CN115698328A - 参考梯状物和衔接子 - Google Patents

参考梯状物和衔接子 Download PDF

Info

Publication number
CN115698328A
CN115698328A CN202180024693.6A CN202180024693A CN115698328A CN 115698328 A CN115698328 A CN 115698328A CN 202180024693 A CN202180024693 A CN 202180024693A CN 115698328 A CN115698328 A CN 115698328A
Authority
CN
China
Prior art keywords
sequence
polynucleotide
sequences
calibration
adaptor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180024693.6A
Other languages
English (en)
Inventor
T·默瑟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Garvan Institute of Medical Research
Original Assignee
Garvan Institute of Medical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2020900400A external-priority patent/AU2020900400A0/en
Application filed by Garvan Institute of Medical Research filed Critical Garvan Institute of Medical Research
Publication of CN115698328A publication Critical patent/CN115698328A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/02Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Ladders (AREA)
  • Forklifts And Lifting Vehicles (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本公开总体上涉及可用于确定样品中多核苷酸的身份和/或数量的校准方法的多核苷酸。特别地,本公开涉及包含用作参考梯状物或参考衔接子的校准序列的多核苷酸。所述多核苷酸可用于校准各种各样的测序方法,包括高通量测序方法(例如,称为下一代测序或NGS方法的那些方法)。本公开还总体上涉及这些多核苷酸在各种各样的应用中,包括例如在各种各样的测序方法的校准中的用途。

Description

参考梯状物和衔接子
相关申请的交叉引用
本申请要求于2020年2月13日提交的澳大利亚临时专利申请第2020900400号和第2020900401号的优先权,其每一个的内容通过引用以其整体并入本文。
技术领域
本公开总体上涉及可用于确定样品中多核苷酸的身份和/或数量的校准方法的多核苷酸。所述多核苷酸可用于校准各种各样的测序方法,包括高通量测序方法(例如,称为下一代测序或NGS方法的那些)。本公开还总体上涉及这些多核苷酸在各种各样的应用中,包括例如在各种各样的测序方法的校准中的用途。
背景
NGS技术(以由诸如以下的公司提供的服务和产品为例:Illumina、OxfordNanopore、PacBio、Ion Torrent、Roche 454Pyrosequencing(参见例如,Bentley,D.R.等人,2008;Clarke,J.等人,2009;Ronaghi,M.等人,1998;Eid,J.等人,2009;Rothberg,J.M.等人,2011)和其他公司)使核酸分子的高通量、大规模并行测序成为可能。这些技术有能力在单个样品中确定数百万RNA和DNA分子的核苷酸碱基序列。此外,确定单个RNA或DNA序列的速率与样品中该单个RNA或DNA序列的相对丰度成比例。因此,NGS也可用于测定样品中一种或更多种核酸序列的数量。
NGS被广泛用于确定从天然来源(诸如动物、植物、微生物或环境样品中的不同微生物种群(Edwards,R.A.等人,2006))采集的样品中发现的核酸的序列和/或测量所述核酸的数量。这些用途包括确定生物体的全基因组序列(参见例如Bentley,D.R.等人,2008),确定存在于样品内的信使RNA的序列和丰度(参见,例如,Mortazavi,A等人,2008),或鉴定与疾病相关的遗传变体,或对一系列细胞特征(诸如表观遗传修饰(参见,例如,Bernstein,B.E.等人,2005)、蛋白质结合位点(参见,例如Johnson,D.S.等人,2007)、三维DNA结构(参见,例如,Lieberman-Aiden,E.等人,2009),以及其他特征)进行测序和测量。
由NGS确定的数百万的个体RNA或DNA序列可以通过从头组装合并成更长的序列(称为重叠群)或与已知的参考序列匹配。DNA序列的从头组装可以用来组装生物体的基因组;RNA序列的从头组装可以指示基因序列、长度和同种型。DNA序列与参考基因组的匹配或比对可以鉴定个体之间遗传差异或变异的位置。DNA序列和参考基因组之间匹配的位置可以指示表观遗传特征(诸如组蛋白修饰)或蛋白结合位点的位置。RNA序列与参考基因组的比对可以指示在基因剪接过程期间被切除的内含子序列的存在。
在一些情况下,在这样的测序方法的操作期间,已知数量或序列的核酸(称为标准品)被添加(或“加标(spiked-in)”)到天然核酸样品中。然后,可以使用一系列基因技术(诸如NGS技术),包括微阵列技术、定量聚合酶链式反应方法和其他方法,对所得的组合混合物进行分析。样品核酸的数量或序列可以与添加的核酸标准品的已知数量或序列进行比较,以便提供可用于测量和确定天然核酸样品的数量或序列的参考标尺。
先前使用的RNA和DNA标准品来源于天然来源。例如,从最初来源于高加索裔女性人类的NA12878细胞系中提取的DNA序列已经被广泛地表征,并被用于评估分析工具鉴定遗传变异的性能(Zook,J.M.等人,2014)。包含来源于古生菌詹氏甲烷球菌(Methanocaldococcus jannaschii)的序列的核糖核酸标准品(称为ERCC加标)为微阵列和qRT-PCR技术而开发(Baker,S.C.等人,2005年;Consortium E.R.C.,2005),并已与RNA测序(Jiang,L.等人,2011)一起使用。最近,已经设计了人工校准序列,以解决由于使用天然序列作为标准品而导致的一个或更多个缺点。在公开为WO2016/094947的国际专利申请第PCT/AU2015/050797号中描述了这样的人工校准序列。
衔接子(adaptor或adapter)序列通常是已知用于制备用于下一代测序的靶多核苷酸的DNA序列。下一代测序期间的文库制备过程产生包含在靶DNA或RNA序列上游(即在5'方向)和/或下游(即在3'方向)的衔接子序列的DNA序列。然后使用下一代测序方法对这些产生的DNA序列进行测序。
尽管取得了这些进展,但NGS数据的分析仍然具有挑战性。测序错误可能导致错误检测的(假阳性)突变,从而导致不必要的和昂贵的治疗,并且遗漏的突变(假阴性)可能导致漏诊和遗漏的患者治疗的机会。因此,进一步提高NGS方法的准确性将是有益的。
概述
本公开总体上涉及多核苷酸序列,其可用于校准各种各样的测序方法。这些多核苷酸序列在本文中也称为“标准品”、“参考标准品”或“对照品”,并且这些术语在本文中可互换使用。因此,本公开提供了可用于校准各种各样的高通量测序方法诸如NGS方法的参考标准品。本文公开的多核苷酸序列包含两种或更多种校准序列,每种校准序列独立地代表一种天然存在的多核苷酸序列,并以在任何天然存在的基因组中都没发现的排列连续地排列在多核苷酸序列中。不同的校准序列可以以单个拷贝存在。可选地,校准序列中的一种或更多种可以在多核苷酸序列中以两个或更多个拷贝数存在。因此,本公开提供了包含多于一种校准序列的多核苷酸“梯状物”,每种校准序列以相同拷贝数或以不同拷贝数独立存在。
在一方面,本公开提供了一种分离的多核苷酸序列,其包含两种或更多种校准序列,其中每种校准序列独立地代表一种天然存在的多核苷酸序列,并且其中校准序列以在任何天然存在的基因组中都没发现的排列连续地排列在多核苷酸序列内。校准序列中的一种或更多种可以在多核苷酸序列内以两个或更多个拷贝数存在。
第一校准序列可以代表外显子、内含子、基因、等位基因、染色体或基因组序列,并且第二校准序列可以不同于第一校准序列并且可以代表不同的外显子、内含子、基因、等位基因、染色体或基因组序列。第二校准序列可以代表第一校准序列的变体。
校准序列中的一种或更多种可以指示感兴趣的特征,诸如癌症、遗传性疾病、病原体、耐药性、循环肿瘤DNA、循环胎儿DNA、循环母体DNA、或其他感兴趣的属性中的任何一种或更多种。
当本文公开的多核苷酸包含以两个或更多个拷贝数存在的校准序列时,可以选择这些拷贝数以复制由校准序列代表的天然存在序列的天然存在频率。例如但不限于,可以选择两个或更多个拷贝数来复制天然存在的人类多核苷酸序列的纯合、杂合和/或体细胞等位基因频率中的任何一种或更多种。本文描述了其他拷贝数表示。
校准序列的长度可以独立地在18个核苷酸和20,000个核苷酸之间。例如,校准序列的长度可以独立地在100个核苷酸和2,000个核苷酸之间。
在另一方面,本公开提供了一种载体,其包含编码本文公开的多核苷酸序列的DNA序列,该DNA序列可操作地连接到以下中的任何一种或更多种:5'启动子;旁侧(3'和5')内切核酸酶位点;和3'聚腺嘌呤重复段。
在另一方面,本公开提供了一种制备本公开的多核苷酸序列的方法,包括提供和连接两种或更多种校准序列;任选地还包括提供和连接旁侧序列或末端序列和/或间隔物序列(如果存在)。
在另一方面,本公开提供了一种组合物,该组合物包含本文公开的任何两种或更多种多核苷酸序列。
在另一方面,本公开提供了一种提供用于校准循环DNA检测方法的多核苷酸的方法,该方法包括将本公开的多核苷酸序列片段化以产生一种或更多种多核苷酸片段,所述一种或更多种多核苷酸片段适合于校准循环DNA检测方法。
另一方面,本公开提供了一种提供用于校准RNA测序方法的多核苷酸的方法,所述方法包括对本公开的多核苷酸序列进行体外转录以产生一种或更多种RNA片段,所述多核苷酸序列是DNA多核苷酸序列,所述一种或更多种RNA片段适合于校准RNA测序方法。
在另一方面,本公开提供了一种校准多核苷酸测序过程的方法,包括:
i)使本公开的多核苷酸序列在给定的一组参数下经历多核苷酸测序过程;
ii)记录由i)中进行的所述测序过程确定的校准序列的序列;
iii)将ii)中记录的校准序列的序列与本公开的多核苷酸序列中的相应的校准序列的已知序列进行比较;和
iv)使包含感兴趣的多核苷酸的样品在同一组参数下经历在i)中进行的相同测序过程;
其中iii)中的序列确定的准确性用于校准iv)中的序列确定。iv)中的定量过程可以在不存在本公开的多核苷酸序列的情况下进行。
在另一方面,本公开提供了一种校准多核苷酸定量过程的方法,包括:
i)使本公开的多核苷酸序列在给定的一组参数下经历多核苷酸定量过程;
ii)记录由i)中进行的定量过程确定的校准序列的数量;
iii)将ii)中记录的校准序列的数量与本公开的多核苷酸序列中的相应的校准序列的已知数量进行比较;和
iv)使包含感兴趣的多核苷酸的样品在同一组参数下经历在i)中进行的相同定量过程;
其中iii)中的数量确定的准确性用于校准iv)中的数量确定。同样,iv)中的定量过程可以在不存在本公开的多核苷酸序列的情况下进行。
从以上明显的是,本文公开的任何方法都可以与在测试样品上进行的具有相同参数的等同方法分开进行。例如,本文公开的方法可以与在测试样品上进行的等同方法并行进行。这降低了校准序列干扰在测试样品上进行的方法的结果的风险,例如通过添加代表相同靶序列的校准序列来改变测试样品中感兴趣的靶多核苷酸序列的量。
在另一方面,本公开提供了一种校准靶DNA富集过程的方法,该方法包括:
i)将本公开的多核苷酸序列与大体上互补序列的寡核苷酸在允许杂交的条件下组合;
ii)富集与多核苷酸序列杂交的寡核苷酸;
iii)在给定的一组参数下对ii)中富集的多核苷酸进行测序;
iv)将iii)中确定的多核苷酸序列与所述多核苷酸序列的已知序列进行比较;和
v)在iii)中的同一组参数下对ii)中富集的寡核苷酸进行测序;
其中iv)中的序列确定的准确性用于校准v)中的序列确定。
在另一方面,本公开提供了一种校准靶DNA富集过程的方法,该方法包括:
i)将已知数量的本公开的多核苷酸序列与大体上互补序列的寡核苷酸在允许杂交的条件下组合;
ii)富集与多核苷酸序列杂交的寡核苷酸;
iii)在给定的一组参数下对ii)中富集的多核苷酸进行定量;
iv)将iii)中确定的多核苷酸数量与i)中的所述多核苷酸序列的已知数量进行比较;和
v)在iii)中的同一组参数下对ii)中富集的寡核苷酸进行定量;
其中iv)中的数量确定的准确性用于校准v)中的数量确定。
在另一方面,本公开提供了本公开的多核苷酸序列校准多核苷酸测序和/或定量过程的用途。
在另一方面,本公开提供了一种试剂盒,该试剂盒包含本公开的多核苷酸序列和一种或更多种能够使多核苷酸序列片段化的核酸酶。
本公开还提供了多核苷酸衔接子序列,每种衔接子序列包含校准序列(诸如本文描述的),该校准序列可用于校准确定样品中多核苷酸的身份和/或数量的方法。例如,与在样品上进行的方法并行进行的单独的校准方法的性能相比,在衔接子序列中掺入校准序列提高了校准这些方法的效力。校准序列提供可以根据其确定在测序方法的进行期间发生的错误和技术偏差的参考序列。因此,可以在多核苷酸文库制备方法(诸如NGS文库制备方法)期间使用本文公开的衔接子序列以测量这些文库制备方法的测序和/或定量性能。
因此,本公开提供了一种包含校准序列和引物序列的分离的多核苷酸衔接子序列。
所述引物序列可以与能够添加到包含待复制的多核苷酸的样品中的单独引物序列互补(或大体上互补)。因此,衔接子序列可以添加到包含待复制的多核苷酸的样品中,连接到待复制的多核苷酸上,并且所得的连接序列可以与添加以便促进与所得的连接序列互补的多核苷酸的合成和/或促进所得的连接序列的转录的引物结合。
可选地,引物序列可以与待复制的多核苷酸的一部分互补(或大体上互补)。因此,可以将衔接子序列添加到包含待复制的多核苷酸的样品中,并且衔接子序列中的引物序列可以与待复制的多核苷酸中的互补序列结合,以促进待复制的多核苷酸的合成。
本公开还提供了一种包含校准序列和与靶序列互补的序列(“互补序列”)的分离的多核苷酸衔接子序列。互补序列可以以与引物相同的方式与靶多核苷酸序列结合,但不必履行促进靶多核苷酸复制或合成的引物的功能。因此,包含校准序列和互补序列的分离的多核苷酸衔接子序列可以不包含引物序列。包含多核苷酸、校准序列和互补序列的这样的衔接子多核苷酸可特别用于校准不涉及多核苷酸复制的文库制备方法。例如,这样的衔接子多核苷酸在用蛋白质纳米孔测序的文库制备方法中可能特别有用。
衔接子序列还可以包括以下中的任何一种或更多种:与流动池DNA序列互补的序列;指示包含待复制的多核苷酸的样品身份的索引序列;以及指示单个衔接子序列身份的独特分子标识符(UMI)序列。
校准序列可以代表天然存在的多核苷酸序列。这可以通过包含或由天然存在的多核苷酸序列组成的校准序列,或通过包含或由仍然保留天然存在的多核苷酸序列的某些高阶特征的人工多核苷酸序列(例如,如WO2016/094947中描述的)组成的校准序列来实现。
衔接子序列可以是单链或双链多核苷酸序列,并且可以是DNA或RNA多核苷酸序列。
本文公开的任何衔接子序列可以包含当衔接子序列结合到互补靶序列时形成末端核苷酸单链突出端的序列。单链突出端的核苷酸可以是胸腺嘧啶(T)。末端T核苷酸可以通过硫代磷酸酯键连接以防止核酸酶消化。可选地,本文公开的任何衔接子序列可以包含当衔接子序列结合到互补的靶序列时形成粘性单链突出端的序列。粘性单链突出端包含与另一多核苷酸上的粘性单链突出端互补的序列,以促进两个多核苷酸的退火。
两种或更多种校准序列可以以不同的数量(即拷贝数)存在于单个衔接子序列中。此外,两种或更多种的衔接子序列可以以已知的数量组合在混合物中。因此,该混合物可以提供两种或更多种不同校准序列的已知相对数量。这可以通过在混合物中包含具有每种校准序列的多于一个拷贝的衔接子来实现。这也可以通过在混合物中包含已知的不同数量的不同衔接子,每种衔接子具有单一校准序列来实现。这也可以通过这些方法的组合来实现。以不同数量提供两种或更多种校准序列允许测量待校准的靶多核苷酸的数量。
本公开还提供了一种包含本文公开的一种或更多种衔接子序列的组合物。
本公开还提供了一种包含本文公开的组合物的容器。
本公开还提供了一种包含本文公开的衔接子序列的载体。
本公开还提供了一种试剂盒,该试剂盒包含本文公开的一种或更多种衔接子序列,或本文公开的组合物,以及连接酶和/或转座酶和/或一种或更多种单独的寡核苷酸引物。
本公开还提供了制备本文公开的衔接子序列的方法,该方法包括通过内切核酸酶消化从本文公开的载体中切除衔接子序列,或者通过从本文公开的载体中扩增衔接子序列,或者通过转录包含在本文公开的载体中的衔接子序列。
本公开还提供了一种制备包含用于测序或定量过程的靶多核苷酸的样品的方法,该方法包括将本文公开的多核苷酸衔接子序列附接到靶多核苷酸的一个或两个末端(即5'和/或3'末端)的步骤。
本公开还提供了一种制备包含用于测序或定量过程的靶多核苷酸的样品的方法,该方法包括使靶多核苷酸与本文公开的衔接子序列在适合于允许多核苷酸衔接子序列中的引物序列结合到靶多核苷酸的互补部分的条件下接触。
本公开还提供了本文公开的多核苷酸衔接子序列或本文公开的组合物校准多核苷酸测序和/或定量过程的用途。
因此,本公开还提供了一种校准多核苷酸测序过程的方法,包括:
i)将本文公开的衔接子序列或组合物在允许多核苷酸衔接子序列附接到靶多核苷酸的5'和/或3'末端的条件下添加到包含待确定序列的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的序列;
iv)确定衔接子序列中校准序列的序列;以及
v)将iv)中确定的序列与原始校准序列进行比较;
其中iv)中的序列确定的准确性用于校准iii)中的序列确定。
本公开还提供了一种校准多核苷酸测序过程的方法,包括:
i)将本文公开的衔接子序列或组合物在允许多核苷酸衔接子序列中的引物序列与靶多核苷酸的互补部分结合的条件下添加到包含待确定序列的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的序列;
iv)确定衔接子序列中校准序列的序列;以及
v)将iv)中确定的序列与原始校准序列进行比较;
其中iv)中的序列确定的准确性用于校准iii)中的序列确定。
本公开还提供了一种校准多核苷酸定量过程的方法,包括:
i)将已知量的本文公开的衔接子序列或组合物在允许衔接子序列附接到靶多核苷酸的5'和/或3'末端的条件下添加到包含待确定数量的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的数量;
iv)确定衔接子序列中校准序列的数量;以及
v)将iv)中确定的数量与i)中衔接子序列中校准序列的已知量进行比较;
其中iv)中的数量确定的准确性用于校准iii)中的数量确定。
本公开还提供了一种校准多核苷酸定量过程的方法,包括:
i)将已知量的本文公开的衔接子序列或组合物在允许多核苷酸衔接子序列中的引物序列与靶多核苷酸的互补部分结合的条件下添加到包含待确定数量的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的数量;
iv)确定衔接子序列中校准序列的数量;以及
v)将iv)中确定的数量与i)中衔接子序列中校准序列的已知量进行比较;
其中iv)中的数量确定的准确性用于校准iii)中的数量确定。
本公开的任何特定方面或实施方案或实例的每个特征可加以必要的修改应用于本公开的任何其他方面或实施方案或实例。
附图简述
下面的图进一步展示了本公开的某些方面。通过参考这些图中的一个或更多个并结合本文呈现的特定实施方案的详细描述,可以更好地理解本公开。
图1.图解说明了包含重复1个、2个和3个拷贝数的ERBB2基因外显子序列的多核苷酸序列的设计和使用。
图2.图解说明了包含重复1个拷贝数的TP53基因外显子序列的多核苷酸序列的设计和使用。
图3.图解说明了包含重复1个、2个和4个拷贝数的细菌基因组序列的多核苷酸序列的设计和使用。
图4.图解说明了包含校准序列的多核苷酸序列的设计和使用,该校准序列代表BRAF基因中体细胞等位基因频率的遗传变异。
图5.图解说明了包含校准序列的多核苷酸序列的设计和使用,该校准序列代表BRCA2基因中杂合等位基因频率的遗传变异。
图6.来自用于循环DNA测序方法的多核苷酸序列的酶促剪切(shearing)的DNA片段的尺寸谱。
图7.图解说明了用于校准多核苷酸测序过程的合适计算机系统3800。计算机系统3800包括处理器3802,处理器3802与到程序存储器3804、数据存储器3806、通信端口3808和用户端口3810连接。
图8.文库制备和测序期间包含校准序列的多核苷酸衔接子序列的设计。(A)示意图示出了校准序列在Y-衔接子内的位置,以及相对于P5和P7引物序列、索引序列和独特分子标识符(UMI)和T-核苷酸单链突出端的位置。(B)示意图示出了在用于下一代测序的文库制备步骤期间连接到测试样品DNA片段末端的多核苷酸衔接子序列。
图9.DNA合成期间包含校准序列的多核苷酸衔接子序列的掺入。(A)多核苷酸衔接子序列包含校准序列和与样品DNA中的靶位点互补的引物序列。多核苷酸衔接子序列与靶DNA杂交,并且DNA合成从引物序列起始。(B)第一轮和第二轮DNA合成将包含引物序列和校准序列的多核苷酸衔接子序列掺入测试样品DNA片段,以形成单个连续的DNA序列。
图10.多核苷酸衔接子序列在长读段(纳米孔)测序期间的用途。(A)包含两种校准序列的两种多核苷酸衔接子序列,其中第二校准序列(G)是第一校准序列(WT)的遗传变体序列。(B)多核苷酸序列连接到长测试样品DNA片段的5'和3'末端。(C)使用纳米孔技术对长样品DNA片段和多核苷酸衔接子序列(包含校准序列)进行测序。
图11.多核苷酸衔接子序列在文库制备和下一代测序期间的用途。(A)将多核苷酸衔接子序列连接到测试样品DNA。(B)文库片段包含样品DNA序列和包含校准序列的多核苷酸衔接子序列。(C)在文库制备期间,DNA合成在末端区域掺入校准序列和衔接子序列。(D)在测序读段内鉴定校准序列。(E)散点图指示相对于衔接子混合物内校准序列的预计分数丰度的读段内校准序列的观察到的计数。
图12.(A)基因组浏览器视图示出了与多核苷酸衔接子内的校准序列相对应的测序长读段比对。指示了测序错误。下图示出了实例测序读段,并指示了校准序列。(B)散点图示出了相对于不同校准序列(Y5-Y8)在NGS文库中的预计分数丰度的它们的观察到的分数丰度。
图13.(A)基因组浏览器视图示出了与多核苷酸衔接子内的校准序列相对应的测序长读段比对。下图示出了实例测序读段,并指示了校准序列。指示了遗传变体序列(C)的存在。
图14.(A)基因组浏览器视图示出了与多核苷酸衔接子内的校准序列相对应的测序长读段比对。校准序列代表与BRAF基因相对应的人类参考基因组序列。
图15.(A)基因组浏览器视图示出了被多核苷酸衔接子序列内引物序列靶向的人类EFGR基因的区域。(B)示意图示出了多核苷酸衔接子序列,包含靶向人EFGFR基因的校准序列和引物序列。(C)实例测序读段示出了在输出文库(FASTQ)中测序读段中的校准序列的鉴定。
序列表的解释
SEQ ID NO:1 包含来自ERBB2基因的三种校准序列的线性多核苷酸序列(EG1_ERBB2)的核苷酸序列。
SEQ ID NO:2 EG1_EGFR的核苷酸序列。
SEQ ID NO:3 EG1_MET的核苷酸序列。
SEQ ID NO:4 EG1_BRAF的核苷酸序列。
SEQ ID NO:5 EG1_FGFR1的核苷酸序列。
SEQ ID NO:6 包含来自TP53基因的五种校准序列的线性多核苷酸序列(EG2_TP53)的核苷酸序列。
SEQ ID NO:7 包含来自铜绿假单胞菌(Pseudomonas aeruginosa)PAO1、流感嗜血杆菌(Haemophilus influenzae)Rd KW20和大肠杆菌(Escherichia coli)K-12的校准序列的线性多核苷酸序列(EG3_16S)的核苷酸序列。
SEQ ID NO:8 BRAF基因校准序列(EG4_BRAF)的核苷酸序列。
SEQ ID NO:9 连接在一起的来自BRCA2基因的两种校准序列(EG4_BRCA2)的核苷酸序列。
SEQ ID NO:10 连接在一起的来自BCR、ABL和ALK基因的三种校准序列(EG6_GENES)的核苷酸序列。
SEQ ID NO:11 来自ERBB2基因外显子的校准序列(EG1_CNV_ERBB2_A)的核苷酸序列。
SEQ ID NO:12 来自ERBB2基因外显子的校准序列(EG1_CNV_ERBB2_B)的核苷酸序列。
SEQ ID NO:13 来自ERBB2基因外显子的校准序列(EG1_CNV_ERBB2_C)的核苷酸序列。
SEQ ID NO:14 来自EGFR基因的校准序列(EG1_CNV_EGFR_A)的核苷酸序列。
SEQ ID NO:15 来自EGFR基因的校准序列(EG1_CNV_EGFR_B)的核苷酸序列。
SEQ ID NO:16 来自EGFR基因的校准序列(EG1_CNV_EGFR_C)的核苷酸序列。
SEQ ID NO:17 来自MET基因的校准序列(EG1_CNV_MET_A)的核苷酸序列。
SEQ ID NO:18 来自MET基因的校准序列(EG1_CNV_MET_B)的核苷酸序列。
SEQ ID NO:19 来自MET基因的校准序列(EG1_CNV_MET_C)的核苷酸序列。
SEQ ID NO:20 来自BRAF基因的校准序列(EG1_CNV_BRAF_A)的核苷酸序列。
SEQ ID NO:21 来自BRAF基因的校准序列(EG1_CNV_BRAF_B)的核苷酸序列。
SEQ ID NO:22 来自BRAF基因的校准序列(EG1_CNV_BRAF_C)的核苷酸序列。
SEQ ID NO:23 来自FGFR1基因的校准序列(EG1_CNV_FGFR1_A)的核苷酸序列。
SEQ ID NO:24 来自FGFR1基因的校准序列(EG1_CNV_FGFR1_B)的核苷酸序列。
SEQ ID NO:25 来自FGFR1基因的校准序列(EG1_CNV_FGFR1_C)的核苷酸序列。
SEQ ID NO:26 与TP53基因外显子重叠的校准序列(EG2_TP53_A)的核苷酸序列。
SEQ ID NO:27 与TP53基因外显子重叠的校准序列(EG2_TP53_B)的核苷酸序列。
SEQ ID NO:28 与TP53基因外显子重叠的校准序列(EG2_TP53_C)的核苷酸序列。
SEQ ID NO:29 与TP53基因外显子重叠的校准序列(EG2_TP53_D)的核苷酸序列。
SEQ ID NO:30 与TP53基因外显子重叠的校准序列(EG2_TP53_E)的核苷酸序列。
SEQ ID NO:31 包含来自铜绿假单胞菌PAO1的校准序列的多核苷酸序列(EG3_16S_pseuAeru_C)的核苷酸序列。
SEQ ID NO:32 包含来自流感嗜血杆菌Rd KW20的校准序列的多核苷酸序列(EG3_16S_haemInfl_B)的核苷酸序列。
SEQ ID NO:33 包含来自大肠杆菌K-12的校准序列的多核苷酸序列(EG3_16S_eschColi_A)的核苷酸序列。
SEQ ID NO:34 包含代表BRAF的不同遗传变体的校准序列(EG4_BRAF_WT)的多核苷酸序列的核苷酸序列。
SEQ ID NO:35 包含代表BRAF的不同遗传变体的校准序列(EG4_BRAF_V600E)的多核苷酸序列的核苷酸序列。
SEQ ID NO:36 来自BRCA2基因的校准序列(EG5_BRCA2_WT)的核苷酸序列。
SEQ ID NO:37 来自具有单核苷酸缺失的BRCA2的校准序列(EG5_BRCA2_DEL)的核苷酸序列。
SEQ ID NO:38 测量BCR基因的基因表达的合成序列(EG6_GENE_BCR_A)的核苷酸序列。
SEQ ID NO:39 测量ABL基因的基因表达的合成序列(EG6_GENE_ABL_B)的核苷酸序列。
SEQ ID NO:40 测量ALK基因的基因表达的合成序列(EG6_GENE_ALK_C)的核苷酸序列。
SEQ ID NO:41 在ERBB2_SPCR的组装中使用的人工间隔物序列的核苷酸序列。
SEQ ID NO:42 在EGFR_SPCR的组装中使用的人工间隔物序列的核苷酸序列。
SEQ ID NO:43 在MET_SPCR的组装中使用的人工间隔物序列的核苷酸序列。
SEQ ID NO:44 在BRAF_SPCR的组装中使用的人工间隔物序列的核苷酸序列。
SEQ ID NO:45 在FGFR1_SPCR的组装中使用的人工间隔物序列的核苷酸序列。
SEQ ID NO:46 命名为Y1A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:47 Y1A引物的核苷酸序列。
SEQ ID NO:48 Y1A校准序列的核苷酸序列。
SEQ ID NO:49 Y1A Y序列的核苷酸序列。
SEQ ID NO:50 命名为Y2A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:51 Y2A引物的核苷酸序列。
SEQ ID NO:52 Y2A校准序列的核苷酸序列。
SEQ ID NO:53 Y2A Y序列的核苷酸序列。
SEQ ID NO:54 命名为Y3A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:55 Y3A引物的核苷酸序列。
SEQ ID NO:56 Y3A校准序列的核苷酸序列。
SEQ ID NO:57 Y3A Y序列的核苷酸序列。
SEQ ID NO:58 命名为Y4A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:59 Y4A引物的核苷酸序列。
SEQ ID NO:60 Y4A校准序列的核苷酸序列。
SEQ ID NO:61 Y4A Y序列的核苷酸序列。
SEQ ID NO:62 命名为Y1B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:63 Y1B引物的核苷酸序列。
SEQ ID NO:64 Y1B校准序列的核苷酸序列。
SEQ ID NO:65 Y1B Y序列的核苷酸序列。
SEQ ID NO:66 命名为Y2B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:67 Y2B引物的核苷酸序列。
SEQ ID NO:68 Y2B校准序列的核苷酸序列。
SEQ ID NO:69 Y2B Y序列的核苷酸序列。
SEQ ID NO:70 命名为Y3B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:71 Y3B引物的核苷酸序列。
SEQ ID NO:72 Y3B校准序列的核苷酸序列。
SEQ ID NO:73 Y3B Y序列的核苷酸序列。
SEQ ID NO:74 命名为Y4B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:75 Y4B引物的核苷酸序列。
SEQ ID NO:76 Y4B校准序列的核苷酸序列。
SEQ ID NO:77 Y4B Y序列的核苷酸序列。
SEQ ID NO:78 命名为Y5A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:79 Y5A校准序列的核苷酸序列。
SEQ ID NO:80 Y5A Y序列的核苷酸序列。
SEQ ID NO:81 命名为Y6A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:82 Y6A校准序列的核苷酸序列。
SEQ ID NO:83 Y6A Y序列的核苷酸序列。
SEQ ID NO:84 命名为Y7A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:85 Y7A校准序列的核苷酸序列。
SEQ ID NO:86 Y7A Y序列的核苷酸序列。
SEQ ID NO:87 命名为Y8A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:88 Y8A校准序列的核苷酸序列。
SEQ ID NO:89 Y8A Y序列的核苷酸序列。
SEQ ID NO:90 命名为Y5B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:91 Y5B校准序列的核苷酸序列。
SEQ ID NO:92 Y5B Y序列的核苷酸序列。
SEQ ID NO:93 命名为Y6B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:94 Y6B校准序列的核苷酸序列。
SEQ ID NO:95 Y6B Y序列的核苷酸序列。
SEQ ID NO:96 命名为Y7B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:97 Y7B校准序列的核苷酸序列。
SEQ ID NO:98 Y7B Y序列的核苷酸序列。
SEQ ID NO:99 命名为Y8B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:100 Y8B校准序列的核苷酸序列。
SEQ ID NO:101 Y8B Y序列的核苷酸序列。
SEQ ID NO:102 命名为Y9A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:103 Y9A校准序列的核苷酸序列。
SEQ ID NO:104 Y9A Y序列的核苷酸序列。
SEQ ID NO:105 命名为Y9B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:106 Y9B校准序列的核苷酸序列。
SEQ ID NO:107 Y9B Y序列的核苷酸序列。
SEQ ID NO:108 命名为Y10A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:109 Y10A校准序列的核苷酸序列。
SEQ ID NO:110 Y10A Y序列的核苷酸序列。
SEQ ID NO:111 命名为Y11A的Y型衔接子序列的核苷酸序列。
SEQ ID NO:112 Y11A校准序列的核苷酸序列。
SEQ ID NO:113 Y11A Y序列的核苷酸序列。
SEQ ID NO:114 命名为Y10B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:115 Y10B校准序列的核苷酸序列。
SEQ ID NO:116 Y10B Y序列的核苷酸序列。
SEQ ID NO:117 命名为Y11B的Y型衔接子序列的核苷酸序列。
SEQ ID NO:118 Y11B校准序列的核苷酸序列。
SEQ ID NO:119 Y11B Y序列的核苷酸序列。
SEQ ID NO:120 命名为Y12F的Y型衔接子序列的核苷酸序列。
SEQ ID NO:121 Y12F引物的核苷酸序列。
SEQ ID NO:122 Y12F校准序列的核苷酸序列。
SEQ ID NO:123 命名为Y13F的Y型衔接子序列的核苷酸序列。
SEQ ID NO:124 Y13F引物的核苷酸序列。
SEQ ID NO:125 Y13F校准序列的核苷酸序列。
SEQ ID NO:126 命名为Y14F的Y型衔接子序列的核苷酸序列。
SEQ ID NO:127 Y14F引物的核苷酸序列。
SEQ ID NO:128 Y14F校准序列的核苷酸序列。
SEQ ID NO:129 命名为Y12R的Y型衔接子序列的核苷酸序列。
SEQ ID NO:130 Y12R引物的核苷酸序列。
SEQ ID NO:131 Y12R校准序列的核苷酸序列。
SEQ ID NO:132 命名为Y13R的Y型衔接子序列的核苷酸序列。
SEQ ID NO:133 Y13R引物的核苷酸序列。
SEQ ID NO:134 Y13R校准序列的核苷酸序列。
SEQ ID NO:135 命名为Y14R的Y型衔接子序列的核苷酸序列。
SEQ ID NO:136 Y14R引物的核苷酸序列。
SEQ ID NO:137 Y14R校准序列的核苷酸序列。
SEQ ID NO:138 polyT mRNA衔接子序列的核苷酸序列。
SEQ ID NO:139 polyT mRNA衔接子引物序列的核苷酸序列。
SEQ ID NO:140 polyT mRNA衔接子校准序列的核苷酸序列。
SEQ ID NO:141 polyT mRNA衔接子的核苷酸序列。
SEQ ID NO:142 polyT mRNA衔接子引物序列的核苷酸序列。
SEQ ID NO:143 polyT mRNA衔接子校准序列的核苷酸序列。
SEQ ID NO:144 天然人类免疫缺陷病毒(HIV)序列衔接子的核苷酸序列。
SEQ ID NO:145 天然HIV序列衔接子引物序列的核苷酸序列。
SEQ ID NO:146 天然HIV序列衔接子校准序列的核苷酸序列。
SEQ ID NO:147 天然人类免疫缺陷病毒(HIV)序列衔接子的核苷酸序列。
SEQ ID NO:148 天然HIV序列衔接子引物序列的核苷酸序列。
SEQ ID NO:149 天然HIV序列衔接子校准序列的核苷酸序列。
SEQ ID NO:150 PCR引物1.0(P5)的核苷酸序列。
SEQ ID NO:151 PCR引物2.0(P7)的核苷酸序列。
SEQ ID NO:152 TruSeq通用衔接子的核苷酸序列。
SEQ ID NO:153 TruSeq衔接子,索引1的核苷酸序列。
SEQ ID NO:154 TruSeq衔接子,索引2的核苷酸序列。
SEQ ID NO:155 TruSeq衔接子,索引3的核苷酸序列。
SEQ ID NO:156 TruSeq衔接子,索引4的核苷酸序列。
SEQ ID NO:157 TruSeq衔接子,索引5的核苷酸序列。
SEQ ID NO:158 TruSeq衔接子,索引6的核苷酸序列。
SEQ ID NO:159 TruSeq衔接子,索引7的核苷酸序列。
SEQ ID NO:160 TruSeq衔接子,索引8的核苷酸序列。
SEQ ID NO:161 TruSeq衔接子,索引9的核苷酸序列。
SEQ ID NO:162 TruSeq衔接子,索引10的核苷酸序列。
SEQ ID NO:163 TruSeq衔接子,索引11的核苷酸序列。
SEQ ID NO:164 TruSeq衔接子,索引12的核苷酸序列。
SEQ ID NO:165 TruSeq衔接子,索引13的核苷酸序列。
SEQ ID NO:166 TruSeq衔接子,索引14的核苷酸序列。
SEQ ID NO:167 TruSeq衔接子,索引15的核苷酸序列。
SEQ ID NO:168 TruSeq衔接子,索引16的核苷酸序列。
SEQ ID NO:169 TruSeq衔接子,索引18的核苷酸序列。
SEQ ID NO:170 TruSeq衔接子,索引19的核苷酸序列。
SEQ ID NO:171 TruSeq衔接子,索引20的核苷酸序列。
SEQ ID NO:172 TruSeq衔接子,索引21的核苷酸序列。
SEQ ID NO:173 TruSeq衔接子,索引22的核苷酸序列。
SEQ ID NO:174 TruSeq衔接子,索引23的核苷酸序列。
SEQ ID NO:175 TruSeq衔接子,索引25的核苷酸序列。
SEQ ID NO:176 TruSeq衔接子,索引27的核苷酸序列。
SEQ ID NO:177 NEB索引1的核苷酸序列。
SEQ ID NO:178 NEB索引2的核苷酸序列。
SEQ ID NO:179 NEB索引3的核苷酸序列。
SEQ ID NO:180 NEB索引4的核苷酸序列。
SEQ ID NO:181 NEB索引5的核苷酸序列。
SEQ ID NO:182 NEB索引6的核苷酸序列。
SEQ ID NO:183 NEB索引7的核苷酸序列。
SEQ ID NO:184 NEB索引8的核苷酸序列。
SEQ ID NO:185 NEB索引9的核苷酸序列。
SEQ ID NO:186 NEB索引10的核苷酸序列。
SEQ ID NO:187 NEB索引11的核苷酸序列。
SEQ ID NO:188 NEB索引12的核苷酸序列。
SEQ ID NO:189 NEBnext通用引物的核苷酸序列。
SEQ ID NO:190 用于Illumina的NEBNext衔接子的核苷酸序列。
SEQ ID NO:191 16S正向引物的核苷酸序列。
SEQ ID NO:192 23S反向引物的核苷酸序列。
SEQ ID NO:193 TruSeq衔接子,索引1的核苷酸序列。
SEQ ID NO:194 TruSeq衔接子,索引2的核苷酸序列。
SEQ ID NO:195 TruSeq衔接子,索引3的核苷酸序列。
SEQ ID NO:196 TruSeq衔接子,索引4的核苷酸序列。
SEQ ID NO:197 TruSeq衔接子,索引5的核苷酸序列。
SEQ ID NO:198 TruSeq衔接子,索引6的核苷酸序列。
SEQ ID NO:199 TruSeq衔接子,索引7的核苷酸序列。
SEQ ID NO:200 TruSeq衔接子,索引8的核苷酸序列。
SEQ ID NO:201 TruSeq衔接子,索引9的核苷酸序列。
SEQ ID NO:202 TruSeq衔接子,索引10的核苷酸序列。
SEQ ID NO:203 TruSeq衔接子,索引11的核苷酸序列。
SEQ ID NO:204 TruSeq衔接子,索引12的核苷酸序列。
SEQ ID NO:205 TruSeq衔接子,索引13的核苷酸序列。
SEQ ID NO:206 TruSeq衔接子,索引14的核苷酸序列。
SEQ ID NO:207 TruSeq衔接子,索引15的核苷酸序列。
SEQ ID NO:208 TruSeq衔接子,索引16的核苷酸序列。
SEQ ID NO:209 TruSeq衔接子,索引18的核苷酸序列。
SEQ ID NO:210 TruSeq衔接子,索引19的核苷酸序列。
SEQ ID NO:211 TruSeq衔接子,索引20的核苷酸序列。
SEQ ID NO:212 TruSeq衔接子,索引21的核苷酸序列。
SEQ ID NO:213 TruSeq衔接子,索引22的核苷酸序列。
SEQ ID NO:214 TruSeq衔接子,索引23的核苷酸序列。
SEQ ID NO:215 TruSeq衔接子,索引25的核苷酸序列。
SEQ ID NO:216 TruSeq衔接子,索引27的核苷酸序列。
SEQ ID NO:217 UMI序列。
SEQ ID NO:218 PolyT序列。
SEQ ID NO:219 实验读段序列1的核苷酸序列。
SEQ ID NO:220 实验读段序列2的核苷酸序列。
SEQ ID NO:221 实验读段序列3的核苷酸序列。
SEQ ID NO:222 实验读段序列4的核苷酸序列。
SEQ ID NO:223 实验读段序列5的核苷酸序列。
SEQ ID NO:224 实验读段序列6的核苷酸序列。
SEQ ID NO:225 IDT双索引UMI衔接子1的核苷酸序列。
SEQ ID NO:226 IDT双索引UMI衔接子2的核苷酸序列。
SEQ ID NO:227 IDT双索引UMI衔接子3的核苷酸序列。
SEQ ID NO:228 IDT双索引UMI衔接子4的核苷酸序列。
SEQ ID NO:229 IDT双索引UMI衔接子5的核苷酸序列。
SEQ ID NO:230 IDT双索引UMI衔接子6的核苷酸序列。
详述
一般
在整个说明书中,除非另有特别说明或上下文另有要求,对单个步骤、物质组合物、步骤组或物质组合物的组的提及应被视为包括这些步骤、物质组合物、步骤组或物质组合物的组中的一种和多于一种(即一种或更多种)。
如本文所用,除非上下文另外清楚指明,单数形式“一(a)”、“一(an)”和“该(the)”包括这些词的复数形式。
术语“和/或”,例如“X和/或Y”,应理解为意指“X和Y”或“X或Y”,并应被视为对两种含义或任一含义提供明确支持。
在整个说明书中,词语“包含(comprise)”或诸如“包含(comprises)”或“包含(comprising)”的变化形式将被理解为意指包括所陈述的要素、整数或步骤,或者要素、整数或步骤的组,但不排除任何其他要素、整数或步骤,或者要素、整数或步骤的组。
如本文所用,术语“约”是指指定值的+/-10%的范围,并且被视为包括对所述值本身的明确提及(例如,术语“约10”包括对10的明确提及)。
术语“大体上互补”应理解为意指具有足够的序列同一性以允许一个多核苷酸与另一个多核苷酸结合。例如,本文描述的任何序列可以与靶序列至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%相同,但仍然能够与该靶序列杂交。杂交的程度可以足以实现多核苷酸的任何给定功能或方法学处理步骤,例如,促进转录的起始或促进样品内双链多核苷酸的富集或选择或加工。
多核苷酸序列
本文公开的多核苷酸序列可以是编码两种或更多种校准序列的单个连续RNA或DNA序列。多核苷酸序列可以是重组多核苷酸序列。本文描述的多核苷酸序列也可以是如本文描述的衔接子多核苷酸序列。
多核苷酸衔接子序列
本文公开的多核苷酸衔接子序列(在本文中可互换地称为“衔接子序列”或“衔接子”或“衔接子分子”)可以是单个连续RNA或DNA序列。优选地,衔接子序列是DNA序列。衔接子序列可以是重组多核苷酸序列。
衔接子序列能够在多核苷酸测序和/或定量方法中使用。衔接子序列赋予的功能是在多核苷酸测序和/或定量方法期间促进感兴趣的靶多核苷酸序列的合成(或复制)。这是通过在衔接子序列内包含引物序列来实现的。引物序列促进DNA合成蛋白分子在引物位点处的特异性结合,允许合成(或复制)的起始。任何已知的引物都可以被包含在本文公开的衔接子序列中。
例如,引物序列可以与任何商购可得的引物大体上互补(或与其互补)。商购可得的引物的实例包括P5和P7引物(Illumina)。下面的表1中包括了这些和其他商购可得的引物的实例。
表1:商购可得的引物、衔接子、索引序列和UMI序列的非限制性实例。
Figure BDA0003865051000000251
Figure BDA0003865051000000261
Figure BDA0003865051000000271
Figure BDA0003865051000000281
Figure BDA0003865051000000291
引物序列可以与以下大体上互补(或与以下互补):通用测序引物(诸如TruSeq通用衔接子、NEBnext通用引物);测试DNA样品中的序列;人类基因组的区域;mRNA 3'poly-A序列,或任何已知的引物。例如,引物序列可以与以下大体上互补(或与以下互补):16S和23S rRNA基因;免疫球蛋白和T细胞受体基因;编码外显子;或与人类疾病(诸如癌症)有因果关系的基因中的外显子的旁侧和其内的序列。
还可以提供衔接子序列,以便将一种或更多种特定序列掺入到合成的多核苷酸中。这通常在制备用于测序的靶多核苷酸时进行。例如,这可以通过将一种或更多种这样的特定序列定位在引物序列下游(即在3'方向)来实现。可选地或另外地,一种或更多种这样的特定序列可以定位在引物序列的上游(即在5'方向)。例如,衔接子序列可以是双链多核苷酸,其中第一链包含定位在待掺入合成多核苷酸的特定序列上游的引物序列,并且其中与第一链互补(或大体上互补)的第二链包含定位在待掺入合成多核苷酸的特定序列下游的引物序列。
校准序列
多核苷酸序列可以包含任何数量的校准序列。在一个实例中,多核苷酸序列可以包含不超过200,000个、或不超过100,000个、或不超过10,000个、或不超过1,000个、或不超过900个、或不超过800个、或不超过700个、或不超过600个、或不超过500个、或不超过400个、或不超过300个、或不超过200个、或不超过100个、或不超过90个、或不超过80个、或不超过70个、或不超过60个、或不超过50个、或不超过40个、或不超过30个、或不超过20个、或不超过10个、或不超过9个、或不超过8个、或不超过7个、或不超过6个、或不超过5个、或不超过4个、或不超过3个、或不超过2个校准序列。
可选地,多核苷酸序列可以包含多于2个、多于3个、多于4个、多于5个、多于6个、多于7个、多于8个、多于9个、多于10个、多于20个、多于30个、多于40个、多于50个、多于60个、多于70个、多于80个、多于90个、多于100个、多于200个、多于300个、多于400个、多于500个、多于600个、多于700个、多于800个、多于900个、多于1000个、多于5000个、多于10,000或多于20,000个校准序列。
多核苷酸序列可包含2个和20,000个之间的校准序列。例如,多核苷酸序列可以包含2个和10,000个之间的校准序列,或2个和5,000个之间的校准序列,或2个和1,000个之间的校准序列,或2个和500个之间的校准序列,或2个和100个之间的校准序列,或2个和10个之间的校准序列,或2个和5个之间的校准序列,或2个和4个之间的校准序列,或2个和3个之间的校准序列,或者另外的类似的范围。
每种校准序列可以具有独立于其他校准序列长度的多核苷酸长度。校准序列可以具有在21个核苷酸到20,000个核苷酸之间的不同长度。校准序列的长度可独立地为不超过20,000个、或不超过10,000个、或不超过1,000个、或不超过900个、或不超过800个、或不超过700个、或不超过600个、或不超过500个、或不超过400个、或不超过300个、或不超过200个、或不超过100个、或不超过90个、或不超过80个、或不超过70个、或不超过60个、或不超过50个、或不超过40个、或不超过30个、或不超过21个、或不超过21个、或不超过18个、或不超过15个核苷酸。校准序列的长度可独立地为至少20,000个、或至少10,000个、或至少1,000个、或至少900个、或至少800个、或至少700个、或至少600个、或至少500个、或至少400个、或至少300个、或至少200个、或至少100个、或至少90个、或至少80个、或至少70个、或至少60个、或至少50个、或至少40个、或至少30个、或至少21个核苷酸、或至少18个核苷酸、或至少15个核苷酸。校准序列的长度可以在由上述最小值和最大值的任何组合定义的范围内。例如,校准序列可以为长度在21个和10,000个核苷酸之间,或者长度在21个和2,000个核苷酸之间,或者长度在21个和1,000个核苷酸之间,或者长度在21个和900个核苷酸之间,或者长度在21个和800个核苷酸之间,或者长度在21个和700个核苷酸之间,或者长度在21个和600个核苷酸之间,或者长度在21个和500个核苷酸之间,或者长度在21个和400个核苷酸之间,或者长度在21个和300个核苷酸之间,或者长度在21个和200个核苷酸之间,或者长度在21个和100个核苷酸之间。在一个实例中,校准序列可以为长度在约200个和约1600个核苷酸之间。在另一个实例中,校准序列可以为长度在约600个和约1600个核苷酸之间。
多核苷酸序列中存在的任何校准序列可以仅以一个拷贝存在。在一个实例中,多核苷酸序列中存在的所有校准序列可以仅以一个拷贝存在。可选地,多核苷酸序列中存在的任何一种或更多种校准序列可以以两个或更多个拷贝数存在。例如,多核苷酸可以包含以任何排列形式独立地以2个、3个、4个、5个、6个、7个、8个、9个、10个、12个、14个、16个、32个、64个、100个、128个、256个、512个、1000个、1024个、2048个、4096个、8192个或10,000个拷贝中的任何一种存在的一种或更多种校准序列。
在另一个实例中,多核苷酸可以包含以一个或更多个拷贝存在的第一校准序列,和以比第一校准序列大2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、50倍、100倍、1,000倍或10,000倍的拷贝数中的任何一种存在的第二校准序列。在另一个实例中,一种或更多种校准序列可以以多于2个、3个、4个或5个拷贝存在于多核苷酸序列中。可选地或另外地,任何校准序列可以以不超过5个、10个、20个、50个、100个或100,000个拷贝存在于多核苷酸序列中。在另外的实例中,多核苷酸可以包含以相等拷贝数存在的校准序列。任何两种,或两种以上,或所有校准序列都可以以相等的拷贝数存在。
本文公开的多核苷酸序列可以包含一种或更多种校准序列,这些校准序列以与多核苷酸序列内的第二校准序列的拷贝数成已知的、对数的、整数的、顺序的和恒定的比率的拷贝数重复。可选地,本文公开的多核苷酸序列可以包含在多核苷酸序列内以不同拷贝数重复的两种或更多种校准序列。在一个实例中,多核苷酸序列包含在多核苷酸序列内以一种、两种和三种拷贝数重复的校准序列。
在一个特定的实例中,多核苷酸序列包含可以被命名为A、B、C和D(它们分别以2、2、1和3个拷贝存在)的校准序列。因此,在一个实例中,多核苷酸可以包含或由四种校准序列组成,其中一种校准序列仅以一个拷贝存在,两种校准序列以两个拷贝存在,并且一种校准序列以三个拷贝存在。
校准序列的拷贝与原始校准序列相同。应当理解,给定校准序列的“变体”被认为是不同的校准序列。因此,例如,本文公开的多核苷酸序列可以包含代表感兴趣基因组序列的第一校准序列和代表第一校准序列的变体的第二校准序列。多核苷酸序列可以包含多于一种校准序列,每种校准序列代表一种感兴趣基因组序列的变体。这些变体可能由相对于特定感兴趣的基因组序列的任何遗传变化而产生。
校准序列可以以预定拷贝数组合成单个连续的多核苷酸序列。
本文公开的多核苷酸包含以在任何天然存在的基因组中都没发现的排列提供的两种或更多种校准序列。因此,校准序列被人工排列在单个多核苷酸序列内。因此,虽然校准序列可能与天然存在的基因组序列相同,但它们通过在本文公开的多核苷酸中的人工排列以非天然形式提供。这种非天然的形式可以简单地是在本文公开的多核苷酸序列内的校准序列的呈现。应当理解,本文公开的多核苷酸序列的制备需要生成自然界中没发现的多核苷酸序列。
本文公开的多核苷酸序列包含被人工排列以形成在天然基因组或转录组中本来不存在的线性序列的两种或更多种校准序列。因此,两种或更多种校准序列可以被连接(joined)或连接(ligated)在一起以形成单个多核苷酸序列。多核苷酸序列可以包含连续和线性排列的校准序列,以及间插的间隔物序列。可选地或另外地,多核苷酸序列可以包含以线性顺序连续排列(即,没有间插的间隔物序列)的校准序列。
本文公开的多核苷酸序列可以包含单个校准序列的至少两个拷贝,这些拷贝被排列在多核苷酸序列内,使得两个拷贝被其他校准序列和/或被其他校准序列的多于一个拷贝分开。
本文公开的多核苷酸序列可以包含另外的序列元件。这些另外的序列元件可以是人工的(即,不存在于天然存在的基因组中)。例如,多核苷酸序列可以包含出现在任何一种或更多种校准序列之前和/或之间和/或之后的间隔物和/或旁侧序列。间隔物序列的长度可以是多于5个、多于6个、多于7个、多于8个、多于9个、多于10个、多于12个、多于15个、多于18个、多于21个、多于30个、多于40个、多于50个、多于100个、多于200个、多于500个、多于600个、多于1000个、多于2000个、多于10,000个核苷酸。间隔物的长度可以是不超过5个、不超过6个、不超过7个、不超过8个、不超过9个、不超过10个、不超过12个、不超过15个、不超过15个、不超过18个、不超过21个、不超过30个、不超过40个、不超过50个、不超过100个、不超过200个、不超过500个、不超过600个、不超过1000个、不超过2000个、不超过10,000个核苷酸。间隔物序列的非限制性实例在SEQ ID NO:41-45中列出。应当理解,可以使用许多可选的间隔物序列。
旁侧序列的长度可以是多于5个、多于6个、多于7个、多于8个、多于9个、多于10个、多于12个、多于15个、多于18个、多于21个、多于30个、多于40个、多于50个、多于100个、多于200个、多于500个、多于600个、多于1000个、多于2000个、多于10,000个核苷酸。间隔物的长度可以是不超过5个、不超过6个、不超过7个、不超过8个、不超过9个、不超过10个、不超过12个、不超过15个、不超过15个、不超过18个、不超过21个、不超过30个、不超过40个、不超过50个、不超过100个、不超过200个、不超过500个、不超过600个、不超过1000个、不超过2000个、不超过10,000个核苷酸。在一个实例中,多核苷酸序列包含出现在一种或更多种校准序列或每种校准序列之前、之间和之后的间隔物和旁侧序列。
在另一个实例中,多核苷酸序列包含由间隔物序列分开的校准序列的两个或更多个拷贝。间隔物序列可以是人工的(即,不存在于天然存在的基因组中)。在一个实例中,间隔物序列是随机化的遗传序列,其可以被策划以去除或减少与任何公开可得的、天然存在的基因组序列的序列同源性。本文公开的多核苷酸序列可以包含与一种或更多种校准序列邻接的一种或更多种间隔物序列。可选地或另外地,多核苷酸序列可以包含减轻在文库制备过程中可能发生的边缘效应的间隔物和旁侧序列。
多核苷酸序列可以包含可以被计算地鉴定、过滤和/或从下一代测序文库中移除的间隔物和/或旁侧序列。在一个实例中,多核苷酸序列包含当被测序时可以计算地与合成序列或参考合成染色体比对,或者与人工序列或人工染色体比对(例如,如WO 2016/094947中描述)的间隔物和旁侧序列。
本文公开的多核苷酸序列可以包含与聚合酶链式扩增期间使用的引物序列完全或部分互补的一种或更多种间隔物和/或旁侧序列。例如,多核苷酸序列可以包含含有用于限制性内切核酸酶消化的识别位点序列的间隔物和/或旁侧序列。可选地或另外地,多核苷酸序列可以包含含有以下任何一种或更多种的间隔物和旁侧序列:启动子序列、转录起始位点或poly-A段。多核苷酸序列可以包含可操作地连接到一个或更多个引物位点、限制性位点、启动子序列、转录起始位点和/或poly-A段的校准序列。在一个实例中,多核苷酸序列包含可操作地连接到一个或更多个引物位点、限制性位点、启动子序列、转录起始位点和/或poly-A段的第一校准序列,以及可操作地连接到一个或更多个不同的引物位点、限制性位点、启动子序列、转录起始位点和/或poly-A段的第二校准序列。
应当理解,如本文所公开的两种或更多种多核苷酸序列可以组合以形成组合物。组合物可以包含两种或更多种不同的多核苷酸序列。两种或更多种不同的多核苷酸序列可以各自包含两种或更多种不同的校准序列。可选地,组合物可以包含两种或更多种不同的多核苷酸序列,每种序列包含相同的一组校准序列。
在本文公开的组合物中,一种或更多种校准序列可以存在于组合物中的两种或更多种多核苷酸序列中。在一个实例中,单一校准序列以不同的拷贝数存在于两种或更多种多核苷酸序列中。
在另一个实例中,两种或更多种多核苷酸序列可以以不同浓度组合以形成混合物。多核苷酸序列可以以预定浓度组合以形成混合物。在一些组合物中,两种或更多种多核苷酸序列以已知的绝对浓度组合形成混合物。在一些组合物中,两种或更多种多核苷酸序列以已知的相对浓度组合形成混合物。在一些组合物中,两种或更多种多核苷酸序列以等摩尔浓度组合形成混合物。相对浓度可以是预定的,以便在每种校准序列的拷贝数方面以本文描述的任何相对差异倍数提供组合物中的每种校准序列的相对量。
如本文描述,本公开的衔接子序列包含将掺入转录多核苷酸的校准序列。校准序列(本文中也称为“标准品”、“参考标准品”或“对照”)可以具有任何合适的长度和/或核苷酸组成,以作为可以以它为背景来测量多核苷酸测序和/或定量方法的准确性的参考标准品。校准序列是已知序列和数量的基本事实对照,可以根据其评价多核苷酸测序的准确性和/或定量。校准序列可以具有任何合适的长度和/或核苷酸组成,使得其在该方法期间不妨碍合成、测序和/或比对的性能。
在本公开的衔接子的上下文中,校准序列的长度可以是,例如,至少8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、500个、1,000个核苷酸。因此,校准序列的长度可以是,例如,至少约8个、至少约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个、约50个、约60个、约70个、约80个、约90个、约100个、约150个、约200个、约300个、约400个、约500个或约1,000个核苷酸。在另一个实例中,校准序列的长度可以是约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个、约50个、约60个、约70个、约80个、约90个、约100个、约150个、约200个、约300个、约400个、约500个或约1,000个核苷酸。可选地或另外地,校准序列的长度可以是例如小于20,000个、10,000个、5,000个、2,000个、1,000个、900个、800个、700个、600个、500个、400个、300个、200个或100个核苷酸。因此,校准序列可以是,例如,在8个和10,000个核苷酸之间长。对于基于流动池的测序方法,较短的校准序列(例如,长度在8个和100个核苷酸之间,诸如长度在8个和50个核苷酸之间,诸如长度在8个和20个核苷酸之间,诸如长度约20个核苷酸)可以是优选的。对于基于纳米孔的测序方法(该方法通常包括对较长的多核苷酸的测序),较长的校准序列(例如长度在8个和10,000个核苷酸之间,诸如长度在12个和10,000个核苷酸之间,诸如长度在20个和10,000个核苷酸之间,诸如长度在50个和10,000个核苷酸之间,诸如长度在100个和10,000个核苷酸之间)可以是优选的。
校准序列可以构成衔接子序列的任何比例。例如,校准序列可以构成衔接子序列长度的至少0.0001、0.001、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、0.95、0.99、0.999、0.9999的部分。在另一个实例中,校准序列可以构成多核苷酸衔接子序列长度的约0.1%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%、约99%、约99.9%。在另一个实例中,校准序列可以构成多核苷酸衔接子序列长度的不超过1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或99.9%。
衔接子序列可以包含任何数量的校准序列。在一个实例中,衔接子序列可以包含不超过1,000个、或不超过900个、或不超过800个、或不超过700个、或不超过600个、或不超过500个、或不超过400个、或不超过300个、或不超过200个、或不超过100个、或不超过90个、或不超过80个、或不超过70个、或不超过60个、或不超过50个、或不超过40个、或不超过30个、或不超过20个、或不超过10个、或不超过9个、或不超过8个、或不超过7个、或不超过6个、或不超过5个、或不超过4个、或不超过3个、或不超过2个、或不超过1个校准序列。
多核苷酸序列可包含2个和1,000个之间的校准序列,或2个和500个之间的校准序列,或2个和100个之间的校准序列,或2个和50个之间的校准序列,或2个和10个之间的校准序列,或2个和8个之间的校准序列,或另外的类似范围。
在包含两种或更多种校准序列的衔接子序列中,或者在包含两种或更多种校准序列(无论是否在同一衔接子序列中)的两种或更多种衔接子序列的组合物中,每种校准序列可以具有独立于其他校准序列长度的多核苷酸长度。校准序列的长度可以具有8个核苷酸到10,000个核苷酸之间的不同长度。校准序列的长度可独立地为不超过10,000个、或不超过1,000个、或不超过900个、或不超过800个、或不超过700个、或不超过600个、或不超过500个、或不超过400个、或不超过300个、或不超过200个、或不超过100个、或不超过90个、或不超过80个、或不超过70个、或不超过60个、或不超过50个、或不超过40个、或不超过30个、或不超过21个核苷酸。可选地或另外地,校准序列的长度可独立地为至少9,900个、或至少1,000个、或至少900个、或至少800个、或至少700个、或至少600个、或至少500个、或至少400个、或至少300个、或至少200个、或至少100个、或至少90个、或至少80个、或至少70个、或至少60个、或至少50个、或至少40个、或至少30个、或至少21个、或至少20个、或至少15个、或至少10个、或至少8个核苷酸。校准序列的长度可以在由上述最小值和最大值的任何组合定义的范围内。例如,校准序列可以为长度在8个和10,000个核苷酸之间,或者长度在21个和2,000个核苷酸之间,或者长度在21个和1,000个核苷酸之间,或者长度在21个和900个核苷酸之间,或者长度在21个和800个核苷酸之间,或者长度在21个和700个核苷酸之间,或者长度在21个和600个核苷酸之间,或者长度在21个和500个核苷酸之间,或者长度在21个和400个核苷酸之间,或者长度在21个和300个核苷酸之间,或者长度在21个和200个核苷酸之间,或者长度在21个和100个核苷酸之间。在一个实例中,校准序列可以为长度在约8个和约10,000个核苷酸之间。在一个实例中,校准序列可以为长度在约8个和约10,000个核苷酸之间。在一个实例中,校准序列可以为长度在约10个和约10,000个核苷酸之间。在另一个实例中,校准序列可以为长度在约20个和约1000个核苷酸之间。
衔接子中存在的任何校准序列可以仅以一个拷贝存在。在一个实例中,衔接子中存在的所有校准序列可以仅以一个拷贝存在。可选地,衔接子中存在的任何一种或更多种校准序列可以以两个或更多个拷贝数存在。例如,衔接子可以包含以任何排列形式独立地以2个、3个、4个、5个、6个、7个、8个、9个、10个、12个、14个、16个、32个、64个、100个、128个、256个、512个、1000个、1024个、2048个、4096个、8192个或10,000个拷贝中的任何一种存在的一种或更多种校准序列。
在另一个实例中,衔接子可以包含以一个或更多个拷贝存在的第一校准序列,和以比第一校准序列大2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、50倍、100倍、1,000倍或10,000倍中的任何一种的拷贝数存在的第二校准序列。在另一个实例中,一种或更多种校准序列可以以多于2个、3个、4个或5个拷贝存在于衔接子中。可选地或另外地,任何校准序列可以以不超过5个、10个、20个、50个、100个或100,000个拷贝存在于衔接子中。在进一步的实例中,多核苷酸可以包含以相等拷贝数存在的校准序列。任何两种,或两种以上,或所有校准序列都可以以相等的拷贝数存在。
在另一个实例中,一个衔接子可以包含以一个或更多个拷贝存在的第一校准序列,而第二衔接子可以包含以比第一校准序列大2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、50倍、100倍、1,000倍或10,000倍的拷贝数中的任何一种存在的第二校准序列。
本文公开的衔接子序列(其可以以包含一种或更多种衔接子的组合物和/或混合物提供,每种衔接子具有独立地以一个或更多个拷贝数存在的一种或更多种校准序列)可以包含一种或更多种校准序列,该校准序列以与衔接子序列内或多于一种衔接子的组合物中的不同衔接子内的第二校准序列的拷贝数成已知的、对数的、整数的、顺序的和恒定的比率的拷贝数重复。在一个实例中,衔接子序列包含在衔接子序列内或在混合物中存在的多于一个衔接子的集合中以一种、两种和三种拷贝数重复的校准序列。因此,本文公开的衔接子的组合物或混合物可以包含一种或更多种校准序列,这些校准序列以与组合物或混合物中不同衔接子内的第二校准序列的拷贝数成已知的、对数的、整数的、顺序的和恒定的比率的拷贝数重复。
在一个特定的实例中,衔接子序列包含校准序列,其可以被命名为A、B、C和D,它们分别以2、2、1和3个拷贝存在。因此,在一个实例中,衔接子可以包含或由四种校准序列组成,其中一种校准序列仅以一个拷贝存在,两种校准序列以两个拷贝存在,并且一种校准序列以三个拷贝存在。
校准序列的拷贝与原始校准序列相同。应当理解,给定校准序列的“变体”被认为是不同的校准序列。因此,例如,本文公开的衔接子序列(或衔接子序列的组合物,或混合物)可以包含代表感兴趣基因组序列的第一校准序列和代表第一校准序列的变体的第二校准序列。衔接子序列可以包含多于一种校准序列,每种校准序列代表感兴趣基因组序列的变体。这些变体可以由相对于感兴趣的特定基因组序列的任何遗传变化而产生。
校准序列可以以预定拷贝数组合到单个连续的多核苷酸序列中。单个连续的多核苷酸序列可以构成衔接子序列。
本文公开的衔接子序列可以包含是天然存在的多核苷酸序列的校准序列。此外,本文公开的衔接子序列可以包括以在任何天然存在的基因组中没发现的排列提供的两种或更多种校准序列。因此,校准序列可以在衔接子序列内被人工排列。因此,虽然校准序列可以与天然存在的基因组序列相同,但它们通过它们在本文公开的衔接子中的人工排列以非天然形式提供。这种非天然形式可以简单地是在本文公开的衔接子序列内的校准序列的呈现。应当理解,本文公开的衔接子序列的制备需要生成自然界中没发现的多核苷酸序列。
本文公开的衔接子序列可以包含被人工排列以形成在天然基因组或转录组中本来不存在的线性序列的两种或更多种校准序列。因此,两种或更多种校准序列可以被连接(joined)或连接(ligated)在一起以形成单个多核苷酸序列。衔接子序列可以包含连续和线性排列的校准序列,以及间插的间隔物序列。可选地或另外地,衔接子序列可以包含以线性顺序连续排列(即,没有间插的间隔物序列)的校准序列。
本文公开的衔接子序列可以包含单一校准序列的至少两个拷贝,这些拷贝被排列在衔接子序列内,使得两个拷贝被其他校准序列和/或被其他校准序列的多于一个拷贝分开。
可选地或另外地,本文公开的衔接子序列可以包含人工校准序列。人工校准序列可以与选自天然外显子、基因、等位基因、基因组或转录组序列的序列具有小于100%、小于99.99%、小于99.9%、小于99%、小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%或小于1%的序列同一性。在一个实例中,校准序列选自天然存在的遗传序列,这些遗传序列被修饰为具有一个或更多个遗传变体、核苷酸颠换、转换、插入和缺失,使得校准序列能够与原始遗传序列区分开来。在一个实例中,校准序列选自天然存在的遗传序列,这些遗传序列被修饰为具有一个或更多个人工核苷酸颠换、转换、插入和缺失,使得校准序列能够与原始遗传序列区分开来。在另一个实例中,校准序列可以从天然存在的遗传序列中选择,然后对这些遗传序列进行逆转、改组和/或修饰,以使校准序列能够与原始遗传序列区分开。因此,校准序列可以包含一种或更多种天然遗传序列的人工序列表示,其中天然遗传序列包括遗传变异、基因或重复序列。
本文公开的校准序列可包含大于其长度的10%、20%、30%、40%、50%、60%、70%、80%或90%的鸟嘌呤或胞嘧啶核苷酸。可选地或另外地,校准序列可以包含大于其长度的10%、20%、30%、40%、50%、60%、70%、80%或90%的腺嘌呤或胸腺嘧啶核苷酸。可选地或另外地,校准序列可以包含长度大于2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸的单核苷酸重复序列。可选地或另外地,校准序列可以包含长度大于2个、4个、6个、8个、10个、12个、14个、16个、18个或20个核苷酸的双核苷酸重复序列。可选地或另外地,校准序列可以包含长度大于3个、6个、9个、12个、15个、18个或21个核苷酸的三核苷酸重复序列。
本文公开的衔接子序列可以包含另外的序列元件。这些另外的序列元件可以是人工的(即,不存在于天然存在的基因组中)。例如,多核苷酸序列可以包含出现在任何一个或更多个校准序列之前和/或之间和/或之后的间隔物序列。间隔物序列的长度可以是至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少50个、至少100核苷酸。可选地或另外地,间隔物序列的长度可以不超过6个、不超过8个、不超过10个、不超过20个、不超过50个、不超过100个核苷酸。在一个实例中,衔接子序列包含出现在一个或更多个校准序列或每个校准序列之前、之间和之后的间隔物序列。
在另一个实例中,衔接子序列包含由间隔物序列分开的校准序列的两个或更多个拷贝。间隔物序列可以是人工的(即,不存在于天然存在的基因组中)。在一个实例中,间隔物序列是随机化的遗传序列,其可以被策划以去除或减少与任何公开可得的、天然存在的基因组序列的序列同源性。本文公开的衔接子序列可以包含与一个或更多个校准序列邻接的一个或更多个间隔物序列。可选地或另外地,衔接子序列可以包含减轻在文库制备过程中可能发生的边缘效应的间隔物序列。
衔接子序列可以包含可以被计算地鉴定、过滤和/或从下一代测序文库中移除的间隔物和/或旁侧序列。在一个实例中,衔接子序列包含当被测序时可以计算地与合成序列或参考合成染色体比对,或者与人工序列或人工染色体比对(例如,如WO 2016/094947中描述)的间隔物和旁侧序列。
本文公开的衔接子序列可以包含含有用于限制性内切核酸酶消化或连接的识别位点序列的间隔物和/或旁侧序列。可选地或另外地,衔接子序列可以包含含有以下任何一种或更多种的间隔物和旁侧序列:启动子序列、转录起始位点或poly-A段。衔接子序列可以包含可操作地连接到一个或更多个引物位点、限制性位点、启动子序列、转录起始位点和/或poly-A段的校准序列。在一个实例中,衔接子序列包含可操作地连接到一个或更多个引物位点、限制性位点、启动子序列、转录起始位点和/或poly-A段的第一校准序列,以及可操作地连接到一个或更多个不同的引物位点、限制性位点、启动子序列、转录起始位点和/或poly-A段的第二校准序列。
衔接子序列还可以包含以下中的任何一种或更多种:UMI、与流动池DNA序列互补的序列、细胞条形码序列和索引序列。可选地,衔接子序列可以不包含以下中的任何一种或更多种:UMI、与流动池DNA序列互补的序列、细胞条形码序列和索引序列。
独特分子标识符(UMI)序列是指示一个序列读段是否是另一个序列读段的重复(这可能发生在文库制备期间的PCR扩增期间)的独特的人工序列。UMI序列通常在测序前不是已知的,但在衔接子的合成期间由随机核苷酸的掺入产生(随机和未知的UMI序列通常由NNNNN注释指示)。由于UMI的随机合成,它们在组合物中独特地存在,并且在混合物中不以已知的数量存在。UMI与其他UMI序列不共有任何同源性。UMI通常是在4-12nt之间(对于短读段Illumina测序)和上至36nt(对于长读段Oxford纳米孔测序)的短序列。UMI序列通常是不包含核苷酸重复序列的随机和人工的序列。任何单个测试样品DNA序列都将可能与2个已鉴定的UMI关联(第二个靶样品有相同序列并与相同的2个已鉴定的UMI关联的可能性非常小),并指示读段是第一个读段的重复克隆,通常是由于PCR扩增。本文公开的每种衔接子可以包含单个UMI。
UMI序列可以包含任何一个或更多个随机掺入的核苷酸,并且可以包含选自由以下组成的组的任何一个或更多个修饰的核苷酸:R、Y、S、W、K、M、B、D、H、V或N核苷酸(IUPAC核苷酸编码)。因此,在可选的实施方案中,校准序列可以不包含这样的UMI序列。因此,校准序列可以仅包含A、T、C或G核苷酸,并且可以不包含选自由以下组成的组的任何一个或更多个修饰的核苷酸:R、Y、S、W、K、M、B、D、H、V或N核苷酸(IUPAC核苷酸编码)。
索引序列是指示一个测序的读段属于哪个文库的独特的人工序列。每个不同的文库将在所使用的衔接子序列中包含不同的索引序列。然后,可以将这些文库混合在一起以在单个流动池上进行测序(称为“多重化”),其中根据索引序列的存在,将输出的经测序的读段分配到不同的文库。索引序列通常是介于6-8个核苷酸(例如,对于短读段Illumina测序)和36个核苷酸(例如,对于长读段Oxford纳米孔测序),并且是不包含核苷酸重复序列的随机和人工的序列。衔接子序列还可以包含用于单个细胞测序应用的“细胞条形码”序列。这包括指示测序读段与单个细胞、孔或液滴的关联的短的(例如26个核苷酸)序列。通常,索引和细胞条形码序列是随机序列。
衔接子序列可以在靶多核苷酸和锚定到表面(诸如流动池的表面)的多核苷酸或附接到蛋白质的多核苷酸之间形成桥。流动池可以包含附接有寡核苷酸的固体表面。衔接子序列可以包含与附接到表面的寡核苷酸序列互补的引物序列。由此,包含测试样品DNA序列和衔接子序列的DNA片段可以与附接到表面的寡核苷酸序列杂交。
Y形衔接子
本文公开的衔接子序列可以是Y形衔接子。Y型衔接子包含两个退火在一起的大体上互补的多核苷酸序列,其中退火的分子的一个末端包含互补的多核苷酸,并且退火的分子的另一末端包含非互补的多核苷酸。因此,例如,可以通过使两个多核苷酸衔接子序列退火来形成Y形衔接子,其中第一多核苷酸衔接子序列的3'末端与第二多核苷酸序列的5'末端互补,而第一多核苷酸衔接子序列的5'末端与第二多核苷酸衔接子序列的3'末端不互补。当这两个多核苷酸序列杂交和退火时,它们形成Y型分子结构。图1说明了Y形衔接子的非限制性实例。在一个实例中,本文公开的Y形衔接子可以包含在Y的退火部分(Y的茎)中的两个互补引物序列,并且两个非退火部分(Y的叉)包含非互补序列。这些非互补序列可以是引物序列,也可以不是引物序列。
引物和校准序列在衔接子内的相对位置
校准序列可以位于多核苷酸衔接子序列的5'末端。可选地,校准序列可以位于多核苷酸衔接子序列的3'末端。在一个实例中,一个多核苷酸包含终止于多核苷酸衔接子序列3'末端的校准序列,而第二多核苷酸衔接子序列包含开始于多核苷酸衔接子序列5'末端的第二校准序列。在这样的实例中,第二校准序列可以是第一校准序列的反向互补体。这导致两个校准序列在双链多核苷酸的同一末端杂交。
在本文公开的任何衔接子中,一个衔接子中的校准序列可以是第二衔接子中的第二校准序列的反向互补体。
在一个实例中,校准序列位于退火形成Y形衔接子的两个多核苷酸衔接子序列之间的互补序列的3'下游。在另一个实例中,校准序列位于退火形成Y形衔接子的两个多核苷酸衔接子序列之间的互补序列的5'上游。
在一个实例中,多核苷酸衔接子序列包含一种或更多种引物序列3'下游的一种或更多种校准序列。在另一个实例中,校准序列位于合成的、通用的、P5或P7寡核苷酸序列(参见表1)的互补序列的3'下游。在另一个实例中,校准序列位于与起始DNA合成的互补DNA寡核苷酸结合的序列(参见表1)的3'下游。
在一个实例中,多核苷酸衔接子序列包含一种或更多种引物序列上游的一种或更多种校准序列。在一个实例中,多核苷酸衔接子序列包含与靶DNA位点杂交以起始DNA合成的引物序列,其中所得到的扩增的DNA片段将包含含有靶DNA序列上游的多核苷酸衔接子序列的单个多核苷酸序列。在一个实例中,校准序列位于与附接到流动池表面的寡核苷酸互补的引物序列的3'下游。
在另一个实例中,校准序列位于合成的、通用的寡核苷酸序列(参见表1)的互补序列的5'上游。在另一个实例中,校准序列位于与起始DNA合成的互补DNA寡核苷酸结合的序列(参见表1)的3'下游。
在另一个实例中,校准序列位于与测试DNA样品内的互补靶多核苷酸序列结合的序列的5'上游。在另一个实例中,校准序列位于与人类基因组序列内的互补靶多核苷酸序列结合的序列的5'上游。在另一个实例中,校准序列位于与人类基因外显子和/或内含子内的互补靶多核苷酸序列结合的序列的5'上游。
逆转录需要与互补的靶RNA序列杂交,并起始互补DNA(cDNA)合成的短的DNA寡核苷酸引物。在本公开的一个实例中,衔接子序列包含一种或更多种校准序列和一种或更多种与靶RNA序列互补的引物序列。这样的衔接子可用于逆转录方法。在本实例中,逆转录方法中使用的多核苷酸衔接子序列包含校准序列和与RNA靶互补的序列。多核苷酸衔接子序列与靶RNA位点的杂交将起始cDNA分子的合成,该cDNA分子包含位于cDNA分子5'末端的多核苷酸衔接子序列和随后的靶RNA序列。因此,逆转录合成可以产生包含多核苷酸衔接子序列和靶RNA序列的cDNA片段。
在一个实例中,多核苷酸衔接子序列包含校准序列,其中校准序列位于包含多于3个、多于8个、多于10个、多于15个或多于20个连续胸腺嘧啶核苷酸的引物序列的上游。在一个实例中,多核苷酸衔接子序列包含校准序列,其中校准序列位于包含多于3个、多于8个、多于10个、多于15个或多于20个连续尿嘧啶核苷酸的引物序列的上游。在一个实例中,多核苷酸衔接子序列包含校准序列,其中校准序列位于包含多于3个、8个、10个、15个或20个连续胸腺嘧啶核苷酸的序列的下游。
纳米孔测序可以通过当RNA或DNA序列通过纳米孔时电流的变化来确定核苷酸的身份。在本公开的一个实例中,衔接子序列包含一种或更多种校准序列。这样的衔接子可用于纳米孔测序的方法。在该实例中,衔接子序列可以连接到靶多核苷酸序列(在图3中的非限制性实例中说明)。在一个实例中,衔接子序列可以附接有蛋白。在一个实例中,衔接子序列可以与附接有蛋白的第二DNA分子连接。附接的蛋白可以是起始和控制DNA或RNA分子通过纳米孔的易位的酶马达。然后,靶多核苷酸序列和衔接子序列可以被蛋白装载到纳米孔中,并随后通过纳米孔,确定衔接子和多核苷酸靶序列。
在一个实例中,多核苷酸衔接子序列包含校准序列,其中校准序列终止于多核苷酸衔接子序列的3'末端,并且其中校准序列以胸腺嘧啶核苷酸终止。在另一个实例中,多核苷酸衔接子序列包含校准序列,其中校准序列从多核苷酸衔接子序列的5'开始,并且其中校准序列以胸腺嘧啶核苷酸开始。在一个实例中,衔接子序列在3'末端具有胸腺嘧啶核苷酸。在另一个实例中,衔接子在衔接子分子的5'末端包含5'磷酸。
组合物
应当理解,如本文所公开的两种或更多种衔接子序列可以组合以形成组合物。组合物可以包含两种或更多种不同的衔接子序列。两种或更多种不同的衔接子序列可以各自包含两种或更多种不同的校准序列。可选地,组合物可以包含两种或更多种不同的衔接子序列,每种衔接子序列包含相同的一组校准序列。
在本文公开的组合物中,一种或更多种校准序列可以存在于组合物中的两种或更多种衔接子序列中。在一个实例中,单一校准序列以不同的拷贝数存在于两种或更多种衔接子序列中。
在另一个实例中,两种或更多种衔接子序列可以以不同浓度组合以形成混合物。衔接子序列可以以预定浓度组合以形成混合物。在一些组合物中,两种或更多种衔接子序列以已知的绝对浓度组合形成混合物。在一些组合物中,两种或更多种衔接子序列以已知的相对浓度组合形成混合物。在一些组合物中,两种或更多种衔接子序列以等摩尔浓度组合形成混合物。相对浓度可以是预定的,以便在每种校准序列的拷贝数方面以本文描述的任何相对倍数差异提供组合物中的每种校准序列的相对量。例如,衔接子可包含浓度是组合物中一种或更多种其他校准序列的浓度的2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、12倍、14倍、16倍、32倍、64倍、100倍、128倍、256倍、512倍、1000倍、1024倍、2048倍、4096倍、8192倍或10,000倍的一种或更多种校准序列。
天然遗传特征的表示
本文描述的校准序列可以基于存在于天然存在的基因组中的任何特定的感兴趣序列。例如,校准序列可以基于最新公开可得的人类基因组序列(目前为GRCh38.p13(Genome Reference Consortium Human Build 38补丁版本13,智人(Homo sapiens)(人类),由Genome Reference Consortium于2019年2月28日提交到NCBI,并鉴定为GenBank组装(assembly)登录号GCA_000001405.28(最新)))中存在的任何特定的感兴趣序列。因此,校准序列可以基于人类基因组序列GRCh38.p13中存在的任何特定的感兴趣序列。校准序列可以基于任何其他公开可得的基因组序列,诸如任何哺乳动物、脊椎动物、动物、微生物、细菌、病毒、噬菌体、细胞器、原核或真核基因组中存在的任何特定的感兴趣序列。这样的公开可得的基因组序列的两个非限制性实例包括乙型肝炎基因组(NC_003977.2)和HIV基因组(NC_001802.1)。将非常明显的是,存在许多这样的公开可得的基因组序列,并且它们可用于产生如本文描述的校准序列。
本文公开的多核苷酸序列可以包含至少一种是天然存在的多核苷酸序列的校准序列。校准序列可以部分或全部基于天然存在的序列。因此,校准序列可以基于在天然基因组或转录组序列中观察到的一种或更多种序列。因此,本文公开的多核苷酸序列可以包含复制自然界中发现的遗传序列的校准序列。
多核苷酸序列可以包含代表来自两种或更多种不同外显子、基因、内含子、染色体或基因组的遗传序列的校准序列。
校准序列在校准序列的整个长度上可以与天然存在的基因组序列100%相同。然而,在其他实例中,包含在本公开的衔接子中的校准序列与天然存在的遗传序列具有小于100%的同一性(或同源性)。例如,衔接子序列可以与在天然基因组或转录组序列中观察到的序列具有超过1%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、99.99%、99.9999%或99.999999%的同一性(或同源性)。在一种实施方案中,衔接子序列包含与在天然基因组或转录组序列中观察到的序列具有超过1%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、99.99%、99.9999%或99.999999%的同一性(同源性)的一种或更多种校准序列。在一种实施方案中,衔接子序列包含与在天然基因组或转录组序列中观察到的序列具有超过1%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、99.99%、99.9999%或99.999999%的同源性的两种或更多种校准序列。
本文公开的多核苷酸序列可以包含两种或更多种校准序列,其复制在天然基因组或转录组序列中观察到的被连接成单个连续的RNA或DNA序列的两种或更多种序列。
在一个实例中,本文描述的多核苷酸序列(包括本公开的梯状物和衔接子)可以包含复制选自第一基因组的遗传序列的第一校准序列和复制选自第二基因组的遗传序列的第二校准序列。在另一个实例中,本文描述的多核苷酸序列(包括本公开的梯状物和衔接子)可以包含复制选自第一染色体序列的遗传序列的第一校准序列和复制选自第二染色体序列的遗传序列的第二校准序列。在其他实例中,本文描述的多核苷酸序列(包括本公开的梯状物和衔接子)可以包含复制选自以下任何一种或更多种的序列的校准序列:真核、原核或病毒基因组、载体、细胞器或质粒基因组或转录组序列。
多核苷酸序列可以包含代表天然存在的基因组序列特征的校准序列。这些特征可选自,例如并且不限于,人类微卫星、T细胞和免疫球蛋白基因序列以及CpG甲基化序列。多核苷酸序列可包含选自遗传变体内的序列的校准序列,其中遗传变体包括,例如,核苷酸颠换、核苷酸转换、插入、缺失、倒位、重复扩展和/或结构变体。在另一个实例中,多核苷酸序列可包含选自具有拷贝数变异、扩增、缺失、微缺失或染色体非整倍性的遗传序列的校准序列。本文公开的多核苷酸序列可包含一种或更多种从选自基因组的编码、内含子和非编码的序列选择的校准序列。在一个实例中,多核苷酸序列包含选自基因序列的校准序列。在另一个实例中,多核苷酸序列包含选自信使RNA序列、融合基因序列、微RNA、长非编码RNA和其他种类RNA转录物的校准序列。这样的特征可选自,例如并且不限于,人类微卫星、甲基化序列以及T细胞和免疫球蛋白基因序列。在另一个实例中,多核苷酸序列包含选自常见、困难、致病和/或良性遗传变体序列的校准序列。在另一个实例中,多核苷酸序列包含选自公开可得的参考基因组组装序列的校准序列。在另一个实例中,多核苷酸序列包含选自人类基因组组装序列的校准序列。在另一个实例中,多核苷酸序列包含选自人类遗传序列的校准序列。在另一个实例中,多核苷酸序列包含选自具有拷贝数变异、扩增、缺失、微缺失或染色体非整倍性的遗传序列的校准序列。本文公开的衔接子序列可以包含至少一种是天然存在的多核苷酸序列的校准序列。校准序列可以部分或全部基于天然存在的序列。因此,校准序列可以基于在天然基因组或转录组序列中观察到的一种或更多种序列。因此,本文公开的多核苷酸序列可以包含复制自然界中发现的遗传序列的校准序列。衔接子序列可以包含代表来自外显子、基因、内含子、染色体或基因组的遗传序列的校准序列。衔接子序列可以包含代表来自两种或更多种不同外显子、基因、内含子、染色体或基因组的遗传序列的校准序列。
在另一个实例中,多核苷酸序列(例如,衔接子)包含选自公开可得的参考基因组组装序列的校准序列。在另一个实例中,多核苷酸序列(例如,衔接子)包含选自人类基因组组装序列的校准序列。在另一个实例中,多核苷酸序列(例如,衔接子)包含选自人类遗传序列的校准序列。
在一个实例中,多核苷酸序列(例如,衔接子)包含至少一种代表天然存在的第一多核苷酸序列的校准序列和至少一种代表第一校准序列的变体序列的其他校准序列。
因此,本文公开的多核苷酸序列可以包含复制包含遗传变体的遗传序列的校准序列。在一个实例中,多核苷酸序列包含选自基因组序列的第一校准序列和代表第一序列的变体序列的第二校准序列。在一个实例中,多核苷酸序列包含两种或更多种校准序列,其中第一校准序列选自人类基因组参考组装序列,并且第二校准序列代表第一校准序列的变体。在一个实例中,多核苷酸序列包含分别代表选自人类染色体二倍体对的不同等位基因序列的第一和第二校准序列。因此,一种校准序列可以代表母体来源的序列,并且另一种校准序列可以代表父体来源的序列。
多核苷酸序列可以包含选自基因组序列的第一校准序列,以及代表第一序列的变体序列的第二校准序列,其中第二校准序列以比第一校准序列更多、更少或相同的拷贝数重复。例如,多核苷酸序列可以包含代表两种或更多种等位基因序列的两种或更多种校准序列,这些校准序列以复制对于杂合基因型、纯合基因型、拷贝数扩增、缺失、插入和/或杂合性损失观察到的拷贝数比率的拷贝数重复。在一个实例中,多核苷酸序列包含代表母体遗传染色体序列的第一校准序列和代表父体遗传染色体序列的第二校准序列。在另一个实例中,多核苷酸序列可以包含代表第一等位基因序列的第一校准序列和代表第二等位基因序列的第二校准序列。应当理解,可以包含代表另外的等位基因序列的另外的校准序列。
本文公开的多核苷酸序列可以包含代表第一等位基因序列的第一校准序列和代表第二等位基因序列的第二校准序列,其中两种校准序列以不同拷贝数重复,并且其中拷贝数的比率复制在生物样品测序中观察到的体细胞等位基因频率。任何生物样品都可以根据其中存在的等位基因频率通过使用其拷贝数被相应调整的校准序列来复制。合适的生物样品的一个非限制性实例是肿瘤活检。例如,多核苷酸序列可以包含以一定拷贝数重复的两种或更多种校准序列,其中拷贝数的比率复制50%、25%、12.5%、6.25%、10%、1%或0.1%等位基因频率。此外,多核苷酸序列可以包含以一定拷贝数重复的两种或更多种校准序列,其中拷贝数的比率复制拷贝数变异、扩增、缺失、微缺失、三体性和/或染色体非整倍性。在一个实例中,多核苷酸序列包含以一定拷贝数重复的两种或更多种校准序列,其中拷贝数的比率复制在非侵入性产前测序中观察到的胎儿和/或母体和/或父体基因型。
本文公开的多核苷酸序列可以包含选自在人类疾病的临床诊断期间鉴定的遗传序列的一种或更多种校准序列。例如,多核苷酸序列可以包含选自与人类疾病有因果关系的人类基因组序列的一种或更多种校准序列。例如,本文公开的多核苷酸序列可包括选自在癌症、遗传性疾病、病原体检测和/或耐药性诊断期间鉴定的遗传序列的校准序列。在一个实例中,多核苷酸序列包含选自用于临床诊断的人类序列的校准序列。
癌症
肿瘤样品的测序可以检测可用于诊断癌症的遗传突变的存在。这可以为患者的预后和治疗提供信息。然而,肿瘤样品的复杂性、常以低等位基因频率存在的体细胞突变以及文库制备和测序期间的另外的技术变量可能会影响突变的准确诊断。
本文公开的多核苷酸序列可以包含选自已知会引起癌症的遗传序列的校准序列。例如,多核苷酸序列可包含选自与癌症有因果关系的一种或更多种基因或外显子序列的校准序列。在另一个实例中,多核苷酸序列可以包含选自与癌症有因果关系的单个基因的两个或更多个外显子的遗传序列的校准序列。因此,本文公开的多核苷酸序列可用于解释与癌症有因果关系的基因序列内变体的检测。因此,本公开提供了本文公开的多核苷酸校准检测癌症的方法的用途。例如,本文公开的多核苷酸可用于校准检测指示癌症的存在、或发生癌症的易感性、或患有癌症的受试者的预后的一种或更多种遗传序列的方法。这样的方法可以在动物受试者诸如哺乳动物受试者上进行,并且更具体地,在人类受试者上进行。
在另一个实例中,本文公开的多核苷酸序列可以包含选自来自单个基因的不同外显子序列的两种或更多种校准序列。这样的校准序列可以以复制人类疾病中基因外显子的扩增和缺失的拷贝数重复。因此,在一个实例中,本文公开的多核苷酸序列可以包含选自来自同一基因的不同外显子序列的校准序列。在另一个实例中,本文公开的多核苷酸序列可包含选自来自同一基因的不同外显子序列的校准序列,该校准序列以2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、100个、1,000和/或10,000个拷贝提供。因此,本文公开的多核苷酸序列可以复制通常存在于肿瘤样品中的突变负荷。因此,校准序列可以以复制通常存在于肿瘤样品中的突变负荷的拷贝数来提供。因此,校准序列可以以复制通常存在于肿瘤样品中的突变负荷的拷贝数来提供。
本文公开的多核苷酸序列可以包含一种或更多种以任何组合或排列形式的选自以下基因序列的校准序列(这些序列在诸如NIH的遗传序列数据库
Figure BDA0003865051000000511
的数据库上公开可得):ABL1、ABO、ACADM、ACTA2、ACTC1、AFF2、AKT1、AKT2、AKT3、ALK、APC、APOA1、APOB、APOE、AR、ARAF、AREG、ARID1A、ATM、ATN1、ATP7B、ATR、ATXN1、ATXN3、ATXN7、AURKA、AXIN2、BAP1、BCL2、BCR、BCR-ABL1、BCR-JAK2、BLM、BMPR1A、BMPR2、BRAF、BRCA1、BRCA2、BRD4、BTD、BTK、C9orf72、CACNA1A、CACNA1S、CAS9、CASR、CBL、CCND1、CCND2、CCND3、CCNE1、CD19、CD274、CDH1、CDK4、CDK6、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CFTR、CHEK2、chrM、COL1A1、COL1A1-PDGFRB、COL3A1、CRLF2、CSF1R、CSF3R、CTNNB1、CYP1A2、CYP2C19、CYP2C9、CYP2D6、CYP2D7、CYP3A5、DDR2、DMD、DMPK、DNMT3A、DSC2、DSG2、DSP、EF1a、EGFR、EPHA2、EPHA3、ERBB、ERBB2、ERBB3、ERBB4、ERCC1、ERCC2、ERCC4、ERCC6、EREG、ESR1、EZH2、F2、F5、F8、F9、FANCA、FANCC、FBN1、FBXW7、FGA、FGF3、FGF4、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT3、FMR1、FRS2、FXN、G6PD、GALT、GATA3、GBA、GLA、GNA11、GNAQ、GNAS、HBA1、HBA2、HBB、HBD、HBG1、HBG2、HDAC2、HEXA、HFE、HGF、HLA-A、HLA-B、HLA-C、HLA-DM、HLA-DO、HLA-DP、HLA-DQ、HLA-DR、HRAS、HTT、IDH1、IDH2、IGF1R、IGF2、IKBKAP、IL7R、INPP4B、JAK1、JAK2、JAK3、KCNH2、KCNQ1、KDR、KIT、KMT2A、KRAS、LDLR、LMNA、LRP1B、LYZ、MAP2K1、MAP2K2、MAP3K1、MCL1、MCOLN1、MDM2、MDM4、MEK1、MEN1、MET、MGMT、MITF、MLH1、MLL、MLL2、MLL3、MPL、MSH2、MSH3、MSH6、MTHFR、MTOR、MUTYH、MYBPC3、MYC、MYCN、MYD88、MYH11、MYH7、MYL2、MYL3、MYLK、NAT2、NF1、NF2、NKX2、NOTCH1、NOTCH2、NPM1、NRAS、NRG1、NTRK1、NTRK3、OTC、PAH、PAK1、PALB2、PAX8、PBRM1、PCSK9、PDGFRA、PDGFRB、PDK1、PDPK1、PIK3CA、PIK3CB、PIK3R1、PIK3R2、PKD1、PKD2、PKHD1、PKP2、PLCG2、PML、PML-RARA、PMS2、PPARG、PPP2R2B、PRKAG2、PRKCH、PRSS1、PTCH1、PTEN、PTPN11、RAC1、RAD50、RAF1、RARA、RB1、RET、RET-PTCH1、RHCE、RHD、RICTOR、RNF43、ROS1、RYR1、RYR2、SCN5A、SDHAF2、SDHB、SDHC、SDHD、SERPINA1、SETD2、SF3B1、SH2B3、SLCO1B1、SMAD3、SMAD4、SMARCA1、SMARCA4、SMARCB1、SMN1、SMN2、SMO、SMPD1、SOCS1、SPINK1、STAG2、STK11、SUZ12、SYK、TBP、TGFBR1、TGFBR2、TMEM43、TMPRSS2、TNNI3、TNNT2、TOP2A、TP53、TPM1、TPMT、TSC1、TSC2、TTR、UGT1A1、VEGFA、VHL、VKORC1、WT1、ZNRF3。在一个实例中,多核苷酸序列包含选自本文描述的任何一种或更多种基因的参考序列、野生型序列、突变序列或变体序列的校准序列。
ctDNA
可以在癌症患者的血流中检测到循环肿瘤DNA(ctDNA)的片段。这些片段(或ctDNA)可以指示肿瘤的存在和演变。检测ctDNA可用作检测和诊断肿瘤的非侵入性方法。
本文公开的多核苷酸序列可以包含选自ctDNA序列的校准序列。例如,多核苷酸序列可包含选自与癌症相关的遗传序列(诸如存在于ctDNA中的体细胞、驱动、临床可操作或良性的突变或DNA修饰)的校准序列。
在一个实例中,本文公开的多核苷酸序列用于鉴定和分析ctDNA片段。可以使用酶促剪切将多核苷酸序列片段化以复制ctDNA的长度。在一个实例中,本文描述的多核苷酸序列使用机械或酶促剪切来片段化,以产生与ctDNA片段长度匹配的片段。这样的片段的长度可以为,例如,约10个至约400个核苷酸。例如,这样的片段的长度可以为约15个至约350个核苷酸,或约50个至约300个核苷酸,或约100个至约200个核苷酸,或约130个至约170个核苷酸,或约140个至约160个核苷酸,或约150个核苷酸。同样,校准序列可以在多核苷酸序列中以反映ctDNA中存在的体细胞突变频率的拷贝数重复。
本文公开的多核苷酸序列中的校准序列之间的拷贝数或比率可以模拟ctDNA中反映的肿瘤突变负荷。
校准序列可以在多核苷酸序列中以反映ctDNA中存在的体细胞突变频率的拷贝数重复。本文公开的衔接子序列中(例如,在单个衔接子序列中或在衔接子序列的组合物中)的校准序列之间的拷贝数或比率可以模拟ctDNA中反映的肿瘤突变负荷。
本文公开的多核苷酸序列可以包含含有修饰的核苷酸的校准序列。例如,多核苷酸序列可以包含含有一种或更多种甲基化DNA序列的校准序列。此外,本文公开的多核苷酸序列可以包含含有不同且已知的丰度的修饰的核苷酸的校准序列。在一个实例中,多核苷酸序列包含以反映ctDNA中存在的体细胞突变频率的不同拷贝数存在的校准序列,使得这些多核苷酸序列可以在检测ctDNA样品中体细胞突变的校准方法有利地使用。
核型
非整倍性以及大的染色体缺失和扩增可以引起一系列人类疾病。NGS可用于检测大染色体区域或数量的这样的变化,然而,比对错误、测序深度不足、低复杂性和重复序列可能会混淆分析。
本文公开的多核苷酸序列可以包含代表第一等位基因序列的第一校准序列和代表第二等位基因序列的第二校准序列。可以确定代表不同等位基因的两种校准序列之间的拷贝数比,以便匹配人类核型中染色体区域的拷贝数比。因此,在一个实例中,本文公开的多核苷酸序列可以包含从人类染色体的一个或更多个区域中选择的父体和母体等位基因序列的一种或更多种校准序列。可以预定多核苷酸序列中校准序列的比率以匹配正常或异常人类核型中染色体的比率。为了提供这种情况的一个实例,多核苷酸序列可以包含相对于至少一个以2个拷贝重复的其他校准序列而言以3个拷贝重复的校准序列。多核苷酸序列可包含选自人类染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X、Y或线粒体染色体(chrM)序列中的任何一种或更多种的校准序列。在一个实例中,多核苷酸序列包含以不同拷贝数重复的校准序列,如本文描述,以建立测量和评估DNA样品中拷贝数变异的数量的定量参考梯状物。在一个实例中,多核苷酸序列包含以与人类基因组中的序列相同的拷贝数重复的校准序列。
NIPT
可以检测到来源于胎儿基因组的DNA片段在怀孕母亲的血液中循环。循环胎儿DNA片段的分离和测序可以提供非侵入性方法来检测胎儿基因组内染色体非整倍性、拷贝数变体、结构变体和小突变的存在。然而,由于片段尺寸小、胎儿DNA载量可变、基因组覆盖稀疏以及循环母体DNA的重叠存在,用NGS方法进行分析具有有限的灵敏度。
本文公开的多核苷酸序列可以包含选自循环母体或胎儿DNA序列的校准序列。因此,多核苷酸序列可以包含选自父体、母体或胎儿染色体遗传序列的一种或更多种校准序列。在一个实例中,多核苷酸序列包含选自母体染色体遗传序列的第一校准序列和选自胎儿染色体遗传序列的第二校准序列。一种或更多种校准序列可以以复制母体和胎儿循环DNA序列比率的拷贝数重复。在一个实例中,本文公开的多核苷酸序列用于测量母体血液中的胎儿循环DNA。
本文公开的多核苷酸序列可以包含一种或更多种校准序列,其中两种或更多种校准序列之间的拷贝数的比率与杂合、纯合、胎儿和母体遗传变异、胎儿染色体非整倍性、拷贝数变异、缺失和/或扩增的比率相匹配。在一个实例中,多核苷酸序列包含选自通过非侵入性产前测试(NIPT)鉴定的遗传序列的校准序列。此外,多核苷酸序列可包含选自具有染色体非整倍性、大拷贝数变体、微扩增、微缺失和/或微重复的遗传序列的校准序列。在一个实例中,多核苷酸序列被片段化以产生与循环胎儿DNA和循环母体DNA片段长度匹配的DNA片段。这样的片段的长度可以为,例如,约10个至约400个核苷酸。例如,这样的片段可以长度为约15个至约350个核苷酸,或长度为约50个至约250个核苷酸,或长度为约100个至约200个核苷酸,或长度为约130个至约170个核苷酸,或长度为约140个至约160个核苷酸,或长度可以为约150个核苷酸。
RNA
基因组被转录成一系列编码和非编码RNA,统称为转录组。RNA测序已成为生物学研究中的常用工具,并越来越多地应用于临床诊断。然而,基因表达的规模和复杂性、普遍的表达依赖性偏差以及文库制备、测序和分析期间的另外的技术变量影响了转录组的分析。
本文公开的多核苷酸序列可以包含或由核糖核苷酸(RNA)序列组成。在一个实例中,多核苷酸序列包含选自一个或更多个基因外显子的校准序列。在另一个实例中,多核苷酸序列包含两种或更多种校准序列,每种校准序列选自来自单个基因的不同外显子序列。在另一个实例中,多核苷酸序列包含两种或更多种校准序列,每种校准序列选自来自不同基因的不同外显子序列。校准序列重复的拷贝数的数量之间的比率可以提供为匹配由校准序列代表的天然存在的序列的基因表达丰度、可变剪接频率和同种型表达。
本文公开的多核苷酸序列可被逆转录成互补DNA(cDNA)序列。因此,本文公开的多核苷酸序列可用于RNA测序方法。因此,本公开提供了如本文公开的多核苷酸序列在RNA测序方法的校准中的用途。
本文公开的多核苷酸序列也可用于使用基于PCR的扩增方法进行RNA序列的靶向富集。例如,本文公开的多核苷酸序列可用于使用与互补寡核苷酸探针杂交来靶向富集RNA序列的方法。因此,本公开提供了如本文所公开的多核苷酸序列在使用基于PCR的扩增方法和/或使用与互补寡核苷酸探针杂交的RNA序列靶向富集中的用途。
存在于本文公开的多核苷酸中的校准序列拷贝数的比率可以确定为对应于基因表达丰度。例如,本文公开的多核苷酸序列可以用于单细胞RNA测序方法。在一个实例中,多核苷酸序列包含选自人类疾病临床诊断中使用的基因特征的校准序列。在另一个实例中,多核苷酸序列包含一种或更多种选自癌症中出现的融合基因序列的校准序列。在另一个实例中,多核苷酸序列包含一种或更多种选自两个不同基因的一个或更多个外显子(如通常在融合基因中出现的)的校准序列。
本文公开的多核苷酸序列可以包含,例如,以任何组合或排列形式的选自以下基因列表的一种或更多种校准序列:ABL1、ABO、ACADM、ACTA2、ACTC1、AFF2、AKT1、AKT2、AKT3、ALK、APC、APOA1、APOB、APOE、AR、ARAF、AREG、ARID1A、ATM、ATN1、ATP7B、ATR、ATXN1、ATXN3、ATXN7、AURKA、AXIN2、BAP1、BCL2、BCR、BCR-ABL1、BCR-JAK2、BLM、BMPR1A、BMPR2、BRAF、BRCA1、BRCA2、BRD4、BTD、BTK、C9orf72、CACNA1A、CACNA1S、CAS9、CASR、CBL、CCND1、CCND2、CCND3、CCNE1、CD19、CD274、CDH1、CDK4、CDK6、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CFTR、CHEK2、chrM、COL1A1、COL1A1-PDGFRB、COL3A1、CRLF2、CSF1R、CSF3R、CTNNB1、CYP1A2、CYP2C19、CYP2C9、CYP2D6、CYP2D7、CYP3A5、DDR2、DMD、DMPK、DNMT3A、DSC2、DSG2、DSP、EF1a、EGFR、EPHA2、EPHA3、ERBB、ERBB2、ERBB3、ERBB4、ERCC1、ERCC2、ERCC4、ERCC6、EREG、ESR1、EZH2、F2、F5、F8、F9、FANCA、FANCC、FBN1、FBXW7、FGA、FGF3、FGF4、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT3、FMR1、FRS2、FXN、G6PD、GALT、GATA3、GBA、GLA、GNA11、GNAQ、GNAS、HBA1、HBA2、HBB、HBD、HBG1、HBG2、HDAC2、HEXA、HFE、HGF、HLA-A、HLA-B、HLA-C、HLA-DM、HLA-DO、HLA-DP、HLA-DQ、HLA-DR、HRAS、HTT、IDH1、IDH2、IGF1R、IGF2、IKBKAP、IL7R、INPP4B、JAK1、JAK2、JAK3、KCNH2、KCNQ1、KDR、KIT、KMT2A、KRAS、LDLR、LMNA、LRP1B、LYZ、MAP2K1、MAP2K2、MAP3K1、MCL1、MCOLN1、MDM2、MDM4、MEK1、MEN1、MET、MGMT、MITF、MLH1、MLL、MLL2、MLL3、MPL、MSH2、MSH3、MSH6、MTHFR、MTOR、MUTYH、MYBPC3、MYC、MYCN、MYD88、MYH11、MYH7、MYL2、MYL3、MYLK、NAT2、NF1、NF2、NKX2、NOTCH1、NOTCH2、NPM1、NRAS、NRG1、NTRK1、NTRK3、OTC、PAH、PAK1、PALB2、PAX8、PBRM1、PCSK9、PDGFRA、PDGFRB、PDK1、PDPK1、PIK3CA、PIK3CB、PIK3R1、PIK3R2、PKD1、PKD2、PKHD1、PKP2、PLCG2、PML、PML-RARA、PMS2、PPARG、PPP2R2B、PRKAG2、PRKCH、PRSS1、PTCH1、PTEN、PTPN11、RAC1、RAD50、RAF1、RARA、RB1、RET、RET-PTCH1、RHCE、RHD、RICTOR、RNF43、ROS1、RYR1、RYR2、SCN5A、SDHAF2、SDHB、SDHC、SDHD、SERPINA1、SETD2、SF3B1、SH2B3、SLCO1B1、SMAD3、SMAD4、SMARCA1、SMARCA4、SMARCB1、SMN1、SMN2、SMO、SMPD1、SOCS1、SPINK1、STAG2、STK11、SUZ12、SYK、TBP、TGFBR1、TGFBR2、TMEM43、TMPRSS2、TNNI3、TNNT2、TOP2A、TP53、TPM1、TPMT、TSC1、TSC2、TTR、UGT1A1、VEGFA、VHL、VKORC1、WT1、ZNRF3。
宏基因组学
宏基因组学提供了环境样本中存在的微生物基因组的全局概况。然而,缺乏微生物参考基因组序列,存在复杂的、可变的和重复的遗传序列,以及由于文库制备和测序而引起的技术变差(technical variation)会混淆分析。
本文公开的多核苷酸序列可以包含一种或更多种为选择的微生物基因组序列的校准序列。例如,多核苷酸序列可包含选自细菌、古细菌、病毒、质粒和/或噬菌体RNA或DNA序列的校准序列。在一个实例中,多核苷酸序列包含以与两种或更多种微生物的丰度匹配的拷贝数重复的两种或更多种校准序列。可选地或另外地,多核苷酸序列可以包含一种或更多种选自水平获得的基因(horizontally-aquired gene)、质粒、转座子或整合子、病毒或噬菌体序列的校准序列。
例如,本文公开的多核苷酸序列可包含一种或更多种选自病毒基因组序列(包括RNA或DNA病毒基因组序列、逆转录病毒、双链和单链RNA和/或DNA病毒)的校准序列。在一个实例中,多核苷酸序列包含选自病毒整合到人类基因组中的序列的一种或更多种校准序列。在另一个实例中,多核苷酸序列可以包含选自病毒基因组序列的变体序列的校准序列。在另一个实例中,多核苷酸序列可以包含一种或更多种选自赋予耐药性(诸如抗生素耐药性)的遗传变体序列的校准序列。在一个实例中,多核苷酸序列包含一种或更多种校准序列,该校准序列是选择的HIV基因组序列,其赋予对非核苷逆转录酶抑制剂、核苷逆转录酶抑制剂和蛋白酶抑制剂的抗性。在另一个实例中,多核苷酸序列包含选自在基因治疗应用中使用的病毒载体序列的校准序列。
本文公开的多核苷酸序列可以包含例如从以下基因组序列列表中选择的一种或更多种校准序列:星状病毒(Astrovirus)、白色念珠菌(Candida Albicans)、光滑念珠菌(Candida glabrata)、新型隐球菌(Cryptococcus neoformans)、新型隐球菌(SOD1)、登革病毒(Dengue virus)、埃博拉病毒(Ebola virus)、EB病毒(Epstein Barr Virus)、幽门螺杆菌(Helicobacter pylori)、甲型肝炎病毒(Hepatitis A virus)、乙型肝炎病毒(Hepatitis B virus)、丙型肝炎病毒(Hepatitis C virus)、丁型肝炎病毒(Hepatitis Dvirus)、戊型肝炎病毒(Hepatitis E virus)、戊型肝炎病毒(Hepatitis E virus)、丙型肝炎病毒(Hepatitus C)、人类甲型疱疹病毒(Human alphaherpesvirus)、人类冠状病毒(Human coronavirus)、人类肠道病毒A(Human enterovirus A)、人类肠道病毒B(Humanenterovirus B)、人类肠道病毒D(Human enterovirus D)、人类疱疹病毒(Humanherpesvirus)、人类免疫缺陷病毒(Human immunodeficiency virus)、人类偏肺病毒(Human metapneumovirus)、人类乳头瘤病毒(Human papillomavirus)、人类副流感病毒1(Human parainfluenza virus 1)、人类副流感病毒3(Human parainfluenza virus 3)、人类细小病毒(Human parvovirus)、人类鼻病毒(Human rhinovirus)、流感(Influenza)、甲型流感(Influenza A)、乙型流感(Influenza B)、诺如病毒GI(Norovirus GI)、副肠病毒(Parechovirus)、脊髓灰质炎病毒(Poliovirus)、狂犬病病毒(Rabies virus)、小隐孢子虫(Hsp70)(Cryptosporidium parvum(Hsp70))、呼吸道合胞病毒(Respiratory syncytialvirus)、轮状病毒(Rotavirus)、沙波病毒(Sapovirus)、金黄色葡萄球菌(Staphylococcusaureus)、西尼罗病毒(West Nile virus)、黄热病病毒(Yellow fever virus)、寨卡病毒(Zika virus)、大肠杆菌(Escherichia coli)。
修饰的核苷酸
本文公开的多核苷酸序列可以包含一种或更多种修饰的核苷酸。在一种实施方案中,多核苷酸序列包含一种或更多种包含修饰的核苷酸的校准序列和一种或更多种不包含修饰的核苷酸的校准序列。在一种实施方案中,多核苷酸序列包含存在于多核苷酸序列中已知位点的修饰的核苷酸。在一种实施方案中,多核苷酸序列可用于校准使用测序、杂交、抗体或荧光技术的对修饰的核苷酸的检测。
本文公开的多核苷酸序列可以包含一种或更多种修饰的核苷酸,所述修饰的核苷酸包含5-甲基尿苷、2'O-甲基-RNA、2'-氟尿嘧啶、2'-氟胞嘧啶、5-丙炔基-2'脱氧胞苷、5-丙炔基-2'脱氧尿苷、5-甲基胞嘧啶、5-羟甲基胞嘧啶ionisin、7-脱氮鸟嘌呤、2,6-二氨基嘌呤、5'硝基吲哚、3-硝基吡咯和2'-O-甲基化核糖中的一种或更多种。此外,本文公开的多核苷酸序列可以包含修饰的核苷酸,所述修饰的核苷酸包含以下的任何一种或更多种:2-氨基-ATP、2-氨基-6-Cl-RTP、8-氮杂-ATP、6-Cl-RTP、2'-氟-dATP、2'-氟-dCTP、2'-氟-dGTP、2'-氟-dUTP、5-碘-CTP、5-碘-UTP、N6-甲基-ATP、5-甲基-CTP、2'-O-甲基-ATP、2'-O-甲基-CTP、2'-O-甲基-GTP、2'-O-甲基-UTP、伪-UTP、ITP、2'-O-甲基-ITP、嘌呤霉素-TP、黄苷-TP、5-甲基-UTP、4-硫代-UTP、2'-氨基-dCTP、2'-氨基-dUTP、2'-叠氮基-dCTP、2'-叠氮基-dUTP、O6-甲基-GTP、2-硫代-UTP、阿糖-CTP、阿糖-UTP、5,6-二氢-UTP、2-硫代-CTP、6-氮杂-CTP、6-氮杂-UTP、N1-甲基-GTP、2'-O-甲基-2-氨基-ATP、2’-O-甲基伪-UTP、N1-甲基-ATP、2'-O-甲基-5-甲基-UTP、7-脱氮-GTP、2'-叠氮基-dATP、2'-氨基-dATP、阿糖-ATP、8-叠氮基-ATP、5-溴-CTP、5-溴-UTP、2'-氟-dTTP、3'-O-甲基-ATP、3'-O-甲基-CTP、3'-O-甲基-GTP、3'-O-甲基-UTP、7-脱氮-ATP、5-AA-UTP、2'-叠氮基-dGTP、2'-氨基-dGTP、5-AA-CTP、8-氧代-GTP、2-氨基-RTP、伪异-CTP(Pseudoiso-CTP)、N4-甲基-CTP、N1-甲基伪-UTP、5,6-二氢-5-甲基-UTP、N6-甲基-氨基-ATP、5-羧基-CTP、5-甲酰基-CTP、5-羟甲基-UTP、5-羟甲基-CTP、噻吩并-GTP、5-羟基CTP、5-甲酰基-UTP,噻吩并-UTP、2-氨基-6-Cl-dRTP、2-氨基-dATP、2-氨基-dRTP、5-溴-dCTP、5-溴-dUTP、6-氯-dRTP、7-脱氮-dATP、7-脱氮-dGTP、dITP、5-丙炔基-dCTP、5-丙炔基-dUTP、2'-dUTP、5-氟-dUTP、5-碘-dCTP、5-碘-dUTP、N6-甲基-dATP、5-甲基-dCTP、O6-甲基-dGTP、N2-甲基-dGTP、5-硝基-1-吲哚基-dRTP、8-氧代-dATP、8-氧代-dGTP、2-硫代-dTTP、2'-dPTP、5-羟基-dCTP、4-硫代-dTTP、2-硫代-dCTP、6-氮杂-dUTP、6-硫代-dGTP、8-氯-dATP、5-AA-dCTP、5-AA-dUTP、N4-甲基-dCTP、2'-脱氧泽布拉林(deoxyzebularine)-TP、5-羟甲基-dUTP、5-羟甲基-dCTP、5-炔丙基氨基-dCTP、5-炔丙基氨基-dUTP、5-羧基-dCTP、5-甲酰基-dCTP、5-吲哚基-AA-dUTP、5-羧基-dUTP、5-甲酰基-dUTP、3'-dATP、3'-dGTP、3'-dCTP、5-甲基-3'-dUTP、3'-dUTP、ddATP、ddGTP、ddUTP、ddTTP、ddCTP、3'-叠氮基-ddATP、3'-叠氮基-ddGTP、3'-叠氮基-ddTTP、3'-氨基-ddATP、3'-氨基-ddCTP、3'-氨基-ddGTP、3'-氨基-ddTTP、3'-叠氮基-ddCTP、3'-叠氮基-ddUTP、5-溴-ddUTP、ddITP、生物素-16-dUTP,生物素-16-dCTP、生物素-16-CTP、N4-生物素-dCTP、生物素-16-UTP、Dabcyl-dUTPN/AN/AN/A、脱硫生物素-6-dCTP、脱硫生物素-16-UTP、ppGpp、pGp、5'-生物素-GMP、5'-生物素-AMP、5'-生物素-dGMP、5'-生物素-dAMP、5'-氨基-GMP、mCAP、CAP、ARCA、(1-硫代)-dATP、(1-硫代)-dCTP、(1-硫代)-dGTP、(1-硫代)-dTTP、(1-硫代)-ATP、(1-硫代)-CTP、(1-硫代)-GTP、(1-硫代)-UTP、(1-硫代)-ddATP、(1-硫代)-ddCTP、(1-硫代)-ddGTP、(1-硫代)-ddTTP、(1-硫代)-3'-叠氮基-ddTTP、(1-硫代)-ddUTP、(1-硼烷)-dATP、(1-硼烷)-dCTP、(1-硼烷)-dGTP、(1-硼烷)-dTTP、更昔洛韦-TP、西多福韦-DP。
产生参考标准品和衔接子的方法
在一种实施方案中,本公开提供了一种产生包含校准序列的多核苷酸序列的方法。多核苷酸序列可以是如本文描述的梯状物或衔接子。该方法可以包括首先如本文描述地选择校准序列。在一些实施方案中,每种校准序列以一个或更多个的拷贝数重复。在一些实施方案中,然后将每个校准拷贝序列排列成线性连续顺序以形成单个连续多核苷酸序列。由于这种排列,校准序列以在自然界中没有观察到的人工线性顺序排列。在一些实施方案中,每个校准序列间插有“间隔物”序列,并且多核苷酸序列的末端包含旁侧末端序列。在一些实施方案中,本文描述的间隔物和末端序列可以包含引物结合位点、限制性消化位点、启动子和转录起始位点以及其他序列元件。
在一些实施方案中,多核苷酸序列被物理合成为DNA或RNA分子。在一些实施方案中,多核苷酸序列两侧是允许从宿主载体序列中切除和纯化多核苷酸序列的两个限制性消化位点。在一些实施方案中,多核苷酸序列包含旁侧为能够通过限制性内切核酸酶切除和纯化校准序列的序列的校准序列。
在一些实施方案中,如本文描述,多核苷酸序列在5'方向前接启动子序列和/或后接poly-A尾部和/或限制性位点,以使多核苷酸序列或校准序列能够在体外转录。在一些实施方案中,如本文描述,校准序列在5'方向前接启动子序列和/或后接poly-A尾部和/或限制性位点,以使多核苷酸序列或校准序列能够在体外转录。在一些实施方案中,多核苷酸序列的正向和反向链都在体外转录以形成两个RNA片段。
在一种实施方案中,多核苷酸序列被合成为RNA或DNA分子。在一种实施方案中,多核苷酸序列被置于载体内。在一个方面,本文描述的多核苷酸或校准序列从载体中切除。在一种实施方案中,本文描述的多核苷酸或校准序列通过限制性消化从载体中切除。在一种实施方案中,本文描述的多核苷酸或校准序列通过聚合酶链式反应从载体中扩增。在一种实施方案中,本文描述的多核苷酸或校准序列通过聚合酶链式反应从载体中扩增。在一种实施方案中,多核苷酸序列通过体外转录从载体转录。在一种实施方案中,将两种或更多种多核苷酸序列组合在一起以配制混合物。
在一种实施方案中,本文描述的多核苷酸序列被片段化以产生片段化DNA分子的衍生物池。在一种实施方案中,本文描述的多核苷酸序列被机械地或酶促剪切以产生片段化DNA分子的衍生物池。在一种实施方案中,本文描述的多核苷酸序列被消化以产生较小DNA片段的衍生物池。在一种实施方案中,本文描述的多核苷酸序列被消化以产生与正常、肿瘤、胎儿和母体循环DNA分子相同长度的DNA片段。
连接衔接子序列
根据其中本公开的多核苷酸序列是衔接子序列的实例,衔接子序列可以连接到其他多核苷酸。本文公开的衔接子序列可以通过本领域已知的任何方式连接到测试样品中的多核苷酸。例如并且不限于,使用连接酶或转座酶来实现连接。合适的连接酶的一个实例是T4 DNA连接酶。
多核苷酸衔接子序列可以连接到靶多核苷酸序列的3'和/或5'末端以形成单个连续的多核苷酸序列。因此,本文公开的方法可以包括将衔接子序列连接到靶多核苷酸。在一个实例中,一种或更多种多核苷酸衔接子序列可以连接到天然存在的RNA或DNA片段。
在一个实例中,多核苷酸衔接子序列可以连接到DNA片段,其中DNA片段已经被末端修复和dA加尾。
在另一个实例中,在DNA合成、聚合酶链式反应扩增或逆转录期间,一种或更多种多核苷酸衔接子序列可以附接到靶多核苷酸,以产生单个连续的多核苷酸序列。例如,从多核苷酸衔接子序列的3'末端起始的DNA合成可以产生包含多核苷酸衔接子序列和靶DNA序列的单个连续的多核苷酸序列。
优选地,在制备用于测序过程的文库期间,多核苷酸衔接子序列连接到天然DNA片段。
在一个实例中,多核苷酸衔接子序列的3'末端连接到靶DNA片段序列的5'开始处。在另一个实例中,靶DNA片段的3'末端连接到多核苷酸衔接子序列的5'开始处。
使用多核苷酸序列的方法
本公开提供了包含两种或更多种的多核苷酸序列,校准序列允许在多种测序方法中比较它们的检测和/或定量。将两种校准序列包含在单个多核苷酸序列中允许忽略在制备单独多核苷酸序列期间可能以其他方式导致的技术差异。通过将两种校准序列组合成单个遗传序列,我们可以确保两种校准序列在用于校准方法时经历相同的制备条件和相同的工艺参数,从而允许在多核苷酸序列内更准确地比较两种校准序列。
本文公开的多核苷酸序列可以以预定的分数浓度直接添加到感兴趣的RNA或DNA样品中。因此,多核苷酸序列和感兴趣的RNA或DNA样品可以一起经历文库制备和测序。在一个实例中,将本文公开的多核苷酸添加到人类基因组DNA样品中,并且然后一起经历文库制备和测序。在另一个实例中,将本文公开的多核苷酸添加到从细胞系提取的DNA中,并且然后一起经历文库制备和测序。例如,可以将多核苷酸序列添加到RNA样品中,并且它们一起经历逆转录、文库制备和测序。
有利的是,本文公开的多核苷酸序列可以经历与应用于包含感兴趣多核苷酸序列的样品的方法分开的任何测序方法。在与应用于包含感兴趣的多核苷酸序列的样品相同的条件,但不存在感兴趣的样品的情况下,进行该方法降低了校准序列干扰在样品上进行的测序过程的结果的可能性。
本公开还提供了使用本文公开的多核苷酸衔接子序列来校准多核苷酸测序和/或定量方法的方法。校准序列可用于鉴定技术错误,包括以下任何一种或更多种:定量准确性、定量灵敏度、测序错误、文库制备期间的PCR扩增偏差、靶向富集步骤的使用、连接偏差、文库复杂性和样品输入、生物信息学伪影和测序错误。
本公开还提供了这样的方法,其中将一个文库中的校准序列与第二文库中的校准序列进行比较,并且其中该比较鉴定了文库深度、文库制备方法、测序技术的差异和/或由不同实验室地点或人员制备样品所导致的其他批次特异性影响。
本公开还提供了这样的方法,其中从两种或更多种文库内的校准序列的数量确定两种或更多种文库之间的序列数量的标准化内的校准序列的数量。
此外,本公开提供了这样的方法,其中可以使用由校准序列确定的缩放因子(scaling factor)来使靶RNA或DNA序列数量的确定标准化。
本公开提供了其中使用下一代测序方法对多核苷酸衔接子序列进行测序的方法。
本公开提供了这样的方法,其中文库数据文件中的测序读段中的校准序列的数量可以由多核苷酸衔接子序列组合物中的校准序列的数量确定。在一个实例中,来自高通量下一代测序过程的输出数据文件中的校准序列的数量由多核苷酸衔接子序列组合物中的校准序列的数量确定。本公开还提供了一种方法,其中多核苷酸序列组合物中的校准序列的数量确定了包含校准序列的输出文库数据文件中的测序读段的数量。
本公开提供了一种方法,其中将文库数据文件中的测序读段中的一种校准序列的确定的数量与组合物中的校准序列的参考数量进行比较,并且其中确定的数量和参考数量之间的差异指示序列确定和定量中的错误。本公开提供了一种方法,其中两种或更多种不同文库之间的校准序列计数的比较使得能够在文库之间进行标准化。本公开提供了一种方法,其中多核苷酸衔接子序列用作具有已知数量的参考序列,以校准靶RNA和DNA序列数量的测量。
本公开提供了一种方法,其中多核苷酸衔接子序列的组合物用作引物寡核苷酸以起始DNA合成。本公开提供了一种方法,其中在聚合酶链式反应期间多核苷酸衔接子序列的组合物用作引物寡核苷酸。本公开提供了一种方法,其中提供了包含一种多核苷酸衔接子序列的混合物,这种多核苷酸衔接子序列在混合物中以与第二多核苷酸衔接子序列不同的数量存在,并且其中多核苷酸衔接子序列的混合物在合成两种或更多种靶DNA序列期间使用,并且其中通过与相应校准序列的参考数量比较来校准两种或更多种DNA靶的合成。
在一种实施方案中,连接到天然DNA靶片段的包含校准序列的多核苷酸衔接子序列的数量由混合物中多核苷酸衔接子的已知数量确定。在一种实施方案中,包含多核苷酸序列的扩增的DNA片段的数量将由混合物中多核苷酸衔接子的已知数量确定。在一种实施方案中,与输出文库数据文件中的多核苷酸序列匹配的序列的数量由混合物中的多核苷酸的数量确定。
本公开提供了一种方法,其中如本文描述,多核苷酸衔接子序列与使用与互补寡核苷酸探针杂交的靶向富集方法一起使用。本公开提供了一种使用包含校准序列的多核苷酸衔接子序列来校准多核苷酸测序过程的方法,其中测序过程包括单末端测序、成对末端测序、纳米孔测序、边合成边测序、短读段测序技术、长读段测序技术。本公开提供了一种方法,其中本文描述的多核苷酸衔接子序列与测序方法一起使用,其中这样的方法包括全基因组测序、鸟枪法测序方法、宏基因组测序方法、单细胞测序方法、纳米孔测序方法和长读段测序方法。
本公开提供了一种方法,其中本文描述的多核苷酸衔接子序列用于检测指示疾病包括遗传性人类疾病、癌症诊断、病原体检测和耐药性的遗传序列。本公开提供了一种方法,其中多核苷酸衔接子序列用于癌症的临床诊断。在一种实施方案中,多核苷酸衔接子序列用于分析循环肿瘤DNA和非侵入性产前测试。
本公开提供了一种方法,其中多核苷酸衔接子序列具有测序应用,其中测序应用包括全基因组测序、靶向测序应用、RNA测序或宏基因组测序。本公开提供了一种方法,其中多核苷酸衔接子序列用于聚合酶链式反应扩增、DNA合成、DNA测序、RNA测序、逆转录和cDNA测序。本公开提供了一种方法,其中多核苷酸序列用于基于聚合酶链式反应的测序方法中,其中测序过程包括多重PCR扩增、实时PCR扩增、逆转录、扩增子基因小组(amplicon genepanels)、免疫库谱分析。
本公开提供了一种方法,其中多核苷酸衔接子序列在随后经历下一代测序过程并且然后生成测序读段的输出文库(例如.FASTQ文件)的文库的制备期间使用。本公开提供了一种方法,其中可以在读段序列中鉴定校准序列。本公开提供了一种方法,其中在去除测序读段文库中的衔接子序列期间可以鉴定和分析校准序列。本公开提供了一种方法,其中将输出文库文件中的校准序列的数量和序列与校准序列的参考数量和参考序列进行比较,其中所确定的校准序列的序列或数量与校准序列的参考序列或数量之间的差异指示在测序过程中序列和数量的确定中的错误。本公开提供了一种方法,其中所描述的校准序列与包括无PCR、基于转座酶、基于扩增子的文库制备方法和靶富集方法一起使用。本公开提供了一种方法,其中所描述的校准序列与包括纳米孔测序、边合成边测序或者短读段或长读段测序技术的测序方法一起使用。
本公开提供了一种方法,其中可以将确定的校准序列数量与校准序列的参考数量进行比较,以指示技术错误和变异的存在。本公开提供了一种方法,其中可以将确定的校准序列数量与校准序列的参考数量进行比较,以指示技术错误和变差的存在,其中这些错误包括测序错误、PCR扩增偏差、连接偏差和生物信息学伪影。本公开提供了一种方法,其中将一个文库中存在的校准序列与第二个文库中存在的校准序列进行比较,其中文库之间的差异指示错误。
当在衔接子序列中包含两种或更多种校准序列时,包含这两种校准序列允许忽略在制备单独的多核苷酸序列期间可能以其他方式导致的技术差异。通过将两种校准序列组合成单个遗传序列,我们可以确保两种校准序列在用于校准方法时经历相同的制备条件和相同的工艺参数,从而允许在多核苷酸序列内更准确地比较两种校准序列。
本文公开的衔接子序列可以以预定的分数浓度直接添加到感兴趣的多核苷酸样品中。因此,衔接子序列和感兴趣的RNA或DNA样品可以一起经历文库制备和测序。例如,可以将衔接子序列添加到RNA样品中,并使它们一起经历逆转录、文库制备和测序。本文公开的多核苷酸序列可用于校准测序过程。例如,本文公开的多核苷酸序列可用于校准下一代测序过程。多核苷酸序列可用于测量任何检测遗传变体的方法中的真阳性、真阴性、假阳性和假阴性率中的任何一种或更多种。因此,本文公开的多核苷酸序列可用作测序方法(诸如NGS方法)中的定量和定性对照。应当理解,在给定测序方法期间测量的校准序列的序列和/或拷贝数与那些校准序列的已知序列和/或拷贝数相比较之间的差异指示了测序方法中的潜在错误和/或偏差。因此,这样的差异可用于校准这些测序方法。
本文公开的多核苷酸序列可以与文库制备和测序方法一起使用。例如,多核苷酸序列可以与基于PCR的、基于转座子的、无PCR、PCR扩增和靶富集的文库制备方法一起使用。本文公开的多核苷酸序列也可与纳米孔测序、边合成边测序或者短读段或长读段测序技术一起使用。
在一个实例中,本文公开的多核苷酸序列与靶向富集DNA序列的方法一起使用。因此,本文公开的多核苷酸序列可以用聚合酶链式反应扩增。
本文公开的多核苷酸序列也可以与使用与互补寡核苷酸探针杂交的靶向富集方法一起使用。本文公开的多核苷酸序列还可以与全基因组测序、鸟枪法测序、宏基因组测序、纳米孔测序和/或长读段测序方法中的任何一种或更多种一起使用。
本文描述的多核苷酸序列可以与荧光寡核苷酸探针一起使用。因此,本文公开的方法可以包括添加一种或更多种荧光探针。在一个实例中,本文公开的多核苷酸序列与荧光原位杂交一起使用。在另一个实例中,本文公开的多核苷酸序列与荧光显微术一起使用。在另一个实例中,本文公开的多核苷酸序列可与使用寡核苷酸探针的靶DNA的荧光检测一起使用。
本文公开的多核苷酸序列可以与靶向测序应用一起使用。例如,本文公开的多核苷酸序列可以与PCR扩增一起使用。本文公开的多核苷酸序列也可以与靶向基因小组(targeted gene panels)一起使用。在一个实例中,在用于下一代测序的文库制备期间,寡核苷酸探针与本文公开的多核苷酸序列杂交,捕获和富集本文公开的多核苷酸序列。因此,校准序列的富集程度可用于校准富集样品中感兴趣的靶序列的方法。引物可以被设计为靶向DNA合成和扩增期间的本文公开的多核苷酸或校准序列。因此,可以使用与本文公开的多核苷酸序列或者一种或更多种校准序列互补的引物和寡核苷酸探针。因此,多核苷酸序列可以包含以富集为目标的校准序列。在一个实例中,多核苷酸序列包含一种或更多种作为富集靶的校准序列和一种或更多种不作为富集靶的校准序列。因此,多核苷酸序列可用于通过与第二校准序列的富集进行比较来校准第一校准序列的富集。可选地或另外地,多核苷酸序列可用于通过与第二校准序列的测序进行比较来校准第一校准序列的测序。在一个实例中,可以通过比较相对于多核苷酸序列内的校准序列的预计拷贝数的丰度来测量和校准一种或更多种校准序列的富集。
在本文公开的方法的一个实例中,多核苷酸序列可以在文库制备和测序之前添加到从血液样品中提取的循环DNA中。
在另一个实例中,本文公开的多核苷酸序列可以在文库制备和测序之前添加到从肿瘤活检中提取的DNA中。
本文公开的多核苷酸序列可以在整个测序工作流程中充当内部定量和定性对照。因此,本文公开的方法能够对测序方法进行评估、优化和校准。本文公开的多核苷酸序列还可以提供下一代测序测试中诊断能力的经验度量。例如,本文描述的多核苷酸序列可用于测量真阳性、真阴性、假阳性和/或假阴性率,以用于鉴定基因组DNA中的突变。本文公开的多核苷酸序列还可允许多于一种DNA或RNA样品的标准化。在一种梯状物中,本文公开的多核苷酸序列可以允许来自不同地点或时间的多于一种DNA或RNA样品的标准化。
多核苷酸序列分析
本公开的多核苷酸序列内的校准序列的丰度可以通过对输出文库内的衍生的测序读段的数量计数来确定。在一个实例中,校准序列的丰度可以通过对序列读段与参考基因组或染色体索引的对齐情况计数来测量。校准序列的丰度也可以用本领域已知的其他合适的方法,例如,通过使用微阵列或原位杂交来测量荧光来确定。在一个实例中,使用与寡核苷酸探针的杂交来测量校准序列的丰度。
本公开提供了一种使用本文公开的多核苷酸序列校准测序过程的方法。多核苷酸序列可以与样品同时经历文库制备和测序。在这样的方法中,多核苷酸序列可以与添加点下游的伴随样本一起积累技术变差。因此,本文公开的多核苷酸序列可用于测量文库制备、测序和生物信息分析期间技术错误的产生。因此,本文公开的多核苷酸序列可用于测量由文库制备期间的PCR扩增偏差、靶向富集步骤、连接偏差、文库复杂性、样品输入、生物信息学错误和/或测序错误导致的技术变差。在整个NGS工作流程中可能积累的技术变差的幅度可以与多核苷酸序列内校准序列的预计拷贝数和观察到的丰度之间的偏差成比例。
本公开还提供了使用本文公开的多核苷酸序列来校准另一单独样品中RNA或DNA序列的测序的方法。本文公开的多核苷酸序列可用于确定或估计与多核苷酸序列的测量相关的不确定性。例如,多核苷酸序列可用于从在测序过程期间测量的技术变差计算缩放因子。然后,可以在分析来源于伴随的RNA或DNA样品的多核苷酸序列期间使用该缩放因子。
多核苷酸序列可用于测量使用PCR扩增、寡核苷酸探针杂交、荧光或其他丰度定量测量的测量准确性。在一个实例中,对来源于多核苷酸序列内的校准序列的测序读段进行计数。然后将校准序列的测量的读段计数与预计的校准序列在多核苷酸序列中重复的拷贝数进行比较,其中测量的读段计数与预计的拷贝数之间的差异指示文库制备和/或测序过程中的错误,并且其中可以使用包括例如残差总和、相关性和斜率的统计量来测量该错误,从而可以测量在NGS工作流程中积累的技术变差的幅度。因此,多核苷酸序列可用于使两种或更多种下一代测序文库之间的技术差异标准化。
试剂盒
本公开还提供包含本文公开的一种或更多种多核苷酸序列的试剂盒。在一些实例中,试剂盒包含一种或更多种本公开的为梯状物的多核苷酸。在其他实例中,试剂盒包含一种或更多种本公开的为衔接子序列的多核苷酸。在其他实例中,试剂盒包含梯状物序列和衔接子序列两者。试剂盒还可以提供描述其中包含的特定多核苷酸序列的信息,诸如(但不限于)其序列、浓度、感兴趣的结构基因组特征等。
试剂盒可以包含本文描述的任何一种或更多种多核苷酸序列以任何组合的混合物。多核苷酸序列的混合物可以在单一缓冲液中一起提供,多核苷酸序列可以在一个或更多个容器中提供。可选地,多核苷酸序列的混合物可以以多于一个单独容器的形式提供,每个容器包含单一多核苷酸序列或单一浓度的多核苷酸序列。在一个实例中,单独的容器彼此相关联地作为试剂盒提供。
试剂盒还可以包含本文公开的计算机装置、计算机可编程介质和/或计算机软件。在一个实例中,试剂盒以允许实验使用物理参考标准品,并允许使用计算机装置和软件将实验来源的测序信息与本文描述的参考标准品联系起来的包装形式提供。
如本文描述的参考标准品可以基于使用天然存在的遗传序列来设计。例如,kmer可以选自天然存在的遗传序列。然后kmer可以以一个或更多个已知的拷贝数单元连接,以形成单个连续序列。然后可以将连续序列合成到载体中。然后,该载体可以在包括以下的制备过程中使用:细菌转化、扩增、提取、限制性消化、纯化和定量。载体还可以在包括以下的制备过程中使用:PCR扩增,其中可设计引物来扩增序列,并且可以然后对扩增产物进行纯化和定量。所得参考标准品可用作该参考标准品的库存(stock inventory)。
这些制备的参考标准品可与其他不同的制备的参考标准品组合以形成混合物。这些参考标准品可以以不同浓度组合,以模拟纯合、杂合和其他等位基因频率、拷贝数、染色体倍性以及微生物和病原体丰度。
参考标准品或参考标准品的混合物可以以分数浓度添加到从人类样品或其他感兴趣的样品中提取的RNA/DNA中,并且然后一起经历文库制备和测序。单独的参考标准品可以经历文库制备和测序。NGS测序可用于产生单个(.FASTQ)参考标准品或参考标准品和样品混合物的读段的文库。来源于梯状物参考标准品的读段可以通过读段序列中已知的kmer的存在来鉴定。因此,如果读段包含已知的kmer,则可被分类为来自标准品,或者如果读段不包含已知的kmer,则可被分类为来自样品。这种输出(.FASTQ)文库可以被分区为来自参考标准品或样品的两个较小的文库。可以分析输出文库中与梯状物参考标准品有关的数据。
计算机系统和计算机实现方法:
本公开还提供了计算机系统和计算机实现方法。图7说明了用于校准多核苷酸测序或定量方法的合适的计算机系统3800。计算机系统3800包括连接到程序存储器3804、数据存储器3806、通信端口3808和用户端口3810的处理器3802。程序存储器3804是非暂时性计算机可读介质,诸如硬盘驱动器、固态盘或CD-ROM。软件,即存储在程序存储器3804上的可执行程序使处理器3802执行本文公开的方法。
处理器3802然后可以将初始和/或校准结果存储在数据存储器3806上,诸如存储在RAM或处理器寄存器上。处理器3802还可以经由通信端口3808将初始和/或校准结果发送到服务器,诸如样品序列数据库或管理多核苷酸测序实验的计算机系统。
处理器3802可以从数据存储器3806以及从通信端口3808和/或用户端口3810接收数据,诸如指示多核苷酸序列或多核苷酸序列的数量,或样品的序列的数据,用户端口3810连接到显示器3812,显示器3812向用户3816示出测序和/或定量结果的视觉表示3814。在一个实例中,处理器3802经由通信端口3808诸如通过使用根据IEEE 802.11的Wi-Fi网络从测序设备接收序列数据。Wi-Fi网络可以是去中心化的自组织网络,因此不需要专用的管理基础设施,诸如路由器,或者Wi-Fi网络可以是具有管理网络的路由器或接入点的中心化的网络。
尽管通信端口3808和用户端口3810被示为不同的实体,但应理解,任何类型的数据端口可用于接收数据,诸如网络连接、存储器接口、处理器3802的芯片封装的引脚,或逻辑端口,诸如存储在程序存储器3804上并由处理器3802执行的IP套接字(socket)或功能参数。这些参数可以存储在数据存储器3806上,并且可以在源代码中按值或按引用处理,即作为指针。
处理器3802可以通过所有这些接口接收数据,其包括对易失性存储器(诸如高速缓存或RAM)或非易失性存储器(诸如光盘驱动器、硬盘驱动器、存储服务器或云存储)的存储器访问。计算机系统3800还可以在云计算环境,诸如托管动态数量的虚拟机的相互连接的服务器管理组中实现。
应当理解,可以在任何接收步骤之前,由处理器3802确定或计算稍后接收的数据。例如,处理器3802可以确定多核苷酸序列的序列数据,并且可以将序列数据存储在诸如RAM或处理器寄存器的数据存储器3806中。处理器3802然后可以诸如通过提供与存储器地址一起的读取信号来请求来自数据存储器3806的数据。数据存储器3806可以在物理位线上提供数据作为电压信号,并且处理器3802可以经由存储器接口接收序列数据。
应当理解,在整个本公开中,除非另有说明,否则数据可由数据结构表示,诸如[“G”、“A”、“T”、“C”]串或编码核苷酸的二进制元组列表。数据结构可以物理地存储在数据存储器3806上或由处理器3802处理。
应当理解,本公开的技术可以使用多种技术来实现。例如,本文描述的方法可以通过驻留在合适的计算机可读介质上的一系列计算机可执行指令来实现。合适的计算机可读介质可以包括易失性(例如RAM)和/或非易失性(例如ROM、磁盘)存储器、载波和传输介质。示例性载波可以采取沿本地网络或诸如互联网的公共可访问网络传送数字数据流的电、电磁或光信号的形式。
还应该理解的是,除非另外具体指出,如从下面的讨论中明确的,否则应理解,在整个描述中,使用诸如“处理”或“计算(computing)”或“计算(calculating)”、或“确定”或“显示”或“校准”或“标准化”等术语的讨论可以指计算机系统或类似的电子计算设备的动作和过程,该电子计算设备处理并将表示为计算机系统寄存器和存储器内的表示为物理(电子)量的数据转换为类似地表示为计算机系统存储器或寄存器或其他这样的信息存储、传输或显示设备内的物理量的其他数据。
现在在以下非限制性实施例中进一步描述本公开。
实施例1:使用多核苷酸序列校准癌症基因的测量。
本实施例示出了包含来自人类基因组的两种或更多种校准序列的多核苷酸序列的设计和合成。从ERBB2(HER2)基因的不同外显子序列中选出3种~750nt的校准序列(图1;参见SEQ ID NO:11-13)。然后重复校准序列;其中序列A以一个拷贝存在,序列B以两个拷贝存在,序列C以三个拷贝存在,从而模拟癌症基因的缺失、正常(二倍体基因型)和扩增。然后将六个拷贝(代表3种校准序列)排列成如下C-B-C-A-B-C的线性顺序。然后在每个校准序列之间包括间插的随机产生的~600nt间隔物序列,并将另外的旁侧序列添加到3'和5'末端,以形成最终的多核苷酸序列。还构建了选自经常发现在癌症中扩增或缺失的EGFR、MET、BRAF和FGFR1基因的最终多核苷酸序列,参见SEQ ID NO:2-4和14-25。
然后由商业供应商(ThermoFisher)合成多核苷酸序列并将其置于宿主pMA质粒内。在质粒内,多核苷酸序列两侧是Sap1限制性酶位点。质粒在大肠杆菌(E.coli)中转化,在培养基中扩增并被纯化(使用质粒Midi-Prep,
Figure BDA0003865051000000721
使用Sanger测序验证多核苷酸序列是正确的。通过用Sap1酶(NEB,根据制造商的方案)进行内切核酸酶消化,从pMA质粒中切除多核苷酸序列。使用琼脂糖凝胶电泳从剩余的质粒中分离和纯化切除的多核苷酸序列。纯化的多核苷酸序列DNA在Qubit2.0荧光仪(Life Technologies)上使用BR dsDNAQubit测定进行定量,并在Agilent 2100生物分析仪上用Agilent高灵敏度DNA试剂盒(Agilent Technologies)进行验证。然后将五种单独的多核苷酸序列以相等的浓度组合(使用
Figure BDA0003865051000000722
Epmotion)以配制混合物。
根据制造商的方案,用KAPA文库制备试剂盒(Illumina平台KR0935-v2.14)连同SeqCap衔接子试剂盒(Roche-NimbleGen)制备文库。然后使用靶向~183个癌症基因的定制的基因小组(SeqCap,Roche-NimbleGen)进行靶向富集测序。富集的文库在Agilent 2100生物分析仪上进行定量,然后如上在HiSeq 2500上进行成对末端测序。根据制造商的说明进行测序(
Figure BDA0003865051000000731
HiSeq 2500)以生成输出文库文件(.FASTQ文件)。
为了分析多核苷酸序列(如上文指示,其被制备为梯状物),使用BWA(Li,2013)将输出文库(.FASTQ)与人类基因组参考组装(hg38;GRCh38.p12,2013年12月组装)比对。进一步分析中省略了包含间隔物和旁侧序列的比对。校准多核苷酸的比对覆盖率,使得校准序列B(以两个拷贝存在)具有~30x倍的覆盖率。将跨靶向的基因外显子的观察比对覆盖率相对于多核苷酸序列内校准序列的已知拷贝数绘图。得到的散点图指示了使用靶富集的NGS方案检测基因缺失和扩增的定量准确性。为了评价测量拷贝数变异的定量准确性,通过残差之和测量观察比对覆盖率相对于预计比对覆盖率的偏差,并且测量相关性和斜率与1值的偏差。
实施例2:使用多核苷酸序列校准基因小组(gene panel)。
本实施例示出了包含两种或更多种校准序列的多核苷酸序列的设计和合成,该校准序列选自与癌症有因果关系的~97个基因的外显子序列。选择了5种与TP53基因外显子重叠的校准序列(A-E)(图2;参见SEQ ID NO:26-30)。校准序列(600nt、640nt、1549nt、871nt、1103nt)与~600nt(SEQ ID NO:42)的间插的间隔物序列排列在一起,同时将另外的旁侧序列添加到3'和5'末端,以形成~7.6kb的最终多核苷酸序列(参见SEQ ID NO:6)。
然后如以上描述的合成和制备多核苷酸序列(参见实施例1)。简单地说,多核苷酸被合成用于文库制备、靶富集和测序。然后使用BWA(Li,2013)将输出文库(.FASTQ)与人类基因组参考组装(hg38,GRCh38.p12,2013年12月组装)比对。
将所有校准序列的比对覆盖率校准到中值比对倍数覆盖率等于~30倍覆盖率。在TP53基因内评价校准序列1-5的比对覆盖率的差异,以测量NGS测试的技术性能的差异。
实施例3:使用多核苷酸序列校准微生物群落的测序。
本实施例示出了包含选自原核基因组的校准序列的多核苷酸序列的设计和合成。来自16S rRNA基因的~1,500nt的校准序列选自三个微生物基因组(大肠杆菌K-12、流感嗜血杆菌Rd KW20、铜绿假单胞菌PAO1;图3;参见SEQ ID NO:31-33)。然后每种校准序列以一倍、二倍和四倍的拷贝数重复。然后将拷贝与间插的间隔物序列和旁侧末端序列一起排列,以形成最终的多核苷酸序列(参见SEQ ID NO:7)。
如以上描述的(参见实施例1)制备多核苷酸序列,但以下例外。使用Nextera XT样品制备试剂盒
Figure BDA0003865051000000741
根据制造商的说明制备多核苷酸序列DNA片段。制备的文库在Qubit荧光仪(Life Technologies)上进行定量,并在Agilent 2100生物分析仪上用Agilent高灵敏度DNA试剂盒(Agilent Technologies)进行验证。测序(
Figure BDA0003865051000000742
HiSeq2500)根据制造商的说明进行以生成用于分析的输出文库文件(.FASTQ文件)。
为了分析梯状物,使用BWA(Li,2013)将输出文库(.FASTQ)与四个微生物基因组的参考基因组组装比对。进一步分析中省略了包含间隔物和旁侧序列的比对。将跨微生物序列的观察比对覆盖率相对于多核苷酸序列内每种校准序列的已知拷贝数绘图,以评价NGS文库的性能。
实施例4:使用多核苷酸序列校准人类基因组中遗传变体的检测。
本实施例示出了包含各自代表单个染色体区域的不同遗传变体的校准序列的多核苷酸序列的设计和使用。选择了来自BRAF基因序列的1,100nt校准序列(图4)。校准序列以两个拷贝重复;一个拷贝具有参考T核苷酸,而一个拷贝具有突变A,其导致与恶性黑色素瘤相关的val600到glu(V600E)的氨基酸取代(参见SEQ ID NO:34-35)。将两个校准序列拷贝连同间插的间隔物序列连接在一起,以形成7.6kb长的单个多核苷酸序列(参见SEQ IDNO:8)。
发明人接下来选择了选自BRCA2基因序列的2,200nt校准序列(图5)。该校准序列以两个拷贝重复;一个拷贝具有参考A核苷酸,而一个拷贝具有小的单核苷酸缺失(参见SEQID NO:36-37)。将两个校准序列拷贝连同间插的间隔物序列连接在一起,以形成6.2kb长的单个多核苷酸序列(参见SEQ ID NO:9)。
如以上描述的合成和制备多核苷酸序列(参见实施例1)。简单地说,多核苷酸被合成用于文库制备、靶富集和测序。然后使用BWA (Li,2013)将输出文库(.FASTQ)与人类基因组参考组装(hg38;GRCh38.p12,2013年12月组装)比对。为了分析梯状物,使用BWA(Li,2013)将输出文库(.FASTQ)与人类参考基因组组装(hg38)比对。将比对校准到30x覆盖率,并且进一步分析中省略了间隔物序列和旁侧序列。
VarScan2(Koboldt等人,2012)用于鉴定BRAF和BCRA2基因的突变。将观察到的突变等位基因频率与预计的重复拷贝数比率进行比较,以评价NGS文库的准确性。BRAF V600E突变的频率预计为25%(反映体细胞突变),并且BRCA2预计为50%(反映杂合突变)。
实施例5:使用多核苷酸序列校准循环DNA中遗传变体的检测
本实施例示出了用于循环肿瘤DNA检测方法的多核苷酸序列的设计和使用。如以上描述的(参见实施例4),将包含BRAF V600E和BCRA2缺失的多核苷酸序列片段化为类似于循环DNA测序期间通常观察到的较小DNA片段。多核苷酸序列的片段化使用酶促DNA片段化试剂盒根据制造商的说明(New England Biolabs NEBNext Ultra II FS)进行。使用Agilent4300TapStation系统测量了片段化的多核苷酸序列的尺寸,显示多核苷酸序列被片段化为165nt的中值尺寸(图6),这与循环DNA中通常观察到的长度相似(Lapin等人,2018)。
如以上描述的合成和制备多核苷酸序列(参见实施例4)。简单地说,多核苷酸被合成用于文库制备、靶富集和测序。然后使用BWA(Li,2013)将输出文库(.FASTQ)与人类基因组参考组装(hg38,GRCh38.p12,2013年12月组装)比对并使用VarScan2(Koboldt等人,2012)鉴定突变。
实施例6:使用多核苷酸序列校准RNA测序。
本实施例示出了测量基因表达的RNA多核苷酸序列的设计和合成。选择了包括来自3个不同基因(BCR、ABL和ALK)的外显子的长度为200nt的校准序列,这些基因的表达与癌症相关(参见SEQ ID NO:38-40)。校准序列以1、2和3拷贝代表,并与间隔物和旁侧序列一起组装到单个多核苷酸序列中(参见SEQ ID NO:10)。
然后合成多核苷酸序列并将其置于宿主pMA质粒内,如以上实施例1中描述的。在质粒内,多核苷酸序列在5'前接SP6启动子(以实现多核苷酸序列的体外转录),并且在3’后接60nt的聚腺嘌呤段,然后是一个Not1限制性酶位点。通过Not1消化将质粒线性化,并且然后按照制造商的说明转录成RNA(使用MEGAscript SP6转录试剂盒,Thermo Fisher
Figure BDA0003865051000000761
)。然后将得到的包含多核苷酸序列的RNA转录物以相等的浓度组合(使用
Figure BDA0003865051000000762
Epmotion)以配制混合物。
然后使其经历文库制备(使用
Figure BDA0003865051000000763
KAPA RNA HyperPrep试剂盒)。文库在Agilent 2100生物分析仪上进行定量,然后在HiSeq 2500上进行成对末端测序,如以上描述的。测序(
Figure BDA0003865051000000764
HiSeq 2500)根据制造商的说明进行以生成输出文库文件(.FASTQ文件)。
然后使用BWA (Li,2013)将输出文库(.FASTQ)与人类基因组参考组装(hg38)比对。然后使用Kallisto(Bray等人,2016)分析文库,为多核苷酸序列内的每个校准序列分配每百万的转录物(transcript per million)(TPM)值。然后相对于多核苷酸序列内校准序列的预计拷贝数绘制测量的TPM值。多核苷酸序列分析指示在RNA测序实验期间测量基因表达的定量准确性。
实施例7:Illumina测序
本实施例示出了用于下一代测序的多核苷酸衔接子序列的设计(参见图11)。选择4种不同的校准序列(Y1-4),其中每种校准序列包含一个人工12nt序列。这些序列是随机产生的序列,不包含低复杂度或重复序列。然后对校准序列进行测试,以确保它们与衔接子内的其他序列(包括P5序列、P7序列或互补序列)具有最小的互补性(少于5个连续的核苷酸)。校准序列也在校准内的相应位点编码不同的核苷酸。这是为了通过在索引读取的每个循环中具有不同的核苷酸来确保最佳的簇区分。一对Y-衔接子序列(称为Y1A和Y1B)的设计的实例如下:
对于第一衔接子序列,设计了具有5'末端胸腺嘧啶的校准序列(示出了单个实例):
CACGGTGTTCTT(SEQ ID NO:48)
然后将其与P5引物结合序列:
AATGATACGGCGACCACCGA(SEQ ID NO:47)
和与(Y-衔接子)伴侣互补的序列:
-GA-TCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:49)组装,
以形成衔接子序列(Y1A):
CACGGTGTTCTT-AATGATACGGCGACCACC-GA-GATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:46)
对于第二衔接子序列,我们设计了校准序列(示出了单个实例):
AGAACACCGTG(SEQ ID NO:64)
然后将其与和(Y-衔接子)伴侣互补的序列及索引序列:
GATCGGAAGAGCACACGTCTGAACTCCAGTCAC-ATCACG-(SEQ ID NO:65)
以及P7引物结合位点:
ATCTCGTATGCCGTCTTCTGCTTG(SEQ ID NO:63)组装。
然后将以上序列组装以形成衔接子序列(Y1B):
AGAACACCGTG-AGATCGGAAGAGCA-CACGTCTGAACTCCAGTCAC-ATCACG-ATCTCGTATGCCGTCTTCTGCTTG(SEQ ID NO:62)。
使用这种方法,设计了8种序列,形成4对Y-衔接子(Y1-Y4;参见SEQ ID NO:46-61)。
然后合成以上多核苷酸序列(由商业供应商;GeneArt)。每对衔接子与相应的衔接子配对,并通过在20分钟内从68℃冷却而杂交。这使得每对定制衔接子序列之间能够退火以形成Y形衔接子(参见图11)。然后将多核苷酸Y-衔接子以下列相对量(校准序列Y1=10%;Y2=20%;Y3=30%和Y4=40%)组合,以配制衔接子序列的混合物(EppendorfEpmotion)。
然后,在使用Illumina TruSeq文库制备试剂盒从测试样品制备文库期间使用该衔接子序列混合物(根据制造商的说明,除了使用合成的定制衔接子)。测试样品包含合成的模拟微生物群落(模拟群落A)。这包括反映一系列微生物基因组的基因组序列的合成DNA序列(称为sequin)的混合物(Hardwick等人,2019)。制备的文库使用Agilent 2100生物分析仪进行验证,然后根据制造商的说明进行测序(
Figure BDA0003865051000000781
NextSeq)。
然后使用CutAdapt(Martin等人,2011;cutadapt 1.8.1和Python 2.7.6)(具有以下修改:提供我们自己的包含校准序列的定制的衔接子序列(-g选项)),在输出文库(.FASTQ)中测序读段的5'起始处鉴定校准序列。第一对读段的实例包含(校准序列CACGGTGTTCTT(SEQ ID NO:48)加下划线):
@M00813:119:000000000-G4NKV:1:1101:16007:1887 1:N:0:CAGATCCACGGTGTTCTTGCGCCAGCACGATGGCCAGGCCGAGCCCGACCTCGGCCGCCGCGATGACGATGACGAACAACGTGAGCACCTGCCCGCTGTGCAGCCGGTCGCGCAGCCAGACGTCGAACGCGACCAGGTTGAGGTTGACCGCGTTG(SEQ ID NO:219)
+
A1>11>1>A@DF1111A0AA0B00FAAAFB00FFAE/EEF/EEGGHFGGGGGGGGGGGCHHCAFFHHGEGGGHHGHHHGHHHHHHHHHGGGGGHHHFHHG/CGGGGGGCCHGFFGGGGCCEHGGGGGGGGEGFGGGGFFFFFF@@?@@@
在文库中对校准序列进行了鉴定和计数:Y1(10%)135,312个读段、Y2(20%)302,356个读段、Y3(30%)581,931个读段和Y4(40%)1,324,455个读段。然后,将校准序列的观察分数相对于校准序列的预计分数绘图(参见图11)。该图指示了NGS文库的定量准确性、线性度和灵敏度,并能够估计斜率(3.847e+006±943048)和相关性(R2-0.8927)。在文库中校准序列的观察分数丰度和预计分数丰度(fractional abundance)之间的差异或残差指示了测序期间的技术变差。
实施例8:将衔接子序列用于Oxford纳米孔测序
本实施例示出了用于使用Oxford纳米孔MinIONTM仪器进行长读段测序的多核苷酸衔接子序列的设计(参见图10)。选择了4种长度为24个核苷酸的校准序列。这些序列是随机产生的,并被策划以确保它们与天然序列不具有实质上的同源性,或与其他衔接子或引物序列不具有互补性。将校准序列组装到衔接子序列中的实例如下(校准序列加下划线):
对于第一衔接子序列,设计了校准序列(示出了单个实例):
TCCATGTAACACCATGAACACATC*T(SEQ ID NO:79)
然后它和与(Y-衔接子,例如Y5B)伴侣互补的序列:
TGACAGACAAGGGTAA(SEQ ID NO:80)组装
然后将以上序列组装以形成第一衔接子序列(Y5A,校准序列加下划线):
TGACAGACAAGGGTAA-TCCATGTAACACCATGAACACATC*T(SEQ ID NO:78)
对于第二衔接子序列,我们设计了校准序列(示出了单个实例):
GATGTGTTCATGGTGTTACATGGA(SEQ ID NO:91)
然后它和与(Y-衔接子,即Y5A)伴侣互补的引物序列:
TTACCCTTGTCTGTCA(SEQ ID NO:92)组装
然后将以上序列组装以形成衔接子序列:
GATGTGTTCATGGTGTTACATGGA-TTACCCTTGTCTGTCA(SEQ ID NO:90)
使用这种方法,设计了4对衔接子序列(Y5-Y8;参见SEQ ID NO:78、81、84和87)。
如以上描述的制备多核苷酸衔接子序列(参见实施例7)。然后将多核苷酸Y-衔接子以下列相对量(校准序列Y5=10%;Y6=20%;Y7=30%和Y8=40%)合并,以配制衔接子序列的混合物(Eppendorf Epmotion)。
然后,根据制造商的说明(除了使用合成的定制衔接子),在使用Oxford纳米孔LSK108试剂盒(1D连接)从测试样品中制备文库期间使用该衔接子序列混合物。测试样品包含合成的模拟微生物群落(模拟群落A)。这包括反映一系列微生物基因组的基因组序列的合成DNA序列(称为sequin)的混合物(Hardwick等人,2019)。文库在MinIONTM仪器(OxfordNanopore Technologies)上进行测序。碱基判定使用ONT Albacore Sequencing PipelineSoftware(版本1.2.6)实现。
确定了ONT读段中校准序列的存在。此处是一个原始读段序列的实例(Y8A校准序列GAAACCCATCAATCGCTTAACATC(SEQ ID NO:88)加下划线(为简洁起见,质量分数已被移除)):
@3d4f1939-915f-4eaa-8e2f-b8d390eac3d5
runid=29bac5664b009eaf1f91a4857ce89c11f0afdca0 read=61 ch=49start_time=2019-11-12T05:37:03Z flow_cell_id=ABF060protocol_group_id=FXFN061896sample_id=FXFN061896
CATGACAGACAAGGGTAAGAAACCCATCAATCGCTTAACATCACAGAGCCCAGTTCTGTTGTCTATGACTTGGCGAAGAAGAACAAGTCTGAACTGATATACTCTCGTGATTCCACTTTTAAGTAGTACCATAAATAGAATTATACGGAAGTAGTAGGTTCAGTGTGCATTTAAATCTAACTTAGTGGGAGTATTTCAAAACTTACCGTAACTATTAGCTCTTTAGAGTTAGAGCGGTGAATTGGCTTTGCGATTATATTTACGAGGACTTCTGCGGTTACCTAGAACTTAACTACGTCGTGGTACGTGCAAAAGTCATTTCTTTCAACGTGTGGTAAAAAAGTTACAAGCCACTAGACTAAAGACACGTACAAGTTGTGAGAAGTCAACTCATAAATTTATTAGGTTATAAGGACGTTGAATAGTTATTTGGTTATTCAATGGTAGTACTACCTACCAACAATAGTACACCAGTTCAGGCTTGTTCTTCGCCAAGTCATAGACAACAGAACTGGTGTGCTCATTGGGAATGATATACTCACTATAAGCAACTCAAGCTCTTCCTGGCGATCCTGGAGTCATCATTGACTTCACTTAACGAGTCTGGTGTTGCAGCAAGTAAATAAATATCATAAAATAATACTGCTCAGAAGCAATAGACACGACAGTTGGGCCAAATGCAATAATTCTTTCGTATATTATTCATATTTTCACGTGAGAAACTACCCTCTTTGCGATTATTCTGTTGAGCTTTCAGATCTTCAACGTTGATGTCAGCTAACT(SEQ ID NO:220)
+
将文库中校准序列的预计分数相对于在文库中鉴定的观察到的校准序列绘图(参见图12)。该图指示了NGS文库的定量准确性、线性度和灵敏度,并能够估计斜率和相关性。校准序列的观察到的读段的数量和预计的分数丰度之间的差异指示了测序期间的技术变差。
然后对文库中的校准序列进行鉴定和计数:Y5(10%)539个读段、Y6(20%)758个读段、Y7(30%)2,119个读段和Y8(40%)3,201个读段。然后,将校准序列的观察分数相对于校准序列的预计分数绘图(参见图12)。该图指示了NGS文库的定量准确性、线性度和灵敏度,并能够估计斜率(9347±1695)和相关性(R2=0.9383)。在文库中校准序列的观察分数丰度和预计分数丰度之间的差异或残差指示了测序期间的技术变差。
实施例9:使用包含含有包含天然遗传序列的校准序列的衔接子序列。
本实施例示出了包含代表具有临床重要性的天然遗传序列的校准序列的多核苷酸衔接子序列的设计(参见,例如,图13)。校准序列选自人类基因组(GRCh38.p13)中的chr7:140753300–140753372(+)坐标。该序列与BRAF基因的编码外显子中出现的反复出现的突变(称为V600E)重叠。该突变的存在为癌症患者的治疗提供了信息。
然后将该校准序列(Y9)组装在如下的衔接子序列中(校准序列加下划线):
CAAGTGCATAAGGAGATGTTCAAACTGATGGGACCCACTCCATCGAGATTTCTCTGTAGCTAGACCAAAATCACCTATTTTTACTGTGA*T(SEQ ID NO:102)
此外,还合成了Y-衔接子伴侣序列:
TCACAGTAAAAATAGGTGATTTTGGTCTAGCTACAGAGAAATCTCGATGGAGTGGGTCCCATCAGTTTGAACATCTCCTTATGCACTTG(SEQ ID NO:105)。
制备这些衔接子序列(SEQ ID NO:57和SEQ ID NO:60)并在如以上描述的用于Oxford纳米孔测序的DNA样品的文库制备期间使用(参见实施例8)。如以上描述的确定了ONT读段中校准序列的存在(参见实施例8)。下面提供了一个原始读段序列的实例(Y9校准序列加下划线(为简洁起见,质量分数已被移除)):
@e5f0f05f-d7da-46e8-92b4-1c2163cced5drunid=29bac5664b009eaf1f91a4857ce89c11f0afdca0 read=1731 ch=90start_time=2019-11-12T06:01:42Z flow_cell_id=ABF060protocol_group_id=FXFN061896sample_id=FXFN061896
AAGTGCATGAGAGATGTTCAAACTGATGGGACCCACTCCATCGAGATTTCTCTGTAGCTAGACCAAAATCACCTATTTTTACTGTGATTTTGTTAACCAGGCTAATATAAAAGTGATGGATCGAAAGTACGCTCGTTCATTATTAGATCTTATCTTATTGAAATTTATTATATCGTTTTATTAAAAACTATATAATATTGCTATACGTTTTTACAAATATCTGTAAATTAAACAAAGTATAATATAAAAAATAGTATAAGAAATTAATGTCGTTAATATCGATGTATTTTATTACTCTTGACTTATACTAAGTAATCTTTTAAAAAGATCAATTATCTACTAAAAACGTTCATAAGACTTCTTCATTATTTTTATATACTATGGTTTGGGAGTATCTTTTTCGTTAAGTAGTATATTTTAGCATCGATGTTCCGTCCGCGTTTTGCGAAAGGAAGGTTTCTTGGCGTGCTCGCTTAAATGAGTCGTATGACGAGTCTGTTAAATGATATATTTATGCAGGTAAGCTACAATAAAAGATCAGAAAAATAGATTCATTTAACAGACTCGTCATACGACTCATTTAGCGAGCACGCCAAATTTCCTTTCACAAAAACACAGGCAGATATCGACCATCCCCCAAACCATAATTATAGTATAATTTTAATCAGATAATTGATCTTTTAAAGATTACTTCTTAGTACTCAAGTCAAGGTAACAAAAAATCAACCTATTACCTGCGCATGTTATGCTGTTTAATTCATAGATGACTAACAAAACATATAACTGTATTATATAGTTTTTAGCAAAACGATATAACCAACTTCAATAAAAGACAAGATCTAATAATGAACGGGCGTGCTCGTCACTTTATATTAAAAATTGGTTAACAAATCACGGGCTGATCTCAGCTACAGAAAATCTCGTATAGTCCCTCCTTTGAACATCATACGCAGTATACACATGGC(SEQ ID NO:221)
+
还鉴定了其中衔接子序列(包含校准序列Y9)存在于测试样品DNA序列3'的读段序列:
@b073934f-4d47-44fd-a6e7-98cbdbf6ab1brunid=29bac5664b009eaf1f91a4857ce89c11f0afdca0 read=2199 ch=66start_time=2019-11-12T06:07:49Z flow_cell_id=ABF060protocol_group_id=FXFN061896sample_id=FXFN061896
AAGTGCATAAGGAGATGGGACCCTCCCATCGAGATTTCTCTGTAGCTAACCAAAATCACCTAGGCCAGTTAATTAAGAATTTACCGCTCTTCAGCAAAATCAAGAACGAGCTAGAAATCAGCCGCCAGGGCTTTCTGAAAGCGTAGACTCAACCCGCTATGGTGGTCAGCGCATGCTATACCGTATAGCTCTCTGACGGTGGTTATCGATCTCCGGGCGACAGTCACCACTGCCCACCCTATATTTTCCTCTTATTACCGGTCCCATCACTCGTAAAGGTCACCCAGCACAGAGTTGACCTCAGGTTTCCTCATACCACCTCCAGCGGAAGGACGTATCCACAGGCCGAGGTACACAAGTGCATAAGGAGATGTTCAAACTGATGGGACCCACTCCATCGAGATTTCTCTGTAGCTAGACCAAAATCACCTATTTTTACTGTGAGAAGCAATACGTA(SEQ ID NO:222)
+
鉴于校准序列的序列是已知的,读段中校准序列的错误率指示了文库的测序准确性。5,863个读段正确鉴定了BRAF V600E核苷酸(WT=A),而50个读段不正确,包含0.0085%的错误率。这包括核苷酸A错配(3个读段),C错配(4个读段)和43个单核苷酸缺失,并提供了文库的测序准确性的指示。这说明了代表具有临床重要性的天然序列的校准序列可以如何用于评价文库的测序准确性和校准测序过程。
实施例10:使用包含编码遗传变异的校准序列的衔接子序列。
本实施例示出了包含代表遗传变体的校准序列的多核苷酸衔接子序列的设计和使用(参见,例如,图14)。产生了除单个变体核苷酸差异外相同的两种人工21个核苷酸的序列(Y10序列编码G,而突变Y11序列编码C)。衔接子序列如下(其中校准序列加下划线,变体核苷酸加粗):
Y10A:
TAAGGAAGATAGACGCACTCCCACCATTGATGTCCAAAAG*T(SEQ ID NO:108)
Y11A:
TAAGGAAGATAGACGCACTCCCACCATTCATGTCCAAAAG*T(SEQ ID NO:111)
这些校准序列被组装到如以上描述的衔接子序列(参见以上,SEQ ID NO:108和SEQ ID NO:111)中。制备这些衔接子序列并在如以上描述的用于Oxford纳米孔测序的DNA样品的文库制备期间使用(参见实施例8)。如以上描述的确定读段序列中校准序列的存在(参见实施例8)。此处是一个原始读段序列的实例(Y11校准序列(编码C变体)加下划线(为简洁起见,质量分数已被移除):
@55bae27d-da02-402d-90f4-276dd5abc2b6
runid=29bac5664b009eaf1f91a4857ce89c11f0afdca0 read=89 ch=70start_time=2019-11-12T05:37:33Z flow_cell_id=ABF060protocol_group_id=FXFN061896sample_id=FXFN061896
GTTTGATTAGACCGTATTGCTAGGAAGATAGACGCACTCCCACCATTCATGTCCAAAAGTAGGCCAGTTAATTAAGAGGTACCGCTCTTCAGCAAAATCAAGAACGAGCTAGAAATCAGCCGCGAGGGCTTTCTAGGCGTAGACTTTCAACCCGCTATGTGGTAGGTCAGCACGCCCTATACCGTATAGCTCTGACGGTGGTTATCGATCTCCGGACGCGAGTCCAGTCATACATCACTCGTAAGGTCACCCAGCACAGGGAGTTGACCCTCCGGGTTTTCACATGCCTCAGCGGAAGGCATTATCCTGAGCCAGTGCCACGCTACTAGACCTGCCGGTGAAAACCTAAGACTACAGTAACGCCAAGACCCTCTCCCACAGGCTAGTTTGCCAGACCTCAAAAGTACGGCCCCCAGCAGTAAACTGCCGGACCACAAGGTGCTGGGTGTAGCGCTCTTGAAGATGGAGCCCTTCCGGCTTCTTCCACCACTTCGCTTTGAACGACGTACTACTCCAAAGCACTATGACGCGGTCAGAATTCCCTTTGAGTCCGACCAGACCTGATGGGAGGAAAAAATTGGGATATAAGCTCGAATCACCAAGTCTTGTGGGCTGATACAGGGAGCCACAGGTCACCACCGCCGCCTCTAAACCCGGTAAACCCACTATATTCCATTCCAAGTTGACTTGGGCTCAACGCGCAAATTACGGCCCAACATGCGCCGTATTAGAAGAAAGCACCAGCCAGCTGCACCAAGTACCAAAGTAAGCGTCTCGGAACAGCGTCACCATCCTCGGGTAGAACTATGAGGCAAGTGCCATTAGCGACCAGTACTTCCAACCTTTCAGAGTCGAAGGGCCAATCGTTGCCTCATAAAGCGGACACCGCTTTTAAGACACCCGGCACTTCCATGGAAGGTGCTTCGCTAGGTTTACCAGTCATACCCTGCGAACTACTGTGATAGCCGCGCTCCGACCAATGATACCGATCCTCGGGAGGGACCGAAACGATGCGAGTTTGGTACGTGAACGTAATGTCTTCCTGTTGCGAGAATACAACGCAACGAAGGTCCTAACATACACAGCCTAGAGGCTGCAATGCAAAGCGAGGTTACGTTGCCACGACGGCAATAAGTGTAACGGCTTTCAGGGCACAACTGGGGCGTGAGCCGCGCTCTAGCCGACACACGCAGCGTCAGCCAGCCTATGCTAAATTTACCCCTCGCTGAAGAGCAGCTCATGGCGCGCCTAGGCCTAGCAATACGTAA(SEQ ID NO:223)
+
测量输出文库中包含两个参考序列和变体序列中的任何一个的读段计数。鉴定出6,895个具有G变体的读段,而8403个读段具有C变体。这对应于45%的等位基因频率,并且与预计的杂合基因型频率(即50%)的差异指示技术变差的程度。该变体还提供了一个可用于评价和优化遗传变体检测的遗传变体的基本事实(ground-truth)实例。
实施例11:在PCR扩增期间使用衔接子序列
本实施例示出了在PCR扩增和扩增子测序期间使用的多核苷酸衔接子序列的设计(参见图15)。选择了来自chr7:55191816-55191828(GRCh38.p12)坐标的第一校准序列:
Y12(WT):TTGGGCTGGCCA(SEQ ID NO:131)
然后对该序列进行修饰以掺入两个突变(A和G,对应于EFGR L585突变),从而产生另外两种校准序列:
Y13(A):TTGGGCAGGCCA(SEQ ID NO:134)
Y14(G):TTGGGCGGGCCA(SEQ ID NO:137)
然后选择了人类基因组(包含EGFR外显子)chr7:55,191,755-55,191,888区域两侧的正向和反向引物序列。
正向:TTCAGGGCATGAACTACTTGG(SEQ ID NO:121、124和127)反向:TGCCTCCTTCTGCATGGTAT(SEQ ID NO:130、133和136)
然后将校准序列与随机间隔物序列和引物序列一起组装,以形成如下的多核苷酸衔接子序列:
Y12F:TTGGGCTGGCCA–CTGATGCTA–TTCAGGGCATGAACTACTTGG(SEQ ID NO:120)
Y13F:TTGGGCGGGCCA–GCATTGCAG–TTCAGGGCATGAACTACTTGG(SEQ ID NO:123)
Y14F:TTGGGCAGGCCA–TCACTATCC–TTCAGGGCATGAACTACTTGG(SEQ ID NO:126)
然后合成(由商业供应商;GeneArt)以上多核苷酸序列(SEQ ID NO:120、123和126)。然后将多核苷酸衔接子以下列相对量(衔接子序列Y12=89%;Y13=10%;Y14=1%)组合,以配制衔接子序列的混合物(Eppendorf Epmotion)。
然后使用多核苷酸衔接子序列的混合物和人类基因组DNA样品(NA12878基因组,NIST)进行PCR(Taw DNA聚合酶;New England Bioscience)。PCR根据以下循环参数进行:初始变性;95℃;30秒;30个循环95℃;45-68℃;68℃15秒;20秒;最终延伸68℃5分钟;保持4-10℃。得到的扩增子被纯化,并使用QIAquick PCR纯化试剂盒根据制造商的说明进行尺寸选择。扩增子DNA产物然后使用Agilent 2100生物分析仪进行验证,并用作使用IlluminaTruSeq文库制备试剂盒(根据制造商的说明)的文库制备的输入DNA。然后根据制造商的说明对文库进行测序(
Figure BDA0003865051000000871
NextSeq)。
然后,校准序列在输出文库(.FASTQ)中的测序读段中被鉴定,如以上描述的(参见实施例1)。下面示出了一个原始读段序列的实例(其中Y12校准序列加下划线):
@HWI-D00116:342:CD1NVANXX:7:1101:5759:2792 1:N:0:CTTGTATTGGGCTGGCCACTGATGCTATTCAGGGCATGAACTACTTGGAGGACCGTCGCTTGGTGCACCGCGACCTGGCAGCCAGGACGTACTGGTGAAAACACCGCAGCATGTCAAGATCACAGATTTT(SEQ ID NO:224)
+
BBBBBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
鉴于校准序列的序列是已知的,读段中校准序列的错误率指示了文库的测序准确性。95,616个读段(90.7%)正确鉴定了EGFR WT核苷酸序列,而9,032个(8.5%)鉴定了A变体,而743个读段(0.7%)鉴定了G变体。这指示了用于检测EFGR L585的文库的灵敏度和定量准确性。该变体还提供了可用于评价和优化体细胞遗传变体检测的遗传变体的基本事实的实例。
本领域技术人员应当理解,可以对上述实施方案进行多种变化和/或修改,而不脱离本公开的广义范围。因此,本发明的实施方案在全部方面都被认为是说明性的而非限制性的。
本文中讨论和/或引用的所有出版物以其整体并入本文。
本说明书中已经包括的对文献、法案、材料、装置、物品等的任何讨论不应因为其在每个所附权利要求的优先权日之前存在而被视为承认任何或所有这些内容形成现有技术基础的一部分,或者是与本公开相关的领域中的公知常识。
本发明可以根据以下陈述中的一个或更多个来描述:
陈述1.一种分离的多核苷酸序列,包含两种或更多种校准序列,其中每种校准序列独立地代表天然存在的多核苷酸序列,并且其中校准序列以在任何天然存在的基因组中都没发现的排列连续地排列在多核苷酸序列内。
陈述2.陈述1的多核苷酸序列,其中校准序列中的一种或更多种以两个或更多个拷贝数存在于多核苷酸序列内。
陈述3.陈述1或2的多核苷酸序列,其中第一校准序列代表外显子、内含子、基因、等位基因、染色体或基因组序列,并且其中第二校准序列不同于第一校准序列并且独立地代表不同的外显子、内含子、基因、等位基因、染色体或基因组序列。
陈述4.陈述3的多核苷酸序列,其中第二校准序列代表第一校准序列的变体。
陈述5.陈述4的多核苷酸序列,其中第二校准序列与第一校准序列至少90%相同。
陈述6.陈述5的多核苷酸序列,其中与第一校准序列相比,变体包含一个或更多个SNP、一个或更多个插入、一个或更多个缺失、一个或更多个微卫星、多于一种核苷酸多态性、一个或更多个重复、一个或更多个串联重复计数变体、一个或更多个倒位、一个或更多个转换、一个或更多个颠换和/或一个或更多个易位。
陈述7.陈述3-6中任一项的多核苷酸序列,其中第一校准序列和/或第二校准序列指示癌症、遗传性疾病、病原体、耐药性、循环肿瘤DNA、循环胎儿DNA、循环母体DNA、或其它感兴趣的属性中的任何一种或更多种。
陈述8.陈述2-7中任一项的多核苷酸序列,其中两个或更多个拷贝数选择为复制由校准序列代表的天然存在序列的天然存在频率。
陈述9.陈述8的多核苷酸序列,其中两个或更多个拷贝数选择为复制天然存在的人类多核苷酸序列的纯合、杂合和/或体细胞等位基因频率中的任何一种或更多种。
陈述10.陈述8的多核苷酸序列,其中两个或更多个拷贝数选择为复制以下中的任何一种或更多种:基因组丰度、染色体丰度、基因表达水平、同种型表达水平、变体等位基因频率、纯合基因型、杂合基因型、体细胞突变频率、拷贝数变异、基因扩增、基因缺失、三体性、染色体非整倍性、微生物丰度、病毒丰度或变化的mRNA表达水平。
陈述11.陈述1-10中任一项的多核苷酸序列,其中一种校准序列代表母体来源的多核苷酸,并且另一种校准序列代表父体来源的多核苷酸。
陈述12.陈述1-11中任一项的多核苷酸序列,其中天然存在的多核苷酸序列来源于人类、原核生物、细菌、病毒、噬菌体或细胞器基因组。
陈述13.陈述1-12中任一项的多核苷酸序列,其中校准序列的长度独立地在18个核苷酸和20,000个核苷酸之间。
陈述14.陈述13的多核苷酸序列,其中校准序列的长度独立地在100个核苷酸和2,000个核苷酸之间。
陈述15.陈述1-14中任一项的多核苷酸序列,其中校准序列中的两个或更多个被间隔物序列分开。
陈述16.陈述1-15中任一项的多核苷酸序列,多核苷酸序列包含位于校准序列中的一种或更多种的5'和/或3'的一种或更多种旁侧或末端序列。
陈述17.陈述1-14中任一项的多核苷酸序列,其中校准序列中的两种或更多种在多核苷酸序列内连续排列。
陈述18.陈述1-17中任一项的多核苷酸序列,其中校准序列中的至少两种具有不同的核苷酸长度。
陈述19.陈述1-18中任一项的多核苷酸序列,多核苷酸序列为DNA或RNA多核苷酸序列。
陈述20.一种载体,包含编码陈述1-19中任一项的多核苷酸序列的DNA序列,该DNA序列可操作地连接到以下中的任何一种或更多种:5'启动子;旁侧(3'和5')内切核酸酶位点;和3'聚腺嘌呤重复段。
陈述21.一种制备陈述1-19中任一项的多核苷酸序列的方法,包括提供和连接两种或更多种校准序列;任选地还包括提供和连接旁侧序列或末端序列和/或间隔物序列(如果存在)。
陈述22.一种组合物,包含两种或更多种陈述1-19中任一项的多核苷酸序列。
陈述23.一种提供用于校准循环DNA检测方法的多核苷酸的方法,方法包括使陈述1-19中任一项的多核苷酸序列片段化以产生一种或更多种多核苷酸片段,该一种或更多种多核苷酸片段适合于校准循环DNA检测方法。
陈述24.一种提供用于校准RNA测序方法的多核苷酸的方法,方法包括对陈述1-19中任一项的多核苷酸序列进行体外转录以产生一种或更多种RNA片段,该多核苷酸序列是DNA多核苷酸序列,该一种或更多种RNA片段适合于校准RNA测序方法。
陈述25.一种校准多核苷酸测序过程的方法,包括:
i)使陈述1-19中任一项的多核苷酸序列在给定的一组参数下经历多核苷酸测序过程;
ii)记录由i)中进行的测序过程确定的校准序列的序列;
iii)将ii)中记录的校准序列的序列与陈述1-19中任一项的多核苷酸序列中的相应的校准序列的已知序列进行比较;和
iv)使包含感兴趣的多核苷酸的样品在同一组参数下经历在i)中进行的相同测序过程;
其中iii)中的序列确定的准确性用于校准iv)中的序列确定。
陈述26.陈述25的方法,其中iv)中的定量过程是在不存在陈述1-19中任一项的多核苷酸序列的情况下进行的。
陈述27.一种校准多核苷酸定量过程的方法,包括:
i)使陈述1-19中任一项的多核苷酸序列在给定的一组参数下经历多核苷酸定量过程;
ii)记录由i)中进行的定量过程确定的校准序列的数量;
iii)将ii)中记录的校准序列的数量与陈述1-15中任一项的多核苷酸序列中的相应的校准序列的已知数量进行比较;和
iv)使包含感兴趣的多核苷酸的样品在同一组参数下经历在i)中进行的相同定量过程;
其中iii)中的数量确定的准确性用于校准iv)中的数量确定。
陈述28.陈述27的方法,其中iv)中的定量过程是在不存在陈述1-19中任一项的多核苷酸序列的情况下进行的。
陈述29.一种校准靶DNA富集过程的方法,方法包括:
i)将陈述1-19中任一项的多核苷酸序列与大体上互补序列的寡核苷酸在允许杂交的条件下组合;
ii)富集与多核苷酸序列杂交的寡核苷酸;
iii)在给定的一组参数下对ii)中富集的多核苷酸进行测序;
iv)将iii)中确定的多核苷酸序列与多核苷酸序列的已知序列进行比较;和
v)在iii)中的同一组参数下对ii)中富集的寡核苷酸进行测序;
其中iv)中的序列确定的准确性用于校准v)中的序列确定。
陈述30.一种校准靶DNA富集过程的方法,方法包括:
i)将已知数量的陈述1-19中任一项的多核苷酸序列与大体上互补序列的寡核苷酸在允许杂交的条件下组合;
ii)富集与多核苷酸序列杂交的寡核苷酸;
iii)在给定的一组参数下对ii)中富集的多核苷酸进行定量;
iv)将iii)中确定的多核苷酸数量与i)中的多核苷酸序列的已知数量进行比较;和
v)在iii)中的同一组参数下对ii)中富集的寡核苷酸进行定量;
其中iv)中的数量确定的准确性用于校准v)中的数量确定。
陈述31.陈述1-19中任一项的多核苷酸序列校准多核苷酸测序和/或定量过程的用途。
陈述32.一种试剂盒,包含陈述1-19中任一项的多核苷酸序列和一种或更多种能够使多核苷酸序列片段化的核酸酶。
陈述33.一种分离的多核苷酸衔接子序列,包含校准序列和引物序列。
陈述34.陈述33的衔接子序列,其中引物序列能够结合互补多核苷酸序列以促进多核苷酸合成。
陈述35.陈述34的衔接子序列,其中存在于衔接子序列中的引物序列与能够添加到包含待复制的多核苷酸的样品中的单独引物序列互补。
陈述36.陈述35的衔接子序列,其中校准序列位于衔接子序列中存在的引物序列的3'。
陈述37.陈述34的衔接子序列,其中存在于衔接子序列中的引物序列与待复制的靶多核苷酸的一部分互补。
陈述38.陈述37的衔接子序列,其中校准序列位于衔接子序列中存在的引物序列的5'。
陈述39.陈述33-38中任一项的衔接子序列,其中引物序列与通用引物序列互补,或者包含通用引物序列。
陈述40.陈述33-39中任一项的衔接子序列,还包含以下中的任何一种或更多种:与流动池DNA序列互补的序列;指示包含待复制的多核苷酸的样品身份的索引序列;以及指示个体衔接子序列身份的独特分子标识符(UMI)序列。
陈述41.陈述33-40中任一项的衔接子序列,其中校准序列代表天然存在的多核苷酸序列。
陈述42.陈述33-41中任一项的衔接子序列,其中校准序列代表外显子、内含子、编码、非编码、基因、染色体、等位基因、基因组、转录组、重复和/或变体遗传序列。
陈述43.陈述33-42中任一项的衔接子序列,其中校准序列代表选自核苷酸转换、颠换、杂合突变、纯合突变、体细胞突变、插入、缺失、大规模结构变异、倒位、易位、串联重复和拷贝数变异中的任何一种或更多种的遗传变异序列。
陈述44.陈述33-43中任一项的衔接子序列,其中校准序列代表指示癌症、遗传性疾病、病原体、耐药性、循环肿瘤DNA、循环胎儿DNA、循环母体DNA或其他感兴趣属性中的任何一种或更多种的序列。
陈述45.陈述33-44中任一项的衔接子序列,其中校准序列是在跨越其整个长度上与选自天然基因组或转录组序列的序列具有小于100%的序列同一性的人工多核苷酸序列。
陈述46.陈述45的衔接子序列,其中校准序列是通过选择天然存在的遗传序列并通过逆转、改组、插入、删除或取代一种或更多种核苷酸中的任何一种或更多种来修饰所述天然存在的遗传序列以将与天然存在的序列的序列同一性从100%降低而产生的。
陈述47.陈述33-46中任一项的衔接子序列,其中校准序列包含以下中的任何一种或更多种:连续重复大于3次的单个核苷酸;校准序列长度的至少70%的G或C核苷酸;和校准序列长度的至少70%的A或T核苷酸。
陈述48.陈述33-47中任一项的衔接子序列,其是单链或双链的多核苷酸序列。
陈述49.陈述33-48中任一项的衔接子序列,其是DNA或RNA多核苷酸序列。
陈述50.陈述33-49中任一项的衔接子序列,其包含两种或更多种校准序列。
陈述51.陈述33-50中任一项的衔接子序列,包含第一校准序列和第二校准序列,其中第二校准序列是第一校准序列的反向互补体。
陈述52.陈述33-51中任一项的衔接子序列,包含第一和第二校准序列,其中第二校准序列是第一校准序列的变体。
陈述53.陈述33-52中任一项的衔接子序列,包含一种或更多种校准序列的两个或更多个拷贝数。
陈述54.陈述33-53中任一项的衔接子序列,其中衔接子序列和/或校准序列的最终3'末端核苷酸是胸腺嘧啶。
陈述55.陈述33-54中任一项的衔接子序列,其中校准序列构成衔接子序列长度的至少10%。
陈述56.陈述33-55中任一项的衔接子序列,其中校准序列的长度为从9个至10,000个核苷酸。
陈述57.一种组合物,包含一种或更多种陈述33-56中任一项的衔接子序列。
陈述58.陈述57的组合物,包含至少两种不同的衔接子序列。
陈述59.陈述58的组合物,其中不同的衔接子序列以不同的数量存在于组合物中。
陈述60.陈述59的组合物,其中不同衔接子序列的不同数量的比率是已知的、恒定的、整数的和/或对数的比率。
陈述61.陈述57-60中任一项的组合物,包含具有第一校准序列的第一衔接子序列和具有第二校准序列的第二衔接子序列,其中第一衔接子序列与第二衔接子序列的数量的比率为1:1或1:2。
陈述62.陈述57-61中任一项的组合物,还包含液体运载体。
陈述63.一种容器,包含陈述57-62中任一项的组合物。
陈述64.一种载体,包含陈述33-56中任一项的衔接子序列。
陈述65.一种试剂盒,包含一种或更多种陈述33-56中任一项的衔接子序列或陈述57-62中任一项的组合物以及连接酶和/或转座酶和/或一种或更多种单独的寡核苷酸引物。
陈述66.陈述65的试剂盒,其中一种或更多种单独的寡核苷酸引物与试剂盒中存在的多核苷酸衔接子序列中的引物序列互补或大体上互补。
陈述67.一种制备陈述33-56中任一项的衔接子序列的方法,该方法包括通过内切核酸酶消化从陈述64的载体中切除衔接子序列,或通过从陈述64的载体中扩增衔接子序列,或通过转录包含在陈述64的载体中的衔接子序列。
陈述68.一种制备包含用于测序或定量过程的靶多核苷酸的样品的方法,该方法包括将陈述33-56中任一项的多核苷酸衔接子序列附接到靶多核苷酸的5'末端的步骤。
陈述69.陈述68的方法,其中附接步骤包括在多核苷酸衔接子序列的3'羟基基团和靶多核苷酸的5'羟基基团之间形成磷酸二酯键。
陈述70.陈述68或69的方法,其中附接步骤包括通过连接、转座或引物延伸过程将陈述33-56中任一项的多核苷酸衔接子序列附接到靶多核苷酸的5'末端。
陈述71.陈述70的方法,包括使用连接酶或转座酶。
陈述72.一种制备包含用于测序或定量过程的靶多核苷酸的样品的方法,该方法包括使靶多核苷酸与陈述37或38或者依赖于陈述37或38时的陈述39-56中的任一项的多核苷酸衔接子序列在适合于允许多核苷酸衔接子序列中的引物序列与靶多核苷酸的互补部分结合的条件下接触。
陈述73.陈述68-72中任一项的方法,其中靶多核苷酸是DNA多核苷酸。
陈述74.陈述33-56中任一项的多核苷酸衔接子序列或陈述56-62中任一项的组合物校准多核苷酸测序和/或定量过程的用途。
陈述75.一种校准多核苷酸测序过程的方法,包括:
i)将根据陈述33-56中任一项的衔接子序列或根据陈述57-62中任一项的组合物在允许多核苷酸衔接子序列附接到靶多核苷酸的5'和/或3'末端的条件下添加到包含待确定序列的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的序列;
iv)确定衔接子序列中校准序列的序列;以及
v)将iv)中确定的序列与原始校准序列进行比较;
其中iv)中的序列确定的准确性用于校准iii)中的序列确定。
陈述76.一种校准多核苷酸测序过程的方法,包括:
i)将根据陈述37或38,或依赖于陈述37或38时的陈述39-56中任一项的衔接子序列,或包含这些衔接子序列的组合物在允许多核苷酸衔接子序列中的引物序列与靶多核苷酸的互补部分结合的条件下添加到包含待确定序列的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的序列;
iv)确定衔接子序列中校准序列的序列;以及
v)将iv)中确定的序列与原始校准序列进行比较;
其中iv)中的序列确定的准确性用于校准iii)中的序列确定。
陈述77.一种校准多核苷酸定量过程的方法,包括:
i)将已知量的陈述33-56中任一项的衔接子序列或陈述57-62中任一项的组合物在允许衔接子序列附接到靶多核苷酸的5'和/或3'末端的条件下添加到包含待确定数量的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的数量;
iv)确定衔接子序列中校准序列的数量;以及
v)将iv)中确定的数量与i)中衔接子序列中校准序列的已知量进行比较;
其中iv)中的数量确定的准确性用于校准iii)中的数量确定。
陈述78.一种校准多核苷酸定量过程的方法,包括:
i)将已知量的根据陈述37或38,或依赖于陈述37或38时的陈述39-56中任一项的衔接子序列,或包含这些衔接子序列的组合物在允许多核苷酸衔接子序列中的引物序列与靶多核苷酸的互补部分结合的条件下添加到包含待确定数量的靶多核苷酸的样品中;
ii)扩增靶多核苷酸;
iii)确定靶多核苷酸的数量;
iv)确定衔接子序列中校准序列的数量;以及
v)将iv)中确定的数量与i)中衔接子序列中校准序列的已知量进行比较;
其中iv)中的数量确定的准确性用于校准iii)中的数量确定。
陈述79.陈述77或78的方法,其中在i)中添加的至少一种衔接子序列包含两种或更多种校准序列,并且其中iv)包括确定每种校准序列的量。
陈述80.陈述75-79中任一项的方法,其包括聚合酶链式反应扩增、DNA合成、DNA测序、RNA测序、逆转录和互补cDNA测序中的任何一种或更多种。
陈述81.陈述75-80中任一项的方法,其中方法包括单末端、成对末端末端、短读段、长读段、边合成边测序和纳米孔测序中的任何一种或更多种。
陈述82.陈述75-81中任一项的方法,其中靶多核苷酸和/或衔接子序列是DNA或RNA多核苷酸。
陈述83.陈述75-81中任一项的方法,其中方法包括鉴定引起或指示疾病或感染的存在或易感性的遗传序列。
陈述84.陈述75-83中任一项的方法,其中方法包括对样品取自的受试者的疾病或状况或感染的诊断。
陈述85.陈述84的方法,其中疾病是癌症,和/或感染是由微生物感染,和/或受试者是人类。
参考文献:
·Baker,S.C.等人The External RNA Controls Consortium:a progressreport.Nat Methods 2,731-4(2005).
·Bentley,D.R.等人Accurate whole human genome sequencing usingreversible terminator chemistry.Nature 456,53-9(2008).
·Bernstein,B.E.等人Genomic maps and comparative analysis of histonemodifications in human and mouse.Cell 120,169-81(2005).
·Bray,N.,Pimentel,H.,Melsted,P.等人Near-optimal probabilistic RNA-seq quantification.Nat Biotechnol 34,525–527(2016).
·Clarke,J.等人Continuous base identification for single-moleculenanopore DNA sequencing.Nat Nanotechnol 4,265-70(2009).
·Consortium,E.(2005)."Proposed methods for testing and selecting theERCC external RNA controls."BMC Genomics 6:150.
·Edwards,R.A.等人Using pyrosequencing to shed light on deep minemicrobial ecology.BMC Genomics 7,57(2006).
·Eid,J.等人Real-time DNA sequencing from single polymerasemolecules.Science 323,133-8(2009).
·Jiang,L.等人Synthetic spike-in standards for RNA-seqexperiments.Genome Res 21,1543-51(2011).
·Johnson,D.S.,Mortazavi,A.,Myers,R.M.&Wold,B.Genome-wide mapping ofin vivo protein-DNA interactions.Science 316,1497-502(2007).
·Koboldt DC,Zhang Q,Larson DE,等人VarScan 2:somatic mutation andcopy number alteration discovery in cancer by exome sequencing.Genome Res.(2012);22(3):568–576.
·Lapin,Morten等人“Fragment size and level of cell-free DNA provideprognostic information in patients with advanced pancreatic cancer.”Journal of translational medicine vol.16,1 300;2018年11月6日.
·Li,H.and R.Durbin(2009)."Fast and accurate short read alignmentwith Burrows-Wheeler transform."Bioinformatics 25(14):1754-1760.
·Li H.(2013)Aligning sequence reads,clone sequences and assemblycontigs with BWA-MEM.arXiv:1303.3997v1[q-bio.GN].
·Lieberman-Aiden,E.等人Comprehensive mapping of long-rangeinteractions reveals folding principles of the human genome.Science 326,289-93(2009).
·Mortazavi,A.,Williams,B.A.,McCue,K.,Schaeffer,L.&Wold,B.Mapping andquantifying mammalian transcriptomes by RNA-Seq.Nat Methods 5,621-8(2008).
·Ronaghi,M.,Uhlen,M.&Nyren,P.A sequencing method based on real-timepyrophosphate.Science 281,363,365(1998).
·Rothberg,J.M.等人An integrated semiconductor device enabling non-optical genome sequencing.Nature 475,348-52(2011).
·Zook,J.M.等人Integrating human sequence data sets providesaresource of benchmark SNP and indel genotype calls.Nat Biotechnol 32,246-51(2014).
序列表
<110> 加尔文医学研究所
<120> 参考梯状物和衔接子
<130> 188554PCT
<150> AU 2020900400
<151> 2020-02-13
<150> AU 2020900401
<151> 2020-02-13
<160> 230
<170> PatentIn version 3.5
<210> 1
<211> 8786
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_ERBB2校准序列
<400> 1
ttcctccggc gccagtggga atgtgatgtt gttggggcaa cggtgtactc ccataaaccg 60
tcccgggtga ttcataggta taatatcacc ggaaatcaat atgcctgtta cttaggctat 120
tctgaggggv ggatgccggt gtgcggcgcg ttgtcttaga atgagccaat gatagctcag 180
tccacattcg ttccctaatt agaagaaata tgagccccaa accgcttatc accgtaccac 240
acacataata gctcgttcca gctcgtctac tcccagtgcc cagagagatt tgatgggcac 300
attacagggg tgattatgtg ccaccagctc tgggtagtca accgaggacc ggggcggcct 360
gattatctcg ccagctgtat tggttgactt caatgcggaa aacgtctact gtcaacggag 420
cgtaaaacgc acagacttca atatgtcgtt cgagcatcca cactatgtgc gatcacgaaa 480
ggcacggtgg tcctccgttc tagcgaccgc tgtaaactca tcatcgcatg tctgctaaaa 540
gggcgagtag gtccgttcat gatcaatgaa gatgtgcctg tatactccct taagtcaaat 600
atctcttaac caccaagcag catgcccaga gtagaggtga gaaggaagga gagagctgcg 660
gtccacatga gcatctggac ctagcatgga caactcactc ctccctggct ctcgctttgt 720
tcttgttgcg ggtgtggtgg tggtgggact caaagacggt aaagatagct ttctctcctc 780
cctggggaat ctgggggttg tttaaaaggc ctgctcctct tttagaaggc aggagggccc 840
caagggaagc agaaggtgac agaaggggaa agggtcctct gatcattgct caccccacag 900
agatcttgaa aggaggggtc ttgatccagc ggaaccccca gctctgctac caggacacga 960
ttttgtggaa ggacatcttc cacaagaaca accagctggc tctcacactg atagacacca 1020
accgctctcg ggcctgtaag ccatgcccct ccctgctgcc tcttctctca gacagcctga 1080
ccccagccgc aaactcccaa cttacaaccc agtgcctgcc cgccactgcc ccagccgcct 1140
acaccaccca tttcctccct ctctgtccct cctgccatct ccctgtgcct cttcatctct 1200
ggggttctct gtcttgtctc cctctgctta taggttgtgc ctctggtttg ggggcctctc 1260
agcctgtctg ggtccctccc ttgctgtgca gttggcctcg tggcctctgc tgctgtttgt 1320
gcctctctct gttactatac catgactgcg tvatccagaa attccgggaa caatgccagc 1380
atgtgattcg ctatttcaat ccctcaagcg attttgagga ccgcgtgcgc taataaatgg 1440
ccctctatca cagacctaat gggacggaaa gtaatgaatg ctgaggtgag ggctcggtac 1500
atccggctcg agagagtaaa agattgtctt acattttatt ctgtcacatc aacgcccggg 1560
ggtctcggtc aggccccgct gcgaccgggt agggttatac ctaaccacat actggaaact 1620
tgctctgcca tgcgaacaaa ccgctaggct tgtacactga gtcgtattat taattaggcc 1680
accgccctac gagcgtgcta tggccgagcc cgtcatctca tcaagtcgac ttactccatt 1740
tgctcactta acttctcaga ccccaaatgc gacgagtggt atactgccac tgttttcatg 1800
gcgcaggaaa acgtatgctc agggtagacg cgttgcgcgc gccaacggta aggcgattcg 1860
gttaaaacat ggtagatttg ctttgttcag ctgttgggaa attactgagt aacggtctcg 1920
cgtgaaggat gatccaccat cccatccagg cctttgcttt cactgatgaa gaaactgaga 1980
tacagagagg gcagggcacc tgttcggagt ttatgaaatg cccccccacc attatctttc 2040
ttgatcatat aagaatctgg tgaggcaagg tagggcgtga tctttatctc tattttatcg 2100
ttttatttaa gcgggaacag gactgctcag tggctggggg ccttgcccaa gatctccaag 2160
tactggggaa ccccagggag gccctggggg gtggcagtgt tcctatttca gccccactct 2220
gcttccccct cccaggatat ccaggaggtg cagggctacg tgctcatcgc tcacaaccaa 2280
gtgaggcagg tcccactgca gaggctgcgg attgtgcgag gcacccagct ctttgaggac 2340
aactatgccc tggccgtgct agacaatgga gacccgctga acaataccac ccctgtcaca 2400
ggggcctccc caggaggcct gcgggagctg cagcttcgaa gcctcacagg tggccttcac 2460
cgtcattgaa accttctctt ggttattcag agctgaccag ggccactgct aaccaggggg 2520
aggctttgtg tgcattagaa atggtgtccc ttctgggcag acgcaggcag agcccgggaa 2580
gacgccctca gaagattgga aaaagattcc ccttcttcct gggaagttgt agcttgcgtc 2640
agcacatata attcaatcgt gagaatgcag gctgggtttt tgcccccact tggctgagtg 2700
aagtgtacag tgaacaacct atgtaactat ttgctggccc tggagccgac gtcggagcaa 2760
actcctgacg gaggctgagc agcaaaagct acaataaccc gcaaaaattg gataatagcc 2820
cgacttgaac aacggtacvg cctcaggctg ccatcatgcg ccaataggag tatgcatagc 2880
tgtctacttg ctccgcgaag gcgcccggta gtactcaagt gctctttccg gaattcggtg 2940
tattcgccag tctggagatt gggcgatagc aaactcagtg gctagcggcc tcgagtattg 3000
cgtgggagtg agtgtcatga gtcggtgtcc cagatacagt ttgtctctag aggcccgtga 3060
cacttaatcg agtattgtgt acgcccatcc caatgtactc ggatttgttg tcgaagattt 3120
ggtcccattt aaccttatcc gagcttccag tttttagcaa cgctaggtgc agaaagtatg 3180
aaccctcact tgtattcgct cataagaggc catccaaagc gatgcagcag aaattatatc 3240
tggttcgcga cagttcatgg caagagaaga agtgcacagg gttacttcat gccgccaatg 3300
cttctccgtc gtaccttcac cgctcccgat tggacctaat aatgcatgta tctcttaacc 3360
accaagcagc atgcccagag tagaggtgag aaggaaggag agagctgcgg tccacatgag 3420
catctggacc tagcatggac aactcactcc tccctggctc tcgctttgtt cttgttgcgg 3480
gtgtggtggt ggtgggactc aaagacggta aagatagctt tctctcctcc ctggggaatc 3540
tgggggttgt ttaaaaggcc tgctcctctt ttagaaggca ggagggcccc aagggaagca 3600
gaaggtgaca gaaggggaaa gggtcctctg atcattgctc accccacaga gatcttgaaa 3660
ggaggggtct tgatccagcg gaacccccag ctctgctacc aggacacgat tttgtggaag 3720
gacatcttcc acaagaacaa ccagctggct ctcacactga tagacaccaa ccgctctcgg 3780
gcctgtaagc catgcccctc cctgctgcct cttctctcag acagcctgac cccagccgca 3840
aactcccaac ttacaaccca gtgcctgccc gccactgccc cagccgccta caccacccat 3900
ttcctccctc tctgtccctc ctgccatctc cctgtgcctc ttcatctctg gggttctctg 3960
tcttgtctcc ctctgcttat aggttgtgcc tctggtttgg gggcctctca gcctgtctgg 4020
gtccctccct tgctgtgcag ttggcctcgt ggcctctgct gctgtttgtg cctctctctg 4080
ttacagtctt agcttctaca tctttaggac gaaagggctg tattcactcg tcaccgcaga 4140
tctgtgcctg ggtagtttcg ttgcccaggt gtccgtcgca tcgtcagcta ggtttttgcg 4200
atcaattctg aactaccgcc gagaagtgtt tcccgctctg aacattcaat ttgagcggta 4260
cgatatgtga cgcaatcgtc actcgcgccc tttcgggata acggctactc ctggaggtcc 4320
gvagcatata gcactggaac ctcattaccg gcccaggaac atggaaaacc gtctccttcg 4380
caaaacacct agctgttctc gtaactccga ccgcccagga agtcggcgat cacgtgtatc 4440
gtatccccgc tataatacta gaatcttact caaccagaac cgcggagccg cggatcgatt 4500
gaagattatt tgtaggaggg agccataaga gatgatacga cggaaaaggg ggtttcggag 4560
ataacctgta gtatcattgg agtgttaatc ccaagatggg acggcagagc tcaacgtagg 4620
agatggatat cggcgctctc tatcgtcaca tttctcgtat ctagctacga cagttacaat 4680
tgagagccaa caccctgtac tggcgggcga gctccccagg gctggcacgc tggggcagcc 4740
tctgaatgca cagggtgggc ctagtcagaa gaagcctttc ccctgaaatc cctctacttc 4800
ccaagcacgc aagctttctc ctgctgttaa acctgcagtg tgcaagggac atgggcggag 4860
gggtccttca gtcaggcttc tccctgtctg aggtggcatg acttggagtg agtttggatg 4920
gggtggccag gtctgagaag gtcccccgcc agtgtcctct gacccatctg ctctctcctg 4980
ccagtgtgca ccggcacaga catgaagctg cggctccctg ccagtcccga gacccacctg 5040
gacatgctcc gccacctcta ccagggctgc caggtggtgc agggaaacct ggaactcacc 5100
tacctgccca ccaatgccag cctgtccttc ctgcaggtga ggcccgtggg caacccagcc 5160
aggccctgcc tccagctggg ctgagccctc tgtttacagg tgggtggcag aagaaggtgc 5220
cctgcccttc tgtttcctct cttgttgtgg tttctcaacc aggaagtcct ttctaacatc 5280
taacccccat tcattttact gcagaatcag ttgactctct ctataacgtg gctggccgag 5340
gtcatgtctg gatgggatgc gtctgtgttt ccgctaaatc ttgtgctctc ttgccagcat 5400
gatcatgtcc cctgtccacc tgctccagcc actatctaaa cctgctgacc tctgcctccc 5460
ggtgattvcc cgtaaagcgt tcatgggtat actacgcgtc gactgcgctc tcgtcacaca 5520
actgttggaa ctgacatatg caatgagatt atcatacgcc ctttatgcaa agctatagtt 5580
caaaactcgc gcgggccatt tctgcaccag agtgtgggag ttcagcggat aagattagta 5640
aacgaaacag acgctcaatc ctcctgaagg ccgcggcccc gggtactgga cggagtccct 5700
atctgacggc attgcgacag aatttgagct ggggcgaagt atcaagcgtg cgccccagtc 5760
acatactgcg caatcaccaa aacacatcaa cttctgcacc gcgtatgatg aaggaggata 5820
cccgcgtaga agagagagca gtctgcttaa gataattcac actgtgacaa tgattcctcg 5880
caaggtttgg ctccgccctc ataccgggtt caggttgatt gactgcaatg tttgtgttgg 5940
cgagcagttt cgggtccggt gttgaattac tccgaatgcc tccgctgtgg agtgctgcgt 6000
ttcaagttaa atattaggtc tatttcctta agtaaaacca tcccatccag gcctttgctt 6060
tcactgatga agaaactgag atacagagag ggcagggcac ctgttcggag tttatgaaat 6120
gcccccccac cattatcttt cttgatcata taagaatctg gtgaggcaag gtagggcgtg 6180
atctttatct ctattttatc gttttattta agcgggaaca ggactgctca gtggctgggg 6240
gccttgccca agatctccaa gtactgggga accccaggga ggccctgggg ggtggcagtg 6300
ttcctatttc agccccactc tgcttccccc tcccaggata tccaggaggt gcagggctac 6360
gtgctcatcg ctcacaacca agtgaggcag gtcccactgc agaggctgcg gattgtgcga 6420
ggcacccagc tctttgagga caactatgcc ctggccgtgc tagacaatgg agacccgctg 6480
aacaatacca cccctgtcac aggggcctcc ccaggaggcc tgcgggagct gcagcttcga 6540
agcctcacag gtggccttca ccgtcattga aaccttctct tggttattca gagctgacca 6600
gggccactgc taaccagggg gaggctttgt gtgcattaga aatggtgtcc cttctgggca 6660
gacgcaggca gagcccggga agacgccctc agaagattgg aaaaagattc cccttcttcc 6720
tgggaagttg tagcttgcgt cagcacatat aattcaatcg tgagaatgca ggctgggttt 6780
ttgcccccac ttggctgagt gaagtgtaca gtgaacaacc tatgtaacta tttgctggcc 6840
ctggagccga aatagtcatt gccagtgact taagcttatc ggtcttatta gtccttcgtg 6900
atcgcgcgtg caagagtgtc cgggcacggg ggcaggtacc accgcatatg cagacggcgc 6960
taaaatacct atttgtacgg gagtgcgcga aagtcgttat aagtgcgctg gtttatagac 7020
gatcgcagta caggccgaaa acctttgcca tcttttcgaa ttgtgatacc caactattag 7080
accttcaagg aacaactcgt atacatccga gcactcccag cgctcacagc tgcgcggtca 7140
acggggaata actaccgatt ccccgtggcg ggacgaatat gtcagaaatc aatacgaagg 7200
gtcggagtcc tacccccacg ggggcaagag tcctgttggg atgaagttca cttcctttct 7260
cattgggtac aaccactttg taaagvttgg tcggagaacg ttatctcgca gcacccatcg 7320
agtaagttca cgcatgttgt agctcaatac ggctggcgcc gcacgtagaa gccttttatc 7380
tgggtgaatg cgcgcgctat aattctagta acctataatt ttggcccatc ttatccgagt 7440
agcctatcag atctcttaac caccaagcag catgcccaga gtagaggtga gaaggaagga 7500
gagagctgcg gtccacatga gcatctggac ctagcatgga caactcactc ctccctggct 7560
ctcgctttgt tcttgttgcg ggtgtggtgg tggtgggact caaagacggt aaagatagct 7620
ttctctcctc cctggggaat ctgggggttg tttaaaaggc ctgctcctct tttagaaggc 7680
aggagggccc caagggaagc agaaggtgac agaaggggaa agggtcctct gatcattgct 7740
caccccacag agatcttgaa aggaggggtc ttgatccagc ggaaccccca gctctgctac 7800
caggacacga ttttgtggaa ggacatcttc cacaagaaca accagctggc tctcacactg 7860
atagacacca accgctctcg ggcctgtaag ccatgcccct ccctgctgcc tcttctctca 7920
gacagcctga ccccagccgc aaactcccaa cttacaaccc agtgcctgcc cgccactgcc 7980
ccagccgcct acaccaccca tttcctccct ctctgtccct cctgccatct ccctgtgcct 8040
cttcatctct ggggttctct gtcttgtctc cctctgctta taggttgtgc ctctggtttg 8100
ggggcctctc agcctgtctg ggtccctccc ttgctgtgca gttggcctcg tggcctctgc 8160
tgctgtttgt gcctctctct gttactggca atctcggtgg accctcctat gtcccggatt 8220
tacgcatcgg ggccgggacg caacacagca gtgcggtttg aaggtgcttc ttacaaatta 8280
ccaactgtgg tgtagaggag gactaagaag ctgacataag tcatacgtca tgaagtactt 8340
tccataggta tcgcgttgaa caatgtcagc acaaaccgag tagctgggta cgcgtagtca 8400
gactcaaccc tgtgtcagag caagcgtaat cgactatacg tcgagcatga gacatcgttt 8460
tccaggagtt gttgacttgt acttaactat gcacgaccct tagggagata cgttccaaac 8520
tggaatatga gccgactctc cgcaggttcc attcgtcatg aaggtttgct ccgcgaccgg 8580
ctccttcatt gatgacacga tttcccgaag atctgggatc aaacgtctaa cgaagtcttc 8640
atcgtggttt tattaacact tggggcctac tgcgccvgac tagcccatgt aagatacttt 8700
ccgatgaaga atttgatcag cggggccctg tggtgctatt agaccggtct actgatacgg 8760
tgccctaaac ctgcgccccc acgaaa 8786
<210> 2
<211> 8726
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_EGFR校准序列
<400> 2
gtggaaccgc ctaggtcgtt ggcctcgtgt cagcacccat cgccattccg aggaatcgta 60
tagcgtctag atcaagggga tcaggtgctg ttcacggatt tcgaccaatt ttgctgccgt 120
gcagcaatat ccagtaatgc gctgcgcgct gttcacatct acgccactag tgctgtaaga 180
gttctctaaa atttgctttt gggcttgacg atagcaccgc tagggtaaaa cgatttctcc 240
ggagatcagt gcaactagga ctgcaccttg gcgcacggtt caagtgagac acgccggtac 300
cacttagagc aacggagcgg cctcatggtc tatacattag aaaaaaacgt cagctacata 360
gactgagvgt acataaccgg tggattttag tcaccatgtc tggttttgtg cccggggctg 420
ggatagcaca aaagatctgt atcctgacct tttagaggac gcaaaggccg tgacttgatc 480
gaggttctct cccatactgc gtcacgacaa aaatttaaga gcgagacctt ctaagatacc 540
ttatctcgca cgataccacg tgctaacgcc atgtccgaag gagcttctat ggtactttgc 600
acatgcatat catttatgct gtgaccactg actaaaccat tctcttcctt cctccccata 660
tttctaaatt tctaatcatt gctcaaagcc caattcagag aaaaccctag ctcctccatg 720
gcaccatcat taacaatttt atctggccgc cccccgggaa gttcactggg ctaattgcgg 780
gactcttgtt cgcaccatgg catctcttta gcagaacata aatgcgacga gcacatgcat 840
ccttcatggg aatttaaagg agctggaaag agtgctcacc gcagttccat tctcccgcag 900
aaatcctgca tggcgccgtg cggttcagca acaaccctgc cctgtgcaac gtggagagca 960
tccagtggcg ggacatagtc agcagtgact ttctcagcaa catgtcgatg gacttccaga 1020
accacctggg cagctgtaag tgtcgcatac acactatctc tgcctccagc tcctatgggg 1080
gacagctcta cagcactggg gcaggggaga gaagccatgt ttagtaagtc acattaatca 1140
gaaacaaaaa gtagtaagca aaatatctga ccactagaaa agcatgtatt taccacggac 1200
atagagatcg tttttttgtg gcgggtggca gcccagctgg ttggcagtgc aggccaccgg 1260
aggcagatcc cctgcaggga cagcagagca cttgtgtcct gagacgagct gctgttcatg 1320
gggctggcag caccagcgac ttggacttta gtccgcgagg ctttccggga caccggcttt 1380
tagcaaccct gttcgagtac ccgcaaattt ttgaggattg agccagaccc atgttaatgt 1440
ggttgtcgcg acaactgcag ccgcaatcat gcagtatatc aggagcgact tataccgact 1500
tgctaagcat ggactcactg aagacatcga ctaaggctta cagggtcctg ctgcctatag 1560
gcttgttgac tccgtcgacg caggggctaa tavctggtaa aattaagtat acggtggtaa 1620
agttctggtt catacattga accctcgctc agctgatcag cgactgtctt ttactccagt 1680
aatgttccct tgttgaacta atataacagc ttttgccagc ggtgtcacga acgtttgcac 1740
ccagggaatc atcgaacttt aacgctctac aggtgttaac caagacatgt ctggaggggg 1800
acggttgcgg tgccggcgca atagctgtcc gcactgacgg cacaccgcac aggacaccgg 1860
acatatgaat tagcgatcaa tcactcggcc aaactgttcc actctgtgac acgtgatggg 1920
attgtcatgg aaacaaattt ccattttcac tggagagtgt tgaaccccgt gaggcatgag 1980
agcacagtgt tccagaacaa tgcttactgc tcattatcac aggggtcaaa ggctaacgtg 2040
cagggattgt tgcagatcgt ggacatgctg cctcctgtgt ccatgactgc aatcgtctac 2100
ctattttaca gttgttgagc actcgtgtgc attagggttc aactgggcgt cctagggctc 2160
cctggaccca ttttagacct tgagttcttg agttcctcaa aagagaaatc acgcatttat 2220
gttttctctt cttagaccat ccaggaggtg gctggttatg tcctcattgc cctcaacaca 2280
gtggagcgaa ttcctttgga aaacctgcag atcatcagag gaaatatgta ctacgaaaat 2340
tcctatgcct tagcagtctt atctaactat gatgcaaata aaaccggact gaaggagctg 2400
cccatgagaa atttacaggg tgagaggctg ggatgccaag gctgggggtt cataaatgca 2460
gacagcagtt ccgatggctc ccagcgagct tgtcactcaa ttccacctcg gagaaggctt 2520
ttatttttac ccagtacacg tgcactgagt gccggctgtg tgtaagatac tgcaggggaa 2580
gttactgaga agatggcaga tactggaatg ggaagattta agcggggtac cagtgtttac 2640
atggacatga aaaaatactg agagatagta agaaatcgta aagattctga gtaaaagaga 2700
gtatgaccaa acaagctgaa gatctaatga ctacatcagg taacagggcc cctatcgagg 2760
atcttacacg taagtctctt gagcgctcac ggcgctgtgt cccctgcgca tggcggtgcc 2820
aaaatgccac attttctgtt agactgtcaa atatgcttca aaaaccgtag ttactgccag 2880
gacatccgag cacaactcta cvcacgaaac acagacgtag cgcagaagca gaaataccat 2940
acctcggcga aacggatgct ctatccatgt cgtacttgcg ataatctagt tctaggctgc 3000
aaggctcctg gtcacagcta tctatgccag agttgaatta gttctggcct tcgccgacaa 3060
caattcttgc actagtagtt gtagggatgt tcggggcatc gtcgcgcaaa ggggcagagg 3120
aaatactagt cccatttatc attcaggtcg ctcctcgcgg cttgtattgt atttggcccg 3180
ttgtcaagca cggtgctttc atttcagctg aacaccacga aaatcctagt gggtataagg 3240
tattgatagg cgttcgcgcc gggtggcagg ttatgctgca cagggccggt tgcgaaggcg 3300
ctcagtatca ctatcaaaga catgcatatc atttatgctg tgaccactga ctaaaccatt 3360
ctcttccttc ctccccatat ttctaaattt ctaatcattg ctcaaagccc aattcagaga 3420
aaaccctagc tcctccatgg caccatcatt aacaatttta tctggccgcc ccccgggaag 3480
ttcactgggc taattgcggg actcttgttc gcaccatggc atctctttag cagaacataa 3540
atgcgacgag cacatgcatc cttcatggga atttaaagga gctggaaaga gtgctcaccg 3600
cagttccatt ctcccgcaga aatcctgcat ggcgccgtgc ggttcagcaa caaccctgcc 3660
ctgtgcaacg tggagagcat ccagtggcgg gacatagtca gcagtgactt tctcagcaac 3720
atgtcgatgg acttccagaa ccacctgggc agctgtaagt gtcgcataca cactatctct 3780
gcctccagct cctatggggg acagctctac agcactgggg caggggagag aagccatgtt 3840
tagtaagtca cattaatcag aaacaaaaag tagtaagcaa aatatctgac cactagaaaa 3900
gcatgtattt accacggaca tagagatcgt ttttttgtgg cgggtggcag cccagctggt 3960
tggcagtgca ggccaccgga ggcagatccc ctgcagggac agcagagcac ttgtgtcctg 4020
agacgagctg ctgttcatgg ggctggcagc accacagatg cagtataggg cttaacgtat 4080
gattcgaacc gccagtgagg aaaggccagg gttgcccatg gacgcctcca atctagtaaa 4140
ctggtttgta atttagacat ttaattaaat acaccagccc ggccaagtat ataggtctga 4200
gcagagattg aacgcgggac cctaccagcc gagcctcggt tagcatcatc tctcggcaca 4260
gcgtatcgtg actacgagag gaacagatct gcagttttca tactctgata gggccggtcg 4320
ccgagacagt aagaacgaac aggctagccc gtcgtccttg tgtcgttccc tgactaactt 4380
acctccgcta gagttcgtat tgccctgtcc cgtagcttat taaacgaaga ggatagctta 4440
gacgtggcgt aacttctcct tccgaacatt tggattattc gagccgagct ctaagttatt 4500
tgggcccggg gactcgtggc taatacgttt tcccaggcgg cttgaaatta cggcgtttgg 4560
ccaattatcg gtcgcgaagt vaatggagcg ctgctgaact cccgactaca gcgggtccaa 4620
ttatagacaa ggctcacctt actgaccatt ttaaattcaa tgcattatag ggacaagcta 4680
tctcttatta tgaattgcac cttatataaa cttaaagatc ttttatcaca aatttctttg 4740
ctgtgtcctt tagtgagaat ttgtattatc agtcactaaa gctcactaag ttagtaagct 4800
ttgcgcccag atgacctggg caggaatggg tgagtctctg tgtggagaga gtgaagaaac 4860
tgctaccctt aatacctgga ccttgaggga ttgttttatt ttagtttttc tgcatttctc 4920
agtatttcat gtgatatctg tctttttctt ccagtttgcc aaggcacgag taacaagctc 4980
acgcagttgg gcacttttga agatcatttt ctcagcctcc agaggatgtt caataactgt 5040
gaggtggtcc ttgggaattt ggaaattacc tatgtgcaga ggaattatga tctttccttc 5100
ttaaaggttg gtgactttga ttttcctaca caaataaaat tggagaaaat ctaagtggag 5160
aaaggcctgg gcagaattcc acttgaagtg tgtttatttt tgctatggca atgacaagtc 5220
ttacagagct acaaacgaga gttttatgag aaagccattt taccagctaa tgtcaagtaa 5280
taactagaaa aggatatcaa atagaaacag gctaatctgg agttccatgt catcatagac 5340
actgacgttt atccctgacc attacctcag tcatgatgtg ctgccatact cgctcttaaa 5400
aacttttcgc gggcataaat acatagtcga tagtctgtca acgtvatacc ttctgagtgt 5460
gcctgaaagc acttcgttgc agagcactcc tgcagaaaaa gtcattcatg agatcgactc 5520
gtgttatgtg ggggtcgtct gaaggtcaat tcgttactac aagcatccga gatctacccc 5580
ccgtaccaga cgcgccaacc atccttatag aatttggcac tggtatagca cggtgggcca 5640
tactgtaatt tagccgtagc agtgagtatt ctcaactacg gccacaaagt gctcgcgaac 5700
aatggggtga ccgccgtcat ggtctttggc aagccgctcg ggatatgacc gatggtaagt 5760
ttctgtcaga gatgcccgct gacccgtacg acaaaactat acatttgctc atcaatggag 5820
ccctaaagaa gcaacattcc gggtttttat catctgacca tattgtctat gcccataggc 5880
ttcaacggaa tggatccagc caacgactgt atttcgttgg ggcggtctca gacggaatca 5940
ctctcgtggt gtgcgacgat aggcgagcac agcaacccat taggagttgt cgcgttctgg 6000
ctactgaatt tccattttca ctggagagtg ttgaaccccg tgaggcatga gagcacagtg 6060
ttccagaaca atgcttactg ctcattatca caggggtcaa aggctaacgt gcagggattg 6120
ttgcagatcg tggacatgct gcctcctgtg tccatgactg caatcgtcta cctattttac 6180
agttgttgag cactcgtgtg cattagggtt caactgggcg tcctagggct ccctggaccc 6240
attttagacc ttgagttctt gagttcctca aaagagaaat cacgcattta tgttttctct 6300
tcttagacca tccaggaggt ggctggttat gtcctcattg ccctcaacac agtggagcga 6360
attcctttgg aaaacctgca gatcatcaga ggaaatatgt actacgaaaa ttcctatgcc 6420
ttagcagtct tatctaacta tgatgcaaat aaaaccggac tgaaggagct gcccatgaga 6480
aatttacagg gtgagaggct gggatgccaa ggctgggggt tcataaatgc agacagcagt 6540
tccgatggct cccagcgagc ttgtcactca attccacctc ggagaaggct tttattttta 6600
cccagtacac gtgcactgag tgccggctgt gtgtaagata ctgcagggga agttactgag 6660
aagatggcag atactggaat gggaagattt aagcggggta ccagtgttta catggacatg 6720
aaaaaatact gagagatagt aagaaatcgt aaagattctg agtaaaagag agtatgacca 6780
aacaagctga ctcatcgggt tatgaaagca actaagcctg atttcttcaa tccatgtaag 6840
tctttgcggt agcgactcga tagtgtacag ctcaagaagt cgtggatatt tgctaagtgg 6900
caaacctcat ctgccggcga cgtgcgccat ataagtctac caccgattct cctgtgatct 6960
ttttggcata ctatcgacct gtagtaggcc cttctgtaaa tattgaggtg ccgcatatat 7020
tgggaatatc catacccgat ctaacaacct agatctgctc tgcaactggt tagatggtct 7080
cccactggaa aattgacccg tcggcagatc gacgttgccc acagattcta agcccaagtg 7140
gcgcagtgga ttvttgttca gggcatttct aagtaacgcc attggggtaa tcgctatcga 7200
aaaacgctgt gtgaagcaag ggccggcgtg aaaacgcagt ggtgacaaac cgccattaac 7260
cgcctgtcga tgcagactag ctcgttgtga acgacgcagg ggcctggcat cgtgccctgg 7320
aaccggttat gagcgtccct tgtagttgaa ctctccccaa aaagcggcaa catttgcagg 7380
tagacccgga acatgcatat catttatgct gtgaccactg actaaaccat tctcttcctt 7440
cctccccata tttctaaatt tctaatcatt gctcaaagcc caattcagag aaaaccctag 7500
ctcctccatg gcaccatcat taacaatttt atctggccgc cccccgggaa gttcactggg 7560
ctaattgcgg gactcttgtt cgcaccatgg catctcttta gcagaacata aatgcgacga 7620
gcacatgcat ccttcatggg aatttaaagg agctggaaag agtgctcacc gcagttccat 7680
tctcccgcag aaatcctgca tggcgccgtg cggttcagca acaaccctgc cctgtgcaac 7740
gtggagagca tccagtggcg ggacatagtc agcagtgact ttctcagcaa catgtcgatg 7800
gacttccaga accacctggg cagctgtaag tgtcgcatac acactatctc tgcctccagc 7860
tcctatgggg gacagctcta cagcactggg gcaggggaga gaagccatgt ttagtaagtc 7920
acattaatca gaaacaaaaa gtagtaagca aaatatctga ccactagaaa agcatgtatt 7980
taccacggac atagagatcg tttttttgtg gcgggtggca gcccagctgg ttggcagtgc 8040
aggccaccgg aggcagatcc cctgcaggga cagcagagca cttgtgtcct gagacgagct 8100
gctgttcatg gggctggcag caccaccvat ggcgcccccg cgtagatatc agcgagcgta 8160
tctttgagcc cgttaaatcc gatagatcgt catgatccac tctcgatttt acgtcgcact 8220
ctacaagtct cccaggcagt tccgtgtgga tgaagtatgg ccgtcgtatt tgcgactgtg 8280
caaaagatct ggaaccttat atgagtccga ccataaactg gcgaccagaa tttcccgcac 8340
ttggcaatcg tacaaattgt acctgcatgt tgcctgttaa ccgggtgcga gattacctgc 8400
aacttaccag ccaccatgag tattacgacc tgccgggtct gggctctccg caacagagcc 8460
agttgcgcat acaaatggac ataacatgac tggatagctc caatgcacgc aaaaacggcg 8520
tttcgagtat cacgttttgc ggtccgtatc gctactacag gtattagtag cacatgcgga 8580
ataagatggg tatccgacta gttgtaatac gaagtaaaag acagacgccg tgccggtcgt 8640
ttccacgggt gtaagtggga ataacaccga gtgcacgggc cgagtatggt tttacgtcat 8700
actttagttg ttggctcggt atcgca 8726
<210> 3
<211> 8783
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_MET校准序列
<400> 3
tagggatgcc ggtcatcagg tgtctcaact gcctagggtt gtacctcagt ttttgtacca 60
gtgcttggct tttagaacaa tccactggta atttatataa cgttttaacg gtagttactg 120
gcctgaaagg cttgcgtvgg atgtcagctc caatctagtt gagacgatac gtgcgcggct 180
aaaatcctgc ccagagtcgc ccatcgacgt cctagcgttg aattacagga aggtccttac 240
gcctgggact ggcgtgcgtg ttccagaagt ttaaacggat agggccggtg ctcagcgggt 300
ataccgaagc ctgtgtgtca tagatcaagg atattctata gttaggagaa gtagaaacat 360
cggtgaggat cccagcgaaa tagaaaacga tctatcgaac ccgctgtaag ctgcagttct 420
ggctccctat gttatttacg gtcgtaaaac ccccaattcc ccatggatca tccaccagaa 480
ttcccttccc aacaacaaat tcttcctgac ccgccagtct caaacttggg cctagagccc 540
taggaatagc ccctgtcagg gggagttagg cggcgcctat gtcgcacgag acgcattcaa 600
aaatcatctc agacagggca caatgtccct actatgtaga acctctaaca ttgtgtggca 660
atgctatgct cactggacaa taatgttact ttttcacata cctgctaaca ataaaggaaa 720
ggaaggaatc agatttttaa aattttaatc accgttatga caggatttgc acacatagtt 780
gctaagtcta gaaaattcca tcaaatgata tttacatgta ccttttgtgt acttacttta 840
taattaatta acaaactaga tacccctctg gaagctcttt ccaccccttc tcttcacaga 900
tcacgaagat cccattgaat ggcttgggct gcagacattt ccagtcctgc agtcaatgcc 960
tctctgcccc accctttgtt cagtgtggct ggtgccacga caaatgtgtg cgatcggagg 1020
aatgcctgag cgggacatgg actcaacaga tctgtctgcc tgcaatctac aaggtaggaa 1080
tctctaacag ctggcataca tgtttttgtt tggtgttttt tttttttttt tggtttggtt 1140
tggtttgttt tttgtttttt tagatacaaa tcccactaat gaaaaaaatt taaaaatcaa 1200
tttactcatt tagctgtgag tcatcagcta aagcaccatc tctctcttgg ctttatccct 1260
cgggcaggga gggggtggtg tttgggcatc cccccaagtc ctgcacctga agtgcttgct 1320
tcacattgtc taggttctat cgctgggcag ctgctcacct ttagtgccgt gtgtacgagc 1380
gactccctta ggatttaagc aaacttgtta ctacgtccaa cttgacatta gtggttctta 1440
gacgagacgg catgcgttta acagatcggt aatcaaagac gcttaataat gcgccgtgca 1500
cgttctttcc ataaggtcat cctcacaagc aactccacgc cgtcggcgca gtctacagaa 1560
ttgtgcagtc ggtccgtgct agcgttagac ggatgggctg actagggtca ggtatgagag 1620
aaatcggcga agacagtgac caaaccggtc actaggggat gggttaggtt tattagatvg 1680
ttaactgatt caagcatcag cgcgctaccg cgcccacgaa gcacacttca acgtggactc 1740
atgtctccta ggggcgccag agctaaagtt ctgtgcactg atgcgtcaat tggcccgaac 1800
atcttaacac ttcaccttag tgcctgttat gctaccacta cggtaactga tcatgattga 1860
aggtgccctt cagaattgaa ttagcatcga acacaatagc gtcttttaac acctctgtgt 1920
cgccttgagt aggtggggta ggttcccaag gccgccgccg gtcttacgtc ctgatttcca 1980
atacaattgc agggatttgt ctgtatgtgc tgccaattga ttgaaagatc tctttccctt 2040
gaaaccatta aaagatcata ggcaaagtct gtcttggggg ttcagataat ttggcttcaa 2100
ggcaagagat tagaagatga catattgatt tacaatgagg ggaactgttg ggtcttcagt 2160
tcaaacaccc acaagccctg ctaatctgtt attaccatta tcatctacat tttccactta 2220
tatttaaact gagcttgttg gaataaggat gttataactt ttttgctgtt taggttgtgg 2280
tttctcgatc aggaccatca acccctcatg tgaattttct cctggactcc catccagtgt 2340
ctccagaagt gattgtggag catacattaa accaaaatgg ctacacactg gttatcactg 2400
ggaagaaggt aagctgttcc cacagggaat ttccatagac gtggtttttc ccaaatgcat 2460
atttacaacc agtgtcactt ggccctttat aatgtctctc ttcatcttaa atttacccct 2520
cctccattaa gttctttagt gagtattcca gagatcttct gaaatctagt taatttgttc 2580
tccaagaaag actagaccta agggaggtct ttttcaaaac ttctcctttt gtcctatatt 2640
tctcaacaag aaaaataaac acacagaatg agaattacag tcctaatgac agagctctag 2700
tgcaggcaca gccgggagtc gtcagcgttc accctcgagg caacacgaac tagacgagcg 2760
tttagaatct taattctata ccggtgcaac tgatttgtgc ggcgagtaga gctctggttg 2820
ctgtctggtt gcccggcacg gaattgtcgc tatcatagaa cgatacttac acttttctcg 2880
gaacaacagg vagcgttcta acgtgcgtac ttccgcggtg actatgatgt gtcacgtcat 2940
aaggttagcc ctaattcttc cgtataccga cgacaaattg tacactcgac attaccatag 3000
gctggtcgag gtgctgactc atattggtat cccatcgccg ccaactccaa gggtttttag 3060
tgcgagatga ttctcggcct caattactgc gatggcttgc tcgacgaata tatctccctt 3120
tgggggggcg caagttctca atccccttcg acgctcgccc taagaactaa tgtactattc 3180
aagatataat gccaggggtt acagcgtata gagttataca agcacacgaa agccagaccc 3240
cggtgagatg aaacgtatag ccaccgtagg ggcctgagct acgagtgggc tgataggatc 3300
aacagcataa aatcatctca gacagggcac aatgtcccta ctatgtagaa cctctaacat 3360
tgtgtggcaa tgctatgctc actggacaat aatgttactt tttcacatac ctgctaacaa 3420
taaaggaaag gaaggaatca gatttttaaa attttaatca ccgttatgac aggatttgca 3480
cacatagttg ctaagtctag aaaattccat caaatgatat ttacatgtac cttttgtgta 3540
cttactttat aattaattaa caaactagat acccctctgg aagctctttc caccccttct 3600
cttcacagat cacgaagatc ccattgaatg gcttgggctg cagacatttc cagtcctgca 3660
gtcaatgcct ctctgcccca ccctttgttc agtgtggctg gtgccacgac aaatgtgtgc 3720
gatcggagga atgcctgagc gggacatgga ctcaacagat ctgtctgcct gcaatctaca 3780
aggtaggaat ctctaacagc tggcatacat gtttttgttt ggtgtttttt tttttttttt 3840
ggtttggttt ggtttgtttt ttgttttttt agatacaaat cccactaatg aaaaaaattt 3900
aaaaatcaat ttactcattt agctgtgagt catcagctaa agcaccatct ctctcttggc 3960
tttatccctc gggcagggag ggggtggtgt ttgggcatcc ccccaagtcc tgcacctgaa 4020
gtgcttgctt cacattgtct aggttctatc gctgggcagc tgctcacctt tagtgccgtg 4080
tgtcgcgtcc ccggtctcca caacgcggat cgatgttgga ccgtagatga tggtgcacgt 4140
caggtagttt gaagtggtct agtgtatacc aagctgataa gactcgacga tttaaaaagc 4200
gatcggcact gaggaaaatg ttcagggtag gcgatccctc gtttagacga tcctgaatag 4260
ccgtagatac tcttgtggag gagcttctag taagctgact aagaacatag caacgcgcat 4320
cagtaccgtg gagcccatcc acccacctgg cagccaaatc cgctcctagg aacttcatac 4380
tgaggttgcc gaaacgatgt ggacgcattt gggctctccc tctctggcga tctccaaacc 4440
agacaaggag caacactatg ttgtacgcgc ccgaagttgg aacggactca ctgtggttat 4500
catcacgtgt tagccatcat tccatcggct ggtataggct ctgggtacaa agtgtatcgt 4560
ttttattatt tgcgctcggt gtgtaagatc tctgaaacct ttaggcccca gctgcctaat 4620
cctaagcctt atavataacg acctacctgt cttgcgctaa ggcggatata cgaagggatc 4680
tcaacattta aaagttttgt ttttcttata atagcagcag ctaagttcca tttttaggcg 4740
tgcacatatt gaaccatggt gtgaattgcg atagtaaggt tttagagtct ataaataatg 4800
cctagtgaaa ttggagccat tcagtcccta gaaatattta tgcctatctg tggctatttg 4860
tctatttgca tgattatcct tgccattatc ctccaggctc tgaaaataca cactgaaagg 4920
tttcttacca gcttgttcat gtctggattc acattaactc tatgaccata ttttattcca 4980
gacacttctg agaaattcat caggctgtga agcgcgccgt gatgaatatc gaacagagtt 5040
taccacagct ttgcagcgcg ttgacttatt catgggtcaa ttcagcgaag tcctcttaac 5100
atctatatcc accttcatta aaggagacct caccatagct aatcttggga catcagaggg 5160
tcgcttcatg caggtaagtg ctttctgaga gtagctgtgt ctgttctatc tggtattgtg 5220
caattaattt gttttcgttt ttgcagtaag gtatttgcaa atactgtaaa gtccaaatca 5280
tagtagaaac tggaacacag actgaaagcc aaacaatgaa gcctggtcta ctttctgtta 5340
aatgtgtggt ctctttttat taagttcttg aagctttcag tttgaatctg tttgctttaa 5400
ttttctcgtc cagaatggtg tggcattttt tttccattta taatttctgt cacgtgattg 5460
gaaaataaaa tgaagactat ttgcagccgg ctgcatgaag gtaacgacat tgaaggatac 5520
cacgttctgt ggttacgggc agcccagacg gcctcgcaca gcccttggaa ggagctaccg 5580
ctgataatcg cggaccgctt ccattgtgat ggttctgcta aggagaacgt ttacggcaaa 5640
acctctcgtt gcttcacggg taagcctgct gtgggttctt cttacaagat ctgatcacca 5700
aacgcacccg cttacggtga ctttgcccaa gttgtcggac ggacttttca gttcattagg 5760
tccaaagtac cggcacagct agacatgtca tgtacgtvgc agaaggtggc tcggctctat 5820
agaataaaag gatctaacgc agagaggttc acctattaaa gcatgtgaac ccttccggag 5880
attgcagaca gatacaccgg tatcggcgct agttattaat tttaggccct gacagaactc 5940
gaggttaaga tgtgcctgtc tggtgacaaa tatgtcggca actaaaagag ctgctgttct 6000
gataatcccc cctagcgatt taccttgtcc aacctcccta tccgaggcag gtgtaatcag 6060
gccttgtgct tacatttcca atacaattgc agggatttgt ctgtatgtgc tgccaattga 6120
ttgaaagatc tctttccctt gaaaccatta aaagatcata ggcaaagtct gtcttggggg 6180
ttcagataat ttggcttcaa ggcaagagat tagaagatga catattgatt tacaatgagg 6240
ggaactgttg ggtcttcagt tcaaacaccc acaagccctg ctaatctgtt attaccatta 6300
tcatctacat tttccactta tatttaaact gagcttgttg gaataaggat gttataactt 6360
ttttgctgtt taggttgtgg tttctcgatc aggaccatca acccctcatg tgaattttct 6420
cctggactcc catccagtgt ctccagaagt gattgtggag catacattaa accaaaatgg 6480
ctacacactg gttatcactg ggaagaaggt aagctgttcc cacagggaat ttccatagac 6540
gtggtttttc ccaaatgcat atttacaacc agtgtcactt ggccctttat aatgtctctc 6600
ttcatcttaa atttacccct cctccattaa gttctttagt gagtattcca gagatcttct 6660
gaaatctagt taatttgttc tccaagaaag actagaccta agggaggtct ttttcaaaac 6720
ttctcctttt gtcctatatt tctcaacaag aaaaataaac acacagaatg agaattacag 6780
tcctaatgac agagctctag tgcaggcatc agcgctcatg attggtatgt attttaacga 6840
atcaacccga tagcgcttgt tctattgvca caaaataaag gctattcgca agagtttcgg 6900
acagcttaat ggccacagtc gggaatctct caaaggaagg tacgggtctg atatggcacg 6960
cagggtcggg gcagctttta actctccaga gtatacgttt atgttttcgg gttttatttg 7020
ctactagcgc actatgggat ccgatccggg tatggcgtca acttgcccgt tcaagtagtt 7080
agcccgtggt acgcgcaccc tcactgtttg tccggcttca gaccactcca ttcacttagc 7140
aggattataa gattcattag cccggtagga ttcatgaatt ggcagacgta aattggcctc 7200
aaatatcaac gctctaggag actagtgcac acgaaatacc gacattctgt atccagtgaa 7260
cagtatataa ttcatcgcaa cttggagatc ctcccctgca gttatagagc ggccgcaaag 7320
gcggcggccg gcaagggtag ggcggacgcg attgtaggca taatcccttc ccagtcccgg 7380
ccaggacgtc ctgcgaaagc acgcacccaa aatcatctca gacagggcac aatgtcccta 7440
ctatgtagaa cctctaacat tgtgtggcaa tgctatgctc actggacaat aatgttactt 7500
tttcacatac ctgctaacaa taaaggaaag gaaggaatca gatttttaaa attttaatca 7560
ccgttatgac aggatttgca cacatagttg ctaagtctag aaaattccat caaatgatat 7620
ttacatgtac cttttgtgta cttactttat aattaattaa caaactagat acccctctgg 7680
aagctctttc caccccttct cttcacagat cacgaagatc ccattgaatg gcttgggctg 7740
cagacatttc cagtcctgca gtcaatgcct ctctgcccca ccctttgttc agtgtggctg 7800
gtgccacgac aaatgtgtgc gatcggagga atgcctgagc gggacatgga ctcaacagat 7860
ctgtctgcct gcaatctaca aggtaggaat ctctaacagc tggcatacat gtttttgttt 7920
ggtgtttttt tttttttttt ggtttggttt ggtttgtttt ttgttttttt agatacaaat 7980
cccactaatg aaaaaaattt aaaaatcaat ttactcattt agctgtgagt catcagctaa 8040
agcaccatct ctctcttggc tttatccctc gggcagggag ggggtggtgt ttgggcatcc 8100
ccccaagtcc tgcacctgaa gtgcttgctt cacattgtct aggttctatc gctgggcagc 8160
tgctcacctt tagtgccgtg tggaatggta caagttcaac ttaatgggag agctcgccgc 8220
ctaatcttga catagcgtag ttgggagact ctgggtgcgt tcccgaggct accctcaagc 8280
caaacatgag agtgagacgt ctctcacgtg gaactctacg tgcggcaatt ggtccttcta 8340
gacctactag catgcatagt gcgggactcg acgggcatat ctatcaccvc taagaagatt 8400
ctaatgagtg tccgtttggt tccgcagcag cgtccaaaca cgctggcgaa ggtacgtccg 8460
ctcgactgac tcgccaggct ccgtgggtga taggacttta ccctacccca cacggggtga 8520
gtaggcgccc gcatagtagc aagccgcgcc caggcggagt atcagttaaa aaacactata 8580
tgtgaatgga tgacggaaat agatgtgtct agcgcgtatc cgagtctttc gtaatttata 8640
gatatgtgac gttcagatgc gatagtacgg cacctattga cggatattac acacttctgc 8700
ctgcagattg tacattttcc tgcaagacaa actcgttctc acacctgtta accccgcata 8760
cgtcggataa actttttttt gta 8783
<210> 4
<211> 8648
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_BRAF校准序列
<400> 4
accgagcgct atggagcatg cctcagagac cactctacca agcggaaggc ttaaagttta 60
ataagtccgt ggttcgatcc tgttatttta cccggtctac ggtactgtgc cactgcgttt 120
gagcgagaat ctcatacggc tgtcaggtta gacgatccta tcgctccggg ctgaggaaac 180
aacgtgctac acagggtgct tctctcccac ttgctatcag tgtctaggcc aggaattcta 240
atcgaacctc aggcaaacva gtcccatcaa cgttatacct ggggaaagcc tcctcgtgcg 300
taatgccgag tgtcgcctta atggggagaa agatataatc agagtgattc ttcccacatg 360
tgtctggttt aggatcagct cataaataga atatgccggc ctttcttcgt aacacgtgcg 420
aaaaaacgtt tttacacctg caggaatata agtggggggt atacaaccca ggcgtcaagg 480
tttaagaatt gtccaccagt tcggccctcc gaggtactcg gtcaagctgc tttcgccagt 540
agcaatgcgc gcgtacgagc cttgagttcc gggtcgctaa gtctgtataa cgtccgagaa 600
aaaacaactc tccctctcct cctagaaact atccaaaaat ggtttctatg ggttaggggt 660
cttgattaat taaacgataa tataaaatat aaattaactg tatagctgaa ccagcattac 720
aatttgggag agaaatactg tccattccac atattattct ctaactacac ttaaaaaaaa 780
ttctctataa caatcgtatg gaagaaaaac cctcacagac ttttagacat cgtagcttca 840
cattaagaaa atttaagtgt aaaatggtag gtagaaaaga gatatttttg gattacttac 900
tcaagttggt cataattaac acacatcagt ggaacttctg tactacaacg ctggtgaaat 960
ttataaccac atgtttgaca gcggaaaccc tggaaaagca gctttcgaca aaagtcacaa 1020
aatgctaagg tgaaaaacgt ttttcgtacc tgcaaagtaa aaaatcacag agatttcaaa 1080
aactcacaag aaaactttct agaaactgac gtatctactc tcttgtttaa aataacaaag 1140
ttgtaatata tttatatcat gaaactcaca tactaaagta ctattataaa atgaaaaccg 1200
ggggttcaag ataatagatg gactacacat atttatttcc caccccacta tctaacttaa 1260
aaacccagaa gttaaaaaat gagaaatgag taaaaggctg gcaactgatt tcaagcttga 1320
caacataaaa gtaaaagtag acatgaaaag cccacccgga cgtttaggat ggggccggct 1380
aacctgaaag taagctactc aatccaaaag tttcacagga tttaaattca agtggtgtga 1440
aacacgctca ggccactttt gactgcggga tatgttgtca ttctgtgaat tagtgcaaaa 1500
attttcgtca tacagttgac cccgactcgc tggagctgct gagacacgcc ctgtcttggg 1560
agaccggttc tacaaatacc acaccaggtg gattcgggtc atcacgtgaa tgacccgagc 1620
ggcttatcag ccaggtcaat ctccgttgac attctctgag ccgtcaccat gagtcagcgg 1680
atccaattgt tctaggaaaa gggcaggcgc gtctgcaagg ggaggtattt ggagcaactg 1740
tgaagaacgt ttcgatgtga tgacaatgag actttaaaac gvtgaactgc tcccctccat 1800
cccgtaagtg acctcagcgg gtagtgatcc cacctcttct ggggtctgtc aagtccatag 1860
gatctaggaa gtgccctcaa acatacatca cccagtatat cgcgttcccg acataagtgg 1920
agttgtattt tgtttcctcc gacggaccta ttctaattaa ccaggagatc caaaagaaag 1980
cagttcaaga agcatgtcac tgacgagcag aagtcaaatc atacccaata ttgatttttt 2040
caggactgat tctgaaatag tctatgtcag ctttaatccc atttatttgt atcaaatgca 2100
tgtaaatatc tgagtggtat gataagttat ttggggaaaa agtccttaat ttaacaattt 2160
aaacattgga aaggtttcta attaaccagg agatccaaaa gaaagcggtt caagtagcat 2220
gtcgcccaag agcagaagtc aaaccatacc caatagagtc cgaggcgggt gcggaagggg 2280
atgatccaga tgttagggca gtctctgcta aggacgcctc ttcctgtggt attgggtggt 2340
gttcaaagaa cttggagaca aacagcaaac tgtgaggcaa aacaaaacaa acctaacttg 2400
tgcaaaaccc agaagcttca tataccaaaa tacatagtta accaaaaaaa ctgagatcaa 2460
attccattct cagaaacaac tgttaaaatt caattagttg tatttttgtc taaaggctta 2520
ttttaaaaaa aattgtattg cactttcaaa ggcatgctta taacttaaaa ctaatcattc 2580
agttcagcaa atttctacat actacaagat gaaaatcatg ctttatggtt aaagaatgag 2640
aataaaaagt atctactgta aattaggtgc tgaagatggg ctggggcgct gtctcaccaa 2700
cctgtatgca acctatcggt tacagtaggg tatgtgtgag ccggcggctt acagcttgcc 2760
taatgccata cagacatgca ccgagctctc tacgtatcca taccatttct aactaacvga 2820
agtttaaaac gcatcgccat tagcttgtag ccaacaccaa gactagcgaa gctttccgtg 2880
cttcaaagcg aggatccgtt cgtgcgcaat tatagtattt tccccacgtc ccggggagtt 2940
aagaaatgag tcgatattgc gtgggcgccg tagaacattc cgtttaagaa agagaatcca 3000
gagaatttaa tgggatggtt ttacacagcc cacacgccgt aacctcacga ggtaggtgtt 3060
cttccgctat tcggccataa tcctctcggt gcaatcgcgt cttgtgcact tcttggtcat 3120
tcgaacgccc ctagcgtgag tgattaatgt cacccgtcag gggatatcga gaatccctgt 3180
aggaaacgtg taaccgggaa ctatgtggtc catctaaaac ctggtggtcc gaattgctaa 3240
ctcgtacgct agcggtcaaa tggaggggca aaacaactct ccctctcctc ctagaaacta 3300
tccaaaaatg gtttctatgg gttaggggtc ttgattaatt aaacgataat ataaaatata 3360
aattaactgt atagctgaac cagcattaca atttgggaga gaaatactgt ccattccaca 3420
tattattctc taactacact taaaaaaaat tctctataac aatcgtatgg aagaaaaacc 3480
ctcacagact tttagacatc gtagcttcac attaagaaaa tttaagtgta aaatggtagg 3540
tagaaaagag atatttttgg attacttact caagttggtc ataattaaca cacatcagtg 3600
gaacttctgt actacaacgc tggtgaaatt tataaccaca tgtttgacag cggaaaccct 3660
ggaaaagcag ctttcgacaa aagtcacaaa atgctaaggt gaaaaacgtt tttcgtacct 3720
gcaaagtaaa aaatcacaga gatttcaaaa actcacaaga aaactttcta gaaactgacg 3780
tatctactct cttgtttaaa ataacaaagt tgtaatatat ttatatcatg aaactcacat 3840
actaaagtac tattataaaa tgaaaaccgg gggttcaaga taatagatgg actacacata 3900
tttatttccc accccactat ctaacttaaa aacccagaag ttaaaaaatg agaaatgagt 3960
aaaaggctgg caactgattt caagcttgac aacataaaag taaaagtaga catgaaaaca 4020
agcatccaac aatctaggga aaagttgtct gcttcggatc tgttacgagc ctagttccta 4080
gtaagttccc tgaacgtata taagtaggtg tttctgctgt gacggaaagt atcagtcgta 4140
ctaaagacac cagtcaacga ttgaagccca ggagtggcag gggtcgccct gggccggttt 4200
gacatatgaa catggtgggc atcgttgtac gatttcactg ctttagggtc cattggccgg 4260
atcagatgcc ccagtagttt tgcgtccatc gcgtggtaag ctcctatcta aggcccgcgt 4320
ccgacacctc ctatacccga atttaatttc cgcttggcat caagaaccgg taaccctgag 4380
agcctgatgg ttgcgaccga tacgttcagg tggctcctat ccaagtaaaa ttagcggctc 4440
ccggaaacga gattggcaaa ctaagtaaga ccatgtaaat gttctctttg tcgggtatac 4500
ggtagccccg aagatacact avcgcactca gtctgtcccg gcaaagtgag tactggaatc 4560
cgaagggcga attctaacag tcagtggcac tactccttcg tcactcgaat gcatccgtag 4620
ggcttctatc agtcctttga tatttaaacc attttcattt gaagatgact tttatagaga 4680
tggtatcata agggaaaaaa atcagagtga ctgtataacc tggagtcagt gaaatattta 4740
atgtcatcag agagaaacca gaagcttttc tgatttgtga ttcacaagaa gcttatcact 4800
taaaataact gtgataaatg aaaaatggca cttatttctg atctaagtta taattatagc 4860
agaaaaataa agatacatac ttggtttttt tttagttcta gcaatgctgg atacttacat 4920
caatattgac aggttctatt gtgtttatat gcacattggg agctgatgag gatcggtctc 4980
gttgcccaaa ttgatttcga tgatcttcat ctgctggtcg gaagggctgt ggaattggaa 5040
tggattttga aggagacgga ctggtgagaa tttggggcct ggaaaaatga agtcattgga 5100
agataagatt cagagtaacg atataaaggt aataatattt aaaaaggaag ataaaaggat 5160
tttcttgttt ttatattctc aaaatcatta aagcattaaa aacctagcag taatgacttt 5220
taaaagtatt aatttaaaaa tccaatactg ccaaagctgc tttgctcaag taggccctcc 5280
aggaactatc aatgataaga ccactgattc ttacctggaa aacactaggg aaatttactt 5340
atggctagaa attacctgtg gccatcaact gaagaagtat atagcttagc aattatcgct 5400
tgagctgtgg gtgcgccatg gaacgggttc tgtcaagaca aggttccttc cgctcccaac 5460
cgtacaacga gcttacctgc agtccgcatc gttgcgagcc ctgtcgaggt acagccgaca 5520
atgtgcatag cgtgaataca gcgagagctc ctcagtcgtg ggcggacaca agcggacctc 5580
taccgcaata ggtccgggac gccacgggcc ttataaaagg gaatggccca cagcaccttt 5640
agttatgacc ccgctacagc aggctctcat aatatccagc cattcacgac actgtacgga 5700
ggtaccgcat atgaacattg aactcgggtc tctacaatat cataaggcag tatgtctatt 5760
aaatacccca gaattcatta aactaaagtg taatgaggtg gtgtcaatgg tagccgacaa 5820
atcggcaaga ctccacgtaa tttgctttcc cgacatgact ttcggtttga gcacagtctt 5880
cttcggcggt gcgatcgaag cctatcatac tcagatatcg ttgttgttgc gcgtagtggg 5940
gctatcgtag ttcgttgaca vtttttaggg ctggacgtat tctaattaac caggagatcc 6000
aaaagaaagc agttcaagaa gcatgtcact gacgagcaga agtcaaatca tacccaatat 6060
tgattttttc aggactgatt ctgaaatagt ctatgtcagc tttaatccca tttatttgta 6120
tcaaatgcat gtaaatatct gagtggtatg ataagttatt tggggaaaaa gtccttaatt 6180
taacaattta aacattggaa aggtttctaa ttaaccagga gatccaaaag aaagcggttc 6240
aagtagcatg tcgcccaaga gcagaagtca aaccataccc aatagagtcc gaggcgggtg 6300
cggaagggga tgatccagat gttagggcag tctctgctaa ggacgcctct tcctgtggta 6360
ttgggtggtg ttcaaagaac ttggagacaa acagcaaact gtgaggcaaa acaaaacaaa 6420
cctaacttgt gcaaaaccca gaagcttcat ataccaaaat acatagttaa ccaaaaaaac 6480
tgagatcaaa ttccattctc agaaacaact gttaaaattc aattagttgt atttttgtct 6540
aaaggcttat tttaaaaaaa attgtattgc actttcaaag gcatgcttat aacttaaaac 6600
taatcattca gttcagcaaa tttctacata ctacaagatg aaaatcatgc tttatggtta 6660
aagaatgaga ataaaaagta tctactgtaa attaggtgtt actagtgtcc actccagctt 6720
ccatgtgttt ctggcaaacc tggcacctga gcagaacgca gccgtgggta ggctactcag 6780
cgacgcggtg ccccacgact tcacgacatc tcttcgggtg gaggctccgg cttttcctga 6840
gcgcattgga gtagttgagg gccgcacgva gtcgattgat atggtatgta aagcccccga 6900
acttatcccc gtctattgat ttttgcgtaa cttgagttaa aaaacatact aaatcaattt 6960
aatgagaaga gtacgcagca ctgtgacatg cttctaatca agggtgtcat actgctttac 7020
aaataaagag ctggtaaatt caagtccatg attaggcgag tgtcgaccct tctggatttc 7080
tggtctgaag ttaccattgg tgggctaacc caaccgtgcc ttgggctttt tctgtctcca 7140
gtcgatagac gggacaacaa gtcctaccgc cgcgacagcc ttaaggcaca ccgttaaaca 7200
atcccgagag gggcgagcgg gtatagcctt acgaacgcgc tggtaaacca tgactctgct 7260
tatcagaggc tcatcagact ggtaagacat gtgcagcaaa aacaactctc cctctcctcc 7320
tagaaactat ccaaaaatgg tttctatggg ttaggggtct tgattaatta aacgataata 7380
taaaatataa attaactgta tagctgaacc agcattacaa tttgggagag aaatactgtc 7440
cattccacat attattctct aactacactt aaaaaaaatt ctctataaca atcgtatgga 7500
agaaaaaccc tcacagactt ttagacatcg tagcttcaca ttaagaaaat ttaagtgtaa 7560
aatggtaggt agaaaagaga tatttttgga ttacttactc aagttggtca taattaacac 7620
acatcagtgg aacttctgta ctacaacgct ggtgaaattt ataaccacat gtttgacagc 7680
ggaaaccctg gaaaagcagc tttcgacaaa agtcacaaaa tgctaaggtg aaaaacgttt 7740
ttcgtacctg caaagtaaaa aatcacagag atttcaaaaa ctcacaagaa aactttctag 7800
aaactgacgt atctactctc ttgtttaaaa taacaaagtt gtaatatatt tatatcatga 7860
aactcacata ctaaagtact attataaaat gaaaaccggg ggttcaagat aatagatgga 7920
ctacacatat ttatttccca ccccactatc taacttaaaa acccagaagt taaaaaatga 7980
gaaatgagta aaaggctggc aactgatttc aagcttgaca acataaaagt aaaagtagac 8040
atgaaaaagg ctcagccaga accagtcgtt cagaaataag gaatcacgtg aactggtgcg 8100
tgacgcgttg atagctcgat cgacggaaga tcacatcttc agcgtaagtg aagctcggta 8160
atttgttgcc tcggcctctc atgcaatatc ctcgttcgtc gcagcttgta ccctagaata 8220
gcccgctttt aggttctgtt gccatctaaa acatataatt tcgggattcg cactgccaga 8280
attcgcgtcc gcctvcaacg ctcgttatcc cacagcggtc accggtagga tagtgactgt 8340
acaggcacgc gaaactatct caggattaag ccgcagtacg tatagctggt acttgagccg 8400
attcctgatg tcaaatctac aagcaggctt tggcagggaa tccaaggtcg ctcagttctg 8460
cttgtagcga gcctaaccca tatgtcgctc atgcatgata atgagacagc ccatagtctg 8520
accccgcgtg ctgcccatcg tcggaaggtc tctgtatgga aaatataaac ttcgcgaaaa 8580
taacggcagg gtggcgtcaa tgatgatagt tgatcgtgtc gcacatatgc ctcgtgtata 8640
atcgggga 8648
<210> 5
<211> 8867
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_FGFR1校准序列
<400> 5
ccggatagct tcttgagacc tcgaagcgtt gactcgcaac ggtcctatgg tattctgccc 60
ctttttatgc tataaactat acccacccat ggtcatcttt atattgagaa cgctgccata 120
cggtgtgagt tgtgaagcag cgcgccggag ccccactcaa tacatttgag tatagttact 180
tccgcagaca ccgttacgtt gctagavtgg agagagtcgc aatgcttcga cccccgaatc 240
aacataggtt atgccgaagt caccgacaat acctacgagg ctacccttgg cacctggtga 300
cgtggtggaa gcttgagtaa atttctacaa ctgtcatgtg tggattcgca ccgcgagaca 360
ttaaaagctt tcatacggag cgcatttcat ctgcaatcga ggcttggatc gaatattctt 420
acaagctcgg atcggcggac agccgttctt aaacactgtg tgtcgtatag cattgaagcg 480
ggggagcacc actccactgg ggcattgatg cattcggggg tgaacgtatg taacaacatg 540
gaacccgggc ttttgggcca tcggcatccg ccgggaatac taaagagtac tacgaactct 600
acaaatgcct tccttgtgta gctgacccca aagccccagt gacgttgctc tcaaagctta 660
ttacagacca gcaccaccca tccctgcagc cctctgttcc cagctcacct ccactttgtg 720
acctctgtta ctagtcctgg gggatgtggc tagatcccta ctgagatgga gtgtgtgtgc 780
ctgaagcgtg aggaatgatc ccattcgggg gcaactgagc ctgcccacag gaacttgagc 840
ccccgagaca gtggtctcct tcccagtaga ctggcccacg aagactggtg ccatgattac 900
cttcaagatc tggacataag gcaggttgtc tgggccaatc ttgctcccat tcacctcgat 960
gtgctttagc cactggatgt gcggctgcgg gtcactgtac accttacaca tgaactccac 1020
gttgctaccc agggccactg ttttgttggc gggcaaccct gcttgcagga tgggccggtg 1080
aggggaccgc tctgtggaag atgggagagg aggcacttgt catggggacc ttgccatggc 1140
taaagagggg tgggctcacc tgcgccccac ttggctttcc cagtgatggg ttgtaaacct 1200
cccagcactt ctgctgagcc caagcctctc aaaacagagc tggggaaagg gacaccctct 1260
cttcaggccc taagccatca ggatcctcct ccccaaggca gtcatcatat ttacagtcac 1320
agtaagtcgc tcatgcttta atggagaacc ttctaattca gttgcacccc cagacctcag 1380
cacaacctgc tcccccctta aaaactggga cctgaacaac ctgggtgctg ggttcgggaa 1440
tggccagaaa agtatcgtga ccgtccgacc actcatagat caagtcgcct gtctcgtgga 1500
atcaactcca accttagatg ccccgtgcta ctacatgaat gagcaccggc aaaagtgtga 1560
gctcttaaat aaagtgggtc tagcgcctca gcgcgatatc agtgcaaatc aacggttcac 1620
gccaaagggc taggcagtgt actgagccgt gtggcagcca tataggtgaa ccccccgcga 1680
ggagtgcgtv tgccgattaa tccgacatct gtttattgaa tttttgcacg tgattgttaa 1740
aaacacatgg gttcgctgtt agccgatgcc taaacacgct cctggcagga ctcatgcggg 1800
tgcttaactg atgcgcgaag ttacgcaaga cagtctcaag gggcagcatt ggcttatcat 1860
gcgaactgat atcaagtaca atctcttatt tgtgttcact caggcttttt aaccggcgta 1920
agtcctcgat ctttgccctt tgctttagaa tagaaatggg tgcatccgcc tcaactatgg 1980
tgggtctcag caccctggag gagtcgggct gcagggtaaa cccagatccc gggcatgcat 2040
tgcaatggcc agggggagag cagaggcagg tgtacgggtg ggaggcctcc gtgcgcctgc 2100
aaaactaggg aagctcctct ctgagctgag aggattcagc cctcaaagct ggggcaggat 2160
gtggcaccag gcaggcagga gcccattctt ccagctctcc tgcctctgtg tctccccaag 2220
cctggaaatg catgctcccc ccgtgcccgt ggcgagggca ggacatcgag aggagaagtt 2280
acagtgtgta ccttccagaa cggtcaacca tgcagagtga tgggagagtc cgatagagtt 2340
acccgccaag cacgtatact cccctgcgtc ctcaaaggag acatttctta agtgaagcac 2400
ctccatctct ttgtcggtgg tattaactcc agcagtctag aagagacaac ggaagcaaaa 2460
tggacaagca caggacatga gacctctaag agacgcagag caagggaagg agacagaaag 2520
aagggggact agaggaagaa atgctccctg acatcttctt tgcaacaagg aacaaacgaa 2580
aaccaccagg cagcaaaacc tgttagagga agagggtgag accctgaggg aagaactccg 2640
gcagacctga gaagacgatg gctggttacg acccttcacc agatgctggc agccactggc 2700
ccatccgagc atgcgggcgg tgagcggcat ggagaactga aatccggcgg tagtaaggcc 2760
gagttatact gccgagctgg caggattgac gcccttttca tgctagtacc atgatcacca 2820
tgtgccgcat acctttggcg gaatctcgat tggctgaaca tcagattctg actgtataag 2880
cgttgcccaa tattccggga tagtaaggac gcagcaggcg aaccctctgt gataaccgcg 2940
gcggaaatag ggctgaaggt tgacctgcag gataagcatt gaaccactgt gtacgcctaa 3000
ggaggttgtt aaaatcgaca gtggactata ttatgtaccc caattttctt actcacacat 3060
tgatgggagc tgcgaggaat attctgagat tccatgagtc tattcagtcc gggtgcccat 3120
agcttgtcca tcgcacagct ttctaccggc cggtctgaca gaaacggtcg gggcatactt 3180
tccgccctcg tcatcgttcg gtggtcctga atgataatat cttctacgca ccaataccga 3240
agttctgacc acggagcgcc taacgctcta ataacccatc aggcatgttc cacagaggac 3300
ggagcctgca gggagttcav ttcatcaaat aggtttacaa atgccttcct tgtgtagctg 3360
accccaaagc cccagtgacg ttgctctcaa agcttattac agaccagcac cacccatccc 3420
tgcagccctc tgttcccagc tcacctccac tttgtgacct ctgttactag tcctggggga 3480
tgtggctaga tccctactga gatggagtgt gtgtgcctga agcgtgagga atgatcccat 3540
tcgggggcaa ctgagcctgc ccacaggaac ttgagccccc gagacagtgg tctccttccc 3600
agtagactgg cccacgaaga ctggtgccat gattaccttc aagatctgga cataaggcag 3660
gttgtctggg ccaatcttgc tcccattcac ctcgatgtgc tttagccact ggatgtgcgg 3720
ctgcgggtca ctgtacacct tacacatgaa ctccacgttg ctacccaggg ccactgtttt 3780
gttggcgggc aaccctgctt gcaggatggg ccggtgaggg gaccgctctg tggaagatgg 3840
gagaggaggc acttgtcatg gggaccttgc catggctaaa gaggggtggg ctcacctgcg 3900
ccccacttgg ctttcccagt gatgggttgt aaacctccca gcacttctgc tgagcccaag 3960
cctctcaaaa cagagctggg gaaagggaca ccctctcttc aggccctaag ccatcaggat 4020
cctcctcccc aaggcagtca tcatatttac agtcacagta agtcgctcat gctttaatgg 4080
agaaccttct aattcagttg cacccccaga cctcagcaca acctgctgag gcgggagtaa 4140
ataatggacg ggaagtcgtg cccacgtcgc tcacagaata gactttgcgg ggggggtcta 4200
aataacgact ccaccgatta tagtgctcag gtcgttagga ggatgaaggt agcgagatgt 4260
acgtgactca cvtcgatgaa tctctcaatc ggctgaataa tatctgtcgt ggtctatacc 4320
cgcagcccgg ttcgaatcct actttggagc aaggagatca tagtaccgcc gcatgcgcta 4380
tatggaaacc tagactctct ttagatcttg ttaggatatt tctctataat gggctaccgg 4440
gtgctcagta ttctaacgtc gactcgggtc ccagaatcct agccttggcc taacatctct 4500
tcctgcaaca gcctgagcac ggtcggctaa aaccaggtat tattctaccc gctgagattg 4560
tcagtatgtg ccgtagcccg tttccagcgg cggccgatgg gtgtctaaaa gacaggcaaa 4620
ctcaactagc accatatcgg cgcggaacca agttcactct tcataccacc taagggggta 4680
taattgcatg gctattcatt gtggcaaatc ccacgctgat tacttccatg gggacagttc 4740
aaattcatgc tattggctgc acattctgtc caaataggac ttcctcccaa tccatgtccc 4800
aggagtccgg aggacttgca gtgtgatatg gagggtgcag gaaattcacg ggctacacta 4860
gcttgaaaca gactctagag cacttagttc atgatattcc actgtgcctt gcccagaagc 4920
cagaaaataa ggcccaaagc tataaattag ggacaatgga gagggcaggg cattagaggc 4980
ccagagagag aggtggtgct gagtgtgcaa atcccccatc tactttctgt tacctgtctg 5040
cgcagaggga tgctcttggc cagcttgtgc acagccatct ggctgtggaa gtcactcttc 5100
ttggtaccac tcttcatctt gtagacgatg accgacccca ccatgcagga gatgaggaag 5160
gcccctgtgc aatagatgat gatctccagg tacaggggcg aggtcatcac tgccggcctc 5220
tcttccaggg ctgagtcagt gcgaacaggg tgttagcagg cttggagggc cccgtccatg 5280
cgaggtcccg ctccattaga aaagcaacac ctgtctcctg tcccctggga acttttaggg 5340
agaagaacca tggcaagttc tagctaggac tgggattgtg gcactaggag gatcaggcaa 5400
ccccctgatt ttggaggctg ccttcaatgg acttgagcca tggaaaaggg atggcctaga 5460
accatcgtgc tacacaagcc ccatcttcat taattcctga gcctccttgc tcagctggac 5520
tggagaggta gcagtagact catggctttt ttaggagggt agggatgcat gctcatcatg 5580
ggtggggcgg tctaatcaag actctcacag agagcatgcc ccgcaagttt acctgtattt 5640
tggggatatc gtggtcatga cgcaaggacg cgctggctct gcgaagtatg ctgaacacac 5700
ctgaatctaa ccattattct cgcctttgaa gcgcatgacc gagtccgtag cgtattatca 5760
cgtcagaacg aaaggggatc gacccagttc atccaatcgg atcttgacga aattagtaaa 5820
accgctagca ctccgtattc tgagattgct cgagctagca gaaattctgt tagggtgtca 5880
aatcgcactt caattccgtg tataaggggt acggatcccc cggctgacgc tctcgaataa 5940
gacacttgcc agaggcctga gcgctcagca gggagggttt agcgatgcct ttgctggaat 6000
actatgcctg ttgattggta ctaggcttgc gcgcgctgcv aaagcttata ttctgtacta 6060
ttcaatcccg cataaccatg acacaccgtg cagccattcc cgttacatta caatcctcca 6120
aacccgggaa accctggagg agtcgggctg cagggtaaac ccagatcccg ggcatgcatt 6180
gcaatggcca gggggagagc agaggcaggt gtacgggtgg gaggcctccg tgcgcctgca 6240
aaactaggga agctcctctc tgagctgaga ggattcagcc ctcaaagctg gggcaggatg 6300
tggcaccagg caggcaggag cccattcttc cagctctcct gcctctgtgt ctccccaagc 6360
ctggaaatgc atgctccccc cgtgcccgtg gcgagggcag gacatcgaga ggagaagtta 6420
cagtgtgtac cttccagaac ggtcaaccat gcagagtgat gggagagtcc gatagagtta 6480
cccgccaagc acgtatactc ccctgcgtcc tcaaaggaga catttcttaa gtgaagcacc 6540
tccatctctt tgtcggtggt attaactcca gcagtctaga agagacaacg gaagcaaaat 6600
ggacaagcac aggacatgag acctctaaga gacgcagagc aagggaagga gacagaaaga 6660
agggggacta gaggaagaaa tgctccctga catcttcttt gcaacaagga acaaacgaaa 6720
accaccaggc agcaaaacct gttagaggaa gagggtgaga ccctgaggga agaactccgg 6780
cagacctgag aagacgatgg ctggttacga cccttcacca gatgctggca gccactggcc 6840
catccgagca tgcgggcggt gagcggcatg gagaacgcat attgtcgaac cgtagatgta 6900
gaatacgtca ggtgctacgt caaacttgat tcctgccctg gacttvggag agctctagta 6960
gggtgtgttg ctcaacccgc gtgagttttt agggcagtag aagtccagtt gcgaccctcg 7020
caagacagta ctacatatgc actggtgtcg cctttatcct cgctaggatc tgctgagaga 7080
gagggtagtc cctggctccc ttaaacgcgt cacgttgaat caaatcgtca gagtgggtcc 7140
gtcgacagaa gtcccgccgg tattgtaggg gtttcgtccc gatcgatcta taacaggtct 7200
ccagtactct tagaaactcg aagtcgaccc tcccgagcct ctttagatta tcgtccccca 7260
tcgcccgatt aaccgaattt tcatggggaa acagttaagg ggccgagaaa aacagcacaa 7320
aatcatgtcg gtttgtctag agattagact caagcttatc ctgtgcgaaa taaccgagtg 7380
tagtcatgaa ttatccggct caggacagtc tggcatcccc tcctactcca aatccgtcta 7440
actataagga ggcctcagaa gggatgacgg tagtgacaaa tgccttcctt gtgtagctga 7500
ccccaaagcc ccagtgacgt tgctctcaaa gcttattaca gaccagcacc acccatccct 7560
gcagccctct gttcccagct cacctccact ttgtgacctc tgttactagt cctgggggat 7620
gtggctagat ccctactgag atggagtgtg tgtgcctgaa gcgtgaggaa tgatcccatt 7680
cgggggcaac tgagcctgcc cacaggaact tgagcccccg agacagtggt ctccttccca 7740
gtagactggc ccacgaagac tggtgccatg attaccttca agatctggac ataaggcagg 7800
ttgtctgggc caatcttgct cccattcacc tcgatgtgct ttagccactg gatgtgcggc 7860
tgcgggtcac tgtacacctt acacatgaac tccacgttgc tacccagggc cactgttttg 7920
ttggcgggca accctgcttg caggatgggc cggtgagggg accgctctgt ggaagatggg 7980
agaggaggca cttgtcatgg ggaccttgcc atggctaaag aggggtgggc tcacctgcgc 8040
cccacttggc tttcccagtg atgggttgta aacctcccag cacttctgct gagcccaagc 8100
ctctcaaaac agagctgggg aaagggacac cctctcttca ggccctaagc catcaggatc 8160
ctcctcccca aggcagtcat catatttaca gtcacagtaa gtcgctcatg ctttaatgga 8220
gaaccttcta attcagttgc acccccagac ctcagcacaa cctgctcagc ttggcaggac 8280
gagaatgtcc agagtcagtc taaaatggag tatcacctcc tgaaattggc gcagccgcta 8340
ttgcctcggc ccggggatat ctcgtgttgg tgtagcgtac gccaactttt ccgttaaagc 8400
gtccctccac gagaagactg agagtgcgga ataaatgtgg accagcatcc cttacatact 8460
atacagaatg tacaacagct gaagaaagag attactgtgt atggcctaac gtctttgtcg 8520
actaaggcca gcagattagt cgaaatctca gacattgtag ggatttccga aactagtcac 8580
gtcagtagta gvtaacagga tgtctaaaat aggtgggata ctttcgtacc acagtattac 8640
cgcaagctcg ccactggcga tcttgttccg tgtaatttcc gcgctgccac ctgcggtatc 8700
tacggggttt agtcgccgtt gctggaatga tcaactacga cctccgcctg cgtccgagac 8760
gcccccttcc tgtgccattt tgagaacgct tcctttcgac gattaaccgg atagacgcca 8820
cgctatagac ccgaaggtgg ttagatacta gtgcgcatat ggtgcta 8867
<210> 6
<211> 7606
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG2_TP53校准序列
<400> 6
agaccgcttc tcatgacgca tgtgcagggt tacagatgtg tgatatagga tatattcggg 60
ctcgggcaaa ggcctttgga atgtacccag cggcacagtt tatcctagct gaagcgcatc 120
gcagtttccc cgtctataag cgttatggag aagtgacacg ggacgaatgg acgaagtgta 180
agcgcataac caaaattaca cccaatactt tttgcggcga gtcgttgcca atacgacact 240
acacactggg ttcgaatctc actctaacta tcgccttcca aactcactca gtgaacggct 300
gggatcctgc gtctaagcat ttctaatggt cacgcttaac gcgcctcctc agtcctttcg 360
atcgactatg cattgcgttg aacgaatcag gtgaggatac ttacgatacc gcctgcactt 420
gataagttgg gttagtacaa cgtctaagcg ccttgggcaa tgaaggggct ggtttgvacc 480
cagtccccgc gggcactgac gagatttaaa gtcagcagtt aactcgtttc aaggcgtaca 540
cggggagttc gccattcaaa gtcaccttac gcctcagagg actcatgggt atttggttcc 600
atcccaaagt tccaaacaaa agaaatgcag ggggatacgg ccaggcattg aagtctcatg 660
gaagccagcc cctcagggca actgaccgtg caagtcacag acttggctgt cccagaatgc 720
aagaagccca gacggaaacc gtagctgccc tggtaggttt tctgggaagg gacagaagat 780
gacaggggcc aggagggggc tggtgcaggg gccgccggtg taggagctgc tggtgcaggg 840
gccacggggg gagcagcctc tggcattctg ggagcttcat ctggacctgg gtcttcagtg 900
aaccattgtt caatatcgtc cggggacagc atcaaatcat ccattgcttg ggacggcaag 960
ggggactgta gatgggtgaa aagagcagtc agaggaccag gtcctcagcc ccccagcccc 1020
ccagccctcc aggtccccag ccctccaggt ccccagccca acccttgtcc ttaccagaac 1080
gttgttttca ggaagtctga aagacaagag cagaaagtca gtcccatgga attttcgctt 1140
cccacaggtc tctgctaggg ggctggggtt ggggtggggg tggtgggcct gcccttccaa 1200
tggatccact cacagtttcc ataggtctga aaatgtttcc tgactcagag ggggctcgac 1260
gctaggatct gactgcggct cctccatggc agtgacccgg aaggcagtct ggctgctgca 1320
agaggaaaag tggggatcca gcatgagaca cttccaaccc tgggtcacct gggcctgcag 1380
agaaggaacc ccctccccca atctctgatg ggacactgct gacactacat aattccggac 1440
taagacaatc ctccttacag aaaaatttgt tatatgctac acaggtcgct ctgcagagtg 1500
ctactattct ctgagaggac aagggggtta gccaataccc gagtagccgt cctgatgtgc 1560
agtttcgctg acgggcctgt ggatttatat ttcacacgtc tgtatagccg cagtaccaca 1620
tggtactcta atcgatattc aggtcaaggg atgccgttvt taatttccaa cccgttagcc 1680
ggattgagtc ggctcaagtg tctccagggc ccggatgttc ttcgacaaga acgtcgacga 1740
tttcaatcaa gagcccttaa aattgttcca ttgtgagtga tagctcatgg aatggtgcac 1800
ctctcctcaa attgcggcac cttgcatgta ggcccgggct agaggtgacc caactccctc 1860
ctcgttggtc aggcgagagc gaacaagcga tgaccttggg cgtggagcag gcagagctct 1920
ctttaaaccc gccatgacgg gataaggaat catcgacccc cgtaatcagg agcttgtatg 1980
cataataggc gcggaaaact tacccagcca agcaggggag gcccttagcc tctgtaagct 2040
tcagtttttt caactgtgca atagttaaac ccatttactt tgcacatctc atggggttat 2100
agggaggtca aataagcagc aggagaaagc ccccctactg ctcacctgga gggccactga 2160
caaccaccct taacccctcc tcccagagac cccagttgca aaccagacct caggcggctc 2220
atagggcacc accacactat gtcgaaaagt gtttctgtca tccaaatact ccacacgcaa 2280
atttccttcc actcggataa gatgctgagg aggggccaga cctaagagca atcagtgagg 2340
aatcagaggc ctggggaccc tgggcaacca gccctgtcgt ctctccagcc ccagctgctc 2400
accatcgcta tctgagcagc gctcatggtg ggggcagcgc ctcacaacct ccgtcatgtg 2460
ctgtgactgc ttgtagatgg ccatggcgcg gacgcgggtg ccgggcgggg gtgtggaatc 2520
aacccacagc tgcacagggc aggtcttggc cagttggcaa aacatcttgt tgagggcagg 2580
ggagtactgt aggaagagga aggagacaga gttgaaagtc agggcacaag tgaacagata 2640
aagcaactgg aagacggcag caaagaaaca aacatgcgta agcacctcct gcaacccact 2700
agcgagctag agagagttgg cgtctacacc tcaggagctt ttcttttttt tttttttttt 2760
tgagataggg tcttgctctg tcactcaggc tggagcacag tggccccgat gttgatgtct 2820
ttctcaattt acgttttccc ctgaataggc agtttcatta ctactactcg ggtaactaca 2880
gggagtaaag atcgaaattc gttaaatcac cgaatgagac gaagaatccg cttgatatag 2940
ctgaactttt gcattggcat cggggatctt gattgatcgc cgctctcagt ggattgctcc 3000
atctcctggc ggacagatcg cgcgccgacc tcatcgtaat gtacggatgg ggcctcagca 3060
tctgcccaac cccggcccgt gttgccattc tccacgacaa gcagtcaacg gtacgtgcgg 3120
caacgagagt aaccatgtta ttttacaaac tccgtaggaa cttagaatgg atggtgcagc 3180
atgacaagac acaacgggga gattgttatt tacacgggac acgaagttac atgtaagaga 3240
cgtcccgcca cataaccttt tcggcctcac atcaaagacc tggctacgag ggtagagggc 3300
atagcttggc cttgattttc agggcaagcc gggcgatgtg gcttcgcggc agttctagcc 3360
tgagtaataa taggvgttcc gggtacctat taatctccta ccactttttg aaagctggtc 3420
tggtccttta aaatatatat tatggtataa gttggtgttc tgaagttagt tagctacaac 3480
caggagccat tgtctttgag gcatcactgc cccctgatgg caaatgcccc aattgcaggt 3540
aaaacagtca agaagaaaac ggcattttga gtgttagact ggaaactttc cacttgataa 3600
gaggtcccaa gacttagtac ctgaagggtg aaatattctc catccagtgg tttcttcttt 3660
ggctggggag aggagctggt gttgttgggc agtgctagga aagaggcaag gaaaggtgat 3720
aaaagtgaat ctgaggcata actgcaccct tggtctcctc caccgcttct tgtcctgctt 3780
gcttacctcg cttagtgctc cctgggggca gctcgtggtg aggctcccct ttcttgcgga 3840
gattctcttc ctctgtgcgc cggtctctcc caggacaggc acaaacacgc acctcaaagc 3900
tgttccgtcc cagtagatta ccactactca ggataggaaa agagaagcaa gaggcagtaa 3960
ggaaatcagg tcctacctgt cccatttaaa aaaccaggct ccatctactc ccaaccaccc 4020
ttgtcctttc tggagcctaa gctccagctc caggtaggtg gaggagaagc cacaggttaa 4080
gaggtcccaa agccagagaa aagaaaactg agtgggagca gtaaggagat tccccgccgg 4140
ggatgtgatg agaggtggat gggtagtagt atggaagaaa tcggtaagag gtgggcccag 4200
gggtcagagg caagcagagg ctggggcaca gcaggccagt gtgcagggtg gcaagtggct 4260
cctgacctgg agtcttccag tgtgatgatg gtgaggatgg gcctccggtt catgccgccc 4320
atgcaggaac tgttacacat gtagttgtag tggatggtgg tacagtcaga gccaacctag 4380
gagataacac aggcccaaga tgaggccagt gcgccttggg gagacctgtg gcaagcaggg 4440
gaggcctttt tttttttttt ttgagatgga atctcgctct gtcgcccagg ctggagtgca 4500
gtggcgtgat ctcagctcac tgcaagctcc accgcccagg ttcacgccat tctccttcct 4560
cagcctcccg agtagctggg actacaggtg cccagcacca cgcacacata tttcacggga 4620
caggactccc ggcggcactg ggccgccgga tttcgacaag ggcaggtgac agctctggga 4680
gagctgttcc cccccaatct acccacaagc gataggggcg ccaagcgctc gattaacggt 4740
tgatggtaag tccttcttgt acactccaga gatatcctgc gtcgtaggaa tcgagaatac 4800
gctgcatctc tgcctattat tgaaatctct taactccata tgtacggcag ttacgacaat 4860
gtgaaccaca acatggggga ctgtaactat tgactacatg gagcaacttg gatagttttg 4920
agagtgtgtt gatacaagtg cgttcttggt ttcgcgctat atttgcaatg taaatttccg 4980
gtcggttcgt ccaacaatca tactcagcct gacggavaac ggggtaacgt atgatcagct 5040
ctgttctcta gggtcgcgcc acttcgcggc taaggagccg gtattccaga agcagcaata 5100
cacctgagcc gccaccaatc ccattaatgt ctgacaatgt tactatggca cgtgccgcta 5160
ttaggctatg agatccaggg caaattgatt ttcgcgactg cagaatggca aagaagtatc 5220
cacactcgtc cctgggtttg gatgttctgt ggatacactg aggcaagaat gtggttatag 5280
gattcaaccg gaggaagact aaaaaaatgt ctgtgcaggg ctgggaccca atgagatggg 5340
gtcagctgcc tttgaccatg aaggcaggat gagaatggaa tcctatggct ttccaaccta 5400
ggaaggcagg ggagtagggc caggaagggg ctgaggtcac tcacctggag tgagccctgc 5460
tcccccctgg ctccttccca gcctgggcat ccttgagttc caaggcctca ttcagctctc 5520
ggaacatctc gaagcgctca cgcccacgga tctgcagcaa cagaggaggg ggagaagtaa 5580
gtatatacac agtacctgag ttaaaagatg gttcaagtta caattgtttg actttatgac 5640
ggtacaaaag caacatgcat ttagtagaaa ctgcacttca agtacctata cagctgactt 5700
ttaaaaatat ttatttattt attttgagat ggggtctcac tctgttgccc aggcgggagt 5760
gcaatggtgc aatcttggct gattgcaatc tccgcctctg gggtggggtc tgagtaagag 5820
ccaaattcca gtcggcttcc aatggtttct ccccctgaat taccggtcaa gttgatgacg 5880
aagggctatg ccactttggt cgtgccgggt aagcagcccc ttcaatgtta gcccacccca 5940
ttatcataat tcgatcgaag cttgggctgt atgatgtaat cacgataaca tttggctcgt 6000
gatgatgatt ctagtctcct aagaggccga cacagcaccc tagctatcga tcactggttt 6060
attatgttct tctaatactt atacgtgcgc accttaaaca atagccgagc gtggtcccac 6120
cccttgtcat gcgtaacagg cggtcaggga ccaagagtcv taggcttcaa aggcgcgttc 6180
cgtggattcc acaaggcttc tcaatctcaa acagaaatac gacatgacct tgagctaact 6240
agttgaagaa tgtagtgggc gtcctattgt gcgctatcac agctgcatta tgcaagttca 6300
caggcatact cgatcgtcgg cggaggctag cagagtcgga tgcgacgccc catagtagac 6360
gagaccggtg cggtagagga tatgcgccgc ttactatgat agcaacccaa acatccctca 6420
cagtaaaaac cttaaaatct aagctggtat gtcctactcc ccatcctcct ccccacaaca 6480
aaacaccagt gcaggccaac ttgttcagtg gagccccggg acaaagcaaa tggaagtcct 6540
gggtgcttct gacgcacacc tattgcaagc aagggttcaa agacccaaaa cccaaaatgg 6600
caggggaggg agagatgggg gtgggaggct gtcagtgggg aacaagaagt ggagaatgtc 6660
agtctgagtc aggcccttct gtcttgaaca tgagtttttt atggcgggag gtagactgac 6720
cctttttgga cttcaggtgg ctgtaggaga cagaagcagg gaggagagat gacatcacat 6780
gagtgagagg gtctgtgccc cttttccctg accaatgctt tgaagggcct aaggctggga 6840
caacgggaat tcaaatcaag atggtggcca caccccatgc aaatatgttt actgagcacc 6900
tcagagtatt agtgtgtatt agtctcgtaa tcttccctta ccccatttta ctttatttat 6960
cttttttgag acggagtttc actcttgttg cccaggctgg agtgtggttt agtgccggta 7020
tcacgtcaca taataatact ggtggagttt catagatccg tggacgacca tcaattattg 7080
gatttctacc gaggaggtag accaccatag actgtctata ccatatcgtt agtcgtatta 7140
gcgaaaacca ctagaggcgc gctgcccgtc cctggtacct cacatcccgg gavtagctta 7200
gcgtcttaag gcaaaagacg tcgccacccc cttagttggt atttgaccca taggatttat 7260
cgagaagttt cgccggcggt gaaaccctcg cgacttgtcg cttcgcgttt ttagcacagt 7320
aacgaaggca gcttactcac agtcatgaaa gtacagggtg gggtggtgaa cagtgccacc 7380
cctgttgtac agacacgagt attaaggcag tccgtgtaat cccaggaatt atgcgaagtc 7440
ttcaactcgt tgcctgtgct cgtacttaag acacccctga acgtagccag catcgccgta 7500
tgactgctta ccggacgtgt tagtcatctc aactaacctg gagaaagtcc tgtggtgagg 7560
cctaaagcct catggagcgg acaacacaca cttattgttg gtggga 7606
<210> 7
<211> 13455
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG3_16S校准序列
<400> 7
caacatgaga tcctaggcac taataaccgg ctcatctggc taggagcatc ttttgcgtag 60
aacagagctt gagacggaca taagcagggt cgccgctgtt gtaccggttc agtgtgtgat 120
cttttgctgc taaatacttg agcagctttt tcttcacacc accccttggt atcatattaa 180
caagttaacg ctagggctcg ctcgtgttga cggvcaaaca ttgacactgc ggacaatcgc 240
aatgcccctt gctgtaagcg ttttagatca aagttcgaga gacggcttgt gatcaggctt 300
gcaccggtcg ttagtaatca tatgggtcca gtcgagccgc ttaatagctg gctaacatcc 360
tccgctattg catcggtctc cgcataaacg aaaatacgca ctacatcaga gtctagcgtc 420
ctcgcgacct ggttgagagc ggaaccctgt ctgagggctt atgatgaatc gatgttaccc 480
gggcggcaac ttacgcatgg cgcacaccat taaaatagat tcagccgggg ttagtcccac 540
aatggatgga cggctgagta taccattacg caaggcttac caacggaaac cgtgggcttt 600
aaactgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa 660
gtcgagcgga tgaagggagc ttgctcctgg attcagcggc ggacgggtga gtaatgccta 720
ggaatctgcc tggtagtggg ggataacgtc cggaaacggg cgctaatacc gcatacgtcc 780
tgagggagaa agtgggggat cttcggacct cacgctatca gatgagccta ggtcggatta 840
gctagttggt ggggtaaagg cctaccaagg cgacgatccg taactggtct gagaggatga 900
tcagtcacac tggaactgag acacggtcca gactcctacg ggaggcagca gtggggaata 960
ttggacaatg ggcgaaagcc tgatccagcc atgccgcgtg tgtgaagaag gtcttcggat 1020
tgtaaagcac tttaagttgg gaggaagggc agtaagttaa taccttgctg ttttgacgtt 1080
accaacagaa taagcaccgg ctaacttcgt gccagcagcc gcggtaatac gaagggtgca 1140
agcgttaatc ggaattactg ggcgtaaagc gcgcgtaggt ggttcagcaa gttggatgtg 1200
aaatccccgg gctcaacctg ggaactgcat ccaaaactac tgagctagag tacggtagag 1260
ggtggtggaa tttcctgtgt agcggtgaaa tgcgtagata taggaaggaa caccagtggc 1320
gaaggcgacc acctggactg atactgacac tgaggtgcga aagcgtgggg agcaaacagg 1380
attagatacc ctggtagtcc acgccgtaaa cgatgtcgac tagccgttgg gatccttgag 1440
atcatagtgg cgcagctaac gcgataagtc gaccgcctgg ggagtacggc cgcaaggtta 1500
aaactcaaat gaattgacgg gggcccgcac aagcggtgga gcatgtggtt taattcgaag 1560
caacgcgaag aaccttacct ggccttgaca tgctgagaac tttccagaga tggattggtg 1620
ccttcgggaa ctcagacaca ggtgctgcat ggctgtcgtc agctcgtgtc gtgagatgtt 1680
gggttaagtc ccgtaacgag cgcaaccctt gtccttagtt accagcacct cgggtgggca 1740
ctctaaggag actgccggtg acaaaccgga ggaaggtggg gatgacgtca agtcatcatg 1800
gcccttacgg ccagggctac acacgtgcta caatggtcgg tacaaagggt tgccaagccg 1860
cgaggtggag ctaatcccat aaaaccgatc gtagtccgga tcgcagtctg caactcgact 1920
gcgtgaagtc ggaatcgcta gtaatcgtga atcagaatgt cacggtgaat acgttcccgg 1980
gccttgtaca caccgcccgt cacaccatgg gagtgggttg ctccagaagt agctagtcta 2040
accgcaaggg ggacggttac cacggagtga ttcatgactg gggtgaagtc gtaacaaggt 2100
agccgtaggg gaacctgcgg ctggatcacc tccttaagcg agcataaaca aacgacctga 2160
actgagctga ttctattctc gtgaaaatga attgcgcctt ttgttgcaca aagggccgga 2220
gacccagtca cgttagcggc tgtcttttaa acagaattcc tctcgcvcac ctcccgcttg 2280
ttgtgcgcct tgtcacgtgg acaatacctg cggccatcag tttaaagaag ctctctgtgt 2340
gtagtcgctt cctgtcatgc agccagtttg ttctgcgccc ctggcatagt taatatccct 2400
gaggaagcct caatcggaat ccctctctgg cggccctctt gaccgtccag ggtagggggt 2460
atggagagag ttgcacccct ggaaagaacc ttgacattga cttgaatacc ctacgaacag 2520
atcggctcac ttggatgcag ctctcttggc ttgagcaact gtggtcacac aagagaccgc 2580
gtcaacacag caagggccgc acgaaatgct ggcggtgggt aatgggtgtt tttaacaccc 2640
aattatggca atatctcata gacattgagt acaatagcgc aggcaggcct gaattcggag 2700
aacaaaggtg ctcattttca gaaaatttga atgattgaaa cttgaattga agagtttgat 2760
catggctcag attgaacgct ggcggcaggc ttaacacatg caagtcgaac ggtagcagga 2820
gaaagcttgc tttcttgctg acgagtggcg gacgggtgag taatgcttgg gaatctggct 2880
tatggagggg gataacgacg ggaaactgtc gctaataccg cgtattatcg gaagatgaaa 2940
gtgcgggact gagaggccgc atgccatagg atgagcccaa gtgggattag gtagttggtg 3000
gggtaaatgc ctaccaagcc tgcgatctct agctggtctg agaggatgac cagccacact 3060
ggaactgaga cacggtccag actcctacgg gaggcagcag tggggaatat tgcgcaatgg 3120
ggggaaccct gacgcagcca tgccgcgtga atgaagaagg ccttcgggtt gtaaagttct 3180
ttcggtattg aggaaggttg atgtgttaat agtacatcaa attgacgtta aatacagaag 3240
aagcaccggc taactccgtg ccagcagccg cggtaatacg gagggtgcga gcgttaatcg 3300
gaataactgg gcgtaaaggg cacgcaggcg gttatttaag tgaggtgtga aagccctggg 3360
cttaacctag gaattgcatt tcagactggg taactagagt actttaggga ggggtagaat 3420
tccacgtgta gcggtgaaat gcgtagagat gtggaggaat accgaaggcg aaggcagccc 3480
cttgggaatg tactgacgct catgtgcgaa agcgtgggga gcaaacagga ttagataccc 3540
tggtagtcca cgctgtaaac gctgtcgatt tggggattgg gcttagagct tggtgcccgt 3600
agctaacgtg ataaatcgac cgcctgggga gtacggccgc aaggttaaaa ctcaaatgaa 3660
ttgacggggg cccgcacaag cggtggagca tgtggtttaa ttcgatgcaa cgcgaagaac 3720
cttacctact cttgacatcc taagacgagc tcagagatga gcttgtgcct tcgggaactt 3780
agagacaggt gctgcatggc tgtcgtcagc tcgtgttgtg aaatgttggg ttaagtcccg 3840
caacgagcgc aacccttatc ctttgttgcc agcgacttgg tcgggaactc aaaggagact 3900
gccagtgata aactggagga aggtggggat gacgtcaagt catcatggcc cttacgagta 3960
gggctacaca cgtgctacaa tggcgtatac agagggaagc gaagctgcga ggtggagcga 4020
atctcataaa gtacgtctaa gtccggattg gagtctgcaa ctcgactcca tgaagtcgga 4080
atcgctagta atcgcgaatc agaatgtcgc ggtgaatacg ttcccgggcc ttgtacacac 4140
cgcccgtcac accatgggag tgggttgtac cagaagtaga tagcttaacc ttttggaggg 4200
cgtttaccac ggtatgattc atgactgggg tgaagtcgta acaaggtaac cgtaggggaa 4260
cctgcggttg gatcacctcc ttactgaaaa ggtacgatcg tataccatcc tgctggtaca 4320
cgagccaaac atcttatcgc tacgtttgac tttggtcgct tagtatgggc accagcacac 4380
tttggcaact atccaattgg acgagccacg tgcttgggac cgcccgtgga gcgtggagag 4440
ctaatattgc cgagcttgag gaattcaagt gatgtagagg ggacaagaat agtgctggca 4500
tattccaaag aaggagtggt taatgacggg gtcgagctag cacttctgcc gtctgactcg 4560
attcgaattg tgtcgcaaac atacgtctac tttaatactg tgcaccgcga tccaggagac 4620
cgavgcttca agggatgctg agtgccgaac gtccgttagt gtacctttac ggctgagcca 4680
ctctaacaat gcaccggacg cgtttcatat taatcgcctt tctgtaggtt taaaactcgg 4740
atagcttcca gcaatcaaat acgctaggcc tggcttgacc aatgtgcgcc gtcctggtgt 4800
gcccgttcaa tacgggggat tagacgacat gccgtagttc catccagctc tcaatagcta 4860
gattccccat gccaacccct tacattaaaa ctgaagagtt tgatcatggc tcagattgaa 4920
cgctggcggc aggcctaaca catgcaagtc gagcggatga agggagcttg ctcctggatt 4980
cagcggcgga cgggtgagta atgcctagga atctgcctgg tagtggggga taacgtccgg 5040
aaacgggcgc taataccgca tacgtcctga gggagaaagt gggggatctt cggacctcac 5100
gctatcagat gagcctaggt cggattagct agttggtggg gtaaaggcct accaaggcga 5160
cgatccgtaa ctggtctgag aggatgatca gtcacactgg aactgagaca cggtccagac 5220
tcctacggga ggcagcagtg gggaatattg gacaatgggc gaaagcctga tccagccatg 5280
ccgcgtgtgt gaagaaggtc ttcggattgt aaagcacttt aagttgggag gaagggcagt 5340
aagttaatac cttgctgttt tgacgttacc aacagaataa gcaccggcta acttcgtgcc 5400
agcagccgcg gtaatacgaa gggtgcaagc gttaatcgga attactgggc gtaaagcgcg 5460
cgtaggtggt tcagcaagtt ggatgtgaaa tccccgggct caacctggga actgcatcca 5520
aaactactga gctagagtac ggtagagggt ggtggaattt cctgtgtagc ggtgaaatgc 5580
gtagatatag gaaggaacac cagtggcgaa ggcgaccacc tggactgata ctgacactga 5640
ggtgcgaaag cgtggggagc aaacaggatt agataccctg gtagtccacg ccgtaaacga 5700
tgtcgactag ccgttgggat ccttgagatc atagtggcgc agctaacgcg ataagtcgac 5760
cgcctgggga gtacggccgc aaggttaaaa ctcaaatgaa ttgacggggg cccgcacaag 5820
cggtggagca tgtggtttaa ttcgaagcaa cgcgaagaac cttacctggc cttgacatgc 5880
tgagaacttt ccagagatgg attggtgcct tcgggaactc agacacaggt gctgcatggc 5940
tgtcgtcagc tcgtgtcgtg agatgttggg ttaagtcccg taacgagcgc aacccttgtc 6000
cttagttacc agcacctcgg gtgggcactc taaggagact gccggtgaca aaccggagga 6060
aggtggggat gacgtcaagt catcatggcc cttacggcca gggctacaca cgtgctacaa 6120
tggtcggtac aaagggttgc caagccgcga ggtggagcta atcccataaa accgatcgta 6180
gtccggatcg cagtctgcaa ctcgactgcg tgaagtcgga atcgctagta atcgtgaatc 6240
agaatgtcac ggtgaatacg ttcccgggcc ttgtacacac cgcccgtcac accatgggag 6300
tgggttgctc cagaagtagc tagtctaacc gcaaggggga cggttaccac ggagtgattc 6360
atgactgggg tgaagtcgta acaaggtagc cgtaggggaa cctgcggctg gatcacctcc 6420
ttaatattga gcctggtatg caagggtgag ccctcgaccc acatgactta tcatctcata 6480
gtctccaact ctcatagggt aaacccgtac aatggaacaa cggtgtgttt tctaatatgt 6540
ataccctcag caatagtaat ttagggacat agaaccaggg aaaatcgtat ggagatacat 6600
gtcgacccat attagaggta cccttgagat ttagggcagg catgccgccg gggacggcac 6660
ttacctgcga cgtttcgagc taagcgccat cgcctgatat taataaccgg ccggatgggc 6720
gtttcaaacc agagagtttg ctatgcacta atgcggccvg ccggtgaatg attgtagatc 6780
cccgtaacag gcagcgcccg ataggaatta cggcggatcc aacccggttt acaagttcat 6840
cggaattgta catgtaaact ccccgctacc gtattgtccc gtccgacaat ttctcgtctg 6900
cactccactt tgatggttgg tcaacgtcca taggtgcaac gcacccagag ggcgtcacgt 6960
tagctacgcg ggcggttgtg cgtaggtatg gtgattatgt acatcctgat cagtcatgta 7020
ttccaaaatt gaagagtttg atcatggctc agattgaacg ctggcggcag gcctaacaca 7080
tgcaagtcga acggtaacag gaaacagctt gctgtttcgc tgacgagtgg cggacgggtg 7140
agtaatgtct gggaaactgc ctgatggagg gggataacta ctggaaacgg tagctaatac 7200
cgcataacgt cgcaagacca aagaggggga ccttcgggcc tcttgccatc agatgtgccc 7260
agatgggatt agctagtagg tggggtaacg gctcacctag gcgacgatcc ctagctggtc 7320
tgagaggatg accagccaca ctggaactga gacacggtcc agactcctac gggaggcagc 7380
agtggggaat attgcacaat gggcgcaagc ctgatgcagc catgccgcgt gtatgaagaa 7440
ggccttcggg ttgtaaagta ctttcagcgg ggaggaaggg agtaaagtta atacctttgc 7500
tcattgacgt tacccgcaga agaagcaccg gctaactccg tgccagcagc cgcggtaata 7560
cggagggtgc aagcgttaat cggaattact gggcgtaaag cgcacgcagg cggtttgtta 7620
agtcagatgt gaaatccccg ggctcaacct gggaactgca tctgatactg gcaagcttga 7680
gtctcgtaga ggggggtaga attccaggtg tagcggtgaa atgcgtagag atctggagga 7740
ataccggtgg cgaaggcggc cccctggacg aagactgacg ctcaggtgcg aaagcgtggg 7800
gagcaaacag gattagatac cctggtagtc cacgccgtaa acgatgtcga cttggaggtt 7860
gtgcccttga ggcgtggctt ccggagctaa cgcgttaagt cgaccgcctg gggagtacgg 7920
ccgcaaggtt aaaactcaaa tgaattgacg ggggcccgca caagcggtgg agcatgtggt 7980
ttaattcgat gcaacgcgaa gaaccttacc tggtcttgac atccacggaa gttttcagag 8040
atgagaatgt gccttcggga accgtgagac aggtgctgca tggctgtcgt cagctcgtgt 8100
tgtgaaatgt tgggttaagt cccgcaacga gcgcaaccct tatcctttgt tgccagcggt 8160
ccggccggga actcaaagga gactgccagt gataaactgg aggaaggtgg ggatgacgtc 8220
aagtcatcat ggcccttacg accagggcta cacacgtgct acaatggcgc atacaaagag 8280
aagcgacctc gcgagagcaa gcggacctca taaagtgcgt cgtagtccgg attggagtct 8340
gcaactcgac tccatgaagt cggaatcgct agtaatcgtg gatcagaatg ccacggtgaa 8400
tacgttcccg ggccttgtac acaccgcccg tcacaccatg ggagtgggtt gcaaaagaag 8460
taggtagctt aaccttcggg agggcgctta ccactttgtg attcatgact ggggtgaagt 8520
cgtaacaagg taaccgtagg ggaacctgcg gttggatcac ctccttatac cgtagcaccc 8580
ccctcaacat tacggcagaa ttcgaccaca caaggctatt ttacatgaac tcatttggat 8640
atggtcgvca gttattgtct atcgcaaagg tcacgaggaa gttgtccgat gcgcaaagcg 8700
ctttattcgg cccgccccta gagtcgctcc tggccaaaaa gatggcttaa ggacacatgt 8760
cacaaacggc aatttgacag cgtcgaaacc attcagattt ccttaggacc taacccggtc 8820
gatcgccatg attttaacca acgcgctttc caatgaccgt gactaaggtg agaggccctg 8880
aggatagcgt ctcggcagcc tccgtttgtg gacagcgcca caacatgtca tgctgtggtg 8940
tctgagttta ttaagtgtca gtatttagtc gcgcagcggc cttgctgagt gaactagagg 9000
agtaccatca ccttaccgac tttagtgagc ccgtgaactt tcagaacgcc tgtttgtgtg 9060
tcggatcgtt gtcaaacgac tcaaaggggc gtagtcgctg tccttcggca caaaaaggtg 9120
gcattggaaa aatgtccccg cggccattag gtgtagtgta atagattaaa cttgaattga 9180
agagtttgat catggctcag attgaacgct ggcggcaggc ttaacacatg caagtcgaac 9240
ggtagcagga gaaagcttgc tttcttgctg acgagtggcg gacgggtgag taatgcttgg 9300
gaatctggct tatggagggg gataacgacg ggaaactgtc gctaataccg cgtattatcg 9360
gaagatgaaa gtgcgggact gagaggccgc atgccatagg atgagcccaa gtgggattag 9420
gtagttggtg gggtaaatgc ctaccaagcc tgcgatctct agctggtctg agaggatgac 9480
cagccacact ggaactgaga cacggtccag actcctacgg gaggcagcag tggggaatat 9540
tgcgcaatgg ggggaaccct gacgcagcca tgccgcgtga atgaagaagg ccttcgggtt 9600
gtaaagttct ttcggtattg aggaaggttg atgtgttaat agtacatcaa attgacgtta 9660
aatacagaag aagcaccggc taactccgtg ccagcagccg cggtaatacg gagggtgcga 9720
gcgttaatcg gaataactgg gcgtaaaggg cacgcaggcg gttatttaag tgaggtgtga 9780
aagccctggg cttaacctag gaattgcatt tcagactggg taactagagt actttaggga 9840
ggggtagaat tccacgtgta gcggtgaaat gcgtagagat gtggaggaat accgaaggcg 9900
aaggcagccc cttgggaatg tactgacgct catgtgcgaa agcgtgggga gcaaacagga 9960
ttagataccc tggtagtcca cgctgtaaac gctgtcgatt tggggattgg gcttagagct 10020
tggtgcccgt agctaacgtg ataaatcgac cgcctgggga gtacggccgc aaggttaaaa 10080
ctcaaatgaa ttgacggggg cccgcacaag cggtggagca tgtggtttaa ttcgatgcaa 10140
cgcgaagaac cttacctact cttgacatcc taagacgagc tcagagatga gcttgtgcct 10200
tcgggaactt agagacaggt gctgcatggc tgtcgtcagc tcgtgttgtg aaatgttggg 10260
ttaagtcccg caacgagcgc aacccttatc ctttgttgcc agcgacttgg tcgggaactc 10320
aaaggagact gccagtgata aactggagga aggtggggat gacgtcaagt catcatggcc 10380
cttacgagta gggctacaca cgtgctacaa tggcgtatac agagggaagc gaagctgcga 10440
ggtggagcga atctcataaa gtacgtctaa gtccggattg gagtctgcaa ctcgactcca 10500
tgaagtcgga atcgctagta atcgcgaatc agaatgtcgc ggtgaatacg ttcccgggcc 10560
ttgtacacac cgcccgtcac accatgggag tgggttgtac cagaagtaga tagcttaacc 10620
ttttggaggg cgtttaccac ggtatgattc atgactgggg tgaagtcgta acaaggtaac 10680
cgtaggggaa cctgcggttg gatcacctcc ttactgatta tgttcgccga actgtgagtt 10740
tcctgtccgt acacggtagc gtgacatcgt ccagtttgtg ctgaattaga aagagctcac 10800
cgactgtcaa gggatgacgc atcgggtcct gcagacccgc tttggatcta tcttcagata 10860
ataatgacac taatggccac gtgtcctctc cgtactgcat tgttctgaac cgacttgact 10920
ttgctacatc cgggagtgtg gaaggatcca acgtaagcta atggtagaca cacaggtacg 10980
aataagtcgc gctactattc tgtctttttc tcctatacag aaaaaatcaa ggcgcacaaa 11040
atgcggaagc gagccgtgcg taggactcat ggtagacgag cattcatcta gatcagtttg 11100
tctgtagcat tgccgagcat tagcgcattg agttagcgcc cttgggtcca gtctagccta 11160
tccaccaact gagcacgaaa ggacgcgtcg ggctggggtg acgtgatcgc tgccgtvagc 11220
gaatctgaaa cccgtcggag ttagtccgat cgtcacagga catcccacca gtagggtccc 11280
ccaatatcct aaattcggat agttatggtt atccaccaaa ctgaagagtt tgatcatggc 11340
tcagattgaa cgctggcggc aggcctaaca catgcaagtc gagcggatga agggagcttg 11400
ctcctggatt cagcggcgga cgggtgagta atgcctagga atctgcctgg tagtggggga 11460
taacgtccgg aaacgggcgc taataccgca tacgtcctga gggagaaagt gggggatctt 11520
cggacctcac gctatcagat gagcctaggt cggattagct agttggtggg gtaaaggcct 11580
accaaggcga cgatccgtaa ctggtctgag aggatgatca gtcacactgg aactgagaca 11640
cggtccagac tcctacggga ggcagcagtg gggaatattg gacaatgggc gaaagcctga 11700
tccagccatg ccgcgtgtgt gaagaaggtc ttcggattgt aaagcacttt aagttgggag 11760
gaagggcagt aagttaatac cttgctgttt tgacgttacc aacagaataa gcaccggcta 11820
acttcgtgcc agcagccgcg gtaatacgaa gggtgcaagc gttaatcgga attactgggc 11880
gtaaagcgcg cgtaggtggt tcagcaagtt ggatgtgaaa tccccgggct caacctggga 11940
actgcatcca aaactactga gctagagtac ggtagagggt ggtggaattt cctgtgtagc 12000
ggtgaaatgc gtagatatag gaaggaacac cagtggcgaa ggcgaccacc tggactgata 12060
ctgacactga ggtgcgaaag cgtggggagc aaacaggatt agataccctg gtagtccacg 12120
ccgtaaacga tgtcgactag ccgttgggat ccttgagatc atagtggcgc agctaacgcg 12180
ataagtcgac cgcctgggga gtacggccgc aaggttaaaa ctcaaatgaa ttgacggggg 12240
cccgcacaag cggtggagca tgtggtttaa ttcgaagcaa cgcgaagaac cttacctggc 12300
cttgacatgc tgagaacttt ccagagatgg attggtgcct tcgggaactc agacacaggt 12360
gctgcatggc tgtcgtcagc tcgtgtcgtg agatgttggg ttaagtcccg taacgagcgc 12420
aacccttgtc cttagttacc agcacctcgg gtgggcactc taaggagact gccggtgaca 12480
aaccggagga aggtggggat gacgtcaagt catcatggcc cttacggcca gggctacaca 12540
cgtgctacaa tggtcggtac aaagggttgc caagccgcga ggtggagcta atcccataaa 12600
accgatcgta gtccggatcg cagtctgcaa ctcgactgcg tgaagtcgga atcgctagta 12660
atcgtgaatc agaatgtcac ggtgaatacg ttcccgggcc ttgtacacac cgcccgtcac 12720
accatgggag tgggttgctc cagaagtagc tagtctaacc gcaaggggga cggttaccac 12780
ggagtgattc atgactgggg tgaagtcgta acaaggtagc cgtaggggaa cctgcggctg 12840
gatcacctcc ttaaatcgcc ggcgcccatc aaattgggca atacgtccag gcgacggagt 12900
ctccaatggc gcaagcgtgc gtatggtctg gctatagctt gagagtattt tgtgaaccct 12960
tgggagtgga ctttcagtgc taagtactga aggtatcttg accagggtag caccgttgct 13020
attccgctga ccccaaatgc cagctataaa tgtttaaaaa aatcccagtt atgctgcggt 13080
cagcacccct gccgtccgct caagctgcag ctcaccaggc tatagtacag tcgtccaggg 13140
acaacctatt ctgtacagag aagtgtgaat tcccaatgta cagagtaagc cctggtgtac 13200
gagtgagtgt acggtggctv aagtggtttt acttatgtgt cgatattgcc aggatgggga 13260
cccaaacgac tacattgatc acacctcttt aagcaagggg gtttgagagg tgtctgcggg 13320
tttctcgcca atcctacacg tactcatata taattgcgac ttatgcgcac gcaaaggatt 13380
ttagcctcaa gtgaactcgc tatgcggtga aagacccgtg tcttggacca cacctacacc 13440
cctccaatca tcgaa 13455
<210> 8
<211> 7685
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG4_BRAF校准序列
<400> 8
atcgccggcg cccatcaaat tgggcaatac gtccaggcga cggagtctcc aatggcgcaa 60
gcgtgcgtat ggtctggcta tagcttgaga gtattttgtg aacccttggg agtggacttt 120
cagtgctaag tactgaaggt atcttgacca gggtagcacc gttgctattc cgctgacccc 180
aaatgccagc tataaatgtt taaaaaaatc ccagttatgc tgcggtcagc acccctgccg 240
tccgctcaag ctgcagctca ccaggctata gtacagtcgt ccagggacaa cctattctgt 300
acagagaagt gtgaattccc aatgtacaga gtaagccctg gtgtacgagt gagtgtacgg 360
tggctvaagt ggttttactt atgtgtcgat attgccagga tggggaccca aacgactaca 420
ttgatcacac ctctttaagc aagggggttt gagaggtgtc tgcgggtttc tcgccaatcc 480
tacacgtact catatataat tgcgacttat gcgcacgcaa aggattttag cctcaagtga 540
actcgctatg cggtgaaaga cccgtgtctt ggaccacacc tacacccctc caatcatcga 600
aatttaggct taaataagat tgcgaaacag cttctctgtt aaaaggagta gttctcttag 660
caaaaccata ataatggctg tggatcacac ctgccttaaa ttgcatacct gttttttttt 720
tcaacagggt acacagaaca ttttgaacac aaaatacttt aaacaattta gaataaaata 780
tgaaacactg tttataagac atatattttt gtttgaaata cactgaaact ggtttcaaaa 840
tattcgtttt aagggttcat atttatttaa gaataaaata tgaaacactg tttataagac 900
atatattttt gtttgaaata cactgaaact ggtttcaaaa tattcgtttt aagggtaaag 960
aaaaaagtta aaaaatctat ttacataaaa aataagaaca ctgatttttg tgaatactgg 1020
gaactatgaa aatactatag ttgagacctt caatgacttt ctagtaactc agcagcatct 1080
cagggccaaa aatttaatca gtggaaaaat agcctcaatt cttaccatcc acaaaatgga 1140
tccagacaac tgttcaaact gatgggaccc actccatcga gatttcactg tagctagacc 1200
aaaatcacct atttttactg tgaggtcttc atgaagaaat atatctgagg tgtagtaagt 1260
aaaggaaaac agtagatctc attttcctat cagagcaagc attatgaaga gtttaggtaa 1320
gagatctaat ttctataatt ctgtaatata atattcttta aaacatagta cttcatcttt 1380
cctcttagag tcaataagta tgtctaaaac aatgattagt tctatttagc ctatataacc 1440
tgcttttaag atttttgggg cttgaaatgt gttaggatga ggtgagatgc tttcctaagt 1500
ttataggaga acctaaaact ttcccattag attttagcaa tgtaggccca gatattctct 1560
tggcactcct gggcgagcag taaaggctcc tcattggaat gaagatgctg cagatagtat 1620
cttagtctgc acttagggaa gagaaatatt atgtttttct cacctcattg ttatataatt 1680
tagagtcttc agttatatct caactaccac tgagcaaggt cagaggtctg aaagggacta 1740
atagatagct acaaaactat cagttttata gatcgccggc gcccatcaaa ttgggcaata 1800
cgtccaggcg acggagtctc caatggcgca agcgtgcgta tggtctggct atagcttgag 1860
agtattttgt gaacccttgg gagtggactt tcagtgctaa gtactgaagg tatcttgacc 1920
agggtagcac cgttgctatt ccgctgaccc caaatgccag ctataaatgt ttaaaaaaat 1980
cccagttatg ctgcggtcag cacccctgcc gtccgctcaa gctgcagctc accaggctat 2040
agtacagtcg tccagggaca acctattctg tacagagaag tgtgaattcc caatgtacag 2100
agtaagccct ggtgtacgag tgagtgtacg gtggctvaag tggttttact tatgtgtcga 2160
tattgccagg atggggaccc aaacgactac attgatcaca cctctttaag caagggggtt 2220
tgagaggtgt ctgcgggttt ctcgccaatc ctacacgtac tcatatataa ttgcgactta 2280
tgcgcacgca aaggatttta gcctcaagtg aactcgctat gcggtgaaag acccgtgtct 2340
tggaccacac ctacacccct ccaatcatcg aaatttaggc ttaaataaga ttgcgaaaca 2400
gcttctctgt taaaaggagt agttctctta gcaaaaccat aataatggct gtggatcaca 2460
cctgccttaa attgcatacc tgtttttttt ttcaacaggg tacacagaac attttgaaca 2520
caaaatactt taaacaattt agaataaaat atgaaacact gtttataaga catatatttt 2580
tgtttgaaat acactgaaac tggtttcaaa atattcgttt taagggttca tatttattta 2640
agaataaaat atgaaacact gtttataaga catatatttt tgtttgaaat acactgaaac 2700
tggtttcaaa atattcgttt taagggtaaa gaaaaaagtt aaaaaatcta tttacataaa 2760
aaataagaac actgattttt gtgaatactg ggaactatga aaatactata gttgagacct 2820
tcaatgactt tctagtaact cagcagcatc tcagggccaa aaatttaatc agtggaaaaa 2880
tagcctcaat tcttaccatc cacaaaatgg atccagacaa ctgttcaaac tgatgggacc 2940
cactccatcg agatttcact gtagctagac caaaatcacc tatttttact gtgaggtctt 3000
catgaagaaa tatatctgag gtgtagtaag taaaggaaaa cagtagatct cattttccta 3060
tcagagcaag cattatgaag agtttaggta agagatctaa tttctataat tctgtaatat 3120
aatattcttt aaaacatagt acttcatctt tcctcttaga gtcaataagt atgtctaaaa 3180
caatgattag ttctatttag cctatataac ctgcttttaa gatttttggg gcttgaaatg 3240
tgttaggatg aggtgagatg ctttcctaag tttataggag aacctaaaac tttcccatta 3300
gattttagca atgtaggccc agatattctc ttggcactcc tgggcgagca gtaaaggctc 3360
ctcattggaa tgaagatgct gcagatagta tcttagtctg cacttaggga agagaaatat 3420
tatgtttttc tcacctcatt gttatataat ttagagtctt cagttatatc tcaactacca 3480
ctgagcaagg tcagaggtct gaaagggact aatagatagc tacaaaacta tcagttttat 3540
agacgaagac aattcgatga agatgactac attgtcccat atgatcttcg cgcgaccaga 3600
gtacggtaga caacgacatt gctccttaat tggtcacgga tggaccacta taccctcact 3660
tagcttacgt agggtacgct gctctctcac gcgctaatat tcgtgattac actgttggtc 3720
aaagagatca aactgactat agacattgac catcttgcgt gcccggaccg ttattcgagc 3780
gggctaggta agtaggtccc actagggttc attttaggac ttttgcacag gagttaccga 3840
ccagccatcc gcctaggtgt acgtgaatcc tctctaccgc ttctacctcg atagagatct 3900
gaattgagga ggcaggggtg gacgaatcac tcttcvcaag gcagtaagga acgccgcctg 3960
aaagtaaact cttatcctag tagaggcctg atgtgttgat tgactcacgt acgcggcacg 4020
cgactaggcc taggccggat acctgtggtt agctcgtctt taatgcggtg ctacatgcac 4080
taaatgaggc aaatggagcc gtggtcctct taactcttgg aagactactc ggtacccagc 4140
ggaatttagg cttaaataag attgcgaaac agcttctctg ttaaaaggag tagttctctt 4200
agcaaaacca taataatggc tgtggatcac acctgcctta aattgcatac ctgttttttt 4260
tttcaacagg gtacacagaa cattttgaac acaaaatact ttaaacaatt tagaataaaa 4320
tatgaaacac tgtttataag acatatattt ttgtttgaaa tacactgaaa ctggtttcaa 4380
aatattcgtt ttaagggttc atatttattt aagaataaaa tatgaaacac tgtttataag 4440
acatatattt ttgtttgaaa tacactgaaa ctggtttcaa aatattcgtt ttaagggtaa 4500
agaaaaaagt taaaaaatct atttacataa aaaataagaa cactgatttt tgtgaatact 4560
gggaactatg aaaatactat agttgagacc ttcaatgact ttctagtaac tcagcagcat 4620
ctcagggcca aaaatttaat cagtggaaaa atagcctcaa ttcttaccat ccacaaaatg 4680
gatccagaca actgttcaaa ctgatgggac ccactccatc gagatttctc tgtagctaga 4740
ccaaaatcac ctatttttac tgtgaggtct tcatgaagaa atatatctga ggtgtagtaa 4800
gtaaaggaaa acagtagatc tcattttcct atcagagcaa gcattatgaa gagtttaggt 4860
aagagatcta atttctataa ttctgtaata taatattctt taaaacatag tacttcatct 4920
ttcctcttag agtcaataag tatgtctaaa acaatgatta gttctattta gcctatataa 4980
cctgctttta agatttttgg ggcttgaaat gtgttaggat gaggtgagat gctttcctaa 5040
gtttatagga gaacctaaaa ctttcccatt agattttagc aatgtaggcc cagatattct 5100
cttggcactc ctgggcgagc agtaaaggct cctcattgga atgaagatgc tgcagatagt 5160
atcttagtct gcacttaggg aagagaaata ttatgttttt ctcacctcat tgttatataa 5220
tttagagtct tcagttatat ctcaactacc actgagcaag gtcagaggtc tgaaagggac 5280
taatagatag ctacaaaact atcagtttta taggttaaga tgtggcagtg cgacatacgg 5340
ctgaccagac cctcagcttt gactcctata aattgtatag tctatggccc agccaaactg 5400
caatgatcag tgattttcgt tagaactacg cggcccccgg catgaacccc gtttctgaca 5460
cccttgccat actcagcccg tgcttcagta gagcttccaa tagccgtgct ccaggctatg 5520
aacgggcatt cgtcccgggc ttcaacttag tgatccaatg tggactctgg agtcgtctca 5580
ccggtaagac taactcgaga cgtgggctgc ggttcctgga acttgatgcg ttgagaavgt 5640
tggccttcag caatgcacgg ccgttttcac cttaacagtg ggttcgtccg caaagtcact 5700
ttgaccagta acagttggcc tttcaccgca gaaccatata agcacacggt caaatggatg 5760
agtgccgact tggtgagggg cgaagatacg tgcgatttag aaacagaatg tgagagaggc 5820
gtaggagacg aacggtaaga aactccgtac actaatctct gttttaacca acggtttcga 5880
agccttcttt tattgcactt gagtagacca attaatttag gcttaaataa gattgcgaaa 5940
cagcttctct gttaaaagga gtagttctct tagcaaaacc ataataatgg ctgtggatca 6000
cacctgcctt aaattgcata cctgtttttt ttttcaacag ggtacacaga acattttgaa 6060
cacaaaatac tttaaacaat ttagaataaa atatgaaaca ctgtttataa gacatatatt 6120
tttgtttgaa atacactgaa actggtttca aaatattcgt tttaagggtt catatttatt 6180
taagaataaa atatgaaaca ctgtttataa gacatatatt tttgtttgaa atacactgaa 6240
actggtttca aaatattcgt tttaagggta aagaaaaaag ttaaaaaatc tatttacata 6300
aaaaataaga acactgattt ttgtgaatac tgggaactat gaaaatacta tagttgagac 6360
cttcaatgac tttctagtaa ctcagcagca tctcagggcc aaaaatttaa tcagtggaaa 6420
aatagcctca attcttacca tccacaaaat ggatccagac aactgttcaa actgatggga 6480
cccactccat cgagatttca ctgtagctag accaaaatca cctattttta ctgtgaggtc 6540
ttcatgaaga aatatatctg aggtgtagta agtaaaggaa aacagtagat ctcattttcc 6600
tatcagagca agcattatga agagtttagg taagagatct aatttctata attctgtaat 6660
ataatattct ttaaaacata gtacttcatc tttcctctta gagtcaataa gtatgtctaa 6720
aacaatgatt agttctattt agcctatata acctgctttt aagatttttg gggcttgaaa 6780
tgtgttagga tgaggtgaga tgctttccta agtttatagg agaacctaaa actttcccat 6840
tagattttag caatgtaggc ccagatattc tcttggcact cctgggcgag cagtaaaggc 6900
tcctcattgg aatgaagatg ctgcagatag tatcttagtc tgcacttagg gaagagaaat 6960
attatgtttt tctcacctca ttgttatata atttagagtc ttcagttata tctcaactac 7020
cactgagcaa ggtcagaggt ctgaaaggga ctaatagata gctacaaaac tatcagtttt 7080
atagatcgcc ggcgcccatc aaattgggca atacgtccag gcgacggagt ctccaatggc 7140
gcaagcgtgc gtatggtctg gctatagctt gagagtattt tgtgaaccct tgggagtgga 7200
ctttcagtgc taagtactga aggtatcttg accagggtag caccgttgct attccgctga 7260
ccccaaatgc cagctataaa tgtttaaaaa aatcccagtt atgctgcggt cagcacccct 7320
gccgtccgct caagctgcag ctcaccaggc tatagtacag tcgtccaggg acaacctatt 7380
ctgtacagag aagtgtgaat tcccaatgta cagagtaagc cctggtgtac gagtgagtgt 7440
acggtggctv aagtggtttt acttatgtgt cgatattgcc aggatgggga cccaaacgac 7500
tacattgatc acacctcttt aagcaagggg gtttgagagg tgtctgcggg tttctcgcca 7560
atcctacacg tactcatata taattgcgac ttatgcgcac gcaaaggatt ttagcctcaa 7620
gtgaactcgc tatgcggtga aagacccgtg tcttggacca cacctacacc cctccaatca 7680
tcgaa 7685
<210> 9
<211> 6246
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG4_BRCA2校准序列
<400> 9
ttcccggtat acgttctatt cagctcctca ggagaaattg aacccttctc gcgagttctt 60
gtgcctcggg ggggtgtgag aaaccccttt gtacttcatc acaagatatt tgcgggacgc 120
gcacgtctgg aacacccacg agaagcgcag cgcgagaatc atataggcgt acggtaggct 180
gcctaaacaa ccgaaaggat gctagcggag gtgagccacc cggttagact tagcaaatca 240
ggaattagag ctgacacaat ccaaatvgcg tcaaccctac agcggggcct aattacggtg 300
tcagaaactt cgagaagctc acggaggact tgttagtctt gctcattctg tcctcgctct 360
gccatcacgc cgccctagaa cggttgtcaa accgattacg ggttagtgaa atcgcctata 420
gctaagtgcc tgaggagcga caaatacaca ccgtctcgtc gaaaccttag taattccagg 480
taatcataca ttgttacgca tttgtgctcc atgggtttgc caaatctcgg cttcttagct 540
tcttagagct tcgagcattt acggttacga ggtcggtgtt ctagatgata gtcctggagc 600
agcatcacct tcaagaaagg tacaattcaa ccaaaacaca aatctaagag taatccaaaa 660
aaatcaagaa gaaactactt caatttcaaa aataactgtc aatccagact ctgaagaact 720
tttctcagac aatgagaata attttgtctt ccaagtagct aatgaaagga ataatcttgc 780
tttaggaaat actaaggaac ttcatgaaac agacttgact tgtgtaaacg aacccatttt 840
caagaactct accatggttt tatatggaga cacaggtgat aaacaagcaa cccaagtgtc 900
aattaaaaaa gatttggttt atgttcttgc agaggagaac aaaaatagtg taaagcagca 960
tataaaaatg actctaggtc aagatttaaa atcggacatc tccttgaata tagataaaat 1020
accagaaaaa aataatgatt acatgaacaa atgggcagga ctcttaggtc caatttcaaa 1080
tcacagtttt ggaggtagct tcagaacagc ttcaaataag gaaatcaagc tctctgaaca 1140
taacattaag acgagcaaaa tgttcttcaa agatattgaa gaacaatatc ctactagttt 1200
agcttgtgtt gaaattgtaa ataccttggc attagataat caaaagaaac tgagcaagcc 1260
tcagtcaatt aatactgtat ctgcacattt acagagtagt gtagttgttt ctgattgtaa 1320
aaatagtcat ataacccctc agatgttatt ttccaagcag gattttaatt caaaccataa 1380
tttaacacct agccaaaagg cagaaattac agaactttct actatattag aagaatcagg 1440
aagtcagttt gaatttactc agtttagaaa accaagctac atattgcaga agagtacatt 1500
tgaagtgcct gaaaaccaga tgactatctt aaagaccact tctgaggaat gcagagatgc 1560
tgatcttcat gtcataatga atgccccatc gattggtcag gtagacagca gcaagcaatt 1620
tgaaggtaca gttgaaatta aacggaagtt tgctggcctg ttgaaaaatg actgtaacaa 1680
aagtgcttct ggttatttaa cagatgaaaa tgaagtgggg tttaggggct tttattctgc 1740
tcatggcaca aaactgaatg tttctactga agctctgcaa aaagctgtga aactgtttag 1800
tgatattgag aatattagtg aggaaacttc tgcagaggta catccaataa gtttatcttc 1860
aagtaaatgt catgattctg ttgtttcaat gtttaagata gaaaatcata atgataaaac 1920
tgtaagtgaa aaaaataata aatgccaact gatattacaa aataatattg aaatgactac 1980
tggcactttt gttgaagaaa ttactgaaaa ttacaagaga aatactgaaa atgaagataa 2040
caaatatact gctgccagta gaaattctca taacttagaa tttgatggca gtgattcaag 2100
taaaaatgat actgtttgta ttcataaaga tgaaacggac ttgctattta ctgatcagca 2160
caacatatgt cttaaattat ctggccagtt tatgaaggag ggaaacactc agattaaaga 2220
agatttgtca gatttaactt ttttggaagt tgcgaaagct caagaagcat gtcatggtaa 2280
tacttcaaat aaagaacagt taactgctac taaaacggag caaaatataa aagattttga 2340
gacttctgat acattttttc agactgcaag tgggaaaaat attagtgtcg ccaaagagtc 2400
atttaataaa attgtaaatt tctttgatca gaaaccagaa gaattgcata acttttcctt 2460
aaattctgaa ttacattctg acataagaaa gaacaaaatg gacattctaa gttatgagga 2520
aacagacata gttaaacaca aaatactgaa agaaagtgtc ccagttggta ctggaaatca 2580
actagtgacc ttccagggac aacccgaacg tgatgaaaag atcaaagaac ctactctatt 2640
gggttttcat acagctagcg ggaaaaaagt taaaattgca aaggaatctt tggacaaagt 2700
gaaaaacctt tttgatgaaa aagagcaagg tactagtgaa atcaccagtt ttagccatca 2760
atgggcaaag accctaaagt acagagaggc ctgtaaagac cttgaattag catgtgagac 2820
catagagacg acatctaatt catcttggta tagtgcagac accctgatat caatttggcg 2880
acaatttcgc attagccccg agatgagcgc ttagcaactt ggctttgatg gccacttttc 2940
cgcgtgcact gtcgttcttt agccctggtg gatagtcgcg gtgcttctta acgccgggca 3000
acccagccgt aaaccacttt catacgtctg gtagaaaata tacaagtata attacagcta 3060
cacgatgtac tttgggvact ggccactaga acgtactgtt accggggtca acttcatgga 3120
cgtataagtt atcgatcaac atacaagtac tgagatcgtt gtagaggacg agcggactct 3180
gtttctcgag cccatagggc aaactaggta gagttcagaa tcactagctt caggggaaga 3240
gttgtaaaca agagggatac tattaacccc ccgcgcagcg aaatgcattc ctttatggcc 3300
cttcgcaggc cgacatcggc tggcctgtag tggggcgtca gtcgtatcgt acgtgggcta 3360
gctgacttct gttaggattc cagacgctca tagctcaccc gccctaaagc ggcgtggcac 3420
ccaagcatca ccttcaagaa aggtacaatt caaccaaaac acaaatctaa gagtaatcca 3480
aaaaaatcaa gaagaaacta cttcaatttc aaaaataact gtcaatccag actctgaaga 3540
acttttctca gacaatgaga ataattttgt cttccaagta gctaatgaaa ggaataatct 3600
tgctttagga aatactaagg aacttcatga aacagacttg acttgtgtaa acgaacccat 3660
tttcaagaac tctaccatgg ttttatatgg agacacaggt gataaacaag caacccaagt 3720
gtcaattaaa aaagatttgg tttatgttct tgcagaggag aacaaaaata gtgtaaagca 3780
gcatataaaa atgactctag gtcaagattt aaaatcggac atctccttga atatagataa 3840
aataccagaa aaaaataatg attacatgaa caaatgggca ggactcttag gtccaatttc 3900
aaatcacagt tttggaggta gcttcagaac agcttcaaat aaggaaatca agctctctga 3960
acataacatt aagacgagca aaatgttctt caaagatatt gaagaacaat atcctactag 4020
tttagcttgt gttgaaattg taaatacctt ggcattagat aatcaaaaga aactgagcaa 4080
gcctcagtca attaatactg tatctgcaca tttacagagt agtgtagttg tttctgattg 4140
taaaaatagt catataaccc ctcagatgtt attttccaag caggatttta attcaaacca 4200
taatttaaca cctagccaaa aggcagaaat tacagaactt tctactatat tagaagaatc 4260
aggaagtcag tttgaattta ctcagtttag aaaaccaagc tacatattgc agaagagtac 4320
atttgaagtg cctgaaaacc agatgactat cttaaagacc acttctgagg aatgcagaga 4380
tgctgatctt catgtcataa tgaatgcccc atcgattggt caggtagaca gcagcaagca 4440
atttgaaggt acagttgaaa ttaaacggaa gtttgctggc ctgttgaaaa atgactgtaa 4500
caaaagtgct tctggttatt taacagatga aaatgagtgg ggtttagggg cttttattct 4560
gctcatggca caaaactgaa tgtttctact gaagctctgc aaaaagctgt gaaactgttt 4620
agtgatattg agaatattag tgaggaaact tctgcagagg tacatccaat aagtttatct 4680
tcaagtaaat gtcatgattc tgttgtttca atgtttaaga tagaaaatca taatgataaa 4740
actgtaagtg aaaaaaataa taaatgccaa ctgatattac aaaataatat tgaaatgact 4800
actggcactt ttgttgaaga aattactgaa aattacaaga gaaatactga aaatgaagat 4860
aacaaatata ctgctgccag tagaaattct cataacttag aatttgatgg cagtgattca 4920
agtaaaaatg atactgtttg tattcataaa gatgaaacgg acttgctatt tactgatcag 4980
cacaacatat gtcttaaatt atctggccag tttatgaagg agggaaacac tcagattaaa 5040
gaagatttgt cagatttaac ttttttggaa gttgcgaaag ctcaagaagc atgtcatggt 5100
aatacttcaa ataaagaaca gttaactgct actaaaacgg agcaaaatat aaaagatttt 5160
gagacttctg atacattttt tcagactgca agtgggaaaa atattagtgt cgccaaagag 5220
tcatttaata aaattgtaaa tttctttgat cagaaaccag aagaattgca taacttttcc 5280
ttaaattctg aattacattc tgacataaga aagaacaaaa tggacattct aagttatgag 5340
gaaacagaca tagttaaaca caaaatactg aaagaaagtg tcccagttgg tactggaaat 5400
caactagtga ccttccaggg acaacccgaa cgtgatgaaa agatcaaaga acctactcta 5460
ttgggttttc atacagctag cgggaaaaaa gttaaaattg caaaggaatc tttggacaaa 5520
gtgaaaaacc tttttgatga aaaagagcaa ggtactagtg aaatcaccag ttttagccat 5580
caatgggcaa agaccctaaa gtacagagag gcctgtaaag accttgaatt agcatgtgag 5640
accatgatgc aggtatccga catgacggtt gcgtacatat gcaaaaaggt ccgaggatta 5700
atcaacgctg aagcatagga gccggtggca gcactatgac ccgtaggtat caacctaaca 5760
tcgcctcgtt gtttgtcccc caattgaaac acttgaggtc ttatcaaatc ttgtttcccg 5820
atgccaaatc gtagctaggg gatccgagaa cctcgcatag caacgctatg ttcggaacac 5880
gggctcatcc cggagcgtat atgaggtatg gcgtgtctcc cgtataactt ccgcggtaaa 5940
ggtgtttctt accggcgata tagctacatg atatagtaag ttgccgttac gccgcatcct 6000
attctacccg ttacatagcc accgctacaa ggactacagc taggggtgaa tgccctcctc 6060
caattggaaa agggtgaaga tcgttctgca cgtaggcgag tcaagtgtcc actttaggtg 6120
attgtttgcg acgtacgcgg gcaacgctca gtctttgcac ctatagctgv tactttgaac 6180
cagaccagtt acgcacgtcc aagccgcttc gacctatggc tttacattga tgtgagggat 6240
acgaga 6246
<210> 10
<211> 9744
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG6_GENES校准序列
<400> 10
agatctaatg actacatcag gtaacagggc ccctatcgag gatcttacac gtaagtctct 60
tgagcgctca cggcgctgtg tcccctgcgc atggcggtgc caaaatgcca cattttctgt 120
tagactgtca aatatgcttc aaaaaccgta gttactgcca ggacatccga gcacaactct 180
acvcacgaaa cacagacgta gcgcagaagc agaaatacca tacctcggcg aaacggatgc 240
tctatccatg tcgtacttgc gataatctag ttctaggctg caaggctcct ggtcacagct 300
atctatgcca gagttgaatt agttctggcc ttcgccgaca acaattcttg cactagtagt 360
tgtagggatg ttcggggcat cgtcgcgcaa aggggcagag gaaatactag tcccatttat 420
cattcaggtc gctcctcgcg gcttgtattg tatttggccc gttgtcaagc acggtgcttt 480
catttcagct gaacaccacg aaaatcctag tgggtataag gtattgatag gcgttcgcgc 540
cgggtggcag gttatgctgc acagggccgg ttgcgaaggc gctcagtatc actatcaaag 600
agatttaggt gacactatag aagtgtaccg ccggaagcac caggagctgc aagccatgca 660
gatggagctg cagagccctg agtacaagct gagcaagctc cgcacctcga ccatcatgac 720
cgactacaac cccaactact gctttgctgg caagacctcc tccatcagtg acctgaagga 780
ggtgccgcgg aaaaacatca ccctcattcg gggtctgggc catggcgcct ttggggaggt 840
gtatgaaggc caggtgtccg gaatgcccaa cgacccaagc cccctgcaag tggctgtgaa 900
gacgctgcct gaagtgtgct ctgaacagga cgaactggat ttcctcatgg aagccctgat 960
catcagcaaa ttcaaccacc agaacattgt tcgctgcatt ggggtgagcc tgcaatccct 1020
gccccggttc atcctgctgg agctcatggc ggggggagac ctcaagtcct tcctccgaga 1080
gacccgccct cgcccgagcc agccctcctc cctggccatg ctggaccttc tgcacgtggc 1140
tcgggacatt gcctgtggct gtcagtattt ggaggaaaac cacttcatcc accgagacat 1200
tgctgccaga aactgcctct tgacctgtcc aggccctgga agagtggcca agattggaga 1260
cttcgggatg gcccgagaca tctacagggc gagctactat agaaagggag gctgtgccat 1320
gctgccagtt aagtggatgc ccccagaggc cttcatggaa ggaatattca cttctaaaac 1380
agacacatgg tcctttggag tgctgctatg ggaaatcttt tctcttggat atatgccata 1440
ccccagcaaa agcaaccagg aagttctgga gtttgtcacc agtggaggcc ggatggaccc 1500
acccaagaac tgccctgggc ctgtataccg gataatgact cagtgctggc aacatcagcc 1560
tgaagacagg cccaactttg ccatcatttt ggagaggatt gaatactgca cccagcagcc 1620
gggagtcgtc agcgttcacc ctcgaggcaa cacgaactag acgagcgttt agaatcttaa 1680
ttctataccg gtgcaactga tttgtgcggc gagtagagct ctggttgctg tctggttgcc 1740
cggcacggaa ttgtcgctat catagaacga tacttacact tttctcggaa caacaggvag 1800
cgttctaacg tgcgtacttc cgcggtgact atgatgtgtc acgtcataag gttagcccta 1860
attcttccgt ataccgacga caaattgtac actcgacatt accataggct ggtcgaggtg 1920
ctgactcata ttggtatccc atcgccgcca actccaaggg tttttagtgc gagatgattc 1980
tcggcctcaa ttactgcgat ggcttgctcg acgaatatat ctccctttgg gggggcgcaa 2040
gttctcaatc cccttcgacg ctcgccctaa gaactaatgt actattcaag atataatgcc 2100
aggggttaca gcgtatagag ttatacaagc acacgaaagc cagaccccgg tgagatgaaa 2160
cgtatagcca ccgtaggggc ctgagctacg agtgggctga taggatcaac agcataatgg 2220
ggcagcagcc tggaaaagta cttggggacc aaagaaggcc aagcttgcct gccctgcatt 2280
ttatcaaagg agcagggaag aaggaatcat cgaggcatgg gggtccacac tgcaatgttt 2340
ttgtggaaca tgaagccctt cagcggccag tagcatctga ctttgagcct cagggtctga 2400
gtgaagccgc tcgttggaac tccaaggaaa accttctcgc tggacccagt gaaaatgacc 2460
ccaacctttt cgttgcactg tatgattttg tggccagtgg agataacact ctaagcataa 2520
ctaaaggtga aaagctccgg gtcttaggct ataatcacaa tggggaatgg tgtgaagccc 2580
aaaccaaaaa tggccaaggc tgggtcccaa gcaactacat cacgccagtc aacagtctgg 2640
agaaacactc ctggtaccat gggcctgtgt cccgcaatgc cgctgagtat ctgctgagca 2700
gcgggatcaa tggcagcttc ttggtgcgtg agagtgagag cagtcctggc cagaggtcca 2760
tctcgctgag atacgaaggg agggtgtacc attacaggat caacactgct tctgatggca 2820
agctctacgt ctcctccgag agccgcttca acaccctggc cgagttggtt catcatcatt 2880
caacggtggc cgacgggctc atcaccacgc tccattatcc agccccaaag cgcaacaagc 2940
ccactgtcta tggtgtgtcc cccaactacg acaagtggga gatggaacgc acggacatca 3000
ccatgaagca caagctgggc gggggccagt acggggaggt gtacgagggc gtgtggaaga 3060
aatacagcct gacggtggcc gtgaagacct tgaaggagga caccatggag gtggaagagt 3120
tcttgaaaga agctgcagtc atgaaagaga tcaaacaccc taacctggtg cagctccttg 3180
ctgaagatgg gctggggcgc tgtctcacca acctgtatgc aacctatcgg ttacagtagg 3240
gtatgtgtga gccggcggct tacagcttgc ctaatgccat acagacatgc accgagctct 3300
ctacgtatcc ataccatttc taactaacvg aagtttaaaa cgcatcgcca ttagcttgta 3360
gccaacacca agactagcga agctttccgt gcttcaaagc gaggatccgt tcgtgcgcaa 3420
ttatagtatt ttccccacgt cccggggagt taagaaatga gtcgatattg cgtgggcgcc 3480
gtagaacatt ccgtttaaga aagagaatcc agagaattta atgggatggt tttacacagc 3540
ccacacgccg taacctcacg aggtaggtgt tcttccgcta ttcggccata atcctctcgg 3600
tgcaatcgcg tcttgtgcac ttcttggtca ttcgaacgcc cctagcgtga gtgattaatg 3660
tcacccgtca ggggatatcg agaatccctg taggaaacgt gtaaccggga actatgtggt 3720
ccatctaaaa cctggtggtc cgaattgcta actcgtacgc tagcggtcaa atggaggggc 3780
actgaaatcc ggcggtagta aggccgagtt atactgccga gctggcagga ttgacgccct 3840
tttcatgcta gtaccatgat caccatgtgc cgcatacctt tggcggaatc tcgattggct 3900
gaacatcaga ttctgactgt ataagcgttg cccaatattc cgggatagta aggacgcagc 3960
aggcgaaccc tctgtgataa ccgcggcgga aatagggctg aaggttgacc tgcaggataa 4020
gcattgaacc actgtgtacg cctaaggagg ttgttaaaat cgacagtgga ctatattatg 4080
taccccaatt ttcttactca cacattgatg ggagctgcga ggaatattct gagattccat 4140
gagtctattc agtccgggtg cccatagctt gtccatcgca cagctttcta ccggccggtc 4200
tgacagaaac ggtcggggca tactttccgc cctcgtcatc gttcggtggt cctgaatgat 4260
aatatcttct acgcaccaat accgaagttc tgaccacgga gcgcctaacg ctctaataac 4320
ccatcaggca tgttccacag aggacggagc ctgcagggag ttcavttcat caaataggtt 4380
taatggtgga cccggtgggc ttcgcggagg cgtggaaggc gcagttcccg gactcagagc 4440
ccccgcgcat ggagctgcgc tcagtgggcg acatcgagca ggagctggag cgctgcaagg 4500
cctccattcg gcgcctggag caggaggtga accaggagcg cttccgcatg atctacctgc 4560
agacgttgct ggccaaggaa aagacgagct atgaccggca gcgatggggc ttccggcgcg 4620
cggcgcaggc ccccgacggc gcctccgagc cccgagcgtc cgcgtcgcgc ccgcagccag 4680
cgcccgccga cggagccgac ccgccgcccg ccgaggagcc cgaggcccgg cccgacggcg 4740
agggttctcc gggtaaggcc aggcccggga ccgcccgcag gcccggggca gccgcgtcgg 4800
gggaacggga cgaccgggga ccccccgcca gcgtggcggc gctcaggtcc aacttcgagc 4860
ggatccgcaa gggccatggc cagcccgggg cggacgccga gaagcccttc tacgtgaacg 4920
tcgagtttca ccacgagcgc ggcctggtga aggtcaacga caaagaggtg tcggaccgca 4980
tcagctccct gggcagccag gccatgcaga tggagcgcaa aaagtcccag cacggcgcgg 5040
gctcgagcgt gggggatgca tccaggcccc cttaccgggg acgctcctcg gagagcagct 5100
gcggcgtcga cggcgactac gaggacgccg agttgaaccc ccgcttcctg aaggacaacc 5160
tgatcgacgc caatggcggt agcaggcccc cttggccgcc cctggagtac cagccctacc 5220
agagcatcta cgtcgggggc atgatggaag gggagggcaa gggcccgctc ctgcgcagcc 5280
agagcacctc tgagcaggag aagcgcctta cctggccccg caggtcctac tccccccgga 5340
gttttgagga ttgcggaggc ggctataccc cggactgcag ctccaatgag aacctcacct 5400
ccagcgagga ggacttctcc tctggccagt ccagccgcgt gtccccaagc cccaccacct 5460
accgcatgtt ccgggacaaa agccgctctc cctcgcagaa ctcgcaacag tccttcgaca 5520
gcagcagtcc ccccacgccg cagtgccata agcggcaccg gcactgcccg gttgtcgtgt 5580
ccgaggccac catcgtgggc gtccgcaaga ccgggcagat ctggcccaac gatggcgagg 5640
gcgccttcca tggagacgca gatggctcgt tcggaacacc acctggatac ggctgcgctg 5700
cagaccgggc agaggagcag cgccggcacc aagatgggct gccctacatt gatgactcgc 5760
cctcctcatc gccccacctc agcagcaagg gcaggggcag ccgggatgcg ctggtctcgg 5820
gagccctgga gtccactaaa gcgagtgagc tggacttgga aaagggcttg gagatgagaa 5880
aatgggtcct gtcgggaatc ctggctagcg aggagactta cctgagccac ctggaggcac 5940
tgctgctgag tcttagcttc tacatcttta ggacgaaagg gctgtattca ctcgtcaccg 6000
cagatctgtg cctgggtagt ttcgttgccc aggtgtccgt cgcatcgtca gctaggtttt 6060
tgcgatcaat tctgaactac cgccgagaag tgtttcccgc tctgaacatt caatttgagc 6120
ggtacgatat gtgacgcaat cgtcactcgc gccctttcgg gataacggct actcctggag 6180
gtccgvagca tatagcactg gaacctcatt accggcccag gaacatggaa aaccgtctcc 6240
ttcgcaaaac acctagctgt tctcgtaact ccgaccgccc aggaagtcgg cgatcacgtg 6300
tatcgtatcc ccgctataat actagaatct tactcaacca gaaccgcgga gccgcggatc 6360
gattgaagat tatttgtagg agggagccat aagagatgat acgacggaaa agggggtttc 6420
ggagataacc tgtagtatca ttggagtgtt aatcccaaga tgggacggca gagctcaacg 6480
taggagatgg atatcggcgc tctctatcgt cacatttctc gtatctagct acgacagtta 6540
caattgagaa tggggcagca gcctggaaaa gtacttgggg accaaagaag gccaagcttg 6600
cctgccctgc attttatcaa aggagcaggg aagaaggaat catcgaggca tgggggtcca 6660
cactgcaatg tttttgtgga acatgaagcc cttcagcggc cagtagcatc tgactttgag 6720
cctcagggtc tgagtgaagc cgctcgttgg aactccaagg aaaaccttct cgctggaccc 6780
agtgaaaatg accccaacct tttcgttgca ctgtatgatt ttgtggccag tggagataac 6840
actctaagca taactaaagg tgaaaagctc cgggtcttag gctataatca caatggggaa 6900
tggtgtgaag cccaaaccaa aaatggccaa ggctgggtcc caagcaacta catcacgcca 6960
gtcaacagtc tggagaaaca ctcctggtac catgggcctg tgtcccgcaa tgccgctgag 7020
tatctgctga gcagcgggat caatggcagc ttcttggtgc gtgagagtga gagcagtcct 7080
ggccagaggt ccatctcgct gagatacgaa gggagggtgt accattacag gatcaacact 7140
gcttctgatg gcaagctcta cgtctcctcc gagagccgct tcaacaccct ggccgagttg 7200
gttcatcatc attcaacggt ggccgacggg ctcatcacca cgctccatta tccagcccca 7260
aagcgcaaca agcccactgt ctatggtgtg tcccccaact acgacaagtg ggagatggaa 7320
cgcacggaca tcaccatgaa gcacaagctg ggcgggggcc agtacgggga ggtgtacgag 7380
ggcgtgtgga agaaatacag cctgacggtg gccgtgaaga ccttgaagga ggacaccatg 7440
gaggtggaag agttcttgaa agaagctgca gtcatgaaag agatcaaaca ccctaacctg 7500
gtgcagctcc ttgcagatgc agtatagggc ttaacgtatg attcgaaccg ccagtgagga 7560
aaggccaggg ttgcccatgg acgcctccaa tctagtaaac tggtttgtaa tttagacatt 7620
taattaaata caccagcccg gccaagtata taggtctgag cagagattga acgcgggacc 7680
ctaccagccg agcctcggtt agcatcatct ctcggcacag cgtatcgtga ctacgagagg 7740
aacagatctg cagttttcat actctgatag ggccggtcgc cgagacagta agaacgaaca 7800
ggctagcccg tcgtccttgt gtcgttccct gactaactta cctccgctag agttcgtatt 7860
gccctgtccc gtagcttatt aaacgaagag gatagcttag acgtggcgta acttctcctt 7920
ccgaacattt ggattattcg agccgagctc taagttattt gggcccgggg actcgtggct 7980
aatacgtttt cccaggcggc ttgaaattac ggcgtttggc caattatcgg tcgcgaagtv 8040
aatggagcgc tgctgaactc ccgactacag cgggtccaat tatagacaag gctcacctta 8100
ctgaccattt taaatgtacc gccggaagca ccaggagctg caagccatgc agatggagct 8160
gcagagccct gagtacaagc tgagcaagct ccgcacctcg accatcatga ccgactacaa 8220
ccccaactac tgctttgctg gcaagacctc ctccatcagt gacctgaagg aggtgccgcg 8280
gaaaaacatc accctcattc ggggtctggg ccatggcgcc tttggggagg tgtatgaagg 8340
ccaggtgtcc ggaatgccca acgacccaag ccccctgcaa gtggctgtga agacgctgcc 8400
tgaagtgtgc tctgaacagg acgaactgga tttcctcatg gaagccctga tcatcagcaa 8460
attcaaccac cagaacattg ttcgctgcat tggggtgagc ctgcaatccc tgccccggtt 8520
catcctgctg gagctcatgg cggggggaga cctcaagtcc ttcctccgag agacccgccc 8580
tcgcccgagc cagccctcct ccctggccat gctggacctt ctgcacgtgg ctcgggacat 8640
tgcctgtggc tgtcagtatt tggaggaaaa ccacttcatc caccgagaca ttgctgccag 8700
aaactgcctc ttgacctgtc caggccctgg aagagtggcc aagattggag acttcgggat 8760
ggcccgagac atctacaggg cgagctacta tagaaaggga ggctgtgcca tgctgccagt 8820
taagtggatg cccccagagg ccttcatgga aggaatattc acttctaaaa cagacacatg 8880
gtcctttgga gtgctgctat gggaaatctt ttctcttgga tatatgccat accccagcaa 8940
aagcaaccag gaagttctgg agtttgtcac cagtggaggc cggatggacc cacccaagaa 9000
ctgccctggg cctgtatacc ggataatgac tcagtgctgg caacatcagc ctgaagacag 9060
gcccaacttt gccatcattt tggagaggat tgaatactgc acccagtcgc gtccccggtc 9120
tccacaacgc ggatcgatgt tggaccgtag atgatggtgc acgtcaggta gtttgaagtg 9180
gtctagtgta taccaagctg ataagactcg acgatttaaa aagcgatcgg cactgaggaa 9240
aatgttcagg gtaggcgatc cctcgtttag acgatcctga atagccgtag atactcttgt 9300
ggaggagctt ctagtaagct gactaagaac atagcaacgc gcatcagtac cgtggagccc 9360
atccacccac ctggcagcca aatccgctcc taggaacttc atactgaggt tgccgaaacg 9420
atgtggacgc atttgggctc tccctctctg gcgatctcca aaccagacaa ggagcaacac 9480
tatgttgtac gcgcccgaag ttggaacgga ctcactgtgg ttatcatcac gtgttagcca 9540
tcattccatc ggctggtata ggctctgggt acaaagtgta tcgtttttat tatttgcgct 9600
cggtgtgtaa gatctctgaa acctttaggc cccagctgcc taatcctaag ccttatavat 9660
aacgacctac ctgtcttgcg ctaaggcgga tatacgaagg gatctcaaaa aaaaaaaaaa 9720
aaaaaaaaaa aaaaaagcgc cgcg 9744
<210> 11
<211> 751
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_ERBB2_A校准序列
<400> 11
gccaacaccc tgtactggcg ggcgagctcc ccagggctgg cacgctgggg cagcctctga 60
atgcacaggg tgggcctagt cagaagaagc ctttcccctg aaatccctct acttcccaag 120
cacgcaagct ttctcctgct gttaaacctg cagtgtgcaa gggacatggg cggaggggtc 180
cttcagtcag gcttctccct gtctgaggtg gcatgacttg gagtgagttt ggatggggtg 240
gccaggtctg agaaggtccc ccgccagtgt cctctgaccc atctgctctc tcctgccagt 300
gtgcaccggc acagacatga agctgcggct ccctgccagt cccgagaccc acctggacat 360
gctccgccac ctctaccagg gctgccaggt ggtgcaggga aacctggaac tcacctacct 420
gcccaccaat gccagcctgt ccttcctgca ggtgaggccc gtgggcaacc cagccaggcc 480
ctgcctccag ctgggctgag ccctctgttt acaggtgggt ggcagaagaa ggtgccctgc 540
ccttctgttt cctctcttgt tgtggtttct caaccaggaa gtcctttcta acatctaacc 600
cccattcatt ttactgcaga atcagttgac tctctctata acgtggctgg ccgaggtcat 660
gtctggatgg gatgcgtctg tgtttccgct aaatcttgtg ctctcttgcc agcatgatca 720
tgtcccctgt ccacctgctc cagccactat c 751
<210> 12
<211> 813
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_ERBB2_B
<400> 12
ccatcccatc caggcctttg ctttcactga tgaagaaact gagatacaga gagggcaggg 60
cacctgttcg gagtttatga aatgcccccc caccattatc tttcttgatc atataagaat 120
ctggtgaggc aaggtagggc gtgatcttta tctctatttt atcgttttat ttaagcggga 180
acaggactgc tcagtggctg ggggccttgc ccaagatctc caagtactgg ggaaccccag 240
ggaggccctg gggggtggca gtgttcctat ttcagcccca ctctgcttcc ccctcccagg 300
atatccagga ggtgcagggc tacgtgctca tcgctcacaa ccaagtgagg caggtcccac 360
tgcagaggct gcggattgtg cgaggcaccc agctctttga ggacaactat gccctggccg 420
tgctagacaa tggagacccg ctgaacaata ccacccctgt cacaggggcc tccccaggag 480
gcctgcggga gctgcagctt cgaagcctca caggtggcct tcaccgtcat tgaaaccttc 540
tcttggttat tcagagctga ccagggccac tgctaaccag ggggaggctt tgtgtgcatt 600
agaaatggtg tcccttctgg gcagacgcag gcagagcccg ggaagacgcc ctcagaagat 660
tggaaaaaga ttccccttct tcctgggaag ttgtagcttg cgtcagcaca tataattcaa 720
tcgtgagaat gcaggctggg tttttgcccc cacttggctg agtgaagtgt acagtgaaca 780
acctatgtaa ctatttgctg gccctggagc cga 813
<210> 13
<211> 734
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_ERBB2_C校准序列
<400> 13
tctcttaacc accaagcagc atgcccagag tagaggtgag aaggaaggag agagctgcgg 60
tccacatgag catctggacc tagcatggac aactcactcc tccctggctc tcgctttgtt 120
cttgttgcgg gtgtggtggt ggtgggactc aaagacggta aagatagctt tctctcctcc 180
ctggggaatc tgggggttgt ttaaaaggcc tgctcctctt ttagaaggca ggagggcccc 240
aagggaagca gaaggtgaca gaaggggaaa gggtcctctg atcattgctc accccacaga 300
gatcttgaaa ggaggggtct tgatccagcg gaacccccag ctctgctacc aggacacgat 360
tttgtggaag gacatcttcc acaagaacaa ccagctggct ctcacactga tagacaccaa 420
ccgctctcgg gcctgtaagc catgcccctc cctgctgcct cttctctcag acagcctgac 480
cccagccgca aactcccaac ttacaaccca gtgcctgccc gccactgccc cagccgccta 540
caccacccat ttcctccctc tctgtccctc ctgccatctc cctgtgcctc ttcatctctg 600
gggttctctg tcttgtctcc ctctgcttat aggttgtgcc tctggtttgg gggcctctca 660
gcctgtctgg gtccctccct tgctgtgcag ttggcctcgt ggcctctgct gctgtttgtg 720
cctctctctg ttac 734
<210> 14
<211> 751
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_EGFR_A校准序列
<400> 14
ttcaatgcat tatagggaca agctatctct tattatgaat tgcaccttat ataaacttaa 60
agatctttta tcacaaattt ctttgctgtg tcctttagtg agaatttgta ttatcagtca 120
ctaaagctca ctaagttagt aagctttgcg cccagatgac ctgggcagga atgggtgagt 180
ctctgtgtgg agagagtgaa gaaactgcta cccttaatac ctggaccttg agggattgtt 240
ttattttagt ttttctgcat ttctcagtat ttcatgtgat atctgtcttt ttcttccagt 300
ttgccaaggc acgagtaaca agctcacgca gttgggcact tttgaagatc attttctcag 360
cctccagagg atgttcaata actgtgaggt ggtccttggg aatttggaaa ttacctatgt 420
gcagaggaat tatgatcttt ccttcttaaa ggttggtgac tttgattttc ctacacaaat 480
aaaattggag aaaatctaag tggagaaagg cctgggcaga attccacttg aagtgtgttt 540
atttttgcta tggcaatgac aagtcttaca gagctacaaa cgagagtttt atgagaaagc 600
cattttacca gctaatgtca agtaataact agaaaaggat atcaaataga aacaggctaa 660
tctggagttc catgtcatca tagacactga cgtttatccc tgaccattac ctcagtcatg 720
atgtgctgcc atactcgctc ttaaaaactt t 751
<210> 15
<211> 783
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_EGFR_B校准序列
<400> 15
atttccattt tcactggaga gtgttgaacc ccgtgaggca tgagagcaca gtgttccaga 60
acaatgctta ctgctcatta tcacaggggt caaaggctaa cgtgcaggga ttgttgcaga 120
tcgtggacat gctgcctcct gtgtccatga ctgcaatcgt ctacctattt tacagttgtt 180
gagcactcgt gtgcattagg gttcaactgg gcgtcctagg gctccctgga cccattttag 240
accttgagtt cttgagttcc tcaaaagaga aatcacgcat ttatgttttc tcttcttaga 300
ccatccagga ggtggctggt tatgtcctca ttgccctcaa cacagtggag cgaattcctt 360
tggaaaacct gcagatcatc agaggaaata tgtactacga aaattcctat gccttagcag 420
tcttatctaa ctatgatgca aataaaaccg gactgaagga gctgcccatg agaaatttac 480
agggtgagag gctgggatgc caaggctggg ggttcataaa tgcagacagc agttccgatg 540
gctcccagcg agcttgtcac tcaattccac ctcggagaag gcttttattt ttacccagta 600
cacgtgcact gagtgccggc tgtgtgtaag atactgcagg ggaagttact gagaagatgg 660
cagatactgg aatgggaaga tttaagcggg gtaccagtgt ttacatggac atgaaaaaat 720
actgagagat agtaagaaat cgtaaagatt ctgagtaaaa gagagtatga ccaaacaagc 780
tga 783
<210> 16
<211> 734
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_EGFR_C校准序列
<400> 16
catgcatatc atttatgctg tgaccactga ctaaaccatt ctcttccttc ctccccatat 60
ttctaaattt ctaatcattg ctcaaagccc aattcagaga aaaccctagc tcctccatgg 120
caccatcatt aacaatttta tctggccgcc ccccgggaag ttcactgggc taattgcggg 180
actcttgttc gcaccatggc atctctttag cagaacataa atgcgacgag cacatgcatc 240
cttcatggga atttaaagga gctggaaaga gtgctcaccg cagttccatt ctcccgcaga 300
aatcctgcat ggcgccgtgc ggttcagcaa caaccctgcc ctgtgcaacg tggagagcat 360
ccagtggcgg gacatagtca gcagtgactt tctcagcaac atgtcgatgg acttccagaa 420
ccacctgggc agctgtaagt gtcgcataca cactatctct gcctccagct cctatggggg 480
acagctctac agcactgggg caggggagag aagccatgtt tagtaagtca cattaatcag 540
aaacaaaaag tagtaagcaa aatatctgac cactagaaaa gcatgtattt accacggaca 600
tagagatcgt ttttttgtgg cgggtggcag cccagctggt tggcagtgca ggccaccgga 660
ggcagatccc ctgcagggac agcagagcac ttgtgtcctg agacgagctg ctgttcatgg 720
ggctggcagc acca 734
<210> 17
<211> 790
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_MET_A校准序列
<400> 17
acatttaaaa gttttgtttt tcttataata gcagcagcta agttccattt ttaggcgtgc 60
acatattgaa ccatggtgtg aattgcgata gtaaggtttt agagtctata aataatgcct 120
agtgaaattg gagccattca gtccctagaa atatttatgc ctatctgtgg ctatttgtct 180
atttgcatga ttatccttgc cattatcctc caggctctga aaatacacac tgaaaggttt 240
cttaccagct tgttcatgtc tggattcaca ttaactctat gaccatattt tattccagac 300
acttctgaga aattcatcag gctgtgaagc gcgccgtgat gaatatcgaa cagagtttac 360
cacagctttg cagcgcgttg acttattcat gggtcaattc agcgaagtcc tcttaacatc 420
tatatccacc ttcattaaag gagacctcac catagctaat cttgggacat cagagggtcg 480
cttcatgcag gtaagtgctt tctgagagta gctgtgtctg ttctatctgg tattgtgcaa 540
ttaatttgtt ttcgtttttg cagtaaggta tttgcaaata ctgtaaagtc caaatcatag 600
tagaaactgg aacacagact gaaagccaaa caatgaagcc tggtctactt tctgttaaat 660
gtgtggtctc tttttattaa gttcttgaag ctttcagttt gaatctgttt gctttaattt 720
tctcgtccag aatggtgtgg catttttttt ccatttataa tttctgtcac gtgattggaa 780
aataaaatga 790
<210> 18
<211> 734
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_MET_B校准序列
<400> 18
tttccaatac aattgcaggg atttgtctgt atgtgctgcc aattgattga aagatctctt 60
tcccttgaaa ccattaaaag atcataggca aagtctgtct tgggggttca gataatttgg 120
cttcaaggca agagattaga agatgacata ttgatttaca atgaggggaa ctgttgggtc 180
ttcagttcaa acacccacaa gccctgctaa tctgttatta ccattatcat ctacattttc 240
cacttatatt taaactgagc ttgttggaat aaggatgtta taactttttt gctgtttagg 300
ttgtggtttc tcgatcagga ccatcaaccc ctcatgtgaa ttttctcctg gactcccatc 360
cagtgtctcc agaagtgatt gtggagcata cattaaacca aaatggctac acactggtta 420
tcactgggaa gaaggtaagc tgttcccaca gggaatttcc atagacgtgg tttttcccaa 480
atgcatattt acaaccagtg tcacttggcc ctttataatg tctctcttca tcttaaattt 540
acccctcctc cattaagttc tttagtgagt attccagaga tcttctgaaa tctagttaat 600
ttgttctcca agaaagacta gacctaaggg aggtcttttt caaaacttct ccttttgtcc 660
tatatttctc aacaagaaaa ataaacacac agaatgagaa ttacagtcct aatgacagag 720
ctctagtgca ggca 734
<210> 19
<211> 773
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_MET_C校准序列
<400> 19
aaatcatctc agacagggca caatgtccct actatgtaga acctctaaca ttgtgtggca 60
atgctatgct cactggacaa taatgttact ttttcacata cctgctaaca ataaaggaaa 120
ggaaggaatc agatttttaa aattttaatc accgttatga caggatttgc acacatagtt 180
gctaagtcta gaaaattcca tcaaatgata tttacatgta ccttttgtgt acttacttta 240
taattaatta acaaactaga tacccctctg gaagctcttt ccaccccttc tcttcacaga 300
tcacgaagat cccattgaat ggcttgggct gcagacattt ccagtcctgc agtcaatgcc 360
tctctgcccc accctttgtt cagtgtggct ggtgccacga caaatgtgtg cgatcggagg 420
aatgcctgag cgggacatgg actcaacaga tctgtctgcc tgcaatctac aaggtaggaa 480
tctctaacag ctggcataca tgtttttgtt tggtgttttt tttttttttt tggtttggtt 540
tggtttgttt tttgtttttt tagatacaaa tcccactaat gaaaaaaatt taaaaatcaa 600
tttactcatt tagctgtgag tcatcagcta aagcaccatc tctctcttgg ctttatccct 660
cgggcaggga gggggtggtg tttgggcatc cccccaagtc ctgcacctga agtgcttgct 720
tcacattgtc taggttctat cgctgggcag ctgctcacct ttagtgccgt gtg 773
<210> 20
<211> 759
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_BRAF_A
<400> 20
gggcttctat cagtcctttg atatttaaac cattttcatt tgaagatgac ttttatagag 60
atggtatcat aagggaaaaa aatcagagtg actgtataac ctggagtcag tgaaatattt 120
aatgtcatca gagagaaacc agaagctttt ctgatttgtg attcacaaga agcttatcac 180
ttaaaataac tgtgataaat gaaaaatggc acttatttct gatctaagtt ataattatag 240
cagaaaaata aagatacata cttggttttt ttttagttct agcaatgctg gatacttaca 300
tcaatattga caggttctat tgtgtttata tgcacattgg gagctgatga ggatcggtct 360
cgttgcccaa attgatttcg atgatcttca tctgctggtc ggaagggctg tggaattgga 420
atggattttg aaggagacgg actggtgaga atttggggcc tggaaaaatg aagtcattgg 480
aagataagat tcagagtaac gatataaagg taataatatt taaaaaggaa gataaaagga 540
ttttcttgtt tttatattct caaaatcatt aaagcattaa aaacctagca gtaatgactt 600
ttaaaagtat taatttaaaa atccaatact gccaaagctg ctttgctcaa gtaggccctc 660
caggaactat caatgataag accactgatt cttacctgga aaacactagg gaaatttact 720
tatggctaga aattacctgt ggccatcaac tgaagaagt 759
<210> 21
<211> 719
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_BRAF_B校准序列
<400> 21
ttctaattaa ccaggagatc caaaagaaag cagttcaaga agcatgtcac tgacgagcag 60
aagtcaaatc atacccaata ttgatttttt caggactgat tctgaaatag tctatgtcag 120
ctttaatccc atttatttgt atcaaatgca tgtaaatatc tgagtggtat gataagttat 180
ttggggaaaa agtccttaat ttaacaattt aaacattgga aaggtttcta attaaccagg 240
agatccaaaa gaaagcggtt caagtagcat gtcgcccaag agcagaagtc aaaccatacc 300
caatagagtc cgaggcgggt gcggaagggg atgatccaga tgttagggca gtctctgcta 360
aggacgcctc ttcctgtggt attgggtggt gttcaaagaa cttggagaca aacagcaaac 420
tgtgaggcaa aacaaaacaa acctaacttg tgcaaaaccc agaagcttca tataccaaaa 480
tacatagtta accaaaaaaa ctgagatcaa attccattct cagaaacaac tgttaaaatt 540
caattagttg tatttttgtc taaaggctta ttttaaaaaa aattgtattg cactttcaaa 600
ggcatgctta taacttaaaa ctaatcattc agttcagcaa atttctacat actacaagat 660
gaaaatcatg ctttatggtt aaagaatgag aataaaaagt atctactgta aattaggtg 719
<210> 22
<211> 748
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_BRAF_C校准序列
<400> 22
aaacaactct ccctctcctc ctagaaacta tccaaaaatg gtttctatgg gttaggggtc 60
ttgattaatt aaacgataat ataaaatata aattaactgt atagctgaac cagcattaca 120
atttgggaga gaaatactgt ccattccaca tattattctc taactacact taaaaaaaat 180
tctctataac aatcgtatgg aagaaaaacc ctcacagact tttagacatc gtagcttcac 240
attaagaaaa tttaagtgta aaatggtagg tagaaaagag atatttttgg attacttact 300
caagttggtc ataattaaca cacatcagtg gaacttctgt actacaacgc tggtgaaatt 360
tataaccaca tgtttgacag cggaaaccct ggaaaagcag ctttcgacaa aagtcacaaa 420
atgctaaggt gaaaaacgtt tttcgtacct gcaaagtaaa aaatcacaga gatttcaaaa 480
actcacaaga aaactttcta gaaactgacg tatctactct cttgtttaaa ataacaaagt 540
tgtaatatat ttatatcatg aaactcacat actaaagtac tattataaaa tgaaaaccgg 600
gggttcaaga taatagatgg actacacata tttatttccc accccactat ctaacttaaa 660
aacccagaag ttaaaaaatg agaaatgagt aaaaggctgg caactgattt caagcttgac 720
aacataaaag taaaagtaga catgaaaa 748
<210> 23
<211> 802
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_FGFR1_A校准序列
<400> 23
tggggacagt tcaaattcat gctattggct gcacattctg tccaaatagg acttcctccc 60
aatccatgtc ccaggagtcc ggaggacttg cagtgtgata tggagggtgc aggaaattca 120
cgggctacac tagcttgaaa cagactctag agcacttagt tcatgatatt ccactgtgcc 180
ttgcccagaa gccagaaaat aaggcccaaa gctataaatt agggacaatg gagagggcag 240
ggcattagag gcccagagag agaggtggtg ctgagtgtgc aaatccccca tctactttct 300
gttacctgtc tgcgcagagg gatgctcttg gccagcttgt gcacagccat ctggctgtgg 360
aagtcactct tcttggtacc actcttcatc ttgtagacga tgaccgaccc caccatgcag 420
gagatgagga aggcccctgt gcaatagatg atgatctcca ggtacagggg cgaggtcatc 480
actgccggcc tctcttccag ggctgagtca gtgcgaacag ggtgttagca ggcttggagg 540
gccccgtcca tgcgaggtcc cgctccatta gaaaagcaac acctgtctcc tgtcccctgg 600
gaacttttag ggagaagaac catggcaagt tctagctagg actgggattg tggcactagg 660
aggatcaggc aaccccctga ttttggaggc tgccttcaat ggacttgagc catggaaaag 720
ggatggccta gaaccatcgt gctacacaag ccccatcttc attaattcct gagcctcctt 780
gctcagctgg actggagagg ta 802
<210> 24
<211> 744
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_FGFR1_B校准序列
<400> 24
ccctggagga gtcgggctgc agggtaaacc cagatcccgg gcatgcattg caatggccag 60
ggggagagca gaggcaggtg tacgggtggg aggcctccgt gcgcctgcaa aactagggaa 120
gctcctctct gagctgagag gattcagccc tcaaagctgg ggcaggatgt ggcaccaggc 180
aggcaggagc ccattcttcc agctctcctg cctctgtgtc tccccaagcc tggaaatgca 240
tgctcccccc gtgcccgtgg cgagggcagg acatcgagag gagaagttac agtgtgtacc 300
ttccagaacg gtcaaccatg cagagtgatg ggagagtccg atagagttac ccgccaagca 360
cgtatactcc cctgcgtcct caaaggagac atttcttaag tgaagcacct ccatctcttt 420
gtcggtggta ttaactccag cagtctagaa gagacaacgg aagcaaaatg gacaagcaca 480
ggacatgaga cctctaagag acgcagagca agggaaggag acagaaagaa gggggactag 540
aggaagaaat gctccctgac atcttctttg caacaaggaa caaacgaaaa ccaccaggca 600
gcaaaacctg ttagaggaag agggtgagac cctgagggaa gaactccggc agacctgaga 660
agacgatggc tggttacgac ccttcaccag atgctggcag ccactggccc atccgagcat 720
gcgggcggtg agcggcatgg agaa 744
<210> 25
<211> 790
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG1_CNV_FGFR1_C校准序列
<400> 25
caaatgcctt ccttgtgtag ctgaccccaa agccccagtg acgttgctct caaagcttat 60
tacagaccag caccacccat ccctgcagcc ctctgttccc agctcacctc cactttgtga 120
cctctgttac tagtcctggg ggatgtggct agatccctac tgagatggag tgtgtgtgcc 180
tgaagcgtga ggaatgatcc cattcggggg caactgagcc tgcccacagg aacttgagcc 240
cccgagacag tggtctcctt cccagtagac tggcccacga agactggtgc catgattacc 300
ttcaagatct ggacataagg caggttgtct gggccaatct tgctcccatt cacctcgatg 360
tgctttagcc actggatgtg cggctgcggg tcactgtaca ccttacacat gaactccacg 420
ttgctaccca gggccactgt tttgttggcg ggcaaccctg cttgcaggat gggccggtga 480
ggggaccgct ctgtggaaga tgggagagga ggcacttgtc atggggacct tgccatggct 540
aaagaggggt gggctcacct gcgccccact tggctttccc agtgatgggt tgtaaacctc 600
ccagcacttc tgctgagccc aagcctctca aaacagagct ggggaaaggg acaccctctc 660
ttcaggccct aagccatcag gatcctcctc cccaaggcag tcatcatatt tacagtcaca 720
gtaagtcgct catgctttaa tggagaacct tctaattcag ttgcaccccc agacctcagc 780
acaacctgct 790
<210> 26
<211> 800
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TP53_A校准序列
<400> 26
tcccaaagtt ccaaacaaaa gaaatgcagg gggatacggc caggcattga agtctcatgg 60
aagccagccc ctcagggcaa ctgaccgtgc aagtcacaga cttggctgtc ccagaatgca 120
agaagcccag acggaaaccg tagctgccct ggtaggtttt ctgggaaggg acagaagatg 180
acaggggcca ggagggggct ggtgcagggg ccgccggtgt aggagctgct ggtgcagggg 240
ccacgggggg agcagcctct ggcattctgg gagcttcatc tggacctggg tcttcagtga 300
accattgttc aatatcgtcc ggggacagca tcaaatcatc cattgcttgg gacggcaagg 360
gggactgtag atgggtgaaa agagcagtca gaggaccagg tcctcagccc cccagccccc 420
cagccctcca ggtccccagc cctccaggtc cccagcccaa cccttgtcct taccagaacg 480
ttgttttcag gaagtctgaa agacaagagc agaaagtcag tcccatggaa ttttcgcttc 540
ccacaggtct ctgctagggg gctggggttg gggtgggggt ggtgggcctg cccttccaat 600
ggatccactc acagtttcca taggtctgaa aatgtttcct gactcagagg gggctcgacg 660
ctaggatctg actgcggctc ctccatggca gtgacccgga aggcagtctg gctgctgcaa 720
gaggaaaagt ggggatccag catgagacac ttccaaccct gggtcacctg ggcctgcaga 780
gaaggaaccc cctcccccaa 800
<210> 27
<211> 800
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG2_TP53_B校准序列
<400> 27
cccagccaag caggggaggc ccttagcctc tgtaagcttc agttttttca actgtgcaat 60
agttaaaccc atttactttg cacatctcat ggggttatag ggaggtcaaa taagcagcag 120
gagaaagccc ccctactgct cacctggagg gccactgaca accaccctta acccctcctc 180
ccagagaccc cagttgcaaa ccagacctca ggcggctcat agggcaccac cacactatgt 240
cgaaaagtgt ttctgtcatc caaatactcc acacgcaaat ttccttccac tcggataaga 300
tgctgaggag gggccagacc taagagcaat cagtgaggaa tcagaggcct ggggaccctg 360
ggcaaccagc cctgtcgtct ctccagcccc agctgctcac catcgctatc tgagcagcgc 420
tcatggtggg ggcagcgcct cacaacctcc gtcatgtgct gtgactgctt gtagatggcc 480
atggcgcgga cgcgggtgcc gggcgggggt gtggaatcaa cccacagctg cacagggcag 540
gtcttggcca gttggcaaaa catcttgttg agggcagggg agtactgtag gaagaggaag 600
gagacagagt tgaaagtcag ggcacaagtg aacagataaa gcaactggaa gacggcagca 660
aagaaacaaa catgcgtaag cacctcctgc aacccactag cgagctagag agagttggcg 720
tctacacctc aggagctttt cttttttttt tttttttttg agatagggtc ttgctctgtc 780
actcaggctg gagcacagtg 800
<210> 28
<211> 1200
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG2_TP53_C校准序列
<400> 28
ctttttgaaa gctggtctgg tcctttaaaa tatatattat ggtataagtt ggtgttctga 60
agttagttag ctacaaccag gagccattgt ctttgaggca tcactgcccc ctgatggcaa 120
atgccccaat tgcaggtaaa acagtcaaga agaaaacggc attttgagtg ttagactgga 180
aactttccac ttgataagag gtcccaagac ttagtacctg aagggtgaaa tattctccat 240
ccagtggttt cttctttggc tggggagagg agctggtgtt gttgggcagt gctaggaaag 300
aggcaaggaa aggtgataaa agtgaatctg aggcataact gcacccttgg tctcctccac 360
cgcttcttgt cctgcttgct tacctcgctt agtgctccct gggggcagct cgtggtgagg 420
ctcccctttc ttgcggagat tctcttcctc tgtgcgccgg tctctcccag gacaggcaca 480
aacacgcacc tcaaagctgt tccgtcccag tagattacca ctactcagga taggaaaaga 540
gaagcaagag gcagtaagga aatcaggtcc tacctgtccc atttaaaaaa ccaggctcca 600
tctactccca accacccttg tcctttctgg agcctaagct ccagctccag gtaggtggag 660
gagaagccac aggttaagag gtcccaaagc cagagaaaag aaaactgagt gggagcagta 720
aggagattcc ccgccgggga tgtgatgaga ggtggatggg tagtagtatg gaagaaatcg 780
gtaagaggtg ggcccagggg tcagaggcaa gcagaggctg gggcacagca ggccagtgtg 840
cagggtggca agtggctcct gacctggagt cttccagtgt gatgatggtg aggatgggcc 900
tccggttcat gccgcccatg caggaactgt tacacatgta gttgtagtgg atggtggtac 960
agtcagagcc aacctaggag ataacacagg cccaagatga ggccagtgcg ccttggggag 1020
acctgtggca agcaggggag gccttttttt tttttttttg agatggaatc tcgctctgtc 1080
gcccaggctg gagtgcagtg gcgtgatctc agctcactgc aagctccacc gcccaggttc 1140
acgccattct ccttcctcag cctcccgagt agctgggact acaggtgccc agcaccacgc 1200
<210> 29
<211> 600
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG2_TP53_D校准序列
<400> 29
atggcaaaga agtatccaca ctcgtccctg ggtttggatg ttctgtggat acactgaggc 60
aagaatgtgg ttataggatt caaccggagg aagactaaaa aaatgtctgt gcagggctgg 120
gacccaatga gatggggtca gctgcctttg accatgaagg caggatgaga atggaatcct 180
atggctttcc aacctaggaa ggcaggggag tagggccagg aaggggctga ggtcactcac 240
ctggagtgag ccctgctccc ccctggctcc ttcccagcct gggcatcctt gagttccaag 300
gcctcattca gctctcggaa catctcgaag cgctcacgcc cacggatctg cagcaacaga 360
ggagggggag aagtaagtat atacacagta cctgagttaa aagatggttc aagttacaat 420
tgtttgactt tatgacggta caaaagcaac atgcatttag tagaaactgc acttcaagta 480
cctatacagc tgacttttaa aaatatttat ttatttattt tgagatgggg tctcactctg 540
ttgcccaggc gggagtgcaa tggtgcaatc ttggctgatt gcaatctccg cctctggggt 600
<210> 30
<211> 600
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG2_TP53_E校准序列
<400> 30
cccaaacatc cctcacagta aaaaccttaa aatctaagct ggtatgtcct actccccatc 60
ctcctcccca caacaaaaca ccagtgcagg ccaacttgtt cagtggagcc ccgggacaaa 120
gcaaatggaa gtcctgggtg cttctgacgc acacctattg caagcaaggg ttcaaagacc 180
caaaacccaa aatggcaggg gagggagaga tgggggtggg aggctgtcag tggggaacaa 240
gaagtggaga atgtcagtct gagtcaggcc cttctgtctt gaacatgagt tttttatggc 300
gggaggtaga ctgacccttt ttggacttca ggtggctgta ggagacagaa gcagggagga 360
gagatgacat cacatgagtg agagggtctg tgcccctttt ccctgaccaa tgctttgaag 420
ggcctaaggc tgggacaacg ggaattcaaa tcaagatggt ggccacaccc catgcaaata 480
tgtttactga gcacctcaga gtattagtgt gtattagtct cgtaatcttc ccttacccca 540
ttttacttta tttatctttt ttgagacgga gtttcactct tgttgcccag gctggagtgt 600
<210> 31
<211> 1536
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG3_16S_pseuAeru_C校准序列
<400> 31
aactgaagag tttgatcatg gctcagattg aacgctggcg gcaggcctaa cacatgcaag 60
tcgagcggat gaagggagct tgctcctgga ttcagcggcg gacgggtgag taatgcctag 120
gaatctgcct ggtagtgggg gataacgtcc ggaaacgggc gctaataccg catacgtcct 180
gagggagaaa gtgggggatc ttcggacctc acgctatcag atgagcctag gtcggattag 240
ctagttggtg gggtaaaggc ctaccaaggc gacgatccgt aactggtctg agaggatgat 300
cagtcacact ggaactgaga cacggtccag actcctacgg gaggcagcag tggggaatat 360
tggacaatgg gcgaaagcct gatccagcca tgccgcgtgt gtgaagaagg tcttcggatt 420
gtaaagcact ttaagttggg aggaagggca gtaagttaat accttgctgt tttgacgtta 480
ccaacagaat aagcaccggc taacttcgtg ccagcagccg cggtaatacg aagggtgcaa 540
gcgttaatcg gaattactgg gcgtaaagcg cgcgtaggtg gttcagcaag ttggatgtga 600
aatccccggg ctcaacctgg gaactgcatc caaaactact gagctagagt acggtagagg 660
gtggtggaat ttcctgtgta gcggtgaaat gcgtagatat aggaaggaac accagtggcg 720
aaggcgacca cctggactga tactgacact gaggtgcgaa agcgtgggga gcaaacagga 780
ttagataccc tggtagtcca cgccgtaaac gatgtcgact agccgttggg atccttgaga 840
tcatagtggc gcagctaacg cgataagtcg accgcctggg gagtacggcc gcaaggttaa 900
aactcaaatg aattgacggg ggcccgcaca agcggtggag catgtggttt aattcgaagc 960
aacgcgaaga accttacctg gccttgacat gctgagaact ttccagagat ggattggtgc 1020
cttcgggaac tcagacacag gtgctgcatg gctgtcgtca gctcgtgtcg tgagatgttg 1080
ggttaagtcc cgtaacgagc gcaacccttg tccttagtta ccagcacctc gggtgggcac 1140
tctaaggaga ctgccggtga caaaccggag gaaggtgggg atgacgtcaa gtcatcatgg 1200
cccttacggc cagggctaca cacgtgctac aatggtcggt acaaagggtt gccaagccgc 1260
gaggtggagc taatcccata aaaccgatcg tagtccggat cgcagtctgc aactcgactg 1320
cgtgaagtcg gaatcgctag taatcgtgaa tcagaatgtc acggtgaata cgttcccggg 1380
ccttgtacac accgcccgtc acaccatggg agtgggttgc tccagaagta gctagtctaa 1440
ccgcaagggg gacggttacc acggagtgat tcatgactgg ggtgaagtcg taacaaggta 1500
gccgtagggg aacctgcggc tggatcacct ccttaa 1536
<210> 32
<211> 1549
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG3_16S_haemInfl_B校准序列
<400> 32
aacttgaatt gaagagtttg atcatggctc agattgaacg ctggcggcag gcttaacaca 60
tgcaagtcga acggtagcag gagaaagctt gctttcttgc tgacgagtgg cggacgggtg 120
agtaatgctt gggaatctgg cttatggagg gggataacga cgggaaactg tcgctaatac 180
cgcgtattat cggaagatga aagtgcggga ctgagaggcc gcatgccata ggatgagccc 240
aagtgggatt aggtagttgg tggggtaaat gcctaccaag cctgcgatct ctagctggtc 300
tgagaggatg accagccaca ctggaactga gacacggtcc agactcctac gggaggcagc 360
agtggggaat attgcgcaat ggggggaacc ctgacgcagc catgccgcgt gaatgaagaa 420
ggccttcggg ttgtaaagtt ctttcggtat tgaggaaggt tgatgtgtta atagtacatc 480
aaattgacgt taaatacaga agaagcaccg gctaactccg tgccagcagc cgcggtaata 540
cggagggtgc gagcgttaat cggaataact gggcgtaaag ggcacgcagg cggttattta 600
agtgaggtgt gaaagccctg ggcttaacct aggaattgca tttcagactg ggtaactaga 660
gtactttagg gaggggtaga attccacgtg tagcggtgaa atgcgtagag atgtggagga 720
ataccgaagg cgaaggcagc cccttgggaa tgtactgacg ctcatgtgcg aaagcgtggg 780
gagcaaacag gattagatac cctggtagtc cacgctgtaa acgctgtcga tttggggatt 840
gggcttagag cttggtgccc gtagctaacg tgataaatcg accgcctggg gagtacggcc 900
gcaaggttaa aactcaaatg aattgacggg ggcccgcaca agcggtggag catgtggttt 960
aattcgatgc aacgcgaaga accttaccta ctcttgacat cctaagacga gctcagagat 1020
gagcttgtgc cttcgggaac ttagagacag gtgctgcatg gctgtcgtca gctcgtgttg 1080
tgaaatgttg ggttaagtcc cgcaacgagc gcaaccctta tcctttgttg ccagcgactt 1140
ggtcgggaac tcaaaggaga ctgccagtga taaactggag gaaggtgggg atgacgtcaa 1200
gtcatcatgg cccttacgag tagggctaca cacgtgctac aatggcgtat acagagggaa 1260
gcgaagctgc gaggtggagc gaatctcata aagtacgtct aagtccggat tggagtctgc 1320
aactcgactc catgaagtcg gaatcgctag taatcgcgaa tcagaatgtc gcggtgaata 1380
cgttcccggg ccttgtacac accgcccgtc acaccatggg agtgggttgt accagaagta 1440
gatagcttaa ccttttggag ggcgtttacc acggtatgat tcatgactgg ggtgaagtcg 1500
taacaaggta accgtagggg aacctgcggt tggatcacct ccttactga 1549
<210> 33
<211> 1542
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG3_16S_eschColi_A校准序列
<400> 33
aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa 60
gtcgaacggt aacaggaaac agcttgctgt ttcgctgacg agtggcggac gggtgagtaa 120
tgtctgggaa actgcctgat ggagggggat aactactgga aacggtagct aataccgcat 180
aacgtcgcaa gaccaaagag ggggaccttc gggcctcttg ccatcagatg tgcccagatg 240
ggattagcta gtaggtgggg taacggctca cctaggcgac gatccctagc tggtctgaga 300
ggatgaccag ccacactgga actgagacac ggtccagact cctacgggag gcagcagtgg 360
ggaatattgc acaatgggcg caagcctgat gcagccatgc cgcgtgtatg aagaaggcct 420
tcgggttgta aagtactttc agcggggagg aagggagtaa agttaatacc tttgctcatt 480
gacgttaccc gcagaagaag caccggctaa ctccgtgcca gcagccgcgg taatacggag 540
ggtgcaagcg ttaatcggaa ttactgggcg taaagcgcac gcaggcggtt tgttaagtca 600
gatgtgaaat ccccgggctc aacctgggaa ctgcatctga tactggcaag cttgagtctc 660
gtagaggggg gtagaattcc aggtgtagcg gtgaaatgcg tagagatctg gaggaatacc 720
ggtggcgaag gcggccccct ggacgaagac tgacgctcag gtgcgaaagc gtggggagca 780
aacaggatta gataccctgg tagtccacgc cgtaaacgat gtcgacttgg aggttgtgcc 840
cttgaggcgt ggcttccgga gctaacgcgt taagtcgacc gcctggggag tacggccgca 900
aggttaaaac tcaaatgaat tgacgggggc ccgcacaagc ggtggagcat gtggtttaat 960
tcgatgcaac gcgaagaacc ttacctggtc ttgacatcca cggaagtttt cagagatgag 1020
aatgtgcctt cgggaaccgt gagacaggtg ctgcatggct gtcgtcagct cgtgttgtga 1080
aatgttgggt taagtcccgc aacgagcgca acccttatcc tttgttgcca gcggtccggc 1140
cgggaactca aaggagactg ccagtgataa actggaggaa ggtggggatg acgtcaagtc 1200
atcatggccc ttacgaccag ggctacacac gtgctacaat ggcgcataca aagagaagcg 1260
acctcgcgag agcaagcgga cctcataaag tgcgtcgtag tccggattgg agtctgcaac 1320
tcgactccat gaagtcggaa tcgctagtaa tcgtggatca gaatgccacg gtgaatacgt 1380
tcccgggcct tgtacacacc gcccgtcaca ccatgggagt gggttgcaaa agaagtaggt 1440
agcttaacct tcgggagggc gcttaccact ttgtgattca tgactggggt gaagtcgtaa 1500
caaggtaacc gtaggggaac ctgcggttgg atcacctcct ta 1542
<210> 34
<211> 1170
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG5_BRAF_WT校准序列
<400> 34
atttaggctt aaataagatt gcgaaacagc ttctctgtta aaaggagtag ttctcttagc 60
aaaaccataa taatggctgt ggatcacacc tgccttaaat tgcatacctg tttttttttt 120
caacagggta cacagaacat tttgaacaca aaatacttta aacaatttag aataaaatat 180
gaaacactgt ttataagaca tatatttttg tttgaaatac actgaaactg gtttcaaaat 240
attcgtttta agggttcata tttatttaag aataaaatat gaaacactgt ttataagaca 300
tatatttttg tttgaaatac actgaaactg gtttcaaaat attcgtttta agggtaaaga 360
aaaaagttaa aaaatctatt tacataaaaa ataagaacac tgatttttgt gaatactggg 420
aactatgaaa atactatagt tgagaccttc aatgactttc tagtaactca gcagcatctc 480
agggccaaaa atttaatcag tggaaaaata gcctcaattc ttaccatcca caaaatggat 540
ccagacaact gttcaaactg atgggaccca ctccatcgag atttcactgt agctagacca 600
aaatcaccta tttttactgt gaggtcttca tgaagaaata tatctgaggt gtagtaagta 660
aaggaaaaca gtagatctca ttttcctatc agagcaagca ttatgaagag tttaggtaag 720
agatctaatt tctataattc tgtaatataa tattctttaa aacatagtac ttcatctttc 780
ctcttagagt caataagtat gtctaaaaca atgattagtt ctatttagcc tatataacct 840
gcttttaaga tttttggggc ttgaaatgtg ttaggatgag gtgagatgct ttcctaagtt 900
tataggagaa cctaaaactt tcccattaga ttttagcaat gtaggcccag atattctctt 960
ggcactcctg ggcgagcagt aaaggctcct cattggaatg aagatgctgc agatagtatc 1020
ttagtctgca cttagggaag agaaatatta tgtttttctc acctcattgt tatataattt 1080
agagtcttca gttatatctc aactaccact gagcaaggtc agaggtctga aagggactaa 1140
tagatagcta caaaactatc agttttatag 1170
<210> 35
<211> 1170
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG5_BRAF_V600E校准序列
<400> 35
atttaggctt aaataagatt gcgaaacagc ttctctgtta aaaggagtag ttctcttagc 60
aaaaccataa taatggctgt ggatcacacc tgccttaaat tgcatacctg tttttttttt 120
caacagggta cacagaacat tttgaacaca aaatacttta aacaatttag aataaaatat 180
gaaacactgt ttataagaca tatatttttg tttgaaatac actgaaactg gtttcaaaat 240
attcgtttta agggttcata tttatttaag aataaaatat gaaacactgt ttataagaca 300
tatatttttg tttgaaatac actgaaactg gtttcaaaat attcgtttta agggtaaaga 360
aaaaagttaa aaaatctatt tacataaaaa ataagaacac tgatttttgt gaatactggg 420
aactatgaaa atactatagt tgagaccttc aatgactttc tagtaactca gcagcatctc 480
agggccaaaa atttaatcag tggaaaaata gcctcaattc ttaccatcca caaaatggat 540
ccagacaact gttcaaactg atgggaccca ctccatcgag atttctctgt agctagacca 600
aaatcaccta tttttactgt gaggtcttca tgaagaaata tatctgaggt gtagtaagta 660
aaggaaaaca gtagatctca ttttcctatc agagcaagca ttatgaagag tttaggtaag 720
agatctaatt tctataattc tgtaatataa tattctttaa aacatagtac ttcatctttc 780
ctcttagagt caataagtat gtctaaaaca atgattagtt ctatttagcc tatataacct 840
gcttttaaga tttttggggc ttgaaatgtg ttaggatgag gtgagatgct ttcctaagtt 900
tataggagaa cctaaaactt tcccattaga ttttagcaat gtaggcccag atattctctt 960
ggcactcctg ggcgagcagt aaaggctcct cattggaatg aagatgctgc agatagtatc 1020
ttagtctgca cttagggaag agaaatatta tgtttttctc acctcattgt tatataattt 1080
agagtcttca gttatatctc aactaccact gagcaaggtc agaggtctga aagggactaa 1140
tagatagcta caaaactatc agttttatag 1170
<210> 36
<211> 2222
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG5_BRCA2_WT校准序列
<400> 36
gcatcacctt caagaaaggt acaattcaac caaaacacaa atctaagagt aatccaaaaa 60
aatcaagaag aaactacttc aatttcaaaa ataactgtca atccagactc tgaagaactt 120
ttctcagaca atgagaataa ttttgtcttc caagtagcta atgaaaggaa taatcttgct 180
ttaggaaata ctaaggaact tcatgaaaca gacttgactt gtgtaaacga acccattttc 240
aagaactcta ccatggtttt atatggagac acaggtgata aacaagcaac ccaagtgtca 300
attaaaaaag atttggttta tgttcttgca gaggagaaca aaaatagtgt aaagcagcat 360
ataaaaatga ctctaggtca agatttaaaa tcggacatct ccttgaatat agataaaata 420
ccagaaaaaa ataatgatta catgaacaaa tgggcaggac tcttaggtcc aatttcaaat 480
cacagttttg gaggtagctt cagaacagct tcaaataagg aaatcaagct ctctgaacat 540
aacattaaga cgagcaaaat gttcttcaaa gatattgaag aacaatatcc tactagttta 600
gcttgtgttg aaattgtaaa taccttggca ttagataatc aaaagaaact gagcaagcct 660
cagtcaatta atactgtatc tgcacattta cagagtagtg tagttgtttc tgattgtaaa 720
aatagtcata taacccctca gatgttattt tccaagcagg attttaattc aaaccataat 780
ttaacaccta gccaaaaggc agaaattaca gaactttcta ctatattaga agaatcagga 840
agtcagtttg aatttactca gtttagaaaa ccaagctaca tattgcagaa gagtacattt 900
gaagtgcctg aaaaccagat gactatctta aagaccactt ctgaggaatg cagagatgct 960
gatcttcatg tcataatgaa tgccccatcg attggtcagg tagacagcag caagcaattt 1020
gaaggtacag ttgaaattaa acggaagttt gctggcctgt tgaaaaatga ctgtaacaaa 1080
agtgcttctg gttatttaac agatgaaaat gaagtggggt ttaggggctt ttattctgct 1140
catggcacaa aactgaatgt ttctactgaa gctctgcaaa aagctgtgaa actgtttagt 1200
gatattgaga atattagtga ggaaacttct gcagaggtac atccaataag tttatcttca 1260
agtaaatgtc atgattctgt tgtttcaatg tttaagatag aaaatcataa tgataaaact 1320
gtaagtgaaa aaaataataa atgccaactg atattacaaa ataatattga aatgactact 1380
ggcacttttg ttgaagaaat tactgaaaat tacaagagaa atactgaaaa tgaagataac 1440
aaatatactg ctgccagtag aaattctcat aacttagaat ttgatggcag tgattcaagt 1500
aaaaatgata ctgtttgtat tcataaagat gaaacggact tgctatttac tgatcagcac 1560
aacatatgtc ttaaattatc tggccagttt atgaaggagg gaaacactca gattaaagaa 1620
gatttgtcag atttaacttt tttggaagtt gcgaaagctc aagaagcatg tcatggtaat 1680
acttcaaata aagaacagtt aactgctact aaaacggagc aaaatataaa agattttgag 1740
acttctgata cattttttca gactgcaagt gggaaaaata ttagtgtcgc caaagagtca 1800
tttaataaaa ttgtaaattt ctttgatcag aaaccagaag aattgcataa cttttcctta 1860
aattctgaat tacattctga cataagaaag aacaaaatgg acattctaag ttatgaggaa 1920
acagacatag ttaaacacaa aatactgaaa gaaagtgtcc cagttggtac tggaaatcaa 1980
ctagtgacct tccagggaca acccgaacgt gatgaaaaga tcaaagaacc tactctattg 2040
ggttttcata cagctagcgg gaaaaaagtt aaaattgcaa aggaatcttt ggacaaagtg 2100
aaaaaccttt ttgatgaaaa agagcaaggt actagtgaaa tcaccagttt tagccatcaa 2160
tgggcaaaga ccctaaagta cagagaggcc tgtaaagacc ttgaattagc atgtgagacc 2220
at 2222
<210> 37
<211> 2221
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG5_BRCA2_DEL校准序列
<400> 37
gcatcacctt caagaaaggt acaattcaac caaaacacaa atctaagagt aatccaaaaa 60
aatcaagaag aaactacttc aatttcaaaa ataactgtca atccagactc tgaagaactt 120
ttctcagaca atgagaataa ttttgtcttc caagtagcta atgaaaggaa taatcttgct 180
ttaggaaata ctaaggaact tcatgaaaca gacttgactt gtgtaaacga acccattttc 240
aagaactcta ccatggtttt atatggagac acaggtgata aacaagcaac ccaagtgtca 300
attaaaaaag atttggttta tgttcttgca gaggagaaca aaaatagtgt aaagcagcat 360
ataaaaatga ctctaggtca agatttaaaa tcggacatct ccttgaatat agataaaata 420
ccagaaaaaa ataatgatta catgaacaaa tgggcaggac tcttaggtcc aatttcaaat 480
cacagttttg gaggtagctt cagaacagct tcaaataagg aaatcaagct ctctgaacat 540
aacattaaga cgagcaaaat gttcttcaaa gatattgaag aacaatatcc tactagttta 600
gcttgtgttg aaattgtaaa taccttggca ttagataatc aaaagaaact gagcaagcct 660
cagtcaatta atactgtatc tgcacattta cagagtagtg tagttgtttc tgattgtaaa 720
aatagtcata taacccctca gatgttattt tccaagcagg attttaattc aaaccataat 780
ttaacaccta gccaaaaggc agaaattaca gaactttcta ctatattaga agaatcagga 840
agtcagtttg aatttactca gtttagaaaa ccaagctaca tattgcagaa gagtacattt 900
gaagtgcctg aaaaccagat gactatctta aagaccactt ctgaggaatg cagagatgct 960
gatcttcatg tcataatgaa tgccccatcg attggtcagg tagacagcag caagcaattt 1020
gaaggtacag ttgaaattaa acggaagttt gctggcctgt tgaaaaatga ctgtaacaaa 1080
agtgcttctg gttatttaac agatgaaaat gagtggggtt taggggcttt tattctgctc 1140
atggcacaaa actgaatgtt tctactgaag ctctgcaaaa agctgtgaaa ctgtttagtg 1200
atattgagaa tattagtgag gaaacttctg cagaggtaca tccaataagt ttatcttcaa 1260
gtaaatgtca tgattctgtt gtttcaatgt ttaagataga aaatcataat gataaaactg 1320
taagtgaaaa aaataataaa tgccaactga tattacaaaa taatattgaa atgactactg 1380
gcacttttgt tgaagaaatt actgaaaatt acaagagaaa tactgaaaat gaagataaca 1440
aatatactgc tgccagtaga aattctcata acttagaatt tgatggcagt gattcaagta 1500
aaaatgatac tgtttgtatt cataaagatg aaacggactt gctatttact gatcagcaca 1560
acatatgtct taaattatct ggccagttta tgaaggaggg aaacactcag attaaagaag 1620
atttgtcaga tttaactttt ttggaagttg cgaaagctca agaagcatgt catggtaata 1680
cttcaaataa agaacagtta actgctacta aaacggagca aaatataaaa gattttgaga 1740
cttctgatac attttttcag actgcaagtg ggaaaaatat tagtgtcgcc aaagagtcat 1800
ttaataaaat tgtaaatttc tttgatcaga aaccagaaga attgcataac ttttccttaa 1860
attctgaatt acattctgac ataagaaaga acaaaatgga cattctaagt tatgaggaaa 1920
cagacatagt taaacacaaa atactgaaag aaagtgtccc agttggtact ggaaatcaac 1980
tagtgacctt ccagggacaa cccgaacgtg atgaaaagat caaagaacct actctattgg 2040
gttttcatac agctagcggg aaaaaagtta aaattgcaaa ggaatctttg gacaaagtga 2100
aaaacctttt tgatgaaaaa gagcaaggta ctagtgaaat caccagtttt agccatcaat 2160
gggcaaagac cctaaagtac agagaggcct gtaaagacct tgaattagca tgtgagacca 2220
t 2221
<210> 38
<211> 1566
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG6_GENE_BCR_A校准序列
<400> 38
atggtggacc cggtgggctt cgcggaggcg tggaaggcgc agttcccgga ctcagagccc 60
ccgcgcatgg agctgcgctc agtgggcgac atcgagcagg agctggagcg ctgcaaggcc 120
tccattcggc gcctggagca ggaggtgaac caggagcgct tccgcatgat ctacctgcag 180
acgttgctgg ccaaggaaaa gacgagctat gaccggcagc gatggggctt ccggcgcgcg 240
gcgcaggccc ccgacggcgc ctccgagccc cgagcgtccg cgtcgcgccc gcagccagcg 300
cccgccgacg gagccgaccc gccgcccgcc gaggagcccg aggcccggcc cgacggcgag 360
ggttctccgg gtaaggccag gcccgggacc gcccgcaggc ccggggcagc cgcgtcgggg 420
gaacgggacg accggggacc ccccgccagc gtggcggcgc tcaggtccaa cttcgagcgg 480
atccgcaagg gccatggcca gcccggggcg gacgccgaga agcccttcta cgtgaacgtc 540
gagtttcacc acgagcgcgg cctggtgaag gtcaacgaca aagaggtgtc ggaccgcatc 600
agctccctgg gcagccaggc catgcagatg gagcgcaaaa agtcccagca cggcgcgggc 660
tcgagcgtgg gggatgcatc caggccccct taccggggac gctcctcgga gagcagctgc 720
ggcgtcgacg gcgactacga ggacgccgag ttgaaccccc gcttcctgaa ggacaacctg 780
atcgacgcca atggcggtag caggccccct tggccgcccc tggagtacca gccctaccag 840
agcatctacg tcgggggcat gatggaaggg gagggcaagg gcccgctcct gcgcagccag 900
agcacctctg agcaggagaa gcgccttacc tggccccgca ggtcctactc cccccggagt 960
tttgaggatt gcggaggcgg ctataccccg gactgcagct ccaatgagaa cctcacctcc 1020
agcgaggagg acttctcctc tggccagtcc agccgcgtgt ccccaagccc caccacctac 1080
cgcatgttcc gggacaaaag ccgctctccc tcgcagaact cgcaacagtc cttcgacagc 1140
agcagtcccc ccacgccgca gtgccataag cggcaccggc actgcccggt tgtcgtgtcc 1200
gaggccacca tcgtgggcgt ccgcaagacc gggcagatct ggcccaacga tggcgagggc 1260
gccttccatg gagacgcaga tggctcgttc ggaacaccac ctggatacgg ctgcgctgca 1320
gaccgggcag aggagcagcg ccggcaccaa gatgggctgc cctacattga tgactcgccc 1380
tcctcatcgc cccacctcag cagcaagggc aggggcagcc gggatgcgct ggtctcggga 1440
gccctggagt ccactaaagc gagtgagctg gacttggaaa agggcttgga gatgagaaaa 1500
tgggtcctgt cgggaatcct ggctagcgag gagacttacc tgagccacct ggaggcactg 1560
ctgctg 1566
<210> 39
<211> 964
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG6_GENE_ABL_B校准序列
<400> 39
atggggcagc agcctggaaa agtacttggg gaccaaagaa ggccaagctt gcctgccctg 60
cattttatca aaggagcagg gaagaaggaa tcatcgaggc atgggggtcc acactgcaat 120
gtttttgtgg aacatgaagc ccttcagcgg ccagtagcat ctgactttga gcctcagggt 180
ctgagtgaag ccgctcgttg gaactccaag gaaaaccttc tcgctggacc cagtgaaaat 240
gaccccaacc ttttcgttgc actgtatgat tttgtggcca gtggagataa cactctaagc 300
ataactaaag gtgaaaagct ccgggtctta ggctataatc acaatgggga atggtgtgaa 360
gcccaaacca aaaatggcca aggctgggtc ccaagcaact acatcacgcc agtcaacagt 420
ctggagaaac actcctggta ccatgggcct gtgtcccgca atgccgctga gtatctgctg 480
agcagcggga tcaatggcag cttcttggtg cgtgagagtg agagcagtcc tggccagagg 540
tccatctcgc tgagatacga agggagggtg taccattaca ggatcaacac tgcttctgat 600
ggcaagctct acgtctcctc cgagagccgc ttcaacaccc tggccgagtt ggttcatcat 660
cattcaacgg tggccgacgg gctcatcacc acgctccatt atccagcccc aaagcgcaac 720
aagcccactg tctatggtgt gtcccccaac tacgacaagt gggagatgga acgcacggac 780
atcaccatga agcacaagct gggcgggggc cagtacgggg aggtgtacga gggcgtgtgg 840
aagaaataca gcctgacggt ggccgtgaag accttgaagg aggacaccat ggaggtggaa 900
gagttcttga aagaagctgc agtcatgaaa gagatcaaac accctaacct ggtgcagctc 960
cttg 964
<210> 40
<211> 992
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EG6_GENE_ALK_C校准序列
<400> 40
tgtaccgccg gaagcaccag gagctgcaag ccatgcagat ggagctgcag agccctgagt 60
acaagctgag caagctccgc acctcgacca tcatgaccga ctacaacccc aactactgct 120
ttgctggcaa gacctcctcc atcagtgacc tgaaggaggt gccgcggaaa aacatcaccc 180
tcattcgggg tctgggccat ggcgcctttg gggaggtgta tgaaggccag gtgtccggaa 240
tgcccaacga cccaagcccc ctgcaagtgg ctgtgaagac gctgcctgaa gtgtgctctg 300
aacaggacga actggatttc ctcatggaag ccctgatcat cagcaaattc aaccaccaga 360
acattgttcg ctgcattggg gtgagcctgc aatccctgcc ccggttcatc ctgctggagc 420
tcatggcggg gggagacctc aagtccttcc tccgagagac ccgccctcgc ccgagccagc 480
cctcctccct ggccatgctg gaccttctgc acgtggctcg ggacattgcc tgtggctgtc 540
agtatttgga ggaaaaccac ttcatccacc gagacattgc tgccagaaac tgcctcttga 600
cctgtccagg ccctggaaga gtggccaaga ttggagactt cgggatggcc cgagacatct 660
acagggcgag ctactataga aagggaggct gtgccatgct gccagttaag tggatgcccc 720
cagaggcctt catggaagga atattcactt ctaaaacaga cacatggtcc tttggagtgc 780
tgctatggga aatcttttct cttggatata tgccataccc cagcaaaagc aaccaggaag 840
ttctggagtt tgtcaccagt ggaggccgga tggacccacc caagaactgc cctgggcctg 900
tataccggat aatgactcag tgctggcaac atcagcctga agacaggccc aactttgcca 960
tcattttgga gaggattgaa tactgcaccc ag 992
<210> 41
<211> 734
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> ERBB2_SPCR间隔物序列
<400> 41
tctcttaacc accaagcagc atgcccagag tagaggtgag aaggaaggag agagctgcgg 60
tccacatgag catctggacc tagcatggac aactcactcc tccctggctc tcgctttgtt 120
cttgttgcgg gtgtggtggt ggtgggactc aaagacggta aagatagctt tctctcctcc 180
ctggggaatc tgggggttgt ttaaaaggcc tgctcctctt ttagaaggca ggagggcccc 240
aagggaagca gaaggtgaca gaaggggaaa gggtcctctg atcattgctc accccacaga 300
gatcttgaaa ggaggggtct tgatccagcg gaacccccag ctctgctacc aggacacgat 360
tttgtggaag gacatcttcc acaagaacaa ccagctggct ctcacactga tagacaccaa 420
ccgctctcgg gcctgtaagc catgcccctc cctgctgcct cttctctcag acagcctgac 480
cccagccgca aactcccaac ttacaaccca gtgcctgccc gccactgccc cagccgccta 540
caccacccat ttcctccctc tctgtccctc ctgccatctc cctgtgcctc ttcatctctg 600
gggttctctg tcttgtctcc ctctgcttat aggttgtgcc tctggtttgg gggcctctca 660
gcctgtctgg gtccctccct tgctgtgcag ttggcctcgt ggcctctgct gctgtttgtg 720
cctctctctg ttac 734
<210> 42
<211> 734
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EGFR_SPCR间隔物序列
<400> 42
catgcatatc atttatgctg tgaccactga ctaaaccatt ctcttccttc ctccccatat 60
ttctaaattt ctaatcattg ctcaaagccc aattcagaga aaaccctagc tcctccatgg 120
caccatcatt aacaatttta tctggccgcc ccccgggaag ttcactgggc taattgcggg 180
actcttgttc gcaccatggc atctctttag cagaacataa atgcgaagag cacatgcatc 240
cttcatggga atttaaagga gctggaaaga gtgctcaccg cagttccatt ctcccgcaga 300
aatcctgcat ggcgccgtgc ggttcagcaa caaccctgcc ctgtgcaacg tggagagcat 360
ccagtggcgg gacatagtca gcagtgactt tctcagcaac atgtcgatgg acttccagaa 420
ccacctgggc agctgtaagt gtcgcataca cactatctct gcctccagct cctatggggg 480
acagctctac agcactgggg caggggagag aagccatgtt tagtaagtca cattaatcag 540
aaacaaaaag tagtaagcaa aatatctgac cactagaaaa gcatgtattt accacggaca 600
tagagatcgt ttttttgtgg cgggtggcag cccagctggt tggcagtgca ggccaccgga 660
ggcagatccc ctgcagggac agcagagcac ttgtgtcctg agaagagctg ctgttcatgg 720
ggctggcagc acca 734
<210> 43
<211> 773
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> MET_SPCR间隔物序列
<400> 43
aaatcatctc agacagggca caatgtccct actatgtaga acctctaaca ttgtgtggca 60
atgctatgct cactggacaa taatgttact ttttcacata cctgctaaca ataaaggaaa 120
ggaaggaatc agatttttaa aattttaatc accgttatga caggatttgc acacatagtt 180
gctaagtcta gaaaattcca tcaaatgata tttacatgta ccttttgtgt acttacttta 240
taattaatta acaaactaga tacccctctg gaagctcttt ccaccccttc tcttcacaga 300
tcacgaagat cccattgaat ggcttgggct gcagacattt ccagtcctgc agtcaatgcc 360
tctctgcccc accctttgtt cagtgtggct ggtgccacga caaatgtgtg cgatcggagg 420
aatgcctgag cgggacatgg actcaacaga tctgtctgcc tgcaatctac aaggtaggaa 480
tctctaacag ctggcataca tgtttttgtt tggtgttttt tttttttttt tggtttggtt 540
tggtttgttt tttgtttttt tagatacaaa tcccactaat gaaaaaaatt taaaaatcaa 600
tttactcatt tagctgtgag tcatcagcta aagcaccatc tctctcttgg ctttatccct 660
cgggcaggga gggggtggtg tttgggcatc cccccaagtc ctgcacctga agtgcttgct 720
tcacattgtc taggttctat cgctgggcag ctgctcacct ttagtgccgt gtg 773
<210> 44
<211> 748
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> BRAF_SPCR间隔物序列
<400> 44
aaacaactct ccctctcctc ctagaaacta tccaaaaatg gtttctatgg gttaggggtc 60
ttgattaatt aaacgataat ataaaatata aattaactgt atagctgaac cagcattaca 120
atttgggaga gaaatactgt ccattccaca tattattctc taactacact taaaaaaaat 180
tctctataac aatcgtatgg aagaaaaacc ctcacagact tttagacatc gtagcttcac 240
attaagaaaa tttaagtgta aaatggtagg tagaaaagag atatttttgg attacttact 300
caagttggtc ataattaaca cacatcagtg gaacttctgt actacaacgc tggtgaaatt 360
tataaccaca tgtttgacag cggaaaccct ggaaaagcag ctttcgacaa aagtcacaaa 420
atgctaaggt gaaaaacgtt tttcgtacct gcaaagtaaa aaatcacaga gatttcaaaa 480
actcacaaga aaactttcta gaaactgacg tatctactct cttgtttaaa ataacaaagt 540
tgtaatatat ttatatcatg aaactcacat actaaagtac tattataaaa tgaaaaccgg 600
gggttcaaga taatagatgg actacacata tttatttccc accccactat ctaacttaaa 660
aacccagaag ttaaaaaatg agaaatgagt aaaaggctgg caactgattt caagcttgac 720
aacataaaag taaaagtaga catgaaaa 748
<210> 45
<211> 790
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> FGFR1_SPCR间隔物序列
<400> 45
caaatgcctt ccttgtgtag ctgaccccaa agccccagtg acgttgctct caaagcttat 60
tacagaccag caccacccat ccctgcagcc ctctgttccc agctcacctc cactttgtga 120
cctctgttac tagtcctggg ggatgtggct agatccctac tgagatggag tgtgtgtgcc 180
tgaagcgtga ggaatgatcc cattcggggg caactgagcc tgcccacagg aacttgagcc 240
cccgagacag tggtctcctt cccagtagac tggcccacga agactggtgc catgattacc 300
ttcaagatct ggacataagg caggttgtct gggccaatct tgctcccatt cacctcgatg 360
tgctttagcc actggatgtg cggctgcggg tcactgtaca ccttacacat gaactccacg 420
ttgctaccca gggccactgt tttgttggcg ggcaaccctg cttgcaggat gggccggtga 480
ggggaccgct ctgtggaaga tgggagagga ggcacttgtc atggggacct tgccatggct 540
aaagaggggt gggctcacct gcgccccact tggctttccc agtgatgggt tgtaaacctc 600
ccagcacttc tgctgagccc aagcctctca aaacagagct ggggaaaggg acaccctctc 660
ttcaggccct aagccatcag gatcctcctc cccaaggcag tcatcatatt tacagtcaca 720
gtaagtcgct catgctttaa tggagaacct tctaattcag ttgcaccccc agacctcagc 780
acaacctgct 790
<210> 46
<211> 70
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1A完整序列
<400> 46
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctca 60
cggtgttctt 70
<210> 47
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1A引物序列
<400> 47
aatgatacgg cgaccaccga 20
<210> 48
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1A校准序列
<400> 48
cacggtgttc tt 12
<210> 49
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1A Y序列
<400> 49
gatctacact ctttccctac acgacgctct tccgatct 38
<210> 50
<211> 70
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2A完整序列
<400> 50
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctcc 60
ttggctatgt 70
<210> 51
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2A引物序列
<400> 51
aatgatacgg cgaccaccga 20
<210> 52
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2A校准序列
<400> 52
ccttggctat gt 12
<210> 53
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2A Y序列
<400> 53
gatctacact ctttccctac acgacgctct tccgatct 38
<210> 54
<211> 70
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3A完整序列
<400> 54
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctct 60
cacttgtggt 70
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3A引物序列
<400> 55
aatgatacgg cgaccaccga 20
<210> 56
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3A校准序列
<400> 56
ctcacttgtg gt 12
<210> 57
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3A Y序列
<400> 57
gatctacact ctttccctac acgacgctct tccgatct 38
<210> 58
<211> 70
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4A完整序列
<400> 58
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctgc 60
tgcactttgt 70
<210> 59
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4A引物序列
<400> 59
aatgatacgg cgaccaccga 20
<210> 60
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4A校准序列
<400> 60
gctgcacttt gt 12
<210> 61
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4A Y序列
<400> 61
gatctacact ctttccctac acgacgctct tccgatct 38
<210> 62
<211> 75
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1B完整序列
<400> 62
agaacaccgt gagatcggaa gagcacacgt ctgaactcca gtcacatcac gatctcgtat 60
gccgtcttct gcttg 75
<210> 63
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1B引物序列
<400> 63
atctcgtatg ccgtcttctg cttg 24
<210> 64
<211> 11
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1B校准序列
<400> 64
agaacaccgt g 11
<210> 65
<211> 33
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y1B Y序列
<400> 65
gatcggaaga gcacacgtct gaactccagt cac 33
<210> 66
<211> 75
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2B完整序列
<400> 66
catagccaag gagatcggaa gagcacacgt ctgaactcca gtcacatcac gatctcgtat 60
gccgtcttct gcttg 75
<210> 67
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2B引物序列
<400> 67
atctcgtatg ccgtcttctg cttg 24
<210> 68
<211> 11
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2B校准序列
<400> 68
catagccaag g 11
<210> 69
<211> 33
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y2B Y序列
<400> 69
gatcggaaga gcacacgtct gaactccagt cac 33
<210> 70
<211> 75
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3B完整序列
<400> 70
ccacaagtga gagatcggaa gagcacacgt ctgaactcca gtcacatcac gatctcgtat 60
gccgtcttct gcttg 75
<210> 71
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3B引物序列
<400> 71
atctcgtatg ccgtcttctg cttg 24
<210> 72
<211> 11
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3B校准序列
<400> 72
ccacaagtga g 11
<210> 73
<211> 33
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y3B Y序列
<400> 73
gatcggaaga gcacacgtct gaactccagt cac 33
<210> 74
<211> 75
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4B完整序列
<400> 74
caaagtgcag cagatcggaa gagcacacgt ctgaactcca gtcacatcac gatctcgtat 60
gccgtcttct gcttg 75
<210> 75
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4B引物序列
<400> 75
atctcgtatg ccgtcttctg cttg 24
<210> 76
<211> 11
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4B校准序列
<400> 76
caaagtgcag c 11
<210> 77
<211> 33
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y4B Y序列
<400> 77
gatcggaaga gcacacgtct gaactccagt cac 33
<210> 78
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y5A完整序列
<400> 78
tgacagacaa gggtaatcca tgtaacacca tgaacacatc t 41
<210> 79
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y5A校准序列
<400> 79
tccatgtaac accatgaaca catct 25
<210> 80
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y5A Y序列
<400> 80
tgacagacaa gggtaa 16
<210> 81
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y6A完整序列
<400> 81
tgacagacaa gggtaaacta gtacacataa gacccacttc t 41
<210> 82
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y6A校准序列
<400> 82
actagtacac ataagaccca cttct 25
<210> 83
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y6A Y序列
<400> 83
tgacagacaa gggtaa 16
<210> 84
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y7A完整序列
<400> 84
tgacagacaa gggtaacaac tcaactaagg tactcctaac t 41
<210> 85
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y7A校准序列
<400> 85
caactcaact aaggtactcc taact 25
<210> 86
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y7A Y序列
<400> 86
tgacagacaa gggtaa 16
<210> 87
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y8A完整序列
<400> 87
tgacagacaa gggtaagaaa cccatcaatc gcttaacatc t 41
<210> 88
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y8A校准序列
<400> 88
gaaacccatc aatcgcttaa catct 25
<210> 89
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y8A Y序列
<400> 89
tgacagacaa gggtaa 16
<210> 90
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y5B完整序列
<400> 90
gatgtgttca tggtgttaca tggattaccc ttgtctgtca 40
<210> 91
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y5B校准序列
<400> 91
gatgtgttca tggtgttaca tgga 24
<210> 92
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y5B Y序列
<400> 92
ttacccttgt ctgtca 16
<210> 93
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y6B完整序列
<400> 93
gaagtgggtc ttatgtgtac tagtttaccc ttgtctgtca 40
<210> 94
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y6B校准序列
<400> 94
gaagtgggtc ttatgtgtac tagt 24
<210> 95
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y6B Y序列
<400> 95
ttacccttgt ctgtca 16
<210> 96
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y7B完整序列
<400> 96
gttaggagta ccttagttga gttgttaccc ttgtctgtca 40
<210> 97
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y7B校准序列
<400> 97
gttaggagta ccttagttga gttg 24
<210> 98
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y7B Y序列
<400> 98
ttacccttgt ctgtca 16
<210> 99
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y8B完整序列
<400> 99
gatgttaagc gattgatggg tttcttaccc ttgtctgtca 40
<210> 100
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y8B校准序列
<400> 100
gatgttaagc gattgatggg tttc 24
<210> 101
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y8B Y序列
<400> 101
ttacccttgt ctgtca 16
<210> 102
<211> 90
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y9A完整序列
<400> 102
caagtgcata aggagatgtt caaactgatg ggacccactc catcgagatt tctctgtagc 60
tagaccaaaa tcacctattt ttactgtgat 90
<210> 103
<211> 73
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y9A校准序列
<400> 103
tgttcaaact gatgggaccc actccatcga gatttctctg tagctagacc aaaatcacct 60
atttttactg tga 73
<210> 104
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y9A Y序列
<400> 104
caagtgcata aggaga 16
<210> 105
<211> 89
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y9B完整序列
<400> 105
tcacagtaaa aataggtgat tttggtctag ctacagagaa atctcgatgg agtgggtccc 60
atcagtttga acatctcctt atgcacttg 89
<210> 106
<211> 73
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y9B校准序列
<400> 106
tcacagtaaa aataggtgat tttggtctag ctacagagaa atctcgatgg agtgggtccc 60
atcagtttga aca 73
<210> 107
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y9B Y序列
<400> 107
tctccttatg cacttg 16
<210> 108
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y10A完整序列
<400> 108
taaggaagat agacgcactc ccaccattga tgtccaaaag t 41
<210> 109
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y10A校准序列
<400> 109
actcccacca ttgatgtcca aaagt 25
<210> 110
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y10A Y序列
<400> 110
taaggaagat agacgc 16
<210> 111
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y11A完整序列
<400> 111
taaggaagat agacgcactc ccaccattca tgtccaaaag t 41
<210> 112
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y11A校准序列
<400> 112
accattcatg tccaaaagt 19
<210> 113
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y11A Y序列
<400> 113
taaggaagat agacgc 16
<210> 114
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y10B完整序列
<400> 114
cttttggaca tcaatggtgg gagtgcgtct atcttcctta 40
<210> 115
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y10B校准序列
<400> 115
cttttggaca tcaatggtgg gagt 24
<210> 116
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y10B Y序列
<400> 116
gcgtctatct tcctta 16
<210> 117
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y11B完整序列
<400> 117
cttttggaca tgaatggtgg gagtgcgtct atcttcctta 40
<210> 118
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y11B校准序列
<400> 118
cttttggaca tgaatggtgg gagt 24
<210> 119
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y11B Y序列
<400> 119
gcgtctatct tcctta 16
<210> 120
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y12F完整序列
<400> 120
ttgggctggc cactgatgct attcagggca tgaactactt gg 42
<210> 121
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y12F引物序列
<400> 121
ttcagggcat gaactacttg g 21
<210> 122
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y12F校准序列
<400> 122
ttgggctggc cactgatgct a 21
<210> 123
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y13F完整序列
<400> 123
ttgggcgggc cagcattgca gttcagggca tgaactactt gg 42
<210> 124
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y13F引物序列
<400> 124
ttcagggcat gaactacttg g 21
<210> 125
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y13F校准序列
<400> 125
ttgggcgggc cagcattgca g 21
<210> 126
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y14F完整序列
<400> 126
ttgggcaggc catcactatc cttcagggca tgaactactt gg 42
<210> 127
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y14F引物序列
<400> 127
ttcagggcat gaactacttg g 21
<210> 128
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y14F校准序列
<400> 128
ttgggcaggc catcactatc c 21
<210> 129
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y12R完整序列
<400> 129
ttgggctggc cactgatgct atgcctcctt ctgcatggta t 41
<210> 130
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y12R引物序列
<400> 130
tgcctccttc tgcatggtat 20
<210> 131
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y12R校准序列
<400> 131
ttgggctggc ca 12
<210> 132
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y13R完整序列
<400> 132
ttgggcgggc cagcattgca gtgcctcctt ctgcatggta t 41
<210> 133
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y13R引物序列
<400> 133
tgcctccttc tgcatggtat 20
<210> 134
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y13R校准序列
<400> 134
ttgggcaggc ca 12
<210> 135
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y14R完整序列
<400> 135
ttgggcaggc catcactatc ctgcctcctt ctgcatggta t 41
<210> 136
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y14R引物序列
<400> 136
tgcctccttc tgcatggtat 20
<210> 137
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Y14R校准序列
<400> 137
ttgggcgggc ca 12
<210> 138
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT mRNA衔接子
<400> 138
tttttttttt tttttttttt ttttgggctg gcca 34
<210> 139
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT mRNA衔接子引物序列
<400> 139
tttttttttt tttttttttt tt 22
<210> 140
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT mRNA衔接子校准序列
<400> 140
ttgggctggc ca 12
<210> 141
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT mRNA衔接子
<400> 141
tttttttttt tttttttttt ttttgggcag gcca 34
<210> 142
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT mRNA衔接子引物序列
<400> 142
tttttttttt tttttttttt tt 22
<210> 143
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT mRNA衔接子校准序列
<400> 143
ttgggcaggc ca 12
<210> 144
<211> 86
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 天然(HIV)序列衔接子
<400> 144
caagtgcata aggagaaagc tttagacaag atagaggaag agcaaaacaa aagtaagaaa 60
aaagcacagc aagcagcagc tgacac 86
<210> 145
<211> 70
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 天然(HIV)序列衔接子引物序列
<400> 145
aagctttaga caagatagag gaagagcaaa acaaaagtaa gaaaaaagca cagcaagcag 60
cagctgacac 70
<210> 146
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 天然(HIV)序列衔接子校准序列
<400> 146
caagtgcata aggaga 16
<210> 147
<211> 86
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 天然(HIV)序列衔接子
<400> 147
tctccttatg cacttggtgt cagctgctgc ttgctgtgct tttttcttac ttttgttttg 60
ctcttcctct atcttgtcta aagctt 86
<210> 148
<211> 70
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 天然(HIV)序列衔接子引物序列
<400> 148
gtgtcagctg ctgcttgctg tgcttttttc ttacttttgt tttgctcttc ctctatcttg 60
tctaaagctt 70
<210> 149
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 天然(HIV)序列衔接子校准序列
<400> 149
tctccttatg cacttg 16
<210> 150
<211> 44
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PCR引物1.0 (P5)
<400> 150
aatgatacgg cgaccaccga gatctacact ctttccctac acga 44
<210> 151
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> PCR引物2.0 (P7)
<400> 151
caagcagaag acggcatacg agat 24
<210> 152
<211> 57
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq通用衔接子
<400> 152
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatc 57
<210> 153
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引1
<400> 153
gatcggaaga gcacacgtct gaactccagt cacatcacga tctcgtatgc cgtcttctgc 60
ttg 63
<210> 154
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引2
<400> 154
gatcggaaga gcacacgtct gaactccagt caccgatgta tctcgtatgc cgtcttctgc 60
ttg 63
<210> 155
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引3
<400> 155
gatcggaaga gcacacgtct gaactccagt cacttaggca tctcgtatgc cgtcttctgc 60
ttg 63
<210> 156
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引4
<400> 156
gatcggaaga gcacacgtct gaactccagt cactgaccaa tctcgtatgc cgtcttctgc 60
ttg 63
<210> 157
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引5
<400> 157
gatcggaaga gcacacgtct gaactccagt cacacagtga tctcgtatgc cgtcttctgc 60
ttg 63
<210> 158
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引6
<400> 158
gatcggaaga gcacacgtct gaactccagt cacgccaata tctcgtatgc cgtcttctgc 60
ttg 63
<210> 159
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引7
<400> 159
gatcggaaga gcacacgtct gaactccagt caccagatca tctcgtatgc cgtcttctgc 60
ttg 63
<210> 160
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引8
<400> 160
gatcggaaga gcacacgtct gaactccagt cacacttgaa tctcgtatgc cgtcttctgc 60
ttg 63
<210> 161
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引9
<400> 161
gatcggaaga gcacacgtct gaactccagt cacgatcaga tctcgtatgc cgtcttctgc 60
ttg 63
<210> 162
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引10
<400> 162
gatcggaaga gcacacgtct gaactccagt cactagctta tctcgtatgc cgtcttctgc 60
ttg 63
<210> 163
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引11
<400> 163
gatcggaaga gcacacgtct gaactccagt cacggctaca tctcgtatgc cgtcttctgc 60
ttg 63
<210> 164
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引12
<400> 164
gatcggaaga gcacacgtct gaactccagt caccttgtaa tctcgtatgc cgtcttctgc 60
ttg 63
<210> 165
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引13
<400> 165
gatcggaaga gcacacgtct gaactccagt cacagtcaac aatctcgtat gccgtcttct 60
gcttg 65
<210> 166
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引14
<400> 166
gatcggaaga gcacacgtct gaactccagt cacagttccg tatctcgtat gccgtcttct 60
gcttg 65
<210> 167
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引15
<400> 167
gatcggaaga gcacacgtct gaactccagt cacatgtcag aatctcgtat gccgtcttct 60
gcttg 65
<210> 168
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引16
<400> 168
gatcggaaga gcacacgtct gaactccagt cacccgtccc gatctcgtat gccgtcttct 60
gcttg 65
<210> 169
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引18
<400> 169
gatcggaaga gcacacgtct gaactccagt cacgtccgca catctcgtat gccgtcttct 60
gcttg 65
<210> 170
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引19
<400> 170
gatcggaaga gcacacgtct gaactccagt cacgtgaaac gatctcgtat gccgtcttct 60
gcttg 65
<210> 171
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引20
<400> 171
gatcggaaga gcacacgtct gaactccagt cacgtggcct tatctcgtat gccgtcttct 60
gcttg 65
<210> 172
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引21
<400> 172
gatcggaaga gcacacgtct gaactccagt cacgtttcgg aatctcgtat gccgtcttct 60
gcttg 65
<210> 173
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引22
<400> 173
gatcggaaga gcacacgtct gaactccagt caccgtacgt aatctcgtat gccgtcttct 60
gcttg 65
<210> 174
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引23
<400> 174
gatcggaaga gcacacgtct gaactccagt cacgagtgga tatctcgtat gccgtcttct 60
gcttg 65
<210> 175
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引25
<400> 175
gatcggaaga gcacacgtct gaactccagt cacactgata tatctcgtat gccgtcttct 60
gcttg 65
<210> 176
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引27
<400> 176
gatcggaaga gcacacgtct gaactccagt cacattcctt tatctcgtat gccgtcttct 60
gcttg 65
<210> 177
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引1
<400> 177
caagcagaag acggcatacg agatcgtgat gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 178
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引2
<400> 178
caagcagaag acggcatacg agatacatcg gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 179
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引3
<400> 179
caagcagaag acggcatacg agatgcctaa gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 180
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引4
<400> 180
caagcagaag acggcatacg agattggtca gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 181
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引5
<400> 181
caagcagaag acggcatacg agatcactgt gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 182
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引6
<400> 182
caagcagaag acggcatacg agatattggc gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 183
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引7
<400> 183
caagcagaag acggcatacg agatgatctg gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 184
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引8
<400> 184
caagcagaag acggcatacg agattcaagt gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 185
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引9
<400> 185
caagcagaag acggcatacg agatctgatc gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 186
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引10
<400> 186
caagcagaag acggcatacg agataagcta gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 187
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引11
<400> 187
caagcagaag acggcatacg agatgtagcc gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 188
<211> 64
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEB索引12
<400> 188
caagcagaag acggcatacg agattacaag gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 189
<211> 58
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> NEBnext通用引物
<400> 189
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 190
<211> 65
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 用于Illumina的NEBNext衔接子
<220>
<221> n
<222> (32)..(32)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (32)..(32)
<223> n是a、c、g或t
<400> 190
gatcggaaga gcacacgtct gaactccagt cnacactctt tccctacacg acgctcttcc 60
gatct 65
<210> 191
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 16S Fwd
<400> 191
agrgttygat ymtggctcag 20
<210> 192
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 23S Rev
<400> 192
cgacatcgag gtgccaaac 19
<210> 193
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引1
<400> 193
atcacg 6
<210> 194
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引2
<400> 194
cgatgt 6
<210> 195
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引3
<400> 195
ttaggc 6
<210> 196
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引4
<400> 196
tgacca 6
<210> 197
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引5
<400> 197
acagtg 6
<210> 198
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引6
<400> 198
gccaat 6
<210> 199
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引7
<400> 199
cagatc 6
<210> 200
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引8
<400> 200
acttga 6
<210> 201
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引9
<400> 201
gatcag 6
<210> 202
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引10
<400> 202
tagctt 6
<210> 203
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引11
<400> 203
ggctac 6
<210> 204
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引12
<400> 204
cttgta 6
<210> 205
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引13
<400> 205
agtcaaca 8
<210> 206
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引14
<400> 206
agttccgt 8
<210> 207
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引15
<400> 207
atgtcaga 8
<210> 208
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引16
<400> 208
ccgtcccg 8
<210> 209
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引18
<400> 209
gtccgcac 8
<210> 210
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引19
<400> 210
gtgaaacg 8
<210> 211
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引20
<400> 211
gtggcctt 8
<210> 212
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引21
<400> 212
gtttcgga 8
<210> 213
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引22
<400> 213
cgtacgta 8
<210> 214
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引23
<400> 214
gagtggat 8
<210> 215
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引25
<400> 215
actgatat 8
<210> 216
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> TruSeq衔接子,索引27
<400> 216
attccttt 8
<210> 217
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> UMI
<220>
<221> n
<222> (1)..(12)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (1)..(12)
<223> n是a、c、g或t
<400> 217
nnnnnnnnnn nn 12
<210> 218
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> polyT
<400> 218
tttttttttt tttttttttt tt 22
<210> 219
<211> 149
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 实验读段序列 1
<400> 219
cacggtgttc ttgcgccagc acgatggcca ggccgagccc gacctcggcc gccgcgatga 60
cgatgacgaa caacgtgagc acctgcccgc tgtgcagccg gtcgcgcagc cagacgtcga 120
acgcgaccag gttgaggttg accgcgttg 149
<210> 220
<211> 783
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 实验读段序列 2
<400> 220
catgacagac aagggtaaga aacccatcaa tcgcttaaca tcacagagcc cagttctgtt 60
gtctatgact tggcgaagaa gaacaagtct gaactgatat actctcgtga ttccactttt 120
aagtagtacc ataaatagaa ttatacggaa gtagtaggtt cagtgtgcat ttaaatctaa 180
cttagtggga gtatttcaaa acttaccgta actattagct ctttagagtt agagcggtga 240
attggctttg cgattatatt tacgaggact tctgcggtta cctagaactt aactacgtcg 300
tggtacgtgc aaaagtcatt tctttcaacg tgtggtaaaa aagttacaag ccactagact 360
aaagacacgt acaagttgtg agaagtcaac tcataaattt attaggttat aaggacgttg 420
aatagttatt tggttattca atggtagtac tacctaccaa caatagtaca ccagttcagg 480
cttgttcttc gccaagtcat agacaacaga actggtgtgc tcattgggaa tgatatactc 540
actataagca actcaagctc ttcctggcga tcctggagtc atcattgact tcacttaacg 600
agtctggtgt tgcagcaagt aaataaatat cataaaataa tactgctcag aagcaataga 660
cacgacagtt gggccaaatg caataattct ttcgtatatt attcatattt tcacgtgaga 720
aactaccctc tttgcgatta ttctgttgag ctttcagatc ttcaacgttg atgtcagcta 780
act 783
<210> 221
<211> 965
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 实验读段序列 3
<400> 221
aagtgcatga gagatgttca aactgatggg acccactcca tcgagatttc tctgtagcta 60
gaccaaaatc acctattttt actgtgattt tgttaaccag gctaatataa aagtgatgga 120
tcgaaagtac gctcgttcat tattagatct tatcttattg aaatttatta tatcgtttta 180
ttaaaaacta tataatattg ctatacgttt ttacaaatat ctgtaaatta aacaaagtat 240
aatataaaaa atagtataag aaattaatgt cgttaatatc gatgtatttt attactcttg 300
acttatacta agtaatcttt taaaaagatc aattatctac taaaaacgtt cataagactt 360
cttcattatt tttatatact atggtttggg agtatctttt tcgttaagta gtatatttta 420
gcatcgatgt tccgtccgcg ttttgcgaaa ggaaggtttc ttggcgtgct cgcttaaatg 480
agtcgtatga cgagtctgtt aaatgatata tttatgcagg taagctacaa taaaagatca 540
gaaaaataga ttcatttaac agactcgtca tacgactcat ttagcgagca cgccaaattt 600
cctttcacaa aaacacaggc agatatcgac catcccccaa accataatta tagtataatt 660
ttaatcagat aattgatctt ttaaagatta cttcttagta ctcaagtcaa ggtaacaaaa 720
aatcaaccta ttacctgcgc atgttatgct gtttaattca tagatgacta acaaaacata 780
taactgtatt atatagtttt tagcaaaacg atataaccaa cttcaataaa agacaagatc 840
taataatgaa cgggcgtgct cgtcacttta tattaaaaat tggttaacaa atcacgggct 900
gatctcagct acagaaaatc tcgtatagtc cctcctttga acatcatacg cagtatacac 960
atggc 965
<210> 222
<211> 457
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 实验读段序列 4
<400> 222
aagtgcataa ggagatggga ccctcccatc gagatttctc tgtagctaac caaaatcacc 60
taggccagtt aattaagaat ttaccgctct tcagcaaaat caagaacgag ctagaaatca 120
gccgccaggg ctttctgaaa gcgtagactc aacccgctat ggtggtcagc gcatgctata 180
ccgtatagct ctctgacggt ggttatcgat ctccgggcga cagtcaccac tgcccaccct 240
atattttcct cttattaccg gtcccatcac tcgtaaaggt cacccagcac agagttgacc 300
tcaggtttcc tcataccacc tccagcggaa ggacgtatcc acaggccgag gtacacaagt 360
gcataaggag atgttcaaac tgatgggacc cactccatcg agatttctct gtagctagac 420
caaaatcacc tatttttact gtgagaagca atacgta 457
<210> 223
<211> 1268
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 实验读段序列 5
<400> 223
gtttgattag accgtattgc taggaagata gacgcactcc caccattcat gtccaaaagt 60
aggccagtta attaagaggt accgctcttc agcaaaatca agaacgagct agaaatcagc 120
cgcgagggct ttctaggcgt agactttcaa cccgctatgt ggtaggtcag cacgccctat 180
accgtatagc tctgacggtg gttatcgatc tccggacgcg agtccagtca tacatcactc 240
gtaaggtcac ccagcacagg gagttgaccc tccgggtttt cacatgcctc agcggaaggc 300
attatcctga gccagtgcca cgctactaga cctgccggtg aaaacctaag actacagtaa 360
cgccaagacc ctctcccaca ggctagtttg ccagacctca aaagtacggc ccccagcagt 420
aaactgccgg accacaaggt gctgggtgta gcgctcttga agatggagcc cttccggctt 480
cttccaccac ttcgctttga acgacgtact actccaaagc actatgacgc ggtcagaatt 540
ccctttgagt ccgaccagac ctgatgggag gaaaaaattg ggatataagc tcgaatcacc 600
aagtcttgtg ggctgataca gggagccaca ggtcaccacc gccgcctcta aacccggtaa 660
acccactata ttccattcca agttgacttg ggctcaacgc gcaaattacg gcccaacatg 720
cgccgtatta gaagaaagca ccagccagct gcaccaagta ccaaagtaag cgtctcggaa 780
cagcgtcacc atcctcgggt agaactatga ggcaagtgcc attagcgacc agtacttcca 840
acctttcaga gtcgaagggc caatcgttgc ctcataaagc ggacaccgct tttaagacac 900
ccggcacttc catggaaggt gcttcgctag gtttaccagt cataccctgc gaactactgt 960
gatagccgcg ctccgaccaa tgataccgat cctcgggagg gaccgaaacg atgcgagttt 1020
ggtacgtgaa cgtaatgtct tcctgttgcg agaatacaac gcaacgaagg tcctaacata 1080
cacagcctag aggctgcaat gcaaagcgag gttacgttgc cacgacggca ataagtgtaa 1140
cggctttcag ggcacaactg gggcgtgagc cgcgctctag ccgacacacg cagcgtcagc 1200
cagcctatgc taaatttacc cctcgctgaa gagcagctca tggcgcgcct aggcctagca 1260
atacgtaa 1268
<210> 224
<211> 130
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 实验读段序列 6
<400> 224
cttgtattgg gctggccact gatgctattc agggcatgaa ctacttggag gaccgtcgct 60
tggtgcaccg cgacctggca gccaggacgt actggtgaaa acaccgcagc atgtcaagat 120
cacagatttt 130
<210> 225
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> IDT双索引UMI衔接子1
<220>
<221> n
<222> (9)..(17)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (9)..(17)
<223> n是a、c、g或t
<400> 225
ctgatcgtnn nnnnnnn 17
<210> 226
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> IDT双索引UMI衔接子2
<220>
<221> n
<222> (9)..(17)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (9)..(17)
<223> n是a、c、g或t
<400> 226
actctcgann nnnnnnn 17
<210> 227
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> IDT双索引UMI衔接子3
<220>
<221> n
<222> (9)..(17)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (9)..(17)
<223> n是a、c、g或t
<400> 227
tgagctagnn nnnnnnn 17
<210> 228
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> IDT双索引UMI衔接子4
<220>
<221> n
<222> (9)..(17)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (9)..(17)
<223> n是a、c、g或t
<400> 228
gagacgatnn nnnnnnn 17
<210> 229
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> IDT双索引UMI衔接子5
<220>
<221> n
<222> (9)..(17)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (9)..(17)
<223> n是a、c、g或t
<400> 229
cttgtcgann nnnnnnn 17
<210> 230
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> IDT双索引UMI衔接子6
<220>
<221> n
<222> (9)..(17)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (9)..(17)
<223> n是a、c、g或t
<400> 230
ttccaaggnn nnnnnnn 17

Claims (32)

1.一种分离的多核苷酸序列,包含两种或更多种校准序列,其中所述校准序列各自独立地代表天然存在的多核苷酸序列,并且其中所述校准序列以在任何天然存在的基因组中都没发现的排列连续地排列在所述多核苷酸序列内。
2.根据权利要求1所述的多核苷酸序列,其中所述校准序列中的一种或更多种以两个或更多个拷贝数存在于所述多核苷酸序列内。
3.根据前述权利要求中任一项所述的多核苷酸序列,其中第一校准序列代表外显子、内含子、基因、等位基因、染色体或基因组序列,并且其中第二校准序列不同于所述第一校准序列并且独立地代表不同的外显子、内含子、基因、等位基因、染色体或基因组序列。
4.根据权利要求3所述的多核苷酸序列,其中所述第二校准序列代表所述第一校准序列的变体。
5.根据权利要求4所述的多核苷酸序列,其中所述第二校准序列与所述第一校准序列至少90%相同。
6.根据权利要求5所述的多核苷酸序列,其中与所述第一校准序列相比,所述变体包含一个或更多个SNP、一个或更多个插入、一个或更多个缺失、一个或更多个微卫星、多于一种核苷酸多态性、一个或更多个重复、一个或更多个串联重复计数变体、一个或更多个倒位、一个或更多个转换、一个或更多个颠换和/或一个或更多个易位。
7.根据权利要求3-6中任一项所述的多核苷酸序列,其中所述第一校准序列和/或所述第二校准序列指示癌症、遗传性疾病、病原体、耐药性、循环肿瘤DNA、循环胎儿DNA、循环母体DNA或其它感兴趣的属性中的任何一种或更多种。
8.根据权利要求2-7中任一项所述的多核苷酸序列,其中所述两个或更多个拷贝数选择为复制由所述校准序列代表的天然存在序列的天然存在频率。
9.根据权利要求8所述的多核苷酸序列,其中所述两个或更多个拷贝数选择为复制天然存在的人类多核苷酸序列的纯合、杂合和/或体细胞等位基因频率中的任何一种或更多种。
10.根据权利要求8所述的多核苷酸序列,其中所述两个或更多个拷贝数选择为复制以下中的任何一种或更多种:基因组丰度、染色体丰度、基因表达水平、同种型表达水平、变体等位基因频率、纯合基因型、杂合基因型、体细胞突变频率、拷贝数变异、基因扩增、基因缺失、三体性、染色体非整倍性、微生物丰度、病毒丰度或变化的mRNA表达水平。
11.根据任一项前述权利要求所述的多核苷酸序列,其中一种校准序列代表母体来源的多核苷酸,并且另一种校准序列代表父体来源的多核苷酸。
12.根据任一项前述权利要求所述的多核苷酸序列,其中所述天然存在的多核苷酸序列来源于人类、原核生物、细菌、病毒、噬菌体或细胞器基因组。
13.根据任一项前述权利要求所述的多核苷酸序列,其中所述校准序列的长度独立地在18个核苷酸和20,000个核苷酸之间。
14.根据权利要求13所述的多核苷酸序列,其中所述校准序列的长度独立地在100个核苷酸和2,000个核苷酸之间。
15.根据任一项前述权利要求所述的多核苷酸序列,其中所述校准序列中的两个或更多个被间隔物序列分开。
16.根据任一项前述权利要求所述的多核苷酸序列,所述多核苷酸序列包含位于所述校准序列中的一种或更多种的5'和/或3'的一种或更多种旁侧或末端序列。
17.根据权利要求1-14中任一项所述的多核苷酸序列,其中所述校准序列中的两种或更多种在所述多核苷酸序列内连续排列。
18.根据任一项前述权利要求所述的多核苷酸序列,其中所述校准序列中的至少两种具有不同的核苷酸长度。
19.根据任一项前述权利要求所述的多核苷酸序列,所述多核苷酸序列为DNA或RNA多核苷酸序列。
20.一种载体,包含编码任一项前述权利要求所述的多核苷酸序列的DNA序列,所述DNA序列可操作地连接到以下中的任何一种或更多种:5'启动子;旁侧(3'和5')内切核酸酶位点;和3'聚腺嘌呤重复段。
21.一种制备权利要求1-19中任一项所述的多核苷酸序列的方法,包括提供和连接所述两种或更多种校准序列;任选地还包括提供和连接旁侧序列或末端序列和/或间隔物序列,如果所述旁侧序列或末端序列和/或间隔物序列存在的话。
22.一种组合物,包含两种或更多种权利要求1-19中任一项所述的多核苷酸序列。
23.一种提供用于校准循环DNA检测方法的多核苷酸的方法,所述方法包括使权利要求1-19中任一项所述的多核苷酸序列片段化以产生一种或更多种多核苷酸片段,所述一种或更多种多核苷酸片段适合于校准循环DNA检测方法。
24.一种提供用于校准RNA测序方法的多核苷酸的方法,所述方法包括对权利要求1-19中任一项所述的多核苷酸序列进行体外转录以产生一种或更多种RNA片段,所述多核苷酸序列是DNA多核苷酸序列,所述一种或更多种RNA片段适合于校准RNA测序方法。
25.一种校准多核苷酸测序过程的方法,包括:
i)使权利要求1-19中任一项所述的多核苷酸序列在给定的一组参数下经历多核苷酸测序过程;
ii)记录由i)中进行的所述测序过程确定的校准序列的序列;
iii)将ii)中记录的所述校准序列的序列与权利要求1-19中任一项所述的多核苷酸序列中的相应的校准序列的已知序列进行比较;和
iv)使包含感兴趣的多核苷酸的样品在同一组参数下经历在i)中进行的相同测序过程;
其中iii)中的序列确定的准确性用于校准iv)中的序列确定。
26.根据权利要求25所述的方法,其中iv)中的定量过程是在不存在权利要求1-19中任一项所述的多核苷酸序列的情况下进行的。
27.一种校准多核苷酸定量过程的方法,包括:
i)使权利要求1-19中任一项所述的多核苷酸序列在给定的一组参数下经历多核苷酸定量过程;
ii)记录由i)中进行的所述定量过程确定的校准序列的数量;
iii)将ii)中记录的所述校准序列的数量与权利要求1-15中任一项所述的多核苷酸序列中的相应的校准序列的已知数量进行比较;和
iv)使包含感兴趣的多核苷酸的样品在同一组参数下经历在i)中进行的相同定量过程;
其中iii)中的数量确定的准确性用于校准iv)中的数量确定。
28.根据权利要求27所述的方法,其中iv)中的定量过程是在不存在权利要求1-19中任一项所述的多核苷酸序列的情况下进行的。
29.一种校准靶DNA富集过程的方法,所述方法包括:
i)将权利要求1-19中任一项所述的多核苷酸序列与大体上互补序列的寡核苷酸在允许杂交的条件下组合;
ii)富集与多核苷酸序列杂交的寡核苷酸;
iii)在给定的一组参数下对ii)中富集的多核苷酸进行测序;
iv)将iii)中确定的多核苷酸序列与所述多核苷酸序列的已知序列进行比较;和
v)在iii)中的同一组参数下对ii)中富集的寡核苷酸进行测序;
其中iv)中的序列确定的准确性用于校准v)中的序列确定。
30.一种校准靶DNA富集过程的方法,所述方法包括:
i)将已知数量的权利要求1-19中任一项所述的多核苷酸序列与大体上互补序列的寡核苷酸在允许杂交的条件下组合;
ii)富集与多核苷酸序列杂交的寡核苷酸;
iii)在给定的一组参数下对ii)中富集的多核苷酸进行定量;
iv)将iii)中确定的多核苷酸数量与i)中的所述多核苷酸序列的已知数量进行比较;和
v)在iii)中的同一组参数下对ii)中富集的寡核苷酸进行定量;
其中iv)中的数量确定的准确性用于校准v)中的数量确定。
31.权利要求1-19中任一项所述的多核苷酸序列校准多核苷酸测序和/或定量过程的用途。
32.一种试剂盒,包含权利要求1-19中任一项所述的多核苷酸序列和一种或更多种能够使所述多核苷酸序列片段化的核酸酶。
CN202180024693.6A 2020-02-13 2021-02-12 参考梯状物和衔接子 Pending CN115698328A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
AU2020900400A AU2020900400A0 (en) 2020-02-13 Reference ladders
AU2020900400 2020-02-13
AU2020900401 2020-02-13
AU2020900401A AU2020900401A0 (en) 2020-02-13 Reference adapters
PCT/AU2021/050123 WO2021159184A1 (en) 2020-02-13 2021-02-12 Reference ladders and adaptors

Publications (1)

Publication Number Publication Date
CN115698328A true CN115698328A (zh) 2023-02-03

Family

ID=77291306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180024693.6A Pending CN115698328A (zh) 2020-02-13 2021-02-12 参考梯状物和衔接子

Country Status (7)

Country Link
US (1) US20230392187A1 (zh)
EP (1) EP4103749A4 (zh)
JP (1) JP2023513725A (zh)
CN (1) CN115698328A (zh)
AU (1) AU2021219852A1 (zh)
CA (1) CA3170856A1 (zh)
WO (1) WO2021159184A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107002130B (zh) * 2014-11-11 2022-02-01 深圳华大基因研究院 多程测序
KR20170099939A (ko) * 2014-12-16 2017-09-01 가반 인스티튜트 오브 메디컬 리서치 시퀀싱 컨트롤
WO2020174406A1 (en) * 2019-02-28 2020-09-03 Inivata Ltd. Method for quantifying the amount of a target sequence in a nucleic acid sample

Also Published As

Publication number Publication date
US20230392187A1 (en) 2023-12-07
WO2021159184A1 (en) 2021-08-19
EP4103749A4 (en) 2024-03-13
AU2021219852A1 (en) 2022-10-06
CA3170856A1 (en) 2021-08-19
EP4103749A1 (en) 2022-12-21
JP2023513725A (ja) 2023-04-03

Similar Documents

Publication Publication Date Title
CN110520542B (zh) 用于靶向核酸序列富集的方法及在错误纠正的核酸测序中的应用
US20210340619A1 (en) Compositions and methods for accurately identifying mutations
AU2022203184A1 (en) Sequencing controls
ES2769241T5 (es) Sistemas y métodos para detectar variación en el número de copias
CN110719958B (zh) 构建核酸文库的方法和试剂盒
JP7379418B2 (ja) 腫瘍のディープシークエンシングプロファイリング
CN109415764A (zh) 用于检测核酸突变的组合物和方法
JP2019511070A (ja) 核酸を解析するシステムおよび方法
US20120295260A1 (en) Methods for accurate sequence data and modified base position determination
CN110628880B (zh) 一种同步使用信使rna与基因组dna模板检测基因变异的方法
EP3512965B1 (en) Methods of nucleic acid sample preparation for analysis of cell-free dna
US20150126376A1 (en) Compositions and methods for sensitive mutation detection in nucleic acid molecules
EP3775274B1 (en) Detection method of somatic genetic anomalies, combination of capture probes and kit of detection
KR20220130756A (ko) 자가면역 질환과 면역결핍 장애의 면역 레퍼토리 바이오마커
CN111575379B (zh) 甲状腺癌相关58基因检测试剂盒及其使用方法
WO2019183582A9 (en) Immune repertoire monitoring
CN115698328A (zh) 参考梯状物和衔接子
KR102547253B1 (ko) 유전성 대사질환 진단용 조성물 및 이의 용도
CN114250297A (zh) 基因突变在结肠癌、肺癌易感基因变异检测中的应用
Bjarnesdatter Rypdal Targeted next-generation sequencing identified novel mismatch repair risk-variants involved in hereditary colorectal cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination