CN111566228A - 用于在胎儿孕育中预测胎龄和早产的无创分子钟 - Google Patents

用于在胎儿孕育中预测胎龄和早产的无创分子钟 Download PDF

Info

Publication number
CN111566228A
CN111566228A CN201880076096.6A CN201880076096A CN111566228A CN 111566228 A CN111566228 A CN 111566228A CN 201880076096 A CN201880076096 A CN 201880076096A CN 111566228 A CN111566228 A CN 111566228A
Authority
CN
China
Prior art keywords
genes
expression
seq
pregnancy
placental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880076096.6A
Other languages
English (en)
Inventor
米拉·N·穆法雷
翠·T·M·努
琼·卡蒙纳斯-索勒
马斯·梅尔比
斯蒂芬·R·夸克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chen Zuckerberg Biological Center San Francisco Co
Statens Serum Institut SSI
Leland Stanford Junior University
Original Assignee
Statens Serum Institut SSI
Chen Zuckerberg Biological Center Co
Leland Stanford Junior University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Statens Serum Institut SSI, Chen Zuckerberg Biological Center Co, Leland Stanford Junior University filed Critical Statens Serum Institut SSI
Publication of CN111566228A publication Critical patent/CN111566228A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/689Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to pregnancy or the gonads
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/36Gynecology or obstetrics
    • G01N2800/368Pregnancy complicated by disease or abnormalities of pregnancy, e.g. preeclampsia, preterm labour
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Reproductive Health (AREA)
  • Medicinal Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Cell Biology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Gynecology & Obstetrics (AREA)
  • Food Science & Technology (AREA)

Abstract

本发明涉及预测胎儿的胎龄的方法。本发明还涉及识别妇女有早产风险的方法。在一些方面,所述方法包含对来自妇女的生物学样本中的一种或多种胎盘或胎儿组织特异性基因进行定量。

Description

用于在胎儿孕育中预测胎龄和早产的无创分子钟
发明领域
本发明涉及医学领域。
相关申请的交叉引用
本申请要求美国临时申请No.62/576,033(2017年10月23日提交)和No.62/578,360(2017年10月27日提交)的权益,通过引用将每个所述美国临时申请的全部内容并入本文。
序列表
本申请包含序列表,该序列表已经以ASCII格式电子提交,并且其全部内容通过引用并入本文。所述ASCII副本创建于2018年10月17日,名为103182-1107145_(000300PC)_SL.txt,大小为159,304字节。
背景技术
几千年来,了解人类孕育(development)的时机和计划一直是备受关注的话题。在古代,古希腊人对胎儿孕育阶段的各种细节有着惊人的详细了解,他们开发了数学理论来试图解释孕育(包含分娩婴儿)期间重要标志的时间(Hanson 1995;Hanson 1987;Parker1999)。在现代,生物学家将胎儿和胎盘孕育的详细细胞和分子画像(cellular andmolecular portrait)放在一起。但是,这些结果通常与妊娠有关,没有导致分子检测,这可能实现对给定的一组父母的孕育和分娩预测的监测。使用最广泛的孕育分子指标是确定人绒毛膜促性腺激素(HCG)和甲胎蛋白(AFP)的水平,其分别可用于检测妊娠和胎儿并发症;然而,没有发现单个或组合的分子能精确地确定胎龄(Dugoff等人2005;Yefet等人2017)。
由于缺乏有用的分子测试,大多数临床医生使用超声成像或患者对末次月经期(LMP)的估算来确定胎龄和粗略估算分娩日期。但是,这些方法既不是特别精确,也不可用于预测早产,早产是产前保健中死亡率和成本的重要致因。此外,不准确的日期甚至会误导对正常足月妊娠的胎儿孕育的评估,这已显示最终会导致不必要的引产和剖宫产、延长产后护理并增加消耗性医疗费用(Bennett等人,2004年;Whitworth等人,2015年)。
开发一种更精确的方法来测量妊娠各个点的胎儿的胎龄,并且更一般地监测胎儿和胎盘孕育的异常或早产迹象,这将是有用的。全世界每年大约有1500万新生儿出生(Blencowe等,2013)。作为新生儿死亡的主要致因和5岁以下儿童死亡的第二致因(Liu等人,2012年),据估算,早产每年给美国造成的损失高达262亿美元[Institute of Medicine(US)Committee on Understanding Premature Birth and Assuring Healthy Outcomes2007]。并发症后续一直在生命中持续,而早产是健康欠佳、残疾或夭折而失去生命的主要致因(Murray等人,2012)。三分之二的早产是自然发生(occur spontaneously)的,唯一的预测因素是早产、多胎和阴道流血的病史[Institute of Medicine(US)Committee onUnderstanding Premature Birth and Assuring Healthy Outcomes 2007]。寻找遗传原因的努力仅获得了有限的成功(Ward等人,2005;York等人,2009),因此,大多数努力都集中在表型和环境原因上(Muglia和Katz,2010)。
发明概述
可通过以下方式确定胎龄或时间:(a)使用来自母体样本的cfRNA或蛋白生成表达谱,以及(b)将该表达谱与一个或多个参照谱进行比较,该参照谱反映作为限定胎龄的特征的表达谱。
可以通过以下方式确定早产的风险:(a)使用来自母体样本的cfRNA(或蛋白)生成表达谱,以及(b)确定该表达谱是否是具有早产病史的群体的特征:和/或该表达谱是否是具有足月分娩病史的群体的特征。
在第一方面,本公开提供了一种估算胎儿的胎龄的方法,其包括分析母体样本以确定来自包含一种或多种胎盘基因的组套(panel)的表达谱。
在一些实施方案中,该方法包含表达谱,该表达谱包括三种或更多种胎盘基因。在一些实施方案中,该方法包含来自仅由胎盘基因组成的组套的表达谱。
在一些实施方案中,该方法进一步包含在妊娠过程期间改变的每个胎盘基因的表达水平。在一些实施方案中,该方法包含在第一孕期比第三孕期高的至少一个胎盘基因的表达水平。在一些方式中,第一孕期中所有胎盘基因的表达水平都比第三孕期低。在一些实施方案中,该方法包含在第一孕期比第三孕期低的至少一个胎盘基因的表达水平。
在一些实施方案中,该方法包含选自表1中的基因的胎盘基因。在一些实施方案中,该方法包含选自CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14的胎盘基因。
在一些实施方案中,该方法包含确定三至九种胎盘基因的表达谱。在一些实施方案中,该方法包含通过测量母体样本中的无细胞RNA(cfRNA)来确定表达谱。在一些实施方案中,该方法包含通过测量母体样本中的胎盘蛋白来确定表达谱。
在一些实施方案中,该方法包含来自血液、血浆、血清或尿液的母体样本。在一些实施方案中,该方法包含在妊娠的第三孕期期间从母体获得的母体样本。在一些实施方案中,该方法包含在妊娠的第二孕期期间从母体获得的母体样本。
在一些实施方案中,该方法包含以下步骤:将表达谱与多个参考谱进行比较,其中每个参考谱是限定胎龄的特征,基于该比较确定多个参考谱中的哪一个对应于表达谱,以及根据对应的参考谱的限定胎龄推导出获得母体样本时胎儿的估算胎龄。
在第二方面,本公开提供了一种用于估算胎儿的胎龄的方法,该方法包含以下步骤:(a)获得样本的母体表达谱,其包括根据第一方面的任何实施方案的基因组套的表达水平,以及(b)比较该基因组套的表达水平与参考表达水平,其中该参考表达水平是从足月分娩群体中获得的,以确定该母体表达谱与阈值内的参考表达水平相似还是不同。
在一些实施方案中,该方法包含使用机器学习技术为足月群体建立一个或多个参考表达水平。在一些方式中,该方法进一步包含获得多个训练样本,每个训练样本被标记为早产或足月;获得多个训练样本中的每个训练样本的基因组套的一个或多个测量的表达水平;以及使用机器学习技术迭代地调整一个或多个参考表达水平来增加训练样本的数量,该训练样本是通过将一个或多个测量的表达水平与一个或多个参考表达水平进行比较而正确分类的。
在一些实施方案中,该方法进一步包含以下步骤:将该基因组套的表达水平与其他参考表达水平进行比较,其中该其他参考表达水平从早产群体中获得,以确定母体表达谱与阈值内的其他参考表达水平相似还是不同。
在第三方面,本公开提供了一种用于估算胎儿的胎龄的方法,该方法包含以下步骤:(i)确定包括至少一个胎盘RNA的组套的母体表达谱,以及(ii)比较该母体表达谱与参考谱,其中该母体表达谱与该参考谱的比较使得能够估算胎龄。在一些实施方案中,已知参考谱的胎龄。在一些实施方案中,母体表达谱与参考谱的比较是通过将母体表达谱与基于一个或多个表达水平的输入提供胎龄的胎龄函数进行比较来进行的,其中该胎龄函数通过将模型拟合到多个具有测量的表达水平且胎龄已知的校准样本中来确定。在一些方式中,该方法使用回归模型。
在一些实施方案中,该方法包含在第一方面的任何实施方案中所述的谱组套(profile panel)。在一些实施方案中,该方法由计算机执行。
在一些实施方案中,该方法包含根据第一或第二方面的方法,使用第一母体样本来确定第一胎龄,以及根据第一或第二方面的方法,使用妊娠后期获得的第二母体样本来确定第二胎龄。
第一方面的方法,其中各个胎盘基因的表达水平通过qPCR或大规模平行测序来确定。
第一方面的方法,其中各个胎盘基因的表达水平通过质谱法或使用抗体阵列确定。
第一、第二或第三方面的方法,其中确定至少一个另外的基因的表达,并且所述另外的基因不是胎盘基因。
在第四方面,本公开提供了一种组合物,其包括用于多重扩增选自表1的至少三种且不超过五十种胎盘基因的引物。
在第五方面,本公开提供了一种试剂盒,其包括适于多重扩增选自表1的至少三种且不超过五十种胎盘基因的引物。
在第六方面,本公开提供了一种抗体阵列,其用于检测从母体血液或尿液中分离的至少三种且不超过一百种的胎盘蛋白。
在第七方面,本公开提供了一种用于评估孕妇早产的风险的方法,该方法包括分析母体样本以确定来自包括选自表2的一种或多种基因的组套的表达谱。
在一些实施方案中,该方法包含一组套,其包括来自表2的三种或更多种基因。在一些实施方案中,该方法包含具有表达水平在早产群体中比在足月群体中高的基因。在一些实施方案中,该方法包含选自CLCN3、DAPP1、POLE2、PPBP、LYPLAL1、MAP3K7CL、MOB1B、RAB27B、RGS18和TBC1D15,或者选自CLCN3、DAPP1、PPBP、MAP3K7CL、MOB1B、RAB27B和RGS18的基因。在一些实施方案中,该方法包含一组套,其包括选自CLCN3、DAPP1、POLE2、PPBP、LYPLAL1、MAP3K7CL、MOB1B、RAB27B、RGS18和TBC1D15(十种转录物组套),或者选自CLCN3、DAPP1、PPBP、MAP3K7CL、MOB1B、RAB27B和RGS18(七种转录物组套)的三种基因的任意组合的三种基因。
在一些实施方案中,该方法包含其中确定了三到十种基因的组套的表达谱。在一些实施方案中,该方法包含其中确定了恰好包括三种基因的组套的表达谱。
在一些方式中,该方法包含通过测量母体样本中的无细胞RNA(cfRNA)来确定表达谱。在一些实施方案中,该方法包含通过测量母体样本中的蛋白来确定表达谱。
在一些实施方案中,该方法包含来自血液、血浆、血清或尿液的母体样本。在一些实施方案中,该方法包含在早产之前超过28天获得的母体样本。在一些实施方案中,该方法包含在早产之前超过45天获得的母体样本。在一些实施方案中,该方法包含在妊娠第二个月之后和第八个月之前获得的母体样本。在一些实施方案中,该方法包含在妊娠的第二孕期获得的母体样本。
在一些方式中,在妊娠的第三孕期获得母体样本。
在一些实施方案中,第七方面的方法包含在指定的妊娠周获得母体样本,该方法包括以下步骤:将表达谱与时间匹配的参考谱进行比较,其中该时间匹配的参考谱是在指定的妊娠周正常足月妊娠的特征,以及如果表达谱与阈值内的时间匹配的参考谱显著不同,则确认孕妇处于升高的早产风险。
在一些实施方案中,第七方面的方法包含在指定的妊娠周获得母体样本,该方法包括以下步骤:将表达谱与时间匹配的参考谱进行比较,其中该时间匹配的参考谱是早产的特征,以及如果表达谱与阈值内的时间匹配的参考谱显著相似,则确认孕妇处于升高的早产风险。
在第八方面,本公开提供了一种用于评估孕妇早产风险的方法,该方法包括以下步骤:(a)获得样本的母体表达谱,其包括根据本公开的第七方面的基因组套的表达水平,以及(b)将该基因组套的表达水平与参考表达水平进行比较,其中该参考表达水平从早产群体、足月分娩群体或这两种群体中获得,以确定母体表达谱与阈值内的参考表达水平相似还是不同。
在一些实施方案中,该方法使用机器学习技术来建立一个或多个参考水平。
在一些实施方案中,第七或第八方面的方法由计算机执行。
在第九方面,本公开提供了一种方法,该方法包含利用在妊娠过程中在不同时间获得的两个或多个母体样本来执行在第七或第八方面中提供的权利要求的步骤。
第七方面的方法,其中通过qPCR或大规模平行测序确定单个基因的表达水平。
第七方面的方法,其中各个基因的表达水平通过质谱法或抗体阵列确定。
在第十方面,本公开提供了一种组合物,其包括用于多重扩增选自表2的至少三种基因和不超过一百种不同基因的引物。
在第十一方面,本公开提供了一种试剂盒,其包括用于多重扩增选自表2的至少三种基因和不超过一百种不同基因的引物。
在第十二方面,本公开提供了一种估算分娩时间(time to delivery)的方法,该方法包含分析母体样本以确定来自包括一种或多种胎盘基因的组套的表达谱。
在一些实施方案中,该方法包含来自包括三种或更多种胎盘基因的组套的表达谱。
在一些实施方案中,该方法包含来自仅包括胎盘基因的组套的表达谱。
在一些实施方案中,该方法包含在妊娠过程中每个胎盘基因的表达水平改变。在一些实施方案中,该方法包含至少一个胎盘基因的表达水平在第一孕期比第三孕期高。在一些实施方案中,该方法包含至少一个胎盘基因的表达水平在第一孕期比第三孕期低。在一些方式中,与第三孕期相比,第一孕期所有胎盘基因的表达水平较低。
在一些实施方案中,该方法包含通过测量母体样本中的无细胞RNA(cfRNA)来确定表达谱。在一些实施方案中,该方法包含通过测量母体样本中的胎盘蛋白来确定表达谱。
在一些实施方案中,该方法包含来自血液、血浆、血清或尿液的母体样本。
在一些实施方案中,该方法包含在妊娠的第三孕期期间从母体获得的母体样本。
在一些实施方案中,该方法包含在妊娠的第二孕期期间从母体获得的母体样本。
在一些实施方案中,该方法包含以下步骤:将表达谱与多个参考谱进行比较,其中每个参考谱是分娩时间的特征,确定多个参考谱中的哪一个对应于表达谱,并基于对应的参考谱的分娩时间推导出获得母体样本时的估算的分娩时间。
在第十三方面,本公开提供了一种用于估算分娩时间的方法,该方法包含以下步骤:(a)获得样本的母体表达谱,包含根据第九和第七方面的实施方案中任一项的基因组套的表达水平,以及(b)将表达水平与基因组套的参考表达水平进行比较,其中参考表达水平是从足月分娩群体中获得的,以确定母体表达谱与阈值内的参考表达水平类似还是不同。
在一些实施方案中,该方法包含使用机器学习技术建立足月群体的一个或多个参考水平。在一些实施方案中,该方法由计算机执行。
在一些实施方案中,该方法包含根据第十二或第十三方面的方法,使用第一母体样本确定第一分娩时间,以及根据第十二或第十三方面的方法,使用妊娠后期获得的第二母体样本确定第二分娩时间。
第十二方面的方法,其中各个胎盘基因的表达水平通过qPCR或大规模平行测序来确定。
第十二方面的方法,其中各个胎盘基因的表达水平通过质谱法或抗体阵列确定。
第十二或第十三方面的方法,其中确定至少一个另外的基因的表达,并且所述另外的基因不是胎盘基因。
在第十四方面,本公开提供了一种组合物,其包括用于多重扩增选自表1的至少三种胎盘基因和不超过一百种不同基因的引物。
在第十五方面,本公开提供了一种试剂盒,其包括用于多重扩增选自表1的至少三种基因和不超过一百种胎盘基因的引物。
在第十六方面,本公开提供了一种抗体阵列,其用于检测从母体血液或尿液中分离的至少三种且不超过一百种的胎盘蛋白。
附图说明
图1A和图1B是时间图,其示出了来自三个不同队列的孕妇的收集时间线:丹麦(图1A)、宾夕法尼亚州和阿拉巴马州(图1B)。正方形、倒三角形和直线分别表示样本收集、分娩日期和各个患者。
图2A示出了来自胎盘、免疫或器官特异性基因(最后一行)的代表性基因表达阵列的数据。在妊娠过程中绘制的基因特异性患者间月平均值±平均值标准误差(SEM)(灰色阴影)。
Figure BDA0002506829930000101
表示仅21名患者的数据可用的基因。
图2B是示出了基因特异性估算的转录物计数之间的相关性的热图。以与图2A相同的顺序列出基因,同时省略了仅21名患者的数据可用的基因。示出了胎盘基因(行/列1-20)、免疫基因(行/列21-29)和器官特异性基因(行/列30-36)。
图2C至图2D示出了分别表示线性拟合和95%置信区间的实线和阴影。图2C示出了针对训练数据的分娩时间的示例性随机森林模型预测(n=21,R=0.91,P<2.2x 10-16,交叉验证)。图2D示出了针对验证数据的分娩时间的示例性随机森林模型预测(n=10,R=0.89,P<2.2x 10-16)。
图2E是示出了通过本发明的超声或无细胞RNA方法比较在第二孕期、第三孕期或第二和第三孕期期间的预期分娩日期预测的图。
图3A示出了早产和正常分娩之间40个差异表达基因(p<0.001)的热图。对来自宾夕法尼亚州的样本进行RNA-Seq。
图3B示出了在来自阿拉巴马州的独立队列中确认和验证的10种基因的个体图,该图使用来自该集合(set)的3种基因的任何独特组合准确地预测了早产。报告的所有p值均使用费舍尔精确检验(FDR<5%)进行计算。*、**和***分别表示低于0.05、0.005和0.0005的显著性水平。
图3C是示出了在来自图3B的3种基因的独特组合中的10个已验证早产生物标志物的预测性能的图。对于发现(宾夕法尼亚州和丹麦)和验证(阿拉巴马州)队列,均突出显示了曲线下面积(AUC)值。
图4示出了来自胎盘或免疫基因的代表性基因表达阵列的数据。在妊娠过程中绘制的基因特异性患者间月平均值±平均值标准误(SEM)(灰色阴影)。
Figure BDA0002506829930000111
表示仅21名患者的数据可用的基因。
图5示出了使用9种胎盘基因构建的随机森林模型,其优于使用胎盘、免疫和组织特异性器官来源的51种基因构建的随机森林模型,以通过均方根误差(RMSE)预测胎龄。
图6A和6B示出了分别表示线性拟合和95%置信区间的实线和阴影。图6A示出了针对训练数据的胎龄的示例性随机森林模型预测(n=21,R=0.91,P<2.2x 10-16,交叉验证),以及图6B示出了针对验证数据的胎龄的示例性随机森林模型预测(n=10,R=0.90,P<2.2x10-16)。
图7A和7B示出了分别表示线性拟合和95%置信区间的实线和阴影。训练和验证数据记录在每个图的上方。对正常和早产样本的胎龄和分娩时间的随机森林模型预测表明,尽管该模型对于正常分娩(RMSE=4.5)和早产(RMSE=4.7)的胎龄的预测非常有效(图7A),它却不能准确地预测早产情况(RMSE=10.5周)下的分娩时间(图7B);同时准确地预测正常分娩的分娩时间(图7B)。
图8示出了RT-qPCR测量结果与先前确定的RNA-Seq值一致。
图9示出了使用由外部RNA对照协会(ERCC)开发的一个常见集合的外部RNA对照生成的标准曲线从Ct值反算出每个被评估基因的Ct计数。对照由一个集合的未标记的聚腺苷酸化的转录物组成,这些转录物被设计为在样本分离后和问诊前添加到RNA分析实验中。ERCC Spike-In Control Mixes是市售的92种转录物的预先配制共混物,设计为250至2,000个核苷酸长,可模拟天然真核mRNA(例如加利福尼亚州Invitrogen的ERCC RNA Spike-In Mix,目录号4456740)。
图10A至图10D提供了使用三种统计分析在自然早产(spontaneous pretermdelivery)和正常分娩样本之间明显不同的基因的示例性列表。
发明详述
1.引言
我们已经发现了一组套的遗传生物标志物,其用于无创地预测孕妇的胎儿胎龄或分娩时间。我们还发现了正交集合(orthogonal set)的遗传生物标志物,其用于无创地预测妇女是否处于胎儿早产的风险。发现一个集合的用于预测胎儿胎龄或分娩时间的遗传标志物具有重要意义,部分原因在于具有潜在的优势,即,取代超声作为预测胎龄的黄金标准并因此避免了与超声波和超声医师相关联的大量医疗保健费用。此外,发现一个集合的用于预测妇女是否处于早产风险的遗传标志物也具有重要意义,部分原因在于具有潜在的优势,即,预防性地治疗处于早产风险的妇女并因此消除了与新生儿重症监护病房(NICU)相关联的大量医疗保健费用。
通过在妊娠的每个星期内纵向地测量孕妇血液中的cfRNA,我们对人类的正常孕育进行了高分辨率的研究。对这些样本中组织特异性转录物的分析使我们能够以高分辨率和高灵敏度追踪胎儿和胎盘的孕育,并检测母体免疫系统对妊娠的基因特异性反应。这项研究的数据为人类的正常孕育构建了一个“时钟”,并使直接分子方法能够确定预期的分娩日期,其准确性可与超声相提并论,而费用却很少。我们还确认了一个正交基因集合,该基因集合准确地区分在分娩前多达两个月即处于早产风险的妇女,从而为早产风险的筛查或诊断测试奠定了基础。
2.定义
如本文所用,术语“无细胞RNA”或“cfRNA”是指由母体、胎儿和/或胎盘的细胞表达且可从母体血液的非细胞部分回收的RNA,尤其是mRNA,并且包含全长RNA转录物的片段。在一些实施方案中,“cfRNA”不包含rRNA。在一些实施方案中,“cfRNA”不包含miRNA。在一些实施方案中,“cfRNA”是指mRNA。Cf RNA也可以从母体尿液中回收。
如本文所用,术语“胎盘基因”、“胎盘基因产物”、“胎盘cfRNA”或“胎盘蛋白”是指在胎盘中表达但未通过母体或胎儿组织表达(或以显著较低的水平表达)的基因或相应的基因产物。存在可用于确认胎盘基因的公共资源,包含数据库,例如组织特异性基因表达和调控(TiGER),其确认了优先在胎盘中表达的377个RefSeq(NCBI参考序列数据库)基因(http://bioinfo.wilmer.jhu.edu/tiger)。其他数据库,例如Expression Atlas(https://www.ebi.ac.uk/gxa/home)也可以用于确认胎盘基因。胎盘基因产物包含mRNA和蛋白。
如本文所用,术语“表达谱”是指从母体样本获得的一种或多种基因产物的表达水平。基因产物可以是cfRNA或蛋白。对于从母体血浆中回收的基因产物,表达水平可以表示为每mL母体血浆中特定RNA的转录物数、每mL母体血浆中特定多肽的质量、由RNA-Seq计算的转录物数或任何其他合适的单位。类似单位可用于从其他母体样本(如尿液)获得的基因产物。基因产物的表达可使用任何合适的方法(例如,如下所述)确定。通常对测量值进行归一化,以解释样本数量和质量、逆转录效率等方面的变化。当表达谱反映来自多个不同基因产物(例如,不同的cfRNA转录物)的表达时,在生成或比较表达谱或参考谱时,可以赋予基因产物不同的权重。例如,当将来自孕妇的样本中包括cfRNA 1和cfRNA 2的表达谱与参考谱(下文讨论)进行比较时,在确定表达谱与参考谱之间相似性或差异程度时,cfRNA 1值的2倍差相比cfRNA 2的2倍差可以被赋予更大的权重。来自母体(例如,患者)样本的表达谱有时被称为“母体表达谱”,而在指定时间收集的样本中的母体表达谱可以被称为“[时间]母体表达谱”,例如“24周母体表达谱”。
如本文所用,“参考谱”是衍生自参考群体的表达谱。为了说明,参考群体的示例是孕妇,足月分娩的孕妇或早产的孕妇。在一些实施方案中,参考群体是以母体年龄(例如,足月分娩的20-25岁妇女)、种族或民族(例如,足月分娩的非裔美国人妇女)为特征的孕妇亚群。通过组合群体中统计学上显著数量的妇女的表达谱来生成参考谱,对于指定的基因产物,该参考谱可以反映群体中的平均转录水平、群体中的中位转录水平,或者可以使用在流行病学和医学领域中已知的许多方法中的任何一种来确定。参考群体通常将包括至少10个受试者(例如10-200个受试者),有时50个或更多个受试者,有时1000个或更多个受试者。
如本文所用,术语“谱组套”是指在特定测定中测量的基因产物集合。例如,在针对六(6)种不同的cfRNA(“RNA A-F”)的测定中,这六种cfRNA将是谱组套。同样,在对来自母体血浆或尿液的六(6)种不同蛋白的测定中,这六种蛋白将成为谱组套。作为另一个例证,在一种收集了大量基因的转录物(例如整个转录组或大量胎盘基因转录物)的表达数据的测定中,用于估算胎龄或分娩时间或者评估早产风险的子集可以称为谱组套。将认识到,未包含在组套中的RNA或蛋白的测量值可以用作对照,以将样本内或样本之间的测量值归一化,或用于类似用途。在一些实施方案中,谱组套可包含基因产物集合,该集合包含cfRNA和蛋白两者。谱组套有时称为“组套”。
如本文所用,术语“早产”、“足月妊娠”、“足月分娩”和“正常足月妊娠”具有其正常含义。足月是指胎儿达到37周胎龄之后的分娩,而早产是指胎儿达到37周胎龄之前的分娩。在某些情况下,早产是指在16周至35周胎龄或24周至30周胎龄期间的分娩。下文讨论的研究中使用的早产群体(见实施例)在一个病例(宾夕法尼亚州队列)中在29周胎龄之前分娩了胎儿,在另一病例(阿拉巴马州队列)中在33周胎龄时分娩了胎儿。参见图1。
如本文所用,“母体样本”是指从孕妇获得的体液的样本。体液通常是血清、血浆或尿液,并且通常是血清。在一些实施方案中,可以使用不同体液的样本,例如唾液、脑脊髓液、胸腔积液等。可以在妊娠期间的多个不同时间点获得母体样本,并进行存储(例如冷冻)直至进行测定。应当理解,母体样本的收集日期是样本不可或缺的特性。
如本文所用,“分娩时间”是指从指定时间(当前时间、母体样本收集的日期)到分娩日期或预计分娩日期的周数。分娩时间的计算方法是(分娩时的胎龄)减去(样本收集时的胎龄)。
如本文所用,术语“蛋白”和“多肽”可互换使用。提及从母体样本获得的蛋白并不一定意味着该蛋白是全长基因表达产物。可以根据本发明检测和确认部分、片段和切割产物。
3.使用无细胞RNA表达谱的说明性方法和实施方案
本发明涉及用于胎儿孕育的高分辨率分子钟的发现,以及用于确定分娩时间、胎儿的胎龄和早产风险的方法的发明。一方面,描述了使用胎盘基因的表达谱估算胎儿的胎龄或分娩时间的方法和材料。另一方面,描述了用于评估早产风险的方法和材料。
为了说明而非限制,可以通过以下方式确定胎龄或分娩时间:(a)使用来自母体样本的cfRNA(或蛋白)生成表达谱,以及(b)将该表达谱与一个或多个参照谱进行比较,该参照谱反映作为限定胎龄的特征的表达谱。为了说明,将母体表达谱与37个参考谱(作为胎龄为1至37周的特征)进行比较,并且基于母体表达谱与37个参考谱之一的相关性来估算胎龄或分娩时间。为了说明而非限制,可以通过以下方式确定早产的风险:(a)使用来自母体样本的cfRNA(或蛋白)生成表达谱,以及(b)确定该表达谱是否是具有早产史的群体的特征和/或该表达谱是否是具有足月分娩史的群体的特征。在另一种方法中,基于从母体样本生成的母体表达谱,使用机器学习(例如,随机森林回归、支持向量机、弹性网络、lasso)来预测胎龄、分娩时间和早产风险。
3.1获取母体样本
可以收集母体样本(例如血浆或尿液),并且可以立即或在储存后从该样本中分离cfRNA。参见下面的实施例1。可以采用本领域已知的方法来保护RNA部分免于降解,包含例如使用特殊的收集管(例如,Preanalytix的PAXgene RNA管、Applied Biosystems的TempusBlood RNA管)或稳定RNA部分的添加剂(例如,Ambion的RNAlater、Promega的RNAsin)。
可以收集多个母体样本。例如,可以在每个孕期,或在妊娠过程中的某个时期(例如3-8个月)每月收集一次母体样本。注明时,可能会更频繁地收集母体样本。例如,可以频繁地(例如,每两周一次)监测胎龄或分娩时间,作为监测胎儿健康的方法。
作为另一个示例,在24周被确认为处于早产风险的妇女可以选择每两周进行一次测定以监测风险。在使用避免早产的干预措施(例如补充黄体酮)的情况下,可以在干预措施启动后获得母体样本,以评估该干预措施是否改变了母体表达谱。显著地,本发明的方法可以用于准确地区分在分娩前多达两个月即处于早产风险的妇女。参见实施例6。在本发明的一些实施方案中,在早产之前超过28天获得母体样本。在本发明的一些实施方案中,在早产之前超过45天获得母体样本。在一些实施方案中,在妊娠的第二个月之后和第八个月之前获得母体样本。在一些实施方案中,在妊娠的第二孕期期间获得母体样本。在一些实施方案中,在妊娠的第三孕期期间得到母体样本。如上所讨论,在许多情况下,可以在妊娠过程中不止一次地获得和测定母体样本。
3.2cfRNA的分离
可以使用本领域熟知的技术从母体样本中分离无细胞RNA。参见下面的实施例1。从血液或血液部分中分离cfRNA被描述于Qin等人,BMC Res.Notes.,26;6:380(2013)和Mersy等人,Clin.Chem.,61(12)1515-23(2015)中,两者均通过引用并入本文。从血液中分离cfRNA的试剂盒是已知的并且可商购[例如PaxGene Blood RNA试剂盒(Qiagen,目录号762164)]。从血浆/血清中分离cfRNA的试剂盒是已知的并且可商购[例如,来自加拿大Norgen Biotek公司的血浆/血清RNA纯化试剂盒,目录号:56900,以及来自Zymo Research的Quick-cfRNATM血清&血浆,目录号:R1059;NextPrep Magnazol cfRNA分离试剂盒(BiooScientific);Quick-cfRNATM血清&血浆试剂盒(Zymo Research)和
Figure BDA0002506829930000171
循环核酸试剂盒(Qiagen)]。
已经描述了从尿液中分离cfRNA(参见,例如Zhao等人,2015,Int.J.Cancer,1;136(11):2610-5,其通过引用并入本文,描述了cfRNA用于确认生物标志物并监测疾病状况)。从尿液中分离cfRNA的试剂盒是已知的并且是可商购的(例如,来自加拿大Norgen Biotek公司的尿液无细胞循环RNA纯化试剂盒,目录号:56900)。
3.3cfRNA转录物的定量
无细胞RNA样本中特定转录物的定量能够以多种方式完成,包含但不限于,基于阵列的方法、基于扩增的方法(例如RT-qPCR)和高通量测序(RNA-Seq)。本发明的方法不限于特定的定量方法。
3.3.1RT-qPCR测定
RT-qPCR测定在下面的实施例1中描述。简而言之,RNA通过逆转录酶从总RNA或信使RNA(mRNA)转录为互补DNA(cDNA)。替代地,使用对所选RNA转录物(例如,SEQ ID NO:1-19中的一个或多个)具有特异性的模板特异性引物生成cDNA。然后将cDNA用作qPCR反应的模板。
RT-qPCR能够以一步法或两步法进行。一步测定使用逆转录酶和DNA聚合酶在单个试管和缓冲液中结合逆转录和PCR。一步RT-qPCR仅使用序列特异性引物。在两步测定中,使用不同的优化缓冲液、反应条件和引物策略[例如在逆转录中使用随机引物、oligo-(dT)或序列特异性引物,然后在qPCR步骤中使用序列特异性引物]在单独的试管中进行逆转录和PCR步骤。如上所述,很明显,本文提到的RT-qPCR包含一步或两步RT-qPCR测定。
RT-qPCR可以使用各种缓冲液和优化法来进行。参见下面的实施例1。从血液中分离cfRNA并随后通过RT-qPCR进行分析是本领域已知的(例如,参见美国专利公开号:20140199681,通过引用并入本文)。用于进行一步RT-qPCR的试剂盒是已知的并且可商购[例如TaqPathTM 1步RT-qPCR Master Mix、CG(Thermo Fisher Scientific,目录号A15299)]。用于进行两步RT-qPCR的试剂盒是已知的并且可商购[例如,用于RT-qPCR的Maxima First Strand cDNA合成试剂盒(Thermo Fisher Scientific,目录号K1641)]。
3.3.2RNA-Seq测定
RNA-Seq(RNA测序)测定也称为全转录组鸟枪法测序,使用下一代测序法(NGS)揭示给定时间点样本中RNA的存在和数量[参见Zhong等人Nat.Rev.Gen.10(1):57–63(2009),其通过引用并入本文)。RNA-Seq测定在下面的实施例1中描述。RNA-Seq便于观察基因表达随时间的变化或不同群组或治疗中基因表达差异[参见Maher等人Nature.458(7234):97–101(2009),其通过引用并入本文]。
以下阐述了分析从母体体液样本中分离的cfRNA的示例性方法。简而言之,例如使用序列特异性引物、oligo(dT)或随机引物从母体样本中分离cfRNA,以生成cDNA分子。在一种方法中,使用对所选RNA转录物(例如,对应于表1和2中列出的基因;SEQ ID NO:1-19中的一种或多种)具有特异性的模板特异性引物来生成cDNA。可以对cDNA分子进行片段化和优化,以便将测序接头添加到cDNA分子的3'和5'末端以产生测序文库。cfRNA通常不需要片段化。然后使用NGS测序平台对优化的cDNA进行测序。用于根据本发明的方法扩增cDNA和分析测序产物的合适试剂盒包含例如OvationTM RNA-Seq系统(NuGen)。制备用于测序平台的RNA-Seq文库的其他方法是已知的,例如,Podnar等人,2014,“Next-GenerationSequencing RNA-Seq Library Construction”Curr Protoc Mol Biol.2014年4月14日;106:4.21.1-19.doi:10.1002/0471142727.mb0421s106;Schuierer等人,2017,“Acomprehensive assessment of RNA-Seq protocols for degraded and low-quantitysamples.BMC Genomics.2017年6月5日;18(1):442.doi:10.1186/s12864-017-3827-y;Hrdlickova R,2017,RNA-Seq methods for transcriptome analysis,WileyInterdiscip Rev RNA.2017年1月;8(1).doi:10.1002/wrna.1364),其全部通过引用并入本文。
适于与RNA-Seq测定一起使用的测序文库可以包含衍生自从母本样本分离的cfRNA的cDNA。也将显然的是,测序文库可以包含衍生自可以在总RNA分离而不是cfRNA分离程序期间收集的其他RNA种类(例如,miRNA)的cDNA。因此,可以对从母体样本获得的RNA含量进行部分或全部转录组分析。在一个实施方案中,优选仅将从母体样本获得的cfRNA用作制备适于RNA-Seq的cDNA的输入材料。
3.4谱组套
发明人已经发现基因产物的某些组合在实施本发明中特别有用。也就是说,已经确认基因产物的某些组合足以或优选提供对胎龄、分娩时间或预测早产可能性的准确估算。例如,如实施例4中所述,与较大的基因组套相比,9种胎盘基因的子集在估算胎龄或分娩时间方面具有更大的预测能力。
应当理解,尽管在本节中讨论了组套的某些特征,但是本发明不限于这些具体描述的实施方案。还应理解,尽管本节通过参考cfRNA转录物表达来描述组套,但是基于由那些基因子集编码的循环蛋白的表达水平的组套也可以用于确定胎龄或分娩时间,并确认处于早产风险的妇女。参见下面的第4节。
在某些方法中,在妇女妊娠过程中使用多个不同的谱组套。例如,在第二孕期可以使用第一谱组套,而在第三孕期可以使用不同的谱组套。
3.4.1用于确定胎龄或分娩时间的谱组套
一方面,本发明提供一种用于通过分析母体样本以确定胎盘基因(例如,由胎盘基因编码的cfRNA或蛋白)的表达谱来估算胎儿的胎龄或分娩时间的方法。可以基于本公开中提供的信息来选择合适的组套。在一个实施方案中,该组套包含1、至少2或至少3种胎盘基因。在一些实施方案中,谱组套可包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种胎盘基因。在一些实施方案中,谱组套可恰好包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种胎盘基因。在一些实施方案中,该谱组套包含少于100种基因,例如少于100种胎盘基因,有时少于50种胎盘基因,有时少于20种胎盘基因,有时少于15种胎盘基因,有时少于10种胎盘基因,有时少于5种胎盘基因。
在一些实施方案中,谱组套中每个胎盘基因的表达水平在妊娠过程中改变。参见下面的实施例。因此,在一个实施方案中,与第三孕期相比,第一孕期的该组套中至少一个胎盘基因的表达水平较高。在一些实施方案中,与第三孕期相比,第一孕期的该组套中大多数或所有胎盘基因的表达水平较高。在一些实施方案中,与第三孕期相比,第一孕期中至少一个胎盘基因的表达水平较低。在一些实施方案中,与第三孕期相比,第一孕期的该组套中大多数或所有胎盘基因的表达水平较低。
在一些实施方案中,至少一个胎盘基因选自表1中的基因。在一些实施方案中,谱组套中的所有胎盘基因都是表1中列出的基因。
在一些实施方案中,表达谱包含选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]以及LGALS14[SEQ ID NO:9]的至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因。在一些实施方案中,表达谱包含选自CGA[SEQID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ IDNO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]以及LGALS14[SEQID NO:9]的1、2、3、4、5、6、7、8或9种基因。在一种方法中,胎盘基因的集合包含除CGA和CGB以外的至少一种基因。在一种方法中,谱组套包括选自SEQ ID NO:1-9的三(3)至九(9)个cfRNA。
在一个实施方案中,使用以下9种基因的谱组套谱来确定胎龄:CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14。我们针对妇女亚群(即未产或多胎妇女、怀有男胎或女胎的妇女)训练了几种不同的模型,以确定构成已确认的转录组识别标志(transcriptomic signature)的9种基因的重要性。针对怀有男胎或女胎的妇女以及未产或多胎妇女训练的4种不同的模型揭示,正文中确认的9种基因中有2种足以预测怀有男胎(CGA,CSHL1)或女胎(CGA,CAPN6)和多胎(CGA,CSHL1)的妇女的分娩时间。但是,所有9种基因对于最佳预测未产妇女距离分娩的时间都是必不可少的,这突出了已确认的转录组识别标志的重要性。在本发明的一些实施方案中,该组套包含CGA和CSHL1或CGA和CAPN6。
该模型以下面的重要性顺序(从最高到最低)对用于预测胎龄的九种转录物进行加权:CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14。因此,在一些实施方案中,当与参考谱中的表达相比时,确定的单个基因表达水平被赋予不同的权重(或系数)。例如,当该群组中包括所有9种基因或包含少于9(例如2、3、4、5、6、7或8)种基因的子集时,每种基因的表达值排名为CGA>CAPN6>CGB>ALPP>CSHL1>PLAC4>PSG7>PAPPA>LGALS14。
在一个实施方案中,该组套包含来自表1的1、至少2或至少3种基因。在一些实施方案中,谱组套可以包含来自表1的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种基因。在某些实施方案中,谱组套可以恰好包含来自表1的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种基因。在某些实施方案中,谱组套包含少于100种基因,有时少于50种基因,有时少于20种基因,有时少于15种基因,有时少于10种基因,有时少于5种基因。在某些方法中,谱组套包括的基因数在1-100种基因、1-50种基因、1-25种基因、3-100种基因、3-50种基因、3-25种基因或3-10种基因的范围内。
在一些方式中,胎盘基因选自表1中的基因。在一些实施方案中,胎盘基因选自CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14。在一些实施方案中,该基因包含除CGA以外的至少一种基因。在一些实施方案中,该基因包含除CGA以外的至少两种、三种、四种、五种、六种、七种或八种基因。在一些实施方案中,该基因包含除CGB以外的至少一种基因。在一些实施方案中,该基因包含除CGB以外的至少两种、三种、四种、五种、六种、七种或八种基因。在一些实施方案中,该基因包含除CGA和CGB以外的至少一种基因。在一些实施方案中,该方法包含确定三(3)至九种胎盘基因的表达谱。
3.4.2确定早产风险的谱组套
一方面,本发明提供一种通过分析母体样本以确定表达谱来估算早产风险的方法。在一个实施方案中,用于这种确定的谱组套包括在早产群体中比在足月群体中具有更高表达水平的一种或多种cfRNA转录物。在一个实施方案中,早产群体是指在37周胎龄之前分娩胎儿的一组妇女。在另一个实施方案中,早产群体是指在胎龄33周之前分娩胎儿的妇女。在另一个实施方案中,早产群体是指在29周胎龄之前分娩胎儿的妇女。在又一个实施方案中,早产群体是指在胎龄12和33周之间分娩胎儿的妇女。在另一个实施方案中,早产群体是指在16和29周胎龄之间分娩胎儿的一组妇女。在一个实施方案中,早产群体是指在16和33周胎龄之间分娩胎儿的一组妇女。如上所述,在实施例中使用的一个早产群体由在29周胎龄之前分娩胎儿的妇女组成,并且该群体(或其亚群)优选用于制备作为高早产风险特征的参考谱。实施例还表明,在29周之前分娩胎儿的妇女群体中发现的生物标志物适用于在33周胎龄之前分娩的妇女群体的生物标志物。
在一种方法中,谱组套包含表2中列出的1种或更多种基因,优选3种或更多种基因。
在一种方法中,谱组套包含选自十种转录物组套CLCN3[SEQ ID NO:10]、DAPP1[SEQ ID NO:11]、POLE2[SEQ ID NO:12]、PPBP[SEQ ID NO:13]、LYPLAL1[SEQ ID NO:14]、MAP3K7CL[SEQ ID NO:15]、MOB1B[SEQ ID NO:16]、RAB27B[SEQ ID NO:17]、RGS18[SEQ IDNO:18]和TBC1D15[SEQ ID NO:19]的三(3)种或更多种基因。在一种方法中,谱组套包括三(3)种或更多种基因。在一种方法中,谱组套包括选自SEQ ID NO:10-19的三(3)种或更多种基因。在一种方法中,谱组套恰好包括选自SEQ ID NO:10-19的三(3)种基因。在一些实施方案中,该组套仅包括选自SEQ ID NO:10-19的基因。例如,在各种实施方案中,谱组套将包括以下组合:(i)CLCN3,DAPP1,POLE2;(ii)DAPP1,POLE2,PPBP;(iii)POLE2,PPBP,LYPLAL1;(iv)PPBP,LYPLAL1,MAP3K7CL;(v)LYPLAL1,MAP3K7CL,MOB1B;(vi)MAP3K7CL,MOB1B,RAB27B;(vii)MOB1B,RAB27B,RGS18;以及(viii)RAB27B,RGS18,TBC1D15。应当理解,很容易生成选自SEQ ID NO:10-19的3种基因的组合的完整列表,并且该段落旨在传达对每个所述3种基因的组合的拥有。
在一种方法中,谱组套包含选自七种转录物组套CLCN3[SEQ ID NO:10]、DAPP1[SEQ ID NO:11]、PPBP[SEQ ID NO:13]、MAP3K7CL[SEQ ID NO:15]、MOB1B[SEQ ID NO:16]、RAB27B[SEQ ID NO:17]以及RGS18[SEQ ID NO:18]的三(3)种或更多种基因。在一种方法中,谱组套包括三(3)种或更多种基因。在一种方法中,谱组套包括选自SEQ ID NO:10、11、13和15-18的三(3)种或更多种基因。在一种方法中,谱组套恰好包括选自SEQ ID NO:10、11、13和15-18的三(3)种基因。在一些实施方案中,该组套仅包括选自SEQ ID NO:10、11、13、15和16-18的基因。
在一种方法中,谱组套恰好包括选自表2的三种基因。在一种方法中,谱组套恰好包括选自SEQ ID NO:10-19的三种基因。在一种方法中,谱组套恰好包括选自SEQ ID NO:10、11、13、15和16-18的三种基因。
该模型以下面的重要性顺序(从最高到最低)对用于确认处于较高风险或早产的妇女的七种转录物进行加权:RAB27B>PPBP>DAPP1>RGS18>(MOB1B、MAP3K7CL和CLCN3),其中MOB1B、MAP3K7CL和CLCN3排名均等。因此,在一些实施方案中,当与参考谱中的表达相比时,确定的单个基因表达水平被赋予不同的权重(或系数)。例如,当该群组中包括所有7种基因或包含少于7种基因(例如2、3、4、5、6)的子集时,每种基因的表达值排名为RAB27B>PPBP>DAPP1>RGS18>(MOB1B、MAP3K7CL和CLCN3)。
一方面,本发明提供一种通过分析母体样本以确定表2中列出的基因(例如,cfRNA或蛋白)集合(例如SEQ ID NO:10、11、13、15和16-18)的表达谱来确定早产风险的方法。在一个实施方案中,该组套包含来自表2的至少1、至少2或至少3种基因。在一些实施方案中,谱组套可以包含来自表2的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种基因。在某些实施方案中,谱组套可以恰好包含来自表2的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种基因。在某些实施方案中,谱组套包括少于100种基因,有时少于50种基因,有时少于20种基因,有时少于15种基因,有时少于10种基因,有时少于5种基因。在某些方法中,谱组套包括的基因数量在1-100种基因、1-50种基因、1-25种基因、3-100种基因、3-50种基因、3-25种基因或3-10种基因的范围内。在一种方法中,谱组套中的至少一种基因未在美国专利公开号2013/0252835的图3A和/或图3B和/或图4中列出。
在一种方法中,在指定的妊娠周获得母体样本,并将母体表达谱与时间匹配的参考谱进行比较,其中时间匹配的参考谱是在指定的妊娠周的足月妊娠谱的特征。在一种方法中,在妊娠的指定孕期(例如,第一、第二或第三孕期)获得母体样本,并将母体表达谱与时间匹配的参考谱进行比较,其中时间匹配的参考谱是在妊娠的指定孕期的足月妊娠谱的特征。母体谱与参考谱的显著偏差表明该妇女处于升高的早产风险。即刻显而易见的是,在替代方法中,在指定的妊娠周获得母体样本,并将母体表达谱与时间匹配的参考谱进行比较,其中时间匹配的参考谱是在指定的妊娠周早产谱的特征。母体谱和参考谱之间的显著相似性表明该妇女处于升高的早产风险。在一种方法中,使用机器学习模型来比较母体谱和参考谱。
4.使用循环蛋白表达的说明性方法和实施方案
4.1从母体血液或尿液中分离蛋白
可以使用本领域熟知的方法从母体样本中分离蛋白。在一种方法中,全蛋白来自母体血液部分或尿液,并测定特定蛋白的存在和/或数量。在一种方法中,使用蛋白部分(例如富含目标蛋白的部分)进行测定。在一种方法中,使用一种或多种纯化蛋白进行测定。通过使用分子量、蛋白电荷、溶解度/疏水性、蛋白等电点(pI)、亲和纯化(例如,使用反义配体,例如特异于蛋白的抗体或适体)等方法进行分馏来执行蛋白的分离和分馏。用于从血液中分离蛋白的试剂盒是已知的并且是可商购的(例如,来自ITSIBiosciences的全蛋白测定试剂盒,目录号:K-0014-20)。用于从血浆/血清中分离蛋白的试剂盒是已知的并且是可商购的[例如,来自Abcam的抗体血清纯化试剂盒(蛋白A),目录号:ab109209]。用于从样本中分离蛋白和RNA的试剂盒也是已知的[例如,来自Thermo Fisher Scientific的蛋白和RNA分离系统(PARIS),目录号AM1921]。
4.2检测来自母体样本的蛋白
可以使用熟知的方法来确认和/或定量来自母体样本的特定蛋白,所述方法包含酶联免疫吸附测定(ELISA);放射免疫测定(RA)[参见,例如,Anthony等人,Ann.Clin.Biochem.,34:276-280(1997),其描述了使用可比较的ELISA条件检测难检测出的低水平蛋白,通过引用并入本文];邻位连接和邻位延伸测定(参见,例如,美国专利公开号20170211133;20160376642;20160369321;20160289750;20140194311;20140170654;20130323729;以及20020064779,通过引用并入本文),蛋白结合阵列(例如,抗体或适体阵列),质谱法[参见,例如,Han,X.等人(2008),通过引用并入本文.Mass Spectrometry forProteomics.Current Opinion in Chemical Biology,12(5),483–490.http://doi.org/10.1016/j.cbpa.2008.07.024;Serang,O等人(2012).Areview of statistical methodsfor protein identification using tandem mass spectrometry.Statistics and ItsInterface,5(1),3–20,通过引用并入本文]。可以使用任何合适的方法。
蛋白结合阵列可用于检测和定量蛋白,包含但不限于基于抗体的阵列和基于适体的阵列(参见,例如,Gold L,等人(2010)Aptamer-Based Multiplexed ProteomicTechnology for Biomarker Discovery.PLoS ONE5(12):e15004.https://doi.org/10.1371/journal.pone.0015004,通过引用并入本文)。抗体阵列(也称为抗体微阵列)是一种特定形式的蛋白阵列。在该技术中,将一系列的捕获抗体固定在诸如玻璃、塑料、膜或硅芯片之类的固体表面上,并且检测抗体与其靶抗原之间的相互作用(参见,例如,美国专利号:4,591,570;4,829,010;以及5,100,777,它们全部通过引用并入本文)。抗体阵列可用于检测来自各种生物体液(包含血清、血浆、尿液以及细胞或组织裂解物)的蛋白表达[参见Knickerbocker T.,MacBeath G.Detecting and Quantifying Multiple Proteins inClinical Samples in High-Throughput Using Antibody Microarrays.In:Wu C.(编著)Protein Microarray for Disease Analysis.Methods in Molecular Biology(Methodsand Protocols),第723卷.Humana Press(2011),通过引用并入本文]。
用于执行抗体阵列的试剂盒是已知的并且是可商购的(例如,来自佐治亚州诺克罗斯RayBiotech的定制抗体阵列或预定抗体阵列)。
5.统计分析
能够以多种方式将母体表达谱与参考谱进行比较。在一种方法中,执行两个数据集之间的比较以确定一个数据集与另一数据集(例如在统计显著性范围内)不同还是相似。在一个实施方案中,第一数据集可以包括母体表达谱,而第二数据集可以包括参考谱,其中第一数据集和第二数据集包含针对一种或多种基因的基因表达数据的一个或多个数据点(例如,中位数值),该数据点在妊娠期间的一个或多个时间点(例如,在妊娠过程中每周一次或每个孕期一次)收集。在一些实施方案中,第二数据集包括来自早产母体样本或具有已知胎龄的母体样本的多个数据点。
因此,母体数据集可以是一种或多种基因的表达水平的测量值,其中该表达水平可以根据每种基因的单独表达值确定,例如作为各个表达水平的平均值、加权平均值或中位数。在其他实施方案中,可以将各个表达水平视为例如用于聚类的多维数据点的不同维度。为了确定胎龄或分娩时间,可以在测得的母体样本表达水平与具有不同已知胎龄的多个参考物的参考表达水平之间进行比较,从而确认最接近的群组或代表性数据点(例如,测量的表达水平和参考表达水平之间的差距的最小差异)。最接近的参考样本的已知胎龄(或全部具有相同胎龄的一群组参考样本的代表性数据点)可以用作母体样本的胎龄或分娩时间。这种比较可以通过将测量的表达水平与根据参考样本确定的妊娠函数进行比较来执行,该妊娠函数例如线性函数,其定义了表达水平之间的函数关系(例如,个体表达水平对应于不同维度时的三维空间,或将个体表达水平组合以提供单个度量时的二维绘图)。
在区分足月样本和早产样本的实施方案中,比较可以涉及确定测量的表达水平是更类似于早产参考水平还是足月参考水平。这种比较可以涉及确定哪个参考水平聚类最接近测量的表达水平。一个或多个值可用于确定测量的表达水平是否足够接近(例如,如通过差距或权重差距所测量的,其中将沿一维的差异进行不同加权)被认为是足月或早产样本聚类的一部分的测量水平。如果表达水平不足够接近,则可能导致不确定的分类。阈值可用于确定测量的表达水平是否足够接近足月或早产群体的参考表达水平。如对于本领域技术人员来说将显而易见的,可以基于期望的灵敏度和特异性来选择阈值。
为了确定参考水平,可以用不同的分类(例如足月或早产)标记训练样本集合。然后,可以选择参考水平作为代表分类或作为分离不同分类的值,例如,作为将不同分类分配给新样本的截断值。机器学习技术可以分析不同基因的不同表达水平,以确定哪组表达水平(特征)提供针对优化参考水平集合的最佳区分。特异性和敏感性之间的折衷可以例如通过ROC(接收器工作特征)曲线来优化。在一些实施方案中,可以获得多个训练样本,每个训练样本被标记为早产或足月。在一些实施方案中,训练样本被标记为未产、多胎妇女、怀有男胎、怀有女胎等等。对于多个训练样本中的每一个,可以获得基因组套的一个或多个测量的表达水平。使用机器学习技术(例如,通过优化由模型定义的成本函数),可以迭代地调整一个或多个参考表达水平,以增加由于将一个或多个测量的表达水平与一个或多个参考表达水平进行比较而正确分类的训练样本的数量。
在一些方面,可以分析第一数据集和第二数据集以建立数据集(例如,数据集的表达水平)之间的相对差异或相似性(例如,倍数增加或倍数减少)。当确定基因组套的单一表达水平时,可以执行这样的程序。另一方面,整个妊娠期间每种基因在每个时间点的表达水平的成对比较可以用于确认哪个参考水平最相似,其中每个参考水平集合可以对应不同的胎龄。在一些实施方案中,成对比较(例如,不同基因的表达水平之间和/或不同时间的参考水平之间的成对比较)可以包含经由一系列统计方法进行的统计分析,包含但不限于费舍尔精确检验、Wilcox秩检验、置换检验、线性回归、广义线性模型和拟似然检验,并结合适当的多重假设校正(例如,Benjamini Hochberg)。
在一个实施方案中,在整个妊娠期间区分基因活性(例如,在早产和足月母体样本之间,参见实施例1和图11A至图11D)可以包含使用分位数调整的条件最大似然方法、广义线性模型(GLM)似然比检验和/或拟似然F检验,其使用edgeR软件(Bioconductor,可从https://bioconductor.org/packages/release/bioc/html/edgeR.html获得)在R中实施。
另一方面,可以使用利用第二数据集生成的随机森林模型[例如,参见Chen和Ishwaran,Genomics,99:323-329(2012),通过引用并入本文)来分析样本数据集。参见实施例。随机森林是机器学习的一种形式,其随机选择训练集以建立多个模型(例如,决策树或回归模型),并使用这种全套模型的输出来确定最终输出(例如,在确定胎龄或分娩时间时经由对足月/早产分类或平均值的多数投票进行所述确定)。每个模型可以具有相同或不同的特征(例如,基因的表达水平),但是具有如根据随机选择的不同训练集所确定的不同参考水平。将认识到,可以使用其他机器学习技术来比较两个数据集,包含但不限于支持向量机、弹性网络、lasso或神经网络。还将显而易见的是,可以开发机器学习模型(例如,监督机器学习;参见,例如,Mohri等人(2012),Foundations of Machine Learning,The MITPress,通过引用并入本文),以解释群体的特定属性,例如种族,以及可以基于不同需求制备多种模型(例如东欧模型与北非模型)。
一方面,可以如下制备机器学习模型(例如,以预测胎龄或分娩时间):
(1)组建标记的训练集(例如,已知每个样本的胎龄);
(2)通过选择目标特征进行迭代(例如,递归特征选择);
(3)基于所选择的特征建立回归模型(例如随机森林);以及
(4)使用交叉验证数据来选择回归模型和特征子集(例如,通过保留训练集的一部分并确定回归模型评估保留数据的准确性)。
在一个实施方案中,一旦制备了回归模型,就可以将其存储并用于将来的数据解释。在其他实施方案中,可以例如通过将直线或曲线拟合到在已知胎龄时测量的一组测量的表达水平来确定单个回归模型。例如,当模型(例如,线性或非线性函数)被拟合到具有测量的表达水平并且已知胎龄的多个校准样本的表达水平时,可以将回归模型视为妊娠函数。因此,可以通过将母体表达谱与基于一个或多个表达水平的输入来提供胎龄的妊娠函数进行比较来进行母体表达谱与参考谱的比较。
另一方面,可以使用可从http://statweb.stanford.edu/~tibs/SAM/获得的SAMS(分子亚表型评分算法)来分析第一数据集和第二数据集[参见Tusher等人,PNAS,98:5116-5121(2001),通过引用并入本文]。SAMS是通过两个分数(例如,上分数和下分数)的计算而生成的基因表达数据的分类算法。在一个实施方案中,可以将本发明的母体表达谱数据集(例如cfRNA)与参考表达谱数据集进行比较,并且具有高于中位数值(与参考表达谱相比)的上分数和高于中位数值(与参考表达谱相比)的下分数的母体样本可以被归类为统计学上显著的[参见,例如Herazo-Maya,Lancet Respir Med,9月20日,(2017)doi:org/10.1016/S2213-2600(17)30349-1以及Dinu等人,BMC Bioinformatics,8:242(2007),两者均通过引用并入本文]。可以根据SAMS用户手册(可从http://www-stat.stanford.edu/~tibs/SAM/sam.pdf获得)对使用SAMS的第一数据集和第二数据集进行其他评估。
存在各种附加的统计分析,用于针对基因表达数据(例如,早产数据集对比母体样本)的第一和第二数据集的比较,包含,例如由Efron和Tibshirani[On Testing theSignificance of Sets of Genes.Ann Appl.Stat.,1.107-129(2007)]和Zhao等人[Geneexpression profiling predicts survival in conventional renal cell carcinoma,PLOS Medicine,3.E13.13.10.1371/journal.pmed.0030013.(2006),两者均通过引用并入本文]提出的方法。
如上所讨论,可以将母体表达谱与参考谱进行比较,并且可以进行相似性或差异性的测量。在一种方法中,将母体表达谱与参考谱进行比较包含编译基因表达数据(例如,计算机可读介质上的指定cfRNA序列的转录物的数量或相对数量),并在所述计算机上处理所述数据以确认所述谱之间的相似性和差异性的程度。
6.对处于早产风险的妇女的医疗干预
被确认为处于早产风险的妇女可以选择医学干预(例如,补充黄体酮、宫颈环扎)、行为改变(戒烟)或超声成像,以监测和减少早产的可能性或尽可能地延长妊娠期。参见Newnham等人.“Strategies to Prevent Preterm Birth.”Frontiers in Immunology 5(2014):584,通过引用并入本文。孕酮可用于治疗和/或预防被确认为处于早产风险的妇女的早产发作。在一些实施方案中,可以向孕妇施用,例如作为阴道凝胶剂的一定量的孕酮,该量足以通过延迟子宫颈的缩短或脱落(effacing)来延长妊娠。施用频率可以每周一次或每天4次。对某些有早产先兆,即胎膜早破(PROM)的妇女,建议进行抗生素治疗(阿莫西林、氨苄青霉素、红霉素、阿奇霉素和头孢菌素),并且可以对被确认处于早产风险的妇女施用抗生素治疗。当确认妇女处于早产风险时,医疗服务提供者可以建议每四周、每两周或每周进行至少一次超声检查。
7.本发明对处于早产风险的妇女的治疗和预后用途
在一些实施方案中,本文所述的方法用于治疗。在一种方法中,在第一时间点从处于早产风险的妇女获得第一母体表达谱,启动或执行在医学上适当的步骤(例如,医学干预),然后在第二时间点从妇女获得第二母体表达谱。将每个母体表达谱与适当的参考谱(例如,时间匹配、群体匹配的参考谱等)进行比较。如果第二母体表达谱和适当的对应的参考谱之间的差异小于第一母体表达谱和其适当的对应的参考谱之间的差异,则表明所执行的步骤具有有益的治疗作用。在一些情况下,将第一和第二母体表达谱与相同的参考谱进行比较。在一种方法中,该过程无需任何医学干预即可进行,在这种情况下,可以观察到自然的改善(spontaneous improvement)。
在一些实施方案中,本文描述的方法用于预后。据信某些母体表达谱指示特定的预后。例如,某些母体表达谱可用于估算距离早产的时间(无干预)。为此目的的参考谱可以从按特定妊娠结果(早产日期)、按遗传风险或按表型因素(例如年龄和以前的妊娠史)分组的亚群体中生成。本文公开的方法还可用于确认和监测具有先天性缺陷的胎儿;在某些情况下,该方法可用于告知有关子宫内治疗的决定。母体表达谱可用于估算胎儿的分娩时间和胎龄,并且结果可用于为母体或胎儿提供建议或治疗。类似地,通过适当选择的基因,此类谱可用于估算诸如早产之类的不良事件的风险。
8.计算机实现方法&参考值数据库
可以使用基于计算机的系统来实现本发明的方法。如本文所用,“基于计算机的系统”是指用于分析本发明的信息的硬件装置、软件装置和数据存储装置。本发明的基于计算机的系统的最小硬件包含中央处理单元(CPU)、输入装置、输出装置和数据存储装置。本领域技术人员可以容易地理解,当前可用的任何一种基于计算机的系统都适用于本发明。数据存储装置可以包含任何制品,包括如上所述的当前信息的记录制品,或者可以访问这种制品的存储器访问装置。
在一些实施方案中,在本发明的方法中使用包括参考谱的数据库。在一些实施方案中,提供了一种数据库,该数据库包括来自多个妇女,以及任选地不同的妇女亚群的表达数据。因此,本发明的各方面提供了用于数据库的使用和开发的系统和方法。在某些方法中,数据库与算法结合使用,该算法实现了基于单个妇女的特征选择的新参考谱的生成。
本文提到的任何计算机系统都可以利用任何合适数量的子系统。在一些实施方案中,计算机系统包含单个计算机设备,其中子系统可以是计算机设备的组件。在其他实施方案中,计算机系统可以包含具有内部组件的多个计算机设备,每个计算机设备是子系统。计算机系统可以包含台式计算机和膝上型计算机、平板电脑、移动电话和其他移动装置。
计算机系统可以包含多个相同的组件或子系统,例如,通过外部接口、通过内部接口或经由可移动存储装置连接在一起的多个相同组件或子系统,该可移动存储装置可以从一个组件连接到另一个组件或在其间移除。在一些实施方案中,计算机系统、子系统或设备可以通过网络进行通信。在这种情况下,一台计算机可以被视为客户端,而另一台计算机可以被视为服务器,其中每台计算机都可以是同一计算机系统的一部分。客户端和服务器可以各自包含多个系统、子系统或组件。
实施方案的各方面可以使用硬件电路(例如,专用集成电路或现场可编程门阵列)和/或使用具有通常可编程处理器的计算机软件以模块化或集成方式以控制逻辑的形式来实现。如本文所使用的,处理器可以包含单核处理器,同一集成芯片上的多核处理器,或单个电路板上或联网的多个处理单元,以及专用硬件。基于本文提供的公开内容和教导,本领域普通技术人员将知道并理解使用硬件以及硬件和软件的组合来实现本发明的实施方案的其他方式和/或方法。
在本申请中描述的任何软件组件或功能可以被实现为软件代码,该软件代码将由处理器使用例如传统或面向对象技术使用诸如Java、C、C++、C#、Objective-C、Swift之类的任何合适的计算机语言,或诸如Perl或Python之类的脚本语言来执行。可以将软件代码作为一系列指令或命令存储在计算机可读介质上,以进行存储和/或传输。合适的非暂时性计算机可读介质可以包含随机存取存储器(RAM)、只读存储器(ROM)、诸如硬盘驱动器或软盘之类的磁性介质,或者诸如光盘(CD)或DVD(数字通用磁盘)之类的光学介质、闪存等。计算机可读介质可以是这种存储或传输装置的任何组合。
可以以各种形式或介质来提供数据库以促进它们的使用。“介质”是指包含本发明的表达信息的制品。本发明的数据库可以记录在算机可读介质上,例如可以由计算机直接读取和访问的任何介质(例如,互联网数据库)。此类介质包含但不限于:磁存储介质,例如软盘、硬盘存储介质和磁带;光学存储介质,例如CD-ROM;电存储介质,例如RAM和ROM;以及这些类别的混合物,例如磁/光存储介质。本领域的技术人员可以容易地理解,如何可以使用任何当前已知的计算机可读介质来创建包括对当前数据库信息的记录的制品。“记录的”是指使用本领域中已知的任何此类方法在计算机可读介质上存储信息的过程。基于用于访问所存储的信息的手段,可以选择任何方便的数据存储结构。各种数据处理器程序和格式可以用于存储,例如文字处理文本文件、数据库格式等。
这样的程序还可以使用载波信号来编码和传输,该载波信号适于经由符合包含因特网的各种协议的有线、光学和/或无线网络进行传输。这样,可以使用用这样的程序编码的数据信号来创建计算机可读介质。可以将用程序代码编码的计算机可读介质与兼容装置打包在一起,或者与其他装置分开提供(例如,经由Internet下载)。任何此类计算机可读介质可以驻留(reside)在单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或其内部,并且可以存在于系统或网络内的不同计算机产品上或该计算机产品内部。计算机系统可以包含监测器、打印机或其他合适的用于向用户提供本文提到的任何结果的显示器。
本文描述的任何方法可以用包含一个或多个处理器的计算机系统完全或部分执行,其可以被配置为执行步骤。因此,实施方案可以涉及计算机系统,该计算机系统被配置为执行本文描述的任何方法的步骤,潜在地具有执行相应步骤或相应步骤群组的不同组件。尽管以编号的步骤呈现,但是本文的方法的步骤可以同时或在不同时间或以不同顺序执行。另外,这些步骤的部分可以与其他方法的其他步骤的部分一起使用。而且,步骤的全部或部分可以是可选的。另外,可以用模块、单元、电路或用于执行这些步骤的系统的其他装置来执行任何方法中的任何步骤。
9.引物、探针和组合物
在本发明的各方面的实践中,可以使用引物和探针,该引物和探针特异性杂交或扩增来自胎盘基因(包含表1中的基因)和其他信息基因(包含表1和表2中的基因)的cfRNA。特别地,有用的引物和探针包含特异性杂交或扩增SEQ ID NO:1-19的引物和探针。这些引物和探针用于扩增(包含多重PCR、多重RT-qPCR或其他扩增方法)、逆转录、构建测序文库(例如RNA-seq文库)、添加适体序列、杂交捕获目标RNA、构建核酸阵列、引物延伸并用于具有本领域知识的从业者已知的其他用途。考虑到扩增(例如,添加适体或通用引物)、靶序列组成、碱基组成、避免诸如引物二聚体形成之类的假象,以及cfRNA的片段化性质的方法,设计用于其预期用途的探针和引物完全在本领域普通技术人员的能力范围内。
例如,使用SEQ ID NO:1-19来设计对于每种基因具有特异性并对其预期目的(例如,用于多重反应中)起作用的引物、引物对和探针在本领域普通技术人员的能力范围内。应当理解,对于每个RNA转录物,存在可以扩增至少一部分转录物的许多不同引物和引物组合。因此,本领域技术人员可以设计引物组合以扩增SEQ ID NO:1-19中的任一个或其任何组合的信息序列,以及表1和2中确认的其他基因序列。在表3至表5中描述了示例性引物和探针。探针可以是核酸探针,例如RNA或DNA探针。引物或探针可以被固定(例如,用于基于捕获的富集)或被可检测地标记(例如,用荧光、酶促或化学发光部分等)。
9.1胎龄或分娩时间组合物
一方面,本发明提供用于多重扩增选自表1的基因的至少3种且不超过50种,任选地不超过25种,任选地不超过10种基因的引物。在一些实施方案中,本发明提供用于表1中提供的至少3种mRNA转录物的多重扩增的引物。在另一个实施方案中,本发明提供用于选自SEQ ID NO:1-9的至少3种mRNA转录物的任何组合的多重扩增的引物。在一个实施方案中,引物用于多重扩增,其中引物包括至少一对,并且任选地包括三个或更多个引物对。表3中提供了示例性引物对。在另一个实施方案中,用于多重扩增的引物包括选自表3中提供的任何引物对的至少三个且不超过100个引物对,任选地不超过50个,任选地不超过25个,任选地不超过10个引物对。
在相关方面,本发明提供包括如上所述的引物或引物对的组合物。该组合物可以是混合物。该组合物可以是溶液。该组合物可以附加地包含以下一种或多种:(a)母体cfRNA,(b)缓冲液,(c)酶(例如,逆转录酶、DNA聚合酶、RNA或DNA连接酶中的一种或组合),(d)dNTP。
一方面,提供一种组合物,其包括:(1)cfRNA,其具有对应于表1中至少2种基因的cfRNA序列,所述cfRNA序列的扩增子或来自所述cfRNA序列的cDNA,以及(2)用于扩增所述cfRNA序列或扩增子或cDNA的引物,或用于检测所述cfRNA序列或扩增子或cDNA的探针,条件是该组合物不包括用于扩增超过阈值数量的不同基因、扩增子或cDNA的引物;并且不包括用于检测超过阈值数量的不同cfRNA序列或扩增子或cDNA的探针。在一个实施方案中,该组合物不包括具有对应于来自人基因组(human genome)的超过阈值数量的不同基因的cfRNA序列的cfRNA,超过阈值数量的不同基因的扩增子或来自超过阈值数量的不同基因的cDNA。在一些实施方案中,阈值数量是200。在一些实施方案中,阈值数量是150。在一些实施方案中,阈值数量是100。在一些实施方案中,阈值数量是50。在一些实施方案中,阈值数量是25。
在相关方面,本发明提供包括如上所述的引物、引物对或探针的核酸阵列。
9.2早产风险组合物
一方面,本发明提供用于多重扩增选自表2的基因的至少3种且不超过100种基因,任选地不超过50种,任选地不超过25种,任选地不超过10种基因的引物。在一些实施方案中,本发明提供用于表2中提供的至少3种mRNA转录物(即,RefSeq标识符)的多重扩增的引物。在另一个实施方案中,本发明提供用于选自SEQ ID NO:10至19的至少3种mRNA转录物,或者可替代地选自SEQ ID NO:10、11、13和15-18的至少3种mRNA转录物的任何组合的多重扩增的引物。在一个实施方案中,引物用于多重扩增,其中引物包括至少一对,并且任选地包括三种或更多种引物对。表3中提供了示例性引物对。在另一个实施方案中,用于多重扩增的引物包括选自表3中提供的任何引物对的至少三种且不超过100种引物对,任选地不超过50种,任选地不超过25种,任选地不超过10种对。
在相关方面,本发明提供包括如上所述的引物或引物对的组合物。该组合物可以是混合物。该组合物可以是溶液。该组合物可以附加地包括以下一种或多种:(a)母体cfRNA,(b)缓冲液,(c)酶(例如逆转录酶、DNA聚合酶、RNA或DNA连接酶),(d)dNTP。
在相关方面,本发明提供试剂盒,其包括包装在一起的如上所述的引物或引物对。在一种方法中,将不同引物的混合物合并为单一混合物。在另一种方法中,将对单个cfRNA特异的引物包装在单独的小瓶中。该试剂盒可以附加地包括以下一种或多种:(a)母体cfRNA,(b)缓冲液,(c)酶(例如,逆转录酶、DNA聚合酶、RNA或DNA连接酶),(d)dNTP。
一方面,提供了一种组合物,其包括(1)cfRNA,其具有对应于表2中的至少2种基因的cfRNA序列,所述cfRNA序列的扩增子或来自所述cfRNA序列的cDNA,以及(2)用于扩增所述cfRNA序列或扩增子或cDNA的引物;或用于检测所述cfRNA序列或扩增子或cDNA的探针,条件是该组合物不包括用于扩增超过阈值数量的不同基因、扩增子或cDNA的引物;并且不包括用于检测超过阈值数量的不同cfRNA序列或扩增子或cDNA的探针。在一个实施方案中,该组合物不包括具有对应于来自人基因组的阈值数量的不同基因的cfRNA序列的cfRNA,超过阈值数量的不同基因的扩增子或来自超过阈值数量的不同基因的cDNA。在一些实施方案中,阈值数量是200。在一些实施方案中,阈值数量是150。在一些实施方案中,阈值数量是100。在一些实施方案中,阈值数量是50。在一些实施方案中,阈值数量是25。
在相关方面,本发明提供包括如上所述的引物或引物对的核酸阵列。
10.方法
本节描述了用于确定胎龄和早产风险的方法的实施。本节中的示例仅用于说明,绝非限制性的。
在一种方法中,将母体样本收集、冷冻,并运送到中央实验室进行分析。在一种方法中,本发明的方法在本地医疗机构(例如医院实验室)中任选地使用用于分离cfRNA、产生cDNA、qPCR和/或测序的试剂盒进行。在一种方法中,试剂盒包含用于cfRNA分离的试剂。使用标准试剂盒有利于确保样本收集、cfRNA分离和通过qPCR或转录组测序的分析的一致性。试剂盒可以包含用于cfRNA、cDNA产生、qPCR和/或测序的试剂,以及本文所述的用于确定本文所述的cfRNA转录物或转录物组合的表达水平的引物或探针。在一种方法中,将cfRNA、cDNA或文库生产并运送到中央实验室进行分析。
在一种方法中,将母体样本收集,使用分布式系统(其包含通过计算机网络在服务器-客户端进行通信的客户端系统和服务器系统)确定表达谱,冷冻并运送到中央实验室进行分析。服务器系统可以包括参考谱的数据库,并且可以从客户端系统接收数据(例如,表达谱信息)。使用计算机产品将来自患者的表达谱信息与参考谱进行比较,该计算机产品例如包括存储用于控制计算机系统以执行本发明的方法(根据前述权利要求中任一项所述的方法)的多个指令的计算机可读介质。参考谱的数据库可以使用本文描述的机器学习方法来产生。有利地,当收集来自各个患者的表达谱时,该信息可以用作训练数据。当从人口统计学上不同的患者群体(例如,按年龄、种族或民族、地理位置或其他标准确认的群体)中收集训练和验证数据时,这可能特别有用。
当患者表达谱与特定结果(例如足月分娩或早产)或出生时的胎龄相关联时,该患者表达谱将是最有用的。因此,一方面,本发明涉及(1)在妊娠期间一次或多次从孕妇收集cfRNA,使用cfRNA确定表达谱(即,与本文确认的基因集合相对应的表达谱,例如来自表1、表2或表6的基因或组合或本文所述的子集);以及将表达谱记录在例如合适的非暂时性计算机可读介质上;然后(2)确定妇女的分娩日期,将分娩归类为足月或早产(如果是早产,则按天数),或者以其他方式表征妊娠的结果,以及(3)将(2)中的信息与(1)中的表达谱相关联,例如,通过在计算机可读介质中链接信息和表达谱。
胎龄的确定
在一种方法中,提供一种使用计算机执行的用于估算胎儿的胎龄的方法,该方法包括:(a)从怀有胎儿的孕妇的母体样本获得一个或多个表达谱,其中该表达谱对应于来自第一个基因组套的cfRNA转录物的表达;(b)使用计算机系统将该表达谱与限定胎龄特征的一个或多个参考谱进行比较,以估算胎儿的胎龄,其中使用机器学习模型确定作为限定胎龄的特征的参考谱,该机器学习模型分析第一训练样本,该第一训练样本是用限定胎龄标记的cfRNA表达谱;(c)使用计算机系统通过以下方式更新参考谱:(1)接收第二训练样本,其中该第二训练样本是用特定胎龄标记的cfRNA表达谱,以及(2)经由机器学习模型迭代地调整参考谱,以增加正确分类的第一和第二训练样本的数量。参考谱可以形成直线或曲线,或者是离散值。在一些实施方案中,第一个基因组套包括以下任何项的任何组合:本文公开的可预测胎龄的基因的任何组合,包含胎盘基因,表1中列出的胎盘基因,以及选自CGA[SEQID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ IDNO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]和LGALS14[SEQ IDNO:9]的至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因。
还提供一种计算机系统,其包括:(a)包括参考谱的数据库,每个参考谱均包含在孕妇群体中对应于第一个基因组套和对应于限定胎龄的cfRNA转录物的表达水平;(b)被配置为通过网络与客户端计算机交互并接收表达谱的用户界面,该表达谱包含在怀有胎儿的孕妇中对应于第一个基因组套的cfRNA转录物的表达水平;以及(c)一个或多个被配置为分析参考谱和表达谱的处理器,包含比较参考谱和表达谱以确定胎儿的胎龄;以及(d)网络接口,其将胎儿的胎龄传输到客户端计算机。在一个实施方案中,参考谱和表达谱包括本文公开的任何组合的cfRNA组套的表达水平,包含来自胎盘基因的转录物;表1中列出的胎盘基因;以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ IDNO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ IDNO:8]和LGALS14[SEQ ID NO:9]的至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因。
早产的风险
在一种方法中,提供一种使用计算机执行的用于评估孕妇早产风险的方法,该方法包括:(a)从孕妇的母体样本获得一个或多个表达谱,其中该表达谱对应于来自第一个基因组套的多个cfRNA转录物的表达;(b)使用计算机系统将表达特征与具有(a)早产高风险或(b)早产低风险的妇女特有或具有限定的妊娠时长的妇女特有的一个或多个参考特征进行比较,其中使用机器学习模型确定参考谱,该机器学习模型分析第一训练样本,该第一训练样本是早产或足月cfRNA表达谱,或者标记有妊娠时长,(c)使用计算机系统通过以下方式更新参考谱:(1)接收第二训练样本,其中该第二训练样本是被标记为早产或足月或标记有妊娠时长的cfRNA表达谱,以及(2)经由机器学习模型迭代地调整参考谱以增加正确分类的第一和第二训练样本的数量。参考谱可以形成直线或曲线,或是离散值。在一些实施方案中,第一个基因组套包括本文公开的预测早产风险的基因的任何组合,包含表1中列出的基因,以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ IDNO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ IDNO:8]和LGALS14[SEQ ID NO:9]的至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因,或者选自CLCN3[SEQ ID NO:10]、DAPP1[SEQ ID NO:11]、PPBP[SEQ ID NO:13]、MAP3K7CL[SEQ ID NO:15]、MOB1B[SEQ ID NO:16]、RAB27B[SEQ ID NO:17]和RGS18[SEQ IDNO:18]的至少2、至少3、至少4、至少5、至少6或7种基因。在一些实施方案中,第一个基因组套包括选自(1)RGS18;DAPP1;PPBP;(2)RGS18;RAB27B;PPBP;(3)RGS18;MOB1B;PPBP;(4)RGS18;PPBP;MAP3K7CL;(5)RGS18;PPBP;CLCN3;(6)DAPP1;RAB27B;PPBP;(7)DAPP1;MOB1B;PPBP;(8)DAPP1;PPBP;CLCN3;(9)RAB27B;MOB1B;PPBP;(10)RAB27B;PPBP;MAP3K7CL;(11)RAB27B;PPBP;CLCN3;(12)MOB1B;PPBP;MAP3K7CL;以及(13)MOB1B;PPBP;CLCN3的至少一种组合。
为了确定早产的风险,可以将母体样本标记为“早产”和“足月”;或标记孩子出生时的胎龄;或标记妊娠时长(例如分娩周),这些的组合,或标记适用于定量或定性区分足月分娩与早产的标签。
还提供一种计算机系统,其包括:(a)包括参考谱的数据库,每个参考谱包含在孕妇群体中对应于第一个基因组套和早产风险的cfRNA转录物的表达水平;(b)用户界面,其被配置为通过网络与客户端计算机交互并接收表达谱,该表达谱包含在孕妇中对应于第一个基因组套的cfRNA转录物的表达水平;以及(c)一个或多个处理器,其被配置为分析参考谱和表达谱,包含比较参考谱和表达谱以确定早产风险;以及(d)网络接口,其将早产风险传输到客户端计算机。在一些实施方案中,参考谱和表达谱包括本文公开的任何组合的cfRNA组套的表达水平,包含表1中列出的基因,以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ IDNO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]和LGALS14[SEQ ID NO:9]的至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因,或者选自CLCN3[SEQ ID NO:10]、DAPP1[SEQ IDNO:11]、PPBP[SEQ ID NO:13]、MAP3K7CL[SEQ ID NO:15]、MOB1B[SEQ ID NO:16]、RAB27B[SEQ ID NO:17]和RGS18[SEQ ID NO:18]的至少2、至少3、至少4、至少5、至少6或7种基因。
11.实施例
11.1实施例1-材料和实验方法
样本收集
根据机构审查委员会批准的协议,每周一次从丹麦孕妇收集血液样本(高分辨率队列),以及在第二孕期或第三孕期期间的一个时间点从宾夕法尼亚大学(早产队列)和阿拉巴马大学伯明翰分校(早产队列)收集血液样本。参与研究的宾夕法尼亚州和阿拉巴马州妇女自然早产的风险较高。除一名宾夕法尼亚州患者(先兆子痫)外,所有早产妇女均经历了自然早产。按照护理标准,所有具有早产史的妇女都要接受每周一次的孕酮注射。将血样收集到涂有EDTA的真空采血管(新泽西州Becton Dickinson)中。使用标准的临床血液离心方案从血液中分离血浆。
无细胞RNA(cfRNA)分离
使用血浆/血清循环RNA和外泌体纯化试剂盒(加拿大Norgen Biotek公司,目录号42800)从0.75-2mL血浆中提取无细胞RNA。DNA残留物使用Baseline-ZERO DNase(威斯康星州Epicentre)消化,然后通过RNAClean and ConcentratorTM-5试剂盒(加利福尼亚州ZymoResearch)清洗。在洗脱缓冲液中将所得的RNA洗脱至12μl。
RT-qPCR检测
RT-qPCR测定由两个主要反应组成:提取的cfRNA的逆转录/预扩增以及预扩增的cDNA的qPCR。用于我们的基因组套的引物是由加利福尼亚州的Fluidigm公司设计和合成的(表3)。使用CellsDirectTMOne-Step RT-qPCR试剂盒(加利福尼亚州Invitrogen,目录号11753-100)和来自表3的96种引物对池,将12μl总纯化RNA中的1-2μl或10μl用于逆转录/预扩增反应。进行20个循环的预扩增,并使用核酸外切酶I处理消化反应的残余引物。在BioMark System(加利福尼亚州Fluidigm公司)上使用96x96动态阵列芯片对96种引物对的96个样本进行多重qPCR反应。BioMark动态阵列芯片将单独的样本(cDNA)和单独的试剂(引物对)分别装入动态阵列芯片上的孔中。集成的流体回路控制器将样本和试剂推入通道,直至充满;然后流体值的协调释放和关闭使得样本和试剂能够混合到芯片内的各个隔室中。96x96动态阵列芯片可以同时分析多达9,216个反应。使用Fluidigm实时PCR分析软件提取qPCR反应的阈值循环(Ct值)。
cfRNA-Seq文库制备
根据制造商的手册,使用6μl洗脱的cfRNA,通过SMARTer Stranded TotalRNAseq-Pico Input哺乳动物试剂盒(加利福尼亚州Clontech,目录号634413)制备无细胞RNA测序文库。在Illumina NextSeqTM(2x75bp)平台(Illumina,CA)上进行短读数测序,深度为每个样本超过一千万的读数。
统计分析
cfRNA-Seq差异表达分析
对早产发现队列的28个样本(14个足月和14个早产)cfRNA样本进行了测序。使用STAR比对仪将测序读数映射到人参考基因组(hg38)。通过Picard删除重复项,然后使用htseq-count量化唯一读数。预处理后,将包含映射到3000多种基因的测序读数的16个样本用于后续的统计分析。使用分位数调整的条件最大似然方法、广义线性模型(GLM)似然比检验和使用edgeR包在R中实施的拟似然F检验,确认了足月和早产样本之间的差异基因。
RT-qPCR样本分析
以绝对术语量化原始Ct值。绝对定量基于已知量的ERCC的循环阈值估算每个样本中包含的转录物计数(图9)。然后调整估算的转录物计数的稀释度、样本量,并通过处理的血浆量进行归一化。
多元随机森林建模
使用插入符号包在R中执行递归特征选择和模型构建。纵向数据使用3周居中移动平均值进行平滑处理,分为21位患者训练集和10位患者验证集。使用重复10次的10倍交叉验证进行模型选择。
预期的分娩日期估算
预期的分娩日期是从随机森林模型预测中得出的。没有使用居中移动平均值对此应用程序的纵向数据进行平滑处理。对于任何给定的采样周期[第二孕期(T2)、第三孕期(T3)或两者(T2&T3)],将分娩时间估算值转移到指定的参考时间点,然后使用中位数取平均值以建立预期的分娩日期。
早产生物标志物候选物的选择和验证
如Rose和Mennuti(Fetal Medicine,West J Med.,1993;159:312-317,通过引用并入本文)中应用的,使用修正的中位数倍数方法将绝对RT-qPCR值归一化,该修正的中位数倍数在时间和流行病学上不变,从而能够对不同种族的队列进行一致的比较。足月患者中位数通过每种基因的队列水平的第三孕期进行定量。如Sweeney等人(J.PediatricInfect.Dis.Soc.,2017,doi:10.1093/jpids/pix021,通过引用并入本文)所述,使用分别使用Hedges’g和费舍尔精确检验计算出的效应大小和显著性阈值的组合标准进行生物标志物发现。使用0.8的效应大小阈值和5%的错误发现率(FDR),认为基因的队列之间存在显著差异。然后以3个独特组合测试候选基因生物标记,以评估其检测真假阳性的能力。使用独立队列选择真阳性率大于0.75和假阳性率小于0.05的组合,以进行进一步验证。ROC曲线基于生物标志物组合的分数,其中所有基因均显示了超过中值表达至少2.5倍的倍数增长。
11.2实施例2-来自三个不同群体的到期日的纵向数据
我们通过在妊娠期的每周纵向测量孕妇血液中的cfRNA来进行正常人孕育的高分辨率研究。cfRNA通过提供有关胎儿、胎盘和母体组织中基因表达的信息,提供了通向妊娠表型状态的窗口。Koh等人描述了使用组织特异性基因来直接测量组织健康和生理学,并且这些测量结果与低时间分辨率下妊娠和胎儿孕育的已知生理学一致[Koh等人PNAS,第111卷,20:7361-7366,(2014),通过引用并入本文]。对本样本中组织特异性转录物的分析使我们能够以高分辨率和高灵敏度追踪胎儿和胎盘的孕育,还检测母体免疫系统对妊娠的基因特异性反应。来自本研究的数据为人类的正常孕育建立了一个“时钟”,并使直接分子方法能够使用9种胎盘基因确定分娩时间和胎龄。我们证明,来自妊娠的第二孕期和第三孕期的cfRNA样本可以预测预期的分娩日期,其准确性与超声相当,从而为廉价的便携式日期确定方法奠定了基础。
我们从丹麦国家生物库中招募了31名丹麦孕妇,她们每个人都同意每周献血一次,从而产生了521个血浆样本以进行分析(图1A)。所有孕妇正常足月分娩(限定为分娩时胎龄等于或大于37周),以及她们的病历显示妊娠期间没有异常的健康变化(表8)。使用所选择的特定于胎盘、胎儿组织或免疫系统的基因组套,通过高度多重的实时PCR分析每个样本。
表8
Figure BDA0002506829930000461
11.3实施例3-来自正常到期日分娩的母体血浆样本中母体、胎盘和胎儿组织特异性基因的基因表达
如实施例1所述,从每个丹麦队列个体血液样本中分离无细胞RNA。基本上如实施例1所述,对分离的cfRNA进行RT-qPCR测定。将图9中列出的每种基因引物对添加到cfRNA样本的等分试样中,并使用适当的对照计算Ct值。
在妊娠过程中绘制基因特异性患者间月平均值±平均值的标准误(SEM)(图2A)。基因表达的平均时间过程突出了因基因功能而不同的有趣行为(图2A和图4)。胎盘和胎儿基因(蓝色和黄色)在整个妊娠过程中显示出明显的增加,其中轨迹因基因而略有不同。这些基因中的一些在分娩前达到稳定期,其中一个(CGB)从第一孕期的峰值下降。受母体免疫系统控制但也可包含胎儿贡献的免疫基因具有更为复杂的解释,但通常在妊娠初期和分娩后以可测量的基线显示随时间的变化。然后,我们计算了所有基因和所有妊娠期的基因值之间的相关性(图2B),并且发现每个集合内的基因(即胎盘、免疫、胎儿)彼此高度相关。此外,我们发现胎盘和胎儿基因也显示出中等程度的互相关性,这表明胎盘cfRNA可提供整个妊娠期胎儿孕育和胎龄的准确估算。
11.4实施例4-分娩时间预测模型&与黄金标准的比较
基因表达测定的结果促使我们应用机器学习方法来建立模型,该模型将根据cfRNA测量结果预测胎龄或分娩时间。我们使用随机森林模型,并且能够显示九种胎盘基因的子集比使用完整的一组测得的基因提供更多的预测能力(图5)。使用这9种基因(CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14),我们准确地预测了从样本收集到分娩的时间(Pearson相关系数r=0.91,P<2.2x10-16),这是不受超声估算的胎龄影响的客观标准(图2C)。我们的模型的性能在妊娠过程中得到了显著改善[均方根误差(RMSE)=6.0(T1),3.9(T2),3.3(T3),3.7(PP)周]。值得注意的是,在验证阶段[RMSE=5.4(T1),4.2(T2),3.8(T3),2.7(PP)周](图2D)期间,我们的模型在10名妇女的保留队列中表现同样好(r=0.89,P<2.2x10-16)。
我们还建立了单独的模型来预测胎龄(通过超声估算),且通过使用相同的九种胎盘基因,该模型在训练(r=0.91,P<2.2x10-16)和验证数据(r=0.90,P<2.2x10-16)方面均表现良好(图6A和6B)。
随机森林模型选择最能预测从样本收集直到分娩的时间和胎龄的胎盘基因。尽管这些基因中的几种基因显示出相似的时间轨迹,但是它们在孕早期的检测率不同,这表明当胎盘和胎儿cfRNA都较低并导致丢弃效应(drop-out effect)时,冗余可以提高早期时间点的准确性。随着cfRNA在妊娠期间增加,该模型的准确性提高。这与超声日期确定法的功效相反,该超声日期确定法依赖于恒定的胎儿生长速度—随着时间的流逝而恶化的假设(Savitz等人.2002;Papageorghiou等人.2016)。
该模型的进一步调查驱动物揭示了在妊娠期间具有已知作用的标志物。两个主要模型驱动物CGA和CGB与CAPN6的行为与模型中的其他基因不同。CGA和CGB是HCG的两个亚基,已知在妊娠的起始和进展中起主要作用,并参与滋养细胞的分化(Jaffe等人,1969)。观察到这两种基因的趋势与妊娠期间蛋白水平已知的趋势相吻合(Cocquebert等人.2012)。游离的CGB和PAPPA也被用作第一孕期唐氏综合征风险的生化标志物(Wald和Hackshaw1997),并且通过该模型选择的其他基因与滋养细胞孕育有关(例如,LGALS14、PAPPA)。
然后,我们使用我们的模型根据在第二孕期、第三孕期或这两个孕期期间抽取的样本估算预期的分娩日期(图2E)。我们发现,32%(T2)、23%(T3)、45%(T2&T3)和48%(T1超声)的患者在他们预期的分娩日期的一周内分娩(表9)。
表9
Figure BDA0002506829930000481
先前的研究报告说,在正常情况下,有可能使用超声波以57.8%的准确度以及使用LMP以48.1%的准确度确定妇女可能分娩的那一周(Savitz等人,2002)。我们的结果不仅可与超声波测量结果媲美,且成本低廉,而且使用的方法更易于转用到资源匮乏的环境中。
为了预测胎龄,我们针对妇女亚群(即,未产或多胎妇女、怀有男胎或女胎的妇女)训练了几种不同的模型,以确定构成所确认的转录组识别标志的9种基因的重要性。针对怀有男胎或女胎的妇女训练4种不同的模型揭示,正文中确认的9种基因中有2种足以预测孕有男胎(CGA,CSHL1)[第二和第三孕期的均方根误差(RMSE)分别为5.43和4.80]或女胎(CGA,CAPN6)(第二和第三孕期的RMSE分别为5.58和4.60)和多胎(CGA,CSHL1)(第二和第三孕期的RMSE分别为5.22和4.56)的妇女的分娩时间。但是,所有9种基因对于预测未产妇女的距离分娩的时间都是必不可少的,这突显了已确认的转录组识别标志的重要性。该模型按以下重要性顺序(从最高到最低)对用于预测胎龄的九种转录物进行了加权:CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14。参见表10。
表10
Figure BDA0002506829930000491
总而言之,我们发现了胎儿孕育的分子钟,它反映了胎盘和胎儿中孕育基因表达的路线图,并能够以与超声相当的准确性预测分娩时间、胎龄和预期的分娩日期。我们的方法具有超过超声的几个优点,即成本和妊娠后期的适用性。只需花费超声成本的一小部分,cfRNA测量结果就可以轻易地转用到资源匮乏的环境中。即使在经常使用超声的国家中,cfRNA仍是超声的一种有吸引力的准确的替代方法,尤其是第二孕期和第三孕期,这时超声预测会降低到15(T2)或27(T3)天的分娩估算天数(Altman和Chitty,1997年)。我们希望该时钟还将有助于发现和监测具有先天性缺陷的胎儿,这些胎儿可以在子宫内接受治疗,这代表了孕产妇医学的快速增长部分。
11.5实施例5-正常和早产之间差异表达基因的确认
尽管第一代“时钟”模型能够预测正常妊娠的胎龄和分娩时间,但我们也对测试其在早产时的表现感兴趣。因此,我们使用了两个队列来测试早产的表现,这两个队列分别从宾夕法尼亚大学和阿拉巴马大学伯明翰分校招募的处于早产高危社区中招募(见图1和表1)。我们发现,尽管该模型验证了正常妊娠时的表现(RMSE=4.3周),但它通常无法预测早产样本中的分娩时间(RMSE=10.5周)(图7)。这表明该模型的内容反映了正常的孕育程序,并且可能无法解释可能导致早产的各种异常生理事件。换句话说,从分子角度看,早产胎儿似乎尚未达到足月妊娠,因此早产可能不是由胎儿或胎盘的过成熟信号(其提供了达到足月的感觉)引起的。该结论得到以下观察结果的支持:旨在阻止或减缓子宫收缩的药理剂防止少量早产(Romero等人.2014;Conde-Agudelo和Romero 2016)。
为了进一步研究这个问题并开发能够预测早产的第二代“时钟”模型,我们对获自从一个早产富集群体(宾夕法尼亚州)(参见图1和表1)收集的足月(n=7)和早产(n=9)妇女中的血浆样本cfRNA进行了RNAseq(基本如实施例1所述),以确认可区分早产与正常分娩的基因。
对该RNAseq数据的分析表明,近40种基因可以以统计学显著性(p<0.001)将足月与早产分开(参见图3A和图10A至10D)。当重新计算以排除一名先兆子痫妇女(参见实施例)时,确定37种基因可以以统计学显著性将足月与早产分开。
然后,我们创建了PCR组套(PCR panel),该PCR组套具有最高得分的候选早产生物标志物以及其他免疫和胎盘基因。我们证实了,用qPCR组套也观察到了在RNAseq中观察到的差异表达(图8)。
11.6实施例6-早产预测模型
来自该组套的前十种基因(CLCN3、DAPP1、POLE2、PPBP、LYPLAL1、MAP3K7CL、MOB1B、RAB27B、RGS18、TBC1D15)(FDR≤5%,Hedge’s g≥0.8)(图3B)对9个早产样本的7个(78%)进行了准确分类,并且仅对来自宾夕法尼亚州和丹麦两者的26个足月样本中的1个(4%)进行了错误分类,其中平均AUC为0.87(图3C)。
当组合使用时,这十种基因在来自阿拉巴马州的独立的早产富集队列中也显示出成功的验证,对6个早产样本中的4个(66%)进行了准确分类,并对18个足月样本中的3个(17%)进行了错误分类(参见图1)。
此外,该独立的验证队列表明,有可能在分娩前多达2个月将早产与足月妊娠区分开,其中AUC为0.74(图3C)。响应标识(response signature)中的几种基因在早产妇女中分别显著高表达(FDR≤5%,Hedge’s g≥0.8),这证明了其作用的稳健性(图3B)。我们的数据表明,与自然早产相关联的基因不同于那些最能预测胎龄和正常分娩时间的基因。
在随后的改进中,我们确定该队列中的一名妇女由于先兆子痫而不是自然早产而经历了早产。我们删除了与她的血浆样本相关联的数据点。在去除该样本的情况下运行分析产生了7种转录物(CLCN3、DAPP1、PPBP、MAP3K7CL、MOB1B、RAB27B、RGS18),而不是10种,当结合使用3种时,其真实阳性率大于75%,且错误分类率较低超过5%。
如下面的实施例7所述,我们确认了可用于确定妇女早产的可能性或风险的7种转录物的几种亚组合。因此,在某些方法中,以下组套中的一个或多个用于评估足月或早产的可能性:(1)RGS18;DAPP1;PPBP;(2)RGS18;RAB27B;PPBP;(3)RGS18;MOB1B;PPBP;(4)RGS18;PPBP;MAP3K7CL;(5)RGS18;PPBP;CLCN3;(6)DAPP1;RAB27B;PPBP;(7)DAPP1;MOB1B;PPBP;(8)DAPP1;PPBP;CLCN3;(9)RAB27B;MOB1B;PPBP;(10)RAB27B;PPBP;MAP3K7CL;(11)RAB27B;PPBP;CLCN3;(12)MOB1B;PPBP;MAP3K7CL;以及(13)MOB1B;PPBP;CLCN3。
我们发现在宾夕法尼亚州和阿拉巴马州队列中均早产的妇女中,PPBP,DAPP1和RAB27B均单独升高(FDR≤5%,Hedge’s g≥0.8),这证明了其作用的稳健性。权重顺序的排名(从最高到最低)是RAB27B>PPBP>DAPP1>RGS18>(MOB1B、MAP3K7CL和CLCN3)。
总之,我们已经发现并验证了一组生物标志物,其能够预测处于早产风险中的患者的分娩时间。此外,我们的早产模型表明,早产的生理学与正常孕育不同,这为早产风险的首次筛查或诊断测试奠定了基础。
11.7实施例7-满足75%真实阳性率和低于5%假阳性率的标准的基因组合
七种目标转录物RAB27B、PPBP、DAPP1、RGS18、MOB1B、MAP3K7CL、CLCN37可以被分组为35种独特的基因组合。我们使用75%的真实阳性率和小于5%的假阳性率的标准过滤了这些组合。这产生了表11中所示的13种组合。我们生成了ROC曲线,以确定哪些组合预测了早产风险。
表11
组合 基因1 基因2 基因3
1 RGS18 DAPP1 PPBP
2 RGS18 RAB27B PPBP
3 RGS18 MOB1B PPBP
4 RGS18 PPBP MAP3K7CL
5 RGS18 PPBP CLCN3
6 DAPP1 RAB27B PPBP
7 DAPP1 MOB1B PPBP
8 DAPP1 PPBP CLCN3
9 RAB27B MOB1B PPBP
10 RAB27B PPBP MAP3K7CL
11 RAB27B PPBP CLCN3
12 MOB1B PPBP MAP3K7CL
13 MOB1B PPBP CLCN3
3种基因的这13种组合中的每一种都可用作评估早产风险的组套。因此,在一些实施方案中,包括一种或多种以下基因组合的组套用于确定以下组套。因此,在一些方法中,包括一种或多种以下基因组合的组套用于评估足月或早产的可能性:(1)RGS18;DAPP1;PPBP;(2)RGS18;RAB27B;PPBP;(3)RGS18;MOB1B;PPBP;(4)RGS18;PPBP;MAP3K7CL;(5)RGS18;PPBP;CLCN3;(6)DAPP1;RAB27B;PPBP;(7)DAPP1;MOB1B;PPBP;(8)DAPP1;PPBP;CLCN3;(9)RAB27B;MOB1B;PPBP;(10)RAB27B;PPBP;MAP3K7CL;(11)RAB27B;PPBP;CLCN3;(12)MOB1B;PPBP;MAP3K7CL;以及(13)MOB1B;PPBP;CLCN3。
11.8实施例8-体重指数(BMI)不影响无细胞RNA(cfRNA)的水平
我们使用估算的每毫升血浆GAPDH的转录物计数测试了BMI对循环cfRNA水平的影响,以及发现使用Wilcoxon秩和检验进行Bonferroni校正前后体重过轻(BMI<18.5)、正常体重(18.5≤BMI<25)、超重(25≤BMI<30)和肥胖(BMI≥30)个体之间没有显著不同。
在Bonferroni校正前后,分别对GAPDH水平进行不同测试的P值如下:(1)体重过轻对比正常体重(P=0.58,1),体重过轻对比超重(P=0.12,0.80),体重不足对比肥胖(P=0.26,1),正常体重对比超重(P=0.06,0.35),正常体重对比肥胖(P=0.16,0.95),以及超重对比肥胖(P=0.72,1)。对于胎盘特异性cfRNA,例如CAPN6、CGA和CGB,获得了相似的结果。
所有比较均在队列中进行,以使队列之间的BMI分布差异不会混淆。
12.选定的参考文件
Altman,D.G.,&Chitty,L.S.(1997).New charts for ultrasound dating ofpregnancy.Ultrasound in Obstetrics&Gynecology,10(3),174–191.doi:10.1046/j.1469-0705.1997.10030174.x
Barr,W.B.,&Pecci,C.C.(2004).Last menstrual period versus ultrasoundfor pregnancy dating.International Journal of Gynaecology and Obstetrics,87(1),38–39.doi:10.1016/j.ijgo.2004.06.008
Bennett,K.A.,Crane,J.M.G.,O’shea,P.,Lacelle,J.,Hutchens,D.,&Copel,J.A.(2004).First trimester ultrasound screening is effective in reducingpostterm labor induction rates:a randomized controlled trial.American Journalof Obstetrics and Gynecology,190(4),1077–1081.doi:10.1016/j.ajog.2003.09.065
Blencowe,H.,Cousens,S.,Chou,D.,Oestergaard,M.,Say,L.,Moller,A.-B.,…Born Too Soon Preterm Birth Action Group.(2013).Born too soon:the globalepidemiology of 15 million preterm births.Reproductive Health,10 Suppl 1,S2.doi:10.1186/1742-4755-10-S1-S2
Cocquebert,M.,Berndt,S.,Segond,N.,Guibourdenche,J.,Murthi,P.,Aldaz-Carroll,L.,…Fournier,T.(2012).Comparative expression of hCGβ-genes in humantrophoblast from early and late first-trimester placentas.American Journal ofPhysiology.Endocrinology and Metabolism,303(8),E950–8.doi:10.1152/ajpendo.00087.2012
Conde-Agudelo,A.,&Romero,R.(2016).Vaginal progesterone to preventpreterm birth in pregnant women with a sonographic short cervix:clinical andpublic health implications.American Journal of Obstetrics and Gynecology,214(2),235–242.doi:10.1016/j.ajog.2015.09.102
Dugoff,L.,Hobbins,J.C.,Malone,F.D.,Vidaver,J.,Sullivan,L.,Canick,J.A.,…FASTER Trial Research Consortium.(2005).Quad screen as a predictor ofadverse pregnancy outcome.Obstetrics and Gynecology,106(2),260–267.doi:10.1097/01.AOG.0000172419.37410.eb
Hanson,A.E.(1987).The Eight Months’Child and the Etiquette of Birth:Obsit Omen!Bulletin of the History of Medicine.
Hanson,A.E.(1995).Paidopoiia:Metaphors for conception,abortion,andgestation in the Hippocratic Corpus.Clio Medica(Amsterdam,Netherlands).
Institute of Medicine(US)Committee on Understanding Premature Birthand Assuring Healthy Outcomes.(2007).Preterm Birth:Causes,Consequences,andPrevention.(R.E.Behrman&A.S.Butler,Eds.).Washington(DC):National AcademiesPress(US).
Jaffe,R.B.,Lee,P.A.,&Midgley,A.R.(1969).Serum gonadotropins before,atthe inception of,and following human pregnancy.The Journal of ClinicalEndocrinology and Metabolism,29(9),1281–1283.doi:10.1210/jcem-29-9-1281
Koh,W.,Pan,W.,Gawad,C.,Fan,H.C.,Kerchner,G.A.,Wyss-Coray,T.,…Quake,S.R.(2014).Noninvasive in vivo monitoring of tissue-specific global geneexpression in humans.Proceedings of the National Academy of Sciences of theUnited States of America,111(20),
7361–7366.doi:10.1073/pnas.1405528111
Liu,L.,Johnson,H.L.,Cousens,S.,Perin,J.,Scott,S.,Lawn,J.E.,…ChildHealth Epidemiology Reference Group of WHO and UNICEF.(2012).Global,regional,and national causes of child mortality:an updated systematic analysis for2010 with time trends since 2000.The Lancet,379(9832),2151–2161.doi:10.1016/S0140-6736(12)60560-1
Lund,S.P.,Nettleton,D.,McCarthy,D.J.,&Smyth,G.K.(2012).Detectingdifferential expression in RNA-sequence data using quasi-likelihood withshrunken dispersion estimates.Statistical Applications in Genetics andMolecular Biology,11(5).doi:10.1515/1544-6115.1826
McCarthy,D.J.,Chen,Y.,&Smyth,G.K.(2012).Differential expressionanalysis of multifactor RNA-Seq experiments with respect to biologicalvariation.Nucleic Acids Research,40(10),4288–4297.doi:10.1093/nar/gks042
Muglia,L.J.,&Katz,M.(2010).The enigma of spontaneous pretermbirth.The New England Journal of Medicine,362(6),529–535.doi:10.1056/NEJMra0904308
Murray,C.J.L.,Vos,T.,Lozano,R.,Naghavi,M.,Flaxman,A.D.,Michaud,C.,…等人.(2012).Disability-adjusted life years(DALYs)for291diseases and injuriesin 21regions,1990-2010:a systematic analysis for the Global Burden of DiseaseStudy 2010.The Lancet,380(9859),2197–2223.doi:10.1016/S0140-6736(12)61689-4
Papageorghiou,A.T.,Kemp,B.,Stones,W.,Ohuma,E.O.,Kennedy,S.H.,Purwar,M.,…International Fetal and Newborn Growth Consortium for the 21st Century(INTERGROWTH-21st).(2016).Ultrasound-based gestational-age estimation in latepregnancy.Ultrasound in Obstetrics&Gynecology,48(6),719–726.doi:10.1002/uog.15894
Parker,H.(1999).Greek Embryological Calendars and a Fragment from theLost Work of Damastes,on the Care of Pregnant Women and of Infants.TheClassical Quarterly.
Robinson,M.D.,McCarthy,D.J.,&Smyth,G.K.(2010).edgeR:a Bioconductorpackage for differential expression analysis of digital gene expressiondata.Bioinformatics,26(1),139–140.doi:10.1093/bioinformatics/btp616Robinson,M.D.,&Smyth,G.K.(2008).Small-sample estimation of negative binomialdispersion,with applications to SAGE data.Biostatistics,9(2),321–332.doi:10.1093/biostatistics/kxm030
Romero,R.,Dey,S.K.,&Fisher,S.J.(2014).Preterm labor:one syndrome,manycauses.Science,345(6198),760–765.doi:10.1126/science.1251816
Rose,N.C.,&Mennuti,M.T.(1993).Maternal serum screening for neuraltube defects and fetal chromosome abnormalities.The Western Journal ofMedicine,159(3),312–317.
Savitz,D.A.,Terry,J.W.,Dole,N.,Thorp,J.M.,Siega-Riz,A.M.,&Herring,A.H.(2002).Comparison of pregnancy dating by last menstrual period,ultrasoundscanning,and their combination.American Journal of Obstetrics and Gynecology,187(6),1660–1666.doi:10.1067/mob.2002.127601
Sweeney,T.E.,Haynes,W.A.,Vallania,F.,Ioannidis,J.P.,&Khatri,P.(2017).Methods to increase reproducibility in differential gene expression viameta-analysis.Nucleic Acids Research,45(1),e1.doi:10.1093/nar/gkw797
Wald,N.J.,&Hackshaw,A.K.(1997).Combining ultrasound and biochemistryin first-trimester screening for Down’s syndrome.Prenatal Diagnosis,17(9),821–829.doi:10.1002/(SICI)1097-0223(199709)17:9<821::AID-PD154>3.0.CO;2-5
Ward,K.,Argyle,V.,Meade,M.,&Nelson,L.(2005).The heritability ofpreterm delivery.Obstetrics and Gynecology,106(6),1235–1239.doi:10.1097/01.AOG.0000189091.35982.85
Whitworth,M.,Bricker,L.,&Mullan,C.(2015).Ultrasound for fetalassessment in early pregnancy.Cochrane Database of Systematic Reviews,(7),CD007058.doi:10.1002/14651858.CD007058.pub3
Yefet,E.,Kuzmin,O.,Schwartz,N.,Basson,F.,&Nachum,Z.(2017).PredictiveValue of Second-Trimester Biomarkers and Maternal Features for AdversePregnancy Outcomes.Fetal Diagnosis and Therapy.doi:10.1159/000458409
York,T.P.,Strauss,J.F.,Neale,M.C.,&Eaves,L.J.(2009).Estimating fetaland maternal genetic contributions to premature birth from multiparouspregnancy histories of twins using MCMC and maximum-likelihoodapproaches.Twin Research and Human Genetics,12(4),333–342.doi:10.1375/twin.12.4.333
Zhang,G.,等人.(2017).Genetic Associations with Gestational Durationand Spontaneous Preterm Birth.The New England Journal of Medicine,377(12),1156–1167.doi:10.1056/NEJMoa1612665
Rose和Mennuti(Fetal Medicine,West J Med.,1993;159:312-317)
Sweeney等人.(J.Pediatric Infect.Dis.Soc.,2017,doi:10.1093/jpids/pix021.)
13.表1至5
表1:预测分娩时间
Figure BDA0002506829930000581
Figure BDA0002506829930000591
Figure BDA0002506829930000601
表2:预测早产
Figure BDA0002506829930000602
Figure BDA0002506829930000611
Figure BDA0002506829930000621
表3:示例性引物对
Figure BDA0002506829930000622
Figure BDA0002506829930000631
Figure BDA0002506829930000641
Figure BDA0002506829930000651
表4
关键字:“正向”正向引物包括与SEQ ID NO:X的碱基a-b相对应的序列。例如,正向引物包括SEQ ID NO:1的碱基30-45。“反向”反向引物包括与SEQ ID NO:X的碱基c-d相对应的序列的反向互补物。例如,反向引物包括SEQ ID NO:1的碱基500-520的反向互补物。
Figure BDA0002506829930000652
Figure BDA0002506829930000661
表5
关键字:探针包括与SEQ ID NO:X的碱基a-b相对应的序列,或其互补物。
Figure BDA0002506829930000662
Figure BDA0002506829930000671
表6:示例性mRNA转录物的列表:
Figure BDA0002506829930000672
表7:示例性mRNA转录物的序列:
SEQ ID NO:1CGA mRNA转录物861bp
Figure BDA0002506829930000673
Figure BDA0002506829930000681
SEQ ID NO:2CAPN6mRNA转录物3604bp
Figure BDA0002506829930000682
Figure BDA0002506829930000691
SEQ ID NO:3CGB mRNA转录物933bp
Figure BDA0002506829930000692
SEQ ID NO:4ALPP mRNA转录物2883bp
Figure BDA0002506829930000693
Figure BDA0002506829930000701
SEQ ID NO:5CSHL1mRNA转录物661bp
Figure BDA0002506829930000702
SEQ ID NO:6PLAC4mRNA转录物10009bp
Figure BDA0002506829930000703
Figure BDA0002506829930000711
Figure BDA0002506829930000721
Figure BDA0002506829930000731
SEQ ID NO:7PSG7mRNA转录物2046bp
Figure BDA0002506829930000732
SEQ ID NO:8PAPPA mRNA转录物11025bp
Figure BDA0002506829930000741
Figure BDA0002506829930000751
Figure BDA0002506829930000761
SEQ ID NO:9LGALS14mRNA转录物794bp
Figure BDA0002506829930000771
SEQ ID NO:10CLCN3mRNA转录物6299bp
Figure BDA0002506829930000772
Figure BDA0002506829930000781
Figure BDA0002506829930000791
SEQ ID NO:11DAPP1mRNA转录物3006bp
Figure BDA0002506829930000792
SEQ ID NO:12POLE2mRNA转录物1861bp
Figure BDA0002506829930000793
Figure BDA0002506829930000801
SEQ ID NO:13PPBP mRNA转录物1307bp
Figure BDA0002506829930000802
SEQ ID NO:14LYPLAL1mRNA转录物1922bp
Figure BDA0002506829930000803
Figure BDA0002506829930000811
SEQ ID NO:15MAP3K7CL mRNA转录物2269bp
Figure BDA0002506829930000812
Figure BDA0002506829930000821
SEQ ID NO:16MOB1B mRNA转录物7091bp
Figure BDA0002506829930000822
Figure BDA0002506829930000831
Figure BDA0002506829930000841
SEQ ID NO:17RAB27B mRNA转录物7003bp
Figure BDA0002506829930000842
Figure BDA0002506829930000851
Figure BDA0002506829930000861
SEQ ID NO:18RGS18mRNA转录物2158bp
Figure BDA0002506829930000862
SEQ ID NO:19TBC1D15mRNA转录物5852bp
Figure BDA0002506829930000863
Figure BDA0002506829930000871
Figure BDA0002506829930000881
Ngo等人,Science 360,1133–1136(2018)通过引用并入本文。
尽管出于清楚和理解的目的已经详细描述了前述发明,但是相关领域的技术人员将理解,一旦他们熟悉本公开,则可以在不背离所附权利要求书中本发明的真实范围的情况下对形式和细节进行各种改变。因此,本发明不限于以上阐述的方法或构造的确切组件或细节。除了在过程本身中必要或固有的程度之外,没有意图或隐含包括附图在内的本公开中所描述的方法或过程的步骤或阶段的特定顺序。在许多情况下,可以更改处理步骤的顺序,而不会改变所描述的方法的目的、效果或重要性。
本文引用的所有出版物和专利文件都通过引用并入本文,就好像每个这样的出版物或文件都被具体地和单独地指示为通过引用并入本文。引用出版物和专利文件(专利、已公开的专利申请和未公开的专利申请)并不意味着承认任何此类文件都是相关的现有技术,也不构成对其内容或日期的承认。
序列表
<110> 陈扎克伯格生物中心公司
斯坦福大学托管董事会
<120> 用于在胎儿孕育中预测胎龄和早产的无创分子钟-II
<130> 103182-1107145 (000300PC)
<140>
<141>
<150> 62/578,360
<151> 2017-10-27
<150> 62/576,033
<151> 2017-10-23
<160> 299
<170> PatentIn版本3.5
<210> 1
<211> 861
<212> DNA
<213> 智人
<400> 1
acactctgct ggtataaaag caggtgagga cttcattaac tgcagttact gagaactcat 60
aagacgaagc taaaatccct cttcggatcc acagtcaacc gccctgaaca catcctgcaa 120
aaagcccaga gaaaggagcg ccatggatta ctacagaaaa tatgcagcta tctttctggt 180
cacattgtcg gtgtttctgc atgttctcca ttccgctcct gatgtgcagg agacagggtt 240
tcaccatgtt gcccaggctg ctctcaaact cctgagctca agcaatccac ccactaaggc 300
ctcccaaagt gctaggatta cagattgccc agaatgcacg ctacaggaaa acccattctt 360
ctcccagccg ggtgccccaa tacttcagtg catgggctgc tgcttctcta gagcatatcc 420
cactccacta aggtccaaga agacgatgtt ggtccaaaag aacgtcacct cagagtccac 480
ttgctgtgta gctaaatcat ataacagggt cacagtaatg gggggtttca aagtggagaa 540
ccacacggcg tgccactgca gtacttgtta ttatcacaaa tcttaaatgt tttaccaagt 600
gctgtcttga tgactgctga ttttctggaa tggaaaatta agttgtttag tgtttatggc 660
tttgtgagat aaaactctcc ttttccttac cataccactt tgacacgctt caaggatata 720
ctgcagcttt actgccttcc tccttatcct acagtacaat cagcagtcta gttcttttca 780
tttggaatga atacagcatt tagcttgttc cactgcaaat aaagcctttt aaatcatcat 840
tcaaaaaaaa aaaaaaaaaa a 861
<210> 2
<211> 3604
<212> DNA
<213> 智人
<400> 2
gagcagagct tggtacagcc caaatagttt tcaggttaag aaagccagaa tctttgttca 60
gccacactga ctgaacagac ttttagtggg gttacctggc taacagcagc agcggcaacg 120
gcagcagcag cagcagcagc agcagcagca gcagcagggc tcctgggata actcaggcat 180
agttcaacac tatgggtcct cctctgaagc tcttcaaaaa ccagaaatac caggaactga 240
agcaggaatg catcaaagac agcagacttt tctgtgatcc aacatttctg cctgagaatg 300
attctctttt ctacaaccga ctgcttcctg gaaaggtggt gtggaaacgt ccccaggaca 360
tctgtgatga cccccatctg attgtgggca acattagcaa ccaccagctg acccaaggga 420
gactggggca caagccaatg gtttctgcat tttcctgttt ggctgttcag gagtctcatt 480
ggacaaagac aattcccaac cataaggaac aggaatggga ccctcaaaaa acagaaaaat 540
acgctgggat atttcacttt cgtttctggc attttggaga atggactgaa gtggtgattg 600
atgacttgtt gcccaccatt aacggagatc tggtcttctc tttctccact tccatgaatg 660
agttttggaa tgctctgctg gaaaaagctt atgcaaagct gctaggctgt tatgaggccc 720
tggatggttt gaccatcact gatattattg tggacttcac gggcacattg gctgaaactg 780
ttgacatgca gaaaggaaga tacactgagc ttgttgagga gaagtacaag ctattcggag 840
aactgtacaa aacatttacc aaaggtggtc tgatctgctg ttccattgag tctcccaatc 900
aggaggagca agaagttgaa actgattggg gtctgctgaa gggccatacc tataccatga 960
ctgatattcg caaaattcgt cttggagaga gacttgtgga agtcttcagt gctgagaagg 1020
tgtatatggt tcgcctgaga aaccccttgg gaagacagga atggagtggc ccctggagtg 1080
aaatttctga agagtggcag caactgactg catcagatcg caagaacctg gggcttgtta 1140
tgtctgatga tggagagttt tggatgagct tggaggactt ttgccgcaac tttcacaaac 1200
tgaatgtctg ccgcaatgtg aacaacccta tttttggccg aaaggagctg gaatcggtgt 1260
tgggatgctg gactgtggat gatgatcccc tgatgaaccg ctcaggaggc tgctataaca 1320
accgtgatac cttcctgcag aatccccagt acatcttcac tgtgcctgag gatgggcaca 1380
aggtcattat gtcactgcag cagaaggacc tgcgcactta ccgccgaatg ggaagacctg 1440
acaattacat cattggcttt gagctcttca aggtggagat gaaccgcaaa ttccgcctcc 1500
accacctcta catccaggag cgtgctggga cttccaccta tattgacacc cgcacagtgt 1560
ttctgagcaa gtacctgaag aagggcaact atgtgcttgt cccaaccatg ttccagcatg 1620
gtcgcaccag cgagtttctc ctgagaatct tctctgaagt gcctgtccag ctcagggaac 1680
tgactctgga catgcccaaa atgtcctgct ggaacctggc tcgtggctac ccgaaagtag 1740
ttactcagat cactgttcac agtgctgagg acctggagaa gaagtatgcc aatgaaactg 1800
taaacccata tttggtcatc aaatgtggaa aggaggaagt ccgttctcct gtccagaaga 1860
atacagttca tgccattttt gacacccagg ccattttcta cagaaggacc actgacattc 1920
ctattatagt acaggtctgg aacagccgaa aattctgtga tcagttcttg gggcaggtta 1980
ctctggatgc tgaccccagc gactgccgtg atctgaagtc tctgtacctg cgtaagaagg 2040
gtggtccaac tgccaaagtc aagcaaggcc acatcagctt caaggttatt tccagcgatg 2100
atctcactga gctctaaatc tgcaatccca gagaatcctg acaaagcgtg ccaccctttt 2160
attttccgtc aggtgccagg tcttagttaa gattcacaat ctttagaaag aatgagattc 2220
acaataatta actcttcctc tcttctgata aattccccat acctcccaat ccaagtagca 2280
tctgtagcta cataacctat atacctccag cagctggaca tggggaggcg acagtcctat 2340
ctagacatca tacacatttg ccaagaaagg atctctgggg cttccggggg tgagattcaa 2400
gcaggacaat aacaagaggc tggacaccct acagatgtct ttgatgtttt cagttgtttg 2460
atatatctcc cctgtagggc atgttgagga aggaggaggg ctgatcaagg ccaagctggt 2520
ctagcctgac atcctagctc ctgactgaac actatagact tcccagcagc atttcaccca 2580
gcagccagag ccggctttaa gtccccaacc cttacagaca ccactgccac caccaccaac 2640
cacgaccacc accaccacca ccactcacca ccatcatcac ctccggaaag tgtagtcctg 2700
ccctaaccca agtcaccccc gacagtaaat tttaccttca tgttgagaaa gcttcctggt 2760
gcttaatcaa gagctggagt tcaatgagtc ctagacagtg agaggggcct gagcttcagc 2820
tcaatggaag cctgctgtgt gccacaagac ggaaaagtgg aagaagctgc agtgggagac 2880
aaagcctcgg tcccccaccc atccacacac acctacactc acacacgcgc acatgggcgc 2940
gcacgaacta ccattcaggc agtcagtggg caagaggaaa gataagtaag taccatacac 3000
acctaaaaga tgagagaatt catccagaca tattacagcc agtttggggc ccctgactgc 3060
aatgtgaaac ctctcgctgc tgctaggttt acaaacaagc ccattgtcct gtgcctccta 3120
atatcatttg tactgaagac cccatctggg gacttgagac tttggtccca gcccagactc 3180
ctcagacttt tctctcagtt gggatgcttc actcgctggg ggtgtttgtt tgccctctca 3240
tttttcagta cttctacaga attttctcta gagtcagtca ttatgaaatg tacttccctc 3300
catcttaacc tatcaacttt ctgcccctcc ttcaaggccc agtataaatg ccacctcctc 3360
catgaagcct tccctaattc caccccaaac ccccaccttc aacaatattt caacgcttct 3420
gcaatgatga aaaagaaaca tagttgtagt acttagccta cctagaccag caagcattca 3480
tttttagctc gctcattttt taccatgttt tccagtctgt ttaacttctg cagtgccttc 3540
actacactgc cttacataaa ccaaatcaca ataaagttca tattcagtac attgaaaaaa 3600
aaaa 3604
<210> 3
<211> 933
<212> DNA
<213> 智人
<400> 3
tgcaggaaag cctcaagtag aggagggttg aggcttcagt ccagcacctt tctcgggtca 60
cggcctcctc ctggctccca ggaccccacc ataggcagag gcaggccttc ctacacccta 120
ctccctgtgc ctccagcctc gactagtccc tagcactcga cgactgagtc tctgaggtca 180
cttcaccgtg gtctccgcct cacccttggc gctggaccag tgagaggaga gggctggggc 240
gctccgctga gccactcctg cgcccccctg gccttgtcta cctcttgccc cccgaggggt 300
tagtgtcgag ctcaccccag catcctatca cctcctggtg gccttgccgc ccccacaacc 360
ccgaggtata aagccaggta cacgaggcag gggacgcacc aaggatggag atgttccagg 420
ggctgctgct gttgctgctg ctgagcatgg gcgggacatg ggcatccaag gagccgcttc 480
ggccacggtg ccgccccatc aatgccaccc tggctgtgga gaaggagggc tgccccgtgt 540
gcatcaccgt caacaccacc atctgtgccg gctactgccc caccatgacc cgcgtgctgc 600
agggggtcct gccggccctg cctcaggtgg tgtgcaacta ccgcgatgtg cgcttcgagt 660
ccatccggct ccctggctgc ccgcgcggcg tgaaccccgt ggtctcctac gccgtggctc 720
tcagctgtca atgtgcactc tgccgccgca gcaccactga ctgcgggggt cccaaggacc 780
accccttgac ctgtgatgac ccccgcttcc aggactcctc ttcctcaaag gcccctcccc 840
ccagccttcc aagcccatcc cgactcccgg ggccctcgga caccccgatc ctcccacaat 900
aaaggcttct caatccgcaa aaaaaaaaaa aaa 933
<210> 4
<211> 2883
<212> DNA
<213> 智人
<400> 4
tcagccagtg tggcttcagg tcaagaggct gggcagggtc aaggtggcaa cgaggggaga 60
agccgggaca cagttctccc tgatttaaac ccgggcagcc tggagtgcag ctcatactcc 120
atgcccagaa ttcctgcctc gccactgtcc tgctgccctc cagacatgct ggggccctgc 180
atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 240
gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 300
aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 360
atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 420
gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 480
aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 540
aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 600
acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 660
ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 720
gtgaaccgca actggtactc ggacgccgac gtgcctgcct ccgcccgcca ggaggggtgc 780
caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 840
cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 900
ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 960
gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 1020
catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 1080
ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 1140
cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1200
gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1260
ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1320
ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1380
gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1440
ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1500
gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1560
ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1620
ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1680
gacgccgcgc acccggggcg gtccgtggtc cccgcgttgc ttcctctgct ggccgggacc 1740
ctgctgctgc tggagacggc cactgctccc tgagtgtccc gtccctgggg ctcctgcttc 1800
cccatcccgg agttctcctg ctccccacct cctgtcgtcc tgcctggcct ccagcccgag 1860
tcgtcatccc cggagtccct atacagaggt cctgccatgg aaccttcccc tccccgtgcg 1920
ctctggggac tgagcccatg acaccaaacc tgccccttgg ctgctctcgg actccctacc 1980
ccaaccccag ggactgcagg ttgtgccctg tggctgcctg caccccagga aaggaggggg 2040
ctcaggccat ccagccacca cctacagccc agtgggtacc aggcaggctc ccttcctggg 2100
gaaaagaagc acccagaccc cgcgccccgc tgatctttgc ttcagtcctt gaatcacctg 2160
tgggacttga ggactcggga tcttcaggac gcctggagaa gggtggtttc ctgccaccct 2220
gctggccaag gaggctcctg gggtggggat caccaggggg attttgacac agccttcggc 2280
tgccccccac taagctaatt ccacacccct gtaccccccc agggggccct ctgcctcatg 2340
gcaaaggctt gccccaaatc tcaacttctc agacgttcca tacccccaca tgccaatttc 2400
agcacccaac tgagatccga ggagctcctg ggaagccctg ggtgcaggac actggtcgag 2460
agccaaaggt ccctccccag acatctggac actgggcata gatttctcaa gaaggaagac 2520
tcccctgcct ccccagggcc tctgctctcc tgggagacaa agcaataata aaaggaagtg 2580
tttgtaatcc cagcactttg ggaggccgag gtgggcggat cacgaggtca ggagatggag 2640
accatcctgg ctaacacggt gaaacccctt atctatgcgc ctgtagtccc agctacccag 2700
gaggctgaag caggataatc gcttgaaccc gggcggcgga gattgcagtg agccgaggtc 2760
atgccactgc actgcagcct gggcgacaga gcgagattct gcctcaaaaa taaacaaata 2820
aattttaaaa ataaataaat aataaaagga agtgttagac aatgtaaaaa aaaaaaaaaa 2880
aaa 2883
<210> 5
<211> 661
<212> DNA
<213> 智人
<400> 5
agcatcccaa ggcccgactc cccgcaccac tcagggtcct gtggacagct cacctagcgg 60
caatggctgc aggaagaagc ctatatcaca aaggaacaga agtattcatt cctgcatgac 120
tcccagacct ccttctgctt ctcagactct attccgacat cctccaacat ggaggaaacg 180
cagcagaaat ccaacttaga gctgctccac atctccctgc tgctcatcga gtcgcggctg 240
gagcccgtgc ggttcctcag gagtaccttc accaacaacc tggtgtatga cacctcggac 300
agcgatgact atcacctcct aaaggaccta gaggaaggca tccaaatgct gatggggagg 360
ctggaagacg gcagccacct gactgggcag accctcaagc agacctacag caagtttgac 420
acaaactcgc acaaccatga cgcactgctc aagaactacg ggctgctcca ctgcttcagg 480
aaggacatgg acaaggtcga gacattcctg cgcatggtgc agtgccgctc tgtggagggc 540
agctgtggct tctaggggcc cgcgtggcat cctgtgaccc ctccccagtg cctctcctgg 600
ccctgaaggt gccactccag tgcccaccag ccttgtctta ataaaattaa gttgtattgt 660
t 661
<210> 6
<211> 10009
<212> DNA
<213> 智人
<400> 6
cgtagctcat aatccatttt tataacacct tgctatctat atttacacct ttaaagaaca 60
cgggaattta agagggaaga gtaactaggc ttttgctaaa cttgggctaa taaaaccctc 120
tgtagagaga tccttaatat aggcatgggg acaacaagga gtatcccaag ggactcgccg 180
ctagggtgtc ttttaagcta ttggagcaaa ttcaaatttg gcttaaagaa aaagaaactc 240
attttgtatt gcaacaccat ttgggttaaa tacaagttag atgacgaata tatctggcct 300
aaacatggtt ctatatacta tagtgatatt ttacgattag gcttattttg taaaagagaa 360
ggaaaatggg aagagatccc ttatgtacag gcttttatgg ctctatactg gatcacgtta 420
cttccaggca ttagaatgcc atgcataagg gatccccacc tagctgctcc ccatagaaag 480
ttcataagcc tccccagagt ctcttcagtc ccccagtcct gagtgggggt tctcgccaat 540
tccctaatga gattccaccc caatatcatc aggcaccttt cccccttatc caactagccc 600
tagcctatac cctctgctgc ccaagaaaat gagcccaacc agtacaccag gagtggggct 660
ccatatcagc ccctaaggtc aagcctgtgt ccactgtgga aagtagttga tggaaatgag 720
ggaacactca aagagtacat atgccacttt ccatgtctaa ttagacctta taaaaggaaa 780
gaattggcca gttttcagat aaaccagaaa agcttataca agagtttgtt acgttgacta 840
tgttcttcaa attgccacga tttacaaata ttgtcatccg cttgctgtgc tgtggggaaa 900
aaaaagtaga ggaaaaagtg tgtggttaag ccagtcaatt atgacaaggt taaagaagta 960
actcggggaa aagatgaaaa tcccgctctg tttcagggtc ttttagttga agcactcagg 1020
aaatatacta atgcaggccc agacacccca gaagggcaag ctctcctggg tatacatttt 1080
ctcattcaat cttctcctga cattaggagg aatctacaaa aagcagcaat gggaccttca 1140
agtcctatga aacgacgctt aaacatagcc tttaaagttt acaacaacag ggacagggca 1200
aaagagggga gtaaaaagaa atagccaaaa agtacaattg ttaacagtga ctttaagcct 1260
ccttgcccct caggattact catcttgaga aaatgttaca aaattagcat ctgggatgcc 1320
tagacaagac ttgatgcctg acttgctgac ccctgggcca gaatcactgc gcctactata 1380
cgcaaaaggg cccctggcaa tgcaaatgtc ctaactgctc tggtgagaga gaacaataac 1440
aacaaaaagc ttccatcaat actagagcta accttctcct actagcccca gtgagctgct 1500
tagctcaagt aagtttactg tcccagagga cagctttcca cagtggcaga taagcagccg 1560
cctgaacatt tttctttggt atttccacca ctgagtgtgc tctccagtgg cgtggggact 1620
ccagaatctc cttttgagca atgcagtttg cttcctcccc tttttagttg atgctatggg 1680
attccctgtc ctgccttttc ctgttttcca tacctatcgg ggcaaacaaa atttggccag 1740
gtagatgggt cccagttctg taaataactt gaatccagtt gtcttgtata ggtcatttta 1800
tttaatatgt ttttgggtat atgtacatgt attgtgatgt gtgttacatc tagcgtgctg 1860
tcaaactggc ttatagataa aagaacactc atacattcaa caaataagac tactgaaagc 1920
ttattagttt gaagagaatc ttgtatcttc taaaatttaa ctttaggatt tttacctagg 1980
taagtcactg atgttcatag gctttaaaat ggttaaaatg gctttaaatg gtgaccagct 2040
ttgcatggta ccttggttct cggtgatcta gataaagtta aaagtgaaat aattaaatac 2100
acgtaaatgg gatatgctta atgtgtggtt taaaatcata aaatggtaga atggttctca 2160
gttatagaat gacaatgtct agtgtgaagt tcatgacttc ttccttccta ggtttccata 2220
aaatgtgcta aagaaatgta ttctttattg agaaaaaatt ttttgtctaa tccggaagtt 2280
actaaatggg aggttcaaaa catgagtgaa ccagtgagta gaaaagagag atgtaaagaa 2340
tattatgaat agaaaatgta ttttttgttt gttttgcaag gaaggatata aagaaagagt 2400
aattttatat gtggaggaat cctgtatagt aaattcccta tcctagagta aaataacttt 2460
aagaaagagg tagtatagaa catgtcagga aattcagcta tgttgtagat ggtctgtgta 2520
agtcatctgc acagtgcatg agtgtggagg tgggcgggca ctcattggcc cttgaactcc 2580
ttttgagcag tatggaagcc aagaactaga agccaggaaa tggggttgta aaactgattt 2640
gtctatggat tttatgtgtt gagctgctgt ggtcttggct tgtagtaatt acctatatga 2700
accttccccc ctccccttta gaatttagga caggttcaaa aggccctcca atataaaaat 2760
aaaatactgt ccttccccac aaaggaaaaa atagctcccc ggttcaacca ggagacttag 2820
tcttgctaaa accttaaaga cagggtaaag acagggatac cccaagaatc aattacaatg 2880
aaatggaagg ggccttatca ggtattgtta agtaccccca ctgctgttaa acttcaggga 2940
acacctactt gggcacacag atccaggact aaacctgttt cttatgagtc acaggcacaa 3000
aggaagggca ctacaaccac aaccaatatc agtaaagctt tggaagacct ctgctaccta 3060
tttaaaataa tcaacactca gccagaagag gtaatgtaat gctgtagatg ggaataggag 3120
cattgatctt gctcttcttc ctgactgtag tacttccttt ctatggcttt aaccagccac 3180
ctcctcctgg gaaacatctc ctgtgggctt gttgggtata gaagctactc taagacccaa 3240
ccagatacca tgatgccact gttaattctg tttgctcttc taattaacct aagctagtgt 3300
gtatgtggac agggagggtg gacaaaattc tacagtaaat atttcaaaaa ttatagcatc 3360
atagaatcat ctttatggct gccagatttg tcatcaacac ccccaggata gacagtttca 3420
tcttccgacc tatctggaaa atctcaggac catgtcccca gacctcctaa ctaaccatag 3480
caccccaaaa tacccaaacc cctattgtga agtggaactc ttccccactt agtggatccc 3540
ccctggaccc tgctgtcccc ctgccctgac cactattatc ggaatctggg aagttgggca 3600
tctatatctc cagtgcactc ataactctaa catttgcatc cactcttgca ttaatgacac 3660
aaaagtggaa gcttccctgc gatgctctgg tccaactcta gttgccaagt ttccaagacc 3720
acggggaggt aaatgagatt ccatttgtga gtgaaaagac catatatggt accttctccc 3780
ggatgggaac atacaaagga aaaacaactg cctgatctgg gaaggtgaca gtactacctt 3840
cttctagaaa acaaagattg ttcaaccacc accatgagaa caggtggaaa atatctctat 3900
agacccaacc tggcaatgaa gtataaacat cgcaccccgc agggcttctc ttggtgccct 3960
agttgggttc atttttgttt gtgactatga atgggaagaa gtcacaccct gtaaccactc 4020
caactcccta aggagtcacc tcttctttaa ggaatagctt tcccttgtat ctaaaaaact 4080
tggaactgac atgaatgaac gttggccact cttacccctc caggggtcac aatctataac 4140
gcctaggacc caagaatatc agaaataagt aagcaataaa actaattctg gcaggaatca 4200
gggtggcaat aggactagca gcaccctggg gtggctttgc ctaccatgag ttaacgctaa 4260
agaacttggc tcaaatccta gaatccttag ccaccaacgg agatcaggca ttaaagagaa 4320
ttcaagagtt ccccagactc tggaaaatgt agttgttgat aacagactag cattggatta 4380
tttactagct gaacaaggtg gggtcttgtg cagttattaa taaaacctgc tgcacatata 4440
ttaactctgg acaggttgag gttaacattc aaaagatcta tgagcaagct acctagttac 4500
atagatataa ccagggcact gcccccaact atatctggtc aaccatcaaa agtgccttcc 4560
caagtctcac ctgtttttca cctcttctag gacctttgac aactgtcttg ttacaaatgt 4620
ttggtccttg cttctttaac ctcttagtaa agtttgtgta ttctagatta ccacagttcc 4680
agagacaatg ctggcacaag gcttccagcc catcctgtcc actgacacgg agaatgaaat 4740
cgtcctgcct ctgggctcct tagatcaggt atccagagat ttttactcct ccagtgccag 4800
gcagggccta cgtccataaa ctcagcagga agtagttacg gaaaacagat ctccgccctt 4860
ctgcagcccc cttaagatta aggaggagta tctaatctct gaagggggaa tgaggtagga 4920
ggtgggactc aactctggaa gtggggctca ggcactcaga ccaaactgag cactagctaa 4980
aataggtcca gggcagatgc tagtttccat aggacacacc gacctgtgtc aagtcagttc 5040
accatggctc tggcagcacc cagaagttac caccctcacc ctggaaatgt ctgcataaac 5100
tgccccttca tttgcatata attaaaagtg gatacaaata ccactgcaga actgcctctg 5160
agctgctact gtgggcgcac agcctgtagg gcagccctgc tttgcaagga gcagcgcctc 5220
tgctgctgct gtgcacagcc ggccgcttca ataaaagttg ctaacaccac tggcttgccc 5280
ttgagttcct tcctgggcaa agctaagaac cctcccgggc tatgcttcaa tcttagggct 5340
cgcctgtcct gcatcactgg gatcatctcc cagtaaacta gccacactta catccatgtg 5400
tcagggacat ttctggagaa agcagcccag gacactgttg aataaaacac acaatagtct 5460
ctgtggtctt ctccacccca ccccacacca ggcaccctca gcttgattct cctttttaat 5520
tgcctgtaag cagggaagca caatgttttc acattctttg taaggccttt gttctactaa 5580
aatctaacct cagagcacaa ttttaaacta gatgaaagag ttgctgcgcc tgaagcactg 5640
caaacacctc ctcaccacac atgtgcactc accctggaca ccctcactca ccctgacacc 5700
ctcactcctc accctggaca ccctcactca ccccagacac cgtcactcct caccctggac 5760
acctcactct gcaccctgga caccctcact caccctggac acgttcactc accctgacac 5820
cctcactcac cctggacacc ctcactcacc ctggataccc tcactcctca ccctggacac 5880
cctcactcac cctggatacc ctcactcctc accctggaca ctctcactca ccctgacacc 5940
ctcaatcctc accctggact ccctcactcc tcaccctgga ctccctcact cctcaccctg 6000
gacaccctca ctcctcatcc tggacaccct cactcaacct ggacaccctc actcctcacc 6060
ctgacaccct cactcctcac cctggacacc ctcactcctc accctgacac cctcactcct 6120
caccctggca ccctcagtca ccctgacacc ctcactcctc accctgacac cctcaagtct 6180
tcacctccct ggctgcagcc tgggacacgc tttccctaac ttctgaaggc tcagtcctcc 6240
tcaagccaat ctcatctcaa attgcacctc ctcagagagg tcttccataa ccgcccttat 6300
aaagcaggat tctttcacca ataccccttc ccacatggca ctgtctcaca gcactcctct 6360
aaaagtctgt ttacttcctt gacaatctgt cttccttata aggggaggtt ctgtaaaagc 6420
caagactctc tctgtctagt tgactgttgc ataccagggc ttagaccaag gccctgacat 6480
gcagtaggtg cttaatatgt tttgaggcaa ggtcttgctc tgttgcacat gctggagtgc 6540
agtggcacaa tcgtaattca ttgcagcctt gaactcctga gctcaagtga tcctcctgcc 6600
tcagcctcct gagtagctgg gactacaggc atgcaccacc aagcttggct aatttaaaaa 6660
aaaaattata tagataggga cttgctatgt tgcctaggct gatcttgaac tcctaacctc 6720
aagcaatcct cccacctcgg ccttccaaag tgctgggata ataggcatgg agccgccaca 6780
cccagccaat gtgccgaaga aagaaagaaa aacatgctca tcctttgagt caggttcaaa 6840
ttttttctcc tctttaaccc ccagtcactc cagttataag tgatttttaa ctcttctcac 6900
actttaatgc atctggcaag aagatccacg tggtgttagg aacaatacag gaccttaagg 6960
atgggggaat cagcaggtgt cagcgtgccc tgtatgctca gggcagctgt ttccactgga 7020
cattctccct ttgcctctct gggcagcaac tcctaggcca gccgacctgc tgtgtcgagt 7080
aaccaggatt tctcaatctt ggcatggttg ccattttgga ccagatcgtt ctttgttgtg 7140
ggggctgccc tgtacggcaa agaatgccga gcagcacttc cagtctccac ccacaggacg 7200
ccagtagcac cctctaagtt gtgagaactc aaaatgtccc cagaggatgc cagatgtccc 7260
ctggggtggg gacacaatca ccccaggttg agatccatgg agccaggtct gtttgccacc 7320
aaggggtaaa gctccattcc caccttagga gggctaggag gcagcatcgt ggggccacag 7380
aaggcctggg tttgcagtca gaggacagga tgcacattcc ttcaagatac agacccagat 7440
tgttgggcat ctagttcttg ggttttctgt tgttgctgtt ccgttttgtc tgtcttccct 7500
cctttgttta ctagcagcct ggaatttgcc actttttcta aacgaagatt tatggaacac 7560
ttaccacacg gctgacgctg cgcgaggcta aggttctaat acaccgcagc tcacttaact 7620
ctcgcaatac cataaacgca cactgtttca tcttgaccct ttcttgggaa ggtgacagag 7680
aggtaggagg gcaaacatct tgtgtgcccc gtcccaaggg tattactggt ggaataatat 7740
ccgcccccca ccccagtttc taatttgctg taggctgtga cgctgtgggg caagactagg 7800
agtcctgttg aaattaggaa taagtgtgct gtgagggaag ggctgcctta ttttagagca 7860
cagattttct gaatatctat tttgacaggt tcgatcctct ccccttcctg ccttccttct 7920
gtcgattttc aatgtcttga tggtgtccca cctgagtggc ctttagagat gtgagttgtg 7980
aggcactggg gaggcaggca cacgtcctcc agcccaagac tgcctaattt aacagggatt 8040
tctgcattct ggaacaagcc tccattttcc ccaagcagga ttactccaga gggcaaaaca 8100
cagcccaata gtatcacatt tcctttctgc tttagcaaaa ataaccactg tctcattcat 8160
gggaaaaggc cgccaaacaa atttgttact ggaaccattt gtaacaactt ctagtttgca 8220
ctgccttgga gcaagcacac tttgtagagg agggatttgc agttacttgg gcaacaaggt 8280
aaccactgat cattacagga agcttcagaa accgtgggac cagtgtagaa gaatggacta 8340
tctgtccaaa ctaagaataa aaagaatgac acttgtattt tgtatgtctt tttcactttg 8400
cctttctagt aattcatttt tcttgatatt tacaccttgt ggccctgtga tagactggaa 8460
atctcaaaaa cacacgttca gcaccaagat tttcagcagc accgcctcag aatgagaccc 8520
ctagaaaaaa ctgcgtgttt tccacttgcc caacacgagg agtttttgga acacgacctg 8580
cttgaggtgg agattttcta gatgggcaaa gagaaggaaa cacttaacct aggaagagta 8640
tttaggaaga agaaagaaca cagcctttct gcacaggaaa ccgccgagca gaggggcatc 8700
tggcctctgc agtggcctcc aaatagagtc caatggctgg ggccagcgtg gctgcttaaa 8760
ggggactcaa gggatataat aaaatgcaga ttctcaggtc ctagtgcaga caggctcacc 8820
caataagtct ggactgcata tgggaatctc tatttctagg cccttctgca aggtattcct 8880
gctctttcca ggaaccatcg gcagctggtt tggggaaaga agcaacgact ccaagtgtga 8940
cctgtgagct ggcagcagcc accctcagct ctgctctcgg tcactgaatc cgattctgca 9000
ttttaacagg accccaggtg ttgcacccac acaaagctga agcagattgg tctgggggca 9060
aaaaattaga gctatggaga ttctctcaaa tgaaatagat gatatcattg actgttagag 9120
cttctagaag gaatctgagg tcacttgttc aaattccctg atttacagat gaggaaacag 9180
aggctcagac agctcaaatg acttctctcc aatacccaac attcgacaag tagcagctct 9240
gggactagta cccaaagcac ctagctctcc aatcactgcg caagccacac aattctgtct 9300
gcttgtcagt ggcttttctg attcaaaaaa agcttaggaa tttccccagg aggcagcacg 9360
atgtagtggg aagggctctg gatgtctctc caaggcttct ggaattcatg cccacctcca 9420
ccaagaagcc actttcctgc cagctacagg tgctcacctg aaaagcaagc cagaccatat 9480
taaccctggc attgctggta cctggaagac tttctgattc aatgctttcc acctcctcct 9540
acccctcacc acccccgtgg catgaaatcc tgggggctgc tttagaaatt gttttctttg 9600
gctgctggtg ggggtgctgc tggtgggggt ttgcacagct ggcacactgc accagtctgg 9660
tgggggtttg cacagctggc acactgcacc agtctcctgc ctgctgccaa caaggccatt 9720
tcccaagcac tggctttgga gaagttgggg ctctgaagtg ggaacacaag gctgcctttt 9780
gcaggccagg tgtaaattct ccccctgcca ctttcagcct agcgtgaaac agatggagtg 9840
tgcattccca cttcccttta tggtaccctg gaatgatgga gctgcccagg gcatcgccac 9900
gttactctct agacagtctc tttgtcttcc tgcaatggca gcgccgaggt tgtatatttc 9960
taggtgcagg tatatgattg ccatataata aaaatctgaa aacatccca 10009
<210> 7
<211> 2046
<212> DNA
<213> 智人
<400> 7
agtgcagaag gaggaaggac agcacagctg acagccgtgc tcaggaagat tctggatcct 60
aggctcatct ccacagagga gaacacgcag ggagcagaga ccatggggcc cctctcagcc 120
cctccctgca cacagcatat aacctggaaa gggctcctgc tcacagcatc acttttaaac 180
ttctggaacc cgcccaccac agcccaagtc acgattgaag cccagccacc aaaagtttcc 240
gaggggaagg atgttcttct acttgtccac aatttgcccc agaatcttac tggctacatc 300
tggtacaaag gacaaatcag ggacctctac cattatgtta catcatatat agtagacggt 360
caaataatta aatatgggcc tgcatacagt ggacgagaaa cagtatattc caatgcatcc 420
ctgctgatcc agaatgtcac ccaggaagac acaggatcct acactttaca catcataaag 480
cgaggtgatg ggactggagg agtaactgga cgtttcacct tcaccttata cctggagact 540
cccaaaccct ccatctccag cagcaatttc aaccccaggg aggccacgga ggctgtgatt 600
ttaacctgtg atcctgagac tccagatgca agctacctgt ggtggatgaa tggtcagagc 660
ctccctatga ctcacagctt gcagctgtct gaaaccaaca ggaccctcta cctatttggt 720
gtcacaaact atactgcagg accctatgaa tgtgaaatac ggaacccagt gagtgccagc 780
cgcagtgacc cagtcaccct gaatctcctc ccgaagctgc ccaagcccta catcaccatc 840
aataacttaa accccaggga gaataaggat gtctcaacct tcacctgtga acctaagagt 900
gagaactaca cctacatttg gtggctaaat ggtcagagcc tcccggtcag tcccagggta 960
aagcgacgca ttgaaaacag gatcctcatt ctacccagtg tcacgagaaa tgaaacagga 1020
ccctatcaat gtgaaatacg ggaccgatat ggtggcatcc gcagtgaccc agtcaccctg 1080
aatgtcctct atggtccaga cctccccaga atttaccctt cattcaccta ttaccattca 1140
ggacaaaacc tctacttgtc ctgctttgcg gactctaacc caccggcaca gtattcttgg 1200
acaattaatg ggaagtttca gctatcagga caaaagcttt ctatccccca gattactaca 1260
aagcatagcg ggctctatgc ttgctctgtt cgtaactcag ccactggcaa ggaaagctcc 1320
aaatccgtga cagtcagagt ctctgactgg acattaccct gaattctact agttcctcca 1380
attccatctt ctcccatgga acctcaaaga gcaagaccca ctctgttcca gaagccctat 1440
aagtcagagt tggacaactc aatgtaaatt tcatgggaaa atccttgtac ctgatgtctg 1500
agccactcag aactcaccaa aatgttcaac accataacaa cagctgctca aactgtaaac 1560
aaggaaaaca agttgatgac ttcacactgt ggacagcttt tcccaagatg tcagaataag 1620
actccccatc atgatgaggc tctcacccct cttagctgtc cttgcttgtg cctgcctctt 1680
tcacttggca ggataatgca gtcattagaa tttcacatgt agtataggag cttctgaggg 1740
taacaacaga gtgtcagata tgtcatctca acctcagact tttacataac atctcaggag 1800
gaaatgtggc tctctccatc ttgcatacag ggctcccaat agaaatgaac acagagatat 1860
tgcctgtgtg tttgcagaga agatggtttc tataaagagt aggaaagctg aaattatagt 1920
agactcccct ttaaatgcac attgtgtgga tggctctcac catttcctaa gagatacatt 1980
gtaaaacgtg acagtaagac tgattctagc agaataaaac atgtactaca tttgctaaaa 2040
aaaaaa 2046
<210> 8
<211> 11025
<212> DNA
<213> 智人
<400> 8
gagcatcttt tggggggagg gaattcagcg gatcagtctt aagaggagct tttttttgga 60
gcgagaaatc atataaaata aaatgaaata aaacaaggag gaaggcaacc agctgttagg 120
ggaaaaataa ggcagataaa ggagcgggga gagaaattaa ttgccaacca ggaggagttg 180
ggctgtattt ttcaaaggtg gggagagtgg agcacacacc ttgaggagga aagcgagaaa 240
gaaaagaaaa aagcaagtgg aaaggggggc tcgcccaaga agggtgaaga agcgaagaaa 300
gtcgaggcgc cgaggctccc aaagctggca gctccgggtg gcggtgcagg ggcgaagggg 360
gggcgggggg aaccgtcgga catgcggctc tggagttggg tgctgcacct ggggctgctg 420
agcgccgcgc tgggctgcgg gctggccgag cgtccccgcc gggcccggag agacccgcgg 480
gccggccgac ccccgcgccc cgccgccggc ccggccacct gcgccacccg ggcggcccgc 540
ggccgccgcg cctcgccgcc gccgccgccg ccgccgggcg gtgcctggga agccgtgcgc 600
gtcccccggc ggcggcagca gcgggaggcg aggggcgcca ccgaggagcc gagcccgccg 660
agccgggcgc tctatttcag cgggcgaggc gagcagctgc gcctccgggc cgacctcgag 720
ctgccccggg acgcgttcac gctgcaagtg tggctgcgag cggagggggg ccagaggtct 780
ccggcagtga tcacagggct gtatgacaaa tgttcttata tctcacgtga ccgaggatgg 840
gtcgtgggca ttcacaccat cagtgaccaa gacaacaaag acccacgcta ctttttctcc 900
ttgaagacag accgagcccg gcaagtgacc accatcaatg cccaccgcag ctacctccca 960
ggccagtggg tatacctagc tgccacctat gatgggcagt tcatgaagct ctatgtgaat 1020
ggtgcccagg tggccacctc tggggaacaa gtgggtggca tattcagccc actgacccag 1080
aagtgcaaag tgctcatgtt agggggcagt gccctgaatc acaactaccg gggctacatc 1140
gagcacttca gtctgtggaa ggtggccagg actcagcggg agatactgtc tgacatggaa 1200
acccatggcg cccacactgc tctacctcag ctcctcctcc aggagaactg ggacaatgtg 1260
aagcatgcct ggtcccccat gaaggatggc agcagcccca aagtggaatt cagcaatgcc 1320
cacggctttc tgctggacac gagtctggag cctcctctgt gcggacagac attgtgtgac 1380
aacacagagg tcattgccag ctacaatcag ctctcaagtt tccgccagcc caaggtggtg 1440
cgctaccgcg tggtcaacct ctatgaagat gatcataaga acccgacggt gacgcgcgag 1500
caggtggact tccagcacca tcagctggct gaggccttca agcaatacaa catctcctgg 1560
gagctggacg tgctggaggt gagcaactcc tcccttcgcc gccgcctcat cctggccaac 1620
tgtgacatca gcaagattgg ggatgagaac tgtgaccccg agtgcaacca cacgctgacg 1680
ggccacgacg gcggggattg ccgccacctg cgccaccctg ccttcgtgaa gaagcagcac 1740
aacggggtgt gtgacatgga ctgcaactat gaacggttca actttgatgg tggagagtgc 1800
tgtgaccctg aaatcaccaa tgtcactcag acttgctttg accccgactc tccacacaga 1860
gcctacttgg atgttaatga gctgaagaac attcttaaat tggatggatc aacacatctc 1920
aatattttct ttgcaaaatc ctcagaggag gagttggcag gagtagcaac ttggccatgg 1980
gacaaggagg ccctgatgca cttaggtggc attgtcttga acccatcttt ctatggcatg 2040
cctgggcaca cccacaccat gatccatgag attggtcaca gcctgggcct ctatcacgtc 2100
ttccgaggca tctcagaaat ccagtcctgc agtgacccct gcatggagac agagccctcc 2160
ttcgagactg gagacctctg caatgatacc aacccagccc ctaaacacaa gtcctgtggt 2220
gacccagggc caggaaatga cacctgtggc tttcatagct tcttcaacac tccttacaac 2280
aacttcatga gctatgcaga tgacgactgt acggactcct tcacgcccaa tcaagtcgcc 2340
agaatgcact gttacctgga cctggtctac cagggctggc agccctccag gaaaccagcg 2400
cctgttgccc tcgcccccca agttctgggc cacacaacgg actctgtgac actggagtgg 2460
ttcccaccta tagatggcca tttctttgaa agagaattgg gatcagcatg tcatctttgc 2520
ctggaaggga gaatcctggt gcagtatgct tccaacgctt cctccccaat gccctgcagc 2580
ccatcaggac actggagccc tcgtgaagca gaaggtcatc ctgatgttga acagccctgt 2640
aagtccagtg tccgcacctg gagcccaaat tcagctgtca acccacacac ggttcctcca 2700
gcctgccctg agcctcaagg ctgctacctc gagctggagt tcctctaccc cttggtccct 2760
gagtctctga ccatttgggt gacctttgtc tccactgact gggactctag tggagctgtc 2820
aatgacatca aactgttggc tgtcagtggg aagaacatct ccctgggtcc tcagaatgtc 2880
ttctgtgatg tcccactgac catcagactc tgggacgtgg gcgaggaggt gtatggcatc 2940
caaatctaca cgctggatga gcacctggag atcgatgctg ccatgttgac ctccactgca 3000
gacaccccac tctgtctaca gtgtaagccc ctgaagtata aggtggtccg ggaccctcct 3060
ctccagatgg atgtggcctc catcctacat ctcaatagga aattcgtaga catggatcta 3120
aatcttggca gtgtgtacca gtattgggtc ataactattt caggaactga agagagtgag 3180
ccatcacctg ctgtcacata catccatgga agtgggtact gtggcgatgg cattatacaa 3240
aaagaccaag gtgaacaatg cgacgacatg aataagatca atggtgatgg ctgctccctt 3300
ttctgccgac aagaagtctc cttcaattgt attgatgaac ccagccggtg ctatttccat 3360
gatggtgatg gggtatgtga ggagtttgaa caaaaaacca gcattaagga ctgtggtgtc 3420
tacacgcccc agggattcct ggatcagtgg gcatccaatg cttcagtatc tcatcaagac 3480
cagcaatgcc caggctgggt catcatcgga cagccagcag catcccaggt gtgtcgaacc 3540
aaggtgatag atctcagtga aggcatttcc cagcatgcct ggtacccttg caccatcagc 3600
tacccatatt cccagctggc tcagaccact ttttggctcc gggcgtattt ttctcaacca 3660
atggttgccg cagctgtcat tgtccacctg gtgacggatg ggacatatta tggggaccaa 3720
aagcaggaga ccatcagcgt gcagctgctt gataccaaag atcagagcca cgatctaggc 3780
ctccatgtcc tgagctgcag gaacaatccc ctgattatcc ctgtggtcca tgacctcagc 3840
cagcccttct accacagcca ggcggtacgt gtgagcttca gttcgcccct ggtcgccatc 3900
tcgggggtgg ccctccgttc cttcgacaac tttgaccccg tcaccctgag cagctgccag 3960
agaggggaga cctacagccc tgccgagcag agctgcgtgc acttcgcatg tgagaaaact 4020
gactgtccag agctggctgt ggagaatgct tctctcaatt gctccagcag cgaccgctac 4080
cacggtgccc agtgtactgt gagctgccgg acaggctacg tgctccagat acggcgggat 4140
gatgagctga tcaagagcca gacgggaccc agcgtcacag tgacctgtac agagggcaag 4200
tggaataagc aggtggcctg tgagccagtc gactgcagca tcccagatca ccatcaagtc 4260
tatgctgcct ccttctcctg ccctgagggc accacctttg gcagtcaatg ttccttccag 4320
tgccgtcacc ctgcacaatt gaaaggcaac aacagcctcc tgacctgcat ggaggatggg 4380
ctgtggtcct tcccagaggc cctgtgtgag ctcatgtgcc tcgctccacc ccctgtgccc 4440
aatgcagacc tccagaccgc ccggtgccga gagaataagc acaaggtggg ctccttctgc 4500
aaatacaaat gcaagcctgg ataccatgtg cctggatcct ctcggaagtc aaagaaacgg 4560
gccttcaaga ctcagtgtac ccaggatggc agctggcagg agggagcttg tgttcctgtg 4620
acctgtgacc cacctccacc aaaattccat gggctctacc agtgtactaa tggcttccag 4680
ttcaacagtg agtgtaggat caagtgtgaa gacagtgatg cctcccaggg acttgggagc 4740
aatgtcattc attgccggaa agatggcacc tggaacggct ccttccatgt ctgccaggag 4800
atgcaaggcc agtgctcggt tccaaacgag ctcaacagca acctcaaact gcagtgccct 4860
gatggctatg ccatagggtc ggagtgtgcc acctcgtgcc tggaccacaa cagcgagtcc 4920
atcatcctgc caatgaacgt gaccgtgcgt gacatccccc actggctgaa ccccacacgg 4980
gtagagagag ttgtctgcac tgctggtctc aagtggtatc ctcaccctgc tctgattcac 5040
tgtgtcaaag gctgtgagcc cttcatggga gacaattatt gtgatgccat caacaaccga 5100
gccttttgca actatgacgg tggggattgc tgcacctcca cagtgaagac caaaaaggtc 5160
accccattcc ctatgtcctg tgatctacaa ggtgactgtg cttgtcggga cccccaggcc 5220
caagaacaca gccggaaaga cctccgggga tacagccatg gctaaggaag gacaagaagt 5280
tgtcaaagaa ttcccaacgc caggacccac atccctttgg tattgatttc acagtcagct 5340
gctcaacgga atggcctctc cacaccaggg atccttagca cccaaccggt ctgcctttaa 5400
ttttacccag gaaggactca cattggggcg aatgaaccaa gtttcgccat gctggatgat 5460
gaaatggatt cccatcccaa agtctgagat ggattgcata tacagtgtgc agtcccagag 5520
cctcctaaaa ttctagccat ttgtcacaca accacagcaa gaaacgtgtt ctatatctag 5580
agtgtgccca tctgtgttta gtacacatgc atgcatacac acccatacaa acatctgtgt 5640
gagggcagtt ctggagatga gcagagagag accggaataa actcaatctt ttctttccca 5700
agctcctagc caacactatc cttgggagaa agaaatttgc agaaactgct aagaccaagt 5760
gtggagatgt caagctagtt cacactctga ggctcagaat atgtaggaca tgcacaattg 5820
tgcagtcctt tgggattgga agtgaaacag tctgtgatcc cctaccttct agggaactag 5880
gacctaggaa gaggtaaaga ttatcaggta tgcaaagcgc cccaattctt ctgctgccat 5940
gggggatttt accccaactc cagggttcga ggccaatctg agaatggctt aggattgcaa 6000
tgtcaaggta ttatatcagc cccttgcttg aggcttgagg tcataatatc cctctaggac 6060
ttacctgttc ccccagatct tgccttggga ccacatttgc tgctactttt cctgctgctc 6120
tatcctatac attgaataat ccaagatggt agaactaggt taggaaaaat tccacacaac 6180
caaacagtct gccttaaaag tgacccacat ttttccatag ctcctcactt tttagccctt 6240
ctgcaagaga aaaaccctca tgggtccaca tggtgagaag ttaagtttcc tgtaagtggg 6300
cctctcaccc tggaaaggag ttgagggaca tcagatgctg gaaccctcac tgaaagtcca 6360
gaatgtctaa gccagtgtta gattttgtaa acaagtggaa cagtgttaaa tttctatgat 6420
gttggagcca tccagagact actggaattg tcgagacttt tggattatta tccttatcct 6480
tatcctaatc ttcctagccc ttcaggctag agtaggcttc gatcctgaga accttgctgt 6540
tgctctgagg agatataatt ctgggagaaa gaatctttta taagaacagt acagattgtt 6600
ctcaagaggg ccatcagaag gaagccaaag agttcacagc ctcagcacca acaactcaac 6660
atggtcatca tgttttctat atggtttttc cagctagcag tactcccttc catacctgtg 6720
actgggcagt gcttttctct ctcccatgtc tagcctccaa aagttaagtg aaaattagtc 6780
aactgcacgt ggaagccccc accactttgg ggatctcttt atttcttttc agccagggac 6840
ctgtccactc cctttgaatt aatatgggaa gaaattaata caggatgaac tggagagaag 6900
ggttgagtgt ggcatacttt ctgaaacctg gagctgggaa ttgcggagaa gggaaggtct 6960
agactagtta catcacatag ggattactgt aaatcaagtc atctcaagtc tagtgaagac 7020
agccaacaga aacaaaacct agcataggga tagaaaatac catgcacgtg tgcagcccca 7080
cctaattcct gcatccaagg caggtgttgt taatctatca tagcacttaa aaaaaaaaaa 7140
aaaaagagac caaaaataac tttaggaacc accatattat atcactccca atagcactga 7200
cctggtgatc aaaaacactt gagaagacat ctattggcca tctctggcca attacactaa 7260
gaaacatatc aaggtgcttt tggcacaggt gcccacaaat acggatgcag tgctgagata 7320
gtttatgaga cttgtaccat ttcacaaact ctgaaattgg gttccatatt ggcaaggctg 7380
ccacagttgt taagaataat cctctatgtt tcttcctcac aaaaccatat ctcatttata 7440
tccagaccat tacttcacta taattacaag gacaaattat tagcaagaaa taagaatagt 7500
attagaagaa ttgatcctat tttgaacccc tctccagtat cttcacactc ttgtcaactc 7560
tccaggcctc tctcttgccc tgagttatca gcctgtgtgg tgttaactac cttagaaggt 7620
acaagctaag aaatgtaaca gtatcaaccc tcccagttgc ttaattatac ccataggtaa 7680
tacaaaaagc tctgaagacc caaagatgac attactaatg atgtgatttc aggagccaca 7740
gaagaacctt accagcttcc ctcaaatcag tccttatcct ctttctatct tcactcccat 7800
catcatctat tttcacacta tccagctaag caaagattcc tggaggctga cttgtatctt 7860
cagactcaca gagtgaattc agctcttctg aatcaagacc cacccagtct ctttcattca 7920
gacctgttgc taacaaattt atatttgcca aggatattag gcaaaagagg ctacttgatt 7980
ggtggccaac ctcgtgccca catggaaggt atctttaata gggtcttttc aaaccttagt 8040
ggaggagggt cagctcaatt tgggcaatgc atttgttccc agtttcattt tcttcctggg 8100
aattaactcg tcatttcatt ccttcagtca tcttctgtgt aggtgaccgg agcactgaga 8160
ggcagctctg atgcactatt gtgtgtcagc agctcaaagg ccctaaaaca ctgaaggttc 8220
tgcatctgaa gtattagatt gttagcagca aaatatgaaa gatgaggtgg acagtcctct 8280
aagccctatt tagggaagct tttccaagcc acaatcttaa ctacctaccc aaaggatttg 8340
cattaccccc agattctgtg ccaacaacct tttaaggaaa tacagtcctt gggaaatgag 8400
ttttgatggt gaattggggt gttaaggaag ggaaagattg tcatagatgg tagggctttg 8460
aaaatgcagg gtatcagctg ccactcctgg cttcaacaca ttgagtcact gcctagacgg 8520
ttctcttggt cttattccca tcctggccaa tgcttaaata ctatttgttg aaaataattc 8580
tttgagacag atttcagcta cctcccttcc aggttcgatt taacttggtt gtaattgtca 8640
atttgttgtt ataggtctta cctgtgtgaa agaaagaaaa agaaagaaag aaagaaagag 8700
aaaggaaatt ataaggtcaa gttaacagtt ttgaggtttt gtgttttttt ctggaactac 8760
ttcaagtgag aaaataaaaa aaaatggtga caaagctgta cagatagaga taatagaaga 8820
caaagagatt aaaaggaaat aaaaatgcat gattaaaaac taagaataaa aaacctattt 8880
ttatgtttcc taaaggaaat tgtttattct acagcctcag taggtagaca caaacataaa 8940
gatttcccta gaagacatag agtgggattt gataacactg tctgttattt tctgtacatt 9000
gtggtaggtc caggaaatat gacattttcc cccttgatgt gttattgttg ttgttgggtg 9060
gggtgggcat tttgtttatt tgtttggtgg caatcagtgg tagtagggag tgggagggct 9120
tatattggtt tttccagcta ttaaggggac atattgtgtc gttgtgcttt tcacgttata 9180
aaatgtttat atttaccagt acagcactgg gctttataaa gactgcactc agaaccacac 9240
tgcacagtcc agttttttaa aaagctgcta catgacagac aggtaatccc actgagtgag 9300
ttttgagaaa caaatcaaac gaagtaaaca agaaacataa aaaccaaata gcaaatgaat 9360
aaaagcctgt tcttgtaact tattcaactt ttgccaaatt cctaccaatc acttgctttt 9420
taaaagaaat gtataatagc caaaagagaa attatgtccc tgttgtacag aagttagaat 9480
ttttgactcc aggcagcagt ttgctcagtg atcttgaaca agttatccaa ttgcctctac 9540
atttgcatca gtttctctag ctgcaaaatg gggataatac tatataccta cctcacagtg 9600
ggagggcagg agattttgag gccctgaggt tttaggtggg ctgtgagggc caacgcttga 9660
cacaaagtcc atgggttatt attcaagaat gcacaggccc atcggccttt tagaaagaca 9720
agacagggag tgcttgtttg atatttcaag gaataaagcc ggagctcctg aattgtagtc 9780
caccttaaaa gagagacctg tattggagaa tattttattt ttttggcaaa tttgatctta 9840
ccctttacca gttctataat ttggttaaaa gctgattatg tcctacaatg tcaaagtcag 9900
ctaactgtcg tctacttaag acttctggtc atttccaact tatagaggaa gggagtctct 9960
aaaatctctt cttcagaagg cacctcactt ctcagactta aaattccaca tcaagtgttc 10020
cattaaaaga agataaggca ttctgagtgc aaacaaatgg gggcttctta aactacacac 10080
cagcagtcag tgaggaaaac tttgaacaat tattgagttg ctttcttggg tctctataat 10140
caataacctg tctgcagata tctatctata taaagatatt atatataaat ataaatttac 10200
atatatatgc acatgtatat atagttgtac atatatgtgt gtatatatat acttaaatgt 10260
aatatttaca aaataaaact gtgatctcgt ctagagaaaa tgtattcata ttacaaactg 10320
ctcttccata tttatgtacc atattatacc tttttattat tgttataatt attatgggta 10380
tttctaatta atatgatgtt gaaacctgtt tggcaccttc tggaagctac caaaaaaatg 10440
acactccatt gaagtgctta aaagctgttc tcataagaat tctactggcc tattgtaaaa 10500
aagaaaaaaa aaaagaaaaa gaagaaagac acaaagaaaa taatctaaac accaaaaact 10560
aaacacaatt ccaatccttt ttctgtacct cacgcgcata aatttgctgc tcctattttt 10620
ttttctgttt atgtgttttt atggatctaa gttaaatctt ttggcaatat ataaaaatgt 10680
aaatagtaaa ctttatttat taagaatgtc atctttttta atttatattt acacaattgt 10740
tcatctaatt tattttttct atacagtttt aaatactcag acatattttg ctgttcatga 10800
tatttttatc ctgttctcat ggatttgttt tcccatactg ttttctctga tctcaattac 10860
aggttggatc tcacaaataa taatgtcaga gacagaaata ttttgccact gttgattact 10920
atactttaaa gttctatatt atgaaaatat ataatagctt gtacgcttca aaaaaaaaaa 10980
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 11025
<210> 9
<211> 794
<212> DNA
<213> 智人
<400> 9
gctgcattac agacacagac ctgcaaacat ctatggttgt gacagagttt ctttctgaca 60
cctgagtctt tctcctgctg cacggaaagc ttgctgggag gggcttggaa tctggcatga 120
agccaaaggg catctctgag ttgcagcatt taaatgatcc cactcagaga ttcacacaga 180
agactggaca caattccgaa gagctgccca gaaggagaga acaatgtcat cactacccgt 240
accatacaca ctgcctgttt ccttgcctgt tggttcgtgc gtgataatca cagggacacc 300
gatcctcact tttgtcaagg acccacagct ggaggtgaat ttctacactg ggatggatga 360
ggactcagat attgctttcc aattccgact gcactttggt catcctgcaa tcatgaacag 420
ttgtgtgttt ggcatatgga gatatgagga gaaatgctac tatttaccct ttgaagatgg 480
caaaccattt gagctgtgca tctatgtgcg tcacaaggaa tacaaggtaa tggtaaatgg 540
ccaacgcatt tacaactttg cccatcgatt cccgccagca tctgtgaaga tgctgcaagt 600
cttcagagat atctccctga ccagagtgct tatcagcgat tgagggagat gatcagactc 660
ctcattgttg aggaatccct ctttctacct gaccatggga ttcccagagc ctactaacag 720
aataatccct cctcacccct tcccctacac ttgatcatta aaacagcacc aaacttcaaa 780
aaaaaaaaaa aaaa 794
<210> 10
<211> 6299
<212> DNA
<213> 智人
<400> 10
gtgacgtcac gcgtcgacgc tggggcgtac ctttcgggct cctgactcct gccgcttctc 60
ttccccttcc gtgggtcagg gccggtccgg tccggaacct gcagcccctt tcccagtgtt 120
ctagttcgcc cgtgacccgg aataatgagc aaggagggtg tggtgggttg aaagccatcc 180
tactttactc ccgagttaga gcatggattc agttttagtc ttaaggggga agtgagattg 240
gagattttta tttttaattt tgggcagaag caggttgact ctagggatct ccagagcgag 300
aggatttaac ttcatgttgc tcccgtgttt gaaggaggac aataaaagtc ccaccgggca 360
aaattttcgt aacctctgcg gtagaaaacg tcaggtatct tttaaatcgc gatagttttc 420
gctgtgtcag gctttcttcg gtggagctcc gagggtagct aggttctagg tttgaaacag 480
atgcagaatc caaaggcagc gcaaaaaaca gccaccgatt ttgctatgtc tctgagctgc 540
gagataatca gacagctaaa tggagtctga gcagctgttc catagaggct actatagaaa 600
cagctacaac agtataacaa gtgcaagtag tgatgaggaa cttttagatg gagcaggtgt 660
tattatggac tttcaaacat ctgaagatga caatttatta gatggtgaca ctgcagttgg 720
aactcattat acaatgacaa atggaggcag cattaacagt tctacacatt tactggatct 780
tttggatgaa ccaattccag gtgttggtac atatgatgat ttccatacta ttgattgggt 840
gcgagaaaaa tgtaaagaca gagaaaggca tagacggatc aacagcaaaa agaaagaatc 900
agcatgggaa atgacaaaaa gtttgtatga tgcgtggtca ggatggctag tagtaacact 960
aacaggattg gcatcagggg cactggccgg attaatagac attgctgccg attggatgac 1020
tgacctaaag gagggcattt gccttagtgc gttgtggtac aaccacgaac agtgctgttg 1080
gggatctaat gaaacaacat ttgaagagag ggataaatgt ccacagtgga aaacatgggc 1140
agaattaatc ataggtcaag cagagggtcc tggttcttat atcatgaact acataatgta 1200
catcttctgg gccttgagtt ttgcctttct tgcagtttcc ctggtaaagg tatttgctcc 1260
atatgcctgt ggctctggaa ttccagagat taaaactatt ttaagtggat tcatcatcag 1320
aggttacttg ggaaaatgga ctttaatgat taaaaccatc acattagtcc tggctgtggc 1380
atcaggtttg agtttaggaa aagaaggtcc cctggtacat gttgcctgtt gctgcggaaa 1440
tatcttttcc tacctctttc caaagtatag cacaaacgaa gctaaaaaaa gggaggtgct 1500
atcagctgcc tcagctgcag gggtttctgt agcttttggt gcaccaattg gaggagttct 1560
ttttagcctg gaagaggtta gctattattt tcctctcaaa actttatgga gatcattttt 1620
tgctgcttta gtggctgcat ttgttttgag gtccatcaat ccatttggta acagccgtct 1680
ggtccttttt tatgtggagt atcatacacc atggtacctt tttgaactgt ttccttttat 1740
tcttctaggg gtatttggag ggctttgggg agcctttttc attagggcaa atattgcctg 1800
gtgtcgtcga cgcaagtcca cgaaatttgg aaagtatccc gttctggaag tcattattgt 1860
tgcagccatt actgctgtga tagccttccc taatccatac actaggctaa acaccagtga 1920
actgatcaaa gagcttttta cagactgtgg tcccctggaa tcctcttctc tttgtgacta 1980
cagaaatgac atgaatgcca gtaaaattgt cgatgacatt cctgatcgtc cagcaggcat 2040
tggagtatat tcagctatat ggcagttatg cctggcactc atatttaaaa tcataatgac 2100
agtattcact tttggcatca aggttccatc aggcttgttc atccccagca tggccattgg 2160
agcgatcgca ggaaggattg tggggattgc ggtggagcag cttgcctact atcaccacga 2220
ctggtttatc tttaaggagt ggtgtgaggt cggggctgat tgcattacac ctggccttta 2280
tgccatggtt ggtgctgctg catgcttagg tggtgtgaca agaatgactg tctccctggt 2340
ggttattgtt tttgagctta ctggaggctt ggaatatatt gttcccctta tggctgcagt 2400
catgaccagt aaatgggttg gagatgcctt tggcagggaa ggcatttatg aagcacacat 2460
ccgattaaat ggataccctt tcttggatgc aaaagaagaa ttcactcata ccaccctggc 2520
tgctgacgtt atgagacctc gaaggaatga tcctccctta gctgtcctga cacaggacaa 2580
tatgacagtg gatgatatag aaaacatgat taatgaaacc agctacaatg gatttcctgt 2640
cataatgtca aaagaatctc agagattagt gggatttgcc ctcagaagag acctgacaat 2700
tgcaatagaa agtgccagga aaaaacaaga aggtatcgtt ggcagttctc gggtgtgttt 2760
tgcacagcac accccatctc ttccagcaga aagtcctcgg ccattgaagc ttcgaagcat 2820
tcttgacatg agccctttta cagtgacaga ccacacccca atggagatcg tggtggatat 2880
tttccgaaag ctgggactga ggcagtgcct tgtaactcac aatgggattg tcttggggat 2940
catcacaaag aagaacatat tagagcatct cgagcaacta aagcagcacg tcgaaccctt 3000
ggcgcctcct tggcattata acaaaaaaag atatcctccg gcatatggcc cagacggcaa 3060
accaagaccc cgcttcaata atgttcaact gaatctcaca gatgaggaga gagaagaaac 3120
ggaagaggaa gtttatttgt tgaatagcac aactctttaa cctgagggag tcatctactt 3180
ttttttcctc ctttacaaaa aaagaaagga aatataaaag ccgggttttt gcaacatggt 3240
ttgcaaataa tgctggtgga atggaggagt tgtttgggga gggaaaggag agagaaggaa 3300
aggagtgagg tatttcccgt ctaacagaaa gcagcgtatc aactcctatt gttctgcact 3360
ggatgcattc agctgaggat gtgcctgata gtgcaggctt gcgcctcaac agagatgaca 3420
gcagagtcct cgagcacctg gcctgttgct ccaacattgc aaagacacat tatcagtccc 3480
tatttctaga gggattactt tgaattgagc catctataaa actgcaaggt cttgcccttt 3540
tttttaatca aaactgttct gtttaattca tgaattgtat agttaagcat tacctttcta 3600
cattccagaa gagcctttat ttctctctct ctctctctct ctctctctct ctctactgag 3660
ctgtaacaaa gcctctttaa atcggtgtat ccttttgaag cagtcctttc tcatattgag 3720
atgtactgtg attttactga ggtttcatca caagaaggga gtgtttcttg tgccattaac 3780
catgtagttt gtaccatcac taaatgcttg gaacagtaca catgcaccac aacaaaggct 3840
catcaaacag gtaaagtctc gaaggaagcg agaacgaaat ctctcattgt gtgccgtgtg 3900
gctcaaaacc gaaaacaatg aagcttggtt ttaaaggata aagttttctt ttttgttttc 3960
ctctcagact ttatggataa tgtgaccggg tcttatgcaa attttctatt tctaaaacta 4020
ctactatgat atacaagtgc tgttgagcat aattaaataa aatgctgctg ctttgacagt 4080
aaagagaagg aagtattctg attagctgta tctggtatta attgcatgtt aaaacactgg 4140
aatttttaaa attgaaatta gatcagtcat tcttttcttt tctcaagata tctcatggct 4200
gacactgaag aagaaatgta attcataact tgcactaaat gtatattttt tttcttaaaa 4260
atttaccatt cttatttata tttttatgga ttaaaattta taaaatacag atcagttaat 4320
attgcactta agtaatttta cctttttaat gtgattttta tagaataatt cagacttaca 4380
aatacagaga tatgaacaaa gtttacagtg ggaacaaagg tttaaaaaaa ggttgtggtt 4440
ctctctctgt gatccagtgt gcacataaac ctttctctga tctttcactg ccatcctctg 4500
gattatgtct tctgacctgt ccattttgac ccattaactg gaaagttgaa aaactacatt 4560
aactggaaag ttgaaaaact acattacttt ggagaataaa accgaaagtt cgtgtatacc 4620
ttcttaaaaa aaaaatcaaa ccaaaaatgt gaaaacaata gaattgcaaa gatagcagtt 4680
aaaattttaa tctgaaaata acctttgaat ctcgggctag gttacgtcca tatttgaagt 4740
ggtcagtgat ggtttgaaca ttttttgcag gatgagtgaa aatgcactgg attatatttg 4800
ggatttttgt ttttggaatt gtctgtttta atcacagcct taattcacaa ttggcaaagg 4860
cagtttactc aaaggactgg gctaaatatt ctgtaattat gcatttttga taggaaaatg 4920
aaatttttgc aaacagacat tttctttttt tttggctgga gtgcagtggg gcatggtctt 4980
ggctcactgc agcgttgacc acctgggctc aagtgatact cccgcctcag ccacccaagt 5040
agctggcact acgggcacac gccaccatgc ccagctaatt tttttgtatt tttagtagag 5100
atggggtttt gccatgctgc ccaggctggt ctcaactcct cagctcaagc aatctgcctg 5160
cgtgagcctc ccaaagtggt ggaattacag gcgtgggcca ctgcgcctgg cccagacaga 5220
cattttctga aacacaactg gcaatgagct gtttttacat tttgaaagtg attcttcact 5280
tcctagttct taattatagt atacctatta agatctgtaa gatcctgaag acataagatc 5340
atgaagccat ataagaatga ggattgaaag ttgagcaaaa ttttcgggat tttgggaaac 5400
attcttagct gtgctatctg cctaaaatta ttccttatta cttctctcct ttgacagact 5460
tcaagttttc ttcatagccc tttcaaagtt ttttgagcca tccagagtaa aatcatttct 5520
aaatgatagt tctgtatatc tccaactcgt cttaagtgta tttgcctgtg tgcaacgtat 5580
tgctagacta tgaactcctc agcatggctg ctggataact taattgtcct gagttaatag 5640
ccttcaaagg acaaatcggt ttctttgcag atagcttcgt aaaacttcac atggagttta 5700
ttttatcata tttccctttt ttatttctgc tcctccttta attgcccatc ttgcttcaga 5760
gactgacatt tcagggtgga tattaattaa agcattaatt ttgttttttg gtatatttct 5820
atccctagta tttctatctt actgctaaaa tacaggaaaa gtgccgtatt tttaatgcat 5880
ttagtggttt tctttggtgt tatctgttcc atttttcttt ttcatacatt gaagtgtgtc 5940
tccttttcaa ccaaaataat gaaatagtgg agaccatgaa attgttgtgc ctggctaatt 6000
ggcaaattaa tttaccaata taataagtgt agcgccttgt ttgaataccc tttttgagaa 6060
ggtatgatga gaatgggcaa gggtgtcagc atctcttctt cttaataatt aattgttttc 6120
agttttggtt cacgaagaat gcttagttaa tctgtaatgt tgcctagagc tgtatttatc 6180
tgtttttatt tatactagtg tagtaaagct gcatatcatt acagtaaaaa cgactactgt 6240
gatgagttaa tcagaaaatc tattaaaatc tatatgacaa tgaaaaaaaa aaaaaaaaa 6299
<210> 11
<211> 3006
<212> DNA
<213> 智人
<400> 11
gcaggctgct gtctcacaga gcgagaaggt gtcaggagca gcccagttgt gtctctctct 60
ctacctctgt gaagggcgcg aatgggcaga gcagaacttc tagaagggaa gatgagcacc 120
caggatccct cagatctgtg gagcagatcc gatggagagg ctgagctgct ccaggacttg 180
gggtggtatc acggcaacct cacacgccat gctgctgaag ctcttctcct ctcaaatgga 240
tgtgacggca gctaccttct gagggacagc aatgagacca ccgggctgta ctctctctct 300
gtgagggcca aagattctgt taaacacttt catgttgaat atactggata ttcatttaaa 360
tttggcttta atgaattctc atctttgaag gattttgtca agcattttgc aaatcagcct 420
ttgattggaa gcgagacagg cactctgatg gttctaaaac atccctaccc aagaaaagtg 480
gaagaaccct ccatttatga atctgtccgg gttcacacag caatgcagac aggaagaaca 540
gaagatgacc ttgtgcccac agcaccttct ctgggcacca aagaaggtta cctcaccaaa 600
cagggaggcc tggtcaagac ctggaaaaca agatggttta ctctgcacag gaatgaactg 660
aaatacttca aagaccagat gtcaccagaa ccaattcgga tcctagacct aacagaatgt 720
tcagctgtac aattcgatta ttcacaagaa agggtaaact gtttttgttt ggtatttcca 780
ttcaggacat tttatctctg tgcaaagacc ggagtagaag ctgatgagtg gatcaagata 840
ttacgctgga aattggtcaa ggacaaaagc tgatttattt tgtctgctct ctgtatatct 900
cccgaggaga agactgatca caaataagaa aacagctcaa ccaaggggaa ggcacgatcc 960
gatctcggtc gttcatcttt aaatagatct ttcttgccaa ggaatgctct ggcccaggag 1020
caaggtggaa tgtttccctg acgctgtgat ctgcagcagg cttcaaatga aaaccgacta 1080
aggattttct ttcaaaaaca aatcagaagc agatgctgat tgggacccat ataccacgtt 1140
gctgactcac gttgctgccc ttccatgatg ttgccatctc cttgagaaca ctgaagcaat 1200
caccattctg atagaaagtg cttaaaccac cactcttagg tctgctcact cttagaacac 1260
acaatggaag aggaagggtt tttgttttca ctcattgtgg tccccaagcc tattgacact 1320
agttgcctag agtcccactg tgagtcatgg tcagcctgtc tgacatccag gttgtgctat 1380
taaccaagaa ggaaacagat acttggaggc ttagatgact tctgcaggat ttatattcag 1440
atagaaaaca tcaaatattt tcaggggaga ggtttttttt tttaattttt ccccctttat 1500
acaaaaaaaa aagaacattt ccaaaactaa aatagaaaat gcttgtggca tttattttct 1560
ctttttaaaa ggttcagaaa tttggcaggt cctttgcttc taatgacaaa actgtgagag 1620
ctagatgtcc tatgggcaat taggtagtat aataaaggta aatgaaggta caatttttaa 1680
accattattt tcaccctgtt ggggtaaatg ttttaaagag tgagaaaaca taaattgaga 1740
aagggtgata aagtaataga taacttttag tttaataata attattgtta ttatactact 1800
aataatagag cacttgtaag cactaagtta tctttatcca acatttctcc aaatggactg 1860
aaagaaactt ttcaaggaca gtgtattata acaatccctt tcccagaatt agttgtatag 1920
ggttggccca agagatgtaa gaaaaatctc gcattgctcc ctaagcaccc tgggccttat 1980
taaagagcaa cttctatttc cagtcggggg agtaacacta aagctacaag aaatatgtaa 2040
taatgatagg taataatgtg ttccaaagct ttttcaaact agaataagga ggcaaataga 2100
agaatgagat actgatgtcc acagttcatt ggcagaatct aaccccttct gttatctttt 2160
ttaatactat ttttgtttag atagaagttt caaagaagat aaaaatgctt gaagagcctg 2220
agagtaaaaa gattatgctg caaagctatg atataaactg ctcttgcagt ccaaagggat 2280
acctgattaa agaagtttct tatttaaaca tctcagacgc aaaaattaca ttaaattttt 2340
gtatatttca acaacatttt aaatgtattt tgttatgttt gtattatata ggataaagca 2400
aatgtcaagt taaaatgtat tgtgttgttt gtaaagtaag aagttactgg ccaggagcgg 2460
cggctcatgc ctgtaatccc aggactttgg taggccaaga caagcagatc acttgaggtc 2520
aggagttcaa catcagcctg gccaacatga tgaaaccttg tctttactaa aaatacaaaa 2580
attagctggg catggtggca ggcgcctgta atcccagcta ctcaggaggc tgaggcagga 2640
gaattgcttg aacccgggag gtggaggttg cagtgaacca agatcgcggc gctgcactct 2700
agcctgggtg acagagtcag actccgtccc aaaaaaacaa acaaacaaaa caaaacaaaa 2760
aaaaacagaa gttacaaatg aatactcacg gatatgtata gttttatgtt tgttttctta 2820
gaaacaaatg tgtttctttg ggtgggtaat attgtgtttt actatgttta ccttttataa 2880
aacataacct gtttatttat attctttggc tttgtttatt aaaaagcatg attttgctgt 2940
gcatgtacca ttttgctatt aaaatttatt tttaatattt gtaacttgaa aaaaaaaaaa 3000
aaaaaa 3006
<210> 12
<211> 1861
<212> DNA
<213> 智人
<400> 12
agcctactcg gtccggggtt gcgaactgta aggtctgagt tgctgcggcg caggcagcgg 60
agaccaagca gggatcttaa cagggtttag cgccacgcgg gccagggccg aggccggagc 120
tgggaggggc gcgcccggga aggggcggag ctgcggcggt ggcgccaaat cgcaaatatg 180
gcgccggagc ggctgcggag ccgggcgctc tccgccttca agttgcgggg cttgctgctc 240
cgtggtgaag ctattaagta cctcacagaa gctcttcagt ctatcagtga attagagctt 300
gaagataaac tggaaaagat aattaatgca gttgagaagc aacccttgtc atcaaacatg 360
attgaacgat ctgtggtgga agcagcagtc caggaatgca gtcagtctgt tgatgaaact 420
atagagcacg ttttcaatat cataggagca tttgatattc cacgctttgt gtacaattca 480
gaaagaaaaa aatttcttcc tctgttaatg accaaccacc ctgcaccaaa tttatttgga 540
acaccaagag ataaagcaga gatgtttcgt gagcgatata ccattttgca ccagaggacc 600
cacaggcatg aattatttac tcctccggtg ataggttctc accctgatga aagcggaagc 660
aaattccagc ttaaaacaat agaaacctta ttgggtagta caaccaaaat cggagatgcg 720
attgttcttg gaatgataac gcagttaaaa gagggaaaat tttttctgga agatcctact 780
ggaacagtcc aactagacct tagtaaagct cagttccata gtggtttata cacagaggca 840
tgctttgtct tagcagaagg ttggtttgaa gatcaagtgt ttcatgtcaa tgcctttgga 900
tttccaccca ctgagccctc tagtactact agggcatact atggaaatat taattttttt 960
ggaggtcctt ctaatacatc tgtgaagact tctgcaaaac taaaacagct agaagaggag 1020
aataaagatg ctatgtttgt gtttttatct gatgtttggt tggaccaggt ggaagtattg 1080
gaaaaacttc gcataatgtt tgctggttat tcaccagcac ctccaacctg ctttattctg 1140
tgtggtaatt tttcatctgc accatatgga aaaaatcaag ttcaagcttt gaaagattcc 1200
ctaaaaactt tggcagatat aatatgtgaa tacccagata ttcaccaaag tagtcgtttt 1260
gtgtttgtac ctggtccaga ggatcctgga tttggttcca tcttaccaag gccaccactt 1320
gctgaaagca tcactaatga attcagacaa agggtaccat tttcagtttt tactactaat 1380
ccttgcagaa ttcagtactg tacacaggaa attactgtct tccgtgaaga cttagtaaat 1440
aaaatgtgca gaaactgcgt ccgttttcct agcagcaatt tggctattcc taatcacttt 1500
gtaaagacta tcttatccca aggacatctg actcccctac ctctttatgt ctgcccagtg 1560
tattgggcat atgactatgc tttgagagtg tatcctgtgc ccgatctact tgtcattgca 1620
gacaaatatg atcctttcac tacgacaaat accgaatgcc tctgcataaa ccctggctct 1680
tttccaagaa gtggattttc attcaaagtt ttttatcctt ctaataagac agtagaagat 1740
agcaaacttc aaggcttttg agattcttaa agatcatctg aagaaaattc atcagttttc 1800
tgcttaactc tatatcttat gtgattctga tattacaata aaattatggt aaactttagg 1860
a 1861
<210> 13
<211> 1307
<212> DNA
<213> 智人
<400> 13
acttatctgc agacttgtag gcagcaactc accctcactc agaggtcttc tggttctgga 60
aacaactcta gctcagcctt ctccaccatg agcctcagac ttgataccac cccttcctgt 120
aacagtgcga gaccacttca tgccttgcag gtgctgctgc ttctgtcatt gctgctgact 180
gctctggctt cctccaccaa aggacaaact aagagaaact tggcgaaagg caaagaggaa 240
agtctagaca gtgacttgta tgctgaactc cgctgcatgt gtataaagac aacctctgga 300
attcatccca aaaacatcca aagtttggaa gtgatcggga aaggaaccca ttgcaaccaa 360
gtcgaagtga tagccacact gaaggatggg aggaaaatct gcctggaccc agatgctccc 420
agaatcaaga aaattgtaca gaaaaaattg gcaggtgatg aatctgctga ttaatttgtt 480
ctgtttctgc caaacttctt taactcccag gaagggtaga attttgaaac cttgattttc 540
tagagttctc atttattcag gatacctatt cttactgtat taaaatttgg atatgtgttt 600
cattctgtct caaaaatcac attttattct gagaaggttg gttaaaagat ggcagaaaga 660
agatgaaaat aaataagcct ggtttcaacc ctctaattct tgcctaaaca ttggactgta 720
ctttgcattt ttttctttaa aaatttctat tctaacacaa cttggttgat ttttcctggt 780
ctactttatg gttattagac atactcatgg gtattattag atttcataat ggtcaatgat 840
aataggaatt acatggagcc caacagagaa tatttgctca atacattttt gttaatatat 900
ttaggaactt aatggagtct ctcagtgtct tagtcctagg atgtcttatt taaaatactc 960
cctgaaagtt tattctgatg tttattttag ccatcaaaca ctaaaataat aaattggtga 1020
atatgaatct tataaactgt ggttagctgg tttaaagtga atatatttgc cactagtaga 1080
acaaaaatag atgatgaaaa tgaattaaca tatctacata gttataattc tatcattaga 1140
atgagcctta taaataagta caatatagga cttcaacctt actagactcc taattctaaa 1200
ttctactttt ttcatcaaca gaactttcat tcatttttta aaccctaaaa cttataccca 1260
cactattctt acaaaaatat tcacatgaaa taaaaatttg ctattga 1307
<210> 14
<211> 1922
<212> DNA
<213> 智人
<400> 14
gtgcgcggcc ccgcgcggca acgcaggggc ggaaccgcat gactggcagt ggcatcagcg 60
atggcggctg cgtcggggtc ggttctgcag cgctgtatcg tgtcgccggc agggaggcat 120
agcgcctctc tgatcttcct gcatggctca ggtgattctg gacaaggatt aagaatgtgg 180
atcaagcagg ttttaaatca agatttaaca ttccaacaca taaaaattat ttatccaaca 240
gctcctccca gatcatatac tcctatgaaa ggaggaatct ccaatgtatg gtttgacaga 300
tttaaaataa ccaatgactg cccagaacac cttgaatcaa ttgatgtcat gtgtcaagtg 360
cttactgatt tgattgatga agaagtaaaa agtggcatca agaagaacag gatattaata 420
ggaggattct ctatgggagg atgcatggca atacatttag catatagaaa tcatcaagat 480
gtggcaggag tatttgctct ttctagtttt ctgaataaag catctgctgt ttaccaggct 540
cttcagaaga gtaatggtgt acttcctgaa ttatttcagt gtcatggtac tgcagatgag 600
ttagttcttc attcttgggc agaagagaca aactcaatgt taaaatctct aggagtgacc 660
acgaagtttc atagttttcc aaatgtttac catgagctaa gcaaaactga gttagacata 720
ttgaagttat ggattcttac aaagctgcca ggagaaatgg aaaaacaaaa atgaatgaat 780
caagagtgat ttgttaatgt aagtgtaatg tctttgtgaa aagtgatttt tactgccaaa 840
ttataatgat aattaaaata ttaagaaata acactttcct gactttttta ttattaaaat 900
gcttatcact gtagacagta gctaatctta ttaatgaaaa acaatagaca aacatctgtg 960
cataattttt cagacacaat tctgtaaata tttggaaacc ttttaagtat ttaaactttt 1020
aaatttttga aataaagtat tctaaactaa tataaataag gacaatgaaa aaacatgaaa 1080
ggacttagca taatgttatt ttatcttttc tacaactttg tttaaattac ctttccaaag 1140
atatttgtgt ttatgtaatt ttccacggaa taacattaat actctaggtt tataaaccgg 1200
tttcacatta tttcatttga tcatcacaag agctttgtga agtaagccga gaagttgtta 1260
ctggtattta ataatagcaa tagaggagtt aaagactttc ccacagcttg caggtcaaga 1320
caagaaattc aggtctccta attctcagtg gagctctatt tctgttaacc caaattgctg 1380
ctctgtttta ggtctcaatt tcatctgtaa aatgatacta atagtactta tcccattgga 1440
tttttgttga gatttaaata aatagccaaa agccaataca taataaacac tcaataaaga 1500
ttaaccataa ggagagtcat gatctggttc caggaataca ttgttagatg actgaaaaat 1560
tgtattactt caatgaaaat actataaata ataacatttt catatattag ttggttctca 1620
tgcatacata atctaatttt atttgatcct cacaactgtt taagttttat taaatataca 1680
ttatccctat ttgtataaat agaatcatac aatacctgcc tgctttcatt caacaaaatt 1740
atcatgagat ttttccatgt tgtgtacatc aatagttcat ctattttatt gctcagtaat 1800
attccattgt gtggatgtat cactatttgt ttacacattc accactgata tataagttgc 1860
ttccagtgtg aggctgtttt aaataaagct gctatgaata ttcatgtaag aaaaaaaaaa 1920
aa 1922
<210> 15
<211> 2269
<212> DNA
<213> 智人
<400> 15
cgcagccccg gttcctgccc gcacctctcc ctccacacct ccccgcaagc tgagggagcc 60
ggctccggcc tcggccagcc caggaaggcg ctcccacagc gcagtggtgg gctgaagggc 120
tcctcaagtg ccgccaaagt gggagcccag gcagaggagg cgccgagagc gagggagggc 180
tgtgaggact gccagcacgc tgtcacctct caatagcagc ccaaacagat taagacatgg 240
gaggtgaaag acaacttgag tggttaaatt actgtcatgc aaagcgacta gatggttcag 300
ctgattgcac ctttagaagt tatgtggaac gaggcagcag atcttaagcc ccttgctctg 360
tcacgcaggc tggaatgcag tggtggaatc atggctcact acagccctga cctcctgggc 420
ccagagatgg agtctcgcta ttttgcccag gttggtcttg aacacctggc ttcaagcagt 480
cctcctgctt ttggcttctt gaagtgcttg gattacagta tttcagtttt atgctctgca 540
acaagtttgg ccatgttgga ggacaatcca aaggtcagca agttggctac tggcgattgg 600
atgctcactc tgaagccaaa gtctattact gtgcccgtgg aaatccccag ctcccctctg 660
gattgtcagt ggctgctatg cagcaggtgc agcctggtct ctcactgagt ctctactcca 720
caaaggcaac gactggccaa ggcagtggct ggctctgggt tacacaagtg cagacactca 780
actaagtgag ctggaagacc caggagaagg cggaggctca ggtgcccaca tgatcagcac 840
agccagggta cctgctgaca agcctgtacg catcgccttt agcctcaatg acgcctcaga 900
tgatacaccc cctgaagact ccattccttt ggtctttcca gaattagacc agcagctaca 960
gcccctgccg ccttgtcatg actccgagga atccatggag gtgttcaaac agcactgcca 1020
aatagcagaa gaataccatg aggtcaaaaa ggaaatcacc ctgcttgagc aaaggaagaa 1080
ggagctcatt gccaagttag atcaggcaga aaaggagaag gtggatgctg ctgagctggt 1140
tcgggaattc gaggctctga cggaggagaa tcggacgttg aggttggccc agtctcaatg 1200
tgtggaacaa ctggagaaac ttcgaataca gtatcagaag aggcagggct cgtcctaact 1260
ttaaattttt cagtgtgagc atacgaggct gatgactgcc ctgtgctggc caaaagattt 1320
ttattttaaa tgaatagtga gtcagatcta ttgcttctct gtattaccca catgacaact 1380
gtctataatg agtttactgc ttgccagctt ctagcttgag agaagggata ttttaaatga 1440
gatcattaac gtgaaactat tactagtata tgtttttgga gatcagaatt cttttccaaa 1500
gatatatgtt tttttctttt ttaggaagat atgatcatgc tgtacaacag ggtagaaaat 1560
gataaaaata gactattgac tgacccagct aagaatcgtg ggctgagcag agttaaacca 1620
tgggacaaac ccataacatg ttcaccatag tttcacgtat gtgtattttt aaatttcatg 1680
cctttaatat ttcaaatatg ctcaaattta aactgtcaga aacttctgtg catgtattta 1740
tatttgccag agtataaact tttatactct gatttttatc cttcaatgat tgattatact 1800
aagaataaat ggtcacatat cctaaaagct tcttcatgaa attattagca gaaaccatgt 1860
ttgtaaccaa agcacatttg ccaatgctaa ctggctgttg taataataaa cagataaggc 1920
tgcatttgct tcatgccatg tgacctcaca gtaaacatct ctgcctttgc ctgtgtgtgt 1980
tctgggggag gggggacatg gaaaaatatt gtttggacat tacttgggtg agtgcccatg 2040
aaaacatcag tgaacttgta actattgttt tgttttggat ttaaggagat gttttagatc 2100
agtaacagct aataggaata tgcgagtaaa ttcagaattg aaacaatttc tccttgttct 2160
acctatcacc acattttctc aaattgaact ctttgttata tgtccatttc tattcatgta 2220
acttcttttt cattaaacat ggatcaaaac tgacaaaaaa aaaaaaaaa 2269
<210> 16
<211> 7091
<212> DNA
<213> 智人
<400> 16
gctacccact tccgccccct ccccctgcca ttggaactag ctgagccgaa ctagttgcgg 60
ccaccgagca gccggctctc ggcacctcct cctccgcctc cctgtctcct gttccattcg 120
cctttcctct tctttcctgg cccacgccgc tccgaggcct cgcgaccgcc gagcctgcag 180
cctgccccgc ggccaacatg agcttcttgt tgagttctca gcctgaagtt gactggaact 240
ttcagttaac aagtatttat cgaatacctg atctgtagtg ttggacttag acctatggaa 300
ggagctactg atgtgaatga aagtggtagt cgctcttcta aaacttttaa accaaagaag 360
aacattccag agggttctca ccagtatgag ctcttaaaac acgcagaagc cacacttggc 420
agtggcaacc ttcggatggc tgtcatgctt cctgaagggg aagatctcaa tgaatgggtt 480
gcagttaaca ctgtggattt cttcaatcag atcaacatgc tttatggaac tatcacagac 540
ttctgtacag aagagagttg tccagtgatg tcagctggcc caaaatatga gtatcattgg 600
gcagatggaa cgaacataaa gaaacctatt aagtgctctg caccaaagta tattgattac 660
ttgatgactt gggttcagga ccagttggat gatgagacgt tatttccatc aaaaattggt 720
gtcccgttcc caaagaattt catgtctgtg gcaaaaacta tactcaaacg cctctttagg 780
gtttatgctc acatttatca tcagcatttt gaccctgtga tccagcttca ggaggaagca 840
catctaaata catctttcaa gcactttatt ttttttgtcc aggaattcaa ccttattgat 900
agaagagaac ttgcaccact ccaagaactg attgaaaaac tcacctcaaa agacagataa 960
aaggatgcag agctgtgcaa attgttcctc aaatgaagca gtgtggagtg tattggggat 1020
tttgttatat tttgttttta tctggattgt ttttgtccta ggtttggggg cgggggcttg 1080
tttgggttcc tttttcttta ttctgattat gtgaaaccat attctattgc taggggaagc 1140
caagaaccat tctctataca cttgataagg gtaaatttat cttagtgttt ttaaacttgg 1200
ttttggttac ttgaggagtt ttttaataat attgtgtgct gcaagaaagt gcttgttgat 1260
tgaactgccg atggattggt ttctgtgtgg tataaattgt ggcccattta tgaagtcccc 1320
aaaagagtta tgtttttaag tgccttggca ggctcacttc tgaggtgcaa aacatagata 1380
tagaactgaa cagggcttga aacaatatta ggattactac ccagggcact tactggtgca 1440
tgttgtaaca tatctatgat aaaagccata gtttacctaa aatggtgatt tccagccttt 1500
actgctttga agaaacagaa tttgtaaagg tatgcatgta gaacataaaa aatatttctt 1560
aattattttt tatattgatg gtaatatatt acgttcaaca atgcttaaag ctctacaagc 1620
aggtcttttc ccacctcttg atatctgtga tactgaaact tgaggatgtt gaaatgtatt 1680
acattttggc ttctttctac atgttaactg cactgtagat gtaaaaattc aggttatata 1740
taggattgcc atcttcagag gtgatgctga actgtgaggt ttcctagtaa ttgccaaatg 1800
agccgtaagt ctgcagaatt cccttctact ttgaagagaa ggggatagga atgtatattt 1860
ggctgggggc atggagatgt tcgtatgtat gaggagttag ggatggggag tcaagttcta 1920
gaaagttttg tctgaaaacc tttgaataga atggcatgaa gattttaatc aattacttat 1980
aaacaaagtc ttagagactt ccttttagga atcaacttcc atgagaagtt aaaaataaat 2040
tattaatttt aggtacagac attaaacatg gaatttaagg actgttgggg gaaattgatc 2100
acttcttagc atttccattc agtgaatgga gctgatgttt gcctgtcatt ttaagatgat 2160
accatacctt ctttggttat tataggtcca gtttgaagca ttctgacttc tggtttttcc 2220
accctgaaag gaaatgtttt tctttgcagc agtattagat aatgaaaaat gctaattcag 2280
tagttattaa cttctaaatt ttattcgcca tgactttcta gtgaattatt accataaata 2340
acaatttcag aaacttagtt tttagaataa atattaattt ttccacttca gttttattct 2400
agaaaatacc ctttttagaa atccagtttt agttttgtca ttttcgataa atctttcttc 2460
agttagaaat atatatcctt ccttcagttg aaacatatac ctttttcaca tctaggaaga 2520
aatgcttgct ctgaaatagt atagattaaa aacactcagt agaaaagaat ctaaaattaa 2580
atgaatttgt tttgccatta aagtagagca gtgatacaat ttaatgccat tacaattatg 2640
ttgactagaa actgcctttt tctccacttc atttctagca attatttacc aagtaccaac 2700
agtagaagta acaggaaagc ctggcagagt taaatatctt ggacatttat tggtaaagct 2760
tatttataaa ctgcagtcag agctagttaa tttccttaaa tctttttgta ttcagataga 2820
taatatgaat cattatgggt tgattcagaa ataaaatttg tgaggtgatt ttgaatcttg 2880
tccatatagg aaaatgaagc acagaattac tcagtcttcc atattgtatt tgacttcata 2940
tcaatctagt aaaaaaggag ttgcaatagc caagtataga gagaatagtg aaaaattaat 3000
cttgcccttt caagccttat acagtagtac actgtacttg tttttagtag taagacctac 3060
tttcccacta tatgtagata gtttgttttc actgtgccag aatctcaggt gcctgcttag 3120
agtatttctt taatcacagt cactgggaag taaggagatg tatatatgtg tatatatggt 3180
aacaaagcat agcagttctc taggggagag gcctggcatt gcacatggtg ttacatggct 3240
acaagtaagg aaaaaatcag aaagtgaaag aactgatgta ataaaaggtt gatttggttg 3300
gttcccatga aagttagtaa gatgcccttt taaatataag gatcagtgct ttgttctgca 3360
gcagagtttg ctgataaatg tctgttggat tctttttgga tttctttaat taatttgtaa 3420
gtaaccaaga taattatttt cccccttgct ctctatatta atacgtagct ataaagcaac 3480
agttggtttt cttatccttt gataaaagca tcccataaaa tataaagtag taagttaaca 3540
tagtattatt gtcacacaca atgctttttt tggttaaatg ttgatacgaa gcaatgtttt 3600
ggaattactt taattgatgg agtagtggtg gtagagagaa attaataaca aaaagagtga 3660
aaatatttta attagcagta gatggtgcta ctggctttca tttgctgact tgattattcc 3720
ctttctctta aaaaccatgg cattagactg cactaaatta acaagcatgt tagttgctgg 3780
tagaggtttt ggaggttaat ttaccttaaa ttggaagact tttaattgca gtctctttct 3840
accttccctc tgttagtcat ttgtaaattc taaatggtca ccataaaatg tattaggtag 3900
gagaagatac gttttatgta taatatatct cagactgagt tactgcctgt cttatcagga 3960
tggataaaac actacagtct cttatcagga aatagagatg atgtggatat ttatatatta 4020
catatataac caccagactc cattttatat attagcattt tccttgctta tgggaaaata 4080
gcaaaacaac atttcattta tacttttgtt tacccctctc tgagacaggt tttgataacc 4140
actgaaatgg tagaatatgt gagatacaaa tattgagttg tagaactttc tttttaaggt 4200
gaataagtca tgccttaaca tccaaataag agttcatctt cagagtggtt cttttgggag 4260
cactgtttat tccagctata ctgcaaaagt ataatgtttt tggaactgtt ctagagcata 4320
ccatgaaaag cagtttgtta ttatgcagga aaatcagttt catcatttta gttacactaa 4380
acacttttgg cagcttaata tgaccttttt aaattttttt tatttttttt atttttattt 4440
ctttaagatg gagtcttgct ctgttgcccg ggctggagta caatggcatg atctcagctc 4500
actgcaacct ccacctcctg ggttcaagca tttctcctgc ctcagcctcc caagtagctg 4560
ggattacagg cagcaccaca cctggctaat tttcatattt ttagtagaga tggggtttca 4620
acatattggc caggctggtc tcaaactcct gacctcaagt gatccgccct ccccagcctc 4680
ccaaagtgct gggattacag gtgtgagcca ccacagccag ccagtatgac ctatcttaat 4740
catcagctca actgtaattt aaatttggct gttctctgga gctaaaccat tagggaagtt 4800
caaaggaatg tgccatgatt tccgaatttg cacaagagaa tgttttaagc attggtagca 4860
taattgaata aaagaatagt ttcctgatgt cactattttg aagtggaaat tatcacttgg 4920
atgtggaggt tttacttttt aaaaacattc agcttaatta ccttacctta attaccttag 4980
ttagatatac taatggaaaa aaaccaagtc ctttctctag aacttgtttt ctatttttgt 5040
tccttttcat gaaaacttct caatttaatt ttaactactg taggatagta ttgattgaat 5100
ggatactatg gaaaagtgga tccaatattt aagatagaag tagtttaagg agacaacagc 5160
ctttactgcc attttttttt aaatgttttc actcagatga acaatttgac tttaataaaa 5220
gactggagat ttttgtacaa agaaatagga ataagtttca tatactaatt atgctgagtt 5280
ttaagcctac atatcacaaa atatttagaa ttgtataacc ttttcatata tttataactt 5340
ttaatgtctt tttaaaagat gtgggaccaa aaatatattt ataatttgga aatgtgactg 5400
cataccaata agaaaactta ccttattttg aaatttatct gggatattaa agaatctacc 5460
aattcttaaa aacacagatt tatactttaa gcttatttta aaattaaaga atatatacca 5520
attcttagaa acactttaag gactactctt aaataactta aatatcagag ttttgttgta 5580
atattaaaat ttaccgtgga aatcactgtt gttcagctat caccttaatt gtgtatgata 5640
tgataaatgt ttagcagtaa agctatctta agatttaatg gaaaagttta atttgaagat 5700
gtaacaaaaa ttctgaccac agttgattct gaatttttaa ggctttccta ataggctgat 5760
cacagagaat aatccatttt gaaggtataa aactgcactg tatgtctgtc acttgtagct 5820
gaactgattc acattttgac aaaagagaga aaatacaaaa atgagttttg caaatgtaat 5880
aactttttct gcatatagaa ctaaataatt gaaaaatatg ggctatagtt ctcaaaggta 5940
gatagtaaaa tcactggctt tttccagctg tatgtttttc cactgtgcgt gtacacacac 6000
actggaaaat aattaggctg attttgcagg tcttcattgt tagagattct gaagtattta 6060
ctgtcaattc ataggtttca gtttatttag gaaattagtg tttgacagct ttttttaaat 6120
tatttcactg aagctgagat tattagtgat acaaagttaa aatttcaata tttaatttct 6180
ctatatatta ttaatattaa attgtttttt acttataaat tcatgttctc atctgattta 6240
atattaaatt tgtataggtg ggcgtttctt accattttgc acaagttttt gtttttctga 6300
aatacttaat tgtgcaggtt gtaaaaaaga ttagtgcatt ttcattttaa ggatgctttg 6360
ctccttaaat tgttcgacag aaatgacttt ttagggaaag tagttttttt ggagctacta 6420
acttgtattt attattgtac atgcataacc agggtggtga gggcactaat cttgtaggaa 6480
acacttactt gatgttttat ttgaactttt cctataggtt taacttttac tgcatagaat 6540
taacactagg aacagtgtca tgaaatctgg gttgaaggag aatacagtat atatgagaac 6600
acttaaagtt caaatagaaa tcatttctga agacaaaagc agaggaatat tgtcagtgcc 6660
aagtaatgga agaataaggg cggcatttac actgtgcaag tattgagaag agtgcataaa 6720
gacagggaac tactctcatg gagacagttt ctctcttata atcaagtaac tagaagggga 6780
aaaatcatct aagttatgaa atccaacata ggcgctatat tacaaactgt gccggattat 6840
gcaaattgta gttgttactg atcaaagttt aattgcttca tttttgttta aaaagggata 6900
ctgatgtcag aaaatctgta atatgtttta ttcaaaagat gtaaataatg tatacagact 6960
tgtatgtgat gggatgggaa atatttaaat tctaggtgtt tttttttttt taaagaagaa 7020
actcaatgtt tataagaaaa aaatgaataa atagttacgt ttggccatga atcctgaaaa 7080
aaaaaaaaaa a 7091
<210> 17
<211> 7003
<212> DNA
<213> 智人
<400> 17
actcgcagtc ctgacgggca ggggctgcgg accgcccggc cttggaccca tccggagcca 60
caggttggag gagataagta gctgtccccg tgctcatcgc cctgtggagc agatcctgtc 120
tccttgctga cggtggagcc cgggagttcc agggcttggg aaggggaagg aaacctctct 180
gaaatctgac acctgctctc ccggcaagga aacttcgcag gctgaccgac caagaccatc 240
actatgaccg atggagacta tgattatctg atcaaactcc tggccctcgg ggattcaggg 300
gtggggaaga caacatttct ttatagatac acagataata aattcaatcc caaattcatc 360
actacagtag gaatagactt tcgggaaaaa cgtgtggttt ataatgcaca aggaccgaat 420
ggatcttcag ggaaagcatt taaagtgcat cttcagcttt gggacactgc gggacaagag 480
cggttccgga gtctcaccac tgcatttttc agagacgcca tgggcttctt attaatgttt 540
gacctcacca gtcaacagag cttcttaaat gtcagaaact ggatgagcca actgcaagca 600
aatgcttatt gtgaaaatcc agatatagta ttaattggca acaaggcaga cctaccagat 660
cagagggaag tcaatgaacg gcaagctcgg gaactggctg acaaatatgg cataccatat 720
tttgaaacaa gtgcagcaac tggacagaat gtggagaaag ctgtagaaac ccttttggac 780
ttaatcatga agcgaatgga acagtgtgtg gagaagacac aaatccctga tactgtcaat 840
ggtggaaatt ctggaaactt ggatggggaa aagccaccag agaagaaatg tatctgctag 900
actctacata gaaactgaac atcaagaacc ccaccaaaat attactttta aaaacaatga 960
caaaccacac aattgttgtt gagtaaacca cgcacaatgg catgtctttc tttttctgcc 1020
agaaaatcta ttttaagaaa ccagaatagt caacagtgtt caaaagaatt gactagttat 1080
ccctgaggcc ctttcaaaca tgatcaaaga tttcccaatg tgatctcatc atcatggata 1140
ctcaatttgt tttttcttat agagaaaatg agtatataag acaatataca agaagaaata 1200
tcagtgagtt ttaaatcaga acaagttacc tgtcacattg aagaaaaggg taggcactaa 1260
agggagaaca cagaaagaag aatttctaaa atattggatt tacttcttat attgagtcag 1320
atgcatactt ttagatttgc attggggaaa atgtactagc taaaaatgga tacacaatga 1380
agaattctat ttggctaatt aagaatgata tactatgtac acccaataag ctgtactaga 1440
atgaataaat tactgataag gttacaaata ggtaaatgtc acacttctgt taaaatgcag 1500
gaggtagtgt cataatgccg tctttatatt cttaataaat agcactttga caagaacagg 1560
actgtaaatg atgaagtaca agacaaatac cctgggaaaa aaaatgaaag tatgagaaat 1620
tggcatttct acagctgaaa ttcaatgtat ctgttagaga tgtctggaag ggttacttag 1680
ccaaatttta ctcaagccaa ttaggagctg atattatcag ttggaattaa gagaactcca 1740
gaggtttcca tttcaaacaa aattttagaa attggtttgg tgttcagctt cacatttcat 1800
tttttcttag cacatgttga taaaatagtc acaaggagaa attaccagtt acggtttatt 1860
aaatctcttt taaaatgcag tcaaggaaaa ctagccttga atttttttta gataaaataa 1920
gatggtgata tgaaacaaaa agtggcaatt attgcaggtt tccttttagt ttacaaaagt 1980
actggaaact aaatcatatt tcttccctcc aaatttcacc cattcctgac tttgaatcaa 2040
ttgcagaaat gcaggtgtgt tactttgttg atcaataact ttggaacaat tatggatcaa 2100
ttctatggtc actctgaatt ttcatgtcat taatcacata aaaattgata atacctcatt 2160
ctgtattaca atatgatttt attttgccaa aggcaagaca cctatagttg agctgtattt 2220
tgggggattg ggtgaggaag gacttctgat cttatctcaa caaaaaactg gccagtattt 2280
ttgttaatgt aaagcttcct tttctttcta aaaaatagta acaaaattat ttttcattgg 2340
cctattctgt tcttgtgtct aaactaacat tacattaatt tttaatctta gtttctgata 2400
aacacaagcc attcctatca aaatattatt tatttcagtc aattttacca aataacaaag 2460
acaatatatt ttcgtttttt tttattatga gcatatgatt ttttgacagg ctgtttcctc 2520
gtcgtataga ttttttccaa tcaaacctac tttttccata ctctgtgcat attttttgtg 2580
aagttataca cattgaagac cctaaaaatc ccagtccatc attcagctta cctctgcgaa 2640
cttctatctg gtattgaatc agtttcagaa acacagacag atccaaggaa atgtctcttt 2700
ataatgttct taggatggac tagacccata aatgtgccat gaatcaaaat attaataatt 2760
tgaaagcttt catgctgtta gcccctgatg aaattctcag cattaactgg ccagctcctc 2820
tgatttctgc agcatcgcaa caggttcgaa gatgggttgt ggctgggtat tccctcccat 2880
ggtgtttcct ctgggatgct cttcattatc tcaatgcctg tgccatgaag atagaaaact 2940
gtaagctaac atttaagatg tttcttctgg aaggaaagtg agcaggaaca agttatattg 3000
ccactgctgt ggcaaatttt ggtgaacttt tggggtcatt atatcaattt tttctttgga 3060
ttcaaattgt aatgtcccct gcatttcctt aatagggaat gtgaaacctt tataaaactc 3120
taaaagtatt ctgttttgat atgtcttttt gtttctattc attttcagtt atatgattga 3180
tttacttatg ccaagattct gtcactgtca gttatttaat gagtgttttt tcagggtctg 3240
ttttaagatc attatttgat agctgtagca tgaagcagag gttgatgatg cccataattg 3300
caagactatt cctgtaaaaa taacaattat tgggtaataa cttcaagagg aatgagaagt 3360
gacaaaattg atttaaaata ttgttctact tataaataaa tgcttgatat aaaaaatttt 3420
ctccataaag tttgacatct gaccccagat tctatgtaat cattattaga aattccttct 3480
ctcattattt caggattagt agttctgtgt aattcatttt acaatttcaa attgttctgg 3540
tgccataaag tatacagact actttaaaga tttccaaatc ccctaattta ccccacaaca 3600
gcatgtaatt ttagccaaga tatgtcctgt tactaagtat ctcccaatgc tttagtaaaa 3660
cgtatttagg agaaatgttg aaaatgtaca tgaagctcct ttctgatata gaaaccattt 3720
ctggagtatt tacactggtt tgatgtttac attgctctaa ctcggtgcct cagatacctc 3780
tgtgaccaaa tttgtctcca accacatagc tcatttccta taatgttata tcataggaag 3840
ccctcacaga gacactaaca cagctaaaga tcttctgata ttatcagcaa gggatgcaag 3900
gactttattg gaatctggag agtttaactg ccttctcttg gtctcctcac ttacttctta 3960
tgaagttggc attacctgag actcttagct gtgattaggt acaagcttac cttttagggt 4020
agaaaaagaa agatcatttg aaaaatgtat ctaaaataat ccagagaaca taatgtttgt 4080
cttggtctga taatgataag aagtcaagga ttggcagaga aaatactaaa cgccaagagt 4140
tgagcctgtg ggtctctcca taagagtttt aaaactcttg ccagttacca ctttatccaa 4200
tttgctatca ttttcgtatt atcagctatc gccctgtaaa atattcaaaa ctagctattt 4260
ctaaagtaaa cattttatct gttactttta accagatagg tgtctttgtc atccttctac 4320
tataaattgt tctttgccaa cctgtacagg tagatgaacc aggcgagagt tttaatcagc 4380
cttttcttgt cccctttgta agaaagagat gcttgccata gagaaggaca tgagtacatt 4440
aaaaataatt taatagccac aatatgatgt tctttaagct gcaaattgag tacactggga 4500
atcaacaaat ttgatgaagc ctgtctgtct cttcaccagt ggagtgagtg cagcagttag 4560
aaagagaagc aatattgtgc aactggtgca gtggtgagtt aatcatagtg tataaccttg 4620
tgttcatgaa acaggttgtt cattgttctg catctctctt catttaaaaa ggatacacaa 4680
ttctttcctc attgcatatt acaccaaacg tttgagggaa aaatcctcat tcgtaaagga 4740
ttttggatgt ataatctaaa actcaacaat aaagaaataa tattccaagt ctctggtttc 4800
ctaagataca taataactgt ttataaagaa ggtctaagag ctgatatttg ccaaagtgat 4860
agaagagttg ttttttcctc tctactacca agctttaaga cattaaaaga agtctagtgt 4920
atttgaatat tttagagaaa gctttatcat tttttaagat gccaagatgc tgcctacgtt 4980
tgcaaaagtt gtctaagaat tcaccatgag ctatattttc ttctggatct ttgaccaagg 5040
tgatgtcagc ttatttctgg ggaaggtgtt gagctcttat acatgaaaat ggatataggc 5100
tattctctgg gatgagtgtc atttcaatgc tttataaatc catgaagctg cttgtctcat 5160
aaagtagaac tgatacaaat tttggttgga tatatagaga attttataaa tgtattgcct 5220
tagaatttct gggtggagac ccaactacaa tgacattgtc atgccagaac tataaagata 5280
attagagtta aaagttgttt aaattgtgcc cttaaataca gcagaacctg gagaaggtca 5340
tacttcaaag gtcgattttg agtccgaata aagaaagacc tagtaacaga tagttttttt 5400
ttgttcattt tcttctacca agtagaggtt tatgccctca gaactaaact agtaaaaata 5460
tctgaacaaa aaacctttcg ttgttggcat aaaaatgtga tacacttaga gacattttgt 5520
ttattgcata taaatctaat ttttccataa attagattta tgatattttc ataaagcact 5580
tgattagttt ttcaaggcgt accatcacaa agatgctttc ctgcagagtt ctttgtatca 5640
acagcctatg gttgagatgt tttctcattt cctgtagaga gagaatacca ctaacaaaca 5700
aacaaaaact ttagtgccaa aatagtggaa ctattttgtc atcttttgag aaaaaaatat 5760
acaaagaagt catcttttca ttaagtggat tccctggttc ctttccagct ggttgtggaa 5820
gtaatggcta acatccttca gctgactttg tctacaagga ttattagcaa attctgtagg 5880
agcaagcatg tctgacctta acttaatgga tcccttattc aatcagtggc ttctgtcttt 5940
atgtctgttg gcatatcaaa atggtttctg ttcctagaaa agtaataaca tatgcttatc 6000
tttattcttt ttccaggtga ttttgttttc aaatgctcct tgtgaaaaca cctagtgttg 6060
tagaaaggaa agtggccaga aagaacaact tgggaccatg agtaggtcat taaatagctt 6120
agtgatttat cctcatatag ggcttataaa ccctgtatgt gtttatatgt gcttcacaga 6180
gttcgtgtca ggctcaaagg agatatgtat aagaaagtgg tttgtaaatt atgttccatt 6240
tcataaatag acactattca caaactaaaa tctaataaaa aaccacagtt gtaatttaaa 6300
ctgcttgata taaaaagagg tatcatagca gggaaaacac actaattttc atacagtaga 6360
ggtattgaaa actgaaaatg ggaaggcaac ttgaagtcat tgtatttgat tgaaaatgtt 6420
taatacatct cattattgac aaaatatgtc atcttgtatt tatttcaagg aaaccaatga 6480
attctaggta gtatattaca agttggtcaa aatattccat gtacaaatag ggcttctgtg 6540
tccatagcct tgtaagagat actgattgta tctgaaatta ttttttaaaa aaataaatta 6600
tcctgcttta gttagtgtgt taaaagtaga cgatgttcta atataacact gaagtgcttc 6660
attgtatccc aacagtttac cttcaagtaa tattatcttt atttttaggc taagcacgtt 6720
tgattatttt gtctgtctcc tatatagatc tgttttgtct agtgctatga atgtaactta 6780
aaactataaa cttgaagttt ttattctata tgccccttaa tagactgtgg ttcctgacgc 6840
acactgttag gtcattattt tgttgtacca aagttctagt ggcttcagaa atcatagcat 6900
ccaatgattt tttggtgtct ggctatgaat actatggttg agaattgtat tcagtgattg 6960
tttctgcaca cttttcaaat aaaaaatgaa tttttatcaa tta 7003
<210> 18
<211> 2158
<212> DNA
<213> 智人
<400> 18
agttctgcat ttctgcagag acagaaagaa acgcagctct tgacttcttt tttgtaaaca 60
ttactgtaag agttgtgata actttttatt ctactatgta tatgtatgga atagtattaa 120
taaatgaact agggaaggat gtaataaatt agacatctct tcattttaga gagaagatgg 180
aaacaacatt gcttttcttt tctcaaataa atatgtgtga atcaaaagaa aaaacttttt 240
tcaagttaat acatggttca ggaaaagaag aaacaagcaa agaagccaaa atcagagcta 300
aggaaaaaag aaatagacta agtcttcttg tgcagaaacc tgagtttcat gaagacaccc 360
gctccagtag atctgggcac ttggccaaag aaacaagagt ctcccctgaa gaggcagtga 420
aatggggtga atcatttgac aaactgcttt cccatagaga tggactagag gcttttacca 480
gatttcttaa aactgaattc agtgaagaaa atattgaatt ttggatagcc tgtgaagatt 540
tcaagaaaag caagggacct caacaaattc accttaaagc aaaagcaata tatgagaaat 600
ttatacagac tgatgcccca aaagaggtta accttgattt tcacacaaaa gaagtcatta 660
caaacagcat cactcaacct accctccaca gttttgatgc tgcacaaagc agagtgtatc 720
agctcatgga acaagacagt tatacacgtt ttctgaaatc tgacatctat ttagacttga 780
tggaaggaag acctcagaga ccaacaaatc ttaggagacg atcacgctca tttacctgca 840
atgaattcca agatgtacaa tcagatgttg ccatttggtt ataaagaaaa ttgattttgc 900
tcatttttat gacaaactta tacatctgct tctaacatat cgcatgttta tgttaagatt 960
tggtcccatc ctttaaactg aaatatgtca tgtgaaatta ttttaaaaat gtaaaaacaa 1020
aactttctgc taacaaaata catacagtat ctgccagtat attctgtaaa accttctatt 1080
tgatgtcatt ccatttataa tcagaaaaaa aacttatttc ttaatcaaaa ggcagtacaa 1140
aaaaagtaat aatgttttat aagattgtag agttaagtaa aagttaagct tttgcaaagt 1200
tgtcaaaagt tcaaacaaaa gtctagttgg gattttttac caaagcagca taatatgtgt 1260
tatataaaca taataatact cagatatcca aatgttcaga tagcattttt cataatgaat 1320
gttctctttt ttttggtaat agtgtagaag tgatctggtt cttacaatgg gagatgaaga 1380
acatttatta ttgggttact actaaccctg tcccaagaat agtaatatca cctctagtta 1440
taagccagca acaggaactt ttgtgaagac acattcatct ctacagaact tcagattaaa 1500
tataatctag attaatgact gagaataaga tccacatttg aactcattcc taagtgaaca 1560
tggacgtacc cagttataca aagtacttct gttggtcaca gaaacatgac cagattttgc 1620
atatctccag gtagggaact aagtagacta ccttatcacc ggctaagaaa acttgctact 1680
aaactattag gccatcaatg gcttgaataa aaaccagaga aggtttttcc caggacgtct 1740
catgtttggc cctttagaat tggggtagaa atcagaaatg agatgagggg aagaagcaag 1800
gagtctaagg ccctagcgat ttgggcatct gccacattgg ttcatattca gaaagtgtta 1860
tctcattgat tatattcttg ttaagcaaat ctccttaagt aattattatt caaataagat 1920
tatactcata catctatatg tcactgtttt aaagagatat ttaattttta atgtgtgtta 1980
catggtctgt aaatatttgt atttaaaaat gccatgcatt aggctttgga aatttaatgt 2040
tagttgaaat gtaaaatgtg aaaactttag atcatttgta gtaataaata tttttaactt 2100
cattcataca gttaagttta tctgacaata aaagctctga ctgaaaaaaa aaaaaaaa 2158
<210> 19
<211> 5852
<212> DNA
<213> 智人
<400> 19
ttttgccgga tgttgttgta tgtccgagag acacgtgagg ttctgctacg tcattaccag 60
gcacgcgcag gaaacatggc ggcggcgggt gttgtgagcg ggaaggtttt tggtttcttc 120
ttgattcaat cttgataagt agtatgtgtc caggacttta tccatactcc agtttgttgg 180
agtatggtag gagtatgatt atatatgaac aagaaggagt atatattcac tcatcttgtg 240
gaaagaccaa tgaccaagac ggcttgattt caggaatatt acgtgtttta gaaaaggatg 300
ccgaagtaat agtggactgg agaccattgg atgatgcatt agattcctct agtattctct 360
atgctagaaa ggactccagt tcagttgtag aatggactca ggccccaaaa gaaagaggtc 420
atcgaggatc agaacatctg aacagttacg aagcagaatg ggacatggtt aatacagttt 480
catttaaaag gaaaccacat accaatggag atgctccaag tcatagaaat gggaaaagca 540
aatggtcatt cctgttcagt ttgacagacc tgaaatcaat caagcaaaac aaagagggta 600
tgggctggtc ctatttggta ttctgtctaa aggatgacgt cgttctccct gctctacact 660
ttcatcaagg agatagcaaa ctactgattg aatctcttga aaaatatgtg gtattgtgtg 720
aatctccaca ggataaaaga acacttcttg tgaattgtca gaataagagt ctttcacagt 780
cttttgaaaa tcttcttgat gagccagcat atggtttaat acaaaaaatt aaaaaggacc 840
cttatacggc aactatgata ggattttcca aagtcacaaa ctacattttt gacagtttga 900
gaggcagcga tccctctaca catcaacgac caccttcaga aatggcagat tttcttagtg 960
atgctattcc aggtctaaag ataaatcaac aagaagaacc aggatttgaa gtcatcacaa 1020
gaattgattt gggggaacgc cctgttgttc aaaggagaga accggtatca ctggaagaat 1080
ggactaagaa cattgattct gaaggaagaa ttttaaatgt agataatatg aagcagatga 1140
tatttagagg gggacttagt catgcattga gaaagcaagc atggaaattt cttctgggtt 1200
attttccctg ggacagtacc aaggaggaaa gaacccaatt acaaaagcaa aaaactgatg 1260
aatacttcag aatgaaactg cagtggaaat ccatcagcca ggaacaagag aaaagaaatt 1320
cgaggttaag agattataga agtcttatcg aaaaagatgt taacagaaca gatcgaacaa 1380
acaagtttta tgaaggccaa gataatccag ggttgatttt acttcatgac attttgatga 1440
cctactgtat gtatgatttt gatttaggat atgttcaagg aatgagtgat ttactttccc 1500
ctcttttata tgtgatggaa aatgaagtgg atgccttttg gtgctttgcc tcttacatgg 1560
accaaatgca tcagaatttt gaagaacaaa tgcaaggcat gaagacccag ctaattcagc 1620
tgagtacctt acttcgattg ttagacagtg gattttgcag ttacttagaa tctcaggact 1680
ctggatacct ttatttttgc ttcaggtggc ttttaatcag attcaaaagg gaatttagtt 1740
ttctagatat tcttcgatta tgggaggtaa tgtggaccga actaccatgt acaaatttcc 1800
atcttcttct ctgttgtgct attctggaat cagaaaagca gcaaataatg gaaaagcatt 1860
atggcttcaa tgaaatactt aagcatatca atgaattgtc catgaaaatt gatgtggaag 1920
atatactctg caaggcagaa gcaatttctc tacagatggt aaaatgcaag gaattgccac 1980
aagcagtctg tgagatcctt gggcttcaag gcagtgaagt tacaacacca gattcagacg 2040
ttggtgaaga cgaaaatgtt gtcatgactc cttgtcctac atctgcattt caaagtaatg 2100
ccttgcctac actctctgcc agtggagcca gaaatgacag cccaacacag ataccagtgt 2160
cctcagatgt ctgcagatta acacctgcat gatcactgtt cttgcttttt tgggaagaga 2220
cactttgttg caaccctttt tcaagtactt gaaagttgaa aatttgaaat cttggtattg 2280
atcatgcttt aaggtttatg taaagaaagt gtactgatgt tcttacatta aagctttaca 2340
aagatttaaa ctaattattt ttgtagttac ttctaccaaa tagcctttcc ttttcgataa 2400
cattcctcag tatttttata gccaagtaca ttttattttc ttgctgatga actggaattg 2460
gataaatatt gcaagtggat gagttggaaa ttatgcactt tgaaaaacat tcactttgtt 2520
taagcttatt gggtttcaga tttgattaaa ttaaatgtgg aggctttcta tagcattcta 2580
agctgagaag tagattgtta cccagtaatg aaataaaaaa taaaaataaa aggatttttt 2640
tctctattgt ttacgacagt actcagctta aatatttatg ctggtcaaat gtgatttaaa 2700
ttggacattt tcatcaatgc agtctaatgt gtagataaat atttcaacca taataagtgg 2760
attggcagta tattttttac attgaacttt tcttcacttg tatataaaga ttatatataa 2820
gtacttattt atgagtataa gaaaggttag gcatattttc attaactgaa taaacgactt 2880
gatttatata acctggttta tcaaaattta acatggcttc agtatgagat ctttttcaaa 2940
actattttct taaacattta tttcatgaga ttatgttcaa ccctgtacct ggtgtaattt 3000
taaaattaat tgcttgtaac ctcactttac taataatgtt tattatcttt cctaataatg 3060
cattaactga ttaatcaggt gtttaaattt ttataaaata ctcttgcaaa aagtttattt 3120
gaaaaatttc tagatggtct catgagtttc aaaataataa tttttgtgta tgaacaaagc 3180
tgttgttttt accatgcagt attgcatgat tttaagttat gtggaattaa cataactgat 3240
tttgttttaa ttgtaagttg ttaactcctg tatatatcat taaaataaat ctgaagttga 3300
agtagtgttt ttagttaaat tatacttaga aatagtctgc ttttttaaaa ttttttttct 3360
tgagaaagag tcttgctctg ttgcccaggc tggagtgcag tggcgcagtc ctggctcact 3420
gcagcctccg ccttctgggt tcaagcgatt ctcctgtctc agcctcccga gcagctggga 3480
ctacaggctt gtgccatcgc gcctgactaa tttttgtatt ttgagtagag atggggtttc 3540
accatgttgg ccaggctggt ctcgaactct tgacctcaag tgatccactc gcttcagcct 3600
cccaaagtgc tgagattaca ggtgtgagcc actgtgcccg gctaattctt taatagaaga 3660
aaaaacatcc aagatggacc tcaattcatc tcttattttt atatgattaa aatgataatc 3720
tggccgggcg cggtggctca cgcctgtaat cccagcactt tgggaggccg aggcgggcgg 3780
atcacgaggt caggagatcg agaccatccc ggctaaaacg gtgaaacccc gtctctacta 3840
aaaatacaaa aaattagccg ggcgtagtgg cgggcgcctg tagtcccagc tacttgggag 3900
gctgaggcag gagaatggcg tgaacccggg aggcggagct tgcagtgagc cgagatcccg 3960
ccactgcact ccagcctggg cgacagagcg agactccgtc tcaaaaaaaa aaaaaaaaaa 4020
atgataatct gaataagtta tggaaatgaa aaccatcctt tttataactg aaaaaaaatt 4080
ttcattagca tggaaatggg cacagtgttg ccttgaaaga tacagttatt tgactcagta 4140
aagcagctta ttacaactga tgctaatagt atagagaaaa aagttgtgca gttctaaaat 4200
ggtcctagag attgactttt ttcccccaag aaagttaggg aacaaaacga acttttttcc 4260
tggttgagca ttaactgaca atcacgacag tagaaccgtt agagtttagt ttttaatatt 4320
atgtgtgtta tctttcatca gttaataatg agtaagccta ttcagaaaaa gaacataaac 4380
tgatcaaaaa ctcagcatct ccagcctttc atttcctgct attcaggaaa ttgcttagaa 4440
catcttgatg tcctccttgt tcttcctgga cagtgacttt ttgggagttt gttcctgctg 4500
cgtaatgtga tacccacttc agattttttt tttatcaata catttagtaa gttgaacttc 4560
tgtcaagttt tattacaaaa ttacttgtta aaacaatttt tactaaactg catttctatc 4620
tagcatattt ttgatatgga agtgatagta tagtatagtt ccaggagaag tcttaaatca 4680
gtccacagag tccagttagc aaatactctg tgccattaag attgctaaaa tacacagttc 4740
aggtaaattt actagtgttt tttaaaggtt tatttgtttt cacaagatgc tctgtccaca 4800
cccttataac atgtaaaata ttgtgtgctg tattatgtgg taaagttgtt aaaattcagt 4860
ttctaacatt aacttaaaag tacagacaat ctaacatgat gatttgactt acaaactttc 4920
aactaaattt atgatggctt taaagcagtg cactgaatag aaaccatact ttgagtaccc 4980
atacagccat ttttcacttt tactacaata ttctataaat cacatgagat atttaacact 5040
ttattataaa ataggctttg tgttagatga ttttgcccaa atgtaaacta atgtagtgtt 5100
ctgagcatgt ttaagttagg gtaggctaaa ctatgtttgg taggttagat gtattaaaag 5160
catttttgat taatgatgtc ttcaatttat gatgtgttta ttggaacata acctcaatat 5220
aagttgaaaa gcatatgtat tttcaattct ggcatgaacc tatgggaatc ttttgcattt 5280
aagaacctcc ccattttaat aatttcatgg gtctaagatt cttcatctgt ttataaggaa 5340
ctttagtctt agtgattaga gactaaattt ttttttgagc agtaagaaaa cagccttttg 5400
ggacagatag tgagtgattc ttaggaactt gacattgcca agaaatttta tagatgccga 5460
agaattctta tgtgaaattc acataagcat gcccattact aaagacagtt tgtataaagt 5520
aaccctaaat gtttattgag gaacctacag cttcaactga cttacgtgca gatatgtacc 5580
aggagaacat cattttagct tgggcgtctt tacttggggt tttcagagga tccaggaacc 5640
tcactgtatg caaagtcttg tggatgtacc tgaatgtttt tggaggcagg tcacatagtt 5700
tctgaaagtg ttctcttatt ttcctcaaat gtaggtaacc attgttacaa gttatttaac 5760
aggagaatag taacaatgtc taacttatgc taatgatttt gtgtgctgag ctcccattaa 5820
ttaaaatgtc ttcagaaaaa aaaaaaaaaa aa 5852
<210> 20
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 20
ccaaccgcga gaagatgac 19
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 21
tagcacagcc tggatagcaa 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 22
tgagaaagga ggctgcatca 20
<210> 23
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 23
ctgctgcaac tgctgaaca 19
<210> 24
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 24
gcctcttcca gaaactagga gaa 23
<210> 25
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 25
ggggctttct ttgtgtaagc aa 22
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 26
gacagctgcc aggatcctaa 20
<210> 27
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 27
gtctggcaca tgtttgtcta ca 22
<210> 28
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 28
aagtgcgcca caagcaaa 18
<210> 29
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 29
tgccttatgg cgagttcca 19
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 30
cagcggcagc tgattgttaa 20
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 31
cagagagatc acccttcaag tca 23
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 32
acccagatga ctcccacaaa 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 33
caaggattgg ctgctgctta 20
<210> 34
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 34
aaggccgtgg tcctgac 17
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 35
tcagctggct gaagtagtcc 20
<210> 36
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 36
gcaaggtggc agaagtcaa 19
<210> 37
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 37
atggccagag atgcttcca 19
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 38
gcgcctttct tcatcatcca 20
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 39
gatggtgatg gtagggtttt cc 22
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 40
tcctggaact gaagcactca 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 41
gcagcacaag aatgggtaca 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 42
ccccttcctg gctctcagta 20
<210> 43
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 43
ggtctgggct gctctcca 18
<210> 44
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 44
ggacagtgac cctcaacca 19
<210> 45
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 45
cagcagggca aatctcttgt ta 22
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 46
tggaaaggtg gtgtggaaac 20
<210> 47
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 47
gtcagctggt ggttgctaa 19
<210> 48
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 48
tgatgtcagt gctgctactc c 21
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 49
ctgtgtatcc aagacagcag tca 23
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 50
ctcagttcag gcttcctaca 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 51
tcttttggca caaggcttac 20
<210> 52
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 52
cacaatagaa ccttcagcag ac 22
<210> 53
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 53
gaaaagtgtc ttcatgtatc cagtta 26
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 54
attccagctt caacccctca 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 55
atgactaggt gcctgggaac 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 56
ccaactaatg ccaccaccaa 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 57
cgaagagact ggctgttgac 20
<210> 58
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 58
ccccttgcct acaagaagct a 21
<210> 59
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 59
tcccgttggg ccaatcc 17
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 60
agcaagaacg ccaaggacaa 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 61
cggccacgat tctcttccaa 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 62
agattgcatg tcccctggaa 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 63
gggtgggttc cagaaggtta 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 64
tatgcctgcc acaccactaa 20
<210> 65
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 65
gccaggagaa cttccttgta cta 23
<210> 66
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 66
tcaaccgccc tgaacaca 18
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 67
acaccgacaa tgtgaccaga a 21
<210> 68
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 68
agccttccaa gcccatcc 18
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 69
tgcggattga gaagccttta 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 70
cgtggtcagg atggctagta 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 71
ccaatcggca gcaatgtcta 20
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 72
gtcctctgtg aaggggtcaa a 21
<210> 73
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 73
tcttcaggca agttagagtt ggtta 25
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 74
tgacaaccca gagctcatcc 20
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 75
ggacgccatg ttgtttggaa 20
<210> 76
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 76
cgtccaggtg tcagaggatt a 21
<210> 77
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 77
accttgttct ccaggatacc c 21
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 78
tgaagtggct ggttacatcc 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 79
agaggctggt catagggtaa 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 80
gtcttgacca gcctctctca 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 81
acggtgcttt gagggataca 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 82
acaagagacc ggctctagga 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 83
ttgccactag gtgagctgtc 20
<210> 84
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 84
cgttccgtta tccaggcttt t 21
<210> 85
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 85
actcctggta ggtgtcaatg g 21
<210> 86
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 86
ttagagctgc tccacatctc c 21
<210> 87
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 87
accaggttgt tggtgaaggt a 21
<210> 88
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 88
tccatcacca agagggtgaa 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 89
caggatgctt tccccaaaca 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 90
acgtgcattg tgctctctca 20
<210> 91
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 91
cagcactgat ttggtcatct cc 22
<210> 92
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 92
tgggcaccaa agaaggtta 19
<210> 93
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 93
ttcctgtgca gagtaaacca 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 94
atctctacgc ccaccagtcc 20
<210> 95
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 95
agcgagtccg agtcatccaa 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 96
gacgaaagct tggctccaaa 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 97
gttccatagc gacgttctcc 20
<210> 98
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 98
tgggataaaa gctctgctct tca 23
<210> 99
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 99
tgttcgccgg cagaatacta 20
<210> 100
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 100
acaaggccaa gaattccctc a 21
<210> 101
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 101
tgccggggct tcttaaaca 19
<210> 102
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 102
ttcgtcccca gccaacaa 18
<210> 103
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 103
tggcttcccg ttcactatcc 20
<210> 104
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 104
gcagtgactt tctcagcaac a 21
<210> 105
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 105
ttgggacagc ttggatcaca 20
<210> 106
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 106
ctctgccgtc gcagcaa 17
<210> 107
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 107
tggattagcc cgttgcagac 20
<210> 108
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 108
gccggagcaa aacttaggaa a 21
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 109
aggcggagtt cacaccaata 20
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 110
gccaagctct ggaggaagaa 20
<210> 111
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 111
gagaagaaca ggccgatggt ta 22
<210> 112
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 112
atcctggtgc tgctgac 17
<210> 113
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 113
ggccagatct tctgcttca 19
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 114
agttcagaag agcccgagac 20
<210> 115
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 115
gcgctgtctt ttggtgaaaa c 21
<210> 116
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 116
taccgggaga actacgtatc ca 22
<210> 117
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 117
atgcgccggt tctggaa 17
<210> 118
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 118
aggaatgtga gctggagaca 20
<210> 119
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 119
ttgtcacctt ccaactgaac c 21
<210> 120
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 120
gctacctgga agctgaccaa 20
<210> 121
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 121
ccacctgcct agtggcaaa 19
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 122
ggaaaggggt ggatgtgtca 20
<210> 123
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 123
cacccaggat gtccttgttc ta 22
<210> 124
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 124
atgttagagc tcagttggtt gata 24
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 125
tactgcatga ccctcgacaa 20
<210> 126
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 126
atattgtcgc accccatgca 20
<210> 127
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 127
acctcctttc ctgataattt cctcac 26
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 128
gccagcagca ctttgagtta 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 129
tgagtcaaca cggagctgta 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 130
gaaacccagc cagaaagcaa 20
<210> 131
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 131
aggtggtggt gtcagacaaa 20
<210> 132
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 132
cctctgccct ccacttaatg tta 23
<210> 133
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 133
cagctataga gccttccacc aa 22
<210> 134
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 134
ccggacctga gcgtcatgta 20
<210> 135
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 135
gcacaccacg tgctcaca 18
<210> 136
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 136
gaacgggaag cttgtcatca a 21
<210> 137
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 137
atcgccccac ttgattttgg 20
<210> 138
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 138
tcagtttgga aacctgcaga a 21
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 139
gctgcccata gctctttgaa 20
<210> 140
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 140
cccgtcgcct gtacca 16
<210> 141
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 141
tgttggaata gactctgaga agca 24
<210> 142
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 142
cggctacgac ctgaaactct a 21
<210> 143
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 143
tgagtgaggt gttgatgaac ca 22
<210> 144
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 144
ccagaggcag tgcaaacata a 21
<210> 145
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 145
agaaattggg tccggggtta 20
<210> 146
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 146
actccggaca gcacataca 19
<210> 147
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 147
ccaactgaag cactccgaaa 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 148
aagacctggc aacggatgac 20
<210> 149
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 149
ttgagaatcc tttccaaccc agac 24
<210> 150
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 150
acaacttgtc catcgtttca c 21
<210> 151
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 151
accagccatc acacacaa 18
<210> 152
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 152
agaactgaac agcgcaaca 19
<210> 153
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 153
gctgggtatt caccatggaa 20
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 154
ggtgaccgtt ttggcaatcc 20
<210> 155
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 155
cactggccac tccagtcac 19
<210> 156
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 156
gcctggcgca ttacaacaa 19
<210> 157
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 157
caattccccg ggtagcagta 20
<210> 158
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 158
cggcaaagct gaaggagaag ta 22
<210> 159
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 159
caggaccctt tgcaccatca 20
<210> 160
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 160
acacagtgct aggtgcagtt a 21
<210> 161
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 161
tccatactcc cagcctttca c 21
<210> 162
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 162
aagttcatcc ggcccttca 19
<210> 163
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 163
ggtgtcttca tccacctcca 20
<210> 164
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 164
tggacgtaag ggactcaaaa tcc 23
<210> 165
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 165
cccaggcctg cgttaca 17
<210> 166
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 166
tgtgccttac gacccatgta 20
<210> 167
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 167
gttgttcagg gcctcgttta 20
<210> 168
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 168
gcaagaaggt ggcattgttt cta 23
<210> 169
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 169
tctggggaaa gtgaggcaaa 20
<210> 170
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 170
agagaagaga aggctggtga ac 22
<210> 171
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 171
tccaggttgt caggagcaaa 20
<210> 172
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 172
tcccatctca aagcccatta ca 22
<210> 173
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 173
ctcgtctgag cgggagaa 18
<210> 174
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 174
ctggcaggac tgtgagtaca a 21
<210> 175
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 175
atttcgtact gctcctcttc cc 22
<210> 176
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 176
tgaccgacga gatcaacttc c 21
<210> 177
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 177
tgtgccttga cctcagcaa 19
<210> 178
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 178
tgaaggcatt ggggctgtg 19
<210> 179
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 179
agcctgacac gcagaggt 18
<210> 180
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 180
tgtgcatcta tgtgcgtcac 20
<210> 181
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 181
ggaatcgatg ggcaaagttg ta 22
<210> 182
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 182
caaaagacgg gcctcaccaa 20
<210> 183
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 183
cgtaagaggt tgcgcctgaa 20
<210> 184
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 184
catcggtgga acgcacaa 18
<210> 185
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 185
gggcacttcc ctcaaacaaa 20
<210> 186
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 186
gccttggttg gactggaaaa 20
<210> 187
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 187
tttgaagagc aacatggggt ac 22
<210> 188
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 188
ctcccaggaa ccgtacttca 20
<210> 189
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 189
ctctgataaa agccacgtct cc 22
<210> 190
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 190
catcaagatg tggcaggagt a 21
<210> 191
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 191
tgcagtacca tgacactgaa ata 23
<210> 192
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 192
gactccattc ctttggtctt tcc 23
<210> 193
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 193
ccatggattc ctcggagtca 20
<210> 194
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 194
tggtctgatg ggtggagacc 20
<210> 195
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 195
tgagtttcgg ggattgccat ac 22
<210> 196
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 196
tctcacaatg ggattctctc ca 22
<210> 197
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 197
caggcaagtt cctgaagtcc 20
<210> 198
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 198
tgccgaagaa acatggacca a 21
<210> 199
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 199
agccccaaag aatggccaaa 20
<210> 200
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 200
agaaggccaa accccagaa 19
<210> 201
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 201
atgctgaggc cttgtttgc 19
<210> 202
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 202
gagagttgtc cagtgatgtc a 21
<210> 203
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 203
gtcctgaacc caagtcatca 20
<210> 204
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 204
catcggtacc cagttcagga a 21
<210> 205
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 205
tgctgcatgc tgaacacac 19
<210> 206
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 206
tcctctccaa caccaaagtc c 21
<210> 207
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 207
aggattccgg cacagtcaa 19
<210> 208
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 208
tggaagccac ggtggataa 19
<210> 209
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 209
tgtgcggata tgcttgttcc 20
<210> 210
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 210
tctgctccct tccattccc 19
<210> 211
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 211
gaattcttca ttcccttgaa ctgaac 26
<210> 212
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 212
cgcctcatgt tctgctaca 19
<210> 213
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 213
tagaagagtg cgttggtcac 20
<210> 214
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 214
cgagccgacc atgtcttca 19
<210> 215
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 215
aagctgaagg ttcggagcaa 20
<210> 216
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 216
ccaggctttc caaggttacc a 21
<210> 217
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 217
tggctttctg ggcaagca 18
<210> 218
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 218
actggataca ttcaaaccct cca 23
<210> 219
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 219
tggtgcacag actggtgtta 20
<210> 220
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 220
gtactgtggc gatggcatta tac 23
<210> 221
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 221
agaaaaggga gcagccatca 20
<210> 222
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 222
acagtggaag cctgggttaa 20
<210> 223
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 223
acagtgtggg agcagttatc a 21
<210> 224
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 224
ctggcatcca gttgacgaaa 20
<210> 225
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 225
catcagggcc tagcaggtaa 20
<210> 226
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 226
gtgcagcact accacatgaa 20
<210> 227
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 227
tatacgagcc cgtcttctcc 20
<210> 228
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 228
gccagctgct atatcacaca aa 22
<210> 229
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 229
aaacccaggg ctacttccaa 20
<210> 230
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 230
gccacatttc aaaggaaact gac 23
<210> 231
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 231
tccctgcagc caatcagata 20
<210> 232
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 232
ccaccaagaa gccactttcc 20
<210> 233
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 233
taccagcaat gccagggtta 20
<210> 234
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 234
agaaactgcg tccgttttcc 20
<210> 235
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 235
ggagtcagat gtccttggga taa 23
<210> 236
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 236
cggatcaaac tgggatttac cc 22
<210> 237
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 237
cgagaacacg ttgccataca 20
<210> 238
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 238
tctggcttcc tccaccaaa 19
<210> 239
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 239
cagcggagtt cagcatacaa 20
<210> 240
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 240
gttcggctcc tggctgat 18
<210> 241
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 241
caaagatgga caccagcgaa tc 22
<210> 242
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 242
ggggcagttt ctgctcttca 20
<210> 243
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 243
tcatcctcag gcagcgtctt a 21
<210> 244
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 244
gcaggatcct acaccttaca ca 22
<210> 245
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 245
tgctggagat ggagggctta 20
<210> 246
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 246
ctggcgagga aagctcca 18
<210> 247
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 247
cagaaatgac atcacagctg cta 23
<210> 248
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 248
ctccccagca tttacccttc a 21
<210> 249
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 249
ggttagactc ggcgaagca 19
<210> 250
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 250
acccagtcac cctgaatgtc 20
<210> 251
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 251
gcaggacaag tagaggtttt gtc 23
<210> 252
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 252
gtcggtctgc tggtctcc 18
<210> 253
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 253
tgtgtcttgc agtgctcaac 20
<210> 254
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 254
aggcacagat atgggacaca 20
<210> 255
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 255
ataaggcacc tacagctcca 20
<210> 256
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 256
accagatcag agggaagtca 20
<210> 257
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 257
cagttgctgc acttgtttca 20
<210> 258
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 258
ggaagcagga tggatgaaca 20
<210> 259
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 259
ctcgggtatg gaatgtagtc c 21
<210> 260
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 260
tgaagacacc cgctccagta 20
<210> 261
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 261
ccccatttca ctgcctcttc a 21
<210> 262
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 262
tgggaaggtg gtcatcacac 20
<210> 263
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 263
cagcacccgc tgagatca 18
<210> 264
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 264
gccaagatcc catctctcca 20
<210> 265
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 265
aggcacttca gctcaggaaa 20
<210> 266
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 266
ctggctgtgg gtgtggtact 20
<210> 267
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 267
cgctccactc cctctaggc 19
<210> 268
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 268
gctagagacc gagtgtcctc a 21
<210> 269
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 269
ccagaatgag gaactcctgg aa 22
<210> 270
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 270
tcaaagagct ggtgcgaaaa 20
<210> 271
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 271
atttgtgtcc aggtcctcca 20
<210> 272
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 272
gaaggagcta ccaggcttcc 20
<210> 273
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 273
agcaatttat ccacggcatc c 21
<210> 274
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 274
cttcgagaag tcttgcaacc 20
<210> 275
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 275
gccagaataa gagggaagct a 21
<210> 276
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 276
tttgccaaag tggctgcaaa 20
<210> 277
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 277
tttctgggct tgggttctcc 20
<210> 278
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 278
tgcaccagtg ggtgtcata 19
<210> 279
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 279
gtggaactga aggtgccaaa 20
<210> 280
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 280
agaagtggaa ccgcttacta ca 22
<210> 281
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 281
agtgtggctc caaggtcata 20
<210> 282
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 282
gctgccatcg tgtatttcta ca 22
<210> 283
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 283
agacctcatc caccggaaaa 20
<210> 284
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 284
gggagcactt ggcacttttc a 21
<210> 285
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 285
gcaggatgtg ccacagatca 20
<210> 286
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 286
ggtccttccc atctacagtg aa 22
<210> 287
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 287
agcatccccg tgatggaaat a 21
<210> 288
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 288
tgctgccgct catcttca 18
<210> 289
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 289
caaaggttgc cttggcatca 20
<210> 290
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 290
gacctggcgc tccagttta 19
<210> 291
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 291
cctctgtgaa gcatctcagc ta 22
<210> 292
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 292
aagacggctt gatttcagga a 21
<210> 293
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 293
gcatcatcca atggtctcca 20
<210> 294
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 294
tgttaagcag gacgactttc c 21
<210> 295
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 295
cctttctggc tgggcttaaa 20
<210> 296
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 296
ggtgcctctg ccttccaa 18
<210> 297
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 297
ttgtgccagc catagtcaca 20
<210> 298
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 298
agagtgaagg tgtgatgctg aa 22
<210> 299
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成
引物
<400> 299
gcacggtttg tgacaggtac 20

Claims (103)

1.一种估算胎儿的胎龄的方法,其包括分析母体样本以确定来自包括一种或多种胎盘基因的组套的表达谱。
2.根据权利要求1所述的方法,其中所述表达谱来自包括三(3)种或更多种胎盘基因的组套。
3.根据权利要求1或2所述的方法,其中所述表达谱来自仅包括胎盘基因的组套。
4.根据权利要求1至3中任一项所述的方法,其中每种所述胎盘基因的表达水平在妊娠过程中改变。
5.根据权利要求1至4中任一项所述的方法,其中至少一种胎盘基因的表达水平在第一孕期比第三孕期高。
6.根据权利要求1至4中任一项所述的方法,其中至少一种胎盘基因的表达水平在第一孕期比第三孕期低。
7.根据权利要求5所述的方法,其中所有的所述胎盘基因的表达水平在第一孕期比第三孕期低。
8.根据前述权利要求中任一项所述的方法,其中所述胎盘基因选自表1中的基因。
9.根据权利要求8所述的方法,其中所述胎盘基因选自CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14。
10.根据前述权利要求中任一项所述的方法,其中确定三(3)至九种胎盘基因的表达谱。
11.根据权利要求1至10中任一项所述的方法,其中所述表达谱通过测量所述母体样本中的无细胞RNA(cfRNA)来确定。
12.根据权利要求1至10中任一项所述的方法,其中所述表达谱通过测量所述母体样本中的胎盘蛋白来确定。
13.根据权利要求11或12所述的方法,其中所述母体样本是母体血液、血浆、血清或尿液。
14.根据权利要求1至13所述的方法,其中所述母体样本在妊娠的第三孕期期间从母体获得。
15.根据权利要求1至13所述的方法,其中所述母体样本是在妊娠的第二孕期期间从母体获得的。
16.根据权利要求1至15中任一项所述的方法,其包括:
比较所述表达谱和多个参考谱,其中每个参考谱是特定胎龄的特征;
基于所述比较确定所述多个参考谱中的哪个对应于所述表达谱,以及
基于对应的参考谱的所述特定胎龄,推导出获得所述母体样本时的估算的胎儿的胎龄。
17.一种用于估算胎儿的胎龄的方法,其包括:
(a)获得样本的母体表达谱,包括根据权利要求1至11中任一项所述的基因组套的表达水平;
(b)比较所述基因组套的所述表达水平与参考表达水平,其中所述参考表达水平从足月分娩群体中获得,以确定所述母体表达谱与阈值内的参考表达水平相似还是不同。
18.根据权利要求17所述的方法,其中使用机器学习技术建立针对所述足月群体的一个或多个参考表达水平。
19.根据权利要求18所述的方法,其还包括:
获得多个训练样本,每个训练样本被标记为早产或足月;
获得所述多个训练样本中的每一个训练样本的所述基因组套的一个或多个测量的表达水平;
使用所述机器学习技术迭代地调整所述一个或多个参考表达水平,以增加所述训练样本的数量,所述训练样本由于将所述一个或多个测量的表达水平与所述一个或多个参考表达水平进行比较而得到正确分类。
20.根据权利要求16至18所述的方法,其进一步包括:将所述表达水平与所述基因组套的其他参考表达水平进行比较,其中所述其他参考表达水平从早产群体获得,以确定所述母体表达谱与阈值内的所述其他参考表达水平相似还是不同。
21.一种用于估算胎儿的胎龄的方法,其包括以下步骤:(i)确定包括至少一个胎盘RNA的组套的母体表达谱,以及(ii)将所述母体表达谱与参考谱进行比较,其中所述母体表达谱与所述参考谱的比较使得能够估算胎龄。
22.根据权利要求21所述的方法,其中所述参考谱的胎龄是已知的。
23.根据权利要求21所述的方法,其中所述母体表达谱与所述参考谱的比较是通过将所述母体表达谱与基于一个或多个表达水平的输入来提供胎龄的妊娠函数进行比较而进行的,其中通过将模型拟合到多个具有测量的表达水平且已知胎龄的校准样本来确定所述妊娠函数。
24.根据权利要求23所述的方法,其中所述模型是回归模型。
25.根据权利要求21所述的方法,其中所述谱组套如权利要求1至15中的任一项所述。
26.根据前述权利要求中任一项所述的方法,其由计算机执行。
27.一种方法,其包括:使用第一母体样本,根据权利要求16、17或18所述的方法确定第一胎龄,以及使用在妊娠后期获得的第二母体样本,根据权利要求16、17或18所述的方法确定第二胎龄。
28.根据权利要求11所述的方法,其中各个胎盘基因的表达水平通过qPCR或大规模平行测序来确定。
29.根据权利要求12所述的方法,其中各个胎盘基因的表达水平通过质谱法或使用抗体阵列来确定。
30.根据权利要求1至29中任一项所述的方法,其中确定至少一个另外的基因的表达,并且所述另外的基因不是胎盘基因。
31.一种组合物,其包括用于对选自表1中的基因的至少3种且不超过五十种胎盘基因进行多重扩增的引物。
32.一种试剂盒,其包括用于对选自表1中的基因的至少3种且不超过五十种胎盘基因进行多重扩增的引物。
33.一种抗体阵列,其用于检测从母体血液或尿液中分离出的至少三种且不超过一百种的胎盘蛋白。
34.一种用于评估孕妇早产风险的方法,其包括分析母体样本以确定来自包括选自表2的一种或多种基因的组套的表达谱。
35.根据权利要求34所述的方法,其中所述组套包括来自表2的三种或更多种基因。
36.根据权利要求34或35所述的方法,其中所述基因在早产群体中的表达水平高于在足月群体中的表达水平。
37.根据权利要求34或35所述的方法,其中所述基因选自CLCN3、DAPP1、POLE2、PPBP、LYPLAL1、MAP3K7CL、MOB1B、RAB27B、RGS18和TBC1D15;并且任选地选自CLCN3、DAPP1、PPBP、MAP3K7CL、MOB1B、RAB27B和RGS18。
38.根据权利要求37所述的方法,其中所述组套包括三(3)种基因,其选自CLCN3、DAPP1、POLE2、PPBP、LYPLAL1、MAP3K7CL、MOB1B、RAB27B、RGS18和TBC1D15的三种的任何组合;其中任选地,所述组套包括选自(1)RGS18;DAPP1;PPBP;(2)RGS18;RAB27B;PPBP;(3)RGS18;MOB1B;PPBP;(4)RGS18;PPBP;MAP3K7CL;(5)RGS18;PPBP;CLCN3;(6)DAPP1;RAB27B;PPBP;(7)DAPP1;MOB1B;PPBP;(8)DAPP1;PPBP;CLCN3;(9)RAB27B;MOB1B;PPBP;(10)RAB27B;PPBP;MAP3K7CL;(11)RAB27B;PPBP;CLCN3;(12)MOB1B;PPBP;MAP3K7CL;(13)MOB1B;PPBP;CLCN3的三种基因。
39.根据权利要求34至38中任一项所述的方法,其中确定三至十种基因的组套的表达谱。
40.根据权利要求39所述的方法,其中所述表达谱是恰好包括三种基因的组套。
41.根据权利要求39所述的方法,其中确定恰好三种基因的组套的表达谱。
42.根据权利要求34至41中任一项所述的方法,其中所述表达谱通过测量所述母体样本中的无细胞RNA(cfRNA)来确定。
43.根据权利要求34至41中任一项所述的方法,其中所述表达谱通过测量所述母体样本中的蛋白来确定。
44.根据权利要求34至43中任一项所述的方法,其中所述母体样本是母体血液、血浆、血清或尿液。
45.根据权利要求34至44中任一项所述的方法,其中所述母体样本在早产之前超过28天获得。
46.根据权利要求45所述的方法,其中所述母体样本在早产前超过45天获得。
47.根据权利要求45所述的方法,其中所述母体样本在妊娠的第二个月之后和第八个月之前获得。
48.根据权利要求34至47中任一项所述的方法,其中所述母体样本在妊娠的第二孕期期间获得。
49.根据权利要求34至47中任一项所述的方法,其中所述母体样本在妊娠的第三孕期期间获得。
50.根据权利要求34至49中任一项所述的方法,其中所述母体样本在指定的妊娠周获得,所述方法包括:
比较所述表达谱与时间匹配的参考谱,其中所述时间匹配的参考谱是在指定妊娠周的正常足月妊娠的特征;
如果所述表达谱与所述时间匹配的参考谱在阈值内显著不同,则确认孕妇处于升高的早产风险。
51.根据权利要求34至49中任一项所述的方法,其中所述母体样本在指定的妊娠周获得,所述方法包括:
比较所述表达谱与时间匹配的参考谱,其中所述时间匹配的参考谱是早产的特征;
如果所述表达谱与阈值内的所述时间匹配参考谱显著相似,则确认孕妇处于升高的早产风险。
52.一种用于评估孕妇早产风险的方法,其包括:
(a)获得母体表达谱或样本,其包括根据权利要求37或38所述的基因组套的表达水平;
(b)比较所述表达水平与所述基因组套的参考表达水平,其中所述参考表达水平从早产群体、足月分娩群体或两者中获得,以确定所述母体表达谱与阈值内的所述参考表达水平相似或不同。
53.根据权利要求51或52所述的方法,其中使用机器学习技术来建立一个或多个参考水平。
54.根据权利要求51至53所述的方法,其由计算机执行。
55.一种方法,其包括对在妊娠过程中在不同时间获得的两个或多个母体样本执行如权利要求50至52所述的步骤。
56.根据权利要求42所述的方法,其中各个基因的表达水平通过qPCR或大规模平行测序来确定。
57.根据权利要求43所述的方法,其中各个基因的表达水平通过质谱法或使用抗体阵列来确定。
58.一种组合物,其包括用于对选自表2中的基因的至少3种且不超过一百种基因进行多重扩增的引物。
59.一种组合物,其包括(1)cfRNA,其具有对应于表2中至少2种基因的cfRNA序列,或所述cfRNA序列的扩增子或来自所述cfRNA序列的cDNA,以及(2)用于扩增所述cfRNA序列或扩增子或cDNA的引物,或用于检测所述cfRNA序列或扩增子或cDNA的探针,条件是所述组合物不包括具有以下项的cfRNA:对应于来自人类基因组的200多个不同基因的cfRNA序列、所述200个不同基因的扩增子或来自所述200个不同基因的cDNA;并且不包括用于扩增所述200多种不同基因、扩增子或cDNA的引物;并且不包括用于检测上述200多个不同cfRNA序列或扩增子或cDNA的探针。
60.根据权利要求59所述的组合物,其中所述探针是核酸探针。
61.根据权利要求59或60所述的组合物,所述cfRNA序列对应于表2中的至少2、3、4、5、6、7、8、9或10种基因。
62.根据权利要求59至61所述的组合物,其中所述组合物不包括具有以下项的cfRNA:对应于来自人基因组的超过100(任选地超过75或超过50)个不同基因的cfRNA序列、所述200个不同基因的扩增子或来自所述200个不同基因的cDNA。
63.一种试剂盒,其包括用于对选自表2中的基因的至少3种且不超过一百种基因进行多重扩增的引物。
64.一种估算分娩时间的方法,其包括分析母体样本以确定来自包括一种或多种胎盘基因的组套的表达谱。
65.根据权利要求64所述的方法,其中所述表达谱来自包括三(3)种或更多种胎盘基因的组套。
66.根据权利要求64或65所述的方法,其中所述表达谱来自仅包括胎盘基因的组套。
67.根据权利要求64至66中任一项所述的方法,其中每种所述胎盘基因的表达水平在妊娠过程中改变。
68.根据权利要求64至67中任一项所述的方法,其中至少一种胎盘基因的表达水平在第一孕期比第三孕期高。
69.根据权利要求64至67中任一项所述的方法,其中至少一种胎盘基因的表达水平在第一孕期比第三孕期低。
70.根据权利要求69所述的方法,其中所有的所述胎盘基因的表达水平在第一孕期比第三孕期低。
71.根据前述权利要求中任一项所述的方法,其中所述胎盘基因选自表1中的基因。
72.根据权利要求71所述的方法,其中所述胎盘基因选自CGA、CAPN6、CGB、ALPP、CSHL1、PLAC4、PSG7、PAPPA和LGALS14。
73.根据权利要求56所述的方法,其中胎盘基因的集合包含除CGA和CGB以外的至少一种基因。
74.根据前述权利要求中任一项所述的方法,其中确定三(3)至九种胎盘基因的表达谱。
75.根据权利要求64至74中任一项所述的方法,其中所述表达谱通过测量所述母体样本中的无细胞RNA(cfRNA)来确定。
76.根据权利要求64至74中任一项所述的方法,其中所述表达谱通过测量所述母体样本中的胎盘蛋白来确定。
77.根据权利要求75或76所述的方法,其中所述母体样本是母体血液、血浆、血清或尿液。
78.根据权利要求64至67或71至77所述的方法,其中所述母体样本在妊娠的第三孕期期间从母体获得。
79.根据权利要求64至67或71至77所述的方法,其中所述母体样本在妊娠的第二孕期期间从母体获得。
80.根据权利要求64至79中任一项所述的方法,其包括:
比较所述表达谱和多个参考谱,其中每个参考谱是分娩时间的特征;
确定所述多个参考谱中的哪个对应于所述表达谱,以及
基于对应的参考谱的所述分娩时间推算出获得所述母体样本时的估算的分娩时间。
81.一种用于估算分娩时间的方法,其包括:
(a)获得样本的母体表达谱,包括根据权利要求56所述的基因组套的表达水平;
(b)比较所述表达水平与所述基因组的参考表达水平,其中所述参考表达水平从足月分娩群体获得,以确定所述母体表达谱与阈值内的所述参考表达水平相似还是不同。
82.根据权利要求80或81所述的方法,其中使用机器学习技术建立所述足月人群的一个或多个参考水平。
83.根据权利要求82所述的方法,其由计算机执行。
84.一种方法,其包括:使用第一母体样本,根据权利要求80或81所述的方法确定第一分娩时间;以及使用在妊娠后期获得的第二母体样本,根据权利要求80或81所述的方法确定第二分娩时间。
85.根据权利要求75所述的方法,其中各个胎盘基因的表达水平通过qPCR或大规模平行测序来确定。
86.根据权利要求76所述的方法,其中各个胎盘基因的表达水平通过质谱法或使用抗体阵列来确定。
87.根据权利要求64至86中任一项所述的方法,其中确定至少一个另外的基因的表达,并且所述另外的基因不是胎盘基因。
88.一种组合物,其包括用于对选自表1中的至少3种基因和不超过一百种胎盘基因进行多重扩增的引物。
89.一种试剂盒,其包括用于对选自表1中的至少3种胎盘基因和不超过一百种胎盘基因进行多重扩增的引物。
90.一种抗体阵列,其用于检测来自表1的至少3种胎盘蛋白和从母体血液或尿液中分离的不超过100种的胎盘蛋白。
91.一种用于降低孕妇早产风险的方法,其包括:
(i)根据权利要求34至57中的任何一项评估早产的风险,以及
(ii)施加治疗以延迟防止早产的发作。
92.一种用于降低孕妇早产风险的方法,其包括:
(i)根据权利要求34至57中的任何一项评估早产的风险,以及
(ii)每四周至少一次使用超声波对胎儿进行成像。
93.一种使用计算机执行的用于估算胎儿的胎龄的方法,其包括:
(a)从怀有胎儿的孕妇的母体样本中获得一个或多个表达谱,其中所述表达谱对应于来自第一基因组套的cfRNA转录物的表达;
(b)使用计算机系统将所述表达谱与特定胎龄特有的一个或多个参考谱进行比较,以估算所述胎儿的胎龄,其中使用机器学习模型确定所述特定胎龄特有的所述参考谱,所述机器学习模型分析第一训练样本,所述第一训练样本是用特定胎龄标记的cfRNA表达谱;
(c)使用所述计算机系统通过以下方式更新所述参考谱:
(1)接收第二训练样本,其中所述第二训练样本是标记有特定胎龄的cfRNA表达谱,以及
(2)经由机器学习模型迭代调整所述参考谱,以增加正确分类的所述第一训练样本和所述第二训练样本的数量。
94.根据权利要求93所述的方法,其中所述参考谱可以形成直线或曲线或为离散值。
95.根据权利要求93至94中任一项所述的方法,其中所述第一基因组套包括以下项的任何组合:本文公开的基因的任何组合,包含胎盘基因,表1中列出的胎盘基因,以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]和LGALS14[SEQ ID NO:9]的至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因。
96.一种计算机系统,其包括:(a)包括参考谱的数据库,每个参考谱包含在孕妇群体中对应于第一基因组套并且对应于特定胎龄的cfRNA转录物的表达水平;(b)用户界面,其被配置为通过网络与客户端计算机交互并接收表达谱,所述表达谱包含在怀有胎儿的孕妇中对应于所述第一基因组套的cfRNA转录物的表达水平;以及(c)一个或多个处理器,其被配置为分析所述参考谱和表达谱,包含比较所述参考谱和表达谱以确定所述胎儿的胎龄;以及(d)网络接口,其将所述胎儿的胎龄传输到所述客户端计算机。
97.根据权利要求96所述的系统,其中所述参考图谱和表达图谱包括本文公开的任何组合的cfRNA组套的表达水平,包含来自胎盘基因的转录物;在表1中列出的胎盘基因;以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]和LGALS14[SEQ ID NO:9]的至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因。
98.一种使用计算机执行的用于评估孕妇早产风险的方法,其包括:
(a)从孕妇的母体样本中获得一个或多个表达谱,其中所述表达谱对应于来自第一基因组套的多个cfRNA转录物的表达;
(b)使用计算机系统将所述表达特征与具有(a)早产高风险或(b)早产低风险或具有限定的妊娠时长的妇女特有的一个或多个参考谱进行比较,其中使用机器学习模型确定所述参考谱,所述机器学习模型分析第一训练样本,所述第一训练样本是早产或足月或标记有妊娠时长的cfRNA表达谱,
(c)使用所述计算机系统通过以下方式更新所述参考谱:
(1)接收第二训练样本,其中所述第二训练样本是被标记为早产或足月或标记有妊娠时长的cfRNA表达谱,以及
(2)经由机器学习模型迭代调整所述参考谱,以增加正确分类的所述第一训练样本和所述第二训练样本的数量。
99.根据权利要求98所述的方法,其中所述参考谱可以形成直线或曲线或为离散值。
100.根据权利要求98至99中任一项所述的方法,其中所述第一基因组套包括以下项的任何组合:本文公开的基因的任何组合,包含表1中列出的基因,以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]、and LGALS14[SEQ IDNO:9]的至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因,或选自CLCN3[SEQ IDNO:10]、DAPP1[SEQ ID NO:11]、PPBP[SEQ ID NO:13]、MAP3K7CL[SEQ ID NO:15]、MOB1B[SEQ ID NO:16]、RAB27B[SEQ ID NO:17]和RGS18[SEQ ID NO:18]的至少2、至少3、至少4、至少5、至少6或7种基因。
101.根据权利要求100所述的方法,其中所述第一基因组套包括选自以下项的至少一种组合:(1)RGS18;DAPP1;PPBP;(2)RGS18;RAB27B;PPBP;(3)RGS18;MOB1B;PPBP;(4)RGS18;PPBP;MAP3K7CL;(5)RGS18;PPBP;CLCN3;(6)DAPP1;RAB27B;PPBP;(7)DAPP1;MOB1B;PPBP;(8)DAPP1;PPBP;CLCN3;(9)RAB27B;MOB1B;PPBP;(10)RAB27B;PPBP;MAP3K7CL;(11)RAB27B;PPBP;CLCN3;(12)MOB1B;PPBP;MAP3K7CL;以及(13)MOB1B;PPBP;CLCN3。
102.一种计算机系统,其包括:(a)包括参考谱的数据库,每个参考谱包含在孕妇群体中对应于第一基因组套和早产风险的cfRNA转录物的表达水平;(b)用户界面,其被配置为通过网络与客户端计算机交互并接收表达谱,所述表达谱包含在孕妇中对应于所述第一基因组套的cfRNA转录物的表达水平;以及(c)一个或多个处理器,其被配置为分析所述参考谱和表达谱,包含比较所述参考谱和表达谱以确定所述早产风险;以及(d)网络接口,其将所述早产风险传输到所述客户端计算机。
103.根据权利要求102所述的系统,其中所述参考谱和表达谱包括本文公开的cfRNA组套的表达水平,例如表1中列出的基因以及选自CGA[SEQ ID NO:1]、CAPN6[SEQ ID NO:2]、CGB[SEQ ID NO:3]、ALPP[SEQ ID NO:4]、CSHL1[SEQ ID NO:5]、PLAC4[SEQ ID NO:6]、PSG7[SEQ ID NO:7]、PAPPA[SEQ ID NO:8]和LGALS14[SEQ ID NO:9]的至少2、至少3、至少4、至少5、至少6、至少7、至少8或9种基因,或选自CLCN3[SEQ ID NO:10]、DAPP1[SEQ ID NO:11]、PPBP[SEQ ID NO:13]、MAP3K7CL[SEQ ID NO:15]、MOB1B[SEQ ID NO:16]、RAB27B[SEQ IDNO:17]和RGS18[SEQ ID NO:18]的至少2、至少3、至少4、至少5、至少6或7种基因。
CN201880076096.6A 2017-10-23 2018-10-23 用于在胎儿孕育中预测胎龄和早产的无创分子钟 Pending CN111566228A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762576033P 2017-10-23 2017-10-23
US62/576,033 2017-10-23
US201762578360P 2017-10-27 2017-10-27
US62/578,360 2017-10-27
PCT/US2018/057142 WO2019084033A1 (en) 2017-10-23 2018-10-23 NON-INVASIVE MOLECULAR CLOCK RELATING TO FETAL DEVELOPMENT AND PREDICTING GESTATIONAL AGE AND PREMATURE DELIVERY

Publications (1)

Publication Number Publication Date
CN111566228A true CN111566228A (zh) 2020-08-21

Family

ID=66247703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880076096.6A Pending CN111566228A (zh) 2017-10-23 2018-10-23 用于在胎儿孕育中预测胎龄和早产的无创分子钟

Country Status (5)

Country Link
US (1) US20230140653A1 (zh)
EP (1) EP3701043B1 (zh)
JP (1) JP7319553B2 (zh)
CN (1) CN111566228A (zh)
WO (1) WO2019084033A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022082436A1 (zh) * 2020-10-20 2022-04-28 深圳华大基因股份有限公司 确定孕妇的孕期状态的方法
CN114592074A (zh) * 2022-04-12 2022-06-07 苏州市立医院 一种与胎龄相关的靶标基因组合及其应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020148757A1 (en) * 2019-01-14 2020-07-23 Gynisus Ltd. System and method for selecting required parameters for predicting or detecting a medical condition of a patient
US20230288398A1 (en) * 2020-11-06 2023-09-14 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Gestational Age Dating and Applications Thereof
WO2022185320A1 (en) * 2021-03-04 2022-09-09 Tel Hashomer Medical Research Infrastructure And Services Ltd. Machine learning models for prediction of unplanned cesarean delivery
EP4099335A1 (en) * 2021-06-03 2022-12-07 Tata Consultancy Services Limited System and method for estimation of delivery date of pregnant subject using microbiome data
US11664100B2 (en) * 2021-08-17 2023-05-30 Birth Model, Inc. Predicting time to vaginal delivery

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014105985A1 (en) * 2012-12-28 2014-07-03 NX Pharmagen Biomarkers of preterm birth
CN104334742A (zh) * 2012-01-27 2015-02-04 利兰斯坦福青年大学董事会 解析和定量无细胞rna的方法
CN104704364A (zh) * 2012-06-15 2015-06-10 韦恩州立大学 用于先兆子痫和/或hellp综合征的预测或早期检测的生物标记物测试
US20150355188A1 (en) * 2012-12-28 2015-12-10 NX Pharmagen Biomarkers of preterm birth
WO2017096405A1 (en) * 2015-12-04 2017-06-08 Nx Prenatal Inc. Use of circulating microparticles to stratify risk of spontaneous preterm birth
CN107155350A (zh) * 2014-07-30 2017-09-12 马修·库珀 用于诊断、预后和确认先兆子痫的方法与组合物

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4591570A (en) 1983-02-02 1986-05-27 Centocor, Inc. Matrix of antibody-coated spots for determination of antigens
US4829010A (en) 1987-03-13 1989-05-09 Tanox Biosystems, Inc. Immunoassay device enclosing matrixes of antibody spots for cell determinations
US5100777A (en) 1987-04-27 1992-03-31 Tanox Biosystems, Inc. Antibody matrix device and method for evaluating immune status
US7306904B2 (en) 2000-02-18 2007-12-11 Olink Ab Methods and kits for proximity probing
WO2009134452A2 (en) 2008-05-01 2009-11-05 Swedish Health Services Preterm delivery diagnostic assay
GB2460660B (en) 2008-06-04 2013-05-22 Alere Switzerland Gmbh Assay reader device & method for measuring hCG
WO2012057689A1 (en) 2010-10-29 2012-05-03 Ge Healthcare Bio-Sciences Ab Proximity ligation technology for western blot applications
GB201107863D0 (en) 2011-05-11 2011-06-22 Olink Ab Method and product
US10597701B2 (en) 2011-05-11 2020-03-24 Navinci Diagnostics Ab Unfolding proximity probes and methods for the use thereof
GB201108678D0 (en) 2011-05-24 2011-07-06 Olink Ab Multiplexed proximity ligation assay
US10174366B2 (en) 2012-11-14 2019-01-08 Olink Bioscience Ab Localised RCA-based amplification method
EP2920320B1 (en) 2012-11-14 2016-12-28 Olink Bioscience AB Rca reporter probes and their use in detecting nucleic acid molecules
US20140199681A1 (en) 2013-01-14 2014-07-17 Streck, Inc. Blood collection device for stabilizing cell-free rna in blood during sample shipping and storage
WO2015010442A1 (en) * 2013-07-24 2015-01-29 The Chinese University Of Hong Kong Biomarkers for premature birth
GB201320145D0 (en) 2013-11-14 2014-01-01 Olink Ab Localised RCA-based amplification method using a padlock-probe
US10166210B2 (en) * 2014-06-12 2019-01-01 Nsabp Foundation, Inc. Methods of subtyping CRC and their association with treatment of colon cancer patients with oxaliplatin

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104334742A (zh) * 2012-01-27 2015-02-04 利兰斯坦福青年大学董事会 解析和定量无细胞rna的方法
CN104704364A (zh) * 2012-06-15 2015-06-10 韦恩州立大学 用于先兆子痫和/或hellp综合征的预测或早期检测的生物标记物测试
WO2014105985A1 (en) * 2012-12-28 2014-07-03 NX Pharmagen Biomarkers of preterm birth
US20150355188A1 (en) * 2012-12-28 2015-12-10 NX Pharmagen Biomarkers of preterm birth
CN107155350A (zh) * 2014-07-30 2017-09-12 马修·库珀 用于诊断、预后和确认先兆子痫的方法与组合物
WO2017096405A1 (en) * 2015-12-04 2017-06-08 Nx Prenatal Inc. Use of circulating microparticles to stratify risk of spontaneous preterm birth

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
T. M. SILER-KHODR: "Gonadotropin-releasing Hormone Effects on Placental Hormones during Gestation: I. Alpha-Human Chorionic Gonadotropin, Human Chorionic Gonadotropin and Human Chorionic Somatomammotropin", 《BIOLOGY OF REPRODUCTION》, vol. 34, pages 245 - 254, XP055596325, DOI: 10.1095/biolreprod34.2.245 *
于达;宋雁;林艳;: "胎动减少后不良妊娠结局的风险预测研究", 中国当代医药, no. 18, pages 28 - 30 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022082436A1 (zh) * 2020-10-20 2022-04-28 深圳华大基因股份有限公司 确定孕妇的孕期状态的方法
CN114592074A (zh) * 2022-04-12 2022-06-07 苏州市立医院 一种与胎龄相关的靶标基因组合及其应用

Also Published As

Publication number Publication date
US20230140653A1 (en) 2023-05-04
JP7319553B2 (ja) 2023-08-02
JP2021500061A (ja) 2021-01-07
EP3701043A4 (en) 2021-11-17
EP3701043A1 (en) 2020-09-02
WO2019084033A1 (en) 2019-05-02
EP3701043B1 (en) 2023-11-22

Similar Documents

Publication Publication Date Title
JP7319553B2 (ja) 在胎週数および早産を予測する胎児発達のための非侵襲的分子時計
CN107743524B (zh) 前列腺癌预后的方法
KR101824746B1 (ko) 폐암 검출용 타액 바이오마커
AU2012340393B2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
KR20150090246A (ko) 암을 위한 분자 진단 테스트
CN106978480A (zh) 用于癌症的分子诊断试验
AU2012203810B2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
WO2014059178A1 (en) Differential expression of novel protein markers for the diagnosis and treatment of eosinophilic esophagitis
KR20120047334A (ko) 자궁내막암 마커
AU2015257483A1 (en) Biomarkers and combinations thereof for diagnosising tuberculosis
WO2012006056A2 (en) Ccr6 as a biomarker of alzheimer&#39;s disease
RU2766885C2 (ru) Оценки риска на основе экспрессии варианта 7 фосфодиэстеразы 4d человека
KR20110073451A (ko) 임상 샘플에서의 인터페론 반응 (iris)
JP2023157965A (ja) アトピー性皮膚炎の検出方法
US20130109017A1 (en) Multiple myeloma prognosis and treatment
WO2015013233A2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
Chen et al. Exosomes—a potential indicator and mediator of cleft lip and palate: a narrative review
WO2020198990A1 (zh) 结核病标志物在结核病诊断和疗效评估中的应用
KR20090025898A (ko) 폐암 환자의 폐암 재발 위험을 예측하기 위한 마커, 키트,마이크로어레이 및 방법
JP4214235B2 (ja) 2型糖尿病診断用キット
CN114236123B (zh) 标志物在预测妊娠期糖尿病风险中的应用
CN110382521B (zh) 从氧化应激区分肿瘤抑制性foxo活性的方法
WO2022186296A1 (ja) アトピー性皮膚炎の症度悪化の検出方法
WO2022186297A1 (ja) アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法
AU2014201129A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40036472

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20230607

Address after: California, USA

Applicant after: Chen Zuckerberg Biological Center San Francisco Co.

Applicant after: THE BOARD OF TRUSTEES OF THE LELAND STANFORD JUNIOR University

Applicant after: STATENS SERUM INSTITUT

Address before: California, USA

Applicant before: Chen Zuckerberg Biological Center Co.

Applicant before: THE BOARD OF TRUSTEES OF THE LELAND STANFORD JUNIOR University

Applicant before: STATENS SERUM INSTITUT

TA01 Transfer of patent application right