CN109790583A - 对肺腺癌亚型分型的方法 - Google Patents

对肺腺癌亚型分型的方法 Download PDF

Info

Publication number
CN109790583A
CN109790583A CN201780044229.7A CN201780044229A CN109790583A CN 109790583 A CN109790583 A CN 109790583A CN 201780044229 A CN201780044229 A CN 201780044229A CN 109790583 A CN109790583 A CN 109790583A
Authority
CN
China
Prior art keywords
biomarker
nucleic acid
expression
kinds
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780044229.7A
Other languages
English (en)
Other versions
CN109790583B (zh
Inventor
H·法鲁基
M·莱-高德曼
G·梅休
J·赛罗德
C·佩鲁
D·N·海耶斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gene Center Therapeutics Inc
University of North Carolina System
Original Assignee
Gene Center Therapeutics Inc
University of North Carolina System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gene Center Therapeutics Inc, University of North Carolina System filed Critical Gene Center Therapeutics Inc
Priority to CN202310993898.6A priority Critical patent/CN116987790A/zh
Publication of CN109790583A publication Critical patent/CN109790583A/zh
Application granted granted Critical
Publication of CN109790583B publication Critical patent/CN109790583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

提供了用于通过检测选自一组肺腺癌基因标签的至少一种分类器生物标记物的表达水平来确定个体的肺腺癌(AD)亚型的方法和组合物。本文还提供了用于确定具有一种腺癌亚型的个体对诸如免疫疗法等疗法的反应的方法和组合物。

Description

对肺腺癌亚型分型的方法
交叉引用
本申请要求2016年5月17日提交的美国临时申请号62/337,591、2016年5月17日提交的美国临时申请号62/337,645、2016年9月19日提交的美国临时申请号62/396,587、2016年11月11日提交的美国临时申请号62/420,836和2016年11月23日提交的美国临时申请号62/425,717的优先权,出于所有目的将每个临时申请通过引用以其整体并入。
技术领域
本发明涉及用于确定肺样品的腺癌亚型和用于预测患有特定肺癌亚型的患者对治疗的反应的方法。
关于序列表的声明
与本申请相关的序列表以文本格式提供以代替纸质拷贝,并且通过引用特此并入本说明书中。包含该序列表的文本文件的名称是GNCN_009_01WO_SeqList_ST25.txt。文本文件为194KB,并且创建于2017年5月16日,并通过EFS-Web以电子方式提交。
发明背景
肺癌是美国以及全世界中癌症死亡的主要原因。2005年诊断出大约172,000例肺部肿瘤,估计有163,000例死亡,超过结肠、乳腺和前列腺癌症的总和。至少75%的患者出现局部晚期疾病。尽管已经作出很多努力来使用诸如高分辨率CT等技术改进筛查,但这些方法通常会产生假阳性结果,并且通常不会改变结果。因此,即使是早期检测到的小肿瘤也对于如下患者构成重大威胁,该患者的I期肺癌术后5年存活率估计在47%至63%之间。对于晚期疾病患者,预后较差,中值存活期低于一年。一般而言,姑息治疗有效但不可持续,并且对总体存活期的平均影响为大约3个月。
在群体水平上,肺癌的根本原因显然是烟草使用,其中全部肺癌中的90%直接归因于吸烟。吸烟与肺癌如此紧密相关,以致于它击败与大多数其他危险因素的决定性联系;虽然石棉、氡和一些肺部刺激物通常被认为是肺癌的危险因素。强烈怀疑遗传联系,然而,确切的机制仍然被确定在罕见的孟德尔癌症综合征选定组之外。尽管有许多分类方案和正在进行的临床试验,但在临床诊断和治疗领域总体上取得了令人失望的进展。
大多数肺癌被归类为非小细胞肺癌(NSCLC)(>85%),其是一个多样化的组,在整个呼吸道中都有亚型。腺癌(AD)和鳞状细胞癌(SCC或SQ)是NSCLC的两个主要亚型,其诊断频率几乎相等,但常常在不同位置被发现,SCC出现在更中心的位置。由世界卫生组织(WHO)开发的第6版肺癌共识分类(consensus classification of lung cancers)描述了不少于90种恶性形态类别和变体。通常可能存在异质性,尤其是在>1.5cm的较大肿瘤中,使得形态学分类更加困难并且导致诸如腺癌-鳞状细胞癌等命名。此外,组织学诊断再现性的研究已经表明病理学家内一致性和病理学家间一致性有限。形态学的变化性、有限的组织样品以及对不断增加的治疗靶向标记物列表评估的需要对当前的诊断标准提出了挑战。如下观点进一步突出了这一点:肺癌的各种形态学亚型之间的区分在指导患者管理方面是必不可少的并且可以使用另外的分子测试来鉴定特定的治疗靶标记物。
目前,基于基因表达的肺腺癌(AD)亚型分型主要限于如下研究方案,该研究方案涉及:从新鲜冷冻肺肿瘤中提取RNA,随后使用超过500种基因的定量基因表达来应用最近质心(nearest centroid)预测因子。已显示基于基因表达的腺癌亚型分型将腺癌肿瘤分类为3个生物学上不同的亚型(末端呼吸单元型(TRU;以前称为支气管型(Bronchioid))、近端炎症型(PI;以前称为鳞状型(Squamoid))和近端增生型(PP;以前称为巨型(Magnoid))),其可以在基因组谱(包括基因表达、突变谱和拷贝数变化)方面不同。此外,这三种亚型可以在其预后方面,在其吸烟者与非吸烟者的分布方面,在其EGFR改变、ALK重排、TP53突变的发生率方面,在其血管生成特征方面以及在其免疫原性反应特征方面各不相同。尽管有AD亚型分型的预后和预测益处的证据,但是需要>500种基因的基因表达结合复杂的生物信息学分析,阻碍了AD亚型分型在药物开发和/或临床中的应用。
癌症免疫监视的原则是免疫系统可以鉴定癌前细胞和癌性细胞,并在这些细胞变成临床相关性之前杀死它们,这已经在免疫缺陷小鼠模型中得到证明。先天性和适应性免疫反应可以一起工作以促进或抑制癌症生长,并且逃避免疫破坏是癌症的新兴标志。在历史上,免疫刺激的方法对于临床上的肺癌患者无效。肿瘤抗原表达的缺陷和抗原呈递细胞(APC)的呈现,免疫抑制细胞和细胞因子的浸润以及无效的T细胞活化可以导致在肿瘤部位的免疫抑制。对癌症和免疫系统的理解的进展已经导致有效的疗法,该疗法激活抗肿瘤反应,甚至在已经高度发展免疫逃避方法的肿瘤(例如肺癌)中。然而,由于患者中免疫激活和免疫抑制之间的微妙平衡,由肺部肿瘤引起的高免疫抑制作用限制了这些进展的有益效果。例如,在NSCLC中,阻碍免疫激活的免疫抑制细胞的作用很高,这被认为与肿瘤的类型、疾病的进展期和肿瘤负荷有关。
因此,开发一种有效区分固有的肺腺癌亚型的方法对临床诊断和疾病管理至关重要。因此,需要新的方法来进一步确定可能对免疫疗法有反应的群体。本发明部分地基于患者的腺癌亚型(末端呼吸单元型(TRU)、近端炎症型(PI)、近端增生型(PP))来解决该领域中的这些和其他需求,以便确定腺癌患者群体的预后或疾病结果。与本领域已知的诊断方法相比,本发明的方法提供了用于确定肺癌的细胞和分子起源(例如,对AD亚型分型)的手段,并且可以提供更准确的诊断和可应用的治疗。
发明概述
在一个方面,本文提供了用于确定从患者获得的肺组织样品的腺癌(AD)亚型的方法,该方法包括检测表1的至少一种分类器生物标记物的表达水平,其中该分类器生物标记物的表达水平的检测特异性地鉴定末端呼吸单元(TRU)、近端增生(PP)或近端炎症(PI)AD亚型。在一些情况下,该方法还包括将检测到的表1的该至少一种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考AD TRU样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PP样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PI样品的表1的该至少一种分类器生物标记物的表达数据或其组合;并且基于比较步骤的结果将样品分类为TRU、PP或PI亚型。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为TRU、PP或PI亚型。在一些情况下,在核酸水平检测分类器生物标记物的表达水平。在一些情况下,核酸水平是RNA或cDNA。在一些情况下,对表达水平的检测包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,表达水平的检测包括使用对表1的至少一种分类器生物标记物有特异性的至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该至少一种分类器生物标记物包含多种分类器生物标记物。在一些情况下,该多种分类器生物标记物包含表1的至少两种分类器生物标记物、至少8种分类器生物标记物、至少16种分类器生物标记物、至少24种分类器生物标记物、至少32种分类器生物标记物、至少40种分类器生物标记物、或至少48种分类器生物标记物。在一些情况下,该至少一种分类器生物标记物包含表1的所有分类器生物标记物。
在另一个方面,本文提供了用于确定从患者获得的肺组织样品的腺癌(AD)亚型的方法,该方法包括检测编码在肺癌细胞中具有特定表达模式的分类器生物标记物的至少一种核酸分子的表达水平,其中该分类器生物标记物选自下组,该组由以下组成:表1中列出的分类器基因,该方法包括:(a)从来自患者的肺组织样品中分离核酸材料;(b)将该核酸材料与基本上与该分类器生物标记物的核酸分子的部分互补的寡核苷酸混合;并且(c)检测该分类器生物标记物的表达。在一些情况下,该方法还包括将表1的该至少一种分类器生物标记物的检测到的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考AD TRU样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PP样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PI样品的表1的该至少一种分类器生物标记物的表达数据或其组合;并且基于比较步骤的结果将样品分类为TRU、PP或PI亚型。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为TRU、PP或PI亚型。在一些情况下,对表达水平的检测包括进行qRT-PCR或任何基于杂交的基因测定。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,表达水平的检测包括使用对表1的至少一种分类器生物标记物有特异性的至少一对寡核苷酸引物。在一些情况下,该方法还包括基于检测到的分类器生物标记物的表达水平预测对用于治疗肺腺癌(AD)亚型的疗法的反应。在一些情况下,该疗法是化学疗法、血管生成抑制剂和/或免疫疗法。在一些情况下,该肺AD亚型是TRU,并且疗法是化学疗法或血管生成抑制剂。在一些情况下,该肺AD亚型是PP,并且疗法是化学疗法。在一些情况下,该肺AD亚型是PI,并且疗法是免疫疗法。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,编码分类器生物标记物的该至少一种核酸分子包含编码多种分类器生物标记物的多种核酸分子。在一些情况下,该多种分类器生物标记物包含表1的至少两种分类器生物标记物、至少5种分类器生物标记物、至少10种分类器生物标记物、至少20种分类器生物标记物、或至少30种分类器生物标记物。在一些情况下,该至少一种分类器生物标记物包含表1的所有分类器生物标记物。
在又另一个方面,本文提供了检测从患者获得的肺组织样品中的生物标记物的方法,该方法包括使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。在一些情况下,肺组织样品先前被诊断为腺癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,对该表达水平的该检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
在一个方面,本文提供了检测从患者获得的肺组织样品中的生物标记物的方法,该方法基本上由以下组成:使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。在一些情况下,肺组织样品先前被诊断为腺癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,对该表达水平的该检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
在另一个方面,本文提供了检测从患者获得的肺组织样品中的生物标记物的方法,该方法由以下组成:使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。在一些情况下,肺组织样品先前被诊断为腺癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,对该表达水平的该检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
在另一个方面,本文提供了确定腺癌患者是否可能对免疫疗法有反应的方法,该方法包括确定来自患者的肺组织样品的腺癌亚型,其中该腺癌亚型选自下组,该组由以下组成:鳞状型(近端炎症型)、支气管型(末端呼吸单元型)和巨型(近端增生型);并且基于亚型,评估患者是否可能对免疫疗法有反应。在一些情况下,免疫疗法包括检查点抑制剂疗法。在一些情况下,检查点抑制剂靶向PD-1或PD-L1。在一些情况下,检查点抑制剂靶向CTLA-4。在一些情况下,检查点抑制剂是派姆单抗(Pembrolizumab)、纳武单抗(Nivolumab)或其抗原片段结合片段。在一些情况下,检查点抑制剂是伊匹单抗(Ipilimumab)或其抗原结合片段。在一些情况下,最初经由样品的组织学分析确定患者患有腺癌。在一些情况下,患者的腺癌分子亚型选自鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型),并且经由对从患者获得的样品的组织学分析来确定。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,对腺癌亚型的确定包括确定多种分类器生物标记物的表达水平。在一些情况下,对该多种分类器生物标记物的表达水平的确定是在核酸水平上通过进行RNA测序、逆转录酶聚合酶链反应(RT-PCR)或基于杂交的分析来进行。在一些情况下,用于确定腺癌亚型的该多种分类器生物标记物选自可公开获得的肺腺癌数据集。在一些情况下,该可公开获得的肺腺癌数据集是TCGA肺AD RNAseq数据集。在一些情况下,用于确定腺癌亚型的该多种分类器生物标记物选自表1。在一些情况下,RT-PCR是定量实时逆转录酶聚合酶链反应(qRT-PCR)。在一些情况下,使用对表1的该多种分类器生物标记物有特异性的引物进行RT-PCR。在一些情况下,该方法还包括将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该多种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考腺癌TRU样品的表1的该多种分类器生物标记物的表达数据、来自参考腺癌PP样品的表1的该多种分类器生物标记物的表达数据、来自参考腺癌PI样品的表1的该多种分类器生物标记物的表达数据、或其组合;并且基于比较步骤的结果将第一个样品分类为TRU、PP或PI。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为TRU、PP或PI亚型。在一些情况下,该多种分类器生物标记物包含表1中列出的分类器生物标记物中的每一种。
在又另一个方面,本文提供了用于选择腺癌患者进行免疫疗法的方法,该方法包括确定来自该患者的肺组织样品的腺癌亚型;并且基于该亚型选择患者进行免疫疗法。在一些情况下,免疫疗法包括检查点抑制剂疗法。在一些情况下,检查点抑制剂靶向PD-1或PD-L1。在一些情况下,检查点抑制剂靶向CTLA-4。在一些情况下,检查点抑制剂是派姆单抗(Pembrolizumab)、纳武单抗(Nivolumab)或其抗原片段结合片段。在一些情况下,检查点抑制剂是伊匹单抗(Ipilimumab)或其抗原结合片段。在一些情况下,最初经由样品的组织学分析确定患者患有腺癌。在一些情况下,患者的腺癌分子亚型选自鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型),并且经由对从患者获得的样品的组织学分析来确定。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,对腺癌亚型的确定包括确定多种分类器生物标记物的表达水平。在一些情况下,对该多种分类器生物标记物的表达水平的确定是在核酸水平上通过进行RNA测序、逆转录酶聚合酶链反应(RT-PCR)或基于杂交的分析来进行。在一些情况下,用于确定腺癌亚型的该多种分类器生物标记物选自可公开获得的肺腺癌数据集。在一些情况下,可公开获得的肺腺癌数据集是TCGA肺AD RNAseq数据集。在一些情况下,用于确定腺癌亚型的该多种分类器生物标记物选自表1。在一些情况下,RT-PCR是定量实时逆转录酶聚合酶链反应(qRT-PCR)。在一些情况下,使用对表1的该多种分类器生物标记物有特异性的引物进行RT-PCR。在一些情况下,该方法还包括将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该多种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考腺癌TRU样品的表1的该多种分类器生物标记物的表达数据、来自参考腺癌PP样品的表1的该多种分类器生物标记物的表达数据、来自参考腺癌PI样品的表1的该多种分类器生物标记物的表达数据、或其组合;并且基于比较步骤的结果将第一个样品分类为TRU、PP或PI。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为TRU、PP或PI亚型。在一些情况下,该多种分类器生物标记物包含表1中列出的分类器生物标记物中的每一种。
在一个方面,本文提供了治疗受试者的肺癌的方法,该方法包括:测量从受试者获得的肺癌样品中至少一种生物标记物核酸的表达水平,其中该至少一种生物标记物核酸选自表1中列出的一组生物标记物,其中该至少一种生物标记物的存在、不存在和/或水平指示肺癌的亚型;并且基于肺癌的亚型给予免疫治疗剂。在一些情况下,肺癌样品是腺癌肺癌样品,在一些情况下,选自该组生物标记物的该至少一种生物标记物核酸包含表1的至少两种生物标记物核酸、至少8种生物标记物核酸、至少16种生物标记物核酸、至少32种生物标记物核酸、或所有48种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,肺组织样品先前被诊断为腺癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,该方法还包括测量来自另外一组生物标记物的至少一种生物标记物的表达。在一些情况下,另外一组生物标记物包括先天性免疫细胞(IIC)、适应性免疫细胞(AIC)的基因表达标签(gene expression signature),一种或多种个体免疫生物标记物,一种或多种干扰素(IFN)基因,一种或多种主要组织相容性复合物II类(MHCII)基因或其组合。在一些情况下,另外一组生物标记物包含选自表4A、表4B、表5、表6、表7或其组合的基因。在一些情况下,AIC的基因表达标签选自表4A。在一些情况下,IIC的基因表达标签选自表4B。在一些情况下,该一种或多种个体免疫生物标记物选自表5。在一些情况下,该一种或多种IFN基因选自表6。在一些情况下,该一种或多种MHCII基因选自表7。在一些情况下,测量表达水平使用扩增、杂交和/或测序测定来进行。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,样品是从患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,受试者的腺癌亚型选自鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)。在一些情况下,肺癌亚型是近端炎症型的,并且其中该免疫治疗剂包含检查点抑制剂。在一些情况下,检查点抑制剂靶向PD-1或PD-L1。在一些情况下,检查点抑制剂靶向CTLA-4。在一些情况下,检查点抑制剂是派姆单抗(Pembrolizumab)、纳武单抗(Nivolumab)或其抗原片段结合片段。在一些情况下,检查点抑制剂是伊匹单抗(Ipilimumab)或其抗原结合片段。在一些情况下,该至少一种生物标记物核酸是多种生物标记物核酸,其中该多种生物标记物核酸包含表1中所列出的至少一种生物标记物核酸与来自可公开获得的肺腺癌数据集的一种或多种生物标记物核酸的组合,其中该多种生物标记物核酸的存在、不存在和/或水平指示肺癌的亚型。在一些情况下,该至少一种生物标记物核酸是多种生物标记物核酸,其中该多种生物标记物核酸包含表1中所列出的所有生物标记物核酸与来自可公开获得的肺腺癌数据集的一种或多种生物标记物核酸的组合,其中该多种生物标记物核酸的存在、不存在和/或水平指示肺癌的亚型。在一些情况下,可公开获得的肺腺癌数据集是TCGA肺AD RNAseq数据集。
附图简述
图1示出了肺癌亚型分型和鳞状细胞癌(SCC或SQ)和腺癌(AC或AD)的生物学亚型。
图2示出了在实施例1中描述的研究中使用的肺AD数据集。
图3示出了癌症基因组图集(Cancer Genome Atlas,TCGA)肺AD数据集中的免疫细胞标签表达(即,来自实施例1的Bindea等人的参考文献)、其他免疫标记物和个体免疫标记物的热图。TRU=末端呼吸单元型,PP=近端增生型,PI=近端炎症型。
图4示出了TCGA AD数据集中的免疫细胞标签的相关矩阵,其中通过分层聚类来排列标签。深红色表示一对基因更呈正相关。白色表示没有相关。深蓝色表示负相关。
图5示出了如实施例1中所述的跨多个AD数据集的T细胞标签基因表达亚型模式的再现性。TRU=末端呼吸单元型,PP=近端增生型,PI=近端炎症型。RNAseq(Illumina,SanDiego,CA)以及来自Affymetrix(Santa Clara,CA)和Agilent(Santa Clara,CA)两者的微阵列。
图6示出了在TCGA数据集的腺癌(AD)评估中在CD274(PD-L1)表达与适应性免疫细胞(AIC)标签之间的关联(经调整的R平方)。亚型的关联始终大于PD-L1的关联。Tcm=中枢记忆T细胞,Tem=效应记忆T细胞,Th1=1型T辅助细胞,Th2=2型T辅助细胞,TFH=T滤泡辅助细胞,Th17=T辅助17细胞,Treg=T调节细胞,Tgd=γδT细胞。
图7A-图7B示出了如实施例1中所述的整体和按照亚型的标签-存活关联。从分层的cox模型计算的风险比(HR)和置信区间(CI)对应于标准化免疫标记物的单位增加,并针对病理阶段进行调整。针对阶段调整亚型特异性HR(整体通过阶段和亚型进行调整),并且仅显示了对于至少一种亚型具有显著关联(标称p<0.05)的免疫特征。AD=腺癌,TRU=末端呼吸单元型,PP=近端增生型,PI=近端炎症型,MHC II=主要组织相容性II类基因标签,Th1=1型T辅助细胞,Th2=2型T辅助细胞,TFH=T滤泡辅助细胞,Th17=T辅助17细胞,Treg=T调节细胞,DC=树突细胞,iDC=未成熟树突细胞。图7A-图7B显示了TCGA群组中(图7A)或者TGCA、Shedden和Tomida群组中(图7B)免疫细胞标签和标记物按照AD亚型的存活关联。对于图7A,亚型特异性免疫标记物风险比和95%置信区间是针对TCGA群组(n=515AD)中的5年总体存活期。
图8示出了在RNASeq肺腺癌(AD)数据集上从癌症基因组图集(TCGA)进行的五折交叉验证研究。用于确定包括以用于对AD亚型分型的最佳基因数量。末端呼吸单元(TRU)以前称为支气管型。近端增生型(PP)以前称为巨型。近端炎症型(PI)以前称为鳞状型。
图9示出了通过本文所述的AD预测因子的基因标签训练的轮廓(silhouette)得分来选择原型样品。
图10示出了来自选择用于区分支气管型样品(末端呼吸单元型)的48个基因分类器的16基因子集的中值基因表达。
图11示出了来自选择用于区分巨型样品(近端增生型)的48个基因分类器的16基因子集的中值基因表达。
图12示出了来自选择用于区分鳞状型样品(近端炎症型)的48个基因分类器的16基因子集的中值基因表达。
图13示出了本文提供的48个基因标签与定义多个验证数据集的金标准亚型的506个基因分类器的AD亚型预测的一致性。与金标准(TCGA)的一致性为87%。与Shedden、Tomida、UNC和FFPE的一致性分别为87%、79%、92%和84%。
图14示出了癌症基因组图集(TCGA)肺AD数据集中的免疫细胞标签(即,来自实施例3的Bindea等人的参考文献)、和其他免疫标记物的热图。
图15示出了如实施例3中所述的跨多个AD数据集的T细胞标签基因表达亚型模式的再现性。
图16示出了如实施例3中所述的在CD274(PD-L1)表达与适应性免疫细胞(AIC)标签之间相对于在亚型与AIC标签之间的关联(经调整的R平方)。Tcm=中枢记忆T细胞,Tem=效应记忆T细胞,Th1=1型T辅助细胞,Th2=2型T辅助细胞,TFH=T滤泡辅助细胞,Th17=T辅助17细胞,Treg=T调节细胞,Tgd=γδT细胞。
图17示出了如实施例3中所述的整体和按照亚型的AD标签-存活关联。根据分层cox模型计算风险比(HR)和置信区间。针对阶段调整亚型特异性HR(整体通过阶段和亚型进行调整),并且仅显示了具有显著关联(p<0.05)的免疫特征。
图18示出了所有免疫细胞和免疫标志物(即,IFN基因、MHCII基因和个体免疫标志物PDL1、PDL2、PDCD1和CTLA4)相对于AD的箱形图。TRU=末端呼吸单元型,PP=近端增生型,PI=近端炎症型。AC=腺癌。
图19示出了腺癌(AD)亚型非沉默突变负荷、AD中的STK11失活(突变和/或缺失)、和MHCII类标签,连同Kruskal-Wallis关联检验p值。TRU=末端呼吸单元型,PP=近端增生型,PI=近端炎症型,MHC II=主要组织相容性II类基因标签。
图20示出了在增生、非沉默突变负荷、和关键药物靶标(CD274(PD-L1)、PDCD1(PD-1)和CTLA4)方面的显著腺癌(AD)亚型差异。如实施例4中所述来测定AD。
图21示出了针对临床实体瘤突变小组(表8中公开的322种基因)中的大多数基因,AD亚型的显著药物靶基因表达差异。在AD亚型中,65%的小组基因显示出显著可变的表达(KWBonferroni阈值p<0.000155)。如实施例4中所述,测定AD亚型分型。
图22示出了针对临床实体瘤突变小组(表8中公开的322种基因)中的大多数基因,AD的显著药物靶基因表达差异。在AD亚型中,63%的小组基因显示出显著可变的表达(KWBonferroni阈值p<0.000155)。如实施例5中所述,测定AD亚型分型。
图23示出了在增生方面的显著腺癌(AD)亚型差异。如实施例5中所述,测定AD亚型分型。
发明详述
概述
本发明提供了用于鉴定或诊断肺癌的试剂盒、组合物和方法。也就是说,该方法可以用于肺癌(特别是肺腺癌(AD))的在分子上定义的亚组。该方法提供了肺癌的分类,其可以针对治疗反应进行预后和预测。虽然是用于流行病学目的的有用术语,但“肺癌”可能不是指特定疾病,而是可以代表肺部、支气管和胸膜的肿瘤的异质集合。出于实际目的,肺癌通常可以分为两种组织学亚型-小细胞肺癌(SCLC)和非小细胞肺癌(NSCLC)。这些主要肿瘤类型可以以不同的频率存在,可以具有不同的解剖学位置,可以具有不同的转移偏好,可以对疗法有不同的反应,并且可能源自不同的细胞祖细胞。
“确定腺癌亚型”可以包括,例如,诊断或检测肺腺癌的存在和类型,监测疾病的进展,以及鉴定或检测指示亚型的细胞或样品。
在一个实施方案中,通过评价一个或多个受试者样品中多种分类器基因或生物标记物的表达模式或表达谱来评估肺癌状态。出于讨论的目的,术语受试者或受试者样品是指个体而不论健康和/或疾病状态。受试者可以是受试者、研究参与者、对照受试者、筛查受试者、或在本发明的上下文中从其获得和评估样品的任何其他类别的个体。因此,受试者可以被诊断患有肺腺癌(包括亚型或其等级),可以出现肺AD癌的一种或多种症状、或肺癌的易感因素(例如家族(遗传)或病史(医学)因子),可以正在经历肺癌治疗或疗法等。可替代地,关于任何上述因子或标准,受试者可以是健康的。应当理解,如本文所用的术语“健康的”与肺癌状态有关,因为术语“健康的”不能被定义为对应于任何绝对评价或状态。因此,参考任何特定疾病或疾病标准定义为健康的个体实际上可以被诊断患有任何其他一种或多种疾病,或者表现出任何其他一种或多种疾病标准(包括一种或多种其他癌症)。
如本文所用,“表达谱”或“生物标记物谱”或“基因标签”包含对应于鉴别性或分类器基因或生物标记物的表达的相对丰度、水平、存在或不存在的测量值的一个或多个值。表达谱可以来源于在肺癌诊断之前或之后的受试者,可以来源于在治疗或疗法之前或之后的一个或多个时间点从受试者收集的生物样品,可以来源于在其间没有进行治疗或疗法(例如,以监测疾病的进展或评估被诊断患有肺癌或有患肺癌风险的受试者的疾病的发展)的一个或多个时间点从受试者收集的生物样品,或者可以从健康的受试者收集。术语受试者可以与患者互换使用。患者可以是人类患者。本文提供的生物标记物谱的该一种或多种生物标记物选自表1的一种或多种生物标记物。
如本文所用,术语“确定表达水平”或“确定表达谱”或“检测表达水平”或“检测表达谱”如关于生物标记物或分类器所用,意指向样品(例如受试者或患者的样品和/或对照样品)应用生物标记物特异性试剂(例如探针、引物或抗体)和/或方法,用于定量、半定量或定性地确定或测量一种或多种生物标记物的量(例如生物标记物多肽或mRNA(或由其衍生的cDNA)的量)。例如,生物标记物的水平可以通过许多方法确定,包括例如免疫测定,包括例如免疫组织化学、ELISA、Western印迹、免疫沉淀等,其中生物标记物检测试剂例如抗体(例如标记的抗体)特异性结合生物标记物并允许例如相对或绝对确定多肽生物标记物的量;杂交和PCR方案,其中使用探针或引物或引物组来确定核酸生物标记物的量,包括例如基于探针和基于扩增的方法,包括例如微阵列分析、RT-PCR(如定量RT-PCR(qRT-PCR))、基因表达系列分析(SAGE)、Northern印迹、数字分子条形码技术(例如纳米串(Nanostring)计数器分析)和TaqMan定量PCR试验。可以应用其他mRNA检测和定量方法,例如在福尔马林固定的石蜡包埋(FFPE)组织样品或细胞中的mRNA原位杂交。该技术目前由QuantiGene ViewRNA(Affymetrix)提供,其使用每个mRNA的探针组,该探针组特异性结合扩增系统以扩增杂交信号;可以使用标准荧光显微镜或成像系统使这些放大的信号可视化。例如,该系统可以检测和测量异质样品中的转录物水平;例如,如果样品具有存在于相同的组织切片中的正常和肿瘤细胞。如上所述,基于TaqMan探针的基因表达分析(基于PCR)也可以用于测量组织样品中的基因表达水平,并且该技术已显示可用于测量FFPE样品中的mRNA水平。简言之,基于TaqMan探针的测定利用与mRNA靶标特异性杂交的探针。该探针含有附着于各末端的淬灭剂染料和报告染料(荧光分子),并且仅在与mRNA靶标特异性杂交时才发出荧光。在扩增步骤期间,聚合酶的核酸外切酶活性导致淬灭剂和报告染料从探针上分离,并且可以发生荧光发射。记录该荧光发射并通过检测系统测量信号;将这些信号强度用于计算样品中给定转录物(基因表达)的丰度。
在一个实施方案中,与本文(例如,表1和表2)所述的基因盒或分类器基因相关的“表达谱”或“生物标记物谱”或“基因标签”可以用于在正常样品与肿瘤样品之间作出区分。在另一个实施方案中,肿瘤样品是肺腺癌(AD)。在另一个实施方案中,基于使用本文提供的方法确定的表达谱,AD可以进一步被分类为支气管型、鳞状型和巨型。使用肿瘤活组织检查组织对支气管型、鳞状型和巨型腺癌的表征已经在Hayes等人(2006)J.Clin Oncol.24(31):5079-90中进行了描述。使用本文(例如,表1)公开的分类器基因的表达谱可以为特异性鉴定肺腺癌亚型以及为评价治疗肺腺癌的治疗功效提供有价值的分子工具。因此,本发明提供了用于对受试者的分子AD亚型进行筛查和分类的方法和用于监测肺AD的某些治疗性治疗的功效的方法。
在一些情况下,本文提供的单一分类器基因能够鉴定肺腺癌的亚型,其预测成功率为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%。
在一些情况下,如本文提供的单一分类器基因能够确定肺腺癌亚型,其灵敏度或特异性为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%。
本发明还涵盖能够区分使用现有方法无法检测的各种肺腺癌亚型的系统。该系统能够处理大量受试者和受试者变量例如表达谱和其他诊断标准。本文所述的方法也可以用于类似于药物基因组学(pharmacogenomics)的“药物代谢组学”(pharmacometabonomics),例如,预测对疗法的反应。在该实施方案中,可以使用表达谱作为“反应”的证据将受试者分成“反应者”和“非反应者”,然后可以使用表达谱的特征来靶向将可能对特定治疗过程有反应的未来受试者。
表达谱可以与其他诊断方法组合使用,包括组织化学、免疫组织化学、细胞学、免疫细胞学、和视觉诊断方法,包括肺组织的组织学或形态学评价。
在本发明的各种实施方案中,将来源于受试者的表达谱与参考表达谱进行比较。“参考表达谱”可以是从在治疗或疗法之前的受试者来源的谱;可以是在特定时间点(通常在治疗或疗法之前或之后,但也可以包括在诊断肺癌之前或之后的特定时间点)从受试者样品产生的谱;或者可以来源于健康个体或来自健康个体的合并参考。参考表达谱可以是肺癌通用的,或者可以对肺腺癌的不同亚型有特异性。
可以将参考表达谱与测试表达谱进行比较。“测试表达谱”可以源自于与参考表达谱相同的受试者(除了在随后的时间点(例如,在收集参考表达谱之后的一天或多天、一周或几周、或者一个月或几个月)之外),或者可以源自于不同的受试者。总之,可以将受试者的任何测试表达谱与来自具有TRU、PP或PI亚型的受试者的先前收集的谱进行比较。
本发明的分类器生物标记物可以包括核酸(RNA、cDNA和DNA)和蛋白质、及其变体和片段。此类生物标记物可以包括含有编码生物标记物的核酸序列的全部或部分序列的DNA,或这样的序列的互补序列。本文所述的生物标记物可以包括含有任何感兴趣核酸序列的全部或部分序列的RNA,或其在逆转录反应中体外合成获得的非天然cDNA产物。生物标记物核酸还可以包括感兴趣核酸序列的任何表达产物或其部分。生物标记物蛋白质可以是由本发明的DNA生物标记物编码或与其对应的蛋白质。生物标记物蛋白质可以包含任何生物标记物蛋白质或多肽的全部或部分氨基酸序列。生物标记物核酸可以从细胞中提取,或者可以是无细胞的或从细胞外囊泡实体(如外泌体)中提取。
“分类器生物标记物”或“生物标记物”或“分类器基因”可以是与正常或健康细胞或组织相比其在组织或细胞中表达的水平改变的任何基因或蛋白质。例如,“分类器生物标记物”或“生物标记物”或“分类器基因”可以是在特定肺腺癌亚型中其在组织或细胞中表达的水平改变的任何基因或蛋白质。检测本发明的生物标记物可以允许对特定亚型的确定。“分类器生物标记物”或“生物标记物”或“分类器基因”可以是相对于如本文提供的参考或对照被上调(例如表达增加)或被下调(例如表达降低)的那种基因或蛋白质。参考或对照可以是如本文提供的任何参考或对照。在一些实施方案中,可以将在肺腺癌的特定亚型中上调或下调的基因的表达值合并到一个基因盒中。在每个基因盒中的总体表达水平在本文中称为“表达谱”,并且用于根据肺腺癌的亚型对测试样品进行分类。然而,应理解,对本文公开的每种基因的表达的独立评价可以用于对肿瘤亚型进行分类,而无需将被上调和下调的基因分组成一个或多个基因盒。在一些情况下,如表2中所示,可以将总共48种生物标记物用于AD亚型确定。对于每种AD亚型,16种生物标记物中的8种可以是负相关基因,而8种可以是正相关基因,其可以被选择作为特定AD亚型的基因标签。
本发明的分类器生物标记物包括在肺腺癌中选择性表达的任何基因或蛋白质,如本文上面所定义。样品生物标记物基因列于下表1或表2中。在表2中,该表的第一列表示选择用于区分末端呼吸单元型(TRU)的生物标记物列表。该表的中间列表示选择用于区分近端增生型(PP)的生物标记物列表。该表的最后一列表示选择用于区分近端炎症型(PI)的生物标记物列表。
表1中显示了用于肺AD亚型分型的分类器生物标记物的如本文所述的由tsat表示的相对基因表达水平。在一个实施方案中,表1中显示了用于肺腺癌亚型分型的分类器生物标记物的基因表达水平。在一个实施方案中,所有48种基因都可以用于分类AD的亚型。在一个实施方案中,前16种基因是末端呼吸单元型的选定基因标签生物标记物,其中与非TRU样品相比,基因编号1-8被上调且基因编号9-16被下调。在另一个实施方案中,基因编号17-32是对近端增生型(PP)有特异性的选定基因标签生物标记物,其中与非PP样品相比,基因编号17-24被上调且基因编号25-32被下调。在又另一个实施方案中,基因编号33-48是对近端炎症型(PI)有特异性的选定基因标签生物标记物,其中与非PI样品相比,基因编号33-40被上调且基因编号41-48被下调。
表1.肺腺癌(AD)亚型的48种分类器生物标记物的基因质心(Gene Centroid)
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
表2.针对末端呼吸单元型、近端增生型和近端炎症型选择的分类器生物标记物
诊断用途
在一个实施方案中,本文提供的方法和组合物允许用比本领域已知的分子AD亚型分型方法所需的基因更少的基因来区分腺癌的三种亚型:(1)末端呼吸单元型(TRU),以前称为支气管型;(2)近端增生型(PP),以前称为巨型;以及(3)近端炎症型(PI),以前称为鳞状型。
通常,将本文提供的方法用于将肺癌样品分类为特定的肺癌亚型(例如腺癌的亚型)。在一个实施方案中,该方法包括测量、检测或确定任何可公开获得的肺AD表达数据集的至少一种分类器生物标记物的表达水平。在一个实施方案中,该方法包括检测或确定从患者或受试者获得的肺癌样品中表1的至少一种分类器生物标记物的表达水平。用于本文所述的检测或区分方法的肺癌样品可以是先前确定或诊断为腺癌样品的样品。先前的诊断可以是基于组织学分析。组织学分析可以由一名或多名病理学家进行。
在一个实施方案中,测量或检测步骤是在核酸水平上,其通过在适合于RNA-seq、RT-PCR或杂交的条件下,用与该至少一种分类器生物标记物(例如表1的分类器生物标记物)的cDNA分子的部分基本上互补的寡核苷酸进行RNA-seq、逆转录酶聚合酶链反应(RT-PCR)或杂交测定,并且基于检测步骤获得该至少一种分类器生物标记物的表达水平。然后将该至少一种分类器生物标记物的表达水平与来自至少一个样品训练集的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的参考表达水平进行比较。该至少一个样品训练集可以包含,(i)来自过表达该至少一种生物标记物的样品的至少一种生物标记物的表达水平,(ii)来自参考鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)样品的表达水平,或(iii)来自无腺癌的肺部样品的表达水平,并且将肺组织样品分类为鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)亚型。然后可以基于比较步骤的结果将肺癌样品分类为支气管型、鳞状型或巨型腺癌亚型。在一个实施方案中,比较步骤可以包括应用统计算法,该统计算法包括确定从肺部组织或癌症样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于该统计算法的结果将肺部组织或癌症样品分类为鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)亚型。
在一个实施方案中,该方法包括在从患者获得的肺癌样品中在核酸水平上探测本文提供的至少一种分类器生物标记物(例如表1的分类器生物标记物)的水平。肺癌样品可以是先前确定或诊断为腺癌样品的样品。先前的诊断可以是基于组织学分析。组织学分析可以由一名或多名病理学家进行。在一个实施方案中,探测步骤包括在适合于一种或多种寡核苷酸与其互补序列或基本互补序列杂交的条件下将样品与该一种或多种寡核苷酸混合,该寡核苷酸与本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的cDNA分子的部分基本上互补;检测该一种或多种寡核苷酸与其互补序列或基本互补序列之间是否发生杂交;并且基于检测步骤获得该至少一种分类器生物标记物的杂交值。然后将该至少一种分类器生物标记物的杂交值与来自至少一个样品训练集的一个或多个参考杂交值进行比较。例如,该至少一个样品训练集包含来自参考TRU腺癌、PP腺癌和/或PI腺癌样品的杂交值。基于比较步骤的结果,将肺癌样品分类为例如TRU、PP或PI。
肺组织样品可以是从人受试者或患者分离的任何样品。例如,在一个实施方案中,对包埋在石蜡中的肺活组织检查上进行分析。在一个实施方案中,样品可以是新鲜冷冻的肺组织样品。在另一个实施方案中,样品可以是从患者获得的体液。体液可以是血液或其部分(即,血清、血浆)、尿液、唾液、痰液或脑脊髓液(CSF)。样品可以含有用于在本文提供的方法中使用的核酸的细胞来源以及细胞外来源。细胞外来源可以是无细胞的DNA和/或外泌体。在一个实施方案中,样品可以是细胞沉淀物或洗涤液。本发明的这个方面提供了一种通过精确鉴定主要组织学类型(甚至从小的活组织检查中)来改善当前诊断的手段。本发明的方法(包括RT-PCR方法)是灵敏的、精确的并且具有多分析物能力以便用于石蜡包埋的样品。参见例如,Cronin等人(2004)Am.J Pathol.164(1):35-42,通过引用并入本文。
在光学显微镜评价之前,福尔马林固定和石蜡中的组织包埋是组织处理的通用方法。福尔马林固定的石蜡包埋的(FFPE)样本提供的主要优点是保留组织切片中的细胞和结构学形态细节。(Fox等人(1985)J Histochem Cytochem 33:845-853)。在其中处理活组织检查样本的标准缓冲福尔马林固定剂典型地是含有37%甲醛和10%-15%甲醇的水性溶液。甲醛是一种高反应性偶极化合物,其导致在体外形成蛋白质-核酸和蛋白质-蛋白质交联(Clark等人(1986)J Histochem Cytochem 34:1509-1512;McGhee和von Hippel(1975)Biochemistry 14:1281-1296,各自通过引用并入本文)。
在一个实施方案中,本文使用的样品获自个体,并且包含福尔马林固定的石蜡包埋的(FFPE)组织。然而,其他组织和样品类型适合于在本文中使用。在一个实施方案中,其他组织和样品类型可以是新鲜冷冻的组织、洗涤液体或细胞沉淀物等。在一个实施方案中,样品可以是从个体获得的体液。体液可以是血液或其部分(例如,血清、血浆)、尿液、痰液、唾液或脑脊髓液(CSF)。如本文提供的生物标记物核酸可以从细胞中提取,或者可以是无细胞的或从细胞外囊泡实体(如外泌体)中提取。
用于从FFPE组织中分离RNA的方法在本领域中是已知的。在一个实施方案中,可以从FFPE组织中分离总RNA,如由Bibikova等人(2004)American Journal of Pathology 165:1799-1807所述,通过引用并入本文。同样,可以使用高纯的RNA石蜡试剂盒(High Pure RNAParaffin Kit)(罗氏公司(Roche))。通过二甲苯萃取去除石蜡,随后用乙醇洗涤。可以使用MasterPure纯化试剂盒(Epicenter,Madison,Wis.)从切片组织块中分离RNA;包括DNA酶I处理步骤。可以根据供应商的说明书(Invitrogen Life Technologies,Carlsbad,Calif.)使用Trizol试剂从冷冻样品中提取RNA。可以将具有可测量的残留基因组DNA的样品重新进行DNaseI处理并测定DNA污染。可以根据制造商的方案进行所有纯化、DNA酶处理和其他步骤。在总RNA分离之后,可以将样品储存在-80℃下直至使用。
用于mRNA提取的一般方法是本领域熟知的,并且公开于分子生物学的标准教科书中,包括Ausubel等人,编辑,Current Protocols in Molecular Biology,John Wiley&Sons,New York 1987-1999。从石蜡包埋的组织中提取RNA的方法公开于例如Rupp和Locker(LabInvest.56:A67,1987)以及De Andres等人(Biotechniques 18:42-44,1995)中。具体地,可以使用来自商业制造商例如Qiagen(Valencia,Calif.)的纯化试剂盒、缓冲液组和蛋白酶根据制造商的说明书进行RNA分离。例如,可以使用Qiagen RNeasy微型柱分离来自培养物中的细胞的总RNA。其他可商购的RNA分离试剂盒包括MasterPureTM。完整的DNA和RNA纯化试剂盒(Complete DNA and RNA Purification Kit)(Epicentre,Madison,Wis.)以及石蜡块RNA分离试剂盒(Paraffin Block RNA Isolation Kit)(Ambion,Austin,Tex.)。可以例如使用RNA Stat-60(Tel-Test,Friendswood,Tex.)分离来自组织样品的总RNA。可以例如通过氯化铯密度梯度离心分离从肿瘤制备的RNA。另外,可以使用本领域技术人员熟知的技术(例如Chomczynski的单步RNA分离方法(美国专利号4,843,155,出于所有目的将该文献通过引用以其整体并入)容易地处理大量的组织样品。
在一个实施方案中,样品包含从肺组织样品(例如腺癌样品)收获的细胞。可以使用本领域已知的标准技术从生物样品中收获细胞。例如,在一个实施方案中,通过离心细胞样品并重悬浮沉淀的细胞来收获细胞。可以将细胞重悬浮于缓冲溶液如磷酸盐缓冲盐水(PBS)中。在将细胞悬浮液离心获得细胞沉淀之后,可以将细胞裂解以提取核酸,例如信使RNA。所有获得自受试者的样品,包括经受任何种类的进一步处理的那些,均应认为是获得自该受试者。
在一个实施方案中,在检测本文所列出的生物标记物组合的生物标记物水平之前,将样品进一步处理。例如,在细胞或组织样品中的mRNA可以与该样品的其他组分分开。可以将样品浓缩和/或纯化以分离处于其非天然状态的mRNA,因为mRNA不是处于其天然环境中。例如,研究已经表明体内mRNA的较高级结构不同于相同序列的体外结构(参见例如,Rouskin等人(2014).Nature 505,第701-705页,出于所有目的以其整体并入本文)。
在一个实施方案中,来自样品的mRNA与合成DNA探针杂交,该探针在一些实施方案中包括检测部分(例如,可检测标记、捕获序列、条形码报告序列)。因此,在这些实施方案中,最终制得非天然mRNA-cDNA复合物并将其用于检测生物标记物。在另一个实施方案中,将来自样品的mRNA直接用可检测标记(例如荧光团)进行标记。在另外的实施方案中,非天然标记的mRNA分子杂交至cDNA探针,并且检测复合物。
在一个实施方案中,一旦从样品获得mRNA,则将其在杂交反应中转化为互补DNA(cDNA),或者与一种或多种cDNA探针一起用于杂交反应中。cDNA在体内不存在,并因此是非天然分子。另外,cDNA-mRNA杂交体是合成的并且在体内不存在。除了cDNA在体内不存在之外,cDNA必然不同于mRNA,因为它包括脱氧核糖核酸而非核糖核酸。然后例如通过聚合酶链反应(PCR)或本领域普通技术人员已知的其他扩增方法将cDNA扩增。例如,可以采用的其他扩增方法包括连接酶链反应(LCR)(Wu和Wallace,Genomics,4:560(1989),Landegren等人,Science,241:1077(1988),出于所有目的将该文献通过引用以其整体并入);转录扩增(Kwoh等人,Proc.Natl.Acad.Sci.USA,86:1173(1989),出于所有目的将该文献通过引用以其整体并入);自持序列复制(self-sustained sequence replication)(Guatelli等人,Proc.Nat.Acad.Sci.USA,87:1874(1990),出于所有目的将该文献通过引用以其整体并入),出于所有目的将该文献通过引用以其整体并入;以及基于核酸的序列扩增(NASBA)。用于选择PCR扩增引物的指南对于本领域普通技术人员而言是已知的。参见例如,McPherson等人,PCR Basics:From Background to Bench,Springer-Verlag,2000,出于所有目的将该文献通过引用以其整体并入。这种扩增反应的产物(即扩增的cDNA)必然也是非天然产物。首先,如上所述,cDNA是非天然分子。其次,在PCR的情况下,扩增过程用于针对起始材料的每个单独cDNA分子产生数以亿计的cDNA拷贝。生成的拷贝数目与体内存在的mRNA的拷贝数目相差甚远。
在一个实施方案中,将cDNA用将另外的DNA序列(例如,衔接子、报告子、捕获序列或部分、条形码)引入片段上的引物(例如,使用衔接子特异性引物)扩增,或者将mRNA或cDNA生物标记物序列直接与包含该另外的序列(例如,衔接子、报告子、捕获序列或部分、条形码)的cDNA探针杂交。因此扩增和/或mRNA与cDNA探针的杂交用于通过引入另外的序列并形成非天然杂交体而从非天然单链cDNA或mRNA产生非天然双链分子。另外,如本领域普通技术人员已知的,扩增程序具有与其相关的错误率。因此,扩增将另外的修饰引入cDNA分子中。在一个实施方案中,在用衔接子特异性引物扩增期间,可检测标记(例如荧光团)被添加到单链cDNA分子上。因此,扩增还用于产生天然不存在的DNA复合物,至少因为(i)cDNA在体内不存在,(i)衔接子序列被添加到cDNA分子的末端以得到体内不存在的DNA序列,(ii)与扩增相关的错误率进一步产生体内不存在的DNA序列,(iii)与天然存在的那些相比cDNA分子的结构不同,以及(iv)将可检测标记化学添加到cDNA分子上。
在一些实施方案中,感兴趣的生物标记物的表达是经由检测非天然cDNA分子在核酸水平上检测的。
在一些实施方案中,用于肺癌AD亚型分型的方法包括检测分类器生物标记物组的表达水平。在一些实施方案中,检测包括在核酸水平或蛋白质水平上的表1的所有分类器生物标记物。在另一个实施方案中,检测表1的分类器生物标记物的单个或子集(例如,从约8种至约16种)。例如,在一个实施方案中,在确定肺癌AD亚型的方法中检测了表1中的从约5种至约10种、从约5种至约15种、从约5种至约20种、从约5种至约25种、从约5种至约30种、从约5种至约35种、从约5种至约40种、从约5种至约45种、从约5种至约48种生物标记物。在另一个实施方案中,在确定肺癌亚型的方法中检测来自表1的每种生物标记物。在另一个实施方案中,选择来自表1的16种生物标记物作为特定肺癌AD亚型的基因标签。
例如使用对分类器生物标记物有特异性的引物和/或探针、和/或类似物,可以通过任何合适的技术(包括但不限于RNA-seq、逆转录酶聚合酶链反应(RT-PCR)、微阵列杂交测定、或另一种杂交测定(例如纳米串测定))来进行检测。在一些情况下,用于扩增方法(例如,RT-PCR或qRT-PCR)的引物是适用于结合本文提供的分类器基因(例如表1中列出的分类器生物标记物)的任何正向和反向引物。
本文所述的生物标记物包括含有任何感兴趣核酸序列的全部或部分序列的RNA,或其在逆转录反应中体外合成获得的非天然cDNA产物。术语“片段”旨在指代通常包含至少10个、15个、20个、50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、800个、900个、1,000个、1,200个、或1,500个连续核苷酸或高达存在于本文公开的全长生物标记物多核苷酸中的核苷酸数目的多核苷酸的一部分。生物标记物多核苷酸的片段将通常编码至少15个、25个、30个、50个、100个、150个、200个、或250个连续氨基酸,或高达存在于本发明的全长生物标记物蛋白中的氨基酸总数。
在一些实施方案中,过表达(例如RNA转录物或其表达产物的过表达)通过归一化至参考RNA转录物或其表达产物的水平来确定,该参考RNA转录物或其表达产物可以是样品中的所有测量的转录物(或其产物)或特定的RNA转录物(或其非天然cDNA产物)的参考集。进行归一化以校正所测定的RNA或cDNA的量的差异以及所使用的RNA或cDNA的质量的变化两者,或使这两者归一化。因此,测定典型地测量并结合某些归一化基因(包括众所周知的管家基因,如例如GAPDH和/或β-肌动蛋白)的表达。可替代地,归一化可以是基于所有所测定的生物标记物或其大的子集的平均或中值信号(全局归一化方法)。
可以将分离的mRNA用于杂交或扩增测定,其包括但不限于Southern或Northern分析、PCR分析和探针阵列、纳米串测定。检测mRNA水平的一种方法涉及使分离的mRNA或合成的cDNA与核酸分子(探针)接触,该核酸分子可以与被检测基因编码的mRNA杂交。核酸探针可以是例如cDNA或其部分,例如长度为至少7个、15个、30个、50个、100个、250个、或500个核苷酸的寡核苷酸并且足以在严格条件下与本发明的非天然cDNA或mRNA生物标记物特异性地杂交。
如上所解释,在一个实施方案中,一旦从样品中获得mRNA,就在杂交反应中将其转化为互补DNA(cDNA)。可以用包含与特定mRNA的一部分互补的序列的寡核苷酸或引物进行mRNA向cDNA的转化。可以用包含随机序列的寡核苷酸或引物进行mRNA向cDNA的转化。可以用包含与mRNA的poly(A)尾互补的序列的寡核苷酸或引物进行mRNA向cDNA的转化。cDNA在体内不存在,并因此是非天然分子。在另外的实施方案中,然后例如通过聚合酶链反应(PCR)或本领域普通技术人员已知的其他扩增方法将cDNA扩增。可以用包含与本文提供的分类器基因(例如表1中的分类器生物标记物)的至少一部分互补的序列的正向和/或反向引物进行PCR。这种扩增反应的产物(即扩增的cDNA)必然是非天然产物。如上所述,cDNA是非天然分子。其次,在PCR的情况下,扩增过程用于针对起始材料的每个单独cDNA分子产生数以亿计的cDNA拷贝。生成的拷贝数目与体内存在的mRNA的拷贝数目相差甚远。
在一个实施方案中,用将另外的DNA序列(衔接子序列)引入片段上的引物(使用衔接子特异性引物)扩增cDNA。衔接子序列可以是尾部,其中该尾部序列不与cDNA互补。例如,包含与本文提供的分类器基因(例如来自表1的分类器生物标记物)的至少一部分互补的序列的正向和/或反向引物可以包含尾部序列。因此,通过将条形码、衔接子和/或报告序列引入已经非天然的cDNA上,扩增用于从非天然单链cDNA产生非天然双链分子。在一个实施方案中,在用衔接子特异性引物扩增期间,可检测标记(例如荧光团)被添加到单链cDNA分子上。因此,扩增还用于产生天然不存在的DNA复合物,至少因为(i)cDNA在体内不存在,(ii)衔接子序列被添加到cDNA分子的末端以得到体内不存在的DNA序列,(iii)与扩增相关的错误率进一步产生体内不存在的DNA序列,(iv)与天然存在的那些相比cDNA分子的结构不同,以及(v)将可检测标记化学添加到cDNA分子上。
在一个实施方案中,经由与探针杂交,例如经由微阵列,将合成的cDNA(例如,扩增的cDNA)固定在固体表面上。在另一个实施方案中,经由引入与cDNA产物杂交的荧光探针,经由实时聚合酶链反应(PCR)检测cDNA产物。例如,在一个实施方案中,通过定量荧光RT-PCR(例如,使用探针)评估生物标记物检测。对于PCR分析,本领域中可获得用于确定用于在分析中使用的引物序列的众所周知的方法。
在一个实施方案中,本文提供的生物标记物通过使用捕获探针和/或报告探针的杂交反应来检测。例如,杂交探针是衍生到固体表面(例如珠粒、玻璃或硅基底)上的探针。在另一个实施方案中,捕获探针存在于溶液中并与患者样品混合,随后例如通过生物素-亲和素相互作用将杂交产物附着于表面(例如,其中生物素是捕获探针的一部分,并且亲和素在表面上)。在一个实施方案中,杂交测定使用捕获探针和报告探针两者。报告探针可以与捕获探针或生物标记物核酸中的任一者杂交。然后对报告探针进行计数和检测,以确定样品中一种或多种生物标记物的水平。在一个实施方案中,捕获探针和/或报告探针含有可检测标记,和/或允许官能化到表面上的基团。
例如,nCounter基因分析系统(参见例如,Geiss等人(2008)Nat.Biotechnol.26,第317-325页,出于所有目的,通过引用以其整体并入)适用于与本文提供的方法一起使用。
在美国专利号7,473,767和8,492,094(出于所有目的将其公开内容通过引用以其整体并入)中描述的杂交测定适用于与本文提供的方法一起使用,即,适用于检测本文所述的生物标记物和生物标记物组合。
可以使用膜印迹(例如用于杂交分析,如Northern印迹、Southern印迹、斑点印迹等)、或微孔、样品管、凝胶、珠粒或纤维(或包含结合核酸的任何固体支持物)来监测生物标记物水平。参见例如,美国专利号5,770,722、5,874,219、5,744,305、5,677,195和5,445,934,各自通过引用以其整体并入。
在一个实施方案中,将微阵列用于检测生物标记物水平。由于不同实验之间的再现性,微阵列特别适合于此目的。DNA微阵列提供了一种同时测量大量基因的表达水平的方法。每个阵列由附着于固体支持物上的可再现模式的捕获探针组成。标记的RNA或DNA与阵列上的互补探针杂交,并然后通过激光扫描阵列上每个探针的杂交强度来检测,并将其转化为代表相对基因表达水平的定量值。参见例如,美国专利号6,040,138、5,800,992和6,020,135、6,033,860和6,344,316各自通过引用以其整体并入。高密度寡核苷酸阵列特别适用于确定样品中大量RNA的基因表达谱。
使用机械合成方法合成这些阵列的技术描述于例如美国专利号5,384,261中。尽管通常使用平面阵列表面,但是阵列可以制造在几乎任何形状的表面或甚至多个表面上。阵列可以是在珠粒、凝胶、聚合物表面、纤维(例如光纤)、玻璃或任何其他适当的基底上的核酸(或肽)。参见例如,美国专利号5,770,358、5,789,162、5,708,153、6,040,193和5,800,992,各自通过引用以其整体并入。阵列可以以这样一种方式包装,以致于允许全包式设备的诊断或其他操作。参见例如,美国专利号5,856,174和5,922,591,各自通过引用以其整体并入。
在一个实施方案中,将基因表达系列分析(SAGE)用于本文所述的方法中。SAGE是允许同时和定量分析大量基因转录物的方法,无需为每种转录物提供单独的杂交探针。首先,生成短序列标签(约10-14bp),其中含有足够的信息来独特地鉴定转录物,条件是该标签是从每个转录物内的独特位置获得的。然后,许多转录物连接在一起形成长系列分子,可以对其进行测序,同时揭示多个标签的身份。通过确定单个标签的丰度并鉴定与每个标签对应的基因,可以定量评价任何转录物群体的表达模式。参见Velculescu等人Science 270:484-87,1995;Cell 88:243-51,1997,将该文献通过引用以其整体并入。
在核酸水平上的另外的生物标记物水平分析方法是使用测序方法,例如RNAseq、下一代测序和大规模平行标签测序(MPSS),如Brenner等人(Nat.Biotech.18:630-34,2000,将该文献通过引用以其整体并入)所描述的。这是在单独的5μm直径微珠上将基于非凝胶的标签测序与数百万个模板的体外克隆组合的一种测序方法。首先,通过体外克隆构建DNA模板的微珠文库。随后是在流动池中以高密度(典型地大于3.0X 106个微珠/cm2)组装含有模板的微珠的平面阵列。使用不需要DNA片段分离的基于荧光的标签测序方法,同时分析每个微珠上的所克隆模板的自由端。已经显示该方法在一次操作中同时且准确地提供来自酵母cDNA文库的数十万个基因标签序列。
在核酸水平上的另一种生物标记物水平分析方法是使用扩增方法,如例如RT-PCR或定量RT-PCR(qRT-PCR)。用于确定样品中生物标记物mRNA水平的方法可以包括:核酸扩增的过程,例如通过RT-PCR(Mullis,1987,美国专利号4,683,202中所述的实验性实施方案)、连接酶链反应(Barany(1991)Proc.Natl.Acad.Sci.USA 88:189-193)、自持序列复制(Guatelli等人(1990)Proc.Natl.Acad.Sci.USA 87:1874-1878)、转录扩增系统(Kwoh等人(1989)Proc.Natl.Acad.Sci.USA 86:1173-1177)、Qβ复制酶(Lizardi等人(1988)Bio/Technology6:1197)、滚环复制(Lizardi等人,美国专利号5,854,033)或任何其他核酸扩增方法;随后使用本领域技术人员熟知的技术检测所扩增的分子。许多不同的PCR或qRT-PCR方案是本领域已知的,并且可以使用目前描述的组合物直接应用于或适用于检测和/或定量样品中区别基因的表达。参见例如,Fan等人(2004)Genome Res.14:878-885,通过引用并入本文。通常,在PCR中,通过与至少一种寡核苷酸引物或一对寡核苷酸引物反应来扩增靶多核苷酸序列。一种或多种引物与靶核酸的互补区杂交,并且DNA聚合酶延伸该一种或多种引物以扩增靶序列。在足以提供基于聚合酶的核酸扩增产物的条件下,一种大小的核酸片段为主反应产物(作为扩增产物的靶多核苷酸序列)。重复扩增循环以增加单个靶多核苷酸序列的浓度。反应可以在通常用于PCR的任何热循环仪中进行。
在一些情况下定量RT-PCR(qRT-PCR)(也称为实时RT-PCR)是优选的,因为它不仅提供定量测量,还提供减少的时间和污染。如本文所用,“定量PCR”(或“实时qRT-PCR”)是指当PCR扩增发生时在不需要对反应产物重复取样的情况下直接监测PCR扩增的进程。在定量PCR中,可以在产生反应产物时通过信号传导机制(例如荧光)监测反应产物,并在信号上升到背景水平之后但在反应达到平稳之前跟踪反应产物。达到可检测或“阈值”荧光水平所需的循环次数直接随着PCR过程开始时可扩增靶标的浓度而变化,从而能够测量信号强度以实时提供样品中靶核酸的量的量度。可以将DNA结合染料(例如,SYBR green)或标记探针用于检测通过PCR扩增产生的延伸产物。可以使用利用包含本发明序列的标记探针的任何探针形式。
免疫组织化学方法也适用于检测本发明的生物标记物的水平。可以将样品冷冻用于后续制备或立即置于固定剂溶液中。可以组织样品通过用试剂如福尔马林、戊二醛、甲醇等处理来固定,并包埋在石蜡中。从福尔马林固定的、石蜡包埋的组织样品制备用于免疫组织化学分析的切片的方法是本领域熟知的。
在一个实施方案中,将本文提供的生物标记物(例如表1的分类器生物标记物(或其子集,例如8种至16种、16种至32种、或32种至48种生物标记物))的水平针对所有RNA转录物或其非天然cDNA表达产物、或样品中蛋白质产物的表达水平、或者RNA转录物的参考集或其非天然cDNA表达产物的参考集、或其样品中蛋白质产物的参考集的表达水平进行归一化。
在一个实施方案中,可以使用本文提供的分类器基因(例如表1中列出的分类器生物标记物)中的一种或多种的蛋白质表达水平来评价肺腺癌亚型。可以使用免疫学检测方法来测量蛋白质表达水平。可以用于本文中的免疫学检测方法包括但不限于使用如下技术的竞争性和非竞争性测定系统,例如Western印迹、放射免疫测定、ELISA(酶联免疫吸附测定)、“三明治”免疫测定、免疫沉淀测定、沉淀素反应、凝胶扩散沉淀素反应、免疫扩散测定、凝集测定、补体固定测定、免疫放射测定、荧光免疫测定、蛋白A免疫测定等。此类测定是常规的并且是本领域熟知的(参见例如,Ausubel等人,编辑,1994,Current Protocols inMolecular Biology,第I卷,John Wiley&Sons,Inc.,New York,将其通过引用以其整体并入)。
在一个实施方案中,利用对生物标记物蛋白有特异性的抗体来检测身体样品中生物标记物蛋白的表达。该方法包括从患者或受试者获得身体样品,使身体样品与针对在肺癌细胞中选择性表达的生物标记物的至少一种抗体接触,并且检测抗体结合以确定生物标记物是否在患者样品中表达。本发明的优选方面提供了用于诊断肺癌亚型的免疫细胞化学技术。本领域技术人员将认识到,本文下面描述的免疫细胞化学方法可以手动进行或以自动方式进行。
如贯穿全文所提供的,本文所述的方法提供了用于确定患者的肺癌AD亚型的方法。一旦例如通过测量非天然cDNA生物标记物水平或非天然mRNA-cDNA生物标记物复合物确定了生物标记物水平,就例如通过使用统计学方法或直接比较检测水平将生物标记物水平与参考值或参考样品进行比较,以确定肺癌分子AD亚型。基于该比较,将患者的肺癌样品进行AD分类,例如分类为TRU、PP或PI。
在一个实施方案中,将本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的表达水平值与来自至少一个样品训练集的一个或多个参考表达水平值进行比较,其中该至少一个样品训练集包含来自一个或多个参考样品的表达水平值。在另外的实施方案中,该至少一个样品训练集包含来自近端炎症型(鳞状型)、近端增生型(巨型)、末端呼吸单元型(支气管型)样品或其组合的本文提供的至少一种分类器生物标记物(例如表1的分类器生物标记物)的表达水平值。
在单独的实施方案中,将本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的杂交值与来自至少一个样品训练集的一个或多个参考杂交值进行比较,其中该至少一个样品训练集包含来自一个或多个参考样品的杂交值。在另外的实施方案中,该至少一个样品训练集包含来自近端炎症型(鳞状型)、近端增生型(巨型)、末端呼吸单元型(支气管型)样品或其组合的本文提供的至少一种分类器生物标记物(例如表1的分类器生物标记物)的杂交值。本文提供了用于将检测到的生物标记物水平与参考值和/或参考样品进行比较的方法。基于该比较,在一个实施方案中,获得从受试者样品获得的生物标记物水平与参考值之间的相关性。然后进行肺癌AD亚型的评估。
可以使用各种统计方法来辅助从患者获得的生物标记物水平与例如来自至少一个样品训练集的参考生物标记物水平的比较。
在一个实施方案中,采用监督模式识别方法。监督模式识别方法的例子可以包括但不限于最近质心方法(Dabney(2005)Bioinformatics21(22):4148-4154以及Tibshirani等人(2002)Proc.Natl.Acad.Sci.USA99(10):6576-6572);类别分析的软独立建模(SIMCA)(参见例如,Wold,1976);偏最小二乘分析(PLS)(参见例如,Wold,1966;Joreskog,1982;Frank,1984;Bro,R.,1997);线性判别分析(LDA)(参见例如,Nillson,1965);K-最近邻分析(KNN)(参见例如,Brown等人,1996);人工神经网络(ANN)(参见例如,Wasserman,1989;Anker等人,1992;Hare,1994);概率神经网络(PNN)(参见例如,Parzen,1962;Bishop,1995;Speckt,1990;Broomhead等人,1988;Patterson,1996);规则归纳法(RI)(参见例如,Quinlan,1986);以及贝叶斯方法(参见例如,Bretthorst,1990a,1990b,1988)。在一个实施方案中,基于基因表达数据用于鉴定肿瘤亚型的分类器是基于质心的方法,其描述于Mullins等人(2007)Clin Chem.53(7):1273-9(将其各自通过引用以其整体并入本文)中。
在其他实施方案中,采用无监督训练方法,并因此,不使用训练集。
再次参考用于监督学习方法的样品训练集,在一些实施方案中,一个或多个样品训练集可以包括来自腺癌样品的多种或所有分类器生物标记物(例如,表1的所有分类器生物标记物)的表达数据。该多种分类器生物标记物可以包含表1的至少两种分类器生物标记物、至少8种分类器生物标记物、至少16种分类器生物标记物、至少24种分类器生物标记物、至少32种分类器生物标记物、至少40种分类器生物标记物、或至少48种分类器生物标记物。在一些实施方案中,对一个或多个样品训练集进行归一化以去除样品与样品之间的变化。
在一些实施方案中,比较可以包括应用统计算法(如例如,任何合适的多变量统计分析模型),该统计算法可以是参数的或非参数的。在一些实施方案中,应用统计算法可以包括确定从人肺组织样品获得的表达数据与来自一个或多个腺癌训练集的表达数据之间的相关性。在一些实施方案中,进行交叉验证,如(例如)留一交叉验证(leave-one-out cross-validation,(LOOCV))。在一些实施方案中,进行整合关联(integrative correlation)。在一些实施方案中,进行斯皮尔曼关联(Spearman correlation)。在一些实施方案中,基于基因表达数据,将基于质心的方法用于统计算法,如Mullins等人(2007)Clin Chem.53(7):1273-9(将该文献通过引用以其整体并入本文)所描述的。
可以将来自受试者的样品(测试样品)进行的基因表达的结果与一个或多个已知或怀疑是正常的生物样品(“参考样品”或“正常样品”,例如,非腺癌样品)或来自其的数据进行比较。在一些实施方案中,参考样品或参考基因表达数据获自或源自于已知具有腺癌的特定分子亚型(即,鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型))的个体。
可以同时或在与测试样品不同的时间对参考样品进行测定。可替代地,来自参考样品的生物标记物水平信息可以存储在数据库或其他装置中以供在以后的日期访问。
可以将对测试样品的测定的生物标记物水平结果与对参考样品的相同测定的结果进行比较。在一些情况下,对参考样品的测定的结果来自数据库或是一个或多个参考值。在一些情况下,对参考样品的测定的结果是本领域技术人员已知的或通常接受的值或值的范围。在一些情况下,比较是定性的。在其他情况下,比较是定量的。在一些情况下,定性比较或定量比较可能涉及但不限于以下项中的一项或多项:比较荧光值、光斑强度、吸光度值、化学发光信号、直方图、临界阈值、统计显著性值、本文所述基因的表达水平、mRNA拷贝数目。
在一个实施方案中,针对每个生物标记物水平小组测量计算优势比(OR)。这里,OR是患者的测量生物标记物值与结果(例如,肺腺癌亚型)之间的关联的量度。例如,参见,J.Can.Acad.Child Adolesc.Psychiatry 2010;19(3):227-229,出于所有目的将该文献通过引用以其整体并入。
在一个实施方案中,可以确定指定的统计置信水平,以便提供关于肺癌亚型的置信水平。例如,可以确定大于90%的置信水平可以是肺癌亚型的有用预测因子。在其他实施方案中,可以选择更严格或不太严格的置信水平。例如,可以选择约或至少约50%、60%、70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、或99.9%的置信水平。在一些情况下,所提供的置信水平可以与样品的质量、数据的质量、分析的质量、所使用的具体方法、和/或所分析基因表达值的数目(即,基因的数目)相关。可以基于预期的假阳性或假阴性数目来选择用于提供反应的可能性的指定置信水平。选择参数以便达到指定置信水平或以便鉴定具有诊断能力的标记物的方法包括但不限于受试者工作特征(ROC)曲线分析、副法线ROC、主成分分析、优势比分析、偏最小二乘分析、奇异值分解、最小绝对收缩与选择算子分析、最小角回归、以及阈值梯度定向正则化方法。
在一些情况下,确定肺腺癌亚型可以通过应用被设计为使基因表达数据可靠性归一化和/或改进的算法加以改进。在本发明的一些实施方案中,由于大量的待处理的单独数据点,数据分析利用了计算机或其他设备、机器或装置来应用本文所述的各种算法。“机器学习算法”是指基于计算的预测方法,本领域技术人员也将其称为“分类器”,用于表征一个或多个基因表达谱,例如,以便确定肺腺癌亚型。在一个实施方案中,使通过例如基于微阵列的杂交测定、测序测定、纳米串测定等确定的生物标记物水平经受算法以便对谱进行分类。监督学习通常涉及“训练”分类器以识别亚型(例如鳞状型(近端炎症型)阳性、支气管型(末端呼吸单元型)阳性或巨型(近端增生型)阳性)之间的区别,并然后在独立的测试集上“测试”分类器的准确性。因此,对于新的未知样品,分类器可以用于预测例如样品所属的类别(例如,鳞状型与支气管型与巨型)。
在一些情况下,稳健多阵列平均(RMA)方法可以用于使原始数据归一化。RMA方法通过计算许多微阵列上各匹配细胞的背景校正强度开始。在一个实施方案中,背景校正值被限制为正值,如Irizarry等人(2003).Biostatistics April 4(2):249-64(出于所有目的将该文献通过引用以其整体并入)所述。在背景校正之后,然后获得各背景校正的匹配细胞强度的以2为底的对数。然后使用分位数归一化方法(其中对于各输入阵列和各探针值,阵列百分位探针值被所有阵列百分位点的平均值替换,该方法在Bolstad等人Bioinformatics2003(将该文献通过引用以其整体并入)中有更完整的描述)使各微阵列上背景校正的对数转化的匹配强度归一化。在分位数归一化之后,然后可以将归一化的数据拟合到线性模型中,以获得各微阵列上各探针的强度测量值。然后可以使用Tukey中值平滑算法(Tukey,J.W.,Exploratory Data Analysis.1977(出于所有目的将该文献通过引用以其整体并入))来确定归一化探针集数据的对数尺度强度水平。
可以执行各种其他软件程序。在某些方法中,可以使用glmnet通过lasso惩罚的逻辑回归来进行特征选择和模型估计(Friedman等人(2010).Journal of statistical software33(1):1-22,将该文献通过引用以其整体并入)。可以使用TopHat来比对原始读数(Trapnell等人(2009).Bioinformatics 25(9):1105-11,将该文献通过引用以其整体并入)。在方法中,使用e1071库(Meyer D.Support vector machines:the interface tolibsvm in package e1071.2014,将该文献通过引用以其整体并入),将高维特征(topfeature)(N的范围为从10至200)用于训练线性支持向量机(SVM)(Suykens JAK,Vandewalle J.Least Squares Support Vector Machine Classifiers.NeuralProcessing Letters 1999;9(3):293-300,将该文献通过引用以其整体并入)。在一个实施方案中,使用pROC包(Robin X,Turck N,Hainard A,等人pROC:an open-source packagefor R and S+to analyze and compare ROC curves.BMC bioinformatics 2011;12:77(将该文献通过引用以其整体并入))来计算置信区间。
此外,可以过滤数据以除去可能被认为可疑的数据。在一个实施方案中,从具有少于约4个、5个、6个、7个或8个鸟苷+胞嘧啶核苷酸的微阵列探针衍生出的数据可以被认为是不可靠的,因为它们有异常杂交倾向或二级结构问题。类似地,从具有多于约12个、13个、14个、15个、16个、17个、18个、19个、20个、21个或22个鸟苷+胞嘧啶核苷酸的微阵列探针衍生出的数据可以被认为是不可靠的,因为它们有异常杂交倾向或二级结构问题。
在本发明的一些实施方案中,如果不以可检测的水平(高于背景)鉴定出来自探针集的数据,则它们可以从分析中排除。
在本公开文本的一些实施方案中,没有表现出变异或表现出低变异的探针集可以从进一步分析中排除。通过卡方检验从分析中排除低变异的探针集。在一个实施方案中,如果转化的变异在具有(N-1)自由度的卡方分布的99%置信区间的左侧,则探针集被认为是低变异的。(N-1)*探针集变异/(基因探针集变异)。Chi-Sq(N-1),其中N是输入CEL文件的数目,(N-1)是卡方分布的自由度,且“基因的探针集变异”是整个基因的探针集变异的平均值。在本发明的一些实施方案中,如果给定mRNA或mRNA集的探针集包含少于通过前述用于GC含量、可靠性、变异等的过滤器步骤的最低数目的探针,则可以从进一步分析中排除它们。例如,在一些实施方案中,如果给定基因或转录物簇的探针集包含少于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或少于约20个探针,则从进一步分析中排除它们。
在一个实施方案中,生物标记物水平数据分析的方法还包括使用如本文提供的特征选择算法。在本发明的一些实施方案中,特征选择通过使用LIMMA软件包(Smyth,G.K.(2005).Limma:linear models for microarray data.In:Bioinformatics and ComputationalBiology Solutions using R and Bioconductor,R.Gentleman,V.Carey,S.Dudoit,R.Irizarry,W.Huber(编辑),Springer,New York,第397-420页(出于所有目的将该文献通过引用以其整体并入))提供。
在一个实施方案中,生物标记物水平数据分析的方法包括使用预分类器算法。例如,算法可以使用特异性分子指纹来根据它们的组成对样品进行预分类,然后再应用校正/归一化因子。然后可以将该数据/信息输入到最终分类算法中,其将整合该信息来辅助最终的诊断。
在一个实施方案中,生物标记物水平数据分析的方法还包括使用如本文提供的分类器算法。在本发明的一个实施方案中,提供了对角线线性判别分析、k-近邻算法、支持向量机(SVM)算法、线性支持向量机、随机森林算法、或基于概率模型的方法、或它们的组合用于微阵列数据的分类。在一些实施方案中,基于在感兴趣的类别之间生物标记物水平的差异的统计学显著性,选择区分样品的鉴定标记物(例如,不同生物标记物水平谱、和/或腺癌的不同分子亚型(例如,鳞状型、支气管型、巨型)的鉴定标记物)。在一些情况下,通过针对错误发现率(FDR)应用Benjamin Hochberg校正或另一种校正来调节统计学显著性。
在一些情况下,分类器算法可以用荟萃分析方法补充,如Fishel和Kaufman等人2007Bioinformatics 23(13):1599-606(出于所有目的将该文献通过引用以其整体并入)描述的方法。在一些情况下,分类器算法可以用荟萃分析方法补充,如可重复性分析。
用于导出后验概率并将后验概率应用于生物标记物水平数据分析的方法在本领域中是已知的,并且已经描述于例如Smyth,G.K.2004Stat.Appi.Genet.Mol.Biol.3:Article 3(出于所有目的将该文献通过引用以其整体并入)中。在一些情况下,可以将后验概率用于本发明的方法中,以对由分类器算法提供的标记物进行分级。
生物标记物水平谱分析结果的统计学评价可以提供指示以下中的一种或多种的一个或多个定量值:腺癌的分子亚型(鳞状型、支气管型或巨型);特定治疗干预(例如,血管生成抑制剂治疗、化学疗法或免疫疗法)成功的可能性。在一个实施方案中,数据以其最有用的形式直接呈现给医师以指导患者护理,或者用于在临床试验中定义患者群体或针对给定药物定义患者群体。分子谱分析的结果可使用本领域已知的多种方法进行统计学评估,该方法包括但不限于:学生T检验、双侧T检验、皮尔逊秩和分析、隐马尔可夫模型分析、q-q作图分析、主成分分析、单因素ANOVA、双因素ANOVA、LIMMA等。
在一些情况下,可通过随时间追踪受试者以确定原始诊断的准确性而确定准确性。在其他情况下,准确性可以按确定性的方式或使用统计学方法确立。例如,受试者工作特征(ROC)分析可用于确定最佳测定参数,以实现特定水平的准确性、特异性、阳性预测值、阴性预测值和/或错误发现率。
在一些情况下,将生物标记物水平谱分析测定的结果输入数据库中以供分子谱分析企业、个人、医疗供应商、或保险供应商的代表或代理访问。在一些情况下,测定结果包括企业的代表、代理或咨询人员(如医疗专业人员)进行的样品分类、鉴定、或诊断。在其他情况下,自动提供数据的计算机或算法分析。在一些情况下,分子谱分析企业可以向个人、保险供应商、医疗供应商、研究人员或政府实体针对以下项中的一种或多种收费:进行的分子谱分析测定、咨询服务、数据分析、报告结果或数据库访问。
在本发明的一些实施方案中,生物标记物水平谱分析测定的结果作为计算机屏幕上的报告或纸件记录呈现。在一些实施方案中,报告可以包括但不限于如以下中的一种或多种信息:与参考样品或一个或多个参考值相比生物标记物的水平(例如,如通过拷贝数目或荧光强度等报告的);基于生物标记物水平值和肺腺癌亚型和建议疗法,受试者将对特定疗法有反应的可能性。
在一个实施方案中,基因表达谱分析的结果可以分为以下中的一种或多种:鳞状型(近端炎症型)阳性、支气管型(末端呼吸单元型)阳性、巨型(近端增生型)阳性、鳞状型(近端炎症型)阴性、支气管型(末端呼吸单元型)阴性、巨型(近端增生型)阴性;可能对血管生成抑制剂、免疫疗法或化学疗法有反应;不太可能对血管生成抑制剂、免疫疗法或化学疗法有反应;或其组合。
在本发明的一些实施方案中,使用经训练的算法对结果进行分类。本发明的经训练的算法包括已使用已知基因表达值和/或正常样品(例如,来自诊断患有特定分子亚型的腺癌的个体的样品)的参考集开发的算法。在一些情况下,已知基因表达值的参考集从已被诊断患有特定分子亚型的腺癌并且还已知对血管生成抑制剂疗法有反应(或不反应)的个体获得。在一些情况下,已知基因表达值的参考集从已被诊断患有特定分子亚型的腺癌并且还已知对免疫疗法有反应(或不反应)的个体获得。在一些情况下,已知基因表达值的参考集从已被诊断患有特定分子亚型的腺癌并且还已知对化学疗法有反应(或不反应)的个体获得。
适用于对样品分类的算法包括但不限于k-近邻算法、支持向量机、线性判别分析、对角线线性判别分析、updown、朴素贝叶斯算法、神经网络算法、隐马尔可夫模型算法、基因算法、或其任何组合。
当将二元分类器与实际真值(例如,来自生物样品的值)进行比较时,通常存在四种可能的结果。如果预测的结果是p(其中“p”是正分类器输出,例如存在删除或重复综合症)并且实际值也是p,则将其称作真阳性(TP);但是,如果实际值是n,则将其称为是假阳性(FP)。相反,当预测结果和实际值两者均为n(其中“n”是负分类器输出,例如没有删除或重复综合症)时,出现真阴性,而当预测结果为n同时实际值为p时,出现假阴性。在一个实施方案中,考虑进行试图确定人是否可能或不太可能对血管生成抑制剂疗法有反应的测试。当这个人测试为阳性但实际上确实有反应时,在这种情况下出现假阳性。另一方面,当这个人测试为阴性时(表明他们不太可能有反应),当他们实际上可能有反应时,出现假阴性。对于对肺癌亚型的分类而言也是如此。
疾病的阳性预测值(PPV)或精确率或后验概率是具有阳性测试结果的被正确诊断为可能反应或不太可能反应的、或者被诊断为具有正确的肺癌亚型、或者它们的组合的受试者的比例。它反映了阳性测试反映出测试的基础病状的概率。但是,它的值确实依赖于疾病的流行度,其可发生变化。在一个实施例中,提供以下特征:FP(假阳性);TN(真阴性);TP(真阳性);FN(假阴性)。假阳性率(α)=FP/(FP+TN)-特异性;假阴性率(β)=FN/(TP+FN)-灵敏度;能力=灵敏度=1-β;阳性似然比=灵敏度/(1-特异性);阴性似然比=(1-灵敏度)/特异性。阴性预测值(NPV)是被正确诊断的具有阴性测试结果的受试者的比例。
在一些实施方案中,主题方法的生物标记物水平分析的结果提供了给出的诊断正确的统计学置信水平。在一些实施方案中,这种统计学置信水平是至少约或多于约85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、或更多。
在一些实施方案中,该方法还包括基于样品中的生物标记物水平与(例如存在于至少一个训练集中的)参考生物标记物水平的比较将肺组织样品分类为特定肺癌亚型。在一些实施方案中,如果比较的结果满足一个或多个标准,如例如,最小百分比一致性,基于百分比一致性计算的统计量的值,例如(例如,卡帕(kappa)统计量,最小相关性(例如,皮尔逊相关性)和/或类似物,则肺组织样品被分类为特定亚型。
据预期,本文描述的方法可以通过软件(存储在存储器中和/或在硬件上执行)、硬件或其组合来进行。硬件模块可以包括通用处理器、现场可编程门阵列(FPGA)、和/或专用集成电路(ASIC)。软件模块(在硬件上执行)可以用各种软件语言(例如,计算机代码)表达,包括Unix实用工具、C、C++、JavaTM、Ruby、SQL、R编程语言/软件环境、Visual BasicTM、以及其他面向对象的程序性或其他编程语言和开发工具。计算机代码的例子包括但不限于微代码或微指令、机器指令(如由编译器产生的)、用于产生网络服务的代码、以及包含使用解释器由计算机执行的高水平指令的文件。计算机代码的另外的例子包括但不限于控制信号、加密代码、和压缩代码。
本文描述的一些实施方案涉及具有非暂时性计算机可读介质(还可以称作非暂时性处理器可读介质或存储器)的设备,该介质上具有用于执行各种计算机实施的操作的指令或计算机代码和/或本文公开的方法。计算机可读介质(或处理器可读介质)在它本身不包括暂时性传播信号(例如,在传输介质如空间或缆线上传播携带信息的电磁波)的意义上是非暂时性的。该介质和计算机代码(还可以称作代码)可以是被设计并构建为用于特定目的或多个目的的那些。非暂时性计算机可读介质的例子包括但不限于:磁存储介质,如硬盘、软盘和磁带;光存储介质,如光碟/数字视频光盘(CD/DVD)、光碟只读存储器(CD-ROM)和全息设备;磁光存储介质,如光碟;载波信号处理模块;以及专门配置成存储和执行程序代码的硬件设备,例如专用集成电路(ASIC)、可编程逻辑设备(PLD)、只读存储器(ROM)和随机存取存储器(RAM)设备。在此描述的其他实施方案涉及计算机程序产品,其可以包括例如在此讨论的指令和/或计算机代码。
在一些实施方案中,单一生物标记物、或从约5种至约10种、从约8种至约16种、从约5种至约15种、从约5种至约20种、从约5种至约25种、从约5种至约30种、从约5种至约35种、从约5种至约40种、从约5种至约45种、从约5种至约48种生物标记物(例如,如表1中公开的)能够对肺腺癌的亚型进行分类,其中预测成功率为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值。在一些实施方案中,本文(例如,在表1中)公开的生物标记物的任何组合可以用于获得至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值的预测成功率。
在一些实施方案中,单一生物标记物、或从约5种至约10种、从约8种至约16种、从约5种至约15种、从约5种至约20种、从约5种至约25种、从约5种至约30种、从约5种至约35种、从约5种至约40种、从约5种至约45种、从约5种至约48种生物标记物(例如,如表1中所公开的)能够对肺腺癌亚型进行分类,其中灵敏度或特异性为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值。在一些实施方案中,本文公开的生物标记物的任何组合可以用于获得至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值的灵敏度或特异性。
分类器基因选择
在一个实施方案中,本文提供的方法和组合物可用于通过分析一组生物标记物的表达来确定来自患者的样品(例如,肺组织样品)的AD亚型,其中与本领域已知的用于对肺AD亚型进行分子分类的方法中的生物标记物相比,该组生物标记物包含较少数量的生物标记物。在一些情况下,该组生物标记物是少于250种、240种、230种、220种、210种、200种、150种、100种、95种或90种生物标记物。在一些情况下,该组生物标记物是少于50种生物标记物。在一些情况下,该组生物标记物是表1中列出的48种生物标记物的组。在一些情况下,该组生物标记物是表1中列出的生物标记物的子集。可用于本文提供的方法和组合物中的生物标记物或分类器基因可以选自来自一个或多个数据库的一个或多个肺腺癌数据集。该数据库可以是公共数据库。在一个实施方案中,可用于本文提供的用于检测或诊断肺腺癌亚型的方法和组合物中的分类器基因(例如,表1和表2中列出的一种或多种基因)选自来自癌症基因组图集(TCGA)的肺腺癌RNAseq数据集。在一个实施方案中,通过对分类器基因的大集合进行基于计算机模拟的过程以便确定其表达谱可以用于确定从受试者获得的样品的AD亚型的最小基因数目来选择可用于本文提供的方法和组合物的分类器基因,例如表1中的那些。在一些情况下,分类器基因的大集合可以是肺AD RNAseq数据集,如例如来自TCGA。在一些情况下,分类器基因的大集合可以是本文所述的506种基因分类器,其中该506种基因分类器可以用于定义金标准亚型。用于选择如本文提供的用于确定来自患者的样品的肺AD亚型的基因盒的计算机模拟过程可以包括对标准506种分类器基因应用或使用进行修改的至最近质心阵列分类(CLaNC)算法,以针对每种亚型选择相同数量的负相关基因和正相关基因。为了确定包括在标签中的基因的最佳数目(例如,如表1中所示的每种亚型16个),该过程可以还包括使用如本文提供的TCGA肺腺癌数据集进行5折交叉验证以产生交叉-验证曲线,如图8所示。为了获得基因分类器的最终列表,该方法可以进一步包括将至最近质心阵列分类(CLaNC)应用至整个TCGA数据集减去20%的具有最低金标准亚型预测强度的样品,并从每种亚型中去除相等数量,例如图9中所示。
在一个实施方案中,该方法还包括验证基因分类器。验证可以包括在几个新鲜冷冻的可公开获得的阵列和RNAseq数据集中测试分类器的表达,并基于所述表达水平称呼亚型,并随后将该表达与如由先前公布的506种基因标签定义的金标准亚型称谓进行比较。然后可以在归档的福尔马林固定的石蜡包埋(FFPE)腺癌样品的新收集的RNAseq数据集中进行基因标签(例如,表1)的最终验证,以确保FFPE样品中的可比性能。在一个实施方案中,基于本文所述的计算机模拟CLaNC过程选择表1的分类器生物标记物。将基因符号和官方基因名称分别列于第2列和第3列。
在一个实施方案中,本发明的方法需要检测在从患者获得的肺癌细胞样品中的其表达被改变的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、或多达16种分类器生物标记物,以鉴定TRU、PP或PI肺腺癌亚型。这同样适用于如本文提供的其他分类器基因表达数据集。
在另一个实施方案中,本发明的方法需要在从患者获得的肺癌细胞样品(例如,肺AD样品)中检测出表1的48种基因生物标记物中的总共至少1种、至少2种、至少5种、至少8种、至少10种、至少16种、至少20种、至少30种、至少32种、或多达48种分类器生物标记物,以便鉴定TRU、PP或PI肺腺癌亚型。这同样适用于如本文提供的其他分类器基因表达数据集。
在一个实施方案中,表1中的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、或多达8种生物标记物在肺腺癌的特定亚型中被“上调”。在另一个实施方案中,表1中的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、或多达8种生物标记物在肺腺癌的特定亚型中被“下调”。这同样适用于如本文提供的其他分类器基因表达数据集。
在一个实施方案中,如本文提供的“上调的”生物标记物的表达水平增加了约0.5倍、约1倍、约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、以及介于两者之间的任何值。在另一个实施方案中,如本文提供的“下调的”生物标记物的表达水平降低了约0.8倍、约1.4倍、约2倍、约2.6倍、约3.2倍、约3.6倍、约4倍、以及介于两者之间的任何值。
认识到在本发明的实践中可以使用另外的基因或蛋白质。例如,波形蛋白(中间丝状蛋白家族的成员)可以用于鉴定腺癌亚型近端增生型(巨型)亚型,并且SMA可以用于鉴定近端炎症型(鳞状型)亚型。通常,可用于对肺腺癌亚型进行分类的基因包括能够独立地在正常与肿瘤之间、或肺癌的不同类别或等级之间作出区分的那些基因。如果受试者工作特征(receiver operator characteristic,ROC)曲线下面积约为1,则认为基因能够可靠地区分亚型。
临床/治疗用途
在一个实施方案中,本文提供了一种用于确定患有癌症的患者的疾病结果或预后的方法。在一些情况下,该癌症是肺癌。可以通过检查一段时间或间隔(例如,0至36个月或者0至60个月)的总体存活期来测量疾病结果或预后。在一个实施方案中,根据亚型(例如,对于肺癌,腺癌(TRU、PI和PP))对存活期进行分析。可以使用标准卡普兰-迈耶(Kaplan-Meier)图以及Cox比例风险模型来评估无复发和总体存活期。
在一个实施方案中,在确定患者的肺癌亚型后,选择患者以接受合适的疗法,例如化学疗法或用血管生成抑制剂的药物疗法或免疫疗法。在一个实施方案中,在确定患者的肺癌亚型后,向患者给予合适的治疗剂,例如一种或多种化学治疗剂、或血管生成抑制剂、或一种或多种免疫治疗剂。在一个实施方案中,该疗法是免疫疗法,并且该免疫治疗剂是检查点抑制剂、单克隆抗体、生物反应调节剂、治疗性疫苗或细胞免疫疗法。
本发明的方法还可用于评价对疗法的临床反应,以及对于临床试验的终点用于评价新疗法的功效。可以将顺序诊断表达谱向正常移动的程度用作候选疗法的功效的一种量度。
在一个实施方案中,本发明的方法还可用于基于肺腺癌(AD)亚型预测对不同线的疗法的反应。例如,可以通过更准确地分配肿瘤亚型来改进化学治疗反应。同样,可以基于肿瘤亚型来配制治疗方案。例如,临床试验已显示令人信服的证据证明VEGF抑制剂(贝伐单抗)可以有效治疗NSCLC。
在一个实施方案中,末端呼吸单元(TRU)亚型对EGFR抑制剂和培美曲塞可以具有增强的反应。在另一个实施方案中,近端增生型(PP)对化学疗法可以具有增强的反应。在另一个实施方案中,近端炎症型(PI)对免疫疗法可以具有增强的反应。在另一个实施方案中,所有亚型对化学疗法、血管生成抑制剂治疗和免疫疗法可以具有增强的反应。
血管生成抑制剂
在一个实施方案中,在确定患者的肺腺癌亚型后,选择患者以接受用血管生成抑制剂的药物疗法。
在一个实施方案中,血管生成抑制剂是血管内皮生长因子(VEGF)抑制剂、VEGF受体抑制剂、血小板衍生生长因子(PDGF)抑制剂或PDGF受体抑制剂。
每个生物标记物小组可以包括分类器可用的一种、两种、三种、四种、五种、六种、七种、八种或更多种生物标记物(也称为“分类器生物标记物”),以评估腺癌患者是否可能对血管生成抑制剂疗法有反应;选择腺癌患者以接受血管生成抑制剂疗法;确定“缺氧得分”和/或将腺癌样品亚型分型为鳞状型(也称为近端炎症型)、支气管型(也称为末端呼吸单元型)或巨型(也称为近端增生型)分子亚型。如本文所用,术语“分类器”可以指用于统计分类的任何算法,并且可以在硬件、软件或其组合中实施。分类器可以具有2级、3级、4级或更高级的分类,并且可以依赖于被分类的实体的性质。可以采用一种或多种分类器来实现本文公开的方面。
通常,本文提供了确定腺癌患者是否可能对血管生成抑制剂疗法有反应的方法、或选择腺癌患者以接受血管生成抑制剂疗法的方法。在一个实施方案中,该方法包括使用本文所述的方法评估患者的腺癌亚型是鳞状型(近端炎症型)、支气管型(末端呼吸单元型)还是巨型(近端增生型)(例如,评估表1中的一种或多种分类器生物标记物的表达),并且在核酸水平上探测来自患者的腺癌样品中选自下组的至少五种生物标记物的水平,该组由以下组成:RRAGD、FABP5、UCHL1、GAL、PLOD、DDIT4、VEGF、ADM、ANGPTL4、NDRG1、NP、SLC16A3、和C14ORF58(参见表3)。在另外的实施方案中,探测步骤包括将样品与五种或更多种寡核苷酸混合,该五种或更多种寡核苷酸在适合于该五种或更多种寡核苷酸与其互补序列或基本互补序列杂交的条件下与该至少五种生物标记物的核酸分子的部分基本上互补,检测在该五种或更多种寡核苷酸与其互补序列或基本互补序列之间是否发生杂交;并且基于该检测步骤获得样品的杂交值。然后将样品的杂交值与来自该至少一个样品训练集的一个或多个参考杂交值进行比较,其中该至少一个样品训练集包括(i)来自过表达该至少五种生物标记物或过表达该至少五种生物标记物的子集的样品的该至少五种生物标记物的一个或多个杂交值,(ii)来自参考鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)样品的该至少五种生物标记物的杂交值,或(iii)来自无腺癌肺样品的该至少五种生物标记物的杂交值。然后基于(i)患者的腺癌亚型和(ii)比较的结果来确定患者是否可能对血管生成抑制剂疗法有反应、或选择患者以接受血管生成抑制剂。
上述一组十三种生物标记物或其子集在本文中也称为“缺氧谱”。
在一个实施方案中,本文提供的方法包括在从受试者获得的腺癌样品中确定选自RRAGD、FABP5、UCHL1、GAL、PLOD、DDIT4、VEGF、ADM、ANGPTL4、NDRG1、NP、SLC16A3、和C14ORF58的至少五种生物标记物、至少六种生物标记物、至少七种生物标记物、至少八种生物标记物、至少九种生物标记物、或至少十种生物标记物、或者五种至十三种、六种至十三种、七种至十三种、八种至十三种、九种至十三种或十种至十三种生物标记物的水平。在一些情况下,生物标记物表达可以针对样品中所有RNA转录物或其表达产物的表达水平或针对RNA转录物或其表达产物的参考集进行归一化。如全文所解释的参考集可以是与腺癌样品平行测试的实际样品,或者可以是来自数据库或存储的数据集的值的参考集。在一个实施方案中,以拷贝数目、相对荧光值或检测的荧光值报告表达水平。如使用本文提供的方法确定的缺氧谱连同腺癌亚型的生物标记物的表达水平可以用于本文所述的方法中,以确定患者是否可能对血管生成抑制剂疗法有反应。
在一个实施方案中,针对样品中的所有RNA转录物或其非天然cDNA表达产物、或蛋白质产物的表达水平,或者样品中的RNA转录物的参考集或其非天然cDNA表达产物的参考集、或其蛋白质产物的参考集的表达水平,对十三种生物标记物(或其子集,如上所述,例如,五种或更多种、从约五种至约13种)的表达水平进行归一化。
在一个实施方案中,血管生成抑制剂治疗包括但不限于整合素拮抗剂;选择素拮抗剂;粘附分子拮抗剂(细胞间粘附分子(ICAM)-1、ICAM-2、ICAM-3、血小板内皮粘附分子(PCAM)、血管细胞粘附分子(VCAM)的拮抗剂);淋巴细胞功能相关抗原1(LFA-1);碱性成纤维细胞生长因子拮抗剂;血管内皮生长因子(VEGF)调节剂;血小板衍生生长因子(PDGF)调节剂(例如,PDGF拮抗剂)。
在确定受试者是否可能对整合素拮抗剂有反应的一个实施方案中,该整合素拮抗剂是小分子整合素拮抗剂,例如,由Paolillo等人(Mini Rev Med Chem,2009,第12卷,第1439-1446页,将该文献通过引用以其整体并入)描述的拮抗剂、或白细胞粘附诱导细胞因子或生长因子拮抗剂(例如,肿瘤坏死因子-α(TNF-α)、白细胞介素-1β(IL-1β)、单核细胞趋化蛋白-1(MCP-1)和血管内皮生长因子(VEGF)),如美国专利号6,524,581(将该文献通过引用以其整体并入本文)中所述。
本文提供的方法还可用于确定受试者是否可能对以下血管生成抑制剂中的一种或多种有反应:干扰素γ1β、干扰素γ1β与吡非尼酮、ACUHTR028、αVβ5、氨基苯甲酸钾、淀粉样蛋白P、ANG1122、ANG1170、ANG3062、ANG3281、ANG3298、ANG4011、抗CTGFRNAi、Aplidin、黄芪提取物与丹参和五味子、动脉粥样硬化斑块阻断剂、Azol、AZX100、BB3、结缔组织生长因子抗体、CT140、达那唑、艾思瑞(Esbriet)、EXC001、EXC002、EXC003、EXC004、EXC005、F647、FG3019、Fibrocorin、卵泡抑素、FT011、半乳凝素-3抑制剂、GKT137831、GMCT01、GMCT02、GRMD01、GRMD02、GRN510、Heberon Alfa R、干扰素α-2β、ITMN520、JKB119、JKB121、JKB122、KRX168、LPA1受体拮抗剂、MGN4220、MIA2、微小RNA 29a寡核苷酸、MMI0100、诺斯卡品、PBI4050、PBI4419、PDGFR抑制剂、PF-06473871、PGN0052、Pirespa、Pirfenex、吡非尼酮、普利提环肽(plitidepsin)、PRM151、Px102、PYN17、PYN22与PYN17、Relivergen、rhPTX2融合蛋白、RXI109、胰泌素、STX100、TGF-β抑制剂、转化生长因子、β-受体2寡核苷酸、VA999260、XV615或其组合。
在另一个实施方案中,提供了一种用于确定受试者是否可能对一种或多种内源性血管生成抑制剂有反应的方法。在另外的实施方案中,内源性血管生成抑制剂是内皮抑素、源自XVIII型胶原的20kDa C-末端片段、血管抑素(胞浆素的38kDa片段)、血小板反应蛋白(TSP)蛋白家族的成员。在另外的实施方案中,该血管生成抑制剂是TSP-1、TSP-2、TSP-3、TSP-4和TSP-5。还提供了用于确定对以下血管生成抑制剂中的一种或多种有反应的可能性的方法:可溶性VEGF受体,例如可溶性VEGFR-1和神经毡蛋白1(NPR1)、血管生成素-1、血管生成素-2、血管形成抑制素、钙网蛋白、血小板因子-4;金属蛋白酶组织抑制剂(TIMP)(例如,TIMP1、TIMP2、TIMP3、TIMP4);软骨衍生的血管生成抑制剂(例如,肌钙蛋白肽I和chrondomodulinI);具有血小板反应蛋白基序1的解整合素和金属蛋白酶;干扰素(IFN)(例如,IFN-α、IFN-β、IFN-γ);趋化因子,例如具有C-X-C基序的趋化因子(例如,CXCL10,也称为干扰素γ诱导的蛋白质10或小的诱导型细胞因子B10);白细胞介素细胞因子(例如,IL-4、IL-12、IL-18);凝血素;抗凝血酶III片段;催乳素;由TNFSF15基因编码的蛋白质;骨桥蛋白;乳腺丝抑蛋白;血管能抑素;增殖素相关蛋白。
在一个实施方案中,提供了用于确定对以下血管生成抑制剂中的一种或多种有反应的可能性的方法:血管生成素-1、血管生成素-2、血管抑素、内皮抑素、血管形成抑制素、血小板反应蛋白、钙网蛋白、血小板因子-4、TIMP、CDAI、干扰素α、干扰素β、血管内皮生长因子抑制剂(VEGI)meth-1、meth-2、催乳素、VEGI、SPARC、骨桥蛋白、乳腺丝抑蛋白、血管能抑素、增殖素相关蛋白(PRP)、网状内皮系统刺激素(restin)、TSP-1、TSP-2、干扰素γ1β、ACUHTR028、αVβ5、氨基苯甲酸钾、淀粉样蛋白P、ANG1122、ANG1170、ANG3062、ANG3281、ANG3298、ANG4011、抗CTGF RNAi、Aplidin、黄芪提取物与丹参和五味子、动脉粥样硬化斑块阻断剂、Azol、AZX100、BB3、结缔组织生长因子抗体、CT140、达那唑、艾思瑞(Esbriet)、EXC001、EXC002、EXC003、EXC004、EXC005、F647、FG3019、Fibrocorin、卵泡抑素、FT011、半乳凝素-3抑制剂、GKT137831、GMCT01、GMCT02、GRMD01、GRMD02、GRN510、Heberon Alfa R、干扰素α-2β、ITMN520、JKB119、JKB121、JKB122、KRX168、LPA1受体拮抗剂、MGN4220、MIA2、微小RNA 29a寡核苷酸、MMI0100、诺斯卡品、PBI4050、PBI4419、PDGFR抑制剂、PF-06473871、PGN0052、Pirespa、Pirfenex、吡非尼酮、普利提环肽、PRM151、Px102、PYN17、PYN22与PYN17、Relivergen、rhPTX2融合蛋白、RXI109、胰泌素、STX100、TGF-β抑制剂、转化生长因子、β-受体2寡核苷酸、VA999260、XV615或其组合。
在又另一个实施方案中,血管生成抑制剂可以包括帕唑帕尼(Votrient)、舒尼替尼(Sutent)、索拉非尼(Nexavar)、阿西替尼(Inlyta)、帕纳替尼(Iclusig)、凡德他尼(vandetanib)(Caprelsa)、卡博替尼(Cometrig)、雷莫芦单抗(Cyramza)、瑞格拉非尼(Stivarga)、阿柏西普(ziv-aflibercept)(Zaltrap)、莫特塞尼(motesanib)或其组合。在另一个实施方案中,血管生成抑制剂是VEGF抑制剂。在另外的实施方案中,该VEGF抑制剂是阿西替尼、卡博替尼、阿柏西普(aflibercept)、布立尼布、tivozanib、雷莫芦单抗或莫特塞尼。在又另外的实施方案中,血管生成抑制剂是莫特塞尼。
在一个实施方案中,本文提供的方法涉及确定受试者对血小板衍生生长因子(PDGF)家族成员的拮抗剂(例如,抑制、减少或调节PDGF受体(PDGFR)的信号传导和/或活性的药物)有反应的可能性。例如,在一个实施方案中,PDGF拮抗剂是抗PDGF适体、抗PDGF抗体或其片段、抗PDGFR抗体或其片段、或小分子拮抗剂。在一个实施方案中,PDGF拮抗剂是PDGFR-α或PDGFR-β的拮抗剂。在一个实施方案中,该PDGF拮抗剂是抗PDGF-β适体E10030、舒尼替尼、阿西替尼、索拉菲尼、伊马替尼、甲磺酸伊马替尼、尼达尼布、盐酸帕唑帕尼、帕纳替尼、MK-2461、多韦替尼、帕唑帕尼、crenolanib、PP-121、替拉替尼、伊马替尼、KRN 633、CP 673451、TSU-68、Ki8751、amuvatinib、tivozanib、马赛替尼、二磷酸莫替沙尼、、多韦替尼二乳酸、利尼伐尼(linifanib)(ABT-869)。
在确定患者是否可能对血管生成抑制剂疗法有反应、或选择患者以接受血管生成抑制剂疗法时,在一个实施方案中,向患者给予血管生成抑制剂。血管生成抑制剂可以是本文所述的任何血管生成抑制剂。
免疫疗法
在一个实施方案中,本文提供了用于通过以下方式确定腺癌(AD)肺癌患者是否可能对免疫疗法有反应的方法:确定从患者获得的样品的AD亚型、以及基于该AD肺癌亚型评估患者是否可能对免疫疗法有反应。在另一个实施方案中,本文提供了通过以下方式选择患有AD的患者进行免疫疗法的方法:确定来自患者的样品的AD亚型、以及基于该AD亚型选择患者进行免疫疗法。可以使用本领域已知的对AD亚型分型的任何方法来进行从患者获得的样品的AD亚型的确定。在一个实施方案中,从患者获得的样品先前已被诊断为AD,并且将本文提供的方法用于确定该样品的AD亚型。先前的诊断可以是基于组织学分析。组织学分析可以由一名或多名病理学家进行。在一个实施方案中,通过一组或一小组生物标记物或其子集的基因表达分析以便产生表达谱来进行AD亚型分型。可以对从患者获得的肺癌样品(例如,肺癌AD样品)进行基因表达分析,以便确定选自本文所述的可公开获得的肺癌数据库和/或本文提供的表1的一种或多种生物标记物的存在、不存在或表达水平。AD亚型可以选自下组,该组由以下组成:鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)。免疫疗法可以是本文提供的任何免疫疗法。在一个实施方案中,免疫疗法包括给予一种或多种检查点抑制剂。该检查点抑制剂可以是本文提供的任何检查点抑制剂,如例如靶向PD-1、PD-LI或CTLA4的检查点抑制剂。
如本文所公开,生物标记物小组或其子集可以是在任何一个或多个可公开获得的AD基因表达数据集中公开的那些。在一个实施方案中,该肺癌是AD,并且该生物标记物小组或其子集是例如癌症基因组图集(TCGA)肺AD RNAseq基因表达数据集(n=515)。在一个实施方案中,该肺癌是AD,并且该生物标记物小组或其子集是例如Shedden等人(Nat Med 2008;14(8):822-827,将其内容通过引用以其整体并入本文)中公开的AD基因表达数据集(n=442)。在一个实施方案中,该肺癌是AD,并且该生物标记物小组或其子集是例如Tomida等人(J Clin Oncol 2009;27(17):2793-2799,将其内容通过引用以其整体并入本文)中公开的AD基因表达数据集(n=117)。在一个实施方案中,该肺癌是AD,并且该生物标记物小组或其子集是例如Wilkerson等人(PLoS One 2012;7(5):e36530,将其内容通过引用以其整体并入本文)中公开的AD基因表达数据集(n=116)。在一个实施方案中,该肺癌是AD,并且该生物标记物小组或其子集是例如表1中公开的AD基因表达数据集。在一个实施方案中,该肺癌是AD,并且该生物标记物小组或其子集是例如表1中公开的AD基因表达数据集与来自可公开获得的AD表达数据集的一种或多种生物标记物的组合。在表2中,该表的第一列代表用于区分末端呼吸单元(TRU)的生物标记物列表。该表的中间列代表用于区分近端增生型(PP)的生物标记物列表。该表的最后一列代表用于区分近端炎症型(PI)的生物标记物列表。在一些情况下,如表2中所示,可以将总共48种生物标记物用于AD亚型确定。对于每种AD亚型,16种生物标记物中的8种可以是负相关基因,而8种可以是可以被选择作为特定AD亚型的基因标签的正相关基因。
在一些实施方案中,用于肺癌亚型分型(例如,AD亚型分型)的方法包括检测分类器生物标记物组的表达水平。分类器生物标记物组可以是来自可公开获得的数据库的一组生物标记物,如例如一个或多个TCGA肺AD RNASeq基因表达数据集或本文提供的任何其他数据集。在一些实施方案中,检测包括在核酸水平或蛋白质水平上的表1的所有分类器生物标记物或本文提供的任何其他数据集。在另一个实施方案中,检测表1的单个分类器生物标记物或表1的分类器生物标记物的子集或本文提供的任何其他数据集,例如,从约五种至约二十种。在另一个实施方案中,检测表1的单个分类器生物标记物或表1的分类器生物标记物的子集和/或本文提供的任何其他数据集,例如,从约16种至约48种。在另一个实施方案中,检测表1的所有分类器生物标记物或本文提供的任何其他数据集。在另一个实施方案中,检测表1的至少一种或所有分类器生物标记物与本文提供的任何其他AD数据集的一种或多种分类器生物标记物的组合。例如使用对分类器生物标记物有特异性的引物和/或探针、和/或类似物,可以通过任何合适的技术(包括但不限于RNA-seq、逆转录酶聚合酶链反应(RT-PCR)、微阵列杂交测定、或另一种杂交测定(例如纳米串测定))来进行检测。在一些情况下,可用于扩增方法(例如,RT-PCR或qRT-PCR)的引物是适合用于单独地或组合地与来自本文提供的数据集的分类器基因结合的任何正向和反向引物。
在一个实施方案中,在如本文提供的确定肺癌亚型的方法中检测了在本文提供的任何AD基因表达数据集(包括例如,针对AD肺样品的表1)中的从约1种至约5种、约5种至约10种、从约5种至约15种、从约5种至约20种、从约5种至约25种、从约5种至约30种、从约5种至约35种、从约5种至约40种、从约5种至约45种、从约5种至约50种、从约5种至约55种、从约5种至约60种、从约5种至约65种、从约5种至约70种、从约5种至约75种、或从约5种至约80种生物标记物。在另一个实施方案中,在如本文提供的确定肺癌亚型的方法中检测了来自本文提供的AD基因表达数据集中的任何一个(包括例如针对AD肺样品的表1)的每种生物标记物。
在一个实施方案中,本文提供的方法还包括确定AD亚型中免疫激活的存在、不存在或水平。可以通过创建表达谱或检测与从患者获得的样品(例如,肺癌样品)中的每种AD亚型相关的先天性免疫细胞和/或适应性免疫细胞相关的一种或多种生物标记物的表达来确定免疫细胞活化的存在或水平。在一个实施方案中,通过监测Bindea等人(Immunity 2013;39(4);782-795,将其内容通过引用以其整体并入本文)的免疫细胞标签来确定与AD亚型相关的免疫细胞活化。在一个实施方案中,该方法还包括测量单基因免疫生物标记物,如例如CTLA4、PDCD1和CD274(PD-LI)、PDCDLG2(PD-L2)和/或IFN基因标签。与AD亚型相关的免疫激活(先天性和/或适应性)的存在或可检测水平可以指示或预测具有所述AD亚型的患者可以修改为免疫疗法。免疫疗法可以是用如本文提供的检查点抑制剂进行的治疗。在一个实施方案中,AD的PI亚型具有免疫表达。在一个实施方案中,本文提供了一种用于检测从患者获得的样品(例如,肺癌AD样品)中的本文提供的至少一种分类器生物标记物的表达的方法,该方法还包括在所述样品中检测到如本文提供的免疫激活后给予免疫治疗剂。
在一个实施方案中,该方法包括确定肺癌AD样品的亚型并随后确定所述亚型的免疫细胞活化的水平。在一个实施方案中,通过使用如本文所述的测序(例如,RNASeq)、扩增(例如,qRT-PCR)或杂交测定(例如,微阵列分析)确定一种或多种分类器生物标记物的表达水平来确定亚型。该一种或多种生物标记物可以选自可公开获得的数据库(例如,TCGA肺ADRNASeq基因表达数据集或本文提供的任何其他可公开获得的AD基因表达数据集)。在一些实施方案中,可以将表1的生物标记物用于特异性确定从患者获得的AD肺样品的亚型。在一个实施方案中,通过测量免疫标记物的基因表达标签来确定免疫细胞活化的水平。可以在用于对如本文所述的肺癌样品进行亚型分型的相同和/或不同样品中测量免疫标记物。可以测量的免疫标记物可以包含先天性免疫细胞(IIC)和/或适应性免疫细胞(AIC)基因标签、干扰素(IFN)基因标签、个体免疫标记物、主要组织相容性复合物II类(MHC II类)基因或其组合,由其组成或基本上由其组成。IIC和AIC两者的基因表达标签可以是本领域已知的所述细胞类型的任何已知基因标签。例如,免疫基因标签可以是来自Bindea等人(Immunity 2013;39(4);782-795)的那些。在一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表4A和/或表4B。个体免疫标记物可以是CTLA4、PDCD1和CD274(PD-L1)。在一个实施方案中,用于在本文提供的方法中使用的个体免疫标记物选自表5。免疫标记物可以是一种或多种干扰素(INF)基因。在一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表6。免疫标记物可以是一种或多种MHCII基因。在一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表7。在又另一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表4A、表4B、表5、表6、表7、或其组合。
表5.用于在本文提供的方法中使用的个体免疫标记物。
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
表6.用于在本文提供的方法中使用的干扰素(IFN)基因。
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
表7.用于在本文提供的方法中使用的MHC II类基因。
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
在一个实施方案中,在使用如本文提供的任何方法和分类器生物标记物小组或其子集确定患者的AD肺癌亚型(单独或者组合确定如本文提供的一种或多种免疫细胞标记物的表达)时,选择患者以用免疫治疗剂进行治疗或给予免疫治疗剂。该免疫治疗剂可以是检查点抑制剂、单克隆抗体、生物反应调节剂、治疗性疫苗或细胞免疫疗法。
在另一个实施方案中,免疫治疗剂是检查点抑制剂。在一些情况下,提供了一种用于确定对一种或多种检查点抑制剂有反应的可能性的方法。在一个实施方案中,该检查点抑制剂是PD-1/PD-LI检查点抑制剂。该PD-1/PD-LI检查点抑制剂可以是纳武单抗、派姆单抗、阿特珠单抗(atezolizumab)、度伐单抗、拉立珠单抗(lambrolizumab)或阿维鲁单抗(avelumab)。在一个实施方案中,该检查点抑制剂是CTLA-4检查点抑制剂。该CTLA-4检查点抑制剂可以是伊匹单抗(ipilimumab)或tremelimumab。在一个实施方案中,该检查点抑制剂是检查点抑制剂的组合,如例如,与一种或多种CTLA-4检查点抑制剂组合使用的一种或多种PD-1/PD-LI检查点抑制剂的组合。
在一个实施方案中,免疫治疗剂是单克隆抗体。在一些情况下,提供了一种用于确定对一种或多种单克隆抗体有反应的可能性的方法。单克隆抗体可以针对肿瘤细胞或针对肿瘤产物。单克隆抗体可以是帕尼单抗、马妥珠单抗、necitumunab、曲妥珠单抗、阿麦妥昔单抗(amatuximab)、贝伐单抗、雷莫芦单抗、巴维昔单抗、patritumab、rilotumumab、西妥昔单抗、immu-132或登西珠单抗(demcizumab)。
在又另一个实施方案中,免疫治疗剂是治疗性疫苗。在一些情况下,提供了一种用于确定对一种或多种治疗性疫苗有反应的可能性的方法。该治疗性疫苗可以是肽或肿瘤细胞疫苗。该疫苗可以靶向MAGE-3抗原、NY-ESO-1抗原、p53抗原、存活素抗原或MUC1抗原。治疗性癌症疫苗可以是GVAX(GM-CSF基因转染的肿瘤细胞疫苗)、belagenpumatucel-L(用TGF-β2反义质粒修饰的四个经辐射的NSCLC细胞系制备的同种异体肿瘤细胞疫苗)、MAGE-A3疫苗(由MAGE-A3蛋白和佐剂AS15构成)、(l)-BLP-25抗MUC-1(靶向肿瘤细胞上表达的MUC-1)、CimaVax EGF(由与载体蛋白质偶联的人重组表皮生长因子(EGF)构成的疫苗)、WT1肽疫苗(由四个维尔姆斯(Wilms)肿瘤抑制基因类似物肽构成)、CRS-207(编码人间皮素的活减毒单核细胞增多性李斯特菌载体)、Bec2/BCG(诱导抗GD3抗体)、GV1001(靶向人端粒酶逆转录酶)、tergenpumatucel-L(由经遗传修饰以包括免疫系统对其强烈反应的小鼠基因的人肺癌细胞构成)、TG4010(靶向MUC1抗原)、racotumomab(模仿在多种人类癌症上表达的NGcGM3神经节苷脂的抗独特型抗体)、tecemotide(脂质体BLP25;由MUC1的串联重复区域制成的基于脂质体的疫苗)或DRibbles(由九种癌症抗原加TLR佐剂制成的疫苗)。
在一个实施方案中,免疫治疗剂是生物反应调节剂。在一些情况下,提供了一种用于确定对一种或多种生物反应调节剂有反应的可能性的方法。该生物反应调节剂可能引发炎症,如例如PF-3512676(CpG 7909)(toll样受体9激动剂)、CpG-ODN 2006(下调Treg)、卡介苗(Bacillus Calmette-Guerin,BCG)、母牛分枝杆菌(SRL172)(现在经常作为佐剂进行测试的非特异性免疫刺激剂)。该生物反应调节剂可以是细胞因子疗法,如例如IL-2+肿瘤坏死因子α(TNF-α)或干扰素α(诱导T细胞增殖)、干扰素γ(诱导肿瘤细胞凋亡)或Mda-7(IL-24)(Mda-7/IL-24诱导肿瘤细胞凋亡并抑制肿瘤血管生成)。该生物反应调节剂可以是集落刺激因子,如例如粒细胞集落刺激因子。该生物反应调节剂可以是多模式效应物,如例如多靶VEGFR:沙利度胺及类似物如来那度胺和泊马度胺、环磷酰胺、环孢菌素、地尼白介素(denileukin diftitox)、talactoferrin、trabecetedin或全反式视黄酸。
在一个实施方案中,免疫疗法是细胞免疫疗法。在一些情况下,一种用于确定对一种或多种细胞治疗剂有反应的可能性的方法。细胞免疫治疗剂可以是树突细胞(DC)(离体产生的负载肿瘤抗原的DC疫苗)、T细胞(离体产生的淋巴因子激活的杀伤细胞;细胞因子诱导的杀伤细胞;活化的T细胞;γδT细胞)或自然杀伤细胞。
在一些情况下,AD的特定亚型具有不同水平的免疫激活(例如,先天性免疫力和/或适应性免疫力),使得具有升高的或可检测的免疫激活(例如,先天性免疫力和/或适应性免疫力)的亚型被选择以接受用本文所述的一种或多种免疫治疗剂进行的治疗。在一个实施方案中,与其他AD亚型或肺癌亚型相比,AD的PP亚型具有低的免疫激活(例如,先天性免疫力和/或适应性免疫力)。在一些情况下,AD的特定亚型具有高水平或升高水平的免疫激活。在一些情况下,与其他AD亚型或肺癌亚型相比,AD的PI亚型具有升高水平的免疫激活(例如,先天性免疫力和/或适应性免疫力)。在一个实施方案中,不选择具有低水平免疫激活或无免疫激活(例如,先天性免疫力和/或适应性免疫力)的AD亚型用于接受用本文所述的一种或多种免疫治疗剂进行的治疗。
检测方法
在一个实施方案中,本文提供的方法和组合物允许检测从受试者获得的肺癌样品(例如,腺癌肺癌样品)中的至少一种核酸。该至少一种核酸可以是本文提供的分类器生物标记物。在一个实施方案中,使用本文提供的方法和组合物检测的该至少一种核酸选自表1。在一个实施方案中,检测从受试者获得的肺癌样品中的一种或多种核酸(例如,分类器生物标记物)的方法包括使用本文提供的任何方法测量至少一种或多种生物标记物的表达水平,基本上由其组成或由其组成。该生物标记物可以选自表1。在一些情况下,该多种生物标记物核酸包含表1中的至少两种生物标记物核酸、至少8种生物标记物核酸、至少16种生物标记物核酸、至少24种生物标记物核酸、至少32种生物标记物核酸或所有48种生物标记物核酸,基本上由其组成或由其组成。该检测可以是在核酸水平。该检测可以通过使用本文公开的任何扩增、杂交和/或测序测定。
在另一个实施方案中,本文提供的方法和组合物允许检测从受试者获得的肺癌样品(例如,腺癌肺癌样品)中的至少一种核酸或多种核酸,使得该至少一种核酸或该多种核酸选自表1中列出的生物标记物;并且允许从一组生物标记物中检测至少一种生物标记物,该生物标记物的存在、不存在和/或表达水平指示免疫激活。用于指示免疫激活的一组生物标记物可以是适应性免疫细胞(AIC)(例如,表4A)和/或先天性免疫细胞(IIC)(例如,表4B)的基因表达标签、个体免疫生物标记物(例如,表5)、干扰素基因(例如,表6)、主要组织相容性复合物II类(MHC II)基因(例如,表7)或其组合。IIC和AIC两者的基因表达标签可以是本领域已知的任何基因标签,如例如Bindea等人(Immunity 2013;39(4);782-795)中列出的基因标签。该检测可以是在核酸水平。该检测可以通过使用本文公开的任何扩增、杂交和/或测序测定。
试剂盒
可以进一步提供用于实践本发明的方法的试剂盒。“试剂盒”可以涵盖包含用于特异性检测本发明的生物标记物的表达的至少一种试剂(例如,抗体、核酸探针或引物等)的任何制品(例如,包装或容器)。该试剂盒可以作为用于执行本发明方法的单元进行促销、分发或销售。另外,该试剂盒可以包含描述该试剂盒及其使用方法的包装说明书。
在一个实施方案中,提供了用于实践本发明方法的试剂盒。此类试剂盒与手动和自动免疫细胞化学技术(例如,细胞染色)兼容。这些试剂盒包含针对感兴趣的生物标记物的至少一种抗体、用于检测与生物标记物结合的抗体的化学品、复染剂和任选地上蓝剂(以促进阳性染色细胞的鉴定)。检测抗原-抗体结合的任何化学品都可以用于本发明的实践中。该试剂盒可以包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、或更多种抗体,用于在本发明的方法中使用。
实施例
通过参考以下实施例来进一步展示本发明。但是,应注意的是这些实施例,像以上所述的实施方案一样,是说明性的并且不以任何方式构成对本发明范围的限制。
实施例1-肺腺癌内在亚型之间的免疫细胞活化差异和与CD274(PD-L1)表达的可变相关性。
介绍
基于基因表达的肺腺癌(AD)亚型分型将AD肿瘤分类为具有不同生物学和临床特征的不同亚型。基于基因表达的亚型分型一致地鉴定了3种不同的肺AD生物学类型:末端呼吸单元型(TRU)(以前为支气管型)、近端增生型(PP)(以前为巨型)和近端炎症型(PI)(以前为鳞状型)(1,2)(参见图1)。AD亚型展示了基因组改变、肿瘤驱动因素、预后以及可能对各种疗法的反应的关键差异(1-2)。
方法
使用以前公布的Bindea等人(3)免疫细胞基因标签(总共24种)和AD亚型分型基因表达标签(1-2),针对与AD亚型相关的免疫细胞特征检测了几个可公开获得的肺AD数据集(2,4和5)和1个最近收集的基因表达数据集(参见图2)。对按照亚型的免疫差异的这种研究使用了来自Bindea等人[3]的24种免疫细胞基因标签,该24种免疫细胞基因标签的每种标签都有不同数量的基因并被分类为适应性或先天性免疫细胞标签(参见表4A-表4B)。适应性免疫细胞(AIC)标签(表4A)包括T细胞、中枢记忆T细胞(Tcm)、效应记忆T细胞(Tem)、T辅助细胞(Th)、1型T辅助细胞(Th1)、2型T辅助细胞(Th2)、T滤泡辅助细胞(Tfh)、T辅助17细胞(Th17)、T调节细胞(Treg)、γδT细胞(Tgd)、CD8T细胞、细胞毒性T细胞、B细胞,并且先天性免疫细胞(IIC)标签(表4B)包括自然杀伤(NK)、NK CD56暗细胞、NK CD56亮细胞、树突细胞(DC)、未成熟树突细胞(iDC)、树突细胞(pDC)、活化树突细胞(aDC)、肥大细胞、嗜酸性粒细胞、巨噬细胞和嗜中性粒细胞。除了先天性免疫细胞(IIC)和适应性免疫细胞(AIC)两者的基因表达标签以外,在3种AD亚型(TRU、PP和PI)中还检测了13种基因IFN标签(IFN;表6)、13种基因MHC II类标签得分(Forero[6];表7)以及表5中的单基因免疫生物标记物(CTLA4、PDCD1、CD274(PD-L1)、和PDCDLG2(PD-L2))。
AD数据集包括如上所述的几种可公开获得的肺癌基因表达数据集和新收集的福尔马林固定的石蜡包埋(FFPE)肺肿瘤样品(n=88)的腺癌数据集。新收集的AD数据集的88个福尔马林固定的石蜡包埋(FFPE)样品是在北卡罗来纳大学教堂山分校(University ofNorth Carolina at Chapel Hill,UNC-CH)根据批准的IRB方案收集的存档残留肺肿瘤样品。在RNA提取之前,宏观切开FFPE样品切片(3个10um切片)。使用Illumina’s的RNA-Access试剂盒(San Diego,CA)以100ng/样品的输入进行转录组富集的RNAseq。使用hg19作为参考比对序列数据,并使用cufflinks构建转录组(Trapnell2010)。使用cuff compare来注释转录组并计算基因表达计数。
对于AD,使用4个已公布的和1个最近收集的肺腺癌样品的基因表达数据集(即GeneCentric表达数据集),总共1278个患者样品。已公布的数据集包括TCGA[2]、Shedden等人[4]、Tomida等人[5]、和Wilkerson等人[1],源自新鲜冷冻样本。GeneCentric表达数据集源自于福尔马林固定的石蜡包埋(FFPE)样本。对于TCGA,从Firehose下载上四分位数归一化RSEM数据并进行log2变换。来自Shedden等人[4]的Affymetrix Cel文件从caIntegrator网站下载,并使用R中的Affy包生成强大的多阵列平均表达量度。对于Tomida等人[5](GSE13213)和Wilkerson等人[1](GSE26939),从Gene Expression Omnibus(GEO)网站下载归一化的Agilent阵列数据。
为了确定腺癌亚型(TRU、PP和PI),使用如先前在Wilkerson等人[1]中所述的公布的506种基因最近质心分类器。在标签中的基因中值中心之后,为每个样品分配对应于与其最大相关的质心的亚型。(皮尔逊)
使用腺癌的TCGA数据,通过绘制成对Spearman秩相关系数的矩阵来评估30种标记物之间的相关性,其中标记物通过分级聚类排序(参见图4)。为了按照亚型研究总体免疫标记物趋势,绘制表达热图,其中样品按亚型排列并且标记物根据Bindea等人[3]中的排序进行分组(参见图3)。为了评价亚型之间免疫标记物差异的再现性,针对每个数据集按照亚型绘制归一化T细胞标签(参见图5)。
使用线性回归评价免疫细胞标签与肿瘤亚型和与CD274表达的关联。更具体地,为了评估亚型作为免疫标记物预测因子相对于PD-L1的预测因子的预测强度,在TCGA数据集中拟合每个标签用亚型作为唯一预测因子和再用PD-L1作为唯一预测因子的线性回归模型。PD-L1表达被视为低/中/高分类变量,其在每组中具有相等比例。检查当亚型是预测因子时调整的R平方相对于当PD-L1是预测因子时调整的R平方的散点图的总体趋势(参见图6)。
使用来自TCGA腺癌的补充信息(Lawrence 2013)中可获得的每Mb数据的非沉默突变负荷,分别使用Kruskal Wallis检验和Spearman相关系数研究突变负荷-T细胞表达的关联。对于TCGA腺癌,从Firehose下载STK11CNV和突变状态,并使用Fisher精确检验评价STK11失活-亚型的关联。这里,当一个样品被报告为已缺失和/或已突变时,它被称作失活的。为了测试AD中的STK11在针对亚型调整后是否显示关联的证据,将T细胞表达的线性模型与AD中的失活的STK11作为唯一预测因子拟合,并且在针对亚型调整后再次拟合。
使用Kruskal-Wallis检验研究亚型和免疫标签与13种基因MHC II类标签的关联[Forero[6];表7](计算为列表(表7)中的所有基因的平均值)。对于免疫标签-MHC II类关联,计算Spearman相关系数。
还分析了免疫标签的分级聚类和成对标签相关性。使用分层cox比例风险模型评价第I-III阶段样品的存活标签关联,从而允许每个数据集中的不同基线风险。更具体地,使用Cox比例风险模型,在每种亚型内对TCGA数据集中的免疫标记物-存活关联进行总体和单独测试。将免疫标记物集中并按比例缩放以具有平均值0和方差1,并且排除第IV阶段患者。针对阶段调整的特定亚型内的评价,并针对阶段和亚型调整总体评价。制作显示每种标签的风险比和置信区间的森林图(参见图7A和图7B)。使用R 3.2.0软件(http://www.R-project.org)进行所有统计分析。
结果
免疫细胞基因标签的热图分析和无监督分级聚类提供了AD的内在亚型的分离(参见图3和图4)。对免疫细胞基因标签(AIC和IIC两者)以及个体免疫基因标记物的检测揭示了AD亚型之间的明显差异(参见图3)。在AD中,对于所检测的大多数细胞类型,PP亚型中的免疫表达始终较低。大多数T细胞的表达在TRU和PI中相似,但是可以通过在TRU亚型中一些先天性免疫细胞(树突细胞、NK CD56亮细胞、肥大细胞、嗜酸性粒细胞)和几种适应性免疫细胞(B细胞、TFH、Tcm、Th17、CD8T细胞)的更高表达在TRU与PI之间作出区分,然而PI亚型显示出Th1和Th2、Treg、细胞毒性T细胞和NKCD56暗细胞的更高表达(可以在图18中找到按照AD亚型的所有免疫细胞和标记物的箱形图)。免疫疗法靶向CTLA4和CD274(PD-L1),证明在多个数据集中在PI亚型中的表达始终较高(箱形图补充图18)。在PP肿瘤中,相对于其他AD,适应性免疫细胞和先天性免疫细胞表达以及免疫疗法靶标表达都被抑制。(图18)。
总体而言,免疫激活在AD的PI亚型中最为突出,证明了先天性免疫细胞和适应性免疫细胞的激活。相反,AD的PP亚型表现出较低的免疫激活。
使用分级聚类,相关性矩阵揭示了适应性免疫细胞和先天性免疫细胞的聚类(参见图4)。在AD中,适应性免疫特征例如T细胞、细胞毒性细胞、CD8细胞、Th1细胞、PDCD1、CTLA4和Treg具有高的成对相关性,并且类似地,对于先天性免疫细胞(包括iDC、DC、巨噬细胞、嗜中性粒细胞、肥大细胞和嗜酸性粒细胞)是相关的(图4)。
与AD亚型相比,进行了CD274(PD-L1)表达与适应性免疫细胞标签的关联强度分析。如图6中所示,对于AD亚型,关联强度(调整的R平方)是混合的,表明对于一些细胞(B细胞、T细胞、Th1、Treg、细胞毒性细胞、T辅助细胞、Tem、Tgd)CD274关联更大,而对于其他细胞(TFH、Th2、CD8、Th17和Tcm)AD亚型关联更大。
免疫细胞标签主要在TCGA数据集中评价,然而发现如通过免疫细胞标签测量的,AD亚型免疫差异在多个数据集中是非常可再现的(参见图5)。AD亚型中的T细胞免疫细胞标签表达亚型差异在多个基因表达数据集中具有显著的可再现性,该基因表达数据集源自冷冻样品和FFPE样品两者并且涉及多个基因表达平台包括RNAseq(Illumina,San Diego,CA)和来自Affymetrix(Santa Clara,CA)和Agilent(Santa Clara,CA)两者的微阵列。总体而言,免疫细胞标签基因表达模式在多个AD(参见图5)数据集中是一致的。
TCGA AD数据中的非沉默突变负荷按照亚型而不同,PI显示负荷最高,而TRU负荷最低(图19)。富含TP53突变的PI亚型与免疫细胞表达升高相关联,然而,尽管具有相对高的免疫表达,TRU具有最低的突变负荷。在AD数据集中,突变负荷与T细胞免疫细胞表达不强烈相关(在AD中Spearman相关性=-0.07)。
几个其他基因组特征例如AD中STK11的缺失(Cao[7],Shabath[8],Koyama[9])已被认为是NSCLC中免疫应答降低的可能原因。在低免疫应答腺癌PP亚型中富含STK11失活。AD中的STK11失活与较低的免疫细胞表达相关,然而在使用线性回归针对亚型调整之后,STK11不是显著的预测因子(在针对亚型调整后AD中的STK11p=0.0007至p=0.43)。
使用公布的13种基因MHC II类标签(Forero[6])研究AD肺癌中的免疫细胞表达与MHCII类基因的关联。MHC II类基因表达与AD中的几种免疫细胞强烈相关,包括T细胞表达(AD中的Spearman相关性=0.66)、B细胞表达(AD中的Spearman相关性=0.5)和DC表达(AD中的Spearman相关性=0.69)。在肿瘤邻近正常肺组织中的MHC II类基因表达与肿瘤相比显著更高,并且在肿瘤亚型中差异表达(图19)。在作为T细胞免疫细胞表达预测因子的MHC II类标签的线性模型中,在针对AD亚型调整后MHC II类仍然显著(对于MHC II,p<1E-50)。
使用cox比例风险模型,计算增加一个表达单位的亚型特异性风险比(HR)。针对病理阶段调整亚型特异性HR,并计算置信区间(CI)。在图7A-图7B中显示了对于至少一种亚型显著(标称p值<0.05)的标记物的风险比和置信区间。在图7A-图7B中显示了针对一种或多种亚型显示显著存活关联的细胞标签或基因的HR和CI。对于AD亚型,许多先天性性和适应性免疫细胞、CD274(PD-L1)MHC II类标签和CTLA4的表达的单位增加与AD的PI亚型中的存活改善显著相关,但在其他亚型中没有显著相关(图7A-图7B)。总体而言,免疫细胞标签的存活分析表明T辅助17和T滤泡辅助免疫细胞预测AD中的存活改善(p<0.001)(参见图7A-图7B)。
结论
肺AD基因表达亚型在其免疫景观方面不同。AD的内在生物学亚型揭示了免疫细胞活化的关键差异,其不总是与CD274表达相关并且展现出与存活的可变关联。AD PP亚型显示出最小的免疫浸润(抑制的免疫细胞表达),表明对immunoRX的应答降低。AD PI亚型显示出与改善的存活相关的免疫特征表达。此外,非沉默突变负荷与亚型之间的免疫细胞表达不相关;然而,MHC II类基因表达高度相关。增加的免疫和MHC II基因表达与AD的TRU和PI亚型的存活改善相关。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Wilkerson MD,et al.PLoS One 2012;7(5):e36530.PMID 22590557
2.)TCGA Lung AdenoC.Nature 2014;511(7511):543-550.PMID25079552
3.)Bindea et al.,Immunity 2013;39(4):782-95.PMID 24138885
4.)Shedden K.et al.Nat Med 2008;14(8):822-827.PMID 18641660
5.)Tomida S,et al.J Clin Oncol 2009;27(17):2793-99.PMID 19414676
6.)Forero A,Li Y,Dongquan C,et al.Expression of the MHC class II pathwayin triple negative breast cancer tumor cells is associated with a goodprognosis and infiltrating lymphocytes.Cancer Immunol Res 2016;4(5):390-399.
7.)Cao C,Gao R,Zhang M,er al.Role of LKB1-CRTC1on glycosylated COX-2andresponse yto COX-2inhibition in lung cancer.J Natl Cancer Inst.2015;107(1):1-11.
8.)Shabath MB,Welsh EA,Fultp WJ,et al.Differential association ofSTK11and TP53with KRAS mutation-associated gene expression,proliferation,andimmune surveillance in lung adenocarcinoma.Oncogene.2015:1-8.
9.)Koyama S,Akbey EA,Li Y,et al.STK11/LKB1deficiency promotes neutrophilrecruitment and proinflammatory cytokine production to suppress T-cellactivity in the lung tumor microenvironment.Cancer Res 2016;76(5):999-1008.
实施例2-肺腺癌亚型分型标签的开发和验证
背景
几项基因组研究已经证明了在其基因组谱(包括基因表达、突变谱和拷贝数目变化)方面可能有差异的三种不同的内在肺腺癌亚型[1-3]。三种生物学AD亚型TRU、PP和PI不仅在其基因组特征上不同,而且在临床特征方面也显示出潜在的重要差异[1-4]。AD的基因表达亚型可以显示出在肿瘤分化、远端复发的可能性、阶段特异性存活、潜在的肿瘤驱动因子和炎症反应方面的显著差异[1-4],并且可能不容易通过基于标准形态学的技术(显微镜和免疫组织化学)区分。还提出了对化学疗法[2]、培美曲塞[5]和/或EGFR抑制剂疗法的潜在反应差异[2]。在末端呼吸单元(TRU)亚型中证实了EGFR过表达的富集[2,3]。与LKB1/STK11缺失结合的更高的KRAS突变频率,更可能发生在近端增生(PP)亚型中[2,3]。TP53突变和免疫基因激活是近端炎症(PI)亚型的标志[2-4]。初步数据可能证明TRU亚型中对EGFR抑制剂的反应增强、PP亚型中对化学疗法的反应增强、TRU亚型中的培美曲塞反应增强、以及PI亚型中对免疫疗法的潜在反应的可能性[2-6]。新兴数据表明,按照基因表达亚型的AD分类可以提供有价值的信息,从而补充药物靶标突变检测并为肺癌患者管理提供信息。
目的
肺腺癌(AD)亚型分型主要限于如下研究方案,该研究方案涉及:从新鲜冷冻肺肿瘤中提取RNA,随后使用超过500种基因的定量基因表达来应用最近质心(nearest centroid)预测因子。尽管有腺癌亚型分型的预后和预测益处的证据,但是对新鲜冷冻组织的需求,需要>500种基因的基因表达结合复杂的生物信息学分析,阻碍了AD亚型分型在药物开发和/或临床中的应用。这项研究的目的是开发用于区分腺癌的三种亚型(末端呼吸单元型(TRU),以前称为支气管型;近端增生型(PP),以前称为巨型;和近端炎症型(PI),以前称为鳞状型)的稳健而有效的基因标签(需要较少的基因)。新的有效基因标签可以用于从新鲜冷冻或FFPE肿瘤样品中可靠地对AD亚型分型,使其适用于使用任何可获得的定量RNA平台(qRT-PCR、RNAseq、Affymetrix或Agilent阵列)进行诊断应用和/或药物开发。用于区分腺癌亚型的48种基因标签的开发如本文的方法部分中所述进行。
方法
使用515个肺腺癌癌症基因组图集(TCGA)RNAseq数据集用于训练和506种基因分类器用于定义金标准亚型,开发了48种基因标签,其在应用于几个独立测试集时保持低错误分类率。从标准的506种分类器基因开始,使用至最近质心阵列分类(CLaNC)[7]算法加以修改用于对每种亚型选择相等数量的负相关基因和正相关基因。使用TCGA肺腺癌数据集进行基于5折交叉验证曲线选择包括在标签中的基因的最佳数目(每种亚型16个)(参见图8)。图9中显示了用于训练预测因子的原型样品的选择,其中为了获得48种基因的最终列表,将CLaNC应用于整个TCGA数据集减去20%的具有最低金标准亚型预测强度的样品,从每种亚型中去除相等数量(图9)。然后在几个新鲜冷冻公开可获得的阵列和RNAseq数据集[2,8,9]中测试48种基因标签,并将结果与如由先前公布的506种基因标签[2]定义的金标准亚型称谓进行比较。然后在存档的FFPE腺癌样品的新收集的RNAseq数据集中进行48种基因标签(表1)的最终验证,以确保在FFPE样品中具有可比的性能。
为了验证所选的48种基因标签的一致性能,新收集的FFPE样品是肺腺癌(AD)残留存档样品(主要是手术样品),这些样品是在北卡罗来纳大学教堂山分校(NC)的IRB批准方案下收集的。由病理学家审查样品的肿瘤细胞,并且在提取之前宏观切开三个10μm组织切片以富集肿瘤细胞。将RNA定量并且每个样品输入100ng。使用Illumina RNA-Access试剂盒构建富集转录组的测序文库。通过使用BA分析仪对测序文库进行质量控制,并使用qPCR进行定量。在Illumina RNA-Access平台(50bp PE,20-30百万读数)上生成序列数据,并且通过使用fastQC进行质量控制。使用STAR比对器将序列结果与hg19参考序列比对,并使用Cufflinks构建转录组[10]。使用cuff compare来注释转录组并计算各种表达基因的计数。根据癌症基因组图集肺腺癌分析中使用的方法,将RSEM表达计数估计值进行上四分位数归一化和log2转化[3,11]。
结果
表2中显示了该研究中开发的48种基因标签基因列表,而每个AD亚型的48种基因标签基因列表的T统计量可以在表1中找到。分别在图10、图11和图12中显示了为每种AD亚型(支气管型、巨型、鳞状型)选择的16种基因的中值基因表达。在图13中显示了使用48种基因标签的亚型称谓与在几个不同的测试数据集中公布的506种基因标签亚型称谓的一致性。新开发的48种基因标签表明在新收集的FFPE数据集中的一致性为0.84,并且在其他3个新鲜冷冻的测试数据集中为0.79-0.92的范围。以下是测试数据集、RNA平台类型和所使用的腺癌样品数目的汇总。
参考文献 RNA平台 腺癌样品
TCGA腺癌 RNAseq 515
Shedden等人 Affymetrix阵列 442
Tomida等人 Agilent阵列 117
新收集的UNC FFPE样品 RNAseq 88
结论
描述了用于AD亚型分型的有效的48种基因标签的开发和验证。当应用于几个独立的测试集时,所得的48种基因标签保持低错误分类率。因此,新标签从新鲜冷冻或FFPE肿瘤样品中可靠地对AD进行亚型分型,并且可以使用从包括RNAseq和阵列在内的各种平台生成的基因表达数据可靠地执行。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Hayes DN,Monti S,Parmigiani G,et al.Gene expression profiling revealsreproducible human lung adenocarcinoma subtypes in multiple independentpatient cohorts.J Clin Oncol 2006.24(31):5079-5090.
2.)Wilkerson M,Yin X,Walter V,et al.Differential pathogenesis of lungadenocarcinoma subtypes involving sequence mutations,copy number,chromosomalinstability,and methylation.PLoS ONE.2012;7(5)e36530.Doi:10.1371/journal.pone.0036530.
3.)Cancer Genome Atlas Research Network.Comprehensive molecular profilingof lung adenocarcinoma.Nature 511.7511(2014):543-550.
4.)Ringner M,Jonsson G,Staaf J.Prognostic and Chemotherapy PredictiveValue of Gene-Expression Phenotypes in Primary Lung Adenocarcinoma.ClinCancer Research 2016;22(1):218-29.
5.)Fennell DA,Myrand SP,Nguyen TS,Ferry D,Kerr KM,et al.Associationbetween Gene Expression Profile and Clinical Outcome of Pemetrexed-BasedTreatment in Patients with Advanced Non-Small Cell Lung Cancer:ExploratoryResults from a Phase II study.PLOS one 2014;September14 9(9):e107455.
6.)Skoulidis F,Byers LA,Diao L,Papadimitrakopoulou VA,Tong P,et al.Co-occuring genomic alterations define major subsets of KRAS-mutant lungadenocarcinoma with distinct biology,immune profiles,and therapeuticvulnerabilities.Cancer Discov 2015;Aug 5(8):860-77.
7.)Dabney AR.ClaNC:Point-and-click software for classifying microarraysto nearest centroids.Bioinformatics.2006;22:122–123.doi:10.1093/bioinformatics/bti756
8.)Shedden K,Taylor JMG,Enkemann SA,et al.Gene expression-based survivalprediction in lung adenocarcinoma:a multi-site,blinded validation study:director’s challenge consortium for the molecular classification of lungadenocarcinoma.Nat Med 2008.14(8):822-827.doi:10.1038/nm.1790.
9.)Tomida S,Takeuchi T,Shimada Y,Arima C,Maatsuo K,et al.Relapse-RelatedMolecular Signature Identifies Patients With Dismal Prognosis.J Clin Oncol2009;27(17):2793-99.
10.)Trapnell C,Williams BA,Pertea G,Mortazavi A,Kwan G,van Baren MJ,etal.Transcript assembly and quantification by RNA-Seq reveals unannotatedtranscripts and isoform switching during cell differentiation.Naturebiotechnology 2010;28(5):511-5.
11.)Li B,and Dewey CN.RSEM:accurate transcript quantification from RNA-Seq data with or without a reference genome.BMC Bioinformatics 2011,12:323doi:10.1186/1471-2105-12-323
实施例3-如使用来自实施例2的肺腺癌亚型分型48种基因标签所确定的肺腺癌内在亚型之间的免疫细胞活化差异。
方法
使用以前公布的Bindea等人(3)免疫细胞基因标签(总共24种)和和实施例2中描述的用于对AD亚型分型的肺AD亚型分型基因标签,针对与如使用实施例2中描述的肺AD基因标签所确定的AD亚型相关的免疫细胞特征检测了几个可公开获得的肺AD数据集(1-2,4-5;参见图2)。在3种AD亚型(TRU、PP和PI)中检测了先天性免疫细胞(IIC)和适应性免疫细胞(AIC)两者的基因表达标签、13种基因IFN标签(IFN)、以及单基因免疫生物标记物(CTLA4、PDCD1、以及CD274(PD-L1)、PDCDLG2(PD-L2))。使用线性回归评价免疫细胞标签与肿瘤亚型和与CD274表达的关联。还分析了免疫标签的分级聚类和成对标签相关性。使用分层cox比例风险模型评价第I-III阶段样品的存活标签关联,从而允许每个数据集中的不同基线风险。
结果
使用实施例2的TCGA AD数据集和48种基因AD亚型分型标签,免疫细胞基因标签的热图分析和无监督分级聚类以与实施例1中观察到的相似的方式提供AD的内在亚型的分离(参见图3和图14)。此外,与在实施例1中观察到的相似,免疫细胞标签基因表达模式在多个AD(参见图15)数据集中是一致的(参见图5)。与AD亚型相比,进行了CD274(PD-L1)表达与适应性免疫细胞标签的关联强度分析。如图16中所示(像实施例1的图6中一样),对于AD亚型,关联强度(调整的R平方)是混合的,表明对于一些细胞(B细胞、T细胞、Th1、Treg、细胞毒性细胞、T辅助细胞、Tem、Tgd)CD274关联更大,而对于其他细胞(TFH、Th2、CD8、Th17和Tcm)AD亚型关联更大。如在实施例1中,免疫激活在AD的PI亚型中最突出,而AD的PP亚型表现出较低的免疫激活,并且AD亚型和CD274表达类似地预测AIC表达(参见图6和图16)。
使用cox比例风险模型,计算增加一个表达单位的亚型特异性风险比。针对病理阶段调整亚型特异性HR,并计算置信区间。在图17中显示了针对一种或多种亚型显示显著存活关联的细胞标签或基因的HR和CI。对于AD亚型,像在实施例1中一样,许多先天性性和适应性免疫细胞、CD274(PD-L1)和CTLA4的表达的单位增加与AD的PI亚型中的存活改善显著相关,但在其他亚型中没有显著相关(参见图7A-图7B和图17)。总体而言,像实施例1中一样,免疫细胞标签的存活分析表明T辅助17和T滤泡辅助免疫细胞预测AD中的存活改善(p<0.001)(参见图7A-图7B和图17)。
结论
在显示肺AD亚型在其免疫景观中如何有差异方面,实施例2中描述的AD亚型分型的48种基因标签显示出与实施例1中使用的一种或多种AD亚型分型基因标签相似的结果。与实施例1的AD亚型分型基因标签一致,该实施例中使用的AD亚型分型基因标签显示肺AD基因表达亚型在其免疫景观中有差异。AD的内在生物学亚型揭示了免疫细胞活化的关键差异,其不总是与CD274表达相关并且展示与存活的可变关联。AD PP亚型显示出最小的免疫浸润,表明对immunoRX的应答降低。AD PI亚型显示出与改善的存活相关的免疫特征表达。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Wilkerson MD,et al.PLoS One 2012;7(5):e36530.PMID 22590557
2.)TCGA Lung AdenoC.Nature 2014;511(7511):543-550.PMID25079552
3.)Bindea et al.,Immunity 2013;39(4):782-95.PMID 24138885
4.)Shedden K.et al.Nat Med 2008;14(8):822-827.PMID 18641660
5.)Tomida S,et al.J Clin Oncol 2009;27(17):2793-99.PMID 19414676
6.)Lee ES,et al.Cancer Res 2008;14(22):7397-7404.PMID 19010856
7.)Raponi M,et al.Cancer Res 2006;66(7):466-72.PMID 16885343
实施例4-肺腺癌的表达亚型揭示了不同的免疫景观和独特的体细胞遗传特征,表明对 多种药物靶标的差异性反应
介绍:基于基因表达的肺腺癌(AD)亚型分型将AD肿瘤分类为具有可变结果和对疗法有潜在反应的不同亚型。基于基因表达的亚型分型一致地鉴定了3种不同的肺AD生物学类型:末端呼吸单元型(TRU)(以前为支气管型)、近端增生型(PP)(以前为巨型)和近端炎症型(PI)(以前为鳞状型)(1,2)(参见图1)。AD亚型展示了基因组改变、肿瘤驱动因素、预后以及可能对各种疗法的反应的关键差异(1-2)。
方法:作为实施例1中进行的实验的后续,在使用图2中所示的TCGA肺癌基因表达数据集(AD n=515)2确定的来自实施例1的肺AD亚型中评价差异性药物靶基因表达。使用基因表达模式在实施例1中定义了先前公布的AD亚型(TRU、PP和PI)。在该实施例中,作为对免疫细胞基因标签(Bindea等人24种免疫细胞类型)4、单一免疫基因生物标记物(CTLA4、PDCD1(PD-1)和CD274(PD-L1))的表达、增殖(11种基因标签;参见表9)5、和在实施例1中完成的非沉默突变负荷的检测的补充,根据来自实施例1的AD亚型检测出来自临床肿瘤学实体瘤突变小组(322种基因,参见表8)3的基因的可变表达。使用具有Bonferroni校正Kruskal-Wallis(KW)检验评估差异性基因表达,而将线性回归和Spearman相关性用于评价非沉默突变负荷、肿瘤亚型和CD274(PD-L1)表达与免疫细胞表达的关联。
结果:如图21中所示,观察到AD亚型中208个/322个肿瘤小组基因(65%)的可变表达(KW Bonferroni阈值p<0.000155)。大多数药物靶基因(包括但不限于AD中的AURKA、CHEK1、ROS1、CD274(PD-L1)、CSF1R和ERBB4)在各亚型中表现出强烈的差异性表达(p<1E-28)。此外,从表10可以看出,来自临床肿瘤学实体瘤突变小组的322种基因中的前25种基因在AD亚型之间显示出差异性基因表达。免疫细胞表达在亚型之间也是高度可变的(参见图3)。AD的PI亚型表现出最大的免疫细胞表达,而AD的PP亚型表现出低的免疫细胞表达(参见图3)。非沉默突变负荷与免疫细胞表达没有强烈的相关性(在AD中,Spearman相关性=-0.07),然而,AD的PI亚型(其富含TP53突变)与升高的免疫细胞表达和高的突变负荷相关(参见图20)。总体而言,如图20中所示,在增殖、非沉默突变负荷和关键药物靶标CD274(PD-L1)、PDCD1(PD-1)、和CTLA4方面存在显著的AD亚型差异。
结论:肺AD的分子亚型在临床实体瘤测序小组中包括的大多数关键药物靶基因的表达方面有差异。肺AD的分子亚型揭示了宿主免疫应答和免疫靶标的差异性表达。应该单独地并且与免疫细胞特征和关键突变靶标组合地研究亚型作为潜在生物标记物的药物敏感性的评价。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Wilkerson MD,et al.PLoS One 2012;7(5):e36530.PMID 22590557
2.)TCGA Lung AdenoC.Nature 2014;511(7511):543-550.PMID25079552
3.)Foundation Medicine Solid Tumor Mutation Panel accessed October2014.
4.)Bindea et al.,Immunity 2013;39(4):782-95.PMID 24138885
5.)Neilson TO,et al.Clin Cancer Res 2010;16(21):522-5232.PMID20837693.
实施例5:肺腺癌的表达亚型揭示了不同的免疫景观和独特的体细胞遗传特征,表明对多种药物靶标的差异性反应
介绍:就像实施例4中一样,该实施例的目的是评估临床上重要基因在先前定义的腺癌(AD)基因表达亚型中的差异性表达。与使用如实施例1中描述的TCGA肺癌基因表达数据集(AD n=515)2进行基于基因表达的AD亚型分型的实施例4相反,使用实施例2中描述的48个基因集进行本实施例中基于基因表达的AD亚型分型。此外,临床上重要的基因是322种基因(参见表8),其构成用于管理肿瘤学患者的临床实体瘤突变测序小组以鉴定影响治疗管理的基因组改变和/或确定靶向药物临床试验的合格性。就像实施例4中一样,还使用11种基因增殖标签(参见表9)评估在AD亚型之间的肿瘤增殖的差异。
方法:使用TCGA肺癌基因表达数据集(腺癌(AD)n=515)1,在肺AD亚型中评价差异性药物靶基因表达。如前所述的(最近质心预测)2使用Clanc48AD subtyper(参见实施例2和本文所述)来定义在AD中的亚型。检测了AD亚型末端呼吸单元型(TRU)、近端增生型(PP)和近端炎症型(PI)。根据AD,检测来自临床肿瘤学实体瘤突变小组(322种基因)3的基因的可变表达。使用具有Bonferroni校正的Kruskal-Wallis(KW)检验评估差异性基因表达。此外,增殖得分计算为11种基因PAM50增殖标签4中可获得基因的平均表达(log2(RSEM+1))。使用Kruskal-Wallis检验来测试亚型-增殖的关联。
结果:与图21相似,图22显示了观察到的AD亚型之间的203个/322个肿瘤小组基因(63%)的可变表达(KW Bonferroni阈值p<0.000155)。此外,就像实施例4中的图20中一样,存在显著的AD亚型增殖差异(参见图23)。此外,从表11中所见的来自临床肿瘤学实体瘤突变小组的322种基因中的前25种基因在AD亚型之间显示出差异性基因表达与表10中发现的非常相似。
结论:就像实施例4中一样,肺AD的分子亚型在临床实体瘤测序小组中包括的大多数关键药物靶基因的表达方面有差异。肺AD的分子亚型揭示了宿主免疫应答和免疫靶标的差异性表达。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)TCGA Lung AD.Nature 2014;511(7511):543-550.PMID 25079552
2.)Wilkerson MD,et al.PLoS One 2012;7(5):e36530.PMID 22590557
3.)Foundation Medicine Solid Tumor Mutation Panel accessed October 6,2014.
4.)Neilson TO,Parker JS,Leung S,et al.Clin Cancer Res 2010;16(21):5222-5232.PMID 20837693
表10.如实施例4中所确定的AD表达亚型的322肿瘤小组3的前25种分化基因。
表11.如实施例5中所确定的AD表达亚型的322肿瘤小组3的前25种分化基因。
*******
上述不同的实施方案可以组合以提供另外的实施方案。将在本说明书中引用的和/或在申请数据表中列举的所有美国专利申请公开案、美国专利申请、外国专利、外国专利申请和非专利公开案通过引用以其整体结合在此。如果必要的话,可以修改实施方案的方面,以采用不同专利、申请和公开案的概念以提供另外的实施方案。
根据上文详细说明,可以对实施方案作出这些和其他改变。总体上,在以下权利要求书中,所使用的术语不应解读为将权利要求书限制为说明书和权利要求书中公开的具体实施方案,而应解读为包括所有可能的实施方案连同这些权利要求所享有的等效权利的全部范围。因此,权利要求书不受本公开文本的限制。
序列表
<110> 基因中心治疗公司
北卡罗莱纳大学教堂山分校
Faruki, Hawazin
Lai-Goldman, Myla
Mayhew, Greg
Serody, Jonathan
Perou, Charles
Hayes, David Neil
<120> 对肺腺癌亚型分型的方法
<130> GNCN-009/01WO 320289-2034
<150> US 62/425,717
<151> 2016-11-23
<150> US 62/420,836
<151> 2016-11-11
<150> US 62/396,587
<151> 2016-09-19
<150> US 62/337,645
<151> 2016-05-17
<150> US 62/337,591
<151> 2016-05-17
<160> 48
<170> PatentIn 版本3.5
<210> 1
<211> 2122
<212> DNA
<213> 智人
<400> 1
ctctagcttc tagcacaatg tctgtcattt aatgggcatt cagtacataa tagataggta 60
attgaatgaa tggatttaga tgcctgggtg ttttctttct acttgtattc tattccccac 120
atcctctcca aagatttcag catcatcaag acatattatc ctgtgtcttc cttctgaaga 180
tttaaattat agtgatcacc aaatccatgt tgatatgata acaatggtta agaagtttga 240
atatgttatt ttctctaagc aatacagttg tatattaatc agaatctccc agagaaagcc 300
ccttagagca ggcagttcca taaaaggaat gtcaggaact tctgcaggct ggatgaggac 360
atacactgag tgaacaagtc tgtcaactgc tctaaagaca ctgtcaatgc catataaaag 420
ctggccttgt tcatctagca gatcatgggg gtgagacagt ccagtgcctc tctgccccta 480
caatatatga agaaagggga agaaacacac attgcctcct ggtagattag gggaggactt 540
cttgtacatt tttagcaaaa tccgagttca gacccagcaa ttagacaaaa gggtcagcaa 600
actatggtcg atgggctaca tctgcccact gcatgttttt gtaaatgaag ttttattggg 660
acacagccat acctattcac ttttgcatta tctatggctg cttttgcact ttgatgaaag 720
agttgagtag ttgagacaga cactgtttga cccacaaaat ctaaaataca tactatctag 780
cccttcctag caaacatttg ccaaccccta gaaaactttt aaaaaatgat gctcttcgac 840
ttgaaatttt tataatcttc tgtttattgt caataggtgc tgctgatttt caaaaaatga 900
cttagaatcc tcaaataagt atacagcctt atatgctgct tagacaccaa agctatgata 960
agatttgtca gttctttgta tcagatgggt tcaattcttg acatcagcta atgttataaa 1020
aataactaca aaattggttg taatagaacc aaatctaaga ctctttttaa taaaaaagat 1080
caccattgct ggtgagaaac ctatactgaa tgggtgagat gccattgcat ttatctgaag 1140
tttcgtcttt ataatcaata atcatataca atcctagtca agaaactcat cttacagtcc 1200
ttggggattg aacactgtga aaataaactt ttactcttcg gatgtgcttg gattttgttt 1260
taaattaaga actacagaaa tatatatcat ttctagtggt agaggaaaat attgccaccc 1320
agaactttct gaatgtctct ttctgcccta ggtccatttg tgatgaacac caatgaagag 1380
atttctcaag ctattcttga tttcagaaac gcaaaaaatg ggtttgaaag ggccaaaacc 1440
tggaaatcaa agattgggaa ctagtggaaa gcggaagagc aggtcttgat gtgtcctaga 1500
attttgccat ttctgagatt gagccattga aggcattcca tttctaaagc ttatttagcc 1560
ggtgcttcta aagaattcca cactaacgtg ataacatggt ttttgtaaca ataaatgtag 1620
gatatttcct ggcacatgca aataaaccta atcattgttt ctttaaaaat cagtgttttt 1680
catttgagat acctaagtta ctaagcttct gtttaaaaag tcgttttgtg tatgtttgcc 1740
tttttttgca tgtatggatg gatgttttta ttatttttgt gcatgtgcag gttttaaaaa 1800
tcatatttga ttgctttctg tgtgtcattg gcagcagatg catgagcatc tgaggtccct 1860
tcttaagcaa tcccactgag atacaaaggt caaagctatg tgctggggtt tcatgttaca 1920
ggttatctgc tttaaaataa cggcagccct gaacatttga gtcagttctt aaaactgccc 1980
tgctattggt agggacgcaa caggattaca gccaagactt ctctgcattt tctgccaaaa 2040
tctgtgtcag atttaagaca catgcttctg caagcttcca tgaaggttgt gcaaaaaagt 2100
ttcaatccag agttgggttc ca 2122
<210> 2
<211> 1514
<212> DNA
<213> 智人
<400> 2
ttcgcgctcc cgccgctcct ccacgctcgt gccgctcccc ccccgcgctc ccagttgacg 60
ctctgggccg ccacctccgc ggaccctgag cgcaagagcc aagccgccag cgctgcgatg 120
tgggccacgc tgccgctgct ctgcgccggg gcctggctcc tgggagtccc cgtctgcggt 180
gccgccgaac tgtgcgtgaa ctccttagag aagtttcact tcaagtcatg gatgtctaag 240
caccgtaaga cctacagtac ggaggagtac caccacaggc tgcagacgtt tgccagcaac 300
tggaggaaga taaacgccca caacaatggg aaccacacat ttaaaatggc actgaaccaa 360
ttttcagaca tgagctttgc tgaaataaaa cacaagtatc tctggtcaga gcctcagaat 420
tgctcagcca ccaaaagtaa ctaccttcga ggtactggtc cctacccacc ttccgtggac 480
tggcggaaaa aaggaaattt tgtctcacct gtgaaaaatc agggtgcctg cggcagttgc 540
tggactttct ccaccactgg ggccctggag tctgcgatcg ccatcgcaac cggaaagatg 600
ctgtccttgg cggaacagca gctggtggac tgcgcccagg acttcaataa tcacggctgc 660
caagggggtc tccccagcca ggctttcgag tatatcctgt acaacaaggg gatcatgggt 720
gaagacacct acccctacca gggcaaggat ggttattgca agttccaacc tggaaaggcc 780
atcggctttg tcaaggatgt agccaacatc acaatctatg acgaggaagc gatggtggag 840
gctgtggccc tctacaaccc tgtgagcttt gcctttgagg tgactcagga cttcatgatg 900
tatagaacgg gcatctactc cagtacttcc tgccataaaa ctccagataa agtaaaccat 960
gcagtactgg ctgttgggta tggagaaaaa aatgggatcc cttactggat cgtgaaaaac 1020
tcttggggtc cccagtgggg aatgaacggg tacttcctca tcgagcgcgg aaagaacatg 1080
tgtggcctgg ctgcctgcgc ctcctacccc atccctctgg tgtgagccgt ggcagccgca 1140
gcgcagactg gcggagaagg agaggaacgg gcagcctggg cctgggtgga aatcctgccc 1200
tggaggaagt tgtggggaga tccactggga cccccaacat tctgccctca cctctgtgcc 1260
cagcctggaa acctacagac aaggaggagt tccaccatga gctcacccgt gtctatgacg 1320
caaagatcac cagccatgtg ccttagtgtc cttcttaaca gactcaaacc acatggacca 1380
cgaatattct ttctgtccag aagggctact ttccacatat agagctccag ggactgtctt 1440
ttctgtattc gctgttcaat aaacattgag tgagcacctc cccagatgga gcatgctggt 1500
cctggaaaaa aaaa 1514
<210> 3
<211> 1833
<212> DNA
<213> 智人
<400> 3
aaagccgcgt cctgatcaat ggggcgggcg gcttagcgcg cgcggccacc tggtccgagg 60
aggagcagtc ccggggcccg ccgcaggtcg ggtggctcag ccatggctcc tcggggcgca 120
gcggccggcc ggagcccggg accctgcgcg gggcgctgag ctcccgagcg ggcagagggc 180
acgggcaggc ggacgtcggg gcgccctcgg ggaacgtgcg ggcaccatgc gtccccacct 240
gtcgccgccg ctgcagcagc tactactgcc ggtgctgctc gcctgcgccg cgcactcgac 300
tggagccctt ccccgactat gtgacgtgct acaagtgctg tgggaagagc aagaccagtg 360
cctgcaggaa ctctccagag agcagacagg agacctgggc acggagcagc cagtgccagg 420
ttgtgagggg atgtgggaca acataagctg ctggccctct tctgtgccgg gccggatggt 480
ggaggtggaa tgcccgagat tcctccggat gctcaccagc agaaatggtt ccttgttccg 540
aaactgcaca caggatggct ggtcagaaac cttccccagg cctaatctgg cctgtggcgt 600
taatgtgaac gactcttcca acgagaagcg gcactcctac ctgctgaagc tgaaagtcat 660
gtacaccgtg ggctacagct cctccctggt catgctcctg gtcgcccttg gcatcctctg 720
tgctttccgg aggctccact gcactcgcaa ctacatccac atgcacctgt tcgtgtcctt 780
catccttcgt gccctgtcca acttcatcaa ggacgccgtg ctcttctcct cagatgatgt 840
cacctactgc gatgcccaca gggcgggctg caagctggtc atggtgctgt tccagtactg 900
catcatggcc aactactcct ggctgctggt ggaaggcctc taccttcaca cactcctcgc 960
catctccttc ttctctgaaa gaaagtacct ccagggattt gtggcattcg gatggggttc 1020
tccagccatt tttgttgctt tgtgggctat tgccagacac tttctggaag atgttgggtg 1080
ctgggacatc aatgccaacg catccatctg gtggatcatt cgtggtcctg tgatcctctc 1140
catcctgatt aatttcatcc ttttcataaa cattctaaga atcctgatga gaaaacttag 1200
aacccaagaa acaagaggaa atgaagtcag ccattataag cgcctggcca ggtccactct 1260
cctgctgatc cccctctttg gcatccacta catcgtcttc gccttctccc cagaggacgc 1320
tatggagatc cagctgtttt ttgaactagc ccttggctca ttccagggac tggtggtggc 1380
cgtcctctac tgcttcctca atggggaggt gcagctggag gttcagaaga agtggcagca 1440
atggcacctc cgtgagttcc cactgcaccc cgtggcctcc ttcagcaaca gcaccaaggc 1500
cagccacttg gagcagagcc agggcacctg caggaccagc atcatctgag aggctggagc 1560
agggtcaccc acggacagag accaagagag gtcctgcgaa ggctgggcac tgctgtggga 1620
cagccagtct tcccagcaga caccctgtgt cctccttcag ctgaagatgc ccctccccag 1680
gccttggact cttccgaagg gatgtgaggc actgtggggc aggacaaggg cctgggattt 1740
ggttcgtttg ctcttctggg aagagaagtt caggggtccc agaaagggac agggaaataa 1800
atggtgcctg ggatgagatt caaaaaaaaa aaa 1833
<210> 4
<211> 2128
<212> DNA
<213> 智人
<400> 4
aagatgcatg ggtccagagt ataaaggaac ccaggagcag ctgaaggcag gtcagatgaa 60
ggctaggtgg ctggaactgc aaccatggtg cccagcttcc tctccctgag cttctcctcc 120
ttgggcctgt gggcttctgg gctgatcttg gtcttaggct ttctcaagct catccacctg 180
ctgctgcgga ggcagacgtt ggctaaggct atggacaaat tcccagggcc tcccacccac 240
tggctttttg gacatgccct cgagatccag gagacgggga gcctggacaa agtggtgtcc 300
tgggcccacc agttcccgta tgcccaccca ctctggttcg gacagttcat tggcttcctg 360
aacatctatg agcctgacta tgccaaagct gtgtacagcc gtggggggag aggcctgctg 420
gttcttgagg ggcccaagtg gttgcagcac cgcaagctgc tcacacctgg ctttcattat 480
gatgtgctga agccctatgt ggccgtgttc actgagtcta cacgtatcat gctggacaag 540
tgggaagaga aagctcggga gggtaagtcc tttgacatct tctgcgatgt gggtcacatg 600
gcgctgaaca cactcatgaa gtgcaccttt ggaagaggag acaccggcct gggccacagc 660
agggacagca gctactacct tgcagtcagc gatctcactc tgttgatgca gcagcgcctt 720
gtgtccttcc agtaccataa tgacttcatc tactggctca ccccacatgg ccgccgcttc 780
ctgcgggcct gccaggtggc ccatgaccat acagaccagg tcatcaggga gcggaaggca 840
gccctgcagg atgagaaggt gcggaagaag atccagaacc ggaggcacct ggacttcctg 900
gacattctcc tgggtgcccg ggatgaagat gacatcaaac tgtcagatgc agacctccgg 960
gctgaagtgg acacattcat gtttgaaggc catgacacca ccaccagtgg tatctcctgg 1020
tttctctact gcatggccct gtaccctgag caccagcatc gttgtagaga ggaggtccgc 1080
gagatcctag gggaccagga cttcttccag tgggatgatc tgggcaaaat gacttatctg 1140
accatgtgca tcaaggagag cttccgcctc tacccacctg tgccccaggt gtaccgccag 1200
ctcagcaagc ctgtcacctt tgtggatggc cggtctctac ctgcaggaag cctgatctct 1260
atgcatatct atgccctcca taggaacagt gctgtatggc ccgaccctga ggtctttgac 1320
tctctgcgct tttccactga gaatgcatcc aaacgccatc cctttgcctt tatgcccttc 1380
tctgctgggc ccaggaactg cattgggcag cagtttgcca tgagtgagat gaaggtggtc 1440
acagccatgt gcttgctccg ctttgagttc tctctggacc cctcacggct gcccatcaag 1500
atgccccagc ttgtcctgcg ctccaagaat ggctttcacc tccacctgaa gccactgggc 1560
cctgggtctg ggaagtagct ctgatgagaa tggggtccca gatggctcag gctgtgacct 1620
ccctgggcac caccctcccc aggctgggtg tggaggagtt ggggccccct gccttcagga 1680
ggcttgtagt ttagaaggga agtaggcatt accatagacg actcctagag gacagtgcta 1740
tgtaaaaatg tgtgtctata aatgtttatc atgcatgtat tctagagctc attcatttat 1800
tcaacaaaca tttggtgagc acctatttcg ttcgagaaac ttcatttatc tcctataatt 1860
ggcaaactta aaaatgcagc agaaacttac attccaacct tagagactca tagtgagcac 1920
aaggaaagtt ttgccctgag attcatggtt atggctgggt accaccaaat agaagaatgg 1980
cttaggggag tgccccttca ctgagatgtg tttctttgtt gaactttgtg tgtgtgtgtt 2040
tagaatataa cagacataag aaaaaattac ctaaatgaag actgtacaaa ataataaata 2100
attctgaagc agaaaaaaaa aaaaaaaa 2128
<210> 5
<211> 3903
<212> DNA
<213> 智人
<400> 5
atgaaatccc caaggagaac cactttgtgc ctcatgttta ttgtgattta ttcttccaaa 60
gctgcactga actggaatta cgagtctact attcatcctt tgagtcttca tgaacatgaa 120
ccagctggtg aagaggcact gaggcaaaaa cgagcagttg ccacaaaaag tcctacggct 180
gaagaataca ctgttaatat tgagatcagt tttgaaaatg catccttcct ggatcctatc 240
aaagcctact tgaacagcct cagttttcca attcatggga ataacactga ccaaattacc 300
gacattttga gcataaatgt gacaacagtc tgcagacctg ctggaaatga aatctggtgc 360
tcctgcgaga caggttatgg gtggcctcgg gaaaggtgtc ttcacaatct catttgtcaa 420
gagcgtgacg tcttcctccc agggcaccat tgcagttgcc ttaaagaact gcctcccaat 480
ggaccttttt gcctgcttca ggaagatgtt accctgaaca tgagagtcag actaaatgta 540
ggctttcaag aagacctcat gaacacttcc tccgccctct ataggtccta caagaccgac 600
ttggaaacag cgttccggaa gggttacgga attttaccag gcttcaaggg cgtgactgtg 660
acagggttca agtctggaag tgtggttgtg acatatgaag tcaagactac accaccatca 720
cttgagttaa tacataaagc caatgaacaa gttgtacaga gcctcaatca gacctacaaa 780
atggactaca actcctttca agcagttact atcgaaagca atttctttgt cacaccagaa 840
atcatctttg aaggggacac agtcagtctg gtgtgtgaaa aggaagtttt gtcctccaat 900
gtgtcttggc gctatgaaga acagcagttg gaaatccaga acagcagcag attctcgatt 960
tacaccgcac ttttcaacaa catgacttcg gtgtccaagc tcaccatcca caacatcact 1020
ccaggtgatg caggtgaata tgtttgcaaa ctgatattag acatttttga atatgagtgc 1080
aagaagaaaa tagatgttat gcccatccaa attttggcaa atgaagaaat gaaggtgatg 1140
tgcgacaaca atcctgtatc tttgaactgc tgcagtcagg gtaatgttaa ttggagcaaa 1200
gtagaatgga agcaggaagg aaaaataaat attccaggaa cccctgagac agacatagat 1260
tctagctgca gcagatacac cctcaaggct gatggaaccc agtgcccaag cgggtcgtct 1320
ggaacaacag tcatctacac ttgtgagttc atcagtgcct atggagccag aggcagtgca 1380
aacataaaag tgacattcat ctctgtggcc aatctaacaa taaccccgga cccaatttct 1440
gtttctgagg gacaaaactt ttctataaaa tgcatcagtg atgtgagtaa ctatgatgag 1500
gtttattgga acacttctgc tggaattaaa atataccaaa gattttatac cacgaggagg 1560
tatcttgatg gagcagaatc agtactgaca gtcaagacct cgaccaggga gtggaatgga 1620
acctatcact gcatatttag atataagaat tcatacagta ttgcaaccaa agacgtcatt 1680
gttcacccgc tgcctctaaa gctgaacatc atggttgatc ctttggaagc tactgtttca 1740
tgcagtggtt cccatcacat caagtgctgc atagaggagg atggagacta caaagttact 1800
ttccatacgg gttcctcatc ccttcctgct gcaaaagaag ttaacaaaaa acaagtgtgc 1860
tacaaacaca atttcaatgc aagctcagtt tcctggtgtt caaaaactgt tgatgtgtgt 1920
tgtcacttta ccaatgctgc taataattca gtctggagcc catctatgaa gctgaatctg 1980
gttcctgggg aaaacatcac atgccaggat cccgtaatag gtgtcggaga gccggggaaa 2040
gtcatccaga agctatgccg gttctcaaac gttcccagca gccctgagag tcccattggc 2100
gggaccatca cttacaaatg tgtaggctcc cagtgggagg agaagagaaa tgactgcatc 2160
tctgccccaa taaacagtct gctccagatg gctaaggctt tgatcaagag cccctctcag 2220
gatgagatgc tccctacata cctgaaggat ctttctatta gcatagacaa agcggaacat 2280
gaaatcagct cttctcctgg gagtctggga gccattatta acatccttga tctgctctca 2340
acagttccaa cccaagtaaa ttcagaaatg atgacgcacg tgctctctac ggttaatgtc 2400
atccttggca agcccgtctt gaacacctgg aaggttttac aacagcaatg gaccaatcag 2460
agttcacagc tactacattc agtggaaaga ttttcccaag cattacagtc gggagatagc 2520
cctcctttgt ccttctccca aactaatgtg cagatgagca gcatggtaat caagtccagc 2580
cacccagaaa cctatcaaca gaggtttgtt ttcccatact ttgacctctg gggcaatgtg 2640
gtcattgaca agagctatct agaaaacttg cagtcggatt cgtctattgt caccatggct 2700
ttcccaactc tccaagccat ccttgcccag gatatccagg aaaataactt tgcagagagc 2760
ttagtgatga caaccactgt cagccacaat acaactatgc cattcaggat ttcaatgact 2820
tttaagaaca atagcccttc aggcggcgaa acgaagtgtg tcttctggaa cttcaggctt 2880
gccaacaaca caggggggtg ggacagcagt gggtgctatg tagaagaagg tgatggggac 2940
aatgtcacct gtatctgtga ccacctaaca tcattctcca tcctcatgtc ccctgactcc 3000
ccagatccta gttctctcct gggaatactc ctggatatta tttcttatgt tggggtgggc 3060
ttttccatct tgagcttggc agcctgtcta gttgtggaag ctgtggtgtg gaaatcggtg 3120
accaagaacc ggacttctta tatgcgccac acctgcatag tgaatatcgc tgcctccctt 3180
ctggtcgcca acacctggtt cattgtggtc gctgccatcc aggacaatcg ctacatactc 3240
tgcaagacag cctgtgtggc tgccaccttc ttcatccact tcttctacct cagcgtcttc 3300
ttctggatgc tgacactggg cctcatgctg ttctatcgcc tggttttcat tctgcatgaa 3360
acaagcaggt ccactcagaa agccattgcc ttctgtcttg gctatggctg cccacttgcc 3420
atctcggtca tcacgctggg agccacccag ccccgggaag tctatacgag gaagaatgtc 3480
tgttggctca actgggagga caccaaggcc ctgctggctt tcgccatccc agcactgatc 3540
attgtggtgg tgaacataac catcactatt gtggtcatca ccaagatcct gaggccttcc 3600
attggagaca agccatgcaa gcaggagaag agcagcctgt ttcagatcag caagagcatt 3660
ggggtcctca caccactctt gggcctcact tggggttttg gtctcaccac tgtgttccca 3720
gggaccaacc ttgtgttcca tatcatattt gccatcctca atgtcttcca gggattattc 3780
attttactct ttggatgcct ctgggatctg aagtcaacat ccctgggttc atccacacct 3840
gtgttttcta tgagttctcc aatatcaagg agatttaaca atttgtttgg taaaacaggt 3900
taa 3903
<210> 6
<211> 2829
<212> DNA
<213> 智人
<400> 6
acaagcaaac aaaataaata tctgtgcaat atatctgctt tatgcactca agcagagaag 60
aaatccacaa agactcacag tctgctggtg ggcagagaag acagaaacga catgagcaca 120
gcaggaaaag aaagttgtct gacagaagtt tgatgagagg aatttgactc agaagactga 180
aatatccttt aaccttacta taaaatatct tacaaaatac tcattgattt cacagcatta 240
gaatcatcaa ggtaatcaaa tgcaaagcag ctgtgctatg ggaggtaaag aaaccctttt 300
ccattgagga tgtggaggtt gcacctccta aggcttatga agttcgcatt aagatggtgg 360
ctgtaggaat ctgtcacaca gatgaccacg tggttagtgg caacctggtg accccccttc 420
ctgtgatttt aggccatgag gcagccggca tcgtggagag tgttggagaa ggggtgacta 480
cagtcaaacc aggtgataaa gtcatcccgc tctttactcc tcagtgtgga aaatgcagag 540
tttgtaaaaa cccggagagc aactactgct tgaaaaatga tctaggcaat cctcggggga 600
ccctgcagga tggcaccagg aggttcacct gcagggggaa gcccattcac cacttccttg 660
gcaccagcac cttctcccag tacacggtgg tggatgagaa tgcagtggcc aaaattgatg 720
cagcctcgcc cctggagaaa gtctgcctca ttggctgtgg attctcgact ggttatgggt 780
ctgcagttaa cgttgccaag gtcaccccag gctctacctg tgctgtgttt ggcctgggag 840
gggtcggcct atctgctgtt atgggctgta aagcagctgg agcagccaga atcattgcgg 900
tggacatcaa caaggacaaa tttgcaaagg ccaaagagtt gggtgccact gaatgcatca 960
accctcaaga ctacaagaaa cccattcagg aagtgctaaa ggaaatgact gatggaggtg 1020
tggatttttc gtttgaagtc atcggtcggc ttgacaccat gatggcttcc ctgttatgtt 1080
gtcatgaggc atgtggcaca agcgtcatcg taggggtacc tcctgcttcc cagaacctct 1140
caataaaccc tatgctgcta ctgactggac gcacctggaa gggggctgtt tatggtggct 1200
ttaagagtaa agaaggtatc ccaaaacttg tggctgattt tatggctaag aagttttcac 1260
tggatgcgtt aataacccat gttttacctt ttgaaaaaat aaatgaagga tttgacctgc 1320
ttcactctgg gaaaagtatc cgtaccgtcc tgacgttttg aggcaataga gatgccttcc 1380
cctgtagcag tcttcagcct cctctaccct acaagatctg gagcaacagc taggaaatat 1440
cattaattca gctcttcaga gatgttatca ataaattaca catgggggct ttccaaagaa 1500
atggaaattg atgggaaatt atttttcagg aaaatttaaa attcaagtga gaagtaaata 1560
aagtgttgaa catcagctgg ggaattgaag ccaacaaacc ttccttctta accattctac 1620
tgtgtcacct ttgccattga ggaaaaatat tcctgtgact tcttgcattt ttggtatctt 1680
cataatcttt agtcatcgaa tcccagtgga ggggaccctt ttacttgccc tgaacataca 1740
catgctgggc cattgtgatt gaagtcttct aactctgtct cagttttcac tgtcgacatt 1800
ttcctttttc taataaaaat gtaccaaatc cctggggtaa aagctagggt aaggtaaagg 1860
atagactcac atttacaagt agtgaaggtc caagagttct aaatacagga aatttcttag 1920
gaactcaaat aaaatgcccc acattttact acagtaaatg gcagtgtttt tatgactttt 1980
atactatttc tttatggtcg atatacaatt gattttttaa aataatagca gatttcttgc 2040
ttcatatgac aaagcctcaa ttactaattg taaaaactga actattccca gaatcatgtt 2100
caaaaaatct gtaatttttg ctgatgaaag tgcttcattg actaaacagt attagtttgt 2160
ggctataaat gattatttag atgatgactg aaaatgtgta taaagtaatt aaaagtaata 2220
tggtggcttt aagtgtagag atgggatggc aaatgctgtg aatgcagaat gtaaaattgg 2280
taactaagaa atggcacaaa caccttaagc aatatatttt cctagtagat atatatatac 2340
acatacatat atacacatat acaaatgtat atttttgcaa aattgttttc aatctagaac 2400
ttttctatta actaccatgt cttaaaatca agtctataat cctagcatta gtttaatatt 2460
ttgaatatgt aaagacctgt gttaatgctt tgttaatgct tttcccactc tcatttgtta 2520
atgctttccc actctcaggg gaaggatttg cattttgagc tttatctcta aatgtgacat 2580
gcaaagatta ttcctggtaa aggaggtagc tgtctccaaa aatgctattg ttgcaatatc 2640
tacattctat ttcatattat gaaagacctt agacataaag taaaatagtt tatcatttac 2700
tgtgtgatct tcagtaagtc tctcaggctc tctgagcttg ttcatccttt gttttgaaaa 2760
aattactcaa ccaatccatt acagcttaac caagattaaa tgggatgatg ttaaaaaaaa 2820
aaaaaaaaa 2829
<210> 7
<211> 4081
<212> DNA
<213> 智人
<400> 7
ccgaggaaaa cgttgcgcag gttcaaaaat ggaacgtcgg cggcgtgagg gagcgcgagg 60
gggtgtgcgc gcgtgcgcgt gcgcgtgcgc gcccggacga gggtgacggg gaccccgcca 120
gccccagcat cgcgcgccgc agccgcggcc ccgcagctcc gcccccggcc cggcccggcc 180
ccgggcccgc tcgcccgccg ccccgcatgg agctgtcagc catcggcgag caggtgttcg 240
ccgtggagag catccggaag aagcgcgtgc ggaagggtaa agtcgagtat ctggtgaagt 300
ggaaaggatg gcccccaaag tacagcacgt gggagccaga agagcacatc ttggaccccc 360
gcctcgtcat ggcctacgag gagaaggagg agagagaccg agcatcgggg tataggaaga 420
gaggtccgaa acccaagcgg cttctgctgc agcggctgta cagcatggac ctgcggagct 480
cccacaaggc caagggcaag gagaagctct gcttctccct gacgtgccca ctcggcagcg 540
ggagccctga gggggtggtc aaggcggggg cacctgagct ggtggacaag ggccccttgg 600
tgcccaccct gcccttcccg ctccgcaagc cccgaaaggc ccacaagtac ctgcggctct 660
cgcgcaagaa gttcccgccc cgcgggccca acctggagag ccacagccat cgacgggagc 720
tcttcctgca ggagccaccg gccccagacg tcctgcaggc ggctggcgag tgggagcctg 780
ctgcgcagcc ccctgaagag gaggcagatg ccgacctggc cgaggggccc cctccctgga 840
cacctgcgct cccctcaagt gaggtgaccg tgaccgacat caccgccaac tccatcaccg 900
tcaccttccg cgaggcccag gcagctgagg gcttcttccg agaccgcagt gggaagttct 960
gaatcaccgt ttttactctt cttaaactgt tttcttttgg gcttggggtg ggacttccag 1020
agatagggat gggttggggg cggggtaatt attttattta aaaaaatacc gagcagcaaa 1080
aggggagaag atcccactac tctcccacca cctgcccttt ctctgaggga cgtttaccac 1140
gaggcctcag gctggggatg gagagagttg ctctgggagt tggggtacca cccccagggc 1200
aggatgggga caggatcacc tgcccgggac accaccatta tcattctcct ctagtgacgc 1260
agcagctggt tctgggagtt aaaggagcat tggaaggccc aaaccctctc ccttgagtgg 1320
ccaccccagc ctggttggct ggttttcccc ttttctcttg tttcaattgg gtctttacct 1380
tgaactctcc tctctggctt tgcggtgggc tgtggaggct ggttttgacc aaaagtgagt 1440
ggggcgggag gaaggggcag gaggaagggt tgaggttact tggggcgagt cccttcccct 1500
tcagagaggc ttctatcctt cccagggagg aggcgccgct gagacccttc tgctgagagc 1560
tctgccctcc cctcatcacc tggcctgtgc agaaacgctc atgcacacct ggctgcacag 1620
gtgtgcacgc attacccttc gcgtgtacgt tcccatgtgc cccgtgaaag catgtgtggc 1680
tgcagacgtg tccacatggg ccttgcgaac ctgggttaga aaccctggcc aggcgaacgt 1740
ggggtgattc acagcacaaa agacctcacc accacacctg cactcacccc accttgcatg 1800
caccttgcta cctgcttgcg gctttcagtg gagggcaggg gtctggcaca ggtgcgatgg 1860
caccccatgc tccaggcata cagatgtggt ttctcggctg caccgggcca ggctgcgggt 1920
gtgcaggcgt ctgctaagtt gtgtgatgta tcagcacagg ctttgagacg tctggaccct 1980
gtccttcctc ccgtgagggg ttcttgttct ttctgactca ggtgactttt cagcccttcc 2040
aattcccctc tttttctgcc ctcccctcca actcagccaa cccaggtgtg ggcagtcagg 2100
gagggaggga gtgtcccacc acgttctcag ggcagccctt gactcctaag ccccttcctc 2160
cttccattct gcatcccctc cccatccaac ctaaatgcca cagctggggc tgagctgtat 2220
tcctgtggag ggacctctgc cgtgcctctc tgaggtcagg ctgtgctgtg tgatgggcag 2280
gctttgcccc agcccacccc tggcaaggtg cacttgtttt ctggtttgta caaggtgtcc 2340
tgggggcccg tggcttccct gccagtgagg agtgacttct ccctctcttc cagtcctgta 2400
ggggagacaa aaccagattg gggggcccaa ggggagcatg gaaaaggccg gctcccctgt 2460
ctttccttgg ctgtcagagt cagggtaaca cacaccaaga gtggagtgcg gccagcaagt 2520
ttgagacctg cccgccctcc tcgcagctct gctctgtgtc ctcaggaagt cacagagtct 2580
actgaggcaa ggagagggtg attctttccc caaatccctt cttccctggt tcccaaacca 2640
aagacagcct gcagcccttt ctgcatgggg tgctctgttg acaggcttcc cagatccctg 2700
agtctctctt tccttcctcc tcgatcttta gttgtccacg gtcaattcag tgcttccatt 2760
gggggacagt cccctccggg atgacctgat tcacctccag cccagggaat ggaatctaga 2820
ggaatacgtg gggtgggtct ggacaaggag cggcaggaat caccacccat ctccagctgt 2880
ggagccctgt ggaggggaag gggaagcttg gggttcagag gggactcttc caggagaggg 2940
gtgcccagcg gaggtaaaga tgatagaggg ttgtgggggg tctctagttg aatgttttgg 3000
cccatgactt tggaacatgg ctggcagctt ccagcagaag tcacgctccc catcccccag 3060
gggacatagg acctttttcc tgcttcctgg tcactttcaa agaactattt gcgcaatctg 3120
tgggtctgtg gattcacggg gctttctgtg tgggtgctgc agttgctttt gtctgcagca 3180
gcaggacaca tctttcctct tactcagccc tttatggccc atggggaact ccgtggctca 3240
gggagagctg aactccaggg gtgtgacctg ggacgggtgg gcctgaggtg cccagctcag 3300
ggcagccagg tggctcatgg gctgtagtga gccagctccc tgggggaaaa ggctgtgggc 3360
cgttaggacc atcctccagg acaggtgacc tctatgaggt cacctacggc tgtggccgtg 3420
caggcctcct tccagcccag agtggcccag tagagcaagg cagacagtga cctccacccc 3480
cgcagccctc ttaaaaggcc agtactcttg ggggtggggg gagggtttag aaagcatttg 3540
cccatctgcc tttctttccc ccagccccca cccgctttga atgtagagac ccgtgggcac 3600
ttttcctttt gtggtggggg gtgcggagga ggtaccccca cccctggcac agccgcctgg 3660
aatgcaggac tgtcactgct gttcgggtga tgacctcgtt gccaagctcc tcctgtcccc 3720
ttgttctggg ggcaggcgct gtgcttctgt gaggtggttt agcttttgct ttcgaagtgg 3780
ccagctgcgg ccaccaggtc tcagcacaag agcgcttcct ttgcacagaa tgagcttcga 3840
gctttgttca gactaaatga atgtatctgg gaggggtcgg gggcacgagt tgattccaag 3900
cacatgcctt tgctgagtgt gtgtgtgctg ggagagtcag agtggatgta gagcgcggtt 3960
ttatttttgt actgacattg gtaagagact gtatagcatc tatttattta gatgatttat 4020
ctggtaaatg aggcaaaaaa attattaaaa atacattaaa gatgatttaa aaaaaagaaa 4080
a 4081
<210> 8
<211> 3865
<212> DNA
<213> 智人
<400> 8
tttttcaatt ttgaacattt tgcaaaacga ggggttcgag gcaggtgaga gcatcctgca 60
cgtcgccggg gagcccgcgg gcacttggcg cgctctcctg ggaccgtctg cactggaaac 120
ccgaaagttt ttttttaata tatattttta tgcagatgta tttataaaga tataagtaat 180
ttttttcttc ccttttctcc accgccttga gagcgagtac ttttggcaaa ggacggagga 240
aaagctcagc aacattttag ggggcggttg tttctttctt tcttatttct tttttaaggg 300
gaaaaaattt gagtgcatcg cgatggagaa aatgtcccga ccgctccccc tgaatcccac 360
ctttatcccg cctccctacg gcgtgctcag gtccctgctg gagaacccgc tgaagctccc 420
ccttcaccac gaagacgcat ttagtaaaga taaagacaaa gaaaagaagc tggatgatga 480
gagtaacagc ccgacggtcc cccagtcggc attcctgggg cctaccttat gggacaaaac 540
ccttccctat gacggagata ctttccagtt ggaatacatg gacctggagg agtttttgtc 600
agaaaatggc attcccccca gcccatctca gcatgaccac agccctcacc ctcctgggct 660
gcagccagct tcctcggctg ccccctcggt catggacctc agcagccggg cctctgcacc 720
ccttcaccct ggcatcccat ctccgaactg tatgcagagc cccatcagac caggtcagct 780
gttgccagca aaccgcaata caccaagtcc cattgatcct gacaccatcc aggtcccagt 840
gggttatgag ccagacccag cagatcttgc cctttccagc atccctggcc aggaaatgtt 900
tgaccctcgc aaacgcaagt tctctgagga agaactgaag ccacagccca tgatcaagaa 960
agctcgcaaa gtcttcatcc ctgatgacct gaaggatgac aagtactggg caaggcgcag 1020
aaagaacaac atggcagcca agcgctcccg cgacgcccgg aggctgaaag agaaccagat 1080
cgccatccgg gcctcgttcc tggagaagga gaactcggcc ctccgccagg aggtggctga 1140
cttgaggaag gagctgggca aatgcaagaa catacttgcc aagtatgagg ccaggcacgg 1200
gcccctgtag gatggcattt ttgcaggctg gctttggaat agatggacag tttgtttcct 1260
gtctgatagc accacacgca aaccaacctt tctgacatca gcactttacc agaggcataa 1320
acacaactga ctcccatttt ggtgtgcatc tgtgtgtgtg tgcgtgtata tgtgcttgtg 1380
ctcatgtgtg tggtcagcgg tatgtgcgtg tgcgtgttcc tttgctcttg ccattttaag 1440
gtagccctct catcgtcttt tagttccaac aaagaaaggt gccatgtctt tactagactg 1500
aggagccctc tcgcgggtct cccatcccct ccctccttca ctcctgcctc ctcagctttg 1560
cttcatgttc gagcttacct actcttccag gactctctgc ttggattcac taaaaagggc 1620
cctggtaaaa tagtggatct cagtttttaa gagtacaagc tcttgtttct gtttagtccg 1680
taagttacca tgctaatgag gtgcacacaa taacttagca ctactccgca gctctagtcc 1740
tttataagtt gctttcctct tactttcagt tttggtgata atcgtcttca aattaaagtg 1800
ctgtttagat ttattagatc ccatatttac ttactgctat ctactaagtt tccttttaat 1860
tctaccaacc ccagataagt aagagtacta ttaatagaac acagagtgtg tttttgcact 1920
gtctgtacct aaagcaataa tcctattgta cgctagagca tgctgcctga gtattactag 1980
tggacgtagg atattttccc tacctaagaa tttcactgtc ttttaaaaaa caaaaagtaa 2040
agtaatgcat ttgagcatgg ccagactatt ccctaggaca aggaagcaga gggaaatggg 2100
aggtctaagg atgaggggtt aatttatcag tacatgagcc aaaaactgcg tcttggatta 2160
gcctttgaca ttgatgtgtt cggttttgtt gttccccttc cctcacaccc tgcctcgccc 2220
ccacttttct agttaacttt ttccatatcc ctcttgacat tcaaaacagt tacttaagat 2280
tcagttttcc cactttttgg taatatatat atttttgtga attatacttt gttgttttta 2340
aaaagaaaat cagttgatta agttaataag ttgatgtttt ctaaggccct ttttcctagt 2400
ggtgtcattt ttgaatgcct cataaattaa tgattctgaa gcttatgttt cttattctct 2460
gtttgctttt gaacgtatgt gctcttataa agtggacttc tgaaaaatga atgtaaaaga 2520
cactggtgta tctcagaagg ggatggtgtt gtcacaaact gtggttaatc caatcaattt 2580
aaatgtttac tatagaccaa aaggagagat tattaaatcg tttaatgttt atacagagta 2640
attataggaa gttctttttt gtacagtatt tttcagatat aaatactgac aatgtatttt 2700
ggaagacata tattatatat agaaaagagg agaggaaaac tattccatgt tttaaaatta 2760
tatagcaaag atatatattc accaatgttg tacagagaag aagtgcttgg gggtttttga 2820
agtctttaat attttaagcc ctatcactga cacatcagca tgttttctgc tttaaattaa 2880
aattttatga cagtatcgag gcttgtgatg acgaatcctg ctctaaaata cacaaggagc 2940
tttcttgttt cttattaggc ctcagaaaga agtcagttaa cgtcacccaa aagcacaaaa 3000
tggattttag tcaaatattt attggatgat acagtgtttt ttaggaaaag catctgccac 3060
aaaaatgttc acttcgaaat tctgagttcc tggaatggca cgttgctgcc agtgccccag 3120
acagttcttt tctaccctgc gggcccgcac gttttatgag gttgatatcg gtgctatgtg 3180
tttggtttat aatttgatag atgtttgact ttaaagatga ttgttctttt gtttcattaa 3240
gttgtaaaat gtcaagaaat tctgctgtta cgacaaagaa acattttacg ctagattaaa 3300
atatcctttc atcaatggga ttttctagtt tcctgccttc agagtatcta atcctttaat 3360
gatctggtgg tctcctcgtc aatccatcag caatgcttct ctcatagtgt catagacttg 3420
ggaaacccaa ccagtaggat atttctacaa ggtgttcatt ttgtcacaag ctgtagataa 3480
cagcaagaga tgggggtgta ttggaattgc aatacattgt tcaggtgaat aataaaatca 3540
aaaacttttg caatcttaag cagagataaa taaaagatag caatatgaga cacaggtgga 3600
cgtagagttg gcctttttac aggcaaagag gcgaattgta gaattgttag atggcaatag 3660
tcattaaaaa catagaaaaa tgatgtcttt aagtggagaa ttgtggaagg attgtaacat 3720
ggaccatcca aatttatggc cgtatcaaat ggtagctgaa aaaactatat ttgagcactg 3780
gtctctcttg gaattagatg tttatatcaa atgagcatct caaatgtttt ctgcagaaaa 3840
aaataaaaag attctaataa aaaaa 3865
<210> 9
<211> 2656
<212> DNA
<213> 智人
<400> 9
cacacctgat ggtgtgactc ggccgacgcg agcgccgcgc ttcgcttcag ctgctagctg 60
gcccaaggga ggcgaccgcg gagggtggcg aggggcggcc aggacccgca gccccggggc 120
cgggccggtc cggaccgcca gggagggcag gtcagtgggc agatcgcgtc cgcgggattc 180
aatctctgcc cgctctgata acagtccttt tccctggcgc tcacttcgtg cctggcaccc 240
ggctgggcgc ctcaagaccg ttgtctcttc gatcgcttct ttggacttgg cgaccatttc 300
agagatgtct tccagaagta ccaaagattt aattaaaagt aagtggggat cgaagcctag 360
taactccaaa tccgaaacta cattagaaaa attaaaggga gaaattgcac acttaaagac 420
atcagtggat gaaatcacaa gtgggaaagg aaagctgact gataaagaga gacacagact 480
tttggagaaa attcgagtcc ttgaggctga gaaggagaag aatgcttatc aactcacaga 540
gaaggacaaa gaaatacagc gactgagaga ccaactgaag gccagatata gtactaccgc 600
attgcttgaa cagctggaag agacaacgag agaaggagaa aggagggagc aggtgttgaa 660
agccttatct gaagagaaag acgtattgaa acaacagttg tctgctgcaa cctcacgaat 720
tgctgaactt gaaagcaaaa ccaatacact ccgtttatca cagactgtgg ctccaaactg 780
cttcaactca tcaataaata atattcatga aatggaaata cagctgaaag atgctctgga 840
gaaaaatcag cagtggctcg tgtatgatca gcagcgggaa gtctatgtaa aaggactttt 900
agcaaagatc tttgagttgg aaaagaaaac ggaaacagct gctcattcac tcccacagca 960
gacaaaaaag cctgaatcag aaggttatct tcaagaagag aagcagaaat gttacaacga 1020
tctcttggca agtgcaaaaa aagatcttga ggttgaacga caaaccataa ctcagctgag 1080
ttttgaactg agtgaatttc gaagaaaata tgaagaaacc caaaaagaag ttcacaattt 1140
aaatcagctg ttgtattcac aaagaagggc agatgtgcaa catctggaag atgataggca 1200
taaaacagag aagatacaaa aactcaggga agagaatgat attgctaggg gaaaacttga 1260
agaagagaag aagagatccg aagagctctt atctcaggtc cagtttcttt acacatctct 1320
gctaaagcag caagaagaac aaacaagggt agctctgttg gaacaacaga tgcaggcatg 1380
tactttagac tttgaaaatg aaaaactcga ccgtcaacat gtgcagcatc aattgcatgt 1440
aattcttaag gagctccgaa aagcaagaaa tcaaataaca cagttggaat ccttgaaaca 1500
gcttcatgag tttgccatca cagagccatt agtcactttc caaggagaga ctgaaaacag 1560
agaaaaagtt gccgcctcac caaaaagtcc cactgctgca ctcaatgaaa gcctggtgga 1620
atgtcccaag tgcaatatac agtatccagc cactgagcat cgcgatctgc ttgtccatgt 1680
ggaatactgt tcaaagtagc aaaataagta tttgttttga tattaaaaga ttcaatactg 1740
tattttctgt tagcttgtgg gcattttgaa ttatatattt cacattttgc ataaaactgc 1800
ctatctacct ttgacactcc agcatgctag tgaatcatgt atcttttagg ctgctgtgca 1860
tttctcttgg cagtgatacc tccctgacat ggttcatcat caggctgcaa tgacagaatg 1920
tggtgagcag cgtctactga gactactaac attttgcact gtcaaaatac ttggtgagga 1980
aaagatagct caggttattg ctaatgggtt aatgcaccag caagcaaaat attttatgtt 2040
ttgggggttt tgaaaaatca aagataatta accaaggatc ttaactgtgt tcgcattttt 2100
tatccaagca cttagaaaac ctacaatcct aattttgatg tccattgtta agaggtggtg 2160
atagatacta tttttttttt catattgtat agcggttatt agaaaagttg gggattttct 2220
tgatctttat tgctgcttac cattgaaact taacccagct gtgttcccca actctgttct 2280
gcgcacgaaa cagtatctgt ttgaggcata atcttaagtg gccacacaca atgttttctc 2340
ttatgttatc tggcagtaac tgtaacttga attacattag cacattctgc ttagctaaaa 2400
ttgttaaaat aaactttaat aaacccatgt agccctctca tttgattgac agtattttag 2460
ttatttttgg cattcttaaa gctgggcaat gtaatgatca gatctttgtt tgtctgaaca 2520
ggtattttta tacatgcttt ttgtaaacca aaaactttta aatttcttca ggttttctaa 2580
catgcttacc actgggctac tgtaaatgag aaaagaataa aattatttaa tgttttaaaa 2640
aaaaaaaaaa aaaaaa 2656
<210> 10
<211> 3685
<212> DNA
<213> 智人
<400> 10
agtggactca cgcaggcgca ggagactaca cttcccagga actccgggcc gcgttgttcg 60
ctggtacctc cttctgactt ccggtattgc tgcggtctgt agggccaatc gggagcctgg 120
aattgctttc ccggcgctct gattggtgca ttcgactagg ctgcctgggt tcaaaatttc 180
aacgatactg aatgagtccc gcggcgggtt ggctcgcgct tcgttgtcag atctgaggcg 240
aggctaggtg agccgtggga agaaaagagg gagcagctag ggcgcgggtc tccctcctcc 300
cggagtttgg aacggctgaa gttcaccttc cagcccctag cgccgttcgc gccgctaggc 360
ctggcttctg aggcggttgc ggtgctcggt cgccgcctag gcggggcagg gtgcgagcag 420
gggcttcggg ccacgcttct cttggcgaca ggattttgct gtgaagtccg tccgggaaac 480
ggaggaaaaa aagagttgcg ggaggctgtc ggctaataac ggttcttgat acatatttgc 540
cagacttcaa gatttcagaa aaggggtgaa agagaagatt gcaactttga gtcagacctg 600
taggcctgat agactgatta aaccacagaa ggtgacctgc tgagaaaagt ggtacaaata 660
ctgggaaaaa cctgctcttc tgcgttaagt gggagacaat gtcacaagtt aaaagctctt 720
attcctatga tgccccctcg gatttcatca atttttcatc cttggatgat gaaggagata 780
ctcaaaacat agattcatgg tttgaggaga aggccaattt ggagaataag ttactgggga 840
agaatggaac tggagggctt tttcagggca aaactccttt gagaaaggct aatcttcagc 900
aagctattgt cacacctttg aaaccagttg acaacactta ctacaaagag gcagaaaaag 960
aaaatcttgt ggaacaatcc attccgtcaa atgcttgttc ttccctggaa gttgaggcag 1020
ccatatcaag aaaaactcca gcccagcctc agagaagatc tcttaggctt tctgctcaga 1080
aggatttgga acagaaagaa aagcatcatg taaaaatgaa agccaagaga tgtgccactc 1140
ctgtaatcat cgatgaaatt ctaccctcta agaaaatgaa agtttctaac aacaaaaaga 1200
agccagagga agaaggcagt gctcatcaag atactgctga aaagaatgca tcttccccag 1260
agaaagccaa gggtagacat actgtgcctt gtatgccacc tgcaaagcag aagtttctaa 1320
aaagtactga ggagcaagag ctggagaaga gtatgaaaat gcagcaagag gtggtggaga 1380
tgcggaaaaa gaatgaagaa ttcaagaaac ttgctctggc tggaataggg caacctgtga 1440
agaaatcagt gagccaggtc accaaatcag ttgacttcca cttccgcaca gatgagcgaa 1500
tcaaacaaca tcctaagaac caggaggaat ataaggaagt gaactttaca tctgaactac 1560
gaaagcatcc ttcatctcct gcccgagtga ctaagggatg taccattgtt aagcctttca 1620
acctgtccca aggaaagaaa agaacatttg atgaaacagt ttctacatat gtgccccttg 1680
cacagcaagt tgaagacttc cataaacgaa cccctaacag atatcatttg aggagcaaga 1740
aggatgatat taacctgtta ccctccaaat cttctgtgac caagatttgc agagacccac 1800
agactcctgt actgcaaacc aaacaccgtg cacgggctgt gacctgcaaa agtacagcag 1860
agctggaggc tgaggagctc gagaaattgc aacaatacaa attcaaagca cgtgaacttg 1920
atcccagaat acttgaaggt gggcccatct tgcccaagaa accacctgtg aaaccaccca 1980
ccgagcctat tggctttgat ttggaaattg agaaaagaat ccaggagcga gaatcaaaga 2040
agaaaacaga ggatgaacac tttgaatttc attccagacc ttgccctact aagattttgg 2100
aagatgttgt gggtgttcct gaaaagaagg tacttccaat caccgtcccc aagtcaccag 2160
cctttgcatt gaagaacaga attcgaatgc ccaccaaaga agatgaggaa gaggacgaac 2220
cggtagtgat aaaagctcaa cctgtgccac attatggggt gccttttaag ccccaaatcc 2280
cagaggcaag aactgtggaa atatgccctt tctcgtttga ttctcgagac aaagaacgtc 2340
agttacagaa ggagaagaaa ataaaagaac tgcagaaagg ggaggtgccc aagttcaagg 2400
cacttccctt gcctcatttt gacaccatta acctgccaga gaagaaggta aagaatgtga 2460
cccagattga acctttctgc ttggagactg acagaagagg tgctctgaag gcacagactt 2520
ggaagcacca gctggaagaa gaactgagac agcagaaaga agcagcttgt ttcaaggctc 2580
gtccaaacac cgtcatctct caggagccct ttgttcccaa gaaagagaag aaatcagttg 2640
ctgagggcct ttctggttct ctagttcagg aaccttttca gctggctact gagaagagag 2700
ccaaagagcg gcaggagctg gagaagagaa tggctgaggt agaagcccag aaagcccagc 2760
agttggagga ggccagacta caggaggaag agcagaaaaa agaggagctg gccaggctac 2820
ggagagaact ggtgcataag gcaaatccaa tacgcaagta ccagggtctg gagataaagt 2880
caagtgacca gcctctgact gtgcctgtat ctcccaaatt ctccactcga ttccactgct 2940
aaactcagct gtgagctgcg gataccgccc ggcaatggga cctgctctta acctcaaacc 3000
taggaccgtc ttgctttgtc attgggcatg gagagaaccc atttctccag acttttacct 3060
acccgtgcct gagaaagcat acttgacaac tgtggactcc agttttgttg agaattgttt 3120
tcttacatta ctaaggctaa taatgagatg taactcatga atgtctcgat tagactccat 3180
gtagttactt cctttaaacc atcagccggc cttttatatg ggtcttcact ctgactagaa 3240
tttagtctct gtgtcagcac agtgtaatct ctattgctat tgccccttac gactctcacc 3300
ctctccccac tttttttaaa aattttaacc agaaaataaa gatagttaaa tcctaagata 3360
gagattaagt catggtttaa atgaggaaca atcagtaaat cagattctgt cctcttctct 3420
gcataccgtg aatttatagt taaggatccc tttgctgtga gggtagaaaa cctcaccaac 3480
tgcaccagtg aggaagaaga ctgcgtggat tcatggggag cctcacagca gccacgcagc 3540
aggctctggg tggggctgcc gttaaggcac gttctttcct tactggtgct gataacaaca 3600
gggaaccgtg cagtgtgcat tttaagacct ggcctggaat aaatacgttt tgtctttccc 3660
tcaaaaaaaa aaaaaaaaaa aaaaa 3685
<210> 11
<211> 3670
<212> DNA
<213> 智人
<400> 11
ccggtttgtt agggagtcgt gtacgtgcct tggtcgcttc tgtagctccg agggcaggtt 60
gcggaagaaa gcccaggcgg tctgtggccc agaggaaagg cctgcagcag gacgaggacc 120
tgagccagga atgcaggatg gcggcggtga agaaggaagg gggtgctctg agtgaagcca 180
tgtccctgga gggagatgaa tgggaactga gtaaagaaaa tgtacaacct ttaaggcaag 240
ggcggatcat gtccacgctt cagggagcac tggcacaaga atctgcctgt aacaatactc 300
ttcagcagca gaaacgggca tttgaatatg aaattcgatt ttacactgga aatgaccctc 360
tggatgtttg ggataggtat atcagctgga cagagcagaa ctatcctcaa ggtgggaagg 420
agagtaatat gtcaacgtta ttagaaagag ctgtagaagc actacaagga gaaaaacgat 480
attatagtga tcctcgattt ctcaatctct ggcttaaatt agggcgttta tgcaatgagc 540
ctttggatat gtacagttac ttgcacaacc aagggattgg tgtttcactt gctcagttct 600
atatctcatg ggcagaagaa tatgaagcta gagaaaactt taggaaagca gatgcgatat 660
ttcaggaagg gattcaacag aaggctgaac cactagaaag actacagtcc cagcaccgac 720
aattccaagc tcgagtgtct cggcaaactc tgttggcact tgagaaagaa gaagaggagg 780
aagtttttga gtcttctgta ccacaacgaa gcacactagc tgaactaaag agcaaaggga 840
aaaagacagc aagagctcca atcatccgtg taggaggtgc tctcaaggct ccaagccaga 900
acagaggact ccaaaatcca tttcctcaac agatgcaaaa taatagtaga attactgttt 960
ttgatgaaaa tgctgatgag gcttctacag cagagttgtc taagcctaca gtccagccat 1020
ggatagcacc ccccatgccc agggccaaag agaatgagct gcaagcaggc ccttggaaca 1080
caggcaggtc cttggaacac aggcctcgtg gcaatacagc ttcactgata gctgtacccg 1140
ctgtgcttcc cagtttcact ccatatgtgg aagagactgc acgacagcca gttatgacac 1200
catgtaaaat tgaacctagt ataaaccaca tcctaagcac cagaaagcct ggaaaggaag 1260
aaggagatcc tctacaaagg gttcagagcc atcagcaagc gtctgaggag aagaaagaga 1320
agatgatgta ttgtaaggag aagatttatg caggagtagg ggaattctcc tttgaagaaa 1380
ttcgggctga agttttccgg aagaaattaa aagagcaaag ggaagccgag ctattgacca 1440
gtgcagagaa gagagcagaa atgcagaaac agattgaaga gatggagaag aagctaaaag 1500
aaatccaaac tactcagcaa gaaagaacag gtgatcagca agaagagacg atgcctacaa 1560
aggagacaac taaactgcaa attgcttccg agtctcagaa aataccagga atgactctat 1620
ccagttctgt ttgtcaagta aactgttgtg ccagagaaac ttcacttgcg gagaacattt 1680
ggcaggaaca acctcattct aaaggtccca gtgtaccttt ctccattttt gatgagtttc 1740
ttctttcaga aaagaagaat aaaagtcctc ctgcagatcc cccacgagtt ttagctcaac 1800
gaagacccct tgcagttctc aaaacctcag aaagcatcac ctcaaatgaa gatgtgtctc 1860
cagatgtttg tgatgaattt acaggaattg aacccttgag cgaggatgcc attatcacag 1920
gcttcagaaa tgtaacaatt tgtcctaacc cagaagacac ttgtgacttt gccagagcag 1980
ctcgttttgt atccactcct tttcatgaga taatgtcctt gaaggatctc ccttctgatc 2040
ctgagagact gttaccggaa gaagatctag atgtaaagac ctctgaggac cagcagacag 2100
cttgtggcac tatctacagt cagactctca gcatcaagaa gctgagccca attattgaag 2160
acagtcgtga agccacacac tcctctggct tctctggttc ttctgcctcg gttgcaagca 2220
cctcctccat caaatgtctt caaattcctg agaaactaga acttactaat gagacttcag 2280
aaaaccctac tcagtcacca tggtgttcac agtatcgcag acagctactg aagtccctac 2340
cagagttaag tgcctctgca gagttgtgta tagaagacag accaatgcct aagttggaaa 2400
ttgagaagga aattgaatta ggtaatgagg attactgcat taaacgagaa tacctaatat 2460
gtgaagatta caagttattc tgggtggcgc caagaaactc tgcagaatta acagtaataa 2520
aggtatcttc tcaacctgtc ccatgggact tttatatcaa cctcaagtta aaggaacgtt 2580
taaatgaaga ttttgatcat ttttgcagct gttatcaata tcaagatggc tgtattgttt 2640
ggcaccaata tataaactgc ttcacccttc aggatcttct ccaacacagt gaatatatta 2700
cccatgaaat aacagtgttg attatttata accttttgac aatagtggag atgctacaca 2760
aagcagaaat agtccatggt gacttgagtc caaggtgtct gattctcaga aacagaatcc 2820
acgatcccta tgattgtaac aagaacaatc aagctttgaa gatagtggac ttttcctaca 2880
gtgttgacct tagggtgcag ctggatgttt ttaccctcag cggctttcgg actgtacaga 2940
tcctggaagg acaaaagatc ctggctaact gttcttctcc ctaccaggta gacctgtttg 3000
gtatagcaga tttagcacat ttactattgt tcaaggaaca cctacaggtc ttctgggatg 3060
ggtccttctg gaaacttagc caaaatattt ctgagctaaa agatggtgaa ttgtggaata 3120
aattctttgt gcggattctg aatgccaatg atgaggccac agtgtctgtt cttggggagc 3180
ttgcagcaga aatgaatggg gtttttgaca ctacattcca aagtcacctg aacaaagcct 3240
tatggaaggt agggaagtta actagtcctg gggctttgct ctttcagtga gctaggcaat 3300
caagtctcac agattgctgc ctcagagcaa tggttgtatt gtggaacact gaaactgtat 3360
gtgctgtaat ttaatttagg acacatttag atgcactacc attgctgttc tactttttgg 3420
tacaggtata ttttgacgtc actgatattt tttatacagt gatatactta ctcatggcct 3480
tgtctaactt ttgtgaagaa ctattttatt ctaaacagac tcattacaaa tggttacctt 3540
gttatttaac ccatttgtct ctacttttcc ctgtactttt cccatttgta atttgtaaaa 3600
tgttctctta tgatcaccat gtattttgta aataataaaa tagtatctgt taaaaaaaaa 3660
aaaaaaaaaa 3670
<210> 12
<211> 4504
<212> DNA
<213> 智人
<400> 12
gggcagtccg cactgcaatt ggttggcgtc tccgggacgg atttgaaact tggcggttaa 60
agctccggct gggacagggc ggcgggaggc ccagggagaa cggggaaggg acatttagtt 120
tgagacggtg ctgagatagg atcatgaagg aagaggtgaa gggaattcct gtaagagtgg 180
cgctgcgttg tcgccctctg gtccccaaag agattagcga gggctgccag atgtgccttt 240
ccttcgtgcc cggagagcct caggtggtgg ttggtacaga taaatccttc acctacgatt 300
ttgtatttga tccctctact gaacaggaag aagtcttcaa tacagcagta gcgccactca 360
taaaaggtgt atttaaagga tataatgcaa cggtcctggc ctatgggcag actggctctg 420
gaaaaaccta ttcaatggga ggtgcatata ctgcagagca agagaatgaa ccaacagttg 480
gggttattcc tagggtaata caactgctct tcaaagaaat tgataaaaag agtgactttg 540
aatttactct gaaagtgtct tacttagaga tttacaatga agaaattttg gatcttctat 600
gcccatctcg tgagaaagct caaataaata tacgagagga tcctaaggaa ggcataaaga 660
ttgtgggact cactgagaag actgttttgg ttgccttgga tactgtttcc tgtttggaac 720
agggcaacaa ctctaggact gtggcctcca cggctatgaa ctcccagtcg tcccgatctc 780
atgccatctt tacaatctcc ttagagcaaa gaaagaaaag tgacaagaat agcagctttc 840
gctccaagct gcatcttgta gacctcgctg gatcagaaag acagaagaaa accaaggctg 900
aaggggatcg tctaaaagag ggtattaata ttaaccgagg cctcctatgc ttgggaaatg 960
taatcagtgc tcttggagat gacaaaaagg gtggctttgt gccctacaga gattccaagt 1020
tgactcgact gcttcaagat tctctaggag gtaatagcca tactcttatg atagcctgtg 1080
tgagtcctgc tgactccaat ctagaggaaa cattaaatac ccttcgctat gctgacagag 1140
caagaaaaat caagaacaaa cctattgtta atattgatcc ccagacagct gaacttaatc 1200
atctaaagca acaggtacaa cagctacaag tcttgttgct acaggcccat ggaggtaccc 1260
tgcctggatc tataactgtg gaaccatcag agaatctaca atccctgatg gagaagaatc 1320
agtccctggt agaggagaat gaaaaattaa gtcgtggtct gagcgaggca gctggtcaga 1380
cagcccagat gttggagagg atcattttga cagagcaagc gaatgaaaaa atgaacgcca 1440
agctagaaga gctcaggcag catgcggcct gcaaactgga tcttcaaaag ctagtggaga 1500
ctttggaaga ccaggaattg aaagaaaatg tagagataat ttgtaacctg cagcaattga 1560
ttacccagtt atcggatgaa actgttgctt gcatggctgc agccattgat actgcggtgg 1620
agcaagaagc ccaagtagaa accagtccag agacgagcag gtcttctgac gcttttacca 1680
ctcagcatgc tctccgtcaa gcgcagatgt ctaaggagct ggttgagttg aataaagcgc 1740
ttgcactgaa agaggccctg gctaggaaga tgactcagaa tgacagccaa ctgcagccca 1800
ttcagtacca ataccaggat aacataaaag agctagaatt agaagtcatc aatctgcaaa 1860
aggaaaagga agaattggtt cttgaacttc agacagcaaa gaaggatgcc aaccaagcca 1920
agttgagtga gcgccgccgc aaacgtctcc aggagctgga gggtcaaatt gctgatctga 1980
agaagaaact gaatgagcag tccaaacttc tgaaactaaa ggaatccaca gagcgtactg 2040
tctccaaact gaaccaggag atacggatga tgaaaaacca gcgggtacag ttaatgcgtc 2100
aaatgaaaga agatgctgag aagtttagac agtggaagca gaaaaaagac aaagaagtaa 2160
tacagttaaa agaacgagac cgtaagaggc aatatgagct gctgaaactt gaaagaaact 2220
tccagaaaca atccaatgtg ctcagacgta aaacggagga ggcagcagct gccaacaagc 2280
gtctcaagga tgctctccag aaacaacggg aggttgcaga taagcggaaa gagactcaga 2340
gccgtggaat ggaaggcact gcagctcgag tgaagaattg gcttggaaac gaaattgagg 2400
ttatggtcag tactgaggaa gccaaacgcc atctgaatga cctccttgaa gatagaaaga 2460
tcctggctca agatgtggct caactcaaag aaaaaaagga atctggggag aatccacctc 2520
ctaaactccg gaggcgtaca ttctccctta ctgaagtgcg tggtcaagtt tcggagtcag 2580
aagattctat tacaaagcag attgaaagcc tagagactga aatggaattc aggagtgctc 2640
agattgctga cctacagcag aagctgctgg atgcagaaag tgaagacaga ccaaaacaac 2700
gctgggagaa tattgccacc attctggaag ccaagtgtgc cctgaaatat ttgattggag 2760
agctggtctc ctccaaaata caggtcagca aacttgaaag cagcctgaaa cagagcaaga 2820
ccagctgtgc tgacatgcag aagatgctgt ttgaggaacg aaatcatttt gccgagatag 2880
agacagagtt acaagctgag ctggtcagaa tggagcaaca gcaccaagag aaggtgctgt 2940
accttctcag ccagctgcag caaagccaaa tggcagagaa gcagttagag gaatcagtca 3000
gtgaaaagga acagcagctg ctgagcacac tgaagtgtca ggatgaagaa cttgagaaaa 3060
tgcgagaagt gtgtgagcaa aatcagcagc ttctccgaga gaatgaaatc atcaagcaga 3120
aactgaccct cctccaggta gccagcagac agaaacatct tcctaaggat acccttctat 3180
ctccagactc ttcttttgaa tatgtcccac ctaagccaaa accttctcgt gttaaagaaa 3240
agttcctgga gcaaagcatg gacatcgagg atctaaaata ttgttcagag cattctgtga 3300
atgagcatga ggatggtgat ggtgatgatg atgaggggga tgacgaggaa tggaagccaa 3360
caaaattagt taaggtgtcc aggaagaaca tccaagggtg ttcctgcaag ggctggtgtg 3420
gaaacaagca gtgtgggtgc aggaagcaaa agtcagactg tggtgtggac tgttgctgtg 3480
accccacaaa gtgtcggaac cgccagcaag gcaaggatag cttgggcact gttgaacgga 3540
cccaggattc cgaaggctcc ttcaaactgg aggatcctac cgaggtgacc ccaggattga 3600
gcttctttaa tcccgtctgt gccaccccca atagcaagat cctgaaagag atgtgcgatg 3660
tggagcaggt gctgtcaaag aagactcccc cagctccctc cccttttgac ctcccagagt 3720
tgaaacatgt agcaacagaa taccaagaaa acaaggctcc agggaagaaa aagaaacggg 3780
ctctggccag caacaccagc ttcttctctg gctgctcccc tatcgaagaa gaggcccact 3840
gaagttggag tcatcatctc tacccccagt ctggcttggg agatgctttc aggttgcagc 3900
cagaaggggt tttttaaatg acttctctgg atttcaggtt tcttgctgtt gaaaaaagga 3960
acaaagcgtt actgaaaaga aggtaacctt tgttggatgt gggccttagc ctccaggtcc 4020
agactactac tctatgttct ccagaagggt gctaagtcac ctactgaaga gagaaccaac 4080
tgactttcct attgactcat caggaaccag tcctcagtct ggtcaagttg tttcttattt 4140
gtgagcagtt caggctatct cctgatgggg atgaggccaa ggctttctta tcttttggtt 4200
gtctctgctt aatggaggag cctggcctag gatggaggcc tggcttagat ctttcattcc 4260
acctcaggaa tgaggttgtg atctttcctg tcctgaccct ctctgaatta tgtttcaata 4320
gtactcttga ttgtctgcca tgttgttgaa gcaaatgaat tatttttaaa tgttaagtaa 4380
gtaaataaac cttagcccgt ctactgtttg ggaagatcct tctgtgctag agggagaaat 4440
aaaatttcaa cctgtgttcc tcagcccctg aggaagctat taaggggatt cattacaagt 4500
aaaa 4504
<210> 13
<211> 1566
<212> DNA
<213> 智人
<400> 13
gggccgccca atggggcgca agcgacgcgg tatttgaatc ctggaacaag gctacagcgt 60
cgaagatccc cagcgctgcg ggctcggaga gcagtcctaa cggcgcctcg tacgctagtg 120
tcctcccttt tcagtccgcg tccctccctg ggccgggctg gcactcttgc cttccccgtc 180
cctcatggcg ctgctccgac gcccgacggt gtccagtgat ttggagaata ttgacacagg 240
agttaattct aaagttaaga gtcatgtgac tattaggcga actgttttag aagaaattgg 300
aaatagagtt acaaccagag cagcacaagt agctaagaaa gctcagaaca ccaaagttcc 360
agttcaaccc accaaaacaa caaatgtcaa caaacaactg aaacctactg cttctgtcaa 420
accagtacag atggaaaagt tggctccaaa gggtccttct cccacacctg aggatgtctc 480
catgaaggaa gagaatctct gccaagcttt ttctgatgcc ttgctctgca aaatcgagga 540
cattgataac gaagattggg agaaccctca gctctgcagt gactacgtta aggatatcta 600
tcagtatctc aggcagctgg aggttttgca gtccataaac ccacatttct tagatggaag 660
agatataaat ggacgcatgc gtgccatcct agtggattgg ctggtacaag tccactccaa 720
gtttaggctt ctgcaggaga ctctgtacat gtgcgttggc attatggatc gatttttaca 780
ggttcagcca gtttcccgga agaagcttca attagttggg attactgctc tgctcttggc 840
ttccaagtat gaggagatgt tttctccaaa tattgaagac tttgtttaca tcacagacaa 900
tgcttatacc agttcccaaa tccgagaaat ggaaactcta attttgaaag aattgaaatt 960
tgagttgggt cgacccttgc cactacactt cttaaggcga gcatcaaaag ccggggaggt 1020
tgatgttgaa cagcacactt tagccaagta tttgatggag ctgactctca tcgactatga 1080
tatggtgcat tatcatcctt ctaaggtagc agcagctgct tcctgcttgt ctcagaaggt 1140
tctaggacaa ggaaaatgga acttaaagca gcagtattac acaggataca cagagaatga 1200
agtattggaa gtcatgcagc acatggccaa gaatgtggtg aaagtaaatg aaaacttaac 1260
taaattcatc gccatcaaga ataagtatgc aagcagcaaa ctcctgaaga tcagcatgat 1320
ccctcagctg aactcaaaag ccgtcaaaga ccttgcctcc ccactgatag gaaggtccta 1380
ggctgccgtg gcccctgggg atgtgtgctt cattgtgccc tttttcttat tggtttagaa 1440
ctcttgattt tgtacatagt cctctggtct atctcatgaa acctcttctc agaccagttt 1500
tctaaacata tattgaggaa aaataaagcg attggttttt cttaaggtaa aaaaaaaaaa 1560
aaaaaa 1566
<210> 14
<211> 7293
<212> DNA
<213> 智人
<400> 14
ctggggagcc ggcgctggag gtggtgagtg gcgtggggac tgtgtcgagg gggtccccaa 60
ggtgccggac cctgcggagg ggcgaagttt cggcactggg gagggcgtgc ggacgctttc 120
cctacaggcg accactgctc tgcgggcggg tggtcttagc tccagtcccc cattcagttc 180
ctcagcattc caggtcggcg gcgaaggggt ccccgaacga agggcgcaag gcagcgtctc 240
tgctgggacc gggaagccgg acttcagggc ctctcggccc gtgggcttct ccccgagtct 300
ccccgagtcg gttggcatta agagtttagc agatactttc agaaatggat acataagaaa 360
tggctggaaa tcaaatgaat gtccaaagaa gagcttaggg tcttagtaac attctttttt 420
aaaataactg tctgccaaaa tgtcattaca cagtactcat aatagaaata acagcggtga 480
tattcttgat attccttctt cccaaaatag ttcatcactg aatgccctca cccacagtag 540
ccgacttaag ctgcatttga agtcggatat gtcagaatgt gaaaatgatg atccattatt 600
gagatctgca ggtaaagtca gagacataaa tagaacttat gttatttctg ccagtagaaa 660
aacagcagac atgcccctta cccctaatcc tgtaggtaga ttggcacttc agaggagaac 720
tacaaggaac aaagaatcat ctttgcttgt tagtgagttg gaagacacaa ctgaaaaaac 780
agcagaaaca cgtcttacat tacaacgtcg tgctaaaaca gattctgcag aaaagtggaa 840
aacagctgaa atagattctg tcaaaatgac actgaatgtg ggaggtgaaa cagaaaataa 900
tggtgtttct aaggaaagta gaacaaatgt aaggattgta aataatgcta aaaactcttt 960
tgttgcctct tctgtacctt tagatgaaga tccacaggtc attgaaatga tggctgataa 1020
gaaatacaaa gaaacatttt ctgcccccag tagagcaaat gaaaatgttg cacttaagta 1080
ctcaagtaat agaccaccca ttgcttccct gagtcagact gaagttgtta gatcaggaca 1140
cttgacaacg aaacctactc agagcaagtt ggatatcaaa gtgttgggaa caggaaactt 1200
gtatcataga agtattggga aggaaattgc aaaaacttca aataaatttg ggagcttaga 1260
aaaaagaaca cctacaaaat gtacaacaga acacaaactg acaacaaagt gcagcctgcc 1320
tcagcttaag agcccagctc catcaatact gaagaataga atgtctaacc ttcaagttaa 1380
acaaagacca aaaagttcct ttcttgcaaa taaacaggaa agatccgcag aaaatacaat 1440
tcttcccgaa gaagaaactg tagttcagaa cacctctgca ggaaaagacc ccttaaaagt 1500
agagaatagt caagtgacag tggcagtacg cgtaagacct ttcaccaaga gagagaagat 1560
tgaaaaagca tcccaggtag tcttcatgag tgggaaagaa ataactgtgg aacaccctga 1620
cacgaaacaa gtttataatt ttatttatga tgtttcattc tggtcttttg atgaatgtca 1680
tcctcactac gctagccaga caactgtcta tgagaagcta gcagcaccac tcctagaaag 1740
agccttcgaa ggcttcaata cctgtctttt tgcttatggt cagactggct ctggaaaatc 1800
atatacgatg atgggattta gtgaagaacc aggaataatt ccaagatttt gtgaagatct 1860
tttttctcaa gtagccagaa aacaaaccca agaggtcagc tatcacattg aaatgagctt 1920
ctttgaagta tataatgaaa aaattcacga ccttctggtt tgtaaagatg aaaatgggca 1980
gagaaagcaa ccactgagag tgagggaaca tcctgtttat ggaccatatg ttgaagcact 2040
gtcaatgaac attgtcagtt cttacgctga tatccagagt tggctagaat tgggaaataa 2100
acaaagagct actgctgcta ctggtatgaa tgataaaagt tcccgatctc attcagtttt 2160
caccctggtg atgacccaga ccaagacaga atttgtggaa ggggaagaac acgatcacag 2220
aataacaagt cgaattaacc taatagatct ggcaggcagt gagcgctgct ctacggctca 2280
cactaatgga gatcgactaa aggaaggtgt gagtattaat aagtccttgc taactttggg 2340
aaaagttata tctgcacttt cggaacaagc aaaccaaagg agtgttttta ttccttatcg 2400
tgaatctgtt cttacatggc tgttaaaaga aagtctgggt ggaaattcaa aaactgcaat 2460
gattgctacg attagtcccg ctgccagcaa catagaagaa acattaagca cacttagata 2520
tgctaaccaa gcccgtttaa tagtcaacat tgctaaagta aatgaagata tgaacgctaa 2580
gttaattaga gaattgaagg cagaaattgc aaagctaaaa gctgctcaga gaaacagtcg 2640
gaatattgac cctgaacgat acaggctctg tcggcaagaa ataacatcct taagaatgaa 2700
actgcatcaa caggagagag acatggcaga aatgcaaaga gtgtggaaag aaaagtttga 2760
acaagctgaa aaaagaaaac ttcaagaaac aaaagagtta cagaaagcag gaattatgtt 2820
tcaaatggac aatcatttac caaaccttgt taatctgaat gaagatccac aactatctga 2880
gatgctgcta tatatgataa aagaaggaac aactacagtt ggaaagtata aaccaaactc 2940
aagccatgat attcagttat ctggggtgct gattgctgat gatcattgta ctatcaaaaa 3000
ttttggtggg acagtgagta ttatcccagt tggggaagca aagacatatg taaatggaaa 3060
acatattttg gaaatcacag tattacgtca tggtgatcga gtgattcttg gtggagatca 3120
ttattttaga tttaatcatc cagtagaagt ccagaaagga aaaaggccat ctggaagaga 3180
tactcctata agtgagggtc caaaagactt tgaatttgca aaaaatgagt tgctcatggc 3240
acagagatca caacttgaag cagaaataaa agaggctcag ttgaaggcaa aggaagaaat 3300
gatgcaagga atccagattg caaaagaaat ggctcagcaa gagctttctt ctcaaaaagc 3360
tgcatatgaa agcaaaataa aagcactgga agcagaactg agagaagagt ctcaaaggaa 3420
aaaaatgcag gaaataaata accagaaggc taatcacaaa attgaggaat tagaaaaggc 3480
aaagcagcat cttgaacagg aaatatatgt caacaaaaag cgattagaaa tggaaacatt 3540
ggctacaaaa caggctttag aagaccatag catccgccat gcaagaattc tggaagcttt 3600
agaaactgaa aagcaaaaaa ttgctaaaga agtacaaatt ctacagcaga atcggaataa 3660
tagggataaa acttttacag tgcagacaac ttggagctct atgaaactct caatgatgat 3720
tcaggaagcc aatgctatca gcagcaaatt gaaaacatac tatgtttttg gcagacatga 3780
tatatcagat aaaagtagtt ctgacacttc tattcgggtt cgtaacctga aactaggaat 3840
ctcaacattc tggagtctgg aaaagtttga atctaaactt gcagcaatga aagaacttta 3900
tgagagtaat ggtagtaaca ggggtgaaga tgccttttgt gatcctgaag atgaatggga 3960
acccgacatt acagatgcac cagtttcttc actttctaga aggaggagta ggagtttgat 4020
gaagaacaga agaatttctg gttgtttaca tgacatacaa gtccatccaa ttaagaattt 4080
gcattcttca cattcatcag gtttaatgga caaatcaagc actatttact caaattcagc 4140
agagtccttt cttcctggaa tttgcaaaga attgattggt tcttcgttag atttttttgg 4200
acagagttat gatgaagaaa gaactatagc agacagccta attaatagtt ttcttaaaat 4260
ttataatggg ctatttgcca tttccaaggc tcatgaagaa caagatgaag aaagtcaaga 4320
taacttgttt tcttctgatc gagcaatcca gtcacttact attcagactg catgtgcttt 4380
tgagcagcta gtagtgctaa tgaaacactg gctgagtgat ttactgcctt gtaccaacat 4440
agcaagactt gaggatgagt tgagacaaga agttaaaaaa ctgggaggct acttacagtt 4500
atttttgcag ggatgctgtt tggatatttc atcaatgata aaagaggctc aaaagaatgc 4560
aatccaaatt gtacaacaag ctgtaaagta tgtggggcag ttagcagttc tgaaagggag 4620
caagctacat tttctagaaa acggtaacaa taaagctgcc agtgtccagg aggaattcat 4680
ggatgctgtt tgtgatggtg taggcttagg aatgaagatt ttattagatt ctggactgga 4740
aaaagcaaaa gaacttcagc atgaactctt taggcagtgt acaaaaaatg aggttaccaa 4800
agaaatgaaa actaatgcca tgggattgat tagatctctt gaaaacatct ttgctgaatc 4860
gaaaattaaa agtttcagaa ggcaagtaca agaagaaaac tttgaatacc aagatttcaa 4920
gaggatggtt aatcgtgctc cagaattctt aaagttaaaa cattgcttag agaaagctat 4980
tgaaattatt atttctgcac tgaaaggatg ccatagtgat ataaatcttc tccagacttg 5040
tgttgaaagt attcgcaact tggccagtga tttttacagt gacttcagtg tgccttctac 5100
ttctgttggc agctatgaga gtagagtaac tcacattgtc caccaggaac tagaatctct 5160
agctaagtct ctcctctttt gttttgaatc tgaagaaagc cctgatttgt tgaaaccctg 5220
ggaaacttat aatcaaaata ccaaagaaga acaccaacaa tctaaatcaa gcgggattga 5280
cggcagtaag aataaaggtg taccaaagcg tgtctatgag ctccatggct catccccagc 5340
agtgagctca gaggaatgca cacccagtag gattcagtgg gtgtgaatac tgatgtgtag 5400
gcacttttat gaccacccat gaaagaaaaa gaacacttgc tcggtaattt tctttatgca 5460
ggagagttta agagaaatca gcacagatat ttcaaaaaag tccatgtctt tttatcttta 5520
aaatatctat ttatcaaagg ccagacacag tggctcacgc ctgtaatccc agcactttgg 5580
gaggcgggca gatcacaagg tcaggagttt gagaccggcc tggccaacat ggcgaaaccc 5640
cgtctctact aaaaatacaa aaatttgctg ggcatggtgg cgcgtgcctg taatcccagc 5700
tactaggggg gctgaggcag gaggatcgct tgaacctgag aggcagaggt tgcagtgagc 5760
caagatcatg ccactttact ccagtctgag caacagaacg agacttagtc aaaataaata 5820
aataaataaa taaataaata aataaataaa taaataaaat atatttttat ctttaaagtg 5880
tttaacattg gtatactgtc tgtagttggt tcattagtcg tttataaagg gttattttct 5940
catgagtgga aacctgaaca atcagttacc tttgtgccta tgccttctct ctcctcagac 6000
agctgggatg tttatggtga aatggcctgt acaagtttaa ctaagacaac ttaacttgca 6060
ttgttaatca aaaattcttt tctcaaaggg ttaactggtt gccattttga atagtatgtt 6120
caagggtgta gcttcctgtt tctttccaaa ttataagtag ctacctaaat atagtataat 6180
tatatattaa taatatggct tgctggcaca gtagtttacc ctgttatctg tgtttcataa 6240
tgggggctgt atgaatatta tttaaaacta ataaaatgtt gccagaatta tactaaactg 6300
ttggatgaga ttaggagatc agaggctgga ccttctcttg ataatgcttg ttttgttaaa 6360
ggtataatga aataatttgt atatgatttg atgaagatta aagaccctta ttttccacag 6420
ctttaaaaaa aaacctttat ttatgatcaa gtaataaaga taatattcta cttgtgggat 6480
cttacattac ggaaatagtt tgacgttttt gacctcaaga gtatgtataa tttgaagaga 6540
tactttgtaa ctatgcttgg gtgatattga gcagttccta aagaataatt catttaaaaa 6600
aaaagaagaa aaaaaaagaa gaattcattt aaataacctg atcctttcat ttgccctttt 6660
cgaatttaca gatactactt gtacatttgg cataactagt tgaaattggc cattcgtacc 6720
atgaataaat ctgatagttt ccttgttagg aagagattgt aagtaaatac agtcattgca 6780
gtcagaacag tattagtgaa ccttgtgtgg tgttttcaag ctctttaaaa tggtacaatg 6840
tagcacattt gctttcattt ctttttttat ttttggcatt tgaccttgta ttctttctga 6900
agctctatat gtgtttttat tagtcaataa tctggcaagt agcactttgc ctgtgcagtt 6960
tgctggagtg tagatgtaca tatgaggatt tcccgggagg tgcacttctt tgaagaactt 7020
cctaaagtac ctgtatagta gttttcatct taatattcag tatttaatct tcagtttgtg 7080
ctttgtaaac tcatgactta attggtcaga aactttttag tgtctttata aaattttgta 7140
tacatattta tactaaacac attgtgatac tgtatttgaa tgaatggtga aaaaatattt 7200
gctattggaa ttatgtgcac tgacaagaaa tgttataaag agaatgcctt taataaatct 7260
tttcagcatt agaattgaaa aaaaaaaaaa aaa 7293
<210> 15
<211> 2486
<212> DNA
<213> 智人
<400> 15
gagatttgat tcccttggcg ggcggaagcg gccacaaccc ggcgatcgaa aagattctta 60
ggaacgccgt accagccgcg tctctcagga cagcaggccc ctgtccttct gtcgggcgcc 120
gctcagccgt gccctccgcc cctcaggttc tttttctaat tccaaataaa cttgcaagag 180
gactatgaaa gattatgatg aacttctcaa atattatgaa ttacatgaaa ctattgggac 240
aggtggcttt gcaaaggtca aacttgcctg ccatatcctt actggagaga tggtagctat 300
aaaaatcatg gataaaaaca cactagggag tgatttgccc cggatcaaaa cggagattga 360
ggccttgaag aacctgagac atcagcatat atgtcaactc taccatgtgc tagagacagc 420
caacaaaata ttcatggttc ttgagtactg ccctggagga gagctgtttg actatataat 480
ttcccaggat cgcctgtcag aagaggagac ccgggttgtc ttccgtcaga tagtatctgc 540
tgttgcttat gtgcacagcc agggctatgc tcacagggac ctcaagccag aaaatttgct 600
gtttgatgaa tatcataaat taaagctgat tgactttggt ctctgtgcaa aacccaaggg 660
taacaaggat taccatctac agacatgctg tgggagtctg gcttatgcag cacctgagtt 720
aatacaaggc aaatcatatc ttggatcaga ggcagatgtt tggagcatgg gcatactgtt 780
atatgttctt atgtgtggat ttctaccatt tgatgatgat aatgtaatgg ctttatacaa 840
gaagattatg agaggaaaat atgatgttcc caagtggctc tctcccagta gcattctgct 900
tcttcaacaa atgctgcagg tggacccaaa gaaacggatt tctatgaaaa atctattgaa 960
ccatccctgg atcatgcaag attacaacta tcctgttgag tggcaaagca agaatccttt 1020
tattcacctc gatgatgatt gcgtaacaga actttctgta catcacagaa acaacaggca 1080
aacaatggag gatttaattt cactgtggca gtatgatcac ctcacggcta cctatcttct 1140
gcttctagcc aagaaggctc ggggaaaacc agttcgttta aggctttctt ctttctcctg 1200
tggacaagcc agtgctaccc cattcacaga catcaagtca aataattgga gtctggaaga 1260
tgtgaccgca agtgataaaa attatgtggc gggattaata gactatgatt ggtgtgaaga 1320
tgatttatca acaggtgctg ctactccccg aacatcacag tttaccaagt actggacaga 1380
atcaaatggg gtggaatcta aatcattaac tccagcctta tgcagaacac ctgcaaataa 1440
attaaagaac aaagaaaatg tatatactcc taagtctgct gtaaagaatg aagagtactt 1500
tatgtttcct gagccaaaga ctccagttaa taagaaccag cataagagag aaatactcac 1560
tacgccaaat cgttacacta caccctcaaa agctagaaac cagtgcctga aagaaactcc 1620
aattaaaata ccagtaaatt caacaggaac agacaagtta atgacaggtg tcattagccc 1680
tgagaggcgg tgccgctcag tggaattgga tctcaaccaa gcacatatgg aggagactcc 1740
aaaaagaaag ggagccaaag tgtttgggag ccttgaaagg gggttggata aggttatcac 1800
tgtgctcacc aggagcaaaa ggaagggttc tgccagagac gggcccagaa gactaaagct 1860
tcactataac gtgactacaa ctagattagt gaatccagat caactgttga atgaaataat 1920
gtctattctt ccaaagaagc atgttgactt tgtacaaaag ggttatacac tgaagtgtca 1980
aacacagtca gattttggga aagtgacaat gcaatttgaa ttagaagtgt gccagcttca 2040
aaaacccgat gtggtgggta tcaggaggca gcggcttaag ggcgatgcct gggtttacaa 2100
aagattagtg gaagacatcc tatctagctg caaggtataa ttgatggatt cttccatcct 2160
gccggatgag tgtgggtgtg atacagccta cataaagact gttatgatcg ctttgatttt 2220
aaagttcatt ggaactacca acttgtttct aaagagctat cttaagacca atatctcttt 2280
gtttttaaac aaaagatatt attttgtgta tgaatctaaa tcaagcccat ctgtcattat 2340
gttactgtct tttttaatca tgtggttttg tatattaata attgttgact ttcttagatt 2400
cacttccata tgtgaatgta agctcttaac tatgtctctt tgtaatgtgt aatttctttc 2460
tgaaataaaa ccatttgtga atatag 2486
<210> 16
<211> 5101
<212> DNA
<213> 智人
<400> 16
agcgcagcca ttggtccggc tactctgtct ctttttcaaa ttgaggcgcc gagtcgttgc 60
ttagtttctg gggattcggg cggagacgag attagtgatt tggcggctcc gactggcgcg 120
ggacaaacgc cacggccaga gtaccgggta gagagcgggg acgccgacct gcgtgcgtcg 180
gtcctccagg ccacgccagc gcccgagagg gaccagggag actccggccc ctgtcggccg 240
ccaagcccct ccgcccctca cagcgcccag gtccgcggcc gggccttgat tttttggcgg 300
ggaccgtcat ggcgtcgcag ccaaattcgt ctgcgaagaa gaaagaggag aaggggaaga 360
acatccaggt ggtggtgaga tgcagaccat ttaatttggc agagcggaaa gctagcgccc 420
attcaatagt agaatgtgat cctgtacgaa aagaagttag tgtacgaact ggaggattgg 480
ctgacaagag ctcaaggaaa acatacactt ttgatatggt gtttggagca tctactaaac 540
agattgatgt ttaccgaagt gttgtttgtc caattctgga tgaagttatt atgggctata 600
attgcactat ctttgcgtat ggccaaactg gcactggaaa aacttttaca atggaaggtg 660
aaaggtcacc taatgaagag tatacctggg aagaggatcc cttggctggt ataattccac 720
gtacccttca tcaaattttt gagaaactta ctgataatgg tactgaattt tcagtcaaag 780
tgtctctgtt ggagatctat aatgaagagc tttttgatct tcttaatcca tcatctgatg 840
tttctgagag actacagatg tttgatgatc cccgtaacaa gagaggagtg ataattaaag 900
gtttagaaga aattacagta cacaacaagg atgaagtcta tcaaatttta gaaaaggggg 960
cagcaaaaag gacaactgca gctactctga tgaatgcata ctctagtcgt tcccactcag 1020
ttttctctgt tacaatacat atgaaagaaa ctacgattga tggagaagag cttgttaaaa 1080
tcggaaagtt gaacttggtt gatcttgcag gaagtgaaaa cattggccgt tctggagctg 1140
ttgataagag agctcgggaa gctggaaata taaatcaatc cctgttgact ttgggaaggg 1200
tcattactgc ccttgtagaa agaacacctc atgttcctta tcgagaatct aaactaacta 1260
gaatcctcca ggattctctt ggagggcgta caagaacatc tataattgca acaatttctc 1320
ctgcatctct caatcttgag gaaactctga gtacattgga atatgctcat agagcaaaga 1380
acatattgaa taagcctgaa gtgaatcaga aactcaccaa aaaagctctt attaaggagt 1440
atacggagga gatagaacgt ttaaaacgag atcttgctgc agcccgtgag aaaaatggag 1500
tgtatatttc tgaagaaaat tttagagtca tgagtggaaa attaactgtt caagaagagc 1560
agattgtaga attgattgaa aaaattggtg ctgttgagga ggagctgaat agggttacag 1620
agttgtttat ggataataaa aatgaacttg accagtgtaa atctgacctg caaaataaaa 1680
cacaagaact tgaaaccact caaaaacatt tgcaagaaac taaattacaa cttgttaaag 1740
aagaatatat cacatcagct ttggaaagta ctgaggagaa acttcatgat gctgccagca 1800
agctgcttaa cacagttgaa gaaactacaa aagatgtatc tggtctccat tccaaactgg 1860
atcgtaagaa ggcagttgac caacacaatg cagaagctca ggatattttt ggcaaaaacc 1920
tgaatagtct gtttaataat atggaagaat taattaagga tggcagctca aagcaaaagg 1980
ccatgctaga agtacataag accttatttg gtaatctgct gtcttccagt gtctctgcat 2040
tagataccat tactacagta gcacttggat ctctcacatc tattccagaa aatgtgtcta 2100
ctcatgtttc tcagattttt aatatgatac taaaagaaca atcattagca gcagaaagta 2160
aaactgtact acaggaattg attaatgtac tcaagactga tcttctaagt tcactggaaa 2220
tgattttatc cccaactgtg gtgtctatac tgaaaatcaa tagtcaacta aagcatattt 2280
tcaagacttc attgacagtg gccgataaga tagaagatca aaaaaaggaa ctagatggct 2340
ttctcagtat actgtgtaac aatctacatg aactacaaga aaataccatt tgttccttgg 2400
ttgagtcaca aaagcaatgt ggaaacctaa ctgaagacct gaagacaata aagcagaccc 2460
attcccagga actttgcaag ttaatgaatc tttggacaga gagattctgt gctttggagg 2520
aaaagtgtga aaatatacag aaaccactta gtagtgtcca ggaaaatata cagcagaaat 2580
ctaaggatat agtcaacaaa atgacttttc acagtcaaaa attttgtgct gattctgatg 2640
gcttctcaca ggaactcaga aattttaacc aagaaggtac aaaattggtt gaagaatctg 2700
tgaaacactc tgataaactc aatggcaacc tggaaaaaat atctcaagag actgaacaga 2760
gatgtgaatc tctgaacaca agaacagttt atttttctga acagtgggta tcttccttaa 2820
atgaaaggga acaggaactt cacaacttat tggaggttgt aagccaatgt tgtgaggctt 2880
caagttcaga catcactgag aaatcagatg gacgtaaggc agctcatgag aaacagcata 2940
acatttttct tgatcagatg actattgatg aagataaatt gatagcacaa aatctagaac 3000
ttaatgaaac cataaaaatt ggtttgacta agcttaattg ctttctggaa caggatctga 3060
aactggatat cccaacaggt acgacaccac agaggaaaag ttatttatac ccatcaacac 3120
tggtaagaac tgaaccacgt gaacatctcc ttgatcagct gaaaaggaaa cagcctgagc 3180
tgttaatgat gctaaactgt tcagaaaaca acaaagaaga gacaattccg gatgtggatg 3240
tagaagaggc agttctgggg cagtatactg aagaacctct aagtcaagag ccatctgtag 3300
atgctggtgt ggattgttca tcaattggcg gggttccatt tttccagcat aaaaaatcac 3360
atggaaaaga caaagaaaac agaggcatta acacactgga gaggtctaaa gtggaagaaa 3420
ctacagagca cttggttaca aagagcagat tacctctgcg agcccagatc aacctttaat 3480
tcacttgggg gttggcaatt ttatttttaa agaaaactta aaaataaaac ctgaaacccc 3540
agaacttgag ccttgtgtat agattttaaa agaatatata tatcagccgg gcgcggtggc 3600
tcatgcctgt aatcccagca ctttgggagg ctgaggcggg tggattgctt gagcccagga 3660
gtttgagacc agcctggcca acgtggcaaa acctcgtctc tgttaaaaat tagccgggcg 3720
tggtggcaca ctcctgtaat cccagctact ggggaggctg aggcacgaga atcacttgaa 3780
cccaggaagc ggggttgcag tgagccaaag gtacaccact acactccagc ctgggcaaca 3840
gagcaagact cggtctcaaa aacaaaattt aaaaaagata taaggcagta ctgtaaattc 3900
agttgaattt tgatatctac ccatttttct gtcatcccta tagttcactt tgtattaaat 3960
tgggtttcat ttgggatttg caatgtaaat acgtatttct agttttcata taaagtagtt 4020
cttttataac aaatgaaaag tatttttctt gtatattatt aagtaatgaa tatataagaa 4080
ctgtactctt ctcagcttga gcttacatag gtaaatatca ccaacatctg tccttagaaa 4140
ggaccatctc atgttttttt tcttgctatg acttgtgtat tttcttgcat cctccctaga 4200
cttccctatt tcgctttctc ctcggctcac tttctccctt tttatttttc accaaaccat 4260
ttgtagagct acaaaaggta tcctttctta ttttcagtag tcagaatttt atctagaaat 4320
cttttaacac ctttttagtg gttatttcta aaatcactgt caacaataaa tctaacccta 4380
gttgtatccc tcctttcagt atttttcact tgttgcccca aatgtgaaag catttcattc 4440
ctttaagagg cctaactcat tcaccctgac agagttcaca aaaagcccac ttaagagtat 4500
acattgctat tatgggagac cacccagaca tctgactaat ggctctgtgc ccacactcca 4560
agacctgtgc cttttagaga agctcacaat gatttaagga ctgtttgaaa cttccaatta 4620
tgtctataat ttatattctt ttgtttacat gatgaaactt tttgttgttg cttgtttgta 4680
tataatacaa tgtgtacatg tatctttttc tcgattcaaa tcttaaccct taggactctg 4740
gtatttttga tctggcaacc atatttctgg aagttgagat gtttcagctt gaagaaccaa 4800
aacagaagga atatgtacaa agaataaatt ttctgctcac gatgagttta gtgtgtaaag 4860
tttagagaca tctgactttg atagctaaat taaaccaaac cctattgaag aattgaatat 4920
atgctacttc aagaaactaa attgatctcg tagaattatc ttaataaaat aatggctata 4980
atttctctgc aaaatcagat gtcagcataa gcgatggata atacctaata aactgccctc 5040
agtaaatcca tggttaataa atgtggtttc tacattaaaa aaaaaaaaaa aaaaaaaaaa 5100
a 5101
<210> 17
<211> 1285
<212> DNA
<213> 智人
<400> 17
aattacaaat tcccaatgca gttacaggat cctgggaagc agagtgtctg gatggaacct 60
gagctgggtc tctgactcac ttctgacttt agttttttca agggggaaca tggcaaaggt 120
gttcagtttc atccttgtta ccaccgctct gacaatgggc agggaaattt cggcgctcga 180
ggactgtgcc caggagcaga tgcggctcag agcccaggtg cgcctgcttg agacccgggt 240
caaacagcaa caggtcaaga tcaagcagct tttgcaggag aatgaagtcc agttccttga 300
taaaggagat gagaatactg tcattgatct tggaagcaag aggcagtatg cagattgttc 360
agagattttc aatgatgggt ataagctcag tggattttac aaaatcaaac ctctccagag 420
cccagcagaa ttttctgttt attgtgacat gtccgatgga ggaggatgga ctgtaattca 480
gagacgatct gatggcagtg aaaactttaa cagaggatgg aaagactatg aaaatggctt 540
tggaaatttt gtccaaaaac atggtgaata ttggctgggc aataaaaatc ttcacttctt 600
gaccactcaa gaagactaca ctttaaaaat cgaccttgca gattttgaaa aaaatagccg 660
ttatgcacaa tataagaatt tcaaagttgg agatgaaaag aatttctacg agttgaatat 720
tggggaatat tctggaacag ctggagattc ccttgcgggg aattttcatc ctgaggtgca 780
gtggtgggct agtcaccaaa gaatgaaatt cagcacgtgg gacagagatc atgacaacta 840
tgaagggaac tgcgcagaag aagatcagtc tggctggtgg tttaacaggt gtcactctgc 900
aaacctgaat ggtgtatact acagcggccc ctacacggct aaaacagaca atgggattgt 960
ctggtacacc tggcatgggt ggtggtattc tctgaaatct gtggttatga aaattaggcc 1020
aaatgatttt attccaaatg taatttaatt gctgctgttg ggctttcgtt tctgcaattc 1080
agctttgttt aaagtgattt gaaaaatact cattctgaac atatccatgc gcaatcatga 1140
taactgttgt gagtagtgct tttcattctt ctcacttgcc tttgttactt aatgtgcttt 1200
cagtacagca gatatgcaat attcaccaaa taaatgtaga ctgtgttaaa aaaaaaaaaa 1260
aaaaaaaaaa aaaaaaaaaa aaaaa 1285
<210> 18
<211> 2127
<212> DNA
<213> 智人
<400> 18
ataatcacga cacattcaac acagatgtga gcgtttggag agagcttcag ccttcagcac 60
aggcaactgt gttctattca ccgggctgtg ctcctcggaa gggctggtgg ttcctgtaaa 120
agtttgtgct ccccgcgcct ttccttcctt ccctcgtctt tggcgcctgc gggcaccggg 180
agtcctggga gagggaggag gaacggcgaa tcggcggggc gtgtccttca cgccgccccg 240
tagctcgggg ccgaagctgg cgcagcgcgc gactttttga aagccaggag ggttcgaatt 300
gcaacggcag ctgccgggcg tatgtgttgg tgctagaggc agctgcaggg tctcgctggg 360
ggccgctcgg gaccaatttt gaagaggtac ttggccacga cttattttca cctccgacct 420
ttccttccag gcggtgagac tctggactga gagtggcttt cacaatggaa gggatcagta 480
atttcaagac accaagcaaa ttatcagaaa aaaagaaatc tgtattatgt tcaactccaa 540
ctataaatat cccggcctct ccgtttatgc agaagcttgg ctttggtact ggggtaaatg 600
tgtacctaat gaaaagatct ccaagaggtt tgtctcattc tccttgggct gtaaaaaaga 660
ttaatcctat atgtaatgat cattatcgaa gtgtgtatca aaagagacta atggatgaag 720
ctaagatttt gaaaagcctt catcatccaa acattgttgg ttatcgtgct tttactgaag 780
ccaatgatgg cagtctgtgt cttgctatgg aatatggagg tgaaaagtct ctaaatgact 840
taatagaaga acgatataaa gccagccaag atccttttcc agcagccata attttaaaag 900
ttgctttgaa tatggcaaga gggttaaagt atctgcacca agaaaagaaa ctgcttcatg 960
gagacataaa gtcttcaaat gttgtaatta aaggcgattt tgaaacaatt aaaatctgtg 1020
atgtaggagt ctctctacca ctggatgaaa atatgactgt gactgaccct gaggcttgtt 1080
acattggcac agagccatgg aaacccaaag aagctgtgga ggagaatggt gttattactg 1140
acaaggcaga catatttgcc tttggcctta ctttgtggga aatgatgact ttatcgattc 1200
cacacattaa tctttcaaat gatgatgatg atgaagataa aacttttgat gaaagtgatt 1260
ttgatgatga agcatactat gcagcgttgg gaactaggcc acctattaat atggaagaac 1320
tggatgaatc ataccagaaa gtaattgaac tcttctctgt atgcactaat gaagacccta 1380
aagatcgtcc ttctgctgca cacattgttg aagctctgga aacagatgtc tagtgatcat 1440
ctcagctgaa gtgtggcttg cgtaaataac tgtttattcc aaaatattta catagttact 1500
atcagtagtt attagactct aaaattggca tatttgagga ccatagtttc ttgttaacat 1560
atggataact atttctaata tgaaatatgc ttatattggc tataagcact tggaattgta 1620
ctgggttttc tgtaaagttt tagaaactag ctacataagt actttgatac tgctcatgct 1680
gacttaaaac actagcagta aaacgctgta aactgtaaca ttaaattgaa tgaccattac 1740
ttttattaat gatctttctt aaatattcta tattttaatg gatctactga cattagcact 1800
ttgtacagta caaaataaag tctacatttg tttaaaacac tgaacctttt gctgatgtgt 1860
ttatcaaatg ataactggaa gctgaggaga atatgcctca aaaagagtag ctccttggat 1920
acttcagact ctggttacag attgtcttga tctcttggat ctcctcagat ctttggtttt 1980
tgctttaatt tattaaatgt attttccata ctgagtttaa aatttattaa tttgtacctt 2040
aagcatttcc cagctgtgta aaaacaataa aactcaaata ggatgataaa gaataaagga 2100
cactttgggt accagaaaaa aaaaaaa 2127
<210> 19
<211> 2339
<212> DNA
<213> 智人
<400> 19
acgcggtgcc gcggggcggg agtagaggcg gagggagggg acacgggctc attgcggtgt 60
gcgccctgca ctctgtccct cactcgccgc cgacgacctg tctcgccgag cgcacgcctt 120
gccgccgccc cgcagaaatg cttcggttac ccacagtctt tcgccagatg agaccggtgt 180
ccagggtact ggctcctcat ctcactcggg cttatgccaa agatgtaaaa tttggtgcag 240
atgcccgagc cttaatgctt caaggtgtag accttttagc cgatgctgtg gccgttacaa 300
tggggccaaa gggaagaaca gtgattattg agcagagttg gggaagtccc aaagtaacaa 360
aagatggtgt gactgttgca aagtcaattg acttaaaaga taaatacaaa aacattggag 420
ctaaacttgt tcaagatgtt gccaataaca caaatgaaga agctggggat ggcactacca 480
ctgctactgt actggcacgc tctatagcca aggaaggctt cgagaagatt agcaaaggtg 540
ctaatccagt ggaaatcagg agaggtgtga tgttagctgt tgatgctgta attgctgaac 600
ttaaaaagca gtctaaacct gtgaccaccc ctgaagaaat tgcacaggtt gctacgattt 660
ctgcaaacgg agacaaagaa attggcaata tcatctctga tgcaatgaaa aaagttggaa 720
gaaagggtgt catcacagta aaggatggaa aaacactgaa tgatgaatta gaaattattg 780
aaggcatgaa gtttgatcga ggctatattt ctccatactt tattaataca tcaaaaggtc 840
agaaatgtga attccaggat gcctatgttc tgttgagtga aaagaaaatt tctagtatcc 900
agtccattgt acctgctctt gaaattgcca atgctcaccg taagcctttg gtcataatcg 960
ctgaagatgt tgatggagaa gctctaagta cactcgtctt gaataggcta aaggttggtc 1020
ttcaggttgt ggcagtcaag gctccagggt ttggtgacaa tagaaagaac cagcttaaag 1080
atatggctat tgctactggt ggtgcagtgt ttggagaaga gggattgacc ctgaatcttg 1140
aagacgttca gcctcatgac ttaggaaaag ttggagaggt cattgtgacc aaagacgatg 1200
ccatgctctt aaaaggaaaa ggtgacaagg ctcaaattga aaaacgtatt caagaaatca 1260
ttgagcagtt agatgtcaca actagtgaat atgaaaagga aaaactgaat gaacggcttg 1320
caaaactttc agatggagtg gctgtgctga aggttggtgg gacaagtgat gttgaagtga 1380
atgaaaagaa agacagagtt acagatgccc ttaatgctac aagagctgct gttgaagaag 1440
gcattgtttt gggagggggt tgtgccctcc ttcgatgcat tccagccttg gactcattga 1500
ctccagctaa tgaagatcaa aaaattggta tagaaattat taaaagaaca ctcaaaattc 1560
cagcaatgac cattgctaag aatgcaggtg ttgaaggatc tttgatagtt gagaaaatta 1620
tgcaaagttc ctcagaagtt ggttatgatg ctatggctgg agattttgtg aatatggtgg 1680
aaaaaggaat cattgaccca acaaaggttg tgagaactgc tttattggat gctgctggtg 1740
tggcctctct gttaactaca gcagaagttg tagtcacaga aattcctaaa gaagagaagg 1800
accctggaat gggtgcaatg ggtggaatgg gaggtggtat gggaggtggc atgttctaac 1860
tcctagacta gtgctttacc tttattaatg aactgtgaca ggaagcccaa ggcagtgttc 1920
ctcaccaata acttcagaga agtcagttgg agaaaatgaa gaaaaaggct ggctgaaaat 1980
cactataacc atcagttact ggtttcagtt gacaaaatat ataatggttt actgctgtca 2040
ttgtccatgc ctacagataa tttattttgt atttttgaat aaaaaacatt tgtacattcc 2100
tgatactggg tacaagagcc atgtaccagt gtactgcttt caacttaaat cactgaggca 2160
tttttactac tattctgtta aaatcaggat tttagtgctt gccaccacca gatgagaagt 2220
taagcagcct ttctgtggag agtgagaata attgtgtaca aagtagagaa gtatccaatt 2280
atgtgacaac ctttgtgtaa taaaaatttg tttaaagtta aaaaaaaaaa aaaaaaaaa 2339
<210> 20
<211> 3251
<212> DNA
<213> 智人
<400> 20
gatttggctc cgaggaggcg gaagtgcagc acagaaaggg ggtccgtggg ggacggtaga 60
agcctggagg aggagcttga gtccagccac tgtctgggta ctgccagcca tcgggcccag 120
gtctctgggg ttgtcttacc gcagtgagta ccacgcggta ctacagagac cggctgcccg 180
tgtgcccggc aggtggagcc gcccgcatca gcggcctcgg ggaatggaag cggagaacgc 240
gggcagctat tcccttcagc aagctcaagc tttttatacg tttccatttc aacaactgat 300
ggctgaagct cctaatatgg cagttgtgaa tgaacagcaa atgccagaag aagttccagc 360
cccagctcct gctcaggaac cagtgcaaga ggctccaaaa ggaagaaaaa gaaaacccag 420
aacaacagaa ccaaaacaac cagtggaacc caaaaaacct gttgagtcaa aaaaatctgg 480
caagtctgca aaatcaaaag aaaaacaaga aaaaattaca gacacattta aagtaaaaag 540
aaaagtagac cgttttaatg gtgtttcaga agctgaactt ctgaccaaga ctctccccga 600
tattttgacc ttcaatctgg acattgtcat tattggcata aacccgggac taatggctgc 660
ttacaaaggg catcattacc ctggacctgg aaaccatttt tggaagtgtt tgtttatgtc 720
agggctcagt gaggtccagc tgaaccatat ggatgatcac actctaccag ggaagtatgg 780
tattggattt accaacatgg tggaaaggac cacgcccggc agcaaagatc tctccagtaa 840
agaatttcgt gaaggaggac gtattctagt acagaaatta cagaaatatc agccacgaat 900
agcagtgttt aatggaaaat gtatttatga aatttttagt aaagaagttt ttggagtaaa 960
ggttaagaac ttggaatttg ggcttcagcc ccataagatt ccagacacag aaactctctg 1020
ctatgttatg ccatcatcca gtgcaagatg tgctcagttt cctcgagccc aagacaaagt 1080
tcattactac ataaaactga aggacttaag agatcagttg aaaggcattg aacgaaatat 1140
ggacgttcaa gaggtgcaat atacatttga cctacagctt gcccaagagg atgcaaagaa 1200
gatggctgtt aaggaagaaa aatatgatcc aggttatgag gcagcatatg gtggtgctta 1260
cggagaaaat ccatgcagca gtgaaccttg tggcttctct tcaaatgggc taattgagag 1320
cgtggagtta agaggagaat cagctttcag tggcattcct aatgggcagt ggatgaccca 1380
gtcatttaca gaccaaattc cttcctttag taatcactgt ggaacacaag aacaggaaga 1440
agaaagccat gcttaagaat ggtgcttctc agctctgctt aaatgctgca gttttaatgc 1500
agttgtcaac aagtagaacc tcagtttgct aactgaagtg ttttattagt attttactct 1560
agtggtgtaa ttgtaatgta gaacagttgt gtggtagtgt gaaccgtatg aacctaagta 1620
gtttggaaga aaaagtaggg tttttgtata ctagcttttg tatttgaatt aattatcatt 1680
ccagcttttt atatactata tttcatttat gaagaaattg attttctttt gggagtcact 1740
tttaatctgt aattttaaaa tacaagtctg aatatttata gttgattctt aactgcataa 1800
acctagatat accattatcc cttttatacc taagaagggc atgctaataa ttaccactgt 1860
caaagaggca aaggtgttga tttttgtata tgaagttaag cctcagtgga gtctcatttg 1920
ttagttttta gtggtaacta agggtaaact cagggttccc tgagctatat gcacactcag 1980
acctctttgc tttaccagtg gtgtttgtga gttgctcagt agtaaaaact ggcccttacc 2040
tgacagagcc ctggctttga cctgctcagc cctgtgtgtt aatcctctag tagccaatta 2100
actactctgg ggtggcaggt tccagagaat gcagtagacc ttttgccact catctgtgtt 2160
ttacttgaga catgtaaata tgatagggaa ggaactgaat ttctccattc atatttataa 2220
ccattctagt tttatcttcc ttggctttaa gagtgtgcca tggaaagtga taagaaatga 2280
acttctaggc taagcaaaaa gatgctggag atatttgata ctctcattta aactggtgct 2340
ttatgtacat gagatgtact aaaataagta atatagaatt tttcttgcta ggtaaatcca 2400
gtaagccaat aattttaaag attctttatc tgcatcattg ctgtttgtta ctataaatta 2460
aatgaacctc atggaaaggt tgaggtgtat acctttgtga ttttctaatg agttttccat 2520
ggtgctacaa ataatccaga ctaccaggtc tggtagatat taaagctggg tactaagaaa 2580
tgttatttgc atcctctcag ttactcctga atattctgat ttcatacgta cccagggagc 2640
atgctgtttt gtcaatcaat ataaaatatt tatgaggtct cccccacccc caggaggtta 2700
tatgattgct cttctcttta taataagaga aacaaattct tattgtgaat cttaacatgc 2760
tttttagctg tggctatgat ggattttatt ttttcctagg tcaagctgtg taaaagtcat 2820
ttatgttatt taaatgatgt actgtactgc tgtttacatg gacgttttgt gcgggtgctt 2880
tgaagtgcct tgcatcaggg attaggagca attaaattat tttttcacgg gactgtgtaa 2940
agcatgtaac taggtattgc tttggtatat aactattgta gctttacaag agattgtttt 3000
atttgaatgg ggaaaatacc ctttaaatta tgacggacat ccactagaga tgggtttgag 3060
gattttccaa gcgtgtaata atgatgtttt tcctaacatg acagatgagt agtaaatgtt 3120
gatatatcct atacatgaca gtgtgagact ttttcattaa ataatattga aagattttaa 3180
aattcatttg aaagtctgat ggcttttaca ataaaagata ttaagaattg ttatccttaa 3240
cttaaaaaaa a 3251
<210> 21
<211> 3207
<212> DNA
<213> 智人
<400> 21
gattgcgcac ccgcgacttc agcccgaggg gcggggattt tcttggagcg acgggacgcg 60
acgccaatcg cgacgaggct tcgccccgtg gcgcggtttg aaattttgcg gggctcaacg 120
gctcgcggag cggctacgcg gagtgacatc gccggtgttt gcgggtggtt gttgctctcg 180
gggccgtgtg gagtaggtct ggacctggac tcacggctgc ttggagcgtc cgccatgagg 240
agaagtgagg tgctggcgga ggagtccata gtatgtctgc agaaagccct aaatcacctt 300
cgggaaatat gggagctaat tgggattcca gaggaccagc ggttacaaag aactgaggtg 360
gtaaagaagc atatcaagga actcctggat atgatgattg ctgaagagga aagcctgaag 420
gaaagactca tcaaaagcat atccgtctgt cagaaagagc tgaacactct gtgcagcgag 480
ttacatgttg agccatttca ggaagaagga gagacgacca tcttgcaact agaaaaagat 540
ttgcgcaccc aagtggaatt gatgcgaaaa cagaaaaagg agagaaaaca ggaactgaag 600
ctacttcaag agcaagatca agaactgtgc gaaattcttt gtatgcccca ctatgatatt 660
gacagtgcct cagtgcccag cttagaagag ctgaaccagt tcaggcaaca tgtgacaact 720
ttgagggaaa caaaggcttc taggcgtgag gagtttgtca gtataaagag acagatcata 780
ctgtgtatgg aagaattaga ccacacccca gacacaagct ttgaaagaga tgtggtgtgt 840
gaagacgaag atgccttttg tttgtctttg gagaatattg caacactaca aaagttgcta 900
cggcagctgg aaatgcagaa atcacaaaat gaagcagtgt gtgaggggct gcgtactcaa 960
atccgagagc tctgggacag gttgcaaata cctgaagaag aaagagaagc tgtggccacc 1020
attatgtctg ggtcaaaggc caaggtccgg aaagcgctgc aattagaagt ggatcggttg 1080
gaagaactga aaatgcaaaa catgaagaaa gtgattgagg caattcgagt ggagctggtt 1140
cagtactggg accagtgctt ttatagccag gagcagagac aagcttttgc ccctttctgt 1200
gctgaggact acacagaaag tctgctccag ctccacgatg ctgagattgt gcggttaaaa 1260
aactactatg aagttcacaa ggaactcttt gaaggtgtcc agaagtggga agaaacctgg 1320
aggcttttct tagagtttga gagaaaagct tcagatccaa atcgatttac aaaccgagga 1380
ggaaatcttc taaaagaaga aaaacaacga gccaagctcc agaaaatgct gcccaagctg 1440
gaagaagagt tgaaggcacg aattgaattg tgggaacagg aacattcaaa ggcatttatg 1500
gtgaatgggc agaaattcat ggagtatgtg gcagaacaat gggagatgca tcgattggag 1560
aaagagagag ccaagcagga aagacaactg aagaacaaaa aacagacaga gacagagatg 1620
ctgtatggca gcgctcctcg aacacctagc aagcggcgag gactggctcc caatacaccg 1680
ggcaaagcac gtaagctgaa cactaccacc atgtccaatg ctacggccaa tagtagcatt 1740
cggcctatct ttggagggac agtctaccac tcccccgtgt ctcgacttcc tccttctggc 1800
agcaagccag tcgctgcttc cacctgttca gggaagaaaa caccccgtac tggcaggcat 1860
ggagccaaca aggagaacct ggagctcaac ggcagcatcc tgagtggtgg gtaccctggc 1920
tcggcccccc tccagcgcaa cttcagcatt aattctgttg ccagcaccta ttctgagttt 1980
gcgaaggatc cgtccctctc tgacagttcc actgttgggc ttcagcgaga actttcaaag 2040
gcttccaaat ctgatgctac ttctggaatc ctcaattcaa ccaacatcca gtcctgagaa 2100
gccctgatca gtcaaccagc tgtggcttcc tgtgcctaga ctggacctaa ttatatgggg 2160
gtgactttag tttttcttca gcttaggcgt gcttgaaacc ttggccaggt tccatgacca 2220
tgggcctaac ttaaagatgt gaatgagtgt tacagttgaa agcccatcat aggtttagtg 2280
gtcctaggag acttggtttt gacttatata catgaaaagt ttatggcaag aagtgcaaat 2340
tttagcatat ggggcctgac ttctctacca cataattcta cttgctgaag catgatcaaa 2400
gcttgtttta tttcaccact gtaggaaaat gattgactat gcccatccct gggggtaatt 2460
ttggcatgta tacctgtaac tagtaattaa catctttttt gtttaggcat gttcaattaa 2520
tgctgtagct atcatagctt tgctcttacc tgaagccttg tccccaccac acaggacagc 2580
cttcctcctg aagagaatgt ctttgtgtgt ccgaagttga gatggcctgc cctactgcca 2640
aagaggtgac aggaaggctg ggagcagctt tgttaaattg tgttcagttc tgttacacag 2700
tgcattgccc tttgttgggg gtatgcatgt atgaacacac atgcttgtcg gaacgctttc 2760
tcggcgtttg tcccttggct ctcatctccc ccattcctgt gcctactttg cctgagttct 2820
tctacccccg cagttgccag ccacattggg agtctgtttg ttccaatggg ttgagctgtc 2880
tttgtcgtgg agatctggaa ctttgcacat gtcactactg gggaggtgtt cctgctctag 2940
cttccacgat gaggcgccct ctttacctat cctctcaatc actactcttc ttgaagcact 3000
attatttatt cttccgctgt ctgcctgcag cagtactact gtcaacatag tgtaaatggt 3060
tctcaaaagc ttaccagtgt ggacttggtg ttagccacgc tgtttactca tacagtacgt 3120
gtcctgtttt taaaatatac aattattctt aaaaataaat taaaatctgt atacttacat 3180
ttcaaaaaga aaaaaaaaaa aaaaaaa 3207
<210> 22
<211> 5625
<212> DNA
<213> 智人
<400> 22
acctagcgcc ccctcccccg ggagcgcgga ggagcattaa taaacctcta agccgaggag 60
aaaactctgg ctggggcagt gcgctgagcg ccggaggagc gtaggcaggg cagcgctggc 120
gccagtggcg acaggagccg cgcgaccggc aaaaatacac gggaggccgt cgccgaaaag 180
agtccgcggt cctctctcgt aaacacactc tcctccaccg gcgcctcccc ctccgctctg 240
cgcgccgccc ggctgggcgc ccgaggccgc tccgactgct atgtgaccgc gaggctgcgg 300
gaggaagggg acagggaaga agaggctctc ccgcgggagc ccttgaggac caagtttgcg 360
gccacttctg caggcgtccc ttcttagctc tcgcccgccc ctttctgcag cctaggcggc 420
ccgggttctc ttctcttcct cgcgcgccca gccgcctcgg ttcccggcga ccatggtgac 480
gatggaggag ctgcgggaga tggactgcag tgtgctcaaa aggctgatga accgggacga 540
gaatggcggc ggcgcgggcg gcagcggcag ccacggcacc ctggggctgc cgagcggcgg 600
caagtgcctg ctgctggact gcagaccgtt cctggcgcac agcgcgggct acatcctagg 660
ttcggtcaac gtgcgctgta acaccatcgt gcggcggcgg gctaagggct ccgtgagcct 720
ggagcagatc ctgcccgccg aggaggaggt acgcgcccgc ttgcgctccg gcctctactc 780
ggcggtcatc gtctacgacg agcgcagccc gcgcgccgag agcctccgcg aggacagcac 840
cgtgtcgctg gtggtgcagg cgctgcgccg caacgccgag cgcaccgaca tctgcctgct 900
caaaggcggc tatgagaggt tttcctccga gtacccagaa ttctgttcta aaaccaaggc 960
cctggcagcc atcccacccc cggttccccc cagtgccaca gagcccttgg acctgggctg 1020
cagctcctgt gggaccccac tacacgacca ggggggtcct gtggagatcc ttcccttcct 1080
ctacctcggc agtgcctacc atgctgcccg gagagacatg ctggacgccc tgggcatcac 1140
ggctctgttg aatgtctcct cggactgccc aaaccacttt gaaggacact atcagtacaa 1200
gtgcatccca gtggaagata accacaaggc cgacatcagc tcctggttca tggaagccat 1260
agagtacatc gatgccgtga aggactgccg tgggcgcgtg ctggtgcact gccaggcggg 1320
catctcgcgg tcggccacca tctgcctggc ctacctgatg atgaagaaac gggtgaggct 1380
ggaggaggcc ttcgagttcg ttaagcagcg ccgcagcatc atctcgccca acttcagctt 1440
catggggcag ctgctgcagt tcgagtccca ggtgctggcc acgtcctgtg ctgcggaggc 1500
tgctagcccc tcgggacccc tgcgggagcg gggcaagacc cccgccaccc ccacctcgca 1560
gttcgtcttc agctttccgg tctccgtggg cgtgcactcg gcccccagca gcctgcccta 1620
cctgcacagc cccatcacca cctctcccag ctgttagagc cgccctgggg gccccagaac 1680
cagagctggc tcccagcaag ggtaggacgg gccgcatgcg ggcagaaagt tgggactgag 1740
cagctgggag caggcgaccg agctccttcc ccatcatttc tccttggcca acgacgaggc 1800
cagccagaat ggcaataagg actccgaata cataataaaa gcaaacagaa cactccaact 1860
tagagcaata acggctgccg cagcagccag ggaagacctt ggtttggttt atgtgtcagt 1920
ttcacttttc cgatagaaat ttcttacctc atttttttaa gcagtaaggc ttgaagtgat 1980
gaaacccaca gatcctagca aatgtgccca accagcttta ctaaaggggg aggaagggag 2040
ggcaaaggga tgagaagaca agtttcccag aagtgcctgg ttctgtgtac ttgtcccttt 2100
gttgtcgttg ttgtagttaa aggaatttca ttttttaaaa gaaatcttcg aaggtgtggt 2160
tttcatttct cagtcaccaa cagatgaata attatgctta ataataaagt atttattaag 2220
actttcttca gagtatgaaa gtacaaaaag tctagttaca gtggatttag aatatattta 2280
tgttgatgtc aaacagctga gcaccgtagc atgcagatgt caaggcagtt aggaagtaaa 2340
tggtgtcttg tagatatgtg caaggtagca tgatgagcaa cttgagtttg ttgccactga 2400
gaagcaggcg ggttgggtgg gaggaggaag aaagggaaga attaggtttg aattgctttt 2460
taaaaaaaaa agaaaagaaa aagacagcat ctcactatgt tgccaaggct catcttgaga 2520
agcaggcggg ttgggtggga ggaggaagaa agggaagaat taggtttgaa ttgctttttt 2580
aaaaaaaaag aaaagaaaaa aaaagacagc atctcactat gttgccaagg ctcatctcaa 2640
gctcttgggc tcaagagatc ctcccacctc ggcctcctga gtagctggga ctgcaggtgt 2700
gtgtcatcat gaccaatgtg aattgctttt gaagctggtt catgggcatg taggccaccg 2760
aagcaatttt agaccacagt aagtcaagct tttttccctc cgatgatcac tgggtggttg 2820
cagcattttt tgcataaacc tgcctaagac ttgtctatcg tctgtgatca atatgccata 2880
ttacactaag gtgctcctgg aaaattgggt gcagttcaaa ttttcctaca gcaaatcatt 2940
tggcaaggcc agccattggg gaaaccagac aactagagat aaccctgaaa tgaatccttt 3000
tgtaaattga agcaccatct tttctttttt tgcataaatt ggaggtttta attttagggc 3060
agttacctga agtgaaatat accaacaatt tcttgtgttc tttaaattcc tagttaggtg 3120
aatatttttg aaggtcctct tttgaataaa gaggggaatg gacaccacat ttcaggtctt 3180
ctcgaagtgt ggaagggcaa gagagcatca gtgagctgat ggtggattgc ttacatcgga 3240
ttccattggt atgaatttcc caaactggaa atcaaagcgc cagggtgggg ttggggctga 3300
ctgctggtga gggggctggc cgctggctcc cgtgacgtgc gtcatgggca cgcaggcgcc 3360
attttgaatc tatcgtcggc acgtgggtgc cattttgaat ccttagttgg gcctttctaa 3420
atggagaatg gctttggagg gagacacgtt ttctgtgggg agggtttggg ggggagggag 3480
gagggaacaa gctacatgct attttgtttg tagtattgtg gaacagtctt gttatggagt 3540
gccagcttag aggttgttgc aaacttgtct agaagtgaga gcatggtttt ttttagccct 3600
ttgagagtct acatctaatg aacattcttg ctcacccata aataacgtca agcctcaatg 3660
tcaccgtcac gttgggatac tctttctcat ctggcatcct agacaggaca aggttggtta 3720
cctttccttc catgaaccat gaacctgtga cggcatcatt catcctgact tcaccaagct 3780
ccgcctgtgg gtgaggccag agctcccact ggcaattttt agaagagcca gaggctccct 3840
gcttcctcta gaaataacag ttcagggtga agcatggagg gtttcagttc ccagacaatg 3900
gaaccattta gagacaacac agttggacat ttccactttt tccttgattc ctggaagtcc 3960
agtgggttct gcagctgaaa aagccctggg tcccagcagc agagagacag gacagagggg 4020
atgcttgggc ggggagggac ggtaacctgc agaacagatt ccatttttat agaacgagta 4080
cacgtttgct aaaacagtcc tgctttccca gactggattc ccaccacagg gacagtcgga 4140
actcaggact agctccagcg acatctttcc tccgaattca agccttctat cacaatgtca 4200
aaacagctat ttataaagcc attttcattg tacttgataa cagcacgagt cccaaaactt 4260
ttagaaataa aataggacat tggcttgatt gaaaagaggg actttttaaa aattgttctt 4320
tcgtcagaag ccttttggat gacttacaat agctctgatg aagataccac cccagcgtca 4380
gtccaatagg tcagtgagtt tcaacaggca tccatccctc ccatgaaggg attctggtga 4440
tgggaagttt ctgtaatgac aggaaagcat tgaccctcat tgattgtcaa ctttggtatt 4500
agccatgaaa gacaggatgc tcattgggtg ttctgtagag tgaggaatgc tgcctattcc 4560
ctcccagaac gtctgaccca ggggtgtgtg ttgaggagcc ctgggggaaa tggaccaagt 4620
tttcccacag agcagtatta ggctgaagag caggtgactg gtaggcccca gctcccatca 4680
ttccctccca aagccatttt gttcagttgc tcatccacgc tggattccag agagttttcc 4740
aatttgggaa gccatgagaa aggtttttaa atcttgggaa gatggagaga gggacatagg 4800
atagttgact ccaacatgac aggaagaggc tggagattgg gaattggcca tcaaccaagc 4860
ctgtagtagt aaagccatgg tcccgcattg gaattacttg gggaacttat acagttctga 4920
tacccaggct ctcctagacc agttcaacca attctaggtg ggggactcag gcatcagtgt 4980
gtttcgtagc tccccgggtg ttttccctgt gcagccgagc ttgggaaact gccatgcttt 5040
ttggatgtca aggcgctgtt ggaggctggg tgtgacagca cagagccagg ttgtcttgtg 5100
gaaaccacag ccacgggttt gccactggct cagcatggcc tcactgccag tcccagcctg 5160
gctgagggac aagatggttt ctcttgggag ttcctgagtg gagcaccctt ccaggctttt 5220
tgaaagccag ctgatctgtg gagccttgtt aagggactca atacggtgtt tggatattga 5280
tgtttttcct tgagactgtc ttgtccatca ataaagatgg aggatgtctc ctctttgaac 5340
cccgcttccc caccagtact ctctctccct tagagtttat gagttattca aggaggagac 5400
ttcttaaaga cagcaacgca attcttgtaa cttgtgtaaa tagccccatc tttcagagtg 5460
ataccatttc tacatttgat aatgcctgta ttcctgtagg atgtatatag tttaggggat 5520
tttttttttg tttggttttg ttttttagaa gtcaatatgt ctggttttat ttattgcttg 5580
aaaaagatca tttgaaaaaa ataaatacat tttcaaccac taaaa 5625
<210> 23
<211> 2537
<212> DNA
<213> 智人
<400> 23
ggaagtccca cctgcgcccg acggcggaag ttccgggagt gccaagtacc cgcgtgcata 60
cggctgccgg catggcacat tacaacttca agaaaattac ggtggtgccg tccgccaagg 120
acttcataga cctcacgttg tcgaagactc aacgaaagac tccaaccgtt attcataaac 180
attaccaaat acatcgcatt agacattttt acatgagaaa agtcaaattt actcaacaga 240
attaccatga tagactttca caaattctaa cagatttccc caaattggat gatattcatc 300
cgttctatgc tgatttgatg aatattctct acgacaagga tcattacaag ttggctctgg 360
ggcaaataaa tattgccaaa aatttagtgg acaatgttgc taaagattat gtgcgactga 420
tgaagtatgg cgactctctc taccgctgca aacagctgaa gcgtgcggcc ctgggacgga 480
tgtgcacagt gatcaagagg cagaagcaga gtttggagta tttggagcaa gtgcgtcagc 540
atttatcccg tttgccaacc attgatccga ataccaggac cctgcttttg tgtgggtacc 600
caaatgttgg gaagtccagc ttcatcaaca aggtgacgag agcagacgtg gatgtccagc 660
cctatgcgtt cacaaccaag tctctgtttg ttgggcacat ggattataag tatctacgtt 720
ggcaggttgt agacactcct gggatcctgg accaccctct ggaggatagg aacaccatcg 780
agatgcaggc catcactgcc ctggcccacc tccgtgctgc ggtcctgtat gtgatggatt 840
tgtctgagca gtgtgggcat gggctgaggg agcagctaga actcttccag aacatcagac 900
ctctcttcat caacaagcct ctcatagttg tagccaacaa atgtgatgtg aagagaatag 960
ctgaactttc tgaagatgat cagaaaatat ttacagattt gcagtctgaa ggattccctg 1020
taatagagac cagcaccctg actgaggaag gtgttattaa agttaaaaca gaggcttgcg 1080
ataggctttt ggctcatcga gtggaaacca aaatgaaggg aaataaagtg aatgaggtgc 1140
tgaatagact gcacctggct atcccaacca ggagggacga taaggagagg ccccctttca 1200
tccctgaagg agtggtggct cgcaggaaga ggatggaaac tgaggagtcc aggaagaaga 1260
gggaacgaga tcttgagctg gaaatgggag atgattatat tttggatctt cagaagtact 1320
gggatttaat gaatttgtct gaaaaacatg ataagatacc agaaatctgg gaaggccata 1380
atatagctga ttatattgat ccagccatca tgaagaaatt ggaagaatta gaaaaagaag 1440
aagagctgag aacagctgct ggagagtatg acagtgtatc tgagagtgaa gacgaagaga 1500
tgctggaaat ccgacagctg gcaaagcaaa ttcgagagaa aaagaagttg aaaattctgg 1560
agtccaaaga aaagaataca cagggaccca ggatgccgcg aactgctaag aaggttcaga 1620
ggacagtttt ggagaaggag atgcgtagtc ttggtgttga catggacgat aaagacgatg 1680
cccattacgc agtccaggca agaagatccc ggagcatcac taggaaaaga aagcgggaag 1740
actctgctcc cccgtcctct gtggcccgga gtgggagttg ctctcgaact ccacgtgacg 1800
tttctggtct tagggatgtc aagatggtga agaaagccaa gactatgatg aagaatgctc 1860
agaagaagat gaatcggttg gggaagaaag gggaggcgga tagacacgtg tttgatatga 1920
agcccaagca cttgctgtct gggaagagga aagctggtaa aaaggacagg agatagtatc 1980
cgtttggttg gcgtggcttc gctagagtgt tgctgtttat ttcctggttt ggcacagtat 2040
ggtttcatga aattggagct ctgtataaac tgaaaaagac aaaataagta aagcacttgt 2100
tgctttgctg aaaactatgg ttaaccctat ataggtgtgg gaaatttttg tcactgcata 2160
atattacaaa tattttgagt agacagtgtt tccacattta atggagtatc agttgcttca 2220
gattttcaga actgggaaga tttactggtg taactgggtt gtttttgatg gagaaaaacc 2280
ttattttctt ttgtaagagc tgggagcaaa cacgtttatg agtgtgtcgg aatcccgtgc 2340
ttaaaatacg ctcttaaatt attttctagt cttattttac aatgtctcat tgtagtctgt 2400
cttcaactat tttatccaaa ataaacctcc agaagaaagt agttttcatt tacttagctc 2460
atgttttggt ttagttatag tcgctatgga tttggccaaa taaaaaggca aacaacaaaa 2520
aaaaaaaaaa aaaaaaa 2537
<210> 24
<211> 1687
<212> DNA
<213> 智人
<400> 24
gattgtggga aggcagctga actcggcgcc tggaaagatg gaggcagcgg agacagaggc 60
ggaagctgca gccctagagg tcctggctga ggtggcaggc atcttggaac ctgtaggcct 120
gcaggaggag gcagaactgc cagccaagat cctggttgag tttgtggtgg actctcagaa 180
gaaagacaag ctgctctgca gccagcttca ggtagcggat ttcctgcaga acatcctggc 240
tcaggaggac actgctaagg gtctcgaccc cttggcttct gaagacacga gccgacagaa 300
ggcaattgca gctaaggaac aatggaaaga gctgaaggcc acctacaggg agcacgtaga 360
ggccatcaaa attggcctca ccaaggccct gactcagatg gaggaagccc agaggaaacg 420
gacacaactc cgggaagcct ttgagcagct ccaggccaag aaacaaatgg ccatggagaa 480
acgcagagca gtccagaacc agtggcagct acaacaggag aagcatctgc agcatctggc 540
ggaggtttct gcagaggtga gggagcgtaa gacagggact cagcaggagc ttgacagggt 600
gtttcagaaa cttggaaacc tgaagcagca ggcagaacag gagcgggaca agctgcagag 660
gtatcagacc ttcctccagc ttctgtatac cctgcagggt aagctgttgt tccctgaggc 720
tgaggctgag gcagagaatc ttccagatga taaaccccag cagccgactc gaccccagga 780
gcagagtaca ggagacacca tggggagaga ccctggtgtg tccttcaagg ctgttggtct 840
acaacctgct ggagatgtaa atttgccatg acttcctgga ggacagcagc atggagaaag 900
atcctagaaa aggcctctga cttccctcac ctcccaacca tcattacagg aaagactgtg 960
aactcctgag ttcagcttga tttctgacta catcccagca agctctggca tctgtggatt 1020
aaaatccctg gatctctctc agttgtgtat ttgttcatct tcatatgctg gcaggaacaa 1080
ctattaatac agatactcag aagccaataa catgacagga gctgggactg gtttgaacac 1140
agggtgtgca gatggggagg gggtactggc cttgggcctc ctatgatgca gacatggtga 1200
atttaattca aggaggagga gaatgtttta ggcaggtggt tatatgtggg aagataattt 1260
tattcatgga tccaaatgtt tgttgagtcc tttctttgtg ctaaggttct tgcggtgaac 1320
cagaattata acagtgagct catctgactg ttttaggatg tacagcctag tgttaacatt 1380
cttggtatct ttttgtgcct tatctaaaac atttctcgat cactggtttc agatgttcat 1440
ttattatatt cttttcaaag attcagagat tggcttttgt catccactat tgtatgtttt 1500
gtttcattga cctctagtga taccttgatc tttcccactt tctgttttcg gattggagaa 1560
gatgtacctt ttttgtcaac tcttactttt atcagatgat caactcacgt atttggatct 1620
ttatttgttt tctcaaataa atatttaagg ttatacattt aaaaaaaaaa aaaaaaaaaa 1680
aaaaaaa 1687
<210> 25
<211> 3849
<212> DNA
<213> 智人
<400> 25
cccttttgct tacttcctag tcccgggcag gccggctcgg aggcagcgag aaagcgcagc 60
caggcggctg ctcggcgttc tctcaggtga ctgctcggag ttctcccagt gtttggtgtt 120
gcaagcagga tccaaaggag acctatagtg actcccagga gctcttagtg accaagtgaa 180
ggcaggaaga cagggttctg atggtgtgag tctccttcaa ctcagcaaac caccttggtc 240
tgcctcgagt ttccaacacc cctcctgcct gctagtgata ggtgtgaggc aggttgatga 300
acatggaact tttttctttt ggtcccaaag catgctactc ctggagtttc attcagtgaa 360
tgagaactat agtttggttc tgtgagatct ctatgaatca aggcggccac tgaagcggag 420
aaaagaaatg cttaaatgtt aagaaagttt gaagtgcaga aaaaggttga agcactggac 480
aatgccacat actttgtgga tggtgtgggt cttgggggtc atcatcagcc tctccaagga 540
agaatcctcc aatcaggctt ctctgtcttg tgaccgcaat ggtatctgca agggcagctc 600
aggatcttta aactccattc cctcagggct cacagaagct gtaaaaagcc ttgacctgtc 660
caacaacagg atcacctaca ttagcaacag tgacctacag aggtgtgtga acctccaggc 720
tctggtgctg acatccaatg gaattaacac aatagaggaa gattcttttt cttccctggg 780
cagtcttgaa catttagact tatcctataa ttacttatct aatttatcgt cttcctggtt 840
caagcccctt tcttctttaa cattcttaaa cttactggga aatccttaca aaaccctagg 900
ggaaacatct cttttttctc atctcacaaa attgcaaatc ctgagagtgg gaaatatgga 960
caccttcact aagattcaaa gaaaagattt tgctggactt accttccttg aggaacttga 1020
gattgatgct tcagatctac agagctatga gccaaaaagt ttgaagtcaa ttcagaatgt 1080
aagtcatctg atccttcata tgaagcagca tattttactg ctggagattt ttgtagatgt 1140
tacaagttcc gtggaatgtt tggaactgcg agatactgat ttggacactt tccatttttc 1200
agaactatcc actggtgaaa caaattcatt gattaaaaag tttacattta gaaatgtgaa 1260
aatcaccgat gaaagtttgt ttcaggttat gaaacttttg aatcagattt ctggattgtt 1320
agaattagag tttgatgact gtacccttaa tggagttggt aattttagag catctgataa 1380
tgacagagtt atagatccag gtaaagtgga aacgttaaca atccggaggc tgcatattcc 1440
aaggttttac ttattttatg atctgagcac tttatattca cttacagaaa gagttaaaag 1500
aatcacagta gaaaacagta aagtttttct ggttccttgt ttactttcac aacatttaaa 1560
atcattagaa tacttggatc tcagtgaaaa tttgatggtt gaagaatact tgaaaaattc 1620
agcctgtgag gatgcctggc cctctctaca aactttaatt ttaaggcaaa atcatttggc 1680
atcattggaa aaaaccggag agactttgct cactctgaaa aacttgacta acattgatat 1740
cagtaagaat agttttcatt ctatgcctga aacttgtcag tggccagaaa agatgaaata 1800
tttgaactta tccagcacac gaatacacag tgtaacaggc tgcattccca agacactgga 1860
aattttagat gttagcaaca acaatctcaa tttattttct ttgaatttgc cgcaactcaa 1920
agaactttat atttccagaa ataagttgat gactctacca gatgcctccc tcttacccat 1980
gttactagta ttgaaaatca gtaggaatgc aataactacg ttttctaagg agcaacttga 2040
ctcatttcac acactgaaga ctttggaagc tggtggcaat aacttcattt gctcctgtga 2100
attcctctcc ttcactcagg agcagcaagc actggccaaa gtcttgattg attggccagc 2160
aaattacctg tgtgactctc catcccatgt gcgtggccag caggttcagg atgtccgcct 2220
ctcggtgtcg gaatgtcaca ggacagcact ggtgtctggc atgtgctgtg ctctgttcct 2280
gctgatcctg ctcacggggg tcctgtgcca ccgtttccat ggcctgtggt atatgaaaat 2340
gatgtgggcc tggctccagg ccaaaaggaa gcccaggaaa gctcccagca ggaacatctg 2400
ctatgatgca tttgtttctt acagtgagcg ggatgcctac tgggtggaga accttatggt 2460
ccaggagctg gagaacttca atcccccctt caagttgtgt cttcataagc gggacttcat 2520
tcctggcaag tggatcattg acaatatcat tgactccatt gaaaagagcc acaaaactgt 2580
ctttgtgctt tctgaaaact ttgtgaagag tgagtggtgc aagtatgaac tggacttctc 2640
ccatttccgt ctttttgatg agaacaatga tgctgccatt ctcattcttc tggagcccat 2700
tgagaaaaaa gccattcccc agcgcttctg caagctgcgg aagataatga acaccaagac 2760
ctacctggag tggcccatgg acgaggctca gcgggaagga ttttgggtaa atctgagagc 2820
tgcgataaag tcctaggttc ccatatttaa gaccagtctt tgtctagttg ggatctttat 2880
gtcactagtt atagttaagt tcattcagac ataattatat aaaaactacg tggatgtacc 2940
gtcatttgag gacttgctta ctaaaactac aaaacttcaa attttgtctg gggtgctgtt 3000
ttataaacat atgccagatt taaaaattgg tttttggttt ttcttttttc tatgagataa 3060
ccatgatcat aagtctatta ctgatatctg aatatagtcc cttggtatcc aagggaattg 3120
gttgcaggat cctcgtggat atcaaaattc atagatgatc aagtccctta taagagtggc 3180
atagtatttg catataacct gtgtacattc tcctgtatac tttaaatcat ctctagatta 3240
cttatgatac ccaatacaat gtaaatacta tgtaaatagt tgtactgtct ttttatttat 3300
attattattg ttatttttta ttttcaaaat ttttaaaaca tacttttgat ccacagttgg 3360
ttgacttcat ggatgcagaa cccatggata tagagggcca actgtaatct gtagcaactg 3420
gcttagttca ttaggaaaca gcacaaatga acttaagatt ctcaatgact gtgtcattct 3480
ttcttcctgc taagagactc ctctgtggcc acaaaaggca ttctctgtcc tacctagctg 3540
tcacttctct gtgcagctga tctcaagagc aacaaggcaa agtatttggg gcactcccca 3600
aaacttgttg ctattcctag aaaaaagtgc tgtgtatttc ctattaaact ttacaggatg 3660
agaaatacta gagggtgtat tttcatgtga tctggatctg tctttctggc tattagatag 3720
gtttctccag ccatagttac ttgagagagt gagtacacag tgcaaggtac agtaaattat 3780
gtatttctgt aatttaacaa aataaatact cagtttagga gaatttgaaa gacaaaaaaa 3840
aaaaaaaaa 3849
<210> 26
<211> 1698
<212> DNA
<213> 智人
<400> 26
ctgcctgggg agcccccccg ccccacatcc tgccccgcaa aaggcagctt caccaaagtg 60
gggtatttcc agcctttgta gctttcactt ccacatctac caagtgggcg gagtggcctt 120
ctgtggacga atcagattcc tctccagcac cgactttaag aggcgagccg gggggtcagg 180
gtcccagatg cacaggagga gaagcaggag ctgtcgggaa gatcagaagc cagtcatgga 240
tgaccagcgc gaccttatct ccaacaatga gcaactgccc atgctgggcc ggcgccctgg 300
ggccccggag agcaagtgca gccgcggagc cctgtacaca ggcttttcca tcctggtgac 360
tctgctcctc gctggccagg ccaccaccgc ctacttcctg taccagcagc agggccggct 420
ggacaaactg acagtcacct cccagaacct gcagctggag aacctgcgca tgaagcttcc 480
caagcctccc aagcctgtga gcaagatgcg catggccacc ccgctgctga tgcaggcgct 540
gcccatggga gccctgcccc aggggcccat gcagaatgcc accaagtatg gcaacatgac 600
agaggaccat gtgatgcacc tgctccagaa tgctgacccc ctgaaggtgt acccgccact 660
gaaggggagc ttcccggaga acctgagaca ccttaagaac accatggaga ccatagactg 720
gaaggtcttt gagagctgga tgcaccattg gctcctgttt gaaatgagca ggcactcctt 780
ggagcaaaag cccactgacg ctccaccgaa agtactgacc aagtgccagg aagaggtcag 840
ccacatccct gctgtccacc cgggttcatt caggcccaag tgcgacgaga acggcaacta 900
tctgccactc cagtgctatg ggagcatcgg ctactgctgg tgtgtcttcc ccaacggcac 960
ggaggtcccc aacaccagaa gccgcgggca ccataactgc agtgagtcac tggaactgga 1020
ggacccgtct tctgggctgg gtgtgaccaa gcaggatctg ggcccagtcc ccatgtgaga 1080
gcagcagagg cggtcttcaa catcctgcca gccccacaca gctacagctt tcttgctccc 1140
ttcagccccc agcccctccc ccatctccca ccctgtacct catcccatga gaccctggtg 1200
cctggctctt tcgtcaccct tggacaagac aaaccaagtc ggaacagcag ataacaatgc 1260
agcaaggccc tgctgcccaa tctccatctg tcaacagggg cgtgaggtcc caggaagtgg 1320
ccaaaagcta gacagatccc cgttcctgac atcacagcag cctccaacac aaggctccaa 1380
gacctaggct catggacgag atgggaaggc acagggagaa gggataaccc tacacccaga 1440
ccccaggctg gacatgctga ctgtcctctc ccctccagcc tttggccttg gcttttctag 1500
cctatttacc tgcaggctga gccactctct tccctttccc cagcatcact ccccaaggaa 1560
gagccaatgt tttccaccca taatcctttc tgccgacccc tagttccctc tgctcagcca 1620
agcttgttat cagctttcag ggccatggtt cacattagaa taaaaggtag taattagaac 1680
aaaaaaaaaa aaaaaaaa 1698
<210> 27
<211> 1501
<212> DNA
<213> 智人
<400> 27
agcgagtcct tcttttcctg actgcagctc ttttcatttt gccatccttc tccagctcca 60
tgatggttct gcaggtttct gcggcccccc ggacagtggc tctgacggcg ttactgatgg 120
tgctgctcac atctgtggtc cagggcaggg ccactccaga gaattacgtg taccagggac 180
ggcaggaatg ctacgcgttt aatgggacac agcgcttcct ggagagatac atctacaacc 240
gggaggagta cgcgcgcttc gacagcgacg tgggggagtt ccgggcggtg acggagctgg 300
ggcggcctgc tgcggagtac tggaacagcc agaaggacat cctggaggag aagcgggcag 360
tgccggacag ggtatgcaga cacaactacg agctggacga ggccgtgacc ctgcagcgcc 420
gagtccagcc taaggtgaac gtttccccct ccaagaaggg gcccctgcag caccacaacc 480
tgcttgtctg ccacgtgaca gatttctacc caggcagcat tcaagtccga tggttcctga 540
atggacagga ggaaacagct ggggtcgtgt ccaccaacct gatccgtaat ggagactgga 600
ccttccagat cctggtgatg ctggaaatga ccccccagca gggagacgtc tacatctgcc 660
aagtggagca caccagcctg gacagtcctg tcaccgtgga gtggaaggca cagtctgatt 720
ctgcccagag taagacattg acgggagctg ggggcttcgt gctggggctc atcatctgtg 780
gagtgggcat cttcatgcac aggaggagca agaaagttca acgaggatct gcataaacag 840
ggttcctgac ctcaccgaaa agactaatgt gccttagaac aagcatttgc tgtgttttgt 900
taacacctgg ttccaggaca gaccctcagc ttcccaagag gatactgctg ccaagaagtt 960
gctctgaagt cagtttctat cgttctgctc tttgattcaa agcactgttt ctctcactgg 1020
gcctccaacc atgttccctt cttcttagca ccacaaataa tcaaaaccca acataagtgt 1080
ttgctttcct ttaaaaatat gcatcaaatc gtctctcatt acttttctct gagggtttta 1140
gtaaacagta ggagttaata aagaagttca ttttggttta cacgtaggaa agaagagaag 1200
catcaaagtg gagatatgtt aactattgta taatgtggcc tgttatacat gacactcttc 1260
tgaattgact gtatttcagt gagctgcccc caaatcaagt ttagtgccct catccattta 1320
tgtctcagac cgctattctt aactattcaa tggtgagcag actgcaaatc tgcctgatag 1380
gacccatatt cccacagcac taattcaaca tatatcttac tgagagcatg ttttatcatt 1440
accattaaga agttaaatga acatcagaat ttaaaatcat aaatataatc taatacactt 1500
t 1501
<210> 28
<211> 1697
<212> DNA
<213> 智人
<400> 28
atttccagtg ctagaggccc acagtttcag tctcatctgc ctccactcgg cctcagttcc 60
tcatcactgt tcctgtgctc acagtcatca attatagacc ccacaacatg cgccctgaag 120
acagaatgtt ccatatcaga gctgtgatct tgagagccct ctccttggct ttcctgctga 180
gtctccgagg agctggggcc atcaaggcgg accatgtgtc aacttatgcc gcgtttgtac 240
agacgcatag accaacaggg gagtttatgt ttgaatttga tgaagatgag atgttctatg 300
tggatctgga caagaaggag accgtctggc atctggagga gtttggccaa gccttttcct 360
ttgaggctca gggcgggctg gctaacattg ctatattgaa caacaacttg aataccttga 420
tccagcgttc caaccacact caggccacca acgatccccc tgaggtgacc gtgtttccca 480
aggagcctgt ggagctgggc cagcccaaca ccctcatctg ccacattgac aagttcttcc 540
caccagtgct caacgtcacg tggctgtgca acggggagct ggtcactgag ggtgtcgctg 600
agagcctctt cctgcccaga acagattaca gcttccacaa gttccattac ctgacctttg 660
tgccctcagc agaggacttc tatgactgca gggtggagca ctggggcttg gaccagccgc 720
tcctcaagca ctgggaggcc caagagccaa tccagatgcc tgagacaacg gagactgtgc 780
tctgtgccct gggcctggtg ctgggcctag tcggcatcat cgtgggcacc gtcctcatca 840
taaagtctct gcgttctggc catgaccccc gggcccaggg gaccctgtga aatactgtaa 900
aggtgacaaa atatctgaac agaagaggac ttaggagaga tctgaactcc agctgcccta 960
caaactccat ctcagctttt cttctcactt catgtgaaaa ctactccagt ggctgactga 1020
attgctgacc cttcaagctc tgtccttatc cattacctca aagcagtcat tccttagtaa 1080
agtttccaac aaatagaaat taatgacact ttggtagcac taatatggag attatccttt 1140
cattgagcct tttatcctct gttctccttt gaagaacccc tcactgtcac cttcccgaga 1200
ataccctaag accaataaat acttcagtat ttcagagcgg ggagactctg agtcattctt 1260
actggaagtc taggaccagg tcacatgtga atactatttc ttgaaggtgt ggtttcaacc 1320
tctgttgccg atgtggttac taaaggttct gatcccactt gaacggaaag gtctgaggat 1380
attgattcag tcctgggttt ttccctaact acaggatagg gtggggtaga gaaaggatat 1440
ttgggggaaa ttttacttgg atgaagattt tcttggatgt agtttgaaga ctgcagtgtt 1500
tgaagtctct gagggaagag atttggtctg tctggatcaa gatttcaggc agattaggat 1560
tccattcaca gcccctgagc ttccttccca aggctgtatt gtaattatag caatatttca 1620
tggaggattt ttctacatga taaactaaga gccaagaaat aaaattttta aaatgcccta 1680
aaaaaaaaaa aaaaaaa 1697
<210> 29
<211> 1312
<212> DNA
<213> 智人
<400> 29
ttttaatggt cagactctat tacaccccac attctctttt cttttattct tgtctgttct 60
gcctcactcc cgagctctac tgactcccaa cagagcgccc aagaagaaaa tggccataag 120
tggagtccct gtgctaggat ttttcatcat agctgtgctg atgagcgctc aggaatcatg 180
ggctatcaaa gaagaacatg tgatcatcca ggccgagttc tatctgaatc ctgaccaatc 240
aggcgagttt atgtttgact ttgatggtga tgagattttc catgtggata tggcaaagaa 300
ggagacggtc tggcggcttg aagaatttgg acgatttgcc agctttgagg ctcaaggtgc 360
attggccaac atagctgtgg acaaagccaa cctggaaatc atgacaaagc gctccaacta 420
tactccgatc accaatgtac ctccagaggt aactgtgctc acaaacagcc ctgtggaact 480
gagagagccc aacgtcctca tctgtttcat agacaagttc accccaccag tggtcaatgt 540
cacgtggctt cgaaatggaa aacctgtcac cacaggagtg tcagagacag tcttcctgcc 600
cagggaagac caccttttcc gcaagttcca ctatctcccc ttcctgccct caactgagga 660
cgtttacgac tgcagggtgg agcactgggg cttggatgag cctcttctca agcactggga 720
gtttgatgct ccaagccctc tcccagagac tacagagaac gtggtgtgtg ccctgggcct 780
gactgtgggt ctggtgggca tcattattgg gaccatcttc atcatcaagg gattgcgcaa 840
aagcaatgca gcagaacgca gggggcctct gtaaggcaca tggaggtgat ggtgtttctt 900
agagagaaga tcactgaaga aacttctgct ttaatggctt tacaaagctg gcaatattac 960
aatccttgac ctcagtgaaa gcagtcatct tcagcatttt ccagccctat agccacccca 1020
agtgtggata tgcctcttcg attgctccgt actctaacat ctagctggct tccctgtcta 1080
ttgccttttc ctgtatctat tttcctctat ttcctatcat tttattatca ccatgcaatg 1140
cctctggaat aaaacataca ggagtctgtc tctgctatgg aatgccccat ggggcatctc 1200
ttgtgtactt attgtttaag gtttcctcaa actgtgattt ttctgaacac aataaactat 1260
tttgatgatc ttgggtggaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 1312
<210> 30
<211> 2973
<212> DNA
<213> 智人
<400> 30
gggccgctct ctgacatcag agctgctgta gagcggagag gggcaggggt gaagggccac 60
ggtggtgcaa cccaccactt cctccaagga ggagctgaga ggaacaggaa gtgtcaggac 120
tttacgaccc gcgcctccag ctgaggtttc tagacgtgac ccagggcaga ctggtagcaa 180
agcccccacg cccagccagg agcaccgccg aggactccag cacaccgagg gacatgctgg 240
gcctgcgccc cccactgctc gccctggtgg ggctgctctc cctcgggtgc gtcctctctc 300
aggagtgcac gaagttcaag gtcagcagct gccgggaatg catcgagtcg gggcccggct 360
gcacctggtg ccagaagctg aacttcacag ggccggggga tcctgactcc attcgctgcg 420
acacccggcc acagctgctc atgaggggct gtgcggctga cgacatcatg gaccccacaa 480
gcctcgctga aacccaggaa gaccacaatg ggggccagaa gcagctgtcc ccacaaaaag 540
tgacgcttta cctgcgacca ggccaggcag cagcgttcaa cgtgaccttc cggcgggcca 600
agggctaccc catcgacctg tactatctga tggacctctc ctactccatg cttgatgacc 660
tcaggaatgt caagaagcta ggtggcgacc tgctccgggc cctcaacgag atcaccgagt 720
ccggccgcat tggcttcggg tccttcgtgg acaagaccgt gctgccgttc gtgaacacgc 780
accctgataa gctgcgaaac ccatgcccca acaaggagaa agagtgccag cccccgtttg 840
ccttcaggca cgtgctgaag ctgaccaaca actccaacca gtttcagacc gaggtcggga 900
agcagctgat ttccggaaac ctggatgcac ccgagggtgg gctggacgcc atgatgcagg 960
tcgccgcctg cccggaggaa atcggctggc gcaacgtcac gcggctgctg gtgtttgcca 1020
ctgatgacgg cttccatttc gcgggcgacg ggaagctggg cgccatcctg acccccaacg 1080
acggccgctg tcacctggag gacaacttgt acaagaggag caacgaattc gactacccat 1140
cggtgggcca gctggcgcac aagctggctg aaaacaacat ccagcccatc ttcgcggtga 1200
ccagtaggat ggtgaagacc tacgagaaac tcaccgagat catccccaag tcagccgtgg 1260
gggagctgtc tgaggactcc agcaatgtgg tccatctcat taagaatgct tacaataaac 1320
tctcctccag ggtcttcctg gatcacaacg ccctccccga caccctgaaa gtcacctacg 1380
actccttctg cagcaatgga gtgacgcaca ggaaccagcc cagaggtgac tgtgatggcg 1440
tgcagatcaa tgtcccgatc accttccagg tgaaggtcac ggccacagag tgcatccagg 1500
agcagtcgtt tgtcatccgg gcgctgggct tcacggacat agtgaccgtg caggttcttc 1560
cccagtgtga gtgccggtgc cgggaccaga gcagagaccg cagcctctgc catggcaagg 1620
gcttcttgga gtgcggcatc tgcaggtgtg acactggcta cattgggaaa aactgtgagt 1680
gccagacaca gggccggagc agccaggagc tggaaggaag ctgccggaag gacaacaact 1740
ccatcatctg ctcagggctg ggggactgtg tctgcgggca gtgcctgtgc cacaccagcg 1800
acgtccccgg caagctgata tacgggcagt actgcgagtg tgacaccatc aactgtgagc 1860
gctacaacgg ccaggtctgc ggcggcccgg ggagggggct ctgcttctgc gggaagtgcc 1920
gctgccaccc gggctttgag ggctcagcgt gccagtgcga gaggaccact gagggctgcc 1980
tgaacccgcg gcgtgttgag tgtagtggtc gtggccggtg ccgctgcaac gtatgcgagt 2040
gccattcagg ctaccagctg cctctgtgcc aggagtgccc cggctgcccc tcaccctgtg 2100
gcaagtacat ctcctgcgcc gagtgcctga agttcgaaaa gggccccttt gggaagaact 2160
gcagcgcggc gtgtccgggc ctgcagctgt cgaacaaccc cgtgaagggc aggacctgca 2220
aggagaggga ctcagagggc tgctgggtgg cctacacgct ggagcagcag gacgggatgg 2280
accgctacct catctatgtg gatgagagcc gagagtgtgt ggcaggcccc aacatcgccg 2340
ccatcgtcgg gggcaccgtg gcaggcatcg tgctgatcgg cattctcctg ctggtcatct 2400
ggaaggctct gatccacctg agcgacctcc gggagtacag gcgctttgag aaggagaagc 2460
tcaagtccca gtggaacaat gataatcccc ttttcaagag cgccaccacg acggtcatga 2520
accccaagtt tgctgagagt taggagcact tggtgaagac aaggccgtca ggacccacca 2580
tgtctgcccc atcacgcggc cgagacatgg cttgccacag ctcttgagga tgtcaccaat 2640
taaccagaaa tccagttatt ttccgccctc aaaatgacag ccatggccgg ccgggtgctt 2700
ctgggggctc gtcgggggga cagctccact ctgactggca cagtctttgc atggagactt 2760
gaggagggag ggcttgaggt tggtgaggtt aggtgcgtgt ttcctgtgca agtcaggaca 2820
tcagtctgat taaaggtggt gccaatttat ttacatttaa acttgtcagg gtataaaatg 2880
acatcccatt aattatattg ttaatcaatc acgtgtatag aaaaaaaata aaacttcaat 2940
acaggctgtc catggaaaaa aaaaaaaaaa aaa 2973
<210> 31
<211> 2755
<212> DNA
<213> 智人
<400> 31
cctacccgcg cgcaggccaa gttgctgaat caatggagcc ctccccaacc cgggcgttcc 60
ccagcgaggc ttccttccca tcctcctgac caccggggct tttcgtgagc tcgtctctga 120
tctcgcgcaa gagtgacaca caggtgttca aagacgcttc tggggagtga gggaagcggt 180
ttacgagtga cttggctgga gcctcagggg cgggcactgg cacggaacac accctgaggc 240
cagccctggc tgcccaggcg gagctgcctc ttctcccgcg ggttggtgga cccgctcagt 300
acggagttgg ggaagctctt tcacttcgga ggattgctca acaaccatgc tgggcatctg 360
gaccctccta cctctggttc ttacgtctgt tgctagatta tcgtccaaaa gtgttaatgc 420
ccaagtgact gacatcaact ccaagggatt ggaattgagg aagactgtta ctacagttga 480
gactcagaac ttggaaggcc tgcatcatga tggccaattc tgccataagc cctgtcctcc 540
aggtgaaagg aaagctaggg actgcacagt caatggggat gaaccagact gcgtgccctg 600
ccaagaaggg aaggagtaca cagacaaagc ccatttttct tccaaatgca gaagatgtag 660
attgtgtgat gaaggacatg gcttagaagt ggaaataaac tgcacccgga cccagaatac 720
caagtgcaga tgtaaaccaa actttttttg taactctact gtatgtgaac actgtgaccc 780
ttgcaccaaa tgtgaacatg gaatcatcaa ggaatgcaca ctcaccagca acaccaagtg 840
caaagaggaa ggatccagat ctaacttggg gtggctttgt cttcttcttt tgccaattcc 900
actaattgtt tgggtgaaga gaaaggaagt acagaaaaca tgcagaaagc acagaaagga 960
aaaccaaggt tctcatgaat ctccaacttt aaatcctgaa acagtggcaa taaatttatc 1020
tgatgttgac ttgagtaaat atatcaccac tattgctgga gtcatgacac taagtcaagt 1080
taaaggcttt gttcgaaaga atggtgtcaa tgaagccaaa ataggtgaga tcaagaatga 1140
caatgtccaa gacacagcag aacagaaagt tcaactgctt cgtaattggc atcaacttca 1200
tggaaagaaa gaagcgtatg acacattgat taaagatctc aaaaaagcca atctttgtac 1260
tcttgcagag aaaattcaga ctatcatcct caaggacatt actagtgact cagaaaattc 1320
aaacttcaga aatgaaatcc aaagcttggt ctagagtgaa aaacaacaaa ttcagttctg 1380
agtatatgca attagtgttt gaaaagattc ttaatagctg gctgtaaata ctgcttggtt 1440
ttttactggg tacattttat catttattag cgctgaagag ccaacatatt tgtagatttt 1500
taatatctca tgattctgcc tccaaggatg tttaaaatct agttgggaaa acaaacttca 1560
tcaagagtaa atgcagtggc atgctaagta cccaaatagg agtgtatgca gaggatgaaa 1620
gattaagatt atgctctggc atctaacata tgattctgta gtatgaatgt aatcagtgta 1680
tgttagtaca aatgtctatc cacaggctaa ccccactcta tgaatcaata gaagaagcta 1740
tgaccttttg ctgaaatatc agttactgaa caggcaggcc actttgcctc taaattacct 1800
ctgataattc tagagatttt accatatttc taaactttgt ttataactct gagaagatca 1860
tatttatgta aagtatatgt atttgagtgc agaatttaaa taaggctcta cctcaaagac 1920
ctttgcacag tttattggtg tcatattata caatatttca attgtgaatt cacatagaaa 1980
acattaaatt ataatgtttg actattatat atgtgtatgc attttactgg ctcaaaacta 2040
cctacttctt tctcaggcat caaaagcatt ttgagcagga gagtattact agagctttgc 2100
cacctctcca tttttgcctt ggtgctcatc ttaatggcct aatgcacccc caaacatgga 2160
aatatcacca aaaaatactt aatagtccac caaaaggcaa gactgccctt agaaattcta 2220
gcctggtttg gagatactaa ctgctctcag agaaagtagc tttgtgacat gtcatgaacc 2280
catgtttgca atcaaagatg ataaaataga ttcttatttt tcccccaccc ccgaaaatgt 2340
tcaataatgt cccatgtaaa acctgctaca aatggcagct tatacatagc aatggtaaaa 2400
tcatcatctg gatttaggaa ttgctcttgt cataccccca agtttctaag atttaagatt 2460
ctccttacta ctatcctacg tttaaatatc tttgaaagtt tgtattaaat gtgaatttta 2520
agaaataata tttatatttc tgtaaatgta aactgtgaag atagttataa actgaagcag 2580
atacctggaa ccacctaaag aacttccatt tatggaggat ttttttgccc cttgtgtttg 2640
gaattataaa atataggtaa aagtacgtaa ttaaataatg tttttggtaa aaaaaaaaaa 2700
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2755
<210> 32
<211> 1280
<212> DNA
<213> 智人
<400> 32
cctataactt ggaatgtggg tggaggggtt catagttctc cctgagtgag acttgcctgc 60
ttctctggcc cctggtcctg tcctgttctc cagcatggtg tgtctgaagc tccctggagg 120
ctcctgcatg acagcgctga cagtgacact gatggtgctg agctccccac tggctttgtc 180
tggggacacc cgaccacgtt tcctgtggca gcctaagagg gagtgtcatt tcttcaatgg 240
gacggagcgg gtgcggttcc tggacagata cttctataac caggaggagt ccgtgcgctt 300
cgacagcgac gtgggggagt tccgggcggt gacggagctg gggcggcctg acgctgagta 360
ctggaacagc cagaaggaca tcctggagca ggcgcgggcc gcggtggaca cctactgcag 420
acacaactac ggggttgtgg agagcttcac agtgcagcgg cgagtccaac ctaaggtgac 480
tgtatatcct tcaaagaccc agcccctgca gcaccacaac ctcctggtct gctctgtgag 540
tggtttctat ccaggcagca ttgaagtcag gtggttcctg aacggccagg aagagaaggc 600
tgggatggtg tccacaggcc tgatccagaa tggagactgg accttccaga ccctggtgat 660
gctggaaaca gttcctcgaa gtggagaggt ttacacctgc caagtggagc acccaagcgt 720
gacaagccct ctcacagtgg aatggagagc acggtctgaa tctgcacaga gcaagatgct 780
gagtggagtc gggggctttg tgctgggcct gctcttcctt ggggccgggc tgttcatcta 840
cttcaggaat cagaaaggac actctggact tcagccaaca ggattcctga gctgaaatgc 900
agatgaccac attcaaggaa gaactttctg ccccggcttt gcaggatgaa aagctttcct 960
gcttggcagt tattcttcca caagagaggg ctttctcagg acctggttgc tactggttcg 1020
gcaactgcag aaaatgtcct cccttgtggc ttcctcagct cctgcccttg gcctgaagtc 1080
ccagcattga tggcagcgcc tcatcttcaa cttttgtgct cccctttgcc taaaccgtat 1140
ggcctcccgt gcatctgtat tcaccctgta tgacaaacac attacattat taaatgtttc 1200
tcaaagatgg agttaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260
aaaaaaaaaa aaaaaaaaaa 1280
<210> 33
<211> 2398
<212> DNA
<213> 智人
<400> 33
ctgatataga gcaggcgccg cgggtcgcag cacagtgcgg agaccgcagc cccggagccc 60
gggccagggt ccacctgtcc ccgcagcgcc ggctcgcgcc ctcctgccgc agccaccgag 120
ccgccgtcta gcgccccgac ctcgccacca tgagagccct gctggcgcgc ctgcttctct 180
gcgtcctggt cgtgagcgac tccaaaggca gcaatgaact tcatcaagtt ccatcgaact 240
gtgactgtct aaatggagga acatgtgtgt ccaacaagta cttctccaac attcactggt 300
gcaactgccc aaagaaattc ggagggcagc actgtgaaat agataagtca aaaacctgct 360
atgaggggaa tggtcacttt taccgaggaa aggccagcac tgacaccatg ggccggccct 420
gcctgccctg gaactctgcc actgtccttc agcaaacgta ccatgcccac agatctgatg 480
ctcttcagct gggcctgggg aaacataatt actgcaggaa cccagacaac cggaggcgac 540
cctggtgcta tgtgcaggtg ggcctaaagc cgcttgtcca agagtgcatg gtgcatgact 600
gcgcagatgg aaaaaagccc tcctctcctc cagaagaatt aaaatttcag tgtggccaaa 660
agactctgag gccccgcttt aagattattg ggggagaatt caccaccatc gagaaccagc 720
cctggtttgc ggccatctac aggaggcacc gggggggctc tgtcacctac gtgtgtggag 780
gcagcctcat cagcccttgc tgggtgatca gcgccacaca ctgcttcatt gattacccaa 840
agaaggagga ctacatcgtc tacctgggtc gctcaaggct taactccaac acgcaagggg 900
agatgaagtt tgaggtggaa aacctcatcc tacacaagga ctacagcgct gacacgcttg 960
ctcaccacaa cgacattgcc ttgctgaaga tccgttccaa ggagggcagg tgtgcgcagc 1020
catcccggac tatacagacc atctgcctgc cctcgatgta taacgatccc cagtttggca 1080
caagctgtga gatcactggc tttggaaaag agaattctac cgactatctc tatccggagc 1140
agctgaaaat gactgttgtg aagctgattt cccaccggga gtgtcagcag ccccactact 1200
acggctctga agtcaccacc aaaatgctgt gtgctgctga cccacagtgg aaaacagatt 1260
cctgccaggg agactcaggg ggacccctcg tctgttccct ccaaggccgc atgactttga 1320
ctggaattgt gagctggggc cgtggatgtg ccctgaagga caagccaggc gtctacacga 1380
gagtctcaca cttcttaccc tggatccgca gtcacaccaa ggaagagaat ggcctggccc 1440
tctgagggtc cccagggagg aaacgggcac cacccgcttt cttgctggtt gtcatttttg 1500
cagtagagtc atctccatca gctgtaagaa gagactggga agataggctc tgcacagatg 1560
gatttgcctg tgccacccac cagggcgaac gacaatagct ttaccctcag gcataggcct 1620
gggtgctggc tgcccagacc cctctggcca ggatggaggg gtggtcctga ctcaacatgt 1680
tactgaccag caacttgtct ttttctggac tgaagcctgc aggagttaaa aagggcaggg 1740
catctcctgt gcatgggtga agggagagcc agctcccccg acggtgggca tttgtgaggc 1800
ccatggttga gaaatgaata atttcccaat taggaagtgt aacagctgag gtctcttgag 1860
ggagcttagc caatgtggga gcagcggttt ggggagcaga gacactaacg acttcagggc 1920
agggctctga tattccatga atgtatcagg aaatatatat gtgtgtgtat gtttgcacac 1980
ttgtgtgtgg gctgtgagtg taagtgtgag taagagctgg tgtctgattg ttaagtctaa 2040
atatttcctt aaactgtgtg gactgtgatg ccacacagag tggtctttct ggagaggtta 2100
taggtcactc ctggggcctc ttgggtcccc cacgtgacag tgcctgggaa tgtattattc 2160
tgcagcatga cctgtgacca gcactgtctc agtttcactt tcacatagat gtccctttct 2220
tggccagtta tcccttcctt ttagcctagt tcatccaatc ctcactgggt ggggtgagga 2280
ccactcctgt acactgaata tttatatttc actattttta tttatatttt tgtaatttta 2340
aataaaagtg atcaataaaa tgtgattttt ctgatgacaa aaaaaaaaaa aaaaaaaa 2398
<210> 34
<211> 3050
<212> DNA
<213> 智人
<400> 34
ggagtcagtg atttgaacga agtactttca gtttcatatt actctaaatc cattacaaat 60
ctgcttagct tctaaatatt tcatcaatga ggaaatccca gccctacaac ttcggaacag 120
tgaaatatta gtccagggat ccagtgagag acacagaagt gctagaagcc agtgctcgtg 180
aactaaggag aaaaagaaca gacaagggaa cagcctggac atggcatcag agatccacat 240
gacaggccca atgtgcctca ttgagaacac taatgggcga ctgatggcga atccagaagc 300
tctgaagatc ctttctgcca ttacacagcc tatggtggtg gtggcaattg tgggcctcta 360
ccgcacaggc aaatcctacc tgatgaacaa gctggctgga aagaaaaagg gcttctctct 420
gggctccacg gtgcagtctc acactaaagg aatctggatg tggtgtgtgc cccaccccaa 480
gaagccaggc cacatcctag ttctgctgga caccgagggt ctgggagatg tagagaaggg 540
tgacaaccag aatgactcct ggatcttcgc cctggccgtc ctcctgagca gcaccttcgt 600
gtacaatagc ataggaacca tcaaccagca ggctatggac caactgtact atgtgacaga 660
gctgacacat agaatccgat caaaatcctc acctgatgag aatgagaatg aggttgagga 720
ttcagctgac tttgtgagct tcttcccaga ctttgtgtgg acactgagag atttctccct 780
ggacttggaa gcagatggac aacccctcac accagatgag tacctgacat actccctgaa 840
gctgaagaaa ggtaccagtc aaaaagatga aacttttaac ctgcccagac tctgtatccg 900
gaaattcttc ccaaagaaaa aatgctttgt ctttgatcgg cccgttcacc gcaggaagct 960
tgcccagctc gagaaactac aagatgaaga gctggacccc gaatttgtgc aacaagtagc 1020
agacttctgt tcctacatct ttagtaattc caaaactaaa actctttcag gaggcatcca 1080
ggtcaacggg cctcgtctag agagcctggt gctgacctac gtcaatgcca tcagcagtgg 1140
ggatctgccg tgcatggaga acgcagtcct ggccttggcc cagatagaga actcagctgc 1200
agtgcaaaag gctattgccc actatgaaca gcagatgggc cagaaggtgc agctgcccac 1260
agaaaccctc caggagctgc tggacctgca cagggacagt gagagagagg ccattgaagt 1320
cttcatcagg agttccttca aagatgtgga ccatctattt caaaaggagt tagcggccca 1380
gctagaaaaa aagcgggatg acttttgtaa acagaatcag gaagcatcat cagatcgttg 1440
ctcagcttta cttcaggtca ttttcagtcc tctagaagaa gaagtgaagg cgggaattta 1500
ttcgaaacca gggggctatc gtctctttgt tcagaagcta caagacctga agaaaaagta 1560
ctatgaggaa ccgaggaagg ggatacaggc tgaagagatt ctgcagacat acttgaaatc 1620
caaggagtct atgactgatg caattctcca gacagaccag actctcacag aaaaagaaaa 1680
ggagattgaa gtggaacgtg tgaaagctga gtctgcacag gcttcagcaa aaatgttgca 1740
ggaaatgcaa agaaagaatg agcagatgat ggaacagaag gagaggagtt atcaggaaca 1800
cttgaaacaa ctgactgaga agatggagaa cgacagggtc cagttgctga aagagcaaga 1860
gaggaccctc gctcttaaac ttcaggaaca ggagcaacta ctaaaagagg gatttcaaaa 1920
agaaagcaga ataatgaaaa atgagataca ggatctccag acgaaaatga gacgacgaaa 1980
ggcatgtacc ataagctaaa gaccagagcc ttcctgtcac ccctaaccaa ggcataattg 2040
aaacaatttt agaatttgga acaagcgtca ctacatttga taataattag atcttgcatc 2100
ataacaccaa aagtttataa aggcatgtgg tacaatgatc aaaatcatgt tttttcttaa 2160
aaaaaaaaaa agactgtaaa ttgtgcaaca aagatgcatt tacctctgta tcaactcagg 2220
aaatctcata agctggtacc actcaggaga agtttattct tccagatgac cagcagtaga 2280
caaatggata ctgagcagag tcttaggtaa aagtcttggg aaatatttgg gcattggtct 2340
ggccaagtct acaatgtccc aatatcaagg acaaccaccc tagcttctta gtgaagacaa 2400
tgtacagtta tccgttagat caagactaca cggtctatga gcaataatgt gatttctgga 2460
cattgcccat gtataatcct cactgatgat ttcaagctaa agcaaaccac cttatacaga 2520
gatctagaat ctctttatgt tctccagagg aaggtggaag aaaccatggg caggagtagg 2580
aattgagtga taaacaattg ggctaatgaa gaaaacttct cttattgttc agttcatcca 2640
gattataact tcaatgggac actttagacc attagacaat tgacactgga ttaaacaaat 2700
tcacataatg ccaaatacac aatgtattta tagcaacgta taatttgcaa agatggactt 2760
taaaagatgc tgtgtaacta aactgaaata attcaattac ttattattta gaatgttaaa 2820
gcttatgata gtcttttcta actcttaaca ctcatacttg aaaactttct gagtttcccc 2880
agaagagaat atgggatttt ttttgacatt tttgactcat ttaataatgc tcttgtgttt 2940
acctagtata tgtagacttt gtcttatgtg tgaaaagtcc taggaaagtg gttgatgttt 3000
cttatagcaa ttaaaaatta tttttgaact gaaaatacaa tgtatttcac 3050
<210> 35
<211> 4146
<212> DNA
<213> 智人
<400> 35
cggagcctca gcgcccgccg cgtccctccc tccgcccctt tcgcccacac ctacccgccc 60
ccgccggccc ggctctcagt agcgtcgccc gaggctgcag cagcgcatcc cggggcatgg 120
cgcggcgggg gcgcggaggg ctcggttcgg agggggccgg gagcccgggc gccctggagt 180
gaggaggacc gggagctggc tctggaggct gcggaggcga cgccggagag aacgaagcct 240
cggctgggag cggatctttc gaagatggtt tggctgcctt ggagatttgg agatctgatg 300
ccacgatgag gactcacaca cggggggctc ccagtgtgtt tttcatatat ttgctttgct 360
ttgtgtcagc ctacatcacc gacgagaacc cagaagttat gattcccttc accaatgcca 420
actacgacag ccatcccatg ctgtacttct ccagggcaga agtggcggag ctgcagctca 480
gggctgccag ctcgcacgag cacattgcag cccgcctcac ggaggctgtg cacacgatgc 540
tgtccagccc cttggaatac ctccctccct gggatcccaa ggactacagt gcccgctgga 600
atgaaatttt tggaaacaac ttgggtgcct tggcaatgtt ctgtgtgctg tatcctgaga 660
acattgaagc ccgagacatg gccaaagact acatggagag gatggcagcg cagcctagtt 720
ggttggtgaa agatgctcct tgggatgagg tcccgcttgc tcactccctg gttggttttg 780
ccactgctta tgacttcttg tacaactacc tgagcaagac acaacaggag aagtttcttg 840
aagtgattgc caatgcctca gggtatatgt atgaaacttc atacaggaga ggatggggat 900
ttcaatacct gcacaatcat cagcccacca actgtatggc tttgctcacg ggaagcctag 960
tcctgatgaa tcaaggatat cttcaagaag cctacttatg gaccaaacaa gttctgacca 1020
tcatggagaa atctctggtc ttgctcaggg aggtgacgga tggctccctc tatgaaggag 1080
ttgcgtatgg cagctacacc actagatcac tcttccaata catgtttctc gtccagaggc 1140
acttcaacat caaccacttt ggccatccgt ggcttaaaca acactttgca tttatgtata 1200
gaaccatcct gccagggttt caaaggactg tggctattgc ggactcaaat tacaactggt 1260
tttatggtcc agaaagccaa ttagtgttcc ttgataaatt tgtcatgcgt aatggcagtg 1320
gtaactggct agctgaccaa atcagaagga accgtgtggt ggaaggtcca ggaacaccat 1380
ccaaagggca gcgctggtgc actctgcaca cagaatttct ctggtatgat ggcagcttga 1440
aatcggttcc tcctccagac tttggcaccc ctacactgca ttattttgaa gactggggtg 1500
tcgtgactta tggaagtgca ctacctgcag aaatcaatag atctttcctt tccttcaagt 1560
ctggaaaact ggggggacgt gcaatatatg acattgtcca cagaaacaaa tacaaagatt 1620
ggatcaaagg atggagaaat tttaatgcag ggcatgaaca tcctgatcaa aactcattta 1680
cttttgctcc caatggtgtg cctttcatta ctgaggctct gtacgggcca aagtacacct 1740
tcttcaacaa tgttttgatg ttttccccag ctgtgtcaaa gagctgcttt tctccctggg 1800
tgggtcaggt cacagaagac tgctcatcaa aatggtctaa atacaagcat gacctggcag 1860
ctagttgtca ggggagggtg gttgcagcag aggagaaaaa tggggtggtt ttcatccgag 1920
gagaaggtgt gggagcttat aacccccagc tcaacctgaa gaatgttcag aggaatctca 1980
tcctcctaca tccacagctg cttctccttg tagaccaaat acacctggga gaggagagtc 2040
ccttggagac agcagcgagc ttcttccata atgtggatgt tccttttgag gagactgtgg 2100
tagatggtgt ccatggggct ttcatcaggc agagagatgg tctctataaa atgtactgga 2160
tggacgatac tggctacagc gagaaagcaa cctttgcctc agtgacatat cctcggggct 2220
atccctacaa cgggacaaac tatgtgaatg tcaccatgca cctccgaagt cccatcacca 2280
gggcagctta cctcttcata gggccatcta tagatgttca gagcttcact gtccacggag 2340
actctcagca actggatgtg ttcatagcca ccagcaaaca tgcctacgcc acatacctgt 2400
ggacaggtga ggccacagga cagtctgcct ttgcacaggt cattgctgat cgtcacaaaa 2460
ttctgtttga ccggaattca gccatcaaga gcagcattgt ccctgaggtg aaggactatg 2520
ctgctattgt ggaacagaac ttgcagcatt ttaaaccagt gtttcagctg ctggagaagc 2580
agatactgtc ccgagtccgg aacacagcta gctttaggaa gactgctgaa cgcctgctga 2640
gattttcaga taagagacag actgaggagg ccattgacag gatttttgcc atatcacagc 2700
aacagcagca gcaaagcaag tcaaagaaaa accgaagggc aggcaaacgc tataaatttg 2760
tggatgctgt ccctgatatt tttgcacaga ttgaagtcaa tgagaaaaag attagacaga 2820
aagctcagat tttggcacag aaagaactac ccatagatga agatgaagaa atgaaagacc 2880
ttttagattt tgcagatgta acatacgaga aacataaaaa tgggggcttg attaaaggcc 2940
ggtttggaca ggcacggatg gtgacaacta cacacagcag ggccccatca ctgtctgctt 3000
cctataccag gttgttcctg attctgaaca ttgctatttt ctttgtcatg ttggcaatgc 3060
aactgactta tttccagagg gcccagagcc tacatggcca aagatgtctt tatgcagttc 3120
ttctcataga tagctgtatt ttattatggt tgtactcttc ttgttcccaa tcacagtgtt 3180
agcactgaag ctataaatta cctggtcatt ttgtgatcac aagagtctat gcaaaaaaaa 3240
aaatttcttt accccagatt atcagatttt tttccctcag attcatttta acaaattaag 3300
ggaagatatt ttgacacaag aaagcaggaa cgtggagaaa ttggagcagg aaaagaaatt 3360
atcaaagcaa tagaaatagc ttggtggtcc tatggtgttt ttggaagtat ttggcattgc 3420
taattgagca gtccatatag tactactttt agaagaaaca aaaagtctat tttttaaagt 3480
aatgtttttt cttatgagaa aaaggtttag atagaattgg gttttattaa tattaattta 3540
atgctattag caatttccat atactatatt gtggaaaaga ctgaagaata caattctgag 3600
aaatataaaa aaattttaat ggtatactca tgttgaaaga taaatgttgc taagtcctgg 3660
tatgatggtg tgagcttcct tggggaagta cttcttgagt tatgtaacta acaggatgtt 3720
ttactacaga tctggatggc tattcagata acatggcaaa aaatgatagc agaagatcat 3780
taaaaactta aaatatattt tattagaaaa catttatcta tgaatgaata tttccttgat 3840
gctggtctct gcacacatat gcttggttac ttgcatgcat tcattggttg ttcaataagt 3900
gagatgatta cagataatac tgtattttcc ttatatggaa aaccgttata gacccaataa 3960
caactaaacc tttcaaaaga aaatattttc tattatgaat gttgattttc ataccaaaga 4020
agatggagag tctaaaattt ggatatgatt cttatgtttt tttaatagaa aaccttcttc 4080
aagtttattt tcctaaataa acatcataat tgtgaatttt ctctagtaaa aaaaaaaaaa 4140
aaaaaa 4146
<210> 36
<211> 1236
<212> DNA
<213> 智人
<400> 36
caggcgctga cgaggagccc ggctgaggga ggatgcgccg ctgacgcctg cgggagccgc 60
gcgcctgggg cgggaggatg ctccagaggg gcctctggcc gtggcgcacg cggctgctgc 120
cgacccctgg cacctggcgc ccagcgcgcc cgtggccgct gccgcctccg ccccaggttt 180
tgcgtgtgaa gctgtgtgga aatgtgaaat actaccagtc acaccattat agtaccgtgg 240
tgccacctga tgaaataaca gttatttata gacatggcct tcccttggta acacttacct 300
tgccatctag aaaagaacgt tgtcaattcg tagtcaaacc aatgttgtca acagttggtt 360
cattccttca ggacctacaa aatgaagata agggtatcaa aactgcagcc atcttcacag 420
cagatggcaa catgatttca gcttctacct tgatggatat tttgctaatg aatgatttta 480
aacttgtcat taataaaata gcatatgatg tgcagtgtcc aaagagagaa aaaccaagta 540
atgagcacac tgctgagatg gaacacatga aatccttggt tcacagacta tttacaatct 600
tgcatttaga agagtctcag aaaaagagag agcaccattt actggagaaa attgaccacc 660
tgaaggaaca gctgcagccc cttgaacagg tgaaagctgg aatagaagct cattcggaag 720
ccaaaaccag tggactcctg tgggctggat tggcactgct gtccattcag ggtggggcac 780
tggcctggct cacgtggtgg gtgtactcct gggatatcat ggagccagtt acatacttca 840
tcacatttgc aaattctatg gtcttttttg catactttat agtcactcga caggattata 900
cttactcagc tgttaagagt aggcaatttc ttcagttctt ccacaagaaa tcaaagcaac 960
agcactttga tgtgcagcaa tacaacaagt taaaagaaga ccttgctaag gctaaagaat 1020
ccctgaaaca ggcgcgtcat tctctctgtt tgcaaatgca agtagaagaa ctcaatgaaa 1080
agaattaatc ttacagtttt aaatgtcgtc agattttcca ttatgtattg attttgcaac 1140
ttaggatgtt tttgagtccc atggttcatt ttgattgttt aatctttgtt attaaattct 1200
tgtaaaacag aaaaaaaaaa aaaaaaaaaa aaaaaa 1236
<210> 37
<211> 2805
<212> DNA
<213> 智人
<400> 37
ctccttgcac gggccggccc agcttccccg cccctggcgt ccgctccctc ccgctcgcag 60
cttacttaac ctggcccggg cggcggaggc gctctcactt ccctggagcc gcccgcttgc 120
ccgtcggtcg ctagctcgct cggtgcgcgt cgtcccgctc catggcgctc ttcgtgcggc 180
tgctggctct cgccctggct ctggccctgg gccccgccgc gaccctggcg ggtcccgcca 240
agtcgcccta ccagctggtg ctgcagcaca gcaggctccg gggccgccag cacggcccca 300
acgtgtgtgc tgtgcagaag gttattggca ctaataggaa gtacttcacc aactgcaagc 360
agtggtacca aaggaaaatc tgtggcaaat caacagtcat cagctacgag tgctgtcctg 420
gatatgaaaa ggtccctggg gagaagggct gtccagcagc cctaccactc tcaaaccttt 480
acgagaccct gggagtcgtt ggatccacca ccactcagct gtacacggac cgcacggaga 540
agctgaggcc tgagatggag gggcccggca gcttcaccat cttcgcccct agcaacgagg 600
cctgggcctc cttgccagct gaagtgctgg actccctggt cagcaatgtc aacattgagc 660
tgctcaatgc cctccgctac catatggtgg gcaggcgagt cctgactgat gagctgaaac 720
acggcatgac cctcacctct atgtaccaga attccaacat ccagatccac cactatccta 780
atgggattgt aactgtgaac tgtgcccggc tgctgaaagc cgaccaccat gcaaccaacg 840
gggtggtgca cctcatcgat aaggtcatct ccaccatcac caacaacatc cagcagatca 900
ttgagatcga ggacaccttt gagacccttc gggctgctgt ggctgcatca gggctcaaca 960
cgatgcttga aggtaacggc cagtacacgc ttttggcccc gaccaatgag gccttcgaga 1020
agatccctag tgagactttg aaccgtatcc tgggcgaccc agaagccctg agagacctgc 1080
tgaacaacca catcttgaag tcagctatgt gtgctgaagc catcgttgcg gggctgtctg 1140
tagagaccct ggagggcacg acactggagg tgggctgcag cggggacatg ctcactatca 1200
acgggaaggc gatcatctcc aataaagaca tcctagccac caacggggtg atccactaca 1260
ttgatgagct actcatccca gactcagcca agacactatt tgaattggct gcagagtctg 1320
atgtgtccac agccattgac cttttcagac aagccggcct cggcaatcat ctctctggaa 1380
gtgagcggtt gaccctcctg gctcccctga attctgtatt caaagatgga acccctccaa 1440
ttgatgccca tacaaggaat ttgcttcgga accacataat taaagaccag ctggcctcta 1500
agtatctgta ccatggacag accctggaaa ctctgggcgg caaaaaactg agagtttttg 1560
tttatcgtaa tagcctctgc attgagaaca gctgcatcgc ggcccacgac aagaggggga 1620
ggtacgggac cctgttcacg atggaccggg tgctgacccc cccaatgggg actgtcatgg 1680
atgtcctgaa gggagacaat cgctttagca tgctggtagc tgccatccag tctgcaggac 1740
tgacggagac cctcaaccgg gaaggagtct acacagtctt tgctcccaca aatgaagcct 1800
tccgagccct gccaccaaga gaacggagca gactcttggg agatgccaag gaacttgcca 1860
acatcctgaa ataccacatt ggtgatgaaa tcctggttag cggaggcatc ggggccctgg 1920
tgcggctaaa gtctctccaa ggtgacaagc tggaagtcag cttgaaaaac aatgtggtga 1980
gtgtcaacaa ggagcctgtt gccgagcctg acatcatggc cacaaatggc gtggtccatg 2040
tcatcaccaa tgttctgcag cctccagcca acagacctca ggaaagaggg gatgaacttg 2100
cagactctgc gcttgagatc ttcaaacaag catcagcgtt ttccagggct tcccagaggt 2160
ctgtgcgact agcccctgtc tatcaaaagt tattagagag gatgaagcat tagcttgaag 2220
cactacagga ggaatgcacc acggcagctc tccgccaatt tctctcagat ttccacagag 2280
actgtttgaa tgttttcaaa accaagtatc acactttaat gtacatgggc cgcaccataa 2340
tgagatgtga gccttgtgca tgtgggggag gagggagaga gatgtacttt ttaaatcatg 2400
ttccccctaa acatggctgt taacccactg catgcagaaa cttggatgtc actgcctgac 2460
attcacttcc agagaggacc tatcccaaat gtggaattga ctgcctatgc caagtccctg 2520
gaaaaggagc ttcagtattg tggggctcat aaaacatgaa tcaagcaatc cagcctcatg 2580
ggaagtcctg gcacagtttt tgtaaagccc ttgcacagct ggagaaatgg catcattata 2640
agctatgagt tgaaatgttc tgtcaaatgt gtctcacatc tacacgtggc ttggaggctt 2700
ttatggggcc ctgtccaggt agaaaagaaa tggtatgtag agcttagatt tccctattgt 2760
gacagagcca tggtgtgttt gtaataataa aaccaaagaa acata 2805
<210> 38
<211> 1227
<212> DNA
<213> 智人
<400> 38
ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60
gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120
attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggagt acctctctct 180
agaactgtac gctgtacctg catcagcatt agtaatcaac ctgttaatcc aaggtcttta 240
gaaaaacttg aaattattcc tgcaagccaa ttttgtccac gtgttgagat cattgctaca 300
atgaaaaaga agggtgagaa gagatgtctg aatccagaat cgaaggccat caagaattta 360
ctgaaagcag ttagcaagga aaggtctaaa agatctcctt aaaaccagag gggagcaaaa 420
tcgatgcagt gcttccaagg atggaccaca cagaggctgc ctctcccatc acttccctac 480
atggagtata tgtcaagcca taattgttct tagtttgcag ttacactaaa aggtgaccaa 540
tgatggtcac caaatcagct gctactactc ctgtaggaag gttaatgttc atcatcctaa 600
gctattcagt aataactcta ccctggcact ataatgtaag ctctactgag gtgctatgtt 660
cttagtggat gttctgaccc tgcttcaaat atttccctca cctttcccat cttccaaggg 720
tactaaggaa tctttctgct ttggggttta tcagaattct cagaatctca aataactaaa 780
aggtatgcaa tcaaatctgc tttttaaaga atgctcttta cttcatggac ttccactgcc 840
atcctcccaa ggggcccaaa ttctttcagt ggctacctac atacaattcc aaacacatac 900
aggaaggtag aaatatctga aaatgtatgt gtaagtattc ttatttaatg aaagactgta 960
caaagtagaa gtcttagatg tatatatttc ctatattgtt ttcagtgtac atggaataac 1020
atgtaattaa gtactatgta tcaatgagta acaggaaaat tttaaaaata cagatagata 1080
tatgctctgc atgttacata agataaatgt gctgaatggt tttcaaaata aaaatgaggt 1140
actctcctgg aaatattaag aaagactatc taaatgttga aagatcaaaa ggttaataaa 1200
gtaattataa ctaagaaaaa aaaaaaa 1227
<210> 39
<211> 586
<212> DNA
<213> 智人
<400> 39
agttaaaagg gtgggagcgt ccgggggccc atctctctcg ggtggagtct tctgacagct 60
ggtgcgcctg cccgggaaca tcctcctgga ctcaatcatg gcttgtggtc tggtcgccag 120
caacctgaat ctcaaacctg gagagtgcct tcgagtgcga ggcgaggtgg ctcctgacgc 180
taagagcttc gtgctgaacc tgggcaaaga cagcaacaac ctgtgcctgc acttcaaccc 240
tcgcttcaac gcccacggcg acgccaacac catcgtgtgc aacagcaagg acggcggggc 300
ctgggggacc gagcagcggg aggctgtctt tcccttccag cctggaagtg ttgcagaggt 360
gtgcatcacc ttcgaccagg ccaacctgac cgtcaagctg ccagatggat acgaattcaa 420
gttccccaac cgcctcaacc tggaggccat caactacatg gcagctgacg gtgacttcaa 480
gatcaaatgt gtggcctttg actgaaatca gccagcccat ggcccccaat aaaggcagct 540
gcctctgctc cctctgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 586
<210> 40
<211> 2078
<212> DNA
<213> 智人
<400> 40
ttttccgccc ggctcccggc aagggtcccc cgactggcgc ccgcgcgtcc tccctcggct 60
gctgcaggcc gggccgcggc gtcgagcggg ggcggcgggg cggggcccgc agccattggc 120
gagcggcggg gcgggggcgg gggcgcggag ggtcggcccc gggacgcgcg cagccggccc 180
gcagttgccg ctgtcgtccg cagagccagt tcctagcgca gagccgcgcc cgccatgagg 240
gagatcgtgc acatccaggc gggccagtgc gggaaccaga tcggcaccaa gttttgggaa 300
gtgatcagcg atgagcacgg catcgacccg gccggaggct acgtgggaga ctcggcgctg 360
cagctggaga gaatcaacgt ctactacaat gagtcatcgt ctcagaaata tgtgcccagg 420
gccgccctgg tggacttaga gccaggcacc atggacagcg tgcggtctgg gccttttggg 480
cagcttttcc ggcctgacaa cttcatcttt ggccagacgg gtgcagggaa caactgggcg 540
aaagggcact acacggaggg cgcggagctg gtggacgcag tgctggacgt ggtgcggaag 600
gagtgcgagc actgcgactg cctgcagggc ttccagctca cgcactcgct gggcggcggc 660
acgggctcag gcatgggcac gctgctcatc agcaagatcc gtgaggagtt cccggaccgc 720
atcatgaaca ccttcagcgt catgccctcg cccaaggtgt cggacacggt ggtggagccc 780
tacaatgcca cactgtcggt gcaccagctg gtggagaata cagacgagac ctactgcatc 840
gacaacgagg cgctctatga catctgcttc cgcactctga agctgacaac gcccacctac 900
ggggacctca accacctggt gtccgccacc atgagtgggg tcaccacctc gctgcgcttc 960
ccgggccagc tcaatgctga cctgcgcaag ctggcggtga acatggtgcc cttcccgcgc 1020
ctgcacttct tcatgcctgg cttcgcgccg ctcaccagcc gcggcagcca gcagtaccgg 1080
gccctgaccg tgcccgagct cacccagcag atgttcgacg ccaggaacat gatggccgcc 1140
tgcgatccgc gccatggccg ctacctgacc gtggccaccg tgttccgcgg gcccatgtcc 1200
atgaaggagg tggacgagca gatgctggcc atccagagta agaacagcag ctacttcgtg 1260
gagtggattc ccaacaacgt gaaggtggcc gtgtgcgaca tcccgccccg cggcctgaag 1320
atggcctcca ccttcatcgg caacagcacg gccatccagg agctgttcaa gcgcatctcc 1380
gagcagttct cagccatgtt ccggcgcaag gccttcctgc actggttcac gggtgagggc 1440
atggatgaaa tggagttcac cgaggcggag agcaacatga acgacctggt atccgagtac 1500
cagcagtacc aggatgccac cgccaatgac ggggaggaag cttttgagga tgaggaagag 1560
gagatcgatg gatagtcgga atagagccgc cccaactcag atcctacaac acgcaagttc 1620
cttcttgaac cctggtgcct cctaccctat ggccctgaat ggtgcactgg tttaattgtg 1680
ttggtgtcgg cccctcacaa atgcagccaa gtcatgtaat tagtcatctg gaacaaagac 1740
taaaaacagc agagaattgc gggttctacc cagtcagaag atcacaccat ggagactttc 1800
tactagagga cttgaaagag aactgagggg ccacaaaata aacttcacct tccattaagt 1860
gttcaagcat gtctgcaaat taggagggag ttagaaacag tctttttcat cctttgtgat 1920
gaagcctgaa attgtgccgt gttgccttat atgaatatgc agtatgggac tttgaaataa 1980
tgattcataa taaaatacta aacgtgtgtc ttcatctctc tagccatgtg cataaatgac 2040
gtaagttact ttgtatggtt aaaaaaaaaa aaaaaaaa 2078
<210> 41
<211> 1623
<212> DNA
<213> 智人
<400> 41
ctggtggcat agggcagaca cgcctgcaga cattctctgg gaaagggcag cagcagccag 60
gtgtggcagt gacagggagg tgtgaatgag gcaggatgaa ctggacaggt ttgtacacct 120
tgctcagtgg cgtgaaccgg cattctactg ccattggccg agtatggctc tcggtcatct 180
tcatcttcag aatcatggtg ctggtggtgg ctgcagagag tgtgtggggt gatgagaaat 240
cttccttcat ctgcaacaca ctccagcctg gctgcaacag cgtttgctat gaccaattct 300
tccccatctc ccatgtgcgg ctgtggtccc tgcagctcat cctagtttcc accccagctc 360
tcctcgtggc catgcacgtg gctcaccagc aacacataga gaagaaaatg ctacggcttg 420
agggccatgg ggacccccta cacctggagg aggtgaagag gcacaaggtc cacatctcag 480
ggacactgtg gtggacctat gtcatcagcg tggtgttccg gctgttgttt gaggccgtct 540
tcatgtatgt cttttatctg ctctaccctg gctatgccat ggtgcggctg gtcaagtgcg 600
acgtctaccc ctgccccaac acagtggact gcttcgtgtc ccgccccacc gagaaaaccg 660
tcttcaccgt cttcatgcta gctgcctctg gcatctgcat catcctcaat gtggccgagg 720
tggtgtacct catcatccgg gcctgtgccc gccgagccca gcgccgctcc aatccacctt 780
cccgcaaggg ctcgggcttc ggccaccgcc tctcacctga atacaagcag aatgagatca 840
acaagctgct gagtgagcag gatggctccc tgaaagacat actgcgccgc agccctggca 900
ccggggctgg gctggctgaa aagagcgacc gctgctcggc ctgctgatgc cacataccag 960
gcaacctccc atcccacccc cgaccctgcc ctgggcgagc ccctccttct cccctgccgg 1020
tgcacaggcc tctgcctgct ggggattact cgatcaaaac cttccttccc tggctacttc 1080
ccttcctccc ggggccttcc ttttgaggag ctggaggggt ggggagctag aggccaccta 1140
tgccagtgct caaggttact gggagtgtgg gctgcccttg ttgcctgcac ccttccctct 1200
tccctctccc tctctctggg accactgggt acaagagatg ggatgctccg acagcgtctc 1260
caattatgaa actaatctta accctgtgct gtcagatacc ctgtttctgg agtcacatca 1320
gtgaggaggg atgtgggtaa gaggagcaga gggcaggggt gctgtggaca tgtgggtgga 1380
gaagggaggg tggccagcac tagtaaagga ggaatagtgc ttgctggcca caaggaaaag 1440
gaggaggtgt ctggggtgag ggagttaggg agagagaagc aggcagataa gttggagcag 1500
gggttggtca aggccacctc tgcctctagt ccccaaggcc tctctctgcc tgaaatgtta 1560
cacattaaac aggattttac agtaaatgaa gaggtggctt gtgaaaaaaa aaaaaaaaaa 1620
aaa 1623
<210> 42
<211> 3310
<212> DNA
<213> 智人
<400> 42
gcgcgggccg ggccgggcgg cggcggcggc accatgagcg gccggaagcg cagcttcacc 60
ttcggggcct acggcggggt ggacaagtcc ttcacttctc gccggagtgt gtggaggagc 120
gatgggcaga accagcactt ccctcaggca ctagacctgt cacgagtgaa cttagttccc 180
tcctatactc cttcactcta ccctaagaac acagatctat ttgagatgat tgagaagatg 240
cagggaagca ggatggatga acaacgctgc tccttcccgc cgcccctcaa aacagaggag 300
gactacattc catacccgag cgtgcacgag gtcttggggc gagaaggacc cttccccctc 360
atcctgctgc cccagtttgg gggctactgg attgagggca ccaaccacga aatcaccagc 420
atccccgaga cagagccact gcagtcgccc acaaccaagg tgaagctcga gtgcaacccc 480
acagcccgca tctaccggaa gcactttctc ggcaaggagc atttcaatta ctactcactg 540
gacgctgccc tcggccacct tgtcttctca ctcaagtacg atgtcatcgg ggaccaagag 600
cacctgcggc tgctgctcag gaccaagtgc cggacatacc atgatgtcat ccccatctcc 660
tgcctcaccg agttccctaa tgttgtccag atggcaaagt tggtgtgtga agacgtcaat 720
gtggatcggt tctatcctgt gctctacccc aaggcttccc ggctcatcgt cacctttgac 780
gagcatgtca tcagcaataa cttcaagttt ggcgtcattt atcagaagct tgggcagacc 840
tccgaggaag aactcttcag caccaatgag gaaagtcccg ctttcgtgga gttccttgaa 900
tttcttggcc agaaggtcaa actgcaggac tttaaggggt tccgaggagg cctggacgtg 960
acccacgggc agacggggac cgaatctgtg tactgcaact tccgcaacaa ggagatcatg 1020
tttcacgtgt ccaccaagct gccatacacg gaaggggacg cccagcagtt gcagcggaag 1080
cggcacatcg ggaacgacat cgtggctgtg gtcttccagg atgagaacac tcctttcgtg 1140
cccgacatga tcgcgtccaa cttcctgcat gcctacgtcg tggtgcaggc tgagggcggg 1200
ggccctgatg gccccctcta caaggtctct gtcactgcaa gagatgatgt gcccttcttt 1260
ggaccccccc tcccggaccc cgctgtgttc aggaaggggc ctgagttcca ggaatttttg 1320
ctgacaaagc tgatcaatgc tgaatatgcc tgctacaagg cagagaagtt tgccaaactg 1380
gaggagcgga cgcgggccgc cctcctggag acgctctatg aggaactaca catccacagc 1440
cagtccatga tgggcttggg cggcgacgag gacaagatgg agaatggcag tgggggcggc 1500
ggcttctttg agtctttcaa gcgggtcatc cggagccgca gccagtccat ggatgccatg 1560
gggctgagca acaagaagcc caacaccgtg tccaccagcc acagcgggag cttcgcgccc 1620
aacaaccccg acctggccaa ggcggctgga atatcactga ttgtccctgg gaagagcccc 1680
acgaggaaga agtcgggccc gttcggctcc cgccgcagca gcgccattgg catcgagaac 1740
atacaggagg tgcaggagaa gagggagagc cctccggctg gtcagaagac cccagacagc 1800
gggcacgtct cacaggagcc caagtcggag aactcatcca ctcagagctc cccagagatg 1860
cccacgacca agaacagagc ggagaccgca gcgcagagag cagaggcgct caaggacttc 1920
tcccgctcct cgtccagtgc cagcagcttc gccagcgtgg tggaggagac ggagggtgtg 1980
gacggagagg acacaggcct ggagagcgtg tcatcctcag gaacacccca caagcgggac 2040
tccttcatct atagcacgtg gctggaggac agtgtcagca ccactagtgg gggcagctcc 2100
ccaggcccct ctcgatcacc ccacccagac gccggcaagt tgggggaccc tgcgtgtccc 2160
gagatcaaga tccagctgga agcatctgag cagcacatgc cccagctggg ctgttagccg 2220
ggccaccccc tctgaaggtg aaactgagca gatgaggcca cagaagcaca aggggaaggt 2280
gccgtgtcaa gcccaggcag acgagacctc tgccctgaag accaacacca gcccgtgggc 2340
tgccccctgc ctccccaccc tccccatggc ccacccatct gggctgtctc tgcagggcag 2400
agccgtccag acctgggatc agggaagctg ctggcatcgt ccccaccccc agcctggggg 2460
tctgggctgg ggcagggatt gctcagtgga agcaggactg ggggtctggc ttgccccctc 2520
cctgggcctc catcacccct gagcatccct ctggactcag agggaacaag gtgggagaga 2580
gagtttgaga cagctccgtg tggagagctt agcccctgga ggcagcacaa ggaggatgtg 2640
atatgtgggg gagtgagcac tgggttggga gccgggtcct ggtttccaat ttgggttctg 2700
ctgtgtgact ctgggcaagt cactctccct ctctgggcat gtctgctaca aatggacaag 2760
attatttcag aggtcactga agactgtgat tacatgcacc tgccttagaa ggtaggattt 2820
tcttcccagg gacctcctat caccctaccc tgcttcttga ggtccctgga gccccaggtg 2880
ggctgagggg cagggagccg gctgtgccca gtatgcctcc tggaccctcc agttctgcca 2940
caggtctgcc gatgccctgt ccactgccta cacatgacag acaagtaacc ccctcatggg 3000
ggatggggac ctacctggct cctcagccag cacccagctt aacccctgcc atcccatgct 3060
gggccctcca ggccaagagt ctcagctggc cgagagtcca ggccttgcct cccccgaccg 3120
ccatggaggg ggcagcccgg cacagctgct gggagccctt gtgtgtctgg tcacactttt 3180
taggcgtcac gccaaaggcc agcctcctgg ccccaatacc cattttggaa gcccctgtgg 3240
ccgtgtggat gtcggtaaca gttgtataaa ataaattcta tttatcgcta ttgtaaaaaa 3300
aaaaaaaaaa 3310
<210> 43
<211> 5665
<212> DNA
<213> 智人
<400> 43
gcgcagcccg cagaggcgct gcggcccgtg cagccccgga ggcccctcgc ggagaaggcg 60
gcggcggagg agaggccgag ttaccgcccg ccgcccgcgc ccccccaacc ccgccgccgc 120
cgccgccgcc gccactgccc cccctccccg cggcgccgca tcttgaatgg aaacatggcg 180
gtgccggctc ggacctgcgg cgcctctcgg cccggcccag cgcggactgc gcgcccctgg 240
cccggctgcg gcccccaccc tggccccggc acccggcgcc cgacgtccgg gcccccgcgc 300
ccgctgtggc tgctgctgcc gcttctaccg ctgctcgccg cccccggcgc ctctgcctac 360
agcttccccc agcagcacac gatgcagcac tgggcccggc gtctggagca ggaggtcgac 420
ggcgtgatgc ggatttttgg aggcgtccag cagctccgtg agatttacaa ggacaaccgg 480
aacctgttcg aggtacagga gaatgagcct cagaagttgg tggagaaggt ggcaggggac 540
attgagagcc ttctggacag gaaggtgcag gccctgaaga gactggctga tgctgcagag 600
aacttccaga aagcacaccg ctggcaggac aacatcaagg aggaagacat cgtgtactat 660
gacgccaagg ctgacgctga gctggacgac cctgagagtg aggatgtgga aagggggtct 720
aaggccagca ccctaaggct ggacttcatc gaggacccaa acttcaagaa caaggtcaac 780
tattcatacg cggctgtaca gatccctacg gacatctaca aaggctccac tgtcatcctc 840
aatgagctca actggacaga ggccctggag aatgtgttca tggaaaaccg cagacaagac 900
cccacactgc tgtggcaggt cttcggcagc gccacaggag tcactcgcta ctacccggcc 960
accccgtggc gagcccccaa gaagatcgac ctgtacgatg tccgaaggag accctggtat 1020
atccaggggg cctcgtcacc caaagacatg gtcatcatcg tggatgtgag tggcagtgtg 1080
agcggcctga ccctgaagct gatgaagaca tctgtctgcg agatgctgga cacgctgtct 1140
gatgatgact atgtgaatgt ggcctcgttc aacgagaagg cacagcctgt gtcatgcttc 1200
acacacctgg tgcaggccaa tgtgcgcaac aagaaggtgt tcaaggaagc tgtgcagggc 1260
atggtggcca agggcaccac aggctacaag gccggctttg agtatgcctt tgaccagctg 1320
cagaactcca acatcactcg ggccaactgc aacaagatga tcatgatgtt cacggatggt 1380
ggtgaggacc gcgtgcagga cgtctttgag aagtacaatt ggccaaaccg gacggtgcgc 1440
gtgtttactt tctccgtggg gcagcataac tatgacgtca caccgctgca gtggatggcc 1500
tgtgccaaca aaggctacta ttttgagatc ccttccatcg gagccatccg catcaacaca 1560
caggaatatc tagatgtgtt gggcaggccc atggtgctgg caggcaagga ggccaagcag 1620
gtgcagtgga ccaacgtgta tgaggatgca ctgggactgg ggttggtggt aacagggacc 1680
ctccctgttt tcaacctgac acaggatggc cctggggaaa agaagaacca gctgatcctg 1740
ggcgtgatgg gcattgacgt ggctctgaat gacatcaaga ggctgacccc caactacacg 1800
cttggagcca acggctatgt gtttgccatt gacctgaacg gctacgtgtt gctgcacccc 1860
aatctcaagc cccagaccac caacttccgg gagcctgtga ctctggactt cctggatgcg 1920
gagctagagg atgagaacaa ggaagagatc cgtcggagca tgattgatgg caacaagggc 1980
cacaagcaga tcagaacgtt ggtcaagtcc ctggatgaga ggtacataga tgaggtgaca 2040
cggaactaca cctgggtgcc tataaggagc actaactaca gcctggggct ggtgctccca 2100
ccctacagca ccttctacct ccaagccaat ctcagtgacc agatcctgca ggtcaagtat 2160
tttgagttcc tgctccccag cagctttgag tctgaaggac acgttttcat tgctcccaga 2220
gagtactgca aggacctgaa tgcctcagac aacaacaccg agttcctgaa aaactttatt 2280
gagctcatgg agaaagtgac tccagactcc aagcagtgca acaacttcct tctgcacaac 2340
ctgatcttgg acacgggcat cacgcagcag ctggtagagc gtgtgtggag ggaccaggat 2400
ctcaacacgt acagcctact ggccgtgttc gctgccacag acggtggcat cacccgagtc 2460
ttccccaaca aggcagctga ggactggaca gagaaccctg agcccttcaa tgccagcttc 2520
taccgccgca gcctggataa ccacggttat gtcttcaagc ccccacacca ggatgccctg 2580
ttaaggccgc tggagctgga gaatgacact gtgggcatcc tcgtcagcac agctgtggag 2640
ctcagcctag gcaggcgcac actgaggcca gcagtggtgg gcgtcaagct ggacctagag 2700
gcttgggctg agaagttcaa ggtgctagcc agcaaccgta cccaccaaga ccagcctcag 2760
aagtgcggcc ccaacagcca ctgtgagatg gactgcgagg ttaacaatga ggacttactc 2820
tgtgtcctca ttgatgatgg aggattcctg gtgctgtcaa accagaacca tcagtgggac 2880
caggtgggca ggttcttcag tgaggtggat gccaacctga tgctggcact ctacaataac 2940
tccttctaca cccgcaagga gtcctatgac tatcaggcag cctgtgcccc tcagccccct 3000
ggcaacctgg gtgctgcacc ccggggtgtc tttgtgccca ccgttgcaga tttccttaac 3060
ctggcctggt ggacctctgc tgccgcctgg tccctgttcc agcagcttct ctacggcctc 3120
atctaccaca gctggttcca agcagacccc gcggaggccg aggggagccc cgagacgcgc 3180
gagagcagct gcgtcatgaa acagacccag tactacttcg gctcggtaaa cgcctcctac 3240
aacgccatca tcgactgcgg aaactgctcc aggctgttcc acgcgcagag actgaccaac 3300
accaatcttc tctttgtggt ggccgagaag ccgctgtgca gccagtgcga ggctggccgg 3360
ctgctgcaga aggagacgca ctgcccagcg gacggcccgg agcagtgtga gctagtgcag 3420
agaccgcgat accggagagg cccgcacatc tgcttcgact acaacgcgac agaagatacc 3480
tcagactgtg gccgcggggc ctccttcccg ccgtcgctgg gcgtcctggt ctccctgcaa 3540
ctgctgctcc tcctgggcct gccgccccgg ccgcagcctc aagtcctcgt ccacgcctct 3600
cgccgcctct gagcaccctg ccccacccca cctccactcc cacctcaccc ggcctcttcg 3660
cctttcccac cctcctgccc cacactcccc gccttagagc ctcgtccctc cctcactgaa 3720
ggacctgagc tggccaggcc ctgagagtct ggtctgcgcc ttgggatggg gagtcccaaa 3780
gcgggacgcc gcaggtgttt ggcacccaaa tcacatctca cctccgaact gttcaagtgt 3840
ccccagaccc ttcttgcctg ctgggctccc cccagtggga tgggacaggg aggccacacg 3900
cactggtgcc aaaaccaggc ctctgctgcc gcccttcctg gaggctgcct atgttggggg 3960
ggaccctgcc tcagctgacc cggcctctct gccccaccca agcccaaact tggtttctgt 4020
gagaatagtg gaggaaggtg agatggccag tttgaagcct gtgcctccca gcttaaatcc 4080
tagcaggaga gaggctctgg ggcagccccc atgggctcct gcccctttca ggcctacagc 4140
cacatcccca agcccaccag gtgtcaggat agtcacagtg ataccagttc agacactacc 4200
ccatatacac ctggaacatt gaggatggaa actggactca cattcgacat accccactgg 4260
gcacacgcac aaacacacac actatggggt ggggtgggtg taggggctta caaagcctta 4320
cacagggcga ggggttggtg ggagggttgg cacctgcaca ctccatctcc tgctcaccac 4380
ctgcctctaa tctgagctgc agcctggctg gtcctcccat ttctaaagct gaatgtcaaa 4440
cagtgccaaa tgctggggca gggggtgaag aaccctctgt cccaccccta gccaccagtg 4500
tcctccaagt gccccctcac ctctccaggt gctcattgta accatttctc actagtgtca 4560
ggcccccagt gggaccacat gccactgcct gcacctttcg gcagaggaac ccccaccaga 4620
catcaccctt tgccttagca ggggtgactt tgtctctcct ggctgggcca tccttccgcc 4680
aatctggccc ttacacactc aggcctgtgc ccactcccta tctccttccc acccctacac 4740
acacactccc tgcttgcagg aggccaaact gtccctccct tgctgaacac acacacacac 4800
acacacacac aggtggggac tgggcacagc tcttcacacc attcattctg gtcatttccc 4860
ccaaaggcat cccagcctgg gggccagtgg ggaactgagg gcaaggggat atagtgatgg 4920
ggctcagatg gactgggagg agggggaggg tgatgcatta attaatggct tcgttaatta 4980
atgtcatgtt gcttgtcgct ttctcagtgt gtgtgtgtgg tccatgccca ctgctggtgc 5040
cagggtgggt gtccatgtgc acccggcctg gatgccagct gtgtccttcg ggggcgtgcg 5100
tgtaactgta gtgtagtcag gtgctcaatg gagaatataa acatatacag aaaaatatat 5160
attttaagtt taaaaaacag aaaaacagac aaaacaatcc ccatcaggta gctgtctaac 5220
ccccagctgg gtctaatcct tctcattacc cacccgacct ggctgcccct caccttgggc 5280
tgggggactg gggggccatt tccttttctc tgcccttttt ttgttgttct attttgtaca 5340
gacaagttgg aaaaacaaca gcgacaaaaa agtcaagaaa ctttgtaaaa tatcgtgtgt 5400
gtgattcctt gtaaaatatt ttcaaatggt ttattacaga agatcagtta ttaaataatg 5460
ttcatatttt cacttcaaat ggttcccatc cactgtatca gcttgggggt gaggactggg 5520
tagctatgaa gacagttggc caagacctca gagtcccact tagtgctctg cagggggtga 5580
agaccatggt agcccaggtc cctgtcaacc acagggcatg gcacttgctt ccaccagtta 5640
taataggtgc caggcccttg acata 5665
<210> 44
<211> 1768
<212> DNA
<213> 智人
<400> 44
tataaattcc ctcccttcgc tccttccccg gaacagcggc ctctgacacc agcacagcaa 60
acccgccggg atcaaagtgt accagtcggc agcatggcta cgaaatgtgg gaattgtgga 120
cccggctact ccacccctct ggaggccatg aaaggaccca gggaagagat cgtctacctg 180
ccctgcattt accgaaacac aggcactgag gccccagatt atctggccac tgtggatgtt 240
gaccccaagt ctccccagta ttgccaggtc atccaccggc tgcccatgcc caacctgaag 300
gacgagctgc atcactcagg atggaacacc tgcagcagct gcttcggtga tagcaccaag 360
tcgcgcacca agctggtgct gcccagtctc atctcctctc gcatctatgt ggtggacgtg 420
ggctctgagc cccgggcccc aaagctgcac aaggtcattg agcccaagga catccatgcc 480
aagtgcgaac tggcctttct ccacaccagc cactgcctgg ccagcgggga agtgatgatc 540
agctccctgg gagacgtcaa gggcaatggc aaagggggtt ttgtgctgct ggatggggag 600
acgttcgagg tgaaggggac atgggagaga cctgggggtg ctgcaccgtt gggctatgac 660
ttctggtacc agcctcgaca caatgtcatg atcagcactg agtgggcagc tcccaatgtc 720
ttacgagatg gcttcaaccc cgctgatgtg gaggctggac tgtacgggag ccacttatat 780
gtatgggact ggcagcgcca tgagattgtg cagaccctgt ctctaaaaga tgggcttatt 840
cccttggaga tccgcttcct gcacaaccca gacgctgccc aaggctttgt gggctgcgca 900
ctcagctcca ccatccagcg cttctacaag aacgagggag gtacatggtc agtggagaag 960
gtgatccagg tgccccccaa gaaagtgaag ggctggctgc tgcccgaaat gccaggcctg 1020
atcaccgaca tcctgctctc cctggacgac cgcttcctct acttcagcaa ctggctgcat 1080
ggggacctga ggcagtatga catctctgac ccacagagac cccgcctcac aggacagctc 1140
ttcctcggag gcagcattgt taagggaggc cctgtgcaag tgctggagga cgaggaacta 1200
aagtcccagc cagagcccct agtggtcaag ggaaaacggg tggctggagg ccctcagatg 1260
atccagctca gcctggatgg gaagcgcctc tacatcacca cgtcgctgta cagtgcctgg 1320
gacaagcagt tttaccctga tctcatcagg gaaggctctg tgatgctgca ggttgatgta 1380
gacacagtaa aaggagggct gaagttgaac cccaacttcc tggtggactt cgggaaggag 1440
ccccttggcc cagcccttgc ccatgagctc cgctaccctg ggggcgattg tagctctgac 1500
atctggattt gaactccacc ctcatcaccc acactcccta ttttgggccc tcacttcctt 1560
ggggacctgg cttcattctg ctctctcttg gcacccgacc cttggcagca tgtaccacac 1620
agccaagctg agactgtggc aatgtgttga gtcatataca tttactgacc actgttgctt 1680
gttgctcact gtgctgcttt tccatgagct cttggaggca ccaagaaata aactcgtaac 1740
cctgtccttc agaaaaaaaa aaaaaaaa 1768
<210> 45
<211> 9306
<212> DNA
<213> 智人
<400> 45
gggttcggag cgcgaagccg ccgctgggtc ctcggcgcgc cccgcgtctg cgcttgctgc 60
cgcgccccgg tcggcgcgct gggagttcca gccatgctct tctggcacac gcagcccgag 120
cactacaacc agcacaactc cggcagctac ctgcgtgatg tgctcgctct gcccatcttc 180
aagcaggagg aaccccagct gtcccccgag aacgaggccc gcctgccacc cctgcaatat 240
gtgttgtgtg ctgccacgtc cccagccgtg aagctgcatg aagagacgct gacctacctc 300
aaccaaggtc agtcttatga aatccgacta ctggagaatc ggaagctggg agactttcaa 360
gatctgaaca caaaatatgt caagagcatc atccgtgtgg tcttccatga ccgccggctg 420
cagtatacgg agcaccagca gctggagggc tggcggtgga gtcggccagg ggaccggatc 480
ctggacatcg atattccact gtctgttggt atcttggacc ccagggccag cccgacccag 540
ctgaatgcag tcgagttttt gtgggaccct gcgaagagag cttctgcatt cattcaggta 600
cactgcatca gcacagaatt cacccccagg aagcacgggg gcgagaaggg agtgcccttt 660
cgagtccaga ttgacacgtt taagcagaac gagaatgggg agtacacgga gcacctgcac 720
tcagccagct gccagatcaa ggtgttcaag ccgaagggag ccgatcggaa acagaagact 780
gaccgggaga agatggagaa aagaactgcc caagagaagg agaaatacca gccgtcctat 840
gaaaccacca tcctcacaga gtgctctcca tggcccgacg tggcctacca ggtgaacagc 900
gccccgtccc caagctacaa tggttctcca aacagctttg gcctcggcga aggcaacgcc 960
tctccgaccc acccggtgga ggccctgccc gtgggcagtg accacctgct cccatcagct 1020
tcgatccagg atgcccagca gtggcttcac cgcaacaggt tctcgcagtt ctgccggctc 1080
tttgccagct tctcaggtgc tgacttgctg aagatgtccc gagatgattt ggtccagatc 1140
tgtggtcccg cagatgggat ccggctcttc aacgccatca aaggccggaa tgtgaggcca 1200
aagatgacca tttatgtctg tcaggagctg gagcagaatc gagtgcccct gcagcagaag 1260
cgggacggca gtggagacag caacctgtct gtgtaccacg ccatcttcct ggaagagctg 1320
accaccttgg agctgattga gaagatcgcc aacctgtaca gcatctcccc ccagcacatc 1380
caccgagtct accggcaggg ccccacgggc atccatgtgg tggtgagcaa cgagatggtg 1440
cagaacttcc aagatgaatc ctgttttgtc ctcagcacaa ttaaagctga gagcaatgat 1500
ggctaccaca tcatcctgaa atgtggactc tgagcagcag tggacctcat acctgtctcc 1560
agctcccagc cctgtggatc cccgtggatg tagacattgc cccactgtaa gctgtggcct 1620
caccaggcaa gctgaggcca ggagggaccc tgcccagtct gtgaaagcta cagagcacca 1680
accagcagaa gcctgtggac accaagtacg gtgtacagaa agccagtggc tcctttctcc 1740
cttcctcttg gcctccagat tttgaatggt tccttgttct tttctattgg tccaaccctg 1800
acgttctaaa agggcaaaca gtggagacgt ctgctctgaa atccctcatc ccttagttgg 1860
aagctgattg ggtatcttgg tgctgcctgt attggtccct tctgaccact ctcctgcctc 1920
cagagaaagc tctgcttcac cctggaagct ggtaccttta cctcctcctc tgggagttgg 1980
ctgcatggcc agcactgccg acttgatggg agcagtttgc cctcattctc ctgtttcagg 2040
tttgcttccc ttctcagtga ccctggtgag catccgcctt tcctgttctt ggatgaattg 2100
atgggagtgg ggctattctg tgccttctac ctctttcttc tctacgttgt ttctaaggat 2160
ctgctgctgc ggaacccaaa gatgtgctcc tgtctctgca ctggcgcatt ggcatggtag 2220
atgccacaat gtatgtgcac ggcctttctc agagacatta gttctgaggc cctttgtggg 2280
gaggttaggg ggatggtaat agaaaaagac tattttattt cctggcaatc acgggtaagg 2340
aggattagga atgagtattc cattcctagg tgtcatcaga tgaccttgac caccacaata 2400
ccaggccctc ttggatggac ttatagaaag ttagagaaga ccttgttgaa ccgctgctaa 2460
acttgccaca ggagcgatgt gttttctctg agtgcccctc acttacatgt ttatctttgt 2520
ttgtagaggc tatgtttagg atattttgcc tgcatcagaa tgggtgcatc atctttctta 2580
atggcctaac tatcgggaaa tttgagtgtc agtaactgtg gtagactcag aaattcgtct 2640
ttgtcttgcc tctggttcct gggatccagt gatctctact ggcccagggc ttcagctctt 2700
ggttaattta ggttcatggg gaaccctctg accacctgaa tgggatgtca tagcttctaa 2760
atggagcttc tgtggaatga agtgctagac tgaaggacta ccagaataaa acagggtcta 2820
caatggggag aacttgtttt atagatgagg aaaccaaggc tcagaggggc aaagtcacct 2880
gcatggtagc acatagtgat agggtagcga tataaattta tcatataaac caggacatct 2940
cggaataaaa ggggctctgt tagtcattat gttgggtaat agccgtggca ttcctacaga 3000
acagagtgag gacaggctcc tgattcctct tccttcttta gaggagaagc ggggagtggg 3060
ttaactaaca gctttattga gatgtcattc acatgccatt cagtttaccc attgctagtg 3120
tccaattgta ttcacagaac caccatcaat tcacagaatt acagtcaacg ttggtacatt 3180
ttcatcaccc ccagtaaaac cccgtaccct tggtctgtca ctcctgcttt cctaactcct 3240
gcagtccaag gcagccatga atctactttc tatgtaagat taacctactc tggacatttc 3300
atatatctgg aatcatgtga tatctctttt gtgactggct tcttccactg aatgttttct 3360
agggccgtcc aagttgagga tgtatcagta cttcattctt ttgtattgct gaataatact 3420
tcattgtata gatagaccac atttgtttat tgattcatca gttgatggac atttgtgtgt 3480
ttttactttt tggctactct gaatgatgct gctatgaaca tatttctaca agattttgtg 3540
tggacatatg ttttcatttc ttttagcaat atacatagga gtggaattgc taggtcttac 3600
agtaactccg tgttttaact ttttgagaaa ctgccagact gttttctata gcagctgtac 3660
cattttacat tcccaccagc aatgtatcca ggtttcaatt tgtctacatc ctcatcaaca 3720
cttgctatta tctgtctttt tgcttttagc atcctaatga gtatgaaatg ctatcttgtg 3780
gttttgattt gcattcccct gatggcaact gatgctgagt gtcttttcct gtgcttacgg 3840
gccatgcgta tttctttgga gaaaggtcta tccaggtcct ttgcctattt ttaattgagt 3900
tgtctttttt tttttaagtt ttctgttttc ctaaccacta gactaccagg gatgagcctt 3960
ctttttatta ttgagttggg tgagctattt gtatattcta gacgccagtc ttttatcagg 4020
tatatgactg gtaaaaatgt tctccccttc tgtggattgt tttcagtttc ttgttggtgt 4080
cctttgagac acaaaacttt ttaactttga tgatttccaa gatacgtatt ttttttctat 4140
tgtcacttgt gcttttggtg ccatatctag aaaaccattg cctaatccaa ggtcaagaag 4200
attaatgcct gtgttttctt ctaagaacta tacttttagt tctcacaatg gtctttgatc 4260
catttcgagt atatttttat atatgatgtg atgtaggggt ccagcttcat tcttttgctt 4320
gtggatctcc acttgtccca ctgctgatta ttgagaaaaa tatcctttct ccacggaatt 4380
gtcttggcat ccttgctaaa ggcctctgct tcttactgga tcttctttcc tgggacatgg 4440
tgtcgttggg aagcttacct tttttttttt tttacttagt ctgtgtttgg ttccaccagt 4500
tttatgctgc ctttctactc tgttcttgct gtctccctct ttacctgagt caacggtact 4560
gagtcctatc tctctctgat gttccccagt cttccttggt gcatgttcta gctccacaca 4620
ctagtccttg gaggaaggtt gagaccaatg atttcctgtt atgagtcatg aggaaactga 4680
atcacctaga agtggaataa tgtgctcagg gtcaccatag cccattagtg gaaggaccag 4740
gactagacct ttagtcttct gaggtccagc cccttaggct gtctgtcatc actgtaccca 4800
agtgatgtca ctaccaaggc caaatgatgg tgggctaaat tttaattctc aaaagtgtag 4860
gaggctaata ttgtcttcta agttccaaaa gaagatgtaa taaaagtctg ttaccttaag 4920
tgtgctatta gtagagtctt ccatttttct ggcatgcccc tggcatctgc tcttcttacc 4980
ttctcgtggt tgtagttaaa gcttatagct tatgaaagaa tagaaaataa taaataccaa 5040
aaaaaagtac acatggtaat ttggtaccaa aatatctcag ctgcctaatt tagcagctca 5100
tcccttccac aggggtcaga tgagctaaag ctccaggttt tatttttcat ttgattgaca 5160
tacagaaaag ccatagccct tcccacagct gtccagggtc tttcctgtga gtccggaggt 5220
gctggcctat tgagcaggac agctcttccc agggcattcc caccaacctg tggcttctga 5280
actgtagctt ctttttacag tgaaccccag agggaaataa gacagacaca tgtgctcagg 5340
ccaccatctt gaactggaag cccaaagctg agttccttac tcttaggtcg tcacggtttt 5400
tgcggggtat ctgcaaggtt gagataaacc ctttcctgtt taccaggttg tcctttctgg 5460
atgaagggac agaggctgtt gaatggagga ataataggtt tgctggagga ggggcatggt 5520
atgcctgtgg aaaggacagg atggggtggg gaggtcgagg ctttgacttg gggtcctaaa 5580
caaaggtcag gtgttgccct agtgacctct tgcccagaca gcccagagcc ccttacacag 5640
agctattaac ctagggaagg ctttaccagc agtggactgg agccagccag ggtcacaagt 5700
ttccaagtcc agcattgctt caggggctgg cctgagtaac tgaagatctg aaaatcatta 5760
acaagtcgat gaaataaacg gaaaagcctc ttaggctgtt gtcagtggag cagagggaga 5820
aagtccctag gcgctcagag ggggtgagaa agcagtggat gattgggcgg gggtggggga 5880
ttagatgttg acactgcctg gggtgtagga agaggaacag agaacccaga gtcagggtcc 5940
tagatcccag accctcgctc agtatgagtc tctttgcctc tctgggtctc tatctcctcc 6000
tcttacaaat acaggcttgg tgatctctga agatggcacc aacctgccat gaaatgaatc 6060
tgaggggttt tcccattttt ccctccatca aaatcgtaca aaaagctgga cgtggtggcc 6120
catgcctcta atcctagcat tttgggaggc cgaggtggga gaatcacttg acgccaagag 6180
ttcgagacca gcctgggcat cgtagtgaga ctccatctct gtctttttga aaataaaaaa 6240
tctttgaaaa ttgcacaaca ggcaggagac ctttacgtgt gcccatcctg gttgtacaca 6300
gtgccaccag tgctcctgca gtgcaaggcg gcatgcttct tgacatgggt cagattgtgt 6360
ccatcgtgtc tttgggaatc agccctagct cctaactggg ctgactactt cctccgcaaa 6420
cttatggggg ctcccagata ttccttgcca gccaggggcc agacacagtg caggcacagt 6480
ctgtgtcatt ggtgcacatg tgcgtgttta catgtgtacc tgggttcctt cccttgccca 6540
tgaatttgcc atgagcacag ccagaagcag cctcagcttg gcaaggtgtg gagatgactg 6600
ctgttccctt cgcatttggg gaaaacaggc tccctcggta gctcgatgat cctcttttga 6660
tcttgtgtga cctcctggag agtggatgaa gctggtggcc ttagcttttc tagacagtgt 6720
aagtggcact gggcaaggcc cccagagcag ggcaaggtct ctagagcggg tctcccacat 6780
gactggcttc acacaggcac ttccgctcgg gttgcatgct ctgtgtcatc ttaccggtcc 6840
agggttgcag gtaggaaatg tttgtaccct cttctgattg ccacctcctt cccatcgccc 6900
cttagggaca gggcttgagg gccagtgagg cgctggtcag gcaccccagg cctccttggg 6960
acctgcccag gggcaccctg agagctcctg aaacccccac ttagcttcca gacctttctg 7020
caaaagctcc tcctggcttt cctccctccc ccaatctatg ggtcacagct aacagatctg 7080
agggcaactg ctgtgctagt ggccagggct gcacctgcca tccccggctc tgccacttta 7140
gggccttcta gaggcagtgt ccttaggaag tagctctgag gcatgggttt tctgctcctg 7200
tgcagggcag ctgatgggat aaggtgggga aggacggtca gtgcttgggc cccagctggc 7260
cagcctggcg atggggaaac caaaccatgt cccccagcga agggccagag tgggaacctg 7320
tcctcatgcc cttcgtcctg aggagccctg aggtgggcag caggggccag gggaagtttt 7380
caggccttca tcaaagagaa caacatcctc agctccgcac ccctcatcct gtatcagcac 7440
ttaccggtgt gtgactgccc ttgtcagcta gcatacggtg ggcccacctg gcccactggc 7500
tgtttatgcc actgatttat gatagggaat attatctttg aacccaatga agtgttttct 7560
cccccatcac aaaaaaaaaa attcttattt ttagtagaca tgtatttacc aaaaatatgt 7620
actcaattat tgtattttgg attttatcaa tttaaaaatt gtggaaattt gtttgctctt 7680
acgccaacat aatattgatt ttgcctcttg gctctgaaag cccaaaatat ttaccgtcta 7740
gcccgttaca gaaaaagtct gctgactact gagccagacc tccattacct ccatccctgt 7800
tggattattt aaagaaagcc tcagacagta agggcttttt taaaagaata aaatgacttg 7860
gtttgcgctt ggaagcaggg gaagcattca gatgagcggt ttctgcatta accctgccta 7920
tcacgcatct cgtgtcctgt gtggctggcg agcccccctt ggaaggttct ggtgcttcag 7980
ctggctcctg cagagtccac cccgcctcgt ggtgggaatg cagagccctt tgctttcctt 8040
cttgccgcct gcttcctgtt cctggggacc cgctgggcct ttggtctgca tcccctggcc 8100
aggtccctca gggttgatgc gtggagaagg actttgagca gtggtgggca gcagtggcct 8160
cctggccagc tcacactctt gtcctgggag gggcagcctg atctcacctc cacctagtac 8220
cttggggact gaggaccttt tggcttctct ggagcctgca agcctcttcc catgtgtcca 8280
gctgctcttc ctgctacaaa ggggactgct cacagtggcc tcagcttggt ggttttgagg 8340
ggccgccccc cggccctcca taagggtatc ctgggcctga gaattctgca tctgccattg 8400
gaggatggac agcctcaaat ggaaggagtc ccacgggaga tgggtccgag gtccggctgt 8460
ggccatccag ccccctgtgg cttgtccagc ctctgtgcac ccctggtgtc ttcactccag 8520
gggcagacag cagccactgc agttcctttc ttcgtgagta acagtagtga tagcagctgg 8580
ggctaacagg ctaggctttg tgttctgcgc atttggtcag cttctcactc gatcctccct 8640
aaagcaatgg ggaggccccc actagcccag ttttcaggaa gtcaactggg aggttagatg 8700
ggggccaggg tcccacagct actgatggcc cgagccaggt tgagcttcct ggtgtccagt 8760
ccggatccca cttgcagatc tcatgctctc agataggtgg gacaagttct tttgtcacag 8820
tgctggctct gtcctgaggc ctcattgctg gctgggtgtg ctctgctggg aaaagctttg 8880
cggggcttgc ttggttaacc acagaagaga aggggactgt ttggggtgcc tctctgcagc 8940
ctccccgtgc tgggtggaag cacggttact gtgttctcta atgttcatgt atttaaaatg 9000
atttctttct aaagatgtaa cctccacacc tttctccaga ttgggtgact cttttctaaa 9060
ggtggtggga gtatctgtcg gggtggtgtg gcccttggat gggtcaggtg ggtgtgagag 9120
gtcctgggga ggtgggcgtt gagctcaaag ttgtcctact gccatgtttt tgtacctgaa 9180
ataaagcata ttttgcactt gttactgtac catagtgcgg acgagaagtc tgtatgtggg 9240
atctgtgctt gggttagaat gcaaataaaa ctcacatttg taagaaaaaa aaaaaaaaaa 9300
aaaaaa 9306
<210> 46
<211> 6564
<212> DNA
<213> 智人
<400> 46
atgcattaaa ctccaggtat tttcagggag gaatcatgaa gccgctcctg ttaaatcata 60
tccattttat tacgtctctc cttgtggatt acgtagaact ttggaaaatt aaacattaga 120
catcttcata gaaaatcatg tcactgattt ttaaagccag ctcaatttaa cctgccactg 180
attccctaac cagctcttct ctgactgtat cccgagggaa aatgtattga acgcagcaga 240
aggttaaggc agaggagttc ggctagaccg ggtagcagcc aatcagatgg ggagggtcca 300
aggatctgat gcctccaggc gagcagcgcc aagctgagct ggttagtctc cttttattgt 360
ggatgaacac cacgtacatg ccgtaaatgc tccctaggct ggctgcggct acaaggcaga 420
cccgggagct gagaatagag gaatacctgc ccaagcaact cattctgcac agcagccgac 480
aagacagcga ttttcctgtg ctggaatgtg cccatccaaa gccaaccaat ttgttggaaa 540
atcagtcaaa atctaatttt gatgttctgc aagttccctg ggggccatga agcacctgac 600
acttggattg gacttaatct taaacctctg gagttcaaga ccttttaaaa agggctaaat 660
aaacaatctc tacatgtaaa aggccactga ctcctacttc ctctgtatag agcaactgtt 720
gaactcagct gcctgtagga aaactgaaga ctttaataac aaactctcca aggtgaaaat 780
gaacacagat agcggtgggt gtgctcgcaa acgtgccgcc atgtctgtta cgctaacatc 840
tgtgaagaga gtgcaaagtt ctccaaacct attggctgca gggcgtgatt ctcagtcacc 900
agactcagct tggagatctt acaatgatgg caatcaggag acactgaacg gagatgctac 960
atattcctct cttgcagcaa aaggttttag aagcgttcga ccaaacctac aagataaaag 1020
atcaccaact cagagccaga taacagtgaa tggaaactca ggaggtgccg tgagtcccat 1080
gagttactat cagaggccgt tttccccctc ggcatattct ctcccagcct cactcaactc 1140
cagcattgtc atgcagcacg gcacatccct cgattccaca gacacatatc cccagcatgc 1200
gcagtctctg gatggcacca ccagcagctc tatccccctg taccgatcct cagaggaaga 1260
gaagagagtg acagtcatca aagccccgca ttacccaggg atcgggcccg tggatgaatc 1320
cggaatcccc acagcaatta gaacgacagt cgaccggccc aaggactggt acaagacgat 1380
gtttaagcaa attcacatgg tgcacaagcc ggatgatgac acagacatgt ataatactcc 1440
ttatacatac aatgcaggtc tgtacaaccc accctacagt gctcagtcac accctgctgc 1500
aaagacccaa acctacagac ctctttccaa aagccactcc gacaacagcc ccaatgcctt 1560
taaggatgcg tcctccccag tgcctccccc acatgttcca cctccagtcc cgccgcttcg 1620
accaagagat cggtcttcaa cagaaaagca tgactgggat cctccagaca gaaaagtgga 1680
cacaagaaaa tttcggtctg agccaaggag tatttttgaa tatgaacctg gcaagtcatc 1740
aattcttcag catgaaagac cagcctcctt gtatcagtcc tctatagaca gaagcctgga 1800
aagacccatg agttctgcaa gcatggccag tgacttcagg aagcggagga agagcgagcc 1860
tgcagtgggt ccaccacggg gcttgggaga tcaaagtgcg agcaggacta gcccaggccg 1920
agtggacctc ccaggatcaa gcaccactct tacaaagtct ttcactagct cttctccttc 1980
ttccccatca agagcaaaag gtggggatga tagcaaaata tgtccatccc tttgcagtta 2040
ctcagggctc aacggcaacc cctccagtga gttagattac tgtagcactt acagacagca 2100
cttggatgtc cctcgggact caccaagagc cattagtttc aagaacggct ggcaaatggc 2160
ccggcaaaac gcagaaatct ggagcagcac ggaagaaacc gtctctccca aaatcaaatc 2220
ccggagctgt gacgatctcc taaacgacga ctgcgatagc ttcccggacc cgaaagtcaa 2280
gtcggaaagc atgggctccc tgttatgtga ggaggactcc aaggagagct gccccatggc 2340
gtgggggtcc ccctacgtcc cggaggttcg cagtaacggc agatcaagga tcagacacag 2400
gtcagcccgc aacgccccgg ggttcctgaa gatgtacaag aaaatgcacc gcatcaaccg 2460
caaggacctg atgaactccg aggtgatctg ctccgtgaag tccaggattc tgcagtacga 2520
gagcgagcag cagcacaagg acctgctgcg cgcctggagc cagtgctcca cggaggaggt 2580
gccccgggac atggtgccca cacgcatctc cgaattcgaa aagctgatcc agaagtccaa 2640
atccatgcca aatttagggg atgacatgct gtctcccgta accctagaac caccgcaaaa 2700
tggcctatgt cccaagaggc ggttttccat tgagtatttg ctggaggaag aaaatcaaag 2760
cggccccccc gctcggggcc ggcgaggctg ccagtctaac gccctggtgc ccattcacat 2820
tgaagtcacc agcgatgagc agccccgagc acacgtggag ttttccgaca gcgaccagga 2880
cggggttgtg tccgaccaca gtgactacat tcacctagag gggtcatcct tctgcagtga 2940
aagtgacttt gatcactttt ccttcacatc ctccgaaagc ttttacggat ccagccacca 3000
ccaccaccat caccaccacc accaccaccg ccacctcatc agctcctgca aaggcaggtg 3060
cccggcctcc tacactcgat ttaccacaat gttaaaacac gaaagagcca gacacgaaaa 3120
caccgaggag cccagaaggc aagaaatgga ccctggcctt tctaaacttg cttttctagt 3180
cagtcctgtg cctttccgga ggaaaaaaaa ttcggctcct aagaaacaga ctgaaaaggc 3240
aaaatgtaaa gcatctgtgt ttgaggctct ggactctgcc cttaaagaca tctgtgacca 3300
aattaaagct gaaaagaaaa gggggagctt gccggacaac agcatcctgc accgcctcat 3360
cagtgagctg ctgccagatg ttcccgagag gaactcatcc ctgagagcgc tgaggaggag 3420
ccccctgcac cagcctctcc acccactgcc tcccgatggt gctattcatt gtccacccta 3480
ccagaatgac tgcgggagaa tgccccgcag tgcctctttc caagacgtgg acacagccaa 3540
cagcagctgc caccaccaag accgtggcgg tgcactccaa gaccgtgagt cccctagaag 3600
ttactcatcc actttgactg acatggggag aagtgcacca agggaaagaa gaggaactcc 3660
agaaaaagag aaattgcctg caaaagctgt ttatgatttt aaggctcaga catctaagga 3720
gttgtcattt aagaaaggag atactgtcta catcctcagg aaaattgatc aaaattggta 3780
tgagggagaa caccacggga gagtgggcat cttcccgatc tcatacgtag agaaactcac 3840
acctcctgag aaagcacagc ctgcaagacc acctccgcca gcccagcccg gagaaatcgg 3900
agaagctata gccaaataca acttcaacgc agacacaaat gtggagctgt cactgagaaa 3960
gggagataga gttattcttc ttaaaagagt tgatcaaaac tggtatgaag gtaaaatccc 4020
aggaaccaac agacaaggca tcttccctgt ttcctatgtg gaggtcgtca agaagaacac 4080
aaaaggtgct gaggactacc ctgaccctcc aataccccac agctattcta gtgataggat 4140
tcacagcttg agctcaaata agccacagcg tcctgtgttt actcatgaaa atattcaagg 4200
tgggggggaa ccgtttcagg ctctgtataa ctatactccc aggaatgaag atgagctgga 4260
gctcagagaa agtgatgtca ttgatgtcat ggaaaagtgt gatgacggct ggtttgtggg 4320
gacctcaaga agaaccaaat tctttggtac tttccccgga aactacgtca agaggctgtg 4380
aattgcgctc cctccttctg tagaggccgc ctgccagcca tgcacctgcg tcaacgcgcc 4440
tgaaacaccc cgcgggcctc ccgttgtcat gccttacggt ttccaatgcg ccgtcaccat 4500
ctccacctgc caccaaacca ccagcagagt agccgccgct gctgtgagcc tggggacgac 4560
atggcaggct ggtccccctc cgtgaaagtg tggattccta cttcctgctc taagctttga 4620
cacgtcaaaa tgtgggatca gaaagaaaaa aatcatgata tttaaaaatg gtcaaatatt 4680
tgaggcaaaa aaaaaaaaaa aaagtgtctc caggaggctg tccagcctcg tggctccatt 4740
tcaacatctc cccccaggcg atgttctccc ccaagacgac cagaaaattg tttattgggg 4800
aatgctgtgg tttgcatttt catattcttc gcttggcagt gtgtattctt ttcacaagtt 4860
tgcctagtgt cttggtttac acaatatgac aactgtaact gtactttagc tattgtttgc 4920
ctgcacatac atgttgtaat atgcacagtg attacaacct ttaaagcaag aggaggcgag 4980
ttaatttgga tgagtgtgat tttgctgatt gaatgtgagt tttcaaatag gagtcttttt 5040
ctgcaatttg tttgcatttt ttagaagtgc aaacagtaag taaataaaag ccttcggtaa 5100
taatcatgac aatacaagag gctgagctag gctacagggg aaaactattg tgttgtaaag 5160
ttgcatcgct attttatatt aaaatgtaat gatcagcatc atgaacaatg agctcttagt 5220
gttttattta tctgaaaaaa tgtaagtaaa agcagtgtta gtgagaggtg caaagaatta 5280
ttctaacaga cacctgaaag tatctgtaag caatactagt aggtaagatt tcactgtgtg 5340
tacacataca catttgagat tgtatgagaa catataatcc atatgatatg ttgtacattt 5400
tatggaaatg taatagaatc tcacacatta ttttatagaa atagagtaca gaagcatcac 5460
aagtattaaa gttggtttta gcaaggatta ggattactac aattattttt actataataa 5520
ttatttttct tctatggaac tcagaatcct ggctacattt gaggacagga atatgttgag 5580
cctgattttc ctggtgtgtg taaaatattt cctaggaata aattaggcac tttttagaag 5640
caatgttaaa tcattcaggt tttattttct gccctgaagc agaaatttaa aaaatgatat 5700
tgggacctgg aaggtttaat atggttcaca gtgcctgaat tacacctgct ccgaaaacta 5760
gctttgtatt tcttatgact ttgcataaga actgttcatc tttggatctt gagcacctta 5820
cagataaaac tttttatggc atctctttca tggacagtga tattgatctt ttcacaatgt 5880
acgtagcctc tagaattttg tacatatgtt tgctcttttt ttgtacagac tagttgttga 5940
gaaaacaggg gcgtttccta atttggtctt tatcctgcga caacactttc agcagactag 6000
cctctcctta tctcacagat cacaagcacc cctagatagt gtgattctgt cagatagcat 6060
ttatgcaaaa atctatgaag ttaaaagatc gtagaagcca aatgaaatgt acatatctac 6120
tgactgatga caagggaatt tcattaggaa gaaggtaaag aaacatcgtt gagtagccta 6180
ccttgatttc tgtcaagttc ataaccagct tcatatttta aaggcttcag gtttgaaatt 6240
aagtcaactg catgcagctt tgctgataaa tgaataattc tctttgatgc catttatgag 6300
aaaagacttc aatatctgtt gcctgtcata tttaagaaaa attactgttt ctactctctg 6360
tatctgattt taaaagaaaa aactattcat acctggcttc caggtaattg actttgaatt 6420
cttacaagca aaggtcattg tgtttttctt gaatagacat ctaataaatt ttgcttggaa 6480
gtatacttca gtttttcttc ttgacattta tctttataaa aattgtgtat tttattccaa 6540
cttgttaaac taagagaaaa tgca 6564
<210> 47
<211> 6398
<212> DNA
<213> 智人
<400> 47
gtggaatgac gggagggagt cccggcagct cctacctccc agcgatggcg tcgctgtgcc 60
gcgcccagtc cccagcctgc cggccggtac tcaccgctac ccggagttcg ctcagacggt 120
gagatttggg gcgggtccga ggcagcggcg ggacgctacc tgcgaccggg accatgagga 180
gctgccagac ccgtggggcc ggtaacgaga gcagtcgcgg cacctgctga gaggaaagag 240
ggagcggtcc ggcgcggctg gggcgcggca gaggcttgcc cgatcctcgg ccatgtcact 300
gctctgcgtg cgcgttaaaa gggccaaatt ccagggttca ccagataaat ttaacacata 360
tgtgaccctg aaagtacaga atgtgaagag cacaactgta gcagttcgtg gtgatcagcc 420
ttcctgggaa caggatttca tgtttgagat tagtcgcctg gacctgggtc taagtgtgga 480
ggtatggaac aaaggactga tctgggacac catggtgggg actgtgtgga ttgcgctgaa 540
gactattcgt cagtcggatg aggaagggcc tggggaatgg tccacattag aggcagagac 600
gttaatgaaa gacgatgaga tctgtggaac tagaaaccca actcctcata aaattttgct 660
tgatacaaga tttgagttgc cttttgatat cccagaggag gaagccagat attggaccta 720
caaatgggag caaatcaatg ccttgggagc tgacaatgag tattctagtc aagaagaaag 780
ccagaggaag ccattgccca ctgctgccgc ccagtgttct tttgaagacc ctgatagtgc 840
cgtcgatgac cgagatagtg actatcgcag tgagaccagc aacagcttcc cacctcctta 900
ccatacagct tcccagccca acgcttctgt gcaccagttc cctgtgccgg tgcgatcgcc 960
acagcagctg ctacttcaag gcagttcccg ggactcttgt aatgactcta tgcaaagtta 1020
tgaccttgat tatccagagc ggcgggctat cagccccacc agcagcagta ggtatggctc 1080
ctcctgtaat gtgagtcaag gaagctctca gctaagtgaa ctagaccagt atcacgaaca 1140
agatgacgac catcgggaga cggactcgat tcattcttgc cacagctctc acagcctgtc 1200
cagagatggc caagcaggtt ttggagaaca agagaaaccc ttggaggtga caggtcaagc 1260
agagaaggag gcagcatgtg aacccaagga gatgaaagaa gatgccacaa cccaccctcc 1320
cccagatctg gtgctgcaaa aagaccactt cctaggtccc caggagagtt ttcctgagga 1380
gaatgcatct tcaccattta cccaagccag agcacattgg atccgagcag ttaccaaggt 1440
tcgactccag ctgcaggaga ttccagatga tggtgacccc tctctgcctc agtggctccc 1500
ggaagggcca gccggagggc tctatggcat tgacagcatg ccagatttac gcagaaagaa 1560
gccactgcca cttgtcagtg atctgtcact ggtccagtct cggaaggcag gaatcacttc 1620
tgcaatggct acacgcactt ctcttaagga cgaagagctg aaatcccacg tgtataagaa 1680
aaccctgcag gccttaatct accccatttc gtgcaccact cctcataact ttgaggtctg 1740
gacggccact accccaacct actgctatga gtgtgaaggc ctgctctggg gcattgcccg 1800
gcagggcatg cgctgcagcg aatgtggagt caagtgccat gagaagtgcc aggatctgct 1860
caatgctgac tgcctgcagc gggctgcaga aaagagctgt aaacatggag ctgaggaccg 1920
gacccagaac attatcatgg ccatgaagga ccgcatgaag atccgagagc gaaataagcc 1980
agagatcttt gaagttatcc gggacgtctt cacagtgaac aaagctgccc atgtgcagca 2040
gatgaaaaca gtgaagcaga gtgtactgga tggcacctcc aaatggtcag ccaagatcac 2100
cattactgtg gtgtgtgccc agggcctaca agccaaggac aaaacaggat ccagtgaccc 2160
ttacgtgact gtgcaagtca gcaaaactaa gaagcgtacc aagaccattt ttggaaactt 2220
gaatcctgtt tgggaggaga agttccattt tgagtgccac aactcctctg accgcattaa 2280
ggtgcgtgta tgggatgagg atgatgacat caagtcaaga gtaaagcaac gcctaaagcg 2340
agagtctgat gatttccttg gccaaaccat cattgaggtt cggaccctaa gtggcgagat 2400
ggacgtctgg tacaacttgg agaagaggac agacaaatca gccgtctcag gggctatccg 2460
actacaaatc agtgtggaga tcaaggggga ggagaaagta gccccatacc acgtgcagta 2520
tacatgtctc catgagaatc ttttccatta cctcacagac attcagggca gtggaggagt 2580
ccgcatccct gaagctcgag gagacgatgc ctggaaggtg tactttgatg agacagccca 2640
agaaattgtg gatgaatttg ccatgcgtta tggcattgag tccatatatc aggccatgac 2700
gcactttgca tgtttatcat ccaagtacat gtgtcctggt gtgccagcag tgatgagcac 2760
cttactggcc aacatcaacg cctactatgc ccacacaact gcctctacca atgtctctgc 2820
atctgatcgc tttgcagcct ccaactttgg gaaagagaga tttgtaaaac tgctggacca 2880
gctacacaac tcactgagga tcgacctctc tacatacagg aataatttcc ctgctgggag 2940
tcctgaacgg cttcaggact taaaatccac agtggatttg ctgaccagca ttactttctt 3000
cagaatgaag gtacaagaac tgcaaagccc tccaagagcc agccaggtgg taaaggattg 3060
tgtgaaggcc tgtttgaact ccacatatga atatatcttc aacaactgcc acgacttata 3120
cagccgccag taccagctga agcaggagct acctccagag gaacaagggc ccagcattcg 3180
gaacctggat ttctggccca agctcatcac actcatcgtg tcaatcatag aggaagataa 3240
gaattcctac acacctgttc tgaaccagtt tcctcaggag ttgaatgtgg gaaaagtcag 3300
cgcagaagtg atgtggcatt tgtttgccca agacatgaaa tatgcattgg aggagcatga 3360
gaaagaccac ctgtgtaaaa gtgctgacta catgaacctg cacttcaagg tgaagtggct 3420
ccacaatgaa tacgtgcggg atctgcctgt cctccagggg caggtgcctg agtacccagc 3480
gtggtttgag cagttcgtgc tacaatggct ggatgagaat gaggatgtat ccctggaatt 3540
cctgcgtggg gccctggaac gagataagaa ggatggattc cagcagacat cagagcatgc 3600
actcttttcc tgctctgtgg tggatgtctt cacacaactc aatcagagct ttgagatcat 3660
ccggaagctg gaatgcccag accccagcat ccttgcccac tacatgagga ggtttgctaa 3720
gaccatcggg aaggtgctga tgcagtatgc agacatcttg tcaaaggact tcccagccta 3780
ttgcacaaag gagaaactgc cctgcatcct gatgaacaac gtgcagcaac tgagggtcca 3840
gctggagaaa atgtttgagg ccatgggagg caaggagctg gaccttgaag ctgcagacag 3900
tctgaaggag ctgcaggtga aactgaatac ggttctggat gagctcagca tggtgtttgg 3960
aaacagtttc caggtacgga ttgatgagtg tgttcgacaa atggccgaca tcctgggcca 4020
ggttcggggc acagggaatg catctccaga cgccagggcc tcagcggctc aggatgcaga 4080
tagcgtactc cggcctctca tggacttcct ggatggcaac ctcaccctct ttgccactgt 4140
gtgtgagaag acggttctga agcgtgtact gaaggagctc tggcgcgtgg tgatgaacac 4200
aatggagagg atgattgttc tgcccccact cactgaccag acgggcaccc agctgatctt 4260
cactgctgcc aaggagctga gccatctttc caaactcaag gatcacatgg tacgagagga 4320
aacacggaat ctcactccaa agcagtgtgc agtccttgac ctcgccctgg acaccatcaa 4380
gcaatacttc catgcaggag gcaatgggct gaagaaaacc ttcctggaga agagcccaga 4440
tctgcagtct ctacgctatg ccctgtctct gtacacacag actactgaca ctctcatcaa 4500
gacctttgtg cgctcgcaga ccacccaagg gtctggtgtg gacgatcctg tgggagaagt 4560
ctctattcag gtggacttgt ttacacaccc tggtactggg gagcacaagg tcacagtgaa 4620
agtggtggct gccaatgacc tcaagtggca gacagcgggt atgttccggc ctttcgtgga 4680
ggtgactatg gttggcccac accaaagtga taagaagagg aagttcacaa ccaaatccaa 4740
aagcaacaac tgggccccca agtacaatga gacattccac ttcctcctgg gaaatgagga 4800
ggggcccgag tcctatgagt tgcagatatg cgtgaaggat tactgctttg cccgggaaga 4860
tcgcgtgcta gggctggctg tgatgcctct gagggatgtc acagccaagg gcagctgtgc 4920
ctgctggtgc cccttgggcc ggaagatcca tatggatgag acaggcctga ccattctccg 4980
gattttatct cagaggagca atgacgaggt ggcccgagaa tttgtgaaac tcaaatcaga 5040
gtctcgttcc acggaggagg ggagctgaac accttcgact cctgtgccaa tcaggcagca 5100
gcaatttcac aaatcagggc cagtgggagt tagctgtgta accggcttag ggtctttgca 5160
gtcaagaggc tgaccccttc agttaaagat atttaaggaa aaatttgggg tggtgataat 5220
atggcttttc acagaaaggg tcatgaagcc ctggcccaac aggactgtgg tactaggggc 5280
tgggatgtgg ggttaccaca tggagagatt ttccattaag agagaaggac aaacatttct 5340
gagagtgtca gccattcttg gtagacacct ctccactcct catcccacct ctacccatct 5400
ccatgccaca ccttatccag ttagacacat acataccaat cattagaaga acaagtttag 5460
aaggtgtgga acttgtgcct ggctggctgg gtagtcagct gagcctgttg ctgagcccgg 5520
tggtctggat tggagtatgg ccagggcagg agtacacaga atagaattta gactgtccct 5580
tgagtagaat ccactgattt tctgtggctc cagtgagaac aaggctttga aactgaacaa 5640
gataacttct agaaatgaac tgtactaatc cctttcccca gattgtatca tgagtagaat 5700
caggttcacg tggtgcttca aagccctgag aagaatattt ctttggaccc caggcactag 5760
gggccacctg cctgggagtc tccctgcctc actcctctag gcaggggagt gatgcttcag 5820
gacgtgacag gctgttctaa catgtgtcta cctgagggct agttgaagga tccaggagta 5880
ttttcttctt gggtgggccc tgaacaaagc caaaaattgt agaaaccagt ctagaaaaag 5940
tcctgctcat ctgtggccac tgccttctag ccgtcctcca ccttgcagaa agaatctagc 6000
ctttggtctc tctctctctc atcggggtca tttgctattc ccctctgata ttcaacccta 6060
tagaaggagc ctggactctg atccctctgt acaggctgga tggaaggggc cctccacact 6120
tcctgggagg tcagagacaa actgtttcag agagtcagat ggacttccca agacttgttg 6180
agagatgtga catggttctt ggatttcctc tgtagcagcc tcctggactt cctgaggact 6240
cgacattgtc cacagatgta ctggccatta catgaaacaa gaaaccaagc atctttgctg 6300
ttgttaatta ttatatgtgc cattgttaca ggagattata ggctagtctg taataaatta 6360
tcttatagca aaaaaaaaaa aaaaaaaaaa aaaaaaaa 6398
<210> 48
<211> 3311
<212> DNA
<213> 智人
<400> 48
cgcccgggca ggtgaaaggt tttgtctatt tctgttcctt gttgaatctc tagtacctag 60
aaccatgtct ggtcctgatt aggcacttgg tgaatgtttt tgaatgaata ctctgagctg 120
ttctttaatc ggtcctcatg atcctcattg tacagatgag ggaactctgg gcgaacctgg 180
cctgggtctt gagctaatta cgggtaggtc aggttctgta cccaagtagt acacacagtg 240
atgggcgggg tggcctgggg ccgtggtttg tcaaccccta cgctggaggg tgatgttttg 300
gtacaagagg agaggtgccc caatgcgtcc tgtgtctgta attgatggcg ttgtctgtgt 360
ttccccagga tgtggttctg agacagtccc tgtccctgat ggcccacgga gcgactcggt 420
ggaaggaagt cccttccgtc ccccgtcaca ctccttctct gccgtcttcg atgaagacaa 480
gccgatagcc agcagtggga cttacaactt ggactttgac aacattgagc ttgtggatac 540
ctttcagacc ttggagcctc gtgcctcaga cgctaagaat caggagggca aagtgaacac 600
acggaggaag tccacggatt ccgtccccat ctctaagtct acactgtccc ggtcgctcag 660
cctgcaagcc agtgactttg atggtgcttc ttcctcaggc aatcccgagg ccgtggccct 720
tgccccagat gcatatagca cgggttccag cagtgcttct agtaccctta agcgaactaa 780
aaaaccgagg ccgccttcct taaaaaagaa acagaccacc aagaaaccca cagagacccc 840
cccagtgaag gagacgcaac aggagccaga tgaagagagc cttgtcccca gtggggagaa 900
tctagcatct gagacgaaaa cggaatctgc caagacggaa ggtcctagcc cagccttatt 960
ggaggagacg ccccttgagc ccgctgtggg gcccaaagct gcctgccctc tggactcaga 1020
gagtgcagaa ggggttgtcc ccccggcttc tggaggtggc agagtgcaga actcaccccc 1080
tgtcgggagg aaaacgctgc ctcttaccac ggccccggag gcaggggagg taaccccatc 1140
ggatagcggg gggcaagagg actctccagc caaagggctc tccgtaaggc tggagtttga 1200
ctattctgag gacaagagta gttgggacaa ccagcaggaa aacccccctc ctaccaaaaa 1260
gataggcaaa aagccagttg ccaaaatgcc cctgaggagg ccaaagatga aaaagacacc 1320
cgagaaactt gacaacactc ctgcctcacc tcccagatcc cctgctgaac ccaatgacat 1380
ccccattgct aaaggtactt acacctttga tattgacaag tgggatgacc ccaattttaa 1440
ccctttttct tccacctcaa aaatgcagga gtctcccaaa ctgccccaac aatcatacaa 1500
ctttgaccca gacacctgtg atgagtccgt tgaccccttt aagacatcct ctaagacccc 1560
cagctcacct tctaaatccc cagcctcctt tgagatccca gccagtgcta tggaagccaa 1620
tggagtggac ggggatgggc taaacaagcc cgccaagaag aagaagacgc ccctaaagac 1680
tgacacattt agggtgaaaa agtcgccaaa acggtctcct ctctctgatc caccttccca 1740
ggaccccacc ccagctgcta caccagaaac accaccagtg atctctgcgg tggtccacgc 1800
cacagatgag gaaaagctgg cggtcaccaa ccagaagtgg acgtgcatga cagtggacct 1860
agaggctgac aaacaggact acccgcagcc ctcggacctg tccacctttg taaacgagac 1920
caaattcagt tcacccactg aggagttgga ttacagaaac tcctatgaaa ttgaatatat 1980
ggagaaaatt ggctcctcct tacctcagga cgacgatgcc ccgaagaagc aggccttgta 2040
ccttatgttt gacacttctc aggagagccc tgtcaagtca tctcccgtcc gcatgtcaga 2100
gtccccgacg ccgtgttcag ggtcaagttt tgaagagact gaagcccttg tgaacactgc 2160
tgcgaaaaac cagcatcctg tcccacgagg actggcccct aaccaagagt cacacttgca 2220
ggtgccagag aaatcctccc agaaggagct ggaggccatg ggcttgggca ccccttcaga 2280
agcgattgaa attagagagg ctgctcaccc aacagacgtc tccatctcca aaacagcctt 2340
gtactcccgc atcgggaccg ctgaggtgga gaaacctgca ggccttctgt tccagcagcc 2400
cgacctggac tctgccctcc agatcgccag agcagagatc ataaccaagg agagagaggt 2460
ctcagaatgg aaagataaat atgaagaaag caggcgggaa gtgatggaaa tgaggaaaat 2520
agtggccgag tatgagaaga ccatcgctca gatgatagag gacgaacaga gagagaagtc 2580
agtctcccac cagacggtgc agcagctggt tctggagaag gagcaagccc tggccgacct 2640
gaactccgtg gagaagtctc tggccgacct cttcagaaga tatgagaaga tgaaggaggt 2700
cctagaaggc ttccgcaaga atgaagaggt gttgaagaga tgtgcgcagg agtacctgtc 2760
ccgggtgaag aaggaggagc agaggtacca ggccctgaag gtgcacgcgg aggagaaact 2820
ggacagggcc aatgctgaga ttgctcaggt tcgaggcaag gcccagcagg agcaagccgc 2880
ccaccaggcc agcctgcgga aggagcagct gcgagtggac gccctggaaa ggacgctgga 2940
gcagaagaat aaagaaatag aagaactcac caagatttgt gacgaactga ttgccaaaat 3000
ggggaaaagc taactctgaa ccgaatgttt tggacttaac tgttgcgtgc aatatgaccg 3060
tcggcacact gctgttcctc cagttccatg gacaggttct gttttcactt tttcgtatgc 3120
actactgtat ttcctttcta aataaaattg atttgattgt atgcagtact aaggagacta 3180
tcagaatttc ttgctattgg tttgcatttt cctagtataa ttcatagcaa gttgacctca 3240
gagttcctgt atcagggaga ttgtctgatt ctctaataaa agacacattg ctgaaaaaaa 3300
aaaaaaaaaa a 3311

Claims (107)

1.一种用于确定从患者获得的肺组织样品的腺癌(AD)亚型的方法,该方法包括检测表1的至少一种分类器生物标记物的表达水平,其中对该分类器生物标记物的表达水平的检测特异性地鉴定末端呼吸单元(TRU)、近端增生(PP)或近端炎症(PI)AD亚型。
2.权利要求1的方法,其中该方法还包括将检测到的表1的该至少一种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考AD TRU样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PP样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PI样品的表1的该至少一种分类器生物标记物的表达数据或其组合;并且基于该比较步骤的结果将该样品分类为TRU、PP或PI亚型。
3.权利要求2的方法,其中该比较步骤包括应用统计算法,该统计算法包括确定从该样品获得的该表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于该统计算法的结果将该样品分类为TRU、PP或PI亚型。
4.上述权利要求中任一项的方法,其中在核酸水平上检测该分类器生物标记物的该表达水平。
5.权利要求4的方法,其中该核酸水平是RNA或cDNA。
6.权利要求4或5的方法,其中对表达水平的该检测包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。
7.权利要求6的方法,其中通过进行qRT-PCR检测该表达水平。
8.权利要求7的方法,其中对该表达水平的该检测包括使用对表1的至少一种分类器生物标记物有特异性的至少一对寡核苷酸引物。
9.上述权利要求中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
10.权利要求9的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
11.上述权利要求中任一项的方法,其中该至少一种分类器生物标记物包含多种分类器生物标记物。
12.权利要求11的方法,其中该多种分类器生物标记物包含表1的至少两种分类器生物标记物、至少8种分类器生物标记物、至少16种分类器生物标记物、至少24种分类器生物标记物、至少32种分类器生物标记物、至少40种分类器生物标记物、或至少48种分类器生物标记物。
13.权利要求1-10中任一项的方法,其中该至少一种分类器生物标记物包含表1的所有分类器生物标记物。
14.一种用于确定从患者获得的肺组织样品的腺癌(AD)亚型的方法,该方法包括检测编码在肺癌细胞中具有特定表达模式的分类器生物标记物的至少一种核酸分子的表达水平,其中该分类器生物标记物选自下组,该组由表1中列出的分类器基因组成,该方法包括:(a)从来自患者的肺组织样品中分离核酸材料;(b)将该核酸材料与基本上与该分类器生物标记物的核酸分子的部分互补的寡核苷酸混合;并且(c)检测该分类器生物标记物的表达。
15.权利要求14的方法,其中该方法还包括将表1的该至少一种分类器生物标记物的检测到的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考AD TRU样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PP样品的表1的该至少一种分类器生物标记物的表达数据、来自参考AD PI样品的表1的该至少一种分类器生物标记物的表达数据或其组合;并且基于该比较步骤的结果将该样品分类为TRU、PP或PI亚型。
16.权利要求15的方法,其中该比较步骤包括应用统计算法,该统计算法包括确定从该样品获得的该表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于该统计算法的结果将该样品分类为TRU、PP或PI亚型。
17.权利要求14-16中任一项的方法,其中对该表达水平的该检测包括进行qRT-PCR或任何基于杂交的基因测定。
18.权利要求17的方法,其中通过进行qRT-PCR检测该表达水平。
19.权利要求18的方法,其中对该表达水平的该检测包括使用对表1的至少一种分类器生物标记物有特异性的至少一对寡核苷酸引物。
20.权利要求14-19中任一项的方法,还包括基于检测到的该分类器生物标记物的表达水平预测对用于治疗肺腺癌(AD)亚型的疗法的反应。
21.权利要求20的方法,其中该疗法是化学疗法、血管生成抑制剂和/或免疫疗法。
22.权利要求21的方法,其中该肺AD亚型是TRU,并且该疗法是化学疗法或血管生成抑制剂。
23.权利要求21的方法,其中该肺AD亚型是PP,并且该疗法是化学疗法。
24.权利要求21的方法,其中该肺AD亚型是PI,并且该疗法是免疫疗法。
25.权利要求14-24中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
26.权利要求25的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
27.权利要求14-26中任一项的方法,其中编码分类器生物标记物的该至少一种核酸分子包含编码多种分类器生物标记物的多种核酸分子。
28.权利要求27的方法,其中该多种分类器生物标记物包含表1的至少两种分类器生物标记物、至少5种分类器生物标记物、至少10种分类器生物标记物、至少20种分类器生物标记物、或至少30种分类器生物标记物。
29.权利要求14-26中任一项的方法,其中该至少一种分类器生物标记物包含表1的所有分类器生物标记物。
30.一种检测从患者获得的肺组织样品中的生物标记物的方法,该方法包括使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。
31.权利要求30的方法,其中该肺组织样品先前被诊断为是腺癌。
32.权利要求31的方法,其中该先前的诊断是通过组织学检查。
33.权利要求30-32中任一项的方法,其中该扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。
34.权利要求33的方法,其中通过进行qRT-PCR检测该表达水平。
35.权利要求34的方法,其中对该表达水平的该检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。
36.权利要求30-35中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
37.权利要求36的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
38.权利要求30-37中任一项的方法,其中该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。
39.权利要求30-37中任一项的方法,其中该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
40.一种检测从患者获得的肺组织样品中的生物标记物的方法,该方法基本上由以下组成:使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。
41.权利要求40的方法,其中该肺组织样品先前被诊断为是腺癌。
42.权利要求41的方法,其中该先前的诊断是通过组织学检查。
43.权利要求40-42中任一项的方法,其中该扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。
44.权利要求43的方法,其中通过进行qRT-PCR检测该表达水平。
45.权利要求44的方法,其中对该表达水平的该检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。
46.权利要求40-45中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
47.权利要求46的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
48.权利要求40-47中任一项的方法,其中该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。
49.权利要求40-47中任一项的方法,其中该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
50.一种检测从患者获得的肺组织样品中的生物标记物的方法,该方法由以下组成:使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。
51.权利要求50的方法,其中该肺组织样品先前被诊断为是腺癌。
52.权利要求51的方法,其中该先前的诊断是通过组织学检查。
53.权利要求50-52中任一项的方法,其中该扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。
54.权利要求53的方法,其中通过进行qRT-PCR检测该表达水平。
55.权利要求54的方法,其中对该表达水平的该检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。
56.权利要求50-55中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
57.权利要求56的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
58.权利要求50-57中任一项的方法,其中该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。
59.权利要求50-57中任一项的方法,其中该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
60.一种确定腺癌患者是否可能对免疫疗法有反应的方法,该方法包括,确定来自该患者的肺组织样品的腺癌亚型,其中该腺癌亚型选自下组,该组由以下组成:鳞状型(近端炎症型)、支气管型(末端呼吸单元型)和巨型(近端增生型);并且
基于该亚型,评估该患者是否可能对免疫疗法有反应。
61.一种用于选择腺癌患者进行免疫疗法的方法,该方法包括确定来自该患者的肺组织样品的腺癌亚型;并且基于该亚型选择患者进行免疫疗法。
62.权利要求60或61的方法,其中,该免疫疗法包括检查点抑制剂疗法。
63.权利要求62的方法,其中该检查点抑制剂靶向PD-1或PD-L1。
64.权利要求62的方法,其中该检查点抑制剂靶向CTLA-4。
65.权利要求63的方法,其中该检查点抑制剂是派姆单抗、纳武单抗或其抗原片段结合片段。
66.权利要求64的方法,其中该检查点抑制剂是伊匹单抗或其抗原结合片段。
67.权利要求60-66中任一项的方法,其中最初该患者经由样品的组织学分析被确定患有腺癌。
68.权利要求60-67中任一项的方法,其中该患者的腺癌分子亚型选自鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型),并且经由对从该患者获得的样品的组织学分析来确定。
69.权利要求67-68中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体或体液。
70.权利要求69的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
71.权利要求60-70中任一项的方法,其中对该腺癌亚型的该确定包括确定多种分类器生物标记物的表达水平。
72.权利要求71的方法,其中对该多种分类器生物标记物的表达水平的该确定是在核酸水平上通过进行RNA测序、逆转录酶聚合酶链反应(RT-PCR)或基于杂交的分析来进行。
73.权利要求71或72的方法,其中,用于确定该腺癌亚型的该多种分类器生物标记物选自可公开获得的肺腺癌数据集。
74.权利要求73的方法,其中该可公开获得的肺腺癌数据集是TCGA肺ADRNAseq数据集。
75.权利要求72的方法,其中用于确定该腺癌亚型的该多种分类器生物标记物选自表1。
76.权利要求75的方法,其中该RT-PCR是定量实时逆转录酶聚合酶链反应(qRT-PCR)。
77.权利要求76的方法,其中使用对表1的该多种分类器生物标记物有特异性的引物进行该RT-PCR。
78.权利要求71-77中任一项的方法,还包括:将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该多种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包括来自参考腺癌TRU样品的表1的该多种分类器生物标记物的表达数据、来自参考腺癌PP样品的表1的该多种分类器生物标记物的表达数据、来自参考腺癌PI样品的表1的该多种分类器生物标记物的表达数据、或其组合;并且基于该比较步骤的结果将该第一样品分类为TRU、PP或PI。
79.权利要求78的方法,其中该比较步骤包括应用统计算法,该统计算法包括确定从该样品获得的该表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于该统计算法的结果将该样品分类为TRU、PP或PI亚型。
80.权利要求71-79中任一项的方法,其中该多种分类器生物标记物包含表1中列出的分类器生物标记物中的每一种。
81.一种治疗受试者中的肺癌的方法,该方法包括:
测量从该受试者获得的肺癌样品中至少一种生物标记物核酸的表达水平,其中该至少一种生物标记物核酸选自表1中列出的一组生物标记物,其中该至少一种生物标记物的存在、不存在和/或水平指示肺癌的亚型;并且
基于肺癌的该亚型给予免疫治疗剂。
82.权利要求81的方法,其中该肺癌样品是腺癌肺癌样品。
83.权利要求82的方法,其中选自该组生物标记物的该至少一种生物标记物核酸包含表1的至少两种生物标记物核酸、至少8种生物标记物核酸、至少16种生物标记物核酸、至少32种生物标记物核酸、或所有48种生物标记物核酸,基本上由其组成或由其组成。
84.权利要求81-83中任一项的方法,其中该肺组织样品先前被诊断为是腺癌。
85.权利要求84的方法,其中该先前的诊断是通过组织学检查。
86.权利要求81-85中任一项的方法,还包括:测量来自另外一组生物标记物的至少一种生物标记物的表达。
87.权利要求86的方法,其中该另外一组生物标记物包括先天性免疫细胞(IIC)、适应性免疫细胞(AIC)的基因表达标签,一种或多种个体免疫生物标记物,一种或多种干扰素(IFN)基因,一种或多种主要组织相容性复合物II类(MHCII)基因或其组合。
88.权利要求87的方法,其中该另外一组生物标记物包含选自表4A、表4B、表5、表6、表7或其组合的基因。
89.权利要求87的方法,其中该AIC的基因表达标签选自表4A。
90.权利要求87的方法,其中该IIC的基因表达标签选自表4B。
91.权利要求87的方法,其中该一种或多种个体免疫生物标记物选自表5。
92.权利要求87的方法,其中该一种或多种IFN基因选自表6。
93.权利要求87的方法,其中该一种或多种MHCII基因选自表7。
94.权利要求81-93中任一项的方法,其中对该表达水平的该测量是使用扩增、杂交和/或测序测定来进行。
95.权利要求94的方法,其中该扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。
96.权利要求95的方法,其中通过进行qRT-PCR检测该表达水平。
97.权利要求81-96中任一项的方法,其中该样品是从该患者获得的福尔马林固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
98.权利要求97的方法,其中该体液是血液或其部分、尿液、唾液或痰液。
99.权利要求81-98中任一项的方法,其中该受试者的腺癌亚型选自鳞状型(近端炎症型)、支气管型(末端呼吸单元型)或巨型(近端增生型)。
100.权利要求99的方法,其中该肺癌亚型是近端炎症型的,并且其中该免疫治疗剂包含检查点抑制剂。
101.权利要求100的方法,其中该检查点抑制剂靶向PD-1或PD-L1。
102.权利要求100的方法,其中该检查点抑制剂靶向CTLA-4。
103.权利要求101的方法,其中该检查点抑制剂是派姆单抗、纳武单抗或其抗原片段结合片段。
104.权利要求102的方法,其中该检查点抑制剂是伊匹单抗或其抗原结合片段。
105.权利要求81的方法,其中该至少一种生物标记物核酸是多种生物标记物核酸,其中该多种生物标记物核酸包含表1中所列出的至少一种生物标记物核酸与来自可公开获得的肺腺癌数据集的一种或多种生物标记物核酸的组合,其中该多种生物标记物核酸的存在、不存在和/或水平指示肺癌的亚型。
106.权利要求81的方法,其中该至少一种生物标记物核酸是多种生物标记物核酸,其中该多种生物标记物核酸包含表1中所列出的所有生物标记物核酸与来自可公开获得的肺腺癌数据集的一种或多种生物标记物核酸的组合,其中该多种生物标记物核酸的存在、不存在和/或水平指示肺癌的亚型。
107.权利要求105或106的方法,其中,该可公开获得的肺腺癌数据集是TCGA肺ADRNAseq数据集。
CN201780044229.7A 2016-05-17 2017-05-17 对肺腺癌亚型分型的方法 Active CN109790583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310993898.6A CN116987790A (zh) 2016-05-17 2017-05-17 对肺腺癌亚型分型的方法

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201662337645P 2016-05-17 2016-05-17
US201662337591P 2016-05-17 2016-05-17
US62/337,591 2016-05-17
US62/337,645 2016-05-17
US201662396587P 2016-09-19 2016-09-19
US62/396,587 2016-09-19
US201662420836P 2016-11-11 2016-11-11
US62/420,836 2016-11-11
US201662425717P 2016-11-23 2016-11-23
US62/425,717 2016-11-23
PCT/US2017/033110 WO2017201165A1 (en) 2016-05-17 2017-05-17 Methods for subtyping of lung adenocarcinoma

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310993898.6A Division CN116987790A (zh) 2016-05-17 2017-05-17 对肺腺癌亚型分型的方法

Publications (2)

Publication Number Publication Date
CN109790583A true CN109790583A (zh) 2019-05-21
CN109790583B CN109790583B (zh) 2023-08-25

Family

ID=60326094

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310993898.6A Pending CN116987790A (zh) 2016-05-17 2017-05-17 对肺腺癌亚型分型的方法
CN201780044229.7A Active CN109790583B (zh) 2016-05-17 2017-05-17 对肺腺癌亚型分型的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310993898.6A Pending CN116987790A (zh) 2016-05-17 2017-05-17 对肺腺癌亚型分型的方法

Country Status (6)

Country Link
US (2) US10934595B2 (zh)
EP (1) EP3458612B1 (zh)
JP (1) JP7241353B2 (zh)
CN (2) CN116987790A (zh)
CA (1) CA3024747A1 (zh)
WO (1) WO2017201165A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112034185A (zh) * 2020-09-11 2020-12-04 上海市胸科医院 Gpr110、vegfr、cd34在鉴别肺腺癌亚型中的用途
WO2021037134A1 (zh) * 2019-08-27 2021-03-04 上海善准生物科技有限公司 肺腺癌分子分型及生存风险基因群及诊断产品和应用
CN112530595A (zh) * 2020-12-21 2021-03-19 无锡市第二人民医院 一种基于多分支链式神经网络的心血管疾病分类方法和装置
CN114480644A (zh) * 2022-01-07 2022-05-13 深圳市龙华区人民医院 肺腺癌基于代谢基因的分子分型
CN114574589A (zh) * 2022-04-28 2022-06-03 深圳市第二人民医院(深圳市转化医学研究院) 标志物znf207在制备肺腺癌诊断试剂中的应用及诊断试剂盒
CN115862876A (zh) * 2023-03-02 2023-03-28 北京师范大学 基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质
CN116403648A (zh) * 2023-06-06 2023-07-07 中国医学科学院肿瘤医院 一种基于多维分析建立的小细胞肺癌免疫新分型方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107208131A (zh) 2014-05-30 2017-09-26 基因中心治疗公司 用于肺癌分型的方法
US11041214B2 (en) 2016-05-17 2021-06-22 Genecentric Therapeutics, Inc. Methods for subtyping of lung squamous cell carcinoma
WO2017201165A1 (en) 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung adenocarcinoma
JP7429539B2 (ja) * 2017-12-01 2024-02-08 イルミナ インコーポレイテッド 薬効を評価するためのシステム及び方法
US11414698B2 (en) * 2018-03-22 2022-08-16 Chang Gung Medical Foundation Chang Gung Memorial Hospital At Chiayi Method of quantifying mutant allele burden of target gene
CA3105292A1 (en) * 2018-08-10 2020-02-13 Omniseq, Inc. Methods and systems for assessing proliferative potential and resistance to immune checkpoint blockade
CA3115922A1 (en) 2018-10-09 2020-04-16 Genecentric Therapeutics, Inc. Detecting cancer cell of origin
WO2020081463A1 (en) * 2018-10-18 2020-04-23 Verily Life Sciences Llc Systems and methods for using image processing to generate inferences of biomarker for immunotherapy
EP4313314A1 (en) * 2021-03-30 2024-02-07 Genecentric Therapeutics, Inc. Methods for assessing proliferation and anti-folate therapeutic response
CN113687076B (zh) * 2021-07-14 2024-03-01 郑州大学 一种可用于肺腺癌早期诊断的联合检测血清标志物及其应用
WO2023010327A1 (zh) * 2021-08-04 2023-02-09 杭州浙大迪迅生物基因工程有限公司 一种人白三烯受体CysLTR2 mRNA RT-PCR检测用引物探针组和试剂盒
CN113981093B (zh) * 2021-11-26 2023-06-16 大连医科大学附属第一医院 Inpp4b基因表达量的检测剂在制备用于预测肺腺癌放疗敏感性的试剂盒的应用
WO2023244582A1 (en) * 2022-06-13 2023-12-21 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Lung cancer-related biomarkers and methods of using the same
CN117635612A (zh) * 2024-01-25 2024-03-01 天津博思特医疗科技有限责任公司 一种肺部ct图像的识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006792A (ja) * 2005-06-30 2007-01-18 Hitachi Software Eng Co Ltd 肺腺癌の胸膜浸潤を判別するための遺伝子セット
WO2009146545A1 (en) * 2008-06-05 2009-12-10 University Health Network Compositions and methods for classifying lung cancer and prognosing lung cancer survival
US20150057335A1 (en) * 2013-08-20 2015-02-26 National Cancer Center Novel fusion genes identified in lung cancer
US20150346208A1 (en) * 2014-05-29 2015-12-03 Spring Bioscience Corporation PD-L1 Antibodies and Uses Thereof

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4843155A (en) 1987-11-19 1989-06-27 Piotr Chomczynski Product and process for isolating RNA
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
ATE148889T1 (de) 1991-09-18 1997-02-15 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
EP0916396B1 (en) 1991-11-22 2005-04-13 Affymetrix, Inc. (a Delaware Corporation) Combinatorial strategies for polymer synthesis
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
EP0880598A4 (en) 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
DE69829402T2 (de) 1997-10-31 2006-04-13 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Expressionsprofile in adulten und fötalen organen
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6670321B1 (en) 1998-12-30 2003-12-30 The Children's Medical Center Corporation Prevention and treatment for retinal ischemia and edema
CA2432639A1 (en) 2000-11-16 2002-05-23 Cemines, Llc Profiling tumor specific markers for the diagnosis and treatment of neoplastic disease
US7473767B2 (en) 2001-07-03 2009-01-06 The Institute For Systems Biology Methods for detection and quantification of analytes in complex mixtures
EP1444361A4 (en) 2001-09-28 2006-12-27 Whitehead Biomedical Inst CLASSIFICATION OF LUNG CARCINOMAS BY GENE EXPRESSION ANALYSIS
TW200413725A (en) 2002-09-30 2004-08-01 Oncotherapy Science Inc Method for diagnosing non-small cell lung cancers
US20060024692A1 (en) 2002-09-30 2006-02-02 Oncotherapy Science, Inc. Method for diagnosing non-small cell lung cancers
WO2008151110A2 (en) 2007-06-01 2008-12-11 The University Of North Carolina At Chapel Hill Molecular diagnosis and typing of lung cancer variants
US9846162B2 (en) 2012-05-14 2017-12-19 Yale University Immune biomarkers and assays predictive of clinical response to immunotherapy for cancer
KR20210149870A (ko) * 2014-05-13 2021-12-09 메디뮨 리미티드 비-소세포 폐암을 치료하기 위한 항-b7-h1 및 항-ctla-4 항체
CN107208131A (zh) 2014-05-30 2017-09-26 基因中心治疗公司 用于肺癌分型的方法
CN114920840A (zh) * 2014-10-14 2022-08-19 诺华股份有限公司 针对pd-l1的抗体分子及其用途
WO2016168446A1 (en) 2015-04-14 2016-10-20 Genecentric Diagnostics, Inc. Methods for typing of lung cancer
US11041214B2 (en) 2016-05-17 2021-06-22 Genecentric Therapeutics, Inc. Methods for subtyping of lung squamous cell carcinoma
WO2017201165A1 (en) 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung adenocarcinoma
US11739386B2 (en) * 2017-07-21 2023-08-29 Genecentric Therapeutics, Inc. Methods for determining response to PARP inhibitors

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006792A (ja) * 2005-06-30 2007-01-18 Hitachi Software Eng Co Ltd 肺腺癌の胸膜浸潤を判別するための遺伝子セット
WO2009146545A1 (en) * 2008-06-05 2009-12-10 University Health Network Compositions and methods for classifying lung cancer and prognosing lung cancer survival
US20150057335A1 (en) * 2013-08-20 2015-02-26 National Cancer Center Novel fusion genes identified in lung cancer
US20150346208A1 (en) * 2014-05-29 2015-12-03 Spring Bioscience Corporation PD-L1 Antibodies and Uses Thereof

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
E. A. COLLISSON等: "Comprehensive molecular profiling of lung adenocarcinoma", 《NATURE》 *
GABRIELA BINDEA等: "Spatiotemporal Dynamics of Intratumoral Immune Cells Reveal the Immune Landscape in Human Cancer", 《IMMUNITY》 *
MATTHEW D. WILKERSON等: "Differential Pathogenesis of Lung Adenocarcinoma Subtypes Involving Sequence Mutations, Copy Number, Chromosomal Instability, and Methylation", 《PLOS ONE》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021037134A1 (zh) * 2019-08-27 2021-03-04 上海善准生物科技有限公司 肺腺癌分子分型及生存风险基因群及诊断产品和应用
CN112034185A (zh) * 2020-09-11 2020-12-04 上海市胸科医院 Gpr110、vegfr、cd34在鉴别肺腺癌亚型中的用途
CN112530595A (zh) * 2020-12-21 2021-03-19 无锡市第二人民医院 一种基于多分支链式神经网络的心血管疾病分类方法和装置
CN114480644A (zh) * 2022-01-07 2022-05-13 深圳市龙华区人民医院 肺腺癌基于代谢基因的分子分型
CN114574589A (zh) * 2022-04-28 2022-06-03 深圳市第二人民医院(深圳市转化医学研究院) 标志物znf207在制备肺腺癌诊断试剂中的应用及诊断试剂盒
CN114574589B (zh) * 2022-04-28 2022-08-16 深圳市第二人民医院(深圳市转化医学研究院) 标志物znf207在制备肺腺癌诊断试剂中的应用及诊断试剂盒
CN115862876A (zh) * 2023-03-02 2023-03-28 北京师范大学 基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质
CN115862876B (zh) * 2023-03-02 2023-05-26 北京师范大学 基于免疫微环境基因群预测肺腺癌患者预后的装置
CN116403648A (zh) * 2023-06-06 2023-07-07 中国医学科学院肿瘤医院 一种基于多维分析建立的小细胞肺癌免疫新分型方法
CN116403648B (zh) * 2023-06-06 2023-08-01 中国医学科学院肿瘤医院 一种基于多维分析建立的小细胞肺癌免疫新分型方法

Also Published As

Publication number Publication date
JP7241353B2 (ja) 2023-03-17
CN109790583B (zh) 2023-08-25
JP2019516407A (ja) 2019-06-20
US20190338365A1 (en) 2019-11-07
CN116987790A (zh) 2023-11-03
US20210222254A1 (en) 2021-07-22
EP3458612A4 (en) 2020-02-26
EP3458612A1 (en) 2019-03-27
EP3458612B1 (en) 2023-11-15
CA3024747A1 (en) 2017-11-23
WO2017201165A1 (en) 2017-11-23
US10934595B2 (en) 2021-03-02

Similar Documents

Publication Publication Date Title
CN109790583B (zh) 对肺腺癌亚型分型的方法
AU2019201577B2 (en) Cancer diagnostics using biomarkers
CN109863251B (zh) 对肺鳞状细胞癌亚型分型的方法
CN107743524B (zh) 前列腺癌预后的方法
KR102023584B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
CN106119405B (zh) 一种肺癌的预后标记物、使用该标记预测肺癌预后的方法及应用
AU2013277971B2 (en) Molecular malignancy in melanocytic lesions
DK2644712T3 (en) A method for diagnosing neoplasms
KR101446626B1 (ko) 신장암 진단, 신장암 환자 예후 예측을 위한 조성물 및 방법
US20030175736A1 (en) Expression profile of prostate cancer
KR20140044341A (ko) 암에 대한 분자적 진단 검사
KR20150090246A (ko) 암을 위한 분자 진단 테스트
AU2018210695A1 (en) Molecular subtyping, prognosis, and treatment of bladder cancer
CN110382521A (zh) 从氧化应激区分肿瘤抑制性foxo活性的方法
CN107077536A (zh) 使用靶基因表达的数学建模评价TGF‑β细胞信号传导途径的活性
CN101573453A (zh) 使用生物学途径基因表达分析来预测淋巴结阴性原发性乳腺癌的远处转移的方法
CN101258249A (zh) 检测黑素瘤的方法和试剂
KR20160117606A (ko) 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험
CN111183233A (zh) 使用靶基因表达的数学建模评估Notch细胞信号传导途径活性
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
CN101111768A (zh) 肺癌预后
US20200300859A1 (en) Modulating biomarkers to increase tumor immunity and improve the efficacy of cancer immunotherapy
WO2018132369A1 (en) Biomarkers predictive of anti-immune checkpoint response
CA2666057C (en) Genetic variations associated with tumors
CN111670364A (zh) 用于将癌症患者分类到合适的癌症治疗组的系统和方法以及治疗癌症患者的组合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant