CN1678741A - 用于检测基因多态性的方法 - Google Patents

用于检测基因多态性的方法 Download PDF

Info

Publication number
CN1678741A
CN1678741A CN03817304.2A CN03817304A CN1678741A CN 1678741 A CN1678741 A CN 1678741A CN 03817304 A CN03817304 A CN 03817304A CN 1678741 A CN1678741 A CN 1678741A
Authority
CN
China
Prior art keywords
nucleotide
dna
sequence
polymorphism
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN03817304.2A
Other languages
English (en)
Inventor
中村佑辅
关根章博
饭田有俊
斋藤督
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Independent Administrative Institution Physical Chemistry Institute
RIKEN Institute of Physical and Chemical Research
Original Assignee
Independent Administrative Institution Physical Chemistry Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Independent Administrative Institution Physical Chemistry Institute filed Critical Independent Administrative Institution Physical Chemistry Institute
Publication of CN1678741A publication Critical patent/CN1678741A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

一种用于检测编码细胞色素P450的基因中的遗传多态性的方法,其中包括将选自下列一组的至少一个成员用作寡核苷酸探针和/或寡核苷酸引物:包括SEQ ID NOS:1-215所示碱基序列中包括第21位碱基的至少13个碱基的序列,或与其互补的序列。

Description

用于检测基因多态性的方法
技术领域
本发明涉及遗传多态性信息;用于检测遗传多态性信息的方法;使用遗传多态性评估药物的方法;和用于筛选药物的方法。
技术背景
与人类个体的身体外观变化无穷一样,在个体之间进行比较后发现,由三十亿(3,000,000,000)个碱基对组成的人类遗传密码在相当多的位点上存在变化。遗传密码中的这些差异称为遗传多态性,而单核苷酸多态性已知是具有代表性的多态性。
单核苷酸多态性(SNP)指个体间一个DNA字母的差异。就像人类个体的相貌和体型变化无穷一样,个体的核苷酸序列(即遗传密码)在相当多的位点上存在变化。根据SNP的位置,将它们划分成cSNP(编码SNP)和gSNP(基因组SNP);cSNP可进一步分成sSNP(沉默SNP)、rSNP(调控SNP)、和iSNP(内含子SNP)。
这些SNP可以作为多态标记用于搜索那些与疾病的发展或恶化有关的基因;最后,在临床领域,这些SNP直接涉及疾病的风险诊断或者治疗性药物的选择和使用。同样,根据使用病因性物质作为靶分子获得的证据来开发药物已经成为世界趋势。在对患有相同疾病的患者施用药物后,他们的响应度是多样性的。有些患者显示显著效果;有些患者显示较低效果;而有些患者显示没有效果。因此,对药物的响应度随患者存在极大变化。即使患者的状况是相同的,而且诊断患有相同疾病,然而引起该疾病的路径可能是不同的;或者,药物代谢速度可能在患者间存在极大变化。因此,希望根据诸如SNP的遗传多态性而针对目标疾病选择合适药物,并开发合适治疗方法(即希望所谓的定制化医学)。
除了对药物的响应度以外,有时可能致命的强烈副作用也是医务人员应当考虑的主要问题之一。即使没有由配方错误等引起的过量施用,仍然可能发生意外的致命副作用。因此,在对药物的响应方面,考虑到诸如SNPs的遗传多态性,需要确定在药物代谢、药物输送、和反应强度或药物受体的副作用方面的个体间差异。
本发明的目的是提供用于检测遗传多态性信息的方法;根据所述信息评估药物的功效和安全性的方法;以及用于筛选药物的方法。
发明描述
作为解决上述问题的广泛且深入研究的结果,本发明人成功建立了如下方法,包括:检测编码药物代谢酶的基因中的遗传多态性,并且利用所得到的信息评估药物和疾病之间的因果关系。由此完成了本发明。
对本发明的说明如下。
(1)一种用于检测编码细胞色素P450的基因中的遗传多态性的方法,其中将选自下列一组的至少一种序列用作寡核苷酸探针和/或寡核苷酸引物:SEQ ID NOS:1-215所示的任意核苷酸序列中的至少13个核苷酸的序列,所述至少13个核苷酸的序列包括第21位核苷酸,或与所述至少13个核苷酸的序列互补的序列。
遗传多态性包括单核苷酸多态性,由多个核苷酸的缺失、取代或插入所导致的多态性,或VNTR或微卫星型多态性。在表1中列举了本发明的遗传多态性信息。
(2)一种评估药物的方法,包括根据通过上述(1)所提到的方法获得的检测结果,评估由细胞色素P450代谢的药物的效力和安全性。
(3)一种筛选药物的方法,包括参考通过如上述(2)提到的方法获得的评估结果选择要使用的药物。
(4)一种筛选药物的方法,包括将有关编码细胞色素P450的基因和/或其互补序列中的多态性信息(例如在表1中示出的信息)与从受试者获得的有关编码细胞色素P450的基因和/或其互补序列中的多态性信息进行比较;分析由细胞色素P450代谢的药物的效力和/或安全性;和根据所获得的分析结果选择要使用的药物。
(5)上述(1)-(4)提到的方法,其中,所述细胞色素P450是选自下列一组的至少一种:2A6,2A13,2B6,2E,2S1,5A1,7A1和7B1。
(6)选自由下述组成的组的寡核苷酸:SEQ ID NOS:1-215所示的核苷酸序列及其互补序列。
(7)根据有关编码细胞色素P450的基因和/或其互补序列内的多态性信息制备的、包括存在于该基因和/或其互补序列中存在的基因多态性位点的寡核苷酸。
在这种情况下,可以将所述寡核苷酸设计成位于所述寡核苷酸的5′-末端、3′-末端或中央的核苷酸相当于所述基因多态性位点。
作为包括基因多态性位点的寡核苷酸的更具体的例子,可以指出的有由彼此连接在一起的两个片段组成的寡核苷酸,其中一个片段能够与编码细胞色素P450的基因或其互补序列杂交,而另一个片段不能够与之杂交,并且,所述多态性位点位于所述可杂交片段的5′-末端或3′-末端。
更具体地讲,所述寡核苷酸序列包括SEQ ID NOS:1-215所示的任意核苷酸序列内的至少13个核苷酸的序列,所述至少13个核苷酸的序列包括第21个核苷酸,或互补于所述至少13个核苷酸的序列的序列。
(8)寡核苷酸,它是在包括SEQ ID NOS:1-215所示的任意核苷酸序列内的基因多态性位点的基因组DNA区基础上设计的,以便它位于多态性位点朝向所述基因组DNA区的5′-末端和/或3′-末端的1000bp内,并且其长度为13-60个核苷酸。
(9)微阵列,其中,上述(6)-(8)所述寡核苷酸序列固定在支持物上。
(10)遗传多态性检测试剂盒,包括上述(6)-(8)所述寡核苷酸和/或上述(9)所述微阵列。
附图的简要说明
图1是表示TaqMan探针的示意图。
图2是表示TaqMan PCR概况的示意图。
图3是表示用荧光染料标记过的探针的示意图。
图4A是表示入侵者方法的概况的示意图。
图4B是表示入侵者探针和等位基因探针之间的位置关系的示意图。
图4C是表示入侵者探针和等位基因探针之间的位置关系的示意图。
图5是表示FRET探针的示意图。
图6是表示入侵者方法概况的示意图。
图7是表示不与等位基因匹配的探针的示意图。
图8是表示通过连接反应进行等位基因甄别的概况的示意图。
图9是表示CYP2A6细胞色素P450(IIA亚家族(苯巴比妥可诱导型),多肽6)基因结构,和SNPs位点的示意图。
入藏登记号:NG_000008.2
图10是表示CYP2A13细胞色素P450(IIA亚家族(苯巴比妥可诱导型),多肽13)基因结构,和SNPs位点的示意图。
入藏登记号:AC008962.9
图11是表示CYP2B6细胞色素P450(IIB亚家族(苯巴比妥可诱导型),多肽6)基因结构,和SNPs位点的示意图。
入藏登记号:NG_000010.1
图12是表示CYP2E细胞色素P450(IIE亚家族(乙醇可诱导型))基因结构,和SNPs位点的示意图。
入藏登记号:AL161645.14
图13是表示CYP2S1细胞色素P450(IIS亚家族,多肽1)基因结构,和SNPs的位点的示意图。
入藏登记号:NG_000011.1
图14是表示TBXAS1血栓烷A合成酶1(血小板,细胞色素P450,亚家族V)(CYP5A1)基因结构,和SNPs的位点的示意图。
入藏登记号:AC006021.2,AC004914.1,和AC004961.2
图15是表示CYP7A1细胞色素P450(亚家族VIIA(胆甾醇7α-单氧化酶),多肽1)基因结构,和SNPs位点的示意图。
入藏登记号:AC020782.10
图16是表示CYP7B1细胞色素P450(亚家族VIIB(Oxysterol7α-羟化酶),多肽1)基因结构,和SNPs位点的示意图。
入藏登记号:AF127089.1,AF176800.1,和AF215845.2
图17表示通过入侵者分析对两不同组的受试者进行定型的结果。
下面将对本发明作详细说明。
本发明涉及用于检测受试者内的遗传多态性的方法,其中使用有关编码药物代谢酶的基因、特别是编码细胞色素P450的基因和/或其互补序列内的遗传多态性的信息。本发明的特征还在于,分析所述药物的效力和安全性的/存在与否或强度;根据所述分析结果,评估疾病和药物之间的关系。即使多个患者患有相同的疾病,相当常见的是,有关药物代谢酶基因的遗传多态性信息在不同患者之间存在差异。因此,根据个体间遗传多态性信息的差异,描绘出药物反应的差异;然后,评估所述药物的效力或安全性(即当患者具有这样那样的遗传多态性信息时,所述特定药物的效力得到认可或不被认可,或当患者具有这样那样的遗传多态性信息时,副作用经常发生或很少发生)。根据以上结果,可以确定应当将哪一种药物用于特定的疾病,以及根据他/她的遗传多态性信息,给予适合患者个体的药物(定制医药)。
1.定义
下面将对本说明书中使用的术语进行解释。
术语″药物代谢酶″是用于表示催化包括药物在内的外源物质发生体内结构转化的酶的通用名词。与某些内源物质代谢相关的酶也包含在药物代谢酶的范围内,只要它们是出于治疗目的而使用的即可。
术语″效力″表示在给受试者施用药物时,对所述受试者具有有利作用(效力)的药物的特性。术语“安全性”是在给受试者给予药物时会对所述受试者产生负面影响或副作用的药物的特性。
术语″遗传多态性信息″包括基因的多态性信息和它的互补序列中的多态性信息。
术语″治疗″表示病症或疾病的至少一种症状得到了治愈或缓解。
术语″筛选″表示筛选药物候选物的步骤,并且表示通过筛选多种测试物质而缩小药物候选物范围的步骤。
术语″基因″表示没有编码功能的RNA(例如,核糖体RNA或转移RNA),生产多肽或前体所必需的调控序列,和具有编码序列的DNA序列。所述RNA或多肽可以是由完整长度的编码序列或所述编码序列的一部分编码的,只要该部分能够提供需要的活性或功能就行。
术语″野生型″表示从天然来源中分离的基因或基因产物,并且具有所述基因或基因产物所固有的功能。野生型基因是在群体中最经常地出现的基因,更具体地讲,表示基因的“正常型”或“野生型”。另一方面,“突变型”表示与野生型基因或基因产物相比,在序列和/或功能特征方面具有改变的基因或基因产物,并且,有时候被称作“修饰类型”或“多态性类型”。所述突变型的例子包括(1)与野生型基因或基因产物相比具有改变了的特征的基因,和(2)尽管在基因序列上不同,但是具有相同的功能的基因。所述野生型结构基因和它的突变型,这两种类型的结构基因,具有由于单核苷酸的取代和/或缺失,或不少于一个核苷酸的插入所导致的序列改变。
术语″寡核苷酸″被定义为具有不少于两个脱氧核糖核苷酸或核糖核苷酸的分子,优选至少5个核苷酸,更优选至少大约10-15个核苷酸,更优选至少大约15-30个核苷酸。所述寡核苷酸的确切大小可以根据它的功能和用途而改变。寡核苷酸可以通过本领域公知的方法生产,例如化学合成,DNA复制,逆转录,PCR或这些方法的组合。
寡核苷酸可通过以下方法制备:通过磷酸二酯键沿单一的方向将它的戊糖环的5′磷酸基团结合在相邻单核苷酸的戊糖环的3′氧上。当所述5′磷酸基团不与单核苷酸戊糖环的3′氧结合时,所述寡核苷酸的末端被称为″5′-末端″,而当所述3′氧不与单核苷酸戊糖的5′磷酸基团结合时,所述寡核苷酸的末端被称为″3′-末端″。因此,多核苷酸具有5′-末端和3′-末端。当多核苷酸链具有第一区和第二区,并且第一区的3′-末端位于第二区的5′-末端前面时,所述第一区就位于所述第二区的上游。
术语″多核苷酸序列″表示(1)寡核苷酸,核苷酸,或多核苷酸,(2)它们的片段或一部分,或(3)基因组或合成的DNA或RNA。所述多核苷酸序列可以是单链或双链,或正义链或反义链。应当指出的是,在本发明中所使用的多核苷酸可以包括在天然存在的多核苷酸中罕见的核苷酸。所述核苷酸的例子包括肌苷和7-脱氮鸟嘌呤。
术语″核苷酸类似物″表示修饰过的核苷酸或非天然存在的核苷酸,例如7-脱氮嘌呤(即7-脱氮-dATP和7-脱氮-dGTP)。所述核苷酸类似物的例子包括碱基类似物,以及修饰过的脱氧核糖核苷酸和修饰过的核糖核苷酸。
术语″肽核酸″(PNA)包括出现在天然存在的多核苷酸中的碱基或碱基类似物,并且指不是与典型的多核苷酸的糖-磷酸骨架结合、而是与肽骨架结合的核酸分子。由于核苷酸与肽结合,所述核苷酸可以与多核苷酸的互补核苷酸配对,与寡核苷酸的情况类似。上述小分子又被称为抗基因制剂,它能结合互补的多核苷酸链,从而阻止转录延伸(Nielsen,等,Anticancer Drug Des.8:53 63(1993))。在本发明中,作为多核苷酸的替代物,可以使用上述核苷酸类似物和肽核酸。
术语″蛋白″,″多肽″和″肽″被定义成具有在将它们用于表示基因产物时相同的含义。应当指出的是,通过重组DNA技术生产的多肽特别被称为“重组蛋白”。这种重组蛋白可以通过重组DNA技术获得,包括将编码多肽的DNA插入合适的载体,以便转化宿主细胞,并且表达异源蛋白。
术语″纯化的″表示从天然环境中取出的多核苷酸分子、肽、多肽或蛋白分子,或通过重组DNA技术提取或分离的分子,并且在天然状态下,它包含的其它成分的量为40%或更少,优选25%或更少,最优选10%或更少。因此,术语“分离的多核苷酸”或″分离的寡核苷酸″是基本上纯化的多核苷酸。
术语″多态性″表示对于基因或该基因的一部分来说同时存在一种或多种类型的形态这一事实。呈现出至少两种不同的形态,就是说,具有至少不同的核苷酸序列的基因部分被称为″基因的多态性区″。多态性区包括例如遗传多态性,如在下面将要披露的单核苷酸多态性。多态性区根据各种等位基因而有所不同。某些多态性区具有数个核苷酸的长度。
术语″多态性基因″表示具有至少一个多态性区的基因。应当指出的是,术语″多态性基因座″是存在于群体中的基因座,不过,在该群体的成员之间可以变化。最常见的等位基因的出现频率低于0.95。另一方面,术语″单一形态基因座″是在群体的成员之间罕见不同或在它们之间完全相同的基因座。一般,最常见的等位基因被认为是在群体的基因库中出现的频率不超过0.95的基因座。
术语″信息″表示事实或数据的积累。利用计算机系统保存或加工的信息表示按照任意格式保存的数据。所述计算机系统的例子包括,但不具体局限于互联网等。所述格式的例子包括模拟,数字化和光学格式。术语″有关受试者的信息″表示有关所述受试者的事实或数据。术语“基因组信息”表示有关基因组的信息,并且包括,但不局限于核苷酸序列,基因,等位基因频率,RNA表达水平,蛋白表达,以及基因型和表现型之间的相关性。术语“等位基因频率信息”表示有关等位基因频率的事实或数据,并且包括、但不局限于等位基因鉴定,有关等位基因的存在和受试者的性状之间的统计学相关性,等位基因在个体或群体中的存在或缺乏,等位基因在表现至少一种特殊性状的个体中出现的概率(%)。
术语″互补″或″互补性″是用于表达具有可以彼此配对的核苷酸的多核苷酸之间的关系的概念(即,寡核苷酸或靶多核苷酸的核苷酸序列)。更具体地讲,序列″5′-A-G-T-3″是互补于序列″3′-T-C-A-5′″的。所述″互补性″可以是“部分”的,就是说,具有多核苷酸互补性的一定数量的核苷酸可以形成配对的核苷酸或建立完整的配对,就是说,所有的核苷酸都可以配对。所述互补性的程度对杂交的效率和强度具有显著影响。在利用扩增反应和多核苷酸之间的偶联的检测方法中,这种互补性是特别重要的。用于与另一种核苷酸类似物(例如,IsoC/IsoG核苷酸对)或天然存在的核苷酸配对的核苷酸类似物也包含在“互补”或“互补性”的定义范围内,并且可以说它们是互补于要配对的配偶体的。
核苷酸序列的互补性表示当核苷酸序列并排排列而使得一个序列的5′-末端对着另一个序列的3′-末端时,寡核苷酸序列呈现“反向平行关系”。所述序列不必是完全互补的。因此,即使是在包括错配的核苷酸对或未偶联的核苷酸的情况下,也稳定形成了双螺旋。本领域技术人员可以根据所述寡核苷酸的长度,核苷酸的组成,所述寡核苷酸的核苷酸序列,离子强度以及寡核苷酸的错配核苷酸对的存在,凭经验确定双螺旋的稳定性。
术语″杂交″是用于表示互补的多核苷酸彼此配对的概念。杂交和杂交强度(换句话说多核苷酸-多核苷酸结合强度)受多核苷酸之间的互补性,要采用的条件的严格性,以及要形成的杂合体的Tm的影响。在杂交方法中,多核苷酸与互补的多核苷酸(具有互补核苷酸序列的多核苷酸)退火。
符号″Tm″表示“解链温度”,它表示通过加热使双链多核苷酸变性而转化成单链的温度。为了诱导使模板DNA和引物形成双链的引发反应,有必要将退火温度设定为等于或低于所述引物的Tm。用于获得多核苷酸的Tm的某些计算公式为本领域所公知。正如在一般文献中所披露的,当将多核苷酸溶解在1M NaCl水溶液中时,可以根据以下公式简单地估算Tm值:
Tm=81.5+0.41(%G+C)
(例如,参见Anderson和Young,Quantitative FilterHybridization,Nucleic Acid hybridization(1985))。另外,另一份参考文献披露了更精确地计算Tm的方法,该方法考虑了结构、环境特征和顺序特征(例如,参见Allawi,H.T.& SantaLucia,J.,Jr.Thermodynamics and NMR of internal G.T mismatches in DNA.Biochemistry36,10581-94(1997))。
术语″严格性″是用于表示杂交条件的概念,包括温度,离子强度和其它化合物的存在。在“高严格条件”下,核苷酸配对(碱基配对)只能在由具有高频率的互补核苷酸的序列组成的多核苷酸片段之间发生。因此,当杂交是在与要通过退火偶联的多核苷酸不完全互补的多核苷酸之间进行时,使用“弱的”或“低的”严格条件。
就“高严格条件”而言,在使用长度为大约500个核苷酸的探针时,可以提到的有在含有5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2O和1.85g/l EDTA,用NaOH将pH调整到7.4),0.5%SDS,5×Denhalt试剂,和100μg/ml变性的鲑鱼精子DNA的溶液中,在42℃下进行杂交,然后在含有0.1×SSPE和1.0%SDS的溶液中在42℃下洗涤的条件。500ml的50×Denhalt溶液含有5g Ficoll(Type400,Pharamcia),和5g BSA(级份V;Sigma)。
就“中等严格条件”而言,当使用长度为大约500个核苷酸的探针时,可以提到的有在含有5×SSPE(43.8g/l NaCl,6.9g/lNaH2PO4H2O和1.85g/l EDTA,用NaOH将pH调整到7.4),0.5%SDS,5×Denhalt试剂,和100μg/ml变性的鲑鱼精子DNA的溶液中,在42℃下进行杂交,然后在含有1.0×SSPE和1.0%SDS的溶液中在42℃下洗涤的条件。
就“低严格条件”而言,当使用长度为大约500个核苷酸的探针时,可以提到的有在含有5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2O和1.85g/l EDTA,用NaOH将pH调整到7.4),0.5%SDS,5×Denhalt试剂,和100μg/ml变性的鲑鱼精子DNA的溶液中,在42℃下进行杂交,然后在含有5×SSPE和0.1%SDS的溶液中在42℃下洗涤的条件。
对于互补性来说,重要的是根据它的用途确定杂交是完全进行的或部分进行的。例如,为了简单地检测外源DNA序列的存在与否,重要的是选择进行杂交的条件,其中只要存在检测目标——DNA序列,通过部分互补的探针或完全互补的探针检测就不会失败。另一方面,有时候需要能够区分部分互补性和完全互补性的杂交方法。
术语″引物″表示当它处在能够启动引物延伸的条件下时能够启动合成的寡核苷酸。寡核苷酸引物可以是天然存在的引物,通过限制性消化纯化的引物,或合成生产的引物。所述引物被设计成互补于模板的特定序列。引物必须与模板序列具有足够的互补性,这样它能够与模板杂交,导致引物延伸,从而形成模板-引物复合物,获得引物延伸产物。应当指出的是,引物序列并非总是完全互补于模板的,只要由于部分互补序列的存在它能够与所述模板偶联就行。
″标记″表示任何原子或分子,只要它能够用于检测(优选定量)并且结合多核苷酸或蛋白即可。所述标记的例子包括,但不局限于诸如放射性标记的染料(例如32P),结合基团(例如,生物素),半抗原(例如,地高辛),能发射磷光或荧光的发光基团,和荧光染料。所述标记可以单独使用或与一组能够通过荧光共振能量转移(FRET)抑制或改变发射光谱的标记组合使用。所述标记是能够根据荧光,放射性,比色测定,重量测定,X-光衍射或吸收,磁性或酶促活性而产生可检测的信号的标记。本发明所使用的标记可以是带电荷的基团(带正电荷或带负电荷的基团)或在电学上呈中性的基团。当多核苷酸或蛋白序列包括可检测的标记时,所述标记可能包括上面提到的带电荷的序列或由这样的序列组成。
术语″信号″表示通过标记或检测反应产生的可以通过物理化学方法检测的信号。
″检测仪″表示系统或系统的结构元件,更具体地讲,是指向用户报告信号的存在的装置或反应介质,或所述系统的其它结构部件(例如,计算机或控制器)。所述装置的例子包括,但不局限于照相机,荧光检测仪,电荷偶联装置,和闪烁计数器。所述反应介质的例子包括,但不局限于X-射线,照相软片,和pH指示器。
所述指示器的例子包括能够检测紫外线,可见光或红外线的光分析系统(例如,荧光或化学发光),光谱测定系统,放射检测系统、光谱测定法(如核磁共振光谱测定,质谱分析,表面诱导的Raman分光光度测定法),诸如凝胶电泳、毛细管电泳或凝胶排阻层析的系统,本领域已知的其它检测系统,以及所述系统的组合。
″样品″表示生物学样本和合成样本。所述生物学样本的例子包括动物(例如人)样本,如液体,固体(粪便物)或组织样品,液体或固体形式的食物,饲料和feed staff(日常用品,蔬菜,肉类,肉制品),以及其它混杂的废弃物。生物学样品可以从家畜或野生动物体内获得,所述动物包括、但不局限于有蹄类动物,熊,鱼,和啮齿类动物。
检测目标——多核苷酸,是由含有或推测含有多核苷酸(RNA或DNA)的样品提供的。所述靶多核苷酸的特别优选的来源是生物学样品,这些样品包括、但不局限于血液,唾液,脑脊髓液,胸膜液,乳,淋巴,唾液和精液。
术语核苷酸的″裂解的结构″表示通过使至少一种探针寡核苷酸与靶多核苷酸相互作用以便形成双链结构,并且通过裂解剂裂解所述双链结构而产生的结构。所述裂解剂的例子包括,但不局限于酶(如限制酶)。所述要裂解的结构是用于通过一种裂解方式进行特异性裂解的底物,并因此不同于作为非特异性裂解底物的多核苷酸分子。所述裂解方式的例子包括诸如磷酸二酯酶的制剂,这种酶能裂解多核苷酸分子,而与它的二级结构无关。
术语″试剂盒″表示提供底物的供应系统。在它被用于反应分析中时,在这样的供应系统中包括用于储存,转运或供应反应试剂和/或辅助物质的系统。所述反应试剂的例子包括,但不局限于寡核苷酸,以及装在容器中的酶。所述辅助物质的例子包括,但不局限于缓冲液和指导手册。所述试剂盒的例子包括至少一种类型的容纳单元(例如,盒子),它装有相关的反应试剂和/或辅助物质。术语“部分试剂盒”表示装有所述试剂盒的一部分或所有成分的供应系统,就是说,不少于两个独立的容器。所述容器是同时或分别提供给用户的。例如,第一个容器装有用于分析的酶,而第二个容器装有寡核苷酸。另外,所述试剂盒能够以“组合试剂盒”形式提供。组合试剂盒包括在一个容器中装有用于分析反应的所有成分的供应系统。例如,组合试剂盒可以将必要的成分装在一个容纳容器中。上面所提到的部分试剂盒和组合试剂盒都属于本发明的“试剂盒”。
术语″受试者″表示要通过本发明的方法获得它的遗传多态性信息并且在它体内进行药物评估和筛选的活有机体靶。所述受试者的例子包括,但不局限于哺乳动物(如啮齿类动物,包括人在内的灵长类动物,绵羊,山羊,马,狗,和牛),禽类,两栖类动物,和爬行动物。受试者优选选自包括人在内的灵长类动物,和包括大鼠和小鼠的啮齿类动物,最优选的是人类。遗传操作过的动物,即转基因动物和敲除动物,也可用于评估和筛选对各种过程(胚胎发生和组织发生)能产生影响的药物。
2.遗传多态性
遗传多态性包括单核苷酸多态性,插入/缺失型多态性,和通过核苷酸序列的重复次数的差异导致的多态性。一般,单核苷酸多态性(SNP)表示通过用其它核苷酸取代基因或其互补链(互补序列)区内的一个特定的核苷酸所导致的多态性。不过,在本发明中,术语SNP还包括通过核苷酸的缺失所导致的多态性,和通过在所述核苷酸上添加一个或多个核苷酸所导致的多态性。插入/缺失型多态性表示通过插入或缺失多个核苷酸(例如,两个至几十个核苷酸)所导致的多态性。有时候,可以缺失或插入几百个至几千个核苷酸。通过核苷酸序列重复次数的差别所导致的多态性具有包括两个至几十个核苷酸的序列的重复,并且该重复的次数在个体之间有所不同。其中重复单位包括几个至几十个核苷酸的多态性被称为VNTR(可变数量的串联重复)多态性,并且其中的重复单位由大约2-4个核苷酸构成的多态性被称为微卫星型多态性。在VNTR或微卫星型多态性中,所述重复的次数在个体的等位基因之间是不同的,由此导致了变异。
3.药物代谢酶
药物代谢酶与药物的吸收,代谢和排泄相关。所述酶的多态性改变了该酶的表达(转录和翻译)量和活性,其结果是未改变的药物或它的代谢物的血液浓度发生了改变。
在本发明中,通过基因多态性分析的靶基因表达的药物代谢酶的例子包括细胞色素P450(CYP)等。
负责第一阶段药物代谢的CYP(细胞色素P450)将氧原子导入药物。CYP的例子包括CYP2A6,CYP2A13,CYP2B6,CYP2E,CYP2S1,CYP5A1,CYP7A1和CYP7B1。可以适当选择单一的CYP或它们的组合。
4.CYP基因的遗传多态性的检测和鉴定
可以通过检测遗传多态性的常规方法获得有关遗传多态性的信息。例如,可以使用测序方法,PCR方法,片段长度多态性分析,使用等位基因特异性寡核苷酸作模板的杂交方法(例如TaqMan PCR方法,入侵者方法,DNA芯片方法),利用引物延伸反应的方法,MALDI-TOF/MS方法,和DNA芯片方法等。可以利用所述PCR方法和直接测序方法检测任何类型的遗传多态性。可以将其它方法主要用于检测SNPs。
下面将对用于检测遗传多态性序列的每一种方法的概况进行说明。
(1)直接测序分析
可以通过使用直接测序方法来检测基因多态性序列。在本分析方法中,首先通过合适方法从受试者体内采集DNA样品。将目标检测区克隆到合适的载体上,并且通过宿主细胞(例如细菌细胞)的繁殖进行扩增。所述目标检测区表示含有例如SNP或突变的区域。或者,可以通过使用PCR方法扩增处在所述目标检测区内的DNA。在扩增之后,通过合适的方法对所述目标检测区内的DNA进行测序。所述测序方法的例子包括,但不局限于手工测序方法或自动测序方法。所述手工测序方法的例子包括使用放射性标记核苷酸等的方法。所述自动测序方法的例子包括使用Dye Terminator等的方法。通过合适的显示方法给出所述测试结果。然后,确定预定的SNP或突变的存在或缺乏。
(2)PCR分析
在本发明中,可以通过使用基于PCR的分析方法检测基因多态性序列。所述PCR分析中使用只能在突变型或野生型等位基因(例如,多态性或突变区)内形成杂合体的寡核苷酸引物。通过使用由突变型引物和野生型引物组成的引物组扩增DNA样品。当只有突变型引物能产生PCR产物时,就表明了所述受试者具有突变的等位基因。当只有野生型引物能产生PCR产物时,就表明了所述受试者具有野生型等位基因。
(3)片段长度多态性分析
在本发明中,基因多态性序列可以通过片段长度多态性分析检测。在片段长度多态性分析中,根据一系列的酶促DNA裂解位点获得了特殊的DNA带型。所述酶的例子包括限制酶和Cleavase I(Third WaveTechnologies,Inc.)。来自样品的、并且具有SNP或突变的DNA片段,表现出不同于野生型的带型。
(3-a)RFLP分析
在本发明中,还可将限制性片段长度多态性(RFLP)分析用于检测基因多态性序列。首先,通过PCR扩增目标检测区。然后,利用已知能产生预定多态性所固有的特定长度的片段的限制酶裂解所得到的PCR产物。通常,通过凝胶电泳分离被限制酶消化成片段的PCR产物,并且通过用溴化乙锭染料进行观察。将片段的长度与分子标记以及野生型和突变型对照的片段长度进行比较。
(3-b)CFLP分析
在本发明中,还可将裂解酶片段长度多态性(CFLP)用于检测基因多态性序列(参见Third Wave Technologies Inc.,美国专利号5,843,654,5,843,669,5,719,208和5,888,780)。Cleavase I酶是结构特异性的耐热核酸酶,它能识别并且裂解DNA的单链区和双链区之间的交接部分。
首先,分离目标检测区的DNA,例如通过PCR方法进行分离。在该步骤中,优选对一条或两条链进行标记。然后,通过加热使所述DNA链分离。让所得到的产物退火,以便在链内形成二级结构,然后用CleavaseI酶处理所述PCR产物,以便产生预定的SNP或突变所固有的一系列片段。通过变性凝胶电泳,分离并且检测用Cleavase酶处理过的PCR产物,然后通过放射性自显影、荧光成像或染色进行观察。将片段的长度与分子标记以及野生型和突变型对照的片段长度进行比较。
(4)杂交分析
在本发明中,可以通过杂交分析检测基因多态性序列。所述杂交分析是根据来自样品的DNA与互补DNA分子(例如寡核苷酸探针)杂交的能力而确定预定SNP或突变的存在或缺乏的方法。杂交分析可通过各种杂交技术和检测技术完成。下面将对从中选择的分析进行说明。
(4-a)杂交的直接检测
无论探针是否能与目标检测序列(例如,SNP或突变)杂交,都可以通过观察杂交探针而直接检测。该方法被称为Northern或Southern分析(例如,参见,Ausabel等(edited),Current Protocols inMolecular Biology,John Wiley & Sons,NY(1991))。在Southern分析中,从受试者体内分离基因组DNA,而在Northern分析中,从受试者体内分离RNA。然后,用一系列限制酶裂解分离的DNA或RNA,所述限制酶很少会裂解除了基因组内标记附近的区域以外的位点。然后,分离DNA或RNA,并且转移到膜上。例如,所述分离操作可以在琼脂糖凝胶上进行。向膜上的转移是通过在低、中等或高严格条件下,将标记过的探针或对检测目标、SNP或突变特异的探针转移到薄膜上完成的。标记是通过导入例如放射性核苷酸完成的。在除去未结合的探针之后,观察标记过的探针,由此检测结合的存在。
(4-b)利用DNA芯片分析检测杂交
在本发明中,还可以通过DNA芯片杂交分析检测基因多态性序列。在该分析中,将一系列寡核苷酸探针附着到固体支持物上。将所述寡核苷酸探针设计成对预定的SNP或突变具有特异性。让测试DNA样品与由此形成的DNA芯片接触,从而检测杂交。
(4-c)用酶检测杂交
在本发明中,还可以利用酶裂解特殊结构来检测杂交(入侵者分析;Third Wave Technologies Inc.,例如,参见美国专利号5,846,717,6,090,543,6,001,567,5,985,557和5,994,069)。入侵者分析能检测特异性DNA和RNA序列,包括通过寡核苷酸探针形成重叠部分,并且用结构特异性酶裂解所述重叠部分。
或者,可以通过TAQMAN分析,检测与探针杂交的结构(PEBiosystems;例如,参见美国专利号5,962,233和5,538,848)。该分析通常是在PCR过程中进行的。TAQMAN分析中利用了DNA聚合酶(例如,AMPLITAQ DNA聚合酶)的5′-3′外切核酸酶活性。将预定的等位基因或突变特异性的探针导入PCR。所述探针是由具有5′报导染料(例如,荧光染料)和3′淬灭染料的寡核苷酸构成的。在PCR过程中,当探针与靶序列结合时,通过AMPLITAQ聚合酶的5′-3′多核苷酸分解活性,在所述报导染料和淬灭染料之间的位点裂解探针。通过分离所述报导染料和淬火染料可提高荧光的强度。所得到的信号在每一轮PCR中积累,以便可以通过荧光检测仪检测所述信号。
另外,在本发明中,可以通过SNP-IT引物延伸分析检测多态性(Orchid Biosciences Inc.;例如,参见美国专利号5,952,174和5,919,626)。在该分析中,SNP通过使用专门合成的DNA引物和DNA聚合酶从位于推测的SNP位点处的核苷酸开始选择性地延伸DNA而确定。首先,扩增位于目标检测区内的DNA并使它变性。然后,通过被称为纤维流体学的微型系统完成聚合酶反应。检测是通过将标记结合在有可能位于SNP或突变位点处的核苷酸上进行的。导入DNA的标记可以通过随意选择的合适方法检测。例如,当核苷酸包括生物素标记时,它可以通过荧光标记的生物素特异性抗体检测。
(5)利用引物延伸反应的方法
在本发明中,基因多态性序列还可以通过利用引物延伸反应检测。作为使用引物延伸反应的方法,例如,可以采用SniPer方法。所述SniPer方法基本上是基于被称为滚环扩增(RCA)的流程,其中,DNA聚合酶连续地合成互补DNA,同时,在用作模板的单链环状DNA上移动(例如,参见美国专利号6,210,884和6,183,960)。根据这种方法,可以通过确定在进行DNA扩增时所产生的颜色反应的存在或缺乏而确定SNP(Lizardi,P.M.等,Nature Genet.,19,225-232(1998);Piated,A.S.等,Nature Biotech.,16,359-363(1998))。
(6)质谱分析
在本发明中,可以利用MassARRAY系统检测基因多态性序列(Sequenom Inc.;例如,参见美国专利号6,043,031,5,777,324和5,605,798)。首先,通过标准方法从样品中分离DNA。然后,通过PCR扩增包含检测目标、突变或SNP的特定DNA区。例如,所述区的长度可以为200个核苷酸。然后,将由此扩增的链之一结合并且固定在固相的表面上,然后通过普遍采用的变性或洗涤,将未与所述表面结合的另一链除去。在自动酶反应中将剩余的固定化单链用作模板,产生了对基因型具有特异性的待检测产物(检测产物)。
将极少量的酶产物(通常为5-10毫微升)转移到SpectroCHIP array上,然后利用SpectroREADER质谱仪进行自动分析。对每一个斑点来说,事先导入了检测产物和形成矩阵的吸光晶体。所述MassARRAY系统采用了MALDI-TOF(Matrix Assisted Laser Desorption Ionization-Time ofFight)质谱分析。MALDI-TOF方法是一种通过利用质谱仪,根据单核苷酸在质量上的基本差异进行SNP基因定型的方法。所述方法的例子包括利用PCR扩增的方法,和利用多重性的方法(Haff,L.A.,Smirnov,I.P.,Genome Res.,7,378-(1997);Little,D.P.等,Eur.J.Clinica.Chem,Clin.Biochem.,35,545-(1997);Ross,P.,等,Nat Biotechnol.,16,1347-(1998))。
在所述MALDI-TOF中,在被称为消除过程的过程中,点阵与由激光光束产生的脉冲发生碰撞。能量从所述激光光束转移到所述矩阵,以便使所述矩阵蒸发,其结果是将少量的检测产物排入飞行管。在对所述飞行管施加电场脉冲时,使所述检测产物带有电荷。由于检测产物的存在,飞行管向检测仪方向推进。将施加所述电场脉冲和所述检测产物在所述检测仪上的碰撞之间的时间表示为飞行时间。在该方法中,由于分子的质量与飞行时间直接相关,故能够相当精确地测定所述检测产物的分子量。更具体地讲,所述检测产物的分子量越小,飞行时间就越短。所述产物的分子量越大,飞行时间就越长。由于所述分析是在千分之一秒内完成的,因此总共在3-5秒时间(包括获得重复数据的时间)内就可以对完成对样品的分析。然后,可以根据SpectroTYPER软件以每个样品3秒钟的速度通过计算机获得、记录、比较并且报导基因型。
(7)其它检测分析
可用于本发明方法中的其它检测分析的例子包括,但不局限于酶错配裂解方法(例如,参见Variagenics Inc.;美国专利号6,110,684,5,958,692和5,851,770),聚合酶链反应,支链DNA杂交方法(例如,参见Chiron Corporation;美国专利号5,849,481,5,710,264,5,124,246和5,624,802),NASBA方法(例如,参见美国专利号5,409,818),分子信标技术(例如,参见美国专利号6,150,097),E-传感器技术(参见Motorola;美国专利号6,248,229,6,221,583,6,013,170和6,063,573),循环探针技术(例如,参见美国专利号5,403,711,5,011,769和5,660,988),Dade Behring信号扩增方法(例如,参见美国专利号6,121,001,6,110,677,5,914,230,5,882,867和5,792,614),连接酶链反应(Barnay Proc.,Natl.Acad.Sci USA88,189-93(1991)),和夹心杂交方法(例如,参见美国专利号5,288,609)。
在表1中列举了通过上述检测方法获得的CYP基因的基因多态性信息。
表1
基因命名 No. 位置 序列 SEQ ID NO
 CYP2A6     1 exon1+31  tgctggcctcagggatgctt C/T tggtggccttgctggtctgc     1
 CYP2A6     2 exon1+153  ttcattggaaactacctgca G/A ctgaacacagagcagatgta     2
 CYP2A6     3 intron1+29  aggcagggagatgggtggca C/T ggggtgggggctgcctagtt     3
 CYP2A6     4 intron1+98  cagtgtggaccagagtctta G/A gaaatggagttttggagttt     4
 CYP2A6     5 intron1+153  caggatcttgggatgtccag C/T tccctgactgtgagaacctg     5
 CYP2A6     6 intron2+1011  agctgctccgctcctgcccc C/T gccgccccctggcctgtctc     6
 CYP2A6     7 intron3+23  gagcaggggaccccgagtgc G/T ggggcaggagaaggaaaaca     7
 CYP2A6     8 intron3+77  acccgcgcgcgttctgcctg G/C ggatggggactaggtgggga     8
 CYP2A6     9 intron6+323  ttaacaggatcctactccaa C/A aatgcgaatggctgatgtct     9
 CYP2A6     10 intron7+203  ctccagactctttgtgtcag G/A agaatcaaacacatgttccc     10
 CYP2A6     11 intron7+440  cttccccttacctggggcac A/C ctagttccccctccagcccc     11
 CYP2A6     12 exon8+84  caggacttcaatccccagca C/T ttcctgaatgagaaggggca     12
 CYP2A6     13 exon8+96  ccccagcacttcctgaatga G/C aaggggcagtttaagaagag     13
 CYP2A6     14 intron8+27  gaccactgtttgctgccagg C/T cacggctcacaccagcaggg     14
 CYP2A6     15 intron8+47  ccacggctcacaccagcagg G/C gcctccctcaccctcctccc     15
 CYP2A6     16 exon9+333  gggaagagaagaaacagaag C/G ggctcagttcaccttgataa     16
 CYP2A6     17 exon9+383  gagctgggatgagaggaagg A/G aacccttacattatgctatg     17
 CYP2A6     18 exon9+386  ctgggatgagaggaaggaaa C/A ccttacattatgctatgaag     18
 CYP2A13     1 5′flanking-251  tccacagtttatctgttgcc C/T gctcctaaatccacagccct     19
 CYP2A13     2 5′flanking-112  agctgtgtgggattcagggt T/C ggggtgtagttgggaggtga     20
 CYP2A13     3 exon1+83  ggtcttgatgtcagtctggc G/A gcagaggaagagcaggggga     21
 CYP2A13     4 exon2+121  aggctgaggagttcagcggg C/T gaggcgagcaggccaccttc     22
 CYP2A13     5 intron4+118  cagtgtcccctcaaaatcag T/C ccccgatattggacaactgg     23
 CYP2A13     6 intron4+500  tctacttcacccacttaaat G/A cctgaaaacatggacaggtg     24
 CYP2A13     7 intron4+673  cacctcaacaggtatcccct C/G cacttcaacatcttcaccag     25
 CYP2A13     8 intron4+712  agccccactttaatacctga A/G cacctgaacaaaagccccca     26
 CYP2A13     9 exon5+115  agaaggtggagcacaaccag C/T gcacgctggatcccaattcc     27
 CYP2A13     10 exon 9+283  gggctaagaatgggggcagt G/C ggggaaggaaggggagaggt     28
 CYP2A13     11 3′flanking+145  gaaagttgtctctatctgat T/G tctcacaaaacgtaagtgcc     29
 CYP2A13     12 3′flanking+157  tatctgatttctcacaaaac G/A taagtgcccagaaaatcttt     30
 基因命名 No.     位置     序列 SEQ ID NO
 CYP2B6     1 5′flanking-1179 caccagttctgcatctcttg C/G tcctccttctgtttctccga     31
 CYP2B6     2 exon 1+71 tcttgctactcctggttcag C/T gccaccctaacacccatgac     32
 CYP2B6     3 ntron 1+2663 aacagaaaccaacttatctt C/G gtcgattttgaggttgatag     33
 CYP2B6     4 intron 1+2676 ttatcttcgtcgattttgag G/A ttgatagtaatttcagttat     34
 CYP2B6     5 intron 1+2832 agagtaagcaaacctcaaga T/C actcaaggtaggcactcgtg     35
 CYP2B6     6 intron 1+2919 tagatttgtttacccataag T/C ctgcatagctcctgaacaag     36
 CYP2B6     7 intron 1+3212 ccacacccccataggtagtc C/T ccaggtcttgcatacgggat     37
 CYP2B6     8 exon 2+45 ttcacggtacacctgggacc G/C aggcccgtggtcatgctgtg     38
 CYP2B6     9 intron 2+111 ccaacttcttctacaaccaa C/T ccacacctcccctgcacccc     39
 CYP2B6     10 intron 3+2124 ggggcctgagaggaggtgca G/T agtgagaaccggctgcatgg     40
 CYP2B6     11 intron 3+2441 acttcagtctgtgtccttga C/T ctgctgcttcttcctagggg     41
 CYP2B6     12 exon 4+15 tcctaggggccctcatggac C/G ccaccttcctcttccagtcc     42
 CYP2B6     13 exon 4+32 gaccccaccttcctcttcca G/T tccattaccgccaacatcat     43
 CYP2B6     14 intron 4+1850 agaaagacaaataaacaggc T/C gaggtagacaatgggtgaca     44
 CYP2B6     15 intron 4+2048 gttcagaggcagaggggagt G/A gggaagtggggttcccatgg     45
 CYP2B6     16 intron 5+183 agaaagatgaggtgaaagga G/A ggagaaaatagggaggagga     46
 CYP2B6     17 intron 5+488 agaaaagcaaactgggccag A/G tagtgtcaaagacctttagg     47
 CYP2B6     18 intron 5+514 tcaaagacctttaggccaac G/A gagggcagccagggagatgg     48
 CYP2B6     19 intron 8+53 ccagagggcaggtactatcc C/T caacttgagaaaaacaacga     49
 CYP2B6     20 exon 9+165 tacccccaacataccagatc C/T gcttcctgccccgctgaagg     50
 CYP2E     1 5′flanking-1621 tctcaccccaccaaagccaa G/C gcttcaatttcagtctgtgg     51
 CYP2E     2 5′flanking-1480 cccacacaggacaacagggt T/G caggggtctggacagctgtt     52
 CYP2E     3 intron 2+15 acaggggtgagtccgcgtcc C/T tggcacggagcggggggtgc     53
 CYP2E     4 intron 2+344 ttcccctcctgttcaaccgc C/A ggggtacaggtggcttcgtc     54
 CYP2E     5 intron 2+439 ttcagggctttgctcagctg C/T agctggtgacctccagagag     55
 CYP2E     6 intron 2+500 ggggtggatgtcctgagacc G/A ggaagggggaagagacccac     56
 CYP2E     7 intron 2+1023 tgagctgataaagaacgccg T/G cagcacagagcagacgctgg     57
 CYP2E     8 intron 2+2567 cttttcaagaatgttgtcga T/C agataggaaagaggtgggag     58
 CYP2E     9 intron 4+186 ggggccccacgcaccccctt T/G cctaacgtcaggatgtgtat     59
 CYP2E     10 intron 6+326 gacagagaagataatgtccc A/G gttccccccaagtaagacct     60
 CYP2E     11 intron 6+474 ctacagctgccctggaccct T/C gttccttccacagggctcct     61
基因命名 No. 位置 序列 SEQ ID NO
 CYP2E     12 ntron 6+625 gaggtgatgtgagggcaccc G/A catgcaaacaggccagtcag     62
 CYP2E     13 ntron 6+786 agttcacagcctgagtggtg T/C gtgccgccctcctcctgaag     63
 CYP2E     14 ntron 7+117 ctttggcaggggtcactgag T/G ggaagggctggccccactcc     64
 CYP2E     15 ntron 8+(217-219) tcctgggaatgaagtgttgt TGT/Δ aggtggattttttttttccc     65
 CYP2E     16 intron 8+(227-236) gaagtgttgttgtaggtgga (T)9-11 cccaaagactagacatttta     66
 CYP2E     17 3′flanking+1501 agttgacagctttcccaaaa C/T ggttcacggagacttcattt     67
 CYP2E     18 3′flanking+1505 gacagctttcccaaaacggt G/T cacggagacttcatttgact     68
 CYP2E     19 3′flanking+1631 caaccaaacatcctctaag G/T tctactgtgcagagtatagc     69
 CYP2S1     1 5′flanking-177 ttcccgacatcaggcggcgg C/T ggtggtccgggagaaacccg     70
 CYP2S1     2 5′flanking-(22-24) ccgcgcggagcgcctgggag AGG/Δ agaaggagccgacctgccga     71
CYP2S1     3 intron 1+540 tgggtggagctcagttggga G/C ttcctgggattggggaggaa     72
 CYP2S1     4 intron 2+(2991-3001) acagagcgagattccgtctc (A)10-11 gaaagaaaggaagaaggggg     73
 CYP2S1     5 exon 5+35 ctcctggttcctgcggcccc C/T gccaggcccccacaagcagc     74
 CYP2S1     6 intron 5+(245-248) catttgtgccgggctgtctg TCTC/Δt ccagcatctctcctctttc     75
 CYP2S1     7 intron 6+(332-343) acagagcgagacactgtttc (A)11-12 gtgagaattctagagggaag     76
 CYP2S1     8 intron 6+337 gcgagacactgtttcaaaaa A/G aaaaaagtgagaattctaga     77
 CYP2S1     9 intron 8+(157-172) gaggaatactgactcagccc(TC)7-8 ctcaccagggaagcgtgtct     78
 CYP2S1     10 exon 9+757 ctctcccagcctgtgaccac C/A gatgtccacacacccccaac     79
 CYP5A1     1 intron 1+(1060-1069) ttctttttaactggtttaa (T)10-13 gaacttttttatctcattgt     80
 CYP5A1     2 intron 1+8545 tccacaaccatcagccccgc C/T ccaggactcactgtgggtct     81
 CYP5A1     3 intron 1+8592 ccttcagcgggccccctgtc G/A ctctctcccccacaaaccct     82
 CYP5A1     4 intron 1+8815 caaaggcactgaggagcccc C/G tctcagcattgcttttatcc     83
 CYP5A1     5 intron 1+9827 aactgctcccttctagtggt A/G aaggggaaagcagtttcatg     84
 CYP5A1     6 intron 1-(30739-30725) gagggatacatctatttccc (T)11-13 atctttttgtatttttgt ct     85
 CYP5A1     7 intron 1-29832 atgattgaatgaactcttcc C/T ctaaccctagtgccataata     86
 CYP5A1     8 intron 1-28130 gaaattgaagagcaagactg C/T aaaaggaggggatgatggaa     87
 CYP5A1     9 intron 1-27482 catccgtacacagagagtga C/G caaaattggtagcatcatct     88
 CYP5A1     10 intron 1-27360 acagtgtagggacagacaca T/C ctctttccctgggtgtcctt     89
 CYP5A1     11 intron 1-27182 cctaatgttaaccctccaca G/T tctggccagtcttgactccc     90
 CYP5A1     12 intron 1-25419 taagctgaagtgtcttcggg G/A gtgttggggatggtcaccaa     91
 CYP5A1     13 intron 1-25391 ggatggtcaccaatggtgtg G/A tggggacagagccatagtgc     92
基因命名 No. 位置 序列 SEQ ID NO
 CYP5A1     14 intron 1-22669 tcagtgtaggggccaggttg G/C tcctgggccgaacctgggga     93
 CYP5A1     15 intron 1-21974 ttgcaatccagaatcagcca C/T aaaatcccatttcctttttt     94
 CYP5A1     16 intron 1-7228 aaatactcactattataaat T/C tgtaaatgaacagtctcgtt     95
 CYP5A1     17 intron 1-1368 gggaggccaaggcaggagga C/T cgcttgaggccaggagttaa     96
 CYP5A1     18 intronn 1-883 gctgatctctgcgtgatgct A/T aacaaccagtttgactcatt     97
 CYP5A1     19 intron 2+508 tggcaagaatccatctctta T/C cactatcaatatgtattgag     98
 CYP5A1     20 intron 3+3741 agctattagtcgtggtggta C/T gtgataaaaaactctcctga     99
 CYP5A1     21 intron 3+6106 gtcccatactgaaaaaaaaa A/Δ tcaatttagcaaataaataa     100
 CYP5A1     22 intron 3+(6688-6689) tggctgaggatagggtaggg TG/Δ gaaactattgctgatttgtc     101
 CYP5A1     23 intron 3+6894 actttaggtttttgctgctg A/G taaaagtgcaagcctcagta     102
 CYP5A1     24 intron 3+7924 tccctcttctttgggtagaa G/A catccaacagggcatgatag     103
 CYP5A1     25 intron 3+9360 tggagaggcaccgagtctca T/C gatgtgtggctggaggttgt     104
 CYP5A1     26 intron 3+(10750-10774) aggcactctttgcagatgaa (T)22-25 ggcctcggcttaaagaggaa     105
 CYP5A1     27 intron 3+11020 tccctggcttgtgccacctc C/T atcttttccgtggctaatgt     106
 CYP5A1     28 intron 3+12740 tactgacttctgcttccttg T/C tccctgggtctacactgttc     107
 CYP5A1     29 intron 3+13193 acaaccttggcagtggcaga T/C gagagagaacctcaggactg     108
 CYP5A1     30 intron 3+18241 caatagagtagggaggttta T/A cattacaggtttctttcaga     109
 CYP5A1     31 intron 3+18569 actaccgtgccaccacccac G/A caccacaccattgctgcaga     110
 CYP5A1     32 intron 3+20654 acaaggagcgaagggtccat G/A aagccttcacaaagaggggc     111
 CYP5A1     33 intron 3+(23375-23386) gtgacaaattctccctctcc (T)10-12 cattgcagaagtcacatgcg     112
 CYP5A1     34 intron 3+23471 aggacagtgccccataattt C/T ctgctccagatctatgccct     113
 CYP5A1     35 intron 3+23793 tctacttaagttcccagaag G/A cggctgtgaactattttggt     114
 CYP5A1     36 intron 3+(25690-25704) agcattagcaatattactac (A)12-16 gaagcaggaagactcccaag     115
 CYP5A1     37 intron 3+(34024-34026) tttccatagttaatgagaag GAG/Δ aagaatttaaaacaattaat     116
 CYP5A1     38 intron 4+2446 attttcgtcctcttccactc A/G gcacaggattaagccttcag     117
 CYP5A1     39 intron 4+4399 gggggtgatgcaacagggag C/T tccctgacatacaacaacat     118
 CYP5A1     40 intron 4+(5554-5555) tgaggagagaggggcccttg (C) gcagacttgccataaaaccg     119
 CYP5A1     40 intron 4+(5554-5555) tgaggagagaggggcccttg     gcagacttgccataaaaccg     120
 CYP5A1     41 intron 4+7453 tgtttttagccaccacatgc C/T cctgagctgacccctcgagc     121
 CYP5A1     42 intron 4+(7645-7654) tactgttttcatttttggta (T)9-10 acattttaatttttttatac     122
 CYP5A1     43 intron 4+7756 ggttcaaatctttgtacagc C/T agatagcaatagatataaat     123
基因命名     No.     位置     序列 SEQ ID NO
 CYP5A1     44 intron 4+7770 tacagccagatagcaataga T/C ataaattgacaatggcctca     124
 CYP5A1     45 intron 4+17600 ccagtcaacagggcttccct T/C aggagatgttctctaaactg     125
CYP5A1 46 intron 4+(22506-22542) acatgtggttctgagactgc TTGGTCCCCCAACCGCCTGTCTCCCCACACCCCGCAA/AGGCTGCAGTCC cctgcaggctggggacactc 126
 CYP5A1     47 intron 4+24582 cctgctcagtagggggactg C/A agaacacacagaagccattg     127
 CYP5A1     48 exon 5+37 tcaagtcggtagccgacagc G/A ttctgtttttacgtgacaaa     128
 CYP5A1     49 intron 5+(5127-5138) ttgtatttaaattaaaattg (T)9-12 ggcctatgtcataccaggga     129
 CYP5A1     50 intron 5+(5140-5141) aaattgttttttttttttgg (T) cctatgtcataccagggata     130
 CYP5A1     50 intron 5+(5140-5141) ataattgtttttttttttgg     cctatgtcataccagggata     131
 CYP5A1     51 ntron 5+7570 ggcattaattttttcatttt T/A aaaaaaaacccagaaatacg     132
 CYP5A1     52 intron 6+1001 ttttcactctagcagggaaa T/C gtgtaatcagttgtagaaac     133
 CYP5A1     53 intron 7+1203 gggcaggtggctcagttgtg C/T catcccttctatttctcctc     134
 CYP5A1     54 intron 7+1815 attaattgcacagatgttta T/C tgagtgcttactatgtgcca     135
 CYP5A1     55 intron 7+1922 gggagggcaggactccaaaa C/A ggctccgattccaggcccgc     136
 CYP5A1     56 intron 8+(1245-1274) gccaccttttgagagtgttc (AC)12-13 gcatccctagcctggctgtg     137
 CYP5A1     57 intron 9+139 tgaaatagggtcattgcttg G/C cttctcctgctctccgggtt     138
 CYP5A1     58 intron 9+5862 caataattcagattctctac T/C gttagcagttctaaacccct     139
 CYP5A1     59 intron 9+5978 catctctcatcccatacagc C/T ttgactgcattctcctttca     140
 CYP5A1     60 intron 9+(7360-7369) caaatctatcctcactatgg (A)9-10 tgtcttcccatgtggatctc     141
 CYP5A1     61 intron 9+(7562-7563) ttcagtcccccagccacaca (A) ggggtcagaggtgctgctga     142
 CYP5A1     61 intron 9+(7562-7563) ttcagtcccccagccacaca     ggggtcagaggtgctgctga     143
 CYP5A1     62 intron 9+9085 accctatcttggaagttaag A/T tttgtggtcactgctaccaa     144
 CYP5A1     63 intron 9+9441 gcccatgcccacagtaaccc G/T tagggaaactgacccgctct     145
 CYP5A1     64 intron 9+(11323-11338) ggtttgtttggtgagctttc  (T)13-16 aggttgtattttataactga     146
 CYP5A1     65 intron 9+13259 accaagtggatcaatggtgg C/Δ tctggcatttctataaaggg     147
 CYP5A1     66 intron 9+(17698-17707) catgtaacattgggttttgc (T)9-10 cctcacgtaaaatccacata     148
 CYP5A1     67 intron 9+(18709-18719) caagcagtattccacagatg (A)10-12 ttataaaagcgaaaccaaaa     149
 CYP5A1     68 intron 9+20380 aaatggaacaaaaagtttta G/T gaaacatgtcaccttctatg     150
 CYP5A1     69 intron 9+20607 tacaaacgaggaaatgtatc G/A ggttccttaagagcctttcc     151
 CYP5A1     70 intron 9+(21300-21308) agccgcccactccgcacaca (T)8-9 ctagttgtcataaacaaatt     152
 CYP5A1     71 intron 9+22829 tgtccctctggcttctgcag C/A ttttcctgatgtggcagggt     153
基因命名     No.     位置     序列 SEQ ID NO
 CYP5A1     72 intron 9+22919 tgtccctctagagggtgaca T/C gccttgaatggcagcgaacc     154
 CYP5A1     73 intron 9+23463 ccccatagtgtgtggaccat T/C gggggcctagaactgaggtc     155
 CYP5A1     74 intron 9+25072 ggtttaactgcattttactc T/G ttccagcctgtctggccatt     156
 CYP5A1     75 intron 9+25641 ttgcagtccagcccaaagag G/A cctgtcccagcaggacgcca     157
 CYP5A1     76 intron 9+25763 tgccaaacttttaaactcag G/T ggaattccgcaaaaatctag     158
 CYP5A1     77 intron 9+26532 gagaggcaggttcacccagc T/C gtctgtgcccgggcagggca     159
 CYP5A1     78 intron 9+26542 ttcacccagctgtctgtgcc C/T gggcagggcaactcccgaag     160
 CYP5A1     79 intron 9+26792 ttggcctggggacagttttt C/G agcgactgctctttgagaag     161
 CYP5A1     80 intron 9+28687 cacagagagcgtgcgctcca A/T taaaacggcactaaatggca     162
 CYP5A1     81 intron 9+28989 ccagggactgtgcatcaccc G/A tctccaccccaccccagaac     163
 CYP5A1     82 intron 9+29606 tggaatggcctttctctccc C/A caacgcccagccaagggagg     164
 CYP5A1     83 intron 9+32268 tctgagcccagacaatggct T/C atttatttcagacaatattc     165
 CYP5A1     84 intron 9+32429 ggccttattaataaatccat C/T ggtggtctgctgaaaatgct     166
 CYP5A1     85 intron 9+32912 tcctacagcaaatcatcaac A/G agatgcacacgaagatgagg     167
 CYP5A1     86 intron 9+33183 ccttttcagatgctccataa C/A ctcgtgtgaaaagccccggt     168
 CYP5A1     87 intron 9+34811 ggatctgtggggtgagtgaa C/T aaaagcattttctctgcaaa     169
 CYP5A1     88 intron 9+36495 gggttctgtccccttctaaa G/A caggtataaatagatgccat     170
 CYP5A1     89 intron 9+38683 aggccaaggtcaaggggagg C/G gctgcagggggggcttcctc     171
 CYP5A1     90 intron 9+43855 atcccagtgcgcccacaccc T/C gctcaagagctcatgggcac     172
 CYP5A1     91 exon 10+25 cccctgagttctgcagcctc G/A aggaaggcctgccctatctg     173
 CYP5A1     92 intron 10+3166 gctgacacaacttggactta T/C tcataaaagaaaatcagaat     174
 CYP5A1     93 exon 12+138 ccacgtgctgcacaagttcc G/A gttccaagcctgccctgaga     175
 CYP5A1     94 intron 12+1073 gaaacgggggtcctcaccca T/G atcctgcccactcccaagct     176
 CYP5A1     95 intron 12+1806 actcagctccagaggaaacc C/G aactcctcgagtaattcttt     177
 CYP5A1     96 intron 12+2033 tggggaggatcagcagggac G/A gctggagtcactgaaagata     178
 CYP5A1     97 3′flanking+1402 tcctgtggccctccccacac C/T cttgttgccaccacctgccc     179
 CYP7A1     1 5′flanking-469 gaaacatgaagcagcagaaa C/T gtttttcccagttctctttc     180
 CYP7A1     2 5′flanking-203 gtcaacatatatttgagaga C/A cttcaacttatcaagtattg     181
 CYP7A1     3 5′flanking-(114-105) tcaaggccagttactaccac (T)9-10 ctaatagaatgaacaaatgg     182
 CYP7A1     4 intron 1+512 ttctattactgtttttaaat C/A aatgttaatcaactgtggtg     183
 CYP7A1     5 intron 1+607 gttcaagaatgcaagaaaaa C/T aaatacagtcagatccagaa     184
基因命名 No.     位置     序列 SEQ ID NO
 CYP7A1     6 intron 1+611 aagaatgcaagaaaaacaaa T/C acagtcagatccagaaccat     185
 CYP7A1     7 intron 1+1184 gaaaaatgatgcttagcaaa G/A tgataaacactagaatgtag     186
 CYP7A1     8 intron 2+770 aaaacattatcaattagttt A/G tgtgcaatagctgtaaataa     187
 CYP7A1     9 intron 2+782 attagtttatgtgcaatagc T/C gtaaataagtgcagtagcat     188
 CYP7A1     10 exon 3+377 catgttcaggactgcgcaca A/G tgcccgggagaaactggcag     189
 CYP7A1     11 exon 4+131 tgaatgacctgccagtatta G/A gtgggtatacttgttatgtt     190
 CYP7A1     12 intron 5+(249-257) catgataataaacctgccac (T)8-9 cttaaaaagcacctcctccc     191
 CYP7A1     13 intron 5+471 agtatttgctaaatcactaa T/C ggggtagaattaaaaagaaa     192
 CYP7A1     14 intron 5+566 ttaaaggcggttttctttgt A/G tttttattgcagacttttaa     193
 CYP7A1     15 exon 6+758 cttagtgagatcccgtctcc G/A aagaaaagatatgtattcta     194
 CYP7B1     1 5′flanking-595 ccttattctttctgagtaca A/G cctgtagtacttgaaccact     195
 CYP7B1     2 intron 1+19 aggtaagcgcctcggccgcc A/T cgacgcatgcgccctgggcc     196
 CYP7B1     3 intron 1-(19-9) ttttcttttgttcttttatc (T)9-12 ccttgtaggagacccggtga     197
 CYP7B1     4 intron 2+(8107-8117) gaactcatattttctctctc (T)10-11 ctaggaaagtacataacatt     198
 CYP7B1     5 intron 3+(158-171) ataaccctctataattgata (T)12-14 gctgaggtggtaaaacaaga     199
 CYP7B1     6 intron 4+2144 gcatgaagtatatgtacaaa G/A gcaagacttacacagttaaa     200
 CYP7B1     7 intron 4+2280 aaaaagtttaaacttttatc A/C ttataagaggaaaaaagatt     201
 CYP7B1     8 intron 4+2626 tcttgttaagattctgctta T/C gacctcagtaaaacatttta     202
 CYP7B1     9 introrn 4+2841 tcagaaaaaaatctggggtg G/T aggtaggatttagaactgcg     203
 CYP7B1     10 intron 4+(7610-7627) atttataagtatatggaaag (A)16-19 aattctagaacgaattgaga     204
 CYP7B1     11 intron 4+(7846-7851) cctcatgtgtgagaaggggg (A)6-7 tgagggtcttgttcatttgt     205
 CYP7B1     12 intron 4+8004 ggaagtcctcccagggccca G/T ctggtctgtcagtggcactg     206
 CYP7B1     13 intron 4+8217 ccattgttgataataacgca A/G ctcattacttttgtcgtcta     207
 CYP7B1     14 intron 4+8267 ggcatgatggctcagaacga G/C agccaacctcatctcgcaca     208
 CYP7B1     15 intron 4+8417 aattgtcatttgtgatactg T/C ggtgggcgcaagctgccatg     209
 CYP7B1     16 intron 4+9226 ccatttgttatcatgtgaag G/C gggagaaaactccatttggg     210
 CYP7B1     17 intron 5+6213 aagctcacttagactgattt G/T ggttaggtagatagaggacc     211
 CYP7B1     18 intron 5+6224 gactgatttgggttaggtag A/G tagaggaccagtctcctcag     212
 CYP7B1     19 intron 5+6629 aaatgaggacaaacctaata G/C ttttaaaggaaatggttcac     213
 CYP7B1     20 intron 5+7545 aagtcatacagcttttcaga T/C ttcactttgatatgggagaa     214
 CYP7B1     21 exon 6+337 atcaaaattaccctaaacat C/T ctaagctcatctatttcttt     215
在表1中,“基因名称”栏表示编码药物代谢酶(CYP)的基因的名称。在“序列”栏中用大写字母表示的核苷酸是多态性信息。位于标记“/”两侧的两个核苷酸表示纯合或杂合的SNP。例如,“A/G”表示所述等位基因是A/A或G/G纯合体或A/G杂合体。在该表中的序列基本上表示分别位于SNP前面和后面的20个核苷酸,不过,括号中的核苷酸[例如在CYP5A1上的No.40的(C):SEQ ID NO:119]表示由于插入引起的多态性。标记“△”(例如,参见CYP5A1的No.21:SEQ ID NO:100)表示由于一个或多个核苷酸的缺失所导致的多态性。括号中的带有数字的核苷酸表示该核苷酸重复的次数。例如,在SEQ ID NO:66中出现的(T)9-11)(表1,CYP2E的No.16)表示该序列中的T重复了9-11次。应当指出的是,用于说明表1中“序列”栏所述的用于表示核苷酸序列内的位置关系时所用的术语“第21个(21号位置)”表示遗传多态性位点的位置。因此,对于缺失的SNP(Δ)来说,缺失的、假想的核苷酸是“第21个”。在多态性位点上存在多个核苷酸的情况下,一组这样的核苷酸都是“第21个”。例如,对于CYP2E(SEQ ID NO:65)的No.15来说,所述多态性位点“TGT”是第21个;对于CYP2E(SEQ ID NO:66)的No.16来说,所述多态性位点“(T)9-11”是第21个。
在该表中的“位置”表示SNP在基因组中的位置。5′旁侧区、内含子区和3′旁侧区中SNPs的位置以将外显子5′最末端的核苷酸上游1 bp的核苷酸确定为-1号位置而表示的。然后,将朝向该基因5′末端的核苷酸依次编号为-2,-3,-4,...。内含子区表示从外显子3′末端下游1bp的核苷酸到下一个外显子的部分。内含子的编号与位于相关内含子的5′末端的外显子的编号相同。例如,存在于外显子3和外显子4之间的内含子(即位于外显子3的3′末端的内含子)被称为内含子3。内含子区内的SNPs的位置是这样计数的:将位于相关内含子的5′侧的外显子/内含子接合部分紧邻3′处的第一个核苷酸确定为该内含子的核苷酸序列的1号位置。在“位置”栏中,带有“+”标记或没有任何标记的数字表示它们是朝向该基因的3′末端计数的;带有“-”标记的数字表示它们是朝向该基因的5′末端计数的。例如,如果从外显子3/内含子3接合部分朝向该基因的3′末端计数为第三个核苷酸是多态性的,该位置就被表示为“内含子3,+3”。类似地,如果从内含子3/外显子4接合部分向该基因的5′末端计数的第五个核苷酸是多态性的,该位置就被表示为“内含子3,-5”。将位于最后一个外显子的3′末端的区称为3′旁侧区。位于该区内的SNPs的位置是这样计数的:将位于最后一个外显子的3′末端核苷酸下游1bp的核苷酸确定为1号位置。
在表1中“No.”栏中出现的数字相当于在相应的基因图谱(图9-16)上出现的表示SNPs的位置的编号。在图9-16中,还提供了在公开基因组数据库中的多态性的入藏登记号。通过利用在表1、附图和数据库中所提供的信息,可以确定与多态性相邻的序列。可将所述信息用于例如制备与多态性邻接的PCR引物。
上述基因组数据库的例子包括,但不局限于由IMS-JST JSNP数据库网站(Laboratory for Genotyping,SNP Research Center,RIKEN,Japan)所提供的服务项目清单。
5.寡核苷酸探针或寡核苷酸引物的制备
在本发明的检测方法中被用作引物和/或探针的寡核苷酸可以根据表1所披露的核苷酸序列(SEQ ID NOS:1-215)制备。例如,在检测SNPs时,可以合成这些序列本身,或者可以设计并且合成引物和/或探针,使得它们包括所述序列的一部分。不过,这里应当指出的是,所述引物或探针的核苷酸序列必须包括遗传多态性(在表1的“序列”栏中用大写字母表示的部分)。本发明还包括所述序列的互补链。
为了进行说明,以SNP为例,可以将引物或探针设计成SNP位点位于所述引物或探针的核苷酸序列的3′或5′末端;或将引物或探针设计成SNP位点位于与它的核苷酸序列互补的序列的3′或5′末端;或将引物或探针设计成SNP位点距离它的核苷酸序列或互补序列的3′或5′末端四个核苷酸,优选两个核苷酸以内。或者,可以将引物或探针设计成SNP位点位于所述寡核苷酸的全长序列的中央。“中央”表示中央区,其中,从这里向3′末端计数的核苷酸数与从这里向5′末端计数的核苷酸数几乎是相等的。如果所述寡核苷酸的核苷酸数是奇数,“中央”是中间的5个核苷酸,优选中间的3个核苷酸,更优选位于正中间的1个核苷酸。例如,如果所述寡核苷酸由41个核苷酸组成的话,所述“中央”是从19号位置到23号位置的核苷酸,优选从20号位置到22号位置的核苷酸,更优选21号位置处的核苷酸。如果所述寡核苷酸的核苷酸数是偶数的话,所述“中央”表示中间的4个核苷酸,优选中间的2个核苷酸。在表1中“序列”栏中所示出的核苷酸序列内,如果所述多态性是缺失多态性的话,则所述序列的实际长度为40,它是偶数。因此,如果根据这样的序列设计由40个核苷酸组成的寡核苷酸的话,所述“中央”是从19号位置到22号位置的核苷酸,优选20号位置处的核苷酸。
当多态性位点包括多个核苷酸时,设计并且制备探针或引物,使得所述多态性位点的完整或部分序列或其互补序列包含在所述探针或引物的核苷酸序列上。在将由此制备的寡核苷酸用作探针时,可以利用杂交的存在或缺乏或者杂交的差异来确定等位基因。在下文中,探针或引物DNA上的与所述多态性位点或它的周边位点形成互补链的核苷酸被称为“相应的核苷酸”。可以设计探针或引物,使得相应的核苷酸位于构成多态性的序列的任何核苷酸处。“周边位点”表示位于构成多态性的序列5′最外侧末端之外(5′侧)1-3个5核苷酸的区域,或位于构成多态性的序列的3′最外侧末端之外(3′侧)1-3个核苷酸的区域。具体地讲,可以将探针或引物上的相应核苷酸设计成5′或3′末端核苷酸在形成互补链时,将位于构成多态性的序列的5′末端,3′末端,或中央。在本发明中,优选的是,上述5′或3′末端核苷酸位于构成多态性的序列的中央。还可以将相应核苷酸设计成位于构成多态性序列的周边区。
在制备入侵者探针和等位基因探针以便通过下文所披露的入侵者方法检测在表1中CYP2E(SEQ ID NO:65)的No.15所示的遗传多态性(TGT)时,将等位基因探针设计成互补于多态性位点TGT的核苷酸(即沿5′-3′方向为A,C或A)是所述等位基因探针的相应核苷酸,并且发生杂交(参见图4B中的图片(a)-(c))。例如,在图4B的图片(a)中,形成互补链的是5′侧的相应核苷酸“C”位于构成多态性的核苷酸(TGT)的中央。在图4B的图片(b)中,形成互补链的最5′侧的相应核苷酸“A”位于构成多态性的核苷酸(TGT)的“T”处。在图4B的图片(d)中,示出了等位基因探针,该探针被设计成它的相应核苷酸位于所述多态性位点(加下划线的部分)周边区(三个核苷酸)。
设计入侵者探针,以便它的3′末端核苷酸“N”(A,T,C或G中的任意一个)的位置相当于在杂交时所述多态性位点(TGT)的任意核苷酸的位置。不过,最有效的是将入侵者探针设计成在入侵者探针和等位基因探针之间存在一个核苷酸的重叠(图4C)。另一方面,为了检测其它多态性(即TGT的缺失),可以将入侵者探针和等位基因探针设计成位于缺失位点上游或下游1-3个核苷酸处的核苷酸是所述重叠核苷酸,其中考虑了TGT的缺失(即从所述序列上缺失)。图4B的图片(e)表示等位基因探针,它被设计成位于缺失位点两侧的两个核苷酸与它杂交。对于TaqMan探针来说,可以将它们设计成TGT或所述缺失位点的任意核苷酸位于该探针的中央。
所述寡核苷酸的核苷酸序列长度至少为13个核苷酸,优选13-60个核苷酸,更优选15-40个核苷酸,最优选18-30个核苷酸。可以将该寡核苷酸序列用作检测靶基因的探针,并且可以将它用作正向(正义)或反向(反义)引物。
用于本发明的寡核苷酸可以是由串联连接在一起的两个区域组成的寡核苷酸,其中一个区域能够与基因组DNA杂交,而另一个区域不能够与它杂交。连接的顺序没有特别的限定;任一个区域都可以位于上游或下游。该寡核苷酸的可杂交的区域是根据表1中所示出的含有SNP的序列的信息设计的。制备所述寡核苷酸,以便位于能够与基因组DNA杂交的区域最5′或3′末端的序列包含SNP。上述不能与基因组DNA杂交的寡核苷酸的区域是随机设计的,以便它不能与表1中所示出的含有SNP的序列杂交。可以将该寡核苷酸用作探针,主要用于在入侵者方法中检测SNPs。
另外,可以将本发明中使用的引物设计成,在通过PCR扩增、以便检查由SNP导致的功能改变、判断药物的效率或无效、并且检查副作用的出现时,表1中提供的核苷酸序列中包括SNP。对引物的长度进行设计,以便在所述引物中包括至少15个核苷酸,优选15-30个核苷酸,更优选18-24个核苷酸。该引物序列是从模板DNA中适当筛选的,以便所述扩增片段的长度为1000bp或更少,优选在500bp以内(例如,120-500bp),更优选在200bp以内(120-200bp)。
例如,可以将引物设计成有义和反义引物中至少其一包含在分别从紧靠SNP的5′或3′的核苷酸开始向所述基因的5′或3′末端计算为1000bp,优选200bp,更优选100bp的区域内。
如此设计的寡核苷酸引物或探针可以按照已知技术化学合成。通常,所述引物或探针是使用商业化学合成仪合成的。
还可以预先用荧光物质(例如,FAM,VIC,Redmond Dye等)标记探针,以便使检测过程自动化。
6.试剂盒
上述寡核苷酸可以包括在遗传多态性检测试剂盒中。本发明的遗传多态性检测试剂盒包括实施本发明所需的一种或多种成分。例如,本发明的检测试剂盒包括保存或供应实施裂解分析(例如,入侵者分析)所需的酶和/或反应成分的部件。本发明的检测试剂盒包括预期分析所需要的(合适的)任何和所有组成成分酶或成分。所述成分的例子包括、但不局限于寡核苷酸,聚合酶(例如Taq聚合酶),缓冲液(例如Tris缓冲液),dNTPs,对照试剂(例如,组织样品,作为正对照或负对照的目标寡核苷酸等),标记和/或检测试剂(荧光染料,如VIC,FAM),固体支持物,手册,说明图和/或产品信息,抑制剂,包装环境调节剂(例如,冰,干燥剂)。本发明的检测试剂盒可以是部分试剂盒,其中只包括一部分必需成分。在这种情况下,用户可以提供其余的成分。本发明的检测试剂盒可以包括两个或多个独立的容器,每一个容器装有要使用的一部分成分。例如,所述试剂盒可以包括装有酶的第一容器,和装有寡核苷酸的第二容器。所述酶的具体例子包括装在合适的储存缓冲液或容器中的结构特异性裂解酶。所述寡核苷酸的具体例子包括入侵者寡核苷酸,探针寡核苷酸,和被用作对照的目标寡核苷酸等。另外,能够以被预先分成特定量的部分的方式提供一种或多种反应成分。由于这样的试剂盒包括业已定量测定以便用于本发明方法的一个步骤的成分,没有必要再次测定或再次细分。还可以混合选定的反应成分,并且分成特定量的部分。优选的是,应当将反应成分预先分成小的部分,并且装在反应器中。所述反应器的具体例子包括,但不局限于反应管或孔,或微量滴定板。特别优选的是,应当通过诸如脱水或冷冻干燥的方法使所述预先分开的反应成分在反应器中保持干燥。
7.检测
使用按照上述方法制备的寡核苷酸作引物,利用DNA聚合酶扩增编码药物代谢酶的基因(模板DNA)。或者,将按照上述方法制备的探针与模板DNA杂交,以便检测具有基因多态性的靶DNA。所述模板DNA可以通过已知技术制备,例如氯化铯密度梯度超速离心,SDS分解,或苯酚-氯仿萃取。
(1)用PCR检测
可以通过聚合酶链反应(PCR)进行扩增。可以使用的DNA聚合酶的具体例子包括LA Taq DNA聚合酶(Takara),Ex Taq聚合酶(Takara),Gold Taq聚合酶(Perkin Elmer),AmpliTaq(Perkin Elmer),和PfuDNA聚合酶(Stratagene)等。
扩增条件如下。变性步骤在85-105℃下进行10-40秒,优选在94℃下进行20-30秒;退火步骤在50-72℃下进行20秒-1分钟,优选在60℃下进行20秒-1分钟。并且,延伸步骤在65-75℃下进行1-4分钟,优选在72℃下进行2-3分钟。以上为1轮反应。进行30-40轮。不过,为了使模板DNA和引物充分变性,可以在开始上述扩增循环之前,增加一个在95℃下变性1-5分钟的变性步骤[如果使用Gold Taq聚合酶(Perkin Elmer)的话,至少进行8-15分钟,优选10-12分钟。同样,为了充分延伸扩增的DNA,可以在上述扩增循环之后,增加一个在72℃下延伸1-5分钟或1-10分钟的延伸步骤。如果扩增产物的检测不是马上进行的话,比较理想的是增加一个在4℃下保存扩增产物的步骤,以避免非特异性扩增。因此,可以扩增出编码药物代谢酶(CYP)的基因。
然后,对扩增的产物进行琼脂糖凝胶电泳,接着用溴化乙锭、SYBRGreen溶液等进行染色,以便以单条带或2-3个条带的形式检测扩增产物(DNA片段)。因此,能够以DNA片段形式检测包括遗传多态性的编码药物代谢酶的基因的一部分。除了琼脂糖凝胶电泳之外,还可以进行聚丙烯酰胺凝胶电泳或毛细管电泳。还可以利用用诸如荧光染料之类物质标记过的引物进行PCR,并且检测所述扩增产物。还可以采用不需要电泳的检测方法;在所述方法中,让扩增产物与诸如微量滴定板之类的固体支持物结合,并且通过荧光或酶反应等方法检测感兴趣的DNA片段。
(2)通过TaqMan PCR检测
TaqMan PCR是一种在PCR反应中采用荧光标记的等位基因特异性寡聚体和Taq DNA聚合酶的方法。用于TaqMan PCR的等位基因特异性寡聚体(被称为“TaqMan探针”),可以根据上文所披露的SNP信息设计。用荧光报导染料R(例如,FAM或VIC)标记TaqMan探针的5′末端,与此同时,用淬灭剂Q(淬火物质)标记它的3′末端(图1)。在上述条件下,荧光是检测不到的,因为所述淬灭剂能吸收荧光能量。由于TaqMan探针的3′末端是磷酸化的,在PCR期间不会通过TaqMan探针发生延伸反应(图1)。不过,当使用这种TaqMan探针和Taq DNA聚合酶和设计成含有SNP的片段得到扩增的引物进行PCR时,发生了下文所述的反应。
首先,TaqMan探针与模板DNA上的特定序列杂交(图2a),与此同时,从PCR引物开始发生延伸反应(图2b)。与此同时,具有5′核酸酶活性的Taq DNA聚合酶随着延伸反应的进行而裂解杂交的TaqMan探针。在业已裂解了所述TaqMan探针之后,荧光染料不再受所述淬灭剂的影响。然后,可以检测荧光(图2c)。
例如,如图3所示,假设有两个等位基因:一个等位基因在SNP位点上具有位点A(等位基因1),而另一个等位基因在SNP位点上具有G(等位基因2)。用FAM标记对等位基因1特异的TaqMan探针,并且用VIC标记对等位基因2特异的另一TaqMan探针(图3)。将这两种等位基因特异性寡聚体添加到PCR试剂中,然后,用要检测其SNP的模板DNA进行TaqMan PCR。然后,用荧光检测仪检测FAM和VIC的荧光强度。当所述等位基因的SNP位点互补于TaqMan探针内相当于SNP的位点时,所述探针与所述等位基因杂交;并且Taq聚合酶能裂解探针的荧光染料,该探针变得不受所述淬灭剂的影响。由此可以检测到荧光强度。
如果所述模板是等位基因1的纯合体的话,就会出现FAM的强的荧光强度,而VIC的荧光几乎检测不到。如果所述模板是等位基因1和等位基因2的杂合体的话,FAM和VIC的荧光都可以检测到。
(3)通过入侵者方法进行SNP检测
入侵者方法是通过使等位基因特异性寡聚体与模板杂交而检测SNPs的方法。在入侵者方法中,使用了两种未标记的寡聚体和一种荧光标记的寡聚体。这两种未标记过的寡聚体之一被称为“等位基因探针”。所述等位基因探针由能够与基因组DNA(模板DNA)杂交而形成互补双链的区以及具有与所述模板DNA的序列完全无关、并因此不能与基因组DNA杂交的区(被称为“flap”)组成。位于所述可杂交区域最5′或3′末端的核苷酸相当于SNP(图4A中的图片(a))。上述flap序列是具有互补于下面所披露的FRET探针的序列的寡核苷酸。另一未标记过的寡聚体被称为“入侵者探针”。将该寡聚体设计成能与所述模板DNA从SNP位点向基因组DNA3′末端发生互补性杂交(图4A中的图片(b))。不过,相当于SNP的核苷酸(图4A中的图片(b)中的“N”)可以是任何核苷酸。当基因组DNA(模板)与以上两个探针杂交时,入侵者探针的一个核苷酸(N)侵入SNP位点(图4A中的图片(c))。结果在SNP位点处形成了三条链。
另一方面,所述荧光标记的寡聚体具有与等位基因完全无关的序列。该序列是共有的,与SNPs的类型无关。该探针被称为“FRET”探针(荧光共振能量转移探针)(图5)。用荧光染料R标记位于FRET探针(报导物)5′末端的核苷酸,而将淬灭剂Q连接在所述报导物的上游。在上述条件下,所述淬灭剂能吸收荧光染料,检测不到荧光。可以设计从5′末端报导核苷酸开始的FRET探针的某些区(被命名为“1区”),以便当1区和2区彼此相对时,它与位于1区3′侧的探针的某个区(被命名为“2区”)互补。因此,1区和2区在FRET探针内形成了互补链(图5)。另外,设计了位于该互补链形成区下游的区域,使得它能与所述等位基因探针的flap杂交,从而形成互补链(图5)。
在入侵者方法中,使用了被称为cleaavase的酶,它是一种具有独特的5′内切核苷酸酶活性的核苷酸酶,它能根据对特定DNA结构的识别进行裂解。Cleavase是一种在所述基因组DNA,等位基因探针和所述入侵者探针在SNP位点处形成三链体时能够在紧靠SNP位点3′侧的位点处裂解所述等位基因探针的酶。因此,当三个核苷酸形成了图4A中的图片(c)所示出的三链体时,cleavaase识别5′flap,并且将该flap切除。由此,该SNP位点的结构被cleavage所识别(图6中的图片(a)),并且在它的侧翼(flap)位点裂解所述等位基因探针,以便释放出所述flap(图6中的图片(b))。然后,从所述等位基因探针中释放出来的flap与FRET探针发生互补性结合,因为它具有互补于FRET探针的序列(图6中的图片(c))。此时,所述flap的SNP位点侵入FRET探针的业已形成了双链的部分。Cleavase再次识别该结构,并且将被荧光染料标记了的核苷酸切除。因此,裂解的荧光染料变得不受所述淬灭剂的影响,并且发射荧光(图6中的图片(d))。当所述基因组DNA中的SNP与相当于所述等位基因探针中的SNP的核苷酸不匹配时,就不能形成如图7所示的可以由cleavase识别的特殊DNA结构。因此,所述等位基因探针没有被裂解,并且检测不到荧光。
例如,当要检测的SNP是T/C时,制备了T的入侵者探针和等位基因探针,以及具有相当于SNP的FAM-连接报导物的FRET探针。还分别制备了针对C的入侵者探针和等位基因探针,以及具有相当于SNP的VIC-连接报导物的FRET探针。然后,将所有探针混合在一起,以便进行SNP检测。结果,如果受试者的SNP是T/T纯合型的话,就能发射FAM的荧光;如果受试者的SNP是C/C纯合型的话,就发射VIC的荧光;如果受试者的SNP是T/C杂合型的,就发射FAM和VIC这两种荧光。由于FAM和VIC具有不同的荧光波长,可以区分这两种荧光。被荧光染料标记了的产物可以用荧光平板读数器或用用于收集在反应期间产生的荧光数据的装置(实时荧光检测仪)检测。实时荧光检测仪的例子包括ABI7700序列检测系统(Applied Biosystems)。
(4)通过SniPer方法检测
为了通过SniPer方法检测SNPs,可以通过RCA检查扩增的存在与否来分辨等位基因。简单地讲,将被用作模板的基因组DNA线性化。然后,让探针与该基因组DNA杂交。当所述探针序列和基因组DNA序列彼此互补并且形成双链时,可以通过连接反应将所述基因组DNA转化成环状DNA。结果,环状DNA的RCA继续进行。另一方面,当所述探针的末端与所述基因组DNA不匹配时,所述DNA不能连接而形成环状DNA。因此,RCA反应不能继续进行。因此,在Sniper方法中设计了能够与基因组DNA退火并且环化的单链探针。该单链探针被称为挂锁探针。将该挂锁探针的两端的序列设计成相当于要检测的SNP。然后混合该挂锁探针和基因组DNA,以便连接。如果挂锁探针的两端和基因组DNA的SNP位点是彼此互补的话,通过连接将所述挂锁探针的两端接在一起,产生环状探针。如果挂锁探针和基因组DNA的SNP位点不是彼此互补的话,探针就不能成为环状。因此,只有互补于要检测的SNP的挂锁探针可以成为环状,并且通过DNA聚合酶扩增。通过检测该扩增的存在与否,可以检测SNP。为了进行所述检测,使用了合成的寡核苷酸,它在相应末端具有荧光染料和淬灭剂,并且还具有发卡结构。
(5)通过MALDI-TOF/MS方法检测
MALDI-TOF/MS(Matrix Assisted Laser Desorption-Time ofFlight/Mass Spectrometry)是将质谱仪用于SNP分型的方法。该方法包括以下步骤:
(i)含有SNP的DNA片段的PCR扩增和纯化
设计PCR引物,以便在它们和SNP位点的核苷酸之间没有重叠。然后,扩增DNA片段。通过用外切核酸酶,碱性磷酸酶等处理,除去引物,dNTPs等,从扩增反应产物中纯化所述扩增片段。
(ii)引物延伸(热循环)和纯化
将十倍或更多的引物添加到所述目标区的模板(它是PCR产物)中,并且通过热循环进行引物延伸。将这里所使用的引物设计成它们的3′末端靠近SNP位点的核苷酸。所述引物的长度为15-30个核苷酸,优选20-25个核苷酸。当进行多次反应时,将不互补于所述模板的序列添加到5′末端。在85-105℃(优选94℃)和35-40℃(优选37℃)两种温度之间进行热循环,共20-30轮(优选25轮)。用纯化试剂盒等纯化所得到的产物,使它们适合质谱仪分析。
(iii)用质谱仪对DNA进行质谱分析
将所述纯化的延伸反应产物加样到质谱仪上,以便确定所述纯化产物的质量。简单地讲,将所述纯化的产物与基质混合,并且将0.5-1.0μ1的混合物点在MALDI平板上。在干燥所述平板之后,将激光打在所述样品上,以便制备光谱图。
(6)通过DNA测序方法检测
在本发明中,可以通过使用单核苷酸延伸反应检测多态性。简单地讲,将用不同荧光化合物标记的四种类型的双脱氧核苷酸添加到含有感兴趣的基因的反应系统中。然后,实施单核苷酸延伸反应。在这种情况下,要延伸的核苷酸是所述多态性位点。另外,实施DNA合成终止和DNA分子3′末端的荧光标记这两种反应。在测序凝胶或毛细管的相同泳道上对四种类型的反应溶液进行电泳。用荧光检测仪检测用于标记的荧光染料的差异,以便对所述DNA带进行测序。或者,用荧光检测系统或质谱分析系统检查所述单核苷酸延伸的寡核苷酸,以便利用荧光染料的差异确定哪一个核苷酸被延伸。除了荧光标记的双脱氧核苷酸之外,可以对引物进行荧光标记,并且与未标记过的双脱氧核苷酸一起使用。
(7)在DNA微阵列上检测
DNA微阵列是在上面固定了核苷酸探针的固体支持物,它们包括DNA芯片,基因芯片,微型芯片,和珠阵列等。作为DNA微阵列(例如,DNA芯片)分析的具体例子,可以列举基因芯片分析(Affymetrix;美国专利号6,045,996;5,925,525;和5,858,659)。基因芯片技术采用具有附着在芯片上的寡核苷酸探针的小型、高密度微阵列。可通过例如光辐射化学合成方法(Affymetrix)生产探针阵列,该方法是固体化学合成和用于半导体行业的光刻生产技术的组合。可以通过使用光刻掩模以便使芯片的化学反应位点的边界明确,并且实施特殊的化学合成步骤,由此制造高密度阵列。多探针阵列是在大型玻璃基板上同时合成的。然后,使基板干燥,并且将各探针阵列包装在铸模塑料盒中。该盒能使所述阵列与外部环境隔离,并且还能起着杂交腔室的作用。
首先,分离要分析的多核苷酸,通过PCR扩增,并且用荧光报导基团标记。然后,用流体装置将所述标记过的DNA和阵列一起孵育。将该阵列插入扫描仪中,以便检测杂交形式。以来自与所述探针阵列结合的荧光报导基团的发光形式采集杂交数据(即考虑所述目标序列)。一般而言,与所述目标序列完全匹配的探针所产生的信号比具有与所述目标序列不匹配的部分的探针产生的信号强。由于所述阵列上各探针的序列和位置是已知的,可以根据互补性确定与所述探针阵列起反应的目标多核苷酸的序列。
在本发明中,还可以使用具有电俘获探针的DNA微型芯片(Nanogen;例如,参见美国专利号6,017,696;6,068,818;和6,051,380)。通过使用微电子装置,Nanogen的技术能够将带电荷的分子转移到半导体微型芯片上的特定检测位点处,以及从位点上转移走,并且浓缩所述分子。将对某些SNPs特异的DNA捕捉型探针排列在微型芯片上的特定位置上或指定地址。由于DNA强烈带负电荷,它能够以电子方式移动到带正电荷的部位。
首先,用正电荷将微型芯片上的测试位置或一排测试位置电激活。然后,将含有DNA探针的溶液引导到所述微型芯片上。由于带负电荷的探针能够快速移动到带正电荷的部位,探针在微型芯片上的该部位浓缩,并且与该部位化学结合。洗涤该微型芯片,并且将另一种DNA探针溶液添加到所述微型芯片上,使DNA探针与芯片特异性结合。
然后,分析所述目标DNA分子是否存在于测试样品中。该分析是通过判断所述DNA捕获探针的类型而实施的,所述探针业已与测试样品的互补DNA杂交。作为测试样品,可以有已通过PCR扩增的感兴趣的基因。通过使用电荷,可以将靶分子移动到微型芯片上的一个或多个测试位点处并且浓缩。所述样品DNA在某一个测试位点处发生电浓缩的结果是,样品DNA和与它互补的捕获探针之间的杂交能迅速完成。例如,由于所述操作的结果,杂交在几分钟内完成。为了从每一个测试位置上除去未结合的DNA或非特异性结合的DNA,将所述位置处的极性或电荷转化成负电荷,以便使未结合的DNA或非特异性结合的DNA重新回到溶液中。在该方法中,可以检测特异性结合,例如通过使用采用激光的荧光扫描仪进行检测。
另外,在本发明中,还可以使用阵列技术,该技术利用了由于表面张力的差异在平面表面(芯片)上出现的流体分离现象(ProtoGene;例如参见美国专利号6,001,311;5,985,551;和5,474,796)。ProtoGene技术基于以下事实:由于化学包衣造成的表面张力的差异,流体在平面上是彼此分离的。由于可以根据上述原理可以分离寡核苷酸探针,可以通过含有探针的试剂的喷墨印刷,直接在芯片上合成探针。将具有由表面张力限定的反应位点的阵列安装在位于一组(4个)压电喷头下面的X/Y可移动工作台上。每一个压电喷头包括四种标准核苷酸,该可移动的工作台沿所述阵列的每一行移动,以便向每一个反应位点提供合适的试剂(例如,amidite)。将所述阵列的整个表面浸泡在所述阵列的测试位点所共有的试剂中,然后浸泡在洗涤溶液中。然后,旋转所述阵列,以便将所述溶液除掉。
使用Protogene的技术,将对待检测SNPs或变异特异的DNA探针固定在芯片上。然后,将所述芯片与感兴趣的经PCR扩增的基因接触。在杂交之后,除去未结合的引物,然后使用合适的方法检测杂交。
另外,可以使用“珠阵列”检测多态性(Illumina Inc.;例如,参见PCT国际公开号WO99/67641和WO00/39587)。Illumina有限公司采用了珠阵列技术,该技术使用了光学纤维束和与所述阵列发生自我结合的珠子的组合。根据所述纤维束的直径,每一束光学纤维具有几百万根纤维。用对某些SNPs或变异的检测特异的寡核苷酸对珠子进行包被。将各种类型的珠子以特定的量混合,以便形成阵列特异性库。为了分析,让珠子阵列与由受试者体内制备的样品接触。然后,通过合适的方法检测杂交。
8.药物的评估
在本发明中,可以根据按上述方法获得的诸如SNP之类的遗传多态性的检测结果评估通过药物代谢酶代谢的药物的效力和安全性。
药物的评估可以通过分型系统进行。简单地讲,根据上述任意一种检测方法,比较在出现毒性(副作用)组和未出现毒性组之间的等位基因的频率,选择在两组之间造成等位基因频率差异的多态性,作为识别毒性存在的标记。作为统计学测验,通常进行χ2测验,不过,还可使用诸如Fisher测验之类的其它统计学处理。另外,可以将该结果体现在血液或组织中药物的活性体(或未改变的实体或药物代谢物)的浓度方面。对于所有遗传多态性来说,可检查了原因和效果与毒性之间的关系。然后,仅选择表现出与所述毒性具有相关性的遗传多态性位点。可以通过以下方法检查等位基因形式:预先在反应板、卡或玻璃基板等上制备用于分析遗传多态性的所有探针或引物以及每一种技术所必需的试剂,并且将人类受试者的基因组DNA添加上去,以便反应。当所述受试者具有和所述毒性相关的遗传多态性时,可以预测所述药物在受试者体内是否有效或是否有毒。可以用类似方法评估药物的效力。与副作用或效力相关的遗传多态性根据药物而改变。因此,通过利用所述遗传多态性进行分型,可以预测所述药物的效力或副作用。
通过这种方法,将所述遗传多态性的频率与效力/无效力或副作用的存在/缺乏进行比较。当在等位基因频率方面存在差异时,可以对药物进行判断。
例如,如果在服用药物A时表现出毒性(副作用)的人体内的SNP分析结果在统计学上揭示出,90%的这种人具有T/T(例如,检查到了FAM的荧光强度)时,并且如果在没有表现出毒性(副作用)的人体上进行的SNP分析结果揭示了只有10%的这种人具有T/T,而其中90%的人具有C/C的话,就可以评估药物A不应当给具有T/T的人服用。
9.筛选药物
在本发明中,将按上述方法获得的遗传多态性信息与个体的编码相应药物代谢酶的基因内的遗传多态性信息进行比较。通过这种方式,可以将上述信息用作分析由所述药物代谢酶代谢的药物的效力和安全性的指示剂。因此,在本发明中获得的遗传多态性信息起着用于选择用来治疗疾病的最有效药物的信息资源的作用。
作为一种方法,可以使用在“8.药物的评估”部分所披露的评估方法。简单地讲,可以说,在前面的小部分中被认为与副作用或效力相关的遗传多态性能对所述酶的活性、转录、和翻译产生影响。另外,可以说,这种遗传多态性与副作用或效力发生的机制具有某些间接的关系。药物的代谢是由药品生产商等在前临床试验或临床试验中检验并且证实的。因此,如果所述药物是酶,并且与严重副作用相关的多态性存在于位于编码所述酶的基因内的多态性中的话,就可以删除该相关多态性或有条件地使用所述药物。就效力而言,可以进行类似的评估。根据有关副作用和效力的信息,这种信息,有可能进行药物筛选。
另外,通过对在临床试验中出现副作用的病例和没有副作用的病例进行遗传多态性频率分析(从I期到III期试验),可以检测除了上述多态性之外的、与副作用或效力相关的新型遗传多态性。通过以与上文所述相同的方法检查这种多态性,有可能进行药物筛选。
实施本发明的最佳方式
下面,将结合实施例对本发明作更详细的说明。不过,本发明的技术范围并不局限于这些实施例。
例1:SNP信息的获得
(1)提取DNA
在存在EDTA的条件下,从48个不相关的个体体内采集血液。按下文所述方法进行DNA提取,采用了披露于以下文献中的方法:″Genomic Analysis Laboratory Manual(Genomu Kaiseki RaboManyuaru)″(Yusuke Nakamura ed.,Springer-Verlag Tokyo)。
将十毫升血液放入50-ml的Falcon试管中,并且以3000rpm的速度在室温下离心5分钟。用吸液管收集所述上清液(血清),然后添加30ml的RBC裂解缓冲液(10mM NH4HCO3,144mM NH3Cl)。在混合直到混合物松散之后,将该混合物在室温下放置20分钟。然后以3000rpm的速度在室温下对该混合物离心5分钟,使用吸液管将上清液(血清)弃去,获得白血细胞沉淀。将30ml的RBC裂解缓冲液添加到所述沉淀中,并且将相同的操作再重复2次。向所述白细胞沉淀中添加4ml蛋白酶K缓冲液(50mM Tris-HCl(pH7.4),100mM NaCl,1mM EDTA(pH8.0)),200μl的10%SDS,200μl的10mg/ml蛋白酶K,并且通过倒转混合所述混合物,在37℃下静置过夜。添加4ml苯酚,并且利用旋转仪(Rotator T-50,Taitec)通过倒转缓慢混合。在室温下以3000rpm的速度对该混合物进行离心10分钟,将上层收集到新的试管中,添加4ml苯酚-氯仿-异戊醇(体积比为25∶24∶1),按上述方法倒转混合2小时并且离心。将上层收集到新的试管中,并且添加4ml苯酚-异戊醇(体积比为24∶1),按上述方法通过倒转混合30分钟,并且离心。将上层收集到新的试管中,并且添加400μl的8M乙酸铵和4ml异戊醇,然后通过倒转混合。将纤维状白色沉淀(DNA)收集到2-ml的试管中,并且添加1ml 70%的乙醇,通过倒转混合。在将DNA收集到新的2-ml试管并且风干之后,添加500μl的TE溶液(10mM Tris-HCl(pH7.4)和1mM EDTA(pH7.4)),以便溶解所述DNA,获得基因组DNA样品。
(2)PCR
从GenBank DNA数据库中获得基因组序列。采用RepMask计算机程序除去所述重复序列,并且设计PCR产物,使得PCR产物大约为1kb。所使用的基因组DNA是从48个不相关的个体体内获得的DNA,将这些DNA制备成相同的浓度。将来自三个个体的等量的每一种DNA放入一个试管中并且混合,将取自该混合物的60ng样品用于PCR。PCR是在GeneAmp PCR System 9700(PE Applied Biosystems)上,用Ex-Taq(2.5U;TaKaRa)进行的。一轮扩增包括在94℃下反应2分钟,然后在94℃下变性30秒、在60℃或55℃下退火30秒、并且在72℃下延伸1分钟,进行35轮扩增。
(3)测序
采用Arraylt(Telechem)纯化PCR产物,并且用BigDye TerminatorRR Mix(PE Applied Biosystems)进行测序反应。一轮反应包括在96℃下反应2分钟,然后在96℃下变性20秒,在50℃下退火30秒,并且在60℃下延伸4分钟,使用GeneAmp PCR System 9700(PE AppliedBiosystems),进行25轮。在所述测序反应之后,在ABI PRISM 3700 DNA分析仪上进行序列分析。
(4)SNP检测
将PolyPhred计算机程序(Nickerson等,1997,Nucleic AcidsRes.,25,2745-2751)用于对SNP检测进行分析。
(5)结果
获得了表1所示的有关SNP的结果。另外,在图9-16中示出了分析的药物代谢酶的名称和缩写,数据库(GenBank)的入藏登记号以及药物代谢酶的遗传结构和SNPs的位置。在图9-16中,外显子表示为白色方框或水平线形式的通过基因的黑色线条。SNPs的位置是以在所述基因上的实线形式示出的,并且给出了编号。
例2
通过入侵者方法分型确定从两组不同的受试者获得的CYP基因的多态性。结果如图17所示。在图17中,水平轴(等位基因1)和垂直轴(等位基因2)分别表示与G相应的VIC荧光强度和与A相应的FAM荧光强度。用虚线圈起来的每一个区表示SNP形式,黑色矩形(■),黑色圆形(●),和黑色三角形(▲)分别表示G/G,A/A,和G/A。白色矩形(□)表示背景值。可以看出,在图片A(上图)的图表中示出的受试者组通常具有G/G的SNP形式,而在图片B(下图)的图表中示出的受试者组通常具有A/A的SNP形式。
例3:SNP的检测
将按照例1所述方法从5个不相关的个体采集的基因组DNA用作样品,通过入侵者方法进行两种类型的CYP基因(CYP2E,CYP2S)中的SNP的检测。采用了根据CYP2E的相应序列Nos.6和13(SEQ ID Nos.56和63)和CYP2S的相应序列No.3和10(SEQ ID Nos.72和79)设计的入侵者探针和等位基因探针。在表1中示出了每一个SNP的位置。
结果如表2所示。
表2
药物代谢酶基因                  CYP2E                 CYP2S
    No.6     No.13     No.3     No.10
    SEQ ID No.56     SEQ ID No.63     SEQ ID No.72     SEQ ID No.79
SNP     (G/A)     (T/C)     (G/C)     (C/A)
受试者I受试者II受试者III受试者IV受试者V受试者VI     G/GG/AG/GG/AG/AA/A     T/CT/CT/TT/TT/CC/C     C/CG/CG/CG/CG/GG/C     C/CA/AC/CC/AC/AC/A
从表2所示结果可以看出,本发明的方法可以检测SNP,并且确定它们在每一个受试者的药物代谢酶基因中的形式。
本文所引用的所有出版物、专利和专利申请都全文收入本文作为参考。
工业应用性
根据本发明,提供了用于分析SNPs的方法。根据本发明的方法,可以筛选用于靶疾病的合适的药物。因此,本发明的方法是非常有用的。
无序列表文本
SEQ ID NO 65:n表示tgt或缺失(21号位置)。
SEQ ID NO 66:n表示t重复9-11次(21号位置)。
SEQ ID NO 71:n表示agg或缺失(21号位置)。
SEQ ID NO 73:n表示a重复10-11次(21号位置)。
SEQ ID NO 75:n表示tctc或缺失(21号位置)。
SEQ ID NO 76:n表示a重复11-12次(21号位置)。
SEQ ID NO 78:n表示tc重复7-8次(21号位置)。
SEQ ID NO 80:n表示t重复10-13次(21号位置)。
SEQ ID NO 85:n表示t重复11-13次(21号位置)。
SEQ ID NO 100:n表示a或缺失(21号位置)。
SEQ ID NO 101:n表示tg或缺失(21号位置)。
SEQ ID NO 105:n表示t重复12-25次(21号位置)。
SEQ ID NO 112:n表示t重复10-12次(21号位置)。
SEQ ID NO 115:n表示a重复12-16次(21号位置)。
SEQ ID NO 116:n表示gag或缺失(21号位置)。
SEQ ID NO 122:n表示t重复9-10次(21号位置)。
SEQ ID NO 126:n表示″ttggtcccccaaccgcctgtctccccacaccccgcaa″或″aggctgcagtCC″(21号位置)。
SEQ ID NO 129:n表示t重复9-12次(21号位置)。
SEQ ID NO 137:n表示ac重复12-13次(21号位置)。
SEQ ID NO 141:n表示a重复9-10次(21号位置)。
SEQ ID NO 146:n表示t重复13-16次(21号位置)。
SEQ ID NO 147:n表示c或缺失(21号位置)。
SEQ ID NO 148:n表示t重复9-10次(21号位置)。
SEQ ID NO 149:n表示a重复10-12次(21号位置)。
SEQ ID NO 152:n表示t重复8-9次(21号位置)。
SEQ ID NO 182:n表示t重复9-10次(21号位置)。
SEQ ID NO 191:n表示t重复8-9次(2 1号位置)。
SEQ ID NO 197:n表示t重复9-12次(21号位置)。
SEQ ID NO 198:n表示t重复10-11次(21号位置)。
SEQ ID NO 199:n表示t重复12-14次(21号位置)。
SEQ ID NO 204:n表示a重复16-19次(21号位置)。
SEQ ID NO 205:n表示a重复6-7次(21号位置)。
                    序列表
<110>RIKEN
<120>检测基因多态性的方法
<130>PH-1793-PCT
<150>JP2002-158237
<151>2002-5-30
<160>215
<170>PatentIn Ver.2.1
<210>1
<211>41
<212>DNA
<213>Homo sapiens
<400>1
tgctggcctc agggatgctt ytggtggcct tgctggtctg c                    41
<210>2
<211>41
<212>DNA
<213>Homo sapiens
<400>2
ttcattggaa actacctgca rctgaacaca gagcagatgt a                    41
<210>3
<211>41
<212>DNA
<213>Homo sapiens
<400>3
aggcagggag atgggtggca yggggtgggg gctgcctagt t                    41
<210>4
<211>41
<212>DNA
<213>Homo sapiens
<400>4
cagtgtggac cagagtctta rgaaatggag ttttggagtt t                    41
<210>5
<211>41
<212>DNA
<213>Homo sapiens
<400>5
caggatcttg ggatgtccag ytccctgact gtgagaacct g                    41
<210>6
<211>41
<212>DNA
<213>Homo sapiens
<400>6
agctgctccg ctcctgcccc ygccgccccc tggcctgtct c                    41
<210>7
<211>41
<212>DNA
<213>Homo sapiens
<400>7
gagcagggga ccccgagtgc kggggcagga gaaggaaaac a                    41
<210>8
<211>41
<212>DNA
<213>Homo sapiens
<400>8
acccgcgcgc gttctgcctg sggatgggga ctaggtgggg a                    41
<210>9
<211>41
<212>DNA
<213>Homo sapiens
<400>9
ttaacaggat cctactccaa maatgcgaat ggctgatgtc t                    41
<210>10
<211>41
<212>DNA
<213>Homo sapiens
<400>10
ctccagactc tttgtgtcag ragaatcaaa cacatgttcc c                    41
<210>11
<211>41
<212>DNA
<213>Homo sapiens
<400>11
cttcccctta cctggggcac mctagttccc cctccagccc c                    41
<210>12
<211>41
<212>DNA
<213>Homo sapiens
<400>12
caggacttca atccccagca yttcctgaat gagaaggggc a                    41
<210>13
<211>41
<212>DNA
<213>Homo sapiens
<400>13
ccccagcact tcctgaatga saaggggcag tttaagaaga g                    41
<210>14
<211>41
<212>DNA
<213>Homo sapiens
<400>14
gaccactgtt tgctgccagg ycacggctca caccagcagg g                    41
<210>15
<211>41
<212>DNA
<213>Homo sapiens
<400>15
ccacggctca caccagcagg sgcctccctc accctcctcc c                    41
<210>16
<211>41
<212>DNA
<213>Homo sapiens
<400>16
gggaagagaa gaaacagaag sggctcagtt caccttgata a                    41
<210>17
<211>41
<212>DNA
<213>Homo sapiens
<400>17
gagctgggat gagaggaagg raacccttac attatgctat g                    41
<210>18
<211>41
<212>DNA
<213>Homo sapiens
<400>18
ctgggatgag aggaaggaaa mccttacatt atgctatgaa g                    41
<210>19
<211>41
<212>DNA
<213>Homo sapiens
<400>19
tccacagttt atctgttgcc ygctcctaaa tccacagccc t                    41
<210>20
<211>41
<212>DNA
<213>Homo sapiens
<400>20
agctgtgtgg gattcagggt yggggtgtag ttgggaggtg a                    41
<210>21
<211>41
<212>DNA
<213>Homo sapiens
<400>21
ggtcttgatg tcagtctggc rgcagaggaa gagcaggggg a                    41
<210>22
<211>41
<212>DNA
<213>Homo sapiens
<400>22
aggctgagga gttcagcggg ygaggcgagc aggccacctt c                    41
<210>23
<211>41
<212>DNA
<213>Homo sapiens
<400>23
cagtgtcccc tcaaaatcag yccccgatat tggacaactg g                    41
<210>24
<211>41
<212>DNA
<213>Homo sapiens
<400>24
tctacttcac ccacttaaat rcctgaaaac atggacaggt g                    41
<210>25
<211>41
<212>DNA
<213>Homo sapiens
<400>25
cacctcaaca ggtatcccct scacttcaac atcttcacca g                    41
<210>26
<211>41
<212>DNA
<213>Homo sapiens
<400>26
agccccactt taatacctga rcacctgaac aaaagccccc a                    41
<210>27
<211>41
<212>DNA
<213>Homo sapiens
<400>27
agaaggtgga gcacaaccag ygcacgctgg atcccaattc c                    41
<210>28
<211>41
<212>DNA
<213>Homo sapiens
<400>28
gggc taagaa tgggggcagt sggggaagga aggggagagg t                   41
<210>29
<211>41
<212>DNA
<213>Homo sapiens
<400>29
gaaagttgtc tctatctgat ktctcacaaa acgtaagtgc c                    41
<210>30
<211>41
<212>DNA
<213>Homo sapiens
<400>30
tatctgattt ctcacaaaac rtaagtgccc agaaaatctt t                    41
<210>31
<211>41
<212>DNA
<213>Homo sapiens
<400>31
caccagttct gcatctcttg stcctccttc tgtttctccg a                    41
<210>32
<211>41
<212>DNA
<213>Homo sapiens
<400>32
tcttgctact cctggttcag ygccacccta acacccatga c                    41
<210>33
<211>41
<212>DNA
<213>Homo sapiens
<400>33
aacagaaacc aacttatctt sgtcgatttt gaggttgata g                    41
<210>34
<211>41
<212>DNA
<213>Homo sapiens
<400>34
ttatcttcgt cgattttgag rttgatagta atttcagtta t                    41
<210>35
<211>41
<212>DNA
<213>Homo sapiens
<400>35
agagtaagca aacctcaaga yactcaaggt aggcactcgt g                    41
<210>36
<211>41
<212>DNA
<213>Homo sapiens
<400>36
tagatttgt t tacccataag yctgcatagc tcctgaacaa g                   41
<210>37
<211>41
<212>DNA
<213>Homo sapiens
<400>37
ccacaccccc ataggtagtc yccaggtctt gcatacggga t                    41
<210>38
<211>41
<212>DNA
<213>Homo sapiens
<400>38
ttcacggtac acctgggacc saggcccgtg gtcatgctgt g                    41
<210>39
<211>41
<212>DNA
<213>Homo sapiens
<400>39
ccaacttctt ctacaaccaa yccacacctc ccctgcaccc c                    41
<210>40
<211>41
<212>DNA
<213>Homo sapiens
<400>40
ggggcctgag aggaggtgca kagtgagaac cggctgcatg g                    41
<210>41
<211>41
<212>DNA
<213>Homo sapiens
<400>41
acttcagtct gtgtccttga yctgctgctt cttcctaggg g                    41
<210>42
<211>41
<212>DNA
<213>Homo sapiens
<400>42
tcctaggggc cctcatggac sccaccttcc tcttccagtc c                    41
<210>43
<211>41
<212>DNA
<213>Homo sapiens
<400>43
gaccccacct tcctcttcca ktccattacc gccaacatca t                    41
<210>44
<211>41
<212>DNA
<213>Homo sapiens
<400>44
agaaagacaa ataaacaggc ygaggtagac aatgggtgac a                    41
<210>45
<211>41
<212>DNA
<213>Homo sapiens
<400>45
gttcagaggc agaggggagt rgggaagtgg ggttcccatg g                    41
<210>46
<211>41
<212>DNA
<213>Homo sapiens
<400>46
agaaagatga ggtgaaagga rggagaaaat agggaggagg a                    41
<210>47
<211>41
<212>DNA
<213>Homo sapiens
<400>47
agaaaagcaa actgggccag rtagtgtcaa agacctttag g                    41
<210>48
<211>41
<212>DNA
<213>Homo sapiens
<400>48
tcaaagacct ttaggccaac rgagggcagc cagggagatg g                    41
<210>49
<211>41
<212>DNA
<213>Homo sapiens
<400>49
ccagagggca ggtactatcc ycaacttgag aaaaacaacg a                    41
<210>50
<211>41
<212>DNA
<213>Homo sapiens
<400>50
tacccccaac ataccagatc ygcttcctgc cccgctgaag g                    41
<210>51
<211>41
<212>DNA
<213>Homo sapiens
<400>51
tctcacccca ccaaagccaa sgcttcaatt tcagtctgtg g                    41
<210>52
<211>41
<212>DNA
<213>Homo sapiens
<400>52
cccacacagg acaacagggt kcaggggtct ggacagctgt t                    41
<210>53
<211>41
<212>DNA
<213>Homo sapiens
<400>53
acaggggtga gtccgcgtcc ytggcacgga gcggggggtg c                    41
<210>54
<211>41
<212>DNA
<213>Homo sapiens
<400>54
ttcccctcct gttcaaccgc mggggtacag gtggcttcgt c                    41
<210>55
<211>41
<212>DNA
<213>Homo sapiens
<400>55
ttcagggctt tgctcagctg yagctggtga cctccagaga g                    41
<210>56
<211>41
<212>DNA
<213>Homo sapiens
<400>56
ggggtggatg tcctgagacc rggaaggggg aagagaccca c                    41
<210>57
<211>41
<212>DNA
<213>Homo sapiens
<400>57
tgagctgata aagaacgccg kcagcacaga gcagacgctg g                    41
<210>58
<211>41
<212>DNA
<213>Homo sapiens
<400>58
cttttcaaga atgttgtcga yagataggaa agaggtggga g                    41
<210>59
<211>41
<212>DNA
<213>Homo sapiens
<400>59
ggggccccac gcaccccctt kcctaacgtc aggatgtgta t                    41
<210>60
<211>41
<212>DNA
<213>Homo sapiens
<400>60
gacagagaag ataatgtccc rgttcccccc aagtaagacc t                    41
<210>61
<211>41
<212>DNA
<213>Homo sapiens
<400>61
ctacagctgc cctggaccct ygttccttcc acagggctcc t                    41
<210>62
<211>41
<212>DNA
<213>Homo sapiens
<400>62
gaggtgatgt gagggcaccc rcatgcaaac aggccagtca g                    41
<210>63
<211>41
<212>DNA
<213>Homo sapiens
<400>63
agttcacagc ctgagtggtg ygtgccgccc tcctcctgaa g                    41
<210>64
<211>41
<212>DNA
<213>Homo sapiens
<400>64
ctttggcagg ggtcactgag kggaagggct ggccccactc c                    41
<210>65
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表tgt或缺失
<400>65
tcctgggaat gaagtgttgt naggtggatt ttttttttcc c                    41
<210>66
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复9-11次
<400>66
gaagtgttgt tgtaggtgga ncccaaagac tagacatttt a                    41
<210>67
<211>41
<212>DNA
<213>Homo sapiens
<400>67
agttgacagc tttcccaaaa yggttcacgg agacttcatt t                    41
<210>68
<211>41
<212>DNA
<213>Homo sapiens
<400>68
gacagctttc ccaaaacggt kcacggagac ttcatttgac t                    41
<210>69
<211>41
<212>DNA
<213>Homo sapiens
<400>69
caaaccaaac atcctctaag ktctactgtg cagagtatag c                    41
<210>70
<211>41
<212>DNA
<213>Homo sapiens
<400>70
ttcccgacat caggcggcgg yggtggtccg ggagaaaccc g                    41
<210>71
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表agg或缺失
<400>71
ccgcgcggag cgcctgggag nagaaggagc cgacctgccg a                    41
<210>72
<211>41
<212>DNA
<213>Homo sapiens
<400>72
tgggtggagc tcagttggga sttcctggga ctggggagga a                    41
<210>73
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复10-11次
<400>73
acagagcgag attccgtctc ngaaagaaag gaagaagggg g                    41
<210>74
<211>41
<212>DNA
<213>Homo sapiens
<400>74
ctcctggttc ctgcggcccc ygccaggccc ccacaagcag c                    41
<210>75
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表tctc或缺失
<400>75
catttgtgcc gggctgtctg ntccagcatc tctcctcttt c                    41
<210>76
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复11-12次
<400>76
acagagcgag acactgtttc ngtgagaatt ctagagggaa g                    41
<210>77
<211>41
<212>DNA
<213>Homo sapiens
<400>77
gcgagacact gtttcaaaaa raaaaaagtg agaattctag a                    41
<210>78
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表tc重复7-8次
<400>78
gaggaatact gactcagccc nctcaccagg gaagcgtgtc t                    41
<210>79
<211>41
<212>DNA
<213>Homo sapiens
<400>79
ctctcccagc ctgtgaccac mgatgtccac acacccccaa c                    41
<210>80
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复10-13次
<400>80
tttcttttta actggtttaa ngaacttttt tatctcattg t                    41
<210>81
<211>41
<212>DNA
<213>Homo sapiens
<400>81
tccacaacca tcagccccgc yccaggactc actgtgggtc t                    41
<210>82
<211>41
<212>DNA
<213>Homo sapiens
<400>82
ccttcagcgg gccccctgtc rctctctccc ccacaaaccc t                    41
<210>83
<211>41
<212>DNA
<213>Homo sapiens
<400>83
caaaggcact gaggagcccc stctcagcat tgcttttatc c                    41
<210>84
<211>41
<212>DNA
<213>Homo sapiens
<400>84
aactgctccc ttctagtggt raaggggaaa gcagtttcat g                    41
<210>85
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复11-13次
<400>85
gagggataca tctatttccc natctttttg tatttttgtc t                    41
<210>86
<211>41
<212>DNA
<213>Homo sapiens
<400>86
atgattgaat gaactcttcc yctaacccta gtgccataat a                    41
<210>87
<211>41
<212>DNA
<213>Homo sapiens
<400>87
gaaattgaag agcaagactg yaaaaggagg ggatgatgga a                    41
<210>88
<211>41
<212>DNA
<213>Homo sapiens
<400>88
catccgtaca cagagagtga scaaaattgg tagcatcatc t                    41
<210>89
<211>41
<212>DNA
<213>Homo sapiens
<400>89
acagtgtagg gacagacaca yctctttccc tgggtgtcct t                    41
<210>90
<211>41
<212>DNA
<213>Homo sapiens
<400>90
cctaatgtta accctccaca ktctggccag tcttgactcc c                    41
<210>91
<211>41
<212>DNA
<213>Homo sapiens
<400>91
taagctgaag tgtcttcggg rgtgttgggg atggtcacca a                    41
<210>92
<211>41
<212>DNA
<213>Homo sapiens
<400>92
ggatggtcac caatggtgtg rtggggacag agccatagtg c                    41
<210>93
<211>41
<212>DNA
<213>Homo sapiens
<400>93
tcagtgtagg ggccaggttg stcctgggcc gaacctgggg a                    41
<210>94
<211>41
<212>DNA
<213>Homo sapiens
<400>94
ttgcaatcca gaatcagcca yaaaatccca tttccttttt t                    41
<210>95
<211>41
<212>DNA
<213>Homo sapiens
<400>95
aaatactcac tattataaat ytgtaaatga acagtctcgt t                    41
<210>96
<211>41
<212>DNA
<213>Homo sapiens
<400>96
gggaggccaa ggcaggagga ycgcttgagg ccaggagtta a                    41
<210>97
<211>41
<212>DNA
<213>Homo sapiens
<400>97
gctgatctct gcgtgatgct waacaaccag tttgactcat t                    41
<210>98
<211>41
<212>DNA
<213>Homo sapiens
<400>98
tggcaagaat ccatctctta ycactatcaa tatgtattga g                    41
<210>99
<211>41
<212>DNA
<213>Homo sapiens
<400>99
agctattagt cgtggtggta ygtgataaaa aactctcctg a                    41
<210>100
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a或缺失
<400>100
gtcccatact gaaaaaaaaa ntcaatttag caaataaata a                    41
<210>101
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表tg或缺失
<400>101
tggctgagga tagggtaggg ngaaactatt gctgatttgt c                    41
<210>102
<211>41
<212>DNA
<213>Homo sapiens
<400>102
actttaggtt tttgctgctg rtaaaagtgc aagcctcagt a                    41
<210>103
<211>41
<212>DNA
<213>Homo sapiens
<400>103
tccctcttct ttgggtagaa rcatccaaca gggcatgata g                    41
<210>104
<211>41
<212>DNA
<213>Homo sapiens
<400>104
tggagaggca ccgagtctca ygatgtgtgg ctggaggttg t                    41
<210>105
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复12-25次
<400>105
aggcactctt tgcagatgaa nggcctcggc ttaaagagga a                    41
<210>106
<211>41
<212>DNA
<213>Homo sapiens
<400>106
tccctggctt gtgccacctc yatcttttcc gtggctaatg t                    41
<210>107
<211>41
<212>DNA
<213>Homo sapiens
<400>107
tactgacttc tgcttccttg ytccctgggt ctacactgtt c                    41
<210>108
<211>41
<212>DNA
<213>Homo sapiens
<400>108
acaaccttgg cagtggcaga ygagagagaa cctcaggact g                    41
<210>109
<211>41
<212>DNA
<213>Homo sapiens
<400>109
caatagagta gggaggttta wcattacagg tttctttcag a                    41
<210>110
<211>41
<212>DNA
<213>Homo sapiens
<400>110
actaccgtgc caccacccac rcaccacacc attgctgcag a                    41
<210>111
<211>41
<212>DNA
<213>Homo sapiens
<400>111
acaaggagcg aagggtccat raagccttca caaagagggg c                    41
<210>112
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复10-12次
<400>112
gtgacaaatt ctccctctcc ncattgcaga agtcacatgc g                    41
<210>113
<211>41
<212>DNA
<213>Homo sapiens
<400>113
aggacagtgc cccataattt yctgctccag atctatgccc t                    41
<210>114
<211>41
<212>DNA
<213>Homo sapiens
<400>114
tctacttaag ttcccagaag rcggctgtga actattttgg t                    41
<210>115
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复12-16次
<400>115
agcattagca atattactac ngaagcagga agactcccaa g                    41
<210>116
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表gag或缺失
<400>116
tttccatagt taatgagaag naagaattta aaacaattaa t                    41
<210>117
<211>41
<212>DNA
<213>Homo sapiens
<400>117
attttcgtcc tcttccactc rgcacaggat taagccttca g                    41
<210>118
<211>41
<212>DNA
<213>Homo sapiens
<400>118
gggggtgatg caacagggag ytccctgaca tacaacaaca t                    41
<210>119
<211>41
<212>DNA
<213>Homo sapiens
<400>119
tgaggagaga ggggcccttg cgcagacttg ccataaaacc g                    41
<210>120
<211>40
<212>DNA
<213>Homo sapiens
<400>120
tgaggagaga ggggcccttg gcagacttgc cataaaaccg                      40
<210>121
<211>41
<212>DNA
<213>Homo sapiens
<400>121
tgtttttagc caccacatgc ycctgagctg acccctcgag c                    41
<210>122
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复9-10次
<400>122
tactgttttc atttttggta nacattttaa tttttttata c                    41
<210>123
<211>41
<212>DNA
<213>Homo sapiens
<400> 123
ggttcaaatc tttgtacagc yagatagcaa tagatataaa t                    41
<210>124
<211>41
<212>DNA
<213>Homo sapiens
<400>124
tacagccaga tagcaataga yataaattga caatggcctc a                    41
<210>125
<211>41
<212>DNA
<213>Homo sapiens
<400>125
ccagtcaaca gggcttccct yaggagatgt tctctaaact g                    41
<210>126
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表″ttggtcccccaaccgcctgtctccccacaccccgcaa″或″aggctgcagtcc″
<400>126
acatgtggtt ctgagactgc ncctgcaggc tggggacact c                    41
<210>127
<211>41
<212>DNA
<213>Homo sapiens
<400>127
cctgctcagt agggggactg magaacacac agaagccatt g                    41
<210>128
<211>41
<212>DNA
<213>Homo sapiens
<400>128
tcaagtcggt agccgacagc rttctgtttt tacgtgacaa a                    41
<210>129
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复9-12次
<400>129
ttgtatttaa attaaaattg nggcctatgt cataccaggg a                    41
<210>130
<211>41
<212>DNA
<213>Homo sapiens
<400>130
aaattgtttt ttttttttgg tcctatgtca taccagggat a                    41
<210>131
<211>40
<212>DNA
<213>Homo sapiens
<400>131
aaattgtttt ttttttttgg cctatgtcat accagggata                      40
<210>132
<211>41
<212>DNA
<213>Homo sapiens
<400>132
ggcattaatt ttttcatttt waaaaaaaac ccagaaatac g                    41
<210>133
<211>41
<212>DNA
<213>Homo sapiens
<400>133
ttttcactct agcagggaaa ygtgtaatca gttgtagaaa c                    41
<210>134
<211>41
<212>DNA
<213>Homo sapiens
<400>134
gggcaggtgg ctcagttgtg ycatcccttc tatttctcct c                    41
<210>135
<211>41
<212>DNA
<213>Homo sapiens
<400>135
attaattgca cagatgttta ytgagtgctt actatgtgcc a                    41
<210>136
<211>41
<212>DNA
<213>Homo sapiens
<400>136
gggagggcag gactccaaaa mggctccgat tccaggcccg c                    41
<210>137
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表ac重复12-13次
<400>137
gccacctttt gagagtgttc ngcatcccta gcctggctgt g                    41
<210>138
<211>41
<212>DNA
<213>Homo sapiens
<400>138
tgaaataggg tcattgcttg scttctcctg ctctccgggt t                    41
<210>139
<211>41
<212>DNA
<213>Homo sapiens
<400>139
caataattca gattctctac ygttagcagt tctaaacccc t                    41
<210>140
<211>41
<212>DNA
<213>Homo sapiens
<400>140
catctctcat cccatacagc yttgactgca ttctcctttc a                    41
<210>141
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复9-10次
<400>141
caaatctatc ctcactatgg ntgtcttccc atgtggatct c                    41
<210>142
<211>41
<212>DNA
<213>Homo sapiens
<400>142
ttcagtcccc cagccacaca aggggtcaga ggtgctgctg a                    41
<210>143
<211>40
<212>DNA
<213>Homo sapiens
<400>143
ttcagtcccc cagccacaca ggggtcagag gtgctgctga                      40
<210>144
<211>41
<212>DNA
<213>Homo sapiens
<400>144
accctatctt ggaagttaag wtttgtggtc actgctacca a                    41
<210>145
<211>41
<212>DNA
<213>Homo sapiens
<400>145
gcccatgccc acagtaaccc ktagggaaac tgacccgctc t                    41
<210>146
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复13-16次
<400>146
ggtttgtttg gtgagctttc naggttgtat tttataactg a                    41
<210>147
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表c或缺失
<400>147
accaagtgga tcaatggtgg ntctggcatt tctataaagg g                    41
<210>148
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复9-10次
<400>148
catgtaacat tgggttttgc ncctcacgta aaatccacat a                    41
<210>149
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复10-12次
<400>149
caagcagtat tccacagatg nttataaaag cgaaaccaaa a                    41
<210>150
<211>41
<212>DNA
<213>Homo sapiens
<400>150
aaatggaaca aaaagtttta kgaaacatgt caccttctat g                    41
<210>151
<211>41
<212>DNA
<213> Homo sapiens
<400>151
tacaaacgag gaaatgtatc rggttcctta agagcctttc c                    41
<210>152
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复8-9次
<400>152
agccgcccac tccgcacaca nctagttgtc ataaacaaat t                    41
<210>153
<211>41
<212>DNA
<213>Homo sapiens
<400>153
tgtccctctg gcttctgcag mttttcctga tgtggcaggg t                    41
<210>154
<211>41
<212>DNA
<213>Homo sapiens
<400>154
tgtccctcta gagggtgaca ygccttgaat ggcagcgaac c                    41
<210>155
<211>41
<212>DNA
<213>Homo sapiens
<400>155
ccccatagtg tgtggaccat ygggggccta gaactgaggt c                    41
<210>156
<211>41
<212>DNA
<213>Homo sapiens
<400>156
ggtttaactg cattttactc kttccagcct gtctggccat t                    41
<210>157
<211>41
<212>DNA
<213>Homo sapiens
<400>157
ttgcagtcca gcccaaagag rcctgtccca gcaggacgcc a                    41
<210>158
<211>41
<212>DNA
<213>Homo sapiens
<400>158
tgccaaactt ttaaactcag kggaattccg caaaaatcta g                    41
<210>159
<211>41
<212>DNA
<213>Homo sapiens
<400>159
gagaggcagg ttcacccagc ygtctgtgcc cgggcagggc a                    41
<210>160
<211>41
<212>DNA
<213>Homo sapiens
<400>160
ttcacccagc tgtctgtgcc ygggcagggc aactcccgaa g                    41
<210>161
<211>41
<212>DNA
<213>Homo sapiens
<400>161
ttggcctggg gacagttttt sagcgactgc tctttgagaa g                    41
<210>162
<211>41
<212>DNA
<213>Homo sapiens
<400>162
cacagagagc gtgcgctcca wtaaaacggc actaaatggc a                    41
<210>163
<211>41
<212>DNA
<213>Homo sapiens
<400>163
ccagggactg tgcatcaccc rtctccaccc caccccagaa c                    41
<210>164
<211>41
<212>DNA
<213>Homo sapiens
<400>164
tggaatggcc tttctctccc mcaacgccca gccaagggag g                    41
<210>165
<211>41
<212>DNA
<213>Homo sapiens
<400>165
tctgagccca gacaatggct yatttatttc agacaatatt c                    41
<210>166
<211>41
<212>DNA
<213>Homo sapiens
<400>166
ggccttatta ataaatccat yggtggtctg ctgaaaatgc t                    41
<210>167
<211>41
<212>DNA
<213>Homo sapiens
<400>167
tcctacagca aatcatcaac ragatgcaca cgaagatgag g                    41
<210>168
<211>41
<212>DNA
<213>Homo sapiens
<400>168
ccttttcaga tgctccataa mctcgtgtga aaagccccgg t                    41
<210>169
<211>41
<212>DNA
<213>Homo sapiens
<400>169
ggatctgtgg ggtgagtgaa yaaaagcatt ttctctgcaa a                    41
<210>170
<211>41
<212>DNA
<213>Homo sapiens
<400>170
gggttctgtc cccttctaaa rcaggtataa atagatgcca t                    41
<210>171
<211>41
<212>DNA
<213>Homo sapiens
<400>171
aggccaaggt caaggggagg sgctgcaggg ggggcttcct c                    41
<210>172
<211>41
<212>DNA
<213>Homo sapiens
<400>172
atcccagtgc gcccacaccc ygctcaagag ctcatgggca c                    41
<210>173
<211>41
<212>DNA
<213>Homo sapiens
<400>173
cccctgagtt ctgcagcctc raggaaggcc tgccctatct g                    41
<210>174
<211>41
<212>DNA
<213>Homo sapiens
<400>174
gctgacacaa cttggactta ytcataaaag aaaatcagaa t                    41
<210>175
<211>41
<212>DNA
<213>Homo sapiens
<400>175
ccacgtgctg cacaagttcc rgttccaagc ctgccctgag a                    41
<210>176
<211>41
<212>DNA
<213>Homo sapiens
<400>176
gaaacggggg tcctcaccca katcctgccc actcccaagc t                    41
<210>177
<211>41
<212>DNA
<213>Homo sapiens
<400>177
actcagctcc agaggaaacc saactcctcg agtaattctt t                    41
<210>178
<211>41
<212>DNA
<213>Homo sapiens
<400>178
tggggaggat cagcagggac rgctggagtc actgaaagat a                    41
<210>179
<211>41
<212>DNA
<213>Homo sapiens
<400>179
tcctgtggcc ctccccacac ycttgttgcc accacctgcc c                    41
<210>180
<211>41
<212>DNA
<213>Homo sapiens
<400>180
gaaacatgaa gcagcagaaa ygtttttccc agttctcttt c                    41
<210>181
<211>41
<212>DNA
<213>Homo sapiens
<400>181
gtcaacatat atttgagaga mcttcaactt atcaagtatt g                    41
<210>182
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复9-10次
<400>182
tcaaggccag ttactaccac nctaatagaa tgaacaaatg g                    41
<210>183
<211>41
<212>DNA
<213>Homo sapiens
<400>183
ttctattact gtttttaaat maatgttaat caactgtggt g                    41
<210>184
<211>41
<212>DNA
<213>Homo sapiens
<400>184
gttcaagaat gcaagaaaaa yaaatacagt cagatccaga a                    41
<210>185
<211>41
<212>DNA
<213>Homo sapiens
<400>185
aagaatgcaa gaaaaacaaa yacagtcaga tccagaacca t                    41
<210>186
<211>41
<212>DNA
<213>Homo sapiens
<400>186
gaaaaatgat gcttagcaaa rtgataaaca ctagaatgta g                    41
<210>187
<211>41
<212>DNA
<213>Homo sapiens
<400>187
aaaacattat caattagttt rtgtgcaata gctgtaaata a                    41
<210>188
<211>41
<212>DNA
<213>Homo sapiens
<400>188
attagtttat gtgcaatagc ygtaaataag tgcagtagca t                    41
<210>189
<211>41
<212>DNA
<213>Homo sapiens
<400>189
catgttcagg actgcgcaca rtgcccggga gaaactggca g                    41
<210>190
<211>41
<212>DNA
<213>Homo sapiens
<400>190
tgaatgacct gccagtatta rgtgggtata cttgttatgt t                    41
<210>191
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复8-9次
<400>191
catgataata aacctgccac ncttaaaaag cacctcctcc c                    41
<210>192
<211>41
<212>DNA
<213>Homo sapiens
<400>192
agtatttgct aaatcactaa yggggtagaa ttaaaaagaa a                    41
<210>193
<211>41
<212>DNA
<213>Homo sapiens
<400>193
ttaaaggcgg ttttctttgt rtttttattg cagactttta a                    41
<210>194
<211>41
<212>DNA
<213>Homo sapiens
<400>194
cttagtgaga tcccgtctcc raagaaaaga tatgtattct a                    41
<210>195
<211>41
<212>DNA
<213>Homo sapiens
<400>195
ccttattctt tctgagtaca rcctgtagta cttgaaccac t                    41
<210>196
<211>41
<212>DNA
<213>Homo sapiens
<400>196
aggtaagcgc ctcggccgcc wcgacgcatg cgccctgggc c                    41
<210>197
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复9-12次
<400>197
ttttcttttg ttcttttatc nccttgtagg agacccggtg a                    41
<210>198
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复10-11次
<400>198
gaactcatat tttctctctc nctaggaaag tacataacat t                    41
<210>199
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表t重复12-14次
<400>199
ataaccctct ataattgata ngctgaggtg gtaaaacaag a                    41
<210>200
<211>41
<212>DNA
<213>Homo sapiens
<400>200
gcatgaagta tatgtacaaa rgcaagactt acacagttaa a                    41
<210>201
<211>41
<212>DNA
<213>Homo sapiens
<400>201
aaaaagttta aacttttatc mttataagag gaaaaaagat t                    41
<210>202
<211>41
<212>DNA
<213>Homo sapiens
<400>202
tcttgttaag attctgctta ygacctcagt aaaacatttt a                    41
<210>203
<211>41
<212>DNA
<213>Homo sapiens
<400>203
tcagaaaaaa atctggggtg kaggtaggat ttagaactgc g                    41
<210>204
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复16-19次
<400>204
atttataagt atatggaaag naattctaga acgaattgag a                    41
<210>205
<211>41
<212>DNA
<213>Homo sapiens
<220>
<221>变异
<222>21
<223>n代表a重复6-7次
<400>205
cctcatgtgt gagaaggggg ntgagggtct tgttcatttg t                    41
<210>206
<211>41
<212>DNA
<213>Homo sapiens
<400>206
ggaagtcctc ccagggccca kctggtctgt cagtggcact g                    41
<210>207
<211>41
<212>DNA
<213>Homo sapiens
<400>207
ccattgttga taataacgca rctcattact tttgtcgtct a                    41
<210>208
<211>41
<212>DNA
<213>Homo sapiens
<400>208
ggcatgatgg ctcagaacga sagccaacct catctcgcac a                    41
<210>209
<211>41
<212>DNA
<213>Homo sapiens
<400>209
aattgtcatt tgtgatactg yggtgggcgc aagctgccat g                    41
<210>210
<211>41
<212>DNA
<213>Homo sapiens
<400>210
ccatttgtta tcatgtgaag sgggagaaaa ctccatttgg g                    41
<210>211
<211>41
<212>DNA
<213>Homo sapiens
<400>211
aagctcactt agactgattt kggttaggta gatagaggac c                    41
<210>212
<211>41
<212>DNA
<213>Homo sapiens
<400>212
gactgatttg ggttaggtag rtagaggacc agtctcctca g                    41
<210>213
<211>41
<212>DNA
<213>Homo sapiens
<400>213
aaatgaggac aaacctaata sttttaaagg aaatggttca c                    41
<210>214
<211>41
<212>DNA
<213>Homo sapiens
<400>214
aagtcataca gcttttcaga yttcactttg atatgggaga a                    41
<210>215
<211>41
<212>DNA
<213>Homo sapiens
<400>215
atcaaaatta ccctaaacat yctaagctca tctatttctt t                    41

Claims (14)

1.一种用于检测编码细胞色素P450的基因内的遗传多态性的方法,其中使用选自下列一组中的至少一种序列作为寡核苷酸探针和/或寡核苷酸引物:SEQ ID NOS:1-215所示的任意核苷酸序列内的至少13个核苷酸的序列,或与所述至少13个核苷酸的序列互补的序列,所述至少13个核苷酸的序列包括第21位核苷酸。
2.如权利要求1的方法,其中,所述多态性包括单核苷酸多态性,由多个核苷酸的缺失、取代或插入所导致的多态性,或VNTR或微卫星型多态性。
3.一种评估药物的方法,包括根据通过权利要求1或2的方法获得的检测结果评估由细胞色素P450代谢的药物的效力和安全性。
4.一种筛选药物的方法,包括根据通过如权利要求3的方法获得的评估结果选择要使用的药物。
5.一种筛选药物的方法,包括将有关编码细胞色素P450的基因和/或其互补序列内的多态性的信息与从受试者获得的有关编码细胞色素P450的基因和/或其互补序列内的多态性的信息进行比较;分析由细胞色素P450代谢的药物的效力和/或安全性;和从所获得的分析结果选择要使用的药物。
6.如权利要求1-5中任意一项的方法,其中,所述细胞色素P450是选自下列一组中的至少一种:2A6,2A13,2B6,2E,2S1,5A1,7A1和7B1。
7.选自下列一组的寡核苷酸:SEQ ID NOS:1-215所示的核苷酸序列,以及与它们互补的序列。
8.根据有关编码细胞色素P450的基因和/或其互补序列内的多态性的信息制备的寡核苷酸,使之包括存在于所述基因和/或其互补序列内的基因多态性位点。
9.如权利要求8的寡核苷酸,其中,对所述寡核苷酸进行设计,使位于所述寡核苷酸的5′-末端、3′-末端或中央的核苷酸对应于所述基因多态性位点。
10.如权利要求9的寡核苷酸,其中,所述包括基因多态性位点的寡核苷酸由彼此连接在一起的两个片段组成,一个片段能够与编码细胞色素P450的基因或其互补序列杂交,而另一个片段不能够与它杂交,并且,所述多态性位点位于所述可杂交片段的5′-末端或3′-末端。
11.如权利要求8或9的寡核苷酸,其中,所述寡核苷酸包括SEQID NOS:1-215所示的任意核苷酸序列内的至少13个核苷酸的序列或与所述至少13个核苷酸的序列互补的序列,所述至少13个核苷酸的序列包括第21位核苷酸。
12.一种寡核苷酸,它是在包括SEQ ID NOS:1-215所示的任意核苷酸序列内的基因多态性位点的基因组DNA区基础上设计的,使得它位于该多态性位点朝向所述基因组DNA区的5′-末端和/或3′-末端的1000bp内,并且其长度为13-60个核苷酸。
13.一种微阵列,其中,将权利要求7-12中任意一项的寡核苷酸序列固定在支持物上。
14.遗传多态性检测试剂盒,其中包括如权利要求7-12中任意一项的寡核苷酸和/或如权利要求13的微阵列。
CN03817304.2A 2002-05-30 2003-05-29 用于检测基因多态性的方法 Pending CN1678741A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP158237/2002 2002-05-30
JP2002158237A JP2004000039A (ja) 2002-05-30 2002-05-30 遺伝子多型の検出方法

Publications (1)

Publication Number Publication Date
CN1678741A true CN1678741A (zh) 2005-10-05

Family

ID=29706482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN03817304.2A Pending CN1678741A (zh) 2002-05-30 2003-05-29 用于检测基因多态性的方法

Country Status (7)

Country Link
US (1) US20060234230A1 (zh)
EP (1) EP1536003A4 (zh)
JP (1) JP2004000039A (zh)
CN (1) CN1678741A (zh)
AU (1) AU2003241899A1 (zh)
CA (1) CA2510406A1 (zh)
WO (1) WO2003102181A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109903816A (zh) * 2019-01-29 2019-06-18 郑州金域临床检验中心有限公司 一种药物基因组学分析系统
CN110691868A (zh) * 2017-05-22 2020-01-14 Gen9股份有限公司 用于核酸操纵的装置和方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI20040723A0 (fi) * 2004-05-26 2004-05-26 Orpana Aarne Menetelmä mRNA:n ilmentymistasojen kvantitatiiviseksi ja/tai suhteelliseksi mittaamiseksi pienissä biologisissa näytteissä
JP5067830B2 (ja) * 2006-06-06 2012-11-07 株式会社島津製作所 多型アレル判定プログラム、多型アレル判定プログラムを記録したコンピュータ読み取り可能な記録媒体、及び多型アレル判定方法
JP5017947B2 (ja) * 2006-07-12 2012-09-05 東洋紡績株式会社 複数の塩基多型の同定方法
US20090298839A1 (en) * 2008-05-29 2009-12-03 Mccarty Catherine Anne Adrb2 gene polymorphism associated with intraocular pressure response to topical beta-blockers
CN113249796A (zh) * 2018-06-20 2021-08-13 深圳海普洛斯医学检验实验室 对dna片段进行标记的单分子标签
JPWO2020145351A1 (ja) * 2019-01-09 2021-11-25 国立研究開発法人理化学研究所 薬物動態関連遺伝子の網羅的配列解析法とそれに使用されるプライマーセット

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5891633A (en) * 1994-06-16 1999-04-06 The United States Of America As Represented By The Department Of Health And Human Services Defects in drug metabolism
US5834293A (en) * 1994-09-28 1998-11-10 Vanderbilt University Cytochrome P450 arachidonic acid epoxygenase genetic mutation associated with hypertension
GB9828619D0 (en) * 1998-12-23 1999-02-17 Janssen Pharmaceutica Nv An assay for genotyping cytochrome expression
DE60125171T2 (de) * 2000-06-01 2007-09-20 Otsuka Pharmaceutical Factory, Inc., Naruto Verfahren zur detektion und quantifizierung von menschlichen p450-molekülen und sonde und kit für dieses verfahren

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110691868A (zh) * 2017-05-22 2020-01-14 Gen9股份有限公司 用于核酸操纵的装置和方法
CN109903816A (zh) * 2019-01-29 2019-06-18 郑州金域临床检验中心有限公司 一种药物基因组学分析系统

Also Published As

Publication number Publication date
WO2003102181A1 (en) 2003-12-11
AU2003241899A1 (en) 2003-12-19
US20060234230A1 (en) 2006-10-19
CA2510406A1 (en) 2003-12-11
EP1536003A1 (en) 2005-06-01
JP2004000039A (ja) 2004-01-08
EP1536003A4 (en) 2007-01-17

Similar Documents

Publication Publication Date Title
CN1034673C (zh) 检测核苷酸顺序的方法
CN1219972A (zh) 短串联重复基因座的多重扩增
CN1806051A (zh) 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞
CN100351393C (zh) 核苷酸多态性的检测方法
CN1578841A (zh) 退火控制引物及该退火控制引物的使用
CN1898395A (zh) 基于引物的核酸的多重扩增的方法和试剂盒
CN1977050A (zh) 丙型肝炎病毒基因型的确定
CN1930306A (zh) 发展用于血栓形成倾向识别的方法(mert)
CN1497049A (zh) 雄激素受体复合物-相关蛋白
CN1723217A (zh) 使用单核苷酸多态性组分析受损样品的方法和组合物
CN1500144A (zh) 扩增的核酸及其固定化制品
CN1085957A (zh) 由sod族衍生的寡核苷酸类
CN101056990A (zh) 表皮生长因子受体基因启动子的多态性
CN1675373A (zh) 用于鉴别水稻品种的方法
CN1918305A (zh) 核酸检测方法及其应用
CN1678741A (zh) 用于检测基因多态性的方法
CN101067149A (zh) Cyp3a检测芯片及其应用
CN101045944A (zh) 检测六种腹泻致病菌的基因芯片、制备方法及试剂盒
CN1912139A (zh) 细胞色素p450基因遗传变异的检测芯片及其应用
CN1616676A (zh) 稳定的杂交体
CN1671841A (zh) 基因多态性分型方法
CN1503847A (zh) 用于鉴定牛脊椎畸形综合征携带者的遗传试验
CN1635142A (zh) 用于预测偏执型精神分裂症易感性的试剂盒及所用引物
CN1531593A (zh) 核酸探针固定化基体和用其检测标记的核酸存在的方法
CN1961074A (zh) 包含与ⅱ型糖尿病有关的单核苷酸多态性的多核苷酸、包含该多核苷酸的微阵列和诊断试剂盒以及使用它们分析多核苷酸的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication