CN110066771B - 一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用 - Google Patents

一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用 Download PDF

Info

Publication number
CN110066771B
CN110066771B CN201910395464.XA CN201910395464A CN110066771B CN 110066771 B CN110066771 B CN 110066771B CN 201910395464 A CN201910395464 A CN 201910395464A CN 110066771 B CN110066771 B CN 110066771B
Authority
CN
China
Prior art keywords
hiv
pcr
primer
drug
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910395464.XA
Other languages
English (en)
Other versions
CN110066771A (zh
Inventor
冯悦
王�琦
夏雪山
张春月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Kecan Biotechnology Co ltd
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910395464.XA priority Critical patent/CN110066771B/zh
Publication of CN110066771A publication Critical patent/CN110066771A/zh
Application granted granted Critical
Publication of CN110066771B publication Critical patent/CN110066771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/702Specific hybridization probes for retroviruses
    • C12Q1/703Viruses associated with AIDS
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • AIDS & HIV (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种HIV‑1重组型、检测整合酶区耐药突变的引物组、方法及其应用,基于新发现的重组型CRF103_BC同时兼容HIV‑1的B亚型、C亚型、BC重组亚型或CRF01_AE亚型提供一种筛查整合酶基因耐药突变的引物组,并构建用于检测整合酶基因耐药突变的下一代半导体测序技术,对流行病研究或临床用药等具有重要意义。

Description

一种HIV-1重组型、检测整合酶区耐药突变的引物组、方法及 其应用
技术领域
本发明属于生物技术领域,涉及一种HIV-1重组型、检测整合酶区耐药突变的引物组、方法及其应用, 尤其涉及一种HIV-1重组型CRF103_BC、检测整合酶区耐药突变的引物组、利用下一代半导体测序技术 检测整合酶区耐药突变的方法及其应用。
背景技术
人类免疫缺陷病毒(Human immunodeficiency virus,HIV)即引起艾滋病的病毒,艾滋病的专业名称 叫做获得性免疫缺陷综合征(Acquired immunodeficiency syndrome,AIDS)。感染此HIV毒株,会使人体 的免疫系统遭到侵犯,导致人体的细胞免疫和体液免疫受到破坏,使人体成为许多伺机性疾病的攻击目标, 促成患者的多种临床症状。1981年,HIV在美国被首次发现,其属于逆转录病毒科慢病毒属。
HIV/AIDS在全球均有流行。根据世卫组织报道,截至2016年,全球已经发现大约3670万人感染了 艾滋病毒,同年,约有180万人接触并感染了艾滋病毒,约100万人死于艾滋病,其中在感染人群中男女 比例大约各占50%。2016年艾滋病死亡人数约100万左右,相比于2005年的190万个死亡病例已有减少。 1997年全球艾滋病毒感染率每年330万左右,不过,在1997年到2005年全球发病率迅速下降至每年约 260万左右,2005年至2015年之间就开始一直保持稳定。但是,在2016年新增感染人数就高达1800万 人左右,其中还包括儿童16万人左右,每天大约有5000人感染艾滋病毒,其中小于15周岁的儿童约400 人。文化和卫生环境的落后以及不安全的输血都是促成艾滋病快速传播的原因,在南非,HIV感染者与艾滋病患者高达约560万人,同时南非也是世界上HIV感染者与艾滋病患者最高的国家。
目前治疗艾滋病的相对有效的治疗方法为HAART疗法即高效抗逆转录病毒治疗(highly active antiretro-viral therapy),又称“鸡尾酒疗法”。HAART疗法是指通过三种或三种以上的抗HIV病毒药物联合 使用以达到治疗艾滋病的目的,优点是可以尽量减少由单一用药而产生的抗药性,以及最大限度地来抑制 HIV病毒的复制,使被破坏的机体免疫功能部分甚至全部恢复,从而延缓疾病进程,延长患者寿命,减轻 疾病负担。科学家们提出,艾滋病的混合用药治疗是对抗其最有效的治疗方法,不仅可以阻止艾滋病的病 毒繁殖,还可以最大限度地防止体内产生抗药性的病毒毒株。HAART疗法把蛋白酶抑制剂与多种抗逆转 录病毒的药物混合使用,包括逆转录酶抑制剂与整合酶抑制剂,从而有效的控制艾滋病。
随着HAART的广泛应用,HIV基因耐药突变情况也随之增加。HIV耐药突变的产生主要是由于病毒 复制过程中的高频突变和抗病毒药物产生的选择压力造成的。HIV-1是一种变异性很高的病毒,不规范的 抗病毒治疗也会导致病毒耐药的产生。HIV属于逆转录病毒,逆转录病毒是通过DNA中间体复制的RNA 病毒。通过逆转录将病毒RNA逆转录到DNA中,该过程由病毒编码的逆转录酶(Reverse transcriptase,RT) 进行催化,逆转录过程容易出错,导致HIV病毒的高遗传变异性。一个显著的HIV-1基因突变源自HIV-1 RT区的高出错率、高病毒复制率和同源重组相关的突变。HIV-1的多样性是一个重要的临床挑战,因为它 使病毒适应并逃避免疫反应和抗逆转录病毒治疗,因此影响诊断和治疗。与抗病毒治疗压力相关的HIV进 化允许出现耐药突变。抗逆转录病毒耐药性是一个重要的公共卫生问题,因为它限制了治疗方案,导致治 疗失败并快速传播,影响了未治疗个体未来的治疗方案。据报道,在世界不同地区,4%至14%的新诊断 患者感染了至少有一种传播耐药突变的菌株。
HIV整合酶抑制剂(Integrase Inhibitors,INI)是指抑制整合酶的药物,即抑制逆转录病毒复制过程,阻 断催化病毒DNA与宿主染色体DNA的整合。研究发现一大批HIV-1整合酶抑制剂被鉴定出来,其中一些 化合物显示选择性的抑制HIV-1整合酶和阻断病毒复制的活性,而最有影响的两类抑制剂是含邻苯二酚的 多羟基芳环化合物和最近报道的芳基β-二酮酸类化合物。INI是一种全新作用机制的抗HIV/AIDS药物, 可与其他抗逆转录病毒药物联合用药,能有效治疗HIV感染。HIV整合酶抑制剂与已上市的逆转录酶抑 制剂、蛋白酶抑制剂、融合抑制剂组成的鸡尾酒疗法,可能解决单一用药的耐药性及易产生的交叉耐药问 题,将显著改善现有HIV药物的治疗效果,并成为新的治疗途径和选择。目前已批准上市并进入临床应用 的HIV整合酶抑制剂药物有:拉替拉韦(raltegravir)、埃替拉韦(elvitegravir)、dolutegravir以及固定剂量复 方制剂Stribild。斯坦福大学HIV耐药数据库中已经报道的整合酶区主要突变位点如下:T66A/I/K、E92Q、 G118R、E138K/A/T、G140S/A/C、Y143C/R/H、S147G、Q148H/K/R、N155H、R263K。
目前HIV耐药性的检测方法可分为表型分析法和基因型分析法。
表型分析法是从患者体内直接分离病毒以制得高滴度的毒株,在含有药物的培养液中传代培养,然后 直接测定HIV-1在不同浓度抗病毒药物存在时外周血单个核细胞(PBMC)所产生的p24抗原量。根据其 剂量-反应曲线得到50%抑制浓度(50%inhibitoryconcentration,IC50),与标准参比毒株的IC50相比以确 定对药物的敏感性,通过其倍数改变评价耐药程度;还有用改造的细胞进行表型耐药检测,比如早期构建 的HeLa/CD4+细胞等。此方法能够比较直观地反映病毒株对药物的敏感情况。但耗时长,操作复杂、费用 昂贵。而且在培养过程中还可能诱导出新的突变。
基因型分析法是检测病人体内的病毒基因组是否存在与耐药相关的突变位点,基因型分析法首先通过 RT-PCR扩增HIV-1毒株的PR基因区全长和RT基因区20~230氨基酸位点,分析与逆转录酶抑制剂和蛋 白类抑制剂相关的突变情况;扩增HIV-1毒株的整合酶基因区全长,分析与整合酶抑制剂相关的突变情况。 PCR扩增后以核酸测序为基础,可获得较多的突变信息,但需要较多的扩增产物,若患者血浆病毒滴度过 低,常出现扩增失败。目前HIV基因序列的测定主要还是使用Sanger技术。Sanger测序技术以其操作简 单、测序片段长等优点被广泛应用。但同时,Sanger法作为一代测序技术,其通量低,价格高,效率低, 依赖于电泳分离技术,且只能检测20%~30%以上的准种,满足不了日益增长的数据要求。
CN102227507A公开了一种用于检测与整合酶相关的一种或多种HIV序列变体的低频率出现的方法的 一个实施方案,其包括下述步骤:(a)从HIV样品群体中的多个RNA分子制备cDNA物质;(b)从所述cDNA 物质扩增多个第一扩增子,其中每个第一扩增子用一对核酸引物进行扩增,所述核酸引物能够从进化枝A、 B、C、D、AE和G亚型扩增产物;(c)克隆扩增所述第一扩增子的扩增拷贝,以产生多个第二扩增子;(d) 测定所述第二扩增子的核酸序列组成;(e)检测在所述第二扩增子的核酸序列组成中以5%或更低的频率出现 的一种或多种序列变体;和(f)将检测出的序列变体与HIV整合酶有关变异相关联。
现有技术中对整合酶基因的耐药突变研究尚不完善,且随着时间的推移,HIV-1的耐药突变呈增加趋 势,因此,提供一种涵盖范围广、兼容多种针对中国流行毒株的整合酶区基因耐药突变的引物组、筛查方 法及其应用具有重要意义。
发明内容
针对现有技术的不足及实际的需求,本发明提供一种HIV-1重组型、检测整合酶区耐药突变的引物组、 方法及其应用,基于新发现的重组型CRF103_BC同时兼容HIV-1的B亚型、C亚型、BC重组亚型或 CRF01_AE亚型提供一种筛查整合酶基因耐药突变的引物组,并构建用于检测整合酶基因耐药突变的下一 代半导体测序技术,对流行病研究或临床用药等具有重要意义。
为达此目的,本发明采用以下技术方案:
第一方面,本发明提供一种HIV-1重组型CRF103_BC,所述CRF103_BC包括四个独特重组型,分别 为287_78、287_65、23_II和287_168,所述287_78的基因组序列如SEQ IDNO.1所示,所述287_65的 基因组序列如SEQ ID NO.2所示,所述23_II的基因组序列如SEQID NO.3所示,所述287_168的基因组 序列如SEQ ID NO.4所示。
本发明中,发明人通过长期实践筛查得到多条HIV-1全长序列,其中新发现的287_78、287_65、23_II、 287_168四个全长单独形成一簇,不同于其他的流行重组型(CRF),其NJ进化树如图1所示。所述四个 独特重组型毒株具有相同的基因结构,因此将其命名为新的B/C重组型,即CRF103_BC,以287_65为例, 将全长序列经jpHMM分析其基因结构如图2,其余3个样本的基因结构相同。图2中,B区即为目标检 测区域-整合酶区基因,且该区域为B/C重组。
第二方面,本发明提供一种用于检测HIV-1整合酶区基因的基因型或耐药突变的引物组,所述引物组 包括如SEQ ID NO.5-36所示的核苷酸序列。
优选地,所述基因型包括HIV-1的B亚型、C亚型、B/C重组亚型或CRF01_AE亚型中的任意一种或 至少两种的重组亚型。
优选地,所述B/C重组亚型包括CRF07_BC、CRF08_BC、CRF31_BC、CRF57_BC、CRF60_BC、 CRF60_BC、CRF61_BC、CRF62_BC、CRF64_BC、CRF85_BC、CRF86_BC、CRF88_BC或CRF103_BC中的任意一种或至少两种的组合。
现有技术中鲜有HIV-1整合酶区基因耐药突变的相关研究,且尚无关于针对中国流行株的报道,本发 明中,发明人通过比对B亚型、C亚型、所有BC重组亚型和CRF01_AE亚型的基因序列,设计得到一组 引物组,用于多重PCR扩增靶基因,进而构建下一代半导体测序体系,实现高通量,高灵敏度,高特异性 地对整合酶区基因耐药性突变的筛查,检测范围覆盖B亚型、C亚型、所有BC重组亚型、CRF01_AE亚 型以及其中任意两种或以上的亚型重组得到的新的独特重组型,其中涵盖本发明新发现的重组型 CRF103_BC,其覆盖范围更广,兼容性更佳,有利于流行病研究或临床辅助诊断等。发明人通过大量序列 比对以及实践,得到的引物兼并了CRF01_AE/B/C三种基因型的随机重组型,对中国范围内相对流行的 HIV-1有较好的特异性与灵敏度。
优选地,所述耐药突变的位点包括T66A/I/K、E92Q、G118R、E138K/A/T、G140S/A/C、Y143C/R/H、 S147G、Q148H/K/R、N155H或R263K中的任意一种或至少两种的组合。
第三方面,本发明提供一种如第二方面所述的引物组用于检测HIV-1整合酶区基因耐药突变,或制备 检测HIV-1整合酶区基因耐药突变的试剂或试剂盒中的应用。
第四方面,本发明提供一种检测HIV-1整合酶区基因耐药突变的试剂盒,包括如第二方面所述的引物 组。
优选地,所述试剂盒还包括HIV-1整合酶区基因的RT-PCR引物和多重PCR扩增预混液。
本发明中,所述多重PCR扩增预混液是进行多重PCR反应体系中除了引物和模板以外所有组分之和, 提供反应必须的dNTP、缓冲液和酶等,在某一具体实施例中采用的多重PCR扩增预混液为北京艾德莱生 物科技有限公司291732AX,但并不局限于此,凡是满足多重PCR反应要求的预混液Mix都可以兼容本发 明的筛查方法。
优选地,所述试剂盒还包括阳性质控、阴性质控和ddH2O。
本发明中,阳性质控为HIV-1RNA阳性样本,包含HIV-1整合酶(INT)区全部耐药突变位点,所述 阴性质控为HIV-1RNA阴性样本,即未发生突变的HIV-1基因。
优选地,所述RT-PCR引物的核苷酸序列如SEQ ID NO.37-38所示。
本发明的RT-PCR引物具有较高的特异性,能特异性扩增HIV而不与其他干扰基因组发生交叉,同时 兼容多种HIV-1的亚型,扩大筛查范围,为后续测序提供良好的模板。
第五方面,本发明提供一种如第四方面所述的试剂盒用于制备检测待测HIV-1基因组的基因型或耐药 突变位点的产品,或鉴定HIV-1的耐药性中的应用。
第六方面,本发明提供一种HIV-1整合酶区基因的基因型或耐药突变的筛查方法,所述方法使用如第 二方面所述的引物组通过下一代半导体测序技术进行筛查,包括如下步骤:
(1)样品RNA提取;
(2)以步骤(1)所得RNA为模板,逆转录PCR扩增cDNA;
(3)采用多重PCR方法扩增靶基因;
(4)靶基因文库构建;
(5)对步骤(4)所得文库进行下一代半导体测序,筛选对整合酶抑制产生耐药的突变位点。
对于HIV耐药检测,我国主要应用的是in-house检测方法,但是这种方法检测不到占HIV-1准种20% 以下的劣势突变。所以,急需开发一种新方法以高效、快速、准确地检测HIV-1基因耐药突变以及劣势突 变。随着科学技术的发展,也为了建立更有效的HAART方案,基因型分析检测耐药相关突变已广泛应用 于临床环境。最近,下一代测序技术的使用极大地促进了这一实践,它以一种经济高效且高度敏感的方式 提供了大量数据。值得注意的是,下一代测序技术可以检测由Sanger测序无法检测到的HIV低频率突变, 其在病毒群体中的检测限为10-25%。最近使用下一代测序技术进行HIV-1测序的研究能够在病毒群体中 检测频率低于1%的低频率突变,从而研究这些低频率突变对治疗效果的影响。此外,通过下一代测序技 术进行HIV-1测序有助于分析病毒的遗传多样性、进化和流行过程。通过下一代半导体测序技术,在检测 未治疗患者、已治疗的患者以及抗病毒治疗失败或成功的患者体内的劣势耐药方面均有应用,充分证明其 在检测耐药劣势突变的优势,为预测患者体内病毒的耐药进化情况和观察耐药性的产生以及发展情况提供 依据,也对抗病毒治疗后患者的药物治疗方案选择具有参考价值。由此,我们建立了基于下一代测序技术 对HIV-1耐药突变基因的测序方法和体系。
优选地,步骤(5)所述半导体测序采用314半导体芯片进行测序。
本发明中,利用多重PCR对靶基因进行扩增后,在下一代半导体测序平台的基础上,采用314半导体 芯片对靶基因进行大规模的测序,利用Life Technologies公司不同通量的芯片,一次可检测最多96个样本 的16个靶基因,大大降低了每个样品的检测成本,具有通量高、成本低、灵敏性好、准确性高等特点。 314芯片是一种DNA芯片,Ion PGMTMSystem测序平台是依据芯片进行数据的读取,本发明某一实施例中 具体应用的为赛默飞公司的芯片,全称“Ion 314chip”,其读取的数据量大小适中,约100M,满足实验的 情况下价格低廉,但需要说明的是,根据芯片读取数据量的不同,本领域技术人员可以自行选择其他芯片进行实验,例如316芯片、318芯片等。
优选地,步骤(2)所述逆转录PCR的引物的核苷酸序列如SEQ ID NO.37-38所示。
优选地,步骤(3)所述多重PCR的反应体系包括5×多重PCR Mix、如第二方面所述的引物组和模板cDNA。
本发明通过设计多重PCR引物,构建得到的文库,再通过下一代半导体测序技术,实现对HIV-1整 合酶区基因耐药突变的筛查,检测的突变位点全面,灵敏度高,不仅兼容现有技术中的B亚型、C亚型、 所有BC重组亚型、CRF01_AE以及所述亚型间的进一步重组亚型,还能检测出新发现的CRF103_BC,覆 盖的范围更广,对于流行病研究或辅助临床诊断、用药指导等具有重要意义。
本发明中所述5×多重PCR Mix包含多重PCR反应所必须的酶、缓冲液、dNTP等原料,典型非限定 地可以是北京艾德莱生物科技有限公司生产的291732AX。
优选地,所述引物组的终浓度为5-20μM,优选为10μM。
优选地,所述模板cDNA的终浓度为100-1000ng/μL,例如可以是100ng/μL、150ng/μL、200ng/μL、 250ng/μL、300ng/μL、350ng/μL、400ng/μL、450ng/μL、500ng/μL、550ng/μL、600ng/μL、650ng/μL、700ng/μL、 750ng/μL、800ng/μL、850ng/μL、900ng/μL、950ng/μL或1000ng/μL。。
优选地,所述多重PCR的反应条件为:
(1’)94-97℃预变性5分钟;
(2’)94℃变性30秒,50-55℃退火25-30秒,72℃延伸35-40秒,共35-40个循环;
(3’)72℃延伸5分钟。
优选地,所述方法具体包括如下步骤:
(1)样品RNA提取;
(2)以步骤(1)所得RNA为模板,逆转录PCR扩增cDNA:
A)混合反应体系:2×1Step Buffer,PrimeScript 1Step Enzyme Mix,RNaseFree dH2O,RT-PCR引物 和RNA模板;
B)逆转录PCR的反应条件为:(a)50℃逆转录25-30分钟;(b)94℃预变性5分钟;(c)94℃变性 25-30秒,50-55℃退火25-30秒,72℃延伸1.5-3分钟,共35-40个循环;(d)72℃延伸3-6分钟;
(3)采用多重PCR方法扩增靶基因:
A’)多重PCR的反应体系为:5×多重PCR Mix,第二方面所述的引物组,ddH2O和模板cDNA;
B’)多重PCR的反应条件为:(a’)94-97℃预变性5分钟;(b’)94℃变性30秒,50-55℃退火25-30 秒,72℃延伸35-40秒,共35-40个循环;(c’)72℃延伸5分钟;
C’)对每个样品进行柱纯化,去除反应液和杂质,得到180~380bp的多条DNA,再将此DNA溶液经 磁珠纯化后进行定量检测,并将每个样品统一到相同浓度进行下一步操作;
(4)靶基因文库构建:
A”)将相同浓度的每个样品进行DNA的末端修复,补为平末端;
B”)每个样品加上特异性的barcode序列标签接头和通用的测序接头;
C”)将加了接头的DNA片段应用通用引物进行8-10个循环的PCR扩增反应;
(5)对步骤(4)所得文库纯化定量后,进行下一代半导体测序,以HIV-1参考株HXB2的3952-5266bp 的碱基序列为参考序列,筛选对整合酶抑制产生耐药的突变位点。
本发明某一实施例中选择的下一代测序平台为Ion Torrent测序平台,相比于其他下一代测序方法,此 方法较简单快捷,灵敏度高,通量高,结果准确可靠且不需要光学系统。而且模板的DNA片段化是选择 的多重PCR方法,相比于超声机械片段化和酶切两种方法,此方法得到的片段大小根据引物设计决定,大 小可控,可符合测序需要的100~400bp大小的片段,所以此方法得到的片段化DNA更有利于进行下一代 测序与结果的分析。
作为本发明的最优方案,筛查HIV-1整合酶区基因的基因型或耐药突变的方法包括以下步骤:
(1)样品RNA提取;
(2)以步骤(1)所得RNA为模板,逆转录PCR扩增cDNA:
A)逆转录PCR的反应体系为:2×1Step Buffer 6μL,PrimeScript 1Step EnzymeMix 0.5μL,RNase Free dH2O 1μL,10μM的上下游引物各1μL,RNA模板2μL,共11.5μL体系;
B)逆转录PCR的反应条件为:(a)50℃逆转录30分钟;(b)94℃预变性5分钟;(c)94℃变性30 秒,50℃退火30秒,72℃延伸2分钟,共40个循环;(d)72℃延伸5分钟;
(3)采用多重PCR方法扩增靶基因:
A’)多重PCR的反应体系为:5×多重PCR Mix 4μL,10μM的上下游引物的预混液4μL,ddH2O 10μL, 模板cDNA 2μL,共20μL体系;
B’)多重PCR的反应条件为:(a’)94℃预变性5分钟;(b’)94℃变性30秒,50℃退火30秒,72℃ 延伸40秒,共40个循环;(c’)72℃延伸5分钟;
C’)对每个样品进行柱纯化,去除反应液和杂质,得到180~380bp的多条DNA,再将此DNA溶液经 磁珠纯化后进行定量检测,并将每个样品统一到相同浓度进行下一步操作;
(4)靶基因文库构建:
A”)将相同浓度的每个样品进行DNA的末端修复,补为平末端;
B”)每个样品加上特异性的barcode序列标签接头和通用的测序接头;
C”)将加了接头的DNA片段应用通用引物进行8个循环的PCR扩增反应;
(5)对步骤(4)所得文库纯化定量后,进行下一代半导体测序,以HIV-1参考株HXB2的3952-5266bp 的碱基序列为参考序列,筛选对整合酶抑制产生耐药的突变位点。
第七方面,本发明提供一种如第六方面所述的筛查方法筛选得到的突变基因。
第八方面,本发明提供一种包括第七方面所述突变基因的核酸片段。
与现有技术相比,本发明具有如下有益效果:
(1)本发明提供一种HIV-1的B/C重组型CRF103_BC,并提供该重组型的四个独特重组型,为流行 病研究或耐药突变筛查提供依据;
(2)本发明提供的用于检测HIV-1整合酶区基因的基因型或耐药突变的引物组能用于扩增得到B亚 型、C亚型、所有BC重组亚型、CRF01_AE以及其进一步重组得到的重组型的整合酶区短序列,序列长 度均在180-380bp,涵盖了所有的整合酶区耐药突变位点;
(3)本发明在下一代半导体测序平台的基础上,采用314半导体芯片对靶基因进行大规模测序,一 次可检测多个样本,具有简便、快速、经济等特点,大大降低了每个样品的检测成本;
(4)本方法利用下一代半导体测序技术HIV-1整合酶区基因耐药突变的筛选,适用性广,通量高, 准确性好,且一次可以检测出多个样本的耐药突变位点,为不同HIV-1亚型基因耐药情况的检测提供了简 便方法。
附图说明
图1为四个独特重组型287_78、287_65、23_II和287_168的NJ进化树;
图2为287_78的全长序列经jpHMM分析得到的基因结构图;
图3为实施例3中多重PCR产物琼脂糖凝胶电泳结果,Maker的最大量程为1000bp,上边为15个样 本引物池1的电泳结果,下边边为15个样本引物池2的电泳结果;
图4为实施例6中应用314芯片进行下一代半导体芯片测序的ISP热图报告;
图5为实施例6中应用314芯片进行下一代半导体芯片测序的ISP统计分析报告;
图6为实施例6中应用314芯片进行下一代半导体芯片测序的读长直方图报告;
图7为实施例6中应用314芯片进行下一代半导体芯片测序结果与参考靶基因比对分析报告;
图8为实施例6中应用314芯片进行下一代半导体芯片测序准确率统计分析报告;
图9为下一代半导体芯片测序IGV分析结果中B-1样本第118氨基酸位点碱基突变情况,碱基由G 变为A,导致氨基酸为G变为R。
具体实施方式
为更进一步阐述本发明所采取的技术手段及其效果,以下通过具体实施方式来进一步说明本发明的技 术方案,但本发明并非局限在实施例范围内。以下实施例中采用的材料不限于上述列举,可用其他同类材 料替代,仪器未注明具体条件的,按照常规条件,或按照制造厂商所建议的条件。
实施例1引物设计及优化
1、逆转录PCR(RT-PCR)引物设计
a.通过HIV Databases下载INT区基因,包括B型、C型、CRF 01_AE各10个基因序列,以及B/C重 组型、01_AE/B重组型、01_AE/C重组型和01_AE/B/C重组型各3个基因序列,整合成一个txt文档,通 过clustalx软件进行比对,选取可以包含整合酶基因区10个耐药突变位点的保守区序列来设计包含简并碱 基的引物,再经过Primer Select软件分析其GC含量、Tm值、发夹结构以及引物二聚体,全部合格才说 明引物初步设计完成。
b.设计的引物兼并了CRF 01_AE/B/C三种基因型的随机重组型,这也是在中国HIV-1相对流行的基因 型,这样的引物扩增效率更高,适用性更广。
本发明中,用于扩增HIV-1Pol区的整合酶区段,相对于HXB2基因组的3952-5266bp的碱基序列的 RT-PCR引物对如SEQ ID NO.37-38所示:
正向引物(SEQ ID NO.37):5’-GCACAACCAGAYARRAGTGAATCAGA-3’;
反向引物(SEQ ID NO.38):5’-CCTADTGGGATRTGTACTTCTGAAC-3’.
2、多重PCR引物设计
a.通过HIV Databases下载云南地区近几年的HIV-1整合酶区基因,包括B型、C型、CRF 01_AE、 CRF 07_BC、CRF 08_BC各一个基因序列,用320个碱基G将5基因隔开,整合成一条序列。将此序列 导入Ion AmpliSeq Designer系统,会生成一定的引物对数和序列以及引物的分组情况。共包括B型4对引 物、C型3对引物、CRF 01_AE 3对引物、CRF 07_BC 3对引物、CRF 08_BC 3对引物,共16对引物,分 为两个组,每组8对引物。
b.通过HIV Databases下载具有代表性的B型、C型、CRF 01_AE、CRF 07_BC、CRF08_BC各50个 整合酶区基因序列,包含步骤a下载的5个基因序列,各自整理成一个txt文档,共五个txt文档通过clustalx 软件进行比对。将步骤a设计的各引物以比对后的文件为参考加入简并碱基,得到16对含有简并碱基的 多重PCR引物。
c.设计的多重PCR引物包含了许多简并碱基,基本可以扩增所有的B型、C型、CRF01_AE、CRF 07_BC、CRF 08_BC基因样本,而且可以扩增CRF 01_AE/B/C三种基因型间随机重组型的整合酶区基因, 这都是在中国HIV-1相对流行的基因型,这样的引物扩增效率更高,适用性更广,设计得到的多重PCR 引物组如表1所示,共16对优化的引物。
表1多重PCR引物序列
Figure BDA0002058029200000071
Figure BDA0002058029200000081
将B型、C型、CRF01_AE以及众多B/C重组型的基因序列输入Ion AmpliSeqDesigner系统设计引物 时不能涵盖简并碱基,因此选择国内流行亚型和重组型进行引物设计,即B亚型、C亚型、CRF07_BC、 CRF08_BC和CRF01_AE亚型,设计得到的16对引物(表1)。
表1中的多重PCR引物为经过简并优化后的引物,考虑多种HIV-1亚型或重组型的基因序列,软件 设计出的引物数量多且引物之间容易相互影响,具体实践中导致多重PCR扩增效率不高、非特异性产物较 多,发明人通过对所有引物的所有碱基进行逐个分析并逐次简并优化,对简并碱基出现的位置、数量、对 应的引物进行大量摸索,最终确定如表1所示引物序列,使得多重PCR引物扩增效率一致,减少非特异性 扩增,能够用于检测B亚型、C亚型、所有B/C重组亚型或CRF01_AE亚型中的任一种,或至少两种的 进一步重组亚型。
实施例2样品RNA的提取
在云南省传染病专科医院收集的15例通过HAART治疗的艾滋病患者(患者知情,收集人口统计学资 料)通过下一代半导体测序技术对HIV-1整合酶区基因耐药突变情况进行筛查,此15例样本包括通过 Sanger测序结果确定的五种亚型:CRF01_AE亚型、CRF07_BC亚型、CRF08_BC亚型、B亚型和C亚型, 每种亚型包括3个Sanger测序结果显示无耐药突变的样品。
本实施例中应用商业化的TIANamp Virus RNA Kit(TIANGEN,北京)对患者血浆进行RNA的提取 (具体做法详见说明书)。
实施例3逆转录PCR与多重PCR反应
1、逆转录PCR
以实施例2所得RNA为模板进行RT-PCR,反应体系见表2,反应条件见表3.
表2RT-PCR反应混合液组分
试剂成分Reagent 体积Volume(μL)
缓冲液2×1Step Buffer 6
酶的预混液(Prime Script 1Step Enzyme Mix) 0.5
无RNA酶水(RNase Free H<sub>2</sub>O) 1
引物SEQ ID NO.37(10μM) 1
引物SEQ ID NO.38(10μM) 1
模板RNA 2
总体积 11.5
表3反应条件
Figure BDA0002058029200000091
由SEQ ID NO.37-38所示引物对扩增出的产物长度为1315bp,采用的DNA聚合酶为TaKaRa公司的 PrimeScript 1Step Enzyme。
2、多重PCR反应
多重PCR是在同一个PCR反应体系里加上二对以上的扩增引物,通过程序运行同时扩增出多个核酸 片段的PCR反应。由于二代测序对模板的长度要求在100~400bp之间,所以我们通过引物设计软件设计 出适当大小的条带进行多重PCR扩增。为了增加体系稳定性,发明通过大量实践验证,将本发明表1所述 16对引物分为两个引物池可以更好的实现扩增,具体地,引物池1为B.1、B.3、C.2、01_AE.1、01_AE.3、 07_BC.2、08_BC.1、08_BC.3共8对引物,引物池2为B.2、B.4、C.1、C.3、01_AE.2、07_BC.1、07_BC.3、 08_BC.2共8对引物,先将2个引物池的引物对分别进行预混后再进行PCR扩增反应体系的配制。以步骤 1所得逆转录PCR反应产物为模板DNA进行多重PCR反应,反应体系见表4,反应条件见表5.
表4多重PCR反应体系
Figure BDA0002058029200000092
Figure BDA0002058029200000101
表5多重PCR反应条件
Figure BDA0002058029200000102
3、多重PCR扩增结果检测
多重PCR反应结束后,将反应产物进行水平琼脂糖凝胶电泳检测。应用2%的琼脂糖凝胶,取3μL 多重PCR产物,与2μL loading buffer混匀,缓慢加入胶孔中,并在第一个电泳孔中加入DNA Marker 1000, 调试电泳电压为120V恒压进行电泳,电流180mA,约30min后观察结果。电泳结束后,在凝胶成像仪 上观察有无目的条带,鉴定扩增结果,结果见图3。
由图3可知,本发明通过将检测整合酶区基因耐药突变的多重PCR引物组分为两个引物池,保证体 系的稳定性和扩增效率的一致,15个样本应用两个引物池(pool)进行的多重PCR扩增可以成功扩增出 目的条带。
4、多重PCR产物的纯化
1)产物柱纯化
应用普通DNA产物纯化试剂盒(TIANGEN,北京)将多重PCR产物进行纯化,最大限度除去蛋白 质、离子及引物小片段等杂质。
2)DNA浓度检测
将每个样品的2个反应体系(即每个样品包括引物池1与引物池2进行扩增的体系)分别测浓度,然 后将两个体系等浓度混合。
3)磁珠纯化
对每个样品用Agencourt AMPure XP Reagent磁珠(Invitrogen公司)进行磁珠纯化,加入15μL的ddH2O 用于洗脱。
4)产物定量
将纯化产物用Life Technologies公司的Qubit 2.0定量仪对其进行定量,定量后,将每个样品取100ng 进行下一步。
实施例4靶基因文库构建
将多重PCR纯化产物进行文库构建的大致步骤为:样品纯化→末端修复→纯化→添加接头→纯化→ 文库扩增→纯化→文库稀释。应用赛默飞公司Ion Plus FragmentLibrary Kit提供的标准方案进行,为实现 上述技术方案,按以下操作步骤进行:
1、采用实施例3纯化产物进行末端修复,根据表6所示体系,15个样本分别在1.5mL的EP管中混 合体系,吹打混匀,避免气泡产生,室温放置20min。
表6末端修复的反应体系
Figure BDA0002058029200000103
Figure BDA0002058029200000111
2、对修复后的产物进行纯化,用Agencourt AMPure XP Reagent磁珠(Invitrogen公司)进行磁珠纯化, 加入25μL的Low TE进行洗脱。
3、连接adapters和barcode序列标签
按照表7所示体系在PCR管中配制体系:
表7接头添加过程的体系
试剂成分Reagent 体积Volume(μL)
DNA(上一步纯化产物) ~25
连接酶缓冲液10×Ligase Buffer 10
接头Ion P1Adapter 2
Ion Xpress Barcode X(X=接头编号) 2
dNTP预混液dNTP Mix 2
ddH<sub>2</sub>O 49
DNA连接酶DNA Ligase 2
Nick Repair Polymerase 8
总共 100
注:X=接头编号;Ion P1Adapter处于接头试剂盒中,区别于建库试剂盒中的Adapters。
混合好体系后,吹打混匀瞬时离心,置于PCR仪中,反应条件为25℃反应15min,72℃5min,4℃ 至多保存1h。程序运行结束后,将PCR管中溶液转移至干净的EP管中。
4、添加接头后的纯化
对连接后的产物进行纯化,用Agencourt AMPure XP Reagent磁珠(Invitrogen公司)进行磁珠纯化, 加入20μL的Low TE进行洗脱。
5、文库扩增
将上一步洗脱后的PCR文库进行扩增,配制扩增反应体系如表8所示:
表8文库的扩增体系组分
Figure BDA0002058029200000112
文库扩增的反应液混匀后将体系分为两管,每管65μL进行文库的扩增。PCR扩增反应程序为:95℃ 预变性5min;8个循环中包括95℃变性15s、58℃退火15s和70℃延伸1min,4℃可保存1h。反应 结束后,将两个PCR管中的液体全部转移到一个干净的EP管中。
6、扩增结束后,用Agencourt AMPure XP Reagent磁珠(Invitrogen公司)进行磁珠纯化,加入20μL 的Low TE进行洗脱。
7、文库定量
将纯化产物用Life Technologies公司的Qubit 2.0定量仪对其进行定量,定量后,将每个样品的文库稀 释至100pM,计算公式如下:
Figure BDA0002058029200000113
其中c为样品浓度(ng/μL);n为文库片段大小(bp);m为1μL原始文库稀释倍数。将构建好的文库 稀释后,每个文库样品取5μL放置于同一个1.5mL的EP管中,混合均匀后,置于4℃待用。
实施例5油包水PCR与模板富集(OT2与ES)
1、油包水PCR反应
首先,将试剂从-20℃取出后置于于冰上融解,融解后震荡5s,瞬离后重置冰上,开始配制体系,所 需试剂与配制比例如表9所示。
表9
试剂 体积
ddH<sub>2</sub>O 48μL
Ion PGM Hi-Q View Enzyme Mix 50μL
实施例4所得待用文库 2μL
Ion PGM Hi-Q View ISPs 100μL
Ion PGM Hi-Q View Reagent Mix 800μL
总共 1000μL
将扩增反应液配制完成后,震荡5s混合均匀,瞬离2s后,缓慢加入到反应器中,再缓慢向反应器中 加入1.7mL的Ion OonTouch Reaction Oil,然后放置到进行油包水PCR反应的OT2上进行反应,约6.5h 后反应结束,在OT2仪器上按下run,将硅胶珠进行离心,吸走上清,每管留约100μL,放置4℃备用。
2、模板富集
首先进行用来富集所用试剂的准备,包括Melt-Off Solution、Dynabeads MyOneStreptavidin C1Beads 的配制,然后将上一步油包水PCR反应产物与配制的试剂加入相应的八连排管中,用ES仪器对含有DNA 模板的硅胶珠进行富集,大约35min后结束反应,放置4℃准备上机测序。
实施例6上机测序
当OT2程序结束之后,要准备Ion PGMTMSystem测序。首先对PGM仪器进行水洗与氯洗,再进行 初始化,然后进行314芯片的检查与加样,最后进行上机测序。测序过程中所应用的试剂来自于Life Technologies公司,测序所有步骤参照Life Technologies公司的测序流程。具体步骤如下:
1.测序Plan的创建
将电脑用网线连接到PGM服务器上,在服务器中上传参考序列文件和靶向文件,在Ion Torrent Server 的Plan中选择Templates后继续选择AmpliSeq DNA,点击CreatePlan后按照提示、所使用试剂和测序目 的来创建Plan,全部设置完成后点击Plan Run将Plan上传至服务器中以供使用。
2.Ion PGMTMSystem的开机前准备及测序用清洗瓶的预处理
先打开氮气总阀门再调节压力阀,使指针处于10每小时空气变化;按机器正面的开机按钮等待仪器 开机;将测序程序运行时用的瓶W1、W2和W3使用18MΩ水涮洗三遍,并将W2中添加18MΩ水直至 瓶子最上方的刻度线;按照相同方法涮洗2个1L的玻璃瓶,并添加18MΩ水至瓶子最上方的刻度线,将 测序前清洗用瓶W2、W3、水洗瓶和氯洗瓶用18MΩ水涮洗三遍。(注:第一次使用W2测序用瓶时,需 要进行预处理才能使用,预处理步骤如下:将装有2L 18MΩ水的新测序用瓶W2中加入整瓶的Wash 2 Bottle Conditioning Solution,混匀后室温放置至少8h后丢弃溶液才可正常使用。)
3.Ion PGMTMSystem的水洗
①点击主界面上“Clean”,勾选“18MΩwater cleaning”后点击“Next”。
②清空清洗用瓶W2、W3和废液缸中的残余液体,将W2、W3和装有250mL 18MΩ水的水洗瓶安 装至对应位置;确保dNTP接口处吸管下面放置有收集废液的废液缸;确保有一张水洗芯片在PGM仪器 上。
③继续点击“Next”,根据提示进行检查,检查无误后进行水洗程序,待水洗结束后点击“Next”返回主 界面。
4.Ion PGMTMSystem的氯洗
①将装有1L 18MΩ水的氯洗用玻璃瓶中加入一整片Ion Cleaning Tablet,待其完全溶解后加入1mL 1M的NaOH溶液,上下颠倒混匀后用0.22或0.45μm的滤膜过滤出250mL的氯液至氯洗瓶中待用。
②点击主界面上“Clean”选项后勾选“Chlorite cleaning”,点击“Next”。
③清空清洗用瓶W2、W3和废液缸中的残余液体,将W2、W3和装有250mL氯水的氯洗瓶安装至 对应位置;确保dNTP接口处吸管下面放置有收集废液的废液缸;确保有一张氯洗芯片在机器上。
④继续点击“Next”,根据提示进行检查,检查无误后进行氯洗程序。
⑤氯洗结束后,清空清洗用瓶W2、W3和废液缸中的残余液体,将W2、W3和装有250mL18MΩ 水的水洗瓶安装至对应;确保dNTP接口处吸管下面放置有收集废液的废液缸;确保有一张水洗芯片在机 器上。
⑥点击“Next”进行水洗,水洗结束后点击“Next”返回主界面。
5.Ion PGMTMSystem的初始化
①初始化试剂的配制
W1的配制:清空润洗后的残留液体,添加350μL新配的100mM的NaOH。W2的配制:在已经添 加2L的18MΩ水的W2中,加入一整瓶的Ion PGMTMHi-QTMView SequencingW2Solution和70μL新配 的100mM的NaOH,立即拧紧盖子,上下颠倒5次混匀。W3的配制:清空润洗后的残留液体,添加50mL 的Ion PGMTMHi-QTMView Sequencing W3Solution。
②初始化
确保Ion PGMTMSystem中有一张水洗芯片,注意不要移除dNTP接口处吸管并保证下方有废液缸。主 界面上点击“Initialize”后,下拉选择“Ion PGMTMHi-QTMViewSequencing Kit”;点击“Enter barcode”后扫描 Ion PGMTMHi-QTMView SequencingW2Solution bottle上的条形码或输入编号。点击“Next”仪器会检查气 压,检查显示气压充足后,换上干净的手套,更换W1、W2和W3处吸管,同时将配制好的W1、W2和 W3安装在对应位置。点击“Next”,按照提示进行检查,检查无误后,进行pH的调节。
将四种dNTP取出置于冰上溶解,溶解后涡旋混匀瞬时离心置于冰上备用。取出4个新的Reagent Bottles 并分别贴上标签:dGTP、dCTP、dATP和dTTP。按照Reagent Bottles管上标记,分别加入20μL的dNTP, 冰上放置待用。
待初始化完成后,按照屏幕提示将dNTP接口处的旧吸管移除,更换新手套后安装新的吸管,同时将 标记有dGTP、dCTP、dATP和dTTP的Reagent Bottles按照IonPGMTMSystem上标记的顺序依次进行安 装。点击“Next”,按照提示检查是否完成所述操作,如果各项指标均通过,屏幕会显示绿色的“PASS”,点 击“Next”后返回主界面。
6.测序步骤
①添加Control ISPs:涡旋Control Ion SphereTMParticles至少30s后瞬离,吸取5μL加入到2.4.9中 制备的阳性ISPs中。
②测序引物的添加:将上一步ISPs吹打混匀后15500g离心2min;环吸留15μL。加入12μL的 Sequencing Primer使总体积达到27μL。吹打混匀瞬离后置于PCR仪上运行程序:95℃ 2min,37℃ 2min, 程序运行结束后置于常温备用。
③芯片检查:点击主界面的“Run”,根据提示清除废液缸中的废液后点击“Next”,确保有一张干净的 水洗芯片在仪器中后点击“Next”,仪器将进行清洗管路的操作。清洗完成后,选择OT2程序所用的试剂盒, 点击“Next”。脱去手套去静电后拆开一张新的314芯片标记后放入仪器中,点击“Next”。扫描芯片外包装 上的条形码,检查外包装上条形码与屏幕中显示的条形码是否一致,确认一致后点击“Chip Check”;当芯 片检查成功后点击“Next”,取下芯片放入Ion centrifuge adapter/rotor篮中,同时将水洗芯片再次放入PGM仪器中。
④向②中常温备用的的ISPs中加入3μL的Ion PGMTMHi-QTMView SequencingPolymerase使总体积 达到30μL,吹打混匀后室温放置5min备用。
⑤芯片加样:使芯片与桌面呈45°并保持加样孔在下方,将枪头垂直于芯片表面插入加样孔后尽量吸 干净芯片中的液体,随后将芯片倒置标签朝里置于Ion centrifugeadapter/rotor篮中离心5s以除净芯片中的 液体。将芯片水平放置,吸取10μL上一步备用的ISPs,不锁枪,将枪头垂直于芯片表面插入加样孔,通 过旋转移液枪旋钮进行加样,保持每秒1μL的速率加样,为了避免气泡的进入,剩余0.5μL不打入芯片 中。将芯片正置标签朝里放置在Ion centrifuge adapter/rotor篮,离心30s,再将芯片正置标签朝外,离心30s,从Ion centrifuge adapter/rotor篮中取下。
使芯片与桌面呈45°并保持加样孔在下方,将枪调至5μL后,枪头垂直于芯片表面插入加样孔后慢慢 吹吸1次,避免产生气泡,随后尽量吸除残余的液体。将芯片倒置标签朝里离心5s以除去残留液体。最 后将添加好样品的芯片放入Ion PGMTMSystem中点击“Next”。
⑥测序计划的选择及运行:点击“Browse”选择第一步中创建的程序,点击“Next”后会出现所创建程序 的相关信息,检查是否有误,确认无误后,按照提示进行选择,开始进行测序。
⑦测序结束后返回主界面,进行水洗,水洗结束后关闭Ion PGMTMSystem(依次点击“Tool”、 “shutdown”,出现水洗界面后,点掉18MΩ水洗前的“√”,点“Next”关机结束)。
7.测序数据的处理
测序结束后,在Ion Torrent Server服务器中查看ISP热图报告、统计分析报告、读长直方图报告以及 fast QC等报告,确定结果的可取性。若测序结果可用,下载所需处理的数据,主要包括BAM/BAI/VCF 等文件。将BAM文件用IGV可视化软件打开,查找耐药位点上的突变情况,结合VCF文件进行耐药位 点突变情况的统计,通过一次应用314芯片的半导体测序反应,测序结果中,图4-8所示,15个样品共获 得64.1M的数据量,共计323002条序列,序列平均长度199bp,1×覆盖度的碱基读取准确率为98.9%,平 均测序深度为1388.7×。
图4为半导体芯片测序的ISP热图报告,由图4可知,314半导体芯片表面约有1,474,560个微孔,在 进行芯片加样时覆盖了914,227个微孔,覆盖率达62%,测序关键信号为70%,一共获得64.1M的数据量。
图5为半导体芯片测序的ISP统计分析报告,由图5可知芯片表面微孔的数据统计分析,64.1M的数 据量中,可用的reads数约为43%。芯片表面含有模板的微孔为62%,其中有99%含有阳性模板,在这些 含有阳性模板的珠子中,68%含有单一模板。在68%含有单一阳性模板的珠子上,有62%为测序质量较好 的微孔。最后经过滤可得到323,002条可用的reads数。
图6为半导体芯片测序的读长直方图报告,由图6可知reads长度的密度分布图,该图的reads为过滤 后的分布密度图,从图中可以看出大部分的reads主要集中于200-300bp,测序质量较高,平均长度为199bp。
图7为半导体芯片测序结果与参考靶基因比对分析报告,由图7可知测序后的碱基序列与导入的HIV 参考序列HXB2的整合酶区基因组比对的结果,95%的碱基序列能和HIV参考序列HXB2的整合酶区基因 组比对上,其中5%不能比对上。这5%分为两种碱基序列,一种是测序深度较低而导致测序不准确的序列, 另外一种是发生变异的序列。
图8为半导体芯片测序准确率统计分析报告,即测序深度为1×时,不同长度reads的测序准确率,由 图8可知,本发明方法的平均测序准确率为98.9%。
图9为下一代半导体芯片测序IGV分析结果中B-1样本第118氨基酸位点碱基突变情况,碱基由G 变为A,导致氨基酸为G变为R,该位点是整合酶区基因的高频突变位点,由图9可知,本发明的方法可 以筛选整合酶区耐药突变位点。
测试例1
将实施例6得到的测序数据以HXB2为参考序列,分析15个样本的耐药突变情况,并与Sanger测序 结果进行对比。Sanger测序显示均无耐药突变位点出现,但是此方法却检出了耐药突变,突变情况如表10。
表10
Figure BDA0002058029200000141
Figure BDA0002058029200000151
由表10可以看出,Sanger测序显示均无耐药突变位点出现,但是本发明实施例6的方法却检出了耐 药突变,说明本发明的方法可以检测到Sanger测序检测不到的低频率突变。
测试例2
选择了10个URF样本,对其应用此方法进行测序,HIV-1INT区10个耐药位点上的reads值如表11 所示。
表11整合酶区10个耐药位点上的reads值
Figure BDA0002058029200000152
由表11可以看出,本发明的方法可以覆盖多数HIV-1亚型及重组型,适用性强。
由测试例1和测试例2,说明了本发明的方法可以覆盖整合酶区10个突变位点,并且可以对其进行突 变情况的分析。
实施例7检测HIV-1整合酶区基因耐药突变的试剂盒
试剂盒包括如下成分:
检测HIV-1整合酶区基因耐药突变的RT-PCR引物,核苷酸序列如SEQ ID NO.37-38所示;
多重PCR引物预混液1,包括如SEQ ID NO.5-6、SEQ ID NO.9-10、SEQ ID NO.15-16、SEQ ID NO.19-20、 SEQ ID NO.23-24、SEQ ID NO.27-28、SEQ ID NO.31-32、SEQ IDNO.35-36所示的引物;
多重PCR引物预混液2,包括如SEQ ID NO.7-8、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ ID NO.17-18、SEQ ID NO.21-22、SEQ ID NO.25-26、SEQ ID NO.29-30、SEQ IDNO.33-34所示的引物;
5×多重PCR Mix;
阳性质控(-20℃):HIV-1RNA阳性样本经表1中16对引物单独扩增出26个目的片段的胶回收产物, 此阳性质控包含HIV-1整合酶区所有耐药突变位点。
阴性质控(-20℃):HIV-1RNA阴性样本,并且经过表1中16对引物单独扩增也为阴性,阴性质控 上机测序结果显示和参考序列无可比对基因;
ddH2O以及说明书。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法, 即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何 改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围 和公开范围之内。
SEQUENCE LISTING
<110> 昆明理工大学
<120> 一种HIV-1重组型、检测整合酶区耐药突变的引物组、方法及其应用
<130> 2019
<160> 38
<170> PatentIn version 3.3
<210> 1
<211> 8575
<212> DNA
<213> 人工合成序列
<400> 1
ggttaaggcc agggggaaag aaacgctata tgttaaaaca cctagtatgg gcaagcaggg 60
agctggacag atttgcactt aaccctggcc ttttagagac atcagaaggc tgtaaacaaa 120
taataaaaca gctacaacca gctcttcaga caggaacaga ggaacttaga tccttattca 180
acacagtagc agttctctat tgtgtacata cagggataga tgtacgagac accaaggaag 240
cattagacaa gatagaggaa gaacaaaaca acattaagca aaaaacacag caggcaaaag 300
aggctgacgg gaaggtcagt caaaactatc ctatagtgca aaacctccaa gggcaaatgg 360
tacatcagcc catatcaccg aggactttaa atgcatgggt aaaagtagta gaagaaaagg 420
cttttagccc agaggtaata cccatgttct crgcattatc agaaggagcc accccacagg 480
atttaaacac catgctaaac acagtgggag gacatcaagc agccatgcaa atgttaaaag 540
agaccattaa tgaggaagct gcagactggg ataggttgca tccagcacag gcagggccag 600
ttgcaccagg ccarataaga gaaccaaggg gaagtgacat agcaggaact actagtaccc 660
ttcaggagca aataacatgg atgacaaata atccacctat cccagtggga gaaatctata 720
aaagatggat aattctggga ttaaataaaa tagtcagaat gtatagccct tccagcattc 780
tggayattag acaaggacca aaggaaccct ttagagacta tgtagaccgg ttctacaaaa 840
ctctaagagc agaacaagct tcacaagatg taaaaaattg gatgacagaa accttgttgg 900
ttcaaaatgc gaacccagat tgtaagacya tcttaaaagc attgggacca gcagctacac 960
tagaagaaat gatgacagca tgtcagggag tgggaggacc tagccacaaa gcaagagtgt 1020
tggctgaagc aatgagccaa acacagggta gcgtaatgat gcaaagaagc aattttaaag 1080
gccctaaaag aattgttaaa tgtttcaatt gtggcaaaga agggcacatc gccaaaaatt 1140
gcagggcccc taggaaaaaa ggctgttgga aatgtggaaa ggaaggacac caaatgaaag 1200
attgtactga gagacaggct aattttttag ggaaaatttg gccttccaac aagggaaggc 1260
cagggaattt ccttcagagc agaccagagc caatggcccc gaaccagagc caacagcccc 1320
gccagcagag agcttcagat tcgaggagac aaccccagat ctgaagcagg aaccgaaaga 1380
caaggaacct ttaatttccc tcagatcact ctttggcaac gaccccttgt cccaataaga 1440
ataggggggc aattaaaaga agctctatta gacacaggag cagatgatac agtcttagaa 1500
gacatgaatt tgccaggaaa atggaaacca aaaatgatag ggggaattgg aggttttatt 1560
aaagtaagac agtatgatca gatacccata gaaatctgtg gacacaaagc tataggtaca 1620
gtattagtag gacctacacc tgtcaacata attggaagga atctgttgac tcagcttggt 1680
tgcactttaa attttcccat tagtcctatt gaaactgtac cagtaaaatt aaagccagga 1740
atggatggcc caaaagttaa acaatggcca ttgacagaag aaaaaataaa agccttaata 1800
gaaatttgta cagaaatgga aaaggaaggg aagatttcaa aaattgggcc tgaaaaccca 1860
tacaatactc caatatttgc cataaagaaa aaagacagta ctaagtggag aaaattagta 1920
gatttcaggg aactcaataa aaaaactcaa gacttctggg aagttcaatt aggaatacca 1980
cacccagcag ggttaagaaa gaaaaaatca gtgacagtac tggatgtggg ggatgcatat 2040
ttttcagttc ctttatatga agacttcagg aagtatactg cattcaccat acctagtata 2100
aacaatgaaa caccaggaat taggtatcaa tataatgtgc tgccacaggg atggaaagga 2160
tcaccagcaa tattccagag tagcatgaca aaaatcttag agccttttag aaaacagaat 2220
ccagacatag ttatctatca atatatggat gatttgtatg taggatctga cttagaaata 2280
gggcagcata gagtaaaagt agaggagtta agaaaacatc tgttaaaatg gggatttacc 2340
acaccagaca agaaacatca gaaagaaccc ccatttcttt ggatggggta tgaactccat 2400
cctgataaat ggacagtgca gcctataaag ctgccagaaa aagacagctg gactgtcaat 2460
gatatacaaa agttagtggg aaaattaaac tgggcaagtc agatctaccc aggaattaaa 2520
gtaaggcaac tttgtaaact ccttaggggg accaaggcat taacagacat aataccacta 2580
actgaagaag cagaattaga actggcagaa aacagggaaa ttctaaaaga accagtacat 2640
ggagtatatt atgacccatc aaaagactta atagcagaaa tacaaaagca ggggctagga 2700
caatggacat accaaattta tcaagagcaa tataaaaatc taaaaacagg aaaatatgca 2760
agaatgaggg gtgcccacac taatgatgta aagcagttaa cagaggctgt gcagaaaata 2820
gccacagaaa gcatagtaat atggggaaag attcctaaat ttaaattacc catccaaaaa 2880
gaaacatggg aaacatggtg gacagaatat tggcaagcca cctggattcc tgaatgggaa 2940
tttgttaata cccctccctt agtgaaatta tggtaccagt tagagaaaga acccatagaa 3000
ggagcagaaa ctttctatgt agatggggca gctaataggg agactaaatt aggaaaagca 3060
ggatatgtta ccaacagagg aagacaaaag gttgtcaccc taactgacac aacaaatcag 3120
aagactgagt tacaagcaat tcatttagct ctgcaggatt caggagtaga agtaaacata 3180
gtaacagact cacaatatgc attaggaatc cttcaagcac agccagataa aagtgaatca 3240
gagttagtta gtcaaataat agagcagtta ataaaaaagg aaaaggtcta cctggcatgg 3300
gtaccagcac acaaaggaat tggaggaaat gaacaagtag ccaaattagt aagtagtgga 3360
atcaggaaaa tattattttt agatggaata gataaagctc aagaagagca tgaaaagtat 3420
cacagcaatt ggagagcaat ggctagtgac tttaatctac caccggtagt agcaaaagaa 3480
atagtagcta gctgtaataa atgtcagcta aaaggggaag ccatgcatgg acaagtagac 3540
tgtagtccag ggatatggca attagattgt acacatttag aaggaaaaat tatcctggtg 3600
gcagtccatg tagccagcgg ctacatggag gcagaagtga tcccagcaga aacaggacaa 3660
gaaacagcat actttatatt aaaattagca ggaagatggc cagtcaaagc aatacataca 3720
gataatggta gtaatttcat cagtactgca gttaaggccg cctgttggtg ggcagggatt 3780
aagcaggaat ttggcattcc ctacaatccc caaagtcaag gagtagtaga gtctatgaat 3840
aaagaattaa agaaaattat aggacaggta agagatcaag ctgaacatct taagacagca 3900
gtacaaatgg cagttttcat ccacaatttt aaaagaaaag gggggattgg ggggtacagt 3960
gcaggggaaa gaataataga cataatagca acagacatac aaactagaga attacaaaac 4020
caaattacaa aaattcaaaa ttttcgggtt tattacaggg acaacagaga gccactttgg 4080
aaaggaccag caaagctcct ttggaaaggt gaaggggcag tagtaataca ggataatagt 4140
gacataaagg tggtaccaag gaggaaagca aaaattatta gggactatgg aaaacagatg 4200
gcaggtgctg atggtgtggc aagtagacag gatgaagatt agaacatgga atagtctagt 4260
aaaacaccat atgtatgttt caaagagagc taatggatgg gcttacaggc atcattatga 4320
aagcagacac ccaaaaataa gttcagaagt acacatccca ttaggagagg ctaaaatagt 4380
aataacaaca tattggggat tgcaaacagg agaaagagat tggcatttgg gtcatggagt 4440
ctccatagaa tggagattga gaagatatag macacaacta gaacctggcc tggcagacca 4500
gctaattcat atgtattatt ttgattgttt tacagactct gccataagga aagccatatt 4560
aggacacata gttattcata ggtgtgacta tcaagcggga cataataata aggtaggatc 4620
tctgcaatac ctggcactaa cagcattgat aaaaccaaaa aagagaaagc cacctctgcc 4680
tagtgttcag aaattagtag aggatagatg gaacaagccc cagaagatca ggggccacag 4740
agggagccat acgctgaatg gacactagag cttctagagg acctcaagca ggaagctgtt 4800
agacattttc ctagaccatg gcttcatggc ttaggacaat atatctatga tacctatgga 4860
gatacttgga caggagttga aattctaaca aaaatactgc aacaacttct gtttattcat 4920
ttcagaattg ggtgccrcca tagcagaata ggcatttgag acagagaaga gcaagaaact 4980
ggagggctta ggcatttcct atggcaggaa gaagcgaaga cagcgacgaa gcgctcatca 5040
gagcagtgag gatcatcaaa atcctatatc aaagcagtga gtagtaaatg taatgcaatc 5100
tttaaccatt ttagcaatag tagccttagt agtagcagca ataatagcaa taattgtgtg 5160
gaccatagta ttcatagaat acaggagaat attaagacag ggaaaaatag ataggataat 5220
tgatagaata agagaaagag cagaagacag tggcaatgag agtgacgggg atcaggaaca 5280
attattggaa atggggcacg atgctccttg gaatgttgtt gatctgtagt gctgtagaaa 5340
acttgtgggt cacagtctat tatggggtac ctgtatggaa agatgcaaac accactttgt 5400
tttgtgcatc agatgctaaa gcatataaga cagaggtaca taatgtttgg gctacacatg 5460
cttgtgtacc cacagacccc aacccacaag aaatggtttt ggaaaatgta acagaaaatt 5520
ttaacatgtg gaaaaatgaa atggtaaatc agatgcatga agatgtaatc agtttatggg 5580
atcaaagctt aaagccatgt gtgaaattga ccccactctg tgtcacttta aactgtacag 5640
atgctagaag taaaaatggt agcagtaata gtaataatac tgttacctac aatgagacct 5700
acaagggaga aatgaaaaat tgctctttca atgcaaccac ggagttaaga gatagaaaga 5760
cgaaagagta tgcacttttt tataaacttg atgtagtaca gcttgaagag aactctagtg 5820
agtatagatt aataaattgt aatacctcaa ccatagcaca agcctgtcca aaggtcaatt 5880
ttgatccaat tcctatacac tattgcactc cagctggttt tgtgattcta aagtgtaatg 5940
ataagaaatt caatggaaca gggccatgca gtaacgttag cacagtacaa tgtacacatg 6000
ggattaagcc agtggtatca actcagctgc tgttaaatgg tagcttatca gaaggagaaa 6060
tactaattag atctaaaaat ataacagaca atgccaaaac aataatagta catcttaatc 6120
aatctgtaga aattgtatgc acaagaccca acaataatac aagaaaaagt ataaggatag 6180
gaccaggaca aacattctac gcaacaggag aaatcatagg agacataaga caagcatatt 6240
gtaacattag tagaggtaat tggagtgaaa ctttacgaaa agtaagcaaa aaattagcag 6300
aacacttccc taatgaacaa taaaatttaa tgcatcctca ggaggggacc tagaaattac 6360
aacatatagc tttaattgta gaggagaatt tttctattgt aatacatcaa atctgtttaa 6420
tagtacatac atgtctaatg gtacattcat atttaatggt acagacatgt ctaatgttac 6480
agaaagcaat ttaagctcaa tcatcacaat cccatgcaga ataaagcaaa ttataaacat 6540
gtggcagggg gtaggacgag caatgtatgc ccctcccatt gaaggaaaca taacatgtag 6600
atcaaatatc acaggactac tattggaata tgatgagcca aataatacaa tatttagacc 6660
tacaggagga gatatgagga acaattggag aagtgaacta tataaatata aagtagtaga 6720
aattaagcca ttgggagtag cacccactga agcaaaaagg agagtagtgg agagagaaaa 6780
aagagcagcg ggaataggag ctgtgttcct tgggttcttg ggagcagcag gaagcactat 6840
gggcgcagcg tcaataacgc tgacggtaca agccagacaa ttgttgtctg gtatagtgca 6900
acagcaaagc aatttgctga gagccataga ggcgcaacag catctgttgc aactcacggt 6960
ctggggcatt aagcagctac agacaagagt cctggctata gaaagatacc taaaggatca 7020
acagctccta gggatttggg gctgctctgg aaaactcatc tgcactacta ctgtaccttg 7080
gaactccagt tggagtaaca aatctaaaga agaaatttgg gataacatga cctggatgca 7140
gtgggataaa gaaattagta gttacacaaa cgaaatatac aggttgcttg aagactcgca 7200
aaaccagcag gaaagaaatg aaaaagatct attagcattg gacagttgga aaaatctatg 7260
gagttggttt gacatatcaa attggctgtg gtatataaaa atattcataa tgatagtagg 7320
aggcttgata ggtttaagga taatttttgc tgtgctttct atagtgaata gagttaggca 7380
gggttactca cctctgtctc cccagatcct tatcccgaac ccaaggggac caagcaggct 7440
cggaggaatc gaagaagaag gtggagagcc agacaaagac agatccattc gattagcgag 7500
cggattcttg agtctctttt gggacgacct gcggaacctg tgcctcttca gctaccaccg 7560
cttgagagac ttactcttga ttgtagcgag agttgtggaa cttctgggac gcagggggtg 7620
ggaagccctc aaatattggt ggaacctcct gcagtattgg gctcagcaac taaagaatag 7680
tgctgttagc ttgctcgatc ccccagcaat agtagtagct gaagggacag ataggtttat 7740
agaagcaatc caaagagctt atagagctat tctccacgta cctacaagaa taagacaggg 7800
ctttgaagca gctttgcaat aaaatgggga gcaagtggtc aaaaagcagc atagttggat 7860
ggcctactat aagagaaaga ataaggaaaa ctgagccagc agcagaagga gtaggagcag 7920
catcccagga cttagataag catggagcac ttacaaccag caacacagac gccaataatg 7980
ctgattgtgc ttggctgaga acgcaagagg aggaagaaga agtaggcttc ccagtcagac 8040
ctcaagtgcc tttaagacca atgacttata agggagcatt tgatctcagc ttctttttaa 8100
gagaaaaggg gggactggat gggttagttt actctaagaa aaggcaagag atccttgatt 8160
tgtgggtcta ccacacacaa ggctacttcc ctgattgggg caactataca ccgggaccag 8220
gggtcagata cccactgacc tttgggtggt gcttcaagct agtaccagtt gacccaagag 8280
cagtagaaga ggccaaccaa ggagaagaca actgtttgct acaccctgtg tgccagcatg 8340
gaatggatga tgaacacaga gaagtattaa tgtggaagtt tgacagtcaa ctagcacaca 8400
aacacaaggc ccgtgagctg catccggagt tttataaaga ctgctgacac agaagggact 8460
gctgctgaca cgaagggact ttccgcgggc actgggcgtt ccaggaggag tggtctgggc 8520
gggactggga gtggccaacc ctcagatgct gcatataagc agctgctttt cgcct 8575
<210> 2
<211> 8661
<212> DNA
<213> 人工合成序列
<400> 2
ggttaaggcc agggggaaag aaacgctata tgttaaaaca cttagtatgg gcaagcaggg 60
agctggacag atttgcactt aaccctggcc ttttagagac atcagatggc tgtaaacaaa 120
taataaaaca gctacaacca gctcttcaga caggaacaga ggaacttaga tccttattca 180
acacagtagc agttctctat tgtgtacata cagggataga tgtacgagac accaaagaag 240
cattagacaa gatagaggaa gaacaaaaca aaattaagca aaaaacacag caggcaaaag 300
aggctgacgg gaaggtcagt caaaactatc ctatagtgca aaacctccaa gggcaaatgg 360
tacatcagcc catatcacct aggactttaa atgcatgggt aaaagtagta gaagaaaagg 420
cttttagccc agaggtaata cccatgttct cagcattatc agaaggagcc accccacagg 480
atttaaacac catgctaaac acagtgggag gacatcaagc agccatgcaa atgttaaaag 540
agaccattaa tgaggaagct gcagactggg ataggttgca tccaccacag gcagggccag 600
ttgcaccagg ccagctaaga gaaccaaggg gaagtgacat agcaggaact actagtaccc 660
ttcaggagca aataacatgg atgacaaata atccgcctat cccagtggga gaaatctata 720
aaagatggat aattctggga ttaaataaaa tagtaagaat gtatagccct tccagcattc 780
tggacattag acaaggacca aaggaaccct ttagagacta tgtagaccgg ttctacaaaa 840
ctctaagagc agaacaagct tcacaagatg taaaaaattg gatgacagaa accttgttgg 900
ttcaaaatgc gaacccagat tgtaagacta ttttaaaagc attgggacca gcagctacac 960
tagaagaaat gatgacagca tgtcagggag tgggaggacc tagccacaaa gcaagagtgt 1020
tggctgaagc aatgagccaa acacagggta gcgtaatgat gcaaagaagc aattttaaag 1080
gccctaaaag aattattaaa tgtttcaact gtggcaaaga aggacacctg gccagaaatt 1140
gcagggcccc taggaaaaaa ggctgttgga aatgtggaaa ggaaggacac caaatgaaag 1200
attgtactga gagacaggct aattttttag ggaaaatttg gccttcccac aagggaaggc 1260
cagggaattt ccttcagagc agaccagagc caacagcccc gccagcagag agcttcaggt 1320
tcgaggagat aaccccagct ccgaagcagg aactgaaaga cagggaacct ttaatttccc 1380
tcagatcact ctttggcaac gaccccttgt cccaataaga ataggggggc aattaaaaga 1440
agctctatta gacacaggag cagatgatac agtattagaa gacatgaatt tgccaggaaa 1500
atggaaacca aaaatgatag ggggaattgg aggttttatt aaagtaagac agtatgatca 1560
gatacccata gaaatctgtg gacacaaagc tataggtaca gtattagtag gacatacacc 1620
tgtcaacata attggaagaa atctgttgac tcagcttggt tgcactttaa attttcccat 1680
tagtcctatt gaaactgtac cagtaaaatt aaagccagga atggatggcc caaaagttaa 1740
acaatggcca ttgacagaag aaaaaataaa agccttagta gaaatttgta cagaaatgga 1800
aaaggaaggg aagatttcaa aaattgggcc tgaaaaccca tacaatactc caatatttgc 1860
cataaagaaa aaagacagta ctaagtggag aaaattagta gatttcaggg aactcaacaa 1920
aaaaactcaa gacttctggg aagttcaatt aggaatacca cacccagcag ggttaaaaaa 1980
gaaaaaatca gtgacagtac tggatgtggg ggatgcatat ttttcagttc ctttatatga 2040
agacttcagg aagtatactg cattcaccat acctagtata aacaatgaaa caccaggaat 2100
taggtatcaa tataatgtgc tgccacaggg atggaaagga tcaccggcaa tattccagag 2160
tagcatgaca agaatcttag agccttttag agaacagaat ccagacatag ttatctatca 2220
atatatggat gatttgtatg taggatctga cttagaaata gggcagcata gagtaaaagt 2280
agaggagtta agaaaacatc tgttaaaatg gggattcacc acaccagaca agaaacatca 2340
gaaagaaccc ccattccttt ggatggggta tgaactccat cctgataagt ggacagtgca 2400
gcctatagag ctgccagaaa aagacagctg gactgtcaat gatatacaga agttagtggg 2460
aaaattaaac tgggcaagtc agatctaccc aggaattaaa gtaaggcaac tttgtaaact 2520
ccttaggggg accaaggcat taacagacat aataccacta actgaagaag cagaattaga 2580
actggcagaa aacagggaaa ttctaaaaga accagtacat ggagtatatt atgacccatc 2640
aaaagactta atagcagaaa tacaaaagca ggggctaggc caatggacat accaaattta 2700
tcaagagcaa tataaaaatc taaaaacagg aaaatatgca agaatgaggg gtgcccacac 2760
taatgatgta aagcagttaa cagaggctgt gcagaaaata gccacggaaa gcatagtaat 2820
atggggaaag attcctaaat ttaaattacc catccaaaaa gaaacatggg aaacatggtg 2880
gacagaatat tggcaagcca cctggattcc tgaatgggaa tttgttaata ccccgccctt 2940
agtaaaatta tggtatcagt tagagaaaga acccatagaa ggagcagaaa ctttctatgt 3000
agatggggca actaataggg agactaaatt aggaaaagca ggatatgtta ccaacagagg 3060
aagacaaaaa gttgtcaccc taactgacac aacaaatcag aagactgagt tacaagcaat 3120
tcatttagct ctgcaggatt caggaataga agtaaacata gtaacagact cacaatatgc 3180
attaggaatc cttcaagcac aaccagataa aagtgaatca gagttagtta gtcaaatcat 3240
agagcagtta atacaaaagg aaaaagtcta cctggcatgg gtgccagcac acaaaggaat 3300
tggaggaaat gaccaagtag acaaattagt aagtagtgga atcaggaaaa tattatttct 3360
agatggaata gataaagctc aagaagagca tgaaaagtat cacagcaatt ggagagcaat 3420
ggctagtgac tttaatctac caccggtagt agcaaaagaa atagtagcta gctgtgatca 3480
atgtcagcta aaaggggaag ccatgcatgg acaagtagac tgtagtccag ggatatggca 3540
attagattgt acacatttag aaggaaaaat tatcctggtg gcagtccatg tagccagcgg 3600
ctacatggag gcagaagtta tcccagcaga aacaggacaa gaaacagcat actttatatt 3660
aaaattagca ggaagatggc cagtcaaaac aatacataca gataatggta gtaatttcac 3720
cagtgctgca gttaaggccg cctgttggtg ggcaggaatt aagcaggaat ttggcattcc 3780
ctacaatccc caaagtcaag gagtagtaga gtctatgaat aaagaattaa agaaaattat 3840
aggacaggta agagatcaag ctgaacatct taagacagca gtgcaaatgg cagttttcat 3900
ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaataataga 3960
cataatagca acagacatac aaactagaga attacaaaac caaattacaa aaattcaaaa 4020
ttttcgggtt tattacaggg acaacagaga gccactttgg aaaggaccag caaagctcct 4080
ttggaaaggt gaaggggcag tagtaataca agataatagt gacataaagg tggtaccaag 4140
gaggaaagca aaaattatta gggattatgg aaaacagatg gcaggtgctg attgtgtggc 4200
aagtagacag gatgaagatt agaacatgga atagtctagt aaaacaccat atgtatgttt 4260
caaagagagc taagggatgg gcttacaggc atcattatga aagcagacac ccaaaaataa 4320
gttcagaagt acacatccca ttaggagagg ctaaaatagt aataaaaaca tattggggat 4380
tgcaaacagg agaaagagat tggcatttgg gtcatggagt ctccatagaa tggagattga 4440
gaagatataa cacacaaata gaacctgacc tggcagatca gctaattcat atgcattatt 4500
ttgattgttt tacagactct gccataagga aagccatatt aggacacata gttattccta 4560
ggtgtgacta tcaagcagga cataacaata aggtaggatc tctgcaatac ctggcactaa 4620
cagcattgat aaaaccaaaa aagagaaagc cacctctgcc tagtgttcag aaattagtag 4680
aggatagatg gaacaagccc cagaagatca ggggccacag agggagccat atgttgaatg 4740
gacactagag cttctagagg acctcaagca ggaagctgtt agacattttc ctagaccatg 4800
gcttcatggc ttaggacaat atatctatga tacctatgga gatacttgga caggagttga 4860
agttctaaca aaaatactgc aacaacttct gtttattcat ttcagaattg ggtgccaaca 4920
tagcagaata ggcattatga gacagagagg aacaagaaat ggagccagta gatcctaacc 4980
tagagccctg gaaccaccca ggaagtcagc ctgaaactga ttgcaataac tgttactgta 5040
aacgctgtag ctaccactgt ctagtttgtt ttcagaaaaa aggcttaggc atttcctatg 5100
gcaggaagaa gcggagacag cgacgaagcg ctcctcagag cagtgaggat catcaaaatc 5160
ctgtatcaaa gcagtaagta gcagatgtaa tgctagcttt aaccatttta gcaatagcag 5220
ccttaataat agtagcaata atagcaatag tagtgtgggt catagtactc atagaatata 5280
aaaaattatt aagacaaaga aagatagatc ggttaattga aaggataaga gaaagagcag 5340
aggacagtgg caatgagagt gagggggata ttgaggaatt atccacaatg gtggatatgg 5400
ggaatcttag gctgttggat gctaatgact tataatgtgg gaggaaaatt gtgggtcacg 5460
gtttactatg gggtacctgt gtgggaagaa gcaaaaacta ctctcttctg tgcgtcagat 5520
gctaaagcat atgacagaga agtgcataat gtctgggcta cacatgcctg tgtacccaca 5580
gacccaaacc cacacgaaat ggtcttggaa aatgtaacag aaaattttaa catgtggaaa 5640
aatgacatgg tggatcaaat gcatgaggat gtaatcagtt tatgggatga aagcttaaag 5700
ccatgtgtaa agttaacccc actctgtgtc actttaaact gtagccataa tgttacctat 5760
ggaaatgcta ctaacaaggc tatctacaat gatacagaca atatagtaag aaattgctct 5820
ttcaatgcaa ccacagtagt aagagatagg aagcagaaag tgtatgcact tttttataaa 5880
cttgatatag taccccctga tgggaaggag acaaatggga atgattatta taaattaata 5940
aattgtaata cctcagccat aacacaagcc tgtccaaagg tcacttttga tccaattccc 6000
atacactatt gcgctccagc tggttatgcg attctaaagt gtaataatga gacattcaat 6060
gggacaggac catgccttaa tgttagcaca gtacaatgta cacatggaat taagccagtg 6120
gtatcaactc aactactgtt aaatggtagc ctagcaaaag gagaaataat aattagatct 6180
gaaaatctga cagacaatgc caaaacaata atagtacaac ttaatgaatc cgtaacaatt 6240
gtatgtacaa gacctggcaa taatacaaga aaaagtataa ggataggacc aggacaagca 6300
ttctatacaa caggagaaat aataggagac ataagaagag cacattgtag cattaatagg 6360
acaatttgga atgacacttt acaaaaggta ggtaaaaagt tagcagaaca cttccctaat 6420
aagacaataa actttacttc accctcagga ggggatctag aaattacaac acatagcttt 6480
aattgtagag gagaattttt ctattgtaat acatcaggcc tgtttaatgg tacatacaat 6540
ggtacataca ttaaggagac agacaattca agcatcatac tcacatgtaa aataaagcaa 6600
tttataaaca tgtggcaaag ggtaggacaa gccatgtatg ccccgcccat agaaggaaac 6660
ataacatgta tgtcaaatat cacaggacta ttactagtac gggatggagg agaaacaaac 6720
agctccactg agatattcag acctggagga ggagatatga gggacaattg gagaagtgaa 6780
ttatataaat ataaagtggt agaaattaag ccattaggag tagcacccac tgaatcaaaa 6840
aggagagtgg tggagagaga aaaaagagca gtgggagtaa taggagctac gatccttggg 6900
ttcttaagca cagcaggaag cactatgggc gcggcgtcaa tgacgctgac ggtacaggcc 6960
agacaattgc tgtctggtat agtgcaacag caaagcaatt tgctgaaggc tatagaggcg 7020
caacagcgtc tgttgcaact cacggtctgg ggcatcaagc agctccaggc aagagtcctg 7080
gctatagaaa gatacctaaa ggatcaacag ctcctgggga tttggggctg ctctggaaag 7140
ctcatctgca ccactaatgt accttggaac tccagttgga gtaacaaaac tctaaatgag 7200
atttgggaaa acatgacctg gatgcagtgg gagagagaaa ttagtaatta cacagacaca 7260
atatacaggt tgcttgaaga ctcgcaaacc cagcaggaaa aaaatgaaaa agatttatta 7320
gcattggaaa gctggaacag tctatggaat tggtttagta taacaaaatg gctgtggtat 7380
ataaaaatat tcataatgat agtaggaggc ttgataggtt taagaataat ttttgctgtg 7440
ctttctatag tgaatagagt taggcaggga tactcacctt tgtcgtttca gatccgtacc 7500
ccgaacccag agggacaaga caggctcaga ggaatcgaag aagaaggtgg agagccagac 7560
aaagacagat ccattcgatt agtgagcggg ttcttgagtc tcttttggga cgacctgcgg 7620
aacctgtgcc tcttcagcta ccaccacttg agagacttac tcttgattgt agcgagagtt 7680
gtggaacttc tgggacgcag ggggtgggaa gccctcaaat attggtggaa cgtcctgcag 7740
tattggactc agcaactaaa gaatagtgct gttagcttgc tcgataccac agcaatagta 7800
gtagctgagg ggacagatag ggttatagaa gcaatacaaa gagcttatag agctattctc 7860
cacgtaccta caagaataag acagggcttt gaagcagctt tgcaataaaa tggggaacaa 7920
gtggtcaaaa agcagcatag ttggatggcc tgctataagg gaaagaataa ggagaactga 7980
gccagcagca gaaggagtag gagcagcatc ccgggactta gataagcatg gagcacttac 8040
aaccagcaac acagacacca ataatgctga ttgtgcttgg ctgagaacgc aagaggagga 8100
agaagaagta ggcttcccag tcagacctca agtgccttta agaccaatga cttataaggg 8160
agcatttgat ctcagcttct ttttaagaga aaagggggga ctggatgggt tagtttactc 8220
taagaaaagg caagagatcc ttgatttgtg ggtctaccac acacaaggct acttccctga 8280
ttggggcaac tatacaccgg gaccaggggt cagataccca ctgacctttg ggtggtgctt 8340
caagctagta ccagttgacc caagagaagt agaagaggcc aaccaaggag aagacaactg 8400
tttgctacac cctgtgtgcc agcacggaat ggatgatgaa cacagagaag tattaaagtg 8460
gaagtttgac agtcaactag cacacagaca catggcccgt gagctacatc cggagtttta 8520
taaagactgc tgacacagaa ggaaaggctg ctgacacgaa gggactttcc gcgggcactg 8580
ggcgttccag gaggagtggt ctgggcggga ctgggagtgg ctaaccctca gatgctgcat 8640
ataagcagct gcttttcgct t 8661
<210> 3
<211> 8683
<212> DNA
<213> 人工合成序列
<400> 3
ggttaaggcc agggggaaaa aaacattata tgttaaaaca cctattatgg gcaagcaggg 60
agctggaaaa atttgcactt aaccctggcc ttttaaaaac accaaaaggc tgtaaacaaa 120
taataaaaca gctacatcca gctcttgata caggaacaaa ggaacttara tcattattca 180
acacagtagc aaccctctat tgtgtacatc aggggatara agtacragac accaaagagg 240
ccctagacaa aatagaggaa gaacaaaaca aaagtcagca aaaaacgcar aaggcaaaar 300
aggcagacgg gaaggtcagt caaaattatc ctatagtgca aaacctccaa gggcaaatgg 360
tacatcagcc catatcacct agaactttaa atgcatgggt aaaggtagta gaagagaagg 420
cttttagccc agaagtaata cccatgttct cagcattatc agaaggagcc accccacagg 480
atttaaacac catgctaaac acagtgggag gacatcaagc agccatgcaa atgttaaaag 540
aaaccattaa tgaggaagct gcagactggg atagattgca tccagtgcag gcagggccag 600
ttgcaccagg ccagataaga gaaccaaggg gaagtgacat agcaggaact actagtactc 660
ttcaggagca aatagcatgg atgacaaata atccacctat cccagtggga gaaatctata 720
aaagatggat awtcctggga ttaaataaaa tagtaagaat gtatagtcct tccagcattc 780
tggacataag acaaggacca aaggaaccct ttagagacta tgtagaccgg ttctataaaa 840
ctttaagagc agaacaagct tcacaagatg taaaaaattg gatgacagaa accttgttgg 900
tccaaaatgc gaacccagat tgtaaaacca ttttaaaagc attgggacca gcagctacac 960
tagaagaaat gatgacagca tgtcagggag tgggaggacc tagccacaaa gcaagagtgt 1020
tggctgaggc aatgagccaa acacaaggta acataatgat gcaaagaagc aattttaaag 1080
gccctaarag aattgttaaa tgcttcaact gtggcaaaga agggcacata gccaaaaatt 1140
gcagggcccc taggaaaaaa ggctgttgga aatgtggaaa ggaaggacac caaatgaaag 1200
attgtactga gagacaggct aattttttag ggaagatttg gccttcccac aagggaaggc 1260
cagggaattt cctccagagc agaccagagc cgacagcccc gccagcagag agcttcaggt 1320
tcgaggagac aaccccagct ccgaagcagg aactgaaaga cagggaaccc ttaacttccc 1380
tcaaatcact ctttggcaac gaccccttgt cacaataaaa atagaggggc aattaaaaga 1440
agctctatta gatacaggag ctgatgatac agtattagaa gacatgaatt tgccaggaag 1500
atggaaacca aaaatgatag ggggaattgg aggttttatt aaagtaagac agtatgatca 1560
ggtacccata gaaatctgcg gacacacagc tataggtaca gtattagtag gacctacacc 1620
tgtcaacata attggaagaa atctgttgac tcagcttggt tgcactttaa attttcccat 1680
tagtcctatt gaaactgtac cagtaaaatt aaagccagga atggatggcc caaaagttaa 1740
acaatggcca ttggcagaag aaaaaataaa agccttagta gaaatttgta cagaaatgga 1800
aaaggaaggg aagatttcaa aaattgggcc tgaaaatcca tacaatactc cagtatttgc 1860
cataaagaaa aaagacagta ctaagtggag aaaattagta gatttcaggg aactcaataa 1920
aagaactcaa gacttctggg aagttcaatt aggaatacca cacccagcag ggttaaaaaa 1980
gaaaaaatca gcgacagtac tggatgtggg ggatgcatat ttttcagttc ctttatatga 2040
agacttcagg aagtatactg cattcaccat acctagtata aacaatgaaa caccaggaat 2100
taggtatcaa tataatgtac ttccacaggg atggaaagga tcaccagcaa tattccagag 2160
tagcatgaca aaaatcttag aaccatttag aaatcagaat ccagacatag atatctatca 2220
atatatggat gatttgtatg taggatctga cttagagata gggcagcata gagcaaaagt 2280
agaagagtta agagaacatc tgttaaagtg gggatttacc acaccagaca agaaacatca 2340
gaaagaacct ccattccttt ggatggggta tgaactccat cctgataaat ggacagtgca 2400
gcctataagg ctgccagaaa aagacagctg gactgtcaat gatatacaga agttggtggg 2460
aaaattaaac tgggcgagtc agatttaccc aggaattaaa gtaagacaac tttgtaaact 2520
ccttaggggg accaaggcat tgacagacat agtaccacta actgaagaag cagaattaga 2580
attggcagaa aacagggaaa ttctaaaaga accagtacat ggaacatatt atgacccatc 2640
aaaagaatta atagcagaaa tacagaagca ggggctaggc caatggacat accagattta 2700
tcaagagcca tataaaaatc taaaaacagg aaaatatgca agaatgaggg gtgcccatac 2760
caatgatgta aaacagttaa ccgaggctgt acagaaaata gcccaggaaa gcatagtaat 2820
atggggaaag actcctaaat ttagattgcc catccaaaaa gaaacatggg agacatggtg 2880
gacagattat tggcaagcca cctggattcc tgaatgggaa tttgttaata cccctccctt 2940
agtaaaatta tggtatcagt tagagaaaga acccatagaa ggagcagaaa ctttctatgt 3000
agatggggca gctaataggg agactaaatt aggaaaagca ggatatgtta ctaacaaagg 3060
aagacaaaaa gttgttaccc taactgacac aacaaatcag aagactgagt tacaagcaat 3120
tcatttagct ttgcaggatt caggagtaga agtaaacata gtaacagact cacaatatgc 3180
tttaggaatc attcaagcac aaccagataa gagtgaatca gagttagtca gtcaaataat 3240
agagcagtta ataaaaaagg aaaaagtcta cctggcatgg gtgccagcac acaaaggaat 3300
tggaggaaat gaacaagtag ataaattagt aagtagtgga atcaggaaag tactatttct 3360
agatggaata gataaagctc aagaagagca tgaaaagtat cacagcaatt ggagagcaat 3420
ggctagtgac tttaatctgc cacccatagt agcaaaagaa atagtagcta gctgtgatca 3480
atgtcagcta aaaggggaag ccatgcatgg acaagtagac tgcagtccag ggatatggca 3540
attagattgt acacatttag aaggaaaaat tatcctggtg gcagtccatg tagccagtgg 3600
ctacatagaa gcagaggtta tcccagcaga aacaggacaa gaaacagcat actttatatt 3660
aaaattagca ggaagatggc cagtcaaagc ggtacataca gacaatggta gtaatttcac 3720
cagtgctgca gttaaggccg cctgttggtg ggcggggatc aagcaggaat ttggcattcc 3780
ctacaatccc caaagtcaag gagtagtaga atctatgaat aaagaattaa agaaaattac 3840
agcacaggta agagatcaag ctgaacatct taagacagca gtacaaatgg cagttttcat 3900
ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga 3960
cataatagca acagacatac aaactagaga actacaaaaa caaattacaa aaattcaaaa 4020
ttttcgggtt tattacaggg acaacagaga tccactttgg aaaggaccag caaagctcct 4080
ttggaaaggt gaaggggcag tagtaataca agataacagt gacataaagg tggtaccaag 4140
gaggaaagca aaaattatta aggactatgg aaaacagatg gcaggtgctg attgtgtggc 4200
aagtagacag gatgaagatt agaacatgga atagtttagt aaaacaccat atgtatgttt 4260
caaggagagc taatggatgg ttttacaggc atcattatga aagcagacay ccaaaagtaa 4320
gttcagaagt acacatccca ttaggagagg ctaaaatggt aataaaaaca tattgggggt 4380
tacaaacagg agaaagagat tggcatttgg gtcatggagt ctccatagaa tggagattaa 4440
aaagatatag cacacaaata gaacctggcc tggcagatca gctaattcat atgtattatt 4500
ttgattgttt tacagactct gccataagga aagccatatt aggacacata ggtattcata 4560
ggtgtgacta tcaagcagga cataataata aggtaggatc tctacaatac ttggcactaa 4620
cagcattgat aaaaccaaaa aagataaagc cacctctgcc tagtattcag aaattagtag 4680
aggatagatg gaacaacccc cagaagatca ggggccgcag agggaaccat acaatgaatg 4740
gacactagag cttctagagg aactcaagca ggaagctgtc agacattttc ctagaccatg 4800
gcttcatggc ttaggacaac atgtttatga aacctatggg gatacttgga caggagtcga 4860
agctataata agactactgc aacaactact gttcattcat ttcagaattg ggtgccaaca 4920
tagcagaata ggcattgtga gacagagaag agcaagacct ggagccagta gatcctaacc 4980
tagagccctg gaaccatcca ggaagtcagc ctgaaactgc ttgcaataac tgttactgta 5040
aacgttgtag ctaccattgt ctagtttgct ttcagacaaa aggcttaggc atttcatatg 5100
gcaggaagaa gcggagacag cgacgacgag ctcctcagag cagtgaggat catcaaattc 5160
ctgtatcaaa gcagtaagta gtaaatgtaa tgcaaacttt aaccatttta gcaatagtag 5220
ccttaatagt agcagcaata atagcaatag ttgtgtggac catagtaatc atagaatata 5280
ggaaaatatt aagacagaaa aaaatagata ggttaattga aagactaaga gaaagagcag 5340
aagacagtgg caatgagagt gagggggaca ttgaggaatt atcaaccatg gtggatatgg 5400
ggaattttag gcttctggat gttaatgatt tataatgtgg gaggaaactt gtgggtcaca 5460
gtttattatg gggtacctgt gtggaaagaa gcaaaaacta ctctattctg tgcgtcagat 5520
gctaaagcat atgagaccga aatgcataat gtctgggcta cacatgcctg tgtacccaca 5580
gaccccaacc cacaagaaat acctttggaa aatgtaacag aaaattttaa catgtgggaa 5640
aatgaaatgg tgaatcagat gcatgaggat gtaatcagtt tatgggatca aagcctaaag 5700
ccatgtgtaa agttgacccc actctgtgtc actttacagt gtggaaatgc tacctacaat 5760
aatacccacg gaaatgaaac cgtggacaat gaaatgaaaa agtgctcttt caatgtaacc 5820
acagtagtta gggataagca gaagagagtg gaggcattct tttataaact tgatatagta 5880
ccacttgatg agaagaacca gaactctagt aactctagtg agtatagtga gtatagatta 5940
ataaattgta atacctcagc cataacacaa acctgtccaa aggtcacttt tgatccaatt 6000
cctatacact attgcactcc agctggttat gcgcttctaa agtgtaggga tgagacattc 6060
aatgggacag gaccatgcaa taatgttagc acagtacaat gtacacatgg aattaagcca 6120
gtggtatcaa cacaactact gttaaatggt agcctagcag aagaagagat aataattaga 6180
tccgaaaatc tgacaaacaa tgtcaaaaca ataatagtac atcttaatga atctgtagaa 6240
attgtatgta caagacccaa caataataca agaaaaagtg taaggatagg accaggacaa 6300
acattctatg caacaggaga cataatagga aacataagac tagcacattg taacattagt 6360
gaaagacaat ggaatgaaac tttacaaaaa gtaggtaaaa cattagcaaa acacttccct 6420
aataaaacaa taagatttaa ctcatcttca ggaggggacc tagaaattac aacacatagc 6480
tttaattgtg gaggagaatt tttctattgt aatacatcaa aactgtttaa tggcacactt 6540
aatggtacat acacatttaa tggtacaaac agtagttcag actcaatcat cacaattccg 6600
tgcaggataa agcaaattat aaatatgtgg caggaagtag gaagagcaat gtatgcccct 6660
cccattgcag gaaacataac atgtagatca aagatcacag gcctcctatt agtgcgtgat 6720
ggaggaacaa caaatggaac aaatgaaaca aaggaggaga tattcagacc tggaggaggg 6780
gatatgaggg acaattggag aagtgaatta tataaatata aggtggtaga aattaaacca 6840
ttgggagtag cacccacgac agcaaggagg agagtggtgg agagagaaaa aagagcagtg 6900
ggaataggag ctgtgttcct tgggttcttg ggtgcagcag gaagcactat gggcgcggcg 6960
tcaataacgc tgacggtaca ggccagacaa ttgctgtctg gtatagtgca acagcaaagc 7020
aatttgctga gggctataga ggcgcaacaa catatgttgc aactcacggt ctggggcatt 7080
aagcagctcc agacaagagt cctggctata gaaagatacc taaaggatca acagctccta 7140
gggatttggg gctgctctgg aaaactcatc tgcactactg ctgtcccttg gaactccagt 7200
tggagtaaca aaactctaca agagatttgg gataacatga cctggatgca gtgggataga 7260
gaaattagta attactcaga cacaatatac aggttgcttg aagaatcgca aaaccagcag 7320
gaaaaaaatg aaaaagattt attagcattg gacagctgga aaaatctatg gagttggttt 7380
gatataacaa attggctgtg gtatataaaa atattcataa tgatagtagg aggcttgata 7440
ggtttaagaa taatttttgc tgtgctctct atagtgaata gagttaggca gggatactca 7500
cctttgtcgt tgcagaccca taccccgaac ccagggggac acgacaggct cggaagaatc 7560
gaagaagaag gtggagagca agacagagac agatccattc gattagtgaa cggattctta 7620
gctcttgttt gggacgacct gcggaacctg tgcctcttca gctaccaccg cttgagagac 7680
ttactcttga ttgtaacgag agtggtggaa cttctgggac gcagggggtg ggaagccctc 7740
aaatattggt ggaacctcct gcagtattgg attcaggaac taaagactag tgctattagc 7800
ttgcttaatg tcacagcaat agcagtagct gaggggacag atagggttat agaagcaata 7860
caaagagctt atagagctat tctccacata cctacaagaa taagacaggg ctttgaagca 7920
gcattgcaat aaaatggggg gcaagtggtc aaaaagcagc atagttggat ggcctgctat 7980
aagagaaaga atgaggcgaa ctaggccagc agcagaagga gtagaagcag cctctcagga 8040
cttagataag catggagcac ttacaaccag caacacagac accaataatg ctgattgtgc 8100
ttggctgaga acacaagagg aggaagaaga agtaggcttt ccagtcagac ctcaggtgcc 8160
tttaagacca atgactttta agggagcatt tgatctcagc ttctttttaa aagaaaaggg 8220
gggactggaa gggctaattt actctcagaa aaggcgagag atccttgatt tgtgggtcta 8280
tcacacacaa ggctacttcc ctgattggca aaactataca ccgggaccag gggtcagata 8340
cccactgact tttgggtggt gcttcaagct agtaccagtt gatcaagggg aaatagaaga 8400
ggccaaccaa ggagaagaca actgtttgct acaccctatg tgccagtatg gaatggatga 8460
tgaacacaga gaagtgttaa agtggaagtt tgacagtcaa ctagcacaca gacacatggc 8520
ccgcgagcta catccggagt tttacaaaga ctgctgacac agaagggact ttctgctgac 8580
acgaagggac tttccgcact ggggcgttcc gggaggtgtg atctgggcgg gactgggagt 8640
ggccaaccct cagatgctgc atataagcag ctgcttttcg cct 8683
<210> 4
<211> 8662
<212> DNA
<213> 人工合成序列
<400> 4
agttaaggcc agggggaaag aaacgctata tgttaaaaca cctagtatgg gcaagcaggg 60
agctggaaag atttgcactt aaccctagcc ttttagagac atcagaaggc tgtcaacaaa 120
taataaaaca gctacaacca gctctcaata cagggacaga ggaacttaga tcattattca 180
acacaatagc aactctttat tgtgtacata aagggataga tgtacgagac accaaagaag 240
ccttagacaa gatagaggag gaacaaaaca aaattcagca aaaaacacag caggcaaaag 300
aggctgacgg gaaggtcagt caaaattatc ctatagtgca aaacctccaa gggcaaatgg 360
tacatcagcc cataacaccc agaactttaa atgcatgggt aaaagtagta gaagagaagg 420
cttttagccc agaagtaata cccatgttca cagcattgtc agaaggagcc accccacagg 480
atttaaacac catgctaaac acagtggggg gacatcaagc agccatgcag atgttaaaag 540
aaaccattaa tgaggaagct gcagattggg acagattgca tccagtacag gcagggccaa 600
ttgcaccagg ccagataaga gaaccaaggg gaagtgacat agcaggaact actagtactc 660
ttcaggagca aataacatgg atgacaagta atccacctat cccagtggga gaaatttata 720
aaagatggat aatcctggga ttaaataaaa tagtaagaat gtatagccct gccagcattc 780
tggacataag acaaggacca aaggaaccct ttagagacta tgtagaccgg ttctataaaa 840
ctttaagagc agaacaagct tcacaagatg taaaaaattg gatgacagaa accttgttgg 900
tccagaatgc aaacccagat tgtaagacta ttttaaaagc attgggacca gcagctacac 960
tagaagaaat gatgacagca tgtcagggag tgggaggacc tagccacaaa gcaagagtgt 1020
tggctgaggc gatgagccaa acacaaagta acataatgat gcaaagaagc aattttaaag 1080
gccctagaaa aattgttaaa tgtttcaact gtggcaaaga agggcatata gccagaaatt 1140
gcagggcccc taggaaaaaa ggctgttgga aatgtggaaa ggaaggacat caaatgaaag 1200
attgtactga gagacaggct aattttttag ggaagctttg gccttcccac aaggggaggc 1260
cagggaattt cctccagagc agaccagagc caacagcccc gccagcagag agcttcgggt 1320
tcggggagat aaccccagtt ccgaagcagg aacagaagga ggacagggac agggaacaac 1380
ccttaacttc cctcaaatca ctctttggca acgacccctt gtcacaataa aagtaggggg 1440
gcaattaaaa gaagctctat tagatacagg agcagatgat acagtattag aagaaataaa 1500
tttgccagga agatggaaac caaaaatgat agggggaatt ggaggtttta ttaaagtaag 1560
acagtatgat caggtatcca tagaaatctg cggacacaca gctacaggta cagtattagt 1620
aggacctaca cctgtcaaca taattggaag aaatctgttg actcagcttg gttgcacttt 1680
aaattttccc attagtccta ttgaaactgt accagtaaaa ttaaagccag gaatggatgg 1740
cccaaaagtc aaacaatggc cattgacaga agaaaaaata aaagccttag tagaaatttg 1800
tacagaaatg gaaaaggaag ggaagatttc aaaaattggg cctgaaaacc catacaatac 1860
tccagtattt gccataaaga aaaaagacag tactaagtgg agaaaattag tagattttag 1920
ggaactcaat aaaagaactc aagacttctg ggaagttcaa ttaggaatac cacacccagc 1980
agggttaaaa aagaaaaaat cagtgacagt actggatgtg ggggatgcat atttttcagt 2040
tcctttatat gaagacttca ggaagtatac tgcattcacc atacccagta taaacaatga 2100
aacaccagga attaggtatc aatataatgt gcttccacag gggtggaaag gatcaccagc 2160
aatattccag agtagtatga taaaaatctt agagcctttt agacaacaga atccagaaat 2220
agttatctat caatatatgg atgatttgta tgtaggatct gacttagaaa tagggcagca 2280
tagagcaaaa gtagaggagt taagagaaca tctgttaaag tggggattta ccacaccaga 2340
caagaaacat cagaaagagc ctccattcct ttggatggga tatgaactcc atcctgataa 2400
atggacagtg cagcctatag tgctgccaga aaaagacagc tggactgtca atgatataca 2460
gaagttagtg ggaaaattaa actgggcaag tcagatttac ccaggaatta aagtaaagca 2520
actttgtaaa ctccttaagg gggccaaggc actaacagac atagtaccac taactgaaga 2580
agcagaatta gagttggcag aaaacagaga gatcctaaaa gagccagtac atggaacata 2640
ttatgaccca tcaaaagact taatagcaga aatacagaag caagggctag gccaatggac 2700
ataccagatt tatcaagagc catacaaaaa tttaaaaaca ggaaaatatg caagaatgag 2760
gggtgcccac actaatgatg taaaacagtt agcagaggct gtgcagaaaa tatccatgga 2820
aagcatagta atatggggaa agactcctaa atttaagtta cccatccaaa aagagacatg 2880
ggagatatgg tggacagact attggcaagc cacctggatt cctgaatggg aatttgttaa 2940
cacccctccc ttagtgaaat tatggtatca gttagaaaaa gaacccatag aaggagcaga 3000
aactttctat gtagatgggg cagctaatag ggagactaaa ttaggaaaag caggatatgt 3060
tactaacaaa ggaagacaaa aagttatcac tctaactgac acaacaaatc agaaaactga 3120
attacaagca attcatttag ctttgcagga ctcaggagta gaagtaaaca tagtaacaga 3180
ctcacaatat gcattaggaa tcattcaagc acaaccagac aagagtgaat cagagttagt 3240
cagtcaaata atagagcagt taataaaaaa ggaaagagtc tacctggcat gggtgccagc 3300
acacaaagga ataggaggaa atgaacaagt agataaatta gtaagtagtg gaatcaggaa 3360
agtactattt ttagatggaa taaataaagc tcaagaggag catgaaaagt atcacaacaa 3420
ttggagagca atggcaagtg actttaatct gccacccgta gtagcaaaag aaatagtagc 3480
tagctgtgat caatgtcagc taaaagggga agccatgcat ggacaagtag actgtagtcc 3540
agggatatgg caattagatt gtacacattt agaaggaaaa attatcctgg tagcagtcca 3600
tgtagctagt ggctacatag aggcagaggt tatcccagca gaaacaggac aagaaacagc 3660
atactttatc ttaaaactag caggaagatg gccagtcaaa gtagtacata cagacaatgg 3720
tagtaatttc actagtactg cagtcaaggc cgcctgttgg tgggcgggga tcaagcagga 3780
atttggcatt ccctacaatc cccagagtca aggagtagta gaatctatga ataaagaatt 3840
aaagaaaatt ataggacagg taagagatca agctgaacat cttaaaacag cagtacaaat 3900
ggcagttttc atccacaatt ttaaaagaaa aggggggatt ggggggtaca gtgcagggga 3960
aagaatagta gacataatag caacagacat acaaactaga gaattacaaa aacaaattac 4020
aaaaattcaa aattttcggg tttattacag ggacaacaga gatccacttt ggaaaggacc 4080
agcaaggctc ctttggaaag gtgaaggggc agtagtaatc caagataata gtgacataaa 4140
ggtggtgcca aggaggaaag cacaaattat taaagactat ggaaaacaga tggcaggtgc 4200
tgattgtgtg gcaagtagac aggatgaaga tcaggacatg gaatagttta gtaaaacacc 4260
atatgtatgt ttcaaggaga gctaatggat ggttttacag gcatcattat gaaagcagac 4320
acccaaaagt aagttcagaa gtacacatcc cattaggaga ggctaaaata gtaataaaaa 4380
catattgggg gttacaaaca ggagaaagag attggcattt gggtcatgga gtctccatag 4440
aatggagatt gaggagatat agcacacaaa tagaacctgg cctggcagat cagctaatcc 4500
atctgtatta ttttgattgt tttacagatt ctgccataag gaatgccata ttaggacaga 4560
taggtattca taggtgtgac tatcaagtag gacataggaa taaggtagga tctctacaat 4620
acttggcact aacagcattg ataagaacaa aaaagagaaa gccacctctg cctagtattc 4680
agaaattagt agaggataga tggaacaacc cccagaagat caggggccgc agagagaacc 4740
attcaatgaa tgggtactag aacttctaga ggaactcaag caggaagctg tcagacattt 4800
tcctagacca tggcttcatg gcttaggaca atatgtctat gacacctatg gggatacttg 4860
gacaggagtt gaaactataa taagaatgct gcaacaacta ctgtttattc atttcagaat 4920
tgggtgccaa catagcagaa taggcattgt gaggcagaga gagcagaatg gagccagtag 4980
atcctaatct agagccctgg aaccatccag gaagtcagcc taaaactgct tgcaataact 5040
gttattgtaa acgctgcagc taccattgtc cagcttgctt tctgacaaaa ggcttaggca 5100
tttactatgg caggaagaag cggagaagac gacgaggtgc tcctccaagc agtgaggacc 5160
atcaaaatcc tataccaaag cagtaagtag tatatgtaat gccagcttta atcattttag 5220
caatagtagc cttaatagta gtagcaataa tagcaatagt tgtgtggact atagtaatct 5280
tagaatatag gaaaatacta agacagagaa aaatagatag gttaattgaa agaataagag 5340
aaagagcaga agacagtggc aatgagagtg agggagacat tgaggattta tcaacaatgg 5400
tggatatggg gaatattagg cttttggatg ttaatgattt ataatgtggg aggaaacttg 5460
tgggtcacag tttattatgg ggtacctgtg tggaaagaag caaaaactac tctattctgt 5520
gcgtcagatg ctaaaacata tgatgacgag gggcataatg tctgggctac acatgcctgt 5580
gtacccacag accccaaccc acaagaaata cttttgggaa atgtaacaga aaactttaac 5640
atgtggaaaa atgaaatggt gaatcagatg catgaggatg taatcagtat atgggatcaa 5700
agcctaaagc catgtgtaaa gttgacccca ctctgtgtca ctttagactg tacagatgtt 5760
aatgggacca aagtaagtgg tgagaccgat gcaagagatg aaatgaaaaa ttgctctttc 5820
aatgcaacca cagtattaag ggataagaag cagcaagtgt ctgcactttt ttatagactt 5880
gatatagtac cacttaagaa ctctagtggg aactctagtg agtatagatt aataaattgt 5940
aatacctcag ccataacaca agcctgtcca aaggtctctt ttgatccaat tcctatacat 6000
tattgtgctc cagctggtta tgcgcttcta aaatgtaata atgagacatt caatgggaca 6060
ggaccatgta ctaatgttag cacagtacaa tgtacacatg gaattaagcc agtggtatca 6120
actcaactac tgttaaatgg tagcctagca aaagaagaaa taataattag atctgaaaat 6180
ctaacagaca atgtcaaaac aataatagta cagcttaatc aatcagttga aattgtgtgt 6240
gccagaccta acaataatac aagaaaaagt ataaggatag gaccaggaca aacattcttt 6300
gcaacaggag agataatagg aaacataaga caagcacatt gtaatattag tgaaagaaga 6360
tggaaggaaa ctttacaaaa tgtaagtaaa aagttagcaa aacacttccc taatacaaca 6420
atcagatttg caccatcctc aggaggggac ctagaaatta caatacacag ctttaattgt 6480
agaggagaat ttttctattg taatacatcg ggcctgttta atggtacata caatgataca 6540
agcaggtata atgctacaaa cagctcatca gtcatcacac tcccatgcaa aataaagcaa 6600
attataaaca tgtggcagga ggtaggacga gccatgtatg cccctcccat tgaaggaaac 6660
ataacatgta aatcaaatat cacaggacta ctattagtac gggatggggg aaatgagaca 6720
ggtcgtggcc aaaatgagac attcagacct ggaggaggag atatgaagga caattggaga 6780
agtgaattat ataaatataa agtggtagaa attaagccat tgggaatagc acccactcca 6840
gcaaaaagga gagtagtgga gagagaaaaa agagcagtag tgggaatagg agctgtgttc 6900
cttgggttct tgggagcagc aggaagcact atgggcgcgg cgtcaataac gctgacggta 6960
caggccagac aattgctgtc tggtatagtg caacagcaaa acaatttgct gagggctata 7020
gaggcgcaac agcatatgtt gcaactcacg gtctggggca ttaagcagct ccagacaaga 7080
gtcctggcta tagaaagata cctaaaggat caacagctcc tagggatttg gggctgctct 7140
ggaaaactca tctgcactac tgctgtacct tggaactcca gttggagtaa caaatctcaa 7200
acagagattt gggagaacat gacctggatg cagtgggata gagaaattaa caactacaca 7260
gacacaatat acaggttgct tgaagaatcg caaacccagc aggaaaaaaa tgaaaaagat 7320
ttattagcat tggacagctg gaaaaaccta tggagttggt ttgatataac aaattggctg 7380
tggtatataa aaatatttat aatgatagta ggaggcttga taggtttaag aataattttt 7440
gctgtgctat ctatagtgaa tagagttagg cagggatact cacctttgtc gttgcagacc 7500
cttatcccga ccccaggggg acccgacagg ctcggaagaa tcgaagaaga aggtggagag 7560
caagacagag acagatccgt gcgattagtg cacggattct tagcactctt ttgggacgac 7620
ctgcggaacc tgtgcctctt cagctaccac cgcttgagag acttactctc gattgcagcg 7680
agagttgtgg cacttctggg acacaggggg tgggaagccc tcaggtattg gtggaacctc 7740
ctgcagtatt ggattcagga gctaaagatt agtgctgtta acttgctcaa tgccacagca 7800
atagcagtag ctgagtggac agatagggtt atagaagtaa tacaaagagc ttatagagct 7860
attcgccaca tacctacgag aataagacag ggctttgaag cagctttgca ataaaatggg 7920
gggcaagtgg tcaaaaagca gcatagttgg atggcctact ataagagata gaatgaagca 7980
aactgcgcca gcagcagaag gagtaggagc agcatctcag gacttagata agtatggagc 8040
acttacaacc aacaatacag ccaccactaa tgccgattgt gcttggctgc aagcgcaaga 8100
ggaagaagaa gtaggcttcc cagtcagacc tcaggtgcct ttaagaccaa tgacttttaa 8160
gggagcattt gatctcagct tctttttaaa agaaaagggg ggactggaag ggttaattta 8220
ctctaagaaa aggcaagaga tcctggattt gtgggtctat catacacaag gcttcttccc 8280
tgattggcaa aactatacac cgggaccagg ggtcagatat ccactgacct ttgggtggtg 8340
cttcaagcta gtaccagttg acccacagga aatagaagag gccaaccaag gagaagccaa 8400
ctgcttgcta caccctatgt gccagtatgg aatggatgat gaacacagag aagtattaaa 8460
atggaagttt gacagtcaac tagcacacag acacaaggcc cgcgagctac atccggagtt 8520
ttacaaagac tgctgacaca gaagggactt tctgctgaca cgaagggact ttccgcactg 8580
gggcgttccg ggaggtgtga tctgggcggg actgggagtg gccaaccctc agatgctgca 8640
tataagcagc tgcttttcgc ct 8662
<210> 5
<211> 25
<212> DNA
<213> 人工合成序列
<400> 5
tttttrgatg gaatagataa rgccc 25
<210> 6
<211> 23
<212> DNA
<213> 人工合成序列
<400> 6
actggctaca tgmacygcta cca 23
<210> 7
<211> 25
<212> DNA
<213> 人工合成序列
<400> 7
yccagrratr tggcarctag aytgt 25
<210> 8
<211> 28
<212> DNA
<213> 人工合成序列
<400> 8
ttgtgratra awactgccat ttgtactg 28
<210> 9
<211> 25
<212> DNA
<213> 人工合成序列
<400> 9
carrtaagag aycargctga rcatc 25
<210> 10
<211> 23
<212> DNA
<213> 人工合成序列
<400> 10
acctttccav agragcyttg ctg 23
<210> 11
<211> 22
<212> DNA
<213> 人工合成序列
<400> 11
agggacarca gagayccact tt 22
<210> 12
<211> 24
<212> DNA
<213> 人工合成序列
<400> 12
atcctcatcc tgtctacttg ccac 24
<210> 13
<211> 28
<212> DNA
<213> 人工合成序列
<400> 13
bcatgararr tatcayrgya attggaga 28
<210> 14
<211> 27
<212> DNA
<213> 人工合成序列
<400> 14
cttractgya gyactrrtga aattask 27
<210> 15
<211> 23
<212> DNA
<213> 人工合成序列
<400> 15
ggmagatggc cagtcaaagt rrt 23
<210> 16
<211> 31
<212> DNA
<213> 人工合成序列
<400> 16
cyctgtaata aacccgraaa ttttgaaytt t 31
<210> 17
<211> 34
<212> DNA
<213> 人工合成序列
<400> 17
gggaaagrat aatagayata atagcawcag ayat 34
<210> 18
<211> 27
<212> DNA
<213> 人工合成序列
<400> 18
tgccatctgt tttccatart ccytrrt 27
<210> 19
<211> 31
<212> DNA
<213> 人工合成序列
<400> 19
tttttagakg gratagayaa rgctcargaa r 31
<210> 20
<211> 31
<212> DNA
<213> 人工合成序列
<400> 20
ctgrrataac ytctgcttct atrtayccac t 31
<210> 21
<211> 23
<212> DNA
<213> 人工合成序列
<400> 21
graaartcat cctggtagca gtc 23
<210> 22
<211> 31
<212> DNA
<213> 人工合成序列
<400> 22
taaaattgtg ratgaatact gccatytgya s 31
<210> 23
<211> 24
<212> DNA
<213> 人工合成序列
<400> 23
gtaagagarc aagcwgarca ycyy 24
<210> 24
<211> 24
<212> DNA
<213> 人工合成序列
<400> 24
atyytcatcc tgtctacctg ccac 24
<210> 25
<211> 32
<212> DNA
<213> 人工合成序列
<400> 25
ytagatggma tarataaagc tcaarmagas ca 32
<210> 26
<211> 24
<212> DNA
<213> 人工合成序列
<400> 26
dactgcagya ctggtgaart task 24
<210> 27
<211> 26
<212> DNA
<213> 人工合成序列
<400> 27
ggdagatggc cagtyaarrt aataca 26
<210> 28
<211> 34
<212> DNA
<213> 人工合成序列
<400> 28
aaacccgraa wttttgaatk tttrtaatyt gytt 34
<210> 29
<211> 32
<212> DNA
<213> 人工合成序列
<400> 29
acaaatggca gtattcatyc acaattttaa ra 32
<210> 30
<211> 25
<212> DNA
<213> 人工合成序列
<400> 30
cctgccatct gttttccata rtcyy 25
<210> 31
<211> 28
<212> DNA
<213> 人工合成序列
<400> 31
scatgaaarg taycacarya attggara 28
<210> 32
<211> 29
<212> DNA
<213> 人工合成序列
<400> 32
attgtctgta tgtatyayyt tgabkggcc 29
<210> 33
<211> 34
<212> DNA
<213> 人工合成序列
<400> 33
catacttkat rytawarhta gcrgsragat ggcc 34
<210> 34
<211> 33
<212> DNA
<213> 人工合成序列
<400> 34
aatttkwtty tgtrrytcty twgtttgtat gtc 33
<210> 35
<211> 34
<212> DNA
<213> 人工合成序列
<400> 35
gacataatwg caacagacat acaaacwara gary 34
<210> 36
<211> 28
<212> DNA
<213> 人工合成序列
<400> 36
ctgccakctg tkttccatag tccytaat 28
<210> 37
<211> 26
<212> DNA
<213> 人工合成序列
<400> 37
gcacaaccag ayarragtga atcaga 26
<210> 38
<211> 25
<212> DNA
<213> 人工合成序列
<400> 38
cctadtggga trtgtacttc tgaac 25

Claims (10)

1.一种HIV-1重组型CRF103_BC基因组分子,其特征在于,所述基因组分子的序列如SEQID NO.1-4中任一项所示。
2.一种用于检测HIV-1整合酶区基因的基因型或耐药突变的引物组,其特征在于,所述引物组包括如SEQ ID NO.5-36所示的核苷酸序列。
3.一种如权利要求2所述的引物组在制备检测HIV-1整合酶区基因耐药突变的试剂或试剂盒中的应用。
4.一种检测HIV-1整合酶区基因耐药突变的试剂盒,其特征在于,包括如权利要求2所述的引物组。
5.根据权利要求4所述的检测HIV-1整合酶区基因耐药突变的试剂盒,其特征在于,
所述试剂盒还包括HIV-1整合酶区基因的RT-PCR引物和多重PCR扩增预混液;
所述试剂盒还包括阳性质控、阴性质控和ddH2O;
所述RT-PCR引物的核苷酸序列如SEQ ID NO.37-38所示。
6.一种如权利要求5所述的试剂盒在制备检测待测HIV-1基因组的基因型或耐药突变位点的产品中的应用。
7.一种HIV-1整合酶区基因的基因型的非诊断目的的筛查方法,其特征在于,所述方法使用如权利要求2所述的引物组通过下一代半导体测序技术进行筛查,包括如下步骤:
(1)样品RNA提取;
(2)以步骤(1)所得RNA为模板,逆转录PCR扩增cDNA;
(3)采用多重PCR方法扩增靶基因;
(4)靶基因文库构建;
(5)对步骤(4)所得文库进行下一代半导体测序,筛选对整合酶抑制产生耐药的突变位点。
8.根据权利要求7所述的筛查方法,其特征在于,步骤(2)所述逆转录PCR的引物的核苷酸序列如SEQ ID NO.37-38所示;
步骤(3)所述多重PCR的反应体系包括5×多重PCR Mix、如权利要求2所述的引物组和模板cDNA;
所述引物组的终浓度为5-20μM;
所述模板cDNA的终浓度为100-1000ng/μL;
所述多重PCR的反应条件为:
(1’)94-97℃预变性5分钟;
(2’)94℃变性30秒,50-55℃退火25-30秒,72℃延伸35-40秒,共35-40个循环;
(3’)72℃延伸5分钟。
9.根据权利要求8所述的筛查方法,其特征在于,所述引物组的终浓度为10μM。
10.根据权利要求8或9所述的筛查方法,其特征在于,所述方法具体包括如下步骤:
(1)样品RNA提取;
(2)以步骤(1)所得RNA为模板,逆转录PCR扩增cDNA:
A)混合反应体系:2×1Step Buffer,PrimeScript 1Step Enzyme Mix,RNase FreedH2O,RT-PCR引物和RNA模板;
B)逆转录PCR的反应条件为:(a)50℃逆转录25-30分钟;(b)94℃预变性5分钟;(c)94℃变性25-30秒,50-55℃退火25-30秒,72℃延伸1.5-3分钟,共35-40个循环;(d)72℃延伸3-6分钟;
(3)采用多重PCR方法扩增靶基因:
A’)多重PCR的反应体系为:5×多重PCR Mix,权利要求2或3所述的引物组,ddH2O和模板cDNA;
B’)多重PCR的反应条件为:(a’)94-97℃预变性5分钟;(b’)94℃变性30秒,50-55℃退火25-30秒,72℃延伸35-40秒,共35-40个循环;(c’)72℃延伸5分钟;
C’)对每个样品进行柱纯化,去除反应液和杂质,得到180~380bp的多条DNA,再将此DNA溶液经磁珠纯化后进行定量检测,并将每个样品统一到相同浓度进行下一步操作;
(4)靶基因文库构建:
A”)将相同浓度的每个样品进行DNA的末端修复,补为平末端;
B”)每个样品加上特异性的barcode序列标签接头和通用的测序接头;
C”)将加了接头的DNA片段应用通用引物进行8-10个循环的PCR扩增反应;
(5)对步骤(4)所得文库纯化定量后,进行下一代半导体测序,以HIV-1参考株HXB2的3952-5266bp的碱基序列为参考序列,筛选对整合酶抑制产生耐药的突变位点。
CN201910395464.XA 2019-05-13 2019-05-13 一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用 Active CN110066771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910395464.XA CN110066771B (zh) 2019-05-13 2019-05-13 一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910395464.XA CN110066771B (zh) 2019-05-13 2019-05-13 一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用

Publications (2)

Publication Number Publication Date
CN110066771A CN110066771A (zh) 2019-07-30
CN110066771B true CN110066771B (zh) 2022-02-18

Family

ID=67370549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910395464.XA Active CN110066771B (zh) 2019-05-13 2019-05-13 一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用

Country Status (1)

Country Link
CN (1) CN110066771B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114703178A (zh) * 2022-04-29 2022-07-05 中国疾病预防控制中心性病艾滋病预防控制中心 检测hiv-1整合酶基因突变的引物组及其应用
CN116732242A (zh) * 2023-03-16 2023-09-12 赛立安生物技术(广州)有限公司 一种用于检测hiv-1蛋白酶区和逆转录酶区耐药突变的引物组、试剂盒及其检测方法
CN118109641A (zh) * 2023-10-25 2024-05-31 武汉康圣真源医学检验所有限公司 一种对hiv-1耐药序列进行靶向建库的引物组及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101671646A (zh) * 2009-10-14 2010-03-17 南开大学 一种hiv-1整合酶表达菌株及整合酶抑制剂体外筛选模型
CN102227507A (zh) * 2008-12-01 2011-10-26 霍夫曼-拉罗奇有限公司 用于检测hiv整合酶变体的系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102227507A (zh) * 2008-12-01 2011-10-26 霍夫曼-拉罗奇有限公司 用于检测hiv整合酶变体的系统和方法
CN101671646A (zh) * 2009-10-14 2010-03-17 南开大学 一种hiv-1整合酶表达菌株及整合酶抑制剂体外筛选模型

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A genotypic assay for the amplification and sequencing of integrase from diverse HIV-1 group M subtypes;Kristel Van Laethem等;《Journal of Virological Methods》;20081130;全文 *
An HIV-1 integrase genotype assay for the detection of drug resistance mutations;Anna C Hearps等;《Sexual health》;20091231;全文 *
Junpeng Zhao等.HIV-1 molecular epidemiology and drug resistance-associated mutations among treatment-naïve blood donors in China.《Scientific reports》.2020, *
福建省HIV-1耐药性检测及新耐药相关突变位点的研究;邹丽君;《中国优秀硕士学位论文全文数据库》;20140115;摘要,第27页最后一段及图1-9 *

Also Published As

Publication number Publication date
CN110066771A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
Li et al. High multiplicity infection by HIV-1 in men who have sex with men
Bhiman et al. Viral variants that initiate and drive maturation of V1V2-directed HIV-1 broadly neutralizing antibodies
Rodés et al. Emergence of drug resistance mutations in human immunodeficiency virus type 2-infected subjects undergoing antiretroviral therapy
US6958211B2 (en) Methods of assessing HIV integrase inhibitor therapy
CN110106288B (zh) 一种检测hiv-1 pr和rt区耐药突变的引物组、方法及其应用
Novitsky et al. Human immunodeficiency virus type 1 subtype C molecular phylogeny: consensus sequence for an AIDS vaccine design?
Keele et al. Low-dose rectal inoculation of rhesus macaques by SIVsmE660 or SIVmac251 recapitulates human mucosal infection by HIV-1
Contreras-Galindo et al. Characterization of human endogenous retroviral elements in the blood of HIV-1-infected individuals
Delwart et al. Human immunodeficiency virus type 1 populations in blood and semen
CN110066771B (zh) 一种hiv-1重组型、检测整合酶区耐药突变的引物组、方法及其应用
Lavie et al. Human endogenous retrovirus family HERV-K (HML-5): status, evolution, and reconstruction of an ancient betaretrovirus in the human genome
WO2022160562A1 (zh) 一种慢病毒滴度检测引物、试剂盒及检测方法
Mandal et al. HIV type 1 subtypes circulating in eastern and northeastern regions of India
Dudley et al. A novel yeast-based recombination method to clone and propagate diverse HIV-1 isolates
Bénit et al. Characterization of the low-copy HERV-Fc family: evidence for recent integrations in primates of elements with coding envelope genes
Yedavalli et al. Maintenance of an intact human immunodeficiency virus type 1 vpr gene following mother-to-infant transmission
US20030180715A1 (en) Methods and means for assessing HIV envelope inhibitor therapy
Lihana et al. HIV type 1 subtypes among STI patients in Nairobi: a genotypic study based on partial pol gene sequencing
Tripathy et al. Subtype B and subtype C HIV type 1 recombinants in the northeastern state of Manipur, India
Peut et al. Utility of human immunodeficiency virus type 1 envelope as a T-cell immunogen
CN111074004A (zh) 人类免疫缺陷病毒1型耐药基因型检测法及试剂盒
Chaudhary et al. Correlation between CD4 T cell counts and virus compartmentalization in genital and systemic compartments of HIV-infected females
EP1285971B1 (en) Methods for the phenotypic and genotypic assessment of the drug sensitivity of HIV integrase variants
Leal et al. Distinct patterns of natural selection in the reverse transcriptase gene of HIV-1 in the presence and absence of antiretroviral therapy
US10144976B2 (en) HIV-1 genotyping and coreceptor tropism assay

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231122

Address after: Room 101-1, 9th Floor, Standard Building 3, Biotechnology Incubator, Block B-5-28-3, East District, Kunming High tech Zone, Kunming City, Yunnan Province, 650000

Patentee after: Yunnan Kecan Biotechnology Co.,Ltd.

Address before: No.727, Jingming South Road, Chenggong University Town, Kunming, Yunnan 650500

Patentee before: Kunming University of Science and Technology