CN104066839A - 衍生自人基因的启动子 - Google Patents

衍生自人基因的启动子 Download PDF

Info

Publication number
CN104066839A
CN104066839A CN201280068236.8A CN201280068236A CN104066839A CN 104066839 A CN104066839 A CN 104066839A CN 201280068236 A CN201280068236 A CN 201280068236A CN 104066839 A CN104066839 A CN 104066839A
Authority
CN
China
Prior art keywords
polynucleotide
seq
nucleotide
nucleotide sequence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280068236.8A
Other languages
English (en)
Other versions
CN104066839B (zh
Inventor
村上贤二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sankyo Co Ltd
Daiichi Sankyo Co Ltd
Original Assignee
Sankyo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sankyo Co Ltd filed Critical Sankyo Co Ltd
Publication of CN104066839A publication Critical patent/CN104066839A/zh
Application granted granted Critical
Publication of CN104066839B publication Critical patent/CN104066839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/80Vector systems having a special element relevant for transcription from vertebrates
    • C12N2830/85Vector systems having a special element relevant for transcription from vertebrates mammalian

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及转染的哺乳动物宿主细胞(其分泌外源蛋白的能力已通过使用具有衍生自人基因的启动子的外源基因表达载体得到增强),以及利用所述细胞生产外源蛋白的方法。提供了用于增强充当蛋白药物的外源蛋白在培养的哺乳动物细胞或其它宿主细胞中的生产的方法。提供了衍生自人基因的启动子,所述人基因在培养的哺乳动物细胞或其它宿主中具有比巨细胞病毒(CMV)启动子更强的启动子活性。

Description

衍生自人基因的启动子
技术领域
本发明涉及转染的哺乳动物宿主细胞(其外源蛋白转录活性已通过使用具有衍生自人基因的启动子的外源基因表达载体得到增强),以及利用所述宿主细胞生产外源蛋白的方法。
背景技术
由于遗传重组技术的发展,蛋白药物产品,例如治疗性蛋白和抗体药物的市场已快速扩增。尤其是,抗体药物当施用到人体时可以具有高特异性,而不导致不良免疫反应,并且因此其开发已被积极推进。
作为通过其产生以抗体药物为代表的药物蛋白产品的宿主,可以使用微生物、酵母、昆虫、动物或植物细胞、转基因动物或植物细胞等。为了使药物蛋白产品具有生物学活性或免疫原性,翻译后修饰例如折叠或糖基化是必需的。因此,微生物(使用其无法进行复杂的翻译后修饰),或植物(具有不同聚糖结构),不适合作为宿主。考虑到这种细胞具有聚糖结构类似于人的聚糖结构并且安全,并且使用这种细胞可以进行翻译后修饰,使用培养的哺乳动物细胞例如CHO(中国仓鼠卵巢)细胞,其来自于与人密切相关的物种,是目前的标准。
在培养的哺乳动物细胞用作宿主的情况下,问题在于相比使用微生物或类似物生长速率较低,生产效率低,成本高等(NPL 1)。另外,为了临床使用药物蛋白产品,必须施用大量的产品。因此,其生产能力的缺乏是另一个世界性的问题。当在培养的哺乳动物细胞表达系统中生产药物蛋白产品时,相比低分子量合成药物产品生产成本较高。已经进行相应的尝试以通过改善相应生产步骤来减少生产成本。在培养的哺乳动物细胞表达系统中生产量的改善是减少生产成本的有效方法(NPL 2和NPL 3)。因此,为了改善外源基因在培养的哺乳动物细胞中的生产效率,已经研究了基于启动子、增强子、抗生素选择标志物、基因扩增、培养工程改造技术等的各种方法。当其中CHO细胞用作宿主细胞表达外源基因(即,生产药物蛋白产品)的情况下,通常使用病毒衍生的、人巨细胞病毒主要立即早期启动子(下文称作“CMV启动子”)(NPL4、NPL 5和NPL 6)。另外,已知可以使用人核糖体蛋白基因例如RPL32或RPS11的转录起始位点上游多核苷酸作为DNA元件,用于在CHO细胞中的蛋白表达,组合另一种异源启动子(NPL 7和PLT 1)。
引用列表
专利文献
非专利文献
发明概述
技术问题
本发明的一个目标是提供用于增加要用在药物蛋白产品中的外源蛋白生产的方法,所述方法使用对增强宿主细胞例如培养的哺乳动物细胞中外源基因的表达具有高活性的启动子。通过鉴定在CHO细胞等中具有等于或高于CMV启动子的启动子活性的启动子,提供了在哺乳动物细胞中稳定地实现高的外源基因表达的方法,并且可以提供有利于改善生产水平(换句话说,减少药物蛋白产品在培养的哺乳动物细胞表达系统中的生产成本)的方法。
问题解决方案
本发明人为了解决上述问题进行了深入研究,并发现从位于转录起始位点上游约2kbp的核苷酸开始,并在紧接对应于人核糖体蛋白基因起始密码子的核苷酸序列上游的核苷酸终止的多核苷酸具有高的启动子活性。他们发现所述启动子活性可以显著改善在培养的哺乳动物细胞中表达的外源蛋白的生产,并且从而完成本发明。本发明包括下列方面。
(1)包含由序列表中SEQ ID NO: 1所示的核苷酸序列的多核苷酸。
(2)包含由序列表中SEQ ID NO: 2所示的核苷酸序列的多核苷酸。
(3)包含由序列表中SEQ ID NO: 3所示的核苷酸序列的多核苷酸。
(4)包含与根据上述(1)至(3)任一项的多核苷酸的核苷酸序列具有95%或更高同一性的核苷酸序列并具有启动子活性的多核苷酸。
(5)包含与根据上述(1)至(3)任一项的多核苷酸的核苷酸序列具有99%或更高同一性的核苷酸序列并具有启动子活性的多核苷酸。
(6)在严格条件下与包含与根据上述(1)至(3)任一项的多核苷酸的核苷酸序列互补的核苷酸序列的多核苷酸杂交并具有启动子活性的多核苷酸。
(7)包含根据上述(1)至(6)任一项的多核苷酸的外源基因表达单元。
(8)根据上述(7)的外源基因表达单元,其中所述外源基因是编码多聚体蛋白的基因。
(9)根据上述(7)的外源基因表达单元,其中所述外源基因是编码异源多聚体蛋白的基因。
(10)根据上述(7)的外源基因表达单元,其中所述外源基因是编码抗体或其功能片段的基因。
(11)包含根据上述(7)至(10)任一项的外源基因表达单元的外源基因表达载体。
(12)包含根据上述(7)至(10)任一项的外源基因表达单元和一种或多种选自下列组A中(a)至(i)所述的多核苷酸的外源基因表达载体:
组A
(a)包含由序列表中SEQ ID NO: 10所示的核苷酸序列的多核苷酸;
(b)包含由序列表中SEQ ID NO: 11所示的核苷酸序列的多核苷酸;
(c)包含由序列表中SEQ ID NO: 12所示的核苷酸序列的多核苷酸;
(d)包含由序列表中SEQ ID NO: 13所示的核苷酸序列的多核苷酸;
(e)包含由序列表中SEQ ID NO: 14所示的核苷酸序列的多核苷酸;
(f)包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少3000个连续核苷酸的多核苷酸;
(g)包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少2000个连续核苷酸的多核苷酸;
(h)包含与根据上述(a)至(g)任一项的多核苷酸的核苷酸序列具有95%或更高同一性的多核苷酸序列并具有增强外源基因表达的活性的多核苷酸;和
(i)包含与根据上述(a)至(g)任一项的多核苷酸的核苷酸序列具有99%或更高同一性的核苷酸序列并具有增强外源基因表达的活性的多核苷酸。
(13)已经导入根据上述(11)或(12)的外源基因表达载体的转化的细胞。
(14)已经导入根据上述(11)或(12)的外源基因表达载体和元件载体(element vector)的转化的细胞。
(15)根据上述(13)或(14)的转化细胞,其中所述细胞是衍生自哺乳动物的培养的细胞。
(16)根据所述(15)的转化细胞,其中所述衍生自哺乳动物的培养的细胞是COS-1细胞、293细胞或CHO细胞。
(17)生产蛋白的方法,其特征在于包括培养根据上述(13)至(16)任一项的转化细胞并从所得的培养产物中获得衍生自外源基因的蛋白。
(18)根据上述(1)至(6)任一项的多核苷酸用于在转化细胞中表达外源基因的用途。
(19)根据上述(11)至(12)的外源基因表达载体用于在转化细胞中表达外源基因的用途。
本发明的有益效果
通过将使用本发明的衍生自人基因的启动子的外源基因表达载体导入哺乳动物宿主细胞,可以显著增强治疗性蛋白、抗体等的外源基因的表达。并且,通过组合DNA元件使用本发明的启动子,可以进一步增强治疗性蛋白、抗体等的外源基因的表达。
附图简述
[图1] 图1显示通过使用SEAP活性作为指标在转染的CHO-K1多克隆细胞中评价启动子活性的图。该图显示每个启动子的SEAP活性,并且CMV启动子的值归一化为1。显示了两个独立实验的结果(n = 3,平均值 ± SD)。
[图2] 图2显示通过使用SEAP活性作为指标在转染的CHO-K1多克隆细胞中评价截短启动子活性的图。该图显示每个启动子的活性,并且CMV启动子的值归一化为1(n = 3,平均值± SD)。
[图3] 图3显示其中通过扩增GAPDH区域证实进行芯片上ChIP(ChIP-on-chip)的样品特异性地与抗乙酰化组蛋白H3抗体染色质免疫沉淀的图。
[图4] 图4显示其中插入DNA元件的SEAP表达载体的示意图。
[图5] 图5显示其中通过使用在转染的CHO细胞系中CMV启动子表达的SEAP的活性作为指标证实的DNA元件A2、A7、A18、B5和C14的增强表达效果的图。
[图6] 图6显示其中通过使用在转染的CHO细胞系中EF-1α或SV40启动子表达的SEAP的活性作为指标证实的DNA元件A2和A7的增强表达效果的图。
[图7] 图7显示其中插入DNA元件的抗体表达(抗体基因X重链和轻链共表达)载体的示意图。
[图8] 图8显示其中通过在转染的CHO细胞系中使用CMV或EF-1α启动子表达的抗体的生产水平(通过ELISA法测量)作为指标证实的DNA元件A7的增强表达效果的图。
[图9] 图9是显示DNA元件A2和相关序列的序列长度的表。
[图10] 图10显示其中通过在转染的CHO细胞系中使用SEAP的活性作为指标证实的DNA元件A2和相关序列的增强表达效果的图。
[图11] 图11是显示DNA元件A7和相关序列的序列长度的表。
[图12] 图12显示其中通过在转染的CHO细胞系中使用SEAP的活性作为指标证实的DNA元件A7和相关序列的增强表达效果的图。
[图13] 图13是显示DNA元件A18和相关序列的序列长度的表。
[图14] 图14显示其中通过在转染的CHO细胞系中使用SEAP的活性作为指标证实的DNA元件A18和相关序列的增强表达效果的图。
[图15] 图15是显示DNA元件B5和相关序列的序列长度的表。
[图16] 图16显示其中通过在转染的CHO细胞系中使用SEAP的活性作为指标证实的DNA元件B5和相关序列的表达增强效果的图。
[图17] 图17是显示DNA元件C14和相关序列的序列长度的表。
[图18] 图18显示其中通过在转染的CHO细胞系中使用SEAP的活性作为指标证实的DNA元件C14和相关序列的表达增强效果的图。
[图19] 图19显示其中通过在转染的HEK293细胞系中使用SEAP的活性作为指标证实的DNA元件A2、A7、A18、B5和C14的表达增强效果的图。
[图20] 图20是显示在DNA元件A2、A7或A18的全长序列的基础上在起始和终止点的核苷酸的表。
[图21] 图21是显示在DNA元件B5或C14的全长序列的基础上在起始和终止点的核苷酸的表。
实施方案说明
在下文中,将对本发明进行具体的说明。
如本文所用,术语“基因”是指被转录成mRNA和随后翻译成蛋白质的区段,并且不仅包括DNA,还包括其mRNA、其cDNA和其RNA。
如本文所用,术语“多核苷酸”以与核酸相同的意义使用,并且还包括DNA、RNA、探针、寡核苷酸和引物。
如本文所用,术语“多肽”和“蛋白”的使用没有区别。
如本文所用术语“基因表达”指其中mRNA从基因转录的现象和/或其中蛋白从mRNA翻译的现象。
如本文所用术语“外源基因”指人工导入宿主细胞的基因。
如本文所用术语“外源蛋白”指由外源基因编码的蛋白。
如本文所用术语“基因表达单元”指在转录阅读框的方向上具有至少启动子区域、外源基因和转录终止区域(多聚(A)附加信号)的多核苷酸。
如本文所用术语“增强外源基因表达的活性”指通过产生有利于在包含外源基因的基因表达单元周围的任何DNA中转录的环境和显著改善转录效率,增强外源蛋白在宿主细胞中的产生的活性。
如本文所用术语“启动子”指在从DNA到RNA的转录起始中涉及的转录因子可以结合的区域,并且在本说明书中有时称作“启动子区域”。启动子的实例包括从位于转录起始位点上游约2kbp的核苷酸开始并在紧接对应起始密码子的核苷酸序列的上游核苷酸结束的多核苷酸,并且启动子可以包含5'-UTR和内含子。
如本文所用术语“启动子活性”指其中转录因子结合启动子并起始转录以产生基因编码的蛋白的活性。其可以通过使用由报告基因编码的蛋白(例如分泌型碱性磷酸酶(SEAP))的活性作为指标进行测定。
如本文所用短语“具有启动子活性”指如下文所述(实施例3)在相同条件下具有等于或高于CMV启动子的活性的表达SEAP的活性,以通过使用SEAP的表达水平作为指标评价启动子活性。
如本文所用术语“DNA元件”指在多聚核苷酸位于基因表达单元的附近或在含有基因表达单元的外源基因表达载体中的情况下,具有增强外源基因表达的活性的多核苷酸。
如本文所用术语“抗体的功能片段”,指具有抗原结合活性的抗体的部分片段,并且包括Fab、F(ab')2等。但是,该术语不限于这些分子,只要片段对抗原具有结合亲和性。
如本文所用术语“同一性”指两个或更多个核苷酸序列或氨基酸序列的序列之间的关系,通过比较这些序列确定,如本领域已知。在本领域中,术语“同一性”还可以指核酸分子间或多肽之间序列相关性的程度,如通过两个或更多个核苷酸序列或两个或更多个氨基酸序列的串之间的匹配所确定。可以通过计算在具有缺口比对(如果有的话)的两个或更多个序列的最小者之间相同匹配的百分比评价“同一性”,所述比对通过特定数学模型或计算机程序(即“算法”)进行。具体而言,可以通过使用软件例如欧洲分子生物学实验室 - 欧洲生物信息研究所(EMBL-EBI)提供的Clustal W2评价同一性,但是软件不限于其,并且可以使用任何软件,只要其是本领域技术人员所使用的。
如本文所用短语“在严格条件下杂交”指在形成所谓的特异性杂交但是不形成非特异性杂交的条件下的杂交。条件的实例包括这样的条件,其中包含与另一个核酸具有80%或更多,优选90%或更多,更优选95%或更多,最优选99%或更多的同一性的核苷酸序列的核酸的互补链杂交,但是包含具有更低同一性的核苷酸序列的核酸的互补链不杂交。更具体地,其意味着在68℃,在可商购获得的杂交液ExpressHyb 杂交溶液(由Clontech, Inc.制造)中实现杂交或在如下的条件下实现杂交:所述条件使得杂交在68℃,在0.7至1.0M NaCl的存在下进行,使用具有DNA固定于其上的滤器,然后在68℃使用0.1至2 x SSC溶液(1xSSC溶液由150mM NaCl和15mM柠檬酸钠组成)洗涤,或在其等效条件下实现杂交。
1. 用于增强外源基因表达的启动子
作为本发明的衍生自人基因的启动子(下文有时也称作“本发明的启动子”),优选从位于转录起始位点上游约2kbp的核苷酸开始并在紧接对应人核糖体蛋白基因的起始密码子的核苷酸序列的上游核苷酸结束的多核苷酸。衍生自人基因的启动子可以是从位于转录起始位点上游约1kbp或约0.5kbp的核苷酸开始并在紧接对应人核糖体蛋白基因的起始密码子序列的核苷酸序列的上游核苷酸结束的多核苷酸。
人核糖体蛋白基因优选为人核糖体蛋白S7基因(下文称为“RPS7”)、人核糖体蛋白L32基因(下文称为“RPL32”)或人核糖体蛋白L34基因(下文称为“RPL34”)。
本发明的启动子优选是RPS7、RPL32或RPL34的启动子,更优选是由序列表中任意SEQ ID NO: 1-9所表示的多核苷酸,并且特别优选由任意SEQ ID NO: 1-3所表示的多核苷酸。
SEQ ID NO: 1、2和3的核苷酸序列是分别从位于转录起始位点上游约2kbp的核苷酸开始并在紧接RPS7、RPL32和RPL34对应起始密码子的核苷酸序列的上游核苷酸结束的多核苷酸。SEQ ID NO: 4、6和8的核苷酸序列是分别从位于转录起始位点上游约1kbp的核苷酸开始并在紧接RPS7、RPL32和RPL34对应起始密码子的核苷酸序列的上游核苷酸结束的多核苷酸。SEQ ID NO: 5、7和9的核苷酸序列是分别从位于转录起始位点上游约0.5kbp的核苷酸开始并在紧接RPS7、RPL32和RPL34对应起始密码子的核苷酸序列的上游核苷酸结束的多核苷酸。
此外,本发明的启动子可以是包含与SEQ ID NO: 1-9表示的任一核苷酸序列具有80%或更多,优选90%或更多,更优选95%或更多,最优选99%或更多同一性的核苷酸序列的多核苷酸,并且具有启动子活性。
本发明的启动子可以是这样的多核苷酸,其在严格条件下杂交到包括与包含选自由SEQ ID NO: 1-9表示的核苷酸序列的任一核苷酸序列的多核苷酸互补的核苷酸序列的多核苷酸,并具有启动子活性。
本发明的启动子可以是这样的多核苷酸,其是包含其中一个或多个,优选1至300,更优选1至30个核苷酸已被缺失、取代和/或添加的核苷酸的突变的多核苷酸,并具有启动子活性,所述突变在选自由SEQ ID NO: 1-9表示的核苷酸序列的任一核苷酸序列中。
将突变(缺失、取代和/或添加)导入上述核苷酸序列可以通过本领域已知的方法,例如Kunkel法或缺口双链体法或等效的方法进行。例如,可以使用利用定点诱变法的突变导入试剂盒,例如突变-K(TaKaRa Bio, Inc.制造)或突变-G(TaKaRa Bio, Inc.制造),LA PCR体外诱变系列试剂盒(TaKaRa Bio, Inc.制造)。这样的突变的多核苷酸也可以用作本发明的启动子。
增强外源基因表达的本发明的启动子的活性可以通过使用由报告基因所编码的蛋白如SEAP的活性作为指标来测定。 在下列情况下,其中当使用本发明的启动子时报告蛋白的活性等于或高于使用CMV启动子时,优选地,活性增加1.2倍或更高,更优选1.5倍或更高,所述启动子可以判断为具有增强外源基因表达的活性。即使在其中活性增加约1.2倍或更高的情况下,预期这将减少细胞培养规模、细胞培养时间和纯化步骤,使其可能增加产量并减少细胞培养成本。如果产量增加,则可能稳定地提供用作药物产品的外源蛋白。另外,如果细胞培养成本减少,用作药物产品的外源蛋白的成本也减少。
并且,本发明的启动子还可以通过使用本领域技术人员熟知的方法将启动子导入宿主细胞,用于增强宿主细胞的内源基因的表达。
2. 外源基因表达单元
本发明的外源基因表达单元(以下有时也称为“本发明的基因表达单元”)在转录阅读框的方向上,至少具有在上述项目“1”中所述的本发明的启动子、外源基因和转录终止区(多聚(A)附加信号)。
另外,多聚(A)附加信号可以是对从启动子的转录具有导致转录终止活性的序列,并且可以是来自与所述启动子的基因相同或不同的基因的序列。
3. 用于增强外源基因表达的DNA元件
通过使用在上面的项目“2”中所述本发明的基因表达单元并组合DNA元件,可以进一步增强外源基因的表达。如实施例6所述,可以通过使用乙酰化组蛋白H3和元件之间的相互作用作为指标获得组合使用的DNA元件。通常,据说组蛋白(H3和H4)的乙酰化与转录激活相关,并且有两大理论已被提倡。一个理论是,组蛋白的乙酰化与核小体构象的变化相关,所述变化方式使得组蛋白尾部被乙酰化以便被电中和,减弱DNA-组蛋白的相互作用(Mellor J. (2006) Dynamic nucleosomes and gene transcription. Trends Genet. 22(6): 320-329)。另一个理论是组蛋白的乙酰化与多种转录因子的募集有关(Nakatani Y. (2001) Histone acetylases-versatile players. Genes Cells. 6(2): 79-86)。根据任一理论,非常可能的是组蛋白的乙酰化与转录激活有关,并且通过使用抗乙酰化组蛋白H3抗体进行染色质免疫沉淀(ChIP),可以浓缩与乙酰化的组蛋白H3相互作用的DNA元件。
A2是与本发明的启动子组合使用以增强外源基因表达的DNA元件的实例。A2位于人染色体15的 80966429至80974878的区域,并且是具有62.2%的AT含量的8450bp多核苷酸。A2的核苷酸序列由序列表中SEQ ID NO: 10表示。
A7、A18、B5和C14是类似DNA元件的实例。A7位于人染色体11的 88992123至89000542的区域,并且是具有64.52%的AT含量的8420bp多核苷酸。A7的核苷酸序列由序列表中SEQ ID NO: 11表示。
A18位于人染色体4的 111275976至111284450的区域,并且是具有62.54%的AT含量的8475bp多核苷酸。A18的核苷酸序列由序列表中SEQ ID NO: 12表示。
B5位于人染色体1的 143034684至143043084的区域,并且是具有66.37%的AT含量的8401bp多核苷酸。B5的核苷酸序列由序列表中SEQ ID NO: 13表示。
最后,C14位于人染色体11 的46089056至46097482的区域,并且是具有63.81%的AT含量的8427bp多核苷酸。C14的核苷酸序列由序列表中SEQ ID NO: 14表示。
与本发明启动子组合使用的DNA元件的增强外源基因表达的活性可以通过使用由报告基因所编码的蛋白如SEAP的活性作为指标来测定。
在其中DNA元件与本发明的启动子组合使用的情况下,可以单独使用任一上述DNA元件,或者可以使用DNA元件的一种类型的两个或更多个拷贝。或者,可以组合使用两种或更多种不同类型的上述DNA元件。
A2、A7、A18、B5和C14是与本发明的启动子组合使用的DNA元件的优选的实例。
本发明中使用的DNA元件可以是包含与SEQ ID NO: 10-14表示的任意核苷酸序列具有80%或更多,优选90%或更多,更优选95%或更多,最优选99%或更多同一性的核苷酸序列的核苷酸序列,并且具有增强外源基因表达的活性。可以相对例如日本的DNA数据库等,使用程序例如FASTA或BLAST进行核苷酸序列同源性检索。
与本发明的启动子组合使用的DNA元件可以是这样的DNA元件,其在严格条件下杂交到包括与包含选自由SEQ ID NO: 10-14表示的核苷酸序列的核苷酸序列的多核苷酸互补的核苷酸序列的多核苷酸,并具有增强外源基因表达的活性。
参考Molecular Cloning (Sambrook, J. 等, Molecular Cloning: a Laboratory Manual 2nd ed., Cold Spring Harbor Laboratory Press, 10 Skyline Drive Plainview, N.Y. (1989)) 等,本领域技术人员可以容易地获得这样的同源基因。并且,可以通过以相同的方式进行FASTA检索或BLAST检索确定上述核苷酸序列的同一性。
将突变(缺失、取代和/或添加)导入上述多核苷酸可以通过本领域已知的方法,例如Kunkel法或缺口双链体法或等效的方法进行。例如,可以使用利用定点诱变法的突变导入试剂盒,例如突变-K(TaKaRa Bio, Inc.制造)、突变-G(TaKaRa Bio, Inc.制造)或LA PCR体外诱变系列试剂盒(TaKaRa Bio, Inc.制造)等。这样的突变的多核苷酸也可以用作本发明的DNA元件。
作为与本发明的启动子组合使用的DNA元件,可以使用包含序列表中SEQ ID NO: 10-14任一表示的核苷酸序列的至少3000或至少2000个连续核苷酸的部分片段。这样的部分片段的实例包括:A2-1至A2-17,其是A2的部分片段;A7-1至A7-18,其是A7的部分片段;A18-1至A18-4,其是A18的部分片段;B5-1至B5-6,其是B5的部分片段;以及C14-1至C14-14,其是C14的部分片段。但是,所述DNA元件不限于这些部分片段,只要其具有增强外源基因表达的活性。
在本发明中,可以单独使用任一上述部分片段,并且也可以使用所述部分片段的一种类型的两个或更多个拷贝。或者,可以组合使用两种或更多种不同类型的部分片段。此外,可以组合使用全长序列和任意上述DNA元件的部分片段。在上述组合中,所述全长序列和部分片段可以衍生自相同的DNA元件或衍生自不同的DNA元件。
对于A2的相应片段的多核苷酸序列,A2-1对应序列表中SEQ ID NO: 10的核苷酸1至3000的多核苷酸序列;A2-2对应序列表中SEQ ID NO: 10的核苷酸2801至5800的多核苷酸序列;A2-3对应序列表中SEQ ID NO: 10的核苷酸5401至8450的多核苷酸序列;A2-4对应序列表中SEQ ID NO: 10的核苷酸701至2700的多核苷酸序列;A2-5对应序列表中SEQ ID NO: 10的核苷酸701至2200的多核苷酸序列;A2-6对应序列表中SEQ ID NO: 10的核苷酸701至3700的多核苷酸序列;A2-7对应序列表中SEQ ID NO: 10的核苷酸2001至5000的多核苷酸序列;A2-8对应序列表中SEQ ID NO: 10的核苷酸4001至7000的多核苷酸序列;A2-9对应序列表中SEQ ID NO: 10的核苷酸1至3700的多核苷酸序列;A2-10对应序列表中SEQ ID NO: 10的核苷酸2001至5800的多核苷酸序列;A2-11对应序列表中SEQ ID NO: 10的核苷酸2801至7000的多核苷酸序列;A2-12对应序列表中SEQ ID NO: 10的核苷酸701至5800的多核苷酸序列;A2-13对应序列表中SEQ ID NO: 10的核苷酸2001至7000的多核苷酸序列;A2-14对应序列表中SEQ ID NO: 10的核苷酸2801至8450的多核苷酸序列;A2-15对应序列表中SEQ ID NO: 10的核苷酸1至5800的多核苷酸序列;A2-16对应序列表中SEQ ID NO: 10的核苷酸701至7000的多核苷酸序列;A2-17对应序列表中SEQ ID NO: 10的核苷酸2001至8450的多核苷酸序列。
对于A7的相应片段的多核苷酸序列,A7-1对应序列表中SEQ ID NO: 11的核苷酸601至3600的多核苷酸序列;A7-2对应序列表中SEQ ID NO: 11的核苷酸3601至8420的多核苷酸序列;A7-3对应序列表中SEQ ID NO: 11的核苷酸5401至8420的多核苷酸序列;A7-4对应序列表中SEQ ID NO: 11的核苷酸3401至6400的多核苷酸序列;A7-5对应序列表中SEQ ID NO: 11的核苷酸1501至4500的多核苷酸序列;A7-6对应序列表中SEQ ID NO: 11的核苷酸4401至7400的多核苷酸序列;A7-7对应序列表中SEQ ID NO: 11的核苷酸2401至5400的多核苷酸序列;A7-8对应序列表中SEQ ID NO: 11的核苷酸1至3600的多核苷酸序列;A7-9对应序列表中SEQ ID NO: 11的核苷酸1501至5400的多核苷酸序列;A7-10对应序列表中SEQ ID NO: 11的核苷酸2401至6400的多核苷酸序列;A7-11对应序列表中SEQ ID NO: 11的核苷酸3401至7400的多核苷酸序列;A7-12对应序列表中SEQ ID NO: 11的核苷酸4401至8420的多核苷酸序列;A7-13对应序列表中SEQ ID NO: 11的核苷酸1至5400的多核苷酸序列;A7-14对应序列表中SEQ ID NO: 11的核苷酸1501至6400的多核苷酸序列;A7-15对应序列表中SEQ ID NO: 11的核苷酸2401至7400的多核苷酸序列;A7-16对应序列表中SEQ ID NO: 11的核苷酸3401至8420的多核苷酸序列;A7-17对应序列表中SEQ ID NO: 11的核苷酸1至6400的多核苷酸序列;A7-18对应序列表中SEQ ID NO: 11的核苷酸1501至7400的多核苷酸序列。
对于A18的相应片段的多核苷酸序列,A18-1对应序列表中SEQ ID NO: 12的核苷酸1至5040的多核苷酸序列;A18-2对应序列表中SEQ ID NO: 12的核苷酸1001至6002的多核苷酸序列;A18-3对应序列表中SEQ ID NO: 12的核苷酸2001至7000的多核苷酸序列;A18-4对应序列表中SEQ ID NO: 12的核苷酸3000至7000的多核苷酸序列。
对于B5的相应片段的多核苷酸序列,B5-1对应序列表中SEQ ID NO: 13的核苷酸1至4001的多核苷酸序列;B5-2对应序列表中SEQ ID NO: 13的核苷酸1至3200的多核苷酸序列;B5-3对应序列表中SEQ ID NO: 13的核苷酸2491至5601的多核苷酸序列;B5-4对应序列表中SEQ ID NO: 13的核苷酸5373至8401的多核苷酸序列;B5-5对应序列表中SEQ ID NO: 13的核苷酸901至4001的多核苷酸序列;B5-6对应序列表中SEQ ID NO: 13的核苷酸4001至7000的多核苷酸序列。
对于C14的相应片段的多核苷酸序列,C14-1对应序列表中SEQ ID NO: 14的核苷酸960至4015的多核苷酸序列;C14-2对应序列表中SEQ ID NO: 14的核苷酸1987至5014的多核苷酸序列;C14-3对应序列表中SEQ ID NO: 14的核苷酸4020至7119的多核苷酸序列;C14-4对应序列表中SEQ ID NO: 14的核苷酸960至8141的多核苷酸序列;C14-5对应序列表中SEQ ID NO: 14的核苷酸960至6011的多核苷酸序列;C14-6对应序列表中SEQ ID NO: 14的核苷酸4939至8141的多核苷酸序列;C14-7对应序列表中SEQ ID NO: 14的核苷酸960至5014的多核苷酸序列;C14-8对应序列表中SEQ ID NO: 14的核苷酸2994至7119的多核苷酸序列;C14-9对应序列表中SEQ ID NO: 14的核苷酸4020至8141的多核苷酸序列;C14-10对应序列表中SEQ ID NO: 14的核苷酸1至5014的多核苷酸序列;C14-11对应序列表中SEQ ID NO: 14的核苷酸1987至7119的多核苷酸序列;C14-12对应序列表中SEQ ID NO: 14的核苷酸2994至8141的多核苷酸序列;C14-13对应序列表中SEQ ID NO: 14的核苷酸960至7119的多核苷酸序列;C14-14对应序列表中SEQ ID NO: 14的核苷酸1987至8141的多核苷酸序列。
4. 多核苷酸的获得
在本发明中,可通过下述普通方法获得包含编码外源蛋白(其产量待增加,这将在稍后描述)的外源基因的多核苷酸。例如,可以通过使用从外源基因片段合成的DNA探针筛选衍生自表达外源蛋白的细胞或组织的cDNA文库分离这样的多核苷酸。因此可以通过本领域常规使用的方法制备mRNA。例如,用胍试剂、酚试剂等处理细胞或组织,由此获得总RNA,并且从而通过亲和柱法使用寡(dT)纤维素柱或包含琼脂糖2B等的聚U-琼脂糖柱作为载体,或通过分批法获得聚(A)+ RNA (mRNA)。并且,多聚(A)+RNA可以通过蔗糖密度梯度离心等进一步分级。然后,使用这样获得的mRNA作为模板、寡dT引物和反转录酶合成单链cDNA。从这样获得的单链cDNA,使用DNA聚合酶I、DNA连接酶、RNA酶H等合成双链cDNA。使用T4 DNA聚合酶钝化这样合成的双链cDNA,随后连接到适体(例如EcoRI适体),磷酸化等,并且所得的DNA掺入λ噬菌体例如λgt11以实现体内包装,由此制备cDNA文库。还可以使用质粒载体代替λ噬菌体制备cDNA文库。此后,可以从cDNA文库选择包含目标DNA的克隆(阳性克隆)。
在其中上述的启动子,含有终止子区域的多核苷酸,上述的DNA元件,或包含用于生产蛋白的外源基因的多核苷酸从基因组DNA中分离的情况下,根据常规方法(Molecular Cloning (1989), Methods in Enzymology 194 (1991)),基因组DNA从要用作收集来源的生物体的细胞系中提取,并且选择和分离所述多核苷酸。可以根据例如Cryer等的方法(Methods in Cell Biology, 12, 39-44 (1975))或P. Philippsen等的方法(Methods Enzymol., 194, 169-182 (1991))进行基因组DNA的提取。
也可以通过例如PCR法(PCR Technology. Henry A. Erlich, Atockton press (1989))获得目标启动子、DNA元件或包含外源基因的多核苷酸。在使用PCR法的多核苷酸的扩增中,使用20至30聚体的合成单链DNA作为引物并使用基因组DNA作为模板。在证实基因的多核苷酸序列后,使用扩增的基因。作为PCR的模板,可以使用基因组DNA文库,例如细菌人工染色体(BAC)-文库。
另一方面,可以通过(a)根据常规方法制备基因文库,和(b)从制备的基因文库选择所希望的多核苷酸并扩增所述多核苷酸来获得包含未知序列的多核苷酸。可以通过如下获得基因文库:部分消化通过常规方法从用作收集来源的生物体的细胞系获得的染色体DNA,使用适当的限制性酶来使染色体DNA片段化,将所获得的片段连接到适当的载体上,并将载体导入适当的宿主。还可以通过从细胞提取mRNA,从mRNA合成cDNA,将cDNA连接到适当的载体并将载体导入适当的宿主来制备基因文库。作为用于该制备的载体,可以使用通常已知作为用于基因文库制备的载体的质粒,并且也可以使用噬菌体载体、粘粒等。作为要转化或转染的宿主,可以使用适合用于上述载体类型的宿主。通过菌落杂交法、噬菌斑杂交法等使用包含对外源基因特异性的序列的标记探针从上述基因文库选择包含外源基因的多核苷酸。
此外,还可以通过总化学合成生产包含外源基因的多核苷酸。例如,可以通过下列方法合成基因:其中制备并退火两对互补寡核苷酸的方法,其中通过DNA连接酶连接几个退火的DNA链的方法,其中制备几个部分互补的寡核苷酸并通过PCR填平缺口的方法,等等。
可以通过常规技术,例如双脱氧法(Sanger 等, Proc. Natl. Acad. Sci., USA, 74, 5463-5467 (1977))等进行多核苷酸序列的确定。还可以使用可商购获得的测序试剂盒等容易地进行多核苷酸序列的上述确定。
5. 外源基因表达载体、元件载体
作为本发明的外源基因表达载体,提供了包含在上述项目“2”中所述的外源基因表达单元的载体,所述外源基因表达单元包含上述项目“1”中所述本发明的启动子。本发明的外源基因表达载体可以包含一种类型的上述项目“3”中所述的DNA元件,上述DNA元件的一种类型的两个或更多个拷贝,或组合的上述DNA元件的两种或更多种不同类型。当使用上述外源基因表达载体在宿主细胞中表达外源基因时,DNA元件可以位于所述基因表达单元的紧接的上游或下游,或可以位于远离所述基因表达单元的位置。此外,可以使用包含多个这样的DNA元件的一个外源基因表达载体。顺便提及,所述DNA元件可以关于所述基因表达单元的正向或反向插入。
此外,作为本发明中使用的载体,还包括这样的载体,其包含一种类型的上述DNA元件、上述DNA元件的一种类型的两个或更多个拷贝或组合的两种或更多种类型的上述DNA元件,且不包含基因表达单元(下文也称为“元件载体”)。这样的元件载体可以组合包含所述DNA元件的上述外源基因表达载体,或不包含DNA元件并仅包含外源基因表达单元的外源基因表达载体使用。通过允许所述元件载体与所述外源基因表达载体共存,相比其中单独使用外源基因表达载体的情况,外源基因的表达得到增强,并且因此,上述载体的组合也包括在本发明的外源基因表达载体内。
外源基因没有特别限制,但其实例包括报告基因,如分泌型碱性磷酸酶(SEAP)、绿色荧光蛋白(GFP)和荧光素酶的基因;各种酶的基因,如α-淀粉酶基因和α-半乳糖苷酶基因;各种干扰素的基因,其是药学上有用的和生理活性的蛋白,如干扰素α和干扰素γ;各种白细胞介素的基因,如IL-1和IL-2;各种细胞因子基因,如促红细胞生成素(EPO)基因和粒细胞集落刺激因子(G-CSF)基因;生长因子基因;和编码多聚体蛋白的基因如编码抗体或其功能片段异源多聚体的基因。这些基因可以通过任何方法获得。
“抗体的功能片段”指具有抗原结合活性的抗体的部分片段,并包括Fab、F(ab')2、Fv、scFv、双抗体、线性抗体、抗体片段形成的多特异性抗体等等。抗体的功能片段还包括Fab',其是通过在还原条件下处理F(ab')2获得的抗体的可变区的单价片段。但是,所述功能片段不限于这些分子,只要所述片段对抗原具有结合亲和性。此外,这些功能片段不仅包括通过用适当的酶处理抗体蛋白的全长分子获得的片段,还包括使用遗传修饰的抗体基因在适当的宿主细胞中产生的蛋白。
此外,本发明的外源基因表达载体和元件载体可以各自包含选择标志物用于选择转化子。例如,通过使用抗生素抗性标志物(其赋予对抗生素如浅蓝菌素、短梗霉素、博来霉素、刀豆氨酸、环己酰亚胺、潮霉素、嘌呤霉素、杀稻瘟菌素、四环素、卡那霉素、氨苄青霉素或新霉素的抗性),可以选择转化体。此外,当使用赋予对溶剂如乙醇的抗性,对甘油、盐等的渗透压的抗性,对金属离子如铜离子等的抗性的基因作为标志物时,也可以选择转化子。
本发明的外源基因表达载体和元件载体可以各自是不掺入染色体DNA的载体。通常,外源基因表达载体转染进入宿主细胞,并此后随机掺入染色体。但是,通过使用衍生自哺乳动物病毒例如猿猴病毒40(SV40)、乳头瘤病毒(BPV,HPV)或EBV的组成型组分,载体可以用作附加体载体,其在转染的宿主细胞中自我复制。例如,广泛使用含有SV40衍生的复制原点和编码SV40大T抗原的序列(其是反式作用因子)的载体,含有EBV衍生的oriP的载体和编码EBNA-1的序列的载体等。DNA元件可以有效地展示增强外源基因表达的活性,无论载体的类型如何或其是否整合入染色体。
6. 转化的细胞
本发明的转化的细胞是上述项目“5”中所述外源基因表达载体已导入其中的转化细胞。作为外源基因表达载体,(A)可以仅导入不包含DNA元件的外源基因表达载体,或(B)可以组合导入不包含DNA元件的外源基因表达载体和元件载体。可选地,(C)可以导入包含DNA元件的外源基因表达载体,或(D)可以组合导入包含DNA元件的外源基因表达载体和元件载体。
在宿主细胞中可以通过上述(B)或(D)中所述的组合进行外源基因的表达,根据例如Girod等的方法(Biotechnology and Bioengineering, 91, 2-11 (2005))和Otte等的方法(Biotechnol. Prog., 2007, 23, 801-807 (2007))。
转化的宿主细胞的实例可以包括真核细胞,其优选的实例包括哺乳动物细胞,并且更优选的实例包括衍生自人、小鼠、大鼠、仓鼠、猴或牛的细胞。这样的哺乳动物细胞的实例包括COS-1细胞、293细胞和CHO细胞(CHO-K1、DG44、CHO dhfr-、CHO-S),但是宿主细胞不限于其。
在本发明中,可以使用任何方法将表达载体导入宿主细胞,只要该方法允许导入的基因稳定地存在于所述宿主细胞中,并在其中充分表达。通常使用的方法的实例包括磷酸钙法(Ito 等, (1984) Agric. Biol. Chem., 48, 341)、电穿孔法(Becker, D. M. 等, 1990; Methods. Enzymol., 194, 182-187)、原生质体法(Creggh 等, Mol. Cell. Biol., 5, 3376 (1985))、醋酸锂法(Ito, H. (1983) J. Bacteriol. 153, 163-168)和脂质体转染法。
7. 产生外源蛋白的方法
在本发明中,可以通过下列产生外源蛋白:通过已知方法培养上述项目“6”中所述转化的细胞(其中已导入编码外源蛋白的基因),从所得培养产物中收集蛋白,随后纯化蛋白。如本文所用术语“培养产物”除了培养上清液之外还指培养的细胞或细胞匀浆。顺便提及,作为可使用上述项目“6”中所述转化细胞产生的外源蛋白,不仅可以选择单体蛋白,还可以选择多聚体蛋白。 在其中产生多个不同的亚基形成的异源多聚体蛋白的情况下,有必要分别向上述项目“6”所述宿主细胞中导入多个编码这些亚基的基因。
培养转化细胞的方法可以根据用于培养宿主细胞的常规方法进行。
在其中转化细胞是哺乳动物细胞的情况下,所述细胞在下列条件下培养,例如37℃和5%或8% CO2,进行约24至1000小时的培养时间。可以通过分批培养、补料分批培养、连续培养等在静置、摇动、搅拌或通气条件下进行培养。
编码来自上述培养产物(培养溶液)的外源蛋白的基因的表达产物的确认可以通过SDS-PAGE、Western分析、ELISA等进行。为了分离并纯化所产生的蛋白,可以使用常规蛋白分离和纯化方法。完成培养后,在其中目标蛋白在细胞内产生的情况下,使用超声波匀浆器、弗氏细胞压碎器、Manton-Gaulin匀浆器、DYNO-MILL等使细胞匀浆,从而获得靶蛋白。另外,在其中目标蛋白在细胞外产生的情况下,同样地使用培养溶液,或者通过离心等去除细胞。此后,通过提取等,使用有机溶剂收集目标蛋白,并且然后可以通过使用下列技术分离并纯化收集的目标蛋白,例如各种层析技术(疏水层析、反相层析、亲和层析、离子交换层析等),使用分子筛的凝胶过滤,或使用聚丙烯酰胺凝胶的电泳等,根据需要单独或者组合。
上述培养方法和纯化方法仅为实例,并且所述方法不限于其。可以通过已知的氨基酸分析技术例如使用Edman降解方法的自动氨基酸测序确认纯化的基因产物的氨基酸序列。
8. 产生抗体蛋白的方法
作为使用上述项目“7”中所述的生产方法产生的异源多聚体蛋白,抗体蛋白可以作为示例。抗体蛋白是四聚体蛋白,其包含两个重链多肽分子和两个轻链多肽分子。因此,为了获得以维持抗原结合亲和性状态的这样的抗体蛋白,有必要将重链和轻链基因导入上述项目“6”中所述的转化细胞。在这种情况下,所述重链和轻链基因表达单元可以存在于相同的表达载体或不同的表达载体上。
作为在本发明中产生的抗体,通过用所希望的抗原免疫实验动物例如兔子、小鼠或大鼠制备的抗体可以作为示例。并且,通过使用上述抗体作为起始材料获得的嵌合抗体和人源化抗体也可以作为本发明产生的抗体的示例。并且,使用遗传修饰的动物或噬菌体展示方法获得的人抗体也包括在本发明产生的抗体中。
产生抗体所使用的抗体基因不限于具有特定多核苷酸序列的抗体基因,只要从所述抗体基因转录和翻译的重链多肽和轻链多肽的组合具有结合给定抗原蛋白的活性。
并且,不一定所述抗体基因编码所述抗体的全长分子,并且可以使用编码所述抗体的功能片段的基因。这样的编码其功能片段的基因可以通过遗传修饰编码所述抗体蛋白的全长分子的基因来获得。
9. 用于其它外源蛋白的生产方法
除了上述抗体之外,使用本发明的生产方法产生的外源蛋白的实例还包括,各种衍生自人或非人的蛋白、其功能片段和其修饰的产物。这样的蛋白等的实例包括肽类激素,如心房利钠肽(ANP)、脑钠肽(BNP)、C-型钠尿肽(CNP)、加压素、促生长素抑制素、生长激素(GH)、胰岛素、催产素、生长素释放肽、瘦素、脂联素、肾素、降血钙素、骨保护素和胰岛素样生长因子(IGF);细胞因子,如白细胞介素、趋化因子、干扰素、肿瘤坏死因子(如TNF-α、TNF-β和TNF超家族)、神经生长因子(例如NGF)、细胞生长因子(如EGF、FGF、PDGF、HGF和TGF)、造血生长因子(如CSF、G-CSF和促红细胞生成素)和脂肪细胞因子;受体如TNF受体;酶,如溶菌酶、蛋白酶、蛋白水解酶和肽酶;其功能片段(具有部分或全部的原始蛋白的生物活性的片段)和包括任何这些蛋白的融合蛋白。但是,所述蛋白不限于其。
实施例
10. 实施例
在下文中,本发明将具体参照实施例进行描述。但是,这些实施例不限制本发明的技术范围。用于本发明的实施例的质粒、限制性酶、DNA修饰酶等是可商购获得的产品并且可以根据常规方法使用。此外,用于DNA克隆、多核苷酸测序、宿主细胞转化、转化的宿主细胞的培养、从所得培养产物的蛋白收集、蛋白纯化等的方法也可以是本领域技术人员熟知的并可以见于文献。
(实施例1)用于评价启动子活性的载体CMV/pSeapIRESpuro的构建
通过使用SEAP的表达作为指标进行启动子活性的评价,并且构建用于评价的载体。
1-1)通过PCR的SEAP的cDNA的扩增和限制性酶位点的添加
通过PCR扩增SEAP的cDNA,使用其中在紧接起始密码子上游添加NheI位点并在紧接终止密码子下游添加BglII位点的引物和KOD-Plus-(TOYOBO)。作为模板,使用pSEAP2-对照(Clontech)。所获得的片段用NheI和BglII消化并然后使用MinElute反应试剂盒(Qiagen)纯化。
所使用的引物:
1-2)CMV/pSeapIRESpuro的构建
pIRESpuro3 (Clontech)载体用NheI和BamHI消化后,通过连接反应将1-1)中制备的SEAP片段整合在其中。所获得的质粒命名为“CMV/pSeapIRESpuro”。
(实施例2)RPS7、RPL32和RPL34的启动子区域的克隆
作为认为包含具有高转录活性的启动子的人基因,通过使用mRNA水平作为指标选择EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHAE、ARPC2和SERBP1,并且进行每个基因的启动子区域的克隆。所获得的质粒用于实施例3中启动子活性的评价。
2-1)RPS7的启动子区域的克隆
作为RPS7的启动子区域,关于GenBank中登录号NM_001011.3下登记的mRNA序列,使用从位于RPS7的转录起始位点的上游约2kbp的核苷酸起始,并在紧接对应RPS7的起始密码子序列的核苷酸序列的上游的核苷酸结束的序列。
通过PCR使用大肠杆菌人工染色体克隆RP11-644P19(GenoTechs)作为模板扩增RPS7的启动子区域,并且还使用下列引物组和KOD -Plus- (TOYOBO),并然后使用MinElute反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用SpeI和NheI消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在SpeI-NheI位点整合RPS7的启动子区域,由此构建RPS7/pSeapIRESpuro。所克隆的RPS7的启动子区域的核苷酸序列由序列表中SEQ ID NO: 1表示。
RPS7的引物组:
2-2)RPL32的启动子区域的克隆
作为RPL32的启动子区域,关于GenBank中登录号NM_000994.3下登记的mRNA序列,使用从位于RPL32的转录起始位点的上游约2kbp的核苷酸起始,并在紧接对应RPL32的起始密码子序列的核苷酸序列的上游的核苷酸结束的序列。
使用大肠杆菌人工染色体克隆RP11-767C1 (GenoTechs)作为模板扩增RPL32的启动子区域,并且还使用下列引物组和KOD-Plus- (TOYOBO),并然后使用MinElute反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用SpeI和NheI消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在SpeI-NheI位点整合RPL32的启动子区域,由此构建RPL32/pSeapIRESpuro。所克隆的RPL32的启动子区域的核苷酸序列由序列表中SEQ ID NO: 2表示。
RPL32的引物组:
2-3)RPL34的启动子区域的克隆
作为RPL34的启动子区域,关于GenBank中登录号NM_033625.2下登记的mRNA序列,使用从位于RPL34的转录起始位点的上游约2kbp的核苷酸起始,并在紧接对应RPL34的起始密码子序列的核苷酸序列的上游的核苷酸结束的序列。
通过PCR使用大肠杆菌人工染色体克隆RP11-462C24(GenoTechs)作为模板扩增RPL34的启动子区域,并且还使用下列引物组和KOD-Plus- (TOYOBO),并然后使用MinElute反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用SpeI和NheI消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在SpeI-NheI位点整合RPL34的启动子区域,由此构建RPL34/pSeapIRESpuro。所克隆的RPL34的启动子区域的核苷酸序列由序列表中SEQ ID NO: 3表示。
RPL34的引物组:
2-4)其它人基因的启动子区域的克隆
根据上述2-1)中所述方法进行EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHA、ARPC2和SERBP1的各自启动子区域的克隆,由此构建包含克隆的多核苷酸的pSeapIRESpuro。
(实施例3)使用转染的CHO-K1多克隆细胞中SEAP的表达水平作为指标评价启动子活性
3-1)转染
CHO-K1细胞(ATCC)在5% CO2中在37℃下亚培养,使用包含10%超低IgG FBS(GIBCO)的F-12营养混合物培养基(GIBCO)。
以5 x 105细胞/孔将CHO-K1细胞接种到6孔培养板(IWAKI)上。在后一天,使用Lipofectamine 2000 (Invitrogen)转染实施例1)和2)中构建的CMV/pSeapIRESpuro、RPS7/pSeapIRESpuro、RPL32/pSeapIRESpuro、RPL34/pSeapIRESpuro等各2μg。
3-2)使用嘌呤霉素的抗生素选择
转染2天后,通过胰蛋白酶处理从6孔板收集细胞,所收集的细胞的总量接种到6cm皿(Nunc),并且以8μg/ml的最终浓度向培养基中添加嘌呤霉素(Clontech)。
3-3)使用转染的多克隆细胞系的评价
从开始抗生素选择开始,经过11天,用胰蛋白酶收集转染的多克隆细胞系,并且进行细胞计数。然后,以1 x 105细胞/孔将细胞接种到24孔培养板(IWAKI)上。经过24小时,收集培养物上清液,并且使用SensoLyteTM pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测量培养物上清液中SEAP的活性。在RPS7、RPL32和RPL34的各个启动子区域的控制下SEAP的活性高于充当对照的CMV启动子(CMV/pSeapIRESpuro)的控制下,并且SEAP的活性分别比对照的活性高1.7倍或更多,2.0倍或更多,和2.5倍或更多(图1)。同时,在EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHA、ARPC2和SERBP1的各个启动子区域控制下的SEAP的活性低于CMV启动子控制下的活性。
(实施例4)截短的启动子的克隆
通过用作RPS7、RPL32、RPL34的截短的启动子,从位于转录起始位点上游约1kb的核苷酸开始并在紧接对应于各个基因的起始密码子的核苷酸序列的上游结束的核苷酸序列(T1),和从位于转录起始位点上游约0.5kb的核苷酸开始并在紧接对应于各个基因的起始密码子的核苷酸序列的上游结束的核苷酸序列(T2),进行截短的启动子的克隆。
4-1)RPS7T1和RPS7T2的克隆
使用在2-1)中构建的RPS7/pSeapIRESpuro作为模板通过PCR扩增RPS7T1和RPS7T2,并且还使用下列引物组和KOD-Plus- (TOYOBO),并然后使用MinElute反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用SpeI和NheI消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在SpeI-NheI位点整合RPS7T1和RPS7T2各自的启动子区域,由此构建RPS7T1/pSeapIRESpuro和RPS7T2/pSeapIRESpuro。所克隆的RPS7T1和RPS7T2的启动子区域的核苷酸序列分别由序列表中SEQ ID NO: 4和5表示。
RPS7T1的引物组:
RPS7T2的引物组:
4-2)RPL32T1和RPL32T2的克隆
使用在2-2)中构建的RPL32/pSeapIRESpuro作为模板通过PCR扩增RPL32T1和RPL32T2,并且还使用下列引物组和KOD-Plus- (TOYOBO),并然后使用MinElute反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用SpeI和NheI消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在SpeI-NheI位点整合RPL32T1和RPL32T2各自的启动子区域,由此构建RPL32T1/pSeapIRESpuro和RPL32T2/pSeapIRESpuro。所克隆的RPL32T1和RPL32T2的启动子区域的核苷酸序列分别由序列表中SEQ ID NO: 6和7表示。
RPL32T1的引物组:
RPL32T2的引物组:
4-3)RPL34T1和RPL34T2的克隆
使用在2-3)中构建的RPL34/pSeapIRESpuro作为模板通过PCR扩增RPL34T1和RPL34T2,并且还使用下列引物组和KOD-Plus- (TOYOBO),并然后使用MinElute反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用SpeI和NheI消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在SpeI-NheI位点整合RPL34T1和RPL34T2各自的启动子区域,由此构建RPL34T1/pSeapIRESpuro和RPL34T2/pSeapIRESpuro。所克隆的RPL34T1和RPL34T2的启动子区域的核苷酸序列分别由序列表中SEQ ID NO: 8和9表示。
RPL34T1的引物组:
RPL34T2的引物组:
(实施例5)使用转染的CHO-K1多克隆细胞中SEAP的表达水平作为指标评价截短的启动子活性
5-1)转染
CHO-K1细胞(ATCC)在5% CO2中在37℃下亚培养,使用包含10%超低IgG FBS(GIBCO)的F-12营养混合物培养基(GIBCO)。
以2 x 105细胞/孔将CHO-K1细胞接种到6孔培养板(IWAKI)上。在后一天,使用Fugene 6 (Roche Applied Science)转染实施例1)、2)和4)中构建的CMV/pSeapIRESpuro、RPS7/pSeapIRESpuro、RPS7T1/pSeapIRESpuro、RPS7T2/pSeapIRESpuro、RPL32/pSeapIRESpuro、RPL32T1/pSeapIRESpuro、RPL32T2/pSeapIRESpuro、RPL34/pSeapIRESpuro、RPL34T1/pSeapIRESpuro和RPL34T2/pSeapIRESpuro各2μg。
5-2)使用嘌呤霉素的抗生素选择
转染2天后,通过胰蛋白酶处理从6孔板收集细胞,并且所收集的细胞的总量接种到6cm皿(Nunc),并且以8μg/ml的最终浓度向培养基中添加嘌呤霉素(Clontech)以开始抗生素选择。
5-3)使用转染的多克隆细胞系的评价
从开始抗生素选择开始,经过11天,用胰蛋白酶收集每个转染的多克隆细胞系,并且进行细胞计数。然后,以1 x 105细胞/孔将细胞接种到24孔培养板(IWAKI)上。经过24小时,收集培养物上清液,并且使用SensoLyte(注册商标)pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测量培养物上清液中SEAP的活性。测量结果显示在图2中。在每种截短的启动子的控制下SEAP的活性高于在充当对照的CMV启动子(CMV/pSeapIRESpuro)的控制下,并且从而,其显示这些启动子具有高于CMV启动子的启动子活性。
(实施例6)DNA元件的提取
(6-1)使用抗乙酰化的组蛋白H3抗体的染色质免疫沉淀
根据下列方法使用EZ ChIP(Upstate)进行使用抗乙酰化组蛋白抗体的ChIP。顺便提及,除非另有说明,Upstate的产品在下列方法中用作抗体、缓冲液等。
首先,使用GIBCO (注册商标) FreeStyleTM 293培养基(Invitrogen)在37℃和8% CO2的条件下培养293F细胞(Invitrogen),随后离心(1000rpm,5分钟,室温),由此收集生长阶段的细胞。在2 x 107个细胞在包含1%甲醛的培养基中搅拌10分钟后,向其中添加10x甘氨酸,随后在室温搅拌5分钟。离心(3000rpm,5分钟,4℃)后,去除上清,并且向细胞沉淀中添加PBS以悬浮细胞。然后,再次离心细胞悬浮液以去除PBS,并且此后向细胞沉淀添加SDS裂解缓冲液以悬浮和裂解细胞。通过细胞裂解获得的每种样品使用超声波匀浆器(BRANSON)进行DNA片段化,同时用冰水冷却样品,并向其中添加包含蛋白酶抑制剂混合物的稀释缓冲液和固定有蛋白G的琼脂糖。所得混合物在4℃搅拌1小时,随后离心,并然后收集上清液。随后,向其中添加10 μg正常兔IgG或α-乙酰组蛋白H3抗体,随后在4℃搅拌过夜。向所得溶液中添加固定有蛋白G的琼脂糖,并且所得混合物在4℃搅拌1小时,随后离心,并然后收集沉淀。这样获得的沉淀用低盐免疫复合物清洗缓冲液清洗两次,用高盐免疫复合物清洗缓冲液清洗两次,用LiCl免疫复合物清洗缓冲液清洗两次,并最后用TE缓冲液清洗4次。然后向其中添加洗脱缓冲液(包含20 μl 1 M碳酸氢钠、10 μl SDS和170 μl无菌水)。经过30分钟后,离心混合物,并且收集上清液。
随后,向上清液中添加5M氯化钠,并且所得混合物在65℃加热过夜。然后向其中添加RNA酶,并且所得混合物在37℃孵育30分钟。然后向其中添加0.5M EDTA、1M Tris-HCl和蛋白酶K,并且所得混合物在45℃孵育2小时。
最后,以比通过用蛋白酶K处理获得的溶液高5倍的量向其中添加试剂A、B和C,随后使用旋转过滤器离心(10000rpm,30秒,室温),由此纯化染色质免疫沉淀的DNA。
(6-2)微阵列分析
通过使用GenomePlex完整全基因组扩增(WGA)试剂盒(Sigma),扩增(6-1)中获得的每种ChIP样品。方法根据伴随试剂盒的Sigma的方案。
为了证实ChIP,通过使用320ng通过WGA扩增的每种DNA作为模板,并还使用下列引物和SYBR(注册商标)Premix Ex TaqTM (Perfect Real Time) (TAKARA),通过PCR法(95℃进行5秒和60℃进行20秒 x 45个循环)内部扩增磷酸甘油醛脱氢酶(GAPDH)基因。顺便提及,GAPDH是用作阳性对照的持家基因,以证实DNA元件是否通过ChIP富集,并且PCR方法使用EZ ChIP (Upstate)所附的引物进行。
结果证实在用抗乙酰化组蛋白H3抗体进行免疫沉淀的样品中GAPDH被特异性扩增(图3)。通过WGA扩增的每种DNA样品进行微阵列分析(NimbleGen)以进行芯片上染色质免疫沉淀(芯片上ChIP)。“芯片上ChIP”是用于通过使在(6-1)中富集的DNA进行微阵列分析鉴定每种DNA元件的技术。
(6-3)DNA元件的提取
基于(6-2)中获得的芯片上ChIP分析的结果,提取了具有62%或更多的AT含量的5个序列。
A2: 染色体 15 (80966429至80974878)
A7: 染色体 11 (88992123至89000542)
A18: 染色体 4 (111275976至111284450)
B5: 染色体 1 (143034684至143043084)
C14: 染色体 11 (46089056至46097482)。
(实施例7)
使用分泌型碱性磷酸酶(SEAP)的表达作为指标的DNA元件的效果
(7-1)SEAP表达载体的构建
通过使用pSEAP-对照(Clontech)作为模板,通过PCR法((94℃持续30秒,和68℃持续2分钟 x 40 个循环)使用下列引物和KOD -Plus- (TOYOBO)扩增SEAP基因。
随后,通过琼脂糖凝胶电泳分离扩增的SEAP片段,并从凝胶上切下,然后使用QIAquick凝胶提取试剂盒(Qiagen)纯化。这样获得的DNA片段用作插入片段。用限制性酶NheI和BglII消化插入片段,并且用限制性酶NheI和BamHI消化载体pIRES hyg3(Clontech)。所获得的DNA片段进行琼脂糖凝胶电泳以分别分离目标片段,并且将目标片段从凝胶上切下,然后纯化。然后,进行连接反应和转化。使用LigaFast Rapid DNA连接系统(Promega)进行连接反应。如下进行转化。首先融化冷冻的细胞JM109(TAKARA),将连接反应后获得的10 μl溶液添加到融化细胞的溶液中,并将所得混合物在冰上放置30分钟。随后,对混合物应用热休克(42℃, 45秒)并将混合物在冰上冷却5分钟。向此细胞悬浮液中添加1ml LB培养基,并将所得混合物在37℃摇动1小时。然后将混合物铺板在包含0.1 mg/ml氨苄青霉素的LB平板上,并将板在37℃孵育14至16小时。此后,通过碱裂解,从LB平板上培养的克隆收集目标质粒。最后,确定通过碱裂解获得的质粒中SEAP的多核苷酸序列,由此构建pCMV/SEAP ires Hygro。
(7-2)DNA元件的克隆
随后,使用BAC SUBCLONING试剂盒(Gene Bridges)从包含对应插入到(7-1)中获得的SEAP表达载体的DNA元件的多核苷酸序列的细菌人工染色体(BAC)克隆实施例6中提取的各个DNA元件。
首先,用限制性酶SpeI消化(7-1)中获得的pCMV/SEAP ires Hygro几个小时,随后进行乙醇沉淀,并且将沉淀物溶解在无菌水中。通过使用用SpeI消化的载体作为模板,使用下列引物和KOD -Plus- (TOYOBO)进行PCR法(94℃持续15秒,55℃持续30秒,和68℃持续10分钟 x 30 个循环)。
使用部分反应溶液通过琼脂糖凝胶电泳证实扩增之后,将剩余的反应溶液进行乙醇沉淀。沉淀溶解在无菌水中并使用所得溶液作为用于转化的DNA。
随后,进行用于转化的大肠杆菌的制备。
对应在实施例6中提取的5个序列的BAC克隆如下。
[表1]
已融化的10 μl上述BAC克隆(Advanced GenoTechs Co.)接种到1ml培养基(包含15 μg/ml终浓度的氯霉素)并在37℃孵育过夜。将30 μl培养溶液转移到1.4ml培养基(包含15 μg/ml终浓度的氯霉素)并在37℃孵育2小时。重复两次离心和无菌水洗涤,并将细胞悬浮到20 μl无菌水中。向冷却的比色杯(0.1 cm)中添加1 μl pRED/ET (Gene Bridges)和大肠杆菌,然后进行电穿孔(1350 V, 10 μF)。然后向其中添加1ml的SOC培养基,并且所得混合物在30℃孵育70分钟。将100 μl培养溶液铺板到LB平板上(包含终浓度分别为3 μg/ml和15 μg/ml的四环素和氯霉素),并且在30℃孵育过夜。在第二天,这样获得的每个克隆接种到1ml培养基(包含终浓度分别为3 μg/ml和15 μg/ml的四环素和氯霉素),并且在30℃孵育过夜。将30 μl培养溶液转移到1.4ml培养基(包含终浓度分别为3 μg/ml和15 μg/ml的四环素和氯霉素),并且在30℃孵育2小时。然后向其它添加50 μl 10%的L-阿拉伯糖,并进一步在37℃进行孵育1小时。此后,用无菌水洗涤重复两次,并且向冷却的比色杯(0.1cm)中添加悬浮在30 μl无菌水中的大肠杆菌和1 μl用于转染的DNA,然后进行电穿孔(1350 V, 10 μF)。然后向其中添加1ml的SOC培养基,并且所得混合物在37℃孵育90分钟。培养物溶液的总量铺板到LB平板(包含100 μg/ml氨苄青霉素)上,并孵育该平板。此后通过碱裂解获得目标质粒。最后,证实所获得的质粒的序列和其限制性酶位点,由此构建目标质粒(图4)。
(7-3)使用SEAP表达作为指标的评价
使用宿主细胞CHO-K1(ATCC)和转染试剂Lipofectamine 2000(Invitrogen)评价(7-2)中构建的各个质粒。
在转染后2天开始用800 μg/ml的潮霉素进行抗生素选择进行约2周,由此建立稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定数目的细胞接种到24孔板(IWAKI)上。在细胞铺板24小时后,收集培养物上清液,并且测量SEAP的活性。使用SensoLyteTM pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测量培养物上清液中SEAP的活性。
测量结果显示在图5中。当将不具有元件的对照中SEAP的活性归一化为1时,具有DNA元件A2、A7、A18、B5或C14的稳定表达的CHO细胞系的培养物上清液中SEAP的活性显示比对照的值高5倍或更多的数值。基于该结果,证实了所有5个类型的DNA元件显著增强SEAP表达。顺便提及,上述5个类型的DNA元件的多核苷酸分别由序列表中SEQ ID NO: 10至14表示。
(实施例8)组合使用的启动子的一般性
在实施例7中DNA元件的评价中使用的载体的启动子是CMV启动子,并且从而研究了与其它一般启动子组合的DNA元件的使用。
(8-1)使用EF-1α和SV40启动子的SEAP表达载体的构建
通过使用pSEAP2-对照(Clontech)作为模板,通过PCR法((94℃持续30秒和68℃持续2分钟 x 40 个循环)使用(7-1)中所述引物和KOD -Plus-扩增SEAP基因。与(7-1)中相同的方式制备扩增的SEAP基因作为插入片段。用限制性酶NheI和BglII消化插入片段并且用限制性酶NhiI和BamHI消化pIRES puro3载体(Clontech),并且如(7-1)中相同的方式构建pCMV/SEAP ires Puro。
随后,通过使用pEF1/V5-His A (Invitrogen)作为模板,通过PCR法(94℃持续15秒,60℃持续30秒和68℃持续2分钟 x 30 个循环)使用下列引物和KOD -Plus-扩增EF-1α启动子。
通过使用上面构建的pCMV/SEAP ires Puro作为载体,对载体和启动子用限制性酶SpeI和EcoRV进行消化,并且根据(7-1)中所述的方法构建pEF/SEAP ires Puro。
类似地,通过使用pcDNA3.1+ (Invitrogen)作为模板,通过PCR法(94℃持续15秒,60℃持续30秒和68℃持续1分钟 x 30 个循环)使用下列引物和KOD -Plus-扩增SV40启动子。
通过使用上面构建的pCMV/SEAP ires Puro作为载体,对载体和启动子用限制性酶SpeI和EcoRV进行消化,并且根据(7-1)中所述的方法构建pSV40/SEAP ires Puro。
(8-2)DNA元件A2或A7的克隆
随后,使用在(8-1)中构建的pEF/SEAP ires Puro和pSV40/SEAP ires Puro作为基本结构进行DNA元件A2或A7的克隆。
首先,用限制性酶SpeI消化pEF/SEAP ires Puro和pSV40/SEAP ires Puro几个小时,随后进行乙醇沉淀,并且将沉淀物溶解在无菌水中。通过使用用SpeI消化的相应载体作为模板,通过PCR法(94℃持续15秒,55℃持续30秒,和68℃持续10分钟 x 30 个循环)使用下列引物和KOD -Plus-制备用于转染的DNA。
通过使用这样制备的用于转染的DNA和用pRed/ET转染的BAC,将DNA元件A2或A7克隆到(8-1)中所述的载体中。顺便提及,根据(7-2)中所述的方法进行该方法。
(8-3)使用SEAP表达作为指标的评价
使用宿主细胞CHO-K1(ATCC)和转染试剂Lipofectamine 2000(Invitrogen)评价(8-2)中构建的各个质粒。
在转染后2天开始用8 μg/ml的嘌呤霉素进行抗生素选择进行约2周,由此建立稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定数目的细胞接种到24孔板上。在细胞铺板24小时后,收集培养物上清液,并且测量SEAP的活性。使用SensoLyteTM pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测量培养物上清液中SEAP的活性。
测量结果显示在图6中。当在无元件的对照中SEAP的活性归一化为1时,DNA元件A2或A7展示增强表达的效果使得SEAP的活性比对照的活性在使用EF-1α启动子的情况下高两倍或更多,在使用SV40启动子的情况下高4倍或更多。基于这些结果,证实当与一般启动子组合使用时,这些DNA元件展示增强外源基因表达的效果。
(实施例9)使用抗体表达作为指标的评价
(9-1)人轻链表达载体pEF6KCL的构建
通过使用质粒pEF6/V5-HisB (Invitrogen)作为模板,通过PCR使用下列引物和KOD -Plus-获得位置2174(紧接BGHpA的下游)和位置2958(SmaI)之间的DNA片段(包含fl复制起始和SV40启动子和复制起始的DNA片段,下文称为“片段A”,片段A的多核苷酸序列由序列表中SEQ ID NO: 15表示)。
通过重叠PCR连接所获得的片段A和包含编码人κ链分泌信号、人κ链恒定区和人多聚(A)附加信号的DNA序列的DNA片段(下文称为“片段B”)。这样获得的其中连接了片段A或片段B的DNA片段用限制性酶KpnI和SmaI消化,并且将所获得的片段连接到质粒pEF6/V5-HisB (Invitrogen),其用限制性酶KpnI和SmaI消化,由此构建在EF-1α启动子下游具有信号序列、克隆位点、人κ链恒定区和人多聚(A)附加信号序列的人轻链表达载体pEF6KCL。
将通过用限制性酶KpnI和SmaI消化上述方法制备的pEF6KCL获得的DNA片段连接到pEF1/myc-HisB (Invitrogen)(其用KpnI和SmaI消化),然后转化,碱裂解和测序,由此构建质粒pEF1KCL。
(9-2)人重链表达载体pEF1FCCU的构建
包含编码人IgG1信号序列和恒定区氨基酸序列的DNA序列的DNA片段(此DNA片段的多核苷酸序列由序列表中SEQ ID NO: 16表示)用限制性酶NheI和PmeI消化,并且将所得片段连接到用NheI和PmeI消化的质粒pEF1KCL,由此构建在EF-1α 启动子的下游具有信号序列、克隆位点、人重链恒定区和人多聚(A)附加信号序列的人重链表达载体pEF1FCCU。
(9-3)单人源化抗体基因X表达载体(人源化的抗体基因X/pEF_LHN#)的构建
通过连接(9-1)或(9-2)中构建的L链或H链表达载体,构建单抗体表达载体(pEF_LHN (缺少可变区))。
通过PCR法向基因表达单元的两端添加限制性酶SalI位点:一个在启动子的上游,并且另一个在pEF1KCL的多聚(A)的下游。然后进行琼脂糖凝胶电泳,从凝胶切出所需的DNA片段,并且纯化DNA片段,由此制备插入片段。通过用限制性酶SalI消化(9-2)中构建的载体pEF1FCCU,在位于所述基因表达单元上游的SalI位点线性化该载体。然后,将线性化的载体连接到上述插入片段,然后转化,碱裂解和测序,由此构建单人源化抗体表达载体(pEF_LHN (缺少可变区))。
随后,将下列寡核苷酸导入载体pEF_LHN (缺少可变区)的AatII位点。
将相应的寡核苷酸稀释到5 pmol,并通过使用T4多核苷酸激酶(TAKARA),使得反应在37℃进行1小时。然后向其添加10x H缓冲液(TAKARA),并且通过在96℃反应1分钟和然后在室温反应30分钟进行退火。连接这些寡核苷酸和用限制性酶AatII消化的载体pEF_LHN,然后转化,碱裂解和测序,由此构建pEF_LHN#(缺少可变区)。
通过将人源化抗体基因X的可变区整合到上面构建的通用载体(pEF_LHN#(缺少可变区)),完成单人源化抗体基因X表达载体(人源化抗体基因X/pEF_LHN#)的构建。
首先,通过使用下列引物和KOD -Plus-,通过PCR法(94℃持续15秒,55℃持续30秒和68℃持续1分钟 x 30个循环)扩增人源化抗体基因X的L链可变区。
L链可变区:
扩增的L链可变区片段和通用载体(pEF_LHN#(缺少可变区))用限制性酶NdeI和BsiWI消化,随后进行琼脂糖凝胶电泳,将所需片段从凝胶上切出,纯化,连接反应,转化,碱裂解和测序,由此将所述L链可变区整合到载体中。以相同的方式,通过使用下列引物和KOD -Plus-,通过PCR法(94℃持续15秒,55℃持续30秒和68℃持续1分钟 x 30个循环)扩增人源化抗体基因X的H链可变区。
H链可变区:
扩增的H链可变区片段和其中插入L链可变区的载体用限制性酶BlpI消化,随后进行琼脂糖凝胶电泳,将所需片段从凝胶上切出,纯化,连接反应,转化,碱裂解和测序,由此将所述H链可变区整合到载体中,并且构建单人源化抗体基因X表达载体(人源化抗体基因X/pEF_LHN#)。
(9-4)单人源化抗体基因X表达载体(人源化的抗体基因X/pCMV_LHN#)的构建
通过使用(9-3)中构建的单人源化抗体基因X表达载体(人源化的抗体基因X/pEF_LHN#)作为基本载体结构,通过根据下列方法替换启动子构建另一个单人源化抗体基因X表达载体(人源化的抗体基因X/pCMV_LHN#)。
通过使用pIRES puro3作为模板,通过PCR法(94℃持续30秒,和68℃持续3分钟 x 40 个循环)使用下列引物和KOD -Plus-扩增CMV启动子片段。
H链的上游:
L链的上游:
向PCR反应溶液中添加限制性酶DpnI,并使得反应在37℃进行1小时,随后使用MinElute reaction Cleanup试剂盒(Qiagen)纯化,由此制备用于在In-Fusion中使用的样品。同时,用限制性酶HindIII、NheI、NdeI和FseI消化人源化抗体基因X/pEF_LHN#,随后进行琼脂糖凝胶电泳,由此在所得的片段中分离两个大片段。将每个片段从凝胶上切出,并从凝胶提取DNA,由此制备用于在In-Fusion中使用的样品。将所有用于In-Fusion的样品合并,并且使用In-FusionTM Advantage PCR Cloning试剂盒(TAKARA)进行克隆,随后进行转化,碱裂解和测序,由此构建单人源化抗体基因X表达载体(人源化抗体基因X/pCMV_LHN#)。
(9-5)DNA元件A7的克隆
从已证实具有增强SEAP表达效果的5种类型的DNA元件中选择A7,并克隆到抗体表达载体中。
如(7-2)中相同的方式,通过使用用限制性酶NotI消化的每种单人源化抗体基因X表达载体(人源化抗体基因X/pEF_LHN#和人源化抗体基因X/pCMV_LHN#)作为模板,通过PCR法(94℃持续15秒,55℃持续30秒和68℃持续11分钟 x 30 个循环)使用下列引物和KOD -Plus-制备用于转染的DNA。
人源化抗体基因X/pEF_LHN# D:
人源化抗体基因X/pEF_LHN# R:
人源化抗体基因X/pCMV_LHN# D:
使用人源化抗体基因X/pEF_LHN# D。
人源化抗体基因X/pCMV_LHN# R:
使用人源化抗体基因X/pEF_LHN# R。
通过使用上面制备的用于转染的DNA和用pRed/ET转染的BAC,将DNA元件A7克隆到(9-3)和(9-4)中所述的单人源化抗体基因X表达载体中。图7中显示了载体构建的示意图。顺便提及,根据(7-2)中所述的方法进行该方法。
(9-6)使用抗体表达作为指标的评价
使用宿主细胞CHO-K1(ATCC)和转染试剂Lipofectamine 2000(Invitrogen)评价(9-5)中构建的各个质粒。
在转染后2天开始用800 μg/ml的遗传霉素(Roche) 进行抗生素选择进行约2周,由此建立稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定数目的细胞接种到24孔板上。细胞铺板24小时后,收集培养上清液,通过ELISA法测量培养物上清液中抗体表达水平。顺便提及,如下进行ELISA。在包被50 ng/孔的抗κ轻链的96孔板中,将100 μl无细胞培养物上清液加入到各孔中,并将板在37℃孵育1小时。顺便提及,去除样品(培养物上清液),并且每孔用200 μl PBS-吐温(0.05%)洗涤。然后,向每孔中添加100 μl HRP-标记的抗人IgG(Fc),并且将板在37℃孵育另外1小时。此后,去除HRP标记的抗人IgG(Fc),并且每孔用用PBS-吐温(0.05%)洗涤。然后使用POD底物ABTS试剂盒(Nacalai)显色,并且测量在405nm的测量波长的吸收。对于抗κ轻链、所述抗人IgG(Fc)和样品的稀释,使用PBS-吐温(0.05%)。通过使用系列稀释到12ng、6ng、3ng、1.5ng、0.75ng、0.375ng和0.1875ng的人IgG作为标准品,计算样品的浓度。
结果显示在图8中。证实了当在抗体表达载体中使用EF-1α启动子或CMV启动子时,具有DNA元件A7的样品相比无元件的对照具有更好的增强抗体产生的效果。
(实施例10)展示增强外源基因表达活性的序列的长度
(10-1)具有不同序列长度的DNA元件的克隆
基于实施例7中使用的序列的长度,构建包含每种DNA元件但具有不同序列长度的载体。
基于DNA元件A2、A7、A18、B5和C14各自全长设计的具有不同序列长度的DNA元件的细节分别显示在图9、11、13、15和17中。首先,用限制性酶SpeI消化(7-1)中所述pCMV/SEAP ires Hygro几个小时,随后进行乙醇沉淀,并且将沉淀物溶解在无菌水中。通过使用用SpeI消化的载体作为模板,通过PCR法((94℃持续15秒,55℃持续30秒,和68℃持续10分钟 x 30 个循环)使用下列引物和KOD -Plus- 制备用于转染的DNA。通过使用这样制备的用于转染的DNA和相应的用pRed/ET转染的BAC,将具有不同序列长度的每种DNA元件克隆到(7-1)中所述的pCMV/SEAP ires Hygro 中。顺便提及,根据(7-2)中所述的方法进行该方法。
对于A2的相应片段的多核苷酸序列,A2-1对应序列表中SEQ ID NO: 10的核苷酸1至3000的多核苷酸序列;A2-2对应序列表中SEQ ID NO: 10的核苷酸2801至5800的多核苷酸序列;A2-3对应序列表中SEQ ID NO: 10的核苷酸5401至8450的多核苷酸序列;A2-4对应序列表中SEQ ID NO: 10的核苷酸701至2700的多核苷酸序列;A2-5对应序列表中SEQ ID NO: 10的核苷酸701至2200的多核苷酸序列;A2-6对应序列表中SEQ ID NO: 10的核苷酸701至3700的多核苷酸序列;A2-7对应序列表中SEQ ID NO: 10的核苷酸2001至5000的多核苷酸序列;A2-8对应序列表中SEQ ID NO: 10的核苷酸4001至7000的多核苷酸序列;A2-9对应序列表中SEQ ID NO: 10的核苷酸1至3700的多核苷酸序列;A2-10对应序列表中SEQ ID NO: 10的核苷酸2001至5800的多核苷酸序列;A2-11对应序列表中SEQ ID NO: 10的核苷酸2801至7000的多核苷酸序列;A2-12对应序列表中SEQ ID NO: 10的核苷酸701至5800的多核苷酸序列;A2-13对应序列表中SEQ ID NO: 10的核苷酸2001至7000的多核苷酸序列;A2-14对应序列表中SEQ ID NO: 10的核苷酸2801至8450的多核苷酸序列;A2-15对应序列表中SEQ ID NO: 10的核苷酸1至5800的多核苷酸序列;A2-16对应序列表中SEQ ID NO: 10的核苷酸701至7000的多核苷酸序列;A2-17对应序列表中SEQ ID NO: 10的核苷酸2001至8450的多核苷酸序列。
对于A7的相应片段的多核苷酸序列,A7-1对应序列表中SEQ ID NO: 11的核苷酸601至3600的多核苷酸序列;A7-2对应序列表中SEQ ID NO: 11的核苷酸3601至8420的多核苷酸序列;A7-3对应序列表中SEQ ID NO: 11的核苷酸5401至8420的多核苷酸序列;A7-4对应序列表中SEQ ID NO: 11的核苷酸3401至6400的多核苷酸序列;A7-5对应序列表中SEQ ID NO: 11的核苷酸1501至4500的多核苷酸序列;A7-6对应序列表中SEQ ID NO: 11的核苷酸4401至7400的多核苷酸序列;A7-7对应序列表中SEQ ID NO: 11的核苷酸2401至5400的多核苷酸序列;A7-8对应序列表中SEQ ID NO: 11的核苷酸1至3600的多核苷酸序列;A7-9对应序列表中SEQ ID NO: 11的核苷酸1501至5400的多核苷酸序列;A7-10对应序列表中SEQ ID NO: 11的核苷酸2401至6400的多核苷酸序列;A7-11对应序列表中SEQ ID NO: 11的核苷酸3401至7400的多核苷酸序列;A7-12对应序列表中SEQ ID NO: 11的核苷酸4401至8420的多核苷酸序列;A7-13对应序列表中SEQ ID NO: 11的核苷酸1至5400的多核苷酸序列;A7-14对应序列表中SEQ ID NO: 11的核苷酸1501至6400的多核苷酸序列;A7-15对应序列表中SEQ ID NO: 11的核苷酸2401至7400的多核苷酸序列;A7-16对应序列表中SEQ ID NO: 11的核苷酸3401至8420的多核苷酸序列;A7-17对应序列表中SEQ ID NO: 11的核苷酸1至6400的多核苷酸序列;A7-18对应序列表中SEQ ID NO: 11的核苷酸1501至7400的多核苷酸序列。
对于A18的相应片段的多核苷酸序列,A18-1对应序列表中SEQ ID NO: 12的核苷酸1至5040的多核苷酸序列;A18-2对应序列表中SEQ ID NO: 12的核苷酸1001至6002的多核苷酸序列;A18-3对应序列表中SEQ ID NO: 12的核苷酸2001至7000的多核苷酸序列;A18-4对应序列表中SEQ ID NO: 12的核苷酸3000至7000的多核苷酸序列。
对于B5的相应片段的多核苷酸序列,B5-1对应序列表中SEQ ID NO: 13的核苷酸1至4001的多核苷酸序列;B5-2对应序列表中SEQ ID NO: 13的核苷酸1至3200的多核苷酸序列;B5-3对应序列表中SEQ ID NO: 13的核苷酸2491至5601的多核苷酸序列;B5-4对应序列表中SEQ ID NO: 13的核苷酸5373至8401的多核苷酸序列;B5-5对应序列表中SEQ ID NO: 13的核苷酸901至4001的多核苷酸序列;B5-6对应序列表中SEQ ID NO: 13的核苷酸4001至7000的多核苷酸序列。
对于C14的相应片段的多核苷酸序列,C14-1对应序列表中SEQ ID NO: 14的核苷酸960至4015的多核苷酸序列;C14-2对应序列表中SEQ ID NO: 14的核苷酸1987至5014的多核苷酸序列;C14-3对应序列表中SEQ ID NO: 14的核苷酸4020至7119的多核苷酸序列;C14-4对应序列表中SEQ ID NO: 14的核苷酸960至8141的多核苷酸序列;C14-5对应序列表中SEQ ID NO: 14的核苷酸960至6011的多核苷酸序列;C14-6对应序列表中SEQ ID NO: 14的核苷酸4939至8141的多核苷酸序列;C14-7对应序列表中SEQ ID NO: 14的核苷酸960至5014的多核苷酸序列;C14-8对应序列表中SEQ ID NO: 14的核苷酸2994至7119的多核苷酸序列;C14-9对应序列表中SEQ ID NO: 14的核苷酸4020至8141的多核苷酸序列;C14-10对应序列表中SEQ ID NO: 14的核苷酸1至5014的多核苷酸序列;C14-11对应序列表中SEQ ID NO: 14的核苷酸1987至7119的多核苷酸序列;C14-12对应序列表中SEQ ID NO: 14的核苷酸2994至8141的多核苷酸序列;C14-13对应序列表中SEQ ID NO: 14的核苷酸960至7119的多核苷酸序列;C14-14对应序列表中SEQ ID NO: 14的核苷酸1987至8141的多核苷酸序列。
全长序列上的相应片段的起始和终止点也显示在图20和21中。
(10-2)具有不同序列长度的DNA元件的评价
使用宿主细胞CHO-K1(ATCC)和转染试剂Lipofectamine 2000评价(10-1)中构建的各个质粒。
以与(7-3)相同的方式,在转染后用潮霉素进行抗生素选择,由此建立稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定数目的细胞接种到24孔板上。在细胞铺板24小时后,收集培养物上清液,并且测量SEAP的活性。
测量结果显示在图10、12、14、16和18中。其证实不仅全长DNA元件,还有具有比全长更短的序列长度的克隆都具有增强表达的效果。基于结果,证实DNA元件A2、A7、A18、B5和C14具有增强外源基因表达的活性,即使在其中它们具有比全长更短的序列长度的情况下。但是,当序列长度是全长时它们展示最高的效果。
(实施例11)使用CHO细胞系之外的宿主细胞的效果
使用CHO细胞系作为实施例7至10评价中的细胞系。但是在实施例11 中,选择HEK293细胞系作为CHO细胞系之外的细胞系。在37℃存在5%CO2的情况下将HEK293细胞系进行静态培养,使用包含10%FCS的DMEM培养基(Invitrogen),并且在转染前一天将给定数目的细胞接种到6孔板上。为了评价包含(8-2)中构建的每种DNA元件的SEAP表达载体,使用每种质粒和转染试剂Lipofectamine 2000 (Invitrogen)进行转染。在转染后2天开始用潮霉素进行抗生素选择进行约2周,由此建立稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定数目的细胞接种到24孔板上。在细胞铺板24小时后,收集培养物上清液,并且测量SEAP的活性。使用SensoLyteTM pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测量培养物上清液中SEAP的活性。
测量结果显示在图19中。以与实施例3中相同的方式,证实了每种DNA元件在HEK293细胞系中也高度有效增强外源基因(SEAP)的表达。
工业应用性
通过使用根据本发明的启动子或根据本发明的外源基因表达载体,将外源基因表达单元导入哺乳动物宿主细胞,可能改善治疗性蛋白、抗体等的外源基因的产生。
序列表
<110> DAIICHI SANKYO COMPANY, LIMITED
<120> 衍生自人基因的启动子
<130> DSPCT-FP1232
<160> 16
<170> PatentIn 版本 3.4
<210> 1
<211> 2348
<212> DNA
<213> 智人
<400> 1
atttatgtat attaacagca cattaacagc taaaaagaaa aactcacata atcatattag 60
ttcatagaaa caatgcattt gacatactcc aacatccatt catgatttta ttttattttg 120
tatttatata ttttttttga gatggagtct cgctgtcacc caggctggag tgcaatggct 180
cgatctcggc tcactgcagg ctccgccccc ggcggttcac gccattctcc tgcctcagcc 240
tcccgagtag ctgggactac aggcgcccgc cacctcgccc agctaatttt ttgtattttt 300
agtagagacg gggtttcacc gtgttagcca ggatggtctc gatctcctga cctcgtgatc 360
cacccgcctc ggcctcccaa agtgctggga ttacaggcgt gagccaccgt gcccggccca 420
tgattttaaa aaaacctctc agaaatagaa acagagggaa cttcctgaat ttgattaaaa 480
atacctgcaa aatcctagag ctaatattat acttaatggt gaaagactga atggttttcc 540
cctaagatgg agaacaaggc acggatgtcc ttgctcacca ctcctattca acaaaggact 600
ggaaaccaga aataacttta attttttttt ttctcaagtg ataggttcac agagaaaaag 660
ctttactgga tgaactttta gattactact tttatagagc agcagagata aaagccaggt 720
cgaaaagtgc atgtggagta aggaaatgga cctagttcga caaaagggct cagaacgact 780
gcccagatga gattgtagac gcagctgtag tttactttct atctggaaga aacttcaagt 840
tatccttaat tttccaagga gacagtcact taccttttaa aaaacattat tagagaagca 900
ccgggcggga gcatatctag cattaaaaat gtgggatgaa taccatctct gcttggtaaa 960
ggtggttggg aatcctgaga gagggcacct agtgtggctt ctgcattttt cacagtgcct 1020
ggaccacggc tgaaagtaac tcttgcatga catttgacag aagaggaaac cgaagctcag 1080
attaaattcc ctgtccacag cgggatcatt cggcacgagt tcctccctgt ctggaatgct 1140
cttccccagc aatagatcct gcggctcttc cgtgtctcag tctaatgtca ttccgttcca 1200
ggattcccga cttcttaaag cataaataat ccctccccac cctctcattg tactgttatg 1260
taacttatta caatatgtca ttatatattt agtcatactg ctttaggtaa tgtcttctcc 1320
actgaactgt aagctccatg agggcaagag ttcagtcggt tttacttaat aattagcacc 1380
tagtacagta ctagcataga atgaaggcct cgcaattttt tttaaattta tttttagaca 1440
gggtcttgcg ctgtcgccca ggctggagtg cagtggtgca acctcggctc acggcagcct 1500
cgacctttcg gctccagcga tcctcccgcg tcggcctccg gggtagctgg gactgcaggc 1560
gcgcaccacc atgactggct aatttttttt tttttttttt tgtagacatg gggtctcgcc 1620
atgttgccca ggctggttcc tgagctcaag tgatcctcct gcctcggcct cccaaagtgc 1680
tgggattaca ggcgtgagcc tcagcgccca gccaagttag ccttttttaa acgtcctgtc 1740
tccggaggtt gccgaagttg gttttcttcg gcctccttct ctctcccagg cccagggctg 1800
ggacgaggcc ggttcccgcc tgcaacctgc actgaagacg ggaaccttgg gagccggtac 1860
cggaacgctc ggaaacggca ccaaagtacg aatcctaggg cggaaaagcg ttaccaagac 1920
actcgtcccc agagccgctt cctgggactc tctagcctcc taccgcttct cagtgatgtt 1980
ccggtttccg ccctcctcct cgcgctgttt ccgcctcttg ccttcggacg ccggattttg 2040
acgtgctctc gcgagatttg ggtctcttcc taagccggcg ctcggcaagg taggttggcg 2100
gcctgctctc cgacagaact tttcttcttg ggttgaggaa aacgcctttt ggagtcaggc 2160
cctggagggg cgagccttgc tcacagggtg gggatacagc cgattacccg ccctgtgctt 2220
tccgatggct tctgcggggc gagcggggcc tggccggggg gtgcgggcgg gagggcgagc 2280
cagcggcgcc tgcagcccgg gccgcgtaac gctgaccgct gtgccttcag ttctcccagg 2340
agaaagcc 2348
<210> 2
<211> 3345
<212> DNA
<213> 智人
<400> 2
ctaaagtgat tcctaaagaa ttcttccctt ttatcacttc cagtaggcct ctgtgaaacc 60
aaatctacct ccgcttacaa gaaagatgct gggctggcct tctctcaaag tctttccaaa 120
cttttcttgg cattgactta gacaccctag gaatctaact tgagaaaatg ttttcattaa 180
aaaaaatctc aggaagtaaa acctcctgaa tgattactga gttgacataa atcttatgtg 240
tatattctta tcagaaaaaa agtatcttca ttttgtggga caccaattca tgtattatta 300
ttattttgag acaaagtttc gctcttgttg cccaggctgg agtgcaatgg cgcgatctcc 360
acttactgca acctccacct cctgagttca agtgattctc gtgcctcagc ctccctagta 420
gctggaacta caggcatgtg ccaccacacc cagctaattt tttgtaactt tagtagagat 480
ggggtttcac catgttggcc aggatggact cgaactcctg accacaggtg atctgcccac 540
ctcagcttcc caaagtgctg ggattacagg catgagccac cgcgcccagt cgctgggtct 600
tacagtaact ttatgtttaa cattttgagg aaatgctatt cttttccaaa gtgactgcac 660
catttcatat ttgcactagc actgtacgga cattcccatt tctctgtcct agtgagtgtg 720
aaatggtatc tcactgcagt tccagtttgt atttccctga tggctaatga tgtggatcat 780
ttcatgtgtt cattggccac agagaaatgt ctatttggat tctttaccca tttttcaatt 840
gggttatttg tctttatagg tttgttgttg ttgagacaga gtcttgctct gtcactcagg 900
ctggagtgca gtggcattat cacagctaac tgcagtctag aactgctggg ctcacgtgat 960
catcccagct cagcctctcg agtaactggg actacaggca tgcgccacca gccccagcta 1020
attattttat tttttgtaga gacagggtct tactatgttg cctaggccgg tcttgaactc 1080
ctgggctcaa gcaaatctcc cacctcagac tcccaaagta ttggaattat aggtgtgaac 1140
catagtgctc agccaatttg cacaataatc ttaaatacaa aagctaagca aaacaaatca 1200
agagcatctt taaaaactag gcagtctggg aggcaggggc tgccgtgagc cgtgagatgg 1260
cacctttgca ttccagccta ggtgacagag ggaggccctg tctaaaaaaa accaaaaacc 1320
aaaaaacaaa acaaaacaaa aaacatctag gcagtagctc gtgcccgtaa tcccagctac 1380
tcaggaggct gaggcgagag aatcgtttga gcccaggagt tcaagaccag cctgggcaac 1440
agagtgagac cccatttcta aaaaatgaac aaagaaaaac taggcagttt cgcccagtgg 1500
ttagaagcgt ggagtttgga gtcaagtctc caaatttcat cttccacata tgcaaaatgg 1560
agacaataat aggggtacgt tatagaattg tggtaggcat agtgaactcc atcgcatgtt 1620
agctgttttc gttactattt actgtctaaa ttcggtgatg aaattattag gaagtctctg 1680
tcttgttctc ttctgaccac taagaggcgc acttcggagt agaagaaacg cgggcggaaa 1740
tagcccaaaa gcggattggc ttcgacttct ggcggaagta aattcctccc tccaccaggt 1800
cttattagct cagaaagaat tccaaatttc tacgtagtcc caaggatagg tagaatacat 1860
ttctcagtcc tattcctagt tattattgtc tattaaaaca tgtatactca gaatttttgc 1920
ggcattattt tttgacgtgt ctttatttta tttaaaagag ccggagccgg aagtgcttgc 1980
ctttttccct gctaggaccc aggggttacg acccatcagc ccttgcgcgc caccgtccct 2040
tctctcttcc tcggcgctgc ctacggaggt ggcagccatc tccttctcgg taagtgttaa 2100
tccgtggcaa tccgcattcc tgcgggattc atctggcccc gtcgcccagt ggtgcggagg 2160
cctccccttc agcgcggtag tgtctgtggg tattgttatt gtcagcttac tggagcgtgt 2220
acaggaacag aacgaagccg ccgagttgat agggctttgc gtcccagagc ctcctgccct 2280
ccgcctgtat tcagagctgc gggctgcttg tttgttcctt ggcggtggag ggtgctagtt 2340
gaggccagac ttcggggtct cctgggggcc gtgggacgac caggggtggc ccagcttgac 2400
agctttcagc tgggatctgt ggatcccagc gctcaccaat gtcggcccac gtgtattcgt 2460
tcatgccatg gccggcttct tccgctgcag tctctggccc gagggctgct gctgcgggac 2520
cgccaaggaa agacgagctg taggtcggct ggtccagctg caggcagaaa ttctggtagt 2580
atctctggga atatgaagat gcaactgccc ccaccttgcc ttcgaggata tcatgggcca 2640
gaaggcagag tcgttttgaa tacgtggttc attgagtacc cactctgggc cagttgatgg 2700
ctgcgaagag agcagaaggg gtgctgctgt aggaaatcaa tggctcggaa gaccacactg 2760
aggaaggtgt gagttgatac tggaagatct ccaggtttga ggcatcttca gaggtatatg 2820
gtggttttgt gtgtgttgag ggtgtggtag cgcagcagct ccctagggaa ttagaaggtt 2880
ttattgaaca tttaccctgt gacaggcact gcaggcattc agcgcgcagt gtcatcttca 2940
ttttacaggt gaggaaaaga ctcaggttca agtagatggt caaggccagt actaccggaa 3000
ggaccatctg ggggttcgga cactggtggg gtgggatttg ctgccccttg caaattgaga 3060
gtgtcttggg gtcagttttg atttgctcag ctgttggcat tctttgggct ctgagtgggt 3120
gaggtgaccc ttgacctcct gggatcgcat ctggagagtg cctagtattc tgccagcttc 3180
ggaaagggag ggaaagcaag cctggcagag gcacccattc cattcccagc ttgctccgta 3240
gctggcgatt ggaagacact ctgcgacagt gttcagtccc tgggcaggaa agcctccttc 3300
caggattctt cctcacctgg ggccgcttct tccccaaaag gcatc 3345
<210> 3
<211> 3337
<212> DNA
<213> 智人
<400> 3
atggtggcac aatcatggtt cactgcagcc tcaaacttct aggctcaagt gatcctccag 60
cctcagcctc ctgagtaggt gggactaaag gtgtgtgcta caacacctgg ctaattaaaa 120
aaaaaaaatt tgtagagatg ggcgtctcgc tatgttgccc aggctgatct ttaactacag 180
gtctcagtga tctttctgta tcagcctccc gaagtgctag gattaacagg catgggccac 240
tgtacctggc tgtctttgaa gtttttaata agattgccat atctctctca agactgatca 300
agaaaaaatg caaatacaaa tttaaagaga gggaaaaata gtattatgga actgggttaa 360
gtaccttaag ggaaaactac aacaatgaga ccactattct tatctacttg ggtgggggaa 420
ggcacggaca gagacgtaaa caacagcata gtgtgccaag ggctcccatc tcctgttctc 480
ttctgctctg caaagtctct cttaaaatat agagaacata ttgcaagtaa atacattcat 540
tagtgcattt attcaaaaac cacatttgtc tctctatgca agcttccatc tcaatgcctg 600
gcacagagac gaaaaggatt tcagaggaca aaaatcaaag gactggaaag gagggaagta 660
gctgatgaca aggtcggggg agaagcagct atttgagagt gagcagaggg aaggatataa 720
ccagagcctt ccatctggtg ttgtgacaaa gatggcagtg atgtgaggct tgatagaatc 780
aataggcctc acagttcaag acagactaca tgccctcagt cacttgcctg ctttcttggt 840
ttgctagatg gattagaaat actagaagga aagttgagtg ggtactggga tatcctatcc 900
aaatcctctc ttctggggca atgcagctgc ctcacagcaa ccacgttgtg gatcacctga 960
ccccgccttt ctcagcttcc tggaggtgca ttctaagagc gctccccata agccaacact 1020
caagtctctt cgaggtgtgt ttccagggag cctgatctaa gattaaaaac ttaaaggccc 1080
cttttagaat tgtcttttac agcccaggca aagagttctt tactttttta gaggtcatga 1140
atccctttga caaggtgatg aaagccaggg accctcttct cagaaaaata cacacgtgcg 1200
cttaatgtaa aattttacat actgttttaa aggttaaact ttaccaccca tgaaaagcct 1260
caagtagttc tttgtacata atcataagat tagcaaccat ttactgagca cttcctctct 1320
ataagaccct gtgctaagtg ctttaacttc ataatgcctt tgatcatgac ataacatggc 1380
acggtagttc ctaatatctt ccttttagag atttaagggc ttgctcaaag taacatagct 1440
aataattagc agacactgga ttaaaatccc aatttgtttg taaagcttgt gctctgaata 1500
aatgacaagg aaagagaagg gaaggttgaa gaagggaagg ttcttgaagg tccctggtcc 1560
ttgaaggtcc cttaaccata aatgtcaaga gttgggattt aaacccaggt ctaacgccag 1620
agctggcgcc ctttagatta aaagtgcagt gtccatgaca acgaaagaag ttgattttgt 1680
cccacctttg ctctttgcgg cttttcattt gcgtttgttt ccacagcgat ttccaataga 1740
tttctgcgtg gccttgacac agacagctag tgtgaatccc cgcccacaga ggggcggcac 1800
gttggttgcc gtacaacgtg gtggttccct gcatctctgc ccacgtcgga gaggtgcgtc 1860
ggcttccgta caacacggat actctctctc tgacgcaact tcctgtcctg cgcaattcta 1920
tttgaccttt gaactggcaa aggctttttt cttcctcttc cggggacgtt gtctgcaggt 1980
atggatgttg ttctcttttc cctgtcttta tttccttacc aatcggctgc catccgagga 2040
gctgaggaag cctagagctc tcagaagcag tcctttgagc tggtgtaggg gtaaggggca 2100
caacagggag gttggtggtg aggaagttcc ttactttgat ctttggaaat cccttgttcc 2160
tggtggcacc tccaaagccg tgagtagcca cagctcacca cccgggactt tgctgcattc 2220
caagtgtagc gtttggagac taacgagttg tggtttggcg gtttgagtct ggaaaatcgc 2280
caaacgtttt catattttac acccacgttt tcacagcacg cctgtacgtg tccttagtct 2340
ttgggagggc agggtccggc gagttcgggt ggtttcgcta tttggcttct gcgtccaagg 2400
cccatgtcaa ggaagagaaa aatgtgttag aagtttctgt cttgcttttg gagatgcaaa 2460
cagaataatg gcttcataaa tcactcgcac tggttttacg tgtcaagttt tggtgtctgg 2520
taattctgtt ttagtttaat tttagtgaga ggcttgtgac aacaaatgag gtggttacaa 2580
ggggtggaat gggaagatta aattagttca agtattgatt atgttttacg ttgggtagtt 2640
cccttaacga agttgctcgt atgcatatct gtataaccga tttgctaaat aacatcacga 2700
tgtttccaga agtgggaaga aagcaggtgc cataacccaa agaaacttgt gtaatatcaa 2760
aattagtatt aaagggtatg cctttacgca ggtggtgctt tagggcaaga cattgaaccc 2820
tgatatgtgc caggcattgt gttgggacgg atagcccacg tcgtttaatc ctaatgacag 2880
ctgtataaag tagacagaat tcccatgtta gagataagga ggctagctcc ttgcccttta 2940
tattcccagt aaatggcata gctaaggatt cgacttcaga gctcactttt tgtgctcttt 3000
gtttaaagcg gtgtttctcc aactgggctc gtggcacttt tctggacacc actccaaaca 3060
aaattagact ctgagtaagg agcctggtca tcagaacgtt aaggaagtgc cacgtttgat 3120
taccatcagg aaagctaaca ttcttggcct cttgtttatc agtcaccttt aaatacaagt 3180
agttttaaaa tgtggaataa tacatcttaa tttaagggtg ttacatacaa ggatatgtat 3240
gtgaatgaaa tagaccacat gatactgttt tgagatttta tttactttta caatggaaag 3300
atttgatgtt actctattct taatttaggc actcaga 3337
<210> 4
<211> 1361
<212> DNA
<213> 智人
<400> 4
cctagtgtgg cttctgcatt tttcacagtg cctggaccac ggctgaaagt aactcttgca 60
tgacatttga cagaagagga aaccgaagct cagattaaat tccctgtcca cagcgggatc 120
attcggcacg agttcctccc tgtctggaat gctcttcccc agcaatagat cctgcggctc 180
ttccgtgtct cagtctaatg tcattccgtt ccaggattcc cgacttctta aagcataaat 240
aatccctccc caccctctca ttgtactgtt atgtaactta ttacaatatg tcattatata 300
tttagtcata ctgctttagg taatgtcttc tccactgaac tgtaagctcc atgagggcaa 360
gagttcagtc ggttttactt aataattagc acctagtaca gtactagcat agaatgaagg 420
cctcgcaatt ttttttaaat ttatttttag acagggtctt gcgctgtcgc ccaggctgga 480
gtgcagtggt gcaacctcgg ctcacggcag cctcgacctt tcggctccag cgatcctccc 540
gcgtcggcct ccggggtagc tgggactgca ggcgcgcacc accatgactg gctaattttt 600
tttttttttt ttttgtagac atggggtctc gccatgttgc ccaggctggt tcctgagctc 660
aagtgatcct cctgcctcgg cctcccaaag tgctgggatt acaggcgtga gcctcagcgc 720
ccagccaagt tagccttttt taaacgtcct gtctccggag gttgccgaag ttggttttct 780
tcggcctcct tctctctccc aggcccaggg ctgggacgag gccggttccc gcctgcaacc 840
tgcactgaag acgggaacct tgggagccgg taccggaacg ctcggaaacg gcaccaaagt 900
acgaatccta gggcggaaaa gcgttaccaa gacactcgtc cccagagccg cttcctggga 960
ctctctagcc tcctaccgct tctcagtgat gttccggttt ccgccctcct cctcgcgctg 1020
tttccgcctc ttgccttcgg acgccggatt ttgacgtgct ctcgcgagat ttgggtctct 1080
tcctaagccg gcgctcggca aggtaggttg gcggcctgct ctccgacaga acttttcttc 1140
ttgggttgag gaaaacgcct tttggagtca ggccctggag gggcgagcct tgctcacagg 1200
gtggggatac agccgattac ccgccctgtg ctttccgatg gcttctgcgg ggcgagcggg 1260
gcctggccgg ggggtgcggg cgggagggcg agccagcggc gcctgcagcc cgggccgcgt 1320
aacgctgacc gctgtgcctt cagttctccc aggagaaagc c 1361
<210> 5
<211> 867
<212> DNA
<213> 智人
<400> 5
cctcggctca cggcagcctc gacctttcgg ctccagcgat cctcccgcgt cggcctccgg 60
ggtagctggg actgcaggcg cgcaccacca tgactggcta attttttttt tttttttttt 120
gtagacatgg ggtctcgcca tgttgcccag gctggttcct gagctcaagt gatcctcctg 180
cctcggcctc ccaaagtgct gggattacag gcgtgagcct cagcgcccag ccaagttagc 240
cttttttaaa cgtcctgtct ccggaggttg ccgaagttgg ttttcttcgg cctccttctc 300
tctcccaggc ccagggctgg gacgaggccg gttcccgcct gcaacctgca ctgaagacgg 360
gaaccttggg agccggtacc ggaacgctcg gaaacggcac caaagtacga atcctagggc 420
ggaaaagcgt taccaagaca ctcgtcccca gagccgcttc ctgggactct ctagcctcct 480
accgcttctc agtgatgttc cggtttccgc cctcctcctc gcgctgtttc cgcctcttgc 540
cttcggacgc cggattttga cgtgctctcg cgagatttgg gtctcttcct aagccggcgc 600
tcggcaaggt aggttggcgg cctgctctcc gacagaactt ttcttcttgg gttgaggaaa 660
acgccttttg gagtcaggcc ctggaggggc gagccttgct cacagggtgg ggatacagcc 720
gattacccgc cctgtgcttt ccgatggctt ctgcggggcg agcggggcct ggccgggggg 780
tgcgggcggg agggcgagcc agcggcgcct gcagcccggg ccgcgtaacg ctgaccgctg 840
tgccttcagt tctcccagga gaaagcc 867
<210> 6
<211> 2372
<212> DNA
<213> 智人
<400> 6
cctctcgagt aactgggact acaggcatgc gccaccagcc ccagctaatt attttatttt 60
ttgtagagac agggtcttac tatgttgcct aggccggtct tgaactcctg ggctcaagca 120
aatctcccac ctcagactcc caaagtattg gaattatagg tgtgaaccat agtgctcagc 180
caatttgcac aataatctta aatacaaaag ctaagcaaaa caaatcaaga gcatctttaa 240
aaactaggca gtctgggagg caggggctgc cgtgagccgt gagatggcac ctttgcattc 300
cagcctaggt gacagaggga ggccctgtct aaaaaaaacc aaaaaccaaa aaacaaaaca 360
aaacaaaaaa catctaggca gtagctcgtg cccgtaatcc cagctactca ggaggctgag 420
gcgagagaat cgtttgagcc caggagttca agaccagcct gggcaacaga gtgagacccc 480
atttctaaaa aatgaacaaa gaaaaactag gcagtttcgc ccagtggtta gaagcgtgga 540
gtttggagtc aagtctccaa atttcatctt ccacatatgc aaaatggaga caataatagg 600
ggtacgttat agaattgtgg taggcatagt gaactccatc gcatgttagc tgttttcgtt 660
actatttact gtctaaattc ggtgatgaaa ttattaggaa gtctctgtct tgttctcttc 720
tgaccactaa gaggcgcact tcggagtaga agaaacgcgg gcggaaatag cccaaaagcg 780
gattggcttc gacttctggc ggaagtaaat tcctccctcc accaggtctt attagctcag 840
aaagaattcc aaatttctac gtagtcccaa ggataggtag aatacatttc tcagtcctat 900
tcctagttat tattgtctat taaaacatgt atactcagaa tttttgcggc attatttttt 960
gacgtgtctt tattttattt aaaagagccg gagccggaag tgcttgcctt tttccctgct 1020
aggacccagg ggttacgacc catcagccct tgcgcgccac cgtcccttct ctcttcctcg 1080
gcgctgccta cggaggtggc agccatctcc ttctcggtaa gtgttaatcc gtggcaatcc 1140
gcattcctgc gggattcatc tggccccgtc gcccagtggt gcggaggcct ccccttcagc 1200
gcggtagtgt ctgtgggtat tgttattgtc agcttactgg agcgtgtaca ggaacagaac 1260
gaagccgccg agttgatagg gctttgcgtc ccagagcctc ctgccctccg cctgtattca 1320
gagctgcggg ctgcttgttt gttccttggc ggtggagggt gctagttgag gccagacttc 1380
ggggtctcct gggggccgtg ggacgaccag gggtggccca gcttgacagc tttcagctgg 1440
gatctgtgga tcccagcgct caccaatgtc ggcccacgtg tattcgttca tgccatggcc 1500
ggcttcttcc gctgcagtct ctggcccgag ggctgctgct gcgggaccgc caaggaaaga 1560
cgagctgtag gtcggctggt ccagctgcag gcagaaattc tggtagtatc tctgggaata 1620
tgaagatgca actgccccca ccttgccttc gaggatatca tgggccagaa ggcagagtcg 1680
ttttgaatac gtggttcatt gagtacccac tctgggccag ttgatggctg cgaagagagc 1740
agaaggggtg ctgctgtagg aaatcaatgg ctcggaagac cacactgagg aaggtgtgag 1800
ttgatactgg aagatctcca ggtttgaggc atcttcagag gtatatggtg gttttgtgtg 1860
tgttgagggt gtggtagcgc agcagctccc tagggaatta gaaggtttta ttgaacattt 1920
accctgtgac aggcactgca ggcattcagc gcgcagtgtc atcttcattt tacaggtgag 1980
gaaaagactc aggttcaagt agatggtcaa ggccagtact accggaagga ccatctgggg 2040
gttcggacac tggtggggtg ggatttgctg ccccttgcaa attgagagtg tcttggggtc 2100
agttttgatt tgctcagctg ttggcattct ttgggctctg agtgggtgag gtgacccttg 2160
acctcctggg atcgcatctg gagagtgcct agtattctgc cagcttcgga aagggaggga 2220
aagcaagcct ggcagaggca cccattccat tcccagcttg ctccgtagct ggcgattgga 2280
agacactctg cgacagtgtt cagtccctgg gcaggaaagc ctccttccag gattcttcct 2340
cacctggggc cgcttcttcc ccaaaaggca tc 2372
<210> 7
<211> 1862
<212> DNA
<213> 智人
<400> 7
gcagtttcgc ccagtggtta gaagcgtgga gtttggagtc aagtctccaa atttcatctt 60
ccacatatgc aaaatggaga caataatagg ggtacgttat agaattgtgg taggcatagt 120
gaactccatc gcatgttagc tgttttcgtt actatttact gtctaaattc ggtgatgaaa 180
ttattaggaa gtctctgtct tgttctcttc tgaccactaa gaggcgcact tcggagtaga 240
agaaacgcgg gcggaaatag cccaaaagcg gattggcttc gacttctggc ggaagtaaat 300
tcctccctcc accaggtctt attagctcag aaagaattcc aaatttctac gtagtcccaa 360
ggataggtag aatacatttc tcagtcctat tcctagttat tattgtctat taaaacatgt 420
atactcagaa tttttgcggc attatttttt gacgtgtctt tattttattt aaaagagccg 480
gagccggaag tgcttgcctt tttccctgct aggacccagg ggttacgacc catcagccct 540
tgcgcgccac cgtcccttct ctcttcctcg gcgctgccta cggaggtggc agccatctcc 600
ttctcggtaa gtgttaatcc gtggcaatcc gcattcctgc gggattcatc tggccccgtc 660
gcccagtggt gcggaggcct ccccttcagc gcggtagtgt ctgtgggtat tgttattgtc 720
agcttactgg agcgtgtaca ggaacagaac gaagccgccg agttgatagg gctttgcgtc 780
ccagagcctc ctgccctccg cctgtattca gagctgcggg ctgcttgttt gttccttggc 840
ggtggagggt gctagttgag gccagacttc ggggtctcct gggggccgtg ggacgaccag 900
gggtggccca gcttgacagc tttcagctgg gatctgtgga tcccagcgct caccaatgtc 960
ggcccacgtg tattcgttca tgccatggcc ggcttcttcc gctgcagtct ctggcccgag 1020
ggctgctgct gcgggaccgc caaggaaaga cgagctgtag gtcggctggt ccagctgcag 1080
gcagaaattc tggtagtatc tctgggaata tgaagatgca actgccccca ccttgccttc 1140
gaggatatca tgggccagaa ggcagagtcg ttttgaatac gtggttcatt gagtacccac 1200
tctgggccag ttgatggctg cgaagagagc agaaggggtg ctgctgtagg aaatcaatgg 1260
ctcggaagac cacactgagg aaggtgtgag ttgatactgg aagatctcca ggtttgaggc 1320
atcttcagag gtatatggtg gttttgtgtg tgttgagggt gtggtagcgc agcagctccc 1380
tagggaatta gaaggtttta ttgaacattt accctgtgac aggcactgca ggcattcagc 1440
gcgcagtgtc atcttcattt tacaggtgag gaaaagactc aggttcaagt agatggtcaa 1500
ggccagtact accggaagga ccatctgggg gttcggacac tggtggggtg ggatttgctg 1560
ccccttgcaa attgagagtg tcttggggtc agttttgatt tgctcagctg ttggcattct 1620
ttgggctctg agtgggtgag gtgacccttg acctcctggg atcgcatctg gagagtgcct 1680
agtattctgc cagcttcgga aagggaggga aagcaagcct ggcagaggca cccattccat 1740
tcccagcttg ctccgtagct ggcgattgga agacactctg cgacagtgtt cagtccctgg 1800
gcaggaaagc ctccttccag gattcttcct cacctggggc cgcttcttcc ccaaaaggca 1860
tc 1862
<210> 8
<211> 2363
<212> DNA
<213> 智人
<400> 8
gcttcctgga ggtgcattct aagagcgctc cccataagcc aacactcaag tctcttcgag 60
gtgtgtttcc agggagcctg atctaagatt aaaaacttaa aggccccttt tagaattgtc 120
ttttacagcc caggcaaaga gttctttact tttttagagg tcatgaatcc ctttgacaag 180
gtgatgaaag ccagggaccc tcttctcaga aaaatacaca cgtgcgctta atgtaaaatt 240
ttacatactg ttttaaaggt taaactttac cacccatgaa aagcctcaag tagttctttg 300
tacataatca taagattagc aaccatttac tgagcacttc ctctctataa gaccctgtgc 360
taagtgcttt aacttcataa tgcctttgat catgacataa catggcacgg tagttcctaa 420
tatcttcctt ttagagattt aagggcttgc tcaaagtaac atagctaata attagcagac 480
actggattaa aatcccaatt tgtttgtaaa gcttgtgctc tgaataaatg acaaggaaag 540
agaagggaag gttgaagaag ggaaggttct tgaaggtccc tggtccttga aggtccctta 600
accataaatg tcaagagttg ggatttaaac ccaggtctaa cgccagagct ggcgcccttt 660
agattaaaag tgcagtgtcc atgacaacga aagaagttga ttttgtccca cctttgctct 720
ttgcggcttt tcatttgcgt ttgtttccac agcgatttcc aatagatttc tgcgtggcct 780
tgacacagac agctagtgtg aatccccgcc cacagagggg cggcacgttg gttgccgtac 840
aacgtggtgg ttccctgcat ctctgcccac gtcggagagg tgcgtcggct tccgtacaac 900
acggatactc tctctctgac gcaacttcct gtcctgcgca attctatttg acctttgaac 960
tggcaaaggc ttttttcttc ctcttccggg gacgttgtct gcaggtatgg atgttgttct 1020
cttttccctg tctttatttc cttaccaatc ggctgccatc cgaggagctg aggaagccta 1080
gagctctcag aagcagtcct ttgagctggt gtaggggtaa ggggcacaac agggaggttg 1140
gtggtgagga agttccttac tttgatcttt ggaaatccct tgttcctggt ggcacctcca 1200
aagccgtgag tagccacagc tcaccacccg ggactttgct gcattccaag tgtagcgttt 1260
ggagactaac gagttgtggt ttggcggttt gagtctggaa aatcgccaaa cgttttcata 1320
ttttacaccc acgttttcac agcacgcctg tacgtgtcct tagtctttgg gagggcaggg 1380
tccggcgagt tcgggtggtt tcgctatttg gcttctgcgt ccaaggccca tgtcaaggaa 1440
gagaaaaatg tgttagaagt ttctgtcttg cttttggaga tgcaaacaga ataatggctt 1500
cataaatcac tcgcactggt tttacgtgtc aagttttggt gtctggtaat tctgttttag 1560
tttaatttta gtgagaggct tgtgacaaca aatgaggtgg ttacaagggg tggaatggga 1620
agattaaatt agttcaagta ttgattatgt tttacgttgg gtagttccct taacgaagtt 1680
gctcgtatgc atatctgtat aaccgatttg ctaaataaca tcacgatgtt tccagaagtg 1740
ggaagaaagc aggtgccata acccaaagaa acttgtgtaa tatcaaaatt agtattaaag 1800
ggtatgcctt tacgcaggtg gtgctttagg gcaagacatt gaaccctgat atgtgccagg 1860
cattgtgttg ggacggatag cccacgtcgt ttaatcctaa tgacagctgt ataaagtaga 1920
cagaattccc atgttagaga taaggaggct agctccttgc cctttatatt cccagtaaat 1980
ggcatagcta aggattcgac ttcagagctc actttttgtg ctctttgttt aaagcggtgt 2040
ttctccaact gggctcgtgg cacttttctg gacaccactc caaacaaaat tagactctga 2100
gtaaggagcc tggtcatcag aacgttaagg aagtgccacg tttgattacc atcaggaaag 2160
ctaacattct tggcctcttg tttatcagtc acctttaaat acaagtagtt ttaaaatgtg 2220
gaataataca tcttaattta agggtgttac atacaaggat atgtatgtga atgaaataga 2280
ccacatgata ctgttttgag attttattta cttttacaat ggaaagattt gatgttactc 2340
tattcttaat ttaggcactc aga 2363
<210> 9
<211> 1858
<212> DNA
<213> 智人
<400> 9
gtaaagcttg tgctctgaat aaatgacaag gaaagagaag ggaaggttga agaagggaag 60
gttcttgaag gtccctggtc cttgaaggtc ccttaaccat aaatgtcaag agttgggatt 120
taaacccagg tctaacgcca gagctggcgc cctttagatt aaaagtgcag tgtccatgac 180
aacgaaagaa gttgattttg tcccaccttt gctctttgcg gcttttcatt tgcgtttgtt 240
tccacagcga tttccaatag atttctgcgt ggccttgaca cagacagcta gtgtgaatcc 300
ccgcccacag aggggcggca cgttggttgc cgtacaacgt ggtggttccc tgcatctctg 360
cccacgtcgg agaggtgcgt cggcttccgt acaacacgga tactctctct ctgacgcaac 420
ttcctgtcct gcgcaattct atttgacctt tgaactggca aaggcttttt tcttcctctt 480
ccggggacgt tgtctgcagg tatggatgtt gttctctttt ccctgtcttt atttccttac 540
caatcggctg ccatccgagg agctgaggaa gcctagagct ctcagaagca gtcctttgag 600
ctggtgtagg ggtaaggggc acaacaggga ggttggtggt gaggaagttc cttactttga 660
tctttggaaa tcccttgttc ctggtggcac ctccaaagcc gtgagtagcc acagctcacc 720
acccgggact ttgctgcatt ccaagtgtag cgtttggaga ctaacgagtt gtggtttggc 780
ggtttgagtc tggaaaatcg ccaaacgttt tcatatttta cacccacgtt ttcacagcac 840
gcctgtacgt gtccttagtc tttgggaggg cagggtccgg cgagttcggg tggtttcgct 900
atttggcttc tgcgtccaag gcccatgtca aggaagagaa aaatgtgtta gaagtttctg 960
tcttgctttt ggagatgcaa acagaataat ggcttcataa atcactcgca ctggttttac 1020
gtgtcaagtt ttggtgtctg gtaattctgt tttagtttaa ttttagtgag aggcttgtga 1080
caacaaatga ggtggttaca aggggtggaa tgggaagatt aaattagttc aagtattgat 1140
tatgttttac gttgggtagt tcccttaacg aagttgctcg tatgcatatc tgtataaccg 1200
atttgctaaa taacatcacg atgtttccag aagtgggaag aaagcaggtg ccataaccca 1260
aagaaacttg tgtaatatca aaattagtat taaagggtat gcctttacgc aggtggtgct 1320
ttagggcaag acattgaacc ctgatatgtg ccaggcattg tgttgggacg gatagcccac 1380
gtcgtttaat cctaatgaca gctgtataaa gtagacagaa ttcccatgtt agagataagg 1440
aggctagctc cttgcccttt atattcccag taaatggcat agctaaggat tcgacttcag 1500
agctcacttt ttgtgctctt tgtttaaagc ggtgtttctc caactgggct cgtggcactt 1560
ttctggacac cactccaaac aaaattagac tctgagtaag gagcctggtc atcagaacgt 1620
taaggaagtg ccacgtttga ttaccatcag gaaagctaac attcttggcc tcttgtttat 1680
cagtcacctt taaatacaag tagttttaaa atgtggaata atacatctta atttaagggt 1740
gttacataca aggatatgta tgtgaatgaa atagaccaca tgatactgtt ttgagatttt 1800
atttactttt acaatggaaa gatttgatgt tactctattc ttaatttagg cactcaga 1858
<210> 10
<211> 8450
<212> DNA
<213> 智人
<400> 10
attttgcttg aaaggatagc atcaaggaag tgaaatgaca acccacagaa tgagagataa 60
tttttgcaaa tcatgtatct gataagggac ctgtagtcag aatatgcaaa gaacccttac 120
aattcaataa gacaacccaa tttaaaaaca ggcaaaggat gtgaataggc atttctccaa 180
agatacggaa aaacggccaa taagcacata aaaagatgct caaaatcatt tgccatttgg 240
gaaatgcaat caaaaccaca atgaggtatc acttcacgcc cattagggtg gctatagatc 300
agaaagtcag ataacatgtg ttggcaagca catggaaaca ctgaagtcct tacacactgc 360
tggtaggaat gtaaaatggt gcagccactg tggaaaacag ttttccaatt tctcaaaatg 420
ttaaacacag ttatcataca cccaagcaat tctactctta ggtatatacc caagagaaat 480
gaaaacatat gtcttcacca gaacttgctg ttcacagcag cattatgcat aatagaccaa 540
aagtggaaac aactcaactg cccatcaact ggtgaatgga taagtaaaat gtgatgtaac 600
cagtcattgg actgtcattc attaataaaa agaacaaggt actgattcat gttctaacat 660
gagtgaatct tgaaaacact atgctaaatt aaagaagcca gtcacaaaag gccgtgtatt 720
gcatgatttt atatatacat gaacttttat atatatataa ttatatatat tatatataat 780
tttatatata taaatttcta tatataaata tataaaatca tatatatgat atatattttt 840
tcatatacat catatatatt tacaaaaatt atatatcata tatcatatga tatatgagat 900
atatatcatg atatatatga tatatgatat atatcatatg agatatatga tatcatgaga 960
tatatgatat catatgatat atatgatata gatatcatat gatatatata taatatatat 1020
atgatagata tattatatat gatagatatg atagatatca tattatatat gatagatatg 1080
atagatatca tattatatat gatagatata gatatcatat tatatatgat agatatgata 1140
gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1200
gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1260
gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1320
gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1380
gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1440
gatatcatat tatatatgat atcatatata taccacatac atcatatata catcatatat 1500
acatcatata tatcatacat atatatgaac tttccagaat aggtatatca ataaagacag 1560
gaagtataca agtggttgcc acagcctgag aggagcaggg aatggtgagt gactgctaat 1620
ggatatggca ctttttttgg ggggtgatga aaatgttctg gtcagacaat ggcaattaca 1680
aaactgtata cacacgaaaa accaaagaat cacacacttt aaaagggagg atttagctcg 1740
gcatggtggc atgcgcctgt actcccagtt actcgggagg ctgaagcagg actgcttaga 1800
gcccaggact tcaaggctgc agcgagctat gatcgctcca ctgcactcca acaaggatga 1860
cagtgcgaga cccgttttct aaataataat aataataata ataataaata acccaaggta 1920
cccagttcac atgcaaaacc actggtaaac ataaattatc tccaagtaat ctagaaagaa 1980
aatgagcaca taagacgtct tctaaaaaca cacatatatt tctttacatg ttacatttaa 2040
cgtaaaaatc agctatgcag aagttacatg aacattttat gttggaaagg taaatgacta 2100
ttattaatac agaatggtta agtacattta tgtttttatg tacaaacgca taaaaggaaa 2160
agcatcctta aaataaacac catcaatggc tcctcggtgg tcacaaaaca aaatcctcac 2220
acctttgtct tccttcacaa ttgagcttta tccacctttt caggcttatc tcccattatt 2280
acctgacaca aacttgggtg ggccagagtt tccactgacc atcccccgac tattcatcca 2340
acactatgtt cactgcctcc cattcctgac catttgcctt ttgtcttcaa ctaattctgg 2400
ggacgttttg tccaaataaa tgatccatat tcttgaaggc tggaatcaag tcctattaca 2460
aatatatttt ctcaccctct ccagagcata gcaacccagc atctactggc ctctcacagc 2520
tctaaccatc cacaacccta agctggcttc tcatcaaacg ggtacttttc accacccaaa 2580
ttcaattaat tcactcttac aataatgaag aatagtcgcc tacagcctac cttttccagc 2640
cttgattcaa tcatttatca attttatctt caaagtccct cacttcaggg agatgatata 2700
tcagctttca cccagagtcc taaagaaaac agcactcttg ccaatgacat agtgccacct 2760
agtggcaaca taaggtaaat cacagtggca gtagaaggat ctccacacta cttttacagg 2820
aatgcactgc aggtaaaaaa taagaagcta cagtactgtt tggcaggaca atttgtttca 2880
tacgtgcata ctatcgccct gactaaatta actcgcaagt cttacaggta ttatttgttt 2940
tcagttccat gcacagatta gccatttagt acttactaaa tcaaactcaa tttctgaagt 3000
gtcttacacc aatatattca tgcacatatg gttaaaattt tccttgagga tctatcatgt 3060
gagagtgtgg cttattataa caagtaaaca gaacaaataa atacaaaatg aaaagaaatc 3120
gtatgattta ctcgcatata agggagcttg ttgtggatta agtttcatga cccaggacac 3180
tgaaacagaa atggaataaa tgagaataaa attaaaagtt gtcatcaaaa atatagaagc 3240
catctaaaga cctaggtgtc aagcatagct ctatgagtac aatcccgtgc ctgagattac 3300
catatgccca gctgtatgct atacactaag agatttagga aggaagcggg gtcagggatt 3360
gaccccagac tccatctttt caagtgggga agaaagatct tccgattgaa aaataaaggc 3420
aaaaaaggct tcaccgtcac agaagtttca acaaccaaca ggatatttaa aacagttatc 3480
aaagcaaaac cattgtatgt tcacttacat ttttacatag tccctcaaac tcacaaaatg 3540
ctgtttactc agggacttct tccggtctta ctagggagcc tggaaagtga cgggaggatt 3600
gcaagggacc actagaaccc tcttcctcaa ttccccttct ctgagaaggg aggctacagc 3660
ttgcctctct aaccactaaa aggcatgacc ctcctcaaag ttaatagccg gattccctga 3720
tagatatttt cactaaatga attctcataa aactctcact aagatttaga gaaggcttcc 3780
agggttgaat tcctgaacat taagaacagc atgtttttta aaagtttaac ttggtgattg 3840
gaccaggact tcatctaggc tatgaatgct cagaatggta ggtcctttac caaacagctt 3900
gagtttgtgt ataaagtgat ctcatcctct taagagtcag agaaacagaa ccaagcgact 3960
tcactataat ttgatctgag gaagtttctt actcacaata ggtaaatgaa ggcacatact 4020
aaccagcaat ataaacaaca atatcaagtg tcattcacac atgcaaaaaa cagacaaaat 4080
cccaaactct gtgttctaac aaatcgcaaa aacctcacta acaataaatt gaaatgacca 4140
aatgtttgga ctgaaaagca atgccttggt agcctagcca tgcctaactc aaataacaga 4200
accatctcga tgttaaaatc ctcacagatc aagctgtgta tgtctcgggt caagacttcg 4260
ccaaaaagca gtgagcacac acttaagagg gaaaaaatct acctcagcct cctaaatgca 4320
atcatctcta cacgagttgc aggccccaag cttcaacgtg ttctgctgga caacgcagta 4380
gaaagctgac aagcaggtgg ccttcccaca ctgactgaac cacctccatg cccatgtcca 4440
ttcattttct tgcccacccc atgtgctata acagacctcc tggctcaggg cactctttcc 4500
ttcctgactg ccttcactta atgactttgt acttttaggt gcaaaaatta tctgcagaaa 4560
tccacactga aaaccaagct tgagaaaggc agcaataacc aacattttta caagaagaac 4620
aaggtcaata tcaagcccat cagattcaaa tagcaagcat ggatgaaaat gaaagattga 4680
aaggcttgag tgccttctta atgtattaaa tatccattta atttacaatt aagctcactg 4740
tgctcactgg ccttttaatc agctttccag gtcctgctca gacttgccta ggacatggga 4800
atgaaagaac ctatacattt atggaccaat ctaccttaac taacttgtca agtgttcctg 4860
catcaagcag aagaaacatc agtgaaactg atacaggaat taaccccttg ttaatccata 4920
aaacttaaag gagcgggatc caatcttctg gcttccctgg gccacgctgg aagaagaatt 4980
gtcttgcgcc acacataaaa tacacgaaca ctaataatag ctgctaagct ttaaaaaaat 5040
tgcaaaaaag gaaaatctca taattttttg tttgttgtga ggtggagcct cactctgtca 5100
cccaggccgg agtgcagtgg caccatcttg gctcactgca acctctgcct cctgggttca 5160
agccattctc ctgcctcagc ctcccgagta gctgggatga taggcgtgtg ccaccatgcc 5220
cagctaattt tcgtattttt agtagagacg gggtttcacc atgttggcca ggctggtctc 5280
aaactcctga cctcaggtga tccacccacc tcggcctccc aaagtgctgg gattacaggt 5340
gtgagccacc gtgcccggcc aatgttttaa gaacgtttac gaatttgtat tgggccacat 5400
tcaaagcctt cacaggctgc atgcagcctg caggccgcgg ttggacaagc ttggattaga 5460
gaaatctaca gagacaaact agtgacttag tagccctctg atagctcatg atttgcaaga 5520
aacttaggat gactatgtgt aaagaccaca aacatcaatt taactgaatg gttcccgcca 5580
cactggaatg aggaagctga gcaaactcag aggactctaa gaaagggctg atgtcatctg 5640
aactgttcgg aattataaac tcctctaaac atgtttcaaa gccagaactt gtaggagttg 5700
ttctgataca cggattaaaa gagggatgac aaagtgtctg tcccccacac tggtcaaagg 5760
gacaggtcat tgttatgctg gcaatgcagg ctgctgaaaa gaatgtatct gtcaaaagta 5820
atcaaagtaa tgaccccaga aggctccaga aacagactgg taaattcagg ttgctttcag 5880
acttccacaa tgctggcaca caaggggaaa gacaaaacta acatttacag agcattatat 5940
ttgatattac atttaatccc cattaaaaag atactatttc ccgtttcact agtgaaaaag 6000
ttgatctttc aaaggttaaa ttatttaaca ccaaggtcaa agggtaagtt ggagagacca 6060
gattcaaacc cagtctgaca ttaaaacatg tgttttcccc ccacatcgtc tcctgctaat 6120
aacctcaaat ctaaaaactg acttgcccta caccttgagc cccatcctac aaactctccc 6180
tgacgttatt aattcagctg tcactgtgca cctacaacgt gccagacacc atactcctca 6240
acactctgta ggcacagaag gaacagataa aaatccctac cttcatagat attattctag 6300
gggtaacaca ggtaaataaa acattaaaat agttttcaca tagtagcaaa ttccatatag 6360
caaaataaaa cagaagaagg aatagcaaat gagggagatg ccctcttaaa catggtgctg 6420
agggaaggcc tccctgagaa agatatcatt taccccaaaa ataaaaaagc aagtaataga 6480
aaaaacaggt aaaaggtgtt ctagacactt aaacctgcca cattgagaac tcagggttct 6540
gatgcaaaac ctcgctgcat agaatgcatt aacttatttt tatacattta aacaaacaaa 6600
ctctacttaa gaactgtgtt ctaaaggaag gagcatatta caggaaggca atttttggtc 6660
agagtagaca cacttaaaaa ctaaacctat tgaaagacca agaacaactg aaagtctttg 6720
ctttgtcaga tttttgacca aaaggaaaat taaagaaaca caccgtgccc atccaatgat 6780
ttcaccaagg aattttaaga gagaaaatcc tacttcttcc tcacccagta gccagtgaaa 6840
tgactgagca aattcacaag ttcactgggg ctgctttcat gtaacacagg gacaacacat 6900
gacagacaca gtggaaccct acaggttgcc tagtatttga aagactgtga agaggaggag 6960
atgtcaaaat tcaaagtctt aaatgatgta gttttaagta tgttcagcaa tttcaccact 7020
cagtagtaaa gccagctaca gttgaaagca atcagaaatt tgaggggtgt gaaataagca 7080
gaagcacaga agttaaggat ttgtattctt cccacatttt ccactttatt ttatactgct 7140
gagaaaaaac aaatttaata gttttctgct gtataagaga gacacattca ctttatgtca 7200
cagtaagagt cactcaattt taatacaact atctcaatgt ataaattaac attctccccc 7260
ctgcccacac atagtaagtc tcttatgatg ttgctgatta gagaagcaaa agttgccgct 7320
acaattctct tcctgcattt taatataaac aatcatcagt cttttcttca tagagtgcag 7380
tgtgggcact atcatcagaa tgtaccagca ctgggtgtgc aaagtttaca aagattagca 7440
agagcaaaag tgttgagatt tttgaaattc atgctgctgc aaagaagtat gtaaaaactc 7500
actcaccata gaggaccaca cagaaactca ggcatgaagt tatatggctg tgtgagtggt 7560
ttgggagaag gaacggaaag cacttccacc aacctatatg cctgagcaaa ttaatgcaaa 7620
acctcagaag ctacaaaaaa gtttatctac ctaaattaaa attggtgtcc acagcagtag 7680
ccagcaaaat gcctgcgaag cgcaaagtgg taaatatttt agggtctgta ggtcatatgg 7740
tctctgttaa acaatatgta aatgaatggg tgtggctgtg ttccaataaa acttcattta 7800
taaaaagagg cagcatggta catccagtca gcaagctata atgtaccaac ccccggtcta 7860
acactaacca aatacctctt aataagccaa agaaactgtg tcctcttagg ccggaagcgg 7920
tggctcacac ctataatccc agcattttgg gaggccgagg cggggagatc acctgaggtc 7980
aggagtttga gaccatcctg gccaacatgg tgaaacccta tttctactaa aaatacaaaa 8040
attagccagg cgtgctggcg ggcgcctgta atgccaacta ctggggaggc tgaagcacga 8100
gaatcgcttg aacccaggag gcagaggttg cagcgagcct agatcacgcc attgcactcc 8160
agcctgggca acaagagaga aactccgtct caaaaaaaaa aaaggaaata aaagtataca 8220
aagtgaaaac aaagaaatta aactgccctt atttgccagt gacattactg tctatgcaca 8280
aaattccaaa aatctacaaa aaagcttcta gtactaaaaa tgagtttagc aaggttgtag 8340
aatccaaggt cagcatataa cataaaatca ccttcctata tactagcaat caccaactgg 8400
aaattgagaa gtatcattca caacagtacc acaaacatga aataaatgtg 8450
<210> 11
<211> 8420
<212> DNA
<213> 智人
<400> 11
tcttagtatg gtaaaccttt tgaagtagat tcaaatgaga atgggaagag agaaaaggga 60
gagaagcaac ataagaaatc tcttttaagg aattttatat agagagaaac agaggaatca 120
gttgatagtt ggaaattatt ttaaagaaaa tgggttattt taaagaaaaa aggtattaca 180
acatgtttgc actattgtgg gaataatcaa gttgagacag aaaattattt tttaaggaag 240
agtctaattg ctgaagtgaa agagaatgaa tgagaccctg tgcataagtg tgatcagata 300
ggagcatgta cagctcaagt aagaacagga agaaagagac aataaacatg tacagatagg 360
atgggctggt cgatgtggtg gtgaaaagac atgcgagtta ttactgatta cttctatttc 420
cccagtgaaa taggaagcca ggttcataaa ccaaaatgaa gaggagcgag gcagtattgg 480
aagttcagga aaagtaatag gtgtaaaaat atgtaaagta gaattaccag ggagtatgaa 540
gatacatttc caattaagga tgaagaattt aaagtgaggc cagccaatac ccctgctttg 600
cttcagctac atcagctgca taggttcagg cacagaatac atggaacatt gtatttaaat 660
agggcctgga ttttacaaaa gtaacacaat gaagaagaga gatgcaaggc tatttgaggg 720
tgtttgtggg agagattgta aaatattagc taagtaagaa ggggactgca aattttagtg 780
gtataaagga atgaggaaaa gtgtaaatac agtggggtca aagaatgttt ggagccaagg 840
cactagaggc aattagctga aaatgtaggt gattattggt gagtgacatg gtttaaatga 900
aaagtataga agggtacaat tatccatcat gaaaagttct agggtacaac taagatctga 960
gtagctgaag tagaatgaaa gtagaatgga cctttccata tccagccagg ttcagtgaca 1020
gaaggttagg aaacaaatta taaaccactt gagagaacat atcccctaag ttgtttttgc 1080
tatttttctt tcagcatata tttgttggaa tgccaactat gttcagttca attaatatgg 1140
gcttcttaaa taagggctcc agcactggat aatcctgcca tttattttga tacattccat 1200
cctgctgctc agatctattg gcatctacag gatgtctttt gagaagatgg gcattcacat 1260
ccctatgtcc tagcaaattt ccaactcaga aaaccacatt aggcttctct atatatcttc 1320
caactatttc aatggaaaat acaattctct gatttcttcc tatgatattt atcaaagaga 1380
atggtgcctg ccagttctag ggtgggggaa ctcaatacaa atcaccaacc tttagatgac 1440
accctgtctt caaagtgctt tcaaagtctg gcagaaaaaa agtacccagt ggctataaga 1500
ccacccagga gttcagtcat gcattctaag tagcagatca ctggaatgta attggctagt 1560
gagttcattt tactcttctc ttcttggtca catgttaccg cccttgtacc ctgcacgttc 1620
tctttcccag acttacaaag catgttctct tgaattcgtt ctctttttaa attcacacag 1680
tcttaatgat tcttctttca caagagtctt tcactcttac aattcagttc aagtcatcca 1740
catgcttatt atgagcaagg gtctgggact taggggaaaa gggaataaaa agatgaatga 1800
aatgtgatcc ctgcagtcca agagcttgct gtgaaaaagg aagtttggct tacattgcct 1860
ccctaatccc ttggctaggc cagaacagaa tattgtctaa aacctcctca cgtcagcagt 1920
cctctggggt ggtgactgga agtagaattt aaacaaaaat ataattgaca cataataatt 1980
gtgcatactt atagggtaca atctgatgtt tcgatatgtg tttaaatggg tgcattgtgt 2040
aatgatcaaa ttgaggtaat ttatccacca ccttgaagag agatttttca atattctcat 2100
tgcgaagaag caggaatttt tagcagacaa ctgagatgct tcttgttcac actaagtcat 2160
tctgacgatg gatttacata acttgttgtt ttttttgtgt gtgtgttttt gagacagagt 2220
cttactttgt cgactaggct gaagtgcagt ggcacaatct cggctcactg caacctccac 2280
ctcccgggtt caaacgattc tcctgcctca gcctcctgag tagctgggat tacaggtgca 2340
tgcaactagg cctggctaat ttttatattt ttaatacaga tgggatttca ccatgttggc 2400
cctgctggtg tcaaattcgt ggcctcaagt gatctaccag ctgcggcctc ccaaagtgca 2460
gggattacag gtgtgagaca ccaagcctgg tacatttaca tttcttatct ggatctttcc 2520
tttagtaagt gctaaggaat cctacttccc ccaatatttt ttcctatttc aatgttttag 2580
catgtatcat gttactactt tgcagacatt tgattttccc ctttgtttac tgtaaagtat 2640
atttttatag cctttgtaat agaagtattc taaaatctgc ctgcaaccta tctttctgac 2700
tctgcatttt agggaataat tctctgttgt ggaatgaaaa aaaaaacaga gcctgtggag 2760
tcagagatct catttcaaat tatagttatc cctaggaata aatctgagtg acaggtagta 2820
tagtataata ataagtataa agctatggtt aaggaaaact caacaacctt atctgtaaat 2880
tgggatgaca acagcctacg tcaaaaaaat gtgaaggtaa atgagataat gtaaggctga 2940
tacttagtaa gcaatttaaa aacacccaaa aaactattgc catgattact ctacttactc 3000
tatttctcta tgctccaggc aaatgaacta ctaatgaccc aggggtcctt ccccattctc 3060
ttcttcacaa ggaaatattc tctctctgtg tgctgtttat taaaatctac tgcccctttt 3120
agaagccttt ccagatcatc ccatggccaa gaacgatcgc tgcttcctct tctttacata 3180
cagatgtttt tctcctgctt gacaattatt tttgtgcaat tattttcctt ttgattgtgt 3240
ttttaatgtc ccccccaccc cacaattttc cagactgttt gctccacgag agaggagacc 3300
atcatctctg tgctcaccgt tgtatgacca gtatcctgag gagtggctgt tacataatta 3360
catcaggcac tcaataaaaa tttgatgaat aaacactgga ttttaaggca ggtatcatat 3420
cttacatagc atatcatatc ttacatttta tgtccctcac ataaatacca cagagtgaag 3480
tatatgacag ataaggtcat ttctcttgat aagtacatag tccagtctga aacagatatg 3540
ccaaaaaaaa acaaaactgg agtaaacaag atgaattgtt ttaatagagg cactgtatta 3600
gtttcctagg actgccagaa caaatcacct caaacttagt ggctgaaaac aacaaaaatt 3660
tattgtctca cagttataga tgttagaagt ataaaattaa ggtgtcagtg ggattggttc 3720
cttctggggg ctgtggaaga gaatctgtcc caagccttca cactgtaaag tacagtactg 3780
gagggatagg acttcaactt gctctatctc agatagagag gagccatttg ttgtgaattg 3840
agaagagggg tatgttgaat ccataataag cacataaaaa cttggctggt tcataggaga 3900
agtaacatgt ttccagctct agtaaaaaac aaattgaagt ggcctataaa aaggtacaga 3960
gtacgacaga atgaaaaata aatgaacaag aatacagaga ggatgtggta aattatcatg 4020
tttccctaat atgttattgg acactaaatg gtattagaat tatttatcaa taataattct 4080
aaactgttgc aattgaaaga atatattaag tggtgttata tgagaagtgc cagggcattc 4140
tcatttctgt ccaatgggag aaacattttc gtttgagacc tccgtgaata atacagtctt 4200
ttagttagga gagctgcatt ttgagtggtg caggcagaat ggcgatctct cacccacaca 4260
aacactaaga tagagagaga cagagacaga gacagagaca gcagagagag acagagaaag 4320
gaagtacagg tactcagata gagataagcc atttcttgac attaagaaat aaagtagaat 4380
ccattggagg gaaataaaac tgcctcagga acagagttaa ttcacataca catgcaggta 4440
aacacacact gcttgatact tactgtggac tttgaaaatt atgaatgtgt gtgtgtgtgt 4500
gtgtgtacat tcagccctcc atatccatgg attttgcatt cacagattca accaaccatg 4560
aattaaaaac atttggaaat aacaaacatt aaaatataac aatacaacaa taaaaataat 4620
acaaataaaa aatatagtgt aacaactgtt tacatagcat gtatgttgta ttaagtagta 4680
taaatctaga gattacttaa tgtataccag aggatgcata ggctatatgc aaatactatg 4740
ccactttaaa ctgataagaa cagatactaa acttcatctt agccaaaagt cagagaaaca 4800
atataactat gccattttac ataagggact tgagctgagc atcctcagat ttcagtatct 4860
ttggagttcc tggaaacaat tccttgtttt atatatatat atgtgtgtgt atatatatat 4920
atatatatac acacatatat atatatatat atatatgata gctactgagt gacaggtgat 4980
attataccat accacttgtc actcagtagc tgtatatgca tatgtatata tatacatata 5040
catatatgtg tgtatgtgta tgtgtgtgtg tgtgtgtgtg tgtgtgtatg ctgtctttcc 5100
tcggtatcac agggaattgg agatatatat attcttttca gtacaaaaaa aattgaacac 5160
agatgggtat ggtaccagaa cagaaggtaa agacacatga aaaaaatttg caacaacatg 5220
aatggaactg gagatcatta tttgaggaga aataatccag gcacagaaaa acaagcattt 5280
tattatttta ggtgaaagac aaacatttta ttttaggtga aataatccag gcacagaaag 5340
acaaacattg catgttctca tttatttgtg ggatgtaaaa atcaaaacaa tagaacgtat 5400
ggaggtagac agcagaagga tagttaccaa aggctgcaaa gggtagtgta ggctttgagg 5460
gtgaggtggg gatggttatt gggtacaaaa aatagttaga aagaataaat aatatctagt 5520
atttaatagc acaacaggtt gactatagtc aaaataacat aattgtacaa tttaaatatg 5580
aaattaaata tatatacaag actagaacac caagttgaat gactccagct tgcgaaaccc 5640
acattgatca ccatgcttgc cccaagggaa gctgtacaat gtctggctcg tccagaaccc 5700
catcatttat cactagcaat ctattgtcca taatcatgtt taaattaata gcattttaaa 5760
ggtacaaata ttttttaaaa aacaaataat tatttaattc gccttttaaa agctttttaa 5820
aaacgttttt aaaaactttt ttaaagtcct gaggactatt ttctttaaag tgctcagtta 5880
cagagctcca tatattgggc tatgatagcc ttacctgatt cttgccaaga atctagtgcc 5940
cagaaaatgc aaatacaaag taagcaactg aaaaataaac aaataagttg gaggtatgct 6000
acctgttgaa atatgaccta gcgcaaacac ctatgccact tgcttatgaa atcatatagg 6060
ttttcggtgt gcagttttga ctgaatgagg gagtttacgc tggaccacaa gggggcccct 6120
ctgtcaataa cgtactccat ttgtgtatta agtcaaaaat gaaatggaag agaaaagaaa 6180
catcgatgac cccaagtctc tttaattgaa tggaggtaaa agggaaacaa cgaatgagaa 6240
aagtactctg cccttttaag aatcttgcat tcacattcct gatgaagtta tttttcctcc 6300
tctcactgat tcccatttca ctctattaca tagcaccgtg ttccccagga gctcctgaat 6360
gaaggacatc actcagctgt gttaagtatc tggaacaata aatatactag tttcaatgtc 6420
taggctatgg gtattccttt ttactgaagg tatgacatat agctgcccag gcctgactaa 6480
attaatagta ataataatta ataatggcaa atttttattc tattaagtta cttggcttga 6540
cttgtagaaa tagcaacatt catctgaaat gccccctcct acacttatgt ctaaggacaa 6600
atcccacata caccacagat aacttcattt tacatgtttt attctgttac caaactaaat 6660
ttttatcata tagtctgttg ctcactgaac tcttcagtaa ttctcaacat accatgtaaa 6720
gcattaagca cagttccaac acagagcaaa tgagcaataa ctgttagtta ttataacatt 6780
attatgtgtt ttcagtgcat taaaccactg gtctgatacc tagcccaaca ttctattaaa 6840
ccacataatc cagttgaata atatatgata atataataaa atggcgataa gtgctaaata 6900
tccagataga aacacagatg gaatcagaca gctttcccaa gaaatagaga aaatagtaga 6960
taggcgatct aggcctaagc actctaagca gaagctaagt tatcacagga tatcttggca 7020
atctgtggca cgtgaaccct tttcttctgg agtctggaac tatgttgcaa ctctcacttt 7080
ctccctatct agagactcag tttgttccct tgtgattatc agcagttgag aaatccttag 7140
accttctgaa aggactactt tttaaattta tatatataat atttaaaata catatcttta 7200
tatataatat atatttaaat atataatatt taaattaata tatatttaaa tatataatat 7260
ttaaattaat atatatttaa ataaataaat ttatatttaa atatataata attaaaatat 7320
atttttaatg aacagagagt aaaggattat tttgaagaga aactcctggt tcccacttaa 7380
aatcctttct tgtttccaag tttttcaaat ggagccctct ttaccagctt gccccctcag 7440
agataagctg ttcccctact tattcagatc tgagatctga aaacattcct tttcctgtga 7500
gttcagctag gacaaagatg gagctttttg ataaaatttg gcaaacacat tttttaaaga 7560
tgaaaatttt taaaaattga aaaaaaaaca tttatagaaa gagacttcta atccaaattt 7620
aacttctcaa actatgtttt gaccggctag cataatgttt cagtctttct ggagaatgcc 7680
ccttgaaact gttttcttct acacaacttc ctcctttcct ttgactttcc tgctctggaa 7740
gggaagaaca ggaagaggac agatcaaatt actcaagagg aaggacaaga aataaggaac 7800
caaattatca acaattggag aaagaaagct gatgtcagta tcatttcata tatgattatg 7860
tcagagtcag gtggataagc caatcctgtt gaatagcata cttttcctgc tactcctgaa 7920
gggtaaagag gtctttctct tacaaagccg tcctagctag taatcttaca ggtgcaaaaa 7980
gcttgttttc atgttatttc ttagtaactc aaaatacctc taaagttata catattatga 8040
aagtactaca gtcacagtgc tgagaaaagg agtaaataag acaatgtata taaaaacact 8100
tggctcagcc cctggctctg tggttgataa atattaagtt agtattcatt attattataa 8160
tttccaaaga gtccattaaa agatatagaa gaagggaggc agcaataaca ctaagagaaa 8220
attccattat ctccaactat ttatcctcta gcccaaaata attgccatta gaaagagcaa 8280
ctttaacaaa aattttaagt tgcaatagat gttcaacttt aaatccatcc cagaaaaatt 8340
tctaaccaaa ggagcataga agatttgatc ttattttcta agtagtatag acttaattgt 8400
gagaacaaaa taaaaacttg 8420
<210> 12
<211> 8475
<212> DNA
<213> 智人
<400> 12
gcataacttg taagaaatgg agtgaggtct cagttcaaac tggcttctgt atgacttcaa 60
agccaaagtc agcaacttag aaggcaaaaa ttataattta gttggcaaat acgagaaaag 120
gtcagaaaca catgaaatga agctcaatag gaacacttac agggtagcag ggtagtagcc 180
tagggaaaaa agtcagacac taaaattgtt taaataggta agttcaaggg acaggtaaag 240
accttagtgg gtaagaagcc aatcagcaga cgaactgcaa gcaagcactg tctctctttc 300
ccttctgtct cctcttgtag taactgacca caattaaggc tgcctagggg aataatgaag 360
taatcctcct attatcagca atggtctgat ccagtgccag gcaccacaga caacttggtg 420
ttcagagaag atccttcaag atgaacaaag ggtcaaaata aaaaattcta gaagagagaa 480
gactgatcac aatttaatgt aaggcttgga aggaactgat ctctaccttc cttaacatct 540
caagaacttc ctcagattca ttggatgttg agtgtgtgtg agtctagtag aaaaatgaat 600
ttttgtttct taacttggat atgtgattag gatgttaata attaagtctg ggctaatatt 660
gaaggtatct tatgatgggc ttcttaaagc attgatcaca aagactgcat gttcataaac 720
tgagctgcac ttgttaggat tctagatgtt tgaaatttct tgtgttattt tggtctcaga 780
tttctagaca aattttctca aattcctatt tcactttttg acatatcatg agtgactcaa 840
atgtttgccc ttgagtcgga aaacacccag cattaggaat aggcacataa acataatact 900
tcaagcttca gatttaagct caattataaa gtgtttaaag gctgtgctga tagttcttct 960
gagtagaatt cctacaacta tgggtttgtc tataataaaa tgttcactct atattgaacg 1020
ccttatttaa aactcgaaat gtgtaagtag taataaagaa aatatgtcct cctgtaacca 1080
aagctaggac cgattacatg ttcacttgac tgacagatac aatcacctat attaggagca 1140
atcagcactt ccttacaaac taacaacttg agatgtagtg ttcccattgg ctatgaagat 1200
tttctttatt tactcagaat agtctgtagg atctgccagc tgcccctgat tataccagct 1260
gcacccaatg atcacagtga acattatttt acattctaaa taactggtgc aaggtgagcc 1320
atggttttct gagtttccta tcacctttgt gtttcaggtc ctcaaatgtt aatttgtaaa 1380
gctgctgttt caggcaaaac taacaaaatt agcatctaat caataaccat actatgtcca 1440
cccatatcct ataacacaga agtaggggaa gagtgagaaa ggtggaagtg gagaaataga 1500
ggcccaaaaa gaaagtttta tcacaggaat atctagatgt cttctgggat tgtctgttaa 1560
agagctgtga cactcatata aatgcagaat tactctcttt cttccttgtt ggttagaagg 1620
ccaagggtgc catggtaata ctaccaaaca tatatcaaag cttggcagga aaaatggtac 1680
cttcagaaat tttataatct gatatcaaat aggtcaagaa atataataaa actagtttct 1740
ttggtttcct tagaaacctg gaaaacttta aattagaaac ttagaaagct ttaaatcaga 1800
ctttgtagtt aaaaaaggaa attttagttc cttccagcat tagaattccg tgattctctg 1860
actctgagcc tggattaaat ctagcccagc tgagtggaaa cttaagtaac tagctggttg 1920
cctttagtga tcttccactt tatggctgct tccgcctaag aagttcatca tcgtgactta 1980
ctttctttgg ggcaaagtcg tgactaactt tctttggggc aaagttggaa agcagaggtc 2040
aaagtcaatc agaaatggga caaactcact tcctactgcc tggtgaaggg gccattttca 2100
gtagcccctt ttcaagatta gtttcattca agatttgata agctgttttg actttactat 2160
agatcttatt atccatgtca gttaagttta tgcttccact aaatctatct gaattcaaaa 2220
ggtaaaaagc taatgctcag tcttatcaga tttatcttat ttattaatag aatgtggatt 2280
tttttaagca tataacaata atagtaatga taggaccata aatgtggatg gctctttaca 2340
agtcactaac attacataaa ttcctcaaca acacactctg aggccataac aaacttttag 2400
aaataacaca attggctacg gaactccagc catctagctt catgggctcc cactttaatt 2460
tcaaaacaac agaactgtgc acattcattt acatgattag ggcagagctt aactgtatct 2520
catgtagcac ctacatcatt cttcagacaa acttattgcc ttttacagac aagaaaactg 2580
gggctcaaaa aaggacttgc ttataactgg ctaataaaga ggaactctgg gttcaaagtg 2640
agtccaattc tttcttccac ccacagcttc tgctaaagtc attacagaaa tgcatagagc 2700
agttcttcca cgttattgct taggtttcta aagagcagtg acctaataca acatgctcta 2760
taatttatta ctgatttaac tatttcacta aggattcact tttaactttt aacttgtaaa 2820
tatgtctaat aaacaccact gaaatagcaa cctctttctt catggccttg tggttgtaaa 2880
gcaagctagt aatatatgtc tgtggatttg tgctaataaa gttctataca cctcattaat 2940
tccacaaatc ctactgggta tttcttatct gccagatcct acgctaggta ctggatacac 3000
agtactgaac aaaatgggta caaatgagcc tcacagagct tgtttcattg aaaagcagag 3060
agatacacac taatcaacaa attaatagta acacactacg atgtgttttg aaggaaaatt 3120
agagcatcaa agagacggtg ttagcaggtg gaggggagct cttttagatg gagaatgaga 3180
atgcctccct aaagacatgg gaataaattg agatcacaaa aaatgagaaa tagccagcct 3240
tgagaagagc agaaggaaga acattcaaag gaaaagaaag tgcatactgg aaagcctgaa 3300
cactagagtt tggtgtatgt aaggagctga gcaatggtca cttgtgtgat aagatgtgtg 3360
gatgtggggt ggggggcagg ggtgagtccc acgcagctct taagtgtgtc ctcagactcc 3420
tgtggtttcc atcagccaca acctgaataa ctgtgtggta atccaaaaat gattacagat 3480
taaacatata aaaatatcat tacacccata gtacctaagc caaggacaca gtattctatc 3540
ttttcaatga agatctgcat gaagtaaaat tattatatat aattttaggt attgatatag 3600
atacatcagt ggatagatat agatatgtgt ctctggtata gaaaaaagtt ttaaagggat 3660
attaaaagtt cttatcttgc agggttgaag attgtggcaa ctttcatttc tttttaattt 3720
taagaaaaaa gtggtattat gggggattag catgtttgtg ggtatatgta tatttttaat 3780
taaaaaataa acaacaaaat gaaaacgttt ttcttctatg aaagcctaat aagaagaaat 3840
ttcagctgtt ttaacttagg gagctaaaaa catcaaatcc aagaatgttc tctggaactg 3900
agctcaatac atttttattt gagtaagaat tggatacatt tccatcccct tggggctcca 3960
gtctgtcaat attttacttt tcagcgataa aaagacacat gtagataatc acagtgacct 4020
cagtaacttt ccttctctta tttaagttta ttttatttct atcgtagttt tccctgttaa 4080
agattttttc tttttgctta catatataat tttagagaat aacaatgcac acacaaaaaa 4140
ttcctcttgt tctgctagac ctggactttt tctctaatat atatctccat tttttgtctt 4200
ttttcagacg tattttggaa gcaaaggaga gaattgctat atagctgact tcctcttctc 4260
atcaacagtg ttttaacagt ttttaagcaa aagtcagctt tgtttatcta agattttttt 4320
tgctggcatt taacctaccc ctgcctcccc tttcccaagt ccacttcagc caacctctca 4380
ttcgacaggt accaccctct aacataactg aaataatgtc taccattact ggatcttgct 4440
agcaaagaat ctcaaatttt cccacttggt tgtaaattat tttgtaatct ctagtgttta 4500
aggtgcgctt gtcctatcta atcccctccc tggcaggaca ccttacagaa cctacccctt 4560
acactagtca ttaagcacca tcagggacgg atggctgtgt cactggtctg tttggtattc 4620
cctactgatc ctaccatgtg gtgattatct atgacttccc taatccctgg ctgccttagc 4680
tgggactggc tgacatgctt ctcaggttgc cgctggcttt acagtccttt actgcccatg 4740
ccactttgga gataggcagg gctagtactt ttctatataa gcccccaaac ttgactttgt 4800
gtttcacagt aggtgaaaaa gttgggtctc ttttctttta cttttctttc cacaagatga 4860
taaagctagg ggaagcctgt ggacatggtt tatttctgca actgcaatga ttgattggtg 4920
cttcctgctg cttacttcct aaactttgtg ctcagtgtca gatccctagc agtttctatc 4980
ccctgctctg ctaaaaaaga atggatgttg actctcaggc cctagttctt tttaattaaa 5040
ttgtattttt gttatcatta ttattattat tattttgaga tggggtctta ctctgtcgcc 5100
caggctgaag tgcagtggtg caatcacagc tcactgtttt agcctcctga gtagctggga 5160
ctacaagcgt catgccacca tgcttctttt taatttttta aaatggtttt ctgccttcaa 5220
ttctaagcac ttctcaattg taaccaagag ataatacttt ttatgaattc ttaaagttat 5280
caacagatac tcaaagtttt agcaaagtct aaatgatatt aagcttgtcc ttattgccca 5340
agtgacttca atgactattt gttaattgca accaagggtc attttttaaa tgaatatata 5400
ttattattat atatataata ttaaggtcct caaataccta aaagtttagc aaaatctaaa 5460
taatattgtg catattcttt tattactgta ttagtccgtt ttcatgttgc tgataaagac 5520
atacccaaga ctgggcaatt tacaaaagaa agaggttcac tggactcaca gttccacgtg 5580
gctggggagg cctcacaatc acggcagctt acgggattgt tgagaaatga cacttctcaa 5640
gctggggcta aactatctct gtggtagttg ttctgattca agtattgaat tggttttttt 5700
tgtttttttt gagatggagt ttcgttcttg ttgcccaggc tggagtgcaa tggcacgatc 5760
tcagctcacc gcaacctctg cctcccgggt tcaagtgatt ctcctgcttc agcctcccaa 5820
gtagctggga ctacaggcat gagccaccac acccagctaa ttttgtattt ttagtagaga 5880
catggtttct ccatgttggt caggctggtc tcaaactccc aacctcaggt gatccacctg 5940
ccttggcctc ctaaagtgct gggattacag gcataagcca ccgtgcccgg ctggagcatt 6000
ggtatataaa agctgcctag gtaactctaa cctttggccc catacatctg aaggatacct 6060
acaatgcacc tgaaaaatgc aactgaaaca gtagttccct gggaccacac actcagaaag 6120
ggggtgtatc aggagatcta gggaccagga gggtggaaga cctaaggcag cactacagat 6180
gatggagaaa aacccactgg ggaggggcga tcctaacctt gagaatcact gagatcatgc 6240
agaagtattt gatcctacag cattaatatt gtattgtatt gtattagtat atatatatag 6300
tgtatatata tagtattagt atatatattg tattgtatta gcatatatat actaattgta 6360
ttgtattgta tttatatata tagtattgta ttagtatata tatacagtat atatgtatat 6420
atactaatac aatgtactaa tacaatacaa taccatatat atatacacta acacaataca 6480
attagtatat atatatatat atatactaat acaatacaat actatatata tactaataca 6540
atatatacat atatactcac caagacatat tagtggtctg atgtctggct gccacactca 6600
tcttctacct tcagctctgc tctaccaaat atcatttgtt tctgggatct ttgcagtcca 6660
aggaacttca tccttgatat cccacccctt actaactttt tttttttttt ttttttttga 6720
gacggagtct cgctgtgtca cccaggctgg agtgcagtgg tgtgatctcg gctcactgca 6780
agctccacct cctgggatca caccattctc ctgcctcagc ctcccaagta gctgggacta 6840
caggtgcccg ccaccacacc aggctaatgt tttaccgtgt tagcaaggat ggtctcgatc 6900
tcctgacctc atgatccatc cgccttggcc tcctaaagtg ctgggattac aggcataagc 6960
caccgcaccc ggccacccct tactaatttt tagtaacgtc caaggattaa aggaaatttg 7020
ccttacctat ttaacaggaa tcaacagggt taatctcact ccctttctaa aaataattta 7080
taaacattgc agacaatctc atctatccct gtctaaactg tgtggaatta ctgccattta 7140
atgtaatcag tctactcatt tagtttgcct aaggaatttt tgaaaaaaca gttaaatgaa 7200
tgacttaatg gaataaccag gaagttgaag tctccaatag taagaatgaa ctcttgctct 7260
ctggataatc aaatgggtcc ttcctccttc aggtagatca tgccatttcc tcacttacac 7320
tgaacaggta aacaacataa ttactgactt caacttctag ttaattcctt cttttatcac 7380
tgagtatcct ttggctggga gttttgttgg ctatgctgcc attttttcta gttatcacag 7440
tcctataaca taccaatcct tcaatataac tcatctttaa attgtggttt taccttctca 7500
agaagttatt aattatgcca gtgctaaatc ttctaaaatg attgttgact tgttgattag 7560
cccccatgca attcccctct cccgtccctc agcacgtaag gaatggccct ttgcttactt 7620
ccacagatcc ttaaatctac cagttagaag ctaatagcct acctctctac caggaaggaa 7680
ctgtgggctg gaacataata catgttgact tataatttct tagaaaattg tgtgagaaac 7740
atcaaactcc tgattccagg atatgccaaa gacacatcat taaaaagcaa aacaaaacaa 7800
aacaaacctc atttgacgtt gctagtagtg gcatatttca tcaagatcag ctcaaataaa 7860
tagaagtgag attttcacac aaattagact gtagtgcttt tttttttaac ttatctttac 7920
catatgattt ttaacggtaa aaaaaatcgt ttgagatatt agatgtataa tatttatcat 7980
ccaattactt cattagttca atcttttttc aatggcgctc ctgcatctga gaataaggtc 8040
agaaaatttc atgttctgat ttcatgctga ttttcagaag aaaaatgtta gttttgtata 8100
gaataaccca tcctaagaaa tacatttctt attatatttc ttatcttata tttcttagga 8160
caatgagcta ttcaaagggt gatgataacc agcaccatca gtcagcatta tctaagaata 8220
agaatctgtg tttctacata cagacctcct aaaaaggaac ctacacttaa caggattccc 8280
caggcaattt ggatgcacat taaagcttga gcaacactgc attagaaagt tagttttcca 8340
tcacaaaaac agtaacaaaa ggaatataaa gtaagttact ttaataatat aagaagaggg 8400
gcaggccggg cgcagtggct cacgcctgta atcccagcac tttgggaggc tgaggcgggt 8460
ggatcacctg aggtc 8475
<210> 13
<211> 8401
<212> DNA
<213> 智人
<400> 13
tttcatctaa gactacattt ctattgtttt atataatcag cccccctaag atcaacatgt 60
ccacattttt tggcaaagac aaagcctact gatttcagga tcattatttt cctttttcaa 120
aagcacaaac ccaaactgag aaataaatca agagaaattc tccttttttc tatgctaatt 180
tagaagtaga gtctttattt cttttcaaac ccaaagagaa tcagacatac aatatgaatt 240
tatctacttt cgcttgctca gactgagagg aaagattaat attttcaggc tgttagtcaa 300
aactgttcat tcaaatatta tttaataaaa tccaagaacc agctaaaaag tcgcttaagc 360
taagaaacct tcaccagcct catgggaaat tgtgtacagt tttccactag aatagcctat 420
aaatgcttac tgaaaatgtc taagttcata tcttggtaac taacatttta attcaatctg 480
cagaataata tatgcttctt tagtgctaag atatgaatat tagaggcatt ctttcttaaa 540
atttctattt agttatactt tcacaaataa ctatataata ttaaaattct gcatgtggca 600
taaaacatat tttaatggag aaggtaatgt gtagggagtt tatttctgtt tgctattaga 660
acttgtgttt attcttggtt aaaaaaactg cagattacaa catagaaaaa aacaaaagta 720
tgttgtatat ctcttacagt agaagataaa gagtagttct aaatttagaa aggaaaaata 780
aatatacaca gtgaaaatat gtgtcagtga gatgttaatc aaagatcaac tattgctgag 840
accagcaata ttaaatccct gcacaattac tcatattata atgagaattt taaaaagaaa 900
atatgaacac ataacataat gaaggcagaa gtcactctca tccttcatct ttgtattccc 960
aattcaggaa gctggtatag tatcttcatt ataattacta ttcaacaaac atttgtaaaa 1020
tgaatgaata aggaatgaat gatgagaaaa atgataaaca tctccctctg tctcctggga 1080
gttaactgca ctactttctt ttaaatttaa ttaatcctca atgtccttgt aaaatagcca 1140
aagggaaaat gtatttacat tactctaaat attgatgcaa tctacaaaaa gtgttaaaca 1200
acttcctcaa agtaaataaa atgttcacaa tccagctagg ataaaaggat ttaaatcatt 1260
tcctaggtag agggctttca attagagccc ctgctgcatt aaccatggga actcatctca 1320
ctctcttcat gatggagccc tgagtgttgc tgctaatctg tactctacca ttctaatgct 1380
tttaaggttc cttttcagcc cttcctcctc gtaatccaca aatactgaga ccaaggcatt 1440
ttttgggtca gtcctaattt caagcattct atcctgccct ccccaaatga actcacactt 1500
attagaccat atgttcctat attagttcag gaagggggaa aaaatgttaa tcacacttgt 1560
atataagaga tcatagaaaa acagtttact aacctgtgaa aataccattc attctctgtt 1620
tacctctggt ccacagctaa gcaatcagca ggatataaat gtaccctatg ttcactattc 1680
agtattcata agtatactac ttatgaattg gaaatctgac acaacattta catgacctaa 1740
ttttgaaaat ttaaaatagt gtaaggcccc taggcttaat tttacagggg aaagattaaa 1800
gggacacaag caaacatata ttctctctct gtgctgtggg acactggtaa ttttttgact 1860
taaaatattt gatacttaaa atgccaaact tctacatttc tgcagtaaca aggcagttat 1920
catattgaat accatttctt tctctccagt aagtagagtt aatattagca catgaactga 1980
aaatattaag tgattataaa aacgtccaaa taaattcatt aaaatttagc ttggcaaaat 2040
gttagtttca tgttcttggt agaagtcctt ttatatttat attcaaatga aatgaacaat 2100
ttacaagcaa aggaaatggc atcaaatatt tcacaccctg cctcccaagg tgtattgatt 2160
catgcttttt gctcagatct aggtttctcc actcaggaaa agaggagaat gtacccatac 2220
ttgggaaaac aagtttccga tggcacagct ttgatcaaac agcaaaattc tatccatcta 2280
tgtattgcca tctgacagta tgacaaatgg tcccatgtgc gatattcaca ctgcattgca 2340
gtcaaacctg taagtcaaag gatatgaaat aatagtaact atacattaag cacagaagaa 2400
aatgaaacaa acaaaaaggt tttaaaccaa ccaaaaatat gtcttatttt ggatgttcta 2460
tatgttctta cattctctca ggtcttttgt gtcattatga acacaattct aacaagcttg 2520
attattttat ttccattcac atattacagg caacaagctg aaaaagtaga acggggtgta 2580
gagagacagg acaaagtaca gattagggct tgaagtgccc ctgaccagtc gacagcaacc 2640
acatggaata atgactcatg tgcattaatg atcacactaa atgatatttg tttttttacc 2700
tagtccttca actgacagct taaagaactt caggttgttc tgattcttga gcctcctcta 2760
cagcttcaga gaggactttc attttatttt ggatcaaatg ctccacaact agttgaaact 2820
ggaattaaat tttatatgaa gttcctagat gatttaaagc tgtaagaaga agaataatga 2880
atcataagaa aacttgctgc tacagatatc aaaaaggaat gttaccatcc ctcatgctaa 2940
tccttttcat tttaaataaa caggatctaa aaaaaataat gctgggaagt cctaaccaca 3000
tcaagaatgc ctcagatcag tgacccaggg aaccttccag aatggatgaa atagacccaa 3060
agctgaattc acctaatttt agggccaaaa acccaaaaaa caaaacaaga ccaaaaaaat 3120
cttcagatac tgggagaaca aatctcaatt gctcaattgt atcttatgaa aacaattttt 3180
caaaataaaa caagagatat ttaagattca ttaagttctt gtcatttcaa attttaagaa 3240
aaatattttc taatggaatt acatatattt atatgattct tctagttata tccatggtaa 3300
taaatactct tttcagttgg aaataaaacc catttgtgct atattattag ggaaaatatc 3360
tacataaatt agtttttaat ttaactaaag tctatctttt gaattcataa gcataaaatt 3420
ttaaccactt gcaaaattta taacacactt aaggtagtca gatgccttgt caagtagttt 3480
aacaaaagtg attttcacct gtttgtttta ataacagtgc atcgatttta tgaaaatcag 3540
gcatgccctc gggtcctaac aaagtatacg aagctgaatg gatctatgcc aaatatgcca 3600
gattttactt tctgagtctg attttatact tctgtcctct ttcttaccac atggcttcca 3660
gtatcactta cagactaacc cttcaaaagg agaaggctaa gttactaaca tttggaaggc 3720
ttatgaaagt gaagcatagt tatgagccag caatgttttt atttagggaa tgtgtgcaaa 3780
ccatacactt aagcaagctc tggggaatga gagttggggg gaatcaactc ttttatttgc 3840
taattggtat ttcctttaaa agatagagtt cttccagatt ttaactgtgt taatagttac 3900
tctagaaaaa ttggagattt gtgtgcatat attttatgtt gtaaacagac acatacccag 3960
agacactgag agagacagac agacagtaaa cagaggagca ctaaccacaa acggtttaca 4020
aatgacctct gtgctcattc acctgtctgt tccccacctt gccttttata gcaactatag 4080
caacagccat gagagtcatt gtggaaagaa ataaaataaa attaaaaaat cctggaagct 4140
tgtaaagaat gtgagcaaag gggaggaagt tgtgaaaaaa atgaataaag ggcaccgatc 4200
cagagtattg aagaaggcag agtggagagc ctagtaatga gtatctggta ccccagtatc 4260
ctctcccaca gaatctgtac agctctccgt ttatgacagt ttaaacttaa tttaaattat 4320
caaacagaca ctttcctcaa acatataaat gatgaggcag ttcattcagg ctgtatgtat 4380
aaagttgttc cagccacctt tttctaatgg cttctctata tcttttacat ggagacaatg 4440
agagatttgc ttaggacaat ttgactgtaa tttagaagta ggaaatggga agtatttgta 4500
tcttctttgc ctaactcaca ttagttactc aagtaagcat ttcttccgtt attgcatttt 4560
cctgattaca agttttatgt tttctctaaa acacatatca aaagaaatgt cctaagcact 4620
atgcaggggg aagccatgac atttatccac cactgtcagc aaaaacatga acttagccct 4680
caacagaata tttcacttca ttctagtgtc acctctgcgt cacctgcact ggagtcacca 4740
cttgcctgtt gggtaagacc aggatgcacc gctgaaataa aaaggggtca gacaatacaa 4800
gaaaagccag tagaaattgc caaatgtatc agaatacaca caggctttct aaggatatgg 4860
cccaagagga aggctctaga gcccaccctg aaacaggatt tttgacttca cagataaatt 4920
atttaatttt caataacaca attcaattaa agaaagggaa atacaaggct aaacaaataa 4980
gaaatgaaga caaaaaccca acctttcaaa tctaaagaaa ataatctgtt ttaaagacac 5040
agatgaagat caggaaccca aaacagaaga aaggaaaggc aattaacgct ggcatctgat 5100
aacaacgaaa agtatggagt ctggagaatc gctagactct aaaaattata aaggtttaga 5160
cttggacttt gtacactgaa gaaaagaaaa ctgcatgcat ttatactgac caatgtacac 5220
tattgctgct ttttaacttt tgtgtatatg tagggtagat ttttttttaa gtgaaagcaa 5280
gcttattaag aaagtaaaag aataaaaagg tggcttctcc ataggcagaa aactagcgta 5340
gtttttttat tagaaattgt tattcaataa tagtacatgt tacaaataaa taccatttta 5400
aactgaaaaa attgtagact ttcaaatcag ttagggtggt caccctaaaa aagggcattt 5460
tttcccctta gtctccttgt tcatgttgct cacaacaaga aatgggctaa tgctatgaat 5520
aataataaca aacactgcct tctgtcaggc cctgtgctga ataccgtctg catatgtata 5580
ggaaagggtt aactcagcag gtcttgtttg cccagactct gtacatttcc aagaaaggtc 5640
tgcctttagg actggtcctt ggccagctcc tggagaatga gctctcagct tttagaaaat 5700
tctatctgct aagaatagtt ttgcatgtct caggtcttgg gccacaaaat atcagtttaa 5760
tcagatggtt tatgttaaca agtatgattt atggcaaaca tagatctcta atctccattt 5820
ctctctcata tatctatatt tatctatcca tatatatgta cctatatata tcaaatatga 5880
agatatgttt atagcaattg catataaata gagagatagt atgtagtagg aagagagaca 5940
tagatattat tcttcatttt agaatgttat cttggtatgt ttaaaaggaa aaacttaaga 6000
tgtgttgcaa ttgcagtatg agtttcaggt atgtacatgt tatgtgtgtg tgtgagagac 6060
acacacaaac acatttcaaa catgttttat gtttaagctc aatattcaaa cacagaaata 6120
taacatctat tcttaatatg ttttatgtaa gtacagcagc agcattatta aatactgtat 6180
ttctatggtg attgaaaatt agtaggcaga gaatttttgt aatggttctt aataattttt 6240
gtaatagtaa atgattactt tttgtttagt atagttttat aatctataca tgaataaagt 6300
ggatatttct attcatatag aaatgtgatt tactctcatg tacttatcta catgctaaaa 6360
ccataagtta tcaattttag ttctgtgcca aggcactttt actgaataaa aataatcagc 6420
taattttata ttttcctgat tcaaatttat atgcccgtgt aatgttccgg ggtttttttt 6480
tttaatttct gtaaatcaga atattcagat gttgaaaaag tctttgcctt cagatttaaa 6540
agataccttt gaaatgtagc atatcccaaa atgcaaccca gaggctggca atgtcaacat 6600
ttttctgttt taaaaaacct cttatgaaaa ctattgccat actaaatttt ttacttgctg 6660
atgacttaca gctggaaagg attctgtaca tataagacat caaatattga ggatactgga 6720
acttttaaat taatggcaaa gaaagtcaac aaaggaagtt catatgaaat caaactagta 6780
atatgattac aaaaaaaaaa gtttaaaatt tttcttggcc ccagtcttat catttctgag 6840
ccaaatacaa ttctatcgaa atcacctgaa actgaaatca ccattctagg ctggttttcc 6900
cataaagatg gactgctcca aaaagaggaa tcaagaaaga atttggctca cagtgaatta 6960
ttcactttgt cttagttaag taaaaataaa atctgactgt taactacaga aatcatttca 7020
aattctgtgg tgataataaa gtaatgacca cttttcagct ggagggacta acttcttttt 7080
tttttttgct gcatatatag ctgtggtaca ttttaatgtg aaatgatgac tgcatcagct 7140
tatatccatg gagcagattt tagcattcag cttgggtctc ccagtcaata tctacgagtc 7200
tcttcttaag gagatcgatg acacagatac atacagacta acaaatgtga taccaataat 7260
caagaattca ctcagttaag attttgccca ctgatttcca cacaagaaac ctagaattta 7320
ctagattctt gtgcctgtga ggctccactc atttccctga atcacaaaag ctacagagta 7380
tttagataga aatataccta ctcttaacat gaaccatttt aaatatatgt attactgtgt 7440
ccacaggagt acactttaaa gcagggactt cactcttcaa tctctccaat cacgtgttac 7500
ctaaagtggc atgtggttcc ctaaagctta ataactgaca ttgccttaaa aaaggggttt 7560
gcttcccgac taatgtggaa aaagtctgaa aaatgatttt aaatctttca ctaaatttct 7620
catttggtca cgtggaggaa aatgatttca ccaaatagat actctcatta attttttaat 7680
gtaatttatc aaagaaatga aatatttaga taaattccag atttccccca ccatgagctt 7740
ctccgaaagt atactccatc acagactgct cactaagaag ctctactgca gtcaaagtga 7800
ccgaatttaa ggggacataa tgactacttc tgctacacag aaacattatc catctctaac 7860
acttccctat gagatggaag acggacttct aatcaggtac cagagagggc tctgccaact 7920
tcagggcttt gatgaataag aatggttgag agcgctcatc ataaatgaat tcagtataac 7980
tgagtgagaa agtgagagaa ccagagaaat aaatcctcat gtagaaaatt taggggtatg 8040
aaatgccaaa tgccagttaa ccaaagcttt ctttgtcata aagcaacttc tataaaaatt 8100
gctgaaaata aattcttcat ggctcaatgt gaatcagtaa tttccatctc tattacactg 8160
ttgtttaccc aaaaactatt tttaatgact aagactcaga gtttgccaga gtgttttcca 8220
caaaacaact gttttgagat actccagatc tgtaatcaag taagtctgaa aaaccccaaa 8280
tacctcactc acctcttgga tatgcataaa gcacactaat atataacgtt ctaaaaagcc 8340
aatcattaaa accgttttat attgtttaag catttcctag acatatttgg ctacaaatct 8400
a 8401
<210> 14
<211> 8427
<212> DNA
<213> 智人
<400> 14
gcacctgcca ccacgcccag ctaattttct attttcagta gagatgaggt tttgccatgt 60
tggccaggct ggtctcgaac tcttgacctc aggtgatcca cccgcctcag cctaccaaag 120
agctgggatt acaggcgtga gccaccgcgc ctggccatat taacaaattt taaatcacaa 180
ctatgtgggg ggggaggcta gtattattac agcagattgg tttgctatat aaacaagtac 240
tttaaaaaat atttcttggg ccaggcgtgg tggctcacgc ctgtaatccc agcactttgg 300
gaggccgagg tgggcagatc acttgaggcc aagagttaag agaccagcct ggccaacatg 360
gtgaaacccc atctctacta aaaatataac aattagccag gcatggaggt gcatgcctgt 420
aattccagct gctcgagagg ctgaggcatg agaactgctg gatcctggga ggcagaggtt 480
gcagtgagct gatattgcgc cactgcactc catatccagc ctgggcaaca tggcaagact 540
ccgtctcaaa taaataaata aataaataaa taaaactaaa ggcagagttt tcttaaataa 600
acatggtagc cctcagcaac aatattgtaa gaactcctcg caagagaaaa agctggaata 660
agatactggc taagcaagta agaaaggcac tgccctgctt ctgcatacat tcaaactaag 720
acatatacat tgcagcttac acttacattt tccaatatcc ccaggcatcc ctttcccttc 780
tcaaacagcc aaaaggaacc agccatgcaa ataaaaatac aagttcaaga gcctaaaaga 840
agtcagtgtc ctaaaagaga aaattaatgt aaagaattaa gattttttga aactacactt 900
tctttctggg gctgtttact ggcctccaat acatcaatcc tgtaacactg tgaactacag 960
tgatagattg gtacatgctt ctaaacacaa cagaattttt ccaaggttac atacactgta 1020
acaaaagggg cattttgcag catcttattt tccttaatca actagtttgg atattctaac 1080
agtgcaaaca ttgtaaacaa taaattttca ttaccttttg aactttctga agtcaaccaa 1140
aggcttgtgg tatggatgca atgagtacta gacaggcaga gctgaatact agtcaaaata 1200
ttcagttact ggtgtgatag tccttttggg ggcatacatc acttagggag aaactgaggt 1260
gcaaggacat tttacacaca gcaaaaacat tctcaggaat ttgtcacatc attaccataa 1320
gccaaaaatc tcaaggtctt agaacagcct gagcttctga tcaaattata ttgtaaaaag 1380
agaggaaaaa aatgtgaagc gtgctatttt ttaaaataac agtaactact actactgctg 1440
ctgctgctaa ttctaaacgt ttactgagcc cttattatgt gccaagcacc gtgctaggta 1500
cggtcataga ttttaacaat taatccctgt aacaaccctc tgatattagt taataaaatt 1560
aaagtagaat cctcaccaaa aaaatttaaa ctttccaaat aaaaatataa ataaattatt 1620
aaagacattt cacctctttc tctgcctcag actacatttt caagtattaa atttacacta 1680
aaaccacatt tattttcagg aattccagtt aaagcgtaca gatattcaag atgttgacaa 1740
ttattacaga agaatcacag aactctgaaa ttaaatactg gcacagaaaa ccttccatcc 1800
aaccttacgg aacaactatc cccattttaa aaaaaaagga acagcatata tatcaggctt 1860
gataataaga ggcttctcat gcccacacta gcaatgaatg atgccataat tataaagaga 1920
cctgtatcgc cacatgcata aaaataattt acatctgcta agtcaagttt tcaatatatt 1980
attttgtgtg taaaccttat agtagctgat aaaaaataca ataaactaat ctaaggtaaa 2040
ctaaaacact aggttgtttc tgaagactca ctttagaatt tgagcagcat aataatcata 2100
atattagtaa tcaaactact tagcagaaag ttcttagagg gctgggaagc tgtgtataat 2160
aaaatggagc agacaagaag gaagggtttt ccgtactgtt taaatcaact acaggtccca 2220
gcatgcagtg ctctaatctg aagttaagca aaaactgcaa tgcatactgg gacttgtagt 2280
aagtaaacca cgttatcaca gcaagtttca agaaagtctg aactatctag cacaatttga 2340
ctatatctta ttatcagagt ctaatcaaat ttaaatcaaa tttgtatgtt ctctgatgtg 2400
gcacacagtt tctctagcac ataccggaaa aagtatcaat atttagacca acattttcac 2460
attagaaaaa tcttacgtag gagaagcaca gaaaaaaatg ctgaaaaagc aaaaaaactt 2520
gatgaataaa aaatataatt tttgaaatag ttttttaaag tttgaatgga tccatttcaa 2580
cattctctaa tcctccccca caaaaagttt aattgttttg gccgggcgcg gtggctcacg 2640
cctgtaatcc caacacttta ggaggctgag gcgggtgaat tacgagatca agagatcgag 2700
accatcctgg ccaacatggt gaaaccatct ctactaaaaa tacaaaaatt agttgggcgt 2760
ggtggcgcac gcctgtagtc ccagctactc aggaggctga gacaggagaa ttgcttgaac 2820
ctgggaggtg gaggctgcag tgagctaata tcgcaccact gcactccagc ctggtgacag 2880
tgtgagattc attctcaaaa aaaaaaaaaa aaaaagttta attgttttaa caggttgctt 2940
tttaacaatt attcaagatg tattttataa ataatttttc ttgaagaaaa ttctcagaag 3000
caaacattcc ccatattcta atattgccca ccaggaaata atttttttag taatacgcac 3060
acaccccatc acaaaaacaa acaaaaaaca ctgaagttct gcttttgtca agtccttact 3120
caatatttat gccctccatt cctcacctct aattccctac acacacacac acacacgcac 3180
acatccccac acacacacgc ttctacaaag aacacttaga aaaacagtat tccaactaca 3240
agcccacttc tctcatccac tgacctcttc tgaaaacaca aaagattttt taagctatca 3300
gtaacacgtc caaacacaag ctgataagtt tgagctagaa tttacatata tacagttgct 3360
acacaccctc ctattttctg caagtctgtg gaaggaggct gggaaagaac taagtgcaat 3420
ctgcatcagg aggcctaaca caggtggtgg gttattttca ggcaacagca ccttcacaaa 3480
catgttttgg aatatagtcc aagaaattcc taacaaggaa agataagctg gcacacaaat 3540
ttaacgcaat ccagctaaaa atcatctgca acacatgcta ctacatttca ccataaaagt 3600
gacgggctac tataaaggat ttgaagcttc gtcaatacaa catactgtcc ataaggccag 3660
agatagcagt tgccatggtt actataccca cttttatcag gaaattactg tcattacccc 3720
aaagttttgg gtacttattt aaaatttaaa aaaaacacac acaatttagg gttctgactg 3780
ttaattgagt gaaataatca actactgttt gatttgtaag tatgtcgctt tggagatgca 3840
catggttaac aatacttgga tctgcagcag aaaaaaaatc aattcctttc tgctgctcct 3900
tctcctcaag tactgacagt ttgtattctc aatgcagcca aaacaataaa acaaaaccca 3960
tctttttggc ttctgtgttt aagttatttt tcccctaggc ccacaaacag agtcaaaata 4020
aagcctagat catcaacctg ttaggcctca tccccttcct atcccctcca tactggttca 4080
ctttcttgac tacttagaaa aggcagaaaa catttctgta actgattcca aagtatagaa 4140
aagaatagtt gccttcaact gagatatttt caccaaagtc ttttttattt actttttttt 4200
taaggcaggg agaggggaga gacttgcagg gtactgaaag ggagaagtgg aggagtattc 4260
aaattgccac acaagtctag tgtaagaaag ttgctttaga agagtccaaa ggatggctga 4320
acctcacata taatttctaa aagctttgga agagttcacc ataattttaa gactgaattg 4380
agggacaagt aatagaaaag ttattcataa agtctacttc aacattttta caaaagataa 4440
ctattcaaaa atttaacaca catataagaa ttatacgaaa gcctacaaaa tagtatggcc 4500
acatatacac acaaacatac aaagtagaaa acataagcta tttaagaaat aattatctac 4560
aataaattca atgcaatgtt aacatattat ctctttttta aaaaatcgca aagcagcaaa 4620
aacatacacc tgagaaaatt aatgtgatca aaacgttaaa gaattcttag gcctataaaa 4680
aaagcccatg tacaaaagct cctgagaagt caacataaat cattaatatt tcccagcaca 4740
aaataatatg aaaattcaaa catgtttcaa gaaatcagtt ctagatatag atataaaaga 4800
attccattaa aggtcagaga cctaaaactt taattccttc ccttctctgt ttgaatagta 4860
attaaataca aaagccttca gcaataaaat actaaggata caaaatttaa aagcacatta 4920
atataagctt aacttcagta tgtcttcaca gaaagcttta ctattcactg tctgtaggat 4980
gaaaaagtta ataacaccct gagaggtttc atttttatct aaacagttaa gtgtttttct 5040
caccgttcac agaagcaagt ttctatattt actttctaaa gggggcaatt tcaaaagaat 5100
agtcacttct aaaatttaag atactatacc ttttgatagg ctcataaaca cagggttcct 5160
aattatctat attttacttt aaaatgtttc tattccaaat ttgtgagcag agtttataag 5220
aaagctgaaa ctcaaggctt taaacttttg ggttattttt acacaaaaat atttcagtgc 5280
actcctctag atttgagtag tcatttcctt gtgcatcctt ctaaaataga aaaacaaaaa 5340
tgatatatcc atatatacct aatactaaca catacagata tacatctttt tcactgtgaa 5400
acaagcttga aagctttagg cagtaagaat ttttcagaaa gttagcagag tcagtcaaaa 5460
cattcaaaac ttgaaccatg acatctgtta ctctgtcaat aagagtctat agaagaatca 5520
gggaacttac atactcacta aaatcaacta ctatcacatc acatcaatgg agaaatgaag 5580
aaaaactgta ataggggaca tacaattcac aggatcttca aaagggaaaa tgatcttttt 5640
ttttttttta aattatgaga aactgactag gcagcatttt ttcaaaagca gcttcaaaac 5700
tataacaaag acatttttgg taaccacagc agtatttaaa aaacaaaaat ttaggccggg 5760
cgtggtggct cacgcctata atcccagcac tttgggaggc caaggcaggt ggatcacctg 5820
agtcaggagt tcaagaccag cctgaccaac atggtgatac cccgtctcta ctcaaaatac 5880
aaaacttagc cgggcgtagt ggcggacacc tctataatca cagctactca ggaggctgag 5940
aggcaggaga atcgcttgaa cctgggaggc agaggttgca gtgagccgag atcacgccgt 6000
tgcactccag cctgggaaac agagcgagac tccgtctcaa aaaataaaaa aataaaaaaa 6060
ctatagtgtc cagggtgcac tttaaatgta ttactttctc aactgatatg gaaaaagtta 6120
gcatttaaag acagaagctt ctgtccatgt attaattagt tacctatctc aacaacttaa 6180
tatctgcatg ctttcttacc atttatgaag aacttttata tgtattatct catttggtct 6240
tactgagaaa acagtatttt gcctacaaaa tagacaaaat tcaaagcaga tttatcaaac 6300
tttctagcat ccccaaattt ttaaaacttc gacacaaaac tttacaagca accacagtgg 6360
catgatattt tcagtgataa tcaattcacc taacactaac agagtttcaa aggaccatgt 6420
gctataaatg ctatgaaact gttaaagtag ctatattcat ctttatgcag ttactgttac 6480
atcaacaatg acctaccact gatacaactt gacttacagt tcaagaatct cagtctttgc 6540
aggctaactt aagtacatca accatatgta tttataaagc cgagtgccta aaaattgatc 6600
tatattagaa tcatagtctg taaatccgag gggaaaaaac tacaagaagt ctaaaatttt 6660
ttcaacacac tatacccctt tccaaaatct caactactct atatcctatt tgtattaata 6720
ttatagggat gataacaagg cttaaagccc taaatcatac caactacttt tgtttataac 6780
aattacaaat aattttttaa aatacatgct caacatccca ctcatcaaca caagactaat 6840
tccccttcca aataaaataa ttctaaacag tgctctgtac caagggccag aatccttata 6900
ctatccgcaa tcgcacatct actttgtaca gtcaaagact tcactttcaa gtagcaaaca 6960
ttatttatga atggaatttt taaatggact tactcaaaat ctttctggaa ctttaaggtg 7020
ttaatcctgt tgcttagctg aagctaagca gagctgtaat aagtagcaag accctcaaaa 7080
ttcaaaaatt tcctttatct tgctgtagca cctcctgctg gatagcattt agagatcttc 7140
atgtaagcag aagaagagta tttcagaggc agctccttcc agaagactga ataggaaaaa 7200
ggatggaccc ttcaaagcta aaagaaatag gccccatcca tcacttatac cttctaaaaa 7260
tacaatttag cccaggtagg tgtctttttc atctattact actccagttc cacaaagact 7320
tgcctcagtc caaaatacaa catgcttaaa taaagcctgc aaaattgtct aaaaactaag 7380
ttaaaaagca ttcaatagca cccaagcaaa acactttatt atgggcagcc aagcaatgtc 7440
agtcaaactg taaatactat tatgttacca aaagcaaaag tctgatgtta aaaaaaaaaa 7500
aaaaaaagcc cctggaatat tcgtaacatg ttagccagat gtttgtgttt tgagaacttt 7560
gtgcactatt actatgctct tcacttaagg atagttgtac atctacaaac gttttaagta 7620
cagaaatttt tttataaaca ttagcataac tgtacacaaa atttcctctt tgccatgaaa 7680
agataggtcc tgggatttga aaatgtattt ttcagacatt tttaatgacc ccctaaaata 7740
aactagtttt aagcccacaa caccgattcc ataaacaagt aaagacagaa gaagagaata 7800
agaaggaact taccaaaatt aaaatgaata atagtatttc cagtaaaaat gtagtaacag 7860
tttccaacaa tgctgtaaac caaataaatt gtgaaactta aaaaaggaag gagggggcca 7920
gtcttcaaag accaaaagca aagctgacct atttatttct attgcttaga gtgaacacca 7980
gatgtaaaca aatatcataa acactgaaaa gtacgcttac atggtttagc ctcaatttca 8040
gtacccttac caggccctca ataaagctac agatgttggt gagaactcgc tcaaaaagga 8100
gataattcca gcccctcgcc ttaaagaatc cctatcaagt gaacctgtga aaagacttcc 8160
ttcccagagt gcacaactgc tttaaaaaaa aaaaactttc atcagcccaa attaatctga 8220
ttctaatatt caactatcca ttatttatat ataaatgttc ttccctctct aactttccca 8280
gctcgagcat ctacattcct gacaccgact attagcaaaa atgcacaact ccttccccag 8340
ctatggggca aatctttgaa atctgaaaca cagccacaaa gttcactgtc aaggccaggt 8400
gatgaggccc acacatgccc ggacctt 8427
<210> 15
<211> 1704
<212> DNA
<213> 人工序列
<220>
<223> 片段 A
<400> 15
ggtaccaccc aagctggcta ggtaagcttg ctagcgccac catggtgctg cagacccagg 60
tgttcatctc cctgctgctg tggatctccg gcgcatatgg cgatatcgtg atgattaaac 120
gtacggtggc cgccccctcc gtgttcatct tccccccctc cgacgagcag ctgaagtccg 180
gcaccgcctc cgtggtgtgc ctgctgaata acttctaccc cagagaggcc aaggtgcagt 240
ggaaggtgga caacgccctg cagtccggga actcccagga gagcgtgacc gagcaggaca 300
gcaaggacag cacctacagc ctgagcagca ccctgaccct gagcaaagcc gactacgaga 360
agcacaaggt gtacgcctgc gaggtgaccc accagggcct gagctccccc gtcaccaaga 420
gcttcaacag gggggagtgt taggggcccg tttaaacggg tggcatccct gtgacccctc 480
cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 540
aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 600
gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 660
ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 720
ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac 780
caggctcacc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 840
ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 900
acaggcgtga accactgctc cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 960
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 1020
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 1080
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 1140
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 1200
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 1260
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 1320
agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg 1380
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 1440
agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1500
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 1560
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 1620
cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 1680
aggcttttgc aaaaagctcc cggg 1704
<210> 16
<211> 1120
<212> DNA
<213> 人工序列
<220>
<223> 人 IgG1 信号 + 人 IgG1 恒定区
<400> 16
tgctagcgcc accatgaaac acctgtggtt cttcctcctg ctggtggcag ctcccagatg 60
ggtgctgagc caggtgcaat tgtgcaggcg gttagctcag cctccaccaa gggcccaagc 120
gtcttccccc tggcaccctc ctccaagagc acctctggcg gcacagccgc cctgggctgc 180
ctggtcaagg actacttccc cgaacccgtg accgtgagct ggaactcagg cgccctgacc 240
agcggcgtgc acaccttccc cgctgtcctg cagtcctcag gactctactc cctcagcagc 300
gtggtgaccg tgccctccag cagcttgggc acccagacct acatctgcaa cgtgaatcac 360
aagcccagca acaccaaggt ggacaagaga gttgagccca aatcttgtga caaaactcac 420
acatgcccac cctgcccagc acctgaactc ctggggggac cctcagtctt cctcttcccc 480
ccaaaaccca aggacaccct catgatctcc cggacccctg aggtcacatg cgtggtggtg 540
gacgtgagcc acgaagaccc tgaggtcaag ttcaactggt acgtggacgg cgtggaggtg 600
cataatgcca agacaaagcc ccgggaggag cagtacaaca gcacgtaccg ggtggtcagc 660
gtcctcaccg tcctgcacca ggactggctg aatggcaagg agtacaagtg caaggtctcc 720
aacaaagccc tcccagcccc catcgagaaa accatctcca aagccaaagg ccagccccgg 780
gaaccacagg tgtacaccct gcccccatcc cgggaggaga tgaccaagaa ccaggtcagc 840
ctgacctgcc tggtcaaagg cttctatccc agcgacatcg ccgtggagtg ggagagcaat 900
ggccagcccg agaacaacta caagaccacc cctcccgtgc tggactccga cggctccttc 960
ttcctctaca gcaagctcac cgtggacaag agcaggtggc agcagggcaa cgtcttctca 1020
tgctccgtga tgcatgaggc tctgcacaac cactacaccc agaagagcct ctccctgtct 1080
cccggcaaat gagatatcgg gcccgtttaa acgggtggca 1120

Claims (19)

1.多核苷酸,其包含由序列表中SEQ ID NO: 1所示的核苷酸序列。
2.多核苷酸,其包含由序列表中SEQ ID NO: 2所示的核苷酸序列。
3.多核苷酸,其包含由序列表中SEQ ID NO: 3所示的核苷酸序列。
4.多核苷酸,其包含与根据权利要求1至3任一项的多核苷酸的核苷酸序列具有95%或更高同一性的核苷酸序列并具有启动子活性。
5.多核苷酸,其包含与根据权利要求1至3任一项的多核苷酸的核苷酸序列具有99%或更高同一性的核苷酸序列并具有启动子活性。
6.多核苷酸,其在严格条件下与包含与根据权利要求1至3任一项的多核苷酸的核苷酸序列互补的核苷酸序列的多核苷酸杂交,并具有启动子活性。
7.外源基因表达单元,其包含根据权利要求1至6任一项的多核苷酸。
8.根据权利要求7的外源基因表达单元,其中所述外源基因是编码多聚体蛋白的基因。
9.根据权利要求7的外源基因表达单元,其中所述外源基因是编码异源多聚体蛋白的基因。
10.根据权利要求7的外源基因表达单元,其中所述外源基因是编码抗体或其功能片段的基因。
11.外源基因表达载体,其包含根据权利要求7至10任一项的外源基因表达单元。
12.外源基因表达载体,其包含根据权利要求7至10任一项的外源基因表达单元和一种或多种选自下列组A中(1)至(9)所述的多核苷酸:
组A
(1)包含由序列表中SEQ ID NO: 10所示的核苷酸序列的多核苷酸;
(2)包含由序列表中SEQ ID NO: 11所示的核苷酸序列的多核苷酸;
(3)包含由序列表中SEQ ID NO: 12所示的核苷酸序列的多核苷酸;
(4)包含由序列表中SEQ ID NO: 13所示的核苷酸序列的多核苷酸;
(5)包含由序列表中SEQ ID NO: 14所示的核苷酸序列的多核苷酸;
(6)包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少3000个连续核苷酸的多核苷酸;
(7)包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少2000个连续核苷酸的多核苷酸;
(8)包含与根据上述(1)至(7)任一项的多核苷酸的核苷酸序列具有95%或更高同一性的多核苷酸序列并具有增强外源基因表达的活性的多核苷酸;和
(9)包含与根据上述(1)至(7)任一项的多核苷酸的核苷酸序列具有99%或更高同一性的核苷酸序列并具有增强外源基因表达的活性的多核苷酸。
13.转化的细胞,其已经导入根据权利要求11或12的外源基因表达载体。
14.转化的细胞,其已经导入根据权利要求11或12的外源基因表达载体和元件载体。
15.根据权利要求13或14的转化的细胞,其中所述细胞是衍生自哺乳动物的培养的细胞。
16.根据权利要求15的转化的细胞,其中所述衍生自哺乳动物的培养的细胞是COS-1细胞、293细胞或CHO细胞。
17.生产蛋白的方法,其特征在于包括培养根据权利要求13至16任一项的转化的细胞并从所得的培养产物中获得衍生自外源基因的蛋白。
18.根据权利要求1至6任一项的多核苷酸用于在转化细胞中表达外源基因的用途。
19.根据权利要求11至12的外源基因表达载体用于在转化的细胞中表达外源基因的用途。
CN201280068236.8A 2011-11-28 2012-11-27 衍生自人基因的启动子 Active CN104066839B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011-258724 2011-11-28
JP2011258724 2011-11-28
PCT/JP2012/080532 WO2013080934A1 (ja) 2011-11-28 2012-11-27 ヒト遺伝子由来プロモーター

Publications (2)

Publication Number Publication Date
CN104066839A true CN104066839A (zh) 2014-09-24
CN104066839B CN104066839B (zh) 2018-02-16

Family

ID=48535389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280068236.8A Active CN104066839B (zh) 2011-11-28 2012-11-27 衍生自人基因的启动子

Country Status (16)

Country Link
US (1) US9862969B2 (zh)
EP (1) EP2787080B1 (zh)
JP (1) JP6025745B2 (zh)
KR (1) KR101931404B1 (zh)
CN (1) CN104066839B (zh)
AU (1) AU2012344855C1 (zh)
BR (1) BR112014012682A2 (zh)
CA (1) CA2857210A1 (zh)
ES (1) ES2670894T3 (zh)
HK (1) HK1199064A1 (zh)
IL (1) IL232848A0 (zh)
IN (1) IN2014CN03882A (zh)
RU (1) RU2014121383A (zh)
SG (1) SG11201402476XA (zh)
TW (3) TW201329234A (zh)
WO (1) WO2013080934A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109790539A (zh) * 2016-10-03 2019-05-21 第一三共株式会社 Hspa5基因的启动子

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2564227T3 (es) * 2010-07-07 2016-03-21 Daiichi Sankyo Company, Limited Elemento de ADN que tiene actividad de aumento de expresión de un gen exógeno
JP2018038333A (ja) * 2016-09-08 2018-03-15 ライフテクノロジーズジャパン株式会社 細胞の作製方法、発現用ベクター及び細胞
CN112639098A (zh) * 2018-08-09 2021-04-09 第一三共株式会社 Hspa8基因的启动子

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1813066A (zh) * 2003-06-24 2006-08-02 建新公司 新的β-肌动蛋白和RPS21启动子及其应用
CN101605900A (zh) * 2007-01-12 2009-12-16 阿克图杰尼斯公司 乳球菌启动子和其用途

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU725340B2 (en) * 1995-12-22 2000-10-12 Gist-Brocades B.V. Improved methods for transforming Phaffia strains, transformed Phaffia strains so obtained and recombinant DNA in said methods
US20030232056A1 (en) * 1999-09-10 2003-12-18 Corixa Corporation Compositions and methods for the therapy and diagnosis of ovarian cancer
JP4676639B2 (ja) 2001-04-17 2011-04-27 月桂冠株式会社 アスペルギルス属由来の新規なプロモーター
GB0509965D0 (en) * 2005-05-17 2005-06-22 Ml Lab Plc Improved expression elements
WO2009155950A1 (en) * 2008-06-27 2009-12-30 King Faisal Specialist Hospital And Research Centre Cloning-free method of generating transcriptionally and post-transcriptionally controllable expression active linear reporter constructs
ES2564227T3 (es) * 2010-07-07 2016-03-21 Daiichi Sankyo Company, Limited Elemento de ADN que tiene actividad de aumento de expresión de un gen exógeno
EP2611915B1 (en) * 2010-09-01 2015-04-15 Cellagenics B.V. Nucleic acid fragments from a ribosomal protein promoter for enhancing gene expression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1813066A (zh) * 2003-06-24 2006-08-02 建新公司 新的β-肌动蛋白和RPS21启动子及其应用
CN101605900A (zh) * 2007-01-12 2009-12-16 阿克图杰尼斯公司 乳球菌启动子和其用途

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KULOZIK A E, ET AL: "Thalassem ia intermedia:moderate reduction of beta globin gene transcriptional activity by a novel mutation of the proximal CACCC promoter element", 《BLOOD》, vol. 77, no. 9, 1 May 1991 (1991-05-01) *
WATERSTON,R.H.: "Homo sapiens BAC clone RP13-512J5 from 2, complete sequence GenBank: AC108488.4", 《GENBANK》, 8 April 2005 (2005-04-08) *
宫亚娟: "瑞氏木霉纤维素酶基因cbh1启动子突变分析及psi因子合成酶基因的功能研究", 《中国优秀硕士学位论文全文数据库》, 15 October 2014 (2014-10-15) *
董治亚 等: "特发性矮小症患者SHOX基因启动子突变的功能分析", 《中华内分泌代谢杂志》, vol. 25, no. 2, 3 December 2009 (2009-12-03) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109790539A (zh) * 2016-10-03 2019-05-21 第一三共株式会社 Hspa5基因的启动子
US11555204B2 (en) 2016-10-03 2023-01-17 Daiichi Sankyo Company, Limited Promoter of Hspa5 gene

Also Published As

Publication number Publication date
JP6025745B2 (ja) 2016-11-16
US20140342401A1 (en) 2014-11-20
BR112014012682A2 (pt) 2019-09-24
AU2012344855A1 (en) 2014-06-19
IN2014CN03882A (zh) 2015-09-04
RU2014121383A (ru) 2016-01-27
IL232848A0 (en) 2014-07-31
AU2012344855B2 (en) 2018-01-18
JPWO2013080934A1 (ja) 2015-04-27
TW201632625A (zh) 2016-09-16
ES2670894T3 (es) 2018-06-01
CA2857210A1 (en) 2013-06-06
CN104066839B (zh) 2018-02-16
AU2012344855C1 (en) 2018-04-12
EP2787080B1 (en) 2018-03-21
SG11201402476XA (en) 2015-02-27
EP2787080A4 (en) 2015-08-12
WO2013080934A1 (ja) 2013-06-06
TW201329234A (zh) 2013-07-16
US9862969B2 (en) 2018-01-09
KR20140100475A (ko) 2014-08-14
EP2787080A1 (en) 2014-10-08
KR101931404B1 (ko) 2018-12-20
HK1199064A1 (zh) 2015-06-19
TW201632624A (zh) 2016-09-16

Similar Documents

Publication Publication Date Title
US6605432B1 (en) High-throughput methods for detecting DNA methylation
CN107250373A (zh) 通过微流体递送实现的基因编辑
WO2020097372A1 (en) Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear
AU2018200686A1 (en) DNA element having the activity of enhancing foreign gene expression
KR20210138587A (ko) 개선된 면역요법을 위한 조합 유전자 표적
KR20170086027A (ko) 신경발달 장애에서의 행동을 개선시키기 위한 박테리아를 포함하는 조성물 및 방법
AU2023202878A1 (en) Methods for targeted insertion of DNA in genes
KR20220012230A (ko) 스플라이싱 및 번역을 조절하기 위한 방법 및 조성물
KR20210088605A (ko) 유전 장애에 대한 유전자 발현을 변경하는 방법
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
KR20220119038A (ko) 종양 침윤 림프구의 활성화 및 확장을 위한 방법
CN104066839B (zh) 衍生自人基因的启动子
KR20220160053A (ko) 다발성 골수종에서의 면역요법 표적 및 그의 식별 방법
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
AU2018360287B2 (en) Method for determining the response of a malignant disease to an immunotherapy
WO2006022636A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
WO2018209358A2 (en) Systemic delivery of polypeptides
CN1861805A (zh) 甘油三磷酸脱氢酶基因与原发性高血压的相关性
KR102647919B1 (ko) App 돌연변이 세포 및 이의 이용
KR102274721B1 (ko) 난소암 진단을 위한 돌연변이 유전자 및 이를 이용한 진단 방법
US20070292849A1 (en) Methods for Identifying Risk of Low Bmd and Treatments Thereof
KR20240013202A (ko) 안티센스 핵산
KR20230042407A (ko) 포유류 세포들에서 젖분비자극 활성의 조절
WO2006074061A2 (en) Methods for identifying risk of low bmd and treatments thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant