CN101611142A - 用于控制干细胞分化的方法 - Google Patents

用于控制干细胞分化的方法 Download PDF

Info

Publication number
CN101611142A
CN101611142A CNA2006800325011A CN200680032501A CN101611142A CN 101611142 A CN101611142 A CN 101611142A CN A2006800325011 A CNA2006800325011 A CN A2006800325011A CN 200680032501 A CN200680032501 A CN 200680032501A CN 101611142 A CN101611142 A CN 101611142A
Authority
CN
China
Prior art keywords
transgenosis
tsix
cell
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800325011A
Other languages
English (en)
Inventor
J·T·李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Hospital Corp
Original Assignee
General Hospital Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Hospital Corp filed Critical General Hospital Corp
Publication of CN101611142A publication Critical patent/CN101611142A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • C12N5/0606Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/10Production naturally occurring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/40Regulators of development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2501/00Active agents used in cell culture processes, e.g. differentation
    • C12N2501/60Transcription factors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Reproductive Health (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文公开的是用于控制干细胞分化的方法,其通过引入具有Xic、Tsix或Xite序列的转基因以阻断分化和去除转基因以允许分化来实现。还公开的是小RNA分子和关于使用小RNA分子控制干细胞分化的方法。还公开的是通过引入Xic、Tsix或Xite序列进行基因修饰的干细胞。

Description

用于控制干细胞分化的方法
关于联邦赞助研究的声明
本发明部分由来自国立卫生研究院(National Institutes of Health)的拨款号RO1 GM58839支助。政府在本发明中可能具有一定的权利。
发明背景
本发明的特征在于用于开发和维持哺乳动物干细胞及其衍生物的改进。
干细胞是独特的细胞群体,其具有分裂(自我更新)无限时间段的能力,和在正确条件或信号下分化成构成生物的许多不同细胞类型的能力。来源于胚泡内细胞团的干细胞被称为胚胎干(ES)细胞。来源于原生殖细胞且通常发育为成熟配子(卵和精子)的干细胞被称为胚胎生殖干(EG)细胞。因为其分化成所有3种胚胎胚层(内胚层、中胚层和外胚层)衍生物的独特能力,所以这两种类型的干细胞被称为多潜能细胞。
多潜能干细胞可以进一步特化为通常来源于成体组织的另一种类型的多能干细胞。多能干细胞也能够经历自我更新和分化,但与胚胎干细胞不同,定向于产生具有特定功能的细胞。成体干细胞的例子包括造血干细胞(HSC)、骨髓衍生干细胞(BMSC)和神经干细胞(NSC),所述HSC可以增殖和分化以产生淋巴样和髓样细胞类型;所述BMSC可以分化成脂肪细胞、软骨细胞、骨细胞、肝细胞、心肌细胞和神经元;且所述NSC可以分化成星形胶质细胞、神经元和少突胶质细胞。多能干细胞也已来源于上皮和脂肪组织和脐带血(UCB)。
通过与干细胞分离和繁殖有关的近期工作在再生医学和基因疗法领域中已产生相当大的兴趣。干细胞在培养中无限繁殖的能力结合其产生多种组织类型的能力使得来自这些细胞的治疗潜能几乎是无限的。
用于治疗目的的干细胞开发中的主要限制之一涉及足够时间的从自我更新转变成分化的调节,以允许临床医生或研究人员处理细胞用于治疗或研究目的。用于维持未分化状态中的干细胞的当前方法包括在小鼠胚胎成纤维细胞的饲养层上培养细胞,在牛血清中培养,在从小鼠肿瘤提取的细胞的平板涂布基质中培养,和添加试剂,例如白血病抑制因子、成纤维细胞生长因子(FGF)、Map激酶激酶抑制剂PD98059和Oct-4(也被称为Oct-3/4)。所有这些方法在其潜能方面有限,因为其不能阻断分化,且因为可能有动物产品、病原体、饲养细胞的污染,或在人干细胞的情况下,有非人细胞的污染。
需要用于培养和处理未分化干细胞的改进方法以帮助实现这些细胞的全部治疗潜能。
发明概述
本发明基于下述发现:X染色体失活(XCI)使得干细胞能够分化,且抑制或阻断XCI可以导致阻断分化,从而提供了用于控制干细胞分化的机制。此类方法包括靶向和灭活在X失活中心基因座内的任何内源基因,或引入可以阻止细胞经历X染色体失活的转基因。控制干细胞分化的这些方法的使用促进和增强干细胞的治疗和临床潜能。
XCI是其中一个X染色体在雌性细胞(XX)中关闭的过程,以补偿与雄性(XY)细胞比较具有额外的X染色体。这意味着每个胚胎必须配备计数X染色体(XX对XY)的机制,且随后在雌性的2条X染色体之间随机选择以开始失活过程,同时在所有后期分裂中维持相同X染色体的失活。所述步骤分别被称为“计数”、“选择”和“沉默”。此外,染色体间配对也包括在XCI过程中。
这些步骤受到称为X失活中心(Xic)的主调节区的控制,所述主调节区包含许多罕见的非编码基因,所述非编码基因一起发挥作用以确保XCI只在XX雌性中、只在1条染色体上、且以发育特异性方式发生。在Xic上的3种非编码基因Xist、Tsix和Xite与这个过程有关,且每种产生RNA而不是蛋白质。Xist只由将来失活的X产生,且产生“包被”失活X的20kb RNA,从而开始基因沉默过程。Tsix是Xist的反义调节物,且通过阻止Xist RNA沿着X染色体伸展来发挥作用。因此,Tsix指定未来的活性X。Xite连同Tsix一起发挥作用以确保X的活性状态。Xite产生一系列基因间RNAs且呈现具体的染色质构象。它的作用增强了反义Tsix的表达,从而与Tsix协同指定未来的活性X。Tsix和Xite一起控制“选择”步骤,而Xist控制“沉默”步骤。Tsix和Xite还通过X-X配对调节计数和互斥的选择。
本发明基于下述发现:通过过量的Xic、Tsix和Xite或Xic、Tsix和Xite的缺失中断XCI过程可以阻断分化。在本方法中,XCI过程的中断通过使用来源于Xic、Tsix或Xite序列或其片段的转基因或小RNAs来完成,将所述转基因或小RNAs引入干细胞内且阻止干细胞经历X染色体失活和在培养中分化。转基因的去除逆转对分化的阻断且可以根据需要诱导干细胞分化。在不存在细胞或动物产品污染的情况下,这些方法允许临床医生或研究人员有足够的时间根据需要处理干细胞,以增强其治疗潜能。小RNA分子的使用避免了去除转基因的需要,因为小RNA分子具有有限的半衰期且将自然降解。本发明的方法还减少或消除了使用饲养细胞的需要,由于被饲养细胞污染的可能性减少这还导致细胞更适合于治疗目的。因此,这些方法和由这些方法产生的细胞克服了干细胞研究的2个主要限制。
因此,在第一个方面,本发明的特征在于用于延迟干细胞分化的方法,所述方法包括将至少一种转基因引入干细胞内,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因及其任何片段。
在另一个方面,本发明的特征在于控制干细胞分化的方法,所述方法包括步骤(a)将至少一种转基因引入干细胞内,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因及其片段,从而延迟干细胞分化;和(b)需要时,灭活转基因,从而允许干细胞分化。在这种方法中,转基因可以进一步包括选择标记。转基因还可以由重组酶识别序列侧接,所述识别序列包括但不限于LoxP或FRT序列。在该方法的步骤(b)中,灭活转基因可以包括从干细胞中去除转基因,例如通过通过在干细胞中表达重组酶(例如,Cre重组酶或翻转酶(FLP)重组酶),以从基因组DNA中去除转基因或去除包含转基因的附加体(例如,通过删除复制起点)。在优选实施方案中,重组酶的表达是瞬时的。该方法还可以包括在灭活步骤之前将第2种转基因引入干细胞内。如果需要,可以在灭活步骤之前将超过一种的另外转基因引入干细胞内。
在另一个方面,本发明的特征在于用于延迟干细胞分化的方法,所述方法包括将小RNA引入干细胞内,所述小RNA基本上与转基因的至少15个核苷酸相同或互补,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因、Xist转基因及其任何片段。小RNA分子可以是双链RNA或siRNA分子。小RNA长度为至少15个核苷酸,优选地,17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸,且长度甚至最高达50或100个核苷酸(包括在中间的所有整数)。理想地,小RNA分子长度为15-32个核苷酸。
对于任何上述方面,优选的Xic转基因包括基本上等同于SEQ IDNOs:1、2、3、39或其任何片段的任何核酸序列。优选的Tsix转基因包含基本上等同于SEQ ID NOs:5、6、9、10、12、13、14、21、22、23、28、29、30、31、32、36、40或其任何片段的任何核酸序列。特别优选的Tsix转基因包括SEQ ID NOs:9、10、12、21、22和28-32中所示的核酸序列。另外优选的Tsix转基因包括SEQ ID NOs:13、14、28-32或40中任何一个的至少一个拷贝、至少2个拷贝、至少3个拷贝、至少4个拷贝和至少5个拷贝。优选的Xite转基因包括基本上等同于SEQID NOs:15、16、17、24、25、26、27、38或其任何片段的任何核酸序列。优选的Tsix/Xite转基因包括基本上等同于SEQ ID NOs:4、11、19、37或其任何片段的任何核酸序列。关于任何上述区域的优选转基因可以抑制内源X-X配对,例如,如使用本文所述方法测定的,通过诱导X和转基因之间的从新配对。
任何转基因都可以与任何另外的转基因组合使用。在一个例子中,SEQ ID NO:23可以与任何另外的转基因组合使用,以增强对分化的阻断。此外,转基因可以作为单个拷贝或作为多聚体(例如,多个拷贝或串联系列的序列)使用。例如,SEQ ID NOs:13、14、28-32和40作为多聚体是特别有用的。
在上述方面的优选实施方案中,干细胞是胚胎干细胞,理想地雌性胚胎干细胞。哺乳动物胚胎干细胞或来自任何农业动物的胚胎干细胞在本发明的方法中是特别有用的。在优选实施方案中,干细胞是人或小鼠胚胎干细胞。干细胞可以是任何时期的胚胎干细胞,优选地胚泡期干细胞、胚胎生殖干细胞、或来自滋养核(somatic nuclei)的克隆干细胞。
在另一个方面,本发明的特征在于干细胞,所述干细胞包括的Xic转基因基本上等同于SEQ ID NOs:1、2、3、39或其任何片段中所示的核酸序列。
在另外一个方面,本发明的特征在于干细胞,所述干细胞包括的Tsix转基因基本上等同于SEQ ID NOs:5、6、9、10、12、13、14、21、22、23、28-32、36、40或其任何片段中所示的核酸序列。
在另外一个方面,本发明的特征在于干细胞,所述干细胞包括的Xite转基因基本上等同于SEQ ID NOs:15、16、17、24、25、26、27、38或其任何片段中所示的核酸序列。
在另外一个方面,本发明的特征在于干细胞,所述干细胞包括的Tsix/Xite转基因基本上等同于SEQ ID NOs:4、11、19、37或其任何片段中所示的核酸序列。
在上述方面的优选实施方案中,转基因在干细胞中表达。理想地,干细胞是胚胎干细胞,所述胚胎干细胞可以是雄性或雌性的,优选雌性胚胎干细胞。哺乳动物胚胎干细胞或来自任何农业动物的胚胎干细胞在本发明的方法是特别有用的。在优选实施方案中,干细胞是人或小鼠胚胎干细胞。干细胞可以是任何时期的胚胎干细胞,优选胚泡期干细胞、胚胎生殖干细胞、或来自滋养核的克隆干细胞。
对于本发明的任何干细胞,细胞转基因可以进一步包括选择标记或由LoxP或FRT序列侧接。本发明的干细胞还可以包括重组酶(例如,Cre或FLP重组酶),优选瞬时表达的重组酶。本发明的任何干细胞还可以进一步包括第2种转基因,或如果需要另外的转基因。
在另一个方面,本发明的特征在于分离的小RNA分子,所述小RNA分子包含的核酸序列基本上与转基因的至少15个核苷酸相同或互补,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因、Xist转基因或其任何片段。小RNA分子可以是双链RNA或siRNA分子,且长度为至少15个核苷酸,优选地,17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸,且长度甚至最高达50或100个核苷酸(包括在中间的所有整数)。在一个实施方案中,小RNA分子是长度为15-32个核苷酸的siRNA。
在一个相关方面,本发明的特征在于配制用于促进小RNA进入细胞内的、包括上文所述的小RNA分子的组合物。在另一个方面,上文所述的分离的小RNA分子在药物组合物中。药物组合物可以进一步包括药学可接受的载体。本发明的特征还在于包括小RNA分子的载体,其中所述小RNA分子与一种或多种转录调节序列可操作地连接。
对于与小RNAs有关的任一上述方面,RNA分子基本上与优选的Xic转基因相同或互补,所述优选的Xic转基因包括基本上等同于SEQ IDNOs:1、2、3、39或其任何片段的任何核酸序列。优选的Tsix转基因包含基本上等同于SEQ ID NOs:5、6、9、10、12、13、14、21、22、23、28、29、30、31、32、36、40或其任何片段的任何核酸序列。特别优选的Tsix转基因包括SEQ ID NOs:9、10、12、21、22和28-32中所示的核酸序列。优选的Xite转基因包括基本上等同于SEQ ID NOs:15、16、17、24、25、26、27、38或其任何片段的任何核酸序列。优选的Tsix/Xite转基因包括基本上等同于SEQ ID NOs:4、11、19、37或其任何片段的任何核酸序列。优选的Xist转基因包括基本上与SEQ ID NOs:7、8、20和35相同或互补的任何核酸序列。
“干细胞”意指具有自我更新和在合适条件下分化成专门的祖细胞(progenitor cell)或特定细胞或组织潜能的任何细胞。干细胞可以是多潜能或多能的。干细胞包括但不限于胚胎干细胞、胚胎生殖干细胞、来自滋养核的克隆干细胞、成体干细胞和脐带血细胞。
“成体干细胞”或“体细胞干细胞”意指在分化组织中发现的未分化细胞,所述未分化细胞可以自我更新和(具有一定限制)分化,以产生其所来源的组织的所有特化细胞类型。成体干细胞是多能的。成体干细胞的非限制性例子包括造血干细胞、骨髓衍生干细胞、和神经干细胞(NSC)、以及来源于上皮和脂肪组织和脐带血(UCB)的多能干细胞。
“胚胎干细胞”意指来源于胚泡期胚胎,或在细胞基本上分化成3个胚层之前的细胞,所述细胞可以自我更新且显示未分化细胞的形态学特征,从而使它们与胚胎或成体来源的分化细胞区分开。示例性形态学特征包括高核/质比和在显微镜下显著的核仁。在技术人员已知的合适条件下,胚胎干细胞可以分化成细胞或组织,所述细胞或组织是3个胚层中每一个的衍生物:内胚层、中胚层和外胚层。用于鉴定胚胎干细胞的测定包括在合适的宿主中形成畸胎瘤、或对于未分化细胞的标记例如Oct-4染色的能力。
“分化”意指由此非特化的早期胚胎细胞获得特化细胞特征的过程,所述特化细胞例如心脏、肝、骨、神经或肌细胞。分化还可以指细胞自我更新潜能的限制,且一般与细胞功能能力中的变化有关。术语“未分化的”、或“延迟”或“阻断”分化在本发明背景中广泛使用,且不仅包括分化的阻止而且包括细胞分化过程的改变或减缓。技术人员将理解未分化细胞的集落通常可以由分化的邻近细胞环绕;然而,当群体在合适条件下进行培养或传代时,未分化的集落将持续,且个别的未分化细胞将构成相当大部分(例如至少5%、10%、20%、40%、60%、80%、90%或更多)的细胞群体。干细胞分化可以通过本领域众所周知的方法来测定,且这些包括分析与确定分化状态的细胞相关的细胞标记或形态学特征。此类标记和特征的例子包括测量糖蛋白、碱性磷酸酶和癌胚抗原表达,其中这些蛋白质中任何一种的增加是分化的指示。另外的例子在本文中得到描述。在优选实施方案中,如果在培养确定天数(例如2、3、4、5、6或7天或更多)后,群体中少于10%、5%、4%、3%、2%或1%的细胞表达分化的标记或形态学特征,那么细胞是未分化的。分化还可以通过测定X染色体失活来确定。此类测定的例子在本文中得到描述,且包括通过荧光原位杂交(FISH)或RT-PCR测量Xist表达,或通过FISH(X-X配对)测量染色体间的距离。在一个例子中,如果培养确定天数(例如2、3、4、5、6或7天或更多)后,群体中少于20%、15%、10%、5%、4%、3%、2%或1%的细胞如通过FISH或RT-PCR测量的显示Xist表达增加,或如通过FISH测量的显示X-X配对,那么细胞是未分化的。
“片段”意指核酸分子的部分,其包含参考核酸分子全长的至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。在本发明中,片段包括X失活中心(Xic)的任何片段,所述片段包括至少10、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、50、60、68、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、3700、4000、5000、10,000、15,000、19,500、20,000个,或更多核苷酸,直至Xic的全长(约100KB)。优选片段在本文中得到描述,且显示于表1和2以及图1、2、3A、3B和30B中。一个优选片段是小RNA核酸序列,通常称为siRNA,它可以充当RNA干扰(RNAi)途径中的特异性决定子。
“RNAi”在本领域中也称为“基因沉默”和/或“靶沉默”,例如“靶mRNA沉默”),指RNA的选择性细胞内降解。RNAi在细胞中天然发生以去除外来RNAs(例如,病毒RNAs)。天然RNAi经由从游离dsRNA切割的片段来进行,所述片段将降解机制指向其他类似RNA序列。可替代地,RNAi可以通过人为处理开始,例如,以沉默靶基因的表达。RNA沉默现象的统一特征是长度为至少15nt,优选15-32nt,最优选长度为17-26nt的小RNAs的产生,所述小RNAs充当用于下调基因表达的特异性决定子,和Argonaute蛋白质家族(或PPD蛋白质,因为其特征性PAZ和Piwi结构域而命名)的一个或多个成员的需要。近来已注意到较大的siRNA分子,例如25nt、30nt、50nt、或甚至100nt或更多,也可以用于起始RNAi。(参见例如,Girard等人,Nature 2006年6月4日,印刷前的电子出版物,Aravin等人,Nature 2006年6月4日,印刷前的电子出版物,Grivna等人,Genes Dev.2006年6月9日,印刷前的电子出版物,和Lau等人,Science 2006年6月15日,印刷前的电子出版物。)
术语“小RNA”在本申请自始至终使用且指任何RNA分子,单链或双链”,长度为至少15个核苷酸,优选地,17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸,且长度甚至最高达50或100个核苷酸(包括在中间的所有整数)。优选地,小RNA能够介导RNAi。如本文使用的,短语“介导RNAi”指(指示)区分将通过RNAi机器或过程降解哪种RNAs的能力。包括在术语小RNA内的是“小干扰RNAs”和“微小RNA”。一般而言,微小RNAs(miRNAs)是通过切酶(Dicer)由约70个核苷酸的发夹前体RNAs加工的小型(例如,17-26个核苷酸)、单链非编码RNAs。小干扰RNAs(siRNAs)具有类似尺寸且也是非编码的,然而siRNAs由长dsRNAs加工且通常是双链的(例如,内源siRNAs)。siRNAs还可以包括短发夹RNAs,其中siRNA双链体的2条链包括在单个RNA分子内。小RNAs可以用于描述2种类型的RNA。这些术语包括双链RNA、单链RNA、分离的RNA(部分纯化的RNA,基本纯的RNA、合成RNA、重组产生的RNA),以及改变的RNA,所述改变的RNA通过一个或多个核苷酸的添加、缺失、置换和/或改变而不同于天然存在的RNA。此类改变可以包括,例如向小RNA的一个或多个末端或内部(在RNA的一个或多个核苷酸处)添加非核苷酸材料。本发明RNA分子中的核苷酸还可以包含非标准核苷酸,包括非天然存在的核苷酸或脱氧核糖核苷酸。本发明的小RNAs只需要足够类似于天然RNA,从而其具有介导RNAi的能力。
“遗传修饰”或“遗传改变”过程意指将外源基因或外来基因引入哺乳动物细胞内。该术语包括但不限于转导(宿主DNA从宿主或供体到受体的病毒介导的转移,体内或体外)、转染、脂质体介导的转移、电穿孔、磷酸钙转染或共沉淀。转导方法包括直接共培养细胞与生产细胞,或培养细胞与单独的病毒上清液,含或不含合适的生长因子和聚阳离子。
术语“同一性”在本文中用于描述特定核酸分子序列与参考核酸分子序列的关系。例如,如果和它与之比对的参考分子相比较,核酸分子在给定位置上具有相同的核苷酸残基,那么可以说成在那个位置上具有“同一性”。核酸分子与参考核酸分子的序列同一性水平一般使用序列分析软件来测量,用其中指定的缺省参数,例如引入缺口以达到最佳比对(例如,Genetics Computer Group的Sequence Analysis SoftwarePackage,University of Wisconsin Biotechnology Center,1710 UniversityAvenue,Madison,Wis.53705,BLAST或PILEUP/PRETTYBOX程序)。这些软件程序通过将同一性程度分配给各种置换、缺失或其他修饰来匹配相同或相似序列。
如果核酸分子在其全长上显示与参考分子序列至少51%,优选至少55%、60%或65%,且最优选75%、85%、90%、95%、96%、97%、98%、99%或甚至100%的同一性,那么它可以说成“基本上等同于”参考分子。对于核酸分子,比较序列的长度为至少10、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、50、60、68、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、3700、4000、5000、10,000、15,000、19,500、20,000,或更多核苷酸,直至且包括Xic的全长(对于小鼠Xic为约100kB)。
应当指出尽管同源的蛋白质编码基因一般共有显著的同源性水平(一般大于70%),但关于非编码基因和顺式调节元件,例如本发明中包括的区域的总体同源性水平,一般小于60%。例如,来自不同小鼠品系的相同Xic具有约1个核苷酸变化/100个核苷酸的序列变异。在另一个例子中,对于DxPas 34重复,重复长度从品系到品系不同,从15-40个核苷酸不等。在另外一个例子中,特别是在Xite内,品系之间的序列变异可以包括碱基对插入、缺失、和单核苷酸多态性。此外,关于非编码基因和顺式调节元件的同源性通常限于较小的结构域(例如,长度为30-100nt)。因此,更灵敏的方法例如PipMaker分析和Bayesian块分析(block analysis)可以用于测量特定非编码基因区域或顺式调节元件的同源性或同一性(Schwartz等人,Genome Research 10:577-586(2000))。
“灭活转基因”意指减少或消除转基因阻断分化或XCI的能力。在一个例子中,转基因的灭活可以通过去除转基因(例如,使用位点特异性重组酶和转基因侧翼的DNA识别序列)来完成。在另一个例子中,如果使用病毒载体将转基因引入细胞内,那么去除复制起点(例如,使用位点特异性重组酶和复制起点侧翼的DNA识别序列)可以导致在繁殖后病毒序列包括转基因丢失。转基因的灭活可以使用如本文所述关于分化、XCI、或染色体间配对的成核现象的测定进行测量。
“分离的”意指当通过重组技术产生时基本上不含其他细胞材料或培养基,或当化学合成时基本上不含化学前体或其他化学试剂。
“核酸分子”意指核苷酸或核酸模拟物的任何链。包括在这个定义中的是天然和非天然,修饰和未修饰的寡核苷酸。
“药学可接受的载体”意指对于被治疗的哺乳动物是生理学可接受的,同时保留它与之一起施用的化合物的治疗特性的载体。一种示例性药学可接受的载体物质是生理盐水。其他生理学可接受的载体及其配制是本领域技术人员已知的,且在例如Remington’s PharmaceuticalSciences,(第20版),ed.A.Gennaro,2000,Lippincott,Williams &Wilkins,Philadelphia,PA中描述。
“增殖”意指通过单个细胞连续分裂成2个相同子细胞的细胞群体增殖。
“纯化的”意指与天然伴随其的其他组分分开。一般地,当它至少50重量%不含它与之天然结合的蛋白质、抗体和天然存在的有机分子时,化合物(例如,核酸)是基本上纯的。优选地,化合物是至少75重量%,更优选地至少90重量%,且最优选地至少99重量%纯的。基本上纯的化合物可以通过下述方法来获得:化学合成、使因子与天然来源分开、或在不天然生产化合物的重组宿主细胞中生产化合物。核酸分子可以通过本领域技术人员使用标准技术来纯化,所述标准技术例如由Ausubel等人(Current Protocols in Molecular Biology,John Wiley &Sons,New York,2000)描述的那些。如使用聚丙烯酰胺凝胶电泳、柱层析、光密度、HPLC分析、或蛋白质印迹分析测量的,与原材料比较核酸分子优选是至少2、5或10倍纯的。
“重组酶”意指一组酶的任何成员,所述酶可以促进限定位点之间的位点特异性重组,其中所述位点在单个DNA分子上物理地分开,或其中所述位点位于分开的DNA分子上。限定重组位点的DNA序列不必是相同的。存在几个亚家族,包括“整合酶”(包括,例如Cre和λ整合酶)和“解离酶/转化酶”(包括,例如ψC31整合酶、R4整合酶和TP-901整合酶)。2种优选的重组酶及其DNA识别序列是Cre(重组酶)-lox(识别序列)或翻转酶(FLP)(重组酶)-Frt(识别序列)。(参见Fukushige等人,Proc.Natl.Acad.Sci.USA 89:7905-7909(1992);O′Gorman,等人,Science 251:1351-1335(1991);Sauer等人,Proc.Natl.Acad.Sci.USA 85:5166-70(1988);Sauer等人,Nuc.Acids Res.17:147-161(1989);Sauer等人,New Biol.2:441-49(1990);和Sauer,Curr.Opin.Biotechnol.5:521-7(1994))。理想地,在细胞中的重组酶表达是“瞬时的”。“瞬时表达”意指在相对短暂的时间间隔内减少的表达。瞬时表达可以通过例如使用脂质体、包被颗粒或显微注射,引入作为纯化多肽的重组酶来完成。瞬时表达还可以通过引入编码重组酶的核酸序列来完成,所述核酸序列与表达载体中的启动子可操作地连接,所述表达载体随后引入细胞内。重组酶的表达还可以以其他方式进行调节,例如,通过将重组酶的表达置于可调节的启动子(即,其表达可以被选择性诱导或阻抑的启动子)的控制下。重组酶只存在从细胞去除转基因序列所必需的时间一般是优选的。
“重组酶识别序列”指由特异性重组酶蛋白质识别的任何DNA序列。例子包括loxP位点和由FLP重组酶识别的34-bp FRT位点,所述loxP位点由8-bp非回文核心区侧翼的2个13-bp反转重复组成,且由Cre重组酶识别。野生型识别序列的变体包括在本文中。如下文所述,变体可以通过其被合适的重组酶识别的能力进行鉴定。
“同线的”意指在不同物种的染色体上以相同顺序存在的相应基因或染色体区域。同线基因或染色体区域不必是高度同源的,特别是当保守元件是非编码的时。例如,小鼠X失活中心的同线部分在人Xq13上发现。
“畸胎瘤”意指由来自3种胚胎胚层的组织组成的肿瘤,通常在卵巢和睾丸中发现。畸胎瘤一般通过注射多潜能干细胞在动物中实验地产生,且用于测定干细胞分化成各种类型的组织的能力。
“Tsix转基因”意指通过人工手段引入细胞内的、基本上等同于哺乳动物Tsix序列或其任何片段的核酸片段。转基因可以整合或不整合到细胞染色体内,且可以表达或不表达。转基因可以是附加型的或不是附加型的。优选的Tsix转基因序列的非限制性例子包括至少基本上等同于全长小鼠Tsix基因(图5,SEQ ID NO:6)或其片段的核酸序列,以及至少基本上等同于下述小鼠Tsix基因片段的核酸:例如pCC3(SEQ IDNO:9)、p3.7(SEQ ID NO:10)、DxPas34(SEQ ID NO:12)、DxPas34的34bp重复(SEQ ID NO:13)、DxPas34的68bp重复(SEQID NO:14)、ns25(SEQ ID NO:21)、ns41(SEQ ID NO:22)、ns82(SEQ ID NO:23)、小鼠重复A1(SEQ ID NO:28)、小鼠重复A2(SEQ ID NO:29)、小鼠重复B(SEQ ID NO:30)、大鼠重复A(SEQ ID NO:31)、和大鼠重复B(SEQ ID NO:32)。另一种优选的Tsix转基因序列包括34bp或68bp DxPas34重复(分别为SEQ ID NOs:13或14)的至少2个拷贝,以及至少3个拷贝、至少4个拷贝、和至少5个拷贝或更多。这些优选片段在图1、2和3A中图示,且序列在图3B、4、5和30B中提供。优选的Tsix转基因序列的另外非限制性例子包括基本上等同于全长人Tsix基因(SEQ ID NO:35)、人重复A(SEQ ID NO:40)或其任何片段的核酸序列,和基本上等同于小鼠Tsix序列(SEQ IDNO:6)或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。物种变异包括发生在小鼠品系之间的Xite和Tsix中的多态性,所述小鼠品系包括但不限于C57BL/6、129和CAST/Ei小鼠。如上文关于SEQ ID NOs:13和14所述,应当指出对于任何片段,特别是较小的片段例如SEQ ID NOs:28、29、30、31、32和40,转基因可以包括序列的多个拷贝,例如以串联系列(例如,至少2个拷贝、至少3个拷贝、至少4个拷贝、和至少5个拷贝或更多)。
“Xite转基因”意指通过人工手段引入细胞内的、基本上等同于哺乳动物Xite序列或其任何片段的核酸片段。转基因可以整合或不整合到细胞染色体内,且可以表达或不表达。转基因可以是附加型的或不是附加型的。优选的Xite转基因序列的非限制性例子包括至少基本上等同于全长小鼠Xite基因(图7,SEQ ID NO:15)或其片段的核酸序列,以及至少基本上等同于下述小鼠Xite基因片段的核酸:例如pXite(SEQ IDNO:16)、Xite增强子(SEQ ID NO:17)、ns130(SEQ ID NO:24)、ns135(SEQ ID NO:25)、ns 155(SEQ ID NO:26)、ns132(SEQ IDNO:27)。这些优选片段在图1、2和3A中图示,且序列在图3B、4和7中提供。优选的Xite转基因序列的另外非限制性例子包括基本上等同于人Xite基因(SEQ ID NO:38)或其片段的核酸序列,和基本上等同于小鼠Xite序列(SEQ ID NO:15)或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。物种变异包括发生在小鼠品系之间的Xite和Tsix中的多态性,所述小鼠品系包括但不限于C57BL/6、129和CAST/Ei小鼠。
“Tsix/Xite转基因”意指通过人工手段引入细胞内的、基本上等同于哺乳动物Tsix、Xite、或组合或间插的Tsix/Xite序列、或其任何片段的核酸。转基因可以整合或不整合到细胞染色体内,且可以表达或不表达。转基因可以是附加型的或不是附加型的。包括跨越2种基因全部或部分的区域或2种基因之间的间插区域的序列被称为Tsix/Xite转基因,且也可以在本发明方法中使用。优选的Tsix/Xite转基因的非限制性例子包括基本上等同于跨越小鼠中的2种基因的关键区域,例如pSxn(SEQ IDNO:4)、pCC4(SEQ ID NO:11)、和二分增强子(bipartite enhancer)(SEQ ID NO:19)的核酸序列。这些优选片段在图1和3A中图示,且序列在图3B和4中提供。优选的Tsix/Xite转基因序列的另外非限制性例子包括基本上等同于跨越人染色体中的2种基因的关键区域,例如pSxn人(SEQ ID NO:37),或其片段的核酸序列,和基本上等同于小鼠中跨越Tsix和Xite基因的关键区域或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。物种变异包括发生在小鼠品系之间的Xite和Tsix中的多态性,所述小鼠品系包括但不限于C57BL/6、129和CAST/Ei小鼠。
“Xic转基因”意指通过人工手段引入细胞内的、基本上等同于哺乳动物Xic区域的核酸分子。转基因可以整合或不整合到细胞染色体内,且可以表达或不表达。转基因可以是附加型的或不是附加型的。优选的Xic转基因包括全长小鼠Xic(SEQ ID NO:1),GenBank登记号AJ421479(SEQ ID NO:33)的核苷酸80,000-180,000。本文所述的每种小鼠转基因在AJ421749的这个100kB片段内发现。例如,小鼠Xist在nt 106,296到nt 129,140中发现,小鼠Tsix/Xite序列在nt 157,186到nt 104,000内发现,且小鼠Tsx序列在nt 174,041到nt 163,932中发现。小鼠Xic内的另一种片段是Jpx/Enox,在AJ421479的nt 95,894到nt86,564中发现。优选的Xic片段包括πJL2(SEQ ID NO:2)和πJL3(SEQID NO:3)。优选的Xic转基因序列的另外非限制性例子包括基本上等同于人Xic基因(SEQ ID NO:39)或其片段的核酸序列,和基本上等同于小鼠Xic(SEQ ID NO:1)或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。
“Xist转基因”意指通过人工手段引入细胞内的、基本上等同于哺乳动物哺乳动物Xist序列,或其任何片段的核酸。转基因可以整合或不整合到细胞染色体内,且可以表达或不表达。转基因可以是附加型的或不是附加型的。优选的Xist转基因序列的非限制性例子包括至少基本上等同于全长小鼠Xist基因(图6,SEQ ID NO:20)或其片段的核酸序列,以及至少基本上等同于下述小鼠Xist基因片段的核酸:例如pXist 3’(SEQ ID NO:7)和pXist 5’(SEQ ID NO:8)。这些优选片段在图1中图示,且序列在图6中提供。优选的Xist转基因序列的另外非限制性例子包括基本上等同于人Xist基因(SEQ ID NO:35)或其片段的核酸序列,和基本上等同于小鼠Xist序列(SEQ ID NO:20)或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。物种变异包括发生在小鼠品系之间的Xist中的多态性,所述小鼠品系包括但不限于C57BL/6、129和CAST/Ei小鼠。
干细胞分化是不可逆过程,且定向至分化途径阻止或极大地减少临床医生或研究人员以治疗有用的方式修饰干细胞的能力。干细胞的巨大治疗潜能依赖于控制干细胞分化的能力。因此,需要以可逆方式阻断或延迟干细胞分化的有效方法。本发明提供了用于控制干细胞分化的此类新型方法,且允许以受控方式抑制和诱导干细胞分化。本发明基于下述发现:通过过量的Xic、Tsix和Xite或Xic、Tsix和Xite的缺失中断XCI过程可以阻断分化。在本方法中,XCI过程的中断通过使用来源于Xic、Tsix或Xite序列或其片段的转基因或小RNAs来完成,将所述转基因或小RNAs引入干细胞内且阻止干细胞经历X染色体失活和阻止培养中的分化。用于处理干细胞分化的这些新型方法允许临床医生或研究人员使干细胞维持于未分化状态,其时间足以根据需要修饰细胞(例如,通过引入治疗基因)以用于治疗或研究目的,而没有细胞或细胞产品污染的限制或分化的无效抑制。该方法还允许临床医生再次以有效方式且无污染问题地容易地去除对分化的阻断,从而使得细胞可以给受试者施用。本发明的特征还在于通过控制或延迟分化的方法产生的细胞,所述细胞在培养中可以无限地自我更新,且对于治疗目的例如再生医学和基因疗法有用。
由于下述详细描述、附图和权利要求,本发明的其他特征和优点将是显而易见的。
附图简述
图1是Xic区域的图示,显示了用于阻断干细胞分化的一组优选转基因。
图2是Xic区域亚型的图示,更详细地显示了Tsix/Xite接头。指出了另外的优选转基因。
图3A-3B是pSxN转基因的图示和相应核酸序列。图3A是pSxN6(也称为pSxN)转基因的图示,显示了用于阻断干细胞分化的一组优选转基因。这个区域包括Tsix和Xite的5’端,且包含对于X’s的计数(计数器)、细胞分化、印记、选择和互斥效应关键的元件。图3B是pSxN转基因(SEQ ID NO:4)的注解序列图。序列图进行注解以显示图3A中鉴定的每种转基因的限制位点和特异性位置。
图4是注解的核酸序列,其显示了DxPas34转基因(SEQ ID NO:12)的34和68个碱基对的重复(分别为SEQ ID NO:13和14)。每行序列表示34个碱基对的重复。这些重复位于SEQ ID NO:4的nt 5074-6630(图3B)。注意34和68bp重复不是精确的重复但从一个到下一个略微不同。
图5的核酸序列显示了小鼠Tsix RNA序列(未剪接形式;SEQ IDNO:6)。
图6的核酸序列显示了全长小鼠Xist RNA(未剪接形式;SEQ IDNO:20)。
图7的核酸序列显示了小鼠Xite区域(SEQ ID NO:15)。这个序列以与pSxn的注解序列(图3)相同的方向定向。Xite在2簇起始位点内的多个位置中开始。第1个簇在nt 6995-5773(其中存在1.2kb增强子)周围。第2个簇在nt 13000-12500周围。注意所有转录物以反义方向(例如,从nt 6995到nt 1)进行。还应当注意Xite不“结束”。当它达到Tsix时,它正好减少。还应当注意2个起始簇中的第2个在pSxn关键区域外面但仍是Xite的部分。
图8A-8E显示计数缺陷,候选计数区域,以及XΔXΔ、XΔO和XΔY ES细胞分离的表现。图8A的图示显示了正常和异常计数模式。实心黑圈,xi。空圈,Xa。图8B是Xic的图示,显示了被认为影响或不损害计数的现有缺失。水平虚线描绘了每个敲除的程度。关于计数元件的假定区域以橙色显示。图8C是选择新分离的XΔXΔ、XΔO和XΔY ES系的DNA印迹分析。图8D的显微照片显示了使用来自Xite基因座(pDNT 1)的X连锁探针,对Δf5细胞的DNA FISH结果,从而证明了突变系中的2个Xs。图8E是鉴定Δf4作为XΔY克隆的Y染色体涂染的显微照片。染色体涂染如制造商(Cambio,UK)建议的进行。
图9A-9F显示了异常分化和XΔXΔ而不是XΔO或XΔY克隆中的XCI。图9A是在相同放大率下获取的突变EB的一系列相差图像。XΔXΔEB(Δf5显示)显示d2至d6(d,天)的差的分化,但某些EB最后在不迟于d9显示稀少的长出(outgrowth)。XΔO(Δf32显示)、XΔX(BA9,未显示)和XΔY(Δf4,未显示)自始至终显示正常分化。图9B的图显示了细胞死亡的定量。第0天在所有细胞系中显示了<<1%的死亡。显示的数据表示了3次实验的平均值。如通过斯氏t检验计算的,统计学显著性(P)在下表中指出。每种细胞系针对WT对照进行测试。图9C的一系列图像显示了使用对于Xist RNA(FITC标记的,绿色)和Xite DNA(Cy3标记的,红色)的探针以标记X染色体的RNA/DNA FISH。图9D的图示显示了在分化d3时的XCI模式。对于来自2次实验的每种样品计数>200个核。n.a.,不可用。图9E的图像显示了在第6天时生长差的Δf25EB(XΔXΔ)的RNA/DNA FISH,显示了具有2个Xi的众多核。Xist RNA,绿色。Xite DNA,红色。图9F的图像显示了在随后的分化天数时的RNA/DNA FISH,其中大多数存活的XΔXΔ细胞(Δf41显示)只显示单个Xi。Xist RNA,绿色。Xite DNA,红色。
图10A-10E显示了携带Xic的雌性转基因ES系的生成。图10A的Xic和P1转基因图覆盖Xic的各个区域。转基因序列是:πJL2,包含Xist以及30kb上游和下游序列的80kb P1质粒(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上);πJL3,包含Xist和60kb下游序列的80kb P1质粒(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上);和pSx7,πJL1的BssHII-NotI片段。如先前所述(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上)通过电穿孔引入转基因,连同摩尔比为0.1的Neo选择标记(pGKRN)。本文使用的所有转基因系具有常染色体插入。图10B是转基因细胞系的DNA印迹分析。拷贝数分析如先前所述进行(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上)。Xist拷贝数对Dnmt1进行标准化。图10C是分化5天的WT和转基因EB的一系列相差图像。所有图像为相同的放大率。图10D的一系列图像显示用于检测Xist RNA(绿色)和X染色体(Xite DNA,红色)的RNA/DNA FISH。细胞来自第4天。X,X染色体;T,转基因常染色体。红色箭标指向在高拷贝克隆中可见的稀少的Xist RNA聚集体。图10E的表显示了与转基因拷贝数反相关的Xist表达的频率(如通过RNA/DNA FISH测定的)。
图11A-11E显示的较精细的转基因作图揭示Tsix和Xite具有计数元件。图11A是Xic和较精细转基因的图。由每种转基因携带的序列是:pSxn,πJL1的19.5kb RsrII-NotI片段(SEQ ID NO:4);p3.7,从TsixΔCpG中缺失的3.7kb MluI-SacI序列(SEQ ID NO:10;Lee等人,Cell(1999)同上);pCC3,Tsix启动子下游的4.3kb BamHI片段(SEQ ID NO:9);pCC4,Tsix启动子上游且包括Tsix启动子的5.9kb BamHI片段(SEQ IDNO:11);pXite,跨越Xite的DHS1-4的5.6kb片段(Ogawa等人,同上);pXist5’,来自Xist启动子的4.8kb XbaI-XhoI片段(SEQ ID NO:8);pXist3’,来自Xist外显子7的4.9kb PstI片段(SEQ ID NO:7);和pTsx,来自Tsx基因座的Genbank X99946的bp 41,347-52,236(SEQ IDNO:18)。除了pXist3’外,将Neo选择标记工程改造到每种质粒内用于在ES细胞中选择。本文表征的所有系都具有常染色体插入。实心紫色条,具有最强计数性质的元件;虚线紫色条,也具有计数性质的元件,虽然比前者弱。图11B的图显示了通过锥虫蓝测定对选择的转基因细胞系的细胞死亡分析。数据表示3次实验的平均值。如通过斯氏t检验计算的,统计学显著性(P)在邻近表中指出。每种细胞系针对对照WTneo进行测试。图11C是在相同放大率下获取的转基因EB和对照的一系列相差图像。对于克隆3.7-11和Xite-11,注意到d5时大尺寸的EB和不迟于d8的大量退化。图11D的图显示了d3时转基因和对照细胞系中的XCI模式。对于来自2次实验的每种样品计数至少200个核。在Tsix和Xite转基因中,检查载玻片上>50,000个细胞以得出结论为0%显示Xist表达。n.a.,不可用。图11E的一系列图像显示了Tsix和Xite雌性转基因系而不是Xist或Tsx系中的XCI阻抑。RNA/DNA FISH使用p3.7、pXite或pTsx质粒作为探针(红色)检测Xist RNA(绿色)和转基因染色体。X,X染色体;T,转基因常染色体。
图12A-12D显示了用于计数的二重性模型(duality model)。图12A的图显示单一模型(singularity model)。计数表示X因子(绿色圈)和A因子(紫罗兰色圈)的滴定。A因子可以来源于多个不同常染色体。A至X因子的偶联形成‘阻断因子’(BF)。任何未滴定的X因子被降解。选择由BF与1个Xic的结合产生,这随后阻抑XCI的开始。Xi通过缺省形成。X,X染色体;A,常染色体。图12B的图显示二重性模型。正如在单一模型中,A和X因子的复合形成BF。然而,未滴定的一种或多种X因子导致称为(dubbed)‘感受态因子’(CF)的第2种复合物形成。选择步骤表示BF和CF与Xic的结合。BF结合阻断未来Xa上的XCI,而CF与剩余X的结合诱导未来Xi上的XCI。二重性模型暗示BF和CF以互相排斥的方式结合。BF和CF最可能与Tsix和Xite的5’区域结合。图12C的图显示了XΔXΔ突变体中的异常计数和混乱选择。描述的是在细胞分化期间4种同样可能的结果。顶端的2种结果达到剂量补偿作用且导致产生存活细胞。假定这些细胞是图9A中第9天存活的EB细胞和图9F中的剂量补偿的细胞。它们引起偶然的XΔXΔ小鼠出生(Lee,Nature Genet.(2002),同上)。底部的2种结果导致2个Xi’s或2个Xa’s(由于互相排斥的丧失和随之发生的‘混乱’)——不存活的状态。Tsix缺失由X中的缺口表示。图12D的图显示常染色体上出现多个Tsix或Xite序列压制来自内源Xic的阻断和感受态因子,从而导致转基因细胞中组成型活性的X’s。黑色框是完整或部分的Xic序列。ATg,转基因常染色体。
图13的一系列相差图像显示XΔXΔ克隆中的异常细胞分化。指出了分化天数(d)时在相同放大率下的突变EB的相差图像。为了产生EZB,在d)时ES集落被胰蛋白酶消化成脱附的细胞簇,在悬浮培养中在不含LIF的DME/15%FBS中生长4天,其后与凝胶化的板附着以获得长出。注:尽管不迟于d*时许多XΔXΔEB退化,但相当大部分EB的确长出(显示了例子),但长出的程度一般不如WT或XΔO强壮。
图14的一系列相差图像显示了包含Tsix/Xite的转基因系中的异常细胞分化。显示了在指定分化日时在相同放大率下的突变体和野生型EB的相差图像。所有包含Tsix/Xite的XX转基因导致在第5天时EB长出差且不迟于第8天时大量死亡。如通过锥虫蓝摄取测定的,>99%的非附着细胞是死亡的。包含相同转基因的XY系和包含Xist、Tsx的XX系,以及载体转基因不显示这种表型。在Tsix/Xite转基因中,p3.7和pXite转基因显示非常高的放射状生长(显示了各2种克隆)。与较大的转基因比较,pCC3、pCC4和pSxN转基因的确也是这样,但程度较少和更可变。πJL2、πJL3和pSx7同样具有升高的细胞死亡率,但它们的EB集落不是非常大。
图15A-D显示了关于X-X同源结合的证据。图15A的一系列图像和图显示了野生型雌性ES核从分化第0天到第6天以及MEFs的DNA FISH和X-X分布特征。2种探针组合:Xic DNA绿色(pSxn-FITC)+Tsx DNA红色(pTsx-Cy3)。DAPI(4’,6’-二脒基-2-苯基吲哚),蓝色。每个图像是0.2μz切片的3D图像栈(image stack)层的2维(2D)表示。分布显示标准化的距离,ND=X-X距离/d,其中d=2x(核面积/π)0.5。ND为0-1。平均距离,空心三角。图15B的一系列图显示了ND 0.0-0.2时关于X-X对的累积频率曲线。P(KS检验)在逐对比较中针对第0天进行计算。关于每次实验的样本大小(n)=174-231。图15C的图显示X-X距离<0.05ND。距离用来自3次独立实验的标准差(SD)进行图示。图15D是Xic的图和显示对Xic特异的邻近配对的图。关于X连锁基因座的X-X分布特征显示于图中。KS检验(P)比较Xic对侧翼基因座。n=166-188。
图16A-D显示在XCI开始期发生的同源结合。图16A的一系列图像和图显示关于第2天野生型XX细胞的RNA-DNA FISH。Xic DNA,绿色(pSxn-FITC);Xist RNA,红色(链特异性核糖核酸探针(riboprobes)-Cy3)。图16B-16D的一系列图显示关于第2天野生型XX细胞的累积分布,从而比较Xist+(n=74)对Xist-(n=180)细胞(图16B);Ezh2+(n=33)对Ezh2-细胞(n=178)(图16C);和H3-3meK27+(n=48)对H3-3meK27-(n=188)细胞(图16D)。
图17A-F显示Tsix和Xite对于X-X配对是必需和充分的。图17A是Xic、TsixΔCpG和XiteΔL以及各种转基因的图。图17B的一系列图显示了从第0天到第6天关于Tsix和Xite突变体的X-X分布。n=181-223。KS检验比较了每条曲线与第0天的曲线。图17C的图表显示了用于3C分析的Tsix等位基因和引物(红色)。BamHI位点,蓝色箭标。图17D显示了XΔTsix(neo+)X细胞和p3.7雌性的逐对相互作用的3C分析。引物对在凝胶右侧指出。C,阳性对照连接。所有负-交联(N)和负-连接对照都是阴性的。图17E的图显示使用显示的等式,使第n天(dn)时的相对配对频率(X)对β珠蛋白(βg)和第0天的值进行标准化。S,通过光密度测定法定量的信号强度。来自3次独立实验的平均值和SD。图17F关于转基因ES细胞的DNA FISH和X-A分布曲线。转基因被Neo探针标记为红色,且X被pSx7探针(对于p3.7、pXite、pXist5’和pTsx细胞)或pTsx探针(对于pSx7细胞)标记为绿色。pSx7与p3.7和pXite转基因部分重叠,但小重叠使信号暗淡且可与X区分。对于πJL1.4.1,转基因标记为绿色(pSx9 Xist片段)且X标记为红色(pTsx探针)。KS检验比较来自第0天对第4天的数据集。n=170-234。
图18A-D显示从头X-A配对抑制X-X配对。图18A的一系列图显示雌性转基因细胞中的X-X配对的破坏。n=177-221。图18B显示的KS检验比较来自第0天对第2天以及来自第0天对第4天的数据集。图18C的图显示了来自3次实验的X-X配对的平均频率与标准差。图18D的模型显示了X-X配对是计数/选择所需的。等位基因交扰导致不对称的染色体标记(黄色圈,阻断的Xic;红色圈,诱导的Xic)以及Xa和Xi的互相排斥的指示。蓝线,Xist RNA。异位Tsix/Xite转基因(Tg-Xic)通过滴定消除X-X相互作用来抑制XCI。Tsix XΔXΔ配对的丧失引起异常计数/选择。
图19的一系列图和图像显示,X-X邻近配对代表XX细胞中的X染色体双联体而不是XO细胞中单个X的姐妹染色单体。WT雌性ES细胞的Xic标记(Tsix探针,红色)和X涂染(FITC,绿色)显示,X-X邻近配对代表XX细胞中的2个不同Xs而不是XO细胞中单个X的姐妹染色单体。配对的Xs显示占据单个Xs 2倍核面积的X涂染信号。在右侧显示了X-X分布特征,其中KS检验(P)比较d4对d0。
图20的一系列图显示邻近配对是对X染色体特异的。在ES细胞分化期间Chr.1着丝粒(1C)和Chr.2 Abca2基因的分布特征。
图21A-C显示邻近配对是对Xic特异的。图21A的一系列图像显示XC和Tsix的DNA FISH,其中Tsix信号是分开(左侧)或配对的(右侧)。图21B的一系列图显示在d4时侧翼X连锁探针的分布特征。图21C的一系列图显示d0至d6的X连锁探针的累积频率曲线。KS检验,P=针对d0测试时的差异显著性。
图22A-B的一系列图像和图显示,使用Ezh2(图22A)和H3-3meK27(图22B)作为标记的邻近配对的时间图解。ImmunoFISH使用与Ezh2或H3-3meK27抗体(红色)组合的Xic探针(绿色)。X-X分布特征在右侧显示。
图23的一系列图显示在d0天到d6天时突变Tsix和Xite ES细胞的X-X分布特征。这些图显示Tsix和Xite介导配对。
图24是β珠蛋白基因座图,其中3C引物通过箭头显示且BamHI位点通过箭标显示。
图25的一系列图显示从d0到d4所示转基因雌性ES细胞的X-X分布特征。
图26的一系列图像显示雌性转基因ES细胞在分化条件下甚至在第5天时仍维持未分化形态学。ns11(载体)和ns82(Tsix启动子)用作阴性对照。
图27的一系列图像显示雄性转基因ES细胞在分化条件下没有显示对于雌性ES细胞可见的相同未分化形态学。
图28的一系列图显示细胞中的Tsix和Xite的所有亚片段之间的配对,除了ES ns82(只有Tsix启动子)之外。异位X-A配对抑制内源X-X配对。
图29A-I显示Tsix启动子的杂合缺失对选择没有明显作用。图29A是关于Tsix启动子删除的靶向方案的示意图。RV:EcoRV,B:BamHI。探针1和2的位置由编号的灰色矩形指出。实心和空心三角分别表示FRT和LoxP位点。图29B显示来自雌性克隆的基因组DNAs的DNA印迹分析,所述基因组DNA用EcoRV消化和用探针1探测。图29C显示来自小家鼠(M.musculus)(129)或M.castaneus(cast)肝的基因组DNAs、和来自野生型或靶向的雌性ES细胞的DNA的DNA印迹分析,所述DNA用BamHI消化和用探针2探测。图29D显示来自雄性克隆的基因组DNAs的DNA印迹分析,所述基因组DNA用EcoRV消化和用探针1探测。图29E显示基于ScrFI和MnlI SNPs在2个位置上的Tsix表达的等位基因特异性分析。图29F的一系列图显示雄性细胞中的Tsix表达的实时RT-PCR定量。所有样品对内部对照Rpo2进行标准化。误差条指示1个标准差。图29G显示关于雌性细胞系中的Xist(顶端)或Mecp2(底部)的等位基因特异性RT-PCR。分化天数如所示的。图29H显示在图29G中所示实验中来自129等位基因的Tsix RNA级分。图29I的一系列图像显示在第8天时雌性ΔPneo细胞的RNA/DNA FISH。Xist RNA,绿色;Neo DNA,红色。每种XCI模式的百分比在小图右侧指出(括号中是取样的核数目)。n=138。
图30A-E显示DXPas34是保守的,且具有与转座元件(TEs)的相似性。图30A是在DXPas34上小鼠(x轴,AJ421479的138,745-141,000)对大鼠(y轴,N_W048043的51,001-53,300)序列的点图。显示了不同重复簇的位置。图30B显示如对于每个物种测定的共有重复序列。人重复A,SEQ ID NO:40;小鼠重复A1,SEQ ID NO:28;小鼠重复A2,SEQ ID NO:29;小鼠重复B,SEQ ID NO:30;大鼠重复A,SEQ ID NO:31;大鼠重复B,SEQ ID NO:32。图30C显示小鼠(x轴,AJ421479的bp134,001-141,000)对人(y轴,NT_011669的bp 11,328,000-11,352,000)的点图分析。区域2和3如所标记的(Lee等人,Cell 99:47-57(1999))。在y轴上标出人序列中的14kb插入,连同包含A重复(灰色框)的区域。图30D显示了人A重复区域的示意图,显示ERV/LTRs和SINEs(亮和暗灰色框)以及A重复单位(黑色三角)的位置。显示了代表性的ERV/LTR序列(NT_011669的bp 11345000-11348700;SEQ ID NO:43),其中A重复用框圈出。图30E显示人重复A(SEQ ID NO:40)完全匹配人HERVL重复(SEQ ID NO:44)的相应区域。小鼠DXPas34(A1基序)(SEQ ID NO:28)同样显示与人HERVL(27bp中的4个错配)和小鼠MERVL/RatERVL(5个错配)(SEQID NO:45)的极佳比对。
图31A-E显示DXPas34展示双向启动子活性。图31A是Tsix 5’区域的示意图,显示了DXPas34、对于链特异性RT-PCR使用的引物对的位置(星号数字)、和相关限制位点(A:Age I,S:SalI,M:MluI)。显示了萤光素酶测定中使用的DXPas34片段。萤光素酶活性对β半乳糖苷酶且随后对Tsix启动子萤光素酶构建体进行标准化。误差条指示1个标准差。图31B显示如图31A中所示的Rrm2或Tsix 5’区域的链特异性RT-PCR结果。有义(s)和反义(as)链在每个柱的上方指出。图31C显示检测Dxpas-r的5’RACE的结果。M:标记,5’:5’RACE扩增产物。具有主要和次要起始位点的代表性DXPas34区组序列由重和轻箭标指出(SEQ ID NO:46)。有下划线的是包含起始位点的重复A1单位。图31D显示用tagetin(T)处理8小时或α鹅膏毒环肽处理4或8小时(分别为α4和α8)的ES细胞的RT-PCR结果。Tsix和Dxpas-r在位置2上检测到。18S RNA(PolI转录物)作为装载对照进行平行扩增。图31E显示在位置2上扩增来自指示样品的RNAs的RT-PCR结果。
图32A-F显示的DXPas34的靶向缺失使Tsix转录减少。图32A的图显示关于DXPas34缺失的靶向方案。这个基因座的前3个等位基因在上方以灰色显示(Debrand等人,Mol.Cell Biol.19:8513-8525(1999);Lee等人,Cell 99:47-57(1999);Sado等人,Development 128 1275-1286(2001))。相关限制位点是S:StuI,B:BamHI,RV:EcoRV。探针由灰色框指出。图32B显示用StuI消化和用探针1检测的来自雌性和雄性克隆的基因组DNAs。图32C显示用EcoRV消化和用探针2检测的基因组DNAs。图32D显示用BamHI消化和用探针2探测的雌性基因组DNAs,以测定哪个等位基因被靶向。图32F的放射自显影图显示在未分化的雄性细胞中在位置A和B上的定量实时RT-PCR分析(如图29E中所示)。图32的一系列图显示如图31B-E中所述,对指示基因型的雄性细胞的链特异性RT-PCR分析的结果。位置2在ΔDXPas34缺失区域内且因此从分析中省略。
图33A-C显示DXPas34缺失导致非随机XCI模式。图33A的一系列图像显示在第12天时雌性ΔDXPas34细胞的RNA/DNA FISH。Xist RNA,绿色;DXPas34 DNA,红色。每种XCI模式的百分比在小图右侧指出(括号中的核数目)。n=48。图33B-33C显示如图29G中所述关于Xist(图33B)或Mecp2(图33C)的等位基因特异性RT-PCR分析。注:ΔDXPas34实验对图29G中呈现的细胞系平行进行;因此,对照放射自显影图是相同的。图表指出在第12天时对于多分化实验来自129染色体的转录百分比。空心圈表示个别实验;实心圈表示平均值,其中1个标准差由误差条指示。如所示的样品的逐对比较通过斯氏t检验来进行(底部)。
图34A和B显示分化后期DXPas34缺失使Tsix去阻抑。图34A显示在分化期间野生型和ΔDXPas34雌性的ScrFI多态性上的等位基因特异性Tsix RT-PCR。图34B的一系列图显示在细胞分化期间来自129(左侧小图)或castaneus(右侧小图)的Tsix RNA的等位基因级分。误差条指示1个标准差。
图35A的示意图显示在细胞分化期间DXPas34如何调节Tsix表达的3步骤模型,其中DXPas34的2个增强子和2个功能在序列中发挥作用以控制Tsix动力学的不同方面。这个模型提出二分增强子在前XCI细胞中发挥作用以完成双等位基因(biallelic)Tsix表达。Xite增强子在这个期间可能也发挥作用,但它直到XCI开始时才是绝对需要的,这时它的作用使得Tsix表达能够在未来Xa上持续。XCI确立后,Tsix的稳定表达需要DXPas34的晚期的阴性功能。在这个模型中,Dxpas-r的反平行转录导致Tsix的阻抑,可能通过类似的反义机制。图35B的示意图显示Tsix如何指派反转录转座元件用于其调节的模型。约8千万-2亿年前,反转录转座子(rTE)偶然插入原始Tsix基因5’端附近的Xic内。每个TE是包含启动子、增强子和隔离子的自给自足型基因表达模块,插入引入指派调节Tsix的调节元件谱(repertoire)(例如CTCF位点、Tsix增强子、和可变启动子(Chao等人,Science 295:345-347(2002);Stavropoulos等人,Mol.Cell Biol.25:2757-2769(2005))。随着时间过去,rTE可能丧失几乎所有其原始序列,除了保留用于调节Tsix的那些。保留的元件在这个过程期间重复加倍以产生现在的DXPas34。
图36显示关于在Xite内存在小RNAs的RNA印迹分析,如示意图中所示,左侧的1个用let7探针探测,且右侧的1个用Xite探针探测。Xite内的小RNAs用箭标指出。let7b印迹是显示已知miRNA(let7b)可以被检测的阳性对照。注意对于Xite小图,小RNAs可以使用指出小RNAs是双链的有义和反义探针进行检测。显示的细胞系是来自Lee,Science(2005)同上、和Xu等人Science(2006)同上、以及Ogawa和Lee Mol.Cell.(2003)同上的那些。简言之,J1,野生型雄性ES;16.7,野生型雌性ES;J1-ΔCpG是Tsix-缺失的雄性ES;16.7Δ/Δ是Tsix-/-雌性ES;ΔL(Xite)是Xite的12.5kb缺失;雌性-Tsix3.7是具有在Tsix等位基因中缺失的3.7kb Tsix序列的转基因雌性ES;雌性-Xite是具有5.6Xite转基因的转基因雌性ES。泳道0、4、10指关于每种细胞系的细胞分化天数。
详述
由于其无限自我更新和分化成大量细胞和组织类型的能力,干细胞具有巨大的临床潜能。它们在再生疗法和基因疗法中的潜在用途几乎是无限的,但取决于控制以其他方式不可逆的分化过程的能力。
本发明的特征在于用于控制此类分化的方法,其通过引入Xic、Tsix、Xite或Tsix/Xite转基因或其片段,或来源于Xic、Tsix、Xite或Tsix/Xite的小RNA以抑制分化来实现。这允许有足够时间根据需要处理干细胞以用于治疗或研究用途。转基因的后续去除允许诱导干细胞分化成所需细胞或组织类型,且给患者施用。
转基因
本发明基于下述发现:将具有Xic、Tsix、Xite或Tsix/Xite序列或其片段的转基因引入干细胞内抑制分化。在本发明中有用的转基因可以包括任何Xic、Tsix或Xite核酸序列,或具有Tsix和Xite序列的部分或全部的Tsix/Xite核酸序列。
Tsix和Xite是在称为X失活中心(Xic)的主调节区中发现的非编码顺式作用基因。这个区域包含许多罕见的非编码基因,包括Xist、Tsix和Xite,所述非编码基因一起发挥作用以确保XCI只在XX雌性中、只在1条染色体上、且以发育特异性方式发生。这些基因各自产生RNA而不是蛋白质。Xist只由将来失活的X产生,且产生“包被”失活X的20kbRNA,从而开始基因沉默过程。Tsix是Xist的反义调节物,且通过阻止Xist RNA沿着X染色体扩展来发挥作用。因此,Tsix指定未来的活性X。Xite连同Tsix一起发挥作用以确保X的活性状态。Xite产生一系列基因间RNAs且呈现特别的染色质构象。它的作用增强了反义Tsix的表达,从而与Tsix协同指定未来的活性X。此外,Tsix和Xite通过如本文所述的X-X配对一起发挥作用,以调节XCI的计数和选择方面。
具有Xic、Tsix、Xite或Tsix/Xite序列或其片段或组合的转基因在本发明的方法中对于延迟或控制分化是有用的。应当指出尽管确定了Xic、Tsix、Xite或Tsix/Xite序列内的优选片段,但这个区域内的任何核酸序列在本发明的方法中都是有用的。本文呈现的数据鉴定这个区域关于阻断X-X配对、计数和细胞分化的功能丰余性,支持来自这个区域的任何片段的使用。例如,来自这个区域的可以抑制X-X配对的任何序列(例如,通过诱导从头X转基因配对)都可以用于阻断分化。
优选的Xic转基因序列的非限制性例子包括小鼠Xic(SEQ ID NO:1)或人同线等价物(SEQ ID NO:39)、πJL2(SEQ ID NO:2)和πJL3(SEQ ID NO:3)。
优选的Tsix转基因序列的非限制性例子包括至少基本上等同于全长小鼠Tsix基因(SEQ ID NO:6)或其片段的核酸序列,以及至少基本上等同于下述小鼠Tsix基因片段的核酸:例如高度保守区域(SEQ IDNO:5)、pCC3(SEQ ID NO:9)、p3.7(SEQ ID NO:10)、DxPas34(SEQ ID NO:12)、DxPas34的34bp重复(SEQ ID NO:13)、DxPas34的68bp重复(SEQ ID NO:14)、ns25(SEQ ID NO:21)、ns41(SEQID NO:22)、ns82(SEQ ID NO:23)、小鼠重复A1(SEQ ID NO:28)、小鼠重复A2(SEQ ID NO:29)、小鼠重复B(SEQ ID NO:30)、大鼠重复A(SEQ ID NO:31)和大鼠重复B(SEQ ID NO:32)。另一种优选的Tsix转基因序列包括34bp或68bp DxPas34重复(分别为SEQ ID NOs:13或14)的至少2个拷贝,以及至少3个拷贝、至少4个拷贝、和至少5个拷贝或更多。另外优选的Tsix转基因序列包括至少基本上等同于以下人同线等价物的核酸序列:全长人Tsix基因(SEQ ID NO:36)、人重复A(SEQ ID NO:40),或其任何片段,和基本上等同于小鼠Tsix序列(SEQ ID NO:6)或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。
如上文关于SEQ ID NOs:13和14所述,应当指出对于任何片段,特别是较小的片段例如SEQ ID NOs:28、29、30、31、32和40,转基因可以包括序列的多个拷贝,例如以串联系列(例如,至少2个拷贝、至少3个拷贝、至少4个拷贝、和至少5个拷贝或更多)。小鼠重复A1(SEQ ID NO:28)、小鼠重复A2(SEQ ID NO:29)、小鼠重复B(SEQID NO:30)、大鼠重复A(SEQ ID NO:31)、大鼠重复B(SEQ ID NO:32)和人重复A(SEQ ID NO:40)都是DXPas34区域的部分,且包括结合转录因子CTCF所需的正规序列。图30B中提供的这些DxPas小重复单位和任何ERV衍生的正规序列多聚体,因此被包括作为在本发明方法中有用的优选Tsix转基因序列。
优选的Xite转基因序列的非限制性例子包括至少基本上等同于全长小鼠Xite基因(SEQ ID NO:15)或其片段的核酸序列,以及至少基本上等同于下述小鼠Xite基因片段的核酸:例如pXite(SEQ ID NO:16)、Xite增强子(SEQ ID NO:17)、ns130(SEQ ID NO:24)、ns135(SEQID NO:25)、ns155(SEQ ID NO:26)、ns132(SEQ ID NO:27)。优选的Xite转基因序列的另外非限制性例子包括基本上等同于人Xite基因(SEQ ID NO:38)或其片段的核酸序列,和基本上等同于小鼠Xite序列(SEQ ID NO:15)或其片段的任何哺乳动物(例如,人、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体的核酸序列。
包括跨越2种基因全部或部分的区域或2种基因之间的间插区域的序列被称为Tsix/Xite转基因,且也可以在本发明方法中用作转基因。非限制性例子包括具有跨越小鼠染色体的2种基因的整个关键区域的核酸,pSxn(SEQ ID NO:4)、pCC4(SEQ ID NO:11)、和二分增强子(SEQ ID NO:19)。另外优选的Tsix/Xite转基因序列包括基本上等同于Tsix(SEQ ID NO:36)和Xite(SEQ ID NO:38)的人同线等价物之间的间插区域的核酸序列。人Tsix/Xite转基因序列的一个例子是pSxN人(SEQ ID NO:37)。
优选片段显示于下表1和2中。应当指出因为片段是非编码区,所以序列的确切起始和结束并不重要。因此,对于所有片段,大小和核苷酸序列是近似值,且可以有1、2、5、10、20、30、40、50、100、150、200、250、500、750、1000或更多核苷酸的改变。还应当指出所有序列以5’至3’的方向呈现。
表1.小鼠和大鼠序列。
  SEQ IDNO 名称   长度(近似值) 核苷酸序列 参考图
  1   Xic   100kB   GenBank AJ421479的nt 80,000-180,000   图4A
  2   πJL2   80kB   Xist+30kB上游和下游   图9A
  3   πJL3   80kB   Xist+60kB下游   图9A
  4   pSxN   19.5kB   参见图3A和3B   图1、3A和3B
  5   高度保守的   5kB   SEQ ID NO:4的nt 1-5074(参见图3B)   图3A、3B
  6   全长Tsix   40kB   图5,AJ421479的nt 157,186-104,000   图5
  7   pXist 3′   4.9kB   未显示   图1
  8   pXist 5′   48kB   未显示   图1
  9   pCC3   4.3kB   SEQ ID NO:4的nt 3079-7395(参见图3B)   图1、3A和3B
  10   p3.7   3.7kB   SEQ ID NO:4的nt 5074-8768(参见图3B)   图1、2、3A和3B
  11   pCC4   5.9kB   SEQ ID NO:4的nt 7395-13274(参见图3B)   图1、2、3A和3B
  12   DxPas34   1.5kB   SEQ ID NO:4的nt 5073-6635(参见图3B)   图1、3A和3B
  13   34bp重复   34   SEQ ID NO:4的nt 5073-6635自始至终   图3B、4
  14   68bp重复   68   SEQ ID NO:4的nt 5073-6635自始至终   图3B、4
  15   全长Xite   20kB   图7,AJ421479的nt 157,186-104,000   图7
  16   pXite   5.6kB   SEQ ID NO:4的nt 13887-19467(参见图3B)   图1、2、3A和3B
  17   Xite增强子   1.2kB   SEQ ID NO:4的nt 16360-17582(参见图3B)   图1、3A和3B
18 pTsx 10.8kB   GenBank X99946的nt 41,347-52,236(SEQ ID NO:91) 图1
  19   二分增强子   10.2kB   SEQ ID NO:4的nt 3079-12274(参见图3B)   图3A、3B
  20   全长Xist   23kB   图5,AJ421479的nt 106,296-129,140   图6
21   ns25(DXPas34) 1.6kB   SEQ ID NO:4的nt 5485(SalI)-7177(SmaI)(参见图3B) 图1、2和3B
22 ns41 2.4kB   SEQ ID NO:4的nt 3079(BamHI)-5486(SalI)(参见图3B) 图1、2和3B
  SEQ IDNO 名称   长度(近似值) 核苷酸序列 参考图
23   ns82(Tsix启动子) 220bp  SEQ ID NO:4的nt 7177(SmaI)-7398(BamHI)(参见图3B) 图1、2和3B
24 ns130 1.8kB  SEQ ID NO:4的nt 17580-19467(参见图3B) 图1、2和3B
25   ns135(1.2kbXite增强子) 1.2kB  SEQ ID NO:4的nt 16360(StuI)-17583(XhoI)(参见图3B) 图1、2和3B
26   ns155(等价于ns135) 1.2kb  SEQ ID NO:4的nt 16360(StuI)-17583(XhoI)(参见图3B) 图1和3B
27 ns132 2.5kB  SEQ ID NO:4的nt 13883(AvrII)-16363(StuI)(参见图3B) 图1、2和3B
28 小鼠重复A1 34  GTGAYNNCCCAGRTCCCCGGTGGCAGGCATTTTA 图30B
29 小鼠重复A2 32  NNNNTNNNTNCNNNNNNNNNGCANNCATTTTA 图30B
30 小鼠重复B 30  CAAGCACTTAGCCAYCGCYCCACTGTCCCG 图30B
31 大鼠重复A 32  NNYAYANNYCNNNNNNNYNNNCAGNNATTTTA 图30B
32 大鼠重复B 31  CARGCACNTYAGCCACCTCNCCACTGWCCCG 图30B
“N”指任何核苷酸
“Y”指任一嘧啶
“R”指任一嘌呤
*应当指出如图5中所示的序列和GenBank登记号AJ421479在Zeste重复区域中具有3kB缺失。这个区域不能进行测序。这些坐标基于提供的序列且在序列中不包括3kB缺口。
表2.人序列
  SEQ ID NO   名称   长度(近似值)   核苷酸序列(近似值)
  35   Xist   32kB   NT_011669的11,390,576-11,358,483
  36   Tsix   64kB   NT_011669的11,329,000-11,393,000
  37   pSxN人   50-60kB   NT_011669的11,358,483-11,300,000
  38   Xite   13kB   NT_011669的11,320,000-11,333,000
  39   Xic   80kB   NT_011669的11,320,000-11,450,000
  40   重复A   16bp   GCNNCNNGGNGGCAGG,图30B
对于任何Xic、Tsix、Xite或组合Tsix/Xite转基因序列,将理解还包括哺乳动物(例如,人、小鼠、灵长类动物、牛、绵羊、猫和犬)同源物、直向同源物、旁系同源物、物种变体、或同线变体。例如,人同线区域包括X染色体上邻接人序列的约15兆碱基(GenBank登记号NT_011669,SEQ ID NO:34)。这些15兆碱基序列包括人Xic区域以及Xic区域2个末端上的另外序列。Xist的同线等价物在GenBank登记号NT_011669的约核苷酸11,390,576-11,358,483(SEQ ID NO:35)处发现。包括人序列中的Tsix和Xite的关键区域预测来自GenBank登记号NT_011669的约核苷酸11,358,483-核苷酸11,300,000(pSxN,人,SEQID NO:37)。Tsix(SEQ ID NO:36)的同线等价物在NT_011699的约核苷酸11,329,000-11,393,000处发现,且Xite(SEQ ID NO:38)的同线等价物在NT_011669的约核苷酸11,320,000-11,333,000处发现。在本发明方法中有用的转基因可以使用关于转基因阻断X染色失活或分化能力的测定进行鉴定。此类测定是本领域已知的且例子在本文中描述。
RNA干扰(RNAi)
本发明基于XCI过程破坏可以阻断分化的发现。用于干扰XCI的一种方法包括针对Xic、Tsix、Xite或Xist的小RNA分子例如siRNA的使用,将所述小RNA分子引入干细胞内且阻止干细胞经历X染色失活和在培养中分化。此类小RNA分子的使用避免了去除转基因的需要,因为小RNA分子具有有限的半衰期且将自然降解。
RNAi是通过引入双链RNA(dsRNA)开始的转录后基因沉默形式。一般称为“siRNAs”、“小RNAs”或“微小RNAs(microRNAs)”的15-32个核苷酸的短双链RNAs,在线虫(Zamore等人,Cell 101:25-33)和哺乳动物组织培养细胞系(Elbashir等人,Nature 411:494-498,2001,在此引入作为参考)中有效下调基因表达。这种方法在哺乳动物中的进一步治疗效力通过McCaffrey等人(Nature 418:38-39.2002)在体内证实。小RNA长度为至少15个核苷酸,优选地,17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个核苷酸,且长度甚至最高达50或100个核苷酸(包括在中间的所有整数)。基于下述发现:Tsix、Xite以及Xist元件被转录和这些区域的部分显示双向转录,因而具有形成随后可以经历RNAi途径的双链RNAs的潜能,基本上等同于Xic、Tsix、Xite或Xist的任何区域,或与Xic、Tsix、Xite或Xist的任何区域互补的此类小RNAs,包括在本发明中。事实上,对应于Xite区域、大小小于25nt-约100nt的小非编码RNAs(ncRNAs)已由有义和反义链鉴定(参见图36)。此外,Xic、Tsix Xite、或Tsix/Xite、或两者的转录或ncRNA产物已显示是XCI期间配对所需的。
因此,本发明包括任何小RNA,其基本上等同于Xic、Tsix、Xite或Xist的任何区域,优选本文所述以及表1和2中所示区域的长度上至少15个核苷酸,优选地,17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸,及长度上甚至最高达50或100个核苷酸(包括在中间的所有整数)。本发明还包括此类小RNA分子阻断分化的用途。应当指出,如下所述,可以使用被加工成此类小RNAs的较长dsRNA片段。有用的小RNAs可以使用本文所述方法,通过其阻断分化、阻断配对、或阻断XCI的能力来鉴定。小RNAs还可以包括短发夹RNAs,其中siRNA双链体的2条链都包括在单个RNA分子内。
小RNA的具体需要和修饰是本领域已知的,且例如在PCT公开号WO01/75164,以及美国申请公开号20060134787、20050153918、20050058982、20050037988和20040203145中得到描述,所述公开的相关部分引入本文作为参考。在具体实施方案中,siRNAs可以通过加工较长的双链RNAs来合成或产生,例如在切酶的存在下在其中dsRNA被加工成约17-约26个核苷酸的RNA分子的条件下。siRNAs还可以通过表达相应的DNA片段(例如,发夹DNA构建体)来产生。一般地,siRNA具有特征性2-3个核苷酸的3’突出端,优选地这些是(2’-脱氧)腺苷或尿嘧啶。siRNAs一般包含3’羟基。在某些实施方案中,使用单链siRNAs或平端dsRNA。为了进一步增强RNA的稳定性,3’突出端针对降解进行稳定化。在一个实施方案中,RNA通过包括嘌呤核苷酸例如腺苷或尿苷来稳定化。可替代地,用修饰类似物置换嘧啶核苷酸,例如用(2’-脱氧)胸腺嘧啶核苷(thymide)置换尿苷2-核苷酸突出端是耐受的,且不影响RNAi效率。2’羟基的不存在显著增强突出端在组织培养基中的核酸酶抗性。
siRNA分子可以通过多种规程来获得,包括化学合成或使用果蝇(Drosophila)体外系统的重组生产。它们可以从公司例如DharmaconResearch Inc.或Xeragon Inc.商购获得,或它们可以使用商购可得的试剂盒来合成,所述试剂盒例如来自Ambion的SilencerTM siRNAConstruction Kit(目录号1620)或来自New England BioLabs的HiScribeTMRNAi Transcription Kit(目录号E2000S)。
可替代地,siRNA可以使用用于RNA体外转录的标准程序和dsRNA退火程序来制备,所述程序例如Elbashir等人(Genes & Dev.,15:188-200,2001),Girard等人,(Nature 2006年6月4日,印刷前的电子出版物),Aravin等人,(Nature 2006年6月4日,印刷前的电子出版物),Grivna等人,(Genes Dev.2006年6月9日,印刷前的电子出版物),和Lau等人,(Science 2006年6月15日,印刷前的电子出版物)中描述的那些。siRNAs也通过下述方法来获得:在来自合胞体胚盘(blastoderm)果蝇胚的无细胞果蝇裂解物中,在其中dsRNA被加工以产生约21-约23个核苷酸的siRNAs的条件下温育对应于靶基因序列的dsRNA,所述siRNAs随后使用本领域技术人员已知技术来分离。例如,凝胶电泳可以用于分离21-23nt RNAs,且RNAs随后可以从凝胶切片中洗脱。此外,层析(例如大小排阻层析)、甘油梯度离心、和使用抗体的亲和纯化可以用于分离小RNAs。
对Tsix、Xite、Xist或Xic区域特异的siRNAs也可以从天然来源获得。例如,如图36中所示,小RNAs由小鼠XIC内的各个位点内源产生。此类小RNAs可以如上所述进行纯化且在本发明方法中使用。
如Yu等人或Paddison等人(Proc.Natl.Acad.Sci USA,99:6047-6052,2002;Genes & Dev,16:948-958,2002;引入本文作为参考)中所述的短发夹RNAs(shRNAs),也可以在本发明方法中使用。shRNAs被这样设计,从而使得有义和反义链都包括在单个RNA分子内且通过核苷酸(3个或更多)环连接。shRNAs可以使用如上文和Yu等人(同上)中所述的标准体外T7转录合成来合成和纯化。shRNAs也可以被亚克隆到具有小鼠U6启动子序列的表达载体内,所述表达载体随后可以被转染到细胞内且用于shRNA的体内表达。
多种方法可用于将dsRNA转染或引入哺乳动物细胞内。例如,存在对siRNAs的基于脂质的转染有用的几种商购可得的转染试剂,包括但不限于:TransIT-TKOTM(Mirus,目录号MIR 2150)、TransmessengerTM(Qiagen,目录号301525)、OligofectamineTM和LipofectamineTM(Invitrogen,目录号MIR 12252-011和目录号13778-075)、siPORTTM(Ambion,目录号1631)、DharmaFECTTM(Fisher Scientific,目录号T-2001-01)。用于siRNA转染的基于电穿孔的方法的试剂也是商购可得的,例如siPORTerTM(Ambion Inc.目录号1629)。还可以使用显微注射技术。小RNA也可以由引入细胞内的表达构建体来转录,其中所述表达构建体包括与一种或多种转录调节序列可操作地连接的用于转录小RNA的编码序列。需要时,质粒、载体或病毒载体也可以用于递送dsRNA或siRNA,且此类载体是本领域已知的。关于每种转染试剂的规程可从制造商获得。其他方法是本领域已知的,且在例如美国专利申请公开号20060058255中得到描述。
关于每种靶和每种细胞系的dsRNA浓度不同,且可以由技术人员确定。需要时,细胞可以使用多个小RNAs转染多次以最优化基因沉默作用。
细胞
来源于植入前胚胎的内细胞团的胚胎干细胞(ES)已被识别为最多潜能的干细胞群体,且因此是用于本发明方法的优选细胞。这些细胞在体外能够无限增殖,同时维持分化成广泛多样的体和胚外组织的能力。ES细胞可以是雄性(XY)或雌性(XX)的;雌性ES细胞是优选的。
多能成体干细胞也可以在本发明方法中使用。优选的成体干细胞包括造血干细胞(HSC)、骨髓衍生干细胞(BMSC)和神经干细胞(NSC),所述HSC可以在生命中自始至终增殖和分化,以产生淋巴样和髓样细胞类型;所述BMSC可以分化成各种细胞类型,包括脂肪细胞、软骨细胞、骨细胞、肝细胞、心肌细胞和神经元;且所述NSC可以分化成星形胶质细胞、神经元和少突胶质细胞。来源于上皮和脂肪组织和脐带血细胞的多能干细胞也可以在本发明方法中使用。
干细胞可以来源于任何哺乳动物,包括但不限于小鼠、人和灵长类动物。用于干细胞制备的优选小鼠品系包括129、C57BL/6和杂交品系(Brook等人,Proc.Natl.Acad.Sci.U.S.A.94:5709-5712(1997),Baharvand等人,In Vitro Cell Dev.Biol.Anim.40:76-81(2004))。用于制备小鼠、人或灵长类动物干细胞的方法是本领域已知的,且例如在下述参考文献中描述:Nagy等人,Manipulating the mouse embryo:A laboratory manual,第3版,Cold Spring Harbor Laboratory Press(2002);Thomson等人,Science 282:1145-1147(1998),Marshall等人,Methods Mol.Biol.158:11-18(2001);Thomson等人,TrendsBiotechnol.18:53-57(2000);Jones等人,Semin.Reprod.Med.18:219-223(2000);Voss等人,Exp.Cell Res.230:45-49(1997);和Odorico等人,Stem Cells 19:193-204(2001)。
ES细胞可以直接来源于胚泡或任何其他发育早期,且可以是来源于体细胞核移植和其他类似程序的“克隆的”干细胞系。用于培养来自胚泡的小鼠、人或灵长类动物ES细胞的一般方法可以在名称为StemCells:Scientific Progress and Future Research Directions的NIH干细胞报告附录C(这个报告可以在NIH干细胞信息网站上在线找到,http://stemcells.nih.gov/info/scireport)中找到。例如,在第1个步骤中,植入前胚泡的内细胞团从围绕其的滋养外胚层中取出。(关于人ES细胞的培养,胚泡通过体外受精产生和捐赠用于研究。)用于培养细胞的小塑料培养皿包含补加了胎牛血清的生长培养基,且有时用不分裂细胞的“饲养”层包被。饲养细胞通常是小鼠胚胎成纤维细胞(MEF)细胞,所述MEF细胞已被化学灭活,从而它们将不分裂。其他试剂例如细胞因子白血病抑制因子(LIF)也可以添加到用于小鼠ES细胞的培养基中。其次,几天至1周后,取出细胞增殖集落且分散到新培养皿内,每个所述培养皿可以包含或不包含MEF饲养层。如果细胞将用于人治疗用途,那么优选不包括MEF饲养层。在这些体外条件下,ES细胞聚集以形成集落。在产生ES细胞系所需的第3个主要步骤中,个别未分化集落被解离且在新皿内重新铺平板(replate),这个步骤称为传代。这个重新铺平板过程确立ES细胞“系”。如果单一ES细胞产生细胞系,那么它命名为“克隆的”。有限稀释法可以用于产生克隆ES细胞系。干细胞培养所需试剂例如由Invitrogen、Stem Cell Technologies、R&D Systems和SigmaAldrich商购可得,且在例如美国专利申请公开号20040235159和20050037492,以及NIH报告附录C Stem Cells:Scientific Progress andFuture Research Directions同上中得到描述。
尽管本发明的优选方法包括在干细胞系已确立后将转基因转染到干细胞内,但也可能产生有转基因整合到小鼠染色体内的嵌合转基因小鼠。转基因随后将存在于种系中,且小鼠将交配以产生具有整合的转基因的胚胎。具有整合的转基因的植入前胚泡的内细胞团从围绕其的滋养外胚层中取出,且用于如上所述确立干细胞系。
转基因转染
干细胞系已确立后,细胞可以用本发明的转基因转染或转导(对于病毒载体)以阻止或控制干细胞分化。取决于用于递送转基因的方法,转基因可以整合到染色体内且可以是附加型的。使用质粒或病毒载体将转基因递送到细胞内的方法是本领域已知的。用于转染或感染宿主细胞的合适方法可以在下述参考文献中找到:Sambrook等人(Molecular Cloning:A Laboratory Manual,第2版,Cold Spring HarborLaboratory press(1989));Goeddel等人,(Gene Expression Technology:Methods in Enzymology,Academic Press,San Diego,Calif.(1990);Ausubel等人(Current Protocols in Molecular Biology John Wiley &Sons,New York,N.Y.(1998);Watson等人,Recombinant DNA,第12章,第2版,Scientific American Books(1992);以及其他实验室教科书。关于转基因递送方法的综述参见Stull,The Scientist,14:30-35(2000)。重组质粒或载体可以通过下述方法来转移:例如磷酸钙沉淀、电穿孔、脂质体介导的转染、基因枪、显微注射、病毒壳体介导的转移、或聚凝胺(polybrene)介导的转移。关于脂质体制备、靶向和内容物递送程序的综述,参见Mannino和Gould-Fogerite,(BioTechniques,6:682-690,1988),Felgner和Holm,(Bethesda Res.Lab.Focus,11:21,1989)以及Maurer(Bethesda Res.Lab.Focus,11:25,1989)。关于病毒转导,病毒载体一般使用上述方法首先转移至辅助细胞培养物,以用于生产病毒。病毒颗粒随后进行分离且用于感染预期的干细胞系。用于生产和分离病毒颗粒的技术和病毒颗粒用于感染的用途,也可以在上文引用的参考文献和美国专利申请公开号20040241856中找到。
存在对转基因递送有用的多种质粒和病毒载体,且这些是本领域已知的。参见,例如Pouwels等人,Cloning Vectors :A Laboratory Manual(1985).Supp.1987)和上文引用的参考文献。质粒和病毒载体也是例如由Clontech、Invitrogen、Stratagene和BD Biosciences商购可得的。
一般而言,优选的质粒或病毒载体包括下述组分:用于克隆转基因的由限制酶识别位点组成的多克隆位点,和用于在补加了选择试剂的培养基中选择转染或转导的细胞的真核选择标记(阳性或阴性)。优选的选择标记包括药物抗性标记、抗原标记、附着标记等。抗原标记的例子包括在荧光激活细胞分选术中有用的那些。附着标记的例子包括关于允许选择性附着的附着配体的受体。其他选择标记包括可以在实验测定规程中检测的多种基因产物,例如标记酶、氨基酸序列标记、细胞表型标记、核酸序列标记等。一般而言,正选择标记基因是药物抗性基因。合适的正选择标记包括例如,编码新霉素抗性、潮霉素抗性、嘌呤霉素抗性、组氨醇抗性、黄嘌呤利用、zeocin抗性、和博来霉素抗性的核酸序列。正选择标记可以在核酸分子中与启动子可操作地连接(例如,原核启动子或磷酸甘油酸激酶(“PGK”)启动子)。
一般而言,负选择标记基因在由此表达的基因产物导致宿主细胞消除的情况下使用,例如在核苷类似物例如丙氧鸟苷(gancyclovir)的存在下。合适的负选择标记包括例如,编码Hprt、gpt、HSV-tk、白喉毒素、蓖麻毒蛋白毒素和胞嘧啶脱氨酶的核酸序列。
质粒或病毒载体还可以包含多腺苷酸化位点、一种或多种启动子、和内部核糖体进入位点(IRES),所述IRES允许下游编码区或可读框与细胞质多核糖体附着,以在不存在内部启动子的情况下开始翻译。IRES序列通常位于RNA病毒,例如微小核糖核酸病毒的非翻译前导区域上。病毒序列长度为约450-500个核苷酸,尽管IRES序列还可以更短或更长(Adam等人J.Virol.65:4985-4990(1991);Borman等人Nuc.Acids Res.25:925-32(1997);Hellen等人Curr.Top.Microbiol.Immunol.203:31-63(1995);和Mountford等人Trends Genet.11:179-184(1995))。脑心肌炎病毒IRES是适合于用于在本发明中使用的一种此类IRES。
质粒或病毒载体还可以包括细菌复制起点、一种或多种细菌启动子、和用于选择转化的细菌和生产质粒或载体的原核选择标记基因。细菌选择标记基因可以等价于或不同于真核选择标记基因。优选的细菌选择标记基因的非限制性例子包括,编码氨苄青霉素抗性、卡那霉素抗性、潮霉素抗性、和氯霉素抗性的核酸。
希望地,质粒或病毒载体还将包括用于切除和去除转基因的序列。对于靶向的重组有用的重组酶识别序列对于控制分化的方法有用,且在下文详细描述。可以包括在本发明使用的质粒或载体中的识别序列的非限制性例子是loxP序列或FRT序列。loxP位点由8-bp非回文核心区侧翼的2个13-bp反向重复组成。loxP序列是包含下述核苷酸序列的DNA序列(在下文中这种序列被称为野生型loxP序列):
5′-ATAACTTCGTATA ATGTATGC TATACGAAGTTAT-3′(SEQ ID NO:
41)
3′-TATTGAAGCATAT TACATACG ATATGCTTCAATA-5′(SEQ ID NO:
42)
然而,loxP序列不需限于上述野生型loxP序列,且野生型loxP序列部分可以用其他碱基替换,只要2个“重组酶识别序列”成为Cre重组酶的底物。此外,即使与野生型loxP序列组合通常不成为重组酶Cre底物,但与通过野生型loxP序列的碱基置换的相同序列的突变loxP序列(即,对于其发生切割、交换和DNA链结合的整个过程的序列)组合变成重组酶Cre底物的那些loxP序列(突变loxP序列),包括在重组酶Cre的识别序列中。此类突变loxP序列的例子在下述参考文献中描述:Hoess等人(Nucleic Acids Res.14:2287-2300(1986)),其中野生型loxP序列间隔区中的1个碱基已被置换,和Lee等人(Gene 14:55-65(1998)),其中间隔区中的2个碱基已被置换。
FLP识别序列包括成为重组酶FLP底物的任何序列,其中FLP引起2个重组酶识别序列之间的切割、交换和DNA链结合的整个过程。例子包括FRT序列,这是34碱基DNA序列(Babineau等人,J.Biol.Chem.260:12313-12319(1985))。如上文关于Cre识别序列所述,FLP识别序列不限于上文的野生型FRT序列。野生型FRT序列部分可以用其他碱基替换,只要2个FLP重组酶识别序列可以成为FLP重组酶的底物。此外,即使与野生型FRT序列组合通常不成为重组酶FLP底物,但与通过野生型FRT序列的碱基置换的相同序列的突变FRT序列(即,对于其发生切割、交换和DNA链结合的整个过程的序列)组合变成重组酶底物的那些FRT序列(突变FRT序列),包括在FLP的识别序列中。关于FRT序列的例子,参见McLeod等人,Mol.Cell Biol.,6:3357-3367(1986)。
在本发明中有用的病毒载体的非限制性例子包括腺病毒载体、腺伴随病毒载体、逆转录病毒载体、EB病毒载体、慢病毒载体、单纯疱疹病毒载体、和来源于鼠干细胞病毒(MSCV)的载体以及由Hawley(Curr.Gene Ther.1:1-17(2001)描述的杂合载体。对于这个目的有用的众多载体一般是已知的,且已得到描述(Miller,Human GeneTherapy 15:14,1990;Friedman,Science 244:1275-1281,1989;Eglitis和Anderson,BioTechniques 6:608-614,1988;Tolstoshev和Anderson,Current Opinion in Biotechnology 1:55-61,1990;Sharp,The Lancet 337:1277-1278,1991;Cornetta等人,Nucleic Acid Research and MolecularBiology 36:311-322,1987;Anderson,Science 226:401-409,1984;Moen,Blood Cells 17:407-416,1991;Miller和Rosman,Biotechniques7:980-990,1989;Rosenberg等人,N.Engl.J.Med 323:370,1990,Groves等人,Nature,362:453-457,1993;Horrelou等人,Neuron,5:393-402,1990;Jiao等人,Nature 362:450-453,1993;Davidson等人,Nature Genetics 3:2219-2223,1993;Rubinson等人,Nature Genetics 33,401-406,2003;Buning等人,(Cells Tissues Organs 177:139-150(2004));以及Tomanin等人,Curr.Gene Ther.4:357-372(2004)。
在一个优选例子中,使用基于EB病毒(EBV)的载体,所述载体保持附加型且可以无限繁殖。在这个例子中,在EBV复制起点周围引入重组酶序列,且在用合适的重组酶处理后,复制起点丧失且附加型序列将不再繁殖,从而导致附加型序列丧失。
在本发明中有用的质粒的非选择性例子包括来自Stratagene的pSG、pSV2CAT和PXtl,以及来自Pharmacia的pMSG、pSVL、pBPV和pSVK3。
在分化已被阻断前或后,用于将Tsix或Xite转基因引入干细胞内的上述方法也可以用于将治疗基因递送给干细胞。
关于转基因表达的测定
一旦干细胞培养物已用转基因或小RNA分子感染、转染或显微注射,就在选择培养基中培养细胞以分离稳定表达包含转基因的质粒或病毒载体的细胞。选择方法一般是本领域已知的,且包括例如,在包含选择剂的培养基中培养细胞,以用于选择表达合适的选择标记基因的细胞。选择标记基因可以编码负选择标记、正选择标记、或含正和负选择性状的融合蛋白。负选择性状在由此表达的基因导致宿主细胞消除的情况下提供,经常是在核苷类似物例如丙氧鸟苷的存在下。正选择性状可以由药物抗性基因来提供。合适的负选择标记包括例如,编码Hprt、gpt、HSV-tk、白喉毒素、蓖麻毒蛋白毒素和胞嘧啶脱氨酶(deeaminase)的核酸序列。合适的正选择标记包括例如,编码新霉素抗性、潮霉素抗性、嘌呤霉素抗性、组氨醇抗性、黄嘌呤利用、Zeocin抗性、和博来霉素抗性的核酸序列。药物抗性细胞可以合并为混合的群体,或集落可以个别选择(例如,约25-1000个细胞的小组,优选地,25-500个细胞,且最优选25-100个细胞),且铺平板以产生克隆细胞系或其中高比例(80%、85%、90%、95%或更多)细胞表达转基因的细胞系。
干细胞的遗传改变很少是100%的,且已成功改变的细胞群体可以通过下述方法来富集:例如使转基因与标记例如GFP或可免疫染色的表面标记例如NCAM一起共转染,所述标记可以通过荧光激活细胞分选术用于鉴定和分离转染的细胞。
可以针对下述测定表达转基因的细胞:增殖标记的存在、未分化细胞的指示剂、或分化指示剂的不存在,以确定分化是否已被成功阻止。关于分化的测定的例子在下文描述。
表达转基因且被阻断分化的细胞系包括在本发明中。此类细胞可以无限维持且用于需要干细胞的任何治疗目的,例如本文所述的那些。此类细胞还可以用治疗性转基因进行基因修饰。例如,本发明的“主”哺乳动物(例如,人)ES细胞系或“主”哺乳动物(例如,人)成体干细胞系可以进行基因修饰以用于在下述疾病治疗中使用:神经变性病症(例如,阿尔茨海默氏或帕金森氏或脑或脊髓的外伤损伤),血液学病症(例如,镰形细胞、地中海贫血)、肌营养不良(例如,杜兴氏肌营养不良),内分泌病症(例如,糖尿病、生长激素缺乏),浦肯野细胞变性、心脏病、视力和听力丧失等。
分化
其中分化通过使用本发明方法引入转基因或小RNA分子有效阻断的细胞,可以通过下述方法进行测定:检测未分化细胞的表型特征,或检测对未分化细胞特异的标记的存在,或分化细胞的标记或特征的不存在。
未分化干细胞的形态学不同于分化干细胞的那种,且形态学特征可以用于鉴定用转基因成功转染和维持未分化状态的干细胞。一般地,ES细胞被无限增殖化,且具有圆形形态学、高辐射率水平、和在凝胶化的板上非常少的细胞长出。用于检测转染的干细胞形态学的方法也是本领域已知的。
也可以使用指示未分化状态或指示不存在分化的标记。在第1种情况下,对于小鼠、灵长类动物、或人细胞,标记例如期特异性胚胎抗原(SSEA)1、3和4,表面抗原TRA-1-60和TRA-1-81,碱性磷酸酶,Nanog,Oct-4,和端粒酶逆转录酶都是干细胞未分化状态的指示剂。可以用于监控ES细胞分化的由未分化ES细胞表达的另外基因的分子特征在Bradenberger等人(BMC Dev.Bio.4:10(2004))中描述。
在第2种情况下,未分化细胞可以通过分化标记的不存在来鉴定。示例性的分化标记包括作为特定分化细胞特征的任何蛋白质或mRNA,且将是技术人员已知的。例如,已分化成神经元的细胞将表达酪氨酸羟化酶,已分化成少突胶质细胞的细胞将表达NG2蛋白聚糖、A2B5和PDGFR-α,且对于NeuN将是阴性的,已分化成T淋巴细胞的细胞将表达CD4和CD8,且已分化成成熟粒细胞的细胞将表达Mac-1。
分化和未分化细胞类型标记的另外例子可以在名称为Stem Cells:Scientific Progress and Future Research Directions,同上的NIH干细胞报告附录E中找到。用于检测蛋白质标记、转录因子、或表面抗原,或mRNA或编码这些的基因(例如,编码Oct-3/Oct-4转录因子的Pou5f1基因)表达的方法是本领域已知的,且包括例如,免疫染色、免疫印迹、免疫组织化学、PCR、DNA印迹、RNA印迹、RNA酶保护测定和原位杂交。
转基因的灭活
对于需要控制从未分化状态到分化状态的转换的应用(例如,治疗应用),转基因被灭活以减少或消除针对分化的阻断。在优选实施方案中,转基因通过使用例如位点特异性重组法去除转基因来灭活。对于此类应用,在去除转基因之前基因修饰干细胞维持足以操纵或处理的合适时间段(例如,1-90天、优选地1-45天、更优选地1-30天或1-10天)。
本领域已知的任何位点特异性重组酶/DNA识别序列都可以用于从本发明的干细胞中去除转基因。位点特异性重组酶的一个例子是Cre重组酶。Cre是噬菌体P1的cre(环化重组)基因的38-kDa产物,且是Int家族的位点特异性DNA重组酶(Sternberg等人,J.Mol.Biol.187:197-212(1986)。Cre识别P1基因组上称为loxP(P1交换的基因座)的34-bp位点,且有效催化loxP位点对之间的交互保守DNA重组。loxP位点由8-bp非回文核心区侧翼的2个13-bp反向重复组成。2个同向重复的loxP位点之间的Cre介导的重组导致它们之间的DNA作为共价闭环切除。反向loxP位点对之间的Cre介导的重组将导致间插DNA倒位而不是切除。DNA的断裂和连接限于核心区内的不连续位置,且用酶经由瞬时的磷酸酪氨酸DNA-蛋白质键每次对1条链进行。位点特异性重组系统的另外例子包括来自噬菌体λ的整合酶/att系统、和来自啤酒糖酵母(Saccharomyces cerevisiae)2pi环状质粒的FLP(翻转酶)/FRT系统。关于这些和另外或修饰的重组酶/DNA识别序列的另外细节以及关于使用它们的方法可以在下述参考文献中找到:例如美国专利号4,959,317;5,527,695;6,632,672;和6,734,295;Kilby等人Trends Genet.9:413-421(1993);Gu等人Cell 73:1155-1164.(1993);Branda等人,Dev.Cell.6:7-28(2004);Sauer Endocrine 19:221-228(2002;Pfeifer等人,Proc.Natl.Acad.Sci.98:11450-11455(2001),和Ghosh等人,Methods 28:374-83(2002)。
关于转基因灭活的测定
基因改造的干细胞已维持所需时间段后,转基因或小RNA分子的成功灭活(例如,通过自然降解)可以使用技术人员将知道的各种技术来测定。例如,细胞在选择培养基中生长的能力可以用作转基因成功去除的测定。在这个例子中,重组酶的使用消除了包括选择标记基因的所有转基因序列(除了1个剩余识别位点外)。因此,细胞丧失在正选择培养基中生长的能力。细胞可以使用标准有限稀释法接种和生长成克隆细胞系。克隆细胞系可以影印铺板,且1套可以在选择剂的存在下培养,而第2套在不存在选择剂的情况下培养。已丧失其在选择培养基中生长的能力的细胞鉴定为已丧失转基因的细胞。这些细胞的匹配套随后可以根据需要在不存在选择培养基的情况下生长,扩增且使用。
尽管转基因的去除应当足以诱导X染色体失活和加强细胞的分化,但在某些情况下另外的因子可能是完全诱导分化或诱导分化成所需细胞类型所需的。此类因子在例如美国专利申请公开号20050037492,和名称为Stem Cells:Scientific Progress and Future Research Directions,同上的NIH干细胞报告附录D中得到描述。
如上所述,分化的表型特征或分化标记的鉴定也可以用于鉴定其中转基因被灭活的细胞且所述细胞已成功经历分化。
如上所述,转基因已知阻断X染色体失活。因此,关于X染色体失活,包括染色体配对成核现象的测定,也可以用于鉴定其中转基因被灭活的和/或不再具有转基因的细胞。此类测定的例子在本文(例如,荧光原位杂交(Ogawa等人,同上)或Lee等人,Cell(1999),同上,Stavropoulos等人,Proc.Natl.Acad.Sci.98:10232-10237(2001),Lee,Nature Genetics(2002),同上,和Ogawa等人,同上中描述。
组合方法
本文所述的任何转基因都可以与本文所述的另外转基因组合使用,以增强所需作用。此外,siRNA与本发明的一种或多种转基因的组合使用也可以用于达到所需作用。如果需要,本文所述方法可以与本领域已知的另外方法组合,以减少干细胞分化。此类方法包括在小鼠胚胎成纤维细胞的饲养层上生长,在MatrigelTM中生长,向培养基中添加白血病抑制因子,和向培养基中添加map激酶激酶抑制剂例如PD98059(Sigma,目录号P215-5MGA)、LIF、Oct-4、Gab1、STAT3或FGF,(或激活这些蛋白质活性或表达的因子)(参见,例如,下述参考文献中描述的方法,Xu等人,Nature Biotech.19:971(2001),Amit等人,Biol.Reprod.70:837-45(2004),PCT公开号WO 01/51616,以及美国专利申请公开号20040235159和20050037492)。
治疗应用
本文所述的用于调节干细胞分化的方法具有技术人员将理解的众多临床、农业和研究用途。由于其分化成身体的任何细胞类型的能力,干细胞具有巨大的临床潜能。细胞可以用作产生更替组织或细胞的起始点,所述组织或细胞例如软骨、骨或骨细胞、肌肉或肌细胞、神经元细胞、胰组织或细胞、肝或肝细胞、成纤维细胞、和造血细胞。使用本文所述方法,临床医生或研究人员可以将合适的转基因引入干细胞内以阻止分化,且随后紧在给患者施用细胞产品之前去除转基因。如果使用小RNA,那么此类小RNA一般将自然降解且无需去除。
本文所述的用于调节哺乳动物干细胞分化的方法例如可以用于治疗疾病,所述疾病可通过移植来源于ES细胞的分化细胞治疗。使ES细胞维持未分化状态,其时间段足以在分化前遗传处理细胞,以减少免疫原性或对细胞给予新性质以对抗具体疾病。此外,本文所述用于调节分化的方法的使用不仅允许从业者有足够的时间基因修饰干细胞,而且由于干细胞自我更新的能力,还允许基因在连续细胞分裂中自始至终维持,由此避免了重复的转基因引入的需要。
本发明的或使用本发明的方法生产的干细胞可以用于在任何哺乳动物优选人中治疗下述疾病:例如神经变性病症(例如,阿尔茨海默氏或帕金森氏或脑或脊髓的外伤损伤),血液学病症(例如,镰形细胞、地中海贫血)、肌营养不良(例如,杜兴氏肌营养不良),内分泌病症(例如,糖尿病、生长激素缺乏),浦肯野细胞变性、心脏病、视力和听力丧失等。基因修饰干细胞在实验性基因疗法中使用的另外例子在名称为Stem Cells:Scientific Progress and Future ResearchDirections,同上的NIH干细胞报告第11章以及也在Shufaro等人,BestPract.Res.Clin.Obstet.Gynaecol.18:909-927(2004)中得到描述。
本发明的细胞和方法也可以用于农业用途以克隆所需家畜(例如,牛、猪、羊)和猎物。对于此类用途,使用合适种类的干细胞系和转基因。
研究应用
本发明还可以用于研究用途以用于研究分化或发育,和用于产生对研究用途有用的转基因动物。本文所述的干细胞和用于调节干细胞分化的方法可以例如用于鉴定分化过程中涉及的信号传导途径或蛋白质,这可以导致鉴定用于治疗多种疾病的未来治疗靶。本发明的干细胞和方法还可以用于研究特定基因或化合物对干细胞分化、发育、和组织产生和再生的作用。
实施例
下述实施例被提供用于举例说明本发明的目的,且不应被解释为限制性的。
实施例1.关于XCI的模型和涉及的计数元件。
X染色体失活通过在XX(雌性)和XY(雄性)个体中确立相等的X染色体表达在哺乳动物中达到剂量补偿作用(Lyon,Nature 190:372-373(1961))。XCI途径涉及一系列分子开关,包括X染色体计数、外遗传选择、和全染色体沉默(Avner等人,Nature Rev.Genet.2:59-67(2001))。‘计数’确保XCI只在具有超过1个X(n>1)的核中发生。当n>1时,‘选择’机制外遗传地选择1个X作为活性X(Xa),和第2个X作为无活性的X(Xi)。在选择期间,3种非编码顺式作用基因——Xist(Brown等人,Cell 71:527-542(1992);N.Brockdorff等人,Cell 71:515-526(1992))、Tsix(Lee等人,Nature Genet.21:400-404(1999))和Xite(Ogawa等人,同上)——的平行作用确定每条染色体的分别命运。在指定的Xi上,Xist RNA(顺式产生)包裹X染色体(Clemson等人,J.Cell Biol.132:259-275(1996))且在X上顺式开始全染色体沉默(Penny等人,Nature 379:131-137(1996);Marahrens等人,Genes& Dev.11:156-166(1997))。在指定的Xa上,Tsix的反义作用连同Xite的增强作用阻断Xist RNA传播以维持染色体活性(Ogawa等人,同上;Lee等人,Cell(1999),同上;Lee等人,Cell(2000),同上;Sado等人,同上)。简言之,XCI的选择和沉默步骤受到RNA产生性基因的相对和动态作用的控制。
尽管计数机制构成顶端开关(apical switch),但关于其如何发挥作用知之甚少。由性染色体非整倍体的研究已推断出一般规律(Lyon,同上;Rastan,J.Embryol.Exp.Morph.78:1-22(1983);Rastan等人,J.Embryol.Exp.Morph.90:379-388(1985))。例如,经历灭活的Xs数目遵循‘n-1’规则,由此在二倍体中除了1个外全部的X被灭活。因此XX细胞沉默1个X,而XXX细胞沉默2个。计数也受到倍性的影响,如通过下述事实所示,尽管二倍体只维持1个Xa,但四倍体可以维持2个Xa,且八倍体可以维持4个Xa(Lyon,同上;Webb等人,Genet.Res.59:205-214(1992);Jacobs等人,Am.J.Hum.Genet.31:446-457(1979))。因此,哺乳动物计数机制不是由X染色体的绝对数目而是由X与常染色体(X∶A)比来确定的。这暗示具体X连锁的和常染色体因子(分别为X因子和A因子)在早期发育期间进行测量。
用于计数的2种模型类型在近年来已有进展。最广泛接受的模型(Avner等人,同上;Lyon,同上;Rastan,(1983),同上)——在本文中命名为‘单一模型’——假定计数通过单一‘阻断因子’来完成,所述‘阻断因子’在二倍体中结合且使单个X免于失活。所有其他Xs被缺省沉默。备选的‘二重性’模型(等人,Lee等人,Cell(1999),同上)假定通过2种因子调节:保护未来Xa的阻断因子,和诱导在未来Xi上的XCI的‘感受态因子’。模型之间的关键差异在于,尽管单一模型规定Xi’s由缺省形成,但二重性模型需要有目的的作用以完成Xa和Xi。目前证据没有决定性地支持任一。
迄今为止,尽管XCI突变的目录在增长,但具体X连锁的和常染色体因子仍未被鉴定。推理的,计数途径中的突变可以通过与Xi预期数目的任何偏差来识别。这些包括XY或XO细胞中Xi的出现,XX细胞中任何Xi的不存在,或XX细胞中第2个Xi的出现(图8A)。使用小鼠胚胎干(ES)细胞作为研究XCI的先体外后体内系统,转基因分析已显示X失活中心(Xic)内或附近的元件涉及计数(Lee等人,Cell(1996),同上;Heard等人,Molec.Cell.Biol.19:3156-3166(1999);Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上;Migeon等人,Genomics59:113-121(1999))。当引入另外的Xic序列拷贝时,XY细胞显示异位XCI。在ES细胞中,敲除分析也已暗示在Xic上跨越Xist、Tsix、Xite和Tsx(睾丸特异性基因)的区域中存在计数因子。这个区域的65kb缺失(Δ65kb;图8B)导致XO和XY细胞亚群中的异位Xi(Clerc等人,NatureGenet.19:249-253(1998))。向从前状态添加最多到但不包括Tsx的37kb序列消除了这个异常细胞群体(图8B,p37kb)(Morey等人,Embo J 23:594-604(2004))。
基于可获得的遗传实验,候选计数元件被认为位于Xist下游,不包括Tsix和Xite的5’端(图8B)(Morey等人,Embo J 23:594-604(2004))。关于这个观点的证据包括敲除Tsix的CpG岛(Lee等人,Cell(1999)同上;Sado等人,同上;Luikenhuis等人,Mol.Cell.Biol.21:8512-8520(2001))以及Xite的主要超敏位点(Ogawa等人,同上;Sado等人,同上)不产生异常Xi数目(图8B,TsixΔCpG和XiteΔL)。Δ/Y雄性适当地阻断XCI且Δ/+雌性显示单个Xi。然而,尽管Tsix和Xite杂合雌性似乎适当地计数,但它们在选择方面是有缺陷的,因为存在对选择突变的X为Xi的主要效应(Ogawa等人,同上;Lee等人,Cell(1999)同上;Lee等人,Cell(2000),同上;Sado等人,同上;Luikenhuis等人,Mol.Cell.Biol.21:8512-8520(2001);Stavropoulos等人,Proc.Natl.Acad.Sci.U.S.A.98:10232-10237(2001);Morey等人,Hum.Mol.Genet.10:1403-1411(2001))。这些实验证实计数和选择事实上在遗传上是可分离的。
然而,尽管敲除研究关于Tsix在选择而不是计数中的作用是清楚的,但近期观察已提出新的可能性(Lee,Nature Genet.(2002),同上)。具体地,尽管TsixΔ/+(在下文中为XΔX)小鼠总是灭活突变的X,但TsixΔ/Δ(在下文中为XΔXΔ)纯合子显然回复随机XCI。尽管自相矛盾,但XΔXΔ胚胎显示在子宫内比其XΔY和XΔX配对物更大的丧失。这些观察暗示Tsix可能起另外的作用,所述另外的作用只在2个等位基因都被突变时才是明显的。实际上,已提出Tsix不仅顺式选择未来的Xa,而且还通过允许2个反义等位基因之间的交扰确保互相排斥的选择(Lee,Nature Genet.(2002)同上)。2个等位基因的丧失因此可以导致‘混乱选择’状态,由此选择决定无需X’s之间的协调而发生,且导致异常的XCI模式。仅仅偶然地,某些XΔXΔ细胞可以达到正常XaXi模式,而其他细胞由于异常的剂量补偿作用而死亡。
该模型产生清楚和可测试的预测。如果XΔXΔ细胞经历混乱选择,那么如通过某些核具有2个Xi、某些具有1个Xi、和其他没有Xi(总体混乱)的出现表明的,在分化XX细胞中可能可以检测到多个异常XCI模式。混乱选择模式与异常计数具有显著的相似性(图8A)。因此,混乱选择模型进一步预测Tsix自身可能涉及计数。下文的研究测试这种假设且发现特异性非编码基因在计数中起作用。XX和XY细胞中的不寻常表现支持二重性模型,所述二重性模型现在提供用于理解计数机制细节的新概念框架。
纯合Tsix ES模型中的混乱XCI
因为随机XCI在外胚层(E4.5-5.5)中发生,由于细胞数目有限和可能被丰富的胚胎细胞污染,所以在XΔXΔ胚胎中XCI的开始难以表征。为了避免这个问题,建立XΔXΔx XΔY杂交且培养所得到的胚泡以产生XΔXΔES细胞。在小鼠中,ES细胞已提供了研究XCI的有力的先体外后体内系统,因为它们在细胞分化期间重演XCI。93个胚泡从11个杂交中分离。与先前观察一致(Lee,Nature Genet.(2002)同上),非常大部分的胚泡产生质量差的ICM长出。总之,5个XΔXΔES系被确立且通过DNA印迹来鉴定(图8C)。用BamHI消化基因组DNAs,进行凝胶电泳,印迹到膜上,且与Tsix起始位点下游的1.4kb NdeI-MluI片段杂交(Lee等人,Cell(1999),同上)。WT,野生型雌性(16.7);BA9,XΔX对照。这些结果指出可能分离具有纯合Tsix缺陷的ES细胞,尽管XΔXΔ胚胎的总体适合度差(Lee,Nature Genet.(2002)同上)。通过如通过Y染色体涂染测定的Y-染色体缺乏、Zfy PCR实验中不存在条带、和如通过荧光原位杂交(FISH)测定的二倍体背景中2个Xs的出现(图8D),证实克隆Δf1、Δf5、Δf10、Δf25和Δf41为雌性。FISH如先前所述进行(Ogawa等人,Mol Cell 11:731-743(2003);Lee等人,同上)。因为所有5种XΔXΔ克隆表现相似(表3,图13),所以下文的结果将只显示代表性克隆。同样分离XΔY雄性(Δf4)和XΔO雌性(Δf21,Δf32)系作为对照。克隆Δf4、Δf21和Δf32都携带单个X染色体,且Δf4也携带Y染色体(图8E)。一旦在培养中确立,在未分化状态中XΔXΔES系与WT(野生型)雌性ES细胞就没有区别地生长。然而,分化成胚状体(EB)后,几个差异立即是明显的。为了产生EB,在d0时贴壁ES细胞进行轻微胰蛋白酶消化以产生脱附的簇,在不含LIF的DME+15%胎牛血清中在悬浮培养中作为簇(EB)生长4天,且在d4时在明胶上进行铺平板,再进行4-6天以产生EB长出(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上)。首先,与WT、XΔX和XΔO对照相比较,所有XΔXΔEB生长差。XΔXΔEB趋向保持小,在培养期间破碎,且产生不寻常量的细胞碎片(图9A)。为了定量细胞死亡,EB照常生长,且所有细胞(在悬浮液中松散的或在板上贴壁的)在d0、d4和d8时收获用于用锥虫蓝染色。为了计算死亡百分比,染为蓝色(死的)的细胞数目除以染为蓝色(死的)和排斥染料(活的)的细胞总数目。细胞死亡分析揭示与WT相比较大部分XΔXΔ细胞丧失生存力(P<0.01),紧在EB形成后开始和在第8天时达到顶点(图9B)。这与XΔO对照(Δf32)的比率形成对比,所述XΔO对照(Δf32)的比率与WT可比较(P>0.2)。有趣的是,尽管大量细胞死亡,但部分XΔXΔEB可以在第4天时附着且产生EB长出,虽然不如WT、XΔX或XΔO EB强壮(图9A,d9,图13)。这个结果与下述体内发现一致:XΔXΔ胚胎在子宫内经常丧失,但偶然可以存活到出生(Lee,Nature Genet.(2002)同上)。
为了评估突变克隆的XCI状态,接下来进行Xist RNA FISH以确定Xi(Xist RNA核结构域)是否是在单细胞水平上形成的。如同WT雌性系,如通过在分化第0天时Xist积累的不存在推断的,XΔXΔES系在未分化状态中维持2个Xa(图9C)。FISC如先前所述进行(Ogawa等人,Mol Cell 11:731-743(2003))。分化后,XΔXΔ细胞中的XCI模式变得显著不同于对照的那种,所述对照包括WT、XΔX、XΔY和XΔO细胞(图9C,D;表3)。在第2至4天,当XCI正常开始时,突变EB的特征在于3种类型的XCI模式:具有2个Xa的那些、具有1个Xi的那些、和具有2个Xi的那些(图9C,D)。相比之下,WT和XΔX细胞只产生具有1个Xi的那些和具有2个Xa的那些(反映仍未分化的亚群)(图9C,D;表3)。对照XΔO(Δf32)和XΔY(Δf4)在任何一天时都不产生Xist表达(图9C,表3)。
表3显示突变ES细胞系及其特征的概括。每个敲除和转基因系列的多个克隆在这个研究中进行分析,其中每个系列显示3-4个。只检查pCC3、pCC4、p3.7、pXite和pSxn系列的1个雄性克隆,因为较大的pSx7转基因系在XY背景中没有显示表型。所有细胞系在这个研究中产生,除了J1(Li等人,Cell 69:915-926(1992))、16.6(Lee等人,Cell(1999),同上)和BA9(3F1的1-lox neo-minus衍生物)(Lee等人,Cell(1999),同上)。转基因拷贝数通过DNA印迹分析、感光成像、以及FISH信号强度和大小来测定。低,1-4个拷贝。高,>5个拷贝。Tg,转基因。n.a.,不可用。
表3.突变ES细胞系和表型的概括
Figure A20068003250100571
Figure A20068003250100581
在XΔXΔ培养中,存在EB成功长出和达到正确的剂量补偿作用之间的紧密相关性。例如,显示差长出的EB通常显示具有2个显著Xi的细胞簇(图8E)。在随后的分化天数时,EB长出的渐增的存在与具有正确Xi数目的细胞数目增加相关联(图8F)。一般而言,在任何XΔXΔEB培养物中存在关于EB长出和达到剂量补偿作用的显著随机变异。
根据迄今的实验,几个观察暗示XCI在XΔXΔ中实际上以混乱方式进行-首先,在相同分化群体内出现具有2个、1个和无Xi的核;其次,与异常Xi数目有关的大量细胞死亡;和第三,显示单个Xi的细胞逐渐占优势,推测是针对不正确地选择无或多个X’s的那些选择的结果。特别感兴趣的是异常特征对XΔXΔ基因型特异的事实(图9A-9F)。XΔY和XΔO ES系不受影响,即使它们同样缺乏任何Tsix功能。此外,XΔX系是用不着的。这证明缺陷与性别本身无关,该作用也不仅仅是不存在Tsix功能的结果。相反,表型需要2个共存条件:两个Tsix等位基因的丧失和XX背景。
通过基因转移(transgenesis)揭示计数缺陷
大量细胞死亡和伴随的异常Xi数目的出现暗示计数缺陷(图8A)负责罕见的XΔXΔ表型。原则上,任何计数元件在细胞中必须被精确滴定。因此,如果Tsix影响计数,那么Tsix的多余拷贝也将破坏XCI。为了测试这个观点,使用ES基因转移诱导Tsix的额外拷贝。因为Tsix缺失表型在XX和XY细胞中显著不同,所以首先确定Tsix基因转移是否也将不同地影响XX和XY细胞。在XY细胞中,先前显示将80-460kb Xic序列引入XY ES细胞内导致针对转基因顺式的X或常染色体的异位灭活(Lee等人,Cell(1996),同上;Heard等人,Molec.Cell.Biol.19:3156-3166(1999);Lee等人,Proc.Natl.Acad.Sci.,(1999)同上;Migeon等人,同上),从而导致计数元件位于Xic内的观点。在此处,使用80kb质粒πJL2和πJL3重新生成了XX背景中的转基因(图10A)(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999)同上)。对于每个转基因分离多个雌性克隆,且详细表征具有低和高拷贝数的3个代表性克隆(图10B)。
所有雌性转基因生物都显示差分化,其中非常少的EB在培养第5天时显示长出(图10C)。相比之下,先前产生的雄性πJL2和πJL3转基因生物(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999)同上)和只携带neo选择标记的雌性对照(WTneo)产生中等至丰富的长出(图10C;表3,图14)。因为XY转基因生物显然可以分化成EB(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上),所以这些结果同样暗示转基因测定中的XX和XY差异。如先前对于XY转基因生物已报道的(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999)同上),πJL2和πJL3转基因雌性的FISH分析揭示在X’s或具有转基因的常染色体上的Xist RNA积累(图10D)。
这些转基因的潜在复杂化是Xist的存在,所述Xist可以通过异位常染色体失活阻碍生长(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999),同上)。为了分开常染色体失活作用与计数缺陷的那种作用,通过使用pSx7消除了Xist表达(图10A)。pSx7显示与XY比较XX细胞中完全不同的表型。尽管XY转基因生物显示强壮的分化,但XX细胞生产少至无的EB长出(图10C,图14)。这些结果证明阻碍的EB生长不依赖Xist诱导的常染色体失活而发生。通过Xist RNA FISH检查Xi形成导致XX和XY细胞之间的进一步差异:尽管pSx7雌性经历Xi形成,但pSx7雄性从不显示XCI(图10D,图14)。这种差异提供了对计数过程的另外了解且在下一部分中讨论。
有趣的是,Xist表达频率与转基因拷贝数反相关(图10D,E)。在πJL2系列中,低拷贝克隆(π2.1B,π2.22)显示在第4天时23-44%细胞中的Xist结构域,但高拷贝克隆(π2.18)只在14%的细胞中具有Xist结构域。在后者中,Xist RNA通常显得稀疏(图10D,箭标)而不是WT和低拷贝克隆中可见的强壮簇。在πJL2克隆中,Xist RNA在X或常染色体上积累,与XY细胞中发现的结果一致(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999)同上)。拷贝数在πJL3和pSx7系列中同样影响Xist表达频率。然而,在这些克隆中,Xist RNA只在X上积累,且在这些细胞中从不在常染色体上积累,与先前在XY细胞中报道的Xist启动子中的πJL3’s断裂点一致(Lee等人,Proc.Natl.Acad.Sci.U.S.A.(1999)同上),且与Xist 5’端的pSx7缺失一致。这种剂量应答关系暗示可滴定性特性且赞成pSx7区域中的计数元件。
Tsix和Xite是计数元件
为了查明潜在的一种或多种计数元件,使pSx7转基因片段化以分离已知界标(图11A)。pSxn(19.5kb)缺失所有Xist且包括Tsix和Xite的5’一半;p3.7(3.7kb)包含在TsixΔCpG中缺失的全部序列(Lee等人,Cell(1999)同上),包括Tsix启动子、DXPas34重复(Courtier等人,Proc.Natl.Acad.Sci.U.S.A.92:3531-3535(1995))、和Tsix二分增强子部分(Stavropoulos等人,Mol Cell Biol 25:2757-2769(2005));pCC3(4.3kb)包含几个CTCF结合位点(Chao等人,Science 295:345-347(2002))和DXPas34;pCC4(5.9kb)包含二分增强子的近一半(Stavropoulos等人,Mol Cell Biol (2005)同上);以及pXite(5.6kb)包含主要Xite基因间转录物、DNA酶I超敏位点、和第2种Tsix增强子(Ogawa等人,同上;Stavropoulos等人,Mol Cell Biol(2005)同上)。
所有5个转基因系列都显示XX和XY细胞之间的显著差异。该作用在p3.7和pXite系列中最深远,这2个系列包含关于Tsix和Xite的启动子。一般而言,XX转基因EB集落在第0至5天显示明显快速的放射状生长,在第5天时达到比野生型XX和XY对照、或甚至比πJL2和πJL3转基因生物大得多的尺寸(图11C)。有趣的是,尽管分化5-6天,XX转基因EB似乎保持未分化,因为它们的集落类似第0天的ES细胞,表现为具有圆形形态学、高辐射率水平、和在凝胶化的板上非常少的细胞长出(图11C)。
然而,尽管XX转基因生物从第2到5天快速生长,但它们的生长在第6天后变得严重受损。尽管p3.7、pCC3、pCC4、pXite和pSxn转基因生物全都共有这些特性,但该作用再次在p3.7和pXite转基因生物中最显著。第6-8天培养物的特征在于死亡、脱附细胞的积累(图11B;图11C:注意在d8时3.7-11和Xite-11中的紊乱团块)。细胞死亡程度在第4至8天多达总群体的70-75%(图11B)。为了理解关于这些异常的细胞基础,使用FISH检查了单个细胞中的XCI模式。显著的是,在p3.7、pXite、pCC3、pCC4、pSxn转基因生物中在细胞分化期间的任何时候完全不存在Xist积累(图11D,E)。这个结果与关于较大的πJL2、πJL3和pSx7的那些形成对比,且暗示关于Xist诱导的关键元件在较小的转基因中已缺失。Xist RNA的不存在不是XO非整倍性的结果,因为DNAFISH清楚地表明XX构成。因此,5’Tsix和Xite序列的多余拷贝抑制XCI。这种抑制显然延缓或阻断ES细胞分化且最终毁灭培养物。显著的是,关于小转基因生物的结果与关于Tsix XΔXΔ的那些相对(图9A-9F)。在第2-5天,XΔXΔEB显示缓慢、片段化的生长,而XX转基因EB显示高放射状生长。在第6-9天,XΔXΔEB显示分化中的总体改善(由于选择适当剂量补偿的细胞),而XX转基因EB退化。另外,尽管XΔXΔEB显示所有可能的Xi数目,但XX转基因生物不能形成Xi。这些对比发现暗示它们代表计数缺陷的相反极端:关键元件的缺乏引起不适当的XCI,而过量则抑制XCI。在πJL2、πJL3和pSx7转基因生物中可见的剂量依赖作用进一步赞成需要精确滴定的计数器。重要的是,没有一个XY转基因生物表现缺陷。在对于p3.7、pDNT、pCC3和pCC4检查的多个克隆中,XY EB显示分化自始至终的正常生长、正常的细胞死亡率、和指示正确剂量补偿作用的Xi结构域的不存在(图11B,D和表3;显示了一个代表性XY克隆)。因此,罕见表型只能在具有XX构成的转基因细胞中观察到。
此外,携带其他Xic序列的转基因生物没有一个表现这些缺陷。测试了携带Tsx编码区和来自Xist的各种片段的多个克隆。在细胞分化测定中,Tsx和Xist XX转基因生物显示略微较慢的生长率和最低限度升高的细胞死亡率(图11B,C)。然而,通过RNA FISH分析,这些对照系没有一个显示异常XCI模式,因为单个Xi结构域在分化期间呈现正常的动力学(图11D,E)。因此,在Xist和Tsx序列对XX EB具有轻度的毒性作用的范围内,这种作用与异常计数无关。这些结果证实计数元件特别地位于~14kb序列内(图11A),其中Tsix和Xite的5’端显示最强的计数作用(实心紫色条)且邻近区域也发挥作用,尽管弱得多(虚线紫色条)。因此,正如选择和沉默步骤一样,开始的计数步骤也受到非编码基因的控制。
非编码基因和二重性模型
X染色体计数机制仍是XCI最难以捉摸的方面。用于计数的模型现在必须协调由这个研究揭示的几个悖论。最有趣的是,为什么XΔ在TsixXΔY雄性中是活性的(Lee等人,Cell(1999)同上),而它在XΔX中是沉默的(Lee等人,Cell(1999),同上;Sado等人,同上;Luikenhuis等人,Mol.Cell.Biol.21:8512-8520(2001);Lee,Nature Genet.(2002),同上)和在XΔXΔ中是可沉默的?关键因子必须在XΔY中缺乏而在雌性突变体中存在。此外,为什么携带大的Xic转基因的细胞允许X失活(Lee等人,Cell(1996),同上;Heard等人,Molec.Cell.Biol.19:3156-3166(1999);Lee等人,Proc.Natl.Acad.Sci.(1999)同上;Migeon等人,同上),而携带小的Tsix和Xite转基因的那些在XCI方面失败?最后,为什么小转基因影响XX细胞但不影响XY细胞?目前的工作使得我们能够得出几个新结论。
首先,Tsix和Xite通过其5’端的元件调节计数过程。这个结论似乎与二或三分结构包含计数元件的先前观点不一致(图8B)(Ogawa等人,同上;Lee等人,Cell(1999)同上;Sado等人,同上;Clerc等人,Nature Genet.19:249-253(1998);Morey等人,Embo J 23:594-604(2004);Luikenhuis等人,Mol.Cell.Biol.21:8512-8520(2001))。然而,过去的结论很大程度上基于杂合突变体。目前研究强调扩展分析至纯合子的重要性,因为观察到的奇特作用只在第2个Tsix等位基因被消除时才是明显的。使XiteΔL、Δ65kb、p37kb和ΔXist突变纯合现在将是重要的(Ogawa等人,同上;Penny等人,Nature 379:131-137(1996);Marahrens等人,Genes & Dev.11:156-166(1997);Clerc等人,NatureGenet.19:249-253(1998);Morey等人,Embo J 23:594-604(2004)),因为与计数有关的表型在其他纯合子中可能也是出乎意料的。
重要的是,这项工作没有区分关键元件是可滴定的DNA序列还是2个非编码基因的RNA产物。给定暗示14kb结构域(例如,pCC3,pCC4)内的无启动子序列可以发挥计数表型的转基因数据,可滴定的DNA序列似乎更符合。提出Tsix和Xite启动子附近或其中的具体DNA元件充当反式作用因子的结合位点,例如推定的阻断或感受态因子。
这个研究的第2个主要结论涉及用于计数的单一对二重性模型的优点。在单一模型中(图12A)(Avner等人,同上;Lyon,同上;Rastan,J.Embryol.Exp.Morph.78:1-22(1983)),X染色体和各种常染色体产生与其拷贝数/细胞相当的有限量的独特X和A因子。X和A因子复合导致形成推定的阻断因子(BF),所述BF与1个Xic/细胞结合且阻抑其发放。在这个模型中,剩余的X’s不结合单个且通过缺省成为Xi’s。该模型是精致简单的——单个因子的结合达到单个Xa的计数和选择。对于Xi不需要有目的的选择。然而,尽管单一模型巧妙地解释了‘n-1’规则和多倍体中另外Xa’s的存在,但它不能容易地协调最近的观察。首先,具有小的Tsix和Xite转基因的XX细胞中XCI的不存在是无法解释的。在单一模型中,BF将结合1个X或转基因常染色体,从而导致1个或2个X’s的缺省失活。这点没有观察到。此外,如果XCI实际上通过缺省发生,那么XΔXΔ细胞应当总是形成1个Xi(不是2个或无),因为单个BF在理论上将结合1个X,从而使剩余的X通过缺省失活。从不同观点来看,给定XΔXΔ细胞可以灭活1个或2个XΔ’s的观察,单一模型还将预测XΔY细胞灭活XΔ。然而,这点也没有观察到。
这些差异改为求助于‘二重性模型’(Lee等人,Cell(1999)同上)。在不存在XΔY中的任何表型的情况下,XΔX和XΔXΔ的突变表型表明清楚的一点:尽管Tsix是阻抑XCI所需的,但另外因子是诱导XCI必需的。如提议的,除了阻抑未来Xa上的XCI的BF外,感受态因子(CF)是诱导未来Xi上的XCI所需的。推理的,CF必须包含XX而不是XY细胞中存在的因子。乍看起来,另外的雌性X染色体是满足这个标准的单个实体,从而暗示CF是X连锁的。
在二重性模型中(图12B),计数机制通过具体的X和A因子测量X:A比,所述X和A因子各自以与染色体拷贝数成比例的有限量产生。计数作用代表X和A因子的‘滴定’。A因子互相复合且一起滴定消除1个X因子,其总和成为1个BF。无A因子配偶体而留下时,剩余的X因子成为CF。随后的选择作用反映BF和CF与2个X’s的随机结合,其中BF阻抑未来Xa上的Xic,而CF诱导未来Xi上的Xic。BF和CF必须以互相排斥的方式结合。二重性模型与单一模型的不同之处只在于Xi形成需要CF有目的的作用而不是缺省过程的规定。
目前数据证实CF的存在。在二重性模型中,XΔY对XΔX和XΔXΔ突变体的不同结果起因于CF在XΔY细胞中不存在且在XΔX和XΔXΔ细胞中存在。在XΔXΔ突变体中,推测发生混乱选择,因为Tsix缺失导致BF和CF与X’s结合之间的互斥效应丧失(图12C)(Lee,Nature Genet.(2002),同上)。在这个模型中,BF和CF两者与一个X结合和另一个X上不存在BF和CF,导致其中X’s可以保持活性或灭活的混乱状态,由此产生观察到的2个Xa和2个Xi表型。二重性模型还解释了转基因细胞中的各种结果。在携带小的Tsix和Xite转基因的XX细胞中,非编码序列的多余拷贝充当库且滴定消除BF和CF,从而产生2个Xa’s(图12D)。这些细胞系的高转基因拷贝数使得常染色体对于因子比内源Xic更有竞争力,从而解释了为什么Xi是罕见地,如果曾经看见的话。在XY细胞中,BF通过转基因滴定消除而没有结果,因为异位XCI不能没有CF而发生。
提供对计数过程的进一步了解的是下述事实:πJL2、πJL3和pSx7产生对XCI处于感受态的细胞,而较小的转基因不能诱导XCI。这暗示较大的转基因具有较小的转基因中缺乏的另一个关键元件,可能是CF自身或可以代替它的某物。需要进一步的研究以鉴定和表征πJL2内的元件。如何能够协调CF的存在与Δ65kb敲除(Clerc等人,Nature Genet.19:249-253(1998);Morey等人,Embo J 23:594-604(2004))?在这种敲除中,XO和XY细胞在不存在推定CF的情况下经历XCI。一个可能的解释可能是Δ65kb是新效等位基因。因为缺失的大小,并列的Chic1基因的调节物可能对Xist发挥异位影响。更可能地,跨越Xist、Tsix、Xite、Tsx和Chic1的65kb区域实际上可能包含另外调节物,所述另外调节物的缺失顺式导致XCI。这个观点与转基因分析的上述结论一致,所述结论同样暗示了Xic上的另外调节物。因此,Δ65kb不能与XiteΔL和TsixΔCpG相等同。
这项工作的第3个结论致力于BF和CF是否可以结合的问题。敲除和转基因的表型表明BF和CF必须直接或通过其他因子与Tsix和Xite启动子中或周围的元件相互作用(紫色条,图11A)。在转基因分析中,2个基因的启动子区引起最强的表型(实心紫色条),但与之紧邻的片段也引起计数表型(虚线紫色条)。因此,~14kb区域内的多个顺式元件可能在计数方面协同作用。显著的是,最近已将2个增强子作图到这个区域,包括与Xite启动子一致的1.2kb元件和Tsix启动子侧翼的二分元件(Stavropoulos等人,Mol Cell Biol(2005),同上)。BF和CF可以结合Tsix增强子的观点固有地是令人满意的,因为每个X的命运事实上由分化细胞中Tsix表达是持续(Xa)还是关闭(Xi)来决定。
最后,目前工作证明计数和选择在分子上是偶联的。尽管由于TsixXΔY、XΔX和XΔXΔ细胞中的差别效应它们在遗传上可分离,但本文的观察指出共有的控制元件。具体地,已知影响选择的Tsix和Xite突变(Ogawa等人,同上;Lee等人,Cell(1999),同上;Sado等人,同上;Luikenhuis等人,Mol.Cell.Biol.21:8512-8520(2001);Stavropoulos等人,Proc.Natl.Acad.Sci.U.S.A.98:10232-10237(2001);Morey等人,Hum.Mol.Genet.10:1403-1411(2001);Lee,Nature Genet.(2002),同上)现在也显示影响计数。在二重性模型中,计数和选择顺次发生,其中计数表示X和A因子的滴定且选择表示BF与Xa和CF与Xi的结合。因此,计数和选择涉及相同的X和A因子组和相同的非编码基因。这些X和A因子可能是什么?有趣的是,CTCF、Xiaf1和Xiaf2已被鉴定为关于选择步骤的候选反式因子(Chao等人,Science 295:345-347(2002);Percec等人,Science 296:1136-1139(2002))。根据目前工作,询问它们是否同样在计数中具有潜在作用将是有趣的。鉴定关于计数的反式作用因子的进一步努力将集中于Xite和Tsix增强子、本文表征为具有计数器特性的顺式元件的DNA结合蛋白上。
实施例2.p3.7和pXite的较小的转基因可以抑制细胞分化。
基于上文所述的Xic区域可以用于阻断细胞分化的最初发现,生成了Tsix和Xite的较小片段以鉴定计数、配对和细胞分化抑制所需的最低限度的关键区域。这些较小的转基因在图1和2中显示、在表1中描述、且在下文概述。
ns25(SEQ ID NO:21):包含重复A1、A2和B的Tsix内的1.6kbDXPas34片段(参见图30B)。
ns41(SEQ ID NO:22):紧位于DXPas34下游(就Tsix转录而言的下游)的Tsix的2.4kb片段。ns41是pCC3的SalI-BamHI片段。
ns130(SEQ ID NO:24):如Stavropoulos等人,(2005)同上的表I中限定的1.8kb Xite。它包括就Tsix主要起始位点而言从bp-12,045到-10,229的序列。
ns135(SEQ ID NO:25)和ns 155(SEQ ID NO:26):各自的相关片段是如Stavropoulos等人,(2005)同上中限定的1.2kb Xite增强子。它们包括就Tsix主要起始位点而言的bp-10,234至-9,010。
ns132(SEQ ID NO:27):同样如Stavropoulos等人,同上中限定的Xite的2.5kb片段。它包括就Tsix主要起始位点而言的bp-9,009至-6,535。
ns82(SEQ ID NO:23):Tsix启动子的220碱基对片段。
如图26中所示,大小为1.2-2.5kb的亚片段ns41、ns25、ns132、ns135和ns130全都引起雌性ES细胞即使在分化条件下5天看起来也是“未分化的”。这种效应在不存在饲养细胞的情况下可见。这种效应在雄性ES细胞中看不到,从而表明该效应是性别特异性的(图27)。在这些较小的转基因中,ns25和ns135在尺寸中是最小的,且两者都包含对于2种非编码RNAs的启动子和增强子活性。Ns25包含DXPas34的重复A1、A2和B,这在下文实施例4中更详细地描述。对于这些实验,如Lee,Science 309:768(2005)中所述转基因ES细胞系分化成胚状体,和在如指出的分化天数时EB被照相、收获用于表达分析和细胞死亡分析。
一个显著的例外是ns82,它只包含Tsix的主要启动子(Stavropoulos等人,(2005)同上的表I)。这种片段不影响计数或选择,不能单独对配对起核作用(如下文实施例3中详细描述的),它也不能抑制雌性中的ES分化。然而,这种片段可以增强使用其他片段可见的针对分化的阻断。因此,ns82可以与本文所述的任何其他片段组合使用,以阻断细胞分化或影响计数、选择或配对。
实施例3.瞬时的同源配对标记XCI的开始。
随机形式的X染色体失活(XCI)[在Avner和Heard,Nat.Rev.Genet.2:59(2001)中综述]通过‘计数’机制来调节,所述‘计数’机制使得XCI只在超过一个X存在于二倍体核中时才成为可能。“选择”机制随后随机指定1个Xa(活性X),在其上X失活中心(Xic)被阻断起始沉默,和1个Xi(无活性的X),在其上Xic被诱导起始全染色体沉默。已将调节元件作图到3种非编码Xic基因,所述基因包括Xist(Brown等人,Cell 71:527(1992);Brockdorff等人,Cell 71:515(1992);Penny等人,Nature 379:131(1996))、其反义配偶体Tsix(Lee等人,Cell 21:400(1999);Lee和Lu,Cell 99:47(1999);Sado等人,Development128:1275(2001))和Xite(Ogawa和Lee,Mol.Cell 11:731(2003))。尽管Xite和Tsix一起调节计数和选择(Lee和Lu,(1999)同上;Sado等人,(2001)同上;Lee,Nat.Genet.32:195(2002);Morey等人,EMBO J.23:594(2004);Lee,Science 309:768(2005)),但Xist占优势地调节全染色体沉默(Penny等人,(1996)同上;Clemson等人,J.Cell Biol.132:259(1996);Marahrens等人,Genes Dev.11:156(1997);Wutz和Jaenisch,Mol.Ce ll5:695(2000))。有趣的是,每种基因顺式作用,其中Xite激活连锁的Tsix等位基因,Tsix阻抑连锁的Xist等位基因,且Xist阻抑相同X上的其他基因。
尽管顺式作用基因支配Xic,但Xic功能必须反式发挥。显著的是,Xa和Xi的选择总是以互相排斥的方式发生,因此当一个X指定为Xa时,另一个相应地指定为Xi。交扰的观点得到Tsix -/-敲除的支持,在所述敲除中选择变得“混乱”,出现2个Xi、1个Xi、或0个Xi/细胞(Lee,(2002)同上;Lee等人,Science(2005)同上)。尽管反式相互作用似乎是必要的(Lee等人,Nature Genetics(2002)同上,Marahrens,Genes Dev.13:2624(1999)),但仍缺乏直接证据。原则上,反式传感可以通过反馈信号级联放大、可扩散的X连锁因子、或直接的染色体间配对,例如对T细胞分化提出的那种来完成(Spilianakis等人,Nature 435:637(2005))。
因为体细胞同源物配对一般不在哺乳动物中发生,所以推测配对——如果它发生在X上——必须瞬时发生。此处,在分化小鼠胚胎干(ES)细胞——在培养中重演XCI的模型中使用荧光原位杂交(FISH)跟踪随着时间过去染色体的运动。测量第0天(XCI前)、第2天和第4天(XCI开始)、第6天ES细胞和小鼠胚胎成纤维细胞(MEFs)的X-X染色体间距离(图15A-D)。通过组合2种不重叠探针,获得了99%的X检测率(单个探针产生85-90%的比率)。只评分具有2种可分辨信号的核。对于每个实验,评分150-250个核,且在3次独立测试中获得相似结果。
在野生型XX细胞中,X-X距离在细胞分化期间是高度动态的(图15A)。在第0天时,染色体间距离接近正态分布,从而暗示接近随机性。有趣的是,在第2天时,如通过分布中的左移动所示,高比例的细胞开始展示近的X-X距离(图15A)[Kolmogorov-Smirnov(KS)检验,P=0.01]。这个趋势继续到第4天(P<0.001)且在第6天时部分地回到基线(P=0.41)。MEF分布完全是随机的,比第0天的ES细胞稍微更多些,可能反映了某些ES细胞的自发分化。累积频率曲线(图15B)显示第2天和第4天展示最高频率的“邻近配对”,或具有标准化的X-X距离(ND)<0.2(<2.0μ)的配对。在邻近配对中,三分之一展示0.2-至0.5-μ的间隔(图15C),这个部分分别为第0天的ES和MEFs的6和16倍。X涂染证实2个Xs的存在(图19),因此排除了显现XO细胞内的姐妹染色单体的可能性。
在1C[染色体1(Chr1)着丝粒]、Abca2(Chr2)和染色体3着丝粒上的常染色体间(interautosomal)(A-A)距离测量在所有时间点上显示正态分布(图15B和图20),从而证明一般无法观察到邻近配对。为了确定X上的配对程度,测试了与Xic探针组合的4种细菌人工染色体(BAC)探针(图15D和图21A-C),且发现尽管Xic运动受到同源相互作用的限制,但侧翼区采用相对自由的位置,其中每个基因座显示经过时间的接近随机分布(图21A-C)。因此,X-X相互作用限制于Xic。
配对动力学暗示与XCI的连锁,所述XCI在分化第2天至第4天同时开始。因为Xist RNA上调是最早已知的XCI细胞学特征(Avner和Heard,(2001)同上),所以询问配对是否在Xist+细胞中更频繁地观察到。事实上,Xist+细胞显示46%具有X-X结合(图16A-B),从而表明配对紧在Xist上调之前或期间发生。为了查明时间范围,使用另外的时间标记Ezh2和H3-3meK27。这些标记在“早期Xi维持”期期间Xist上调后不久在Xi上积累[在(Heard,Curr.Opin.Genet.Dev.15:482(2005))中综述]。在第2天时,相对于Ezh2+和H3-3meK27+细胞,反式结合(trans-association)在Ezh2-细胞和H3-3meK27-细胞中显著富集(图16C-D和图22A-B)。这些结果将反式相互作用限制于仍未募集Ezh2和H3-3meK27的Xist表达性细胞,因此证明远在XCI维持期前非常早的时间范围。
我们因此测试反式相互作用与XCI的2个最早步骤计数和选择的关系,这2个步骤都由Tsix和Xite调节。先前显示Tsix+/-小鼠(XΔTsixX)只有XΔ破坏选择和沉默(Lee和Lu,(1999)同上;Sado等人,(2001)同上;Morey等人,(2004)同上;Lee,Cell 103:17(2000)),而XΔTsixX XΔTsix小鼠破坏计数和选择两者(Lee等人,Nature Genetics(2002)同上;Lee等人,Science(2005),同上)。Xite突变已类似地影响计数/选择(Ogawa和Lee,(2003)同上;Lee等人,Science(2005),同上)。XΔXiteX细胞显示X-X结合中的显著延迟(图17A-B,和图23),从而暗示丧失1个Xite等位基因足以部分破坏配对。这种部分效应与XΔXiteX中的异常选择相关联。然而,XΔTsixX细胞显示预期的同源结合频率,从而指出丧失1个Tsix等位基因不影响配对。相比之下,XΔTsixTsix细胞显示经过所有时间点的接近随机分布(图17B和图23),这支持2个Tsix等位基因缺失是取消配对所需的论点。尽管不是统计学显著的,第6天群体显示轻微的左移动,暗示延迟或减弱的结合尝试。这些数据证实Tsix和Xite是配对所需的,且暗示配对和计数/选择之间的紧密关系。
“染色体构象捕获”(3C)用于认识同源结合是否表示正确的物理配对(Dekker等人,Science 295:1306(2002)),由此2个相互作用的基因座可以通过交联、分子间连接、和聚合酶链反应来检测。为了获得对于3C必需的多态性,使用配对感受态XΔTsix(neo+)X系,其中1个Xic通过Neo区分(图17C)(不能使用野生型,因为它们缺乏所需限制片段内的信息多态性)。使用3种独特的引物对[Tsix1-N3(显示)、以及TSEN2-N1和Tsix1-N2],一致地检测到2个Tsix基因座之间的物理接触,而在各种Tsix和常染色体对照或不正确定向的Tsix2引物和N3之间,没有观察到接触(图17D和图24)。Tsix间相互作用在第4天时最强(图17E),与FISH分析一致。因此,Xic间配对事实上是同源结合的基础。
为了鉴定指导配对的序列,将Xic片段引入ES细胞内(图17A和表4)(Lee,Science(2005),同上),且询问常染色体插入是否可诱导X-常染色体(X-A)从头配对且影响计数/选择。有趣的是,常染色体pSx7导致雌性中的异位X-A配对(图17F),与pSx7雌性中的异常计数和XCI开始相关联(Lee等人,Science(2005),同上)。相比之下,雌性Xist和Tsx转基因生物在背景之上没有显示X-A配对(图17F),与其正常XCI一致(Lee等人,Science(2005),同上)。此外,雄性pSx7转基因生物没有显示X-A配对(图17F),与其正常计数和XCI抑制一致(Lee等人,Science(2005)同上)。
表4.转基因细胞系及其配对特征概括。
为了详细分析pSx7内的具体要求,测试了p3.7,无配对能力的XΔTsixXΔTsix中缺失的3.7kb Tsix片段。p3.7在XX细胞中诱导X-A从头配对方面非常有效(图17F),而3C分析证实p3.7和X之间的直接物理相互作用(图17D)。在p3.7雌性中异位配对与计数/选择和XCI开始的失败平行(Lee等人,Science(2005),同上)。相比之下,p3.7雄性不诱导X-A配对且相应地不表现计数缺陷(Lee等人,Science(2005),同上)。同样测试了pXite(配对受损的XΔXiteX中缺失的5.6-kb片段)且显示有效的X-A配对(图17F),与pXite对计数/选择的深远影响一致(Lee等人,Science(2005),同上)。有趣的是,pXite雄性也可以开始配对,尽管它们不显示异位XCI。因为pXite雄性被认为缺乏用于开始XCI的X连锁的“感受态因子”,所以接下来测试携带全长Xic转基因的雄性(Lee等人,Science(2005),同上)以确定配对和XCI是否可以一起完成。事实上,πJL1.4.1雄性展示异位X-A配对(图17F),且相应地开始计数/选择和沉默(Lee等人,Proc.Natl.Acad.Sci.U.S.A.96:3836(1999)),从而进一步支持配对和XCI开始之间的紧密关联。这些实验证实具有小至3.7和5.6kb的序列的Tsix和Xite足以重演配对,且反过来配对是XCI的最早步骤所需的。
在转基因雌性中,假设XCI不能开始可能是由于通过X-A从头相互作用的X-X相互作用的竞争性抑制。事实上,与野生型相比较,X-X相互作用的频率对于pSx7、p3.7和pXite雌性显著减少(图18A对图15B)。在pSx7雌性中,X-X配对率小于X-A配对率。在p3.7和pXite雌性中,X-X配对看起来被完全取消(图18A和图25),其中第2天和第4天的分布特征与第0天不能区别(图18B),且具有ND<0.05的核<2%(背景)(图18C)。相比之下,X-X配对在pTsx和pXist对照中保持是强壮的(图25)。因此,异位X-A相互作用从内源X-X相互作用适度地减去。X-X配对频率直接预测XCI频率。提出通过异位Tsix/Xite滴定X-X相互作用解释了转基因雌性中计数/选择和XCI的普遍失败。
基于这项工作,假定X-X配对通过介导计数/选择和提供用于互相排斥的XCI必需的交扰作用于Xist上游。配对相互作用明显不需要Xist表达。在我们的模型中(图18D),2个Xs呈现在前XCI细胞中随机独立的位置且随后在XCI开始时同源地配对,而Tsix和Xite充当成核现象中心。随后的交扰达到一个X成为Xa和另一个成为Xi的不对称标记。由于计数/选择反映“阻断因子”与Xa的结合和感受态因子与Xi的结合(Lee和Lu,(1999)同上;Lee等人,Science(2005)同上),配对确保2种因子互相排斥地结合。
显著的是,3.7kb的Tsix或5.6kb的Xite足以开始从头配对。因此,这些基因通过反式发挥作用以协同配对/计数/选择和顺式发挥作用以拮抗Xist在XCI中起双重顺反式作用。这些事件可以在时间和空间上同时发生。Tsix和Xite突变体之间微妙的配对差异可能反映长度需求,因为事实上XΔXiteX显示比XΔTsixX弱的配对,和Xite转基因雄性配对比Tsix配对物好。与这点一致,全长转基因πJL1.4.1雄性不仅配对良好还开始XCI。为什么X-A相互作用一般在数目上超过X-X相互作用?多拷贝转基因性质可能增加常染色体相对于X的抗体亲抗原性(avidity)。X-A配对抑制X-X配对的能力现在提供了Tsix/Xite转基因雌性中XCI失败的机制:如果配对是正确的计数/选择所需的,那么不能配对将造成针对XCI的特异性阻断。提出的通过染色体间配对的调节产生基因调节问题的新维度,且可能成为外遗传现象中经常出现的主题(Spilianakis等人,(2005)同上;LaSalle和Lalande,Science 272:725(1996))。
为了确定实施例2中所述的较小转基因是否也可以对染色体之间的配对起核作用,将亚片段插入常染色体内且测试常染色体与X配对的能力。对于这些实验,在第0天(未分化)或第4天时收获ES细胞、分散、固定在载玻片上、且通过FISH检查。它们随后如下文和Xu等人,Science 311:1149-1152(2006)中所述通过Improvision软件进行成像和分析。FISH使用来自XIC的探针(使用等价于每种转基因序列的片段)来进行。如图28中所示,较小的转基因还对X和转基因已插入其中的常染色体之间的从头“配对”起核作用。这点的唯一例外是ns82片段,所述ns82片段只包括Tsix启动子。(应当指出名称指携带转基因的转基因特定克隆。例如,ns82-7指携带ns82转基因的克隆7。)这些结果显示异位X-A配对抑制内源X-X配对。提出这是X失活被抑制和细胞分化不能在雌性ES细胞中发生的原因。因此,引起Xic’s之间的异位配对的任何片段都可以用于阻断细胞分化。
下述材料和方法在上述实验中使用。
ES细胞培养
野生型雄性J1(40XY)、野生型雌性16.7(40XX)、和所有突变小鼠ES细胞系及其培养条件先前已得到描述(Lee和Lu,Cell 99:47(1999);Lee等人,Nat.Genet.21:400(1999);Lee,Science 309:768(2005))。转基因ES系在300μg/ml G418选择下维持。ES分化通过悬浮培养4天且撤回白血病抑制因子(LIF)来诱导。在第4天时,胚状体与凝胶化的板附着以促进分化细胞的长出。成纤维细胞使用标准规程由d13.5小鼠胚胎来源。
FISH分析
ES簇被胰蛋白酶消化成单个细胞,且在多聚甲醛固定之前在载玻片上细胞离心(cytospun)。DNA和RNA FISH如所述的(Lee等人,(1999)同上)进行。探针通过切口平移用荧光素-12-dUTP或cy3-dUTP进行标记。pSxn、pSx9或pTsx序列用作Xic区域的探针(Lee,(2005)同上)。BAC探针1C、XC、Xa2、Xa4和Xf2从Open Biosystems获得。Abca2 BAC是Drs.Brian Seed和Ramnik Xavier的赠品。对于转基因的具体检测,使用无启动子的Neo片段。对于Xist RNA的检测,使用单链核糖核酸探针混合物(cocktail)(Ogawa和Lee,Mol.Cell 11:731(2003))。免疫DNA FISH使用抗H3-3meK27或抗Ezh2兔多克隆抗体(Upstate),随后为与cy3缀合的第二山羊抗兔抗体来进行。图像使用Zeiss axioscope来获取且使用OpenLab软件(Improvision)来加工。3D图像的2D表示通过合并穿过整个核深度获取的0.2μ间隔的z切片来产生。X-X距离(x)和核面积(A)使用OpenLab中的测量模块来计算。
只评分具有2种可分辨的X信号的核——排除单个点以避免计数XO细胞,所述XO细胞占总培养物的<<5%(图20)。核直径(d)=2*(核面积/π)0.5。标准化距离(ND)=X-X距离/d。与第0天的核相比较,第2到6天ES核一般具有类似尺寸和形状。存在对于这种方法的固有限制。一般的ES核几乎是完全圆形的,直径测量为10μ。然而,MEFs在形状方面倾向于卵形,这点可能引起在图19A和20中MEFs略微不同的分布特征。
染色体构象捕获(3C)测定
使3C测定适合于哺乳动物细胞(Tolhuis等人,Mol.Cell 10:1453(2002))。对于检测同源染色体之间的相互作用所必需的多态性,使用配对感受态XΔTsix(neo+)X系,其中通过Neo区分1个Xic(图21C)。(注:不能使用WT系,因为所需限制片段内没有足够的天然存在的信息多态性)。为了区分TsixΔCpG(neo+)与XWT,使用如图21C中所示的BamHI消化物和引物。简言之,107细胞的单细胞悬浮液在ES培养基中进行稀释,于室温与4%甲醛交联10分钟,用0.125M甘氨酸猝灭,沉淀且用PBS洗涤。106细胞在10ml冰冷的裂解缓冲液(100mM Tris-HCL pH8.0,10mM NaCl,0.2%NP-40,蛋白酶抑制剂)中进行裂解,且使核沉淀,重悬浮于含0.3%SDS的NEB缓冲液2中,且于37℃伴随振荡温育1小时。为了螯合SDS,于37℃伴随振荡加入Triton X-100至1.8%1小时。样品与400单位BamHI一起于37℃伴随振荡温育过夜,酶于65℃用1.6%SDS灭活,且随后与1x连接缓冲液(10ml)和Triton X-100(1%)一起于25℃伴随振荡进行温育。连接在低DNA浓度(<2.5ng/μl)下使用200单位T4DNA连接酶于16℃进行4小时。加入蛋白酶K(100μg/ml)以于65℃过夜逆转交联。样品随后用RNA酶A(0.5μg/ml)于37℃处理30分钟,DNA用苯酚/氯仿提取且进行异丙醇沉淀。无交联或无T4连接酶的对照样品平行进行处理。在每次PCR反应中使用<20ng的模板,且每次反应在扩增指数期内发生以达到精确的产物定量。
对于α珠蛋白对照模板,跨越目的BamHI位点的PCR产物(引物对b1/b1R、b2/b2R、b3/b3R、b4/b4R)被进行消化,以相等的摩尔比混合,且互相连接(对于βg-βg测试)或与消化的pSxn连接(对于βg-Tsix和βg Xite)以产生所有可能的逐对连接。引物对b2/b4一致地显示顺式相互作用(图21D),如b1/b4和b3/b4一样(数据未显示)。为了标准化Tsix结果,使用任何对产生类似结果。对于X-X相互作用的对照模板,pSxn和TsixΔCpG敲除载体被进行消化,以相等的摩尔比混合,且进行连接以产生所有可能的逐对连接库。对于X-A相互作用的对照模板,p3.7被进行消化且与消化的πJL2(全长Xic P1质粒(Lee等人,Proc.Acad.Sci.USA 96:3836(1999)))连接、或与消化的βg PCR片段连接(对于转基因p3.7-βg相互作用)。所有引物都被设计为具有62-64℃的退火温度,且全部产生具有预期尺寸的产物。所有测试的PCR产物被进行测序以证实特异性和同一性。Tsix-βg引物对组合没有一个产生特异性PCR产物。所有负交联和负连接对照也没有产生产物。对于每种相互作用进行2到3次独立实验,且PCR反应对于每次实验重复至少2次。使用的引物如下:
Tsix1(Bam12):5′-CTCTGGCCACCTGTCTAGCTG(SEQ ID NO:47)
Tsix2(DSN35):5′-TAGGTACCTAGGCAGATTGC(SEQ ID NO:48)
Tsix3(Bam13a):5′-GGCTGAAGGTGCTGTAGCAAG(SEQ ID NO:49)
Tsix4(Bam14):5′-CTGAGCTCGAACATTGCCCCAC(SEQ ID NO:50)
Tsix5(Ban11):5′-CTAACAAGTGTGAGCCACCTGCC(SEQ ID NO:51)
Tsix TSEN2:5’-CCACCTGTCTAGCTGGCTATCA(SEQ ID NO:52)
N1(NeoF):5’-TTAGCCACCTCTCCCCTGTC(SEQ ID NO:53)
N2(NeoF2):5’-TGTCCGGTGCCCTGAATGAACTGC(SEQ ID NO:54)
N3(NeoF3):5′-ACGTTGTCACTGAAGCGGGAAGGG(SEQ ID NO:55)
b2(beta2):5′-GTTTCCAGGAGGGGTTCAGGTTTA(SEQ ID NO:56)
b2R(beta2R):5′-CACAAACCCAAACACAGATAAATG(SEQ ID NO:57)
b3(beta3):5′-TTCATACACAGGACATCTACACAA(SEQ ID NO:58)
b3R(beta3R):5′-TAAAATACAATCCACCAGTCATAC(SEQ ID NO:59)
b4(beta4):5′-GCAAGGTCCAGGGTGAAGAATAAA(SEQ ID NO:60)
b4R(beta4R):5′-ATTTTGATTTCCTCCTTGGGTCTT(SEQ ID NO:61)
统计学分析
染色体间距离分布中差异的显著性使用Kolmogorov-Smirnov(KS)检验——非参数检验进行测试,以检查2个数据集显示相同潜在分布的虚假设。P值通过统计学软件SPSS 12.0进行计算。P<0.05被视为在统计学上显著。
实施例4.转录在XCI调节中的作用。
尽管其潜在的破坏作用,转座元件(TEs)已广泛地散布且现在占哺乳动物基因组的几乎50%。它们的普遍存在暗示宿主基因组可能由TEs获益,尽管关于这点的证据仍不足。X失活中心因TEs丰富而众所周知。此处,提供了Tsix内的34聚体DXPas34重复是反转录转座子残迹的证据,且确定这种重复元件在X染色体失活(XCI)期间起作用。DXPas34包含双向启动子活性,从而产生重叠的正向和反向转录物。产生3个新Tsix等位基因且将其用于证实,尽管Tsix启动子出乎意料地是可有可无的,但DXPas34起双重正-负功能。在XCI开始时,DXPas34刺激Tsix作为其二分增强子组分的表达。然而,一旦XCI确立,DXPas34就成为阻抑的且是Tsix稳定沉默所需的。这些数据把新功能归于重复DNA元件。提出TEs可以通过其经由附近基因指派外遗传调节的方案。
自从其在超过50年前由Barbara McClintock发现,转座元件(TEs)已在几乎所有生物中鉴定且占真核基因组的大部分。显著的是,转座子及其可识别的残迹现在构成至少50%的某些哺乳动物基因组(Lander等人,Nature 409:860-921(2001))和多达90%的植物基因组(SanMiguel等人,Science 274:765-768(1996))。因为这些元件被视为遗传寄生物,所以它们及其可识别的残迹已经常表征为“无用DNA”。在哺乳动物中特别常见的是反转录转座子,通过RNA中间物动员且需要逆转录用于整合到基因组内的一类TEs。反转录转座子包括短和长散布核苷酸元件(分别为SINEs和LINEs),以及内源性逆转录病毒(ERV)和重复序列的LTR家族。尽管起源远古,但TEs在小鼠和人中仍活跃地转座(Kazazian,Science 303:1626-1632(2004)),尽管其可能的破坏和诱变作用。
为什么真核生物已对转座子如此耐受,随着时间过去可能甚至促进其扩充?尽管固有的危险它们仍繁殖,暗示宿主基因组可能实际上由可移动的TE获益。在哺乳动物中,转座的元件可以对现有基因赋予新调节活性。例如,它们可能已对小鼠Lama3(Ferrigno等人,Nat.Genet.28:77-81(2001))和Agouti(Morgan等人,Nat.Genet.23:314-318(1999))引入新启动子活性。在卵母细胞至胚胎转变期间,TEs可能已由小鼠指派为关于非常大部分的表达的转录物的可替代的启动子和第1个外显子,从而协同不同系列基因的同步、发育调节的表达(Peaston等人,Dev.Cell 7:597-606(2004))。关于TE破坏的进一步证据来自SINEs在>1000种人基因启动子内的出现(Oei等人,2004),其用于产生新剪接位点的可能性(Kreahling和Graveley,Trends Genet.20:1-4(2004)),及其对增强子调节的贡献(Bejerano等人,Nature 441:87-90(2006))。以这些方式,TEs可以驱使基因组进化且提供快速适应不断变化(everchanging)的环境需要的手段。
因为转座破坏局部染色质和基因功能,所以进化稳定的整合事件已知集中于非编码区(Lippman等人,Nature 430:471-476(2004))。包含多个非编码基因的哺乳动物X失活中心(Xic)已因TEs丰富而出名(Chureau等人,Genome Res.12:894-908(2002);Migeon等人,Am.J.Hum.Genet.69:951-960(2001);Nesterova等人,Dev.Biol.235:343-350(2001);Simmler等人,Hum.Mol.Genet.5:1713-1726(1996)),且因此充当研究TEs和外遗传过程之间的功能性相互作用的模型。X染色体失活(XCI)使哺乳动物雄性和雌性之间的X连锁的基因表达相等(Lyon,Nature 190:372-373(1961))且通过一系列步骤进行,所述步骤包括X染色体计数、一个活性X(Xa)和一个无活性的X(Xi)的有目的的选择,以及指定Xi上沉默的开始和确立。这些步骤受到下述非编码基因的控制:Xite(Ogawa和Lee,Mol.Cell 11:731-743(2003))、Tsix(Lee等人,Nat.Genet.21:400-404(1999))和Xist(Borsani等人,Nature 351:325-329(1991);Brockdorff等人,Nature 351:329-331(1991);Brown等人,Nature 349:38-44(1991)),所述非编码基因各自的特征在于TE渗入。
Xist产生大核RNA,所述大核RNA由Xi专有地表达,顺式包被那个染色体(Clemson等人,J.Cell Biol.142:13-23(1998)),且通过募集异染色质指导连锁的染色体沉默(Borsani等人,(1991)同上;Brockdorff等人,(1991)同上;Brown等人,(1991)同上)。反义基因Tsix充当Xist表达的二元开关:在未来Xi上,Tsix表达丧失允许顺式上调Xist和染色体沉默;在未来Xa上,Tsix在雌性细胞分化期间的持续表达使那个X免于Xist的沉默作用(Lee和Lu,Cell 99:47-57(1999);Luikenhuis等人,Mol.Cell Biol.21:8512-8520(2001);Stavropoulos等人,Mol.Cell Biol.25:2757-2769(2001))。Tsix在Xa上的持续取决于Xite(Ogawa和Lee,(2003)同上;Stavropoulos等人,Mol.Cell Biol.25:2757-2769(2005)),所述Xite与Tsix协同以调节计数和选择(Lee,Science 309:768-771(2005))。
Tsix对Xist的阻抑特性需要反义基因的5’端,有证据涉及具体DNA元件(Chao等人,Science 295:345-347(2002);Lee和Lu,(1999)同上;Morey等人,Hum.Mol.Genet.10:1403-1411(2001))或经由主要Tsix启动子的转录(Luikenhuis等人,(2001)同上;Sado等人,Development 128:1275-1286(2001);Shibata和Lee,Curr.Biol.14:1747-1754(2004);Stavropoulos等人,(2001)同上)。TsixΔCpG敲除(Lee和Lu,(1999)同上)已限定3.7kb关键结构域,所述关键结构域包括主要Tsix启动子和二分增强子(Stavropoulos等人,(2005)同上)、重复元件DXPas34(Courtier等人,Proc.Natl.Acad.Sci.92:3531-3535(1995);Debrand等人,Mol.Cell Biol.19:8513-8525(1999))、以及在等位基因选择中具有潜在功能的CTCF结合位点(Chao等人,(2002)同上)。然而,明显地,反义转录的某些方面也是重要的,因为被迫表达(Luikenhuis等人,(2001)同上;Stavropoulos等人,(2001)同上)和过早转录终止(Luikenhuis等人,(2001)同上;Sado等人,(2001)同上;Shibata和Lee,(2004)同上)两者都导致偏斜的X失活选择。尽管这些分析已揭示了许多潜在元件,但每种元件是否有助于Xist控制以及到何种程度目前仍不清楚。
下述实验寻求通过在3.7kb TsixΔCpG结构域内产生新敲除等位基因来限定具体所需元件。首先,为了确定反义转录是否是实际上需要的,缺失Tsix的各种启动子片段,且非常惊奇地发现突变无产生XCI表型。使用剩余序列的计算分析且鉴定DXPas34为具有2种不同功能的远古反转录转座子的残迹。DXPas34的分子特征和遗传意义在下文报告。
结果
Tsix启动子的靶向缺失不损害Tsix功能
为了确定转录活性是否是Tsix功能所需的,产生在主要Tsix启动子周围的缺失。已将主要启动子作图到跨越-160至+116bp Tsix起始位点的276bp片段(Stavropoulos等人,(2005)同上)[注:上游的次要6启动子已得到描述,但其缺失对XCI没有影响(Ogawa和Lee,(2003)同上;Sado等人,(2001)同上;Stavropoulos等人,(2001)同上)]。因为紧侧翼区也可以包含关键元件,所以产生2种类型的启动子缺失,其中一种去除起始位点周围~700bp的序列(ΔPmin),且另一种去除延伸至但不包括DXPas34的~2100bp(ΔPmax)。为了简化靶向努力,Cre-Lox和Flp-Frt位点特异性重组酶系统(Meyers等人,Nat.Genet.18:136-141(1998))用于产生嵌套缺失对(图29A)。
将启动子靶向构建体转染到小鼠胚胎干(ES)细胞内,所述小鼠胚胎干细胞是常规用于在培养中模拟XCI的系统。测试XX和XY ES系以检测突变对计数和选择的任何潜在作用。靶向到雌性16.7系内导致在筛选的3000种中的2种同源重组体(图29B)。因为16.7包含Mus castaneus起源(“cast”)的1个X染色体和小家鼠起源(“129”)的第2个X,所以我们可以使用起于DXPas34重复数目中品系特异性差异的限制性片段长度多态性(RFLP)(Avner等人,Genet.Res.72:217-224(1998)),以确定在雌性细胞中靶向哪个X。在2种情况下,靶向129等位基因(图29C)。靶向进入雄性J1系之内产生在筛选的500个集落中的2种同源重组体(图29D)。用Cre和Flp重组酶分别瞬时转染靶向的细胞系产生ΔPmin和ΔPmax(图29B,D)。独立分离的克隆表现类似,因此在下文讨论每种缺失类型和性别的单个代表性克隆。
为了确定其对Tsix表达的作用,进行基于多态性MnlI和ScrFI位点的等位基因特异性RT-PCR分析(图29E)。如预测的,与野生型比较,来自雌性中的突变等位基因(129)的Tsix表达显著减少。如通过实时RT-PCR分析测定的,来自半合子雄性细胞中的突变等位基因的Tsix表达同样显著减少(图29F)。ΔPmax和ΔPmin对Tsix转录具有比TsixΔCpG弱得多的影响,从而暗示显著的启动子活性可以在ΔPmax区域外找到(参见下文)。
为了确定启动子突变是否影响XCI,雄性和雌性细胞在培养中分化成胚状体(EB),以开始XCI途径且寻找对计数和选择的作用。具有异常计数的细胞已显示分化差或在分化期间死亡(Clerc和Avner,Nat.Genet.19:249-253(1998);Lee,(2005)同上)。然而,XX和XY背景中的ΔPmin和ΔPmaxEB正常分化和生长,在细胞死亡方面没有数量增加。这些观察反对计数缺陷,基于杂合和半合子状态中关于TsixΔCpG的计数表型不存在可预测的结果(Lee和Lu,(1999)同上)。
为了查询对选择的作用,检查对Xist和X连锁基因Mecp2表达的相对等位基因贡献。令人惊讶的是,在XX细胞中ΔPmin和ΔPmax对等位基因选择都没有任何作用(图29G,H)。这个结果与TsisΔCpG的那种形成对比,所述TsixΔCpG的结果在杂合雌性中显示完全偏斜的XCI模式(Lee和Lu,(1999)同上)。因此,尽管被迫的Tsix转录(Luikenhuis等人,(2001)同上;Stavropoulos等人,(2001)同上)或过早Tsix终止(Luikenhuis等人,(2001)同上;Sado等人,(2001)同上;Shibata和Lee,(2004)同上)使XCI选择模式偏斜,但令人惊讶地,从主要Tsix启动子开始的转录不是Tsix的随机选择调节所需的。
然而,奇怪地,尽管ΔPmin和ΔPmax等位基因无引起XCI表型,但如通过等位基因特异性RT-PCR和FISH观察到的,它们的前体等位基因ΔPneo导致非随机XCI,其中失活在野生型X上占优势地发生(图29G-I)。因此,尽管消除了700bp启动子区,但ΔPneo表现与迄今为止产生的所有Tsix敲除等位基因(Lee和Lu,(1999)同上;Luikenhuis等人,(2001)同上;Morey等人,(2001)同上;Sado等人,(2001)同上;Shibata和Lee,(2004)同上)相反,且更接近地类似Tsix超表达等位基因(Luikenhuis等人,(2001)同上;Stavropoulos等人,(2001)同上),其中当细胞分化时突变的X优先保持活性。但与其中非随机XCI次于细胞选择的TsixEF1α超表达等位基因(Stavropoulos等人,(2001)同上)不同,ΔPneo显示选择中的主要缺陷。在分化过程中没有观察到过量的细胞死亡(数据未显示),从而表明突变细胞各自选择突变X为Xa。这些结果表明与Pgk-Neo标记插入组合的Tsix启动子缺失产生新效等位基因(neomorphic allele)。因为Pgk-Neo以对于Tsix相反的方向插入,所以表型不能由Neo连读转录成Tsix产生。相反,与Pgk-Neo构建体连接的Pgk增强子(McBurney等人,Nucleic Acids Res.19:5755-5761(1991);Sutherland等人,Gene Expr.4:265-279(1995))可能已产生回避确立的正常选择机制的异位相互作用(参见讨论)。
DXPas34是保守元件
已知主要Tsix启动子对于调节是可有可无的,所以集中于DXPas34——包含ΔPmax中未缺失的3.7kb TsixΔCpG序列的占优势基序。由小鼠中~34bp的串联重复组成(Avner等人,(1998)同上;Courtier等人,(1995)同上),DXPas34具有用于染色质隔离子CTCF的结合位点(Chao等人,(2002)同上),且有助于二分Tsix增强子的活性(Stavropoulos等人,(2005)同上)。然而,因为早期研究指出DXPas34在小鼠外不是保守的(Avner等人,(1998)同上;Chureau等人,GenomeRes.12:894-908(2002);Courtier等人,(1995)同上;Debrand等人,Mol.Cell Biol.19:8513-8525(1999);Migeon等人,(2001)同上;Nesterova等人,(2001)同上),所以其功能意义仍不清楚。
为了测试DXPas34终究是不是保守的,进行使用小鼠、大鼠和人Xic序列的生物信息学分析。有趣的是,点图分析鉴定了在大鼠Xic中与小鼠DXPas34同线的位置上的一组迄今未识别的重复(图30A)。点图还揭示这个结构域中存在2种不同的重复簇:对应于DXPas34的‘重复A’(Avner等人,(1998)同上;Courtier等人,(1995)同上),和先前未描述的‘重复B’。重复A,小鼠中的主要重复,在小鼠中极大地扩充且可以进一步细分类为A1和A2。A1长度为34bp,对应于先前鉴定的重复单位(Courtier等人,(1995)同上),且在129个品系中以29个串联拷贝存在(AgeI至MluI片段)。A2重复单位长度只有32bp,在位于A1组和Tsix启动子之间的5个串联拷贝中发现。在大鼠中只发现了一种类型的重复A,且它以13个高度简并的拷贝存在。小鼠A2共有序列和大鼠A共有序列与DXPas34的主要A1重复共有独特的6-bp ATTTTA基序。小鼠A2和大鼠A共有序列不包含A1中存在的GGTGGC基序。这个基序与先前作图在DXPas34内的CTCF结合位点核心一致(Chao等人,(2002)同上)。重复B位于A2的紧上游,长度为30bp且在129个品系中只以6个串联拷贝存在。与重复A形成对比,重复B在大鼠中具有31bp的共有序列,在大鼠中它扩充至35个串联拷贝。有趣的是,小鼠和大鼠B共有序列都包含CTCF-基序(5’-GCCACC-3’)的倒位,以及附近部分的倒位(CCACT)(图30B)。
我们接下来比较小鼠和人序列。尽管先前分析已检测出小鼠和人之间的3个同源性区域(R1,R2,R3(Lee等人,(1999)同上)),但在DXPas34周围没有明显的同源性。事实上,人TSIX具有在小鼠中不存在的R2和R3之间的14-kb插入,在小鼠中R2和R3是邻接的(图30C)。因为小鼠在系统发生上与人比与大鼠更远,所以预期任何潜在的人DXPas34元件和邻近的重复B可以容易地逃避检测。因此,开发了用于更紧密检查的简并重复A和重复B搜索串且显示,尽管B基序在人TSIX中没有显示明显的直向同源物(orthologue),但由跨越CTCF识别位点的16个碱基对(bp)组成的紧密相关A簇在人TSIX起始位点下游是明显的(图30C-D)。这个元件重复7次,以相同方向定位,且分散在R2和R3之间的3kb结构域中。小鼠和大鼠的重复B也包含相同的16-bp含CTCF结构域。关于这种共同定位、高度簇生的重复组类型的一般搜索揭示在Xic/XIC上没有其他。
基于这种分析,得出结论为DXPas34实际上在哺乳动物中以下列方式是保守的:(i)DXPas34区域实际上由2种不同但相关的重复簇组成:重复A(在最初描述的DXPas34内)和重复B(与最初的DXPas34邻近)。这些重复在至少2种哺乳动物物种中发现。(ii)啮齿类动物重复A是3个区域的复合物,包括中央的16-bp含CTCF结构域、上游11-bp结构域、和下游6-bp ATTTTA结构域。(iii)人重复A显得更紧凑,只由16-bp含CTCF结构域组成,没有明显的11-或6-bp侧翼结构域。(iv)存在于小鼠和大鼠中的重复B包含反向部分CTCF基序(GGNGG)。
ERV反转录转座子中的DXPas34起源
在哺乳动物中,已知存在至少575个重复DNA元件家族(Jurka等人,Genome Res.110:462-467(2005))(http://www.girinst.org/repbase/update/index.html)。在哺乳动物中测试DXPas34保守性的同时,得到出乎意料的发现:人A重复是在R2和R3之间的14kb缺口内串联存在的较大反转录转座子单位的部分(图30C-D)。有趣的是,7个重复A基序中的5个位于重复元件的LTR/ERV或SINE/Alu亚类内,从而暗示DXPas34可能由远古的反转录转座子遗传下来。为了进一步研究这点,询问图30B中的基序是一般存在于啮齿类动物和人重复元件中,还是它们只在特定家族中发现(来自RepBase10.11的rodrep.ref和humrep.ref文件,从http://www.girinst.org/server/RepBase/index.php获得)。人重复A的16-bpCTCF核心结构域匹配人数据库中的3个重复元件,包括hAT型DNA重复元件——MER45R、和2个相关内源逆转录病毒元件(ERV)-ERVL和HERVL(图30E)。同样地,小鼠重复A包含相同的16-bp CTCF结构域(图30B)且匹配啮齿类动物数据库中相应的MER45R、MERVL和RatERVL序列。[关于术语的注解:(i)尽管LTRs表示内源性逆转录病毒(ERV)的末端,但LTR和ERV元件在RepBase中分别细分类;(ii)HERVL中的‘H’指‘人’,而MERVL中的‘M’指小鼠]。由人和小鼠数据库共有的元件表示先于灵长类动物和啮齿类动物趋异的远古重复。
详察这些比对的背景导致另一个令人惊讶的发现:16-bp CTCF结构域不是唯一的同源性区域。事实上,小鼠A1核心上游的上游11-bp结构域(图30B)也匹配HERVL和MERVL中的上游序列。这些匹配存在于内源性逆转录病毒的整合酶编码区中(Benit等人,J.Virol.73:3301-3308(1997))。因此,DXPas34和ERVs在2个邻接结构域上进行比对:16-bp核心结构域和11-bp上游结构域。尽管在1个元件内携带16-bp基序的概率为~2.1x 10-9(考虑所有核苷酸变换,4-15x2-1),但携带11-bp和16-bp基序两者的概率是2.8x10-14([4-15x2-1]x[4-8x2-1x1-1x1-1])。这是非常不可能的现象,因为巧合的机会是2.8x1014个核苷酸中1次-为哺乳动物基因组尺寸的5个数量级。这些论据因此支持DXPas34和HERVL/MERVL反转录转座子之间的亲缘关系。
为了测试这种假设,进行2种分析。首先,推论如果DXPas34来源于MERVL,那么在小鼠基因组中的命中应当是MERVL相关的。实际上,小鼠染色体3(160Mb)的取样揭示了在5个错配或更少的水平上的48个命中。显著的是,基于Mouse Genome Table Browser(http://genome.ucsc.edu/cgi-bin/hgTables),48中的43个由Repeatmasker识别为MERVL相关的。对于剩余的5个,更紧密的检查揭示至少一个同样具有与MERVL的相似性,但没有同样地被Repeatmasker识别。这个结论基于使用BAST-2序列比对法(http://ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi)围绕模式匹配的227-bp背景与MERVL的比对。X染色体取样揭示了在165Mb区域中5个或更少错配上的50个命中(排除DXPas34自身内的命中)。在50个命中中,48个类似地显示是MERVL相关的。完整小鼠基因组的查询产生总共846个针对DXPas34的模式匹配。基于这些结果、这些匹配的外推,约795个将在MERVL序列中。因此,在小鼠基因组中通过DXPas34鉴定的所有命中中,~95%存在于注释为MERVL的序列内。
其次,如果DXPas34来源于MERVL,那么16bp+11bp串在RepBase中应当不鉴定其他的重复元件。使用融合的11+16bp基序5’-GTGAYNNCCCAGRTCCCCGGTGGCAGG-3’(SEQ ID NO:90)进行RepBase的搜索。在人数据库中,这个27-bp序列在4个或更少错配的严格性上只匹配HERVL,而不匹配其他类型的反转录转座子(图30E;应当指出11-bp基序存在于HERVL序列中)。在啮齿类动物数据库中,它在5个或更少错配的严格性上类似地只匹配相应的RatERVL和MERVL,而不匹配其他反转录转座子(图30E)。[注:这个搜索没有鉴定MER45R,因为MER45R只匹配16-bp基序,而不是11-bp基序。因此,27-bp搜索产生更严格和特异的结果]。为了确定这些匹配可以单独偶然发生的概率,使用不依赖匹配被发现的方式的统计学方法进行Monte Carlo分析。改组27-bp基序中的碱基,且测试随机化的27-bp串(具有在其他方面相同的碱基组成)在相同严格性和频率上在RepBase中是否会找到匹配。在27-bp模式的100个随机化变换的测试中,在啮齿类动物重复数据库中在4个或更少错配的严格性上没有观察到匹配。重要的是,这在性质上类似于DXPas34和HERVL之间的匹配。在100个变换中只有3个在5个错配上得到命中,这在性质上类似于使用啮齿类动物ERVL的总体命中。将这些数据联系在一起,得出结论为通过DXPas34鉴定的HERVL、RatERVL和MERVL命中不是偶然的结果。
总之,在575个重复DNA家族中,DXPas34特别类似ERV反转录转座子(HERVL、RatERVL和MERVL)。这种序列相似性可以起因于ERV反转录转座子家族中一个或少量元件中的DXPas34起源。给定啮齿类和人类之间可检测的保守性水平,DXPas34非常可能在约6-8千万年前灵长类动物-啮齿类动物趋异时出现。
DXPas34内的新活性
LTR/ERV如同其他哺乳动物反转录转座子,通常具有启动子活性且可以在低水平上由2条链转录(在(Kazazian,(2004)同上)中综述)。DXPas34内的启动子活性可以潜在地替代ΔPmin和ΔPmax中主要Tsix启动子的丧失,且解释了其最低限度的表型。实际上,发现在萤光素酶报道测定中当置于其天然方向时DXPas34可以充当启动子(图31A)。与这点一致,已发现Tsix cDNAs在DXPas34内开始(Shibata和Lee,Hum.Mol.Genet.12:135-136(2003))。为了寻找相关转录物,在ES细胞中进行链特异性RT-PCR,且观察到预期的DXPas34下游的反义转录物(图31B,位置1)。有趣的是,在DXPas34和Tsix启动子之间(位置2),观察到反向(有义)以及正向(反义)方向上的转录。这种新型反向转录物不如Tsix RNA丰富,穿过~3kb区域(位置3和4)进行,且在位置5附近终止。使用位置2处的引物,5’RACE产物揭示DXPas34内的多个转录起始位点,所述转录起始位点各自与不连续的重复A1单位一致(图31C)。因此,每个A1重复单位可以充当转录活性起点。正向和反向转录单位分别称为Dxpas-f和Dxpas-r。
LTR/ERVs已知由RNA Pol II转录(Havecker等人,Genome Biol.5:225(2004))。因为重复A1单位与Pol II启动子没有明显的相似性,所以通过用α鹅膏毒环肽或tagetin处理未分化的ES细胞4小时询问哪个RNA聚合酶实际上负责Dxpas-r转录,所述α鹅膏毒环肽或tagetin分别特异性抑制Pol II或Pol III。链特异性RT-PCR显示Dxpas-r RNA在α鹅膏毒环肽处理的细胞中严重减少,而它在tagetin处理的细胞中未受影响(图31D),从而表明Dxpas-r通过Pol II转录。用α鹅膏毒环肽再处理4小时(总共8小时)也取消Tsix表达(图31D,α4对α8),从而指出Pol II也转录Tsix和这种转录物具有更长的半衰期。这些结果支持DXPas34具有双向Pol II活性的结论,从而提供了重复A类似LTR/ERV反转录转座子的进一步证据。
随后通过分析未分化的(第0天)ES细胞、分化中的EB(第4天)、和完全分化的小鼠胚胎成纤维细胞(MEFs)来检查Dxpas-r的发展特征。有趣的是,Dxpas-r的表达模式类似于Tsix的那种(图31E):表达在第0天时最强,不迟于第4天时减少,且在MEFs中不存在。这种表达模式与报道的DXPas34的甲基化特征和近期描述的DXPas34中的ES细胞特异性DNA酶I超敏位点状态(Luikenhuis等人,(2001)同上;Stavropoulos等人,(2001)同上;Stavropoulos等人,(2005)同上)精确相关联,所述DXPas34在ES细胞中是未甲基化的,且在分化的细胞的Xa上是过度甲基化的(Avner等人,(1998)同上;Courtier等人,(1995)同上)。
通过DXPas34的Tsix双重正-负调节
根据这些发现,询问DXPas34在XCI中是否起作用。尽管几种其他Tsix敲除等位基因已包括DXPas34(图32A),但先前未产生这种1.6kb元件的严格缺失(Debrand等人,(1999)同上;Lee和Lu,(1999)同上;Luikenhuis等人,(2001)同上;Sado等人,(2000)同上)。因此,DXPas34自身对于XCI调节的必要性仍不清楚。产生在XX和XY细胞中重复A1的靶向缺失,从而获得在筛选的300个集落中2个正确靶向的雄性克隆和3000个中1个正确靶向的雌性克隆(图32B)。Neo标记随后通过用Cre瞬时转染来去除(图32B-C,最右侧泳道),且RFLP分析证实在XX系中靶向129等位基因(图32D)。对于雄性和雌性细胞,含和不含新霉素标记的克隆表现类似,因此讨论不含新霉素标记的代表性克隆。DXPas34缺失导致Tsix表达显著减少,类似于TsixΔCpG等位基因中的那种(图32E)。这些结果证明DXPas34是Tsix的正转录调节物,与DXPas34包含Tsix二分增强子部分的事实一致(Stavropoulos等人,(2005)同上)。应当指出DXPas34缺失减少但并未完全消除Dxpas-r的表达(图32F),可能是因为通过RACE次要Dxpas-r起始位点作图到正好在缺失区域外的位置。
在杂合和半合子状态中ΔDXPas34对XCI计数没有明显作用,因为所有XX和XY克隆正常生长和分化,而细胞死亡没有增加(数据未显示)。相比之下,ΔDXPas34对XCI选择产生明显作用,且重演与TsixΔCpG相关的非随机XCI表型。在杂合ΔDXPas34/+细胞系中,Xist和Mecp2的等位基因特异性分析显示M.castaneus等位基因的偏倚表达(图33A-C)。偏倚对于ΔDXPas34可能比ΔCpG稍微弱些,可能更多暗示对于Xite+/-杂合子可见的不完全偏斜(Ogawa和Lee,(2003)同上)。如同TsixΔCpG和XiteΔL杂合子,当与野生型XX细胞比较时,ΔDXPas34 EB也没有显示增加的细胞死亡(数据未显示),从而暗示非随机XCI模式是由于对Tsix选择功能的首要作用而不是细胞丧失的次要作用。因此由TsixΔCpG引起的非随机XCI可以主要归因于DXPas34丧失而不是启动子丧失。
在这些实验中揭示了在分化晚期期间DXPas34缺失的独特自相矛盾的作用。在杂合雌性中,如通过等位基因特异性RT-PCR在ScrFI多态性位点上测量的,DXPas34缺失导致Tsix的明显去阻抑(图34A)。这种去阻抑首先在分化第4天时明显,且在第12天时变得足够强,从而129(突变的)Tsix转录物极大地超过了来自野生型castaneus等位基因的贡献。相对比率的这种翻转可以是由于129转录物的真实增加,或更确切地是由于castaneus转录物的急剧下降(这因此将产生129转录物随着时间过去增加的表现)。为了区分可能性,使用持家基因Rpo2作为内校准器来进行定量等位基因特异性RT-PCR。在野生型XX细胞中,如预期的129和castane Tsix转录物水平从第0到12天显著降低(图34B)。然而,在ΔDXPas34细胞中,来自突变(129)染色体的Tsix实际上随着时间过去增加。然而,在相同细胞中,野生型castaneus染色体表现类似于野生型细胞中的castaneus染色体,从而显示一旦XCI完成Tsix就预期下调。这些观察证实在XCI确立和维持期过程中,DXPas34是稳定阻抑Tsix转录所需的。因此DXPas34提供关于Tsix的2种顺次功能:在XCI开始时刺激反义转录,随后在XCI确立后稳定沉默Tsix。
然而,应当指出在晚期过程中Tsix的去阻抑并未逆转XCI。相信这是由于ES细胞已通过XCI的“可逆期”(Wutz和Jaenisch,Mol.Cell5:695-705(2000))——即,Tsix表达丧失可能是必需的但不足以使Xist再活化。这些结果暗示远古的MERVL反转录转座子可能已被篡夺,以对Tsix调节发挥激活和阻抑作用。提出DXPas34是Tsix表达的双重调节物,其激活作用首先发生且在XCI确立后其阻抑作用发生。
讨论
LTR/ERV反转录转座子中的DXPas34起源
我们已提供了DXPas34来源于LTR/ERVL反转录转座子的证据。DXPas34自身由2个可识别的相关重复簇-重复A和B组成。在RepBase中表现的575个重复家族中,这些重复特异性匹配HERVL、RatERVL和MERVL家族。针对这些相关内源性逆转录病毒的序列匹配存在于重复A的11-bp上游结构域、重复A的16-bp中央结构域、和重复B的GGNGG核心中。有趣的是,16-bp结构域包含先前显示结合小鼠DXPas34、关于染色质隔离子CTCF的共有序列(Chao等人,(2002)同上)。DXPas34和ERV重复之间的序列相似性显然不是随机事件,因为这种巧合的概率是2.8x1014个核苷酸中1次-为哺乳动物基因组尺寸的5个数量级。因此,提出DXPas34来源于一个或少数ERVs。
在超过7千万年前ERVs在哺乳动物中出现,在猿猴和啮齿类动物趋异之前(Benit等人,(1999)同上)。现今,约5,000-20,000个HERVL和MERVL拷贝存在于人和小鼠基因组中。先前工作已显示在小鼠中对反转录转座子实施富含GC重复单位的广泛内部扩充(Bois等人,Genomics 49:122-128(1998);Bois等人,Mamm.Genome 12:104-111(2001))。现今小鼠DXPas34的GC丰富度可能指出这个基因座上发生的类似渗入过程。看起来可能最终产生DXPas34的逆转录病毒元件经过过去8千万年-1亿年中,在灵长类动物-啮齿类动物趋异点之后经历广泛降解性诱变作用和重复扩充。这个衰退过程可能只保存在原始Tsix上偶然提供某些功能的那些序列,从而使得DXPas34今天可最低限度地识别为LTR/ERV反转录转座子家族的从前成员。
‘无用DNA’在外遗传调节中的新功能
本文进行的DXPas34遗传分析现在将新功能归于在历史上视为‘无用DNA’的此类重复元件。DXPas34展示双向转录且在Tsix的外遗传调节中起2种作用。使用生物信息学、分子、和遗传技术的组合,已将其作用置于其他5’Tsix调节物的背景中。根据显示被迫的Tsix表达导致功能获得(gain-of-function)等位基因的先前工作(Luikenhuis等人,(2001)同上;Stavropoulos等人,(2001)同上),已预期在启动子缺失后的Tsix无效等位基因和偏斜的XCI选择。然而,尽管反义表达显著减少,但ΔPmin和ΔPmax对Xist的Tsix调节都没有明显作用。因此,尽管通过Tsix的转录足以阻断Xist功能,但来自主要启动子的转录不是随机选择绝对需要的。通过Dxpas-f转录,DXPas34援救了来自主要Tsix启动子的转录起始丧失,而来自上游起始位点的贡献可能也起作用(Ogawa和Lee,(2003)同上;Sado等人,(2001)同上)。在反向方向上,Dxpas-r转录是容易检测的且具有类似于Tsix那种的发展动力学,可能由此也在Tsix调节中起作用。
敲除分析清楚地显示DXPas34对Tsix具有正和负作用。先前工作已揭示Tsix由2种增强子调节:包含DXPas34的二分增强子和嵌入Xite内的上游增强子(Ogawa和Lee,(2003)同上;Stavropoulos等人,(2005)同上)。与DXPas34对二分增强子作用关键的事实(Stavropoulos等人,(2005)同上)一致,现在已显示其缺失导致来自主要启动子的Tsix转录显著丧失,从而表明DXPas34的正调节影响通过其作为增强子的作用来完成。出乎意料地,其缺失还导致顺式Tsix晚期再活化,从而表明DXPas34一定也在反义基因的稳定阻抑中起作用。因此,讽刺地,DXPas34也已成为Tsix的第1种候选阻抑物。这些作用在人中也被保存,因为双向转录也已从TSIX的共线区域中检测到(Chow等人,Genomics82:309-322(2003))。
在可用数据的背景中,我们目前的工作导致3步骤模型,其中2种增强子和DXPas34的2种功能顺次起作用以控制Tsix动力学的不同方面(图35A)。由于ΔDXPas34的作用在未分化的ES细胞中已是明显的,所以提出二分增强子在前XCI细胞中起作用以达到双等位基因Tsix表达。相比之下,Xite增强子主要在XCI开始时起作用,因为其缺失在XCI前对Tsix只有很小的作用,但在XCI期间导致Tsix表达过早丧失(Ogawa和Lee,(2003)同上)。(注:Xite增强子在前XCI细胞中也可以有助于Tsix表达,但这种作用迄今为止通过遗传分析仍未被揭示。)即,尽管二分增强子是Tsix从头表达所需的,但Xite增强子是在未来Xa上持续的Tsix表达所必需的。因此,未来Xa和Xi通过Xite增强子的作用区分,其中增强子在Xa而不是Xi上不对称地作用。XCI确立后,Tsix表达被自身压制。提出这种阻抑需要DXPas34的晚期第2种功能。给定Dxpas-r转录物的存在,这种反平行转录可以抑制Tsix,其方式类似于Tsix介导的Xist表达反义阻抑。在这种模型的背景中,功能获得ΔPneo表型可能是异位Pgk-Neo增强子的直接结果,所述异位Pgk-Neo增强子回避对Xite的需要。通过位于Dxpas-f转录上游,异位增强子可以缩短内源调节网络且产生组成型持续的Tsix等位基因。
尽管杂合缺失对随机选择的作用是明确的,但目前的工作没有解决ΔPmin、ΔPmax、ΔPneo和ΔDXPas34对XCI调节的其他方面的作用,例如X染色体计数、选择的互斥性、和XCI印记。在TsixΔCpG的情况下,计数中的失常只在纯合敲除细胞中变得明显(Lee,(2002)同上;Lee,(2005)同上),因此使启动子和DXPas34缺失纯合可以揭示在XCI调节的其他(且仍是重要的)方面中的作用。
最后,在内源性逆转录病毒(ERVs)中DXPas34的可能进化起源仍是引起兴趣的。由于每个反转录转座子是包含启动子、增强子和隔离子的自给自足型基因表达模块(Gerasimova和Corces,Curr.Opin.Genet.Dev.6:185-192(1996);Willoughby等人,J.Biol.Chem.275:759-768(2000)),每个插入引入可以由在整合位点处的基因利用的新调节元件谱。我们提出ERV偶然插入原始Tsix基因内导致通过Xic指派元件以调节Tsix(图35B)。实际上,DXPas34元件包含已各自提议作为调节机器组分的启动子、增强子和隔离子活性(Chao等人,(2002)同上;Stavropoulos等人,(2005)同上)。随着时间过去,ERV可能已丧失几乎所有其原始序列,除了对Tsix具有有利作用的那些外。此类有利元件可能随后进行加倍以产生今天在DXPas34上可见的重复结构。DXPas34因此加入通过先前视为无用DNA的TEs进行的可能功能的增长中的列表(Ferrigno等人,Nat.Genet.28:77-81(2001);Morgan等人,(1999)同上;Oei等人,Genomics 83:873-882(2004);Peaston等人,(2004)同上)。其他人已指出TEs在其他外遗传调节的基因座上呈现主要的存在,所述基因座例如植物和哺乳动物的常染色体印记的结构域、以及裂殖酵母和植物着丝粒(Cam等人,Nat.Genet.37:809-819(2005);Lippman等人,(2004)同上;Noma等人,Nat.Genet.36:1174-1180(2004);Seitz等人,Nat.Genet.34:261-262(2003);Sleutels和Barlow,Academic Press,San Diego,Calif.第119-154页(2002);Volpe等人,Science 297:1833-1837(2002))。因此,TE相关元件可以包含在真菌、植物和哺乳动物中外遗传基因控制的一般机制。相应地,图30B中所示的任何最低限度的DXPas34共有基序(SEQID NOs:28-32和40)、或其多聚体、或规范序列的任何ERV衍生多聚体可以用于抑制细胞分化。
下述材料和方法用于上述实验。
生物信息学分析
种间序列比较使用来自GCG Software Package(http://www.accelrys.com/products/gcg/)的点图法来进行。调整窗口大小和严格性参数以产生在背景上最明显的信号。当重复区域由水平或垂直矩形区域暗示时,进行针对其自身的可能重复区域的点图。这产生具有与对角线平行的线的图,由所述图估计直接重复拷贝的总数目以及重复单位长度(bp)。为了在串联重复簇内找到在碱基对水平上的最佳重复,使用下述程序:Repeat(GCG软件包)、Equicktandem(EMBOSS包http://emboss.sourceforge.net/和Etandem(EMBOSS)。簇随后基于这种信息分割成个别重复。ClustalW的网络实现(http://www.ch.embnet.org/software/ClustalW.html和http://www.ebi.ac.uk/clustalw/)用于比对单个重复。比对用于确定共有序列。存在于人、大鼠和小鼠序列中的TEs使用Repeatmasker网络程序(http://www.repeatmasker.org/cgi-bin/WEBRepeatMasker)来鉴定。通过BLAST搜索在小鼠基因组中搜索另外的DXPas34样位点使用34bp小鼠A1共有序列(图30B)或1056bp片段(bp 139145-140200)来进行,所述1056bp片段包括针对小鼠基因组(http://www.ncbi.nlm.nih.gov/genome/seq/MmBlast.html)或人基因组genome(http://www.ncbi.nlm.nih.gov/genome/seq/HsBlast.html)的DXPas34区域。参数设定为使用blastn、目前参考重叠群和期望值10,从而使得将重新获得具有错配的较短命中以及完美命中。人重复A模式基于先前描述的CTCF结合基序(Bell和Felsenfeld,Nature 405:482-485(2000);Chao等人,(2002)同上;Hark等人,Nature 405:486-489(2000))。使用模式匹配程序Fuzznuc(EMBOSS包)搜索简并的重复共有序列,所述Fuzznuc允许指定允许的错配数目还允许考虑正向和/或互补链。分析来自应用于人基因组序列的Fuzznuc程序的模式匹配列表(来自的http://www.ncbi.nlm.nih.gov/Ftp/的构造35),以确定在3kb区域内相同方向上发现至少7个模式匹配,而在相反方向上没有任何匹配的频率。
细胞系和靶向的诱变
雄性J1(40XY)和雌性16.7(40XX)ES细胞系和培养技术先前已得到描述((Lee和Lu,(1999)同上)和其中的参考文献)。16.7携带129和Mus castaneus起源的X染色体。为了靶向Tsix启动子,将EcoRV-BamHI片段(Genbank X99946的bp 77,816-81,950(Simmler等人,Mamm.Genome 4:523-530(1993)))和NheI-KpnI片段(bp 70,569-77,118)各自克隆到pGEM-7Zfy(+)内,从而形成pSA和pLA。这些质粒分别用AgeI和SacI进行消化,且插入包含2个退火的寡核苷酸(oligos)的合成FRT位点(DEC1和DEC2用于pSA以及DEC3和DEC4用于pLA),从而形成pSA-FRT和pLA-FRT。每个合成FRT位点包含BamHI限制位点。寡核苷酸序列如下:
DEC1:
GAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCGGATCCAGCT
(SEQ ID NO:62)
DEC2:
GGATCCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCAGCT
(SEQ ID NO:63)
DEC3:CCGGGAGTTCCTATTCTCTAGAAGTATAGGAACTTCGGATCC
(SEQ ID NO:64)
DEC4:
CCGGGGATCCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTC
(SEQ ID NO:65)
对装配的具有FRT位点的同源臂进行测序以确定FRT位点方向。同源臂从pSA-FRT和pLA-FRT中释放且连接到pPGK-neo-BpA-lox2-dTA(Phil Soriano的慷慨赠品)中的NotI和NheI位点内。所得到的靶向构建体pDECKO用PvuI线性化,且使用Lipofectamine 2000(Invitrogen)将40μg线性化DNA转染到~107ES细胞内。使脂质转染复合物与ES细胞接触8小时。转染的细胞用300μg/mL G418进行选择,且在选择第7-9天时挑选抗性集落。靶向的克隆随后用Cre或FLP编码质粒进行转染,且新霉素敏感性克隆通过DNA印迹检查以鉴定正确切除事件。探针1是用下述引物扩增的PCR片段(bp 82,247-82,615):
Ext1:CACATGAGGGCATAGCCGCATTC(SEQ ID NO:66)
Ext2:CCTGGCATAAGAAATCTTGAGGAT(SEQ ID NO:67)
探针2是1.4kb MluI-NdeI限制片段(bp 79,949-81,461)
用于ΔDXPas34的靶向构建体(pKO3)由克隆到pLNTK的SalI位点内的2kb MluI-BamHI片段(Genbank X99946的79949-81950)组成(Gorman等人,Immunity 5:241-252(1996))。所得到的质粒用XhoI线性化,且加入6.6kb BamHI-AgeI片段(71,753-78,396),从而产生pKO3。约107ES细胞以用PvuI线性化的40μg pKO3进行电穿孔。用300μg/mL G418和2μM丙氧鸟苷选择7-9天后挑选集落。正确靶向的克隆随后用pMC-CreN转染,且通过DNA印迹分析新霉素敏感性克隆。
RNA/DNA FISH
RNA/DNA FISH如先前所述进行(Lee和Lu,(1999)同上)。对于雌性ΔPneo系中的129X检测,2kb Neo片段(来自pGKRN的SalI-XhoI)通过切口平移(Roche)用Cy3-dUTP(Amersham)进行标记。对于雌性ΔDXPas34系中的castaneus X检测,使用1.2kb DXPas34片段(来自pCC3的AgeI-SalI)。Xist RNA用P1质粒pSx9进行检测,所述pSx9用FITC-dUTP(Roche)进行标记。
RT-PCR
对于每个位置使用如表5中所示引物进行链特异性RT-PCR。所有RT反应使用M-MLV逆转录酶来进行,且使用Trizol(Invitrogen)从未分化的雄性ES细胞中分离3μg总RNA。反应于50℃进行以避免非特异性引发。PCR使用下述条件来进行:95℃,3分钟;(95℃,45秒;55℃,45秒;72℃,1分钟)38个循环,随后为于72℃延伸10分钟。关于Xist、Tsix和Mecp2的等位基因特异性RT-PCR如先前所述进行(Stavropoulos等人,(2001)同上)。对于定量、等位基因特异性RT-PCR,使用引物ns66和Rpo2B于50℃逆转录3μg RNA。Rpo2用引物Rpo2-1A(Stavropoulos等人,(2001)同上)和Rpo2B进行扩增,且用Rpo2A进行检测。Tsix使用ns66和ns67进行扩增,且用ns60进行检测。预实验确定这些PCRs的线性范围为23-27个循环,且样品在25个循环后使用先前所述方法(Stavropoulos等人,(2001)同上)进行分析。
表5.用于链特异性RT-PCR的引物
Figure A20068003250100941
*来自Shibata和Lee,2003
5’RACE
RACE使用GeneRacer试剂盒(Invitrogen)来进行,且根据制造商的说明书使用Trizol(Invitrogen)从未分化的雄性ES细胞中分离5μg总RNA。逆转录使用65℃Thermoscript逆转录酶(Invitrogen)和下述引物来进行
CC3-1DL:GATAGCTTACATACATGCCACGTTCCCGG(SEQ IDNO:68)
RT产物使用CC3-1DL和由制造商推荐的递降PCR规程提供的5’Generacer引物进行扩增,对于所有步骤使用1分钟延伸时间和使用65℃退火温度的25个循环和于68℃延伸。嵌套式PCR使用下述引物对1μl第一级PCR来进行:
CC3-1DN:GGATGCCTGGGACTGGGAAACTTTACT(SEQ IDNO:69)和提供的5’嵌套式引物,使用推荐的循环条件进行25个循环。嵌套式PCR产物使用Qiaquick柱(Qiagen)进行凝胶纯化,且使用Topo-TA克隆系统(Invitrogen)进行克隆。将克隆产物转化到提供的化学感受态TOP10细胞内,且在LB-amp-IPTG-X-gal板上进行铺平板。挑选白色集落用于进一步分析:
转录抑制剂实验
α鹅膏毒环肽(Sigma)或tagetin(Epicentre)在ES+LIF培养基中分别稀释至75μg/mL或45μM的终浓度。85%汇合的未分化雄性ES细胞在包含每一种上述药物的培养基下生长4或8小时。RNA使用Trizol(Invitrogen)从每个孔中进行分离,且通过RT-PCR进行分析。
实施例5.在X失活中心处的小RNA分子检测。
已知上述结果指出双向转录和dsRNA在Tsix和Xite上发生,和通过Tsix/Xite转录或Tsix/Xite的RNA产物、或两者都是配对所需的,RNAi可能天然发生以调节XCI和分化。
进行RNA印迹分析以确定小RNAs是否存在于Xite内。对于这些实验,如每个图所示将20μg总细胞RNA装载到每个泳道中,电泳到琼脂糖凝胶内,且随后与T3或T7产生的核糖核酸探针杂交。如图36中所示,检测到来自2条链(有义和反义)的25-30、35-40和50+个核苷酸的小RNAs。let7b印迹是显示已知miRNA(let7b)可以通过我们的技术进行检测的阳性对照。目的条带由箭标指出。不管探针的链特异性,都检测到相同条带。即,有义和反义链探针都可以获得小RNAs,从而暗示小RNAs是双链的。所示细胞系是来自Lee,Science(2005)同上和Xu等人Science(2006)同上、以及Ogawa和Lee Mol.Cell.(2003)同上的那些。简言之,J1,野生型雄性ES;16.7,野生型雌性ES;J1-ΔCpG是Tsix缺失的雄性ES;16.7Δ/Δ是Tsix-/-雌性ES;ΔL(Xite)是Xite的12.5kb缺失;雌性-Tsix3.7是具有在Tsix等位基因中缺失的3.7kb Tsix序列的转基因雌性ES;雌性-Xite是具有5.6Xite转基因的转基因雌性ES。泳道0、4、10指关于每种细胞系的细胞分化天数。
这些方法可以用于鉴定来自Xic、Xite、Tsix、Tsix/Xite或Xist中任何区域的小RNAs,其大小为长度至少15个核苷酸,优选地,17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个核苷酸,且长度甚至最高达50或100个核苷酸(包括在中间的所有整数),所述小RNAs基本上与Xic、Xite、Tsix或Xist相同或互补,且可以用于干扰正常计数和配对过程且抑制ES细胞分化。
其他实施方案
本说明书中提及的所有出版物、专利申请和专利,且包括于2005年7月7日提交的美国临时申请系列号60/697,301,引入本文作为参考。
尽管本发明已结合具体实施方案进行描述,但应当理解它能够进一步修改。因此,本申请预期包括一般而言遵循本发明原理的本发明的任何变化、用途或适应,包括在本领域已知或常规实践范围内的与本公开内容的偏差。

Claims (88)

1.一种用于延迟干细胞分化的方法,所述方法包括将转基因引入所述干细胞内,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因,及其片段。
2.权利要求1的方法,其中所述Xic转基因包含的核酸序列基本上等同于选自SEQ ID NOs:1、2和3的序列。
3.权利要求1的方法,其中所述Xic转基因包含的核酸序列基本上等同于SEQ ID NOs:39中所示的人Xic序列。
4.权利要求1的方法,其中所述Tsix转基因包含的核酸序列基本上等同于选自SEQ ID NOs:5、6、9、10、12、13、14、21、22、23和28-32的序列。
5.权利要求4的方法,其中所述Tsix转基因包含SEQ ID NOs:9、10、12、21、22或28-32的核酸序列。
6.权利要求4的方法,其中所述Tsix转基因包含SEQ ID NOs:13、14或28-32中所示序列的至少一个拷贝。
7.权利要求6的方法,其中所述Tsix转基因包含SEQ ID NOs:13、14或28-32中所示序列的至少2个拷贝。
8.权利要求1的方法,其中所述Tsix转基因包含的核酸序列基本上等同于SEQ ID NOs:36或40中所示的人Tsix序列。
9.权利要求8的方法,其中所述Tsix转基因包含SEQ ID NO:40中所示序列的至少2个拷贝。
10.权利要求1的方法,其中所述Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:15、16、17、24、25、26和27的序列。
11.权利要求1的方法,其中所述Xite转基因包含的核酸序列基本上等同于SEQ ID NO:38中所示的人Xite序列。
12.权利要求1的方法,其中所述Tsix/Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:4、11和19的序列。
13.权利要求1的方法,其中所述Tsix/Xite转基因包含的核酸序列基本上等同于SEQ ID NO:37中所示的人Tsix/Xite序列。
14.权利要求1的方法,其中所述转基因可以阻断内源X-X配对。
15.权利要求1的方法,其中所述干细胞是胚胎干细胞。
16.权利要求15的方法,其中所述胚胎干细胞是雌性或雄性的。
17.权利要求15的方法,其中所述胚胎干细胞是哺乳动物的。
18.权利要求17的方法,其中所述胚胎干细胞是人的。
19.权利要求17的方法,其中所述胚胎干细胞是小鼠的。
20.权利要求15的方法,其中所述胚胎干细胞是胚泡期干细胞、胚胎生殖干细胞、或来自滋养核的克隆干细胞。
21.权利要求15的方法,其中所述胚胎干细胞来自农业动物。
22.一种用于延迟干细胞分化的方法,所述方法包括将小RNA引入所述干细胞内,所述小RNA基本上与转基因的至少15个核苷酸相同或互补,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因、Xist转基因,及其片段。
23.权利要求22的方法,其中所述小RNA是双链RNA。
24.权利要求22的方法,其中所述小RNA长度为15-32个核苷酸。
25.权利要求22的方法,其中所述小RNA长度为32-50nt。
26.权利要求22的方法,其中所述Xic转基因包含的核酸序列基本上等同于选自SEQ ID NOs:1、2、3或39的序列。
27.权利要求22的方法,其中所述Tsix转基因包含的核酸序列基本上等同于选自SEQ ID NOs:5、6、9、10、12、13、14、21、22、23、28-32、36和40的序列。
28.权利要求22的方法,其中所述Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:15、16、17、24、25、26、27和38的序列。
29.权利要求22的方法,其中所述Tsix/Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:4、11、19和37的序列。
30.权利要求22的方法,其中所述Xist转基因包含的核酸序列基本上等同于选自SEQ ID NOs:7、8、20和35的序列。
31.权利要求22的方法,其中所述小RNA被转染或显微注射到所述干细胞内。
32.一种用于控制干细胞分化的方法,所述方法包括
(a)将至少一种转基因引入所述干细胞内,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因,及其片段,从而延迟所述干细胞分化;和
(b)需要时,灭活所述转基因,从而允许所述干细胞分化。
33.权利要求32的方法,其中所述Xic转基因包含的核酸序列基本上等同于选自SEQ ID NOs:1、2和3的序列。
34.权利要求32的方法,其中所述Xic转基因包含的核酸序列基本上等同于SEQ ID NOs:39中所示的人Xic序列。
35.权利要求32的方法,其中所述Tsix转基因包含的核酸序列基本上等同于选自SEQ ID NOs:5、6、9、10、12、13、14、21、22、23和28-32的序列。
36.权利要求35的方法,其中所述Tsix转基因包含SEQ ID NOs:9、10、12、21、22或28-32的核酸序列。
37.权利要求35的方法,其中所述Tsix转基因包含SEQ ID NOs:13、14或28-32中所示序列的至少一个拷贝。
38.权利要求35的方法,其中所述Tsix转基因包含SEQ ID NOs:13、14或28-32中所示序列的至少2个拷贝。
39.权利要求32的方法,其中所述Tsix转基因包含的核酸序列基本上等同于SEQ ID NOs:36或40中所示的人Tsix序列。
40.权利要求39的方法,其中所述Tsix转基因包含SEQ ID NO:40中所示序列的至少2个拷贝。
41.权利要求32的方法,其中所述Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:15、16、17、24、25、26和27的序列。
42.权利要求32的方法,其中所述Xite转基因包含的核酸序列基本上等同于SEQ ID NO:38中所示的人Xite序列。
43.权利要求32的方法,其中所述Tsix/Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:4、11和19的序列。
44.权利要求32的方法,其中所述Tsix/Xite转基因包含的核酸序列基本上等同于SEQ ID NO:37中所示的人Tsix/Xite序列。
45.权利要求32的方法,其中所述转基因进一步包含选择标记。
46.权利要求32的方法,其中所述转基因侧翼为重组酶识别序列。
47.权利要求46的方法,其中所述重组酶识别序列是LoxP或FRT序列。
48.权利要求32的方法,其中所述灭活包含从所述干细胞中去除所述转基因。
49.权利要求48的方法,其中所述转基因通过在所述干细胞中表达重组酶从所述干细胞中被去除。
50.权利要求49的方法,其中所述重组酶的所述表达是瞬时的。
51.权利要求49的方法,其中所述重组酶是Cre重组酶或翻转酶(FLP)重组酶。
52.权利要求32的方法,其中在步骤(b)之前将第2种转基因引入所述干细胞内。
53.权利要求32的方法,其中所述干细胞是胚胎干细胞。
54.权利要求53的方法,其中所述胚胎干细胞是雌性或雄性的。
55.权利要求53的方法,其中所述胚胎干细胞是哺乳动物的。
56.权利要求55的方法,其中所述胚胎干细胞是人的。
57.权利要求55的方法,其中所述胚胎干细胞是小鼠的。
58.权利要求53的方法,其中所述胚胎干细胞是胚泡期干细胞、胚胎生殖干细胞、或来自滋养核的克隆干细胞。
59.权利要求53的方法,其中所述胚胎干细胞来自农业动物。
60.一种干细胞,其包含的Xic转基因基本上等同于选自SEQ IDNOs:1、2、3、39及其片段的序列。
61.一种干细胞,其包含的Tsix转基因基本上等同于选自SEQ IDNOs:5、6、9、10、12、13、14、21、22、23、28-32、36、40及其片段的序列。
62.一种干细胞,其包含的Xite转基因基本上等同于选自SEQ IDNOs:15、16、17、24、25、26、27、38及其片段的序列。
63.一种干细胞,其包含的Tsix/Xite转基因基本上等同于选自SEQID NOs:4、11、19、37及其片段的序列。
64.权利要求60-63中任何一项的细胞,其中所述转基因在所述干细胞中表达。
65.权利要求60-63中任何一项的细胞,其中所述干细胞是胚胎干细胞。
66.权利要求65的细胞,其中所述胚胎干细胞是雌性或雄性的。
67.权利要求65的细胞,其中所述胚胎干细胞是哺乳动物的。
68.权利要求65的细胞,其中所述胚胎干细胞是人的。
69.权利要求65的细胞,其中所述胚胎干细胞是小鼠的。
70.权利要求65的细胞,其中所述胚胎干细胞是胚泡期干细胞。
71.权利要求65的细胞,其中所述胚胎干细胞来自农业动物。
72.权利要求60-63中任何一项的细胞,其中所述转基因进一步包含选择标记。
73.权利要求60-63中任何一项的细胞,其中所述转基因侧翼为LoxP或FRT序列。
74.权利要求60-63中任何一项的细胞,其中所述干细胞进一步包含重组酶。
75.权利要求60-63中任何一项的细胞,其中所述干细胞进一步包含第2种转基因。
76.一种分离的小RNA分子,其包含的核酸序列基本上与转基因的至少15个核苷酸相同或互补,所述转基因选自Xic转基因、Tsix转基因、Xite转基因、Tsix/Xite转基因、Xist转基因,及其片段。
77.权利要求76的分离的小RNA分子,其中所述小RNA是双链RNA。
78.权利要求76的分离的小RNA分子,其中所述小RNA长度为15-32个核苷酸。
79.权利要求76的分离的小RNA分子,其中所述小RNA长度为32-50nt。
80.权利要求76的分离的小RNA分子,其中所述小RNA是siRNA。
81.权利要求76的分离的小RNA分子,其中所述Xic转基因包含的核酸序列基本上等同于选自SEQ ID NOs:1、2、3或39的序列。
82.权利要求76的分离的小RNA分子,其中所述Tsix转基因包含的核酸序列基本上等同于选自SEQ ID NOs:5、6、9、10、12、13、14、21、22、23、28-32、36和40的序列。
83.权利要求76的分离的小RNA分子,其中所述Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:15、16、17、24、25、26、27和38的序列。
84.权利要求76的分离的小RNA分子,其中所述Tsix/Xite转基因包含的核酸序列基本上等同于选自SEQ ID NOs:4、11、19和37的序列。
85.权利要求76的分离的小RNA分子,其中所述Xist转基因包含的核酸序列基本上等同于选自SEQ ID NOs:7、8、20和35的序列。
86.一种组合物,其包含权利要求76的分离的小RNA分子,被配制用于促进所述小RNA分子进入细胞内。
87.一种药物组合物,其包含权利要求76的分离的小RNA分子。
88.一种载体,其包含权利要求76的分离的小RNA分子,其中所述小RNA与一种或多种转录调节序列可操作地连接。
CNA2006800325011A 2005-07-07 2006-06-30 用于控制干细胞分化的方法 Pending CN101611142A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US69730105P 2005-07-07 2005-07-07
US60/697,301 2005-07-07

Publications (1)

Publication Number Publication Date
CN101611142A true CN101611142A (zh) 2009-12-23

Family

ID=38006359

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800325011A Pending CN101611142A (zh) 2005-07-07 2006-06-30 用于控制干细胞分化的方法

Country Status (3)

Country Link
US (3) US20090215872A1 (zh)
CN (1) CN101611142A (zh)
WO (1) WO2007053207A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008091680A2 (en) * 2007-01-25 2008-07-31 The General Hospital Corporation Methods for controlling stem cell differentiation
US20150376612A1 (en) 2014-06-10 2015-12-31 The General Hospital Corporation CCCTC-Binding Factor (CTCF) RNA Interactome
US10970656B2 (en) 2016-12-29 2021-04-06 Dropbox, Inc. Automatically suggesting project affiliations
WO2023107708A2 (en) * 2021-12-09 2023-06-15 University Of Massachusetts A-repeat minigene compositions for targeted repression of selected chromosomal regions and methods of use thereof

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US37492A (en) * 1863-01-27 Improvement in water-elevators
US59892A (en) * 1866-11-20 Improvement in knitting-machines
US203145A (en) * 1878-04-30 Improvement in self-lighting lamps
US58255A (en) * 1866-09-25 Improvement in respirators
US235159A (en) * 1880-12-07 Obazio lugo
US37988A (en) * 1863-03-24 Improvement in cultivators
US153918A (en) * 1874-08-11 Improvement in railway-trucks
US134787A (en) * 1873-01-14 Improvement in watch-makers lathes
CA1293460C (en) * 1985-10-07 1991-12-24 Brian Lee Sauer Site-specific recombination of dna in yeast
US5572695A (en) * 1994-05-31 1996-11-05 International Business Machines Corporation Transparent memory mapping mechanism for a digital signal processing system
US6632672B2 (en) * 1998-08-19 2003-10-14 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for genomic modification
US7410798B2 (en) * 2001-01-10 2008-08-12 Geron Corporation Culture system for rapid expansion of human embryonic stem cells
US7455983B2 (en) * 2000-01-11 2008-11-25 Geron Corporation Medium for growing human embryonic stem cells
US6734294B2 (en) * 2001-01-22 2004-05-11 Chad C. Nelson Isotopically enriched nucleic acids and associated methods for the production and purification thereof
PL1633767T3 (pl) * 2003-06-02 2019-07-31 University Of Massachusetts Sposoby i kompozycje do kontrolowania wydajności wyciszania rna

Also Published As

Publication number Publication date
WO2007053207A3 (en) 2009-06-18
US20150344910A1 (en) 2015-12-03
US20090215872A1 (en) 2009-08-27
WO2007053207A2 (en) 2007-05-10
US20150125958A1 (en) 2015-05-07

Similar Documents

Publication Publication Date Title
Kleaveland et al. A network of noncoding regulatory RNAs acts in the mammalian brain
Yang et al. Generation of genetically modified mice by oocyte injection of androgenetic haploid embryonic stem cells
Buganim et al. The developmental potential of iPSCs is greatly influenced by reprogramming factor selection
Kanellopoulou et al. Dicer-deficient mouse embryonic stem cells are defective in differentiation and centromeric silencing
Jee et al. Dual strategies for argonaute2-mediated biogenesis of erythroid miRNAs underlie conserved requirements for slicing in mammals
Hayashi et al. MicroRNA biogenesis is required for mouse primordial germ cell development and spermatogenesis
Hayashi Chuva de Sousa Lopes SM
JP7385281B2 (ja) 低抗原性細胞の製造方法
US20080025958A1 (en) Cell-based RNA interference and related methods and compositions
US11459586B2 (en) Methods for increasing efficiency of nuclease-mediated gene editing in stem cells
CN101802172A (zh) 由体细胞产生多能细胞的方法
US20230053028A1 (en) Engineered cells for therapy
Liskovykh et al. Derivation, characterization, and stable transfection of induced pluripotent stem cells from Fischer344 rats
Li et al. A lncRNA fine tunes the dynamics of a cell state transition involving Lin28, let-7 and de novo DNA methylation
AU2012343826A1 (en) Haploid cells
Liu et al. Canonical microRNA activity facilitates but may be dispensable for transcription factor-mediated reprogramming
US20150344910A1 (en) Methods for controlling stem cell differentiation
Xie et al. MLL3/MLL4 methyltransferase activities regulate embryonic stem cell differentiation independent of enhancer H3K4me1
US8975068B2 (en) Isolated stem cell comprising a Xic flanking region transgene
US8383803B2 (en) PITX3 expression promoters
Meissner Conditional RNA interference, altered nuclear transfer and genome-wide DNA methylation analysis
Buccheri et al. Genetic activation of canonical RNA interference in mice
Elahi Effects of RNA Binding Protein Ars2 on Multipotent Hematopoietic and Pluripotent Embryonic Stem Cells
Jung et al. Epigenetic memory in induced pluripotent stem cells
Chen Development and Application of Genome Editing Approaches to Investigate Endogenous Retroviruses

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091223