CN113454104A - 肝特异性调节性核酸序列 - Google Patents

肝特异性调节性核酸序列 Download PDF

Info

Publication number
CN113454104A
CN113454104A CN201980089303.6A CN201980089303A CN113454104A CN 113454104 A CN113454104 A CN 113454104A CN 201980089303 A CN201980089303 A CN 201980089303A CN 113454104 A CN113454104 A CN 113454104A
Authority
CN
China
Prior art keywords
cre
cre0058
crm
cre0051
cre0065
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980089303.6A
Other languages
English (en)
Inventor
迈克尔·罗伯茨
胡安·曼纽尔·伊格莱西亚斯
豪尔赫·奥马尔·亚涅斯-库纳
尼科尔·基彭
罗斯·弗雷泽
凯蒂·贝克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Synpromics Ltd
Original Assignee
Synpromics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synpromics Ltd filed Critical Synpromics Ltd
Publication of CN113454104A publication Critical patent/CN113454104A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/067Hepatocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Cell Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及调节性核酸序列,特别是肝特异性顺式调节元件、顺式调节模块、启动子和其他这样的核酸序列,其能够增强基因的肝特异性表达。本发明还涉及包含这样的肝特异性调节性核酸序列的表达构建体、载体和细胞,以及涉及它们的使用方法。肝特异性调节性核酸序列特别地可用于基因治疗应用,但也可用于另一些领域,例如生物加工和生物技术。

Description

肝特异性调节性核酸序列
技术领域
本发明涉及调节性核酸序列,特别是肝特异性顺式调节元件、顺式调节模块、启动子和其他这样的核酸序列,其能够增强基因的肝特异性表达。本发明还涉及包含这样的肝特异性调节性核酸序列的表达构建体、载体和细胞,以及涉及它们的使用方法。肝特异性调节性核酸序列特别地可用于基因治疗应用,但也可用于另一些领域,例如生物加工和生物技术。
背景技术
提供以下讨论以帮助读者理解本公开内容,并且以下讨论不构成对现有技术的内容或相关性的任何承认。
在许多领域(包括基因治疗)中,期望提供能够驱动基因表达的调节性核酸序列以在所期望的细胞、组织或器官内产生蛋白质或核酸表达产物。
在肝中的表达是特别令人感兴趣的,因为其涉及身体中的广泛范围的基本功能,包括参与代谢、止血和保护免受感染的许多蛋白质的合成。鉴于许多疾病与肝中基因表达的破坏有关,开发允许转基因在肝中表达以产生治疗性表达产物的基因治疗策略具有重要意义。与基因异常表达相关的肝疾病的一些实例包括血友病(包括血友病A或B)、家族性高胆固醇血症、鸟氨酸氨甲酰基转移酶缺乏症、α-抗胰蛋白酶缺乏症、肝炎病毒感染、非病毒性肝炎、肝癌和多种另一些肝病(例如非酒精性脂肪性肝病(non-alcoholic fatty liverdisease,NAFLD)和酒精相关性肝病(alcohol-related liver disease,ARLD))。
使用基因治疗治疗肝病的重大挑战是提供肝特异性(liver-specific)(也称为肝特异性(hepato-specific))治疗性基因表达的能力。已知通过将DNA或病毒载体注射到肝实质、肝动脉或门静脉中来靶向哺乳动物肝细胞。据报道,腺病毒载体在小鼠中主要靶向肝。然而,它们也会感染其他组织,特别是肺和骨骼肌,导致“脱靶(off-target)”效应。一些形式的腺相关病毒载体(adeno-associated viral vector,AAV)或慢病毒载体优先转导肝细胞,但脱靶效应的确再次出现。
因此期望提供以肝特异性方式调节基因表达的系统。理想地,这样的系统对肝具有高度特异性(从而避免在非靶标组织中的脱靶表达或使其最小化)并且还是强有力的,即它们驱动肝中的高表达水平。已提议使用顺式作用调节元件来提供特异性和活性二者。通常来说,这涉及顺式调节增强子序列,即顺式作用以提高启动子活性的核酸序列。无论增强子的方向如何,其通常都是具有活性的,并且在一些情况下,它们可以在距启动子高至数千碱基的距离内发挥作用,尽管它们通常也在更接近启动子时发挥作用。
用于基因的肝特异性表达的多种增强子序列已经描述于文献中。WO95/011308和WO01/098482描述了包含与启动子和转基因连接的肝细胞特异性载脂蛋白E-肝细胞控制区增强子的基因治疗载体。另一些肝特异性构建体也已在文献中提出,例如AAT启动子和白蛋白或乙型肝炎增强子,或醇脱氢酶6(alcohol dehydrogenase 6,ADH6)基础启动子,其与载脂蛋白E增强子元件的两个串联拷贝连接。WO2009/130208描述了多种肝特异性调节元件,所述元件因为其相当短的长度而被描述为有利的。期望短长度的调节序列以使调节序列占据的基因治疗载体的比例最小化;这对于容量(有效载荷)有限的基因治疗载体(例如AAV载体)是特别重要的。
本领域仍然需要能够驱动肝特异性基因表达的调节性核酸。特别地,需要肝特异性调节序列(例如顺式调节元件和最小或近端启动子元件),以及包含这样的元件的肝特异性顺式调节模块和启动子,其可并入表达构建体和载体中用于期望基因(例如基因治疗背景下的治疗性转基因)的肝特异性表达。
发明概述
在本发明的第一方面中,提供了包含选自以下的两种或更多种可操作连接的顺式调节元件(cis-regulatory element,CRE)的合成肝特异性顺式调节模块(cis-regulatorymodule,CRM):
-CRE0018(SEQ ID NO:1)或其功能变体;
-CRE0042(SEQ ID NO:2)或其功能变体;
-CRE0051(SEQ ID NO:3)或其功能变体;
-CRE0058(SEQ ID NO:4)或其功能变体;
-CRE0065(SEQ ID NO:5)或其功能变体;
-CRE0066(SEQ ID NO:7)或其功能变体;
-CRE0068(SEQ ID NO:10)或其功能变体;和
-CRE0074(SEQ ID NO:11)或其功能变体。
在一些实施方案中,合成肝特异性CRM包含三种或更多种、四种或更多种、五种或更多种、或者六种或更多种所述CRE。如下文更详细讨论的,已发现这些CRE有助于合成肝特异性启动子中存在的CRM的活性。
在一些实施方案中,本发明的合成肝特异性CRM包含选自以下的CRE或其功能变体的组合:
-CRE0051和CRE0058;
-CRE0051和CRE0042;
-CRE0051、CRE0058和CRE0065;
-CRE0051、CRE0058和CRE0066;
-CRE0051、CRE0058、CRE0065和CRE0066;
-CRE0018、CRE0051、CRE0058、CRE0065和CRE0066
-CRE0051、CRE0065和CRE0066;
-CRE0051、CRE0074和CRE0058;
-CRE0051、CRE0074、CRE0058和CRE0065;
-CRE0058和CRE0065;
-CRE0068和CRE0042;
-CRE0058、CRE0065和CRE0066;
-CRE0074、CRE0058和CRE0065;
-CRE0051、CRE0074、CRE0058、CRE0065和CRE0066;以及
-CRE0074、CRE0058、CRE0065和CRE0066。
在本文中公开的CRE或其功能变体的组合的任一种中,所记载CRE可以以任何顺序存在。在一些实施方案中,其在一些情况下是优选的,CRE以所记载顺序存在(即以上游至下游的顺序,参考它们相对于可操作连接的启动子元件或基因的位置)。
在本文中公开的CRE或其功能变体的组合的任一种中,一些或所有的所记载CRE可适当地在CRM中彼此相邻定位(即,没有任何间插CRE或其他调节元件)。CRE可以是连续的或非连续的(即它们可彼此紧邻定位或者它们可被间隔子或其他序列隔开)。在一些优选实施方案中,CRE或其功能变体以所记载顺序提供并且彼此相邻。例如,合成肝特异性调节性核酸可包含紧邻CRE0058上游的CRE0051,等等。CRE可以是连续的或非连续的。在一些实施方案中,优选地,一些或所有的CRE是连续的。
已发现包含上述组合CRE的CRM在与合适的启动子元件组合时提供显著的肝特异性增强子活性。当CRE以所记载顺序存在且彼此相邻时,已观察到特别高的活性水平。因此,这些代表了一些优选的CRE“基序”,它们通常与高水平的肝特异性启动子活性相关。
在一些实施方案中,本发明的合成肝特异性CRM包含选自以下的两种、三种、四种或更多种CRE:
-CRE0051或其功能变体;
-CRE0058或其功能变体;
-CRE0065或其功能变体;
-CRE0066或其功能变体;和
-CRE0074或其功能变体。
在一些实施方案中,本发明的合成肝特异性CRM还包含选自以下的一种或更多种CRE:
-CRE0001(SEQ ID NO:12)或其功能变体;
-CRE0005(SEQ ID NO:13)或其功能变体;
-CRE0012(SEQ ID NO:14)或其功能变体;
-CRE0047(SEQ ID NO:15)或其功能变体;
-CRE0048(SEQ ID NO:16)或其功能变体;
-CRE0056(SEQ ID NO:17)或其功能变体;
-CRE0062(SEQ ID NO:18)或其功能变体;
-CRE0077(SEQ ID NO:19)或其功能变体;
-CRE0078(SEQ ID NO:20)或其功能变体;
-CRE0083.1(SEQ ID NO:21)或其功能变体;和
-CRE0089(SEQ ID NO:22)或其功能变体。
在本发明的一些优选实施方案中,合成肝特异性CRM包含选自以下的CRE或其功能变体的组合:
-CRE0051、CRE0058;
-CRE0018、CRE0077、CRE0074、CRE0058、CRE0065;
-CRE0068、CRE0042;
-CRE0051、CRE0042;
-CRE0065、CRE0051、CRE0083.1;
-CRE0018、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0012、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0058、CRE0018;
-CRE0051、CRE0058、CRE0065、CRE0018;
-CRE0051、CRE0058、CRE0065、CRE0012;
-CRE0047、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0058、CRE0065、CRE0001;
-CRE0051、CRE0058、CRE0065;
-CRE0051、CRE0066.2;和
-CRE0047、CRE0001。
优选地,所述CRE以所记载顺序存在于合成肝特异性CRM中。如上所述,在这样的合成肝特异性CRM中,一些或所有的所记载CRE或其功能变体可适当地彼此相邻。CRE可以是连续的或非连续的。已经发现,当与合适的启动子元件组合时,包含这些CRE组合的CRM提供高水平的肝特异性增强子活性。
在本发明的一些优选实施方案中,合成肝特异性CRM包含选自以下的CRE或其功能变体的组合:
-CRE0018、CRE0051、CRE0058、CRE0065、CRE0066(即来自SP0239的CRE);
-CRE0051 CRE0058、CRE0065、CRE0012(即来自SP0244的CRE);
-CRE0051、CRE0058、CRE0065、CRE0066(即来自SP0265的CRE);和
-CRE0051、CRE0042(即来自SP0412的CRE)。
同样,CRE优选地以所记载顺序存在,并且优选地彼此相邻定位。它们也可以是连续的。已发现包含这些CRE组合的CRM在与合适的启动子元件组合时提供高水平的肝特异性增强子活性,并且是特别令人感兴趣的。
在本发明的一些实施方案中,合成肝特异性CRM包含选自以下的CRM:CRM_SP0109、CRM_SP0112、CRM_SP0113、CRM_SP0121、CRM_SP0124、CRM_SP0127、CRM_SP0127A1、CRM_SP0127V1、CRM_SP0127V2、CRM_SP0128、CRM_SP0131、CRM_SP0132、CRM_SP0133、CRM_SP0239、CRM_SP0240、CRM_SP0241、CRM_SP0242、CRM_SP0243、CRM_SP0244、CRM_SP0246、CRM_SP0247、CRM_SP0248、CRM_SP0249、CRM_SP0250、CRM_SP0251、CRM_SP0253、CRM_SP0254、CRM_SP0255、CRM_SP0256、CRM_SP0257、CRM_SP0258、CRM_SP0265、CRM_SP0266、CRM_SP0267、CRM_SP0268、CRM_SP0269、CRM_SP0270、CRM_SP0271、CRM_SP0272、CRM_SP0273、CRM_SP0368、CRM_SP0373、CRM_SP0378、CRM_SP0379、CRM_SP0380、CRM_SP0381、CRM_SP0384、CRM_SP0396、CRM_SP0397、CRM_SP0398、CRM_SP0403、CRM_SP0404、CRM_SP0405、CRM_SP0406、CRM_SP0407、CRM_SP0409、CRM_SP0411、CRM_SP0412、CRM_SP0413、CRM_SP0107、CRM_SP0111、CRM_SP0115、CRM_SP0116、CRM_SP0155、CRM_SP0158、CRM_SP0163、CRM_SP0236、CRM_SP0252、CRM_SP0259、CRM_SP0264、CRM_SP0388和CRM_SP0399,或其中任意的功能变体。适当地,任何所述CRM的功能变体包含与参考合成肝特异性CRM具有至少70%同一性,更优选地与参考合成肝特异性CRM具有至少80%、90%、95%或99%同一性的序列。对应于这些CRM的序列和SEQ ID NO示出于实施例1中。
在本发明的一些实施方案中,合成肝特异性CRM包含选自以下的CRM:CRM_SP0399、CRM_SP0405、CRM_SP0379、CRM_SP0381、CRM_SP0384、CRM_SP0412、CRM_SP0112、CRM_SP0239、CRM_SP0243、CRM_SP0413、CRM_SP0163、CRM_SP0382、CRM_SP0383、CRM_SP0241、CRM_SP0255、CRM_SP0249、CRM_SP0247、CRM_SP0265、CRM_SP0406、CRM_SP0373、CRM_SP0155、CRM_SP0380、CRM_SP0244、CRM_SP0111、CRM_SP0258、CRM_SP0268、CRM_SP0250、CRM_SP0242、CRM_SP0109和CRM_SP0259,或其中任意的功能变体。适当地,任何所述CRM的功能变体包含与参考合成肝特异性CRM具有至少70%同一性,更优选地与参考合成肝特异性CRM具有至少80%、90%、95%或99%同一性的序列。该组包含表现出非常高水平活性的合成肝特异性CRM。
在本发明的一些实施方案中,合成肝特异性CRM包含选自以下的CRM:CRM_SP0239、CRM_SP0244、CRM_SP0259CRM_SP0265和CRM_SP0412,或其中任意的功能变体。该组包含来自合成肝特异性启动子的表现出非常高水平活性的优选CRM子集。适当地,任何所述CRM的功能变体包含与参考合成肝特异性CRM具有至少70%同一性,更优选地与参考合成肝特异性CRM具有至少80%、90%、95%或99%同一性的序列。
在本发明的第二方面中,提供了合成肝特异性启动子,其包含:
a)与启动子元件(优选最小启动子或肝特异性近端启动子)可操作连接的根据第一方面的CRM;或者
b)至少一种以下CRE或其功能变体,其与选自CRE0059或其功能变体或者CRE0006或其功能变体的启动子元件可操作地连接:
-CRE0018或其功能变体;
-CRE0042或其功能变体;
-CRE0051或其功能变体;
-CRE0058或其功能变体;
-CRE0065或其功能变体;
-CRE0066或其功能变体;
-CRE0068或其功能变体;和
-CRE0074或其功能变体。
本文中讨论了用于组a)的合成肝特异性启动子的合适启动子元件。通过非限制性实例,启动子元件可选自CRE0006、CRE0059、CRE0052、CRE0079、CRE0073和CRE0073.1,或其中任意的功能变体。
在一些实施方案中,b)的合成肝特异性启动子包含与选自CRE0059或其功能变体或者CRE0006或功能变体的启动子元件可操作连接的至少两种所记载顺式调节元件或其功能变体。换言之,b)的合成肝特异性启动子可包含与选自CRE0059或CRE0006(或其功能变体)的启动子元件可操作连接的根据第一方面的CRM。
在一些实施方案中,本发明的合成肝特异性启动子包含与启动子元件可操作连接的如表1中示出的CRE或其功能变体的组合之一:
表1
Figure BPA0000307894250000081
Figure BPA0000307894250000091
同样,CRE优选地以所记载顺序存在,并且优选地彼此相邻定位。它们也可以是连续的。
表1示出了发现在与合适的启动子元件(例如最小启动子或肝特异性近端启动子)组合时提供高水平的肝特异性活性的选自CRE0018、CRE0042、CRE0051、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074的两种或更多种CRE的组合。这些CRE或其功能变体的组合也代表了根据本发明第一方面的CRM的一些优选实施方案。发现在与启动子元件CRE0059或CRE0006组合时提供高水平的肝特异性活性的包含选自CRE0018、CRE0042、CRE0051、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074的至少一种CRE的至少两种CRE的组合示出于最后7行中。这些代表了根据本发明的另外优选的CRM。
在一些实施方案中,合成肝特异性启动子包含与选自CRE0006或其功能变体或者CRE0059或其功能变体的启动子元件可操作连接的如表2中示出的单独的CRE或其功能变体、或者CRE或其功能变体的组合中的一种:
表2
Figure BPA0000307894250000101
Figure BPA0000307894250000111
同样,CRE优选地以所记载顺序存在,并且优选地彼此相邻。它们也可以是连续的。启动子元件位于CRE的下游,并且其通常与近端CRE相邻。启动子元件可以与相邻的CRE相连,或者其可以由间隔子隔开。
表2示出了根据本发明一些实施方案的可适当地与启动子元件CRE0006或CRE0059(或其功能变体)可操作连接提供的选自CRE0018、CRE0051、CRE0058、CRE0065、CRE0066、CRE0042、CRE0068和CRE0074(或其功能变体)的多种单独CRE或CRE组合。
在一些实施方案中,合成肝特异性启动子包含与启动子元件或其功能变体可操作连接的CRE或其功能变体的组合之一,如下表3中所示:
表3
Figure BPA0000307894250000112
Figure BPA0000307894250000121
同样,CRE优选地以所记载顺序存在,并且优选地彼此相邻。它们也可以是连续的。启动子元件位于CRE的下游,并且其通常与近端CRE相邻。启动子元件可以与相邻的CRE相连,或者其可以由间隔子隔开。
在另一方面中,提供了包含与启动子元件或其功能变体可操作连接的以下CRE或其功能变体或者CRE或其功能变体的组合中的一种的合成肝特异性启动子,如表4中所示:
表4
Figure BPA0000307894250000131
同样,CRE优选地以所记载顺序存在,并且优选地彼此相邻。它们也可以是连续的。启动子元件位于CRE的下游,并且其通常与近端CRE相邻。启动子元件可以与相邻的CRE相连,或者其可以由间隔子隔开。
表4提供了已发现提供高水平的肝特异性活性的CRE和启动子元件的另一些示例性组合。因此,它们代表了另外的目的合成肝特异性启动子。
在本发明的一些实施方案中,合成肝特异性启动子包含选自以下的启动子:SP0109、SP0112、SP0113、SP0121、SP0124、SP0127、SP0127A1、SP0127V1、SP0127V2、SP0128、SP0131、SP0132、SP0133、SP0239、SP0240、SP0241、SP0242、SP0243、SP0244、SP0246、SP0247、SP0248、SP0249、SP0250、SP0251、SP0253、SP0254、SP0255、SP0256、SP0257、SP0258、SP0265、SP0266、SP0267、SP0268、SP0269、SP0270、SP0271、SP0272、SP0273、SP0368、SP0373、SP0378、SP0379、SP0380、SP0381、SP0384、SP0396、SP0397、SP0398、SP0403、SP0404、SP0405、SP0406、SP0407、SP0409、SP0411、SP0412、SP0413、SP0107、SP0111、SP0115、SP0116、SP0155、SP0158、SP0163、SP0236、SP0252、SP0259、SP0264、SP0388和SP0399,或其中任意的功能变体。适当地,任何所述启动子的功能变体包含与参考合成肝特异性启动子具有至少70%同一性,更优选地与参考合成肝特异性启动子具有至少80%、90%、95%或99%同一性的序列。对应于这些启动子的序列和SEQ ID NO示出于实施例1中。
在本发明的一些实施方案中,合成肝特异性启动子包含选自以下的启动子:SP0109、SP0112、SP0113、SP0121、SP0124、SP0127、SP0127A1、SP0127V1、SP0127V2、SP0128、SP0131、SP0132、SP0133、SP0239、SP0240、SP0241、SP0242、SP0243、SP0244、SP0246、SP0247、SP0248、SP0249、SP0250、SP0251、SP0253、SP0254、SP0255、SP0256、SP0257、SP0258、SP0265、SP0266、SP0267、SP0268、SP0269、SP0270、SP0271、SP0272、SP0273、SP0368、SP0373、SP0378、SP0379、SP0380、SP0381、SP0384、SP0396、SP0397、SP0398、SP0403、SP0404、SP0405、SP0406、SP0407、SP0409、SP0411、SP0412、SP0413、SP0107、SP0111、SP0115、SP0116、SP0155、SP0158、SP0163、SP0236、SP0252、SP0259、SP0264、SP0388和SP0399,或其中任意的功能变体。适当地,任何所述启动子的功能变体包含与参考合成肝特异性启动子具有至少70%同一性,更优选地与参考合成肝特异性启动子具有至少80%、90%、95%或99%同一性的序列。对应于这些启动子的序列和SEQ ID NO示出于实施例1中。
在本发明的一些实施方案中,合成肝特异性启动子包含选自以下的启动子:SP0399、SP0405、SP0379、SP0381、SP0384、SP0412、SP0112、SP0239、SP0243、SP0413、SP0163、SP0382、SP0383、SP0241、SP0255、SP0249、SP0247、SP0265、SP0406、SP0373、SP0155、SP0380、SP0244、SP0111、SP0258、SP0268、SP0250、SP0242、SP0109、SP0259、SP0266、SP0158、SP0398、SP0253、SP0254、SP0257、SP0269、SP0409、SP0127A1、SP0270、SP0378、SP0403、SP0236、SP0248、SP0251、SP0411、SP0271、SP0132、SP0368、SP0246、SP0404和SP0116,或其中任意的功能变体。适当地,任何所述启动子的功能变体包含与参考合成肝特异性启动子具有至少70%同一性,更优选地与参考合成肝特异性启动子具有至少80%、90%、95%或99%同一性的序列。该组包含具有相对高水平活性的合成肝特异性启动子。
在本发明的一些实施方案中,合成肝特异性启动子包含选自以下的启动子:SP0399、SP0405、SP0379、SP0381、SP0384、SP0412、SP0112、SP0239、SP0243、SP0413、SP0163、SP0382、SP0383、SP0241、SP0255、SP0249、SP0247、SP0265、SP0406、SP0373、SP0155、SP0380、SP0244、SP0111、SP0258、SP0268、SP0250、SP0242、SP0109和SP0259,或其中任意的功能变体。适当地,任何所述启动子的功能变体包含与参考合成肝特异性启动子具有至少70%同一性,更优选地与参考合成肝特异性启动子具有至少80%、90%、95%或99%同一性的序列。该组包含具有高水平活性的合成肝特异性启动子。
在本发明的一些实施方案中,合成肝特异性启动子包含选自以下的启动子:SP0239、SP0244、SP0259、SP0265和SP0412,或其中任意的功能变体。该组包含合成肝特异性启动子的特别优选的具有高水平活性的子集。SP0412和SP0265(或其中任意的功能变体)由于其短的长度(分别为283和381个核苷酸)而是特别令人感兴趣的。与LP1启动子相比,已确定SP0239和SP0244的体内活性很高。
根据一些实施方案中,合成肝特异性启动子包含选自以下的CRE(或其中任意的功能变体)和启动子元件(或其中任意的功能变体)的组合:
-CRE0018、CRE0051、CRE0058、CRE0065、CRE0066、CRE0052(即来自SP0239的CRE和启动子元件);
-CRE0051 CRE0058、CRE0065、CRE0012、CRE0006(即来自SP0244的CRE和启动子元件CRE);
-CRE0047、CRE0001、CRE0006(即来自SP0265的CRE和启动子元件);
-CRE0051、CRE0058、CRE0065、CRE0066、CRE0052(即来自SP0265的CRE和启动子元件);以及
-CRE0051、CRE0042、CRE0059(即来自SP0412的CRE和启动子元件)。
与本文中公开的其他合成肝特异性启动子相比,已发现合成肝特异性启动子SP0109、SP0121、SP0113和SP0380在非肝(HEK293)细胞中的表达略高。因此,在其中非肝细胞中低表达水平特别重要的一些实施方案中,可不太期望启动子或其功能变体。在这样的情况下,在非肝(HEK293)细胞中显示出非常低表达的合成肝特异性启动子可以是特别优选的。
在本发明的一些实施方案中,合成肝特异性启动子的长度为700个或更少的核苷酸,例如600、500、450、400、350、300、250、200、150、100、75、70、68个或更少的核苷酸。
在另一方面中,本发明提供了包含CRE0006或其功能变体的合成肝特异性启动子。CRE0006可以在没有任何可操作连接的CRE的情况下提供(即合成肝特异性启动子基本上由CRE0006组成),或者其可以与可操作连接的CRE一起提供。出乎意料地发现,CRE0006本身是一种活性肝特异性启动子(即不存在任何可操作连接的调节序列;参见实施例3中SP0154的结果),以及当与一种或更多种肝特异性CRE(例如,如上所讨论)组合时提供高水平活性。因此,本发明还提供了由CRE0006或其功能变体组成的合成肝特异性启动子。本发明还提供了包含CRE0006或其功能变体的启动子元件,任选地其中启动子元件的长度为400个或更少的核苷酸,优选地为350个或更少的核苷酸,更优选地为300个或更少的核苷酸,更优选地为280个或更少的核苷酸。本发明还提供了由CRE0006或其功能变体组成的启动子元件。
在另一方面中,本发明提供了包含CRE0059或其功能变体的合成肝特异性启动子。出乎意料地发现CRE0059在与一种或更多种肝特异性CRE(例如如上所讨论)组合时提供高水平活性。本发明还提供了包含CRE0059或其功能变体的启动子元件,其中启动子元件的长度为350个或更少的核苷酸,更优选地为300个或更少的核苷酸,更优选地为250个或更少的核苷酸,更优选地为230个或更少的核苷酸。本发明还提供了由CRE0059或其功能变体组成的启动子元件。
在另一方面中,本发明提供了包含CRE0079或其功能变体的合成肝特异性启动子。出乎意料地发现CRE0079在与一种或更多种肝特异性CRE(例如如上所讨论)组合时提供高水平活性。本发明还提供了包含CRE0079或其功能变体的启动子元件,其中启动子元件的长度为200个或更少的核苷酸,优选地为150个或更少的核苷酸,更优选地为100个或更少的核苷酸。本发明还提供了由CRE0079或其功能变体组成的启动子元件。
在另一方面中,本发明提供了包含CRE0073或其功能变体的合成肝特异性启动子。出乎意料地发现CRE0073在与一种或更多种肝特异性CRE(例如如上所讨论)组合时提供高水平活性。本发明还提供了包含CRE0073或其功能变体的启动子元件,其中启动子元件的长度为300个或更少的核苷酸,更优选地为250个或更少的核苷酸,更优选地为200个或更少的核苷酸,更优选地为190个或更少的核苷酸。本发明还提供了由CRE0073或其功能变体组成的启动子元件。
在另一方面中,本发明提供了包含CRE0073.1或其功能变体的合成肝特异性启动子。出乎意料地发现CRE0073.1在与一种或更多种肝特异性CRE(例如如上所讨论)组合时提供高水平活性。本发明还提供了包含CRE0073.1或其功能变体的启动子元件,其中启动子元件的长度为180个或更少的核苷酸,更优选地为170个或更少的核苷酸。本发明还提供了由CRE0073.1或其功能变体组成的启动子元件。
在另一方面中,本发明提供了包含CRE0040或其功能变体的合成肝特异性启动子。出乎意料地发现CRE0040在与一种或更多种肝特异性CRE(例如如上所讨论)组合时提供高水平活性。本发明还提供了包含CRE0040或其功能变体的启动子元件,其中启动子元件的长度为400个或更少的核苷酸,更优选地为325个或更少的核苷酸,更优选地为275个或更少的核苷酸,更优选地为250个或更少的核苷酸。本发明还提供了由CRE0040或其功能变体组成的启动子元件。
在本发明的一些实施方案中,本发明的合成肝特异性CRM和/或合成肝特异性启动子不包含CR0077或其功能变体,或者CR0078或其功能变体。
在本发明的一些实施方案中,本发明的合成肝特异性CRM和/或合成肝特异性启动子不包含CRE0052或其功能变体。
在本发明的另一方面中,提供了选自以下的CRE:CRE0018、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068、CRE0074、CRE0001、CRE0005、CRE0012、CRE0047、CRE0048、CRE0056、CRE0062、CRE0077、CRE0078、CRE0083.1和CRE0089,或其中任意的功能变体。在一些优选实施方案中,提供了选自以下的CRE:CRE0018、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074,或其中任意的功能变体。在另一方面中,提供了包含任一种或更多种所述CRE或其功能变体的合成肝特异性CRM或合成肝特异性启动子。
在本发明的另一方面中,提供了包含与编码表达产物的序列(适当地为基因,例如转基因)可操作连接的本发明的合成肝特异性启动子的表达盒。
在另一方面中,提供了包含根据本发明的合成肝特异性CRM、合成肝特异性启动子或表达盒的载体。在一些实施方案中,载体是表达载体。在一些实施方案中,载体是病毒载体。在一些实施方案中,载体是基因治疗载体,适当地为AAV载体、腺病毒载体、逆转录病毒载体或慢病毒载体。AAV载体是特别令人感兴趣的。
在另一方面中,提供了包含根据本发明的载体(适当地为病毒载体)的病毒体(病毒颗粒)。
在另一方面中,提供了包含根据本发明的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体或病毒体的药物组合物。
在另一方面中,提供了根据本发明的合成肝特异性调节性CRM、合成肝特异性启动子、表达盒、载体、病毒体或药物组合物,其用于治疗,即预防或治疗医学病症或疾病。适当地,与异常基因表达(任选地,肝中的异常基因表达)相关的病症或疾病。适当地,该用途是用于基因治疗,优选地用于治疗涉及异常基因表达的疾病。适当地,基因治疗涉及在肝中表达治疗性表达产物。
在另一方面中,提供了包含如本文中所述的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体或病毒体的细胞。在一些实施方案中,细胞是真核细胞,任选哺乳动物细胞,任选人细胞。适当地,细胞可以是肝细胞,任选地其中细胞是人肝细胞。合成肝特异性CRM、合成肝特异性启动子、表达盒可以在载体中或可以在细胞的基因组中。
在另一方面中,提供了如本文中所述的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体、病毒体或药物组合物,其用于制造用于治疗如本文中所讨论的医学病症或疾病的药物组合物。
在另一方面中,提供了用于产生表达产物的方法,所述方法包括在肝细胞中提供本发明的合成肝特异性表达盒以及表达存在于合成肝特异性表达盒中的基因。该方法可以是体外或离体的,或者其可以是体内的。在一些实施方案中,所述方法是生物加工方法。
在另一方面中,提供了在肝细胞中表达治疗性转基因的方法,所述方法包括将如本文中所述的合成肝特异性表达盒、载体或病毒体引入到肝细胞中。
在另一方面中,提供了治疗有此需要的对象,优选人的方法,所述方法包括:
-向对象施用如本文中所述的表达盒、载体、病毒体或药物组合物,其包含编码与根据本发明的启动子可操作连接的治疗性产物的序列;以及
-在所述对象的肝中表达治疗量的治疗性产物。
在一些实施方案中,所述方法包括:
-将如本文中所述的包含编码治疗性产物的基因的表达盒、载体、病毒体或药物组合物引入到对象的肝中;以及
-在所述对象的肝中表达治疗量的治疗性产物。
适当地,所述方法包括向对象施用如本文中所述的载体、病毒体或药物组合物。在一些优选实施方案中,载体是病毒基因治疗载体,优选AAV载体。
附图简述
-图1示出了具有所示CRE增强子元件的根据本发明的合成肝特异性启动子的示意图。
-图2示出了相对于由已知肝特异性启动子LP1和遍在CMV-IE和CBA启动子驱动的表达水平,在肝来源细胞系Huh7中由多种合成肝特异性启动子驱动的萤光素酶报道蛋白的表达水平的图。如本文中使用的CBA(鸡β肌动蛋白)启动子包含CMV立即早期增强子+鸡β肌动蛋白近端启动子+内含子。
-图3示出了具有所示CRE增强子元件的根据本发明的另一些合成启动子的示意图。这些启动子对应于图1的启动子,但添加了“V1”(LVR_CRE0077_V1)、“V2”(或LVR_CRE0078_V2)和“A1”(或LVR_CRE0051_AMBP)CRE增强子。
-图4a示出了在Huh7细胞中由LVR_127合成肝特异性启动子(即单独的LVR_127),以及在LVR_127启动子的紧挨上游具有添加的A1、V1和V2CRE增强子元件的变体驱动的萤光素酶报道蛋白的表达水平的图。同样,示出了与LP1、CMV-IE和CBA启动子的比较。
-图4b示出了在Huh7细胞中由LVR_131合成肝特异性启动子(即单独的LVR_131),以及在LVR_131启动子的紧挨上游具有添加的A1、V1和V2CRE增强子元件的变体驱动的萤光素酶报道蛋白的表达水平的图。同样,示出了与LP1、CMV-IE和CBA启动子的比较。
-图4c示出了在Huh7细胞中由LVR_132合成肝特异性启动子(即单独的LVR_132),以及在LVR_132启动子的紧挨上游具有添加的A1、V1和V2CRE增强子元件的变体驱动的萤光素酶报道蛋白的表达水平的图。同样,示出了与LP1、CMV-IE和CBA启动子的比较。
-图4d示出了在Huh7细胞中由LVR_133合成肝特异性启动子(即单独的LVR_133),以及在LVR_133启动子的紧挨上游具有添加的A1、V1和V2CRE增强子元件的变体驱动的萤光素酶报道蛋白的表达水平的图。同样,示出了与LP1、CMV-IE和CBA启动子的比较。
-图5示出了由如关于图4a至4d所示出的LVR_127、LVR_131、LVR_132和LVR_133合成肝特异性启动子及其变体驱动的在HEK-293细胞(即非肝来源细胞)中的萤光素酶报道蛋白的表达水平的图。同样,示出了与LP1、CMV-IE和CBA启动子的比较。
-图6示出了由如关于图4a至4d所示出的LVR_127、LVR_131、LVR_132和LVR_133合成肝特异性启动子及其变体驱动的在HeLa细胞(即非肝来源细胞)中的萤光素酶报道蛋白的表达水平的图。同样,示出了与LP1、CMV-IE和CBA启动子的比较。
-图7A、图7B和图7C示出了具有所示CRE增强子元件的根据本发明一些实施方案的合成肝特异性启动子的示意图。
-图8A、图9A、图10A和图11A示出了相对于TBG活性归一化的根据本发明一些实施方案的启动子在Huh7细胞中的平均活性。相对活性为100等于TBG的活性。误差棒是平均值的标准误差。如果不存在误差棒,则结果来自单个实验。在图8A、图9A和图10A中,启动子已经按照相对活性排列,其中具有最高相对活性的启动子在最前。图10A中的启动子是如实施例3中限定的“组2”的成员。图10A中的一些启动子也是如实施例3中限定的“组1”的成员。图8A和图9A中的启动子是如实施例3中限定的“组1”的成员。
-图8B、图9B、图10B和图11C分别示出了图8A、图9A、图10A和图11A中呈现的启动子在HEK293中的平均表达。示出了每个启动子的不同实验的平均相对活性。如果不存在误差棒,则结果来自单个实验。已经测试并确定了图8A、图9A、图10A和图11A中呈现的大多数启动子(但不是所有启动子)的特异性。
-图11B示出了仅包含启动子元件CRE0006(SP0154)和CRE0040(SP0235)的两个启动子的平均活性。
-图12A示出了肝特异性启动子(组“所有(ALL)”)、包含至少两种“核心(Core)”CRE的启动子(“组1”)和包含与选自CRE0059或CRE0006的启动子元件可操作连接的至少一种“核心”CRE的启动子(“组2”)的大合并物(large pool)的平均相对活性。“组1”(n=49)的平均相对活性比组“所有”(n=217)的平均相对活性高约一倍。另外,“组2”(n=20)的平均相对活性比组“所有”(n=217)的平均相对活性高约两倍。误差棒是平均值的标准误差。
-图12B示出了组“所有”、“组1”和“组2”中的每一个中的每个启动子的相对活性除以其尺寸(以碱基对计)的平均值。与组“所有”相比,“组1”和“组2”的性能提高持续存在,即使考虑到启动子的尺寸也是如此。这表明与组“所有”相比“组1”和“组2”的优异性能并不是由于组之间启动子尺寸的差异引起。
-图13A示出了与具有特定数目的CRE(任何CRE)的启动子的平均活性相比,具有特定数目的核心CRE的启动子的平均活性。1、2、3或4种核心CRE元件的存在与和具有1、2、3或4种任何CRE元件的启动子相比提高的活性相关。核心CRE由以下组成:
CRE0018(SEQ ID NO:1),CRE0042(SEQ ID NO:2),CRE0051(SEQ ID NO:3),CRE0058(SEQ ID NO:4),CRE0065(SEQ ID NO:5),CRE0066(SEQ ID NO:7),CRE0068(SEQ IDNO:10)和CRE0074(SEQ ID NO:11)。
-图13B示出了与具有特定数目的CRE(任何CRE)的启动子的相对于尺寸的平均活性相比,具有特定数目的核心CRE的启动子的相对于尺寸(以碱基对计)的平均活性。1、2、3或4种核心CRE元件的存在与和具有1、2、3或4种任何CRE元件的启动子相比的相对于尺寸(bp)的活性提高相关。这表明,与包含指定数目的任何CRE的启动子相比,包含指定数目的核心CRE的启动子的更高活性不是由于启动子尺寸的差异引起。
-图14示出了由不同启动子驱动的在小鼠中平均体内萤光素酶表达。表达水平以平均生物发光强度总通量(以光子/秒计)表示。误差棒是平均值的标准误差。当动物仅注射盐水(n=10)时,未检测到萤光素酶生物发光。当向动物注射包含与LP1启动子可操作连接的萤光素酶的构建体时(n=9),检测到萤光素酶生物发光。为了测试一些肝特异性启动子的活性,向动物注射包含与SP0244启动子(n=8)和SP0239启动子(n=10)可操作连接的萤光素酶的等效构建体。启动子SP0244和SP0239显示出比对照LP1更高的萤光素酶表达。
-图15A示出了与来自组“所有”的具有任何两种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051和CRE0058的组合的启动子的平均相对活性。
-图15B示出了与来自组“所有”的具有任何两种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051和CRE0058的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明,与包含任何两种肝特异性CRE的启动子相比,包含CRE CRE0051和CRE0058的启动子的优异性能不是由于启动子尺寸的差异引起。
-图16A示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0065的组合的启动子的平均相对活性。
-图16B示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0065的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明,与包含任何三种肝特异性CRE的启动子相比,包含CRECRE0051、CRE0058和CRE0065的启动子的优异性能不是由于启动子尺寸的差异引起。
-图17A示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0066的组合的启动子的平均相对活性。
-图17B示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0066的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明,与包含任何三种肝特异性CRE的启动子相比,包含CRECRE0051、CRE0058和CRE0066的启动子的优异性能不是由于启动子尺寸的差异引起。
-图18A示出了与来自组“所有”的具有任何四种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058、CRE0065和CRE0066的组合的启动子的平均相对活性。
-图18B示出了与来自组“所有”的具有任何四种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058、CRE0065和CRE0066的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明与包含任何四种肝特异性CRE的启动子相比,包含CRE CRE0051、CRE0058、CRE0065和CRE0066的启动子的优异性能不是由于启动子尺寸的差异引起。
-图19A示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0065和CRE0066的组合的启动子的平均相对活性。
-图19B示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0065和CRE0066的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明,与包含任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0065和CRE0066的启动子的优异性能不是由于启动子尺寸的差异引起。
-图20A示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0074的组合的启动子的平均相对活性。
-图20B示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0074的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明,与包含任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058和CRE0074的启动子的优异性能不是由于启动子尺寸的差异引起。
-图21A示出了与来自组“所有”的具有任何四种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058、CRE0065和CRE0074的组合的启动子的平均相对活性。
-图21B示出了与来自组“所有”的具有任何四种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058、CRE0065和CRE0074的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明与包含任何四种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0051、CRE0058、CRE0065和CRE0074的启动子的优异性能不是由于启动子尺寸的差异引起。
-图22A示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0058、CRE0065和CRE0066的组合的启动子的平均相对活性。
-图22B示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0058、CRE0065和CRE0066的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明与包含任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0058、CRE0065和CRE0066的启动子的优异性能不是由于启动子尺寸的差异引起。
-图23A示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0058、CRE0065和CRE0074的组合的启动子的平均相对活性。
-图23B示出了与来自组“所有”的具有任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0058、CRE0065和CRE0074的组合的启动子的相对于尺寸(以碱基对计)的平均相对活性。这表明,与包含任何三种肝特异性顺式调节元件的启动子相比,包含顺式调节元件CRE0058、CRE0065和CRE0074的启动子的优异性能不是由于启动子尺寸的差异引起。
-图24A示出了HNF1A的PWM,以及图24B示出了HNF1B的PWM。
发明详述
CRE及其功能变体:
本文中公开了可用于构建肝特异性启动子的多种CRE。这些CRE通常来源于基因组启动子和增强子序列,但它们在本文中在与其天然基因组环境完全不同的环境中使用。通常来说,CRE构成更大的基因组调节结构域的一小部分,其控制与其通常相关的基因的表达。出乎意料地发现,这些CRE(其中许多非常小)可从其正常环境中分离,并在用于构建多种合成启动子时保持肝特异性调节活性。这是出乎意料的,因为从基因组中复杂且“三维”天然环境中取出调节序列通常会导致活性的显著损失,因此没有理由期望给定的CRE一旦从其天然环境中取出就保持观察到的活性水平。已经测试了这些CRE的许多组合,并且发现当与最小和近端启动子组合时,在增强肝特异性启动子活性方面高度有效。应该注意的是,本发明的CRE的序列可以被改变而不会导致活性的显著损失。因此,下文讨论的CRE的功能变体可通过修饰CRE的序列来制备,前提是避免了对CRE活性显著有害的修饰。鉴于本公开内容中提供的信息,修饰CRE以提供功能变体是明确的。此外,本公开内容提供了用于简单地评估任何给定CRE变体的功能的方法。每种CRE的功能变体于下文讨论。
根据本发明的某些CRE的相对小尺寸是有利的,因为其允许CRE,更具体地包含所述CRE的启动子在载体中提供的同时占据载体的最少量的有效载荷。当CRE用于容量有限的载体(例如基于AAV的载体)时,这一点特别重要。
CRE0018、CRE0051、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074(或其功能变体)在本发明中是特别令人感兴趣的,因为已表明它们在多种组合中的存在与高度活性肝特异性启动子始终相关。因此,包含这些元件中的两种的组合具有特别的相关性。此外,已表明这些CRE之一与启动子元件CRE0006和CRE0059的组合与高度活性肝特异性启动子始终相关。不希望受理论束缚,显示这些CRE在增强肝特异性启动子活性方面特别有效,并且在许多情况下,当与CRM/启动子组合时它们可以协同作用。
已发现CRE0001、CRE0005、CRE0012、CRE0047、CRE0048、CRE0056、CRE0062、CRE0077、CRE0078、CRE0083.1和CRE0089(或其功能变体)的存在也与高肝特异性活性相关,但程度较低。因此,在一些情况下,优选存在这些CRE中的一种或更多种。不希望受理论束缚,显示这些CRE在增强肝特异性启动子活性方面有一些效果,并且当在CRM/启动子中与上述CRE中的一种或更多种组合时,它们可以协同作用。
如下文不再相当详细地使用,本发明的CRE包含某些肝特异性TFBS。通常期望在CRE的功能变体中,这些肝特异性TFBS保持功能。技术人员很清楚TFBS序列可以变化但保持功能。有鉴于此,TFBS的序列通常由来自其中通常存在一定程度的变异的共有序列来举例说明。有关TFBS中发生的变异的进一步信息可使用位置权重矩阵(positional weightmatrix,PWM)来举例说明,所述位置权重矩阵表示通常在共有序列中的给定位置存在的给定核苷酸的频率。TF共有序列和相关位置权重矩阵的细节可见于例如Jaspar或Transfac数据库http://jaspar.genereg.net/和http://gene-regulation.com/pub/databases.html中)。该信息允许技术人员以保持CRE功能并且在一些情况下甚至提高CRE功能的方式修饰CRE的任何给定TFBS中的序列。举例来说,如果我们考虑存在于CRE0079中的HNF1的TFBS,则如下所示。CRE0079中HNF1的TFBS具有序列GTTAATTTATAAC(SEQ ID NO:98)。HNF1的PMW示于图24中(HNF1具有两个亚家族成员,HNF1A和HNF1B,具有非常相似的TFBS PWM;HNF1A和HNF1B同种型二者的PWM分别示于图24A和24B中)。有鉴于此,技术人员对如何可以在保持结合所期望TF的能力的同时修饰HNF1的TFBS有充分的指导;例如,Jaspar系统将基于推定的TFBS与给定PWM的相似性对其进行评分。此外,可针对来自JASPAR数据库的所有PWM扫描CRE,以鉴定/分析所有TFBS。技术人员当然可以在文献中找到另外的指导,并且此外,可使用常规实验来确定与任何变体CRE中推定的TFBS的TF结合。虽然在该实例中已经讨论了HNF1,但是技术人员可以对本文中提及的其他TF和TFBS做同样的事情。将明显的是,可以在保持功能的同时在CRE中进行显著的序列修饰,即使在CRE中的TFBS内也是如此。
CRE0018及其功能变体:
CRE0018具有如SEQ ID NO:1中所示出的序列。
CRE0018的功能变体是具有与CRE0018不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(transcription factor,TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE基本上无功能。
在一些实施方案中,CRE0018的功能变体可被视为当在CRM或启动子中替换地替代CRE0018时,基本上保持其活性的CRE。例如,包含替换地替代CRE0018的CRE0018功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0018的参考启动子相比)。例如,将启动子SP0239视为一个实例,SP0239中的CRE0018可以被CRE0018的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,CRE0018的功能变体包含与CRE0018相同的肝特异性转录因子(TF)的转录因子结合位点(transcription factor binding site,TFBS)。CRE0018中存在的肝特异性TFBS按其中它们存在的顺序列出,是:IRF、NF1、HNF3、HBLF、RXRa、EF-C、NF1和c/EBP。CRE0018的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0018中存在的相同的顺序(即以IRF、NF1、HNF3、HBLF、RXRa、EF-C、NF1,并随后是c/EBP的顺序)存在。当CRE与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(transcription start site,TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0018的功能变体包含以下TFBS序列:
CTTTCACTTTC(IRF),TCGCCAA(NF1),TGTGTAAACA(HNF3),TGTAAACAATA(HBLF),CTGAACCTTTACCC(RXRa),GTTGCCCGGCAAC(EF-C),CAGGTCTGTGCCAAG(NF1),TGCCAAGTGTTTG(c/EBP)、
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表9,对于TFBS SEQ ID NO)。这些可以以与CRE0018相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0018的功能变体包含以下序列:
CTTTCACTTTCTCGCCAA-Na-TGTGTAAACAATA-Nb-CTGAACCTTTACCC-Nc-GTTGCCCGGCAAC-Nd-CAGGTCTGTGCCAAGTGTTTG(SEQ ID NO:268)
,或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na、Nb、Nc和Nd表示任选的间隔子序列。当存在时,Na任选地长度为10至20个核苷酸,优选地为13至17个核苷酸,并且更优选地为15个核苷酸。当存在时,Nb任选地长度为1至10个核苷酸,优选地为1至5个核苷酸,更优选地为1个核苷酸。当存在时,Nc任选地长度为1至10个核苷酸,优选地为1至5个核苷酸,并且更优选地为1个核苷酸。当存在时,Nd适当地长度为1至10个核苷酸,优选地长度为2至8个核苷酸,并且更优选地长度为3个核苷酸。
在一些实施方案中,CRE0018的功能变体适当地包含与SEQ ID NO:1具有至少70%同一性,更优选地与SEQ ID NO:1具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0018的功能变体适当地包含在严格条件下与SEQ ID NO:1杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID NO:1或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:1或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:1或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0018或其功能变体,或者由CRE0018或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或者103个或更少的核苷酸。
CRE0042及其功能变体:
CRE0042具有如SEQ ID NO:2中所示出的序列。
CRE0042的功能变体是具有与CRE0042不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE基本上无功能。
在一些实施方案中,CRE0042的功能变体可被视为当在CRM或启动子中替换地替代CRE0042时,基本上保持其活性的CRE。例如,包含替换地替代CRE0042的CRE0042功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0042的参考启动子相比)。例如,将启动子SP0239视为一个实例,SP0380中的CRE0042可以被CRE0042的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0042的功能变体包含与CRE0042相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0042中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-3、C/EBP、HNF-4和C/EBP。CRE0042的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0042中存在的相同的顺序(即以HNF-3、C/EBP、HNF-4,并随后C/EBP的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0042的功能变体包含以下TFBS序列:
GTTCAAACATG(HNF-3),CTAATACTCTG(C/EBP),TGCAAGGGTCAT(HNF-4),和TTACTCAACA(C/EBP)、
和与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表10,对于SEQ ID NO)。这些可以以与CRE0042相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0042的功能变体包含以下序列:
GTTCAAACATG-Na-CTAATACTCTG-Nb-TGCAAGGGTCAT-Nc-TTACTCAACA(SEQ ID NO:269)
,或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na、Nb和Nc表示任选的间隔子序列。当存在时,Na任选地长度为1至10个核苷酸,优选地为1至5个核苷酸,并且更优选地为2个核苷酸。当存在时,Nb任选地长度为1至10个核苷酸,优选地为2至6个核苷酸,并且更优选地为4个核苷酸。当存在时,Nc任选地长度为8至23个核苷酸,优选地为10至20个核苷酸,并且更优选地为15个核苷酸。
在一些实施方案中,CRE0042的功能变体适当地包含与SEQ ID NO:2具有至少70%同一性,更优选地与SEQ ID NO:2具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0042的功能变体适当地包含在严格条件下与SEQ ID NO:2杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由CRE0042或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:2或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:2或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0042或其功能变体,或者由CRE0042或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸、或者80个或更少的核苷酸。
CRE0051及其功能变体:
CRE0051(也称为A1或αmic/bik)具有如SEQ ID NO:3中所示出的序列。
CRE0051的功能变体是具有与CRE0051不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE基本上无功能。
在一些实施方案中,CRE0051的功能变体可被视为当在CRM或启动子中替换地替代CRE0051时,基本上保持其活性的CRE。例如,包含替换地替代CRE0051的CRE0051功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%。例如,将启动子SP0373视为一个实例,SP0239中的CRE0051可以被CRE0051的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,CRE0051的功能变体包含与CRE0051相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0051中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF1、HNF4、HNF3、HNF1和HNF3。CRE0051的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0051中存在的相同的顺序(即以HNF1、HNF4、HNF3、HNF1,然后HNF3的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0051的功能变体包含以下TFBS序列:
GTTAATTTTTAAA(HNF1),GTGGCCCTTGG(HNF4),TGTTTGC(HNF3),TGGTTAATAATCTCA(HNF1)然后ACAAACA(HNF3),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表11,对于TFBS SEQ ID NO)。这些可以以与CRE0051相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0051的功能变体包含以下序列:
GTTAATTTTTAAA-Na-GTGGCCCTTGG-Nb-TGTTTGC-Nc-TGGTTAATAATCTCA-Nd-ACAAACA(SEQ ID NO:270)
,或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na、Nb、Nc和Nd表示任选的间隔子序列。当存在时,Na任选地长度为10至26个核苷酸,优选地为14至22个核苷酸,并且更优选地为18个核苷酸。当存在时,Nb任选地长度为8至22个核苷酸,优选地为12至20个核苷酸,更优选地为16个核苷酸。当存在时,Nc任选地长度为1至10个核苷酸,优选地为1至5个核苷酸,并且更优选地为2个核苷酸。当存在时,Nd适当地长度为1至13个核苷酸,优选地长度为2至9个核苷酸,并且更优选地长度为5个核苷酸。
在一些实施方案中,CRE0051的功能变体适当地包含与SEQ ID NO:3具有至少70%同一性,更优选地与SEQ ID NO:3具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,SEQ ID NO:3的功能变体适当地包含在严格条件下与SEQ ID NO:3杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID No:3或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:3或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:3或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0051或其功能变体,或者由CRE0051或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或者100个或更少的核苷酸。
CRE0058及其功能变体:
CRE0058具有如SEQ ID NO:4中所示出的序列。
CRE0058的功能变体是具有与CRE0058不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0058的功能变体可被视为当在CRM或启动子中替换地替代CRE0058时,基本上保持其活性的CRE。例如,包含替换地替代CRE0058的CRE0058功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0058的参考启动子相比)。例如,将启动子SP0373视为一个实例,SP0373中的CRE0058可以被CRE0058的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0058(SEQ ID NO:4)的功能变体包含与CRE0058相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0058中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF4和c/EBP。CRE0058的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0058中存在的相同的顺序(即以HNF4然后c/EBP的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0058的功能变体包含以下TFBS序列:
CGCCCTTTGGACC(HNF4)和GACCTTTTGCAATCCTGG(c/EBP),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表12,对于TFBS SEQ ID NO)。这些可以以与CRE0058相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0058的功能变体包含以下序列:GCGCCCTTTGGACCTTTTGCAATCCTGG(SEQ ID NO:271),或者与其具有至少70%、80%、90%、95%或99%同一性的序列。
在一些实施方案中,CRE0058的功能变体适当地包含与SEQ ID NO:4具有至少70%同一性,更优选地与SEQ ID NO:4具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0058的功能变体适当地包含在严格条件下与SEQ ID NO:4杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID NO:4或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:4或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:4或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0058或其功能变体,或者由CRE0058或其功能变体组成的CRE,其长度为120个或更少的核苷酸、80个或更少的核苷酸、60个或更少的核苷酸、或者40个或更少的核苷酸。
CRE0065及其功能变体:
CRE0065(也称为LVR_CRE0065_APOA1)具有如SEQ ID NO:5中所示出的序列。
CRE0065的功能变体是具有与CRE0065不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0065的功能变体可被视为当在CRM或启动子中替换地替代CRE0065时,基本上保持其活性的CRE。例如,包含替换地替代CRE0065的CRE0065功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0065的参考启动子相比)。例如,将启动子SP0239视为一个实例,SP0239中的CRE0065可以被CRE0065的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0065的功能变体包含与CRE0065相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0065中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:RXRα、HNF3和HNF3。CRE0065的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0065中存在的相同的顺序(即以RXRα、HNF3然后HNF3的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0065的功能变体包含以下TFBS序列:
ACTGAACCCTTGACCCCTGCCCT(RXRα),CTGTTTGCCC(HNF3),和CTATTTGCCC(HNF3)
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表13,对于TFBS SEQ ID NO)。这些可以以与CRE0065相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0065的功能变体包含以下序列:
ACTGAACCCTTGACCCCT-Na-CTGTTTGCCC-Nb-TATTTGCCC(SEQ ID NO:272),或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na和Nb表示任选的间隔子序列。当存在时,Na任选地长度为14至30个核苷酸,优选地为18至26个核苷酸,并且更优选地为22个核苷酸。当存在时,Nb任选地长度为1至10个核苷酸,优选地为2至6个核苷酸,并且更优选地为4个核苷酸。
在一些实施方案中,CRE0065的功能变体适当地包含与SEQ ID NO:5具有至少70%同一性,更优选地与SEQ ID NO:5具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0065的功能变体适当地包含在严格条件下与SEQ ID NO:5杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID NO:5或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:5或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:5或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0065或其功能变体,或者由CRE0065或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、90个或更少的核苷酸,或者72个或更少的核苷酸。
CRE0065.1及其功能变体:
CRE0065.1(也称为LVR_CRE0065_APOA1_v1)具有如SEQ ID NO:6中示出的序列。CRE0065.1包含以其整体的CRE0065,以及在3’端的另外34个核苷酸。CRE0065.1可以看作是CRE0065的更长的功能等效物。
CRE0065.1的功能变体是具有与CRE0065.1不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0065.1的功能变体可被视为当在CRM或启动子中替换地替代CRE0065.1时,基本上保持其活性的CRE。例如,包含替换地替代CRE0065.1的CRE0065.1功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0065.1的参考启动子相比)。例如,将启动子SP0127A1视为一个实例,SP0127A1中的CRE0065.1可以被CRE0065.1的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0065.1的功能变体包含与CRE0065.1相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0065.1中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:RXRα、HNF3、HNF3和HNF4(即其与CRE0065相比时,比较出了另外的HNF4TFBS)。CRE0065.1的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0065.1中存在的相同的顺序(即以RXRα、HNF3、HNF3随后HNF4的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0065.1的功能变体包含以下TFBS序列:
ACTGAACCCTTGACCCCTGCCCT(RXRα),CTGTTTGCCC(HNF3),CTATTTGCCC(HNF3)和TGATCCTTGAACTCT(HNF4),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表14,对于TFBS SEQ ID NO)。这些可以以与CRE0065.1相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0065.1的功能变体包含以下序列:
ACTGAACCCTTGACCCCT-Na-CTGTTTGCCC-Nb-TATTTGCCC-Nc-TGATCCTTGAACTCT(SEQID NO:273)
,或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na、Nb和Nc表示任选的间隔子序列。当存在时,Na任选地长度为14至30个核苷酸,优选地为18至26个核苷酸,并且更优选地为22个核苷酸。当存在时,Nb任选地长度为1至10个核苷酸,优选地为2至6个核苷酸,并且更优选地为4个核苷酸。当存在时,Nc任选地长度为9至25个核苷酸,优选地为13至21个核苷酸,并且更优选地为17个核苷酸。
在一些实施方案中,CRE0065.1的功能变体适当地包含与SEQ ID NO:6具有至少70%同一性,更优选地与SEQ ID NO:6具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0065.1的功能变体适当地包含在严格条件下与SEQ ID NO:6杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由CRE0065.1或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:6或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:6或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0065.1或其功能变体,或者由CRE0065.1或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或者106个或更少的核苷酸。
CRE0066及其功能变体:
CRE0066(也称为Enh_18XS)具有如SEQ ID NO:7中所示出的序列。
CRE0066的功能变体是具有与CRE0066不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0066的功能变体可被视为当在CRM或启动子中替换地替代CRE0066时,基本上保持其活性的CRE。例如,包含替换地替代CRE0066的CRE0066功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0066的参考启动子相比)。例如,将启动子SP0239视为一个实例,SP0239中的CRE0066可以被CRE0066的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0066的功能变体包含与CRE0066相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0066中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF4G和FOS::JUN。CRE0066的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0066中存在的相同的顺序(即以HNF4G随后FOS::JUN的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0066的功能变体包含以下TFBS序列:
GCAGGGCAAAGTGCA(HNF4G)和GATGACTCAG(FOS::JUN)
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表15,对于SEQ ID NO)。这些可以以与CRE0066相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0066(SEQ ID NO:7)的功能变体包含以下序列:
GCAGGGCAAAGTGCA-Na-GATGACTCAG(SEQ ID NO:274),或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na表示任选的间隔子序列。当存在时,Na任选地长度为10至28个核苷酸,优选地为14至24个核苷酸,并且更优选地为19个核苷酸。
在一些实施方案中,CRE0066的功能变体适当地包含与SEQ ID NO:7具有至少70%同一性,更优选地与SEQ ID NO:7具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0066的功能变体适当地包含在严格条件下与SEQ ID NO:7杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由CRE0066或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:7或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:7或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0066或其功能变体,或者由CRE0066或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸,或者87个或更少的核苷酸。
CRE0066.2及其功能变体:
CRE0066.2(也称为LVR_CRE0066_v2或Enh_18S)具有SEQ ID NO:8中示出的序列。CRE0066.2包含以其整体的CRE0066,以及在3’端存在另外的81个核苷酸。CRE0066.2可被视为CRE0066的更长的功能变体。
CRE0066.2的功能变体是具有与CRE0066.2不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0066.2的功能变体可被视为当在CRM或启动子中替换地替代CRE0066.2时,基本上保持其活性的CRE。例如,包含替换地替代CRE0066.2的CRE0066.2功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0066.2的参考启动子相比)。例如,将启动子SP0109视为一个实例,SP0109中的CRE0066.2可以被CRE0066.2的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
CRE0066.2包含与CRE0066的肝特异性TFBS相同的TFBS,并因此相同的考虑适用于对于相关TFBS的优选存在和位置。
在一些实施方案中,CRE0066.2的功能变体适当地包含与SEQ ID NO:8具有至少70%同一性,更优选地与SEQ ID NO:8具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0066.2的功能变体适当地包含在严格条件下与SEQ ID NO:8杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID NO:8或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:8或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:8或其功能变体的序列的单链核酸也落入本发明的范围内。
CRE0066.1及其功能变体:
CRE0066.1(也称为LVR_CRE0066_v1或Enh_18)具有如SEQ ID NO:9中示出的序列。CRE0066.1包含以其整体的CRE0066和CRE0066.2二者,以及当与CRE0066相比时在3’端存在另外的154个核苷酸。CRE0066.1可被视为CRE0066和CRE0066.2各自更长的功能变体。
CRE0066.1的功能变体是具有与CRE0066.1不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0066.1的功能变体可被视为当在CRM或启动子中替换地替代CRE0066.1时,基本上保持其活性的CRE。例如,包含替换地替代CRE0066.1的CRE0066.1功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0066.1的参考启动子相比)。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
CRE0066.1包含与CRE0066的肝特异性TFBS相同的TFBS,并因此相同的考虑适用于对于相关TFBS的优选存在和位置。
在一些实施方案中,CRE0066.1的功能变体适当地包含与SEQ ID NO:9具有至少70%同一性,更优选地与SEQ ID NO:9具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0066.1的功能变体适当地包含在严格条件下与SEQ ID NO:9杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID NO:9或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:9或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:9或其功能变体的序列的单链核酸也落入本发明的范围内。
CRE0068及其功能变体:
CRE0068具有如SEQ ID NO:10中所示出的序列。
CRE0068的功能变体是具有与CRE0068不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0068的功能变体可被视为当在CRM或启动子中替换地替代CRE0068时,基本上保持其活性的CRE。例如,包含替换地替代CRE0068的CRE0068功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0068的参考启动子相比)。例如,将启动子SP0379视为一个实例,SP0379中的CRE0068可以被CRE0068的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0068的功能变体包含与CRE0068相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0068中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-4、HNF-1/HNF-3和SP1。CRE0068的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0068中存在的相同的顺序(即以以上顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0068的功能变体包含以下TFBS序列:
TTCCTGCTCTTTGTCCC(HNF4),AGACTAATATTTGCC(HNF-1/HNF-3)和ATGGGGGAGGGACAG(SP1)
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表16,对于TFBS SEQ ID NO)。这些可以以与CRE0068相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0068的功能变体包含以下序列:
TTCCTGCTCTTTGTCCC-Na-AGACTAATATTTGCC-Nb-ATGGGGGAGGGACAG(SEQ ID NO:275),
或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na和Nb表示任选的间隔子序列。当存在时,Na任选地长度为4至20个核苷酸,优选地为8至16个核苷酸,并且更优选地为12个核苷酸。当存在时,Nb任选地长度为10至30个核苷酸,优选地为15至25个核苷酸,并且更优选地为20个核苷酸。
在一些实施方案中,CRE0068的功能变体适当地包含与SEQ ID NO:10具有至少70%同一性,更优选地与SEQ ID NO:10具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0068的功能变体适当地包含在严格条件下与SEQ ID NO:10杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由CRE0068或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:10或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:10或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0068或其功能变体,或者由CRE0068或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸,或者100个或更少的核苷酸。
CRE0074及其功能变体:
CRE0074(也称为SEPP1)具有如SEQ ID NO:11中所示出的序列。
CRE0074的功能变体是具有与CRE0074不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0068的功能变体可被视为当在CRM或启动子中替换地替代CRE0074时,基本上保持其活性的CRE。例如,包含替换地替代CRE0074的CRE0074功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0074的参考启动子相比)。例如,将启动子SP0379视为一个实例,SP0268中的CRE0074可以被CRE0074的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0074的功能变体包含与CRE0074相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0074中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF4和FoxO1a。CRE0074的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0074中存在的相同的顺序(即以HNF4然后FoxO1a的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0074的功能变体包含以下TFBS序列:
AACATTGAACTTTGGACTA(HNF4)和GTAAACAA(FoxO1a),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表17,对于TFBS SEQ ID NO)。这些可以以与CRE0074相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0074的功能变体包含以下序列:AACATTGAACTTTGGACTA-Na-GTAAACAA(SEQ ID NO:276),或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na表示任选的间隔子序列。当存在时,Na任选地长度为7至23个核苷酸,优选地为11至19个核苷酸,并且更优选地为15个核苷酸。
在一些实施方案中,CRE0074的功能变体适当地包含与SEQ ID NO:11具有至少70%同一性,更优选地与SEQ ID NO:11具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,SEQ ID NO:11的功能变体适当地包含在严格条件下与SEQ ID NO:11杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID No:11或其功能变体组成。
应注意,CRE0074或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:11或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:11或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0074或其功能变体,或者由CRE0074或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、100个或更少的核苷酸,80个或更少的核苷酸,或者61个或更少的核苷酸。
CRE0001及其功能变体:
CRE0001具有如SEQ ID NO:12中所示出的序列。
CRE0001的功能变体是具有与CRE0001不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0001的功能变体可被视为当在CRM或启动子中替换地替代CRE0001时,基本上保持其活性的CRE。例如,包含替换地替代CRE0001的CRE0001功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0001的参考启动子相比)。例如,将启动子SP0250视为一个实例,SP0250中的CRE0001可以被CRE0001的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0001的功能变体包含与CRE0001相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0001中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-4、HNF-1、HNF-3和HNF-4。CRE0018的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0018中存在的相同的顺序(即以以上所示出的顺序)存在。当CRE与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0001的功能变体包含以下TFBS序列:
TCCAAAGTCCAAA(HNF-4),TGTTAATAATTAATA(HNF-1),CAATAAACATCA(HNF-3),TTCCCTTTGAACCTT(HNF-4)
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表18,对于TFBS SEQ ID NO)。这些可以以与CRE0018相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0001的功能变体包含以下序列:
TCCAAAGTCCAAA-Na-TGTTAATAATTAATA-Nb-CAATAAACATCA-Nc-TTCCCTTTGAACCTT(SEQ ID NO:277),
或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na、Nb和Nc表示任选的间隔子序列。当存在时,Na任选地长度为1至10个核苷酸,优选地为2至6个核苷酸,并且更优选地为3个核苷酸。当存在时,Nb任选地长度为1至10个核苷酸,优选地为2至6个核苷酸,并且更优选地为3个核苷酸。当存在时,Nc任选地长度为11至31个核苷酸,优选地为16至26个核苷酸,并且更优选地为21个核苷酸。
在一些实施方案中,CRE0001的功能变体适当地包含与SEQ ID NO:12具有至少70%同一性,更优选地与SEQ ID NO:12具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0001的功能变体适当地包含在严格条件下与SEQ ID NO:12杂交的序列。
在本发明的一些实施方案中,顺式调节增强子元件由SEQ ID NO:12或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:12或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:12或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0001或其功能变体,或者由CRE0001或其功能变体组成的CRE,其长度为400个或更少的核苷酸、300个或更少的核苷酸、250个或更少的核苷酸,或者201个或更少的核苷酸。
CRE0005及其功能变体:
CRE0005具有如SEQ ID NO:13中所示出的序列。
CRE0005的功能变体是具有与CRE0005不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0005的功能变体可被视为当在CRM或启动子中替换地替代CRE0005时,基本上保持其活性的CRE。例如,包含替换地替代CRE0005的CRE0005功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0005的参考启动子相比)。例如,将启动子SP0256视为一个实例,SP0256中的CRE0005可以被CRE0005的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
CRE0005的生物信息学分析揭示,其没有明显包含任何已知的肝特异性TFBS。尽管如此,本发明人已经确定CRE0005仍然有助于启动子的肝特异性活性。不希望受理论束缚,这可能是通过与确实包含肝特异性TFBS的其他CRE的协同相互作用来增强它们的活性。
在本发明的一些实施方案中,CRE0005的功能变体包含与SEQ ID NO:13具有至少70%同一性,更优选地与SEQ ID NO:13具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0005的功能变体适当地包含在严格条件下与SEQ ID NO:13杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:13或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:13或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:13或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0005或其功能变体,或者由CRE0005或其功能变体组成的CRE,其长度为400个或更少的核苷酸、325个或更少的核苷酸、275个或更少的核苷酸,或者232个或更少的核苷酸。
CRE0012及其功能变体:
CRE0012具有如SEQ ID NO:14中所示出的序列。
CRE0012的功能变体是具有与CRE0012不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0012的功能变体可被视为当在CRM或启动子中替换地替代CRE0012时,基本上保持其活性的CRE。例如,包含替换地替代CRE0012的CRE0012功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0012的参考启动子相比)。例如,将启动子SP0243视为一个实例,SP0243中的CRE0012可以被CRE0012的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0012的功能变体包含与CRE0012相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0012中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-4、HNF-3、HNF-3和C/EBP。CRE0012的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0012中存在的相同的顺序(即以HNF-4、HNF-3、HNF-3并随后C/EBP的顺序)存在。当CRE与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0012的功能变体包含以下TFBS序列:
AAGTCCAAAGGTAGA(HNF-4),GAGTCAACATGA(HNF-3),AAATGTTGACTG(HNF-3)和GGTTGCTTAAT(C/EBP),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表19,对于TFBS SEQ ID NO)。这些可以以与CRE0012相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0012的功能变体包含以下序列:
AAGTCCAAAGGTAGA-Na-GAGTCAACATGA-Nb-AAATGTTGACTG-Nc-GGTTGCTTAAT(SEQ IDNO:278),
或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na、Nb和Nc表示任选的间隔子序列。当存在时,Na任选地长度为23至43个核苷酸,优选地为28至38个核苷酸,并且更优选地为33个核苷酸。当存在时,Nb任选地长度为38至58个核苷酸,优选地为42至53个核苷酸,更优选地为48个核苷酸。当存在时,Nc任选地长度为8至28个核苷酸,优选地为13至23个核苷酸,并且更优选地为18个核苷酸。
在一些实施方案中,CRE0012的功能变体适当地包含与SEQ ID NO:14具有至少70%同一性,更优选地与SEQ ID NO:14具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0012的功能变体适当地包含在严格条件下与SEQ ID NO:14杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:14或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:14或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:14或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0012或其功能变体,或者由CRE0012或其功能变体组成的CRE,其长度为400个或更少的核苷酸、300个或更少的核苷酸、250个或更少的核苷酸,或者200个或更少的核苷酸。
CRE0047及其功能变体:
CRE0047具有如SEQ ID NO:15中所示出的序列。
CRE0047的功能变体是具有与CRE0047不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0047的功能变体可被视为当在CRM或启动子中替换地替代CRE0047时,基本上保持其活性的CRE。例如,包含替换地替代CRE0047的CRE0047功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0047的参考启动子相比)。例如,将启动子SP0258视为一个实例,SP0258中的CRE0047可以被CRE0047的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0047的功能变体包含与CRE0047相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0047中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-3和C/EBP。CRE0047的功能变体因此优选地包含这些TFBS中的二者。优选地,它们以与它们在CRE0047中存在的相同的顺序(即以HNF-3并随后C/EBP的顺序)存在。当CRE与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0047的功能变体包含以下TFBS序列:
GCAATGTTTGCCCAT(HNF-3),TGTTTGCCCAT(C/EBP),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表20,对于TFBS SEQ ID NO)。这些可以以与CRE0047相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0047的功能变体包含以下序列:
GCAATGTTTGCCCAT(SEQ ID NO:279),或者与其具有至少70%、80%、90%、95%或99%同一性的序列。
在一些实施方案中,CRE0047的功能变体适当地包含与SEQ ID NO:15具有至少70%同一性,更优选地与SEQ ID NO:15具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0047的功能变体适当地包含在严格条件下与SEQ ID NO:15杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:15或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:15或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:15或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0047或其功能变体,或者由CRE0047或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、100个或更少的核苷酸、50个或更少的核苷酸,或者35个或更少的核苷酸。
CRE0048及其功能变体:
CRE0048具有如SEQ ID NO:16中所示出的序列。
CRE0048的功能变体是具有与CRE0048不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0048的功能变体可被视为当在CRM或启动子中替换地替代CRE0048时,基本上保持其活性的CRE。例如,包含替换地替代CRE0048的CRE0048功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0048的参考启动子相比)。例如,将启动子SP0378视为一个实例,SP0378中的CRE0048可以被CRE0048的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
CRE0048的生物信息学分析揭示,其没有明显包含任何已知的肝特异性TFBS。尽管如此,本发明人已经确定CRE0005仍然有助于启动子的肝特异性活性。不希望受理论束缚,这可能是通过与确实包含肝特异性TFBS的其他CRE的协同相互作用来增强它们的活性。
在本发明的一些实施方案中,CRE0048的功能变体包含与SEQ ID NO:16具有至少70%同一性,更优选地与SEQ ID NO:16具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0048的功能变体适当地包含在严格条件下与SEQ ID NO:16杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:16或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:16或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:16或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0048或其功能变体,或者由CRE0048或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或者92个或更少的核苷酸。
CRE0056及其功能变体:
CRE0056具有如SEQ ID NO:17中所示出的序列。
CRE0056的功能变体是具有与CRE0056不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0056的功能变体可被视为当在CRM或启动子中替换地替代CRE0056时,基本上保持其活性的CRE。例如,包含替换地替代CRE0056的CRE0056功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0056的参考启动子相比)。例如,将启动子SP0380视为一个实例,SP0380中的CRE0056可以被CRE0056的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0056的功能变体包含与CRE0056相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0056中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-4和HNF-3。CRE0056的功能变体因此优选地包含这些TFBS中的二者。优选地,它们以与它们在CRE0056中存在的相同的顺序(即以HNF-4并随后HNF-3的顺序)存在。当CRE与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0056的功能变体包含以下TFBS序列:
ACTGAACCCTTGACCCCTGCCCT(HNF-4)和TGCCCACTCTATTTGCCCAGCC(HNF-3),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表21,对于TFBS SEQ ID NO)。这些可以以与CRE0056相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0056的功能变体包含以下序列:
ACTGAACCCTTGACCCCTGCCCT-Na-TGCCCACTCTATTTGCCCAGCC(SEQ ID NO:280),或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na表示任选的间隔子序列。当存在时,Na任选地长度为12至32个核苷酸,优选地为17至27个核苷酸,并且更优选地为22个核苷酸。
在一些实施方案中,CRE0056的功能变体适当地包含与SEQ ID NO:17具有至少70%同一性,更优选地与SEQ ID NO:17具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0056的功能变体适当地包含在严格条件下与SEQ ID NO:17杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:17或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:17或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:17或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0056或其功能变体,或者由CRE0056或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸,或者79个或更少的核苷酸。
CRE0062及其功能变体:
CRE0062具有如SEQ ID NO:18中所示出的序列。
CRE0062的功能变体是具有与CRE0062不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0062的功能变体可被视为当在CRM或启动子中替换地替代CRE0062时,基本上保持其活性的CRE。例如,包含替换地替代CRE0062的CRE0062功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0062的参考启动子相比)。例如,将启动子SP0381视为一个实例,SP0381中的CRE0062可以被CRE0062的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0062的功能变体包含与CRE0062相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0062中存在的肝特异性TFBS,按其中它们存在的顺序列出,是:HNF-4、HNF-4和HNF-3。CRE0062的功能变体因此优选地包含这些TFBS中的全部。优选地,它们以与它们在CRE0062中存在的相同的顺序(即以HNF-4、HNF-4并随后HNF-3的顺序)存在。当CRE与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0062的功能变体包含以下TFBS序列:
AGATTCCAAAGTTCA(HNF-4),ACCAAAGTTCAGA(HNF-4),和GTTATTTACAA(HNF-3),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表22,对于TFBS SEQ ID NO)。这些可以以与CRE0062相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0062的功能变体包含以下序列:
AGAGATTCCAAAGTTCA-Na-ACCAAAGTTCAGA-Nb-GTTATTTACAA(SEQ ID NO:281),或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na和Nb表示任选的间隔子序列。当存在时,Na任选地长度为1至13个核苷酸,优选地为2至8个核苷酸,并且更优选地为3个核苷酸。当存在时,Nb任选地长度为1至18个核苷酸,优选地为3至13个核苷酸,更优选地为8个核苷酸。
在一些实施方案中,CRE0062的功能变体适当地包含与SEQ ID NO:18具有至少70%同一性,更优选地与SEQ ID NO:18具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0062的功能变体适当地包含在严格条件下与SEQ ID NO:18杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:18或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:18或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:18或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0062或其功能变体,或者由CRE0062或其功能变体组成的CRE,其长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸,或者85个或更少的核苷酸。
CRE0077及其功能变体:
CRE0077具有如SEQ ID NO:19中所示出的序列。
CRE0077的功能变体是具有与CRE0077不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0077的功能变体可被视为当在CRM或启动子中替换地替代CRE0077时,基本上保持其活性的CRE。例如,包含替换地替代CRE0077的CRE0077功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0077的参考启动子相比)。例如,将启动子SP0405视为一个实例,SP0405中的CRE0077可以被CRE0077的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0077(SEQ ID NO:19)的功能变体包含与CRE0077相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0077中存在的肝特异性TFBS,按(5’至3’)的顺序列出,是:HNF3、HNF3、HNF1、HNF3和HNF3。CRE0077的功能变体因此优选地包含这些TFBS中的全部。优选地,TFBS以与其在CRE0077中存在的相同的顺序(即以HNF3、HNF3、HNF1、HNF3然后HNF3的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。可以在相邻的TFBS之间提供间隔子序列。在一些实施方案中,TFBS可适当地重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些优选实施方案中,CRE0077的功能变体包含以下TFBS序列:
AGCAAATATTT(HNF3),AAATATTTGTGG(HNF3),GGTTATGGATTAACT(HNF1),CTGTTTGCCC(HNF3),CTATTTGCCC(HNF3),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表23,对于TFBS SEQ ID NO)。这些可以以与CRE0077相同的顺序(即其中它们在上文示出的顺序)存在。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在其间通常存在一定程度的偏差的共有序列。
在本发明的一些实施方案中,CRE0077的功能变体包含以下序列:
AGCAAATATTTGTGGTTATGGATTAACT-Na-CTGTTTGCCC-Nb-CTATTTGCCC(SEQ ID NO:282),
或者与其具有至少70%、80%、90%、95%或99%同一性的序列,
其中Na和Nb各自表示任选的间隔子序列。在存在的情况下,间隔子序列Na和Nb的长度适当地为0至10个核苷酸。任选地,Na的长度为2至8个核苷酸,优选长度为3至6个核苷酸,并且更优选长度为4个核苷酸。任选地,Nb的长度为2至8个核苷酸,优选长度为2至6个核苷酸,并且更优选长度为3个核苷酸。
在本发明的一些实施方案中,CRE0077的功能变体包含与SEQ ID NO:19具有至少70%同一性,更优选地与SEQ ID NO:19具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0077的功能变体适当地包含在严格条件下与SEQ ID NO:19杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:19或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:19或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:19或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0077或其功能变体,或者由CRE0077或其功能变体组成的CRE,其长度为150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸、75个或更少的核苷酸,或者56个或更少的核苷酸。
CRE0078及其功能变体:
CRE0078具有如SEQ ID NO:20中所示出的序列。
CRE0078的功能变体是具有与CRE0078不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0078的功能变体可被视为当在CRM或启动子中替换地替代CRE0078时,基本上保持其活性的CRE。例如,包含替换地替代CRE0078的CRE0078功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0078的参考启动子相比)。例如,将启动子SP0270视为一个实例,SP0270中的CRE0078可以被CRE0078的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,优选地,CRE0078(SEQ ID NO:20)的功能变体包含与CRE0078相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0078中存在的肝特异性TFBS,按顺序列出,是:HNF4、c/EBP、HNF3和HNF3。CRE0078的功能变体因此优选地包含这些TFBS。优选地,它们以与它们在CRE0078中存在的相同的顺序(即以HNF4、c/EBP、HNF3和HNF3的顺序)存在。当顺式调节元件与启动子和基因缔合时,该顺序优选地被认为是从上游至下游的方向(即从转录起始位点(TSS)的远端至TSS的近端的方向)。在一些实施方案中,TFBS重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0078的功能变体包含以下TFBS序列:
CGCCCTTTGGACC(HNF4),GACCTTTTGCAATCCTGG(c/EBP),CTGTTTGCT(HNF3),GTGTTTGCTG(HNF3),
与其互补的序列、或者这些TFBS序列的保持与其各自的TF结合的能力的功能变体(参见表24,对于TFBS SEQ ID NO)。本领域公知地,存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常基于多序列比对限定共有序列,通常存在与共有序列的一定程度的偏差。
在本发明的一些实施方案中,CRE0078的功能变体包含以下序列:
CGCCCTTTGGACCTTTTGCAATCCTGGAGCAAACAGCAAACAC(SEQ ID NO:283),
或者与其具有至少70%、80%、90%、95%或99%同一性的序列。
在本发明的一些实施方案中,CRE0078的功能变体包含与SEQ ID NO:20具有至少70%同一性,更优选地与SEQ ID NO:20具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0078的功能变体适当地包含在严格条件下与SEQ ID NO:20杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:20或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:20或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:20或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0078或其功能变体,或者由CRE0078或其功能变体组成的CRE,其长度为150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸、75个或更少的核苷酸,或者45个或更少的核苷酸。
CRE0083.1及其功能变体:
CRE0083.1具有如SEQ ID NO:21中所示出的序列。
CRE0083.1的功能变体是具有与CRE0083.1不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0083.1的功能变体可被视为当在CRM或启动子中替换地替代CRE0083.1时,基本上保持其活性的CRE。例如,包含替换地替代CRE0083.1的CRE0083.1功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0083.1的参考启动子相比)。例如,将启动子SP0112视为一个实例,SP0112中的CRE0083.1可以被CRE0083.1的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
CRE0083.1的生物信息学分析揭示,其没有明显包含任何已知的肝特异性TFBS。尽管如此,本发明人已经确定CRE0005仍然有助于启动子的肝特异性活性。不希望受理论束缚,这可能是通过与确实包含肝特异性TFBS的其他CRE的协同相互作用来增强它们的活性。
在本发明的一些实施方案中,CRE0083.1的功能变体包含与SEQ ID NO:21具有至少70%同一性,更优选地与SEQ ID NO:21具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0083.1的功能变体适当地包含在严格条件下与SEQ ID NO:21杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:21或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:21或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:21或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0083.1或其功能变体,或者由CRE0083.1或其功能变体组成的CRE,其长度为250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或者112个或更少的核苷酸。
CRE0089及其功能变体:
CRE0089具有如SEQ ID NO:22中所示出的序列。
CRE0089的功能变体是具有与CRE0089不同的序列,但基本上保持了其作为肝特异性CRE的活性的调节元件。技术人员将理解,可以在保持CRE与必需转录因子(TF)结合并增强表达的能力的同时改变CRE的序列。与参考CRE相比,功能变体可包含替换、缺失和/或插入,前提是它们不会使CRE无功能。
在一些实施方案中,CRE0089的功能变体可被视为当在CRM或启动子中替换地替代CRE0089时,基本上保持其活性的CRE。例如,包含替换地替代CRE0089的CRE0089功能变体的启动子优选地保持其活性的80%,更优选地保持其活性的90%,更优选地保持其活性的95%,并且还更优选地保持其活性的100%(与包含CRE0089的参考启动子相比)。例如,将启动子SP0139视为一个实例,SP0139中的CRE0089可以被CRE0089的功能变体替代,并且该启动子基本上保持其活性。活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
CRE0083的生物信息学分析揭示,其没有明显包含任何已知的肝特异性TFBS。尽管如此,本发明人已经确定CRE0005仍然有助于启动子的肝特异性活性。不希望受理论束缚,这可能是通过与确实包含肝特异性TFBS的其他CRE的协同相互作用来增强它们的活性。
在本发明的一些实施方案中,CRE0089的功能变体包含与SEQ ID NO:22具有至少70%同一性,更优选地与SEQ ID NO:22具有至少80%、90%、95%或99%同一性的序列。另外地或作为替代地,CRE0089的功能变体适当地包含在严格条件下与SEQ ID NO:22杂交的序列。
在本发明的一些实施方案中,CRE由SEQ ID NO:22或其功能变体组成。
应注意,CRE或其功能变体可以在双链多核苷酸的任一链上提供并且可以以任一方向提供。因此,SEQ ID NO:22或其功能变体的互补序列和反向互补序列落入本发明的范围内。包含根据SEQ ID NO:22或其功能变体的序列的单链核酸也落入本发明的范围内。
在一些优选实施方案中,提供了包含CRE0089或其功能变体,或者由CRE0089或其功能变体组成的CRE,其长度为250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或者102个或更少的核苷酸。
启动子元件及其功能变体:
本文中公开了可用于构建合成肝特异性启动子的多种启动子元件。这些启动子元件是最小启动子或肝特异性近端启动子。虽然本发明的CRE和CRM可以与多种合适的最小启动子或肝特异性近端启动子组合使用,但已经发现一些近端启动子与CRE或CRM协同作用以显著促进肝特异性启动子的活性。另外,已发现如本文中公开的一些肝特异性近端启动子具有显著水平的活性,即使在不存在另外的CRE或CRM序列(最显著的是近端启动子CRE0006和CRE0059)的情况下也是如此。
启动子元件的功能变体包含与参考启动子元件不同但基本上保持其肝特异性启动子元件活性的序列。技术人员将理解,可以改变启动子元件的序列,同时保持其募集RNA聚合酶II,并在相关时与肝特异性转录因子(TF)结合以增强表达的能力。与参考启动子元件相比,启动子元件的功能变体可包含替换、缺失和/或插入,前提是它们不会使启动子元件无功能。
在一些实施方案中,启动子元件的功能变体可被视为当其替换启动子中的参考启动子元件时,基本上保持其活性的启动子元件。例如,包含给定启动子元件的功能变体的肝特异性启动子优选地保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持其活性的100%(与包含未经修饰启动子元件的参考启动子相比)。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
适当地,启动子元件的功能变体与参考启动子元件保持显著水平的序列同一性。适当地,功能变体包含与参考启动子元件具有至少70%同一性,更优选地与参考启动子元件具有至少80%、90%、95%或99%同一性的序列。
在作为近端启动子的启动子元件的情况下,优选地,功能变体保持与参考启动子元件结合的肝特异性TF的TFBS(关于PWM的以上讨论在此处同样适用)。优选地,TFBS以与参考启动子元件中相同的顺序和与其基本上相同的位置保持。此外,通常优选转录起始位点(TSS)的序列在启动子元件的功能变体中基本上未改变。
活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
本发明中使用的启动子元件可以是天然的(即,获自或来源于天然存在的基因启动子)或者可以是合成的(即,非天然存在的)。
CRE0006及其功能变体:
CRE0006具有如SEQ ID NO:25中所示出的序列。
如上所述,CRE0006的功能变体基本上保持了CRE0006用作肝特异性启动子元件的能力。例如,当CRE0006的功能变体被替换到肝特异性启动子SP0241或SP0244中时,经修饰的保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持SP0241或SP0244的活性的100%。适当地,CRE0006的功能变体包含与SEQ ID NO:25具有至少70%、80%、90%、95%或99%同一性的序列。
CRE0006是近端启动子,并且包含针对TSS上游肝特异性TF的TFBS。CRE0006中存在的肝特异性TFBS,按顺序列出,是HNF4、RXRa、HNF4、c/EBP和HNF3(详见表25)。CRE0006的功能变体因此优选地包含这些TFBS。优选地,它们以与它们在CRE0006中存在的相同的顺序(即以HNF4、c/EBP、HNF3和HNF3的顺序)存在。在一些实施方案中,TFBS重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0006的功能变体包含与SEQ ID NO:25具有至少70%同一性(优选地与SEQ ID NO:25具有至少80%、90%、95%或99%同一性)的序列,其包含针对HNF4、RXRa、HNF4、c/EBP和HNF3的TFBS,并且优选地,其包含与表25中所示的所述TFBS下游的序列具有至少80%、90%、95%或完全同一性的TSS序列。
在一些实施方案中,CRE0006的功能变体包含与SEQ ID NO:25具有至少70%、80%、90%、95%或99%同一性的序列,并且其还包含以下TFBS:位于或接近第25至37位的HNF4;位于或接近第73至83位的RXRa;位于或接近第74至86位的HNF4;位于或接近第123至136位的c/EBP;和位于或接近第129至137位的HNF3;并且其包含与表25中所示的位于或接近第166至196位的序列具有至少80%、90%、95%或完全同一性的TSS序列,位置参考SEQID NO:25进行编号。在本发明上下文中,位于或接近适当地意指在参考SEQ ID NO:25所述位置的10、5、4、3、2或1个核苷酸内。合适的TFBS序列示于表25中,但可使用替代的TFBS序列。
在一些优选实施方案中,包含CRE0006或其功能变体,或者由CRE0006或其功能变体组成的启动子的长度为400个或更少的核苷酸、350个或更少的核苷酸、325个或更少的核苷酸、300个或更少的核苷酸,或279个或更少的核苷酸。
CRE0059及其功能变体:
CRE0059具有如SEQ ID NO:26中所示出的序列。
如上所述,CRE0059的功能变体基本上保持了CRE0059用作肝特异性启动子元件的能力。例如,当CRE0059的功能变体被替换到肝特异性启动子SP0412或SP0380中时,经修饰的保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持SP0412或SP0380的活性的100%。适当地,CRE0059的功能变体包含与SEQ ID NO:26具有至少70%、80%、90%、95%或99%同一性的序列。
CRE0059是近端启动子,并且包含TSS上游的肝特异性TF(即HNF1)的TFBS。CRE0059的功能变体因此优选地包含TSS上游的HNF1的TFBS。
在一些实施方案中,CRE0059的功能变体包含与SEQ ID NO:26具有至少70%同一性(优选地与SEQ ID NO:26具有至少80%、90%、95%或99%同一性)的序列,其包含针对HNF1的TFBS,并且优选地,其包含与表27中所示的所述TFBS下游的序列具有至少80%、90%、95%或完全同一性的TSS序列。
在一些实施方案中,CRE0059的功能变体包含与SEQ ID NO:26具有至少70%、80%、90%、95%或99%同一性的序列,并且其还包含位于或接近第24至36位的HNF3的TFBS;并且其包含与表27中所示的位于或接近第73至93位的序列具有至少80%、90%、95%或完全同一性的TSS序列,位置参考SEQ ID NO:26进行编号。在本发明上下文中,位于或接近适当地意指在参考SEQ ID NO:26所述位置的10、5、4、3、2或1个核苷酸内。合适的TFBS序列示于表27中,但可使用替代的TFBS序列。
在一些优选实施方案中,包含CRE0059或其功能变体,或者由CRE0059或其功能变体组成的启动子的长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的核苷酸,或95个或更少的核苷酸。
CRE0073及其功能变体:
CRE0073具有如SEQ ID NO:27中所示出的序列。
如上所述,CRE0073的功能变体基本上保持了CRE0073用作肝特异性启动子元件的能力。例如,当CRE0073的功能变体被替换到肝特异性启动子SP0249或SP0116中时,经修饰的保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持SP0249或SP0116的活性的100%。适当地,CRE0073的功能变体包含与SEQ ID NO:27具有至少70%、80%、90%、95%或99%同一性的序列。
CRE0073是近端启动子,并且包含针对TSS上游肝特异性TF的TFBS。CRE0073中存在的肝特异性TFBS,按顺序列出,是HNF3、C/EBP、HNF1和C/EBP(详见表28)。CRE0073的功能变体因此优选地包含这些TFBS。优选地,它们以与它们在CRE0073中存在的相同的顺序(即以HNF3、C/EBP、HNF1并随后C/EBP的顺序)存在。在一些实施方案中,TFBS重叠,只要它们保持功能,即重叠序列均能够结合其各自的TF即可。
在一些实施方案中,CRE0073的功能变体包含与SEQ ID NO:27具有至少70%同一性(优选地与SEQ ID NO:27具有至少80%、90%、95%或99%同一性)的序列,其包含针对HNF3、C/EBP、HNF1和C/EBP的TFBS,并且优选地,其包含与表28中所示的所述TFBS下游的序列具有至少80%、90%、95%或完全同一性的TSS序列。
在一些实施方案中,CRE0073的功能变体包含与SEQ ID NO:27具有至少70%、80%、90%、95%或99%同一性的序列,并且其还包含以下TFBS:位于或接近第36至42位的HNF3;位于或接近第38至49位的C/EBP;位于或接近第66至83位的HNF1;位于或接近第75至86位的C/EBP;和位于或接近第129至137位的HNF3;并且其包含与表28中所示的位于或接近第138至156位的序列具有至少80%、90%、95%或完全同一性的TSS序列,位置参考SEQ IDNO:27进行编号。在本发明上下文中,位于或接近适当地意指在参考SEQ ID NO:27所述位置的10、5、4、3、2或1个核苷酸内。合适的TFBS序列示于表28中,但可使用替代的TFBS序列。
CRE0073的示例性功能变体中的CRE0073.1。与CRE0073相比,CRE0073.1从5’端缺失了22个核苷酸。其在其他方面相同,并且在相对于CRE0073的相同相对位置中包含相同的TFBS。
在一些优选实施方案中,包含CRE0073或其功能变体,或者由CRE0073或其功能变体组成的启动子的长度为300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、175个或更少的核苷酸,或164个或更少的核苷酸。
CRE0040及其功能变体:
CRE0040具有如SEQ ID NO:29中所示出的序列。
如上所述,CRE0040的功能变体基本上保持了CRE0040用作肝特异性启动子元件的能力。例如,当CRE0040的功能变体被替换到肝特异性启动子SP0254或SP0252中时,经修饰的保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持SP0254或SP0252的活性的100%。适当地,CRE0040的功能变体包含与SEQ ID NO:29具有至少70%、80%、90%、95%或99%同一性的序列。
CRE0040是近端启动子,并且包含针对TSS上游肝特异性TF的TFBS。CRE0040中存在的肝特异性TFBS,按顺序列出,是C/EBP和HNF1(详见表30)。CRE0040的功能变体因此优选地包含这些TFBS。优选地,它们以与它们在CRE0040中存在的相同的顺序(即以C/EBP并随后HNF1的顺序)存在。
在一些实施方案中,CRE0040的功能变体包含与SEQ ID NO:29具有至少70%同一性(优选地与SEQ ID NO:29具有至少80%、90%、95%或99%同一性)的序列,其包含针对C/EBP和HNF1的TFBS,并且优选地,其包含与表30中所示的所述TFBS下游的序列具有至少80%、90%、95%或完全同一性的TSS序列。
在一些实施方案中,CRE0040的功能变体包含与SEQ ID NO:29具有至少70%、80%、90%、95%或99%同一性的序列,并且其还包含以下TFBS:位于或接近第39至52位的C/EBP;位于或接近第120至140位的HNF1;并且其包含与表30中所示的位于或接近第172至201位的序列具有至少80%、90%、95%或完全同一性的TSS序列,位置参考SEQ ID NO:29进行编号。在本发明上下文中,位于或接近适当地意指在参考SEQ ID NO:29所述位置的10、5、4、3、2或1个核苷酸内。合适的TFBS序列示于表30中,但可使用替代的TFBS序列。
在一些优选实施方案中,包含CRE0006或其功能变体,或者由CRE0006或其功能变体组成的启动子的长度为400个或更少的核苷酸、350个或更少的核苷酸、300个或更少的核苷酸、275个或更少的核苷酸,或240个或更少的核苷酸。
CRE0079及其功能变体:
CRE0079具有如SEQ ID NO:24中所示出的序列。
如上所述,CRE0079的功能变体基本上保持了CRE0079用作肝特异性启动子元件的能力。例如,当CRE0079的功能变体被替换到肝特异性启动子SP0271或SP0272中时,经修饰的保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持SP0271或SP0272的活性的100%。适当地,CRE0079的功能变体包含与SEQ ID NO:24具有至少70%、80%、90%、95%或99%同一性的序列。
CRE0079是近端启动子,并且包含针对TSS上游肝特异性TF的TFBS。CRE0079中存在的肝特异性TFBS,按顺序列出,是HNF4、HNF1和C/EBP(详见表26)。CRE0079的功能变体因此优选地包含这些TFBS。优选地,它们以与它们在CRE0079中存在的相同的顺序(即以HNF4、HNF1并随后C/EBP的顺序)存在。
在一些实施方案中,CRE0079的功能变体包含与SEQ ID NO:24具有至少70%同一性(优选地与SEQ ID NO:24具有至少80%、90%、95%或99%同一性)的序列,其包含针对HNF4、HNF1和C/EBP的TFBS,并且优选地,其包含与表24中所示的所述TFBS下游的序列具有至少80%、90%、95%或完全同一性的TSS序列。
在一些实施方案中,CRE0079的功能变体包含与SEQ ID NO:24具有至少70%、80%、90%、95%或99%同一性的序列,并且其还包含以下TFBS:位于或接近第43至55位的HNF4;位于或接近第138至150位的HNF1;位于或接近第162至175位的C/EBP;并且其包含与表26中所示的位于或接近第206至219位的序列具有至少80%、90%、95%或完全同一性的TSS序列,位置参考SEQ ID NO:24进行编号。在本发明上下文中,位于或接近适当地意指在参考SEQ ID NO:24所述位置的10、5、4、3、2或1个核苷酸内。合适的TFBS序列示于表26中,但可使用替代的TFBS序列。
在一些优选实施方案中,包含CRE0079或其功能变体,或者由CRE0079或其功能变体组成的启动子的长度为400个或更少的核苷酸、325个或更少的核苷酸、275个或更少的核苷酸、250个或更少的核苷酸,或226个或更少的核苷酸。
CRE0052及其功能变体:
CRE0052具有如SEQ ID NO:23中所示出的序列。
如上所述,CRE0052的功能变体基本上保持了CRE0052用作肝特异性启动子元件的能力。例如,当CRE0052的功能变体被替换到肝特异性启动子SP0239或SP0265中时,经修饰的保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持SP0239或SP0265的活性的100%。
适当地,CRE0052的功能变体包含与SEQ ID NO:23具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0052或其功能变体,或者由CRE0052或其功能变体组成的启动子的长度为200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸,或76个或更少的核苷酸。
另一些启动子元件:
可用于本发明的另一些肝特异性近端启动子的一些非限制性实例包括但不限于ApoA-I启动子、ApoA-II启动子、ApoA-IV启动子、ApoB启动子、ApoC-1启动子、ApoC-II启动子、ApoC-III启动子、ApoE启动子、白蛋白启动子、甲胎蛋白启动子、磷酸烯醇丙酮酸羧化激酶(PCK1)启动子、磷酸烯醇丙酮酸羧化激酶2(PCK2)启动子、甲状腺素转运蛋白(transthyretin,TTR)启动子、α-抗胰蛋白酶(AAT或SERPINA1)启动子、TK(胸苷激酶)启动子、血色素结合蛋白启动子、醇脱氢酶6启动子、胆固醇7α-25羟化酶启动子、IX因子启动子、a-微球蛋白启动子、SV40启动子、CMV启动子、劳斯肉瘤病毒-L TR启动子和HBV启动子。当然也可使用来源于这些启动子的最小启动子。
合成肝特异性CRM及其功能变体:
本文中公开了可用于构建合成肝特异性启动子的多种合成肝特异性CRM。如上所讨论,本发明的CRM可以与广泛范围的合适的最小启动子或肝特异性近端启动子组合使用。
CRM的功能变体包含与参考CRM元件不同的序列,但基本上保持作为肝特异性CRM的活性。技术人员将理解,可以在保持CRM募集合适的肝特异性转录因子(TF)并因此增强表达的能力的同时改变CRM的序列。与参考CRM相比,CRM的功能变体可包含替换、缺失和/或插入,前提是它们不会使CRM基本上无功能。
在一些实施方案中,CRM的功能变体可被视为当在启动子中替换参考CRM时,基本上保持其活性的CRM。例如,包含给定CRM的功能变体的肝特异性启动子优选地保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持其活性的100%(与包含未经修饰CRM的参考启动子相比)。
适当地,CRM的功能变体与参考CRM保持显著水平的序列同一性。合适的功能变体包含与参考CRM具有至少70%同一性,更优选地与其具有至少80%、90%、95%或99%同一性的序列。
活性的保持可通过在等效条件下对在参考启动子与包含经替换CRE的其他方面相同的启动子的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
在一些实施方案中,给定CRM的功能变体可包含参考CRM中存在的一种或更多种CRE的功能变体。例如,给定CRM的功能变体可包含参考CRM中存在的1、2、3、4、5或6种CRE的功能变体。上面讨论了CRE的功能变体。
在一些实施方案中,给定CRM的功能变体可包含与参考CRM相同的组合CRE,但是CRE可以以与参考CRM不同的顺序存在。通常优选地,CRE以与参考CRM相同的顺序存在(因此,CRM的功能变体适当地包含与参考CRM中示出的相同的CRE布置)。
在一些实施方案中,相对于参考CRM中存在的CRE,给定CRM的功能变体可包含一种或更多种另外的CRE。可以在参考CRM中存在的CRE的上游、参考CRM中存在的CRE的下游和/或参考CRM中存在的CRE之间提供另外的CRE。另外的CRE可以是本文中公开的CRE,或者它们可以是其他CRE。通常来说,优选地,给定CRM的功能变体包含相同的CRE(或其功能变体)并且不包含另外的CRE。
与参考CRM相比,给定CRM的功能变体可包含一个或更多个另外的调节元件。例如,它们可包含诱导型或阻遏型元件、边界控制元件、绝缘子、基因座控制区、响应元件、结合位点、末端重复区段、响应位点、稳定元件、去稳定元件和剪接元件等,前提是它们不会使CRM基本上无功能。
给定CRM的功能变体可以在相邻CRE之间包含另外的间隔子,或者如果一个或更多个间隔子存在于参考CRM中,则所述一个或更多个间隔子可以比在参考CRM中更长或更短。
将明显地,本文中公开的CRM或其功能变体可以与任何合适的启动子元件组合以提供根据本发明的合成肝特异性启动子。
在许多情况下,较短的启动子序列是优选的,特别是用于其中载体(例如病毒载体,例如AAV)的容量有限的情况。因此,在一些实施方案中,合成肝特异性CRM的长度为500个或更少的核苷酸,例如450、400、350、300、250、200、150、100、75、60、50个或更少的核苷酸。
合成肝特异性启动子及其功能变体:
本文中公开了多种合成肝特异性启动子。
参考合成肝特异性启动子的功能变体是包含与参考合成肝特异性启动子不同的序列,但基本上保持肝特异性启动子活性的启动子。技术人员将理解,可以在保持合成肝特异性启动子募集合适的肝特异性转录因子(TF)和募集RNA聚合酶II以提供可操作连接的序列(例如开放阅读框)的肝特异性表达的能力的同时改变合成肝特异性启动子的序列。与参考启动子相比,合成肝特异性启动子的功能变体可包含替换、缺失和/或插入,只要这样的替换、缺失和/或插入不会使合成肝特异性启动子基本上无功能(与参考启动子相比)即可。
因此,在一些实施方案中,合成肝特异性启动子的功能变体可被视为基本上保持参考启动子的肝特异性启动子活性的变体。例如,合成肝特异性启动子的功能变体优选地保持参考启动子活性的至少70%,更优选地保持其活性的至少80%,更优选地保持其活性的至少90%,更优选地保持其活性的至少95%,并且还更优选地保持其活性的100%。
合成肝特异性启动子的功能变体通常与参考合成肝特异性启动子保持显著水平的序列相似性。在一些实施方案中,功能变体包含与参考合成肝特异性启动子具有至少70%同一性,更优选地与参考合成肝特异性启动子具有至少80%、90%、95%或99%同一性的序列。
功能变体的活性可通过在等效条件下对在参考合成肝特异性启动子与推定的功能变体的控制下合适报道子的表达进行比较来评估。用于评估肝特异性启动子活性的合适测定在本文中(例如在实施例2和3中)公开。
给定合成肝特异性启动子的功能变体可包含参考合成肝特异性启动子中存在的一种或更多种CRE的功能变体。例如,给定CRM的功能变体可包含参考CRM中存在的1、2、3、4、5或6种CRE。上面讨论了CRE的功能变体。
给定合成肝特异性启动子的功能变体可包含启动子元件的功能变体,或与参考合成肝特异性启动子相比不同的启动子元件。
给定合成肝特异性启动子的功能变体可包含与参考合成肝特异性启动子相同的CRE,但CRE可以以与参考合成肝特异性启动子不同的顺序存在。
相对于参考合成肝特异性启动子中存在的CRE,给定合成肝特异性启动子的功能变体可包含一种或更多种另外的CRE。可以在参考CRM中存在的CRE的上游、参考合成肝特异性启动子中存在的CRE的下游和/或参考合成肝特异性启动子中存在的CRE之间提供另外的CRE。另外的CRE可以是本文中公开的CRE,或者它们可以是其他CRE。
与参考CRM相比,给定CRM的功能变体可包含一个或更多个另外的调节元件。例如,它们可包含诱导型元件、内含子元件、边界控制元件、绝缘子、基因座控制区、响应元件、结合位点、末端重复区段、响应位点、稳定元件、去稳定元件和剪接元件等,前提是它们不会使启动子基本上无功能。
给定合成肝特异性启动子的功能变体可以在相邻的CRE与启动子元件之间包含另外的间隔子,或者,如果一个或更多个间隔子存在于参考合成肝特异性启动子中,则所述一个或更多个间隔子可以比在参考合成肝特异性启动子中更长或更短。
将明显地,本发明的合成肝特异性启动子可包含本发明的CRM和另外的调节序列。例如,它们可包含一个或更多个另外的CRM、诱导型或阻遏型元件、边界控制元件、绝缘子、基因座控制区、响应元件、结合位点、末端重复区段、响应位点、稳定元件、去稳定元件和剪接元件等,前提是它们不会使启动子基本上无功能。
本发明的优选合成肝特异性启动子表现出为TBG启动子活性的至少15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%的肝特异性启动子活性。在一些实施方案中,本发明的合成肝特异性启动子适合以LP1启动子活性的至少100%,优选LP1启动子活性的150%、200%、300%或500%的水平促进肝特异性转基因表达。在许多情况下,更高水平的启动子活性是优选的,但情况并非总是如此;因此,在一些情况下,更适度的表达水平可以是优选的。与TBG相比本发明的给定合成肝特异性启动子的活性可通过对合成肝特异性启动子控制下的报道基因的肝特异性表达与TBG启动子控制下的相同报道子的表达进行比较来评估,当两个启动子在其他方面等同的表达构建体中和在等同条件下提供时。
在一些实施方案中,相对于已知的肝特异性启动子,适当地LP-1启动子,本发明的合成肝特异性启动子能够在对象的肝中或肝细胞中将基因(例如,治疗性基因或目的基因)的表达提高至少20%、至少40%、至少60%、至少80%、至少100%、至少200%、至少300%、至少500%、至少1000%或更多。
本发明优选的合成肝特异性启动子在非肝细胞(例如HEK293细胞)中表现出的活性在与CMV-IE相比时为50%或更低,优选与CMV-IE相比为25%或更低,更优选与CMV-IE相比为10%或更低,并且在一些情况下与CMV-IE相比为5%或更低,或者与CMV-IE相比为1%或更低。
在许多情况下,较短的启动子序列是优选的,特别是用于其中载体(例如病毒载体,例如AAV)容量有限的情况。因此,在一些实施方案中,合成肝特异性启动子的长度为700个或更少的核苷酸,例如600、500、450、400、350、300、250、200、150、100、75、70、68个或更少的核苷酸。
特别优选的合成肝特异性启动子是既短又表现出高水平活性的那些。
合成肝特异性表达盒:
本发明还提供了包含与编码表达产物的序列(适当地为基因,例如转基因)可操作连接的本发明的合成肝特异性启动子的合成肝特异性表达盒。
该基因通常编码期望的基因表达产物,例如多肽(蛋白质)或RNA。基因可以是全长cDNA或基因组DNA序列,或者其具有至少一些期望的生物活性的任何片段、亚基或突变体。
在基因编码蛋白质的情况下,其基本上可以是任何类型的蛋白质。作为一些非限制性实例,蛋白质可以是酶、抗体或抗体片段(例如单克隆抗体)、病毒蛋白质(例如,REP-CAP、REV、VSV-G或RD114)、治疗性蛋白质、或毒性蛋白(例如胱天蛋白酶3、8或9)。
在本发明的一些优选实施方案中,基因编码治疗性表达产物,优选适合用于治疗与异常基因表达(任选地在肝中)相关的疾病或病症的治疗性多肽。治疗性表达产物可以是蛋白质,例如分泌型蛋白质,例如如凝血因子(例如IX因子或VIII因子)、细胞因子、生长因子、抗体或纳米抗体、趋化因子、血浆因子、胰岛素、促红细胞生成素、脂蛋白脂肪酶或毒性蛋白。或者,治疗性表达产物可以是RNA,例如siRNA或miRNA。设想用于本发明的治疗性表达产物(和编码它们的序列)的一些非详尽列表包括:VIII因子、IX因子、VII因子、X因子、冯·维勒布兰德因子(von Willebrand factor)、促红细胞生成素(erythropoietin,EPO)、干扰素-a、干扰素-B、干扰素-y、白介素1(IL-1)、白介素2(IL-2)、白介素3(IL-3)、白介素4(IL-4)、白介素5(IL-5)、白介素6(IL-6)、白介素7(IL-7)、白介素8(IL-8)、白介素9(IL-9)、白介素10(IL-10)、白介素11(IL-11)、白介素12(IL-12)、趋化因子(C-X-C基序)配体5(chemokine(C-X-C motif)ligand 5,CXCL5)、粒细胞-集落刺激因子(granulocyte-colonystimulating factor,G-CSF)、粒细胞-巨噬细胞集落刺激因子(granulocyte-macrophagecolony stimulating factor,GM-CSF)、巨噬细胞集落刺激因子(macrophage colonystimulating factor,M-CSF)、干细胞因子(stem cell factor,SCF)、角质细胞生长因子(keratinocyte growth factor,KGF)、单核细胞趋化蛋白-1(monocyte chemoattractantprotein-1,MCP-1)、肿瘤坏死因子(tumour necrosis factor,TNF)、afamin(AFM)、a1-抗胰蛋白酶、a-半乳糖苷酶A、α-L-艾杜糖苷酸酶(α-L-iduronidase)、ATP7b、鸟氨酸氨基甲酰转移酶、苯丙氨酸羟化酶、脂蛋白脂肪酶、芳香族氨基酸脱羧酶(aromatic amino aciddecarboxylase,AADC)、ATP酶肌质/内质网Ca2+转运2(ATP2A2)、囊性纤维化穿膜传导调节蛋白(CTFR)、谷氨酸脱羧酶65kDa蛋白(GAD65)、谷氨酸脱羧酶67kDa蛋白(GAD67)、脂蛋白脂肪酶(lipoprotein lipase,LPL)、神经生长因子(nerve growth factor,NGF)、神经营养因子(neurturin)(NTN)、胆色素原脱氨酶(porphobilinogen deaminase,PBGD)、肌聚糖α(sarcoglycan alpha,SGCA)、可溶性fms样酪氨酸激酶-1(soluble fms-like tyrosinekinase-1,sFLT-1)、载脂蛋白、低密度脂蛋白受体(low-density lipoprotein receptor,LDL-R)、白蛋白、葡萄糖-6-磷酸酶、抗体、纳米抗体、适配体、抗病毒显性负蛋白,及其功能片段、亚基或突变体。优选地,蛋白质是灵长类蛋白质,更优选人蛋白质。
在本发明的一些实施方案中,合成肝特异性表达盒包含可用于基因编辑的基因,例如,编码位点特异性核酸酶的基因,所述位点特异性核酸酶例如兆核酸酶、锌指核酸酶(zinc finger nuclease,ZFN)、基于转录激活因子样效应物的核酸酶(TALEN)或成簇规则间隔短回文重复系统(CRISPR-Cas)。适当地,位点特异性核酸酶通过进行切割(通常是位点特异性双链断裂)而适于编辑期望的靶基因组基因座,该切割随后通过非同源末端连接(non-homologous end-joining,NHEJ)或同源依赖性修复(homology dependent repair,HDR)进行修复,导致期望的编辑。编辑可以是功能失调的基因的部分或完全修复,或者可以是功能基因的敲低或敲除。
适当地,合成肝特异性表达盒包含提供或编码核糖体结合位点、起始密码子、终止密码子中的一个或更多个,并且优选全部的序列,以及转录终止序列。适当地,表达盒包含编码转录后调节元件的核酸。适当地,表达盒包含编码polyA元件的核酸。
载体和病毒颗粒:
本发明还提供了包含根据本发明的合成肝特异性CRM、合成肝特异性启动子或表达盒的载体。
在本发明的一些实施方案中,载体是质粒。这样的质粒可包含多种另一些功能性核酸序列,例如一个或更多个选择性标志物、一个或更多个复制起点、多个克隆位点等。在本发明的一些实施方案中,载体是病毒载体。
在本发明的一些实施方案中,载体是用于在真核细胞中表达的表达载体。真核表达载体的一些实例包括但不限于可从Stratagene获得的pW-LNEO、pSV2CAT、pOG44、pXTl和pSG;可从Amersham Pharmacia Biotech获得的pSVK3、pBPV、pMSG和pSVL;以及可从Clontech获得的pCMVDsRed2-express、pIRES2-DsRed2、pDsRed2-Mito、pCMV-EGFP。许多其他载体是公知的并且是可商购的。对于哺乳动物细胞腺病毒载体,pSV和pCMV系列载体是一些特别公知的非限制性实例。有许多公知的酵母表达载体,包括但不限于酵母整合型质粒(yeast integrative plasmid,YIp)和酵母复制型质粒(yeast replicative plasmid,YRp)。对于植物,农杆菌属(agrobacterium)的Ti质粒是一个示例性表达载体,并且植物病毒也提供合适的表达载体,例如烟草花叶病毒(tobacco mosaic virus,TMV)、马铃薯X病毒和豇豆花叶病毒。
在一些优选实施方案中,载体是基因治疗载体。多种基因治疗载体是本领域已知的,并且可提及AAV载体、腺病毒载体、逆转录病毒载体和慢病毒载体。在载体是基因治疗载体的情况下,载体优选地包含与本发明的合成肝特异性启动子可操作连接的编码治疗性产物(适当地治疗性蛋白质)的核酸序列。治疗性蛋白质可以是分泌型蛋白质。上文讨论了分泌型蛋白质的一些非限制性实例,并且示例性分泌型治疗性蛋白质包括凝血因子,例如VIII因子或IX因子、胰岛素、促红细胞生成素、脂蛋白脂肪酶、抗体或纳米抗体、生长因子、细胞因子、趋化因子、血浆因子、毒性蛋白等。
在本发明的一些实施方案中,载体是病毒载体,例如逆转录病毒、慢病毒、腺病毒或腺相关病毒(AAV)载体。在一些优选实施方案中,载体是AAV载体。在一些优选实施方案中,AAV具有适合于肝转导的血清型。在一些实施方案中,AAV选自:AAV2、AAV5、AAV6、AAV7、AAV8、AAV9,或其衍生物。AAV载体优选地用作自互补双链AAV载体(scAAV)以克服AAV转导中的限制步骤之一(即单链至双链AAV转换),但是使用单链AAV载体(ssAAV)也涵盖在本文中。在本发明的一些实施方案中,AAV载体是嵌合的,这意味着它包含来自至少两种AAV血清型的组分,例如AAV2的ITR和AAV5的衣壳蛋白。
本发明还提供了包含如上所述载体的重组病毒体(病毒颗粒)。
药物组合物:
本发明的载体或病毒体可以与可药用赋形剂,即一种或更多种可药用的载体物质和/或添加剂,例如缓冲剂、载体、赋形剂、稳定剂等一起配制在药物组合物中。所述药物组合物可以以药盒的形式提供。
因此,本发明的另一方面提供了包含如本文中所述的载体或病毒体的药物组合物。
治疗剂和其他方法和用途
本发明还提供了根据本发明多个方面的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体、病毒体或药物组合物,其用于治疗疾病,优选与异常基因表达(任选地在肝中)相关的疾病(例如遗传性肝病)。上文讨论了肝中与异常基因表达相关的多种疾病,并且这些包含但不限于血友病(包括血友病A或B)、家族性高胆固醇血症、鸟氨酸氨甲酰基转移酶缺乏症、苯丙酮尿症、鸟氨酸氨甲酰基转移酶缺乏症、糖原贮积病、α1-抗胰蛋白酶缺乏症、遗传性血色素沉积症、1型酪氨酸血症、精氨琥珀酸尿症、肝炎病毒感染、非病毒性肝炎、肝癌、遗传性胆汁淤积、威尔逊氏病(Wilson’s disease)和多种另一些肝病(例如非酒精性脂肪性肝病(NAFLD)、酒精相关性肝病(ARLD)和溶酶体贮积症。可用于治疗血友病A或B代表本发明的一些优选实施方案。
本发明还提供了根据本发明多个方面的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体、病毒体,其用于制造用于治疗本文中提及的任何病症或疾病的药物组合物。
本发明还提供了包含根据本发明多个方面的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体、病毒体的细胞。适当地,细胞是真核细胞。真核细胞可适当地是真菌细胞(例如酵母菌细胞)、动物(后生动物)细胞(例如哺乳动物细胞)或植物细胞。或者,细胞可以是原核细胞。
在本发明的一些实施方案中,细胞是离体的,例如,在细胞培养中。在本发明的另一些实施方案中,细胞可以是组织或多细胞生物体的一部分。
在一个优选实施方案中,细胞是肝细胞(liver cell/hepatocyte),其可以是离体的或体内的。肝细胞可以是原代肝细胞或肝来源细胞系(例如,永生化细胞系)的细胞。细胞可存在于肝组织环境中(例如在动物的肝中)或可以从肝组织中分离,例如其可以在细胞培养中。适当地,细胞是人细胞。
根据本发明的肝特异性CRM、合成肝特异性启动子、表达盒或载体可插入到细胞的基因组中,或者它可以是附加型的(episomal)(例如,存在于附加型载体中)。
在另一方面中,本发明提供了用于产生表达产物的方法,所述方法包括在细胞(优选肝细胞)中提供根据本发明的合成肝特异性表达盒(优选在如上所述的载体中),以及表达存在于合成肝特异性表达盒中的基因。该方法适当地包括将所述肝细胞维持在用于表达基因的合适条件下。在培养中,这可包括在合适的培养条件下孵育细胞或包含细胞的组织。所述表达当然可以是体内的,例如在对象肝中的一个或更多个细胞中。
适当地,所述方法包括将合成肝特异性表达盒引入到肝细胞中的步骤。广泛范围的转染肝细胞的方法是本领域公知的。转染肝细胞的一种优选方法是用包含合成肝特异性表达盒的病毒载体(例如,AAV载体)转导细胞。
对于技术人员将明显的是,根据本发明多个方面的合成肝特异性CRM、合成肝特异性启动子、表达盒、载体或病毒体可用于基因治疗。因此,这样的核酸构建体在基因治疗中的应用构成了本发明的一部分。
因此,在一些实施方案中,本发明提供了根据本发明的表达盒、载体或病毒体,其用于在对象中进行基因治疗,优选通过治疗性基因的肝特异性表达进行基因治疗。所述治疗可涉及通过从肝细胞分泌治疗性产物来治疗疾病,合适的是涉及肝中异常基因表达的疾病(例如,血友病A或B)。
本发明还提供了在肝细胞中表达治疗性转基因的方法,所述方法包括将根据本发明的表达盒或载体引入到肝细胞中。肝细胞可以是体内的或离体的。
本发明还提供了对有此需要的对象,优选人进行基因治疗的方法,所述方法包括:
-向对象施用(适当地向对象的肝中引入)本发明的合成肝特异性表达盒、载体、病毒体或药物组合物,其包含编码治疗性产物的基因。
该方法适当地包括从所述对象的肝中的基因表达治疗量的治疗性产物。
上文讨论了编码合适治疗性产物的基因。然而,可以特别提及治疗性蛋白质,例如用于治疗血友病的VIII和IX因子。
该方法适当地包括向对象施用根据本发明的载体或病毒体。合适的载体是病毒基因治疗载体,例如AAV载体。
在一些实施方案中,所述方法包括全身施用病毒基因治疗载体。全身施用可以是肠内(例如,经口、舌下和直肠)或肠胃外(例如,注射)。优选的注射途径包括静脉内、肌内、皮下、动脉内、关节内、鞘内和皮内注射。
在一些实施方案中,病毒基因治疗载体可以与一种或更多种另外的治疗剂或与设计用于阻止载体被网状内皮系统清除的一种或更多种饱和剂同时或顺序施用。
在载体是AAV载体的情况下,载体的剂量可以为1×1010gc/kg至1×1015gc/kg或更多,适当地为1×1012gc/kg至1×1014gc/kg,适当地为5×1012gc/kg至5×1013gc/kg。
一般而言,有此需要的对象将是哺乳动物,并且优选灵长类,更优选人。通常来说,有此需要的对象将表现出疾病的特征性症状。该方法通常包括通过表达治疗量的治疗性产物来减轻有此需要的对象表现出的症状。
用于体外和体内靶细胞中治疗性基因表达的基因治疗方案是本领域公知的,并且在此不再详细讨论。简言之,它们包括质粒DNA载体(裸的或在脂质体中)或病毒载体的肌内注射、间质注射、气道内滴注、施加于内皮、肝实质内以及静脉内或动脉内施用(例如肝动脉内、肝静脉内)。已经开发了多种装置来增强DNA对靶细胞的可用性。虽然一种简单的方法是使靶细胞与包含相关载体的导管或可植入材料物理接触,但更复杂的方法可使用喷射注射装置等。已经使用离体和体内程序二者进行基因向哺乳动物肝细胞中的转移。离体方法通常需要收获肝细胞,用合适的表达载体进行体外转导,随后将经转导的肝细胞再引入到肝中。体内基因转移已通过将DNA或病毒载体注射到肝实质、肝动脉或门静脉中来实现。
根据一些优选实施方案,上述方法可用于治疗患有血友病(例如,血友病A或B)的对象。因此,本发明提供了治疗患有血友病A或B的对象的方法,所述方法包括以下步骤:
-向对象施用(适当地向对象的肝中引入)本发明的合成肝特异性表达盒、载体、病毒体或药物组合物,其包含编码合适的凝血因子(特别地,在血友病A的情况下为VIII因子,或在血友病B的情况下为IX因子)的基因;以及
-在所述对象的肝中表达治疗量的凝血因子。
在一些情况下,合成肝特异性表达盒在基因治疗载体(适当地为AAV载体)中提供。
优选地,所述方法包括在对象的肝中表达合适量的相关凝血因子以减轻或改善血友病A或B的症状。
另外事项:
在本发明的一些实施方案中,CRM或合成肝特异性启动子不包含CR0077(或其功能变体)和CR0078(或其功能变体)二者。在本发明的一些实施方案中,在CRE、CRM或合成肝特异性启动子包含CR0077或CR0078(或其功能变体)的情况下,它不包含选自以下的另一些CRE:CR0077(或其功能变体)和CR0078(或其功能变体)。在本发明的一些实施方案中,CRM或合成肝特异性启动子不包含选自以下的多于一种CRE:CR0077(或其功能变体)或CR0078(或其功能变体)。
在本发明的一些实施方案中,CRE、CRM或合成肝特异性启动子不包含CR0077或其功能变体或者CR0078或其功能变体。
在本发明的一些实施方案中,CRM或合成肝特异性启动子不包含序列
GGACTTAGCCCCTGTTTGCTCCTCCGATAACTGGGGTGACCTTGGTTAATATTCACCA(SEQ ID NO:284),或
GCCCCTGTTTGCTCCTCCGATAACTGGGGTGACCTTGGTTAATATTCACCA(SEQ ID NO:285),
或其中任一者的功能变体。这些序列是SEPRINA1启动子的部分。
在本发明的一些实施方案中,在CRM或合成肝特异性启动子包含CR0077或CR0078(或其中任意的功能变体)的情况下,它不包含SEQ ID NO:284或SEQ ID NO:285(或其中任意的功能变体)。因此,在一些实施方案中,CRM或合成肝特异性启动子包含序列V1、V2、SEQID NO:284和SEQ ID NO:285中的不超过一个。
在本发明的一些实施方案中,CRM或合成肝特异性启动子包含不超过两个以下元件:LVR_CRE0080_PROC、LVR_CRE0081_APOA1、LVR_CRE0061_APOB、LVR_CRE0082_APOC4、SEQID NO:284和SEQ ID NO:285,或其中任意的功能变体。在本发明的一些实施方案中,CRM或合成肝特异性启动子包含不超过一个所述元件或其中任意的功能变体。在本发明的一些实施方案中,CRM或合成肝特异性启动子不包含任何所述元件或其中任意的功能变体。LVR_CRE0080_PROC和LVR_CRE0081_APOA1是CR0077的组件,而LVR_CRE0061_APOB、LVR_CRE0082_APOC4是CR0078的组件(另一些细节参见表7和表8)。
在本发明的一些实施方案中,合成肝特异性启动子不包含CRE0052最小启动子或其功能变体。
在本发明的一些实施方案中,CRM或合成肝特异性启动子不包含欧洲专利申请no18207027.6中公开的序列。
上文讨论的这些免责声明和实施方案中的任何序列的功能变体可具有例如与任何参考序列具有60%、70%、80%、90%、95%或99%同一性的序列。
定义和一般性要点:
尽管以下详细讨论了本发明的多个实施方案的制造和使用,但是应当理解,本发明提供了许多可应用的发明构思,这些构思可在广泛多种特定的上下文中体现。本文中讨论的特定实施方案仅是制造和使用本发明的特定方式的举例说明,并不限制本发明的范围。
本文中包括对本发明背景的讨论,以解释本发明的上下文。这不应被视为承认所提及的任何材料自任何权利要求的优先权日起已在任何国家公开、已知或作为公知常识的一部分。
在本公开内容通篇,通过标识引文引用了多种出版物、专利和公开的专利说明书。本说明书中引用的所有文件均通过引用整体并入本文。特别地,本文中具体提及的这样的文件的教导或部分通过引用并入。
除非另有说明,否则本发明的实施将采用细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术,其在本领域技术范围内。这样的技术在文献中有充分的解释。参见,例如,Current Protocols in Molecular Biology(Ausubel,2000,Wiley and son Inc,Library of Congress,USA);Molecular Cloning:ALaboratory Manual,第三版,(Sambrook et al,2001,Cold Spring Harbor,New York:Cold Spring Harbor Laboratory Press);Oligonucleotide Synthesis(M.J.Gait ed.,1984);美国专利No.4,683,195;Nucleic Acid Hybridization(Harries和Higgins编辑.1984);Transcription和Translation(Hames和Higgins编辑.1984);Culture of AnimalCells(Freshney,Alan R.Liss,Inc.,1987);Immobilized Cells和Enzymes(IRL Press,1986);Perbal,A Practical Guide to Molecular Cloning(1984);Methods inEnzymology系列(Abelson和Simon,主编,Academic Press,Inc.,New York),特别是第154和155卷(Wu et al.编辑)以及第185卷″Gene Expression Technology″(Goeddel,编辑);Gene Transfer Vectors For Mammalian Cells(Miller和Calos编辑,1987,Cold SpringHarbor Laboratory);Immunochemical Methods in Cell和Molecular Biology(Mayer和Walker,编辑,Academic Press,London,1987);Handbook of Experimental Immunology,第I至IV卷(Weir和Blackwell,编辑,1986);以及Manipulating the Mouse Embryo,(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1986)。
为了促进理解本发明,下面定义或解释了许多术语。本文中使用的术语具有与本发明相关领域的普通技术人员通常理解的含义。没有数量词修饰的术语不旨在仅指单个实体,而是包括可使用其具体实例进行举例说明的一般类别。本文中的术语用于描述本发明的具体实施方案,但是除了权利要求书中概述的以外,其使用不限定本发明。
术语“顺式调节元件”或“CRE”是技术人员公知的术语,并且意指可以调节(regulate)或调节(modulate)相邻基因的转录(即顺式)的核酸序列,例如增强子、启动子、绝缘子或沉默子。CRE存在于它们调节的基因附近。CRE通常通过与TF结合(即其包括TFBS)来调节基因转录。单个TF可与许多CRE结合,并因此控制许多基因的表达(多效性)。CRE通常(但不总是)位于它们调节的基因的转录起始位点(TSS)的上游。“增强子”是增强(即上调)与其可操作缔合的基因的转录的CRE,并且可存在于它们调节的基因的上游、下游并且甚至它们调节的基因的内含子内。多个增强子可以以协同方式来发挥作用以调节一个基因的转录。在本发明上下文中,“沉默子”涉及结合称为阻遏物的TF的CRE,所述阻遏物作用是阻止或下调基因的转录。术语“沉默子”还可以指信使RNA的3’非翻译区中的区域,该区域结合抑制该mRNA分子翻译的蛋白质,但这样的用法与其在描述CRE中的用途不同。一般而言,本发明的CRE是肝特异性增强子元件(通常称为肝特异性CRE,或肝特异性CRE增强子等)。在本发明上下文中,优选地,CRE位于距转录起始位点(TSS)1500个核苷酸或更少,更优选地距TSS1000个核苷酸或更少,更优选地距TSS 500个核苷酸或更少,并且适当地距TSS 250、200、150或100个核苷酸或更少处。本发明的CRE优选长度相对较短,优选长度为250个核苷酸或更少,例如它们的长度可以为200、175、150、90、80、70、60或50个核苷酸或更少。本发明的CRE通常与可操作连接的启动子元件组合提供,所述启动子元件可以是最小启动子或近端启动子;本发明的CRE增强启动子元件的肝特异性活性。
术语“顺式调节模块”或“CRM”意指通常包含两种或更多种CRE的功能性调节性核酸模块;在本发明中,CRE通常是肝特异性增强子,并因此CRM是合成肝特异性调节性核酸。因此,在本申请中,CRM通常包含多种肝特异性CRE。通常来说,CRM内的多种CRE共同作用(例如,相加或协同)以增强与包含CRM的启动子可操作地缔合的基因的转录。有相当大的空间可以移动(shuffle)(即重新排序)、倒置(即反向)和改变CRM内CRE的间距。因此,本发明的CRM的功能变体尤其包括所引用的CRM的变体,其中它们的CRE已被移动和/或倒置,和/或CRE之间的间距已被改变。
本文中使用的短语“启动子”是指通常位于待转录核酸序列上游的DNA区域,其是转录发生所需要的,即其启动转录。启动子允许正确激活或抑制在其控制下的编码序列的转录。启动子通常包含被多个TF识别和结合的特定序列。TF与启动子序列结合并导致RNA聚合酶(即从基因编码区合成RNA的酶)的募集。许多不同的启动子是本领域已知的。
本文中使用的术语“合成启动子”涉及自然界中不存在的启动子。在本发明上下文中,它通常包含与最小(或核心)启动子或肝特异性近端启动子(启动子元件)可操作连接的本发明的CRE和/或CRM。本发明的CRE和/或CRM用于增强与合成启动子可操作连接的基因的肝特异性转录。合成启动子的部分可以是天然存在的(例如,最小启动子或启动子中的一种或更多种CRE),但合成启动子作为一个完整实体并不是天然存在的。
本文中使用的“最小启动子”(也称为“核心启动子”)是指自身无活性或大部分无活性,但在与其他转录调节元件组合时可介导转录的短DNA区段。最小启动子序列可来源于多种不同的来源,包括原核和真核基因。最小启动子的一些实例在上文讨论,并且包括多巴胺β-羟化酶基因最小启动子、巨细胞病毒(CMV)即早期基因最小启动子(CMV-MP)和疱疹胸苷激酶最小启动子(MinTK)。最小启动子通常包含转录起始位点(TSS)和直接上游的元件、RNA聚合酶II的结合位点和一般转录因子结合位点(通常是TATA框)。最小启动子也可包含TSS下游的一些元件,但在不存在另外的调节元件的情况下,这些通常几乎没有功能。
本文中使用的“近端启动子”是指最小启动子加上趋向于包含初级调节元件的基因的上游的近端序列。它通常在TSS上游延伸约250个碱基对,并包含特定的TFBS。近端启动子还可包含TSS下游的一个或更多个调节元件,例如UTR或内含子。在这样的情况下,近端启动子可适当地是可以与本发明的一种或更多种CRE或CRM组合的天然存在的肝特异性近端启动子。然而,近端启动子可以是合成的。
本文中使用的“启动子元件”是指如上所定义的最小启动子或近端启动子。在本发明的上下文中,启动子元件通常与一种或更多种CRE组合以提供本发明的合成肝特异性启动子。
在本发明的上下文中,CRE、CRM、启动子元件、启动子或其他核酸构建体的“功能变体”是保持以与参考序列(例如与肝特异性CRE、肝特异性CRM或肝特异性启动子)相同的方式发挥功能的能力的参考序列的变体。用于这样的功能变体的替代术语包括“生物等效物”或“等效物”。
应当理解,给定CRE用作肝特异性增强子的能力主要取决于序列结合与参考序列结合的相同肝特异性TF的能力。因此,在大多数情况下,CRE或CRM的功能变体将包含大部分或所有与参考CRE或CRM相同的TF的TFBS。优选但非必要的是,功能变体的TFBS与参考CRE或CRM处于相同的相对位置(即顺序和一般位置)。还优选但非必需的是,功能变体的TFBS与参考序列的方向相同(应注意,TFBS在一些情况下可以以反向存在,例如作为相对于参考序列中的序列的反向互补序列)。还优选但非必需的是,功能变体的TFBS与参考序列在同一条链上。因此,在一些优选实施方案中,功能变体包含针对相同TF的TFBS,以与参考序列相同的顺序、相同的位置、相同的方向和在相同的链上。还应理解,位于TFBS之间的序列(在一些情况下称为间隔子序列等)对CRE或CRM的功能影响较小。这样的序列通常可以有很大的变化,并且它们的长度可以改变。然而,在一些优选实施方案中,间距(即相邻TFBS之间的距离)在功能变体中与其在参考序列中的基本上相同(例如,其变化不超过20%,优选不超过10%,并且更优选地其基本上相同)。将明显地是,在一些情况下,CRE的功能变体可以以反向存在,例如它可以是如上所述的CRE的反向互补序列,或其变体。
功能变体与参考序列之间的序列同一性水平也可以是指标或保持的功能。CRE的TFBS中的高水平序列同一性通常比间隔子序列中的序列同一性更重要(在间隔子序列中几乎不需要或不需要任何序列保守性)。然而,将理解的是,鉴于功能性TFBS的序列不需要与共有序列完全匹配,即使在TFBS内,也可以容纳相当程度的序列变异性。
一个或更多个TF与给定功能变体中的TFBS结合的能力可通过本领域已知的任何相关手段来确定,包括但不限于电迁移率变动测定(electromobility shift assay,EMSA)、结合测定、染色质免疫沉淀(chromatin immunoprecipitation,ChIP),和ChIP测序(ChIP-seq)。在一个优选实施方案中,一个或更多个TF结合给定功能变体的能力通过EMSA确定。进行EMSA的方法是本领域公知的。合适的方法描述于以上引用的Sambrook et al.中。描述此程序的许多相关文章均是可获得的,例如Hellman和Fried,Nat Protoc.2007;2(8):1849-1861。
“肝特异性”或“肝特异性表达”是指顺式调节元件、顺式调节模块或启动子以与另一些组织(例如脾、肌、心脏、肺和脑)相比优先或占优势的方式增强或驱动基因在肝(或肝来源细胞)中的表达的能力。基因的表达可以是以mRNA或蛋白质的形式。在一些优选实施方案中,肝特异性表达使得在其他(即非肝)组织或细胞中的表达可忽略不计,即表达是高度肝特异性的。
技术人员可容易地评估CRE、CRM或启动子用作肝特异性CRE、CRM或启动子的能力。因此,技术人员可容易地确定上述特异性CRE、CRM或启动子的任何变体是否仍然保持功能性(即它是如上定义的功能变体)。例如,任何给定的待评估CRM均可以与最小启动子可操作地连接(例如位于CMV-MP上游)并且测量顺式调节元件驱动基因(通常是报道基因)的肝特异性表达的能力。或者,可将CRE的变体替换为合成肝特异性启动子来代替参考CRE,并且可以确定由所述经修饰启动子驱动的对肝特异性表达的作用并将其与未经修饰形式进行比较。类似地,技术人员可容易地评估CRM或启动子驱动肝特异性表达的能力(例如,如下面的实施例中所述)。由参考启动子的变体驱动的基因的表达水平可以与由参考序列驱动的表达水平进行比较。在一些实施方案中,在由变体启动子驱动的肝特异性表达水平为由参考启动子驱动的表达水平的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%的情况下,可以说变体保持功能。合适的核酸构建体和评估肝特异性表达增强的报道测定可以很容易地构建,并且下面示出的实施例给出了合适的方法。
可以鉴定肝特异性,其中基因(例如治疗性基因或报道基因)的表达优先或主要发生在肝来源细胞中。可以限定优先或主要表达,例如,其中与在其他类型的细胞(即非肝来源细胞)中相比,在肝来源细胞中表达水平显著更高。例如,肝来源细胞中的表达适当地比在非肝细胞中高至少5倍,优选地比在非肝细胞中高至少10倍,并且在一些情况下其可能高50倍或更多。为方便起见,肝特异性表达可适当地通过将肝细胞系(例如肝来源细胞系,例如Huh7和/或HepG2细胞)或肝原代细胞中的表达水平与肾来源细胞系(例如HEK-293)、宫颈组织来源细胞系(例如HeLa)和/或肺来源细胞系(例如A549)中的表达水平相比较来表明。
当与非组织特异性启动子(例如CMV-IE)相比时,本发明的合成肝特异性启动子优选地在非肝来源细胞中(适当地在HEK-293、HeLa和/或A549细胞中)表现出降低的表达。本发明的合成肝特异性启动子在非肝来源细胞中(适当地在HEK-293、HeLa和/或A549细胞中)优选地活性为与CMV-IE启动子相比的50%或更低,适当地为25%或更低、20%或更低、15%或更低、10%或更低、5%或更低或者1%或更低。通常来说,优选使非肝来源细胞中的表达最小化,但在一些情况下这可能不是必需的。在一些实施方案中,本发明的合成肝特异性启动子适合于在非肝来源细胞(例如HEK-293、HeLa和/或A549细胞)中以与LP1启动子相比50%或更低的水平促进基因表达。
本发明的合成肝特异性启动子优选地适合于在对象肝中促进表达,例如,驱动转基因,优选治疗性转基因的肝特异性表达。本发明优选的合成肝特异性启动子适合于促进肝特异性转基因表达并且在肝细胞中的活性为TBG启动子活性的至少15%、20%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%。在一些实施方案中,本发明的合成肝特异性启动子适合于以LP1启动子的活性的至少100%,优选LP1启动子活性的150%、200%、300%或500%的水平促进肝特异性转基因表达。这样的肝特异性表达适当地在肝来源细胞中确定,例如,在Huh7和/或HepG2细胞或原代肝细胞(适当地原代人肝细胞)中确定。
本发明的合成肝特异性启动子还能够在肝来源细胞(例如Huh7和/或HepG2细胞)中以与CMV-IE相比至少150%,优选地在肝来源细胞中以CMV-IE启动子的至少200%的水平促进基因的肝特异性表达。
本文中使用的术语“核酸”通常是指基本上由核苷酸构成的任何长度的寡聚物或聚合物(优选线性聚合物)。核苷酸单元通常包含杂环碱基、糖基团和至少一个(例如一个、两个或三个)磷酸基团,包括经修饰或经取代的磷酸基团。杂环碱基可尤其包括嘌呤和嘧啶碱基,例如腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U),它们广泛存在于天然存在的核酸、另一些天然存在的碱基(例如黄嘌呤,肌苷、次黄嘌呤)以及经化学或经生物化学修饰的(例如甲基化的)、非天然或衍生化的碱基中。糖基团可尤其包括戊糖(戊呋喃糖)基团,例如优选在天然存在的核酸中常见的核糖和/或2-脱氧核糖,或阿拉伯糖、2-脱氧阿拉伯糖、苏糖或己糖糖基团,以及经修饰或经取代的糖基团。如本文中预期的,核酸可包括天然存在的核苷酸、经修饰的核苷酸或其混合物。经修饰的核苷酸可包括经修饰的杂环碱基、经修饰的糖部分、经修饰的磷酸基团或其组合。可引入对磷酸基团或糖的修饰以提高稳定性、对酶降解的抗性或另一些有用的特性。术语“核酸”还优选涵盖DNA、RNA和DNA RNA杂交分子,具体包括hnRNA、前mRNA、mRNA、cDNA、基因组DNA、扩增产物、寡核苷酸,以及合成的(例如化学合成的)DNA、RNA或DNA RNA杂交体。核酸可以是天然存在的,例如存在于自然中或从自然分离;或可以是非天然存在的,例如重组的,即通过重组DNA技术产生的,和/或部分或全部通过化学或生物化学合成的。“核酸”可以是双链的、部分双链的或单链的。在单链的情况下,核酸可以是有义链或反义链。另外,核酸可以是环形或线性的。
术语“同一性”和“相同”等是指两个聚合物分子之间,例如两个核酸分子之间,例如两个DNA分子之间的序列相似性。可进行序列比对和序列同一性的确定,例如,使用Altschul et al.1990(J Mol Biol 215:403-10)最初描述的基本局部比对搜索工具(Basic Local Alignment Search Tool,BLAST),例如Tatusova和Madden 1999(FEMSMicrobiol Lett 174:247-250)描述的“Blast 2序列”算法进行。
用于比对序列以进行比较的方法是本领域公知的。多种程序和比对算法描述于例如:Smith和Waterman(1981)Adv.Appl.Math.2:482;Needleman和Wunsch(1970)J.Mol.Biol.48:443;Pearson和Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;Higgins和Sharp(1988)Gene 73:237-44;Higgins和Sharp(1989)CABIOS 5:151-3;Corpetet al.(1988)Nucleic Acids Res.16:10881-90;Huang et al.(1992)Comp.Appl.Biosci.8:155-65;Pearson et al.(1994)Methods Mol.Biol.24:307-31;Tatiana et al.(1999)FEMS Microbiol.Lett.174:247-50。序列比对方法和同源性计算的详细考虑可见于例如Altschul et al.(1990)J.Mol.Biol.215:403-10中。
美国国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)基本局部比对搜索工具(BLASTTM;Altschul et al.(1990))可从多个来源获得,包括美国国家生物技术信息中心(Bethesda,MD)和互联网,其用于与多个序列分析程序结合使用。关于如何使用该程序确定序列同一性的描述可在互联网上在BLASTTM的“帮助”部分下获得。为了比较核酸序列,可使用默认参数使用BLASTTM(Blastn)程序的“Blast 2序列”功能。当通过这种方法评估时,与参考序列具有更大相似性的核酸序列将显示出提高的同一性百分比。通常来说,序列同一性百分比是在序列的整个长度上计算的。
例如,通过具有以下评分参数的Needleman-Wunsch算法适当地找到全局最优比对:匹配评分:+2,不匹配评分:-3;空位罚分:空位开放5,空位延伸2。所得最佳全局比对的同一性百分比适当地通过比对碱基的数目与比对总长度的比值来计算,其中比对长度包括匹配和不匹配二者,乘以100。
术语“杂交”意指在杂交过程中与两个至少部分互补的核苷酸序列退火。为了允许杂交发生,互补核酸分子通常被加热或化学变性以将双链解链成两条单链和/或从单链核酸去除发夹或其他二级结构。杂交的严格性受条件例如温度、盐浓度和杂交缓冲液组成的影响。常规杂交条件描述于例如Sambrook(2001)Molecular Cloning:a laboratorymanual,第3版Cold Spring Harbor Laboratory Press,CSH,New York中,但熟练的技术人员将理解许多不同的杂交条件可以针对核酸序列的已知或预期同源性和/或者长度进行设计。杂交的高严格条件包括高温和/或低钠/盐浓度(盐包括钠,如例如在NaCl和Na-柠檬酸盐中)和/或在杂交缓冲液中包含甲酰胺和/或在杂交缓冲液中降低化合物例如SDS(十二烷基硫酸钠洗涤剂)的浓度,和/或从杂交缓冲液中排除化合物,例如硫酸右旋糖苷或聚乙二醇(促进分子拥挤)。作为一些非限制性实例,严格杂交的代表性盐和温度条件是:1×SSC,0.5%SDS,在65℃下。缩写SSC是指用于核酸杂交溶液的缓冲液。一升20X(20倍浓缩物)储备SSC缓冲溶液(pH 7.0)包含175.3g氯化钠和88.2g柠檬酸钠。实现杂交的代表性时间段是12小时。
术语“转录因子结合位点”(TFBS)是本领域公知的。本文中公开了多个特定的TFBS序列。对于技术人员将明显的是,可使用替代的TFBS序列,前提是它们与预期的TF结合。本文中公开的多个TFBS的共有序列是本领域已知的,并且技术人员可容易地使用该信息来确定替代的TFBS。此外,TF与给定推定序列结合的能力可由技术人员通过实验(例如,通过EMSA和本领域公知的并在本文中讨论的其他方法)容易地确定。
“共有序列”的含义在本领域中是公知的。在本申请中,除非上下文另有说明,否则以下符号用于共有序列。考虑以下示例性DNA序列:
A[CT]N{A}YR
A意指A总是存在于该位置中;[CT]代表该位置中的C或T;N代表该位置中的任意碱基;以及{A)意指存在于该位置中的除A之外的任意碱基。Y表示任何嘧啶,以及R表示任何嘌呤。
本申请中的“合成的”意指自然界中不存在的核酸分子。本发明的合成核酸表达构建体是人工产生的,通常通过重组技术产生。这样的合成核酸可包含天然存在的序列(例如,启动子、增强子、内含子和其他这样的调节序列),但是这些在非天然存在的背景下存在。例如,合成基因(或基因的一部分)通常包含本质上不连续的一个或更多个核酸序列(嵌合序列),和/或可涵盖替换、插入和缺失及其组合。
本文中使用的“互补的”或“互补性”是指两个核酸序列的沃森-克里克碱基配对。例如,对于序列5′-AGT-3′,其与互补序列3′-TCA-5′结合。两个核酸序列之间的互补性可以是“部分的”,其中仅一些碱基与其互补序列结合,或者当序列中的每个碱基与其互补碱基结合时,它可以是完整的。核酸链之间的互补程度对核酸链之间的杂交效率和强度具有显著作用。
本申请中的“转染”广泛地是指将核酸有意引入到细胞中的任何过程,并且涵盖了病毒载体和非病毒载体的引入,并且包括转化、转导和类似术语以及过程。一些实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔(Fromm et al.(1986)Nature 319:791-3);脂质体转染(Feigner et al.(1987)Proc.Natl.Acad.Sci.USA 84:7413-7);显微注射(Mueller et al.(1978)Cell 15:579-85);农杆菌属介导的转移(Fraley et al.(1983)Proc.Natl.Acad.Sci.USA 80:4803-7);直接DNA摄取;晶须介导的转化;以及微弹轰击(Klein et al.(1987)Nature 327:70)。
本文中使用的短语“转基因”是指外源核酸序列。在一个实例中,转基因是编码工业或药学上可用的化合物的基因,或编码期望性状的基因。在又一个实例中,转基因编码反义核酸序列,其中反义核酸序列的表达抑制靶核酸序列的表达。转基因优选地编码治疗性产物,例如,蛋白质。
术语“载体”是本领域公知的,并且如本文中使用是指核酸分子,例如,双链DNA,其中可插入根据本发明的核酸序列。载体适用于将插入的核酸分子转运到合适的宿主细胞中。载体通常包含允许转录插入核酸分子,并且优选地将转录物翻译成多肽的所有必需元件。载体通常包含所有必需的元件,使得一旦载体进入宿主细胞中,载体就可独立于宿主染色体DNA复制或与宿主染色体DNA一致复制;可产生载体及其插入的核酸分子的数个拷贝。本发明的载体可以是附加型载体(即,其不整合到宿主细胞的基因组中),或者可以是整合到宿主细胞基因组中的载体。该定义包括非病毒载体和病毒载体二者。非病毒载体包括但不限于质粒载体(例如,pMA-RQ、pUC载体、bluescript载体(pBS)和pBR322,或其不含细菌序列的衍生物(微环))、基于转座子的载体(例如PiggyBac(PB)载体或Sleeping Beauty(SB)载体)等。较大的载体,例如人工染色体(细菌(BAC)、酵母菌(YAC)或人(HAC))可用于容纳更大的插入物。病毒载体来源于病毒,并且包括但不限于以下:逆转录病毒载体、慢病毒载体、腺相关病毒载体、腺病毒载体、疱疹病毒载体、肝炎病毒载体等。通常来说但不是必要的,病毒载体具有复制缺陷,因为它们已经失去了在给定细胞中繁殖的能力,因为复制必需的病毒基因已经从病毒载体中消除。然而,一些病毒载体也可适合于在给定的细胞(例如如,癌细胞)中特异性复制,并且通常用于触发细胞(癌细胞)特异性裂解(溶瘤(oncolysis))。病毒体是包含病毒和非病毒元件二者的载体的一个非限制性实例,特别是它们将脂质体与灭活的HIV或流感病毒组合(Yamada et al.,2003)。另一个实例涵盖与阳离子脂质混合的病毒载体。
本文中使用的术语“可操作连接(operably linked)”、“可操作连接(operablyconnected)”或等同表述是指多种核酸元件相对于彼此的布置,使得所述元件在功能上联系并且能够以预期的方式彼此相互作用。这样的元件可包括但不限于启动子、CRE(例如,增强子或其他调节元件)、聚腺苷酸化序列、一个或更多个内含子和/或外显子,以及待表达的目的基因的编码序列。核酸序列元件在正确定向或可操作连接时一起发挥作用以调节彼此的活性,并最终可影响表达产物的表达水平。调节意指提高、降低或维持特定元件的活性水平。每个元件相对于其他元件的位置可以依照每个元件的5’端和3’端或它们的位置在另一个元件或位置(例如TSS或启动子元件)的上游或下游来表示,并且任何特定元件之间的距离可通过元件之间的插入核苷酸或碱基对的数目来参考。如技术人员所理解的,可操作连接意味着功能性活性,并且不一定与天然位置连接相关。实际上,当在核酸表达盒中使用时,CRE通常将位于启动子元件的紧挨上游(尽管通常情况如此,但绝对不应将其理解为限制或排除核酸表达盒内的位置),但这不一定是体内的情况,例如,天然存在于基因的下游(该基因的转录被其影响)的调节元件序列能够以与当位于启动子上游时相同的方式发挥功能。因此,根据一个具体实施方案,调节元件的调节或增强作用可以是不依赖于位置的。
本文中使用的“间隔子序列”或“间隔子”是分隔两个功能性核酸序列(例如,TFBS、CRE、CRM、启动子元件等)的核酸序列。它基本上可以具有任何序列,前提是它不阻止功能性核酸序列(例如顺式调节元件)按期望发挥功能(例如,如果它包含沉默子序列、阻止期望转录因子的结合等,则可能发生这样的情况)。通常来说,它是非功能性的,因为它仅存在以将相邻的功能性核酸序列彼此隔开。在一些实施方案中,间隔子的长度可以为75、50、40、30、30或10个核苷酸或更少。
本文中使用的术语“可药用”与本领域一致,并且意指与药物组合物的其他成分相容并且对其接受者无害。
“治疗有效量”和类似短语意指在对象中提供期望的特定药理作用(例如,在肝中表达治疗性基因)的剂量或血浆浓度。治疗有效量可能并不总是有效治疗本文中所述的病症,即使这样的剂量被本领域技术人员认为是治疗有效量。治疗有效量可基于施用途径和剂型、对象的年龄和体重和/或所治疗的疾病或病症而变化。
术语“治疗(treatment)”或“治疗(treating)”是指减少、减轻或消除疾病或病症的一个或更多个体征、症状或影响。
向对象“施用”药剂包括将药剂引入或递送至对象以进行其预期功能的任何途径。施用可通过任何合适的途径进行,包括经口、鼻内、眼内、眼科、肠胃外(静脉内、肌内、腹膜内或皮下),或表面。施用包括自施用和由他人施用。
术语“个体”、“对象”和“患者”可互换使用,并且是指患有需要治疗的疾病或病症的任何个体对象。出于本公开内容的目的,对象可以是灵长类,优选人,或另一些哺乳动物,例如狗、猫、马、猪、山羊或牛等。
实施例
实施例1-序列
以下序列与本公开内容相关:
表5-顺式调节元件(CRE):
Figure BPA0000307894250000911
Figure BPA0000307894250000921
表6-最小/近端启动子:
Figure BPA0000307894250000931
表7-V1(LVR_CRE0077_V1)的组成部分:
Figure BPA0000307894250000932
表8-V2(LVR_CRE0078_V2)的组成部分:
Figure BPA0000307894250000941
表9-CRE0018中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000942
表10-CRE0042中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000943
表11-CRE0051中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000951
表12-CRE0058中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000952
表13-CRE0065中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000953
表14-CRE0065.1中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000961
表15-CRE0066中的TFBS(TFBS以粗体示出)——相同的TFBS存在于CRE0066.1和CRE0066.2中:
Figure BPA0000307894250000962
表16-CRE0068中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000963
表17-CRE0074中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000971
表18-CRE0001中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000972
表19-CRE0012中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000973
表20-CRE0047中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000981
表21-CRE0056中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000982
表22-CRE0062中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000983
表23-CRE0077中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000984
表24-CRE0078中的TFBS(TFBS以粗体示出):
Figure BPA0000307894250000991
表25-启动子元件CRE0006中的TFBS和TSS序列(TFBS以粗体示出):
Figure BPA0000307894250000992
p1@VTN(加下划线的)表示CRE0006中的转录起始位点(TSS),如由基因表达Cap分析(Cap Analysis of Gene Expression,CAGE)确定。NB CRE0006也可以被认为是合成肝特异性启动子,由于其具有高水平的肝特异性活性,即使不存在另外的CRE(SP0154)也是如此。
表26-启动子元件CRE0079中的TFBS和TSS序列(TFBS以粗体示出):
Figure BPA0000307894250001001
p1@SERPINA7(加下划线的)表示CRE0079中的TSS,如由CAGE确定。
表27-启动子元件CRE0059中的TFBS和TSS序列(TFBS以粗体示出):
Figure BPA0000307894250001002
p1@AFP(加下划线的)表示CRE0059中的TSS,如由CAGE确定。
表28-启动子元件CRE0073中的TFBS和TSS序列(TFBS以粗体示出):
Figure BPA0000307894250001003
p1@SERPINA1(加下划线的)表示CRE0073中的TSS,如由CAGE确定。
表29-启动子元件CRE0073.1中的TFBS和TSS序列(TFBS以粗体示出):
Figure BPA0000307894250001011
p1@SERPINA1(加下划线的)表示CRE0073.1中的TSS,如由CAGE确定。
表30-启动子元件CRE0040中的TFBS和TSS序列(TFBS以粗体示出):
Figure BPA0000307894250001012
p1@FGA(加下划线的)表示CRE0040中的TSS,如由CAGE确定。
表31-顺式调节模块(CRM):
Figure BPA0000307894250001021
Figure BPA0000307894250001031
Figure BPA0000307894250001041
Figure BPA0000307894250001051
Figure BPA0000307894250001061
Figure BPA0000307894250001071
表32-合成启动子:
Figure BPA0000307894250001072
Figure BPA0000307894250001081
Figure BPA0000307894250001091
Figure BPA0000307894250001101
Figure BPA0000307894250001111
Figure BPA0000307894250001121
Figure BPA0000307894250001131
Figure BPA0000307894250001141
Figure BPA0000307894250001151
Figure BPA0000307894250001161
Figure BPA0000307894250001171
表33-现有技术启动子:
Figure BPA0000307894250001172
Figure BPA0000307894250001181
实施例2
材料和方法
启动子是使用Synpromics的专有平台
Figure BPA0000307894250001182
设计的,并由
Figure BPA0000307894250001183
合成。这涉及分析用于鉴定候选基因的肝基因表达数据集,包括微阵列和NGS数据集以及用于鉴定在肝细胞中以非常高水平表达的基因的科学文献综述。进行了顺式调节元件的选择和分析。鉴定了CRE中的TFBS。
将包含与如本文中讨论的最小/近端启动子连接的CRM的合成启动子克隆到萤光素酶报道基因上游,随后是将SV40晚期PolyA信号克隆到带有具有与pUC19基本相同的特性的骨架的载体中。将DNA制剂转染到Huh7(肝细胞癌细胞系)、HeLa(来源于宫颈癌的永生化细胞系)或HEK293(人胚肾细胞)中以评估转录活性。Huh-7细胞来源于JCRB细胞库(JCRB0403),HeLa和HEK293来源于ECACC细胞库。所有细胞系均根据细胞库建议进行生长和维持。
使用FuGene HD转染试剂(Promega #E2311)以1∶1.1的DNA∶FuGene HD比率以一式三份在48孔板中进行转染。在转染之后24小时测量萤光素酶活性。将细胞用磷酸缓冲盐水(PBS)洗涤,在100μl被动裂解缓冲液(Passive Lysis Buffer)(Promega #E194A)中裂解,并在-80℃下储存过夜。使用萤光素酶报道1000测定系统(Promega #E4550)按照制造商指导,使用96孔平底实心白色Microplate FluoroNunc板(ThermoFisher #236105)以10μl裂解物对萤光素酶活性进行定量,并在FLUOstar Omega板阅读器(BMG Labtech)机器中定量发光。
以上萤光素酶方法是本领域的常规方法,并且类似的技术已在文献中广泛描述,例如在Alam和Cook,“Reporter Genes:Application to the Study of Mammalian GeneTranscription”,ANALYTICAL BIOCHEMISTRY 188,245-254(1990)中。
讨论和结果
对大基因组数据集的生物信息学分析导致发现预期可用于增强肝特异性基因表达的顺式调节元件(CRE)。选择前12种CRE用于设计四种合成肝特异性启动子。这些启动子分别命名为LVR_127、LVR_131、LVR_132和LVR_133。这些启动子的结构示于图1中,包括每种启动子中存在的CRE和最小/近端启动子元件。
这些启动子的序列示于表32中,并且这些启动子中包含的CRM示于表31中。这些CRM/启动子的组成部分(CRE)的序列示出于表5中,并且与三种CRM可操作连接的最小/近端启动子示出于表6中。对于启动子LVR_127、LVR_131、LVR_132,包含CRE的多种组合的CRM(表31)位于最小启动子LVR_CRE0052_G6PC(参见表6)的上游。对于LVR_133,CRM位于SERPINA7近端启动子(LVR_CRE0079_SERPINA7,参见表6)的上游。
这些合成启动子在肝细胞中驱动表达的能力以遍在CMV_IE和CBA启动子为基准,并且也以已知的肝特异性启动子LP1为基准。这些启动子的序列提供于表14中。该实验的结果示于图2中,其示出了3次重复的平均值。棒显示标准偏差。
根据本发明的所有合成启动子在Huh7细胞中均显示出比LP1启动子更高的活性(图2)。当这些启动子在非肝来源的HEK293和HeLa细胞中进行反筛选时,与遍在活性启动子CMV_IE和CBA相比,它们显示出可忽略不计的活性(参见图5和图6)。这表明LVR_127、LVR_131、LVR_132和LVR_133启动子对肝细胞系中的活性具有高度特异性。
随后,使用以下CRE LVR_CRE0080_PROC、LVR_CRE0081_APOA1、LVR_CRE0061_APOB和LVR_CRE0082_APOC4基于生物信息学预测设计了两种候选增强子。这些合成增强子分别命名为“V1”(或LVR_CRE0077_V1,SEQ ID NO:19)和“V2”(或LVR_CRE0078_V2,SEQ ID NO:20)(图3)。通过将这些候选增强子添加至先前描述的LVR_127、LVR_131、LVR_132和LVR_133肝特异性启动子来测试它们的作用。已知的人α(1)-微球蛋白/双库尼茨前体(alpha(1)-microglobulin/bikunin precursor,AMBP)增强子(在本文中命名为“A1”(或LVR_CRE0051_AMBP,SEQ ID NO:3))(Rouet et al.,1992)也将它们添加至LVR_127、LVR_131、LVR_132和LVR_133肝特异性启动子。具有另外增强子元件的这些新启动子在Huh7细胞中进行了测试,如先前针对LVR_127、LVR_131、LVR_132和LVR_133肝特异性启动子描述的。
如图4a至4d中所示,添加V1或V2增强子中的任一种均显著增强了LVR_127、LVR_132和LVR_133的启动子活性。观察到的唯一例外是将LVR_131与V2组合。此外,添加V1和V2增强子序列保持了启动子肝特异性,这在HEK293和HeLa细胞中对启动子进行反筛选时得到确定(图5)。
SYNP_LVR_131启动子家族(SEQ ID NO:202,和SEQ ID NO:230至232),并且特别是SYNP_LVR_131_A1(SEQ ID NO:230)显示特别强大。因此,这些启动子和它们包含的CRM(SEQID NO:130,和SEQ ID NO:158至160,并且尤其是SEQ ID NO:158),及其功能变体是特别令人感兴趣的。然而,根据本发明的所有合成启动子均显示为强大的和肝特异性的。
预计在具体例示的CRM和启动子中使用的CRE可以重新布置(例如,移动或倒置)并且肝特异性启动子活性将保持。此外,预计CRE、CRM和启动子的序列可以显著改变,同时保持肝特异性启动子活性。通常来说,CRE内的TFBS应保持为CRE仍然能够结合相同TF的程度,并且优选与参考CRE具有相同的顺序和近似间距,以保持功能。通常来说,公开的CRE(即增强子)本身是独立的调节单元,并且它们可以被移动和/或改变方向,而不会损失功能。技术人员可使用本文中所述的方法容易地确定任何改变对CRE、CRM或启动子的作用(例如,以绝对项或者与参考CRE、CRM或启动子相比)。此外,可将CRE并入在其他启动子中以驱动肝特异性表达(尤其是被认为具有特别广泛的用途的V1和V2,以及本文中公开的其他CRE)。
总之,这些新的合成启动子和增强子是用于通过肝特异性基因表达进行基因治疗和用于设计肝特异性基因治疗的有价值工具。
实施例3
大基因组数据集的生物信息学分析和文献分析导致鉴定了预期可用于增强肝特异性基因表达的另外的顺式调节元件(CRE)。这些CRE用于设计另一些肝特异性启动子。
所得肝特异性启动子(即表32中示出的所有启动子)的活性使用基本上如实施例2中所述的材料和方法在Huh7细胞中进行测试。然而,在这样的情况下,将肝特异性启动子的活性与启动子TBG的活性进行比较,因为发现TBG具有比LP1更高且更一致的体外表达。
肝特异性启动子对肝细胞的特异性还使用非肝HEK293细胞,使用实施例2中描述的材料和方法进行测试。与CMV-IE的活性相比,表达了肝特异性启动子的活性(TBG和LP1是肝特异性的,并因此在HEK293细胞中不是特别具有活性的)。示出了在HEK293细胞中测试的肝特异性启动子的特异性的图中的“相对活性”是以相对于CMV-IE活性的比率表示的所命名启动子的活性,其中1是与CMV-IE的活性相同,大于1是与CMV-IE相比活性更高,而小于1是与CMV-IE相比活性更低。
活性
根据本发明的启动子的平均活性示于图8A、图9A、图10A和图11A中。示出了每个启动子的不同实验的平均相对活性,其中每个实验本身就是技术重复的平均值。误差棒是平均值的标准误差。如果不存在误差棒,则数据来自单个实验。示出了在Huh7细胞中测试的肝特异性启动子的活性的这些图中的“相对活性”是以TBG活性的百分比表示的所命名启动子的活性(即,其中100是与TBG的活性相同,大于100是与TBG相比活性更高,而小于100是与TBG相比活性更低)。应该注意的是,TBG是非常强大的肝特异性启动子,并因此显示出低于TBG的表达的启动子仍然可以非常有用。特别地,比TBG短但仍表现出高水平活性(例如TBG活性的15%,更优选25%、50%或75%或更高)的启动子是特别令人感兴趣的。
可见,本发明的合成肝特异性启动子在肝细胞中均具有高度活性。
仅包含启动子元件CRE0006(SP0154)和CRE0040(SP0235)的两个启动子的平均活性作为比较示于图11B中。
图11B示出了仅包含启动子元件CRE0006的SP0154的活性。与TBG相比,SP0154的活性相对更低,但考虑到缺乏任何另外的CRE,它实际上出乎意料地很高。然而,当另外的CRE与启动子元件CRE0006组合时,例如在启动子SP0155(CRE0006和CRE0001)、SP0158(CRE0006和CRE0005)和SP0163(CRE0006和CRE0012)中,所得合成肝特异性启动子的活性分别提高了5倍、3倍和6倍,如图11A中所示。类似地,当启动子元件CRE0006与CRE组合组合时,例如在启动子SP259(CRE0006与CRE0001和CRE0047组合)中,所得合成启动子的活性提高了4倍,如图11A中所示。这表明单独的CRE CRE0001、CRE0005、CRE0012以及CRE0001与CRE0047的组合当添加至启动子元件(例如CRE0006)时可提供相当大的增强活性。
图11B还示出了仅包含启动子元件CRE0040的SP0235的活性。SP0235具有最小的相对活性。然而,当另外的CRE与启动子元件CRE0040组合时,例如在启动子SP0236和SP264(二者均包含CRE0040和CRE0018)中,所得合成启动子的活性提高了约50倍,如图11A中所示。类似地,当启动子元件CRE0040与多种CRE的组合组合时,例如在启动子SP0252(CRE0040与CRE0018和CRE0077组合)中,所得合成启动子的活性提高了约40倍,如图11A中所示。这表明单独的CRE CRE0018以及CRE0018与CRE0077的组合在添加至启动子元件(例如CRE0040)时可提供相当大的增强活性。
在图11A中,启动子SP0236和SP0264包含相同的CRE和启动子元件,但SP0236不具有共有Kozak序列,而SP0264具有共有Kozak序列。共有Kozak序列的存在显示不会影响启动子的活性。
肝特异性
HEK293细胞中启动子相对于CMV-IE的活性示于图8B、图9B、图10B和图11C中。示出了每个启动子的不同实验的平均相对活性。如果不存在误差棒,则结果来自单个实验。大多数(但不是全部)启动子的特异性已经过实验测试。根据本发明的许多启动子在HEK293细胞中具有低表达,如在HEK293细胞中的活性低于CMV-IE活性的50%所表明的。大多数启动子在HEK293细胞中的活性为低于CMV-IE活性的10%,这表明它们的活性是非常肝特异性的。
鉴定高性能CRE和启动子元件
组装了包含预期可用于增强肝特异性基因表达的CRE和/或启动子元件的多种组合的超过200种启动子的大组(这包括实施例3中使用的所有合成启动子以及另外的肝特异性启动子和肝特异性CRE)。这些启动子代表可用于评估多种CRE对表达所作贡献的肝特异性启动子的大组。该大组启动子在图12A和12B中被称为“所有”。
对该组进行分析以鉴定与高水平肝特异性表达特别强相关的单独CRE和CRE组。
在所有受试启动子组中,发现了包含选自CRE0018、CRE0042、CRE0051、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074的两种或更多种可操作连接的“核心”CRE的特定肝特异性启动子子集与高水平活性特别密切地相关。该优选的启动子组在图12A和12B中被称为“组1”。
另外,发现包含与启动子元件CRE0059和CRE0006之一可操作连接的上述核心CRE中的至少一种的肝特异性启动子的另外子集与高活性特别密切地相关。该优选启动子组在图12A和12B中被称为“组2”。应该注意的是,一些启动子同时落入“组1”和“组2”(即其中它们包含两种或更多种核心CRE以及CRE0059或CRE0006)。
为了举例说明“组1”和“组2”启动子的特别高活性,组“所有”(n=217)、“组1”(n=49)和“组2”(n=20)的平均相对活性示于图12A中(注意,“所有”包含“组1”和“组2”的启动子加上另外的启动子)。如从该图中可以看出,“组1”的平均相对活性比组“所有”的平均相对活性高约一倍。另外,“组2”的平均相对活性比组“所有”的平均相对活性高约两倍。这显示不是组之间长度差异的结果,因为当每个启动子的相对活性除以其尺寸(以碱基对计)时,“组1”和“组2”仍然优于组“所有”,并且每个组的该值的平均值示于图12B中。
不希望受理论束缚,“组1”和“组2”的优异性能可由于存在核心CRE和优选启动子元件中的一种或更多种引起。在所有受试启动子的组(组“所有”)中,对每个启动子中存在的CRE数目进行计数。另外,对每个启动子中存在的核心CRE的数目进行计数,其中核心CRE再次是CRE0018、CRE0042、CRE0051、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074。对具有特定数目的核心CRE相对于任何CRE的启动子的平均活性进行计算,并示于图13A中。该图示出了启动子中特定数目的核心CRE的存在与和具有特定数目的CRE的启动子相比(其中CRE是任何CRE)提高的活性相关。这不是因为包含特定数目的核心CRE的启动子组与具有特定数目的任何CRE的启动子组之间的尺寸的差异,因为相对于尺寸的活性比较显示出类似的趋势,如图13B中所示。
当一种或更多种核心CRE与优选启动子元件(例如CRE0059或CRE0006)组合时,所得合成启动子的活性甚至更高,这可以从“组2”(包含至少一种核心CRE和优选启动子元件的启动子)与“组1”(包含至少两种核心CRE的启动子)相比更高的平均相对活性看出。
启动子中核心CRE组中多种CRE子集的存在也与高水平活性相关。例如,包含CRE0051和CRE0058二者的启动子(n=25)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”(n=50)的具有两种CRE的启动子的平均活性,如可见于图15A和图15B中。类似地,包含CRE0051、CRE0058和CRE0065的启动子(n=15)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有三种CRE的启动子(n=19)的平均活性,如可见于图16A和图16B中。包含CRE0051、CRE0058和CRE0066的启动子(n=8)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有三种CRE的启动子(n=19)的平均活性,如可见于图17A和图17B中。包含CRE0051、CRE0058、CRE0065和CRE0066的启动子(n=7)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有四种CRE的启动子(n=15)的平均活性,如可见于图18A和图18B中。包含CRE0051、CRE0065和CRE0066的启动子(n=19)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有三种CRE的启动子(n=19)的平均活性,如可见于图19A和图19B中。包含CRE0051、CRE0058和CRE0074的启动子(n=6)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有三种CRE的启动子(n=19)的平均活性,如可见于图20A和图20B中。包含CRE0051、CRE0058、CRE0065和CRE0074的启动子(n=4)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有四种CRE的启动子(n=15)的平均活性,如可见于图21A和图21B中。包含CRE0058、CRE0065和CRE0066的启动子(n=19)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有三种CRE的启动子(n=50)的平均活性,如可见于图22A和图22B中。最后,包含CRE0058、CRE0065和CRE0074的启动子(n=14)的平均活性和相对于尺寸(以碱基对计)的平均活性高于来自组“所有”的具有两种CRE的启动子(n=19)的平均活性,如可见于图23A和图23B中。总体而言,上述CRE组合的存在与更高的活性相关。这不是由于组间尺寸的差异引起,因为对相对于尺寸(以碱基对计)的活性的归一化揭示了包含上述CRE组合的启动子的类似优异性能。
实施例4
AAV产生
在体内测试了根据本发明的启动子子集的活性。本研究中包括的合成启动子是LVR-239(SP0239)、LVR-244(SP0244)和阳性对照LP1。使用的报道基因是fLUC-T2A-EGFP,即通过T2A信号(双向自切割肽)与mEGFP(突变体绿色荧光蛋白)融合的fLUC(萤火虫萤光素酶)。pAAV_SYNP_Luc-T2A-GFP目的载体来源于pAAV ZsGreen1(购自Clontech),其中ZsGreen1报道子被Luc-T2A-GFP双报道子替换。所有DNA质粒均使用QIAGEN Plasmid Mega试剂盒(Qiagen#12181,Germany)根据制造商说明进行制备。
将HEK293T细胞在组织培养处理的145mm培养皿(Greiner Bio-One Ltd# 639160,UK)中,于补充有10%(v/v)胎牛血清(Sigma# F7524,UK)的Dulbecco改良的Eagle培养基,高葡萄糖,GlutaMAX补充(Gibco(Life Technologies)# 61965-059,UK)中培养,并在37℃和5%CO2下孵育。用于细胞培养的其他试剂购自Invitrogen-UK,以及塑料制品购自LifeTechnologies。
本研究中使用的所有AAV载体均在AAV9衣壳中假型化。将HEK293T细胞用作生产者细胞,在其中它们与其中报道基因由不同的启动子控制的质粒以及允许病毒繁殖的编码辅助功能的质粒(pDG9)共转染。使用聚乙烯亚胺(PEI)(Sigma-Aldrich#764604,UK)以(1ug/ul)的储备浓度使用摩尔比为1∶3(DNA∶PEI)转染HEK293T细胞。
AAV纯化和滴定
在转染72小时之后,将细胞裂解并将粗制裂解物过滤,然后通过包含POROSTMCaptureSelectTM AAV树脂(Thermo Scientific,#A36739)的HPLC柱并使用
Figure BPA0000307894250001261
plus(高效液相色谱-HPLC系统(GE Healthcare,#11001313)进行纯化。
载体基因组的数目通过在QuantStudioTM 3System Real-Time PCR(ThermoFisher Scientific,UK)中,按照
Figure BPA0000307894250001262
Universal qPCR Master Mix(NEB#M3003,UK)的制造商说明,用正向引物(ACGCTGGGCTACTTGATC-SEQ ID NO:265)、反向引物(CGAGGAGGAGCTATTCTTG-SEQ ID NO:266)和探针(TTTCGGGTCGTGCTCATG-SEQ ID NO:267)进行靶向LUC盒的qPCR滴定来确定,以及数据由QuantStudio设计和分析软件V1.4.1来分析。
动物程序
远交系6周龄CD1雄性小鼠购自Charles River-UK。将它们保持隔离一周,并随后将其转移至其封闭的通风笼,并维持在最低限度的疾病设施中。将它们以5只小鼠/笼分笼,并在随意进食和饮水的情况下相对于其体重归一化。将新近饲养的小鼠给予另外的适应周,然后进行任何实验。这项研究是根据法定内政部建议;监管、伦理和许可程序;以及1986年动物(科学程序)法案(Animals(Scientific Procedures)Act 1986),并遵循伦敦大学学院(University College London)的机构指导进行的。
动物注射
将AAV施用于在暖室(Thermo Fisher Scientific,UK)中用医用空气(21%氧气)(Abbotts Laboratories,UK)中提供的2%至4%异氟烷麻醉的8周龄的年轻成年雄性CD1小鼠。使用胰岛素注射器:27G 1/2英寸,1.0ml(Fisher Scientific,UK)对小鼠静脉内注射到侧尾静脉中。将每只小鼠注射最终体积为200μl的生理盐水溶液中8E+10AAV病毒基因组/小鼠的AAV载体剂量。然后允许小鼠恢复至正常温度,然后将其放回其笼中。
生物发光成像
每周对小鼠进行全身生物发光成像。在适当的情况下,用医用空气(21%氧气)中提供的2%至4%异氟烷将小鼠麻醉,并使用胰岛素注射器(Fisher Scientific,UK)使其接受300μl的15mg/mL D-萤光素钾盐(Syd Labs#MB000102,US)的腹膜内注射。D-荧光素储液在生理盐水(Gibco#14190-094,UK)中制备。在5分钟之后,使用冷却的电荷耦合装置照相机(IVIS Lumina II机器,Perkin Elmer,UK)以1秒至10秒对小鼠进行成像。使用IVIS LuminaLiving图像4.5.5(Perkin Elmer)测量感兴趣区域(ROI),并将其以光子/秒/平方厘米/球面度(光子/秒/cm2/sr)表示。
数据
该研究的结果示于图13B中。结果以每组中所有受试动物的平均萤光素酶生物发光强度、总通量(以光子/秒计)表示。误差棒是平均值的标准误差。
在“盐水”组(n=10)中,动物仅注射盐水,并且未检测到萤光素酶生物发光。该组是阴性对照,并且表明如果没有注射与启动子可操作连接的萤光素酶,则未检测到萤光素酶生物发光。
在“LP1”组(n=9)中,向动物注射与LP1启动子可操作连接的萤光素酶,并检测到萤光素酶生物发光。该组为阳性对照,并且表明萤光素酶在LP1启动子的控制下表达并可检测到。
为了测试根据本发明的肝特异性启动子的活性,向动物注射包含与两个启动子可操作连接的萤光素酶的构建体。在“SP0244”组(n=8)中,萤光素酶与SP0244启动子可操作地连接。在“SP0239”组(n=10)中,萤光素酶与SP0239启动子可操作地连接。
如从图13B中可以看出,“SP0244”和“SP0239”组比“LP1”组具有更高的生物发光强度。启动子SP0244和SP0239在体内显示出高活性,并且其活性高于LP1的活性。
该实验表明在实施例3中获得的体外结果与在体内获得的结果相关。此外,与实施例3中提供的数据一致,表明核心CRE与优选的启动子元件(CRE0006和CRE0059)的存在之间存在关系,在体内显示高表达的启动子SP0239是如上讨论的“组1”成员,并且包含5种核心CRE。也显示出高表达的启动子SP0244同时是“组1”和“组2”的成员,其包含3种核心CRE和优选的启动子元件,即CRE0006。该数据表明,核心CRE以及核心CRE与优选启动子元件的组合的存在不仅与体外的高表达相关而且与体内的高表达相关。
本发明提供了具有不同强度的一系列肝特异性启动子,其对于在治疗环境中提供期望水平的肝特异性表达可以是非常有用的。
虽然已经结合多个具体实施方案描述和举例说明了本发明,但是本领域技术人员将理解,在不脱离如本文中所举例说明的,如所述的和所要求保护的本发明的原理的情况下可进行变化和修改。本发明可以在不脱离其精神或本质特征的情况下以其他特定形式体现。所描述的实施方案在所有方面中都被认为是举例说明性的而非限制性的。
pAAV_SYNP_Luc_2A_GFP
Figure BPA0000307894250001281
Figure BPA0000307894250001291
Figure BPA0000307894250001301
Figure ISB0000194643130000011
Figure ISB0000194643130000021
Figure ISB0000194643130000031
Figure ISB0000194643130000041
Figure ISB0000194643130000051
Figure ISB0000194643130000061
Figure ISB0000194643130000071
Figure ISB0000194643130000081
Figure ISB0000194643130000091
Figure ISB0000194643130000101
Figure ISB0000194643130000111
Figure ISB0000194643130000121
Figure ISB0000194643130000131
Figure ISB0000194643130000141
Figure ISB0000194643130000151
Figure ISB0000194643130000161
Figure ISB0000194643130000171
Figure ISB0000194643130000181
Figure ISB0000194643130000191
Figure ISB0000194643130000201
Figure ISB0000194643130000211
Figure ISB0000194643130000221
Figure ISB0000194643130000231
Figure ISB0000194643130000241
Figure ISB0000194643130000251
Figure ISB0000194643130000261
Figure ISB0000194643130000271
Figure ISB0000194643130000281
Figure ISB0000194643130000291
Figure ISB0000194643130000301
Figure ISB0000194643130000311
Figure ISB0000194643130000321
Figure ISB0000194643130000331
Figure ISB0000194643130000341
Figure ISB0000194643130000351
Figure ISB0000194643130000361
Figure ISB0000194643130000371
Figure ISB0000194643130000381
Figure ISB0000194643130000391
Figure ISB0000194643130000401
Figure ISB0000194643130000411
Figure ISB0000194643130000421
Figure ISB0000194643130000431
Figure ISB0000194643130000441
Figure ISB0000194643130000451
Figure ISB0000194643130000461
Figure ISB0000194643130000471
Figure ISB0000194643130000481
Figure ISB0000194643130000491
Figure ISB0000194643130000501
Figure ISB0000194643130000511
Figure ISB0000194643130000521
Figure ISB0000194643130000531
Figure ISB0000194643130000541
Figure ISB0000194643130000551
Figure ISB0000194643130000561
Figure ISB0000194643130000571
Figure ISB0000194643130000581
Figure ISB0000194643130000591
Figure ISB0000194643130000601
Figure ISB0000194643130000611
Figure ISB0000194643130000621
Figure ISB0000194643130000631
Figure ISB0000194643130000641
Figure ISB0000194643130000651
Figure ISB0000194643130000661
Figure ISB0000194643130000671
Figure ISB0000194643130000681
Figure ISB0000194643130000691
Figure ISB0000194643130000701
Figure ISB0000194643130000711

Claims (52)

1.合成肝特异性顺式调节模块(CRM),其包含选自以下的两种或更多种可操作连接的顺式调节元件(CRE):
-CRE0018(SEQ ID NO:1)或其功能变体;
-CRE0042(SEQ ID NO:2)或其功能变体;
-CRE0051(SEQ ID NO:3)或其功能变体;
-CRE0058(SEQ ID NO:4)或其功能变体;
-CRE0065(SEQ ID NO:5)或其功能变体;
-CRE0066(SEQ ID NO:7)或其功能变体;
-CRE0068(SEQ ID NO:10)或其功能变体;和
-CRE0074(SEQ ID NO:11)或其功能变体。
2.权利要求1所述的合成肝特异性CRM,其包含三种或更多种、四种或更多种、五种或更多种、或者六种或更多种所述CRE。
3.权利要求1或2所述的合成肝特异性CRM,其包含选自以下的CRE或其功能变体的组合:
-CRE0051和CRE0058;
-CRE0051和CRE0042;
-CRE0051、CRE0058和CRE0065;
-CRE0051、CRE0058和CRE0066;
-CRE0051、CRE0058、CRE0065和CRE0066;
-CRE0018、CRE0051、CRE0058、CRE0065和CRE0066
-CRE0051、CRE0065和CRE0066;
-CRE0051、CRE0074和CRE0058;
-CRE0051、CRE0074、CRE0058和CRE0065;
-CRE0051、CRE0074、CRE0058、CRE0065和CRE0066;
-CRE0058和CRE0065;
-CRE0068和CRE0042;
-CRE0058、CRE0065和CRE0066;
-CRE0074、CRE0058和CRE0065;以及
-CRE0074、CRE0058、CRE0065和CRE0066。
4.权利要求3所述的合成肝特异性CRM,其中所述CRE或其功能变体以所记载顺序存在于所述CRM中,并且优选地其中它们彼此相邻。
5.任一前述权利要求中所述的合成肝特异性CRM,其包含选自以下的两种、三种、四种或更多种CRE:
-CRE0051或其功能变体;
-CRE0058或其功能变体;
-CRE0065或其功能变体;
-CRE0066或其功能变体;和
-CRE0074或其功能变体。
6.任一前述权利要求中所述的合成肝特异性CRM,其还包含选自以下的一种或更多种CRE:
-CRE0001(SEQ ID NO:12)或其功能变体;
-CRE0005(SEQ ID NO:13)或其功能变体;
-CRE0012(SEQ ID NO:14)或其功能变体;
-CRE0047(SEQ ID NO:15)或其功能变体;
-CRE0048(SEQ ID NO:16)或其功能变体;
-CRE0056(SEQ ID NO:17)或其功能变体;
-CRE0062(SEQ ID NO:18)或其功能变体;
-CRE0077(SEQ ID NO:19)或其功能变体;
-CRE0078(SEQ ID NO:20)或其功能变体;
-CRE0083.1(SEQ ID NO:21)或其功能变体;和
-CRE0089(SEQ ID NO:22)或其功能变体。
7.任一前述权利要求中所述的合成肝特异性CRM,其包含选自以下的CRE或其功能变体的组合:
-CRE0018、CRE0077、CRE0074、CRE0058、CRE0065;
-CRE0068、CRE0042;
-CRE0051、CRE0058;
-CRE0051、CRE0042;
-CRE0065、CRE0051、CRE0083.1;
-CRE0018、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0012、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0058、CRE0018;
-CRE0051、CRE0058、CRE0065、CRE0018;
-CRE0051、CRE0058、CRE0065、CRE0012;
-CRE0047、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;
-CRE0051、CRE0058、CRE0065、CRE0001;
-CRE0051、CRE0058、CRE0065;和
-CRE0051、CRE0066.2。
8.权利要求7所述的合成肝特异性CRM,其中所述CRE或其功能变体以所记载顺序存在于所述CRM中,并且优选地其中它们彼此相邻。
9.任一前述权利要求中所述的合成肝特异性CRM,其包含选自以下的CRE或其功能变体的组合:CRE0051、CRE0066.2;CRE0065、CRE0051、CRE0083.1;CRE0065、CRE0066.2;CRE0066、CRE0066;CRE0065、CRE0066;CRE0074、CRE0058、CRE0065.1;CRE0051、CRE0074、CRE0058、CRE0065.1;CRE0077、CRE0074、CRE0058、CRE0065.1;CRE0078、CRE0074、CRE0058、CRE0065.1;CRE0074、CRE0074、CRE0065;CRE0058、CRE0065、CRE0066;CRE0074、CRE0058、CRE0065、CRE0066;CRE0074、CRE0058;CRE0018、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065;CRE0012、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0012;CRE0051、CRE0058、CRE0065、CRE0018;CRE0051、CRE0058、CRE0065、CRE0001;CRE0051、CRE0058、CRE0065、CRE0077;CRE0051、CRE0058、CRE0018;CRE0047、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0066;CRE0077、CRE0058、CRE0065、CRE0066;CRE0078、CRE0058、CRE0065、CRE0066;CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;CRE0077、CRE0074、CRE0058、CRE0065、CRE0066;CRE0078、CRE0074、CRE0058、CRE0065、CRE0066;CRE0051、CRE0074、CRE0058;CRE0077、CRE0074、CRE0058;CRE0078、CRE0074、CRE0058;CRE0051、CRE0058;CRE0068、CRE0042;CRE0051、CRE0058、CRE0066;CRE0051、CRE0065、CRE0066;CRE0018、CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0074、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0074、CRE0058、CRE0065;和CRE0051、CRE0042。
10.权利要求9所述的合成肝特异性CRM,其中所述CRE或其功能变体以所记载顺序存在于所述CRM中,并且优选地其中它们彼此相邻。
11.任一前述权利要求中所述的合成肝特异性CRM,其包含选自以下的CRE或其功能变体的组合:
-CRE0018、CRE0051、CRE0058、CRE0065、CRE0066;
-CRE0051CRE0058、CRE0065、CRE0012;
-CRE0051、CRE0058、CRE0065、CRE0066;和
-CRE0051、CRE0042。
12.权利要求11所述的合成肝特异性CRM,其中所述CRE或其功能变体以所记载顺序存在于所述CRM中,并且优选地其中它们彼此相邻。
13.任一前述权利要求中所述的合成肝特异性CRM,其包含选自以下的CRM:CRM_SP0109、CRM_SP0112、CRM_SP0113、CRM_SP0121、CRM_SP0124、CRM_SP0127、CRM_SP0127A1、CRM_SP0127V1、CRM_SP0127V2、CRM_SP0128、CRM_SP0131、CRM_SP0132、CRM_SP0133、CRM_SP0239、CRM_SP0240、CRM_SP0241、CRM_SP0242、CRM_SP0243、CRM_SP0244、CRM_SP0246、CRM_SP0247、CRM_SP0248、CRM_SP0249、CRM_SP0250、CRM_SP0251、CRM_SP0253、CRM_SP0254、CRM_SP0255、CRM_SP0256、CRM_SP0257、CRM_SP0258、CRM_SP0265、CRM_SP0266、CRM_SP0267、CRM_SP0268、CRM_SP0269、CRM_SP0270、CRM_SP0271、CRM_SP0272、CRM_SP0273、CRM_SP0368、CRM_SP0373、CRM_SP0378、CRM_SP0379、CRM_SP0380、CRM_SP0381、CRM_SP0384、CRM_SP0396、CRM_SP0397、CRM_SP0398、CRM_SP0403、CRM_SP0404、CRM_SP0405、CRM_SP0406、CRM_SP0407、CRM_SP0409、CRM_SP0411、CRM_SP0412、CRM_SP0413,或其中任意的功能变体。
14.任一前述权利要求中所述的合成肝特异性CRM,其包含CRM_SP0239、CRM_SP0244、CRM_SP0265或CRM_SP0412。
15.任一前述权利要求中所述的合成肝特异性CRM,其长度为500个或更少的核苷酸,任选地为450、400、350、300、250、200、150、100、75、60、50个或更少的核苷酸。
16.合成肝特异性启动子,其包含:
a)与启动子元件可操作连接的根据权利要求1至15中任一项所述的CRM;或者
b)至少一种以下CRE或其功能变体,其与选自CRE0059或其功能变体或者CRE0006或其功能变体的启动子元件可操作地连接;
-CRE0018或其功能变体;
-CRE0042或其功能变体;
-CRE0051或其功能变体;
-CRE0058或其功能变体;
-CRE0065或其功能变体;
-CRE0066或其功能变体;
-CRE0068或其功能变体;和
-CRE0074或其功能变体。
17.权利要求16a)所述的合成肝特异性启动子,其包含选自以下的CRE或其功能变体的组合:CRE0051、CRE0066.2;CRE0065、CRE0051、CRE0083.1;CRE0065、CRE0066.2;CRE0066、CRE0066;CRE0065、CRE0066;CRE0074、CRE0058、CRE0065.1;CRE0051、CRE0074、CRE0058、CRE0065.1;CRE0077、CRE0074、CRE0058、CRE0065.1;CRE0078、CRE0074、CRE0058、CRE0065.1;CRE0074、CRE0074、CRE0065;CRE0058、CRE0065、CRE0066;CRE0074、CRE0058、CRE0065、CRE0066;CRE0074、CRE0058;CRE0018、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065;CRE0012、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0012;CRE0051、CRE0058、CRE0065、CRE0018;CRE0051、CRE0058、CRE0065、CRE0001;CRE0051、CRE0058、CRE0065、CRE0077;CRE0051、CRE0058、CRE0018;CRE0047、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0066;CRE0077、CRE0058、CRE0065、CRE0066;CRE0078、CRE0058、CRE0065、CRE0066;CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;CRE0077、CRE0074、CRE0058、CRE0065、CRE0066;CRE0078、CRE0074、CRE0058、CRE0065、CRE0066;CRE0051、CRE0074、CRE0058;CRE0077、CRE0074、CRE0058;CRE0078、CRE0074、CRE0058;CRE0051、CRE0058;CRE0068、CRE0042;CRE0051、CRE0058、CRE0066;CRE0051、CRE0065、CRE0066;CRE0018、CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0074、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0074、CRE0058、CRE0065;和CRE0051、CRE0042。
18.权利要求17所述的合成肝特异性启动子,其中所述CRE或其功能变体以所记载顺序存在于所述CRM中,并且优选地其中它们彼此相邻。
19.权利要求16a)、17或18所述的合成肝特异性启动子,其中所述启动子元件选自CRE0006、CRE0059、CRE0052、CRE0079、CRE0073或CRE0073.1,或其中任意的功能变体。
20.权利要求16b)所述的合成肝特异性启动子,其包含选自以下的单独的CRE、或其功能变体、或者CRE或其功能变体的组合:CRE0051、CRE0066.2;CRE0065、CRE0051、CRE0083.1;CRE0065、CRE0066.2;CRE0066、CRE0066;CRE0065、CRE0066;CRE0074、CRE0058、CRE0065.1;CRE0051、CRE0074、CRE0058、CRE0065.1;CRE0077、CRE0074、CRE0058、CRE0065.1;CRE0078、CRE0074、CRE0058、CRE0065.1;CRE0074、CRE0074、CRE0065;CRE0058、CRE0065、CRE0066;CRE0074、CRE0058、CRE0065、CRE0066;CRE0074、CRE0058;CRE0018、CRE0051、CRE0058、CRE0065、CRE0066;CRE0018;CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065;CRE0012、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0012;CRE0001、CRE0018;CRE0051、CRE0058、CRE0065、CRE0018;CRE0051、CRE0058、CRE0065、CRE0001;CRE0051、CRE0058、CRE0065、CRE0077;CRE0077、CRE0018;CRE0051、CRE0058、CRE0018;CRE0005、CRE0018;CRE0018、CRE0001;CRE0047、CRE0051、CRE0058、CRE0065、CRE0066;CRE0051、CRE0058、CRE0065、CRE0066;CRE0077、CRE0058、CRE0065、CRE0066;CRE0078、CRE0058、CRE0065、CRE0066;CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;CRE0077、CRE0074、CRE0058、CRE0065、CRE0066;CRE0078、CRE0074、CRE0058、CRE0065、CRE0066;CRE0051、CRE0074、CRE0058;CRE0077、CRE0074、CRE0058;CRE0078、CRE0074、CRE0058;CRE0051;CRE0051、CRE0058;CRE0048、CRE0042;CRE0068、CRE0042;CRE0056、CRE0042;CRE0062、CRE0042;CRE0051、CRE0058、CRE0066;CRE0051、CRE0065、CRE0066;CRE0018、CRE0051、CRE0074、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0074、CRE0058、CRE0065、CRE0066;CRE0018、CRE0077、CRE0074、CRE0058、CRE0065;CRE0051、CRE0018;CRE0051、CRE0042;和CRE0042。
21.权利要求20所述的合成肝特异性启动子,其中所述CRE或其功能变体以所记载顺序存在,并且优选地其中它们彼此相邻。
22.根据权利要求16至21中任一项所述的合成肝特异性启动子,其选自:SP0109、SP0112、SP0113、SP0121、SP0124、SP0127、SP0127A1、SP0127V1、SP0127V2、SP0128、SP0131、SP0132、SP0133、SP0239、SP0240、SP0241、SP0242、SP0243、SP0244、SP0246、SP0247、SP0248、SP0249、SP0250、SP0251、SP0253、SP0254、SP0255、SP0256、SP0257、SP0258、SP0265、SP0266、SP0267、SP0268、SP0269、SP0270、SP0271、SP0272、SP0273、SP0368、SP0373、SP0378、SP0379、SP0380、SP0381、SP0384、SP0396、SP0397、SP0398、SP0403、SP0404、SP0405、SP0406、SP0407、SP0409、SP0411、SP0412和SP0413,或其中任意的功能变体。
23.合成肝特异性启动子,其包含选自以下的CRE和可操作连接的启动子元件,或其中任意的功能变体的组合:
-CRE0066.2、CRE0083.1、CRE0052;
-CRE0051、CRE0083.1、CRE0052;
-CRE0066.1、CRE0073.1;
-CRE0066.2、CRE0073.1;
-CRE0001、CRE0006;
-CRE0005、CRE0006;
-CRE0012、CRE0006;
-CRE0018、CRE0040;
-CRE0077、CRE0018、CRE0040;
-CRE0047、CRE0001、CRE0006;
-CRE0018、CRE0040;
-CRE0051、CRE0052;和
-CRE0074、CRE0052。
24.权利要求23所述的合成肝特异性启动子,其中所述CRE和可操作连接的启动子元件,或其功能变体以所记载顺序存在并且彼此相邻。
25.根据权利要求23或24所述的合成肝特异性启动子,其选自包含以下的组:SP0107、SP0111、SP0115、SP0116、SP0155、SP0158、SP0163、SP0236、SP0252、SP0259、SP0264、SP0388和SP0399,或其中任意的功能变体。
26.合成肝特异性启动子,其包含CRE0006或其功能变体、CRE0059或其功能变体;CRE0079或其功能变体、CRE0073或其功能变体;或者CRE0040或其功能变体。
27.根据权利要求26所述的合成肝特异性启动子,其包含CRE0006或其功能变体,或者CRE0059或其功能变体。
28.合成肝特异性启动子,其包含选自以下的CRE:CRE0018、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068、CRE0074、CRE0001、CRE0005、CRE0012、CRE0047、CRE0048、CRE0056、CRE0062、CRE0077、CRE0078、CRE0083.1和CRE0089,或其中任意的功能变体。
29.根据权利要求21所述的合成肝特异性启动子,其包含CRE0018、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074,或其中任意的功能变体。
30.根据权利要求16至29中任一项所述的合成肝特异性启动子,其长度为700个或更少的核苷酸,任选地为600、500、450、400、350、300、250、200、150、100、75、70或68个或更少的核苷酸。
31.根据权利要求16至30中任一项所述的合成肝特异性启动子,其表现出为TBG启动子活性的至少25%的肝特异性启动子活性。
32.根据权利要求16至30中任一项所述的合成肝特异性启动子,其表现出为TBG启动子活性的至少50%的肝特异性启动子活性。
33.根据权利要求16至30中任一项所述的合成肝特异性启动子,其表现出为TBG启动子活性的至少75%或100%的肝特异性启动子活性。
34.根据权利要求16至33中任一项所述的合成肝特异性启动子,其表现出相比于CMV-IE为50%或更低的在非肝细胞(任选HEK293细胞)中的活性。
35.根据权利要求16至33中任一项所述的合成肝特异性启动子,其表现出相比于CMV-IE为10%或更低的在非肝细胞(任选HEK293细胞)中的活性。
36.根据权利要求16至33中任一项所述的合成肝特异性启动子,其表现出相比于CMV-IE为1%或更低的在非肝细胞(任选HEK293细胞)中的活性。
37.表达盒,其包含与编码表达产物的序列可操作连接的根据权利要求16至36中任一项所述的合成肝特异性启动子。
38.根据权利要求37所述的表达盒,其中编码表达产物的序列是编码治疗性蛋白质的转基因。
39.载体,其包含根据权利要求1至15中任一项所述的合成肝特异性CRM、根据权利要求16至37任一项所述的合成肝特异性启动子或者根据权利要求37或38所述的表达盒。
40.权利要求39所述的载体,其是病毒载体。
41.权利要求39或40所述的载体,其是基因治疗载体。
42.权利要求40或41所述的载体,其是AAV载体。
43.病毒体,其包含根据权利要求39至42中任一项所述的载体。
44.药物组合物,其包含根据权利要求1至15中任一项所述的合成肝特异性CRM、根据权利要求16至37中任一项所述的合成肝特异性启动子、根据权利要求37或38所述的表达盒、根据权利要求39至42中任一项所述的载体,或根据权利要求43所述的病毒体。
45.细胞,其包含根据权利要求1至15中任一项所述的合成肝特异性CRM、根据权利要求16至37中任一项所述的合成肝特异性启动子、根据权利要求37或38所述的表达盒、根据权利要求39至42中任一项所述的载体,或根据权利要求43所述的病毒体。
46.根据权利要求45所述的细胞,其是肝细胞。
47.根据权利要求1至15中任一项所述的合成肝特异性CRM、根据权利要求16至37中任一项所述的合成肝特异性启动子、根据权利要求37或38所述的表达盒、根据权利要求39至42中任一项所述的载体、根据权利要求43所述的病毒体、根据权利要求44所述的药物组合物或根据权利要求45或46所述的细胞,其用于治疗。
48.用于产生表达产物的方法,所述方法包括在肝细胞中提供根据权利要求37或38所述的表达盒,以及从编码表达产物的序列表达所述表达产物。
49.在肝细胞中表达治疗性基因的方法,所述方法包括将根据权利要求37或38所述的表达盒、根据权利要求39至42中任一项所述的载体、或根据权利要求43所述的病毒体引入到所述肝细胞中,其中所述肝特异性表达盒、所述载体或所述病毒体包含与根据权利要求16至37中任一项所述的启动子可操作连接的治疗性基因。
50.治疗有此需要的对象,优选人的方法,所述方法包括:
-向所述对象施用根据权利要求37或38所述的表达盒、根据权利要求39至42中任一项所述的载体、根据权利要求43所述的病毒体、根据权利要求44所述的药物组合物,其包含编码与根据权利要求11至21中任一项所述的启动子连接的治疗性产物的序列。
51.CRE,其选自:CRE0018、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068、CRE0074、CRE0001、CRE0005、CRE0012、CRE0047、CRE0048、CRE0056、CRE0062、CRE0077、CRE0078、CRE0083.1和CRE0089,或其中任意的功能变体。
52.根据权利要求51所述的CRE,其选自:CRE0018、CRE0042、CRE0058、CRE0065、CRE0066、CRE0068和CRE0074,或其中任意的功能变体。
CN201980089303.6A 2018-11-19 2019-11-19 肝特异性调节性核酸序列 Pending CN113454104A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1818816.9A GB201818816D0 (en) 2018-11-19 2018-11-19 Regulatory nucleic acid sequences
GB1818816.9 2018-11-19
PCT/GB2019/053267 WO2020104782A1 (en) 2018-11-19 2019-11-19 Liver-Specific Regulatory Nucleic Acid Sequences

Publications (1)

Publication Number Publication Date
CN113454104A true CN113454104A (zh) 2021-09-28

Family

ID=64740036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980089303.6A Pending CN113454104A (zh) 2018-11-19 2019-11-19 肝特异性调节性核酸序列

Country Status (9)

Country Link
US (2) US20220009981A1 (zh)
EP (2) EP3883952A1 (zh)
JP (1) JP7489161B2 (zh)
CN (1) CN113454104A (zh)
AU (1) AU2019382955A1 (zh)
CA (1) CA3120253A1 (zh)
GB (1) GB201818816D0 (zh)
IL (1) IL283219A (zh)
WO (2) WO2020104782A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116555266A (zh) * 2023-06-09 2023-08-08 呈诺再生医学科技(北京)有限公司 肝脏特异性表达的重组启动子和载体及其在肝脏相关疾病治疗中的应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023008925A1 (ko) * 2021-07-29 2023-02-02 주식회사 리보퓨틱스 융합 프로모터, 이를 포함하는 재조합 벡터 및 이를 이용하는 간암 치료용 조성물

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108588097A (zh) * 2018-04-28 2018-09-28 北京五加和分子医学研究所有限公司 改造后的hbv基因组和相关组合物及其应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US6268212B1 (en) 1993-10-18 2001-07-31 Amgen Inc. Tissue specific transgene expression
EP0933997A4 (en) 1996-09-06 2000-08-16 Chiron Corp METHODS AND COMPOSITIONS FOR LIVER-SPECIFIC ADMINISTRATION OF THERAPEUTIC MOLECULES USING RECOMBINANT AAV VECTORS
US7351813B2 (en) 2000-06-20 2008-04-01 The Board Of Trustees Of The Leland Stanford Junior University Liver-specific gene expression cassettes, and methods of use
WO2009130208A1 (en) 2008-04-22 2009-10-29 Vib Vzw Liver-specific nucleic acid regulatory elements and methods and use thereof
US8815779B2 (en) * 2009-09-16 2014-08-26 SwitchGear Genomics, Inc. Transcription biomarkers of biological responses and methods
EP2479278A1 (en) 2011-01-25 2012-07-25 Synpromics Ltd. Method for the construction of specific promoters
US11007280B2 (en) * 2015-03-17 2021-05-18 Vrije Universiteit Brussel Optimized liver-specific expression systems for FVIII and FIX

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108588097A (zh) * 2018-04-28 2018-09-28 北京五加和分子医学研究所有限公司 改造后的hbv基因组和相关组合物及其应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116555266A (zh) * 2023-06-09 2023-08-08 呈诺再生医学科技(北京)有限公司 肝脏特异性表达的重组启动子和载体及其在肝脏相关疾病治疗中的应用

Also Published As

Publication number Publication date
EP3883952A1 (en) 2021-09-29
EP3883951A1 (en) 2021-09-29
US20220009981A1 (en) 2022-01-13
GB201818816D0 (en) 2019-01-02
JP2022507828A (ja) 2022-01-18
IL283219A (en) 2021-06-30
JP7489161B2 (ja) 2024-05-23
US20210388347A1 (en) 2021-12-16
WO2020104782A1 (en) 2020-05-28
WO2020104783A1 (en) 2020-05-28
CA3120253A1 (en) 2020-05-28
AU2019382955A1 (en) 2021-06-10

Similar Documents

Publication Publication Date Title
JP7248760B2 (ja) 肝特異的核酸調節要素ならびにその方法および用途
US20240110179A1 (en) Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
US8129510B2 (en) Minigene expression cassette
AU2018207259A1 (en) Polynucleotides and vectors for the expression of transgenes
TW202027797A (zh) 用於治療α-1抗胰蛋白酶不足的組成物及方法
WO2011051450A1 (en) Cardiac-specific nucleic acid regulatory elements and methods and use thereof
JP7489161B2 (ja) 肝臓特異的調節性核酸配列
TW202145884A (zh) B4galt1介導功能之囓齒動物模型
EP4368209A1 (en) Cardiac vascular endothelial cell-derived nucleic acid regulatory elements and methods and use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: United Kingdom

Address after: Midlothian County, UK

Applicant after: Asbio UK Ltd.

Address before: Midlothian County, UK

Applicant before: Synpromics Ltd.

Country or region before: United Kingdom

CB02 Change of applicant information