TW202102680A - 多工處理調控元件以識別細胞類型專一性調控元件 - Google Patents

多工處理調控元件以識別細胞類型專一性調控元件 Download PDF

Info

Publication number
TW202102680A
TW202102680A TW109109448A TW109109448A TW202102680A TW 202102680 A TW202102680 A TW 202102680A TW 109109448 A TW109109448 A TW 109109448A TW 109109448 A TW109109448 A TW 109109448A TW 202102680 A TW202102680 A TW 202102680A
Authority
TW
Taiwan
Prior art keywords
transgene
nucleic acid
sequence
regulatory element
specific examples
Prior art date
Application number
TW109109448A
Other languages
English (en)
Inventor
卡提克 拉馬穆爾提
安 譚恩豪斯
席里卡 伍德
馬丁 莫爾賀德
史黛芬妮 泰格利亞特拉
思傑 陳
雷格哈凡德拉 候斯爾
Original Assignee
美商編碼治療公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商編碼治療公司 filed Critical 美商編碼治療公司
Publication of TW202102680A publication Critical patent/TW202102680A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5023Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供一種用於篩選及識別在所關注之特定細胞類型中提供選擇性表現之調控元件的高通量方法。亦提供用於該高通量篩選方法中之核酸組成物。

Description

多工處理調控元件以識別細胞類型專一性調控元件
本申請案主張2019年3月22日申請之美國臨時專利申請案第62/822,528號之優先權益,其以引用的方式併入本文中。
近年來,已利用基因療法治療疾病之臨床試驗之數目已不斷地增加。此等臨床試驗面臨之主要挑戰之一為控制治療性基因之表現量或沉默水準的能力,以便在治療功效與因治療蛋白或基於RNA干擾之序列的過度表現引起之非特定毒性之間提供平衡。特定言之,達成治療有關劑量所需之轉基因表現量基於特定疾病之固有病理生理學及轉基因產物之性質(例如,細胞內與細胞外,結構與酶功能)而變化。另外,轉基因之細胞專一性表現為特別需要的,因為其提供選擇性靶向病理相關性細胞類型(例如,癌細胞)之能力且降低患者中不良事件之可能性。因此,需要識別用於將基因療法或基因表現靶向所關注組織或細胞類型之調控元件及其使用方法,其可減少脫靶效應,增加目標組織及/或細胞類型中之治療功效,且藉由降低達成功效所需要之有效劑量來增加患者安全性及耐受性。
在一些具體實例中,本發明提供一種識別於給定細胞類型中提供選擇性表現之調控元件之方法,其包含:a)向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼(barcode);b)自表現該轉基因之複數個單細胞中分離RNA;c)藉由定序單細胞中之每一者的總轉錄本(transcriptome)來識別該等單細胞中之每一者;及d)使總轉錄本中之條碼與候選調控元件相關聯,從而識別在該細胞類型中提供選擇性表現之調控元件。在一些具體實例中,調控元件選擇性地增加細胞類型中轉基因之表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由另一候選調控及/或對照調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的轉基因之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的轉基因之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的轉基因之選擇性表現。在一些具體實例中,調控元件提供與不同細胞類型中相同調控元件之轉基因之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的轉基因之選擇性表現。在一些具體實例中,調控元件提供與不同細胞類型中相同調控元件之轉基因之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的轉基因之選擇性表現。在一些具體實例中,調控元件提供與不同細胞類型中相同調控元件之轉基因之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的轉基因之選擇性表現。在一些具體實例中,調控元件在一種細胞類型中提供相對於至少一種其他細胞類型的轉基因之選擇性表現。在一些具體實例中,與興奮性神經元相比,調控元件在GABA能神經元中提供轉基因之選擇性表現。在其他具體實例中,調控元件在GABA能神經元亞型,諸如表現麩胺酸去羧酶2(decarboxylase 2;GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元中提供轉基因之選擇性表現。在其他具體實例中,與非PV神經元相比,調控元件在小白蛋白(parvalbumin;PV)神經元中提供轉基因之選擇性表現。在一些具體實例中,非PV神經元為興奮性神經元、多巴胺(dopaminergic)神經元、星狀細胞(astrocyte)、微膠細胞(microglia)或運動神經元中之一或多者。在一些具體實例中,調控元件提供與不同GABA能神經元亞型中相同調控元件之轉基因之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的轉基因之選擇性表現。在一些具體實例中,調控元件提供與不同GABA能神經元亞型中相同調控元件之轉基因之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的轉基因之選擇性表現。
在一些具體實例中,本發明提供一種識別於細胞類型或細胞亞型中提供轉基因之選擇性表現的調控元件之方法,其包含:a)向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼;b)自表現該轉基因之複數個單細胞中分離RNA;c)藉由定序單細胞中之每一者的總轉錄本來識別該等單細胞中之每一者;d)使總轉錄本中之條碼與候選調控元件相關聯;及e)將藉由各候選調控元件提供之轉基因之表現量與轉基因之參考表現量進行比較;從而識別在該細胞類型中提供轉基因之選擇性表現的候選調控元件。在一些具體實例中,調控元件選擇性地增加或減少細胞類型中轉基因之表現。在一些具體實例中,轉基因之參考表現量藉由對照調控元件提供。在一些具體實例中,調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的轉基因之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的轉基因之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的轉基因之選擇性表現。在一些具體實例中,轉基因之參考表現量藉由泛細胞(pan-cellular)調控元件提供。在一些具體實例中,泛細胞調控元件選自由以下者組成之群:巨細胞病毒主要即刻早期啟動子(cytomegalovirus major immediate-early promoter;CMV)、雞β-肌動蛋白啟動子(chicken β-actin promoter;CBA)、CMV早期強化子/CBA啟動子(CMV early enhancer/CBA promoter;CAG)、延伸因子-1α啟動子(elongation factor-1α promoter;EF1α)、猴病毒40啟動子(simian virus 40 promoter;SV40)、磷酸甘油酸激酶啟動子(phosphoglycerate kinase promoter;PGK)及聚泛素C基因啟動子(polyubiquitin C gene promoter;UBC)。在一些具體實例中,調控元件提供與相同細胞類型中藉由泛細胞調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的轉基因之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由泛細胞調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的轉基因之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中藉由泛細胞調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的轉基因之選擇性表現。在一些具體實例中,調控元件在一種細胞類型中提供相對於至少一種其他細胞類型的轉基因之選擇性表現。在一些具體實例中,與非PV神經元相比,調控元件在PV神經元中導致轉基因之選擇性表現。在一些具體實例中,非PV神經元為興奮性神經元、多巴胺神經元、星狀細胞、微膠細胞或運動神經元中之一或多者。
在一些具體實例中,本發明提供一種識別選擇性表現可操作地連接於調控元件之轉基因的細胞類型之方法,其包含:a)向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼;b)自表現該轉基因之複數個單細胞中分離RNA;c)藉由定序單細胞中之每一者的總轉錄本來識別該等單細胞中之每一者;d)使總轉錄本中之條碼與候選調控元件相關聯;及e)將藉由候選調控元件在一種細胞類型中提供之轉基因之表現量與相同候選調控元件在不同細胞類型中之表現量進行比較;從而識別選擇性表現可操作地連接調控元件之轉基因的細胞類型。在一些具體實例中,與至少一種其他細胞類型相比,調控元件選擇性地增加或減少一種細胞類型中轉基因之表現。在一些具體實例中,調控元件在一種細胞類型中提供與至少一種其他細胞類型中藉由調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的轉基因之選擇性表現。在一些具體實例中,調控元件在一種細胞類型中提供與至少一種其他細胞類型中藉由調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的轉基因之選擇性表現。在一些具體實例中,調控元件在一種細胞類型中提供與至少一種其他細胞類型中藉由調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的轉基因之選擇性表現。在一些具體實例中,與非PV神經元相比,調控元件在PV神經元中導致轉基因之選擇性表現。在一些具體實例中,非PV神經元為興奮性神經元、多巴胺神經元、星狀細胞、微膠細胞或運動神經元中之一或多者。
正如可容易地理解,在所關注之細胞或細胞類型中藉由調控元件驅動的表現之選擇性可以許多方法量測。舉例而言,目標細胞類型中之基因表現相對於非目標細胞類型之選擇性可藉由將表現來自可操作地連接於一或多個調控元件的基因之轉錄物之可偵測水準的目標細胞之數目與表現該基因之細胞之總數目進行比較來量測。此類量測、偵測及定量可在活體內或活體外進行。
在一些情況下,專一性細胞類型之選擇性可使用共定域分析來確定。在一些情況下,共定域分析係基於免疫組織化學。在一些情況下,將可偵測報導基因用作轉基因以允許在所關注之細胞類型中偵測及/或量測基因表現。在一些情況下,特異性標記目標細胞之可偵測標記(例如,螢光標記或抗體)用於偵測及/或量測目標細胞。在一些情況下,共定域分析採用成像(例如,螢光成像)以確定不同螢光標記之間的重疊,例如,指示目標細胞之螢光信號與指示基因表現之另一螢光信號之間的重疊。在一些情況下,用於共定域分析之螢光標記包括紅色螢光蛋白(red fluorescent protein;RFP),諸如tdTomato報導基因,及綠色螢光報導蛋白,諸如eGFP。
在一些具體實例中,調控元件在細胞類型中之選擇性可藉由基於免疫組織化學之共定域分析確定。在一些具體實例中,分析包含使用:a)可偵測報導基因作為可操作地連接於調控元件之轉基因以量測轉基因表現及b)識別對目標細胞類型具專一性之標記的結合劑,其中結合劑連接至可偵測標記。在一些具體實例中,可使用基於免疫組織化學之共定域分析使用以下來確定或證實細胞類型之選擇性:a)可操作地連接於調控元件之轉基因以量測轉基因表現及b)識別連接至第二螢光標記之所關注細胞類型之抗體。
在一些具體實例中,本發明提供一種識別於給定細胞類型中提供選擇性表現之調控元件之方法,其包含:a)向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼;b)自表現該轉基因之複數個單細胞中分離RNA;c)藉由定序單細胞中之每一者的總轉錄本來識別該等單細胞中之每一者;及d)使總轉錄本中之條碼與候選調控元件相關聯,從而識別在該細胞類型中提供選擇性表現之調控元件。為增加在單細胞核RNAseq中降至低於偵測臨限值之AAV構築體之偵測,在擴增之前進行富集PCR步驟。在一些具體實例中,在藉由定序單細胞中之每一者的總轉錄本來識別該等單細胞中之每一者之前,進行PCR富集步驟。在一些具體實例中,PCR富集步驟產生至少1-50倍、至少2-25倍或至少3-10倍來自AAV構築體之信號擴增。
在本文所揭示之方法中之任一者的一些具體實例中,RNA選自由以下者組成之群:mRNA、長非編碼RNA、反義轉錄物及pri-miRNA。在本文所揭示之方法中之任一者的一些具體實例中,載體選自由以下者組成之群:質體、病毒載體或黏接質體(cosmid)。在本文所揭示之方法中之任一者的一些具體實例中,病毒載體為腺相關病毒(adeno-associated virus;AAV)載體。在本文所揭示之方法中之任一者的一些具體實例中,AAV載體為AAV1、AAV8、AAV9、scAAV1、scAAV8或scAAV9。在本文所揭示之方法中之任一者的一些具體實例中,AAV載體為AAV9。在本文所揭示之方法中之任一者的一些具體實例中,載體包含5' AAV反向末端重複(inverted terminal repeat;ITR)序列及3' AAV ITR序列。在本文所揭示之方法中之任一者的一些具體實例中,載體之混合物包含至少104 個候選調控元件。在本文所揭示之方法中之任一者的一些具體實例中,各候選調控元件與至少一個獨特條碼相關。在本文所揭示之方法中之任一者的一些具體實例中,轉基因包含報導基因序列。在本文所揭示之方法中之任一者的一些具體實例中,報導基因序列可操作地連接於編碼核結合域之序列。在本文所揭示之方法中之任一者的一些具體實例中,轉基因包含條碼。在本文所揭示之方法中之任一者的一些具體實例中,報導基因序列包含條碼。在本文所揭示之方法中之任一者的一些具體實例中,條碼包含替代密碼子。在本文所揭示之方法中之任一者的一些具體實例中,編碼核結合域之序列包含條碼。在本文所揭示之方法中之任一者的一些具體實例中,編碼核結合域之序列編碼Klarsicht/ANC-1/Syne同源(Klarsicht/ANC-1/Syne homology;KASH)域或Sad1p/UNC-84(Sad1p/UNC-84;SUN)域蛋白,或其生物活性片段。在本文所揭示之方法中之任一者的一些具體實例中,細胞類型屬於選自由以下者組成之群的組織:結締組織、肌肉組織、神經組織及上皮組織。
在一些具體實例中,本發明提供一種核酸分子,其包含可操作地連接於轉基因之調控元件,其中核酸分子包含條碼。在一些具體實例中,條碼包含替代密碼子。在一些具體實例中,轉基因包含報導基因序列。在一些具體實例中,報導基因序列可操作地連接於編碼核結合域序列之核苷酸序列。在一些具體實例中,核結合域序列編碼KASH域或SUN域蛋白或其生物活性片段。在一些具體實例中,調控元件為非天然存在的。在一些具體實例中,報導基因序列編碼螢光蛋白。在一些具體實例中,螢光蛋白為綠色螢光蛋白(green fluorescent protein;GFP);增強型綠色螢光蛋白(enhanced green fluorescent protein;EGFP);黃色螢光蛋白(yellow fluorescent protein;YFP),諸如mBanana;紅色螢光蛋白(red fluorescent protein;RFP),諸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;遠紅色螢光帕米膦酸鹽(far-red fluorescent pamidronate;FRFP),諸如mGrape1或mGrape2;青色螢光蛋白質(cyan fluorescent protein;CFP)、藍色螢光蛋白(blue fluorescent protein;BFP);增強型青色螢光蛋白質(enhanced cyan fluorescent protein;ECFP);群青螢光蛋白(ultramarine fluorescent protein;UMFP);橙色螢光蛋白(orange fluorescent protein;OFP),諸如mOrange或mTangerine;紅色(橙色)螢光蛋白(red (orange) fluorescent protein;mROFP);TagCFP或四半胱胺酸螢光模體。在一些具體實例中,轉基因包含條碼。在一些具體實例中,編碼核結合域之序列包含條碼。在一些具體實例中,報導基因序列包含條碼。在一些具體實例中,條碼置放於轉基因之編碼區內。在一些具體實例中,核酸分子包含非編碼區,且其中條碼置放於轉基因之非編碼區內。在一些具體實例中,核酸分子包含未轉譯區(untranslated region;UTR)且條碼置放於UTR內。在一些具體實例中,條碼序列位於核酸中自polyA尾部開始之約25、30、35、50、100、150、200、250、300、350、400、450或500個鹼基內。在其他具體實例中,核酸包含polyA序列,且其中條碼置放於polyA序列之上游至少35個鹼基處。在一些具體實例中,條碼置放於轉錄起始位點之上游。
在一些具體實例中,本發明提供一種核酸分子,其中核酸分子為自DNA分子轉錄之RNA分子,其中RNA分子包含轉基因及條碼序列,其中DNA分子包含調控元件,且其中RNA分子中之條碼序列與DNA分子中之調控元件相關。在一些具體實例中,轉基因包含報導基因序列。在一些具體實例中,報導基因序列可操作地連接於編碼核結合域之核苷酸序列。在一些具體實例中,核結合域為KASH域或SUN域蛋白或其生物活性片段。在一些具體實例中,調控元件為非天然存在的。在一些具體實例中,報導基因序列編碼螢光蛋白。在一些具體實例中,螢光蛋白為綠色螢光蛋白(GFP);增強型綠色螢光蛋白(EGFP);黃色螢光蛋白(YFP),諸如mBanana;紅色螢光蛋白(RFP),諸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;遠紅色螢光帕米膦酸鹽(FRFP),諸如mGrape1或mGrape2;青色螢光蛋白質(CFP);藍色螢光蛋白(BFP);增強型青色螢光蛋白質(ECFP);群青螢光蛋白(UMFP);橙色螢光蛋白(OFP),諸如mOrange或mTangerine;紅色(橙色)螢光蛋白(mROFP);TagCFP或四半胱胺酸螢光模體。在一些具體實例中,轉基因包含條碼。在一些具體實例中,編碼核結合域之序列包含條碼。在一些具體實例中,報導基因序列包含條碼。在一些具體實例中,條碼包含替代密碼子。在一些具體實例中,核酸分子包含未轉譯區(UTR)且條碼置放於UTR內。在一些具體實例中,核酸分子包含polyA序列,且其中條碼置放於polyA序列之上游至少30至50個鹼基處。在一些具體實例中,核酸分子連接至微粒。在一些具體實例中,微粒為珠粒。在一些具體實例中,微粒連接至微粒聚核苷酸分子。在一些具體實例中,核酸分子經由微粒聚核苷酸分子連接至微粒。在一些具體實例中,微粒聚核苷酸分子包含引子序列。在一些具體實例中,微粒聚核苷酸分子包含細胞條碼序列。在一些具體實例中,微粒聚核苷酸分子包含獨特分子標誌(Unique Molecular Identifier;UMI)核苷酸序列。在一些具體實例中,微粒聚核苷酸分子包含寡聚-dT序列。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)細胞條碼序列,c)獨特分子標誌(UMI)核苷酸序列,及d)寡聚-dT序列;其中核酸包含polyA核苷酸序列,且其中微粒按以下順序連接至a)-d):微粒--a)--b)--c)--d);且其中polyA核苷酸序列與寡聚-dT序列雜合。在一些具體實例中,微粒為珠粒。
在一些具體實例中,本發明提供一種載體,其包含本文所揭示之核酸中之任一者。在一些具體實例中,載體為病毒載體。在一些具體實例中,載體為腺相關病毒載體。在一些具體實例中,腺相關病毒載體為AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其雜合體、禽類AAV、牛類AAV、犬類AAV、馬類AAV、靈長類AAV、非靈長類AAV及綿羊類AAV中之任一者。在一些具體實例中,腺相關病毒載體為AAV9載體。
在一些具體實例中,本發明提供一種細胞,其包含本文所揭示之核酸中之任一者。
在一些具體實例中,本發明提供一種細胞,其包含本文所揭示之載體中之任一者。
在一些具體實例中,本發明提供一種微粒,其連接至本文所揭示之核酸中任一者之一或多者。在一些具體實例中,微粒為珠粒。在一些具體實例中,微粒連接至微粒聚核苷酸分子。在一些具體實例中,微粒聚核苷酸分子包含引子序列。在一些具體實例中,微粒聚核苷酸分子包含獨特分子識別符(UMI)。在一些具體實例中,微粒聚核苷酸分子包含寡聚-dT序列。在一些具體實例中,核酸包含polyA核苷酸序列,且其中polyA核苷酸序列與寡聚-dT序列雜合。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)細胞條碼序列,c)獨特分子標誌(UMI)序列,及d)寡聚-dT序列;其中核酸包含polyA核苷酸序列,其中微粒按以下順序連接至a)-d):微粒--a)--b)--c)--d);且其中polyA核苷酸序列與寡聚-dT序列雜合。在一些具體實例中,微粒為珠粒。
在一些具體實例中,本發明提供一種液滴,其包含本文所揭示之核酸分子中之任一者。
在一些具體實例中,本發明提供一種液滴,其包含本文所揭示之細胞中之任一者。
在一些具體實例中,本發明提供一種液滴,其包含本文所揭示之微粒中之任一者。
在一些具體實例中,本發明提供一種液滴,其包含本文所揭示之細胞中之任一者及本文所揭示之微粒中之任一者。
一個基因療法之挑戰為確保所關注之轉基因在適當的所關注之細胞類型或目標細胞類型中表現,以影響或靶向基因表現而沒有或具有最小脫靶效應。靶向基因療法之傳統方法通常依賴於遞送方法及/或媒劑(例如,改變所使用之病毒或病毒之殼體序列)。涉及遞送轉基因之治療方法亦具有大量挑戰,例如轉基因大小之限制,此係因為許多載體對於轉基因大小具有有限容量。舉例而言,AAV載體之最大容量為大約4.7 kb,且兩個反向末端重複序列(ITR)為約0.2-0.3 kb,保留需要容納轉基因及控制轉基因表現之調控元件兩者的大約4.4 kb。
本發明提供篩選調控元件以識別在所關注之細胞類型中提供所關注之基因(轉基因)之選擇性表現的調控元件之組成物及方法。特定而言,本發明提供篩選諸多(例如,10至104 個)調控元件(例如,活體內或活體外)以便識別在專一性細胞群體中達成轉基因之生理上或治療上相關之表現水準的調控元件之方法。在一些具體實例中,本發明提供一種高通量系統,其用於在數千個候選調控元件中識別在所關注之細胞類型中提供所關注之轉基因的選擇性表現(從而當用於在治療環境中驅動轉基因表現時,有效地最小化或消除脫靶效應)的調控元件。本發明亦可用於識別何種細胞類型對使用所關注之調控元件來表現轉基因更適合(或更具選擇性)。亦即,使用本發明方法,給定調控元件可「匹配」給定細胞類型(例如,PV神經元、心肌細胞等),以用於任何所關注之轉基因的最佳選擇性表現。藉由使用本文中所揭示之方法來識別調控元件,有可能改善基因療法之功效、降低產生治療效果所需之有效劑量、最小化副作用或脫靶效應且/或增加患者安全性及/或耐受性。本發明亦提供適用於實踐本發明方法之組成物。定義
如本文中所使用,除非上下文另外清楚地指示,否則單數形式「一(a/an)」及「該(the)」意欲亦包括複數形式。此外,就實施方式及/或申請專利範圍中使用的術語「包括(including/includes)」、「具有(having/has/with)」、或其變化形式之程度而言,此類術語意欲以類似於術語「包含」之方式包括端點。
術語「AAV」為腺相關病毒之縮寫,且可用於指代病毒自身或其衍生物。除非另有要求,否則該術語涵蓋所有血清型、亞型以及天然存在及重組形式兩者。縮寫「rAAV」係指重組腺相關病毒。術語「AAV」包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其雜合體、禽類AAV、牛類AAV、犬類AAV、馬類AAV、靈長類AAV、非靈長類AAV及綿羊類AAV。AAV之各種血清型的基因體序列,以及自然末端重複(terminal repeat;TR)、Rep蛋白及殼體次單元之序列為所屬領域中已知的。此類序列可發現於文獻中或諸如GenBank之公共資料庫中。如本文中所使用,「rAAV載體」係指包含不屬於AAV來源之聚核苷酸序列(亦即與AAV異源之聚核苷酸)(通常為一種用於細胞之遺傳轉化的所關注序列)的AAV載體。在一些具體實例中,異源聚核苷酸係藉由至少一個,且一般藉由兩個AAV反向末端重複序列(ITR)側接。rAAV載體可為單股(ssAAV)或自身互補型(scAAV)。「AAV病毒」或「AAV病毒顆粒」係指由至少一個AAV殼體蛋白及殼體化聚核苷酸rAAV載體組成之病毒顆粒。若粒子包含異源聚核苷酸(亦即,除野生型AAV基因體(諸如待遞送至哺乳動物細胞之轉基因)以外的聚核苷酸),則其通常稱為「rAAV病毒顆粒」或簡稱為「rAAV顆粒」。
術語「約(about)」或「大致(approximately)」意謂在如由所屬技術領域中具有通常知識者所測定之特定值之可接受誤差範圍內,其將部分取決於如何量測或測定該值,亦即量測系統之限制。舉例而言,根據所屬技術領域中之實踐,「約」可意謂在一個或大於一個標準差之範圍內。替代地,「約」可意謂高於或低於既定值至多20%、至多15%、至多10%、至多5%或至多1%之範圍。
術語「連接至(connected to/connect to)」意謂兩個或更多個實體之間的締合,例如本文中所揭示之核酸中之任一者中的兩者或更多者之間的締合。兩個實體可藉由例如共價鍵(例如,將兩個或更多個核酸核苷酸鏈連接在一起之磷酸二酯鍵)或氫鍵(例如,與一個核酸分子上之核苷酸序列及另一核酸分子上之互補核苷酸序列之間的雜合相關之氫鍵)相互連接。
應理解,每當本文中用語言「包含」描述具體實例時,亦提供用術語「由…組成」及/或「基本上由…組成」所描述之類似具體實例。
術語「測定(determining)」、「量測(measuring)」、「評估(evaluating)」、「評定(assessing)」、「分析(assaying)」、「分析(analyzing)」及其文法等效者可在本文中互換地使用以指任何量測形式,且包括確定要素是否存在(例如偵測)。此等術語可包括定量及/或定性測定兩者。評估可為相對或絕對的。
術語「表現(expression/expressing)」係指核酸序列或核酸分子及/或聚核苷酸自DNA模板轉錄(諸如轉錄為mRNA或其他RNA轉錄物)之過程及/或將經轉錄mRNA隨後轉譯成肽、多肽或蛋白質之過程。術語「表現(expression/expressing)」亦可指非編碼RNA分子(諸如反義RNA分子、RNAi分子及/或短髮夾(short hairpin)RNA分子)之轉錄。轉錄物及編碼多肽可統稱為「基因產物」。若聚核苷酸衍生自基因體DNA,則表現可包括真核細胞中mRNA之剪接。
核苷酸或肽序列之「片段」意謂係指小於認為係「全長」序列之序列。
DNA或蛋白質序列之「功能片段」係指序列之生物活性片段,其比全長或參考DNA或蛋白質序列短,但保留至少一種與全長或參考DNA或蛋白質序列之生物活性實質上類似的生物活性(功能性或結構性)。
術語「活體外」係指發生於個體體外之事件。舉例而言,活體外分析涵蓋個體體外之任何分析操作。活體外分析涵蓋基於細胞之分析,其中採用存活或死亡細胞。活體外分析亦涵蓋無細胞分析,其中不採用完整細胞。
術語「活體內」係指發生於個體體內的事件。
「經分離」核酸係指已與其天然環境之組分分離的核酸分子。經分離核酸包括通常含有核酸分子之細胞中所含有的核酸分子,但該核酸分子存在於染色體外,存在於不同於其天然染色體位置之染色體位置處,或僅含有編碼序列。
如本文中所使用,「可操作地連接(operably linked)」、「可操作連接(operable linkage)」、「可操作地連接(operatively linked)」或其文法等效物係指基因元件(例如啟動子、強化子、聚腺苷酸化序列等)之併接,其中元件處於允許其以預期方式操作之關係。舉例而言,若包含啟動子之調控元件有助於起始編碼序列之轉錄,則該調控元件可操作地連接至編碼區。在一些具體實例中,在調控元件與編碼區之間可存在中間殘基,只要維持此功能關係即可。
術語「調控元件」(可與「RE」互換使用)係指能夠影響(例如,增加、減少或調節)可操作連接序列(諸如基因)之表現的核酸序列或基因元件。調控元件包括但不限於:啟動子、強化子、抑制子、沉默子、絕緣子序列、內含子、UTR、反向末端重複(ITR)序列、長末端重複序列(long terminal repeat sequence;LTR)、穩定性元件、微RNA結合位點、轉譯後反應元件或polyA序列或其組合。調控元件可例如藉由調節基因表現之轉錄階段、轉錄後階段或轉譯階段之基因表現;藉由調節轉譯水準(例如,穩定用於轉譯之mRNA的穩定性元件)、RNA裂解、RNA剪接及/或轉錄終止;藉由向增加基因表現之編碼區募集轉錄因子;藉由提高產生RNA轉錄物之速率、提高產生RNA之穩定性及/或提高自RNA轉錄物蛋白質合成之速率;及/或藉由防止RNA降解及/或提高其穩定性以促進蛋白質合成來在DNA及/或RNA水準方面起作用。在一些具體實例中,調控元件係指強化子、抑制子、啟動子或其組合,尤其強化子加啟動子組合或抑制子加啟動子組合。在一些具體實例中,調控元件衍生自人類序列,例如該序列與衍生自人類序列之序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%或至少99%序列一致性。在一些具體實例中,調控元件為合成序列。
「候選調控元件」意謂將以本發明之分析方法中之任一者評估的調控元件。「候選調控元件」可包括一種調控元件或多於一種調控元件之組合。
「對照調控元件」意謂與候選調控元件進行比較之調控元件。在一些具體實例中,「對照調控元件」為具有良好表徵之表現圖譜的調控元件。舉例而言,在一些具體實例中,「對照調控元件」為天然存在之調控元件,諸如雞β肌動蛋白啟動子(CBA)。
如本文中所使用,「RNAseq」或「RNA-seq」用以指總轉錄本學方法,其中使用高通量次世代定序(next generation sequencing;NGS)技術(例如,SOLiD、454、依魯米那(Illumina)或ION Torrent)分離且定序來自給定樣品之RNA的總補體。在一些具體實例中,將RNAseq轉錄物逆轉錄為cDNA,且將銜接子連接至cDNA之各端。在一些具體實例中,定序可單向(單端定序)或雙向(成對末端定序)進行且接著與參考基因體資料庫比對。
一般而言,可互換使用之「序列一致性」或「序列同源性」分別係指兩個聚核苷酸或多肽序列之精確的核苷酸與核苷酸或胺基酸與胺基酸對應性。兩個或更多個序列(聚核苷酸或胺基酸)可藉由測定其「一致性百分比」(亦稱為「同源性百分比」)來比較。與參考序列(例如,核酸或胺基酸序列)之一致性百分比可計算為兩個最佳比對序列之間的精確相配物之數目除以參考序列之長度且乘以100。當針對序列一致性測定相配物之數目時,不將保守性取代視為相配物。應瞭解,當第一序列(A)之長度不等於第二序列(B)之長度時,A:B序列之一致性百分比將不同於B:A序列之一致性百分比。序列比對(諸如出於評估一致性百分比之目的)可藉由任何適合之比對演算法或程式執行,包括(但不限於)尼德曼-翁施演算法(Needleman-Wunsch algorithm)(參見例如可於全球資訊網ebi.ac.uk/Tools/psa/emboss_needle/上獲得的EMBOSS Needle比對器)、BLAST演算法(參見例如可於全球資訊網blast.ncbi.nlm.nih.gov/Blast.cgi上獲得的BLAST比對工具)、史密斯-沃特曼演算法(Smith-Waterman algorithm)(參見例如可於全球資訊網ebi.ac.uk/Tools/psa/emboss_water/上獲得的EMBOSS Water比對器)及Clustal Omega比對程式(參見例如全球資訊網clustal.org/omega/及F. Sievers等人, Mol Sys Biol. 7: 539 (2011))。最佳比對可使用所選演算法之任何適合之參數(包括預設參數)來評估。BLAST程式係基於Karlin及Altschul, Proc. Natl. Acad. Sci. USA 87:2264-2268 (1990)之比對方法及如Altschul等人, J. Mol. Biol. 215:403-410 (1990);Karlin及Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5877 (1993);及Altschul等人, Nucleic Acids Res. 25:3389-3402 (1997)中所論述之比對方法。
術語「個體(subject)」及「受試者(individual)」在本文中可互換使用以指脊椎動物,較佳為哺乳動物,更佳為人類。
核苷酸序列之「變體」係指與最常見野生型DNA序列(例如,藉由其GenBank寄存編號提及之cDNA或序列)或特定參考序列相比具有基因改變或突變的序列。
如本文中所使用,「載體」係指可用於介導將其連接之另一核酸分子遞送至其可複製或表現之細胞中的核酸分子。術語包括作為自我複製核酸結構之載體以及併入其已引入之宿主細胞之基因體中的載體。某些載體能夠導引其可操作地連接之核酸的表現。此類載體在本文中稱為「表現載體」。載體之其他實例包括質體、病毒載體及黏接質體。
如本文中所使用,術語「轉基因」係指並非天然存在於特定細胞中之聚核苷酸序列、外源地添加至細胞中之聚核苷酸序列及/或載體(例如,病毒載體,諸如AAV載體)中所含有的異源聚核苷酸序列。轉基因可包含天然序列(例如,編碼天然蛋白質之序列)以及合成序列。轉基因可包含編碼及/或非編碼序列。在一些具體實例中,轉基因為可操作地連接至調控元件之序列。
術語「選擇性表現」或「選擇性地表現」係指轉基因表現相對於參考表現水準(如本文所定義)之選擇性增加或減少,該參考表現水準由轉基因可操作地連接之調控元件(例如,候選調控元件)驅動。在各種具體實例中,由調控元件提供之轉基因之選擇性表現包括:一種細胞類型中之轉基因表現,其高於或低於相同細胞類型中由不同調控元件提供之轉基因表現水準;一種細胞類型中之轉基因表現,其高於或低於一或多種其他細胞類型中由相同調控元件提供之轉基因表現水準;特定細胞類型中之轉基因表現的增加或減小,其在表現可操作地連接至相同調控元件之相同轉基因的不同細胞類型(參考細胞類型)中未觀察到;表現可操作地連接至細胞群體(例如,目標組織)中之候選調控元件的轉基因之一種特定細胞類型之目標細胞數目的比率相比於表現可操作地連接至相同調控元件之轉基因的群體中之細胞總數增加或減少;當轉基因可操作地連接至候選調控元件時,表現轉基因之目標細胞的數目與表現轉基因之細胞總數的比率相比於轉基因可操作地連接至不同調控元件時所獲得之比率增加或減少;目標細胞中之轉基因表現水準,其比非目標細胞或非目標組織(例如,人類個體中)中之轉基因表現水準高至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、120%、140%、150%、200%、250%、300%、350%、400%、450%、500%;在目標目標組織中所關注之細胞類型的至少一部分中以有意義的(例如,治療相關的)水準發生之轉基因表現;及/或相比於其他組織之細胞,主要發生在目標組織之彼等細胞中之轉基因表現。
術語「參考表現水準」係指藉由以下提供之表現水準:所關注之相同細胞類型中之另一候選調控元件;不同細胞類型中之相同候選調控;所關注之相同細胞類型中之已知的對照調控元件;及/或不同細胞類型中之已知的對照調控元件。
在調控元件之上下文中,術語「泛細胞」係指驅動基因或轉基因表現之調控元件,該基因或轉基因與諸多細胞類型可操作地(或廣泛地)連接。此類調控元件之一些實例包括巨細胞病毒主要即刻早期啟動子(CMV)、雞β-肌動蛋白啟動子(CBA)、CMV早期強化子/CBA啟動子(CAG)、延伸因子-1α啟動子(EF1α)、猴病毒40啟動子(SV40)、磷酸甘油酸激酶啟動子(PGK)及聚泛素C基因啟動子(UBC)。
術語「細胞類型」係指細胞之獨特形態或功能形式。可使用各種特徵來鑑別細胞類型,包括例如:基因表現圖譜、表觀遺傳圖譜、非編碼RNA譜、蛋白質表現圖譜、細胞表面標記、分化潛能、增殖能力、對刺激或信號之反應、解剖位置、形態、染色圖譜及/或發育期間出現之時間及/或前述的任意組合。在一些具體實例中,基於特定特徵或特徵之組合來定義細胞類型。舉例而言,在一些具體實例中,基於特定基因或基因之組合的表現來定義細胞類型。在一些具體實例中,細胞類型可由其來源或起源之組織來定義,該組織例如結締組織、肌肉組織、神經組織或上皮組織。藉助於實例,源自肌肉組織之細胞包括心肌細胞(cardiac muscle cells)(例如,心肌細胞(cardiomyocytes))、平滑肌細胞、骨胳肌細胞及前述任一者之各種亞群。各種不同的細胞類型可獲自單個生物體(或相同物種的生物體)、單個器官或單個組織。例示性細胞類型包括但不限於:膀胱(urinary bladder)、胰臟上皮細胞、胰臟α、胰臟β、胰臟內皮、骨髓淋巴母細胞、骨髓B淋巴母細胞、骨髓巨噬細胞、骨髓紅血球母細胞、骨髓樹突、骨髓脂肪細胞、骨髓骨細胞、骨髓軟骨細胞、早幼粒細胞(promyeloblast)、骨髓巨核母細胞(megakaryoblast)、膀胱(bladder)、大腦B淋巴細胞、腦神經膠質、神經元、腦星狀細胞、神經外胚層(neuroectoderm)、腦巨噬細胞、腦微膠細胞、腦上皮細胞、心肌細胞、皮質神經元、腦纖維母細胞、乳腺上皮細胞、結腸上皮細胞、結腸B淋巴細胞、乳腺上皮細胞、乳腺肌上皮細胞、乳腺纖維母細胞、結腸腸上皮細胞、子宮頸上皮細胞、卵巢上皮細胞、卵巢纖維母細胞、乳房導管上皮細胞、舌上皮細胞、扁桃體樹突、扁桃體B淋巴細胞、外周血淋巴母細胞、外周血T淋巴母細胞、外周血皮膚T淋巴球、外周血自然殺手細胞、外周血B淋巴母細胞、外周血單核球、外周血骨髓母細胞、外周血單核母細胞(monoblast)、外周血早幼粒細胞、外周血巨噬細胞、外周血嗜鹼性球、肝臟內皮細胞、肝臟肥大細胞、肝臟上皮細胞、肝臟B淋巴細胞、脾內皮細胞、脾上皮細胞、脾B淋巴細胞、肝臟肝細胞、肝臟亞歷山大細胞(liver Alexander)、肝臟纖維母細胞、肺上皮細胞、支氣管上皮細胞、肺纖維母細胞、肺B淋巴細胞、肺神經鞘、肺鱗狀細胞、肺巨噬細胞、肺成骨細胞、神經內分泌細胞、肺泡細胞、胃上皮細胞及胃纖維母細胞。
術語「報導子分子」係指可用作細胞或生物體中之特定生物過程、活性、事件或狀態之發生或水準之指示符的分子(例如,蛋白質)。報導子分子通常具有一或多種特性或酶活性,使得其易於量測或允許選擇表現報導子分子之細胞。一般而言,可藉由確定報導子分子自身(例如,DNA、RNA及/或蛋白質)之存在及/或量測其水準或報導子分子之酶活性來分析細胞中報導子分子之存在。報導子分子可具有之可偵測特徵或活性包括例如螢光、生物發光、與特定基質結合之能力、序列、在存在適合之基質的情況下催化產生螢光或彩色物質之反應的能力,或基於發射及/或吸收光子(光)之其他讀數。通常,報導子分子為未藉由使用報導子分子之細胞或生物體內源表現之分子,或已經改質以允許在內源性分子內進行選擇性偵測的分子。
術語「域」或「蛋白質域」係指可獨立於蛋白質鏈之其餘部分而存在且發揮功能之蛋白質鏈之一部分。
術語「非天然」或「非天然地」或「變體」應意謂展現偏離天然存在之物的品質。
術語「統計學上顯著」或「顯著地」係指統計顯著性且通常意謂偏離參考水準之至少兩個標準差(2SD)其定義為當虛無假設實際上為真時,作出拒絕虛無假設之決定的機率。
在本文中所使用之術語「減小(decrease)」、「減少(reduced)」、「減少(reduction)」、「減小(decrease)」或「抑制」通常皆意謂所量測參數的可觀測的減小。
本文中所使用之術語「增加(increased/increase)」或「增強」或「活化」通常皆意謂所量測參數之可觀測的增加。
如本文中所使用,術語「治療(treat/treatment)」、「療法」及類似者係指獲得所需藥理學及/或生理學功效,包括但不限於緩解、延緩或減緩進展;減少影響或症狀;預防發作;預防復發;抑制、改善疾病或病症之發作;獲得關於疾病、病症或醫學病況的有益或所需結果,諸如治療效益及/或預防效益。如本文中所使用,「治療」涵蓋對哺乳動物,尤其人類之疾病的任何治療,且包括:(a)預防疾病出現於易患有疾病或處於獲得疾病之風險下但尚未診斷患有該疾病之個體中;(b)抑制疾病,亦即遏制其發展;及(c)緩解疾病,亦即引起疾病消退或以下中之任一者的漸變。治療效益包括根除或改善所治療之潛在病症。此外,經由根除或改善與潛在病症相關之生理症狀中的一或多者來達成治療效益,從而觀測到個體之改善,儘管該個體仍可能罹患潛在病症。在一些具體實例中,針對預防效益,向處於罹患特定疾病之風險下的個體投予組成物,或向報導疾病之生理症狀中之一或多者的個體投予組成物,儘管此疾病之診斷可能尚未做出。本發明之方法可用於任何哺乳動物。在一些具體實例中,治療可引起症狀之減少或停止。預防作用包括延緩或消除疾病或病況之出現;延緩或消除疾病或病況之症狀發作;減緩、阻止或逆轉疾病或病況之進展;或其任何組合。
除非另有指示,否則本文中所使用之所有術語具有其對於所屬技術領域中具有通常知識者所意味之相同含義且本發明之實踐將採用分子生物學、微生物學及重組DNA技術之習知技術,其在所屬技術領域中具有知識者之知識內。核酸組成物
在一些具體實例中,本發明係關於(例如,活體內或活體外)篩選諸多(例如,10至104 個)候選調控元件以便識別在專一性細胞群體中提供所關注之轉基因之選擇性表現的調控元件之方法。在一些具體實例中,本發明係關於(例如,活體內或活體外)篩選10至20、10至50、10至100、10至200、10至400、10至600、10至800、10至1000、10至3000、10至6000、10至10,000、10至13,000、10至16,000、10至20,000、10至30,000、10至40,000、10至50,000、10至60,000、10至70,000、10至80,000、10至90,000、10至100,000、10至500,000或10至1,000,000個候選調控元件以便識別在專一性細胞群體中提供所關注之轉基因之選擇性表現的調控元件之方法。方法包括向細胞(例如,細胞群體或組織)提供載體之混合物,該等載體各自包含具有可操作地連接至編碼轉基因(例如,包含報導基因)之序列的一或多個候選調控元件之核酸分子及用於調控元件識別之條碼序列。因此,在一些態樣中,本文中提供適用於實踐本發明之方法的核酸組分及組成物。
在一些具體實例中,核酸為DNA分子。在一些具體實例中,核酸為RNA分子。在一些具體實例中,核酸為本文中所揭示之載體中之任一者中的DNA分子。在一些具體實例中,核酸分子包含本文中所揭示之轉基因中之任一者。在一些具體實例中,核酸分子包含本文中所揭示之候選調控元件中之任一者。在一些具體實例中,核酸包含本文中所揭示之條碼序列中之任一者。在一些具體實例中,核酸為包含本文中所揭示之轉基因中之任一者、本文中所揭示之候選調控元件中之任一者及本文中所揭示之條碼序列中之任一者的DNA分子。在一些具體實例中,核酸分子為包含本文中所揭示之轉基因中之任一者及本文中所揭示之條碼序列中之任一者的RNA核酸分子。在一些具體實例中,RNA分子自本文中所揭示之DNA分子(例如,包含本文中所揭示之轉基因、候選調控元件及條碼序列中之任一者的DNA分子)中之任一者轉錄。在一些具體實例中,RNA分子自本文中所揭示之DNA分子(例如,包含本文中所揭示之轉基因、候選調控元件及條碼序列中之任一者的DNA分子)中之任一者轉錄,其中RNA分子包含轉基因及條碼序列,其中RNA分子中之條碼序列與DNA分子中之候選調控元件相關。
如下文更詳細地論述,在一些具體實例中,本文中所揭示之核酸分子中之任一者連接至微粒。在特定具體實例中,連接至微粒之核酸分子為自DNA分子(例如,本文中所揭示之DNA分子中之任一者)轉錄的n個RNA分子。在一些具體實例中,RNA分子包含轉基因及條碼序列。在一些具體實例中,DNA分子包含調控元件,其中RNA分子中之條碼序列與DNA分子中之調控元件相關。在一些具體實例中,微粒為珠粒。在一些具體實例中,微粒連接至微粒聚核苷酸分子。在一些具體實例中,核酸分子經由微粒聚核苷酸分子(例如,經由核酸分子及微粒聚核苷酸分子上之互補核苷酸序列之間的雜合)連接至微粒。在一些具體實例中,微粒聚核苷酸分子包含引子序列。在一些具體實例中,微粒聚核苷酸分子包含條碼序列。在一些具體實例中,微粒聚核苷酸分子包含獨特分子標誌(UMI)核苷酸序列。在一些具體實例中,微粒聚核苷酸分子包含寡聚-dT序列。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)條碼序列,c)獨特分子標誌(UMI)核苷酸序列,d)寡聚-dT序列,及e)核酸序列;其中核酸包含polyA核苷酸序列,且其中微粒按以下順序連接至a)-e):微粒--a)--b)--c)--d)--e);且其中polyA序列與寡聚-dT序列雜合。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)條碼序列,c)獨特分子標誌(UMI)核苷酸序列,d)寡聚-dT序列,及e)核酸序列;其中核酸包含polyA核苷酸序列,且其中微粒按以下順序連接至a)-e):微粒--a)--c)--b)--d)--e);且其中polyA序列與寡聚-dT序列雜合。 調控元件標誌條碼
在一些具體實例中,本文中所揭示之核酸分子中之任一者包含用於識別與其相關聯之特定調控元件的核酸條碼序列。如本文中所描述,本發明方法能夠(例如,活體內或活體外)篩選諸多(例如,10至104 個)RE,以便識別在專一性細胞類型及/或細胞群體(例如,神經元、心肌細胞等)或細胞亞型(例如,GABA能亞型,諸如表現麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元)中提供所關注之轉基因之選擇性表現的RE。藉由將特定條碼序列分配(或標記、匹配、配對)至特定候選RE,使識別在給定細胞類型中提供選擇性表現之RE的能力成為可能。當在細胞中偵測轉基因表現(例如,藉由報導基因(諸如編碼EGFP之基因)的表現)時,存在於細胞中之條碼序列使得有可能確定哪個特定候選RE存在於細胞中以驅動轉基因(例如,EGFP)的表現。在某些具體實例中,條碼序列對於特定調控元件為唯一的。因此,對於本發明方法中測試之每個候選調控元件,使唯一的條碼序列與各候選調控元件配對,從而能夠識別各候選調控元件。在一些具體實例中,本發明提供表現本文中所揭示之核酸中之任一者的方法。在一些具體實例中,核酸之表現涉及在核酸中轉錄所關注之轉基因的步驟,其中轉基因可操作地連接至候選RE。由於在一些實施例中,核酸中之候選RE不再與轉基因一起轉錄,所以條碼序列為尤其適用的,此係因為其保留識別促進核酸中之所關注之轉基因的轉錄之特定候選RE之資訊。在特定具體實例中,條碼序列在DNA核酸分子中。在一些具體實例中,條碼序列在自本文中所揭示之DNA核酸分子中之任一者轉錄的RNA核酸分子中。
條碼序列之大小可在長度為約4至約100、約4至約50、約4至約20或約6至約20或更多個核苷酸之範圍內。在某些具體實例中,條碼序列之長度為6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個核苷酸或更長。在某些具體實例中,條碼序列之長度為長度為至少6個、至少7個、至少8個、至少9個、至少10個、至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個、至少18個、至少19個、至少20個核苷酸。在一些具體實例中,條碼序列為相鄰的,亦即在相鄰核苷酸之單個序列段中,或在一些具體實例中,條碼序列分離成兩個或更多個獨立的子序列,該條碼序列由1個或更多個核苷酸分離。在某些具體實例中,分離的條碼子序列之長度可為約4至約16個核苷酸。在一些具體實例中,條碼子序列為4、5、6、7、8、9、10、11、12、13、14、15、16個核苷酸或更長。在某些具體實例中,條碼子序列可為至少4、5、6、7、8、9、10、11、12、13、14、15、16個核苷酸或更長。在某些具體實例中,條碼子序列可為至多4、5、6、7、8、9、10、11、12、13、14、15、16個核苷酸或更短。在一些具體實例中,條碼序列包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個條碼子序列,其中條碼子序列之長度為至少2至10個核苷酸。在一些具體實例中,條碼序列包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個條碼子序列,其中條碼子序列之長度為至少4至20個核苷酸。在一些具體實例中,兩個或更多個條碼子序列之間存在一或多個核苷酸。在一些具體實例中,兩個或更多個條碼子序列之間存在1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、t至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90個核苷酸。在一些具體實例中,條碼包含兩個條碼子序列,其中各條碼子序列之長度為4至20個核苷酸,且其中條碼子序列藉由1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、t至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90個核苷酸間隔開。在一些具體實例中,條碼包含三個條碼子序列,其中各條碼子序列之長度為4至20個核苷酸,且其中條碼子序列藉由1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、t至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90個核苷酸間隔開。在一些具體實例中,條碼包含四個條碼子序列,其中各條碼子序列之長度為4至20個核苷酸,且其中條碼子序列藉由1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、t至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90個核苷酸間隔開。在一些具體實例中,條碼包含五個或更多個條碼子序列,其中各條碼子序列之長度為4至20個核苷酸,且其中條碼子序列藉由1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、t至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90個核苷酸間隔開。
在一些具體實例中,一或多個條碼序列可包括於核酸分子之多於一個區域中。舉例而言,一或多個條碼序列可包括於編碼區(例如,編碼表現轉基因之序列)或非編碼區(例如,UTR及/或內含子序列)或兩者中。在一些具體實例中,轉基因之編碼區或非編碼區皆不包含條碼序列。在一些具體實例中,條碼序列連接至轉基因之編碼區或非編碼區。在一些具體實例中,若多於一個條碼序列包括於核酸分子內,則各條碼序列可為相同的(例如,藉由至少1個核苷酸間隔開的相同條碼序列之三個複本),各者可彼此不同(例如,藉由至少1個核苷酸間隔開的三個不同條碼序列),或條碼序列中之一些可彼此相同且不同。因此,任何數目之條碼序列(相同,各自不同或一些相同/一些不同)可包括於本文中所揭示之核酸分子中之任一者中。在某些具體實例中,核酸分子包含至少1個、至少2個、至少3個、至少4個、至少5個或至少6個相同的條碼序列。在某些具體實例中,核酸分子包含至少1個、至少2個、至少3個、至少4個、至少5個或至少6個不同的條碼序列。
在一些具體實例中,條碼序列對於特定候選調控元件具有特異性。在一些具體實例中,條碼序列之組合對於特定候選調控元件具有特異性。在一些具體實例中,核酸分子中之條碼序列之位置對於特定候選調控元件具有特異性。在一些具體實例中,a)條碼序列,b)條碼序列之組合,c)核酸分子中之條碼序列的位置或a)-c)之任何組合對於特定候選調控元件具有特異性。
在一些具體實例中,核酸分子中之任一者之編碼區(例如,轉基因)包含一或多個條碼序列。在一些具體實例中,轉基因之編碼區中之條碼包含替代性密碼子。替代性密碼子係指編碼DNA中之同義密碼子。遺傳密碼描述為簡併或冗餘的,此係因為單個胺基酸可由多於一個密碼子編碼。舉例而言,密碼子TAT及密碼子TAC皆編碼胺基酸酪胺酸。因此,藉助於實例,置放於編碼EGFP之核苷酸序列之編碼區中的條碼可設計以使用替代性密碼子(例如,DNA序列的改變)編碼EGFP之區域,同時保持EGFP野生型蛋白質序列之表現(亦即,存在於編碼EGFP之核苷酸序列之編碼區中的條碼序列內之替代性密碼子不改變由彼核苷酸序列編碼的EGFP胺基酸序列)。在一些具體實例中,本文中所揭示之核酸分子中之任一者的非編碼區(例如,轉基因之UTR及/或內含子區)包含一或多個條碼序列。在一些具體實例中,本文中所揭示之核酸分子中之任一者的非編碼區及編碼區各自包含一或多個條碼序列。在一些具體實例中,本文中所揭示之核酸分子中之任一者包含至少一個條碼序列,其至少部分在核酸分子之編碼區中且至少部分在核酸分子之非編碼區中。
一般而言,一或多個條碼序列可置放於核酸分子中之任何位置。在一些具體實例中,本文中所揭示之核酸序列中之任一者包含polyA尾部及至少一個條碼序列。在一些具體實例中,條碼序列位於核酸中自polyA尾部開始之約25、30、35、50、100、150、200、250、300、350、400、450或500個鹼基內。在一些具體實例中,條碼位於核酸中自polyA尾部開始之約50個鹼基內。在一些具體實例中,核酸包含多個條碼,其中各條碼在核酸中接近polyA尾部之跨越約50個鹼基的區域內間隔80至120 bp。在一些具體實例中,至少一個條碼序列置放於接近polyA尾部之跨越約50個鹼基之區域內的各80至120 bp跨距中。 轉基因
在一些具體實例中,可根據本發明方法使用之本文中所提供之核酸分子中的任一者包含可操作地連接至用於多工處理方法中之候選調控元件的轉基因序列。在一些具體實例中,本發明組成物及方法之轉基因充當用於偵測(若存在)由候選調控元件驅動之表現的報導子。在一些具體實例中,候選RE位於轉基因之上游。在一些具體實例中,候選RE位於轉基因之非編碼區內。
在一些具體實例中,轉基因衍生自野生型參考基因序列(例如,編碼EGFP蛋白質之基因序列)。在一些具體實例中,轉基因與野生型基因序列具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性。在一些具體實例中,與野生型參考核苷酸序列相比,轉基因不包含任何突變。在一些具體實例中,轉基因連接至本文中所揭示之條碼序列中之任一者或多者(亦即,條碼序列不在轉基因之編碼區或非編碼區中)。所關注之任何轉基因可經設計且用於本發明方法中。如本文中所描述且舉例說明,轉基因可設計以包括可易於偵測及/或可鑑別的特性、特徵或部分。在一些具體實例中,與參考核苷酸序列相比,轉基因包含經修飾之核苷酸序列(例如,替代性密碼子)。在一些具體實例中,轉基因可設計以具有某些有益特性,例如表現轉基因特異性地位於細胞之特定隔室且/或表現轉基因有助於分離及/或純化轉基因蛋白質、細胞或細胞組分(例如細胞核)。結合所屬技術領域中已知的功能域及/或標記之各種蛋白質設計方法可用於產生適用於本發明方法之特定上下文中的轉基因。在一些具體實例中,轉基因為DNA核酸分子。在一些具體實例中,轉基因為已自本文中所描述之DNA核酸分子中之任一者轉錄的RNA核酸分子。
在一些具體實例中,轉基因包含編碼報導基因之序列。所屬領域中已知的各種報導基因可用於產生用於本發明方法之轉基因。報導基因包括有助於偵測轉基因表現之任何基因或核苷酸序列,若存在。報導基因可視情況允許定位表現產物,例如在細胞之特定區域或細胞器及/或多細胞生物體之特定細胞、組織、器官或任何部分中。此類報導基因亦可經設計使其編碼融合蛋白質,該融合蛋白質包含報導子多肽(例如GFP蛋白質)及一或多個賦予功能性益處之域,該益處例如細胞分離、細胞識別或對細胞之區域的報導子定位(例如經由核結合域)。在一些具體實例中,本文中所揭示之報導基因中之任一者編碼一或多個螢光蛋白,諸如綠色螢光蛋白(GFP);增強型綠色螢光蛋白(EGFP);黃色螢光蛋白(YFP),諸如mBanana;紅色螢光蛋白(RFP),諸如mCherry、DsRed、dTomato、tdTomato、mHoneydew、mStrawberry、TagRFP;遠紅色螢光帕米膦酸鹽(FRFP),諸如mGrape1或mGrape2;青色螢光蛋白質(CFP);藍色螢光蛋白(BFP);增強型青色螢光蛋白質(ECFP);群青螢光蛋白(UMFP);橙色螢光蛋白(OFP),諸如mOrange或mTangerine;紅色(橙色)螢光蛋白(mROFP);TagCFP或四半胱胺酸螢光模體。在某些具體實例中,螢光蛋白為GFP或EGFP。在一些具體實例中,轉基因編碼可偵測標記之蛋白質,諸如可偵測標記之抗體或其抗原結合片段。在一些具體實例中,轉基因編碼可使用一或多種與蛋白質結合之試劑偵測之蛋白質。舉例而言,在一些具體實例中,轉基因編碼可用一或多個可偵測標記之抗體(例如經螢光標記之抗體)偵測的蛋白質。
如本文中所舉例說明,轉基因可包含報導基因序列(例如,編碼EGFP之序列),其可操作地連接至編碼核結合域(例如,KASH域或SUN域蛋白或其生物活性片段)之序列,該序列將表現報導基因蛋白質(EGFP)靶向至外核膜。雖然EGFP能夠易於識別及分選表現轉基因之細胞,但核結合域有助於自細胞分離細胞核,其有益於在自完整組織解離期間易於細胞膜破裂的某些細胞(例如,神經元或脂肪細胞)。如所屬技術領域中具通常知識者將識別,由報導基因序列編碼之多肽不必連接至核結合域序列。在一些具體實例中,由報導基因(例如,EGFP)編碼之多肽可單獨使用以標記表現報導基因之細胞的胞溶質,從而允許識別表現轉基因之細胞。此標記可用於自組織分離全細胞,該等組織在自完整組織(例如,上皮細胞及纖維母細胞)解離期間不易於破壞細胞膜。此類細胞可與其來源(例如,組織)分離,根據報導基因表現分選且定序其總轉錄本用於進行本文中所詳述之分析。
在一些具體實例中,轉基因包含編碼細胞定位域之序列。各種細胞定位域為所屬技術領域中已知的,且包括例如KASH域、SUN域。熟習此項技術者知曉其他細胞定位域,諸如儲存於LOCATE次細胞定位資料庫中之彼等細胞定位域(http://locate.imb.uq.edu.au)。 調控元件
在一些具體實例中,本發明之核酸分子中之任一者包括例如一或多個條碼序列及一或多個可操作地連接至轉基因之候選調控元件。如本文中所描述,本發明部分係關於一種(例如,活體內或活體外)篩選諸多(例如,10至104 個)候選RE以便識別在專一性細胞群體中提供所關注之轉基因之選擇性表現的RE的方法。可使用本文中所描述之方法測試候選RE,以便識別在給定細胞類型(所關注之細胞類型或目標細胞)中提供轉基因之選擇性表現的RE。一般而言,可使用本文中所描述之方法篩選、分離且識別任何已知的、天然的及/或合成的候選RE。已知及/或天然存在之RE可易於獲得以用作本發明方法中之候選RE。可使用所屬技術領域中已知之方法設計且生成適用於本發明之合成候選RE。在一些具體實例中,可用於本發明方法中之候選RE可為在一或多種細胞類型中活性已知但在其他細胞類型中未知的RE。在一些具體實例中,可用於本發明方法中之候選RE可為具有未知活性的RE。如本文中所描述,可根據本發明方法篩選各種已知或新穎的(例如,合成)RE以識別其中RE提供選擇性表現之細胞類型。在一些具體實例中,可用於本發明方法中之候選RE包括已知的RE,其可用作可與候選RE進行比較之陰性或陽性對照RE(例如,泛細胞RE)。
在特定具體實例中,候選RE為DNA核酸分子之部分。在一些具體實例中,DNA核酸分子包含本文中所揭示之轉基因中之任一者、一或多個候選RE及一或多個條碼序列,其中條碼序列與核酸中的候選RE相關(例如,條碼可用於識別核酸分子中所含有的RE)。在一些具體實例中,本發明提供自本文中所揭示之DNA核酸分子(例如,包含本文中所揭示之條碼序列、候選RE及轉基因的DNA核酸分子)中之任一者轉錄之RNA核酸分子,其中RNA核酸分子包含轉基因及條碼序列,且其中RNA分子中之條碼序列與DNA分子中之候選RE相關。
RE可在DNA及/或RNA水準下運作。RE可用以調節或控制細胞選擇性(細胞專一性)基因表現。RE可用以在基因表現之轉錄階段、轉錄後階段或轉譯階段調節基因表現。RE包括(但不限於)啟動子、強化子、內含子或其他非編碼序列。在RNA水準,調控可在轉譯(例如使mRNA穩定以用於轉譯之穩定性元件)、RNA裂解、RNA剪接及/或轉錄終止之水準進行。在一些具體實例中,RE可募集轉錄因子,其選擇性地增加所關注之細胞類型中之基因表現。在一些具體實例中,RE可增加產生RNA轉錄物之速率,增加產生RNA之穩定性且/或增加自RNA轉錄物蛋白合成的速率。
RE為核酸序列或遺傳元件,其能夠影響(例如,增加或減少)一或多個細胞類型或組織中之基因或轉基因(例如,編碼蛋白質(諸如EGFP或螢光素酶)之報導基因;編碼定位域(諸如KASH域)之轉基因;及/或治療性基因)的表現。在一些具體實例中,RE可為內含子、啟動子、強化子、UTR、反向末端重複(ITR)序列、長末端重複序列(LTR)、穩定性元件、轉譯後反應元件、微RNA結合位點或polyA序列或其組合。在一些具體實例中,RE為啟動子或強化子,或其組合。在一些具體實例中,RE衍生自人類序列。
在一些具體實例中,兩個或更多個RE(已知的、天然的及/或合成RE)可經合併以形成可用作本文中所描述之方法中之候選RE的較大RE。在一些具體實例中,可能需要產生較小的候選RE。保留轉基因表現活性之較小RE在使用較大轉基因之基因療法方法中,及/或當載體或質體之選殖能力由於使用基因療法待遞送之轉基因的大小而受到限制時為有利的。因此,在一些具體實例中,藉由例如每次截斷一或多個鹼基且根據本發明方法測試各所得候選RE驅動表現之能力,可自具有已知活性的RE得到候選RE。
在一些具體實例中,兩個或更多個相對短的RE可合併以形成較大RE且用作本發明方法中之候選RE。先前已展示此類組合會得到高轉基因表現活性及/或大小標準化之基因表現。因此,此候選RE可經篩選以識別例如其可提供選擇性表現之細胞類型。
在一些具體實例中,本文中所揭示之候選RE包含不超過500 bp、600 bp、700 bp、800 bp、900 bp、1000 bp、1100 bp、1200 bp、1300 bp、1400 bp、1500 bp、1600 bp、1700 bp、1800 bp、1900 bp、2000 bp、2100 bp、2200 bp、2300 bp、2400 bp、2500 bp、2600 bp、2700 bp、2800 bp、2900 bp、3000 bp、3100 bp、3200 bp、3300 bp、3400 bp、3500 bp、3600 bp、3700 bp、3800 bp、3900 bp、4000 bp、4100 bp、4200 bp、4300 bp、4400 bp、4500 bp、4600 bp、4700 bp、4800 bp、4900或5000 bp。
在一些具體實例中,本文中所揭示之候選RE包含不超過40bp、45bp、49bp、50bp、56bp、60bp、70bp、80bp、90bp、100bp、110bp、117bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、210bp、220bp、230bp、240bp、250bp、259bp、260bp、265bp、270bp、280bp、290bp、300bp、310bp、320bp、330bp、340bp、350bp、360bp、370bp、380bp、390bp或400bp。
在一些具體實例中,可以本發明方法篩選之候選RE不超過49bp、50bp、56bp、60bp、70bp、80bp、90bp、100bp、110bp、117bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、210bp、220bp、230bp、240bp、250bp、259bp、260bp、265bp、270bp、280bp、290bp、300bp、310bp、320bp、330bp、340bp、350bp、360bp、370bp、380bp、390bp或400bp。此類候選RE可適用於驅動較大轉基因之表現(例如,在基因療法或表現卡匣中),此係因為RE增強轉基因表現,而不會佔據AAV載體或表現卡匣內之大量空間,從而允許較大轉基因具有更大的容量。
在一些具體實例中,本文中所描述之候選RE為40-50 bp、45-55 bp、50-60 bp或55-65 bp。在一些具體實例中,候選RE為45-60 bp。在一些具體實例中,本文中所描述之候選RE為49bp或56bp。在一些具體實例中,候選RE可在100bp與150bp之間、在110bp與140bp之間、在110bp與130bp之間或在115bp與125bp之間。在一些具體實例中,候選RE為或為約100bp。
在一些具體實例中,可使用允許識別候選調控元件之任何方法(例如,DNA酶過敏反應、ATAC-Seq及ChIP-Seq)選擇用於本文中所描述之方法中的候選調控元件。參見例如WO 2018187363,其以全文引用之方式併入本文中。在一些具體實例中,可使用基於分析之實驗(例如,報導基因分析)、高通量實驗(例如,染色體免疫沈澱實驗)或計算方法(例如,ChIP-seq)來識別調控元件。參見例如Narlikar等人, 2009, Briefings in Functional Genomics and Proteomics, 8(4): 215-230。在一些具體實例中,計算方法可用以識別所關注之特定基因體(例如hg19)中之調控元件。在一些具體實例中,可識別阻斷強化子與啟動子之間的交互作用之假定絕緣子區域,且用於評估基因體區域內基因及強化子的可能影響範圍。參見例如Khan等人, 2013, Genesis, 51:311-324。在一些具體實例中,譜系足跡分析可用於計算順式-調控元件之預測。特定而言,譜系足跡分析可用於識別可含有轉錄因子發現位點之DNA之保守片段,該等位點在整個進化過程中經保留。同上。在一些具體實例中,譜系足跡分析將僅在由假定絕緣子區域所界定之區域中使用,有效地允許選擇候選調控元件。同上。
在一些具體實例中,候選RE衍生自已知的對照RE,諸如已知啟動子。可使用之已知的對照啟動子之實例包括但不限於:CMV啟動子、超核心啟動子、TTR啟動子、Proto 1啟動子、UCL-HLP啟動子、AAT啟動子、KAR啟動子、EF1α啟動子、EFS啟動子或CMVe強化子/CMV啟動子組合、雞β肌動蛋白啟動子(CBA)、CMV早期強化子/CBA啟動子(CAG)、延伸因子-1α啟動子(EF1α)、猴病毒40啟動子(SV40)、磷酸甘油酸激酶啟動子(PGK)及聚泛素C基因啟動子(UBC)。可操作地連接至此類已知的對照RE之轉基因之表現水準可相對於可操作地連接至候選RE之轉基因(相同轉基因)的表現水準進行分析。
在一些具體實例中,候選RE可為啟動子,當包括於本發明之核酸分子時,該啟動子可驅動下游序列轉錄,其可與下游序列(例如,轉基因)緊密相關或直接接觸。啟動子可驅動所連接轉基因之高、中或低表現。
在一些具體實例中,本文中所揭示之候選RE包含人類衍生之序列。在一些具體實例中,本發明之候選RE為非天然存在的。在一些具體實例中,候選RE包含核苷酸序列,其與人類參考基因體(或人類基因體構築)中之序列具有至少80%、90%、95%或99%序列一致性。同源序列可為具有與人類基因體之區域相比至少80%序列一致性(例如,如藉由BLAST所量測)之區域的序列。舉例而言,與人類序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同源性之序列視為人類衍生序列。
在一些具體實例中,人類衍生之候選RE為與人類序列具有100%一致性的序列。在一些具體實例中,候選RE之序列為人類衍生的,其中候選RE與相應人類序列的差異為至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90或95個核苷酸或鹼基對。
在一些具體實例中,至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%之候選RE序列為人類衍生的。舉例而言,候選RE之序列的50%可為人類衍生,且剩餘的50%為非人類衍生(例如,小鼠衍生或全合成)。對於其他實例,視為50%人類衍生且包含300bp之候選RE可與人類基因體中之序列具有總共45%序列一致性,而候選RE之鹼基對1-150可與人類基因體的類似大小區域具有90%一致性(例如,局部序列一致性)。
在一些具體實例中,候選RE含有人類衍生序列及非人類衍生序列,使得總體上RE與人類基因體具有低序列一致性。然而,候選RE之一部分與人類基因體具有100%序列一致性。在其他情況下,候選RE序列之至少50%、60%、70%、80%、90%、95%、98%或99%為人類衍生,或至少10、20、30、40或50個鄰接核苷酸為人類衍生。舉例而言,候選RE之序列的50%可為人類衍生,且剩餘的50%為非人類衍生(例如,小鼠衍生、病毒衍生或全合成)。
候選RE可衍生自不同物種。在一些具體實例中,候選RE之至少一部分為人類衍生。非人類衍生RE可衍生自哺乳動物、病毒或合成序列。
如本文中所描述,本發明涵蓋一種識別RE之方法,其中RE可操作地連接至一或多個官能性序列,包括例如本文中所描述之轉基因。在DNA插入至載體中之前或之後實現此有效連接之方法為吾人所熟知。
在一些具體實例中,本文中所揭示之候選RE可衍生自基因體啟動子序列。在一些具體實例中,本文中所揭示之候選RE可衍生自基因體啟動子序列及3'未轉譯區(3' UTR)。在一些具體實例中,本文中所揭示之候選RE可衍生自基因間序列。在一些具體實例中,本文中所揭示之候選RE可衍生自基因之基因體序列下游、或5' UTR序列或5' UTR及下游序列之混合物。
在一些具體實例中,候選RE可為強化子,且可評估與藉由啟動子而不需強化子之相同轉基因的表現相比,其在表現載體以及啟動子中之活性是否在專一性細胞類型或專一性細胞群體中提供轉基因(例如EGFP)的選擇性表現(例如表現增加或減小)。
在一些具體實例中,本文中之候選RE為內含子序列,或包含內含子,且可評估與藉由啟動子而不需內含子序列之相同轉基因的表現相比,其在表現載體以及啟動子中之活性是否在專一性細胞群體中提供轉基因(例如編碼EGFP之轉基因)的選擇性表現。
在一些具體實例中,本文中之候選RE為啟動子序列,或包含啟動子序列,且其可操作地連接至本發明之核酸分子中之所關注的轉基因,而不需任何其他啟動子序列及/或強化子序列來表現轉基因。
在一些具體實例中,候選RE包含5'未轉譯區(5' UTR)之部分或所有。5' UTR候選RE可以數種不同的方式影響基因之表現。5' UTR候選RE可含有RNA結合蛋白之結合位點。此外,由5' UTR中之RE所形成的二級結構可影響轉譯所需之RNA結合蛋白的結合。在一些實例中,候選RE可具有高度的二級結構。在一些具體實例中,候選RE可具有很少或沒有二級結構。候選RE亦可含有內部核糖體入口位點(internal ribosome entry site;IRES),允許5'帽獨立轉譯。候選RE可含有上游轉譯起始密碼子(upstream translation initiation codon;uAUG)。在一些具體實例中,候選RE不含有上游轉譯起始密碼子。在一些具體實例中,候選RE在AUG密碼子之一個鹼基內不含有任何密碼子,或含有與偶然預期相比更少的類似於AUG密碼子之密碼子。在一些具體實例中,候選RE可含有上游開放閱讀框架,其在上游AUG(或足夠類似的序列)存在時發生,隨後為框內終止密碼子。在一些實例中,候選RE不包含uORF。在一些具體實例中,候選RE含有微RNA結合位點,或RNA結合蛋白之結合位點。
在一些具體實例中,本發明之候選RE亦可為以上中之任一者的功能片段。當功能片段為強化子、內含子序列、啟動子序列或其組合時,與無功能片段之類似載體或卡匣相比,當片段可操作地連接至轉基因時,觀測到更高、更低或更多選擇性表現。在一些具體實例中,片段之長度小於或等於25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp或110bp。在一些具體實例中,可使用衍生自人類啟動子序列之本發明之候選RE,而無需載體中的二級啟動子。
在一些具體實例中,作為內含子序列之候選RE可偶合或可操作地連接至任何啟動子。在一些具體實例中,作為啟動子序列之候選RE可偶合或可操作地連接至轉基因,而無需任何其他啟動子序列。在一些具體實例中,包含啟動子序列及內含子序列之候選RE可偶合或可操作地連接至轉基因,而無需任何其他啟動子序列。在一些具體實例中,包含啟動子序列及強化子序列之候選RE可偶合或可操作地連接至轉基因,而無需任何其他啟動子序列。 微粒
在一些具體實例中,本發明提供連接至本文中所揭示之核酸分子中之任一者的微粒。在特定具體實例中,連接至微粒之核酸分子為自本文中所揭示之DNA核酸分子中之任一者轉錄的RNA分子。在一些具體實例中,RNA分子包含轉基因及條碼序列。在一些具體實例中,DNA分子包含調控元件,其中RNA分子中之條碼序列與DNA分子中之調控元件相關。在一些具體實例中,微粒為珠粒。在一些具體實例中,微粒連接至微粒聚核苷酸分子。在一些具體實例中,微粒聚核苷酸序列包含引子序列。在特定具體實例中,引子序列有助於微粒聚核苷酸序列之至少一部分的擴增及/或表現。在一些具體實例中,引子序列有助於微粒聚核苷酸序列之至少一部分及與微粒聚核苷酸序列連接/雜合之本文中所揭示的核酸分子中之任一者之至少一部分的擴增及/或表現。在一些具體實例中,微粒聚核苷酸包含微粒(例如,珠粒)特有的條碼核苷酸序列。在一些具體實例中,各微粒包含兩個或更多個微粒聚核苷酸。在一些具體實例中,兩個或更多個微粒聚核苷酸中之各者包含不同的獨特分子標誌(UMI)核苷酸序列。在一些具體實例中,微粒聚核苷酸包含寡聚-dT核苷酸序列。在一些具體實例中,寡聚-dT序列能夠與本文中所揭示之核酸分子中之任一者的polyA部分雜合。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)條碼序列,c)獨特分子標誌(UMI)序列,d)寡聚-dT序列,及e)本文中所揭示之核酸分子中之任一者。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)條碼序列,c)獨特分子標誌(UMI)序列,d)寡聚-dT序列,及e)本文中所揭示之核酸分子中之任一者;其中核酸包含polyA核苷酸序列,其中微粒按以下順序連接至a)-e):微粒--a)--b)--c)--d)--e);且其中polyA序列與寡聚-dT序列雜合。在一些具體實例中,微粒聚核苷酸分子包含:a)引子序列,b)識別碼序列,c)獨特分子標誌(UMI)序列,d)寡聚-dT序列,及e)本文中所揭示之核酸分子中之任一者;其中核酸包含polyA核苷酸序列,其中微粒按以下順序連接至a)-e):微粒--a)--c)--b)--d)--e);且其中polyA序列與寡聚-dT序列雜合。 遞送方法及組成物
在一些具體實例中,本發明提供包含本文中所揭示之核酸分子中之任一者的載體(例如,本文中所揭示之載體中之任一者)。在一些具體實例中,載體為病毒載體(例如腺相關病毒載體)。在一些實施例中,載體為病毒顆粒。在一些實施例中,載體為非病毒載體。
在一些具體實例中,使用所屬技術領域中可用的各種已知及適合之方法,活體外或活體內將本文中所描述之核酸分子提供(或遞送)至細胞或組織。習知的基於病毒及非病毒之基因遞送方法可用於將本文中所揭示之核酸分子引入至細胞(例如哺乳動物細胞)及組織中。非病毒表現載體系統包括核酸載體諸如(例如)直鏈寡核苷酸及環狀質體;人造染色體,諸如人類人造染色體(human artificial chromosomes;HAC)、酵母人造染色體(yeast artificial chromosomes;YAC)及細菌人造染色體(BAC或PACs);游離型載體;轉座子(例如PiggyBac);及黏接質體。病毒載體遞送系統包括DNA及RNA病毒,諸如(例如)逆轉錄病毒載體、慢病毒載體、腺病毒載體及腺相關病毒載體。將本文中所描述之核酸分子併入至非病毒及病毒表現系統中之任一者中的方法已為所屬技術領域中具通常知識者所已知。
用於核酸之非病毒遞送的方法及組成物為所屬技術領域已知的,包括物理及化學方法。物理方法通常係指在促進基因物質之胞內遞送中採用物理力來抵消細胞膜障壁之遞送方法。物理方法之實例包括使用針、彈道DNA、電穿孔、聲致穿孔、光致穿孔、磁轉染及水穿孔(hydroporation)。化學方法通常係指其中化學載劑將核酸分子遞送至細胞之方法且可包括無機粒子、基於脂質之載劑、基於聚合物之載劑及基於肽之載劑。
在一些具體實例中,使用無機粒子向目標細胞投予非病毒表現載體。無機粒子可指奈米粒子,諸如經工程改造得到各種大小、形狀及/或孔隙率以自網狀內皮系統逸出或保護經包覆分子免於降解之奈米粒子。無機奈米粒子可由金屬(例如,鐵、金及銀)、無機鹽或陶瓷(例如鈣、鎂或矽之磷酸鹽或碳酸鹽)來製備。此等奈米粒子之表面可經塗佈以促進DNA結合或靶向基因遞送。亦可使用磁性奈米粒子(例如超磁性氧化鐵)、富勒烯(例如可溶性碳分子)、碳奈米管(例如圓柱形富勒烯)、量子點及超分子系統。
在一些具體實例中,使用陽離子脂質(例如陽離子脂質體)向目標細胞投予非病毒表現載體。已研究各種類型的脂質之基因遞送,諸如(例如)脂質奈米乳液(例如其為藉由乳化劑穩定化的一種不可混溶液體於另一種液體中之分散液)或固體脂質奈米粒子。在一些具體實例中,可使用脂質奈米粒子(lipid nanoparticles;LNP)遞送非病毒表現載體。在一些具體實例中,LNP包含陽離子脂質。在一些具體實例中,LNP包含十八-9,12-二烯酸(9Z,12Z)-3-((4,4-雙(辛氧基)丁醯基)氧基)-2-((((3-(二乙胺基)丙氧基)羰基)氧基)甲基)丙酯(亦稱為(9Z,12Z)-十八-9,12-二烯酸3-((4,4-雙(辛氧基)丁醯基)氧基)-2-((((3-(二乙胺基)丙氧基)羰基)氧基)甲基)丙酯)或另一可離子化脂質。參見例如WO2017/173054、WO2015/095340及WO2014/136086以及其中所提供之參考文獻之脂質。
在一些具體實例中,使用基於肽之遞送媒劑向目標細胞投予非病毒表現載體。基於肽之遞送媒劑可具有保護待遞送之遺傳物質、靶向專一性細胞受體、破壞核內體膜及將遺傳物質遞送至細胞核中之優點。在一些具體實例中,使用基於聚合物之遞送媒劑向目標細胞投予非病毒表現載體。基於聚合物之遞送媒劑可包含天然蛋白質、肽及/或多醣或合成聚合物。在一個具體實例中,基於聚合物之遞送媒劑包含聚伸乙亞胺(PEI)。PEI可將DNA縮合至帶正電粒子中,該等帶正電粒子結合至陰離子細胞表面殘基且經由胞吞作用引入至細胞中。在其他具體實例中,基於聚合物之遞送媒劑可包含聚-L-離胺酸(PLL)、聚(DL-乳酸)(PLA)、聚(DL-丙交酯-共-糖苷)(PLGA)、聚鳥胺酸、聚精胺酸、組蛋白、魚精蛋白、樹枝狀聚合物、聚葡萄胺糖、聚葡萄糖之合成胺基衍生物及/或陽離子丙烯酸聚合物。在某些具體實例中,基於聚合物之遞送媒劑可包含聚合物之混合物,諸如(例如)PEG及PLL。
在一些具體實例中,本文中所揭示之核酸分子中之任一者包含可操作地連接至轉基因及條碼序列的候選調控元件,且可使用任何已知的適合之病毒載體進行遞送,該病毒載體包括:例如逆轉錄病毒(例如,A型、B型、C型及D型病毒);腺病毒;細小病毒(例如,腺相關病毒或AAV);冠狀病毒;負股RNA病毒,諸如正黏病毒(例如,流感病毒);桿狀病毒(例如,狂犬病及水泡性口炎病毒);副黏病毒(例如,麻疹及仙台病毒(Sendai));正股RNA病毒,諸如小核糖核酸病毒及α病毒;及雙股DNA病毒,包括腺病毒、疱疹病毒(例如,1型及2型單純疱疹病毒(Herpes Simplex virus)、埃-巴二氏病毒(Epstein-Barr virus)、巨細胞病毒);及痘病毒(例如,牛痘、禽痘及金絲雀痘)。逆轉錄病毒之實例包括禽類白血病肉瘤病毒、1型人類T-淋巴病毒(human T-lymphotrophic virus type 1;HTLV-1)、牛白血病病毒(bovine leukemia virus;BLV)、慢病毒及泡沫病毒屬。其他病毒包括例如諾沃克病毒(Norwalk virus)、披衣病毒(togavirus)、黃病毒、呼腸孤病毒(reoviruses)、乳多泡病毒(papovavirus)、嗜肝DNA病毒及肝炎病毒。病毒載體可根據其整合至宿主基因體中之能力分為兩組-整合及非整合。致癌逆轉錄病毒及慢病毒可整合至宿主細胞染色體中,而腺病毒、腺相關病毒及疱疹病毒主要以染色體外游離基因體形式保持於細胞核中。
在一些具體實例中,適合之病毒載體為逆轉錄病毒載體。逆轉錄病毒係指逆轉錄病毒科之病毒。逆轉錄病毒之實例包括致癌逆轉錄病毒,諸如鼠類白血病病毒(MLV),及慢病毒,諸如人類免疫缺陷病毒1(human immunodeficiency virus 1;HIV-1)。逆轉錄病毒基因體為單股(ss)RNA且包含可以順式或反式提供之各種基因。舉例而言,逆轉錄病毒基因體可含有順式作用序列,諸如兩個長末端重複序列(LTR),具有用於基因表現、逆轉錄及整合至宿主染色體中之元件。其他組分包括封裝信號(psi或ψ),以用於將特定RNA封裝至新形成之病毒粒子(Virion)及聚嘌呤管道(polypurine tract;PPT)、在逆轉錄期間起始正股DNA合成之位點中。此外,在一些具體實例中,逆轉錄病毒基因體可包含gag、pol及env基因。gag基因編碼結構蛋白,pol基因編碼伴隨ssRNA且進行將病毒RNA逆轉錄為DNA之酶,且env基因編碼病毒套膜。一般而言,gag、pol及env以反式提供用於病毒複製及封裝。
在一些具體實例中,本文中所提供之逆轉錄病毒載體可為慢病毒載體。識別慢病毒之至少五個血清組或血清型。不同血清型之病毒可不同地感染某些細胞類型及/或宿主。舉例而言,慢病毒包括靈長類逆轉錄病毒及非靈長類逆轉錄病毒。靈長類逆轉錄病毒包括HIV及猿猴免疫缺陷病毒(simian immunodeficiency virus;SIV)。非靈長類逆轉錄病毒包括貓類免疫缺陷病毒(feline immunodeficiency virus;FIV)、牛免疫缺陷病毒(bovine immunodeficiency virus;BIV)、山羊關節炎-腦炎病毒(caprine arthritis-encephalitis virus;CAEV)、馬傳染性貧血病毒(equine infectious anemia virus;EIAV)及維思納病毒(visnavirus)。慢病毒或慢病毒載體能夠轉導靜止細胞。如同致癌逆轉錄病毒載體,慢病毒載體之設計可基於順式作用及反式作用序列之分離。
在一些具體實例中,本發明提供經設計用於藉由最佳化治療性逆轉錄病毒載體遞送之表現載體。逆轉錄病毒載體可為包含以下中之任一者或多者的慢病毒:左(5')LTR;有助於病毒封裝及/或核導入之序列;啟動子;視情況選用之一或多個額外調控元件(諸如(例如)強化子或polyA序列);視情況選用之慢病毒反向反應元件(RRE);構築體,其包含可操作地連接至轉基因(例如EGFP-KASH)之候選調控元件;視情況選用之絕緣子;及右(3')逆轉錄病毒LTR。
在一些具體實例中,本文中所提供之病毒載體為腺相關病毒(AAV)。AAV為感染人類及一些其他靈長類物種之小型、複製缺乏型、無套膜動物病毒。已知AAV不會引起人類疾病及誘導輕度免疫反應。AAV載體亦可在不整合至宿主細胞基因體中的情況下感染分裂及靜止細胞兩者。
AAV基因體天然地由長度為約4.7kb之直鏈單股DNA組成。基因體由藉由長度為約145bp之反向末端重複(ITR)序列側接之兩個開放閱讀框架(ORF)組成。ITR由含有回文序列之5'端處之核苷酸序列(5' ITR)及位於3'端處之核苷酸序列(3' ITR)組成。ITR藉由互補鹼基配對摺疊形成T形髮夾結構而順式起作用,該互補鹼基配對在第二股合成之起始DNA複製期間充當引子。兩個開放閱讀框架編碼參與病毒粒子之複製及封裝的rep及cap基因。在一些具體實例中,本文中所提供之AAV載體不含有rep或cap基因。此類基因可以反式提供用於產生病毒粒子,如下文進一步描述。
在一些具體實例中,AAV載體可包括填充核酸。在一些具體實例中,填充核酸可編碼綠色螢光蛋白或提供對諸如康黴素(kanamycin)或安比西林(ampicillin)之抗生素之抗性的抗生素抗性基因。在某些具體實例中,填充核酸可位於ITR序列外部(例如相比於轉基因序列及調控序列,其位於5'與3' ITR序列之間)。
在一些具體實例中,AAV載體為以下中之任一者:AAV1、AAV2、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV-DJ8、AAV-DJ9或嵌合、雜合或變體AAV。AAV亦可為自身互補型AAV(scAAV)。此等血清型不同之處在於其趨向性或其所感染的細胞類型。在一些具體實例中,AAV載體包含來自多個血清型(例如假型)之基因體及殼體。舉例而言,AAV可包含封裝於血清型5或血清型9之殼體中之血清型2的基因體(例如ITR)。假型可提高轉導效率以及改變趨向性。在一些具體實例中,AAV為AAV9血清型。在某些具體實例中,經設計用於藉由AAV遞送之表現載體包含5' ITR及3' ITR。
在一些具體實例中,AAV血清型6或AAV血清型9之ITR可用於本文中所揭示之AAV載體中之任一者中。然而,可選擇來自其他適合之血清型之ITR。在一些具體實例中,將本文中所揭示之核酸分子中之任一者封裝至殼體蛋白中且遞送至所選擇的宿主細胞。本發明之AAV載體可由各種腺相關病毒產生。可藉由將一種血清型之重組基因體封裝至衍生自另一AAV血清型之殼體中來改變載體之趨向性。在一些具體實例中,rAAV病毒之ITR可基於AAV1-12中之任一者之ITR且可與選自以下中之任一者的AAV殼體合併:AAV1-12、AAV-DJ、AAV-DJ8、AAV-DJ9或其他經修飾血清型。在特定具體實例中,基於待用AAV載體靶向之細胞或組織來選擇AAV ITR及/或殼體。
在一些具體實例中,本發明提供一種載體,其包含本文中所揭示之核酸中之任一者,其中載體為AAV載體或AAV病毒顆粒,或病毒粒子。在一些具體實例中,AAV載體或AAV病毒顆粒,或病毒粒子可用於遞送本文中所揭示之核酸分子中之任一者,該等核酸分子包含可操作地連接至本文中所揭示之轉基因中之任一者的本文中所揭示之候選調控元件中之任一者,無論活體內、離體或活體外。在一些具體實例中,此種AAV載體為複製缺陷型。在一些具體實例中,AAV病毒經工程化或經遺傳修飾以使得其可僅在輔助因子的存在下複製且產生病毒粒子。
在一些具體實例中,可使用本文所描述之方法篩選一或多個可操作地連接至轉基因之候選調控元件以確定候選調控元件是否在目標細胞、細胞類型或組織中提供轉基因之選擇性(例如,增加或減少)表現。在一些具體實例中,經設計用於由AAV遞送之表現載體包含:5' ITR;啟動子;核酸分子,其包含可操作地連接至轉基因(例如編碼EGFP-KASH之轉基因)之候選調控元件及條碼序列;及3' ITR。在一些具體實例中,經設計用於由AAV遞送之表現載體包含:5' ITR;強化子;啟動子;核酸分子,其包含可操作地連接至轉基因(例如編碼EGFP-KASH之轉基因)之候選調控元件及條碼序列;polyA序列及3' ITR。
在一些具體實例中,本發明提供一種包含本文中所揭示之核酸中之任一者的病毒載體。術語「病毒顆粒(viral particle)」及「病毒粒子(virion)」在本文可互換使用且係關於感染性及通常複製缺陷性的病毒顆粒,其包含封裝於殼體內之病毒基因體(例如病毒表現載體),且視具體情況,例如對於逆轉錄病毒,可為殼體周圍的脂質套膜。「殼體」係指封裝病毒基因體之結構。殼體由數種由蛋白質製成之寡聚結構次單元組成。舉例而言,AAV具有藉由以下三種殼體蛋白之交互作用所形成的二十面體殼體:VP1、VP2及VP3。在一些具體實例中,本文中所提供之病毒粒子為藉由封裝AAV載體所獲得之重組AAV病毒粒子,如本文中所描述,該AAV載體包含可操作地連接至蛋白質外殼中之轉基因及條碼序列的候選調控元件。
在一些具體實例中,本文中所提供之重組AAV病毒粒子可藉由殼體化衍生自病毒顆粒中之特定AAV血清型的AAV基因體製備,該病毒顆粒由與相同特定血清型之AAV對應的天然Cap蛋白質形成。在其他具體實例中,本文中所提供之AAV病毒顆粒包含病毒載體,該病毒載體包含封裝至來自不同血清型之蛋白質中之給定AAV血清型的ITR。參見例如Bunning H等人J Gene Med 2008; 10: 717-733。舉例而言,具有來自給定AAV血清型之ITR的病毒載體可封裝至以下各者中:a)由衍生自相同或不同AAV血清型之殼體蛋白(例如AAV2 ITR及AAV9殼體蛋白;AAV2 ITR及AAV8殼體蛋白;等)構成之病毒顆粒;b)由來自不同AAV血清型之殼體蛋白或突變體之混合物(例如AAV2 ITR與AAV1及AAV9殼體蛋白)構成之嵌合體病毒顆粒;c)由已藉由不同AAV血清型之間的域交換截短之殼體蛋白或變體構成之嵌合病毒顆粒(例如AAV2 ITR與具有AAV9域之AAV8殼體蛋白);或d)靶向病毒顆粒,其經工程化以顯示選擇性結合域,使得能夠與目標細胞專一性受體進行嚴格交互作用(例如AAV5 ITR與藉由插入肽配體而基因截短之AAV9殼體蛋白;或藉由將肽配體偶合至殼體表面而進行非基因修飾之AAV9殼體蛋白)。
技術人員應瞭解,本文中所提供之AAV病毒粒子可包含任何AAV血清型之殼體蛋白。在一個具體實例中,病毒顆粒包含來自選自由以下者組成之群之AAV血清型的殼體蛋白:AAV1、AAV2、AAV5、AAV6、AAV8及AAV9。
所屬技術領域中已知諸多用於產生rAAV病毒粒子之方法,包括轉染、穩定細胞系產生及感染性雜合病毒產生系統,其包括腺病毒-AAV雜合體、疱疹病毒-AAV雜合體(Conway, J E等人, (1997) J. Virology 71(11):8780-8789)及桿狀病毒-AAV雜合體。在一些具體實例中,用於生產rAAV病毒顆粒之rAAV生產培養物包含:1)在桿狀病毒生產系統之情況下的適合之宿主細胞,包括例如人類衍生細胞系,諸如HeLa、A549或293細胞,或昆蟲衍生細胞系,諸如SF-9;2)適合之輔助病毒功能,由野生型或突變型腺病毒(諸如溫度敏感性腺病毒)、疱疹病毒、桿狀病毒或提供輔助功能之質體構築體提供;3)AAV rep及cap基因及基因產物;4)核酸分子,其包含可操作地連接至轉基因(例如編碼可操作地連接至如本文中所描述之報導基因序列之核結合域的核苷酸序列)之候選調控元件,其由AAV ITR序列側接;其中核酸分子包含一或多個條碼序列;及5)用於支援rAAV生產之適合之培養基及培養基組分。
在一些具體實例中,生產細胞系為經提供Rep及Cap蛋白質之桿狀病毒表現載體感染之昆蟲細胞系(通常為Sf9細胞)。此系統不需要腺病毒輔助基因(Ayuso E等人, Curr. Gene Ther. 2010, 10:423-436)。
如本文中所使用,術語「cap蛋白」係指具有天然AAV Cap蛋白(例如VP1、VP2、VP3)之至少一種功能活性的多肽。cap蛋白之功能活性之實例包括誘導殼體形成、促進單股DNA積聚、促進AAV DNA封裝至殼體中(亦即殼體化)、結合至細胞受體及促進病毒粒子進入宿主細胞中之能力。原則上,任何Cap蛋白可用於本發明之上下文中。
已報導Cap蛋白對宿主趨向性、細胞、組織或器官特異性、受體使用、感染效率及AAV病毒之免疫原性具有影響。因此,可考慮到例如個體之物種(例如人類或非人類)、個體之免疫狀態、個體對長期或短期治療之適合性或特定治療性應用(例如治療特定疾病或病症,或遞送至特定細胞、組織或器官)來選擇用於rAAV中之AAV cap。在某些具體實例中,cap蛋白衍生自由AAV1、AAV2、AAV5、AAV6、AAV8及AAV9血清型組成之群的AAV。
在一些具體實例中,用於本文所提供之方法中之AAV Cap可由前述AAV cap或其編碼核酸中之一者的突變誘發(亦即,藉由插入、缺失或取代)產生。在一些具體實例中,AAV cap與前述AAV cap中之一或多者具有至少70%、75%、80%、85%、90%、95%、98%或99%或更大相似性。
在一些具體實例中,AAV cap為嵌合的,包含來自兩個、三個、四個或更多個前述AAV cap之域。在一些具體實例中,AAV cap為源自兩種或三種不同AAV或重組AAV之VP1、VP2及VP3單體之嵌合體。在一些具體實例中,rAAV組成物包含前述cap中之多於一者。
在一些具體實例中,用於rAAV病毒粒子之AAV cap經工程化以含有異源序列或其他修飾。舉例而言,賦予選擇性靶向或免疫逃避之肽或蛋白質序列可工程化為cap蛋白。可替代地或另外,cap可經化學改性以使得rAAV之表面經聚乙二醇化(polyethylene glycolated/pegylated),其可有助於免疫逃避。cap蛋白亦可經突變誘發(例如以移除其天然受體結合,或掩蔽免疫原性抗原決定基)。
如本文中所使用,術語「rep蛋白」係指具有天然AAV rep蛋白(例如rep 40、52、68、78)之至少一種功能活性之多肽。rep蛋白之功能活性之實例包括與蛋白質的生理功能相關之任何活性,包括經由識別促進DNA複製、DNA複製之AAV來源的結合及切口以及DNA解螺旋酶活性。額外功能包括自AAV(或其他異源)啟動子調節轉錄及將AAV DNA定點整合至宿主染色體中。在一些具體實例中,AAV rep基因可來自血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAVrh10。
在一些具體實例中,用於本發明方法中之AAV rep蛋白可由前述AAV rep中之一者或其編碼核酸之突變誘發(亦即藉由插入、缺失或取代)產生。在一些具體實例中,AAV rep與前述AAV rep中之一或多者具有至少70%、75%、80%、85%、90%、95%、98%或99%或更大相似性。
如本文中所使用,表述「輔助功能」或「輔助基因」係指AAV進行複製所依賴之病毒蛋白質。輔助功能包括AAV複製所需之彼等蛋白質,包括但不限於參與AAV基因轉錄活化、階段特異性AAV mRNA剪接、AAV DNA複製、cap表現產物合成及AAV殼體裝配之彼等蛋白質。基於病毒之輔助功能可衍生自已知輔助病毒,諸如腺病毒、疱疹病毒(除1型單純疱疹病毒以外)及牛痘病毒中之任一者。輔助功能包括但不限於:腺病毒E1、E2a、VA及E4或疱疹病毒UL5、ULB、UL52及UL29,及疱疹病毒聚合酶。在一較佳具體實例中,AAV進行複製所依賴之蛋白質衍生自腺病毒。
在一些具體實例中,用於本發明方法中之AAV進行複製所依賴之病毒蛋白可藉由前述病毒蛋白中之一者或其編碼核酸之突變誘發(亦即藉由插入、缺失或取代)產生。在一些具體實例中,病毒蛋白與前述病毒蛋白中之一或多者具有至少70%、75%、80%、85%、90%、95%、98%或99%或更大相似性。
分析AAV進行複製所依賴之cap蛋白、rep蛋白及病毒蛋白之功能的方法為所屬技術領域中眾所周知的。
在一些具體實例中,病毒表現載體可與向目標細胞投予之脂質遞送媒劑(例如,如本文中所描述之陽離子脂質體或LNP)相關聯。
含有本文中所描述之核酸分子的各種遞送系統可投予生物體以活體內遞送至細胞或離體投予細胞或細胞培養物。投予係藉由常用於引入分子以最終與血液、流體或細胞接觸之途徑中之任一者來進行,該等途徑包括但不限於注射、輸注、局部施用及電穿孔。投予此類核酸之適合方法為可獲得的且為所屬技術領域中具通常知識者已知。
可活體外、活體內或離體遞送核酸分子以靶向各種細胞及/或組織。在一些具體實例中,遞送可靶向各種器官/組織及相應的細胞,例如靶向大腦、心臟、骨胳肌肉、肝臟、腎臟、脾或胃。在一些具體實例中,核酸分子遞送至神經元細胞、心肌細胞、骨胳肌肉細胞、平滑肌細胞、肝細胞、足細胞或上皮細胞中之任一者或多者。在一些具體實例中,遞送可靶向患病細胞,諸如(例如)腫瘤或癌症細胞。在一些具體實例中,遞送可靶向幹細胞、血細胞或免疫細胞。
在一些具體實例中,本發明提供一種本文中所揭示之載體中之任一者或本文中所揭示之核酸中之任一者的混合物。在一些具體實例中,混合物包含兩個或更多個核酸分子,其中核酸分子中之每一者包含不同的條碼核苷酸序列。在一些具體實例中,混合物包含約101 至約104 個核酸分子,其中各核酸分子包含不同的調控元件。在一些具體實例中,混合物包含約101 個核酸分子,其中各核酸分子包含不同的調控元件。在一些具體實例中,混合物包含約102 個核酸分子,其中各核酸分子包含不同的調控元件。在一些具體實例中,混合物包含約103 個核酸分子,其中各核酸分子包含不同的調控元件。在一些具體實例中,混合物包含約104 個核酸分子,其中各核酸分子包含不同的調控元件。在一些具體實例中,混合物或核酸分子包含約10、約50、約100、約250、約500、約750、約1000、約1250、約1500、約1750、約2000、約2500、約3000、約3500、約4000、約4500、約5000、約5500、約6000、約6500、約7000、約7500、約8000、約8500、約9000、約9500、約10000個或更多個不同的調控元件。 多工處理分析之方法
如本文中所描述,本發明部分地係關於(例如,活體內或活體外)篩選調控元件以便識別在專一性細胞群體中提供所關注之轉基因之選擇性表現的調控元件的高通量方法。
在一些具體實例中,方法包括藉由載體之混合物提供/處理兩個或更多個細胞(例如,細胞群體或組織),該等載體各自包含核酸序列,該等核酸序列包含可操作地連接至編碼轉基因(例如,包含報導基因及用於調控元件識別之條碼的轉基因)之序列的候選調控元件。在一些具體實例中,本文中所揭示之方法中之任一者可包含向細胞群體投予本文中所揭示之核酸或載體中之任一者的步驟。投予係藉由常用於引入分子以最終與細胞群體接觸之途徑中之任一者進行,該等途徑包括但不限於注射、輸注、局部施用及電穿孔。在一些具體實例中,細胞群體中之細胞為哺乳動物細胞。在一些具體實例中,細胞群體中之細胞為人類細胞。在一些具體實例中,細胞群體處於活體外。在一些具體實例中,細胞群體處於活體內。在一些具體實例中,細胞群體處於來自動物之組織或器官中。在一些具體實例中,細胞群體處於動物中。在一些具體實例中,動物為小鼠、大鼠、蛙、狗、兔、天竺鼠或非人類靈長類動物。在一些具體實例中,非人類靈長類動物為食蟹獼猴或黑猩猩。在一些具體實例中,若細胞群體處於動物中之組織或器官中,則自動物移除(例如以手術方式移除)組織或器官(或來自組織或器官之樣品)以自細胞群體分開/分離細胞(如在下文更詳細地描述)。在一些具體實例中,細胞群體處於動物中,且藉由以下投予途徑之任一者或多者向動物投予載體及/或核酸:靜脈內、皮下、經口、鼻內、肌內、眼內、直接注射至所關注之組織中或鞘內。
在一些具體實例中,為了根據本發明方法識別調控元件,分開且分離經處理之細胞或組織的單個細胞以用於進一步分析,以例如評估轉基因表現,確定表現轉基因之各細胞的一致性及/或經表現之轉基因與起始調控元件相關(例如使用條碼),如下文所描述。 單細胞 RNA 分離
在一些具體實例中,本發明提供併入允許自細胞(例如來自組織、器官或體液(例如血清)之細胞)之混合物分離或分開單細胞之任何方法的方法。在一些具體實例中,表現可操作地連接至調控元件之轉基因的各細胞經分開/分離,以便定序細胞中之每一者的總轉錄本。一般而言,用於自細胞(例如來自組織、器官或體液(例如血清)之細胞)之混合物分離單個細胞的各種方法為所屬技術領域中已知的。此類方法包括但不限於:基於細胞分離組成物中之浮力密度分離細胞(美國專利第4,927,750號),基於密度梯度使用塗佈有抗血清學因子之乳膠珠粒分離血清學因子(美國專利第3,862,303號),經由使用磁場分離細胞(美國專利第4,777,145號),及基於密度梯度分離T細胞及B細胞(美國專利第4,511,662號)。在一些具體實例中,基於細胞內或結合至細胞之螢光標記物發出之螢光強度,例如藉由使用FACS分選來分離單個細胞。所屬技術領域中具通常知識者可容易地針對特定背景或應用執行適合之方法。舉例而言,某些細胞類型(例如,神經元及脂肪細胞)之細胞膜在自完整組織解離期間易於破裂。因此,某些標準器官解離技術(例如酶及機械力)相比於其他更適合於一些細胞類型。在一些情況下,視特定應用而定,細胞經完整地分開/分離(例如,無裂解)。在一些具體實例中,細胞之細胞核經完整地分開/分離(例如,無裂解)。
在一些具體實例中,單個細胞可自細胞群體(諸如自組織來源)分離。可用於本發明方法中之組織來源的實例包括結締組織、肌肉組織、神經組織及上皮組織。可在本發明方法之應用中分開/分離且分析之結締組織細胞之實例包括例如纖維母細胞、脂肪細胞、巨噬細胞、肥大細胞、漿細胞等。可在本發明方法之應用中分開/分離且分析之肌肉組織細胞之實例包括例如心肌細胞(cardiomyocytes)、骨胳肌肉細胞、心肌細胞(cardiac muscle cells)、平滑肌細胞等。可在本發明方法之應用中分開/分離且分析之神經組織細胞之實例包括例如神經元、神經膠質等。可在本發明方法之應用中分開/分離且分析之神經組織細胞之實例包括神經元細胞之亞型,諸如GABA能細胞,包括(例如)表現麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元。可在本發明方法之應用中分開/分離且分析之上皮組織細胞之實例包括例如鱗狀上皮細胞、立方體上皮細胞、柱狀上皮細胞等。在一些具體實例中,單個細胞可自血細胞分開/分離。在一些具體實例中,單個細胞可自幹細胞群體(例如自骨髓)分開/分離。在一些具體實例中,單個細胞可自腫瘤分開/分離。在一些具體實例中,單個細胞可自癌症分開/分離。
在一些具體實例中,本發明提供併入允許分選經分開/經分離細胞之任何方法的方法。在一些具體實例中,在進行單細胞RNA定序之前分選經分開/經分離細胞(或細胞核)。在某些具體實例中,基於轉基因(例如,編碼蛋白質(諸如EGFP或EGFP-KASH)之報導基因,如本文中所舉例說明)之表現,天然細胞專一性標記物的存在或添加標記的存在來分離且分選細胞。如本文中所描述,出於細胞分選之目的,各種報導基因、天然細胞專一性標記物及標記為所屬技術領域中已知的。如所屬技術領域中具通常知識者將認識到,報導子轉基因或標記可設計以按需要在細胞之任何部分(例如細胞表面或核套膜之表面)中表現。舉例而言,皆作為代表性核結合域序列之KASH蛋白質(Klarsicht,ANC-1,Syne同源)及SUN蛋白質(Sad1及UNC-84)表現且位於核套膜之外膜。如本文中所舉例說明,包含螢光標記物及核結合域序列之轉基因的表現允許基於轉基因之表現進行細胞核分選。各種細胞分選方法(諸如螢光活化細胞分選(fluorescence-activated cell sorting;FACS)及磁體活化細胞分選(magnet-activated cell sorting;MACS)可用於本發明之實踐中。
在一些具體實例中,在進行單細胞RNA定序之前不分選經分離細胞。
在一些具體實例中,所屬技術領域中具通常知識者已知之任何標記物質可結合上文所描述之細胞分選方法使用。在某些具體實例中,可基於報導基因之表現(例如螢光標記,諸如EGFP的表現)分離且分選細胞。在一些具體實例中,標記為螢光標記。螢光標記之實例包括但不限於:綠色螢光蛋白(GFP);增強型綠色螢光蛋白(EGFP);黃色螢光蛋白(YFP),諸如mBanana;紅色螢光蛋白(RFP),諸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;遠紅色螢光帕米膦酸鹽(FRFP),諸如mGrape1或mGrape2;青色螢光蛋白質(CFP);藍色螢光蛋白(BFP);增強型青色螢光蛋白質(ECFP);群青螢光蛋白(UMFP);橙色螢光蛋白(OFP),諸如mOrange或mTangerine;紅色(橙色)螢光蛋白(mROFP);TagCFP或四半胱胺酸螢光模體。在某些具體實例中,螢光標記為GFP或EGFP。在一些具體實例中,將經分開/經分離細胞或細胞核封裝於液滴中。在一些具體實例中,液滴為乳化液滴。在一些具體實例中,液滴具有奈升級別。在一些具體實例中,液滴進一步包含微粒。在一些具體實例中,微粒為珠粒。
在一些具體實例中,本發明提供併入劃分細胞或細胞核以對其mRNA轉錄物進行進一步分析之任何方法的方法。在一些具體實例中,本發明提供包含本文中所揭示之核酸中之任一者的液滴(例如,乳狀液滴)。在一些具體實例中,本發明提供包含本文中所揭示之細胞中之任一者的乳狀液滴。在一些具體實例中,本發明提供包含本文中所揭示之微粒中之任一者的液滴(例如,乳狀液滴)。在一些具體實例中,本發明提供包含本文中所揭示之微粒中之任一者以及本文中所揭示之細胞中之任一者的液滴(例如乳狀液滴)。
在一些具體實例中,一旦本文中所揭示之細胞或細胞核中之任一者藉由本文中所揭示之液滴中的任一者封裝,則細胞或細胞核經裂解以將細胞或細胞核之內容物(例如RNA內容物)釋放至液滴中。在特定具體實例中,細胞或細胞核經裂解以將細胞或細胞核之內容物(例如RNA內容物)釋放至液滴中,其中液滴進一步包含本文中所揭示之微粒中之任一者。在一些具體實例中,複數個RNA分子連接至複數個微粒(例如珠粒),其中各珠粒帶有獨特的條碼。在一些具體實例中,微粒連接至微粒聚核苷酸,其中微粒聚核苷酸包含寡聚-dT核苷酸序列。在一些具體實例中,寡聚-dT核苷酸序列能夠與自經裂解細胞或細胞核釋放之mRNA分子中之任一者的3'聚腺苷酸化(poly(A))尾部雜合。在一些具體實例中,在本發明方法中捕獲且分離用於分析的RNA包括mRNA、長非編碼RNA、反義轉錄物及pri-miRNA。在一些具體實例中,經分離RNA為mRNA。在一具體實施例中,mRNA藉由結合至帶條碼的微粒(例如珠粒)分離。 識別經分離細胞之細胞類型之方法
如上文所描述,本發明方法預期定序單細胞總轉錄本以確定細胞之一致性(亦即,細胞類型)及/或獲得關於在特定細胞中表現之基因及轉基因的資訊。最終,序列資訊可收集於庫中,該庫不僅可用以識別細胞,而且用於確定哪個候選調控元件能使轉基因在特定細胞中表現,以及量化細胞中之轉基因表現的水準。
在一些具體實例中,本發明提供併入允許自單細胞或單細胞核分離RNA之任何方法的方法。在一些具體實例中,本發明提供併入允許分析mRNA轉錄物同時保存關於轉錄物細胞之來源的資訊之任何方法的方法。在一些具體實例中,本發明提供併入允許識別表現可操作地連接至候選調控元件之轉基因之細胞之任何方法的方法。在一個實例中,單細胞可藉由使用液滴-定序(亦稱為「Drop-Sequence」或「Drop-Seq」)方法識別。Drop-Sequence方法提供高通量單細胞RNA-seq及/或靶向核酸分析(例如,定序、定量逆轉錄聚合酶鏈反應和其類似物),其中使用獨特帶條碼的聚核苷酸單獨標記來自不同細胞之RNA,從而允許創建單個庫同時保留各定序mRNA之細胞標識。在一些具體實例中,分子條碼及基於乳液之微流體的組合用於以高通量方式自單個細胞分離、裂解、條碼化且製備核酸。
在Drop-Sequence方法中,連接至獨特地帶條碼的聚核苷酸之特別設計之微粒(例如,珠粒)用於細胞識別。如圖1中所展示,可將含有大量獨特地帶條碼的聚核苷酸之單個微粒(珠粒)連同單細胞(或單細胞核)引入至單個乳狀液滴中。在一些具體實例中,帶條碼的聚核苷酸經由可撓性多原子連接子共價連接至微粒(例如珠粒)(自5'至3',產生可用於酶促引發之游離3'末端)以形成帶條碼的捕獲珠粒。在一些具體實例中,帶條碼的聚核苷酸經由可撓性多原子連接子共價連接至5'至3'之微粒(例如珠粒)(產生可用於酶促引發之游離3'末端),以形成帶條碼的捕獲珠粒。
在一些具體實例中,本文中所揭示之微粒(例如珠粒)中之任一者連接至聚核苷酸分子(在本文中係指「微粒聚核苷酸」)。在一些具體實例中,微粒聚核苷酸包含用作下游PCR及定序之引發位點的恆定序列。在一些具體實例中,微粒聚核苷酸包含微粒(例如珠粒)獨有的條碼序列(「細胞條碼」),但該序列為連接至微粒之所有微粒聚核苷酸共有的。在一些具體實例中,微粒聚核苷酸包含各微粒聚核苷酸獨有的獨特分子標誌(UMI)核苷酸序列。舉例而言,若微粒包含兩個或更多個微粒聚核苷酸,則微粒上之各微粒聚核苷酸將包含不同的UMI序列。在一些具體實例中,UMI可用以識別PCR複製品。在一些具體實例中,微粒聚核苷酸包含寡聚-dT序列。在一些具體實例中,寡聚-dT序列可用以捕獲聚腺苷酸化mRNA(例如,經由與mRNA之polyA序列雜合)及/或引發逆轉錄。
在一些具體實例中,本文中所揭示之微粒聚核苷酸分子中之任一者與本文中所揭示之核酸分子中之任一者交互作用。在一些具體實例中,與微粒交互作用(例如連接至其)之核酸分子為自DNA分子轉錄之RNA分子。在一些具體實例中,RNA分子包含轉基因及條碼序列。在一些具體實例中,DNA分子包含調控元件,其中RNA分子中之條碼序列與DNA分子中之調控元件相關。在一些具體實例中,核酸分子包含polyA尾部且微粒聚核苷酸分子包含寡聚-dT序列,且核酸分子之polyA尾部與微粒聚核苷酸之寡聚-dT序列雜合。
在一些具體實例中,各微粒聚核苷酸分子包含四個不同的區域:(1)恆定序列,其用作下游PCR及定序之引發位點(所有微粒上之微粒聚核苷酸分子相同);(2)「細胞條碼」,其在任一種微粒上之所有微粒聚核苷酸分子中為相同的,但不同於其他微粒上之細胞條碼(亦即,細胞條碼對於特定微粒為唯一的);(3)獨特分子標誌(UMI),其在各微粒聚核苷酸分子上為不同的,且用於識別PCR複製品;及(4)寡聚-dT序列,其用於捕獲聚腺苷酸化mRNA及引發逆轉錄。
如上文所指出,由微流體裝置所產生之乳狀液滴(由不可混溶的載劑流體圍繞之水性液滴)可用於用帶條碼的微粒共封裝細胞(或細胞核)。在一些具體實例中,細胞(或細胞核)在液滴內裂解,且來自經裂解細胞或細胞核之mRNA(總轉錄本)與微粒(例如珠粒)之諸多微粒聚核苷酸分子(例如在微粒聚核苷酸分子之寡聚-dT區域上)雜合。參見例如圖1。如本文中所描述,在特定具體實例中,微粒帶有獨特的條碼,使得各液滴及其內容物為可區分的。本文中所揭示之方法涵蓋使用任何微粒類型之單細胞方法(例如10X基因體學鉻單細胞基因表現分析)。參見例如美國公開申請案第20180030515號及Macosko等人, 2015, 「Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets」Cell 161, 1202-1214;及Klein等人, 2015, 「Droplet Barcoding for Single-Cell Transcriptomics Applied to Embryonic Stem Cells」Cell 161, 1187-1201,其各自以全文引用之方式併入本文中。可用以識別表現轉基因之細胞的其他技術包括例如CEL-seq2/C1、MARS-seq、SCRB-seq、Smar-seq/C1及/或Smart-seq2。參見 例如Ziegenhain等人, 2017, Molecular Cell, 65:631-643。 單細胞總轉錄本定序
在一些具體實例中,如上文所論述,可使用本文中所揭示之定序方法中之任一者來對來自經裂解細胞或細胞核之RNA進行定序,且收集序列資訊以產生序列庫。在一些具體實例中,本發明提供併入允許對細胞之總轉錄本進行定序之任何方法的方法。用於產生序列庫之各種方法為所屬技術領域中已知的,且方法適用於正使用的特定高通量平台。在一些具體實例中,在mRNA分析中,3'聚腺苷酸化(poly(A))尾部經靶向,以便確保編碼RNA與非編碼RNA分離。在本文中所描述之Drop-sequence方法中,帶條碼的微粒聚核苷酸分子與mRNA雜合。參見例如圖1。在一些具體實例中,在帶條碼的微粒上獲取mRNA之後,進行逆轉錄(RT)反應,以將各單元的mRNA轉化為第一股cDNA,其帶有獨特的條碼且共價連接至mRNA微粒。隨後,在一些具體實例中,經由模版轉換反應之通用引子用於在合成cDNA之下游引入PCR操作。在一些具體實例中,接著可使用PCR擴增cDNA中之每一者,定量且使用高通量平台(諸如次世代定序(NGS))並行定序以創建資料集。PCR方法在所屬技術領域中為眾所周知的。參見例如Dieffenbach及Dveksler, PCR Primer, 實驗室手冊, Cold Spring Harbor Press, Plainview, N.Y. [1995]。NGS方法,諸如Illumina/Solexa™平台及NovaSeq™平台已為所屬技術領域中具通常知識者所已知。
一旦完成定序,則在一些具體實例中,原始序列資料可經歷額外分析。在一些具體實例中,習知的庫製備協定可用於製備RNA-Seq庫。在一些具體實例中,可利用NGS資料之通用資料分析管線。在一些具體實例中,用於NGS資料之通用資料分析管線可包括但不限於預處理資料以移除銜接子序列及低質量讀段,將資料映射至參考基因體或序列讀數之重新比對,及分析編譯的序列。舉例而言,在一些具體實例中,序列可與特定人類總轉錄本比對,且可提取其「細胞」條碼序列資訊,以便識別哪些mRNA來自哪些細胞。在一些具體實例中,序列可與特定人類總轉錄本比對,且可提取其「UMI」條碼序列資訊,以便識別特定細胞中之特定轉錄物的豐度。在一些具體實例中,序列可與特定人類總轉錄本比對,且可提取其「細胞」及「UMI」條碼序列資訊,以便識別哪些mRNA來自哪些細胞及特定細胞中之特定轉錄物的豐度。序列之分析可包括各種生物資訊學評估,包括但不限於:要求偵測小核苷酸多態性(small nucleotide polymorphisms;SNP)的遺傳變體之評估、新基因之偵測、轉基因插入位點之識別、表現轉基因之細胞類型的確定、涉及轉基因表現之候選調控元件的識別及/或基因(例如,轉基因)轉錄物表現水準的評估。在一些具體實例中,經由單次定序運行,可同時獲得數萬個(或更多個)可區分的總轉錄本。 單細胞表現圖譜之分析
在一些具體實例中,本發明提供分析異質細胞群體以識別於給定細胞類型中提供選擇性表現之候選調控元件的方法。在一些具體實例中,本發明提供併入任何允許識別選擇性表現可操作地連接於候選調控元件之轉基因之細胞之方法的方法。在一些具體實例中,細胞可在非均質細胞群體內。異質細胞群體不僅可包含不同類型之細胞(例如,不同譜系之細胞、不同分化狀態之細胞及/或自整個身體中一或多種組織來源獲得之細胞),而且可包含在各種細胞週期階段中之細胞。在一些具體實例中,自此等異質細胞群體之總轉錄本量測可進行多種生物資訊評估。
在一些具體實例中,原始序列資料可與參考基因體比對,提供與各基因相關之讀段數目的計數。在一些具體實例中,原始序列資料可與已知細胞類型或新穎細胞類型之基因表現的一或多個分子圖譜中之序列資料比對。在一些具體實例中,藉由使用UMI條碼量化轉錄物之數目來確定讀段計數以識別且移除由於PCR擴增偏差而已包括在內之轉錄物。將資料標準化以解釋在cDNA庫形成及定序之效率方面的細胞與細胞變化。許多標準化方法為此項技術中已知的。參見例如以全文引用之方式併入本文中的Risso等人, 2018, 「A General and Flexible Method for Signal Extraction from Single-Cell RNA-seq Data」Nat. Comm. 9:284;1-17。在一些具體實例中,細胞或基因可基於其總轉錄本圖譜叢集以形成亞組,允許分別識別細胞亞型或共變基因。在一些具體實例中,諸如主成分分析(principal component analysis;PCA)或t-SNE之各種分析可用於藉由將細胞自高維空間轉換至低維空間來簡化可視化及圖案偵測之資料。在一些具體實例中,代表性細胞標記(亦即,文獻衍生之典型生物標記)可映射至各叢集上,以便識別專一性細胞群體。
在一些具體實例中,如本文所描述,若細胞表現可操作地連接於候選調控元件之帶條碼的轉基因(例如,編碼EGFP-KASH之轉基因),則可對各轉基因條碼進行比較性分析以評估給定候選調控元件對特定細胞類型中轉基因表現之影響。舉例而言,可評估可操作地連接於特定調控元件之特定轉基因之表現量值。在一些具體實例中,可操作地連接於候選調控元件之特定轉基因之表現量值(例如,表現之減少或增加量)可與可操作地連接於不同候選調控元件之相同轉基因的表現量進行比較。在一些具體實例中,可操作地連接於候選調控元件之特定轉基因在一種細胞類型中之表現量值(例如,表現之減少或增加量)可與不同細胞類型中連接至相同候選調控元件的相同轉基因之表現量進行比較。另外,在一些具體實例中,進一步預期可進行比較以比較可操作地連接於候選調控元件之轉基因在各種細胞類型中之表現。以此方式,可確定調控元件之細胞類型專一性及可操作地連接於調控元件之轉基因的表現量值。 確定藉由調控元件提供之選擇性表現
在一些具體實例中,本發明之方法包括各種方法,例如用於自表現報導轉基因之細胞中分離RNA、定序所關注的轉錄物、量測及/或偵測轉基因之表現、識別於所關注的細胞類型中提供轉基因之表現的調控元件等。基於轉基因在目標細胞類型中表現之選擇性,本發明方法可用於識別且選擇適合於在目標細胞類型中表現任何所關注之轉基因的調控元件。在一些具體實例中,轉基因之表現選擇性為確定轉基因是否在目標細胞類型中而非在非目標細胞類型中表現。在一些具體實例中,轉基因之表現選擇性為確定轉基因是否以較大水準在目標細胞類型而非在非目標細胞類型中表現。在一些具體實例中,轉基因之表現選擇性為確定轉基因是否以較低水準在目標細胞類型而非在非目標細胞類型中表現。
在一些具體實例中,本發明方法可用於識別在任何所關注之細胞類型中提供選擇性表現之調控元件。在一些具體實例中,所關注之細胞類型為肌肉細胞、神經元細胞、上皮細胞或結締組織細胞或其各種亞群。在一些具體實例中,肌肉細胞為心肌細胞(cardiomyocyte)、骨骼肌細胞、心肌細胞(cardiac muscle cell)或平滑肌細胞。在一些具體實例中,上皮細胞為鱗狀上皮細胞、立方體上皮細胞或柱狀上皮細胞。在一些具體實例中,神經元細胞為神經元或膠細胞。在一些具體實例中,結締組織細胞為纖維母細胞、脂肪細胞、巨噬細胞、肥大細胞或漿細胞。在一些具體實例中,所關注之細胞為血細胞。在一些具體實例中,所關注之細胞為幹細胞。在一些具體實例中,所關注之細胞為腫瘤細胞(例如,癌細胞)。在一些具體實例中,所關注之細胞類型為真核細胞,諸如哺乳動物細胞,其包括(但不限於)來自以下之細胞:人類、非人類靈長類動物(諸如猿、黑猩猩、猴及紅毛猩猩),家養動物(包括狗及貓)以及家畜(諸如馬、牛、豬、綿羊及山羊),或其他哺乳動物物種,包括但不限於小鼠、大鼠、天竺鼠、兔、倉鼠及其類似物。在一些具體實例中,所關注之細胞類型包括「轉化體」及「轉化細胞」,其包括初級轉化細胞及自其衍生之子代(不考慮繼代次數)。
在簡單情形中,可確定給定候選調控元件(「調控元件A」)將轉基因於特定細胞類型中之表現驅動至與相同細胞類型中之另一調控元件(「調控元件B」)相比更高的水準。在此類情形中,與調控元件B相比,調控元件A將視為在使轉基因在特定細胞類型中表現方面更具選擇性。在另一簡單情形中,可確定給定調控元件A將轉基因於特定細胞類型中之表現驅動至比相同細胞類型中之另一調控元件B更低的水準。在一些情況下,調控元件A可使轉基因在給定組織(例如,神經元組織)之許多不同細胞類型中廣泛表現。在一些具體實例中,調控元件B可使轉基因在給定組織之目標細胞的離散群體中表現(亦即,調控元件B提供表現轉基因之目標細胞相對於表現轉基因之細胞總數的更高比率)。在此情形下,與調控元件A相比,調控元件B將視為在使轉基因在更有限之細胞類型亞群中表現方面更具選擇性,其可有益於例如減少脫靶事件。在上文簡化之實例情形中,用於確定選擇性之比較不為彼此互斥的。
在一些具體實例中,對於調控元件之特定用途及/或為實現特定治療目的,可考慮多重比較。在一些具體實例中,適合於特定治療目的之調控元件不需要在給定細胞類型中提供最高或最低表現量。如本文所詳述,可以多種方法量測及測定藉由候選調控元件驅動之表現之選擇性。
在一個態樣中,本發明方法可用於自可操作地連接於轉基因(例如,報導基因)之候選調控元件池篩選及識別允許轉基因於所關注之細胞類型中之任何可偵測表現的調控元件。亦即,可操作地連接於所關注之細胞類型中給定候選調控元件之轉基因的任何可偵測表現指示調控元件可用於所關注之細胞類型中以驅動任何轉基因之表現。藉助於實例,已識別為驅動轉基因(例如,報導基因)於PV細胞中表現之調控元件指示識別之調控元件可用於PV細胞中以驅動所關注之轉基因的表現。在一些具體實例中,轉基因之表現量不需要與參考表現量相比較;可操作地連接於調控元件之轉基因之任何可偵測表現量指示調控元件在給定細胞類型中提供選擇性表現。因此,在一些具體實例中,與另一細胞類型(其中偵測到表現或低表現)相比,識別之調控元件選擇性地驅動轉基因在一種細胞類型中之表現。在一些具體實例中,與另一候選調控元件(其並未驅動轉基因在相同細胞類型中之表現)相比,識別之調控元件選擇性地驅動轉基因在一種細胞類型中之表現。
在一些態樣中,本文所描述之方法可用於自可操作地連接至轉基因(例如,報導基因)之候選調控元件池篩選及識別與相同細胞類型中轉基因之參考表現量相比允許轉基因於所關注之細胞類型中選擇性(例如,增加或減少)表現的調控元件。在一些具體實例中,轉基因之參考表現量為藉由對照調控元件提供之轉基因表現量。熟習此項技術者瞭解到此項技術中之許多例示性對照調控元件(例如,CBA)。在一些具體實例中,對照調控元件為天然存在之調控元件(例如,CBA)。在一些具體實例中,轉基因之參考表現量為藉由相同細胞類型中之另一候選調控元件提供之轉基因表現量。在一些具體實例中,轉基因之參考表現量為藉由相同細胞類型中之泛細胞調控元件提供之轉基因表現量。泛細胞調控元件之實例包括例如,巨細胞病毒主要即刻早期啟動子(CMV)、雞β-肌動蛋白啟動子(CBA)、CMV早期強化子/CBA啟動子(CAG)、延伸因子-1α啟動子(EF1α)、猴病毒40啟動子(SV40)、磷酸甘油酸激酶啟動子(PGK)及聚泛素C基因啟動子(UBC)且如本文所描述。藉助於實例,候選調控元件於所關注之細胞類型中之選擇性可藉由將由細胞類型中調控元件提供之表現量與由相同細胞類型中一或多種不同候選調控元件驅動之表現量進行比較來確定。在一些具體實例中,調控元件提供與相同細胞類型中之參考表現量(例如,藉由另一候選調控元件提供之轉基因表現量;藉由泛細胞調控元件提供之轉基因表現量)相比,大於或小於至少1.2倍、至少1.4倍、至少1.6倍、至少1.8倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少14倍、至少16倍、至少18倍、至少20倍之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中之參考表現量(例如,藉由另一候選調控元件提供之轉基因表現量;藉由泛細胞調控元件提供之轉基因表現量)相比,大於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少125%、至少150%、至少175%、至少200%、至少250%、至少300%、至少350%、至少400%、至少450%或至少500%之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中之參考表現量(例如,藉由另一候選調控元件提供之轉基因表現量;藉由泛細胞調控元件提供之轉基因表現量)相比,小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中之參考表現量(例如,藉由另一候選調控元件提供之轉基因表現量;藉由泛細胞調控元件提供之轉基因表現量)相比,大於約1.5倍、約2倍、約2.5倍、約3倍、約3.5倍、約4倍、約4.5倍、約5倍、約5.5倍、約6倍、約6.5倍、約7倍、約7.5倍、約8倍、約8.5倍、約9倍、約9.5倍或約10倍之選擇性表現。在一些具體實例中,調控元件提供與相同細胞類型中之參考表現量(例如,藉由另一候選調控元件提供之轉基因表現量;藉由泛細胞調控元件提供之轉基因表現量)相比,小於約1.5倍、約2倍、約2.5倍、約3倍、約3.5倍、約4倍、約4.5倍、約5倍、約5.5倍、約6倍、約6.5倍、約7倍、約7.5倍、約8倍、約8.5倍、約9倍、約9.5倍或約10倍之選擇性表現。
在一些態樣中,本文所描述之方法中之任一者可用於自可操作地連接至轉基因(例如,報導基因)之候選調控元件池篩選及識別與一或多種不同細胞類型中可操作地連接至相同調控元件的相同轉基因之表現量(參考表現量)相比,在一種細胞類型中可操作地連接至調控元件之轉基因的選擇性(例如,增加或減少)表現。藉助於實例,候選調控元件於所關注之細胞類型中之選擇性可藉由將該細胞類型中由調控元件提供之表現量與一或多種不同細胞類型中由相同調控元件提供之表現量進行比較來確定。在一些具體實例中,調控元件提供與參考表現量(例如,藉由一或多種不同細胞類型中相同調控元件提供之轉基因表現量)相比,大於至少1.2倍、至少1.4倍、至少1.6倍、至少1.8倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少14倍、至少16倍、至少18倍、至少20倍之選擇性表現。在一些具體實例中,調控元件提供與參考表現量(例如,藉由一或多種不同細胞類型中相同調控元件提供之轉基因表現量)相比,小於至少1.2倍、至少1.4倍、至少1.6倍、至少1.8倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少14倍、至少16倍、至少18倍、至少20倍之選擇性表現。在一些具體實例中,調控元件提供與參考表現量(例如,藉由一或多種不同細胞類型中相同調控元件提供之轉基因表現量)相比,大於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少125%、至少150%、至少175%、至少200%、至少250%、至少300%、至少350%、至少400%、至少450%或至少500%之選擇性表現。在一些具體實例中,調控元件提供與參考表現量(例如,藉由一或多種不同細胞類型中相同調控元件提供之轉基因表現量)相比,小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%之選擇性表現。在一些具體實例中,調控元件提供與參考表現量(例如,藉由一或多種不同細胞類型中相同調控元件提供之轉基因表現量)相比,大於約1.5倍、約2倍、約2.5倍、約3倍、約3.5倍、約4倍、約4.5倍、約5倍、約5.5倍、約6倍、約6.5倍、約7倍、約7.5倍、約8倍、約8.5倍、約9倍、約9.5倍或約10倍之選擇性表現。在一些具體實例中,調控元件提供與參考表現量(例如,藉由一或多種不同細胞類型中相同調控元件提供之轉基因表現量)相比,小於約1.5倍、約2倍、約2.5倍、約3倍、約3.5倍、約4倍、約4.5倍、約5倍、約5.5倍、約6倍、約6.5倍、約7倍、約7.5倍、約8倍、約8.5倍、約9倍、約9.5倍或約10倍之選擇性表現。
在一些具體實例中,可操作地連接至調控元件之轉基因表現之選擇性可藉由量測在細胞群體中(例如,在組織中)表現轉基因的所關注之特定細胞類型(所關注之假設細胞類型「Cell X」)之比率的方法來測定。在一些具體實例中,比率之測定不包括量測轉基因表現量或轉基因表現之量值;相反,在此類具體實例中,細胞中之任何可偵測表現促成該比率。在一些具體實例中,可操作地連接至候選調控元件之轉基因表現之選擇性可藉由將在細胞群體中(例如,在組織中)表現轉基因的預定臨限值水準(例如,可偵測水準)之Cell X細胞之數目與表現可操作地連接至相同調控元件之轉基因的細胞之總數目進行比較來量測。在一些具體實例中,此「比率」經計算為在細胞群體(Cell X +非Cell X細胞)中表現轉基因之Cell X細胞之數目與表現轉基因之細胞的總數目之比,其中轉基因可操作地連接至細胞群體中所有細胞中之相同調控元件。藉助於實例,與神經元組織中之其他非PV細胞相比,可操作地連接至GABA能神經元(諸如PV神經元)中之調控元件的轉基因(例如,編碼GFP之轉基因)之選擇性表現可藉由將表現可偵測水準之轉基因(例如,表現GFP轉基因)的PV細胞之數目與在相同調控元件A控制下神經元組織中表現GFP之細胞之總數目進行比較來量測(亦即,PV與表現GFP之總細胞(PV + 非PV細胞)之比率)。根據本文所描述之分析方法,此類量測、偵測及定量可在活體內或活體外進行。舉例而言,使用本文詳述之分析方法,可分開且分離表現GFP之細胞,可確定各經分離細胞的標識(例如,PV神經元與非PV細胞),且可量化在候選調控元件控制下之表現GFP之PV神經元及在相同調控元件控制下之表現GFP之非PV神經元的數目。在一些具體實例中,表現可操作地連接至調控元件之轉基因之Cell X細胞的數目相對於表現可操作地連接至相同調控元件之轉基因的總細胞愈高(亦即,比率愈高),調控元件對Cell X之選擇性愈高。
在一些具體實例中,可使用基於免疫組織化學之共定域分析來確定或證實細胞類型中調控元件之選擇性。在一些具體實例中,分析需要使用:a)可操作地連接至調控元件之轉基因(例如,編碼GFP之轉基因)以量測轉基因表現及,b)識別對目標細胞類型具專一性之標記的結合劑(例如,抗體),其中結合劑連接至可偵測標記。舉例而言,在一些具體實例中,可使用基於免疫組織化學之共定域分析來確定或證實細胞類型之選擇性,該共定域分析使用:a)可操作地連接至調控元件之轉基因(例如,編碼GFP之轉基因)以量測轉基因表現及,b)識別連接至第二螢光標記(例如,紅色螢光蛋白)之所關注的細胞類型(例如,與PV神經元特異性相互作用之抗PV抗體)之抗體。細胞類型中基因表現之選擇性以對細胞類型(例如,PV細胞)亦為陽性之GFP陽性細胞(例如,總細胞)之百分比形式量測。在此種分析中,亦為GFP陽性之所關注之陽性細胞類型藉由兩種螢光信號之共定域指示,亦即,紅色及綠色螢光之重疊。此種量測、分析及/或偵測可藉由眼睛檢查或藉由電腦進行。
在一些具體實例中,如本文所描述之「比率」可藉由將表現可操作地連接至候選調控元件之轉基因之Cell X細胞的數目除以表現可操作地連接至相同調控元件之轉基因之細胞的總數目(亦即,Cell X及非Cell X細胞)且乘以100以轉換成百分比來計算。在一些具體實例中,若表現可操作地連接至調控元件A之轉基因之細胞的總數目之約35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大於約99%為Cell X細胞,則調控元件A對Cell X為選擇性的。
在一些具體實例中,可使用調控元件針對Cell X細胞確定如上文所描述之比率(或百分比)且將其與使用一或多種不同調控元件針對Cell X細胞確定之比率(或百分比)進行比較。舉例而言,在一些具體實例中,當表現轉基因之Cell X細胞之百分比(例如,Cell X細胞/總細胞× 100)與可操作地連接至不同調控元件時表現相同轉基因之Cell X細胞之百分比相比為更高百分比時,調控元件對Cell X中之表現具有選擇性。在一些具體實例中,不同調控元件為參考調控元件。在一些具體實例中,不同調控元件為泛細胞調控元件,例如,巨細胞病毒主要即刻早期啟動子(CMV)、雞β-肌動蛋白啟動子(CBA)、CMV早期強化子/CBA啟動子(CAG)、延伸因子-1α啟動子(EF1α)、猴病毒40啟動子(SV40)、磷酸甘油酸激酶啟動子(PGK)及聚泛素C基因啟動子(UBC)且如本文所描述。在一些具體實例中,當表現轉基因之Cell X細胞之百分比(例如,Cell X細胞/總細胞× 100)比可操作地連接至不同調控元件時表現相同轉基因之Cell X細胞之百分比高至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少125%、至少150%、至少175%、至少200%、至少250%、至少300%、至少350%、至少400%、至少450%或至少500%,或高至少1-5%、5%-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、40-45%、45-50%、50-55%、55-60%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%、100-125%、125-150%、150-200%、200-250%、250-300%、300-350%、350-400%、400-450%或450-500%時,調控元件在Cell X中提供選擇性表現。在一些具體實例中,當表現轉基因之Cell X細胞之百分比(例如,Cell X細胞/總細胞× 100)比可操作地連接至不同調控元件時表現相同轉基因之Cell X細胞之百分比低至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%,或低至少1-5%、5%-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、40-45%、45-50%、50-55%、55-60%、65-70%、70-75%、75-80%、80-85%、85-90%或90-95%時,調控元件在Cell X中提供選擇性表現。在一些具體實例中,當表現轉基因之Cell X細胞之百分比(例如,Cell X細胞/總細胞× 100)與可操作地連接至不同調控元件時表現相同轉基因之Cell X細胞之百分比相比高至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少25倍或至少50倍時,調控元件在Cell X中提供選擇性表現。在一些具體實例中,當表現轉基因之Cell X細胞之百分比(例如,Cell X細胞/總細胞× 100)與可操作地連接至不同調控元件時表現相同轉基因之Cell X細胞之百分比相比低至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少25倍或至少50倍時,調控元件在Cell X中提供選擇性表現。在一些具體實例中,當表現轉基因之Cell X細胞之百分比(例如,Cell X細胞/總細胞× 100)為比可操作地連接至不同調控元件時表現轉基因之Cell X細胞之百分比高至少1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100倍之水準時,調控元件在Cell X中提供選擇性表現。
在一些具體實例中,在Cell X中提供選擇性表現之調控元件亦具有高水準之活性。在某些具體實例中,與不具有調控元件或具有不同調控元件(參考調控元件)之Cell X細胞中相同構築體之表現量相比,在Cell X中提供選擇性表現之調控元件將Cell X細胞中轉基因之表現增加至少2、5、10、15、20、30、40、50、60、70、80、90、100倍或更多倍。在一些具體實例中,與不具有調控元件或具有不同調控元件(參考調控元件)之Cell X細胞中相同構築體之表現量相比,在Cell X中提供選擇性表現之調控元件將基因表現增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些具體實例中,與不同於Cell X之細胞類型中相同構築體之表現量相比,在Cell X中提供選擇性表現之調控元件將Cell X細胞中之基因表現增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些具體實例中,與表現可操作地連接至相同調控元件之相同轉基因的不同細胞中之表現增加量相比,調控元件將Cell X細胞中之轉基因表現增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些具體實例中,與表現可操作地連接至不同調控元件(例如,參考調控元件或泛細胞調控元件)之相同轉基因的Cell X細胞中之表現增加量相比,調控元件將Cell X細胞中之轉基因表現增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
一般而言,表現之增加或減少可以轉錄或轉錄後水準發生,且可量測轉錄或轉錄後產物。舉例而言,以轉錄水準,調控元件可藉由募集轉錄因子及/或RNA聚合酶、增加轉錄起始或募集增加轉錄水準之DNA及/或組蛋白修飾來增加表現。表現之增加或減少可藉由量測表示轉基因之RNA轉錄物的量之增加或減少來偵測。以轉錄後水準,調控元件可藉由增加轉譯成蛋白質之RNA的量或速率來增加表現。此可經由各種機制,例如藉由增加mRNA之穩定性或增加轉譯所需蛋白質之募集及組裝來實現。此種蛋白質表現之增加或減少可藉由量測表示轉基因之蛋白質表現的量來偵測。產生之蛋白質的量可例如藉由酶聯免疫吸附分析法(enzyme linked immunosorbent assay;ELISA)直接量測或例如藉由功能分析間接量測。
使用上述方法識別之各種RE的選擇性可進一步測試及證實專一性細胞類型中之選擇性基因表現。舉例而言,使用免疫組織化學方法可測試RE在GABA能神經元(諸如PV、SST或VIP神經元)中之選擇性基因表現。GABA能神經元可藉由諸如麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV及VIP之表現的標記來識別。替代地,可測試RE在其他細胞類型中之選擇性基因表現,諸如興奮性神經元、多巴胺神經元、微膠細胞、運動神經元、血管細胞、非GABA能神經元或其他CNS細胞、上皮細胞、心肌細胞或肝細胞或體內任何其他細胞類型。在所關注之細胞或細胞類型中藉由調控元件驅動的表現之選擇性可以許多方法量測。目標細胞類型中之基因表現相對於非目標細胞類型之選擇性可藉由將表現來自可操作地連接至一或多個調控元件的基因之轉錄物之可偵測水準的目標細胞之數目與表現該基因之細胞之總數目進行比較來量測。此類量測、偵測及定量可在活體內或活體外進行。
在一些情況下,專一性細胞類型之選擇性可使用共定域分析來確定。在一些情況下,共定域分析係基於免疫組織化學。在一些情況下,將可偵測報導基因用作轉基因以允許在所關注之細胞類型中偵測及/或量測基因表現。在一些情況下,特異性標記目標細胞之可偵測標記(例如,螢光標記或抗體)用於偵測及/或量測目標細胞。在一些情況下,共定域分析採用成像(例如,螢光成像)以確定不同螢光標記之間的重疊,例如,指示目標細胞之螢光信號與指示基因表現之另一螢光信號之間的重疊。在一些情況下,用於共定域分析之螢光標記包括紅色螢光蛋白(RFP),諸如tdTomato報導基因,及綠色螢光報導蛋白,諸如eGFP。
在一些情況下,可操作地連接至一或多個調控元件之基因為螢光蛋白,例如eGFP或RFP,其中轉基因之表現提供可偵測信號。在一些情況下,將組織進行eGFP染色或使用螢光顯微鏡直接偵測來自eGFP之螢光。具有不同螢光或可偵測信號之第二螢光標記或報導基因可用於指示目標細胞,諸如識別目標細胞之抗體。舉例而言,與PV神經元特異性相互作用之抗PV抗體可用於產生可偵測信號,該可偵測信號與用於量測基因表現之螢光可區分,諸如紅色螢光或紅色斑點。因此,在一實例中,其中eGFP為可操作地連接至一或多個在PV神經元中驅動選擇性表現之調控元件的轉基因,且其中PV神經元用抗PV抗體標記,PV細胞中基因表現之選擇性以亦為PV+之eGFP+細胞之百分比形式量測。在此種分析中,亦為eGFP+之PV+細胞藉由兩種螢光信號之重疊來指示,亦即,紅色及綠色螢光之重疊。此種量測、分析及/或偵測可藉由眼睛檢查或藉由電腦進行。
在一些情況下,與表現轉基因之非目標細胞類型(或其他細胞)的比例相比,吾人亦可量測表現轉基因之所關注之細胞類型(或目標細胞類型)的比例以評估一或多個可操作地連接至轉基因之調控元件之選擇性。類似地,表現之選擇性亦可藉由將表現可操作地連接至一或多個調控元件之轉基因之目標細胞的數目與表現轉基因之所有細胞之總數目進行比較來量測。在兩種方法中,表現轉基因之目標細胞之數目愈高,目標細胞之調控元件更具選擇性。在一些情況下,目標細胞為PV神經元。單細胞核多工處理分析之替代應用
在某些具體實例中,本文所描述之單細胞核多工處理分析用於量測所關注之細胞中之AAV轉導。在此類具體實例中,多工處理分析可用於量測所關注之特定病毒向所關注之細胞中的轉導,諸如特定AAV血清型、重組或經工程改造AAV或特定慢病毒株。在某些具體實例中,多工處理分析用於量測選自由以下者組成之群的AAV向所關注之細胞中之轉導:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其雜合體、禽類AAV、牛類AAV、犬類AAV、馬類AAV、靈長類AAV、非靈長類AAV及綿羊類AAV。在某些具體實例中,本文所描述之單細胞核多工處理分析用於量測AAV向所關注之細胞類型中的轉導,諸如CNS細胞(例如,神經元或膠細胞(諸如星狀細胞))、非CNS細胞(例如,興奮性神經元、多巴胺神經元、微膠細胞、運動神經元、血管細胞、非GABA能神經元或其他CNS細胞)、上皮細胞、心肌細胞或肝細胞。在特定具體實例中,本文所描述之單細胞核多工處理分析用於量測AAV向GABA能神經元中之轉導,其可藉由諸如麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV及VIP之表現的標記來識別。
在特定具體實例中,本發明之單細胞核多工處理分析用於藉由量測所關注之細胞中病毒轉導之增加或減少來識別增加病毒向關注細胞中之轉導的新穎病毒殼體或病毒DNA序列。舉例而言,可篩選新穎病毒殼體變體或病毒DNA序列之庫以識別增加病毒向所關注之細胞中之轉導(例如,AAV或慢病毒)的殼體或DNA序列。在一些情況下,殼體或DNA序列增加病毒向所關注之細胞類型中之轉導,諸如CNS細胞(例如,神經元或膠細胞(諸如星狀細胞))、非CNS細胞(例如,興奮性神經元、多巴胺神經元、微膠細胞、運動神經元、血管細胞、非GABA能神經元或其他CNS細胞)、上皮細胞、心肌細胞或肝細胞。在特定情況下,本文所描述之單細胞核多工處理分析用於識別增加AAV向GABA能神經元(諸如表現麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元)中之轉導的殼體或DNA序列。
在其他具體實例中,可篩選新穎病毒殼體變體或病毒DNA序列之庫以識別減少或抑制病毒向所關注之細胞中之轉導(例如,AAV或慢病毒)的病毒殼體或病毒DNA序列。舉例而言,殼體或DNA序列減少或抑制病毒向所關注之細胞類型中之轉導,諸如CNS細胞(例如,神經元或膠細胞(諸如星狀細胞))、非CNS細胞(例如,興奮性神經元、多巴胺神經元、微膠細胞、運動神經元、血管細胞、非GABA能神經元或其他CNS細胞)、上皮細胞、心肌細胞或肝細胞。在特定具體實例中,本文所描述之單細胞核多工處理分析用於識別減少或抑制AAV向GABA能神經元(諸如表現麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元)中之轉導的殼體或DNA序列。
在另一個具體實例中,本發明之單細胞核多工處理分析用於識別調節由病毒(例如,AAV、慢病毒、HSV等)向所關注之細胞中轉導之轉基因之轉譯的因子。舉例而言,篩選候選因子之庫以識別增加或減少由病毒(例如,AAV、慢病毒、HSV等)向所關注之細胞中轉導之轉基因之轉譯的因子。在一個具體實例中,因子增加或減少向所關注之細胞中轉導之轉基因的轉譯,諸如CNS細胞(例如,神經元或膠細胞(諸如星狀細胞))、非CNS細胞(例如,興奮性神經元、多巴胺神經元、微膠細胞、運動神經元、血管細胞、非GABA能神經元或其他CNS細胞)、上皮細胞、心肌細胞或肝細胞。在特定具體實例中,本文所描述之單細胞核多工處理分析用於識別增加或減少向GABA能神經元(諸如表現麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元)中轉導之轉基因之轉譯的因子。
在另一具體實例中,本發明之單細胞核多工處理分析用於識別在所關注之細胞中促進病毒(例如,AAV)第二股合成之病毒DNA序列。舉例而言,可篩選新穎病毒DNA序列之庫以識別在所關注之細胞中增加或減少AAV第二股合成之DNA序列。舉例而言,DNA序列在所關注之細胞類型中增加或減少AAV第二股合成,諸如CNS細胞(例如,神經元或膠細胞(諸如星狀細胞))、非CNS細胞(例如,興奮性神經元、多巴胺神經元、微膠細胞、運動神經元、血管細胞、非GABA能神經元或其他CNS細胞)、上皮細胞、心肌細胞或肝細胞。在特定具體實例中,本文所描述之單細胞核多工處理分析用於識別在GABA能神經元(諸如表現麩胺酸去羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP之GABA能神經元)中增加或減少AAV第二股合成之病毒DNA序列。
在另一具體實例中,本發明之單細胞核多工處理分析用於量測所關注之細胞中回應於所關注之功能蛋白(諸如功能蛋白效應子)的基因表現。在此類具體實例中,可將蛋白質之庫添加至一或多個細胞中,且在所關注之細胞中量測回應於各獨特蛋白質之基因表現。針對治療反應、細胞路徑信號傳導反應、脫靶基因調節、免疫反應等,可分析回應於一或多種來自庫之蛋白質的基因表現。序列 SEQ ID NO: 1 TCAACAGGGGGACACTTGGGAAAGAAGGATGGGGACAGAGCCGAGAGGACTGTTACACATTAGAGAAACATCAGTGACTGTGCCAGCTTTGGGGTAGACTGCACAAAAGCCCTGAGGCAGCACAGGCAGGATCCAGTCTGCTGGTCCCAGGAAGCTAACCGTCTCAGACAGAGCACAAAGCACCGAGACATGTGCCACAAGGCTTGTGTAGAGAGGTCAGAGGACAGCGTACAGGTCCCAGAGATCAAACTCAACCTCACCAGGCTTGGCAGCAAGCCTTTACCAACCCACCCCCACCCCACCCACCCTGCACGCGCCCCTCTCCCCTCCCCATGGTCTCCCATGGCTATCTCACTTGGCCCTAAAATGTTTAAGGATGACACTGGCTGCTGAGTGGAAATGAGACAGCAGAAGTCAACAGTAGATTTTAGGAAAGCCAGAGAAAAAGGCTTGTGCTGTTTTTAGAAAGCCAAGGGACAAGCTAAGATAGGGCCCAAGTAATGCTAGTATTTACATTTATCCACACAAAACGGACGGGCCTCCGCTGAACCAGTGAGGCCCCAGACGTGCGCATAAATAACCCCTGCGTGCTGCACCACCTGGGGAGAGGGGGAGGACCACGGTAAATGGAGCGAGCGCATAGCAAAAGGGACGCGGGGTCCTTTTCTCTGCCGGTGGCACTGGGTAGCTGTGGCCAGGTGTGGTACTTTGATGGGGCCCAGGGCTGGAGCTCAAGGAAGCGTCGCAGGGTCACAGATCTGGGGGAACCCCGGGGAAAAGCACTGAGGCAAAACCGCCGCTCGTCTCCTACAATATATGGGAGGGGGAGGTTGAGTACGTTCTGGATTACTCATAAGACCTTTTTTTTTTCCTTCCGGGCGCAAAACCGTGAGCTGGATTTATAATCGCCCTATAAAGCTCCAGAGGCGGTCAGGCACCTGCAGAGGAGCCCCGCCGCTCCGCCGACTAGCTGCCCCCGCGAGCAACGGCCTCGTGATTTCCCCGCCGATCCGGTCCCCGCCTCCCCACTCTGCCCCCGCCTACCCCGGAGCCGTGCAGCCGCCTCTCCGAATCTCTCTCTTCTCCTGGCGCTCGCGTGCGAGAGGGAACTAGCGAGAACGAGGAAGCAGCTGGAGGTGACGCCGGGCAGATTACGCCTGTCAGGGCCGAGCCGAGCGGATCGCTGGGCGCTGTGCAGAGGAAAGGCGGGAGTGCCCGGCTCGCTGTCGCAGAGCCGAGGTGGGTAAGCTAGCGACCACCTGGACTTCCCAGCGCCCAACCGTGGCTTTTCAGCCAGGTCCTCTCCTCCCGCGGCTTCTCAACCAACCCCATCCCAGCGCCGGCCACCCAACCTCCCGAAATGAGTGCTTCCTGCCCCAGCAGCCGAAGGCGCTACTAGGAACGGTAACCTGTTACTTTTCCAGGGGCCGTAGTCGACCCGCTGCCCGAGTTGCTGTGCGACTGCGCGCGCGGGGCTAGAGTGCAAGGTGACTGTGGTTCTTCTCTGGCCAAGTCCGAGGGAGAACGTAAAGATATGGGCCTTTTTCCCCCTCTCACCTTGTCTCACCAAAGTCCCTAGTCCCCGGAGCAGTTAGCCTCTTTCTTTCCAGGGAATTAGCCAGACACAACAACGGGAACCAGACACCGAACCAGACATGCCCGCCCCGTGCGCCCTCCCCGCTCGCTGCCTTTCCTCCCTCTTGTCTCTCCAGAGCCGGATCTTCAAGGGGAGCCTCCGTGCCCCCGGCTGCTCAGTCCCTCCGGTGTGCAGGACCCCGGAAGTCCTCCCCGCACAGCTCTCGCTTCTCTTTGCAGCCTGTTTCTGCGCCGGACCAGTCGAGGACTCTGGACAGTAGAGGCCCCGGGACGACCGAGCTG SEQ ID NO: 2 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGTTCATCACAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCTGCTTCAGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGGACTCAGCT SEQ ID NO: 3 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGTAGCAGCCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCTGCCAGCGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGCTTACTAGC SEQ ID NO: 4 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGCAGTAGTCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCCGCTAGTGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGTCAGGAATC SEQ ID NO: 5 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGCTCGTCGCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCCGCCTCGGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGAGACAGGTA SEQ ID NO: 6 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGATCTTCTCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCAGCATCTGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGGATTCTCAG SEQ ID NO: 7 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGGTCCTCCCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCGGCGTCCGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGCAGATACCA SEQ ID NO: 8:CCCCTGGTT SEQ ID NO: 9:GGTTCATCACAA SEQ ID NO: 10:TTGCCTGCTTCAGAG SEQ ID NO: 11:CTAACGGTT SEQ ID NO: 12:GTGGATTCT SEQ ID NO: 13:GGTAGCAGCCAA SEQ ID NO: 14:TTGCCTGCCAGCGAG SEQ ID NO: 15:CTTTCTCTC SEQ ID NO: 16:GGTGGTACT SEQ ID NO: 17:GGCAGTAGTCAA SEQ ID NO: 18:TTGCCCGCTAGTGAG SEQ ID NO: 19:TCCCATCAT SEQ ID NO: 20:GGTTCCTTC SEQ ID NO: 21:GGCTCGTCGCAA SEQ ID NO: 22:TTGCCCGCCTCGGAG SEQ ID NO: 23:AAGTTGGCG SEQ ID NO: 24:GGTGGTACT SEQ ID NO: 25:GGATCTTCTCAA SEQ ID NO: 26:TTGCCAGCATCTGAG SEQ ID NO: 27:TCCCATCAT SEQ ID NO: 28:GGAGGCAAG SEQ ID NO: 29:GGGTCCTCCCAA SEQ ID NO: 30:TTGCCGGCGTCCGAG SEQ ID NO: 31:CATCAATCG SEQ ID NO: 32:TCGCAATCT SEQ ID NO: 33:GGTTCGTCGCAG SEQ ID NO: 34:CTCCCTGCATCGGAA SEQ ID NO: 35:ACGGCTACA SEQ ID NO: 36:CGCTACCAG SEQ ID NO: 37:GGTTCTTCTCAG SEQ ID NO: 38:CTCCCTGCTTCTGAA SEQ ID NO: 39:GCGTCGTAA SEQ ID NO: 40:ACAACACCT SEQ ID NO: 41:GGCTCCTCCCAG SEQ ID NO: 42:CTCCCCGCATCCGAA SEQ ID NO: 43:ATGACGACC SEQ ID NO: 44:AAAGTCCCG SEQ ID NO: 45:GGCTCATCACAG SEQ ID NO: 46:CTCCCCGCGTCAGAA SEQ ID NO: 47:TCTCATCCG SEQ ID NO: 48:GACTTCTCT SEQ ID NO: 49:GGAAGCAGCCAG SEQ ID NO: 50:CTCCCAGCCAGCGAA SEQ ID NO: 51:TCCACGGTT SEQ ID NO: 52:ACTCCAACT SEQ ID NO: 53:GGGAGTAGTCAG SEQ ID NO: 54:CTCCCGGCCAGTGAA SEQ ID NO: 55:TTCCAGCTC SEQ ID NO: 56:CAGGCTGAA SEQ ID NO: 57:GGTAGTTCTCAG SEQ ID NO: 58:TTGCCTGCATCTGAA SEQ ID NO: 59:TTCGCATTG SEQ ID NO: 60:CGTCGATGC SEQ ID NO: 61:GGCAGCTCCCAA SEQ ID NO: 62:TTGCCAGCTAGCGAG SEQ ID NO: 63:GACTCCACT SEQ ID NO: 64:GTTCGGAAA SEQ ID NO: 65:GGGAGCTCCCAG SEQ ID NO: 66:TTGCCGGCAAGTGAG SEQ ID NO: 67:ACTCCGTCG SEQ ID NO: 68 AATGATACGGCGACCACCGAGATCTACACTAGATCGCACACTCTTTCCCTACACGACGCTCTTCCGATCT SEQ ID NO: 69 GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATCCTTCTACCCCATGCTGCGG SEQ ID NO: 70 CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC實施例
此等實施例僅出於說明之目的提供且不限制本文所提供之申請專利範圍之範疇。實施例 1 在基於活體內 AAV 感染中多工處理調控元件 RE )以 評估 RE 之專一性
在基於活體內AAV之系統中分析多種調控元件以便評估個別調控元件之細胞專一性。此分析允許識別細胞專一性調控元件及各轉基因在細胞專一性調控元件下之表現量值。
設計、生產及活體內測試經多工處理之 RE AAV
為了測試系統多工處理三個調控元件之能力,將所關注之轉基因可操作地連接至三個以下候選RE中之一者:(1)CamKII、(2)CBA及(3)由SEQ ID NO: 1之核酸序列編碼之調控元件(RE1)。選擇此等RE之條件為CamKII啟動子在興奮性神經元中展現較佳表現,CBA啟動子展現廣泛表現,且藉由SEQ ID NO: 1之核酸序列編碼之調控元件(RE1)在抑制性/小白蛋白(paravalbumin;PV)神經元中展現較佳表現。轉基因由編碼融合至KASH核繫栓域之EGFP蛋白(EGFP-KASH)之報導基因體成。EGFP-KASH轉基因中KASH之三個特定區域經序列修飾以允許在混合池中進行個體識別(表1)。此等序列修飾僅影響EGFP-KASH之DNA及RNA序列且並未改變胺基酸序列。因此,序列修飾充當驅動各別EGFP-KASH轉基因構築體之給定RE之獨特條碼。將帶條碼之轉基因選殖至AAV基因體主鏈中,且藉由經瞬時轉染之HEK293細胞評定質體且評估EGFP螢光。條碼策略展示於下表1中,其中KASH序列之帶條碼區域以粗體加底線 指示。 1
條碼 序列
MBC 1 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCC GGTTCATCACAA CCGAG ACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGC TCCTGGCCTGCCTG TTGCCTGCTTCAGAG GATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCG ATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTA GGACTCAGCT (SEQ ID NO: 2)
MBC 2 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCC GGTAGCAGCCAA CCGA GACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCT GCTCCTGGCCTGCCTG TTGCCTGCCAGCGAG GATGACTACAGCTGCACCCAGGCCAACAACTTTGCC CGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAG CTTACTAGC (SEQ ID NO: 3)
MBC 3 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCC GGCAGTAGTCAA CCGA GACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCT GCTCCTGGCCTGCCTG TTGCCCGCTAGTGAG GATGACTACAGCTGCACCCAGGCCAACAACTTTGCC CGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAG TCAGGAATC (SEQ ID NO: 4)
MBC 4 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCC GGCTCGTCGCAA CCGA GACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCT GCTCCTGGCCTGCCTG TTGCCCGCCTCGGAG GATGACTACAGCTGCACCCAGGCCAACAACTTTGC CCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAG AGACAGGTA (SEQ ID NO: 5)
MBC 5 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCC GGATCTTCTCAA CCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTG TTGCCAGCATCTGAG GATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAG GATTCTCAG (SEQ ID NO: 6)
MBC 6 GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCC GGGTCCTCCCAA CCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTG TTGCCGGCGTCCGAG GATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAG CAGATACCA (SEQ ID NO: 7)
為建立初始多工處理實驗(如圖1之簡化示意圖中所示),指定各RE之兩個條碼且製得包含相同量之各帶條碼之構築體的質體混合物(例如,CamKII-EGFP-KASH條碼1、CamKII-EGFP-KASH條碼2、CBA-EGFP-KASH條碼3、CBA-EGFP-KASH條碼4、RE1-EGFP-KASH條碼5及RE1-EGFP-KASH條碼6)。此混合物(稱為L1)用於產生腺相關病毒9(AAV9),所選擇之活體內遞送媒劑。野生型(C57Bl6/J)小鼠(n = 6)用AAV載體與AAV9 L1(2E14基因體複本(genome copies;gc)/小鼠)一起,或PBS對照兩側輸注至背部及腹部海馬(4個注射位點)中。注射後四週,處死動物且將右側及左側海馬以手術方式移除且在4℃下儲存於RNAlater™中隔夜。
經由人工沖洗將個別小鼠海馬在裂解緩衝液中均質化,以便釋放細胞核。濃縮之粗製細胞核製劑藉由基於PBS之洗滌及離心獲得。細胞核用DAPI染色以用於在細胞分選儀上識別且確認細胞核完整性。使用BD FACSAria™ II細胞分選儀純化細胞核,且PBS注射之對照樣品用於限定閘控策略。對於每一樣品,分選大致100,000個細胞核,且藉由離心濃縮樣品以用於單細胞核RNA定序(RNA sequencing;RNAseq)。用10X基因體學鉻單細胞3' v2套組進行單細胞核RNAseq。所得cDNA庫進行次世代定序。序列處理
定序後,自Illumina BaseSpace下載原始BCL序列檔案(Illumina二進位格式)且使用定製之處理指令碼將其轉換成原始FASTQ讀段檔案。對於各樣品,使用10× Cell Ranger軟體(v.2.1.0)處理原始FASTQ以及小鼠基因體及基因標註(GENCODE版本M19,https://uswest.ensembl.org/Mus_musculus/Info/Annotation)。10× Cell Ranger軟體根據細胞解多工處理讀段且接著將讀段映射至轉錄物。為將讀段映射至轉錄物,使用前mRNA參考總轉錄本,因為來自核樣品之大部分轉錄物為前mRNA。對於源自AAV載體之讀段,各帶條碼之AAV轉錄序列經人工添加至參考總轉錄本中。10× Cell Ranger針對各樣本產生含有各經偵測細胞核中各基因之獨特分子標誌(UMI)計數的檔案。此等UMI計數檔案接著用於降維及叢集以限定組織亞群。 定序分析
來自上文之UMI計數檔案係使用自定義R及Python指令碼處理以識別細胞亞群。首先過濾細胞基因計數檔案以移除含有總計小於300個UMI之細胞。利用細胞(列)及基因(行)之UMI計數之經過濾2D矩陣縮小至具有相同細胞(列)數目但基因行使用ZinbWave(版本1.3.4, D.Risso等人, Nature 9: 284(2018))置換為35個縮小之維度的較小尺寸。35個縮小之維度為基因之線性組合且表示在不同細胞類型中活躍之生物模組。藉由將約15K個基因之維度縮小至35個生物模組,資料中之雜訊顯著降低,有效地減輕熟知之單細胞資料的『漏失』問題,從而使叢集更易控制。前5000個可變基因(如藉由Seurat: https://satijalab.org/seurat/計算,其中參數最小細胞數 =300,最小 基因數 =200,y 截止值 =0.005)用於使用ZinbWave(默認參數)計算35個維度。另外,在ZinbWave方法中,將各細胞之總轉錄輸出(總UMI)合併為共變數。
為對此矩陣進行叢集,使用如在Louvain套裝軟體(版本0.6.1,https://pypi.org/project/louvain/)中實施之Louvain叢集演算法。Louvain演算法需要圖式作為輸入,其中細胞作為由邊連接之頂點。若兩個細胞之間的相關性(使用35維表示)大於0.5,則藉由在兩個細胞之間包括一條邊來建構圖式。接著基於文獻衍生之典型生物標記標註識別之叢集(或細胞亞群)(參見表2及圖2)。對神經元群體中之EGFP-KASH表現進行比較性分析以評估給定RE對轉基因表現之影響。 2
基因標記 基因亞標記 基因ID 基因 名稱 染色體 起始端 染色體 結束端
疾病 FTD ENSMUSG00000034708 Grn 102430314 102437048
疾病 Dravet ENSMUSG00000064329 Scn1a 66270777 66440840
疾病 阿茲海默症 ENSMUSG00000023992 Trem2 48346400 48354147
興奮性 - ENSMUSG00000032502 Stac 111561436 111690348
興奮性 - ENSMUSG00000070570 Slc17a7 45163948 45176142
興奮性 - ENSMUSG00000032373 Car12 66713685 66766845
興奮性 - ENSMUSG00000058420 Syt17 118380716 118448222
興奮性 - ENSMUSG00000027296 Itpka 119742336 119751263
興奮性 - ENSMUSG00000001119 Col6a1 76708791 76726168
興奮性 - ENSMUSG00000024617 Camk2a 60925617 60988152
興奮性 - ENSMUSG00000053025 Sv2b 75114893 75309262
興奮性 - ENSMUSG00000041324 Inhba 16011850 16027211
興奮性 - ENSMUSG00000030772 Dkk3 112116016 112159057
GABA - ENSMUSG00000070880 Gad1 70553071 70602014
GABA Vip ENSMUSG00000019772 Vip 5639217 5647617
GABA - ENSMUSG00000062209 Erbb4 68032185 69108059
GABA Sst ENSMUSG00000004366 Sst 23889580 23890844
GABA - ENSMUSG00000026787 Gad2 22622204 22693874
GABA PV ENSMUSG00000005716 Pvalb 78191113 78206400
非興奮性 Ndnf ENSMUSG00000042453 Reln 21884453 22344702
非興奮性 - ENSMUSG00000051910 Sox6 115470871 116038796
非興奮性 Ndnf ENSMUSG00000049001 Ndnf 65671589 65712326
非興奮性 - ENSMUSG00000037771 Slc32a1 158610766 158615748
非神經元 Astro ENSMUSG00000020932 Gfap 102887335 102900912
非神經元 Endo ENSMUSG00000029648 Flt1 147561603 147726011
非神經元 OPC ENSMUSG00000029231 Pdgfra 75152291 75198215
非神經元 寡聚 ENSMUSG00000046160 Olig1 91269771 91271933
非神經元 OPC ENSMUSG00000032911 Cspg4 56865032 56899870
非神經元 - ENSMUSG00000033208 S100b 76253852 76261159
非神經元 - ENSMUSG00000054675 Tmem119 113793728 113800516
非神經元 Micro ENSMUSG00000038642 Ctss 95526785 95556403
非神經元 Micro ENSMUSG00000052336 Cx3cr1 119901615 120069879
非神經元 Oligo ENSMUSG00000076439 Mog 37010742 37023398
非神經元 SMC ENSMUSG00000031375 Bgn 73483601 73495933
非神經元 Oligo ENSMUSG00000036634 Mag 30899175 30914873
非神經元 Astro ENSMUSG00000050953 Gja1 56377299 56390419
非神經元 Astro ENSMUSG00000024411 Aqp4 15389393 15403684
泛神經元 - ENSMUSG00000027273 Snap25 136713452 136782428
結果
基於各樣本之已知生物標記,將叢集分組成三個叢集組-興奮性神經元(Excitatory neurons;Exc)、GABA能神經元(GABAergic neurons;GABA)及非神經元細胞(Non-Neuronal cell;NonN)。為易於解釋,此等叢集組中之每一者稱為細胞群。根據UMI計數,計算每百萬份轉錄物(Transcripts-Per-Million;TPM)中各帶條碼之AAV轉基因之表現(圖3)。
基因TPM計算如下:
Figure 02_image001
為能夠比較GABA與興奮性內之表現且能夠更易於比較不同RE驅動AAV轉基因,將所有AAV基因之TPM表現標準化為其在興奮性神經元中之表現。由於CBA用作廣泛表現之陽性對照,各AAV基因之TPM表現在細胞群體內亦標準化為AAV CBA轉基因在該群體內之平均TPM表現。最後,為易於解釋,將各AAV轉基因(標準化為CBA)之相對表現表示為CBA標準化之倍數變化。
如所預期,與興奮性細胞相比,兩種CamKII AAV轉基因之相對表現在GABA及非神經元群體中低於約30%(圖4)。與興奮性神經元相比,兩種RE1驅動AAV轉基因在GABA神經元中高約20%,且在非神經元細胞中低約25%。
另外,由於各AAV轉基因之兩種帶條碼之構築體在各細胞群體內展示類似表現,因此將各AAV轉基因之兩種帶條碼之構築體之間的表現值平均化以獲得簡化表現標繪圖(圖5)。
與圖4類似,圖5證實與興奮性細胞相比,CamKII AAV轉基因之相對表現在GABA及非神經元群體中低約30%,且證實與興奮性神經元相比,RE1驅動之AAV轉基因在GABA神經元中高約20%,且在非神經元細胞中低約25%。
使用已知生物標記(PV、VIP、Sst、Ndnf-Reln)評估GABA能神經元之四種主要亞群。結果顯示106m1轉基因之表現在GABA之PV、VIP及Sst亞群內相當高(圖6)。另外,結果證實RE1在PV亞群中之平均倍數變化最高(比興奮性細胞高約50%)。
使用上述方法獲得之此等資料顯示可活體內篩選候選調控元件以識別細胞專一性調控元件及各轉基因在細胞專一性調控元件下之表現量值。此外,結果展示此等方法可有效地用於進行調控元件之多工處理分析以便識別在特定細胞群體中達成生理上相關劑量之調控元件。本文所描述之分析可用於使用多種遞送方法在活體內系統中篩選多達104 種候選調控元件。實施例 2 使用基於活體內 AAV 感染識別之 RE 評估 RE 之專一性的用途
在驗證使用本文所描述之篩選分析識別之調控元件的細胞選擇性之後,調控元件可用於將特定轉基因靶向特定細胞群體。特定言之,各調控元件可以可操作地連接至轉基因以選擇性地靶向表現至至少一種、兩種、三種、四種、五種或多於五種非PV細胞上之特定細胞群體。實施例 3 大規模活體內多工處理調控元件 RE )以 評估複雜混合物中 RE 之專一性 3
調控元件 L3條碼 L3.2條碼
構築體1(CBA-EGFP-KASH) MBC7 MBC7
構築體2(EF1 α-EGFP-KASH) MBC10 MBC10
構築體3(RE 1 -EGFP-KASH) MBC11 MBC11
構築體4(RE2-EGFP-KASH) MBC8 MBC8
構築體5(RE3 -EGFP-KASH) MBC9 MBC9
構築體6(RE4-EGFP-KASH) MBC12 MBC12
構築體7(RE5-EGFP-KASH) MBC13 MBC13
構築體8(RE6-EGFP-KASH) MBC14 MBC14
構築體9(RE7-EGFP-KASH) MBC15 MBC15
構築體10(RE8-EGFP-KASH) MBC16 MBC16
構築體11(RE9-EGFP-KASH) MBC17 MBC17
構築體12(RE 10-EGFP-KASH) MBC18 MBC18
構築體13(RE11-EGFP-KASH) MBC19 MBC19
構築體14(RE 12-EGFP-KASH) MBC20 N/A
構築體15(RE 13 -EGFP-KASH) MBC21 MBC21
為了測試多工處理分析是否能夠評估細胞類型專一性及細胞之複雜混合物中個別RE之表現量值,在基於活體內AAV之系統中分析十五個調控元件。此分析允許在多種不同構築體之複雜混合物內識別細胞專一性調控元件以及各轉基因在細胞專一性調控元件下之表現量值。設計、生產及活體內測試經多工處理之 RE AAV
為了測試系統多工處理調控元件之複雜混合物之能力,將所關注之轉基因可操作地連接至十五個候選RE中之一者。兩種RE為CBA及EF1α,其皆經選擇為廣泛表現之對照啟動子(分別為構築體1及構築體2)。在構築體3中使用藉由SEQ ID NO: 1之核酸序列編碼之調控元件(RE1),其在抑制性/小白蛋白(PV)神經元中展現較佳表現。參見表3。其餘的十二個啟動子經選擇用於其在抑制性/PV神經元中之較佳表現。轉基因由編碼融合至KASH核繫栓域之EGFP蛋白(EGFP-KASH)之報導基因體成。EGFP-KASH轉基因中之KASH之編碼序列之兩個區域(KASH序列1及KASH序列2)經序列修飾以允許在混合池中進行個體識別(表4)。此等序列修飾僅影響EGFP-KASH之DNA及RNA序列且並未改變胺基酸序列。因此,序列修飾充當驅動各別EGFP-KASH轉基因構築體之給定RE之獨特條碼。在各構築體之轉錄起始位點之上游插入額外獨特條碼序列以允許在混合池中對特定構築體進行個體識別(表4,上游序列)。最後,在各構築體之EGFP轉基因之終止密碼子之後插入獨特條碼序列以允許在混合池中對特定構築體進行個體識別(表4,下游序列)。將帶條碼之轉基因選殖至AAV基因體主鏈中且用於製備供活體內研究之AAV9病毒。獨特條碼序列展示於下表4中。 4
條碼 上游 序列 KASH 序列 1 KASH 序列 2 下游 序列
MBC7 CCCCTGGTT(SEQ ID NO: 8) GGTTCATCACAA(SEQ ID NO: 9) TTGCCTGCTTCAGAG(SEQ ID NO: 10) CTAACGGTT (SEQ ID NO: 11)
MBC8 GTGGATTCT(SEQ ID NO: 12) GGTAGCAGCCAA(SEQ ID NO: 13) TTGCCTGCCAGCGAG(SEQ ID NO: 14) CTTTCTCTC (SEQ ID NO: 15)
MBC9 GGTGGTACT(SEQ ID NO: 16) GGCAGTAGTCAA(SEQ ID NO: 17) TTGCCCGCTAGTGAG(SEQ ID NO: 18) TCCCATCAT (SEQ ID NO: 19)
MBC10 GGTTCCTTC(SEQ ID NO: 20) GGCTCGTCGCAA (SEQ ID NO: 21) TTGCCCGCCTCGGAG(SEQ ID NO: 22) AAGTTGGCG (SEQ ID NO: 23)
MBC11 GGTGGTACT(SEQ ID NO: 24) GGATCTTCTCAA(SEQ ID NO: 25) TTGCCAGCATCTGAG(SEQ ID NO: 26) TCCCATCAT (SEQ ID NO: 27)
MBC12 GGAGGCAAG(SEQ ID NO: 28) GGGTCCTCCCAA (SEQ ID NO: 29) TTGCCGGCGTCCGAG(SEQ ID NO: 30) CATCAATCG (SEQ ID NO: 31)
MBC13 TCGCAATCT(SEQ ID NO: 32) GGTTCGTCGCAG (SEQ ID NO: 33) CTCCCTGCATCGGAA(SEQ ID NO: 34) ACGGCTACA (SEQ ID NO: 35)
MBC14 CGCTACCAG(SEQ ID NO: 36) GGTTCTTCTCAG(SEQ ID NO: 37) CTCCCTGCTTCTGAA(SEQ ID NO: 38) GCGTCGTAA (SEQ ID NO: 39)
MBC15 ACAACACCT(SEQ ID NO: 40) GGCTCCTCCCAG (SEQ ID NO: 41) CTCCCCGCATCCGAA(SEQ ID NO: 42) ATGACGACC (SEQ ID NO: 43)
MBC16 AAAGTCCCG(SEQ ID NO: 44) GGCTCATCACAG (SEQ ID NO: 45) CTCCCCGCGTCAGAA(SEQ ID NO: 46) TCTCATCCG (SEQ ID NO: 47)
MBC17 GACTTCTCT(SEQ ID NO: 48) GGAAGCAGCCAG(SEQ ID NO: 49) CTCCCAGCCAGCGAA(SEQ ID NO: 50) TCCACGGTT (SEQ ID NO: 51)
MBC18 ACTCCAACT(SEQ ID NO: 52) GGGAGTAGTCAG(SEQ ID NO: 53) CTCCCGGCCAGTGAA(SEQ ID NO: 54) TTCCAGCTC (SEQ ID NO: 55)
MBC19 CAGGCTGAA(SEQ ID NO: 56) GGTAGTTCTCAG (SEQ ID NO: 57) TTGCCTGCATCTGAA(SEQ ID NO: 58) TTCGCATTG (SEQ ID NO: 59)
MBC20 CGTCGATGC(SEQ ID NO: 60) GGCAGCTCCCAA(SEQ ID NO: 61) TTGCCAGCTAGCGAG(SEQ ID NO: 62) GACTCCACT (SEQ ID NO: 63)
MBC21 GTTCGGAAA (SEQ ID NO: 64) GGGAGCTCCCAG(SEQ ID NO: 65) TTGCCGGCAAGTGAG(SEQ ID NO: 66) ACTCCGTCG (SEQ ID NO: 67)
與實施例1中所描述之初始實驗類似,建立複雜混合物之多工處理,除包含獨特上游序列之單一MBC條碼、KASH內部之兩個獨特序列以外,且針對各RE指定獨特下游序列,且製得包含相同量之各帶條碼之構築體的質體混合物(例如,MBC7-CBA-EGFP-KASH、MBC10-EF1α-EGFP-KASH、MBC11-RE1-EGFP1-KASH等)。此混合物(稱為L3)用於產生腺相關病毒9(AAV9),所選擇之活體內遞送媒劑。使用相同獨特條碼序列第二次重複實驗,不同之處在於包含條碼之序列片段(例如,上游序列、KASH內部之兩個序列及下游序列)經不同地組態於構築體內。製得包含相同量之此等帶條碼之構築體中之每一者的質體混合物。此混合物(稱為L3.2)用於產生額外AAV9。L3.2庫不包括構築體14。
六至八週齡野生型(C57Bl6/J)雄性小鼠用1.5 pL之AAV載體池與AAV9 L3或AAV9 L3.2一起單側輸注至背部及腹部皮層,且用1.5 pL之AAV載體集與AAV9 L3或AAV9 L3.2一起單側輸注至背部及腹部海馬(2個注射位點,其中每位點3 pL;海馬為1.5 pL且皮層為1.5 pL),其中基因體含量為1.5 × 1011 至2.4 × 1011 個病毒基因體/小鼠(vg/小鼠),速率為0.3 pL/分鐘,且注射後休息4分鐘。
注射後四週,處死動物且將其感測皮層及海馬以手術方式移除,在4℃下儲存於RNAlater™中24小時,且接著在-80℃下冷凍直至組織備用於處理。
RNAlater™大腦皮層或海馬樣品在冰上解凍。為了釋放細胞核,將大致20毫克之組織在裂解緩衝液中人工均質化。濃縮之粗製細胞核製劑藉由基於PBS之洗滌及離心獲得。細胞核用DAPI染色以用於在細胞分選儀上識別且確認細胞核完整性。使用BD FACS Melody細胞分選儀純化細胞核。對於每一樣品,分選大致100,000個細胞核。藉由離心濃縮樣品以用於單細胞核RNAseq。用10X基因體學鉻單細胞3' v3套組進行單細胞核RNAseq(如製造商說明書中所描述-圖1)。所得cDNA庫進行次世代定序。
為增加在單細胞核RNAseq中UMI降至低於偵測臨限值之AAV構築體之偵測,在擴增之前對來自10X工作流之cDNA樣品進行富集PCR步驟。此富集步驟產生自10×庫偵測之AAV構築體信號之3-10倍擴增。用於富集PCR步驟中之PCR引子包括來自標準Illumina Truseq定序引子(501)之正向引子及經設計以結合至AAV轉基因中相對靠近polyA位點之區域的反向引子。此反向引子已向其中添加讀段2手柄(handle),使得其可在隨後的PCR反應中用作向產物中添加Illumina銜接子之手段(用於定序目的)。此步驟在本文中稱為拔出PCR。此拔出PCR之引子序列展示於表5中。 5
引子名稱 引子序列 引子用途
501 Illumina 引子 AATGATACGGCGACCACCGAGATCTACACTAGATCGCACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO: 68) Illumina定序包括p5及讀段1序列之銜接子
干擾KASH _2F GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATCCTTCTACCCCATGCTGCGG(SEQ ID NO: 69) 反向引子對於KASH中具有讀段2手柄之區域具有特異性
70× Illumina 引子 CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGT GTGCTCTTCCGATC(SEQ ID NO: 70) Illumina定序包括p7及讀段2序列之銜接子
10X基因體學鉻單細胞3' v3套組工作流提高了靈敏度且允許在單細胞水準上偵測DNA/蛋白質資訊。在v3工作流中修飾併入至用於cDNA生產之單細胞核液滴中之珠粒。此等珠粒經工程改造以捕獲polyA序列以及併入捕獲1或捕獲2序列之DNA/RNA序列。此有助於偵測所關注之特定蛋白質之抗體-寡聚共軛物以及併入此等捕獲序列之DNA物種。為了使套組捕獲此等DNA/RNA物種且在給定構築體中使其與RE獨特地連接,緊靠捕獲序列編碼獨特條碼特徵。此條碼對各RE為獨特的。
在10X基因體學鉻單細胞3' v3套組工作流中,各樣品含有四個用於解多工處理之樣品索引。在拔出PCR中,各樣品僅含有一個樣品索引。為經由用於10X基因體學鉻單細胞3' v3套組工作流中之10× Cell Ranger軟體處理拔出PCR樣品,將一個拔出PCR樣品索引與三個「假」索引(與任何10×索引相差至少兩個核苷酸)合併以藉由10× Cell Ranger軟體模擬四個樣品索引要求。在解多工處理成10×-相容FASTQ檔案之後,處理繼續與10×序列處理完全一樣。 序列處理
定序後,自Illumina BaseSpace下載原始BCL序列檔案(Illumina二進位格式)且使用10× Cell Ranger軟體(v.3.0.2)將其轉換成原始FASTQ讀段檔案以解多工處理樣本,其中各樣本具有四個10×索引。對於各樣品,使用10× Cell Ranger軟體(v.3.0.2)處理原始FASTQ以及小鼠基因體及基因標註(GENCODE版本M19,https://uswest.ensembl.org/Mus_musculus/Info/Annotation)。10× Cell Ranger軟體根據細胞解多工處理讀段且接著將讀段映射至轉錄物。FASTQ檔案含有成對末端讀段,其中讀段1含有UMI條碼及10×細胞條碼且讀段2含有基因轉錄物序列。讀段2與小鼠基因體及各RE序列比對以確定基因/RE標識。10× Cell Ranger軟體針對各樣本產生含有各經偵測細胞核中各基因之獨特分子標誌(UMI)計數的檔案。此等UMI計數檔案接著用於降維及叢集以便限定組織亞群。 定序分析
對於降維,前5000個可變基因(如根據Stuart, Butler等人, bioRxiv, 2018;Butler等人, Nature Biotechnology, 2018;Hafemeister及Satija, bioRxiv 2019計算;其中參數最小細胞數=300,最小基因數=200,y截止值=0.005)用於使用ZinbWave(默認參數)計算35個維度。另外,在ZinbWave方法中,將各細胞之總轉錄輸出(總UMI)合併為共變數。與L1庫之處理類似,UMI計數檔案係使用自定義R及Python指令碼處理以識別細胞亞群。首先過濾細胞基因計數檔案以移除含有總計小於300個UMI之細胞。利用細胞(列)及基因(行)之UMI計數之經過濾2D矩陣縮小至具有相同細胞(列)數目但基因行使用ZinbWave(版本1.3.4, D.Risso等人, Nature 9: 284(2018))置換為35個縮小之維度的較小尺寸。35個縮小之維度為基因之線性組合且表示在不同細胞類型中活躍之生物模組。藉由將約15K個基因之維度縮小至35個生物模組,資料中之雜訊顯著降低,有效地減輕熟知之單細胞資料的『漏失』問題,從而使叢集更易控制。
為對此矩陣進行叢集,如上文所描述使用如在Louvain套裝軟體(版本0.6.1,https://pypi.org/project/louvain/)中實施之Louvain叢集演算法。Louvain演算法需要圖式作為輸入,其中細胞作為由邊連接之頂點。若兩個細胞之間的相關性(使用35維表示)大於0.5,則藉由在兩個細胞之間包括一條邊來建構圖式。如表2及圖2中所指示,接著基於文獻衍生之GABA能神經元、興奮性神經元及非神經元細胞群體的典型生物標記來標註識別之叢集(或細胞亞群)。對神經元群體中之EGFP-KASH表現進行比較性分析以評估給定RE對轉基因表現之相對表現量值及細胞類型專一性。 結果
如實施例1中所描述,基於以下各樣本之已知生物標記,將叢集分組成三個叢集組:興奮性神經元(Exc)、GABA能神經元(GABA)及非神經元細胞(NonN)。根據UMI計數,使用上文所論述之基因TPM演算法計算每百萬份轉錄物(TPM)中各帶條碼之AAV轉基因之表現。
最初,自興奮性及GABA能神經元中之各RE分析L3及L3.2庫兩者中之TPM以確定各RE在興奮性及GABA能神經元中之基因表現量值及細胞類型專一性。表現之量值提供對RE之強度的反饋。亦顯示興奮性或GABA能神經元之細胞類型專一性,其中特定啟動子在興奮性與GABA能神經元之間的表現差異指示各別細胞類型之專一性。舉例而言,構築體6及構築體3在GABA能神經元中展示較高表現,且因此指示此RE具有GABA能神經元專一性。然而,構築體1在GABA能及興奮性神經元兩者中展示相對類似之表現,從而表明缺乏啟動子之細胞類型專一性。
為易於解釋,將各AAV轉基因之相對表現以對數標度呈現。觀察到CBA啟動子(構築體1)及EF1α啟動子(構築體2)之表現增加。在CBA及EF1α啟動子已知為普遍存在的強啟動子之條件下,預期此等啟動子之此表現增加。自RE1(構築體3)亦觀察到表現增加。自其他候選啟動子觀察到較低表現量,可能表明此等啟動子驅動基因表現小於CBA及EF1α。引起關注地,針對若干構築體觀察到經測試調控元件在GABA能神經元中之細胞類型專一性表現。參見圖7及8。此等資料顯示多工處理分析能夠在單一分析中偵測多個RE以及識別細胞類型專一性RE及其強度。
針對GABA能神經元內之專一性,隨後在L3及L3.2庫兩者中評估各RE之細胞類型專一性表現(圖9)。此處,由於EF1α用作廣泛表現之對照,各AAV基因之TPM表現在細胞群體內標準化為AAV EF1α相關之轉基因在該群體內的平均TPM表現。此外,相對於興奮性神經元中之表現,GABA能神經元內表現之專一性計算如下:
log(專一性) = log(GABA神經元表現) - log(興奮性神經元表現)
為易於解釋,將各AAV轉基因(標準化為EF1α)之相對表現表示為EF1α-標準化之倍數變化且以對數標度呈現。
由於各TPM表現在群體內標準化為EF1α相關之轉基因的平均TPM表現,因此EF1α之表現為零。CBA啟動子(構築體1)之表現平均類似於EF1α啟動子之表現。此為預期的,因為CBA及EF1α為高度表現之廣泛啟動子。相比之下,相對於興奮性神經元,構築體3展示在GABA能神經元中實質上較高的表現,以及來自CBA及EF1α之廣泛表現。此亦為預期的,因為構築體3利用在抑制性/小白蛋白(PV)神經元中展現較佳表現之RE(RE1,由SEQ ID NO: 1編碼)。相對於興奮性神經元,其餘的構築體在GABA能神經元中展示較高表現,以及來自CBA及EF1α之廣泛表現,儘管表現不如構築體3高。此指示此等構築體中之RE在GABA能神經元中驅動細胞類型專一性表現。此等資料顯示多工處理分析能夠偵測驅動GABA能神經元專一性表現之多個RE。
測試多工處理分析在GABA能神經元(例如,PV、SST及VIP細胞)類別而非一般GABA能神經元內之專一性細胞類型內量測細胞類型專一性表現(AAV L3.2庫)之能力。由於EF1α用作廣泛表現之對照,因此各AAV基因之TPM表現在細胞群體內標準化為AAV EF1α相關之轉基因在該群體內的平均TPM表現。專一性亦如上述所定義。如所預期,在所有專一性GABA能細胞類型中EF1α及CBA相關之轉基因之表現類似且接近零,因為其為廣泛表現之細胞。多工處理分析亦能夠識別在所有GABA能細胞類型中具有較高轉基因表現之RE(例如,構築體11),從而表明此等RE對GABA能神經元類別內之某些細胞類型不具有專一性(圖10)。重要的係,多工處理分析能夠識別且描繪某些RE之表現,該等RE對GABA能神經元類別內之某些細胞類型之表現具有專一性。
使用上述方法獲得之資料進一步顯示可在活體內調控元件之複雜混合物中篩選候選調控元件以便識別細胞專一性調控元件以及各轉基因在細胞專一性調控元件下之表現量值。此外,此等結果進一步展示本文所描述之方法可有效地用於進行調控元件之多工處理分析以便識別在特定細胞群體中達成生理上相關劑量之調控元件。本文所描述之分析可用於使用多種遞送方法在活體內系統中篩選多達104 種候選調控元件。
本發明之新穎特徵在隨附申請專利範圍中細緻闡述。將參考闡述利用本發明原理之說明性具體實例及其隨附圖式的以下詳細描述來獲得對本發明之特徵及優勢的更佳理解:
[ 1] 圖1A為用於活體內多工處理調控元件(「RE」)以藉由使用單細胞核RNAseq來評估RE專一性之方法的簡化說明。圖1B為用於單細胞核RNAseq之10X基因體學鉻單細胞3' v2套組之工作流的簡化示意圖。
[ 2] 說明基於文獻衍生之典型生物標記標註之叢集(clustering)。生物標記定義於表2中。「Exc」=興奮性神經元;「GABA」=GABA能神經元;「NonN」=非神經元細胞;「TPM」=每百萬個轉錄物。
[ 3] 說明在各細胞群體內各帶條碼的AAV轉基因在CamKII啟動子、CBA啟動子或RE1調控元件(例如,SEQ ID NO: 1)下之表現。「Exc」=興奮性神經元;「GABA」=GABA能神經元;「NonN」=非神經元細胞;「TPM」=每百萬個轉錄物。
[ 4] 說明在各細胞群體內各AAV轉基因之CBA標準化倍數變化(亦即,相對於給定細胞群體內之平均CBA表現的各AAV轉基因之表現)。興奮性群體內之倍數變化經標準化至1。分別展示各帶條碼的AAV轉基因。「Exc」=興奮性神經元;「GABA」=GABA能神經元;「NonN」=非神經元細胞。
[ 5] 說明各細胞群體內之各AAV轉基因之CBA標準化倍數變化。在各AAV轉基因之兩種帶條碼的形式之間平均化表現值。興奮性群體內之倍數變化經標準化至1。「Exc」=興奮性神經元;「GABA」=GABA能神經元;「NonN」=非神經元細胞。
[ 6] 說明與四種GABA亞群(針對小白蛋白(PV)、血管活性腸多肽(vasoactive intestinal polypeptide;VIP)、生長抑素(Sst)或神經元衍生之神經營養因子-顫蛋白(Ndnf-Reln)呈陽性之亞群)相比,興奮性細胞中的AAV轉基因表現。
[ 7] 為展示GABA能及興奮性神經元中之各調控元件之AAV L3庫之表現(TPM)的圖式。對照調控元件為:CBA(構築體1)、EF1α(構築體2)及RE1(構築體3)。
[ 8] 為展示GABA能及興奮性神經元中之各調控元件之AAV L3.2庫(library)之表現(TPM)的圖式。對照調控元件為:CBA(構築體1)、EF1α(構築體2)及RE1(構築體3)。
[ 9] 為展示GABA能神經元(AAV L3及AAV L3.2庫)中之各種RE之細胞類型專一性表現的圖式。各構築體之表現經標準化至AAV EF1α相關聯之轉基因的平均TPM表現。對照調控元件為:CBA(構築體1)、EF1α(構築體2)及RE1(構築體3)。
[ 11] 為展示一類GABA能神經元(例如,PV、SST及VIP細胞)內之專一性細胞類型內之細胞類型專一性表現(AAV9 L3.2庫)的圖式。各構築體之表現經標準化至AAV EF1α相關聯之轉基因的平均TPM表現。對照調控元件為:CBA(構築體1)、EF1α(構築體2)及RE1(構築體3)。

Claims (108)

  1. 一種識別於給定細胞類型中提供選擇性表現之調控元件之方法,其包含: a.  向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼; b.  自表現該轉基因之複數個單細胞中分離RNA; c.  藉由定序該等單細胞中之每一者的總轉錄本(transcriptome)來識別該等單細胞中之每一者;及 d.  使總轉錄本中之條碼與候選調控元件相關聯,從而識別在該細胞類型中提供選擇性表現之調控元件。
  2. 如請求項1之方法,其中該調控元件選擇性地增加該細胞類型中該轉基因之表現。
  3. 如請求項1之方法,其中該調控元件提供與相同細胞類型中藉由另一候選調控及/或對照調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的該轉基因之選擇性表現。
  4. 如請求項1之方法,其中該調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的該轉基因之選擇性表現。
  5. 如請求項1之方法,其中該調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的該轉基因之選擇性表現。
  6. 如請求項1之方法,其中該調控元件提供與不同細胞類型中相同調控元件之該轉基因之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的該轉基因之選擇性表現。
  7. 如請求項1之方法,其中該調控元件提供與不同細胞類型中相同調控元件之該轉基因之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的該轉基因之選擇性表現。
  8. 如請求項1之方法,其中該調控元件提供與不同細胞類型中相同調控元件之該轉基因之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的該轉基因之選擇性表現。
  9. 如請求項1之方法,其中該調控元件在一種細胞類型中提供相對於至少一種其他細胞類型的該轉基因之選擇性表現。
  10. 如請求項1之方法,其中與非PV(non-parvalbumin)神經元相比,該調控元件在小白蛋白(parvalbumin,PV)神經元中提供該轉基因之選擇性表現。
  11. 如請求項10之方法,其中該非PV神經元為興奮性神經元、多巴胺(dopaminergic)神經元、星狀細胞、微膠細胞或運動神經元中之一或多者。
  12. 一種識別於細胞類型中提供轉基因之選擇性表現的調控元件之方法,其包含: a.  向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼; b.  自表現該轉基因之複數個單細胞中分離RNA; c.  藉由定序該等單細胞中之每一者的總轉錄本來識別該等單細胞中之每一者; d.  使總轉錄本中之條碼與該候選調控元件相關聯;及 e.  將藉由各候選調控元件提供之該轉基因之表現量與該轉基因之參考表現量進行比較; 從而識別在該細胞類型中提供該轉基因之選擇性表現的候選調控元件。
  13. 如請求項12之方法,其中該調控元件選擇性地增加或減少該細胞類型中該轉基因之表現。
  14. 如請求項12之方法,其中該轉基因之參考表現量藉由對照調控元件提供。
  15. 如請求項12之方法,其中該調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的該轉基因之選擇性表現。
  16. 如請求項12之方法,其中該調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的該轉基因之選擇性表現。
  17. 如請求項12之方法,其中該調控元件提供與相同細胞類型中藉由另一候選調控元件及/或對照調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的該轉基因之選擇性表現。
  18. 如請求項12之方法,其中該轉基因之參考表現量藉由泛細胞(pan-cellular)調控元件提供。
  19. 如請求項12之方法,其中該泛細胞調控元件選自由以下者組成之群:巨細胞病毒主要即刻早期啟動子(CMV)、雞β-肌動蛋白啟動子(CBA)、CMV早期強化子/CBA啟動子(CAG)、延伸因子-1α啟動子(EF1α)、猴病毒40啟動子(SV40)、磷酸甘油酸激酶啟動子(PGK)及聚泛素C基因啟動子(UBC)。
  20. 如請求項12之方法,其中該調控元件提供與相同細胞類型中藉由泛細胞調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的該轉基因之選擇性表現。
  21. 如請求項12之方法,其中該調控元件提供與相同細胞類型中藉由泛細胞調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的該轉基因之選擇性表現。
  22. 如請求項12之方法,其中該調控元件提供與相同細胞類型中藉由泛細胞調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的該轉基因之選擇性表現。
  23. 如請求項12之方法,其中該調控元件在一種細胞類型中提供相對於至少一種其他細胞類型的該轉基因之選擇性表現。
  24. 如請求項12之方法,其中與非PV神經元相比,該調控元件在PV神經元中導致該轉基因之選擇性表現。
  25. 如請求項24之方法,其中該非PV神經元為興奮性神經元、多巴胺神經元、星狀細胞、微膠細胞或運動神經元中之一或多者。
  26. 一種識別選擇性表現可操作地連接於調控元件之轉基因的細胞類型之方法,其包含: a.  向細胞提供載體之混合物,該等載體各自包含可操作地連接於轉基因之候選調控元件,其中各載體進一步包含條碼; b.  自表現該轉基因之複數個單細胞中分離RNA; c.  藉由定序該等單細胞中之每一者的總轉錄本來識別該等單細胞中之每一者; d.  使總轉錄本中之條碼與該候選調控元件相關聯;及 e.  將藉由候選調控元件在一種細胞類型中提供之該轉基因之表現量與相同候選調控元件在不同細胞類型中之表現量進行比較 從而識別選擇性表現該可操作地連接調控元件之轉基因的細胞類型。
  27. 如請求項26之方法,其中與至少一種其他細胞類型相比,該調控元件選擇性地增加或減少一種細胞類型中該轉基因之表現。
  28. 如請求項26之方法,其中該調控元件在一種細胞類型中提供與至少一種其他細胞類型中藉由該調控元件驅動之表現相比,大於或小於至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的該轉基因之選擇性表現。
  29. 如請求項26之方法,其中該調控元件在一種細胞類型中提供與至少一種其他細胞類型中藉由該調控元件驅動之表現相比,大於或小於至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的該轉基因之選擇性表現。
  30. 如請求項26之方法,其中該調控元件在一種細胞類型中提供與至少一種其他細胞類型中藉由該調控元件驅動之表現相比,大於或小於約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的該轉基因之選擇性表現。
  31. 如請求項26之方法,其中與非PV神經元相比,該調控元件在PV神經元中導致該轉基因之選擇性表現。
  32. 如請求項31之方法,其中該非PV神經元為興奮性神經元、多巴胺神經元、星狀細胞、微膠細胞或運動神經元中之一或多者。
  33. 如請求項1至32中任一項之方法,其中該RNA選自由以下者組成之群:mRNA、長非編碼RNA、反義轉錄物及pri-miRNA。
  34. 如請求項1至33中任一項之方法,其中該載體選自由以下者組成之群:質體、病毒載體或黏接質體。
  35. 如請求項34之方法,其中該病毒載體為腺相關病毒(AAV)載體。
  36. 如請求項35之方法,其中該AAV載體為AAV1、AAV8、AAV9、scAAV1、scAAV8或scAAV9。
  37. 如請求項36之方法,其中該AAV載體為AAV9。
  38. 如請求項35至37中任一項之方法,其中該載體包含5' AAV反向末端重複(ITR)序列及3' AAV ITR序列。
  39. 如請求項1至38中任一項之方法,其中該載體之混合物包含至少104 個候選調控元件。
  40. 如請求項1至39中任一項之方法,其中各候選調控元件與至少一個獨特條碼相關。
  41. 如請求項1至40中任一項之方法,其中該轉基因包含報導基因序列。
  42. 如請求項41之方法,其中該報導基因序列可操作地連接於編碼核結合域之序列。
  43. 如請求項1至43中任一項之方法,其中該轉基因包含該條碼。
  44. 如請求項42至44中任一項之方法,其中該報導基因序列包含該條碼。
  45. 如請求項43或44之方法,其中該條碼包含替代密碼子。
  46. 如請求項43至45中任一項之方法,其中該編碼核結合域之序列包含該條碼。
  47. 如請求項43至46中任一項之方法,其中該編碼核結合域之序列編碼Klarsicht/ANC-1/Syne同源(KASH)域或Sad1p/UNC-84(SUN)域蛋白,或其生物活性片段。
  48. 如請求項1至47中任一項之方法,其中該細胞類型屬於選自由以下者組成之群的組織:結締組織、肌肉組織、神經組織及上皮組織。
  49. 一種核酸分子,其包含可操作地連接於轉基因之調控元件,其中該核酸分子包含條碼。
  50. 如請求項49之核酸分子,其中該條碼包含替代密碼子。
  51. 如請求項49或50之核酸分子,其中該轉基因包含報導基因序列。
  52. 如請求項51之核酸分子,其中該報導基因序列可操作地連接於編碼核結合域序列之核苷酸序列。
  53. 如請求項52之核酸分子,其中該核結合域序列編碼KASH域或SUN域蛋白或其生物活性片段。
  54. 如請求項50至53中任一項之核酸分子,其中該調控元件為非天然存在的。
  55. 如請求項49至54中任一項之核酸分子,其中該報導基因序列編碼螢光蛋白。
  56. 如請求項55之核酸分子,其中該螢光蛋白為綠色螢光蛋白(GFP);增強型綠色螢光蛋白(EGFP);黃色螢光蛋白(YFP),諸如mBanana;紅色螢光蛋白(RFP),諸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;遠紅色螢光帕米膦酸鹽(far-red fluorescent pamidronate, FRFP),諸如mGrape1或mGrape2;青色螢光蛋白質(CFP);藍色螢光蛋白(BFP);增強型青色螢光蛋白質(ECFP);群青螢光蛋白(UMFP);橙色螢光蛋白(OFP),諸如mOrange或mTangerine;紅色(橙色)螢光蛋白(mROFP);TagCFP或四半胱胺酸螢光模體。
  57. 如請求項49至56中任一項之核酸分子,其中該轉基因包含該條碼。
  58. 如請求項49至56中任一項之核酸分子,其中該編碼核結合域之序列包含該條碼。
  59. 如請求項49至56中任一項之核酸分子,其中該報導基因序列包含該條碼。
  60. 如請求項49至59中任一項之核酸分子,其中該條碼置放於該轉基因之編碼區內。
  61. 如請求項49至59中任一項之核酸分子,其中該核酸分子包含非編碼區,且其中該條碼置放於該轉基因之非編碼區內。
  62. 如請求項61之核酸分子,其中該核酸分子包含非轉譯區(UTR)且該條碼置放於該UTR內。
  63. 如請求項61之核酸分子,其中該核酸分子包含polyA序列,且其中該條碼置放於該polyA序列之上游至少50個鹼基處。
  64. 如請求項49至59中任一項之核酸分子,其中該條碼置放於轉錄起始位點之上游。
  65. 一種核酸分子,其中該核酸分子為自DNA分子轉錄之RNA分子,其中該RNA分子包含轉基因及條碼序列,其中該DNA分子包含調控元件,且其中該RNA分子中之條碼序列與該DNA分子中之調控元件相關。
  66. 如請求項65之核酸分子,其中該轉基因包含報導基因序列。
  67. 如請求項66之核酸分子,其中該報導基因序列可操作地連接於編碼核結合域之核苷酸序列。
  68. 如請求項67之核酸分子,其中該核結合域為KASH域或SUN域蛋白或其生物活性片段。
  69. 如請求項65至68中任一項之核酸分子,其中該調控元件為非天然存在的。
  70. 如請求項66至69中任一項之核酸分子,其中該報導基因序列編碼螢光蛋白。
  71. 如請求項70之核酸分子,其中該螢光蛋白為綠色螢光蛋白(GFP);增強型綠色螢光蛋白(EGFP);黃色螢光蛋白(YFP),諸如mBanana;紅色螢光蛋白(RFP),諸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;遠紅色螢光帕米膦酸鹽(FRFP),諸如mGrape1或mGrape2;青色螢光蛋白質(CFP);藍色螢光蛋白(BFP);增強型青色螢光蛋白質(ECFP);群青螢光蛋白(UMFP);橙色螢光蛋白(OFP),諸如mOrange或mTangerine;紅色(橙色)螢光蛋白(mROFP);TagCFP或四半胱胺酸螢光模體。
  72. 如請求項65至71中任一項之核酸分子,其中該轉基因包含該條碼。
  73. 如請求項67至71中任一項之核酸分子,其中該編碼核結合域之序列包含該條碼。
  74. 如請求項66至71中任一項之核酸分子,其中該報導基因序列包含該條碼。
  75. 如請求項66至74中任一項之核酸分子,其中該條碼包含替代密碼子。
  76. 如請求項65至71中任一項之核酸分子,其中該核酸分子包含非轉譯區(UTR)且該條碼置放於該UTR內。
  77. 如請求項65至71中任一項之核酸分子,其中該核酸分子包含polyA序列,且其中該條碼置放於該polyA序列之上游至少50個鹼基處。
  78. 如請求項65至71中任一項之核酸分子,其中該條碼置放於轉錄起始位點之上游。
  79. 如請求項65至77中任一項之核酸分子,其中該核酸分子連接至微粒。
  80. 如請求項79之核酸分子,其中該微粒為珠粒。
  81. 如請求項79或80之核酸分子,其中該微粒連接至微粒聚核苷酸分子。
  82. 如請求項81之核酸分子,其中該核酸分子經由該微粒聚核苷酸分子連接至該微粒。
  83. 如請求項81或82之核酸分子,其中該微粒聚核苷酸分子包含引子序列。
  84. 如請求項81至83中任一項之核酸分子,其中該微粒聚核苷酸分子包含細胞條碼序列。
  85. 如請求項81至84中任一項之核酸分子,其中該微粒聚核苷酸分子包含獨特分子標誌(UMI)核苷酸序列。
  86. 如請求項81至85中任一項之核酸分子,其中該微粒聚核苷酸分子包含寡聚-dT序列。
  87. 如請求項81至86中任一項之核酸分子,其中該微粒聚核苷酸分子包含:a)引子序列,b)細胞條碼序列,c)獨特分子標誌(UMI)核苷酸序列,及d)寡聚-dT序列;其中該核酸包含polyA核苷酸序列,且其中該微粒按以下順序連接至a)-d):微粒--a)--b)--c)--d);且其中該polyA核苷酸序列與該寡聚-dT序列雜合。
  88. 如請求項87之核酸分子,其中該微粒為珠粒。
  89. 一種載體,其包含如請求項49至65中任一項之核酸。
  90. 如請求項89之載體,其中該載體為病毒載體。
  91. 如請求項89之載體,其中該載體為腺相關病毒載體。
  92. 如請求項89之載體,其中該腺相關病毒載體為AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其雜合體、禽類AAV、牛類AAV、犬類AAV、馬類AAV、靈長類AAV、非靈長類AAV及綿羊類AAV中之任一者。
  93. 如請求項89之載體,其中該腺相關病毒載體為AAV9載體。
  94. 一種細胞,其包含如請求項49至87中任一項之核酸。
  95. 一種細胞,其包含如請求項88至92中任一項之載體。
  96. 一種微粒,其連接至如請求項65至88中任一項之核酸中之一或多者。
  97. 如請求項96之微粒,其中該微粒為珠粒。
  98. 如請求項96或97之微粒,其中該微粒連接至微粒聚核苷酸分子。
  99. 如請求項98之微粒,其中該微粒聚核苷酸分子包含引子序列。
  100. 如請求項98或99之微粒,其中該微粒聚核苷酸分子包含獨特分子標誌(UMI)。
  101. 如請求項98至100中任一項之微粒,其中該微粒聚核苷酸分子包含寡聚-dT序列。
  102. 如請求項98至101之微粒,其中該核酸包含polyA核苷酸序列,且其中該polyA核苷酸序列與該寡聚-dT序列雜合。
  103. 如請求項98至102中任一項之微粒,其中該微粒聚核苷酸分子包含:a)引子序列,b)細胞條碼序列,c)獨特分子標誌(UMI)序列,及d)寡聚-dT序列;其中該核酸包含polyA核苷酸序列,且其中該微粒按以下順序連接至a)-d):微粒--a)--b)--c)--d);且其中該polyA核苷酸序列與該寡聚-dT序列雜合。
  104. 如請求項103之微粒,其中該微粒為珠粒。
  105. 一種液滴,其包含如請求項49至88中任一項之核酸分子。
  106. 一種液滴,其包含如請求項94或95之細胞。
  107. 一種液滴,其包含如請求項96至104中任一項之微粒。
  108. 一種液滴,其包含如請求項94或95之細胞及如請求項96至104中任一項之微粒。
TW109109448A 2019-03-22 2020-03-20 多工處理調控元件以識別細胞類型專一性調控元件 TW202102680A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201962822528P 2019-03-22 2019-03-22
US62/822,528 2019-03-22

Publications (1)

Publication Number Publication Date
TW202102680A true TW202102680A (zh) 2021-01-16

Family

ID=72611757

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109109448A TW202102680A (zh) 2019-03-22 2020-03-20 多工處理調控元件以識別細胞類型專一性調控元件

Country Status (17)

Country Link
US (1) US20220170910A1 (zh)
EP (1) EP3942055A4 (zh)
JP (1) JP2022525477A (zh)
KR (1) KR20210143855A (zh)
CN (1) CN113874515A (zh)
AU (1) AU2020245425A1 (zh)
BR (1) BR112021018819A2 (zh)
CA (1) CA3134501A1 (zh)
CL (1) CL2021002433A1 (zh)
CO (1) CO2021012576A2 (zh)
EA (1) EA202192580A1 (zh)
IL (1) IL286455A (zh)
MA (1) MA55386A (zh)
MX (1) MX2021011511A (zh)
SG (1) SG11202110298RA (zh)
TW (1) TW202102680A (zh)
WO (1) WO2020198017A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114085873A (zh) * 2021-11-16 2022-02-25 珠海中科先进技术研究院有限公司 一种癌细胞状态辨识基因电路组及其制备方法
WO2024005577A1 (ko) * 2022-06-29 2024-01-04 서울대학교산학협력단 Rna 안정성 또는 mrna 번역 증가용 조절 엘리먼트를 스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2879426A1 (en) * 2013-01-14 2014-07-17 Cellecta, Inc. Methods and compositions for single cell expression profiling
JP6754361B2 (ja) * 2014-12-16 2020-09-09 ボード オブ リージェンツ オブ ザ ユニバーシティ オブ ネブラスカ 若年型バッテン病のための遺伝子療法
CA3058189A1 (en) * 2017-04-03 2018-10-11 Encoded Therapeutics, Inc. Tissue selective transgene expression

Also Published As

Publication number Publication date
CO2021012576A2 (es) 2021-10-20
EP3942055A1 (en) 2022-01-26
CL2021002433A1 (es) 2022-09-20
CN113874515A (zh) 2021-12-31
US20220170910A1 (en) 2022-06-02
JP2022525477A (ja) 2022-05-16
MA55386A (fr) 2022-01-26
CA3134501A1 (en) 2020-10-01
WO2020198017A1 (en) 2020-10-01
SG11202110298RA (en) 2021-10-28
KR20210143855A (ko) 2021-11-29
AU2020245425A1 (en) 2021-10-07
BR112021018819A2 (pt) 2021-11-23
EA202192580A1 (ru) 2022-03-10
IL286455A (en) 2021-12-01
MX2021011511A (es) 2022-01-31
EP3942055A4 (en) 2022-12-28

Similar Documents

Publication Publication Date Title
Brown et al. Deep parallel characterization of AAV tropism and AAV-mediated transcriptional changes via single-cell RNA sequencing
JP2020515292A (ja) 組織選択的導入遺伝子発現
KR20200038236A (ko) 큐론을 포함하는 조성물 및 그의 용도
KR20220066225A (ko) 선택적 유전자 조절을 위한 조성물 및 방법
AU2019414426B2 (en) Methods and materials for single cell transcriptome-based development of AAV vectors and promoters
TW202102680A (zh) 多工處理調控元件以識別細胞類型專一性調控元件
CN116096394A (zh) 用于治疗心脏病的基因疗法载体
CN114829389A (zh) 转录调节元件
TW202045725A (zh) 用於治療核纖層病的組成物及方法
US20240151709A1 (en) Compositions and methods for tracing cell networks
KR20210131309A (ko) 분비형 치료 양식을 운반하기 위한 아넬로좀
Kuroda et al. A comparative analysis of constitutive and cell‐specific promoters in the adult mouse hippocampus using lentivirus vector‐mediated gene transfer
WO2016149684A2 (en) Haplotype based generalizable allele specific silencing for therapy of cardiovascular disease
Zheng et al. Massively parallel in vivo Perturb-seq reveals cell-type-specific transcriptional networks in cortical development
CN115768900A (zh) 病毒递送媒剂选择
US20150197803A1 (en) Method for Detecting or Measuring the Impact of a Viral Vector Composition on Eukaryotic Cells and Biomarkers Used Thereof
US20230257736A1 (en) A Method for Assessing Transduction Efficiency and/or Specificity of Vectors at Single Cell Level
JP2023518809A (ja) アデノ随伴ウイルスの改変方法及び分離方法
CN117597448A (zh) 用于使用单细胞核测序在体内筛选治疗剂的组合物和方法
EA046157B1 (ru) Композиции и способы селективной регуляции экспрессии генов
WO2024073310A2 (en) Elements for de-targeting gene expression in dorsal root ganglion and/or liver
Nathanson Cell type specific gene expression: profiling and targeting
WO2021209941A1 (en) Use of an orphan motif to increase expression of a heterologous transgene
CN115141896A (zh) 一种AAV组织分布的qPCR检测方法
CN109321575A (zh) 猪脂肪组织特异性启动子及其应用