CN113924366A - 基因沉默的中介体 - Google Patents

基因沉默的中介体 Download PDF

Info

Publication number
CN113924366A
CN113924366A CN202080038339.4A CN202080038339A CN113924366A CN 113924366 A CN113924366 A CN 113924366A CN 202080038339 A CN202080038339 A CN 202080038339A CN 113924366 A CN113924366 A CN 113924366A
Authority
CN
China
Prior art keywords
trna
tsrna
derived polynucleotide
gene
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080038339.4A
Other languages
English (en)
Inventor
莫尼卡·古勒罗瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Research Technology Ltd
Original Assignee
Cancer Research Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Research Technology Ltd filed Critical Cancer Research Technology Ltd
Publication of CN113924366A publication Critical patent/CN113924366A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • C12N2310/113Antisense targeting other non-coding nucleic acids, e.g. antagomirs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Epidemiology (AREA)
  • Diabetes (AREA)
  • Data Mining & Analysis (AREA)
  • Hospice & Palliative Care (AREA)

Abstract

本发明涉及抑制生物系统中基因表达的方法。本发明的方法包括将tRNA衍生的多核苷酸引入生物系统中。本发明的tRNA衍生的多核苷酸包含与其表达将被抑制的基因的内含子区互补的序列。

Description

基因沉默的中介体
技术领域
本发明涉及抑制生物系统中基因表达的方法。本发明进一步涉及tRNA衍生的多核苷酸及其作为药物的用途。
背景技术
哺乳动物细胞利用源自各种内源性来源的小RNA(sRNA)调节称为RNA干扰(RNAi)途径中的基因表达。这些sRNA包括微小RNA(microRNA,miRNA)和小干扰RNA(siRNA),它们可以对细胞质中许多蛋白编码基因的表达进行转录后调控。
RNAi途径存在于许多真核生物中并由Dicer酶启动,该Dicer酶将长双链RNA(dsRNA)切割成长度为约21个核苷酸的较短双链片段。这些短双链片段被称为siRNA。每个siRNA被解开形成两条单链RNA,其中一条链(向导链)被掺入RNA诱导的沉默复合物(RISC)中。然后向导链与互补的信使RNA(mRNA)配对,并且切割由Argonaute 2(Ago2)(RISC的催化组分)诱导,导致转录后基因沉默。
miRNA是参与基因表达调控的非编码RNA,尤其是在发育过程中。如上所讨论的,RNAi包括miRNA的基因沉默效应以及由dsRNA触发的基因沉默效应。miRNA,一旦经Drosha加工,则被Dicer结合和切割,以产生可以掺入RISC中的miRNA。然而,与负载siRNA的RISC不同,负载miRNA的RISC扫描mRNA以寻找潜在的互补序列,并与这些mRNA的3′非翻译区结合,从而阻止翻译。
围绕RNAi潜在机制的理解取得的进展已在许多领域得到利用,包括研究,例如基因功能研究,以及用于治疗疾病的各种治疗应用。与一种或多种基因活性相关的疾病应该非常适合基于RNAi的疗法,因为针对这些基因的小RNA可以被设计并用作治疗剂。这些可以包括,例如,癌症、自身免疫性疾病和神经退行性疾病(例如阿尔茨海默病)。RNAi的临床应用已被用于治疗年龄相关的黄斑变性,并且正在一系列治疗领域中开发进一步的治疗方法,包括治疗各种病毒感染,例如HIV。开发可用于治疗疾病的抑制基因表达的方法将是有利的。
转运RNA(tRNA)是长度为约75-90个核苷酸的RNA分子,它们作为接头分子携带氨基酸至mRNA的密码子。tRNA通常采用三叶草结构,其包括受体茎,该受体茎结合氨基酸和与mRNA密码子互补的反密码子臂。除了作为接头分子的作用外,tRNA最近还被鉴定为一类具有未表征作用的新型调节性RNA片段的来源。
本发明的目的是提供抑制基因表达的新分子和方法。
发明内容
本发明涉及介导RNA干扰,特别是基因沉默的新方法。RNAi是RNA分子通过中和靶向mRNA分子以抑制基因表达或翻译的生物学过程。因此,还提供了抑制基因表达的方法。我们还提供了介导基因沉默的新型分离的tRNA多核苷酸及其在治疗疾病的方法中的用途。
本发明部分基于发明人的研究,其中她已表明在细胞转染tRNA衍生的多核苷酸(特别是介导基因沉默的tRNA短片段)后特定基因的mRNA水平和随后的蛋白水平降低是可能的。这些tRNA的短片段被称为tsRNA(tRNA衍生的sRNA)。tsRNA不同于tRNA半段和tRNA片段,它们均是tRNA三叶草叶结构的切割产物。然而,如本文所解释的,tsRNA通过交替(alternative)折叠的tRNA(即茎-环/发夹结构)的Dicer依赖性切割产生。与siRNA不同,tsRNA在细胞核中通过发夹样tRNA的Dicer切割产生。tsRNA靶向细胞核中的基因。因此,本发明不涉及通过切割tRNA三叶草叶结构产生的tRNA半段和tRNA片段。
发明人已表明,内切核糖核酸酶Dicer是典型RNAi中的关键参与者,与具有转录活性的tRNA基因缔合,与折叠成非典型二级结构的tRNA结合并将它们加工成tsRNA。此外,这些Dicer依赖性tsRNA具有功能性,并且特异性靶向许多蛋白编码基因的内含子,导致其新生RNA以Argonaute 2(Ago2)依赖性方式降解。这使机制区分于由已知siRNA介导的其他RNA机制。此外,tsRNA在细胞核中起作用,而其他已知的siRNA在细胞质中起作用。靶向基因或长非编码RNA的内含子导致RNA在细胞核中生成后立即降解。本发明人已表明,tsRNA并非由成熟的tRNA产生,而是由折叠成交替二级结构的不同tRNA群体产生的,这种结构可以被描述为茎-环/发夹结构。这些交替折叠的tRNA被Dicer识别并在细胞核中加工成tsRNA。因此,我们提出了Dicer依赖性基因表达调控的新机制,该机制由tsRNA通过新生RNA降解介导,与熟知的转录后或转录基因沉默不同。
重要的是,本发明人已表明tsRNA靶基因与各种疾病(例如癌症)显著相关,这巩固了该途径的生物学重要性。因此,如本文所述的tsRNA可用于治疗疾病。
本发明的发明人已经发现,通过将tRNA衍生的多核苷酸(例如tsRNA)引入生物系统(例如细胞)中,可抑制基因或长非编码RNA的表达,前提是该tRNA衍生的多核苷酸包含与该基因的内含子区部分或完全互补的序列。本发明人使用该方法实现的基因表达抑制已被证明非常有效。
不希望受理论束缚,发明人的理解是tsRNA通过靶向蛋白编码基因的内含子用于新生RNA降解而不需要转录抑制和异染色质形成来共转录调控细胞核中的基因表达。
具体实施方式
现将进一步描述本发明的实施方案。在以下段落中,描述了不同的实施方案。除非明确指出相反,否则如此定义的每个方面均可以与任何其他方面或多个方面组合。特别地,被指示为优选或有利的任何特征可以与被指示为优选或有利的任何其他特征组合。
通常,与本文所述的细胞和组织培养、病理学、肿瘤学、分子生物学、免疫学、微生物学、遗传学以及蛋白质和核酸化学和杂交相关的术语和技术是本领域熟知和常用的那些。本公开的方法和技术通常根据本领域熟知的常规方法进行,并且如在本说明书通篇引用和讨论的各种常规和更具体的参考文献中所描述的,除非另有说明。参见,例如,Green和Sambrook等人,分子克隆:实验室手册,第4版,冷泉港实验室出版社,冷泉港,细约(2012)。
多核苷酸
在本发明的第一方面,提供了一种分离的tRNA衍生的多核苷酸,包含与靶基因的内含子区或长非编码RNA的内含子区互补的序列,特别是其中所述tRNA衍生的多核苷酸是具有14至35个核苷酸的tRNA衍生的多核苷酸片段(tsRNA)。
术语“分离的”意指tRNA衍生的多核苷酸从其天然环境中分离,而不是天然存在的。这表明有人工参与。当提及核酸分子时,该术语意指核酸分子或多肽至少基本上不含在自然界中天然相关并且如在自然界中所发现的至少一种其他组分。
本领域技术人员将理解,术语“多核苷酸”是指包含共价键合核苷酸单体的线性聚合物。例如,多核苷酸包括DNA和RNA。在本发明的实施方案中,多核苷酸是tRNA衍生的。
转运RNA(tRNA)是长度为约75-90个核苷酸的RNA分子,它们作为接头分子携带氨基酸至mRNA的密码子。在本申请中,术语“tRNA衍生的”用于表示多核苷酸可以包含天然存在的tRNA的全部或部分序列或者天然存在的tRNA的全部或部分序列的修饰序列(例如具有一个或多个插入、缺失或修饰的tRNA序列的全部或部分)。tRNA衍生的多核苷酸可以是化学合成的RNA或天然存在的RNA的类似物。类似物可以通过添加、缺失、置换或改变一个或多个核苷酸而与RNA不同。
术语“tRNA衍生的多核苷酸”还可以包括基于天然存在的tRNA的序列的人工多核苷酸,例如或使用基于天然存在的tRNA的特征(例如天然存在的tRNA的序列)的生物信息学算法开发的人工多核苷酸。
在本发明的一些实施方案中,tRNA衍生的多核苷酸可以包含天然存在的tRNA的全部或部分序列或者天然存在的tRNA的全部或部分序列的修饰序列(例如包括天然存在的序列的一个或多个插入、缺失或修饰)。优选地,当序列包括对天然存在的tRNA序列的修饰时,该修饰是保守修饰。技术人员将理解,通过利用保守修饰,保持或基本保持经修饰的核苷酸的特征。修饰的序列可以包括一个或多个人工的而非天然存在的核苷酸,例如锁核酸(LNA)。
在实施方案中,tRNA衍生的多核苷酸包含与天然存在的tRNA序列至少50、60、70、80、90或95%互补的序列。在实施方案中,tRNA衍生的多核苷酸包含与天然存在的tRNA序列至少98%或99%互补的序列。
本发明人出人意料地发现使用tRNA衍生的序列,尤其是那些与天然存在的tRNA具有高度序列相似性的序列,结果有效抑制基因表达和长非编码RNA的表达。
在本发明的实施方案中,多核苷酸包含tRNA。在此类实施方案中,tRNA优选包含茎-环/发夹结构。本发明人已表明,除了形成典型的三叶草结构之外,tRNA还可以形成交替二级结构,特别是茎-环结构。本发明人已表明,正是这种茎-环结构可以被内切核糖核酸酶Dicer结合,用于随后的加工和切割以在细胞核中产生tsRNA。因此,本文所述的tsRNA通过具有茎-环/发夹结构的tRNA的Dicer依赖性切割产生。
因此,在优选的实施方案中,多核苷酸包含具有14至35个核苷酸的tRNA衍生的多核苷酸片段(tsRNA)。tRNA衍生的sRNA被称为tsRNA。本发明人已表明,由内切核糖核酸酶Dicer(经典RNAi中的关键参与者)对tRNA的加工导致tsRNA形成。不希望受理论束缚,本发明人的理解是,Dicer与具有转录活性的tRNA基因缔合,与折叠成非典型二级结构(例如,可以描述为茎-环结构或短发夹结构)的tRNA结合并将它们加工成tsRNA。
本发明人已表明,tsRNA在结合它们具有互补性的基因或长非编码RNA的内含子区方面非常有效,从而抑制所述基因或长非编码RNA的表达。
例如,tsRNA分子包含14至25、18至23、20至22、或25至28个核苷酸。在一个实施方案中,多核苷酸包含18、19、20、21、22、23、24、25、26、27或28个核苷酸。tsRNA可以是双链的或单链的。双链tsRNA可以是平末端的。在另一个实施方案中,tsRNA是双链的并且tsRNA包含突出端。tsRNA可以是哺乳动物、植物或细菌tsRNA。例如,tsRNA可以是人或啮齿动物tsRNA。在一个实施方案中,tsRNA在5′或3′末端富含UA。
在一个实施方案中,tsRNA经化学修饰。可以引入修饰以提高稳定性,将先天免疫最小化,并能够递送至靶组织。
例如,ds或ss tsRNA的核苷酸的至少一个2′-羟基可以被化学基团(优选2′-氨基或2′-甲基)替换。至少一条链中的至少一个核苷酸还可以是带有糖环的锁核苷酸,该糖环经化学修饰,优选通过2′-O、4′-C亚甲基桥。有利地,几个核苷酸是锁核苷酸。还可以包括硫代磷酸酯修饰。其他修饰包括DNA或RNA类似物,例如反向dT或无碱基位点。或缀合物,例如肽核酸缀合物。
例如,单链tsRNA可以被核酸酶降解。然而,这可以通过添加化学修饰或锁定糖键(LNA)对tsRNA末端修饰来消除。
在一个实施方案中,tRNA衍生的多核苷酸与另一部分(例如N-乙酰半乳糖胺(GalNAc))缀合以助于递送至细胞核中。
发明人已显示具有特定序列的tsRNA可以靶向多于一个基因。如果需要在一个途径中靶向多于一个基因,这可能是需要的。在其他示例中,可能需要使tsRNA具有更高特异性从而仅靶向一个基因。这可以通过在tsRNA的每一侧添加来自靶基因序列的几个核苷酸(即多于5个残基)实现。
分离的tRNA衍生的多核苷酸,例如tsRNA,包含与靶基因的内含子区或长非编码RNA的内含子区互补的序列。tRNA衍生的多核苷酸通过新生RNA降解使靶基因或长非编码RNA失活。此外,tsRNA衍生的多核苷酸不是衍生自成熟的tRNA。它衍生自一种异常折叠的tRNA,其形成茎-环/发夹结构并通过依赖Dicer的机制切割。本文所述的tsRNA能够靶向细胞核中的新生RNA。tsRNA靶向特定基因的内含子区,以便通过以依赖Ago2的方式切割新生RNA来下调它们的表达。
在该技术领域工作的技术人员将容易理解,内含子是DNA或RNA的片段或者非编码RNA的剪接区,其不编码蛋白并且通常中断基因的蛋白编码区(外显子)。在本发明中,多核苷酸与其表达将被抑制的基因的内含子区互补。技术人员将理解,不必整个多核苷酸与基因的内含子区互补。然而,多核苷酸应该充分互补,使得多核苷酸与基因的内含子区结合和/或杂交。
如本文所用,互补用于表示基本上互补。换言之,互补性不一定是100%。“互补性”是指一种核酸与另一种核酸的序列通过传统的Watson-Crick或其他非传统类型形成氢键的能力。互补性百分比表示核酸分子中可以与第二核酸序列形成氢键(例如,Watson-Crick碱基配对)的残基的百分比(例如,10个中有5、6、7、8、9、10个为50%、60%、70%、80%、90%》和100%互补)。“完全互补”意指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基形成氢键。如本文所用,“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上具有至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补性程度,或指在严格条件下杂交的两个核酸。如本文所用,杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交而基本上不与非靶序列杂交的条件。严格条件通常具有序列依赖性,并根据许多因素而变化。通常,序列越长,该序列与其靶序列特异性杂交的温度越高。
因此,在一些实施方案中,多核苷酸包含与基因的内含子区的序列至少50%、60%、70%、80%、90%或95%互补的序列。优选地,多核苷酸可以包含与基因的内含子区的序列至少95%、96%、97%、98%或99%互补的序列。
在本发明的优选实施方案中,多核苷酸与其表达将被抑制的基因的mRNA的内含子区结合和/或杂交。在实施方案中,多核苷酸结合其表达将被抑制的基因的新生mRNA的内含子区。本发明人出人意料地发现,通过利用与其表达将被抑制的基因的mRNA的内含子区互补并因此可以与其结合的tRNA衍生的多核苷酸,可以实现高效抑制所述基因的表达。不希望受理论束缚,发明人提出这是通过新生RNA的降解实现的。因此,本发明还涉及如下所述的方法。
优选地,靶基因与病理状况相关。发明人出人意料地发现,tsRNA靶向的大多数基因是疾病相关基因,特别是当过表达时与疾病表型相关的基因。在一个实施方案中,靶基因与癌症相关。在一个实施方案中,靶基因与如图10、11或12所示的疾病相关。在一个实施方案中,靶基因选自图10、11或12的基因。在一个实施方案中,靶基因选自以下人类基因或长非编码RNA:表皮生长因子受体(EGFR,参见例如UniProtKB:P00533)、MET(MET原癌基因,受体酪氨酸激酶,参见例如UniProtKB:P08581)、BCL2(BCL2细胞凋亡调节剂,参见例如UniProtKB:P10415)、LINC0665(长基因间非编码RNA 00665,Lieu等人,Mol Ther NucleicAcids.2019 Jun 7;16:155-161)或LINC00660。靶向这些基因的示例性tsRNA序列如实例中所示并且在本发明的范围内。病理状况可以选自癌症、自身免疫性疾病、神经退行性疾病(例如阿尔茨海默病或帕金森病)、代谢疾病、呼吸疾病和心血管疾病。在一个实施方案中,病理状况选自如图10、11或12所示的状况中的一种。
在一个实施方案中,tsRNA具有包含SEQ ID NO.4、5或6的序列。
在另一方面,我们提供了一种载体,其包含分离的tRNA衍生的多核苷酸,例如如上所述的tsRNA片段。还提供了一种宿主细胞,其包含tRNA衍生的多核苷酸,例如如上所述的tsRNA片段或载体。宿主细胞可以是哺乳动物、病毒、细菌、植物或酵母细胞。载体可以是质粒或病毒载体。可以使用例如裸tsRNA注射、物理递送(例如电穿孔、基因枪、声穿孔、磁转染)、流体动力学递送和增强递送的化学方法(例如无机纳米粒子和细胞穿透肽)等方法进行递送。
方法
本发明提供了一种抑制或下调生物系统中基因表达的方法。抑制或下调表达是通过将与基因的内含子区互补的tRNA衍生的多核苷酸(例如tsRNA)引入生物系统实现的。
因此,提供了一种抑制或下调生物系统中靶基因或非编码RNA的表达的方法,该方法包括:
将tRNA衍生的多核苷酸(例如tsRNA)引入生物系统,其中该多核苷酸包含与靶基因或非编码RNA的内含子区互补的序列。
tRNA衍生的多核苷酸如上所述,例如如上所述的tsRNA。在一个实施方案中,tRNA衍生的多核苷酸包含在如上所述的载体中。
本领域技术人员将理解,短语“抑制基因表达”不一定要求基因表达完全沉默。在实施方案中,该方法可以导致基因或非编码RNA表达的基本上完全抑制(即100%抑制或接近100%的基因表达)。然而,在可选的实施方案中,本发明的方法可以导致靶基因或非编码RNA表达的部分例如轻度或中度降低。
例如,与正常或野生型表达相比,该方法可以导致基因或非编码RNA的表达被抑制/下调至少10%、20%、30%、40%或50%。如技术人员将理解的,所需的抑制量取决于靶向的基因。例如,与正常或野生型表达相比,本发明的方法导致基因表达被抑制/下调至少60%、70%、80%、90%、95%、98%或99%。
该方法导致生物系统中基因或非编码RNA表达抑制。然而,技术人员将理解,该方法可以导致同时抑制多个基因表达。在此类实施方案中,通过引入与所述多个基因的内含子区互补的tRNA衍生的多核苷酸以实现对所述多个基因表达的抑制。
本发明的方法可用于抑制任何靶基因(即任何目的基因)或任何靶非编码RNA的表达,条件是与该基因的内含子区互补的tRNA衍生的多核苷酸(例如,如本文所述的tsRNA)对于引入生物系统中是可得的/可以设计的。
本发明的方法可用于研究目的,例如确定特定基因的功能或降低该基因表达的效果。在此类实施方案中,基因可以是寻求进一步信息的基因。在某些实施方案中,基因可以是与特定疾病相关的基因。例如,在该方法用于研究目的的本发明的实施方案中,据称基因可能与疾病相关,并且该方法可用于确定在体外、体内、离体或计算机系统中抑制该基因的效果。
例如,如上所述,基因是与疾病(例如癌症、自身免疫性疾病、神经退行性疾病例如阿尔茨海默病、病毒或细菌感染性疾病等)相关的基因。
生物系统
上述方法导致抑制/下调生物系统中基因表达或长非编码RNA表达。该方法包括将tRNA或tRNA衍生的多核苷酸(例如tsRNA)引入生物系统中。
本领域技术人员将理解,本发明的生物系统可以是包含其表达将被抑制的基因的任何生物系统。例如,生物系统可以包含一个细胞或多个细胞,例如一个/多个真核细胞。样品可以包括细胞、组织、血液、尿液、唾液、外泌体、CSF或来自人或动物(例如哺乳动物)受试者的其他样品。在另一个实例中,样品可以包括来自植物的细胞或组织。在某些实施方案中,生物系统可以是人或动物受试者,例如需要抑制基因表达的受试者。在实施方案中,生物系统可以包含合成生物系统,例如由体外组成部分构建或在计算机中构建。
本发明的方法可以在体外进行。例如,在此类实施方案中,生物系统可以包含来自人、植物或动物受试者的细胞、组织、血液样品或其他样品。在此类实施方案中,出于研究目的,例如为了确定所述基因的功能或确定所述基因的抑制是否导致特定结果,可能需要抑制基因表达。
可选地,本发明的方法可以在体内进行。例如,在此类实施方案中,生物系统可以是人、植物或动物受试者。在此类实施方案中,抑制基因表达可以导致所述人或动物受试者的表型改变。例如,抑制基因表达(其中该基因与疾病相关)可以导致该疾病的治疗。
在又另外的实施方案中,本发明的方法可以离体进行。
本发明的上述方法涉及将tRNA衍生的多核苷酸(例如tsRNA)引入生物系统中。技术人员将理解,存在可将tRNA衍生的多核苷酸引入生物系统的多种方法。此类示例性方法可以包括,例如,使用非病毒载体(例如外泌体、纳米粒子或脂质体(例如lipofectamine))或病毒载体(例如逆转录病毒载体、腺病毒载体或单纯疱疹病毒载体)。
其他非限制性递送方法可以包括注射裸tsRNA、物理递送(例如电穿孔、基因枪、声穿孔、磁转染)、流体动力学递送和用于增强递送的化学方法(例如无机纳米粒子和细胞穿透肽)。还可以使用本领域已知的用于siRNA的其他递送方法。
在其中tRNA衍生的多核苷酸包含tRNA的本发明的实施方案中,该方法可以进一步包括将酶引入生物系统中,该酶切割tRNA以产生tsRNA。在实施方案中,该酶包括Dicer。
本发明人已表明,Dicer是经典RNAi中的关键参与者,与具有转录活性的tRNA基因缔合,与折叠成非经典二级结构(茎-环结构)的tRNA结合,并将它们加工成tsRNA。本发明人已有效地使用此类tsRNA以靶向和抑制基因表达。
本领域技术人员将理解,在本发明中使用的一些生物系统中,Dicer将天然存在。然而,在某些系统中,例如合成生物系统中,Dicer可以不存在并且将Dicer引入生物系统可能是有利的。
在实施方案中,本发明的方法可以包括将tRNA衍生的多核苷酸引入生物系统中的细胞的细胞核中。本领域技术人员将理解,存在多种可以将多核苷酸引入细胞的细胞核中的方法,如本领域已知的。这些包括,例如,原核注射和其他显微注射方法或使用与多核苷酸可操作连接的核靶向序列将多核苷酸靶向细胞核。
在本发明的实施方案中,该方法可以进一步包括将酶引入生物系统中,其将tRNA衍生的多核苷酸转运至细胞核。在实施方案中,该酶包括Argonaute 2(Ago2)。
本发明人出人意料地表明,Ago2与tsRNA缔合并将tsRNA运送至细胞核,在细胞核中它们可以通过结合新生mRNA的内含子区以抑制基因表达。
本领域技术人员将理解,在本发明中使用的一些生物系统中,Ago2将天然存在。然而,在某些系统中,例如合成生物系统,Ago2可以不存在并将Ago2引入生物系统中可能是有利的。
技术人员将理解,存在多种可以将酶(例如Ago2或Dicer)引入生物系统中的方法。此类方法可以包括,例如,使用非病毒载体(例如外泌体、纳米粒子或脂质体)或病毒载体(例如逆转录病毒载体、腺病毒载体或单纯疱疹病毒载体)。可选地,可利用在生物系统内在某些条件下表达酶的表达载体来引入此类酶。在本技术领域工作的技术人员将充分理解此类表达载体的使用。
我们还提供了一种降解生物系统中新生RNA的方法,该方法包括:
将tRNA衍生的多核苷酸引入生物系统中,其中该多核苷酸包含与新生RNA的内含子区互补的序列。
该方法可以进一步包括分离tsRNA。
我们还提供了一种鉴定介导靶基因的RNA干扰的tsRNA片段的方法,所述方法包括:
a)提供样品;
b)从所述样品分离具有约14至35个核苷酸的tsRNA片段;
c)表征所述tsRNA片段以确定与所述靶基因的序列同一性或相似性以及;
d)鉴定包含与靶基因的内含子区互补的序列的tsRNA片段。
样品可以是组织、细胞、血液、血清、外泌体或其他样品。
我们还提供了一种产生介导RNA干扰的tsRNA的方法,包括根据上述方法鉴定tsRNA片段。这可以涉及基于已鉴定tRNA片段的序列合成tsRNA。
我们还提供了一种从具有茎-环/发夹结构的tRNA产生tsRNA的方法,包括切割茎-环/发夹结构。以Dicer依赖的方式。
另一方面涉及通过上述方法获得或可获得的介导RNA干扰的tsRNA片段。
我们还提供了一种介导RNA干扰的方法,该方法包括:
将tRNA衍生的多核苷酸(例如本文所述的tsRNA)引入生物系统中。
我们还提供了一种介导细胞中靶标特异性RNA干扰的方法,包括使细胞与tRNA衍生的多核苷酸(例如本文所述的tsRNA)接触。
在上述所有方法中,tRNA衍生的多核苷酸如本文所述并且是如本文所述的tsRNA。
我们进一步提供了一种设计tRNA衍生的多核苷酸(例如tsRNA)的方法,该tRNA衍生的多核苷酸包含与靶基因的内含子区互补并且能够抑制靶基因的基因表达的序列,所述方法包括如图4a所示。
我们进一步提供了一种设计tRNA衍生的多核苷酸(例如tsRNA)的方法,该tRNA衍生的多核苷酸包含与靶基因的内含子区互补并且能够抑制靶基因的基因表达的序列,所述方法包括:
-生成dicer和ago2敲除;
-鉴定当dicer和ago2被敲除时上调的基因;
-生成候选靶标数据库;
-鉴定候选靶标的内含子区;
-计算机生成一组互补的tsRNA序列以及
-验证靶标以确认生成的tsRNA与预测的内含子区结合。
tRNA衍生的多核苷酸作为生物标志物的用途
在另一方面,如本文所述的tRNA衍生的多核苷酸,例如tsRNA,可以用作生物标志物以检测疾病的存在。
在另一方面,我们提供了一种检测疾病的方法,所述方法包括;
a)检测tsRNA的存在,所述tsRNA具有14至35个核苷酸并且与样品中的靶基因的内含子区或长非编码RNA的内含子区互补;
b)定量所述样品中存在的所述tsRNA的量;
c)将所述样品中存在的所述tsRNA的量与参考值进行比较以及;
d)评估所述疾病的存在或不存在。
在一个实施方案中,参考是健康细胞或患病细胞、血清或外泌体中tsRNA的量。在一个实施方案中,病症选自癌症、自身免疫性疾病、神经退行性疾病、代谢疾病、呼吸疾病和心血管疾病。在一个实施方案中,分离的tsRNA通过本领域已知的方法(例如RT-PCR)定量。在一个实施方案中,样品是血液样品。在一个实施方案中,该方法在体外进行。
医疗用途和方法
本发明还提供了tRNA衍生的多核苷酸,例如如上所述的tsRNA,其包含与基因或长非编码RNA的内含子区互补的序列,或如本文所述的药物组合物,其用作药物。
还提供了tRNA衍生的多核苷酸,例如如上所述的tsRNA,其包含与基因或长非编码RNA的内含子区互补的序列,或如本文所述的药物组合物,其用于治疗可以通过抑制基因表达而至少部分改善的疾病。
适当地,该用途涉及向患有该疾病的受试者施用治疗有效量的tRNA衍生的多核苷酸。
本发明还提供了一种治疗受试者疾病的方法,包括向受试者施用治疗有效量的tRNA衍生的多核苷酸,例如如上文所述的tsRNA,或如本文所述的药物组合物,其中该疾病可以通过抑制基因表达而至少部分改善,并且该tRNA衍生的多核苷酸包含与基因或长非编码RNA的内含子区互补的序列。
tRNA衍生的多核苷酸(例如tsRNA)的特征如以上关于本发明的第一方面所述。在一个实施方案中,tRNA衍生的多核苷酸是如上所述的tsRNA。
本领域技术人员将理解,存在许多与基因表达相关的疾病。例如,某些基因的表达或过表达可以产生疾病表型。实例包括与帕金森病的发展有关的α-突触核蛋白的过表达和与各种形式癌症相关的p53的过表达。其他疾病在图10、11和12列出。本领域技术人员将理解,当疾病由基因的表达或过表达引起时,可以通过抑制基因的表达来治疗此类疾病。因此,例如,通过降低α-突触核蛋白的表达,可能治疗帕金森病。
本领域技术人员将理解,术语“治疗(treating、treats和treatment)”包括病况、疾病或病症的预防性和治愈性治疗。这些术语还包括减缓、中断、控制或停止病况、疾病或病症的进展,以及预防、治愈、减缓、中断、控制或停止病况、疾病或病症的症状。
本发明人已表明,通过利用与基因内含子区互补的tRNA衍生的多核苷酸,可以抑制该基因表达。通过靶向特定的疾病相关基因(其疾病由所述基因的表达或过表达引起),可能治疗该疾病。
tRNA衍生的多核苷酸(例如tsRNA)治疗的疾病是可以通过抑制tRNA衍生的多核苷酸与内含子部分互补的基因的表达而至少部分改善的疾病。在特定实施方案中,该疾病可以例如选自癌症、自身免疫性疾病、神经退行性疾病(例如阿尔茨海默病或帕金森病)、代谢疾病、呼吸疾病和心血管疾病。其他疾病在图10、11和12中列出。
本领域技术人员将理解,短语“抑制基因表达”不一定要求基因表达完全沉默。在实施方案中,tRNA衍生的多核苷酸可以完全抑制基因表达(即100%抑制基因表达)。然而,在可选的实施方案中,tRNA衍生的多核苷酸可以导致基因表达轻度或中度降低。
优选地,与正常或野生型表达相比,tRNA衍生的多核苷酸导致基因表达被抑制至少50%。优选地,与正常或野生型表达相比,tRNA衍生的多核苷酸导致基因表达被抑制至少60%、70%、80%、90%、95%、98%或99%。优选地,tRNA衍生的多核苷酸(例如tsRNA)导致基因表达的完全抑制(即基因表达被100%抑制)。
在治疗疾病的方法中,该方法包括向受试者施用tRNA衍生的多核苷酸(例如tsRNA)。受试者可以是需要治疗疾病的任何受试者,其中可以通过抑制基因表达以治疗疾病。在实施方案中,受试者是人或动物受试者。
治疗有效量的tRNA衍生的多核苷酸(例如tsRNA)可以口服、局部、吸入、吹入或肠胃外施用。如技术人员将理解的,tRNA衍生的多核苷酸(例如tsRNA)可以制剂为例如药物组合物,用于特定施用途径。例如,适合口服施用的制剂包括片剂、锭剂、硬胶囊或软胶囊、水性或油性混悬剂、乳剂、可分散粉剂或颗粒剂、糖浆剂或酏剂。适合局部使用的制剂包括,例如,乳膏、软膏、凝胶、或水性或油性溶液或混悬剂。适合吸入的制剂包括,例如,细粉或液体气雾剂。适合通过吹入施用的制剂包括,例如,细粉。适合肠胃外施用的制剂包括,例如,用于静脉内、皮下、肌内或肌肉内给药的无菌水溶液或油性溶液,或用于直肠给药的栓剂。
如技术人员将理解的,治疗有效量的tRNA衍生的多核苷酸(例如tsRNA)将有必要根据待治疗的受试者、施用途径以及待治疗疾病的性质和严重程度而变化。
我们还提供了一种联合疗法,包括施用上述tRNA衍生的多核苷酸或上述药物组合物和抗癌疗法。抗癌疗法可以是放疗、化疗、RNAi疗法、基因疗法、或用生物或小分子药物进行的治疗。tRNA衍生的多核苷酸或药物组合物和抗癌疗法可以在相同或不同的药物中同时提供。可选地,治疗可以以序贯施用的不同药物提供。在一个实施方案中,其他疗法是放疗并且联合疗法可以提供至少叠加效应。因此,我们还提供了通过联合施用如本文所述的tRNA衍生的多核苷酸以增强放疗的治疗效果的方法。
药物组合物
本发明还提供了一种药物组合物,其包含如本文所述的tRNA衍生的多核苷酸(例如tsRNA)和药学上可接受的稀释剂或运载体(carrier)。
还提供了一种药物组合物,其包含如本文所述的tRNA衍生的多核苷酸(例如tsRNA)和药学上可接受的稀释剂或运载体,其用作药物。
还提供了一种药物组合物,其包含含有与基因的内含子区互补序列的tRNA衍生的多核苷酸(例如tsRNA)和药学上可接受的稀释剂或运载体,其用于治疗可以通过抑制靶基因或长非编码RNA的表达而至少部分改善的疾病。
tRNA衍生的多核苷酸(例如tsRNA)的特征如上所述。
本领域技术人员将理解,术语“治疗(treating、treats和treatment)”包括病况、疾病或病症的预防性和治愈性治疗。这些术语还包括减缓、中断、控制或停止病况、疾病或病症的进展,以及预防、治愈、减缓、中断、控制或停止病况、疾病或病症的症状。
本发明的药物组合物可以口服、局部、吸入、吹入或肠胃外施用。本领域技术人员将理解,可以针对特定施用途径配制药物组合物。例如,适合口服施用的制剂包括片剂、锭剂、硬胶囊或软胶囊、水性或油性混悬剂、乳剂、可分散粉剂或颗粒剂、糖浆剂或酏剂。适合局部使用的制剂包括,例如,乳膏、软膏、凝胶、或水性或油性溶液或混悬剂。适合吸入的制剂包括,例如,细粉或液体气雾剂。适合通过吹入施用的制剂包括,例如,细粉。适合肠胃外施用的制剂包括,例如,用于静脉内、皮下、肌内或肌肉内给药的无菌水溶液或油性溶液,或用于直肠给药的栓剂。
本发明的药物组合物可以使用常规药物辅料通过常规程序获得。例如,用于口服施用的药物组合物可以含有,例如,一种或多种着色剂、甜味剂、调味剂和/或防腐剂。
本领域技术人员将理解,活性成分(即tRNA衍生的多核苷酸)的量将有必要根据治疗的宿主和施用途径而变化。活性成分的量将有必要根据待治疗疾病的性质和严重程度、患者或动物的年龄和性别以及施用途径而变化。
药物组合物可以特别配制用于递送RNA分子非病毒载体(例如外泌体、纳米粒子或脂质体)或病毒载体(例如逆转录病毒载体、腺病毒载体或单纯疱疹病毒载体)或脂质缀合物。其他可能的递送方法在本文别处列出。
用途
本发明还提供了如本文所述的tRNA衍生的多核苷酸(例如tsRNA)用于抑制生物系统中基因或长非编码RNA的表达的用途,其中多核苷酸包含与基因的内含子区互补的序列。
在一些实施方案中,该用途是体外用途,即非医疗用途。在其他实施方案中,该用途是离体用途,例如用于调节(condition)细胞疗法。
试剂盒
本发明还提供了一种试剂盒,其包含如本文所述的tRNA衍生的多核苷酸,例如tsRNA。
设计分子的方法
我们还提供了一种用于生成候选tRNA衍生的多核苷酸(例如tsRNA)的计算机实施方法,其包含与本文所述的靶基因的内含子区互补的序列并且能够抑制靶基因的基因表达,所述方法包括:
a)确定衍生所述多核苷酸的tRNA的固有特征;
b)确定靶基因的内含子区内结合位点的固有特征,所述tRNA衍生的多核苷酸与所述结合位点结合;
c)生成包含已知tRNA衍生的多核苷酸和结合位点的数据集;
d)使用所述数据集定义训练数据集,以鉴定结构,核苷酸含量,在内含子内的位置,一级、二级或三级结构,或基因靶标的任何模式;
e)使用所述训练数据集筛选基因组序列以鉴定所述靶基因的内含子区内的候选结合位点以及;
f)生成包含与所述靶基因的内含子区互补的序列的候选tRNA衍生的多核苷酸。
在一个实施方案中,固有特征包括序列、二级结构和/或在基因组内的位置。
我们还提供了一种用于鉴定真核生物基因组中一个或多个独特的tRNA衍生的多核苷酸序列的计算机系统,所述系统包括:
I.存储单元,用于接收和/或存储基因组的序列信息;和
II.一个或多个单独或组合的处理器,其被编程以执行上述方法。
在以下实施例中,关于本发明的上述方面更详细地描述了本发明的用途的特征。
所描述和示出的实施例被认为是说明性的而不是限制性的,应该理解的是,仅示出和描述了优选的实施方案,并且落入如权利要求所限定的本发明的范围内的所有变化和修改均希望得到保护。
应当理解,虽然在说明书中使用例如“可优选的”、“优选地”、“优选的”或“更优选的”之类的词表明如此描述的特征可能是期望的,但是这可能不是必需的,并且可以将缺少这种特征的实施方案设想为在所附权利要求中限定的本发明的范围内。关于权利要求,旨在当例如“一个(a)”、“一种(an)”或“至少一个”之类的词用于特征前时,除非在权利要求中明确指出相反,否则并不旨在将权利要求仅限于一个此类特征。
附图
现将参考以下显示的非限制性附图对本发明进行进一步描述:
图1:Dicer与tRNA基因缔合,结合交替折叠的tRNA并将它们加工成tsRNA。A)显示ChIP-seq数据的热图。tRNA基因(行)根据RNAPIII占位排序。B)表示与Dicer和RNAPIII缔合(和未缔合)的tRNA的比例的堆叠柱状图。C)对野生型和shDicer细胞中特定tRNAArg-CCG-2-1、tRNAGly-CCC-2-1和tRNAPro-TCG-3-3进行探针检测的Northern印迹图像。代表与条带相对应的三叶草结构和短发夹结构的示意图。D)对野生型和shDicer中tRNAGly-CCC-2-1进行探针检测的Northern印迹图像。E)野生型和shDicer细胞之间tRNA、miRNA和snoRNA内sRNA变化的箱线图。虚线过零点。
图2:Dicer与可以折叠成短发夹结构的转录的tRNA基因缔合。A)显示与Dicer和RNAPIII缔合(和未缔合)的tRNA基因的比例的饼图。B)表示由tRNAArg-CCG-2-1和tRNAGly-CCC-2-1形成的二级结构的示意图。dG表示自由能。C)显示shDicer后RNAPII、RNAPIII和Dicer水平的Western印迹图像(β-微管蛋白作为上样对照)。
图3:tsRNA生物发生和起源分析。A)shDicer(D)vs正常细胞(N)中的sRNA水平,按绝对差异D-N>0和D-N<0分组。B)映射到每个tRNA位置的tsRNA数量(以tRNA长度%示出)。
图4:预期Dicer依赖性tsRNA靶向基因的内含子而不影响染色质状态。A)绘出通过Dicer和Ago缔合tsRNA预测基因靶向的生物信息学工作流程的图表。B)分别显示shDrosha、shDicer和shAgo2后六个选定靶基因的基于外显子的qRT-PCR分析的柱状图。C)分别显示shDicer和shAgo2后六个选定靶基因的基于内含子的qRT-PCR分析的柱状图。D-F)显示SPINT1三个区域的shDicer后总RNAPII水平和活性RNAPII水平的ChIP分析的柱状图。显示平均值±s.d.(n=3,*P<0.05)。
图5:靶基因在细胞质和细胞核中上调。A)显示野生型、shDicer和shDrosha细胞中Dicer和Drosha水平的Western印迹图像(p63作为上样对照)。B)显示野生型、shDicer和shAgo2细胞中Dicer和Ago2水平的Western印迹图像(丽春红S作为上样对照)。C)显示野生型和shDicer细胞的细胞质和细胞核部分中NOV、GUCY1A2、GK和RBP7的水平的柱状图。显示平均值±s.d.(n=3)。
图6:tsRNA未导致转录基因沉默。A)显示跨GK和GUCY1A2的shDicer后RNAPII总形式和活性形式的ChIP分析的柱状图。显示平均值±s.d.(n=3)。B)显示靶暴因的基因座处shDicer后H3K9me2的ChIP分析的柱状图。显示平均值±s.d.(n=3)。C)显示shDicer后总和活性RNAPII、H3和H3K9me2的水平的Western印迹图像(β-微管蛋白作为上样对照)。
图7:tsRNA靶标的ChrRNA-seq分析。A)显示分别在进行chrRNA-seq的两个生物重复中shDrosha、shDicer和shAgo2后染色质DROSHA、DICER和AGO2转录水平的qRT-PCR分析的柱形图。B)绘出了使用chrRNA-seq数据预测靶基因的工作流程,然后进行疾病基因关联分析的示意图。
图8:SPINT1上存在活性表观遗传标记和不存在抑制标记。跨SPINT1基因的H327Ac、H3K4me3和H3K9me3图谱。读段计数显示在左侧。
图9:靶基因的ChrRNA-seq分析和tsRNA药物基因沉默的验证。A)显示chrRNA-seq中上调基因的维恩图(对于shDicer和shAgo2,P<0.005,对于shDrosha,P<0.05)。B)跨SPINT1的chrRNA-seq图谱(n=2)。归一化读段计数在括号中表示。C)代表跨不同基因区域的tsRNA靶向的上调基因的比例的饼图。D)代表在不同基因区域具有靶标的tRNA的比例的饼图。E)表示在转染和未转染特定tsRNA的情况下在shDicer后GK和SPINTl mRNA的qRT-PCR分析的柱状图(上图)。显示平均值±s.d.(n=4)。表示tsRNA靶向区域及其起源的示意图。F)显示在经α鹅膏菌素处理或未处理的情况下细胞的细胞质和染色质部分中Ago2水平的Western印迹图像。G)绘出基因沉默机制模型的示意图。
图10:通过Dicer依赖性tsRNA介导的新生RNA降解导致的基因沉默与各种疾病有关。A)靶基因和疾病相关基因的列联表(P<2.2×10-16,单侧Fisher精确检验)。B)前50种疾病相对于前100种靶基因的热图,针对基因-疾病关联进行双向分选。蓝色表示匹配,白色表示不匹配。C)显示与靶基因相关的前100种疾病相关的疾病类别的堆叠柱状图。63种疾病是癌症,17种是神经系统疾病等。
图11:tsRNA与各种疾病有关。前100种疾病相对于前100种靶基因的热图,针对基因-疾病关联进行双向分选。蓝色表示匹配,白色表示不匹配。
图12:tsRNA与各种疾病类别相关。前100种疾病类别相对于前100种靶基因的热图,针对基因-疾病关联进行双向分选。蓝色表示匹配,白色表示不匹配。
图13:A)转染tsRNA EGFR/MET后EGFR和MET mRNA的稳态水平降低。B)tsRNA EGFR/MET转染后EGFR和MET mRNA的新生水平降低。从左至右的柱代表:BT-;BT tsRNAEGFR/MET;BT-tsRNASPINT1。
图14:BT549细胞转染tsRNA EGFR/MET,并在第3天使用光学显微镜成像。在转染tsRNAEGFR/MET的细胞群中似乎有更多细胞死亡。
图15:死细胞数量随tsRNA EGFR/MET量的增加而增加(光学显微镜)。
图16:活细胞数量随tsRNA EGFR/MET量的增加而减少(结晶紫染色)。
图17:tsRNA EGFR/MET和靶向EGFR的siRNA的转染导致EGFR和MET下调,但对照基因未下调,使用siRNA具有更高有效性。A)24小时后的稳态mRNA;B)72小时后的稳态mRNA水平。C)显示24小时后蛋白水平的Western印迹;D)显示72小时后蛋白水平的Western印迹。从左至右的柱代表:BT-;BT ts;BTsi
图18:tsRNA BCL2转染细胞导致稳态BCL2 mRNA水平下调。从左至右的柱代表:MCF7-;MCF7 tsRNABCL2;MCF7 tsRNASPINT1
图19:显示BCL-2水平随转染的tsRNA BCL2量的增加而降低的Western印迹。裂解的半胱天冬酶-9随tsRNA BCL2量的增加而增加,表明更多细胞正在经历凋亡。
图20:MCF7细胞转染tsRNA BCL2并在第3天用光学显微镜成像。在转染tsRNA BCL2的细胞群中存在更多死细胞。
图21:在转染tsRNA BCL2的细胞群中存在较少活细胞。
图22:BT549细胞中转染tsRNA LINC0665导致LINC0665水平降低。从左至右的柱代表:A-;tsRNALINC0665;tsRNASPINT1。
图23:A549细胞转染tsRNA LINC0665导致稳态(A)和新生(B)LINC0665水平降低。从左至右的柱代表:A-;tsRNALINC0665;tsRNASPINT1。
图24:A549细胞转染tsRNA LINC00665并在第3天用光学显微镜成像。在转染tsRNALINC00665的细胞群中存在更多死细胞。
图25:在转染tsRNA LINC00665的细胞群中存在较少活细胞。
图26:受辐照的细胞在辐照后30min显示出更高γ-H2AX信号。然而,在90min时间点,转染ts20(即靶向LINC00665的tsRNA)的细胞未能如对照一样修复DNA损伤,这表明tsRNA LINC00665正在影响参与DNA损伤反应的基因。
图27:将tsRNA LINC00665转染到MCR7和BT549细胞中导致细胞死亡;当细胞受γ射线辐照时,更多细胞发生死亡。然而,当tsRNA LINC00665的转染与γ射线辐照相结合时,这种效果被放大。A)暴露于0Gy的细胞;B)暴露于10Gy的细胞。
图28:将tsRNA BCL2转染到MCR7和BT549细胞中导致细胞死亡;当细胞受γ射线辐照时,更多细胞发生死亡。然而,当tsRNA LINC00665的转染与γ射线辐照相结合时,这种效果被放大。A)暴露于0Gy的细胞;B)暴露于10Gy的细胞。
图29:a.显示tRNAArg-CCG-2-1和miRNA pre-let7a的体外转录RNA的非变性PAGE。代表与条带相对应的三叶草结构和短发夹结构的示意图。B.体外转录的miRNA pre-let7a、tRNAArg-CCG-2-1和snoRD38A与纯化的Dicer-TAP一起孵育。在指示的时间点取等分试样并在变性PAGE上分析。C.在0、30、90和240min时,在纯化的Dicer-TAP存在下孵育的体外转录的tRNAArg-CCG-2-1的Northern印迹分析。
图30:a.wt HEK293细胞以及跨靶基因RP4-639F20.1的Drosha、Dicer和Ago2敲低中RNAP II ChIP-seq、RNAP II mNET-seq和chrRNA-seq图谱的组合快照(n=2)。归一化读段计数在括号中表示。B.Wt HEK293细胞以及跨非靶基因GAPDH的Drosha、Dicer和Ago2敲低中RNAP II ChIP-seq、RNAP II mNET-seq和chrRNA-seq图谱的组合快照(n=2)。归一化读段计数在括号中表示。
图31:a.代表靶向内含子的tsRNA分布的Metagene
图32:a wt HEK293细胞以及跨靶基因SPINT1的Drosha、Dicer和Ago2敲低中RNAPII ChIP-seq、RNAP II mNET-seq和chrRNA-seq图谱的组合快照(n=2)。归一化读段计数在括号中表示。b.wt HEK293细胞以及跨靶基因GK的Drosha、Dicer和Ago2敲低中RNAP IIChIP-seq、RNAP II mNET-seq和chrRNA-seq图谱的组合快照(n=2)。归一化读段计数在括号中表示。
图33a显示体外荧光(绿色)标记的siRNA和靶向EGFR靶基因的tsRNA的定位的共聚焦图像。细胞核被蓝染。
图34:a.显示从分级细胞:WC全细胞、C细胞质部分和N核部分分离的RNA样品的Northern印迹。显示了两个tRNA的信号。右侧的垂直线描绘了小RNA的区域。b.显示与Ago2结合的特定tsRNA的信号的Northern印迹。IgG用作阴性对照。
图35a体外切割测定。含有靶位点的全长底物(SPINT1内含子的一部分)与纯化的Ago2一起孵育,然后进行Northern印迹。探针的位置用红色表示。
图36:a.显示靶向SPINT1基因内含子的tsRNA的位置的示意图。qRT-PCR显示瞬转合成tsRNA的wt细胞中靶SPINT1 RNA的水平。模拟物(mock)被用作对照。b.显示瞬转靶向SPINT1和GK(阴性对照)基因的合成tsRNA的wt和Dicer kd(shDicer)细胞中靶SPINT1 RNA的水平的qRT-PCR。模拟物被用作对照。从左至右的4个柱代表:wt+模拟物;shDicer+模拟物;shDicer+tsRNASPINT1;shDicer+tsRNAGK。c.显示瞬转不同量的靶向SPINT1的单链合成tsRNA的wt细胞中靶SPINT1 RNA的水平的qRT-PCR。模拟物被用作对照。从左至右的3个柱代表:wt_模拟物;wt+ss tsRNASPIN1 50nM;wt+ss tsRNA SPIN 100nM。d.显示瞬转不同量的靶向SPINT1的双链合成tsRNA的wt细胞中靶SPINT1 RNA的水平的qRT-PCR。模拟物被用作对照。从左至右的3个柱代表:wt_模拟物;wt+ds tsRNASPINT1 30nM;wt+ds tsRNA SPIN 60nM
如上所述,本发明的方面实现通过使用与基因的内含子区互补的tRNA衍生的多核苷酸以有效抑制基因表达。本发明人进行了大量研究以开发如下所述的本发明的方面。
实施例
参考以下非限制性实施例进一步描述本发明。
实施例1
材料和方法
细胞系和处理
本发明人进行的研究中使用的细胞系是人胚胎肾293(HEK293细胞)、具有整合多西环素诱导表达盒的HEK293克隆1.3细胞(含有TAP标签的Dicer以及针对DICER mRNA的shRNA(shDicer))和具有整合多西环素诱导表达盒的基于HEK293的细胞系(分别含有针对AGO2 mRNA(shAgo2)的shDicer和shRNA)。所有细胞均在含10%胎牛血清、1%L-谷氨酰胺(Thermo Fisher Scientific)和1%青霉素-链霉素(Thermo Fisher Scientific)的Dulbecco′s Modified Eagle培养基(DMEM)(Thermo Fisher Scientific)中在5%CO2中于37℃下培养。Dicer和Ago2敲低是通过在DMEM中将可诱导细胞系与多西环素(3μg/ml)于37℃下孵育72小时(每24小时更换含多西环素的新鲜培养基)实现的。HEK293T克隆1.3细胞中的TAP-标签用多西环素(3μg/ml)诱导5天。使用Lipofectamine 2000试剂(Invitrogen)进行针对含DROSHA mRNA(shDrosha)的质粒的shRNA(10μg,6小时两次)和tsRNA(50μM,48小时)的转染。细胞与α-鹅膏菌素(2μg/ml,Sigma)孵育24小时以抑制转录。
Northern印迹
在1×TBE中的14%双聚丙烯酰胺凝胶上分离在2×非变性上样染料(0.05%二甲苯氰醇、0.05%溴酚蓝、20%甘油)中的2至3μg RNA,然后转移到硝酸纤维素膜(Protran,GEHealthcare)上。膜经UV交联并在寡核苷酸杂交缓冲液中于42℃下预杂交1小时。tRNA特异性寡核苷酸探针通过多核苷酸激酶(PNK)于37℃下放射性标记32P-ATP 30分钟。放射性标记的探针在G-25 Sephadex柱(GE Healthcare)中纯化,并于42℃下杂交到O/N膜上,然后用Northern洗涤缓冲液(0.05%SDS,0.1×SCC)洗涤并进行放射自显影。
Western印迹
全细胞、细胞质、细胞核或染色质提取物直接用4×Laemmli缓冲液(0.2M Tris-HCl,8%(w/v)SDS,40%甘油,20%(v/v)β-巯基乙醇,0.005%溴苯酚蓝)处理,于95℃下孵育5分钟并超声处理。样品在mini-
Figure BDA0003369651820000241
TGXTM凝胶(Bio-Rad Laboratories)上分离,然后转移到硝酸纤维素膜(Protran,GE Healthcare)上并用抗体进行探针检测。
sRNA-seq和mRNA-seq样品的制备
对于sRNA-seq,使用miRVana miRNA分离试剂盒(Thermo Fisher Scientific)从用乱序shRNA(作为对照)和shDicer细胞处理7天的细胞中分离总RNA。在Agilent 2100生物分析仪上使用RNA 6000 Pico试剂盒(Agilent)确证纯化RNA的质量。使用
Figure BDA0003369651820000242
Multiplex Small RNA Library Prep Set(New England BioLabs)制备测序文库,并在HiSeq2000(Illumina)上测序。对于mRNA-seq,使用miRNEasy试剂盒(Qiagen)纯化RNA,并于37℃下用DNase(Thermo Fisher Scientific)处理30分钟,然后进行酸性苯酚-氯仿提取。使用1.25%甲醛凝胶验证样品完整性。RNA样品是核糖耗竭样品,并且测序文库制备是使用TruSeq Stranded Total RNA样品制备试剂盒(Illumina)进行的,然后在HiSeq2000(Illumina)上进行双端测序。
逆转录-定量PCR
根据生产商的说明,使用TRIzol(Invitrogen)从全细胞、细胞质、细胞核或染色质提取物中分离RNA,并于37℃下用DNase I(1U,Roche)处理30分钟。使用SuperScriptTM逆转录酶(Thermo Fisher Scientific)和特定反向引物,将250-500ng(基于外显子)和5μg RNA(基于内含子)用于制备cDNA模板。在Rotor-Gene RG3000机器(Corbett Research)上使用SensiMixTMSYBR No-Rox Mastermix(Bioline Reagents)和特定引物对进行实时PCR。使用比较Ct方法(1)计算相对倍数变化。
亚细胞分级分离
根据已公开的方案(2)获得细胞质和细胞核级分。
染色质相关RNA测序
根据公开的方案(3)使用约6.72×106个细胞提取染色质部分,并用在1%SDS中的40μg蛋白酶K和1μl Turbo DNase(2U/μl)(Thermo Fisher Scientific)处理,然后用TRIzol(Invitrogen)提取。通过在安全锁管(Eppendorf)中的加热块上将样品于55℃下加热10分钟,溶解不完全溶解的染色顾沉淀物。
染色质免疫沉淀
将约7×106个细胞与在DMEM中的1%甲醛孵育8分钟,然后于37℃下用在DMEM中的0.125M甘氨酸淬灭10分钟。细胞用冰冷的PBS洗涤并在500μl细胞裂解缓冲液(0.5%NP-40,85mM KCl,5mM PIPES,1×蛋白酶抑制剂混合物(cocktail)(Roche))中裂解。染色质以800g沉淀10min,然后在核裂解缓冲液(50mM Tris-HCl、1%SDS、10mM EDTA、1×蛋白酶抑制剂混合物(Roche))中裂解,并于4℃下以高功率设置超声处理25min。用蛋白G磁珠(每个样品40ul,Invitrogen)预清除碎片化染色质裂解物1小时,平均分为输入样品、IP样品和仅磁珠样品,并在稀释缓冲液(16.7mM Tris-HCl,0.01%SDS,1.1%Triton X-100,500mM EDTA,167mM NaCl,1×蛋白酶抑制剂混合物(Roche))中稀释。使用抗体进行免疫沉淀过夜,样品与蛋白G磁珠(40μl)孵育1小时。磁珠用洗涤缓冲液A(20mM Tris-HCl,2mM EDTA,0.1%SDS,1%Triton X-100,150mM NaCl)、B(20mM Tris-HCl,2mM EDTA,0.1%SDS,1%TritonX-100,500mM NaCl)、C(10mM Tris-HCl,1mM EDTA,1%NP-40,1%脱氧胆酸钠,0.25M LiCl)和D(10mM Tris-HCl,1mM乙二胺四乙酸)洗涤。蛋白质-DNA复合物于室温下用洗脱缓冲液(1%SDS,0.1M NaHCO3)洗脱30min,然后在65℃下用RNase A(1μl)和蛋白酶K(2μl)处理过夜。用苯酚-氯仿(1∶1)混合物提取DNA,然后进行qPCR。
实验数据的统计分析
使用原始Ct值分析qPCR数据。在比较两个条件时,对数据进行Shapiro-Wilk检验和F检验以评估正态性和等方差;如果它们服从正态分布并具有相同的方差,则执行非配对t检验(单尾)以检验显著性差异(p值<0.05被认为具有显著性)。如果数据不服从正态分布,则使用非配对Mann Whitney检验(单尾)代替。为了比较两个或多个条件,进行单因素ANOVA,然后进行Tukey多重比较检验。
生物信息学分析
ChIP-seq
对发明者先前公开的Dicer ChIP-seq进行分析(4)(GSM1366345)。原始数据用cutadapt 1.8.3(5)对由fastqc(6)鉴定的各种污染序列进行接头剪切(trim)。因此,对AGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG(SEQ ID NO.1)、TCGTATGCCGTCTTCTG(SEQ ID NO.2)和CTGTAGGCACCATCAAT(SEQ ID NO.3)在3′和5′末端进行剪切。
RNAPIII ChIP-seq数据下载自GEO(GSM509047)(7),以及RNAPII ChIP-seq数据(GSM935534)和输入(GSM935533)(ENCODE Transcription Factor Binding Sites byChIP-seq from Stanford/Yale/USC/Harvard)(8)。使用bowtie2(9)默认值将所有ChIP-Seq数据映射到hg38。带有samflag 4(未映射)的读段被丢弃,并使用samtools 0.1.19(10)去除重复读段。Bedgraphs通过使用bedTools基因组CoverageBed(11)生成,并通过(文库大小)/108进行归一化。RNAPIII和Dicer的存在通过使用MACS版本2.1.1(12)和命令行参数callpeak-g hs--broad-cutoff 0.05-broad进行峰值调用来确定。
tRNA hg38坐标下载自UCSC(13)。使用自定义编写的perl脚本计算每个tRNA和200nt周围区域的覆盖值。随后每个tRNA被延伸至100nt并校正覆盖值。热图使用自定义MATLAB(MATLAB和Statistics Toolbox Release 2016a The MathWorks,Inc.,Natick,Massachusetts,United States)脚本生成,其中采用25nt滚动平均值。
sRNA-seq和PAR-CLIP
使用bowtie-build(14)针对每侧延伸7nt的tRNA基因序列构建bowtie索引。MicroRNA和snoRNA序列下载自UCSC(13),并以相同的方式构建索引。Dicer敲低和乱序shRNA对照(3reps)的sRNA-seq数据以及AGO 1、2、3和4(15)和Dicer(16)(3reps)的PAR-CLIP数据使用具有最小长度1024的cutadapt 1.8.3进行接头剪切。使用自定义编写的perl脚本去除由部分接头组成的更多序列。使用-S-v3--all--best-strata(14)将剩余序列映射到tRNA+7nt/mi-和snoRNA。仅考虑长度为19nt至22nt的序列进行进一步分析。读段与它们的基因组序列等同。
对于sRNA分析,在任一rep中读段由至少一个AGO和一个Dicer PAR-CLIP命中支持。将tRNA/miRNA/snoRNA区中的命中归一化为可映射到基因组的读段总数。这些是通过将具有bowtie(14)-m 1-k 1的读段映射到hg38并将输出报告中的“具有至少一个报告比对的读段”和“由于-m抑制比对的读数”相加来确定的。对于PAR-CLIP,进一步考虑在所有AGO集中出现25次以及在Dicer rep1、rep2或rep3集中分别出现323、41或19次的读段(临界值是由于不同的文库大小和读段出现的分布获得的)。这些被认为是tsRNA。
ChrRNA-seq
cDNA和ncRNA序列数据下载自Ensembl版本89(17),并建立kallisto(v0.43.1)索引。使用kallisto(18)和以下选项生成RNA-seq数据的读段计数:--rf-stranded-b 100-t5。
差异基因表达
差异表达的基因用DESeq2(19)确定。对于mRNA-seq基因,具有FDR校正的P<0.001的基因被认为是显著差异表达。对于chrRNA-seq,具有shDicer和shAgo2的校正P<0.005的基因被认为是显著差异表达。由于变化基因的数量少,因此在shDrosha样品中使用严格度较低的校正P<0.05的标准。
靶标预测
通过使用参数-sc 150-en-30-quiet针对由mRNA-Seq确定的显著上调基因运行miRanda 3.3a(20)来预测tsRNA靶标。对chrRNA-seq中shDicer和shAgo2中显著上调的基因重复进行相同分析。
tsRNA分布
如果它们彼此重叠10nt,则将映射到tRNA的sRNA进行分组。然后将每一组视为具有最极端映射的一个sRNA。每个tRNA被延伸至100nt。绝对频率计算为每个tRNA位置的(分组的)sRNA命中数。
疾病关联热图
发明人从DisGeNET(21)下载了所有基因-疾病关联的表格以及cui、疾病和疾病类别的精选注释。DisGeNET使用NCBI注释作为参考。我们提取了NCBI基因的基因符号和所有同义词。本发明人还使用BioMart(22)提取了Ensembl 89的基因符号。基因体系(geneuniverse)被视为NCBI基因符号和Ensembl 89基因符号的重叠,并且仅进一步考虑该体系中带有符号的疾病和靶基因。因此构建了列联表,并采用单侧Fisher精确检验来评估观察结果的显著性。通过构建靶基因-疾病/疾病类别关联的二元矩阵,使用pheatmap包(24)在R(23)中绘制热图。该矩阵首先按列总和(基因)排序,然后按行总和(疾病)排序。
tRNA二级结构预测
为了预测可能的tRNA结构,我们使用了mFold(25)网络服务器,其次优性%:20和其他默认参数。
讨论
深度测序技术的出现有助于鉴定哺乳动物细胞中的tsRNA,消除源自tRNA的sRNA是随机片段化产物的疑虑。然而,对于哪些酶产生tsRNA仍存在争议并且它们的生物学作用的程度尚未清楚。由于Dicer参与产生一些tsRNA,本发明人试图探索Dicer的细胞核功能是否与此类sRNA有任何关系。
发明人首先利用Dicer和RNA聚合酶III(RNAPIII)染色质免疫沉淀测序(ChIP-seq)数据来表明Dicer优先与转录的tRNA基因结合。RNA聚合酶II(RNAPII)和输入(input)用作阴性对照。(图1a、b,图2a)。为了检测Dicer是否对tRNA有任何影响,发明人进行了Northern印迹分析并表明,在Dicer敲低后不同tRNA群在非变性聚丙烯酰胺凝胶电泳(PAGE)中稳定,但在变性PAGE中不稳定(图1c),表明该tRNA群具有与典型tRNA相同的一级序列,但折叠成交替二级结构。发明人还使用mFold(25)预测tRNA的交替二级结构,并表明它们确实可以折叠成类似于miRNA前体的短发夹结构(图2b)。为了确认Dicer和交替折叠tRNA之间的直接关联,发明人免疫沉淀串联亲和纯化(TAP)标记的Dicer并检测到在非变性PAGE中交替折叠tRNA的富集(图1d)。有人提出Dicer结合各种RNA底物,但无需任何进一步加工。为了检测Dicer是否将交替折叠的tRNA加工成功能性sRNA,发明人对从野生型和诱导型Dicer敲低细胞中分离的sRNA进行了测序和比较(图2c)。首先,发明人在野生型细胞中检测到tsRNA,确证了它们的存在。其次,它们的水平在Dicer敲低后与miRNA(发明人将其用作阳性对照)一起降低。用作阴性对照的小核仁RNA(snoRNA)的水平在Dicer敲低后未降低(图1e、图3a)。这些tsRNA中有很大一部分来自tRNA的前半部分(图3b),这将它们与tRNA片段相区分。这些数据表明,Dicer参与衍生自交替折叠tRNA结构的tsRNA的生物发生。因此,这种类型的tsRNA不同于先前报道的衍生自成熟tRNA的Dicer非依赖性tsRNA。
发明人接下来从可光活化核糖核苷增强的交联和免疫沉淀(PAR-CLIP)Dicer以及Ago1、2、3和4数据中提取序列,并将这些映射到tRNA基因(±7nt)。接下来,发明人对来自野生型和Dicer敲低细胞的mRNA进行测序,并通过DESeq2确定在Dicer敲低中上调的基因。最后,他们使用miRanda(20)生成预测为Dicer和Ago相关tsRNA靶向的基因列表(图4a)。使用靶向3′非翻译区(UTR)的引物,通过逆转录-定量PCR(qRT-PCR)检测野生型、Drosha、Dicer和Ago2敲低细胞(图5a、b)中六个随机选择的靶基因。如果基因受miRNA调控,则Drosha的缺失应导致其上调,因为Drosha对miRNA生物发生至关重要。四个蛋白编码基因(GK、GUCY1A2、RBP7和SPINT1)和一个非编码转录本(RP4-639F20.1)仅在Dicer和Ago2敲低中上调,表明它们不通过miRNA依赖性途径调节(图4b)。Drosha、Dicer和Ago2敲低后NOV显著上调。由于这些数据表明大多数检测基因为miRNA非依赖性调控,我们接下来分析了在哪些亚细胞区室中靶基因被上调并进行亚细胞分离,然后进行qRT-PCR。出人意料地,四个检测的靶基因在细胞质和细胞核区室中均上调(图5c)。有人可能争辩,来自细胞质部分的潜在污染可能导致该观察结果。因此,发明人在靶基因的内含子中使用了qRT-PCR探针,并表明六个检测基因在Dicer和Ago2敲低后上调,而非靶对照基因ETNK1的水平不受影响(图4c)。这些结果意味着检测的基因在转录水平(而不是转录后)受调控,因为内含子的剪接是共转录进行的。转录基因沉默(TGS)是通过组蛋白修饰和异染色质形成介导的,并导致转录关闭和染色质上RNAPII缺失。为了检测tsRNA是否可以靶向TGS基因,发明人对三个选定的靶基因(在启动子、外显子和3′UTR中进行探针检测)进行总形式和活性形式的RNAPII的ChIP(在C末端结构域中的丝氨酸位置2(S2P)和5(S5P)处磷酸化)并发现RNAPII的水平在Dicer敲低后未增加(图4d,图6a)。此外,作为异染色质标记的赖氨酸9二甲基化组蛋白3(H3K9me2)的水平仅在靶基因的背景水平检测到,并且在Dicer敲低后未变化,而RNAPII、H3和H3K9me2的整体蛋白水平未受影响(图6b、c)。这些结果表明tsRNA介导的基因沉默不需要转录或染色质状态的变化,而是导致新生的RNA降解。
为了鉴定受这种独特基因沉默机制全局调控的基因,发明人进行了染色质相关RNA测序(chrRNA-seq),以检测野生型、Drosha、Dicer和Ago2敲低细胞中新生转录本的水平(图7a)。鉴定了超过2000个在Dicer和Ago2敲低后上调但在Drosha敲低后未上调的基因(图9a、b)。仔细检查其中一个靶基因SPINT1,证实野生型和Drosha敲低细胞中仅有低水平的新生RNA。然而,活性组蛋白标记赖氨酸27乙酰化的H3(H327Ac)和赖氨酸4三甲基化的H3(H3K4me3)存在于SPINT1的启动子中,而抑制性标记赖氨酸9三甲基化的H3(H3K9me3)未检测到(图8;GEO登录号GSE66530)。发明人随后对在chrRNA-seq中上调的靶基因进行miRanda分析(图7b),并表明它们被tsRNA靶向,特别是在它们的内含子中(图9c)。在产生tsRNA的531种tRNA中,496种在蛋白编码基因的至少一个内含子区中具有靶标(图9d)。为了验证靶向内含子的tsRNA的分子机制,发明人合成了预测靶向SPINT1的第二内含子的tsRNA序列,转染野生型和Dicer敲低细胞,并使用qRT-PCR评估SPINT1和GK mRNA的水平。发明人发现,在转染其靶向tsRNA后,在Dicer敲低后SPINT1的上调显著降低,而用作阴性对照的GK上调不受影响(图9e)。该实验表明tsRNA可以靶向特定基因的内含子区以下调其表达。由于靶基因在Dicer和Ago2敲低后上调,并且Ago2通常在Dicer下游起作用,因此本发明人假设Ago2由tsRNA引导至染色质以靶向新生RNA进行降解。发明人观察到染色质上的Ago2水平在α-鹅膏菌素抑制RNAPII 24小时后降低(图9e),表明Ago2和染色质之间的关联具有转录依赖性。总之,发明人提出了一种新的基因沉默机制,该机制采用Dicer依赖性tsRNA驱动依赖于Ago2的新生RNA降解(图9g)。这种机制不同于miRNA介导的转录后基因沉默,因为它发生在细胞核中并且具有Drosha非依赖性。它也不同于转录基因沉默,因为它不涉及转录抑制和异染色质形成。这种基因沉默机制的优势是它不需要改变可能影响靶基因附近基因的表达的染色质背景。
最后,发明人研究了tsRNA调控基因的共同点。考虑到它们在野生型细胞中被抑制,我们探寻它们新生的RNA降解是否具有生物学背景。发明人采用DisGeNET,这是记录人类疾病相关基因的平台,并出人意料地发现,与非靶基因相比,Dicer依赖性tsRNA靶向沉默的基因与疾病显著相关(单侧Fisher精确检验,P<2.2×10-16)(图10a)。发明人鉴定了1225个靶基因(总共1564个)与至少一种疾病的关联(图11和12)。在图10b中,发明人显示了迄今为止已知的涉及最多疾病(此处为前50种)的前100个基因。此外,发明人对与靶基因相关的前100种疾病进行了分类,并发现许多靶基因参与肿瘤发生、神经系统疾病、自身免疫性疾病等(图10c)。
本发明的发明人提出了独特的基因沉默机制。与miRNA介导的PTGS不同,Dicer依赖性tsRNA以共转录方式靶向细胞核中的基因。然而,与通过转录抑制和异染色质形成促进的TGS不同,这些tsRNA靶向蛋白编码基因的内含子以立即降解新生的RNA。这种调节1125个疾病相关基因的新分子机制在当前扩展RNA疗法的时代具有巨大的转化潜力。
实施例2:EGFR表达细胞系
tsRNA的生成如图4a所示。编码表皮生长因子受体的基因;EGFR是I型生长因子受体家族的成员,其基因位于染色体7p12上并编码具有酪氨酸激酶活性的170kDa跨膜糖蛋白。EGFR在许多癌变部位的高水平表达已反复证明与恶性程度更高或晚期疾病、预后不良相关。
细胞转染tsRNA 24小时并收集用于RNA分离。相对RNA水平通过逆转录定量PCR(qRT-PCR)进行定量。靶向外显子的引物用于定量稳态mRNA水平,而靶向内含子的引物用于定量新生(新产生的)RNA水平。如图13A所示,转染tsRNA EGFR后EGFR mRNA的稳态水平降低。如图13B所示,转染tsRNAEGFR后EGFR mRNA的新生水平降低。
实施例3:MET表达细胞系
tsRNA的生成如图4a所示。cMET在乳腺癌细胞和人乳腺肿瘤中也过表达,并且其表达与EGFR表达相关。cMET生长因子受体的特征为受体酪氨酸激酶。cMET部分调节EGFR酪氨酸磷酸化和生长。细胞转染tsRNA24小时并收集细胞用于RNA分离。相对RNA水平通过逆转录定量PCR(qRT-PCR)进行定量。靶向外显子的引物用于定量稳态mRNA水平,而靶向内含子的引物用于定量新生(新产生的)RNA水平。如图13A所示,转染tsRNA MET后MET mRNA的稳态水平降低。如图13B所示,转染tsRNA MET后MET mRNA的新生水平降低。
实施例4:使用BT549的EGFR+MET(表达两者)
如图14所示,BT549细胞转染tsRNA EGFR/MET,并在第3天使用光学显微镜成像。在转染tsRNA EGFR/MET的细胞群中似乎有更多细胞死亡。tsRNA是单链的,具有以下序列(5′至3′):UCCCUGGUGGUCUAGUGGUUAG(SEQ ID NO.4)。BT549细胞转染浓度增加的tsRNA EGFR/MET(10、20、40和80ul-100、200、400和800pmol),并在第6天成像。如图15所示,死细胞数随tsRNA EGFR/MET量的增加而增加(光学显微镜),在图16中,可以看出活细胞数随tsRNAEGFR/MET量的增加而减少(结晶紫染色)。BT549细胞转染tsRNA EGFR/MET(100pmol)或靶向EGFR的siRNA(100pmol)24小时。从细胞提取总RNA和蛋白质分别用于qRT-PCR(图17A和17B)和Western印迹(图17C和17D)。
实施例5:BCL2
tsRNA的生成如图4a所示。它是单链的并且具有以下序列(5′至3′):UAAGCCAGGGAUUGUGGGUUCG(SEQ ID NO.5)。Bcl-2蛋白家族在调节细胞凋亡(包括坏死和自噬)中起关键作用。Bcl-2家族的抗凋亡基因Bcl-2的过表达负责乳腺癌化疗耐药。MCF7是表达BCL2的乳腺癌细胞系。此处使用的tsRNA BCL2特异性靶向BCL2,tsRNA SPINT1用作对照。细胞转染tsRNA 24小时并收集用于RNA分离。相对RNA水平通过逆转录定量PCR(qRT-PCR)进行定量。靶向外显子的引物用于定量稳态mRNA水平。tsRNA BCL2转染至细胞中导致稳态BCL2 mRNA水平下调(图18)。
MCF7细胞转染增加量的tsRNA BCL224小时。提取总蛋白用于Western印迹,β-微管蛋白信号用作上样对照。裂解的半胱天冬酶-9信号被用作细胞正在经历凋亡的代表。如图19所示,BCL-2水平随转染的tsRNA BCL2量的增加而降低。裂解的半胱天冬酶-9遵循相反的模式-随tsRNA BCL2量的增加而增加,表明更多的细胞正在经历凋亡。MCF7细胞转染tsRNABCL2,并在第3天用光学显微镜成像。在转染tsRNA BCL2的细胞群中存在更多死细胞。如图20所示。
A549、MCF7和BT549细胞转染tsRNA BCL2,并在第8天进行结晶紫染色。如图21所示,在转染tsRNA BCL2的细胞群中存在较少活细胞。
实施例6:LINC00665
tsRNA的生成如图4a所示。它是单链的并且具有以下序列(5′至3′):GGGGGUGUAGCUCAGUGGUA(SEQ ID NO.6)。长非编码RNA(1ncRNA)在多种恶性肿瘤中经常失调,表明它们在肿瘤发生中具有潜在的致癌或肿瘤抑制作用。LINC00665在肺癌组织中明显上调并且可以作为预后不良的独立预测因子。功能测定表明,LINC00665在体外和体内增强肺癌细胞的增殖和转移。LINC00665通过十个已鉴定的核心基因(CDK1、BUB1B、BUB1、PLK1、CCNB2、CCNB1、CDC20、ESPL1、MAD2L1和CCNA2)调节细胞周期中的通路以促进癌症的发展和进展。A549是表达LINC00665的侵袭性肺癌细胞系。此处使用的tsRNA LINC00665靶向LINC00665,tsRNA SPINT1用作对照。
BT549细胞转染tsRNA LINC00665 24小时。提取RNA用于qRT-PCR。靶向外显子的引物用于定量稳态RNA水平。如图22所示,通过在BT549细胞中转染tsRNA LINC0665,LINC0665水平降低。
A549细胞转染tsRNA LINC00665 24小时。提取RNA用于qRT-PCR。靶向外显子的引物用于定量稳态RNA水平,而靶向内含子的引物用于定量新生RNA水平。如图23A和23B所示,通过在A549细胞中转染tsRNA LINC0665,稳态和新生的LINC0665水平均降低。如图24所示,A549细胞转染tsRNA LINC00665并在第3天用光学显微镜成像。在转染tsRNA LINC00665的细胞群中存在更多死细胞。
A549、MCR7和BT549细胞转染tsRNA LINC00665,并在第6天进行结晶紫染色。如图25所示,转染tsRNA LINC00665的细胞群中存在较少活细胞。A549细胞转染tsRNALINC0066524小时。在辐照后30min和90min的时间点提取总蛋白,并进行Western印迹。用作DNA损伤代表的γ-H2AX信号使用印迹成像仪进行定量,并归一化为β-微管蛋白水平。如预期,经辐照的细胞在辐照后30min显示出更高的γ-H2AX信号;然而,在90min时间点,转染ts20(即靶向LINC00665的tsRNA)的细胞未能如对照一样修复DNA损伤,这表明tsRNALINC00665正在影响参与DNA损伤反应的基因(如图26所示)。
A549、MCF7和BT549转染tsRNA LINC00665,24小时后以10Gy辐照,最后在第6天进行结晶紫染色。如图27A和27B所示,tsRNA LINC00665转染至MCR7和BT549细胞导致细胞死亡;当细胞受到γ射线辐照时,更多细胞发生死亡。然而,当tsRNA LINC00665的转染与γ射线辐照相结合时,这种效果被放大。
最后,A549、MCF7和BT549转染tsRNA BCL2,24小时后以10Gy辐照,最后在第6天进行结晶紫染色。如图28A和28B所示,将tsRNA BCL2转染至MCR7和BT549细胞中导致细胞死亡;当细胞受到γ射线辐照时,更多细胞发生死亡。然而,当tsRNA LINC00665的转染与γ射线辐照相结合时,这种效果被放大。
为了验证这种发夹样tRNA的二级结构预测,我们采用了tRNAArg-CCG-2-1和经过充分研究的发夹miRNA pre-let7a的体外转录。如预期,pre-let7a的转录产生单一条带。出人意料地,tRNAArg-CCG-2-1形成两条条带:一条对应于三叶草叶结构的次要条带和在非变性PAGE后接近pre-let7a对照位置的主要条带,表明该结构是发夹样的(图29a)。值得注意的是,体外RNA修饰酶的缺失可能导致明显的交替tRNA折叠,而体内修饰的tRNA可能优先折叠成三叶草结构,因此在我们的实验中检测到更多数量的发夹样tRNA。
为了检测Dicer是否将这种发夹样tRNA加工成小RNA,我们在体外转录tRNAArg -CCG-2-1、pre-let7a和snoRD38A,并将它们与纯化的Dicer-TAP一起孵育。我们表明,在存在Dicer-TAP的情况下,pre-let7a底物的水平随时间降低。有意思的是,在存在Dicer的情况下,发夹样tRNAArg-CCG-2-1底物水平降低,表明Dicer可能将发夹样tRNA加工成小RNA,而用作阴性对照的snoRNA snoRD38A水平没有变化(图29b)。然而,我们没有在SYBR金染色的凝胶上检测到sRNA,这可能是灵敏度问题所致。随后的Northern分析表明,tRNA水平的降低导致sRNA产生(图29c)。
我们随后对chrRNA-seq数据进行miRanda(Enright等人,2003)分析,并显示了tsRNA靶向蛋白编码基因的内含子以及非编码RNA。有意思的是,存在靶向初始内含子的偏好(图31a)。接下来,我们研究了wt HEK293细胞中靶基因的转录状态。我们比对了RNAP IIChIP-seq数据(GSE126751)、哺乳动物新生延伸转录(mNET-seq)数据(Mayer等人,2015)和chRNA-seq数据(GSE126751)。仔细检查所选靶基因RP4-639F20.1、SPINT1和GK的快照,发现存在RNAP II(ChIP-seq)以及RNAP II保护的新生转录信号(mNET-seq),但在wt细胞中仅有非常低水平的新生RNA。在Dicer和Ago2敲低中靶基因的新生RNA水平增加,但在Drosha敲低中未增加(图30a、32a和32b)。我们还显示了高转录的非靶基因GAPDH的组合快照。我们确实观察到在wt、Drosha、Dicer和Ago2敲低中GAPDH新生RNA水平的任何显著变化(图30b)。
我们假设如果tsRNA靶向新生RNA,它们应该可以在细胞核中检测到。为了检测tsRNA是否定位在细胞核中,我们在体外荧光标记了靶向EGFR基因的合成tsRNA和siRNA。瞬转后,我们在细胞核和细胞质中均检测到tsRNA,而siRNA仅定位于细胞质中(图33a)。接下来,我们在Northern印迹检测两种内源性tsRNA之后进行分级分离。我们再次从两个部分:细胞核和细胞质获得信号(图34a)。为了检测Ago2是否直接结合tsRNA,我们对Ago2进行免疫沉淀,然后使用Northern印迹检测tsRNA中的一种。事实上,我们在Ago2沉降(pull down)中检测到tsRNA信号,但在对照IgG沉降中未检测到(图34b)。
为了评估Ago2在该基因沉默途径中的切割活性,我们将带有FLAG标签的AGO2与合成tsRNA一起孵育,底物携带预期被tsRNA靶向的序列。如Northern印迹所示,全长底物在与Ago2及其靶向tsRNA孵育后不稳定,而在没有Ago2的情况下相同的全长底物保持完整(图35a)。
这些数据表明,通过以依赖于Ago2的方式切割新生RNA,tsRNA靶向特定基因的内含子区以便下调它们的表达。
为了进一步确证靶向内含子,我们合成了预测特异性靶向SPINT1的第二内含子的tsRNA序列。我们将合成的tsRNA转染到wt细胞中,并观察到SPINT1 pre-mRNA的新生水平降低。然而,合成tsRNA的转染并未降低成熟转录本的表达(图36a)。这可能是因为成熟转录本的水平在wt条件下非常低,进一步检测这种低水平的沉默可能很困难。然后将相同的合成tsRNA转染至wt和Dicer敲低细胞中,并使用qRT-PCR评估新生和成熟的SPINT1水平。我们发现在转染其靶向内含子的tsRNA后,在Dicer敲低后SPINT1的上调显著降低(图36b)。此外,我们检测了以单链或双链形式转染合成tsRNA是否重要。我们发现这两种形式均可以导致靶标的基因沉默,并且在大多数情况下,效果呈剂量依赖性(图36c和36d)。
应当理解,在不背离所附权利要求所限定的本发明范围的情况下,可以对上述方法进行多种修改。
参考文献
1.Schmittgen,T.D.&Livak,K.J.Analyzing real-time PCR data by thecomparative CT method.Nat.Protoc.3,1101-1108(2008).
2.Burger,K.&Gullerova,M.Nuclear re-localization of Dicer in primarymouse embryonic fibroblast nuclei following DNA damage.PLOS Genet.14,e1007151(2018).
3.Nojima,T.,Gomes,T.,Carmo-Fonseca,M.&Proudfoot,N.J.Mammalian NET-seqanalysis defines nascent RNA profiles and associated RNA processing genome-wide.Nat.Protoc.11,413-28(2016).
4.White,E.,Schlackow,M.,Kamieniarz-Gdula,K.,Proudfoot,N.J.&Gullerova,M.Human nuclear Dicer restricts the deleterious accumulation of endogenousdouble-stranded RNA.Nat Struct Mol Biol 21,552-559(2014).
5.Martin,M.Cutadapt removes adapter sequences from high-throughputsequencing reads.EMBnet.journal 17,10(2011).
6.Andrews,S.FastQC:a quality control tool for high throughputsequence data.
7.Oler,A.J.et al.Human RNA polymerase III transcriptomes andrelationships to Pol II promoter chromatin and enhancer-bindingfactors.Nat.Struct.Mol.Biol.17,620-8
8.ENCODE Project Consortium.An integrated encyclopedia of DNAelements in the human genome.Nature 489,57-74(2012).
9.Langmead,B.&Salzberg,S.L.Fast gapped-read alignment with Bowtie2.Nat.Methods 9,357-9(2012).
10.Li,H.et al.The Sequence Alignment/Map format andSAMtools.Bioinformatics 25,2078-2079(2009).
11.Quinlan,A.R.&Hall,I.M.BEDTools:a flexible suite of utilities forcomparing genomic features.Bioinformatics 26,841-2(2010).
12.Zhang,Y.et al.Model-based Analysis of ChIP-Seq(MACS).GenomeBiol.9,R137(2008).
13.Kent,W.J.et al.The human genome browser at UCSC.Genome Res.12,996-1006(2002).
14.Langmead,B.,Trapnell,C.,Pop,M.&Salzberg,S.L.Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.GenomeBiol.10,R25(2009).
15.Hafner,M.et al.Transcriptome-wide Identification of RNA-BindingProtein and MicroRNA Target Sites by PAR-CLIP.Cell 141,129-141(2010).
16.Rybak-Wolf,A.et al.A variety of dicer substrates in human andC.elegans.Cell 159,1153-1167(2014).
17.Zerbino,D.R.et al.Ensembl 2018.Nucleic Acids Res.46,D754-D761(2018).
18.Bray,N.L.,Pimentel,H.,Melsted,P.&Pachter,L.Near-optimalprobabilistic RNA-seq quantification.Nat.Biotechnol.34,525-527(2016).
19.Love,M.I.,Huber,W.&Anders,S.Moderated estimation of fold changeand dispersion for RNA-seq data with DESeq2.Genome Biol.15,550(2014).
20.Enright,A.J.et al.MicroRNA targets in Drosophila.Genome Biol.5,R1(2003).
21.
Figure BDA0003369651820000381
J.et al.DisGeNET:A comprehensive platform integratinginformation on human disease-associated genes and variants.Nucleic AcidsRes.45,D833-D839(2017).
22.Smedley,D.et al.The BioMart community portal:an innovativealternative to large,centralized data repositories.Nucleic Acids Res.43,W589-98(2015).
23.R Core Team.R:A Language and Environment for StatisticalComputing.(2016).
24.Kolde,R.pheatmap:Pretty Heatmaps.
25.Zuker,M.Mfold web server for nucleic acid folding andhybridization prediction.Nucleic Acids Res.31,3406-15(2003).
Figure IDA0003369651900000011
Figure IDA0003369651900000021

Claims (46)

1.一种分离的tRNA衍生的多核苷酸,包含与靶基因的内含子区或长非编码RNA的内含子区互补的序列,其中所述tRNA衍生的多核苷酸是具有14至35个核苷酸的tRNA衍生的多核苷酸片段(tsRNA)。
2.根据权利要求1所述的分离的tRNA衍生的多核苷酸,其中所述tsRNA是双链的或单链的。
3.根据权利要求2所述的分离的tRNA衍生的多核苷酸,其中双链tsRNA是平末端的。
4.根据权利要求3所述的分离的tRNA衍生的多核苷酸,其中所述双链tsRNA包含突出端。
5.根据前述权利要求中任一项所述的分离的tRNA衍生的多核苷酸,其中所述tRNA衍生的多核苷酸经化学修饰。
6.根据权利要求1所述的分离的tRNA衍生的多核苷酸,其中所述多核苷酸是tRNA。
7.根据权利要求6所述的分离的tRNA衍生的多核苷酸,其中所述tRNA包含茎-环/发夹结构。
8.根据前述权利要求中任一项所述的分离的tRNA衍生的多核苷酸,其中所述多核苷酸结合靶基因的mRNA的内含子区,从而抑制基因表达。
9.根据前述权利要求中任一项所述的分离的tRNA衍生的多核苷酸,其中所述多核苷酸包含与所述靶基因的内含子区至少50、60、70、80、90或95%互补的序列。
10.根据前述权利要求中任一项所述的分离的tRNA衍生的多核苷酸,其中所述靶基因与病理状况相关。
11.根据权利要求10所述的分离的tRNA衍生的多核苷酸,其中所述病理状况选自癌症、自身免疫性疾病、神经退行性疾病、代谢疾病、呼吸疾病和心血管疾病。
12.根据前述权利要求中任一项所述的分离的tRNA衍生的多核苷酸,其中所述tRNA和所述tsRNA位于细胞核中。
13.一种载体,包含根据权利要求1至12中任一项所述的分离的tRNA片段。
14.一种宿主细胞,包含根据权利要求1至12中任一项所述的分离的tRNA片段或权利要求13的载体。
15.一种抑制生物系统中靶基因表达或长非编码RNA表达的方法,所述方法包括:
将根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸或根据权利要求13的载体引入所述生物系统中。
16.根据权利要求15所述的方法,其中所述生物系统选自真核细胞,例如哺乳动物细胞或植物细胞。
17.根据权利要求15或16所述的方法,其中所述方法进一步包括将酶引入所述生物系统中,其切割tRNA以产生tsRNA。
18.根据权利要求17所述的方法,其中所述酶是Dicer。
19.根据前述权利要求15至18中任一项所述的方法,其中所述方法进一步包括将所述tRNA衍生的多核苷酸引入细胞的细胞核中。
20.根据权利要求15至19中任一项所述的方法,其中所述方法进一步包括将酶引入所述生物系统中,其将所述tRNA衍生的多核苷酸转运至细胞核。
21.根据权利要求20所述的方法,其中所述酶包含Argonaute2(Ago2)。
22.根据权利要求15至21中任一项所述的方法,其中所述方法是体外方法或离体方法。
23.一种药物组合物,包含根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸,或载体,例如根据权利要求13所述的载体,或用于已用tsRNA调节的改良细胞疗法的载体,以及药学上可接受的运载体。
24.根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸或根据权利要求23所述的药物组合物,其用作药物。
25.根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸或根据权利要求23所述的药物组合物,其用于治疗可以通过抑制所述靶基因表达而改善的疾病。
26.根据权利要求24或25所述使用的tRNA衍生的多核苷酸或药物组合物,其中所述疾病选自癌症、自身免疫性疾病、神经退行性疾病、代谢疾病、呼吸疾病和心血管疾病。
27.根据权利要求27所述使用的tRNA衍生的多核苷酸或药物组合物,其中所述疾病选自癌症并且所述tRNA衍生的多核苷酸与第二疗法例如抗癌疗法一起施用。
28.一种治疗癌症、自身免疫性疾病、神经退行性疾病、代谢疾病、呼吸疾病和心血管疾病的方法,其包括向有需要的受试者施用有效量的根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸或根据权利要求23所述的药物组合物。
29.根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸用于抑制生物系统中基因表达或长非编码RNA表达的用途。
30.根据权利要求29所述的用途,其中所述用途在体外或离体进行。
31.一种试剂盒,其包含根据权利要求1至12任一项所述的tRNA衍生的多核苷酸或根据权利要求23所述的药物组合物。
32.一种鉴定介导靶基因的RNA干扰的tsRNA片段的方法,所述方法包括
a)提供样品;
b)从所述样品分离具有约14至35个核苷酸的tsRNA片段;
c)表征所述tsRNA片段以确定与所述靶基因的序列同一性或相似性以及;
d)鉴定包含与靶基因的内含子区互补的序列的tsRNA片段。
33.一种通过权利要求32的方法获得或可获得的介导RNA干扰的tsRNA片段。
34.用于产生介导RNA干扰的tsRNA片段的方法,包括鉴定根据权利要求32所述的tsRNA片段。
35.一种联合疗法,包括施用根据权利要求1至12中任一项所述的tsRNA衍生的多核苷酸和另一疗法,例如抗癌疗法。
36.根据权利要求35所述的联合疗法,其中所述抗癌疗法是放疗或化疗。
37.一种介导靶标特异性RNA干扰的方法,所述方法包括:
将根据权利要求1至12中任一项所述的tRNA衍生的多核苷酸引入生物系统中。
38.一种检测疾病的方法,所述方法包括;
a)检测tRNA衍生的tsRNA片段的存在,所述tRNA衍生的tsRNA片段具有14至35个核苷酸并且与样品中靶基因的内含子区或长非编码RNA的内含子区互补;
b)定量所述样品中存在的所述tsRNA的量;
c)将所述样品中存在的所述tsRNA的量与参考值进行比较以及;
d)评估所述疾病的存在或不存在。
39.根据权利要求38所述的方法,其中所述参考是健康细胞或患病细胞中tsRNA的量。
40.根据权利要求38或39所述的方法,其中病症选自癌症、自身免疫性疾病、神经退行性疾病、代谢疾病、呼吸疾病和心血管疾病。
41.根据权利要求38至40中任一项所述的方法,其中分离的tsRNA通过RT-PCR定量。
42.根据权利要求38至40中任一项所述的方法,其中所述样品是血液样品、组织样品、外泌体、尿液、唾液或CSF。
43.根据权利要求所述的方法,其中所述方法在体外或离体进行。
44.一种用于生成候选tRNA衍生的多核苷酸的计算机实施的方法,所述候选tRNA衍生的多核苷酸包含与靶基因的内含子区互补的序列,根据权利要求1或2所述,并且能够抑制所述靶基因的基因表达,所述方法包括:
a)确定衍生所述多核苷酸的tRNA的固有特征;
b)确定靶基因的内含子区内结合位点的固有特征,所述tRNA衍生的多核苷酸与所述结合位点结合;
c)生成包含已知tRNA衍生的多核苷酸和结合位点的数据集;
d)使用所述数据集定义训练数据集,以鉴定结构,核苷酸含量,在内含子内的位置,一级、二级或三级结构,或基因靶标的任何模式;
e)使用所述训练数据集筛选基因组序列以鉴定所述靶基因的内含子区内的候选结合位点以及;
f)使用输出生成候选tRNA衍生的多核苷酸,所述候选tRNA衍生的多核苷酸包含与所述靶基因的内含子区互补的序列。
45.根据权利要求44所述的方法,其中所述固有特征包括序列、二级结构和/或在所述基因组内的位置。
46.一种用于鉴定真核生物基因组中一个或多个独特的tRNA衍生的多核苷酸序列的计算机系统,所述系统包含:
I.存储单元,用于接收和/或存储基因组的序列信息;和
II.一个或多个单独或组合的处理器,其被编程以执行根据权利要求44或45所述的方法。
CN202080038339.4A 2019-05-24 2020-05-22 基因沉默的中介体 Pending CN113924366A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1907380.8A GB201907380D0 (en) 2019-05-24 2019-05-24 Mediators of gene silencing
GB1907380.8 2019-05-24
PCT/GB2020/051257 WO2020240162A1 (en) 2019-05-24 2020-05-22 Mediators of gene silencing

Publications (1)

Publication Number Publication Date
CN113924366A true CN113924366A (zh) 2022-01-11

Family

ID=66867557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080038339.4A Pending CN113924366A (zh) 2019-05-24 2020-05-22 基因沉默的中介体

Country Status (9)

Country Link
US (1) US20220220476A1 (zh)
EP (1) EP3976784A1 (zh)
JP (1) JP2022533236A (zh)
CN (1) CN113924366A (zh)
AU (1) AU2020284492A1 (zh)
BR (1) BR112021023519A2 (zh)
CA (1) CA3140501A1 (zh)
GB (1) GB201907380D0 (zh)
WO (1) WO2020240162A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114836538A (zh) * 2022-04-14 2022-08-02 南昌大学第一附属医院 生物标志物在hbv相关肝癌诊断及预后中的应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB202018570D0 (en) * 2020-11-25 2021-01-06 Cancer Research Tech Ltd Mediators of gene silencing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012006551A2 (en) * 2010-07-08 2012-01-12 The Brigham And Women's Hospital, Inc. Neuroprotective molecules and methods of treating neurological disorders and inducing stress granules
US20160024575A1 (en) * 2013-05-02 2016-01-28 The Regents Of The University Of California Circulating small noncoding rna markers
WO2016069641A1 (en) * 2014-10-28 2016-05-06 Thomas Jefferson University COMPOSITIONS AND METHODS OF USING TRANSFER RNAS (tRNAs)
WO2018204412A1 (en) * 2017-05-01 2018-11-08 Thomas Jefferson University Systems-level analysis of tcga cancers reveals disease trna fragmentation patterns and associations with messenger rnas and repeat

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050203047A1 (en) * 2004-03-10 2005-09-15 Ulrich Thomann Delivery vectors for short interfering RNA, micro-RNA and antisense RNA
WO2012018881A2 (en) * 2010-08-03 2012-02-09 Alnylam Pharmaceuticals, Inc. Methods and compositions for the regulation of rna
US11655470B2 (en) * 2016-07-05 2023-05-23 The Usa, As Represented By The Secretary, Dept. Of Health And Human Services Diagnosing COL6-related disorders and methods for treating same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012006551A2 (en) * 2010-07-08 2012-01-12 The Brigham And Women's Hospital, Inc. Neuroprotective molecules and methods of treating neurological disorders and inducing stress granules
US20160024575A1 (en) * 2013-05-02 2016-01-28 The Regents Of The University Of California Circulating small noncoding rna markers
WO2016069641A1 (en) * 2014-10-28 2016-05-06 Thomas Jefferson University COMPOSITIONS AND METHODS OF USING TRANSFER RNAS (tRNAs)
WO2018204412A1 (en) * 2017-05-01 2018-11-08 Thomas Jefferson University Systems-level analysis of tcga cancers reveals disease trna fragmentation patterns and associations with messenger rnas and repeat

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SPYROS KARAISKOS等: "Age-driven modulation of tRNA-derived fragments in Drosophila and their potential targets", BIOL DIRECT, pages 1 - 3 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114836538A (zh) * 2022-04-14 2022-08-02 南昌大学第一附属医院 生物标志物在hbv相关肝癌诊断及预后中的应用

Also Published As

Publication number Publication date
JP2022533236A (ja) 2022-07-21
CA3140501A1 (en) 2020-12-03
US20220220476A1 (en) 2022-07-14
EP3976784A1 (en) 2022-04-06
WO2020240162A1 (en) 2020-12-03
GB201907380D0 (en) 2019-07-10
AU2020284492A1 (en) 2021-12-23
BR112021023519A2 (pt) 2022-01-25

Similar Documents

Publication Publication Date Title
Cao et al. LAST, a c-Myc-inducible long noncoding RNA, cooperates with CNBP to promote CCND1 mRNA stability in human cells
Wu et al. Regulation of laryngeal squamous cell cancer progression by the lncRNA H19/miR-148a-3p/DNMT1 axis
Cheray et al. Cytosine methylation of mature microRNAs inhibits their functions and is associated with poor prognosis in glioblastoma multiforme
Li et al. Functional roles of enhancer RNAs for oestrogen-dependent transcriptional activation
Hu et al. Insertion of an Alu element in a lncRNA leads to primate-specific modulation of alternative splicing
Haas et al. Alterations in cardiac DNA methylation in human dilated cardiomyopathy
Zhang et al. MicroRNA-128 inhibits glioma cells proliferation by targeting transcription factor E2F3a
Keniry et al. The H19 lincRNA is a developmental reservoir of miR-675 that suppresses growth and Igf1r
Di Fazio et al. Dicer dependent tRNA derived small RNAs promote nascent RNA silencing
Liang et al. 3′-Terminal 2′-O-methylation of lung cancer miR-21-5p enhances its stability and association with Argonaute 2
US20110263687A1 (en) Rna molecules and uses thereof
CN108285905B (zh) 一种基于CRISPR-Cas13a的抑制真核细胞中基因表达水平的方法及其应用
D’Angelo et al. RPSAP52 lncRNA inhibits p21Waf1/CIP expression by interacting with the RNA binding protein HuR
Attema et al. Identification of an enhancer that increases miR-200b~ 200a~ 429 gene expression in breast cancer cells
Saraiya et al. The microRNAs in an ancient protist repress the variant-specific surface protein expression by targeting the entire coding sequence
US20220220476A1 (en) Mediators of gene silencing
Liu et al. Discovery of porcine mi RNA‐196a/b may influence porcine adipogenesis in longissimus dorsi muscle by mi RNA sequencing
Dang et al. Antisense transcription licenses nascent transcripts to mediate transcriptional gene silencing
Ma et al. Hypermethylation‐mediated down‐regulation of lncRNA TBX5‐AS1: 2 in Tetralogy of Fallot inhibits cell proliferation by reducing TBX5 expression
Zhu et al. RNA methyltransferase BCDIN3D is crucial for female fertility and miRNA and mRNA profiles in Drosophila ovaries
US20240011037A1 (en) Mediators of gene silencing
Dunn-Davies et al. Systematic mapping of small nucleolar RNA targets in human cells
Hu et al. Global view of dynamic expression and precise mapping of mitochondrial tRNAs-derived fragments during stressed conditions in S. pombe
CN115666590A (zh) 口腔鳞癌相关生物标志物及诊断和治疗方法
CN111560437A (zh) 用于预测口腔鳞癌的生物标志物及其在治疗中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination