TW202345862A - 利用重組環狀rna改善蛋白質轉譯的組合物及方法 - Google Patents

利用重組環狀rna改善蛋白質轉譯的組合物及方法

Info

Publication number
TW202345862A
TW202345862A TW112110067A TW112110067A TW202345862A TW 202345862 A TW202345862 A TW 202345862A TW 112110067 A TW112110067 A TW 112110067A TW 112110067 A TW112110067 A TW 112110067A TW 202345862 A TW202345862 A TW 202345862A
Authority
TW
Taiwan
Prior art keywords
ires
ihrv
circrna
protein
rna
Prior art date
Application number
TW112110067A
Other languages
English (en)
Inventor
羅伯特 陳
尚恩 王
蘿拉 阿瑪亞
霍爾Y 張
Original Assignee
李蘭史丹佛學院理事會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 李蘭史丹佛學院理事會 filed Critical 李蘭史丹佛學院理事會
Publication of TW202345862A publication Critical patent/TW202345862A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/39Medicinal preparations containing antigens or antibodies characterised by the immunostimulating additives, e.g. chemical adjuvants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/54Medicinal preparations containing antigens or antibodies characterised by the route of administration
    • A61K2039/541Mucosal route
    • A61K2039/543Mucosal route intranasal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55561CpG containing adjuvants; Oligonucleotide containing adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/532Closed or circular
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/60Vector systems having a special element relevant for transcription from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本揭露內容係有關利用重組環狀RNA改善蛋白質轉譯的組合物及方法。具體而言,本文提供用於遞送重組環狀RNA(circRNA)分子及包含病毒及/或合成內部核糖體進入位點(IRES)之circRNA的製劑,以及其使用方法。

Description

利用重組環狀RNA改善蛋白質轉譯的組合物及方法
本揭露內容係有關利用重組環狀RNA改善蛋白質轉譯的組合物及方法。具體而言,本文提供用於遞送重組環狀RNA(circRNA)分子及包含病毒及/或合成內部核糖體進入位點(IRES)之circRNA的製劑,以及其使用方法。 關於聯邦政府資助研究的聲明
本發明是在美國國家衛生院給予的合約CA209919及合約編號5T32GM008412的政府支持下所完成。政府對本發明享有一定權利。 序列表
與此一起提交的題為「STDU2-40616-905_SQL」的電腦可讀序列表的檔案在2023年3月16日創建,文件大小為33,377,290位元組,其在此藉由引用整體併入。
環狀RNA(circRNA)為一種不同於線性RNA的單股RNA,其包含共價閉合的連續環。circRNA天然存在於哺乳動物細胞中,並在各種生物過程中扮演重要角色。circRNA相較mRNA天生具有更高的穩定性及對細胞內及細胞外核糖核酸酶的抗性,這使得其在需要長期表現的情況下成為遞送關鍵有效負載的有吸引力的候選物。
最近,人們對使用重組circRNA在活體外或活體內表現目的蛋白質感到興趣。使內部核糖體進入序列(IRES)引入環狀RNA,能讓由circRNA編碼的蛋白質被轉譯。然而,天然存在的IRES元件可能支持也可能不支持經改造環狀RNA的轉譯,這是因為IRES元件通常是在線性RNA基因體的背景下演化的緣故。
因此,本發明所屬技術領域需要鑑定能夠從重組circRNA驅動蛋白質轉譯的IRES元件。另外,存在對經改造IRES元件的需求,該元件改善從circRNA表現蛋白質的量及/或持續時間,以及在活體外或活體內將circRNA遞送至細胞的方法。
本申請要求在2022年3月17日提交的美國臨時專利申請案第63/320,952號、在2022年6月17日提交的美國臨時專利申請案第63/353,110號、在2023年3月6日提交的美國臨時專利申請案第63/450,272號、在2022年11月8日提交的美國臨時專利申請案第63/423,641號,以及在2023年3月2日提交的美國臨時專利申請案第63/449,409號的優先權,該等臨時申請案的全部內容藉由引用併入本文以用於所有目的。
本揭露內容係有關利用重組環狀RNA改善蛋白質轉譯的組合物及方法。具體而言,本文提供用於遞送重組環狀RNA(circRNA)分子及包含病毒及/或合成內部核糖體進入位點(IRES)之circRNA的製劑,以及其使用方法。
本文提供一種組合物,其包含:電荷可變可釋放轉運體系統(CART)與包含蛋白質編碼序列之環狀RNA分子的複合物。在一些具體實施例中,蛋白質編碼序列可操作地連接到內部核糖體進入位點(IRES)序列。在一些具體實施例中,IRES序列為病毒序列;且其中蛋白質編碼序列編碼非病毒蛋白質。
在一些具體實施例中,本文提供一種在受試者中誘導免疫的方法,其包含對受試者投予一組合物,該組合物包含:電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物,以便組合物在受試者中誘導免疫。在一些具體實施例中,環狀RNA分子包含蛋白質編碼序列(例如,抗原或治療性蛋白質)。在一些具體實施例中,組合物進一步包含抗原。在一些具體實施例中,免疫為先天免疫或抗原專一性T細胞反應。
也提供一種使受試者免疫的方法,其包含對受試者投予一組合物,該組合物包含:a)電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物;以及b)針對受試者之抗原,以使受試者對抗原免疫。
進一步提供一種治療受試者之癌症的方法,其包含投予一組合物,該組合物包含:a)電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物;以及b)抗原。在一些具體實施例中,抗原為腫瘤抗原。在一些具體實施例中,該投予在受試者中誘導基於抗原專一性T細胞的細胞免疫。
在一些具體實施例中,該投予可治療或預防受試者的疾病或病症(例如,癌症)。在一些具體實施例中,該遞送方式為腹腔注射、鼻內注射、或靜脈注射。在一些具體實施例中,受試者為人類或非人類動物。
在一些具體實施例中,環狀RNA由載體合成,該載體包含自我剪接內含子、5’ PABP間隔子、HBA1 3’ UTR、及內部核糖體進入位點(IRES)序列。
在一些具體實施例中,CART為油基(O)與壬烯基取代(N)的碳酸鹽單體的1:1混合物,隨後為α-胺基酯單體(A)嵌段。例如,6個壬烯基與6個油基碳酸鹽單元及9個陽離子胺基酯單元的嵌段長度。
在一些具體實施例中,環狀RNA與CART以1:10的電荷比複合。在一些具體實施例中,CART將該環狀RNA引導到免疫細胞。在一些具體實施例中,組合物為醫藥組合物。
也提供一種組合物,其包含:環狀RNA分子,其包含可操作地連接到蛋白質編碼序列的內部核糖體進入位點(IRES)序列、5’ UTR、及3’ UTR;其中IRES序列為病毒序列;且其中蛋白質編碼序列編碼非病毒蛋白質。
在一些具體實施例中,5’ UTR為ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUGUCG (SEQ ID NO: 33143) 或AGCGUAACCUCCAUCCGAGUUGCAAGAGAGGGAAACGCAGUCUC,且3’ UTR為β-球蛋白3’ UTR或截斷的β-球蛋白3’ UTR。
進一步提供一種組合物,其包含:環狀RNA分子,其包含可操作地連接到蛋白質編碼序列的內部核糖體進入位點(IRES)序列,其中該IRES序列包含針對該IRES的結構域之間的非鹼基配對之連接子區的鎖核酸(LNA);其中IRES序列為病毒序列;以及 其中蛋白質編碼序列編碼非病毒蛋白質。在一些具體實施例中,IRES為iCVB3,且該LNA針對iCVB3結構域I與II之間的非鹼基配對的連接子區。
另外提供一種組合物,其包含:環狀RNA分子,其包含iHRV-B3內部核糖體進入位點(IRES)序列、5’ UTR、及3’ UTR;可操作地連接到蛋白質編碼序列,其中該環狀RNA包含5% m 6A。
在一些具體實施例中,非病毒蛋白質為哺乳動物蛋白質。在一些 具體實施例中,非病毒蛋白質為人類蛋白質。
在一些具體實施例中,IRES為第1型IRES。在一些具體實施例中,IRES為腸病毒IRES。在一些具體實施例中,IRES為人類鼻病毒(HRV)IRES。
在一些具體實施例中,IRES為表7中列出的任一個IRES。在一些具體實施例中,IRES為下列IRES中的任一個:iEMCV、iHCV、iCVB5、iSwineVesicular、iHRV-A2、iHRV-C3、iHRV-C11、iCVB1、iPV2、iHRV-B17、iEchoV-E15、iEV71、iHRV-A9、iSiminanV4、iEV-D94、iSimianA5、iPV3、iHRV-C54、iHRV-A100、iHRV-B37、iHRV-B4、iHRV-B92、iHRV-B3、iHRV-A1、iEV107、或其片段或衍生物。在一些具體實施例中,IRES為下列IRES中的任一個:iEV-B83、iHRV-A57、iHRV-B35、iHRV-B4、iEV-D68、iHRVB_R93、iHRV-B5、iHRVB-B52、iHRVB-B93、iHRV-B84、iHRV-B83_SC2220、iHRV-B72、iHRV-B69、iHRVB_SC0739、iHRV-B91、iHRV-B42、iHRV-B6、iHRV-B83、iHRV-B48、iHRV-B99、iHRV-B79、iHRV-B97、iHRV-B27、iHRVB_3039、iHRVB-B14、iCosV-B1、或其片段或衍生物。在一些具體實施例中,IRES為iCVB3、或其片段或衍生物。在一些具體實施例中,IRES為iHRV-B3、或其片段或衍生物。
在一些具體實施例中,IRIS為合成IRES序列,其包含適體及第二適體。
在一些具體實施例中,適體為野生型適體。在一些具體實施例中,適體為經設計及/或進化以結合一或多個DNA序列的適體。在一些具體實施例中,適體為突變型適體。在一些具體實施例中,適體經修飾以具有延伸的幹區。
在一些具體實施例中,適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。在一些具體實施例中,適體不中斷IRES的天然eIF4G結合位點,且不中斷IRES內的天然GRNA四環。
在一些具體實施例中,適體為eIF4G結合適體。在一些具體實施例中,eIF4G結合適體包含SEQ ID NO: 33143的序列或由其編碼。在一些具體實施例中,IRES為第1型IRES。在一些具體實施例中,IRES為經修飾的腸病毒IRES。在一些具體實施例中,IRES為經修飾的人類鼻病毒(HRV)IRES。在一些具體實施例中,IRES包含SEQ ID NO: 33169-33173中任一個的序列或由其編碼。
在一些具體實施例中,合成IRES序列為經修飾的iCVB3 IRES。在一些具體實施例中,經修飾的iCVB3 IRES包含插入其結構域I、II、III、IV、V、VI或VII中的適體。在一些具體實施例中,經修飾的iCVB3 IRES包含插入其結構域IV中的適體。在一些具體實施例中,經修飾的iCVB3適體經修飾以具有延伸的幹區。在一些具體實施例中,經修飾的iCVB3適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。在一些具體實施例中,經修飾的iCVB3適體不中斷IRES的天然eIF4G結合位點,且不中斷IRES內的天然GRNA四環。
在一些具體實施例中,合成IRES序列為經修飾的iHRV-B3 IRES。在一些具體實施例中,經修飾的iHRV-B3 IRES包含插入其結構域I、II、III、IV、V或VI中的適體。在一些具體實施例中,經修飾的iHRV-B3 IRES包含插入其結構域IV中的適體。在一些具體實施例中,經修飾的iHRV-B3 IRES適體經修飾以具有延伸的幹區。在一些具體實施例中,經修飾的iHRV-B3 IRES適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。在一些具體實施例中,經修飾的iHRV-B3適體不中斷IRES的天然eIF4G結合位點,且不中斷IRES內的天然GRNA四環。
在一些具體實施例中,環狀RNA包含至少一個2-硫尿苷(2ThioU)或至少一個2′-O-甲基胞苷(2OMeC)。
也提供一種核酸,其編碼一或多個本文所述的環狀RNA分子。
也提供一種組合物,其包含一或多個本文所述的環狀RNA分子及/或核酸。
也提供一種宿主細胞,其包含一或多個本文所述的環狀RNA分子及/或核酸。
也提供一種在細胞中生產蛋白質之方法,該方法包含在一定條件下使細胞與本文所述的環狀RNA分子或核酸接觸,由此環狀RNA的蛋白質編碼核酸序列被轉譯且蛋白質在細胞中生產。
也提供一種在活體外生產蛋白質之方法,該方法包含在一定條件下使無細胞萃取物與環狀RNA分子或核酸接觸,由此環狀RNA的蛋白質編碼核酸序列被轉譯且蛋白質被生產。
進一步提供一種將蛋白質遞送到受試者的方法,其包含:對受試者投予本文所述的組合物。在一些具體實施例中,該蛋白質為治療性蛋白質。在一些具體實施例中,該投予治療或預防受試者的疾病或病症。在一些具體實施例中,該遞送方式為腹腔注射或靜脈注射。在一些具體實施例中,受試者為人類或非人類動物。
這些及其他具體實施例將在下文及附圖中進一步詳細描述。
真核細胞中的蛋白質轉譯通常依靠存在於mRNA的5’末端處的m 7G端帽。然而,已鑑定若干端帽非依賴型的轉譯機轉。例如,一些病毒mRNA採用基於經由內部核糖體進入序列(IRES)的內部核糖體進入的轉譯起始的替代機轉。與端帽依賴型(mRNA轉譯)相比,蛋白質的端帽依賴型轉譯通常遭受較低的轉譯強度。
本文提供病毒及合成IRES,其能夠驅動從環狀RNA表現蛋白質(例如,非病毒蛋白質),以及包含此類 IRES的circRNA的優化。本文所述的病毒及合成IRES滿足端帽非依賴型的轉譯領域中未滿足的需求。經鑑定的IRES也可用於多順反子mRNA基因遞送。因為本文所述IRES以寬範圍的強度驅動表現且一些以細胞類型依賴型方式驅動表現,因此IRES的選擇可用於獨立控制單一轉錄物中兩個或多個蛋白的表現程度。這種表現程度的可調性提供比僅僅劑量程度更多的額外控制層。
本文進一步提供circRNA遞送到細胞(例如,活體外或活體內)的方法及其研究、篩選及臨床用途。 定義
為了便於理解本技術,以下定義多個術語及詞組。在整個詳細描 述中闡述其他定義。
在描述本發明的上下文中(特別是在所附申請專利範圍的上下文中),除非本文另外指出或與上下文明顯矛盾,否則「一(a)」與「一個(an)」、「該(the)」及「至少一個(at least one)」等詞以及類似指涉對象的使用應解釋為涵蓋單數及複數兩種態樣。
除非本文另外指出或與上下文明顯矛盾,否則「至少一個」乙詞後接一或多個項目的列表(例如「A及B中的至少一個」)的使用應理解為是指選自所列項目(A或B)中的一個項目或所列項目(A及B)中的兩個或多個的任何組合。
除非本文另外指出,否則本文中數值範圍的列舉僅意欲用作分別提及落入該範圍內的每個單獨值的簡寫方法,且每個單獨值都被併入說明書中,如同其在本文中被單獨記述一般。
除非本文另外指出或與上下文明顯矛盾,否則本文描述的所有方法可用任何順序執行。除非另外要求,否則本文提供的任何及所有實施例或示例性語言(例如,「諸如」)的使用僅意欲更好地闡明本發明,且不對本發明的範圍構成限制。說明書中的語言都不應解釋為指示任何非所請要素對於本發明的實施是必要的。
本文所用的核苷酸、核酸、核苷及胺基酸的命名法與國際純化學和應用化學聯合會(IUPAC)標準一致(請參見例如bioinformatics.org/sms/iupac.html)。
當提及核酸序列或蛋白質序列時,「一致性」乙詞用於表示兩個序列之間的相似性。序列相似性或一致性可使用本發明所屬技術領域已知的標準技術確定,包括但不限於以下:Smith & Waterman,Adv. Appl. Math. 2,482 (1981)的局部序列一致性算法;Needleman & Wunsch,J Mol. Biol. 48,443(1970)的序列一致性比對算法;Pearson & Lipman,Proc. Natl. Acad. Sci. USA 85,2444(1988)的相似性搜尋方法;這些算法的計算機實現(Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Drive,Madison,WI中的GAP、BESTFIT、FASTA及TFASTA);Devereux等人,Nucl. Acid Res. 12,387-395 (1984)描述的Best Fit序列程式;或藉由檢查。另一個算法為BLAST算法,其描述於Altschul等人,J Mol. Biol. 215,403-410,(1990)及Karlin等人,Proc. Natl. Acad. Sci. USA 90,5873-5787 (1993)。一個特別有用的BLAST程式為WU-BLAST-2程式,其獲自Altschul等人,Methods in Enzymology,266,460-480 (1996);blast.wustl/edu/blast/README.html。WU-BLAST-2使用若干搜尋參數,其可任選地被設定為預設值。參數為動態值,且由程式本身根據特定序列的組成及特定數據庫的組成來建立,其中針對所述特定數據庫搜尋目的序列;然而,可調整這些值以增加靈敏度。另外,另一個有用的算法為gapped BLAST,如Altschul等人,(1997) Nucleic Acids Res. 25,3389-3402所報導。除非本文另外指出,否則百分比一致性在本文中使用以下網址中可用的算法來測定:blast.ncbi.nlm.nih.gov/Blast.cgi。
「內部核糖體進入位點」、「內部核糖體進入序列」、「IRES」及「IRES序列區」等詞在本文中可互換使用,且關於繞過典型真核細胞端帽依賴型轉譯起始步驟的病毒或人類細胞RNA(例如,信使RNA(mRNA)及/或circRNA)的順式元件。絕大多數真核mRNA使用的典型端帽依賴型機轉需要在mRNA的5’末端的m 7G端帽、起始子Met-tRNA met、數十個起始因子蛋白質、定向掃描、及GTP水解,以使有轉譯能力的核糖體置於起始密碼子處。IRES通常由長且高度結構化的5’-UTR所組成,其媒介轉譯起始複合物結合並催化功能性核糖體的形成。
「適體」為可選擇性地結合特定標靶的短的單鏈DNA或RNA分子。標靶可為例如蛋白質、肽、碳水化合物、小分子、毒素或活細胞。一些適體可結合DNA、RNA、自身適體或其他非自身適體。適體由於其傾向形成螺旋及單股環而呈現出多種形狀。示例性DNA及RNA適體列於適體數據庫(scicrunch.org/resources/Any/record/nlx_144509-1/SCR_001781/resolver?q=*&l=)中。
當提及核酸序列時,「編碼序列」、「編碼序列區」、「編碼區」及「CDS」等詞可用於指部分的DNA或RNA序列,例如被轉譯或可能被轉譯成蛋白質的部件。「閱讀框架」、「開放閱讀框架」及「ORF」等詞可在本文中用於指以起始密碼子(例如,ATG)開始,且在一些具體實施例中以終止密碼子(例如,TAA、TAG或TGA)結束的核苷酸序列。開放閱讀框架可含有內含子及外顯子,且因此所有CDS都是ORF,但並非所有ORF都是CDS。
「互補地」及「互補性」等詞係有關具有藉由傳統的華生克立克鹼基配對或其他非傳統類型的配對彼此形成氫鍵的能力的兩個核酸序列或核酸單體之間的關係。兩個核酸序列之間的互補性程度可藉由核酸序列中可與第二個核酸序列形成氫鍵(例如,華生克立克鹼基配對)的核苷酸的百分比(例如,約50%、約60%、約70%、約80%、約90%及100%互補)來指示。若核酸序列的所有連續核苷酸將與第二個核酸序列中相同數目的連續核苷酸形成氫鍵,則兩個核酸序列為「完全互補的」。若兩個核酸序列之間的互補程度在至少8個核苷酸(例如,至少9個、至少10個、至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個、至少18個、至少19個、至少20個、至少21個、至少22個、至少23個、至少24個、至少25個、至少30個、至少35個、至少40個、至少45個、至少50個、或更多個核苷酸)的區域內為至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至 少99%、或100%),或若兩個核酸序列在至少中等或在一些具體實施例中的高嚴格條件下雜交,則兩個核酸序列為「基本上互補的」。示例性中等嚴格條件包括在37℃下在包含20%甲醯胺、5×SSC(150 mM NaCl、15 mM檸檬酸三鈉)、50 mM磷酸鈉(pH 7.6)、5×Denhardt's溶液、10%硫酸聚葡萄糖、及20 mg/ml變性剪切鮭魚精子DNA的溶液中隔夜培養,接著在約37到50℃下在1×SSC中洗滌濾膜,或基本上在類似的條件,例如描述在Sambrook, J., Molecular Cloning: A Laboratory Manual,Cold Spring Harbor Laboratory Press;4th edition(June 15,2012)中。高嚴格性條件為使用例如(1)低離子強度及高溫洗滌的條件,諸如50℃下0.015M氯化鈉/ 0.0015M檸檬酸鈉/0.1%十二烷基硫酸鈉(SDS),(2)在雜交期間使用變性劑,諸如甲醯胺,例如50%(v/v)甲醯胺與0.1%牛血清白蛋白(BSA)/0.1% Ficoll/0.1%聚乙烯吡咯烷酮(PVP)/50 mM磷酸鈉緩衝液,pH 6.5,在42℃下具有750 mM氯化鈉及75 mM檸檬酸鈉,或(3)使用50%甲醯胺、5×SSC(0.75M NaCl、0.075M檸檬酸鈉)、50 mM磷酸鈉(pH 6.8)、0.1%焦磷酸鈉、5×Denhardt’s溶液、超音波處理的鮭魚精子DNA(50μg/ml)、0.1% SDS及10%硫酸聚葡萄糖,在42℃下,在(i)42℃下在0.2×SSC中、(ii)55℃下在50%甲醯胺中,以及(iii)55℃下在0.1×SSC中(任選與EDTA組合)洗滌。雜交反應嚴格性的其他細節及解釋提供於例如Sambrook,如上所述;以及Ausubel等人編輯, Short Protocols in Molecular Biology,5th ed.,John Wiley & Sons, Inc.,Hoboken,N.J. (2002)中。當提及核酸序列時,「雜交」或「雜交的」等詞是在具有互補性的序列之間及/或之中形成的締合。
本文所用的「二級結構」或「二級結構元件」或「二級結構序列區」等詞在關於核酸序列(例如,RNA、DNA等)時,係有關核苷酸或核糖核苷酸單元的任何非線性構形。這種非線性構形可包括在單個核酸聚合物內或在兩個聚合物之間的鹼基配對相互作用。由於單股RNA形成源於核糖中額外羥基的氫鍵的能力增加,因此其通常會形成複雜及錯綜複雜的鹼基配對相互作用。二級結構或二級結構元件的實例包括但不限於,例如,幹環、髮夾結構、凸起、內部環、多環、螺旋(coil)、隨機螺旋(random coil)、雙螺旋(helix)、部件雙螺旋(partial helix)及假結。在一些具體實施例中,「二級結構」乙詞可關於SuRE元件。「SuRE」乙詞代表幹環結構的RNA元件(SuRE)。
本文所用的「自由能」乙詞是指藉由折疊未經折疊的多核苷酸(例如,RNA或DNA等)分子而釋放的能量,或相反地,為了使經折疊的多核苷酸(例如,RNA或DNA等)未折疊而必須加入的能量的量。多核苷酸(例如,DNA、RNA等)的「最小自由能(MFE)」描述當對多核苷酸的各種二級結構進行評估時,對該多核苷酸觀察到的自由能的最低值。RNA分子的MFE可用於預測RNA或DNA二級結構,並受RNA或RNA核苷酸的數目、組成及排列的影響。結構具有的負自由能愈多,其形成的可能性就愈大,這是因為藉由結構的形成會釋放更多儲存的能量。
「解鏈溫度(Tm)」乙詞是指約50%的雙股核酸結構(例如,DNA/DNA、DNA/RNA或RNA/RNA雙股螺旋)變性並解離為單股結構的溫度。
本文所用的「重組」乙詞是指具體核酸(DNA或RNA)為選殖、限制性、聚合酶連鎖反應(PCR)及/或連接步驟的各種組合的產物,該組合導致具有可區別於在天然系統中發現的內源核酸的結構編碼或非編碼序列的構築體。編碼多肽的DNA序列可從cDNA片段或從一系列合成寡核苷酸組裝,以提供能夠由細胞或無細胞轉錄及轉譯系統中所含的重組轉錄單元表現的合成核酸。包含相關序列的基因體DNA也可用於形成重組基因或轉錄單位。非轉譯DNA序列可能存在於開放閱讀框架的5’或3’處,其中這樣的序列不干擾編碼區的操作或表現,且可用於藉由各種機轉來調節所需產物的生產。或者,也可認為編碼未轉譯的RNA的DNA序列為重組的。因此,「重組」核酸乙詞也指非天然存在的核酸,例如藉由人為干預由兩個另外分開的序列區段的人工組合所產生。這種人工組合通常藉由化學合成方法或藉由人工操作經分離的核酸區段,例如藉由基因改造技術來達成。通常這樣做是為了以編碼相同胺基酸、保守胺基酸或非保守胺基酸的密碼子來替換密碼子。或者,可進行人工組合以使所需功能的核酸區段連接在一起,從而產生所需的功能組合。這種人工組合通常藉由化學合成方法或藉由人工操作經分離的核酸區段,例如藉由基因改造技術來達成。當重組多核苷酸編碼多肽時,所編碼多肽的序列可為天然存在的(「野生型」)或可為天然存在的序列的變體(例如,突變體)。因此,「重組」多肽乙詞不一定指其序列不是天然存在的多肽。反而,「重組」多肽由重組DNA序列編碼,而多肽的序列可為天然存在的(「野生型」)或非天然存在的(例如,變體、突變體等)。因此,「重組」多肽為人為干預的結果,但可包含天然存在的胺基酸序列。
本文所用的「可操作地連接」及「可操作地連接」等詞是指元件的配置,該元件被配置為以適合預期目的方式執行、作用或被結構化。例如,當存在合適的酶時,與編碼序列可操作地連接的給定啟動子能夠影響編碼序列的表現。表現是指包括編碼環狀RNA的任何一或多個重組核酸的轉錄,或來自DNA或RNA模板的mRNA的轉錄,且可進一步包括來自包含IRES序列(例如,非天然IRES)的重組環狀RNA的蛋白質的轉譯。因此,例如,在啟動子序列與編碼序列之間可存在未經轉譯但經轉錄的介入序列,且仍然可認為啟動子序列「可操作地連接」到編碼序列。 環狀 RNA
本揭露內容提供重組環狀RNA分子,其包含可操作地連接到蛋白質編碼序列的內部核糖體進入位點(IRES)序列,以及編碼該RNA分子的DNA序列。在一些具體實施例中,蛋白質編碼序列編碼非病毒蛋白質。例如,在一些具體實施例中,蛋白質編碼序列編碼動物蛋白質、植物蛋白質、細菌蛋白質、真菌蛋白質、或人工蛋白質。在一些具體實施例中,蛋白質編碼序列編碼哺乳動物蛋白質,諸如人類蛋白質。
可根據若干方法產生或改造重組circRNA分子。例如,可藉由線性RNA的反向剪接產生重組circRNA分子。例如,在一些具體實施例中,藉由使下游5’剪接位點(剪接供體)反向剪接到上游3’剪接位點(剪接受體)來生產重組環狀RNA。剪接供體及/或剪接受體可在例如人類內含子或其部件中發現,該內含子或其部件通常用於在內源基因座處生產circRNA。在一些具體實施例中,藉由使細胞與DNA質體接觸來生產重組環狀RNA,其中DNA質體編碼線性RNA,且使線性RNA反向剪接以生產重組環狀RNA。在一些具體實施例中,DNA質體包含來自哺乳動物ZKSCAN1基因的內含子。
在一些具體實施例中,可藉由非哺乳動物剪接方法產生環狀RNA。例如,可環化含有各種類型內含子的線性RNA,該等內含子包括自我剪接第I組內含子、自我剪接第II組內含子、剪接體內含子、及tRNA內含子。具體而言,第I組及第II組內含子具有的優點為,因為源自其自催化的核酶活性而具有進行自我剪接的能力,因此其可很容易地用於在活體外及活體內生產環狀RNA。
或者,可藉由化學或酶連接RNA的5’及3’末端,從線性RNA在活體外生產環狀RNA。化學連接可例如使用溴化氰(BrCN)或乙基-3-(3'-二甲基胺基丙基)碳二亞胺(EDC)進行,以活化核苷酸磷酸單酯基團,從而能夠形成磷酸二酯鍵(Sokolova, FEBS Lett232:153-155 (1988);Dolinnaya等人, Nucleic Acids Res.,19: 3067-3072 (1991);Fedorova, Nucleosides Nucleotides Nucleic Acids,15: 1137-1147 (1996))。或者,可使用酶連接來環化RNA。可使用的示例性連接酶包括T4 DNA連接酶(T4 Dnl)、T4 RNA連接酶1(T4 Rnl 1)、及T4 RNA連接酶2(T4 Rnl 2)。
在一些具體實施例中,夾板連接(splint ligation)可用於產生環狀RNA。夾板連接涉及使用與線性RNA的兩端雜交的寡核苷酸夾板,以使線性RNA的末端集合在一起進行連接。夾板的雜交,其可為去氧核糖寡核苷酸或核糖寡核苷酸,使RNA末端的5’-磷酸及3’-OH定向以進行連接。可使用如上所述的化學或酶技術進行後續連接。可例如以T4 DNA連接酶(需要DNA夾板)、T4 RNA連接酶1(需要RNA夾板)或T4 RNA連接酶2(DNA或RNA夾板)進行酶連接。若經雜交的夾板-RNA複合物的結構干擾酶活性,則諸如使用BrCN或EDC的化學連接在某些情況下比酶連接更有效率(請參見例如Dolinnaya等人, Nucleic Acids Res21(23): 5403-5407 (1993);Petkovic等人, Nucleic Acids Res,43(4): 2454-2465 (2015))。
在一些具體實施例中,圖7所示的模組化選殖平台係用於產生用於生成cirRNA的質體。此平台允許快速合成大型庫。該平台可用於隨機庫生成,如IRES改組所示。獨立庫也可模組化組裝以產生豐富的RNA元件數據集,諸如將改組的5’ UTR區及改組的3’ UTR區組合到報告基因的兩側。此方法可極大地擴大可用的IRES的所有組成部件,並可使circRNA的遞送具有與生理表現平行的微調的轉譯活性。取決於RNA為環狀或線性,給定的IRES的轉譯可相差100倍。這與最近在環狀及線性RNA中驅動端帽非依賴性轉譯的序列篩選一致,並表明存在對circRNA獨特的轉譯控制機轉(Chen, C.K.等人,Structured elements drive extensive circular RNA translation. Mol. Cell 81,4300-4318.e13 (2021),其全部內容藉由引用併入本文)。
在一些具體實施例中,circRNA包含優化的3’及/或5’ UTR。在一些具體實施例中,5’ UTR包含或為 ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUGUCG,且3’ UTR包含或為β-球蛋白3’ UTR或截斷的β-球蛋白3’ UTR,或與其至少90%(例如,至少95%、96%、97%、98%、或99%)一致的序列)。在一些具體實施例中,β-球蛋白3’ UTR在AAUAAA聚腺苷酸化訊號之後被截斷。在一些具體實施例中,聚腺苷酸化位點的3’被截斷10、20、30、40、50、60、70、80、90、或100個核苷酸。
雖然環狀RNA大體上比其線性對應物更穩定,這主要是由於缺乏核酸外切酶媒介的降解所必需的游離末端,但可對本文所述的重組環狀RNA進行額外的修飾以進一步改善穩定性。仍有其他種類的修飾可改善環化效率、circRNA的純化、及/或來自circRNA的蛋白質表現。例如,重組circRNA可經改造以包括「同源臂」(即9到19個核苷酸長度,位於前驅物RNA的5’及3’末端,目的為使5’及3’剪接位點彼此靠近)、間隔子序列、及/或硫代磷酸酯(PS)端帽(Wesselhoeft等人, Nat. Commun.9:2629 (2018))。重組circRNA也可經改造以包括2’- O-甲基-、-氟代-、或- O-甲氧基乙基複合體、硫代磷酸酯骨架、或2’,4’-環 2’-O-乙基修飾以增加其穩定性(Holdt等人, Front Physiol.9: 1262 (2018);Krützfeldt等人, Nature,438 (7068): 685-9 (2005);以及Crooke等人, Cell Metab.27(4): 714-739 (2018))。重組circRNA分子也可包含一或多個降低circRNA分子在宿主中先天免疫原性的修飾,諸如至少一個N6-甲基腺苷(m 6A)。
在一些具體實施例中,重組circRNA分子包含至少一個2-硫尿苷(2ThioU)或至少一個2’-O-甲基胞苷(2OMeC)。2-硫尿苷為在tRNA中發現的經修飾的核鹼基,其已被證明可穩定U:A鹼基對並使U:G搖擺對(wobble pair)不穩定(Rodriguez-Hernandez等人,J. Mol. Biol. 2013;425:3888-3906)。2’-羥基的甲基化為天然存在的穩定RNA分子的其一最常見的轉錄後修飾(Satoh等人,RNA 2000. 6: 680-686)。例如,大體上認為tRNA在核糖位置2’-OH的甲基化可經由防止自發水解或核酸酶消化(例如,在非雙螺旋區)的機轉增加tRNA的穩定性,並加強穩定分子三級結構的環內相互作用(Endres等人,PLoS ONE 15(2): e0229103)。
在如本文所述產生的具體circRNA分子中的任何數目的核苷酸(例如,尿苷及/或胞苷),可用相應數目的2-硫尿苷(2ThioU)或2’-O-甲基胞苷(2OMeC)進行修飾(例如,替換)。理想地,在circRNA分子中的至少一個核苷酸被2ThioU或2OMeC替換。在一些具體實施例中,重組環狀RNA分子中至少1%(例如,1%、2%、3%、4%、5%、6%、7%、8%、9%、或更多)的核苷酸被2ThioU或2OMeC替換。在其他具體實施例中,重組環狀RNA分子中至少10%(例如,10%、11%、12%、13%、14%、15%、20%、30%、40%、50%、60%、70%、80%、90%、或更多)的核苷酸被2ThioU或2OMeC替換。例如,重組circRNA分子包含約2%到約5%(例如,2.5%、3%、3.5%、4%、或4.5%)的2-硫尿苷或2-O-甲基胞苷。在一些具體實施例中,重組circRNA分子包含約2.5%的2ThioU或2OMeC。在其他具體實施例中,重組環狀RNA分子中的所有(即100%)尿苷核苷酸可被2ThioU替換,或者重組環狀RNA分子中的所有(即100%)胞苷核苷酸可被2OMeC替換。應當理解,引入重組環狀RNA分子中的2ThioU或2OMeC修飾的數目將取決於circRNA的具體用途。
在一些具體實施例中,編碼環狀RNA分子的DNA序列包含編碼至少兩個內含子及至少一個外顯子的序列。本文所用的「外顯子」乙詞關於存在於基因中的核酸序列,其在轉錄期間切除內含子後以成熟形式的RNA分子表示。外顯子可轉譯成蛋白質(例如,在信使RNA(mRNA)的情況下)。本文所用的「內含子」乙詞關於存在於給定基因中的核酸序列,其在最終RNA產物成熟期間藉由RNA剪接而被除去。內含子大體上存在於外顯子之間。在轉錄期間,內含子從前驅物信使RNA(前mRNA)中除去,且外顯子經由RNA剪接連接。在一些具體實施例中,重組環狀RNA分子包含核酸序列,該核酸序列包括一或多個外顯子及一或多個內含子。
因此,如WO 2017/222911中所述,可使用內源或外源內含子來產生環狀RNA。本文所用的「內源性內含子」乙詞是指對於生產circRNA的宿主細胞而言為天然的內含子序列。例如,當在人類細胞中表現circRNA時,人類內含子為內源性內含子。「外源內含子」是指與產生circRNA的宿主細胞異源的內含子。例如,當在人類細胞中表現circRNA時,細菌內含子將為外源內含子。已知來自多種生物體及病毒的眾多內含子序列,且包括衍生自編碼蛋白質、核糖體RNA(rRNA)或轉運RNA(tRNA)的基因的序列。代表性內含子序列可在各種數據庫中獲得,包括第I組內含子序列及結構數據庫(rna.whu.edu.cn/gissd/)、細菌第II組內含子數據庫(webapps2.ucalgary.ca/~groupii/index.html)、移動第II 組內含子數據庫(fp.ucalgary.ca/group2introns)、酵母內含子數據庫(emblS16heidelberg.de/ExternalInfo/seraphin/yidb.html)、Ares Lab酵母內含子數據庫(compbio.soe.ucsc.edu/yeast_introns.html)、U12內含子數據庫(genome.crg.es/cgibin/u12db/u12db.cgi)、及外顯子-內含子數據庫(bpg.utoledo.edu/~afedorov/lab/eid.html)。
在一些具體實施例中,編碼環狀RNA分子的核酸(例如,DNA)包含自我剪接基團第I組內含子。第I組內含子為一類獨特的RNA自我剪接內含子,該等內含子催化其自身從廣泛的生物體中的mRNA、tRNA及rRNA前驅物切除。真核細胞核中存在的所有已知的第I組內含子都會中斷位於核糖體DNA基因座中的功能性核糖體RNA基因。核第I組內含子在真核微生物中廣泛存在,且原生質體黏菌(黏菌綱)含有大量的自我剪接內含子。編碼環狀RNA分子的DNA中所含的自我剪接第I組內含子可從任何生物體,諸如細菌、噬菌體及真核病毒中獲得或衍生。自我剪接第I組內含子也可在某些細胞器,諸如粒線體及葉綠體中發現,且這種自我剪接內含子可嵌入編碼環狀RNA分子的核酸。
在一些具體實施例中,編碼重組環狀RNA分子的核酸包含噬菌體T4胸苷酸合酶(td)基因的自我剪接第I組內含子。當外顯子線性剪接在一起時,噬菌體T4胸苷酸合酶(td)基因的第I組內含子具有環化的特性(Chandry與Belfort, Genes Dev.1: 1028-1037 (1987);Ford與Ares, Proc. Natl. Acad. Sci. USA91: 3117–3121 (1994);以及Perriman與Ares, RNA4: 1047-1054 (1998))。當td內含子順序在任何外顯子序列兩側置換(即5’一半位於位置3’,反之亦然)時,外顯子經由兩個自催化酯交換反應環化(Ford與Ares,如上所述;Puttaraju與Been, Nucleic Acids Symp. Ser.33: 49-51 (1995))。
在一些具體實施例中,編碼重組環狀RNA分子的核酸(例如,DNA)包含ZKSCAN1內含子。ZKSCAN1內含子描述於例如Yao, Z.等人,Mol. Oncol. (2017) 11(4):422-437。在一些具體實施例中,編碼重組環狀RNA分子的核酸包含miniZKSCAN1內含子。
重組環狀RNA分子可為任何長度或大小。例如,重組環狀RNA分子可包含約200個核苷酸到約10,000個核苷酸(例如,約300、約400、約500、約600、約700、約800、約900、約1,000、約2,000、約3,000、約4,000、約5,000、約6,000、約7,000、約8,000、或約9,000個核苷酸,或由上述值中的任意兩個所定義的範圍)。在一些具體實施例中,重組環狀RNA分子包含約500到約6,000個核苷酸(約 550、約650、約750、約850、約950、約1,100、約1,200、約1,300、約1,400、約1,500、約1,600、約1,700、約1,800、約1,900、約2,100、約2,200、約2,300、約2,400、約2,500、約2,600、約2,700、約2,800、約2,900、約3,100、約3,300、約3,500、約3,700、約3,800、約3,900、約4,100、約4,300、約4,500、約4,700、約4,900、約5,100、約5,300、約5,500、約5,700、或約5,900個核苷酸,或由上述值中的任意兩個所定義的範圍)。在一個具體實施例中,重組環狀RNA分子包含約1,500個核苷酸。
在一些具體實施例中,重組環狀RNA分子包含可操作地連接到蛋白質編碼序列的內部核糖體進入位點(IRES)序列;其中IRES序列為病毒序列;且其中蛋白質編碼序列編碼非病毒蛋白質。
在一些具體實施例中,重組環狀RNA分子包含蛋白質編碼核酸序列區及可操作地連接到蛋白質編碼核酸序列區的內部核糖體進入位點(IRES)序列區,其中IRES包含:至少一個具有二級結構元件的序列區;以及與18S核糖體RNA(rRNA)互補的序列區;其中IRES具有小於-18.9 kJ/mol的最小自由能(MFE)及至少35.0℃的解鏈溫度。在一些具體實施例中,IRES序列以非天然構型與蛋白質編碼核酸序列區連接。
本揭露內容也提供重組環狀RNA分子,其包含蛋白質編碼核酸序列區及可操作地連接到蛋白質編碼核酸序列的內部核糖體進入位點(IRES)序列區;其中IRES由表1A或表1B中所列的任一核酸序列或與其具有至少90%或至少95%一致性或同源性的核酸序列編碼。在一些具體實施例中,IRES序列以非天然構型與蛋白質編碼核酸序列區連接。 內部核糖體進入序列
本文所述的重組環狀RNA包含內部核糖體進入位點(IRES)。這些IRES序列可能可操作地連接到circRNA的蛋白質編碼序列。包含IRES能從環狀RNA轉譯一或多個開放閱讀框架。IRES吸引真核核糖體轉譯起始複合物並促進轉譯起始。
本文提供多種IRES序列,當存在於circRNA中時,其驅動由 circRNA編碼的蛋白質的轉譯。在一些具體實施例中,可使circRNA的IRES可操作地連接到蛋白質編碼核酸序列。在一些具體實施例中,circRNA的IRES以非天然構型可操作地連接到蛋白質編碼核酸序列。在一些具體實施例中,IRES為人類IRES。在一些具體實施例中,IRES為病毒IRES。在一些具體實施例中,IRES為第1型IRES。
本文所用的「非天然構型」乙詞是指IRES與蛋白質編碼核酸之間的連接,其不存在於天然存在的circRNA分子中。例如,病毒IRES可能可操作地連接到環狀RNA中的蛋白質編碼核酸序列,或者未在天然存在的環狀RNA分子中發現的IRES可能可操作地連接到環狀RNA中的蛋白質編碼核酸序列。在一些具體實施例中,在可操作地連接到某種蛋白質編碼核酸的天然存在的circRNA分子中發現的IRES可操作地連接到不同的蛋白質編碼核酸(即在任何天然存在的circRNA中IRES不與之可操作地連接的核酸)。在一些具體實施例中,在天然存在的線性mRNA中發現的IRES可操作地連接到環狀RNA中的蛋白質編碼序列。
許多線性IRES序列為已知的,且可包括在如本文所述的重組環狀RNA分子中。例如,線性IRES序列可衍生自多種病毒,諸如來自微小核糖核酸病毒(例如,腦心肌炎病毒(EMCV)UTR)的前導序列(Jang等人, J. Virol.63: 1651-1660 (1989))、脊髓灰質炎前導序列、A型肝炎病毒前導序列、C型肝炎病毒IRES、人類鼻病毒第2型IRES(Dobrikova等人, Proc. Natl. Acad. Sci.100(25): 15125-15130(2003))、來自口蹄疫病毒的IRES元件(Ramesh等人, Nucl. Acid Res.24: 2697-2700 (1996))、及梨型鞭毛蟲病毒(giardiavirus) IRES(Garlapati等人, J. Biol. Chem.279(5): 3389-3397 (2004))。多種非病毒IRES序列也可包含在環狀RNA分子中,包括但不限於來自酵母的IRES序列、人類血管收縮素II第1型受體IRES(Martin等人, Mol. Cell Endocrinol.212: 51-61 (2003))、纖維母細胞生長因子IRES(例如,FGF-1 IRES及FGF-2 IRES,Martineau等人, Mol. Cell. Biol.24(17): 7622-7635 (2004))、血管內皮生長因子IRES(Baranick等人, Proc. Natl. Acad. Sci. U.S.A.105(12): 4733-4738 (2008);Stein等人, Mol. Cell. Biol.18(6): 3112-3119(1998);Bert等人, RNA12(6): 1074-1083(2006))、及類胰島素生長因子2 IRES(Pedersen等人, Biochem. J.363(Pt 1): 37-44 (2002))。
IRES序列及編碼IRES元件的載體可從多種來源商購獲得,諸如例如Clontech(Mountain View,CA)、Invivogen(San Diego,CA)、Addgene(Cambridge,MA)及GeneCopoeia(Rockville,MD),以及IRESite:經實驗證實的IRES結構數據庫(iresite.org)。值得注意的是,這些數據庫聚焦在mRNA(即線性RNA)中IRES序列的活性,而非集中在circRNA IRES活性圖譜。 病毒 IRES 序列
在一些具體實施例中,本文所述的circRNA包含病毒IRES序列。病毒IRES序列可用非天然構型可操作地連接到蛋白質編碼序列。例如,病毒IRES序列可能可操作地連接到編碼非病毒蛋白質的序列。在一些具體實施例中,蛋白質編碼序列編碼動物蛋白質、植物蛋白質、細菌蛋白質、真菌蛋白質、或人工蛋白質。在一些具體實施例中,蛋白質編碼序列編碼哺乳動物蛋白質,諸如人類蛋白質。在一些具體實施例中,當病毒IRES序列被置於環狀RNA中時,其會驅動由環狀RNA編碼的蛋白質的有效轉譯。
下表7提供病毒IRES的非限制性列表,該病毒IRES可在circRNA中用於驅動由環狀RNA編碼的蛋白質的表現。表7中也提供用於鑑定病毒IRES的基因體序列的GenBank登錄號。序列附錄中提供編碼病毒IRES的序列。 7 :示例性病毒 IRES 序列
病毒IRES GenBank登錄號
iPV1 NC_002058
iPV2 D00625
iPV3  AJ293918
iHRV1  NC_038311
iHRV2  X02316
iHRV-B3  NC_038312
iCVA1  AF499635
iCVA16  KC117318
iCVB2  AF081485
iCVB3  NC_038307
iEV-A71  KT354875
iEV-A120  LK021688
iEV71  HM003207
iEV-B107 AB426609
iHRV-A9  FJ445177
iHRV-A21  FJ445121
iHRV-A57  JN614995
iHRV-A89  NC_001617
iHRV-A100  FJ445175
iHRV-B4  DQ473490
iHRV-B17  EF173420
iHRV-B26  FJ445124
iHRV-B37  EF173423
iHRV-B92  FJ445169
iHRV-C3  EF186077
iHRV-C11  EU840952
iHRV-C54  KP282614
iCVB1  M16560
iCVB5  AF114383
iEchoV1  AF029859
iEchoV-E11  X80059
iEchoV-E15  AY302541
iCVA20  AF499642
iEV-D94  DQ916376
iSimianEV-A  NC_003988
iSimianA5  AF326751
iSimianV4  NC_038309
iSwineVesciular  MK038999
iHRV-B3_SC2220  KY684757
iHRV-B5  FJ445112
iHRV-B6  DQ473486
iHRV-B14  MN306034
iHRV-B27  FJ445186
iHRV-B35  DQ473487
iHRV-B42  FJ445130
iHRV-B48  DQ473488
iHRV-B52  FJ445188
iHRV-B69  FJ445151
iHRV-B70  DQ473489
iHRV-B72  FJ445153
iHRV-B79  FJ445155
iHRV-B83  MN306025
iHRV-B84  FJ445162
iHRV-B86  FJ445164
iHRV-B91  FJ445168
iHRV-B93   EF173425
iHRV-B97  FJ445172
iHRV-B99  FJ445174
iHRVB_SC0739  MN306037
iHRVB_G001-19  MN212904
iHRVB_R93  KF958309
iHRVB_BCH214  GU568096
iHRVB_3039  KF958308
iEV-B69  AY302560
iEV-B73  AF241359
iEV-B74  AY556057
iEV-B75  AY556070
iEV-B77  AJ493062
iEV-B79  AB426610
iEV-B80  AY843298
iEV-B81  AY843299
iEV-B82  AY843300
iEV-B83  AY843301
iEV-B84  DQ902712
iEV-B85  AY843303
iEV-B86  AY843304
iEV-B87  KC292019
iEV-B88  AY843306
iEV-B93  MN580134
iEV-B97  AY843307
iEV-B98  AB426608
iEV-B100  DQ902713
iEV-B101  AY843308
iEV-B106  KF990476
iEV-B107_TN94-0349  AB426609
iEV-B111  KF312882
iEV-B113  KC344833
iEV-D68  NC_038308
iEV-D70  NC_001430
iEV-D94  DQ916376
iEV-D111  MK032895
iHCosV-B1  NC_012801
iEcho-E7  LS451295
iEcho-E9  AF524866
iPV3_PAK1019536  KY941934.1
iPV3_NIE1219535  KY941933.1
iPV3_SWI10947  FJ914252.2
iPV3_FIN84  FJ842158.1
在一些具體實施例中,circRNA包含表7中的任何一個IRES、或其片段或衍生物。在一些具體實施例中,circRNA包含由SEQ ID NO: 33145-33169中的任一個編碼的IRES、或其片段或衍生物。
在一些具體實施例中,IRES為第1型IRES。第I型IRES元件存在於腸病毒物種的RNA基因體中,該等物種包括脊髓灰質炎病毒(PV)、柯沙奇病毒B3(CVB3)、腸病毒71(EV71)、及人類鼻病毒(HRV)。在一些具體實施例中,IRES為腸病毒IRES。在一些具體實施例中,IRES為HRV IRES。
在一些具體實施例中,circRNA包含以下IRES中的任一種:iCVA20;iEchoV-E11、iSimianEV-A、iCovid19、iHRV-A57、iEchoV11、iCrPV、iHRV-A89、iHRV-B26、iBEV、iEchoV1、iHRV-A21、iPV1、iCVB3、iEMCV、iHCV、iCVB5、iSwineVesicular、iHRV-A2、iHRV-C3、iHRV-C11、iCVB1、iPV2、iHRV-B17、iEchoV-E15、iEV71、iHRV-A9、iSiminanV4、iEV-D94、iSimianA5、iPV3、iHRV-C54、iHRV-A100、iHRV-B37、iHRV-B4、iHRV-B92、iHRV-B3、iHRV-A1、iEV107、或其片段或衍生物。
在一些具體實施例中,circRNA包含以下IRES中的任一種:iEMCV、iHCV、iCVB5、iSwineVesicular、iHRV-A2、iHRV-C3、iHRV-C11、iCVB1、iPV2、iHRV-B17、iEchoV-E15、iEV71、iHRV-A9、iSiminanV4、iEV-D94、iSimianA5、iPV3、iHRV-C54、iHRV-A100、iHRV-B37、iHRV-B4、iHRV-B92、iHRV-B3、iHRV-A1、iEV107、或其片段或衍生物。
在一些具體實施例中,circRNA包含以下IRES中的任一種:iEV-B79、iEV-B77、iPV3_SWI10947、iHRV-B26、iHRV-B37、iHRV-A89、iEV-B86、iEV-B113、iEV-B87、iHRVA021、iEV-B88、iHRV-C11、iEV-B93、iEVD70、iEV-B111、iHRV-B92、iEV-B69、iEV-B73、iEV-B107、iEV107、iHRV-C54、iEV-B100、iHRVB_BCH214、iEV-B98、iPV3_NIE21219535、iEV-D111、iEcho-E9、iEV-B82、iEV-D94、iEV-B75、iEV97、iEV-B84、iHRV-C3、iHRV-A1、iEcho-E7、iEV-B81、iPV3_PAK1019536、iHRV-A9、iEV-B106、iHRV-A100、iPV3_FIN84、iEV-B85、iHRV-B86、iEV-B101、iHRV-B3、iHRV-B17、iHRVB_G001-10、iHRV-B70、iEV-B74、iEV-B80、iCVB3、iEV-B83、iHRV-A57、iHRV-B35、iHRV-B4、iEV-D68、iHRVB_R93、iHRV-B5、iHRVB-B52、iHRVB-B93、iHRV-B84、iHRV-B83_SC2220、iHRV-B72、iHRV-B69、iHRVB_SC0739、iHRV-B91、iHRV-B42、iHRV-B6、iHRV-B83、iHRV-B48、iHRV-B99、iHRV-B79、iHRV-B97、iHRV-B27、iHRVB_3039、iHRVB-B14、iCosV-B1。
在一些具體實施例中,circRNA包含以下IRES中的任一種:iEV-B83、iHRV-A57、iHRV-B35、iHRV-B4、iEV-D68、iHRVB_R93、iHRV-B5、iHRVB-B52、iHRVB-B93、iHRV-B84、iHRV-B83_SC2220、iHRV-B72、iHRV-B69、iHRVB_SC0739、iHRV-B91、iHRV-B42、iHRV-B6、iHRV-B83、iHRV-B48、iHRV-B99、iHRV-B79、iHRV-B97、iHRV-B27、iHRVB_3039、iHRVB-B14、iCosV-B1、或其片段或衍生物。
在一些具體實施例中,circRNA包含iCVB3 IRES。在一些具體實施例中,circRNA包含iCVB3 IRES的片段或衍生物。
在一些具體實施例中,circRNA包含iHRV-B3 IRES。在一些具體實施例中,circRNA包含iHRV-B3 IRES的片段或衍生物。 合成 IRES
在一些具體實施例中,circRNA包含合成IRES。「合成IRES」為相對於野生型IRES而言經修飾以調節其結構及/或活性的IRES。例如,在一些具體實施例中,經修飾以嵌入適體序列的IRES為合成IRES。
在一些具體實施例中,合成IRES包含適體。在一些具體實施例中,合成IRES包含第一適體及第二適體。在一些具體實施例中,合成物包含兩個、三個、四個、五個、六個、七個、八個、九個、十個或更多個適體。
在一些具體實施例中,適體為野生型適體。在一些具體實施例中,適體為野生型適體的片段。在一些具體實施例中,適體為經設計用於結合DNA或RNA的適體。可使用例如SELEX技術藉由一或多輪演化來產生結合專一性DNA或RNA序列的合成適體。
在一些具體實施例中,適體為已知適體(例如,突變體適體)的經修飾形式。在一些具體實施例中,適體經修飾以具有延伸的幹區。例如,幹區的長度可延長約10%到約25%、約25%到約50%、約50%到約75%、約75%到約100%、約125%、約150%、約175%、約200%、或更多。在一些具體實施例中,幹區的長度延伸約1、約2、約3、約4、約5、約6、約7、約8、約9、約10個鹼基對。如本發明所屬技術領域中具有通常知識者將理解的,幹區延伸1個鹼基對包括向適體序列加入2個核苷酸。因此,包含延伸3個鹼基對的幹區的適體具有比其中幹區未延伸的相同適體長6個核苷酸的核苷酸序列。
適體可插入IRES序列中能容許這種變化的任何位置。在一些具體實施例中,適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。在一些具體實施例中,適體位於其可結合一或多個轉譯起始因子(諸如eIF4G)的位置。在一些具體實施例中,適體不中斷IRES的天然eIF4G結合位點。在一些具體實施例中,IRES不中斷IRES內的天然GRNA四環。
在一些具體實施例中,適體為eIF4G結合適體,諸如表6中列出的任何一個適體。在一些具體實施例中,適體為表6中列出的任何適體的片段或衍生物。在一些具體實施例中,eIF4G結合適體包含SEQ ID NO: 33143的序列或由其編碼的序列。在一些具體實施例中,eIF4G結合適體包含SEQ ID NO: 33178的序列。
在一些具體實施例中,RNA適體的功能為使小分子能夠控制circRNA轉譯或將circRNA導向特定細胞內標靶。此外,RNA適體的嵌入可能為circRNA的細胞類型專一性表現提供一途徑。 6 eIF4G 結合適體
適體 ID DNA 序列 RNA 序列 SEQ ID NOs:
A TAA TAC GAC TCA CTA TAG GG ACTC ACT ATT TGT TTT CGC GCC CAG TTG CAA AAA GTG TCG CCG CAT CTA GAG GGC C UAAUACGACUCACUAUAGGGACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUGUCGCCGCAUCUAGAGGGCC 33170, 33174
B TAA TAC GAC TCA CTA TAG GGT CCA GAC CCC AAC AGA CTC CAT AAC TAA TAT GTC GCA AAA CCG CAT CTA GAG GGC C UAAUACGACUCACUAUAGGGUCCAGACCCCAACAGACUCCAUAACUAAUAUGUCGCAAAACCGCAUCUAGAGGGCC 33171, 33175
C TAA TAC GAC TCA CTA TAG GGT CCG TAG AAA CGC GTT AAG GTG AAA GTT TGA GGG CTC CTC ACC GCA TCT AGA GGG CC UAAUACGACUCACUAUAGGGUCCGUAGAAACGCGUUAAGGUGAAAGUUUGAGGGCUCCUCACCGCAUCUAGAGGGCC 33172, 33176
D TAA TAC GAC TCA CTA TAG GGT CCG CGG CGC CAT CTC ATG TTT AGT TGT CCT ATG TCG AGC CCG CAT CTA GAG GGC C UAAUACGACUCACUAUAGGGUCCGCGGCGCCAUCUCAUGUUUAGUUGUCCUAUGUCGAGCCCGCAUCUAGAGGGCC 33173, 33177
E ACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCG ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUGUCG 33143, 33178
在一些具體實施例中,IRES為第I型IRES。在一些具體實施例中,IRES為腸病毒IRES。在一些具體實施例中,IRES為HRV IRE。序列附錄中所示的SEQ ID NO: 33145-33169提供示例性的IRES序列,其中IRES序列包含適體。適體插入以大寫字母示出。
在一些具體實施例中,合成IRES序列包含經修飾的iCVB3 IRES。在一些具體實施例中,經修飾的iCVB3 IRES包含插入其結構域I、II、III、IV、V、VI或VII中的適體。在一些具體實施例中,經修飾的iCVB3 IRES包含插入其結構域I、II、III、IV、V、VI或VII中的適體,插入位置最小程度破壞天然RNA結構。在一些具體實施例中,經修飾的iCVB3 IRES包含插入其結構域IV中的適體。在一些具體實施例中,適體經修飾以具有延伸的幹區。幹區可延伸例如1、2、3、4、5、6或更多個鹼基對。在一些具體實施例中,適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。在一些具體實施例中,適體不中斷IRES的天然eIF4G結合位點,及/或不中斷IRES內的天然GRNA四環。
在一些具體實施例中,合成IRES序列包含經修飾的iHRV-B3 IRES。在一些具體實施例中,經修飾的iHRV-B3 IRES包含插入其結構域I、II、III、IV、V、VI或VII中的適體。在一些具體實施例中,經修飾的iHRV-B3 IRES包含插入其結構域IV中的適體。在一些具體實施例中,適體經修飾以具有延伸的幹區。幹區可延伸例如1、2、3、4、5、6或更多個鹼基對。在一些具體實施例中,適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。在一些具體實施例中,適體不中斷IRES的天然eIF4G結合位點,及/或不中斷IRES內的天然GRNA四環。 IRES 元件及特徵
在一些具體實施例中,circRNA包含IRES,諸如合成或病毒IRES,其包含一或多個下述IRES元件或特徵。
在一些具體實施例中,circRNA包含IRES,該IRES包含至少一個RNA二級結構元件。分子內RNA鹼基配對通常為RNA二級結構的基礎,且在某些情況下為整個大分子折疊的關鍵決定因素。與輔因子及RNA結合蛋白質(RBP)結合,二級結構元件可形成更高階的三級結構,從而賦予RNA催化、調節及支架功能。因此,IRES可包含賦予這種結構或功能決定因素的任何RNA二級結構元件。
在一些具體實施例中,RNA二級結構可由IRES相對於其5’末端的約位置40到約位置60的核苷酸所形成。最常見的RNA二級結構為螺旋、環、凸起及連接,其中幹環或髮夾環為RNA二級結構中最常見的元件。當RNA鏈自身折疊形成稱作幹的雙螺旋道時,會形成幹環,其中未配對的核苷酸形成稱作環的單股區。藉由未配對的核苷酸在任一股(凸起)或兩個股(內部環)上分離雙螺旋道而形成凸起及內部環。四環為四鹼基對髮夾RNA結構。核糖體RNA中存在三個常見的四環家族:UNCG(SEQ ID NO: 33179)、GNRA(SEQ ID NO: 33180)、及CUUG(SEQ ID NO: 33181)(N為四個核苷酸其一,且R為嘌呤)。當來自髮夾環的核苷酸與髮夾外的單股區配對形成雙螺旋區段時,會形成假結。RNA二級結構進一步描述於例如以下:Vandivier等人,Annu Rev Plant Biol.,67:463-488(2016);以及Tinoco與Bustamante,如上所述)。在一些具體實施例中,重組circRNA分子的IRES包含至少一個幹環結構。至少一個RNA二級結構元件可位於IRES的任何位置,只要是轉譯是從IRES有效起始即可。在一些具體實施例中,幹環的幹部分可包含3到7個鹼基對、4、5、6、7、8、9、10、11或12個鹼基對、或更多。幹環的環部分可包含3到12個核苷酸,包括4、5、6、7、8、9、10、11、12個、或更多個核苷酸。幹環結構也可在幹的任一側上具有一或多個凸起(錯配)。在一些具體實施例中,RNA二級結構元件由IRES的約位置40到約位置60的核苷酸所形成,其中在IRES的5’末端處的第一個核酸被認為是位置1。在一些具體實施例中,與18S rRNA互補的序列位於至少一個RNA二級結構元件的5’處(即在IRES的約位置1到約位置40的範圍內)。在一些具體實施例中,與18S rRNA互補的序列位於至少一個RNA二級結構元件的3’處(即在約位置61到IRES末端 的範圍內)。表2中列出編碼可包括在本文所述IRES中的示例性二級結構形成的RNA序列。
在一些具體實施例中,IRES的至少一個RNA二級結構元件為幹環。在一些具體實施例中,至少一個RNA二級結構元件由表2中列出的任何一個核酸序列所編碼。在一些具體實施例中,至少一個RNA二級結構元件由相對於表2中列出的任何一個核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的列一致性的核酸序列編碼。在一些具體實施例中,至少一個RNA二級結構元件由相對於表2中列出的任何一個核酸序列具有至少1個、至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、或更多個核苷酸置換的核酸序列編碼。
RNA二級結構通常可從實驗熱力學數據結合化學作圖、核磁共振(NMR)光譜、及/或序列比較來預測。在一些具體實施例中,藉由機器學習/ 深度學習算法(例如,CNN)預測RNA二級結構(請參見Zhao, Q.等人,「Review of Machine-Learning Methods for RNA Secondary Structure Prediction」,Sept 1,2020(可在以下全球資訊網獲取:arxiv.org/abs/2009.08868)。用於RNA二級結構預測及分析的多種算法及軟體套件在本發明所屬技術領域中是已知的,且可用於本文揭露內容的背景中(請參見例如Hofacker I.L. (2014) Energy-Directed RNA Structure Prediction。在:Gorodkin J.,Ruzzo W(eds),RNA Sequence, Structure, and Function: Computational and Bioinformatic Methods. Methods in Molecular Biology(Methods and Protocols),vol 1097. Humana Press,Totowa,NJ;Mathews等人,如上所述;Mathews等人「RNA secondary structure prediction」, Current Protocols in Nucleic Acid Chemistry,Chapter 11 (2007): Unit 11.2. doi:10.1002/0471142700.nc1102s28;Lorenz等人, Methods103: 86-98 (2016);Mathews等人, Cold Spring Harb Perspect Biol.2(12): a003665 (2010))。
在一些具體實施例中,重組circRNA的IRES可包含與18S核糖體RNA(rRNA)互補的核酸序列。真核核糖體,也稱作「80S」核糖體,根據其沉降係數具有兩個不相等的次單元,稱作小次單元(40S)(也稱作「SSU」)以及大次單元(60S)(也稱作「LSU」)。兩個次單元都含有排列在由核糖體RNA(rRNA)所組成的支架上的數十種核糖體蛋白質。在真核生物中,真核80S核糖體含有超過5500個核苷酸的rRNA:在小次單元中的18S rRNA,以及在大次單元中的5S、5.8S及25S rRNA。小次單元監測tRNA反密碼子與mRNA之間的互補性,而大次單元催化肽鍵形成。核糖體通常含有約60%的rRNA及約40%的蛋白質。儘管rRNA序列的一級結構在生物體之間可以變化,但這些序列內的鹼基配對通常形成幹環構型。
在一些具體實施例中,IRES序列包含針對IRES的結構域之間的非鹼基配對的連接子區的鎖核酸(LNA)。
在一些具體實施例中,重組circRNA的IRES可包含任何與真核18S rRNA序列互補的核酸序列。在一些具體實施例中,與18S rRNA互補的核酸序列由表3中列出的任一個核酸序列編碼。在一些具體實施例中,與18S rRNA互補的核酸序列由與表3中所列序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至 少99%一致性或同源性的核酸序列編碼。在一些具體實施例中,與18S rRNA互補的核酸序列由相對於表3中所列的核酸序列具有至少1個、至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、或更多個核苷酸置換的核酸序列編碼。 3 :編碼與 18S RNA 互補的 RNA 序列的示例性 DNA 序列
SEQ ID NO: 核酸序列
34425 CACCTACGGAAACCTTGTTACGACTTTTACTTCCTCTAGATAGTCAAGTTCGACCGTCTTCTCAGCGCTCCGCCAGGGCCGTGGGCCGACCCCGGCGGGGCCGATCCGAGGGCCTCACTAAACCATCCAATCGGTAGTAGCGACGGGCGGTGTGTACAAAGGGCAGGGACTTAATCAACGCAAGCTTATGACCCGCACTTACTGGGAATTCCTCGTTCATGGGGAATAATTGCAATCCCC
34426 GGGACGCCGACCGCTCGGGGGTCGCGTAACTAGTTAGCATGCCAGAGTCTCGTTCGTTATCGGAATTAACCAGACAAATCGCTCCACCAACTAAGAACGGCCATGCACCACCACCC
34427 GTTTATGGTCGGAACTACGACGGTATCTGATCGTCTTCGAACCTCCGACTTTCGTTCTTGATTAATGAAAACATTCTTGGCAAATGCTTTCGCTCTGGTCCGTCTTGCGCCGGTCCAAGAATTTCACCTCTAGCGGCGCAATACGAATGCCCCCGGCCGTCCCTCTTAATCATGGCCTCAGTTCCGAAAACCAACAAAATAGAACCGCGGTCCTATTCCATTATTCCTAGCTGCGGTATCCAGGCGGCTCGGGCCTGCTTTGAACACTCTAATTTTTTCAAAGTAAACGCTTCGGG
34428 AGAGCATCGAGGGGGCGCCGAGAGGCAAGGGGCGGGGACGGGCGGTGGCTCGCCTCGCGGCGGACCGCCCGCCCGCTCCC
34429 TACGAGCTTT
34430 ATACGCTATTGGAGCTGGAATTACCGCGGCTGCTGGCACCAGACTTGCCCTCCAATGGATCCTCGTTAAAGGATTTAAAGTGGACTCATTCCAATTACAGGGCCTCGAAAGAGTCCTGTA
34431 GGGGGCGTGCGATCGGCCCGAGGTTATCTAGAGTCACCAAAGCCGCCGGCGCCCGCCCCCCGGCCGGGGCCGGAGAGGGG
RNA二級結構預測最常用的標準為最小自由能(MFE),這是因為根據熱力學,MFE結構不僅是最穩定的,且為熱力學平衡中最可能的結構。RNA或DNA分子的MFE受RNA/DNA序列中核苷酸的三個性質所影響:數目、組成及排列。例如,由於較長的序列其可形成更多的堆疊及氫鍵相互作用,因此其平均而言更穩定;富含鳥嘌呤-胞嘧啶(GC)的RNA通常比富含腺嘌呤-尿嘧啶(AU)的序列更穩定;且核苷酸順序會影響折疊結構的穩定性,這是因為其決定環及雙螺旋構形的數目及延伸。已發現到,與其他非編碼RNA不同,mRNA及微小RNA前驅物在給定其核苷酸數目及組成下具有比預期更大的負MFE。因此,自由能也可用作鑑定功能性RNA的標準。
重組circRNA分子的IRES可包含小於約-15 kJ/mol(例如,小於約-16 kJ/mol、小於約-17 kJ/mol、小於約-18.5 kJ/mol、小於約-19 kJ/mol、小於約-18.9 kJ/mol、小於約-20 kJ/mol、小於約-30 kJ/mol)的最小自由能(MFE)。在一些具體實施例中,MFE大於約-90 kJ/mol(例如,大於約-85 kJ/mol、大於約-80 kJ/mol、大於約-70 kJ/mol、大於約-60 kJ/mol、大於約-50 kJ/mol、大於約-40 kJ/mol)。在一些具體實施例中,IRES具有約-18.9 kJ/mol或更低的最小自由能(MFE)。在一些具體實施例中,IRES的MFE在約-15.9 kJ/mol到約-79.9 kJ/mol的範圍內。在一些具體實施例中,IRES可包含約-12.55 kJ/mol到約-100.15 kJ/mol範圍內的MFE。在一些具體實施例中,IRES為病毒IRES,且MFE在約-15.9 kJ/mol到約-79.9 kJ/mol的範圍內。在一些具體實施例中,IRES為人類IRES,且MFE在約-12.55 kJ/mol到約-100.15 kJ/mol的範圍內。
在一些具體實施例中,IRES的至少一個二級結構元件可包含小於約-0.4 kJ/mol、小於約-0.5 kJ/mol、小於約-0.6 kJ/mol、小於約-0.7 kJ/mol、小於約-0.8 kJ/mol、小於約-0.9 kJ/mol、或小於約-1.0 kJ/mol的最小自由能(MFE)。在一些具體實施例中,IRES的至少一個二級結構元件可包含小於約-0.7 kJ/mol的MFE。
在一些具體實施例中,包含本文所述的circRNA的IRES的約位置40到約位置60的核苷酸的RNA序列,可包含小於約-0.4 kJ/mol、小於約-0.5 kJ/mol、小於約-0.6 kJ/mol、小於約-0.7 kJ/mol、小於約-0.8 kJ/mol、小於約-0.9 kJ/mol、或小於約-1.0 kJ/mol的最小自由能(MFE)。在一些具體實施例中,包含IRES的約位置40到約位置60的核苷酸的RNA序列可包含小於約-0.7 kJ/mol的MFE。
如上所討論的,可使用多種計算方法及算法來測定具體RNA(例如,從DNA序列生產的RNA)的最小自由能。最常用於藉由MFE算法預測二級RNA或DNA結構的軟體程式為利用所謂的最鄰近能量模型。此模型使用基於經驗熱力學參數的自由能規則(Mathews等人, J Mol Biol288: 911-940 (1999);以及Mathews等人, Proc Natl Acad Sci USA101: 7287-7292 (2004)),並藉由加入由於相鄰鹼基對及環區引起的局部自由能相互作用的獨立貢獻來計算RNA或DNA結構的總體穩定性。在具有均質核苷酸排列及組成的序列中,局部自由能貢獻的加成性及獨立性表明經計算的MFE與序列長度之間的線性關係(Trotta, E., PLoS One9(11): e113380 (2014))。用於測定MFE的算法進一步描述於例如Hajiaghayi等人, BMC Bioinformatics13: 22 (2012);Mathews, D.H., Bioinformatics,Volume 21,Issue 10: 2246-2253 (2005);以及Doshi等人, BMC Bioinformatics,5: 105 (2004) doi 10.1186/1471-2105-5-105)。
本發明所屬技術領域具有通常知識者將理解,具體circRNA分子的解鏈溫度(T m)也可指示穩定性。更確切地,具有高T m的RNA序列大體上含有熱穩定的功能上重要的RNA結構(請參見例如, Nucleic Acids Res.45(10): 6109-6118 (2017))。因此,在一些具體實施例中,重組circRNA分子的IRES具有至少35.0℃的解鏈溫度。在一些具體實施例中,重組circRNA分子的IRES具有至少35.0℃,但不超過約85℃的解鏈溫度。在一些具體實施例中,RNA二級結構具有至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少43℃、至少44℃、至少45℃、至少46℃、至少47℃、至少48℃、至少49℃、或更高的解鏈溫度。在一些具體實施例中,解鏈溫度不超過約85℃、不超過約75℃、不超過約70℃、不超過約65℃、不超過約60℃、不超過約55℃、不超過約50℃、或更低。
可使用本文所述及本發明所屬技術領域已知的熱力學分析及算法來測定具體核酸分子的解鏈溫度(請參見例Kibbe W.A., Nucleic Acids Res.35(Web Server issue): W43-W46 (2007)。doi:10.1093/nar/gkm234;以及Dumousseau等人, BMC Bioinformatics13: 101 (2012)。doi.org/10.1186/1471-2105-13-101)。
在一些具體實施例中,IRES包含至少一個RNA二級結構元件;以及與18S核糖體RNA(rRNA)互補的核酸序列;其中IRES具有-18.9 kJ/mol或更低的最小自由能(MFE)及至少35.0℃的解鏈溫度。在一些具體實施例中,IRES的RNA二級結構元件具有小於-18.9 kJ/mol的最小自由能(MFE),且由IRES的約位置40到約位置60的核苷酸形成,其中在IRES的5’末端處的第一個核酸被認為是位置1。在一些具體實施例中,RNA二級結構元件具有至少35.0℃的解鏈溫度,且由IRES約位置40到約位置60的核苷酸所形成,其中在IRES的5’末端處的第一個核酸被認為是位置1。
由於circRNA分子通常從線性RNA產生,其藉由使下游5’剪接位點(剪接供體)反向剪接到上游3’剪接位點(剪接受體),因此重組環狀RNA分子可進一步包含反向剪接點。在一些具體實施例中,IRES可位於反向剪接點的約100到約200個核苷酸內。另外,已觀察到具有較高G-C含量的RNA區比具有較低G-C含量的RNA鏈具有更穩定的二級結構。因此,在一些具體實施例中,重組circRNA分子的IRES可進一步包含最低程度的G-C鹼基對。例如,重組circRNA分子的非天然IRES可包含至少25%(例如,至少30%、至少35%、至少40%、至少45%、或更多),但不超過約75%(例如,約70%、約65%、約60%、約55%、約50%、或更少)的G-C含量。在一些具體實施例中,IRES具有至少25%的G-C含量。
可使用本發明所屬技術領域已知的任何方法,諸如化學作圖方法,來測量給定核酸序列的G-C含量(請參見例如Cheng等人, PNAS114(37): 9876-9881 (2017);以及Tian, S.與Das, R., Quarterly Reviews of Biophysics49: e7 doi:10.1017/S0033583516000020 (2016))。
編碼用於本文揭露的circRNA分子的IRES的示例性序列在表1A及表1B中列出。因此,本揭露內容進一步提供重組環狀RNA分子,其包含蛋白質編碼核酸序列及以非天然構型可操作地連接到蛋白質編碼核酸序列的IRES;其中IRES由表1A及表1B中列出的任一個核酸序列編碼。
在一些具體實施例中,IRES由表1A中所示的任一個核酸序列編碼。在一些具體實施例中,IRES由與表1A的一或多個核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98、或至少99%一致性的核酸序列編碼。在一些具體實施例中,IRES由核酸序列編碼,該核酸序列相對於表1A中的任一序列具有至少1個、至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、或更多個核苷酸置換。
在一些具體實施例中,IRES由表1B中所示的任一個核酸序列編碼。在一些具體實施例中,IRES由與表1B的一或多個核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98、或至少99%一致性或同源性的核酸序列編碼。在一些具體實施例中,IRES由核酸序列編碼,該核酸序列相對於表1B中的任一序列具有至少1個、至少2個、至 少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、或更多個核苷酸置換。
在一些具體實施例中,IRES由表1B中的索引876(SEQ ID NO: 553)、6063(SEQ ID NO: 2292)、7005(SEQ ID NO: 2624)、8228(SEQ ID NO: 3064)、或8778(SEQ ID NO: 3266)所示的核酸序列編碼。在一些具體實施例中,IRES由SEQ ID NO: 32956的核酸序列編碼。
在一些具體實施例中,IRES由與表5的一或多個核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98、或至少99%一致性或同源性的核酸序列編碼。在一些具體實施例中,IRES由核酸序列編碼,該核酸序列相對於表5中的任一序列具有至少1個、至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、或更多個核苷酸置換。 5 :編碼 IRES 序列的示例性序列
寡核苷酸標識符 序列 SEQ ID NO:
4173 CATCCTCCTGCTGAAGTGACAAGCCACGCTGCTTCTGGAGCCAAAGCTGACCAAGAAGAACAAATCCACCCCAGATCTAGACTCAGGTCACCTCCTGAAGCCCTCGTTCAGGGTCGATATCCCCACATCAAGGACGGTGAGGATCTTAAAGACCACTCAACAGAAAGTAAAAAA 38403
2125 GCAGAAGGGAAACGTGAAGAAGGTGAAGATGGCGGTGGCCAGGGCCGGGGTCTTGGGAGTCCAGTGGCTGCAAAGGGCATCCCGGAACGTGATGCCGCTGGGCGCACGGACAGCCTCCCACATGACCAAGGACATGTTCCCGGGGCCCTATCCTAGGACCCCAGAAGAACGGGC 38404
6742 AGACTCGGGAACTGCCTGAATGTGGTTTGGGACACGAGACCTCATCATATTGATGAGCGAACAAACAAGAACATTTCCTCCCTCCCCTCCTTTGAATTGAAATGGCACATTAAGACTTGTCACGGCTTCTCACTGGGACTGGAGACCTCGTTCCTTCACCCCGCGTGTCGCCAG 38405
8839 AGGTGGGCGGTGGCGGTAGGTGGGTGGCCAGCGACTGGCAACGCGGTGGCTTAGACGCGCGAGATCCGGCCAGGGTCAGAGTACTGTAAGATTGATGTTAAAGGCATGGTGTTCACCCCACTTCATCAGCGTACATAAGTTATCTCTTCTTTTGGACCCTTATTTTATGCCATA 38406
8279 GGAGGCAGGTTGATGTGTTTGTGCTTCCTTCTACAGCCAATATGAAAAGGCCTAGTAAGTGGGGTCGGGAGGCGGGCGTGGAGGGACCCACGTCTGGAAGTTGCTGCAGCCACCACGACGCTCTTCTACGGCTACGGCTTTGTCTCTGCTGAGTTAAAGAAAGCAAGTAAACGC 38407
1637 ATTTATAAGCAATAGTAGCTTATTTGGCTCACAGTTCTGGAGGCTGAGAAGATCGTGAGGCTGCATCTGGCAAGGGCCTTCTTGCTGCTTCATAACATGGCAGAAGACATCATGCGGGTGTGTGTCTGGGGAAGAGACTTACAGAAGTGGAGTTGCTGAGTCAAAGATCTAACC 38408
27147 TCTTTTGGTGCAGAAGGTGACGGGAAACAGGCCGCAGACCTGAACTTCCAACCGTATGTAGGCGAGAAGCCGGTGCCGATACTCCCACTATCCCACAATGTCCCACTGGGCCCCAGAGTGGAAGAGGGCGGAGGCTAATCCAAGAGACCTTGGGGCCAGCTGGGATGTCAGGGG 38409
7408 ATCCACCATGAAGCAGAATCTAAAGAAAAAGGTCCAAGCATGAAGGAACCAAATCCAATTTCTCCACCAATTTTCCATGGTCTGGACACCCTAACCGTGATGGGCATTGCGTTTGCAGCCTTTGTGATCGGAGCACTCCTGACGGGGGCCTTGTGGTACATCTATTCTCACACA 38410
29135 CAGATTAGAGGACGGGCGCTTTGGAGCCGGCCCCAGGCAGCGTGTGTCGGTCGCCTAGTCTGGAGAACTAGTCCTCGACTCACGTGCAAGGATGATGCTGAAAGGAATAACAAGGCTTATCTCTAGGATCCATAAGGCCAAGCATGGGGATCAGCACGAGGGTCAGCACTACAA 38411
7806 CTCTCGGGGGCCAGGGGTCATCGGTTTGACCCCTGACCTATAAGCCAAGATACCCCATAAACACACTCAGAAAGCAGAGAAAAAGGACAAGAGTCTGTGTTTGAGAGGGGGTCTGCCATTCCTGCTTGGGGACTGGTGGGGAAGAGGGCCAGGACATCTTCTGAGCCAGGACGT 38412
661 AGTCTGGCTGCGGCGGCAGAGCTGAAGTGAGCGGAGCCACCAGGAGGCCATGTCGGGTGAGGACGCTGAGGTCCGGGCAGTCTCTGAAGATGTCTCCAATGGAAGCAGTGGCTCGCCCAGCCCTGGGGACACACTGCCCTGGAACCTTGGGAAAACGCAGCGGAGCCGGCGCAG 38413
1258 ATCTGCCTCAGCCTCTTTGTCACTGCCTGGACCATTGTCCCTGCTGTTTCTCAGACAGCATAGAGGCTGAGGCTGGGGCCAGGACCCAGACAGAGACACACGGTCACTGCAGCTGAAGCCGCTGCCCCTGCTACAGGCACCACCAGGACCAGCTGATCATTCCAGCCCACAGCA 38414
6757 CTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGC 38415
5825 CTCAAGGTTTTGAAGAGACAGGGGACACGCTCTATGCCCCCTATTCCACACATTTTCAGCTGCAGAACCAGCCTCCCCAAAAGGAATTCTCCATCCCACGGGCCCACGCTTGGCCGAGCCCTTACAAAGACTATGAAGTAAAGAAAGAGGGCAGCTAACTCTGTCCTGAAGAGT 38416
27115 GCTTCCGTAGAGGCCAGCTGGTTGCTACGCAGCAACAGGAAACATTCCGCGCTACCGAGTACTTTCTACTCCCGACCAGGCATTGCTCTCTCTGGAGACCCTCGGCGGTGGTTGCTGTATTTTGACTTGGAGTAAGGATGACTTTTCGGGCCACAGATAGTGAATTTGACCTGA 38417
3130 CTGGAGGGCCGCACTCCCGTTCCAGCCAGGCTGAGCCTTCTGTCCCCTGCCTCTGGGGCCTGGGAACCCCCCTTCTTCTTTCTCCTGAATGGCACCCCCGCCCTAGAATCCAGACACCGAGTTTCCCACTGTGGCTGGTTCAAGGAGCTCCCTGGTGACAGTCTGTGGCTGAGC 38418
5065 TAGAGTGGGGGGTGGAAGATGATTCTCGCCTGTTGCTGGGGATTTATGAACATGGCTATGGAAACTGGGAGTTAATTAAAACAGACCCAGAGCTTAAATTAACTGACAAAATTCTGCCGGTGGAGACAGATAAAAAGCCTCAGGGGAAGCAGCTACAGACCCGAGCGGATTACT 38419
8066 AGCGGCTGCAGCATCCAGCCAGCTTGGATGTCTGGCCTGTGAGCCTGGGGAAACTATTATTAATAATATTTACTGTTGATAATATTGGGGAAAACAGCCCTTAACTCTGAGGTTTCTGCTGTGCTCCTTTCCAAAACAGACTTCCAGGACTCTGAAGAAACAGTTACAAGCAGG 38420
1952 AAGGGAGGAGGCGCCGAGCTGACCGGGCGACGCCGCGGGAGGTTCTGGAAACGCCGGGAGCTGCGAGTGTCCAGACACTTCCCTCTGTGACCATGAAACTCTGGGTGTCTGCATTGCTGATGGCCTGGTTTGGTGTCCTGAGCTGTGTGCAGGCCGAATTCTTCACCTCTATTG 38421
5020 GCGAACTGAAGGTGGCCCAAGGGAAGGCTCTGCAAGAGAATTTGGCCCTCCTGACCCAGACCCTAGCTGAAAGAGAAGAGGAGGTGGAGACTCTGCGGGGACAAATCCAGGAACTGGAGAAGCAACGGGAAATGCAGAAGGCTGCTTTGGAATTGCTGTCTCTGGACCTGAAGA 38422
8766 AGGAAGCCGAGGAAGGCTGTGTTTCTGACTCACACGGGGGAGTCGGGGGAGTCGTAAACAACCCTGAAGAGAACAGCCAGGCCTGGCGCTCTGGGCTTGGTCCTGGGACACCCGTTTGACACTGTAAAGGTGAGGCTGCAGACCCAGACCACCTACCGGGGCATCGTTGATTGC 38423
27433 CTGCCTCCCCCCCGCTCCCGCTCCCCTGAGCCCAGCCAGACCCCGCGCCGCCCGCGCCCCGCTCGACTCCGGAGGCTCCCGCAGCCCCGGCGTCCGCCCCGCTGCCCCCTCCCCCGGGGGCCATGGGGGCGCCCCCGGGCTACCGGCCCTCAGCTTGGGTGCATCTCCTCCACC 38424
27818 CTCAGTGAAGCAACGAGGATGCCGGGGAGAGGGAAGGGGCTGGGCTCTGGGCGGTGCCAAGTCTGTGAGGGGGCGCGGTCACCGCCCAGGGTTCCCACGAACGCCAAGGCGGCCACGTCCTGCTCCCCCTGGTGAAGAAGCTGCCCTGGGCTTGTCGTCCTAGGGTCTCCAGAC 38425
8861 CTGATGTGAGCTAGTTTGTCTGGTTGAGTTGGATGTTTAAATAGAAGGCAGAACAACAACAGGTACTCCACATCAGCATTCTCAAGACTGGAGAAGTTAGGCCTCAGACATCCCAAGCCTTCTCCTTTCATTGGAAACTTGACATTTTTCCGCCAGGGTTTTTGGGAAAGCCAA 38426
8040 GCCACATTCCACACTAACGTGTTGGTGAATTCTTCTGGGCATTGCCAGTACCTGCCTCCAGGCATATTCAAGAGTTCCTGCTACATCGATGTACGCTGGTTTCCCTTTGATGTGCAGCACTGCAAACTGAAGTTTGGGTCCTGGTCTTACGGAGGCTGGTCCTTGGATCTGCAG 38427
27907 TCCTGCCTCGGCAACCCCGGGCCCTGAGGGCAGGCCCCAACCGCGGAGGAGCAGGAGAGGGCGGAGGCCGGCGGGCCATGCCCTGGTCGTCCCGCGGCGCCCTCCTTCGGGACCTGGTCCTGGGCGTGCTGGGCACCGCCGCCTTCCTGCTCGACCTGGGCACCGACCTGTGGG 38428
2392 AAGTTTGAAACTGGTAACTTCGGGAGTTGAGCCACGAGCTGTTGTGCATCCAGAGGTGGAATTGGGGCCCGGCATTCCCTCCTCGTCCCGGGCTGGCCCTTGCCCCCACCCTGCAACTCCTGGTTGAGATGGGCTCAGCCAAGAGCGTCCCAGTCACACCAGCGCGGCCTCCGC 38429
7802 AGCCTTCGCTGGATCTCCTTCCCGAACTCACAAATCCTGACGAGCTCCTGTCTTATCTGGACCCCCCCGACCTGCCGAGCAATAGTAACGATGACCTCCTGTCTCTATTTGAGAACAACTGAGGGCCACCCGGTCGGGGCCATCCCTCCACACTCTGCATCCTACCCCACCTAC 38430
7655 TTTTTAGAGGTTGGTTGTTGTGTTTTAGGATTCTGTCCATTTTCTTTTAAAGTTATAAACACGTACTTGTGCGAATTATTTTTTTAAAGTGATTTGCCATTTTTGAAAGCGTATTTAATGATAGAATACTATCGAGCCAACATGTACTGACATGGAAAGATGTCAAAGATATGT 38431
981 AGCCAGCGGACGTCCAGGAACCGGGATGCCTCCAGCAGTGAGGCGGTCAGCCTGCAGCATGGGATGGCTGTGGATCTTTGGGGCAGCCCTGGGGCAGTGTCTGGGCTACAGTTCACAGCAGCAAAGGGTGCCATTTCTTCAGCCTCCCGGTCAAAGTCAACTGCAAGCGAGTTA 38432
5027 GGGACCAGGAACTGGAGGCTCTGCAGCAAGAACAGCAGCAGGCCCAGGGACAGGAGGAGAGGGTGAAGGAAAAGGCAGACGCCCTCCAGGGAGCTCTGGAGCAAGCCCATATGACACTGAAGGAGCGTCATGGAGAGCTTCAGGACCACAAGGAACAGGCACGAAGGCTGGAGG 38433
7683 CTACTCCGGAGCCTGAGGTGGGAGGATCGCTTGAGTCTGGGAGGCAGAGGCTGCATTGAGCTATGATCATGGCACTGCATTCCAGCCTGGGTGACAGTGCAAGACCTTGTCTCAGAATAAATAAAGTATGTGATGAAGATGTGCATACATTATATGCAAATACTGTTTTTTTTT 38434
8650 CACCAATTCGGCTGGCGTCTCCGAGACCGCGGACTCCCGTAGGGTCCCCGTGGCCCCGAGTTGTAGTCGGGACACCCCGGCCGCGGGTGATCGTCGGGTCTCCACGCGCCCGGGTCGCTGACGCGGATCCGGCCTCGGCGCCTTCTCAGGGCGCCCTGCAAGGCCGCAGGCAGG 38435
6898 CCTCCTCTCTGGCTAATCAACAGCTGCCCCCAGCCTGTGGTGCCAGGCAACTCAGCAAGCTGAAAAGGTTCCTTACTACCCTGCAGCAGTTTGGCAATGACATTTCACCCGAGATAGGAGAAAGAGTTCGCACCCTCGTTCTGGGACTAGTGAACTCCACTTTGACAATTGAAG 38436
2042 TTTAGTGTCACAGGAGACACGAGGGCAAAGTGCTGAGGAAACTCTAGAGCAACATCGGAATGCATGGTGAAGCATCAGATGGTGAAGGAGAAGGAGACACAGAAGTGATGCAGCAGGAGACAGTTCCAGTTCCTGTACCTTCAGAGAAAACCAAACAGCCTAAAGAATGTTTTT 38437
1686 GCCACTTCTCTTCCCTTCATTCTTCGCCAGGCTCTCTGCTGACTCAAGTTCTTCAGTTCACGATCTTCTAGTTGCAGCGATGAGTGCACGAGTGAGATCAAGATCCAGAGGAAGAGGAGATGGTCAGGAGGCTCCCGATGTGGTTGCATTCGTGGCTCCCGGTGAATCTCAGCA 38438
5902 CTTCAACTTGGCAACAGTTGCCTGGGGTAGCTCTACACAACTCTGTCCAGCCCACAGCAATGATTCCAGAGGCCATGGGGAGTGGACAGCAGCTAGCTGACTGGAGGAATGCCCACTCTCATGGCAACCAGTACAGCACTATCATGCAGCAGCCATCCTTGCTGACTAACCATG 38439
3399 CACCCTGACCCAAGCCGAGACAGGTTCCAAACCTCAACCTGCAGCCGGAAGGGGGAAGTGAAACTCGGCTGGGGGTGGGGGCTCAGAAGCCGCCCCAGAAAGCACTGAAAGCCACAGCACGTACACCCACTCCAGGGATCTGCCAGCACCCTGTGGGGCCCAGACTACAGGCTG 38440
6560 GGGACGCCATTGTGATTGGGGCGGGGATCCAGGGCTGCTTCACTGCATACCACCTGGCCAAACACAGGAAGAGGATCCTCCTGCTGGAGCAGTTCTTTCTACCACACTCCCGAGGAAGCTCCCATGGACAAAGCCGGATAATCCGAAAGGCGTACCTGGAAGACTTTTACACCC 38441
2890 CACCGTAGTGCTTAGAGGCCGAAAAAGTACAGCCCCTTCCGGGCTCCGCGGTACGGGAAGACAGCTTTGGGATGTCGGAAGATCCTAGAGGTCCCAAGGTACCACGAAAGGCAGTGGTAGAAAAGCCAGCTCGGGCAGCAGAGCGAGAGGCCCGGGCCCTGCTGGAGAAGAACC 38442
4343 ATTGGCTGAGCCCGGCTGTCAGTCCTTTCGCGCCTCGGCGGCGCGGCATAGCCCGGCTCGGCCTGTAAAGCAGTCTCAAGCCTGCCGCAGGGAGAAGATGGCGGTCGCCGTGAGAACTTTGCAGGAACAGCTGGAAAAGGCCAAAGAGAGTCTTAAGAACGTGGATGAGAACAT 38443
6138 ACAAGGAGACTGGGAGGTGTCTCAAGTGCCTGTACCACACGGAAGGGGAACACTGTCAGTTCTGCCGGTTTGGATACTATGGTGATGCCCTCCAGCAGGACTGTCGAAAGTGTGTCTGTAATTACCTGGGCACCGTGCAAGAGCACTGTAACGGCTCTGACTGCCAGTGCGACA 38444
2241 GAGGAAGGAGAGAGTGGAGGAGGAGGGCTTTGGGTTAGGGAGAGTGCTTTCGTTTGTTTTAAATGGGAGAAACTGGAGCATGTTGCCAAGGGCAGAGAGCCAGCAGAGAGGGGTGAATGGAAGAAGGAGCGAGAAGGGGGTTACTGACGAAGCCTTATCCTGGAGGAGAGAAGG 38445
5715 CAAGTGGTCCTGTCGAAGTATTTATCACTGAGACTCCGAGTCAGCCCAACTCCCACCCCATCCAGTGGAATGCACCACAGCCATCTCACATTTCCAAGTACATTCTCAGGTGGAGACCTAAAAATTCTGTAGGCCGTTGGAAGGAAGCTACCATACCAGGCCACTTAAACTCCT 38446
3456 CTAGACCAAAGGGTGCGGCTGCTGCAGAGGTGGCTGATGCAGGTTTCCATCCTTGGGGAATGACCACGCAACTGGGCCCAGCCCTGGTGCTGGGGGTGGCCCTGTGCCTGGGTTGTGGCCAGCCCCTACCACAGGTCCCTGAACGCCCCTTCTCTGTGCTGTGGAATGTACCCT 38447
5260 ATCTCCAGCCATTGCTCCTCCAACAGAGACCATGGCTCCTCCAGTCAGGGATCCTGTTCCTGGGAAACCCACGGTCACCATCCGGACTCGAGGCGCCATTATTCAAACCCCAACCCTAGGCCCCATCCAGCCTACTCGGGTGTCAGAAGCTGGCACCACAGTTCCTGGCCAGAT 38448
1288 GGAGGCAGGCGGTGCCGCGGCGCCGGGACCCGACTCATCCGGTGCTTGCGTGTGGTGGTGAGCGCAGCGCCGAGGATGAGGAGGTGCAACAGCGGCTCCGGGCCGCCGCCGTCGCTGCTGCTGCTGCTGCTGTGGCTGCTCGCGGTTCCCGGCGCTAACGCGGCCCCGCGGTCG 38449
8756 CACCCCCACCGACCTCTCGGAGACAGGAATCCGCTCTGCCCCTGCATCCTCCTCTGCTCACCCTTCTCTCAGTAGTGTTTGTCAGACACCAGTCCGGACCTCAGCTCTCGATCTAGTTCCCGAGTAAGATTTAGCTCCCGGGAAAGCGTGCCTGAAACAAGCCGGAGTGAGCCT 38450
8952 CCTGTACCATAACCAGGAGGCTGATGGTTGCTCAGGCCTCCCTCAAACTAGCCAATGAGAAGTGCACGGGTCCTGGTCGCCTAGGAAACCGCGTGACAACAAGATGGCGGCGCTGCGGGACGGCTAGCGGCCCTGCGTGGGAGTTCCTGACAGCTGGATTCTAGAAGTAGAACT 38451
2759 TTCCCCGGAAGTGTTGGTTAAAGCCCCTCCAATCAGCGGCTCGGTGCGGCAAGTTTGAATTTCGTGGAGGCTCGGGTTGTGAGGGTTCCTGCTTCGGAGTCGGCGGTGGTCGTCCAGACCGAGTGTTCTTTACTTTTTGTTTGGTTGAGGTTTCACGCTAGAAGGTGGCTCAGG 38452
1241 CTGTCCATACACTCTCTCATCATCCTGTTCCTTGGATTGGACTTCACTAAGCAATTTATCACTCACCTTCAGACTTACATGTGGGAGTTTTCACAACAGTAGTTTTGGAATCATTAGAACTTGGATTGATTTCATCATTTAACAGAAACAAACAGCCCAAATTACTTTATCACC 38453
28013 GAGCTCCAGCCTCCAGGCACCCGGGATCCAGCGCCGCCGCTCATAACACCCGCGACCCCGCAGCTAAGCGCAGCTCCCGACGCAATGGACCCGGCGCTGGCAGCCCAGATGAGCGAGGCTGTGGCCGAGAAGATGCTCCAGTACCGGCGGGACACAGCAGGCTGGAAGATTTGC 38454
4681 TGTTGACTCATGCAAATGAGGTATCTGAACTGCAGCTTCAGTATTAGCAGAGCCACAGGCCGCCTCTGTGGCATCACCAGGGTTTCTCTGAAGAAGAGGGTCTGCATTTTCCTAAACCCAGTGCTGCTCTCCCATCTCCCATCTTCCTCTCGCAGCTTGATGAGCCCCGGTGTG 38455
5602 TGCCCCAGCCCTCAGGGCCGCCAGCAAGGAAGAAATTTGTGATACCCCTCGACGAGGATGAGGTCCCTCCTGGAGTGGCCAAGCCCTTATTCCGATCTACACAGAGCCTTCCCACTGTGGACACCTCGGCCCAGGCGGCCCCTCAGACCTACGCCGAATATGCCATCTCACAGC 38456
1945 GAGAGGCCGGCGTCTCTCCCCCAGTTTGCCGTTCACCCGGAGCGCTCGGGACTTGCCGATAGTGGTGACGGCGGCAACATGTCTGTGGCTTTCGCGGCCCCGAGGCAGCGAGGCAAGGGGGAGATCACTCCCGCTGCGATTCAGAAGATGTTGGATGACAATAACCATCTTATT 38457
5229 AACCCCAACCCTAGGCCCCATCCAGCCTACTCGGGTGTCAGAAGCTGGCACCACAGTTCCTGGCCAGATTCGCCCAACGATGACCATTCCTGGCTATGTGGAGCCTACTGCAGTTGCTACCCCTCCCACAACCACCACCAAGAAGCCACGAGTATCCACACCAAAACCAGCAAC 38458
7542 CTGCAGCATCTTCTACGTCGGGACCACAGCCTCCGCCTCCACAAAGCCTGAACCTCCTTTCGCAGGCTCAGCTGCAGGCACAGCCTCTTGCGCCAGGCGGAACTCAAATGAAAAAGAAAAGTGGCTTCCAGATAACTAGCGTTACTCCTGCTCAGATCTCCGCTAGTATCAGCT 38459
6866 CCAATACCTGGGATCCATTGCCTCTCCTTCTGTGCACCCAGCAACGCCCATTTCACCTGGACGTGCCAGCGGCATGACAACCCTCTCTGCAGAACTTTCCAGTCGACTCTCAACGGCACCCGACCTGACAGCGTTCAGCGACCCGCGCCAGTTCCCCGCGCTGCCCTCCATCTC 38460
1849 TCTCTTGCTTCAACAGTGTTTGGACGGAACAGATCCGGGGACTCTCTTCCAGCCTCCGACCGCCCTCCGATTTCCTCTCCGCTTGCAACCTCCGGGACCATCTTCTCGGCCATCTCCTGCTTCTGGGACCTGCCAGCACCGTTTTTGTGGTTAGCTCCTTCTTGCCAACCAACC 38461
2558 AGTTACCTCTCCCCTTTCACGTAGTTTTCATTTGTGGTGAGATTCTCTCCCAGGCCACAAGACATTTCCTGCTCGGAACCTTGTTTACTAATTTCCACTGCTTTTAAGGCCCTGCACTGAAAATGCAAGCTCAGGCGCCGGTGGTCGTTGTGACCCAACCTGGAGTCGGTCCCG 38462
2109 ATCAGCCCAAAGGTAGGCTCAGGCTCCGACGGTGGCCGGCGGGGGTCACGAGGCTTCGTAGTGGAGGAACGGGTTTGGCGTGTGGGACGCAGCTGCCTCTGTACTGGGGAGTCACGGAGTGGCCGGGCTCCAGGGACATGGCGGCGGCCTCTGCGGTGTCGGTGCTGCTGGTGG 38463
297 ATCCGGAGGCAGCCTGCAGGAAGCCGTAGCGCCGGTACGTGCCCCTCTCCTGTCTGGAGGCGGGTGTAGAAGTCCGACCGCGGAAGCCAGACTGCTGTCCAGTCGGCGAGCGCGTACCATTCAGCATCGGCTCCGCCCGAGTCCCACCTTCCTCAGGCTCTGATTGGCTGACAC 38464
2621 CAACAGAAGCCAAGAAGGAAGCCGTCTATCTTGTGGCGATCATGTATAAGCTGGCCTCCTGCTGTTTGCTTTTCATAGGATTCTTAAATCCTCTCTTATCTCTTCCTCTCCTTGACTCCAGGGAAATATCCTTTCAACTCTCAGCACCTCATGAAGACGCGCGCTTAACTCCGG 38465
6574 TGGCTGACACATTCCTGGAGCACATGTGCCGCCTGGACATTGATTCACCACCCATCACAGCCCGGAACACTGGCATCATCTGTACCATTGGCCCAGCTTCCCGATCAGTGGAGCTGAAGAAGGGAGCCACTCTCAAAATCACGCTGGATAACGCCTACATGGAAAAGTGTGACG 38466
1033 GACATTTACATCCTGCCCAGCGACAACTCTGGACAAGTCAGTCCCCCAGAGTCTCCAACTGTGACCACTTCCTGGCAGTCTGAGAGCTTACCTGTGTCACTGTCAGCTAGCCAGAGTTGGCACACAGAAAGCCTGCCAGTGTCACTAGGCCCTGAGTCCTGGCAGCAGATTGCA 38467
8789 CCTCTGACTTGACCCAATGAAAGAAGCATATGGCACTTGTGAAGATAAATGTTACTCCTCCCTTTTTAATTGGAACTTCTGCTTAGGACCTGTGTATGACGTTTCACCTGTGATCTGTTCTTTCGGTAGCCACTGACTTTGAGTTACAGGAAGGTCTCCGAAGATTTGTGTCAA 38468
6392 CTTCCCTGAGGAGGACGACCCCACCAACTGGCTGCGTTGCTACTACTACGAAGACACCATCAGCACCATCAAGTCTGTGGCCTGGGAGGGAGGGGCCTGTCCAGCCTTCCTGCCATCCCTACGACCACTGCCCCTCACATCACCTTCTCATGGGTCCCTCTCCCACTCCAAAGC 38469
6885 ATTTATGATTTCAACATGGATACATATTTCAGTTCTTTCTTTTTCTCACTATCTGAAAATACATTTCCCTCCCTCTCTTCCCCCCAATATCTCCCTTTTTTTCTCTCTTCCTCTATCTTCCAAACCCCACTTTCTCCCTCCTCCTTTTCCTGTGTTCTCTTAAGCAGATAGCAC 38470
561 CCCTTCCGGCTGGCCCCGCTCAGTCACCCGCAGCAGGCGTGCAGTTTCCCGGCTCTCCGCGCGGCCGGGGAAGGTCAGCGCCGTAATGGCGTTCTTGGCGTCGGGACCCTACCTGACCCATCAGCAAAAGGTGTTGCGGCTTTATAAGCGGGCGCTACGCCACCTCGAGTCGTG 38471
7556 ATACAAATTTGCCTTTGGCACAACAGATACCACTAAGTTCTACCCAGTTCTCCGCACAATCATTAGCTCAGGCAATTGGAAGCCAAATTGAAGATGCCAGGCGTGCAGCGGAGCCCTCCTTAGTTGGCTTACCTCAGACTATCAGTGGTGACAGTGGGGGAATGTCAGCAGTTT 38472
8800 TCCGTCCTCCAGGATCTGGGGAGAAAGAGCCCCATCCCTTCTCTCTCTGCCACCATTTCGGACACCCCGCAGGGACTCGTTTTGGGATTCGCACTGACTTCAAGGAAGGACGCGAACCCTTCTCTGACCCCAGCTCGGGCGGCCACCTGTCTTTGCCGCGGTGACCCTTCTCTC 38473
5781 GTTTACTTCCCCTGCCAGCATTGGGGTGCTCTCTAAGCAACAGTAGGCGGAGAGTGGTCTGGCGTATTAAAAACAAAGGATCGTCAAGTGGGCCTTCCCAGGCATTGCTTTGACTTAGTACATGTAGAGGATGTGGCAGTTCTCTCCGTCCCTGCCACTGCTGGTTTCTTTGTT 38474
2930 TATTTTAAGCCCAGTCTTCCCTGGGCCACCTTTAGCAGATCCTCGTGCGCCCCCGCCCCCTGGCCGTGAAACTCAGCCTCTATCCAGCAGCGACGACAAGTAAAGTGGCCCGCCGGTTTCTGAGCCTTCTGCCCTGCGGGGACACGGTCTGCACCCTGCCCGCGGCCACGGACC 38475
3426 CCAGCGGAAGTAATTCTTTCGACTGCCCCGGAACCCACCGGAGCAGGCAGCTGGGGGTGGGGGGGCGGCCCTGGGATAGGGGCTGTGGCAGTACGCGGGGACCCGGCTGCGGTGGCTGCGGGACTGACGAATGGAGAGGAGAAAACCTATGGTGGCTGTGAAGGACCTGATGCC 38476
5800 ATGGGGAAGGTGAAGGTCGGAGTCAACGGATTTGGTCGTATTGGGCGCCTGGTCACCAGGGCTGCTTTTAACTCTGGTAAAGTGGATATTGTTGCCATCAATGACCCCTTCATTGACCTCAACTACATGGTTTACATGTTCCAATATGATTCCACCCATGGCAAATTCCATGGC 38477
27433 CTGCCTCCCCCCCGCTCCCGCTCCCCTGAGCCCAGCCAGACCCCGCGCCGCCCGCGCCCCGCTCGACTCCGGAGGCTCCCGCAGCCCCGGCGTCCGCCCCGCTGCCCCCTCCCCCGGGGGCCATGGGGGCGCCCCCGGGCTACCGGCCCTCAGCTTGGGTGCATCTCCTCCACC 38478
424 ATTTCTGGGAAGCAGTCGATATTATCTGTACGCCTAGAACAGTGCCCTCTGCAGCTGAATAACCCTTTTAACGAGTATTCCAAATTTGATGGCAAGGGTCATGTAGGTACAACAGCAACCAAGAAGATCGATGTCTACCTCCCTCTGCACTCGAGCCAGGACAGACTGCTGCCA 38479
28259 CTCTGGTGATACAGAAGAAAAGACAGTCTCCATTTTCAAACAGTCCCTCCTGGGAGAACACAGACAGGCAGAGGATTACAACACAAGGCAGCAAGCACTGGGAGACGAAAGTTTTGGCATCTGTTCCCTGGCTGTGCCAAGATGGGCGATTGGAGCTTCCTGGGAAATTTCCTG 38480
6972 GTCTACTATGTCTGAACTGTGGTTTCTTGTTTATCCTTTTTTCCTTAGTTGGACTGTAATGTATGGTCTGTCAACCTGTGAATCTTTAAAGTATGATTCAGGTATTGTTGTATTCTTTACTGTGTAATAAAAAAGTTGAAAAAAATCTGGATCCTCTGTCTCCCTCGTCCCCGG 38481
417 TTTCGTGACCTTGTCCAGTAGAAGGCTATTTAATTTTCACAACTGCTTGAATTTTGACATACAAGATGAAGCAAGATGCCTCAAGAAATGCTGCCTACACTGTGGATTGTGAAGATTATGTGCATGTGGTAGAATTTAATCCCTTTGAGAATGGGGATTCAGGAAACCTAATTG 38482
8182 TGTCTGCACCAGCCGGCCTCCAGCCTGGCTGGACCCTGCTGCCTGTGTGGCCCGGAGCCAGAGGCCCCCACACTCCCAGCTGCTCTTCTACAGATGCCATCAACGAGCAGGACTCTGGGTGGCTCCACTGTCTAAGGGCTCTGCGAGTGACCCGGCGGGCGAGCTCCGTGCTGC 38483
7572 CTTACGTAGTAATTACATTTCCTTGAAAAAACTATAGTGAATAGAAATCCCTAGCCATTTCATTTTTTATGTTTTTAATGAAGATCTTTAAAATACCATAGGTGGTAATCGTGGAAAATTTGAAAAATCTCATGTCAGTGTATTAAGATGGTGGAGAAGTTTTTTTCTCCATTA 38484
1415 ATTCATGAAAATCCACTACTCCAGACAGACGGCTTTGGAATCCACCAGCTACATCCAGCTCCCTGAGGCAGAGTTGAGAATGGAGAGAATGTTACCTCTCCTGGCTCTGGGGCTCTTGGCGGCTGGGTTCTGCCCTGCTGTCCTCTGCCACCCTAACAGCCCACTTGACGAGGA 38485
7327 GAGCTTCCAGGGATATTTGAGGCACCATCCCTGCCATTGCCGGGCACTCGCGGCGCTGCTAACGGCCTGGTCACATGCTCTCCGGAGAGCTACGGGAGGGCGCTGGGTAACCTCTATCCGAGCCGCGGCCGCGAGGAGGAGGGAAAAGGCGAGCAAAAAGGAAGAGTGGGAGGA 38486
705 GCCCCCTCCCCTGACTATCAAAGCAGCGGCCGGCTGTTGGGGTCCACCACGCCTTCCACCTGCCCCACTGCTTCTTCGCTTCTCTCTTGGAAAGTCCAGTCTCTCCTCGGCTTGCAATGGACCCCAACTGCTCCTGCGCCGCTGGTGTCTCCTGCACCTGCGCTGGTTCCTGCA 38487
8561 AGTCGCATAGTGGTTTTTCCGCTCGCGTCGCTGTGTGAAAGTTGGCTCGCCGCTCTTTGCACGCCCTCCCTGGAGGCCGACCCGAGACGCCAAGCTGGAGAGACCGTGCCTCCCCGAGGCCGGCCGCCCCGCGAGCACAGCCTCCGCCCCCGTTGCACTGCCGGGCTGGGCAAT 38488
1679 GGTGGCGGGAAGAGGAGGCGCGAGAATGGAGGTGGAGGCCGTCTGTGGTGGCGCGGGCGAGGTGGAGGCCCAGGACTCTGACCCTGCCCCTGCCTTCAGCAAGGCCCCCGGCAGCGCCGGCCACTACGAACTGCCGTGGGTTGAAAAATATAGGCCAGTAAAGCTGAATGAAAT 38489
5635 TATTTCCCTCTACTGAGTAAACCCTATCTGTGATTCCCCCAAACATCTGGCATGGCTCCCTTTTGTCCTTCCTGTGCCCTGCAAATATTAGCAAAGAAGCTTCATGCCAGGTTAGGAAGGCAGCATTCCATGACCAGAAACAGGGACAAAGAAATCCCCCCTTCAGAACAGAGG 38490
5583 TGTTACTTAAGAATGCTTTCCAGGTGGAAAGTTCCTTAAGTTTGAGGCTTCAAATTCCATACAGCACATTAAAATCCCATTCATGAGTTTGAAATACTGCTCTGTTGTCTTGGAAATACCAATCAGATTGTTGGCTGAAGTGATGTGGATAAAGAAGGGATCTTAGAAAAACTA 38491
9027 ACGAAGTTCCGGAAATGGAATTACCGAGTCAGATGAGAAACACAAGTCATCAATGAATTAACAAGCAACACATTGTCACATCCAGCTGTTGAAGAGTGGTTAACTCAGCTTGATCTCCGAAGACTCTTCTGCACCCCACCCCGCCCCCAACTGCTTTCCAAAGAGAAACAGAAA 38492
IRES可為任何長度或大小。例如,IRES的長度可為約100個核苷酸到約600個核苷酸(例如,長度為約200、約225、約250、約275、約300、約325、約350、約375、約400、約425、約450、約475、約500、約525、約550或約575個核苷酸,或由上述值中的任意兩個所定義的範圍)。在一些具體實施例中,IRES的長度可為約200個核苷酸到約800個核苷酸(長度為約200、約210、約220、約 240、約260、約280、約320、約340、約360、約380、約420、約440、約460、約480、約500、約520、約540、約560、約580、約600、約620、約640、約660、約680、約700、約720、約740、約760、約780或約800個核苷酸,或由上述值中的任意兩個所定義的範圍)。在一些具體實施例中,IRES的長度可為約200到約400、約400到約600、約600到約700、或約600到約800個核苷酸。在一些具體實施例中,IRES的長度約為210個核苷酸。在一些具體實施例中,IRES的長度可為約100到約3000個核苷酸。
在一些具體實施例中,環狀RNA分子包含IRES序列,該序列由來自表1A或表1B的DNA序列編碼的序列所組成。在一些具體實施例中,環狀RNA分子包含由來自表1A或表1B的DNA序列編碼的IRES序列,其中IRES序列另外包含多達1000個額外的核苷酸。在一些具體實施例中,IRES序列由來自表1A或表1B的序列編碼,且另外包含位於該序列5’末端的多達1000個額外核苷酸。在一些具體實施例中,IRES序列由來自表1A或表1B的序列編碼,且另外包含位於該序列3’末端的多達1000個額外核苷酸。在一些具體實施例中,IRES序列由來自表1A或表1B的序列編碼,且另外包含位於該序列5’末端的多達1000個額外核苷酸,以及位於該序列5’末端的多達1000個額外核苷酸。
在一些具體實施例中,環狀RNA分子包含內部核糖體進入位點(IRES)序列區,其中IRES序列區包含由來自表1A或表1B的DNA序列編碼的序列,且其中由DNA編碼的序列來自表1A或表1B的序列具有小於-18.9 kJ/mol的最小自由能(MFE)及至少35.0℃的解鏈溫度。
在一些具體實施例中,環狀RNA分子包含內部核糖體進入位點(IRES)序列區,其中IRES序列區包含由來自表1A或表1B的DNA序列編碼的序列,且其中IRES序列區在其整個長度上具有小於-18.9 kJ/mol的最小自由能(MFE)及至少35.0℃的解鏈溫度。
在一些具體實施例中,環狀RNA分子包含內部核糖體進入位點(IRES)序列區,其中IRES序列區包含由來自表1A或表1B的DNA序列編碼的序列,且另外包含位於5’末端的多達1000個額外的核苷酸及位於5’末端的多達1000個額外的核苷酸,且其中IRES序列區在其整個長度上具有小於-18.9 kJ/mol的最小自由能(MFE)及至少35.0℃的解鏈溫度。
在一些具體實施例中,重組環狀RNA分子包含可操作地連接到IRES的蛋白質編碼核酸序列,其任選地為非天然構型。任何目的蛋白質或多肽(例如,肽、多肽、蛋白質片段、蛋白質複合物、融合蛋白質、重組蛋白質、磷蛋白質、醣蛋白質或脂蛋白質)可由蛋白質編碼核酸序列編碼。在一些具體實施例中,蛋白質編碼核酸序列編碼治療性蛋白質。合適的治療性蛋白質的實例包括細胞激素、毒素、腫瘤抑制蛋白質、生長因子、激素、受體、促分裂原、免疫球蛋白、神經肽、神經傳導物質、及酶。或者,蛋白質編碼核酸序列可編碼病原體(例如,細菌、病毒、真菌、原生生物、或寄生蟲)的抗原,且circRNA可用作疫苗或疫苗的一個成分。治療性蛋白質及其實例進一步描述於例如Dimitrov, D.S., Methods Mol Biol.899: 1-26 (2012);以及Lagassé等人, F1000Research6: 113 (2017)。
理想地,IRES相對於蛋白質編碼核酸序列為「同框(in-frame)」,亦即IRES位於經編碼蛋白質的正確閱讀框架中的circRNA分子中。被發現與一或多個編碼序列同框的IRES元件的實例在表4中列出。然而,在一些具體實施例中,IRES相對於蛋白質編碼核酸序列可能為「出框(out of frame)」,以便IRES的位置破壞蛋白質編碼核酸序列的ORF。在其他具體實施例中,IRES可與蛋白質編碼核酸序列的一或多個ORF重疊。另外,雖然在一些具體實施例中,蛋白質編碼核酸序列包含至少一個終止密碼子,但在其他具體實施例中,蛋白質編碼核酸序列可缺少終止密碼子。本發明人已發現到,包含同框非天然IRES且缺乏終止密碼子的蛋白質編碼核酸序列的circRNA分子可起始遞迴(即無限循環)轉譯機轉。這種遞迴轉譯可生產串連的蛋白質多聚體(例如,>200 kDa)。這種具體的circRNA設計能使得生產比單個ORF大多達10倍的重複ORF單元。在不受任何理論束縛的情況下,本文所述的用於遞迴基因編碼的circRNA的使用可代表新穎的基因「數據壓縮」算法,其解決與許多當前基因治療應用相關的基因大小限制。
在一些具體實施例中,IRES包含(i)至少一個RNA二級結構元件及(ii)與18S rRNA互補的序列。在一些具體實施例中,IRES包含(i)至少一個RNA二級結構元件及(ii)與18S rRNA互補的序列,其中IRES的RNA二級結構由IRES的約位置40到約位置60的核苷酸所形成,其中在IRES的5’末端處的第一個核酸被認為是位置1。至少一個RNA二級結構及與18S RNA互補的序列的相對位置可變化。例如,在一些具體實施例中,IRES包含(i)至少一個RNA二級結構元件及(ii)與18S rRNA互補的序列,且其中至少一個RNA二級結構位於與18S rRNA互補的序列的5’。在一些具體實施例中,IRES包含(i)至少一個RNA二級結構元件及(ii)與18S rRNA互補的序列,且其中至少一個RNA二級結構元件位於與18S rRNA互補的序列的3’。
在一些具體實施例中,環狀RNA可包含一或多個IRES RNA控制元件。在一些具體實施例中,這些元件可作為條件式的「關閉」開關。例如,IRES RNA控制元件可為miRNA結合位點。miRNA與circRNA的結合可能導致circRNA的降解而破壞其活性。 DNA 分子及宿主細胞
在一些具體實施例中,本揭露內容提供包含編碼本文揭露的任何一個重組circRNA分子的核酸序列的DNA分子。因此,本文描述的為可用於編碼環狀RNA的DNA序列。在一些具體實施例中,DNA序列編碼包含IRES的環狀RNA。在一些具體實施例中,DNA序列編碼包含蛋白質編碼核酸的環狀RNA。在一些具體實施例中,DNA序列編碼環狀RNA分子;其中環狀RNA分子包含蛋白質編碼核酸序列及以非天然構型可操作地連接到蛋白質編碼核酸序列的內部核糖體進入位點(IRES)。在一些具體實施例中,DNA序列編碼蛋白質編碼核酸序列,其中蛋白質為治療性蛋白質。
在一些具體實施例中,本文揭露的DNA序列可包含至少一個非編碼功能序列。例如,非編碼功能序列可為microRNA(miRNA)海綿。microRNA海綿可包含與目的miRNA的互補結合位點。在一些具體實施例中,海綿的結合位點對miRNA種子區具有專一性,這能讓其阻斷整個相關miRNA家族。在一些 具體實施例中,miRNA海綿選自下表中所示的任何一個miRNA海綿。
miRNA 結合位點 細胞背景
92,空的 四個凸起位點 大鼠小腦神經元培養物
miR-155,空的 八個凸起位點 B細胞淋巴瘤細胞株
15a,空的 兩個完美位點 人類前列腺細胞株,異種移植物
113,空的 兩個完美位點 小鼠心肌細胞,心臟
326,空的 七個凸起位點 尾靜脈注射,TH細胞
16,20,21,30-5p,CXCR4 四到九個凸起位點 哺乳動物細胞株
16, 20, CXCR4 四到九個凸起 位點 哺乳動物細胞株
let-7,22,124,125,132,143,空的 五到七個凸起位點 大鼠海馬神經元培養物
183,CXCR4 七個凸起位點 HEK293T細胞株
A.t. 156,319,空的 一個凸起位點 基因轉殖阿拉伯芥植物
16,CXCR4 七到九個凸起 人類多發性骨髓瘤細胞株,異種移植物
16,23a,142-3p. 221,223,非專一性 四個完美或四個凸起位點 U937細胞株,小鼠造血幹細胞/先驅細胞,移植物
KSHV miR-K1,CXCR4,空的 九個凸起位點 BC-3 B細胞淋巴瘤細胞株
21,140-3p,140-5p,空的 一到兩個完美位點 哺乳動物細胞株
133,空的 三個完美位點 小鼠心肌細胞
204,211,空的 兩個完美位點 ST2細胞株,成骨及脂肪形成分化
96/182/183,空的 每個有四個凸起位點 小鼠視網膜
let-7,16,空的 六到九個凸起位點 肺癌細胞株
D.m. 7,8,9a,276a 10個凸起位點 基因轉殖果蠅
9,10b,CXCR4 八個凸起位點 4T1乳癌細胞株,異種移植
疱疹病毒miR-K12-7,K12-8,BARTI-5,BART4,空的 六個凸起位點 人類B細胞株
144,451,空的 四個完美位點 小鼠造血幹細胞/先驅細胞,移植物
let-7,29,125,let-7/125,128,空的 16個凸起位點 神經幹細胞
21,空的 兩個完美位點 小鼠心肌細胞
18a,19b,20a,非專一性 一個完美位點 K562細胞株
145/146,空的 每個有八到九個凸起位點 小鼠造血幹細胞/先驅細胞,移植物
31,CXCR4 七個凸起位點 MCF7-Ras乳癌細胞株,異種移植物
在一些具體實施例中,非編碼序列可為RNA結合蛋白質位點。RNA結合蛋白質及結合位點因此列在本發明所屬技術領域中具有通常知識者已知的許多數據庫中,包括RBPDB(rbpdb.ccbr.utoronto.ca)。在一些具體實施例中,RNA結合蛋白質包含一或多個RNA結合結構域,其選自RNA結合結構域(RBD,也稱作RNP結構域及RNA識別模體,RRM)、K-同源性(KH)結構域(第I型及第II型)、RGG(Arg-Gly-Gly)盒、Sm結構域;DEAD/DEAH盒、鋅指(ZnF,主要為C-x8-X-x5-X-x3-H)、雙股RNA結合結構域(dsRBD)、冷休克結構域;Pumilio/FBF(PUF或Pum-HD)結構域、及Piwi/Argonaute/Zwille(PAZ)結構域。
在一些具體實施例中,DNA序列包含適體。適體為可選擇性地結合特定標靶的短的單股DNA分子。標靶可為例如蛋白質、肽、碳水化合物、小分子、毒素或活細胞。一些適體可結合DNA、RNA、自身適體或其他非自身適體。適體由於其傾向形成螺旋及單股環而呈現出多種形狀。示例性DNA及RNA適體列於適體數據庫(scicrunch.org/resources/Any/record/nlx_144509-1/SCR_001781/resolver?q=*&l=)中。
在一些具體實施例中,DNA序列編碼包含約200個核苷酸到約10,000個核苷酸的環狀RNA分子。
在一些具體實施例中,DNA序列編碼環狀RNA分子,該分子在IRES與蛋白質編碼核酸序列的起始密碼子之間包含間隔子。間隔子可為任何長度(例如,10到100個核苷酸、10到90個核苷酸、10到80個核苷酸、10到70個核苷酸、10到60個核苷酸、10到50個核苷酸、10到40個核苷酸、10到30個核苷酸、10到20個核苷酸、20至100個核苷酸、20到90個核苷酸、20到80個核苷酸、20到70個核苷酸、20到60個核苷酸、20到50個核苷酸、20到40個核苷酸、20到30個核苷酸、30到100個核苷酸、30到90個核苷酸、30到80個核苷酸、30到70個核苷酸、30到60個核苷酸、30到50個核苷酸、30到40個核苷酸、40到100個核苷酸、40到90個核苷酸、40到80個核苷酸、40到70個核苷酸、40到60個核苷酸、40到50個核苷酸、50到100個核苷酸、50到90個核苷酸、50到80個核苷酸、50到70個核苷酸、50到60個核苷酸、60到100個核苷酸、60到90個核苷酸、60到80個核苷 酸、60到70個核苷酸、或50個核苷酸)。例如,在一些具體實施例中,選擇間隔子的長度以最佳化蛋白質編碼核酸序列的轉譯。
在一些具體實施例中,DNA序列編碼包含IRES的環狀RNA分子,該分子經配置以促進滾環轉譯。在一些具體實施例中,DNA序列編碼包含缺少終止密碼子的蛋白質編碼核酸序列的環狀RNA。在一些具體實施例中,DNA序列編碼環狀RNA分子,其包含(i)經配置以促進滾環轉譯的IRES,及(ii)缺乏終止密碼子的蛋白質編碼核酸序列。
本文所述的DNA序列可包含在一或多個載體中。例如,在一些具體實施例中,病毒載體包含編碼環狀RNA的DNA序列。病毒載體可為例如腺相關病毒(AAV)載體、腺病毒載體、反轉錄病毒載體、慢病毒載體、牛痘或疱疹病毒載體。
在一些具體實施例中,病毒載體為AAV。本文所用的「腺相關病毒」(AAV)乙詞包括但不限於AAV1、AAV2、AAV3(包括第3A型及第3B型)、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、禽類AAV、牛類AAV、犬類AAV、馬類AAV、羊類AAV、及現在已知或將來發現的任何其他AAV。在一些具體實施例中,AAV載體可為AAV1、AAV2、AAV3(包括第3A型及第3B型)、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、禽類AAV、牛類AAV、犬類AAV、馬類AAV、或羊類AAV中的一或多個修飾形式(即包含相對於其的一或多個胺基酸修飾的形式)。各種AAV血清型及其變體例如描述在BERNARD N. FIELDS等人,VIROLOGY,volume 2,chapter 69(4th ed.,Lippincott-Raven Publishers)中。已鑑定許多相對新的AAV血清型及演化支(請參見例如,Gao等人(2004) J Virology 78:6381-6388;Moris等人(2004) Virology 33-:375-383)。各種AAV血清型的基因體序列,以及天然末端重複序列(TR)、Rep蛋白質及殼體次單元的序列為本發明所屬技術領域已知的。這些序列可在文獻或公共數據庫(例如,GenBank ®數據庫)中找到。請參見例如GenBank登錄號NC_044927、NC_002077、NC_001401、NC_001729、NC_001863、NC_001829、NC_001862、NC_ 000883、NC_001701、NC_001510、NC_ 006152、NC_006261、AF063497、U89790、AF043303、AF028705、AF028704、J02275、JO 1901、J02275、X01457、AF288061、AH009962、AY028226、AY028223、NC_001358、NC _001540、AF513851、AF513852、AY530579;其揭露內容藉由引用併入本文,用於教示小病毒及AAV核酸以及胺基酸序列。也請參見例如Srivistava等人(1983) J Virology 45:555;Chiorini等人(1998) J. Virology 71 :6823;Chiorini等人(1999) J Virology 73:1309;Bantel-Schaal等人(1999) J. Virology 73:939;Xiao等人(1999) J. Virology 73:3994;Muramatsu等人(1996) Virology 221 :208;Shade等人(1986) J Virol. 58:921;Gao等人(2002) Proc. Nat. Acad. Sci. USA 99: 1 1854;Moris等人(2004) Virology 33-:375-383;國際專利公開案WO 00/28061、WO 99/61601、WO 98/11244;以及美國專利第6,156,303號;其揭露內容藉由引用併入本文。
在一些具體實施例中,本文所述的DNA序列包含在AAV2載體或其變體中。在一些具體實施例中,本文所述的DNA序列包含在AAV4載體或其變體中。在一些具體實施例中,本文所述的DNA序列包含在AAV8載體或其變體中。在一些具體實施例中,本文所述的DNA序列包含在AAV9載體或其變體中。
在一些具體實施例中,本文所述的DNA序列包含在類病毒顆粒(VLP)中。類病毒顆粒為非常類似於病毒的分子,但由於其含有很少或不含病毒基因物質,因此其為非傳染性的。其可為天然存在或可藉由病毒結構蛋白質的單獨表現而合成,接著可自組裝成類病毒結構。來自不同病毒的結構殼體蛋白質的組合可用於產生VLP。例如,VLP可衍生自AAV、反轉錄病毒、黃病毒科、副黏液病毒科或噬菌體。VLP可在多種細胞培養系統中生產,包括細菌、哺乳動物細胞株、昆蟲細胞株、酵母及植物細胞。
在一些具體實施例中,本文所述的DNA序列包含在非病毒載體中。非病毒載體可為例如包含DNA序列的質體。在一些具體實施例中,非病毒載體為封閉末端DNA。封閉末端DNA為具有共價封閉末端的非病毒、無殼體DNA載體(請參見例如WO2019/169233)。在一些具體實施例中,微型內含子質體載體包含本文所述的DNA序列。微型內含子質體為含有細菌複製起點及選擇性標記的表現系統,其維持轉殖基因表現匣的5’及3’末端的並置,就像在一個小環中(請參見例如Lu, J.等人,Mol Ther (2013) 21(5) 954-963)。
在一些具體實施例中,本文所述的DNA序列包含在脂質奈米顆粒中。脂質奈米顆粒(或LNP)為次微米大小的脂質乳濁液,且可提供一或多個以下優點:(i)控制及/或靶向醫藥釋放,(ii)高穩定性,(iii)所用脂質的生物可降解性,(iv)避免使用有機溶劑,(v)易於放大及滅菌,(vi)比基於聚合物/表面活性劑的載體便宜,(vii)更易於驗證及獲得監管批准。在一些具體實施例中,脂質奈米顆粒的直徑範圍在約10 nm與約1000 nm之間。
在一些具體實施例中,DNA序列編碼環狀RNA分子,其中環狀RNA分子包含蛋白質編碼核酸序列及以非天然構型可操作地連接到蛋白質編碼核酸序列的內部核糖體進入位點(IRES),其中IRES包含:至少一個RNA二級結構;以及與18S核糖體RNA(rRNA)互補的序列。
在一些具體實施例中,DNA序列編碼環狀RNA分子,其中環狀RNA分子包含蛋白質編碼核酸序列及以非天然構型可操作地連接到蛋白質編碼核酸序列的內部核糖體進入位點(IRES),其中IRES包含:至少一個RNA二級結構元件;以及與18S核糖體RNA(rRNA)互補的序列;其中IRES具有小於-18.9 kJ/mol的最小自由能(MFE)及至少35.0℃的解鏈溫度;且其中RNA二級結構元件由IRES的約位置40到約位置60的核苷酸所形成,其中在IRES的5’末端處的第一個核酸被認為是位置1。
在一些具體實施例中,DNA序列包含編碼環狀RNA分子的核酸序列;其中環狀RNA分子包含蛋白質編碼核酸序列及以非天然構型可操作地連接到蛋白質編碼核酸序列的內部核糖體進入位點(IRES);其中IRES由表1A或表1B中列出的任一個核酸序列或與其至少90%或至少95%一致性的核酸序列編碼。
本文還提供包含本文所述的重組circRNA分子、DNA分子或載體的細胞。可與重組circRNA分子、編碼重組circRNA分子的DNA分子、或包含重組circRNA分子的載體接觸並穩定維持的任何原核或真核細胞都可用於本發明的上下文中。原核細胞的實例包括但不限於來自芽孢桿菌屬( Bacillus)(諸如枯草芽孢桿菌( Bacillus subtilis)及短芽孢桿菌( Bacillus brevis))、埃希氏菌屬( Escherichia)(諸如大腸桿菌( E. coli))、假單胞菌屬( Pseudomonas)、鏈黴菌屬( Streptomyces)、沙門氏桿菌屬( Salmonella)、及伊文氏桿菌屬( Erwinia)的細胞。在一些具體實施例中,宿主細胞為真核細胞。合適的真核細胞為本發明所屬技術領域已知的,且包括例如酵母細胞、昆蟲細胞及哺乳動物細胞。酵母細胞的實例包括那些來自漢遜氏酵母屬( Hansenula)、克魯維酵母屬( Kluyveromyces)、畢赤酵母屬( Pichia)、鼻芽孢菌屬( Rhinosporidium)、釀母菌屬( Saccharomyces)、及裂殖酵母屬( Schizosaccharomyces)的細胞。合適的昆蟲細胞包括Sf-9及HIS細胞(Invitrogen,Carlsbad,Calif.),且描述於例如Kitts等人, Biotechniques14: 810-817 (1993);Lucklow, Curr. Opin. Biotechnol.4: 564-572 (1993);以及Lucklow等人, J. Virol.67: 4566-4579 (1993)。
在一些具體實施例中,宿主細胞為哺乳動物細胞。許多哺乳動物細胞為本發明所屬技術領域已知的,其中許多可從美國典型培養物保藏中心(ATCC,Manassas,Va.)獲得。哺乳動物細胞的實例包括但不限於HeLa細胞、HepG2細胞、中國倉鼠卵巢細胞(CHO)(例如,ATCC編號CCL61)、CHO DHFR-細胞(Urlaub等人, Proc. Natl. Acad. Sci. USA97: 4216-4220 (1980))、人類胚胎腎(HEK)293或293T細胞(例如,ATCC編號CRL1573)、及3T3細胞(例如,ATCC編號CCL92)。其他哺乳動物細胞株為猴COS-1(例如,ATCC編號CRL1650)及COS-7細胞株(例如,ATCC編號CRL1651),以及CV-1細胞株(例如,ATCC編 號CCL70)。其他示例性哺乳動物宿主細胞包括靈長類動物細胞株及囓齒動物細胞株,包括經轉化的細胞株。正常二倍體細胞、衍生自原代組織的活體外培養的細胞株、以及原代外植體也是合適的。其他哺乳動物細胞株包括但不限於小鼠神經母細胞瘤N2A細胞、HeLa、小鼠L-929細胞、及BHK或HaK倉鼠細胞株,所有這些細胞株都可從美國典型培養物保藏中心(ATCC;Manassas,VA)獲得。選擇哺乳動物細胞的方法及轉化、培養、放大、篩選及純化這些細胞的方法為本發明所屬技術領域已知的(請參見例如,Ausubel等人,如上所述)。在一些具體實施例中,宿主細胞為人類細胞。 生產蛋白質的方法
本揭露內容進一步提供一種在細胞中生產蛋白質的方法,其包含在細胞中轉譯蛋白質編碼核酸序列並生產蛋白質的條件下,使細胞與上述重組環狀RNA分子、包含編碼重組環circRNA分子的核酸序列的上述DNA分子、或包含重組 circRNA分子的載體接觸。
在一些具體實施例中,在細胞中生產蛋白質的方法包含在轉譯蛋白質編碼核酸序列,並在細胞中生產蛋白質的條件下,使細胞與本文所述的DNA序列或包含DNA序列的載體接觸。也提供藉由所揭露的方法生產的蛋白質。
在一些具體實施例中,蛋白質的生產為組織專一性的。例如,可在一或多個以下組織中選擇性生產蛋白質:肌肉、肝、腎、腦、肺、皮膚、胰、血液、或心臟。
在一些具體實施例中,蛋白質在細胞中遞迴表現。
在一些具體實施例中,環狀RNA在細胞中的半衰期為約1天到約7天。例如,環狀RNA的半衰期可為約1天、約2天、約3天、約4天、約5天、約6天、約7天、或更多天。
在一些具體實施例中,與使用編碼線性RNA或作為線性RNA的病毒載體向細胞提供蛋白質編碼核酸序列相比,在細胞中生產蛋白質的時間長至少約10%、至少約20%或至少約30%。
在一些具體實施例中,與使用病毒載體或作為線性RNA向細胞提供蛋白質編碼核酸序列相比,在細胞中以高至少約10%、至少約20%或至少約30%的程度生產蛋白質。
在一些具體實施例中,使用本文所述的IRES序列從環狀RNA表現蛋白,可使得在細胞中,甚至在壓力條件下從環狀RNA繼續表現蛋白質。響應於一或多個壓力條件,從線性RNA生產蛋白質通常受到抑制。因此,在一些具體實施例中,可使用circRNA作為在壓力條件下從線性RNA生產蛋白質的備選方案。在一些具體實施例中,蛋白質在一或多個壓力條件下表現細胞中由環狀RNA表現。在一些具體實施例中,當細胞暴露於一或多個壓力條件時,細胞中環狀RNA的蛋白質的表現基本上不會被破壞。例如,細胞暴露於一或多個壓力條件可使來自環狀RNA的蛋白質的表現改變小於15%、小於10%、小於5%、小於3%、小於1%、或小於0.5%。在一些具體實施例中,由環狀RNA表現的蛋白質在一或多個壓力條件下的表現程度,與不存在一或多個壓力條件下在相同細胞中表現的程度基本上是相同的。在一些具體實施例中,相對於在不存在一或多個壓力條件下的表現程度,細胞中環狀RNA的蛋白質表現程度為至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、或至少約99%。可引起細胞壓力的條件的非限制性列表包括溫度變化(包括暴露於極端溫度及/或熱休克)、暴露於毒素(包括病毒或細菌毒素、重金屬等)、暴露於電磁輻射、機械損傷、病毒感染等。
在一些具體實施例中,本文所述的circRNA(包括其組分,諸如IRES序列)促進circRNA的端帽非依賴型的轉譯活性。在某些人類疾病中,經由端帽非依賴型的機轉的典型轉譯可能會減少。因此,使用circRNA來表現蛋白質可能特別有助於治療這些疾病。在一些具體實施例中,在細胞中端帽依賴型的轉譯被降低或關閉的條件下,本文所述的circRNA促進circRNA的端帽非依賴型的轉譯活性。
如上所述,當IRES與蛋白質編碼核酸序列同框且蛋白質編碼序列缺少終止密碼子時,蛋白質編碼核酸序列的轉譯可無限循環(即遞迴)進行。因此,在一些具體實施例中,在細胞中生產蛋白質的方法生產串連的蛋白質。
本文所述的任何原核或真核宿主細胞可與重組circRNA分子或包含circRNA分子的載體接觸。宿主細胞可為哺乳動物細胞,諸如人類細胞。在一些具體實施例中,細胞為活體內的。在一些具體實施例中,細胞為活體外的。在一些具體實施例中,細胞為離體的。在一些具體實施例中,細胞在哺乳動物,諸如人類中。
在一些具體實施例中,無論選擇何種細胞類型,5’末端帽依賴型的轉譯會在細胞中受損(例如,減少、降低、抑制、或完全消除)。在一些具體實施例中,在細胞中基本上不存在5’末端帽依賴型的轉譯。
本文所述的環狀RNA也可在活體外生產,諸如藉由活體外轉錄或其他無細胞轉錄系統。典型的活體外轉錄方案包括提供(i)經純化的DNA模板,其中DNA模板編碼環狀RNA,(ii)核糖核苷三磷酸,(iii)包括DTT及鎂離子的緩衝系統,以及(iv)合適的噬菌體RNA聚合酶。DNA模板可包含例如以下:藉由選殖改造的質體構築體、藉由來自RNA前驅物(例如,aRNA放大)的第一股及第二股合成所產生的cDNA模板、或藉由PCR或藉由使化學合成的寡核苷酸退火所產生的線性模板。接著使這些成分混合,並在能讓RNA聚合酶使DNA轉錄為RNA(通常為線性RNA)的條件下培養。商業試劑盒可用於進行活體外轉錄,諸如Invitrogen MAXIscript ®或MEGAscript ®試劑盒。在一些具體實施例中,可使多腺苷酸尾加到使用活體外轉錄所生產的RNA中。
可使用一或多個以下示例性方法來環化活體外所生產的線性RNA。例如,可根據化學方法使用縮合劑(諸如溴化氰)來環化活體外所生產的線性RNA。在一些具體實施例中,可使用酶方法來環化活體外所生產的線性RNA。例如,可使用RNA或DNA連接酶(例如,T4 RNA連接酶I或II)來環化線性RNA。或者,可使用核酶方法來環化線性RNA,諸如使用自我剪接內含子的方法。
在一些具體實施例中,在無細胞系統中由環狀RNA生產蛋白質。無細胞系統可包含例如從DNA轉錄環狀RNA、環化RNA、及從其中轉譯蛋白質所需的所有因子。在一些具體實施例中,環狀RNA在無細胞系統中比線性RNA更穩定,這能夠增加蛋白質從環狀RNA的表現。
在一些具體實施例中,用於生產蛋白質的方法包含:在表現蛋白質的條件下,使環狀RNA與包含蛋白質轉譯起始因子(例如,eIF1、eIF2、eIF3、eIF5、eIF6)的無細胞萃取物接觸。在一些具體實施例中,用於生產蛋白質的方法包含:(i)提供編碼目的蛋白質的線性RNA,(ii)環化RNA,(iii)在表現蛋白質的條件下,使環狀RNA與包含蛋白質轉譯起始因子的無細胞萃取物接觸。
在一些具體實施例中,用於生產蛋白質的方法包含:在RNA環化且蛋白質表現的條件下,使線性RNA與包含蛋白質轉譯起始因子的無細胞萃取物接觸。在一些具體實施例中,線性RNA可包含自我剪接內含子。
在一些具體實施例中,用於生產蛋白質的方法包含:在表現線性RNA、環化線性RNA且表現蛋白質的條件下,使DNA與包含蛋白質轉譯起始因子的無細胞萃取物接觸。在一些具體實施例中,DNA可編碼可包含自我剪接內含子。
重組環狀RNA分子、編碼其的DNA分子、或包含其的載體可藉由任何方法,包括例如藉由轉染、轉化或轉導而引入細胞。「轉染」、「轉化」及「轉導」等詞在本文中可互換使用,且關於藉由使用物理或化學方法使一或多個外生多核苷酸引入宿主細胞。許多轉染技術為本發明所屬技術領域已知的,且包括例如磷酸鈣DNA共沉澱(請參見例如Murray E. J.編輯, Methods in Molecular Biology,Vol. 7,Gene Transfer and Expression Protocols,人類a Press (1991));DEAE-聚葡萄糖;電穿孔;陽離子脂質體媒介的轉染;鎢顆粒促進的微粒轟擊(Johnston, Nature346: 776-777 (1990));磷酸鍶DNA共沉澱(Brash等人,Mol. Cell. Biol.,7: 2031-2034 (1987));以及基於磁性奈米顆粒的基因遞送(Dobson, J., Gene Ther13(4): 283-7 (2006))。
可使裸RNA、編碼環狀RNA分子的DNA分子、或包含環狀RNA或編碼環狀RNA的DNA的載體以組合物的形式施用於細胞。在一些具體實施例中,組合物包含醫藥上可接受的載體。載體的選擇部分地由具體環狀RNA分子、DNA序列或載體,以及環狀RNA分子、DNA序列或載體所引入的細胞(或多個細胞)的類型決定。因此,組合物的各種製劑是可能的。例如,組合物可含有防腐劑,諸如,例如對羥基苯甲酸甲酯、對羥基苯甲酸丙酯、苯甲酸鈉及氯化苄烷銨(benzalkonium chloride)。任選地可使用兩個或更多個防腐劑的混合物。另外,在組合物中可使用緩衝劑。合適的緩衝劑包括例如檸檬酸、檸檬酸鈉、磷酸、磷酸鉀、及各種其他酸和鹽。任選地可使用兩個或更多個緩衝劑的混合物。製備藥用組合物的方法為本發明所屬技術領域中具有通常知識者已知的,且更詳細地描述於例如 Remington: The Science and Practice of Pharmacy,Lippincott Williams & Wilkins;21st ed. (May 1,2005)。
在一些具體實施例中,含有重組環狀RNA分子、DNA序列或載體的組合物可配製成包合物,諸如環糊精包合物,或脂質體。脂質體可用於靶向宿主細胞或增加環狀RNA分子的半衰期。製備脂質體遞送系統的方法描述於例如Szoka等人, Ann. Rev. Biophys. Bioeng.9: 467 (1980),以及美國專利第4,235,871、4,501,728、4,837,028及5,019,369號中。重組circRNA分子也可配製成奈米顆粒。
宿主細胞可在活體內或活體外與重組circRNA分子、DNA序列或載體、或含有任何前述的組合物接觸。「活體內」乙詞是指在活的生物體內以其正常的完整狀態進行的方法,而「活體外」方法為使用從其通常的生物學背景中分離出來的生物體的組分所進行。當在活體內進行該方法時,在一些具體實施例中,蛋白質的生產為組織專一性的。「組織專一性」是指蛋白質僅在生物活體內的組織類型的子集中生產,或相對於所有組織類型的基線表現在組織類型的子集中以較高程度生產。蛋白質可在任何組織類型中生產,諸如,例如肌肉、肝、腎、腦、肺、皮膚、胰、血液或心臟的組織。
在一些具體實施例中,使用電荷可變可釋放轉運體系統(CART)將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內)(請參見例如McKinlay等人,其全部內容藉由引用併入本文)。CART解決了mRNA載物帶來的遞送挑戰。這些動態材料最初作為聚陽離子發揮非共價複合、保護及遞送聚陰離子mRNA的作用,然後通過受控的自我分解為中性小分子而失去其等的陽離子電荷。預計這種電荷改變會降低或消除原始陽離子材料的螯合性靜電陰離子結合能力,從而促進胞內體逃脫並使游離mRNA釋放到胞質液中進行轉譯。
本揭示內容不限於特定CART。在一些具體實施例中,CART為油基(O)與壬烯基取代(N)的碳酸鹽單體的1:1混合物,隨後為α-胺基酯單體(A)嵌段(O 6-stat-N 6:A 9)。在一些具體實施例中,CART包含6個壬烯基與6個油基碳酸鹽單元及9個陽離子胺基酯單元的嵌段長度。
在一些具體實施例中,使用任何選擇的細胞穿透複合物將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內)(諸如國際公開第WO2022/020810號中描述的那些,其全部內容藉由引用併入本文)。這些細胞穿透複合物可含有如WO2022/020810中所述的任何陽離子兩親聚合物,且也可含有如WO2022/020810中所述的任何親脂性聚合物或聚合物結構域。可用於本揭露內容的這些細胞穿透複合物的變型在例如WO2022/020810的詳細揭露內容、實例及申請專利範圍中教示,並可替代地稱為電荷可變可釋放轉運體系統(CART)。
在一些具體實施例中,可使用任何選擇的分解性細胞穿透複合物將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內)(諸如國際公開第WO2018/022930號中描述的那些,其全部內容藉由引用併入本文)。這些分解性細胞穿透複合物包括在WO2018/022930中所定義的那些起始材料或其複合物或變型,特別是任何列舉的具體實施例1至93或其中主張的細胞穿透複合物。這些細胞穿透複合物可包含非共價結合至陽離子兩親聚合物的核酸,該陽離子兩親聚合物包含如WO2018/022930中所述的pH敏感性分解結構域。
在一些具體實施例中,使用任何選擇的雜合分解性細胞穿透複合物將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內)(諸如國際公開第WO2020/097614號中描述的那些,其全部內容藉由引用併入本文)。這些雜合分解性細胞穿透複合物包括任何列舉的「P具體實施例」1至114及/或任何列舉的具體實施例1至93或其中主張的雜合分解性細胞穿透複合物中描述的那些。
在一些具體實施例中,使用任何選擇的分解性細胞穿透複合物將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內,特別是肺細胞)(諸如國際公開第WO2020/160511號中描述的那些,其全部內容藉由引用併入本文)。這些分解性細胞穿透複合物包括任何列舉的具體實施例中描述或其中主張的那些。
在一些具體實施例中,使用任何選擇的共寡聚體載具(共寡聚體)將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內)(諸如國際公開第WO2013/036532號中描述的那些,其全部內容藉由引用併入本文)。這些共寡聚體包括WO2013/036532中教示的式I、II、III、IV、或其變型所定義的那些,特別是其中表1中列出的任何那些。
在一些具體實施例中,使用任何選擇的細胞穿透性富含胍(guanidinium)的寡磷酸三酯轉運蛋白化合物將表現目的蛋白質的circRNA遞送到細胞(例如,活體外或活體內)(諸如國際公開第WO2017/083637號中描述的那些,其全部內容藉由引用併入本文)。這些轉運蛋白化合物包括WO2017/083637中教示的式I、II、III、IV、V、VI、VII、或其變型所定義的那些,特別是其中主張的任何那些。
在一些具體實施例中,circRNA用於向受試者遞送編碼治療性肽的核酸。在一些具體實施例中,這些circRNA可用於治療疾病或病況。本揭露內容不限於特定治療性蛋白質、疾病或病況。本文所述的技術可用於治療或預防許多疾病或病況(例如,代謝失調、癌症等)。
在一些具體實施例中,circRNA向同一受試者投予多次(例如,以治療疾病或病況)。本揭露內容不限於特定投劑方案。在一些具體實施例中,cirRNA以單一劑量投予。在一些具體實施例中,投予以規則或不規則的間隔(例如,每天、每週、每兩個月、每月等)重複一次(例如,2、3、4、5、6、7、8、9、10次或更多次)。 誘導 免疫的方法
在一些具體實施例中,本文提供一種在受試者中誘導免疫的方法,其包含向受試者投予一組合物,該組合物包含:電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物,以便組合物在受試者中誘導免疫。在一些具體實施例中,環狀RNA分子包含蛋白質編碼序列(例如,抗原或治療性蛋白質)。在一些具體實施例中,組合物進一步包含抗原。在一些具體實施例中,免疫為先天免疫或抗原專一性T細胞反應。
以提供一種將受試者免疫的方法,其包含向受試者投予一組合物,該組合物包含:a)電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物;以及b)針對受試者之抗原,以使受試者對抗原免疫。
在一些具體實施例中,該投予治療或預防受試者的疾病或病症(例如:癌症)。在一些具體實施例中,遞送方式為腹腔注射、鼻內注射、或靜脈注射。在一些具體實施例中,受試者為人類或非人類動物。
在一些具體實施例中,所揭露的組合物可用於治療癌症(例如,作為癌症疫苗)。例如,在一些具體實施例中,本文提供治療受試者之癌症的方法,其包含投予一組合物,該組合物包含:a)電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物;以及b)抗原。在一些具體實施例中,抗原為腫瘤抗原。在一些具體實施例中,該投予在受試者中誘導基於抗原專一性T細胞的細胞免疫。
腫瘤抗原的非限制實例包括但不限於甲型胎兒蛋白(AFP)、癌胚抗原(CEA)、CA-125、MUC-1、上皮腫瘤抗原(ETA)、酪胺酸酶、黑色素瘤相關抗原(MAGE)、及ras與p53的異常產物。
在一些具體實施例中,CART經優化以向特定細胞類型或組織遞送環狀RNA。 巨量表格
本專利申請案含有冗長的表格。表格副本可以電子形式從USPTO網站獲得。根據37 CFR 1.19(b)(3)的要求及付費用,也可從USPTO獲得表格的電子副本。 實例
以下實例進一步說明了本案所請發明,然而,該等實例當然不應解釋為以任何方式限制本案所請發明的範圍。 實例 1 :病毒 IRES 篩選
開發模組化 circRNA 組裝平台
先前已描述了經由內含子輔助剪接及RNaseR消化合成circRNA(Chen 2017),但是難以快速創建不同的circRNA物種。為了滿足此需求,開發了一種模組化選殖(MoClo)平台,包括一組格式明確且可調適的骨架及部件,且與Golden Gate選殖(Engler 2008)及Gibson選殖(Gibson 2009)相容(圖1及7A)。通過骨架的各種迭代,開發了在從CAGGS啟動子短暫轉染細胞模式後使circRNA轉錄、經由T7啟動子進行活體外轉錄、及以RNaseR輕鬆消化前驅物線性RNA的版本。骨架包含有助於RNA環化的同源序列以及有助於RNaseR持續及完全消化的低結構區。Golden Gate懸突經精心選擇,以產生所有七個部件的穩健組裝而無錯誤,這可在測試過程中藉由定序所選擇的數百個殖株進行定序來評估。circRNA MoClo系統在其骨架中包括一個細菌表達的GFP丟失,以負選擇不正確的組合體,第3~5部件為融合蛋白創建同框甘胺酸-絲胺酸連接子,並在關鍵連接處留下殘基一致的限制酶切割位點以用於次選殖。該平台適合通過部件的組裝來合成大型庫,其可構成序列池。
最後,下游circRNA合成及純化方案針對速度、易用性及穩健性進行優化。基於奈米螢光素酶(NanoLuc Luciferase)的分析適用於評估circRNA轉譯強度,因為其具有廣泛的定量範圍(圖7B)、適用於多孔盤格式、及適用於分泌及細胞內保留形式的奈米螢光素酶的優點。
RNA 修飾改善轉譯強度及穩定性
RNA核苷修飾對於RNA療法的功效很重要,因為其等在控制mRNA(Karikó 2005,Durbin 2016,Svitkin 2017)及circRNA免疫(Chen 2019)相關。編碼由來自微小核糖核酸病毒家族的柯沙奇病毒B3(CVB3)IRES(iCVB3)所驅動的奈米螢光素酶的未經修飾的circRNA用作基線,其兩側使用50bp隨機序列間隔子。在單獨的合成中,八個RNA修飾被嵌入:5-甲基胞苷(5mC)、5-甲基尿苷(5mU)、5-甲氧基胞苷(5moC)、5-甲氧基尿苷(5moU)、5-羥甲基胞苷(5hmC)、5-羥甲基尿苷(5hmU)、假尿苷(Ψ)、及N1-甲基假尿苷(N1Ψ),其已被證實與改善mRNA轉譯(Karikó 2005);N6-甲基腺苷(m6A),因為其與調節circRNA免疫有關(Chen 2019);以及五個RNA修飾:N1-乙基假尿苷(N1ethΨ)、2’-氟代-2’-去氧胞苷(2'FdC)、2’-氟代-2’-去氧尿苷(2'FdU)、2-硫尿苷(2ThioU)、及2’-O-甲基胞苷(2'OMeC),其對RNA轉譯的影響尚未被描述(圖8A)。在首輪中,所有RNA修飾都在10%嵌入程度下進行測試,以確保大的效應值,且在合成時發現到這些修飾都不會大幅降低circRNA產量。在分析奈米螢光素酶的轉譯時,與未經修飾的circRNA相比,大多數修飾在10%嵌入下會使轉譯鈍化。然而,2ThioU及2'OMeC較少程度地抑制轉譯,這表明其嵌入程度的進一步滴定可能會改善轉譯強度。
在進一步滴定2.5%及5%嵌入的RNA修飾後,鑑定在circRNA中八個RNA經修飾的最佳化嵌入程度(圖2A)。其中,2’OMeC顯著改善轉譯,而m6A及2ThioU導致不顯著的增加。轉譯的變化不是由於經轉染RNA量的差異,這在circRNA樣品中是等同的(圖8B)。值得注意的是,已知能改善mRNA轉譯的核苷修飾,諸如N1Ψ(Karikó 2005,Durbin 2016,Svitkin 2017),其在circRNA中無相同的作用。
在個別的製備中,合成具有5% m6A嵌入的相同circRNA。與未經修飾的circRNA相比,含有5% m6A的circRNA表明在轉染或活體外電穿孔後的等同轉譯(圖8A及B)。
進行胎牛血清(FBS)降解分析,其利用FBS中的內源性核糖核酸酶(圖8C)。CleanCap及100% 經N1Ψ修飾的mRNA(基於mRNA治療的行業標準),與未經修飾的circRNA一同被1% FBS完全降解。相反地,含有5% m6A的circRNA對核酸酶更有抗性,且直到2% FBS才被完全降解。這些結果表明,對circRNA的核苷修飾可賦予針對核酸酶的穩定性(圖8C),這可能有助於延長轉譯持續時間。然而,當circRNA被遞送到細胞中時,儘管具有等同的細胞內RNA穩定性,某些RNA修飾仍會改善轉譯強度(圖2A)。
儘管2.5% 2’ OMeC的活體外circRNA轉譯最好,但試圖使此修飾與m 6A組合以阻斷免疫識別會消除轉譯效率。後續的優化工作集中在m 6A修飾的circRNA上,其等不受活體內先天免疫的影響(Chen 2019)。為了比較具有CleanCap的5% m 6A經修飾的circRNA及100% N1Ψ經修飾的mRNA的表現動力學,使用分泌的奈米螢光素酶作為報導子進行一段的時過(圖8D)。使mRNA及circRNA電穿孔到細胞中,並在24天的時間點收集培養基,此時奈米螢光素酶訊號與背景無法區分。雖然mRNA產生更強的最大轉譯訊號,但轉譯在48小時後迅速下降。另一方面,circRNA轉譯在48小時達到峰值,但在幾乎20天後仍持續產生可檢測的表現。進一步地,除非另有明確說明,否則每個circRNA製劑中均嵌入5% m 6A。
用於 circRNA 轉譯的載體拓撲及間隔子要求
研究強轉譯所需的circRNA載體拓撲背後的原理。首先,合成具有報導子奈米螢光素酶基因下游,或3’的IRES的circRNA,其藉由T4 td內含子的自我剪接反應形成的殘留疤痕來維持閱讀框架。在這個取向上,藉由剪接疤痕的轉譯是不可避免的。假設高度結構化的疤痕序列可能會混淆轉譯起始位點,合成在轉譯起始與剪接疤痕之間具有不同長度的同框間隔子的circRNA變體。由這些間隔子編碼的肽反映來自鼻病毒家族的共有病毒前導肽序列。測試這些circRNA的表現表明,增加間隔子長度對於轉譯是無益的,且核糖體不受td剪接疤痕的二級結構的影響(圖2B)。
circRNA載體的拓撲結構被反轉,使IRES置於奈米螢光素酶基因的上游。在此轉譯匣的兩側,測試在circRNA的5’及3’非轉譯區(UTR)中加入衍生自隨機50% GC含量序列的不同長度的間隔子。在檢測奈米螢光素酶表現時,發現具有50 bp長度的間隔子的circRNA產生最強的轉譯(圖2B及圖9A、圖9B)。也測試編碼序列後終止密碼子的數目是否影響circRNA表現,並發現到加入兩個以上終止密碼子(在MoClo平台中使用的數目)會降低轉譯強度(圖8E),但不影響經編碼蛋白質的大小(圖8F及圖11)。結果表明,儘管與直接位於基因上游的IRES相比效率降低,IRES媒介的circRNA轉譯仍可藉由內含子剪接疤痕而很容易地發生。另外,藉由加入使IRES及目的基因與剪接疤痕分開的50bp間隔子,可改善circRNA的轉譯。
5’ 3’ UTR 可改善 circRNA 轉譯
mRNA中的5’及3’ UTR可募集RNA結合蛋白(RBP),致使強轉譯以及轉錄後調控(Jackson 2010)。一個這類RBP家族為多聚腺苷酸結合蛋白(PABP),其與3’ UTR中12bp或更長的聚腺苷酸束相互作用,隨後驅動eIF的結合(Mangus 2003)。其他充分表徵的RBP包括聚(C)結合蛋白(PCBP),其將核醣體蛋白及反式活化因子募集到小核糖核酸病毒RNA(Blyn 1997,Gamarnik 1997,Graff 1998,Walter 1999,Luo 2014),以及YTHDF家族成員,其結合m6A並已被證明可調節mRNA轉譯及穩定性(Wang 2014,Shi 2017)。
先前,使用5’及3’ UTR序列報導了強circRNA轉譯,該序列由約50bp序列組成,主要為1~10bp延伸的腺苷(例如,具有84%的腺嘌呤)及散佈的胞苷-稱為polyAC間隔子(Wesselhoeft 2018)。研究了是否可設置特定序列以改善轉譯。編碼上述三個RBP家族的RNA結合模體的50bp間隔區被合成為5’ UTR,每個模體設計多個版本,以涵蓋任何序列專一性的變異性。另外,測試了兩個具有明確定義的作用的高度結構化序列:xrRNA((AGCGUAACCUCCAUCCGAGUUGCAAGAGAGGGAAACGCAGUCUC)),一種在石竹病毒(dianthovirus)中發現的RNA髮夾,可阻5’-3’核酸外切酶Xrn120的降解,以及Apt-eIF4G,一種eIF4G募集適體,在加入轉錄本的5’ UTR時,顯示增加mRNA轉譯。Apt-eIF4G(ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUGUCG),是一種eIF4G募集適體,在加入轉錄本的5’ UTR時,顯示增加mRNA轉譯(Tusup 2018)。將這些序列嵌入併入circRNA的5’ UTR並分析奈米螢光素酶表現後,發現PABP模體及eIF4G適體最能改善轉譯(圖2C)。
優化了終止密碼子下游的3’間隔子,借鑒了各種各樣的3’ UTR。這些包括縮短形式(Truong 2019)及全長形式(Richner 2017)的人類α-球蛋白1(HBA1)3’ UTR;α-球蛋白2(HBA2)的區域免受α-複合物的RNase消化,α-複合物為一種與mRNA穩定有關的RNA-蛋白質複合物(Holcik 1997);α-複合物與HBA2、兔15-脂肪加氧酶、人類α(I)-膠原蛋白、及三重複的大鼠酪胺酸羥化酶結合的最小區(Holcik 1997);在AAUAAA聚腺苷酸化訊號後截斷的人類β-球蛋白3’ UTR(Jiang 2006;其全部內容藉由引用併入本文);單獨的酶切胺基端增強子(amino-terminal enhancer of split,AES)3’ UTR與粒線體編碼的12S rRNA(mtRNR1)組合(Orlandini von Niessen 2019);小鼠Rps27a的3’ UTR,在Hep3B及293T細胞中高度表達(Zeng 2020);以及來自辛德比斯病毒(Sindbis virus)的HuR結合區,保護其轉錄本免受RNase消化(Sokoloski 2010)。當嵌入circRNA並藉由奈米螢光素酶表現分析時,大多數在mRNA環境中驅動強轉譯的這些3’ UTR對circRNA均無效。然而,以HBA13’ UTR的短或全長形式替換3’間隔子顯著改善轉譯強度(圖2D)。
全長病毒 IRES 對於強轉譯是重要的
病毒IRES為多樣及高度結構化的RNA區,主要存在於可促進端帽非依賴型的轉譯病毒5’UTR中(Kieft 2008,Filbin 2009,Martinez-Salas 2018)。由於iCVB3(本研究中使用的基線IRES)接近750bp,因此判定是否可能保留circRNA轉譯的同時而截斷IRES。iCVB3的先前結構圖使序列分成七個結構域(Bailey 2007),從含有被認為對病毒複製關鍵的三葉草結構的結構域I開始(Murray 2004)。也報導結構域II-V與多種IRES反式活化因子(ITAF)相互作用(de Breyne 2009,Souii 2013,Sweeney 2013),而結構域VI在真正的轉譯起始位點上游容納AUG,其募集43S核糖體起始前複合物(Nicholson 1991,Yang 2003,Sweeny 2013)。
從iCVB3的5’末端開始進行IRES結構域截斷,在幾乎無已知的二級結構鹼基配對的邊界處選擇截斷。與全長IRES相比,結構域I的缺失顯著降低circRNA轉譯25%,且進一步的缺失完全消除轉譯活性(圖3A)。其他單個iCVB3結構域的缺失同樣會減少circRNA轉譯;移除結構域VII使發光減少29%,且失去結構域II、III、IV或VI完全消除蛋白質的生產(圖3B)。接著從3’末端連續截斷iCVB3。在不同的微小核糖核酸病毒IRES中,結構域VII與起始密碼子之間的這個區域,在序列及長度上均為高度可變的,因此假設其將易於縮短。此區少至10個末端核苷酸的3’缺失幾乎消除circRNA轉譯(圖3B)。總之,這些數據表明全長IRES對於強circRNA轉譯是必需的。
IRES 編碼序列連接二級結構決定轉譯強度
研究影響circRNA轉譯起始的編碼序列專一性因子。為了評估這一點,合成了在AUG起始密碼子與奈米螢光素酶報導子之間具有9個不同的24bp N末端前導序列同框的circRNA(圖3D)。使這些前導序列的各種特徵(二級結構、GC含量、及轉譯的親水性)與所得的奈米螢光素酶報導子強度進行比較。二級結構穩定性的指示物,諸如預測的最小自由能及最穩定髮夾的自由能變化,與奈米螢光素酶轉譯最相關(Gruber 2008),其中由這些因子分別解釋34.2%及28.3%的轉譯強度變化。另一方面,N末端前導序列的GC含量及其編碼肽的親水性無法預測轉譯效率。這些發現表明,在IRES與編碼序列之間的鹼基配對相互作用的電腦模擬最佳化可為circRNA轉譯帶來額外的好處。
破壞 eIF4G iCVB3 的結合會消除轉譯
iCVB3與eIF4G及eIF4A的結構域V的結合被認為是從IRES開始轉譯的關鍵步驟(de Breyne 2009)。雖然尚不清楚這些相同的eIF如何在circRNA的背景下產生作用,但預計干擾其等與iCVB3的結合可能對轉譯產生不利影響。為了破壞eIF結合位點,使用鎖核酸(LNA),其為具有特別高的反義結合親和力的經修飾核酸(Wahlestedt 2000,Huston 2021),並針對iCVB3結構域I與II之間的非鹼基配對的連接子區(LNA#1)、eIF4A的足跡(LNA#2)、eIF4G的足跡(LNA#3)、及隨機序列(NC LNA)。
使用奈米螢光素酶作為circRNA轉譯的讀數,在一系列濃度範圍內測試LNA的效果(圖4A)。NC LNA對iCVB3強度的影響最小。相反的,LNA#3劑量依賴性地破壞奈米螢光素酶活性,顯示iCVB3結構域V中的eIF4G位點為轉譯circRNA所必需。還發現,以LNA#1鎖定結構域I-II連接的二級結構,可以劑量依賴性方式改善轉譯。由於RNA可撓性為小核糖核酸病毒IRES的標誌(Martinez-Salas 2018),因此預計轉譯強度的增加可能是由於該區域與circRNA骨架之間不利的鹼基配對相互作用減少所致。該改善為劑量依賴性而非以LNA#2減少轉譯,支持了eIF4A與iCVB3結構域V的直接結合並非circRNA轉譯所必需。然而,在這種情況下,eIF4A仍有可能直接與eIF4G交互作用。
合成了iCVB3的四種變體,其中eIF4G與結構域V的上部幹相互作用的子結構域缺失(圖9)。這些變體在幹環被截斷的位置不同,但至少均消除eIF4G足跡。如所預期,iCVB3結構域V的這個關鍵部分的缺失完全消除了轉譯活性。
使用eIF4G結合適體的合成IRES改造
由LNA實驗得出結論,eIF4G在啟動circRNA中從IRES的轉譯扮演關鍵角色。因此假設,將iCVB3改造為對eIF4G具有更高的親和力可導致更強的circRNA轉譯。Apt-eIF4G(一種eIF4G募集適體),可改善當插入mRNA的5’ UTR時,端帽依賴型的轉譯(Tusup 2018)。產生iCVB3的合成變體,其中Apt-eIF4G被插入IRES內假設允許的區域(圖4B)。這些位置或在柔性非鹼基配對結構域間區(synIRES01、03、05、09及11)內,選擇這些區以避免異常Apt-eIF4G-連接子相互作用,或在環結構域的末端(synIRES02、04、06、07、08及10),除去若干野生型核苷酸以從幹環結構順利過渡到Apt-eIF4G的RNA幹。在所有情況下,藉由電腦模擬RNA結構預測來告知合理的改造選擇(圖12)。使用奈米螢光素酶分析,發現到結構域IV的十字形結構最能夠插入Apt-eIF4G。與野生型iCVB3相比,synIRES06及synIRES08(其中Apt-eIF4G分別插入結構域IV的遠端及靠近環)均顯示出顯著改善的轉譯。相反地,在結構域IV的頂環處的插入完全消除轉譯,這與在該位點處的必須的內部富含C的環及GNRA四環的報導一致(Garmarnik 2000,Bhattacharyya 2006)。
使用流式細胞儀,以不同的報導子(mNeonGreen,一種明亮的單體綠色螢光蛋白質(Shaner 2013))驗證結果。與具有隨機5’及3’ UTR的CleanCap及100% N1Ψ經修飾的mRNA或未經修飾的circRNA相比,具有5’ PABP間隔子的5% m6A經修飾的circRNA及HBA1的3’ UTR顯示出更高的mNeonGreen表現(圖4C)。這藉由iCVB3的適體改造以包括Apt-eIF4G而進一步得到改善。有關閘控策略,請參見圖4D。
分析通過向結構域IV的靠近環中加入Apt-eIF4以拯救iCVB3結構域V eIF4G足跡缺失(圖9)。然而,對於四個變體中的任何一個,藉由這種策略都沒有實現轉譯的恢復。之前的腳趾印(toe-printing)分析推斷出在eIF4G及eIF4A募集後,結構域VI及iCVB3 3’末端的構形變化(de Breyne 2009)。結果表明,這些RNA構形變化對於正確的核糖體組裝是重要的,且簡單地局部募集eIF4G對於轉譯起始是不夠的。
鑑定穩健的高強度 IRES
IRES已演化出利用宿主因子來啟動轉譯的多種機轉。基於這些機轉,IRES已被分類為若干類型:第1型IRES可在腸病毒中發現;第2型可在心臟病毒及口瘡病毒中發現;第3型可在一些微小核糖核酸病毒中發現;第4型可在鐵士古病毒(teschovirus)中發現(Daijogo 2011)。為了進一步最佳化circRNA表現,進行實驗以鑑定IRES比文獻(Mokrejš 2006,Wesselhoeft 2018)中先前描述的那些具有更強轉譯的IRES。經過若干輪的合成與測試,確認了在circRNA中許多跨越不同類型及物種的IRES的特性。分析了代表典型IRES類型(括號中的類型)的IRES,諸如來自CVB3(1)、脊髓灰質炎病毒1(PV1)(1)、人類鼻病毒A1(HRV-A1)(1)、腦心肌炎病毒(EMCV)(2)、C型肝炎病毒(HCV)(3)、及蟋蟀麻痺病毒(CrPV)(4)。第1型IRES似乎在circRNA的背景下驅動強轉譯(圖5A)(Filbin 2009)。篩選被擴展到包括來自腸病毒屬的一大組推定的第1型IRES,其被嵌入circRNA並分析奈米螢光素酶轉譯。
在篩選中,鑑定出跨多個細胞株的具有比iCVB3更強轉譯的IRES(圖5A)。具體而言,來自人類鼻病毒B(HRV-B)及腸病毒B(EV-B)種的IRES驅動強的circRNA轉譯。為了以不同的轉基因驗證此結果,使用螢光報導子分析來評估轉染編碼Cre重組酶的circRNA後Cre媒介的重組(圖13)。在轉染後24小時,與iCVB3相比,iHRV-B3觀察到更多的重組,其支持了iHRV-B3作為circRNA轉譯的更強IRES。
有了這些知識,合成來自每個HRV-B及EV-B亞種的IRES,並使其嵌入circRNA表現質體,該IRES具有NCBI病毒上公開可獲得的序列。鑑於此篩選的規模,使用了活體外共軛的轉錄-轉譯(IVTT)方法,其使用circRNA表現質體而非經純化的circRNA作為輸入材料(圖10A)。在基於IVTT的奈米螢光素酶分析中,發現到大量的HRV-B及EV-B IRES,其轉譯活性比iCVB3高。這些IRES在細胞模式中使用經純化的circRNA進行驗證(圖10B)。雖然許多命中結果為偽陽性,但概括iHRV-B92及iHRV-B97作為較高強度IRES的發現。當這些相同的IRES也以線性RNA形式進行測試時,轉譯強度存在相對差異,但與circRNA相比,絕對表現降低100倍(圖10B)。對於最強的IRES,在四個不同的細胞株中測試奈米螢光素酶轉譯,並發現到許多驅動有效的轉譯而與細胞類型無關(圖10C)。同時,一些IRES在特定細胞類型中顯示出更強的轉譯,諸如針對iHCV及iHRV-C54的HEK293T細胞,以及針對iHRV-A100及iHRV-B4的KG-1細胞。
將早期的circRNA優化(圖2及4)與藉由改變IRES(圖5B)所賦予的改善相比。以奈米螢光素酶下游的CVB3 IRES為起點,且依次嵌入m6A,反轉載體拓撲結構,加入隨機5’及3’ UTR間隔子,修飾5’間隔子以包括PABP模體,以HBA1 3’ UTR替換3’ UTR間隔子,以及將IRES換成iHRV-B3。結果發現,這些變化逐漸增加了circRNA的表現,其中最終的設計比CleanCap及100% N1Ψ修飾的mRNA呈現出更顯著的轉譯。為了以單獨的轉基因驗證此點,使用雙色螢光報導子分析以評估在轉染編碼Cre重組酶的circRNA後Cre媒介的重組(圖13)。具體而言,使用了轉基因HEK293T報導子細胞株,其中紅色螢光蛋白DsRed在Cre重組前表現,而增強型綠色螢光蛋白(eGFP)在重組後表現。在轉染編碼iCVB3驅動的Cre重組酶的circRNA後24小時,在34.3%的細胞中觀察到重組(圖5C)。使用更強的HRV-B3 IRES顯著提高到44.6%。
通過無偏 DNA 改組的合成 IRES 改造
DNA改組為一種無偏方法,其通常用於產生大的多樣基因庫,以選擇新穎經改造的蛋白質(Michnick 1999)。當相關蛋白質的同源家族可用作改組反應的種子模板時,改組具體地比其他基因庫產生策略(諸如點突變)來得有意義。由於從HRV的IRES中觀察到整體上最強的轉譯,因此藉由使41個HRV IRES片段化進行DNA改組,並使所得的池選殖到circRNA質體中(圖5D)。以具有經獨特改組IRES的93個circRNA表現質體用於IVTT分析,其中以iHRV-B3作為內部基準對照組,測量該等質體的轉譯強度。從這93個經改組的IRES中,鑑定出9個比野生型iHRV-B3具有顯著更強的轉譯活性,這說明IRES改組的能力,以改造用於circRNA應用的經改善IRES。
使用 iHRV-B3 驗證 Apt-eIF4G IRES 改造
預期以Apt-eIF4G的適體改造方法也可能改善不確定結構的IRES的轉譯。為了測試這一點,iHRV-B3的結構域結構以電腦模擬進行預測(Gruber 2008),其鑑定在結構域IV中包括十字形結構的六個結構域(圖5E)。這種十字形結構內的環用於在遠端、頂端及靠近環位置處進行Apt-eIF4G插入,藉由合理插入鹼基配對的RNA核苷酸來改變所得幹長度,並以電腦模擬驗證結構。藉由評估一系列幹長度,鑑定對協作結合效應最有利的Apt-eIF4G的具體位置。發現到與野生型iHRV-B3相比,在結構域IV靠近環中的Apt-eIF4G插入顯著改善circRNA轉譯,這證明適體改造策略在合成更強IRES中的更廣泛的效用。與iCVB3一樣,Apt-eIF4G的頂端環插入也破壞iHRV-B3活性,這與此區中預測的GNRA四環一致。當在遠端及靠近環處均進行Apt-eIF4G的雙適體插入時,這大大降低circRNA轉譯。
組合 circRNA 優化的定量
在單一實驗中比較了每個早期的circRNA優化(圖5D)。最初,iCVB3下游為奈米螢光素酶且連續嵌入m6A,反轉載體拓撲結構,隨機5’及3’ UTR間隔子,修飾5’間隔子以包括PABP模體,以HBA1 3’ UTR置換3’ UTR間隔子,使IRES換成iHRV-B3,以及使近端環適體插入iHRV-B3。結果發現,這些變化逐漸增加circRNA的表現,而不影響RNA產量或環化效率(圖14A、B),最終設計呈現出相對於未經優化的circRNA提高了224倍,且比CleanCap及100% N1Ψ修飾的mRNA有更顯著的轉譯。
為了以更大的轉基因驗證這些發現,製備了表現AkaLuc-P2A-CyOFP的circRNA(比奈米螢光素酶長四倍以上的編碼序列)(圖5E)。當分析Aka螢光素酶(AkaLuc)活性時,5’ PABP間隔子、HBA1 3’ UTR、HRV-B3 IRES、及近端環Apt-eIF4G插入的組合添加再次改善circRNA轉譯,支持了這些優化的普遍性。
經優化 circRNA 的活體內表現
將上述circRNA優化 – 5% m6A嵌入、上游IRES拓撲結構、5’ PABP間隔子、HBA1 3’ UTR、及HRV-B3 IRES與近端環Apt-eIF4G插入結合,以測試經優化circRNA在活體內的表現。為了遞送RNA,以其等與電荷可變可釋放轉運體系統(CART)一起配製,CART為能夠在小鼠中媒介mRNA表現的暫時性陽離子分子(McKinlay 2017)。經由腹腔注射,向小鼠投予編碼細胞內表達的奈米螢光素酶的circRNA(圖6A及6B)。與未經處理的動物相比,那些接受circRNA的動物在至少一週內表現出更高的發光活性(圖6C),表明經改造circRNA可在活體內表現。當第一次注射後兩週重新投劑時,奈米螢光素酶表現也與初始水平無法區分(圖6C),支持了重複投予circRNA可能是可行的。
使用編碼人類紅血球生成素(hEPO)的RNA進行經優化circRNA與CleanCap及100% N1Ψ修飾的mRNA在活體內的正面比較,hEPO為一種用於治療貧血的分泌型蛋白質。小鼠在靜脈注射投予後,來自circRNA的血漿hEPO水平最初低於來自mRNA的(圖6D及6E)。然而,雖然hEPO的mRNA表現在48小時內迅速下降,但circRNA表現保持一致直到注射後至少96小時(圖6E及6F)。在功能上,hEPO可提高小鼠網狀紅血球的產量,儘管需要比小鼠EPO52更高的的濃度。接受單一劑量編碼hEPO的circRNA的小鼠在一週後網狀紅血球計數顯著增加,而在等莫耳劑量的mRNA後網狀紅血球水平與未經處理動物無差異(圖6G)。總之,數據顯示,改造的circRNA可在活體內以與經修飾mRNA相當的強度表現,且有更長的持續時間。針對閘控策略,請參見圖6H。
方法
分子選殖
經由Golden Gate反應,藉由將PCR產物或預製的DNA片段(Integrated DNA Technologies)選殖到定制進入載體(pRC0569)中以合成部件質體(請參見圖7)。包括了懸突,如圖7所示。部件與pRC0569按化學計量比2:1組合,總體積為2 µL,然後加入0.5 µL NEB Golden Gate Mix(BsmBI-v2)、0.5 µL T4連接酶緩衝液、及ddH 2O直至5 µL。反應在42℃下培養2分鐘,然後在16℃下培養2分鐘,進行30個循環,然後在60℃下培養5分鐘,之後冷卻至4℃。Turbo Competent(NEB)細胞以2 µL的反應進行轉形,並接種在卡本西林盤上。挑取非綠色菌落、小量製備並定序。
經由第二個Golden Gate反應,藉由將部件1~6選殖到定制骨架(pRC0940)中以組裝circRNA質體。部件質體與pRC0940按化學計量比2:1組合,總體積為4 µL,然後加入0.5 µL NEB Golden Gate Enzyme Mix(BsaI)及0.5 µL T4連接酶緩衝液。反應在37℃下培養2分鐘,然後在16℃下培養2分鐘,進行30個循環,然後在60℃下培養5分鐘,之後冷卻至4℃。Turbo Competent(NEB)細胞以2 µL的反應進行轉形,並接種在卡本西林盤上。挑取非綠色菌落、小量製備並定序。
circRNA 合成
使用活體外轉錄(IVT)試劑盒(HiScribe T7 High Yield RNA Synthesis Kit)來合成circRNA。IVT模板被PCR放大(Q5 Hot Start High-Fidelity 2x Master Mix)30個循環,並在RNA合成前進行管柱純化(DNA Clean & Concentrator-100)。使用以下前置及反置寡核苷酸 circBB-T7啟動子F: AAAAAAAAAAAAAAAAAAAAAAAAAAAggccagtgaattgtaatacgactcactataggg circBB-內含子-多腺核苷酸R: TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTtagaaggcacagttaacgcggccgc
每20 µL IVT反應使用1 µg circRNA模板。反應在37℃下培養隔夜,並帶有加熱蓋在1,000 rpm下搖動。隨後,IVT模板在37℃下以1,000 rpm的搖動,每次IVT反應以2 µL DnaseI降解20分鐘。在進一步的酶反應之前,使剩餘的RNA進行管柱純化。
為了分離circRNA,管柱純化的RNA以每µg RNA一個單位的RnaseR在37℃下以1,000 rpm搖動消化60分鐘。接著使樣品進行管柱純化,使用Nanodrop One分光光度計定量,並使用Agilent TapeStation驗證完全消化。在某些情況下,由於試劑短缺,因此在基於甲醯胺的變性條件下使用瓊脂糖凝膠進行驗證(NEB B0363S)。在線性RNA不完全消化的情況下,重複RnaseR消化。 mRNA合成
用於mRNA合成的IVT模板被PCR放大(Q5 Hot Start High-Fidelity 2x Master Mix)30個循環,並在RNA合成前進行管柱純化(DNA Clean & Concentrator-100)。該反應中的反置引子在3’ UTR後嵌入了100bp的多腺苷酸尾。接著使用IVT試劑盒(HiScribe T7 High Yield RNA Synthesis Kit)來合成mRNA,其具有以下修改:加入CleanCapAG(TriLink N-7113)到4 mM最終濃度,且N1Ψ(TriLink N-1019)完全置換UTP。
每20 µL IVT反應使用1 µg mRNA模板,反應物在37℃下培養2小時,並帶有加熱蓋在1,000 rpm下搖動。隨後,IVT模板在37℃下以1,000 rpm的搖動,每次IVT反應以2 µL DnaseI降解20分鐘。剩餘的mRNA在使用前進行管柱純化。
RNA 凝膠電泳
藉由在加入溴化乙錠的Tris-乙酸鹽-EDTA電泳緩衝液中融化無RNase的瓊脂糖來製備1%瓊脂糖凝膠。藉由1:1體積稀釋、加熱至72℃維持3分鐘,並在冰上冷卻1分鐘,而在RNA上樣緩衝液(Thermo Fisher)中使RNA變性。使RNA裝載到每個孔中,並在室溫下以100 V運行,直到溴酚藍染料到達凝膠的邊緣為止。使用Bio-Rad Gel Doc XR及Image Lab 5.2軟體(其使用「SYBR-Safe」設置)拍攝影像。
細胞培養及轉染
來自ATCC的HeLa(CCL-2)、HEK293T(CRL-11268)、HepG2(HB-8065)及KG-1(CCL-246)細胞,以補充有10% FBS(Gibco)及1%青黴素-鏈黴素(Gibco)的DMEM(ThermoFisher)維持。對於常規繼代培養,0.25% TrypLE(Thermo Fisher)用於細胞分離。為了選擇經轉導的細胞,使用最終濃度為1 µg/mL的嘌呤黴素(Thermo Fisher)。
藉由TransIT-mRNA轉染、Lipofectamine轉染或NEON電穿孔來實現RNA遞送。在每個實驗中,經遞送的mRNA或circRNA的莫耳量以及所使用的轉染方法對於所有樣品來說是相同的。對於TransIT-mRNA轉染,每µg circRNA使用3 µL TransIT-mRNA試劑(Mirus Bio)。除了這個改變之外,按照製造商的操作說明進行轉染。
活體外奈米螢光素酶分析
以表現螢火蟲螢光素酶的pGL4.54[luc2/TK]載體(Promega)對細胞進行電穿孔,並在48小時後以mRNA或circRNA轉染細胞。轉染後24小時,在100 µL被動細胞溶解緩衝液(Promega)中收集細胞,並藉由在室溫下搖動及移液約15分鐘使細胞裂解。使溶解產物以4,000 rcf離心10分鐘以清除碎片,並使5 µL澄清的溶解產物轉移到384孔白底分析盤(Perkin Elmer)中。向每個孔中加入10 µL來自Promega Nano-Glo雙螢光素酶報導子分析系統的 ONE-Glo EX,接著使盤渦旋1分鐘,在室溫下再培養2分鐘,並在TECAN Infinite Pro微量盤分析儀上讀取。
首先測量樣品的螢火蟲發光,其用作組成對照組。接著向每個孔中加入10 µL新鮮製備的NanoDLR Stop & Glo試劑,其後使盤渦旋1分鐘並在室溫下再培養9分鐘,並讀取奈米螢光素酶發光。藉由使奈米螢光素酶訊號除以螢火蟲發光來計算每孔的正規化發光。在每個實驗中,正規化的發光以相對於模擬(無RNA)轉染的倍數變化顯示。
mNeonGreen 流式細胞儀分析
經由NEON電穿孔使由RNA骨架的不同重複驅動的表現mNeonGreen的circRNA及mRNA電穿孔到HeLa細胞中。在電穿孔後24小時,使用溫熱的TrypLE(Thermo Fisher)提出細胞,以DMEM(Thermo Fisher)淬滅細胞,並在室溫下在含有碘化丙啶活死染料(Thermo Fisher)的PBS中培養細胞15分鐘。在所有條件下施加相同電壓,在Attune NxT上經由流式細胞儀分析細胞。每個樣品至少記錄50,000個活的單態細胞。
Cre 報導子分析
Cre報導子loxP-DsRED-STOP-loxP-eGFP(Addgene,#62732)用於創建慢病毒衍生的穩定Cre報導子HEK293T細胞株。針對病毒生產,接種了500萬個HEK293T細胞,在24小時後,按照製造商的說明,使用Lipofectamine 3000(Thermo Fisher)將編碼慢病毒Cre報導子的質體與pMD2.G及psPAX2共轉染。在轉染後48小時收集含有病毒顆粒的上清液,使用Lenti-X濃縮器(Clontech)濃縮,並儲存在-80℃。在病毒感染劑量為1時,將病毒顆粒加入25%匯合度(confluent)的細胞中。在轉染後48小時選擇表現Cre報導子的HEK293T細胞(CreR-293T),在選擇性培養基中維持7天,並在後續實驗之前恢復一天。
使用來自LV-Cre pLKo.1質體(Addgene #25997)的Cre序列合成如上所述的circRNA及編碼Cre重組酶的mRNA。穩定表現的CreR-293T細胞以每孔300,000個細胞接種在12孔盤中。按照製造商的說明,使用Lipofectamine 2000(Thermo Fisher),以4 µg circRNA或編碼Cre的mRNA轉染CreR-293T細胞。在轉染24小時後經由流式細胞儀在Attune NxT上藉由測量eGFP陽性細胞分率而分析Cre媒介的重組。
活體外轉錄- 轉譯
按照製造商的操作說明,使用1步人類經共軛的IVT試劑盒(Thermo Scientific)進行共軛IVTT。簡而言之,使circRNA質體與HeLa溶解產物、輔助蛋白質及反應混合物一同培養至少90分鐘。接著如上所述使用來自每個反應的等分試樣來測量奈米螢光素酶活性。
AkaLuc 分析
經由NEON電穿孔將表現具有不同優化的AkaLuc-P2A-CyOFP54的circRNA電穿孔到HeLa細胞中,並接種在96孔盤中。在電穿孔後24小時,細胞以PBS洗滌,並在室溫下以100 μL TokeOni AkaLumine-HCl受質(Sigma-Aldrich)培養5分鐘,該受質在Opti-MEM(Gibco)中稀釋至250 μM。使用SoftMax Pro 7.1軟體在SpectraMax M5 微盤讀儀(Molecular Devices)上讀取螢光,積分時間為1,000 ms。
CART 合成
O 6-stat-N 6:A 9CART由油基(O)與壬烯基取代(N)的碳酸鹽單體的1:1混合物組成,隨後為α-胺基酯單體(A)嵌段,其製備如前述(Haabeth,2021)。聚合物末端基團分析證實了6個壬烯基與6個油基碳酸鹽單元及9個陽離子胺基酯單元的嵌段長度。
活體內遞送 circRNA mRNA
所有動物實驗均在由The Jackson Laboratory獲得的3-6個月大的雌性BALB/c小鼠中進行。為了配製RNA,將每個核苷酸10.7 ng的線性或環狀RNA(相當於 10 µg hEPO mRNA)稀釋在pH 5.5的磷酸鹽緩衝鹽液中,並與O 6-stat-N 6:A 9CART以10:1的陽離子:陰離子比率混合,並立即經由尾靜脈進行腹腔注射或靜脈注射。CART/circRNA複合物的粒徑為約170 nm。每次注射使用150 μL的總體積。每次注射使用150 μL的總體積。所有實驗程序均經Institutional Animal Care and Use Committee at Stanford University批准。
奈米螢光素酶活體內成像
使用Ami HT光學成像系統(Spectral Instruments Imaging)測量活體內circNanoLuc活性。在每個時間點,小鼠以異氟醚麻醉,並腹腔注射200 µL氟福利馬嗪受質(Promega),每瓶以2.1 mL PBS重構。小鼠在10分鐘後使用原始設定值及10秒曝光時間進行成像。使用Aura 4.0成像軟體定量發光活性。
hEPO ELISA 分析
使用SimpleStep人類紅血球生成素ELISA試劑盒(Abcam)測量小鼠的hEPO水平。在每個時間點,從每隻小鼠尾靜脈將大約100 µL血液收集到肝素化毛細管中,並移到EDTA塗佈試管中。血液以2,000 x g離心10分鐘,所得血漿進行ELISA分析。hEPO的最終濃度係根據所測得的血漿體積進行調整。
網狀紅血球計數
使用網狀紅血球試劑系統(BD Biosciences)測量小鼠週邊血液中的網狀紅血球,其使用噻唑橙來標記網狀紅血球。簡而言之,從每隻小鼠尾靜脈收集10 μL血液,並立即與1 mL試劑混合。在室溫下避光培養30分鐘後,在BD LSR II流式細胞儀上分析樣品,每個樣品記錄100,000個事件。網狀紅血球定義為對噻唑橙呈陽性的單態紅血球細胞。
西方墨點法
在電穿孔後24小時,以RIPA細胞溶解以及含有Halt Protease與磷酸酶抑制劑混合物(Thermo Fisher)的萃取緩衝液(Thermo Fisher)裂解HeLa細胞。藉由離心澄清所得的溶胞產物並使用二辛可寧酸定量蛋白質。隨後,在Bis-Tris凝膠上分離來自每個樣品的10 μg總蛋白質,並使用iBlot 2凝膠轉移裝置使其轉移到硝化纖維素膜。在室溫下以在PBS中稀釋的在0.1% Tween-20中的5%牛血清白蛋白封閉一小時後,以在封閉緩衝液中的1:500稀釋的抗奈米螢光素酶抗體(R&D Systems,MAB10026)在4℃下使膜染色隔夜。洗滌後,接著使膜與1:10,000稀釋的IRDye 680RD山羊抗小鼠二級抗體(LI-COR Biosciences,926-68070)一同培養,並在Odyssey CLx成像系統(LI-COR Biosciences)上進行觀察。
RNA 結構預測
使用RNAfold網路伺服器(rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi),除了取消選擇「避免分離的鹼基對」以外,以預設值預測RNA結構。隨後使用基於最小自由能預測的最佳二級結構來代表RNA序列。
實例 1 參考文獻Bailey, J.M., and Tapprich, W.E. (2007). Structure of the 5′ Nontranslated Region of the Coxsackievirus B3 Genome:Chemical Modification and Comparative Sequence Analysis. J. Virol. 81, 650–668. Bhattacharyya, S., and Das, S. (2006). An Apical GAGA Loop within 5’ UTR of the Coxsackievirus B3 RNA Maintains Structural Organization of the IRES Element Required for Efficient Ribosome Entry. Http://Dx.Doi.Org/10.4161/Rna.3.2.2990 3, 60–68. Blyn, L.B., Towner, J.S., Semler, B.L., and Ehrenfeld, E. (1997). Requirement of poly(rC) binding protein 2 for translation of poliovirus RNA. J. Virol. 71, 6243–6246. Chen, Y.G., Chen, R., Ahmad, S., Verma, R., Kasturi, S.P., Amaya, L., Broughton, J.P., Kim, J., Cadena, C., Pulendran, B., et al. (2019). N6-Methyladenosine Modification Controls Circular RNA Immunity. Mol. Cell 76, 96-109.e9. Chen, Y.G., Kim, M. V., Chen, X., Batista, P.J., Aoyama, S., Wilusz, J.E., Iwasaki, A., and Chang, H.Y. (2017). Sensing Self and Foreign Circular RNAs by Intron Identity. Mol. Cell 67, 228-238.e5. Daijogo, S., and Semler, B.L. (2011). Mechanistic Intersections Between Picornavirus Translation and RNA Replication. Adv. Virus Res. 80, 1–24. De Breyne, S., Yu, Y., Unbehaun, A., Pestova, T. V., and Hellen, C.U.T. (2009). Direct functional interaction of initiation factor eIF4G with type 1 internal ribosomal entry sites. Proc. Natl. Acad. Sci. 106, 9197–9202. Durbin, A.F., Wang, C., Marcotrigiano, J., and Gehrke, L. (2016). RNAs Containing Modified Nucleotides Fail To Trigger RIG-I Conformational Changes for Innate Immune Signaling. MBio 7, e00833-16. Engler, C., Kandzia, R., and Marillonnet, S. (2008). A one pot, one step, precision cloning method with high throughput capability. PLoS One 3. Filbin, M.E., and Kieft, J.S. (2009). Toward a structural understanding of IRES RNA function. Curr. Opin. Struct. Biol. 19, 267–276. Gamarnik, A. V., and Andino, R. (1997). Two functional complexes formed by KH domain containing proteins with the 5′ noncoding region of poliovirus RNA. Rna 3, 882–892. Gamarnik, A. V., Böddeker, N., and Andino, R. (2000). Translation and Replication of Human Rhinovirus Type 14 and Mengovirus in Xenopus Oocytes . J. Virol. 74, 11983–11987. Gibson, D.G., Young, L., Chuang, R.Y., Venter, J.C., Hutchison, C.A., and Smith, H.O. (2009). Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat. Methods 6, 343–345. Graff, J., Cha, J., Blyn, L.B., and Ehrenfeld, E. (1998). Interaction of Poly(rC) Binding Protein 2 with the 5′ Noncoding Region of Hepatitis A Virus RNA and Its Effects on Translation. J. Virol. 72, 9668–9675. Gruber, A.R., Lorenz, R., Bernhart, S.H., Neuböck, R., and Hofacker, I.L. (2008). The Vienna RNA Websuite. Nucleic Acids Res. 36, W70–W74. Holcik, M., and Liebhaber, S.A. (1997). Four highly stable eukaryotic mRNAs assemble 3′ untranslated region RNA–protein complexes sharing cis and transcomponents. Proc. Natl. Acad. Sci. 94, 2410–2414. Huston, N.C., Wan, H., Strine, M.S., de Cesaris Araujo Tavares, R., Wilen, C.B., and Pyle, A.M. (2021). Comprehensive in vivo secondary structure of the SARS-CoV-2 genome reveals novel regulatory motifs and mechanisms. Mol. Cell 81, 584-598.e5. Jackson, R.J., Hellen, C.U.T., and Pestova, T. V. (2010). The mechanism of eukaryotic translation initiation and principles of its regulation. Nat. Rev. Mol. Cell Biol. 11, 113–127. Jiang, Y., Xu, X.-S., and Russell, J.E. (2006). A Nucleolin-Binding 3′ Untranslated Region Element Stabilizes β-Globin mRNA In Vivo. Mol. Cell. Biol. 26, 2419–2429. Karikó, K., Buckstein, M., Ni, H., and Weissman, D. (2005). Suppression of RNA recognition by Toll-like receptors: The impact of nucleoside modification and the evolutionary origin of RNA. Immunity 23, 165–175. Kieft, J.S. (2008). Viral IRES RNA structures and ribosome interactions. Trends Biochem. Sci. 33, 274–283. Kuersten, S., and Goodwin, E.B. (2003). The power of the 3′ UTR: translational control and development. Nat. Rev. Genet. 2003 48 4, 626–637. Luo, Z., Dong, X., Li, Y., Zhang, Q., Kim, C., Song, Y., Kang, L., Liu, Y., Wu, K., and Wu, J. (2014). PolyC-binding protein 1 interacts with 5′-untranslated region of enterovirus 71 RNA in membrane-associated complex to facilitate viral replication. PLoS One 9, 1–13. Martinez-Salas, E., Francisco-Velilla, R., Fernandez-Chamorro, J., and Embarek, A.M. (2018). Insights into structural and mechanistic features of viral IRES elements. Front. Microbiol. 8, 2629. Mayr, C. (2019). What Are 3′ UTRs Doing? Cold Spring Harb. Perspect. Biol. 11, a034728. McKinlay, C.J., Vargas, J.R., Blake, T.R., Hardy, J.W., Kanada, M., Contag, C.H., Wender, P.A., and Waymouth, R.M. (2017). Charge-altering releasable transporters (CARTs) for the delivery and release of mRNA in living animals. Proc. Natl. Acad. Sci. U. S. A. 114, E448–E456. Michnick, S.W., and Arnold, F.H. (1999). “Itching” for new strategies in protein engineering. Nat. Biotechnol. 1999 1712 17, 1159–1160. Mokrejs, M., Vopálenský, V., Kolenaty, O., Masek, T., Feketová, Z., Sekyrová, P., Skaloudová, B., Kríz, V., and Pospísek, M. (2006). IRESite: the database of experimentally verified IRES structures (www.iresite.org). Nucleic Acids Res. 34, D125–D130. Murray, K.E., Steil, B.P., Roberts, A.W., and Barton, D.J. (2004). Replication of Poliovirus RNA with Complete Internal Ribosome Entry Site Deletions. J. Virol. 78, 1393–1402. Nicholson, R., Pelletier, J., Le, S.Y., and Sonenberg, N. (1991). Structural and functional analysis of the ribosome landing pad of poliovirus type 2: in vivo translation studies. J. Virol. 65, 5886–5894. Obi, P., and Chen, Y.G. (2021). The design and synthesis of circular RNAs. Methods 196, 85–103. Orlandini von Niessen, A.G., Poleganov, M.A., Rechner, C., Plaschke, A., Kranz, L.M., Fesser, S., Diken, M., Löwer, M., Vallazza, B., Beissert, T., et al. (2019). Improving mRNA-Based Therapeutic Gene Delivery by Expression-Augmenting 3′ UTRs Identified by Cellular Library Screening. Mol. Ther. 27, 824–836. Ramanathan, M., Majzoub, K., Rao, D.S., Neela, P.H., Zarnegar, B.J., Mondal, S., Roth, J.G., Gai, H., Kovalski, J.R., Siprashvili, Z., et al. (2018). RNA–protein interaction detection in living cells. Nat. Methods 2018 153 15, 207–212. Richner, J.M., Himansu, S., Dowd, K.A., Butler, S.L., Salazar, V., Fox, J.M., Julander, J.G., Tang, W.W., Shresta, S., Pierson, T.C., et al. (2017). Modified mRNA Vaccines Protect against Zika Virus Infection. Cell 168, 1114-1125.e10. Shaner, N.C., Lambert, G.G., Chammas, A., Ni, Y., Cranfill, P.J., Baird, M.A., Sell, B.R., Allen, J.R., Day, R.N., Israelsson, M., et al. (2013). A bright monomeric green fluorescent protein derived from Branchiostoma lanceolatum. Nat. Methods 2013 105 10, 407–409. Shi, H., Wang, X., Lu, Z., Zhao, B.S., Ma, H., Hsu, P.J., Liu, C., and He, C. (2017). YTHDF3 facilitates translation and decay of N 6-methyladenosine-modified RNA. Cell Res. 27, 315–328. Sokoloski, K.J., Dickson, A.M., Chaskey, E.L., Garneau, N.L., Wilusz, C.J., and Wilusz, J. (2010). Sindbis Virus Usurps the Cellular HuR Protein to Stabilize Its Transcripts and Promote Productive Infections in Mammalian and Mosquito Cells. Cell Host Microbe 8, 196–207. Souii, A., Ben M’Hadheb-Gharbi, M., and Gharbi, J. (2013). Role of RNA Structure Motifs in IRES-Dependent Translation Initiation of the Coxsackievirus B3: New Insights for Developing Live-Attenuated Strains for Vaccines and Gene Therapy. Mol. Biotechnol. 2013 552 55, 179–202. Svitkin, Y. V., Cheng, Y.M., Chakraborty, T., Presnyak, V., John, M., and Sonenberg, N. (2017). N1-methyl-pseudouridine in mRNA enhances translation through eIF2α-dependent and independent mechanisms by increasing ribosome density. Nucleic Acids Res. 45, 6023–6036. Sweeney, T.R., Abaeva, I.S., Pestova, T. V., and Hellen, C.U.T. (2014). The mechanism of translation initiation on Type 1 picornavirus IRESs. EMBO J. 33, 76–92. Truong, B., Allegri, G., Liu, X.B., Burke, K.E., Zhu, X., Cederbaum, S.D., Häberle, J., Martini, P.G.V., and Lipshutz, G.S. (2019). Lipid nanoparticle-targeted mRNA therapy as a treatment for the inherited metabolic liver disorder arginase deficiency. Proc. Natl. Acad. Sci. U. S. A. 116, 21150–21159. Tusup, M., Kundig, T., and Pascolo, S. (2018). An eIF4G-recruiting aptamer increases the functionality of in vitro transcribed mRNA. EPH - Int. J. Med. Heal. Sci. (ISSN 2456 - 6063) 4, 29–37. Wahlestedt, C., Salmi, P., Good, L., Kela, J., Johnsson, T., Hökfelt, T., Broberger, C., Porreca, F., Lai, J., Ren, K., et al. (2000). Potent and nontoxic antisense oligonucleotides containing locked nucleic acids. Proc. Natl. Acad. Sci. 97, 5633–5638. Walter, B.L., Nguyen, J.H.C., Ehrenfeld, E., and Semler, B.L. (1999). Differential utilization of poly(rC) binding protein 2 in translation directed by picornavirus IRES elements. RNA 5, S1355838299991483. Wang, X., Lu, Z., Gomez, A., Hon, G.C., Yue, Y., Han, D., Fu, Y., Parisien, M., Dai, Q., Jia, G., et al. (2014). N 6-methyladenosine-dependent regulation of messenger RNA stability. Nature 505, 117–120. Wesselhoeft, R.A., Kowalski, P.S., and Anderson, D.G. (2018). Engineering circular RNA for potent and stable translation in eukaryotic cells. Nat. Commun. 9. Yang, D., Cheung, P., Sun, Y., Yuan, J., Zhang, H., Carthy, C.M., Anderson, D.R., Bohunek, L., Wilson, J.E., and McManus, B.M. (2003). A Shine-Dalgarno-like Sequence Mediates in Vitro Ribosomal Internal Entry and Subsequent Scanning for Translation Initiation of Coxsackievirus B3 RNA. Virology 305, 31–43. Zeng, C., Hou, X., Yan, J., Zhang, C., Li, W., Zhao, W., Du, S., Dong, Y., Zeng, C., Hou, X., et al. (2020). Leveraging mRNA Sequences and Nanoparticles to Deliver SARS-CoV-2 Antigens In Vivo. Adv. Mater. 32, 2004452.
實例 2
方法
CircRNA 設計及活體外轉錄
藉由將DNA片段選殖到包含自我剪接內含子、5’ PABP間隔子、HBA1 3’ UTR及HRV-B3 IRES的定制進入載體中來合成circRNA模板。使用HiScribe T7高產量RNA合成試劑盒(NEB E2040S)合成circRNA。在RNA合成前,對IVT模板進行PCR放大(Q5 Hot Start High-Fidelity 2x Master Mix)440及管柱純化(Zymo DNA Clean & Concentrator-100),如前所述(Chen及Wang,2022)。簡而言之,每20 μL IVT反應使用1 μg circRNA PCR模板。反應在37℃下培養隔夜。IVT模板隨後在37℃下以2 μL DnaseI(NWB M0303S)降解20分鐘。將剩餘的RNA進行管柱純化,並在37℃下以每微克RNA 1U的RnaseR消化60分鐘。然後將樣品進行管柱純化,使用Nanodrop One分光光度計進行定量,並使用Agilent TapeStation驗證是否完全消化。當與線性RNA相比時,使用相同的序列作為IVT模板,並加入100bp多腺苷酸尾,其在3’ UTR之後嵌入。然後使用具有4nM CleanCap AG(TriLink N-7113)的相同IVT試劑盒合成線性RNA。藉由在相應的IVT反應中嵌入5%螢光素-12-UTP(Sigma-Aldrich 11427857910)或藉由使用Label ITR核酸標記試劑盒(Mirus Bio Cy3、Cy5、螢光素、或AF488)的轉錄後修飾進行circRNA或mRNA的螢光標記。在所有實驗中,發明人使用20:1比率的未經標記circRNA與螢光標記circRNA的混合物。產生三種不同的circRNA,circOVA(其編碼Ova蛋白)、circNanoLuc(其編碼奈米螢光素酶蛋白)、及circFOR(其具有干擾蛋白質轉譯的移框突變)。CircOVA及circNanoLuc均藉由加入5% m6A修飾及5% 2’OMeC以進行活體內遞送來增強轉譯。表8中列出環狀RNA元件及修飾。
人類 PBMC circRNA 攝入
人類週邊血液單核細胞(PBMC)係由在Stanford Blood Center的健康供體的白血球層(buffy coat)中獲得,其以Ficoll-Paque梯度分離。將未經標記或cy3標記的10 ng/µl circRNA加入含有1X10 5個細胞的RPMI-1640培養基中,並在37℃下培養2小時。隨後,細胞以FACS緩衝液洗滌,並以抗CD14(AF647,BioLegend 325611)、抗CD3(AF647,BioLegend 300422)、抗CD19(AF647,BioLegend 302222)、抗CD56(AF647,BioLegend 318313)、抗CD15(AF647,BioLegend 323012)、或抗CD41a(AF647,BioLegend 303725)進行染色。在冰上培養30分鐘後,細胞隨後以FACS緩衝液洗滌並以DAPI染色。藉由流式細胞儀分析每個細胞亞型的circRNA攝入。以未經標記及cy3線性RNA用作陰性對照。
人類單核球的 circRNA 攝入
按照製造商的方案,使用Lymphoprep(StemCell Technologies 07801)從健康志願者的全血中製備週邊血液單核細胞。簡而言之,全血在完全培養基(RPMI + 2% FBS-HI(在65℃下熱滅活30分鐘)中以1:1稀釋,且小心地舖在等體積的Lymphoprep(15ml)上,在室溫下以800g離心30分鐘並停止,且小心將白血球層移到新鮮小瓶中。在以完全培養基洗滌一次後,紅血球細胞在4℃下裂解10分鐘,細胞在完全培養基中洗滌兩次,且細胞在冷凍培養基(90% FBS-HI、10% DMSO)中以1:1稀釋液進行冷凍。將冷凍的PBMC解凍,在培養基中洗滌,並使用Countess自動化細胞計數器(ThermoFisher)評估存活力。將50 μl中的1x10 6個細胞等分到96孔盤的每個孔中,並進行等體積的cy3標記的circRNA稀釋。將細胞置於37℃ 5% CO 2中484個指定時間點。在每個時間點,將細胞轉移到新鮮的96孔V底485盤中,並以FACS緩衝液洗滌。細胞在室溫避光下以下列方式培養:ZombieRed活/死染色(Biolegend 423110)10分鐘、人類TruStain FcX(Biolegend 422302)5分鐘,以及以下列抗體混合物培養30分鐘:抗CD3e(FITC,Biolegend 300406)、抗CD11c(BV785,Biolegend 101245)、抗HLADR(BV650,Biolegend 307650)、抗CD16(BV510,Biolegend 360733)、抗CD123(BV421,Biolegend 306017)、抗CD19(AF700,Biolegend 302225)、抗CD14(AF647,Biolegend 325611)。細胞在FACS緩衝液中洗滌兩次,並在4% PFA中固定30分鐘。固定的細胞以FACS緩衝液洗滌,並在4℃下儲存,直到進行流式細胞儀分析。
人類巨噬細胞的 circRNA 攝入
將人類初代巨噬細胞分化,如前所述。簡而言之,使用不去除CD16的EasySep™人類單核球富集試劑盒(STEMCELL Technologies 19059)對人類PBMC進行單核球富集化。將所得單核球以1×10 6個細胞/mL的密度重懸於含有10%人類血清及1X青黴素-鏈黴素的IMDM Glutamax中,並在37℃的組織培養皿中培養6~7天以獲得分化的巨噬細胞。在24孔盤的100 µl培養基中分裝2x10 5個分化的巨噬細胞,並按照指示添加circRNA至最終濃度。在培養2小時後,收取細胞,並在載玻片上進行細胞離心塗片。細胞以DAPI染色,並在螢光顯微鏡下分析circRNA的定位。
細胞株
RAW264.7(TIB-71)及J774A.1(TIB-67)細胞株購自ATCC,並培養在補充有10% FBS及1%青黴素/鏈黴素(Thermo Fisher)的DMEM培養基中。細胞在達90%匯合度後繼代,以細胞刮刀剝離,並每兩天以1:8的比率繼代。U937(CRL-159.2)及THP-1(TIB-202)細胞購自ATCC。細胞維持在RPMI 1640懸浮培養基中,其補充有2mM麩醯胺酸、10% FBS、及1%青黴素-鏈黴素。當細胞濃度達到8x10 5個細胞/mL時,對細胞進行繼代培養。MutuDC細胞購自Applied Biological Materials Inc.(abm T0528)。細胞維持在補充有10% FBS、1%青黴素-鏈黴素、10 mM Hepes(Gibco 15630)、及50 μM β-巰基乙醇(GIBCO 31350)的IMDM-Glutamax(Gibco 31980)培養基中。KG-1(CCL-246)細胞購自ATCC。細胞維持在補充有20% FBS及1%青黴素-鏈黴素的DMEM培養基中。Calu-3(HTB-55)、IMR-90(CCL-186)、及Hep G2(HB-8065)細胞購自ATCC,並維持在補充有10% FBS、1%青黴素-鏈黴素的EMEM培養基中。針對常規繼代培養,使用0.25%胰蛋白酶-EDTA(Thermo Fisher)進行細胞分離。所有細胞株均在37℃、5% CO 2的加濕培養箱中培養,並定期檢測黴漿菌污染(Lonza LT07-318)。
circRNA 攝入及轉染
細胞株以每孔1x10 5個細胞接種在96孔盤的完全培養基中。在24小時後,細胞以無血清培養基洗滌兩次,並加入1 µg/µl或指定濃度的circRNA。將細胞置於37℃及5% CO 2條件下18小時或指定的時間點。然後移除含有circRNA的培養基,將細胞移至v底盤中,並以PBS洗滌兩次,以活/死NIR可固定染料染色,並藉由流式細胞儀分析。為了減少背景表面結合,發明人在每次流式細胞儀分析前進行溫和的胰蛋白酶處理,以確保移除膜結合的染料。使用TransIT-mRNA轉染試劑盒(Mirus MIR 2250)進行circRNA或mRNA轉染,每微克RNA使用3 μL TransIT-mRNA試劑(Mirus Bio)。
CircRNA 攝入的抑制劑及啟動子
如前所述接種RAW264細胞,並在無血清培養基中以100 nM cy3-circRNA結合以下進行培養:1.5uM未經標記circRNA、linRNA、質體 DNA、Poly(I:C)(Sigma-Aldrich P9582)、tRNA(Roche TRNABAK-RO)、或肝素(Sigma-Aldrich H3149)。在培養24小時後,細胞藉由流式細胞儀分析,如前所述。如前所述接種RAW264細胞,並以濃度遞增的疊氮化鈉(Sigma-Aldrich S2002)處理。在以疊氮化鈉預培養30分鐘後,細胞以PBS洗滌兩次,並將1μg cy5-circRNA加入無血清培養基中或轉染到細胞中。在處理後24小時,細胞藉由流式細胞儀分析,如前所述。如前所述接種RAW264細胞,並以20mM 2-去氧-D-葡萄糖(Tocris 4515)或2mg/ml寡黴素(Sigma-Aldrich O4876)處理30分鐘。細胞隨後以PBS洗滌兩次,並將含有1µg cy5-circRNA的無血清培養基加在細胞上。如前所述接種RAW264細胞,並將含有1µg/µl cy5-circRNA的無血清培養基與下列的組合加在細胞上:20ng/ml LPS(Sigma-Aldrich L4516)、0.75µg/ml CD40L(AcroBiosystems M5248)、或5ng/ml PMA(Sigma-Aldrich P1585)。在處理後24小時,細胞藉由流式細胞儀分析,如前所述。
活體外奈米螢光素酶分析
在攝入或轉染後24小時,在100 μL繼代溶解緩衝液(Promega)中收取細胞,並藉由在室溫下搖動及移液約15分鐘以溶解細胞。溶胞產物以4,000 rcf離心10分鐘以清除碎片,並將5 μL澄清的溶胞產物移到384孔白底分析盤(Perkin Elmer)中。向每孔加入10 μL來自Promega Nano-Glo雙螢光素酶報導子分析系統的ONE Glo EX,之後將盤渦旋1分鐘,在室溫下另外培養2分鐘,並在TECAN Infinite Pro微盤分析儀上讀取。
T 細胞增生分析
使用免疫磁珠(Miltenyi Biotech),藉由陰性選擇從TCR轉基因小鼠OT-I純化OT-I CD8 T細胞。針對直接MHC-I抗原呈現分析,將MutuDC株以每孔10,000個細胞接種在圓底96孔盤中。針對MHC-I限制性抗原呈現分析,在存在或不存在1µM CpG(ODN 1585,InvivoGen)之情況下將MutuDC與以下一起培養2小時:1nM SIINFEKL(OVA257–264,Sigma-Aldrich S7951)、1mg/ml 卵白蛋白(InvivoGen vac-pova)、1µg circFOR、或1µg circOVA。細胞以培養基洗滌三次,並與50,000個經純化OT-I CD8 T細胞(CFSE標記)一起培養。在培養60小時後藉由流式細胞儀分析測量T細胞增生,不包括雙態及死細胞。OT-I CD8 T細胞以CD8+ Vα2+ 細胞閘控。檢測到活的分裂的T細胞的細胞增生染料含量低(CFSE低)。MutuDC同樣以含有或不含CART試劑的指定濃度的circOVA進行轉染。
免疫受體的 qRT-PCR 測量
如前所述接種MutuDC細胞,並以含有1µM CpG、1μg circRNA的培養基處理或以TransIT遞送。在處理後24小時,按照製造商的說明,使用TRIzol(Invitrogen,15596018)及Direct-zol RNA Miniprep(Zymo Research,R2052)伴隨管柱上DNase I消化從細胞中分離總RNA。使用Brilliant II SYBR Green qRT-PCR Master Mix(Agilent,600825)及LightCycler 480(Roche)進行RT-qPCR分析(三重複)。藉由ddCt方法計算相對RNA水平,並與B-肌動蛋白對照相比。引子序列列於表9中。
細胞激素及表面受體的流式細胞儀分析
如前所述接種MutuDC細胞,並以含有1µM CpG、1μg circRNA的培養基處理或以TransIT遞送。在處理後24小時,收集細胞上清液,並使用針對小鼠發炎性細胞激素的細胞計數珠粒陣列試劑盒(CBA;BD Biosciences)定量細胞激素水平。同樣地,將細胞懸液移到v形底盤上,並以PBS洗滌兩次,以活/死NIR可固定染料染色,並以抗MHC-II(redFluor 710 Tonbo 80-5321-U025)、抗MCH-I(PE,eBioscience 12-5958-82)、抗CD86(APCFire/750,BioLegene 105045)、抗CD40(PerCP-eFluor 710,eBioscience 46-0401-80)、及抗CD80(Pe-cy5,sBioscience 15-0801-82)染色。在冰上培養30分鐘後,細胞隨後以FACS緩衝液洗滌,並藉由流式細胞儀進行分析。
小鼠及免疫
C57BL/6小鼠購自Jackson Laboratories。小鼠性別相符且年齡在8到14週之間。在免疫方面,小鼠鼻內注射30 μl circRNA(每隻小鼠25 μg)、靜脈注射100 μl circRNA(每隻小鼠25或85 μg)、尾基部皮下注射100 μl circRNA(每隻小鼠25或50 μg)、及腹腔注射100 μl CART-circOVA(每隻小鼠9 μg)。當有指定時,50µg卵白蛋白(InvivoGen vac-pova)也與30 μg Poly(I:C)(HMW VacciGrade,InvivoGen vac-pic)或50 μg Addavax(InvivoGen)組合遞送。本研究中的所有小鼠均維持在無特定病原體、12小時光照/12小時閉光循環、及約18~23℃溫度與40~60%濕度的條件下。
先天免疫亞群的流式細胞儀分析
收集來自免疫小鼠的引流腹股溝淋巴結,並以1 mg/ml第IV型膠原酶(Worthington)在37℃下消化20分鐘,隨後以100 μm過濾器粉碎以製成單細胞懸液。然後單細胞樣品以下列進行染色:Zombie UV(BUV496,BioLegend 423107)、抗Ly6C(BV780,BioLegend 128041)、抗Ly6G(APC Cy7,BioLegend 127624)、抗CD19(BUV395,BD 563557)、抗CD3(BB700,BD742175)、抗MHCII(AF700,eBioscience 56-5321-82)、抗CD11b(BV650,BioLegend 101239)、抗CD11c(BV421,BioLegend 117330)、抗CD86(A647,BioLegend 105020)、抗Siglec-F(PE615 CF594,BD 562757)、抗CD45(BV610,BioLegend 103140)、抗CD169(PE-Cy7,BioLegend 142412)、抗PDCA-1(BUV563,BD 749275)、抗CD8a(BUV805,BD 612898)、抗CD103(PE,eBioscience 12-1031-82)、抗NK1.1(BV510,BioLegend 108738)、及抗F4/80(BUV737,BD 749283)。
CD8 T 細胞流式細胞儀分析
收集免疫小鼠的全肺或脾,並以1 mg/ml第IV型膠原酶(Worthington)在37℃下消化20分鐘,隨後以100-μm過濾器粉碎以製成單細胞懸液。在染色前溶解紅血球細胞。然後單細胞樣品以下列進行染色:Zombie Yellow(BUV570,BioLegend 423103)、抗CD3(殖株145-2C11,BioLegend)、抗CD8α(殖株53-6.7,BioLegend)、抗CD4(殖株RM4-5,BioLegend)、抗CD44(殖株IM7,BioLegend)、抗CD45(殖株30-F11,BioLegend)、抗CD69(殖株H1.2F3,BioLegend)、抗CD103(殖株2E7,BioLegend)、及Ova專一性四聚體(殘基257–264)。
抗體 ELISA
卵白蛋白(Ova)購自InvivoGen。高結合性96孔盤以100 ng Ova蛋白塗佈,該蛋白在PBS中稀釋至10 μg/ml的濃度。將盤洗滌一次,並在37℃下以3%脫脂牛奶阻斷1小時。將在含有PBS的1%脫脂牛奶中連續稀釋的血清樣品加入盤中,並在37℃下培養1小時。將盤以PBS-T洗滌三次,並加入溶於含有1%脫脂牛奶的PBS-T中的辣根過氧化物酶結合的山羊抗小鼠IgG、IgA(SouthernBiotech,1:5,000稀釋),並在37℃下培養1小時。在加入3,3',5,5'-四甲基聯苯胺受質溶液(Thermo Pierce)之前,各孔以PBS-T清洗3次。在5分鐘後加入0.16 M硫酸以終止反應。以Bio-Rad微盤讀儀測量450 nm處的光學密度。
Luminex 分析
此分析由Human Immune Monitoring Center at Stanford University進行。小鼠48叢Procarta試劑盒(EPX480-20834-901)購自Thermo-Fisher/Life Technologies,Santa Clara,California,USA,並按製造商的建議使用,進行所述的修飾。簡而言之:將珠粒加入96孔盤中,並在BioTek ELx405清洗機中清洗。將樣品加入含有混合抗體連接珠粒的盤中,並在4℃下搖動培養隔夜。在定軌搖床上以500-600 rpm的速度進行低溫(4℃)及室溫培養步驟。在隔夜培養後,各盤在BioTek ELx405清洗機中清洗,並加入生物素化檢測抗體,在室溫下搖動60分鐘。如所述洗滌盤,並在室溫下加入鏈黴親和素-PE 30分鐘。如上述洗滌盤,並將讀取緩衝液加入各孔中。每個樣品在雙孔或單孔中測量。使用Luminex 200或FM3D FlexMap儀器讀取各盤,每個細胞激素每個樣品的下限為50顆珠粒。Custom Assay Chex對照珠粒購自Radix BioSolutions,Georgetown,Texas;並添加到所有孔中。
CART 合成及 circRNA 複合物
O6-stat-N6:A9 CART(在本實例中簡稱為CART),其包含平均12個次單元的嵌段,其由油基(O)與壬烯基取代(N)的碳酸鹽次單元的統計1:1混合物及隨後的平均9個α-胺基酯次單元(A)的嵌段組成,其製備如前述。circRNA在PBS(pH 5.5)中稀釋,並在活體外轉染或腹腔遞送到小鼠之前立即與CART以1:10的電荷比混合。
轉錄體數據分析
MutuDC細胞如前述與裸circRNA培養或以CART-circRNA複合物轉染。在培養24小時後,按製造商的方案,使用RNeasy Mini試劑盒(Qiagen)從細胞中萃取總RNA。使用Agilent 2100生物分析儀分析總RNA的完整性,且RIN數量高於9。使用Illumina Ribo-Zero Plus rRNA Depletion試劑盒製備RNA庫。使用Illumina NextSeq 500將轉接子連接的庫定序。使用Salmon(版本1.4.0),藉由偽計數計算轉錄本豐度。標準化分析及差異基因表現分析由R(版本4.1.1)中的DESeq2程式包(v1.32.0)進行。GO術語的富集分析由ClusterProfiler程式包(v4.0.5)進行,且圖表由ggplot2程式包(v3.3.5)產生。
皮下黑色素瘤的 小鼠模型
收取B16-F10-OVA細胞,用於以1x10 6個細胞/ml在PBS中進行注射。將100 ul細胞懸液(1×10 5個細胞/小鼠)皮下注射到C57BL/6小鼠中。每天監控小鼠的腫瘤發生率及生長情況。當可觸及時,每隔一天使用數位卡尺測量腫瘤,並在二維中測量。藉由使用公式V=L×W×D×3.14/6確定腫瘤體積(V)。在腫瘤的中央處壞死之前犧牲小鼠。
統計分析
所有其他統計分析均使用Prism(GraphPad Software v9.2.0)進行。針對兩組的比較,使用Student氏t檢定(雙尾)確定P值。針對兩組以上的比較,應用單因子ANOVA伴隨Tukey氏檢定。將P值<0.05視為組間具有顯著差異。未使用統計方法來預先確定樣品大小。小鼠被隨機分配到各實驗組中。數據收集及分析並非在對實驗條件視而不見的情況下進行的。
結果
circRNA 由特定人類免疫細胞攝入
為了瞭解circRNA與造血系統之間的相互作用,使用前述活體外轉錄的circRNA分析由人類血液細胞攝入的circRNA,其嵌入螢光標記的UTP(圖15a)。藉由在整個實驗過程中轉換不同的螢光染料(cy5、cy3及螢光素),使染料專一性攝入的可能性降至最低,並獲得類似結果。從健康供體中分離出初代人類週邊血液單核細胞(PBMC),並在無血清培養基中以螢光標記的circRNA培養2小時,其防止circRNA結合至白蛋白,並藉由流式細胞儀定量circRNA的細胞攝入。基於細胞表面標記CD14、CD15、CD19、及CD41a分別在cy3+細胞上的表現,觀察到cy3標記的circRNA(cy3-circRNA)在單核球、嗜中性球、B細胞、及血小板中的攝入(圖15b)。值得注意的是,與其餘亞群相比,由單核球的circRNA攝入非常顯著。相反的,當使用與其circRNA對應物具有相同序列的Cy3標記的線性RNA(cy3-linRNA)時,在任何PBMC亞群中均未檢測到細胞攝入,這可能是由於線性RNA的不穩定性質所致。特定人類髓樣亞群的檢查顯示,典型單核球(此處定義為CD14+CD16-)在24小時過程中顯示出更高的circRNA攝入(圖15c及圖21a、b)。
分化的巨噬細胞以劑量依賴性方式有效地攝入 circRNA
經由共軛焦顯微鏡使circRNA攝入成像,其可區分RNA內化與細胞表面結合,並為流式細胞儀提供正交驗證。考量到典型單核球可分化成巨噬細胞,其為專門的吞噬細胞,檢查了由人類初代巨噬細胞的circRNA攝入及細胞定位。不同濃度的cy3-circRNA與巨噬細胞一起培養2小時。如圖15d所示,由巨噬細胞的cy3-circRNA攝入具有劑量依賴性,且在40 µg/ml時飽和,這與基於流動的攝入分析所得的結果一致(圖21c)。在人類巨噬細胞的細胞質中檢測到cy3-circRNA,而cy3-linRNA未檢測到攝入,其用作陰性對照(圖15d)。
為了建立基線模型來研究circRNA攝入的分子動力學,在一組人類及鼠科髓樣細胞株中測量circRNA攝入。CircRNA攝入水平具有細胞株專一性,且在分化的巨噬細胞株小鼠RAW264及J774、人類KG-1、及小鼠樹突細胞株MutuDC(DC)中觀察到最強的circRNA攝入(圖15e)。在單核球諸如人類細胞株THP1及U937中觀察到低水平的circRNA攝入。如在人類典型單核球(圖21d)及巨噬細胞細胞株J774與RAW264中觀察到的,circRNA攝入具有濃度依賴性(圖21e)。由於許多RNA療法在活體內遞送時定位在肝細胞中,因此在組織專一性細胞株中評估circRNA攝入,並在人類肝癌細胞株HepG2、肺上皮細胞株Calu-3、及肺纖維母細胞IMR-90中觀察到cy5標記的circRNA(cy5-circRNA)的強攝入(圖21f)。
由巨噬細胞的 circRNA 攝入係快速、可飽和且依賴 ATP
使用巨噬細胞株RAW264定量circRNA攝入的動力學及潛在機轉。在5分鐘後立即觀察到cy5-circRNA的攝入,並持續累積24小時,表明其為快速且連續的過程(圖16a)。螢光陽性細胞的百分比隨時間而線性增加( R2 = 0.7805, p值 =0.0196,y = 0.03877x + 18.17),這可能表明涉及液相內吞機轉。受體媒介的內吞作用的額外標誌為(i)在高配體濃度下飽和及(ii)藉由過量的相同或相關配體的攝入專一性競爭。當在濃度遞增的cy5-circRNA濃度下分析circRNA的攝入時,觀察到一個可飽和過程,該過程在1 mM circRNA濃度下達到高原期(圖16b)。為了確定circRNA攝入的專一性,進行了競爭分析。如圖16c所示,未經標記circRNA、linRNA、及質體DNA有效地競爭cy5-circRNA攝入。相反的,在結構上類似於雙股RNA的Poly(I:C)及tRNA不與circRNA攝入競爭,而是在circRNA攝入具有正面效果。另外,在質量及電荷方面與某些寡核苷酸相當的肝素無法干擾circRNA攝入。這些結果表明,巨噬細胞經由可飽和及配體選擇性過程攝入circRNA,其可能涉及一或多種受體。
若細胞攝入過程需要能量,則稱為活化的。這通常是藉由以低溫或代謝阻斷抑制能量產生而確定。與多個配體濃度的37℃下培養相比,在4℃下的培養中circRNA攝入受到嚴重抑制(圖16d),表明RAW264細胞中的circRNA攝入具有能量依賴性。在4℃下,HepG2、IMR-90、及Calu3細胞 CircRNA攝入中的circRNA攝入也實質上減弱(圖22a)。當以ATP抑制劑疊氮化鈉處理RAW264細胞時,circRNA攝入減少了50%(圖16e)。相反的,當在RAW264細胞中藉由脂質媒介的轉染而遞送cy5-circRNA時,在circRNA遞送中觀察到無效果(圖16e)。其他代謝抑制劑也證實了類似的結果,諸如抑制ATP合成酶的寡黴素及干擾d-葡萄糖代謝的2-去氧葡萄糖(圖22b)。相反的,測試了是否藉由活化巨噬細胞而促進circRNA攝入,從而增加其等的吞噬機轉。PMA而非LPS或CD40L的處理導致cy5-circRNA攝入的顯著增加(圖22c)。
為了在不存在螢光染料的情況下定量circRNA攝入,RAW264細胞在以未經標記circRNA培養24小時後進行qRT-PCR,其中使用專一性地靶向circRNA的反向剪接區的引子。在攝入後的circRNA水平與脂質轉染相當(圖22d)。線性RNA的攝入也可藉由qRT-PCR(一種比螢光更靈敏的分析)檢測(圖22d)。在RAW264及J774細胞中,circRNA攝入大於linRNA攝入,但在HepG2細胞中則相當(圖22e)。為了追蹤活細胞中circRNA的內化,使用了與細胞內pH指示劑pHrodo-Red(一種在中性pH條件下螢光變弱,在酸性條件下螢光增強的螢光探針)共價結合的circRNA。pHrodo-Red訊號與cy5螢光的密切相關(圖22f)。這些結果證實了circRNA的細胞內定位,並可能表明部分circRNA定位在酸性隔室(諸如胞內體或溶酶體)中。
由樹突細胞的 circRNA 攝入導致轉譯及呈現給 T 細胞
為了確定circRNA在由巨噬細胞及樹突狀細胞攝入後是否可轉譯,設計了兩種circRNA分子,一種編碼報導子蛋白奈米螢光素酶(以下稱為circNanoLuc),另一種編碼模型抗原雞卵白蛋白(以下稱為circOVA)。為了最大化circRNA轉譯,將先前優化的元件用於circRNA設計及轉錄。這些元件包括優化的RNA化學修飾、5’及3’非轉譯區、內部核糖體進入位點(IRES)、及合成的適體,顯示出在單次轉染後circRNA的轉譯優於mRNA。與脂質媒介的轉染相比,circNanoLuc攝入在轉染/攝入24小時後導致類似的發光讀數,這表明circRNA在RAW264細胞攝入後穩定且易於轉譯(圖17a)。circRNA轉譯也與相同蛋白質的mRNA形式相當,如在以濃度遞增的相應mRNA或編碼奈米螢光素酶的circRNA培養後的RAW264及HepG2細胞中觀察到的(圖23a)。
啟動細胞毒性免疫反應的基本過程為抗原交叉呈現。僅樹突細胞而非巨噬細胞含有MHC第I類抗原處理所需的專門交叉呈現轉運系統。為了確定circRNA是否可由樹突狀細胞轉譯及處理以進行抗原呈現,在以circOVA培養後測試了MutuDC的抗原呈現能力。在293T細胞中驗證circOVA的蛋白質轉譯能力。以circOVA轉染24小時後,在細胞溶胞產物及上清液中檢測到卵白蛋白(圖23b)。使用特定MHC四聚體,在以circOVA、SIINFEKL肽、或Ova蛋白培養24小時後,測試了卵白蛋白衍生的肽SIINFEKL與MutuDC細胞上MHC第I類的H-2Kb的結合。與對照相比,circOVA培養導致抗原呈現能力增加5倍(圖17b)。另外,測量了抗原引發的樹突細胞在活體外誘導T細胞專一性增生的能力。在與OT-1-轉基因CD8 T細胞共培養3天後,MutuDC細胞中的circOVA攝入導致抗原專一性T細胞增生的最強誘導,甚至高於OVA蛋白或SINFEKL肽培養(圖17c)。在加入CpG寡去氧核苷酸(短的合成的單股DNA,已知會誘導樹突細胞成熟)後,這種效果得到增強。總結,這些結果表明circRNA可被攝入,在胞質液中轉譯,且由circRNA編碼的蛋白質可經處理並呈現給免疫系統。
CircRNA 攝入與 CART 媒介的遞送
為了進一步優化circRNA轉譯,使用電荷可變可釋放轉運體系統(CART)測試circRNA遞送,CART為一類合成的生物可降解材料,顯示出在細胞內複合、保護及有效地遞送mRNA及circRNA,導致高效的蛋白質轉譯。藉由在遞送AF488標記的circRNA後24小時測量RAW264細胞的螢光而驗證使用CART的circRNA有效遞送(圖23c)。使用或不使用CART將不同量的circOVA遞送到MutuDC細胞中,進行T細胞增生分析。當circRNA與CART複合時,觀察到達成抗原專一性T細胞增生所需的輸入材料減少了約100倍(圖17d)。這一觀察結果表明,大多數由樹突狀細胞自然內化的裸circRNA未被有效轉譯。
為了進一步研究circRNA攝入後與CART遞送相比的轉譯效率差異,在遞送裸circRNA(以下稱為circRNA)或與CART複合(以下稱為CART-circRNA)後檢查MutuDC細胞的轉錄體輪廓。主成分分析(PCA)顯示每種情況很容易彼此區分,這表明不同的轉錄體輪廓表徵了circRNA遞送的路徑(圖24a)。CircRNA攝入的特徵在於Cd74的上調,Cd74為抗原加工的關鍵伴護蛋白,其引導轉運到胞內體/溶酶體系統(圖24b)。另一方面,除了幾種干擾素誘導的跨膜蛋白的上調以外,CART-circOVA還導致 Hmox1(一種具有細胞保護作用的膜結合酶)的顯著上調(圖24b)。各種處理之間的差異表現分析顯示,在circRNA組中參與受質識別及抗原加工與呈現的細胞膜組分(Cd74、Asb2、MHC-I剪接變體)的專一性上調,而CART-circOVA條件導致細胞質受體(Dhx58、Oas1g、Oas2)的顯著上調(圖24c)。與對照相比,在circRNA攝入後差異表現基因的功能註釋導致與「細胞對LPS的反應」顯著相關(圖24d),表明來自胞內體的類鐸受體傳訊。相反的,CART-circOVA處理的細胞的功能性輪廓與「對病毒的反應」及來自胞質液的dsRNA傳訊更加相關(圖24e)。染色質組裝及組織,其可能與CART試劑(其與DNA形成奈米顆粒聚集體)相關,也是最重要的生物過程之一(圖24e)。總結,GO富集分析支持了裸circRNA定位細胞膜或胞內體隔室中/在細胞膜或胞內體隔室中檢測出,而以CART遞送的circRNA定位在胞質液中且易於轉譯。這些結果表明,取決於內化方法,circRNA定位在不同的細胞隔室中,從而被不同地辨識及處理。然而,這兩種治療均會導致病毒反應及免疫效應過程的活化。
接著,確定了藉由不同途徑遞送circRNA後抗原呈現細胞的免疫表型。MutuDC細胞的circRNA攝入引發胞質液RNA傳感器RIG-I及MDA5的mRNA水平以及編碼IL1-B、TNFa及IL-6(樹突細胞分化及成熟所需的細胞激素)的轉錄本的顯著增加。CircRNA轉染及CpG處理均未誘導這些(圖17e)。另外,在circRNA攝入後測量發炎性細胞激素的分泌及MutuDC表面上活化標記物的水平表明,除了MCP1(單核球趨化劑蛋白-1,其具有驅動髓樣及淋巴細胞趨化性的能力 25)水平增加以外,僅在circRNA攝入後TNFa及IL-6蛋白顯著增加(圖17f)。與未經處理樣品或circRNA轉染相比,circRNA攝入顯著增加了DC活化標記物MHC-II、MHC-1、CD80、CD40、CD86的表面表現,但與CpG對照相當(圖17g)。這些結果表明,circRNA攝入導致先天免疫受體活化,從而導致樹突細胞成熟。當circRNA藉由裸攝入或脂質封裝遞送時,在先天免疫反應中觀察到的差異突顯了所涉及的內化機轉的差異以及不同受體及傳訊途徑的活化。
circRNA 在注射至小鼠時會誘導先天免疫細胞活化。
為了檢查circRNA在活體內遞送時的生物分佈,檢查了在免疫後其攝入及後續先天免疫反應的活化。將25 µg circRNA與螢光團AF488結合為AF488-circRNA,並將其皮下(s.c.)注射到C57BL/6小鼠體內。在免疫後6小時及24小時藉由Luminex先天細胞激素組分析血清(圖18a),同時在免疫後24小時經由流式細胞儀分析引流腹股溝淋巴結(iLN)中的先天免疫細胞亞群(圖18a、圖25a)。單核球定義為CD11b+Ly6C+ 細胞,樹突細胞定義為CD11c highMHCII high細胞,其中DC亞群進一步細分為遷移性CD103+或CD11b+ DCs(mDC)以及常駐性CD8a+或CD11b+ DCs(rDC)。淋巴結(LN)巨噬細胞經鑑定為CD11b+Ly6CloF4/80+/-CD169+/-,且漿細胞樣樹突細胞(pDCs)經鑑定為CD11b-PDCA-1+細胞。最後,嗜中性球定義為CD11b+Ly6G+,且嗜酸性球定義為CD11b+Signlec-F+(圖25a)。藉由每個細胞亞群上活化標記物CD86的上調而測量先天細胞活化。在皮下注射後24小時,在單核球、樹突細胞、及引流淋巴結中的數個巨噬細胞亞群中檢測到circRNA。巨噬細胞亞群攝入circRNA的巨噬細胞亞群包括邊緣索巨噬細胞(MCM)、邊緣竇巨噬細胞(MSM)、及囊下竇巨噬細胞(SSM),其中MCM及MSM對circRNA的攝入最為顯著(圖18b)。這些結果類似於在活體外以人類初代細胞觀察到的結果(圖15b),其中巨噬細胞及單核球顯示出circRNA的攝入。儘管在活體外人類B細胞中觀察到circRNA攝入(圖15b),但小鼠iLN B細胞在免疫後24小時未顯示circRNA攝入。即使在小鼠中未觀察到B細胞攝入circRNA,在免疫後24小時iLN中的B細胞頻率顯著增加(圖18c),且如測量CD86的上調,B細胞活化也增加(圖18d)。觀察到iLN中單核球的頻率(圖18c)及活化(圖18d),以及所有巨噬細胞及樹突細胞亞群的活化(圖18d)顯著增加。
為了研究先天活化及circRNA攝入在裸與CART媒介的circRNA遞送之間是否不同,小鼠以單獨的CART、裸circRNA、或CART-circRNA進行皮下注射免疫。在免疫後24小時,測量腹股溝LN中的先天細胞頻率、活化、及circOVA攝入。儘管以單獨CART的免疫誘導了一些先天免疫,諸如iLN中單核球頻率的增加(圖26a),以及mDC上CD86表現的增加(圖26c),但將其加入circRNA中並未顯著改變免疫細胞的circRNA攝入(圖26b)或iLN中的先天細胞浸潤及活化(圖26a、c)。因此,CART不會影響先天免疫活化及circRNA的攝入。
為了檢查血清細胞激素對circRNA免疫的反應,在免疫後6及24小時以先天細胞激素的Luminex組分分析來自免疫小鼠的血清(圖25b)。觀察到大量產生趨化因子:CCL5、CCL4、CCL3、CCL7、CXCL10、CCL2;以及細胞激素:IL-6、TNFa、IL-12;其中在免疫後6小時達到峰值,隨後在24小時下降(圖18e)。BAFF及CCL11顯示持續增加,其中在24小時達到峰值(圖18e)。綜上所述,數據顯示,裸circRNA在注射到小鼠體內時由先天免疫細胞攝入,隨後誘導數種先天免疫細胞類型的活化及多種趨化介素的釋放。circRNA活化先天免疫的這一觀察促使了研究circRNA誘導後天免疫反應的能力,不論是用作佐劑還是在編碼抗原序列時皆然。
當與可溶性蛋白結合時, circRNA 可作為一種有效的疫苗佐劑,其藉由多種免疫途徑誘導強的 T 細胞反應及抗體反應
當circRNA與可溶性Ova蛋白結合時可作為佐劑。為了進一步評估circRNA的佐劑能力,小鼠以免疫原性circRNA(缺乏m6A修飾(14))及Ova蛋白(以下稱為OVAp)進行免疫,並在第7天及第30天的加強針後測量脾、引流淋巴結、及肺中的T細胞反應及抗體反應(圖19)。將T細胞反應及抗體反應的強度與三種遞送策略進行比較:皮下注射(s.c.)、鼻內注射(i.n.)及靜脈注射(i.v.)。另外,將circRNA與常見的疫苗佐劑AddaVax以及Poly(I:C)進行比較。據觀察,在第7天的加強針後,皮下注射circRNA+OVAp在肺、脾及LN中誘導了與AddaVax+OVAp相當的T細胞反應(藉由MHC第I類四聚體 + CD8 T細胞的頻率而測量)(圖27a)。鼻內接種circRNA+OVAp在第7天的加強針後在肺中誘導最高的反應,其中在一些小鼠中四聚體陽性細胞的頻率高達40%(圖19b)。
據觀察,在第30天的加強針後,與AddaVax+OVAp(~5%)相比,皮下遞送circRNA+OVAp對抗原專一性CD8 T細胞誘導2倍以上的頻率(約10%)(圖19c),表明與AddaVax相比,circRNA可能增強記憶T細胞的誘導作用。另外,鼻內及靜脈遞送方法觀察到強的肺記憶CD8 T細胞反應(圖19c),係因誘導了CD69+及CD69+CD103+亞群的肺常駐記憶CD8 T細胞(TRM)(圖27d)。為了測量免疫後的抗體反應,小鼠在加強針後30天進行採血。在所有遞送途徑中,在血清中觀察到類似的抗Ova IgG抗體水平,然而,僅鼻內及靜脈免疫會誘導血清中抗OVA IgA抗體(圖27b、c)。
最後,為了比較作為鼻內佐劑的circRNA及Poly(I:C),小鼠以任一佐劑與可溶性Ova的組合進行免疫。circRNA及Poly(I:C)在加強針後第30天的肺中誘導了相當頻率的抗原專一性CD8 T細胞(圖17e),包括CD69+及CD69+CD103+抗原專一性常駐記憶T細胞(圖19d及圖27d)。另外,在血清中誘導了類似水平的抗321 Ova IgG及IgA抗體(圖27f、g)。綜上所述,結果表明,circRNA在許多免疫途徑中可用作有效的疫苗佐劑,並誘導了對Poly(I:C)及AddaVax相當的反應。另外,以circRNA作為佐劑的黏膜性免疫可誘導有效的常駐記憶CD8 T細胞(TRM)反應。
編碼抗原的 circRNA 在活體內誘導強的 T 細胞反應
為了優化編碼抗原序列的circRNA如何在活體內誘導後天免疫反應,將circOVA的免疫原性與可溶性Ova蛋白結合circRNA(以下稱為circRNA+OVAp)進行比較。小鼠以m6A修飾或未修飾的circOVA進行鼻內注射免疫,並在加強針後30天分析肺的抗原專一性T細胞反應。發明人先前已顯示,m6A的存在會消除circRNA免疫力(16),且如所預期,m6A修飾的circOVA的裸遞送不會誘導任何OVA專一性T細胞反應(圖28b)。針對此原因,未經修飾circOVA用於接下來的實驗。未經修飾circOVA組中的一部分動物在裸circRNA遞送後確實產生有效的OVA專一性CD8 T細胞反應,但許多其他動物則否(圖28b)。這種現象表明在活體內遞送時裸circOVA表現的效率低下,並證實了遞送載具可能是circOVA誘導最佳免疫反應所需。
為了遞送用於活體內轉譯的circRNA,使circOVA與CART複合。CART已顯示在小鼠中有效運作,具有高封裝效率,耐受性良好且無免疫原性 22,26。三組小鼠在第0天及第21天以單獨的CART(僅載具對照)、CART-circOVA、及circRNA + OVAp進行腹腔注射免疫。在第7天(引發後7天)及第42天(加強針後21天)藉由肺、脾、及血液T細胞的MHC第I類四聚體染色而評估抗原專一性CD8 T細胞反應。據觀察,CART-circOVA在一次免疫後第7天在肺、脾(圖20a、c)及血液(圖20c)中誘導有效的CD8 T細胞反應。在加強免疫後三週(第42天),在CART-circOVA組的脾及肺中可看到顯著水平的CD8 T細胞反應(圖20b及20c),而circRNA+OVAp(i.p.)在這個時間點不會導致強的CD8 T細胞反應。另外,KLRG1-CD127+記憶細胞佔了CART-circOVA組中抗原專一性T細胞群的約40%(圖28a、d)。因此,與CART複合的circOVA在小鼠中會誘導有效的T細胞反應。儘管使用及不使用CART的circRNA攝入及先天細胞活化沒有顯著差異(圖25c),但T細胞反應由於CART而顯著增強,表明在circRNA攝入後的事件可能受CART遞送不同的影響。
circRNA 攝入可能受 CART 遞送不同的影響。
為了測量免疫後的抗體反應,小鼠在第0、7、21(加強前)及42天進行採血。據觀察,儘管與CART-circOVA相比,circRNA+OVAp誘導一致且顯著更高的抗Ova IgG,但在CART-circOVA組中仍可檢測到抗Ova抗體而數量有限(圖20d)。缺乏一致的抗體反應可能是由於在CART-circOVA免疫後蛋白質的分泌減少所致。在免疫後24小時血液中無法檢測到Ova蛋白。這表明免疫策略導致T細胞偏誤反應,且進一步的優化可能會提供對circOVA的強抗體反應。綜上所述,數據表明,合成的環狀RNA可編碼免疫所需的抗原及佐劑活性,且circRNA遞送的途徑、劑量、及方式會影響程序化免疫反應的效力、一致性、及記憶。
CircRNA 疫苗誘導抗腫瘤功效。
癌症疫苗接種旨在誘導能夠靶向及清除腫瘤細胞的基於抗原專一性T細胞的細胞免疫(44)。用與CART複合的circOVA免疫後,在組織及血液中系統性地觀察到強的細胞毒性T細胞反應,促使了研究circRNA以作為癌症疫苗。預期疫苗誘導的OVA專一性T細胞將根除表現OVA的腫瘤。另外,抗腫瘤反應可能是全身性的,並藉由在遠離腫瘤的部位接種疫苗而引發(即遠隔效應)。在治療方案中測試了CART-circRNA疫苗的抗腫瘤功效。C57BL/6小鼠被隨機分配成兩組:對照組(未經處理)及CART-circOVA(疫苗)組。將同基因型B16-F10-OVA黑色素瘤細胞皮下注射接種在所有小鼠的背上。在腫瘤細胞接種後4天及8天,腹腔注射CART-circOVA製劑(圖29a)。與未經處理組相比,circRNA疫苗組顯示出顯著的腫瘤生長抑制(圖29b)。生物發光成像證實根除了螢光素酶標記的癌細胞(圖30a、b)。這些結果表明,circRNA免疫可作為一種有效的癌症免疫療法來抑制活體內腫瘤生長。 8
circRNA CDS RNA 修飾 IRES 5’ UTR 3’ UTR 標記
圖15b-d circForeign GFP (出框) iCVB3 cy3
圖15e circForeign GFP (出框) iCVB3 cy5
圖16a、b circForeign GFP (出框) iCVB3 cy5
圖16c circForeign GFP (出框) iCVB3
圖16d、e circForeign GFP (出框) iCVB3 cy5
圖17a circNanoLuc 奈米螢光素酶 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖17b circOVA 卵白蛋白 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖17c circOVA 卵白蛋白 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖17c circForeign GFP (出框) iCVB3
圖17d-g circOVA 卵白蛋白 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖18a-e circForeign GFP (出框) iCVB3 AF488
圖19a-d circOVA 卵白蛋白 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖20a-d circForeign GFP (出框) iCVB4
圖20a-d circOVA 卵白蛋白 5% 2’-O-甲基C synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖7A-D circForeign GFP (出框) iCVB3 cy3
圖7E-F circForeign GFP (出框) iCVB3 cy5
圖8A-C circForeign GFP (出框) iCVB3 cy5
圖8D circForeign GFP (出框) iCVB3
圖8E circForeign GFP (出框) iCVB3 AF488
圖8F circForeign GFP (出框) iCVB3 cy5
圖9A circNanoLuc 奈米螢光素酶 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖9B circOVA 卵白蛋白 5% m6A synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖9C circForeign GFP (出框) iCVB3 AF488
圖10A-E circForeign GFP (出框) iCVB3
圖11A-C circForeign GFP (出框) iCVB3 AF488
圖12a-c circOVA 卵白蛋白 synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1 AF488
圖13a-f circForeign GFP (出框) iCVB3
圖14A-D circOVA 卵白蛋白 5% 2’-O-甲基C synIRES-RC25 (基於iHRVB3) 5’ PABP間隔子 HBA1
圖14A-D circForeign GFP (出框) iCVB3
9
引子名稱 序列 SEQ ID NO:
qRTPCR-mus-RIGI-R CAG ATC CGA GAC ACT AAA GGG A 33182
qRTPCR-mus-RIGI-F TCC TCA TCA GCC TTG CTT TCA 33183
qRTPCR-mus-MDA5-F ATG GAC GCA GAT GTT CGT GG 33184
qRTPCR-mus-MDA5-R TCC CTT CTC GAA GCA AGT GTC 33185
qRTPCR-muE-PKR-F ATG CAC GGA GTA GCC ATT ACG 33186
qRTPCR-muS-PKR-R TGA CAA TCC ACC TTG TIT TCG T 33187
qRTPCR-mus-IL1B-F AAG GGC TGC TTC CAA ACC TIT GAC 33188
qRTPCR-mas-IL1B-R ATA CTG CCT GCC TGA AGC TCT TGT 33189
qRTPCR-mus-TNF-A-F TCT CAT GCA CCA CCA TCA AGG ACT 33190
qRTPCR-mus-TNF-A-R ACC ACT CTC CCT TTG CAG AAC TCA 33191
qRTPCR-mus-IL6-F TCCAGTTGCCTTCTTGGGAC 33192
qRTPCR-mus-IL6-R GTACTCCAGAAGACCAGAGG 33193
qRTPCR-mus-TLR2-F ACAGCAAGGTCTTCCTGGTTCC 33194
qRTPCR-mus-TLR2-R GCTCCCTTACAGGCTGAGTTCT 33195
qRTPCR-mus-B-ACT-F GAC TAC CTC ATG AAG ATC CTG ACC 33196
qRTPCR-mus-B-ACT-R CTC AGT AAC AGT CCG CCT AGA AG 33197
實例 2 參考文獻1. Kristensen, L. S. et al.The biogenesis, biology and characterization of circular RNAs. Nat Rev Genet1–17 (2019). doi:10.1038/s41576-019-0158-7 2. Memczak, S. et al.Circular RNAs are a large class of animal RNAs with regulatory  potency. Nature495, 333–338 (2013). 3. Hansen, T. B. et al.Natural RNA circles function as efficient microRNA sponges. Nature495, 384–388 (2013). 4. Ashwal-Fluss, R. et al.circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell56, 55–66 (2014). 5. Huang, A., Zheng, H., Wu, Z., Chen, M. & Huang, Y. Circular RNA-protein interactions: functions, mechanisms, and identification. Theranostics10, 3503–3517 (2020). 6. Yang, Q. et al.A circular RNA promotes tumorigenesis by inducing c-myc nuclear translocation. Cell Death Differ24, 1609–1620 (2017). 7. Pamudurti, N. R. et al.Translation of CircRNAs. Molecular Cell66, 9–21.e7 (2017). 8. Chen, C.-K. et al.Structured elements drive extensive circular RNA translation. Molecular Cell81, 4300–4318.e13 (2021). 9. Yang, Y. et al.Extensive translation of circular RNAs driven by N6-methyladenosine. Cell Res.27, 626–641 (2017). 10. Wesselhoeft, R. A., Kowalski, P. S. & Anderson, D. G. Engineering circular RNA for potent and stable translation in eukaryotic cells. Nature Communications9, 2629 (2018). 11. Chen, R. & Wang, S. K. Engineering circular RNA for enhanced protein production. Nature Biotechnology1–40 (2022). 12. Liu, C.-X. et al.Structure and Degradation of Circular RNAs Regulate PKR Activation in Innate Immunity. CELL177, 865–880.e21 (2019). 13. Feng, Z. et al.Functions and Potential Applications of Circular RNAs in Cancer Stem Cells. Front Oncol9, 500 (2019). 14. Chen, Y. G. et al.N6-Methyladenosine Modification Controls Circular RNA Immunity. Molecular Cell76, 96–109.e9 (2019). 15. Liu, C.-X. & Chen, L.-L. Expanded regulation of circular RNA translation. Molecular Cell81, 4111–4113 (2021). 16. Zhang, Z., Yang, T. & Xiao, J. Circular RNAs: Promising Biomarkers for Human Diseases. EBioMedicine34, 267–274 (2018). 17. Lasda, E. & Parker, R. Circular RNAs Co-Precipitate with Extracellular Vesicles: A Possible Mechanism for circRNA Clearance. PLoS ONE11, e0148407–11 (2016). 18. Vausort, M. et al.Myocardial Infarction-Associated Circular RNA Predicting Left Ventricular Dysfunction. J Am Coll Cardiol68, 1247–1248 (2016). 19. Hansen, E. B. et al.The transcriptional landscape and biomarker potential of circular RNAs in prostate cancer. Genome Med14, 8–16 (2022). 20. Qu, L. et al.Circular RNA vaccines against SARS-CoV-2 and emerging variants. CELL185, 1728–1744.e16 (2022). 21. Alinovskaya, L. I., Sedykh, S. E 913 ., Ivanisenko, N. V., Soboleva, S. E. & Nevinsky, G. A. How human serum albumin recognizes DNA and RNA. Biol Chem399, 347–360 (2018). 22. McKinlay, C. J. et al.Charge-altering releasable transporters (CARTs) for the delivery and release of mRNA in living animals. Proc. Natl. Acad. Sci. U.S.A.114, E448–E456 (2017). 23. Askew, D., Chu, R. S., Krieg, A. M. & Harding, C. V. CpG DNA induces maturation of dendritic cells with distinct effects on nascent and recycling MHC-II antigen-processing mechanisms. J.I.165, 6889–6895 (2000). 24. Wu, X., Xu, F., Liu, J. & Wang, G. Comparative study of dendritic cells matured by using IL-1β, IL-6, TNF-α and prostaglandins E2 for different time span. Exp Ther Med14, 1389–1394 (2017). 25. Cortez, A. & Muxfeldt, E. Monocyte chemoattractant protein-1 and hypertension: An overview. Hipertens Riesgo Vasc39, 14–23 (2022). 26. Haabeth, O. A. W. et al.An mRNA SARS-CoV-2 Vaccine Employing Charge-Altering Releasable Transporters with a TLR-9 Agonist Induces Neutralizing Antibodies and T Cell Memory. ACS Cent Sci7, 1191–1204 (2021). 27. Chen, Y. G. et al.Sensing Self and Foreign Circular RNAs by Intron Identity. Molecular Cell67, 228–238.e5 (2017). 28. Liu, J. et al.Targeting macrophage checkpoint inhibitor SIRPα for anticancer therapy. JCI Insight5, (2020).
本文描述本發明的各種具體實例,包括發明人已知的用於實施本發明的最佳模式。在閱讀前面的描述之後,這些具體實例的變型對於本發明所屬技術領域中具有通常知識者來說將變得顯而易見。本發明人期望熟練的技術人員合適地採用這樣的變化,且本發明人希望以不同於本文具體描述的方式實施本發明。因此,本發明包括適用法律所允許的所附申請專利範圍中記載申請標的之所有修飾及等同物。另外,除非本文另外指出或與上下文明顯矛盾,否則本發明涵蓋上述元件在其所有可能變化中的任何組合。
本文引用的所有參考文獻,包括出版物、專利申請案及專利,均以引用的方式併入本文,如同每篇參考文獻經單獨地且具體地指示為藉由引用併入本文並在此整體地闡述。
序列表
描述 序列 SEQ ID NO:
iPV1 IRES ttaaaacagctctggggttgtacccaccccagaggcccacgtggcggctagtactccggtattgcggtacccttgtacgcctgttttatactcccttcccgtaacttagacgcacaaaaccaagttcaatagaagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgatgtcgtatagactgcttgcgtggttgaaagcgacggatccgttatccgcttatgtacttcgagaagcccagtaccacctcggaatcttcgatgcgttgcgctcagcactcaaccccagagtgtagcttaggctgatgagtctggacatccctcaccggtgacggtggtccaggctgcgttggcggcctacctatggctaacgccatgggacgctagttgtgaacaaggtgtgaagagcctattgagctacataagaatcctccggcccctgaatgcggctaatcccaacctcggagcaggtggtcacaaaccagtgattggcctgtcgtaacgcgcaagtccgtggcggaaccgactactttgggtgtccgtgtttccttttattttattgtggctgcttatggtgacaatcacagattgttatcataaagcgaattggattggccatccggtgaaagtgagactcattatctatctgtttgctggatccgctccattgagtgtgtttactctaagtacaatttcaacagttatttcaatcagacaattgtatcata 33045
iPV2 IRES ttaaaacagctctggggttgttcccaccccagaggcccacgtggcggccagtacactggtatcgcggtacctttgtacgcctgttttatactcccttcccccgtaacttagaagcacaacgtccaagttcaatagaagggggtacaaaccagtaccaccacgaacaagcacttctgttcccccggtgaggctgtataggctgtttccacggctaaaagcggctgatccgttatccgctcatgtacttcgagaagcctagtatcaccttggaatcttcgatgcgttgcgctcaacactcaaccccagagtgtagcttaggtcgatgagtctggacgttcctcaccggcgacggtggtccaggctgcgttggcggcctacctgtggcccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctattgagctacctgagagtcctccggcccctgaatgcggctaatcctaaccacggagcaggcagtggcaatccagcgaccagcctgtcgtaacgcgcaagttcgtggcggaaccgactactttgggtgtccgtgtttccttttatttttacaatggctgcttatggtgacaattattgatagttatcataaagcaaattggattggccatccggtgagaatttgattattaaattactctcttgttgggattgctcctttgaaatcctgtgcactcacacctattggaattacctcattgttgagatattattaccact 33046
iPV3 IRES ttaaaacagctctggggttgctcccaccccagaggcccacgtggcggccagtactctggtattgcggtacctttgtacgcctgttttatactccctccccccgtgcaactttagaagaaatccacaaagttcaatagagggggtgcaaaccagcaccaccacgaacaagcacttctgtttccccggtgatgtcgtataagctgtacccacggctgaaggcgacggatccgttatccgcttgagtacttcgagaagcctagtattaccttggaatcttcgacgcgttgcgctcagcactctaccccgagtgtagcttaggtcgatgagtctgggcacgccccaccggcgacggtggcccaggctgcgttggcggcctacccatggctatcaccatgggacgctagttgtgaacaaggtgtgaagagcctattgagctacccaagagtcctccggcccctgaatgcggctaatcctaaccacggagcaagtgtcctcaacccaggggatggcttgtcgtaacgcgaaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttatttttatgtatggctgcttatggtgacaatcaaaggttgttaccataaagcaatttggattggccatccggtgagaatcaaacatattatctacctgtttgttgggttttcttcttttacttgaacaatacctctaataataactgctatattgtcaataagacattatcatcaca 33047
iHRV1 IRES ttaaaactgggtgtgggttgttcccacccacaccacccaatgggtgttgtactctgttattccggtaactttgtacgccagtttttccctcccctccccatccttttacgtaacttagaagttttaaatacaagaccaatagtaggcaactctccaggttgtctaaggtcaagcacttctgtttccccggttgatgttgatatgctccaacagggcaaaaacaacagataccgttatccgcaaagtgcctacacagagcttagtaggattctgaaagatctttggttggtcgttcagctgcatacccagcagtagaccttgcagatgaggctggacattccccactggtaacagtggtccagcctgcgtggctgcctgcgcacctctcatgaggtgtgaagccaaagatcggacagggtgtgaagagccgcgtgtgctcactttgagtcctccggcccctgaatgcggctaaccttaaacctgcagccatggctcataagccaatgagtttatggtcgtaacgagtaattgcgggatgggaccgactactttgggtgtccgtgtttcactttttcctttattaattgcttatggtgacaatatatatattgatatatattggcatc 33048
iHRV2 IRES ttaaaactggatccaggttgttcccacctggatttcccacagggagtggtactctgttattacggtaactttgtacgccagttttatctcccttcccccatgtaacttagaagtttttcacaaagaccaatagccggtaatcagccagattactgaaggtcaagcacttctgtttccccggtcaatgttgatatgctccaacagggcaaaaacaactgcgatcgttaaccgcaaagcgcctacgcaaagcttagtagcatctttgaaatcgtttggctggtcgatccgccatttcccctggtagacctggcagatgaggctagaaataccccactggcgacagtgttctagcctgcgtggctgcctgcacaccctatgggtgtgaagccaaacaatggacaaggtgtgaagagccccgtgtgctcgctttgagtcctccggcccctgaatgtggctaaccttaaccctgcagctagagcacgtaacccaatgtgtatctagtcgtaatgagcaattgcgggatgggaccaactactttgggtgtccgtgtttcactttttcctttatatttgcttatggtgacaatatatacaatatatatattggcacc 33049
iHRV-B3 IRES ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33050
iCVA1 IRES ttaaaacagctctggggttgttcccaccccagaggcccacgtggcggccagtactctggtattgcggtacctttgtacgcctgttttatatcccctccccaagtaactttagaagcaattcacaaagttcaatagagggggtacaaaccagtaccaccatgaacaagcacttctgtttccccggtgaagctgtatagactgttcccacggtcgaaaatggcagatccgttatccgctcacgtacttcgagaagcctagtatcatcttggaatcttcgacgcgttgcgctcagcactctaccccgagtgtagcttaggccgatgagtctgggcataccccaccggcgacggtggcccaggctgcgttggcggcctacccatggctaatgtcatgggacgctagttgtgaacaaggtgtgaagagcctattgagctacttgagagtcctccggcccctgaatgcggctaatcctaaccatggagcaagtgcccacaagccagtgggtggcttgtcgtaatgcgcaagtctatggcggaaccgactactttgggtgtccgtgtttccttttattcttattatggctgcttatggtgacaacctaagattgttgtcatatagcttttggattggccatccggtgatctttgagattaatataccttccttattacttcatagtactcatttattcattacactactgtagttaca 33051
iCVA16 IRES ttaaaacagcctgtgggttgttcccacccacagggcccactgggcgctagcacactgattctacgggatccttgtgcgcctgttttataatccttcccccaagtagcaacttagaagctttgtacaatcacgaccagtagtgggcgtggcgcgccagtcacgtcttggtcaagcacttctgtatccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgttacccggctaactacttcgagaaacccagtagcaccgtgaaagttgcggagtgtttcgctcagcacttcccccgtgtagatcaggtcgatgagtcactgtaaaccccacgggcgaccgtgacagtggctgcgttggcggcctgcccatggggtaacccatgggacgctctaatacagacacggtgtgaagagtctattgagctagttagtagtcctccggcccctgaatgcggctaatcctaactgcggagcgcgcaccctcaacccagggggcggcgtgtcgtaatgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattccttattggctgcttatggtgacaattgaaaagttgttaccatatagctattggattggccatccggtgtctaatagagctattgtttacttatttattggatacgtccctcttaatctcaaagtcattcaaactcttgattatatattgctccttaactgtaagaa 33052
iCVB2 IRES ttaaaacagcctgtgggttgatcccacccacagggcccactgggcgctagcacactggtattacggtacctttgtgcgcctgttttatctacccttgcccaatgcaacatagaagcttagtccaaaaggtcaataggcagcccagtgcaccaactgggtccagaccaagcacttctgttaccccggaccaagtatcagtaggctgctcacgcggtgaaggagaaaacgttcgttacccggccaactacttcgagaaacctagtagcaccatgaaggttgcgcagtgtttcgctccgcacagccccagtgtagatcaggtcgatgagccaccgcattccccacggggtgaccgtggcgggtggctgcgttggcggcctgcccatggggtaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcgtgcgcttgcaacccagtgagtagcacgtcgtaatgggtaactctgcagcggaaccgactactttgggtgtccgtgtttcctttattccttgtctggctgcttatggtgacaattgagagattgttgccatatagctattggattggccatccggtatctaacagggcgatcatttacctgtttgttggtttcatacccttgaatcttgaggtttataataccctcactcttataataaaactcaatacatcaag 33053
iCVB3 IRES ttaaaacagcctgtgggttgatcccacccacagggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttcattttattcctatactggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccggtgaccaatagagctattatatatctctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33054
iEV-A71 IRES ttaaaacagcctgtgggttgcacccactcacagggcccacgtggcgctagcactctggttctacggaacctttgtgcgcctgttttacgccccttcccccaatttgcaacttagaagcaatacacaacactggtcaacagtaggcatggcgcaccagccatgtcttgatcaagcacttctgtttccccggaccgagtatcaatagactgctcacgcggttgaaggagaaagcgtccgttatccggctaactacttcgagaaacttagtaacaccattgaagctgcagagtgtttcgctcggcacttcccccgtgtagatcaggtcgatgagtcactgcaatccccacgggtgaccgtggcagtggctgcgctggcggcctgcctatggggtaacccataggacgctctaatgcggacatggtgcgaagagtctattgagctagttagtggtcctccggcccctgaatgcggctaatcctaactgcggagcacatgccttcaatccagagggtagtgtgtcgtaatgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttatattggctgcttatggtgacaattacagaattgttaccatatagctattggattggccatccggtgtgcaatagagctattatatacctatttgttggctttgtgccactaaccttaaaatctataaccaccctcgactttatactaaccctcaatacagtcaaac 33055
iEV-A120 IRES ttaaaacagcctgtgggttgtacccacccacagggcccactgggcgctagcacactgatttcacggaatccttgtgcgcctgttttacaccccctccccccaactcagtaacttagaagttgtaaacacacgtggccaacagcgggcgtagcgcaccagctatgtcttggtcaagcacttctgtttccccggacagagtatcaataagctgcttgcgcggctgaaggagaaaatgttcgttacccggtcaactacttcgagaaacctagtagcatcatgaatgttgcgaggcgtttcgctcagcacttcccccgtgtagatcaggtcgatgagtcactgcactccccacgggcgaccgtggcagtggctgcgttggcggcctgcccatggggtgacccatgggacgcttcaatacggacatggtgtgaagagtctattgagctagttgataatcctccggcccctgaatgcggctaatcctaactgcggagcacataccctcaacccagggggcggtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttatacttatactggctgcttatggtgacaattgaagaattgttaccatatagctattggattggccatccggtgactaacagagctattatatatttatttgttggatttgttccattaacatacacatctttcagcactttacacctcattttacaatacaatacaagaaa 33056
iEV71 IRES ttaaaacagcctgtgggttgcacccactcacagggcccactgggcgcaagcactctggtacctcggtacctttgtgcgcctgttttacaccccccccccagtgaaacttagaagcagcaaaccacgatcaatagcgggcataacgctccagttatgtcttgatcaagcacttctgtttccccggactgagtatcaatagactgctcgcgcggttgaaggagaaaacgttcgttatccggctagctacttcgggaaacctagtaacaccatgaaagttgcggagagcttcgttcagcactcccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggtaacccatggggcgctctaatacggacatggtgtgaagagtctactgagctagttagtagtcctccggcccctgaatgcggctaatcccaactgcggagcacacgcccacaagccagcgggtagcgtgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttctttttatctttatactggctgcttatggtgacaattaaagaattgttaccatatagctattggattggccatccggtgtgcaacagagcaattgtttacctattcattggtttcgtaccattaaccttgaagtctgtgaccacccttaactacatcttgacccttaacacagctaaac 33057
iEV-B107 IRES ttaaaacagcctgtgggttgttcccacccgcagggcccactgggcgctagcacactggtatcccggtacccttgtgcgcctgttttatataccctcccccttatgtaacttagaagtatgattcaaacggtcgacaggcggctcagtgcaccaactgagtcatgaccaagcacttctgttaccccggactgagtatcaataagctgttcacacggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacctagtaccaccatgaaggttgcgcagtgtttcgctccacacaaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcccaactgtggagcagatactcacaaaccagtgagcggtctgtcgtaacgggcaactccgcagcggaaccgactactttgggtgtccgtgtttctttttattcttacattggctgcttatggtgacaattgacaaattgttaccatatagctattggattggccatccggtgacaaacagagctattgtttacttgtttgttggtttcataccattaaattacaaggtcttagaaactctcaactttattttgacactcaatacagcaaa 33058
iHRV-A9 IRES ttaaaactggatctgggttgttcccactcagatctcccacgtggagtagtacactattattacggtaatcttgtacgccagttttataatccccttacccaagtaacttagaagataaacacaaagaccaataggagatgatcatccagatcatcataggtcaagcacttctgtttccccggtcaaggttgatatgctctaacagggcaaaaacagctgagatcgttatccgcaaagcgcctacgcaaagcctagtaactatctggaagttgcttggttggtcgctccgccatatcccatggtagacctggcagatgaggctagaaattccccactggtgacagtgttctagcctgcgtggctgcctgcacaccctctgggtgtgaaaccaagtaatggacagggtgtgaagagccccgtgtgctcgctttgagtcctccggcccctgaatgtggctaaccttaaccctgcagctagggcacacaatccagtgtgtatctagtcgtaatgagcaattgcgggatgggaccaactactttgggtgtccgtgtttcttgtttttcttttatgtttgcttatggtgacaatatatagtaatatatrttggcatc 33059
iHRV-A21 IRES ttaaaactgggtccaggttgttcccacctggatctcctattgggagttgtactctattattccggtaattttgtacgccagttttatctccccttccccaattgcaacttagaagtttatcaatatgaccaataggcggtagttagccaaactaccagaggtcaagcacttctgtttccccggtcaaagttgatatgctccaacagggcaaaaacaactgagatcgttatccgcaaagtgcctacgcaaagcctagtaacacctttgaagatttatggttggtcgttccgctatttcccatagtagacctggcagatgaggctagaaattccccactggcgacagtgttctagcctgcgtggctgcctgcgcaccccttgggtgcgaagccatacattggacaaggtgtgaagagccccgtgtgctcactttgagtcctccggcccctgaatgtggctaaccttaaccctgcagctagtgcatgtaatccaacatgttgctagtcgtaatgagcaattgcgggacgggaccaactactttgggtgtccgtgtttcactttttccttttaatattgcttatggtgacaatatatataaacatatatattgacacc 33060
iHRV-A57 IRES ttgtttgatgccagttttatctccccccccaattgcaacttagaagatgtacacaaagaccaataggcagtggtcacccagaccactgaaggtcaagcacttctgtctccccggtcaaagttgatatgctccaacagggcaaaaacaacttagatcgttatccgcaaagtgcctacgcaaagcttagtaccatctttgagagcctatggttggtcgctccactgaaccccacagtagacctggcagatgaggctagaagacccccactggcgacagtgttctagcctgcgtggctgcctgcacacccttacgggtgtgaagccatatgtttgacaaggtgcgaagagccccgtgtgctcactttgagtcctccggcccctgaatgtggctaaccttaaccctgcagctagtgcacacaagccagtgtgttgctagtcgtaatgagcaattgcgggatgggaccaactactttgggtgtccgtgtttcactttttacctttattttgcttatggtgacaatatatatagtatatatattggcacc 33061
iHRV-A89 IRES ttaaaactgggagtgggttgttcccactcactccacccatgcggtgttgtactctgttattacggtaactttgtacgccagtttttcccacccttccccataatgtaacttagaagtttgtacaatatgaccaataggtgacaatcatccagactgtcaaaggtcaagcacttctgtttccccggtcaatgaggatatgctttacccaaggcaaaaaccttagagatcgttatccccacactgcctacacagagcccagtaccatttttgatataattgggttggtcgctccctgcaaacccagcagtagacctggcagatgaggctggacattccccactggcgacagtggtccagcctgcgtggctgcctgctcacccttcttgggtgagaagcctaattattgacaaggtgtgaagagccgcgtgtgctcagtgtgcttcctccggcccctgaatgtggctaaccttaaccctgcagccgttgcccataatccaatgggtttgcggtcgtaatgcgtaagtgcgggatgggaccaactactttgggtgtccgtgtttcctgtttttcttttgattgcattttatggtgacaatttatagtgtatagattgtcatc 33062
iHRV-A100 IRES ttaaaactgaatccagattgttcccatctggatttcctacatggagttgtactctattattccggtaattttgtacgccagttttatcaccccttcccccgtaacttagaagtttgaaacaaaagaccaataggaggtaactatccaagttactataggtcaagcacttctgtttccccggtcaaagttgatatgctccaccagggcaaaaacaattgagatcgttatccgcaaagtgcctacgcaaagcctagtagtatcttgaaaagcatgtggttggttgctccgctgtaccccacagtaaacctggcagatgaggctagaagttccccactggtgacagtgttctagcctgcgtggctgcctgcgcactctttgagtgcgaagccatatgtttgacaaggtgtgaagagccccgtgtgctcactttgagtcctccggcccctgaatgtggctaaccttaaccctgcagctagtgcatgcaatccagcatgtggctagtcgtaatgagcaattgcgggatgggaccaactactttgggtgtccgtgtttcacttttttccttttataattgcttatggtgacaatatatagtgatatatattgacacc 33063
iHRV-B4 IRES ttaaaacagcggatgggtttcccaccatccgacccactgggtgtagtgctctggtattttgtacctttgcacgcctgtttcccatttgtacccttccttaatctccttcccccgtaacgttagaagttttggaattttaaagtacaataggaagcgccacatccagtggtgttgcgtacaaatacttctgtttacccggagcgaggtataggttgtacccacggccaaaagcctttaaccgttatccgccaatcaactacgtaacggctagtatcatcttgcttttgatttggtgttcgatcaggtggtatcccccactagtctggtcgatgaggctaggaattccccacgggcgaccgtgtcctagcctgcgtggcggccagcccagcttttgctgggacgccttttcaaagacatggtgtgaagacctgcatgtgcttggttgtgagtcctccggcccctgaatgcggctaaccttaaccctggagcccagcagcataatccaatgttgtttgggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttccttttattcttacattgtcttatggtcacagcatatatattatatatactgtgatc 33064
iHRV-B17 IRES tttaaacagcggatgggttccccaccatccgacccactgggtgtagtactctggtattttgtacctttgtacgcctgtttctcccctacctcccaacctaaacaatcctggtaacttagaagacttaaatcatcgtacaataggtgctgtcacatccagtgacggctagtacaagcacttctgtttccccggagcggagtataaatggccaccgctgtcaaaagctcttaaccgttatccgccaattaactacgcaacggctagtaacatcttgttatttttagggcgttcgatcaggtgagtaaacccctcactagtctggtcgatgaggctgagaattccccacgggcgaccgtgtctcagcctgcgtggcggccagcccagctaatgctgggacgccttaattgtgacatggtgtgaagacccacgtgtgcttaattgtgagtcctccggcccctgaatgcggctaacctaaaccctggagccttgagacacaatccagtgttggcaaggtcgtaatgagtaattccgggacgggaccgactactttgggtgtccgtgtttccttttattttcaaattgttcttatggtcacaatataagtaatatattgtgatc 33065
iHRV-B26 IRES ttaaaacagcgggtgggtatcccaccacccgacccactgggtgttgtacactggtattttgtacctttgtatgcctgtttgcacctccccaccccttccaattacccttacccgaattrtattatgcggtaacattagaagaagtgaacacagtgcaataggacgtatcacatccagtgatataaagcacaagcaattcttgttccccggagctggatatagactgctaacgtggttgaaggtccttaaccgttatccgccaaccaactacgagacggctagtaatatcatgtttgtctttgagcgttcgatcaggtgaattccccattcactagtttggtcgatgaggctgagaactccccacaggtgactgtgtctcagcctgcgtggcggccaacccagccacggctgggacgcccactgatagacatggtgtgaagacccaattgtgcttggttgtgactcctccggcccctgaatgcggctaacctcaaccccggagccttgtagtgtaagccaacacatacaaggtcgtaatgggcaactctgggacgggaccgactactttgggtgtccgtgtttcctttatttttatcttttgtgtcttatggttacaagtattgattgtaacc 33066
iHRV-B37 IRES tttaaacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtattttgtacctttgtacgcctgttgttcctaatgtacccaccctaaaacttcctacccaagtaacgttagaagtttcatcaacaagtacaataggaagcatcacatccagtggtgttttgtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccgaaagcctttaaccgttatccgccaaccaactacgtaaaagctagtatcatcatgttttaaaataggcgttcgatcaggtggatcccccctccactagtttggtcgatgaggctaggaactccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttctgctgggacgcctttttatggacatggtgtgaagactcgcatgtgcttggttgtgactcctccggcccctgaatgcggctaaccttaaccccggagccctgtgttgcaatccagtaacattagggtcgtaatgagcaatttcgggacgggaccgactactttgggtgtccgtgtttctcatttttcttattattgtcttatggtcacagcatatatataacgtatatactgtgatc 33067
iHRV-B92 IRES ttaaaacagcggatgggtatcccaccatccggcccactgggtgtagtactctggtacattgtacctttgtacgcctgttttccccctcttgtacccgcccttcaagctccttgcccaagtaacgttagaagtttgaacattggtacaataggaagcatcacatccagtggtgtactgtacaaacacttctgttgccccggagcgaggtatagatggtccccaccgtcaaaagcctttaaccgttatccgccaatcaactacgtaatggctagtagcaccttggatttaagttggcgttcgatcaggtggtaacccccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcatccgctgggacgccaatttaatgacatggtgtgaagacctgcatgtgcttgattgtgagtcctccggcccctgaatgcggctaaccctaaccccggagccttgcagcacaatccagtgttgttaaggtcgtaatgagcaattctgggatgggaccgactactttgggtgtccgtgtttcttatttttcttgaatttttcttatggtcacagcatatatacattatatactgtgatc 33068
iHRV-C3 IRES ttaaagctggatcatggttgttcccaccatgattacccacgcggtgcagtggtcttgtattacggtacatttccataccagttttatacaccccaccccgaaactcatagaagtttgtacacaatgaccaataggtggtggccatccaggtcgctaatggtcaagcacttctgtttccccggcacccttgtatacgcttcacccgaggcgaaaaatgaggttgtcgttatccgcaaagtgcctacgaaaagcctagtaacactttgaaaacccatggttggtcgctcagctgtttacccaacagtagacctggcagatgaggctagacattccccaccagcgatggtggtctagcctgcgtggctgcctgcacaccctgccgggtgtgaagccagaaagtggacaaggtgtgaagagcctattgtgctcactttgagtcctccggcccctgaatgtggctaaccctaaccccgtagctgttgcatgtaacccaacatgtatgcagtcgtaatgggcaactatgggatgggaccaactactttgggtgtccgtgtttcctgttttactttttcattgcttatggtgacaattgtatctgatacacttgttacc 33069
iHRV-C11 IRES ttaaaactggatacaggttgttcccacctgtatcacccaagtggtgtggtgctcttgtatttcggtacgtttgcacgccagtttgctaccccttcccttttacgtaacttagaagtttacacaaagaccaataggcggtggtaaatccataccactaacggtcaaatacttctgtttccccggcatgcgaggaataggctccaaaagggctgaagccactagtgtcgttatccgcattggtactacgcaaagcctagtattaccttgaaaatttcttggctggtcgctccaccagataccccactggtagacctggcagatgaggcaggacttaccccactggcgacagtggtcctgcctgcgtggctgcctgcacaccccttacggggtgtgaagcccagaaacagacaaggtgtgaagagccccgtgtgctactagtgagtcctccggcccctgaatgcggctaatcttaccccacagctgttgcacgcaaaccagcgtgtatgcagtcgtaatgagcaattgtgggatggaaccgactactttgggtgtccgtgtttctttttattcctattatttgcttatggtgacaatattgatattatcagtgttgtcatc 33070
iHRV-C54 IRES ttaaaacagctgtgtggttgttcccaccaccaggcacactgtgcgttgtacactgggattccggtcactttgtacgcctgtttgctatcccccccaacttatgtaatttagaagatgtacacaacgcccattaggatgcggccaaaccaggtccgcttagggcaagcacttctgtttccccgggtgtgtgaatagactctaacagggttgaagctgtagcactcgttatccgcgcaactactacgcgaatgttagtagcatcctgtgttgcatttgggatttcgctccgcagaaaaccccatctgtagattagggcaatgaggctacacataccccactggcgacagtggtgtagcctgcgtggtgccctacccaggccttcttggcctgggattccacttacaagacagggtgtgaaggcactagtgtgctagttgtgagtcctccggcccctgaatgcggctaatcttaaccccgtagcccccgcaagtaaaccaacttgtaggtggtcgtaatgagtaattacgggatggaaccgactactttgggtgtccgtgtttccttttattctttatatttgcatcctatggttacaacataagtaatc 33071
iCVB1 IRES ttaaaacagcctgtgggttgttcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttacatcccctccccaaattgtaatttagaagtttcacacaccgatcattagcaagcgtggcacaccagccatgttttgatcaagcacttctgttaccccggactgagtatcaatagaccgctaacgcggttgaaggagaaaacgttcgttacccggccaactacttcgaaaaacctagtaacaccatggaagttgcggagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcgttccccacgggcgaccgtggcggtggctgcgttggcggcctgcctacggggaaacccgtaggacgctctaatacagacatggtgcgaagagtctattgagctagttggtaatcctccggcccctgaatgcggctaatcctaactgcggagcacataccctcaaaccagggggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttcattttattcctatactggctgcttatggtgacaattgacaggttgttaccatatagttattggattggccatccggtgactaacagagcaattatatatctctttgttgggtttataccacttagcttgaaagaggttaaaacactacatctcatcattaaactaaatacaacaaa 33072
iCVB5 IRES ttaaaacagcctgtgggttgttcccacccgcagggcccactgggcgccagcactctggtatcacggtacctttgtgcgcctgttttaaaaccctctccccaatttgaaacttagaagcaatacacctcgatcaatagtaggcatgacacgccagccatgtcttgatcaagcacttctgtttccccggactgagtatcaataaactgcttgcgcggtcgaaggagaaaacgtccgttacccgactaactacttcgagaaacccagtaacaccatggaaattgcggagtgtttcactcagcacattcccagtgtagatcaggtcgatgagtcaccgcattccccacgggtgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgcttcaatatggacatggtgtgaagagtctattgagctagttagtagtcctccggcccctgaatgcggctaatcctaactgcggagcacgtgcctccattccagggggtggcgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttcttttaattttatactggctgcttatggtgacaattgaaagattgttgccatatagctattggattggccatccggtatccaacagagcaattgtgtacctttttgttggatttgtaccacttaccagaacaagttttcatacactgtgttacattattagactaaacacagaaaa 33073
iEchoV1 IRES ttaaaacagcctgtgggttgttcccacccacagggcccactgggcgttagcacactggtatcacggtacctttgtgcgcctgttttatactcccccccctaaggaaactttagaagcaaagcaattgtgatcaatagtgggtatggcacaccagtcatatcttgatcaagcacttctgttcccccggacttagtaccaatagactgctcaagcggttgaaggggaaaacgttcgttatccggccaactacttcgagaaacctagtagcaccatgaaagttgcggagtgtttcgctcagcacttcccccgtgtagatcaggctgatgagtcaccgtattccccacgggcgaccgtgacggtggctgcgttggcggcctgcccatggggtaacccatgggacgctctaaaacagacacggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggccaatcctaactgcggagcacatactcccaatccagggagcagtgtgtcgtaatgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattctcacattgactgcttatggtgacaattgaaagattgttaccatatagctattggattggtcatccggtgagcaatagagctattgtttatcaatttgttggatttgtaccactcaacttttctgttttgagaacactcaactacatcttactgctaaacacatcaaa 33074
iEchoV-E11 IRES ttaaaacagcctgtgggttgtacccacccacagggcccactgggcgctagcacactggtatcacggtacctttgtgcgcctgttttatacccccttcccgcaaccgcaaatttagaagcaaagctaacccgatcgatagcggatgcgcatgccagccgcattttgatcaagtacttctgtttccccggaccgagtatcaatagactgctcacgcggttgaaggagaaaacgtccgttacccgaccaactacttcgagaaacctagtaacatcatgaatgttgcagggcgtttcgatcagcacgaccctggtgtagatcaggctgatgagtcaccgcattccccacgggtgaccgtggcggtggctgcgttggcggcctgcctatggggtgacccataggacgctctaatacggacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggttaatcctaactgcggacgacatacccctaatccaaggggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttatttttatactggctgcttatggtgacaatctcagagttgttaccatatagctattggattggccatccggtgagcaacagagctgtcatttatcagtttgttggctttatacctctaaatcacacggttttttttttttggaacgcttgtattcatcttaaccctcaataaggcaaa 33075
iEchoV-E15 IRES ttaaaacagcctgtgggttgtacccacccacagggcccactgggcgctagcactctggtattacggtacccttgtgcgcctgttttatataccccgccccaagcaaacgctagatgtaacgcacttatgatcaatagcaggcgtggcactccagccacgttatgatcaagcacttctgtctccccggaccgagtatcaatagactgctcacgcggtcgaaggagaaaacgttcgttacccgaccagctacttcgagaaacctagtaactccatggaggttgcagagtgtttcgttcagcacttcccccgtgtagatcaggctgatgagtcaccgcgttcctcacgggcgaccgtggcggtggctgcgttggcggcctgcctatgggtatacccataggacgctctaatactgacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacatacccccaacccagggggcagtgtgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttacattggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccagtgactaacagagctattatttacctttttgttggcttcgtatcacttggtttaaaagaggttagtactttatattgcattatattactaaacacgagaaa 33076
iCVA20 IRES ttaaaacagctctggggttgtacccaccccagaggcccacgtggcggctagtactccggtattacggtacccttgtacgcctgttttatactccctccctcgtaacttagaagcacaaaaccaagttcaatagaagggggtgcaaaccagtaccaccacgaacaagcatttctgtttccccggtgatgttgtatagactgcccgcgcggttgaaagcaacggatccgttacccgctcaagtacttcgagaagcctagtattaccttggaatcttcgatgcgttgcgttcagcactcgaccctggagtgtagcttaggctgatgagtctggacgtccctcaccggtgacggtggtccaggctgcgttggcggcctacctatggctaacgccataggacgctagttgtgaacaaggtgtgaagagcctattgagctacttgagagtcctccggcccctgaatgcggctaatcctaaccatggagcaggcggtcacagaccagtgactagcttgtcgtaatgcgcaagtctatggcggaaccgactactttgggtgtccgtgtttccttttatttttattatggctgcttatggtgacaatcattgattgttatcataaagcgaattggattggccatccggtgaaagcgagacttactatttacttacttgttggacttaccacacttaatacatttattctaggtgtcacttgtatagcaattagaatcaaacagttgcatcata 33077
iEV-D94 IRES ttaaaacagcctgtgggttgttcccaccccagaggcccacgtggcggccagtactctggtatcacggtacctttgtacgcctgttttatatccccttcccccgcaacttagaagaaaacaaatcaagttcactaggagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgatgtcgtatagactgtaaccacggttgaaaacgattgatccgttatccgctcttgtacttcgaaaagcccagtatcaccttggaatcttcgatgcgttgcgctcagcactcaaccccagagtgtagcttaggtcgatgagtctggacactcctcaccggcgacggtggtccaggctgcgttggcggcctacctgtggtccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctattgagctacaagagaatcctccggcccctgaatgcggctaatcctaaccacggagcaagggtacacaaaccagtgtatatcttgtcgtaacgcgcaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttgtttttatcatggctgcttatggtgacaatctaagattgttatcatatagctgttggattggccatccggtaatttattgagatttgagcatttgcttgtttcttcaacaatttcacctattcattgcatttcagcagtcaaa 33078
iSimianEV-A IRES gagtgttcccacccaacaggcccactgggtgttgtactctggtattacggtacctttgtacgcctattttatttcccccccctttttgaaacttagaagttaataataaacacgctcactaggtgcactacatccagtagtgtaatgagcaagcacttctgtctyccccgggagggatatatggtacgctgtgcaaacggcggaaattaatcctaccgttaaccgcccacctactccgagaagcctagtacctaattggatttatcaatggagttgcgctcagcaggtgaccctgacctgccagctccggctgatggacctgggctttccccacaggcgactgtggcccaggtcgcgtggcggccggcccacccccctgggtgggacgccttgataatgacaaggtgggaagagcctattgggctagctggtttcctccggcctcctgaatgcggctaaccttaaccccagagcatatggtagcaacccagctactagtatgtcataatgcgtaagtctgggatgggaccgactactttggagagtccgtgtttctattgtttctttaatcaatcttatggtgacaatttatagtgccctgagtattgattggttgttgcttttgacaattattgagacatcacatagacata 33079
iSimianA5 IRES ttaaaatagcctgtgggttgctcccacccacagggcccaagtggcgtagtacttggtattccggtacctttgtacacctatttacaaaccctaccccttgtaaccttagaagcaattatttaaccgctcactagggggtgtgctatccaagcacatcaagagcaagcacttctgtctccccgggaggggctaatggtacgctgtgcccacggcggaaatgagccctaccgttaaccggcagtctacttcgggaagcccagtaactacattgaaactttgaggcgttacactcagcacataaccccaatgtgtagttctggtcgatgagccttggcatcccccacaggcgactgtggccaaggctgcgttggcggccagcctgcggaccaaaagtccgtaggacgcctaattgtggacatggtgtgaagagcctactgagctagactgtagtcctccggcccctgaatgcggctaatcctaaccctggagcatccgcgtgcaacccagtacgtagggtgtcgtaatgcgtaagtctgggatggaaccgactactttgggtgtccgtgtttcttgtttttcatactgggtcgcttatggttacaactaattgttgtaatcattggcagtgcgcgctgaccacgcgattattgatatttccatttgttggatactccaatagtgtcaactcatatacacaacttttaccactgatcaagataaaa 33080
iSimianV4 IRES ttaaaatagctgctgggttgttcccatccagcaggcccactgggcgtgatactctggtattgcggtacctttgtatgcctattttacctcccttccccctgaaacttagaagaaagaaacaaacacgctcactaggtacactgcatccagcagtgtaatgagcaagcacttctgtttccccggaagggatatatggtacgctgtgcaaacggcggaaattaatcctaccgttaaccgcccatctactccgagaagcctagtacctaattgaacttatcaatggagttgcgctcagcaggtgaccctgacctgccagctccggctgatggacctgggcatcccccacaggcgactgtggcccaggtcgcgtggcggccggcccactcttttgagtgggacgccttgataatgacaaggtgggaagagcctattgggctagctggtttcctccggcctcctgaatgcggctaaccctaaccccggagcatatggtggcaacccagccactggtatgtcgtaacgcgtaagtctgggatgggaccgactactttggagagtccgtgtttccattattttctttattgaatcttatggtgacaaattgggagttactcgggtgacgattgattattacttctgaaaacgtagagatatagaatcaacaca 33081
iSwineVesciular IRES ttaaaacagcctgtgggttgttcccacccacagggcccactgggcgctagcacactggtatcacggtacctttgtgcgcctgtttgacttaccctccccaaacgcaacttagaagcacaacttaaatggtcaataggcggctcagtatgccaactgagtctcgatcaagcacttctgttaccccggactgagtaccaataggctgctcacgcggctgaaggggaaaccgttcgttacccgactaactacttcgagaaacctagtaccaccatgaaagttgcgcagcgtttcgctccgcacaaccccagtgtagatcaggtcgatgagtcaccgcaaaccccacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcaactcatgggacgcttcaatactgacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacgcaccagtgggcagtctgtcgtaatgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttgttcttatactggctacttatggtgacaattgagagattgtaaccatattgctattggattggccacccggcgacgaatagaacagttgcttacctgtttgttagtctcgtatcactgaactacaaatccttaaacaccctttaatttcgtcataacgctcaatacgttaaa 33082
iHRV-B3_SC2220 IRES ttaaaacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtactttgtacctttgtacgcctgttcttcccattgtacccttcctaaacttccaacccaagtaacgttagaagctcaactttcagtacaataggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaagcctttaaccgttatccgccaaccaactacgtaaaagctagtaacatcatgtttgtaaatgggtgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcgtatgctgggacgcctttttatagacatggtgcgaagactcgcatgtgcttggttgtgagtcctccggcccctgaatgcggctaaccctaaccctggagccttgagtcacaatccagtgatggcaaggtcgtaatgagcaattccgggatgggaccgactactttgggtgtccgtgtttctcatttttcttattattgtcttatggtcacagcatatatagtatatatactgtgatc 33083
iHRV-B5 IRES ttaaaacagcgggtgggtatcccaccacccgacccactgggtgtggtacactggtactttgtacctttgtatgcctgtttgcttccactcccctttacctaatattcttccccaagtatattttgcggtaacgttagaagaagcaaagttagtgcaataggatgtatcacaaccagtggtataaagcacaagcaattcttgttccccggagctggatatagactgctaacgtggtcaaaagtccttaaccgttatccgccagctaactgcgagaagactagtaacaccatgtttgtttttagacgttcgatcaggtgaataccccattcactagtttggtcgatgaggctgagaataccccacaggtaactgtgtctcagcctgcgtggcggccaacccgactcatgtcgggacgcctactaatagacatggtgtgaagatcctattgcgcttagttgtgagtcctccggcccctgaatgcggctaaccctaaccccggagccttgtggtgtaaaccaacatttgcaaggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttcctttatttttattgtgtgtgtcttatggttacaaatacaatttgtaatc 33084
iHRV-B6 IRES ttaatacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtattatgtacctttgtacgcctgttcttcccattgtacccttcccaaatttccaacccaagtaacgttagaagtttgacattaaagtacaataggaggcaccacatccagtggtgttttgtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttacccgccagccaactacgtaaaagctagtaacatcttgtttgtaacttggcgttcgatcaggtggattccccctccactagtttggtcgatgaggctaggaactccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagctcttgctgggacgcccttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccctaaccctggagccttgtgttacaaaccagtaatattaaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttctcatttttcttattattgtcttatggtcacagcatatttgttaaatatactgtgatc 33085
iHRV-B14 IRES tactctggtattatgtacctttgtacgcctgtttcttccctacaaccccttcctaaaactcccacccatgaaacgttagaagcttgacatttaagtacaataggtggcaccacatccagtggtgtctacgtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaagcctttaaccgttatccgccaaccaactacgtaacagctagtatcatcttgttcttcactggacgttcgatcaggtggattccccctccactagtttggtcgatgaggctaggagctccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagctcatgctgggacgcccttttaaggacatggtgtgaagactcgcatgtgcttggttgtgagtcctccggcccctgaatgcggctaaccttaaccctggagccttatgccacgaaccagtggttgtaaggtcgtaacgagcaattccgggatgggaccgactactttgggtgtccgtgtttcctatttttctttatattgtcttatggtcacagcatatatataagtatatactgtgatc 33086
iHRV-B27 IRES ttaaaacagcggatgggtatcccaccatccgacccacagggtgtagtgctctggtattttgtacctttgcacgcctgtttccccattgtacccctccttaaatttcctccccaagtaacgttagaagtttaaggaaacaaatgtacaataggaagcatcacatccagtggtgttatgtacaagcacttctgtttccccggagcgaggtataagtggtacccaccgccgaaagcctttaaccgttatccgccaatcaactacgtaatggctagtattaccatgtttgtgacttggtgttcgatcaggtggttccccccactagtttggtcgatgaggctaggaactccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttttgctgggacgcctttttacagacatggtgtgaagacctgcatgtgcttgattgtgagtcctccggcccctgaatgcggctaaccttaaccccggagccttgcaacataatccaatgttgttgaggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttccttttattctttatattgtcttatggtcacagcatatatagcatatatactgtgatc 33087
iHRV-B35 IRES ttaaaacagcggatgggttccctaccatccgacccactgggtgtagtactctggtactctgtacctttgtacgcctgtttatccactacccttttcctaaattttccacccgtgtaaccttagaagcaaacaaattgtacaatagggtgcatcacaaccagtgatgtacagtacaagcacttctgtttccccggagcggggtatagacggtcaccactgtcaaaagcccttaaccgttacccgccaaccaactacgtaacggctagtaacaccatgaatttgtcttgacgttcgatcaggtggtaaccccccactagtttggtcgatgaggctgagaactccccacgggtaaccgtgtctcagcctgcgtggcggccaacccagcttctgctgggacgccaattcattgacatggtgtgaagacctgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccctaaccccggagccacgcggcataatccaatgtcgtatgggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttcctgtttttccaaattattcttatggtcacagcatataaatagatatatactgtgatc 33088
iHRV-B42 IRES ttaaaacagcgggtgggtatcccaccacccgacccactgggtgtggtacactggtactttgtacctttgtatgcctgtttgcatccccttccctttacctaacatccctccccaagttatattttgcggtaacgttagaagaagtgaacAtagtgcaacaggaagtatcaccaccagtgatataacgcacaagcaattcttgttccccggagctggatatagactgctaacgtggttgaaagtccttaaccgttatccgccaATCaactgcgaaaagactagtaacatcatgcacatttctaggtgttcgatcaggtgaaaaccccattcactagtttggtcgatgaggctgagagtaccccacaggcgactgtgtctcagcctgcgtggcggccaacccgacttatgtcgggacgcctattaatagacatggtgtgaagatcctattgcgcttagctgtgagtcctccggcccctgaatgcggctaaccttaaccccggagtcttgtgatgtaagccaacatttgcaaggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttcctttattcttatcatttgtgtttcatggttacaagcattgtttgtaatc 33089
iHRV-B48 IRES ttaaaacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtactctgtacctttgtacgcctgtttctcctcaaccctcccctacccgttatatatctcagtaacttagaagaATtcattaccgcacaatagggaccgttgtaaccagcaacggtcagtgcaagcacttctgtttccccggagcggagtatagacggccactgctgtcaaaagctcttaaccgttacccgccagtATactacacaacagctagtaacatcttgttgttcttagggcgttcgatcaggtgagtttaccccctcactagtctggtcgatgaggctgagaaatccccacgggtgaccgtgtctcagcctgcgtggcggccagcccagcttatgctgggacgccttaagtatgacatggtgtgaagactcgcgtgtgcttagctgtgagtcctccggcccctgaatgcggctaacctaaaccccggagccttgaggcacaatccagtgcccgcgaggtcgtaacgagaaattctgggacgggaccgactactttgggtgtccgtgtttccttttatctttttgatgttcttatggttacaatatataaagtatattgtaatc 33090
iHRV-B52 IRES ttaaaacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtattatgtacctttgtacgcctgtttctcccccccattacccctccccacatatcccagtaacttagaagaattaaattatcgcacaataggagctattacaaccagtaatagttagtgcaagtacttctgtttccccggagcggagtatagatggccaccgctgtcaaaagctcttaaccgttatccgccagtATactacgtaacggctagtaacatcttgttgtgcttaaggtgttcgatcaggtgaagagacacccccttcactagtctggtcgatgaggctgagaaatccccacgggcgaccgtgtctcagcctgcgtggcggccagcccagcttatgctgggacgccttaagtatgacatggtgtgaagacccgcatgtgcttaactgtgagtcctccggcccctgaatgcggctaaccttaaccctggagccttggggtacaatccagtgctaacaaggtcgtaacgagcaattccgggacgggaccgactactttgggtgtccgtgtttccttttatttcattattgttcttatggttacaatatatagagtatattgtaatc 33091
iHRV-B69 IRES ttaaaacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtactttgtacctttgtacgcctgtttctccctcccttcccaacctaaacaatccttgtaacttagaaggtttcgattatcgcacaatagggactattgcaaccagcaatagtcagtgcaagcacttctgtttccccggagcggagtgtagatggccaccgctgtcaaaagctcttaaccgttatccgccagtATactacgcaacggctagtagtgccttgttgcttttatggcgttcgatcaggcgagatttaccccctcgctagtctggtcgatgaggctgagaattccccacgggcgaccgtgtctcagcctgcgtggcggccagcccagcctttgctgggacgccttgattgcgacatggtgtgaagacccgcgtgtgcttaactgtgagtcctccggcccctgaatgcggctaacctaaaccctggagccttgaaacacaacccagtgttcgcaaggtcgtaacgagcaattccgggacgggaccgactactttgggtgtccgtgtttcctttattctttcaattgttcttatggtcacaatataagtgttatattgtgatc 33092
iHRV-B70 IRES ttaaaacagctgatgggttccccaccatccgacccaatgggtgtagtactctggtattctgtacctttgtacgcctgtttctccccacccccccgtcctaaataatcccagtaacttagaagatttgaattatcgtacaataggtgctgtcacatccagtgatggctagtacaagcacttctgtttccccggagcggagtatagatggccaccgctgtcaaaagctcttaaccgttatccgccaattaactacgcaacggttagtaacatcttgtcatttttgaggcgttcgatcaggtgagtacacccctcactagtctggtcgatgaggctgagaattccccacgggcgaccgtgtctcagcctgcgtggcggccagcccagcttatgctgggacgccttaattgtgacatggtgcgaagacccacgtgtgcttaattgtgagtcctccggcccccgaatgcggctaacctaaaccccggagccttgagacacaatccagtgttagcaaggtcgtaacgagcaattctgggacgggaccgactactttgggtgtccgtgtttcctgttattctcaaattgttcttatggtcacaatataagtaatatatatattgtgatc 33093
iHRV-B72 IRES ttaaaacagcggatgggttctcccaccatccgacccactgggtgtagtactctggtatgatgtacctttgtacgcctgtttattcccaaacccccacccgttattcgcccaacccctgtaacgttagaagtttggaacttaattgtacaatagggagcaccatatccaatggtgtaacgtacaagcacttctgtttccccggagcgaggtataggtggtacccactgccgaaagcctttaaccgtcatccgccaatcaactacgtaacagctagtaacatcttgttgttgattggacgttcgatcaggtggttcaccccccactagtttggtcgatgaggctgggaatcccccacgggtgaccgtgtcccagcctgcgtggcggccaacccagcttatgctgggacgccctttcaatgacatggtgtgaagactcgcatgtgcttgattgtgagtccgccggcccctgaatgcggctaaccctaaccctggagccttgcaccacaatccagtggtgtctgggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttctcatttttcttttaattgtcttatggtcacagcatatagtattatatactgtgatc 33094
iHRV-B79 IRES ttaaaacagcggacgggtatcccaccatccggctcactgagcgtagtactctggtattgtgtacctttgtacgcctgttttccccaaatcccctaccctttatatctcctaccccgtaacgtaagaagttttcaaacagtacaataggaagcaccacatccagtggtgttatgtacaagcacttctgtttccccggagcgaggtataggtggtcaccaccgccaaaagcctttaaccgttacccgccaaccaactacgtaatggctagtaacatcattgatttagattggcgttcgatcaggtggtatccccccactagtttggtcgatgaggctaggaataccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcatacgctgggacgccagtttactgacatggtgcgaagacttgcatgtgcttggttgagagtcctccggcccctgaatgcggctaaccttaaccccggagcctcgcagcataatccaatgttgtagaggtcgtaacgagtaattctgggatgggaccgactactttgggtgtccgtgtttcctgtttttctttaaaatgtcttatggtcacagcatatatactgtatatactgtgatc 33095
iHRV-B83 IRES gtacaataggttgcactacatccagtggtgtttcgtacaagcacttctgtttccccggagcggggtatagacggtacccactgtcaaaagcccttaaccgttatccgccaatcaactacgtaatggctagtaacatcatgaaggtgagttgacgttcgatcaggtggtaacccccactagtttggtcgatgaggctaggaatcccccacgggtaaccgtgtcctagcctgcgtggcggccaacccagcgtttgctgggacgccaattcactgacatggtgcgaatacttgcatgtgcttgattgtgattcctccggcccctgaatgcggctaaccttaaccccggagccttgcagcataaaccaatgttgtggaggtcgtaatgagcaattctgggatgggaccgactactttgggtgtccgtgtttcctgtttttctcaaattgtcttatggtcacagcatatatattgtatatactgtgatc 33096
iHRV-B84 IRES ttaaaacagcggatgggtatcccaccatccggcccactgggcgtagtacactggtattctgtacctttgtacgcctgtttgccgcccctcccccttttattaccacatttgtggtcgctgcaacgttagaagattttaaagtagtgcaataggaagcatcacaaccagtggtgttatgcacaaacacttctgtttccccggagcgaggtatagacggtccccactgtcaaaagcctttaaccgttatccgccaaccaactacgagacagctagtaatgccctgttctcctgcaaggcgttcgatcagacagatttcccctctgttagtctggtcgatgaggctagaagtaccccacaggtaactgtgttctagcctgcgtggcggccagcccagcttctgctgggacgcctttcaagagacatggtgtgaagactcaattgtgcttggttgtgagtcctccggcccctgaatgcggctaaccttaaacccggTAccatgctatgcaaaccagcatagttatggtcgtaatgggcaactctgggatgggaccgactactttgggtgtccgtgtttccatttttactttttgtgtcatttatggttacaattaagttgtaacc 33097
iHRV-B86 IRES ttaaaacagcggatgggtaccctaccatccgacccactgggtgtagtacactggtacattgtacctttgtacgcctgtttctccctattgtaccttccctcacaatcctaacccctgtaacgttagaagatgtgcaactcgtgcaataggagatactgcaaccagtggtatcaagcacaagaacttctgtttcctcggagcggagtatagatggtccccaccgtcaaaagctcttaaccgttatccgccaatcaactacgtgacgactggtagcaTcattttgacactttgacgttcgatcaggtaggcttaccccacctactagtttggccgatgaggctgggagtccctcacaggtaactgtgtcccagcctgcgtggcggccaacccagcaattgctgggacgccaatttgttgacatggtgtgaagatcttaatgtgcttggttgtgagtcctccggcccctgaatgcggctaaccttaaccccggagccttgtgtcacaagccagtgacattaaggtcgtaatgagtaatttcgggatgggaccgactactttgggtgtccgtgtttcctgtttttctttatgattgtcttatggtcacagcatatagtaattatatactgtgatc 33098
iHRV-B91 IRES ttaaaacagcggatgggtttcccaccatccgacccactgggtgtagtactctggtacattgtacctttgtacgcctgtttctcccctccctcccaacctatacaatcccggcaacttagaagatttgaactattgtacaataggcgctgtcacatccagtggcggctagtacaagcacttctgtttccccggagcggagtatagatggccaccgctgtcaaaagctcttaaccgttatccgccaattaactacgcaacggctagtaatatcatgtaacttttagggtgttcgatcaggtgagtgtacccctcactagtctggtcgatgaggctgagaattccccacgggcgaccgtgtctcagcctgcgtggcggccagcccagcttatgctgggacgccttaattgtgacatggtgtgaagacccacgtgtgcttaattgtgagtcctccggcccctgaatgcggctaacctaaaccctggagccttgaaacacaatccagtgttagcaaggtcgtaatgagtaattccgggacgggaccgactactttgggtgtccgtgtttccttttatttttaagttgttcttatggtcacaatataagtaatatatattgtgatc 33099
iHRV-B93 IRES ttaaaacagtggatgggtttcctaccatccgacccactgggtgtagtgctctggtatattgtacctttgcacgcctgttttcccattgtacccttccttaaattcctccccatgtaacgttagaagtttaagaacataaatgtacaataggaagcatcacatccagtggtgtatggtacaagcacttctgtttatccggagcgaggtataagcggtacccactgctgaaagcctttaaccgtATaccgccaatcaactacgtaacggctagtattaccttgtttgcaatctggcgttcgatcaggtggttccccccactagtttggtcgatgaggctaggagttccccacgggcgaccgtgtcctagcctgcgtggcggccaacccagcatttgctgggacgcctttttgtagacatggtgtgaagacctgcatgtgcttgattgtgagtcctccggcccctgaatgcggctaaccttaaccccggagccttgtgacataatccaatgtcattaaggtcgtaatgagcaattctgggacgggaccgactactttgggtgtccgtgtttctctttattctttacattgtcttatggtcacagcatatataatacatatatactgtgatc 33100
iHRV-B97 IRES ttaaaacagcggatgggtttcccaccatccgacccactgggtgtagtgctctggtattttgtacctttgcacgcctgtttcccctttgtacccatcctgaatttcctccctctgcaacgttagaagtttgtgaaattaaaagtacaataggaagcatcacatccagtggtgttcagtacaagcactcctgtttccccggagcgaggtataggttgtacccacgaccgaaagcctttaaccgttatccgccaatcaactacataacggctagtatcatcatgtttttgatctggcgttcgatcaggtggtttcccccactagtctggtcgatgaggctaggatttccccacgggcgaccgtgtcctagcctgcgtggcggccagcccagcttatgctgggacgcctttttaaagacatggtgtgaagacctgcatgtgcttgattgtgagtcctccggcccctgaatgcggctaaccttaaccctggagcccgacagcataatccaatgttgtttgggtcgtaatgagcaattccgggatgggaccgactactttgggtgtccgtgtttctttttattcttatattgtcttatggtcacagcatatatagtatatatactgtgatc 33101
iHRV-B99 IRES ttaaaacagcgggtgggtatcccaccacccgacccactgggtgtagtacactggtattttgtacctttgtatgcctgtttgccatccctccctctcctcttacccttacccttattttgcggtaactttagaagtttgtaaatcacgcgcaatagggtataccacatccagtggtatgaagcacaagcaattcttgttccccggagctggatataaactgctaacgtggttgaaagtccttaaccgttatccgccagtTAactgcgagaagactagtaactccatgtttgtttttaagcgttcgatcaggtggataccccattcactagtttggtcgatgaggctgggaatcccccacaggtaactgtgtctcagcctgcgtggcggccaacccagcttttgctgggacgcttactgacagacatggtgtgaagatcctattgcgcttaactgtgagtcctccggcccctgaatgcggctaacctcaaccccggagccttgtggtgtaaaccaacactcgcaaggtcgtaacgagtaattctgggacgggaccgactactttgggtgtccgtgtttcctttatttcttattgattgtctcctatggttacaaatttactgtaatc 33102
iHRVB_SC0739 IRES ttaaaacagcgggtgggtatcccaccacccgacccactgggtgtggtacactggtactttgtacctttgtatgcctgtttgcatccctttcccctcgcctaacatccttccccaaagtatattttgcggtaacgttagaagaagtgaactcagtgcaacaggaagtatcaccaccagtgatataatgcacaagcaattcttgttccccggagctggatatagactgctaacgtggttgaaagtccttaaccgttatccgccagctaactgcgagaagactagtaacatcatgtacatttctagacgttcgatcaggtgaataccccattcactagtttggtcgatgaggctgagagttccccacaggtgactgtgtctcagcctgcgtggcggccaacccgacttatgtcgggacgcctattaatggacatggtgcgaagatcctattgcgcttagctgtgagtcctccggcccctgaatgcggctaaccttaaccccggagccttgtggtgcaaaccagcatttgcaaggtcgtaatgagcaattctgggatgggaccgactactttgggtgtccgtgtttcctttattcttattatttgtgtttcatggttacaagcatagtttgtaatc 33103
iHRVB_G001-19 IRES TTAAAACAGCGGatgggtttcccaccatccgacccactgggtgtagtgctctggtattttgtacccttgcacgcctgtttcccatttgtacccttccttaatttcctacccctgtaacattagaagttttggaattttacggtacaataggaagcgccacatccagtggtgttgtgtacaagcacttctgtttacccggagcgaggtataggttgtacccacggccaaaaaccttcaaccgttatccgccaaccaactacgtaacggctagtatcatcttgtatttgacttggcgttcgatcaggtggtatcccccactagtctggtcgatgaggctaggaattccccacgggcgaccgtgtcctagcctgcgtggcggccagcccagctttagctgggacgccttttcaaagacatggtgtgaagacctgcatgtgcttggttgtgagtcctccggcccctgaatgcggctaaccttaaccccggagcccagtgacataatccaatgttatttgggtcgtaatgagtaattccgggatgggaccgactactttgggtgtccgtgtttccttttattctttatattgtcttatggtcacagcatatatagtatatatactgtgatc 33104
iHRVB_R93 IRES ttaaaacagcggatgggttctcccaccatccgacccactgggtgtagtactctggtattatgtacctttgtacgcctgtttattcccaaaccccctcccgttacatttccaacccctgtaacgttagaagtttggaacttaacagtacaataggaggcaccatatccaatggtgtaatgtacgagcacttctgtttccccggagcgaggtataggtggtacccaccgctgaaagcctttaaccgttatccgccaatcaactacgtaacagctagtagcattttgttgttgactggacgttcgatcaggtggtttacccccccactagtttggtcgatgaggctggaaattccccacgggtgaccgtgttccagcctgcgtggcggccaacccagctcatgctgggacgccctttcaatgacatggtgtgaagactcgcatgtgcttgattgtgaatcctccggcccctgaatgcggctaaccctaaccccggagccttgcatcacaatccagtgatgttagggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttctcatttttctttgaattgtcttatggtcacagcatatagtaatatatactgtgatc 33105
iHRVB_BCH214 IRES ttaaaacagcgggtgggtatcccaccacccgacccactgggtgtggtacactggtactttgtacctttgtatgcctgtttgcatcccttttcccttcacctaacatcctcccccaaagtatattttgcggtaacgttagaagaagtgaactcagtgcaacaggaagtatcaccaccagtgatataacgcacaagcaattcttgttccccggagctggatatagactgctaacgtggtcaaaagtccttaaccgttatccgccagctaactgcgagaagactagtaacatcatgcacatttctagacgttcgatcaggtgaataccccattcactagtttggtcgatgaggctgagagttccccacaggtgactgtgtctcagcctgcgtggcggccaacccgacttatgtcgggacgcctattaatggacatggtgtgaagatcctattgcgcttagctgtgagtcctccggcccctgaatgcggctaaccttaaccccggagccttgtggtgcaaaccagcatttgcaaggtcgtaatgagcaattctgggatgggaccgactactttgggtgtccgtgtttcctttattcttattatttgtgtttcatggttacaagcatagtttgtaatc 33106
iHRVB_3039 IRES ttaaaacagcggatgggtatcccaccatccgacccactgggtgtagtactctggtattatgtacctttgtacgcctgtttctccctccctaccaccccgccccacgtatcccgtaacttagaagaattgaacaatcgcacaataggagctattacaaccagtaatagttggtgcaagcacttctgtttccccggagcggagtatagacggccaccgctgtcaaaagctcttaaccgttacccgccagCtaactacgtaacggctagtaacatcttgtcgtgcttagggtgttcgatcaggtgaagaaaaacccccttcactagtctggtcgatgaggctgagaagtccccacgggtaaccgtgtctcagcctgcgtggcggccagcccagcatatgctgggacgccttaagtatgacatggtgtgaagacccgcatgtgcttagctgtgagtcctccggcccctgaatgcggctaacctaaaccctggagccttggagcacaagccagtgcttgcaaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttccttttatctcattattgttcttatggttacaatatatagagtatattgtaatc 33107
iEV-B69 IRES ttaaaacagcctgtgggttgtacccacccacagggcccactgggcgctagcacactggtatcacggtacctttgtgcgcctgttttataccccctaccccaactttaaacttagaagcaaagcaaacccgatcaatagcagatgtagcaagccagttgcatcttgatcaagtacttctgtctccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgttacccgaccaactacttcgagaaacctagtaacaccatgaaagtagcagggtgtttcgatcagcacaaccccagtgtagatcaggctgatgagtcaccgcatcccccacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgctctaatatggacatggtgtgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacataccccaaagccaaggggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattctcaaactggctgcttatggtgacaatctcagagttgttaccatatagctattggattggccatccggtgagcaacagagcaattgtctaccaatttgttggatttattccactcaatctagcggttttcagaacattgaattatattctaaccctcaacaagacgaa 33108
iEV-B73 IRES ttaaaacagcctgtgggttgtacccacccacagggcccactgggcgctagcacactggtatcacggtacctttgtgcgcctgttttataccccctaccccaactttaaacttagaagcaaagcaaacccgatcaatagcagatgtagcaagccagttgcatcttgatcaagtacttctgtctccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgttacccgaccaactacttcgagaaacctagtaacaccatgaaagtagcagggtgtttcgatcagcacaaccccagtgtagatcaggctgatgagtcaccgcatcccccacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgctctaatatggacatggtgtgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacataccccaaagccaaggggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattctcaaactggctgcttatggtgacaatctcagagttgttaccatatagctattggattggccatccggtgagcaacagagcaattgtctaccaatttgttggatttattccactcaatctagcggttttcagaacattgaattatattctaaccctcaacaagacgaa 33109
iEV-B74 IRES ttaaaacagcctgtgggttgttcccactcacagggcccactgggcgctagcacactggtatcacggtacccttgtgcgcctgttttattcaccccccccaaatgtaacttagaagcataacccaaatggtcaatagacagcccagtacaccagctgggtttcggccaagtacttctgttaccccggaccgagtatcaataggctgctcacgcggctgaaggagaaaacgttcgttatccggccaattacttcgagaaacctagtaacaccatgaaagttgcgcagtgtttcgctccgcacaaccccagtgtagatcaggtcgatgagtcaccgcgttccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgcgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacatgccagtgggcggtctgtcgtaacgggcaactccgcagcggaaccgactactttgggtgtccgtgtttccttttattcttaatctggctgcttatggtgacaattgaaagattgttgccatatagctattggattggccatccggtgacaaacagggcgattatttatttgtttgttggttttgttccattaaactatagagttttgaatactctagaatttattataacactcaacacaacaaa 33110
iEV-B75 IRES tttaaaacagtcctgtgggttgttacccacccacagggcccactgggcgccagcacactggtatcacggtacctttgtgcgcctgttttatatacccttcccctactaagtaacttagaagcaattaaacaaagaccaacagtaagcacagcgcaccagctgtgtttcggtcaagcacttctgttaccccggactgagtatcaataggctactcacgtggctgaaggagaaaacgttcgttacccgaccaattacttcgagaagcctagtaacaccatggaggttgcgcggcgtttcgctccacacaaccccagtgcagatcaggtcgatgagccaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgcgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcccaactgcggagcagatacccacgcgccagtgggcagtctgtcgtaatgggcaactctgcagcggaaccgactactttgggtgtccgtgtttcctttattcttatactggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccggtgacgagcagagctattatttacctatttgttggttttataccattgaactataaagttttaaaaaccttaaacttcatcttagtactcaatacagcaaa 33111
iEV-B77 IRES ttaaaacagcctgtgggttgtacccacccacagggcccattgggcgctagcacactggtattccggtacccttgtgcgcctgttttatctacccttccctactgcaacttagaagttaaacagtcacggtcgataggcggttcagtaaaccaactggatcttgaccaagcacttctgttaccccggactgagtatcaataagctgcttacgtggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacctagtaccaccatgaaggttgcgcagcgtttcgctccgcacaaccccagtgtagatcaggtcgatgagtcaccgcactcctcacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgcgaagagtctattgagctaattggtaatcctccggcccctgaatgcggctaatcccaactgcggagcaggtacccacacaccagtgggcagcctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcctatactggctgcttatggtgacaattgaaagattgttaccatatagctattggattggccatccagtgacaaacagagcaattgtctatctatttgtcggttttgtaccaataaatttcaaagtcctaaaaaccctcaatttcatattgttacttaacacaacaag 33112
iEV-B79 IRES ttaaaacagcctgtgggttgtacccacccacagggcccattgggcgctagcacactggtatcacggtacccttgtgcgcctgttttatccgcccctccccattgtaacttagaagataactaaacacggtcgttaggtggctcagtacgccaactgagtcttgaccaagcacttctgttaccccggactgagtatcaataggctgctcacgcggctgaaggagaaaacgttcgttatccggccaattacttcgagaaacctagtaccaccatggaggttgcgcagtgtttcgctccgcacaaccccagtgtagatcaggccgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgctggcggcccgcccatgggtaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcccaactgcggagcagatacccacacaccagtgggcagtctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattccaatactggctgcttatggtgacaattgaaagattgttaccatatagctattggattggccatccggtgacaaacagagcgattgtttacctatttgtaggtttcataccattgaattttaaagttttaagaacccttaactttatattagcacttaacacaacaaa 33113
iEV-B80 IRES ttaaaacagcctgtgggttgatcccacccacagggcccactgggcgtcagcactctggtatcacggtacctttgtgcgcctgttttatactccctccccccaaccgtaacttagaagcagcactaactgatcaatagccagcgcggcatgccagccacgcttcgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgtcatccggccaactacttcgagaaacctagtaacaccatggaagttgcggagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacaggcgactgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctcttatatagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcatacaccctcaaaccagagggcagtgtgtcgtaatgggcaactctgcagcggaaccgactactttgggtgtccgtgtttcactttatttctaaattggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccggtgaccaatagagctattatatatctctttgttgggttcataccacttagcttgaaagaggttaaaactctgcattacattatactattgaattccgcaaa 33114
iEV-B81 IRES ttaaaacagcctgtgggttgtacccacccacagggcccattgggcgcttgcacactggtattccggtacctttgtgcgcctgttttatacatcctacccccgtaacttagaagcaagatcacccgatcaccaggaaatgtggcaaaccagtcacattctgatcaagcacttctgtttccccggactgagtatcaataggctgttcacacggctgaaggagaaaacgttcgttacccggccaactacttcgaaaaacctagtatcaccgtgaacgttgcagagtgtttcgctcagcactttccccgtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcctgcggggcaacccgtaggacgctctaatacagacacggtgtgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcgagcgcttgtaatccaacaggtagctcgtcgtaacgggtaactctgcagcggaaccgactactttgggtgaccgtgtttccttttatttcattactggctgcttatggtgacaatcacagagttgttaccatatagctattggattggccatccggtgtcaaatagagcaattgtgtttctttttgttgggtttgtaccacttgacttgaccagctacaacactctgtgctacattgttagattgaacacagcaaa 33115
iEV-B82 IRES ttaaaacagcctgtgggttgcacccacccgcagggcccactgggcgctagtacactggtaccccggtacccttgtacgcctgttttatttctccctcccccaaccagtaacctagaagtaaagcaaacccgatcaatagcaggtgcgacacaccagtcgtatcttgatcaagcacttctgtaaccccgggccgagtatcaatagactgctcacgcggttgagggagaaaacgctcgttatccggctgactacttcgagaaacccagtaacaccatagaagttgcagagtgtttcgctcagcactttccccgtgtagatcaggtcgatgagtcaccgcattccccacgggtgaccgtggcggtggctgcgttggcggcctgcctatggggcaacccatgggacgctctaatacagacatggtgtgaagagtcaattgagctagtcagtattcctccggcccctgaatgcggctaatcctaactgcggagcacgtgcctccaatccagggggtggcgtgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttatcttggctgcttatggtgacaattgaaggattgttaccatatagctattggattggccatccggtgactaacagagcaatcatataccaatttgttggttttataccattgaattacaaagttctaatcacccttaaattcattttaacacttaatacgtcaaa 33116
iEV-B83 IRES tttaaaacagcctgtgggttgttcccacccacagggcccactgggcgctagcactctggtatcacggtacccttgtgcgcctgttttatatccccaccccagtggaacattagaagcagcacacctatgatcaatagtgggcgtggcatccagtcacgttatgatcaagcacttctgtgaccccggactgagtatcaatagactgctcacgcggttgaaggagaaaacgttcgttacccggccagttacttcgagaaacccagtaacaccatgaatgttgcagagtgtttcgctcagcacttcccccgtgtagatcaggtcgatgagccactgcattccccacgggcgaccgtggcagtggctgcgttggcggcctgcctatggggtcacccataggacgctctaatactgacatggtgcgaagagtctattgagctaactggtagtcctccggcccctgaatgcggctaatcctaactgtggagcacattcccccaatccagggggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttctttttattctcatattggctgcttatggtgacaattacagaattgttaccatatagctattggattggccatccggtgactaacagagcaattatttatcaattcgttggatttgtcccactcgatttcaaagcagtcaatacactctcatatatcgttacactcaacacaacaaa 33117
iEV-B84 IRES ttaaaacagcctgtgggttgttcccacccacagggcccaccgggcgccagcacactggtatcacggtacccttgtgcgcctgttttatccaccccttcccacagtaacttagaagcacaccatgtatacggtcaataggcggctcagtacaccaactgggccacgaccaagcacttctgttaccccggactgagtatcaataagctgctcacgcggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacccagtaccaccatgaaggttgcgcagcgtttcgttccgcacaaccccagtgtagatcaggtcgatgagtcaccgcgttcctcacgggtgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgcgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacaaaccagtgggcagtctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttatccttacactggctgcttatggtgacaattgagaaattgttaccatatagctattggattggccatccggtgacaaacagagcagttgtttacctatttgttggtttcgtaccgctgaaccttaaagttctaaagaccctcaattttatcttagcacttaacacagcaaa 33118
iEV-B85 IRES ttaaaacagcctgtgggttgttcccacccacagggcccaccgggcgctagcacactggtattgcggtacctttgtgcgcctgttttatacacccctccttaatgtaactcagaagtacaacattaccggtcaacagatgactcagtaaaccaactgagcctcgaccaagcacttctgtttccccggaccgagtatcaataggctgctcacgcggctgaaggagaaagtgttcgttacccggccaattacttcgagaagcccagtaccaccatggaggttgcgcggcgtttcgctccgcacatccccagtgtagatcaggctgatgagtcaccgcgttccccacgggtgaccgtggcggtggctgcgctggcggcctgcccatggggtaacccatgggacgcttcaatactgacatggtgtgaagagcctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacacaccagcgggcagtctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttatttttatgctggctgcttatggtgacaattgaggaattgttaccatatagctattggattggccatccagtgtccaacagagcgatcatttacctgttcgttgggttcgtaccactaaaccacaagtcactcagcacacttaattacattataactctcaacacaacaag 33119
iEV-B86 IRES ttaaaacagcctgtgggttgtacccacccacagggcccactgggcgctagcacactggtattacggtacccttgtgcgcctgttttatttacccctcccccacgcaacctagaagcatgacttaagcggtcaatagatggctcagtatgccaactgagttatgaccaagcacttctgttaccccggaccgagtatcaataggctgctcacgcggctgaaggagaaagtgttcgttacccggccagttacttcgagaaacctagtatcatcatgaaggttgcgaggcgtttcgctccacacgaccccggtgtagatcaggctgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgcttcaatattgacatggtgcgaagagtctattgagctaactggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagacacccacatgccagtgggcagtctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttatattggctgcttatggtgacaattgaaagattgttgccatatagctattggattggccatccagtgactaacagagcaattgtctacctgttcgttggttacgtaccactaaattataaagttttgaacacacttaattttattatagcacttaacaccttaaa 33120
iEV-B87 IRES ttaaaacagcctgtgggttgttcccacccacagggcccatagggcgccagcactctggtatcccggtacctttgtgcgcctgttttatccacccttccccaagcgtaacttagaagcccatcatacacggtcaataggtggttcagtatgccaactgagtcttgaccaagcacttctgttaccccggactgagtatcaataagctgctcacgcggctgaaggagaaaacgttcgttatccggccaattacttcgagaaacctagtaacaccatgaaggttgcgcagcgtttcgctccgcacaaccccagtgtagatcaggtcgatgagtcaccgcactccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgcgaagagtctattgagataattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacatgccagtgggcagtctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttatttctatactggctgcttatggtgacaattgacagattgttaccatatagctattggattggccatccggtgacgaacagagcaattatttacttatttgttggttttataccattaaatttcaaagttttaaaaaccctcaacttagttttgtcactcaactcagcaaa 33121
iEV-B88 IRES ttaaaacagcctgtgggttgatcccacccacagggcccactgggcgctagcacactggtattccggtacttttgtgcgcctgttttatacacccttccccttcatgtaacttagaagtaaaacacaaacggtcaataggtagctcagcaaaccagctgagcctcggccaagcacttctgttaccccggactgagtatcaataagctgttaacacggctgaaggagaaaacgttcgttatccggccaattacttcgagaaacctagtaacaccatgaaggttgcgtagcgtttcgctccacacaaccccagtgtagatcaggtcgatgagtcaccgctctccccacgggtgaccgtggcggtggctgcgttggcggcctgcccatggagcactccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagacacccacacgccagtgggcagtctgtcgtaatgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttacattggctgcttatggtgacaatcaaggaattgttaccatatagctattggattggccatccggtatctaacagagcaattgtttacctcttcaccggttttgtaccattgaattgcaatagtctcaacaccctttgctatatcattaaattgaactcagcaaa 33122
iEV-B93 IRES aaagcaggctttaaaacagctctggggttgttcccacccacagggcccactgggcgctagcactctggtatcacggtacctttgtgcgcctgtttttccacccctccccatacgcaacttagaagagagactcaaccggtcaatagacagcctagtacaccaactaggttctgaccaagaacttctgtttccccggaccgagtatcaataggctgcttacgcggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacctagtatcaccatggaagttgcgcagtgtttcgctccgcacaaccccagtgtagatcaggtcgatgagtcaccgcattccccacaggcgactgtggcggtggctgcgttggcggcctgcccgtggggcaacccacgggacgcttcaataccgacatggtgcgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgtggagcagatacccacgcgccagtgggcagtctgtcgtaatgggcaactccgcagcggaaccgactactttgggtgtccgtgtttccttttatcctcataatggctgcttatggtgacaattgaaagattgttaccatatagctattggattggccatccggtgactaacagagcaattatttatttgtttgttgggtttgtaccattgaactacaaggtccttaatactctaaactacattataagtcttaatacagtgca 33123
iEV-B97 IRES ttaaaacagcctgtgggttgttcccacccacagggcccactgggcgccagcacactggtatcacggtacctttgtgcgcctgttttatccacccttccccaatgtaacttagaagtaaaactagaaagatcaatagcaagcacagtatgccaactgtgttatgatcaagcacttctgttaccccggactgagtatcaataagctgctaaagcggctgaaggagaaaacgttcgttacccggccaactacttcgagaaacccagtaccaccatgaaggttgcgcagtgtttcgctccacacaatcccagtgtagatcaggtcgatgagtcaccgcgttccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatgggatgacccatgggacgcttcaatactgacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacacaccagtgggcagtctgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttctttttatcctcaaattggctgcttatggtgacaattgataagttgttaccatatagctattggattggccatccggtgtctaacagagctattgtttatttatttgttggtttcgtgccactaaattacaaagtttttgaaactctcaacttcattttgacactcaataaagcaaa 33124
iEV-B98 IRES ttaaaacagcctgtgggttgttcccacccacagggcccaatgggcgccagcactctggtattacggtacctttgtgcgcctgttttatatcccctcccccaattgtaacttagaagcaacacgcaccgaccaacagtgggcgtggcacaccagccacgtcttggtcaagcacatctgtttccccggactgagtatcaatagactgctcacgcggtcgaaggagaaaacgttcgttatccggccaactacttcgagaagcccagtaacaccatgaatattgcgaagtgtttcgctcagcacactcccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcctatggggcaacccgtaggacgcttcaatatggacatggtgtgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaaccgcggagcaggcacccacaaaccagtgggcagcttgtcgtaacgggtaactctgcggcggaaccgactactttgggtgtccgtgtttccttttattcttatactggctgcttatggtgacaattgagagattgttgccatatagctattggattggccatccggtgacaaacagagcaattgtttatctatttgttggttttataccgttaagttttaaagtcctaaaaacccttaacttggtcatactactcaactcagcaaa 33125
iEV-B100 IRES ttaaaacagtctgtgggttgttcccacccacagggcccacgtggcgccagcacactggtatctcggtacctttgtgcgcctgttttatccaccctaaaccccgttgtaacttagaagatgagcaacactgatcaatagtgggtgcaacatgccagttgcatcacgatcaagcacttctgtatccccggactgagtatcaataggctgctcacgcggctgaaggagaaaacgttcgttatccggccagttacttcgagaaacctagtaacatcatggaggttgcgcagtgtttcgctccgcacacccccagtgtagatcaggtcgatgagtcaccgcgttccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatgggataacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaactggtagtcctccggcccctgaatgcggctaatcctaactgtggagcagacacccacatgccagtgggcagtctgtcgtaacgggcaactccgcagcggaaccgactactttgggtgtccgtgtttccttttattcctatattggctgcttatggtgacaattgaaagattgttaccatatagctattggattggccatccggtgtcaaacagagcaatcatttatttgtttgttggttttatacctctgaactttaaagtgctaaagactctcaattttatattatatctcaacaaatcagg 33126
iEV-B101 IRES ttaaaacagcctgtgggttgttcccacccacagggcccactgggcgccagcactctggtattacggtacctttgtgcgcctgttttatatccccctccccacttgaaacttagaagtgaaacacactgatcaatagttgacatggcaagccagccatgtcttgatcaagcacctctgtttccccggacctagtatcaatagactgctcgcgcggttgaaagagaaagcgttcgttacccggctaactacttcgagaaacttagtaacaccatggaagttgcggagtgtttcgctcagcacatccccagtgtagatcaggccgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcctgtggggcaacccacaggacgctctaatacaaacatggtgcgaagagtctattgagctagttagtagtcctccggcccctgaatgcggctaatcctaactgcggagcacgtgcttccaatccaggaggtggcgtgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttgcattggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccggtgacaaacagagcaattatatatctctttgttggatacattccattgaactacaaggagttaaaaaccctcaattatattctgttcttgaattccgcaag 33127
iEV-B106 IRES ttaaaacagcctgtgggttgttcccacccacagggcccatggggcgccagcacactggtattgcggtacctttgtgcgcctgttttattcaccctttcccaatgaaacttagaagcttaactcaaccggtcgatagacagcccagtacaccaactgggttttgaccaagtactcctgtttccccggactgagtatcaataagctgctcgcgcggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacctagtaccaccatgaacgttgcgcagtgtttcgctccgcacaaccccagtgtagatcaggtcgatgagtcaccgcaatccccacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcatcccatgggacgcttcaatactgacatggtgcgaagagtctattgagctaattggtaatcctccggcccctgaatgcggctaatcctaactgcggggcagacacccacacgccagtgggcagtctgtcgtaacgggtaactccgcagcggaaccgactactttgggtgtccgtgtttccttttatctttatattggctgcttatggtgacaattgaaagattgttgccatatagctattggattggccatccggtgtctaatagagcaattatatatctctttgttggcttcatcccgttaaataaagtgagctaccagaccctgtgctatattatcaaattgaacacaataaa 33128
iEV-B107_TN94-0349 IRES ttaaaacagcctgtgggttgttcccacccgcagggcccactgggcgctagcacactggtatcccggtacccttgtgcgcctgttttatataccctcccccttatgtaacttagaagtatgattcaaacggtcgacaggcggctcagtgcaccaactgagtcatgaccaagcacttctgttaccccggactgagtatcaataagctgttcacacggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacctagtaccaccatgaaggttgcgcagtgtttcgctccacacaaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcccaactgtggagcagatactcacaaaccagtgagcggtctgtcgtaacgggcaactccgcagcggaaccgactactttgggtgtccgtgtttctttttattcttacattggctgcttatggtgacaattgacaaattgttaccatatagctattggattggccatccggtgacaaacagagctattgtttacttgtttgttggtttcataccattaaattacaaggtcttagaaactctcaactttattttgacactcaatacagcaaa 33129
iEV-B111 IRES ttaaaacagcctgtgggttgttcccacccacagggcccactgggcgccagcacactggtatcacggtacccttgtgcgcctgttttataaacccttccccaatgcaacttagaagctcaactttaccggtcaatagacagtccagtacgccaactgggcttcgatcaagcacttctgttaccccggactaagtatcaataggctgctcacgcggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacccagtaacactatggaggttgcgcagtgtttcgttccacacaaccccagtgtagatcaggtcgatgagtcaccgctttccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtattcctccggcccctgaatgcggctaatcctaactgcggagcagatactcacgagccagtgggcagtctgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcatatattggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccggtgactaatagagcaattgtttacctatttgttggctttgtgccgttgaactacaaggttttaaaaactattaactacatcctagtacttaacacgttgaa 33130
iEV-B113 IRES actctggtattgcggtacctttgtacgcctgttttatatcccttccccatgtaactttagaagcaattcacaaggttcaatagagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgaagctgtatagactgtccccacggtcaaaaacggcagatccgttatccgcttatgtacttcgagaagcctagtatcatcttggaatcttcgatgcgttgcgttcagcactctatcccgagtgtagcttaggtcgatgagtctgggcattccccaccggcgacggtggcccaggctgcgttggcggcctacccatggctaacgccatgggacgctagttgtgaacaaggtgtgaagagcctattgagctacatgagagtcctccggcccctgaatgcggctaatcccaaccacggagcaagtactcacaacccagtgggcagcttgtcgtaacgcgtaagtctgtggcggaaccgactactttgggtgtccgtgtttcctttttatttttgatatggctgcttatggtgacatctaagattgttatcatatagcttttggattggccatccggtgatttttgagactaaaacgcttgtttgccttatcacacaatttagtattttgttatattcatacggtcata 33131
iEV-D68 IRES ttaaaacagctctggggttgttcccactcaagggcccacgtggcggctagtactctggtatctcggtacctttgtacgcctgttttaattccctccccaacgtaacttagaagcttttaaaccaaagctcaataggtggagcgcaaaccagcgctcttatgagcaagcacttctgtctccccggtgtggttgtatagactgtccccacggttgaaaacaacttatccgttaCccgctatagtacttcgagaaacctagtattgccttcggagtgttgatgcgttgcgctcagcacactaacccgtgtgtagcttgggtcgatgagtctggacgtaccccactggcgacagtggtccaggctgcgttggcggcctactcatggtgaaaaccatgGgacgctagacatgaacaaggtgtgaagagtctattgagctgctatagagtcctccggcccctgaatgcggctaatcctaaccatggagcaagtgctcacaaaccagtgagttacttgtcgtaacgcgcaagtccgtggcggaaccgactactttgggtgtccgtgtttcactttttacttttatgactgctaatggtgacaatttaatattgttaccatttggcttgtcgaattgatcacataagatctatagttttgttcactgatttgctttgaaataatctcacctcaaaacctccagtacataacatttaaagagtttaaacttatttataaca 33132
iEV-D70 IRES ttaaaacagctctggggttgttcccaccccagaggcccacgtggcggctagtactccggtaccccggtacccttgtacgcctgttttatactccctttcccaagtaactttagaagaaataaactaatgttcaacaggagggggtacaaaccagtaccaccacgaacacacacttctgtttccccggtgaagttgcatagactgtacccacggttgaaagcgatgaatccgttacccgcttaggtacttcgagaagcctagtatcatcttggaatcttcgatgcgttgcgatcagcactctaccccgagtgtagcttgggtcgatgagtctggacaccccacaccggcgacgtggtccaggctgcgttggcggcctacccatggctagcaccatgggacgctagttgtgaacaaggtgcgaagagcctattgagctacctgagagtcctccggcccctgaatgcggctaatcccaaccacggagcaaatgctcacaatccagtgagtggtttgtcgtaatgcgcaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttatttttattatggctgcttatggtgacaatctgagattgttatcatatagctattggattagccatccggtgaCatcttgaaattttgccataactttttcacaaatcctacaacattacactacactttctcttgaataattgagacaactcata 33133
iEV-D94 IRES ttaaaacagcctgtgggttgttcccaccccagaggcccacgtggcggccagtactctggtatcacggtacctttgtacgcctgttttatatccccttcccccgcaacttagaagaaaacaaatcaagttcactaggagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgatgtcgtatagactgtaaccacggttgaaaacgattgatccgttatccgctcttgtacttcgaaaagcccagtatcaccttggaatcttcgatgcgttgcgctcagcactcaaccccagagtgtagcttaggtcgatgagtctggacactcctcaccggcgacggtggtccaggctgcgttggcggcctacctgtggtccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctattgagctacaagagaatcctccggcccctgaatgcggctaatcctaaccacggagcaagggtacacaaaccagtgtatatcttgtcgtaacgcgcaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttgtttttatcatggctgcttatggtgacaatctaagattgttatcatatagctgttggattggccatccggtaatttattgagatttgagcatttgcttgtttcttcaacaatttcacctattcattgcatttcagcagtcaaa 33134
iEV-D111 IRES ttcccaccctagaggcccacgtggcggctagtactctggtattacggtacctttgtacgcctgttttatatccctttccccattgtaacttagaagtttcaaagtacagttcaatagacagtagtacaaaccagtactgctacgaacaagcacttctgttgccccggtgtagttgcatagactgtacccacggttgaaagcaactgatccgttatccgctttagtacttcgagaagcctagtagcaccttgggatcttcgatgcgttgcgctcagcactcaaccccagagtgtagcttgggtcgatgagtctggacattcctcaccggcgacggtggtccaggctgcgttggcggcctacctgtggcccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctattgagctactaaagagtcctccggcccctgaatgcggctaatcctaaccacggagcaagtgctcacagtccagtgagtagcttgtcgtaatgagcaattctgtggcggaaccgactactttgggtgtccgtgtttccttttatttttatcattggctgcttatggtgacaatctaaggttgccatcatatagcttttggattggccatcccggtgatatttcgaattattcaatttgctgtttgcagctccttttaaacagtattcactcaccagcattcatattttactcttgagttattaacaaatagtcaaaa 33135
iHCosV-B1 IRES ttgccagttttttgaaacgtgtggtttgacgtctaaccattatggcagtgggtggagtactgcaaagatgtcaccgtgctttacacggtttttgaaccccacaccggctgtttggcgcttgcaggacagcaggtttattttcttttaactctctctttctagccacacacgatctatgtgtgtgggcggagtgatactcccgttccttcttggacaggcggcctccacgccctttgtggatcttaaggctaccaagtcactggtgttggaaagtgaagagaaaggagttccttgggaactacatgtggcattgacagaggttgtagcgatgctgtgtgtgtgtgcggattacccccgtggcgacacggaccccacaggccaaaagccctgtccgaaaggacccacacagtggagcaaccccagctcccctcttcaatgttttgtgttagcaaccttggtattattttctctcaagcttccaatacaccgggccccaaagatgtcctgaaggtaccccgtgtatctgaggatgagcaccatcaactacccggacttgttctttcgagaacagacgcatgtggtaacccagccccgatcctaaggggtcggggcttttgctcactcagcacaggatctgatcaggagacctcccccccctgctttacagggggcgggggtttaaaaattgcccaaggcctggcaaataacctaggggactaggttttcctttttattttaaagttgtcaat 33136
iEcho-E7 IRES ttcccacccacagggcccactgggcgctagcacactggtatcacggtacctttgtgcgcctgttttatccaccctcccccaatgtaacttagaagcacaccaaacgcggtcaataggcggctcagtacaccaactgagtctcgaccaagcacttctgttaccccggactgagtatcaataggctgctcacgcggctgaaggagaaaacgttcgttacccggccaattacttcgagaaacctagtaccaccatgaaggttgcgcggcgtttcgctccacacaaccccagtgtagatcaggtcgatgagccaccgcattccccacgggcgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagacacccacatgccagtgggcagtctgtcgtaacgggtaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattctcatactggctgcttatggtgacaattgaaagattgttgccatatagctattggattggccatccggtgacaaacagagcggttgtttacctatttgtcggttttataccattgaattacaaggttctgaaaaccctcaatttcattttagcacttaataccacaaa 33137
iEcho-E9 IRES ttaaaacagcctgtgggttgttcccacccacagggcccattgggcgctagcacactggtatcacggtacccttgtgcgcctgttttatccacccctccccatcgtaacctagaagcatgactccaacggtcaatagacagctcagtaaaccaattgagccttgaccaagcacttctgttaccccggactgagtatcaataggctgctcacgcggccgaaggagaaaatgttcgttacccggccaattacttcgagaaacctagtaccaccatgaaggttgcgcggtgtttcgctcagcacaaccccagtgtagatcaggccgatgagtcaccgcattccccacgggtgaccgtggcggtggctgcgctggcggcctgcccatggggcaacccatgggacgcttcaatactgacatggtgtgaagagtctattgagctaattggtagtcctccggcccctgaatgcggctaatcctaactgcggagcagatacccacgcaccagtgggcagtctgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtccgtgtttccttttattcttgtactggctgcttatggtgacaattgagagattgttaccatatagctattggattggccatccagtgtcaaacagagcgattgtctacttgttcattggttttataccattgagttacaaggttctagccactcttaacttcattttaacactcaatacatcaaa 33138
iPV3_PAK1019536 IRES tggggttaaaacagctctggggttgttcccaccccagaggcccacgtggcggctagtactctggtatcatggtacctttgtacgcctgttttatacccctaccccacgtaactttagaagcaactcaacaagttcaatagggggggtacaaaccagtaccaccacgaacaagcactcctgttaccccggtgatcttgcataagctgtgcccacggctgaaggcgagagatccgttatccgcttgagtacttcgagaagcctagtatcaccttgggatcttcgacgcgttgcgctcagcactccacccgagtgtagcttaggctgatgagcctgggcattccccaccggcgacggtggcccaggctgcgttggcggcctacccatggctaacaccatgggacgctagatgtgaacaaggtgtgaagagcctattgagctactcaagagtcctccggcccctgaatgcggctaatcccaaccacggagcaggtgtcttcaacccagaaggtagcctgtcgtaacgcgtaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttatcttttatatggctgcttatggtgacaatcacagattgttatcataaagcgatttggattggccatccggtgaagtacaaacacattatctacttgtttgttggatttactccactcacacaccccacccccaatataacatctattgttttgttGacaagaaattactttcgaa 33139
iPV3_NIE1219535 IRES gttaaaacagctctggggttgttcccaccccagaggcccaagtggcggctagtactccggtatcacggtacccttgtacgcctgttttatactcccttcccccgtaacttagaagagttaaaccaagttcaatagaagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgatattgtatagactgtacccacggtcgaaaatgattgatccgttatccgctctcatacttcgagaagcctagtatcatcttggaatcttcgatgcgttgcgctcggcactcgatcccggagtgtagcttaggtcgatgagtctggacactcctcaccggtgacggtggtccagactgcgttggcggcctacctgtggtccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctattgagctatgagagagtcctccggcccctgaatgcggctaatcccaaccacggagcgagagtgcgcaagccagcgtatatctcgtcgtaacgcgcaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttatttttgtattggctgcttatggtgacaatcacagattgttatcataaagcgaattggattggccatccggtgaaagtgaaatacattatttgcttatttattggattcagtccacctaattgctatactcacgaacccaccacagccgttttgttGactgaaagccggtaccaata 33140
iPV3_SWI10947 IRES ttaaaacagctctggggttgttcccaccccagaggcccacgtggcggctagtactccggtatcacggtacccttgtacgcctgttttatactcccttccccgtaacttagaagtatacaaaccaagttcaatagaagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgaagttgcatagattgtccccacggtcgaaagcgactgatccgttatccgctcttgtacttcgggaagcctagtatcaccttcggatcttcgatgcgttgcgctcagcactcaaccccagagtgtagcttaggtcgatgagtctggacgaacctcactggtgacagtggtccaggctgcgttggcggcctacctgtggcccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctactgagctacatgagagtcctccggcccctgaatgcggctaatcccaaccacggagcaggtggtcacaaaccagtggtttgcctgtcgtaacgcgaaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttattcttattatggctgcttatggtgacaatcttagattgttatcataaagcgaattggattggccatccggggaaaattaagcatatcatacacttgtttgttggattcacccctctgattacacatactcttggcttgattaggattgttgcattgataagacactattgttgca 33141
iPV3_FIN84 IRES gggttgttcccaccccagaggcccacgtggcggctagtactccggtatcacggtacccttgtacgcctgttttatactcccttccccgtaacttagaagtatacaagccaagttcaatagaagggggtacaaaccagtaccaccacgaacaagcacttctgtttccccggtgaagttgcatagattgttcccacggtcgaaagcgactgatccgttacccgctcatgtacttcgggaagcctagtatcaccttcggatcttcgatgcgttgcgctcagcactcaaccccagagtgtagcttaggtcgatgagtctggacaaacctcactggcgacagtggtccaggctgcgttggcggcctacctgtggcccaaagccacaggacgctagttgtgaacaaggtgtgaagagcctactgagctacatgagagtcctccggcccctgaatgcggctaatctcaaccacggagcaggtggtcacaaaccagtgatttgcctgtcgtaacgcgaaagtctgtggcggaaccgactactttgggtgtccgtgtttccttttactctcattatggctgcttatggtgacaatcctagattgttatcataaagcgagttggattggccatccggtgaaaatcaagcacatcatatatttgtttgttgggtttaaccctctgattgcacgcactcttggcttggttaggattattgtgtggaaaaggcaccatagttaca 33142
Apt-eIF4G ACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCG 33143
synIRES-RC01 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33144
synIRES-RC02 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtgACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGcacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33145
synIRES-RC03 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33146
synIRES-RC04 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgcACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33147
synIRES-RC05 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33148
synIRES-RC06 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33149
synIRES-RC07 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGgcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33150
synIRES-RC08 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatgggACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGcccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33151
synIRES-RC09 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCCCCctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33152
synIRES-RC10 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGgagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33153
synIRES-RC11 ttaaaacagcctgtgggttgatcccacccacaggcccattgggcgctagcactctggtatcacggtacctttgtgcgcctgttttataccccctcccccaactgtaacttagaagtaacacacaccgatcaacagtcagcgtggcacaccagccacgttttgatcaagcacttctgttaccccggactgagtatcaatagactgctcacgcggttgaaggagaaagcgttcgttatccggccaactacttcgaaaaacctagtaacaccgtggaagttgcagagtgtttcgctcagcactaccccagtgtagatcaggtcgatgagtcaccgcattccccacgggcgaccgtggcggtggctgcgttggcggcctgcccatggggaaacccatgggacgctctaatacagacatggtgcgaagagtctattgagctagttggtagtcctccggcccctgaatgcggctaatcctaactgcggagcacacaccctcaagccagagggcagtgtgtcgtaacgggcaactctgcagcggaaccgactactttgggtgtcgtgtttcattttACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGattcctatactggctgcttatggtgacaattgagagatcgttaccatatagctattggattggccatccggtgactaatagagctattatatatccctttgttgggtttataccacttagcttgaaagaggttaaaacattacaattcattgttaagttgaatacagcaaa 33154
synIRES-RC12 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggCACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGGCCagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33155
synIRES-RC13 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggCGACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCGCCagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33156
synIRES-RC14 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggCGGACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCCGCCagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33157
synIRES-RC15 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggaACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGtccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33158
synIRES-RC16 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggaGACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCtccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33159
synIRES-RC17 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggaGGACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCCtccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33160
synIRES-RC18 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33161
synIRES-RC19 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacggACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGccgtgtcctagcctgcgtggcggccaacccagcttatgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33162
synIRES-RC20 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33163
synIRES-RC21 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccGACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33164
synIRES-RC22 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccGGACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGCCgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33165
synIRES-RC23 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33166
synIRES-RC24 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcCACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGGgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33167
synIRES-RC25 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggatttcccctccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcCCACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGGGgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33168
synIRES-RC26 ttaaaacagcggatgggtaccccaccatccgacccactgggtgtagtactctggtacttcgtacctttgtacgcctgttcttcccattgtacccttcctgaacttccaacccaagtaacgttagaagctcaacatttagtacaacaggaagcaccacatccagtggtgtttagtacaagcacttctgtttccccggagcgaggtataggctgtacccactgccaaaaacctttaaccgttatccgccaaccaactacgtaaaagctagtagtattatgtttttaactaggcgttcgatcaggtggaACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGtccactagtttggtcgatgaggctaggaattccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcACTCACTATTTGTTTTCGCGCCCAGTTGCAAAAAGTGTCGgctgggacgcctttttatagacatggtgtgaagactcgcatgtgcttggttgtgattcctccggcccctgaatgcggctaaccttaaccctggagccttgtgtcacaaaccagtgatgataaggtcgtaatgagcaattccgggacgggaccgactactttgggtgtccgtgtttcttatttttcttattattgtcttatggtcacagcatatatataacatatactgtgatc 33169
圖1. circRNA的模組化選殖平台使能進行快速設計-構建-測試循環。示意圖描述了用於創建circRNA合成的模板質體的模組化選殖(MoClo)平台。第1~6部件對應於上游內含子與5’非轉譯區(UTR)、IRES、N端(N’)標記、編碼序列(CDS)、C端(C’)標記、及3’ UTR與下游內含子,並經由Golden Gate反應單獨選殖到部件質體中(參見圖7)。然後將部件質體與circRNA骨架在第二個Golden Gate反應中組合以創建circRNA質體。circRNA骨架含有一個使能在細胞模式中短暫轉染後進行circRNA轉錄的CAG啟動子,一個使能在體外轉錄(IVT)的T7啟動子,協助RNA環化的同源序列,促進RNaseR持續力的低結構區,以及一個細菌表達的GFP丟失序列來負選擇不正確的組合體。若使用不帶N’或C’標記的CDS,則第3~5部件將替換為單個部件。來自circRNA質體的PCR產物隨後被用作體外轉錄的模板以合成RNA。最後,進行RNaseR清理以消化線性RNA並分離circRNA。
圖2. RNA修飾及非編碼元件的最佳化使能進行更強的circRNA轉譯。(A)HeLa細胞在以含有不同RNA修飾的circRNA轉染後的奈米螢光素酶活性。所顯示的數據為n=3生物重複數的平均值±SEM。***與未經修飾的circRNA相比,未經配對的t檢定的P<0.001。(B)HeLa細胞在含有3’或5’ IRES及不同長度間隔子序列的circRNA轉染後的奈米螢光素酶活性。當IRES在奈米螢光素酶報導子的3’端時,通過td剪接疤痕的轉譯是不可避免的。顯示了該疤痕的預測二級結構。所顯示的數據為n=3生物重複數的平均值±SEM。(C)HeLa細胞在以含有不同5’間隔子序列的circRNA轉染後的奈米螢光素酶活性。所顯示的數據為n=3生物重複數的平均值±SEM。與隨機50bp間隔子序列相比,未經配對的t檢定的*P=0.0213、**P=0.0051及***P<0.001。(D)HeLa細胞在以含有不同3’ UTR序列的circRNA轉染後的奈米螢光素酶活性。奈米螢光素酶活性由來自同一樣品的組成型螢火蟲螢光素酶活性正規化,然後除以來自模擬轉染的值。所顯示的數據為n=3生物重複數的平均值±SEM。與隨機50 nt間隔子序列相比,未經配對的雙側t檢定的***P=0.0012、****P<0.001。PR,保護區;MR,最小區;BR,結合區。
圖3. IRES截斷及IRES編碼序列連接的二級結構影響circRNA轉譯。(A)HeLa細胞在以含有從5’末端開始的不同IRES結構域缺失的circRNA轉染24小時後的奈米螢光素酶活性。二級結構及截斷點在圖中標明。所顯示的數據為n=3生物重複數的平均值±SEM。*與全長(FL)iCVB3相比,未經配對的t檢定的P<0.05。(B)HeLa細胞在以含有單獨IRES結構域缺失的circRNA轉染24小時後的奈米螢光素酶活性。奈米螢光素酶活性由來自同一樣品的組成型螢火蟲螢光素酶活性正規化,然後除以來自模擬轉染的值。所顯示的數據為n=3生物重複數的平均值±SEM。(C)HeLa細胞在以含有從IRES的3’末端開始的連續10bp缺失且緊接在AUG起始密碼子之前的circRNA轉染24小時後的奈米螢光素酶活性。(D)HeLa細胞在以含有AUG起始密碼子與奈米螢光素酶報導子之間的不同N末端前導序列的circRNA轉染24小時後的表明性質與奈米螢光素酶活性之間的相關性。所顯示的數據為n=3生物重複數的平均值±SEM。
5
. 含有eIF4G募集適體的合成IRES驅動更強的circRNA轉譯。(A)HeLa細胞在以circRNA及遞增劑量(4.2~33.3 nM)的鎖核酸(LNA)#1-3或非靶向(NT)LNA共轉染24小時後的奈米螢光素酶活性。LNAs #1-3經設計為與iCVB3的區互補,如示意圖中所示。奈米螢光素酶活性由來自同一樣品的組成型螢火蟲螢光素酶活性正規化,然後除以來自模擬轉染的值。所顯示的數據為n=3生物重複數的平均值±SEM。與等劑量的NT LNA相比,未經配對的雙側t檢定的*P=0.0233、**P<0.01、*** P=0.0001。(B)HeLa細胞在以含有eIF4G募集適體(Apt-eIF4G)的circRNA轉染24小時後的奈米螢光素酶活性,如插圖所示。Apt-eIF4G被插入iCVB3的11個不同位置中,如圖中所示。所顯示的數據為n=3生物重複數的平均值±SEM。與野生型iCVB3相比,未經配對的t檢定的**P=0.0017、***P=0.0002。(C)HeLa細胞在以含有連續優化的mRNA或circRNA電穿孔24小時後的mNeonGreen螢光。mRNA以CleanCap試劑、100% N1Ψ嵌入、及100bp多腺苷酸尾(poly(A) tail)合成。所示數據為每個條件下n>50,000個活的單態細胞的直方圖,及n=3生物重複數的平均值±SEM。未經配對的雙側t檢定的** P=0.0044、*** P=0.0006。(D)顯示閘控策略以分析電穿孔後活的單態HEK293T細胞。
圖5. 大規模篩選及IRES改造擴大了強IRES的圖譜。(A)HeLa、HepG2及HEK293T細胞在以含有表明的IRES的circRNA轉染24小時後的奈米螢光素酶活性。所顯示的數據為n=3生物重複數的平均值±SEM。(B)在以含有改組的IRES的circRNA質體進行體外轉錄-轉譯(IVTT)後的奈米螢光素酶活性。藉由將IRES片段化並將所得的池選殖到circRNA質體中,在人類鼻病毒 IRES上進行DNA改組。然後使用HeLa溶胞產物對純化的質體進行IVTT。將奈米螢光素酶活性除以來自模擬IVTT的值。所顯示的數據為n=4生物重複數的平均值±SEM。與野生型iHRV-B3相比,未經配對的雙側t檢定的P<0.05、**P=0.0095、****P<0.0001。(C)HeLa細胞以含有不同Apt-eIF4G插入不確定結構的(iHRV-B3)的IRES中的circRNA轉染24小時後的奈米螢光素酶活性。顯示了iHRV-B3的假定二級結構、預測的eIF4G及eIF4A結合位點、及Apt-eIF4G插入的位置。每個插入的版本(v1~v6)均設計有不同的幹長度。雙適體是指在遠端環及近端環處插入Apt-eIF4G。奈米螢光素酶活性由來自同一樣品的組成型螢火蟲螢光素酶活性正規化,然後除以來自模擬轉染的值。所顯示的數據為n=3生物重複數的平均值±SEM。與野生型iHRV-B3相比,未經配對的雙側t檢定的*P=0.0422、**P=0.0018、***P=0.0003、****P<0.0001。(D)HeLa細胞在以含有連續優化的mRNA或circRNA轉染24小時後的奈米螢光素酶活性。mRNA以CleanCap試劑、100% N1Ψ嵌入、及120 nt多腺苷酸尾合成。奈米螢光素酶活性由來自同一樣品的組成型螢火蟲螢光素酶活性正規化,然後除以來自模擬轉染的值。所顯示的數據為n=4生物重複數的平均值±SEM。未經配對的雙側t檢定的**P=0.0051、***P=0.0001、**** P<0.0001。(E)HeLa細胞在與編碼AkaLuc-P2A-CyOFP的circRNA電穿孔24小時後的AkaLuc活性。CircRNA iCVB3-AkaLuc-P2A-CyOFP以5% m6A、上游IRES拓撲結構、及隨機UTR間隔子合成。AkaLuc活性除以來自模擬電穿孔的值。大小表明奈米螢光素酶及AkaLuc-P2A-CyOFP編碼序列的長度。未經配對的雙側t檢定的**** P<0.0001。
圖6. 活體內基因置換驗證了改造的circRNA具有延長的轉譯持續時間及強度。(A)編碼奈米螢光素酶的CircRNA藉由以下優化方式合成:5% m6A嵌入、上游IRES拓撲結構、5’ PABP間隔子、HBA1 3’ UTR、及具有近端環Apt-eIF4G插入的HRV-B3 IRES。使用電荷可變可釋放轉運體系統(CART)將CircRNA配製成小鼠腹腔遞送。在指定時間點腹腔注射氟福利馬嗪(fluorofurimazine)受質後使用Ami HT光學成像系統分析表現。在首次投予circRNA奈米螢光素酶後336小時(14天),小鼠再次被投劑。(B)未經處理小鼠(左)與接受circRNA奈米螢光素酶小鼠(右)在投劑後24小時的活體內發光影像。(C)在circNanoLuc投予後不同時間點每隻小鼠的發光定量。在336小時(14天)時重新投劑。所顯示的數據為每個條件n=3動物數的平均值±SEM。(D)編碼人類紅血球生成素(hEPO)的經優化circRNA藉由以下優化方式合成:5% m6A嵌入、上游IRES拓撲結構、5’ PABP間隔子、HBA1 3’ UTR、及具有近端環Apt-eIF4G插入的HRV-B3 IRES。120 nt多腺苷酸尾。使用CART將等莫耳劑量的circRNA及mRNA配製成小鼠靜脈遞送。在指定時間點,藉由ELISA在一組世代中測量血漿hEPO。在168小時(7天)時,在單獨的世代中計數網狀紅血球。(E)在circRNA EPO或mRNA EPO投予後的不同時間點血漿hEPO表現的定量。所顯示的數據為每個條件n=4動物數的平均值±SEM。(F)在circRNA EPO或mRNA EPO投予後的不同時間點將血漿hEPO表現正規化為24小時水平。所顯示的數據為每個條件n=4動物數的平均值±SEM。與mRNA相比,非經配對t檢定及Bonferroni校正的*P=0.0487、***P=0.0001。(G)在circRNA EPO或mRNA hEPO投予後168小時的紅血球細胞中網狀紅血球百分比。所顯示的數據為每個條件n=4動物數的平均值±SEM。未經配對的雙側t檢定的**P=0.0080。ns,不顯著。(H)顯示了分析小鼠週邊血液中網狀紅細胞的閘控策略。
圖7. 與圖1相關的circRNA MoClo平台及奈米螢光素酶分析的其他細節。(A)藉由將PCR產物或預製DNA片段在BsmBI Golden Gate反應中與部件進入載體組合,合成含有兩側為所示突出端之第1~6部件的部件質體。這些部件對應於上游內含子與5’非轉譯區(UTR)、IRES、N端(N’)標記、編碼序列(CDS)、C端(C’)標記、及3’ UTR與下游內含子。部件質體與circRNA骨架隨後在BsaI Golden Gate反應中組合以創建circRNA質體。完全組裝的circRNA質體包括了在關鍵連接處指定限制酶切割位點,以促進次選殖及第3、4及5部件之間的甘胺酸-絲胺酸連接子同框。(B)用於評估circRNA轉譯的奈米螢光素酶分析的標準定量曲線證明了2 21(兩百萬)倍的線性稀釋範圍。所顯示的數據為n=3技術重複數的平均值。
圖8. 與圖2相關的RNA修飾在體外延長了circRNA的穩定性。(A)HeLa細胞在以含有10%嵌入的不同RNA修飾的circRNA轉染24小時後的奈米螢光素酶活性。(B)HeLa細胞在以含有指定的RNA修飾的circRNA轉染24小時後circRNA水平的定量。所顯示的數據為n=3生物重複數的平均值±SEM。(C)具有指定RNA修飾的mRNA及circRNA對遞增劑量的胎牛血清(FBS)降解的抵抗力。RNA以指定百分比的FBS在37℃下培養30分鐘,然後在進行凝膠電泳前在RNA上樣緩衝液中短暫變性。相同量的各凝膠的階梯及各孔的RNA用於允許凝膠之間的比較。(D)HeLa細胞在以編碼分泌的奈米螢光素酶的circRNA或mRNA電穿孔後上清液中的奈米螢光素酶活性。CircRNA以5% m6A嵌入及HRV-B3 IRES合成。mRNA以CleanCap試劑、100% N1Ψ嵌入、及120 nt 多腺苷酸尾合成。在電穿孔後的指定小時數(h)及天數(d),收取培養基以分析分泌的奈米螢光素酶並更換。所顯示的數據為n=3生物重複數的平均值±SEM。(E)HeLa細胞在以含有指定數量終止密碼子的circRNA轉染24小時後的奈米螢光素酶活性。所顯示的數據為n=3生物重複數的平均值±SEM。(F)HeLa細胞在與含有5% m6A的未經修飾circRNA或circRNA電穿孔24小時後的mNeonGreen螢光。藉由流式細胞儀測量平均mNeonGreen表現,並以來自模擬電穿孔的值正規化。所示數據為每個條件下n>50,000個活的單態細胞的直方圖,及n=3生物重複數的平均值±SEM。
圖9. 與圖4相關的eIF4G結合位點缺失為轉譯致死且不可恢復的。HeLa細胞在以含有野生型iCVB3、具有Apt-eIF4G插入的iCVB3、具有eIF4G足跡缺失的iCVB3、或具有eIF4G足跡失缺的iCVB3的circRNA轉染24小時後的奈米螢光素酶活性並嘗試以Apt-eIF4G進行救援。子結構域缺失(v1-v4)在幹環被截斷的位置不同,但至少均消除eIF4G足跡。
圖10. 與圖5相關的IRES的其他大規模篩選及驗證。(A)含有腸病毒(EV)或人類鼻病毒B(HRV-B)IRES的circRNA質體在體外轉錄-轉譯(IVVT)後的奈米螢光素酶活性。所有已知的EV及HRV-B IRES序列均被選殖到circRNA質體中。然後純化的質體使用HeLa溶胞產物進行IVTT。(B)HeLa細胞在以含有來自基於IVTT篩選的強IRES的circRNA或線性RNA轉染24小時後的奈米螢光素酶活性。線性RNA序列與circRNA的序列相同,但不包括自我剪接內含子。所顯示的數據為n=3生物重複數的平均值±SEM。(C)HeLa、HepG2、HEK293T、及KG-1細胞以含有指定IRES的circRNA轉染24小時後的奈米螢光素酶活性。HeLa、HepG2、及HEK293T細胞細胞的值與圖5A中的相同。
圖11.(A)TapeStation凝膠電泳描繪了編碼奈米螢光素酶並具有指定數量的終止密碼子的circRNA的大小。(B)西方墨點法描繪了在以編碼奈米螢光素酶並具有指定數量的終止密碼子的circRNA電穿孔24小時後HeLa溶胞產物中的奈米螢光素酶蛋白。每條泳道裝載10 μg的總蛋白。
圖12. 電腦模擬RNA結構預測可為IRES改造提供訊息。用於在適體插入位點合成IRES synIRES01-11的RNA結構預測。針對結構域間的插入(synIRES01、03、05、09及11),對Apt-eIF4G及相鄰的iCVB3結構域進行結構預測。針對環插入(synIRES02、04、06、07、08及10),對Apt-eIF4G及含有插入的iCVB3結構域進行結構預測。在每個結構中,對應於Apt-eIF4G的核苷酸以白色顯示。
圖13. iHRV-B3增強了編碼Cre的circRNA的活性。CreR-293T細胞在以mRNA或編碼Cre重組酶的circRNA轉染24小時後的eGFP陽性細胞百分比。在此細胞株中,DsRed在Cre重組之前表現且eGFP在Cre重組之後表現。藉由流式細胞儀測量eGFP及DsRed表現。所顯示的數據為n=2生物重複數的模擬及n=3的生物重複數的所有其他條件的平均值±SEM。未經配對的雙側t檢定的* P=0.0147。
圖14. CircRNA優化不會對circRNA合成產生不利影響。(A)從1 μg體外轉錄模板開始,連續circRNA優化對總RNA產量的影響。(B)連續circRNA優化對circRNA百分比的影響,定義為在以RNaseR消化後剩餘RNA的百分比。
圖15. 環狀RNA攝入對髓樣細胞具有專一性。a,circRNA攝入測量實驗模型的示意圖。b,在培養2小時後,藉由流式細胞儀測量來自人類週邊血液的不同造血細胞亞群中的circRNA及linRNA攝入。c,人類髓樣免疫亞群在以螢光標記的circRNA培養不同的時間點後的螢光強度(n = 3,條形代表SEM)。d,人類巨噬細胞在以標記的circRNA(濃度遞增)及miRNA(最後一張影像)培養2小時後的共軛焦顯微鏡。e,小鼠(頂部)及人類(底部)細胞株在circRNA攝入後螢光標記細胞的百分比(n = 5,條形代表SEM)。
圖16. 環狀RNA攝入為一種快速且活躍的過程。a,RAW264細胞在以流式細胞儀測量circRNA攝入的時程分析(n = 5,條形代表SEM)。b,RAW264細胞在培養24小時後的circRNA攝入飽和曲線。對數及線性刻度用於顯示準確的觀察(n = 3,條形代表SEM)。c,競爭分析顯示RAW264細胞在以cy5-circRNA對照組標準化後circRNA攝入的倍數變化(n = 3,條形代表SEM)。d,RAW264細胞在以濃度遞增的螢光標記circRNA培養或lipofectamine轉染後,螢光強度與溫度效應的比較(左側為代表性樣品且右側為定量匯總)(n = 4,條形代表SEM,單一樣品t及Wilcoxon檢定,** P< 0.001、**** P< 0.0001)。e,濃度遞增的疊氮化鈉在RAW264細胞中對circRNA攝入的影響(左側為代表性樣品且右側為定量匯總)(n = 3,條形代表SEM)。在c及e中應用單向ANOVA及隨後的Tukey氏檢定,* P< 0.05、** P< 0.01、*** P< 0.001、**** P< 0.0001。將 P值< 0.05視為組間具有顯著差異。NS,不顯著。
圖17. 環狀RNA被轉譯並呈現於免疫系統中。a,在不同時間點轉染(左)及攝入(右)circNanoLuc後,測量RAW264細胞中的奈米螢光素酶強度(n = 3,條形代表SEM)。b,MutuDC細胞在以cirOVA、Ova蛋白、或SIINFEKL對照培養24小時後,與對照組相比,SIINFEKL結合至MHC I類抗體的H-2Kb的螢光強度(n = 4,條形代表最小值及最大值)。c,比較了與以Ova蛋白、SIINFEKL、及circOVA或非可轉譯circRNA對照組培養的MutuDC細胞共培養的OT-I細胞的抗原專一性T細胞增生水平的增生分析(右側為代表性樣品且左側為定量匯總)(n = 4,條形代表SEM)。d,使用及不使用CART的circOVA滴定,以確定誘導抗原專一性T細胞增生所需的最小量。e,免疫受體及細胞激素的qRT-PCR定量。f,分泌的發炎性細胞激素的流式細胞儀定量,以及g,與MutuDC細胞中的CpG相比,在circOVA攝入或轉染後活化標記物的流式細胞儀定量(n = 4,條形代表最小值及最大值)。在b及g中應用單向ANOVA及隨後的Tukey氏檢定,* P< 0.05、** P< 0.01、*** P< 0.001、**** P< 0.0001。將 P值< 0.05視為組間具有顯著差異。NS,不顯著。
圖18. 環狀RNA活體內遞送趨向性及先天辨識性。a,活體內circRNA遞送及監控的示意圖。以皮下注射方式遞送50 μg的AF488-circRNA,在遞送後6及24小時收集血清樣品。b,攝入circRNA的螢光陽性先天細胞亞群的絕對分率(n = 5,條形代表最小值及最大值)。c,先天細胞亞群比例的定量,以及d,在皮下注射遞送螢光標記的circRNA後24小時,淋巴結的不同先天免疫細胞亞群中活化標記物CD86的螢光強度(n = 5,條形代表最小值及最大值)。e,藉由Luminex測量circRNA遞送後血清中細胞激素的時程分析(n =5)。在b-e中應用單向ANOVA及隨後的Tukey氏檢定,* P< 0.05、** P< 0.01、*** P< 0.001、**** P< 0.0001。
圖19. 不同遞送途徑對circRNA的輔助作用。a,通過不同遞送途徑的 circRNA 免疫策略與免疫反應監控的示意圖。在給予加強針的b,7天後或c,30天後的肺、脾及淋巴結中Ova專一性T細胞反應的百分比(n = 5,條形代表最小值及最大值)。d,在加強針後第30天肺中CD69+及CD69+CD103+ CD8 TRM的頻率(作為抗原專一性CD8 T細胞的百分比)(n = 5,條形代表最小值及最大值)。在b-e中應用單向ANOVA及隨後的Tukey氏檢定,n = 5,* P< 0.05、** P< 0.01、*** P< 0.001、**** P< 0.0001。將 P值< 0.05視為組間具有顯著差異。NS,不顯著。
圖20. 活體內環狀RNA遞送活化T細胞專一性反應。a,免疫策略與後天免疫反應的監控示意圖。b,在第42天肺及脾中Ova專一性T細胞反應的百分比(代表性樣品)。c,在第7天及第42天肺及脾中Ova專一性T細胞的定量(n = 5,條形代表最小值及最大值)。d,藉由ELISA測量血清中抗Ova IgG抗體的時程分析(n = 5,條形代表最小值及最大值)。在c及d中應用單向ANOVA及隨後的Tukey氏檢定,* P< 0.05、** P< 0.01、*** P< 0.001、**** P< 0.0001。
圖21. circRNA在不同細胞株中的攝入驗證。a,用於定義髓樣人類細胞群在攝入circRNA後的閘控策略。b,對應於圖1c(代表性樣品)的人類免疫細胞亞群在circRNA攝入後螢光強度變化的直方圖。c,人類PBMC衍生的巨噬細胞中濃度遞增的circRNA及linRNA的流式細胞儀定量。d,人類典型單核球以劑量及時間依賴性方式攝入circRNA(n = 4,條形代表SEM)。e,J774及RAW細胞以劑量依賴性方式攝入circRNA(n = 4,條形代表SEM)。f,人類肝及肺細胞株(代表性樣品)在circRNA攝入後螢光強度變化的直方圖。
圖22. circRNA及linRNA攝入。a,circRNA攝入在低溫下的人類肝及肺細胞株中被抑制(n = 3,條形代表SEM)。b,ATP抑制劑在RAW264細胞中負向抑制circRNA攝入(n =4,條形代表SEM)。c,成熟訊號在RAW264細胞中促進circRNA攝入(n = 3,條形代表SEM)。d,與RAW264細胞在攝入或轉染後的mRNA相比,circRNA的qRT-PCR定量(n = 3,條形代表SEM)。e,與藉由流式細胞儀測量的不同細胞類型中的mRNA相比,於circRNA攝入的代表性示例。f,在RAW264細胞中不同濃度的cy5-circRNA或pHrodo-circRNA之間的circRNA攝入測量比較的代表性樣品。
圖23. circRNA及linRNA轉譯。a,在HepG2細胞中測量的奈米螢光素酶強度在攝入編碼奈米螢光素酶蛋白的mRNA(左)或circRNA(右)後顯示出類似的轉譯效率。b,藉由西方墨點法及ELISA檢測以circOVA轉染293T後的卵白蛋白。c,RAW264細胞在circRNA攝入後螢光標記細胞的百分比(n = 4,條形代表SEM)。
圖24.  在活體外遞送circRNA後的轉錄體分析。a,按條件分組的正規化及轉化的轉錄體計數的PCA分析:未經處理、circRNA及CART-cirRNA(n=2)。b,circRNA攝入與以CART轉染circRNA之間基因表現的log2倍數變化的火山圖。c,正規化表現數據的熱圖,顯示與未經處理細胞相比,在circRNA攝入或以CART轉染circRNA後差異調節的基因。在d,circRNA攝入及e,以CART轉染circRNA後,主要差異表達基因的功能分析及其等與生物學概念(GO術語)的連結。
圖25. 在活體外遞送circRNA後的轉錄體分析。a,按條件分組的正規化及轉化的轉錄體計數的PCA分析:未經處理、circRNA及CART-circRNA(n = 2)。b,circRNA攝入與以CART轉染circRNA之間基因表現的log2倍數變化的火山圖。c,正規化表現數據的熱圖,顯示與未經處理細胞相比,在circRNA攝入或以CART轉染circRNA後差異調節的基因。在d,circRNA攝入及e,以CART轉染circRNA後,主要差異表達基因的功能分析及其等與生物學概念(GO術語)的連結。
圖26. 使用及不使用CART對circRNA免疫的先天反應。a,在皮下注射遞送circRNA、以CART遞送circRNA(CART-circOVA)、及單獨的CART後24小時,引流腹股溝LN中先天細胞亞群的頻率。b,circRNA+細胞的頻率佔給定細胞亞群的百分比(表明circRNA攝入)。c,四個免疫組中先天細胞亞群的CD86表現。
圖27. 不同遞送途徑對circRNA的輔助作用。a,用於區分在遞送circRNA後的後天免疫亞群的閘控策略。b,在藉由不同遞送途徑的circRNA免疫加強針後第30天,藉由ELISA測量血清中的抗Ova IgG及c,IgA抗體(n = 5,條形代表最小值及最大值)。d,肺中Ova專一性TRM細胞(閘控為CD69+)的百分比(佔CD45+活細胞的百分比)。e,第I類四聚體+CD8 T細胞的頻率。與Poly(IC)相比,在鼻內遞送circRNA的加強針後第30天,藉由ELISA測量血清中,f,抗853 Ova IgG(顯示相互的EC50滴度)以及g,IgA抗體(顯示終點滴度)(n = 5,條形代表最小值及最大值)。在b~e中應用單向ANOVA及隨後的Tukey氏檢定,n = 5。若未發現顯著差異,則不呈現任何值。
圖28. 在以circRNA免疫後的後天免疫反應。a,用於通過免疫實驗測量抗原專一性T細胞反應的閘控策略。b,以裸circOVA進行鼻內免疫後,肺中Ova專一性T細胞的百分比(n = 5,條形代表SEM)。c,在引發後第7天週邊血液中Ova專一性T細胞的百分比(n = 4,條形代表SEM)。d,在引發後第7天及在加強針後第21天的SLEC及MPEC亞群的比例(n = 5,條形代表最小值及最大值)。
圖29. a,免疫策略與接種B16-F10-OVA細胞後的腫瘤體積監控的示意圖。b,22天內的腫瘤體積監控(n = 5,條形代表SEM)。
圖30. 在以circOVA免疫後的後天免疫反應。a,來自對照組小鼠及接種circOVA疫苗小鼠的代表性生物發光影像及b,腫瘤定量(n = 4,條形代表SD)。應用未經配對t檢定的*p<0.05。
TW202345862A_112110067_SEQL.xml

Claims (51)

  1. 一種組合物,其包含:電荷可變可釋放轉運體系統(CART)與包含蛋白質編碼序列之環狀RNA分子的複合物。
  2. 如請求項1之組合物,其中該蛋白質編碼序列可操作地連接到內部核糖體進入位點(IRES)序列。
  3. 如前述請求項中任一項之組合物,其中該CART為油基(O)與壬烯基取代(N)的碳酸鹽單體的1:1混合物,隨後為α-胺基酯單體(A)嵌段。
  4. 如請求項3之組合物,其中該CART包含6個壬烯基與6個油基碳酸鹽單元及9個陽離子胺基酯單元的嵌段長度。
  5. 如前述請求項中任一項之組合物,其中該IRES序列為病毒序列;且其中該蛋白質編碼序列編碼非病毒蛋白質。
  6. 一種組合物,其包含:環狀RNA分子,其包含可操作地連接到蛋白質編碼序列的內部核糖體進入位點(IRES)序列、5’ UTR、及3’ UTR; 其中該IRES序列為病毒序列;以及 其中該蛋白質編碼序列編碼非病毒蛋白質。
  7. 如請求項6之組合物,其中該5’ UTR為ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUGUCG或AGCGUAACCUCCAUCCGAGUUGCAAGAGAGGGAAACGCAGUCUC。
  8. 如請求項6之組合物,其中該3’ UTR為β-球蛋白3’ UTR或截斷的β-球蛋白3’ UTR。
  9. 一種組合物,其包含:環狀RNA分子,其包含可操作地連接到蛋白質編碼序列的內部核糖體進入位點(IRES)序列,其中該IRES序列包含針對該IRES的結構域之間的非鹼基配對之連接子區的鎖核酸(LNA); 其中該IRES序列為病毒序列;以及 其中該蛋白質編碼序列編碼非病毒蛋白質。
  10. 如請求項9之組合物,其中該IRES為iCVB3,且該LNA針對iCVB3結構域I與II之間的非鹼基配對的連接子區。
  11. 如前述請求項中任一項之組合物,其中該IRES為第1型IRES。
  12. 如前述請求項中任一項之組合物,其中該IRES為腸病毒IRES。
  13. 如前述請求項中任一項之組合物,其中該IRES為人類鼻病毒(HRV)IRES。
  14. 如前述請求項中任一項之組合物,其中該IRES為表7中列出的任一個IRES。
  15. 如前述請求項中任一項之組合物,其中該IRES為下列IRES中的任一個:iEMCV、iHCV、iCVB5、iSwineVesicular、iHRV-A2、iHRV-C3、iHRV-C11、iCVB1、iPV2、iHRV-B17、iEchoV-E15、iEV71、iHRV-A9、iSiminanV4、iEV-D94、iSimianA5、iPV3、iHRV-C54、iHRV-A100、iHRV-B37、iHRV-B4、iHRV-B92、iHRV-B3、iHRV-A1、iEV107、或其片段或衍生物。
  16. 如前述請求項中任一項之組合物,其中該IRES為下列IRES中的任一個:iEV-B83、iHRV-A57、iHRV-B35、iHRV-B4、iEV-D68、iHRVB_R93、iHRV-B5、iHRVB-B52、iHRVB-B93、iHRV-B84、iHRV-B83_SC2220、iHRV-B72、iHRV-B69、iHRVB_SC0739、iHRV-B91、iHRV-B42、iHRV-B6、iHRV-B83、iHRV-B48、iHRV-B99、iHRV-B79、iHRV-B97、iHRV-B27、iHRVB_3039、iHRVB-B14、iCosV-B1、或其片段或衍生物。
  17. 如前述請求項中任一項之組合物,其中該IRES為iCVB3、iHRV-B3、或其片段或衍生物。
  18. 如前述請求項中任一項之組合物,其中該IRES為合成IRES。
  19. 如前述請求項中任一項之組合物,其中該合成IRES序列包含適體。
  20. 如前述請求項中任一項之組合物,其中該合成IRES序列包含適體及第二適體。
  21. 如請求項19至20中任一項之組合物,其中該適體為野生型適體或突變體適體。
  22. 如請求項21之組合物,其中該適體經修飾以具有延伸的幹區。
  23. 如請求項19至22中任一項之組合物,其中該適體定位在IRES的二級結構內,以便在空間上靠近IRES負責轉譯起始的部件。
  24. 如請求項19至23中任一項之組合物,其中該適體不中斷IRES的天然eIF4G結合位點,且不中斷IRES內的天然GRNA四環。
  25. 如請求項19至24中任一項之組合物,其中該適體為eIF4G結合適體。
  26. 如請求項25之組合物,其中該eIF4G結合適體由SEQ ID NO: 33143的序列編碼。
  27. 如前述請求項中任一項之組合物,其中該環狀RNA分子包含至少一個2-硫尿苷(2ThioU)或至少一個2′-O-甲基胞苷(2OMeC)。
  28. 如前述請求項中任一項之組合物,其中該組合物為醫藥組合物。
  29. 一種核酸,其編碼如請求項1至27中任一項的環狀RNA分子。
  30. 一種宿主細胞,其包含如請求項1至28中任一項之組合物或如請求項29之核酸。
  31. 一種在細胞中生產蛋白質之方法,該方法包含在一定條件下使細胞與如請求項1至28中任一項之組合物或如請求項29之核酸接觸,由此環狀RNA的蛋白質編碼核酸序列被轉譯且蛋白質在細胞中生產。
  32. 一種在活體外生產蛋白質之方法,該方法包含在一定條件下使無細胞萃取物與如請求項1至28中任一項之環狀RNA分子或如請求項29之核酸接觸,由此環狀RNA的蛋白質編碼核酸序列被轉譯且蛋白質被生產。
  33. 一種由如請求項31至32中任一項之方法生產的蛋白質。
  34. 一種將蛋白質遞送到受試者的方法,其包含: 對受試者投予如請求項1至5中任一項之組合物。
  35. 如請求項34之方法,其中該蛋白質為治療性蛋白質。
  36. 如請求項35之方法,其中該投予治療或預防該受試者的疾病或病症。
  37. 如請求項34至36中任一項之方法,其中該遞送方式為腹腔注射或靜脈注射。
  38. 如請求項34至37中任一項之方法,其中該受試者為人類或非人類動物。
  39. 一種在受試者中表現蛋白質之方法,其包含對該受試者投予電荷可變可釋放轉運體系統(CART)複合的環狀RNA,其中該環狀RNA分子包含可操作地連接到內部核糖體進入位點(IRES)序列的蛋白質編碼序列。
  40. 如請求項39之方法,其中該蛋白質在該受試者的免疫細胞中表現。
  41. 一種治療受試者之癌症的方法,包含 投予一組合物,該組合物包含:a)電荷可變可釋放轉運體系統(CART)與環狀RNA分子的複合物;以及b)抗原。
  42. 如請求項41之方法,其中該抗原為腫瘤抗原。
  43. 如請求項41或42之方法,其中該投予在該受試者中誘導基於抗原專一性T細胞的細胞免疫。
  44. 一種在有需求之受試者中誘導免疫反應的方法,其包含對該受試者投予一組合物,該組合物包含電荷可變可釋放轉運體系統(CART)與環狀RNA分子之複合物。
  45. 如請求項44之方法,其中該環狀RNA分子包含蛋白質編碼序列。
  46. 如請求項45之方法,其中該蛋白質編碼序列編碼抗原。
  47. 如請求項45之方法,其中該蛋白質編碼序列編碼治療性蛋白質。
  48. 如請求項44至47中任一項之方法,其中該免疫反應為T細胞反應。
  49. 如請求項39至48中任一項之方法,其中該環狀RNA分子與該CART以1:10的電荷比複合。
  50. 如請求項39至49中任一項之方法,其中該CART將該環狀RNA分子引導到免疫細胞。
  51. 如請求項50之方法,其中該免疫細胞為巨噬細胞、樹突細胞及/或單核球。
TW112110067A 2022-03-17 2023-03-17 利用重組環狀rna改善蛋白質轉譯的組合物及方法 TW202345862A (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US202263320952P 2022-03-17 2022-03-17
US63/320,952 2022-03-17
US202263353110P 2022-06-17 2022-06-17
US63/353,110 2022-06-17
US202263423641P 2022-11-08 2022-11-08
US63/423,641 2022-11-08
US202363449409P 2023-03-02 2023-03-02
US63/449,409 2023-03-02
US202363450272P 2023-03-06 2023-03-06
US63/450,272 2023-03-06

Publications (1)

Publication Number Publication Date
TW202345862A true TW202345862A (zh) 2023-12-01

Family

ID=88024504

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112110067A TW202345862A (zh) 2022-03-17 2023-03-17 利用重組環狀rna改善蛋白質轉譯的組合物及方法

Country Status (2)

Country Link
TW (1) TW202345862A (zh)
WO (1) WO2023178294A2 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109963564B (zh) * 2016-07-27 2022-08-12 利兰斯坦福初级大学董事会 用于核酸递送的解体型细胞穿透性复合物
WO2021263124A2 (en) * 2020-06-25 2021-12-30 The Board Of Trustees Of The Leland Stanford Junior University Genetic elements driving circular rna translation and methods of use

Also Published As

Publication number Publication date
WO2023178294A2 (en) 2023-09-21
WO2023178294A3 (en) 2023-10-26
WO2023178294A9 (en) 2024-02-08

Similar Documents

Publication Publication Date Title
US11685924B2 (en) Genetic elements driving circular RNA translation and methods of use
US20210198688A1 (en) Circular RNA For Translation In Eukaryotic Cells
KR102666695B1 (ko) Rna를 편집하기 위한 방법 및 조성물
TW202043249A (zh) 編輯rna的方法和組合物
CA3178670A1 (en) Programmable nucleases and methods of use
KR20240024171A (ko) 재조합 원형 rna로부터 개선된 단백질 번역을 위한 조성물 및 방법
AU2022331424A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
Chen et al. A flexible, efficient, and scalable platform to produce circular RNAs as new therapeutics
US20230383293A1 (en) Modified functional nucleic acid molecules
US20240191280A1 (en) Enhanced guide nucleic acids and methods of use
TW202345862A (zh) 利用重組環狀rna改善蛋白質轉譯的組合物及方法
WO2023212677A2 (en) Identification of tissue-specific extragenic safe harbors for gene therapy approaches
Chen Principles of Circular RNA Translation and Immunity
CN117561333A (zh) 用于改善来自重组环状rna的蛋白翻译的组合物和方法
WO2023019243A1 (en) Compositions comprising a variant cas12i3 polypeptide and uses thereof
WO2024107902A2 (en) Effector proteins, compositions, systems and methods of use thereof
WO2024107665A1 (en) Effector proteins, compositions, systems and methods of use thereof
JP2024518413A (ja) 修飾ヌクレアーゼ
WO2022132773A1 (en) Chemically modified crispr-cas13 guide rnas
Daròs Arnau et al. Recombinant RNA production