KR20230153418A

KR20230153418A - 합성 리보핵산(rna)으로부터 단백질 발현을 증가시키기 위한 조작된 발현 작제물

Info

Publication number: KR20230153418A
Application number: KR1020237032938A
Authority: KR
Inventors: 캄비즈 모우사비
Original assignee: 리보즈, 엘엘씨
Priority date: 2021-02-25
Filing date: 2022-02-25
Publication date: 2023-11-06
Also published as: US20240175048A1; CN116917475A; AU2022227003A9; WO2022182976A1; EP4298216A1; JP2024509123A; AU2022227003A1; IL305421A; CA3209374A1

Abstract

본 개시내용은 합성 mRNA의 5' 및/또는 3' 비번역 영역(UTR)에서 번역 향상 요소를 이용함으로써 세포에서 단백질 발현을 향상시키는 것에 관한 것이다. 5' UTR은 프로모터, 미니-인핸서 서열, 및 Kozak 서열을 포함하는 반면, 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로 폴리아데닌 꼬리를 포함한다. 인공 5' 및 3' UTR은 단백질 발현을 증가시키고, 특정 예에서, 변형된 뉴클레오사이드, 마이크로RNA 부위, 또는 면역-회피 인자를 포함하지 않는다.

Description

합성 리보핵산(RNA)으로부터 단백질 발현을 증가시키기 위한 조작된 발현 작제물

관련 출원에 대한 상호 참조

본 출원은 2021년 2월 25일자로 출원된 미국 특허 가출원 제63/153,877호를 우선권으로 주장하며, 이의 전체 내용은 그 전체가 본 명세서에 참조에 의해 원용된다.

서열 목록에 대한 참조

본 출원과 관련된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되고, 본 명세서에 명세서 내에 참조에 의해 원용된다. 서열 목록을 포함하는 텍스트 파일의 명칭은 P183-0010PCT_ST25.txt이다. 텍스트 파일은 26.9 KB이고, 2022년 2월 24일에 생성되었고, EFS-Web을 통해 전자적으로 제출된다.

본 개시내용의 분야

본 개시내용은 코딩 서열에 인접하는 인공 5' 및/또는 3' 비번역 영역(UTR)을 갖는 조작된 발현 작제물을 제공한다. 5' UTR은 프로모터, 미니-인핸서 서열, 및 Kozak 서열을 포함하는 반면, 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로 폴리아데닌 꼬리를 포함한다. 인공 5' 및 3' UTR은 단백질 발현을 증가시키고, 특정 예에서, 변형된 뉴클레오사이드, 마이크로RNA 부위 또는 면역-회피 인자를 포함하지 않는다.

단백질 발현에 영향을 미치는 종래의 기존 방법은 문제로 가득 차 있다. 예를 들어, 외인성으로 도입된 데옥시리보핵산(DNA)이 일부 빈도로 숙주 세포 게놈 DNA에 통합되는 것이 가능하다. 이러한 통합은 숙주 세포 게놈 DNA에 대한 변경 및/또는 손상을 초래한다. 대안적으로, 세포에 도입된 이러한 외인성 DNA는 딸 세포(외인성 DNA가 염색체에 통합되었는지 여부에 관계없이) 또는 자손에 의해 유전될 수 있다. 또한, 숙주 게놈으로 적절하게 전달하더라도 및 숙주 게놈으로의 손상 또는 통합이 없더라도, 인코딩된 단백질이 DNA 가닥으로부터 생산되기 전에 여러 단계가 일어나야 한다. 일단 세포 내부로 들어가면, DNA는 RNA로 전사되는 핵으로 수송되어야 한다. DNA로부터 전사된 RNA는 단백질로 번역되는 세포질로 들어가야 한다. 트랜스펙션된 DNA에서 생산된 단백질까지의 이러한 다중 프로세싱 단계는 기능적 단백질의 최종 생성 전에 지연 시간을 초래하며, 각 단계는 세포에 대한 오류 및 손상의 기회를 나타낸다. 또한, 트랜스펙션된 DNA가 발현되지 않거나 원하는 용도에 필요한 합리적인 속도 또는 농도로 발현되지 않을 수 있기 때문에 종종 세포에서 원하는 단백질 발현 수준을 얻는 것이 어렵다. 이는 DNA가 1차 세포 또는 변형된 세포주에 도입될 때 특히 문제가 될 수 있다.

메신저 RNA(mRNA)는 또한 세포의 단기 변형을 가능하게 하는 가능성으로 조사되었다. 일종의 가역적 유전자 요법으로서 mRNA를 사용하는 이점은 일시적 발현 및 비-형질전환 특성을 포함한다. mRNA는 발현되기 위해 핵에 들어갈 필요가 없고, 또한 숙주 게놈에 통합될 수 없으므로, 종양발생의 위험이 제거된다. mRNA로 달성 가능한 트랜스펙션 속도는 비교적 높고, 많은 세포 타입에 대해 심지어 >90%이므로, 트랜스펙션된 세포를 선택할 필요가 없다.

치료제로서의 mRNA 및 백신으로서의 mRNA 분야에 대한 최근의 상당한 발전에도 불구하고, 당 분야에서는 mRNA를 사용하여 단백질 발현 수준을 증가시키기 위한 추가 연구가 여전히 요구되고 있다.

본 개시내용의 목적은 인코딩된 단백질의 발현 수준을 증가시키는 조작된 리보핵산(예를 들어, mRNA)을 제공하는 것이다.

본 개시내용의 또 다른 목적은 인코딩된 단백질의 발현 수준을 증가시키는 최소 서열을 제공하는 것이다.

이를 위해, 본 개시내용은 특정 조작된 발현 작제물(EEC)이 인코딩된 단백질의 발현 수준을 증가시키는 것을 제공한다. EEC는 코딩 서열의 측면에 배치된 인공 5' 및/또는 3' 비번역 영역(UTR)을 갖는다. 5' UTR은 프로모터, 미니-인핸서 서열(CAUACUCA, 본 명세서), 및 Kozak 서열을 포함하는 반면, 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로, 폴리아데닌 꼬리(폴리A 꼬리)를 포함한다. 특정 예에서, 5' UTR은 작동 세그먼트를 생성하기 위해 개시 코돈에 작동 가능하게 연결된다. 본 명세서의 특정 예에서, 3' UTR은 또한 정지 코돈을 포함하는 것으로 도시된다.

조작된 5' UTR과 관련하여, 특정 예에서, 프로모터는 박테리오파지 T7 프로모터로부터 유래되고 서열 GGGAGA를 갖는다. 특정 예에서, Kozak 서열은 GCCRCC를 포함하며, 여기서, R은 A 또는 G이다. Kozak 서열은 또한 개시 코돈에 작동 가능하게 연결되어 서열 GCCRCC-개시(예를 들어, GCCRCCAUG)를 생성할 수 있다.

5' UTR의 특정 실시형태는 5'로부터 3'로, 미니-T7 프로모터, 미니-인핸서 서열(CAUACUCA, 본 명세서), 및 Kozak 서열을 포함하여, GGGAGACAUACUCAGCCACC(서열번호 2) 또는 GGGAGACAUACUCAGCCGCC(서열번호 3)를 생성한다. 개시 코돈의 첨가는 GGGAGACAUACUCAGCCACCAUG(서열번호 38) 및 GGGAGACAUACUCAGCCGCCAUG(서열번호 39)를 제공한다.

특정 예에서, 이러한 최소 5' UTR은 30개 미만의 뉴클레오타이드를 갖는다. 특정 예에서, 이러한 최소 5' UTR은 20 또는 23개의 뉴클레오타이드를 갖는다.

조작된 3' UTR과 관련하여, 특정 예에서, 스페이서는 [N_1-3]AUA 또는 [N_1-3]AAA를 포함한다. 보다 특정한 예에서, 스페이서는 UGCAUA 또는 UGCAAA를 포함한다. 예시적인 스템 루프 구조는 CCUC 및 GAGG와 같은 서열을 하이브리드화함으로써 형성된다. 특정 예에서, 하이브리드화 서열들 사이에 형성된 루프 구조는 길이가 7 내지 15개의 뉴클레오타이드이다. 루프 세그먼트의 예시적인 서열은 UAACGGUCUU(서열번호 34)를 포함한다. 3' UTR 서열의 일부로서 포함될 때, 예시적인 정지 코돈은 UAA, UAG, 및 UGA를 포함한다.

특정 예에서, 이러한 최소 3' UTR은 30개 미만의 뉴클레오타이드를 갖는다.

스템 루프와 관련하여, 스템 루프 서열의 순서에 관계없이 본 명세서에 개시된 EEC에서 증가된 단백질 발현이 관찰되며, 이는 2차 구조가 중요할 수 있고, 반드시 5'에서 3' 배향의 서열이 아닐 수 있음을 나타낸다. 조작된 3' UTR은 폴리A 꼬리를 추가적으로 포함할 수 있다.

일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열 CAUACUCA를 포함하는 5' UTR을 포함한다.

일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' UTR을 포함한다. 5' UTR은 또한 개시 코돈과 함께 제시되어 서열번호 38 및 서열번호 39를 제공할 수 있다.

일 양태에서, 본 개시내용은 서열번호 4, 5, 6, 7, 8 또는 9를 포함하는 3' UTR을 포함하는 EEC를 제공한다.

일 양태에서, 본 개시내용은 서열번호 10, 11 또는 12를 포함하는 3' UTR을 포함하는 EEC를 제공한다.

일 양태에서, 본 개시내용은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21을 포함하는 3' UTR을 포함하는 EEC를 제공한다.

서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및 21 각각은 폴리A 꼬리를 포함하도록 작제될 수 있다.

일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열 CAUACUCA를 포함하는 5' UTR 및 서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및/또는 21을 포함하는 3' UTR을 포함한다.

일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' UTR 및 서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및/또는 21을 포함하는 3' UTR을 포함한다.

일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열번호 38 또는 서열번호 39를 포함하는 5' UTR 및 서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및/또는 21을 포함하는 3' UTR을 포함한다.

특정 실시형태에서, 본 명세서에 개시된 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않는다. 특정 실시형태에서, 본 명세서에 개시된 EEC는 임의의 마이크로RNA 결합 부위를 포함하지 않는다. 특정 실시형태에서, 본 명세서에 개시된 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않고 임의의 마이크로RNA 결합 부위를 포함하지 않는다.

개시된 EEC 내에서, 조작된 5' 및 3' UTR은 오픈 리딩 프레임 내에서 코딩 서열의 측면에 위치한다. 본 개시내용에서 제공된 데이터는 트랜스펙션 방식과 무관하게, 다양한 세포 타입(예를 들어, 림프계 및 부착성 및 현탁 배아 신장 세포)에서 녹색 형광 단백질(GFP), 인터루킨-2(IL-2) 및 POU5F1(OCT3/4)의 증가된 발현을 보여준다.

본 명세서에 개시된 EEC는 다수의 상이한 목적을 위해 다양한 단백질의 발현을 증가시키기 위해 이용될 수 있다. 예시적인 목적은 치료제 및 백신의 사용을 포함한다.

도면들 중 일부 도면은 색상으로 더 잘 이해될 수 있다. 출원인은 도면의 컬러 버전을 원래 제출의 일부로 간주하고 이후 절차에서 컬러 버전을 제시할 권리를 보유한다.
도 1은 생체내에서 단백질 발현을 증가시키도록 설계된 EEC의 개략도를 도시한다. EEC는 단백질 발현을 증가시키기 위해 EEC 내에 여러 모듈을 포함한다. 5' UTR 내에 위치한 모듈은 3개의 모듈로 나뉜다: 프로모터(예를 들어, T7 프로모터 헥사머)를 나타내는 모듈 1("M1"); 독특한 번역 인핸서(CAUACUCA, 본 명세서에 기재 됨)를 나타내는 모듈 2("M2"); 및 Kozak 공통 서열인 모듈 3("M3"). 도시된 예시적인 3' UTR은 또한 정지 코돈, 스페이서, 및 스템-루프 세그먼트를 포함하는 3개의 세그먼트로 분할된다. 폴리A 꼬리가 또한 포함될 수 있다.
도 2는 x-축에 GFP 강도(FL1-H)를 표시하고 y-축에 세포 수를 표시하는 유세포 분석 히스토그램을 도시한다. EXPI293 세포는 본 명세서에 기재된 바와 같은 본 발명의 5' UTR(서열번호 2) 및 3' UTR(서열번호 10) 서열을 보유하고 이의 오픈 리딩 프레임(서열번호 55 및 56 참조) 내에 GFP 코딩 서열을 갖는 증가하는 양의 EEC로 트랜스펙션되었다. 도시된 바와 같이, GFP 신호 포화는 트랜스펙션 24시간 후에 0.4 피코몰(pmole)(100 ng)의 EEC에 도달한다.
도 3a 및 도 3b는 트랜스펙션 3시간 후(도 3a) 및 트랜스펙션 24시간 후(도 3b)에 GFP-인코딩 EEC 5' UTR 변이체에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프를 도시한다. 유세포 분석 실험의 결과는 또한 막대 그래프로 제공된다. EXPI293 세포는 등몰량의 GFP-인코딩 EEC 5' UTR 변이체, RNA 없음(음성 대조군) 5' UTR mRNA 없음, M1 및 M3 모듈만 5' UTR, 및 M1, M2 및 M3 모듈 5' UTR(서열 번호: 2)로 트랜스펙션되었다.
도 4a 및 도 4b는 트랜스펙션 3시간 후(도 4a) 및 트랜스펙션 24시간 후(도 4b)에 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프를 나타낸다. 유세포 분석 실험의 결과는 또한 막대 그래프로 제공된다. 등몰량의 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체로 트랜스펙션된 EXPI293 세포:
(i) RNA 없음(음성 대조군);
(ii) 3' UTR 단독 mRNA(GGGAGAAUG(ORF)의 전사를 가능하게 하는 UTR의 기본 형태를 제외하고는 5' UTR이 없는 3' UTR에 대한 UGCAUACCUCUAACGGUCUUGAGG(서열번호 10) 또는 UAAUGCAUACCUCUAACGGUCUUGAGG(서열번호 13));
(iii) M3 단독 5' UTR + 3' UTR(5' UTR로서 UAAUGCAUACCUCUAACGGUCUUGAGG(서열번호 13) 및 3' UTR로서 GGGAGAGCCACCAUG(ORF)(서열번호 63)); 및
(iv) M1, M2 및 M3 5' UTR(서열번호 2) + 3' UTR(서열번호 10). 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 EEC를 수용하는 세포는 가장 높은 GFP 강도를 나타낸다는 점에 유의한다.
도 5는 본 명세서에 개시된 EEC를 사용하여 발현된 3개의 상이한 타입의 단백질을 예시한다: 세포질, 소기관(즉, 핵 구획) 및 세포외 구획(즉, 분비 단백질)에서 단백질의 표적화된 발현.
도 6a 내지 도 6c는 GFP 단백질을 발현하는 HEK293 세포를 도해한다. (도 6a)는 GFP 강도(x-축) 및 HEK293 세포 내로 트랜스펙션된 GFP-인코딩 EEC의 양이 증가함에 따라 발생하는 검출에서의 이동을 나타내는 유세포 분석 그래프를 도시한다("mRNA 없음"으로 표지된 패널에는 GFP-인코딩 EEC mRNA가 없다). 다른 패널은 패널의 표제에 의해 지시된 바와 같은 0.2 피코몰의 GFP-인코딩 EEC mRNA; 0.4 피코몰의 GFP-인코딩 EEC mRNA, 1.0 피코몰의 GFP-인코딩 EEC mRNA, 2.0 피코몰의 GFP-인코딩 EEC mRNA 및 4.0 피코몰의 GFP-인코딩 EEC mRNA를 도시하고, (도 6b)는 GFP-인코딩 EEC의 증가하는 투여에 비해 GFP 양성 세포의 백분율 증가에 관한 도 6a의 유세포 분석 그래프로부터의 결과를 해석하는 차트를 도시한다. 도 6b의 차트를 준비하기 위해, GFP에 대해 양성인 HEK293 세포의 백분율은 y-축에 표시되며, GFP-인코딩 EEC mRNA의 양은 x-축에 표시된다. 이와 같이, 도 6b는 GFP-인코딩 EEC mRNA가 증가함에 따라 GFP 양성 세포의 증가된 백분율을 도시한다. (도 6c)는 GFP 발현에 양성인 세포에서 트랜스펙션된 GFP-인코딩 EEC의 수준 증가에 따른 중앙 GFP 강도의 비례 증가에 관한 도 6a의 유세포 분석 그래프로부터의 결과를 해석한다. 도 6c의 차트를 준비하기 위해, GFP를 발현하는 세포로부터의 중앙 GFP 강도는 y-축에 표시되며(FLI-H), GFP-인코딩 EEC mRNA의 양은 x-축에 표시된다. 이와 같이, 도 6c는 GFP-인코딩 EEC mRNA가 증가함에 따라 중앙 GFP 강도의 비례 증가를 예시한다.
도 7a 내지 도 7c는 GFP-인코딩 EEC 변이체로의 트랜스펙션 후 GFP 단백질을 발현하는 HEK293 세포를 도시한다. (도 7a)는 0.4 피코몰의 GFP-인코딩 EEC 변이체로 트랜스펙션된 세포의 GFP 강도(x-축)를 오버레이하는 히스토그램을 예시한다. (도 7b)는 세포가 1 피코몰의 GFP-인코딩 EEC 변이체로 트랜스펙션된다는 점을 제외하고는 (도 7a)와 유사하다. (도 7c)는 등몰 수준의 GFP-인코딩 EEC 변이체(n=2)로 트랜스펙션된 HEK293 세포의 중앙 GFP 강도를 나타내는 막대 그래프를 도시한다. 변이체는 5' UTR만(서열번호 2); 3' UTR만(도 4b의 설명에서 보다 상세히 기재된 바와 같음); 5' 및 3' UTR(서열번호 2 및 서열번호 10, 도 4b의 설명에서 더욱 상세히 기재된 바와 같음); Kozak만; 및 Kozak 및 3' UTR(서열번호 10)을 포함한다.
도 8a 및 도 8b는 GFP-인코딩 EEC 변이체로의 트랜스펙션 후 GFP 단백질을 발현하는 Jurkat(T) 림프구를 도시한다. (도 8a)는 다양한 GFP-인코딩 EEC(전장 5'(서열번호 2) 및 3'(서열번호 10) UTR)로 트랜스펙션된 각 세포 그룹에 존재하는 GFP 양성 Jurkat 세포의 양을 나타내는 유세포 분석 그래프를 도시한다. (도 8b)는 다양한 GFP-인코딩 EEC 5'(서열번호 2) 및 3'(서열번호 10) UTR EEC 작제물로 트랜스펙션된 각 세포 그룹에서 GFP 양성 Jurkat 세포의 양을 나타내는 유세포 분석 히스토그램을 도시한다. (도 8a)의 유세포 분석 그래프로부터의 결과는 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 갖는 증가하는 양의 GFP-인코딩 EEC로 트랜스펙션된 GFP 양성 Jurkat 세포의 백분율을 나타내는 선 그래프로서 제공된다. (도 8b)의 유세포 분석 실험으로부터의 결과는 8 피코몰의 GFP-인코딩 EEC 변이체(n=2)로 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 나타내는 막대 그래프로서 제공된다. UTR이 없음; Kozak 단독; 5' 단독; 3' 단독; 5' 및 3'; 및 Kozak 및 3'를 갖는 변이체에 대한 데이터가 제시된다. 이러한 변이체에 사용된 서열에 대한 세부사항은 도 4b 및 도 7c의 설명에서 확인될 수 있다.
도 9a 내지 도 9c는 UTR 변이체를 보유하는 GFP-인코딩 EEC로 림프구를 전기천공한지 24시간 후에 Jurkat(T) 림프구에서 GFP 발현의 양을 도시한다. (도 9a)는 4 피코몰의 각각의 GFP-인코딩 EEC 변이체를 사용하여 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 갖는 히스토그램의 대표적인 예를 나타낸다. (도 9b)는 8 피코몰의 각각의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 나타내는 히스토그램의 대표적인 예를 도시한다. (도 9c)는 (도 9a) 및 (도 9b)에 도시된 바와 같이, 4 및 8 pmol의 GFP-인코딩 EEC 변이체를 갖는 림프구의 중앙 GFP 강도{실험 횟수 = 2}를 나타내는 막대 그래프이다.
도 10a 내지 도 10c는 GFP 단백질을 발현하는 Raji 림프구가 UTR 변이체를 보유하는 GFP-인코딩 EEC로 림프구를 전기천공한지 24시간 후에 유세포 분석으로 처리된 대표적인 실험을 도시한다. (도 10a)는 4 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Raji 림프구의 GFP 강도 및 백분율의 그래프를 도시한다. (도 10b)는 8 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 세포의 GFP 강도 및 백분율의 대표적인 그래프를 나타낸다. (도 10c)는 (도 10a) 및 (도 10b)에 도시된 바와 같은 실험의 중앙 GFP 강도{실험 횟수 = 2}를 나타내는 막대 그래프를 표시하며, 이는 각각 4 및 8 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Raji 림프구의 GFP 강도를 도시한다. UTR 없음; Kozak 단독; 5' 단독(서열번호 2); 3' 단독(서열번호 10); 5' 및 3'((서열번호 2) 및 (서열번호 10)); 및 Kozak 및 3'(서열번호 10)를 갖는 변이체에 대한 데이터가 제시된다.
도 11a 및 도 11b는 본 명세서에 개시된 5'-3' UTR 변이체를 보유하는 hOCT3/4-인코딩 EEC로 트랜스펙션 24시간 후에 HEK293 세포에서 hOCT3/4 단백질의 발현을 도시한다. (도 11a)는 증가하는 양의 hOCT3/4-인코딩 EEC(전장 5'(서열번호: 2) 및 3'(서열번호: 10) UTR을 가짐)로 트랜스펙션된 hOCT3/4 양성 HEK293 세포의 hOCT3/4의 강도 및 백분율의 양을 나타내는 대표적인 유세포 분석 실험으로부터의 결과를 도시한다. (도 11b)는 UTR 변이체를 갖는 1.2 피코몰의 hOCT3/4로 트랜스펙션된 hOCT3/4+ 세포의 hOCT3/4의 강도 및 백분율의 양을 나타내는 대표적인 유세포 분석 실험으로부터의 결과를 도시한다. (도 11a)의 유세포 분석 실험의 결과는 또한 선 그래프로 제공된다. (도 11b)에 도시된 바와 같은 실험의 {실험 횟수 = 2}로부터의 중간 결과는 RNA가 없는 것과 비교할 때 UTR 변이체를 사용하는 UTR 변이체를 갖는 hOCT3/4의 수준이 또한 막대 그래프로서 제공됨을 도시한다.
도 12a 및 도 12b는 본 명세서에 개시된 5'-3' UTR 변이체를 갖는 hIL2-인코딩 EEC로 트랜스펙션 24시간 후에 HEK293 세포로부터의 hIL2 단백질의 발현(ELISA에 의해 측정됨)을 도시한다. (도 12a)는 hIL2-인코딩 EEC{전장 5'(서열번호: 2) UTR 및 3' UTR(서열번호: 10)을 가짐}의 투여가 증가함에 따라 ELISA 신호의 흡광도(@450nm)의 증가를 나타내는 그래프를 나타낸다. (도 12b)는 UTR 변이체((서열번호 2) 및 (서열번호 10))를 갖는 0.5 pmol의 hIL2-인코딩 EEC로 트랜스펙션된 HEK293 세포로부터의 hIL2의 상대적 수준을 나타내는 막대 그래프를 나타낸다.
도 13a 내지 도 13c는 전장 5'(서열번호 2) UTR 및 3' UTR의 변이체(서열번호 10, 11 및 12)로 GFP-인코딩 EEC 트랜스펙션 후 HEK293 세포에서 GFP 단백질의 발현을 도시한다. (도 13a)는 3' UTR 변이체의 서열을 도시한다. (도 13b)는 1 내지 2 pmol의 다양한 EEC의 트랜스펙션 24시간 후에 GFP 양성 HEK293 세포의 백분율(유동 세포 분석에 의한 10,000개의 이벤트/세포를 기반으로 함)을 나타낸다. (도 13c)는 (도 13a)에 도시된 바와 같이 3' UTR 변이체(A, B 및 C)를 갖는 1 내지 2 pmol의 GFP-인코딩 EEC로 트랜스펙션된 HEK293 세포(2회의 개별 실험으로부터)의 중앙 GFP 강도를 나타내는 막대 그래프이다.
도 14. 조작된 Oct4 mRNA 작제물의 트랜스펙션 시 인간 포피 섬유모세포에서의 Oct4 발현(UO: 비변형 mRNA Oct4, UMD: 비변형 mRNA MyoD-Oct4, PUO: 변형 mRNA Oct4, PUMD: 변형 mRNA MyoD-Oct4).
도 15. 시험관내 합성된 RNA를 생성하기 위한 cDNA 작제물 및 EGFP, Oct4, 및 IL2(서열번호 55 내지 60)에 대한 생성된 합성 RNA 작제물을 포함하는 본 개시를 지지하는 추가 서열.

치료제, 백신으로서 그리고/또는 달리 시험관내 및 생체내 둘 다에서 세포에서 단백질 발현을 변경시키기 위한 RNA의 사용에 있어서 상당한 과학적 진보가 이루어졌다. 극복해야 할 가장 큰 과제 중 하나는 주어진 결과를 허용하기에 충분히 높은 수준의 단백질 발현을 달성하는 것이다. 이러한 과제를 해결하고 표적 단백질의 발현을 증가시켜 mRNA가 다양한 임상적 맥락에서 유용하도록 여러 시도가 이루어졌다. 이러한 연구는 예를 들어, Ribostem Limited에 양도된 2006년 6월 8일자로 출원된(현재 포기됨) US20060247195; Moderna에 양도된 2011년 5월 12일자로 출원된 미국 등록 특허 제10,772,975호; BioNTech AG에 양도된 WO2009077134호로서 공개된 2008년 12월 12일자로 출원된 PCT/EP2008/01059; Curevac GMBH에 양도된 WO2009127230로서 공개된 2008년 4월 16일자로 출원된 PCT/EP2008/03033; Cellular Reprogramming, Inc.에 양도된 2016년 12월 29일자로 출원된 PCT/US2016/069079; 및 Cellular Reprogramming, Inc.에 양도된 2019년 6월 13일자로 출원된 PCT/US2019/037069에 개시되어 있다.

유전자의 비번역 영역(UTR)은 전사되지만 번역되지는 않는다. 일반적으로, 5' UTR은 전사 개시 부위에서 시작하여 개시 코돈으로 계속되지만 개시 코돈은 포함하지 않으며; 3' UTR은 정지 코돈 다음에 시작하여 전사 종결 신호까지 계속된다. 메신저 RNA(mRNA)는 리보솜을 동원하고, 번역을 개시하여, 이에 의해 단백질 발현을 증가시키는 것으로 나타난 UTR을 포함한다. 전술한 설명에 따르면, 개시 코돈 및 정지 코돈은 일반적으로 UTR의 일부로 간주되지 않지만, 본 개시내용에서, 이러한 세그먼트는 때때로 작동 세그먼트를 생성하기 위해 UTR로 지정된 서열 내에 포함된다.

핵산 분자의 안정성 및 결과적인 번역/단백질 발현과 관련하여 UTR이 수행하는 조절 역할에 대한 증거가 증가하고 있다. UTR 내의 서열은 원핵생물 및 진핵생물에서 상이하다. 예를 들어, Shine-Dalgarno 공통 서열(5'-AGGAGGU-3')은 박테리아에서 리보솜을 동원하는 반면, RNA Kozak 공통 서열(5'-GCCRCCRUGG-3')은 개시 코돈(AUG)을 포함하고 포유동물 세포에서 번역 개시 이벤트를 신장시킨다.

Kozak 공통 서열에서 'R'은 아데노신 또는 구아노신을 나타낸다. Kozak 공통 서열의 -3 위치는 번역 개시를 향상시키고, 전체적으로 Kozak 서열은 개시 코돈의 적절한 인식을 위해 번역 개시 복합체를 정지시키는 것으로 여겨진다. Kozak 공통 서열은 그 자체로 리보솜 스캐닝 및 번역 개시를 유도할 수 있지만, 인간 전사체에서 매우 풍부한 단백질과 관련된 추가 UTR이 분석되었다. 연구는 염색체 및 리보솜 관련 단백질을 포함하는 유전 정보 처리와 관련된 단백질의 상대적 존재비를 시사한다(Beck et al., The quantitative proteome of a human cell line. Mol. Syst. Biol. (2011), doi:10.1038/msb.2011.82; Liebermeister et al., Visual account of protein investment in cellular functions. Proc. Natl. Acad. Sci. U.S.A. (2014), doi:10.1073/pnas.1314810111). 예를 들어, 고-발현된 리보솜-관련 단백질(RPL/RPS)의 5' UTR의 정렬은 5' 말단 올리고피리미딘 트랙(즉, 5'TOP) 또는 C/U의 출현을 예시한다(Lavallee-Adam et al., Functional 5' UTR motif discovery with LESMoN: Local enrichment of sequence motifs in biological networks. Nucleic Acids Res. (2017), doi:10.1093/nar/gkx751; Yoshihama et al., The human ribosomal protein genes: Sequencing and comparative analysis of 73 genes. Genome Res. (2002), doi:10.1101/gr.214202; Cardinali et al., La protein is associated with terminal oligopyrimidine mRNAs in actively translating polysomes. J. Biol. Chem. (2003), doi:10.1074/jbc.M300722200; Pichon et al., RNA Binding Protein/RNA Element Interactions and the Control of Translation. Curr. Protein Pept. Sci. (2012), doi:10.2174/13892031280161947). 일반적으로, 5'TOP 서열은 개시 코돈 근처에 위치하고, 전사체의 전사(즉, RNA 합성) 및 번역에 중요하다.

특정 표적 기관의 풍부하게 발현된 유전자에서 통상적으로 발견되는 특징을 조작함으로써, 코딩 서열의 단백질 발현을 증가시킬 수 있다. 예를 들어, 알부민, 혈청 아밀로이드 A, 아포지단백질 A/B/E, 트랜스페린, 알파 태아단백질, 에리트로포이에틴, 또는 인자 VIII와 같은 간-발현된 mRNA의 5' UTR의 도입은 간 세포주 또는 간에서 코딩 서열의 발현을 향상시키기 위해 사용될 수 있다. 마찬가지로, 그러한 조직에서 발현을 개선시키기 위해 다른 조직-특이적 mRNA로부터의 5' UTR의 사용은 근육(MyoD, 미오신, 미오글로빈, 미오게닌, 헤르쿨린), 내피 세포(Tie-1, CD36), 골수 세포(C/EBP, AML1, G-CSF, GM-CSF, CD11b, MSR, Fr-1, i-NOS), 백혈구(CD45, CD18), 지방 조직(CD36, GLUT4, ACRP30, 아디포넥틴) 및 폐 상피 세포(SP-A/B/C/D)에 대해 가능하다.

그러나, UTR은 100 내지 1000개의 뉴클레오타이드(nt) 길이를 가질 수 있다. 치료제 및 백신에서 mRNA의 사용에 비추어, 최소/최적 UTR에 대한 조사는 세포에서 증가되고 표적화된 단백질 발현에 유리하다. 특정 예에서, 본 명세서에 개시된 조작된 발현 작제물(EEC)은 최소 UTR(minUT)을 갖도록 설계되었다. 즉, EEC는 가능한 한 최소이고 의도된 용도에서 여전히 높은 수준의 발현을 가능하게 하는 5' 및/또는 3' UTR을 갖도록 설계되었다.

따라서, 특정 양태에 따르면, 본 개시내용은 단백질 발현을 극적으로 증가시키는 최소 UTR을 제공한다. 특정 예에서, 본 개시내용은 20 내지 23개의 뉴클레오타이드를 갖는 5' UTR을 제공한다. 특정 예에서, 본 개시내용은 선택적 폴리A 꼬리가 포함되는지 여부에 따라 27개의 뉴클레오타이드 또는 67개의 뉴클레오타이드를 갖는 3' UTR을 제공한다. 이후, 함께, 5' 및 3' UTR 조합의 특정 예는 47 내지 50개의 뉴클레오타이드 또는 87 내지 90개의 뉴클레오타이드를 포함한다. 이러한 크기 프로파일은 특히 치료제 및/또는 백신 적용에서 유리하다.

특정 양태에 따르면, minUT를 작제하기 위해, 본 개시내용은 시험관내에서 mRNA의 생산 및 생체내에서 단백질의 생산에 필요한 요소를 통합한다. 시험관내 mRNA의 생산을 위해, 본 개시내용은 T7 박테리오파지(T7P)로부터의 RNA 폴리머라제의 사용을 사용하였다. T7P는 특정 DNA 이중-나선 서열(5'-TAATACGACTCACTATAG-3'(서열번호 45))에 결합하고, 제1 리보뉴클레오타이드로서 구아노신(프로모터에서 마지막 G; 밑줄로 표시됨)의 혼입으로 RNA 합성을 개시한다. 이러한 결합 서열은 일반적으로 전사 복합체를 안정화시키고, T7P 제거 및 RNA 폴리머의 연장을 촉진하는 역할을 하는 펜타머(5'-GGAGA-3')가 뒤따른다.

특정 실시형태에서, 5' UTR은 프로모터, 미니-인핸서 서열(CAUACUCA, 본 명세서), 및 Kozak 서열, 예컨대, 절단된 형태의 Kozak 서열(GCCRCC)을 포함한다. 특정 실시형태에서, 5' UTR은 또한 작동 세그먼트를 생성하기 위해 개시 코돈에 작동 가능하게 연결되는 것으로 기술된다.

특정 실시형태에서, 최소 프로모터는 5' UTR 내에서 사용하기 위해 선택된다. 최소 프로모터는 그 자체로 유전자 발현을 유도하는 활성을 갖지 않지만, 근위 인핸서 요소에 연결될 때 유전자 발현을 유도하도록 활성화될 수 있다. 예시적인 최소 프로모터는 minBglobin, minCMV, SacI 제한 부위가 제거된 minCMV, minRho, SacI 제한 부위가 제거된 minRho, 및 Hsp68 최소 프로모터(proHSP68)를 포함한다. 특정 실시형태에서, 최소 프로모터는 최소 T7 프로모터(미니-T7 프로모터)를 포함한다.

개시된 5' UTR의 특정 예는 독특한 미니-인핸서 서열(CAUACUCA)을 포함한다. 미니-인핸서 서열은 최소 프로모터(예를 들어, T7)와 Kozak 공통 서열 사이에 위치하여 (개시 코돈이 UTR의 일부로 지정되는지 여부에 따라) 20 내지 23개의 뉴클레오타이드를 갖는 최소 5' UTR을 생성할 수 있다. 진핵생물 번역은 일반적으로 AUG 코돈으로 시작하지만, 다른 개시 코돈이 포함될 수 있다. 포유동물 세포는 또한 CUG 코돈을 디코딩하는 류실-tRNA의 도움으로 아미노산 류신으로 번역을 시작할 수 있으며, 미토콘드리아 게놈은 인간에서 AUA 및 AUU를 사용한다. 이러한 성분 및 예시적인 5' UTR은 표 1에 제공된다.

특정 예에서, 5' UTR은 캡핑된다. 예를 들어, 진핵생물 mRNA는 5' 트리포스페이트에 역전된 7-메틸구아노신의 첨가에 의해 구아닐릴화된다(즉, m7GpppN, 여기서 N은 mRNA의 제1 염기를 나타냄). mRNA의 m7GpppN 또는 5' 캡 구조는 핵 이출에 관여하고, mRNA 번역 능력을 담당하는 mRNA 캡 결합 단백질(CBP)에 결합한다.

mRNA의 제1 뉴클레오타이드 및 제2 뉴클레오타이드의 리보스 당은 또한 선택적으로 2'-산소(즉, 2'O) 위치에서 메틸화될 수 있다(즉, CH3 기의 첨가). 제1 뉴클레오타이드 및 제2 뉴클레오타이드에서의 비-메틸화된 mRNA는 Cap0(즉, m7GpppN)으로 표시되는 반면, 제1 뉴클레오타이드 및 제2 뉴클레오타이드 상의 2'O에서의 메틸화는 각각 Cap1(즉, m7GpppNm) 및 Cap2(즉, m7GpppNmNm)로 표시된다. 또한, 제1 5' 뉴클레오타이드가 아데노신인 경우, 이는 6번째 질소(6N) 위치에서 추가로 메틸화되거나(즉, m7Gpppm6A) 변형된 Cap0(즉, m7Gpppm6A) 또는 변형된 Cap1(즉, m7Gpppm6Am) 또는 변형된 Cap2(즉, m7Gpppm6AmNm)를 형성할 수 있다.

RNA 구아닐화 또는 Cap0(즉, m7GpppN)의 첨가는 백시니아 바이러스 캡핑 효소(VCE)에 의해 시험관내(즉, RNA 합성 후) 효소적으로 달성될 수 있다. Cap1 및 Cap2 구조의 생성은 mRNA 2'-O-메틸트랜스퍼라제 및 S-아데노실 메티오닌(즉, SAM)의 첨가를 통해 효소적으로 추가로 달성될 수 있다. 대안적으로, Cap 구조는 항-역전 캡 유사체(즉, ARCA)의 혼입에 의해 시험관내 공동-전사적으로 첨가될 수 있다. ARCA는 캡의 3'-산소(3'O)에서 메틸화되어(m73'OmGpppN) 캡 구조가 정확한 배향으로 혼입되도록 한다. 본 출원에서, 상기 캡 구조들 중 임의의 캡 구조는 최종 EEC mRNA 생성물에 사용될 수 있다.

특정 실시형태에서, 5' UTR은 코딩 서열에 작동 가능하게 연결된다. 본 명세서에서 사용되는 용어 "작동 가능하게 연결된"은 뉴클레오타이드 발현 제어 서열(예를 들어, 프로모터 서열 또는 UTR)과 또 다른 뉴클레오타이드 서열 사이의 기능적 연결을 지칭하며, 이에 의해 제어 서열은 다른 뉴클레오타이드 서열의 전사 및/또는 번역을 가능하게 하고, 이를 야기시킨다.

본 개시내용은 또한 개시된 5' UTR과 함께 선택적인 사용을 위한 3' UTR을 제공한다. 본 명세서에 제시된 바와 같이, 개시된 5' UTR과 개시된 3' UTR의 조합은 단지 개시된 5' UTR 또는 단지 개시된 3' UTR의 사용에 비해 크게 향상된 단백질 발현을 갖는 EEC를 초래한다.

3' UTR은 이들에 임베딩된 아데노신 및 우리딘의 스트레치를 갖는 것으로 공지되어 있다. 이러한 AU 풍부 특징은 회전율이 높은 유전자에서 특히 일반적이다. 이들의 서열 특징 및 기능적 특성에 기초하여, AU 풍부 요소(ARE)는 3개의 부류로 분리될 수 있다: 클래스 I ARE는 U-풍부 영역 내에 AUUUA 모티프의 여러 분산된 사본을 함유한다. C-Myc 및 MyoD는 클래스 I ARE를 함유한다. 클래스 II ARE는 2개 이상의 중첩되는 UUAUUUA(U/A)(U/A) 노나머를 갖는다.

전술한 바와 같이, 개시된 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로 폴리아데닌 꼬리(폴리A 꼬리)를 포함한다. 본 명세서의 특정 예에서, 3' UTR은 또한 정지 코돈에 작동 가능하게 연결된 것으로 도시되어 있다.

예시적인 정지 코돈은 UAA, UGA 및 UAG를 포함한다.

예시적인 스페이서는 [N_1-3]AUA 및 [N_1-3]AAA(예를 들어, UGCAUA, UGCAAA, UGAAA, GCAUA, UAAA 및 GAUA)를 포함하며, 여기서 N은 A, G, C, T 또는 U를 포함하는 임의의 뉴클레오타이드이다. 아래 첨자 숫자는 뉴클레오타이드의 양을 나타낸다. 예를 들어, [N_1-3]은 N, NN 또는 NNN에 기재된 바와 같은 1, 2 또는 3개의 뉴클레오타이드를 포함한다.

스템 루프(SL), 또는 헤어핀 또는 헤어핀 루프는 3' UTR 내에서 고도로 발현된 전사체의 특징이다. SL은 상보적인 뉴클레오타이드가 루프를 형성하는 서열로 종종 중단되는 이중 나선(또는 스템)으로서 쌍을 이루는 별개의 2차 구조이다. SL로 표시되는 특정 2차 구조는 스템 및 헤어핀 루프라고도 하는 (말단) 루프를 포함하는 연속적인 핵산 서열을 포함하며, 여기서 스템은 2개의 이웃하는 완전히 또는 부분적으로 상보적인 서열 요소에 의해 형성되고; 이는 SL 구조의 루프를 형성하는 짧은 서열(예를 들어, 3 내지 10개의 뉴클레오타이드)에 의해 분리된다. 2개의 이웃하는 완전히 또는 부분적으로 상보적인 서열은 예를 들어, SL 요소 스템 1 및 스템 2로서 정의될 수 있다. SL은 이러한 2개의 이웃한 완전히 또는 부분적으로 역상보적인 서열, 예를 들어, SL 요소 스템 1 및 스템 2가 서로 염기쌍을 형성하여, SL 요소 스템 1과 스템 2 사이에 위치한 짧은 서열에 의해 형성된 이의 말단 단부에 쌍을 이루지 않는 루프를 포함하는 이중 가닥 핵산 서열을 야기시킨다. 따라서, SL은 2개의 스템(스템 1 및 스템 2)을 포함하며, 이는 - 핵산 분자의 2차 구조 수준에서 - 서로 염기쌍을 형성하며, 이는 - 핵산 분자의 1차 구조의 수준에서 - 스템 1 또는 스템 2의 일부가 아닌 짧은 서열에 의해 분리된다. 예시를 위해, SL의 2차원 표현은 롤리팝-형상 구조와 유사하다. 스템-루프 구조의 형성은 쌍을 이루는 이중 가닥을 형성하기 위해 스스로 접힐 수 있는 서열의 존재를 필요로 하며; 쌍을 이루는 이중 가닥은 스템 1 및 스템 2에 의해 형성된다. 쌍을 이룬 SL 요소의 안정성은 통상적으로 줄기 2의 뉴클레오타이드(미스매치 또는 벌지(bulge))와 염기쌍을 형성하지 못할 수 있는 스템 1의 뉴클레오타이드의 수에 대한 스템 2의 뉴클레오타이드를 갖는 염기쌍(바람직하게는 표준 염기쌍, 더욱 바람직하게는 Watson-Crick 염기쌍)을 형성할 수 있는 스템 1의 뉴클레오타이드의 수의 길이에 의해 결정된다. 본 발명에 따르면, 최적의 루프 길이는 3 내지 10개의 뉴클레오타이드, 더욱 바람직하게는 4 내지 7개의 뉴클레오타이드, 예컨대, 4개의 뉴클레오타이드, 5개의 뉴클레오타이드, 6개의 뉴클레오타이드 또는 7개의 뉴클레오타이드이다. 제공된 핵산 서열이 SL을 특징으로 하는 경우, 개개의 상보적 핵산 서열은 통상적으로 또한 SL을 특징으로 한다. SL은 통상적으로 단일-가닥 RNA 분자에 의해 형성된다. 특정 실시형태에서, SL 길이는 7개 이상의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개 뉴클레오타이드, 적어도 16개 뉴클레오타이드, 적어도 17개 뉴클레오타이드, 적어도 18개 뉴클레오타이드, 적어도 19개 뉴클레오타이드 또는 적어도 20개 뉴클레오타이드 길이이다.

SL은 폴리아데닌 꼬리에 관계없이 번역을 신장시키는 고도로 발현된 전사체(예를 들어, 히스톤과 같은 풍부한 세포 단백질을 코딩하는 전사체)의 3' UTR 내에 존재한다(Gallie et al., The histone 3'-terminal stem-loop is necessary for translation in Chinese hamster ovary cells. Nucleic Acids Res. (1996), doi:10.1093/nar/24.10.1954). 히스톤 3' UTR 스템 공통 서열은 6개의 염기쌍을 특징으로 하며, 이 중 2개는 G-C 쌍이며, 3개는 피리미딘-퓨린(Y-R) 쌍이며, 1개는 A-U 쌍이며, 또한, 루프는 2개의 우리딘(U), 1개의 퓨린(Y) 및 1개의 리보뉴클레오타이드(N)를 갖는 4개의 리보뉴클레오타이드를 포함한다(Gallie et al., The histone 3'-terminal stem-loop is necessary for translation in Chinese hamster ovary cells. (Nucleic Acids Res. (1996), doi:10.1093/nar/24.10.1954; Tan et al., Structure of histone mRNA stem-loop, human stem-loop binding protein, and 3'hExo ternary complex. Science (80). (2013), doi:10.1126/science.1228705; Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820).

SL은 복제-의존성 mRNA 안정성/프로세싱/대사/번역을 위해 스템-루프 결합 단백질(SLBP)과 회합한다. 구조적 증거는 SLBP와 SL의 직접적인 접촉이 SL(G7)의 염기에서의 구아노신 뉴클레오타이드에서 발생함을 시사한다(Tan et al., Structure of histone mRNA stem-loop, human stem-loop binding protein, and 3'hExo ternary complex. Science (80). (2013), doi:10.1126/science.1228705; Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820). 또한, 스템에 대한 인접한 아데노신, 또는 보다 구체적으로, 상류 AAA는 SLBP 결합 및 기능에 영향을 미친다(Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820; William & Marzluff, The sequence of the stem and flanking sequences at the 3' end of histone mRNA are critical determinants for the binding of the stem-loop binding protein. Nucleic Acids Res. (1995), doi:10.1093/nar/23.4.654). 3' UTR은 또한 번역 능력을 증가시키면서 단백질-코딩 전사체를 안정화시키는 역할을 한다. 특정 실시형태에 따르면, 본 개시내용은 SLBP 결합 및 mRNA 번역을 증가시키기 위한 아데노신과 같은 인접한 스페이서 서열을 갖는 서열(UAACGGUCUU(서열번호 34))에 의해 중단된 G-C 쌍의 3개 그룹인 SL의 특징을 혼입시키기 위한 합성 SL에 대한 설계를 제공한다.

중요하게는, EEC에서 사용되는 스템 루프는 서열-배향 의존적이지 않고, a) CCUC 및 GAGG, b) GAGG 및 CCUC, c) AAACCUC 및 GAGG, 및 d) AAAGAGG 및 CCUC를 포함할 수 있다. 또한, 스템의 2개의 아암(여기서, CCUC 및 GAGG 염기쌍) 사이의 거리는 루프가 형성되기에 충분히 길어야 한다. 특정 실시형태에서, 스템 루프는 상보적 서열, 예컨대, a) RRRR 및 YYYY, b) RYRR 및 YRYY, c) RRYR 및 YYRY, d) RRRY 및 YYYR, e) RYYR 및 YRRY, f) RRYY 및 YYRR, g) YYRR 및 RRYY, h) YYYR 및 RRRY, 또는 i) RYYY 및 YRRR을 포함하며, 여기서, R은 퓨린(A 또는 G)이며, Y는 피리미딘(예를 들어, U 또는 C)이다.

특정 실시형태에 따르면, 2개의 아암 사이의 뉴클레오타이드의 수는 7개, 8개, 9개, 10개, 또는 더 긴 뉴클레오타이드일 수 있다. 스템 루프의 2개의 아암 사이의 길이의 바람직한 실시형태는 7개 이상의 뉴클레오타이드이다. 특정 예에서, SL의 루프 세그먼트는 UAACGGUCUU(서열번호 34)를 포함한다. 특정 실시형태에서, SL 서열은 GAUGCCCCAUUCACGAGUAGUGGGUAUU(서열번호 64), GGCACCCUGCGCAGGUGAUGCAGGUGCC(서열번호 65), GUUCGCUCGGUCAGGAGAGCUGACGGAC(서열번호 66), UCUUACAGUGGCAUGUGACCGUUUAAGG(서열번호 67), CGCGGCGCAUGCACGUGACAUGCCUGCG(서열번호 68), CGGUCCCGUGGCAAGAGUCUAUGGAUUG(서열번호 69), AUGUUCGGCUCCAAGAGCGAGUUGAUAU(서열번호 70), CGAUUCGGGCACAUGUGCUGUCUGAUUG(서열번호 71), GUAUUCUGAUGCACGUGCCAUCAAGUAC(서열번호 72), 또는 UUGAGCAGGAUCAAGUGCAUUCUUUCAA(서열번호 73)를 포함한다. 특정 실시형태에서, SL 서열은 RRYRYYYYRYYYRYRRRYRRYRRRYRYY(서열번호 74), RRYRYYYYRYRYRRRYRRYRYRRRYRYY(서열번호 75), RYYYRYYYRRYYRRRRRRRYYRRYRRRY(서열번호 76), YYYYRYRRYRRYRYRYRRYYRYYYRRRR(서열번호 77), YRYRRYRYRYRYRYRYRRYRYRYYYRYR(서열번호 78), YRRYYYYRYRRYRRRRRYYYRYRRRYYR(서열번호 79), RYRYYYRRYYYYRRRRRYRRRYYRRYRY(서열번호 80), YRRYYYRRRYRYRYRYRYYRYYYRRYYR(서열번호 81), RYRYYYYRRYRYRYRYRYYRYYRRRYRY(서열번호 82), 또는 YYRRRYRRRRYYRRRYRYRYYYYYYYRR(서열번호 83)을 포함하며, 여기서, R은 퓨린(A 또는 G)이며, Y는 피리미딘(예를 들어, U 또는 C)이다. 추가적인 예시적인 SL 모티프에 대해서는 문헌[Gorodkin et al., (Nucleic Acids Research 29(10):2135-2144, 2001)]을 참조한다.

선택적 폴리-A 꼬리. 천연 RNA 프로세싱 동안, 안정성을 증가시키기 위해 긴 사슬의 아데닌 뉴클레오타이드(폴리-A 꼬리)가 mRNA 분자와 같은 폴리뉴클레오타이드에 첨가될 수 있다. 전사 직후, 전사체의 3' 말단은 절단되어 3' 하이드록실을 유리시킬 수 있다. 이후, 폴리-A 폴리머라제는 RNA에 아데닌 뉴클레오타이드의 사슬을 첨가한다. 폴리아데닐화로 불리는 이러한 공정은 예를 들어, 100 내지 250개 잔기 길이일 수 있는 폴리-A 꼬리를 첨가한다. 시험관내 RNA 합성에서, 폴리A 꼬리는 DNA 주형 상에 인코딩될 수 있고, 그 자체로 시험관내 전사 과정 동안 혼입된다.

특정 예에서, 폴리A 꼬리는 길이가 0 내지 500개의 뉴클레오타이드 범위이다(예를 들어, 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 120, 140, 160, 180, 200, 250, 300, 350, 400, 450 또는 500개의 뉴클레오타이드). 특정 예는 40개 뉴클레오타이드 폴리A 꼬리를 이용한다. 길이는 또한 단위로 또는 폴리A 결합 단백질 결합의 함수로서 결정될 수 있다. 이러한 실시형태에서, 폴리A 꼬리는 4개의 폴리A 결합 단백질의 모노머, 3개의 폴리A 결합 단백질의 모노머, 2개의 폴리A 결합 단백질의 모노머, 또는 1개의 폴리A 결합 단백질의 모노머에 결합하기에 충분히 길다. 폴리A 결합 단백질 모노머는 38개의 뉴클레오타이드의 스트레치에 결합한다.

3' UTR의 상기 논의에 기초하여, 본 명세서에 개시된 3' UTR 작제물은 스페이서(예를 들어, [N_1-3]AUA, [N_1-3]AAA, UGCAUA 또는 UGCAAA), 스템 루프 하이브리드화 서열(예를 들어, CCUC, GAGG); 스템 루프 루프 세그먼트(예를 들어, [N_7-15], UAACGGUCUU(서열번호 34)), 및/또는 선택적으로, 폴리A 꼬리 중 하나 이상을 포함한다. 정지 코돈이 3' UTR의 일부로 지정되는 경우, 예시적인 정지 코돈은 UAA, UGA 및 UAG를 포함한다. 이러한 성분에 기반한 예시적인 3' UTR 작제물은 표 2에 제시되어 있다.

특정 실시형태에서, 다른 비-UTR 서열은 5'(또는 3' UTR) UTR에 혼입될 수 있다. 예를 들어, 인트론 또는 인트론 서열의 일부는 이러한 영역에 혼입될 수 있다. 인트론 서열의 혼입은 단백질 발현뿐만 아니라 mRNA 수준을 추가로 증가시킬 수 있다.

개시된 5' 및 3' UTR을 이용한 EEC 아키텍처. 5' UTR 및 3' UTR에 대한 개시된 조작된 서열은 EEC를 생성하는 데 사용될 수 있으며, 이는 주어진 코딩 서열의 측면에서 사용될 때 다양한 단백질의 단백질 발현을 증가시키는 데 유용한 것으로 본 명세서에 제시되어 있다. 이러한 다양한 단백질은 본 명세서에 개시된 바와 같은 녹색 형광 단백질(GFP), 인터루킨-2(IL-2), 및 POU5F1(OCT3/4)을 포함한다. 또한, 이러한 본 발명의 5' UTR 및 3' UTR 서열은 트랜스펙션 방식과 상관없이 림프구 및 부착성 및 현탁 배아 신장 세포를 포함하는 상이한 세포 타입에서 유사하게 작용하는 것으로 나타났다.

도 1은 본 개시내용의 대표적인 EEC를 도시한다. 특정 예에서, "EEC"는 하나 이상의 단백질을 인코딩하고 그 안에서 인코딩된 단백질을 번역하기 위해 충분한 구조적 및/또는 화학적 특징을 보유하는 코딩 서열의 측면에 있는 본 명세서에 개시된 5' 및/또는 3' UTR을 갖는 폴리뉴클레오타이드 전사체를 지칭한다.

도 1로 돌아가서, 도시된 EEC는 제1 측면 영역 및 제2 측면 영역의 측면에 있는 오픈 리딩 프레임 내에 연결된 뉴클레오타이드의 코딩 서열을 포함한다. 이러한 코딩 서열은 단백질을 인코딩하는 RNA 서열을 포함한다. 단백질은 이의 5' 말단에, 신호 서열 영역에 의해 인코딩된 하나 이상의 신호 서열을 포함할 수 있다. 제1 측면 영역은 하나 이상의 완전하거나 불완전한 5' UTR 서열을 포함하는 연결된 뉴클레오타이드의 영역을 포함할 수 있다. 제1 측면 영역은 또한 5' 말단 캡을 포함할 수 있다. 코딩 서열의 5' 말단과 제1 측면 영역을 브리징하는 것은 제1 작동 세그먼트이다. 전통적으로, 이러한 작동 세그먼트는 개시 코돈을 포함한다. 작동 세그먼트는 대안적으로 개시 코돈을 포함하는 임의의 번역 개시 서열 또는 신호를 포함할 수 있다.

제1 측면 영역은 5' UTR 내에 위치하는 모듈을 포함할 수 있다. 이러한 제1 측면 영역은 3개의 모듈로 분할될 수 있다: 최소 프로모터(예를 들어, T7 프로모터 헥사머)를 나타내는 모듈 1("M1"); 독특한 번역 인핸서(CAUACUCA, 본 명세서에 기재됨)인 모듈 2("M2"); 및 Kozak 공통 서열인 모듈 3("M3"). T7 프로모터 헥사머는 T7 폴리머라제 프로모터의 일부이며, 이는 또한 T7 클래스 III 프로모터의 일부이며, 이는 T7 박테리오파지의 특정 프로모터의 전사를 유도하는 것과 연과되고 이러한 유도를 담당하는 당 분야에 널리 공지된 특정 부류의 프로모터이다. 보다 구체적으로, T7 프로모터 및 헥사머는 전체 서열(5'-TAATACGACTCACTATAGGGAGA-3'(서열번호 31))을 갖고, 제1 리보뉴클레오타이드로서 구아노신의 혼입으로 RNA 합성을 개시한다. Kozak 공통은 Kozak 공통 서열(5'-GCCRCCATGG-3'(서열번호 30))을 지칭하며, 여기서 'R'은 아데노신 또는 구아노신을 나타낸다.

제2 측면 영역은 하나 이상의 완전하거나 불완전한 3' UTR을 포함하는 연결된 뉴클레오타이드의 영역을 포함할 수 있다. 측면 영역은 또한 3' 테일링 서열(예를 들어, 폴리A 꼬리)을 포함할 수 있다. 3' UTR은 또한 정지 코돈, 스페이서, 및 스템-루프 세그먼트를 포함하는 3개의 세그먼트로 분할될 수 있다.

코딩 서열의 3' 말단과 제2 측면 영역을 브리징하는 것은 제2 작동 세그먼트이다. 전통적으로, 이러한 작동 세그먼트는 정지 코돈을 포함한다. 작동 세그먼트는 대안적으로 정지 코돈을 포함하는 임의의 번역 개시 서열 또는 신호를 포함할 수 있다. 본 개시에 따르면, 다수의 연속 정지 코돈이 또한 사용될 수 있다.

일반적으로, EEC의 코딩 서열의 최단 길이는 디펩타이드, 트리펩타이드, 테트라펩타이드, 펜타펩타이드, 헥사펩타이드, 헵타펩타이드, 옥타펩타이드, 노나펩타이드, 또는 데카펩타이드를 인코딩하기에 충분한 핵산 서열의 길이일 수 있다. 또 다른 실시형태에서, 길이는 2 내지 30개 아미노산, 예를 들어, 5 내지 30개, 10 내지 30개, 2 내지 25개, 5 내지 25개, 10 내지 25개, 또는 10 내지 20개 아미노산의 펩타이드를 인코딩하기에 충분할 수 있다. 길이는 적어도 11, 12, 13, 14, 15, 17, 20, 25 또는 30개 아미노산의 펩타이드, 또는 40개 이하, 예를 들어, 35, 30, 25, 20, 17, 15, 14, 13, 12, 11 또는 10개 이하의 아미노산의 펩타이드를 인코딩하기에 충분할 수 있다. 폴리뉴클레오타이드 서열이 인코딩할 수 있는 디펩타이드의 예는 카르노신 및 안세린을 포함한다.

일반적으로, 코딩 서열의 길이는 30개 초과의 뉴클레오타이드 길이(예를 들어, 적어도 35, 40, 45, 50, 55, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 1,600, 1,700, 1,800, 1,900, 2,000, 2,500, 및 3,000, 4,000, 5,000, 6,000, 7,000, 8,000, 9,000, 10,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000개 이상 또는 최대 100,000개 이상의 뉴클레오타이드)이다.

일부 실시형태에서, EEC는 30 내지 100,000개의 뉴클레오타이드(예를 들어, 30 내지 50, 30 내지 100, 30 내지 250, 30 내지 500, 30 내지 1,000, 30 내지 1,500, 30 내지 3,000, 30 내지 5,000, 30 내지 7,000, 30 내지 10,000, 30 내지 25,000, 30 내지 50,000, 30 내지 70,000, 100 내지 250, 100 내지 500, 100 내지 1,000, 100 내지 1,500, 100 내지 3,000, 100 내지 5,000, 100 내지 7,000, 100 내지 10,000, 100 내지 25,000, 100 내지 50,000, 100 내지 70,000, 100 내지 100,000, 500 내지 1,000, 500 내지 1,500, 500 내지 2,000, 500 내지 3,000, 500 내지 5,000, 500 내지 7,000, 500 내지 10,000, 500 내지 25,000, 500 내지 50,000, 500 내지 70,000, 500 내지 100,000, 1,000 내지 1,500, 1,000 내지 2,000, 1,000 내지 3,000, 1,000 내지 5,000, 1,000 내지 7,000, 1,000 내지 10,000, 1,000 내지 25,000, 1,000 내지 50,000, 1,000 내지 70,000, 1,000 내지 100,000, 1,500 내지 3,000, 1,500 내지 5,000, 1,500 내지 7,000, 1,500 내지 10,000, 1,500 내지 25,000, 1,500 내지 50,000, 1,500 내지 70,000, 1,500 내지 100,000, 2,000 내지 3,000, 2,000 내지 5,000, 2,000 내지 7,000, 2,000 내지 10,000, 2,000 내지 25,000, 2,000 내지 50,000, 2,000 내지 70,000, 및 2,000 내지 100,000)를 포함한다.

본 개시내용에 따르면, 제1 측면 영역 및 제2 측면 영역은 독립적으로 5 내지 100개의 뉴클레오타이드 길이(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100개의 뉴클레오타이드)의 범위일 수 있다.

본 개시에 따르면, 캡핑 영역은 단일 캡 또는 캡을 형성하는 일련의 뉴클레오타이드를 포함할 수 있다. 이러한 실시형태에서, 캡핑 영역은 길이가 1 내지 10, 예를 들어, 2 내지 9, 3 내지 8, 4 내지 7, 1 내지 5, 5 내지 10, 또는 적어도 2, 또는 10개 이하의 뉴클레오타이드일 수 있다. 일부 실시형태에서, 캡은 존재하지 않는다.

본 개시내용에 따르면, 제1 작동 세그먼트 및 제2 작동 세그먼트는 3 내지 40, 예를 들어, 5 내지 30, 10 내지 20, 15, 또는 적어도 4, 또는 30개 이하의 뉴클레오타이드 길이의 범위일 수 있고, 개시 및/또는 정지 코돈에 추가하여, 하나 이상의 신호 및/또는 제한 서열을 포함할 수 있다.

전이된 IVT-RNA의 더 높고 연장된 발현을 달성하기 위해 다양한 변형에 의해 IVT-RNA를 안정화시키는 것이 이전에 시도되었다. 그러나, 세포에서 펩타이드 및 단백질을 발현시키기 위한 RNA 트랜스펙션-기반 전략의 성공에도 불구하고, RNA 안정성, 인코딩된 펩타이드 또는 단백질의 지속적인 발현 및 RNA의 세포독성과 관련된 문제가 남아 있다. 예를 들어, 외인성 단일-가닥 RNA는 포유동물 세포에서 방어 메커니즘을 활성화시키는 것으로 알려져 있다.

여러 그룹은 활성화된 방어 메커니즘으로 인해, 세포 내로 트랜스펙션된 IVT-RNA로부터 충분히 높은 수준의 단백질 발현을 달성하기 위해, mRNA 전사체가 변형된 뉴클레오타이드(예를 들어, University of Pennsylvania에 양도된 2012년 8월 4일자로 출원된 미국 특허 제9,750,824호 참조) 또는 면역 회피 인자를 포함하는 단백질 또는 IVT-RNA 형태의 추가 시약(예를 들어, BioNTech에 양도된 2015년 5월 7일자로 출원된 미국 특허 제10,207,009호 참조)을 함유해야 한다고 제안하였다. 이러한 면역 회피 인자는 예를 들어, 세포외 IFN(예를 들어, 백시니아 바이러스로부터의 B18R)에 의한 IFN 수용체의 관여를 방지하거나, 세포내 IFN 신호전달(예를 들어, 백시니아 바이러스로부터의 E3 및 K3 둘 다)을 억제하거나, 또는 둘 다의 용량으로(예를 들어, 인플루엔자로부터의 NS1) 작용함으로써 세포 면역 반응을 약화시키는 단백질을 인코딩하는 바이러스 유전자를 포함한다(Liu et al., Sci Rep 9: 11972, 2019). 특정 실시형태에서, 면역 회피 단백질은 B18R, E3, K3, NS1 또는 ORF8(SARS-CoV2로부터)을 포함한다.

본 개시내용의 양태는 변형된 뉴클레오타이드, 마이크로RNA, 또는 면역 회피 인자를 사용하는 대신에, 2차 및 3차 구조를 mRNA 전사체에 도입함으로써 활성화된 방어 메커니즘을 극복하도록 설계되었다. 추가 실시형태에 따르면, 특정 실시형태는 단백질 발현을 증가시키기 위해 변형된 뉴클레오타이드 또는 마이크로RNA를 사용하지 않는다. 또 다른 실시형태에서, 세포로 트랜스펙션된 IVT-RNA로부터의 번역을 연장하기 위해 또는 임의의 다른 목적을 위해 변형된 뉴클레오타이드 또는 마이크로RNA를 사용하지 않는다.

특정 예에서, EEC는 5' UTR, 3' UTR, 5' UTR 및 3' UTR에서, 또는 EEC 전체에서 마이크로RNA 결합 부위 및/또는 변형된 NTP를 배제한다.

마이크로RNA(또는 miRNA)는 핵산 분자의 3' UTR에 결합하고, 핵산 분자 안정성을 감소시킴으로써 또는 번역을 억제함으로써 유전자 발현을 하향 조절하는 19 내지 25개 뉴클레오타이드 길이의 비코딩 RNA이다. 특정 예에서, EEC는 임의의 공지된 마이크로RNA 표적 서열, 마이크로RNA 서열, 또는 마이크로RNA 시드를 포함하지 않는다.

마이크로RNA 시드는 성숙 마이크로RNA의 위치 2 내지 8의 영역에 있는 서열이며, 이러한 서열은 miRNA 표적 서열에 대해 완전한 Watson-Crick 상보성을 갖는다.

특정 예에서, 본 개시내용의 EEC는 변형된 NTP를 구체적으로 배제하도록 설계된다. 변형된 NTP는 이들의 화학 구조를 변형시키기 위해 이들에 부착된 추가의 화학 기를 갖는 것들이다. 이러한 변형된 NTP의 예는 슈도우리딘, 메틸슈도우리딘, N1-메틸-슈도우리딘, 메틸우리딘(m5U), 5-메톡시우리딘(mo5U) 및 2-티오우리딘(s2U)을 포함한다. 5' 캡은 변형된 NTP가 아니다.

특정 예에서, EEC는 메신저 RNA(mRNA)를 포함한다. 본 명세서에서 사용되는 "메신저 RNA"(mRNA)는 단백질을 인코딩하고 번역되어 시험관내, 생체내, 인시튜 또는 생체외에서 인코딩된 단백질을 생산할 수 있는 임의의 폴리뉴클레오타이드를 지칭한다.

EEC는 단백질 또는 이의 단편을 인코딩한다. "단백질"은 펩타이드 결합에 의해 가장 흔히 함께 연결된 아미노산 잔기(천연 또는 비천연)의 폴리머를 지칭한다. 상기 용어는 임의의 크기, 구조, 또는 기능의 폴리펩타이드 및 펩타이드를 포함한다. 일부 예에서, 인코딩된 단백질은 50개의 아미노산보다 작으며, 단백질은 이후 펩타이드로 지칭된다. 단백질이 펩타이드인 경우, 이는 적어도 2개의 연결된 아미노산을 포함할 것이다. 단백질은 자연 발생 단백질, 합성 단백질, 동족체, 오르토로그, 파라로그, 단편, 재조합 단백질, 융합 단백질 및 이의 다른 등가물, 변이체, 및 유사체를 포함한다. 단백질은 단일 단백질일 수 있거나, 다이머, 트라이머 또는 테트라머와 같은 다분자 복합체일 수 있다. 이들은 또한 항체 또는 인슐린과 같은 단일 사슬 또는 다중 사슬 단백질을 포함할 수 있고, 회합되거나 연결될 수 있다. 가장 일반적으로 디설파이드 연결은 다중 사슬 단백질에서 발견된다. 용어 단백질은 또한 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 유사체인 아미노산 폴리머에 적용될 수 있다.

용어 "단백질 변이체"는 천연 또는 참조 서열과 아미노산 서열이 상이한 단백질을 지칭한다. 아미노산 서열 변이체는 천연 또는 참조 서열과 비교하여 아미노산 서열 내의 특정 위치에서 치환, 결실, 및/또는 삽입을 가질 수 있다. 일반적으로, 변이체는 천연 또는 참조 서열과 적어도 50%의 서열 동일성을 가질 것이며, 바람직하게는 이들은 천연 또는 참조 서열과 적어도 80%, 또는 더욱 바람직하게는 적어도 90%의 동일한 서열 동일성을 가질 것이다.

EEC는 생물학적 제제, 항체, 백신, 치료용 단백질 또는 펩타이드, 세포 침투 펩타이드, 분비된 단백질, 원형질막 단백질, 세포질 또는 세포골격 단백질, 세포내 막 결합 단백질, 핵 단백질, 인간 질환과 관련된 단백질, 표적화 모이어티 또는 치료적 징후가 확인되지 않았지만 그럼에도 불구하고 연구 및 발견의 영역에서 유용성을 갖는 인간 게놈에 의해 인코딩된 그러한 단백질을 포함하는, 수 개의 표적 카테고리 중 임의의 표적 카테고리로부터 선택된 단백질을 인코딩할 수 있다. 특정 단백질은 이러한 카테고리들 중 하나 이상에 속할 수 있다.

일부 실시형태에서, 특정 단백질을 인코딩하는 특정 서열이 사용된다. 이러한 특정 단백질은 녹색 형광 단백질(GFP), 인터루킨-2(IL-2), 및 POU5F1 또는 OCT¾를 포함한다(도 15 참조). GFP는 빛에 노출될 때 밝은 녹색 형광을 나타내는 단백질이다. 인간 POU5F1 또는 OCT3/4(본 명세서에서 hOCT4)는 줄기 세포 재프로그래밍 및 유지에 중요한 핵심 핵 전사 인자이다. IL-2는 면역 시스템에서 사이토카인 신호전달 분자의 한 타입인 인터루킨이다. 이는 백혈구의 활성을 조절하는 15.5 내지 16 kDa 단백질이다. IL-2는 미생물 감염에 대한 신체의 자연 반응의 일부이며, 외래("비-자기")와 "자기"를 구별한다. IL-2는 림프구에 의해 발현되는 IL-2 수용체에 결합함으로써 이의 효과를 매개한다. IL-2의 주요 공급원은 활성화된 CD4+ T 세포 및 활성화된 CD8+ T 세포이다.

본 명세서에 개시된 EEC는 하나 이상의 생물학적 제제를 인코딩할 수 있다. "생물학적 제제"는 질환 또는 의학적 병태를 치료, 치유, 완화, 예방 또는 진단하는 데 사용되는 단백질을 포함한다. 예시적인 생물학적 제제는 특히, 알레르기성 추출물(예를 들어, 알레르기 주사 및 시험용), 혈액 성분, 유전자 요법 생성물, 이식에 사용되는 인간 조직 또는 세포 생성물, 백신, 단클론성 항체, 사이토카인, 성장 인자, 효소, 혈전용해제 및 면역조절제를 포함한다.

항체. 본 명세서에 개시된 EEC는 하나 이상의 항체 또는 이의 단편을 인코딩할 수 있다. 용어 "항체"는 단클론성 항체(면역글로불린 Fc 영역을 갖는 전장 항체 포함), 폴리에피토프 특이성을 갖는 항체 조성물, 다중특이적 항체(예를 들어, 이중특이적 항체, 디아바디, 및 단일-사슬 분자)뿐만 아니라 항체 단편을 포함한다. 용어 "면역글로불린"(Ig)은 본 명세서에서 "항체"와 상호교환적으로 사용된다. 본 명세서에서 사용되는 "단클론성 항체"는 실질적으로 균질한 항체의 집단으로부터 수득된 항체를 지칭하며, 즉, 집단을 포함하는 개별 항체는 가능한 자연 발생 돌연변이 및/또는 소량으로 존재할 수 있는 번역-후 변형(예를 들어, 이성질체화, 아미드화)을 제외하고는 동일하다. 단클론성 항체는 단일 항원 부위에 대해 지시되는 매우 특이적이다.

본 명세서의 단클론성 항체는 구체적으로 요망되는 생물학적 활성을 나타내는 한, 중쇄 및/또는 경쇄의 일부가 특정 종으로부터 유래되거나 특정 항체 부류 또는 서브클래스에 속하는 항체의 상응하는 서열과 동일하거나 상동이고 사슬(들)의 나머지가 다른 종으로부터 유래되거나 또 다른 항체 클래스 또는 서브클래스에 속하는 항체 뿐만 아니라 이러한 항체의 단편의 상응하는 서열과 동일하거나 상동인 "키메라" 항체(면역글로불린)를 포함한다. 본 명세서에서 키메라 항체는 비-인간 영장류(예를 들어, 구대륙 원숭이, 유인원 등)로부터 유래된 가변 도메인 항원-결합 서열 및 인간 불변 영역 서열을 포함하는 "영장류화된" 항체를 포함한다.

"항체 단편"은 무손상 항체의 일부, 바람직하게는 무손상 항체의 항원 결합 및/또는 가변 영역을 포함한다. 항체 단편의 예는 Fab, Fab', F(ab')2 및 Fv 단편; 디아바디; 선형 항체; 나노바디; 단일-사슬 항체 분자 및 항체 단편으로부터 형성된 다중특이적 항체를 포함한다.

면역글로불린의 5가지 클래스, IgA, IgD, IgE, IgG 및 IgM 중 임의의 것은 각각 알파, 델타, 입실론, 감마 및 뮤(mu)로 지정된 중쇄를 포함하는 코딩 서열에 의해 인코딩될 수 있다. 또한 서브클래스, 감마 및 뮤를 인코딩하는 폴리뉴클레오타이드 서열이 포함된다. 따라서, 항체의 서브클래스의 임의의 것은 부분적으로 또는 전체적으로 인코딩될 수 있고, 하기 서브클래스를 포함할 수 있다: IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2.

특정 실시형태에서, 본 명세서에 개시된 EEC는 단클론성 항체 및/또는 이의 변이체를 인코딩할 수 있다. 항체의 변이체는 또한 치환 변이체, 보존적 아미노산 치환, 삽입 변이체, 결실 변이체 및/또는 공유 유도체를 포함할 수 있다. 특정 실시형태에서, 본 명세서에 개시된 EEC는 면역글로불린 Fc 영역을 인코딩할 수 있다. 또 다른 실시형태에서, EEC는 변이체 면역글로불린 Fc 영역을 인코딩할 수 있다. 비제한적인 예로서, EEC는 변이체 면역글로불린 Fc 영역을 갖는 항체를 인코딩할 수 있다.

특정 실시형태는 항-SARS-Cov2 항체, 항-SARS 항체, 항-RSV 항체, 항-HIV 항체, 항-뎅기열 바이러스 항체, 항-보르다텔라 백일해 항체, 항-C형 간염 항체, 항-인플루엔자 바이러스 항체, 항-인플루엔자 바이러스 항체, 항-파라인플루엔자 바이러스 항체, 항-메타뉴모바이러스(MPV) 항체, 항-사이토메갈로바이러스 항체, 항-엡슈타인 바르 바이러스 항체; 항-단순 포진 바이러스 항체, 항-클로스트리디움 디피실레 박테리아 독소 항체 또는 항-종양 괴사 인자(TNF) 항체를 인코딩한다.

공지된 항-RSV 항체는 팔리비주맙(palivizumab); 미국 특허 제9,403,900호에 기재된 것들; AB1128(MILLIPORE로부터 입수가능) 및 ab20745(ABCAM로부터 입수가능함)를 포함한다.

공지된 항-HIV 항체의 예는 10E8이며, 이는 gp41에 결합하는 광범위하게 중화 항체이다. VRC01은 gp120의 CD4 결합 부위에 결합하는 광범위한 중화 항체이다. 다른 예시적인 항-HIV 항체는 ab18633 및 39/5.4A(ABCAM로부터 입수 가능함); 및 H81E(THERMOFISHER로부터 입수 가능함)를 포함한다.

항-뎅기 바이러스 항체의 예는 항체 55(US 20170233460호에 기재됨); 항체 DB2-3(미국 특허 제8,637,035호에 기재됨); 및 ab155042 및 ab80914(둘 다 ABCAM으로부터 입수 가능함)를 포함한다.

항-백일해 항체는 미국 특허 제9,512,204호에 기재되어 있다.

항-C형 간염 항체의 예는 MAB8694(MILLIPORE로부터 입수 가능함) 및 C7-50(ABCAM으로부터 입수 가능함)을 포함한다.

항-인플루엔자 바이러스 항체는 미국 특허 제9,469,685호에 기재되어 있고, 또한 C102(TERMOFISHER로부터 입수 가능함)를 포함한다.

예시적인 항-MPV 항체는 MPE8을 포함한다.

예시적인 항-CMV 항체는 MCMV5322A, MCMV3068A, LJP538, 및 LJP539를 포함한다(또한, 예를 들어, 문헌[Deng et al., Antimicrobial Agents and Chemotherapy 62(2) e01108-17 (Feb. 2018); 및 Dole et al., Antimicrobial Agents and Chemotherapy 60(5) 2881-2887 (May 2016)] 참조).

항-HSV 항체의 예는 HSV8-N 및 MB66을 포함한다.

예시적인 항-클로스트리디움 디피실레 항체는 악톡수맙 및 베즐로톡수맙을 포함한다(또한, 예를 들어, 문헌[Wilcox et al., N Engl J Med 376(4) 305-317 (2017)] 참조).

본 개시내용의 교시 내에서 사용될 수 있는 다수의 추가적인 항체 서열이 이용 가능하고 당업자에게 공지되어 있다. 상업적으로 이용 가능한 항체에 대한 서열 정보는 Drug Bank 데이터베이스, CAS Registry, 및/또는 RSCB Protein Data Bank에서 확인될 수 있다.

백신. 본 명세서에 개시된 EEC는 하나 이상의 백신을 인코딩할 수 있다. 본 명세서에서 사용되는 "백신"은 질병 또는 감염을 유발하고/하거나 이를 발달시키는 데 필요한 제제에 대한 후천성 면역을 발생시키기 위해 면역 반응을 자극함으로써 특정 질환 또는 감염원에 대한 면역을 개선시키는 조성물이다. 예를 들어, 백신은 면역 시스템을 항원에 선제적으로 노출시킴으로써 특정 항원에 대한 면역 시스템 반응을 생성하는 제형이다. 병원체 항원은 온전하지만 비-감염성 형태의 병원체(예를 들어, 가열-사멸)일 수 있다. 항원은 또한 병원체의 단백질 또는 단백질 단편 또는 비정상 세포 타입(예를 들어, 감염된 세포 또는 암 세포)에 의해 발현되는 단백질 또는 단백질 단편일 수 있다. 면역 시스템이 선제적 노출 후 항원을 인식하는 경우, 이는 항원이 다시 맞닥뜨리는 경우 면역 시스템이 빠르고 효과적으로 효과적인 반응을 일으킬 수 있도록 장기 면역 기억을 유발할 수 있다.

예시적인 바이러스 백신 항원은 아데노바이러스, 아레나바이러스, 부냐바이러스, 코로나바이러스, 플라버바이러스, 한타바이러스, 헤파드나바이러스, 헤르페스바이러스, 유두종바이러스, 파라믹소바이러스, 파보바이러스, 피코르나바이러스, 폭스바이러스, 오르토믹소바이러스, 레트로바이러스, 라브도바이러스, 로타바이러스, 스폰지폼 바이러스 또는 토가바이러스로부터 유래될 수 있다. 특정 실시형태에서, 백신 항원은 CMV, EBV, 독감 바이러스, A형, B형, 또는 C형 간염, 단순 포진, HIV, 인플루엔자, 일본 뇌염, 홍역, 소아마비, 광견병, 호흡기 세포융합, 풍진, 천연두, 수두 대상포진, 웨스트 나일 및/또는 지카를 포함하는 바이러스에 의해 발현된 펩타이드를 포함한다.

전체 병원체로부터 유래된 백신 항원의 예는 OPV 소아마비 백신에 사용되는 약독화된 소아마비 바이러스, 및 IPV 소아마비 백신에 사용되는 사멸된 소아마비 바이러스를 포함한다.

추가의 특정 예로서, SARS-CoV-02 백신 항원은 스파이크 단백질 또는 이의 단편(예를 들어, 수용체 결합 도메인(RBD))을 포함하며; CMV 백신 항원은 외피 당단백질 B 및 CMV pp65를 포함하며; EBV 백신 항원은 EBV EBNAI, EBV P18, 및 EBV P23을 포함하며; 간염 백신 항원은 B형 간염 바이러스의 S, M, 및 L 단백질, B형 간염 바이러스의 전-S 항원, HBCAG DELTA, HBV HBE, C형 간염 바이러스 RNA, HCV NS3 및 HCV NS4를 포함하며; 단순 포진 백신 항원은 즉시 초기 단백질 및 당단백질 D를 포함하며; 인간 면역결핍 바이러스(HIV) 백신 항원은 gag, pol, 및 env 유전자의 유전자 생성물, 예를 들어, HIV gp32, HIV gp41, HIV gp120, HIV gp160, HIV P17/24, HIV P24, HIV P55 GAG, HIV P66 POL, HIV TAT, HIV GP36, Nef 단백질 및 역전사효소를 포함하며; 인간 유두종바이러스(HPV) 바이러스 항원은 L1 단백질을 포함하며; 인플루엔자 백신 항원은 헤마글루티닌 및 뉴라미니다제를 포함하며; 일본 뇌염 백신 항원은 단백질 E, M-E, ME-NS1, NS1, NS1-NS2A 및 80% E를 포함하며; 말라리아 백신 항원은 플라스모디움 단백질 포자소체(CSP), 글루타메이트 데하이드로게나제, 락테이트 데하이드로게나제, 및 프룩토스-비스포스페이트 알돌라제를 포함하며; 홍역 백신 항원은 홍역 바이러스 융합 단백질을 포함하며; 광견병 백신 항원은 광견병 당단백질 및 광견병 핵단백질을 포함하며; 호흡기 세포융합 백신 항원은 RSV 융합 단백질 및 M2 단백질을 포함하며; 로타바이러스 백신 항원은 VP7sc를 포함하며; 풍진 백신 항원은 단백질 E1 및 E2를 포함하며; 수두 대상포진 백신 항원은 gpl 및 gpll을 포함하며; 지카 백신 항원은 전-막, 외피(E), E 단백질의 도메인 III, 및 비-구조 단백질 1 내지 5를 포함한다.

추가적인 특정의 예시적인 바이러스 항원 서열은 Nef(66-97): (VGFPVTPQVPLRPMTYKAAVDLSHFLKEKGGL(서열번호 48)); Nef(116-145): (HTQGYFPDWQNYTPGPGVRYPLTFGWLYKL(서열번호 49)); Gag p17(17-35): (EKIRLRPGGKKKYKLKHIV(서열번호 50)); Gag p17-p24(253-284): (NPPIPVGEIYKRWIILGLNKIVRMYSPTSILD(서열번호 51)); Pol 325-355(RT 158-188): (AIFQSSMTKILEPFRKQNPDIVIYQYMDDLY(서열번호 52)); CSP 중심 반복 영역; (NANPNANPNANPNANPNANP(서열번호 53)); 및 E 단백질 도메인 III: (AFTFTKIPAETLHTVTEVQYAGTDGPCKVPAQMAVDMQTLTPVGRLITANPVITEGTENSKMMLELDPPFGDSYIVIGVGE(서열번호 54))를 포함한다. 바이러스 항원의 추가적인 예에 대해 문헌[Fundamental Virology, Second Edition, eds. Fields, B. N. and Knipe, D. M. (Raven Press, New York, 1991)]이 참조된다.

특정 실시형태에서, 백신 항원은 박테리아 감염과 관련된 세포에 의해 발현된다. 예시적인 박테리아는 탄저병; 그람-음성 간균, 클라미디아, 디프테리아, 헤모필루스 인플루엔자, 헬리코박터 파일로리(Helicobacter pylori), 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 백일해 독소, 폐렴구균, 리케차, 스타필로코커스, 스트렙토코커스 및 파상풍을 포함한다.

박테리아 백신 항원의 특정 예로서, 탄저병 백신 항원은 탄저병 보호 항원을 포함하며; 그람-음성 간균 백신 항원은 지질다당류를 포함하며; 헤모필루스 인플루엔자 백신 항원은 피막 다당류를 포함하며; 디프테리아 백신 항원은 디프테리아 독소를 포함하며; 마이코박테리움 투베르쿨로시스 백신 항원은 마이콜산, 열 충격 단백질 65(HSP65), 30 kDa 주요 분비 단백질 및 항원 85A를 포함하며; 백일해 독소 백신 항원은 헤마글루티닌, 퍼탁틴, FIM2, FIM3 및 아데닐레이트 사이클라제를 포함하며; 폐렴구균 백신 항원은 뉴몰리신 및 폐렴구균 피막 다당류를 포함하며; 리케차 백신 항원은 rompA를 포함하며; 연쇄상구균 백신 항원은 M 단백질을 포함하며; 파상풍 백신 항원은 파상풍 독소를 포함한다.

특정 실시형태에서, 백신 항원은 다제 내성 "슈퍼버그"로부터 유래된다. 슈퍼버그의 예는 엔테로코커스 패시움(Enterococcus faecium), 클로스트리디움 디피실레(Clostridium difficile), 아시네토박터 바우만니(Acinetobacter baumannii), 슈도모나스 아에루지노사(Pseudomonas aeruginosa), 및 엔테로박테리아세애(대장균, 클레브시엘라 뉴모니애, 엔테로박터 종 포함)를 포함한다.

백신 항원은 또한 암과 싸우기 위한 면역 시스템을 활성화시키기 위해 암 세포에 의해 특이적으로 또는 우선적으로 발현되는 단백질을 포함할 수 있다. 암 항원의 예는 A33; BAGE; B-세포 성숙 항원(BCMA); Bcl-2; β-카테닌; CA19-9; CA125; 카복시-언하이드라제-IX(CAIX); CD5; CD19; CD20; CD21; CD22; CD24; CD33; CD37; CD45; CD123; CD133; CEA; c-Met; CS-1; 사이클린 B1; DAGE; EBNA; EGFR; 에프린B2; 에스트로겐 수용체; FAP; 페리틴; 엽산-결합 단백질; GAGE; G250; GD-2; GM2; gp75, gp100(Pmel 17); HER-2/neu; HPV E6; HPV E7; Ki-67; L1-CAM; LRP; MAGE; MART; 메조텔린; MUC; MUM-1-B; myc; NYESO-1; p53, PRAME; 프로게스테론 수용체; PSA; PSCA; PSMA; ras; RORl; 서바이빈; SV40 T; 테나신; TSTA 티로시나제; VEGF; 및 WT1을 포함한다.

RNA 백신의 사용은 DNA 기반 백신의 잠재적 위험을 피하기 위한 매력적인 대안을 제공한다. DNA와 마찬가지로, RNA의 세포로의 전달은 또한 생체내에서 세포 및 체액 면역 반응 둘 다를 유도할 수 있다. 특히, 시험관내 전사된 RNA(IVT-RNA)를 이용한 면역요법을 위해 2개의 상이한 전략이 추구되었고, 둘 다 다양한 동물 모델에서 성공적으로 시험되었다. RNA는 상이한 면역화 경로에 의해 환자에게 직접 주사되거나 세포가 시험관내에서 통상적인 트랜스펙션 방법을 사용하여 IVT-RNA로 트랜스펙션된 다음 트랜스펙션된 세포가 환자에게 투여된다. 예를 들어, RNA는 번역되고 발현된 단백질은 면역 반응을 유도하기 위해 세포 표면의 MHC 분자에 제시될 수 있다.

치료용 단백질은 세포에 의해 발현될 때 기존의 의학적 병태 또는 장애를 치료하는 단백질을 지칭한다. "치료하다"는 단백질의 발현이 기존의 의학적 병태 또는 장애의 원인을 감소시키고/시키거나 의학적 병태 또는 장애(예를 들어, 통증, 염증, 울혈, 피로, 열, 오한)의 부작용을 감소시키는 것을 의미한다.

세포-침투 단백질. 본 명세서에 개시된 EEC는 하나 이상의 세포-침투 단백질(CPP, 세포 침투 펩타이드로도 지칭됨)을 인코딩할 수 있다. CPP는 분자의 세포 섭취 및 흡수를 촉진할 수 있는 단백질을 지칭한다. 일반적으로, 세포 침투 펩타이드는 세포막을 통해 상이한 타입의 카고 분자를 수송할 수 있고, 따라서 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 촉진할 수 있는 (짧은) 펩타이드이다. 통상적으로, 카고는 공유 결합을 통한 화학적 연결 또는 비공유 상호작용을 통해 펩타이드와 회합된다. 세포-침투 펩타이드는 상이한 크기, 아미노산 서열, 및 전하를 갖지만, 모든 CPP는 원형질막을 전위시키고 다양한 분자 카고의 세포질 또는 세포 소기관으로의 전달을 용이하게 하는 능력인 공통 특성을 갖는다. 현재, CPP 전위의 이론은 세 가지 주요 진입 메커니즘을 구별한다: 막에서의 직접 침투, 세포내이입-매개 진입, 및 일시적 구조의 형성을 통한 전위(Jafari S, Solmaz MD, Khosro A, 2015, Bioimpacts 5(2): 103-111; Madani F, Lindberg S, Langel LI, Futaki S, Graslund A, 2011, J Biophys: 414729).

CPP의 예는 페네트라틴(Derossi, D., et al., J Biol Chem, 1994. 269(14): p.10444-50); 단백질 형질도입에 필요한 TAT의 최소 도메인(Vives, E., P. Brodin, and B. Lebleu, J Biol Chem, 1997. 272(25): p.16010-7); 바이러스 단백질, 예를 들어, VP22(Elliott, C. and P. O'Hare, Cell, 1 997. 88(2): p.223-33) 및 ZEBRA(Rothe, R., et al., J Biol Chem, 2010. 285(26): p.20224-33); 독(venom)으로부터, 예를 들어, 멜리틴(Dempsey, CE, Biochim Biophys Acta, 1990. 1031 (2): p.143-61), 마스토포란(Konno, K., et al., Toxicon, 2000. 38(11): p.1505-15), 마우로칼신(Esteve, E., et al., J Biol Chem, 2005. 280(13): p.12833-9), 크로타민(Nascimento, FD, et al., J Biol Chem, 2007. 282(29): p.21349-60) 또는 부포린(Kobayashi, S., et al., Biochemistry, 2004. 43(49): p.15610-6); 또는 합성 CPP, 예를 들어, 폴리-아르기닌(R8, R9, R10 및 R12)(Futaki, S., et al., J Biol Chem, 2001. 276(8): p.5836-40) 또는 트랜스포탄(Pooga, M., et al., FASEB J, 1998. 12(1): p.67-77)을 포함한다.

CPP는 하나 이상의 검출 가능한 표지를 포함할 수 있다. 단백질은 부분적으로 표지되거나 전반적으로 완전히 표지될 수 있다. EEC는 검출 가능한 표지를 완전히, 부분적으로 인코딩할 수 있거나 전혀 인코딩하지 않을 수 있다. 세포-침투 펩타이드는 또한 신호 서열을 포함할 수 있다. 본 명세서에서 사용되는 "신호 서열"은 단백질 번역 동안 초기 단백질의 아미노 말단에 결합된 아미노산 잔기의 서열을 지칭한다. 신호 서열은 세포-침투 폴리펩타이드의 분비를 신호 전달하기 위해 사용될 수 있다.

EEC에 의해 인코딩된 CPP는 번역된 후 복합체를 형성할 수 있다. 복합체는 세포-침투 폴리펩타이드에 연결된 하전된 단백질을 포함할 수 있다.

특정 실시형태에서, CPP는 제1 도메인 및 제2 도메인을 포함할 수 있다. 제1 도메인은 초하전된 폴리펩타이드를 포함할 수 있다. 제2 도메인은 단백질-결합 파트너를 포함할 수 있다. 이러한 맥락에서 사용되는 "단백질-결합 파트너"는 항체 및 이의 기능성 단편, 스캐폴드 단백질, 또는 펩타이드를 포함한다. CPP는 단백질-결합 파트너에 대한 세포내 결합 파트너를 추가로 포함할 수 있다. CPP는 EEC가 도입된 세포로부터 분비될 수 있다. CPP는 또한 EEC가 도입된 세포를 침투할 수 있다.

추가 실시형태에서, CPP는 제2 세포를 침투할 수 있다. 제2 세포는 제1 세포와 동일한 영역으로부터 유래될 수 있거나, 상이한 영역으로부터 유래될 수 있다. 영역은 조직 및 기관을 포함할 수 있다. 제2 세포는 또한 제1 세포에 대해 근위 또는 원위에 있을 수 있다.

특정 실시형태에서, EEC는 또한 융합 단백질을 인코딩할 수 있다. 융합 단백질은 자연 발생 단백질에 함께 존재하지 않는 적어도 2개의 도메인을 포함한다. 도메인은 직접 융합될 수 있거나 개재 링커 서열을 통해 연결될 수 있다. 특정 예에서, 융합 단백질은 치료용 단백질에 연결된 하전된 단백질을 포함한다. "하전된 단백질"은 양성, 음성 또는 전체 중성 전하를 운반하는 단백질을 지칭한다. 바람직하게는, 치료용 단백질은 융합 단백질의 형성에서 하전된 단백질에 공유적으로 연결될 수 있다. 총 또는 표면 아미노산에 대한 표면 전하의 비율은 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9일 수 있다. 융합 단백질의 다른 예는 이중특이적 항체, 키메라 항원 수용체, 및 조작된 T 세포 수용체(TCR)를 포함한다.

분비된 단백질. 인간 및 다른 진핵 세포는 막에 의해 많은 기능적으로 별개의 구획으로 세분된다. 각각의 막-결합 구획, 또는 소기관은 소기관의 기능에 필수적인 상이한 단백질을 함유한다. 세포는 특정 세포 소기관으로 단백질을 표적화하기 위해 단백질 내에 위치한 아미노산 모티프인 "분류 신호"를 사용한다.

신호 서열, 신호 펩타이드, 또는 리더 서열로 불리는 한 가지 타입의 분류 신호는 단백질 부류를 소포체(ER)라고 하는 소기관으로 지시한다. 신호 서열에 의해 ER을 표적으로 하는 단백질은 분비된 단백질로서 세포외 공간으로 방출될 수 있다. 유사하게, 세포막에 존재하는 단백질은 또한 단백질을 막에 고정시키는 "링커"의 단백질분해 절단에 의해 세포외 공간으로 분비될 수 있다.

일부 실시형태에서, EEC는 대량의 인간 유전자 생성물을 제조하는 데 사용될 수 있다.

일부 실시형태에서, EEC는 원형질막의 단백질을 발현시키는 데 사용될 수 있다.

일부 실시형태에서, EEC는 세포질 또는 세포골격 단백질을 발현시키는 데 사용될 수 있다.

일부 실시형태에서, EEC는 세포내 막 결합된 단백질을 발현시키는 데 사용될 수 있다.

일부 실시형태에서, EEC는 핵 단백질을 발현시키는 데 사용될 수 있다.

일부 실시형태에서, EEC는 인간 질환과 관련된 단백질을 발현시키는 데 사용될 수 있다.

일부 실시형태에서, EEC는 현재 알려지지 않은 치료 기능을 갖는 단백질을 발현시키는 데 사용될 수 있다.

특정 예에서, EEC는 현재 시판 중이거나 개발 중인 하나 이상의 단백질을 인코딩한다. 현재 시판되고 있거나 개발 중인 단백질의 인코딩 폴리뉴클레오타이드를 EEC로 혼입시키면 본 명세서에 기재된 바와 같이 단백질 발현이 증가될 수 있다.

EEC는 코딩 서열 내에 자가-절단 펩타이드에 대한 코딩 서열을 포함시키거나 리보솜 스킵핑 요소를 포함함으로써 하나 초과의 단백질을 인코딩할 수 있다.

EEC에 의해 인코딩된 단백질은 혈액, 심혈관, CNS, 중독(항독제 포함), 피부과, 내분비학, 위장, 의료 영상, 근골격, 종양학, 면역학, 호흡기, 감각 및 항-감염성과 같은 많은 치료 영역에서 병태 또는 질환을 치료하는 데 이용될 수 있다.

대상체를 치료하기 위해 사용될 때, EEC는 투여를 위해 제형화될 수 있다.

EEC의 제형은 약리학 분야에 공지되어 있거나 이후 개발될 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 EEC를 부형제 및/또는 하나 이상의 다른 부속 성분과 회합시키는 단계, 및 이후, 필요 및/또는 바람직한 경우, 제형을 요망되는 단일- 또는 다중-용량 단위로 분할, 형상화 및/또는 패키징하는 단계를 포함한다.

본 개시에 따른 제형에서 EEC, 약제학적으로 허용 가능한 부형제, 및/또는 임의의 추가 성분의 상대량은 치료되는 대상체의 정체, 크기, 및/또는 상태에 따라 및 추가로 제형이 투여되는 경로에 따라 달라질 것이다. 예로서, 제형은 0.1% 내지 100%, 예를 들어, 0.5 내지 50%, 1 내지 30%, 5 내지 80%, 적어도 80%(w/w)의 활성 성분을 포함할 수 있다.

EEC 제형은 (1) 안정성을 증가시키고/시키거나; (2) 세포 트랜스펙션 증가시키고/시키거나; (3) (예를 들어, 데포 제형으로부터) 지속 또는 지연 방출을 허용하고/하거나; (4) 생체분포를 변경(예를 들어, 특정 조직 또는 세포 타입에 대한 표적화)하고/하거나; (5) 생체내에서 인코딩된 단백질의 방출 프로파일을 변경시키기 위해 하나 이상의 부형제를 포함할 수 있다. 임의의 및 모든 용매, 분산 매질, 희석제, 또는 다른 액체 비히클과 같은 전통적인 부형제 이외에, 분산 또는 현탁 보조제, 표면 활성제, 등장제, 증점제 또는 유화제, 보존제, 부형제는 또한 리피도이드, 리포솜, 지질 나노입자, 폴리머, 리포플렉스, 코어-쉘 나노입자, 펩타이드, 단백질, EEC로 트랜스펙션된 세포(예를 들어, 대상체로의 이식을 위해), 히알루로니다제, 나노입자 모방체 및 이들의 조합을 포함할 수 있다.

EEC의 시험관내 합성.

mRNA 생산의 과정은 시험관내 전사, cDNA 주형 제거 및 RNA 클린업, 및 mRNA 캡핑 및/또는 테일링 반응을 포함할 수 있다.

시험관내 전사 동안, 원하는 작제물로부터의 cDNA는 당 분야에 널리 공지된 기술에 따라 생산된다. 이러한 주어진 cDNA는 시험관내 전사(IVT) 시스템을 사용하여 전사될 수 있다. 이러한 IVT는 개시된 EEC의 시험관내 합성된 mRNA를 가능하게 할 수 있다. 시스템은 통상적으로 전사 완충제, 뉴클레오타이드 트리포스페이트(NTP), RNase 억제제 및 폴리머라제를 포함한다. NTP는 사내에서 제조될 수 있거나, 공급자로부터 선택될 수 있거나, 당 분야에 공지된 바와 같이 합성될 수 있다. NTP는 자연 발생 NTP로부터 선택된다. 폴리머라제는 T7 RNA 폴리머라제, T3 RNA 폴리머라제, SP6 RNA 폴리머라제 및 변형된 핵산을 혼입할 수 있는 폴리머라제와 같은 돌연변이체 폴리머라제로부터 선택될 수 있다.

포유동물 세포로의 EEC의 트랜스펙션. 본 명세서에 기재된 바와 같이 설계되고 합성된 EEC는 이후 다양한 세포 타입으로 트랜스펙션될 수 있으며, 여기서 오픈 리딩 프레임 내의 인코딩된 단백질은 관심 단백질로 번역될 것이다. 트랜스펙션은 당 분야에 공지된 임의의 방법, 예를 들어, 전기천공 및 리포펙션을 사용하여 발생할 수 있다. 다양한 세포 타입은 당 분야에 공지되어 있거나 공지될 수 있는 임의의 포유동물 세포를 포함한다. 사용될 수 있는 포유동물 세포의 예는 Jurkat, Raji, HEK293, 1차 섬유모세포, 1차 혈액 세포(다양한 백혈구 세포 포함), 1차 신장 세포, 1차 간 세포, 1차 췌장 세포 및 1차 뉴런을 포함한다.

본 개시내용은 포유동물 세포에서 번역을 위한 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공한다. 단백질은 세포질에 존재하고, 소기관으로 수송되고, 분비될 것들을 포함하는 매우 다양한 단백질로부터 선택될 수 있다. 이러한 EEC는 서열 CAUACUCA, 서열번호 2, 서열번호 3, 서열번호 38, 또는 서열번호 39 중 어느 하나를 포함하는 5' UTR 또는 서열번호 4, 5, 6 또는 7을 포함하는 3' UTR을 포함할 수 있다. 5' UTR은 또한 T7 폴리머라제 프로모터, 미니-인핸서 서열(CAUACUCA), 또는 Kozak 서열을 포함할 수 있다. 추가로, 박테리오파지 T7 프로모터는 조작된 서열에서 T7 클래스 III 프로모터(서열번호 2)로부터 선택될 수 있다.

본 개시내용은 또한 포유동물 세포에서 번역을 위한 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA에 대한 EEC를 제공하며, 여기서 EEC는 또한 정지 코돈(UAA/UAG/UGA)과 컨쥬게이션된 서열번호 4, 5, 6 또는 7을 포함하는 3' UTR을 포함할 수 있다. 또한, 시험관내-합성된 mRNA는 또한 a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC를 포함하는 3' UTR을 포함할 수 있다. 3' UTR 서열의 서열 (a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC)의 세트는 7개 이상의 뉴클레오타이드에 의해 분리될 수 있거나 7개 초과의 뉴클레오타이드일 수 있다. 우선적으로는, 3' UTR 서열에서 뉴클레오타이드의 총 수는 50개 이하의 뉴클레오타이드일 수 있다.

본 개시내용은 EEC를 제공하며, 조작된 시험관내-합성된 mRNA에 대한 방법은 미니-인핸서 서열(CAUACUCA) 서열번호 2, 서열번호 3, 서열번호 38 또는 서열번호 39 중 어느 하나를 포함하는 5' UTR 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' UTR을 포함할 수 있다. 또한, 조작된 시험관내-합성된 mRNA는 미니-인핸서 서열(CAUACUCA), 서열번호 2, 서열번호 3, 서열번호 38 또는 서열번호 39를 포함하는 5' UTR 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' UTR을 포함할 수 있다. 또한, 조작된 시험관내-합성된 mRNA는 미니-인핸서 서열(CAUACUCA) 서열번호 2, 서열번호 3, 서열번호 38, 또는 서열번호 39 중 어느 하나 및 서열번호 4, 5, 6 또는 7 중 하나를 포함할 수 있다. 또한, 본 개시내용의 EEC는 녹색 형광 단백질(GFP), 인간 인터루킨-2(IL2) 및 인간 POU5F1(또는 OCT3/4) 중 어느 하나를 인코딩하는 코딩 서열을 갖는 조작된 mRNA를 포함할 수 있다. 본 개시내용은 또한 시험관내-합성된 RNA가 인코딩된 단백질의 발현 수준을 증가시키는 EEC를 제공한다. 또한, 특정 예에서, 본 개시내용의 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않고/않거나 임의의 마이크로RNA 결합 부위를 포함하지 않는다. 추가의 예에서, 본 개시내용의 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않고, 임의의 마이크로RNA 결합 부위를 포함하지 않고, 임의의 면역-회피제를 포함하지 않는다.

본 명세서에 기재된 바와 같이, EEC는 단백질의 발현을 증가시킨다. 이러한 증가는 5' UTR에 미니-인핸서 서열을 포함하지 않는 코딩 서열과 비교할 때, 3' UTR에 스템-루프 서열을 포함하지 않는 코딩 서열과 비교할 때, 5' UTR의 미니-인핸서 서열 및 3' UTR의 스템-루프 서열을 포함하지 않는 코딩 서열과 비교할 때, 변형된 뉴클레오타이드를 함유하지만 본 명세서에 개시된 EEC를 함유하지 않는 코딩 서열과 비교할 때 단백질의 천연 발현 수준과 관련될 수 있고/있거나 단백질이 역사적으로 또는 통상적으로 발현된 방식과 관련될 수 있다. 특정 예에서, 증가된 단백질 발현은 관련 대조군 시스템 또는 조건과 비교하여 적어도 10% 더 많은 단백질 발현, 적어도 20% 더 많은 단백질 발현, 적어도 30% 더 많은 단백질 발현, 적어도 40% 더 많은 단백질 발현, 적어도 50% 더 많은 단백질 발현, 적어도 60% 더 많은 단백질 발현, 적어도 70% 더 많은 단백질 발현, 적어도 80% 더 많은 단백질 발현, 적어도 90% 더 많은 단백질 발현, 적어도 100% 더 많은 단백질 발현, 적어도 200% 더 많은 단백질 발현, 적어도 300% 더 많은 단백질 발현이다.

하기 예시적인 실시형태 및 실시예는 본 개시내용의 특정 실시형태를 입증하기 위해 포함된다. 당업자는 본 개시에 비추어, 본 명세서에 개시된 특정 실시형태에 많은 변경이 이루어질 수 있고, 개시의 사상 및 범위를 벗어나지 않고 여전히 동일하거나 유사한 결과를 얻을 수 있음을 인지해야 한다.

예시적인 실시형태.

1. 코딩 서열에 작동 가능하게 연결된 5' 비번역 영역(UTR)을 갖되, 상기 5' UTR은 최소 프로모터와 Kozak 서열 사이에 CAUACUCA에 제시된 서열을 갖는, 조작된 발현 작제물(EEC).

2. 실시형태 1에 있어서, 상기 최소 프로모터는 T7 프로모터인, EEC.

3. 실시형태 2에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, EEC.

4. 실시형태 1 내지 3 중 임의의 것에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 A 또는 G인, EEC.

5. 실시형태 1 내지 4 중 임의의 것에 있어서, 상기 5' UTR은

(i) 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열 또는

(ii) 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열

을 갖는, EEC.

6. 실시형태 5에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, EEC.

7. 실시형태 5에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, EEC.

8. 실시형태 1 내지 7 중 임의의 것에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, EEC.

9. 실시형태 1 내지 8 중 임의의 것에 있어서, 3' UTR을 추가로 포함하는, EEC.

10. 실시형태 9에 있어서, 상기 3' UTR은 스페이서, 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는, EEC.

11. 실시형태 10에 있어서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 갖는, EEC.

12. 실시형태 10 또는 11에 있어서, 상기 스페이서는 서열 [N_1-3]AUA 또는 [N_1-3]AAA를 갖는, EEC.

13. 실시형태 10 또는 11에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, EEC.

14. 실시형태 10 내지 13 중 임의의 것에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열(hybridizing sequence)을 갖는, EEC.

15. 실시형태 10 내지 13 중 임의의 것에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 갖는, EEC.

16. 실시형태 10 내지 15 중 임의의 것에 있어서, 상기 스템 루프 구조는 7개 이상의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.

17. 실시형태 10 내지 16 중 임의의 것에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.

18. 실시형태 10 내지 17 중 임의의 것에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, EEC.

19. 실시형태 9 내지 18 중 임의의 것에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, EEC.

20. 실시형태 9 내지 19 중 임의의 것에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, EEC.

21. 실시형태 20에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, EEC.

22. 실시형태 20 또는 21에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, EEC.

23. 실시형태 9 내지 22 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, EEC.

24. 실시형태 9 내지 22 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, EEC.

25. 실시형태 9 내지 24 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, EEC.

26. 실시형태 1 내지 25 중 임의의 것에 있어서, 상기 EEC는 시험관내-합성된 메신저 RNA(mRNA)를 포함하는, EEC.

27. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 녹색 형광 단백질(GFP), 인간 인터루킨-2(IL2) 또는 인간 POU5F1(또는 OCT3/4)을 인코딩하는, EEC.

28. 실시형태 1 내지 27 중 임의의 것에 있어서, 서열번호 56, 58 또는 60에 제시된 서열을 갖는, EEC.

29. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 치료용 단백질을 인코딩하는, EEC.

30. 실시형태 29에 있어서, 상기 치료용 단백질은 항체 또는 이의 결합 단편을 포함하는, EEC.

31. 실시형태 30에 있어서, 상기 항체 또는 이의 결합 단편은 항-SARS-Cov2 항체 또는 이의 결합 단편, 항-SARS 항체 또는 이의 결합 단편, 항-RSV 항체 또는 이의 결합 단편, 항-HIV 항체 또는 이의 결합 단편, 항-뎅기 바이러스 항체 또는 이의 결합 단편, 항-보르다텔라 백일해 항체 또는 이의 결합 단편, 항-C형 간염 항체 또는 이의 결합 단편, 항-인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-파라인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-메타뉴모바이러스(MPV) 항체 또는 이의 결합 단편, 항-사이토메갈로바이러스 항체 또는 이의 결합 단편, 항-엡스타인 바 바이러스 항체; 항-단순 포진 바이러스 항체 또는 이의 결합 단편, 항-클로스트리디움 디피실레 박테리아 독소 항체 또는 이의 결합 단편, 또는 항-종양 괴사 인자(TNF) 항체 또는 이의 결합 단편을 포함하는, EEC.

32. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 백신 항원을 인코딩하는, EEC.

33. 실시형태 32에 있어서, 상기 백신 항원은 SARS-CoV-02 백신 항원, CMV 백신 항원, EBV 백신 항원, 간염 백신 항원, 단순 포진 백신 항원, 인간 면역결핍 바이러스(HIV), 백신 항원, 인간 유두종바이러스(HPV) 바이러스 항원, 인플루엔자 백신 항원, 일본 뇌염 백신 항원, 말라리아 백신 항원, 홍역 백신 항원, 광견병 백신 항원, 호흡기 세포융합 백신 항원, 로타바이러스 백신 항원, 수두 대상포진 백신 항원 또는 지카 백신 항원을 포함하는, EEC.

34. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 사이토카인을 인코딩하는, EEC.

35. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, EEC.

36. 실시형태 35에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, EEC.

37. 실시형태 1 내지 36 중 임의의 것에 있어서, 상기 EEC는 변형된 뉴클레오사이드를 포함하지 않는, EEC.

38. 실시형태 1 내지 37 중 임의의 것에 있어서, 상기 EEC는 마이크로RNA 결합 부위를 포함하지 않는, EEC.

39. 실시형태 1 내지 38 중 임의의 것에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, EEC.

40. 실시형태 40에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, EEC.

41. 실시형태 1 내지 38 중 임의의 것에 있어서, 상기 EEC는 면역 회피 인자를 포함하지 않는, EEC.

42. 실시형태 1 내지 41 중 임의의 것에 있어서, 대상체에 대한 투여용으로 제형화된, EEC.

43. 서열번호 38에 제시된 서열을 포함하는 5' 비번역 영역(UTR) 및 서열번호 13, 14 또는 15에 제시된 서열을 포함하는 3' UTR에 작동 가능하게 연결된 코딩 서열을 갖는 조작된 발현 작제물(EEC).

44. CAUACUCA에 제시된 서열을 포함하는, 인핸서 서열.

45. CAUACUCA에 제시된 서열의 1, 2, 3, 4 또는 5개 복사체를 갖는, 조작된 발현 작제물(EEC).

46. 실시형태 44에 있어서, 상기 인핸서 서열은 프로모터에 작동 가능하게 연결된, EEC.

47. 실시형태 46에 있어서, 상기 프로모터는 최소 프로모터인, EEC.

48. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임(open reading frame) 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 CAUACUCA를 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.

49. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7을 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.

50. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 T7 폴리머라제 프로모터, CAUACUCA에 제시된 서열, 및 Kozak 서열을 포함하는 5' 비번역 영역을 추가로 포함하는, 조작된 발현 작제물.

51. 실시형태 1 내지 42 중 임의의 것에 있어서, 상기 T7 프로모터는 T7 클래스 III 프로모터로부터 선택되는, 조작된 발현 작제물.

52. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 4, 5, 6 또는 7 및 정지 코돈을 포함하는 3' 비번역 영역을 포함하는, 조작된 발현 작제물.

53. 실시형태 52에 있어서, 상기 정지 코돈은 UAA, UAG, 또는 UGA인, 조작된 발현 작제물.

54. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물.

55. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물(EEC)로서, 상기 시험관내-합성된 RNA는 a) AAACCUC 및 GAGG 또는 b) AAAGAGG 및 CCUC 중 어느 하나를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물(EEC).

56. 최소 프로모터와 Kozak 서열 사이에 있는 CAUACUCA에 제시된 서열을 포함하는, 5' 비번역 영역(UTR).

57. 실시형태 56에 있어서, 상기 최소 프로모터는 T7 프로모터인, 5' UTR.

58. 실시형태 57에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, 5' UTR.

59. 실시형태 56 내지 58 중 임의의 것에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 아데노신 또는 구아닌인, 5' UTR.

60. 실시형태 56 내지 59 중 임의의 것에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열을 포함하는, 5' UTR.

61. 실시형태 56 내지 60 중 임의의 것에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열을 포함하는, 5' UTR.

62. 실시형태 60에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, 5' UTR.

63. 실시형태 61에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, 5' UTR.

64. 실시형태 56 내지 63 중 임의의 것에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, 5' UTR.

65. 스페이서 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는 3' UTR로서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 가지며, 상기 스페이서는 서열 [N_1-3]AUA 또는 [N_1-3]AAA을 갖는, 3' UTR.

66. 실시형태 65에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, 3' UTR.

67. 실시형태 65 또는 66에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열을 포함하는, 3' UTR.

68. 실시형태 65 내지 67 중 임의의 것에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 포함하는, 3' UTR.

69. 실시형태 65 내지 68 중 임의의 것에 있어서, 상기 스템 루프 구조는 적어도 7개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.

70. 실시형태 65 내지 69 중 임의의 것에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.

71. 실시형태 65 내지 70 중 임의의 것에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, 3' UTR.

72. 실시형태 65 내지 71 중 임의의 것에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, 3' UTR.

73. 실시형태 65 내지 72 중 임의의 것에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, 3' UTR.

74. 실시형태 73에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, 3' UTR.

75. 실시형태 73 또는 74에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, 3' UTR.

76. 실시형태 65 내지 75 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, 3' UTR.

77. 실시형태 65 내지 75 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, 3' UTR.

78. 실시형태 65 내지 77 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, 3' UTR.

79. 실시형태 65 내지 78 중 임의의 것에 있어서, 상기 3' UTR은 코딩 서열에 작동 가능하게 연결된, 3' UTR.

80. 실시형태 79에 있어서, 상기 코딩 서열은 치료용 단백질, 백신 항원, 사이토카인, 또는 형광 단백질을 인코딩하는, 3' UTR.

81. 실시형태 79 또는 80에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, 3' UTR.

82. 실시형태 81에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, 3' UTR.

83. 실시형태 79 내지 80 중 임의의 것에 있어서, 상기 코딩 서열은 면역 회피 인자를 포함하지 않는, 3' UTR.

84. 실시형태 79 내지 83 중 임의의 것에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, 3' UTR.

85. 실시형태 84에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, 3' UTR.

86. 본 명세서에 개시된 바와 같은 5' UTR 및/또는 3' UTR.

87. 코딩 서열에 작동 가능하게 연결된 본 명세서에 개시된 바와 같은 5' UTR 및/또는 3' UTR.

실험예. 실시예 1. 재료 및 방법. UTR 설계 및 구조 예측. 4개 내지 10개의 뉴클레오타이드 길이인 최소 전사 및 번역 요소(예를 들어, 모두 본 명세서에 기재된 독특한 5' UTR 인핸서, T7 헥사머 및 Kozak 서열)를 어셈블링하여 본 개시내용의 UTR을 구성하였다. 스템 루프 특징에 기초하여, 시험을 위해 합성 3' 서열을 어셈블링하였다. 2차 구조 예측 웹서버(ma.urmc.rochester.edu/RNAstructureWeb/)를 디폴트 파라미터와 함께 이용하여 다양한 UTR 서열로부터 스템 루프 2차 구조가 형성될 가능성을 조사하였다.

[표 1]

mRNA 합성. Integrated DNA Technologies Inc.(IDT)로부터의 DNA 단편을 폴리머라제 연쇄 반응(PCR)에서 사용하여 표 1에 제시된 올리고뉴클레오타이드에 의해 T7 프로모터, UTR, 및 폴리아데노신(40개의 아데노신) 서열을 작제하였다. 이어서, 주형을 T7 RNA 폴리머라제, 항-역전 캡 유사체(ARCA)와의 전사 반응에서 사용하여 mRNA를 합성하였다(HiScribe™ T7 ARCA mRNA Kit, NEB). 이에 따라, DNase I 처리 후, mRNA를 정량화 및 저장하였다.

세포 배양. HEK293(ATCC® CRL-1573™), Jurkat, 클론 E6-1(ATCC® TIB-152™) 및 Raji(ATCC® CCL-86™) 세포를 ATCC(American Type Culture Collection)로부터 입수하였다. 모든 세포를 5% CO₂와 함께 37℃에서 유지시켰다. HEK293 배지는 10% 우태아 혈청(FBS)을 갖는 이글 최소 필수 배지(Eagle's Minimum Essential Medium; EMEM)(ATCC® 30-2003™)를 포함한다. Jurkat 및 Raji 세포를 10% FBS가 보충된 RPMI-1640 배지(ATCC® 30-2001™)에서 유지시켰다. Expi293™ 발현 시스템 키트(ThermoFisher)를 제조사의 지침에 따라 사용하였다.

트랜스펙션 및 전기천공. 최적의 트랜스펙션 파라미터를 위해, 전장 UTR을 포함하는 증가하는 수준의 EEC로 세포를 트랜스펙션시켰다. 비교 연구를 위해, HEK293 세포를 MessengerMax 리포펙타민(Thermo Fisher Scientific, Inc.)과 혼합된 0.4 내지 1 피코몰의 mRNA로 트랜스펙션시켰다. Jurkat 및 Raji 세포를 jetMessenger(PolyPlus)와 혼합된 0 내지 16 pmol의 GFP-인코딩 EEC로 트랜스펙션시켰다. 전기천공을 위해, Neon Transfection System(Thermo Fisher Scientific, Inc.)을 제조사의 매뉴얼에 따라 사용하였다. 최적의 전기천공 파라미터(전압, 지속기간 및 펄스 수)에 대해 데이터베이스를 참조하였다.

유세포분석. 세포를 4% 파라포름알데히드로 30 내지 60분 동안 고정시키고, 포스페이트 완충된 염수(PBS)에 저장하였다. hOCT3/4 염색을 위해, 세포를 침투시키고, 항체(BioLegend)와 함께 인큐베이션하고, 2회 세척하고, 사용할 때까지 PBS에 저장하였다. 세포를 FACSCalibur(BD) 및 CytoFlex(Beckman Coulter) 유세포 분석기에서 분석하고, FlowJo 소프트웨어에서 분석하였다.

ELISA. 트랜스펙션 24시간 후, 세포 배지를 수집하고, 회전시키고, 이에 따라 희석하였다. 인간 IL2 ELISA(BioLegend)를 사용하여 제조사의 프로토콜에 따라 발현을 정량하였다. 간략하게, 플레이트(Costar)를 포획 항체로 코팅한 후, 희석된 세포 배지, 검출 항체 및 아비딘-HRP와 함께 인큐베이션하였다. 흡광도(450nm)를 판독하고, 분석하였다.

실시예 2. 개시된 독특한 5' UTR 서열을 함유하는 EEC는 5' UTR 서열이 없는 것과 비교할 때 단백질 발현을 증가시켰다. 단백질 발현을 증가시키는 EEC 서열의 능력을 시험하기 위해, 리포터 단백질로서 GFP를 갖는 변형된 5' UTR 및 3' UTR 서열을 함유하는 EEC를 EXPI293 현탁액 세포(Thermo Fisher Scientific, Inc.)에 트랜스펙션시켰다. HEK293 세포주로부터 유래된 EXPI293 현탁 세포는 고단백질 발현을 위해 설계되었기 때문에, 이를 초기에 이용하였다. 실험에 사용하기 위한 적절한 양의 mRNA를 결정하기 위해, EXPI293 세포를 EXPIfectamine 트랜스펙션 시약을 사용하여 0 내지 2 피코몰(0 내지 500 ng) 범위의 증가하는 수준의 GFP-인코딩 EEC로 트랜스펙션시켰다. 24시간 후, 세포를 상기 기재된 바와 같이 유세포 분석법에 적용하였다. 이러한 실험에서, GFP 형광 신호는 세포에서 이의 단백질 수준에 비례하는 것으로 간주된다. 도 2에 도시된 바와 같이, 유세포 분석 데이터는 GFP 중간 강도가 6.0×10⁵개 세포 당 0.4 피코몰(100 ng)의 mRNA에서 포화됨을 시사하였다.

다음으로, 세포를 다양한 5' UTR 서열을 갖는 등몰의 mRNA로 트랜스펙션시키고, 트랜스펙션 후 3시간 및 24시간 시점에 GFP 발현을 분석하였다. 다양한 5' UTR 서열은 Kozak 공통 서열(M3)을 갖는 (M1)(T7 프로모터); (M1, M2((CAUACUCA), 및 M3)이거나, 5' 메틸 캡 및 T7 헥사머를 너머, 임의의 추가적인 5' UTR 없는 것이다. 중요하게는, 모든 작제물은 5' 메틸 캡 및 T7 육량체를 함유한다. 도 3a 및 도 3b는 이러한 실험의 결과를 도시한다. 여기서, 도 3a 및 도 3b는 트랜스펙션 3시간 후(도 3a) 및 트랜스펙션 24시간 후(도 3b)에 GFP-인코딩 EEC 5' UTR 변이체에 대해 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프뿐만 아니라 데이터를 도시한 막대 그래프를 도시한다. 예상대로, UTR을 함유하지 않는 전사체로 트랜스펙션된 세포(T7 헥사머 GGGAGA만을 함유하는 작제물)는 트랜스펙션 후 모든 시점에서 GFP 신호의 가장 낮은 중간 강도를 나타내었다(도 3a, 3b). R 위치에 A를 갖는 Kozak 공통 서열의 첨가는 단백질 발현을 200%만큼 증가시킨 반면, 독특한 번역 인핸서(CAUACUCA)의 추가 첨가는 5' UTR 전사체로 처리되지 않은 세포에서 검출된 GFP 신호를 초과하게, GFP 발현을 3시간 및 24시간 시점에 각각 635% 및 240%로 증가시켰다.

따라서, 이러한 실험은 독특하고 조작된 5' UTR, 특히 독특한 번역 인핸서를 보유하는 것들이 단백질 발현을 극적으로 증가시키는데 결정적이었다는 것을 입증한다.

실시예 3. 다양한 5' UTR 서열과 함께 EEC에 독특한 3' UTR 서열을 포함시키면 단백질 발현이 증가하였다. 다음으로, GFP 발현에 대한 독특한 3' UTR의 첨가 효과를 조사하였다. 이러한 실험의 결과는 도 4a 및 도 4b에 도시되어 있다. 도 4a 및 도 4b는 트랜스펙션 3시간 후(도 4a) 및 트랜스펙션 24시간 후(도 4b)에 5' UTR 및 3' UTR 변이체를 함유하는 GFP-인코딩 EEC에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프뿐만 아니라 데이터를 도시하는 막대 그래프를 도시한다. EXPI293 세포를 등몰량의 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체, RNA 없음(음성 대조군) 3' UTR 단독 mRNA(5' UTR 없음), M3 단독 5' UTR + 3' UTR, 및 M1, M2 및 M3 5' UTR + 3' UTR로 트랜스펙션시켰다. 도 4a 및 도 4b에서 알 수 있는 바와 같이, 3' UTR만을 함유하는 전사체로 트랜스펙션된 세포는 조사된 모든 시점에서 낮은 수준의 GFP 발현을 나타내었다. 3' UTR과 함께 Kozak 공통 서열의 첨가는 GFP 중간 강도의 완만한 증가를 초래한다. 그러나, 3' UTR(서열번호 10)과 함께 전장 5'(서열번호 2) UTR의 첨가는 각각 3시간 및 24시간 시점에서 GFP 발현을 660% 및 925%만큼 증가시켰다. 전장 5'(서열번호 2) UTR만을 함유하는 전사체로 처리된 세포와 비교할 때, 3'(서열번호 10) UTR의 첨가는 GFP 신호를 137%만큼 추가로 증가시켰다. 중요하게는, 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 mRNA를 수용하는 세포는 가장 높은 GFP 강도를 나타내었다.

따라서, 이러한 실험은 요망되는 경우, 단백질 발현 수준을 추가로 증가시키기 위해 mRNA에 본 발명의 3' 스템 루프를 포함시키는 것의 중요성을 입증한다.

실시예 4. 독특한 5' UTR 및 3' UTR 서열을 갖는 EEC는 다양한 단백질 타입을 사용하여 단백질 발현을 증가시켰다. 조작된 UTR이 다양한 단백질의 발현을 증가시키는데 유용하다는 것을 보장하기 위해, 독특한 특성을 갖는 단백질을 코딩하는데 이들의 우수성이 입증되었다. 도 5는 본 명세서에 개시된 EEC에서 시험된 3개의 상이한 타입의 단백질을 예시한다: 세포질(GFP), 소기관(즉, 핵 구획; 여기서, 인간 POU5F1 또는 OCT3/4) 및 세포외 구획(즉, 분비 단백질; 여기서, IL2)에서 단백질의 표적화된 발현. 독특한 5' UTR 및 3' UTR 서열이 세포질 단백질 발현(GFP)의 발현에 어떻게 영향을 미치는지 조사하기 위해, 실시예 2 및 3; 도 3a 내지 도 4b가 참조된다.

줄기 세포 재프로그래밍에서 핵심 핵 전사 인자인 인간 POU5F1 또는 OCT3/4(본 명세서에서 hOCT4)(Yu et al., Induced pluripotent stem cell lines based from human somatic cells. Science(80). (2007), doi:10.1126/science.1151526)를 이용하여 소기관-결합된 단백질의 발현에 대한 본 발명의 UTR의 효과를 결정하였다. GFP와 유사하게, 증가하는 양(0 내지 4.8 pmol)의 hOCT4-인코딩 mRNA로 HEK293 세포를 처리하면 24시간 후에 세포 내에서 이의 단백질 수준이 상승하였다(도 11a 및 도 11c). hOCT4+ 세포의 백분율은 2.0×10⁵개 세포 당 1.2 pmol의 mRNA에서 최대치(75%)에 도달하였다. 5' 및 3' 변이체를 갖는 등몰 hOCT4 전사체로 HEK293 세포를 트랜스펙션시킴으로써, 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 것들만이 상당한 백분율의 hOCT4+ 세포(40%)를 나타내었다. 또한, 중간 {실험 횟수 = 2} hOCT4 강도는 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 hOCT4 mRNA로 처리된 그러한 세포에서 4배 더 높았다(도 11a, 11b).

마지막으로, 분비 단백질, 인간 인터루킨-2(hIL2)의 발현에 대한 본 발명의 UTR의 효과를 조사하였다. hIL2는 T 림프구를 활성화시키고, 현재 자가면역 장애 및 암에서 치료 표적이다(Spolski, Li, & Leonard, Biology and regulation of IL-2: from molecular mechanisms to human therapy. Nat. Rev. Immunol. (2018), doi:10.1038/s41577-018-0046-y). 상기 실험과 유사하게, HEK293 세포를 증가하는 수준의 hIL2-인코딩 mRNA(전장 5'(서열번호 2) 및 3'(서열번호 10) UTR 포함)로 트랜스펙션시켰다. hIL2 단백질 수준의 비례적인 증가는 트랜스펙션 24시간 후에 ELISA에 의해 관찰되었다(도 11a). 추가로, UTR 변이체로 hIL2 mRNA의 트랜스펙션은 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR이 둘 다 존재할 때 관찰된 최고 수준으로 hIL2 단백질의 발현을 초래하였다(도 11b).

따라서, 이러한 실험은 본 발명의 조작된 UTR 둘 다를 보유하는 mRNA가 다양한 단백질 타입을 사용하여 단백질 발현을 증가시키는데 유리하다는 것을 보여주었다.

실시예 5. 본 발명의 5' UTR 및 3' UTR 서열을 갖는 EEC는 다양한 세포 타입에서 단백질 발현을 증가시켰다.

단백질 발현의 증가가 다른 세포 타입에서 복제될 수 있는지 여부를 조사하기 위해, 상기 실험을 하기 세포주에서 반복하였다: HEK293(ATCC® CRL1573TM), Jurkat(클론 E6-1; ATCC® TIB-152) 및 Raji(ATCC® CCL-86) 림프구. 부착성 HEK293 세포는 아데노바이러스 타입 5 DNA의 전단 단편으로 형질전환된 인간 배아 신장으로부터 유래된다(Graham et al., Characteristics of a human cell line transformed by DNA from human adenovirus type 5. J. Gen. Virol. (1977), doi:10.1099/0022-1317-36-1-59). 시딩된 HEK293 세포를 5'(서열번호 2) 및 3'(서열번호 10) UTR 둘 다를 함유하는 증가하는 양의 새로운 로트의 GFP-인코딩 EEC로 처리하였다. 이러한 실험을 실시예 1에 기재된 바와 같이 MessengerMax 리포펙타민 시약(ThermoFisher)을 사용하여 mRNA 트랜스펙션으로서 수행하였다. 도 6a, 도 6b, 및 도 6c에 도시된 바와 같이, 세포의 거의 90%가 1 피코몰(250 ng)의 GFP-인코딩 EEC에서 신호 포화도를 갖는 GFP 신호를 나타내었다. 더 많은 양의 mRNA로 세포의 처리는 GFP 양성 세포의 백분율을 단지 약간 증가시켰다. 단백질 발현의 양을 나타내는 중앙 GFP 강도의 측면에서, 포화는 2 pmol(500 ng)에 도달하였다.

후속하여, HEK293 세포를 개시된 5'(서열번호 2) 및 3'(서열번호 10) UTR을 함유하는 0.4 내지 1 pmol의 다양한 EEC로 처리하였다(도 7a 및 도 7b). 모든 mRNA 변이체가 세포의 60 내지 80%에서 GFP의 발현을 유도한 반면, 전장 UTR로 처리된 세포만이 다른 것과 비교하여 GFP 중간 강도의 5배를 나타내었다(도 7c). 중간 강도는 2회의 실험으로부터 계산되었다.

다음으로, 림프구 라인, Jurkat 및 Raji에서 상기 실험을 반복하였다. Jurkat은 급성 T 세포 백혈병을 갖는 14세 소년의 말초 혈액으로부터 확립된 T 림프구이다(Schneider, Schwenk, & Bornkamm, Characterization of EBV-genome negative "null" and "T" cell lines derived from children with acute lymphoblastic leukemia and leukemic transformed non-Hodgkin lymphoma. Int. J. Cancer (1977), doi:10.1002/ijc.2910190505). Raji 세포는 버킷 림프종을 갖는 11세 남성 환자로부터의 B 림프구이다(Osunkoya, The preservation of burkitt tumor cells at middlely low temperature. Br. J. Cancer (1965), doi:10.1038/bjc.1965.87; Pulvertaft, 단기 조직 배양에 의한 나이지리아의 악성 종양 연구. J. Clin. 파톨. (1965), doi:10.1136/jcp.18.3.261). 이러한 실험에서, mRNA 트랜스펙션을 jetMessenger 시약(Polyplus-transfection®)으로 수행하였다. 90% 트랜스펙션 효율을 갖는 HEK293 세포(즉, GFP 양성 세포)와 대조적으로, Jurkat 세포의 10%만이 가장 높은 mRNA 양(16 pmol)에서 GFP 신호를 나타내었다(도 7a). 또한, 등몰의 다양한 작제물로 처리된 세포는 단지 약간의 GFP 신호를 나타내었지만, 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 함유하는 전사체로 트랜스펙션된 세포는 가장 높은 수의 GFP 양성 세포(14%; 도 7b)를 나타내었다. Raji 세포에서 유사한 결과가 관찰된다(데이터는 제시되지 않음).

따라서, 이러한 실험은 본 발명의 조작된 UTR이 다양한 세포 타입에서 단백질 발현을 증가시키는데 도움이 된다는 것을 보여준다.

실시예 6. 트랜스펙션 방법은 본 명세서에 개시된 EEC의 단백질-발현 증가 효과에 중요하지 않았다. 트랜스펙션 방법이 본 명세서에 개시된 EEC에서 보여지는 발현-증가 효과에 중요한지 여부를 조사하기 위해, Jurkat 세포를 GFP를 인코딩하는 코딩 서열과 함께 증가하는 양의 EEC로 전기천공하였다.

전기천공은 핵산의 림프성 세포주로의 전달을 개선시키는 것으로 나타났다(Ohtani et al., Electroporation: Application to human lympboid cell lines for stable introduction of a transactivator gene of human T-cell leukemia virus type I. Nucleic Acids Res. (1989), doi:10.1093/nar/17.4.1589). 먼저, 실험에 사용된 mRNA의 최적 양을 결정하기 위해, GFP-인코딩 EEC의 양이 증가하는 Jurkat 세포에 대해, 실시예 1에 기재된 바와 같이 Neon Electroporation System(Thermo Fisher Scientific, Inc.)으로 전기천공을 수행하였다. 이는 GFP 신호의 비례적 증가를 초래하였다. 다음으로, Jurkat 세포를 UTR 변이체를 갖는 4 및 8 pmol의 GFP-인코딩 EEC로 전기천공하였다. 6 내지 8×10⁵개 세포 당 4 pmol(1 ㎍)의 GFP-인코딩 EEC에서, 최대 10%의 세포가 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 보유하는 mRNA로 처리된 세포에 대해 GFP 양성이었으며, 이는 가장 높은 백분율의 GFP+ 세포를 나타내는 것이다(도 9a). 8 pmol(2 ㎍)에서, Jurkat 세포의 거의 90%는 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 보유하는 mRNA로 처리된 세포에서 GFP 양성이며, 이는 가장 높은 중앙 GFP 강도를 나타낸다(도 9b 및 도 9c). GFP 양성 세포의 수가 사용된 가장 높은 mRNA 수준에서 더 낮았다는 점을 제외하고는, Raji 세포를 사용할 때 유사한 결과가 수득되었다(도 10a, 도 10b 및 도 10c).

실시예 2, 3 및 4의 결과와 비교하여 독특한 조작된 EEC를 사용하여 실시예 7에서 유사한 수준의 단백질 발현이 관찰되었기 때문에, 트랜스펙션 방법은 EEC의 효과에 영향을 미치지 않는다.

실시예 7. 3' UTR에서 스템 루프의 서열을 역전시키는 것은 단백질 발현의 증가에 영향을 미치지 않았다. 3' UTR 서열 조성의 영향을 조사하기 위해, 단백질 발현에 대해 스템-루프 페어링을 보존하면서, 원래의 3' UTR 서열(도 13a, 3' UTR-A)을 편집하여 CCUC를 GAGG로 교환하였다(도 13a, 3' UTR-B). GFP-인코딩 EEC를 3' UTR-A 또는 3' UTR-B를 포함하도록 작제하고, HEK293 세포에서 GFP 발현에 대해 시험하였다(MessengerMax 리포펙타민으로의 트랜스펙션에 의함). 1 내지 2 pmol을 사용하여, 세포의 60 내지 70%가 GFP 발현{실험 횟수 = 2 내지 3}을 나타내었으며, 3' UTR을 함유하는 작제물들 사이에는 차이가 없었다(도 13b). 또한, GFP 중간 강도{실험 횟수 = 2 내지 3}는 또한 3' UTR-A 또는 3' UTR-B를 갖는 EEC 사이에서 유사하였다(도 13c). 또한 3' UTR-B에서 GGAG 이전의 -2 위치에서 단일 뉴클레오타이드 치환(U에서 A로)이 발생하는 추가 3' UTR을 갖는 EEC를 사용하여 GFP 발현을 조사하였다(도 13a, 3' UTR-C). 이러한 서열은 스템 영역이 스템-루프 결합 단백질(SLBP) 및 번역과의 mRNA 회합에 중요한 아데노신의 스트링이 선행하는 히스톤 스템-루프와 유사하다(Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820; William & Marzluff, The sequence of the stem and flanking sequences at the 3' end of histone mRNA are critical determinants for the binding of the stem-loop binding protein. Nucleic Acids Res. (1995), doi:10.1093/nar/23.4.654). 3' UTR-C의 첨가는 이전의 3' UTR과 비교하여 GFP 양성 세포의 백분율을 증가시키지 않았지만, 이는 트랜스펙션된 세포에서 GFP 중간 강도를 60%만큼 증가시켰다(도 13b, 13c).

따라서, 이전 실시예에서 관찰된 바와 같이, 독특한 측면 서열을 갖는 스템 루프를 포함하는 조작된 3' UTR은 인간 세포에서 GFP 발현을 증가시킨다.

실시예 8. 독특한 5' UTR 서열을 함유하는 조작된 mRNA는 섬유모세포로 트랜스펙션될 때 변형된 뉴클레오타이드를 사용한 mRNA와 비교할 때 증가된 단백질 발현을 초래하였다.

개시된 조작된 mRNA로부터 생산된 단백질의 수준을 변형된 뉴클레오타이드(N1-메틸-슈도우리딘)를 사용한 mRNA의 수준과 비교하기 위해, 비변형된 mRNA Oct4(UO), 비변형된 mRNA MyoD-Oct4(UMD), 변형된 mRNA Oct4(PUO), 및 변형된 mRNA MyoD-Oct4(PUMD)를 포함하는, 여러 Oct4 발현 mRNA 작제물을 인간 포피 섬유모세포에 트랜스펙션시켰다. 도 14에 도시된 바와 같이, OCT4 발현은 비변형 mRNA(UO)를 사용하여 가장 컸다. 800 ng의 mRNA를 사용한 비변형된 조작된 전사체는 50.7%로 가장 높은 백분율의 OCT4-양성 세포를 생성하였다. 또한, 도 14에 도시된 바와 같이, OCT4-양성 세포의 백분율은 현재 개시된 조작된 mRNA보다 변형된 뉴클레오사이드 슈도우르딘(PUO 및 PUMD)을 사용하여 유의하게 더 낮았다(36.9% 대 50.7%). 이러한 결과는 개시된 5' 및 3' UTR이 N1-메틸-슈도우리딘과 같은 변형된 뉴클레오타이드로 제조된 전사체보다 더 높은 수준의 단백질 발현을 초래한다는 것을 보여준다.

실험예 내에서 사용된 서열에 대해서는 도 15를 참조한다.

종결 단락(closing paragraph). 당업자에 의해 이해되는 바와 같이, 본 명세서에 개시된 각각의 실시형태는 이의 특정 언급된 요소, 단계, 구성성분 또는 성분을 포함하거나, 이들로 필수적으로 구성되거나, 이들로 구성될 수 있다. 따라서, 용어 "포함하다(include)" 또는 "포함하는(including)"은 "포함하다(comprise), ~로 구성되다(consist of) 또는 ~로 필수적으로 구성된다(consist essentially of)"를 인용하는 것으로 해석되어야 한다. 본 명세서에서 사용되는 연결 어구(transition term) "포함하다(comprise 또는 comprises)"는 비제한적으로, 불특정 요소, 단계, 구성성분, 또는 성분을, 심지어 다량으로 갖고 이를 포함할 수 있는 것을 의미한다. 연결 어구 "~로 구성된"은 지정되지 않은 임의의 요소, 단계, 구성성분 또는 성분을 배제한다. 연결 어구 "~로 필수적으로 구성된"은 실시형태의 범위를 명시된 요소, 단계, 구성성분 또는 성분으로 제한하고 실시형태에 실질적으로 영향을 미치지 않는 것들로 제한한다. 본 명세서에서 사용되는 물질 효과는 5' UTR에서 서열번호 2 및 3' UTR에서 서열번호 10을 함유하는 EEC로 관찰된 증가된 단백질 발현의 통계적으로 유의한 감소를 야기할 것이다.

달리 명시하지 않는 한, 명세서 및 청구범위에 사용된 모든 숫자는 모든 경우에 용어 "약"에 의해 한정되는 것으로 이해되어야 한다. 따라서, 달리 명시하지 않는 한, 명세서 및 첨부된 청구범위에 기재된 수치 파라미터는 본 발명에 의해 획득하고자 하는 요망되는 특성에 따라 달라질 수 있는 근사치이다. 최소한, 청구 범위의 범위에 대한 등가물의 교리의 적용을 제한하려는 시도가 아니라, 각각의 수치 파라미터는 적어도 보고된 유효 숫자의 수에 비추어 그리고 통상적인 반올림 기술을 적용함으로써 해석되어야 한다. 추가의 명확성이 요구될 때, 용어 "약"은 언급된 수치 또는 범위와 함께 사용될 때 당업자에 의해 합리적으로 부여된 의미를 가지며, 즉, 명시된 값의 ±20%; 명시된 값의 ±19%; 명시된 값의 ±18%; 명시된 값의 ±17%; 명시된 값의 ±16%; 명시된 값의 ±15%; 명시된 값의 ±14%; 명시된 값의 ±13%; 명시된 값의 ±12%; 명시된 값의 ±11%; 명시된 값의 ±10%; 명시된 값의 ±9%; 명시된 값의 ±8%; 명시된 값의 ±7%; 명시된 값의 ±6%; 명시된 값의 ±5%; 명시된 값의 ±4%; 명시된 값의 ±3%; 명시된 값의 ±2%; 또는 명시된 값의 ±1% 범위 이내로 언급된 값 또는 범위보다 다소 많거나 다소 적은 것을 나타낸다.

본 발명의 넓은 범위를 설명하는 수치 범위 및 파라미터가 근사치임에도 불구하고, 특정 실시예에 기재된 수치 값은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치는 본질적으로 이들의 개개 시험 측정에서 발견된 표준 편차로부터 필연적으로 발생하는 특정 오차를 포함한다.

본 명세서에 개시된 단백질 및 EEC(5' 및 3' UTR 포함)의 변이체는 또한 참조 서열과 적어도 70% 서열 동일성, 80% 서열 동일성, 85% 서열 동일성, 90% 서열 동일성, 95% 서열 동일성, 96% 서열 동일성, 97% 서열 동일성, 98% 서열 동일성, 또는 99% 서열 동일성을 갖는 서열을 포함한다.

"% 서열 동일성"은 서열들을 비교함으로써 결정되는 2개 이상의 서열 사이의 관계를 지칭한다. 당 분야에서, "동일성"은 또한 이러한 서열의 스트링 사이의 매치에 의해 결정되는 바와 같이 단백질, 핵산, 또는 유전자 서열 사이의 서열 관련성의 정도를 의미한다. "동일성"(종종 "유사성"으로 지칭됨)은 문헌[Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); and Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Oxford University Press, NY (1992)]에 기재된 것들을 포함하는, 공지된 방법에 의해 용이하게 계산될 수 있다. 동일성을 결정하기 위한 바람직한 방법은 시험된 서열 사이에 최상의 매치를 제공하도록 설계된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 이용 가능한 컴퓨터 프로그램에서 코드화된다. 서열 정렬 및 동일성 퍼센트 계산은 LASERGENE 생물정보학 컴퓨팅 스위트(DNASTAR, Inc., Madison, Wisconsin)의 Megalign 프로그램을 사용하여 수행될 수 있다. 서열의 다중 정렬은 또한 디폴트 파라미터를 갖는 Clustal 정렬 방법(Higgins and Sharp CABIOS, 5, 151-153 (1989))을 사용하여 수행될 수 있다(갭 페널티(GAP PENALTY)=10, 갭 길이 패널티(GAP LENGTH PENALTY)=10). 관련 프로그램은 또한 프로그램의 GCG 스위트(Wisconsin Package Version 9.0, Genetics Computer Group(GCG), Madison, Wisconsin); BLASTP, BLASTN, BLASTX(Altschul, et al., J. Mol. Biol. 215:403-410 (1990)); DNASTAR(DNASTAR, Inc., Madison, Wisconsin); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Method Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Publisher: Plenum, New York, NY)을 포함한다. 본 개시내용의 맥락에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 분석의 결과는 참조된 프로그램의 "디폴트 값"에 기반하는 것으로 이해될 것이다. 본 명세서에서 사용되는 "디폴트 값"은 처음 초기화될 때 소프트웨어와 함께 원래 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.

본 발명을 기술하는 맥락에서(특히 하기 청구범위의 맥락에서) 사용되는 단수 용어("a", "an", "the") 및 유사한 지시대상은 본 명세서에서 달리 명시하지 않거나 문맥상 명백히 모순되지 않는 한 단수 및 복수 둘 다를 포함하는 것으로 해석되어야 한다. 본 명세서에서 값의 범위의 언급은 단지 그러한 범위 내에 속하는 각각의 개별 값을 개별적으로 지칭하는 속기 방법으로서 역할을 하도록 의도된다. 본 명세서에서 달리 명시하지 않는 한, 각각의 개별 값은 본 명세서에서 개별적으로 인용된 것처럼 명세서에 포함된다. 본 명세서에 기재된 모든 방법은 본 명세서에 달리 명시하지 않거나 문맥상 명백히 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본 명세서에 제공된 임의의 및 모든 예, 또는 예시적인 언어(예를 들어, "예를 들어")의 사용은 단지 본 발명을 더 잘 설명하기 위한 것이며 달리 청구된 본 발명의 범위를 제한하지 않는다. 명세서의 어떠한 언어도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안 된다.

본 명세서에 개시된 본 발명의 대안적인 요소 또는 실시형태의 그룹화는 제한으로 해석되어서는 안 된다. 각각의 그룹 구성원은 개별적으로 또는 그룹의 다른 구성원 또는 본 명세서에서 발견된 다른 요소와 임의의 조합으로 지칭되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성을 이유로 그룹에 포함되거나 그룹으로부터 삭제될 수 있는 것으로 예상된다. 이러한 임의의 포함 또는 삭제가 발생하는 경우, 명세서는 변경된 바와 같은 그룹을 함유하는 것으로 간주되어 첨부된 청구범위에서 사용된 모든 마쿠쉬 그룹의 서면 설명을 충족시킨다.

본 발명을 수행하기 위해 본 발명자들에게 공지된 최상의 방식을 포함하는 본 발명의 특정 실시형태가 본 명세서에 기재된다. 물론, 이러한 기재된 실시형태의 변형은 전술한 설명을 읽을 때 당업자에게 명백해질 것이다. 본 발명자는 당업자가 이러한 변형을 적절하게 사용할 것으로 예상하고, 본 발명자는 본 발명이 본 명세서에 구체적으로 기재된 것과 달리 실시되는 것을 의도한다. 따라서, 본 발명은 적용 가능한 법에 의해 허용되는 바와 같이 본 명세서에 첨부된 청구범위에 인용된 주제의 모든 변형 및 등가물을 포함한다. 또한, 본 명세서에서 달리 명시하지 않거나 문맥상 명백히 모순되지 않는 한, 모든 가능한 변형에서 상기 기재된 요소의 임의의 조합은 본 발명에 포함된다.

또한, 본 명세서 전반에 걸쳐 간행물, 특허 및/또는 특허 출원(총괄적으로 "참고문헌")이 다수 참조되었다. 인용된 참고문헌 각각은 이들의 특정 인용된 교시를 위해 본 명세서에 개별적으로 참조에 의해 원용된다.

마지막으로, 본 명세서에 개시된 본 발명의 실시형태는 본 발명의 원리를 예시하는 것으로 이해되어야 한다. 사용될 수 있는 다른 변형은 본 발명의 범위 내에 있다. 따라서, 비제한적인 예로서, 본 발명의 대안적인 구성이 본 명세서의 교시에 따라 이용될 수 있다. 따라서, 본 발명은 정확하게 도시되고 설명된 것으로 제한되지 않는다.

본 명세서에 도시된 세부사항은 일 예로서 그리고 단지 본 발명의 바람직한 실시형태의 예시적인 논의의 목적을 위한 것이고, 본 발명의 다양한 실시형태의 원리 및 개념적 양태의 가장 유용하고 용이하게 이해되는 설명인 것으로 여겨지는 것을 제공하기 위해 제시된다. 이와 관련하여, 본 발명의 기본적인 이해에 필요한 것보다 더 상세히 본 발명의 구조적 세부사항을 나타내려는 시도는 이루어지지 않았으며, 도면 및/또는 실시예와 함께 취해진 설명은 당업자에게 본 발명의 수 개의 형태가 어떻게 실제로 구현될 수 있는 지를 명백히 한다.

본 개시에서 사용되는 정의 및 설명은 실시예에서 명확하고 모호하지 않게 수정되거나 의미의 적용이 임의의 구성을 무의미하거나 본질적으로 무의미하게 만드는 경우가 아니면 임의의 향후 구성을 조절하는 것을 의미하고 의도한다. 용어의 구성이 이를 무의미하거나 본질적으로 무의미하게 만드는 경우, 정의는 웹스터 사전(Webster's Dictionary, 3^rd Edition) 또는 생화학 및 분자 생물학의 옥스포드 사전(Oxford Dictionary of Biochemistry and Molecular Biology (Ed. Anthony Smith, Oxford University Press, Oxford, 2004))과 같은 당업자에게 공지된 사전으로부터 취해져야 한다.

SEQUENCE LISTING <110> RIBOZ, LLC <120> ENGINEERED EXPRESSION CONSTRUCTS TO INCREASE PROTEIN EXPRESSION FROM SYNTHETIC RIBONUCLEIC ACID (RNA) <130> P183-0010PCT <150> PCT/US2022/017880 <151> 2022-02-25 <150> US 63/153,877 <151> 2021-02-25 <160> 83 <170> PatentIn version 3.5 <210> 1 <400> 1 000 <210> 2 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> 5' UTR Construct with "A" Kozak Sequence (no start codon) <400> 2 gggagacaua cucagccacc 20 <210> 3 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> 5' UTR Construct with "G" Kozak Sequence (no start codon) <400> 3 gggagacaua cucagccgcc 20 <210> 4 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> 3' UTR construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (2)..(2) <223> n can be present or absent <220> <221> misc_feature <222> (3)..(3) <223> n can be present or absent <220> <221> misc_feature <222> (11)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (18)..(18) <223> n can be present or absent <220> <221> misc_feature <222> (19)..(19) <223> n can be present or absent <220> <221> misc_feature <222> (20)..(20) <223> n can be present or absent <220> <221> misc_feature <222> (21)..(21) <223> n can be present or absent <220> <221> misc_feature <222> (22)..(22) <223> n can be present or absent <220> <221> misc_feature <222> (23)..(23) <223> n can be present or absent <220> <221> misc_feature <222> (24)..(24) <223> n can be present or absent <220> <221> misc_feature <222> (25)..(25) <223> n can be present or absent <400> 4 nnnauaccuc nnnnnnnnnn nnnnngagg 29 <210> 5 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (2)..(2) <223> n can be present or absent <220> <221> misc_feature <222> (3)..(3) <223> n can be present or absent <220> <221> misc_feature <222> (11)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (18)..(18) <223> n can be present or absent <220> <221> misc_feature <222> (19)..(19) <223> n can be present or absent <220> <221> misc_feature <222> (20)..(20) <223> n can be present or absent <220> <221> misc_feature <222> (21)..(21) <223> n can be present or absent <220> <221> misc_feature <222> (22)..(22) <223> n can be present or absent <220> <221> misc_feature <222> (23)..(23) <223> n can be present or absent <220> <221> misc_feature <222> (24)..(24) <223> n can be present or absent <220> <221> misc_feature <222> (25)..(25) <223> n can be present or absent <400> 5 nnnaaaccuc nnnnnnnnnn nnnnngagg 29 <210> 6 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (2)..(2) <223> n can be present or absent <220> <221> misc_feature <222> (3)..(3) <223> n can be present or absent <220> <221> misc_feature <222> (11)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (18)..(18) <223> n can be present or absent <220> <221> misc_feature <222> (19)..(19) <223> n can be present or absent <220> <221> misc_feature <222> (20)..(20) <223> n can be present or absent <220> <221> misc_feature <222> (21)..(21) <223> n can be present or absent <220> <221> misc_feature <222> (22)..(22) <223> n can be present or absent <220> <221> misc_feature <222> (23)..(23) <223> n can be present or absent <220> <221> misc_feature <222> (24)..(24) <223> n can be present or absent <220> <221> misc_feature <222> (25)..(25) <223> n can be present or absent <400> 6 nnnauaggag nnnnnnnnnn nnnnncucc 29 <210> 7 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (2)..(2) <223> n can be present or absent <220> <221> misc_feature <222> (3)..(3) <223> n can be present or absent <220> <221> misc_feature <222> (11)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (18)..(18) <223> n can be present or absent <220> <221> misc_feature <222> (19)..(19) <223> n can be present or absent <220> <221> misc_feature <222> (20)..(20) <223> n can be present or absent <220> <221> misc_feature <222> (21)..(21) <223> n can be present or absent <220> <221> misc_feature <222> (22)..(22) <223> n can be present or absent <220> <221> misc_feature <222> (23)..(23) <223> n can be present or absent <220> <221> misc_feature <222> (24)..(24) <223> n can be present or absent <220> <221> misc_feature <222> (25)..(25) <223> n can be present or absent <400> 7 nnnaaaggag nnnnnnnnnn nnnnncucc 29 <210> 8 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (2)..(2) <223> n can be present or absent <220> <221> misc_feature <222> (3)..(3) <223> n can be present or absent <220> <221> misc_feature <222> (10)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (18)..(18) <223> n can be present or absent <220> <221> misc_feature <222> (19)..(19) <223> n can be present or absent <220> <221> misc_feature <222> (20)..(20) <223> n can be present or absent <220> <221> misc_feature <222> (21)..(21) <223> n can be present or absent <220> <221> misc_feature <222> (22)..(22) <223> n can be present or absent <220> <221> misc_feature <222> (23)..(23) <223> n can be present or absent <220> <221> misc_feature <222> (24)..(24) <223> n can be present or absent <220> <221> misc_feature <222> (25)..(25) <223> n can be present or absent <400> 8 nnnauagagn nnnnnnnnnn nnnnccuc 28 <210> 9 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <220> <221> misc_feature <222> (1)..(1) <223> n is a, c, g, or u <220> <221> misc_feature <222> (2)..(2) <223> n can be present or absent <220> <221> misc_feature <222> (3)..(3) <223> n can be present or absent <220> <221> misc_feature <222> (11)..(17) <223> n is a, c, g, or u <220> <221> misc_feature <222> (18)..(18) <223> n can be present or absent <220> <221> misc_feature <222> (19)..(19) <223> n can be present or absent <220> <221> misc_feature <222> (20)..(20) <223> n can be present or absent <220> <221> misc_feature <222> (21)..(21) <223> n can be present or absent <220> <221> misc_feature <222> (22)..(22) <223> n can be present or absent <220> <221> misc_feature <222> (23)..(23) <223> n can be present or absent <220> <221> misc_feature <222> (24)..(24) <223> n can be present or absent <220> <221> misc_feature <222> (25)..(25) <223> n can be present or absent <400> 9 nnnaaagagg nnnnnnnnnn nnnnnccuc 29 <210> 10 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 10 ugcauaccuc uaacggucuu gagg 24 <210> 11 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 11 ugcauaggag uaacggucuu cucc 24 <210> 12 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 12 ugcaaaggag uaacggucuu cucc 24 <210> 13 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 13 uaaugcauac cucuaacggu cuugagg 27 <210> 14 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 14 ugaugcauac cucuaacggu cuugagg 27 <210> 15 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 15 uagugcauac cucuaacggu cuugagg 27 <210> 16 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 16 uaaugcauag agguaacggu cuuccuc 27 <210> 17 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 17 ugaugcauag agguaacggu cuuccuc 27 <210> 18 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 18 uagugcauag agguaacggu cuuccuc 27 <210> 19 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 19 uaaugcaaag agguaacggu cuuccuc 27 <210> 20 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 20 ugaugcaaag agguaacggu cuuccuc 27 <210> 21 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR construct <400> 21 uagugcaaag agguaacggu cuuccuc 27 <210> 22 <400> 22 000 <210> 23 <400> 23 000 <210> 24 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Forward primer (No UTR) <400> 24 gactcctaat acgactcact atagggagaa tg 32 <210> 25 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Forward primer (Kozak) <400> 25 gactcctaat acgactcact atagggagag ccaccatg 38 <210> 26 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Forward primer (5'UTR) <400> 26 gactcctaat acgactcact atagggagac atactcagcc accatg 46 <210> 27 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Reverse (3'UTR-A) <400> 27 tttttttttt tttttttttt tttttttttt tttttttttt cctcaagacc gttagaggta 60 tgca 64 <210> 28 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Reverse (3'UTR-B) <400> 28 tttttttttt tttttttttt tttttttttt tttttttttt ggagaagacc gttactccta 60 tgca 64 <210> 29 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Reverse (3'UTR-C) <400> 29 tttttttttt tttttttttt tttttttttt tttttttttt ggagaagacc gttactcctt 60 tgca 64 <210> 30 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Kozak sequence <400> 30 gccrccatgg 10 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> T7 promoter and hexamer <400> 31 taatacgact cactataggg aga 23 <210> 32 <400> 32 000 <210> 33 <400> 33 000 <210> 34 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 34 uaacggucuu 10 <210> 35 <400> 35 000 <210> 36 <400> 36 000 <210> 37 <400> 37 000 <210> 38 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> 5' UTR Construct with "A" Kozak Sequence (with start codon) <400> 38 gggagacaua cucagccacc aug 23 <210> 39 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> 5' UTR Construct with "G" Kozak Sequence (with start codon) <400> 39 gggagacaua cucagccgcc aug 23 <210> 40 <400> 40 000 <210> 41 <400> 41 000 <210> 42 <400> 42 000 <210> 43 <400> 43 000 <210> 44 <400> 44 000 <210> 45 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DNA double-helix sequence <400> 45 taatacgact cactatag 18 <210> 46 <400> 46 000 <210> 47 <400> 47 000 <210> 48 <211> 32 <212> PRT <213> Human immunodeficiency virus type 1 <400> 48 Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr 1 5 10 15 Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu 20 25 30 <210> 49 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> DNA double helix <400> 49 His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro 1 5 10 15 Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Leu Tyr Lys Leu 20 25 30 <210> 50 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> DNA double helix <400> 50 Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys 1 5 10 15 His Ile Val <210> 51 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> DNA double helix <400> 51 Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu 1 5 10 15 Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp 20 25 30 <210> 52 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> DNA double helix <400> 52 Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys 1 5 10 15 Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr 20 25 30 <210> 53 <211> 20 <212> PRT <213> Plasmodium falciparum <400> 53 Asn Ala Asn Pro Asn Ala Asn Pro Asn Ala Asn Pro Asn Ala Asn Pro 1 5 10 15 Asn Ala Asn Pro 20 <210> 54 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> E protein Domain III <400> 54 Ala Phe Thr Phe Thr Lys Ile Pro Ala Glu Thr Leu His Thr Val Thr 1 5 10 15 Glu Val Gln Tyr Ala Gly Thr Asp Gly Pro Cys Lys Val Pro Ala Gln 20 25 30 Met Ala Val Asp Met Gln Thr Leu Thr Pro Val Gly Arg Leu Ile Thr 35 40 45 Ala Asn Pro Val Ile Thr Glu Gly Thr Glu Asn Ser Lys Met Met Leu 50 55 60 Glu Leu Asp Pro Pro Phe Gly Asp Ser Tyr Ile Val Ile Gly Val Gly 65 70 75 80 Glu <210> 55 <211> 827 <212> DNA <213> Artificial Sequence <220> <223> EGFP <400> 55 gactcctaat acgactcact atagggagac atactcagcc accatggtga gcaagggcga 60 ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 120 caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 180 gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 240 ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 300 gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 360 ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 420 gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 480 caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 540 caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 600 cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 660 cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 720 cgccgccggg atcactctcg gcatggacga gctgtacaag taatgcatac ctctaacggt 780 cttgaggaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 827 <210> 56 <211> 804 <212> RNA <213> Artificial Sequence <220> <223> EGFP <400> 56 gggagacaua cucagccacc auggugagca agggcgagga gcuguucacc gggguggugc 60 ccauccuggu cgagcuggac ggcgacguaa acggccacaa guucagcgug uccggcgagg 120 gcgagggcga ugccaccuac ggcaagcuga cccugaaguu caucugcacc accggcaagc 180 ugcccgugcc cuggcccacc cucgugacca cccugaccua cggcgugcag ugcuucagcc 240 gcuaccccga ccacaugaag cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg 300 uccaggagcg caccaucuuc uucaaggacg acggcaacua caagacccgc gccgagguga 360 aguucgaggg cgacacccug gugaaccgca ucgagcugaa gggcaucgac uucaaggagg 420 acggcaacau ccuggggcac aagcuggagu acaacuacaa cagccacaac gucuauauca 480 uggccgacaa gcagaagaac ggcaucaagg ugaacuucaa gauccgccac aacaucgagg 540 acggcagcgu gcagcucgcc gaccacuacc agcagaacac ccccaucggc gacggccccg 600 ugcugcugcc cgacaaccac uaccugagca cccaguccgc ccugagcaaa gaccccaacg 660 agaagcgcga ucacaugguc cugcuggagu ucgugaccgc cgccgggauc acucucggca 720 uggacgagcu guacaaguaa ugcauaccuc uaacggucuu gaggaaaaaa aaaaaaaaaa 780 aaaaaaaaaa aaaaaaaaaa aaaa 804 <210> 57 <211> 1190 <212> DNA <213> Homo sapiens <400> 57 gactcctaat acgactcact atagggagac atactcagcc accatggcgg gacacctggc 60 ttcggatttc gccttctcgc cccctccagg tggtggaggt gatgggccag gggggccgga 120 gccgggctgg gttgatcctc ggacctggct aagcttccaa ggccctcctg gagggccagg 180 aatcgggccg ggggttgggc caggctctga ggtgtggggg attcccccat gccccccgcc 240 gtatgagttc tgtgggggga tggcgtactg tgggccccag gttggagtgg ggctagtgcc 300 ccaaggcggc ttggagacct ctcagcctga gggcgaagca ggagtcgggg tggagagcaa 360 ctccgatggg gcctccccgg agccctgcac cgtcacccct ggtgccgtga agctggagaa 420 ggagaagctg gagcaaaacc cggaggagtc ccaggacatc aaagctctgc agaaagaact 480 cgagcaattt gccaagctcc tgaagcagaa gaggatcacc ctgggatata cacaggccga 540 tgtggggctc accctggggg ttctatttgg gaaggtattc agccaaacga ccatctgccg 600 ctttgaggct ctgcagctta gcttcaagaa catgtgtaag ctgcggccct tgctgcagaa 660 gtgggtggag gaagctgaca acaatgaaaa tcttcaggag atatgcaaag cagaaaccct 720 cgtgcaggcc cgaaagagaa agcgaaccag tatcgagaac cgagtgagag gcaacctgga 780 gaatttgttc ctgcagtgcc cgaaacccac actgcagcag atcagccaca tcgcccagca 840 gcttgggctc gagaaggatg tggtccgagt gtggttctgt aaccggcgcc agaagggcaa 900 gcgatcaagc agcgactatg cacaacgaga ggattttgag gctgctgggt ctcctttctc 960 agggggacca gtgtcctttc ctctggcccc agggccccat tttggtaccc caggctatgg 1020 gagccctcac ttcactgcac tgtactcctc ggtccctttc cctgaggggg aagcctttcc 1080 ccctgtctcc gtcaccactc tgggctctcc catgcattca aactgatgca tacctctaac 1140 ggtcttgagg aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1190 <210> 58 <211> 1167 <212> RNA <213> Homo sapiens <400> 58 gggagacaua cucagccacc auggcgggac accuggcuuc ggauuucgcc uucucgcccc 60 cuccaggugg uggaggugau gggccagggg ggccggagcc gggcuggguu gauccucgga 120 ccuggcuaag cuuccaaggc ccuccuggag ggccaggaau cgggccgggg guugggccag 180 gcucugaggu gugggggauu cccccaugcc ccccgccgua ugaguucugu ggggggaugg 240 cguacugugg gccccagguu ggaguggggc uagugcccca aggcggcuug gagaccucuc 300 agccugaggg cgaagcagga gucggggugg agagcaacuc cgauggggcc uccccggagc 360 ccugcaccgu caccccuggu gccgugaagc uggagaagga gaagcuggag caaaacccgg 420 aggaguccca ggacaucaaa gcucugcaga aagaacucga gcaauuugcc aagcuccuga 480 agcagaagag gaucacccug ggauauacac aggccgaugu ggggcucacc cuggggguuc 540 uauuugggaa gguauucagc caaacgacca ucugccgcuu ugaggcucug cagcuuagcu 600 ucaagaacau guguaagcug cggcccuugc ugcagaagug gguggaggaa gcugacaaca 660 augaaaaucu ucaggagaua ugcaaagcag aaacccucgu gcaggcccga aagagaaagc 720 gaaccaguau cgagaaccga gugagaggca accuggagaa uuuguuccug cagugcccga 780 aacccacacu gcagcagauc agccacaucg cccagcagcu ugggcucgag aaggaugugg 840 uccgagugug guucuguaac cggcgccaga agggcaagcg aucaagcagc gacuaugcac 900 aacgagagga uuuugaggcu gcugggucuc cuuucucagg gggaccagug uccuuuccuc 960 uggccccagg gccccauuuu gguaccccag gcuaugggag cccucacuuc acugcacugu 1020 acuccucggu cccuuucccu gagggggaag ccuuuccccc ugucuccguc accacucugg 1080 gcucucccau gcauucaaac ugaugcauac cucuaacggu cuugaggaaa aaaaaaaaaa 1140 aaaaaaaaaa aaaaaaaaaa aaaaaaa 1167 <210> 59 <211> 569 <212> DNA <213> Artificial Sequence <220> <223> IL2 Complete DNA Sequence (with Riboz UTRs and PolyA tail) <400> 59 gactcctaat acgactcact atagggagac atactcagcc accatgtaca ggatgcaact 60 cctgtcttgc attgcactaa gtcttgcact tgtcacaaac agtgcaccta cttcaagttc 120 tacaaagaaa acacagctac aactggagca tttactgctg gatttacaga tgattttgaa 180 tggaattaat aattacaaga atcccaaact caccaggatg ctcacattta agttttacat 240 gcccaagaag gccacagaac tgaaacatct tcagtgtcta gaagaagaac tcaaacctct 300 ggaggaagtg ctaaatttag ctcaaagcaa aaactttcac ttaagaccca gggacttaat 360 cagcaatatc aacgtaatag ttctggaact aaagggatct gaaacaacat tcatgtgtga 420 atatgctgat gagacagcaa ccattgtaga atttctgaac agatggatta ccttttgtca 480 aagcatcatc tcaacactga cttgatgcat acctctaacg gtcttgagga aaaaaaaaaa 540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 569 <210> 60 <211> 546 <212> RNA <213> Artificial Sequence <220> <223> Complete RNA Sequence (with Riboz UTRs and PolyA tail) <400> 60 gggagacaua cucagccacc auguacagga ugcaacuccu gucuugcauu gcacuaaguc 60 uugcacuugu cacaaacagu gcaccuacuu caaguucuac aaagaaaaca cagcuacaac 120 uggagcauuu acugcuggau uuacagauga uuuugaaugg aauuaauaau uacaagaauc 180 ccaaacucac caggaugcuc acauuuaagu uuuacaugcc caagaaggcc acagaacuga 240 aacaucuuca gugucuagaa gaagaacuca aaccucugga ggaagugcua aauuuagcuc 300 aaagcaaaaa cuuucacuua agacccaggg acuuaaucag caauaucaac guaauaguuc 360 uggaacuaaa gggaucugaa acaacauuca ugugugaaua ugcugaugag acagcaacca 420 uuguagaauu ucugaacaga uggauuaccu uuugucaaag caucaucuca acacugacuu 480 gaugcauacc ucuaacgguc uugaggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540 aaaaaa 546 <210> 61 <400> 61 000 <210> 62 <400> 62 000 <210> 63 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> 5' UTR construct <400> 63 gggagagcca ccaug 15 <210> 64 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 64 gaugccccau ucacgaguag uggguauu 28 <210> 65 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 65 ggcacccugc gcaggugaug caggugcc 28 <210> 66 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 66 guucgcucgg ucaggagagc ugacggac 28 <210> 67 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 67 ucuuacagug gcaugugacc guuuaagg 28 <210> 68 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 68 cgcggcgcau gcacgugaca ugccugcg 28 <210> 69 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 69 cggucccgug gcaagagucu auggauug 28 <210> 70 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 70 auguucggcu ccaagagcga guugauau 28 <210> 71 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 71 cgauucgggc acaugugcug ucugauug 28 <210> 72 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 72 guauucugau gcacgugcca ucaaguac 28 <210> 73 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 73 uugagcagga ucaagugcau ucuuucaa 28 <210> 74 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 74 rryryyyyry yyryrrryrr yrrryryy 28 <210> 75 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 75 rryryyyyry ryrrryrryr yrrryryy 28 <210> 76 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 76 ryyyryyyrr yyrrrrrrry yrryrrry 28 <210> 77 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 77 yyyyryrryr ryryryrryy ryyyrrrr 28 <210> 78 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 78 yryrryryry ryryryrryr yryyyryr 28 <210> 79 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 79 yrryyyyryr ryrrrrryyy ryrrryyr 28 <210> 80 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 80 ryryyyrryy yyrrrrryrr ryyrryry 28 <210> 81 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 81 yrryyyrrry ryryryryyr yyyrryyr 28 <210> 82 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 82 ryryyyyrry ryryryryyr yyrrryry 28 <210> 83 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Loop segment of stem loop <400> 83 yyrrryrrrr yyrrryryry yyyyyyrr 28

Claims

서열번호 38에 제시된 서열로 이루어진 5' 비번역 영역(UTR) 및 서열번호 13, 14 또는 15에 제시된 서열로 이루어진 3' UTR에 작동 가능하게 연결된 코딩 서열을 갖는 조작된 발현 작제물(EEC).
코딩 서열에 작동 가능하게 연결된 5' 비번역 영역(UTR)을 갖되, 상기 5' UTR은 최소 프로모터와 Kozak 서열 사이에 CAUACUCA에 제시된 서열을 갖는, 조작된 발현 작제물(EEC).
제2항에 있어서, 상기 최소 프로모터는 T7 프로모터인, EEC.
제3항에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, EEC.
제2항에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 A 또는 G인, EEC.
제2항에 있어서, 상기 5' UTR은
(i) 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열 또는
(ii) 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열
을 갖는, EEC.
제6항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, EEC.
제6항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, EEC.
제2항에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, EEC.
제2항에 있어서, 3' UTR을 추가로 포함하는, EEC.
제10항에 있어서, 상기 3' UTR은 스페이서, 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는, EEC.
제11항에 있어서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 갖는, EEC.
제11항에 있어서, 상기 스페이서는 서열 [N_1-3]AUA 또는 [N_1-3]AAA를 갖는, EEC.
제11항에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, EEC.
제11항에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열(hybridizing sequence)을 갖는, EEC.
제11항에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 갖는, EEC.
제11항에 있어서, 상기 스템 루프 구조는 7개 이상의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.
제11항에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.
제11항에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, EEC.
제10항에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, EEC.
제10항에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, EEC.
제21항에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, EEC.
제21항에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, EEC.
제10항에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, EEC.
제10항에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, EEC.
제10항에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, EEC.
제2항에 있어서, 상기 EEC는 시험관내-합성된 메신저 RNA(mRNA)를 포함하는, EEC.
제2항에 있어서, 상기 코딩 서열은 녹색 형광 단백질(GFP), 인간 인터루킨-2(IL2) 또는 인간 POU5F1(또는 OCT3/4)을 인코딩하는, EEC.
제2항에 있어서, 서열번호 56, 58 또는 60에 제시된 서열을 갖는, EEC.
제2항에 있어서, 상기 코딩 서열은 치료용 단백질을 인코딩하는, EEC.
제30항에 있어서, 상기 치료용 단백질은 항체 또는 이의 결합 단편을 포함하는, EEC.
제31항에 있어서, 상기 항체 또는 이의 결합 단편은 항-SARS-Cov2 항체 또는 이의 결합 단편, 항-SARS 항체 또는 이의 결합 단편, 항-RSV 항체 또는 이의 결합 단편, 항-HIV 항체 또는 이의 결합 단편, 항-뎅기 바이러스 항체 또는 이의 결합 단편, 항-보르다텔라 백일해 항체 또는 이의 결합 단편, 항-C형 간염 항체 또는 이의 결합 단편, 항-인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-파라인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-메타뉴모바이러스(MPV) 항체 또는 이의 결합 단편, 항-사이토메갈로바이러스 항체 또는 이의 결합 단편, 항-엡스타인 바 바이러스 항체; 항-단순 포진 바이러스 항체 또는 이의 결합 단편, 항-클로스트리디움 디피실레 박테리아 독소 항체 또는 이의 결합 단편, 또는 항-종양 괴사 인자(TNF) 항체 또는 이의 결합 단편을 포함하는, EEC.
제2항에 있어서, 상기 코딩 서열은 백신 항원을 인코딩하는, EEC.
제33항에 있어서, 상기 백신 항원은 SARS-CoV-02 백신 항원, CMV 백신 항원, EBV 백신 항원, 간염 백신 항원, 단순 포진 백신 항원, 인간 면역결핍 바이러스(HIV), 백신 항원, 인간 유두종바이러스(HPV) 바이러스 항원, 인플루엔자 백신 항원, 일본 뇌염 백신 항원, 말라리아 백신 항원, 홍역 백신 항원, 광견병 백신 항원, 호흡기 세포융합 백신 항원, 로타바이러스 백신 항원, 수두 대상포진 백신 항원 또는 지카 백신 항원을 포함하는, EEC.
제2항에 있어서, 상기 코딩 서열은 사이토카인을 인코딩하는, EEC.
제2항에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, EEC.
제36항에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, EEC.
제2항에 있어서, 상기 EEC는 변형된 뉴클레오사이드를 포함하지 않는, EEC.
제2항에 있어서, 상기 EEC는 마이크로RNA 결합 부위를 포함하지 않는, EEC.
제2항에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, EEC.
제41항에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, EEC.
제2항에 있어서, 상기 EEC는 면역 회피 인자를 포함하지 않는, EEC.
제2항에 있어서, 대상체에 대한 투여용으로 제형화된, EEC.
CAUACUCA에 제시된 서열로 이루어진, 인핸서 서열.
CAUACUCA에 제시된 서열의 1, 2, 3, 4 또는 5개 복사체를 갖는, 조작된 발현 작제물(EEC).
제44항에 있어서, 상기 인핸서 서열은 프로모터에 작동 가능하게 연결된, EEC.
제46항에 있어서, 상기 프로모터는 최소 프로모터인, EEC.
포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임(open reading frame) 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 CAUACUCA를 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.
포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7을 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.
포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 T7 폴리머라제 프로모터, CAUACUCA에 제시된 서열, 및 Kozak 서열을 포함하는 5' 비번역 영역을 추가로 포함하는, 조작된 발현 작제물.
제2항에 있어서, 상기 T7 프로모터는 T7 클래스 III 프로모터로부터 선택되는, 조작된 발현 작제물.
포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 4, 5, 6 또는 7 및 정지 코돈을 포함하는 3' 비번역 영역을 포함하는, 조작된 발현 작제물.
제52항에 있어서, 상기 정지 코돈은 UAA, UAG, 또는 UGA인, 조작된 발현 작제물.
포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물.
포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물(EEC)로서, 상기 시험관내-합성된 RNA는 a) AAACCUC 및 GAGG 또는 b) AAAGAGG 및 CCUC 중 어느 하나를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물(EEC).
최소 프로모터와 Kozak 서열 사이에 있는 CAUACUCA에 제시된 서열을 포함하는, 5' 비번역 영역(UTR).
제56항에 있어서, 상기 최소 프로모터는 T7 프로모터인, 5' UTR.
제57항에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, 5' UTR.
제56항에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 아데노신 또는 구아닌인, 5' UTR.
제56항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열을 포함하는, 5' UTR.
제56항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열을 포함하는, 5' UTR.
제60항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, 5' UTR.
제61항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, 5' UTR.
제56항에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, 5' UTR.
스페이서 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는 3' UTR로서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 가지며, 상기 스페이서는 서열 [N_1-3]AUA 또는 [N_1-3]AAA을 갖는, 3' UTR.
제65항에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, 3' UTR.
제65항에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열을 포함하는, 3' UTR.
제65항에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 포함하는, 3' UTR.
제65항에 있어서, 상기 스템 루프 구조는 적어도 7개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.
제65항에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.
제65항에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, 3' UTR.
제65항에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, 3' UTR.
제65항에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, 3' UTR.
제73항에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, 3' UTR.
제73항에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, 3' UTR.
제65항에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, 3' UTR.
제65항에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, 3' UTR.
제65항에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, 3' UTR.
제65항에 있어서, 상기 3' UTR은 코딩 서열에 작동 가능하게 연결된, 3' UTR.
제79항에 있어서, 상기 코딩 서열은 치료용 단백질, 백신 항원, 사이토카인, 또는 형광 단백질을 인코딩하는, 3' UTR.
제79항에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, 3' UTR.
제81항에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, 3' UTR.
제79항에 있어서, 상기 코딩 서열은 면역 회피 인자를 포함하지 않는, 3' UTR.
제79항에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, 3' UTR.
제84항에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, 3' UTR.