KR20170100660A

KR20170100660A - 신규 인공 핵산 분자

Info

Publication number: KR20170100660A
Application number: KR1020177021407A
Authority: KR
Inventors: 스테파니 그룬트; 토마스 스크라케
Original assignee: 큐어백 아게
Priority date: 2014-12-30
Filing date: 2015-12-29
Publication date: 2017-09-04
Also published as: SG11201704681QA; US20180148727A1; JP2018501802A; RU2017127203A; EP3240558A1; WO2016107877A1; BR112017009835A2; SG10201906673WA; MX2017008670A; EP3494982A1; AU2015373404A1; CA2966092A1; CN107124889A; US20190345504A1; AU2015373404B2; RU2757675C2; KR102580696B1; RU2017127203A3; JP2021168664A; JP6907116B2

Abstract

본 발명은 적어도 하나의 오픈 리딩 프레임 및 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 적어도 하나의 5'-비번역된 영역 요소(5'-UTR 요소)를 포함하며, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 안정한 mRNA로부터 유도된 인공 핵산 분자에 관한 것이다. 추가로 본 발명은 유전자 치료 및/또는 유전자 백신 접종에 이러한 인공 핵산 분자의 용도에 관한 것이다. 게다가, 안정한 mRNA 요소로부터 유도된 3'-UTR 요소 및/또는 5'-UTR을 식별하는 방법이 개시된다.

Description

신규 인공 핵산 분자

본 발명은 DARPA에 의해 수여된 계약번호 HR0011-11-3-0001에 따라 정부로부터 지원을 받아 이루어졌다. 정부는 발명에 대해 특정 권리를 갖는다. 본 출원은 2014년 12월 30일자로 출원된 국제특허출원 PCT/EP2014/003479호에 우선권을 청구하며, 이는 본 발명에 참고로 인용된다.

본 발명은 오픈 리딩 프레임, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소) 및 선택적으로 폴리(A) 서열 및/또는 폴리아데닐화 신호를 포함하는 인공 핵산 분자에 관한 것이다. 또한 본 발명은 바람직하게 유전자 요법 및/또는 유전자 백신 접종(genetic vaccination)의 분야에 사용하기 위한, 3'-UTR 요소 및/또는 5'-UTR 요소를 포함하는 벡터, 상기 인공 핵산 분자 또는 벡터를 포함하는 세포, 상기 인공 핵산 분자 또는 벡터를 포함하는 약학적 조성물 및 인공 핵산 분자, 벡터 및/또는 약학적 조성물을 포함하는 키트에 관한 것이다.

유전자 요법 및 유전자 백신 접종은 현대 의학의 가장 촉망되고 빠르게 발달하는 방법에 속한다. 이들은 많은 다양한 질병의 치료를 위해 매우 특이적이고 개별적인 선택 사항을 제공할 수 있다. 특히, 유전된 유전자 질병, 염증성 질병뿐만 아니라, 자가면역 질병, 암 또는 종양 관련 질병은 이러한 치료적 접근 방법의 대상이 될 수 있다. 또한, 이러한 접근 방법에 의해 상기 질병의 조기 발병을 예방하는 것이 예상된다.

유전자 치료 배후에 주요 개념의 이론적 근거는 특정한 질병의 병리학적 상태와 관련된 손상된 유전자의 적절한 조절이다. 병리학적으로 변형된 유전자 발현은 필수적인 유전자 산물, 예를 들어 호르몬, 하우스키핑 인자, 대사 효소 또는 구조 단백질 등과 같은 신호 인자의 부족 또는 과발현을 초래할 수 있다. 변형된 유전자 발현은 전사 및/또는 번역의 잘못된 조절에 의한 것뿐만 아니라, 특정한 단백질에 대한 ORF 코딩 내 변이에 의한 것일 수 있다. 병리학적인 변이는 예를 들어 염색체 이상에 의해, 또는 점 또는 프레임-쉬프트-돌연변이, 제한된 기능성을 초래, 및 잠재적으로 유전자 산물의 기능을 전부 상실하게 하는 이들 모두와 같은 보다 특이적인 변이에 의해 유발될 수 있다. 그러나, 만약 돌연변이가 세포의 전사 또는 번역 기관에 포함된 단백질을 코딩하는 유전자에 영향을 미친다면, 전사 또는 번역의 잘못된 조절이 또한 발생할 수 있다. 이러한 돌연변이는 보통 기능적인 유전자의 병리학적인 상향 또는 하향 조절을 일으킬 수 있다. 이러한 조절 기능을 수행하는 유전자 산물을 코딩하는 유전자는 예를 들어 전사 인자, 신호 수용체 또는 메신저 단백질 등일 수 있다. 그러나, 조절 단백질을 코딩하는 이러한 유전자의 기능의 상실은, 특정한 상황 하에, 손상된 유전자 산물의 보다 다운스트림(downstream)으로 활동하는 다른 요소의 인공적인 도입에 의해 역전될 수 있다. 이러한 유전자 결함은 또한 영향을 받은 유전자 자체의 치환을 통한 유전자 요법에 의해 보상될 수 있다.

유전자 백신 접종은 박테리아 표면, 바이러스 입자 또는 종양 항원 등과 같은 특유의 구성 요소와 같은 선택된 항원에 바람직한 면역 반응을 유발한다. 일반적으로, 백신 접종은 현대 의학의 중심적인 업적 가운데 하나이다. 그러나, 효과적인 백신 접종은 현재 제한된 수의 질병에 대해서만 가능하다. 따라서, 백신 접종에 의해 예방이 불가능한 감염은 여전히 매년 수백만명의 사람들에게 영향을 미친다.

일반적으로, 백신은 "제1", "제2" 및 "제3" 세대 백신으로 세분될 수 있다. "제1세대" 백신은 전형적으로 전체 유기체 백신이다. 이들은 생존하고 약화된 또는 사멸된 병원체, 예를 들어 바이러스 또는 박테리아 등에 기초한다. 생존 및 약화된 백신의 주요한 결점은 생명을 위협하는 변이체에 회귀(reversion)에 대한 위험이다. 따라서, 비록 약화되더라도, 이러한 병원체는 여전히 예상치 못한 위험을 본질적으로 가질 수 있다. 사멸된 병원체는 특이적 면역 반응을 발생시키는데 바람직할만큼 효과적이지 않을 수 있다. 이들 위험을 최소화하기 위해, "제2세대" 백신이 개발되었다. 이들은 전형적으로, 병원체로부터 유도된 정의된 항원 또는 재조합 단백질 구성 요소로 이루어진 서브유닛 백신이다.

유전자 백신, 즉 유전자 백신 접종을 위한 백신은 일반적으로 "제3세대" 백신으로 알려져 있다. 그들은 전형적으로 인비보(in vivo) 병원체 또는 종양 항원에 대한 펩타이드 또는 단백질(항원) 절편의 발현을 허용하는 유전적으로 조작된 핵산 분자로 구성된다. 유전자 백신은 표적 세포의 흡수 이후 환자에게 투여될 때 발현된다. 투여된 핵산의 발현은 코딩된 단백질의 생산을 초래한다. 이들 단백질이 환자의 면역계에 의해 외부 물질로 인식될 경우, 면역 반응이 촉발된다.

상기와 같이, 유전자 치료 및 유전자 백신 접종 모두 환자에 핵산 분자의 투여 및 이후 코딩된 유전자 정보의 전사 및/또는 번역에 필수적으로 기초한다. 그렇지 않으면, 유전자 백신 접종 또는 유전자 치료는 또한 치료되는 환자로부터 특정한 체세포의 분리, 이후 이러한 세포의 엑스비보(ex vivo) 형질전환, 및 환자에 처리된 세포의 재투여를 포함하는 방법을 포함할 수 있다.

DNA뿐만 아니라 RNA는 유전자 치료 또는 유전자 백신 접종의 맥락에서 투여를 위한 핵산 분자로 사용될 수 있다. DNA는 상대적으로 안정하고 다루기 쉬운 것으로 알려져 있다. 그러나, DNA의 사용은 잠재적으로 손상된 유전자의 기능의 상실과 같이 돌연변이 현상을 초래하는, 환자의 유전체로 투여된 DNA 절편의 바람직하지 않은 삽입의 위험을 갖는다. 또 다른 위험으로, 항-DNA 항체의 바람직하지 않은 발생이 나타났다. DNA는 생산되는 mRNA가 번역되기 전에 전사되기 위해 반드시 핵에 들어가야 하므로, 다른 결점은 DNA 투여로 성취되는 코딩된 펩타이드 또는 단백질의 제한된 발현 수준이다. 다른 이유들 가운데, 투여된 DNA의 발현 수준은 DNA 전사를 조절하는 특정한 전사 인자의 존재에 의존할 것이다. 이러한 요소들이 없다면, DNA 전사는 RNA의 충분한 양을 생산하지 않을 것이다. 결과적으로 번역된 펩타이드 또는 수득된 단백질의 수준은 제한된다.

유전자 치료 또는 유전자 백신 접종을 위한 DNA 대신 RNA를 사용함으로써, 바람직하지 않은 유전체 삽입 및 항-DNA 항체의 형성의 위험은 최소화 또는 회피된다. 그러나, RNA는 유비쿼터스(ubiquitous) RNAse에 의해 쉽게 분해될 수 있는 상당히 불안정한 분자 종으로 여겨진다.

통상적으로, RNA 분해는 RNA 반감기의 조절에 기여한다. 상기 효과는 진핵세포 유전자 발현의 조절을 세밀하게 조정하는 것으로 여겨지고 증명되었다(Friedel et al., 2009. Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17): 1-12). 따라서, 각각의 자연 발생 mRNA는 mRNA가 유도된 유전자 및 이것이 발현되는 세포 타입에 의존하는 이의 개별적인 반감기를 갖는다. 이는 이러한 유전자의 발현 수준의 조절에 기여한다. 불안정한 RNAs는 특정한 시점에서 일시적인 유전자 발현을 깨닫는데 중요하다. 그러나, 오래 생존한 RNA는 특정한 단백질의 축적 또는 유전자의 지속적인 발현과 관련될 수 있다. 인비보(in vivo), mRNA의 반감기는 또한 예를 들어 인슐린 유사 성장 인자 I, 액틴 및 알부민 mRNA에서 나타나는 것처럼, 호르몬 치료와 같은 환경적인 요소에 의존할 수 있다(Johnson et al., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, pp. 5287-5291, 1991).

유전자 치료 및 유전자 백신 접종을 위해 보통 안정한 RNA가 바람직하다. 이는 반면, 생산물이 RNA 서열에 의해 코딩되는 것이 보통 바람직한 사실 문에, 인비보(in vivo) 축적된다. 반면, RNA는 적절한 투여 형태로 제조, 이의 저장 과정 및 투여될 때 이의 구조적 및 기능적인 온전성을 유지해야 한다. 따라서, 조기에 분해 또는 부식되는 것으로부터 예방하기 위하여, 유전자 치료 또는 유전자 백신 접종을 위해 적절한 RNA 분자를 제공하기 위한 노력이 있었다.

핵산 분자의 G/C-함량은 그들의 안정성에 영향을 미칠 수 있는 것으로 보고되었다. 따라서, 구아닌(G) 및/또는 시토신(C) 잔기의 증가된 양을 포함하는 핵산은 많은 양의 아데닌(A) 및 티민(T) 또는 우라실(U) 뉴클레오티드를 포함하는 핵산에 비해 기능적으로 보다 안정할 수 있다. 이러한 맥락에서, WO02/098443는 코딩 영역 내 서열 변형에 의해 안정되는 mRNA를 포함하는 약학적 조성물을 제공한다. 이러한 서열 변형은 유전자 코드의 퇴화의 장점을 가진다. 따라서, 뉴클레오티드(RNA 안정성의 관점에서 덜 바람직한)의 덜 바람직한 조합을 포함하는 코돈은 코딩된 아미노산 서열의 변형 없이 대체 코돈에 의해 치환될 수 있다. 이러한 RNA 안정화 방법은 바람직한 아미노산 서열의 공간을 남기지 않는, 각 단일 RNA 분자의 특정한 뉴클레오티드 서열의 제공에 의해 제한된다. 또한, 그러한 접근 방법은 RNA의 코딩 영역에 대하여 제한된다.

mRNA 안정화를 위한 대안적 선택으로서, 자연 발생 진핵 mRNA 분자는 특유의 안정화 요소를 포함하는 것으로 밝혀졌다. 예를 들어, 그들은 그들의 5'-말단(5'-UTR) 및/또는 그들의 3'-말단(3'-UTR)에 소위 비번역된 영역(UTR)뿐만 아니라 5'-캡 구조 또는 3'-폴리(A) 테일과 같은 다른 구조적인 특징을 포함할 수 있다. 5'-UTR 및 3'-UTR은 모두 전형적으로 유전체 DNA로부터 전사되며, 따라서 조숙 mRNA의 요소이다. 5'-캡 및 3'-폴리(A) 테일(소위 폴리(A)테일 또는 폴리(A) 서열)과 같은 성숙 mRNA의 특유한 구조적인 특징은 일반적으로 mRNA 가공 도중 전사된 (조숙) mRNA에 추가된다.

3'-폴리(A) 테일은 전형적으로 전사된 mRNA의 3'-말단에 첨가된 아데노신 뉴클레오티드의 단조로운(monotonous) 서열 스트레치이다. 이는 약 400개까지의 아데노신 뉴클레오티드를 포함할 수 있다. 이러한 3'-폴리(A) 테일의 길이는 각 mRNA의 안정성에 대하여 잠재적으로 중요한 요소인 것으로 밝혀졌다.

또한, 알파-글로빈 mRNA의 3'-UTR은 알파-글로빈 mRNA의 잘 알려진 안정성에 중요한 요소일 수 있는 것으로 나타났다(Rodgers et al., Regulated a-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, pp. 1526-1537, 2002). 알파-글로빈 mRNA의 3'-UTR은 이의 존재가 인비트로(in vitro)에 mRNA 안정성과 연관된, 특정한 리보뉴클레오단백질-복합체, 알파-콤플렉스의 형성에 명백하게 포함된다(Wang et al., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular biology, Vol 19, No. 7, July 1999, p. 4552-4560).

흥미로운 조절 기능은 리보좀 단백질 mRNA 내 UTR에 대하여 추가적으로 입증되었다: 반면 리보좀 단백질 mRNA의 5'-UTR은 mRNA의 성장과 관련된 번역을 조절하며, 그러한 조절의 엄격성은 리보좀 단백질 mRNA 내 각각의 3'-UTR에 의해 주어진다(Ledda et al., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, Vol. 344, 2005, p. 213-220). 이러한 메커니즘은 일정한 방식으로 전형적으로 전사되는 리보좀 단백질의 특정한 발현 패턴에 기여하며, 리보좀 단백질 S9 또는 리보좀 단백질 L32와 같은 일부 리보좀 단백질 mRNA는 하우스키핑 유전자로 고려된다(Janovick-Guretzky et al., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., Vol. 90, 2007, p. 2246-2252). 리보좀 단백질의 성장 관련된 발현 패턴은 따라서 주로 번역의 수준에 조절 때문이다.

mRNA 안정성에 영향을 주는 요소와 무관하게, 표적 세포 또는 조직에 의해 투여된 핵산 분자의 효과적인 번역은 유전자 치료 또는 유전자 백신 접종을 위한 핵산 분자를 사용하는 어느 접근 방법에 중요하다. 상기 언급된 실시예에서 볼 수 있듯이, 안정성의 조절에 따라 또한 주요 mRNA의 번역은 UTR, 5'-캡 및 3'-폴리(A) 테일과 같은 구조적 특징에 의해 조절된다. 이러한 맥락에서, 폴리(A) 테일의 길이는 전사 효율성을 위해서도 중요한 역할을 수행할 수 있는 것으로 보고되었다. 그러나, 3'-요소의 안정화는 또한 번역에 약화 효과를 가질 수 있다.

본 발명의 목적은 유전자 치료 및/또는 유전자 백신 접종에 적용하기에 적절할 수 있는 핵산 분자를 제공하는 것이다. 특히, 본 발명의 목적은 번역 효율에 현저한 기능적 손실을 보이지 않는, 조기 분해 또는 붕괴(decay)에 대하여 안정한 mRNA 종을 제공하는 것이다. 또한, 본 발명의 목적은 상기 핵산 분자에 의해 코딩된 각각 단백질의 증가된 발현에 의해 특성화된, 인공 핵산 분자, 바람직하게 mRNA를 제공하는 것이다. 본 발명의 특정한 목적은 각 코딩된 단백질의 번역 효율이 향상된 mRNA를 제공하는 것이다. 본 발명의 다른 목적은 유전자 치료 및/또는 유전자 백신 접종에 잘 사용할 수 있는 이러한 우수한 mRNA 종을 코딩하는 핵산 분자를 제공하는 것이다. 본 발명의 다른 목적은 유전자 치료 및/또는 유전자 백신 접종에 사용하기 위한 약학적 조성물을 제공하는 것이다. 요약하면, 본 발명의 목적은 비용 효율적이며, 간단한 방법에 의해 상기 개시된 선행 기술의 단점을 극복한 향상된 핵산 종을 제공하는 것이다.

본 발명의 기초가 되는 목적은 청구항의 대상에 의해 해결된다.

명확성 및 가독성을 위해 하기 정의가 제공된다. 이들 정의에 대하여 개시된 어느 기술적 특징은 본 발명의 실시예 각각 및 모두에서 읽을 수 있다. 추가적인 정의 및 설명은 이들 실시예의 맥락에서 구체적으로 제공될 수 있다.

적응 면역 반응: 자가 면역 반응은 면역 시스템의 항원 특이적 반응으로 전형적으로 이해된다. 항원 특이성은 특이적 병원체 또는 병원체 감염된 세포에 맞춰진 반응의 발생을 허용한다. 이들 맞춰진 반응을 시작하는 능력은 “기억 세포”에 의해 체내에 보통 유지된다. 병원체가 인체를 한번 이상 감염해야 하고, 이들 특이적 기억 세포는 이를 빠르게 제거하는데 사용된다. 이러한 맥락에서, 적응 면역 반응의 첫번째 단계는 항원 제시 세포에 의한 항원 특이적 면역 반응을 유도할 수 있는 순수한 항원 특이적 T 세포 또는 다른 면역 세포의 활성화이다. 이는 순수한 T 세포가 지속적으로 지나는 림프 조직 및 기관 내에 발생한다. 항원 제시 세포로 제공될 수 있는 세가지 세포 타입은 수상돌기세포, 대식세포, 및 B 세포이다. 이들 세포의 각각은 면역 반응을 유도하는데 뚜렷한 기능을 갖는다. 수상 돌기세포는 그들이 성숙 수상돌기세포로 분화하는 곳에서 식균작용(phagocytosis) 및 대식세포작용(micropinocytosis)에 의해 항원을 흡수할 수 있고 예를 들어 국소 림프 조직에 외래 항원을 이동시킴과 함께 접촉에 의해 자극될 수 있다. 대식세포는 박테리아와 같은 입자 항원을 섭취하고 MHC 분자를 발현하는 감염성 항원 또는 다른 적절한 자극에 의해 유도된다. 그들의 수용체를 통해 용해성 단백질 항원을 결합 및 내재화(internalize)하는 B 세포의 특수한 능력은 T 세포를 유도하는데 또한 중요할 수 있다. MHC 분자는 전형적으로 T-세포에 항원의 존재에 책임을 진다. 그 안에, MHC 분자에 항원의 제시는 무장(armed) 주효 T 세포로 그들의 증식 및 분화를 유도하는 T 세포의 활성화를 유도한다. 주효 T 세포의 가장 중요한 기능은 함께 세포-매개 면역을 일으키는 CD8+ 세포독성 T 세포에 의한 감염된 세포의 사멸 및 Th1 세포에 의한 대식세포의 활성화, 및 그에 따라 체액성 면역 반응을 일으키는 다른 종류의 항체를 생산하는 Th2 및 Th1 모두에 의한 B 세포의 활성화이다. T 세포는 항원을 직접적으로 인식 및 결합하지 못하는 그들의 T 세포 수용체에 의한 항원을 인식하지만, 그러나 대신 다른 세포의 표면에 MHC 분자에 결합하는, 예를 들어 병원체 유래 단백질 항원, 예를 들어 소위 에피토프(epitopes)의, 짧은 펩타이드 절편을 인식한다.

적응 면역 시스템: 적응 면역 시스템은 전형적으로 병원체 생장을 제거 또는 방해하는 데 필수적으로 헌신한다. 이는 전형적으로 특정한 병원체(면역성을 발생시키는)를 인식 및 기억하고, 병원균을 맞닥뜨릴 때마다 강한 공격을 시작하는 능력과 함께 척추동물 면역 시스템 제공에 의한 적응 면역 반응을 조절한다. 시스템은 체세포초돌연변이(somatic hypermutation)(가속된 체세포 돌연 변이의 과정), 및 V(D)J 재조합(항원 수용체 유전자 부분(segments)의 비가역적 유전적 재조합)에 의해 매우 적응할 수 있다. 이러한 메커니즘은 이후 각 개별적인 림프구에 독특하게 발현된 이후, 다른 항원 수용체의 방대한 수를 발생시키는 유전자의 소수를 허용한다. 유전자 재배열은 각 세포의 DNA에 비가역적 변화를 일으키기 때문에, 수명이 긴 특이적 면역에 대해 핵심(key)인 기억 B 세포 및 기억 T 세포를 포함하는, 그 세포의 자손(progeny)(후손(offspring)) 모두는 이후 동일한 수용체 특이성을 코딩하는 유전자를 상속할 것이다.

어쥬번트 / 어쥬번트 성분(component): 넓은 의미의 어쥬번트 또는 어쥬번트 성분은 전형적으로 약물 또는 백신과 같은, 다른 제제의 효과를 변형, 예를 들어 강화할 수 있는 약학적 및/또는 면역학적 제제이다. 이는 넓은 의미로 해석되고 물질의 넓은 범위를 나타낸다. 전형적으로, 이들 물질은 항원의 면역성을 증가시킬 수 있다. 예를 들어, 어쥬번트는 선천적 면역 시스템에 의해 인식될 수 있으며, 예를 들어 선천적 면역 반응을 유도할 수 있다. “어쥬번트”는 전형적으로 적응 면역 반응을 유도하지 않는다. 이러한 한도에서는(insofar), “어쥬번트”가 항원으로써 자격을 갖지 않는다. 그들의 행동 방식은 적응 면역 반응을 초래하는 항원에 의해 시작되는 효과로부터 명백하다.

항원: 본 발명의 맥락에서 “항원”은 전형적으로 면역 시스템에 의해, 바람직하게는 적응 면역 시스템에 의해 인지될 수 있고 항원 특이적 면역 반응을, 예를 들어 적응 면역 반응의 일부로써 항체 및/또는 항원 특이적 T 세포의 형성에 의해 시작할 수 있는 물질을 말한다. 전형적으로, 항원은 T-세포에 MHC에 의해 나타날 수 있는 펩타이드 또는 단백질이거나 이를 포함할 수 있다. 본 발명에 있어서 항원은 제공된 핵산 분자, 바람직하게 본 발명에 정의된 mRNA의 번역된 생산물일 수 있다. 이러한 맥락에서, 또한 펩타이드의 절편, 변이체 및 유도체 적어도 하나의 에피토프를 포함하는 단백질은 항원으로 이해된다. 본 발명의 맥락에서, 본 발명에 정의된 종양 항원 및 병원체 항원이 특히 바람직하다.

인공 핵산 분자: 인공 핵산 분자는 전형적으로 핵산 분자, 예를 들어 자연 발생하지 않는 DNA 또는 RNA로 이해될 수 있다. 다시 말해서, 인공 핵산 분자는 비천연 핵산 분자로 이해될 수 있다. 이러한 핵산 분자는 이의 개별 서열(자연적으로 발생하지 않는) 때문에 및/또는 다른 변형, 예를 들어 자연적으로 발생하지 않는 뉴클레오타이드의 구조적 변형 때문에 비-천연적일 수 있다. 인공 핵산 분자는 DNA 분자, RNA 분자 또는 DNA 및 RNA 부분을 포함하는 하이브리드 분자일 수 있다. 전형적으로, 인공 핵산 분자는 뉴클레오타이드의 원하는 인공 서열(이종(heterologous) 서열)에 대응하는 유전자 조작 방법에 의해 계획되거나/또는 발생될 수 있다. 이러한 맥락에서 인공 서열은 보통 자연적으로 발생하지 않는, 즉 적어도 하나의 뉴클레오타이드에 의해 야생형 서열과 다른 서열이다. 용어 '야생형'은 자연에서 발생하는 서열로서 이해될 수 있다. 나아가, 용어 '인공 핵산 분자'는 '하나의 단일 분자'를 의미하는 것으로 제한되지 않으며, 전형적으로 동일한 분자의 총체(ensemble)를 포함하는 것으로 이해된다. 따라서, 이는 표본(aliquot)에 포함되는 동일한 분자의 다수에 관련될 수 있다.

바이시스트로닉 RNA, 멀티시스트로닉 RNA: 바이시스트로닉 또는 멀티시스트로닉 RNA는 전형적으로 둘 (바이시스트로닉) 또는 그 이상의 (멀티시스트로닉) 오픈 리딩 프레임(ORF)를 가질 수 있는 전형적으로 RNA, 바람직하게는 mRNA이다. 이러한 맥락에서 오픈 리딩 프레임은 펩타이드 또는 단백질로 번역될 수 있는 코돈의 서열이다.

담체 / 폴리머 담체 : 본 발명의 맥락에서 담체는 전형적으로 다른 화합물(화물)의 수송 및/또는 복합화를 용이하게 하는 화합물일 수 있다. 폴리머 담체는 전형적으로 폴리머의 형성된 담체이다. 담체는 공유 또는 비공유 상호작용에 의해 이의 화물에 관련될 수 있다. 담체는 표적 세포에 핵산, 예를 들어 RNA 또는 DNA를 수송할 수 있다. 담체는 - 일부 실시예에서 - 양이온성 성분일 수 있다.

양이온성 성분: 용어 "양이온성 성분"은 전형적으로 전하를 띤 분자를 말하며, 이는 약 전형적으로 1 내지 9의 pH 값에, 바람직하게는 또는 9 미만(예를 들어 5 내지 9)의, 또는 8 미만(예를 들어 5 내지8)의, 또는 7미만(예를 들어 5 내지 7)의, 가장 바람직하게는 예를 들어 약 7.3 내지 7.4 생리학적 pH 값에 양전하를(양이온) 띤다. 따라서, 양이온성 성분은 어느 양전하를 띤 화합물 또는 폴리머, 바람직하게는 생리학적 조건 하에서, 특히 체내 생리학적 조건 하에서 양전하를 띤 양이온성 펩타이드 또는 단백질일 수 있다. "양이온성 펩타이드 또는 단백질"은 적어도 하나의 양전하를 띤 아미노산 또는 하나 이상의 양전하를 띤 아미노산, 예를 들어 Arg, His, Lys 또는 Orn으로부터 선택된 것을 포함할 수 있다. 따라서 '다중양이온성' 성분은 또한 주어진 조건 하에서 하나 이상의 양전하를 보이는 범위 내이다.

5'-캡: 5'-캡은 일반적으로 성숙 mRNA의 5'-말단을 "덮는(caps)" 독립체, 전형적으로 변형된 뉴클레오티드 독립체이다. 5'-캡은 전형적으로 변형된 뉴클레오티드에 의해, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게는, 5'-캡은 5'-5'-삼인산염 연결을 통해 5'-말단에 연결된다. 5'-캡은 메틸화될수 있으며, 예를 들어 m7GpppN, 상기 N은 5'-캡을 수송하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 RNA의 5'-말단이다. 5'캡 구조의 추가적 예시는 글리세릴, 역 디옥시 비염기 잔기(inverted deoxy abasic residue)(일부), 4',5' 메틸렌 뉴클레오타이드, 1-(베타-D-에리쓰로푸라노실) 뉴클레오타이드, 4'-티오 뉴클레오타이드, 카르보사이클릭 뉴클레오타이드, 1,5-무수헥시톨 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형된 염기 뉴클레오티드, 트레오-펜토푸라노실 뉴클레오티드, 비환식(acyclic) 3',4'-세코 뉴클레오티드, 비환식 3,4-디하이드록시부틸 뉴클레오티드, 비환식 3,5 디하이드록시펜틸 뉴클레오티드, 3'-3'-역 뉴클레오티드 일부, 3'-3'-역 비염기 일부, 3'-2'-역 뉴클레오티드 일부, 3'-2'-역 비염기 일부, 1,4-부탄디올 포스페이트, 3'-포스포라미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'포스포로티오에이트, 포스포로디티오에이트, 또는 브릿징(bridging) 또는 논-브릿징 메틸포스포네이트 일부를 포함한다.

세포성 면역/세포성 면역 반응: 세포성 면역은 전형적으로 대식세포, 자연 살생 세포(NK), 항원 특이적 세포독성 T-림프구의 활성화, 및 항원에 반응하여 다양한 사이토카인의 방출에 관련된다. 더 일반적인 용어에서, 세포성 면역은 항체가 아닌 면역 시스템의 세포의 활성화에 기초한다. 전형적으로 세포성 면역 반응은 예를 들어 세포, 예를 들어 그들의 표면에 외래 항원의 에피토프를 보이는 수지상 세포(dendritic cells) 또는 다른 세포와 같은 특이적 면역 세포에 세포자멸을 유도할 수 있는 항원 특이적 세포독성 T-림프구의 활성화에 의해 특성화될 수 있다. 이러한 세포는 바이러스 감염되거나 세포내 박테리아에 의해 감염된 것일 수 있으며, 또는 종양 항원을 제시하는 암 세포이다. 추가적인 특징들은 그들이 병원체를 파괴하게 하는 대식세포 및 자연 살생 세포의 활성화 및 적응 면역 반응 및 선천적 면역 반응에 포함된 다른 세포의 기능에 영향을 주는 다양한 사이토카인을 방출하는 세포의 자극일 수 있다.

핵산, 즉 (다른) 핵산으로부터 "유도된" 핵산에 관하여, 본 명세서 전체에 사용된 용어 "유도된"은 상기 핵산이 유도된 핵산과 적어도 50%, 바람직하게 적어도 60%, 바람직하게 적어도 70%, 더욱 바람직하게 적어도 75%, 더욱 바람직하게 적어도 80%, 더욱 바람직하게 적어도 85%, 더욱 더 바람직하게 적어도 90%, 더욱 더 바람직하게 적어도 95%, 및 특히 바람직하게 적어도 98%의 서열 상동성을 공유하는 (다른) 핵산으로부터 유도된 핵산을 의미한다. 통상의 기술자는 서열 동일성이 통상적으로 동일한 유형의 핵산, 즉 DNA 서열 또는 RNA 서열에 대해 계산됨을 이해할 것이다. 따라서, DNA가 RNA로부터 "유래된" 경우 또는 RNA가 DNA로부터 "유래된" 경우, 첫번째 단계에서 RNA 서열은 상응하는 DNA 서열로 전환된다(특히 서열 전체에 걸쳐 우라실(U)을 티민(T)으로 대체), 또는 그 반대의 경우, DNA 서열은 상응하는 RNA 서열로 전환된다(특히 서열 전체에 걸쳐 티민(T)을 우라실(U)로 대체). 이후, DNA 서열의 서열 동일성 또는 DNA 서열의 서열 동일성이 결정된다. 바람직하게, 핵산으로부터 "유도된" 핵산은 또한 그것이 유도된 핵산과 비교하여, 예를 들어, RNA 안정성을 더욱 증가시키고 및/또는 단백질 생성을 증진 및/또는 증가시키기 위해 변형된 핵산을 의미한다. 예를 들어 그것이 유래된 핵산과 비교하여, RNA 안전성을 손상시키지 않는 그러한 변형은 말할 필요도 없이 바람직하다.

DNA: DNA는 디옥시-리보핵-산(deoxy-ribonucleic-acid)에 대한 일반적인 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 폴리머이다. 이들 뉴클레오티드는 보통 디옥시-아데노신-모노포스페이트, 디옥시-티미딘-모노포스페이트, 디옥시-구아노신-모노포스페이트 및 디옥시-시티딘-모노포스페이트 모노머이며, 이들은 - 그들 자신에 의해 - 당 일부(디옥시리보스), 염기 일부 및 포스페이트 일부로 이루어지고, 특유의 백본(backbone) 구조에 의해 중합한다. 백본 구조는 전형적으로 첫째 뉴클레오티드의 당 일부, 즉 디옥시리보스 및 둘째 포스페이트 일부, 인접한 모노머 사이의포스포디에스터 결합에 의해 형성된다. 모노머의 특정한 순서, 즉 당/포스페이트 백본에 연결된 염기들의 순서는 DNA 서열로 불린다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 형태에서 첫번째 가닥의 뉴클레오티드는 전형적으로 두번째 가닥의 뉴클레오티드와 혼성화하며, 예를 들어 A/T 염기쌍 및 G/C 염기쌍에 의한다.

에피토프 (Epitope): 에피토프(소위 "항원 결정요인")는 T 세포 에피토프 및 B 세포 에피토프로 구별될 수 있다. 본 발명의 맥락에서 T 세포 에피토프 또는 단백질의 일부는 바람직하게는 약 6 내지 약 20의 길이 또는 그 이상의 아미노산을 갖는, 예를 들어 MHC 클래스 I 분자에 의해 가공되고 나타나는 절편, 바람직하게는 약 8 내지 약 10 아미노산의 길이, 예를 들어 8, 9, 또는 10, (또는 11, 또는 12 아미노산)의 길이를 갖는, 또는 MHC 클래스 II 분자에 의해 가공되고 나타나는 절편, 바람직하게는 약 13 또는 그 이상의 아미노산, 예를 들어 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상의 아미노산의 길이를 갖는 절편을 포함할 수 있으며, 상기 이들 절편은 아미노산 서열의 어느 일부로부터 선택될 수 있다. 이들 절편은 전형적으로 펩타이드 절편 및 MHC 분자로 이루어진 복합체의 형태인 T 세포에 의해 인식될 수 있으며, 즉 절편은 전형적으로 그들의 자연 형태로 인식되지 않는다. B 세포 에피토프는 전형적으로 바람직하게는 5 내지 15 아미노산을 갖는, 더욱 바람직하게는 5 내지 12 아미노산을 갖는, 더욱 더 바람직하게는 6 내지 9 아미노산을 갖는, 항체에 의해 인식될 수 있는, 즉 그들의 천연 형태로 본 발명에 정의된 (천연) 단백질 또는 펩타이드 항원의 외부 표면에 위치한다.

단백질 또는 펩타이드의 이러한 에피토프는 나아가 본 발명에 언급된 이러한 단백질 또는 펩타이드의 어느 변이체로부터 선택될 수 있다. 이러한 맥락에서 항원 결정요인은 본 발명에 정의된 단백질 또는 펩타이드의 아미노산 서열 내 불연속적이나 삼차원 구조 또는 단일 폴리펩타이드 사슬로 이루어진 연속적 또는 선형의 에피토프로 합쳐진 본 발명에 정의된 단백질 또는 펩타이드의 부분으로 이루어진 형태적(conformational)이거나 불연속적(discontinuous)인 에피토프일 수 있다.

서열의 절편: 서열의 절편은 전형적으로 예를 들어 핵산 분자 또는 아미노산 서열의 전장(full length) 서열의 짧은 일부일 수 있다. 따라서 절편은 전형적으로 전장 서열 내 상응하는 스트레치와 동일한 서열로 이루어진다. 본 발명의 맥락에서 바람직한 서열의 절편은, 절편이 유도된 것으로부터 총(즉 전장) 분자의 적어도 5%, 10%, 20%, 바람직하게는 적어도 30%, 더욱 바람직하게는 적어도 40%, 더욱 바람직하게는 적어도 50%, 더욱 더 바람직하게는 적어도 60%, 더욱 더 바람직하게는 적어도 70%, 가장 바람직하게는 적어도 80%를 나타내는, 절편이 유도된 분자 내 독립체의 연속적인 스트레치에 상응하는 뉴클레오티드 또는 아미노산과 같은 연속적인 독립체의 스트레치로 이루어진다.

G/C 변형(modified): G/C 변형된 핵산은 전형적으로 야생형 서열에 비해 구아노신 및/또는 시토신의 바람직하게 증가된 수를 포함하는 변형된 야생형 서열에 기초하는 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자일 수 있다. 이러한 증가된 수는 구아노신 또는 시토신 뉴클레오티드를 포함하는 코돈에 의해 아데노신 또는 티미딘 뉴클레오티드를 포함하는 코돈의 치환에 의해 발생될 수 있다. 증가된 G/C 함량이 DNA 또는 RNA의 코딩 영역에 발생하는 경우, 이는 유전적 코드의 축퇴(degeneracy)의 사용을 만든다. 따라서 코돈 치환은 바람직하게는 코딩된 아미노산 잔기를 변화시키지 않으나, 핵산 분자의 G/C 함량을 독점적으로 증가시킨다.

유전자 치료: 유전자 치료는 전형적으로 환자 신체의 치료 또는 환자 신체의 분리된 요소, 예를 들어 분리된 조직/세포, 펩타이드 또는 단백질을 코딩하는 핵산에 의한 것을 의미하는 것으로 이해될 수 있다. 이는 전형적으로 a) 환자에게 직접적으로 - 어떠한 투여 경로를 통해서 - 또는 인비보(in vivo)/엑스비보(ex vivo) 또는 인비트로(in vitro) 환자의 세포의 형질전환을 초래하는, 환자의 분리된 세포/조직에 인비트로에서 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자를 투여; b) 투여된 핵산 분자의 전사 및/또는 번역; 및 선택적으로 c) 만약 핵산이 환자에게 직접 투여되지 않은 경우, 환자에게 분리된, 형질전환된 세포를 재투여하는 단계의 적어도 하나를 포함할 수 있다.

유전자 백신 접종: 유전자 백신 접종은 전형적으로 항원 또는 면역원 또는 이의 절편을 코딩하는 핵산 분자의 투여에 의해 백신 접종되는 것으로 이해된다. 핵산 분자는 개체의 신체 또는 개체의 분리된 세포에 투여될 수 있다. 신체의 특정한 세포의 형질전환 또는 분리된 세포의 형질전환에, 항원 또는 면역원은 이들 세포에 의해 나타날 수 있고 그 뒤에 면역 시스템, 적응을 유도하는, 즉 항원 특이적 면역 반응에 나타난다. 따라서, 유전자 백신 접종은 전형적으로 a) 개체, 바람직하게는 환자에, 또는 인비보 또는 인비트로에서 개체의 세포의 형질전환을 보통 초래하는 개체, 바람직하게는 환자의 분리된 세포에, 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자의 투여; b) 투여된 핵산 분자의 전사 및/또는 번역; 및 선택적으로 c) 만약 핵산이 환자에 직접 투여되지 않았다면 개체, 바람직하게는 환자에 분리된 형질전환된 세포의 재투여하는 단계의 적어도 하나를 포함한다.

이종 서열(Heterologous sequence): 두 서열은 만약 그들이 동일한 유전자로부터 유도되지 않았다면 전형적으로 '이종'인 것으로 이해된다. 즉, 비록 이종 서열이 동일한 유기체로부터 유도될 수 있어도, 그들은 자연적으로(자연에서) 동일한 mRNA에서와 같이, 동일한 핵산 분자로 발생하지 않는다.

체액성 면역/ 체액성 면역 반응: 체액성 면역은 전형적으로 항체 생산 및 선택적으로 항체 생산을 동반하는 부가적 과정을 말한다. 체액성 면역 반응은 예를 들어 Th2 활성화 및 사이토카인 생산, 배중심(germinal center) 형성 및 동형(isotype) 전환, 친화도 성숙 및 기억 세포 발생에 의해, 전형적으로 특성화될 수 있다. 체액성 면역은 또한 병원체 및 독소 중성화, 고전적 보체 활성화, 및 식균 작용 및 병원체 제거의 옵소닌 촉진을 포함하는 전형적으로 항체의 주효 기능을 나타낼 수 있다.

면역원: 본 발명의 맥락에서 면역원은 면역 반응을 촉진할 수 있는 화합물로 전형적으로 이해된다. 바람직하게는 면역원은 펩타이드, 폴리펩타이드, 또는 단백질이다. 특히 바람직한 실시예에서, 본 발명의 의미의 면역원은 제공된 핵산 분자, 바람직하게는 본 발명에 정의된 인공 핵산 분자의 번역의 생산물이다. 전형적으로 면역원은 적어도 적응 면역 반응을 유도한다.

면역자극성 구성요소: 본 발명의 맥락에서, 면역자극성 구성요소는 전형적으로 면역 반응을 유도할 수 있는 또는 면역 반응을 유도할 수 있는 성분이 유도될 수 있는 것으로부터 적어도 하나의 성분을 포함하는 구성요소로 이해된다. 이러한 면역 반응은 바람직하게는 선천적 면역 반응 또는 적응 및 선천적 면역 반응의 조합일 수 있다. 바람직하게는 본 발명의 맥락에서 면역자극성 구성요소는 적어도 하나의 인공 핵산 분자, 더욱 바람직하게는 RNA, 예를 들어 mRNA 분자를 포함한다. mRNA와 같은 면역자극성 구성요소는 적절한 담체와 함께 복합체화될 수 있다. 따라서 면역자극성 구성요소는 mRNA/담체 복합체를 포함할 수 있다. 나아가, 면역자극성 구성요소는 어쥬번트 및/또는 mRNA와 같은 면역자극성 구성요소에 적절한 비히클을 포함할 수 있다.

면역 반응: 면역 반응은 전형적으로 특정한 항원에 적응 면역 시스템의 특이적 반응(소위 특이적 또는 적응 면역 반응) 또는 선천적 면역 시스템의 비특이적 반응(소위 비특이적 또는 선천적 면역 반응), 또는 이들의 조합일 수 있다.

면역 시스템: 면역 시스템은 감염으로부터 유기체를 보호할 수 있다. 만약 병원체가 유기체의 물리적 장벽을 통과하는데 성공하여 이러한 유기체에 침입한다면, 선천적 면역 시스템은 즉시, 단 비 특이적인 반응을 제공한다. 만약 병원체가 선천적 반응을 피한다면, 척추동물은 두번째 방어층, 적응 면역 시스템을 갖는다. 여기에 면역 시스템은 병원체에 대한 이의 인식을 증가시키기 위해 감염 동안 이의 반응을 조정한다. 증가된 반응은 이후 면역학적 기억의 형태로 병원체가 제거된 다음에도 유지되며, 적응 면역 시스템을 보다 빠르게 시작하고 이 병원체를 맞닥뜨릴때마다 보다 강하게 공격하도록 허용한다. 이에 따르면, 면역 시스템은 선천적 및 적응 면역 시스템을 포함한다. 이들 두 파트의 각각은 전형적으로 소위 체액성 및 세포성 성분을 포함한다.

면역자극성 RNA: 본 발명의 맥락에서 면역자극성 RNA(isRNA)는 전형적으로 선천적 면역 반응을 유도할 수 있는 RNA일 수 있다. 이는 일반적으로 오픈 리딩 프레임을 갖지 않으며 따라서 펩타이드 항원 또는 면역원을 제공하지 않으나 예를 들어 톨(Toll) 유사 수용체(TLR) 또는 다른 적절한 수용체의 특정한 종류에 결합에 의한 면역 반응을 촉진한다. 그러나 물론 또한 오픈 리딩 프레임을 가지며 펩타이드/단백질을 코딩하는 mRNAs는 선천적 면역 반응을 유도할 수 있으며, 따라서 면역자극성 RNAs일 수 있다.

선천적 면역 반응: 선천적 면역 반응, 또한 비특이적(또는 불특정(unspecific)) 면역 시스템으로 알려진 것은 전형적으로 세포 및 비특이적 조건에서 다른 유기체에 의한 감염으로부터 숙주를 방어하는 메커니즘을 포함한다. 이는 선천적 면역 시스템의 세포는 일반적인 방법으로 병원체를 인식 및 반응하지만, 적응 면역 시스템과는 다르게 숙주에 오래 지속되거나 방어적 면역을 부여하지 않는 것을 의미한다. 선천적 면역 시스템은 예를 들어 Toll-유사 수용체(TLRs)의 리간드 또는 리포폴리다당류(lipopolysaccharides), TNF-알파, CD40 리간드, 또는 사이토카인, 모노카인(monokines), 림포카인(lymphokines), 인터루킨(interleukins) 또는 케모카인(chemokines), IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-알파, IFN-베타, IFN-감마, GM-CSF, G-CSF, M-CSF, LT-베타, TNF-알파, 성장 인자, 및 hGH와 같은 다른 보조(auxiliary) 물질, 인간 Toll-유사 수용체 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10의 리간드, 쥣과(murine) Toll-유사 수용체 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 또는 TLR13의 리간드, NOD-유사 수용체의 리간드, RIG-I 유사 수용체의 리간드, 면역자극성 핵산, 면역자극성 RNA(isRNA), CpG-DNA, 항생제, 또는 항바이러스제에 의해 활성화될 수 있다. 본 발명에 따르는 약학적 조성물은 하나 또는 그 이상의 이러한 물질을 포함할 수 있다. 전형적으로 선천적 면역 시스템의 반응은 사이토카인으로 불리는 특수한 화학 조절자를 포함하는, 화학적 인자의 생산을 통해, 감염의 부위에 면역 세포를 모으는 것(recruiting); 보체 연쇄(cascade)의 활성화; 특수한 백혈구 세포에 의해 기관, 조직, 혈액 및 림프 내에 존재하는 외래 물질의 선별 및 제거; 적응 면역 시스템의 활성화; 및/또는 감염성 제제에 물리적 및 화학적 장벽으로 행동을 포함한다.

클로닝 부위: 클로닝 부위는 전형적으로 핵산 서열, 예를 들어 오픈 리딩 프레임을 포함하는 핵산 서열의 삽입에 적절한 핵산 분자의 일부로 이해된다. 삽입은 본 발명이 속하는 기술분야에서 통상의 기술자에게 알려진 어느 분자 생물학적 방법을 통해, 예를 들어 제한(restriction) 및 결찰(ligation)에 의해 수행될 수 있다. 클로닝 부위는 전형적으로 하나 또는 그 이상의 제한 효소 인식 부위(제한 부위)를 포함한다. 이들 하나 또는 그 이상의 제한 부위는 이들 부위에 DNA를 쪼개는 제한 효소에 의해 인식될 수 있다. 하나 이상의 제한 부위를 포함하는 클로닝 부위는 또한 멀티플 클로닝 부위(MCS) 또는 폴리링커(polylinker)로 불릴 수 있다.

핵산 분자: 핵산 분자는 바람직하게는 핵산 성분을 포함하는, 바람직하게는 이로 이루어진 분자이다. 용어 핵산 분자는 바람직하게는 DNA 또는 RNA 분자를 말한다. 이는 바람직하게는 용어 “폴리뉴클레오티드”와 동의어로 사용된다. 바람직하게는 핵산 분자는 당/인산 백본의 포스포디에스터 결합에 의해 서로 공유결합된 뉴클레이티드 모노머를 포함 또는 이로 이루어진 폴리머이다. 용어 “핵산 분자”는 또한 염기 변형된, 당 변형된 또는 백본 변형된 등의 DNA 또는 RNA 분자와 같은, 변형된 핵산 분자를 포함한다.

오픈 리딩 프레임: 본 발명의 맥락에서 오픈 리딩 프레임(ORF)는 전형적으로 펩타이드 또는 단백질로 번역될 수 있는 몇몇 뉴클레오티드 트리플렛(triplets)의 서열일 수 있다. 오픈 리딩 프레임은 바람직하게는 시작 코돈, 즉 이의 5'-말단에 아미노산 메티오닌(ATG)을 일반적으로 코딩하는 세개의 후속 뉴클레오티드의 조합 및 보통 3 뉴클레오티드의 배수인 길이를 보이는 후속 영역을 포함한다. ORF는 바람직하게는 정지 코돈(예를 들어 TAA, TAG, TGA)에 의해 종결된다. 전형적으로 이는 오픈 리딩 프레임의 유일한 정지 코돈이다. 따라서 본 발명의 맥락에서 오픈 리딩 프레임은 바람직하게는 시작 코돈(예를 들어 ATG)로 시작하고 바람직하게는 정지 코돈(예를 들어 TAA, TGA, 또는 TAG)으로 종결되는, 세개로 나뉠 수 있는 뉴클레오티드의 수로 이루어진 뉴클레오티드 서열이다. 오픈 리딩 프레임은 분리 또는 보다 긴 핵산 서열, 예를 들어 벡터 또는 mRNA에 병합될 수 있다. 오픈 리딩 프레임은 또한 "단백질 코딩 영역"으로 불릴 수 있다.

펩타이드 : 펩타이드 또는 폴리펩타이드는 전형적으로 펩타이드 결합으로 연결된 아미노산 모노머의 폴리머이다. 이는 전형적으로 50 모노머 단위 미만을 포함한다. 그럼에도 불구하고, 용어 펩타이드는 50 모노머 단위 이상을 갖는 분자를 제외하는 것은 아니다. 긴 펩타이드는 또한 전형적으로 50 및 600 모노머 단위 사이를 갖는 폴리펩타이드로 불린다.

약학적으로 유효한 양: 본 발명의 맥락에서 약학적으로 유효한 양은 전형적으로 면역 반응, 발현된 펩타이드 또는 단백질의 병리학적 수준을 변화, 또는 부족한 유전자 생산물의 치환, 예를 들어 병리학적 상황의 경우와 같이 약학적인 효과를 유도하기에 충분한 양으로 이해된다.

단백질 단백질은 전형적으로 하나 또는 그 이상의 펩타이드 또는 폴리펩타이드를 포함한다. 단백질은 전형적으로 단백질이 이의 생물학적 기능을 행사하는데 필요할 수 있는, 3차원 형태로 접힌다.

폴리 (A) 서열: 폴리(A) 서열, 소위 폴리(A) 꼬리 또는 3'-폴리(A) 꼬리는 전형적으로 아데노신 뉴클레오티드, 예를 들어 약 400 아데노신 뉴클레오티드에 이르는, 예를 들어 약 25 내지 약 400, 바람직하게는 약 50 내지 약 400, 더욱 바람직하게는 약 50 내지 약 300, 더욱 더 바람직하게는 약 50 내지 약 250, 가장 바람직하게는 약 60 내지 약 250 아데노신 뉴클레오티드의 서열로 이해된다. 폴리(A) 서열은 전형적으로 mRNA의 3'말단에 위치한다. 본 발명의 맥락에서, 폴리(A) 서열은 예를 들어 벡터 내, 예를 들어 RNA, 바람직하게는 mRNA의 발생, 예를 들어 벡터의 전사에 의한 것을 위해 주형(template)으로서 제공하는, 벡터 내와 같이, mRNA 또는 어느 다른 핵산 분자 내에 위치할 수 있다.

폴리아데닐화: 폴리아데닐화는 전형적으로 RNA 분자와 같은 핵산 분자에, 예를 들어 조숙 mRNA에 폴리(A)서열의 첨가로 이해된다. 폴리아데닐화는 소위 폴리아데닐화 신호에 의해 유도될 수 있다. 이러한 신호는 바람직하게는 폴리아데닐화되는 RNA 분자와 같은 핵산 분자의 3'-말단에 뉴클레오티드의 스트레치 내에 위치한다. 폴리아데닐화 신호는 전형적으로 아데닌 또는 우라실/티민 뉴클레오티드, 바람직하게는 헥사머 서열 AAUAAA로 이루어진 헥사머를 포함한다. 다른 서열, 바람직하게는 헥사머 서열은 또한 생각될 수 있다. 폴리아데닐화는 전형적으로 Pre-mRNA(소위 조숙-mRNA)의 가공 중에 발생한다. 전형적으로 RNA 성숙(pre-mRNA로부터 성숙 mRNA로)은 폴리아데닐화 단계를 포함한다.

제한 부위: 제한 부위는, 또한 '제한 효소 인식 부위'로 불림, 제한 효소에 의해 인식되는 뉴클레오티드 서열이다. 제한 부위는 전형적으로 짧은, 바람직하게는 회문식(palindromic) 뉴클레오티드 서열, 예를 들어 4 내지 8 뉴클레오티드를 포함하는 서열이다. 제한 부위는 바람직하게는 제한 효소에 의해 특이적으로 인식된다. 제한 효소는 전형적으로 이러한 부위에 제한 부위를 포함하는 뉴클레오티드 서열을 쪼갠다. 이중 나선 DNA 서열과 같은 이중 가닥 뉴클레오티드 서열에서, 제한 효소는 전형적으로 뉴클레오티드 서열의 양쪽 가닥 모두를 절단한다.

RNA, mRNA: RNA는 보통 리보핵산의 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 폴리머이다. 이들 뉴클레오티드는 보통 소위 백본을 통해 서로 연결된 아데노신-모노포스페이트, 우리딘-모노포스페이트, 구아노신-모노포스페이트 및 시티딘 모노포스페이트 모노머이다. 백본은 첫번째로 당, 즉 리보스 및 두번째로 인접 모노머, 포스페이트 일부 사이의 포스포디에스터 결합에 의해 형성된다. 모노머들의 특이적인 연속은 RNA 서열로 불린다. 보통 RNA는 DNA 서열의 전사에 의해, 예를 들어 세포 내에서 얻어질 수 있다. 진핵 세포에서, 전사는 전형적으로 핵 또는 미토콘드리아 내에서 수행된다. 일반적으로, DNA의 전사는 보통 보통 mRNA로 축약되는, 소위 메신저 RNA로 가공되는 소위 조숙 RNA를 초래한다. 예를 들어 진핵 유기체 내에서 조숙 RNA의 가공은 스플라이싱, 5'-캡핑, 폴리아데닐화, 핵 또는 미토콘드리아 및 그와 유사한 것으로부터 배출과 같은 다른 다양한 전사후 변형을 포함한다. 이들 가공의 합은 소위 RNA의 성숙이다. 성숙 메신저 RNA는 보통 특정한 펩타이드 또는 단백질의 아미노산 서열로 번역될 수 있는 뉴클레오티드 서열을 제공한다. 전형적으로, 성숙 mRNA는 5'-캡, 5'UTR, 오픈 리딩 프레임, 3'UTR 및 폴리(A) 서열을 포함한다. 메신저 RNA를 제외하고, 전사 및/또는 번역의 조절에 포함될 수 있는 RNA의 몇몇 비코딩 형태가 존재한다.

핵산 분자의 서열: 핵산 분자의 서열은 전형적으로 특정하고 개별적인 순서, 즉 이의 뉴클레오티드의 연속으로 이해된다. 단백질 또는 펩타이드의 서열은 전형적으로 순서, 즉 이의 아미노산의 연속으로 이해된다.

서열 상동성 (identity): 만약 그들이 뉴클레오티드 또는 아미노산의 동일한 길이 및 순서를 보이는 경우, 둘 또는 그 이상의 서열이 동일한 것이다. 상동성의 백분율은 전형적으로 두 서열이 동일한 정도를 설명, 즉 이는 전형적으로 참조-서열의 동일한 뉴클레오티드와 그들 서열 위치가 일치하는 뉴클레오티드의 백분율을 설명한다. 상동성의 정도를 결정하기 위해, 비교되는 서열은 동일한 길이, 즉 비교되는 서열의 가장 긴 서열의 길이를 보이는 것으로 여겨진다. 이는 8 뉴클레오티드로 이루어지는 첫번째 서열은 첫번째 서열을 포함하는 10 뉴클레오티드로 이루어진 두번째 서열과 80% 동일한 것을 의미한다. 다시 말해서, 본 발명의 맥락에서, 서열의 상동성은 바람직하게는 동일한 길이를 갖는 둘 또는 그 이상의 서열 내 동일한 위치를 갖는 서열의 뉴클레오티드의 백분율과 관련된다. 갭은 보통 정렬 내 그들의 실제 위치와 관계 없이 비상동(non-identical) 위치로 간주된다.

안정화된 핵산 분자: 안정화된 핵산 분자는 변형이 없는 핵산 분자에 비해, 엑소- 또는 엔도뉴클레아제 분해(degradation)에 의한 것처럼 예를 들어 환경적 인자 또는 효소적 소화에 의한 붕괴(disintegration) 또는 분해(degradation)에 더욱 안정하게 변화된 핵산 분자, 바람직하게는 DNA 또는 RNA 분자이다. 바람직하게는 본 발명의 맥락에서 안정화된 핵산 분자는 원핵 또는 진핵 세포와 같은 세포, 바람직하게는 인간 세포와 같은 포유동물 세포 내에 안정된다. 안정화 효과는 또한 세포의 외부, 예를 들어 버퍼 용액 내 등, 예를 들어 안정화된 핵산 분자를 포함하는 약학적 조성물의 제조 과정에 영향을 줄 수 있다.

형질전환: 용어 "형질전환"은 DNA 또는 RNA(예를 들어 mRNA) 분자와 같은 핵산 분자의 세포 내, 바람직하게는 진핵 세포 내에 도입을 말한다. 본 발명의 맥락에서, 용어 "형질전환"은 세포 내로, 바람직하게는 포유동물 세포 내와 같이 진핵 세포 내로 핵산 분자를 도입하기 위한 통상의 기술자에게 알려진 어느 방법을 포함한다. 이러한 방법은 예를 들어 전기천공, 예를 들어 양이온성 지질 및/또는 리포좀에 기초한 리포펙션(lipofection), 칼슘 포스페이트 침전, 나노입자 기초의 형질전환, 바이러스 기초의 형질전환, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머 기초의 형질전환을 포함한다. 바람직하게는 도입은 비-바이러스성이다.

백신: 백신은 전형적으로 적어도 하나의 항원, 바람직하게는 면역원을 제공하는 예방 또는 치료적 물질로 이해된다. 항원 또는 면역원은 백신 접종에 적합한 어느 물질로부터 유래될(derived) 수 있다. 예를 들어, 항원 또는 면역원은 박테리아 또는 바이러스 입자 등으로부터 또는 종양 또는 암 조직으로부터와 같은 병원체로부터 유래될 수 있다. 항원 또는 면역원은 적응 면역 반응을 제공하는 몸의 적응 면역 시스템을 자극한다.

벡터: 용어 "벡터"는 핵산 분자, 바람직하게는 인공 핵산 분자를 말한다. 본 발명의 맥락에서 벡터는 오픈 리딩 프레임을 포함하는 핵산 서열과 같은, 원하는 핵산 서열을 합체 또는 보유하는데 적합하다. 이러한 벡터는 저장 벡터, 발현 벡터, 클로닝 벡터, 수송 벡터 등일 수 있다. 저장 벡터는 핵산 분자, 예를 들어 mRNA 분자의 간편한 저장을 허용하는 벡터이다. 따라서 벡터는 예를 들어 오픈 리딩 프레임 및 mRNA의 3'UTR 및/또는 5'-UTR에 상응하는 서열과 같이, 원하는 mRNA 서열 또는 이의 일부에 상응하는 서열을 포함할 수 있다. 발현 벡터는 RNA, 예를 들어 mRNA, 또는 펩타이드, 폴리펩타이드 또는 단백질과 같은 발현 생산물의 생산에 사용될 수 있다. 예를 들어 발현 벡터는 프로모터 서열, 예를 들어 RNA 폴리머라제 프로모터 서열과 같은 벡터의 서열 스트레치의 전사에 필요한 서열을 포함할 수 있다. 클로닝 벡터는 전형적으로 벡터 내로 핵산 서열을 합체하는데 사용될 수 있는 클로닝 부위를 포함하는 벡터이다. 클로닝 벡터는 예를 들어 플라스미드 벡터 또는 박테리오파지 벡터일 수 있다. 수송 벡터는 세포 또는 유기체 내로 핵산 분자를 수송하는데 적합한 벡터, 예를 들어 바이러스 벡터일 수 있다. 본 발명의 맥락에서 벡터는 예를 들어 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게는 벡터는 DNA 분자이다. 바람직하게는 본 출원의 의미 내 벡터는 클로닝 부위, 항생제 저항성 인자와 같은 선별 마커, 및 복제 원점과 같은 벡터의 증폭에 적합한 서열을 포함한다. 바람직하게는 본 출원의 맥락에서 벡터는 플라스미드 벡터이다.

비히클 (Vehicle): 비히클은 전형적으로 약학적으로 활성인 화합물과 같은 화합물 저장, 수송, 및/또는 투여에 적합한 물질로 이해된다. 예를 들어, 이는 약학적으로 활성인 화합물 저장, 수송, 및/또는 투여에 적합한 생리학적으로 허용 가능한 액체이다.

3'- 비번역된 영역(3'-UTR): 일반적으로, 용어 "3'-UTR"은 오픈 리딩 프레임의 3'(즉 "다운스트림")에 위치하고 단백질로 번역되지 않는 인공 핵산 분자의 일부를 말한다. 전형적으로, 3'-UTR은 단백질 코딩 영역(오픈 리딩 프레임(ORF)) 또는 코딩 서열(CDS)) 및 mRNA의 폴리(A) 서열 사이에 위치한 mRNA의 일부이다. 본 발명의 맥락에서, 용어 3'-UTR은 또한 RNA가 전사된 주형(template)으로 코딩되지 않은 요소를 포함할 수 있으나, 전사 이후 성숙 도중에 첨가된다, 예를 들어 폴리(A) 서열. mRNA의 3'-UTR은 아미노산 서열로 번역되지 않는다. 3'UTR 서열은 보통 유전자 발현 과정 중에 각각 mRNA로 전사되는 유전자에 의해 코딩된다. 유전체 서열은 선택적 인트론을 포함하는 조숙 mRNA로 우선 전사된다. 조숙 mRNA는 이후 성숙 과정에서 성숙 mRNA로 추가적으로 가공된다. 이러한 성숙 과정은 5'캡핑, 조숙 mRNA를 선택적 인트론으로 자르는 스플라이싱 및 조숙 mRNA의 3'-말단의 폴리아데닐화와 같은 3'-말단의 변형 및 선택적 엔도-/ 또는 엑소뉴클레아제 분해 등의 단계를 포함한다. 본 발명의 이러한 맥락에서, 3'UTR은 단백질 코딩 영역의 정지 코돈 사이에, 바람직하게는 단백질 코딩 영역의 정지 코돈에 3' 바로 옆에 위치한 성숙 mRNA의 서열, 및 mRNA의 폴리(A) 서열에 상응한다. 용어 “상응”은 3'UTR 서열은 3'UTR 서열을 정의하는데 사용되는 mRNA 서열에서와 같이 RNA 서열, 또는 이러한 RNA 서열에 상응하는 DNA 서열일 수 있음을 의미한다. 본 발명의 맥락에서, 용어 “유전자의 3'UTR”은 이러한 유전자로부터 유도된 성숙 mRNA의 3'UTR에 상응하는 서열로, 즉 mRNA는 유전자의 전사 및 조숙 mRNA의 성숙에 의해 얻어진다. 용어 “유전자의 3'UTR”은 3'UTR의 DNA 서열 및 RNA 서열(센스(sense) 및 안티센스(antisense) 가닥 모두 및 성숙 및 비성숙 모두)을 포함한다. 바람직하게, 3'UTR은 20, 30, 40 또는 50개 뉴클레오티드 이상의 길이를 갖는다.

5'- 비번역된 영역(5'-UTR): 일반적으로, 용어 "5'-UTR"은 오픈 리딩 프레임의 5'(즉 "업스트림")에 위치하며 단백질로 번역되지 않은 인공 핵산 분자를 의미한다. 5'UTR은 전형적으로 mRNA의 오픈 리딩 프레임의 5'에 위치한 메신저 RNA(mRNA)의 특정한 구획(section)으로 이해된다. 일반적으로, 5'-UTR은 전사 시작 부위에서 시작하며, 오픈 리딩 프레임의 시작 코돈의 1개 뉴클레오티드 앞에서 종결한다. 바람직하게, 5'UTR은 20, 30, 40 또는 50개 뉴클레오티드의 길이를 갖는다. 5'-UTR은 유전자 발현을 조절하기 위한 요소, 소위 조절 요소를 포함할 수 있다. 이러한 조절 요소는 예를 들어 리보좀 결합 부위일 수 있다. 5'-UTR은 예를 들어 5'-CAP의 첨가를 통해 전사후 변형될 수 있다. mRNA의 5'-UTR은 아미노산 서열로 번역되지 않는다. 5'-UTR 서열은 일반적으로 유전자 발현 과정 중 각각의 mRNA로 전사되는 유전자에 의해 코딩된다. 유전체 서열은 선택적 인트론을 포함하는 조숙 mRNA로 먼저 전사된다. 조숙 mRNA는 이후 성숙 과정 중 성숙 mRNA로 추가적으로 가공된다. 이러한 성숙 과정은 5'캡핑, 선택적 인트론으로 자르기 위한 조숙 mRNA의 스플라이싱 및 조숙 mRNA의 3'-말단의 폴리아데닐화와 같은 3'-말단의 변형 및 선택적 엔도/또는 엑소뉴클레아제 분해 등의 단계를 포함한다. 본 발명의 맥락에서, 5'-UTR은 시작 코돈 및 예를 들어, 5'CAP 사이에 위치한 성숙 mRNA의 서열에 상응한다. 바람직하게, 5'-UTR은 5'-CAP에 3' 위치한 뉴클레오티드, 더욱 바람직하게 5'-CAP에 3' 바로 옆에 위치한 뉴클레오티드로부터 단백질 코딩 영역의 시작 코돈에 5' 위치한 뉴클레오티드, 바람직하게 단백질 코딩 영역의 시작 코돈에 5' 바로 옆에 위치한 뉴클레오티드까지 확장하는 서열에 상응한다. 성숙 mRNA의 5'-CAP에 3' 바로 옆에 위치한 뉴클레오티드는 전형적으로 전사 시작 부위에 상응한다. 용어 "상응"은 5'-UTR 서열이 5'-UTR 서열을 정의하는데 사용되는 mRNA 서열과 같은 RNA 서열, 또는 이러한 RNA 서열에 상응하는 DNA 서열일 수 있음을 의미한다. 본 발명의 맥락에서, 용어 "유전자의 5'-UTR"은 이러한 유전자로부터 유도된 성숙 mRNA, 즉, 유전자의 전사 및 조숙 mRNA의 성숙에 의해 얻어진 mRNA의 5'-UTR에 상응하는 서열이다. 용어 "유전자의 5'-UTR"은 5'-UTR의 DNA 서열 및 RNA 서열(모두 센스 및 안티센스 가닥 및 모두 성숙 및 미숙)을 포함한다.

5'말단 올리고피리미딘 트랙트 (TOP): 5'말단 올리고피리미딘 트랙트(TOP)는 전형적으로 특정한 mRNA 분자의 5'말단 영역 또는 특정한 유전자의 기능적 독립체의 5'말단 영역, 예를 들에 전사된 영역과 같은, 핵산 분자의 5'말단 영역에 위치한 피리미딘 뉴클레오타이드의 스트레치이다. 서열은 보통 전사 시작 부위에 상응하는 시티딘으로 시작하며, 보통 약 3 내지 30 피리미딘 뉴클레오티드의 스트레치가 뒤따른다. 예를 들어, TOP는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 그 이상의 뉴클레오티드를 포함할 수 있다. 피리미딘 스트레치 및 따라서 5'TOP는 TOP의 다운스트림에 위치한 첫번째 퓨린 뉴클레오티드에 5' 하나의 뉴클레오티드로 종결한다. 5'말단 올리고피리미딘 트랙트를 포함하는 메신저 RNA는 종종 TOP mRNA로 언급된다. 따라서 이러한 메신저 RNAs를 제공하는 유전자는 TOP 유전자로 언급된다. TOP 서열은 예를 들어 유전자 및 펩타이드 신장 인자를 코딩하는 mRNAs 및 리보좀 단백질에서 발견되었다.

TOP 모티프: 본 발명의 맥락에서, TOP 모티프는 상기 정의된 5'TOP에 상응하는 핵산 서열이다. 따라서, 본 발명의 맥락에서 TOP 모티프는 바람직하게는 3-30 뉴클레오티드의 길이를 갖는 피리미딘 뉴클레오티드의 스트레치이다. 바람직하게는, TOP-모티프는 적어도 3 피리미딘 뉴클레오티드, 바람직하게는 적어도 4 피리미딘 뉴클레오티드, 바람직하게는 적어도 5 피리미딘 뉴클레오티드, 더욱 바람직하게는 적어도 6 뉴클레오티드, 더욱 바람직하게는 적어도 7 뉴클레오티드, 가장 바람직하게는 적어도 8 피리미딘 뉴클레오티드로 이루어지며, 상기 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 시토신 뉴클레오티드의 5'말단에서 시작한다. TOP 유전자 및 TOP mRNAs에서, TOP-모티프는 바람직하게는 전사 시작 부위와 함께 이의 5'말단에서 시작하며 상기 유전자 또는 mRNA 내 첫번째 퓨린 잔기에 5' 하나의 뉴클레오티드에 종결한다. 본 발명의 의미에서 TOP 모티프는 바람직하게는 5'UTR을 나타내는 서열의 5'말단에 또는 5'UTR을 코딩하는 서열의 5'말단에 위치한다. 따라서 바람직하게는 3 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는, 만약 이러한 스트레치가 인공 핵산 분자, 상기 인공 핵산 분자의 5'UTR 요소, 또는 본 발명에 정의된 TOP 유전자의 5'UTR로부터 유도된 핵산 분자와 같은, 각각 서열의 5'말단에 위치하는 경우에, 본 발명의 의미에서 “TOP 모티프”로 불린다. 다시 말하면, 5'UTR 또는 5'UTR 요소의 5'-말단에 위치하지 않으나 5'UTR 또는 5'UTR 요소 내 어느 곳에 위치한 3 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 “TOP 모티프”가 아니다.

TOP 유전자: TOP 유전자는 전형적으로 5' 말단 올리고피리미딘 트랙트의 존재에 의해 특성화된다. 나아가, 대부분 TOP 유전자는 성장 관련된 번역 조절에 의해 특성화된다. 그러나 또한 조직 특이적 번역 조절과 함께 TOP 유전자는 알려졌다. 상기 정의된 바처럼, TOP 유전자의 5'UTR은 바람직하게는 시작 코돈에 5' 위치한 뉴클레오티드에 3'에 위치한 뉴클레오티드로부터 5'캡에까지 이르는, TOP 유전자로부터 유도된(derived) 성숙 mRNA의 5'UTR의 서열에 상응한다. TOP 유전자의 5'UTR은 전형적으로 어떠한 시작 코돈도 포함하지 않으며, 바람직하게는 업스트림 AUGs(uAUGs) 또는 업스트림 오픈 리딩 프레임(uORFs)이 없다. 그 안에, 업스트림 AUGs 및 업스트림 오픈 리딩 프레임은 전형적으로 번역될 오픈 리딩 프레임의 시작 코돈(AUG)의 5'에 발생하는 AUGs 및 오픈 리딩 프레임으로 이해된다. TOP 유전자의 5'UTRs는 일반적으로 보다 짧다. TOP 유전자의 5'UTRs의 길이는 20 뉴클레오티드 내지 500 뉴클레오티드 사이에서 다양할 수 있으며, 전형적으로 약 200 뉴클레오티드 미만, 바람직하게는 약 150 뉴클레오티드 미만, 더욱 바람직하게는 약 100 뉴클레오티드 미만이다. 본 발명의 의미에서 예시적인 TOP 유전자의 5'UTRs는 본 발명에 참고문헌으로 병합된 특허출원 WO2013/143700의 SEQ ID NOs. 1-1363에 따르는 서열 내 위치 5에 뉴클레오티드로부터 시작 코돈(예를 들어 ATG)에 5' 바로 옆에 위치한 뉴클레오티드까지의 핵산 서열이다. 이러한 맥락에서, TOP 유전자의 5'UTR의 특히 바람직한 절편은 5'TOP 모티프가 없는 TOP 유전자의 5'UTR이다. 용어 "TOP 유전자의 5'UTR" 또는 "5'-TOP UTR"은 바람직하게 자연 발생 TOP 유전자의 5'UTR을 의미한다.

첫번째 양태에서, 본 발명은 하기를 포함하는 인공 핵산 분자에 관한 것이다

a. 적어도 하나의 오픈 리딩 프레임(ORF); 및

b. 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 적어도 하나의 5'-비번역된 영역 요소(5'-UTR 요소), 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 안정한 mRNA로부터 유도된다.

바람직하게, 본 발명에 따른 인공 핵산 분자는 리보좀 단백질 S6, RPL36AL, rps16 또는 리보좀 단백질 L9의 3'-UTR(요소) 및/또는 5'-UTR(요소)을 포함하지 않는다. 더욱 바람직하게, 본 발명에 따른 인공 핵산 분자는 리보좀 단백질 S6, RPL36AL, rps16 또는 리보좀 단백질 L9의 3'-UTR(요소) 및/또는 5'-UTR(요소)를 포함하지 않으며, 본 발명에 따른 인공 핵산 분자의 오픈 리딩 프레임은 GFP 단백질을 코딩하지 않는다. 더욱 더 바람직하게, 본 발명에 따른 인공 핵산 분자는 리보좀 단백질 S6, RPL36AL, rps16 또는 리보좀 단백질 L9의 3'-UTR(요소) 및/또는 5'-UTR(요소)를 포함하지 않으며, 본 발명에 따른 인공 핵산 분자의 오픈 리딩 프레임은 리포터 단백질 예를 들어, 글로빈 단백질(특히 베타 글로빈), 루시퍼라제 단백질, GFP 단백질, 글루쿠리노다제 단백질(특히 베타-글루쿠리노다제) 또는 이의 변이체, 예를 들어 글로빈 단백질, 루시퍼라제 단백질, GFP 단백질, 또는 글루쿠리노다제 단백질로 이루어진 군으로부터 선택된 것을 코딩하지 않는다.

용어 "3'-UTR 요소"는 3'-UTR로부터 또는 3'-UTR의 변이체 또는 절편으로부터 유도된 핵산 서열을 포함 또는 이로 구성된 핵산 서열을 의미한다. "3'-UTR 요소"는 바람직하게 인공 mRNA와 같은 인공 핵산 서열의 3'-UTR에 의해 포함되는 핵산 서열을 의미한다. 따라서, 본 발명의 관점에서, 바람직하게, 3'-UTR 요소는 mRNA, 바람직하게 인공 mRNA의 3'-UTR에 의해 포함될 수 있거나, 또는 3'-UTR 용소는 각각의 전사 주형의 3'-UTR에 의해 포함될 수 있다. 바람직하게, 3'-UTR 요소는 유전적으로 조작된 벡터 구조의 전사에 의해 수득된 mRNA와 같이, mRNA의 3'-UTR, 바람직하게 인공 mRNA의 3'-UTR에 상응하는 핵산 서열이다. 바람직하게, 본 발명의 관점에서 3'-UTR 요소는 3'-UTR로써 기능하거나, 또는 3'-UTR의 기능을 수행하는 핵산을 코딩한다.

따라서, 용어 "5'-UTR 요소"는 5'-UTR 또는 5'-UTR의 변이체 또는 절편으로부터 유도된 핵산 서열을 포함하거나 이로 이루어진 핵산 서열을 의미한다. "5-UTR 요소"는 바람직하게 인공 mRNA와 같은 인공 핵산 서열의 5'-UTR에 의해 포함된 핵산 서열을 의미한다. 따라서, 본 발명의 관점에서, 바람직하게, 5'-UTR 요소는 mRNA, 바람직하게 인공 mRNA의 5'-UTR에 의해 포함될 수 있거나, 또는 5'-UTR 요소는 각각의 전사 주형의 5'-UTR에 의해 포함될 수 있다. 바람직하게, 5'-UTR 요소는 유전적으로 조작된 벡터 구조의 전사에 의해 수득된 mRNA와 같이, mRNA의 5'-UTR, 바람직하게 인공 mRNA의 5'-UTR에 상응하는 핵산 서열이다. 바람직하게, 본 발명의 관점에서 5'-UTR 요소는 5'-UTR로 기능하거나 또는 5'-UTR의 기능을 수행하는 뉴클레오티드 서열을 코딩한다.

본 발명에 따른 인공 핵산 분자 내 3'-UTR 요소 및/또는 5'-UTR 요소는 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시킨다. 따라서, 본 발명에 따른 인공 핵산 분자는 특히 하기를 포함할 수 있다:

- 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 3'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 3'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 3'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 5'-UTR 요소,

- 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 5'-UTR 요소, 또는

- 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 증가 및 연장시키는 5'-UTR 요소.

바람직하게, 본 발명에 따른 인공 핵산 분자는 상기 인공 핵산 분자로부터 단백질 생산을 연장시키는 3'-UTR 요소 및/또는 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 5'-UTR 요소를 포함한다.

바람직하게, 본 발명에 따른 인공 핵산 분자는 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소, 즉 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키고 안정한 mRNA로부터 유도된 적어도 하나의 3'-UTR 요소 및 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키고 안정한 mRNA로부터 유도된 적어도 하나의 5'-UTR 요소를 포함한다.

일반적으로 "상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가"는 3'-UTR 및/또는 5'-UTR이 없거나, 또는 ORF와 조합하여 3'-UTR 및/또는 5'-UTR 자연 발생과 같이 참조 3'-UTR 및/또는 참조 5'-UTR을 포함하는 각각의 참조 핵산으로부터 생산된 단백질의 양에 비해, 각각 3'-UTR 요소 및/또는 5'-UTR 요소를 갖는 본 발명에 따른 인공 핵산 분자로부터 생산된 단백질의 양을 의미한다.

특히, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소 및/또는 5'-UTR 요소는 본 발명에 따른 인공 핵산 분자로부터 예를 들어, 3'-UTR 및/또는 5'-UTR이 없는 및/또는 ORF와 조합하여 3'- 및/또는 5'-UTR 자연 발생과 같이 참조 3'-UTR 및/또는 5'-UTR을 포함하는 각각의 핵산에 비해, 본 발명에 따른 mRNA로부터 단백질 생산을 연장시킨다.

특히, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소 및/또는 5'-UTR 요소는 본 발명에 따른 인공 핵산 분자로부터, 예를 들어 ORF와 조합하여 3'- 및/또는 5'-UTR 자연 발생과 같이 3'- 및/또는 5'-UTR이 없는 각각의 핵산에 비해 본 발명에 따른 mRNA로부터 단백질 생산, 특히 단백질 발현 및/또는 총 단백질 생산을 증가시킨다.

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 3'-UTR 및/또는 5'-UTR이 없거나, 또는 ORF와 조합하여 3'-UTR 및/또는 5'-UTR 자연 발생과 같이 참조 3'-UTR 및/또는 참조 5'-UTR을 포함하는 각각의 핵산의 번역 효율에 비해 핵산의 번역 효율에 부정적으로 영향을 미치지 않는다. 더욱 더 바람직하게, 상기 번역 효율은 이의 자연 컨텍스트(context) 내 각각의 ORF에 의해 코딩되는 단백질의 번역 효율에 비해 3'-UTR 및/또는 5'-UTR에 의해 증진된다.

본 발명에 사용된 용어 "각각의 핵산 분자" 또는 "참조 핵산 분자"는 -다른 3'-UTRs 및/또는 5'-UTRs로부터 떨어진 - 참조 핵산 분자가 3'-UTR 요소 및/또는 5'-UTR 요소를 포함하는 본 발명의 인공 핵산 분자와 유사, 바람직하게 동일함을 의미한다.

본 발명의 인공 핵산 분자에 의해 본 발명에 정의된 인비보(in vivo) 또는 인비트로(in vitro)에서 단백질 생산을 평가하기 위해 (즉, 인비트로는 ("살아있는") 세포 및/또는 조직, 살아있는 개체의 조직을 포함하는 것을 의미함; 세포는 세포주, 일차 세포, 조직 또는 개체 내 세포를 포함하며, 바람직한 것은 포유동물 세포, 예를 들어 인간 세포 및 마우스 세포이며, 특히 바람직한 것은 인간 세포주 HeLa, 및 U-937 및 마우스 세포주 NIH3T3, JAWSII 및 L929이며, 나아가 일차 세포가 특히 바람직하며, 특히 바람직한 실시예 인간 피부 섬유아세포(HDF)), 코딩된 단백질의 발현은 본 발명의 인공 핵산 분자의 표적 세포/조직으로의 주입/형질주입(transfection) 이후 결정되고, 참조 핵산에 의해 유도된 단백질 발현과 비교된다. 단백질 발현을 결정하기 위한 정량 방법은 당업계에 공지되었다(예를 들어 웨스턴 블롯, FACS, ELISA, 질량 분광법). 이러한 맥락에서 특히 유용한 것은 루시퍼라제, 녹색 형광 단백질(GFP), 또는 분비된 알칼라인 포스파타제(secreted alkaline phosphatase, SEAP)와 같은 리포터 단백질의 발현의 결정이다. 따라서, 본 발명에 따른 인공 핵산 또는 참조 핵산은 예를 들어 형질 주입 또는 주입, 바람직하게 포유동물 세포와 같은 포유동물 발현 시스템, 예를 들어 HeLa 또는 HDF 세포를 통해, 표적 조직 또는 세포에 도입된다. 핵산 분자의 발현의 시작 후 또는 도입 후 몇 시간 또는 수일(예를 들어, 6, 12, 24, 48 또는 72 시간), 표적 세포 샘플을 수집하고 FACS를 통해 측정하고 용해시켰다. 이후 상기 용해물은 몇몇 방법, 예를 들어 웨스턴-블롯, FACS, ELISA, 질량 분광법을 사용하여 또는 형광 또는 발광 측정법을 통해 발현된 단백질을 검출(및 이에 따라 단백질 발현의 효율을 결정)하는데 사용될 수 있다.

따라서, 만약 본 발명에 따른 인공 핵산 분자로부터 단백질 발현이 특정한 시점(예를 들어 핵산 분자의 발현 시작 또는 도입 후 6, 12, 24, 48 또는 72 시간)에 참조 핵산 분자로부터 단백질 발현과 비교된다면, 양쪽 핵산 분자는 표적 조직/세포로 분리되어 도입되고, 조직/세포로부터 샘플은 특정한 시점 이후에 수집되고, 단백질 용해물은 특정 검출 방법(예를 들어 당업계에 알려진 웨스턴 블롯, ELISA, 형광 또는 발광 측정 등)으로 조정된 특정한 프로토콜에 따라 제조되며, 단백질은 선택된 검출 방법에 의해 검출된다. 세포 용해물 내 발현된 단백질 양의 측정에 대안으로, - 또는, 수집된 세포의 용해 전 세포 용해물 내 단백질 양의 측정에 추가로 또는 동시에 부분 표본을 사용하여 - 단백질 양은 또한 FACS 분석을 사용하여 결정될 수 있다.

인공 mRNA와 같은 인공 핵산 분자로부터 "단백질 생산 연장" 용어는 바람직하게 인공 mRNA와 같은 인공 핵산 분자로부터 단백질 생산이 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템에서, 참조 mRNA와 같은 참조 핵산 분자, 예를 들어 참조 3'- 및/또는 5'-UTR을 포함 또는 3'- 및/또는 5'-UTR이 없는 것으로부터 단백질 생산에 비해 연장됨을 의미한다. 따라서, 인공 mRNA와 같은 인공 핵산 분자로부터 생산된 단백질은 참조 핵산 분자로부터 생산된 단백질에서 발견될 수 있는 것에 비해 긴 시간 동안 관찰될 수 있다. 즉, 이후 시점, 예를 들어 형질 주입 후 48시간 또는 72 시간에 측정된 인공 mRNA와 같은 인공 핵산 분자로부터 생산된 단백질 양은 상응하는 이후 시점에 참조 mRNA와 같은 참조 핵산 분자로부터 생산된 단백질의 양에 비해 많다. 이러한 "이후 시점"은 핵산 분자의 형질주입 후, 예를 들어 발현 시작 후 36, 48, 60, 72, 96 시간, 즉 형질 주입 후와 같이, 예를 들어 발현 시작 24시간 후 어느 시간일 수 있다. 또한, 동일한 핵산에 대하여, 이후 시점에 생산된 단백질의 양은 조기(참조) 시점에 생산된 양으로 표준화될 수 있으며, 예를 들어 이후 시점에 단백질의 양은 형질 주입 24시간 후 단백질 양의 백분율로 나타낼 수 있다.

바람직하게, 이러한 단백질 생산 연장의 효과는 (i) 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내에서, 예를 들어, 루시퍼라제와 같은 코딩된 리포터 단백질의 발현에 의해 수득된 단백질 양을 시간의 경과에 따라 측정하는 단계, (ii) t₁ 시점, 예를 들어 t₁=형질주입 24시간 후에 "참조"에서 관찰된 단백질 양을 결정하고, 이러한 단백질 양을 100%로 셋팅하는 단계, (iii) 하나 이상의 이후 시점 t₂, t₃ 등, 예를 들어 형질주입 후 t₂=48시간 및 t₃=72시간에 관찰된 단백질의 양을 결정하는 단계, 및 t₁ 시점에 단백질 양의 백분율로 이후 시점에 관찰된 상대적인 단백질 양을 계산하는 단계를 통해 결정된다. 예를 들어, "80"의 양으로 t₁에, "20"의 양으로 t₂에, "10"의 양으로 t₃에 발현되는 단백질, t₂에 단백질의 상대적인 양은 25%, 및 t₃에 12.5%일 수 있다. 이후 시점에 이러한 상대적인 양은 그 다음 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 핵산 분자에 대해 상응하는 시점에서 상대적인 단백질 양에 대해 단계 (iv)에서 비교될 수 있다. 참조 핵산 분자, 즉, 각각 3'- 및/또는 5'-UTR이 없는, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 핵산 분자로부터 생산된 상대적인 단백질 양과 본 발명에 따른 인공 핵산 분자로부터 생산된 상대적인 단백질 양을 비교함으로써, 본 발명에 따른 인공 핵산 분자로부터 단백질 생산이 참조 핵산 분자로부터 단백질 생산에 비해 연장됨을 통해, 인자가 결정될 수 있다.

바람직하게, 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 3'- 및/또는 5'-UTR 요소는 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자로부터 단백질 생산과 비교하여, 적어도 1.2배, 바람직하게 적어도 1.5배, 더욱 바람직하게 적어도 2배, 더욱 더 바람직하게 적어도 2.5배로 상기 인공 핵산 분자로부터 단백질 생산을 연장시킨다. 즉, 상기 설명된 것처럼 특정한 이후 시점에 본 발명에 따른 인공 핵산 분자로부터 생산된 단백질의 (상대적인) 양은 참조 핵산 분자, 예를 들어 동일한 이후 시점에 각각 3'- 및/또는 5'-UTR이 없는, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 것으로부터 생산된 단백질의 (상대적) 양에 비해, 적어도 1.2, 바람직하게 적어도 1.5, 더욱 바람직하게 적어도 2, 더욱 더 바람직하게 적어도 2.5의 인자로 증가된다.

그렇지 않으면, 상기 단백질 생산 연장의 효과는 또한 (i) 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내에서, 예를 들어, 루시퍼라제와 같은 코딩된 리포터 단백질의 발현에 의해 수득된 단백질 양을 시간의 경과에 따라 측정하는 단계, (ii) 단백질 양이 예를 들어, 발현 시작 후 1, 2, 3, 4, 5, 또는 6 시간, 예를 들어 인공 핵산 분자의 형질 주입 후 1, 2, 3, 4, 5, 또는 6 시간에 관찰된 단백질의 양을 언더컷(undercuts)하는 시점을 결정하는 단계, 및 (iii) 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 핵산 분자에 대해 결정된 상기 시점에 발현 시작 1, 2, 3, 4, 5, 또는 6시간 후에 관찰된 단백질 양을 상기 단백질 양이 언더컷하는 시점을 비교하는 단계를 통해 결정될 수 있다.

예를 들어, 인공 mRNA와 같은 인공 핵산 분자로부터 단백질 생산 - 핵산 분자의 형질 주입 이후와 같이, 발현 시작 1, 2, 3, 4, 5 또는 6시간 후와 같이, 발현의 초기 단계에서 관찰된 최소한의 양 -은 포유 동물 세포와 같은 포유 동물 발현 시스템, 예를 들어 HeLa 또는 HDF 세포 내에서, 참조 mRNA와 같은 참조 핵산 분자로부터 단백질 생산에 비해, 적어도 약 5시간, 바람직하게 적어도 약 10시간, 더욱 바람직하게 적어도 약 24시간 연장된다. 따라서, 본 발명에 따른 인공 핵산 분자는 바람직하게 형질 주입 후와 같이, 발현 시작 후 1, 2, 3, 4, 5 또는 6 시간과 같이, 적어도 발현 초기 단계에서 관찰된 양으로 단백질 생산을 각각 3'- 및/또는 5'-UTR이 없는, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자에 비해 적어도 약 5시간, 바람직하게 적어도 약 10 시간, 더욱 바람직하게 적어도 약 24시간 연장시킨다.

바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자로부터 단백질 생산 기간은 각각 3'- 및/또는 5-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자로부터 단백질 생산에 비해, 적어도 1.2배, 바람직하게 적어도 1.5배, 더욱 바람직하게 적어도 2배, 더욱 더 바람직하게 적어도 2.5배 연장된다.

바람직하게, 이러한 단백질 생산 연장 효과가 수행되는 반면, 예를 들어 48 또는 72시간의 기간 내에 본 발명에 따른 인공 핵산 분자로부터 생산된 단백질의 총량은 인공 핵산 분자의 ORF와 3'- UTR 및/또는 5'-UTR 자연 발생과 같이, 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자로부터 생산된 단백질의 양에 적어도 상응한다. 따라서, 본 발명은 상기 설명된 것처럼, 포유 동물 세포와 같은 포유 동물 발현 시스템, 예를 들어 HeLa 또는 HDF 세포에서 단백질 생산을 연장시키는 인공 핵산 분자를 제공하며, 예를 들어 48 또는 72 시간의 기간 내에 상기 인공 핵산 분자로부터 생산된 단백질의 총량은 적어도, 예를 들어, 인공 핵산 분자의 ORF와 3'- 및/또는 5'-UTR 자연 발생과 같이, 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자로부터, 상기 시기 내에 생산된 단백질의 총량이다.

나아가, 용어 "연장된 단백질 발현"은 또한 "안정된 단백질 발현"을 포함하며, 이에 따라 "안정된 단백질 발현"은 바람직하게 참조 핵산 분자, 예를 들어, 각각 참조 3'- 및/또는 5'-UTR을 포함하거나, 또는 각각 3'- 및/또는 5'-UTR이 없는 mRNA와 비교할 때, 24 시간 동안, 더욱 바람직하게 48시간 동안, 더욱 더 바람직하게 72 시간 동안과 같이, 예정된 기간 동안 본 발명에 따른 인공 핵산 분자로부터 보다 일정하게 단백질이 생산됨을 의미한다.

따라서, 예를 들어 포유동물 시스템에서, 본 발명에 따른 3'- 및/또는 5'-UTR 요소를 포함하는 인공 핵산 분자로부터, 예를 들어 본 발명에 따른 mRNA로부터 단백질 생산의 수준은 바람직하게 상기 설명된 참조 mRNA와 같은 참조 핵산 분자에서 관찰된 범위로 떨어지지 않는다. 특정한 핵산 분자로부터 단백질 생산이 어느 정도까지 떨어지는지 평가하기 위해, 예를 들어, 발현의 시작 24시간 후 관찰된 단백질(각각 ORF에 의해 코딩된)의 양은, 예를 들어, 포유동물 세포와 같은 세포로 본 발명에 따른 인공 핵산 분자의 형질 주입 24시간 후에, 발현 시작 48시간 후, 예를 들어 형질 주입 48시간 후 관찰된 단백질의 양과 비교될 수 있다. 따라서, 조기 시점, 예를 들어, 발현의 시작 24시간 후, 예를 들어 형질 주입 후에 관찰된 단백질의 양에 비하여, 이후 시점, 예를 들어 발현의 시작 48시간 후, 예를 들어 형질 주입 후에 관찰된 리포터 단백질, 예를 들어 루시퍼라제의 양과 같은 본 발명에 따른 인공 핵산 분자의 ORF에 의해 코딩된 단백질 양의 비율은 바람직하게 각각 참조 3'- 및/또는 5'-UTR을 포함하거나 또는 각각 3'- 및/또는 5'-UTR이 없는 참조 핵산 분자에 대해 상응하는 비율(동일한 시점을 포함)보다 높다.

바람직하게, 이른 시점에 관찰된 단백질의 양에 비해 이후 시점, 예를 들어 발현 시작 후 48시간, 예를 들어 형질 주입 후, 예를 들어 발현 시작 후 24시간, 예를 들어 형질 주입 후에 관찰된 리포터 단백질, 예를 들어 루시퍼라제의 양과 같은, 본 발명에 따른 인공 핵산 분자의 ORF에 의해 코딩된 단백질양의 비율은 바람직하게 적어도 0.2, 더욱 바람직하게 적어도 약 0.3, 더욱 더 바람직하게 적어도 약 0.4, 더욱 더 바람직하게 적어도 약 0.5, 및 특히 바람직하게 적어도 약 0.7이다. 각각의 참조 핵산 분자에 대해, 예를 들어 각각 참조 3'- 및/또는 5'-UTR을 포함하거나, 또는 각각 3'- 및/또는 5'-UTR이 없는 mRNA에 대해, 상기 비율은 예를 들어 약 0.05 내지 약 0.35일 수 있다.

따라서, 본 발명은 상기 설명된 ORF 및 3'- 및/또는 5'-UTR 요소를 포함하는 인공 핵산 분자를 제공하며, 상기 단백질 양의 비율, 예를 들어 바람직하게 포유동물 세포와 같은 포유동물 발현 시스템, 예를 들어 HDF 세포 또는 HeLa 세포에서 발현 시작 24시간 후에 관찰된 단백질 양에 비해 발현 시작 48시간 후에 관찰된 루시퍼라제의 양은 바람직하게 적어도 0.2, 더욱 바람직하게 적어도 약 0.3, 더욱 바람직하게 적어도 약 0.4, 더욱 더 바람직하게 적어도 약 0.5, 더욱 더 바람직하게 적어도 약 0.6, 및 특히 바람직하게 적어도 약 0.7이다. 따라서, 바람직하게 상기 인공 핵산 분자로부터 생산된 단백질의 총량은, 예를 들어 48시간의 기간 내에, 적어도 예를 들어 상기 기간 내에, 인공 핵산 분자의 ORF와 3'-UTR 및/또는 5'-UTR 자연 발생과 같이, 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자로부터 생산된 단백질의 총량과 상응한다.

바람직하게, 본 발명은 상기 설명된 ORF 및 3'-UTR 요소 및/또는 5'-UTR 요소를 포함하는 인공 핵산 분자를 제공하며, 바람직하게 포유동물 세포와 같은 포유동물 발현 시스템, 예를 들어 HeLa 세포 또는 HDF 세포에서, 상기 발현 시작 24시간 후 관찰된 단백질 양에 비해 발현 시작 72 시간 후에 관찰된 단백질 양, 예를 들어 루시퍼라제의 양의 비율은 바람직하게 약 0.05 초과, 더욱 바람직하게 약 0.1 이상, 더욱 바람직하게 약 0.1 이상, 더욱 바람직하게 약 0.2 이상, 더욱 더 바람직하게 약 0.3 이상이며, 바람직하게 상기 인공 핵산 분자로부터 생산된 단백질의 총량은, 예를 들어 72 시간 내에, 적어도 예를 들어 상기 시간 내에, 인공 핵산 분자의 ORF와 3'- 및/또는 5'-UTR 자연 발생과 같이, 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR를 포함하는 참조 핵산 분자로부터 생산된 단백질의 총량이다.

본 발명의 맥락에서 "증가된 단백질 발현" 또는 "증진된 단백질 발현"은 바람직하게 발현 시작 후 일 시점에 증가/증진된 단백질 발현, 또는 참조 핵산 분자에 의해 유도된 발현에 비해 발현된 단백질의 증가/증진된 총량을 의미한다. 따라서, 본 발명에 따른 인공 핵산 분자의 발현 시작 후, 예를 들어 형질 주입 후, 특정한 시점, 예를 들어 본 발명에 따른 mRNA의 형질 주입 후, 예를 들어 형질 주입 6, 12, 24, 48 또는 72 시간 후에 관찰된 단백질 수준은 바람직하게 예를 들어 각각 참조 3'- 및/또는 5'-UTR을 포함하거나, 또는 각각 3'- 및/또는 5'-UTR이 없는 참조 mRNA와 같은 참조 핵산 분자의 형질 주입 후, 발현 시작 후 동일한 시점에 관찰된 단백질 수준에 비해 높다. 바람직한 실시예에서, 인공 핵산 분자로부터 발현된 단백질의 최대량(예를 들어 단백질 활성 또는 질량을 통해 결정됨)은 각각 참조 3'- 및/또는 5'-UTR을 포함하거나, 또는 각각 3'- 및/또는 5'-UTR이 없는 참조 핵산으로부터 발현된 단백질 량에 대하여 증가된다. 피크 발현 수준은 바람직하게, 예를 들어 형질 주입 후 48 시간 내, 더욱 바람직하게 24시간 내 및 더욱 더 바람직하게 12시간 내에 도달한다.

바람직하게, 본 발명에 따른 인공 핵산 분자로부터 "증가된 총 단백질 생산" 또는 "증진된 총 단백질 생산" 용어는 시간에 따라 증가/증진된 단백질 생산을 의미하며, 상기 단백질은 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자에 비해, 바람직하게 포유동물 세포와 같은 포유동물 발현 시스템, 예를 들어 HeLa 또는 HDF 세포에서 예를 들어 48 시간 또는 72 시간, 인공 핵산 분자로부터 생산된 단백질이다. 바람직한 실시예에 따르면, 시간에 따라 발현된 단백질의 축적된 양은 본 발명에 따른 인공 핵산 분자를 사용할 때 증가된다.

특정한 시기 동안 단백질의 총량은 (i) 인공 핵산 분자의 도입 후 몇몇 시점(예를 들어 발현의 시작 후 또는 핵산 분자의 도입 후 6, 12, 24, 48 및 72 시간)에 조직 또는 세포를 수집함으로써 결정될 수 있으며, 시점 마다 단백질 양은 상기 설명된 것처럼 결정될 수 있다. 축적 단백질 양을 계산하기 위해, 단백질의 총량을 결정하는 수학적 방법이 사용될 수 있으며, 예를 들어 곡선 아래 면적(AUC)은 하기 식에 따라 결정될 수 있다.

단백질 총량에 대한 곡선 아래 면적을 계산하기 위해, 각 종점(a 및 b)로부터 발현 곡선의 방정식의 적분이 계산된다.

따라서, "총 단백질 생산"은 바람직하게 시간에 따라 단백질 생산을 나타내는 곡선 아래 면적(AUC)을 의미한다.

바람직하게, 본 발명에 따른 적어도 하나의 3'- 또는 5'-UTR 요소는 상기 인공 핵산 분자로부터 단백질 생산을 각각 3'- 및/또는 5'-UTR이 없는 참조 핵산 분자로부터 단백질 생산에 비해, 적어도 1.5배, 바람직하게 적어도 2배, 더욱 바람직하게 적어도 2.5배 증가시킨다. 즉, 특정한 시점, 예를 들어 발현 시작 후, 예를 들어 형질 주입 후 48시간 또는 72 시간에 본 발명에 따른 인공 핵산 분자로부터 생산된 단백질의 총량은 예를 들어 각각 3'- 및/또는 5'-UTR이 없거나, 또는 각각 참조 3'- 및/또는 5'-UTR을 포함하는 참조 핵산 분자로부터 생산된 단백질의 (상대적인) 양에 비해, 상응하는 이후 시점에서, 적어도 1.5, 바람직하게 적어도 2, 더욱 바람직하게 적어도 2.5의 인자로 증가된다.

3'-UTR 및/또는 5'-UTR뿐만 아니라 mRNA의 변이체, 절편 및/또는 변이체 절편의 mRNA 및/또는 단백질 생산을 연장시키는 효과 및 효율 및/또는 단백질 생산을 증가시키는 효과 및 효율 및/또는 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소의 단백질 생산 연장 효과 및 효율 및/또는 단백질 생산 증가 효과 및 효율은 통상의 기술자에게 알려진 이러한 목적을 위한 적절한 방법을 통해 결정될 수 있다.

예를 들어, 인공 mRNA 분자는 루시퍼라제와 같은 리포터 단백질에 대한 코딩 서열/오픈 리딩 프레임(ORF), 및 본 발명에 따른 3'-UTR 요소, 즉 상기 인공 mRNA 분자로부터 단백질 생산을 연장 및/또는 증가시키는 것을 포함하여 생산될 수 있다. 또한 이러한 본 발명의 mRNA 분자는 추가로 본 발명에 따른 5'-UTR 요소, 즉 상기 인공 mRNA 분자로부터 단백질 생산을 연장 및/또는 증가시키는 것을 포함할 수 있으며, 5'-UTR 요소가 없거나 또는 본 발명에 따르지 않는 5'-UTR 요소, 예를 들어 참조 5'-UTR. 따라서, 인공 mRNA 분자는 루시퍼라제와 같은 리포터 단백질에 대한 코딩 서열/오픈 리딩 프레임(ORF), 및 본 발명에 따른 5'-UTR 요소, 즉 상기 인공 mRNA 분자로부터 단백질 생산을 연장 및/또는 증가시키는 것을 포함하여 생산될 수 있다. 또한 이러한 본 발명의 mRNA 분자는 추가로 본 발명에 따른 3'-UTR 요소, 즉 상기 인공 mRNA 분자로부터 단백질 생산을 연장 및/또는 증가시키는 것을 포함할 수 있으며, 3'-UTR 요소가 없거나 또는 본 발명에 따르지 않는 3'-UTR 요소, 예를 들어 참조 3'-UTR.

본 발명에 따른 mRNAs는 예를 들어 T7 프로모터 및 각각의 mRNA 서열을 코딩하는 서열을 포함하는 플라스미드 벡터와 같은 각각 벡터의 인비트로(in vitro) 전사를 통해 생산될 수 있다. 생산된 mRNA 분자는 mRNA를 형질 주입하기에 적절한 어느 형질 주입 방법을 통해 세포로 형질 주입될 수 있으며, 예를 들어, HeLa 세포 또는 HDF 세포와 같은 포유동물 세포로 리포펙트(lipofected)될 수 있으며, 샘플은 형질 주입 이후 특정한 시점, 예를 들어 형질 주입 후 6시간, 24시간, 48시간, 및 72시간에 분석될 수 있다. 상기 샘플은 통상의 기술자에게 잘 알려진 방법을 통해 mRNA 정량 및/또는 단백질 정량을 위해 분석될 수 있다. 예를 들어, 샘플 시점에서 세포 내에 존재하는 리포터 mRNA의 양은 정량적 PCR 방법에 의해 결정될 수 있다. 각각의 mRNA에 의해 코딩되는 리포터 단백질의 양은 사용된 리포터 단백질에 따라 루시퍼라제 분석과 같이, 웨스턴 블롯, ELISA 분석, FACS 분석기 리포터 분석을 통해 결정될 수 있다. 단백질 발현 안정화 및/또는 단백질 발현 연장 효과는 예를 들어 형질 주입 48시간 후 관찰된 단백질 수준 및 형질 주입 24시간 후 관찰된 단백질 수준의 비율을 결정함으로써 분석될 수 있다. 상기 값이 1에 가까울수록, 이러한 기간 내에서 단백질 발현이 보다 안정하다. 이러한 측정은 물론 또한 72시간 이상 수행될 수 있으며, 형질 주입 72 시간 후 관찰된 단백질 수준 및 형질 주입 24시간 후 관찰된 단백질 수준의 비율은 단백질 발현의 안정성을 결정하기 위해 결정될 수 있다.

게다가, 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 안정한 mRNA로부터 유도된다. 따라서, 안정한 mRNA로부터 "유도"는 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 안정한 mRNA의 3'-UTR 요소 및/또는 5'-UTR 요소와 적어도 50%, 바람직하게 적어도 60%, 바람직하게 적어도 70%, 더욱 바람직하게 적어도 75%, 더욱 바람직하게 적어도 80%, 더욱 바람직하게 적어도 85%, 더욱 더 바람직하게 적어도 90%, 더욱 더 바람직하게 적어도 95%, 및 특히 바람직하게 적어도 98% 서열 상동성을 공유함을 의미한다. 바람직하게, 안정한 mRNA는 자연 발생 mRNA이며, 따라서, 안정한 mRNA의 3'-UTR 요소 및/또는 5'-UTR 요소는 3'-UTR 및/또는 5'-UTR, 또는 자연 발생 mRNA의 절편 또는 이의 변이체를 의미한다. 게다가, 안정한 mRNA로부터 유도된 3'-UTR 요소 및/또는 5'-UTR 요소는 또한 바람직하게 3'-UTR 요소 및/또는 5'-UTR 요소를 의미하며, 이는 예를 들어 RNA 안정성을 보다 증가시키고 및/또는 단백질 생산을 연장 및/또는 증가시키기 위해, 자연 발생 3'-UTR 요소 및/또는 5'-UTR 요소와 비교하여 변형된다. 예를 들어, 자연 발생 (비-변형된) 3'-UTR 요소 및/또는 5'-UTR 요소와 비교하여, RNA 안전성을 손상시키지 않는 이러한 변형이 바람직함은 당연하다. 특히, 본 발명에 사용된 용어 mRNA는 mRNA 분자를 의미하며, 그러나 또한 본 발명에 정의된 mRNA 종을 의미할 수 있다.

바람직하게, mRNA의 안정성, 즉 mRNA 분해 및/또는 반감기는 표준 조건, 예를 들어 사용된 특정 세포주에 대한 표준 조건(표준 배지, 배양 등) 하에 평가된다.

본 발명에 사용된 용어 "안정한 mRNA"는 일반적으로 늦은 mRNA 붕괴를 갖는 mRNA를 의미한다. mRNA의 반감기는 인비보 또는 인비트로에서 기존 mRNA 분자의 50%를 분해하는데 필요한 시간이다. 따라서, mRNA의 안정성은 보통 인비보 또는 인비트로에서 평가된다. 따라서, 인비트로는 살아있는 개체의 조직을 포함하는 ("살아있는") 세포 및/또는 조직을 의미한다. 세포는 특히 세포주, 일차 세포, 조직 또는 대상의 세포를 포함한다. 특정 실시예에서 세포를 배양하는 세포 유형이 본 발명에 적합할 수 있다. 특히 바람직한 것은 포유동물 세포, 예를 들어 인간 세포 및 마우스 세포이다. 특히 바람직한 실시예에서, 인간 세포주 HeLa, 및 U-937 및 마우스 세포주 NIH3T3, JAWSII 및 L929가 사용된다. 나아가 일차 세포가 특히 바람직하며, 특히 바람직한 실시예에서 인간 피부 섬유아세포(HDF)가 사용될 수 있다. 그렇지 않으면 또한 개체의 조직이 사용될 수 있다.

바람직하게, "안정 mRNA"의 반감기는 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 11시간, 적어도 12시간, 적어도 13시간, 적어도 14시간, 및/또는 적어도 15시간이다. 관심 mRNA의 반감기는 당업자에게 알려진 여러 방법에 의해 결정될 수 있다. 전형적으로, 관심 mRNA의 반감기는 붕괴 상수를 결정함을 통해 결정되며, 이로써 통상적으로 이상적인 인비보(또는 상기 정의된 인비트로) 상황이 가정되며, 여기서 관심 mRNA의 전사는 완전히 "턴오프(turned off)"될 수 있다(적어도 탐지할 수 없는 수준까지). 이러한 이상적인 상황에서, 보통 mRNA 붕괴가 일차 반응 속도(first-order kinetics)를 따르는 것으로 가정된다. 따라서, mRNA의 붕괴는 보통 하기 식에 의해 기술될 수 있다:

A₀는 시간 0, 즉 붕괴가 시작되기 전에 관심 mRNA의 양(또는 농도)이며, A(t)는 붕괴 중 시간 t에 관심 mRNA의 양(또는 농도)이며, l는 붕괴 상수이다. 따라서, 만약 시간 0(A₀)에서 관심 mRNA의 양(또는 농도) 및 붕괴 과정 동안 특정 시간 t(A(t) 및 t)에서 관심 mRNA의 양(또는 농도)가 알려진 경우, 붕괴 상수 l가 계산될 수 있다. 붕괴 상수 l에 기초하여, 반감기 t_1/2는 하기 식에 따라 계산될 수 있다:

왜냐하면 t₁ _/2에서 정의 A(t)/A0 = 1/2이기 때문이다. 따라서, 관심 mRNA의 반감기를 측정하기 위해, 일반적으로 mRNA의 양 또는 농도는 인비보(또는 상기 설명된 인비트로)에서 RNA 붕괴 과정 동안 결정된다.

인비보(또는 상기 설명된 인비트로)에서 RNA 붕괴 과정 동안 mRNA의 양 또는 농도를 결정하기 위해, 통상의 기술자에게 알려진 다양한 방법이 사용될 수 있다. 이러한 방법의 비제한적인 예시는 예를 들어 액티노마이신 D와 같은 전사 억제제로 전사의 억제, 일시적 전사를 특이적으로 촉진하는 유도성 프로모터, 예를 들어 c-fos 혈청-유도성 프로모터 시스템 및 Tet-off 조절 프로모터 시스템의 사용, 및 동적 표지 기술(kinetic labelling techniques), 예를 들어 4-티오우리딘(4sU), 5-에티닐우리딘(EU) 또는 5'-브로모-우리딘(BrU)에 의한 펄스 표지(pulse labelling)를 포함한다. RNA 붕괴 동안 mRNA의 양 또는 농도를 결정하는 방법에 관한 추가 세부 사항 및 바람직한 실시 양태는, 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 동정하는 방법의 맥락에서, 하기에 강조되며, 이는 본 발명에 따른 안정한 mRNA로부터 유도된다. RNA 붕괴 동안 mRNA의 양 또는 농도를 결정하는 방법의 각각의 설명 및 바람직한 실시예가 여기에도 적용된다.

바람직하게, 본 발명의 의미에서 "안정한 mRNA"는 바람직하게 인비보(또는 상기 정의된 인비트로)에서 측정된 평균 mRNA와 비교하여 보다 느린 mRNA 붕괴를 갖는다. 예를 들어, "평균 mRNA 붕괴"는 다수의 mRNA 종, 바람직하게 100, 적어도 300, 적어도 500, 적어도 1000, 적어도 2000, 적어도 3000, 적어도 4000, 적어도 5000, 적어도 6000, 적어도 7000, 적어도 8000, 적어도 9000, 적어도 10000, 적어도 11000, 적어도 12000, 적어도 13000, 적어도 14000, 적어도 15000, 적어도 16000, 적어도 17000, 적어도 18000, 적어도 19000, 적어도 20000, 적어도 21000, 적어도 22000, 적어도 23000, 적어도 24000, 적어도 25000, 적어도 26000, 적어도 27000, 적어도 28000, 적어도 29000, 적어도 30000 mRNA 종의 mRNA 붕괴를 조사함으로써 측정될 수 있다. 전체 전사체, 또는 가능한 많은 전사체의 mRNA 종을 평가하는 것이 특히 바람직하다. 이는 예를 들어 전체 전사 범위(coverage)를 제공하는 마이크로 어레이를 사용하여 달성될 수 있다.

본 발명에 사용된 "mRNA 종"은 유전체 전사 단위, 즉 일반적으로 유전자에 상응한다. 따라서, 하나의 "mRNA 종" 내 다른 전사체가 예를 들어 mRNA 가공에 의해 생길 수 있다. 예를 들어, mRNA 종은 마이크로어레이 상 점으로 나타낼 수 있다. 따라서, 마이크로어레이는 예를 들어 mRNA 붕괴 동안 특정한 시점에서, 다수의 mRNA 종의 양을 결정하기 위한 유리한 도구를 제공한다. 그러나, 또한 당업자에게 공지된 다른 기술들, 예를 들어 RNA-seq, 정량적 PCR 등이 사용될 수 있다.

본 발명에 있어서, 안정한 mRNA는 mRNA 붕괴에 의해 특징지어지는 것이 특히 바람직하며, 첫번째 시점에서 상기 mRNA의 양에 비해 두번째 시점에서 상기 mRNA의 양의 비율은 적어도 0.5(50%), 적어도 0.6(60%), 적어도 0.7(70%), 적어도 0.75(75%), 적어도 0.8(80%), 적어도 0.85(85%), 적어도 0.9(90%), 또는 적어도 0.95(95%)이다. 따라서, 두번째 시점은 첫번째 시점 보다 붕괴 과정에서 이후이다.

바람직하게, 상기 첫번째 시점은 붕괴 과정을 겪고 있는 RNA만이 고려되도록 선택되며, 즉 새로 만들어지는(emerging) mRNA는 - 예를 들어 전사 진행중인 - 제외한다. 예를 들어, 만약 동적 표지 기술, 예를 들어 펄스 표지가 사용된다면, 첫번째 시점은 바람직하게 mRNA 내로의 표지의 혼입이 완료되도록, 즉 mRNA 내로 표지가 지속적인 혼입이 일어나지 않도록 선택된다. 따라서, 만약 동적 표지가 사용된다면, 첫번째 시점은 실험 표지 절차의 종료 후, 예를 들어 표지된 세포의 배양 종료 후 적어도 10분, 적어도 20분, 적어도 30분, 적어도 40분, 적어도 50분, 적어도 60분, 적어도 70분, 적어도 80분, 또는 적어도 90분일 수 있다.

예를 들어, 첫번째 시점은 바람직하게 전사 중단(예를 들어 전사 억제자에 의한) 후 0 내지 6시간, 유도성 프로모터의 경우 프로모터 유도의 중단 또는 펄스 또는 표지 공급의 중단 후, 예를 들어 표지의 종료 후일 수 있다. 더욱 바람직하게, 첫번째 시점은 전사 종료 후(예를 들어 전사 억제자에 의해), 유도성 프로모터의 경우 프로모터 유도의 종료 또는 펄스 또는 표지 공급의 중단 이후, 예를 들어 표지의 종료 이후, 30분 내지 5시간, 더욱 더 바람직하게 1 내지 4시간 및 특히 바람직하게 약 3시간 후일 수 있다.

바람직하게, 두번째 시점은 mRNA 붕괴 과정 중 가능한 늦게 선택된다. 그러나, 복수의 mRNA 종을 고려하면, 두번째 시점은 바람직하게 상당한 양의 다수의 mRNA 종, 바람직하게 mRNA 종의 적어도 10%가 검출 가능한 양으로 즉, 0보다 큰 양으로 존재하도록 선택된다. 바람직하게, 두번째 시점은 전사의 종료 또는 실험 표지 절차의 종료 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 11시간, 적어도 12시간, 적어도 13시간, 적어도 14시간, 또는 적어도 15시간 후이다.

따라서, 첫번째 시점 및 두번째 시점 사이의 시간 간격은 상기 한도 내에서 가능한 큰 것이 바람직하다. 따라서, 첫번째 시점 및 두번째 시점 사이의 시간 간격은 바람직하게 적어도 4시간, 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 11시간, 또는 적어도 12시간이다.

또한, 안정한 mRNA로부터 유도된 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 상기 설명된 본 발명에 따른 안정한 mRNA로부터 유도된 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하기 위한 방법을 통해 식별된다. 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는, 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 본 발명에 설명된 본 발명에 따른 안정한 mRNA로부터 유도된, 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법을 통해 식별되는 것이 특히 바람직하다.

바람직하게, 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 진핵세포 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR로부터, 바람직하게 척추동물 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR로부터, 더욱 바람직하게 포유동물 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR로부터, 예를 들어 마우스 및 인간 단백질 코딩 유전자로부터, 더욱 더 바람직하게 영장류 또는 설치류의 3'-UTR 및/또는 5'-UTR, 특히 인간 또는 쥣과 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함하거나 또는 이로 이루어진다.

일반적으로, 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 3'-UTR 요소는 바람직하게 바람직하게 자연적으로(자연(in nature))) 발생 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어지며, 한편 본 발명에 따른 인공 핵산 분자 내 적어도 하나의 5'-UTR 요소는 바람직하게 자연적으로(자연) 발생 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

바람직하게, 적어도 하나의 오픈 리딩 프레임은 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소에 이종(heterologous)이다. 이러한 맥락에서 용어 "이종"은 두 서열 요소가 오픈 리딩 프레임 및 3'-UTR 요소 및/또는 오픈 리딩 프레임 및 5'-UTR 요소와 같은 인공 핵산 분자에 의해 포함되며, 이러한 조합으로 자연적으로(자연) 일어나지 않음을 의미한다. 이들은 전형적으로 재조합이다. 바람직하게, 3'-UTR 요소 및/또는 5'-UTR 요소는 오픈 리딩 프레임과 다른 유전자로부터 유도된다. 예를 들어, 상기 ORF는 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소와 다른 유전자, 예를 들어 다른 단백질 또는 다른 종이지만 동일한 단백질 등을 코딩하는 것으로부터 유도될 수 있다. 즉, 오픈 리딩 프레임은 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 유도된 유전자와는 다른 유전자로부터 유도된다. 바람직한 실시예에서, ORF는 인간 또는 식물(예를 들어, 아라비답시스) 리보좀 단백질을 코딩하지 않으며, 바람직하게 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는다. 더욱 바람직한 실시예에서, 오픈 리딩 프레임(ORF)은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는다.

특정한 실시예에서, 오픈 리딩 프레임은 예를 들어 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, GFP 단백질 또는 이의 변이체, 예를 들어 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질과 적어도 70% 서열 상동성을 보이는 변이체로 이루어진 그룹으로부터 선택된, 리포터 단백질을 코딩하지 않는다. 따라서, 오픈 리딩 프레임이 GFP 단백질을 코딩하지 않는 것이 특히 바람직하다. 또한 오픈 리딩 프레임(ORF)는 리포터 유전자를 코딩하지 않으며, 리포터 유전자로부터 유도되지 않는 것이 특히 바람직하며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체, 바람직하게 EGFP로부터 선택되지 않은 것, 또는 상기 유전자의 어느 변이체, 전형적으로 이들 리포터 유전자, 바람직하게 글로빈 단백질, 루시퍼라제 단백질 또는 GFP 단백질과 적어도 70% 서열 상동성을 보이는 것으로 이루어진 그룹으로부터 선택되지 않는다.

더욱 더 바람직하게, 3'-UTR 요소 및/또는 5'-UTR 요소는 본 발명에 정의된 인공 핵산에 포함된 어느 다른 요소와 이종이다. 예를 들어, 본 발명에 따른 인공 핵산 분자가 주어진 유전자로부터 3'-UTR 요소를 포함한다면, 이는 바람직하게 어느 다른 핵산 서열, 특히 유전자의 ORF의 5' 및 3' 말단에 이의 조절 서열을 포함하는 동일한 유전자로부터 비기능성 핵산 서열(예를 들어 코딩 또는 조절 서열 요소)을 포함하지 않는다. 따라서, 예를 들어, 만약 본 발명에 따른 인공 핵산이 주어진 유전자로부터 5'-UTR 요소를 포함한다면, 이는 바람직하게 어느 다른 핵산 서열, 특히 유전자의 ORF의 5' 및 3' 말단에 이의 조절 서열을 포함하는 동일한 유전자로부터 비기능성 핵산 서열(예를 들어 코딩 또는 조절 서열 요소)을 포함하지 않는다.

게다가, 본 발명에 따른 인공 핵산 분자는 적어도 하나의 오픈 리딩 프레임, 적어도 하나의 3'-UTR(요소) 및 적어도 하나의 5'-UTR(요소)를 포함하며, 한편 적어도 하나의 3'-UTR(요소)는 본 발명에 따른 3'-UTR 요소이며 및/또는 적어도 하나의 5'-UTR(요소)는 본 발명에 따른 5'-UTR 요소인 것이 바람직하다. 이러한 본 발명에 따른 바람직한 인공 핵산 분자에서, 이는 적어도 하나의 오픈 리딩 프레임, 적어도 하나의 3'-UTR(요소) 및 적어도 하나의 5'-UTR(요소)를 포함하며, 이는 오픈 리딩 프레임, 적어도 하나의 3'-UTR(요소) 및 적어도 하나의 5'-UTR(요소) 각각은 이종인 것이 특히 바람직하며, 즉 적어도 하나의 3'-UTR(요소) 및 적어도 하나의 5'-UTR(요소) 또는 오픈 리딩 프레임 및 3'-UTR(요소) 또는 5'-UTR(요소) 각각은 이러한 조합으로 자연적으로(자연) 발생한다. 이는 상기 인공 핵산 분자가 ORF, 3'-UTR(요소) 및 5'-UTR(요소)를 포함하며, 이들 모두는 서로 이종이며, 예를 들어 그들은 각각 다른 유전자(및 그들의 5' 및 3' UTR의)로부터 유도된 재조합임을 의미한다. 다른 바람직한 실시예에서, 3'-UTR(요소)는 바이러스 유전자의 3'-UTR(요소)로부터 유도되지 않거나 바이러스 근원(origin)이 아니다.

바람직하게, 본 발명에 따른 인공 핵산 분자는:

(i) 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소를 포함, 바람직하게 상기 (각각의) 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소는 인간 또는 쥣과 단백질 코딩 유전자의 3'-UTR 또는 5'-UTR로부터 각각 유도된 핵산 서열을 포함하거나 이로 이루어진다;

(ii) 적어도 하나의 3'-UTR 요소, 적어도 하나의 5'-UTR 요소 및 적어도 하나의 본 발명에 따른 인공 핵산 분자의 오픈 리딩 프레임은 서로 모두 이종이다;

(iii) 적어도 하나의 3'UTR 요소는 하기로 이루어진 그룹으로부터 선택된 유전자로부터 유도된다: 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자; 및

(iv) 3'UTR은 리보좀 단백질을 코딩하는 유전자로부터 또는 Fig4 유전자로부터 유도되지 않는다.

하우스키핑 유전자는 전형적으로 기초 세포 기능의 유지에 필요한 구성 유전자이며, 이들은 전형적으로 정상 및 병리 생리학적 조건 하에 유기체의 모든 세포에서 발현된다. 대부분의 비-병리학적 상황에서 일부 하우스키핑 유전자가 비교적 일정한 수준으로 발현되지만, 다른 하우스키핑 유전자는 실험 조건에 따라 달라질 수 있다. 전형적으로, 하우스키핑 유전자는 세포 당 적어도 25개의 카피로 때로는 수천개의 수로 발현된다. 본 발명의 맥락에서 하우스키핑 유전자의 바람직한 실시예를 하기 표 10에 나타내었다.

Acc	정의	기호^a	길이^b	어반던스^c (Abundance)
NM_001402	진핵생물 번역 연장 인자 1 알파 1	EEF1A1	387	20011
NM_001614	액틴, 감마 1	ACTG1	718	16084
NM_002046	글리세르알데하이드-3-포스페이트 디히드로게나제	GAPD	201	15931
NM_001101	액틴, 베타	ACTB	593	15733
NM_000967	리보좀 단백질 L3	RPL3	74	10924
NM_006082	튜불린, 알파, 유비쿼터스	K-ALPHA-1	174	10416
NM_001428	에놀라제 1, (알파)	ENO1	357	9816
NM_006098	구아닌 뉴클레오티드 결합 단백질(G 단백질), 베타 폴리펩티드 2-유사 1	GNB2L1	45	8910
NM_002032	페리틴, 헤비 폴리펩타이드 1	FTH1	138	8861
NM_002654	피루베이트 키나아제, 근육	PKM2	643	7413
NM_004048	베타-2-마이크로글로불린	B2M	568	7142
NM_006597	열 충격 70kDa 단백질 8	HSPA8	258	6066
NM_000034	알돌라제 A, 프룩토스-비스포스페이트	ALDOA	252	5703
NM_021009	유비퀴틴 C	UBC	67	5579
NM_006013	리보좀 단백질 L10	RPL10	1,503	5572
NM_012423	리보좀 단백질 L13a	RPL13A	509	5552
NM_007355	열 충격 90kDa 단백질 1, 베타	HSPCB	309	5436
NM_004046	ATP 합성효소, H+ 수송, 미토콘드리아 F1 복합체, 알파 서브유닛, 동형체 1, 심장 근육	ATP5A1	164	5434
NM_000516	GNAS 복합체 로커스(locus)	GNAS	362	4677
NM_001743	칼모둘린 2(포스포릴라제 키나아제, 델타)	CALM2	611	4306
NM_005566	락테이트 디히드로게나제 A	LDHA	566	4186
NM_000973	리보좀 단백질 L8	RPL8	92	4042
NM_002948	리보좀 단백질 L15	RPL15	1,368	3861
NM_000977	리보좀 단백질 L13	RPL13	424	3774
NM_002952	리보좀 단백질 S2	RPS2	86	3758
NM_005507	코필린 1(비-근육)	CFL1	508	3616
NM_004039	아넥신 A2	ANXA2	294	3560
NM_021019	미오신, 라이트 폴리펩티드 6, 알칼리, 평활근 및 비-근육	MYL6	209	3512
NM_002300	락테이트 디히드로게나제 B	LDHB	230	3501
NM_003217	정소 증진된 유전자 전사체(BAX 억제자 1)	TEGT	1,847	3438
NM_002568	폴리(A) 결합 단백질, 세포질 1	PABPC1	445	3241
NM_001015	리보좀 단백질 S11	RPS11	85	3220
NM_003973	리보좀 단백질 L14	RPL14	156	3198
NM_000969	리보좀 단백질 L5	RPL5	78	3167
NM_007104	리보좀 단백질 L10a	RPL10A	32	3079
NM_001642	아밀로이드 베타(A4) 전구체-유사 단백질 2	APLP2	1,364	3002
NM_001418	진핵 번역 시작 요소 4 감마, 2	EIF4G2	791	2913
NM_002635	용질 캐리어 패밀리 25 (미토콘드리아 캐리어; 포스페이트 캐리어), 멤버 3	SLC25A3	197	2900
NM_001009	리보좀 단백질 S5	RPS5	58	2897
NM_000291	포스포글리세레이트 키나아제 1	PGK1	1,016	2858
NM_001728	배시긴(basigin) (OK 혈액 그룹)	BSG	769	2827
NM_001658	ADP-리보실화 인자 1	ARF1	1,194	2772
NM_001003	리보좀 단백질, 라지, P1	RPLP1	39	2770
NM_018955	유비퀴틴 B	UBB	144	2732
NM_005998	샤페로닌 포함 TCP1, 서브유닛 3(감마)	CCT3	255	2709
NM_001967	진핵 번역 시작 인자 4A, 동형체 2	EIF4A2	626	2693
NM_001469	티로이드 자가항원 70kDa(Ku 항원)	G22P1	259	2682
NM_000918	프로콜라겐-프롤린, 2-옥소글루타레이트 4-디옥시게나제(프롤린 4-하이드록실라제), 베타 폴리펩타이드(단백질 디설파이트 이소머라제, 티로이드 호르몬 결합 단백질 p55)	P4HB	868	2659
NM_002574	퍼옥시레독신 1	PRDX1	323	2604
NM_001020	리보좀 단백질 S16	RPS16	78	2573
NM_007363	비-POU 도메인 포함, 옥타머-결합	NONO	1,119	2557
NM_001022	리보좀 단백질 S19	RPS19	63	2533
NM_001675	활성화 전사 인자 4(tax-반응 인헨서 요소 B67)	ATF4	85	2479
NM_005617	리보좀 단백질 S14	RPS14	78	2465
NM_001664	Ras 유사체 유전자 패밀리, 멤버 A	RHOA	1,045	2426
NM_005801	추정 번역 시작 요소	SUI1	836	2425
NM_000981	리보좀 단백질 L19	RPL19	80	2381
NM_000979	리보좀 단백질 L18	RPL18	49	2362
NM_001026	리보좀 단백질 S24	RPS24	77	2355
NM_000975	리보좀 단백질 L11	RPL11	53	2314
NM_002117	주요 조직적합성 복합체, 클래스 I, C	HLA-C	434	2278
NM_004068	어댑터-관련 단백질 복합체 2, mu 1 서브유닛	AP2M1	494	2230
NM_006429	샤페로닌 함유 TCP1, 서브유닛 7 (eta)	CCT7	164	2216
NM_022551	리보좀 단백질 S18	RPS18	5,538	2208
NM_001013	리보좀 단백질 S9	RPS9	73	2113
NM_005594	초기-폴리펩타이드-관련 복합체 알파 폴리펩타이드	NACA	133	2075
NM_001028	리보좀 단백질 S25	RPS25	74	2066
NM_032378	진핵 번역 연장 인자 1 델타 (구아닌 뉴클레오티드 교환 단백질)	EEF1D	76	2051
NM_000999	리보좀 단백질 L38	RPL38	50	2007
NM_000994	리보좀 단백질 L32	RPL32	64	2003
NM_007008	레티쿨론 4	RTN4	973	1969
NM_001909	카뎁신 D(리소좀 아스파틸 프로테아제)	CTSD	834	1940
NM_006325	RAN, 멤버 RAS 종양 유전자 패밀리	RAN	892	1906
NM_003406	티로신 3-모노옥시게나제/트립토판 5-모노옥시게나제 활성화 단백질, 제타 폴리펩타이드	YWHAZ	2,013	1892
NM_006888	카모둘린 1(포스포릴라제 키나아제, 델타)	CALM1	3,067	1880
NM_004339	뇌하수체 종양-전환 1 상호작용 단백질	PTTG1IP	1,985	1837
NM_005022	프로필린 1	PFN1	289	1787
NM_001961	진핵 번역 연장 인자 2	EEF2	504	1754
NM_003091	작은 핵 리보뉴클레오프로테인 폴리펩타이드 B 및 B1	SNRPB	295	1735
NM_006826	티로신 3-모노옥시게나제/트립토판 5-모노옥시게나제 활성화 단백질, 델타 폴리펩타이드	YWHAQ	1,310	1726
NM_002140	이종 핵 리보뉴클레오프로테인 K	HNRPK	1,227	1725
NM_001064	트랜스케톨라제(Wemicke-korsakoff 증후군)	TKT	167	1721
NM_021103	티모신, 베타 10	TMSB10	317	1714
NM_004309	Rho GDP 분리 억제자(GDI) 알파	ARHGDIA	1,206	1702
NM_002473	미오신, 헤비 폴리펩타이드 9, 비-근육	MYH9	1,392	1692
NM_000884	IMP(이노신 모노포스페이트) 디하이드로게나제 2	IMPDH2	63	1690
NM_001004	리보좀 단백질, 라지 P2	RPLP2	59	1688
NM_001746	칼넥신	CANX	2,302	1677
NM_002819	폴리피리미딘 트랙트 결합 단백질 1	PTBP1	1,561	1663
NM_000988	리보좀 단백질 L27	RPL27	59	1660
NM_004404	신경 전구체 세포 발현된, 발달상 하향 조절된 5	NEDD5	2,090	1654
NM_005347	열 충격 70kDa 단백질 5(글루코스-조절된 단백질, 78kDa)	HSPA5	1,757	1651
NM_000175	글루코스 포스페이트 이소머라제	GPI	296	1635
NM_001207	기초 전사 인자 3	BTF3	300	1632
NM_003186	트랜스젤린	TAGLN	405	1612
NM_003334	유비퀴틴 활성화 효소 E1 (A1S9T 및 BN75 온도 반응성 보완)	UBE1	199	1590
NM_001018	리보좀 단백질 S15	RPS15	32	1574
NM_003404	티로신 3-모노옥시게나제/트립토판 5-모노옥시게나제 활성화 단백질, 베타 폴리펩타이드	YWHAB	2,088	1523
NM_003753	진핵 번역 시작 인자 3, 서브유닛 7 제타, 66/67kDa	EIF3S7	152	1509
NM_005762	3자(tripartite) 모티프 포함 28	TRIM28	193	1507
NM_005381	뉴클레올린	NCL	284	1501
NM_000995	리보좀 단백질 L34	RPL34	450	1495
NM_002823	프로티모신, 알파(유전자 서열 28)	PTMA	720	1462
NM_002415	대식세포 이동 억제 인자 (글리코실화-억제 인자)	MIF	117	1459
NM_002128	고-이동성 그룹 박스 1	HMGB1	1,527	1457
NM_006908	Ras-관련된 C3 보툴리눔 독소 기질 1 (rho 패밀리, 스몰 GTP 결합 단백질 Rac1)	RAC1	1,536	1437
NM_002070	구아닌 뉴클레오티드 결합 단백질 (G 단백질), 알파 억제 활성화 폴리펩타이드 2	GNAI2	512	1435
NM_001997	Finkel-Biskis-Reiliy 쥣과 육종 바이러스(FBR-MuSV) 보편적으로(ubiquitously) 발현된 (fox 유도된); 리보좀 단백질 S30	FAU	68	1428
NM_014390	포도상구균 뉴클레아제 도메인 포함 1	SND1	556	1422
NM_014764	DAZ 관련된 단백질 2	DAZAP2	1,322	1419
NM_005917	말레이트 디하이드로게나제 1, NAD(용해성)	MDH1	208	1396
NM_001494	GDP 분리 억제자 2	GDI2	785	1395
NM_014225	단백질 포스파타제 2(이전에(formerly 2A)), 조절 서브유닛 A(PR 65), 알파 동형체	PPP2R1A	472	1391
NM_001660	ADP-리보실화 인자 4	ARF4	858	1382
NM_001823	크레아틴 키나아제, 뇌	CKB	206	1381
NM_003379	빌린 2(ezrin)	VIL2	1,272	1380
NM_000182	하이드록시아실-코엔자임 A 디하이드록시게나제/3-케토아실-코엔자임 A 티오실라제/에놀-코엔자임 A 하이드라타제(삼기능성 단백질), 알파 서브유닛	HADHA	647	1379
NM_003746	다이네인(dynein), 세포질, 라이트 폴리펩타이드 1	DNCL1	281	1375
NM_007103	NADH 디하이드록시게나제(유비퀴논) 플라보프로테인 1, 51kDa	NDUFV1	103	1352
NM_000992	리보좀 단백질 L29	RPL29	164	1349
NM_007209	리보좀 단백질 L35	RPL35	35	1345
NM_006623	포스포글리세레이트 디하이드록시게나제	PHGDH	231	1340
NM_002796	프로테아좀(프로좀, 마크로페인) 서브유닛, 베타 타입, 4	PSMB4	108	1340
NM_002808	프로테아좀(프로좀, 마크로페인) 26S 서브유닛, 비-ATPase, 2	PSMD2	231	1326
NM_000454	수퍼옥사이드 디스뮤타제 1, 용해성(근위축 측면 경화증 1(성인))	SOD1	346	1323
NM_003915	RNA 결합 모티프 단백질 12	RBM12	216	1323
NM_004924	액티닌, 알파 4	ACTN4	1,099	1316
NM_006086	튜불린, 베타 3	TUBB3	296	1314
NM_001016	리보좀 단백질 S12	RPS12	56	1304
NM_003365	유비퀴놀-시토크롬 c 환원효소 코어 단백질 1	UQCRC1	126	1303
NM_003016	스플라이싱 인자, 아르기닌/세린-풍부 2	SFRS2	1,059	1301
NM_007273	에스트로겐 수용체 활성의 억제자	REA	332	1281
NM_014610	글루코시다제, 알파; 뉴트럴 AB	GANAB	1,652	1280
NM_001749	칼페인, 스몰 서브유닛 1	CAPNS1	514	1270
NM_005080	X-박스 결합 단백질 1	XBP1	1,003	1269
NM_005216	돌리실-디포스포올리고사카라이드-단백질 글리코실트랜스퍼라제	DDOST	616	1268
NM_004640	HLA-B 관련 전사체 1	BAT1	237	1262
NM_021983	주요 조직적합성 복합체, 클래스 II, DR 베타 4	HLA-DRB1	313	1251
NM_013234	진핵 번역 시작 인자 3 서브유닛 k	elF3k	84	1251
NM_004515	인터루킨 인헨서 결합 인자 2, 45kDa	ILF2	384	1249
NM_000997	리보좀 단백질 L37	RPL37	50	1244
NM_000801	FK506 결합 단백질 1A, 12kDa	FKBP1A	1,149	1243
NM_000985	리보좀 단백질 L17	RPL17	58	1243
NM_001014	리보좀 단백질 S10	RPS10	57	1232
NM_001069	튜불린, 베타 2	TUBB2	194	1230
NM_004960	퓨전(악성 지방육종 내 t(12;16)에 포함)	FUS	166	1197
NM_005165	알돌라제 C, 프럭토스-비스포스페이트	ALDOC	432	1195
NM_004930	캡핑 단백질(액틴 필라멘트) 근육 Z-라인, 베타	CAPZB	259	1193
NM_000239	리소자임(신장 아밀로이드증)	LYZ	1,016	1190
NM_007263	코아토머 단백질 복합체, 서브유닛 엡실론	COPE	263	1179
NM_001861	시토크롬 c 옥시다제 서브유닛 IV 동형체 1	COX4I1	129	1178
NM_003757	진핵 번역 시작 인자 3, 서브유닛 2 베타, 36kDa	EIF3S2	408	1169
NM_005745	B-세포 수용체 관련 단백질 31	BCAP31	438	1166
NM_002743	단백질 키나아제 C 기질 80K-H	PRKCSH	337	1158
NM_004161	RAB1A, 멤버 RAS 종양유전자 패밀리	RAB1A	638	1115
NM_002080	글루타믹-옥살로아세틱 트랜스아미나제 2, 미토콘드리아(아스파테이트 아미노트랜스퍼라제 2)	GOT2	1,039	1114
NM_005731	액틴 관련 단백질 2/3 복합체, 서브유닛 2, 34kDa	ARPC2	448	1113
NM_006445	PRP8 프리-mRNA 가공 인자 8 유사체(효모)	PRPF8	173	1110
NM_001867	시토크롬 c 옥시다제 서브유닛 VIIc	COX7C	168	1106
NM_002375	마이크로튜불-관련 단백질 4	MAP4	1,164	1102
NM_003145	신호 서열 수용체, 베타(트랜스로콘-관련 단백질 베타)	SSR2	492	1099
NM_001788	CDC10 세포 분열 사이클 10 유사체 (S. cerevisiae)	CDC10	1,015	1094
NM_006513	세릴-tRNA 합성효소	SARS	323	1085
NM_003754	진핵 번역 시작 인자 3, 서브유닛 5 엡실론, 47kDa	EIF3S5	152	1081
NM_005112	WD 반복 도메인 1	WDR1	845	1080
NM_004893	H2A 히스톤 패밀리, 멤버 Y	H2AFY	635	1072
NM_004494	헵타토마-유도된 성장 인자(고-이동성 그룹 단백질 1-유사)	HDGF	1,339	1069
NM_001436	피브릴라린	FBL	111	1069
NM_003752	진핵 번역 시작 인자 3, 서브유닛 8, 110kDa	EIF3S8	201	1060
NM_003321	Tu 번역 연장 인자, 미토콘드리아	TUFM	207	1038
NM_001119	어덕신 1(알파)	ADD1	1,569	1037
NM_005273	구아닌 뉴클레오티드 결합 단백질 (G 단백질), 베타 폴리펩타이드 2	GNB2	386	1030
NM_006755	트랜스알돌라제 1	TALDO1	256	1026
NM_023009	MARCKS-유사 1	MARCKSL1	774	1014
NM_002799	프로테아좀(프로좀, 마크로페인) 서브유닛, 베타 타입, 7	PSMB7	162	1012
NM_002539	오르니틴 디카르복실라제 1	ODC1	343	1009
NM_006801	KDEL (Lys-Asp-Glu-Leu) 소포체 단백질 유지 수용체 1	KDELR1	742	1007
NM_014944	칼신테닌 1	CLSTN1	1,481	1003
NM_007262	파킨슨병(상염색체 열성, 조기 발병) 7	PARK7	253	1002

표 10. 다양한 하우스키핑 유전자의 리스트 (WO 2007/068265 A1, 표 1 참조).

상기 표는 WO 2007/068265 A1, 표 1로부터 수득하였으며, Eisenberg, E. and E. Y. Levanon (2003): Human housekeeping genes are compact; Trends Genet. 19(7): 362-365에 의해 제공된 수탁 번호(accession numbers)에 기초한다. 상기 수탁 번호는 Unigene 데이터베이스로부터 EST 데이터를 추출하는 PERL(Programmed Extraction Report Language) 컴퓨터 프로그램에 대해 인풋(input)으로 사용된다. Unigene 데이터베이스는 NCBI 웹사이트로부터 텍스트 파일로 다운로드하였다. 3'UTR의 길이는 3'-UTR을 컴퓨터를 통해 추출함으로써 유도되었다 (Bakheet, T., Frevel, M., Williams, BR, and K.S. Khabar, 2001. ARED: Human AU-rich element-containing mRNA database reveals unexpectedly diverse functional repertoire of encoded proteins. Nucleic Acids Research. 29:246-254). <a>는 일반적으로 유전자 산물의 약어로 사용된다; <b>는 3'UTR의 길이이다; <c>는 ESTs의 수이다.

바람직한 하우스키핑 유전자는 LDHA, NONO, PGK1 및 PPIH를 포함한다.

막 단백질에 대한 유전자 코딩은 전형적으로 생물학적 막과 상호작용하는 단백질을 코드하는 이러한 유전자를 의미한다. 대부분의 유전체에서, 모든 유전자의 약 20-30%는 막 단백질을 부호화한다. 단백질의 일반적인 유형은 -막 단백질에 추가로- 용해성 구상 단백질, 섬유질 단백질 및 무질서(disordered) 단백질을 포함한다. 따라서, 막 단백질을 코딩하는 유전자는 전형적으로 용해성 구상 단백질, 섬유질 단백질 또는 무질서 단백질을 코딩하는 유전자와 다르다. 막 단백질은 막 수용체, 수송 단백질, 막 효소 및 세포 접착 분자를 포함한다.

세포 대사에 포함되는 유전자는 전형적으로 세포 대사, 즉 살아있는 유기체의 세포 내에 생명을 유지하는 화학적 변형의 세트에 포함되는 단백질을 코드하는 이러한 유전자를 의미한다. 이들은 전형적으로 효소 촉매된 반응이며, 유기체를 생장 및 생식하게 하고, 그들의 구조를 유지하고, 그들이 환경에 반응하게 한다. 따라서, 세포 대사에 포함되는 바람직한 유전자는 유기체를 생장 및 생식하게 하게 하고, 그들의 구조를 유지하고, 및 그들의 환경에 반응하게 하는, 반응을 촉진시키는 효소를 코드하는 이러한 유전자이다. 세포 대사에 포함되는 유전자의 다른 예시는 세포 골격을 형성하는 것처럼 구조적 또는 기계적 기능을 갖는 단백질을 코딩하는 유전자를 포함한다. 세포 대사에 포함되는 다른 단백질은 포 신호전달, 면역 반응, 세포 접착, 막을 가로지르는 능동 수송 및 세포 사이클에 포함되는 단백질을 포함한다. 대사는 보통 두가지 카테고리로 나뉜다: 이화작용(catabolism), 세포 호흡의 방식으로 유기 물질의 분해, 및 동화작용(anabolism), 단백질 및 핵산과 같은 세포의 구성 요소의 형성.

전사, 번역 및 복제 과정에 포함된 유전자는 전형적으로 전사, 번역 및 복제 과정에 포함된 단백질을 코드하는 이러한 유전자를 의미한다. 특히, 이러한 맥락에서 사용된 용어 "복제"는 바람직하게 핵산의 복제, 예를 들어 DNA 복제를 의미한다. 전사, 번역 및 복제 과정에 포함된 바람직한 유전자는 전사, 번역 및/또는 (DNA) 복제 과정에 포함된 효소를 코딩하는 유전자이다. 다른 바람직한 실시예는 전사 인자 또는 번역 인자를 코딩하는 유전자를 포함한다. 리보좀 유전자는 전사, 번역 및 복제 과정에 포함된 유전자의 다른 바람직한 실시예이다.

단백질 변형에 포함된 유전자는 전형적으로 단백질 변형에 포함된 단백질을 코드하는 이러한 유전자이다. 이러한 유전자의 바람직한 예시는 단백질 변형, 특히 번역 후 변형 과정에 포함된 효소를 코드하는 이러한 유전자이다. 번역 후 변형에 포함되는 효소의 바람직한 실시예는 하기를 포함한다 (i) 소수성 그룹의 추가에 포함된, 특히 막 국소화를 위한 효소, 예를 들어 미리스토일화(myristoylation), 팔미토일화(palmitoylation), 이소프레닐화(isoprenylation) 또는 페닐화(prenylation), 파네실화(farnesylation), 제라닐화(geranylation) 또는 글리핀화(glypiation)에 포함된 효소; (ii) 증진된 효소 활성을 위한 보조인자의 추가에 포함된 효소, 예를 들어 리포일화(lipoylation), 플라빈 부분의 부착, 헤미 C의 부착, 포스포판테데이닐화(phosphopantetheinylation) 또는 레티닐리덴 시프(Schiff) 염기 형성에 포함된 효소; (iii) 번역 인자의 변형, 예를 들어 디프타미드 형성, 에타놀아민 포스포글리세롤 결합 또는 히푸신(hypusine) 형성에 포함된 효소; 및 (vi) 작은 화학적 그룹의 첨가, 예를 들어 아세틸화 및 포밀화와 같은 아실화, 메틸화와 같은 알킬화, C-말단에 아미드화와 같은 아미드 결합 형성, 및 아미노산 첨가(예를 들어 아르기닐화(arginylation), 폴리글루타밀화(polyglutamylation) 및 폴리글리실화(polyglycylation)), 부티릴화(butyrylation), 감마-카르복실화(gamma-carboxylation), 글리코실화(glycosylation), 말로닐화(malonylation), 하이드록실화(hydroxylation), 요오드화(iodination), 뉴클레오티드 첨가(nucleotide addition), 산화(oxidation), 포스포릴화(phosphorylation) 및 아데닐화(adenylation)와 같은 포스페이트 에스터 또는 포스포아미데이트 형성, 프로피오닐화(propionylation), 피로글루타메이트(pyroglutamate) 형성, S-글루타티오닐화(S-glutathionylation), S-니트로실화(S-nitrosylation), 숙시닐화(succinylation) 및 황산화(sulfation)에 포함된 효소.

세포 분열 과정에 포함된 유전자는 전형적으로 세포 분열에 포함된 단백질을 코드하는 이러한 유전자를 의미한다. 세포 분열은 둘 이상의 딸 세포로 모세포가 분열함에 의한 과정이다. 세포 분열은 보통 보다 큰 세포 주기의 일부로 일어난다. 진핵 생물에서, 세포 분열의 두 가지 유형이 있다: 각 딸 세포가 모세포와 유전적으로 동일한 생장(vegetative) 분열(유사 분열), 및 딸 세포 내 염색체의 수가 반수체 생식 세포를 생산하기 위해 절반으로 감소된 생식 세포 분열(감수 분열). 따라서, 세포 분열 과정에 포함된 바람직한 유전자는 유사 분열 및/또는 감수 분열에 포함된 단백질을 코드한다.

Fig4는 인자 유도된 유전자(Factor-Induced Gene)의 약어이다. Fig4 유전자는 또한 포스파티딜이노지톨 3,5-비스포스페이트 5-포스파타제(phosphatidylinositol 3,5-bisphosphate 5-phosphatase) 또는 SAC 도메인-포함 단백질 3 (Sac3)으로 알려진 폴리포스포이노지티드 포스파타제를 코드한다.

바람직하게, 본 발명에 따른 인공 핵산 분자는:

(i) 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소를 포함하며, 바람직하게 상기 (각각의) 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소는 인간 또는 쥣과 단백질 코딩 유전자의 3'-UTR 또는 5'-UTR로부터 각각 유도된 핵산 서열을 포함하거나 또는 이로 이루어짐;

(ii) 적어도 하나의 3'-UTR 요소, 적어도 하나의 5'-UTR 요소 및 적어도 하나의 오픈 리딩 프레임은 서로 모두 이종임(heterologous);

(iii) 적어도 하나의 5'-UTR 요소는 하기로 이루어진 그룹으로부터 선택된 유전자로부터 유도된다: 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자;

(iv) 5'-UTR은 바람직하게 5' TOP UTR이 아님; 및

(v) 3'-UTR은 바람직하게 리보좀 단백질 또는 알부민을 코딩하는 유전자로부터 또는 Fig4 유전자로부터 유도되지 않음.

더욱 바람직하게, 본 발명에 따른 이러한 인공 핵산 분자는:

(iii) 적어도 하나의 3' UTR 요소는 하기로 이루어진 그룹으로부터 선택된 인간 또는 쥣과 유전자로부터 유도된다: 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자;

(iv) 3'-UTR은 리보좀 단백질 또는 알부민을 코딩하는 유전자로부터 또는 Fig4 유전자로부터 유도되지 않음.

(v) 적어도 하나의 5'-UTR 요소는 하기로 이루어진 그룹으로부터 선택된 인간 또는 쥣과 유전자로부터 유도된다: 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자; 및

(vi) 5'-UTR은 5' TOP UTR이 아님.

이에 따라, 본 발명에 따른 인공 핵산 분자에서 3'-UTR 및 5'-UTR은 인간 또는 쥣과 하우스키핑 유전자로부터 유도되는 것이 바람직하다. 또한 3'-UTR 및 5'-UTR은 막 단백질을 코딩하는 인간 또는 쥣과 유전자로부터 유도되는 것이 바람직하다. 또한 3'-UTR 및 5'-UTR은 세포 대사에 포함된 인간 또는 쥣과 유전자로부터 유도되는 것이 바람직하다. 또한 3'-UTR 및 5'-UTR은 전사, 번역 및 복제 과정에 포함된 인간 또는 쥣과 유전자로부터 유도되는 것이 바람직하다. 또한 3'-UTR 및 5'-UTR은 단백질 변형에 포함된 인간 또는 쥣과 유전자로부터 유도되는 것이 바람직하다. 또한 3'-UTR 및 5'-UTR은 세포 분할에 포함된 인간 또는 쥣과 유전자로부터 유도되는 것이 바람직하다. 이러한 맥락에서, 통상의 기술자는 (i) 3'-UTR 및 5'-UTR이 동일한 유전자 종류(class)에 속하고 (ii) 적어도 하나의 3'-UTR 및 적어도 하나의 5'-UTR이 서로 이종일 경우, 3'-UTR 및 5'-UTR이 동일한 유전자로부터 유도되지는 않으나 동일한 유전자 종류에 속하는 별개의 유전자로부터 유도됨을 이해할 것이다. 따라서, 적어도 하나의 3'-UTR 및 적어도 하나의 5'-UTR은 동일한 유전자 종류에 속하는 별개의 유전자로부터 유도된다.

본 발명에 사용된 용어 "유전자 종류"는 유전자의 분류를 의미한다. 유전자 종류의 예시는 (i) 하우스키핑 유전자, (ii) 막 단백질을 코딩하는 유전자, (iii) 세포 대사에 포함된 유전자, (iv) 전사, 번역 및 복제 과정에 포함된 유전자, (v) 단백질 변형에 포함된 유전자 및 (vi) 세포 분할에 포함된 유전자를 포함한다. 즉, "하우스키핑 유전자"는 하나의 유전자 종류이며, 한편 "전사에 포함된 유전자"는 다른 유전자 종류이며, "세포 대사에 포함된 유전자"는 또 다른 유전자 종류이다, 등.

또한 본 발명에 설명된 본 발명에 따른 인공 핵산 분자는 3'-UTR 및 5'-UTR은 하기로 이루어진 그룹으로부터 선택된 인간 또는 쥣과 유전자로부터 유도된 것이 바람직하다: 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자, 상기 3'-UTR 및 5'-UTR은 별개의 유전자 종류로부터 선택된다.

바람직하게, 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 기능적으로 ORF에 연결된다. 이는 바람직하게 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 부호화된 펩타이드 또는 단백질의 발현에 기능을 증진 또는 안정화 또는 인공 핵산 분자에 안정화 기능과 같은 기능을 수행할 수 있는 ORF와 관련됨을 의미한다. 바람직하게, ORF 및 3'-UTR 요소는 5'->3' 방향으로 관련되며 및/또는 5'-UTR 요소 및 ORF는 5'->3' 방향으로 관련된다. 따라서, 바람직하게, 인공 핵산 분자는 보통 구조 5'-[5'-UTR 요소]-(선택적)-링커-ORF-(선택적)-링커-[3'-UTR 요소]-3'를 포함하며, 상기 인공 핵산 분자는 5'-UTR 요소만 포함하고 3'-UTR 요소는 포함하지 않거나, 3'-UTR 요소만 포함하고 5'-UTR 요소는 포함하지 않거나, 또는 3'-UTR 요소 및 5'-UTR 요소를 모두 포함할 수 있다. 추가로, 상기 링커는 존재 또는 부존재할 수 있다. 예를 들어, 상기 링커는 1-50 또는 1-20 뉴클레오티드의 스트레치와 같은, 예를 들어 하나 이상의 제한 효소 인식 부위(제한 부위)를 포함 또는 이로 이루어진 하나 이상의 뉴클레오티드일 수 있다.

바람직하게, 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치(locus)), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-Box 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴(contactin) 1), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과(readthrough) 전사체), SEPP1, PDE5A, SATB1, CCPG1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1으로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

특히 바람직한 실시예에서 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과(readthrough) 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1으로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

더욱 바람직하게, 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), Ybx1 (Y-Box 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1) 및 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 "기능적 절편", "기능적 변이체" 또는 "변이체의 기능적 절편"을 포함 또는 이로 이루어진다.

바람직하게, 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브 복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (readthrough transcript), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1으로 이루어진 그룹으로부터 선택된 인간 유전자의 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함한다.

그렇지 않으면 또는 추가적으로, 또한 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, 및 Gaa로 이루어진 그룹으로부터 선택된 쥣과 유전자의 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함하는 것이 바람직하다.

바람직하게, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ss4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (readthrough transcript), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1으로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함한다. 더욱 바람직하게, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-Box 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)으로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

특히 바람직한 실시예에서, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ss4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역 초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1으로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함한다. 더욱 바람직하게, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)으로 이루어진 그룹으로부터 선택된 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

더욱 바람직하게, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (readthrough transcript), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1으로 이루어진 그룹으로부터 선택된 인간 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함한다; 바람직하게, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)으로 이루어진 그룹으로부터 선택된 인간 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

따라서, 또한 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), Ybx1 (Y- 박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1), Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, 및 Gaa으로 이루어진 그룹으로부터 선택된 쥣과 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함하는 것이 더욱 바람직하다; 바람직하게, 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)으로 이루어진 그룹으로부터 선택된 쥣과 유전자의 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

바람직하게, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴틴) 1 알파 서브복합체 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, TMEM14A, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; 및 Hexa로 이루어진 그룹으로부터 선택된 유전자의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함한다. 더욱 바람직하게, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체4)의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

특히 바람직한 실시예에서, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, TMEM14A, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Ndufa4; Ndufs5; Atp5o; Tspo; Taldo1; Bloc1s1; 및 Hexa로 이루어진 그룹으로부터 선택된 유전자의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함한다. 더욱 바람직하게, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

더욱 바람직하게, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, TMEM14A, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, 및 GSTM4로 이루어진 그룹으로부터 선택된 인간 유전자의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함한다; 바람직하게, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 인간 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

따라서, 또한 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; 및 Hexa로 이루어진 그룹으로부터 선택된 쥣과 유전자의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함하는 것이 더욱 바람직하다; 바람직하게, 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 쥣과 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

"유전자의 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열"이라는 구절은 바람직하게 유전자 또는 절편 또는 이의 일부, 바람직하게 자연적으로 발생한 유전자 또는 절편 또는 이의 일부의 전사체의 3'-UTR 서열 및/또는 5'-UTR 서열에 기초한 핵산 서열을 의미한다. 이러한 구절은 전체 3'-UTR 서열 및/또는 전체 5'-UTR 서열에 상응하는 서열, 즉 유전자의 전사체의 전체 길이 3'-UTR 및/또는 5'-UTR 서열, 및 유전자의 전사체의 3'-UTR 서열 및/또는 5'-UTR 서열의 절편에 상응하는 서열을 포함한다. 바람직하게, 유전자의 전사체의 3'-UTR 및/또는 5'-UTR의 절편은 유전자 전사체의 전장(full-length) 3'-UTR 및/또는 5'-UTR 내 뉴클레오티드의 연속적인 스트레치(stretch)에 상응하는 뉴클레오티드의 연속적인 스트레치로 이루어지며, 이는 유전자 전사체의 전장 3'-UTR 및/또는 5'-UTR의 적어도 5%, 10%, 20%, 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 더 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 및 가장 바람직하게 적어도 90%를 나타낸다. 본 발명에 있어서, 이러한 절편은 바람직하게 본 발명에 설명된 기능적 절편이다. 바람직하게, 상기 절편은 3'-UTR 및/또는 5'-UTR 또는 이의 절편에 연결된 ORF의 번역을 위한 조절 기능을 보유한다.

용어 "유전자 전사체의 3'-UTR의 변이체 및/또는 5'-UTR의 변이체" 및 유전자 전사체의 3'-UTR 및/또는 5'-UTR에 있어서 "이의 변이체"는 자연 발생 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체, 바람직하게 척추동물 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체, 더욱 바람직하게 포유동물 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체, 더욱 더 바람직하게 영장류 유전자, 특히 상기 설명된 인간 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체를 의미한다. 이러한 변이체는 유전자 전사체의 변형된 3'-UTR 및/또는 5'-UTR일 수 있다. 예를 들어, 변이체 3'-UTR 및/또는 5'-UTR의 변이체는 상기 변이체가 유도된 자연 발생 3'-UTR 및/또는 5'-UTR에 비해 하나 이상의 뉴클레오티드 결실, 삽입, 추가 및/또는 치환을 나타낼 수 있다. 바람직하게, 유전자 전사체의 3'-UTR의 변이체 및/또는 5'-UTR의 변이체는 변이체가 유도된 자연 발생 3'-UTR 및/또는 5'-UTR에 적어도 40%, 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 더욱 더 바람직하게 적어도 90%, 가장 바람직하게 적어도 95% 동일하다. 바람직하게, 상기 변이체는 본 발명에 설명된 기능적 변이체이다.

구절 "유전자 전사체의 3'-UTR의 변이체로부터 및/또는 5'-UTR의 변이체로부터 유도된 핵산 서열은 바람직하게 상기 설명된 유전자 또는 절편 또는 이의 일부의 전사체의 3'-UTR 서열 및/또는 5'-UTR의 변이체에 기초한 핵산 서열을 의미한다. 이러한 구절은 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체의 전체 서열, 즉 유전자 전사체의 전장 변이체 3'-UTR 서열 및/또는 전장 변이체 5'-UTR 서열에 상응하는 서열, 및 유전자 전사체의 변이체 3'-UTR 서열의 절편 및/또는 변이체 5'-UTR 서열의 절편에 상응하는 서열을 포함한다. 바람직하게, 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체의 절편은 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 전장 변이체 내 뉴클레오티드의 연속적인 스트레치에 상응하는 뉴클레오티드의 연속적인 스트레치로 이루어지며, 이는 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 전장 변이체의 적어도 20%, 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 더 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 및 가장 바람직하게 적어도 90%를 나타낸다. 본 발명에 있어서, 이러한 변이체의 절편은 바람직하게 본 발명에 설명된 변이체의 기능적 절편이다.

본 발명의 맥락에서 용어 "기능적 변이체", "기능적 절편", 및 "변이체의 기능적 절편" (소위 "기능적 변이체 절편")은 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 절편, 3'-UTR 및/또는 5'-UTR의 변이체, 또는 3'-UTR 및/또는 5'-UTR의 변이체의 절편이 변이체, 절편 또는 변이체의 절편이 유도된 유전자 전사체의 자연 발생 3'-UTR 및/또는 5'-UTR의 적어도 하나, 바람직하게 하나 이상의 기능을 수행함을 의미한다. 이러한 기능은 예를 들어 바람직하게 인간 세포와 같은 포유 동물 세포에서 mRNA를 안정화 및/또는 mRNA로부터 단백질 생산을 증진, 안정화 및/또는 연장 및/또는 mRNA로부터 단백질 발현 또는 총 단백질 생산을 증가시킬 수 있다. 바람직하게, 3'-UTR 및/또는 5'-UTR의 기능은 ORF에 의해 부호화된 단백질의 번역에 관한 것이다. 더욱 바람직하게, 상기 기능은 3'-UTR 및/또는 5'-UTR에 연결된 ORF 또는 이의 절편 또는 변이체의 번역 효율을 증진시키는 것을 포함한다. 본 발명의 맥락에서 변이체, 절편, 변이체 절편은 바람직하게 인간 세포와 같은 포유동물 세포에서 참조 3'-UTR 및/또는 참조 5'-UTR을 포함하거나 3'-UTR 및/또는 5'-UTR이 없는 mRNA에 비해 mRNA를 안정화시키는 기능, 및/또는 바람직하게 인간 세포와 같은 포유동물 세포에서 참조 3'-UTR 및/또는 참조 5'-UTR을 포함하거나 3'-UTR 및/또는 5'-UTR이 없는 mRNA에 비해 mRNA로부터 단백질 생산을 증진, 안정화 및/또는 연장시키는 기능, 및/또는 바람직하게 인간 세포와 같은 포유동물 세포에서 참조 3'-UTR 및/또는 참조 5'-UTR을 포함하거나 3'-UTR 및/또는 5'-UTR이 없는 mRNA에 비해 mRNA로부터 단백질 생산을 증가시키는 기능을 수행하는 것이 특히 바람직하다. 참조 3'-UTR 및/또는 참조 5'-UTR은 예를 들어 ORF와 조합하여 자연 발생하는 3'-UTR 및/또는 5'-UTR일 수 있다. 게다가, 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편은 바람직하게 변이체, 절편, 또는 변이체 절편이 유도된 야생형 3'-UTR 및/또는 야생형 5'-UTR에 비해, 이러한 3'-UTR 및/또는 5'-UTR의 변이체, 절편, 또는 변이체 절편을 포함하는 mRNA의 번역의 효율을 상당히 약화시키는 효과를 갖지 않는다. 본 발명의 맥락에서 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 "기능적 절편", "기능적 변이체" 또는 "변이체의 기능적 절편"의 특히 바람직한 기능은 상기 설명된 기능적 절편, 기능적 변이체 또는 변이체의 기능적 절편을 수송하는 mRNA의 발현에 의한 단백질 생산을 증진, 안정화 및/또는 연장시키는 것이다.

바람직하게, 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편에 의해 수행되는, mRNA 및/또는 단백질 생산을 안정화 효율 및/또는 단백질 생산 증가 효율과 같은 하나 이상의 기능의 효율은 변이체, 절편 또는 변이체 절편이 유도된 유전자 전사체의 자연 발생 3'-UTR 및/또는 5'-UTR에 의해 나타나는 mRNA 및/또는 단백질 생산 안정화 효율 및/또는 단백질 생산 증가 효율에 관하여, 적어도 5%, 더욱 바람직하게 적어도 10%, 더욱 바람직하게 적어도 20%, 더욱 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90% 증가된다.

본 발명의 맥락에서, 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 절편 또는 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체는 바람직하게 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 나타낸다. 바람직하게, 이러한 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 절편 또는 유전자 전사체의 3'-UTR 및/또는 5'-UTR의 변이체는 상기 설명된 기능적 절편이다. 바람직한 실시예에서, 유전자 전사체의 3'-UTR 및/또는 5'-UTR 또는 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타낸다. 전형적으로, 5'-UTR 요소 및/또는 3'-UTR 요소는 500, 400, 300, 200, 150 또는 100개 미만의 뉴클레오티드임을 특징으로 한다.

바람직하게, 적어도 하나의 3'-UTR 요소는 서열번호 1 내지 24 및 서열번호 49 내지 318 또는 상응하는 RNA 서열로 이루어진 그룹으로부터 선택된 핵산 서열에 각각 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지거나, 또는 상기 적어도 하나의 3'-UTR 요소는 서열번호 1 내지 24 및 서열번호 49 내지 318 또는 상응하는 RNA 서열로 이루어진 그룹으로부터 선택된 핵산 서열에 각각 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어진다:

호모 사피엔스(Homo　sapiens) SLC38A6　 3'-UTR

SLC38A6-001 ENST00000267488

AAGAAATATTTTCCTACTTCTTACAAGAATAATATACCCCTAGTTGCAAGAATGAATTATTCCGGAAGACACCCTGGATGAAAAATAACATTTTAATAAAAATTATTAACAGAAAAGCAGAACAAAATGGCAGTGGGTATGGGGAAGTAAGAGTGTGGCAGTTTTAATCAAAAAAAGAAACAAACTCGAAATGCTCTTAAA

(서열번호:49)

호모 사피엔스 DECR1　 3'-UTR

NM_001359.1

GACCACTTTGGCCTTCATCTTGGTTACAGAAAAGGGAATAGAAATGAAACAAATTATCTCTCATCTTTTGACTATTTCAAGTCTAATAAATTCTTAATTAAC

(서열번호:50)

호모 사피엔스 PIGK　 3'-UTR

ACTTGATGATGAATGAAGAATGCATGGAGGACTGCAAACTTGGATAATAATTTATGTCATTATATATTTTTAAAAATGTGTTTCTCTTGTATGAATTGGAAATAAGTATAAGGAAACTAAATTTGAATCAACTATTAATTTTATAACTTAAAGAAAAATAATTGTTAATGCAACTGCTTAATGGCACTAAATATATTCCAGTTTTGTATTTTGTGTATTATAAAAGCGAATGAGACAGAGATCAGAATACATTGACTGTTTTTGAAAATAGTAATTTCCCCTTATCCCCTTTTCATTTGGAAAAGAAACAATTGTGAAGACATTAAATTCTCACTAACAGAAGTAACTTTGGTTAATTATTTTTTGTAT

(서열번호:51)

호모 사피엔스 FAM175A 3'-UTR

FAM175A-009 ENST00000506553

TCCTTTTAACCTTACAAGGAGATTTTTTTATTTGGCTGATGGGTAAAGCCAAACATTTCTATTGTTTTTACTATGTTGAGCTACTTGCAGTAAGTTCATTTGTTTTTACTATGTTCACCTGTTTGCAGTAATACACAGATAACTCTTAGTGCATTTACTTCACAAAGTACTTTTTCAAACATCAGATGCTTTTATTTCCAAACCTTTTTTTCACCTTTCACTAAGTTGTTGAGGGGAAGGCTTACACAGACACATTCTTTAGAATTGGAAAAGTGAGACCAGGCACAGTGGCTCACACCTGTAATCCCAGCACTTAGGGAAGACAAGTCAGGAGGATTGATTGAAGTTAGGAGTTAGAGACCAGCCTGGGCAACGTATTGAGACCATGTCTATTAAAAAATAAAATGGAAAAGCAAGAATAGCCTTATTTTCAAAATATGGAAAGAAATTTATATGAAAA

(서열번호:52)

호모 사피엔스 PHYH 3'-UTR

PHYH-002 ENST00000396913

AATAGCCATCTGCTATAACTCTTTCAACAGAAAACCAAAACCAAACGAAATGTCTAAGGAAAATGTTTTCTTAATGAGATGATGTAACCTTTTCTATCACTTGTTAAAAGCAGAAAACATGTATCAGGTACTTAATTGCATAGAGTTAGTTTTGCAGCACAATGGTGTTGCTTTAATGGAAAAAAAAAACAGTAAAAGTGAAATATTACTGTTTTAAGGAAAACTAATTTAGGGTGGCAGCCAATAAAGGTGGTTGGTGTCTAATTTAAGTGTTAAATCAATTTCTTTCATTCAGTTAGCTCTTTACCCAAGAAGAAGTGAATGATTTGGAGCTTAGGGTATGTTTTGTATCCCCTTTCTGATAAACCCATTCCCTACCAATTTTATGTCATAAGAGATTTTTTTCCCCCAAATCTAGAACAATGTATAATACATTCACATCTAGTCAAGGGCATAGGAACGGTGTCATGGAGTCCAAATAAAGTGGATATTCCTGCTCGGACAA

(서열번호:53)

호모 사피엔스 TBC1D19 3'-UTR

TBC1D19-001 ENST00000264866

TCTTCTTCACAGTCACTGGCAACACATCTAGTTTTTCATTAGAAACAAATCATGAACTATGCAAACTCTGCATAAAACCAAAATGAAACTTTGCATATAAGCCAATAAAGATCATGTTCCCTCTTCAGTTAAACCTAAGTAGTTTCTCACTTTTTGAAACAATAACTCTGCACCAAATATTGCATCGCATGCTGCTGATTTTCAAGAGAGAAGCAATAAACACAACTTCTGCTAAATTGAGCATTATATATATAATATTATAATATATATATAATCCTGACTTGTCAATGGCATGTAATAATATATGCAATAAGAACTAAAGATACTGTAATAAACTTCAAGAGGTAATGTAGCTTCTTGGATAATTCTTTTATGTCAGTTTATAAATTTATCTCTAGATAATG

(서열번호:54)

호모 사피엔스 TBC1D19 NM_018317.2 3'-UTR

TCTTCTTCACAGTCACTGGCAACACATCTAGTTTTTCATTAGAAACAAATCATGAACTATGCAAACTCTGCATAAAACCAAAATGAAACTTTGCATATAAGCCAATAAAGATCATGTTCCCTCTTCAGTTAAACCTAAGTAGTTTCTCACTTTTTGAAACAATAACTCTGCACCAAATATTGCATCGCATGCTGCTGATTTTCAAGAGAGAAGCAATAAACACAACTTCTGCTAAATTGAGCATTATATATATAATATTATAATATATATATAATCCTGACTTGTCAATGGCATGTAATAATATATGCAATAAGAACTAAAGATACTGTAATAAACTTCAAGAGGTAAAAAAA

(서열번호:55)

호모 사피엔스 PIGB 3'-UTR

PIGB-201 ENST00000539642

AAATTCAACATGAAGATGAAATTCTGAACTTTCCTAGATAAATTAACATTGCTGGGTGGAAATATTCAGATGCTGCTTAAATACTTCGGTAAACACTGGGTAAGATTCATGGAACTTAGAAAAAAGCTGTATGAACTGCTTTACCAAATATCACTACTGAGGAAATGTATAAAATACCACATAGTATAAAATTACATGTTAATACAATGCCAGATTTTAAATAAAGACCTTTAGTTTTCCTC

(서열번호:56)

호모 사피엔스 ALG6 3'-UTR

ALG6-006 ENST00000263440 CTGTATTCCTAAACAAATTGTTTCCTAAACAAATGTGAAAATGTGAACAGTGCTGAAAGGTTTTGTGAACTTTTTGCTATGTATAAATGAAATTACCATTTTGAGAACCATGGAACCACAGGAAAGGAAATGGTGAAAAGTCATTGTTGTCTACACA

(서열번호:57)

호모 사피엔스 CRYZ 3'-UTR

CRYZ-005 ENST00000370871 TGATTAATTCTTTCATGGATTTCCTATGTAATTAGAGGTACTGTCTTTCCCCCAGTTGTACTTACCCTATCTTTTCTTTAATTAACATTCGATTCCATGAGCTTCTTATGTGAAAAAATAAGATTTTTCTTTAGAGAGCAGAAGCAGAAGAGTAAAATTTATTGTATAGCTAGCAATATTTTTTTATGCCATCTGTCTCAAATCAAAGAGTCATCATAGTAGGAAATAACATGTTAGTTGTCATTTGGCATGAGTGTGCATTCCAGTAATTCTTAATTGATATTTGATTAATTCCATACCTTTGATTAAAACATGCTAGTTCAA

(서열번호:58)

호모 사피엔스 BRP44L 3'-UTR

BRP44L-001 ENST00000360961 CAATGGAAAAGGAAGAACAAGGTCTTGAAGGGACAGCATTGCCAGCTGCTGCTGAGTCACAGATTTCATTATAAATAGCCTCCCTAAGGAAAATACACTGAATGCTATTTTTACTAACCATTCTATTTTTATAGAAATAGCTGAGAGTTTCTAAACCAACTCTCTGCTGCCTTACAAGTATTAAATATTTTACTTCTTTCCATAAAGAGTAGCTCAAAATATGCAATTAATTTAATAATTTCTGATGATGGTTTTATCTGCAGTAATATGTATATCATCTATTAGAATTTACTTAATGAAAAACTGAAGAGAACAAAATTTGTAACCACTAGCACTTAAGTACTCCTGATTCTTAACATTGTCTTTAATGACCACAAGACAACCAACAGCTGGCCACGTACTTAAAATTTTGTCCCCACTGTTTAAAAATGTTACCTGTGTATTTCCATGCAGTGTATATATTGAGATGCTGTAACTTAATGGCAATAAATGATTTAAATATTTGTTAAA

(서열번호:59)

호모 사피엔스 ACADSB 3'-UTR

ACADSB-004 CGTCTATAGGAGTGGGACCCCTCCCTGGTGTCACTGCTGTAAAATTTTAAACGGTTGTGTCTTGTTGGGAGTAAGTGCCTTGCGTGGGAATAAACTTCCACAGCATTCGAATATTTTAATGAAGCCCTTAGTCAGGGTCCTGGTGTTGGCCTTTTTGGTTTTCTCTTTTCAGGCTGTTTAACTTAGGCACAGGAGATCCACTTTTAAACTTGGGAAATAAGCACCTGTATTTTTTTCCAAAACTGTTTTTAAAGCTGTATACGCATACATATATATATTTTTACTCTGTCTTACTCTGTCACCCAGGCTAGAGTGCAGTGGCGCGATCTCAGCTCACTGCAGCCTTGACCTCCT

(서열번호:60)

호모 사피엔스 TMEM14A 3'-UTR

NM_014051.3 GCATCTGGAGGAACAGAAAACTAAGTTCATGTCATCCTGCTGTAATGGGCAGAGCATATTTTTTTTGTATTTAAAAGATAAACTTCAATATGGAATGCTAGAAACACAAATAGCACTGTCACCTCTAATATGAACATTAGTTTGAGGTAGTTTTTTTCTAAAGCAAAAATTTTAACTGTTTTCTAATTGTCAAGCACTATTTTCATTAAAAGTGTCTAATGAATCATGATATACTCTTCCATTTGTTGTGTCTATTTTTTATATATTTGGTATTTTTTGAAAATTCCAAATACTCATGTCTCAAGTAAGCTTAAACTACAACTTGTCACATAAAGGAAGTCTTAAGTGGAGTTCACAGAATGATAATGTATCTATTTGTCATTTGTGTTATATTTGAAATTATTAGAAATTATGCTTTTTCCATTTTAATTGTATTGCTGCCAGTGCTATTTTTTTCTTTAAAAAATTTTATTCTTAGCACACTGTTATGTCCTAACTGAATGTATTCAGTATTCAAATAAAAGACATTTTGGTTCAAA

(서열번호:61)

호모 사피엔스 GRAMD1C 3'-UTR

GRAMD1C-005 ENST00000472026 TGATCTGAAGGACTAAAACCGCAGAGATACTTGGAACTTAAAGAAAATACCTGGAAGAAAACCAGACGAATGAAGGATTTTGGCATAGAACATTTCTATGTTTTTTCATTATTGAGATTTCTAATATGAACATTTCTTTCAGTAACATTTATTTGATAATTAGTTTCTGCTGGCCTTAATAATCCATCCTTTCACTTCTTATAGATATTTTTAAGCTGTGAATTTCTTCAGTGAACCATGAAATATATTATAGAACTGAATTTCTCTGATACAAAAAGAAAATGACACACCC

(서열번호:62)

호모 사피엔스 C11orf80 3'-UTR

C11orf80-201 ENST00000360962 GCCGGGTCCCCTTCCGCAAGCGCCCACCGATCCGGAGGCTGCGGGCAGCCGTTATCCCGTGGTTTAATAAAGCTGCCGCGCGCTCACCAAGTCC

(서열번호:63)

호모 사피엔스 ANXA4 3'-UTR

ANXA4-002 ENST00000409920 AATAAAAATCCCAGAAGGACAGGAGGATTCTCAACACTTTGAATTTTTTTAACTTCATTTTTCTACACTGCTATTATCATTATCTCAGAATGCTTATTTCCAATTAAAACGCCTACAGCTGCCTCCTAGAATATAGACTGTCTGTATTATTATTCACCTATAATTAGTCATTATGATGCTTTAAAGCTGTACTTGCATTTCAAAGCTTATAAGATATAAATGGAGATTTTAAAGTAGAAATAAATATGTATTCCATGTTTTTAAAA

(서열번호:64)

호모 사피엔스 TBCK 3'-UTR

TBCK-002 ENST00000361687 AGAACCAAGAGTGTGACTGCCAAAACTTAGTGTGGCATCAGCACCAACAGCACAGTTCTTCATATCCACGCCACTCTCAGACAAAACTAGATGTCCAGATTGTTGCATTTCCGTAAAGTTTGTCACGAGACATTTTTTAAAATCTCATAACCCACATGTTCAGTTATCCATGCAAGAAACTTGACTCTACATGTATTGCTGAAAGAATTTTCTTAACAGTGAAATCTGATCATATATTTTTACCACACTGCCACATAAAGCCCAAGAAATTCAGCTGACAAGACAGATTTAGCATTATCAAGAAATCCCATTTGCCCTGAAAAAGCTGTCCTCCATTGTACTGAACAGACAGTCCTGTCGATTGTGTTATTTAGAAACATACACTGAATGTGGGCTGAAATCATCATCTTTCCATAATGAAAACTGAGAAACTATTCACAATGCATTCCTTATAAATAAATGCTACATTTAGTAACTCATTTCACCCAAA

(서열번호:65)

호모 사피엔스 IFI6 3'-UTR

IFI6-001 ENST00000361157 CCAGCAGCTCCCAGAACCTCTTCTTCCTTCTTGGCCTAACTCTTCCAGTTAGGATCTAGAACTTTGCCTTTTTTTTTTTTTTTTTTTTTTTGAGATGGGTTCTCACTATATTGTCCAGGCTAGAGTGCAGTGGCTATTCACAGATGCGAACATAGTACACTGCAGCCTCCAACTCCTAGCCTCAAGTGATCCTCCTGTCTCAACCTCCCAAGTAGGATTACAAGCATGCGCCGACGATGCCCAGAATCCAGAACTTTGTCTATCACTCTCCCCAACAACCTAGATGTGAAAACAGAATAAACTTCACCCAGAAAACACTT

(서열번호:66)

호모 사피엔스 CAMKMT 3'-UTR

(동의어 C2orf34) ENST00000378494 AAGATTAAGCTTCTCAAAGACGAAGAAACGTATCAAGTGCATAGGGAATATTTTTACAAAAACGGAAATCTGTAAGGGGTATAATCGCCTGCCTGCGCCCTTTGCAGCATTTCACGTGTGGGCTATGGACTCCACCTGTCCTCACCCACGTTATTCCCCAGCTGCCCTCTCCAGCTCCCTCCCCGCCTCTTTTTACACTCTGCTTGTTGCTCGTCCTGCCCTAAACCTTTGTTTGTCTTTAAATGTGTATAAGCTGCCTGTCTGTGACTTGAATTTGACTGGTGAACAAACTAAATATTTTTCCCTGTAATTGAGACAGAATTTCTTTTGATGATACCCATCCCTCCTTCATTTTTTTTTTTTTTTTGGTCTTTGTTCTGTTTTGGTGGTGGTAGTTTTTAATCAGTAAACCCAGCAAATATCATGATTCTTTCCTGGTTAGAAAAATAAATAAAGTGTATCTTTTTATCTCCCTCCAA

(서열번호:67)

호모 사피엔스 ALDH6A1 3'-UTR

NM_005589.2 AAACAAGTTTGTTTAAGACTGACTCCATCCTGAGTAATCTCCCTTTATTTTTGACCAGCTTCATTTGTCAGCTTTGCTCAGATCAGATCGATGGGATTGGAATACATTGTAACTAAAATCTTCCTCAGGACTATTAACCCCCGCAAAGTTTCTATAGGGAACTGCCTAGTGTAACAATGAAACCAGATTTCTCACTTGCTCTTCATACTTCTATTTTGAGGTAACTGTTGTAACTATGAAATGCTTATCTGAAAGTAGTGCTTAAACCTGATTTCTAAAAATTATCCCATTTTCTGATGATTTGAAGGGGAGAAAAGCCAGTGTATGTAAAGAAAATGTTCCAGCCAGGCGCGGTGGCTCACGCCTGTAATTCCATCATTTTGGGAGGCCACAGTGGGCAGATTGCTTGAGCCCAGGAGTTGAAGAACGTGGCGAAACCCCGTATCTATTATTTAAAAAAATTGAAAAAGTAAAAA

(서열번호:68)

호모 사피엔스 AGTPBP1 3'-UTR

AGTPBP1-004 ENST00000357081 GCCCGCTGCCATCTCTTGTTAACTGCAAAGAATAAATGAAATATCTTGGTTTTTATTTCCCAGGAAGCTTGAGAGAAATGAGTTTATACAGAGCTGACTCAAAAAGACAAAAAGTAACTTGGGCCAGTTTGGTTTCAAGATAATAAATGTGTTATTAATTAATGATAAAATTGGCGCTTGTTTTATTTTCGATATTCAATGCACTTTATGTAGCATTGAATGATCAAATATTGGATTTACCTTTAAAAAAAAAACCTGAGTATCATTGCATGAATTTTTATCTCCCTATGGTTATATCCTGCATCAAGTGGATAATTTTGAAGTGTGTTCAGAATATAAAATTGAAATTTTAGAGTTGTTGAAAATCCTGACTTGTTGAAAACTAATATATATGTACATGGATTTCTATAGATGTGTTTGTTTAGAAGTGGGTAGATATTGCAGATAAGACTGTTCTTCAGAATCATGTTAACTATTGGGTTGTGACTGAAGTAGTCCAGGGTTTGCCTTGAAACCATTACATTCTACATTTACCAAATTAAACAAATAAAAACTGTATTAAATGTT

(서열번호:69)

호모 사피엔스 CCDC53 3'-UTR

CCDC53-001 ENST00000240079 GCTTAATTTTGATAAGAATTACATATGCATGCATAGGGGTACATTTACATTCTGTAAGAGATTGAGCCTGAACTCTCTTAGTCATAAAAACATCAAATGGCCACATGTCCACTACCAAGCTTCTTCTATGTTAAAAAAATAATAATAAAGCAGTTTTAACCTGCCAGTA

(서열번호:70)

호모 사피엔스 LRRC28 3'-UTR

LRRC28-002 ENST00000331450 TAAACACTCAAGAACCTCAGGAGCGCTGCCAGCTTGACACTGGGGAATCCAGCCAGTCCAGCACACTCTTCCATCCTGTCCTGTCCAATGCGGGGGCACTGCAGAACTCTCTAGAAATGTCATGATTGAGCTTCAGAGCTAAAATGCCTTCACCCTTCCCCCAAGTTGGAATATATCCTCCCCCAAATTAAGGA

(서열번호:71)

호모 사피엔스 CCDC109B 3'-UTR

NM_017918.4 TCTTACAGTTTTAAATGTCGTCAGATTTTCCATTATGTATTGATTTTGCAACTTAGGATGTTTTTGAGTCCCATGGTTCATTTTGATTGTTTAATCTTTGTTATTAAATTCTTGTAAAAC

(서열번호:72)

호모 사피엔스 PUS10 3'-UTR

PUS10-001 ENST00000316752 CTTTCAAATTTGGAGACAAAGAGTATGGTTTTCCTGGCATGATGTGGACATCCATGGAGCACATGCCGTAAAATGGCTGTTTACCCACCATAACGGTGTCTTGAAAACTATTTGGATCATGTTGATCTATATAATTGTTAATTTGTTGTAACATCTCAGGATCTATATATGTGTATATTTTGTGTTAAATTGTTCCAAGGATGTCTTAGGATTTTTCTCATTCCCTCTTTCACCCCCACAAACCAAACTATGAATAATGAAATAATTCTCCTTAATTCTTTCATTTAGAGAGGTGCACAAACAGGACACATTCTCTGTTAACCTAAGAAGCTGTAATTTCAGCAAGATTTCCCTCCACAAGAGATATACCACCTTTAAAATCATGTTCTAATTTTTGTAAATTATCTGAATAAAAGTTATATCTAG

(서열번호:73)

호모 사피엔스 CCDC104 3'-UTR

CCDC104-002 ENST00000339012 TAATTAAGAACAATTTAACAAAATGGAAGTTCAAATTGTCTTAAAAATAAATTATTTAGTCCTTACACTGA

(서열번호:74)

호모 사피엔스 CASP1 3'-UTR

CASP1-007 ENST00000527979 AATAAGGAAACTGTATGAATGTCTGTGGGCAGGAAGTGAAGAGATCCTTCTGTAAAGGTTTTTGGAATTATGTCTGCTGAATAATAAACTTTTTTGAAATAATAAATCTGGTAGAAAAATGAAAA

(서열번호:75)

호모 사피엔스 SNX14 3'-UTR

SNX14-007 ENST00000513865 ACACTTGGATTTGGTATAGAATAACCCATTGAAATTTCTGCTGTGCGAGGGTGGTAGAAATTTACTTTTTTGGGTATATTCTTATATATATTATGTACATCGCTGTCTGAAATTTTAGTTATTTTTTGTTTTTAATAAAGACTAACACAAACTTAATGATTAAAAGTGATTGAG

(서열번호:76)

호모 사피엔스 SKAP2 3'-UTR

SKAP2-201 (SKAP2.001 ENST00000345317의 일부) GAGTCCTGGAAAAGGAAAATTCTTCTGCTTGTCTGCAAATGCTTTGGATTTAGAAGCGTCATGAAAGCACGAGTGACAGCTCCTAACCTCTCCTTGTTTTATTAAACATTACTTATCTTTGACTGTTATTTTATGCAGTCGCTCATTAAAATATTCCTCTGATGTGAAATTAAATGAAGGATATTAATGTAAATTAGATGCAACCAGTTAAGTTATACCTGTTGCTATTTTGCAAAG

(서열번호:77)

호모 사피엔스 NDUFB6 3'-UTR

NM_182739.2 AGATTATGTAAAAAGTTAAAAGGCTTATGAGCCTAAGTTTGTTCCTATATTACCATATTTACTGAATTTTCTGGAAAAGTAACTTTAATAAAGTTTAATCTCAGAAATTGTCATATCTGTTTTCAAGCATTGTACAATTTGAGACTGAGTAATTTAACAATAAGTAAAAAGTGGACATGCTAAACAAATATGAGAGACTACCTACTTTTTCTGGTCATTCTTGACTTGGAAAACGGTATGGAAAAGTATTTAGTTACATGTTTGTTTGTTTTTTTCTTACACAGTACTTACACTAATTTGGTATCAGGGTATGCAACAGTGAAATATCACAATAAACAAATGTAAGAACAAAAAAAAAAAAA

(서열번호:78)

호모 사피엔스 EFHA1 3'-UTR

EFHA1-001 ENST00000382374 TAAAAGATATAATAGTATGGCAATTATATTGTTCCAAATGTCAAAATTTGTGATTTTTTAGAAGTACTTGCTATTTATCTTCTTAAGTCTTCATTGATATTCTGTGTGAAATAAGCATGTCTTGTACTTGCTTTCTGATTCATAATTTTATTAAAGAACTTAGTAGAAAGAAAAGTAAGTATAAAAATAGATATTGGATTCTGTCAGAAGGCCTAGATTTGAAATAATGTTTTGTACTTCGGTAAGATGGAAAACTTAGTGATTCACTGATTTCTTAGACACTCTAATATGATATGCTTTCTGGAAGGATAAAACAAATACATATGGGAAAAAGTACTTGAGACCAAGGCCAGCATCAATTCCAGACATCTTCATGTTCCTAATAGGCTAAATGAAGTTAAAAACTTATTTCAGATTTTTCTCATCTGTACCTTATATCTCATAAATTTATTGCATATTTTATGTCAGTAGCTTAGCTGTTTATTGTCTTTAAAATAACATGTAAACTTCAATGTTCTATCTGGAAGCAGAATAAAATATTTACATAGA

(서열번호:79)

호모 사피엔스 BCKDHB 3'-UTR

BCKDHB-005 ENST00000356489 CCATATAGAAAAGCTGGAAGATTATGACTAGATATGGAAATATTTTTTCTGAATTTTTTTTTATATTTCCTCCGACTTACCTCTTTTTGAAAAGAGAGTTTTTATTAAGTGAACCATCACGATATTGGCTGAAAAGTTCTACATTCTATTATTGTATTGTAACACACATGTATTGATGATTTTCATTAAGAGTTTCAGATTAACTTTGAAAAATATTCCACATGGTAATCTTATAAATTCTGTTTAATTACATCTGTAAATATTATGTGTGTGATAGTATTCAATAAA

(서열번호:80)

호모 사피엔스 BCKDHB 3'-UTR

NM_001164783.1 GACCTGCTCAGCCCACCCCCACCCATCCTCAGCTACCCCGAGAGGTAGCCCCACTCTAAGGGGAGCAGGGGGACCTGACAGCACACCACTGTCTTCCCCAGTCAGCTCCCTCTAAAATACTCAGCGGCCAGGGCGGCTGCCACTCTTCACCCCTGCTCCTCCCGGCTGTTACATTGTCAGGGGACAGCATCTGCAGCAGTTGCTGAGGCTCCGTCAGCCCCCTCTTCACCTGTTGTTACAGTGCCTTCTCCCAGGGGCTGGGTGAGGGCACATTCAGGACTAGAAGCCCCTCTGGGCATGGGGTGGACATGGCAGGTCAGCCTGTGGAACTTGCGCAGGTGCGAGTGGCCAGCAGAGGTCACGAATAAACTGCATCTCTGCGCCTGGCTCTCTACCAAAAAAAAAAAAAAAAAA

(서열번호:81)

호모 사피엔스 BBS2 3'-UTR

NM_031885.3

GTGAGGAAAATACAGGTCATGAAGTTCCTGGCAAAGATTTTCTGTTAAAAACCTATGCTGGTTTGCTTTGGATCACACCCTGGTGAACCCCGGGTGCTAAGAATGAAAATAACCTTGGTGAGTTGTACAAATTAAAGACAAAGAACTACATGTGAAGATAGACTTGCTTTCTATTTTTAAATCAGTAGTAGTACTGTTGCTGAATAATACTAGGTTTTTATGGAATAGGATGAATGCTTTTGAAGTATTAGGGCTTCAGAGTCCAATTTTGCTTATTTATGGTATATAAATACATATTTTTTTCTTGAAATTGCAATTGAGTTTGTACTTTTCAAATAGATTATCTACTTTTTCATTAAAATGTAAAGATGTTAAACTTTGTGTTGATTGATTATAAAATCACCACCAAATCAG

(서열번호:82)

호모 사피엔스 LMBRD1 3'UTR

NM_018368.3

CAGCCTTCTGTCTTAAAGGTTTTATAATGCTGACTGAATATCTGTTATGCATTTTTAAAGTATTAAACTAACATTAGGATTTGCTAACTAGCTTTCATCAAAAATGGGAGCATGGCTATAAGACAACTATATTTTATTATATGTTTTCTGAAGTAACATTGTATCATAGATTAACATTTTAAATTACCATAATCATGCTATGTAAATATAAGACTACTGGCTTTGTGAGGGAATGTTTGTGCAAAATTTTTTCCTCTAATGTATAATAGTGTTAAATTGATTAAAAATCTTCCAGAATTAATATTCCCTTTTGTCACTTTTTGAAAACATAATAAATCATCTGTATCTGTGCCTTAGGTTCTCCAGAGTGATGTGGAATTTTAAAGTGTCTCTCTCTGATTGCCTCCAA

(서열번호:83)

호모 사피엔스 ITGA6 3'-UTR

ITGA6-003 ENST00000409532

TATTGATCTACTTCTGTAATTGTGTGGATTCTTTAAACGCTCTAGGTACGATGACAGTGTTCCCCGATACCATGCTGTAAGGATCCGGAAAGAAGAGCGAGAGATCAAAGATGAAAAGTATATTGATAACCTTGAAAAAAAACAGTGGATCACAAAGTGGAACGAAAATGAAAGCTACTCATAGCGGGGGCCTAAAAAAAAAAAGCTTCACAGTACCCAAACTGCTTTTTCCAACTCAGAAATTCAATTTGGATTTAAAAGCCTGCTCAATCCCTGAGGACTGATTTCAGAGTGACTACACACAGTACGAACCTACAGTTTTAACTGTGGATATTGTTACGTAGCCTAAGGCTCCTGTTTTGCACAGCCAAATTTAAAACTGTTGGAATGGATTTTTCTTTAACTGCCGTAATTTAACTTTCTGGGTTGCCTTTATTTTTGGCGTGGCTGACTTACATCATGTGTT

(서열번호:84)

호모 사피엔스 HERC5 3'-UTR

HERC5-001 ENST00000264350

CCAGCTTGCTTGTCCAACAGCCTTATTTTGTTGTTGTTATCGTTGTTGTTGTTGTTGTTGTTGTTGTTTCTCTACTTTGTTTTGTTTTAGGCTTTTAGCAGCCTGAAGCCATGGTTTTTCATTTCTGTCTCTAGTGATAAGCAGGAAAGAGGGATGAAGAAGAGGGTTTACTGGCCGGTTAGAACCCGTGACTGTATTCTCTCCCTTGGATACCCCTATGCCTACATCATATTCCTTACCTCTTTTGGGAAATATTTTTCAAAAATAAAATAACCGAAAAATTAA

(서열번호:85)

호모 사피엔스 HADHB 3'-UTR

HADHB-001 ENST00000317799

TAGATCCAGAAGAAGTGACCTGAAGTTTCTGTGCAACACTCACACTAGGCAATGCCATTTCAATGCATTACTAAATGACATTTGTAGTTCCTAGCTCCTCTTAGGAAAACAGTTCTTGTGGCCTTCTATTAAATAGTTTGCACTTAAGCCTTGCCAGTGTTCTGAGCTTTTCAATAATCAGTTTACTGCTCTTTCAGGGATTTCTAAGCCACCAGAATCTCACATGAGATGTGTGGGTGGTTGTTTTTGGTCTCTGTTGTCACTAAAGACTAAATGAGGGTTTGCAGTTGGGAAAGAGGTCAACTGAGATTTGGAAATCATCTTTGTAATATTTGCAAATTATACTTGTTCTTATCTGTGTCCTAAAGATGTGTTCTCTATAAAATACAAACCAACGTGCCTAATTAATTATGGAAAAATAATTCAGAATCTAAACACCACTGAAAACTTATAAAAAATGTTTAGATACATAAATATGGTGGTCAGCGTTAATAAAGTGGAGAAATATTGGAGAA

(서열번호:86)

호모 사피엔스 ANAPC4 3'-UTR

ANAPC4-001 ENST00000315368

TCTAGCTTGCCATTATTGTGTGTGTAATTATGGCCAAAAGGACATAGGAGATGGACTAAGATGTCTTGGACCACCTTTGTGTAACAAAGAAATAAACAGTAAATTTTATTTTTTCA

(서열번호:87)

호모 사피엔스 PCCB 3'-UTR

NM_000532.4

ACAAATCAAAGGAAAAGAAACCAAGAACTGAATTACTGTCTGCCCATTCACATCCCATTCCTGCCTTTTGCAATCATGAAACCTGGGAATCCAAATAGTTGGATAACTTAGAATAACTAAGTTTATTAAATTCTAGAAAGATCTCAAAAAAAAA

(서열번호:88)

호모 사피엔스 ABCB7 3'-UTR

ABCB7-001 ENST00000253577

GTCACATAAGACATTTTCTTTTTTTGTTGTTTTGGACTACATATTTGCACTGAAGCAGAATTGTTTTATTAAAAAAATCATACATTCCCA

(서열번호:89)

호모 사피엔스 PGCP 3'-UTR

CPQ-001 ENST00000220763

AAACAGTAAGAAAGAAACGTTTTCATGCTTCTGGCCAGGAATCCTGGGTCTGCAACTTTGGAAAACTCCTCTTCACATAACAATTTCATCCAATTCATCTTCAAAGCACAACTCTATTTCATGCTTTCTGTTATTATCTTTCTTGATACTTTCCAAATTCTCTGATTCTAGAAAAAGGAATCATTCTCCCCTCCCTCCCACCACATAGAATCAACATATGGTAGGGATTACAGTGGGGGCATTTCTTTATATCACCTCTTAAAAACATTGTTTCCACTTTAAAAGTAAACACTTAATAAATTTTTGGAAGATCTCTGA

(서열번호:90)

호모 사피엔스 NFU1 3'-UTR

NM_001002755.2

AATAATCTGGATTTTCTTTGGGCATAACAGTCAGACTTGTTGATAATATATATCAAGTTTTTATTATTAATATGCTGAGGAACTTGAAGATTAATAAAATATGCTCTTCAGAGAATGATATATAAATATTGCA

(서열번호:91)

호모 사피엔스 OMA1 3'-UTR

OMA1-001 ENST00000371226

ATTAAAATTTATGAGACACAAGATATATGAAGAATGTTGCAGTCCTTATCATTTTATGTTACTTTTTAAAAAATGATGTTTGAAGTGAAAAAAAAAAGGATATTCAGGGTCAAATCATGTACATTACAGATATTATCTAAATTCTTCTAGAATTTATTTTTCATGAAATATTGATGTATTTTAATCTATGTTAAAATATCTTCAATGAGGAAAATGTCACAGAATAAATTTATATTACACATTTTA

(서열번호:92)

호모 사피엔스 HHLA3 3'-UTR

NM_001036646.1

GGCGAATCCATAGAGTAAGCTTAGTGATGTGTGTCAGACCTCTGAGCCCAAGCAAAGCCATCATATCCCCTGTGACCTGCATGTATACATCCAGATGGCCTGAAGCAAGTGAAGAATCACAAAAGAAGTGAAAAGGGCCGGTTCCTGCCTTAACTGATGACATTCCACCATTGTGATTTGTTCCTGCCCCACCTTAACTGAGCGATTAACCTGTGAACTTCCTTCTCCTGGCTCAGAAGCTTCCCCACTGAGCACCTTGTGACCCCCGCCCCTGCCTGCCATAGAACAACCCCCTTTGATTGTAATTTTCCTTTACCTACCCAAATCCTATAAAACGGCCCCACCCCTATCTCCCTTCGCTGACACTCTCTTTGGACTCAGCCTGCCTGCACCTAGGTGATTAAAAAGCTTTATTGCTCACGC

(서열번호:93)

호모 사피엔스 HHLA3 3'-UTR

NM_001031693.2

AAAGGGCCGGTTCCTGCCTTAACTGATGACATTCCACCATTGTGATTTGTTCCTGCCCCACCTTAACTGAGCGATTAACCTGTGAACTTCCTTCTCCTGGCTCAGAAGCTTCCCCACTGAGCACCTTGTGACCCCCGCCCCTGCCTGCCATAGAACAACCCCCTTTGATTGTAATTTTCCTTTACCTACCCAAATCCTATAAAACGGCCCCACCCCTATCTCCCTTCGCTGACACTCTCTTTGGACTCAGCCTGCCTGCACCTAGGTGATTAAAAAGCTTTATTGCTCACGC

(서열번호:94)

호모 사피엔스 ACAA2 3'-UTR

NM_006111.2

AGAGACCAGTGAGCTCACTGTGACCCATCCTTACTCTACTTGGCCAGGCCACAGTAAAACAAGTGACCTTCAGAGCAGCTGCCACAACTGGCCATGCCCTGCCATTGAAACAGTGATTAAGTTTGATCAAGCCATGGTGACACAAAAATGCATTGATCATGAATAGGAGCCCATGCTAGAAGTACATTCTCTCAGATTTGAACCAGTGAAATATGATGTATTTCTGAGCTAAAACTCAACTATAGAAGACATTAAAAGAAATCGTATTCTTGCCAAGTAACCACCACTTCTGCCTTAGATAATATGATTATAAGGAAATCAAATAAATGTTGCCTTAACTTC

(서열번호:95)

호모 사피엔스 GSTM4 3'-UTR

GSTM4-001 ENST00000369836

TGCCTTGAAGGCCAGGAGGTGGGAGTGAGGAGCCCATACTCAGCCTGCTGCCCAGGCTGTGCAGCGCAGCTGGACTCTGCATCCCAGCACCTGCCTCCTCGTTCCTTTCTCCTGTTTATTCCCATCTTTACCCCCAAGACTTTATTGGGCCTCTTCACTTCCCCTAAACCCCTGTCCCATGCAGGCCCTTTGAAGCCTCAGCTACCCACTTTCCTTCATGAACATCCCCCTCCCAACACTACCCTTCCCTGCACTAAAGCCAGCCTGACCTTCCTTCCTGTTAGTGGTTGTATCTGCTTTGAAGGGCCTACCTGGCCCCTCGCCTGTGGAGCTCAGCCCTGAGCTGTCCCCGTGTTGCATGACAGCATTGACTGGTTTACAGGCCCTGCTCCTGCAGCATGGCCCCTGCCTTAGGCCTACCTGATCAAAATAAAGCCTCAGCCACA

(서열번호:96)

호모 사피엔스 GSTM4 3'-UTR

GSTM4-003 ENST00000326729

TGGTCAATTTTCTGCATCAACTTGACTGGGCTAAGGGATGCTCAGATGGCAGGTAAAATCATTGTGCTTGTGAGGGTGTTTCCAGAAGAGATTTGCCTTTGAATCAGAAGACAGCAAAGATTTCCTTCAGCAATGAAGGAGGCATCCACCAAACTGTCAGGGCCCAGAGAGAAGAAAAAGACAGGAAGGGTGAATTTGACCTCTCTGACTGGGACATCCATCTCTGCCTATCCTGGGACCTCCACACTCCTGGTTCTCTGGCCTTCAGACTTGATCAGGGACTAACACCATCGCCTCCCACCCCCACCTTTGTTCTGAGGCCTTTAGCCTCTGAATGATACCACTGGCTTTCCTGCTTCTCTATCCTGCAGTCGGCAGATCATGGGACTTCTTCACTCCAAAATTGTGTGAGCCAATTCCCATAACAGATAGATAAATTTATAAATAAACACACAAATTTCCTAC

(서열번호:97)

호모 사피엔스 ALG8 3'-UTR

NM_001007027.2

CTGAAACCTCCGCCTCCCAGAAAAGAAAAACCTCTTTTTAATTGGATGGAAACTTTCTACCTGCTTGGCCTGGGGCCTCTGGAAGTCTGCTGTGAATTTGTATTCCCTTTCACCTCCTGGAAGGTGAAGTACCCCTTCATCCCTTTGTTACTAACCTCAGTGTATTGTGCAGTAGGCATCACATATGCTTGGTTCAAACTGTATGTTTCAGTATTGATTGACTCTGCTATTGGCAAGACAAAGAAACAATGAATAAAGGAACTGCTTAGATATG

(서열번호:98)

호모 사피엔스 C11orf74 3'UTR

TTCACAGAGGCATTTTGTGTGTGTGTGCTTATTTTAATTTTGTTCTTATTCTAGCAACATTAGAATAAAAGATAAACCTACTATAATTCCCTTTGTGGAAATTTAAAAAAAAAAAAAAAAAA

(서열번호:99)

Mus musculus Ndufa1 3'-UTR

Ndufa1-001 ENSMUST00000016571

GGAAGCATTTTCCTGGCTGATTAAAAGAAATTACTCAGCTATGGTCATCTGTTCCTGTTAGAAGGCTATGCAGCATATTATATACTATGCGCATGTTATGAAATGCATAATAAAAAATTTTAAAAAATCTAAA

(서열번호:100)

Mus musculus Atp5e 3'-UTR

NM_025983

CTGAATCTGAAGCCTGAAGTGCTGAGTCTTGAAGGTGAAGCATGTGGGCCCCTGTTCTGGCAGATGGAAATCAACCTCACCTCCTGGGGGACAGGCTGCCCATCTCGTTGATAAATTGACTATGCCAATAAATTAACATGGTTCACTTTCAAAAA

(서열번호:101)

Mus musculus Gstm5 3'-UTR

NM_010360

GCCAGAGCTCGCTGCTGCTGAGCCATCTTGCCCTGAGGGGCCCACACTCTTAGCTCACTGTCAGTCTTGTTCCATCCTGTCCTGAGGGCCCCCACTCTGTCTCCTCTGCTCTTTCTAATAAACAGCAGTTGCATTA

(서열번호:102)

Mus musculus Uqcr11 3'-UTR

NM_025650

GCAGCCCCTCCCCCACCACAGGCCTCGATGGTACCATGTGCCGAGGCCTCAGACACAGCGTAGTCCTGTGGAAGACACTGAGGAAGCTGGACACTGGAGAGGTCTGCACCGCTCAGGGAGCTTCCATGTTGACAGACACTAGGGCTGCCTTGATGGGTGCAGCATTAAACCTTATTCTTATGCCTTGGA

(서열번호:103)

Mus musculus IFi27I2a 3'-UTR

IFi27I2a-001 ENSMUST00000055071; NM_029803

GCTTAGGAGATGACACTTCTATCAGCTCAACTCAAAGCCTGTACAGACTACGCAGGAGATGAAGTTCCAAAAGGCACCTTCAGAACCCTCACTGATGTCAAAGAATGATGAAAACAACAAAGTATATGGGCTGGTGTTCCTAA

(서열번호:104)

Mus musculus Cbr2 3'-UTR

NM_007621

TCTGCTCAGTTGCCGCGGACATCTGAGTGGCCTTCTTAGCCCCACCCTCAGCCAAAGCATTTACTGATCTCGTGACTCCGCCCTCATGCTACAGCCACGCCCACCACGCAGCTCACAGTTCCACCCCCATGTTACTGTCGATCCCACAACCACTCCAGGCGCAGACCTTGTTCTCTTTGTCCACTTTGTTGGGCTCATTTGCCTAAATAAACGGGCCACCGCGTTACCTTTAACTAT

(서열번호:105)

Mus musculus Atp5l 3'-UTR

Atp5l-201 ENSMUST00000043675

AGACCAATCTTTAACTTCTGATTTGAGTTCTTATTTGAATGTTCTTGGACCATGTGTAACAGGACTGCTATCTGAATAAAATACTAGGTGTTGAAAACACTGCTGTGTTTTCTCTGTC

(서열번호:106)

Mus musculus Tmsb10 3'-UTR

NM_025284

AAGCCTAGGAAGATTTCCCCACCCCACCCCACCCCGCCCCATCATCTCCAAGACCCCCTCGTGATGTGGAGGAAGAGCCACCTGCAAGATGGACGCGAGCCACAAGCTGCACTGTGAAACCCGGGCACTCCGAGCCGATGCCACCGGCCCGCGGGTCTCTGAAGGGGACCCCTCCACTAATCGGACTGCCAAATTTCACCGGTTTGCCCTGGGATATTATAGAAAATTATTTGTATGATTGATGAAAATAAAAACACCTCGTGGCATGGTT

(서열번호:107)

Mus musculus Nenf 3'-UTR

NM_025424

TGTCTAGCTGAGAAGCAGCCGGTTCTAGGGAGAAGTGAGGGGACAGGAGTTAAGTGTCCCTCGGAACAAGCGGAGGAAGCCTCCGAGTGCCCTGCAGCTGAATAAAGCGAATGTTT

(서열번호:108)

Mus musculus Atp5k 3'-UTR

NM_007507

GGCGTCAGCGAGCTTGCTTTTCTCTAGTCGTTGAGAACGAATAAAGCTTCATTGTGTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:109)

Mus musculus 1110008P14Rik 3'-UTR

1110008P14Rik-001 ENSMUST00000048792

GTGCCGGGAGCCCCCATCCAGGCCCTACCCTCACCTCTCTAGGCCATGTTCTGGCCTGGGTAGATACTACTTGGCTTAGACACCATCTCGGGTACTGGCCTCCAGATCCTAGTGGGTCTACCAGCCTGGACCAGTCCCCATTCACTGCCCATCACCCTTCCTGGAGTCAGGTGCAATCCTACAGTTCTCCCACTTGTCTGTCTTCTTTCCCCTCCATCCAGACTGAGAGTCCGAATTAAAGATGTCTCCCACACCACTGC

(서열번호:110)

Mus musculus Cox4i1 3'-UTR

NM_009941

GAGCCCGCTGCCTGCCGGCTCCCTGCCTCCCTCACTCCCTCGGCATGCTGGAAGCTGCCGTATCCAATGGTCCATGCTAATAAAAGACCAGTTTACGTGGTG

(서열번호:111)

Mus musculus Cox6a1 3'-UTR

NM_007748

AGAGAACCTGGCCTCCCCCAGGCAACAAAGGGACCACAGCACTGGTTTTGGACCCTTACTCTGTGTGGACCACGAAAACCCTTTGGATGCTAAGCTCGTGTCTCCTTTCCTCAGATGGCGACCATTACTCTGATCTTCCATCCCTTCTGCTTGTAAGAGGAGATGCCTTAAATAAATAACTTAAACTCA

(서열번호:112)

Mus musculus Ndufs6 3'-UTR

NM_010888

TGTGGGCTGTGTCCTGGTCCTCTGACTCCTATGGAACATCTCCACGCTGGGTGTTCTGTGTGAGGCCACTGCTCTGTGAATGGTGTCCCTTGTTTTGAATAAAGGATGCTCCCACCATGAAAAAAAAAAAAAAAAAAAA

(서열번호:113)

Mus musculus Sec61b 3'-UTR

NM_024171

ATTGGGCTACATCCATCTGTCATCTGAAGAAGAAGAAGAAGGAAAAAAACCCAACATATCTTGGACCAAAAGTGTAGTGATTTTCTGTTCACGTGTATTATTTTACAGAGAATAAGAATTGACTTTGAGAAATCAGTTTTTTCTATGGCTAATAAACTTTGGAATTGCTTT

(서열번호:114)

Mus musculus Romo1 3'-UTR

NM_025946

TTAGGGCTAGGATGCCCTGCAATACCTAAACTTCCCCATCCATTTCGACCCTTGTACAATAATAAAGTTGTTTTCTTCTCGTTAAAAAAAAAAAAAAAAAA

(서열번호:115)

Mus musculus Gnas 3'-UTR

NM_010309

GAAGGGAACACCCAAATTTAATTCAGCCTTAAGCACAATTAATTAAGAGTGAAACGTAATTGTACAAGCAGTTGGTCACCCACCATAGGGCATGATCAACACCGCAACCTTTCCTTTTTCCCCCAGTGATTCTGAAAAACCCCTCTTCCCTTCAGCTTGCTTAGATGTTCCAAATTTAGTAAGCTTAAGGCGGCCTACAGAAGAAAAAGAAAAAAAAGGCCACAAAAGTTCCCTCTCACTTTCAGTAAATAAAATAAAAGCAGCAACAGAAATAAAGAAATAAATGAAATTCAAAATGAAATAAATATTGTGTTGTGCAGCATTAAAAAATCAATAAAAATTAAAAATGAGCAAAAAAAAAAAAAAAAAA

(서열번호:116)

Mus musculus Snrpd2 3'-UTR

NM_026943

AGCCTGCTCCCTGCCCTGCGAAGGCCTGCAGAACCCTGCCCAGTGGGCGAGAAATAAAACCCTGTGCTTTTTGGTTAAAAAAAAAAAAAAAAAAAA

(서열번호:117)

Mus musculus Mgst3 3'-UTR

NM_025569

GGTGTGGAGGGCCTTCCGACTCTCACTCACCTCCAGCGACTCACCCTGATTTCCAGTTGCACTGGTTTTTTTTTTTTTTTTAATATAATAAAAACTTATCTGGCATCAGCCTCATACCT

(서열번호:118)

Mus musculus Aldh2 3'-UTR

NM_009656

AGCGGCATGCCTGCTTCCTCAGCCCGCACCCGAAAACCCAACAAGATATACTGAGAAAAACCGCCACACACACTGCGCCTCCAAAGAGAAACCCCTTCACCAAAGTGTCTTGGGTCAAGAAAGAATTTTATAAACAGGGCGGGGCTGGTGGGGGGGAAAGCTCCTGATAAACTGGGTAGGGGATGAAGCTCAATGCAGACCGATCACGCGTCCAGATGTGCAGGATGCTGCCTTCAACCTGCAGTCCCTAAGCAGCAAATGAGCAATAAAAATCAGCAGATCAAAGCCACGGGGTCAGTTCTCT

(서열번호:119)

Mus musculus Mp68 (2010107E04Rik) 3'-UTR

NM_027360

CTGCTCCGAATCCACAAGATGAAGACGTCGGCTAAACTTGAGCAAGCTTTGTTAGATGGGAACATGGAACATCACTGTACACTTATCTAAGTACCATTTATAATGTGGCATTAATAAATGTATCTGTGAATACC

(서열번호:120)

Mus musculus Ssr4 3'-UTR

NM_001166480

GGGCAGCAACTTCAGCCGTCCATTGCTTCTTTCAATAAACAGTCACTATTTGACATGAGTACATTCAAGAAAAAAAAAAAAAAAAAA

(서열번호:121)

Mus musculus Myl6 3'-UTR

NM_010860

GGACATTCTGTATCCCGAGTCTGTTCCTTGCCCAGTGTGATTTCTGTGTGGCTCCAGAGGCTCCCCTGTCACAGCACCTTGCCCATTTGGTTTCTTTTGGATGATGTTTGCCTTCCCCAAATAAAATTTGCTCTCTTTGCCCTCCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:122)

Mus musculus Prdx4 3'-UTR

Prdx4-001, NM_016764

AAAGTACTTCAGTTATGATGTTTGGACCTTCTCAATAAAGGTCATTGTGTTATTACCA

(서열번호:123)

Mus musculus Ubl5 3'-UTR

NM_025401

AGGGGGATTCCTTCTCCTCCTCGCCCTGCTCTGCCCTGCCCTCCTCTCCCATCCTCATCTGACACTGGTGTAGATGGTCATTTTTAACAGTTCACATGAATAAAAACTTGGCTGCTGCTTTGCTGCTGTC

(서열번호:124)

Mus musculus 1110001J03Rik 3'-UTR

NM_025363

TGCAGAGAGTCCTCAGATGTTCCTTCATTCAAGAGTTTAACCATTTCTAACAATATGTAGTTATCATTAAATCTTTTTTAAAGTGTG

(서열번호:125)

Mus musculus Ndufa13 3'-UTR

Ndufa13-201 ENSMUST00000110167

GGCCTGAGCCAACGCACATAATAAAGAGTGGTC

(서열번호:126)

Mus musculus Ndufa3 3'-UTR

NM_025348

ATGCCTCTGCTGATGGAAGAGGCCCCTTCCCTGTTGCTCTCCAATAAAAATGTGAAAACTAATAACCCC

(서열번호:127)

Mus musculus Gstp2 3'-UTR

NM_181796

TGGACTGAAGAGACAAGAGCTTCTTGTCCCCGTTTTCCCAGCACTAATAAAGTTTGTAAGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:128)

Mus musculus Tmem160 3'-UTR

NM_026938

ACAACAGGGCTGTGGGGACTGGCTGGGCCTGACGACTGGGACATTAAAACCTGACCCTTCCGCAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:129)

Mus musculus Ergic3 3'-UTR

NM_025516

CTCTCTCCCTTCCCCACAGCTTGTCCTGCCCTCTCTTCCCCTGTGGGTTTACCCTCCAGCCTGTCAACTACCCATATCCTCTCCTCAGCCAGCCCAGCCCAGGGCAATAAATATGAATTGTGATAGGAA

(서열번호:130)

Mus musculus Pgcp 3'-UTR

NM_018755

GGAGAACAAGAAGAGAGGACCTTGTTCTCTGTAGTTGGGAATCCCAACTCTGAATCTTTACAACATCCATCGTCACAAAAGAGTGTTATACATTTAATCCACAGGGCATAGTTTTCTTTATACCTTCTGTTAATCATCTTTCCTTAATACTTTCTTATCTGTTTCTAGAATAAATCATGATCCCTACTGCACCACCTTGAAAATGTTGTTTCCAGTTTTAAAATAAGCAATAAATATTTGAAATGCTTCTGATTTTTCATTTTCATTTAAAAACATTAAATTAAATGTAATGAGA

(서열번호:131)

Mus musculus Slpi 3'-UTR

NM_011414

GCCTGATCCCTGACATTGGCGCCGGCTCTGGACTCGTGCTCGGTGTGCTCTGGAAACTACTTCCCTGCTCCCAGGCGTCCCTGCTCCGGGTTCCATGGCTCCCGGCTCCCTGTATCCCAGGCTTGGATCCTGTGGACCAGGGTTACTGTTTTACCACTAACATCTCCTTTTGGCTCAGCATTCACCGATCTTTAGGGAAATGCTGTTGGAGAGCAAATAAATAAACGCATTCATTTCTCTATGCAAAAAAAAAAAAAAAAAAA

(서열번호:132)

Mus musculus Myeov2 3'-UTR

NM_001163425

GGCCGCCCGGTCCTATGTGCTCCATGTCTGTGATGTGTCTGGAGTCTCTCGGGACACGACCAGCTGATTGTAGACACCGTGTTGATATCACTAGAAATGAAGACCTTGTCAACCAATAGAGGAACTGTCTGAACCAACTGGGTACTGATGTCTCTGGGAATGCCAGCCCGTGTCCTTGTTTAAGTTAATAAAGAACACTGTAACACGCAGGGTGATTTTAAAAAAAAAAAAAAAAAAAAAA

(서열번호:133)

Mus musculus Ndufa4 3'-UTR

NM_010886

ACTATGAAGTTCACTGTAAAGCTGCTGATAATGAAGGTCTTTCAGAAGCCATCCGCACAATTTTCCACTTAAGCAGGAAATATGTCTCTGAATGCATGAAATCATGTTGATTTTTTTTTTTTTTGGAGTTTATTACACTGATGAATAAATCTCTGAAACTTG

(서열번호:134)

Mus musculus Ndufs5 3'-UTR

NM_001030274

GCGGGGCAGCTGGAGGCCGCTGTCATGCTCTGTTTTCCCCTGGAGAGAATATTTAAGGAAAGCTCCTTCATTAAGTATTAAGTATGTGGAAATAAAGAATTACTCAGTCTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:135)

Mus musculus Gstm1 3'-UTR

NM_010358

GCCCTTGCTACACGGGCACTCACTAGGAGGACCTGTCCACACTGGGGATCCTGCAGGCCCTGGGTGGGGACAGCACCCTGGCCTTCTGCACTGTGGCTCCTGGTTCTCTCTCCTTCCCGCTCCCTTCTGCAGCTTGGTCAGCCCCATCTCCTCACCCTCTTCCCAGTCAAGTCCACACAGCCTTCATTCTCCCCAGTTTCTTTCACATGGCCCCTTCTTCATTGGCTCCCTGACCCAACCTCACAGCCCGTTTCTGCGAACTGAGGTCTGTCCTGAACTCACGCTTCCTAGAATTACCCCGATGGTCAACACTATCTTAGTGCTAGCCCTCCCTAGAGTTACCCCGAAGGTCAATACTTGAGTGCCAGCCTGTTCCTGGTGGAGTAGCCTCCCCAGGTCTGTCTCGTCTACAATAAAGTCTGAAACACACTTGCCATGAAAAAAAAAAAAAAAAA

(서열번호:136)

Mus musculus 1810027O10Rik 3'-UTR

1810027O10Rik-001 ENSMUST00000094065

AGTCTCTTGTTTAAGCGCCCAGTCCTGGCCTTTCTGGGTAATTGGGCGCAGAGGGAAGGAGCCAATGTTGAAGCAGAAAAGAAATTAAAAGAAAAAGGCATATAAAGAA

(서열번호:137)

Mus musculus 1810027O10Rik 3'-UTR

BC117077

AGTCTCTTGTTTAAGCGCCCAGTCCTGGCCTTTCTGGGTAATTGGGCGC

(서열번호:138)

Mus musculus Atp5o 3'-UTR

NM_138597

GAGACTGTCACCTGTGTGAGCTCTTGTCCTTGGAGCAACAATAAAATGCTTCCTG

(서열번호:139)

Mus musculus Shfm1 3'-UTR

NM_009169

CATCTGGGAATGTCCCAGGAACCTCAATCATGGACTCTACCACAGTCTAGGACAGAGAAAGCAGGACGGGATACTTTAAAGAACATGTTTATTTCATTATCTGCTTCAATTTATTTTTGTTTTATAACAAAAAAAATAAGTAAATAAATGTTTTGATTTAATCTTTTTGGTTCA

(서열번호:140)

Mus musculus Tspo 3'-UTR

NM_009775

AGGCACCCAGCCATCAGGAATGCAGCCCTGCCAGCCAGGCACCATGGGTGGCAGCCATCATGCTTTTATGACCATTGGGCCTGCTGGTCTACCTGGTCTTAGCCCAGGAAGCCACCAGGTAGGTTAGGGTGGTCAGTGCCGAGTCTCCTGCAGACACAGTTATACCTGCCTTTCTGCACTGCTCCAGGCATGCCCTTAGAGCATGGTGTTTTAAAGCTAAATAAAGTCTCTAACTTCATGTGTAAAAAAAAAAAAAAAAA

(서열번호:141)

Mus musculus S100a6 3'-UTR

NM_011313

AATGGGACCGTTGAGATGACTTCCGGGGGCCTCTCTCGGTCAAATCCAGTGGTGGGTAGTTATACAATAAATATTTCGTTTTTGTTATGCCT

(서열번호:142)

Mus musculus Taldo1 3'-UTR

NM_011528

TGCAACACCCGAGGCCCCAGTCCTGCACCGAGGCTGACCCCAGACCTGCACTGCCTTTGAGCTGGGTCCTAATTGCACATGGCTTGTGACGAATGAATCTTGCATTTTTTAGTGATCGGAGAAGGGATGGATCATAGGATTCTGATTTTATGTGAAATTTTGTCTAATTCATTAAAGCAGTTGCTTTTCCTATGCTGTTT

(서열번호:143)

Mus musculus Bloc1s1 3'-UTR

NM_015740

ACTAAAACCCACCCCTCTTACTTCACCCTCCTGGACAGGAGGGAAACTGGTGAGCCACGAATAAAAACACAAGCTTCCATTCT

(서열번호:144)

Mus musculus Ndufb11 3'-UTR

NM_019435

TGGCTTACCGAGCAGGGCCTAAGAAGCATTACTCATCCGCTGCTTGTTATTTACCTGGTTCCTCAGAACACCTTATTAAAGGAATTGAAAGTA

(서열번호:145)

Mus musculus Map1lc3a 3'-UTR

NM_025735

GTCAAGAGGAGGGGAGGGGGGTGGCTGGGAGTTCTGGTCAGGTTCTCCCCAGGGAGGTCCTGGCTCCTAAACTAAGCTATTTCAGTCCCCAGTGGATTAGGCAGAGATGTGACACCCACTCCCCCCCCCAGGTAGGGGCCACCAGCCAGCCTACCACATCCTGGGTAGGTCCTGGGCCAGTCATGTTCGGGTTGCTCTTTTGGGTGCTGGCTGGGTTGGGAGTGGGTGGGGAGCAGCATCCCTGCTCTGTGGGGTTTGTCATTTTGTTAGGCCCTTGCCTGTCTGCCCATCTTGCCCCTCATCCACCTGAGGCTTTGCCTCCTGCCAGGACCTGCCCCACCCCTGAAAGGCTGGCTCCCCTTGTCCTGACTCGGTGTATGGATCTGTGGTCATTTCCTCTGCAGAAAGAATAAAGACTGCTCAGGCCTGCCTGGCCAAAAAAAAAAAAAAAAAA

(서열번호:146)

Mus musculus Morn2 3'-UTR

NM_194269

ACCTGCTGCCTTAACGCTGAGATGTGGCCTCTGCAACCCCCCTTAGGCAAAGCAACTGAACCTTCTGCTAAAGTGACCTGCCCTCTTCCGTAAGTCCAATAAAGTTGTCATGCACCCACAAAAAAAAAAAAAAAA

(서열번호:147)

Mus musculus Gpx4 3'-UTR

NM_008162.2

CTAGCCCTACAAGTGTGTGCCCCTACACCGAGCCCCCCTGCCCTGTGACCCCTGGAGCCTTCCACCCCGGCACTCATGAAGGTCTGCCTGAAAACCAGCCTGCTGGTGGGGCAGTCCTGAGGACCTGGCGTGCATCCCTGCCGGAGGAAGGTCCAGAGGCCTGTGGCCCTGGGCTCGAGCTTCACCCTGGCTGCCTTGTGGGAATAAAATGTAGAAATGTGAAAAAAAAAAAAAAAAA

(서열번호:148)

Mus musculus Mif 3'-UTR

NM_010798.2

GTCCTGGCCCCACTTACCTGCACCGCTGTTCTTTGAGCCTCGCTCCACGTAGTGTTCTGTGTTTATCCACCGGTAGCGATGCCCACCTTCCAGCCGGGAGAAATAAATGGTTTATAAGAGACCA

(서열번호:149)

Mus musculus Cox6b1 3'-UTR

NM_025628

CCTGGCTCCGCCCACCTCTCCTCTGTTCTTTGTCTTTCTCCCCGGATAGAAAAGGGGGACCTCAGCATATGATGGTCCTTACCCTGGGACCCTGAATCATGATGCAACTACTAATAAAAACTCACTGGAAAAGTT

(서열번호:150)

Mus musculus RIKEN cDNA2900010J23 (Swi5) 3'-UTR

NM_175190

GCAGCTTCTTGGAGATTTTCATCTACAGCCCACAGGGACAGGAGGATGGGGGCATAAAAGGCAGAGTCTAGACAGTATGTTCATATGGTTTTCAGATTTTAAAAGATGCTAGAAGCCCTCCAAAGTTTGGGGTGGGTTCTAGAGAAGAGGAGTATTGGGAGGGGTGGGTATTGTCAATGTTAAGGTTCCTAAACATACTTGTGAGTAGGTGTGTGTGGTTGTCCCTTTTGTTAATAAACATATGAGCAGTCAAAAAAAAAAAAAAAA

(서열번호:151)

Mus musculus Sec61g 3'-UTR

NM_011343.3

GTCCTTCTCATCATGGGACGAGTGAGCCAGAGCGGGGGAAAGGGCATGAAGTAAAGCGTTGCCTGAATGCTGTGTGGTGTTTTGTTTCTTCCTCCTTCCTATGAGGTTTTCTACTTCTCAATTAAAATAATTTCAAAATAAACACTTTTTCCATAACAGA

(서열번호:152)

Mus musculus 2900010M23Rik 3'-UTR

BC_030629

CCGTGGGGTCTGATACTCATCAATAAAACTGCCTGGTTTCTCCCACAAAAAAAAAAAAAAAA

(서열번호:153)

Mus musculus Anapc5 3'-UTR

Anapc5-201 ENSMUST00000086216

CCAGGACTCCCTGCTTGATGGTGTGCATTTAGGGGTGGGTCATTACATGCTATCTTGTCAATAAACTGTTCTGATCAGTTTGTCTGAAGTGGGTTTTTTTTTATTTTTCTGGGTTGAATTGTCAGTATCTTTGTTAAGAACTGTGTATCTAGGGGCTGGAGAGATGGCTTAGCAGTTAAGAGCACTAACTGTTCTTCTAAAGGACCTGGGTTCAATTCCTAGCACCCTCATGACAGCTCACAGCTGTCTGTAACTCCTGTTCCAGGGACTCTGACACCCTCAGGCAGACATAAAAGCAGTCAAAACACCGATGTACATAAAATTAAAATAAATTATTT

(서열번호:154)

Mus musculus Mars2 3'-UTR

BC132343.1 GAACTCAGCTCTTACTGACTGGTAGTAAAAGATCAAATGTATTCTTTTTGCGTTTTTAAGTAAAGTCATGC

(서열번호:155)

Mus musculus Phpt1 3'-UTR

NM_029293 AGCTCTGCCCCACCCCCCACCCCCCGGACTAAGTCAGGTCTCTGCTCTTGCTGTGTTCTGTTTTGAGGGGCTGGCCCTGTGCTTTCCTTTTGTACCTTAGGCAGCATAGCACCTGCCAGGCCTTAGAGGCCAGACCAATCTGGTCCATAGGAATTAAAAGCATTGATATGCCTACT

(서열번호:156)

Mus musculus Ndufb8 3'-UTR

NM_026061 GGAGGCTTGATGGGCTTTTTGCCCTCGTTCCTAGAGGCTTAACCATAATAAAATCCCTAATAAAGC

(서열번호:157)

Mus musculus Pfdn5 3'-UTR

NM_027044 GAGTGCACTGCAGAAATGAAGCAGAGTGAGGGACCCTTCTTCAAGGGGCCTGGGACTTTTTCCGGCAATGGCCTCCTGGGAAAGTGGCCTGGGAAGAGAGTGTTTTGTGTTTAATGTTAATAAATGTGACCGCTGCGCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:158)

Mus musculus Arpc3 3'-UTR

NM_019824 GAGGAGCCTGGGCAGCACCATCACGTGGAGACACATCATAGGACACACAGGCCAATGTGTCTGTTCATACCTACCGTATCAAGGAGAGAAGAGAGCCTGTCTTTGCTGGAAAAGCTCTTGGTCAAGAATTGGGAGGGTGGGTGTTGGGCGATTTCGATTTTTGGCAGTTTTAAGCTGGTACTTAATATATAATAAATGTCACTGCTTATGTTAGACATTGAATTAAAACATTTTTGAGAAAAAGCTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:159)

Mus musculus Ndufb7 3'-UTR

NM_025843

GGATTACCCGCCAGCCTGTGGACCTATCAGTGAAATAAAAGCTTTGGGTCACCTGCCT

(서열번호:160)

Mus musculus Atp5h 3'-UTR

NM_027862

AGCAGCCTGGGACGGAGCCCCGGCCGACATGAAATAAAACATTTAAATAGT

(서열번호:161)

Mus musculus Mrpl23 3'-UTR

NM_011288 CCTATGACAGCAGGATTTGGACCACAGACCCTAGTGAGCACAGTGGTTCTGACAAGCCCAAATAAAAATTCTTTGTGGAG

(서열번호:162)

Mus musculus Tomm6 3'-UTR

NM_025365.3

CCAGAGAATGGAACTCCTGTGTATTCAGACTTTCCAAAGACAGCCTACTGTCTGTGACCACAAGATCCTACCTGAGTGGCAGCTGAAGTTGACTCCCTCTCCTTGCCTGAACCCCCCCCCACTGCCCCCCCATCCCCCAGTGTCGGCTGAGATGTTGCCTCTGCACGGTTCTGTGTGCAGTTCCCAACTTTCTGCAGAAGATGGTCCTTGCCCTTGTCCTGAAGAGTAGTAATGGTTCTTGAAAAAGATTTCAAATAAAGCCTGCACATAAAAGACAGGTATTTTATTCTTTTAATAAGAAACTTATTACAAAAACAAGGTGTAAAAAGTCCGCTTACAAAAATCAAATAAACATGACTTGTATTTCAAAAAAAAAAAAAAAAAAAA

(서열번호:163)

Mus musculus Tomm6 3'-UTR

Tomm6-002 ENSMUST00000113301

CCAGGTGAGAGCAGTTCTCCTGTGTTTCCCCGTTTCTGATGCTGTTATCTGCTTACAGAGAATGGAACTCCTGTGTATTCAGACTTTCCAAAGACAGCCTACTGTCTGTGACCACAAGATCCTACCTGAGTGGCAGCTGAAGTTGACTCCCTCTCCTTGCCTGAACCCCCCCCCACTGCCCCCCCATCCCCCAGTGTCGGCTGAGATGTTGCCTCTGCACGGTTCTGTGTGCAGTTCCCAACTTTCTGCAGAAGATGGTCCTTGCCCTTGTCCTGAAGAGTAGTAATGGTTCTTGAAAAAGATTTCAAATAAAGCCTGCACATAAAA

(서열번호:164)

Mus musculus Tomm6 3'-UTR

CCAGAGAATGGAACTCCTGTGTATTCAGACTTTCCAAAGACAGCCTACTGTCTGTGACCACAAGATCCTACCTGAGTGGCAGCTGAAGTTGACTCCCTCTCCTTGCCTGAACCCCCCCCCACTGCCCCCCCATCCCCCAGTGTCGGCTGAGATGTTGCCTCTGCACGGTTCTGTGTGCAGTTCCCAACTTTCTGCAGAAGATGGTCCTTGCCCTTGTCCTGAAGAGTAGTAATGGTTCTTGAAAAAGATTTCAAATAAAGCCTGCACATAAAA

(서열번호:165)

Mus musculus Mtch1 3'-UTR

NM_019880 CCTAAGCTGCCCGACCAAACATTTATGGGGTCTTAGCCTACCCCTGGTGAGGACCCATCATCTCAGATGCCCAAGGGTGACTCCAGCCCAGCCTGGCTTCATGTCCATATTTGCCATGTGTCTGTCCAGATGTGGGCTGGTGGAGGTGGGTCACCTGGGACCTGGGGAAGCCTGGGGGAGCAGTGTTGGGGTGGCATCCCCTTCCTGCCTAGAGGTACTGGAGTCCATCTTGTACTCAGGCAGAGGCAGGCTGCAGAGGCAAACGTCACTCAGTGGCAAGGCTTCCCTGCACCTCTAGCCCAGCTCATCCTGCCAGTCAGCCAGAAGCACCCCCGCCCCCCACTTCCTGCTTTGTAAATTGGGCGCCATCACACCTGGGCCATGGGAGGCTGGAGCTATGTTCCCAACACTAATTTTCTTATACAAGGGTGGTGCCTTCTCCTGAATAGGAAATCATGTTCTCCTCAGACCATCCCCTCATCTGCTTGTCTGTGCTGGTGACGCCAGGTGTGAGGGTTCAGTCACTGTGCTGGGTGCGAATACGCACAGGTTACATAGGCCGACATCTAGTCCTCCCCTCGTGGTAAGATAGACCCATCTCCTCGAATAAATGTATTGGTGGTGATTTGGA

(서열번호:166)

Mus musculus Pcbd2 3'-UTR

NM_028281 TCTGCGCCTGCCTTGTCTGCAGCGTTGTTTGCAAGCCACTTATGTTAATAAATTGTCATAAAGTAGTTCATAGTTACATGTATACATTGTTGTATGATTGATGCTCAAATACAGAATGATTTGAAGCCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:167)

Mus musculus Ecm1 3'-UTR

NM_007899 GTCACCCTGAGCCTCAGAGGATTAGATGGGGGAACTCCGCCCTACTCCACCCTCCTCGAACACTCATTACAATAAATGCCTCTTGGATTTGGC

(서열번호:168)

Mus musculus Hrsp12 3'-UTR

Hrsp12-001 ENSMUST00000022946 CTATAAGTAGCCATGCTGATGTTGACTCCGGAGGTTTTAGAATGTCTTTCACACTTTAATTTTTACAAATGATGCTGGGAAGTATAAAAATGACCAGAGTGGTTGAAGTTATTGTGGAAGTGATCAAATATGTGGAGATTTGACATTAATTGGAGATTATTCAGTATAGTGACTGATGTTCTAATTTCACTTATGTTGCTGGGTGTGAGAGAAGAGGTGCACAGCTACTGAGATGGGAAGCAGAAGGAAAGATGGGCTGTTGTACATGAGAAATAGTAAGGAGCACATCTACTTAAATCATATTAATTTGCTCATGTGAAATACTTAGTTCTTATGTTAGATATAAGAAACTAAATTGAAATATTCAAACTTGAATAGTACCAGGAGAACAAGTGGACCAAAATCTTATACAGATAATATTACTTTAATTGAAATAAAAAATAGATGTGTAACTTTCC

(서열번호:169)

Mus musculus Mecr 3'-UTR

NM_025297 TTGCTCCAGAGGACCAGGAGGAAAGCAGGAGAGGCAAGACTGGCTGTCTGCTGGCCCCTCCATGAGAACCCCAGCCTTCCCAGACTGCCTCACCCATATTGTCTCTTCCTACCAGGAGGGTGGGGGACCAACTCTAGGCTCCCTAATAAACCCTTAACTTCCCGAGTGGAGGATGAAGAGTAC

(서열번호:170)

Mus musculus Uqcrq 3'-UTR

NM_025352 ACGGCCTGCACCTGGGTGACAGTCCCCTGCCTCTGAAAGACCCTTCTCTGGGAGAGGAATCCACACTGTAGTCTTGAAGACAATAAACTACTTATGGACTTCCCTTTGAAAAAAAAAAAA

(서열번호:171)

Mus musculus Gstm3 3'-UTR

NM_010359 GCCCCTGCCATGCTGTCACTCAGAGTGGGGGACCTGTCCATACTGCGGATCCTGCAGGCTCTGGGTGGGGACAGCACCCTGGCCTTCTGCACTGTGGCTCCCGGTTCTCTCTCCTTCCCGCTCCCTTCTGCAGCTTGGTCAGCCCCATCTCCTCATCCTCACCCCAGTCAAGCCCATGCAGCCTTTATTCTCCCCATTTTTTTTTCACATGGCCCCTTCTTCATTGGTGCCCAGACCCAACCTCACAGCCCTTTTCTGCAATCTGAGGTCTGTCCTGAACTCAGGCTCCCTAGAGTTACCCCAATGGTCAACACTATCTTAGTGCCAGCCCTCCCTAGAGATACCCTGATGGTCAATACTATCTTAGTGACGGCCCTCCCTAGAGTTACCCTGAAGGTCAATACTCGAGTGCCAGCCTGTTCCTGTTTAAGGAGCTGCCCCAGGCCTGTCTCATGTACAATAAAGCCTGAAACACACTTGAAACACAATAAACACTGAACACTTGCTGTGA

(서열번호:172)

Mus musculus Lsm4 3'-UTR

NM_015816 TCACTCCCTGCCTGAGCCGAGCCCAGAACGGTGGGTGAGGCCTCAGGGCACCTTTGTGTGAAGCCCCACTTGGCGTCTGGTCCAGTGAAGTCCCTCGCTGGCCACTGACTCAGTTTCTGGAAGGTTCCGAGTCTGAGGTGCCTGTGGAGCCTTAGATGCCCTTTGAAGGGCTGACTTCTTCCAGGCATGTTTGAGTTTCAGTTGGAGCTGCAGGCTCAGCCCATGGCGGCTCACCTGTCCTTTACCAGCCATACCCTGTACATCTTCTGTTTGAAAAATAAAAGCAAACACCATAGAAAGAAAAAAAAAAAA

(서열번호:173)

Mus musculus Park7 3'-UTR

NM_020569 AGCCCAAGCCCTGGGCCCCACGCTTGAGCAGGCATTGGAAGCCCACTGGTGTGTCCAGAGCCCAGGGAACCTCAGCAGTAGTATGTGAAGCAGCCGCCACACGGGGCTCTCATCCCGGGTCTGTATGTTTCTGAACCTTGCTAGTAGAATAAACAGTTTACCAAGCTCCTGCCAGCTAAAAAAAAAAAAAAAAAA

(서열번호:174)

Mus musculus Usmg5 3'-UTR

NM_023211 ATGGATTTTGAAATGTCTGACCTCACCTGTTAAGTCCCATGCCTGAAGAAGCTGATGTGAACTCATCATGTAATACTCAATTTGTACAATAAATTATGAACCCAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:175)

Mus musculus Cox8a 3'-UTR

NM_007750 AGGGAGCAGTCTTCCCTCATCCTTTGACTAGACCACTTTTGCCAGCCCACCTTGATCATGTTGCCTGCATTCCTGGCTGGCCTTCCCCGGGATCATGTTATTCAATTCCAGTCACCTCTTCTGCAATCATGACCTCTCGATGTCTCCATGGTGACAACTGGGACCACATGTATTGGCTCTGCTTGGTGGGGTCCCCCTTTGTAACAATAAAGTCTATTTAAACCTTGCTCC

(서열번호:176)

Mus musculus Ly6c1 3'-UTR

NM_010741 TGGTCCTTCCAATGACCCCCACCCTTTTCCTTTTATCTTCATGTGCAACCACTCTTTCCTGGAGTCCTCTAGTGACAAATTATATGTTATAGAAGGTCCAATGTGGGGATAGTGTGTGGAACACCCTGTTTCACCTTTATAGCCCCTGCTGGGTAAGTGCCCGACTCCTCTCTAGGGCTTTCAAATCTGTACTTCTTGCAATGCCATTTAGTTGTGGATTTCTATTCTTGGCCCTGGAGGCATGTGGCCAGCACATGCAACAGGCAGTATTCCAAGGTATTATAGTATCACCATCCACACATAAGTATCTGGGGTCCTGCAGGGTTCCCATGTATGCCTGTCAATGACCCCTGTTGAGTCCAATAAAAGCTTTGTTCTCCCAGCCAAAAAAAAAAAAAAAAAA

(서열번호:177)

Mus musculus Ly6c1 3'-UTR

NM_001252058.1 ACTCATAAAAATGCTCCTGCCTCGGTCTTCCAAGTTCTAGGATTGCAAGTCTGACTTCAACATGCCTTACAGACAACTCTGGGACATCCAGGCCTAGTGGCATGTTGCCCAGATATGGGGATGCTCTGTGGCCCCTGCATAAGAAGTGAGTCACTCCCTGATTTCTTGCAGACTCTCAAAGAAGGAAACTAAAGACCCGTCAGTGCCTTTCTTTCTGCCCTGCTGGTGTGCCAATCAGGGATCCTAACATCAGGGAGAGGACTTCCTGTTGCAGCGAAGACCTCTGCAATGCAGCAGTTCCCACTGCAG

(서열번호:178)

Mus musculus Cox7b 3'-UTR

NM_025379 TCGTGCCAGCTGGTACAATAATCAAGGAATTGTTTAAAACCAACTTATAAGTGAATGCCAAGTCAAAGAATCATGTACTCATTATACTATGGCAGATTGAAGAACAAATAAAGAAATAAAGTACCTTAACCTTCATTCTAGGCTTTGTTTTTTTCCTTTGTAAATGAAGCCCAAGCATGGTGACTTCTCATTTATTTAAGCTGTATTGTCTCTTAAAATGGCTTTTTACCCTATGAGGTGGTATGAGGGAAATCTATGATCAGGAGGGCACCTTTATAGTAAGCTGAAATTACAGAGAATGAAGAAATAAGCACAGAGCTGTTTTAGGAGCCCACTGGGTCATTGGCCATATAGGTTATGCTTACTGCCCTCTACCTCGTGGTTATATTTGGAATTGCCATTAGCTCCCTTCTGCTTAGAGACTGGACTGTCACCAAACCCAAGGGGATAGTGATCCTGTAATGATCCTGTGTGAACTAGGTTTGCTAAAGACTACCACCTCCTTACACTGTATGGCATATTCATCTGAAATAGGTGCTAATTTTTCAGCATAATCCTTAATCTTTAGGATCTGTCATACTTCCTAGTAATTTAACTGTTGCTGAAGAAATAAAGGCTATCTGTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:179)

Mus musculus Ppib 3'-UTR

NM_011149 AGAGCCTGGGGGACCTCATCCCTCTAAGCAGCTGTCTGTGTGGGTCCTGTCAATCCCCACACAGACGAAGGTAGCCAGTCACAAGGTTCTGTGCCACCCTGGCCCTAGTGCTTCCATCTGATGGGGTGACCACACCCCTCACATTCCACAGGCCTGATTTTTATAAAAAACTACCAATGCTGATCAATAAAGTGGGTTTTTTTTATAGCTTGAAAAAAAAAAAAAAAAAAA

(서열번호:180)

Mus musculus Bag1 3'-UTR

NM_009736 AGTGCAGTGGAGAGTGGCTGTACTGGCCTGAAGAGCAGCTTTACAGCCCTGCCCTCTCTGGAACAGAAGTCGCCTGTTTCTCCATGGCTGCCAGGGGCAACTAGCCAAATGTCAATTTCCCTGCTCCTCCGTCGGTTCTCAATGAAAAAGTCCTGTCTTTGCAACCTGAATTAGACTTGTGTTTTCTCAAAAAAAAAAAAAAAAA

(서열번호:181)

Mus musculus S100a4 3'-UTR

S100a4-201 ENSMUST00000001046 AGACTCCTCAGATGAAGTGTTGGGGTGTAGTTTGCCAGTGGGGGATCTTCCCTGTTGGCTGTGAGCATAGTGCCTTACTCTGGCTTCTTCGCACATGTGCACAGTGCTGAGCAAATTCAATAAAAGGTTTTGAAACTATT

(서열번호:182)

Mus musculus Bcap31 3'-UTR

NM_012060 AGGCTTGGTGTTTCCCTGCCTGCCGCTGGCTTCTACCTGACCCATGCTTACTGCTTCCTTGGAGCCCAGACTATCCCTCTGGTACTTGGGTTTATTCCCTACTTCCCCAATTTTCTTCCATGGCTTATAGATCATTATTTTGGCACCATTACACATACTGCTCTTATACCAAAAGGGACCTGATTGTTGTTTATTCAGAGTACTTTTGCCACTGTTCTGCCTGGCTAGGGCACTTTCCACTCCTGGAAGTGTAGAAAAGCACTGGTGACCTGGCCTGCAGTTTGAACCCCTTTTTATTTTGCAATGTACCCTAAAGGAGGCTGCTGTGAAGCAGGTCAACTGTTTTATCCTGAGGGGAATAAATGTTGTTATGT

(서열번호:183)

Mus musculus Tecr 3'-UTR

NM_134118 GCAGCTCCTCACGGCTCTGCCCAGTAATACTCTCCACCCCTCACTGCCCCTGTCCTGATGTGTGGCTGGCCATGGCTCTCCAGCAGCAACAATAAAACCTGCTTACCCAAAAAAAAAAAAAAAAAA

(서열번호:184)

Mus musculus Rabac1 3'-UTR

NM_010261 AGTGTCCTCCAGGACCTGCCGGCCTCTCCTGCCGGCCGGCTGTCCCATCTCTGTCTGTTCTCGTCCTACCTGGCCTTGCTGCTCAGCTCCGAGCCTTCCACCTGAGGCCTCAAACCCAGGGAGGGGCTTTTGTCTTTGGAAATAAAGCTGTTACAATTGCTATTTGGCCAA

(서열번호:185)

Mus musculus Robld3 3'-UTR

NM_031248 (Lamtor2)

CAGCGTGATGGAGGCTGGAGTAGAAAAGGGATGATGATCTGGAGGGAGGGGCGGGGCCCTAGAAACGCCATATCGGGCGAGGTACAGGAAGGGGGGGTTGCTTTTTTCTGAATAAATTTTCAACTCTTAAAAAAAAAAAAAAAA

(서열번호:186)

Mus musculus Sod1 3'-UTR

NM_011434

ACATTCCCTGTGTGGTCTGAGTCTCAGACTCATCTGCTACCCTCAAACCATTAAACTGTAATCTGAAAAAAAAAAAAAAA

(서열번호:187)

Mus musculus Nedd8 3'-UTR

NM_008683

AGAAACTTGGTTCCGTTTACCTCCTTGCCCTGCCAATCATAATGTGGCATCACATATCCTCTCACTCTCTGGGACACCAGAGCCACTGCCCCCTCTCTTGGATGCCCAATCTTGTGTGTCTACTGGTGGGAGAATGTGAGGACCCCAGGGTGCAGTGTTCCTGGCCCAGATGGCCCCTGCTGGCTATTGGGTTTTAGTTTGCAGTCATGTGTGCTTCCCTGTCTTATGGCTGTATCCTTGGTTATCAATAAAATATTTCCTG

(서열번호:188)

Mus musculus Higd2a 3'-UTR

NM_025933

GTATAGCCGGGTCTTAAAGCGCCATGGAAACCATTACAAAACCCAGGAACAACAGACATCCCTGTCAGACTTGCTCCCTCCGTTTCAGACCGGACCTTATTGTCATTTGGGTGAGGAAGTGGCCGATTTTGTAACTGATTTGCGCTTCCACCGCTGCCCCCTCCCGCTCCCAAAATCCCAGGTTCATTTCAGTTGGGTTGCATGCTTCTATTTGTGATGCGTCCCCTTAATTACTTAATAAAAGCTTATTACACTTG

(서열번호:189)

Mus musculus Trappc6a 3'-UTR

Trappc6a-001 ENSMUST00000002112

GGACCCCAGACCCCAGGCTTGCCCTTCCCTAAGCTTAGCCTCGGAATGTGGCACCTGACCCTGCCTCACTGCTCACCTTTGCAGGTCGCCTTGAAGCTGGAGCTCACAGGCTCTGGGGAGGTCACATGTGCTTCAGACAAGGGAATGAAAGGGCCGGGAGGGTCCCGGGAGGTGGGACCATCCCCTGAGTTCCAAGTCAGCATGGAGGGACATTAGGGCATCACCCAGATGACAGATGTTCAGTAAAGGTTCTTTATGTGCAAACAGA

(서열번호:190)

Mus musculus Ldhb 3'-UTR

Ldhb-001 ENSMUST00000032373

CTGCCAGTCTCTAGGCTGTAGAACACAAACCTCCAATGTGACCATGAACCTTTAGTCTTCAGCCATGTATGTAGGTCACAGTTTGCTTCTTCCCTGACATGTGATATGAGCTCACAGATCAAAGCCCAGGCTTGTTTGATGTTTGCACTAGGAGCTCCTGATCAAATAAAGTTAGCAATTGCAGCATA

(서열번호:191)

Mus musculus Nme2 3'-UTR

Nme2-001 ENSMUST00000021217

ACATGAAGAAACCAGAATCCTTTTCAGCACTACTGATGGGTTTCTGGACAGAGCTCTTCATCCCACTGACAGGATGGATCATCTTTTCTAAAACAATAAAGACTTTGGAACT

(서열번호:192)

Mus musculus Snrpg 3'-UTR

NM_026506

CCTGTGCTCAGCAAGCAGTGTCCACATCCCTCCCCAAAGGCCTGTTTGATTGTGATGTAGAATTAGGTCATGTACATTTTCATATGGAACTTTTTACTAAATAAACTTTTGTGATACTC

(서열번호:193)

Mus musculus Ndufa2 3'-UTR

NM_010885

AGGTCTCCACTGAGGACTGTGAGCGAGAGCAGCTGAACCTGCTGGACTGAAGACAGTGTGGGGAAATGTGTGCTTTGGGTCCTTATAAAGCTTACGCTGTACAGTGTCCCTTCAGAATGTCCTCTTCATTACCTTCTCCCTCTTACTGCGCAACACTGAGGCAAAGTAGTTTTATATAAAAATACTCCTTTATTTCTCCTCAAAAAAAAAAAAAAAAAAAACCCACCAGGTGCCA

(서열번호:194)

Mus musculus Serf1 3'-UTR

Serf1-003 ENSMUST00000142155

TGACTGGCTTTTTGGAAAACCTGGGTGCTATTGCCAGTGGGTGCATCATACGCTCTAAGATTAAAATTTCACAGTGACTAATCATTATATGTGTTATAACTTGTCCTTATAAAACTATTTTAAACTTTACTCTTCAGCCTATCTTAATGTGATGTTTTAAGACCATCAAAAAATAAAGTACTGACCTTGCATGTAA

(서열번호:195)

Mus musculus Oaz1 3'-UTR

Oaz1-001 ENSMUST00000180036

GTGCCAGCCCTGCCCAGTGTCCCTGTGCCCTCTCCTGGGTTAGTCCACATGTCGTGATTGTGCAGAATAAACGCTCACTCCATTAGCGGGGTGCTTCTTCGAGCTGAATGCTGTGTTTGTCACACTCAAGTGTTGGCTTTAATTCTAAATAAAGGTTTCTATTTTACTTTTTTATTGCTGTTTAAGATGGTCAGGTGACCTATGCTATAGCAGTCTCCTTTGAAGTCTGGAAAAATAGTGTCACCTCCCCTGGCTCAAATCCAATAAAGTGATCTCGTTCATTGGC

(서열번호:196)

Mus musculus Ybx1 3'-UTR

Ybx1-001 ENSMUST00000079644

ATGCCGGCTTACCATCTCTACCATCATCCGGTTTGGTCATCCAACAAGAAGAAATGAATATGAAATTCCAGCAATAAGAAATGAACAAAGATTGGAGCTGAAGACCTTAAGTGCTTGCTTTTTGCCCTCTGACCAGATAACATTAGAACTATCTGCATTATCTATGCAGCATGGGGTTTTTATTATTTTTACCTAAAGATGTCTCTTTTTGGTAATGACAAACGTGTTTTTTAAGAAAAAAAAAAAAAAGGCCTGGTTTTTCTCAATACACCTTTAACGGTTTTTAAATTGTTTCATATCTGGTCAAGTTGAGATTTTTAAGAACTTCATTTTTAATTTGTAATAAAGTTTACAACTTGATTTTTTCAAAAAAGTCAACAAACTGCAAGCACCTGTTAATAAAGGTCTTAAATAATAA

(서열번호:197)

Mus musculus Ybx1(v2) 3'-UTR

with mutation T128bpG and deletion del236-237bp

TTTTTATGCCGGCTTACCATCTCTACCATCA

TCCGGTTTGGTCATCCAACAAGAAGAAATGAATATGAAATTCCAGCAATAAGAAATGAAC

AAAGATTGGAGCTGAAGACCTTAAGTGCTTGCTTTTTGCCCGCTGACCAGATAACATTAG

AACTATCTGCATTATCTATGCAGCATGGGGTTTTTATTATTTTTACCTAAAGATGTCTCT

TTTTGGTAATGACAAACGTGTTTTTTAAGAAAAAAAAAAAAGGCCTGGTTTTTCTCAATA

CACCTTTAACGGTTTTTAAATTGTTTCATATCTGGTCAAGTTGAGATTTTTAAGAACTTC

ATTTTTAATTTGTAATAAAGTTTACAACTTGATTTTTTCAAAAAAGTCAACAAACTGCAA

GCACCTGTTAATAAAGGTCTTAAATAATAA

(서열번호:198)

Mus musculus Sepp1 3'-UTR

NM_009155

ATTATTTAAAACAAGGCATACCTCTCCCCAACTCAGTCTAAAGACACAATTTCATTTTGAGAATGTTTACAGCCCATTTAATTAATCAGTGAACTAAAAGTCATAGAAATTGGATTTGTGCAAATGTAGAGAAATCTACCATATTGGCTTCCAAAATTTAAAAATTTTATGCCACAGAACATTTCATCCAAATCAGATTTGTACAATAGGGCACCTGAAAAGTGACTGCAGCCTTTGGTTAATATGTCTTTCTTTTTCCTTTTTCCAGTGTTCTAGTTACATTAATGAGAACAGAAACATAAACTATGACCTAGGGGTTTCTGTTGGATAGCTTGTAATTAAGAACGGAGAAAGAACAACAAAGACATATTTTCCAGTTTTTTTTTTCTTTACTTAAACTCTGAAAACAACAGAAACTTTGTCTTCCTACTCTTACATTCTAAACCGATGAAATCTTTAACAGATTACACTTTAAATATCTACTCATCATTTTCTCTCTCAGAGTCCTAGCTTGAGTTGCACTGCATGTATCTGTGCATCTTGTTCTCTTCATTTAATGCTGTACTGTTCTGCTGAGCTCTGAGGGACTATCTTGAGAGATGTAATGGAAGGAAAGCGTGGTGTTAATCTGCGTACTGCTTAAGACAGTATTTCCATAATCAATGATGGTTTCATAGAGAAACTAAGTCCTATGAACCTGACCTCTTTTATGGCTAATACGACTAAGCAAGAATGGAGTACAGAATTAAGTGGCTACAGTACACACTTATCAAAATAAATGCAATTTTAAAACCTTTC

(서열번호:199)

Mus musculus Gaa 3'-UTR

Gaa-001 ENSMUST00000106259

GAGAGTCCGTCGTTTACAGAGGCCTCCAGGGAGGCAGAGGGAGCTTGAGCTGGCTCTGGCTGGTGGCTCCTGTAAGGACCTGCGTCCTGCTCTCCTGACACATCTTTGAGCTTTTCCCACCGTGTTACTGCATGCGCCCCTGAAGCTCTGTGTTCTTAGGAGAGTGAGGCTCGCCTCACCTGCCCCACCCCAGCTGTCTGTCCCTCACCTGGCACTAGAGAATGTGGAGCTCGGCGTGGGGACATCGTGTCTGCACCAACATCAGGCTGTGCAGCCACTGCAGCCGCAACCCTGCAGAGACAGAGCTGGTGCCTTCACCAGGTTCCCAAGACTCGAGAAACTTACTGTGAAGTGTACTTACTTTTAATAAAAAGGATATTGTTTGGAAGC

(서열번호:200)

호모 사피엔스 ACTR10 3'-UTR

ACTR10-002 ENST00000254286

AAGTTTGATTAAAAATCAACCTTGCTTCATATCAAATATTTAACCAATTATAAGCAAATTGTACAAAGTATGTAGGATGTTTTGTTATAGAGGACTATAGTGGAAGTGAAAGCATTCTGTGTTTACTCTTTGCATTAATATATAATTCTTTTGACTTTGTTTCTCTTGTGTAGTGGTAAAATGGTAGCTGGTGCTTATTGAGATTTGCTGTATTTATATCAATAAAGTATAGTAAAGCAGTTTGATTTTGGAAGTTTGTTATGTGGCTTTTTTTTTTTTTTTTTTTTTGAGACGGAGTCTCGCTCTGTCACTTAGGCTGGAGTGCAGTGGCACAATCTCTACTCATTGCAAGCTCCGCCTCCCGGGTTTACGCCATTCTGTCTCAGCCTCCTGAGTAGCTGGGACTATAGGCATACGCCACCCCGCCCGGCTAATTTTTTGTATATTTAGTAGAGACGGGGTTTCACCATGTTAGCCAGGA

(서열번호:201)

호모 사피엔스 PIGF 3'-UTR

NM_173074

GTAACTTAATCCTGACAACCGTAGTGCAAGGTATGGCCCATCTCCTGTACGCTTGGAGCGACCTTTGGCTACGTGGCTGGCCTTGTTATTTCACCACTCTGGATATACTGGAATAGAAAGCAACTTACATACAAGAACAATTAACTGGAGCAAAGGGAGATATTTCTTTGTGCAGATTCTGTAAGGGCTGGGCAGAAATGTGTATGGTCAAAGCCAAGCAGTTCCATTTACAGCTCTGTTTTTTACGTAGTTACAACATGATGTGATTGTAGCTTTTTAAACTATGAAACCCCTGAGAGATTGTACCTTCTAGTTGAAATAAAGTATTTATAATAGATTGTGGCTTC

(서열번호:202)

호모 사피엔스 PIGF 3'-UTR

NM_002643.3

CTGGAGCAAAGGGAGATATTTCTTTGTGCAGATTCTGTAAGGGCTGGGCAGAAATGTGTATGGTCAAAGCCAAGCAGTTCCATTTACAGCTCTGTTTTTTACGTAGTTACAACATGATGTGATTGTAGCTTTTTAAACTATGAAACCCCTGAGAGATTGTACCTTCTAGTTGAAATAAAGTATTTATAATAGATTGTGGCTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:203)

호모 사피엔스 MGST3 3'-UTR

MGST3-001 ENST00000367889

AGAATTATAGGGGTTTAAAAACTCTCATTCATTTTAAATGACTTACCTTTATTTCCAGTTACATTTTTTTTCTAAATATAATAAAAACTTACCTGGCATCAGCCTCATACCTAAAA

(서열번호:204)

호모 사피엔스 SCP2 3'-UTR

NM_001193599

AGAACTCCCTTTGGCTACTTTTGAAAATCAAGATGAGATATATAGATATATATCCATACATTTTATTGTCAGAATTTAGACTGAAACTACACATTGGCAAATAGCGTGGGATAGATTTGTTTCTTAATGGGTGTGACCAATCCTGTTTTTCCTATGCTCTGGGTGAATAGAGCCTGATGGTATACTACTGCTTTGCGGAATTGCATACAACTGTGCATTACAAAGTTAATATGGTAATTATGGTCTGGGGTAAAATTGAGTTTCAGAATAAAATTAGGAACAGTAAAATCCAAAGAACTATGTAAACAAAAAAGCTTTTGTTTTGCTTACAAAGTATATTTAAGGATTATTCTGCTGAAGATTCAGTTTAAGAGTTTTCCTTGGGAGAACTAAGTAAGAAACACAATGCCAACAGCTGGCCAGTAATTAGTGTTGTGCACTTCATGTCATTAATCAATTTCTCAATAGTTCTTAAAATTAGTGAGATTAAAAATCTAAAAATTTTGCATTTCATGCTATCAGAAACAGTATTTTCTTCCCAAATCAAAATAAAAGAAATATGATCAGAGCTTGAACACAGGCTTATTTTTAAAATAAAAATATTTTTAACATGGGTTTCCTTATTGAAAAATCAGTGTATTAGTCATAAAACACCATCATTAAGAATAATTGAACAATAAAGTTTGCTTTCAGATGCAGTTTTCAAATTATAATCTCATTTCAATTTATAACGTTCTCAGTCCTTTGTTATAATTTTCCTTTTTCATGTAAGTTTAATTATCTGCATTTATCTTTTTTCCTAGTTTTTCTAATACTAATGTTATTTCTTAAAATTCAGTGAGATATAGGATAAAATAATGCTTTGAGAAGAATGTTTAATAGAAAATTAAAATAACTTTTTCTGGCCTCTCTT

(서열번호:205)

호모 사피엔스 SCP2 3'-UTR

SCP2-015 ENST00000435345

AGAACTCCCTTTGGCTACTTTTGAAAATCAAGATGAGATATATAGATATATATCCATACATTTTATTGTCAGAATTTAGACTGAAACTACACATTGGCAAATAGCGTGGGATAGATTTGTTTCTTAATGGGTGTGACCAATCCTGTTTTTCCTATGCTCTGGGTGAATAGAGCCTGATGGTATACTACTGCTTTGCGGAATTGCATACAACTGTGCATTACAAAGTTAATATGGTAATTATGGTCTGGGGTAAAATTGAGTTTCAGAATAAAATTAGGAACAGTAAAATCCAAAGAACTATGTAAACAAAAAAGCTTTTGTTTTGCTTACAAAGTATATTTAAGGATTATTCTGCTGAAGATTCAGTTTAAGAGTTTTCCTTGGGAGAACTAAGTAAGAAACACAATGC

(서열번호:206)

호모 사피엔스 HPRT1 3'-UTR

HPRT1-001 ENST00000298556

GATGAGAGTTCAAGTTGAGTTTGGAAACATCTGGAGTCCTATTGACATCGCCAGTAAAATTATCAATGTTCTAGTTCTGTGGCCATCTGCTTAGTAGAGCTTTTTGCATGTATCTTCTAAGAATTTTATCTGTTTTGTACTTTAGAAATGTCAGTTGCTGCATTCCTAAACTGTTTATTTGCACTATGAGCCTATAGACTATCAGTTCCCTTTGGGCGGATTGTTGTTTAACTTGTAAATGAAAAAATTCTCTTAAACCACAGCACTATTGAGTGAAACATTGAACTCATATCTGTAAGAAATAAAGAGAAGATATATTAGTTTTTTAATTGGTATTTTAATTTTTATATATGCAGGAAAGAATAGAAGTGATTGAATATTGTTAATTATACCACCGTGTGTTAGAAAAGTAAGAAGCAGTCAATTTTCACATCAAAGACAGCATCTAAGAAGTTTTGTTCTGTCCTGGAATTATTTTAGTAGTGTTTCAGTAATGTTGACTGTATTTTCCAACTTGTTCAAATTATTACCAGTGAATCTTTGTCAGCAGTTCCCTTTTAAATGCAAATCAATAAATTCCCAAAAATTTAA

(서열번호:207)

ACSF2

호모 사피엔스

ATAAAGCAGCAGGCCTGTCCTGGCCGGTTGGCTTGACTCTCTCCTGTCAGAATGCAACCTGGCTTTATGCACCTAGATGTCCCCAGCACCCAGTTCTGAGCCAGGCACATCAAATGTCAAGGAATTGACTGAACGAACTAAGAGCTCCTGGATGGGTCCGGGAACTCGCCTGGGCACAAGGTGCCAAAAGGCAGGCAGCCTGCCCAGGCCCTCCCTCCTGTCCATCCCCCACATTCCCCTGTCTGTCCTTGTGATTTGGCATAAAGAGCTTCTGTTTTCTTTG

(서열번호:208)

호모 사피엔스 VPS13A 3'-UTR

NM_033305

AATTCATATGTTCTTTATTTTACTTGGAATGTTTCATTAACATGTTTTGTATGACTTATACCATAATGCCCATATGTCCATTTATAGGGAGGTAAAACACATTTTCTTTTAAAATGTTTTCCTACACATTTTCATAAAGCAAAATAATTGTATTATTTAAGCACAGAAAAAAATGTATCTTACATCCAAAGTAGGGAGGGCATCCAACATATTATAGATTTGCTTTTATATATTTTATAGCTTTGTATTGCATAGTTTGTCTTTAAGAGTTCAAGTTAGACTTAAATATAATTTTGATGTTCACTGGTTTTATTTTAAATTGCCTTCTTATTTGTTAGCAAAATGCCTTTTTTTAATGGTCTCTGTAAATTTTCTGGGCTTTAATGTAATGCCACTGTGTAAAAAAAAAGGAAGAAAATAGTAATAGCCATTTAATGTTTTATATTTATCATTTTAAAGATATTTTTGTCAAATTTCTTTTAATAATAATAAACATATGTAATCTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:209)

호모 사피엔스 CTH 3'-UTR

NM_001190463.1

TATTCCAGAGCTGCTATTAGAAGCTGCTTCCTGTGAAGATCAAATCTTCCTGAGTAATTAAATGGACCAACAATGAGCCTTTGCAAAATTTTCAAGCGGAAATTTTAAGGCACCTCATTATCTTTCATAACTGTAATTTTCTTAGGGATCATCTCTGTTAAAAAGTTTTCTGTATGTCATGTTATAATTACAGGTCAATTCTGTTAATATCTTTTTGTTAATTTTGCTCTATGTTTGCCTCTGAAGGAGGTGAGATTTGTGCTACTTTGGGAGATTATGTTCTTTTTTCATGTCTAAGATTTATTTTGATCATGTTTATAATATAATGGTAATTCATTTTTGATGTTTTGTGAAGAATTTAAATTTAAACGAATGTTCTTAAATCAAGTGTGATTTTTTTGCATATCATTGAAAAGAACATTAAAAGCAATGGTTTACACTTAGTTACCATAAGCCGAAAATCAAATACTTGAAAAGTTTACTGTGAAATTCTACTGATTTAAGACTATACTTAATATTTTTAAAAAAATAAATCAGCTGGGCGCGGTGGCTCACGCATGTAATGCCAGCACTTTTGGAGGATAAGGCGGGCGGATCACGAGGTCAGGAGATTGAGACCATCCTGGCTAGCGCAGTGAAACCCCCATCTCTACTAAAAATGCAAAAAAAATTAGACGGACGTGGTGGCGGGTGCCTGTAGTCCCAGCTACTTGGGAGGCTGAGG

(서열번호:210)

호모 사피엔스 CTH 3'-UTR

CTH-001 ENST00000370938

TATTCCAGAGCTGCTATTAGAAGCTGCTTCCTGTGAAGATCAAATCTTCCTGAGTAATTAAATGGACCAACAATGAGCCTTTGCAAAATTTTCAAGCGGAAATTTTAAGGCACCTCATTATCTTTCATAACTGTAATTTTCTTAGGGATCATCTCTGTTAAAAAGTTTTCTGTATGTCATGTTATAATTACAGGTCAATTCTGTTAATATCTTTTTGTTAATTTTGCTCTATGTTTGCCTCTGAAGGAGGTGAGATTTGTGCTACTTTGGGAGATTATGTTCTTTTTTCATGTCTAAGATTTATTTTGATCATGTTTATAATATAATGGTAATTCATTTTTGATGTTTTGTGAAGAATTTAAATTTAAACGAATGTTCTTAAATCAAGTGTGATTTTTTTGCATATCATTGAAAAGAACATTAAAAGCAATGGTTTACACTTA

(서열번호:211)

호모 사피엔스 CTH 3'-UTR

CTH-002 ENST00000346806

TATTCCAGAGCTGCTATTAGAAGCTGCTTCCTGTGAAGATCAAATCTTCCTGAGTAATTAAATGGACCAACAATGAG

(서열번호:212)

호모 사피엔스 NXT2 3'-UTR

NXT2-004 ENST00000372107

AGGGGCAAAAGTCCATTCTCATTTGGTCCATTAGTTCCAGCAATTGAAATTTATGTGAATTATTTTGATTGTAGAAGCACTATAATATGTGCTGAAACTAAATTTCTTTAATATTTTCTATTCCTGTCAGCACCTTTTCTAGCAGCTGCCAGTTTGGAGCATTGCCCTCTAAGAGCTTTAAAACTATTTTTTTACATGCCTTATATACATTCCACTAATGACATTCTTATAATAATATTAAACACATGATCTTGGTACTAACATACTCACTGTGAACCCAGCCTAT

(서열번호:213)

호모 사피엔스 MGST2 3'-UTR

NM_002413

CTTTTTCTCTTCCCTTTAATGCTTGCAGAAGCTGTTCCCACCATGAAGGTAATATGGTATCATTTGTTAAATAAAAATAAAGTCTTTATTCTGTTTTTCTTGAAAAAAAAAAAAAAAAAAA

(서열번호:214)

호모 사피엔스 MGST2 3'-UTR

NM_001204366.1

CTTTTTCTCTTCCCTTTAATGCTTGCAGAAGCTGTTCCCACCATGAAGGCTTGAAGCCACAGTGCATGGCCAGAACCAGCCAGACCTTTGGAGTTCAAGAACTCGAGAGGTGGGTGAAAACTGCCATTGCCTCCACAGACTGTCTTCTCCGTGGAAAGAAGACCTGAGTCACCAGGGCTGGGAAACCTGCACCACTGAGACGAGCACAGCCTCTGCCGGCATGCAAGTGGCCGCTGTCAGGACACATGGACTGAAAGTGGTTTGTCAGCTGCTCCATTAGGTTTTTTTTACCCATATGTTTGCTACCTTTCTTTCCTTGATTTAAAAATAGGGAGGGGGAGCAGTCTCAGCTGTCTTCAGCTGCTAGGGAGATTTTTTTCCCCCTCCTGAGCTACTGTTTCCCCCAACCCGAGCCTTTCTCTCTTATTGTACCCACCCTTTCTGATGAAGTCATCAAAGCAAAGATTGCATAACTGATGCATAGGCCTATCTTGTGTTATACTGGGAGACAGGCCAATGTTTCCATTAATAGACAAGAGCACCACCACGCTGCCAAATGGAGCTCTCTGCTGCAACCACTAC

(서열번호:215)

호모 사피엔스 C11orf67 3'-UTR

AAMDC-005 ENST00000526415

TGGAGCCTTAAGAGGAGAATAAATCACTAAGTGCCTA

(서열번호:216)

호모 사피엔스 PCCA 3'-UTR

NM_000282

AGGATTTATAACCTTTCAGTCATCACCCAATTTAATTAGCCATTTGCATGATGCTTTCACACACAATTGATTCAAGCATTATACAGGAACACCCCTGTGCAGCTACGTTTACGTCGTCATTTATTCCACAGAGTCAAGACCAATATTCTGCCAAAAAATCACCAATGGAAATTTTCATTGATATAAATACTTGTACATATGATTTGTACTTCTGCTGTGAGATTCCCTAGTGTCAAAATTAAATCAATAAAACTGAGCATTTGTCT

(서열번호:217)

호모 사피엔스 GLMN 3'-UTR

NM_053274

AAGTTCCATTTCCTAAATAAAAACTAATAAAATATAGTACTTTCCATTATGATTCATTTAATACCTTTATAAAAAATTTTTCTGTAAAAATTTACTGCTTGAAAAATAAATGTAGCTTTTCTCATTTATCAAAAAAAAAAAA

(서열번호:218)

호모 사피엔스 DHRS1 3'-UTR

NM_001136050

CCCTCCTGGTCTGACACTACGTCTCTGCTTGTCTTCTCATTTGGACTTGGTGGTTCGTCCTGTCTCAGTGAAACAGCAGCCTTTCTTGTTTACCCATACCCTTGATATGAAGAGAAGCCCTCTGCTGTGTGTCCGTGGTGAGTTCTGGGGTGCGCCTAGGTCCCTTCTTTGTGCCTTGGTTTTCCTTGTCCTTCTTTTTACTTTTTGCCTTAGTATTGAAAAATGCTCTTGGAGCTAATAAAAGTCTCATTTCTCTTTCAAAAAAAAAAAAAAAAA

(서열번호:219)

호모 사피엔스 PON2 3'-UTR

PON2-001 ENST00000433091

ATTGTACTTTTGGCATGAAAGTGCGATAACTTAACAATTAATTTTCTATGAATTGCTAATTCTGAGGGAATTTAACCAGCAACATTGACCCAGAAATGTATGGCATGTGTAGTTAATTTTATTCCAGTAAGGAACGGCCCTTTTAGTTCTTAGAGCACTTTTAACAAAAAAGGAAAATGAACAGGTTCTTTAAAATGCCAAGCAAGGGACAGAAAAGAAAGCTGCTTTCGAATAAAGTGAATACATTTTGCACAAAGTAAGCCTCACCTTTGCCTTCCAACTGCCAGAACATGGATTCCACTGAAATAGAGTGAATTATATTTCCTTAAAATGTGAGTGACCTCACTTCTGGCACTGTGACTACTATGGCTGTTTAGAACTACTGATAACGTATTTTGATGTTTTGTACTTACATCTTTGTTTACCATTAAAAAGTTGGAGTTATATTAA

(서열번호:220)

호모 사피엔스 NME7 3'-UTR

NM_013330

TGGTGTGGAAAGTAAAGAAGTCACAGGTTGGGACATTTAGACAAGAGTGAATCACACACGAGGAATGTGTTCATTCTTTTATTGTCCGTTGTTTTAACCTGACTGAATACAAGATCAACAAGAGCACTGTACTCCTGGCAATTATTACATATGTTAGAACATGGATTTTGCACTGTAGACAACATTTAACACCAGTCTATGGGGTACTGCATTGCTTTTTATAAAGTTCAAAATAAAGATTTATTTTCAAACAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:221)

호모 사피엔스 ETFDH 3'-UTR

NM_004453

ACTGCAGCTAGCCAGTTTCTTTCAAGTATGGCAAGCTAACGTTAAAATGTTTAGAGATTAACAGATTTCAGAATGTCTTTCTGCATATTACTGAACAGAATAGTCACAAAATGATTATCAAATAAAAATTTTATACTATATGTAAGATTGTCCCATAAAGAAA

(서열번호:222)

호모 사피엔스 ALG13 3'-UTR

BC117377

GATCCAGCAGTATGAAGTATTCTTGCACTGCCATTTTCTTGCTGTTTTTGTTTTTAAAAAGTATTTTATGTTAGTGGTTAAATGATTTAGGTGATTAGTGTTTACTATTGTATTTGTCTTTAAAATTATTTTATCTTTTGATTTAAAATAGTACTTTAAAATTAAGGGGTATTATTTTGGGCTGTGACTAAGGAAATTGAGATGGATGTACAACTAGCCCCATATTGAGCATACTTCATTGTATTCAGCTGTTTTCCTGTCAGCCATTTGTCAGC

(서열번호:223)

호모 사피엔스 ALG13 3'-UTR

NM_001099922.2

GATCCAGCAGTATGAAGTATTCTTGCACTGCCATTTTCTTGCTGTTTTTGTTTTTAAAAAGTATTTTATGTTAGTGGTTAAATGATTTAGGTGATTAGTGTTTACTATTGTATTTGTCTTTAAAATTATTTTATCTTTTGATTTAAAATAGTACTTTAAAATTAAGGGGTATTATTTTGGGCTGTGACTAAGGAAATTGAGATGGATGTACAACTAGCCCCATATTGAGCATACTTCATTGTATTCAGCTGTTTTCCTGTCAGCCATTTGTCAGCTTTATATTAGCTGATGGTACCAATTGATAAAATGAATATAAAGTATTTCATTGGTTCAAAAATCACACATCATATTAAACCATGCAGAATTGGAGTAACTTCCACTTTTTTCTAGAAAGTAAAACCAAGAGCCTTTGCTTCTGGATAACTCACTTAATATTAAATTAAAGAGCTCTTCACGTTTCTTGAGAATTATCTGAAGCCAGTTGCATTCTGTGATATCAGTTTTGAAGGCACATGGTTCTCTGCTTTAGATTTATCCCATATGCTATTGTTTAATACTGGATGTATGTAAGTGTTTTACTGCACTGTATTGAATTGGTGTCTTTTGCACAGTTAGCAGTAAATAAAAATTAGCATTTAAAATTGCCAAAAAAAAAAAAAAAAAA

(서열번호:224)

호모 사피엔스 DDX60 3'-UTR

DDX60-001 ENST00000393743

AAACAAAGTCTATGCAAACCACTTAAAAATAATTCCATAGTAGTTTTTCAGGTCACGTTTTTGATTCTTATGCTTCTTGCCAGAAATACATTATGATAAAGTGGAAATACATTACGATGAAGTGGAAAGAGCAAACACTTTGGAATCAAACAGAGTTGCAATCAAACCTGCCATGTTCTGTCATGAATACTCACAAATTATTTAGTATACCTGAATCTTGGTTTCTTTTTATAACTGAGTAATAATGGTTACATCTCAGGTAGTTTGAGGATTGACTAAAAAAATGCGAGAATGTTGTATGTGACTGAATAACAATTTTTACTCTGCGAAGCCAAAGTAAATATAATATTATCAGTAACTTTATCCCCAGTGTCAGTATTTATAAAATGTTTATTAAGGCTAGAAAAAATGAATACAATATCCTGAAGGTGAAATATATTCTCTTCAATTAGCATAAATATGATTTACATAAGTTAGCTATACAGCTATTGAGATAGTACTTTCTAGTAAACTTAAACTACTTTTTAAACATACATTTTGTGATGATTTAACAAAAATATAGAGAATGATTTGCTTTATTGTAATTGTATATAAGTGACTGGAAAAGCACAAAGAAATAAAGTGGGTTCGATCTGTTTAC

(서열번호:225)

호모 사피엔스 DYNC2LI1 3'-UTR

NM_015522.3

AATTCATTTGATGTAGATGAACCTGTTCACTGGAAAATTACAGCAATTTATTAAAACCTCAGTAAGAGCAAAACAAGGAAGAAGATTCCTTATATCTTCTTGTTAGACATCTTCTGTGATTGTTATGGCATATTACACCAATCAGAGAAATAGAGTTTTAAAGTAGTGGTTTGATATTGATTTTATAATCTCTGTAAAAATGAAGATAAAAAGCCAGATTGTACAAAAGTCACCTGACAAAGACTAGATGAAGCTACAACTTTAAGCAAGGGGTAGAGTTGTAATAGCCTTCACCATCACTCTGTATTTTACATTCATTTCGTTTCTGTCACTTATTCAGTATCTTTTTATCATCTGACAGCTAATTAAATTATAAAGTTGCTATGATGGTAACACAAGTTCTTCAAATACAATAATAAATATCATCATCTGGAAAAAAAAAAAAAAAAAA

(서열번호:226)

호모 사피엔스 VPS8 3'-UTR

NM_001009921, NM_015303

TGACTCCATGGAGCCTGGCCCAGGAGAACCAGAGATGATCCCGAGGCAGCTGGGGAGAGGCCCCGCCTCTGGTGGGCTTGGCCTCCACCACCTCCCACGCTTCTGAGAAGAGGTTCCAAATTGGGCTTCTGTGCCCAGAGCGTCCACAGCACCATTCCCAGTGTAGACTCCCAGTCTTCTCCACATTGCTGTCATGGCGTCAGTTCACCAGACTCATTGATTTTGTTTTGCTTGTTAAGCAAAGGAATGTCACATACCTCTGTCCAGCTTTTTAGGAAATACATTTCGCCTATTGCGACTTTTTCCATTTACCCTGAAGCCTAGAAAGTAGGTGGAACTCACACAAATGGCATTCCAGAGTCTGCCATACTCCGTCTCCTCCAGCTGCTGGATAATACAGAGGAACTTCAACTTCTACAGGGAACAGTGGTTGGCCAGGCTGCAGTATAACTGAAGCATGCCTTGGAGAGAGCAGACACTGTGGGGGCCAGGGCCATCTCCCTTTAATGTGTTCATGTTAAAACCTATTTGAGTGTAAGACTTGCCCTTTCTAACAATAAATGCTCCGTGTTTAAGTTCTGCAGGTCTCAAAAAAAAAAAAAAAAA

(서열번호:227)

호모 사피엔스 ITFG1 3'-UTR

NM_030790

CTTGCCTTTAATATTACATAATGGAATGGCTGTTCACTTGATTAGTTGAAACACAAATTCTGGCTTGAAAAAATAGGGGAGATTAAATATTATTTATAAATGATGTATCCCATGGTAATTATTGGAAAGTATTCAAATAAATATGGTTTGAATATGTCACAAGGTCTTTTTTTTTAAAGCACTTTGTATATAAAAATTTGGGTTCTCTATTCTGTAGTGCTGTACATTTTTGTTCCTTTGTGGAATGTGTTGCATGTACTCCAGTGTTTGTGTATTTATAATCTTATTTGCATCATGATGATGGAAAAAGTTGTGTAAATAAAAATAATTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:228)

호모 사피엔스 CDK5 3'-UTR

NM_004935

GCCCCGGGACCCCCGGCCTCCAGGCTGGGGCCTGGCCTATTTAAGCCCCCTCTTGAGAGGGGTGAGACAGTGGGGGTGCCTGGTGCGCTGTGCTCCAGCAGTGCTGGGCCCAGCCGGGGTGGGGTGCCTGAGCCCGAATTTCTCACTCCCTTTGTGGACTTTATTTAATTTCATAAATTGGCTCCTTTCCCACAGTCAAAAAAAAAAAAAAAAAA

(서열번호:229)

호모 사피엔스 C1orf112 3'-UTR

BC091516

AACTTATCACTAGGCAGAACTGGGTTTGATGCTTTGTCAACTGAAAATACTTATGTCTGTACATTTTCTAACAGATATAAAACAAATTTTGTAAAGTTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:230)

호모 사피엔스 IFT52 3'-UTR

NM_016004

AGACCATGCCTCTTGAAGCTTTTTCTGCCTCCTGATTCTCTCTTTGTAAACTATTTTCAAATTGTTTTTCAACTCCTTATCAAAATTGTTTATACACTCTTTCCTCCATGAGCTCTGGAAGGTATATGCATCTTCTGTAATACTCAGATAGGTATAAGATTTTTCACAAAATCCTTATGTAAGATACATTCCATTTTTAAAAATTAAATGTATGGTTGCATCTGTCTTTTTATACCCTA

(서열번호:231)

호모 사피엔스 CLYBL 3'-UTR

CLYBL-003 ENST00000339105

TCTGTTAAATGAAGCTGTCATCAGGCTAAAGGGTATTGAAGCTGCAGAGGGATCAACTTGTGCTTGCCAGAGGACGCCAATGAAGTTTGAAACACCAACAATCAGAGATTTTGTTTCTGTTCCTCATTAAATCATGAGCTTTTGTG

(서열번호:232)

호모 사피엔스 FAM114A2 3'-UTR

FAM114A2-006 ENST00000520667

AGAATGGAGACGTTTTGACCTGGGACTTGTGACGGCCAAGGAATGCCACCTTATTCTGGCTACTCCTGCAGAAATGAAGGAGTGGGGTTATTTTAGTATATAAAAATTCAGGCAGGAGAGATGGTTTAAAGAGGAAGATTGTTGCCTTCAGTGTTTGATTGAAGTATTCAGGTTCTCACAGTATTCTTTCCAGTTGTTGTAATTCATAAATTATTTGAAAAGAAACTTTTGTAGAAAGTCCAAGAATAATAACTCTAGATAAAGATTAGTGGGACACTCAGGCAAAAATGTTGGTCTTTCTTTGACATGTTGCAAAATGTTATCAATTTTGTCATGGATATAATTTGCAGCCCATGGATATAACTGGTTGATAAGCCAGAGAAAAATAATTTAGTGTTCTAAAATTCATGGCATGTGTGGTTTATTAATGCCATGTACTTTCTCCTTTCTGGAATAAAATCTATGGCTTTAAGAAAA

(서열번호:233)

호모 사피엔스 NUDT7 3'-UTR

NM_001243661

TTTACTAGAGCAAGAGACAAAGAACTATTCACGAGGATTCTGTGTGTGCTTATTCGTAGAACAACAACAATGCCAGCTGTTGGAATTTGACAGGTGTGAATATTTTTTCTGCAGTATGTAGTTAGAATCCTTGCCTCTTTTCCAGTTGCCTTCTATTGTCTGAAAAAGTAAAAGCCATTCAAAAATGAAAACTATGTTCATAGTGTTGCATATTTTCACCCACAATATGTTAATAATATTTTTCTTACACATATAATAAAGAATATCTGGCACATACTAGGCCCTTAATAAAGATTTTTTGAATATATAA

(서열번호:234)

호모 사피엔스 AKD1 3'-UTR

NM_001145128

TTTACTTAGGTGATAGCAGCCTGAATCTCAAGAGTTATCTGAAAGTGATAGAGGGAAACTGAGAGAAGTAGATTGAAAATCTGGGCCTCTTGGAAGTACTTTTGCCTCCTGAGCAAGGTACCATGGCTGCCAGACTTCAGGTGAACTCAAAGGTCTGCCAGCCAGGAAGGAGCACTCTTATGGAAACAAGTTTTAATACAATTTTAAAATGTATTGCTCTTTGCCTGAACTTTGATGCTTTAACAAAATAAACATTCTATTTATAATTCCATATAGAAAAGTTAAGTGACTTATTTAATAAATGTATTATTTTCCTTTTTAACATTTTCAGTAGAAAAGTCAGTCTCTGTTAAAATTACTCATTAAATGTTAGAAAGCTTTAAGACATTTAACATTGTTATAAATGAAACCAAAATATGGGTTATACATTTTACATACAAAACTGTTTGTGAACTTTGTGAACATAAGATACTATCATTTTCCCAATAAAATAAATGGATTTTGCAACAACTT

(서열번호:235)

호모 사피엔스 MAGED2 3'-UTR

NM_014599

GATTTTAGATATTGTTAATCCTGCCAGTCTTTCTCTTCAAGCCAGGGTGCATCCTCAGAAACCTACTCAACACAGCACTCTAGGCAGCCACTATCAATCAATTGAAGTTGACACTCTGCATTAAATCTATTTGCCATTTCAAAAAAAAAAAAAAAAAAAA

(서열번호:236)

호모 사피엔스 HRSP12 3'-UTR

HRSP12-001 ENST00000254878

GTGGGCCCAGTGCTGTGTAGTCTGGAATTGTTAACATTTTAATTTTTACAATTGATGTAACATCTTAATTAACCTTTTAATTTTCACAATTGATGACAGTGTGAGTTTGATGAAAATATCTGAAGCTATTATGGAAATACCATGTAATAGGGAGAGTTGAACATGAATATTAGAGAAGGAATCCAGTTACTTTTTTAAATTACACCTGTGTGCACCTGTATTACTGAATATAGGAAAGAGATACCCATTACATAGTTACTCAGTAAACAAAAGAGAAATACCAGGTAGGAAAGAAGAGTTACTATTCCTGAGAAATAATCAAGAACATATTTAATTTAAACTAATGATGTGAACTATTTAGTTTTGATGTCCGTTATGTGATTCTGCTTTTACTTGAGTAAAATTAAAGTGTTTAAATTTGAGATCAAGGAGAAGATAGTGGAACAAAATGTTATATAGATAATATTTTTCTAATGGAAATAAAATAGGCAGATTTCC

(서열번호:237)

호모 사피엔스 STX8 NM_004853 3'-UTR

TGGCAGTAAAGAGACCACCAGCAGTGACACCTGCCAATGACAGATGCAAGCCCAACACCCTTTTGGTACGCAAAACCTGCTCTCAATAAATTCCCCCAAAGCTCTGAAAAAAAAAAAAAAAAAAAAA

(서열번호:238)

호모 사피엔스 ACAT1 3'-UTR

ACAT1-001 ENST00000265838

ACAACCTCTGCTATTTAAGGAGACAACCCTATGTGACCAGAAGGCCTGCTGTAATCAGTGTGACTACTGTGGGTCAGCTTATATTCAGATAAGCTGTTTCATTTTTTATTATTTTCTATGTTAACTTTTAAAAATCAAAATGATGAAATCCCAAAACATTTTGAAATTAAAAATAAATTTCTTCTTCTGCTTTTTTCTTGGTAACCTTGAAAAGTTTGATACATTTTTGCATTCTGAGTCTATACTTATCGAAATATGGTAGAAATACCAATGTGTAATATTAGTGACTTACATAAGTAGCTAGAAGTTTCCATTTGTGAGAACACATTTATATTTTTGAGGATTGTTAAAGGTCAAGTGAATGCTCTTTATAGGTAATTTACATT

(서열번호:239)

호모 사피엔스 IFT74 3'-UTR

IFT74-201 ENST00000433700

GTTTAAGTCCACTGAAAGTCTCTAAGGAAGTATCCTCTTGCTGCTAAACTTGGTACAAGTTGACTACCAAAAAAAAAAAAAGCTTACTTTTGGAGTTTACCTAAAATTTCTGAATGTTATAATTTTTGTGGCCTCTTTTAAGAATGATATTTTAAAATAGTAAATAGTTCAATAAATGGTTTGCATATT

(서열번호:240)

호모 사피엔스 KIFAP3 3'-UTR

NM_014970

TAAAGTATCTGTTTCCATGTGTAATCTCAGCTTAGAAGAAATCTGTGTGGGTTGGGTTAATTTTGGATCTTTGCCTAATAATGCATGTTGATGTTATTGTGGGTCTGTGTTTGTTTTTATTTTTATATGTTGTTAGCTGCAGATTAACCCCAGCCCCTCTGTCTTCTGTTAAGTACAGTTGATACTGACATTGTTCACTCATCAAACCACATCTTGATGCTAAGTAACATTTCCCATGAGCCACAAAACTGAATGCTGAAAAGCTACTAGACTGGAAAACAAACACTGCATTATGTATGTTAAGTGACTAATTTAATTTCAATTAAAAAGCGTAAAGTGAAAATGAAAAAAAAAAAAAAAA

(서열번호:241)

호모 사피엔스 CAPN1 3'-UTR

NM_005186

GGCAGGGACTCGGTCCCCCTTGCCGTGCTCCCCTCCCTCCTCGTCTGCCAAGCCTCGCCTCCTACCACACCACACCAGGCCACCCCAGCTGCAAGTGCCTTCCTTGGAGCAGAGAGGCAGCCTCGTCCTCCTGTCCCCTCTCCTCCCAGCCACCATCGTTCATCTGCTCCGGGCAGAACTGTGTGGCCCCTGCCTGTGCCAGCCATGGGCTCGGGATGGACTCCCTGGGCCCCACCCATTGCCAAGCCAGGAAGGCAGCTTTCGCTTGTTCCTGCCTCGGGACAGCCCCGGGTTTCCCCAGCATCCTGATGTGTCCCCTCTCCCCACTTCAGAGGCCACCCACTCAGCACCACCGGCCTGGCCTTGCCTGCAGACTATAAACTATAACCACTAGCTCGACACAGTCTGCAGTCCAGGCGTGTGGAGCCGCCTCCCGGCTCGGGGAGGCCCCGGGGCTGGGAACGCCTGTGCCTTCCTGCGCCGAAGCCAACGCCCCCTCTGTCCTTCCCTGGCCCTGCTGCCGACCAGGAGCTGCCCAGCCTGTGGGCGGTCGGCCTTCCCTCCTTCGCTCCTTTTTTATATTAGTGATTTTAAAGGGGACTCTTCAGGGACTTGTGTACTGGTTATGGGGGTGCCAGAGGCACTAGGCTTGGGGTGGGGAGGTCCCGTGTTCCATATAGAGGAACCCCAAATAATAAAAGGCCCCACATCTGTCTGTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:242)

호모 사피엔스 COX11 3'-UTR

NM_001162861

AGAGTTGGCACCTTTGATGTGGTAGTGAGCTGATCATCCACTTTCTTCTAAAATAAAGAGAAGAAAATGGCCAGTAAAAAAAAAAAAA

(서열번호:243)

호모 사피엔스 GLT8D4 3'-UTR

BC127733

ATATTTTGTCTTGTTGCAAGTCAATTAGGTGTCTTGTGAACAAGGAAATACTAATCTCTAAGCTGCCTGGGTCTTTT

(서열번호:244)

호모 사피엔스 GLT8D4 3'-UTR

NM_001080393

ATATTTTGTCTTGTTGCAAGTCAATTAGGTGTCTTGTGACCAAGGAAATACTAATCTCTAAGCTGCCTGGGTCTTTTTGTGTGAATATTTAATGGTGCTCCATGACTGTTGAGTTTTAAAAACCTCGTTAAATTTTGCCAAATCAGTTGCCCCCAAAAGGGAATATGCTTTTCCTTATTTTTTTTTCTAAAATGCTATTTATCTCTAAGGAAAAA

(서열번호:245)

호모 사피엔스 HACL1 3'-UTR

NM_012260

ATAAAGACGCCAGTTGGTGGTCTTGAGTTTTCTCTTTCTTGCAAGATGAAATTTTATTTTCCACAGCAAAATTACTCTACTGTTAAAATTGTGCAAAATAAAATAAACATTTAAAATGACATTTTACAGTAAAAAAAAAA

(서열번호:246)

호모 사피엔스 IFT88 3'-UTR

NM_175605

TATTCACTTTAATATTTATTAAAGGAAAGAAATTGCCTTATGAGATCATCCTCATGTTAAACCTTGGATTAAATATCTAACCTGTAATTATTTTTTTTCACTGTCAAAACTTAAGTAAGTGTATTCTATTCTGTATGTATGCATTTAAGTTGTTTTTTTCTTTTAAGGAATAAAAACAGGTAAAACTAATACTTTAGGCCAGTGACTTCCTTAGCTTTTTGAAAACATTGACACACAGGAAGAAATAAATTTCATAACACAAAAAAAAAAAAA

(서열번호:247)

호모 사피엔스 IFT88 3'-UTR

IFT88-001 ENST00000351808

TATTCACTTTAATATTTATTAAAGGAAAGAAATTGCCTTATGAGATCATCCTCATGTTAAACCTTGGATTAAATATCTAACCTGTAATTATTTTTTTTCACTGTCAAAACTTAAGTAAGTGTATTCTATTCTGTATGTATGCATTTAAGTTGTTTTTTTCTTTTAAGGAATAAAAACAGGTAAAACT

(서열번호:248)

호모 사피엔스 NDUFB3 3'-UTR

NM_002491

AGATAATACCTGGAAGCATCATAGTGGTTTCTTAACTCTCCAAAATAAGATTTCTTCTCTGTAGCCTACTTGTCTGGTTTATCCCTTACAGAATATTAGTAAGATTTAATCAATTAAAATATATATATATGCCAAAAAAAAAAAAAAAAA

(서열번호:249)

호모 사피엔스 ANO10 3'-UTR

NM_018075

GTGCCCAGCGTGCCCAGCTGCCCTGTTGGCAGAGGCCTGTGTCTGTGCCACACCTGCCACGGTGGCAGGGGGGGTACCCGGGGCAGCATCGTGGCTCCTGAACCCAGACCCAATGCTTAGCCAAACGAAGTGGCTCCCATGTGGCAAGCACCCTTCTCAGTTTCGCAGTGGCTTGGCTCGGGATCCTTGGCAGTTCCCCCAGCCCCACCCTGTCTGCTCCTTCCCAGTTCCTTCCCGGGCCCCACACGCTGCTCCAGCTGCCAACTTTGCTGCAGAGCCACTGCCGCCCTTGAGCCTCTCACCATGAGTGAGCCACCAGCTCTCCACGTTCCCCTCATAGCAGTGTCACTCCCAACCCCACCATGGCCCAGGGACCCGTGGACAGGTTGGGGATGGGGTGTGTGCCCACTGTGCTCATCACAGGAGCCTCAGTTGAGAGTGAGCGGGGTACAGTAAGGCAGTGCTTCCCACACTGGACCTCTTTCCTGGTTCTCTTTTGCAATACATTAACAGACCCTTTATCAACATAAACAATAGTAACTGAGCTATTAAAGGCAACCTCTCTGACTCCTTCTGCCTAAAAAAAAAA

(서열번호:250)

호모 사피엔스 ANO10 3'-UTR

ANO10-005 ENST00000451430

GTGCCCAGCGTGCCCAGCTGCCCTGTTGGCAGAGGCCTGTGTCTGTGCCACACCTGCCACGGTGGCAGGGGGGGTACCCGGGGCAGCATCGTGGCTCCTGAACCCAGACCCAATGCTTAGCCAAACGAAGTGGCTCCCATGTGGCAAGCACCCTTCTCAGTTTCGCAGTGGCTTGGCTCGGGATCCTTGGCAGTTCCCCCAGCCCCACCCTGTCTGCTCCTTCCCAGTTCCTTCCCGGGCCCCACACGCTGCTCCAGCTGCCA

(서열번호:251)

호모 사피엔스 ARL6 3'-UTR

NM_032146

AAAGATAATAGTTGGAAACCTCAGCAATTTTCAATTCAAGGAATCTATCTAAGACAAATAGAATACATTTTGTAAAAGATGTTTATGCATCAAAAAATATAATTTTCTGCTTGCATTTATGGACTCTGACCTTTTTAAGAACATAGGACTTCAGGTATGCTAATTTGGCCATTAATTATTTAAAAACTAAATATTCCCTCAAAAGGGCTCCCTAGAATTATCAAGTTCTTAGTGAAGGTCTACATTTGATTGTACGTAGAATGTTTAAAAGTCAGTTATAAGCCATCTCATCCCATCATAATTTATGATATGTTTAATATATTTTATTTTTTAATTGTCTTTTTAAAAAATTTAGTTTATGACTTTGCAGTATGAATTGTGCTTGTGAAAAAGAACTTTAAATATTTATAAGGGACCATGGGTAATTAATATATATTCAATTTTTACTATGTGTCACTGTCAATAAAATGTAAAATATAATGTGCC

(서열번호:252)

호모 사피엔스 LPCAT3 3'-UTR

NM_005768

TCCATTTCCCTGGTGGCCTGTGCGGGACTGGTGCAGAAACTACTCGTCTCCCTTTTCACAGCACTCCTTTGCCCCAGAGCAGAGAATGGAAAAGCCAGGGAGGTGGAAGATCGATGCTTCCAGCTGTGCCTCTGCTGCCAGCCAAGTCTTCATTTGGGGCCAAAGGGGAAACTTTTTTTTGGAGAAGGCGTCTTGCTTTGTCACCCACGCTGGAATGCAGTGGCGGGATCTCAGCTCACCGCAACCTCCACCTCCTGGGTTCAAGTGATTTTCCTGCCTCAGCCTCCCAAGTAGCTGGGAATACAGGCACGCCACCATGCCCAGCTAATTTTTGTATTTTCAGTAGAAACGGGATTTCACCACGTTGGCCAGGCTGGTCTCGAACTCCTGACCGCAAGTGATCCACCCGCCTCCGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCGTGCCCGGCCCAAAGGGGAAACTCTTGTGGGAGGAGCAGAGGGGCTCACATCTCCCCTCTGATTCCCCCATGCACATTGCCTTATCTCTCCCCATCTAGCCAGGAATCTATTGTGTTTTTCTTCTGCCAATTTACTATGATTGTGTATGTGCCGCTACCACCACCCCCCCCATGGGGGGGTGGAGAGGGGTGCAAGGCCCTGCCTGCTCCACTTTTTCTACCTTGGAACTGTATTAGATAAAATCACTTCTGTTTGTTCAGTTTTTCA

(서열번호:253)

호모 사피엔스 ABCD3 3'-UTR

NM_001122674

AAACCAGACAAATGTATTGGCCAGGCGTGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGATGGGAGGATCGCTTGAATCCAGGAGTTCGAGACAAGCCTGGACAAAAAGCGAGACCCGCTTCTTTAAAAAATAATAATAAAACA

(서열번호:254)

호모 사피엔스 COPG2 3'-UTR

NM_012133

ATGCTTACTGGACAAGAGGAAACTGATGCACACTACATGGTCAGTGGGCTTTTAGGCTAGTGGCATCAGTTTCCCAGAATCAGACTTTTGAAGATGAATGACTTTGGAGAAGCAAATTAAACATTTGGCCCTGAGCCAGCAGATCAAGCAAATGTCTATCTTTGCGCATGGGTTGTTTTTTTTTTTTTTCTTTTTATTCTACTTGGTCAGCTTTGGGACGATAGTGCAGCTTTGGGTGATCTTGAAAATCAAATACTATCCTATACTCCAGCTGCTTAACTTCATTTTATTCTTTAATGTGTACCTGAAAGCTCCTGGCAATGCTGGAAAATTTTTATCCCAGAGGGGTGGGGGGGAGGGGGGAGGGGAAGCCAGAGTCCACTTTTGTCACAATTCATTTTTATTAATAGAAAATAAACACTTATTCCAGTTTCAAAAAAAAAAAAAA

(서열번호:255)

호모 사피엔스 MIPEP 3'-UTR

NM_005932

AAGAAACACTCTACACCTCTTAAATCAAGGTCATGTAGATAATGACTTTGTTATAAATGCTACAGCTGTGAGAGCTTGTTTCTGATTTCATTGTTCGCTTCTGTAATTCTGAAAAACTTTAAACTGGTAGAACTTGGAATAAATAATTTGTTTTAATTAAAAAAAAAAAAAAAAAA

(서열번호:256)

호모 사피엔스 LEPR 3'-UTR

NM_002303

TTTCACTGAAGAAACCTTCAGATTTGTGTTATAATGGGTAATATAAAGTGTAATAGATTATAGTTGTGGGTGGGAGAGAGAAAAGAAACCAGAGTCAAATTTGAAAATAATTGTTCCAAATGAATGTTGTCTGTTTGTTCTCTCTTAGTAACATAGACAAAAAATTTGAGAAAGCCTTCATAAGCCTACCAATGTAGACACGCTCTTCTATTTTATTCCCAAGCTCTAGTGGGAAGGTCCCTTGTTTCCAGCTAGAAATAAGCCCAACAGACACCATCTTTTGTGAGATGTAATTGTTTTTTCAGAGGGCGTGTTGTTTTACCTCAAGTTTTTGTTTTGTACCAACACACACACACACACACATTCTTAACACATGTCCTTGTGTGTTTTGAGAGTATATTATGTATTTATATTTTGTGCTATCAGACTGTAGGATTTGAAGTAGGACTTTCCTAAATGTTTAAGATAAACAGAATTC

(서열번호:257)

호모 사피엔스 LEPR 3'-UTR

NM_001198688

GAAATGCTTGTAGACTACGTCCTACCTCGCTGCCGCACCTGCTCTCCCTGAGGTGTGCACAATG

(서열번호:258)

호모 사피엔스 C2orf76 3'-UTR

NM_001017927

AAACATCTCGAGGGCTTCCTTTTTGCAT

(서열번호:259)

호모 사피엔스 C2orf76 3'-UTR

C2orf76-001 ENST00000409466

AAACATCTCGAGGGCTTCCTTTTTGCATACCTGTATTAAGCTCTTTATTCCACTGCTGAATTTTTGAAATTGACAAACAAATCTTAAAAAATTAATCCCAGGCTATACTCTTTGAGCTAAAATCTGGTTATTTCTTTCTCTTCAGGTCTTTCCTTCTCTCTTTCTTTTTCTTTGTTGTTGTAAAATAATATATTATGAGAAAAACATTTGATCTTTTTAAAGGGAAATAAATTGTTATTAAAAA

(서열번호:260)

호모 사피엔스 ABCA6 3'-UTR

NM_080284.2

AACCTCAAACCTAGTAATTTTTTGTTGATCTCCTATAAACTCATGTTTTATGTAATAATTAATAGTATGTTTAATTTTAAAGATCATTTAAAATTAACATCAGGTATATTTTGTAAATTTAGTTAACAAATACATAAATTTTAAAATTATTCTTCCTCTCAAACATAGGGGTGATAGCAAACCTGTGATAAAGGCAATACAAAATATTAGTAAAGTCACCCAAAGAGTCAGGCACTGGGTATTGTGGAAATAAAACTATATAAACTT

(서열번호:261)

호모 사피엔스 LY96 3'-UTR

NM_015364.4

AATAAATTGAGTATTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:262)

호모 사피엔스 CROT 3'-UTR

NM_ 001243745.1

TGATGATGTTTAAAGAATGATAAATAAAAAGTGCATAGTTTTTATTTTTAAATTATTGCTGTAAAAATTTTTACAGTTATTATTGTTATTTTCATAATCCAAAAGAAGGAATGAATCACTTAACTTTGGGAGTTTTCAGTGGGTGGATTCGGGAACTTGTTAAAATGCAGATTTGCTGGGATAAGTGATTCTGATTCACATGGCTGGAATGAGGCCCAGAGATTCTTATTTTAACAATCACTTCATGTGGTTTGGCTGCAGGTAATCTGTAGACCATGCTGAAGGAAAACATTTTGTCCAGGTGACTAGCTTGAAAAATCAGAAACACTAAAATAGACATGTCACATAGGTGGCATAGAAATATTTTCGTAGTACAATGGAGAAAGGGAATCATTAAAAATCAGAGTGGAGAATGGTTATGTATATTGTATATTTCAGTTAGATAAATTGAGGAAGCTAGTATAATAATTATTGAAGGTCTCAATAATTTTCCACAAAATTCTTTAACTTCTTCAGCTCAACCATTTCTGTACTTCTCTACTATGAATCAGAGGATGAGGTTGTATAATTCAAAAGCATTGCCTTAGTCTAGAAATAATTATTGTACCTATCATTTAGTTTTAGAAATAAAAAGCAAGCTGATTTTTTTTGATGAACCATTTATATCTGTGATGGAATAATAAAATTTCACACTTCCGGATTCCTTTGTTCTCAATTTTGAGCCTTGAGTTGTTTTAATTAAAGAGGGGTAAAGG

(서열번호:263)

호모 사피엔스 ENPP5 3'-UTR

ENPP5-002 ENST00000230565

TGTTACTTTGAAGTGGATTTGCATATTGAAGTGGAGATTCCATAATTATGTCAGTGTTTAAAGGTTTCAAATTCTGGGAAACCAGTTCCAAACATTTGCAGAAACCATTAAGCAGTTACATATTTAGGTATACACACACACACACACACACATACACACACACGGACCAAAATACTTACACCTGCAAAGGAATAAAGATGTGAGAGTATGTCTCCATTGTTCACTGTAGCATAGGGATAGATAAGATCCTGCTTTATTTGGACTTGGCGCAGATAATGTATATATTTAGCAACTTTGCACTATGTAAAGTACCTTATGTATTGCACTTTAAATTTCTCTCCTGATGGGTACTTTAATTTGAAATGCACTTTATGCACAGTTATGTCTTATAACTTGATTGAAAATGACAACTTTTTGCACCCATGTCACAGAATACTTGTTACGCATTGTTCAAACTGAAGGAAATTTCTAATAATCCCGAATAATGAACGTAGAAATCTATCTCCATAAATTGAGAGAAGAAGAAGGTGATAAGTGTTGAAAATTAAATGTGATAACCTTTGAACCTTGAATTTTGGAGATGTATTCCCAACAGCAGAATGCAACTGTGGGCATTTCTTGTCTTATTTCTTTCCAGAGAACGTGGTTTTCATTTATTTTTCCCTCAAAAGAGAGTCAAATACTGACAGATTCGTTCTAAATATATTGTTTCTGTCATAAAATTATTGTGATTTCCTGATGAGTCATATTACTGTGATTTTCATAATAATGAAGACACCATGAATATACTTTTTTTCTATATAGTTCAGCAATGGCCTGAATAGAAGCAACCAGGCACCATCTCAGCAATGTTTTCTCTTGTTTGTAATTATTTGCTCCTTTGAAAATTAAATCACTATTAATTACATTAA

(서열번호:264)

호모 사피엔스 SERPINB7 3'-UTR

SERPINB7-203 ENST00000546027

AAATCCAATTGGTTTCTGTTATAGCAGTCCCCACAACATCAAAGAACCACCACAAGTCAATAGATTTGAGTTTAATTGGAAAAATGTGGTGTTTCCTTTGAGTTTATTTCTTCCTAACATTGGTCAGCAGATGACACTGGTGACTTGACCCTTCCTAGACACCTGGTTGATTGTCCTGATCCCTGCTCTTAGCATTCTACCACCATGTGTCTCACCCATTTCTAATTTCATTGTCTTTCTTCCCACGCTCATTTCTATCATTCTCCCCCATGACCCGTCTGGAAATTATGGAGAGTGCTC

(서열번호:265)

호모 사피엔스 TCP11L2 3'-UTR

NM_152772

AGAAGAACTGACATTGGACGAGAGATTGGAAATCCAGTACTTTGGTATCCAGTCCACTTCCATTGATGGCATTAGAGATCCAGCACATTCTCAGTACTGTGGTGCAGTATTAGCCCAAATCTGTGTAATGGGTAATATTAGCATTACAGAAGACACACACATCACATAGACCCTCAGAAGACGTAAACATCACATAGACCCTATTTGTGCATCATTTTCAAGTTTAAAACAGATATTTGTAATGAACAGAAAACAATTTGTAATTAATTATATTACCTATATAATACTTGTAAATGTTTTCTTAACCATTTATATTTGGCTTATGACATTTAACCCCTAAGGAGTTGTTTTTCTCACTTGTTATTATCAAACCTAATGGTTTTTAATTTTGGTACAACTCCTTAAAGGGTTGAAGGTTGTGACAATAACTGAGGGAACTGATGTTCTGAATAAATGATGTGAAGTAAACACAATTGTATTTGAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:266)

호모 사피엔스 IRAK1BP1 3'-UTR

NM_001010844

AATTCCAAACAAATTATATTGTACTTGTATCTTTTTACCTATTTTTATACTTTTTATAATGTTTACGTTTGTCCTGAATATATA

(서열번호:267)

호모 사피엔스 CDKL2 3'-UTR

CDKL2-002 ENST00000307465

GAACCATTTTGGTTCTGAACTGGATGATGCTCTTGCACTTGAGATGACATCTTCTTGCAGCAAGAGTGCTGATATCCCAAGAGGAGAGATTCATGGTTTTGATCATTTCCTTCTGAACTGCCTGCATTTTCTGAGGAAGGCCTTCTAGAAGAAGGAAAGACAAAGACTTCCAAATGTTTCAAAGGAAGATTGAACAAATGGCCCTCCCCAACTGTTATCCCATTACCTTTCACGTCCACCGATGCTATTTCAAGACATATCCAGTGGAATAACAGTGATATGGTTCTTGTTACATGAATGTGTATTTACTGTTAGGAGATTGTATATTTTAAGTTACC

(서열번호:268)

호모 사피엔스 GHR 3'-UTR

GHR-202 ENST00000537449

CCTTTCTTTGGTTTCCCAAGAGCTACGTATTTAATAGCAAAGAATTGACTGGGGCAATAACGTTTAAGCCAAAACAATGTTTAAACCTTTTTTGGGGGAGTGACAGGATGGGGTATGGATTCTAAAATGCCTTTTCCCAAAATGTTGAAATATGATGTTAAAAAAATAAGAAGAATGCTTAATCAGATAGATATTCCTATTGTGCAATGTAAATATTTTAAAGAATTGTGTCAGACTGTTTAGTAGCAGTGATTGTCTTAATATTGTGGGTGTTAATTTTTGATACTAAGCATTGAATGGCTATGTTTTTAATGTATAGTAAATCACGCTTTTTGAAAAAGCGAAAAAATCAGGTGGCTTTTGCGGT

(서열번호:269)

호모 사피엔스 KIAA1107 3'-UTR

NM_015237

GTGTTAACATTTTGGAAAAATTTATGCCACTCCTTTATTTTTTGATGCCTATATTATATCCAAATGATAATTGCATTAGCCGGATATAAACTTTCTTTAATATTGAGTCTTTCCAATTTAATGAGGTAAACATAGTTTATTTATTAATATATCACATATAGAAAAATGTTTTTCTAAAGTTTTTGAGCATGTTTTCTCTAATTATTAGAGAAATTAGAAGACTTATAAGGAAACCCTAGCTTCAGTTTTCCTTTCCTAGCTGATGATTTGTTCACTTAATCATTATTCAAGAATTTAAAATGTGAATGCAGAAGTAGATCAGTCCCTTTACTTTTTGCTCTGCATAGGGTAACATAGTAATTTAACAATAAAAACTTACCGTGCTTGTGTCCAAAAAAAAAAAAAA

(서열번호:270)

호모 사피엔스 RPS6KA6 3'-UTR

RPS6KA6-001 ENST00000262752

GATTTGTGGTGTTCCTAGGCCAAACTGGATGAAGATGAAATTAAATGTGTGGCTTTTTTCCTATTCTTATCAAAGGCATCGTTGTCTGCTAAATTACTTGAATATTAAGTAATATTAAATCCCCATTTTTAGGGGAAGTGAGATTTAAAAAACCATTCACAGGTCCACAATATTCATACTATGTGTTTGCAGTAGTGTTCAAGTGTTTATTTAAGCATATAATTGGTGTCCACCAGGTCCTCACAACTTCTCTGCACACAAGCTTCTAAAATTCCTTTCAAATAAAGTTACTTTAATATTT

(서열번호:271)

호모 사피엔스 CLGN 3'-UTR

NM_004362, NM_001130675

ACTAGATTGAAATATTTTTAATTCCCGAGAGGGATGTTTGGCATTGTAAAAATCAGCATGCCAGACCTGAACTTTAATCAGTCTGCACATCCTGTTTCTAATATCTAGCAACATTATATTCTTTCAGACATTTATTTTAGTCCTTCATTTCAGAGGAAAAAGAAGCAACTTTGAAGTTACCTCATCTTTGAATTTAGAATAAAAGTGGCACATTACATATCGGATCTAAGAGATTAATACCATTAGAAGTTACACAGTTTTAGTTGTTTGGAGATAGTTTTGGTTTGTACAGAACAAAATAATATGTAGCAGCTTCATTGCTATTGGAAAAATCAGTTATTGGAATTTCCACTTAAATGGCTATACAACAATATAACTGGTAGTTCTATAATAAAAATGAGCATATGTTCTGTTGTGAAGAGCTAAATGCAATAAAGTTTCTGTATGGTTGTTTGATTCTATCAACAATTGAAAGTGTTGTATATGACCCACATTTACCTAGTTTGTGTCAAATTATAGTTACAGTGAGTTGTTTGCTTAAATTATAGATTCCTTTAAGGACATGCCTTGTTCATAAAATCACTGGATTATATTGCAGCATATTTTACATTTGAATACAAGGATAATGGGTTTTATCAAAACAAAATGATGTACAGATTTTTTTTCAAGTTTTTATAGTTGCTTTATGCCAGAGTGGTTTACCCCATTCACAAAATTTCTTATGCATACATTGCTATTGAAAATAAAATTTAAATATTTTTTCATCCTGAAAAAAAA

(서열번호:272)

호모 사피엔스 CLGN-202 3'-UTR

NM_004362, NM_001130675

ENST00000325617

ACTAGATTGAAATATTTTTAATTCCCGAGAGGGATGTTTGGCATTGTAAAAATCAGCATGCCAGACCTGAACTTTAATCAGTCTGCACATCCTGTTTCTAATATCTAGCAACATTATATTCTTTCAGACATTTATTTTAGTCCTTCATTTCAGAGGAAAAAGAAGCAACTTTGAAGTTACCTCATCTTTGAATTTAGAATAAAAGTGGCACATTACATATCGGATCTAAGAGATTAATACCATTAGAAGTTACACAGTTTTAGTTGTTTGGAGATAGTTTTGGTTTGTACAGAACAAAATAATATGTAGCAGCTTCATTGCTATTGGAAAAATCAGTTATTGGAATTTCCACTTAAATGGCTATACAACAATATAACTGGTAGTTCTATAATAAAAATGAGCATATGTTCTGTTGTGAAGAGCTAAATGCAATAAAGTTTCTGTATGGTTGTTTGATTCTATCAAC

(서열번호:273)

호모 사피엔스 TMEM45A 3'-UTR

NM_018004

CTTTGATGAGCTTCCAGTTTTTCTAGATAAACCTTTTCTTTTTTACATTGTTCTTGGTTTTGTTTCTCGATCTTTTGTTTGGAGAACAGCTGGCTAAGGATGACTCTAAGTGTACTGTTTGCATTTCCAATTTGGTTAAAGTATTTGAATTTAAATATTTTCTTTTTAGCTTTGAAAATATTTTGGGTGATACTTTCATTTTGCACATCATGCACATCATGGTATTCAGGGGCTAGAGTGATTTTTTTCCAGATTATCTAAAGTTGGATGCCCACACTATGAAAGAAATATTTGTTTTATTTGCCTTATAGATATGCTCAAGGTTACTGGGCTTGCTACTATTTGTAACTCCTTGACCATGGAATTATACTTGTTTATCTTGTTGCTGCAATGAGAAATAAATGAATGTATGTATTTTGGTGC

(서열번호:274)

호모 사피엔스 TBC1D8B 3'-UTR

TBC1D8B-007 ENST00000276175

ATCCCTAGGAATTGCCTATCATAGACAAGTTTACTAACATTCCTGTAGCTGTCAGTTTGATTCCTGTGAGTAGGGCTCAGGGATTTATCTTGTTACCAATGTGTCTGAAGGCCAAAATATATATCCAGAAGCACAATGCATCATTCCTTTGT

(서열번호:275)

호모 사피엔스 ACP6 3'-UTR

NM_016361

CTGATTTATAAAAGCAGGATGTGTTGATTTTAAAATAAAGTGCCTTTATACAATGCCAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:276)

호모 사피엔스 RP6-213H19.1 3'-UTR

MST4-003 (RBM4B-003 ENST00000496850)

GAAACTTATTATTGGCTTCTGTTTCATATGGACCCAGAGAGCCCCACCAAACCTACGTCAAGATTAACAATGCTTAACCCATGAGCTCCATGTGCCTTTTGGATCTTTGCA

(서열번호:277)

호모 사피엔스 SNRPN 3'-UTR

NM_022807

CATACTGTTGATCCATCTCAGTCACTTTTTCCCCTGCAATGCGTCTTGTGAAATTGTGTAGAGTGTTTGTGAGCTTTTTGTTCCCTCATTCTGCATTAATAATAGCTAATAATAAATGCATAGAGCAATTAAACTGTG

(서열번호:278)

호모 사피엔스 GLRB 3'-UTR

GLRB-005 ENST00000512619

GATCTAATGACTTCAGCATTGTTGGAAGCTTACCAAGAGATTTTGAACTATCCAATTATGACTGCTATGGAAAACCCATTGAAGTTAACAACGGACTTGGGAAATCTCAGGCTAAGAACAACAAGAAGCCTCCCCCTGCGAAACCTGTTATTCCAACAGCAGCAAAGCGAATTGATCTTTATGCAAGAGCATTGTTTCCTTTCTGCTTCTTGTTCTTCAATGTTATATATTGGTCTATATATTTATGATAAATCTTTTCCATTTGTACAAAATAAAATTCCATTTCATTGTGACCTACTCCTTTCATAAATGCCAATCTGTGAGAACTTTTGAATTTTCATAGCAACATTGCATTTTGGATGCCATTTGATTGTAATAAAACTGTGGCACCTTAATTTTGAATGGCAGCATGATCATGTAATATC

(서열번호:279)

호모 사피엔스 HERC6 3'-UTR

NM_017912

TCACCTCTGAGAGACTCAGGGTGGGCTTTCTCACACTTGGATCCTTCTGTTCTTCCTTACACCTAAATAATACAAGAGATTAATGAATAGTGGTTAGAAGTAGTTGAGGGAGAGATTGGGGGAATGGGGAGATGATGATGATGGTCAAAGGGTGCAAAATCTCACACAAGACTGAGGCAGGAGAATAGGGTACAGAGATAGGGATCTAAGGATGACTTGGACACACTCCCTGGCACTGAAGAGTCTGAACACTGGCCTGTGATTGGTCCATTCCAGGACCTTCATTTGCATAAGGTATCAAACCACATCAGCCTCTGATTGGCCATGGGCCAGACCTGCACTCTGGCCAATGATTGGTTCATTCCAGGACATTCATTTGCATAAGGAGTCAAACCACACCAGTCTTGGATTGGCTGTGAGCCAATTCACCTCAGTCTCTAATTGGCTGTGAGTCAGTCTTTCATTTACATAGGGTGTAACCATCAAGAAACCTCTACAGGGTACTTAAGCCCCAGAAGATTTTGCTACCAGGGCTCTTGAGCCACTTGCTCTAGCCCACTCCCACCCTGTGGAATGTACTTTCACTTTTGCTGCTTCACTGCCTTGTGCTCCAATAAATCCACTCCTTCACCACCCAAAAAAAAAAAAAAA

(서열번호:280)

호모 사피엔스 CFH 3'-UTR

NM_000186

AATCAATCATAAAGTGCACACCTTTATTCAGAACTTTAGTATTAAATCAGTTCTCAATTTCATTTTTTATGTATTGTTTTACTCCTTTTTATTCATACGTAAAATTTTGGATTAATTTGTGAAAATGTAATTATAAGCTGAGACCGGTGGCTCTCTTCTTAAAAGCACCATATTAAATCCTGGAAAACTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:281)

호모 사피엔스 GALC 3'-UTR

GALC-002 ENST00000393569

TACTTAACAGGGCATCATAGAATACTCTGGATTTTCTTCCCTTCTTTTTGGTTTTGGTTCAGAGCCAATTCTTGTTTCATTGGAACAGTATATGAGGCTTTTGAGACTAAAAATAATGAAGAGTAAAAGGGGAGAGAAATTTATTTTTAATTTACCCTGTGGAAGATTTTATTAGAATTAATTCCAAGGGGAAAACTGGTGAATCTTTAACATTACCTGGTGTGTTCCCTAACATTCAAACTGTGCATTGGCCATACCCTTAGGAGTGGTTTGAGTAGTACAGACCTCGAAGCCTTGCTGCTAACACTGAGGTAGCTCTCTTCATCTTATTTGCAAGCGGTCCTGTAGATGGCAGTAACTTGATCATCACTGAGATGTATTTATGCATGCTGACCGTGTGT

(서열번호:282)

호모 사피엔스 GALC 3'-UTR

GALC-005 ENST00000393568

TACTTAACAGGGCATCATAGAATACTCTGGATTTTCTTCCCTTCTTTTTGG

(서열번호:283)

호모 사피엔스 PDE1A 3'-UTR

NM_001003683.2

ACACCTTTAAGTAAAACCTCGTGCATGGTGGCAGCTCTAATTTGACCAAAAGACTTGGAGATTTTGATTATGCTTGCTGGAAATCTACCCTGTCCTGTGTGAGACAGGAAATCTATTTTTGCAGATTGCTCAATAAGCATCATGAGCCACATAAATAACAGCTGTAAACTCCTTAATTCACCGGGCTCAACTGCTACCGAACAGATTCATCTAGTGGCTACATCAGCACCTTGTGCTTTCAGATATCTGTTTCAATGGCATTTTGTGGCATTTGTCTTTACCGAGTGCCAATAAATTTTCTTTGAGCAGCTAATTGCTAATTTTGTCATTTCTACAATAAAGCTTGGTCCACCTGTTTTC

(서열번호:284)

호모 사피엔스 PDE1A 3'-UTR

PDE1A-003 ENST00000410103

ACACCTTTAAGTAAAACCTCGTGCATGGTGGCAGCTCTAATTTGACCAAAAGACTTGGAGATTTTGATTATGCTTGCTGGAAATCTACCCTGTCCTGTGTGAGACAGGAAATCTATTTTTGCAGATTGCTCAATAAGCATCATGAGCCACATAAATAACAGCTGTAAACTCCTTAATTCACCGGGCTCAACTGCTACCGAACAGATTCATCTAGTGGCTACATCAGCACCTTGTGCTTTCAGATATCTGTTTCAATGGCATTTTGTGGCATTTGTCTTTACCGAGTGCCAATAAATTTTCTTTGAGCA

(서열번호:285)

호모 사피엔스 GSTM5 3'-UTR

NM_000851

GGCCCAGTGATGCCAGAAGATGGGAGGGAGGAGCCAACCTTGCTGCCTGCGACCCTGGAGGACAGCCTGACTCCCTGGACCTGCCTTCTTCCTTTTTCCTTCTTTCTACTCTCTTCTCTTCCCCAAGGCCTCATTGGCTTCCTTTCTTCTAACATCATCCCTCCCCGCATCGAGGCTCTTTAAAGCTTCAGCTCCCCACTGTCCTCCATCAAAGTCCCCCTCCTAACGTCTTCCTTTCCCTGCACTAACGCCAACCTGACTGCTTTTCCTGTCAGTGCTTTTCTCTTCTTTGAGAAGCCAGACTGATCTCTGAGCTCCCTAGCACTGTCCTCAAAGACCATCTGTATGCCCTGCTCCCTTTGCTGGGTCCCTACCCCAGCTCCGTGTGATGCCCAGTAAAGCCTGAACCATGCCTGCCATGTCTTGTCTTATTCCCTGAGGCTCCCTTGACTCAGGACTGTGCTCGAATTGTGGGTGGTTTTTTGTCTTCTGTTGTCCACAGCCAGAGCTTAGTGGATGGGTGTGTGTGTGTGTGTGTTGGGGGTGGTGATCAGGCAGGTTCATAAATTTCCTTGGTCATTTCTGCCCTCTAGCCACATCCCTCTGTTCCTCACTGTGGGGATTACTACAGAAAGGTGCTCTGTGCCAAGTTCCTCACTCATTCGCGCTCCTGTAGGCCGTCTAGAACTGGCATGGTTCAAAGAGGGGCTAGGCTGATGGGGAAGGGGGCTGAGCAGCTCCCAGGCAGACTGCCTTCTTTCACCCTGTCCTGATAGACTTCCCTGATCTAGATATCCTTCGTCATGACACTTCTCAATAAAACGTATCCCACCGTATTGTAAAAAAAAAAAAAAA

(서열번호:286)

호모 사피엔스 CADPS2 3'-UTR

CADPS2-002 ENST00000412584

TATCACACAGCTTTGCAGAAGGAAGGAAGACCTTGATCGACATTGTTTTTTATTTTTTTAACCTTGTCCTTGTAATTACATTCATTGTTTGTTTTGGCCAAATAAAAATGCTTGTATTTCTTTAAAAAGTAAGCCTGAATGTAGAGTAAAAGGGGAAATGCCAAGATTTTGGGGTTTTTTTGTTTCCTTTTTTTGTTTGTTTGTTTGTTTGTTTTTTTGGAGAAGAGCATCCTCTTTTGTGTAGTTTGACCTAAAAATGAACCTTGGCTCTGCTTGTGATCAGAACATGAACTTTTTTTTTTAAAGAAGATTTGAGCATTTTTCTGTAATCACATCAAAATGATGTTTTCTGTGTAAAGCGAGATACATATTTCTCATAATGCAGCATTGTGAGAAGTCAGTTCGGACCACTGCACCAA

(서열번호:287)

호모 사피엔스 CADPS2 3'-UTR

CADPS2-001 ENST00000449022

TATCACACAGCTTTGCAGAAGGAAGGAAGACCTTGATCGACATTGTTTTTTATTTTTTTAACCTTGTCCTTGTAATTACATTCATTGTTTGTTTTGGCCAAATAAAAATGCTTGTATTTCTTTAAAAAGTAAGCCTGAATGTAGAGTAAAAGGGGAAATGCC

(서열번호:288)

호모 사피엔스 AASS 3'-UTR

AASS-001 ENST00000417368

TTGGGAATTATATTTTGTTTTTTTCTTCCCAGGCAATACACCTCTGAACATGTGTGTGATAAATGGGTTTGCTAATGTGCTGTTTTAAAGTATAAAGCATAATATGTTTTGGTTAACACAATGTACTTTTTGAACTATAAATCTTTATTTTAATATGGAAATGTTTGGAACAGGAGATGCAAGCCACTAACAGAGAACTTTAATAATTCTACCCTGTATTTTATAAATACGTATGTGAAAGTGATGA

(서열번호:289)

호모 사피엔스 TRIM6-TRIM34 3'-UTR

NM_001003819

ATTTTCTCATTTCTTCACCTACAACCCTTTGTCTTGACTTATCTCCTGCAACTGACTCATCTGCAACATTCACACCATTGCTTCCTTGTGGTTTCCCTTCTTTAGAACTTTTACTCATCCTTGAGATGTATGGTGTATTTGGCTTGAGTTATGAGAGATGCTTATTTATTCATTTACTCTTTTTCATATTTTCAGAGAAAGTTACCTAATCCCTCCTAAAGACACAGCAGTATGGGTATAACATCCTTGCCTTCCCATTTATCCATGTTTCACTTTATCACTGATATGAAGAGGCCCAAAGCCTGTTAGCCACCATCCATGCTACCTAGGTAGTCCATAGGAACCACCCCCATGACCACCACCAACATCAACTAAAGGTTCTTGGAGGGTATGTCAGTGTGTTGCTCAGGATACCCCAGGTACATCAAGGAATCAAGGAGAGGAAAATATGAGCAATATGTGTATTCAGAGTGAAGATTTTATGTCCAGAGTATTTGAGCTCAAACCTTGCCTGTTGTTTTCTAATCATGATGAATACTTTCTCAGTTTCTTTTTCCTGAAATATAAATTGGGATTTAAGACTGTACCTAACTATTAAGATCACTGTGTAAAACTAAGTGTCTCTAAATGTAATGCATCGATTTAGTGTCTGGAACATAATAAATATTTGCTCTCATGATTGCTAAAAAAAAAAA

(서열번호:290)

호모 사피엔스 SEPP1 3'-UTR

NM_005410

ATATTTAAAATAGGACATACTCCCCAATTTAGTCTAGACACAATTTCATTTCCAGCATTTTTATAAACTACCAAATTAGTGAACCAAAAATAGAAATTAGATTTGTGCAAACATGGAGAAATCTACTGAATTGGCTTCCAGATTTTAAATTTTATGTCATAGAAATATTGACTCAAACCATATTTTTTATGATGGAGCAACTGAAAGGTGATTGCAGCTTTTGGTTAATATGTCTTTTTTTTTCTTTTTCCAGTGTTCTATTTGCTTTAATGAGAATAGAAACGTAAACTATGACCTAGGGGTTTCTGTTGGATAATTAGCAGTTTAGAATGGAGGAAGAACAACAAAGACATGCTTTCCATTTTTTTCTTTACTTATCTCTCAAAACAATATTACTTTGTCTTTTCAATCTTCTACTTTTAACTAATAAAATAAGTGGATTTTGTATTTTAAGATCCAGAAATACTTAACACGTGAATATTTTGCTAAAAAAGCATATATAACTATTTTAAATATCCATTTATCTTTTGTATATCTAAGACTCATCCTGATTTTTACTATCACACATGAATAAAGCCTTTGTATCTTTCTTTCTCTAATGTTGTATCATACTCTTCTAAAACTTGAGTGGCTGTCTTAAAAGATATAAGGGGAAAGATAATATTGTCTGTCTCTATATTGCTTAGTAAGTATTTCCATAGTCAATGATGGTTTAATAGGTAAACCAAACCCTATAAACCTGACCTCCTTTATGGTTAATACTATTAAGCAAGAATGCAGTACAGAATTGGATACAGTACGGATTTGTCCAAATAAATTCAATAAAAACCTTAAAGCTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(서열번호:291)

호모 사피엔스 SEPP1 3'-UTR

SEPP1-004 ENST00000506577

ATATTTAAAATAGGACATACTCCCCAATTTAGTCTAGACACAATTTCATTTCCAGCATTTTTATAAACTACCAAATTAGTGAACCAAAAATAGAAATTAGATTTGTGCAAACATGGAGAAATCTACTGAATTGGCTTCCAGATTTTAAATTTTATGTCATAGAAATATTGACTCAAACCATATTTTTTATGATGGAGCAACTGAAAGGTGATTGCAGCTTTTGGTTAATATGTCTTTTTTTTTCTTTTTCCAGTGTTCTATTTGCTTTAATGAGAATAGAAACGTAAACTATGACCTAGGGGTTTCTGTTGGATAATTAGCAGTTTAGAATGGAGGAAGAACAACAAAGACATGCTTTCCATTTTTTTCTTTACTTATCTCTCAAAACAATATTACTTTGTCTTTTCAATCTTCTACTTTTAACTAATAAAATAAGTGGATTTTGTATTTTAAGATCCAGAAATACTTAACACGTGAATATTTTGCTAAAAAAGCATATATAACTATTTTAAATATCCATTTATCTTTTGTATATCTAAGACTCATCCTGATTTTTACTATCACACATGAATAAAGCCTTTGTATCTTT

(서열번호:292)

호모 사피엔스 PDE5A 3'-UTR

PDE5A-002 ENST00000264805

GTGGCCTATTTCATGCAGAGTTGAAGTTTACAGAGATGGTGTGTTCTGCAATATGCCTAG

(서열번호:293)

호모 사피엔스 SATB1 3'-UTR

SATB1-004 ENST00000417717

GATAAAAGTATTTGTTTCGTTCAACAGTGCCACTGGTATTTACTAACAAAATGAAAAGTCCACCTTGTCTTCTCTCAGAAAACCTTTGTTGTTCATTGTTTGGCCAATGAATCTTCAAAAACTTGCACAAACAGAAAAGTTGGAAAAGGATAATACAGACTGCACTAAATGTTTTCCTCTGTTTTACAAACTGCTTGGCAGCCCCAGGTGAAGCATCAAGGATTGTTTGGTATTAAAATTTGTGTTCACGGGATGCACCAAAGTGTGTACCCCGTAAGCATGAAACCAGTGTTTTTTGTTTTTTTTTTAGTTCTTATTCCGGAGCCTCAAACAAGCATTATACCTTCTGTGATTATGATTTCCTCTCCTATAATTATTTCTGTAGCACTCCACACTGATCTTTGGAAACTTGCCCCTTATTT

(서열번호:294)

호모 사피엔스 CCPG1 3'-UTR

CCPG1-002 ENST00000442196

TTCACAATTGAGTTAAATTAGACAACTGTAAGAGAAAAATTTATGCTTTGTATAATGTTTGGTATTGAAACTAATGAAATTACCAAGATGACAATGTCTTTTCTTTTGTTTCTAAGTATCAGTTTGATAACTTTATATTATTCCTCAGAAGCATTAGTTAAAAGTCTACTAACCTGCATTTTCCTGTAGTTTAGCTTCGTTGAATTTTTTTTGACACTGGAAATGTTCAACTGTAGTTTTATTAAGGAAGCCAGGCATGCAACAGATTTTGTGCATGAAATGAGACTTCCTTTCAGTGTAAGAGCTTAAAGCAAGCTCAGTCATACATGACAAAGTGTAATTAACACTGATGTTTGTGTTAAATTTGCAGCAGAGCTTGAGAAAAGTACATTGTTCTGGAATTTCATCATTAACATTTTATAATCTTACACTCACTTCTTGTCTTTTTGTGGGTTCAAGAGCCCTCTGACTTGTGAAGAATTTGCTGCCCTCTTAAGAGCTTGCTGACTTGTTTTCTTGTGAAATTTTTTGCACATCTGAATATCGTGGAAGAAACAATAAAACTACACCATGAGGAAAACTAAAGGTCTTTATTTAAAATCTGGCATTGTATTAACATGTAATTTTATACTATGTGGTATTTTATACATTTCCTCAGTAGTGATATTTGGTAAAGCAGTTCATACAGCTTTTTTCTAAGTTCCATGAATCTTACCCAGTGTTTACCGAAGTATTTAAGCAGCATCTGAATATTTCCACCCAGCAATGTTAATTTATCTAGGAAAGTTCAGAATTTCATCTTCATGTTGAATTTCCCTTTTAACTTCCGTTCATAGACATATATGTGACTTCCAATTCGACCCTCTGGCAAGTGAGTGTGGAAGAAAACAGCAGTTCTTTTATAATTGCTTGAAATTAGGAAAGCGCTTATTTCCTAGAAGCAAATAAATGTTTAAGTAAATAAAGGCTACATTTTGCTGA

(서열번호:295)

호모 사피엔스 CCPG1 3'-UTR

CCPG1-004 ENST00000425574

TTCACAATTGAGTTAAATTAGACAACTGTAAGAGAAAAATTTATGCTTTGTATAATGTTTGGTATTGAAACTAATGAAATTACCAAGATGACAATGTCTTTTCTTTTGTTTCTAAGTATCAGTTTGATAACTTTATATTATTCCTCAGAAGCATTAGTTAAAAGTCTACTAACCTGCATTTTCCTGTAGTTTAGCTTCGTTGAATTTTTTTTGACACTGGAAATGTTCAACTGTAGTTTTATTAAGGAAGCCAGGCATGCAACAGATTTTGTGCATGAAATGAGACTTCCTTTCAGTGTAAGAGCTTAAAGCAAGCTCAGTCATACATGACAAAGTGTAATTAACACTGATGTTTGTGTTAAATTTGCAGCAGAGCTTGAGAAAAGTACATTGTTCTGGAATTTCATCATTAACATTTTATAATCTTACACTCACTTCTTGTCTTTTTGTGGGTTCAAGAGCCCTCTGACTTGTGAAGAATTTGCTGCCCTCTTAAGAGCTTGCTGACTTGTTTTCTTGTGAAATTTTTTGCACATCTGAATATCGTGGAAGAAACAATAAAACTACACCATGAG

(서열번호:296)

호모 사피엔스 CNTN1 3'-UTR

CNTN1-002 ENST00000348761

ATGTGTTGTGACAGCTGCTGTTCCCATCCCAGCTCAGAAGACACCCTTCAACCCTGGGATGACCACAATTCCTTCCAATTTCTGCGGCTCCATCCTAAGCCAAATAAATTATACTTTAACAAACTATTCAACTGATTTACAACACACATGATGACTGAGGCATTCGGGAACCCCTTCATCCAAAAGAATAAACTTTTAAATGGATATAAATGATTTTTAACTCGTTCCAA

(서열번호:297)

호모 사피엔스 CNTN1 3'-UTR

CNTN1-004 ENST00000547849

TCGTTGACACTCACCATTTCTGTGAAAGACTTTTTTTTTTTTAACATATTATACTAGATTTGACTAACTCAATCTTGTAGCTTCTGCAGTTCTCCCCACCCCCAACCTAGTTCTTAGAGTATGTTTCCCCTTTTGAAACATGTAAACATACTTTGGGCATAAATATTTTTTAAAATATAACTATAATGCTTCACTAATACCTTAAAAATGCCTAGTGAACTAACTCAGTACATTATATAATGGCCAAGTGAAAGTTTTGTGTTTTCATGTCCTGTTTTTCTTTGAAATTATATAGCCCAGAAATTAGCTCATTATCTGAAAAACGTATGAAGAACTGATGAATTGTATAATACAGGAGTATTGCCATTGAATGTACTGTTTGATTTATTCAAGCAGGTAATGAACAATGTTGTCAAACTCTCTAATGAGACATCATAATTAGGACATAAGCTAAAAGGGGCATTACTCCGGCAGTCTTTTTTTCTTAATCCTAGTACCATACATATTCTTTGGCATGAAAGAATGAAAAGCATTAGTAAACAACTGAAGTCCTACCATGGCTCTGTAGGGTTTTTGGAACAATTCCTGGAATTGGAAAGTGAAAATGGATAGCATGTGGGGGAAACCCTCATCTGAGTAGCAAGATTTTAGTAAAGATGACTAAGCCATTAACAGCATGCATTCATATTTAATTTTATTGACTCCTGCCATCAGCTTTTGTAGATCGTTTGGGTGGAAGGTTGTGATTTTTACTGGGAGGACTTGAGTAGAAGTGGATGATTAAAATTGAGGAGTATATAATTCTTTCTGGGACTGCTTAAATGTTATTGTTTGAAAATACCTTCACTTTCCCCCTTTGGTCAAAGAGATGTGCTTAAAATTCTTATTCCTTCACAATAAATAATTTTGATTTTCTTAGACA

(서열번호:298)

호모 사피엔스 CNTN1 3'-UTR

CNTN1-004 ENST00000547849

+T at pos. 30bp, mutations G727bpT, A840bpG

TTTTTTCGTTGACACTCACCATTTCTGTGAA

AGACTTTTTTTTTTTTTAACATATTATACTAGATTTGACTAACTCAATCTTGTAGCTTCT

GCAGTTCTCCCCACCCCCAACCTAGTTCTTAGAGTATGTTTCCCCTTTTGAAACATGTAA

ACATACTTTGGGCATAAATATTTTTTAAAATATAACTATAATGCTTCACTAATACCTTAA

AAATGCCTAGTGAACTAACTCAGTACATTATATAATGGCCAAGTGAAAGTTTTGTGTTTT

CATGTCCTGTTTTTCTTTGAAATTATATAGCCCAGAAATTAGCTCATTATCTGAAAAACG

TATGAAGAACTGATGAATTGTATAATACAGGAGTATTGCCATTGAATGTACTGTTTGATT

TATTCAAGCAGGTAATGAACAATGTTGTCAAACTCTCTAATGAGACATCATAATTAGGAC

ATAAGCTAAAAGGGGCATTACTCCGGCAGTCTTTTTTTCTTAATCCTAGTACCATACATA

TTCTTTGGCATGAAAGAATGAAAAGCATTAGTAAACAACTGAAGTCCTACCATGGCTCTG

TAGGGTTTTTGGAACAATTCCTGGAATTGGAAAGTGAAAATGGATAGCATGTGGGGGAAA

CCCTCATCTGAGTAGCAAGATTTTAGTAAAGATGACTAAGCCATTAACAGCATGCATTCA

TATTTAATTTTATTGACTCCTGCCATCAGCTTTTGTAGATCTTTTGGGTGGAAGGTTGTG

ATTTTTACTGGGAGGACTTGAGTAGAAGTGGATGATTAAAATTGAGGAGTATATAATTCT

TTCTGGGACTGCTTAAATGTTATTGTTTGAAAATGCCTTCACTTTCCCCCTTTGGTCAAA

GAGATGTGCTTAAAATTCTTATTCCTTCACAATAAATAATTTTGATTTTCTTAGACA

(서열번호:299)

호모 사피엔스 LMBRD2 3'-UTR

AGTCTGAAAAAGTTTGTGGGACCACTAACCAAGGTCAACACATCAGTTCAGTCTTGATGAACATCTGTGTACCCTAGAATTTCCTCTATACACAGTGAAAAGTGTCAAGATAACAAAAAAGGCACTGAGAATTAATTATATCTTAGGAATAATAGTTTAATGTGCATTGAATAGAGTATCACCTTTTTCAACAAGATTTATTACATATCATTTCCTAAGCATCTGCCTTAGAAATACAGTTACAGTGGAAGGACTTTAAGAAAGATCAACATATGTTAAGAACATGCAGTTCAGTTTGTTTCAGATTAATTTTTTTTCAAGAGAGTTATTTTAAAGATTCAAGGAAGCCATAAGTCATACTAAATAATATTATATACAGTTTTGTTATTGTGACTTACATTTTTGTTACTTCTAAAAAGTATATTCAACCTGTATTTCCCAAAGAAATGTAAGTGAATGGAGACCTCAAATAATAACTGTATTCATAAAACTCGTGTCTTAAAACAAGGCTTACTTACTAGACATAACTGAATGTAAAAAGTGCTTTTTCAAATCTGTTTGCAAACTCGTGGGGGATTTTTGCATGTATAAGATTAAGATTATACTTCAAGTGATGCGTGTCTGTGTATTTAGCATGTGTACTATAATCAGGTGATATAGTATTCCTTCAGTCTTTGTAGTAACTGGATTTTTTTATGCTTCTGGTATTGCTTTATAAAAGATTTTCATTTCAG

(서열번호:300)

호모 사피엔스 TLR3 3'-UTR

NM_003265

ATTTATTTAAATATTCAATTAGCAAAGGAGAAACTTTCTCAATTTAAAAAGTTCTATGGCAAATTTAAGTTTTCCATAAAGGTGTTATAATTTGTTTATTCATATTTGTAAATGATTATATTCTATCACAATTACATCTCTTCTAGGAAAATGTGTCTCCTTATTTCAGGCCTATTTTTGACAATTGACTTAATTTTACCCAAAATAAAACATATAAGCACGTAAAAAAAAAAAAAAAAAA

(서열번호:301)

호모 사피엔스 BCAT1 3'-UTR

BCAT1-002 ENST00000342945

ATGGAAAATAGAGGATACAATGGAAAATAGAGGATACCAACTGTATGCTACTGGGACAGACTGTTGCATTTGAATTGTGATAGATTTCTTTGGCTACCTGTGCATAATGTAGTTTGTAGTATCAATGTGTTACAAGAGTGATTGTTTCTTCATGCCAGAGAAAATGAATTGCAATCATCAAATGGTGTTTCATAACTTGGTAGTAGTAACTTACCTTACCTTACCTAGAAAAACATTAATGTAAGCCATATAACATGGGATTTTCCTCAATGATTTTAGTGCCTCCTTTTGTACTTCACTCAGATACTAAATAGTAGTTTATTCTTTAATATAAGTTACATTCTGCTCCTCAAACAAATGCAATTTTTTGTGTGTGTTTGAAAGCTAATTTGAGAAAATTTCATAGGTTACATTTCCTGCAGCCTATCTTTATCCACAGAAAGTGTTTTCTTTTTTTTAAATCAAGACTTTTAAAACTGGATTTCCTCCCATCACTGTTTTTTGAAGGTCCTCCAAGTCCGTGTTAA

(서열번호:302)

호모 사피엔스 BCAT1 3'-UTR

ATGGAAAATAGAGGATACAATGGAAAATAGAGGATACCAACTGTATGCTACTGGGACAGACTGTTGCATTTGAATTGTGATAGATTTCTTTGGCTACCTGTGCATAATGTAGTTTGTAGTATCAATGTGTTACAAGAGTGATTGTTTCTTCATGCCAGAGAAAATGAATTGCAATCATCAAATGGTGTTTCATAACTTG

(서열번호:303)

호모 사피엔스 TOM1L1 3'-UTR

TOM1L1-001 ENST00000575882

GAAGAAAGTGGATGATCAGCTCACTACCACATCAAAGGTGCCAACTCTCTAAAACGTAGACTCTGTGCAGCTTTGAAGCCTGGAAGACAATACCTACCAACATGTCAAAGCCATGGTGGCACATTTCTGCTATAATGAAGATTAAATAGAATAACAGTTCCAGGATAACACTGATTCCTGACAACAGCGTGAGATTTCAACAGAACTTGTTTGGAACAAATACTCACTTAAAACTTCAGCAGAAGAAAAATTACTTAGTCCTTAGGCCAACCAATTTAACTGCAGTGTCATGTTTCACAGGCCTTCCTACATTTAGAAATCGTCACACAGCTGTGATAAGAGTAGATTATTTTACTATGAAATAATTCTGAATAGATGAAAGCATAAAATGTGAGAAACTGAATGTATTATTCAGGAAGAATACTGAGTGCCTTCATTTAACTAAAGTTGAATGTAAAAGTCAATTTGCACTTCTTTATAATCCTCTGGTTTAGAATTATAAATTGTTAAAACCTTGATAATTGTCATTTAATTATATTTCAGGTGTCCTGAACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATATGATTCTTTGTAATGCTAAATAGCCTTTTTTTCTCTTTTTACTGCAACTTAATATTTCTATTTAGAACACAGAAAATGAAAATATTTAGAATAAGTTGTACATTTGATGACAAATAAATCACTATT

(서열번호:304)

호모 사피엔스 SLC35A1 3'-UTR

SLC35A1-201 ENST00000369556

TTTTAGCCTCACGTGAGACTCCTTTTAAGACTAAACCATTTGCATTAAACTAGAGCCTTAAGTCAATCTCAGAAGGTAGCATAAACAAATAAAAATTAACTGTATGGCATGATCAGTGCGGTTATGTGGAAACAACAACAAACAAACGAAGCTATCTGAGTGAACTGCTAATACAGAAACTTAATGTAGACCTGTTTGGGGTCTACTATTGTTTTAGAATGAAGGAATTGTATTATTGTGTGTATATATAATTTGTAAATAAAAAGTATGGAGATGATACGGTGTTAAAAAAAATCATGGTAAGGCTACAATACTCAAGTAACAAGGTTTGGGACAATGTCTAAGGGTTAAAGTGCCAAAGCCATTTCTGTACTAACTGTTCTCTTGTTCCGGTACCGGGGAGAAGGATGACCCCTCCTTATTCTCCAATTCATGTACAGTATTTTGTCCTAGCAGCATAAAGACCTAGCTCTTTTCTTACAAGAGGCAGAAACAAGACAGGCTAGTTCATAAACAAACTGTGTAACTTCTCAAAATGAATCTATTTCATAACTCGGACAATTTCTGGGTGGTGACTGAGTACCCCTTTAGTGAGTACCCCTTTAGTGCTATATTTGTGCCATTCATTATCTGGTTCATATTTCTTTTCTGTTAGATGATACACATTTCTTCAAAAAAATTTCTAATGTCACTTTTGTACTTTTTTAAATAAAGTATGTTTAACTGTTGGGCTCTCAATAATTTGTGAAATTTCAGTGTTTTCTATAATGTTAATGGGGAAATTCAGCAATAAACTTTATTTGT

(서열번호:305)

호모 사피엔스 GLYATL2 3'-UTR

GLYATL2-003 ENST00000532258

TTGATTCCACTGTCCATTTCAAATCTTTCTTATCAGTAAAAAAACATTAATTCAAACACAAGCATTGTGATCTACATTAGCACAAAATGCAACTGATTATCTAGGATCTGTGTATTACTTAAGCTCACCCTTAACAGTTTTACCTTCCTTCTCCTCTGTATTCTTACAGAAAATTAGAAGCTCAATTTTATGGTCTCATAATTTCCTTTATGACAGACATCTCAGAATTAAAATCACCCAAAGCCAATCATTAGTGCCAAGATAACCCTTTAACGGCAACACTTTCTTAAATGAAGACTATTTCTTTCATGAAAAAATTCACTTTTATGACT

(서열번호:306)

호모 사피엔스 STAT4 3'-UTR

STAT4-002 ENST00000392320

CAGGATAAACTCTGACGCACCAAGAAAGGAAGCAAATGAAAAAGTTTAAAGACTGTTCTTTGCCCAATAACCACATTTTATTTCTTCAGCTTTGTAAATACCAGGTTCTAGGAAATGTTTGACATCTGAAGCTCTCTTCACACTCCCGTGGCACTCCTCAATTGGGAGTGTTGTGACTGAAATGCTTGAAACCAAAGCTTCAGATAAACTTGCAAGATAAGACAACTTTAAGAAACCAGTGTTAATAACAATATTAACAG

(서열번호:307)

호모 사피엔스 GULP1 3'-UTR

GULP1-002 ENST00000409609

CATCAAGAACAAGAAATCCTGATTCATGTTAAATGTGTTTGTATACACATGTCATTTATTATTATTACTTTAAGATAGGTATTATTCATGTGTCAATGTTTTTGAATATTTTAATATTTTGAAAATTTTCTCAGTTAAATTTCCTCACCTTCACTATTGATCTGTAATTTTTATTTTAAAAACAGCTTACTGTAAAGTAGATCATACTTTTATGTTCCTTTCTGTTTCTACTGTAGATGAATTTGTAATTGAAAGACATATTATACAAAT

(서열번호:308)

호모 사피엔스 GULP1 3'-UTR

GULP1-010 ENST00000409805

CATCAAGAACAAGAAATCCTGATTCATGTTAAATGTGTTTGTATACACATGTCATTTATTATTATTACTTTAAGATAGG

(서열번호:309)

호모 사피엔스 EHHADH 3'-UTR

EHHADH-002 ENST00000456310

TTCAGTCTTCCAGATTATGCCTCACATGCTAGCATCAGGTAATGCTGACTGAATTTCAGTGAAATTAAATCAAAAATCCAAAGTAAGATTGTTCTGAAATACAAAGCAAAATAAATAATCATTAGAATCTTCTGTGTAACGACTCTAATGGTCAAATCTTTAGGAATGTGCTTCCTATGCCTCTGAATCTGTCCTTATCAGATAAATTCAATGCATGAACTTGTGTGAATATAATACCATAATAGCTAATGAAAGA

(서열번호:310)

호모 사피엔스 NBEAL1 3'-UTR

NM_001114132.1

TTGTTATTTCCATTTTCTGTTATGATTACTGAAACCTGATTTATTGCTTTGTCACTTTAACCACATCTCTCAACTCTCTGCAATGTTGCAAGGCTTTTATCCCTGAAAATCATTTACAGATAACCACAATTTGCTGTGGTATATAAACTAATTCTTGGTCTATACTAAGATGTATTTGAGAAAATACATTTGATTTGATTTTGTGGCCCATTCCTAAAGGTCATTGTATCCATTTTTAAAACAAACTAAAATGAGAACATTAGGTTCAATTTTCTTATTATTCCAAATGATAAAATTTAAGATTTTTCTAATAAAAGAGTACAGATAATGGGACAGTTGAGAGAGATGGCTTTAAATACATTCTTAAGTAATCATTTTCCTATTTACTGACCACTGTAATGAAAATATATCAATTTATTTATGGAACTCCTGATTGGGGATAATATTTTAAAGGTATCTGTTGCACACTTGGATTTTCAAAACTCGGTGAAAGTTACAAGTTTGCATGGTAAGAATAAAATAAGAATATTGAAACTGGTACATTAGCTAATTCTATTACTACTTAGCGTGTTTCTAATGAGAAGTTACTGAAATCTATTACTGTCCTTAATAAAAATTGAGTAGAAAAAAGTGGAACTAG

(서열번호:311)

호모 사피엔스 KIAA1598 3'-UTR

NM_001258299.1

TCTGAATCAGAAAATACTGCAACTCCTTCCTCCTTTTGTCTGCCTTTTGTTCTCCAAAAGTAAGTGGAAATTACATTTCCAAGAAAGGAAATGAAATAATTGCAGGCCCAAGGTCTGCAAAATATGTGTTGAATTGACAGTGAAAAGGATCCATGTGTTGACAGACACAGTTGTTAGATGCCATAAAGGCAGATGTGAAGCTCAATTTATTTCTCATCTTGCTTG

(서열번호:312)

호모 사피엔스 HFE 3'-UTR

HFE-006 ENST00000317896

CACGCAGCCTGCAGACTCACTGTGGGAAGGAGACAAAACTAGAGACTCAAAGAGGGAGTGCATTTATGAGCTCTTCATGTTTCAGGAGAGAGTTGAACCTAAACATAGAAATTGCCTGACGAACTCCTTGATTTTAGCCTTCTCTGTTCATTTCCTCAAAAAGATTTCCCCATTTAGGTTTCTGAGTTCCTGCATGCCGGTGATCCCTAGCTGTGACCTCTCCCCTGGAACTGTCTCTCATGAACCTCAAGCTGCATCTAGAGGCTTCCTTCATTTCCTCCGTCACCTCAGAGACATACACCTATGTCATTTCATTTCCTATTTTTGGAAGAGGACTCCTTAAATTTGGGGGACTTACATGATTCATTTTAACATCTGAGAAAAGCTTTGAACCCTGGGACGTGGCTAGTCATAACCTTACCAGATTTTTACACATGTATCTATGCATTTTCTGGACCCGTTCAACTTTTCCTTTGAATCCTCTCTCTGTGTTACCCAGTAACTCATCTGTCACCAAGCCTTGGGGATTCTTCCATCTGATTGTGATGTGAGTTGCACAGCTATGAAGGCTGTACACTGCACGAATGGAAGAGGCACCTGTCCCAGAAAAAGCATCATGGCTATCTGTGGGTAGTATGATGGGTGTTTTTAGCAGGTAGGAGGCAAATATCTTGAAAGGGGTTGTGAAGAGGTGTTTTTTCTAATTGGCATGAAGGTGTCATACAGATTTGCAAAGTTTAATGGTGCCTTCATTTGGGATGCTACTCTAGTATTCCAGACCTGAAGAATCACAATAATTTTCTACCTGGTCTCTCCTTGTTCTGATAATGAAAATTATGATAAGGATGATAAAAGCACTTACTTCGTGTCCGACTCTTCTGAGCACCTACTTACATGCATTACTGCATGCACTTCTTACAATAATTCTATGAGATAGGTACTATTATCCCCATTTCTTTTTTAAATGAAGAAAGTGAAGTAGGCCGGGCAC

(서열번호:313)

호모 사피엔스 HFE 3'-UTR

HFE-004 ENST00000349999

CACGCAGCCTGCAGACTCACTGTGGGAAGGAGACAAAACTAGAGACTCAAAGAGGGAGTGCATTTATGAGCTCTTCATGTTTCAGGAGAGAGTTGAACCTAAACATAGAAATTGCCTGACGAACTCCTTGATTTTAGCCTTCTCTGTTCATTTCCTCAAAAAGATTTCCCCATTTAGGTTTCTGAGTTCCTGCATGCCGGTGATCCCTAGCTGTGACCTCTCCCCTGGAACTGTCTCTCATGAACCTCAAGCTGCATCTAGAGGCTTCCTTCATTTCCTCCGTCACCTCAGAGACATACACCTATGTCATTTCATTTCCTATTTTTGGAAGAGGACTCCTTAAATTTGGGGGACTTACATGATTCATTTTAACATCTGAGAAAAGCTTTGAACCCTGGGACGTGGCTAGTCATAACCTTACCAGATTTTTACACATGTATCTATGCATTTTCTGGACCCGTTCAACTTTTCCTTTGAATCCTCTCTCTGTGTTACCCAGTAACTCATCTGTCACCAAGCCTTGGGGATTCTTCCATCTGATTGTGATGTGAGTTGCACAGCTATGAAGGCTGTACACTGCACGAATGGAAGAGGCACCTGTCCCAGAAAAAGCATCATGGCTATCTGTGGGTAGTATGATGGGTGTTTTTAGCAGGTAGGAGGCAAATATCTTGAAAGGGGTTGTGAAGAGGTGTTTTTTCTAATTGGCATGAAGGTGTCATACAGATTTGCAAAGTTTAATGGTGCCTTCATTTGGGATG

(서열번호:314)

호모 사피엔스 HFE 3'-UTR

HFE-005 ENST00000397022

CACGCAGCCTGCAGACTCACTGTGGGAAGGAGACAAAACTAGAGACTCAAAGAGGGAGTGCATTTATGAGCTCTTCATGTTTCAGGAGAGAGTTGAACCTAAACATAGAAATTGCCTGACGAACTCCTTGATTTTAGCCTTC

(서열번호:315)

호모 사피엔스 HFE 3'-UTR

HFE-012 ENST00000336625

CACGCAGCCTGCAGACTCACTGTGGGAAGGA

(서열번호:316)

호모 사피엔스 KIAA1324L 3'-UTR

KIAA1324L-005 ENST00000416314

AGAGACAGTGCTGTAGCCTTGAGACTAATGAACAAAGAAACCTGCTCTAGTTTTACAGGACCATATTTTAGGGTCTGTCCTCATACCTGTCACATTGGTGATCTCACAGAGGAGGGCCATGCCGCTGAAAAGGGAAGGAGATTGAAACATTTGATTGCCTTATCACATGGTCAAGTACCTTGCCAAATAAAGGAAAGCAAATGATTTGGGTCTCAACTGAAGATGAAGCTCAACTCAGGAAGAGATTTATCTGTATATACACATAACTGAAAACCAAGTTTAAGCCCACCAATGCACTGCTGATGCATGCCATATAATTAATGGGTAACTTTTATTCTTTATGATGTCTACATAACAAGTGTGATTTGGAAGGCACATGTGAGCATATGCATTA

(서열번호:317)

호모 사피엔스 MANSC1 NM_018050 3'-UTR

GGATGGAACTCGGTGTCTCTTAATTCATTTAGTAACCAGAAGCCCAAATGCAATGAGTTTCTGCTGACTTGCTAGTCTTAGCAGGAGGTTGTATTTTGAAGACAGGAAAATGCCCCCTTCTGCTTTCCTTTTTTTTTTTTGGAGACAGAGTCTTGCTTTGTTGCCCAGGCTGGAGTGCAGTAGCACGATCTCGGCTCTCACCGCAACCTCCGTCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCTAAGTATCTGGGATTACAGGCATGTGCCACCACACCTGGGTGATTTTTGTATTTTTAGTAGAGACGGGGTTTCACCATGTTGGTCAGGCTGGTCTCAAACTCCTGACCTAGTGATCCACCCTCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCATGAGCCACCACAGCTGGCCCCCTTCTGTTTTATGTTTGGTTTTTGAGAAGGAATGAAGTGGGAACCAAATTAGGTAATTTTGGGTAATCTGTCTCTAAAATATTAGCTAAAAACAAAGCTCTATGTAAAGTAATAAAGTATAATTGCCATATAAATTTCAAAATTCAACTGGCTTTTATGCAAAGAAACAGGTTAGGACATCTAGGTTCCAATTCATTCACATTCTTGGTTCCAGATAAAATCAACTGTTTATATCAATTTCTAATGGATTTGCTTTTCTTTTTATATGGATTCCTTTAAAACTTATTCCAGATGTAGTTCCTTCCAATTAAATATTTG

(서열번호:318)

바람직하게, 적어도 하나의 5'-UTR 요소는 서열번호: 25 또는 서열번호: 30 및 서열번호: 319 내지 382 또는 상응하는 DNA 또는 RNA 서열로 이루어진 그룹으로부터 선택된 핵산 서열에 각각 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99% 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지거나 또는 또는 상기 적어도 하나의 5'-UTR 요소는 서열번호: 25 또는 서열번호: 30 및 서열번호: 319 내지 382 또는 상응하는 DNA 또는 RNA 서열로 이루어진 그룹으로부터 선택된 핵산 서열에 각각 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99% 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어진다:

호모 사피엔스 LTA4H 5'-UTR

LTA4H-001 ENST00000228740

AAGAAACTTCCTTTCCCGGCGTGCACCGCGAATCCCTCCTCCTCTTCTTTACCTCTCTCCCTCCTCCTCAGGTTCTCTATCGACGAGTCTGGTAGCTGAGCGTTGGGCTGTAGGTCGCTGTGCTGTGTGATCCCCCAGAGCC

(서열번호:319)

호모 사피엔스 DECR1 5'-UTR

DECR1-001 ENST00000220764

TCCAGCCCCGAGAACTTTGTTCTTTTTGTCCCGCCCCCTGCGCCCAACCGCCTGCGCCGCCTTCCGGCCCGAGTTCTGGAGACTCAAC

(서열번호:320)

호모 사피엔스 PIGK 5'-UTR

ACTGCCTCCGCCCCTTCAGGTGCGGGAAGTCTGAAGCCGGTAAAC

(서열번호:321)

호모 사피엔스 BRP44L 5'-UTR

BRP44L-001

GTCGTGAGGCGGGCCTTCGGGCTGGCTCGCCGTCGGCTGCCGGGGGGTTGGCCGGGGTGTCATTGGCTCTGGGAAGCGGCAGCAGAGGCAGGGACCACTCGGGGTCTGGTGTCGGCACAGCC

(서열번호:322)

호모 사피엔스 ACADSB 5'-UTR

ACADSB-004 NM_001609.3 ENST00000368869

AGGGATTAAGGGGGGGTGTGTGCGGGGCGGGTACTGAGTGGGCGGGGCCTTGCTCGGGTAACTCCCAGGGGCTGGCTAGAGACCCAGAGGCGCAGAGCGGAGAGGCCTGCGGCGAGG

(서열번호:323)

호모 사피엔스 SUPT3H 5'-UTR

SUPT3H-006 ENST00000371459

CACAGCCGAGTCACCTTTTCCCTTTCTACACTCCACACTCTCAGTCCCCCACCCCGCCCCTTTCCAAGCGTGTCCCGGGCCGCAGCAGCAGAAACCGCACCATCTCCACCCCCACATTCTCCTCGCGGGAAGCGCAGCAGTGCCTCCAAGGGTTCTTAAAGCAGAG

(서열번호:324)

호모 사피엔스 TMEM14A 5'-UTR

NM_014051.3

GTTTCCAGGAGGGAGCGGCCTTTGCTCAGCGCGAGACGGCTGGGCGCCGAGTGGGACAGCGCTGGTGCGGAGACTGCTTCCGGACTCCAGGTACCGCGCTTGGCGGCAGCTGGCCCCAGACTTCTGTCTTTTCAGCTGCAGTGAAGGCTCGGGGCTGCAGAATTGCAACCTTGCCA

(서열번호:325)

호모 사피엔스 C9orf46 5'-UTR

AF225420.1

GAGCGAGGCCCGGTCCCTGCAGCGGGCGAAAGGAGCCCGGGCCTGGAGGTTTGCGTACCGGTCGCCTGGTCCCGGCACCAGCGCCGCCCAGTGTGGTTTCCCATAAGGAAGCTCTTCTTCCTGCTTGGCTTCCACCTTTAACCCTTCCACCTGGGAGCGTCCTCTAACACATTCAGACTACAAGTCCAGACCCAGGAGAGCAAGGCCCAGAAAGAGGTCAAA

(서열번호:326)

호모 사피엔스 ANXA4 5'-UTR

NM_001153.3

GCCCCAGGTGCGCTTCCCCTAGAGAGGGATTTTCCGGTCTCGTGGGCAGAGGAACAACCAGGAACTTGGGCTCAGTCTCCACCCCACAGTGGGGCGGATCCGTCCCGGATAAGACCCGCTGTCTGGCCCTGAGTAGGGTGTGACCTCCGCAGCCGCAGAGGAGGAGCGCAGCCCGGCCTCGAAGAACTTCTGCTTGGGTGGCTGAACTCTGATCTTGACCTAGAGTC

(서열번호:327)

호모 사피엔스 IFI6 5'-UTR

NM_022873.2

CCAGCCTTCAGCCGGAGAACCGTTTACTCGCTGCTGTGCCCATCTATCAGCAGGCTCCGGGCTGAAGATTGCTTCTCTTCTCTCCTCCAAGGTCTAGTGACGGAGCCCGCGCGCGGCGCCACC

(서열번호:328)

호모 사피엔스 C2orf34 5'-UTR

CAMKMT -008 ENST00000402247

TCCTGGCAGGGGACGAGCTGCGGCGGTGGCACCTCCGGGTGTGGAAGGCTCCAGTGAG

(서열번호:329)

호모 사피엔스 C2orf34 5'-UTR

NM_024766.3

GAGGGTGCCGGGCGTCACAGGTCCTGACAGGGAAGAAGTTGGCAGGTCCTGGCAGGGGACGAGCTGCGGCGGTGGCACCTCCGGGTGTGGAAGGCTCCAGTGAG

(서열번호:330)

호모 사피엔스 ALDH6A1 5'-UTR

ALDH6A1-002 ENST00000350259

AGTGCTTCTGGGCAGTAGAGGCGCGGGGTGCGGAGCTAGGGCGGCCGAGAGCC

(서열번호:331)

호모 사피엔스 CCDC53 5'-UTR

CCDC53-002 ENST00000545679

GGAAGGGCCCCGGAGGCGGGCACTTGGGGGGAAAGTTGAGACGTGATTACCGGGTTGGGCGGGCCCCATCTGGGAGGGGTTTGTGGGTGAACTCGGGGTCCACCGCCCGCTGAGGAG

(서열번호:332)

호모 사피엔스 CASP1 5'-UTR

NM_001257119.1

ATACTTTCAGTTTCAGTCACACAAGAAGGGAGGAGAGAAAAGCC

(서열번호:333)

호모 사피엔스 NDUFB6 5'-UTR

NM_182739.2

GTAATAACCGCGCGCGGCGCTCGGCGTTCCCGCAAGGTCGCTTTGCAGAGCGGGAGCGCGCTTAAGTAACTAGTCCGTAGTTCGAGGGTGCGCCGTGTCCTTTTGCGTTGGTACCAGCGGCGAC

(서열번호:334)

호모 사피엔스 BCKDHB 5'-UTR

BCKDHB-002 ENST00000369760

AGGCGGCGTGCGGCTGCATAGCCTGAGAATCCCGGTGGTGAGCGGGG

(서열번호:335)

호모 사피엔스 BCKDHB 5'-UTR

NM_001164783.1

CTACGTGAGTGCCGGACCGCTGAGTGGTTGTTAGCCAAG

(서열번호:336)

호모 사피엔스 BBS2 5'-UTR

NM_031885.3

CACAGAAGGCGCCGAGGCTCCACCGCGCAGCCGCAAAAAGAGCGGACGGGTCTGCGCCGCCGCAGGAGGAGCAGGCGGTACCTGGACGGGTTCGTCCCGGGCTGTTTCGCGTCCGGCCTGAGGCGGCTGGGGCCGCGCAGGTAGTGTCCCTGCACTTCTTGCCCGGGCGCGTGAGGCCAGCTCCGCTGCGCTTGTCTCCAGCTTCCAGCCCTCCTCCCCTAAGCCGCCGCCATC

(서열번호:337)

호모 사피엔스 HERC5 5'-UTR

HERC5-001 ENST00000264350

TCAGTAGCTGAGGCTGCGGTTCCCCGACGCCACGCAGCTGCGCGCAGCTGGTTCCCGCTCTGCAGCGCAACGCCTGAGGCAGTGGGCGCGCTCAGTCCCGGGACCAGGCGTTCTCTCCTCTCGCCTCTGGGCCTGGGACCCCGCAAAGCGGCG

(서열번호:338)

호모 사피엔스 FAM175A 5'-UTR

NM_139076.2

ACCACAGGGTCTTGCCTCCGCGCGCCCCGCCCTCGTCCTCTTGTGTAGCCTGAGGCGGCGGTAGC

(서열번호:339)

호모 사피엔스 NT5DC1 5'-UTR

NT5DC1-002 ENST00000319550

CGGTCCTGTCCCGCAGCGTCCCGCCAGCCAGCTCCTTGCACCCTTCGCGGCCGAGGCGCTCCCTGGTGCTCCCCGCGCAGCC

(서열번호:340)

호모 사피엔스 RAB7A 5'-UTR

RAB7A-001 ENST00000265062

GTCTCGTGACAGGTACTTCCGCTCGGGGCGGCGGCGGTGGCGGAAGTGGGAGCGGGCCTGGAGTCTTGGCCATAAAGCCTGAGGCGGCGGCAGCGGCGGAGTTGGCGGCTTGGAGAGCTCGGGAGAGTTCCCTGGAACCAGAACTTGGACCTTCTCGCTTCTGTCCTCCGTTTAGTCTCCTCCTCGGCGGGAGCCCTCGCGACGCGCCCGGCCCGGAGCCCCCAGCGCAGCGGCCGCGTTTGAAGG

(서열번호:341)

호모 사피엔스 AGA 5'-UTR

AGA-001 ENST00000264595

AGGGACGCCTGAGCGAACCCCCGAGAGAGCGGGCGTGGGCGCCAGGCGGGCGGGGCACTGGGGATTAATTGTTCGGCGATCGCTGGCTGCCGGGACTTTTCTCGCGCTGGTCTCTTCGGTGGTCAGGG

(서열번호:342)

호모 사피엔스 TPK1 5'-UTR

TPK1-001 ENST00000360057

AAGGCTCCTCAGCCGAGCGCCGAGCGGTCGATCGCCGTAGCTCCCGCAGCCTGCGATCTCCAGTCTGTGGCTCCTACCAGCCATTGTAGGCCAATAATCCGTT

(서열번호:343)

호모 사피엔스 MBNL3 5'-UTR

MBNL3-001 ENST00000370839

AATTCATTTTTAATCCTTTAATAGTCCACAGTAATATTGTCCTAAAGAGGGTACATTGGATTTTAATTTTGCTTTCAAT

(서열번호:344)

호모 사피엔스 MCCC2 5'-UTR

MCCC2-001 ENST00000340941

AGAATCAGAGAAACCTTCTCTGGGGCTGCAAGGACCTGAGCTCAGCTTCCGCCCCAGCCAGGGAAGCGGCAGGGGAAAGCACCGGCTCCAGGCCAGCGTGGGCCGCTCTCTCGCTCGGTGCCCGCCGCC

(서열번호:345)

호모 사피엔스 CAT 5'-UTR

CAT-001 ENST00000241052

ACTCGGGGCAACAGGCAGATTTGCCTGCTGAGGGTGGAGACCCACGAGCCGAGGCCTCCTGCAGTGTTCTGCACAGCAAACCGCACGCT

(서열번호:346)

호모 사피엔스 ANAPC4 5'-UTR

ANAPC4-001 ENST00000315368

CCCGACGCCGGAAGTGCCTGGAGCGCGCGACAGCGGCGGGGCGGGGCGGCCTGGAGGCTGTGGCGCGCGGCCGGCAGAGGGAGGGGAGAGGCCACTGGGGCCGTGTTAGTCTGCCGGTGGGGACTCTTGCAGGGCCGTCCCC

(서열번호:347)

호모 사피엔스 PHKB 5'-UTR

PHKB-002 ENST00000323584

GGCCAAGGCGGCGACCGGAGCGCG

(서열번호:348)

호모 사피엔스 ABCB7 5'-UTR

ABCB7-001 ENST00000253577

CTCGGTTCCTCTTTCCTCGCTCAAG

(서열번호:349)

호모 사피엔스 GPD2 5'-UTR

GPD2-002 ENST00000438166

CCCGCGCGCCTCGCTGGGAGCACCCGGGCCGAGGCTCTGATTCTGGGGGGAGGCCGACTCCACCCTGGCTGGAGGAACTGGGTGCTCCTGCCCGCTGGCCCCTCGCGCGTGAGGATCTATCTCAGGCTAAGAA

(서열번호:350)

호모 사피엔스 TMEM38B 5'-UTR

TMEM38B-001 ENST00000374692

GCTGGAGCCGGCGCGGAGGAGCGGGCGGCCGCGGCTGTGCCCTCTCCTACTCCTCACCGCGCGAGCGCGGGGAACCAGTAGCCGCGGCTGCTTCGGTTGCCGCGGTCGGTGGTCGTT

(서열번호:351)

호모 사피엔스 NFU1 5'-UTR

NM_001002755.2

GGGAAAGGTTCCCCGGCCTCTCTTGGTCAGGGTGACGCAGTAGCCTGCAAACCTCGGCGCGTAGGCCACCGCACTTATCCGCAGCAGGACCGCCCGCAGCCGGTAGGGTGGGCTCTTCCCAGTGCCCGCCCAGCTACCGGCCAGCCTGCGGCTGCGCAGATCTTTCGTGGTTCTGTCAGGGAGACCCTTAGGCACTCCGGACTAAG

(서열번호:352)

호모 사피엔스 LOC128322/NUTF2 5'-UTR

NM_005796.1

GGAAGGGACAGTCGGCCGCAGACCGCGCTGGGTTGCCGCTGCCGCTGCCGCCATCGTGCCAGCCCCTCGGGTCTCCGTGAGGCCGGGTGACGCTCCAGA

(서열번호:353)

호모 사피엔스 NUBPL 5'-UTR

NM_025152.2

ACTCCGCGCCACCCGCGACAGTTTCCCAGCAGGGCTCACAGCAGCGTTCCGCGTC

(서열번호:354)

호모 사피엔스 LANCL1 5'-UTR

LANCL1-004 ENST00000233714

GAGAAGGGCTTCAGGACGCGGGAGGCGCACTTGCTTCAAGTCGCGGGCGTGGGAACGGGGCTTGCTTCCGGCGTC

(서열번호:355)

호모 사피엔스 PIR 5'-UTR

PIR-002 ENST00000380420

CCTCCCGCCTCCTCTAGGCCGCCGGCCGCGAAGCGCTGAGTCACGGTGAGGCTACTGGACCCACACTCTCTTAACCTGCCCTCCCTGCACTCGCTCCCGGCGGCTCTTCGCGTCACCCCCGCCGCTAAGGCTCCAGGTGCCGCTACCGCAGCCCCTCCATCCTCTACAGCTCAGCATCAGAACACTCTCTTTTTAGACTCCGAT

(서열번호:356)

호모 사피엔스 CTBS 5'-UTR

NM_004388.2

GACGCGCAGCAGGCCCCGCCCACCCAGGCGGTAGGAACCCACTCCGGCCCGCTAGACCTGCTGCT

(서열번호:357)

호모 사피엔스 GSTM4 5'-UTR

NM_000850.4

AAGCTGGCGAGGCCGAGCCCCTCCTAGTGCTTCCGGACCTTGCTCCCTGAACACTCGGAGGTGGCGGTGGATCTTACTCCTTCCAGCCAGTGAGGATCCAGCAACCTGCTCCGTGCCTCCCGCGCCTGTTGGTTGGAAGTGACGACCTTGAAGATCGGCCGGTTGGAAGTGACGACCTTGAAGATCGGCGGGCGCAGCGGGGCCGAGGGGGCGGGTCTGGCGCTAGGTCCAGCCCCTGCGTGCCGGGAACCCCAGAGGAGGTCGCAGTTCAGCCCAGCTGAGGCCTGTCTGCAGAATCGACACCAACCAGCATC

(서열번호:358)

Mus musculus Ndufa1 5'-UTR

Ndufa1-001 ENSMUST00000016571

GCCGGAAGAGAGGTAAAGCCGGGTCACCTCTGAGGAGCCGGTGACGGGTTGGCGTGCGAGTAACGGTGCGGAG

(서열번호:359)

Mus musculus Atp5e 5'-UTR

NM_025983

CCCACCCCTTCCGCTACTCAGGCCTGACCTTCCTGCTGCCGGGCCGGTTTGAGGCTACTCTGAAGCGACCCAGCGGTTCTGCCCGACGCGCCCGCTCGAGACACC

(서열번호:360)

Mus musculus Gstm5 5'-UTR

NM_010360

GAGACAGTTCGGTCGCGTCAGCCCGGCCCACAGCGTCCAGTATAAAGTTAGCCGCCCACAGTCCATCGCTGTATCCCCGAAGGGGCTAAGATCGCCCAAA

(서열번호:361)

Mus musculus Cbr2 5'-UTR

NM_007621

ATAAAAGCTGAGCCCATCTCTTGCTTCGGAAGAAGCTGGTGTCAGCAGC

(서열번호:362)

Mus musculus Anapc13 5'-UTR

NM_181394

GTGACCCAGAAGAAGGGCGGGGCCGGGAGGAAGCCGACGCGCGCGCAGTGGGCCTGACAAGATCAAAGCTGCAGGAGG

(서열번호:363)

Mus musculus Ndufa7 5'-UTR

NM_023202

TCGGAGCGGAAGGAAT

(서열번호:364)

Mus musculus Atp5k 5'-UTR

NM_007507

CGAAGGTCACGGACAAA

(서열번호:365)

Mus musculus Cox4i1 5'-UTR

NM_009941

CTTCCGGTCGCGAGCACCCCAGGGTGTAGAGGGCGGTCGCGGCGGTCGCCTGGGCAGCGGTGGCAGA

(서열번호:366)

Mus musculus Ndufs6 5'-UTR

NM_010888

TTGGTACGACGCGTGGGGTCAAGGGTCACCGGCAAG

(서열번호:367)

Mus musculus Sec61b 5'-UTR

NM_024171

AGAGCCTGTATCTACGAGAGTTCTGAGTGCTCGGCAACTTCACGACTTCCCTCTTCCTGCCTCCTGTGCCCACCGTTCTTAGGCATCAGC

(서열번호:368)

Mus musculus Snrpd2 5'-UTR

NM_026943

AAGGCTGGAGCAACGCGCTTGGAGGCGGGAGTGATCTGCGAGCGAAACCTACACC

(서열번호:369)

Mus musculus Mgst3 5'-UTR

NM_025569

ACTGCTGTGCTTCTCAGGTCTGTACCAGGCGCACGAAGGTGAGCCAGAGCCAAG

(서열번호:370)

Mus musculus Mp68 (2010107E04Rik) 5'-UTR

NM_027360

CTTTCCCATTCTGTAGCAGAATTTGGTGTTGCCTGTGGTCTTGGTCCCGCGGAG

(서열번호:371)

Mus musculus Prdx4-001, 5'-UTR

NM_016764

GCGCGGTCTCCAGCGCGCCGTTTTAGCTGGCTGCCTGGCGGCAGGGGACTCTGTGCTTTAGCAGAGGGACGTGTTTTCGCGCTTGCTTGGTC

(서열번호:372)

Mus musculus Pgcp 5'-UTR

NM_176073

GCTGTCCTGGCACACAAAGAAGCCAGGCCTGCAGACTACTGGGGCTCCGGGCTGTTCCTGAGGCCTCTGGAGGCCCGCCCTGTGGCTCCAGTGCGCTCTGAGGACCTTCCTGGTCCCGCCCCCGAACGTGCCTGTGGTCTGCAGGCCTCACCGGGTGTTGTGGCCGCTGCTGCTCCGCAGAGCCTCGTGATCAGGAAGAAAAGCAACTAGGAACA

(서열번호:373)

Mus musculus Myeov2 5'-UTR

NM_001163425

AGAAGGGGCTGGCCGGAAGTGAGCGCAACGCCGCCTTGTCGAG

(서열번호:374)

Mus musculus Ndufa4 5'-UTR

NM_010886

GTCCGCTCAGCCAGGTTGCAGAAGCGGCTTAGCGTGTGTCCTAATCTTCTCTCTGCGTGTAGGTAGGCCTGTGCCGCAAAC

(서열번호:375)

Mus musculus Ndufs5 5'-UTR

NM_001030274

ACGGCAGGCGTCTGCGTCCTCCCGCAGCCGGCGGTCGGGAATTGCACCAGGGACCTGACAAGGGCACTGCAGAGCC

(서열번호:376)

Mus musculus Gstm1 5'-UTR

NM_010358

CTGCCTTCCGCTTTAGGGTCTGCTGCTCTGGTTACAGACCTAGGAAGGGGAGTGCCTAATTGGGATTGGTGCAGGGTTGGGAGGGACCCGCTGTTTTGTCCTGCCCACGTTTCTCTAGTAGTCTGTATAAAGTCACAACTCCAAACACACAGGTCAGTCCTGCTGAAGCCAGTTTGAGAAGACCACAGCACCAGCACC

(서열번호:377)

Mus musculus Atp5o 5'-UTR

NM_138597

CTGGCGCGCGCGCGTGCGCTCTGGCGCCAGTAGTCTCTTTTCATTTGGGTTTGACCTACAGCCGCCCGGGAAAAG

(서열번호:378)

Mus musculus Tspo 5'-UTR

NM_009775

GTCAGCGGCTACCAACCTCTGTGCGCAGTGTCCTTCACGGAACAACCAGCGACTGCGTGAGCGGGGCTGTGGATCTTTCCAGAACATCAGTTGCAATCACC

(서열번호:379)

Mus musculus Taldo1 5'-UTR

NM_011528

GACGCGCGGGGCATTGTGGGTTAGCACGCACCGGCTACCGCCTCAGCTGTTCGCGTTTCGCC

(서열번호:380)

Mus musculus Bloc1s1 5'-UTR

NM_015740

GTGACGCCTTCCGGGTGAGCCAAGGCATAGTCCAGTTCCTGCAGCCTTAGGGAGGGGTCCGCCGTGCCCACACCCAGCCAGACTCGACC

(서열번호:381)

Mus musculus Hexa 5'-UTR

NM_010421

AGCTGACCGGGGCTCACGTGGGCTCAGCCTGCTGGAAGGGGAGCTGGCCGGTGGGCC

(서열번호:382)

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1; 이로써 CNTN1-004이 특히 바람직함)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR 서열과 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100% 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어진다. 가장 바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 서열번호: 1 내지 서열번호: 24, 또는 상응하는 RNA 서열로 이루어진 군으로부터 선택된 서열 각각에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어진다:

서열번호: 1

GAAGGGAACACCCAAATTTAATTCAGCCTTAAGCACAATTAATTAAGAGTGAAACGTAATGTACAAGCAGTTGGTCACCCACCATAGGGCATGATCAACACCGCAACCTTTCCTTTTTCCCCCAGTGATTCTGAAAAACCCCTCTTCCCTTCAGCTTGCTTAGATGTTCCAAATTTAGTAAGCTTAAGGCGGCCTACAGAAGAAAAAGAAAAAAAAGGCCACAAAAGTTCCCTCTCACTTTCAGTAAATAAAATAAAAGCAGCAACAGAAATAAAGAAATAAATGAAATTCAAAATGAAATAAATATTGTTTGTGCAGCATTAAAAAATCAATAAAAATTAAAAATGAGCA

(Mus musculus GNAS 3'-UTR)

서열번호: 2

GAAGGGAACACCCAAATTTAATTCAGCCTTAAGCACAATTAATTAAGAGTGAAACGTAATTGTACAAGCAGTTGGTCACCCACCATAGGGCATGATCAACACCGCAACCTTTCCTTTTTCCCCCAGTGATTCTGAAAAACCCCTCTTCCCTTCAGCTTGCTTAGATGTTCCAAATTTAGTAAGCTTAAGGCGGCCTACAGAAGAAAAAGAAAAAAAAGGCCACAAAAGTTCCCTCTCACTTTCAGTAAATAAAATAAAAGCAGCAACAGAAATAAAGAAATAAATGAAATTCAAAATGAAATAAATATTGTGTTGTGCAGCATTAAAAAATCAATAAAAATTAAAAATGAGCA

(Mus musculus GNAS 3'-UTR)

서열번호: 3

GAAGGGAACCCCCAAATTTAATTAAAGCCTTAAGCACAATTAATTAAAAGTGAAACGTAATTGTACAAGCAGTTAATCACCCACCATAGGGCATGATTAACAAAGCAACCTTTCCCTTCCCCCGAGTGATTTTGCGAAACCCCCTTTTCCCTTCAGCTTGCTTAGATGTTCCAAATTTAGAAAGCTTAAGGCGGCCTACAGAAAAAGGAAAAAAGGCCACAAAAGTTCCCTCTCACTTTCAGTAAAAATAAATAAAACAGCAGCAGCAAACAAATAAAATGAAATAAAAGAAACAAATGAAATAAATATTGTGTTGTGCAGCATTAAAAAAAATCAAAATAAAAATTAAATGTGAGCAAAGAATGAAAAAAAAAAAAAAAAAAAA

(호모 사피엔스 GNAS 3'-UTR)

서열번호: 4

CGTGTGTTCAACGACTGCCGTGACATCATTCAGCGCATGCACCTTCGTCAGTACGAGCTGCTCTAAGAAGGGAACCCCCAAATTTAATTAAAGCCTTAAGCACAATTAATTAAAAGTGAAACGTAATTGTACAAGCAGTTAATCACCCACCATAGGGCATGATTAACAAAGCAACCTTTCCCTTCCCCCGAGTGATTTTGCGAAACCCCCTTTTCCCTTCAGCTTGCTTAGATGTTCCAAATTTAGAAAGCTTAAGGCGGCCTACAGAAAAAGGAAAAAAGGCCACAAAAGTTCCCTCTCACTTTCAGTAAAAATAAATAAAACAGCAGCAGCAAACAAATAAAATGAAATAAAAGAAACAAATGAAATAAATATTGTGTTGTGCAGCATTAAAAAAAATCAAAATAAAAATTAAATGTGAGCAAAGAATGAAAAAAAAAAAAAAAAAAAA

(호모 사피엔스 GNAS 3'-UTR)

서열번호: 5

ACCTGCTGCCTTAACGCTGAGATGTGGCCTCTGCAACCCCCCTTAGGCAAAGCAACTGAACCTTCTGCTAAAGTGACCTGCCCTCTTCCGTAAGTCCAATAAAGTTGTCATGCACCC

(Mus musculus MORN2 3’-UTR)

서열번호: 6

(Mus musculus MORN2 3’-UTR)

서열번호: 7

CATGTAGATGTGATGTTAAATTAAAGTTGAAATGTAGTAATTGAAGCTTTTAGTTGTAAGGAAAGCAACTTAATCTGTTATTTGAAATGACTTCATACACTACCCCTATAAGTTTGCCAATAAAACCATCACCTGCTTACACCTTTTTGAACTTTATATTCATTGTCTTACAATTAGTTTAAAATAAATGACATGATTCAAAAAAAAAAA

(호모 사피엔스 MORN2 3'-UTR)

서열번호: 8

GCCCTTGCTACACGGGCACTCACTAGGAGGACCTGTCCACACTGGGGATCCTGCAGGCCCTGGGTGGGGACAGCACCCTGGCCTTCTGCACTGTGGCTCCTGGTTCTCTCTCCTTCCCGCTCCCTTCTGCAGCTTGGTCAGCCCCATCTCCTCACCCTCTTCCCAGTCAAGTCCACACAGCCTTCATTCTCCCCAGTTTCTTTCACATGGCCCCTTCTTCATTGGCTCCCTGACCCAACCTCACAGCCCGTTTCTGCGAACTGAGGTCTGTCCTGAACTCACGCTTCCTAGAATTACCCCGATGGTCAACACTATCTTAGTGCTAGCCCTCCCTAGAGTTACCCCGAAGGTCAATACTTGAGTGCCAGCCTGTTCCTGGTGGAGTAGCCTCCCCAGGTCTGTCTCGTCTACAATAAAGTCTGAAACACACTTGCCATG

(Mus musculus GSTM1 3’-UTR)

서열번호: 9

(Mus musculus GSTM1 3’-UTR)

서열번호: 10

GGCCTTGAAGGCCAGGAGGTGGGAGTGAGGAGCCCATACTCAGCCTGCTGCCCAGGCTGTGCAGCGCAGCTGGACTCTGCATCCCAGCACCTGCCTCCTCGTTCCTTTCTCCTGTTTATTCCCATCTTTACTCCCAAGACTTCATTGTCCCTCTTCACTCCCCCTAAACCCCTGTCCCATGCAGGCCCTTTGAAGCCTCAGCTACCCACTATCCTTCGTGAACATCCCCTCCCATCATTACCCTTCCCTGCACTAAAGCCAGCCTGACCTTCCTTCCTGTTAGTGGTTGTGTCTGCTTTAAAGGGCCTGCCTGGCCCCTCGCCTGTGGAGCTCAGCCCCGAGCTGTCCCCGTGTTGCATGAAGGAGCAGCATTGACTGGTTTACAGGCCCTGCTCCTGCAGCATGGTCCCTGCCTTAGGCCTACCTGATGGAAGTAAAGCCTCAACCACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

(호모사피엔스 GSTM1 3’-UTR)

서열번호: 11

(Mus musculus NDUFA1 3’-UTR)

서열번호: 12

GGAAGCATTTTCCTGATTGATGAAAAAAATAACTCAGTTATGGCCATCTACCCCTGCTAGAAGGTTACAGTGTATTATGTAGCATGCAATGTGTTATGTAGTGCTTAATAAAAATAAAATGAAAAAAATGCAAAAAAAAAAAAAAAAA

(호모사피엔스 NDUFA1 3’-UTR)

서열번호: 13

(Mus musculus CBR2 3’-UTR)

서열번호: 14

ATGCCGGCTTACCATCTCTACCATCATCCGGTTTGGTCATCCAACAAGAAGAAATGAATATGAAATTCCAGCAATAAGAAATGAACAAAGATTGGAGCTGAAGACCTTAAGTGCTTGCTTTTTGCCCGCTGACCAGATAACATTAGAACTATCTGCATTATCTATGCAGCATGGGGTTTTTATTATTTTTACCTAAAGATGTCTCTTTTTGGTAATGACAAACGTGTTTTTTAAGAAAAAAAAAAAAGGCCTGGTTTTTCTCAATACACCTTTAACGGTTTTTAAATTGTTTCATATCTGGTCAAGTTGAGATTTTTAAGAACTTCATTTTTAATTTGTAATAAAGTTTACAACTTGATTTTTTCAAAAAAGTCAACAAACTGCAAGCACCTGTTAATAAAGGTCTTAAATAATAA

(Mus musculus YBX1 3’-UTR)

서열번호: 15

(Mus musculus YBX1 3’-UTR)

서열번호: 16

ATGCCGGCTTACCATCTCTACCATCATCCGGTTTAGTCATCCAACAAGAAGAAATATGAAATTCCAGCAATAAGAAATGAACAAAAGATTGGAGCTGAAGACCTAAAGTGCTTGCTTTTTGCCCGTTGACCAGATAAATAGAACTATCTGCATTATCTATGCAGCATGGGGTTTTTATTATTTTTACCTAAAGACGTCTCTTTTTGGTAATAACAAACGTGTTTTTTAAAAAAGCCTGGTTTTTCTCAATACGCCTTTAAAGGTTTTTAAATTGTTTCATATCTGGTCAAGTTGAGATTTTTAAGAACTTCATTTTTAATTTGTAATAAAAGTTTACAACTTGATTTTTTCAAAAAAGTCAACAAACTGCAAGCACCTGTTAATAAAGGTCTTAAATAATAAAAAAAAAAAAAAA

(호모사피엔스 YBX1 3’-UTR)

서열번호: 17

GGAGGCTTGATGGGCTTTTTGCCCTCGTTCCTAGAGGCTTAACCATAATAAAATCCCTAATAAAGC

(Mus musculus Ndufb8 3’-UTR)

서열번호: 18

GGAGGCTTCGTGGGCTTTTGGGTCCTCTAACTAGGACTCCCTCATTCCTAGAAATTTAACCTTAATGAAATCCCTAATAAAACTCAGTGCTGTGTTATTTGTGCCTCAAAAAAAAAAAAAAAAAA

(호모사피엔스 Ndufb8 3’-UTR)

서열번호: 19

GTGAGGAAGAGGAGTGCTGTTCCTGCCTTCCTAGCCCAGCTGGGTCTGACCAGAGGCTACTGTGTACCCATTTACCATGCGTGATTGTTAACTCAGAGTGGGGTGTAGCCAGGTATTGACTGAATGTATGTTCTTGCTGACCTGTGTTTTTTTCTGTAGGGACCAAAGCAGTATCCTTACAATAATCTGTACCTGGAACGAGGCGGTGATCCCTCCAAAGAACCAGAGCGGGTGGTTCACTATGAGATCTGAGGAGGCTTCGTGGGCTTTTGGGTCCTCTAACTAGGACTCCCTCATTCCTAGAAATTTAACCTTAATGAAATCCCTAATAAAACTCAGTGCTGTGTTATTTGTGCCTCAAAAAAAAAAAAAAAAAA

(호모사피엔스 Ndufb8 3’-UTR)

서열번호: 20

TCGTTGACACTCACCATTTCTGTGAAAGACTTTTTTTTTTTTTAACATATTATACTAGATTTGACTAACTCAATCTTGTAGCTTCTGCAGTTCTCCCCACCCCCAACCTAGTTCTTAGAGTATGTTTCCCCTTTTGAAACATGTAAACATACTTTGGGCATAAATATTTTTTAAAATATAACTATAATGCTTCACTAATACCTTAAAAATGCCTAGTGAACTAACTCAGTACATTATATAATGGCCAAGTGAAAGTTTTGTGTTTTCATGTCCTGTTTTTCTTTGAAATTATATAGCCCAGAAATTAGCTCATTATCTGAAAAACGTATAAGAACTGATGAATTGTATAATACAGGAGTATTGCCATTGAATGTACTGTTTGATTTATTCAAGCAGGTAATGAACAATGTTGTCAAACTCTCTAATGAGACATCATAATTAGGACATAAGCTAAAAGGGGCATTACTCCGGCAGTCTTTTTTTCTTAATCCTAGTACCATACATATTCTTTGGCATGAAAGAATGAAAAGCATTAGTAAACAACTGAAGTCCTACCATGGCTCTGTAGGGTTTTTGGAACAATTCCTGGAATTGGAAAGTGAAAATGGATAGCATGTGGGGGAAACCCTCATCTGAGTAGCAAGATTTTAGTAAAGATGACTAAGCCATTAACAGCATGCATTCATATTTAATTTTATTGACTCCTGCCATCAGCTTTTGTAGATCTTTTGGGTGGAAGGTTGTGATTTTTACTGGGAGGACTTGAGTAGAAGTGGATGATTAAAATTGAGGAGTATATAATTCTTTCTGGGACTGCTTAAATGTTATTGTTTGAAAATGCCTTCACTTTCCCCCTTTGGTCAAAGAGATGTGCTTAAAATTCTTATTCCTTCACAATAAATAATTTTGATTTTCTTAGACA

(호모사피엔스 CNTN1-004 3’-UTR)

서열번호: 21

TCGTTGACACTCACCATTTCTGTGAAAGACTTTTTTTTTTTTAACATATTATACTAGATTTGACTAACTCAATCTTGTAGCTTCTGCAGTTCTCCCCACCCCCAACCTAGTTCTTAGAGTATGTTTCCCCTTTTGAAACATGTAAACATACTTTGGGCATAAATATTTTTTAAAATATAACTATAATGCTTCACTAATACCTTAAAAATGCCTAGTGAACTAACTCAGTACATTATATAATGGCCAAGTGAAAGTTTTGTGTTTTCATGTCCTGTTTTTCTTTGAAATTATATAGCCCAGAAATTAGCTCATTATCTGAAAAACGTATGAAGAACTGATGAATTGTATAATACAGGAGTATTGCCATTGAATGTACTGTTTGATTTATTCAAGCAGGTAATGAACAATGTTGTCAAACTCTCTAATGAGACATCATAATTAGGACATAAGCTAAAAGGGGCATTACTCCGGCAGTCTTTTTTTCTTAATCCTAGTACCATACATATTCTTTGGCATGAAAGAATGAAAAGCATTAGTAAACAACTGAAGTCCTACCATGGCTCTGTAGGGTTTTTGGAACAATTCCTGGAATTGGAAAGTGAAAATGGATAGCATGTGGGGGAAACCCTCATCTGAGTAGCAAGATTTTAGTAAAGATGACTAAGCCATTAACAGCATGCATTCATATTTAATTTTATTGACTCCTGCCATCAGCTTTTGTAGATCGTTTGGGTGGAAGGTTGTGATTTTTACTGGGAGGACTTGAGTAGAAGTGGATGATTAAAATTGAGGAGTATATAATTCTTTCTGGGACTGCTTAAATGTTATTGTTTGAAAATACCTTCACTTTCCCCCTTTGGTCAAAGAGATGTGCTTAAAATTCTTATTCCTTCACAATAAATAATTTTGATTTTCTTAGACA (호모사피엔스 CNTN1-004 3’-UTR)

서열번호: 22

TTTTTTCGTTGACACTCACCATTTCTGTGAAAGACTTTTTTTTTTTTTAACATATTATACTAGATTTGACTAACTCAATCTTGTAGCTTCTGCAGTTCTCCCCACCCCCAACCTAGTTCTTAGAGTATGTTTCCCCTTTTGAAACATGTAAACATACTTTGGGCATAAATATTTTTTAAAATATAACTATAATGCTTCACTAATACCTTAAAAATGCCTAGTGAACTAACTCAGTACATTATATAATGGCCAAGTGAAAGTTTTGTGTTTTCATGTCCTGTTTTTCTTTGAAATTATATAGCCCAGAAATTAGCTCATTATCTGAAAAACGTATGAAGAACTGATGAATTGTATAATACAGGAGTATTGCCATTGAATGTACTGTTTGATTTATTCAAGCAGGTAATGAACAATGTTGTCAAACTCTCTAATGAGACATCATAATTAGGACATAAGCTAAAAGGGGCATTACTCCGGCAGTCTTTTTTTCTTAATCCTAGTACCATACATATTCTTTGGCATGAAAGAATGAAAAGCATTAGTAAACAACTGAAGTCCTACCATGGCTCTGTAGGGTTTTTGGAACAATTCCTGGAATTGGAAAGTGAAAATGGATAGCATGTGGGGGAAACCCTCATCTGAGTAGCAAGATTTTAGTAAAGATGACTAAGCCATTAACAGCATGCATTCATATTTAATTTTATTGACTCCTGCCATCAGCTTTTGTAGATCTTTTGGGTGGAAGGTTGTGATTTTTACTGGGAGGACTTGAGTAGAAGTGGATGATTAAAATTGAGGAGTATATAATTCTTTCTGGGACTGCTTAAATGTTATTGTTTGAAAATGCCTTCACTTTCCCCCTTTGGTCAAAGAGATGTGCTTAAAATTCTTATTCCTTCACAATAAATAATTTTGATTTTCTTAGACA

(호모사피엔스 CNTN1-004 3’-UTR)

서열번호: 23

TGATAACTCAAGCTTTTCATTTTCTCATACAGTTGTACAGATTTAACTGGGACCATCAGTTTTAAACTGTTGTCAAGCTAACTAATAATCATCTGCTTTAAGACGCAAGATTCTGAATTAAACTTTATATAGGTATAGATACATCTGTTGTTTCTTTGTATTTCAGGAAAGGTGATAGTAGTTTTATTTGATACTGATAAATATTGAATTGATTTTTTAGTTATTTTTTATCATTTTTTCAATGGAGTAGTATAGGACTGTGCTTTGTCCTTTTTATGAATGAAAAAATTAGTATAAAGTAATAAATGTCTTATGTTACCCAAGAAAAAA

(호모사피엔스 CNTN1-004 3’-UTR)

서열번호: 24

AAATTATTATATGTGTGTGTATATATATAGTTTAACTTTAAAAATAATTTATTAGTCATCATAAAGAAATAAATGTCTCTGGCTCAAGATGTTACTTATTTCCTTCTTTTATATTTTCTAGTCTCAATTACTGTTCCAAAAGGAGCTATCTTAGAACTTAGACTAGAGATCCAGATTAA

(호모사피엔스 CNTN1-004 3’-UTR)

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 전사체의 5'-UTR 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어진다. 가장 바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 5'-UTR 요소는 서열번호: 25 또는 서열번호: 30, 또는 상응하는 RNA 서열에 따른 서열에 각각 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어진다:

서열번호: 25

CTTTCCCATTCTGTAGCAGAATTTGGTGTTGCCTGTGGTCTTGGTCCCGCGGAG

(Mus musculus MP68 5’-UTR)

서열번호: 26

CTTCCCGGCATCCCCTGCGCGCGCCTGCGCGCTCGGTGACCTTTCCGAGTTGGCTGCAGATTTGTGGTGCGTTCTGAGCCGTCTGTCCTGCGCCAAG

(호모사피엔스 MP68 5’-UTR)

서열번호: 27

CTTCCCGGCATCCCCTGCGCGCGCCTGCGCGCTCGGTGACCTTTCCGAGTTGGCTGCAGATTTGTGGTGCGTTCTGAGCCGTCTGTCCTGCGCCAAGGGAGCGTACCTTGGCCTTGAGAGGTTCAGCTGCCTAACCCAGAGGCTACGCAGAGTTAGAGAAGCCAGAGTCCAAGCCAAGAACTCTGACTCCACATCCAGTCCCTTCTCTCCTTTATAACTCAAGTTTCCTTGCGCCACACTGCCCTCCACGTTATGCTGTACATGACAACTTGGGTGAGGCAACAGGGAAGCTGAAAAGAGATCATACGGTGCTGA

(호모사피엔스 MP68 5’-UTR)

서열번호: 28

(Mus musculus NDUFA4 5’-UTR)

서열번호: 29

GUCCGCUCAGCCAGGUUGCAGAAGCGGCUUAGCGUGUGUCCUAAUCUUCUCUCUGCGUGUAGGUAGGCCUGUGCCGCAAAC

(호모사피엔스 NDUFA4 5’-UTR)

서열번호: 30

GGGTCCTTCAGGTAGGAGGTCCTGGGTGACTTTGGAAGTCCGTAGTGTCTCATTGCAGATAATTTTTAGCTTAGGGCCTGGTGGCTAGGTCGGTTCTCTCCTTTCCAGTCGGAGACCTCTGCCGCAAAC

(호모사피엔스 NDUFA4 5’-UTR)

본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 또한 서열번호: 1 내지 24 또는 서열번호: 49 내지 318에 따른 서열의 3'-UTR와 같은 유전자 전사체의 3'-UTR의 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어질 수 있으며, 상기 절편은 바람직하게 상기 설명된 기능적 절편 또는 기능적 변이체 절편이다. 이러한 절편은 바람직하게 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 나타낸다. 바람직한 실시예에서, 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드 사이, 바람직하게 5 내지 약 150개 뉴클레오티드 사이, 더욱 바람직하게 10 내지 100개 뉴클레오티드 사이, 더욱 더 바람직하게 15 내지 90개 뉴클레오티드 사이, 가장 바람직하게 20 내지 70개 뉴클레오티드 사이의 길이를 나타낸다. 바람직하게, 상기 변이체, 절편 또는 변이체 절편은 서열번호: 1 내지 서열번호: 24로 이루어진 그룹으로부터 선택된 핵산 서열을 포함하는 인공 핵산 분자에 의해 나타나는 단백질 생산을 연장시키는 효과의 적어도 30%의 효율, 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90%의 효율을 갖는 본 발명에 따른 인공 핵산 분자로부터 단백질 생산을 연장시키는 3'-UTR의 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편이다.

본 발명에 따른 인공 핵산 분자의 적어도 하나의 5'-UTR 요소는 또한 핵산 서열의 절편을 포함 또는 이로 이루어질 수 있으며, 이는 서열번호: 25 또는 서열번호 30 및 서열번호: 319 내지 382에 따른 서열의 5'-UTR과 같은 유전자 전사체의 5'-UTR의 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 가지며, 상기 절편은 바람직하게 상기 설명된 기능적 절편 또는 기능적 변이체 절편이다. 이러한 절편은 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 나타낸다. 바람직한 실시예에서, 상기 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타낸다. 바람직하게 상기 변이체, 절편 또는 변이체 절편은 5'-UTR의 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편이며, 서열번호: 25 내지 서열번호: 30으로 이루어진 그룹으로부터 선택된 핵산 서열을 포함하는 인공 핵산 분자에 의해 나타나는 단백질 생산 증가 효율의 적어도 30%, 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90%의 효율로 본 발명에 따른 인공 핵산 분자로부터 단백질 생산을 증가시킨다.

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 나타낸다. 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소의 길이에 대한 상한은 500개 뉴클레오티드 또는 그 미만, 예를 들어 400, 300, 200, 150 또는 100개 뉴클레오티드일 수 있다. 다른 실시예에서 상기 상한은 50 내지 100개 뉴클레오티드의 범위 내에서 선택될 수 있다. 예를 들어, 상기 절편 또는 이의 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개 뉴클레오티드, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타낼 수 있다.

게다가, 본 발명에 따른 인공 핵산 분자는 상기 설명된 하나 이상의 3'-UTR 요소 및/또는 하나 이상의 5'-UTR 요소를 포함할 수 있다. 예를 들어, 본 발명에 따른 인공 핵산 분자는 하나, 둘, 셋, 넷 또는 그 이상의 3'-UTR 요소, 및/또는 하나, 둘, 셋, 넷 또는 그 이상의 5'-UTR 요소를 포함할 수 있으며, 상기 각각의 3'-UTR 요소는 동일할 수 있으며, 또는 그들은 상이할 수 있으며, 및 유사하게 각각의 5'-UTR 요소는 동일할 수 있거나 또는 그들은 다를 수 있다. 예를 들어, 본 발명에 따른 인공 핵산 분자는 상기 설명된 두 개의 본질적으로 동일한 3'-UTR 요소, 예를 들어 서열번호: 1 내지 24 및 서열번호: 49 내지 318에 따른 서열과 같이 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 두 개의 3'-UTR 요소, 또는 유전자 전사체의 3'-UTR의 절편 또는 변이체, 상기 설명된 이의 기능적 변이체, 이의 기능적 절편, 또는 이의 기능적 변이체 절편을 포함할 수 있다. 따라서, 예를 들어, 본 발명에 따른 인공 핵산 분자는 상기 설명된 두 개의 본질적으로 동일한 5'-UTR 요소, 예를 들어 서열번호: 25 내지 30 및 서열번호: 319 내지 382에 따른 서열과 같은 유전자 전사체의 5'-UTR로부터, 또는 유전자 전사체의 5'-UTR의 절편 또는 변이체로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 두 개의 5'-UTR 요소, 상기 설명된 이의 기능적 변이체, 이의 기능적 절편, 또는 이의 기능적 변이체 절편을 포함할 수 있다.

놀랍게도, 본 발명자들은 상기 설명된 3'-UTR 요소 및/또는 상기 설명된 5'-UTR 요소를 포함하는 인공 핵산 분자가 단백질 생산을 증가, 연장 및/또는 안정화시키는 mRNA 분자를 나타내거나 또는 제공할 수 있음을 발견하였다. 따라서, 본 발명에 개시된 3'-UTR 요소 및/또는 본 발명에 개시된 5'-UTR 요소는 mRNA 분자로부터 단백질 발현의 안정성을 개선 및/또는 번역 효율을 개선시킬 수 있다.

특히, 본 발명에 따른 인공 핵산 분자는 (i) 단백질 생산을 연장 및/또는 증가시키는 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소; (ii) 단백질 생산을 연장 및/또는 증가시키는 적어도 하나의 3'-UTR 요소, 그러나 단백질 생산을 연장 및/또는 증가시키는 5'-UTR 요소는 제외; 또는 (iii) 단백질 생산을 연장 및/또는 증가시키는 적어도 하나의 5'-UTR 요소, 그러나 단백질 생산을 연장 및/또는 증가시키는 3'-UTR 요소는 제외하고 포함할 수 있다.

그러나, 특히 (ii) 및 (iii)의 경우에, 가능한 또한 (i)의 경우에, 본 발명에 따른 인공 핵산 분자는 추가로 하나 이상의 "추가적 3'-UTR 요소 및/또는 5'-UTR 요소", 즉 상기 설명된 요건을 실현하지 못하는 3'-UTR 요소 및/또는 5'-UTR 요소를 포함할 수 있다. 예를 들어, 본 발명에 따른 3'-UTR 요소, 즉 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키는 3'-UTR 요소를 포함하는 본 발명에 따른 인공 핵산 분자는 추가적으로 어느 추가적 3'-UTR 및/또는 어느 추가적 5'-UTR, 특히 추가적 5'-UTR, 예를 들어 5'-TOP UTR, 또는 어느 다른 5'-UTR 또는 5'-UTR 요소를 포함할 수 있다. 유사하게 예를 들어, 본 발명에 따른 5'-UTR 요소, 즉 상기 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키는 5'-UTR 요소를 포함하는 본 발명에 따른 인공 핵산 분자는 추가적으로 어느 추가적 3'-UTR 및/또는 어느 추가적 5'-UTR, 특히 추가적 3'-UTR, 예를 들어 알부민 유전자의 3'-UTR로부터 유도된 3'-UTR, 특히 바람직하게 서열번호 31 또는 32, 특히 서열번호 32에 따른 서열을 포함하는 3'-UTR, 또는 어느 다른 3'-UTR 또는 3'-UTR 요소를 포함할 수 있다.

만약 추가적으로 단백질 생산을 연장 및/또는 증가시키는 본 발명의 적어도 하나의 5'-UTR 요소 및/또는 본 발명의 적어도 하나의 3'-UTR 요소, 추가적 3'-UTR (요소) 및/또는 추가적 5'-UTR (요소)가 본 발명에 따른 인공 핵산 분자에 존재한다면, 추가적 5'-UTR (요소) 및/또는 추가적 3'-UTR (요소)은 본 발명의 3'-UTR 요소 및/또는 본 발명의 5'-UTR 요소와 상호작용 할 수 있으며, 이에 따라 본 발명의 3'-UTR 요소 및/또는 본 발명의 5'-UTR 요소의 효과를 각각 증가 및/또는 연장시키는 것을 돕는다. 이러한 추가적 3'-UTR 및/또는 5'-UTR (요소)는 추가적으로 안정성 및 번역 효율을 도울 수 있다. 게다가, 만약 본 발명의 3'-UTR 요소 및 본 발명의 5'-UTR 요소 모두가 본 발명에 따른 인공 핵산 분자에 존재한다면, 본 발명의 5'-UTR 요소 및 본 발명의 3'-UTR 요소의 연장 및/또는 증가 효과는 바람직하게 시너지적 방식으로 증진 및 연장된 단백질 생산을 초래할 수 있다.

바람직하게, 상기 추가적 3'-UTR은 알부민 유전자, a-글로빈 유전자, b-글로빈 유전자, 티로신 히드록실라제 유전자, 리폭시게나제 유전자, 및 콜라겐 알파 1(I) 유전자와 같은 콜라겐 알파 유전자로 이루어진 그룹으로부터 선택된 유전자의 3'-UTR, 또는 알부민 유전자, a-글로빈 유전자, b-글로빈 유전자, 티로신 히드록실라제 유전자, 리폭시게나제 유전자, 및 개시 내용이 참고문헌으로 본 발명에 병합된 국제출원 WO2013/143700의 서열번호 1369-1390에 따른 콜라겐 알파 1(I) 유전자와 같은 콜라겐 알파 유전자로 이루어진 그룹으로부터 선택된 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다. 특히 바람직한 실시예에서, 추가적 3'-UTR은 알부민 유전자, 바람직하게 척추동물 알부민 유전자, 더욱 바람직하게 포유동물 알부민 유전자, 가장 바람직하게 서열번호 31에 따른 인간 알부민 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다:

서열번호 31:

CATCACATTT AAAAGCATCT CAGCCTACCA TGAGAATAAG AGAAAGAAAA TGAAGATCAA AAGCTTATTC ATCTGTTTTT CTTTTTCGTT GGTGTAAAGC CAACACCCTG TCTAAAAAAC ATAAATTTCT TTAATCATTT TGCCTCTTTT CTCTGTGCTT CAATTAATAA AAAATGGAAA GAATCT

(인간 알부민 3'-UTR; 국제 출원 WO2013/143700의 서열번호: 1369에 상응)

이러한 맥락에서 본 발명의 핵산 분자는 국제 출원 WO2013/143700의 서열번호 1369-1390에 따른 핵산으로부터 유도된 추가적 3'-UTR 요소, 이의 절편, 유사체 또는 변이체를 포함하는 것이 특히 바람직하다.

가장 바람직하게 추가적 3'-UTR은 서열번호 32에 따른 인간 알부민 유전자의 절편으로부터 유도된 핵산 서열을 포함한다:

서열번호 32:

CATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCT

(알부민7 3'-UTR; 국제 출원 WO2013/143700의 서열번호: 1376에 상응)

이러한 맥락에서 본 발명의 인공 핵산 분자의 추가적 3'-UTR은 서열번호 32에 따른 핵산 서열, 또는 상응하는 RNA 서열을 포함 또는 이로 이루어지는 것이 특히 바람직하다.

상기 추가적 3'-UTR은 또한 리보좀 단백질 코딩 유전자로부터 유도된 핵산 서열을 포함 또는 이로 이루어질 수 있으며, 이러한 추가적 3'-UTR이 유도될 수 있는 것으로부터 리보좀 단백질 코딩 유전자는 리보좀 단백질　L9 (RPL9), 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L4 (RPL4), 리보좀 단백질　L5 (RPL5), 리보좀 단백질　L6 (RPL6), 리보좀 단백질　L7 (RPL7), 리보좀 단백질　L7a (RPL7A), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L12 (RPL12), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L18 (RPL18), 리보좀 단백질　L18a (RPL18A), 리보좀 단백질　L19 (RPL19), 리보좀 단백질　L21 (RPL21), 리보좀 단백질　L22 (RPL22), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L17 (RPL17), 리보좀 단백질　L24 (RPL24), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L30 (RPL30), 리보좀 단백질　L27a (RPL27A), 리보좀 단백질　L28 (RPL28), 리보좀 단백질　L29 (RPL29), 리보좀 단백질　L31 (RPL31), 리보좀 단백질　L32 (RPL32), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L37 (RPL37), 리보좀 단백질　L37a (RPL37A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　L39 (RPL39), 리보좀 단백질,　라지,　P0 (RPLP0), 리보좀 단백질,　라지,　P1 (RPLP1), 리보좀 단백질,　라지,　P2 (RPLP2), 리보좀 단백질　S3 (RPS3), 리보좀 단백질　S3A (RPS3A), 리보좀 단백질　S4,　X-연결 (RPS4X), 리보좀 단백질　S4,　Y-연결 1 (RPS4Y1), 리보좀 단백질　S5 (RPS5), 리보좀 단백질　S6 (RPS6), 리보좀 단백질　S7 (RPS7), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S10 (RPS10), 리보좀 단백질　S11 (RPS11), 리보좀 단백질　S12 (RPS12), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S15 (RPS15), 리보좀 단백질　S15a (RPS15A), 리보좀 단백질　S16 (RPS16), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S20 (RPS20), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S25 (RPS25), 리보좀 단백질　S26 (RPS26), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S27a (RPS27a), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L15 (RPL15), 리보좀 단백질　S2 (RPS2), 리보좀 단백질　L14 (RPL14), 리보좀 단백질　S14 (RPS14), 리보좀 단백질　L10 (RPL10), 리보좀 단백질　L10a (RPL10A), 리보좀 단백질　L35 (RPL35), 리보좀 단백질　L13a (RPL13A), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　L41 (RPL41), 리보좀 단백질　S18 (RPS18), 리보좀 단백질　S24 (RPS24), 리보좀 단백질　L8 (RPL8), 리보좀 단백질　L34 (RPL34), 리보좀 단백질　S17 (RPS17), 리보좀 단백질　SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게(ubiquitously) 발현 (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자(pseudogene) (RPL13AP), 리보좀 단백질 L37a 위유전자8 (RPL37AP8), 리보좀 단백질 S10 위유전자5 (RPS10P5), 리보좀 단백질 S26 위유전자11 (RPS26P11), 리보좀 단백질 L39 위유전자5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자14 (RPL36P14)을 포함하나, 이에 제한되지 않는다.

바람직하게, 추가적 5'-UTR은 TOP 유전자의 5'-UTR로부터 유도된 또는 TOP 유전자의 5'-UTR의 절편, 유사체 또는 변이체로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

특히 5'-UTR 요소는 상기 정의된 TOP-모티프 또는 5'TOP를 포함하지 않는 것이 바람직하다. 특히, TOP 유전자의 5'-UTR은 TOP 모티프가 없는 TOP 유전자의 5'-UTR인 것이 바람직하다.

TOP 유전자의 5'-UTR로부터 유도된 핵산 서열은 진핵생물 TOP 유전자, 바람직하게 식물 또는 동물 TOP 유전자, 더욱 바람직하게 척색동물 TOP 유전자, 더욱 더 바람직하게 척추동물 TOP 유전자, 가장 바람직하게 인간 TOP 유전자와 같은 포유동물 TOP 유전자로부터 유도된다.

예를 들어, 상기 추가적 5'-UTR은 바람직하게 이의 공개가 참고문헌으로 본 발명에 병합된 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422로 이루어진 그룹으로부터, 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422의 유사체로부터, 이의 변이체로부터, 또는 바람직하게 상응하는 RNA 서열로부터 로부터 선택된 핵산 서열로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 5'-UTR 요소로부터 선택된다. 용어 "국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422의 유사체"는 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422에 따른 서열에 상동성(homologous)인 호모 사피엔스 외의 다른 종의 서열을 의미한다.

바람직한 실시예에서, 상기 추가적 5'-UTR은 뉴클레오티드 위치 5 (즉 서열 내 위치 5에 위치한 뉴클레오티드)로부터 시작 코돈에서 5' 바로 옆 뉴클레오티드 위치 (서열의 3' 말단에 위치), 예를 들어 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422로부터, 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422의 유사체로부터, 이의 변이체로부터, 또는 상응하는 RNA 서열로부터 선택된 핵산 서열의 ATG 서열에 5' 바로 옆 뉴클레오티드 위치까지 연장된 핵산 서열로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다. 상기 추가적 5'-UTR은 5' TOP에 3' 바로 옆 뉴클레오티드 위치로부터 시작 코돈에 5' 바로 옆 뉴클레오티드 위치까지, 예를 들어 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422로부터, 국제 출원 WO2013/143700의 서열번호 1-1363, 서열번호 1395, 서열번호 1421 및 서열번호 1422의 유사체로부터, 이의 변이체로부터, 또는 상응하는 RNA 서열로부터 선택된 핵산 서열의 ATG 서열에 5' 바로 옆 뉴클레오티드 위치까지 연장된 핵산 서열로부터 유도되는 것이 특히 바람직하다.

특히 바람직한 실시예에서, 상기 추가적 5'-UTR은 리보좀 단백질을 코딩하는 TOP 유전자의 5'-UTR로부터 또는 리보좀 단백질을 코딩하는 TOP 유전자의 5'-UTR의 변이체로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다. 예를 들어, 상기 5'-UTR 요소는 국제 출원 WO2013/143700의 서열번호: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359의 어느 하나에 따른 핵산 서열의 5'-UTR, 또는 1360, 상응하는 RNA 서열, 상기 설명된 이의 유사체, 또는 이의 변이체, 바람직하게 5'-TOP 모티프가 없는 것으로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다. 상기 설명된 것처럼, 5' 바로 옆 뉴클레오티드에 위치 5로부터 ATG (서열의 3' 말단에 위치함)까지 연장된 서열은 상기 서열의 5'-UTR에 상응한다.

바람직하게, 상기 추가적 5'-UTR은 리보좀 라지 단백질(RPL)을 부호화하는 TOP 유전자의 5'-UTR로부터, 또는 리보좀 라지 단백질(RPL)을 부호화하는 TOP 유전자의 5'-UTR의 유사체 또는 변이체로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다. 예를 들어, 상기 5'-UTR 요소는 국제 출원 WO2013/143700의 서열번호: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 및 1422의 어느 것에 따른 핵산 서열의 5'-UTR, 상응하는 RNA 서열, 상기 설명된 이의 유사체, 또는 이의 변이체, 바람직하게 5'TOP 모티프가 없는 것으로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

특히 바람직한 실시예에서, 상기 5'-UTR 요소는 리보좀 단백질 라지 32 유전자, 바람직하게 척추동물 리보좀 단백질 라지 32(L32) 유전자, 더욱 바람직하게 포유동물 리보좀 단백질 라지 32(L32) 유전자, 가장 바람직하게 인간 리보좀 단백질 라지 32(L32) 유전자의 5'-UTR로부터, 또는 리보좀 단백질 라지 32(L32) 유전자, 바람직하게 척추동물 리보좀 단백질 라지 32(L32) 유전자, 더욱 바람직하게 포유동물 리보좀 단백질 라지 32(L32) 유전자, 가장 바람직하게 인간 리보좀 단백질 라지 32(L32) 유전자의 변이체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어지며, 바람직하게 상기 추가적 5'-UTR은 상기 유전자의 5'TOP를 포함하지 않는다.

따라서, 특히 바람직한 실시예에서, 상기 추가적 5'-UTR은 서열번호 33에 따른 핵산 서열(5' 말단 올리고피리미딘 트랙트(tract)가 없는 리보좀 단백질 라지 32의 5'-UTR: GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC (서열번호 33); 국제 출원 WO2013/143700의 서열번호 1368에 상응) 또는 바람직하게 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지며, 상기 추가적 5'-UTR은 서열번호 33에 따른 핵산 서열 또는 더욱 바람직하게 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어지며, 바람직하게 상기 절편은 상기 설명된 것과 같으며, 즉 전장 5'-UTR의 적어도 20% 등을 나타내는 뉴클레오티드의 연속적인 스트레치이다. 바람직하게, 상기 절편은 적어도 약 20개 뉴클레오티드 또는 그 이상, 바람직하게 적어도 약 30개 뉴클레오티드 또는 그 이상, 더욱 바람직하게 적어도 약 40개 뉴클레오티드 또는 그 이상의 길이를 나타낸다. 바람직하게 상기 절편은 본 발명에 설명된 기능적 절편이다.

일부 실시예에서, 상기 인공 핵산 분자는 RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB로부터 선택된 포유동물과 같은, 척추동물 TOP 유전자, 예를 들어 TOP 유전자의 5'-UTR로부터 유도된 핵산 서열 또는 이의 유사체 또는 변이체를 포함 또는 이로 이루어진 추가적 5'-UTR을 포함하며, 바람직하게 상기 추가적 5'-UTR은 상기 유전자의 TOP 모티프 또는 5'TOP를 포함하지 않으며, 선택적으로 상기 추가적 5'-UTR은 5'말단 올리고피리미딘 트랙트(TOP)의 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 다운스트림 위치에 위치한 뉴클레오티드의 이의 5'-말단에서 시작하며, 선택적으로 상기 TOP 유전자의 5'-UTR로부터 유도된 추가적 5'-UTR은 이것이 유도된 유전자의 시작 코돈(A(U/T)G)의 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 업스트림 위치에 위치한 뉴클레오티드와 함께 이의 3'-말단에서 종결한다.

본 발명에 따른 인공 핵산 분자는 mRNA 또는 바이러스 RNA와 같은 RNA 또는 레플리콘(replicon), DNA 플라스미드 또는 바이러스 DNA와 같은 DNA일 수 있거나, 또는 변형된 RNA 또는 DNA 분자일 수 있다. 이는 센스 가닥(sense strand) 및 안티-센스 가닥을 갖는 이중 가닥 분자, 예를 들어 센스 가닥 및 안티-센스 가닥을 갖는 DNA 분자로 제공될 수 있다.

본 발명에 따른 인공 핵산 분자는 선택적으로 5'-캡(cap)을 추가로 포함할 수 있다. 상기 선택적 5'-캡은 바람직하게 ORF에 5', 더욱 바람직하게 적어도 하나의 5'-UTR 또는 본 발명에 따른 인공 핵산 분자 내 어느 추가적 5'-UTR에 5'에 위치한다.

바람직하게, 본 발명에 따른 인공 핵산 분자는 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가적으로 포함한다. 바람직하게, 선택적 폴리(A) 서열은 적어도 하나의 3'-UTR 요소 또는 어느 추가적 3'-UTR에 위치하며, 더욱 바람직하게 상기 선택적 폴리(A) 서열은 3'-UTR 요소의 3'-말단에 연결된다. 상기 연결은 예를 들어 1-50개 링커를 통한 것과 같은, 2, 4, 6, 8, 10, 20 등 뉴클레오티드, 바람직하게 1-20개 뉴클레오티드의 스트레치, 예를 들어 하나 이상의 제한 부위를 포함 또는 이로 이루어진 것을 통해, 직접적 또는 간접적일 수 있다. 그러나, 본 발명에 따른 인공 핵산 분자가 3'-UTR을 포함하지 않더라도, 예를 들어 적어도 하나의 5'-UTR 요소만을 포함하더라도, 이는 바람직하게 폴리(A) 서열 및/또는 폴리아데닐화 신호를 여전히 포함한다.

일 실시예에서, 상기 선택적 폴리아데닐화 신호는 3'-UTR 요소의 3'의 다운스트림에 위치한다. 바람직하게, 상기 폴리아데닐화 신호는 공통(consensus) 서열 NN(U/T)ANA, N = A 또는 U임, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함한다. 이러한 공통 서열은 대부분의 동물 및 박테리아 세포 시스템을 통해, 예를 들어 CstF, PAP, PAB2, CFI 및/또는 CFII와 협동하는 분해(cleavage)/폴리아데닐화 특이성 요소(CPSF)와 같은 폴리아데닐화 요소를 통해 인식될 수 있다. 바람직하게, 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 만약 3'-UTR 요소가 존재하지 않는 경우, 3'-UTR 요소 또는 ORF의 3'-말단의 약 50개 뉴클레오티드 미만, 더욱 바람직하게 약 30개 염기 미만, 가장 바람직하게 약 25개 염기 미만, 예를 들어 21개 베이스 다운스트림에 위치한다.

본 발명에 따른 인공 핵산 분자, 예를 들어 3'-UTR 요소의(또는 ORF의) 폴리아데닐화 신호 다운스트림을 포함하는 인공 DNA 분자의 전사는 이의 3'-UTR요소의(또는 ORF의) 폴리아데닐화 신호 다운스트림을 포함하는 조숙-RNA를 생산할 것이다.

적절한 전사 시스템의 사용은 이후 조숙-RNA에 폴리(A) 서열의 부착을 일으킬 것이다. 예를 들어, 본 발명의 인공 핵산 분자는 이러한 DNA 분자의 전사에 따라 RNA의 폴리아데닐화를 초래할 수 있는, 상기 설명된 3'-UTR 요소 및 폴리아데닐화 신호를 포함하는 DNA 분자일 수 있다. 따라서, 생산된 RNA는 본 발명의 3'-UTR 요소 다음 폴리(A) 서열의 조합을 포함할 수 있다.

잠재적 전사 시스템은 인비트로(in vitro) 시스템 또는 세포 전사 시스템 등이다. 따라서, 본 발명에 따른 인공 핵산 분자의 전사, 예를 들어 오픈 리딩 프레임, 3'-UTR 요소 및/또는 5'-UTR 요소 및 선택적으로 폴리아데닐화-신호를 포함하는 인공 핵산 분자의 전사는 오픈 리딩 프레임, 3'-UTR 요소 및 선택적으로 폴리(A) 서열을 포함하는 mRNA 분자를 생산할 수 있다.

따라서, 본 발명은 또한 오픈 리딩 프레임, 상기 설명된 3'-UTR 요소 및/또는 상기 설명된 5'-UTR 요소 및 선택적으로 폴리(A) 서열을 포함하는 mRNA 분자인 인공 핵산 분자를 제공한다.

다른 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR은 폴리아데닐화 신호 또는 폴리(A) 서열을 포함하지 않는다. 더욱 바람직하게, 본 발명에 따른 인공 핵산 분자는 폴리아데닐화 신호 또는 폴리(A) 서열을 포함하지 않는다. 더욱 바람직하게, 상기 인공 핵산 분자의 3'-UTR, 또는 이러한 본 발명의 인공 핵산 분자는 폴리아데닐화 신호를 포함하지 않으며, 특히 폴리아데닐화 신호 AAU/TAAA를 포함하지 않는다.

바람직한 실시예에서, 본 발명은 오픈 리딩 프레임 및 서열번호: 1 내지 30에 따른 서열로 이루어진 그룹으로부터, 바람직하게 서열번호 1, 서열번호 5, 서열번호 8, 서열번호 11, 서열번호13, 서열번호14, 서열번호17, 서열번호 20, 서열번호 25 및 서열번호 28에 따른 서열로 이루어진 그룹으로부터 선택된 DNA 서열, 또는 서열번호: 1 내지 30, 바람직하게 서열번호 1, 서열번호 5, 서열번호 8, 서열번호 11, 서열번호 13, 서열번호 14, 서열번호 17, 서열번호 20, 서열번호 25 및 서열번호 28에 적어도 약 40% 이상의 상동성을 갖는 서열에 상응하는 RNA 서열, 또는 상기 설명된 이의 절편을 포함하는 인공 RNA 분자인 인공 핵산 분자를 제공한다. 게다가, 상응하는 인공 DNA 분자는 또한 제공된다.

다른 바람직한 실시예에서, 본 발명은 오픈 리딩 프레임 및 서열번호: 1 내지 30에 따른 서열로 이루어진 그룹으로부터, 바람직하게 서열번호 1, 서열번호 5, 서열번호 8, 서열번호 11, 서열번호13, 서열번호14, 서열번호17, 서열번호 20, 서열번호 25 및 서열번호 28에 따른 서열로 이루어진 그룹으로부터 선택된 서열, 또는 서열번호: 1 내지 30, 바람직하게 서열번호 1, 서열번호 5, 서열번호 8, 서열번호 11, 서열번호 13, 서열번호 14, 서열번호 17, 서열번호 20, 서열번호 25 및 서열번호 28에 적어도 약 40% 이상의 상동성을 갖는 서열을 포함하는 인공 DNA 분자인 인공 핵산 분자를 제공한다.

따라서, 본 발명은 번역 효율에 관하여 안정화되고 최적화된 RNA 분자, 바람직하게 mRNA 분자의 주형으로 제공할 수 있는 인공 핵산 분자를 제공한다. 즉, 본 발명의 핵산 분자는 mRNA의 생산을 위한 주형으로 사용될 수 있는 DNA일 수 있다. 수득 가능한 mRNA는 즉 오픈 리딩 프레임에 의해 부호화되는 바람직한 펩타이드 또는 단백질의 생산을 위해 번역될 수 있다. 만약 인공 핵산 분자가 DNA일 경우, 예를 들어 mRNA의 연속되고 반복되는 인비트로(in vitro) 또는 인비보(iv vivo) 생산을 위한 이중 가닥 저장 형태로 사용될 수 있다. 이에 따라, 인비트로는 특히 살아있는 개체의 조직을 포함하는 ("살아있는") 세포 및/또는 조직을 의미한다. 세포는 특히 세포주, 일차 세포, 조직 또는 개체 내 세포를 포함한다. 특정한 실시예에서 세포 배양하는 세포 타입은 본 발명에 적합할 수 있다. 포유동물 세포, 예를 들어 인간 세포 및 마우스 세포가 특히 바람직하다. 특히 바람직한 실시예에서 인간 세포주 HeLa, 및 U-937 및 마우스 세포주 NIH3T3, JAWSII 및 L929가 사용된다. 게다가 일차 세포는 특히 바람직하며, 특히 바람직한 실시예에서 인간 표피 섬유아세포(human dermal fibroblasts, HDF)가 사용될 수 있다. 그렇지 않으면 또한 개체의 조직이 사용될 수 있다.

일 실시예에서, 본 발명에 따른 인공 핵산 분자는 추가로 폴리(A) 서열을 포함한다. 예를 들어, ORF를 포함하는 DNA 분자는, 선택적으로 이후 3'UTR이 따르는 것은 생성 mRNA 내 폴리(A) 서열로 전사될 수 있는 티미딘 뉴클레오티드의 스트레치를 포함할 수 있다. 폴리(A) 서열의 길이는 다를 수 있다. 예를 들어, 폴리(A) 서열은 약 20개 아데닌 뉴클레오티드 내지 약 300개 아데닌 뉴클레오티드까지, 바람직하게 약 40개 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 50 내지 약 100개 아데닌 뉴클레오티드, 약 60, 70, 80, 90 또는 100개 아데닌 뉴클레오티드와 같은 길이를 가질 수 있다. 가장 바람직하게, 본 발명의 핵산은 약 60 내지 약 70개 뉴클레오티드, 가장 바람직하게 64개 아데닌 뉴클레오티드의 폴리(A) 서열을 포함한다.

인공 RNA-분자는 또한 DNA-전구체(progenitor)로부터 필수적으로 전사되지 않고 화학적-합성의 일반적인 방법을 통해 인비트로(in vitro)에서 수득 가능할 수 있다.

특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 5'-에서 3'-방향 오픈 리딩 프레임, 상기 설명된 3'-UTR 요소 및 폴리(A) 서열을 포함하거나, 또는 5'-에서 3'-방향 상기 설명된 5'-UTR 요소, 오픈 리딩 프레임 및 폴리(A) 서열을 포함하는 RNA 분자, 바람직하게 mRNA 분자이다.

바람직한 실시예에서, 오픈 리딩 프레임은 본 발명의 인공 핵산의 3'-UTR 요소 및/또는 5'-UTR 요소가 유도된 유전자와 상이한 유전자로부터 유도된다. 일부 더욱 바람직한 실시예에서, 3'-UTR 요소 및/또는 5'-UTR 요소가 서열번호 1 내지 서열번호 30에 따른 서열로 이루어진 그룹으로부터 선택된 서열인 경우에, 상기 오픈 리딩 프레임은 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카르보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-Box 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1), 바람직하게 CNTN1-004 또는 이의 변이체로 이루어진 그룹으로부터 선택된 유전자를 코드하지 않는다.

바람직한 실시예에서, 상기 ORF는 인간 또는 식물, 특히 아라비답시스, 리보좀 단백질을 부호화하지 않으며, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 부호화하지 않는다. 더욱 바람직한 실시예에서, 상기 오픈 리딩 프레임(ORF)는 근원(origin)과 무관하게 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 부호화하지 않는다.

일 실시예에서, 본 발명은 오픈 리딩 프레임, 바람직하게 3'-UTR 요소 및/또는 5'-UTR 요소가 유도된 유잔자와 상이한 유전자로부터 유도된 오픈 리딩 프레임; 서열번호 1 내지 24에 따른 서열로 이루어진 그룹으로부터 선택된 DNA 서열과 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%; 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함 또는 이로 이루어진 3'-UTR 요소, 및/또는 서열번호 25 내지 30에 따른 서열로 이루어진 그룹으로부터 선택된 DNA 서열과 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%; 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함 또는 이로 이루어진 5'-UTR 요소를 포함하는 인공 DNA 분자를 제공한다.

더욱 바람직한 실시예에서 약학적으로 허용가능한 담체 내 실시예의 다수의 RNA 분자를 포함하는 조성물이 제공되며, 상기 조성물 내 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 RNA는 길이 차이가 없거나 10개 뉴클레오티드 길이가 다른 폴리(A) 서열을 포함한다. 더욱 바람직한 실시예에서 조성물 내 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 RNA는 동일한 길이의 폴리(A) 서열을 포함한다. 특정한 실시예에서, 상기 폴리(A) 서열은 RNA의 3' 말단에 위치하며, 상대적으로 폴리(A) 서열에서 3'에 위치하는 다른 뉴클레오티드는 없다. 다른 추가적 실시예에서, 약학적으로 허용 가능한 담체 내 실시예의 다수의 RNA 분자를 포함하는 조성물이 제공되며, 상기 다수의 RNA 분자는 캡핑(capped) 및 캡핑되지 않은 RNA를 모두 포함한다. 예를 들어, 일부 양태에서, 조성물은 다수의 RNA 분자를 포함하며, 95%, 90%, 80%, 70% 또는 60% 미만의 RNA는 캡을 포함하며 나머지 RNA 분자는 캡핑되지 않는다.

게다가, 본 발명은 오픈 리딩 프레임, 바람직하게 3'-UTR 요소 및/또는 5'-UTR 요소가 유도된 유전자와 상이한 유전자로부터 유도된 오픈 리딩 프레임; 서열번호 1 내지 24에 따른 서열로 이루어진 그룹으로부터 선택된 DNA 서열에 상응하는 RNA 서열에 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 99%; 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함 또는 이로 이루어진 3'-UTR 요소, 및/또는 서열번호 25 내지 30에 따른 서열로 이루어진 그룹으로부터 선택된 DNA 서열에 상응하는 RNA 서열에 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 99%; 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함 또는 이로 이루어진 5'-UTR 요소 및 폴리아데닐화 신호 및/또는 폴리(A) 서열을 포함하는 인공 RNA 분자, 바람직하게 인공 mRNA 분자 또는 인공 바이러스 RNA 분자를 제공한다.

본 발명은 부호화된 펩타이드 또는 단백질의 증가된 및/또는 연장된 발현을 특징으로 할 수 있는 핵산 분자, 바람직하게 인공 mRNA를 제공한다. 임의의 이론에 구속됨이 없이, 단백질 발현의 증진된 안정성 및 이에 따라 연장된 단백질 발현은 본 발명에 따른 인공 mRNA 분자와 같은 인공 핵산 분자의 분해에 감소로부터 유래할 수 있다. 따라서, 본 발명의 3'-UTR 요소 및/또는 본 발명의 5'-UTR 요소는 분해 및 붕괴(decay)로부터 인공 핵산 분자를 예방할 수 있다.

바람직하게, 상기 인공 핵산 분자는 추가적으로 히스톤 스템-루프를 포함할 수 있다. 따라서, 본 발명에 따른 인공 핵산 분자는 예를 들어 5'-에서 3'- 방향 ORF, 3'-UTR 요소, 선택적 히스톤 스템-루프 서열, 선택적 폴리(A) 서열 또는 폴리아데닐화 신호 및 선택적 폴리(C) 서열 또는 5'-에서 3'-방향 5'-UTR 요소, ORF, 선택적 히스톤 스템-루프 서열, 선택적 폴리(A) 서열 또는 폴리아데닐화 신호 및 선택적 폴리(C) 서열 또는 5'-에서 3'-방향 5'-UTR 요소, ORF, 3'-UTR 요소, 선택적 히스톤 스템-루프 서열, 선택적 폴리(A) 서열 또는 폴리아데닐화 신호 및 선택적 폴리(C) 서열을 포함할 수 있다. 이는 또한 5'-에서 3'-방향 ORF, 3'-UTR 요소, 선택적 폴리(A) 서열, 선택적 폴리(C) 서열 및 선택적 히스톤 스템-루프 서열, 또는 5'-에서 3'-방향 5'-UTR 요소, ORF, 선택적 폴리(A) 서열, 선택적 폴리(C) 서열 및 선택적 히스톤 스템-루프 서열, 또는 5'-에서 3'-방향 5'-UTR 요소, ORF, 3'-UTR 요소, 선택적 폴리(A) 서열, 선택적 폴리(C) 서열 및 선택적 히스톤 스템-루프 서열을 포함할 수 있다.

바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 적어도 하나의 히스톤 스템-루프 서열을 추가로 포함한다.

이러한 히스톤 스템-루프 서열은 바람직하게 이의 공개가 참고문헌으로 본 발명에 병합된 WO 2012/019780에 개시된 히스톤 스템-루프 서열로부터 선택된다.

본 발명에서 적절하게 사용될 수 있는 히스톤 스템-루프 서열은 바람직하게 하기 화학식 (I) 또는 (II)의 적어도 하나로부터 선택된다:

화학식 (I) (스템 경계(bordering) 요소가 없는 스템-루프 서열):

화학식 (II) (스템 경계 요소가 있는 스템-루프 서열):

상기:

스템1 또는 스템2 경계 요소 N_1-6은 1 내지 6개, 바람직하게 2 내지 6개, 더욱 바람직하게 2 내지 5개, 더욱 더 바람직하게 3 내지 5개, 가장 바람직하게 4 내지 5개 또는 5개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;

스템1[N_0-2GN_3-5]는 요소 스템2와 역 상보적 또는 부분적으로 역 상보적이며, 5 내지 7개 뉴클레오티드의 연속적인 서열임;

상기 N_0-2는 0 내지 2개, 바람직하게 0 내지 1개, 더욱 바람직하게 1개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;

상기 N_3-5는 3 내지 5개, 바람직하게 4 내지 5개, 더욱 바람직하게 4개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택되며, 및

상기 G는 구아노신 또는 이의 유사체이며, 스템2 내 이의 상보적인 뉴클레오티드 시티딘이 구아노신에 의해 교체되는 경우, 시티딘 또는 이의 유사체에 의해 선택적으로 교체될 수 있으며;

루프 서열 [N_0- ₄(U/T)N₀ _- ₄]는 요소 스템1 및 스템2 사이에 위치하며, 3 내지 5개 뉴클레오티드, 더욱 바람직하게 4개 뉴클레오티드의 연속적인 서열이며;

상기 각 N_0-4는 서로 독립적으로 0 내지 4개, 바람직하게 1 내지 3개, 더욱 바람직하게 1 내지 2개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택되며; 및

상기 U/T는 우리딘, 또는 선택적으로 티미딘을 나타냄;

스템2[N_3-5CN_0-2]는 요소 스템1과 역 상보적 또는 부분적으로 역 상보적이며, 5 내지 7개 뉴클레오티드의 연속적인 서열이며;

상기 N_3-5는 3 내지 5개, 바람직하게 4 내지 5개, 더욱 바람직하게 4개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;

상기 N_0-2는 0 내지 2개, 바람직하게 0 내지 1개, 더욱 바람직하게 1개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 또는 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨; 및

상기 C는 시티딘 또는 이의 유사체이며, 스템1 내 이의 상보성 뉴클레오시드 구아노신이 시티딘에 의해 교체되는 경우 선택적으로 구아노신 또는 이의 유사체에 의해 교체될 수 있음;

상기

스템1 및 스템2는 염기쌍이 예를 들어 뉴클레오티드 A 및 U/T 또는 G 및 C의 왓슨-크릭 염기쌍에 의해 또는 비-왓슨-크릭 염기쌍, 예를 들어 워블 염기쌍, 역 왓슨-크릭 염기쌍, 후그스틴 염기쌍, 역 후그스틴 염기쌍에 의해 스템1 및 스템2 사이에 발생할 수 있는, 서로 역 상보적 서열을 형성하는 염기쌍이 가능하며, 또는 하나의 스템 내 하나 또는 그 이상의 염기가 다른 스템의 역 상보적 서열 내 상보적 염기를 갖지 않음에 기초하여, 불완전 염기쌍이 스템1 및 스템2 사이에 발생할 수 있는, 부분적으로 역 상보적 서열을 서로 형성하는 염기쌍이 가능하다.

더욱 바람직한 실시예에 따르면, 히스톤 스템-루프 서열은 하기 특정한 화학식 (Ia) 또는 (IIa)의 적어도 하나에 따라 선택될 수 있다:

화학식(Ia) (스템 경계 요소가 없는 스템-루프 서열):

화학식(IIa) (스템 경계 요소가 있는 스템-루프 서열):

상기:

N, C, G, T 및 U는 상기 정의된 것과 같음.

일 양태의 더욱 더 특히 바람직한 실시예에 따르면, 인공 핵산 분자 서열은 하기 특정한 화학식 (Ib) 또는 (IIb)의 적어도 하나에 따른 적어도 하나의 히스톤 스템-루프 서열을 포함할 수 있다:

화학식 (Ib) (스템 경계 요소가 없는 스템-루프 서열):

화학식 (IIb) (스템 경계 요소가 있는 스템-루프 서열):

상기:

N, C, G, T 및 U는 상기 정의된 것과 같음.

특히 바람직한 히스톤 스템-루프 서열은 서열번호: 34: CAAAGGCTCTTTTCAGAGCCACCA에 따른 서열 또는 더욱 바람직하게 서열번호: 34에 따른 핵산 서열의 상응하는 RNA 서열이다.

예를 들어, 상기 단일 요소는 하기 순서의 인공 핵산 분자로 나타낼 수 있다:

5'-캡- 5'-UTR (요소) - ORF - 3'-UTR (요소) - 히스톤 스템-루프 - 폴리(A)/(C)　서열;

5'-캡 - 5'-UTR (요소) - ORF - 3'-UTR (요소) - 폴리(A)/(C)　서열 - 히스톤 스템-루프;

5'-캡 - 5'-UTR (요소) - ORF - IRES - ORF - 3'-UTR (요소) - 히스톤 스템-루프 - 폴리(A)/(C)　서열;

5'-캡 - 5'-UTR (요소) - ORF - IRES - ORF - 3'-UTR (요소) - 히스톤 스템-루프 - 폴리(A)/(C)　서열 - 폴리(A)/(C) 서열;

5'-캡 - 5'-UTR (요소) - ORF - IRES - ORF - 3'-UTR (요소) - 폴리(A)/(C)　서열 - 히스톤 스템-루프;

5'-캡 - 5'-UTR (요소) - ORF - IRES - ORF - 3'-UTR (요소) - 폴리(A)/(C)　서열 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;

5'-캡 - 5'-UTR (요소) - ORF - 3'-UTR (요소) - 폴리(A)/(C)　서열 - 폴리(A)/(C) 서열;

5'-캡 - 5'-UTR (요소) - ORF - 3'-UTR (요소) - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템 루프; 등.

일부 실시예에서, 인공 핵산 분자는 5'-캡, 폴리(C) 서열 및/또는 IRES-모티프와 같은 추가적인 요소를 포함한다. 5'-캡은 RNA의 5' 말단에 전사 동안 또는 후기-전사적으로(post-transcriptionally) 첨가될 수 있다. 게다가, 본 발명의 인공 핵산 분자는 특히 핵산이 mRNA의 형태이거나 또는 mRNA를 코딩할 경우, 적어도 10개 시티딘, 바람직하게 적어도 20개 시티딘, 더욱 바람직하게 적어도 30개 시티딘(소위 "폴리(C) 서열")의 서열에 의해 변형될 수 있다. 특히, 본 발명의 인공 핵산 분자는 특히 핵산이 (m)RNA의 형태이거나 mRNA를 코딩할 때, 전형적으로 약 10 내지 200개 시티딘 뉴클레오티드, 바람직하게 약 10 내지 100개 시티딘 뉴클레오티드, 더욱 바람직하게 약 10 내지 70개 시티딘 뉴클레오티드 또는 더욱 더 바람직하게 약 20 내지 50개 뉴클레오티드 또는 더욱 더 20 내지 30개 시티딘 뉴클레오티드의 폴리(C) 서열을 포함할 수 있다. 가장 바람직하게, 본 발명의 핵산은 30개 시티딘 잔기의 폴리(C) 서열을 포함한다. 따라서, 바람직하게 본 발명에 따른 인공 핵산 분자는 바람직하게 5'-에서 3' 방향, 상기 설명된 적어도 하나의 5'-UTR 요소, ORF, 상기 설명된 적어도 하나의 3'-UTR 요소, 폴리(A) 서열 또는 폴리아데닐화 신호, 및 폴리(C) 서열 또는, 5'-에서 3' 방향, 선택적으로 추가적 5'-UTR, ORF, 상기 설명된 적어도 하나의 3'-UTR 요소, 폴리(A) 서열 또는 폴리아데닐화 신호, 및 폴리(C) 서열, 또는, 5'-에서 3' 방향, 상기 설명된 적어도 하나의 5'-UTR 요소, ORF, 선택적으로 추가적 3'-UTR, 폴리(A) 서열 또는 폴리아데닐화 신호, 및 폴리(C) 서열을 포함한다.

내부 리보좀 유입 부위(IRES) 서열 또는 IRES-모티프는 예를 들어 만약 인공 핵산 분자가 둘 또는 그 이상의 펩타이드 또는 단백질을 코딩하는 경우, 몇몇 오픈 리딩 프레임을 분리할 수 있다. IRES-서열은 만약 상기 인공 핵산 분자가 바이-(bi-) 또는 멀티시스트로닉 핵산 분자일 경우에, 특히 유용할 수 있다.

게다가, 인공 핵산 분자는 추가적 5'-요소, 바람직하게 5'-UTR, 프로모터 또는 프로모터 포함 서열을 포함할 수 있다. 상기 프로모터는 본 발명에 따른 인공 핵산 분자, 예를 들어 본 발명에 따른 인공 DNA 분자의 전사를 일으키고 또는 조절할 수 있다.

바람직하게, 상기 본 발명에 따른 인공 핵산 분자, 바람직하게 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되었다. 따라서, 본 발명의 인공 핵산 분자는 분자의 G(구아노신)/C(시티딘) 함량을 변형함으로써 열역학적으로 안정화될 수 있다. 본 발명에 따른 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량은 바람직하게 유전자 코드의 축퇴(degeneration)를 사용하여, 상응하는 야생형 서열의 오픈 리딩 프레임의 G/C 함량에 비해 증가될 수 있다. 따라서, 인공 핵산 분자의 코딩된 아미노산 서열은 바람직하게 특정한 야생형 서열의 코딩된 아미노산 서열에 비해 G/C 변형에 의해 변형되지 않는다. 코딩 서열의 코돈 또는 전체 인공 핵산 분자, 예를 들어 mRNA는 따라서 야생형 코딩 서열에 비해 다양할 수 있으며, 그들은 증가된 함량의 G/C 뉴클레오티드를 포함하는 반면 번역된 아미노산 서열은 유지된다. 몇몇 코돈이 하나 및 동일한 아미노산(소위 유전자 코드위 축퇴)을 코드(code)하는 사실 때문에, 코딩된 펩타이드/단백질 서열을 변화시키지 않고(소위 대안적(alternative) 코돈 사용), 코돈을 변형하는 것이 가능하다. 따라서, RNA의 안전성에 관하여 및/또는 개체 내 코돈 사용(소위 코돈 최적화)에 관하여 보다 바람직한, 특정 코돈을 특이적으로 도입(동일한 아미노산을 코딩하는 각각의 야생형 코돈을 교환)하는 것이 가능하다.

본 발명에 정의된 본 발명의 인공 핵산 분자의 코딩 영역에 의해 코딩되는 아미노산에 의존하여, 이의 야생형 코딩 영역에 비해, 핵산 서열, 예를 들어 오픈 리딩 프레임의 변형의 다양한 가능성이 있다. 독점적으로 G 또는 C 뉴클레오티드를 포함하는 코돈에 의해 코딩된 아미노산의 경우에, 코돈의 변형이 없는 것이 필수적이다. 따라서 Pro (CCC 또는 CCG), Arg (CGC 또는 CGG), Ala (GCC 또는 GCG) 및 Gly (GGC 또는 GGG)에 대한 코돈은, A 또는 U/T가 존재하지 않으므로, 변형을 요구하지 않는다.

대조적으로 A 및/또는 U/T 뉴클레오티드를 포함하는 코돈은 동일한 아미노산을 코딩하지만 A 및/또는 U/T를 포함하지 않는 다른 코돈의 치환에 의해 변형될 수 있다. 예를 들어

Pro에 대한 코돈은 CC(U/T) 또는 CCA로부터 CCC 또는 CCG로 변형될 수 있으며;

Arg에 대한 코돈은 CG(U/T) 또는 CGA 또는 AGA 또는 AGG로부터 CGC 또는 CGG로 변형될 수 있으며;

Ala에 대한 코돈은 GC(U/T) 또는 GCA로부터 GCC 또는 GCG로 변형될 수 있으며;

Gly에 대한 코돈은 GG(U/T) 또는 GGA로부터 GGC 또는 GGG로 변형될 수 있다.

다른 경우에, 비록 A 또는 (U/T) 뉴클레오티드가 코돈으로부터 제거되지 않더라도, 그러나 A 및/또는 (U/T) 뉴클레오티드의 낮은 함량을 포함하는 코돈을 사용함으로써 A 및 (U/T) 함량을 감소시키는 것이 가능하다. 이들의 예시는 하기와 같다:

Phe에 대한 코돈은 (U/T)(U/T)(U/T)로부터 (U/T) (U/T)C로 변형될 수 있으며;

Leu에 대한 코돈은 (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) 또는 C(U/T)A로부터 C(U/T)C 또는 C(U/T)G로 변형될 수 있으며;

Ser에 대한 코돈은 (U/T)C(U/T) 또는 (U/T)CA 또는 AG(U/T)로부터 (U/T)CC, (U/T)CG 또는 AGC로 변형될 수 있으며;

Tyr에 대한 코돈은 (U/T)A(U/T)로부터 (U/T)AC로 변형될 수 있으며;

Cys에 대한 코돈은 (U/T)G(U/T)로부터 (U/T)GC로 변형될 수 있으며;

His에 대한 코돈은 CA(U/T)로부터 CAC로 변형될 수 있으며;

Gln에 대한 코돈은 CAA로부터 CAG로 변형될 수 있으며;

Ile에 대한 코돈은 A(U/T)(U/T) 또는 A(U/T)A로부터 A(U/T)C로 변형될 수 있으며;

Thr에 대한 코돈은 AC(U/T) 또는 ACA로부터 ACC 또는 ACG로 변형될 수 있으며;

Asn에 대한 코돈은 AA(U/T)로부터 AAC로 변형될 수 있으며;

Lys에 대한 코돈은 AAA로부터 AAG로 변형될 수 있으며;

Val에 대한 코돈은 G(U/T)(U/T) 또는 G(U/T)A로부터 G(U/T)C 또는 G(U/T)G로 변형될 수 있으며;

Asp에 대한 코돈은 GA(U/T)로부터 GAC로 변형될 수 있으며;

Glu에 대한 코돈은 GAA로부터 GAG로 변형될 수 있으며;

정지 코돈 (U/T)AA는 (U/T)AG 또는 (U/T)GA로 변형될 수 있다.

Met (A(U/T)G) 및 Trp ((U/T)GG)에 대한 코돈의 경우에는, 반면 코딩된 아미노산 서열이 바뀌지 않는다면 서열 변형의 가능성은 없다.

상기 개시된 치환들은 이의 특정한 야생형 오픈 리딩 프레임(즉 본래 서열)에 비해, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량을 증가시키기 위해 각각 또는 모두 가능한 조합으로 사용될 수 있다. 따라서 예를 들어 야생형 서열에 발생하는 Thr에 대한 모든 코돈은 ACC(또는 ACG)로 변형될 수 있다.

바람직하게, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량은 코딩된 아미노산 서열의 변화 없이, 즉 유전자 코드의 축퇴를 사용하여, 야생형 코딩 영역의 G/C 함량에 비해 적어도 7%, 더욱 바람직하게는 적어도 15%, 특히 바람직하게는 적어도 20% 증가된다. 특정한 실시예에 따르면 본 발명의 인공 핵산 분자 또는 절편, 변이체 또는 이의 유도체의 오픈 리딩 프레임 내 치환가능한 코돈의 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 더욱 바람직하게는 적어도 70%, 더욱 더 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90%, 95% 또는 100%는 치환되며, 그에 따라 상기 오픈 리딩 프레임의 G/C 함량이 증가한다.

이러한 맥락에서, 이는 코딩된 아미노산 서열의 변화 없이, 야생형 오픈 리딩 프레임에 비해, 최대한(즉 치환 가능한 코돈의 100%), 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량을 증가시키기 위해 특히 바람직하다.

나아가, 오픈 리딩 프레임은 바람직하게는 적어도 부분적으로 코돈-최적화되었다. 코돈-최적화는 번역 효율이 세포 내 트랜스퍼 RNAs(tRNAs)의 발생의 다른 빈도에 의해 결정될 수 있다는 발견에 기초한다. 따라서 만약 소위 “드문 코돈”이 본 발명에 정의된 본 발명의 인공 핵산 분자의 코딩 영역에 존재하는 경우에, 증가된 범위에, 상응하는 변형된 핵산 서열의 번역은 상대적으로 “빈번한” tRNAs를 코딩하는 코돈이 존재하는 경우에 비해 덜 효율적이다.

따라서, 본 발명의 인공 핵산 분자의 오픈 리딩 프레임은 바람직하게는 세포 내 상대적으로 드문, tRNA를 코딩하는 야생형 서열의 적어도 하나의 코돈과 같이 상응하는 야생형 코딩 영역에 비해 변형되며, 세포 내 상대적으로 빈번하며 상대적으로 드문 tRNA와 같은 동일한 아미노산을 수송하는 tRNA를 코딩하는 코돈에 대해 교환된다. 이러한 변형에 의해, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임은 변형되어, 빈번하게 발생하는 tRNAs가 가능한 코돈은 드문 tRNAs에 상응하는 코돈을 교체할 수 있다. 다시 말해서 본 발명에 따르면, 이러한 변형에 의해 드문 tRNA를 코딩하는 야생형 오픈 리딩 프레임의 모든 코돈은 세포 내 보다 빈번한 tRNA를 코딩하는 코돈으로 교환될 수 있으며 드문 tRNA로서 동일한 아미노산을 수송한다. 세포 내 상대적으로 빈번하게 발생하는 tRNAs 및 반대로 상대적으로 드물게 발생하는 것은 기술분야에서 통상의 기술자에게 알려져 있다; 예를 들어 Akashi, Curr. Opin. Genet. Dev. 2001, 11(6): 660-666 참조. 따라서 바람직하게는 오픈 리딩 프레임은 바람직하게는 본 발명에 따르는 인공 핵산 분자가 발현되는 시스템에 관하여, 바람직하게는 본 발명에 따르는 인공 핵산 분자가 번역되는 시스템에 관하여, 코돈 최적화된다. 바람직하게는 오픈 리딩 프레임의 코돈 사용은 포유동물 코돈 사용에 따라서, 더욱 바람직하게는 인간 코돈 사용에 따라서 코돈 최적화된다. 바람직하게는 오픈 리딩 프레임은 코돈-최적화되고 G/C 함량 변형된다.

추가적인 분해(degradation) 저항성, 예를 들어 엑소- 또는 엔도뉴클레아제에 의한 인비보(또는 상기 정의된 인비트로) 분해에 대한 저항성의 증가를 위해, 및/또는 본 발명에 따르는 인공 핵산 분자로부터 단백질 발현의 안정성을 보다 향상시키기 위해, 상기 인공 핵산 분자는 백본 변형, 당 변형 및/또는 염기 변형, 예를 들어 지질-변형 또는 그와 유사한 것과 같은 변형을 추가적으로 포함할 수 있다. 바람직하게는, 본 발명에 따르는 인공 핵산 분자의 전사 및 또는 번역은 상기 변형에 의해 현저하게 손상되지 않는다.

일반적으로, 본 발명의 인공 핵산 분자는 어느 천연(=자연적으로 발생) 뉴클레오티드, 예를 들어 구아노신, 우라실, 아데노신, 및/또는 시토신 또는 이의 유사체를 포함할 수 있다. 이와 관련하여, 뉴클레오티드 유사체는 자연적으로 발생한 뉴클레오티드 아데노신, 시토신, 티미딘, 구아노신 및 우리딘의 천연적 및 비-천연적으로 발생한 변이체로 정의된다. 따라서, 유사체는 예를 들어 바람직하게 자연적으로 발생한 뉴클레오티드로부터 첨가 또는 삭제된 또는 뉴클레오티드의 자연적으로 발생한 기능기를 치환하는, 비-자연적으로 발생한 기능기를 갖는 화학적으로 유도된 뉴클레오티드이다. 따라서, 자연적으로 발생하는 뉴클레오티드의 각 구성요소는 변형된, 즉 염기 구성요소, 당(리보스) 구성요소 및/또는 RNA 서열의 백본(상기 참조)을 형성하는 포스페이트 구성요소일 수 있다. 구아노신, 우리딘, 아데노신, 티미딘 및 시토신의 유사체는 예를 들어 1-메틸-아데노신, 1-메틸-구아노신, 1-메틸-이노신, 2,2-디메틸-구아노신, 2,6-디아미노퓨린, 2'-아미노-2'-디옥시아데노신, 2'-아미노-2'-디옥시시티딘, 2'-아미노-2'-디옥시구아노신, 2'-아미노-2'-디옥시우리딘, 2-아미노-6-클로로퓨린리보사이드, 2-아미노퓨린-리보사이드, 2'-아라아데노신, 2'-아라시티딘, 2'-아라우리딘, 2'-아지도-2'-디옥시아데노신, 2'-아지도-2'-디옥시시티딘, 2'-아지도-2'-디옥시구아노신, 2'-아지도-2'-디옥시우리딘, 2-클로로아데노신, 2'-플루오로-2'-디옥시아데노신, 2'-플루오로-2'-디옥시시티딘, 2'-플루오로-2'-디옥시구아노신, 2'-플루오로-2'-디옥시우리딘, 2'-플루오로티미딘, 2-메틸-아데노신, 2-메틸-구아노신, 2-메틸-티오-N6-이소페네닐-아데노신, 2'-O-메틸-2-아미노아데노신, 2'-O-메틸-2'-디옥시아데노신, 2'-O-메틸-2'-디옥시시티딘, 2'-O-메틸-2'-디옥시구아노신, 2'-O-메틸-2'-디옥시우리딘, 2'-O-메틸-5-메틸우리딘, 2'-O-메틸이노신, 2'-O-메틸슈도우리딘, 2-티오시티딘, 2-티오-시토신, 3-메틸-시토신, 4-아세틸-시토신, 4-티오우리딘, 5-(카르복시하이드록시메틸)-우라실, 5,6-디하이드로우리딘, 5-아미노알릴시티딘, 5-아미노알릴-디옥시-우리딘, 5-브로모우리딘, 5-카르복시메틸아미노메틸-2-티오-우라실, 5-카르복시메틸아모노메틸-우라실, 5-클로로-아라-시토신, 5-플루오로-우리딘, 5-아이오도우리딘, 5-메톡시카르보닐메틸-우리딘, 5-메톡시-우리딘, 5-메틸-2-티오-우리딘, 6-아자시티딘, 6-아자우리딘, 6-클로로-7-디아자-구아노신, 6-클로로퓨린리보사이드, 6-메르캅토-구아노신, 6-메틸-메르캅토퓨린-리보사이드, 7-디아자-2'-디옥시-구아노신, 7-디아자아데노신, 7-메틸-구아노신, 8-아자아데노신, 8-브로모-아데노신, 8-브로모-구아노신, 8-메르캅토-구아노신, 8-옥소구아노신, 벤지미다졸-리보사이드, 베타-D-만노실-큐오신(queosine), 디하이드로-우라실, 이노신, N1-메틸아데노신, N6-([6-아미노헥실]카르바모일메틸)-아데노신, N6-이소펜테닐-아데노신, N6-메틸-아데노신, N7-메틸-잔토신, N-우라실-5-옥시아세트산 메틸 에스터, 퓨로마이신, 큐오신, 우라실-5-옥시아세트산, 우라실-5-옥시아세트산 메틸 에스터, 위보톡소신(Wybutoxosine), 잔토신, 및 자일로-아데노신을 포함하는 화학적으로 변형된, 예를 들어 아세틸화, 메틸화, 하이드록실화 등에 의해, 어느 자연적 발생 또는 비-자연적 발생한 구아노신, 우리딘, 아데노신, 티미딘 또는 시토신을 포함하나, 이에 제한되지 않는다. 이러한 유사체의 제조는 예를 들어 US 특허 4,373,071, US 4,401,796, US 4,415,732, US 4,458,066, US 4,500,707, US 4,668,777, US 4,973,679, US 5,047,524, US 5,132,418, US 5,153,319, US 5,262,530 및 5,700,642로부터, 통상의 기술자에게 알려져 있다. 상기 설명된 유사체의 경우, 특히 바람직한 것은 코딩된 펩타이드 또는 단백질의 단백질의 발현을 증가시키는, 또는 본 발명의 인공 핵산 분자의 면역원성을 증가시키며 및/또는 도입된 인공 핵산 분자의 추가적 변형을 방해하지 않는, 이들 유사체에 대하여 본 발명의 특정한 실시예에 따라 주어질 수 있다.

특정한 실시예에 따르면, 본 발명의 인공 핵산 분자는 지질 변형을 포함할 수 있다.

바람직한 실시예에서, 인공 핵산 분자는 바람직하게 5'에서 3' 방향으로 하기 요소를 포함한다:

상기 인공 핵산 분자로부터, 바람직하게 서열번호 25 내지 30 및 서열번호 319 내지 382의 어느 것에 따른 핵산 서열로부터 단백질 생산을 연장 및/또는 증가시키는 5'-UTR 요소, 더욱 바람직하게 MP68 또는 NDUFA4의 5'-UTR; 또는 추가적 5'-UTR, 바람직하게 5'-TOP UTR;

적어도 하나의 오픈 리딩 프레임(ORF), 상기 ORF는 바람직하게 야생형 서열에 대해 적어도 하나의 변형을 포함;

상기 인공 핵산 분자로부터, 바람직하게 서열번호: 1 내지 24 및 서열번호: 49 내지 318의 어느 것에 따른 핵산 서열로부터 단백질 생산을 연장 및/또는 증가시키는 3'-UTR 요소, 더욱 바람직하게 GNAS, MORN2, GSTM1, NDUFA1, CBR2, YBX1, NDUFB8 또는 CNTN1의 3'-UTR의; 또는 추가적 3'-UTR, 바람직하게 알부민7 3'-UTR;

바람직하게 64개 아데닐레이트를 포함하는 폴리(A) 서열;

바람직하게 30개 시티딜레이트를 포함하는 폴리(C) 서열;

히스톤 스템-루프 서열.

다른 바람직한 실시예에서, 상기 인공 핵산 분자는 서열번호: 36 내지 40, 서열번호: 42 및 43, 서열번호 45 내지 48, 및 서열번호: 384 내지 388에 따른 핵산 서열(도 2 내지 6, 도 8, 9, 11, 도 19 내지 21 및 도 26 내지 30 참조) 또는 상보적 DNA 서열로 이루어진 그룹으로부터 선택된 뉴클레오티드 서열을 포함 또는 이로 이루어진다.

특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 추가적으로 하기 설명된 하나 이상의 변형을 포함할 수 있다:

화학적 변형:

인공 핵산 분자에 관하여 본 발명에 사용된 용어 "변형"은 백본 변형뿐만 아니라 당 변형 또는 염기 변형을 포함하는 화학적 변형을 의미할 수 있다.

이러한 맥락에서, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자는 뉴클레오티드 유사체/변형, 예를 들어 백본 변형, 당 변형 또는 염기 변형을 포함할 수 있다. 본 발명에 관련하여 백본 변형은 본 발명에 정의된 핵산 분자 내 포함된 뉴클레오티드의 백본의 포스페이트가 화학적으로 변형된, 변형이다. 본 발명에 관하여 당 변형은 본 발명에 정의된 핵산 분자의 뉴클레오티드의 당의 화학적 변형이다. 게다가, 본 발명에 관하여 염기 변형은 핵산 분자의 핵산 분자의 뉴클레오티드의 염기 일부의 화학적 변형이다. 이러한 맥락에서, 뉴클레오티드 유사체 또는 변형은 바람직하게 전사 및/또는 번역을 위해 적용 가능한 뉴클레오티드 유사체로부터 선택된다.

당 변형:

본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA에 병합될 수 있는 변형된 뉴클레오시드 및 뉴클레오티드는 당 일부에 변형될 수 있다. 예를 들어, RNA 분자의 2'하이드록실기(OH)는 다른 많은 "옥시" 또는 "디옥시" 치환기로 변형되거나 교체될 수 있다. "옥시"-2' 하이드록실기 변형의 예시는 알콕시 또는 알릴옥시(-OR, 예를 들어, R = H, 알킬, 사이클로알킬, 아릴, 아랄킬, 헤테로아릴 또는 당); 폴리에틸렌글리콜(PEG), -0(CH2CH2o)nCH2CH2OR; 2'하이드록실이 연결된 "잠긴(locked)" 핵산(LNA), 예를 들어 동일한 리보스 당의 4' 탄소에 메틸렌 브릿지에 의한 것; 및 아미노기(-O-아미노, 상기 아미노기, 예를 들어 NRR은 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴 아미노, 에틸렌 디아민, 폴리아미노일 수 있음) 또는 아미노알콕시를 포함하나, 이에 제한되지 않는다.

"디옥시" 변형은 수소, 아미노(예를 들어 NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴 아미노, 디헤테로아릴 아미노, 또는 아미노산)를 포함; 또는 아미노기는 링커를 통해 당에 결합될 수 있으며, 상기 링커는 하나 또는 그 이상의 원자 C, N, 및 O를 포함한다.

상기 당 그룹은 또한 리보스 내 상응하는 탄소에 비해 반대의 입체 화학적 배치를 갖는 하나 또는 그 이상의 탄소를 포함한다. 따라서, 변형된 핵산 분자는 예를 들어 당과 같은 아라비노스를 포함하는 뉴클레오티드를 포함할 수 있다.

백본 변형:

포스페이트 백본은 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA로 병합될 수 있는, 변형된 뉴클레오시드 및 뉴클레오티드에서 더욱 변형될 수 있다. 백본의 포스페이트 기는 다른 치환기와 함께 산소 원자의 하나 또는 그 이상의 교체에 의해 변형될 수 있다. 게다가, 변형된 뉴클레오시드 및 뉴클레오티드는 본 발명에 설명된 변형된 포스페이트와 함께 비변형된 포스페이트 일부의 완전한 교체를 포함할 수 있다. 변형된 포스페이트 기의 예시는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스터, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스터를 포함하나, 이에 제한되지 않는다. 포스포로디티오에이트는 황에 의해 교체된 양쪽 비-연결 산소를 갖는다. 포스페이트 링커는 또한 질소(가교된(bridged) 포스포로아미데이트), 황(가교된 포스포로티오에이트) 및 탄소(가교된 메틸렌포스포네이트)와 함께 연결 산소의 치환에 의해 변형될 수 있다.

염기 변형:

본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자로 병합될 수 있는, 변형된 뉴클레오시드 및 뉴클레오티드는 핵염기 일부에 추가로 변형될 수 있다. RNA에서 발견된 핵염기의 예시는 아데닌, 구아닌, 시토신 및 우라실을 포함하나, 이에 제한되지 않는다. 예를 들어, 본 발명에 정의된 뉴클레오시드 및 뉴클레오티드는 메이저 그루브(major groove) 페이스에 화학적으로 변형될 수 있다. 일부 실시예에서, 메이저 그루브 화학적 변형은 아미노기, 티올기, 알킬기, 또는 할로기를 포함할 수 있다.

본 발명의 특히 바람직한 실시예에서, 뉴클레오티드 유사체/변형은 2-아미노-6-클로로퓨린리보사이드-5'-트리포스페이트, 2-아미노퓨린-리보사이드-5'-트리포스페이트; 2-아미노아데노신-5'-트리포스페이트, 2'-아미노-2'-디옥시시티딘-트리포스페이트, 2-티오시티딘-5'-트리포스페이트, 2-티오우리딘-5'-트리포스페이트, 2'-플루오로티미딘-5'-트리포스페이트, 2'-O-메틸 이노신-5'-트리포스페이트 4-티오우리딘-5'-트리포스페이트, 5-아미노알릴 시티딘-5'-트리포스페이트, 5-아미노알릴우리딘-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 5-브로모우리딘-5'-트리포스페이트, 5-브로모-2'-디옥시시티딘-5'-트리포스페이트, 5-브로모-2'-디옥시우리딘-5'-트리포스페이트, 5-아이오도시티딘-5'-트리포스페이트, 5-아이오도-2'-디옥시시티딘-5'-트리포스페이트, 5-아이오도우리딘-5'-트리포스페이트, 5-아이오도-2'-디옥시우리딘-5'-트리포스페이트, 5-메틸시티딘-5'-트리포스페이트, 5-메틸우리딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시시티딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시우리딘-5'-트리포스페이트, 6-아자시티딘-5'-트리포스페이트, 6-아자우리딘-5'-트리포스페이트, 6-클로로퓨린리보사이드-5'-트리포스페이트, 7-디아자아데노신-5'-트리포스페이트, 7-디아자구아노신-5'-트리포스페이트, 8-아자아데노신-5'-트리포스페이트, 8-아지도아데노신-5'-트리포스페이트, 벤지미다졸-리보사이드-5'-트리포스페이트, N1-메틸아데노신-5'-트리포스페이트, N1-메틸구아노신-5'-트리포스페이트, N6-메틸아데노신-5'-트리포스페이트, O6-메틸 구아노신-5'-트리포스페이트, 슈도우리딘-5'-트리포스페이트, 또는 퓨로마이신-5'-트리포스페이트, 잔토신-5'-트리포스페이트로부터 바람직하게 선택된 염기 변형으로부터 선택된다. 특히 바람직한 것은 5-메틸시티딘-5'-트리포스페이트, 7-디아자구아노신-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 및 슈도우리딘-5'-트리포스페이트로 구성된 염기 변형된 뉴클레오티드의 그룹으로부터 선택된 염기 변형에 대하여 뉴클레오티드로 주어졌다.

일부 실시예에서, 변형된 뉴클레오시드는 피리딘-4-온 리보뉴클레오시드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카르복시메틸-우리딘, 1-카르복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-디아자-슈도우리딘, 2-티오-1-메틸-1-디아자-슈도우리딘, 디하이드로우리딘, 디하이드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 및 4-메톡시-2-티오-슈도우리딘을 포함한다.

일부 실시예에서, 변형된 뉴클레오시드는 5-아자-시티딘, 슈도이소시티딘, 3-메틸-시티딘, N4-아세틸시티딘, 5-포밀시티딘, N4-메틸시티딘, 5-하이드록시메틸시티딘, 1-메틸-슈도이소시티딘, 피롤로-시티딘, 피롤로-슈도이소시티딘, 2-티오-시티딘, 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-디아자-슈도이소시티딘, 1-메틸-1-디아자-슈도이소시티딘, 제부라린(zebularine), 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 및 4-메톡시-l-메틸-슈도이소시티딘을 포함한다.

다른 실시예에서, 변형된 뉴클레오시드는 2-아미노퓨린, 2, 6-디아미노퓨린, 7-디아자-아데닌, 7-디아자-8-아자-아데닌, 7-디아자-2-아미노퓨린, 7-디아자-8-아자-2-아미노퓨린, 7-디아자-2,6-di아미노퓨린, 7-디아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜틸아데노신, N6-(시스-하이드록시이소펜틸)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐) 아데노신, N6-글리시닐카르바모일아데노신, N6-트레오닐카르바모일아데노신, 2-메틸티오-N6-트레오닐 카르바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌을 포함한다.

다른 실시예에서, 변형된 뉴클레오시드는 이노신, 1-메틸-이노신, 위오신, 위부토신, 7-디아자-구아노신, 7-디아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-디아자-구아노신, 6-티오-7-디아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, l-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신을 포함한다.

일부 실시예에서, 뉴클레오티드는 메이저 그루브 페이스에 변형될 수 있으며 메틸기 또는 할로기로 우라실의 C-5에 수소의 교체를 포함할 수 있다.

특정한 실시예에서, 변형된 뉴클레오시드는 5'-0-(1-티오포스페이트)-아데노신, 5'-0-(1-티오포스페이트)-시티딘, 5'-0-(1-티오포스페이트)-구아노신, 5'-0-(1-티오포스페이트)-우리딘 또는 5'-0-(1-티오포스페이트)-슈도우리딘이다.

보다 특정한 실시예에서 인공 핵산 분자, 바람직하게 RNA 분자는 6-아자-시티딘, 2-티오-시티딘, 알파-티오-시티딘, 슈도-이소-시티딘, 5-아미노알릴-우리딘, 5-아이오도-우리딘, N1-메틸-슈도우리딘, 5,6-디하이드로우리딘, 알파-티오-우리딘, 4-티오-우리딘, 6-아자-우리딘, 5-하이드록시-우리딘, 디옥시-티미딘, 5-메틸-우리딘, 피롤로-시티딘, 이노신, 알파-티오-구아노신, 6-메틸-구아노신, 5-메틸-시티딘, 8-옥소-구아노신, 7-디아자-구아노신, N1-메틸-아데노신, 2-아미노-6-클로로-퓨린, N6-메틸-2-아미노-퓨린, 슈도-이소-시티딘, 6-클로로-퓨린, N6-메틸-아데노신, 알파-티오-아데노신, 8-아지도-아데노신, 7-디아자-아데노신으로부터 선택된 뉴클레오시드 변형을 포함할 수 있다.

지질 변형:

추가적 실시예에 따르면, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA는 지질 변형을 포함할 수 있다. 이러한 지질 변형된 RNA는 전형적으로 본 발명에 정의된 RNA를 포함한다. 본 발명에 정의된 이러한 지질 변형된 RNA 분자는 전형적으로 RNA 분자와 공유 결합된 적어도 하나의 링커, 및 각각의 링커와 공유 결합된 적어도 하나의 지질을 추가로 포함한다. 그렇지 않으면, 상기 지질 변형된 RNA 분자는 본 발명에 정의된 적어도 하나의 RNA 분자 및 RNA 분자와 공유 결합된(링커 없이) 적어도 하나의 (이기능성(bifunctional)) 지질을 포함한다. 세번째 대안에 따르면, 지질 변형된 RNA 분자는 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자, 상기 RNA 분자와 공유 결합된 적어도 하나의 링커, 및 각각의 링커에 공유 결합된 적어도 하나의 지질, 및 또한 RNA 분자와 공유 결합된(링커 없이) 적어도 하나의 (이기능성) 지질을 포함한다. 이러한 맥락에서, 상기 지질 변형은 선형 RNA 서열의 말단에 존재하는 것이 특히 바람직하다.

변형된 RNA의 5'-말단의 변형:

본 발명의 다른 바람직한 실시예에 따르면, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자는 소위 "5' 캡(CAP)" 구조의 추가에 의해 변형될 수 있다.

5'-캡은 독립체, 전형적으로 변형된 뉴클레오티드 독립체이며, 일반적으로 성숙 mRNA의 5'-말단 "캡"이다. 5'-캡은 전형적으로 변형된 뉴클레오티드에 의해, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게, 5'-캡은 5'-5'-트리포스페이트 연결을 통해 5'-말단에 연결된다. 5'-캡은 메틸화, 예를 들어 m7GpppN될 수 있으며, 상기 N은 5'-캡을 수송하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 RNA의 5'-말단이다. m7GpppN은 폴리머라제 II에 의해 전사된 mRNA에서 자연적으로 발생하는 5'-캡 구조이며, 따라서 본 발명에 따른 변형된 RNA에 포함된 변형으로 고려되지 않는다. 이는 본 발명에 따른 인공 핵산 분자, 바람직하게 RNA 분자가 5'-캡으로 m7GpppN을 포함할 수 있음을 의미하지만, 추가적으로 상기 인공 핵산 분자, 바람직하게 RNA 분자는 본 발명에 정의된 적어도 하나의 추가적 변형을 포함한다.

5' 캡 구조의 추가적인 예시는 글리세릴, 인버티드(inverted) 디옥시 무염기(abasic) 잔기(일부), 4',5' 메틸렌 뉴클레오티드, 1-(베타-D-에리쓰로퓨라노실) 뉴클레오티드, 4'-티오 뉴클레오티드, 카르복실릭 뉴클레오티드, 1,5-무수헥시톨(anhydrohexitol) 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형된 염기 뉴클레오티드, 트레오-펜토퓨라노실 뉴클레오티드, 아실릭 3',4'-세코 뉴클레오티드, 아실릭 3,4-디하이드록시부틸 뉴클레오티드, 아실릭 3,5 디하이드록시펜틸 뉴클레오티드, 3'-3'-인버티드 뉴클레오티드 일부, 3'-3'-인버티드 무염기 일부, 3'-2'-인버티드 뉴클레오티드 일부, 3'-2'-인버티드 무염기 일부, 1,4-부탄디올 포스페이트, 3'-포스포아미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'포스포로 티오에이트, 포스포로디티오에이트, 또는 가교 또는 비가교 메틸렌포스포네이트 일부를 포함한다. 이들 변형된 5'-CAP 구조는 본 발명에 따른 인공 핵산 분자, 바람직하게 RNA 분자 내 포함된 적어도 하나의 변형으로 여겨진다.

특히 바람직한 변형된 5'-CAP 구조는 CAP1 (m7G의 인접 뉴클레오티드의 리보스의 메틸화), CAP2 (m7G의 2^nd 뉴클레오티드 다운스트림의 리보스의 메틸화), CAP3 (m7G의 3^rd 뉴클레오티드의 리보스의 메틸화), CAP4(m7G의 4^th 뉴클레오티드 다운스트림의 리보스의 메틸화), ARCA (안티-리버스 CAP 유사체, 변형된 ARCA(예를 들어 포스포티오에이트 변형된 ARCA), 이노신, N1-메틸-구아노신, 2'-플루오로-구아노신, 7-디아자-구아노신, 8-옥소-구아노신, 2-아미노-구아노신, LNA-구아노신, 및 2-아지도-구아노신이다.

바람직한 실시예에서, 적어도 하나의 오픈 리딩 프레임은 치료 단백질 또는 펩타이드를 코딩한다. 다른 실시예에서, 항원은 병원성 항원, 종양 항원, 알러지성 항원 또는 자가면역 항원과 같은, 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다. 이하, 항원을 코딩하는 인공 핵산 분자의 투여는 상기 항원을 포함하는 질병에 대한 유전적 백신접종 접근방법에 사용된다.

대안적 실시예에서, 항체 또는 항원 특이적 T 세포 수용체 또는 이의 절편은 본 발명에 따른 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다.

항원:

병원성 항원:

본 발명에 따른 인공 핵산 분자는 병원성 항원 또는 절편, 이의 변이체 또는 유도체를 포함하는 단백질 또는 펩타이드를 코딩한다. 이러한 병원성 항원은 개체, 특히 포유동물 개체, 보다 특히 인간 내 면역학적 반응을 일으키는 병원성 유기체, 특히 박테리아, 바이러스 또는 원생동물(다세포) 병원성 유기체로부터 유도된다. 보다 구체적으로, 병원성 항원은 바람직하게 바이러스 또는 박테리아 또는 원생동물 유기체의 표면에 위치한 표면 항원, 예를 들어 단백질(또는 단백질의 절편, 예를 들어 표면 항원의 외부 일부)이다.

병원성 항원은 바람직하게 감염성 질병과 관련된 병원체로부터 유도된 펩타이드 또는 단백질 항원이며, 바람직하게 병원체 아시네토박터 바우마니(Acinetobacter baumannii), 아나플라즈마 속(Anaplasma genus), 아나플라즈마 파고사이토필리움(Anaplasma phagocytophilum), 브라질구충(Ancylostoma braziliense), 십이지장충(Ancylostoma duodenale), 용혈성 아카노박테리아균(Arcanobacterium haemolyticum), 회충(Ascaris lumbricoides), 아스페르길루스 속(Aspergillus genus), 아스트로비리다에(Astroviridae), 바베시아 속(Babesia genus), 탄저균(Bacillus anthracis), 바실러스 세레우스(Bacillus cereus), 바르토넬라 헨셀라에(Bartonella henselae), BK 바이러스, 블라스토시스티스 호미니스(Blastocystis hominis), 블라스토미세스 더마티티디스(Blastomyces dermatitidis), 백일해균(Bordetella pertussis), 보렐리아 부르그도르페리(Borrelia burgdorferi), 보렐리아 속(Borrelia genus), 보렐리아 종(Borrelia spp), 브루셀라 속(Brucella genus), 말레이사상충(Brugia malayi), 부니아바이러스 과(Bunyaviridae family), 부르크홀데리아 세파시아(Burkholderia cepacia) 및 다른 부르크홀데리아 종, 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이, 칼리시비리다에 과(Caliciviridae family), 캄필로박터 속(Campylobacter genus), 칸디다 알비칸스(Candida albicans), 칸디다 종(Candida spp), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미도필라 뉴모니아(Chlamydophila pneumoniae), 클라미도필라 프시타시(Chlamydophila psittaci), CJD 프리온, 간흡충(Clonorchis sinensis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실리(Clostridium difficile), 클로스트리듐 페르프린젠스(Clostridium perfringens), 클로스트리듐 페르프린젠스, 클로스트리듐 종(Clostridium spp), 클로스트리듐 테타니(Clostridium tetani), 콕시디오이데스 종(Coccidioides spp), 코로나바이러스(coronaviruses), 디프테리아균(Corynebacterium diphtheria), 콕시엘라 부르네티(Coxiella burnetii), 크리민 콩고 출혈열 바이러스(Crimean-Congo hemorrhagic fever virus), 크립토콕쿠스 네오포르만스(Cryptococcus neoformans), 크립토스포리디움 속(Cryptosporidium genus), 사이토메갈로바이러스(Cytomegalovirus, CMV), 뎅기 바이러스(Dengue viruses) (DEN-1, DEN-2, DEN-3 및 DEN-4), 이핵아메바(Dientamoeba fragilis), 에볼라바이러스(Ebolavirus, EBOV), 에키노코쿠스 종(Echinococcus genus), 에를리히아 샤펜시스(Ehrlichia chaffeensis), 엘리키아 에윈기(Ehrlichia ewingii), 엘리키아 속(Ehrlichia genus), 이질 아메바(Entamoeba histolytica), 장구균 속(Enterococcus genus), 장내 바이러스 속(Enterovirus genus), 장내 바이러스(Enteroviruses), 주로 콕사키 A 바이러스(Coxsackie A virus) 및 장내 바이러스 71 (EV71), 표피사상균 종(Epidermophyton spp), 엡스테인-바 바이러스(Epstein-Barr Virus, EBV), 대장균(Escherichia coli) O157:H7, O111 및 O104:H4, 간질(Fasciola hepatica) 및 거대 간질(Fasciola gigantica), FFI 프리온, 필라리오이데아 상과(Filarioidea superfamily), 플라비바이러스(Flaviviruses), 야토병균(Francisella tularensis), 푸소박테리움 속(Fusobacterium genus), 게오트리쿰 칸디둠(Geotrichum candidum), 지알디아편모충(Giardia intestinalis), 악구충속 종(Gnathostoma spp), GSS 프리온, 구아나리토 바이러스(Guanarito virus), 헤모필루스 듀크레이(Haemophilus ducreyi), 헤모필루스 인플루엔자(Haemophilus influenza), 헬리코박터 파일로리(Helicobacter pylori), 헤니파바이러스(Henipavirus) (Hendra virus Nipah virus), 간염 A 바이러스, 간염 B 바이러스(HBV), 간염 C 바이러스(HCV), 간염 D 바이러스, 간염 E 바이러스, 단순포진 바이러스 1 및 2 (HSV-1 및 HSV-2), 히스토플라스마 캡슐라툼(Histoplasma capsulatum), HIV (인간 면역결핍 바이러스, Human immunodeficiency virus), 호르테아 웨넥키(Hortaea werneckii), 인간 보카바이러스(Human bocavirus) (HBoV), 인간 헤르페스 바이러스 6(Human herpesvirus 6, HHV-6) 및 인간 헤르페스 바이러스 7 (HHV-7), 인간 메타뉴모바이러스(Human metapneumovirus, hMPV), 인간 파필로마바이러스(Human papillomavirus, HPV), 인간 파라인플루엔자 바이러스(Human parainfluenza viruses, HPIV), 일본 뇌염 바이러스(Japanese encephalitis virus), JC 바이러스, 주닌(Junin) 바이러스, 킨젤라 킨가에(Kingella kingae), 클레브시엘라 글라눌로마티스(Klebsiella granulomatis), 쿠루 프리온(Kuru prion), 라싸 바이러스(Lassa virus), 레지오넬라 뉴모필라(Legionella pneumophila), 레슈마니아 속(Leishmania genus), 렙토스피라 속(Leptospira genus), 리스테리아 모노사이토게네스(Listeria monocytogenes), 림프구성 맥락수막염바이러스(Lymphocytic choriomeningitis virus) (LCMV), 마츄포 바이러스(Machupo virus), 말라세지아 종(Malassezia spp), 마르부르그 바이러스(Marburg virus), 홍역 바이러스(Measles virus), 메타고니무스 요카가와이(Metagonimus yokagawai), 마이크로스포리디아 필룸(Microsporidia phylum), 전염성 연속종 바이러스(Molluscum contagiosum virus) (MCV), 귀밑샘염 바이러스(Mumps virus), 나균(Mycobacterium leprae) 및 마이코박테리아 레프로마토시스(Mycobacterium lepromatosis), 마이코박테리움 투베쿨로시스(Mycobacterium tuberculosis), 마이코박테리움 우르세란스(Mycobacterium ulcerans), 마이코플라즈마 폐렴(Mycoplasma pneumoniae), 파울러 자유아메바(Naegleria fowleri), 아메리카 구충(Necator americanus), 임균(Neisseria gonorrhoeae), 수막염균(Neisseria meningitides), 노카디아 아스테로이드(Nocardia asteroids), 노카디아 종(Nocardia spp), 온코세르카 볼부루스(Onchocerca volvulus), 오리엔티아 쯔쯔가무시(Orientia tsutsugamushi), 오르토믹소 바이러스과(Orthomyxoviridae family, 인플루엔자), 브라질 파라콕시디오이디즈(Paracoccidioides brasiliensis), 폐흡충 종(Paragonimus spp), 폐디스토마(Paragonimus westermani), 파보바이러스(Parvovirus) B19, 파스퇴렐라 속(Pasteurella genus), 플라스모디움 속(Plasmodium genus), 폐포자충(Pneumocystis jirovecii), 폴리오바이러스(Poliovirus), 라비 바이러스(Rabies virus), 호흡기 합포체 바이러스(Respiratory syncytial virus, RSV), 리노바이러스(Rhinovirus), 리노바이러스, 리케치아 아카리(Rickettsia akari), 리케치아 속(Rickettsia genus), 발진티푸스 리케치아(Rickettsia prowazekii), 로키산 홍반열 리케치아(Rickettsia rickettsia), 발진열 리케치아(Rickettsia typhi), 리프트벨리열 바이러스(Rift Valley fever virus), 로타바이러스(Rotavirus), 풍진 바이러스(Rubella virus), 사비아 바이러스(Sabia virus), 살모넬라 속(Salmonella genus), 천공 개선충(Sarcoptes scabiei), SARS 코로나바이러스, 주혈흡충 속(Schistosoma genus), 시겔라 속(Shigella genus), 신 놈브레 바이러스(Sin Nombre virus), 한타바이러스(Hantavirus), 스포로트릭스 셴키(Sporothrix schenckii), 스타필로코커스 속(Staphylococcus genus), 스타필로코커스 속, 스트렙토코커스 아갈락티아(Streptococcus agalactiae), 폐렴연쇄구균(Streptococcus pneumoniae), 화농성연쇄구균(Streptococcus pyogenes), 분선충(Strongyloides stercoralis), 테니아 속(Taenia genus), 유구조충(Taenia solium), 진드기매개뇌염(Tick-borne encephalitis virus, TBEV), 견회충(Toxocara canis) 또는 고양이 회충(Toxocara cati), 톡소플라즈마 곤디(Toxoplasma gondii), 트레포네마 팔리둠(Treponema pallidum), 선모충(Trichinella spiralis), 질트리코모나스(Trichomonas vaginalis), 백선균 종(Trichophyton spp), 편충(Trichuris trichiura), 트리파노소마 브루세이(Trypanosoma brucei), 트리파노소마 크루지(Trypanosoma cruzi), 우레아플라즈마 우레알리티쿰(Ureaplasma urealyticum), 수두 대상 포진 바이러스(Varicella zoster virus) (VZV), 수두 대상 포진 바이러스 (VZV), 천연두 메이저(Variola major) 또는 천연두 마이너(Variola minor), vCJD 프리온, 베네스 웰라형 마뇌염 바이러스(Venezuelan equine encephalitis virus), 비브리오 콜레라(Vibrio cholera), 웨스트 나일 바이러스(West Nile virus), 서부형 마뇌염 바이러스(Western equine encephalitis virus), 반크로프트 사상충(Wuchereria bancrofti), 황열병 바이러스(Yellow fever virus), 여시니아 엔테로콜리티카(Yersinia enterocolitica), 여시니아 페스티스(Yersinia pestis), 및 여시니아 슈도투베르쿨로시스(Yersinia pseudotuberculosis)로부터 유도된 항원으로부터 선택된다.

이러한 맥락에서, 인플루엔자 바이러스, 호흡기 합포체 바이러스 (RSV), 단순 포진 바이러스 (HSV), 인유두종 바이러스 (HPV), 인간 면역결핍 바이러스 (HIV), 플라스모디움, 황색포도상구균, 뎅기 바이러스, 트라코마 클라미디아, 시토메갈로바이러스(CMV), 간염 B 바이러스 (HBV), 결핵균, 광견병 바이러스, 및 황열병 바이러스로부터 선택된 병원체로부터 항원이 특히 바람직하다.

종양 항원:

추가적 실시예에서 본 발명에 따른 인공 핵산 분자는 종양 항원, 절편, 상기 종양 항원의 변이체 또는 유도체를 포함하는 펩타이드 또는 단백질을 포함하는 단백질 또는 펩타이드를 코딩할 수 있으며, 바람직하게 상기 종양 항원은 멜라닌 세포-특이적 항원, 고환암 항원 또는 종양 특이적 항원, 바람직하게 CT-X 항원, 비-X CT-항원, CT-X 항원에 대한 결합 파트너 또는 비-X CT-항원 또는 종양 특이적 항원에 대한 결합 파트너, 더욱 바람직하게 CT-X 항원, 비-X CT-항원에 대한 결합 파트너 또는 종양-특이적 항원 또는 상기 종양 항원의 변이체 또는 유도체이며; 및 상기 각각의 핵산 서열은 다른 펩타이드 또는 단백질을 코딩하며; 및 상기 적어도 하나의 핵산 서열은 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, 알파-5-베타-1-인테그린, 알파-5-베타-6-인테그린, 알파-액티닌-4/m, 알파-메틸아실-코엔자임 A 라세메이즈, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, 베타-카테닌/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA 19-9, CA72-4, CA125, 칼레티쿨린(calreticulin), CAMEL, CASP-8/m, 카뎁신 B(cathepsin B), 카뎁신 L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, 코액토신-유사 단백질, 콜라주(collage) XXIII, COX-2, CT-9/BRD6, Cten, 사이클린 B1, 사이클린 D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, 헵신, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, 호메오박스 NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, 미숙 라미닌 수용체, 칼리크레인(kallikrein)-2, 크레인-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, 맘마글로빈(mammaglobin) A, MART-1/멜란-A, MART-2, MART-2/m, 기질 단백질(matrix protein) 22, MC1R, M-CSF, ME1/m, 메소텔린(mesothelin), MG50/PXDN, MMP11, MN/CA IX-항원, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, 미오신 클래스 I/m, NA88-A, N-아세틸글루코사미닐트랜스퍼라제-V, 네오-PAP, 네오-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, 오스테오칼신, 오스테오폰틴, p15, p190 마이너 bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PAP, PART-1, PATE, PDEF, Pim-1-키나제, Pin-1, Pml/PAR알파, POTE, PRAME, PRDX5/m, 프로스테인, 프로테이나제-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP-1, 서바이빈, 서바이빈-2B, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGF베타, TGF베타RII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, 티로시나제, UPA, VEGFR1, VEGFR-2/FLK-1, WT1 및 림프성 혈구의 면역글로불린 유전자형 또는 림프구 혈구의 T 세포 수용체 유전자형, 또는 상기 종양 항원의 절편, 변이체 또는 유도체; 바람직하게 서바이빈 또는 이의 유사체, MAGE-과로부터 항원 또는 이의 결합 파트너 상기 종양 항원의 절편, 변이체 또는 유도체를 코딩한다. 이러한 맥락에서 종양 항원 NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, 서바이빈, Muc-1, PSA, PSMA, PSCA, STEAP 및 PAP가 특히 바람직하다.

바람직한 실시예에서, 상기 인공 핵산 분자는 치료적 단백질 또는 절편, 이의 변이체 또는 유도체를 포함하는, 단백질 또는 펩타이드를 부호화한다.

본 발명에 정의된 치료 단백질은 어느 유전된 또는 후천적 질병의 치료에 유용한 또는 개인의 상태를 개선시키는 펩타이드 또는 단백질이다. 특히, 치료 단백질은 다른 기능들 가운데, 유전적 결함의 변형 및 치료, 암 세포 또는 병원체 감염된 세포의 파괴, 면역계 질환 치료, 대사성 또는 내분비 질환의 치료를 할 수 있는, 치료제의 생성에 중요한 역할을 수행한다. 예를 들어, 에리쓰로포이에틴(EPO), 단백질 호르몬은 신장 합병증의 일반적 원인인, 적혈구 결핍증이 있는 환자를 치료하는데 활용될 수 있다. 게다가 어쥬번트 단백질, 치료 항체는 치료 단백질 및 또한 예를 들어 폐경기 여성의 치료에 사용될 수 있는 호르몬 교체 치료에 포함된다. 보다 최근 연구에서, 환자의 체세포는 논란이 되는 줄기 세포 치료를 대체하는 다능성 줄기 세포로 그들을 재프로그램하는데 사용된다. 또한, 체세포의 재프로그래밍에 사용되거나 줄기세포의 분화에 사용된 이들 단백질은 치료 단백질로 본 발명에 정의된다. 게다가, 치료 단백질은 다른 목적, 예를 들어 상처 치료, 조직 재생, 혈관형성 등을 위해 사용될 수 있다. 게다가, 항원-특이적 B 세포 수용체 및 변이체는 치료 단백질로 본 발명에 정의된다.

따라서 치료 단백질은 유전적 또는 후천적인 것과 독립적으로, 예를 들어 감염성 질병, 종양(neoplasm) (예를 들어 암 또는 종양 질환), 혈액 및 혈액 형성 기관의 질병, 내분비, 영양 및 대사성 질병, 신경계 질병, 순환계 질병, 호흡계 질병, 소환계 질병, 피부 및 피하 조직 질병, 근골격계 질병 및 결합 조직, 및 비뇨생식기계 질병과 같은 다양한 질병의 치료를 포함하는 다양한 목적으로 사용될 수 있다.

이러한 맥락에서, 대사성 또는 내분비 질환의 치료에 그 중에서도 사용될 수 있는 특히 바람직한 치료 단백질은 하기로부터 선택됨(괄호 내 치료 단백질이 치료에 사용되는 특정 질병): 산 스핑고미엘리나아제(Acid sphingomyelinase) (니만 피크병, Niemann-Pick disease), 아디포티드(Adipotide) (비만), 아갈시다제-베타(Agalsidase-beta) (인간 갈락토시다제 A) (파브리 병(Fabry disease); 신장 및 심혈관 합병증을 유도하는 지질의 축적을 방지), 알글루코시다제(Alglucosidase) (폼페병(Pompe disease) (글리코겐 저장 질병 타입 II)), 알파-갈락토시다제 A (알파-GAL A, 아갈시다제 알파) (파브리 질병), 알파-글루코시다제(글리코겐 저장 질병(GSD), 폼페 병(Morbus Pompe)), 알파-L-이두로니다제(alpha-L-iduronidase) (뮤코다당증 (MPS), 후를러 증후군(Hurler syndrome), 샤이 증후군(Scheie syndrome)), 알파-N-아세틸글루코사미니다제(alpha-N-acetylglucosaminidase) (산필립포 증후군, Sanfilippo syndrome), 암피레굴린(Amphiregulin) (암, 대사성 질환), 안지오포이에틴(Angiopoietin) ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (혈관 형성, 혈관 안정), 부타세룰린(Betacellulin) (대사성 질환), 베타-글루쿠로니다제(Beta-glucuronidase) (슬리 증후군(Sly syndrome)), 골 형태발생 단백질(Bone morphogenetic protein) BMPs (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP10, BMP15) (재생적 영향, 뼈 관련 증상, 만성 신장 질환(CKD)), CLN6 단백질 (CLN6 질병 - 비정형 후기 영아(Atypical Late Infantile), 늦은 발병 변이(Late Onset variant), 조기 유년(Early Juvenile), 뉴런 세로이드 리포푸시노스(Neuronal Ceroid Lipofuscinoses, NCL)), 표피 성장 인자(EGF) (상처 치료, 세포 성장, 증식 및 분화의 조절), 에피겐(Epigen) (대사성 질환), 에피레귤린(Epiregulin) (대사성 질환), 섬유아세포 성장촉진 인자(Fibroblast Growth Factor) (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (상처 치료, 혈관 생성, 내분비 질환, 조직 재생), 갈술파제(Galsulphase) (뮤코다당침착(Mucopolysaccharidosis) VI), 그렐린(Ghrelin) (과민성 대장 증후군(irritable bowel syndrome, IBS), 비만, 프라더-윌리 증후군(Prader-Willi syndrome), 타입 II 진성 당뇨병(diabetes mellitus), 글루코세레브로시다아제(Glucocerebrosidase) (고셰병(Gaucher's disease)), GM-CSF (재생적 효과, 백혈구 생산, 암), 헤파린-결합 EGF-유사 성장 인자(HB-EGF) (상처 치료, 심장 비대 및 심장 발달 및 기능), 간세포 생장 인자(Hepatocyte growth factor, HGF) (재생 효과, 상처 치료), 헵시딘(Hepcidin) (철 대사 질환, 베타 지중해 빈혈(Beta-thalassemia)), 인간 알부민(알부민의 감소된 생산 (저단백혈증), 증가된 알부민의 감소(신장 증후군), 하이포볼레미아(hypovolaemia), 고빌리루빈혈증(hyperbilirubinaemia)), 이둘설파제(Idursulphase) (이두로네이트-2-설파타제, Iduronate-2-sulphatase) (뮤코다당침착(Mucopolysaccharidosis) II (헌터 증후군, Hunter syndrome)), 인테그린 αVβ3, αVβ5 및 α5β1 (결합 기질 고분자 및 단백질분해효소(Bind matrix macromolecules and proteinases), 혈관 생성), 이우두로네이트 설파타제(Iuduronate sulfatase) (헌터 증후군(Hunter syndrome)), 라로니다제(Laronidase) (뮤코다당침착 I의 후를러 및 후를러-샤이 형태), N-아세틸갈락토사민-4-설파타제(rhASB; 갈설파제(galsulfase), 아릴설파타제 A(Arylsulfatase A) (ARSA), 아릴설파타제 B (ARSB)) (아릴설파타제 B 결핍, 마로토-라미 증후군(Maroteaux-Lamy syndrome), 뮤코다당침착 VI), N-아세틸글루코사민-6-설파타제(N-acetylglucosamine-6-sulfatase) (산필리포 증후군(Sanfilippo syndrome)), 신경 성장 인자(Nerve growth factor) (NGF, 뇌 유도된 신경영양성 인자(Brain-Derived Neurotrophic Factor, BDNF), 뉴로트로핀-3(Neurotrophin-3, NT-3), 및 뉴로트로핀 4/5 (NT-4/5) (재생 효과, 심혈관 질병, 관상동맥 죽상경화증(coronary atherosclerosis), 비만, 제2형 당뇨병, 대사성 증후군, 급성 관동맥 증후군, 치매, 우울증, 정신 분열병(schizophrenia), 자폐증, 레트 증후군(Rett syndrome), 신경성 무식욕증(anorexia nervosa), 신경성 식욕 항진증(bulimia nervosa), 상처 치료, 피부 궤양, 각막 궤양, 알츠하이머병), 뉴레귤린(Neuregulin) (NRG1, NRG2, NRG3, NRG4) (대사성 질환, 정신 분열병), 뉴로필린(Neuropilin) (NRP-1, NRP-2) (혈관 생성, 축색 돌기 유도(axon guidance), 세포 생존, 이동), 오베스타틴(Obestatin) (과민성 대장 증후군(irritable bowel syndrome, IBS), 비만, 프라더-윌리 증후군(Prader-Willi syndrome), 제2형 진성 당뇨병), 혈소판 유래 증식 인자(Platelet Derived Growth factor) (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (재생 효과, 상처 치료, 혈관 생성에 질환, 동맥 경화증, 섬유증, 암), TGF 베타 수용체 (엔도글린(endoglin), TGF-베타 1 수용체, TGF-베타 2 수용체, TGF-베타 3 수용체) (신장 섬유증(renal fibrosis), 신장 질병, 당뇨병, 궁극적 말기 신장 질환(ESRD), 혈관 생성), 트롬보포이에틴 (THPO) (거대 핵세포(Megakaryocyte) 성장 및 발달 인자 (MGDF)) (혈소판 장애, 기증(donation)에 대한 혈소판, 골수 억제 항암 화학요법(myelosuppressive chemotherapy) 이후 혈소판 수의 회복, 변형 성장 인자(Transforming Growth factor) (TGF (TGF-알파, TGF-베타 (TGF베타1, TGF베타2, 및 TGF베타3))) (재생 효과, 상처 치료, 면역력, 암, 심장 질병, 당뇨병, 말판 증후군(Marfan syndrome), 로이 디에츠 증후군(Loeys-Dietz syndrome)), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F 및 PIGF) (재생 효과, 혈관 생성, 상처 치료, 암, 삼투성), 네시리타이드(Nesiritide) (급성 비 대상성 충혈성 심부전(Acute decompensated congestive heart failure), 트립신 (욕창(Decubitus ulcer), 정맥류성 궤양(varicose ulcer), 딱지(eschar)의 창상 절제(debridement), 열개성 상처(dehiscent wound), 화상(sunburn), 태변성 일레우스(meconium ileus)), 부신피질 자극호르몬(adrenocorticotrophic hormone, ACTH) ("에디슨 병, 소세포 암종, 부신백질 이영양증(Adrenoleukodystrophy), 선천성 부신 증식증(Congenital adrenal hyperplasia), 쿠싱 증후군(Cushing's syndrome), 넬슨 증후군(Nelson's syndrome), 유아성 경련(Infantile spasms)), 심방 나트륨이뇨 펩티드(Atrial-natriuretic peptide, ANP) (내분비 질환), 콜레시스토키닌(Cholecystokinin) (다양한), 가스트린(Gastrin) (저가스트린혈증, hypogastrinemia), 렙틴(Leptin) (당뇨병(Diabetes), 과트리글리세라이드혈증(hypertriglyceridemia), 당뇨병), 옥시토신(Oxytocin) (모유 영양(breastfeeding) 자극, 분만의 비진행), 소마토스타틴(Somatostatin) (카르시노이드 증후군(carcinoid syndrome)의 대증 요법, 급성 정맥류 출혈(acute variceal bleeding), 및 말단 비대증(acromegaly), 간 및 신장의 다낭성 질병, 신경 내분비 종양에 의한 말단 비대증 및 증상), 바소프레신 (항이뇨 호르몬) (요붕증(diabetes insipidus)), 칼시토닌 (폐경기후 골다공증(Postmenopausal osteoporosis), 고칼슘혈증(Hypercalcaemia), 파제트병(Paget's disease), 골 전이, 환상지통(Phantom limb pain), 척추관 협착증(Spinal Stenosis)), 엑세나티드(Exenatide) (메트포민(metformin) 및 설포닐우레아(sulphonylurea)로 치료에 내성인 제2형 당뇨병), 성장 호르몬 (GH), 소마토트로핀 (GH 결핍 또는 만성 신부전식(chronic renal insufficiency)에 따른 성장 부전), 프라더-윌리 증후군(Prader-Willi syndrome), 터너 증후군, 에이즈 낭비(AIDS wasting) 또는 항바이러스 치료와 함께 악액질(cachexia)), 인슐린 (진성 당뇨병, 당뇨병성 케토애시도시스(diabetic ketoacidosis), 고칼륨혈증(hyperkalaemia)), 인슐린 유사 성장 인자 1 IGF-1 (GH 유전자 결실 또는 심각한 주요 IGF1 결핍(severe primary IGF1 deficiency)로 어린이 성장 부전, 신경퇴행성 질병(neurodegenerative disease), 심혈관 질병, 심부전), 메카세르민 린파베이트(Mecasermin rinfabate), IGF-1 유사체(analog) (GH 유전자 결실 또는 심각한 주요 IGF1 결핍으로 어린이 성장 부전, 신경퇴행성 질병, 심혈관 질병, 심부전), 메카세르민(Mecasermin), IGF-1 유사체 (GH 유전자 결실 또는 심각한 주요 IGF1 결핍으로 어린이 성장 부전, 신경퇴행성 질병, 심혈관 질병, 심부전), 페그비소만트(Pegvisomant) (말단 비대증(Acromegaly)), 프람린티드(Pramlintide) (진성 당뇨병, 인슐린과 조합), 테리파라타이드(Teriparatide) (인간 파라티로이드 호르몬 잔기 1-34) (심한 골다공증, Severe osteoporosis), 베카프레르민(Becaplermin) (당뇨병성 궤양에 대한 창상 절제 부가(Debridement adjunct)), 디보테르민-알파(Dibotermin-alpha) (골 형태 발생 단백질 2(Bone morphogenetic protein 2)) (척추 융합술(Spinal fusion surgery), 골 상처 회복), 히스트렐린 아세테이트(Histrelin acetate) (고나도트로핀 방출 호르(gonadotropin releasing hormone); GnRH) (조숙(Precocious puberty)), 옥트레오타이드(Octreotide) (말단 비대증, VIP-분비 아데노마 및 전이성 암양종 종양(metastatic carcinoid tumours)의 증상 완화) 및 팔리페르민(Palifermin) (케라틴세포 생장인자(keratinocyte growth factor; KGF)) (화학 요법을 겪는 환자 내 심각한 구강 점막염, 상처 회복).

이들 및 다른 단백질은 그들이 충분한 양의 기능성 단백질의 이의 결함이 있는 내인성 생산을 교체함으로써 개체를 치료하는 것을 의미하는 것과 같이, 치료적인 것으로 이해된다. 따라서, 이러한 치료 단백질은 전형적으로 포유동물, 특히 인간 단백질이다.

혈액 질환, 순환계 질병, 호흡계 질병, 암 또는 종양 질병, 감염성 질병 또는 면역결핍증에 대하여, 하기 치료 단백질이 사용될 수 있다: 알트플라제(Alteplase) (조직 플라스미노겐 활성자(tissue plasminogen activator); tPA) (폐색전(Pulmonary embolism), 심근경색(myocardial infarction), 급성 허혈성 발작(acute ischaemic stroke), 중심정맥 접근장치의 폐색(occlusion of central venous access devices)), 아니스트리플라제(Anistreplase) (혈전 용해), 안티트롬빈 III (AT-III) (유전적 AT-III 결핍, 혈전 색전증), 비발리루딘(Bivalirudin) (관상동맥 형성술 및 헤파린 유도 저혈소판증에 혈액 응고 위험의 감소), 다르베포이에틴-알파(Darbepoetin-alpha) (만성 신부전(renal insufficiency) 및 만성 신부전(renal failure)(+/- 투석)을 갖는 환자에 빈혈의 치료), 드로트리코긴-알파(Drotrecogin-alpha) (활성화된 단백질 C) (사망의 위험이 높은 중증 패혈증(severe sepsis)), 에리쓰로포이에틴(Erythropoietin), 에포에틴-알파(Epoetin-alpha), 에리쓰로포이에틴(erythropoietin), 에쓰로포이에틴(erthropoyetin) (만성 질병의 빈혈, 골수이형성(myelodysplasia), 신부전에 또는 화학요법에 따른 빈혈, 수술전 준비), 인자 IX (혈우병(Haemophilia) B), 인자 VIIa (혈우병 A 또는 B 및 인자 VIII 또는 인자 IX에 억제자를 갖는 환자의 출혈), 인자 VIII (혈우병 A), 레피루딘(Lepirudin) (헤파린 유도된 저혈소판증), 단백질 C 농축(concentrate) (정맥혈전증(Venous thrombosis), 전격성자반(Purpura fulminans)), 레테플라제(Reteplase) (tPA의 삭제 돌연변이) (급성 심근경색의 조절, 좌심실 기능의 증진), 스트렙토키나제(Streptokinase) (급성 진화 전층 심근경색(Acute evolving transmural myocardial infarction), 폐색전(pulmonary embolism), 심부정맥 혈전증(deep vein thrombosis), 동맥 혈전증 또는 색전증, 동정맥 캐뉼라의 폐색), 테넥테플라제(Tenecteplase) (급성 심근경색), 우로키나제(Urokinase) (폐색전), 엔지오스타틴(Angiostatin) (암), 항-CD22 면역독소 (재발된(relapsed) CD33+ 급성 골수 백혈병), 데니루킨 디프티톡스(Denileukin diftitox) (피부 T-세포 림프종(Cutaneous T-cell lymphoma, CTCL)), 이뮤노시아닌(Immunocyanin) (방광 및 전립선 암), MPS (메탈로팬스티물린, Metallopanstimulin) (암), 아플리베르셉트(Aflibercept) (비소세포 폐암 (NSCLC), 전이성 대장암 (mCRC), 호르몬 불응성 전이성 전립선암, 습식 황반변성), 엔도스타틴(Endostatin) (암, 류마티스 관절염뿐만 아니라 크론병, 당뇨병성 망막증, 건선, 및 자궁 내막증과 같은 염증성 질병), 콜라게나제 (만성 피부 궤양의 창상 절제 및 중증 화상 부위, 듀푸이트렌 구축(Dupuytren's contracture), 페이로니병(Peyronie's disease)), 인간 디옥시-리보뉴클레아제 I, 도르나제(dornase) (낭포성 섬유증(Cystic fibrosis); 예견된 40%보다 큰 FVC를 갖는 선택된 환자에 호흡기 감염 감소), 히알루로니다제(Hyaluronidase) (주사된 약물, 특히 안과 수술 및 특정 조영제의 흡수 및 분산을 향상시키는 어쥬번트로 사용됨), 파파인(Papain) (욕창, 정맥류(varicose) 및 당뇨성 궤양, 화상, 수술 후 상처, 모소낭포 상처, 피하 조직 염증(carbuncles), 및 다른 상처와 같은 급성 및 만성 병변에 괴사 조직의 창상 절제 또는 고통(slough)의 액화(liquefication)), L-아스파라기나제(L-Asparaginase) (증식을 위한 외인성 아스파라긴을 필요로 하는, 급성 림프구성 백혈병), 페그-아스파라기나제(Peg-asparaginase) (증식을 위한 외인성 아스파라긴을 필요로 하는 급성 림프구성 백혈병), 라스부리카제(Rasburicase) (항암 치료중인 백혈병, 림프종, 및 고형 종양을 갖는 소아 환자는 종양 용해 증후군을 일으킬 수 있음), 인간 만성 고나도트로핀(Human chorionic gonadotropin, HCG) (보조 생식(Assisted reproduction)), 인간 난포 자극 호르몬(Human follicle-stimulating hormone, FSH) (보조 생식), 루트로핀-알파(Lutropin-alpha) (황체형성 호르몬 결핍과 함께 불임), 프로락틴(Prolactin) (프로락틴 혈증(Hypoprolactinemia), 혈청 프로락틴 결핍, 여성의 난소 기능 장애, 불안, 남자의 동맥성 발기 부전(arteriogenic erectile dysfunction), 조루(premature ejaculation), 정자 감소증(oligozoospermia), 정자 무력증(asthenospermia), 정액낭(seminal vesicles)의 기능 부전, 남성호르몬감소증(hypoandrogenism)), 알파-1-프로테이나제 억제자 (선천성 트립신 결핍증(Congenital antitrypsin deficiency)), 락타제(Lactase) (락토스 소화 불능에 따른 가스, 팽만감(bloating), 경련 및 설사), 췌장 효소(Pancreatic enzymes) (리파제(lipase), 아밀라제(amylase), 프로테아제(protease)) (낭포성 섬유증(Cystic fibrosis), 만성 췌장염(chronic pancreatitis), 췌장 부전(pancreatic insufficiency), 포스트-빌로스 II 위 우회술(post-Billroth II gastric bypass surgery), 췌관 폐색(pancreatic duct obstruction), 지방변(steatorrhoea), 소화 불량(poor digestion), 가스, 팽만감), 아데노신 디아미나제(Adenosine deaminase) (페가데마제 보빈(pegademase bovine), PEG-ADA) (아데노신 디아미나제 결핍에 의한 중증 조합된 면역결핍 질병), 아바타셉트(Abatacept) (류마티스성 관절염 (특히 TNF 알파 억제에 대해 내성(refractory)일 때)), 알레파셉트(Alefacept) (판 건선(Plaque Psoriasis)), 아나킨라(Anakinra) (류마티스성 관절염), 에타너셉트(Etanercept) (류마티스성 관절염, 다관절 과정 청소년 류마티스성 관절염(polyarticular-course juvenile rheumatoid arthritis), 건선 관절염, 강직성 척수염(ankylosing spondylitis), 판 건선, 강직성 척수염), 인터루킨-1 (IL-1) 수용체 길항제, 아나킨라(Anakinra) (류마티스성 관절염과 관련된 염증 및 연골 퇴행), 티물린(Thymulin) (신경퇴행성 질병, 류마티즘, 신경성 무식욕증), TNF-알파 길항자 (류마티스성 관절염, 강직성 척수염, 크론병, 건선, 화농성 한선염, 난치성 천식과 같은 자가면역 질환), 엔푸빌티드(Enfuvirtide) (HIV-1 감염), 및 티모신(Thymosin) α1 (간염 B 및 C).

(괄호 안은 치료에 사용되는 치료 단백질에 대한 특정한 질병임)

추가적 양태에서, 본 발명은 하기를 포함하는 벡터를 제공한다

a. 오픈 리딩 프레임(ORF) 및/또는 클로닝 부위, 예를 들어 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열의 삽입을 위한 것; 및

일반적으로, 본 발명에 따른 벡터는 상기 설명된 본 발명에 따른 인공 핵산 분자를 포함할 수 있다. 특히, 본 발명에 따른 인공 핵산 분자에 대해 상기 바람직한 실시예는 또한 본 발명에 따른 벡터에 포함되는 본 발명에 따른 인공 핵산 분자에 대해 적용된다. 예를 들어, 본 발명의 벡터에서 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소 및 ORF는 바람직한 실시예를 포함하는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것과 같다. 예를 들어, 본 발명에 따른 벡터에서, 적어도 하나의 3'-UTR 및/또는 적어도 하나의 5'-UTR 요소가 유도된 안정한 mRNA는 바람직하게 첫번째 시점에서 상기 mRNA 양에 비해 두번째 시점에서 상기 mRNA의 양의 비율이 적어도 0.5(50%), 적어도 0.6(60%), 적어도 0.7(70%), 적어도 0.75(75%), 적어도 0.8(80%), 적어도 0.85(85%), 적어도 0.9(90%), 또는 적어도 0.95(95%)인 mRNA 붕괴를 특징으로 할 수 있다.

클로닝 부위는 오픈 리딩 프레임을 도입하기에 적절한 어느 서열 또는 하나 이상의 제한 부위와 같은 오픈 리딩 프레임을 포함하는 서열일 수 있다. 따라서, 클로닝 부위를 포함하는 벡터는 바람직하게 벡터로 오픈 리딩 프레임을 삽입, 바람직하게 5'-UTR 요소에 3' 및/또는 3'-UTR 요소에 5' 오픈 리딩 프레임을 삽입하기에 적절하다. 바람직하게, 클로닝 부위 또는 ORF는 5'-UTR 요소에 3' 및/또는 3'-UTR 요소에 5', 바람직하게 5'-UTR 요소의 3'-말단 및/또는 3'-UTR 요소의 5'-말단에 가깝게 위치한다. 예를 들어, 클로닝 부위 또는 ORF는 5'-UTR 요소의 3'-말단 및/또는 3'-UTR 요소의 5'-말단에 직접적으로 연결될 수 있거나 또는 그들은 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 2, 4, 6, 8, 10, 20개 등 뉴클레오티드의 스트레치와 같은 뉴클레오티드의 스트레치를 통해 연결될 수 있다.

바람직하게, 본 발명에 따르는 벡터는 본 발명에 따르는 인공 핵산 분자를 생산하는데, 바람직하게 본 발명에 따르는 인공 mRNA를 생산하는데, 예를 들어 벡터로 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열을 선택적으로 삽입하고 벡터를 전사함으로써, 적합하다. 따라서 바람직하게는 벡터는 프로모터, 예를 들어 RNA 중합효소 프로모터와 같은, 전사를 위해 필요한 요소를 포함한다. 바람직하게는 벡터는 진핵 세포, 원핵 세포, 또는 진핵, 원핵, 바이러스 또는 파지 인비트로 전사 시스템과 같은, 진핵 생물, 원핵 생물, 바이러스 또는 파지 전사 시스템을 사용하는 전사에 적합하다. 따라서 예를 들어 벡터는 RNA 중합효소와 같은 중합효소에 의해, 예를 들어 진핵, 원핵, 바이러스, 또는 파지 RNA 중합효소에 의해 인식되는 프로모터 서열을 포함할 수 있다. 바람직한 실시예에서 상기 벡터는 SP6 또는 T7과 같은 파지 RNA 중합효소 프로모터, 바람직하게는 T7 프로모터를 포함할 수 있다. 바람직하게, 상기 벡터는 인비트로(in vitro) 전사 시스템에 기초한 T7 RNA 중합효소와 같은 인비트로 전사 시스템에 기초한 파지를 사용하는 인비트로 전사에 적절하다. 다른 바람직한 실시예에서, 상기 벡터는 세포 또는 조직 내 코딩된 펩타이드 또는 단백질의 발현에 직접적으로 사용될 수 있다. 이러한 목적을 위해, 상기 벡터는 그들 세포/ 조직 내 발현을 위해 필수적인 특정한 요소, 예를 들어 CMV 프로모터와 같은 특정 프로모터 서열을 포함한다.

상기 벡터는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가적으로 포함할 수 있다.

상기 벡터는 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게, 상기 벡터는 DNA 벡터이다. 상기 벡터는 바이러스 벡터 또는 플라스미드 벡터와 같이, 통상의 기술자에게 알려진 어느 벡터일 수 있다. 바람직하게 상기 벡터는 플라스미드 벡터, 바람직하게 DNA 플라스미드 벡터이다.

바람직한 실시예에서, 본 발명에 따른 벡터는 본 발명에 따른 인공 핵산 분자를 포함한다.

바람직하게, 본 발명에 따른 DNA 벡터는 서열번호: 1 내지 24 및 서열번호: 49 내지 318에 따른 핵산 서열과 같이, 유전자의 전사체의 3'-UTR의 핵산 서열에 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함한다.

바람직하게, 본 발명에 따른 DNA 벡터는 서열번호: 25 내지 30 및 서열번호: 319 내지 382에 따른 핵산 서열과 같이, 유전자의 전사체의 5'-UTR의 핵산 서열에 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함한다.

바람직하게, 본 발명에 따른 DNA 벡터는 성열번호: 1 내지 30에 따른 DNA 서열 또는 서열번호: 1 내지 30 에 따른 DNA 서열 또는 상기 설명된 이의 절편, 바람직하게 이의 기능적 절편에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 약 99% 서열 상동성을 갖는 서열로 이루어진 그룹으로부터 선택된 서열을 포함한다.

바람직하게, 본 발명에 따른 RNA 벡터는 성열번호: 1 내지 30에 따른 DNA 서열에 상응하는 RNA 서열 또는 서열번호: 1 내지 30 에 따른 DNA 서열 또는 상기 설명된 이의 절편, 바람직하게 이의 기능적 절편에 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 약 99% 서열 상동성을 갖는 서열로 이루어진 그룹으로부터 선택된 서열을 포함한다.

바람직하게, 상기 벡터는 원형 분자이다. 바람직하게, 상기 벡터는 이중 가닥 DNA 분자와 같은 이중 가닥 분자이다. 이러한 원형, 바람직하게 이중 가닥 DNA 분자는 본 발명의 인공 핵산 분자를 위한 저장 형태로써 편리하게 사용될 수 있다. 게다가, 이는 세포, 예를 들어 배양된 세포의 형질전환을 위해 사용될 수 있다. 또한 이는 본 발명에 따른 인공 RNA 분자를 수득하기 위한 인비트로(in vitro) 전사를 위해 사용될 수 있다.

바람직하게, 상기 벡터, 바람직하게 원형 벡터는, 예를 들어 제한 효소 소화에 의해 선형화된다. 바람직한 실시예에서, 상기 벡터는 제한 부위와 같은 절단 부위, 바람직하게 ORF에 바로 옆 3'에 위치한, 또는 - 만약 존재한다면 - 3'-UTR 요소에 바로 옆 3'에 위치한, 또는 -만약 존재한다면 - 폴리(A) 서열 또는 폴리아데닐화 신호에 3' 위치한, 또는 - 만약 존재한다면 - 폴리(C) 서열에 3' 위치한, 또는 - 만약 존재한다면 - 히스톤 스템-루프에 3' 위치한 특별한 절단 부위를 포함한다. 따라서, 바람직하게, 벡터를 선형화함으로써 수득된 생산물은 ORF의 3'-말단과 함께, 또는 - 만약 존재한다면 - 3'-UTR 요소의 3'-말단과 함께, 또는 - 만약 존재한다면 - 폴리(A) 서열 또는 폴리아데닐화 신호의 3'-말단과 함께, 또는 - 만약 존재한다면 - 폴리(C) 서열의 3'-말단과 함께 3' 말단에서 종결한다. 실시예에서, 본 발명에 따른 벡터는 본 발명에 따른 인공 핵산 분자를 포함하며, 제한 부위, 바람직하게 특수한 제한 부위는 바람직하게 상기 인공 핵산 분자의 3'-말단에 바로 옆 3'에 위치한다.

추가적 양태에서, 본 발명은 본 발명에 따르는 인공 핵산 분자 또는 본 발명에 따르는 벡터를 포함하는 세포에 관한 것이다. 세포는 박테리아 세포, 곤충 세포, 식물 세포, 척추동물 세포, 예를 들어 포유동물 세포와 같은 어떠한 세포일 수 있다. 이러한 세포는, 예를 들어 박테리아 세포 내에서, 예를 들어 본 발명에 벡터의 복제에 사용될 수 있다. 나아가, 세포는 본 발명에 따르는 인공 핵산 분자 또는 벡터를 전사 및/또는 본 발명에 따르는 인공 핵산 분자 또는 벡터의 오픈 리딩 프레임을 번역하는데 사용될 수 있다. 예를 들어, 세포는 재조합 단백질 생산을 위해 사용될 수 있다.

본 발명에 따르는 세포는 예를 들어 표준 형질전환(transfection), 형질도입(transduction) 또는 형질변환(transformation) 방법과 같은, 표준 핵산 전달 방법에 의해 획득될 수 있다. 예를 들어 본 발명에 따르는 인공 핵산 분자 또는 벡터는 전기천공법, 리포펙션(lipofection)에 의해, 예를 들어 양이온성 지질 및/또는 리포솜, 칼슘 포스페이트 침전, 나노입자 기초의 형질전환, 바이러스 기초의 형질전환에 기초하여, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머에 기초하여, 세포 내로 형질전환될 수 있다.

바람직하게 상기 세포는 인간 개체의 세포와 같은 포유동물 세포, 가축, 마우스 또는 랫과 같은 실험용 동물 세포이다. 바람직하게는 세포는 인간 세포이다. 상기 세포는 CHO, BHK, 293T, COS-7, HELA, HEK 등 세포와 같은, 확립된(established) 세포 라인의 세포일 수 있으며 또는 상기 세포는 인간 피부 아세포(HDF) 등과 같은 일차 세포, 바람직하게 유기체로부터 분리된 세포일 수 있다. 바람직한 실시예에서, 세포는 포유동물 개체의, 바람직하게는 인간 개체의 분리된 세포이다. 예를 들어 세포는 바람직하게는 포유동물 개체의, 바람직하게는 인간 개체의 수상돌기 세포, 암 또는 종양 세포, 또는 어느 체세포 등 과 같은 면역 세포일 수 있다.

추가적 양태에서, 본 발명은 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 또는 본 발명에 따르는 세포를 포함하는 약학적 조성물을 제공한다. 본 발명에 따르는 약학적 조성물은 예를 들어 백신으로서, 예를 들어 유전자적 백신 접종을 위해 사용될 수 있다. 따라서 ORF는 예를 들어 백신 접종을 위해 환자에게 투여되는 항원을 코딩할 수 있다. 따라서 바람직한 실시예에서 본 발명에 따르는 약학적 조성물은 백신이다. 나아가 본 발명에 따르는 약학적 조성물은 예를 들어 유전자 치료를 위해 사용될 수 있다.

바람직하게, 상기 약학적 조성물은 하나 또는 그 이상의 약학적으로 허용가능한 비히클(vehicles), 희석제(diluents) 및/또는 부형제(excipients) 및/또는 하나 또는 그 이상의 어쥬번트를 추가적으로 포함할 수 있다. 본 발명의 맥락에서, 약학적으로 허용가능한 비히클은 전형적으로 본 발명의 약학적 조성물을 위해 액체 또는 비액체 기초(basis)를 포함한다. 일 실시예에서, 약학적 조성물은 액체 형태로 제공된다. 이러한 맥락에서, 바람직하게는 비히클은 무-피로겐 물, 등장성 식염수(isotonic saline) 또는 버퍼 (수용성) 용액, 예를 들어 포스페이트, 시트레이트 등 버퍼 용액과 같은, 물에 기초한다. 버퍼는 특정한 참조 배지에 비해 참조(reference)와 함께 고장성(hypertonic), 등장성(isotonic) 또는 저장성(hypotonic)일 수 있으며, 즉 버퍼는 특정한 참조 배지에 비해 참조와 함께 높은, 동일한 또는 낮은 염 함량을 가질 수 있으며, 상기 바람직하게는 앞서 언급된 이러한 농도는 삼투압 또는 다른 농도 효과에 따르는 포유동물 세포의 피해를 유도하지 않게, 사용될 수 있다. 참조 배지는 예를 들어 피, 림프, 세포질 액체, 또는 다른 체내 액체와 같은 "인비보(in vivo)" 방법에서 발생하는 액체 또는 예를 들어 통상 버퍼 또는 액체와 같은 "인비트로(in vitro)" 방법에서 참조 배지로서 사용될 수 있는 액체이다. 이러한 통상의 버퍼 또는 액체는 통상의 기술자에게 알려져 있다. 링거-락테이트 용액은 액체 베이스로서 특히 바람직하다.

환자에게 투여하기 적절한 하나 또는 그 이상의 호환 가능한 고체 또는 액체 필러 또는 희석제 또는 캡슐화(encapsulating) 화합물은 본 발명의 약학적 조성물에도 사용될 수 있다. 본 발명에 사용된 용어 "호환 가능한"은 바람직하게는 이들 본 발명의 약학적 조성물의 구성 요소가 전형적 사용 조건하에 본 발명의 약학적 조성물의 약학적 효과를 지속적으로 감소시킬 수 있는 상호 작용이 일어나지 않는 환경에서 본 발명에 정의된 본 발명의 인공 핵산, 벡터 또는 세포와 혼합될 수 있다는 것을 의미한다.

본 발명에 따르는 약학적 조성물은 선택적으로 하나 또는 그 이상의 추가적인 약학적으로 활성인 성분을 더 포함할 수 있다. 이러한 맥락에서 약학적으로 활성인 성분은 특정한 증상(indication) 또는 질병에 회복, 개선 또는 예방에 치료적 효과를 보이는 화합물이다. 이러한 화합물은 어떠한 제한을 의미함이 없이, 펩타이드 또는 단백질, 핵산, (치료적으로 활성인) 저분자량 유기 또는 무기 화합물 (5000 미만, 바람직하게는 1000 미만의 분자량), 당, 항원 또는 항체, 선행기술에서 알려진 치료적 제제, 항원 세포, 항원 세포 절편, 세포 분획, 세포벽 성분(예를 들어 폴리사카라이드), 변형된, 약화된 또는 비활성화된(예를 들어 화학적으로 또는 방사선에 의해) 병원체(바이러스, 박테리아 등)를 포함한다.

나아가 본 발명의 약학적 조성물은 인공 핵산 분자 또는 벡터를 위한 담체를 포함할 수 있다. 이러한 담체는 생리학적으로 허용가능한 액체의 용해를 조절, 약학적으로 활성인 인공 핵산 분자 또는 벡터의 수송 및 세포 흡수에 적합할 수 있다. 따라서 이러한 담체는 본 발명에 따르는 인공 핵산 분자 또는 벡터의 보관 및 전달에 적합할 수 있는 성분일 수 있다. 이러한 성분은 예를 들어 형질전환 또는 복합화 제제를 제공할 수 있는 양이온성 또는 다중양이온성 담체 또는 화합물일 수 있다.

이러한 맥락에서 특히 바람직한 형질전환 또는 복합화 제제는 프로타민, 뉴클레올린, 스페르민 또는 스페르미딘, 또는 다른 양이온성 펩타이드 또는 단백질, 폴리-L-리신(PLL), 폴리-아르기닌, 염기성 폴리펩타이드, HIV-결합펩타이드, HIV-1 Tat (HIV), Tat-유도된 펩타이드, 페네트라틴(Penetratin)을 포함하는 세포 관통 펩타이드(CPPs), VP22 유도된 또는 유사체 펩타이드, HSV VP22(단순 포진, Herpes simplex), MAP, KALA 또는 단백질 전달(transduction) 도메인(PTDs), PpT620, 프롤린-풍부 펩타이드, 아르기닌-풍부 펩타이드, 리신-풍부 펩타이드, MPG-펩타이드(들), Pep-1, L-올리고머, 칼시토닌 펩타이드(들), 안테나페디아(Antennapedia)-유도된 펩타이드(특히 초파리(Drosophila antennapedia)로부터), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24, SynB, SynB(1), pVEC, hCT-유도된 펩타이드, SAP, 또는 히스톤과 같은, 양이온성 또는 다중양이온성 화합물이다.

게다가, 이러한 양이온성 또는 다중양이온성 화합물 또는 담체는 바람직하게 적어도 하나의 -SH 일부를 포함하거나 포함하도록 추가적으로 변형된, 양이온성 또는 다중양이온성 펩타이드 또는 단백질일 수 있다. 바람직하게 양이온성 또는 다중양이온성 담체는 하기 합계식(I)을 갖는 양이온성 펩타이드로부터 선택된다:

{(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x}; 화학식 (I)

상기 l + m + n + o + x = 3-100, 및 서로 독립적으로 l, m, n 또는 o는 Arg(아르기닌), Lys(리신), His(히스티딘) 및 Orn(오르니틴)의 총량이 올리고펩타이드의 전체 아미노산의 적어도 10%를 나타내는 경우 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 및 91-100로부터 선택된 어느 수이며; Xaa는 Arg, Lys, His 또는 Orn을 제외하고 천연(=자연적으로 발생하는) 또는 비천연 아미노산으로부터 선택된 어느 아미노산이며; X는 Xaa의 총량이 올리고펩타이드의 전체 아미노산의 90%를 초과하지 않는 경우, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90로부터 선택된 어느 수이다. 아미노산 Arg, Lys, His, Orn 및 Xaa의 어느 것은 펩타이드의 어느 위치에 위치될 수 있다. 이러한 맥락에서 7-30 아미노산의 범위 내 양이온성 펩타이드 또는 단백질은 특히 바람직하다.

나아가, 적어도 하나의 -SH 일부를 포함하거나 포함하도록 추가적으로 변형된, 화학식 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (화학식 (I))에 따라 정의될 때, 상기 개시된 양이온성 또는 다중양이온성 펩타이드 또는 단백질은, 이에 제한되지 않고, 하위 화학식(Ia)로부터 선택될 수 있다:

{(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa')_x (Cys)_y} 하위 화학식 (Ia)

상기 (Arg)l;(Lys)m;(His)n;(Orn)o; 및 x는 본 발명에 정의된 바와 같으며, Arg(아르기닌), Lys(리신), His(히스티딘) 및 Orn(오르니틴)의 총량이 올리고펩타이드의 전체 아미노산의 적어도 10%를 나타내는 경우, Xaa'는 Arg, Lys, His, Orn 또는 Cys를 제외한 천연(=자연적으로 발생) 또는 비천연 아미노산으로부터 선택된 어느 아미노산이며 Y는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 및 81-90으로부터 선택된 어느 수이다. 나아가, 양이온성 또는 다중양이온성 펩타이드는 하위 화학식 (Ib)로부터 선택될 수 있다:

Cys₁ {(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x} Cys₂ 하위 화학식 (Ib)

상기 실험식 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (화학식(III))은 본 발명에 정의된 바와 같으며 반실험(semiempirical) 화학식(III)에 따르는 아미노산 서열의 코어를 형성하며 상기 Cys1 및 Cys2는 (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x 근위(proximal)에, 또는 말단에 시스테인이다.

나아가 형질전환 또는 복합화 제제로 사용될 수 있는 바람직한 양이온성 또는 다중양이온성 화합물은 양이온성 폴리사카라이드, 예를 들어 키토산, 폴리벤, 양이온성 폴리머, 예를 들어 폴리에틸렌이민(PEI), 양이온성 지질, 예를 들어 DOTMA: [1-(2,3-시오레일옥시)프로필)]-N,N,N-트리메틸암모니움 클로라이트([1-(2,3-sioleyloxy)propyl)]-N,N,N-trimethylammonium chloride), DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민(Dioleyl phosphatidylethanol-amine), DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스페르민(Dioctadecylamidoglicylspermin), DIMRI: 디미리스토-옥시프로필 디메틸 히드록시에틸 암모늄 브로마이드(Dimyristo-oxypropyl dimethyl hydroxyethyl ammonium bromide), DOTAP: 디올레오일옥시-3-(트리메틸암모니오)프로판(dioleoyloxy-3-(trimethylammonio)propane), DC-6-14: O,O-디테트라데카노일-N-(α-트리메틸암모니오아세틸)디에타놀아민 클로라이드(O,O-ditetradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride), CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-히드록시에틸)]-디메틸암모니움 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]트리메틸암모니움, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시석시닐옥시)에틸]-트리메틸암모니움, 올리고펙타민, 또는 양이온성 또는 다중양이온성 폴리머, 예를 들어 β-아미노산-폴리머 또는 역(reversed) 폴리아미드 등과 같은 변형된 폴리아미노산, PVP(폴리(N-에틸-4-비닐피리디니움 브로마이드)), 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)), 등과 같은 변형된 아크릴레이트, pAMAM (폴리(아미도아민)), 등과 같은 변형된 아미도아민, 디아민 및 변형된 1,4 부탄디올 디아크릴레이트-코-5-아미노-1-펜타놀 폴리머, 등과 같은 변형된 폴리베타아미노에스터(PBAE), 폴리프로필아민 덴드리머 또는 pAMAM 기초의 덴드리머 등과 같은 덴드리머, PEI:폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 폴리알릴아민, 사이클로덱스트린 기초의 폴리머, 덱스트란 기초의 폴리머, 키토산 등과 같은 당 백본 기초의 폴리머, PMOXA-PDMS 코폴리머 등과 같은 실란 백본 기초의 폴리머, 하나 또는 그 이상의 양이온성 블록(예를 들어 상기 언급된 양이온성 폴리머로부터 선택된 것)의 조합 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜); 등으로 이루어진 블록폴리머를 포함할 수 있다.

다른 실시예에 따르면, 본 발명에 따른 약학적 조성물은 약학적 조성물의 면역 자극성 특성을 증진시키기 위해 어쥬번트를 포함할 수 있다. 이러한 맥락에서, 상기 어쥬번트는 본 발명에 따른 약학적 조성물에 포함된 인공 핵산 분자 또는 벡터와 같은 구성 요소의 투여 및 전달을 돕기에 적절한 어느 화합물로 이해될 수 있다. 게다가, 이러한 어쥬번트는 선천적 면역계의 면역 반응을 개시 또는 증진시킬 수 있으나, 이에 제한되지 않는다. 다시 말해, 투여될 때, 본 발명에 따른 약학적 조성물은 전형적으로 인공 핵산 분자에 의해 코딩된 항원과 직결된 후천적 변역 반응을 개시한다. 추가로, 본 발명에 따른 약학적 조성물은 본 발명에 따른 약학적 조성물에 본 발명에 정의된 어쥬번트의 추가에 따른 (보조적(supportive)) 선천적 면역 반응을 발생시킬 수 있다.

이러한 어쥬번트는 통상의 기술자에게 알려진 어느 어쥬번트로부터 선택될 수 있으며, 본 발명의 경우, 즉 포유동물 내 면역 반응의 유도를 돕는 경우에 적합하다. 바람직하게 상기 어쥬번트는 TDM, MDP, 무라밀 디펩티드(muramyl dipeptide), 플루로닉(pluronics), 알룸(alum) 용액, 알루미늄 하이드록사이드, ADJUMERTM (폴리포스파젠); 알루미늄 포스페이트 겔; 조류(algae)로부터 글루칸; 알감물린(algammulin); 알루미늄 하이드록사이드 겔(알룸, alum); 고 단백질 흡수 알루미늄 하이드록사이드 겔; 저점도 알루미늄 하이드록사이드 겔; AF 또는 SPT (스쿠알렌의 에멀전(5%), 트윈 80(Tween 80) (0.2%), 플루로닉 L121 (1.25%), 인산염 버퍼 식염수, pH 7.4); AVRIDINETM (프로판디아민); BAY R1005TM (N-(2-디옥시-2-L-류실아미노-b-D-글루코피라노실)-N-옥타데실-도데카노일-아미드 하이드로아세테이트((N-(2-deoxy-2-L-leucylamino-b-D-glucopyranosyl)-N-octadecyl-dodecanoyl-amide hydroacetate); CALCITRIOLTM (1-알파,25-디하이드록시-비타민 D3(1-alpha,25-dihydroxy-vitamin D3)); 칼슘 포스페이트 겔(calcium phosphate gel); CAPTM (칼슘 포스페이트 나노입자); 콜레라 완전독소(cholera holotoxin), 콜레라-독소-A1-단백질-A-D-절편 융합 단백질(cholera-toxin-A1-protein-A-D-fragment fusion protein), 콜레라 독소의 서브유닛 B; CRL 1005 (블록 코폴리머 P1205); 사이토카인 포함 리포좀; DDA (디메틸디옥타데실암모늄 브로마이드(dimethyldioctadecylammonium bromide)); DHEA (디하이드로에피안드로스테론(dehydroepiandrosterone)); DMPC (디미리스토일포스파티딜콜린(dimyristoylphosphatidylcholine)); DMPG (디미리스토일포스파티딜글리세롤(dimyristoylphosphatidylglycerol)); DOC/알룸 복합체(디옥시콜산 소듐 염); 프로인트 완전 어쥬번트(Freund's complete adjuvant); 프로인트 불완전 어쥬번트; 감마 이눌린(gamma inulin); 게르부 어쥬번트(Gerbu adjuvant) (하기의 혼합: i) N-아세틸글루코사미닐-(P1-4)-N-아세틸무라밀-L-알라닐-D-글루타민(N-acetylglucosaminyl-(P1-4)-N-acetylmuramyl-L-alanyl-D-glutamine, GMDP), ii) 디메틸디옥타데실암모늄 클로라이드(dimethyldioctadecylammonium chloride, DDA), iii) 아연-L-프롤린염 복합체(zinc-L-proline salt complex, ZnPro-8); GM-CSF); GMDP (N-아세틸글루코마닐-(b1-4)-N-아세틸무라밀-L-알라닐-D-이소글루타민(N-acetylglucosaminyl-(beta-1-4)-N-acetylmuramyl-L-alanyl-D-isoglutamine)); 이미퀴모드(imiquimod) (1-(2-메티프로필)-1H-이미다조[4,5-c]퀴놀린-4-아민(1-(2-methylpropyl)-1H-imidazo[4,5-c]quinoline-4-amine)); ImmTherTM (N-아세틸글루코사미닐-N-아세틸무라밀-L-Ala-D-isoGlu-L-Ala-글리세롤 디팔미테이트(N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-glycerol dipalmitate)); DRVs (탈수-재수화 소포(vesicles)로부터 제조된 면역리포좀); 인터페론-감마; 인터루킨-1베타; 인터루킨-2; 인터루킨-7; 인터루킨-12; ISCOMSTM; ISCOPREP 7.0.3. TM; 리포좀; LOXORIBINETM (7-알릴-8-옥소구아노신); LT 구강 어쥬번트 (E.coli 불안정한 내독소-독소전구물질); 어느 화합물의 마이크로스피어 및 마이크로파티클; MF59TM; (스쿠알렌-물 에멀전); MONTANIDE ISA 51TM (정제된 불완전 프로인트 어쥬번트); MONTANIDE ISA 720TM (대사 작용 오일 어쥬번트(metabolisable oil adjuvant)); MPLTM (3-Q-데사실-4'-모노포스포릴 지질 A(3-Q-desacyl-4'-monophosphoryl lipid A)); MTP-PE 및 MTP-PE 리포좀 ((N-아세틸-L-알라닐-D-이소글루타미닐-L-알라닌-2-(1,2-디팔미토일-sn-글리세로-3-(하이드록시포스포릴옥시))-에틸아미드, 모노소듐염); MURAMETIDETM (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINETM 및 D-MURAPALMITINETM (Nac-Mur-L-Thr-D-isoGIn-sn-글리세롤디팔미토일); NAGO (뉴라미니다제-갈락토스 옥시다제); 어느 조성물의 나노스피어 또는 나노파티클; NISVs (비이온성 계면활성제 비히클); PLEURANTM (베타-글루칸); PLGA, PGA 및 PLA (젖산 및 글리콜산의 호모- 및 코-폴리머; 마이크로스피어/나노스피어); PLURONIC L121TM; PMMA (폴리메틸 메타크릴레이트); PODDSTM (프로테이노이드 마이크로스피어); 폴리에틸렌 카바메이트 유도체; 폴리-rA: 폴리-rU (폴리아데닐산-폴리우리딜산 복합체); 폴리소르베이트 80 (트윈 80); 단백질 코클레이트(protein cochleates) (Avanti Polar Lipids, Inc., Alabaster, AL); STIMULONTM (QS-21); 큐일-A(Quil-A) (Quil-A 사포닌); S-28463 (4-아미노-옥텍-디메틸-2-에톡시메틸-1H-이미다조[4,5 c]퀴놀린-1-에탄올(4-amino-otec-dimethyl-2-ethoxymethyl-1H-imidazo[4,5 c]quinoline-1-ethanol)); SAF-1TM ("신텍스 어쥬번트 제형(Syntex adjuvant formulation)"); 센다이 프로테오리포좀(Sendai proteoliposomes) 및 센다이 포함 지질 기질; 스판-85(Span-85) (소르비탄 트리올레이트(sorbitan trioleate)); Specol (Marcol 52, Span 85 및 Tween 85의 현탁액); 스쿠알렌 또는 Robane® (2,6,10,15,19,23-헥사메틸테트라코산 및 2,6,10,15,19,23-헥사메틸-2,6,10,14,18,22-테트라코사헥산); 스테아릴티로신(stearyltyrosine) (옥타데실티로신 하이드로클로라이드); 테라미드(Theramid)® (N-아세틸글루코사미닐-N-아세틸무라밀-L-Ala-D-isoGlu-L-Ala-디팔미톡시프로필아미드(N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-dipalmitoxypropylamide)); 테로닐-MDP(Theronyl-MDP) (터머티드TM(TermurtideTM) 또는 [thr 1]-MDP; N-아세틸무라밀-L-트레오닐-D-이소글루타민); Ty 입자 (Ty-VLPs 또는 바이러스 유사 입자); 워터-리드 리포좀(Walter-Reed liposomes) (알루미늄 하이드록사이드에 흡수된 지질 A를 포함하는 리포좀), 및 Pam3Cys, 특히 어쥬-포스(Adju-phos), 올하이드로겔(Alhydrogel), 리하이드라겔(Rehydragel)과 같은 알루미늄 염을 포함하는 리포펩타이드; CFA, SAF, IFA, MF59, 프로박스(Provax), 티터맥스(TiterMax), 몬타니드(Montanide), 백스펙틴(Vaxfectin)을 포함하는 에멀전; 옵티박스(Optivax) (CRL1005), L121, 폴로악스머4010(Poloaxmer4010)) 등을 포함하는 코폴리머; 스텔스(Stealth)를 포함하는 리포좀, BIORAL을 포함하는 코클레이트; QS21, 큐일 A(Quil A), 이스코매트릭스(Iscomatrix), ISCOM을 포함하는 식물 유도된 어쥬번트; 토마틴(Tomatine), PLG, PMM, 이눌린을 포함하는 바이오폴리머를 포함하는 공동 자극(costimulation)에 적합한 어쥬번트; 로물티드(Romurtide), DETOX, MPL, CWS, 만노스(Mannose), CpG 핵산 서열, CpG7909, 인간 TLR 1-10의 리간드, 쥣과의 TLR 1-13 리간드, ISS-1018, IC31, 이미다조퀴놀린, 암플리겐(Ampligen), Ribi529, 이목신(IMOxine), IRIVs, VLPs, 콜레라 독소, 열내성 독소, Pam3Cys, 플라겔린(Flagellin), GPI 앵커(anchor), LNFPIII/Lewis X, 항미생물 펩타이드, UC-1V150, RSV 융합 단백질, cdiGMP를 포함하는 미생물 유도된 어쥬번트; 및 CGRP 뉴로펩타이드를 포함하는 길항제로 적합한 어쥬번트로 이루어진 군으로부터 선택될 수 있으나, 이에 제한되지 않는다.

적절한 어쥬번트는 또한 양이온성 또는 다가양이온성 화합물로부터 선택될 수 있으며, 상기 어쥬번트는 바람직하게 양이온성 또는 다가양이온성 화합물과 함께 약학적 조성물의 인공 핵산 분자 또는 벡터를 혼합하여 제조된다. 본 발명에 정의된 양이온성 또는 다가양이온성 화합물과 인공 핵산 분자 또는 약학적 조성물의 벡터를 회합(association) 또는 혼합(complexing)은 바람직하게 어쥬번트 특성을 제공하고 약학적 조성물의 인공 핵산 분자 또는 벡터를 안정화시키는 효과를 부여한다. 특히 바람직하게, 이러한 양이온성 또는 다가양이온성 화합물은 프로타민, 뉴클레올린, 스페르민 또는 스페르미딘을 포함하는 양이온성 또는 다가양이온성 펩타이드 또는 단백질, 또는 폴리-L-라이신 (PLL), 폴리-아르기닌, 염기성 폴리펩타이드, 세포 투과 펩타이드(CPPs), HIV-결합 펩타이드, Tat, HIV-1 Tat (HIV), Tat-유도된 펩타이드, 페네트라틴, VP22 유도된 또는 유사체 펩타이드, HSV VP22 (단순 포진), MAP, KALA 또는 단백질 이송 도메인 (PTDs, PpT620, 프롤린-풍부 펩타이드, 아르기닌 풍부 펩타이드, 리신-풍부 펩타이드, MPG-펩타이드(들), Pep-1, L-올리고머, 칼시토닌 펩타이드(들), 안테나페디아(Antennapedia)-유도된 펩타이드 (특히 초파리(Drosophila antennapedia)로부터), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24, SynB, SynB(1), pVEC, hCT-유도된 펩타이드, SAP, 프로타민, 스페르민, 스페르미딘, 또는 히스톤을 포함하는 것과 같은 다른 양이온성 펩타이드 또는 단백질로부터 선택된다. 더욱 바람직한 양이온성 또는 다가양이온성 화합물은 양이온성 폴리사카라이드, 예를 들어 키토산, 폴리브렌(polybrene), 양이온성 폴리머, 예를 들어 폴리에틸렌이민 (PEI), 양이온성 지질, 예를 들어 DOTMA: 1-(2,3-시올레일옥시)프로필) -N,N,N-트리메틸암모늄 클로라이드, DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민, DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스페르민, DIMRI: 디미리스토-옥시프로필 디메틸 하이드록시에틸 암모늄 브로마이드, DOTAP: 디올레일옥시-3-(트리메틸암모니오)프로판, DC-6-14: O,O-디테트라데카노일-N-( -트리메틸암모니오아세틸)디에탄올아민 클로라이드, CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-하이드록시에틸)]-디메틸암모늄 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]-트리메틸암모늄, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시숙시닐옥시)에틸]-트리메틸암모늄, 올리고펙타민, 또는 양이온성 또는 다가양이온성 폴리머, 예를 들어 -아미노산-폴리머 또는 역전된 폴리아미드 등과 같은 변형된 폴리아미노산, PVP(폴리(N-에틸-4-비닐피리디늄 브로마이드)) 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)) 등과 같은 변형된 아크릴레이트, pAMAM(폴리(아미도아민)) 등과 같은 변형된 아미도아민, 디아민 및 변형된 1,4 부탄디올 디아크릴레이트-코-5-아미노-1-펜타놀 폴리머 등과 같은 변형된 폴리베타아미노에스터(PBAE), 폴리프로필아민 덴드리머 또는 pAMAM 기초의 덴드리머 등과 같은 덴드리머, PEI: 폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 사이클로덱스트린 기초의 폴리머, 덱스트란 기초의 폴리머, 키토산 등과 같은 폴리아릴아민, 당 백본 기초의 폴리머, PMOXA-PDMS 코폴리머 등과 같은 실란 백본 기초의 폴리머, 하나 또는 그 이상의 양이온성 블록(예를 들어 상기 언급된 양이온성 폴리머로부터 선택된) 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜)의 조합으로 이루어진 블록폴리머 등을 포함할 수 있다.

추가적으로, 조성물의 인공 핵산 분자 또는 벡터, 바람직하게 RNA를 혼합함으로써 어쥬번트로 사용될 수 있는, 바람직한 양이온성 또는 다가양이온성 단백질 또는 펩타이드는 하기 전체 화학식 (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x를 갖는 하기 단백질 또는 펩타이드로부터 선택될 수 있으며, Arg, Lys, His 및 Orn의 총 함량이 올리고펩타이드의 전체 아미노산의 적어도 50%를 나타내는 경우, 상기 l + m + n + o + x = 8-15이며, l, m, n 또는 o는 서로 독립적으로 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15로부터 선택된 어느 수일 수 있고; Xaa는 Arg, Lys, His 또는 Orn을 제외한 천연(=자연적으로 발생) 또는 비-천연 아미노산으로부터 선택된 어느 아미노산일 수 있으며; Xaa의 총 함량이 올리고펩타이드의 전체 아미노산의 50%를 초과하지 않는 경우, X는 0, 1, 2, 3 또는 4로부터 선택된 어느 수일 수 있다. 본 발명에 있어서 특히 바람직한 올리고아르기닌은 예를 들어 Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R 등이다.

양이온성 또는 다가양이온성 화합물 대비 인공 핵산 또는 벡터의 비율은 전체 핵산 복합체의 질소/인 비율(N/P-비율)을 기초로 계산될 수 있다. 예를 들어, RNA가 염기의 통계적 분포를 보인다면, 1 ㎍ RNA는 전형적으로 약 3 nmol 포스페이트 잔기를 포함한다. 추가로, 1 ㎍ 펩타이드는 염기성 아미노산의 분자량 및 수에 의존하여, 전형적으로 약 x nmol 질소 잔기를 포함한다. (Arg)9(분자량 1424g/mol, 9개 질소 원자)에 대하여 예시적으로 계산할 때, 1 ㎍ (Arg)9은 약 700 pmol (Arg)9, 따라서 700 x 9=6300 pmol 염기성 아미노산 = 6.3 nmol 질소 원자를 포함한다. 약 1:1 RNA/(Arg)9의 질량비에 대하여 약 2의 N/P 비율이 계산될 수 있다. 2 ㎍ RNA과 함께 약 2:1의 질량비를 갖는 프로타민(연어로부터 프로타민이 사용될 때, 분자량 약 4250 g/mol, 21개 질소 원자)에 대하여 예시적으로 계산할 때, 6 nmol 포스페이트는 RNA에 대하여 계산될 수 있다; 1 ㎍ 프로타민은 약 235 pmol 프로타민 분자 및 따라서 235 x 21 = 4935 pmol 염기성 질소 원자 = 4.9 nmol 질소 원자를 포함한다. 약 2:1 RNA/프로타민의 질량비에 대하여 약 0.81의 N/P 비율이 계산될 수 있다. 약 8:1 RNA/프로타민의 질량비에 대하여 약 0.2의 N/P 비율이 계산될 수 있다. 본 발명의 맥락에서, N/P-비율은 복합체 내 핵산:펩타이드의 비율에 관하여, 바람직하게 약 0.1-10의 범위, 바람직하게 0.3-4의 범위, 및 가장 바람직하게 약 0.5-2 또는 0.7-2의 범위, 가장 바람직하게 약 0.7-1.5의 범위이다.

이의 공개가 본 발명에 참고문헌으로 병합된 특허출원 WO2010/037539는 면역자극성 조성물 및 면역자극성 조성물의 제조를 위한 방법을 개시한다. 그에 따라, 상기 발명의 바람직한 실시예에서, 상기 조성물은 상기 발명에 따른 인공 핵산 분자의 충분한 면역자극성 효과 및 효과적인 번역 모두를 얻기 위해, 분리된 두 단계로 수득된다. 이에, 소위 "어쥬번트 조성물"은 - 첫번째 단계 - 안정한 복합체를 형성하기 위해 특정한 비율로 양이온성 또는 다가 양이온성 화합물과 함게 어쥬번트 구성요소의 인공 핵산 분자 또는 벡터, 바람직하게 RNA를 혼합함으로써 제조된다. 이러한 맥락에서, 자유 양이온성 또는 다가양이온성 화합물이 없거나 또는 오직 무시할 수 있는 소량만이 핵산의 혼합 이후 어쥬번트 구성 요소에 남아 있는 것이 중요하다. 따라서, 어쥬번트 구성 요소 내 핵산 및 양이온성 또는 다가양이온성 화합물의 비율은 핵산이 완전히 혼합되고 자유 양이온성 또는 다가양이온성 화합물이 없거나 또는 오직 무시할 만한 소량으로 조성물 내 남아있는 범위 내에서 전형적으로 선택된다. 어쥬번트 구성 요소의 바람직한 범위, 즉 양이온성 또는 다가양이온성 화합물 대비 핵산의 비율은 약 6:1(w/w) 내지 약 0,25:1(w/w), 더욱 바람직하게 약 5:1(w/w) 내지 약 0,5:1(w/w), 더욱 더 바람직하게 약 4:1(w/w) 내지 약 1:1(w/w) 또는 약 3:1(w/w) 내지 약 1:1(w/w), 및 가장 바람직하게 약 3:1(w/w) 내지 약 2:1(w/w)의 비율의 범위로부터 선택된다.

바람직한 실시예에 따르면, 본 발명에 따른 인공 핵산 분자 또는 벡터, 바람직하게 RNA 분자는 본 발명의 (면역자극성) 조성물을 형성하기 위해 어쥬번트 구성 요소의 혼합된 핵산 분자, 바람직한 RNA에 두번째 단계에 첨가된다. 이에 따라, 본 발명의 인공 산 분자 또는 벡터, 바람직하게 RNA는 자유 핵산, 즉 다른 화합물과 혼합되지 않는 핵산으로서 첨가된다. 첨가 전, 자유 인공 핵산 분자 또는 벡터는 혼합되지 않으며, 바람직하게 어쥬번트 구성 요소의 첨가에 따른 검출 가능한 또는 현저한 어느 혼합 반응을 수행하지 않는다.

적절한 어쥬번트는 나아가 화학식 (II): GlXmGn을 갖는 핵산으로부터 선택될 수 있으며, 상기: G는 구아노신, 우라실 또는 구아노신 또는 우라실의 유사체이며; X는 구아노신, 우라실, 아데노신, 티미딘, 시토신 또는 상기 뉴클레오티드의 유사체이며; l은 1 내지 40의 정수이며, 상기 l=1일 때 G는 구아노신 또는 이의 유사체이며, l>1일 때 뉴클레오티드의 적어도 50%는 구아노신 또는 이의 유사체이며; m은 정수이며 적어도 3이며; 상기 m=3일 때 X는 우라실 또는 이의 유사체이며, 상기 m>3일 때 적어도 3개 연속적인 우라실 또는 우라실의 유도체가 발생하며; n은 1 내지 40의 정수이며, 상기 n=1일 때 G는 구아노신 또는 이의 유사체이며, n>1일 때 적어도 50%의 뉴클레오티드는 구아노신 또는 이의 유사체이다.

다른 적절한 어쥬번트는 나아가 화학식 (III): ClXmCn을 갖는 핵산으로부터 선택될 수 있으며, 상기: C는 시토신, 우라실 또는 시토신 또는 우라실의 유사체이며; X는 구아노신, 우라실, 아데노신, 티미딘, 시토신 또는 상기 뉴클레오티드의 유사체이며; l은 1 내지 40의 정수이며, 상기 l=1일 때 C는 시토신 또는 이의 유사체이며, 상기 l>1일 때 적어도 50%의 뉴클레오티드는 시토신 또는 이의 유사체이며; m은 정수이며 적어도 3이며; 상기 m=3일 때 X는 우라실 또는 이의 유사체이며, 상기 m>3일 때 적어도 3개 연속적인 우라실 또는 우라실의 유사체가 발생하며; n은 1 내지 40의 정수이며, 상기 n=1일 때 C는 시토신 또는 이의 유사체이며, 상기 n>1일 때 적어도 50%의 뉴클레오티드는 시토신 또는 이의 유사체이다.

본 발명에 따르는 약학적 조성물은 바람직하게는 약학적 조성물의, 특히 본 발명에 정의된 본 발명의 인공 핵산 분자, 벡터 및/또는 세포의 구성 성분의 "안전하고 유효한 양"을 포함한다. 본 발명에 사용된 "안전하고 유효한 양"은 본 발명에 정의된 질병 또는 질환의 긍정적 변형을 현저하게 유도하는 충분한 양을 의미한다. 동시에 그러나 "안정하고 효과적인 양"은 바람직하게는 심각한 부작용을 회피하며 장점 및 위험 사이의 민감한 관계를 허용한다. 이들 한계의 결정은 전형적으로 민감한 의학적 판단 내에 있다.

추가적 양태에서, 본 발명은 의약품(medicament)으로서, 예를 들어 백신(유전자적 백신 접종) 또는 유전자 치료에서, 사용을 위한, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 치료적 행동의 사용 또는 펩타이드, 폴리펩타이드 또는 단백질의 효과를 만드는 어느 의학적 적용에, 또는 특정한 펩타이드 또는 단백질의 보충이 필요한 곳에 특히 적절하다. 따라서 본 발명은 펩타이드, 폴리펩타이드 또는 단백질의 치료적 행동 또는 효과에 의해 치료할 수 있거나 특정한 펩타이드, 폴리펩타이드 또는 단백질의 보충에 의해 치료할 수 있는 질병 또는 질환의 치료 또는 예방에 사용을 위해 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다. 예를 들어 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 유전적 질병, 자가면역 질병, 암 또는 종양 관련된 질병, 감염성 질병, 만성 질병 또는 그와 같은 것, 예를 들어 유전적 백신 접종 또는 유전자 치료에 의한 것에 의해 치료 또는 예방을 위해 사용될 수 있다.

특히 치료되는 개체에 치료적 펩타이드, 폴리펩타이드 또는 단백질의 증가되고 연장된 존재로부터 유익한 이러한 치료(therapeutic treatments)는, 본 발명의 3'-UTR 요소가 본 발명의 인공 핵산 분자 또는 벡터의 부호화된 펩타이드 또는 단백질의 안정하고 연장된 발현을 제공하고 및/또는 본 발명의 5'-UTR 요소가 본 발명의 인공 핵산 분자 또는 벡터의 부호화된 펩타이드 또는 단백질의 증가된 발현을 제공하기 때문에, 본 발명의 맥락에서 의학적 적용으로 특히 적절하다. 따라서 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 본 발명에 따르는 약학적 조성물의 특히 적절한 의학적 적용은 백신 접종이다. 따라서 본 발명은 개체, 바람직하게 포유동물 개체, 더욱 바람직하게 인간 개체의 백신 접종을 위한, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다. 바람직한 백신 접종 치료는 박테리아, 원생동물 또는 바이러스 감염과 같은 감염성 질병에 대한 백신 접종 및 항 종양 백신 접종이다. 이러한 백신 접종 치료는 예방을 위한 것 또는 치료를 위한 것일 수 있다.

치료 또는 예방되는 질병에 의존하여 ORF는 선택될 수 있다. 예를 들어 오픈 리딩 프레임은 유전적 질병을 겪는 환자와 같이, 단백질의 기능의 전체 부족 또는 적어도 부분적 결실을 겪는 환자에게 공급되는 단백질에 대해 코딩할 수 있다. 추가적으로 오픈 리딩 프레임은 개체의 질병 또는 상태에 유익하게 영향을 주는 펩타이드 또는 단백질을 코딩하는 ORF로부터 선택될 수 있다. 나아가 오픈 리딩 프레임은 천연 펩타이드 또는 단백질의 병리학적 과생산의 하향-조절 또는 단백질 또는 펩타이드를 병리학적으로 발현하는 세포의 제거에 영향을 주는 펩타이드 또는 단백질을 코딩할 수 있다. 이러한 기능 또는 과생산의 부족, 상실은 예를 들어 종양 및 종양 형성(neoplasia), 자가면역 질병, 알러지, 감염, 만성 질환 또는 이와 유사한 것의 맥락에서 발생할 수 있다. 나아가 오픈 리딩 프레임은 항원 또는 면역원, 예를 들어 병원체의 에피토프에 대한 또는 종양 항원에 대한 것을 코딩할 수 있다. 따라서 바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자 또는 벡터는 항원 또는 면역원, 예를 들어 병원체의 에피토프 또는 종양 관련된 항원, 상기 설명된 3'-UTR 요소 및/또는 상기 설명된 5'-UTR 요소, 및 폴리(A) 서열 등과 같은 선택적인 추가 구성 요소를 포함하거나 이로 구성된 아미노산 서열을 코딩하는 ORF를 포함한다.

의학적 적용의 맥락에서, 특히 백신 접종의 맥락에서, DNA는 항-DNA 면역 반응을 유도하는 위험을 가지며 유전체 DNA에 삽입되려는 경향이 있으므로, 본 발명에 따르는 인공 핵산 분자는 RNA, 바람직하게는 mRNA인 것이 바람직하다. 그러나 일부 실시예에서, 예를 들어 만약 아데노바이러스 전달 비히클과 같은, 바이러스 전달 비히클이 본 발명에 따르는 인공 핵산 분자 또는 벡터의 전달을 위해 사용된다면, 예를 들어 유전자 치료의 맥락에서, 인공 핵산 분자 또는 벡터가 DNA 분자인 것이 바람직할 수 있다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 경구적으로, 비경구적으로, 흡입 스프레이에 의해, 국소적으로, 직장으로, 비강으로, 구강으로, 질로 또는 이식된 병원소(implanted reservoir)를 통해 또는 제트 인젝션(jet injection)을 통해 투여될 수 있다. 본 발명에 사용된 용어 비경구적은 피하, 정맥내, 근육내, 관절내, 활액내(intra-synovial), 흉골내, 척추강내, 간장내, 병소내, 두개내, 경피내, 피내, 폐내(intrapulmonal), 복강내, 심장 내, 동맥내, 및 설하 주사 또는 투입(infusion) 기술을 포함한다. 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자, 본 발명에 따른 벡터, 본 발명에 따른 세포, 또는 본 발명에 따른 약학적 조성물은 무바늘 주사(예를 들어 제트 인젝션)를 통해 투여된다.

바람직하게는 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 비경구적으로, 예를 들어 비경구적 주사에 의해, 더욱 바람직하게는 피하, 정맥내, 근육내, 관절내, 활액내, 흉골내, 척추강내, 간장내, 병소내, 두개내, 경피내, 피내, 폐내, 복강내, 심장내, 동맥내, 및 설하 주사 또는 투입 기술에 의해 투여된다. 특히 바람직한 것은 피내 및 근육내 주사이다. 독창적 약학적 조성물의 살균 주사가능한 형태는 수용성 또는 유성 현탁액일 수 있다. 이들 현탁액은 적절한 분산 또는 습윤제 및 현탁제를 사용하여 기술분야에 알려진 기술에 따라 제조될 수 있다. 바람직하게, 상기 용액 또는 현탁액은 무바늘 주사(예를 들어 제트 인젝션)를 통해 투여된다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 또한 캡슐, 정제, 수용성 현탁액 또는 용액을 포함하나, 이에 제한되지 않고, 어느 구두로 허용 가능한 투여 형태로 구두로(orally) 투여될 수 있다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 또한, 특히 치료의 목표가 국소적 처리에 의해 용이하게 접근 가능한 지역(areas) 또는 기관, 예를 들어 피부의 또는 어느 다른 접근 가능한 상피 조직의 질병을 포함하는 것을 포함할 때 국소적으로 투여될 수 있다. 적절한 국소적 제형은 이들 지역 또는 기관의 각각에 대해 용이하게 제조될 수 있다. 국소적 적용을 위해, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 하나 또는 그 이상의 담체에 현탁 또는 용해된 적절한 연고로 제조될 수 있다.

일 실시예에서, 의약품으로서 사용은 포유동물 세포의 형질전환의 단계, 바람직하게는 포유동물 세포의 인비트로(in vitro) 또는 엑스비보(ex vivo) 형질전환, 더욱 바람직하게는 의약품에 의해 치료될 개체의 분리된 세포의 인비트로 형질전환을 포함한다. 만약 사용이 분리된 세포의 인비트로 형질전환을 포함한다면, 의약품으로서 사용은 환자에 형질전환된 세포의 재투여를 추가적으로 포함할 수 있다. 의약품으로서 본 발명의 인공 핵산 분자 또는 벡터의 사용은 성공적으로 형질전환된 분리된 세포의 선별의 단계를 추가로 포함할 수 있다. 따라서, 만약 벡터가 선별 마커를 추가적으로 포함하는 경우 유익할 수 있다. 또한 의약품으로서 사용은 분리된 세포의 인비트로 형질전환 및 발현 생산물, 즉 이들 세포로부터 코딩된 펩타이드 또는 단백질의 정제를 포함할 수 있다. 이들 정제된 펩타이드 또는 단백질은 차후에 이것이 필요한 개체에 투여될 수 있다.

본 발명은 또한 이것이 필요한 개체에 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 투여하는 것을 포함하는 상기 설명된 질병 또는 질환을 치료 또는 예방하는 방법을 제공한다.

나아가, 본 발명은 본 발명에 따른 인공 핵산 분자와 함께 세포의 형질전환을 포함하는 질병 또는 질환을 치료 또는 예방하는 방법을 제공한다. 상기 형질전환은 인비트로, 엑스비보 또는 인비보에서 수행될 수 있다. 바람직한 실시예에서, 세포의 형질전환은 인비트로 수행되며 형질전환된 세포는 이것이 필요한 개체에, 바람직하게는 인간 환자에 투여된다. 바람직하게는 인비트로 형질전환되는 세포는 개체, 바람직하게는 인간 환자의 분리된 세포이다. 따라서 본 발명은 개체로부터, 바람직하게는 인간 환자로부터 세포를 분리하는 단계, 본 발명에 따르는 인공 핵산 또는 본 발명에 따르는 벡터로 분리된 세포를 형질전환 하는 단계, 및 개체, 바람직하게는 인간 환자에 형질전환된 세포를 투여하는 단계를 포함하는 치료 방법을 제공한다.

본 발명에 따르는 질환을 치료 또는 예방하는 방법은 바람직하게 상기 설명된 백신 접종 방법 또는 유전자 치료 방법이다.

상기 설명된 것처럼, 본 발명의 3'-UTR 요소 및/또는 본 발명의 5'-UTR 요소는 mRNA로부터 단백질 생산을 연장 및/또는 증가시킬 수 있다. 따라서, 추가적 양태에서, 본 발명은 인공 핵산 분자로부터, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증가 및/또는 연장시키는 방법에 관한 것이며, 상기 방법은 3'-UTR 요소 및/또는 5'-UTR 요소와 함께 오픈 리딩 프레임과 결합(associating)하는 단계를 포함하며, 상기 3'-UTR 요소 및/또는 5'-UTR 요소는 생성 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 상기 설명된 본 발명에 따른 인공 핵산 분자, 바람직하게 mRNA 분자 또는 상기 설명된 본 발명에 따른 벡터를 수득하기 위해, 안정한 mRNA로부터 유도된다.

바람직하게, 본 발명에 따른 인공 핵산 분자로부터, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증가 및/또는 연장시키는 방법에서 3'-UTR 요소 및/또는 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5,NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹; 바람직하게 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-Box 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

본 발명의 맥락에서 용어 "3'-UTR 요소 및/또는 5'-UTR 요소와 인공 핵산 분자 또는 벡터를 결합(associating)"은 바람직하게 3'-UTR 요소 및/또는 5'-UTR 요소와 인공 핵산 분자 또는 벡터를 기능적으로 결합(associating) 또는 기능적으로 조합(combining)하는 것을 의미한다. 이는 인공 핵산 분자 또는 벡터 및 3'-UTR 및/또는 5'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소 및/또는 5'-UTR 요소는 3'-UTR 요소 및/또는 5'-UTR 요소의 기능, 예를 들어 RNA 및/또는 단백질 생산 연장 및/또는 증가 기능이 수행되도록 결합 또는 짝지어짐을 의미한다. 전형적으로, 이는 3'-UTR 요소 및/또는 5'-UTR 요소가 오픈 리딩 프레임에 3' 및/또는 5' 각각에, 바람직하게 오픈 리딩 프레임에 3' 바로 옆에 및/또는 오픈 리딩 프레임에 5' 바로 옆에, 3'-UTR 요소는 바람직하게 오픈 리딩 프레임 및 폴리(A) 서열 또는 폴리아데닐화 신호 사이에 인공 핵산 분자 또는 벡터, 바람직하게 mRNA 분자로 통합됨을 의미한다. 바람직하게, 3'-UTR 요소 및/또는 5'-UTR 요소는 인공 핵산 분자 또는 벡터, 바람직하게 각각 3'-UTR 및/또는 5'-UTR과 같은 mRNA로 통합되며, 즉, 3'-UTR 요소 및/또는 5'-UTR 요소는 인공 핵산 분자 또는 벡터, 바람직하게 mNA의 각각 3'-UTR 및/또는 5'-UTR이며, 즉, 5'-UTR은 ORF의 5'-말단 직전에 끝나며 3'-UTR은 오픈 리딩 프레임의 3'-쪽에서 폴리(A) 서열 또는 폴리아데닐화 신호의 5'-쪽까지 확장하며, 선택적으로 하나 이상의 제한 부위를 포함 또는 이로 이루어진 서열과 같은 짧은 링커를 통해 연결된다. 따라서, 바람직하게, 용어 "3'-UTR 요소 및/또는 5'-UTR 요소와 인공 핵산 분자 또는 벡터의 결합"은 3'-UTR 요소 및/또는 5'-UTR 요소를 인공 핵산 분자 또는 벡터 내, 바람직하게 mRNA 분자 내 오픈 리딩 프레임과 기능적으로 결합시킴을 의미한다. 상기 3'-UTR 및/또는 5'-UTR 및 ORF는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것과 같으며, 예를 들어, 바람직하게 ORF 및 3'-UTR은 이종 기원(heterologous)이며 및/또는 ORF 및 5'-UTR은 각각 이종 기원이며, 예를 들어 상기 설명된 다른 유전자로부터 유도된다.

추가적 양태에서, 본 발명은 인공 핵산 분자로부터, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증가 및/또는 연장시키기 위한 3'-UTR 요소 및/또는 5'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소 및/또는 상기 설명된 5'-UTR 요소의 용도를 제공하며, 상기 3'-UTR 요소 및/또는 5'-UTR 요소는 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (readthrough transcript), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹; 바람직하게 GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)으로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진다.

본 발명에 따른 용도는 바람직하게 상기 설명된 3'-UTR 요소 및/또는 상기 설명된 5'-UTR 요소와 인공 핵산 분자, 벡터, 또는 RNA의 결합을 포함한다.

본 발명의 약학적 조성물의 화합물 및 성분은 또한 각각 분리되어 제조 및 거래될 수 있다. 따라서, 본 발명은 나아가 본 발명에 따른 인공 핵산 분자, 본 발명에 따른 벡터, 본 발명에 따른 세포, 및/또는 본 발명에 따른 약학적 조성물을 포함하는 키트 또는 일부(parts)의 키트에 관한 것이다. 바람직하게, 이러한 키트 또는 일부의 키트는 추가적으로 사용을 위한 지침, 형질전환을 위한 세포, 어쥬번트, 약학적 조성물의 투여를 위한 수단, 약학적으로 허용 가능한 담체 및/또는 인공 핵산 분자, 벡터, 세포 또는 약학적 조성물의 용해 또는 희석을 위한 약학적으로 허용 가능한 용액을 포함할 수 있다.

추가적 양태에서 본 발명은 하기 단계를 포함하는, 안정한 mRNA로부터 유도된 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 방법을 제공한다:

a) 하기 하위 단계를 포함하는 mRNA의 안정성을 분석하는 단계:

i. 상기 mRNA의 붕괴 과정 동안 제1 시점에 상기 mRNA 양의 측정,

ii. 상기 mRNA의 붕괴 과정 동안 제2 시점에 상기 mRNA 양의 측정, 및

iii. (i) 단계에서 측정된 상기 mRNA 양 대비 (ii) 단계에서 측정된 상기 mRNA 양의 비율을 계산;

b) 적어도 0.5(50%), 적어도 0.6(60%), 적어도 0.7(70%), 적어도 0.75(75%), 적어도 0.8(80%), 적어도 0.85(85%), 적어도 0.9(90%), 또는 적어도 0.95(95%)의 하위 단계 (iii)에서 계산된 비율을 갖는 안정한 mRNA를 선택하는 단계; 및

c) 상기 안정한 mRNA의 3'- 및/또는 5'-UTR 요소의 뉴클레오티드 서열을 결정하는 단계.

따라서, mRNA의 안정성은 바람직하게 표준 조건, 예를 들어 사용된 특정한 세포주 또는 세포 유형에 대한 표준 조건(표준 배지, 배양 등) 하에서 평가된다.

mRNA의 안정성을 분석하기 위해, 이러한 mRNA의 붕괴 과정은 상기 mRNA의 붕괴 과정 동안 제1 및 제2 시점에서 상기 mRNA의 양 또는 농도를 측정함으로써 평가된다(단계 a) i. 및 a) ii. 참조).

상기 정의된 인비보 또는 인비트로 RNA 붕괴 과정 동안 mRNA의 양 또는 농도를 측정하기 위해 (즉 인비트로는 특히 살아있는 개체의 조직을 포함하는 ("살아있는") 세포 및/또는 조직을 의미하며; 세포는 특히 세포주, 일차 세포, 조직 또는 개체 내 세포를 포함하며, 바람직한 것은 포유동물 세포, 예를 들어 인간 세포 및 마우스 세포이며 및 특히 바람직한 것은 인간 세포주 HeLa, 및 U-937이며 및 마우스 세포주 NIH3T3, JAWSII 및 L929가 사용되으며; 게다가 일차 세포가 특히 바람직하며, 특히 바람직한 실시예에서 인간 표피 섬유아세포(HDF)), 통상의 기술자에게 알려진 다양한 방법이 사용될 수 있다. 이러한 방법의 비제한적인 예시는 전사의 일반적인 억제, 예를 들어 액티노마이신 D와 같은 전사 억제자와 함께, 일시적 전사를 특이적으로 촉진하는 유도성 프로모터의 용도, 예를 들어 c-fos 혈청 유도성 프로모터 시스템 및 Tet-off 조절 프로모터 시스템, 및 동역학(kinetic) 표지 기술, 예를 들어 펄스(pulse) 표지를 포함한다.

예를 들어, 만약 전사 억제자 조절된 전사 중지가 상기 정의된 인비보 또는 인비트로 RNA 붕괴 동안 mRNA의 양 또는 농도를 측정하기 위해 단계 a)에서 사용된다면, 액티노마이신 D(ActD), 5,6-디클로로-1-D-리보퓨라노실-벤지미다졸(DRB) 또는 -아마니틴(a-Am)과 같은 전사 억제자가 사용될 수 있다. 따라서, mRNA 붕괴를 평가하기 위해 전사 억제자가 일반적으로 세포에 첨가되고, 이에 따라 전사가 일반적으로 억제되고 RNA 붕괴가 진행중인 전사의 간섭 없이 관찰될 수 있다.

그렇지 않으면, 일시적 전사를 특이적으로 촉진하는 유도성 프로모터가 a) 단계에서 사용될 수 있으며, 그 이유는 전사를 활성화시키고 mRNA 합성의 폭발을 유도하는 자극을 제공하고, 이후 전사를 중단시키기 위해 자극을 제거하고 mRNA의 붕괴를 관찰한다. 이로써, 유도성 프로모터는 엄격한 조절을 가능하게 하며, 전사의 유도 및 사일런싱(silencing)이 좁은 시간 내에 달성된다. 포유동물 세포에서, cfos 프로모터는 이러한 목적을 위해 가치있는 것으로 알려져 있으며, 이는 혈청 첨가에 빠르고 일시적으로 반응하여 유도될 수 있고, 이에 따라 전사에서 일시적 폭발을 달성하는 믿을 수 있고 단순한 방법을 제공하기 때문이다. Tet-off 프로모터 시스템은 포유동물 세포 내 mRNA 턴오버(turnover)를 연구하기 위한 전사 펄싱(pulsing) 접근법의 적용을 더욱 넓혀주는 다른 선택을 제공한다.

그러나, 본 발명에서 동역학 표지 기술은 상기 정의된 인비보 또는 인비트로 RNA 붕괴 동안 mRNA의 양을 측정하기 위한 a) 단계에서 바람직하다. 동역학 표지에서 RNA가 보통 표지되며, 표지는 특히 표지된 뉴클레오티드 및 표지된 뉴클레오시드를 포함하며, 표지된 우리딘 및 표지된 우라실이 특히 바람직하다. 바람직한 표지의 예시는 4-티오우리딘 (4sU), 2-티오우리딘, 6-티오구아노신, 5-에티닐우리딘 (EU), 5-브로모-우리딘 (BrU), 비오틴-16-아미노알릴우리딘, 5-아미노알릴우리딘, 5-아미노알릴시티딘 등을 포함하며, 4-티오우리딘 (4sU), 5-에티닐우리딘(EU) 또는 5'-브로모-우리딘(BrU)가 더욱 바람직하다. 특히 바람직한 것은 4-티오우리딘(4sU)이다. 4-티오우리딘(4sU)은 바람직하게 100-500 μM의 농도로 사용된다. 게다가, 또한 방사선 표지된 뉴클레오티드가 예를 들어 우리딘-³H와 함께 사용될 수 있다. 또한 상기 표지된 뉴클레오티드의 조합이 사용될 수 있으며, 4-티오우리딘 및 6-티오구아노신의 조합이 특히 바람직하다.

동역학 표지에서, 보통 방출(emerging) RNA가 예를 들어 전사 동안 표지된 우리딘 또는 우라실의 병합(incorporation)에 의해 표지된다. 잠시 후, 표지의 제공이 중단된 후, 일반적으로 전사를 억제하지 않으면서 특이적으로 표지된 RNA를 평가함으로써 RNA 붕괴가 관찰될 수 있다.

단계 a)에서 RNA 붕괴 과정 동안 mRNA의 양을 측정하기 위해, 펄스 표지가 바람직하며, 펄스-추적 방법이 특히 바람직하다. 본 발명에 사용된, 용어 "펄스 표지는 표지, 예를 들어 상기 설명된 표지가 살아있는 세포 내 화합물의 합성 및/또는 붕괴의 속도를 측정하기 위해 사용되는 기술을 의미한다. 일반적으로, 세포는 짧은 기간 동안 소량의 표지에 노출되므로, '펄스'라는 용어가 사용된다. 펄스 추적 방법에서, 펄스-표지 후 보통 훨씬 많은 양의 "펄스"에 상응하는 비표지된 화합물(예를 들어 만약 표지된 우리딘이 펄스로 사용되는 경우 비표지된 우리딘)이 표지에 필요한 노출 기간 이후 첨가된다. 표지된 화합물 및 비표지된 화합물 사이의 경쟁 효과는 표지된 화합물의 추가 흡수를 무시할 수준으로 줄이는 것이며, 따라서 "추적"이라는 용어를 사용한다.

mRNA의 양 또는 농도를 측정하기 위해 보통 mRNA를 분리해야 한다. RNA의 분리를 위한 다른 기술, 예를 들어 구아니디니움 티오시아네이트 페놀-클로로폼 추출을 통해 또는 실리카-칼럼 기초의 추출을 통한 것은 통상의 기술자에게 알려져 있다. 또한 시판중인 키트, 예를 들어 Qiagen의 RNeasy 키트 사용 가능하다.

게다가, 특히 만약 동역학 표지가 사용되는 경우, 추출 단계가 필요할 수 있다 (전사 억제자와 대비하여, 상기 총 RNA는 "붕괴하고 있는" RNA를 나타내며, 전사가 일반적으로 억제되기 때문이다). 추출 단계에서, 표지된 RNA (즉 "붕괴하고 있는" RNA를 나타내는)는 총 분리된 RNA로부터 추출된다. 따라서, 추출 수단은 사용된 표지에 따라 선택될 수 있다. 예를 들어 표지에 항체와 함께 면역정제(immunopurification)가 사용될 수 있다.

게다가, 예를 들어, 티오(thio)-표지된 것의 추출을 위해, 예를 들어 4-티오우리딘(4sU)-표지된, RNA, HPDP-비오틴(피리딜디티올-활성화된, 분해(가역성) 이황화 결합을 통해 결합하는 설프히드릴-반응 비오티닐화 시약)이 분리된 "총 RNA"와 함께 배양될 수 있다. 이 시약은 구체적으로 가역성 이황화 결합을 형성하기 위해 4-티오우리딘(4sU)-표지된 RNA에서 감소된 티올(-SH)와 구체적으로 반응한다. 비오티닐화는 스트립타비딘에 티오-표지된 것, 예를 들어 4-티오우리딘(4sU)-표지된 RNA를 결합시키고, 이에 따라 디티오트레이톨(dithiothreitol) 또는 베타-메르캅토에탄올(또는 어느 다른 환원제)로 이황화 결합을 감소(reduction)시킴으로써 총 RNA로부터 추출될 수 있다.

비오틴-표지된 뉴클레오티드의 경우, 예를 들어 비오틴-16-아미노알릴우리딘, 스트렙타비딘은 직접적으로 총 RNA로부터 표지된 RNA를 추출하는데 사용될 수 있다.

예를 들어, 총 RNA로부터 새롭게 전사된 5-에티닐우리딘(EU)-표지된 세포 RNA의 추출을 위해, 구리-촉매된 시클로첨가(cycloaddition) 반응 내 EU의 비오티닐화(보통 클릭(click) 화학으로 언급됨)가 사용될 수 있으며, 이후 스트렙타비딘 친화성에 의한 정제가 따른다. 이 방법은 Click-iT Nascent RNA Capture Kit (Catalog no. C10365, Invitrogen)로 시판중이다. 이 키트의 제조자의 지시는 펄스 표지 시간을 0.5 mM EU 투여량에 대해 30 내지 60분, 또는 0.1 또는 0.2 mM EU 투여량에 대해 1 내지 24시간으로 추천한다.

예를 들어, BrU-표지된 RNA 분자는 항-브로모디옥시우리딘 항체(예를 들어 Clone. 2B1,Catalog no. MI-11-3, MBL), 및 단백질 G 세파로스(Protein G Sepharose)와 함께 면역정제를 통해 추출될 수 있다.

mRNA의 양 또는 농도, 즉 전사체 수준은 이후 기술분야의 통상의 기술자에게 알려진 다양한 방법을 통해 측정될 수 있다. 이러한 방법의 비-제한적 예시는 마이크로어레이 분석, 노던블롯 분석, 정량적 PCR 또는 차세대 시퀀싱(하이 스루풋(high throughput) 시퀀싱)을 포함한다. 특히 바람직한 것은 마이크로어레이 분석 및 차세대 시퀀싱이다. 게다가, 전체-유전체 접근법/전체 전사체 접근법, 예를 들어 마이크로어레이 분석에서 전체 유전체 마이크로어레이 분석, 예를 들어 Affymetrix Human Gene 1.0 ST 또는 2.0 ST 또는 Affymetrix Mouse Gene 1.0 ST 또는 2.0 ST 또는 차세대 시퀀싱을 통한 전체 전사체 분석이 특히 바람직하다.

a) 단계의 하위 단계 i. 및 ii.에서, mRNA의 양은 mRNA의 붕괴 과정 동안 제1 시점 및 제2시점에서 측정된다. 일반적으로, 이는 mRNA가 특히 각각의 양을 측정하기 위해 mRNA의 붕괴 과정 동안 제1시점 및 제2시점에서 분리됨을 의미한다. 따라서, "제1시점" 및 "제2시점"은 RNA 양을 측정하기 위해 RNA가 분리되는, RNA 붕괴 과정 동안의 특정한 시점이다. 보통 "제2시점"은 "제1시점"에 비해 RNA 붕괴 과정에서 이후이다.

바람직하게, 제1시점은 오직 붕괴 과정을 겪고 있는 mRNA만이 고려되도록, 즉 새로 생기는(emerging) mRNA - 예를 들어 전사 진행 중인 - 는 제외하도록 선택된다. 예를 들어, 만약 동역학 표지 기술, 예를 들어 펄스 표지가 사용된다면, 제1시점은 바람직하게 mRNA로 표지의 병합이 완성되도록, 즉 mRNA로 표지의 지속적인 병합이 일어나지 않도록 선택된다. 따라서, 만약 동역학 표지가 사용된다면, 제1시점은 실험적 표지 절차의 종료 이후 적어도 10분, 적어도 20분, 적어도 30분, 적어도 40분, 적어도 50분, 적어도 60분, 적어도 70분, 적어도 80분, 또는 적어도 90분, 예를 들어 표지와 함께 세포의 배양 종료 이후일 수 있다.

예를 들어, 상기 제1시점은 바람직하게 전사 중지, 유도성 프로모터의 경우 프로모터 유도의 중단 이후 또는 펄스 또는 표지 공급의 중단 이후, 예를 들어 표지의 중단 이후, 0 내지 6시간일 수 있다. 더욱 바람직하게, 상기 제1시점은 전사의 중지 이후(예를 들어 전사 억제자에 의해), 유도성 프로모터의 경우 프로모터 유도의 중단 또는 펄스 또는 표지 공급의 중단 이후, 예를 들어 표지의 중단 이후, 30분 내지 5시간, 더욱 더 바람직하게 1시간 내지 4시간 및 특히 바람직하게 약 3시간일 수 있다.

바람직하게, 제2시점은 mRNA 붕괴 과정 동안 가능한 늦게 선택된다. 그러나, 만약 다수의 mRNA 종이 고려된다면, 상기 제2시점은 바람직하게 다수의 mRNA 종의 여전히 상당한 양, 바람직하게 적어도 10%의 mRNA 종이 검출 가능한 양, 즉 0 초과의 양으로 존재하도록 선택된다. 바람직하게, 상기 제2시점은 전사의 중지 이후(예를 들어 전사 억제자에 의해), 유도성 프로모터의 경우 프로모터 유도의 중단 또는 펄스 또는 표지 공급의 중단 이후, 예를 들어 표지의 종결 이후 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 11시간, 적어도 12시간, 적어도 13시간, 적어도 14시간, 또는 적어도 15시간이다.

예를 들어, 상기 제2시점은 바람직하게 전사의 중지 이후(예를 들어 전사 억제자에 의해), 유도성 프로모터의 경우 프로모터 유도의 중단 또는 펄스 또는 표지 공급의 중단 이후, 예를 들어 표지의 종결 이후, 3 내지 48시간일 수 있다. 더욱 바람직하게, 상기 제2시점은 전사의 중지 이후(예를 들어 전사 억제자에 의해), 유도성 프로모터의 경우 프로모터 유도의 중단 또는 펄스 또는 표지 공급의 중단 이후, 예를 들어 표지의 종결 이후 6분 내지 36시간, 더욱 더 바람직하게 10시간 내지 24시간 및 특히 바람직하게 약 15시간일 수 있다.

따라서, 제1시점 및 제2시점 사이의 시간 범위는 바람직하게 상기 한도 내에서 가능한 큰 것이 바람직하다. 따라서, 제1시점 및 제2시점 사이의 시간 간격은 바람직하게 적어도 4시간, 적어도 5시간, 적어도 6시간, 적어도 7시간, 적어도 8시간, 적어도 9시간, 적어도 10시간, 적어도 11시간, 또는 적어도 12시간이며, 이에 따라 약 12시간 간격이 특히 바람직하다. 일반적으로, 이후 제2시점은 제1시점보다 적어도 10분 늦다.

단계 a)의 하위 단계 iii.에서 단계 (ii)에서 측정된 mRNA의 양에 비해 단계 (i)에서 측정된 mRNA의 양의 비율이 계산된다. 이를 위해, 상기 제2시점에서 상기 설명된 측정된 mRNA의 양(전사 수준)을 제1시점에서 상기 설명된 측정된 mRNA의 양(전사 수준)으로 나누었다. 이 비율은 매우 적은 양으로만 존재하는 제1시점에 이미 존재하는 안정한 mRNA가 다량으로 존재하는 mRNA와 관련하여 무시되는 것을 방지한다.

b) 단계에서, 이러한 mRNA가 선택되며, 이는 적어도 0.5(50%), 적어도 0.6(60%), 적어도 0.7(70%), 적어도 0.75(75%), 적어도 0.8(80%), 적어도 0.85(85%), 적어도 0.9(90%), 또는 적어도 0.95(95%)의 a) 단계의 하위 단계 (iii)에서 계산된 비율을 갖는다. 이러한 mRNA는 본 발명에서 특히 안정한 mRNA로 간주된다.

단계 c)에서, 상기 mRNA의 3'- 및/또는 5'-UTR 요소의 뉴클레오티드 서열, 즉 단계 b)에서 선택된 mRNA가 결정된다. 이를 위해, 당업자에게 공지된 다른 방법, 예를 들어 NCBI(National Center for Biotechnology Information)와 같이 공개적으로 이용 가능한 데이터베이스로부터 시퀀싱 또는 선택이 적용될 수 있다. 예를 들어, 단계 b)에서 선택된 mRNA의 mRNA 서열은 데이터베이스에서 검색될 수 있으며, 이후 3'- 및/또는 5'-UTR은 데이터베이스 내 존재하는 mRNA 서열로부터 추출될 수 있다.

특히, 안정한 mRNA로부터 유도된, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'UTR 요소)를 식별하는 상기 설명된 방법에서, "mRNA" 및/또는 "안정한 mRNA"라는 각각의 용어는 또한 각각 본 발명에 정의된 mRNA 종 및/또는 안정한 mRNA 종을 의미할 수 있다.

게다가, 본 발명에 있어서 "안정한 mRNA"는 평균 mRNA 붕괴, 바람직하게 상기 정의된 인비보 또는 인비트로에서 측정된 것에 비해 늦은 mRNA 붕괴를 가질 수 있다. 이에 따라, "평균 mRNA 붕괴"는 다수의 mRNA 종의 mRNA 붕괴를 조사함으로써 측정될 수 있다.

따라서, 본 발명은 추가적 양태에서 하기 단계를 포함하는 안정한 mRNA로부터 유도된 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 방법을 제공한다:

a) 하기 하위-단계를 포함하는 다수의 mRNA 종의 안정성을 분석하는 단계:

i. 상기 mRNA 종의 붕괴 과정 중 제1시점에 상기 다수의 mRNA 종의 각 mRNA 종의 양 측정,

ii. 상기 mRNA의 붕괴 과정 중 제2시점에 상기 다수의 mRNA 종의 각 mRNA 종의 양 측정, 및

iii. 단계 (ii)에서 측정된 상기 mRNA 종의 양에 비해 단계 (i)에서 측정된 상기 mRNA 종의 양의 상기 다수의 mRNA 종 비율을 각 mRNA 종에 대해 계산;

b) 각 mRNA 종에 대해 하위-단계 (iii)에서 계산된 비율에 따른 다수의 mRNA 종의 mRNA 종의 순위화하는 단계;

c) 가장 높은 비율 또는 하위-단계 (iii)에서 계산된 가장 높은 비율을 갖는 하나 이상의 mRNA 종의 선택하는 단계; 및

d) 상기 mRNA의 3'- 및/또는 5'-UTR 요소의 뉴클레오티드 서열의 결정.

본 발명에 사용된 "mRNA 종"은 유전체 전사 단위, 즉 보통 유전자에 상응한다. 따라서, 하나의 "mRNA 종" 내에, 예를 들어 mRNA 가공에 의해 다른 전사체가 발생할 수 있다. 예를 들어, mRNA 종은 마이크로어레이 상에 점을 통해 나타낼 수 있다. 따라서, 마이크로어레이는 예를 들어 mRNA 붕괴 중 특정한 시점에서, 다수의 mRNA 종의 양을 결정하는 유용한 도구를 제공한다. 그러나, 통상의 기술자에게 알려진 또 다른 기술, 예를 들어 RNA-seq(소위 전체 전사체 샷건 시퀀싱(Whole Transcriptome Shotgun Sequencing), 이는 주어진 시간에 유전체로부터 RNA 존재 및 양의 스냅샷을 나타내는 차세대 시퀀싱 기능을 사용하는 기술임), 정량적 PCR 등이 사용될 수 있다.

바람직하게, "다수의 mRNA 종"은 적어도 100, 적어도 300, 적어도 500, 적어도 1000, 적어도 2000, 적어도 3000, 적어도 4000, 적어도 5000, 적어도 6000, 적어도 7000, 적어도 8000, 적어도 9000, 적어도 10000, 적어도 11000, 적어도 12000, 적어도 13000, 적어도 14000, 적어도 15000, 적어도 16000, 적어도 17000, 적어도 18000, 적어도 19000, 적어도 20000, 적어도 21000, 적어도 22000, 적어도 23000, 적어도 24000, 적어도 25000, 적어도 26000, 적어도 27000, 적어도 28000, 적어도 29000, 또는 적어도 30000개 mRNA 종을 의미한다. 전체 전사체 또는 전사체의 가능한 많은 mRNA 종을 측정하는 것이 특히 바람직하다. 이는 예를 들어 전체 전사체 범위(coverage)를 제공하는 마이크로어레이를 사용함으로써 수행될 수 있다.

이의 하위 단계 i. 내지 iii.과 함께 이러한 방법의 단계 a)는 기본적으로 본 발명의 방법에 상기 설명된 하위-단계 i. 내지 iii.과 함께 단계 a)에 상응하지만, 다수의 mRNA 종의 각 mRNA 종의 양이 제1 및 제2시점에 측정되며 상기 비율이 각 mRNA 종에 대해 계산되는 점이 다르다. 따라서, 상기 설명된 방법 및 바람직한 실시예가 여기에 또한 적용되며, 단일 mRNA 종(및 각각의 단일 mRNA 종, 각각)에 대한 비율은 "mRNA"에 대해 상기 설명된 바와 같이 측정될 수 있다.

그러나, 상기 방법과 대조적으로, mRNA의 안정성은 비율의 절대값에 의해 평가되지 않고, 각 mRNA 종에 대해 단계 a)의 하위 단계 (iii)에서 계산된 비율에 따라 다수의 mRNA 종의 mRNA 종의 순위화를 통해 평가된다. 하위-단계 c)에서 가장 높은 비율을 갖는 하나 이상의 mRNA 종 또는 단계 a)의 하위-단계 (iii)에서 계산된 가장 높은 비율은 이후 선택된다.

이러한 맥락에서, 단계 c)에서 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% 가장 안정한 mRNA 종을 선택하는 것이 특히 바람직하다. 그렇지 않으면 또는 추가적으로, 단계 c)에서, 분석된 모든 mRNA 종으로부터 계산된 평균 비율의 적어도 100%에 상응하는 단계 a)의 하위-단계 iii.에서 계산된 비율을 보이는 이러한 mRNA 종이 선택될 수 있다. 더욱 바람직하게 이러한 mRNA 종은 분석된 모든 mRNA 종으로부터 계산된 평균 비율의 적어도 150%, 더욱 더 바람직하게 적어도 200% 및 가장 바람직하게 적어도 300%의 비율을 보이는 것이 선택된다.

단계 d)에서 단계 c)에서 선택된 mRNA의 3'- 및/또는 5'-UTR 요소의 뉴클레오티드 서열은 상기 설명된 본 발명의 방법의 단계 c)에 대해 상기 설명된 것처럼 결정된다.

바람직하게, 본 발명에 따른 3'-UTR 요소 및/또는 5'-UTR 요소에 대해 상기 설명된 방법 모두에서, 제1시점 및 제2시점 사이의 시간은 적어도 5시간, 바람직하게 적어도 6시간, 바람직하게 적어도 7시간, 더욱 바람직하게 적어도 8시간, 더욱 바람직하게 적어도 9시간, 더욱 더 바람직하게 적어도 10시간, 더욱 더 바람직하게 적어도 11시간, 및 특히 바람직하게 적어도 12시간이다.

바람직하게, 본 발명에 따른 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 상기 설명된 방법 모두에서, mRNA의 안정성은 펄스 표지를 통해, 바람직하게 펄스-추적 방법을 사용하여 분석된다.

추가적 양태에서, 본 발명은 또한 하기 단계를 포함하는 안정한 mRNA로부터 유도된, 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키는, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 방법을 제공한다:

a) 상기 설명된 어느 방법에 따른 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법에 의해 안정한 mRNA로부터 유도된 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 단계;

b) 단계 a)에서 식별된 3'-UTR 요소 및/또는 5'-UTR 요소에 의해 상응 또는 포함되는, 적어도 하나의 오픈 리딩 프레임 및 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자를 합성하는 단계;

c) 단계 b)에서 합성된 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임(ORF)에 의해 부호화된 단백질의 발현을 분석하는 단계;

d) 3'-UTR 요소 및/또는 5'-UTR 요소가 없는 참조 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임에 의해 부호화된 단백질의 발현을 분석하는 단계;

e) 단계 d)에서 분석된 참조 인공 핵산 분자로부터 단백질 발현에 비해 단계 c)에서 분석된 인공 핵산 분자의 단백질 발현을 비교하는 단계; 및

f) 단계 c)에서 분석된 인공 핵산 분자로부터 단백질 발현이 단계 d)에서 분석된 참조 인공 핵산 분자로부터 단백질 발현에 비해 연장 및/또는 증가되는 경우 3'-UTR 요소 및/또는 5'-UTR 요소를 선택하는 단계.

이러한 방법에서, 먼저 3'-UTR 요소 및/또는 5'-UTR 요소는 상기 설명된 본 발명에 따른 방법에 의해 식별된다. 이는 통상의 기술자에게 알려진 방법, 예를 들어 PCR 증폭을 통해 3'- 및/또는 5'-UTR 요소의 합성을 가능하게 한다. 이러한 PCR을 위해 사용되는 프라이머는 바람직하게 클로닝을 위한 제한 부위를 포함한다. 그렇지 않으면, 3'- 및/또는 5'-UTR 요소는 예를 들어 화학적 합성 또는 올리고 어닐링(annealing)을 통해 합성될 수 있다. 따라서, 단계 b)에서, 인공 핵산 분자는 적어도 하나의 오픈 리딩 프레임 및 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하여 합성되며, 이는 단계 a)에서 식별된 3'-UTR 요소 및/또는 5'-UR 요소에 상응하거나 포함된다. 특히, 만약 3'- 및/또는 5'-UTR 요소가 각각의 요구를 만족시키는 경우, 즉 그들이 단백질 발현을 연장 및/또는 증가시키는 경우, 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 보통 본 발명에 따른 3'- 및 5'-UTR 요소를 포함하는 인공 핵산을 초래하는 오픈 리딩 프레임과 조합된다. 이를 실험하기 위해, 단계 a)에서 식별된 3'- 및/또는 5'-UTR 요소, 또는 PCR 절편 또는 이의 합성된 서열은 각각 각각의 ORF로부터 단백질 발현을 측정하기 위해 특정한 벡터, 특히 발현 벡터로 클로닝될 수 있다.

적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자로부터 단백질 발현은 이후 본 발명에 설명된 단계 c)에서 측정되고, 단계 e)에서 본 발명에 설명된 3'-UTR 요소 및/또는 5'-UTR 요소가 없는 각각의 참조 핵산 분자로부터 단계 d)에서 측정된 단백질 발현과 비교된다.

이후, 단계 f)에서 이러한 3'-UTR 요소 및/또는 5'-UTR 요소가 선택되며, 이는 단계 d)에서 분석된 참조 인공 핵산 분자로부터 단백질 발현에 비해 단계 c)에서 분석된 인공 핵산 분자로부터 단백질 발현을 연장 및/또는 증가시킨다. 참조 핵산 분자에 본 발명의 핵산 분자의 단백질 발현의 비교는 본 발명에 설명된 것과 같이, 특히 본 발명의 인공 핵산 분자의 맥락에서 수행된다.

게다가, 본 발명은 하기 단계를 포함하는, 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 안정한 mRNA로부터 유도된, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 특히 바람직한 방법을 제공한다:

a) 새롭게 전사된 RNA 분자에 결합시키기 위해 세포를 표지된 뉴클레오티드와 함께 공급(feeding)/배양하는 단계(펄스-추적 표지);

b) 제1시점 및 적어도 하나의 제2시점에 세포의 총 RNA를 분리하는 단계;

c) 단계 b)에서 분리된 총 RNA로부터 표지된 RNA 분자를 추출하는 단계;

d) 표지된 RNA에 포함된 다른 mRNA 종의 양/전사 수준을 측정하는 단계;

e) 제1시점에 존재하는 mRNA 종의 양/전사 수준에 비해 적어도 하나의 제2시점에 존재하는 mRNA 종의 양/전사 수준의 비율을 계산하는 단계;

f) 단계 e)에서 측정된 비율에 따라 mRNA 종을 순위화하는 단계;

g) 가장 안정한 mRNA 종을 선택하는 단계;

h) 단계 g)에서 선택된 가장 안정한 mRNA의 3'- 및/또는 5'-UTR의 뉴클레오티드 서열을 결정하는 단계;

i) 단계 h)에서 측정된 3'- 및/또는 5'-UTR에 포함된 3'- 및/또는 5'-UTR 요소를 합성하는 단계;

j) 본 발명에 설명된 것처럼 본 발명에 따른 핵산을 얻기 위해 오픈 리딩 프레임과 함께 단계 i)에서 합성된 3'- 및/또는 5'-UTR 요소를 조합하는 단계; 및

k) 선택적으로 본 발명에 설명된 3'- 및/또는 5'-UTR 요소가 없는 참조 핵산 내 존재하는 오픈 리딩 프레임의 발현에 비해 본 발명의 핵산 내 존재하는 오픈 리딩 프레임의 발현을 비교하는 단계.

이에 따라, 상기 본 발명의 방법에 대해 설명된 구체적이고 바람직한 실시예는 또한 단계 a) 내지 k)에 개시된 각각의 제한 내에서 여기에 적용된다.

특히, 하기 표지된 뉴클레오티드가 본 발명의 방법의 단계 a) 내 세포를 공급하는데 바람직하다: 4-티오우리딘(4sU), 2-티오우리딘, 6-티오구아노신, 5-에티닐우리딘(EU), 5-브로모-우리딘(BrU), 비오틴-16-아미노알릴우리딘, 5-아미노알릴우리딘, 5-아미노알릴시티딘 등. 특히 4-티오우리딘(4sU)가 바람직하다. 4-티오우리딘은 100-500 μM의 농도로 사용된다. 그렇지 않으면 방사선 표지된 뉴클레오티드, 예를 들어 우리딘-³H가 사용될 수 있다. 상기 표지된 뉴클레오티드의 조합이 사용될 수 있다. 특히 4-티오우리딘 및 6-티오구아노신의 조합이 바람직하다.

단계 a)에서 표지된 뉴클레오티드와 함께 세포의 배양은 다양할 수 있다. 특히 10분 내지 24시간 배양(공급 시간)이 바람직하다. 특히 2 내지 6시간이 바람직하며, 2 내지 3시간이 더욱 바람직하다.

본 발명의 방법에 사용될 수 있는 세포는 특히 세포주, 일차 세포, 조직 또는 개체 내 세포를 포함한다. 특정한 실시예에서 세포 배양을 허용하는 세포 유형은 본 발명의 방법에 적절할 수 있다. 특히 포유동물 세포, 예를 들어 인간 세포 및 마우스 세포가 바람직하다. 특히 바람직한 실시예에서 인간 세포주 HeLa, 및 U-937 및 마우스 세포주 NIH3T3, JAWSII 및 L929가 사용된다. 게다가 일차 세포가 특히 바람직하다; 특히 바람직한 실시예에서 특히 인간 표피 섬유아세포(HDF)가 사용될 수 있다. 그렇지 않으면 표지된 뉴클레오티드가 또한 개체의 조직에 적용될 수 있으며, 배양 시간 이후에 조직의 RNA는 단계 c)에 따라 분리된다.

세포(유형)의 가장 안정한 mRNA의 측정을 위해, 총 RNA는 상기 설명된 제1시점, 예를 들어 표지 후 0 내지 6시간, 바람직하게 표지 후 3시간, 바람직하게 상기 설명된 제2시점, 예를 들어 표지 후 3 내지 48시간, 바람직하게 10 내지 24시간, 가장 바람직하게 표지 후 15시간에 추출된다. 제2시점은 제1시점에 적어도 10분 후이다.

단계 f)에서 mRNA 종은 단계 e)에서 계산된 비율에 따라 순위화된다. 이러한 맥락에서 특히 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% 가장 안정한 mRNA 종을 선택하는 것이 바람직하다.

이러한 맥락에서, 나아가 제1시점에 비해 제2시점에서 적어도 50%(0,5배), 적어도 60%(0,6배), 적어도 70%(0,7배), 적어도 90%(0,9배) 또는 적어도 95%(0,95배) mRNA 종의 전사 수준/양을 보이는 이들 mRNA 종을 선택하는 것이 바람직하다. 이러한 실시예는 RNA가 표지 후 3시간(제1시점) 및 15시간(제2시점)에 분리되는 경우가 특히 바람직하다.

그렇지 않으면 또는 추가적으로, 이들 mRNA 종은 분석된 모든 mRNA 종으로부터 계산된 평균 비율의 적어도 100%에 상응하는 단계 e)에서 계산된 비율을 나타내는 것이 선택된다. 더욱 바람직하게 이들 mRNA 종은 분석된 모든 mRNA 종으로부터 계산된 평균 비율의 적어도 150% 및 더욱 바람직하게 적어도 200% 및 가장 바람직하게 적어도 300%의 비율을 나타내는 것이 선택된다.

본 발명의 방법의 추가적 단계에서 단계 g)에서 선택된 가장 안정한 mRNA 종의 3'- 및 또는 5'-UTR의 뉴클레오티드 서열이 결정되며, 단계 i)에서 3'- 및/또는 5'-UTR 요소가 예를 들어 PCR 증폭을 통해 합성된다. PCR에 사용된 프라이머는 바람직하게 클로닝을 위한 제한 부위를 포함한다. 그렇지 않으면 3'- 및/또는 5'-UTR 요소는 (예를 들어 화학적 합성 또는 올리고 어닐링을 통해) 합성될 수 있다.

본 발명의 방법의 단계 j)에서 생성 PCR 절편 또는 합성된 서열은 본 발명에 따른 3'- 및/또는 5'-UTR 요소를 포함하는 인공 핵산을 생성하는 오픈 리딩 프레임과 함께 조합된다. 바람직하게, PCR 절편 또는 서열은 벡터로 클로닝될 수 있다.

특히 바람직한 실시예에서 본 발명은 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하기 위하여 단계 a) 내지 k)를 포함하는 방법을 제공하며, 상기 3'-UTR 요소 및/또는 5'-UTR 요소는 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자로부터 단백질 생산을 연장한다.

추가적 양태에서, 본 발명은 또한 인공 핵산 분자를 생성하는 방법을 제공하며, 상기 적어도 하나의 오픈 리딩 프레임 및 상기 설명된 본 발명에 따른 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법에 의해 식별된 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자가 합성된다. 이러한 인공 핵산 분자의 합성은 일반적으로 통상의 기술자에게 알려진 방법, 예를 들어 통상적으로 알려지거나 또는 본 발명에 개시된 클로닝 방법을 통해 수행된다.

바람직하게, 본 발명에 설명된 본 발명에 따른 벡터는 이러한 인공 핵산 분자를 생성하기 위한 본 발명의 방법에 사용된다.

바람직하게, 이러한 인공 핵산 분자를 생성하는 방법을 통해 생성된 인공 핵산 분자는 본 발명에 설명된 본 발명에 따른 핵산 분자이다.

추가로, 본 발명은 또한 상기 본 발명에 따른 인공 핵산 분자를 생성하는 방법에 의해 수득 가능한 인공 핵산 분자를 제공한다.

하기 도면, 서열 및 실시예는 본 발명을 보다 설명하기 위한 것이다. 이들은 본 발명의 주제를 제한하려는 것이 아니다.

본 발명의 인공 핵산 분자에 포함된 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시킨다. 또한, 본 발명의 인공 핵산 분자는 유전자 치료 및/또는 유전자 백신 접종에 효과적으로 사용될 수 있다.

도 1 내지 11, 19 내지 21 및 25 내지 30은 인비트로 전사를 통해 수득될 수 있는 서열 부호화 mRNA를 나타낸다. 하기 약어가 사용되었다:
· PpLuc (GC): 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 mRNA 서열
· A64: 64개 아데닐레이트를 갖는 폴리(A)-서열
· C30: 30개 시티딜레이트를 갖는 폴리(C)-서열
· hSL: (Cakmakci, Lerner, Wagner, Zheng, & William F Marzluff, 2008. Mol. Cell. Biol. 28(3):1182-94)로부터 수득한 히스톤 스템-루프 서열
· 32L4: 5' 말단 올리고피리미딘 트랙트가 없는 인간 리보좀 단백질 라지 32의 5'-UTR
· albumin7: T7 종결 신호뿐만 아니라 HindIII 및 XbaI 제한 부위를 제거하기 위해 도입된 세개의 단일 점 돌연변이를 갖는 인간 알부민의 3'-UTR
· gnas: 쥣과 gnas의 3'-UTR로부터 유도된 3'-UTR 요소; Muc 머스큘러스(musculus) GNAS(구아닌 뉴클레오티드 결합 단백질, 알파 자극) 복합체 위치(Gnas), mRNA
· morn2: 쥣과 morn2의 3'-UTR로부터 유도된 3'-UTR 요소; Muc 머스큘러스 MORN 반복 포함 2 (Morn2), mRNA
· gstm1: 쥣과 gstm1의 3'-UTR로부터 유도된 3'-UTR 요소; Mus 머스큘러스 글루타치온 S-트랜스퍼라제, mu 1(Gstm1), mRNA
· ndufa1: 쥣과 ndufa1의 3'-UTR로부터 유도된 3'-UTR 요소; Muc 머스큘러스 NADH 디히드로게나제(유비퀴논) 1 알파 서브복합체, (Ndufa1), mRNA
· cbr2: 쥣과 cbr2의 3'-UTR로부터 유도된 3'-UTR; Muc 머스큘러스 카보닐 리덕타제 2(Cbr2), mRNA
· mp68: 쥣과 mp68의 5'-UTR로부터 유도된 5'-UTR 요소; Mus 머스큘러스 RIKEN cDNA 2010107E04 유전자 (2010107E04Rik), mRNA
· ndufa4: 쥣과 nudfa4의 5'-UTR로부터 유도된 5'-UTR 요소; Muc 머스큘러스 NADH 디히드로게나제(유비퀴논) 1 알파 서브복합체, 4, (Ndufa4), mRNA
· Ybx1: 쥣과 Ybx1(Y-Box 결합 단백질 1)의 3'-UTR로부터 유도된 3'-UTR 요소
· Ndufb8: 쥣과 Ndufb8의 3'-UTR로부터 유도된 3'-UTR 요소 (NADH 디히드로게나제(유비퀴논) 1 베타 서브복합체 8)
· CNTN1: 인간 CNTN1 (콘택틴 1)의 3'-UTR로부터 유도된 3'-UTR 요소
도 1: 서열번호 35, 즉 32L4 - PpLuc(GC) - A64 - C30 - hSL의 mRNA 서열을 나타냄. (R2464). 5'-UTR은 5' 말단 올리고피리미딘 트랙트가 없는 인간 리보좀 단백질 라지 32 mRNA로부터 유도된다. PpLuc(GC) ORF는 이탤릭체로 강조되었다.
도 2: 서열번호 36, 즉 32L4 - PpLuc(GC) - gnas-A64-C30-hSL의 mRNA 서열을 나타냄. (R3089). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 Gnas 전사체로부터 유도된 3'-UTR 요소는 밑줄 표시되었다.
도 3: 서열번호 37, 즉 32L4 - PpLuc(GC) - morn2- A64 - C30 - hSL의 mRNA 서열을 나타냄. (R3106). PpLuc(GC) ORF는 이탤릭체로 강조되었따. 마우스 morn2로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 4: 서열번호 38, 즉 32L4 - PpLuc(GC) - gstm1- A64 - C30 - hSL의 mRNA 서열을 나타냄. (R3107). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 gstm1으로부터 유도된 3'-UTR 요소는 밑줄 표시되었다.
도 5: 서열번호 39, 즉 32L4 - PpLuc(GC) - ndufa1 - A64 - C30 - hSL의 mRNA 서열을 나타냄. (R3108). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 ndufa1으로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 6: 서열번호 40, 즉 32L4 - PpLuc(GC) - cbr2 - A64 - C30 - hSL의 mRNA 서열을 나타냄. (R3109). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 cbr2로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 7: 서열번호 41, 즉 PpLuc(GC) - albumin7- A64 - C30 - hSL의 mRNA 서열을 나타냄. (R2463). 3'-UTR은 T7 종결 신호뿐만 아니라 HindIII 및 XbaI 제한 부위를 제거하기 위해 도입된 세개의 단일 점 돌연변이를 갖는 인간 알부민으로부터 유도되었다(알부민 7). PpLuc(GC) ORF는 이탤릭체로 강조되었다.
도 8: 서열번호 42, 즉 Mp68 - PpLuc(GC) - albumin7- A64 - C30 - hSL의 mRNA 서열을 나타냄. (R3111). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 mp68로부터 유도된 5'-UTR 요소는 밑줄로 표시되었다.
도 9: 서열번호 43, 즉 Ndufa4 - PpLuc(GC) - albumin7- A64 - C30 - hSL의 mRNA 서열을 나타냄. (R3112). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 Ndufa4로부터 유도된 5'-UTR 요소는 밑줄로 표시되었다.
도 10: 서열번호 44, 즉 PpLuc(GC) - A64 - C30 - hSL (R2462)의 mRNA 서열을 나타냄. PpLuc(GC) ORF는 이탤릭체로 강조되었다.
도 11: 서열번호 45, 즉 PpLuc(GC) - gnas- A64 - C30 - hSL의 mRNA 서열을 나타냄 (R3116). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 Gnas로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 12: 다른 3'-UTR 요소, 즉 gnas, morn2, gstm1, ndufa1 및 cbr2로부터 유도된 3'-UTR 요소가 mRNA로부터 단백질 발현을 현저히 연장시킴을 나타낸다.
mRNA로부터 루시퍼라제 발현에 gnas, morn2, gstm1, ndufa1 및 cbr2 3'-UTR로부터 유도된 본 발명의 3'-UTR 요소의 효과가3'-UTR이 없는 mRNA로부터 루시퍼라제 발현과 비교하여 실험되었다. 이를 위해, 인간 HeLa를 리포펙션(lipofection)을 통해 다른 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 다른 시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다. 3'-UTR은 루시퍼라제 발현을 연장시킨다. 세가지 독립 실험으로부터 평균 값을 나타내었다. 값은 실시예 7.a에 요약되었다.
도 13: 다른 3'-UTR 요소, 즉 gnas, morn2, gstm1, ndufa1 및 cbr2로부터 유도된 3'-UTR 요소는 mRNA로부터 단백질 발현을 현저하게 연장시킨다.
mRNA로부터 루시퍼라제 발현에 gnas, morn2, gstm1, ndufa1 및 cbr2 3'-UTR로부터 유도된 본 발명의 3'-UTR 요소의 효과가3'-UTR이 없는 mRNA로부터 루시퍼라제 발현과 비교하여 실험되었다. 이를 위해, HDF(인간 표피 섬유아세포) 세포를 리포펙션(lipofection)을 통해 다른 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 다른 시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다. 3'-UTR은 루시퍼라제 발현을 연장시킨다. 세가지 독립 실험으로부터 평균 값을 나타내었다. 값은 실시예 7.a에 요약되었다.
도 14: 다른 5'-UTR 요소, 즉 Mp68 및 ndufa4로부터 유도된 5'-UTR 요소는 mRNA로부터 총 단백질 발현을 현저하게 증가시킨다.
mRNA로부터 루시퍼라제 발현에 Mp68 및 ndufa4 로부터 유도된 본 발명의 5'-UTR 요소의 효과가 실험되었다. 이를 위해, 인간 HeLa 세포를 리포펙션(lipofection)을 통해 다른 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 6, 24, 48, 및 72 시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 총 단백질 발현(곡선 아래 영역)이 계산되었다. 5'-UTR이 없는 mRNA에 비해 본 발명의 5'-UTR 요소를 포함하는 mRNA의 발현 수준을 비교하기 위해, 5'-UTR이 없는 대조군 구성(construct)의 발현 수준을 1로 설정하였다. 세가지 독립 실험으로부터 평균 값을 나타내었다. 값은 실시예 7.b에 요약되었다.
도 15: 다른 5'-UTR 요소, 즉 Mp68 및 ndufa4로부터 유도된 5'-UTR 요소는 mRNA로부터 총 단백질 발현을 현저하게 증가시킨다.
mRNA로부터 루시퍼라제 발현에 Mp68 및 ndufa4 로부터 유도된 본 발명의 5'-UTR 요소의 효과가 실험되었다. 이를 위해, HDF 세포를 리포펙션(lipofection)을 통해 다른 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 6, 24, 48, 및 72 시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 총 단백질 발현(곡선 아래 영역)이 계산되었다. 5'-UTR이 없는 mRNA에 비해 본 발명의 5'-UTR 요소를 포함하는 mRNA의 발현 수준을 비교하기 위해, 5'-UTR이 없는 대조군 구성(construct)의 발현 수준을 1로 설정하였다. 세가지 독립 실험으로부터 평균 값을 나타내었다. 값은 실시예 7.b에 요약되었다.
도 16: gnas로부터 유도된 3'-UTR 요소는 mRNA로부터 단백질 발현을 현저하게 연장시킴을 나타낸다.
mRNA로부터 루시퍼라제 발현에 gnas 3'-UTR로부터 유도된 본 발명의 3'-UTR 요소의 효과를 3'-UTR이 없는 mRNA로부터 루시퍼라제 발현을 비교하여 실험하였다. 이를 위해, HDF 세포를 리포펙션(lipofection)을 통해 각각의 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 24, 48, 및 72 시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다. gnas 3'-UTR은 루시퍼라제 발현을 연장시킨다. 값은 실시예 7.c에 요약되었다.
도 17: gnas로부터 유도된 3'-UTR 요소는 mRNA로부터 단백질 발현을 현저하게 연장시킴을 나타낸다.
mRNA로부터 루시퍼라제 발현에 gnas 3'-UTR로부터 유도된 본 발명의 3'-UTR 요소의 효과를 3'-UTR이 없는 mRNA로부터 루시퍼라제 발현을 비교하여 실험하였다. 이를 위해, HeLa 세포를 리포펙션(lipofection)을 통해 각각의 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 d2 및 d3에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다. gnas 3'-UTR은 루시퍼라제 발현을 연장시킨다. 값은 실시예 7.c에 요약되었다.
도 18: 다른 3'-UTR 요소, 즉 ybx1(V2), ndufb8, 및 cntn1-004(V2) 로부터 유도된 3'-UTR 요소는 mRNA로부터 단백질 발현을 현저하게 연장시킴을 나타낸다.
mRNA로부터 루시퍼라제 발현에 ybx1(V2), ndufb8, 및 cntn1-004(V2) 3'-UTR로부터 유도된 본 발명의 3'-UTR 요소의 효과를 3'-UTR이 없는 mRNA로부터 루시퍼라제 발현을 비교하여 실험하였다. 이를 위해, HDF 세포를 리포펙션(lipofection)을 통해 각각의 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 다른 시점에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다. 3'-UTR은 루시퍼라제 발현을 연장시킨다. 값은 실시예 7.d에 요약되었다.
도 19: 서열번호 46, 즉 변이 T128bpG 및 결실 del236-237bp를 갖는 32L4 - PpLuc(GC) - Ybx1-001(V2)-A64-C30-hSL (R3623) mus 머스큘러스 3'UTR의 mRNA 서열을 나타낸다. PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 Ybx1 전사체로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 20: 서열번호 47, 즉 32L4 - PpLuc(GC) - Ndufb8-A64-C30-hSL (R3624)의 mRNA 서열을 나타낸다. PpLuc(GC) ORF는 이탤릭체로 강조되었다. 마우스 Ndufb8 전사체로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 21: 서열번호 48, 즉 32L4 - PpLuc(GC) - Cntn1-004(V2)-A64-C30-hSL (R3625) +T at pos. 30bp, 변이 G727bpT, A840bpG. PpLuc(GC) ORF는 이탤릭체로 강조되었다. 인간 Cntn1 전사체로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 22: 다른 3'-UTR 요소, 즉 gnas, morn2, ndufa1 (Mm; mus 머스큘러스), 및 NDUFA1 (Hs; 호모 사피엔스)로부터 유도된 3'-UTR 요소는 mRNA로부터 단백질 발현을 현저하게 연장시킨다.
mRNA로부터 루시퍼라제 발현에 gnas, morn2, ndufa1 (Mm; mus 머스큘러스), 및 NDUFA1 (Hs; 호모 사피엔스)로부터 유도된 본 발명의 3'-UTR 요소의 효과를 3'-UTR이 없는 mRNA로부터 루시퍼라제 발현을 비교하여 실험하였다. 이를 위해, 인간 Hela 세포를 리포펙션(lipofection)을 통해 각각의 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 다른 시점에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다. 3'-UTR은 루시퍼라제 발현을 연장시킨다. 3개의 독립적인 실험으로부터 평균 값을 나타내었다. 값은 표 8에 요약되었다.
도 23: 다른 5'-UTR 요소, 즉 Mp68 및 ndufa4로부터 유도된 5'-UTR 요소는 mRNA로부터 총 단백질 발현을 현저하게 증가시킴을 나타낸다. mRNA로부터 루시퍼라제 발현에 Mp68 및 ndufa4로부터 유도된 본 발명의 5'-UTR 요소의 효과를 실험하였다. 이를 위해, 인간 Hela 세포를 리포펙션(lipofection)을 통해 각각의 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 6, 24, 48, 및 72시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 총 단백질 발현(곡선 아래 영역)이 계산되었다. 5'-UTR이 없는 mRNA에 비해 본 발명의 5'-UTR 요소를 포함하는 mRNA의 발현 수준을 비교하기 위해, 5'UTR이 없는 대조군 구성의 발현 수준을 1로 설정하였다. 평균 값을 나타내었다. 값을 표 9에 요약하였다.
도 24: 다른 5'-UTR 요소, 즉 Mp68 및 ndufa4로부터 유도된 5'-UTR 요소는 mRNA로부터 총 단백질 발현을 현저하게 증가시킴을 나타낸다. mRNA로부터 루시퍼라제 발현에 Mp68 및 ndufa4로부터 유도된 본 발명의 5'-UTR 요소의 효과를 실험하였다. 이를 위해, 인간 Hela 세포를 리포펙션(lipofection)을 통해 각각의 mRNA로 형질 주입시켰다. 루시퍼라제 수준은 형질 주입 후 24, 48, 및 72시간에 측정되었다. PpLuc 신호는 동시 형질주입된 RrLuc의 신호에 의해 형질주입 효율을 위해 보정되었다. 총 단백질 발현(곡선 아래 영역)이 계산되었다. 5'-UTR이 없는 mRNA에 비해 본 발명의 5'-UTR 요소를 포함하는 mRNA의 발현 수준을 비교하기 위해, 5'UTR이 없는 대조군 구성의 발현 수준을 1로 설정하였다. 평균 값을 나타내었다. 값을 표 9에 요약하였다.
도 25: 서열번호 383, 즉 32L4 - PpLuc(GC) - A64-C30-hSL의 mRNA 서열을 나타낸다. (R2462). PpLuc(GC) ORF는 이탤릭체로 강조되었다.
도 26: 서열번호 384, 즉 PpLuc(GC) - morn2- A64 - C30 - hSL의 mRNA 서열을 나타낸다. (R3948). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 쥣과 morn2로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 27: 서열번호 385, 즉 PpLuc(GC) - ndufa1- A64 - C30 - hSL의 mRNA 서열을 나타낸다. (R4043). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 쥣과 ndufa1로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 28: 서열번호 386, 즉 PpLuc(GC) - NDFUA1- A64 - C30 - hSL의 mRNA 서열을 나타낸다. (R3948). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 인간 NDUFA1로부터 유도된 3'-UTR 요소는 밑줄로 표시되었다.
도 29: 서열번호 387, 즉 Mp68 - PpLuc(GC) - A64 - C30 - hSL의 mRNA 서열을 나타낸다. (R3954). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 쥣과 mp68로부터 유도된 5'-UTR 요소는 밑줄로 표시되었다.
도 30: 서열번호 388, 즉 Ndufa4 - PpLuc(GC) - A64 - C30 - hSL의 mRNA 서열을 나타낸다. (R3951). PpLuc(GC) ORF는 이탤릭체로 강조되었다. 쥣과 ndufa4로부터 유도된 5'-UTR 요소는 밑줄로 표시되었다.

실시예

1. 단백질 생산을 연장 및/또는 증가시키는 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)의 식별:

다른 인간 및 쥣과 세포 유형에서 mRNA 붕괴를 펄스-추적법을 통해 측정하였다. 이를 위해, 세가지 다른 인간 세포 유형(HeLa, HDF 및 U-937) 및 세가지 다른 마우스 세포 유형(NIH3T3, JAWSII 및 L929)를 그들의 각각의 배지에 밤새 두었다: RPMI 배지에서 HeLa, U-937, L929, DMEM에서 JAWSII 및 NIH3T3 및 섬유아세포 성장 배지 2(Fibroblast Growth Medium 2)에서 HDF. 상기 세포를 새롭게 합성된 RNA("펄스")의 표지를 위해 200 μM 4-티오우리딘(4sU)를 포함하는 각각의 배지와 함께 3시간 배양하였다. 배양(표지) 후, 세포를 한번 세척하고 배지를 2mM 우리딘("chase")이 보충된 신선 배지로 교체하였다. 세포를 수집하기 전 3시간(제1시점) 또는 15시간(제2시점)에 추가로 배양하였다.

이에 따라, 세포를 표지의 종료 후 3시간(제1시점) 및 15시간(제2시점)에 수집하였다. 총 RNA를 RNeasy Mini Kit (Qiagen)를 사용하여 이들 세포로부터 분리하였다.

HPDP-Biotin (EZ-Link Biotin-HPDP, Thermo Scientific; 피리딜디티올-활성화된, 분해 가능한(가역성) 이황화 결합을 통해 결합하는 설프히드릴-반응성 비오티닐화 시약)을 이후 4-티오우리딘(4sU)-표지된 RNA를 추출하기 위해 총 RNA와 함께 배양하였다. HPDP-비오틴은 가역성 이황화 결합을 형성하기 위해 4-티오우리딘(4sU)-표지된 RNA에서 감소된 티올(-SH)과 함께 특이적으로 반응하였다. 비오티닐화된 RNA는 Amicon-30 장치를 사용하여 초미세여과(ultrafiltrated)되었고, 스트렙타비딘-결합된 다이나비드(dynabeads) (Life Technologies)로 배양하고, DTT를 통해 스트렙타비딘으로부터 회복되었다. 이어서, RNeasy Mini Kit를 사용하여 RNA를 정제하였다. 각각의 세포주에 대해 3회의 독립적인 실험이 수행되었다.

추출된 4sU-표지된 RNA는 제1시점(표지 후 3시간)에 존재하는 다수의 mRNA종의 전사 수준(즉, mRNA 종의 양) 및 제2시점(표지 후 15시간)에 존재하는 다수의 mRNA 종의 전사 수준(즉, mRNA 종의 양)을 측정하기 위해 마이크로어레이에서 사용되었다. Affymetrix Human Gene 1.0 ST 및 Affymetrix Mouse Gene 1.0 ST 마이크로어레이가 사용되었다. Affymetrix Human Gene 1.0 ST는 36070개의 mRNA 종을 포함한다. Affymetrix Mouse Gene 1.0 ST은 26166개의 mRNA 종을 포함한다.

이들 마이크로어레이가 전체 전사체 범위를 제공, 즉 이들은 완전한 발현 프로파일을 제공하기 문에, 제1시점에 동일한 mRNA 종의 전사 수준에 비해 제2시점에 특정한 mRNA 종의 전사 수준의 비율은 따라서 다수의 mRNA 종에 대해 결정된다. 따라서 상기 비율은 제1시점과 비교하여 제2시점에서 mRNA 종의 x-배 전사 수준(Gene Symbol로 나타냄)을 반영한다.

이들 실험으로부터 결과는 하기 표 1-3에 나타내었다. 각각의 표 1-3은 가장 안정한 mRNA 종, 즉 제1시점에 이 mRNA 종의 전사 수준 대비 제2시점에 이 mRNA 종의 전사 수준의 비율에 따른 순위를 나타낸다 (표 1: 인간 세포 유형(HeLa, HDF 및 U-937의 조합된 분석); 표 2: 마우스 세포주(NIH3T3, JAWSII 및 L929)의 조합된 분석; 표 3: 인간 세포주 HDF(인간 표피 섬유아세포)). 적어도 0,549943138 (약 55%; 표 1), 0,676314425 (약 68%, 표 2) 또는 0,8033973 (약 80%, 표 3)의 제1시점에 전사 수준/제2시점에 전사 수준의 비율에 대한 값을 보이는, 이러한 mRNA 종은 "가장 안정한 mRNA 종"으로 간주된다.

게다가, 평균 비율 대비 특정한 mRNA 종의 비율의 관계(즉 표에서 "비율의 평균"으로 나타난, 측정된 모든 mRNA 종의 비율의 평균)이 계산되고 평균의 %로 주어졌다.

표 1: Affymetrix Human Gene 1.0 ST 마이크로어레이로 인간 세포 유형(HeLa, HDF 및 U-937)의 조합된 분석으로부터 생성되는 안정한 mRNA. 마이크로어레이 상 36070개의 mRNA 종 가운데 113개 mRNA 종이 "가장 안정한" mRNA 종으로 선택되었다. 이는 마이크로어레이에 존재하는 mRNA 종의 0.31%에 상응한다.

유전자 기호	제1시점 전사 수준에 비해 제2시점 전사 수준의 비율	비율의 평균	평균의 %
LTA4H	0,982490359	0,258826017	379,5948991
SLC38A6	0,953694877		368,4694789
DECR1	0,927429689		358,3216631
PIGK	0,875178367		338,1338462
FAM175A	0,849392515		328,1712266
PHYH	0,827905031		319,8693239
NT5DC1	0,815986179		315,2643572
TBC1D19	0,805960687		311,3909086
PIGB	0,805108608		311,0616997
ALG6	0,804875859		310,9717748
CRYZ	0,797694475		308,1971756
BRP44L	0,796150905		307,6008021
ACADSB	0,792385554		306,1460216
SUPT3H	0,792305264		306,1150005
TMEM14A	0,792128439		306,0466827
GRAMD1C	0,78766459		304,3220303
C11orf80	0,778391775		300,739386
C9orf46	0,776061355		299,8390053
ANXA4	0,765663559		295,8217134
RAB7A	0,757621668		292,7146492
TBCK	0,753324047		291,0542204
AGA	0,751782245		290,4585303
IFI6	0,742389518		286,829557
C2orf34	0,737633511		284,9920263
TPK1	0,731359535		282,5680135
ALDH6A1	0,731062569		282,4532776
AGTPBP1	0,725606511		280,3452757
CCDC53	0,725535697		280,3179158
LRRC28	0,722761729		279,2461657
MBNL3	0,716905277		276,9834674
CCDC109B	0,713320794		275,5985668
PUS10	0,70905743		273,9513739
CCDC104	0,706185858		272,8419137
CASP1	0,699081435		270,0970494
SNX14	0,689529842		266,4066965
SKAP2	0,686417578		265,2042424
NDUFB6	0,683568924		264,1036366
EFHA1	0,680321463		262,8489478
BCKDHB	0,679714289		262,6143601
BBS2	0,677825758		261,8847077
LMBRD1	0,676629332		261,4224565
ITGA6	0,660264393		255,0996998
HERC5	0,654495807		252,8709496
HADHB	0,651220796		251,6056164
MCCC2	0,650460461		251,3118537
CAT	0,647218183		250,0591672
ANAPC4	0,646761056		249,8825517
PCCB	0,641145931		247,7130926
PHKB	0,639806797		247,1957046
ABCB7	0,639415266		247,0444329
PGCP	0,636830107		246,0456309
GPD2	0,63484437		245,2784217
TMEM38B	0,634688463		245,2181856
NFU1	0,63202654		244,1897253
OMA1	0,631592924		244,0221934
LOC128322	0,630915328		243,7603974
NUBPL	0,627949735		242,6146113
LANCL1	0,627743069		242,5347636
HHLA3	0,62723119		242,3369941
PIR	0,625871255		241,8115696
ACAA2	0,624054189		241,1095284
CTBS	0,621758355		240,22251
GSTM4	0,618559637		238,9866536
ALG8	0,617468882		238,5652294
ACTR10	0,614629804		237,4683237
PIGF	0,612863425		236,7858655
MGST3	0,607459796		234,6981198
SCP2	0,604745109		233,6492735
HPRT1	0,604586436		233,5879689
ACSF2	0,603568827		233,1948052
VPS13A	0,60079506		232,1231332
CTH	0,598492068		231,2333494
NXT2	0,597938464		231,0194589
MGST2	0,596121512		230,3174615
C11orf67	0,59596274		230,2561181
PCCA	0,595915054		230,2376943
GLMN	0,594596168		229,7281295
DHRS1	0,594391166		229,6489249
PON2	0,594025719		229,5077308
NME7	0,593140523		229,1657265
ETFDH	0,59290737		229,0756456
ALG13	0,591519568		228,5394547
DDX60	0,590567649		228,1716714
DYNC2LI1	0,590400874		228,1072359
VPS8	0,586233686		226,4972016
ITFG1	0,585791975		226,3265424
CDK5	0,584517109		225,8339853
C1orf112	0,58415003		225,6921603
IFT52	0,579757269		223,9949738
CLYBL	0,577777391		223,230028
FAM114A2	0,575975081		222,533688
NUDT7	0,575398988		222,3111085
AKD1	0,57519887		222,233791
MAGED2	0,575157132		222,217665
HRSP12	0,574805797		222,0819235
STX8	0,573508131		221,5805571
ACAT1	0,569067306		219,8648003
IFT74	0,568627867		219,695019
KIFAP3	0,567709483		219,3401921
CAPN1	0,567537877		219,2738902
COX11	0,566354405		218,8166442
GLT8D4	0,566035014		218,6932442
HACL1	0,56371793		217,7980159
IFT88	0,562663344		217,3905661
NDUFB3	0,561240987		216,8410243
ANO10	0,561096127		216,7850564
ARL6	0,560155258		216,4215424
LPCAT3	0,559730076		216,2572689
ABCD3	0,55747212		215,3848853
COPG2	0,557180095		215,2720583
MIPEP	0,554396343		214,1965281
LEPR	0,551799358		213,1931572
C2orf76	0,549943138		212,4759882

표 2: Affymetrix Mouse Gene 1.0 ST 마이크로어레이로 마우스 세포주(NIH3T3, JAWSII 및 L929)의 조합된 분석으로부터 생성되는 안정한 mRNA. 마이크로어레이 상 26166 개의 mRNA 종 가운데 99개 mRNA 종이 "가장 안정한" mRNA 종으로 선택되었다. 이는 마이크로어레이에 존재하는 mRNA 종의 0.38%에 상응한다.

유전자 기호	제1시점 전사 수준에 비해 제2시점 전사 수준의 비율	비율의 평균	평균의 %
Ndufa1	1,571557917	0,209425963	750,4121719
Atp5e	1,444730129		689,8524465
Gstm5	1,436992822		686,1579154
Uqcr11	1,221605816		583,3115431
Ifi27l2a	1,203811772		574,8149632
Cbr2	1,162403907		555,0428852
Anapc13	1,153679871		550,8771953
Atp5l	1,126858713		538,0702074
Tmsb10	1,048459674		500,6350022
Nenf	1,045891853		499,4088786
Ndufa7	1,03898238		496,1096349
Atp5k	1,03623698		494,7987179
1110008P14Rik	1,029513775		491,5884162
Cox4i1	0,991815573		473,5876865
Cox6a1	0,991620272		473,4944312
Ndufs6	0,989419978		472,4438002
Sec61b	0,984420709		470,0566705
Romo1	0,981642576		468,7301241
Gnas	0,969128675		462,7547898
Snrpd2	0,962862199		459,7625743
Mgst3	0,96060161		458,6831531
Aldh2	0,949761281		453,5069425
2010107E04Rik	0,933570825		445,776069
Ssr4	0,930263069		444,1966294
Myl6	0,920572238		439,5692993
Prdx4	0,914830854		436,8278128
Ubl5	0,902505176		430,9423544
1110001J03Rik	0,888041155		424,0358468
Ndufa13	0,881735594		421,0249684
Ndufa3	0,880861551		420,6076163
Gstp2	0,87970004		420,0529997
Tmem160	0,878001416		419,2419142
Ergic3	0,87481135		417,7186716
Pgcp	0,870441149		415,6319192
Slpi	0,868909664		414,9006418
Myeov2	0,868175997		414,5503186
Ndufa4	0,862009116		411,6056594
Ndufs5	0,857586364		409,4938143
Gstm1	0,856672742		409,0575637
1810027O10Rik	0,855929863		408,7028424
Atp5o	0,848957424		405,3735324
Shfm1	0,841951399		402,0281856
Tspo	0,840567742		401,3674952
S100a6	0,840163495		401,1744691
Taldo1	0,8400757		401,1325475
Bloc1s1	0,838838894		400,541978
Hexa	0,826597959		394,6969835
Ndufb11	0,821601877		392,311376
Map1lc3a	0,816696063		389,968871
Morn2	0,810862522		387,18338
Gpx4	0,808459051		386,0357329
Mif	0,804105552		383,9569558
Cox6b1	0,803409855		383,6247633
2900010J23Rik	0,802900813		383,3816981
Sec61g	0,797138268		380,6301077
2900010M23Rik	0,793618387		378,9493795
Anapc5	0,793224505		378,7613023
Mars2	0,787395376		375,9779182
Phpt1	0,785668786		375,153479
Ndufb8	0,784300334		374,5000492
Pfdn5	0,779021933		371,9796349
Arpc3	0,77876305		371,8560197
Ndufb7	0,774103875		369,6312833
Atp5h	0,772255845		368,7488573
Mrpl23	0,77034041		367,834245
Tomm6	0,75481818		360,4224467
Mtch1	0,752594518		359,3606576
Pcbd2	0,752256847		359,199421
Ecm1	0,752254099		359,1981094
Hrsp12	0,749135357		357,708923
Mecr	0,746269148		356,3403207
Uqcrq	0,734462177		350,7025426
Gstm3	0,733839044		350,4049993
Lsm4	0,732100345		349,5747779
Park7	0,7307842		348,9463242
Usmg5	0,724562823		345,9756436
Cox8a	0,720194618		343,8898445
Ly6c1	0,716087602		341,9287619
Cox7b	0,713519017		340,7022736
Ppib	0,706106711		337,1629288
Bag1	0,70488561		336,5798584
S100a4	0,701675201		335,046902
Bcap31	0,700846929		334,6514056
Tecr	0,699592215		334,0522852
Rabac1	0,699161282		333,8465165
Robld3	0,694068018		331,4145049
Sod1	0,691852987		330,356837
Nedd8	0,691415017		330,1477083
Higd2a	0,689498548		329,2326025
Trappc6a	0,688046277		328,5391491
Ldhb	0,686084572		327,6024437
Nme2	0,685974394		327,5498339
Snrpg	0,684247073		326,7250454
Ndufa2	0,683350661		326,2970129
Serf1	0,681148053		325,2452768
Oaz1	0,681139695		325,2412861
Ybx1	0,678927132		324,1847964
Sepp1	0,677551422		323,5279009
Gaa	0,676314425		322,9372402

표 3: Affymetrix Human Gene 1.0 ST 마이크로어레이로 인간 세포주 HDF(인간 표피 섬유아세포)의 분석으로부터 생성되는 안정한 mRNA: 마이크로어레이 상 36079 개의 mRNA 종 가운데 46개 mRNA 종이 "가장 안정한" mRNA 종으로 선택되었다. 이는 마이크로어레이에 존재하는 mRNA 종의 0.13%에 상응한다.

유전자 기호	제1시점에 전사 수준에 비해 제2시점에 전사 수준의 비율	비율의 평균	평균의 %
ABCA6	2,062835692	0,278262352	741,3276273
LY96	1,719983635		618,1158256
CROT	1,422424006		511,1809038
ENPP5	1,315849211		472,880791
SERPINB7	1,12288882		403,5360196
TCP11L2	1,103519648		396,5752607
IRAK1BP1	1,05490107		379,1030521
CDKL2	1,042002646		374,4677057
GHR	1,039327135		373,5061992
KIAA1107	1,020519239		366,7471477
RPS6KA6	1,017695602		365,7324085
CLGN	1,007943464		362,2277524
TMEM45A	1,006063873		361,5522781
TBC1D8B	0,979626826		352,0515148
ACP6	0,964241225		346,5223439
RP6-213H19.1	0,960702414		345,2505905
C11orf74	0,960086216		345,0291458
SNRPN	0,939315038		337,5645433
GLRB	0,923441342		331,8599644
HERC6	0,919865006		330,5747254
CFH	0,908835974		326,6111879
GALC	0,90862766		326,5363257
PDE1A	0,908445187		326,4707497
GSTM5	0,902862912		324,4646303
CADPS2	0,89753131		322,5485959
AASS	0,894768872		321,5558503
TRIM6-TRIM34	0,892150571		320,6149031
SEPP1	0,891344657		320,3252795
PDE5A	0,890221551		319,9216656
SATB1	0,885139895		318,0954552
CCPG1	0,88148167		316,7807873
CNTN1	0,87246423		313,5401621
LMBRD2	0,871500964		313,1939903
TLR3	0,86777981		311,8567077
BCAT1	0,864255836		310,5902863
TOM1L1	0,86240499		309,925142
SLC35A1	0,857201353		308,055095
GLYATL2	0,85132258		305,9424223
STAT4	0,840572034		302,0789653
GULP1	0,839518351		301,7003001
EHHADH	0,82971807		298,1783427
NBEAL1	0,82554089		296,6771768
KIAA1598	0,820341324		294,8085928
HFE	0,815037603		292,9025779
KIAA1324L	0,808279102		290,4737547
MANSC1	0,8033973		288,7193664

2. 안정하게 발현된 mRNA의 5'- 및 3'-UTR 요소의 클로닝:

표 1-3에 나타낸 mRNA 종의 5'- 및/또는 3'-UTR의 뉴클레오티드 서열을 데이터베이스 검색을 통해 결정하고, PCR을 통해 증폭 또는 올리고 어닐링을 통해 합성하였다. 생성 PCR 절편을 하기 실시예 3에 구체적으로 개시된 것처럼 벡터로 클로닝하였다. 5'-UTR 요소를 벡터 PpLuc(GC) - albumin7 - A64 - C30 - hSL(서열번호 41, 도 7)로 클로닝하였고; 및 3'-UTR 요소를 벡터 32L4 - PpLuc(GC) - A64 - C30 - hSL(서열번호 35, 도 1) 또는 벡터 PpLuc(GC) - A64 - C30 - hSL(서열번호 44, 도 10)로 클로닝하였다.

3. DNA-주형의 제조

인비트로(in vitro) 전사를 위한 벡터는 포티너스 피랄리스(Photinus pyralis) 루시퍼라제 (PpLuc(GC))를 코딩하는 T7 프로모터 및 GC-풍부 서열을 포함하여 구성되었다. A64 폴리(A) 서열, 그 다음 C30 및 히스톤 스템-루프 서열을 PpLuc(GC)의 3'에 삽입하였다. 히스톤 스템-루프 서열 다음 인비트로 전사 전 벡터의 선형화(linearization)에 사용되는 제한 효소가 따른다.

단백질 발현에 다른 3'-UTR 요소의 효과를 조사하기 위해, 상기 설명된 벡터가 사용되고(대조군) 이러한 벡터를 나머지의 3'-UTR 요소를 포함하도록 변형시켰다. 그렇지 않으면, 벡터를 상기 설명된 것처럼 제조하고, 32L4(리보좀 단백질 라지 32)의 5' 비번역된 영역(5'-UTR)을 PpLuc(GC)의 5'에 삽입시켰다. 이러한 벡터를 이후 다른 3'-UTR 요소를 포함하거나 3'-UTR 요소가 없도록(대조군) 변형시켰다.

특히, 하기 mRNA는 인비트로 전사를 통해 그에 따른 이들 벡터로부터 수득되었다(mRNA 서열은 도 1 내지 6, 도 10, 11 및 도 19 내지 21에 묘사되었다):

32L4 - PpLuc(GC) - A64 - C30 - hSL (서열번호 35, 도 1);

32L4 - PpLuc(GC) - gnas - A64 - C30 - hSL (서열번호 36, 도 2);

32L4 - PpLuc(GC) - morn2 - A64 - C30 - hSL (서열번호 37, 도 3);

32L4 - PpLuc(GC) - gstm1 - A64 - C30 - hSL (서열번호 38, 도 4);

32L4 - PpLuc(GC) - ndufa1 - A64 - C30 - hSL (서열번호 39, 도 5);

32L4 - PpLuc(GC) - cbr2 - A64 - C30 - hSL (서열번호 40, 도 6);

PpLuc(GC) - A64 - C30 - hSL (서열번호 44, 도 10);

PpLuc(GC) - gnas - A64 - C30 - hSL (서열번호 45, 도 11);

32L4 - PpLuc(GC) - Ybx1(V2)-A64-C30-hSL (서열번호 46, 도 19);

32L4 - PpLuc(GC) - Ndufb8-A64-C30-hSL (서열번호 47, 도 20); 및

32L4 - PpLuc(GC) - Cntn1-004(V2)-A64-C30-hSL (서열번호 48, 도 21).

구성 32L4 - PpLuc(GC) - A64 - C30 - hSL에 대한 대체(alternative) 서열은 도 25에 나타내었다(서열번호 383). 그러나, 서열번호 35, 도 1은 본 발명에 설명된 것처럼 실시예에 사용되었고, 따라서 구성 32L4 - PpLuc(GC) - A64 - C30 - hSL이 바람직하다.

단백질 발현에 여러 5'-UTR 요소의 효과를 조사하기 위해, 벡터를 상기 설명된 것처럼 구성하였고, 알부민 7(T7 종결 신호뿐만 아니라 HindIII 및 XbaI 제한 부위를 제거하기 위해 도입된 3개의 단일 점 돌연변이가 있는 인간 알부민의 3'-UTR)을 PpLuc(GC)의 3'에 삽입시켰다. 이러한 벡터를 다른 5'-UTR 요소를 포함하거나 5'-UTR이 없도록(대조군) 변형시켰다.

특히, 하기 mRNA는 인비트로 전사를 통해 그에 따라 이들 벡터로부터 수득하였다(mRNA 서열은 도 7 내지 9에 묘사됨):

PpLuc(GC) - albumin7 - A64 - C30 - hSL (서열번호 41, 도 7);

Mp68 - PpLuc(GC) - albumin7 - A64 - C30 - hSL (서열번호 42, 도 8); 및

Ndufa4 - PpLuc(GC) - albumin7 - A64 - C30 - hSL (서열번호 43, 도 9);

4. 인비트로 전사

실시예 2 및 3에 따른 DNA 주형을 선형화시키고 T7-RNA 폴리머라제를 사용하여 인비트로에서 전사시켰다. 그 다음 상기 DNA 주형을 DNase-처리를 통해 소화시켰다. 5'-CAP 구조를 포함하는 mRNA 전사체를 전사 반응에 N7-메틸-구아노신-5'-트리포스페이트-5'-구아노신의 과량을 첨가함으로써 수득하였다. 이에 따라 수득된 mRNA를 정제하고 물에 재현탁시켰다.

5. mRNA 리포펙션을 통해 루시퍼라제 발현

인간 표피 섬유아세포(HDF) 및 HeLa 세포를 웰 당 1x10⁴의 밀도로 96 웰 플레이트에 시드하였다. 그 다음 날, 세포를 Opti-MEM에서 세척하고 이후 Opti-MEM에서 웰 당 12.5 ng의 리포펙타민2000-복합화된 PpLuc를 부호화하는 mRNA로 형질주입시켰다. 형질주입되지 않은 세포는 대조군으로 제공되었다. 레닐라 레니포르미스(Renilla reniformis) 루시퍼라제(RrLuc)를 코딩하는 mRNA를 형질주입 효율을 조절하기 위해 PpLuc mRNA와 함께 형질주입시켰다 (웰 당 1 ng의 RrLuc mRNA). 형질주입 시작 90분 후, Opti-MEM은 배지로 교환되었다. 형질주입 6, 24, 48, 72시간 후, 배지를 흡인하고(aspirated) 세포를 100 μl의 Passive Lysis 버퍼 (Promega)에 용해시켰다. 용해물을 루시퍼라제 활성을 측정할 때까지 -80°C에 저장하였다.

6. 루시퍼라제 측정

루시퍼라제 활성을 Hidex Chameleon 플레이트 리더에서 상대적 광 단위(RLU)로 측정하였다. Ppluc 및 Rrluc의 활성을 듀얼 루시퍼라제 분석에서 단일 샘플로부터 연속하여 측정하였다. PpLuc 활성을 20 μl의 용해물 및 50 μl의 Beetle juice (pjk GmbH)를 사용하여 2초의 측정 시간으로 먼저 측정하였다. 1500ms 지연 이후 RrLuc 활성을 50 μl Renilla juice (pjk GmbH)로 측정하였다.

7. 결과

a. 본 발명에 따른 3'-UTR 요소를 포함하는 mRNA로부터 단백질 발현은 연장 및/또는 증가된다.

mRNA로부터 단백질 발현에 다양한 3'-UTR 요소의 효과를 조사하기 위해, 여러 3'-UTR 요소를 포함하는 mRNA를 3'-UTR이 없는 mRNA와 비교하였다.

인간 HeLa 및 HDF 세포를 루시퍼라제를 부호화하는 mRNA로 형질주입하고 루시퍼라제 수준(RLU로)을 형질 주입 6, 24, 48, 및 72시간 후 측정하였다. PpLuc 신호는 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율에 대해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다(하기 표 4 및 도 12(HeLa 세포) 및 13(HDF 세포) 참조).

표 4:

mRNA	HeLa			HDF
mRNA	24h	48h	72h	24h	48h	72h
32L4-PpLuc(GC)-A64-C30-hSL	100	12,3	2,7	100	34,8	10,9
32L4-PpLuc(GC)-gnas-A64-C30-hSL	100	50,5	30,9	100	79,8	27,8
32L4-PpLuc(GC)-morn2-A64-C30-hSL	100	32,9	10,5	100	44,5	14,6
32L4-PpLuc(GC)-gstm1-A64-C30-hSL	100	24,8	7,6	100	46,5	21,4
32L4-PpLuc(GC)-ndufa1-A64-C30-hSL	100	29,4	10,6	100	41,9	13,9
32L4-PpLuc(GC)-cbr2-A64-C30-hSL	100	21,9	4,9	100	60,0	23,2

표 4는 RrLuc에 표준화된 상대적인 PpLuc 발현을 나타낸다(3회 독립적인 실험의 평균 값이 주어졌다).

루시퍼라제는 3'-UTR이 없는 mRNA로부터 발현되었다. 그러나, 본 발명의 3'-UTR 요소 gnas, morn2, gstm1, ndufa 및 cbr2는 루시퍼라제 발현을 현저하게 연장시켰다.

b. 본 발명에 따른 5'-UTR 요소를 포함하는 mRNA로부터 단백질 발현은 증가 및/또는 연장된다.

mRNA로부터 단백질 발현에 다양한 5'-UTR 요소의 효과를 조사하기 위해, 여러 5'-UTR을 포함하는 mRNA를 5'-UTR이 없는 mRNA와 비교하였다.

인간 HeLa 및 HDF 세포를 mRNA를 부호화하는 루시퍼라제로 형질주입하고 루시퍼라제 수준을 형질주입 6, 24, 48, 72시간 후 측정하였다. PpLuc 신호는 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율에 대해 보정되었다. 0 내지 72 시간에 총 단백질 발현을 곡선 아래 영역(AUC)로 계산하였다. 5'UTR이 없는 대조군 구성의 수준을 1로 설정하였다(하기 표 5 및 도 14(HeLa 세포) 및 15(HDF 세포) 참조).

표 5:

mRNA	AUC HeLa	AUC HDF
PpLuc(GC)-albumin7-A64-C30-hSL	1,00	1,07
Mp68-PpLuc(GC)-albumin7-A64-C30-hSL	1,79	3,03
Ndufa4-PpLuc(GC)-albumin7-A64-C30-hSL	1,92	2,83

표 5는 RrLuc에 표준화된 총 PpLuc 발현을 나타낸다(3회 독립 실험의 평균 값이 주어졌다).

루시퍼라제는 5'-UTR이 없는 mRNA로부터 발현되었다. 그러나, 본 발명의 5'-UTR 요소 mp68 및 ndufa4는 루시퍼라제 발현을 현저하게 증가시켰다.

c. 본 발명에 따른 3'-UTR 요소를 포함하는 mRNA로부터 단백질 발현이 연장되었다.

mRNA로부터 단백질 발현에 다양한 3'-UTR의 효과를 조사하기 위해, 여러 3'UTR을 포함하는 mRNA를 3'UTR이 없는 mRNA와 비교하였다.

인간 HeLa 및 HDF 세포를 mRNA를 부호화하는 루시퍼라제로 형질주입하고 루시퍼라제 수준(RLU로)을 형질주입 24, 48, 및 72시간 후 측정하였다. PpLuc 신호는 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율에 대해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다(하기 표 6 및 도 16(HeLa 세포) 및 17(HDF 세포) 참조).

표 6:

mRNA	HeLa			HDF
mRNA	24h	48h	72h	24h	48h	72h
PpLuc(GC)-gnas-A64-C30-hSL	100	61,1	30,3	100	53,6	34,2
PpLuc(GC)-A64-C30-hSL	100	17,1	2,7	100	29,0	12,4

표 6은 RrLuc에 표준화된 상대적인 PpLuc 발현을 나타낸다(3회 독립 실험의 평균 값이 주어졌다).

d. 본 발명에 따른 3'-UTR 요소를 포함하는 mRNA로부터 단백질 발현이 연장되었다.

mRNA로부터 단백질 발현에 다양한 3'UTR 요소의 효과를 조사하기 위해, 여러 3'UTR을 포함하는 mRNA를 3'UTR이 없는 mRNA와 비교하였다.

인간 HeLa 및 HDF 세포를 mRNA를 부호화하는 루시퍼라제로 형질주입하고 루시퍼라제 수준을 형질주입 6, 24, 48, 72시간 후 측정하였다. PpLuc 신호는 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율에 대해 보정되었다. 0 내지 72 시간에 총 단백질 발현을 곡선 아래 영역(AUC)로 계산하였다. 5'UTR이 없는 대조군 구성의 수준을 1로 설정하였다(하기 표 7 및 도 18(HDF 세포) 및 17(HeLa 세포) 참조).

인간 HeLa 및 HDF 세포를 mRNA를 부호화하는 루시퍼라제로 형질주입하고 루시퍼라제 수준(RLU로)을 형질주입 24, 48, 및 72시간 후 측정하였다. PpLuc 신호는 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율에 대해 보정되었다. 24시간에 표준화된 PpLuc 수준을 100%로 설정하고 24시간에 상대적인 발현을 계산하였다(하기 표 7 및 도 18(HDF 세포) 참조).

표 7:

mRNA	HDF
mRNA	24h	48h	72h
32L4-PpLuc(GC)-Ybx1-001(V2)-A64-C30-hSL	100	57,0	28,5
32L4-PpLuc(GC)-Ndufb8-A64-C30-hSL	100	65,4	37,6
32L4-PpLuc(GC)-Cntn1004(V2)-A64-C30-hSL	100	71,0	47,7
32L4-PpLuc(GC)-A64-C30-hSL	100	45,2	21,87

표 7은 RrLuc에 표준화된 상대적인 PpLuc 발현을 나타낸다 (3회 독립 실험의 평균 값이 주어졌다).

8. 단백질 발현에 추가적 3'UTR의 효과

mRNA로부터 단백질 발현에 다양한 3'UTR의 효과를 추가적으로 조사하기 위해, 새로운 mRNA 구성을 제조하고 여러 3'-UTR을 포함하는 이들 mRNA를 3'UTR이 없는 mRNA와 비교하였다.

이를 위해, 선택된 3'-UTR 요소 (gnas, morn2, ndufa1 및 NDUFA1)를 벡터 PpLuc(GC) - A64 - C30 - hSL (서열번호 44, 도 10)로 클로닝하고, 이는 T7 프로모터 및 포티너스 피랄리스(Photinus pyralis) 루시퍼라제(PpLuc(GC))를 코딩하는 GC-풍부 서열을 포함하여 구성되었다. A64 폴리(A) 서열, 다음 C30 및 히스톤 스템-루프 서열이 PpLuc(GC)의 3'에 삽입되었다. 히스톤 스템-루프 서열 다음 제한 부위는 인비트로 전사 전 벡터의 선형화를 위해 사용되었다.

특히, 하기 mRNA는 인비트로 전사를 통해 이러한 벡터로부터 수득되었다(mRNA 서열은 도 11 및 26 내지 28에 묘사됨:

PpLuc(GC) - gnas - A64 - C30 - hSL (서열번호 45, 도 11);

PpLuc(GC) - morn2 - A64 - C30 - hSL (서열번호 384, 도 26);

PpLuc(GC) - ndufa1 - A64 - C30 - hSL (서열번호 385, 도 27); 및

PpLuc(GC) - NDUFA1 - A64 - C30 - hSL (서열번호 386, 도 28).

인간 HeLa 세포를 mRNA를 부호화하는 루시퍼라제로 형질주입하고 루시퍼라제 수준을 형질주입 24, 48, 및 72시간 후 측정하였다. PpLuc 신호를 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율을 위해 보정하였다 (하기 표 8 및 도 22 참조).

mRNA	HeLa (발현 % )
mRNA	24h	48h	72h
PpLuc(GC)-gnas-A64-C30-hSL	100	77,9	36,7
PpLuc(GC)-morn2-A64-C30-hSL	100	53,8	17,2
PpLuc(GC)-ndufa1-A64-C30-hSL	100	55,2	17,9
PpLuc(GC)-NDUFA1-A64-C30-hSL	100	66,9	29,4
PpLuc(GC)-A64-C30-hSL	100	41,5	9,6

표 8: RrLuc에 표준화된 상대적 PpLuc 발현 (3회 독립 실험의 평균 값이 주어졌다).

이들 데이터 및 도 22에 나타낸 데이터는 본 발명에 따른 3'-UTR 요소를 포함하는 mRNA로부터 단백질 발현이 연장됨을 나타낸다.

9. 단백질 발현에 추가적 5'UTR의 효과

mRNA로부터 단백질 발현에 다양한 5'UTR의 효과를 추가적으로 조사하기 위해, 새로운 mRNA 구성을 제조하고 다른 5'UTR을 포함하는 이들 mRNA를 5'UTR이 없는 mRNA와 비교하였다.

이를 위해, 선택된 5'-UTR 요소(mp68 및 ndufa4)를 벡터 PpLuc(GC)-A64-C30-hsL(서열번호 44, 도 10)으로 클로닝하였으며, 이는 T7 프로모터 및 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 서열(PpLuc(GC))를 포함하여 구성된다. A64 폴리(A) 서열 다음 C30 및 히스톤 스템-루프 서열을 PpLuc(GC)의 3'으로 삽입하였다. 히스톤 스템-루프 서열 다음 제한 부위는 인비트로 전사 전 벡터의 선형화를 위해 사용되었다.

특히, 하기 mRNA는 인비트로 전사를 통해 이러한 벡터로부터 수득되었다 (mRNA 서열은 도 29 및 30에 묘사됨:

Mp68 - PpLuc(GC) - A64 - C30 - hSL (서열번호 387, 도 29); 및

Ndufa4 - PpLuc(GC) -A64 - C30 - hSL (서열번호 388, 도 30).

인간 HDF 및 HeLa 세포는 루시퍼라제를 부호화하는 mRNA로 형질주입되었고, 루시퍼라제 수준은 형질주입 24, 48 및 72 시간 후 측정되었다. PpLuc 신호는 공동 형질주입된 RrLuc의 신호를 통해 형질주입 효율을 위해 보정되었다. 총 단백질 발현(곡선 아래 영역)이 계산되었다. 5'UTR이 없는 대조군 구성의 수준을 1로 설정하였다(하기 표 9 및 도 23 및 24 참조).

mRNA	AUC HDF	AUC HeLa
PpLuc(GC) -A64-C30-hSL	1,0	1,0
Mp68-PpLuc(GC)- A64-C30-hSL	3,9	2,3
Ndufa4-PpLuc(GC)- A64-C30-hSL	4,0	2,0

표 9: RrLuc에 표준화된 총 PpLuc 발현 (평균 RLU 값이 주어짐).

이들 데이터 및 도 23 및 24에 나타난 데이터는 본 발명에 따른 5'-UTR 요소를 포함하는 mRNA로부터 단백질 발현이 증가됨을 보여준다.

SEQUENCE LISTING <110> CUREVAC AG <120> Novel artificial nucleic acid molecules <130> IMP173019DE / CU01P167WO1 <150> PCT/EP2014/003479 <151> 2014-12-30 <160> 388 <170> PatentIn version 3.5 <210> 1 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus GNAS 3'-UTR <400> 1 gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60 gtacaagcag ttggtcaccc accatagggc atgatcaaca ccgcaacctt tcctttttcc 120 cccagtgatt ctgaaaaacc cctcttccct tcagcttgct tagatgttcc aaatttagta 180 agcttaaggc ggcctacaga agaaaaagaa aaaaaaggcc acaaaagttc cctctcactt 240 tcagtaaata aaataaaagc agcaacagaa ataaagaaat aaatgaaatt caaaatgaaa 300 taaatattgt ttgtgcagca ttaaaaaatc aataaaaatt aaaaatgagc a 351 <210> 2 <211> 353 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus GNAS 3'-UTR <400> 2 gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60 tgtacaagca gttggtcacc caccataggg catgatcaac accgcaacct ttcctttttc 120 ccccagtgat tctgaaaaac ccctcttccc ttcagcttgc ttagatgttc caaatttagt 180 aagcttaagg cggcctacag aagaaaaaga aaaaaaaggc cacaaaagtt ccctctcact 240 ttcagtaaat aaaataaaag cagcaacaga aataaagaaa taaatgaaat tcaaaatgaa 300 ataaatattg tgttgtgcag cattaaaaaa tcaataaaaa ttaaaaatga gca 353 <210> 3 <211> 385 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GNAS 3'-UTR <400> 3 gaagggaacc cccaaattta attaaagcct taagcacaat taattaaaag tgaaacgtaa 60 ttgtacaagc agttaatcac ccaccatagg gcatgattaa caaagcaacc tttcccttcc 120 cccgagtgat tttgcgaaac ccccttttcc cttcagcttg cttagatgtt ccaaatttag 180 aaagcttaag gcggcctaca gaaaaaggaa aaaaggccac aaaagttccc tctcactttc 240 agtaaaaata aataaaacag cagcagcaaa caaataaaat gaaataaaag aaacaaatga 300 aataaatatt gtgttgtgca gcattaaaaa aaatcaaaat aaaaattaaa tgtgagcaaa 360 gaatgaaaaa aaaaaaaaaa aaaaa 385 <210> 4 <211> 1476 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GNAS 3'-UTR <400> 4 tggaggacgc cgtccagatt ctccttgttt tcatggattc aggtgctgga gaatctggta 60 aaagcaccat tgtgaagcag atgaggatcc tgcatgttaa tgggtttaat ggagagggcg 120 gcgaagagga cccgcaggct gcaaggagca acagcgatgg cagtgagaag gcaaccaaag 180 tgcaggacat caaaaacaac ctgaaagagg cgattgaaac cattgtggcc gccatgagca 240 acctggtgcc ccccgtggag ctggccaacc ccgagaacca gttcagagtg gactacatcc 300 tgagtgtgat gaacgtgcct gactttgact tccctcccga attctatgag catgccaagg 360 ctctgtggga ggatgaagga gtgcgtgcct gctacgaacg ctccaacgag taccagctga 420 ttgactgtgc ccagtacttc ctggacaaga tcgacgtgat caagcaggct gactatgtgc 480 cgagcgatca ggacctgctt cgctgccgtg tcctgacttc tggaatcttt gagaccaagt 540 tccaggtgga caaagtcaac ttccacatgt ttgacgtggg tggccagcgc gatgaacgcc 600 gcaagtggat ccagtgcttc aacgatgtga ctgccatcat cttcgtggtg gccagcagca 660 gctacaacat ggtcatccgg gaggacaacc agaccaaccg cctgcaggag gctctgaacc 720 tcttcaagag catctggaac aacagatggc tgcgcaccat ctctgtgatc ctgttcctca 780 acaagcaaga tctgctcgct gagaaagtcc ttgctgggaa atcgaagatt gaggactact 840 ttccagaatt tgctcgctac actactcctg aggatgctac tcccgagccc ggagaggacc 900 cacgcgtgac ccgggccaag tacttcattc gagatgagtt tctgaggatc agcactgcca 960 gtggagatgg gcgtcactac tgctaccctc atttcacctg cgctgtggac actgagaaca 1020 tccgccgtgt gttcaacgac tgccgtgaca tcattcagcg catgcacctt cgtcagtacg 1080 agctgctcta agaagggaac ccccaaattt aattaaagcc ttaagcacaa ttaattaaaa 1140 gtgaaacgta attgtacaag cagttaatca cccaccatag ggcatgatta acaaagcaac 1200 ctttcccttc ccccgagtga ttttgcgaaa cccccttttc ccttcagctt gcttagatgt 1260 tccaaattta gaaagcttaa ggcggcctac agaaaaagga aaaaaggcca caaaagttcc 1320 ctctcacttt cagtaaaaat aaataaaaca gcagcagcaa acaaataaaa tgaaataaaa 1380 gaaacaaatg aaataaatat tgtgttgtgc agcattaaaa aaaatcaaaa taaaaattaa 1440 atgtgagcaa agaatgaaaa aaaaaaaaaa aaaaaa 1476 <210> 5 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus MORN2 3'-UTR <400> 5 acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60 ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcaccc 117 <210> 6 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus MORN2 3'-UTR <400> 6 acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60 ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcacccaca 120 aaaaaaaaaa aaaaa 135 <210> 7 <211> 210 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MORN2 3'-UTR <400> 7 catgtagatg tgatgttaaa ttaaagttga aatgtagtaa ttgaagcttt tagttgtaag 60 gaaagcaact taatctgtta tttgaaatga cttcatacac tacccctata agtttgccaa 120 taaaaccatc acctgcttac acctttttga actttatatt cattgtctta caattagttt 180 aaaataaatg acatgattca aaaaaaaaaa 210 <210> 8 <211> 438 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus GSTM1 3'-UTR <400> 8 gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60 tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120 tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180 ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240 tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300 gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360 agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420 tgaaacacac ttgccatg 438 <210> 9 <211> 455 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus GSTM1 3'-UTR <400> 9 gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60 tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120 tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180 ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240 tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300 gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360 agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420 tgaaacacac ttgccatgaa aaaaaaaaaa aaaaa 455 <210> 10 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GSTM1 3'-UTR <400> 10 ggccttgaag gccaggaggt gggagtgagg agcccatact cagcctgctg cccaggctgt 60 gcagcgcagc tggactctgc atcccagcac ctgcctcctc gttcctttct cctgtttatt 120 cccatcttta ctcccaagac ttcattgtcc ctcttcactc cccctaaacc cctgtcccat 180 gcaggccctt tgaagcctca gctacccact atccttcgtg aacatcccct cccatcatta 240 cccttccctg cactaaagcc agcctgacct tccttcctgt tagtggttgt gtctgcttta 300 aagggcctgc ctggcccctc gcctgtggag ctcagccccg agctgtcccc gtgttgcatg 360 aaggagcagc attgactggt ttacaggccc tgctcctgca gcatggtccc tgccttaggc 420 ctacctgatg gaagtaaagc ctcaaccaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 531 <210> 11 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus NDUFA1 3'-UTR <400> 11 ggaagcattt tcctggctga ttaaaagaaa ttactcagct atggtcatct gttcctgtta 60 gaaggctatg cagcatatta tatactatgc gcatgttatg aaatgcataa taaaaaattt 120 taaaaaatct aaa 133 <210> 12 <211> 148 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NDUFA1 3'-UTR <400> 12 ggaagcattt tcctgattga tgaaaaaaat aactcagtta tggccatcta cccctgctag 60 aaggttacag tgtattatgt agcatgcaat gtgttatgta gtgcttaata aaaataaaat 120 gaaaaaaatg caaaaaaaaa aaaaaaaa 148 <210> 13 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus CBR2 3'-UTR <400> 13 tctgctcagt tgccgcggac atctgagtgg ccttcttagc cccaccctca gccaaagcat 60 ttactgatct cgtgactccg ccctcatgct acagccacgc ccaccacgca gctcacagtt 120 ccacccccat gttactgtcg atcccacaac cactccaggc gcagaccttg ttctctttgt 180 ccactttgtt gggctcattt gcctaaataa acgggccacc gcgttacctt taactat 237 <210> 14 <211> 416 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus YBX1 3'-UTR <400> 14 atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60 tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120 tttgcccgct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180 tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240 aaaaaaaggc ctggtttttc tcaatacacc tttaacggtt tttaaattgt ttcatatctg 300 gtcaagttga gatttttaag aacttcattt ttaatttgta ataaagttta caacttgatt 360 ttttcaaaaa agtcaacaaa ctgcaagcac ctgttaataa aggtcttaaa taataa 416 <210> 15 <211> 418 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus YBX1 3'-UTR <400> 15 atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60 tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120 tttgccctct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180 tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240 aaaaaaaaag gcctggtttt tctcaataca cctttaacgg tttttaaatt gtttcatatc 300 tggtcaagtt gagattttta agaacttcat ttttaatttg taataaagtt tacaacttga 360 ttttttcaaa aaagtcaaca aactgcaagc acctgttaat aaaggtctta aataataa 418 <210> 16 <211> 415 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens YBX1 3'-UTR <400> 16 atgccggctt accatctcta ccatcatccg gtttagtcat ccaacaagaa gaaatatgaa 60 attccagcaa taagaaatga acaaaagatt ggagctgaag acctaaagtg cttgcttttt 120 gcccgttgac cagataaata gaactatctg cattatctat gcagcatggg gtttttatta 180 tttttaccta aagacgtctc tttttggtaa taacaaacgt gttttttaaa aaagcctggt 240 ttttctcaat acgcctttaa aggtttttaa attgtttcat atctggtcaa gttgagattt 300 ttaagaactt catttttaat ttgtaataaa agtttacaac ttgatttttt caaaaaagtc 360 aacaaactgc aagcacctgt taataaaggt cttaaataat aaaaaaaaaa aaaaa 415 <210> 17 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufb8 3'-UTR <400> 17 ggaggcttga tgggcttttt gccctcgttc ctagaggctt aaccataata aaatccctaa 60 taaagc 66 <210> 18 <211> 125 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens Ndufb8 3'-UTR <400> 18 ggaggcttcg tgggcttttg ggtcctctaa ctaggactcc ctcattccta gaaatttaac 60 cttaatgaaa tccctaataa aactcagtgc tgtgttattt gtgcctcaaa aaaaaaaaaa 120 aaaaa 125 <210> 19 <211> 377 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens Ndufb8 3'-UTR <400> 19 gtgaggaaga ggagtgctgt tcctgccttc ctagcccagc tgggtctgac cagaggctac 60 tgtgtaccca tttaccatgc gtgattgtta actcagagtg gggtgtagcc aggtattgac 120 tgaatgtatg ttcttgctga cctgtgtttt tttctgtagg gaccaaagca gtatccttac 180 aataatctgt acctggaacg aggcggtgat ccctccaaag aaccagagcg ggtggttcac 240 tatgagatct gaggaggctt cgtgggcttt tgggtcctct aactaggact ccctcattcc 300 tagaaattta accttaatga aatccctaat aaaactcagt gctgtgttat ttgtgcctca 360 aaaaaaaaaa aaaaaaa 377 <210> 20 <211> 922 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1-004 3'-UTR <400> 20 tcgttgacac tcaccatttc tgtgaaagac tttttttttt tttaacatat tatactagat 60 ttgactaact caatcttgta gcttctgcag ttctccccac ccccaaccta gttcttagag 120 tatgtttccc cttttgaaac atgtaaacat actttgggca taaatatttt ttaaaatata 180 actataatgc ttcactaata ccttaaaaat gcctagtgaa ctaactcagt acattatata 240 atggccaagt gaaagttttg tgttttcatg tcctgttttt ctttgaaatt atatagccca 300 gaaattagct cattatctga aaaacgtata agaactgatg aattgtataa tacaggagta 360 ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420 tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480 tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540 caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600 gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660 ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720 tagatctttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780 ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaatg 840 ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900 ataattttga ttttcttaga ca 922 <210> 21 <211> 922 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1-004 3'-UTR <400> 21 tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60 tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120 atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180 ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240 tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300 aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360 ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420 tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480 tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540 caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600 gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660 ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720 tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780 ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840 ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900 ataattttga ttttcttaga ca 922 <210> 22 <211> 928 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1-004 3'-UTR <400> 22 ttttttcgtt gacactcacc atttctgtga aagacttttt ttttttttaa catattatac 60 tagatttgac taactcaatc ttgtagcttc tgcagttctc cccaccccca acctagttct 120 tagagtatgt ttcccctttt gaaacatgta aacatacttt gggcataaat attttttaaa 180 atataactat aatgcttcac taatacctta aaaatgccta gtgaactaac tcagtacatt 240 atataatggc caagtgaaag ttttgtgttt tcatgtcctg tttttctttg aaattatata 300 gcccagaaat tagctcatta tctgaaaaac gtatgaagaa ctgatgaatt gtataataca 360 ggagtattgc cattgaatgt actgtttgat ttattcaagc aggtaatgaa caatgttgtc 420 aaactctcta atgagacatc ataattagga cataagctaa aaggggcatt actccggcag 480 tctttttttc ttaatcctag taccatacat attctttggc atgaaagaat gaaaagcatt 540 agtaaacaac tgaagtccta ccatggctct gtagggtttt tggaacaatt cctggaattg 600 gaaagtgaaa atggatagca tgtgggggaa accctcatct gagtagcaag attttagtaa 660 agatgactaa gccattaaca gcatgcattc atatttaatt ttattgactc ctgccatcag 720 cttttgtaga tcttttgggt ggaaggttgt gatttttact gggaggactt gagtagaagt 780 ggatgattaa aattgaggag tatataattc tttctgggac tgcttaaatg ttattgtttg 840 aaaatgcctt cactttcccc ctttggtcaa agagatgtgc ttaaaattct tattccttca 900 caataaataa ttttgatttt cttagaca 928 <210> 23 <211> 2380 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1-004 3'-UTR <400> 23 atgtgttgtg acagctgctg ttcccatccc agctcagaag acacccttca accctgggat 60 gaccacaatt ccttccaatt tctgcggctc catcctaagc caaataaatt atactttaac 120 aaactattca actgatttac aacacacatg atgactgagg cattcgggaa ccccttcatc 180 caaaagaata aacttttaaa tggatataaa tgatttttaa ctcgttccaa tatgccttat 240 aaaccactta acctgattct gtgacagttg catgatttaa cccaatggga caagttacag 300 tgttcaattc aatactatag gctgtagagt gaaagtcaaa tcaccatata caggtgcttt 360 aaatttaata acaagttgtg aaatataata gagattgaaa tgttggttgt atgtggtaaa 420 tgtaagagta atacagtctc ttgtactttc ctcactgttt tgggtactgc atattattga 480 atggccccta tcattcatga catcttgagt tttcttgaaa agacaataga gtgtaacaaa 540 tattttgtca gaaatcccat tatcaaatca tgagttgaaa gattttgact attgaaaacc 600 aaattctaga acttactatc agtattctta ttttcaaagg aaataatttt ctaaatattt 660 gattttcaga atcagttttt taatagtaaa gttaacatac catatagatt tttttttact 720 tttatattct actctgaagt tattttatgc ttttcttatc aatttcaaat ctcaaaaatc 780 acagctctta tctagagtat cataatattg ctatatttgt tcatatgtgg agtgacaaat 840 tttgaaaagt agagtgcttc cttttttatt gagatgtgac agtctttaca tggttaggaa 900 taagtgacag ttaagtgaat atcacaatta ctagtatgtt ggtttttctg cttcattcct 960 aagtattacg tttctttatt gcagatgtca gatcaaaaag tcacctgtag gttgaaaaag 1020 ctaccgtatt ccattttgta aaaataacaa taataataat aataataatt agttttaagc 1080 tcatttccca cttcaatgca atactgaaaa ctggctaaaa ataccaaatc aatatactgc 1140 taatggtact ttgaagagta tgcaaaactg gaaggccagg aggaggcaaa taatatgtct 1200 ttccgatggt gtctcccaag tgttggtgct ttgggttttt ataagttgtg aaaaggaaga 1260 tgcacatttc ttcattctcc atggtgtgca tggaaatgtg tttgagtgtg gatgtaaaag 1320 aaatcgagta ataaagaatt agctggcttg tgaaatagtg cagtgttgga tgcttcaaga 1380 ggtataatcc tattttatta gcacaaactt gctagctaat tagagtttat ctttttagaa 1440 aggacaccgt ataggttcgt aaaaaatatt tacaggaagc aaaatagatc tattactact 1500 ttaccgactt tacccccttt ctttaatttg tataattttt gtactatata tcgatgtgta 1560 aatgtttaga gtcttcatta tgaaaatatc aataaatatt tcattagttt acatttaact 1620 ctggtataaa atgaaacttt taaaaataag tgaaatggat gatttcccag tggaagtatg 1680 tcaacagtct taagatcatt gccagatttc ataaaatatt taagtatttg aaaaagaaac 1740 aaaatgtctt catactttag ggaaacgaat accctgtata ccttctgtac aaatgtttgt 1800 gttttcattg ttacactttg gggttttact tttgcaatgt gacccatgtt gggcattttt 1860 atataatcaa caactaaatc ttttgccaaa tgcatgcttg ccttttattt tctaatatat 1920 gataataacg agcaaaactg gttagatttt gcatgaaatg gttctgaaag gtaagaggaa 1980 aacagacttt ggaggttgtt tagttttgaa tttctgacag agataaagta gtttaaaatc 2040 tctcgtacac tgataactca agcttttcat tttctcatac agttgtacag atttaactgg 2100 gaccatcagt tttaaactgt tgtcaagcta actaataatc atctgcttta agacgcaaga 2160 ttctgaatta aactttatat aggtatagat acatctgttg tttctttgta tttcaggaaa 2220 ggtgatagta gttttatttg atactgataa atattgaatt gattttttag ttatttttta 2280 tcattttttc aatggagtag tataggactg tgctttgtcc tttttatgaa tgaaaaaatt 2340 agtataaagt aataaatgtc ttatgttacc caagaaaaaa 2380 <210> 24 <211> 1204 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1-004 3'-UTR <400> 24 tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60 tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120 atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180 ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240 tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300 aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360 ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420 tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480 tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540 caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600 gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660 ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720 tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780 ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840 ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900 ataattttga ttttcttaga caggtttgtg tttaggtatg agtttctctt ttacttcatc 960 tagcaattct ctctgtggtc agaagaactc tgaagaaagc tttgagggaa atgaatataa 1020 ctcttaaatt attatatgtg tgtgtatata tatagtttaa ctttaaaaat aatttattag 1080 tcatcataaa gaaataaatg tctctggctc aagatgttac ttatttcctt cttttatatt 1140 ttctagtctc aattactgtt ccaaaaggag ctatcttaga acttagacta gagatccaga 1200 ttaa 1204 <210> 25 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus MP68 5'-UTR <400> 25 ctttcccatt ctgtagcaga atttggtgtt gcctgtggtc ttggtcccgc ggag 54 <210> 26 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MP68 5'-UTR <400> 26 cttcccggca tcccctgcgc gcgcctgcgc gctcggtgac ctttccgagt tggctgcaga 60 tttgtggtgc gttctgagcc gtctgtcctg cgccaag 97 <210> 27 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MP68 5'-UTR <400> 27 cttcccggca tcccctgcgc gcgcctgcgc gctcggtgac ctttccgagt tggctgcaga 60 tttgtggtgc gttctgagcc gtctgtcctg cgccaaggga gcgtaccttg gccttgagag 120 gttcagctgc ctaacccaga ggctacgcag agttagagaa gccagagtcc aagccaagaa 180 ctctgactcc acatccagtc ccttctctcc tttataactc aagtttcctt gcgccacact 240 gccctccacg ttatgctgta catgacaact tgggtgaggc aacagggaag ctgaaaagag 300 atcatacggt gctga 315 <210> 28 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus NDUFA4 5'-UTR <400> 28 gtccgctcag ccaggttgca gaagcggctt agcgtgtgtc ctaatcttct ctctgcgtgt 60 aggtaggcct gtgccgcaaa c 81 <210> 29 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NDUFA4 5'-UTR <400> 29 guccgcucag ccagguugca gaagcggcuu agcguguguc cuaaucuucu cucugcgugu 60 agguaggccu gugccgcaaa c 81 <210> 30 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NDUFA4 5'-UTR <400> 30 gggtccttca ggtaggaggt cctgggtgac tttggaagtc cgtagtgtct cattgcagat 60 aatttttagc ttagggcctg gtggctaggt cggttctctc ctttccagtc ggagacctct 120 gccgcaaac 129 <210> 31 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> Human albumin 3'-UTR <400> 31 catcacattt aaaagcatct cagcctacca tgagaataag agaaagaaaa tgaagatcaa 60 aagcttattc atctgttttt ctttttcgtt ggtgtaaagc caacaccctg tctaaaaaac 120 ataaatttct ttaatcattt tgcctctttt ctctgtgctt caattaataa aaaatggaaa 180 gaatct 186 <210> 32 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> albumin7 3'-UTR <400> 32 catcacattt aaaagcatct cagcctacca tgagaataag agaaagaaaa tgaagatcaa 60 tagcttattc atctcttttt ctttttcgtt ggtgtaaagc caacaccctg tctaaaaaac 120 ataaatttct ttaatcattt tgcctctttt ctctgtgctt caattaataa aaaatggaaa 180 gaacct 186 <210> 33 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> 5'-UTR of human ribosomal protein Large 32 lacking the 5' terminal oligopyrimidine tract <400> 33 ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42 <210> 34 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> histone stem-loop <400> 34 caaaggctct tttcagagcc acca 24 <210> 35 <211> 1848 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - A64 - C30 - hSL <400> 35 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguagaucu aaaaaaaaaa aaaaaaaaaa 1740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaugcauc cccccccccc 1800 cccccccccc cccccccccc aaaggcucuu uucagagcca ccagaauu 1848 <210> 36 <211> 2201 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - gnas-A64-C30-hSL <400> 36 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uagugaaggg aacacccaaa uuuaauucag 1740 ccuuaagcac aauuaauuaa gagugaaacg uaauuguaca agcaguuggu cacccaccau 1800 agggcaugau caacaccgca accuuuccuu uuucccccag ugauucugaa aaaccccucu 1860 ucccuucagc uugcuuagau guuccaaauu uaguaagcuu aaggcggccu acagaagaaa 1920 aagaaaaaaa aggccacaaa aguucccucu cacuuucagu aaauaaaaua aaagcagcaa 1980 cagaaauaaa gaaauaaaug aaauucaaaa ugaaauaaau auuguguugu gcagcauuaa 2040 aaaaucaaua aaaauuaaaa augagcaaga ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc aucccccccc cccccccccc 2160 cccccccccc cccaaaggcu cuuuucagag ccaccagaau u 2201 <210> 37 <211> 1965 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - morn2- A64 - C30 - hSL <400> 37 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguaccugc ugccuuaacg cugagaugug 1740 gccucugcaa ccccccuuag gcaaagcaac ugaaccuucu gcuaaaguga ccugcccucu 1800 uccguaaguc caauaaaguu gucaugcacc cagaucuaaa aaaaaaaaaa aaaaaaaaaa 1860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc 1920 cccccccccc cccccccaaa ggcucuuuuc agagccacca gaauu 1965 <210> 38 <211> 2286 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - gstm1- A64 - C30 - hSL <400> 38 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uagugcccuu gcuacacggg cacucacuag 1740 gaggaccugu ccacacuggg gauccugcag gcccugggug gggacagcac ccuggccuuc 1800 ugcacugugg cuccugguuc ucucuccuuc ccgcucccuu cugcagcuug gucagcccca 1860 ucuccucacc cucuucccag ucaaguccac acagccuuca uucuccccag uuucuuucac 1920 auggccccuu cuucauuggc ucccugaccc aaccucacag cccguuucug cgaacugagg 1980 ucuguccuga acucacgcuu ccuagaauua ccccgauggu caacacuauc uuagugcuag 2040 cccucccuag aguuaccccg aaggucaaua cuugagugcc agccuguucc ugguggagua 2100 gccuccccag gucugucucg ucuacaauaa agucugaaac acacuugcca ugagaucuaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaugcauccc cccccccccc cccccccccc ccccccccaa aggcucuuuu cagagccacc 2280 agaauu 2286 <210> 39 <211> 1981 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - ndufa1 - A64 - C30 - hSL <400> 39 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguggaagc auuuuccugg cugauuaaaa 1740 gaaauuacuc agcuaugguc aucuguuccu guuagaaggc uaugcagcau auuauauacu 1800 augcgcaugu uaugaaaugc auaauaaaaa auuuuaaaaa aucuaaaaga ucuaaaaaaa 1860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc 1920 aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag ccaccagaau 1980 u 1981 <210> 40 <211> 2085 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - cbr2 - A64 - C30 - hSL <400> 40 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguucugcu caguugccgc ggacaucuga 1740 guggccuucu uagccccacc cucagccaaa gcauuuacug aucucgugac uccgcccuca 1800 ugcuacagcc acgcccacca cgcagcucac aguuccaccc ccauguuacu gucgauccca 1860 caaccacucc aggcgcagac cuuguucucu uuguccacuu uguugggcuc auuugccuaa 1920 auaaacgggc caccgcguua ccuuuaacua uagaucuaaa aaaaaaaaaa aaaaaaaaaa 1980 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc 2040 cccccccccc cccccccaaa ggcucuuuuc agagccacca gaauu 2085 <210> 41 <211> 1997 <212> RNA <213> Artificial Sequence <220> <223> PpLuc(GC) - albumin7- A64 - C30 - hSL <400> 41 gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60 cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120 ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180 guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240 ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300 ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360 gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420 gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480 gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540 cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600 caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660 cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720 cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780 ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840 gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900 cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960 gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020 cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080 ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140 ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200 gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260 cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320 cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380 gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440 cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500 gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560 cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620 ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuagugcau 1680 cacauuuaaa agcaucucag ccuaccauga gaauaagaga aagaaaauga agaucaauag 1740 cuuauucauc ucuuuuucuu uuucguuggu guaaagccaa cacccugucu aaaaaacaua 1800 aauuucuuua aucauuuugc cucuuuucuc ugugcuucaa uuaauaaaaa auggaaagaa 1860 ccuagaucua aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920 aaaaaaaaaa aaaugcaucc cccccccccc cccccccccc ccccccccca aaggcucuuu 1980 ucagagccac cagaauu 1997 <210> 42 <211> 2048 <212> RNA <213> Artificial Sequence <220> <223> Mp68 - PpLuc(GC) - albumin7- A64 - C30 - hSL <400> 42 gggcuuuccc auucuguagc agaauuuggu guugccugug gucuuggucc cgcggagaag 60 cuugaggaug gaggacgcca agaacaucaa gaagggcccg gcgcccuucu acccgcugga 120 ggacgggacc gccggcgagc agcuccacaa ggccaugaag cgguacgccc uggugccggg 180 cacgaucgcc uucaccgacg cccacaucga ggucgacauc accuacgcgg aguacuucga 240 gaugagcgug cgccuggccg aggccaugaa gcgguacggc cugaacacca accaccggau 300 cguggugugc ucggagaaca gccugcaguu cuucaugccg gugcugggcg cccucuucau 360 cggcguggcc gucgccccgg cgaacgacau cuacaacgag cgggagcugc ugaacagcau 420 ggggaucagc cagccgaccg ugguguucgu gagcaagaag ggccugcaga agauccugaa 480 cgugcagaag aagcugccca ucauccagaa gaucaucauc auggacagca agaccgacua 540 ccagggcuuc cagucgaugu acacguucgu gaccagccac cucccgccgg gcuucaacga 600 guacgacuuc gucccggaga gcuucgaccg ggacaagacc aucgcccuga ucaugaacag 660 cagcggcagc accggccugc cgaagggggu ggcccugccg caccggaccg ccugcgugcg 720 cuucucgcac gcccgggacc ccaucuucgg caaccagauc aucccggaca ccgccauccu 780 gagcguggug ccguuccacc acggcuucgg cauguucacg acccugggcu accucaucug 840 cggcuuccgg gugguccuga uguaccgguu cgaggaggag cuguuccugc ggagccugca 900 ggacuacaag auccagagcg cgcugcucgu gccgacccug uucagcuucu ucgccaagag 960 cacccugauc gacaaguacg accugucgaa ccugcacgag aucgccagcg ggggcgcccc 1020 gcugagcaag gaggugggcg aggccguggc caagcgguuc caccucccgg gcauccgcca 1080 gggcuacggc cugaccgaga ccacgagcgc gauccugauc acccccgagg gggacgacaa 1140 gccgggcgcc gugggcaagg uggucccguu cuucgaggcc aagguggugg accuggacac 1200 cggcaagacc cugggcguga accagcgggg cgagcugugc gugcgggggc cgaugaucau 1260 gagcggcuac gugaacaacc cggaggccac caacgcccuc aucgacaagg acggcuggcu 1320 gcacagcggc gacaucgccu acugggacga ggacgagcac uucuucaucg ucgaccggcu 1380 gaagucgcug aucaaguaca agggcuacca gguggcgccg gccgagcugg agagcauccu 1440 gcuccagcac cccaacaucu ucgacgccgg cguggccggg cugccggacg acgacgccgg 1500 cgagcugccg gccgcggugg uggugcugga gcacggcaag accaugacgg agaaggagau 1560 cgucgacuac guggccagcc aggugaccac cgccaagaag cugcggggcg gcgugguguu 1620 cguggacgag gucccgaagg gccugaccgg gaagcucgac gcccggaaga uccgcgagau 1680 ccugaucaag gccaagaagg gcggcaagau cgccguguaa gacuagugca ucacauuuaa 1740 aagcaucuca gccuaccaug agaauaagag aaagaaaaug aagaucaaua gcuuauucau 1800 cucuuuuucu uuuucguugg uguaaagcca acacccuguc uaaaaaacau aaauuucuuu 1860 aaucauuuug ccucuuuucu cugugcuuca auuaauaaaa aauggaaaga accuagaucu 1920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980 aaaaugcauc cccccccccc cccccccccc cccccccccc aaaggcucuu uucagagcca 2040 ccagaauu 2048 <210> 43 <211> 2075 <212> RNA <213> Artificial Sequence <220> <223> Ndufa4 - PpLuc(GC) - albumin7- A64 - C30 - hSL <400> 43 gggguccgcu cagccagguu gcagaagcgg cuuagcgugu guccuaaucu ucucucugcg 60 uguagguagg ccugugccgc aaacaagcuu gaggauggag gacgccaaga acaucaagaa 120 gggcccggcg cccuucuacc cgcuggagga cgggaccgcc ggcgagcagc uccacaaggc 180 caugaagcgg uacgcccugg ugccgggcac gaucgccuuc accgacgccc acaucgaggu 240 cgacaucacc uacgcggagu acuucgagau gagcgugcgc cuggccgagg ccaugaagcg 300 guacggccug aacaccaacc accggaucgu ggugugcucg gagaacagcc ugcaguucuu 360 caugccggug cugggcgccc ucuucaucgg cguggccguc gccccggcga acgacaucua 420 caacgagcgg gagcugcuga acagcauggg gaucagccag ccgaccgugg uguucgugag 480 caagaagggc cugcagaaga uccugaacgu gcagaagaag cugcccauca uccagaagau 540 caucaucaug gacagcaaga ccgacuacca gggcuuccag ucgauguaca cguucgugac 600 cagccaccuc ccgccgggcu ucaacgagua cgacuucguc ccggagagcu ucgaccggga 660 caagaccauc gcccugauca ugaacagcag cggcagcacc ggccugccga aggggguggc 720 ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc cgggacccca ucuucggcaa 780 ccagaucauc ccggacaccg ccauccugag cguggugccg uuccaccacg gcuucggcau 840 guucacgacc cugggcuacc ucaucugcgg cuuccgggug guccugaugu accgguucga 900 ggaggagcug uuccugcgga gccugcagga cuacaagauc cagagcgcgc ugcucgugcc 960 gacccuguuc agcuucuucg ccaagagcac ccugaucgac aaguacgacc ugucgaaccu 1020 gcacgagauc gccagcgggg gcgccccgcu gagcaaggag gugggcgagg ccguggccaa 1080 gcgguuccac cucccgggca uccgccaggg cuacggccug accgagacca cgagcgcgau 1140 ccugaucacc cccgaggggg acgacaagcc gggcgccgug ggcaaggugg ucccguucuu 1200 cgaggccaag gugguggacc uggacaccgg caagacccug ggcgugaacc agcggggcga 1260 gcugugcgug cgggggccga ugaucaugag cggcuacgug aacaacccgg aggccaccaa 1320 cgcccucauc gacaaggacg gcuggcugca cagcggcgac aucgccuacu gggacgagga 1380 cgagcacuuc uucaucgucg accggcugaa gucgcugauc aaguacaagg gcuaccaggu 1440 ggcgccggcc gagcuggaga gcauccugcu ccagcacccc aacaucuucg acgccggcgu 1500 ggccgggcug ccggacgacg acgccggcga gcugccggcc gcgguggugg ugcuggagca 1560 cggcaagacc augacggaga aggagaucgu cgacuacgug gccagccagg ugaccaccgc 1620 caagaagcug cggggcggcg ugguguucgu ggacgagguc ccgaagggcc ugaccgggaa 1680 gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc aagaagggcg gcaagaucgc 1740 cguguaagac uagugcauca cauuuaaaag caucucagcc uaccaugaga auaagagaaa 1800 gaaaaugaag aucaauagcu uauucaucuc uuuuucuuuu ucguuggugu aaagccaaca 1860 cccugucuaa aaaacauaaa uuucuuuaau cauuuugccu cuuuucucug ugcuucaauu 1920 aauaaaaaau ggaaagaacc uagaucuaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc cccccccccc 2040 cccccccaaa ggcucuuuuc agagccacca gaauu 2075 <210> 44 <211> 1810 <212> DNA <213> Artificial Sequence <220> <223> PpLuc(GC) - A64 - C30 - hSL <400> 44 gggagaaagc ttgaggatgg aggacgccaa gaacatcaag aagggcccgg cgcccttcta 60 cccgctggag gacgggaccg ccggcgagca gctccacaag gccatgaagc ggtacgccct 120 ggtgccgggc acgatcgcct tcaccgacgc ccacatcgag gtcgacatca cctacgcgga 180 gtacttcgag atgagcgtgc gcctggccga ggccatgaag cggtacggcc tgaacaccaa 240 ccaccggatc gtggtgtgct cggagaacag cctgcagttc ttcatgccgg tgctgggcgc 300 cctcttcatc ggcgtggccg tcgccccggc gaacgacatc tacaacgagc gggagctgct 360 gaacagcatg gggatcagcc agccgaccgt ggtgttcgtg agcaagaagg gcctgcagaa 420 gatcctgaac gtgcagaaga agctgcccat catccagaag atcatcatca tggacagcaa 480 gaccgactac cagggcttcc agtcgatgta cacgttcgtg accagccacc tcccgccggg 540 cttcaacgag tacgacttcg tcccggagag cttcgaccgg gacaagacca tcgccctgat 600 catgaacagc agcggcagca ccggcctgcc gaagggggtg gccctgccgc accggaccgc 660 ctgcgtgcgc ttctcgcacg cccgggaccc catcttcggc aaccagatca tcccggacac 720 cgccatcctg agcgtggtgc cgttccacca cggcttcggc atgttcacga ccctgggcta 780 cctcatctgc ggcttccggg tggtcctgat gtaccggttc gaggaggagc tgttcctgcg 840 gagcctgcag gactacaaga tccagagcgc gctgctcgtg ccgaccctgt tcagcttctt 900 cgccaagagc accctgatcg acaagtacga cctgtcgaac ctgcacgaga tcgccagcgg 960 gggcgccccg ctgagcaagg aggtgggcga ggccgtggcc aagcggttcc acctcccggg 1020 catccgccag ggctacggcc tgaccgagac cacgagcgcg atcctgatca cccccgaggg 1080 ggacgacaag ccgggcgccg tgggcaaggt ggtcccgttc ttcgaggcca aggtggtgga 1140 cctggacacc ggcaagaccc tgggcgtgaa ccagcggggc gagctgtgcg tgcgggggcc 1200 gatgatcatg agcggctacg tgaacaaccc ggaggccacc aacgccctca tcgacaagga 1260 cggctggctg cacagcggcg acatcgccta ctgggacgag gacgagcact tcttcatcgt 1320 cgaccggctg aagtcgctga tcaagtacaa gggctaccag gtggcgccgg ccgagctgga 1380 gagcatcctg ctccagcacc ccaacatctt cgacgccggc gtggccgggc tgccggacga 1440 cgacgccggc gagctgccgg ccgcggtggt ggtgctggag cacggcaaga ccatgacgga 1500 gaaggagatc gtcgactacg tggccagcca ggtgaccacc gccaagaagc tgcggggcgg 1560 cgtggtgttc gtggacgagg tcccgaaggg cctgaccggg aagctcgacg cccggaagat 1620 ccgcgagatc ctgatcaagg ccaagaaggg cggcaagatc gccgtgtaag actagtagat 1680 ctaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740 aaaaaatgca tccccccccc cccccccccc cccccccccc ccaaaggctc ttttcagagc 1800 caccagaatt 1810 <210> 45 <211> 2163 <212> RNA <213> Artificial Sequence <220> <223> PpLuc(GC) - gnas- A64 - C30 - hSL <400> 45 gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60 cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120 ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180 guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240 ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300 ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360 gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420 gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480 gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540 cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600 caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660 cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720 cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780 ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840 gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900 cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960 gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020 cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080 ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140 ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200 gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260 cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320 cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380 gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440 cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500 gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560 cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620 ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuagugaag 1680 ggaacaccca aauuuaauuc agccuuaagc acaauuaauu aagagugaaa cguaauugua 1740 caagcaguug gucacccacc auagggcaug aucaacaccg caaccuuucc uuuuuccccc 1800 agugauucug aaaaaccccu cuucccuuca gcuugcuuag auguuccaaa uuuaguaagc 1860 uuaaggcggc cuacagaaga aaaagaaaaa aaaggccaca aaaguucccu cucacuuuca 1920 guaaauaaaa uaaaagcagc aacagaaaua aagaaauaaa ugaaauucaa aaugaaauaa 1980 auauuguguu gugcagcauu aaaaaaucaa uaaaaauuaa aaaugagcaa gaucuaaaaa 2040 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaau 2100 gcaucccccc cccccccccc cccccccccc cccccaaagg cucuuuucag agccaccaga 2160 auu 2163 <210> 46 <211> 2264 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - Ybx1(V2)-A64-C30-hSL <400> 46 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguaugccg gcuuaccauc ucuaccauca 1740 uccgguuugg ucauccaaca agaagaaaug aauaugaaau uccagcaaua agaaaugaac 1800 aaagauugga gcugaagacc uuaagugcuu gcuuuuugcc cgcugaccag auaacauuag 1860 aacuaucugc auuaucuaug cagcaugggg uuuuuauuau uuuuaccuaa agaugucucu 1920 uuuugguaau gacaaacgug uuuuuuaaga aaaaaaaaaa aggccugguu uuucucaaua 1980 caccuuuaac gguuuuuaaa uuguuucaua ucuggucaag uugagauuuu uaagaacuuc 2040 auuuuuaauu uguaauaaag uuuacaacuu gauuuuuuca aaaaagucaa caaacugcaa 2100 gcaccuguua auaaaggucu uaaauaauaa agaucuaaaa aaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ugcauccccc cccccccccc 2220 cccccccccc ccccccaaag gcucuuuuca gagccaccag aauu 2264 <210> 47 <211> 1914 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - Ndufb8-A64-C30-hSL <400> 47 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguggaggc uugaugggcu uuuugcccuc 1740 guuccuagag gcuuaaccau aauaaaaucc cuaauaaagc agaucuaaaa aaaaaaaaaa 1800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ugcauccccc 1860 cccccccccc cccccccccc ccccccaaag gcucuuuuca gagccaccag aauu 1914 <210> 48 <211> 2771 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - Cntn1-004(V2)-A64-C30-hSL <400> 48 ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60 gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120 ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180 accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240 cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300 gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360 gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420 ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480 cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540 ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600 ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660 ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720 cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780 uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840 guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900 cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960 aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020 gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080 accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140 ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200 ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260 aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320 aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380 aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440 aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500 gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560 gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620 ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680 aagaagggcg gcaagaucgc cguguaagac uaguucguug acacucacca uuucugugaa 1740 agacuuuuuu uuuuuuuaac auauuauacu agauuugacu aacucaaucu uguagcuucu 1800 gcaguucucc ccacccccaa ccuaguucuu agaguauguu uccccuuuug aaacauguaa 1860 acauacuuug ggcauaaaua uuuuuuaaaa uauaacuaua augcuucacu aauaccuuaa 1920 aaaugccuag ugaacuaacu caguacauua uauaauggcc aagugaaagu uuuguguuuu 1980 cauguccugu uuuucuuuga aauuauauag cccagaaauu agcucauuau cugaaaaacg 2040 uaugaagaac ugaugaauug uauaauacag gaguauugcc auugaaugua cuguuugauu 2100 uauucaagca gguaaugaac aauguuguca aacucucuaa ugagacauca uaauuaggac 2160 auaagcuaaa aggggcauua cuccggcagu cuuuuuuucu uaauccuagu accauacaua 2220 uucuuuggca ugaaagaaug aaaagcauua guaaacaacu gaaguccuac cauggcucug 2280 uaggguuuuu ggaacaauuc cuggaauugg aaagugaaaa uggauagcau gugggggaaa 2340 cccucaucug aguagcaaga uuuuaguaaa gaugacuaag ccauuaacag caugcauuca 2400 uauuuaauuu uauugacucc ugccaucagc uuuuguagau cuuuugggug gaagguugug 2460 auuuuuacug ggaggacuug aguagaagug gaugauuaaa auugaggagu auauaauucu 2520 uucugggacu gcuuaaaugu uauuguuuga aaaugccuuc acuuuccccc uuuggucaaa 2580 gagaugugcu uaaaauucuu auuccuucac aauaaauaau uuugauuuuc uuagacaaga 2640 ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2700 aaaaaaaugc aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag 2760 ccaccagaau u 2771 <210> 49 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SLC38A6 3'-UTR SLC38A6-001 ENST00000267488 <400> 49 aagaaatatt ttcctacttc ttacaagaat aatatacccc tagttgcaag aatgaattat 60 tccggaagac accctggatg aaaaataaca ttttaataaa aattattaac agaaaagcag 120 aacaaaatgg cagtgggtat ggggaagtaa gagtgtggca gttttaatca aaaaaagaaa 180 caaactcgaa atgctcttaa a 201 <210> 50 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens DECR1 3'-UTR NM_001359.1 <400> 50 gaccactttg gccttcatct tggttacaga aaagggaata gaaatgaaac aaattatctc 60 tcatcttttg actatttcaa gtctaataaa ttcttaatta ac 102 <210> 51 <211> 369 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PIGK 3'-UTR <400> 51 acttgatgat gaatgaagaa tgcatggagg actgcaaact tggataataa tttatgtcat 60 tatatatttt taaaaatgtg tttctcttgt atgaattgga aataagtata aggaaactaa 120 atttgaatca actattaatt ttataactta aagaaaaata attgttaatg caactgctta 180 atggcactaa atatattcca gttttgtatt ttgtgtatta taaaagcgaa tgagacagag 240 atcagaatac attgactgtt tttgaaaata gtaatttccc cttatcccct tttcatttgg 300 aaaagaaaca attgtgaaga cattaaattc tcactaacag aagtaacttt ggttaattat 360 tttttgtat 369 <210> 52 <211> 460 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens FAM175A 3'-UTR FAM175A-009 ENST00000506553 <400> 52 tccttttaac cttacaagga gattttttta tttggctgat gggtaaagcc aaacatttct 60 attgttttta ctatgttgag ctacttgcag taagttcatt tgtttttact atgttcacct 120 gtttgcagta atacacagat aactcttagt gcatttactt cacaaagtac tttttcaaac 180 atcagatgct tttatttcca aacctttttt tcacctttca ctaagttgtt gaggggaagg 240 cttacacaga cacattcttt agaattggaa aagtgagacc aggcacagtg gctcacacct 300 gtaatcccag cacttaggga agacaagtca ggaggattga ttgaagttag gagttagaga 360 ccagcctggg caacgtattg agaccatgtc tattaaaaaa taaaatggaa aagcaagaat 420 agccttattt tcaaaatatg gaaagaaatt tatatgaaaa 460 <210> 53 <211> 505 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PHYH 3'-UTR PHYH-002 ENST00000396913 <400> 53 aatagccatc tgctataact ctttcaacag aaaaccaaaa ccaaacgaaa tgtctaagga 60 aaatgttttc ttaatgagat gatgtaacct tttctatcac ttgttaaaag cagaaaacat 120 gtatcaggta cttaattgca tagagttagt tttgcagcac aatggtgttg ctttaatgga 180 aaaaaaaaac agtaaaagtg aaatattact gttttaagga aaactaattt agggtggcag 240 ccaataaagg tggttggtgt ctaatttaag tgttaaatca atttctttca ttcagttagc 300 tctttaccca agaagaagtg aatgatttgg agcttagggt atgttttgta tcccctttct 360 gataaaccca ttccctacca attttatgtc ataagagatt tttttccccc aaatctagaa 420 caatgtataa tacattcaca tctagtcaag ggcataggaa cggtgtcatg gagtccaaat 480 aaagtggata ttcctgctcg gacaa 505 <210> 54 <211> 404 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TBC1D19 3'-UTR TBC1D19-001 ENST00000264866 <400> 54 tcttcttcac agtcactggc aacacatcta gtttttcatt agaaacaaat catgaactat 60 gcaaactctg cataaaacca aaatgaaact ttgcatataa gccaataaag atcatgttcc 120 ctcttcagtt aaacctaagt agtttctcac tttttgaaac aataactctg caccaaatat 180 tgcatcgcat gctgctgatt ttcaagagag aagcaataaa cacaacttct gctaaattga 240 gcattatata tataatatta taatatatat ataatcctga cttgtcaatg gcatgtaata 300 atatatgcaa taagaactaa agatactgta ataaacttca agaggtaatg tagcttcttg 360 gataattctt ttatgtcagt ttataaattt atctctagat aatg 404 <210> 55 <211> 353 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TBC1D19 NM_018317.2 3'-UTR <400> 55 tcttcttcac agtcactggc aacacatcta gtttttcatt agaaacaaat catgaactat 60 gcaaactctg cataaaacca aaatgaaact ttgcatataa gccaataaag atcatgttcc 120 ctcttcagtt aaacctaagt agtttctcac tttttgaaac aataactctg caccaaatat 180 tgcatcgcat gctgctgatt ttcaagagag aagcaataaa cacaacttct gctaaattga 240 gcattatata tataatatta taatatatat ataatcctga cttgtcaatg gcatgtaata 300 atatatgcaa taagaactaa agatactgta ataaacttca agaggtaaaa aaa 353 <210> 56 <211> 242 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PIGB 3'-UTR PIGB-201 ENST00000539642 <400> 56 aaattcaaca tgaagatgaa attctgaact ttcctagata aattaacatt gctgggtgga 60 aatattcaga tgctgcttaa atacttcggt aaacactggg taagattcat ggaacttaga 120 aaaaagctgt atgaactgct ttaccaaata tcactactga ggaaatgtat aaaataccac 180 atagtataaa attacatgtt aatacaatgc cagattttaa ataaagacct ttagttttcc 240 tc 242 <210> 57 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ALG6 3'-UTR ALG6-006 ENST00000263440 <400> 57 ctgtattcct aaacaaattg tttcctaaac aaatgtgaaa atgtgaacag tgctgaaagg 60 ttttgtgaac tttttgctat gtataaatga aattaccatt ttgagaacca tggaaccaca 120 ggaaaggaaa tggtgaaaag tcattgttgt ctacaca 157 <210> 58 <211> 324 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CRYZ 3'-UTR CRYZ-005 ENST00000370871 <400> 58 tgattaattc tttcatggat ttcctatgta attagaggta ctgtctttcc cccagttgta 60 cttaccctat cttttcttta attaacattc gattccatga gcttcttatg tgaaaaaata 120 agatttttct ttagagagca gaagcagaag agtaaaattt attgtatagc tagcaatatt 180 tttttatgcc atctgtctca aatcaaagag tcatcatagt aggaaataac atgttagttg 240 tcatttggca tgagtgtgca ttccagtaat tcttaattga tatttgatta attccatacc 300 tttgattaaa acatgctagt tcaa 324 <210> 59 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BRP44L 3'-UTR BRP44L-001 ENST00000360961 <400> 59 caatggaaaa ggaagaacaa ggtcttgaag ggacagcatt gccagctgct gctgagtcac 60 agatttcatt ataaatagcc tccctaagga aaatacactg aatgctattt ttactaacca 120 ttctattttt atagaaatag ctgagagttt ctaaaccaac tctctgctgc cttacaagta 180 ttaaatattt tacttctttc cataaagagt agctcaaaat atgcaattaa tttaataatt 240 tctgatgatg gttttatctg cagtaatatg tatatcatct attagaattt acttaatgaa 300 aaactgaaga gaacaaaatt tgtaaccact agcacttaag tactcctgat tcttaacatt 360 gtctttaatg accacaagac aaccaacagc tggccacgta cttaaaattt tgtccccact 420 gtttaaaaat gttacctgtg tatttccatg cagtgtatat attgagatgc tgtaacttaa 480 tggcaataaa tgatttaaat atttgttaaa 510 <210> 60 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ACADSB 3'-UTR ACADSB-004 <400> 60 cgtctatagg agtgggaccc ctccctggtg tcactgctgt aaaattttaa acggttgtgt 60 cttgttggga gtaagtgcct tgcgtgggaa taaacttcca cagcattcga atattttaat 120 gaagccctta gtcagggtcc tggtgttggc ctttttggtt ttctcttttc aggctgttta 180 acttaggcac aggagatcca cttttaaact tgggaaataa gcacctgtat ttttttccaa 240 aactgttttt aaagctgtat acgcatacat atatatattt ttactctgtc ttactctgtc 300 acccaggcta gagtgcagtg gcgcgatctc agctcactgc agccttgacc tcct 354 <210> 61 <211> 539 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TMEM14A 3'-UTR NM_014051.3 <400> 61 gcatctggag gaacagaaaa ctaagttcat gtcatcctgc tgtaatgggc agagcatatt 60 ttttttgtat ttaaaagata aacttcaata tggaatgcta gaaacacaaa tagcactgtc 120 acctctaata tgaacattag tttgaggtag tttttttcta aagcaaaaat tttaactgtt 180 ttctaattgt caagcactat tttcattaaa agtgtctaat gaatcatgat atactcttcc 240 atttgttgtg tctatttttt atatatttgg tattttttga aaattccaaa tactcatgtc 300 tcaagtaagc ttaaactaca acttgtcaca taaaggaagt cttaagtgga gttcacagaa 360 tgataatgta tctatttgtc atttgtgtta tatttgaaat tattagaaat tatgcttttt 420 ccattttaat tgtattgctg ccagtgctat ttttttcttt aaaaaatttt attcttagca 480 cactgttatg tcctaactga atgtattcag tattcaaata aaagacattt tggttcaaa 539 <210> 62 <211> 292 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GRAMD1C 3'-UTR GRAMD1C-005 ENST00000472026 <400> 62 tgatctgaag gactaaaacc gcagagatac ttggaactta aagaaaatac ctggaagaaa 60 accagacgaa tgaaggattt tggcatagaa catttctatg ttttttcatt attgagattt 120 ctaatatgaa catttctttc agtaacattt atttgataat tagtttctgc tggccttaat 180 aatccatcct ttcacttctt atagatattt ttaagctgtg aatttcttca gtgaaccatg 240 aaatatatta tagaactgaa tttctctgat acaaaaagaa aatgacacac cc 292 <210> 63 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C11orf80 3'-UTR C11orf80-201 ENST00000360962 <400> 63 gccgggtccc cttccgcaag cgcccaccga tccggaggct gcgggcagcc gttatcccgt 60 ggtttaataa agctgccgcg cgctcaccaa gtcc 94 <210> 64 <211> 266 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ANXA4 3'-UTR ANXA4-002 ENST00000409920 <400> 64 aataaaaatc ccagaaggac aggaggattc tcaacacttt gaattttttt aacttcattt 60 ttctacactg ctattatcat tatctcagaa tgcttatttc caattaaaac gcctacagct 120 gcctcctaga atatagactg tctgtattat tattcaccta taattagtca ttatgatgct 180 ttaaagctgt acttgcattt caaagcttat aagatataaa tggagatttt aaagtagaaa 240 taaatatgta ttccatgttt ttaaaa 266 <210> 65 <211> 490 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TBCK 3'-UTR TBCK-002 ENST00000361687 <400> 65 agaaccaaga gtgtgactgc caaaacttag tgtggcatca gcaccaacag cacagttctt 60 catatccacg ccactctcag acaaaactag atgtccagat tgttgcattt ccgtaaagtt 120 tgtcacgaga cattttttaa aatctcataa cccacatgtt cagttatcca tgcaagaaac 180 ttgactctac atgtattgct gaaagaattt tcttaacagt gaaatctgat catatatttt 240 taccacactg ccacataaag cccaagaaat tcagctgaca agacagattt agcattatca 300 agaaatccca tttgccctga aaaagctgtc ctccattgta ctgaacagac agtcctgtcg 360 attgtgttat ttagaaacat acactgaatg tgggctgaaa tcatcatctt tccataatga 420 aaactgagaa actattcaca atgcattcct tataaataaa tgctacattt agtaactcat 480 ttcacccaaa 490 <210> 66 <211> 320 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IFI6 3'-UTR IFI6-001 ENST00000361157 <400> 66 ccagcagctc ccagaacctc ttcttccttc ttggcctaac tcttccagtt aggatctaga 60 actttgcctt tttttttttt tttttttttt tgagatgggt tctcactata ttgtccaggc 120 tagagtgcag tggctattca cagatgcgaa catagtacac tgcagcctcc aactcctagc 180 ctcaagtgat cctcctgtct caacctccca agtaggatta caagcatgcg ccgacgatgc 240 ccagaatcca gaactttgtc tatcactctc cccaacaacc tagatgtgaa aacagaataa 300 acttcaccca gaaaacactt 320 <210> 67 <211> 479 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CAMKMT 3'-UTR (synonym C2orf34) ENST00000378494 <400> 67 aagattaagc ttctcaaaga cgaagaaacg tatcaagtgc atagggaata tttttacaaa 60 aacggaaatc tgtaaggggt ataatcgcct gcctgcgccc tttgcagcat ttcacgtgtg 120 ggctatggac tccacctgtc ctcacccacg ttattcccca gctgccctct ccagctccct 180 ccccgcctct ttttacactc tgcttgttgc tcgtcctgcc ctaaaccttt gtttgtcttt 240 aaatgtgtat aagctgcctg tctgtgactt gaatttgact ggtgaacaaa ctaaatattt 300 ttccctgtaa ttgagacaga atttcttttg atgataccca tccctccttc attttttttt 360 tttttttggt ctttgttctg ttttggtggt ggtagttttt aatcagtaaa cccagcaaat 420 atcatgattc tttcctggtt agaaaaataa ataaagtgta tctttttatc tccctccaa 479 <210> 68 <211> 476 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ALDH6A1 3'-UTR NM_005589.2 <400> 68 aaacaagttt gtttaagact gactccatcc tgagtaatct ccctttattt ttgaccagct 60 tcatttgtca gctttgctca gatcagatcg atgggattgg aatacattgt aactaaaatc 120 ttcctcagga ctattaaccc ccgcaaagtt tctataggga actgcctagt gtaacaatga 180 aaccagattt ctcacttgct cttcatactt ctattttgag gtaactgttg taactatgaa 240 atgcttatct gaaagtagtg cttaaacctg atttctaaaa attatcccat tttctgatga 300 tttgaagggg agaaaagcca gtgtatgtaa agaaaatgtt ccagccaggc gcggtggctc 360 acgcctgtaa ttccatcatt ttgggaggcc acagtgggca gattgcttga gcccaggagt 420 tgaagaacgt ggcgaaaccc cgtatctatt atttaaaaaa attgaaaaag taaaaa 476 <210> 69 <211> 567 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens AGTPBP1 3'-UTR AGTPBP1-004 ENST00000357081 <400> 69 gcccgctgcc atctcttgtt aactgcaaag aataaatgaa atatcttggt ttttatttcc 60 caggaagctt gagagaaatg agtttataca gagctgactc aaaaagacaa aaagtaactt 120 gggccagttt ggtttcaaga taataaatgt gttattaatt aatgataaaa ttggcgcttg 180 ttttattttc gatattcaat gcactttatg tagcattgaa tgatcaaata ttggatttac 240 ctttaaaaaa aaaacctgag tatcattgca tgaattttta tctccctatg gttatatcct 300 gcatcaagtg gataattttg aagtgtgttc agaatataaa attgaaattt tagagttgtt 360 gaaaatcctg acttgttgaa aactaatata tatgtacatg gatttctata gatgtgtttg 420 tttagaagtg ggtagatatt gcagataaga ctgttcttca gaatcatgtt aactattggg 480 ttgtgactga agtagtccag ggtttgcctt gaaaccatta cattctacat ttaccaaatt 540 aaacaaataa aaactgtatt aaatgtt 567 <210> 70 <211> 169 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CCDC53 3'-UTR CCDC53-001 ENST00000240079 <400> 70 gcttaatttt gataagaatt acatatgcat gcataggggt acatttacat tctgtaagag 60 attgagcctg aactctctta gtcataaaaa catcaaatgg ccacatgtcc actaccaagc 120 ttcttctatg ttaaaaaaat aataataaag cagttttaac ctgccagta 169 <210> 71 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LRRC28 3'-UTR LRRC28-002 ENST00000331450 <400> 71 taaacactca agaacctcag gagcgctgcc agcttgacac tggggaatcc agccagtcca 60 gcacactctt ccatcctgtc ctgtccaatg cgggggcact gcagaactct ctagaaatgt 120 catgattgag cttcagagct aaaatgcctt cacccttccc ccaagttgga atatatcctc 180 ccccaaatta agga 194 <210> 72 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CCDC109B 3'-UTR NM_017918.4 <400> 72 tcttacagtt ttaaatgtcg tcagattttc cattatgtat tgattttgca acttaggatg 60 tttttgagtc ccatggttca ttttgattgt ttaatctttg ttattaaatt cttgtaaaac 120 <210> 73 <211> 426 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PUS10 3'-UTR PUS10-001 ENST00000316752 <400> 73 ctttcaaatt tggagacaaa gagtatggtt ttcctggcat gatgtggaca tccatggagc 60 acatgccgta aaatggctgt ttacccacca taacggtgtc ttgaaaacta tttggatcat 120 gttgatctat ataattgtta atttgttgta acatctcagg atctatatat gtgtatattt 180 tgtgttaaat tgttccaagg atgtcttagg atttttctca ttccctcttt cacccccaca 240 aaccaaacta tgaataatga aataattctc cttaattctt tcatttagag aggtgcacaa 300 acaggacaca ttctctgtta acctaagaag ctgtaatttc agcaagattt ccctccacaa 360 gagatatacc acctttaaaa tcatgttcta atttttgtaa attatctgaa taaaagttat 420 atctag 426 <210> 74 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CCDC104 3'-UTR CCDC104-002 ENST00000339012 <400> 74 taattaagaa caatttaaca aaatggaagt tcaaattgtc ttaaaaataa attatttagt 60 ccttacactg a 71 <210> 75 <211> 125 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CASP1 3'-UTR CASP1-007 ENST00000527979 <400> 75 aataaggaaa ctgtatgaat gtctgtgggc aggaagtgaa gagatccttc tgtaaaggtt 60 tttggaatta tgtctgctga ataataaact tttttgaaat aataaatctg gtagaaaaat 120 gaaaa 125 <210> 76 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SNX14 3'-UTR SNX14-007 ENST00000513865 <400> 76 acacttggat ttggtataga ataacccatt gaaatttctg ctgtgcgagg gtggtagaaa 60 tttacttttt tgggtatatt cttatatata ttatgtacat cgctgtctga aattttagtt 120 attttttgtt tttaataaag actaacacaa acttaatgat taaaagtgat tgag 174 <210> 77 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SKAP2 3'-UTR SKAP2-201 (part of SKAP2.001 ENST00000345317) <400> 77 gagtcctgga aaaggaaaat tcttctgctt gtctgcaaat gctttggatt tagaagcgtc 60 atgaaagcac gagtgacagc tcctaacctc tccttgtttt attaaacatt acttatcttt 120 gactgttatt ttatgcagtc gctcattaaa atattcctct gatgtgaaat taaatgaagg 180 atattaatgt aaattagatg caaccagtta agttatacct gttgctattt tgcaaag 237 <210> 78 <211> 362 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NDUFB6 3'-UTR NM_182739.2 <400> 78 agattatgta aaaagttaaa aggcttatga gcctaagttt gttcctatat taccatattt 60 actgaatttt ctggaaaagt aactttaata aagtttaatc tcagaaattg tcatatctgt 120 tttcaagcat tgtacaattt gagactgagt aatttaacaa taagtaaaaa gtggacatgc 180 taaacaaata tgagagacta cctacttttt ctggtcattc ttgacttgga aaacggtatg 240 gaaaagtatt tagttacatg tttgtttgtt tttttcttac acagtactta cactaatttg 300 gtatcagggt atgcaacagt gaaatatcac aataaacaaa tgtaagaaca aaaaaaaaaa 360 aa 362 <210> 79 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens EFHA1 3'-UTR EFHA1-001 ENST00000382374 <400> 79 taaaagatat aatagtatgg caattatatt gttccaaatg tcaaaatttg tgatttttta 60 gaagtacttg ctatttatct tcttaagtct tcattgatat tctgtgtgaa ataagcatgt 120 cttgtacttg ctttctgatt cataatttta ttaaagaact tagtagaaag aaaagtaagt 180 ataaaaatag atattggatt ctgtcagaag gcctagattt gaaataatgt tttgtacttc 240 ggtaagatgg aaaacttagt gattcactga tttcttagac actctaatat gatatgcttt 300 ctggaaggat aaaacaaata catatgggaa aaagtacttg agaccaaggc cagcatcaat 360 tccagacatc ttcatgttcc taataggcta aatgaagtta aaaacttatt tcagattttt 420 ctcatctgta ccttatatct cataaattta ttgcatattt tatgtcagta gcttagctgt 480 ttattgtctt taaaataaca tgtaaacttc aatgttctat ctggaagcag aataaaatat 540 ttacataga 549 <210> 80 <211> 288 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BCKDHB 3'-UTR BCKDHB-005 ENST00000356489 <400> 80 ccatatagaa aagctggaag attatgacta gatatggaaa tattttttct gaattttttt 60 ttatatttcc tccgacttac ctctttttga aaagagagtt tttattaagt gaaccatcac 120 gatattggct gaaaagttct acattctatt attgtattgt aacacacatg tattgatgat 180 tttcattaag agtttcagat taactttgaa aaatattcca catggtaatc ttataaattc 240 tgtttaatta catctgtaaa tattatgtgt gtgatagtat tcaataaa 288 <210> 81 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BCKDHB 3'-UTR NM_001164783.1 <400> 81 gacctgctca gcccaccccc acccatcctc agctaccccg agaggtagcc ccactctaag 60 gggagcaggg ggacctgaca gcacaccact gtcttcccca gtcagctccc tctaaaatac 120 tcagcggcca gggcggctgc cactcttcac ccctgctcct cccggctgtt acattgtcag 180 gggacagcat ctgcagcagt tgctgaggct ccgtcagccc cctcttcacc tgttgttaca 240 gtgccttctc ccaggggctg ggtgagggca cattcaggac tagaagcccc tctgggcatg 300 gggtggacat ggcaggtcag cctgtggaac ttgcgcaggt gcgagtggcc agcagaggtc 360 acgaataaac tgcatctctg cgcctggctc tctaccaaaa aaaaaaaaaa aaaa 414 <210> 82 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BBS2 3'-UTR NM_031885.3 <400> 82 gtgaggaaaa tacaggtcat gaagttcctg gcaaagattt tctgttaaaa acctatgctg 60 gtttgctttg gatcacaccc tggtgaaccc cgggtgctaa gaatgaaaat aaccttggtg 120 agttgtacaa attaaagaca aagaactaca tgtgaagata gacttgcttt ctatttttaa 180 atcagtagta gtactgttgc tgaataatac taggttttta tggaatagga tgaatgcttt 240 tgaagtatta gggcttcaga gtccaatttt gcttatttat ggtatataaa tacatatttt 300 tttcttgaaa ttgcaattga gtttgtactt ttcaaataga ttatctactt tttcattaaa 360 atgtaaagat gttaaacttt gtgttgattg attataaaat caccaccaaa tcag 414 <210> 83 <211> 409 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LMBRD1 3'UTR NM_018368.3 <400> 83 cagccttctg tcttaaaggt tttataatgc tgactgaata tctgttatgc atttttaaag 60 tattaaacta acattaggat ttgctaacta gctttcatca aaaatgggag catggctata 120 agacaactat attttattat atgttttctg aagtaacatt gtatcataga ttaacatttt 180 aaattaccat aatcatgcta tgtaaatata agactactgg ctttgtgagg gaatgtttgt 240 gcaaaatttt ttcctctaat gtataatagt gttaaattga ttaaaaatct tccagaatta 300 atattccctt ttgtcacttt ttgaaaacat aataaatcat ctgtatctgt gccttaggtt 360 ctccagagtg atgtggaatt ttaaagtgtc tctctctgat tgcctccaa 409 <210> 84 <211> 466 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ITGA6 3'-UTR ITGA6-003 ENST00000409532 <400> 84 tattgatcta cttctgtaat tgtgtggatt ctttaaacgc tctaggtacg atgacagtgt 60 tccccgatac catgctgtaa ggatccggaa agaagagcga gagatcaaag atgaaaagta 120 tattgataac cttgaaaaaa aacagtggat cacaaagtgg aacgaaaatg aaagctactc 180 atagcggggg cctaaaaaaa aaaagcttca cagtacccaa actgcttttt ccaactcaga 240 aattcaattt ggatttaaaa gcctgctcaa tccctgagga ctgatttcag agtgactaca 300 cacagtacga acctacagtt ttaactgtgg atattgttac gtagcctaag gctcctgttt 360 tgcacagcca aatttaaaac tgttggaatg gatttttctt taactgccgt aatttaactt 420 tctgggttgc ctttattttt ggcgtggctg acttacatca tgtgtt 466 <210> 85 <211> 285 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HERC5 3'-UTR HERC5-001 ENST00000264350 <400> 85 ccagcttgct tgtccaacag ccttattttg ttgttgttat cgttgttgtt gttgttgttg 60 ttgttgtttc tctactttgt tttgttttag gcttttagca gcctgaagcc atggtttttc 120 atttctgtct ctagtgataa gcaggaaaga gggatgaaga agagggttta ctggccggtt 180 agaacccgtg actgtattct ctcccttgga tacccctatg cctacatcat attccttacc 240 tcttttggga aatatttttc aaaaataaaa taaccgaaaa attaa 285 <210> 86 <211> 515 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HADHB 3'-UTR HADHB-001 ENST00000317799 <400> 86 tagatccaga agaagtgacc tgaagtttct gtgcaacact cacactaggc aatgccattt 60 caatgcatta ctaaatgaca tttgtagttc ctagctcctc ttaggaaaac agttcttgtg 120 gccttctatt aaatagtttg cacttaagcc ttgccagtgt tctgagcttt tcaataatca 180 gtttactgct ctttcaggga tttctaagcc accagaatct cacatgagat gtgtgggtgg 240 ttgtttttgg tctctgttgt cactaaagac taaatgaggg tttgcagttg ggaaagaggt 300 caactgagat ttggaaatca tctttgtaat atttgcaaat tatacttgtt cttatctgtg 360 tcctaaagat gtgttctcta taaaatacaa accaacgtgc ctaattaatt atggaaaaat 420 aattcagaat ctaaacacca ctgaaaactt ataaaaaatg tttagataca taaatatggt 480 ggtcagcgtt aataaagtgg agaaatattg gagaa 515 <210> 87 <211> 116 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ANAPC4 3'-UTR ANAPC4-001 ENST00000315368 <400> 87 tctagcttgc cattattgtg tgtgtaatta tggccaaaag gacataggag atggactaag 60 atgtcttgga ccacctttgt gtaacaaaga aataaacagt aaattttatt ttttca 116 <210> 88 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PCCB 3'-UTR NM_000532.4 <400> 88 acaaatcaaa ggaaaagaaa ccaagaactg aattactgtc tgcccattca catcccattc 60 ctgccttttg caatcatgaa acctgggaat ccaaatagtt ggataactta gaataactaa 120 gtttattaaa ttctagaaag atctcaaaaa aaaa 154 <210> 89 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ABCB7 3'-UTR ABCB7-001 ENST00000253577 <400> 89 gtcacataag acattttctt tttttgttgt tttggactac atatttgcac tgaagcagaa 60 ttgttttatt aaaaaaatca tacattccca 90 <210> 90 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PGCP 3'-UTR CPQ-001 ENST00000220763 <400> 90 aaacagtaag aaagaaacgt tttcatgctt ctggccagga atcctgggtc tgcaactttg 60 gaaaactcct cttcacataa caatttcatc caattcatct tcaaagcaca actctatttc 120 atgctttctg ttattatctt tcttgatact ttccaaattc tctgattcta gaaaaaggaa 180 tcattctccc ctccctccca ccacatagaa tcaacatatg gtagggatta cagtgggggc 240 atttctttat atcacctctt aaaaacattg tttccacttt aaaagtaaac acttaataaa 300 tttttggaag atctctga 318 <210> 91 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NFU1 3'-UTR NM_001002755.2 <400> 91 aataatctgg attttctttg ggcataacag tcagacttgt tgataatata tatcaagttt 60 ttattattaa tatgctgagg aacttgaaga ttaataaaat atgctcttca gagaatgata 120 tataaatatt gca 133 <210> 92 <211> 246 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens OMA1 3'-UTR OMA1-001 ENST00000371226 <400> 92 attaaaattt atgagacaca agatatatga agaatgttgc agtccttatc attttatgtt 60 actttttaaa aaatgatgtt tgaagtgaaa aaaaaaagga tattcagggt caaatcatgt 120 acattacaga tattatctaa attcttctag aatttatttt tcatgaaata ttgatgtatt 180 ttaatctatg ttaaaatatc ttcaatgagg aaaatgtcac agaataaatt tatattacac 240 atttta 246 <210> 93 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HHLA3 3'-UTR NM_001036646.1 <400> 93 ggcgaatcca tagagtaagc ttagtgatgt gtgtcagacc tctgagccca agcaaagcca 60 tcatatcccc tgtgacctgc atgtatacat ccagatggcc tgaagcaagt gaagaatcac 120 aaaagaagtg aaaagggccg gttcctgcct taactgatga cattccacca ttgtgatttg 180 ttcctgcccc accttaactg agcgattaac ctgtgaactt ccttctcctg gctcagaagc 240 ttccccactg agcaccttgt gacccccgcc cctgcctgcc atagaacaac cccctttgat 300 tgtaattttc ctttacctac ccaaatccta taaaacggcc ccacccctat ctcccttcgc 360 tgacactctc tttggactca gcctgcctgc acctaggtga ttaaaaagct ttattgctca 420 cgc 423 <210> 94 <211> 292 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HHLA3 3'-UTR NM_001031693.2 <400> 94 aaagggccgg ttcctgcctt aactgatgac attccaccat tgtgatttgt tcctgcccca 60 ccttaactga gcgattaacc tgtgaacttc cttctcctgg ctcagaagct tccccactga 120 gcaccttgtg acccccgccc ctgcctgcca tagaacaacc ccctttgatt gtaattttcc 180 tttacctacc caaatcctat aaaacggccc cacccctatc tcccttcgct gacactctct 240 ttggactcag cctgcctgca cctaggtgat taaaaagctt tattgctcac gc 292 <210> 95 <211> 342 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ACAA2 3'-UTR NM_006111.2 <400> 95 agagaccagt gagctcactg tgacccatcc ttactctact tggccaggcc acagtaaaac 60 aagtgacctt cagagcagct gccacaactg gccatgccct gccattgaaa cagtgattaa 120 gtttgatcaa gccatggtga cacaaaaatg cattgatcat gaataggagc ccatgctaga 180 agtacattct ctcagatttg aaccagtgaa atatgatgta tttctgagct aaaactcaac 240 tatagaagac attaaaagaa atcgtattct tgccaagtaa ccaccacttc tgccttagat 300 aatatgatta taaggaaatc aaataaatgt tgccttaact tc 342 <210> 96 <211> 446 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GSTM4 3'-UTR GSTM4-001 ENST00000369836 <400> 96 tgccttgaag gccaggaggt gggagtgagg agcccatact cagcctgctg cccaggctgt 60 gcagcgcagc tggactctgc atcccagcac ctgcctcctc gttcctttct cctgtttatt 120 cccatcttta cccccaagac tttattgggc ctcttcactt cccctaaacc cctgtcccat 180 gcaggccctt tgaagcctca gctacccact ttccttcatg aacatccccc tcccaacact 240 acccttccct gcactaaagc cagcctgacc ttccttcctg ttagtggttg tatctgcttt 300 gaagggccta cctggcccct cgcctgtgga gctcagccct gagctgtccc cgtgttgcat 360 gacagcattg actggtttac aggccctgct cctgcagcat ggcccctgcc ttaggcctac 420 ctgatcaaaa taaagcctca gccaca 446 <210> 97 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GSTM4 3'-UTR GSTM4-003 ENST00000326729 <400> 97 tggtcaattt tctgcatcaa cttgactggg ctaagggatg ctcagatggc aggtaaaatc 60 attgtgcttg tgagggtgtt tccagaagag atttgccttt gaatcagaag acagcaaaga 120 tttccttcag caatgaagga ggcatccacc aaactgtcag ggcccagaga gaagaaaaag 180 acaggaaggg tgaatttgac ctctctgact gggacatcca tctctgccta tcctgggacc 240 tccacactcc tggttctctg gccttcagac ttgatcaggg actaacacca tcgcctccca 300 cccccacctt tgttctgagg cctttagcct ctgaatgata ccactggctt tcctgcttct 360 ctatcctgca gtcggcagat catgggactt cttcactcca aaattgtgtg agccaattcc 420 cataacagat agataaattt ataaataaac acacaaattt cctac 465 <210> 98 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ALG8 3'-UTR NM_001007027.2 <400> 98 ctgaaacctc cgcctcccag aaaagaaaaa cctcttttta attggatgga aactttctac 60 ctgcttggcc tggggcctct ggaagtctgc tgtgaatttg tattcccttt cacctcctgg 120 aaggtgaagt accccttcat ccctttgtta ctaacctcag tgtattgtgc agtaggcatc 180 acatatgctt ggttcaaact gtatgtttca gtattgattg actctgctat tggcaagaca 240 aagaaacaat gaataaagga actgcttaga tatg 274 <210> 99 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C11orf74 3'UTR <400> 99 ttcacagagg cattttgtgt gtgtgtgctt attttaattt tgttcttatt ctagcaacat 60 tagaataaaa gataaaccta ctataattcc ctttgtggaa atttaaaaaa aaaaaaaaaa 120 aa 122 <210> 100 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa1 3'-UTR Ndufa1-001 ENSMUST00000016571 <400> 100 ggaagcattt tcctggctga ttaaaagaaa ttactcagct atggtcatct gttcctgtta 60 gaaggctatg cagcatatta tatactatgc gcatgttatg aaatgcataa taaaaaattt 120 taaaaaatct aaa 133 <210> 101 <211> 155 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5e 3'-UTR NM_025983 <400> 101 ctgaatctga agcctgaagt gctgagtctt gaaggtgaag catgtgggcc cctgttctgg 60 cagatggaaa tcaacctcac ctcctggggg acaggctgcc catctcgttg ataaattgac 120 tatgccaata aattaacatg gttcactttc aaaaa 155 <210> 102 <211> 136 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gstm5 3'-UTR NM_010360 <400> 102 gccagagctc gctgctgctg agccatcttg ccctgagggg cccacactct tagctcactg 60 tcagtcttgt tccatcctgt cctgagggcc cccactctgt ctcctctgct ctttctaata 120 aacagcagtt gcatta 136 <210> 103 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Uqcr11 3'-UTR NM_025650 <400> 103 gcagcccctc ccccaccaca ggcctcgatg gtaccatgtg ccgaggcctc agacacagcg 60 tagtcctgtg gaagacactg aggaagctgg acactggaga ggtctgcacc gctcagggag 120 cttccatgtt gacagacact agggctgcct tgatgggtgc agcattaaac cttattctta 180 tgccttgga 189 <210> 104 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus IFi27I2a 3'-UTR IFi27I2a-001 ENSMUST00000055071; NM_029803 <400> 104 gcttaggaga tgacacttct atcagctcaa ctcaaagcct gtacagacta cgcaggagat 60 gaagttccaa aaggcacctt cagaaccctc actgatgtca aagaatgatg aaaacaacaa 120 agtatatggg ctggtgttcc taa 143 <210> 105 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cbr2 3'-UTR NM_007621 <400> 105 tctgctcagt tgccgcggac atctgagtgg ccttcttagc cccaccctca gccaaagcat 60 ttactgatct cgtgactccg ccctcatgct acagccacgc ccaccacgca gctcacagtt 120 ccacccccat gttactgtcg atcccacaac cactccaggc gcagaccttg ttctctttgt 180 ccactttgtt gggctcattt gcctaaataa acgggccacc gcgttacctt taactat 237 <210> 106 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5l 3'-UTR Atp5l-201 ENSMUST00000043675 <400> 106 agaccaatct ttaacttctg atttgagttc ttatttgaat gttcttggac catgtgtaac 60 aggactgcta tctgaataaa atactaggtg ttgaaaacac tgctgtgttt tctctgtc 118 <210> 107 <211> 271 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tmsb10 3'-UTR NM_025284 <400> 107 aagcctagga agatttcccc accccacccc accccgcccc atcatctcca agaccccctc 60 gtgatgtgga ggaagagcca cctgcaagat ggacgcgagc cacaagctgc actgtgaaac 120 ccgggcactc cgagccgatg ccaccggccc gcgggtctct gaaggggacc cctccactaa 180 tcggactgcc aaatttcacc ggtttgccct gggatattat agaaaattat ttgtatgatt 240 gatgaaaata aaaacacctc gtggcatggt t 271 <210> 108 <211> 116 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Nenf 3'-UTR NM_025424 <400> 108 tgtctagctg agaagcagcc ggttctaggg agaagtgagg ggacaggagt taagtgtccc 60 tcggaacaag cggaggaagc ctccgagtgc cctgcagctg aataaagcga atgttt 116 <210> 109 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5k 3'-UTR NM_007507 <400> 109 ggcgtcagcg agcttgcttt tctctagtcg ttgagaacga ataaagcttc attgtgtgaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 aaa 123 <210> 110 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus 1110008P14Rik 3'-UTR 1110008P14Rik-001 ENSMUST00000048792 <400> 110 gtgccgggag cccccatcca ggccctaccc tcacctctct aggccatgtt ctggcctggg 60 tagatactac ttggcttaga caccatctcg ggtactggcc tccagatcct agtgggtcta 120 ccagcctgga ccagtcccca ttcactgccc atcacccttc ctggagtcag gtgcaatcct 180 acagttctcc cacttgtctg tcttctttcc cctccatcca gactgagagt ccgaattaaa 240 gatgtctccc acaccactgc 260 <210> 111 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cox4i1 3'-UTR NM_009941 <400> 111 gagcccgctg cctgccggct ccctgcctcc ctcactccct cggcatgctg gaagctgccg 60 tatccaatgg tccatgctaa taaaagacca gtttacgtgg tg 102 <210> 112 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cox6a1 3'-UTR NM_007748 <400> 112 agagaacctg gcctccccca ggcaacaaag ggaccacagc actggttttg gacccttact 60 ctgtgtggac cacgaaaacc ctttggatgc taagctcgtg tctcctttcc tcagatggcg 120 accattactc tgatcttcca tcccttctgc ttgtaagagg agatgcctta aataaataac 180 ttaaactca 189 <210> 113 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufs6 3'-UTR NM_010888 <400> 113 tgtgggctgt gtcctggtcc tctgactcct atggaacatc tccacgctgg gtgttctgtg 60 tgaggccact gctctgtgaa tggtgtccct tgttttgaat aaaggatgct cccaccatga 120 aaaaaaaaaa aaaaaaaaa 139 <210> 114 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Sec61b 3'-UTR NM_024171 <400> 114 attgggctac atccatctgt catctgaaga agaagaagaa ggaaaaaaac ccaacatatc 60 ttggaccaaa agtgtagtga ttttctgttc acgtgtatta ttttacagag aataagaatt 120 gactttgaga aatcagtttt ttctatggct aataaacttt ggaattgctt t 171 <210> 115 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Romo1 3'-UTR NM_025946 <400> 115 ttagggctag gatgccctgc aatacctaaa cttccccatc catttcgacc cttgtacaat 60 aataaagttg ttttcttctc gttaaaaaaa aaaaaaaaaa a 101 <210> 116 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gnas 3'-UTR NM_010309 <400> 116 gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60 tgtacaagca gttggtcacc caccataggg catgatcaac accgcaacct ttcctttttc 120 ccccagtgat tctgaaaaac ccctcttccc ttcagcttgc ttagatgttc caaatttagt 180 aagcttaagg cggcctacag aagaaaaaga aaaaaaaggc cacaaaagtt ccctctcact 240 ttcagtaaat aaaataaaag cagcaacaga aataaagaaa taaatgaaat tcaaaatgaa 300 ataaatattg tgttgtgcag cattaaaaaa tcaataaaaa ttaaaaatga gcaaaaaaaa 360 aaaaaaaaaa 370 <210> 117 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Snrpd2 3'-UTR NM_026943 <400> 117 agcctgctcc ctgccctgcg aaggcctgca gaaccctgcc cagtgggcga gaaataaaac 60 cctgtgcttt ttggttaaaa aaaaaaaaaa aaaaaa 96 <210> 118 <211> 119 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mgst3 3'-UTR NM_025569 <400> 118 ggtgtggagg gccttccgac tctcactcac ctccagcgac tcaccctgat ttccagttgc 60 actggttttt tttttttttt taatataata aaaacttatc tggcatcagc ctcatacct 119 <210> 119 <211> 304 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Aldh2 3'-UTR NM_009656 <400> 119 agcggcatgc ctgcttcctc agcccgcacc cgaaaaccca acaagatata ctgagaaaaa 60 ccgccacaca cactgcgcct ccaaagagaa accccttcac caaagtgtct tgggtcaaga 120 aagaatttta taaacagggc ggggctggtg ggggggaaag ctcctgataa actgggtagg 180 ggatgaagct caatgcagac cgatcacgcg tccagatgtg caggatgctg ccttcaacct 240 gcagtcccta agcagcaaat gagcaataaa aatcagcaga tcaaagccac ggggtcagtt 300 ctct 304 <210> 120 <211> 134 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mp68 (2010107E04Rik) 3'-UTR NM_027360 <400> 120 ctgctccgaa tccacaagat gaagacgtcg gctaaacttg agcaagcttt gttagatggg 60 aacatggaac atcactgtac acttatctaa gtaccattta taatgtggca ttaataaatg 120 tatctgtgaa tacc 134 <210> 121 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ssr4 3'-UTR NM_001166480 <400> 121 gggcagcaac ttcagccgtc cattgcttct ttcaataaac agtcactatt tgacatgagt 60 acattcaaga aaaaaaaaaa aaaaaaa 87 <210> 122 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Myl6 3'-UTR NM_010860 <400> 122 ggacattctg tatcccgagt ctgttccttg cccagtgtga tttctgtgtg gctccagagg 60 ctcccctgtc acagcacctt gcccatttgg tttcttttgg atgatgtttg ccttccccaa 120 ataaaatttg ctctctttgc cctccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180 aaaaaa 186 <210> 123 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Prdx4 3'-UTR Prdx4-001, NM_016764 <400> 123 aaagtacttc agttatgatg tttggacctt ctcaataaag gtcattgtgt tattacca 58 <210> 124 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ubl5 3'-UTR NM_025401 <400> 124 agggggattc cttctcctcc tcgccctgct ctgccctgcc ctcctctccc atcctcatct 60 gacactggtg tagatggtca tttttaacag ttcacatgaa taaaaacttg gctgctgctt 120 tgctgctgtc 130 <210> 125 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus 1110001J03Rik 3'-UTR NM_025363 <400> 125 tgcagagagt cctcagatgt tccttcattc aagagtttaa ccatttctaa caatatgtag 60 ttatcattaa atctttttta aagtgtg 87 <210> 126 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa13 3'-UTR Ndufa13-201 ENSMUST00000110167 <400> 126 ggcctgagcc aacgcacata ataaagagtg gtc 33 <210> 127 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa3 3'-UTR NM_025348 <400> 127 atgcctctgc tgatggaaga ggccccttcc ctgttgctct ccaataaaaa tgtgaaaact 60 aataacccc 69 <210> 128 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gstp2 3'-UTR NM_181796 <400> 128 tggactgaag agacaagagc ttcttgtccc cgttttccca gcactaataa agtttgtaag 60 acaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 96 <210> 129 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tmem160 3'-UTR NM_026938 <400> 129 acaacagggc tgtggggact ggctgggcct gacgactggg acattaaaac ctgacccttc 60 cgcaaaaaaa aaaaaaaaaa aaaaaaaaa 89 <210> 130 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ergic3 3'-UTR NM_025516 <400> 130 ctctctccct tccccacagc ttgtcctgcc ctctcttccc ctgtgggttt accctccagc 60 ctgtcaacta cccatatcct ctcctcagcc agcccagccc agggcaataa atatgaattg 120 tgataggaa 129 <210> 131 <211> 295 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Pgcp 3'-UTR NM_018755 <400> 131 ggagaacaag aagagaggac cttgttctct gtagttggga atcccaactc tgaatcttta 60 caacatccat cgtcacaaaa gagtgttata catttaatcc acagggcata gttttcttta 120 taccttctgt taatcatctt tccttaatac tttcttatct gtttctagaa taaatcatga 180 tccctactgc accaccttga aaatgttgtt tccagtttta aaataagcaa taaatatttg 240 aaatgcttct gatttttcat tttcatttaa aaacattaaa ttaaatgtaa tgaga 295 <210> 132 <211> 263 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Slpi 3'-UTR NM_011414 <400> 132 gcctgatccc tgacattggc gccggctctg gactcgtgct cggtgtgctc tggaaactac 60 ttccctgctc ccaggcgtcc ctgctccggg ttccatggct cccggctccc tgtatcccag 120 gcttggatcc tgtggaccag ggttactgtt ttaccactaa catctccttt tggctcagca 180 ttcaccgatc tttagggaaa tgctgttgga gagcaaataa ataaacgcat tcatttctct 240 atgcaaaaaa aaaaaaaaaa aaa 263 <210> 133 <211> 241 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Myeov2 3'-UTR NM_001163425 <400> 133 ggccgcccgg tcctatgtgc tccatgtctg tgatgtgtct ggagtctctc gggacacgac 60 cagctgattg tagacaccgt gttgatatca ctagaaatga agaccttgtc aaccaataga 120 ggaactgtct gaaccaactg ggtactgatg tctctgggaa tgccagcccg tgtccttgtt 180 taagttaata aagaacactg taacacgcag ggtgatttta aaaaaaaaaa aaaaaaaaaa 240 a 241 <210> 134 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa4 3'-UTR NM_010886 <400> 134 actatgaagt tcactgtaaa gctgctgata atgaaggtct ttcagaagcc atccgcacaa 60 ttttccactt aagcaggaaa tatgtctctg aatgcatgaa atcatgttga tttttttttt 120 ttttggagtt tattacactg atgaataaat ctctgaaact tg 162 <210> 135 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufs5 3'-UTR NM_001030274 <400> 135 gcggggcagc tggaggccgc tgtcatgctc tgttttcccc tggagagaat atttaaggaa 60 agctccttca ttaagtatta agtatgtgga aataaagaat tactcagtct taaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa aaa 143 <210> 136 <211> 455 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gstm1 3'-UTR NM_010358 <400> 136 gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60 tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120 tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180 ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240 tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300 gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360 agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420 tgaaacacac ttgccatgaa aaaaaaaaaa aaaaa 455 <210> 137 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus 1810027O10Rik 3'-UTR 1810027O10Rik-001 ENSMUST00000094065 <400> 137 agtctcttgt ttaagcgccc agtcctggcc tttctgggta attgggcgca gagggaagga 60 gccaatgttg aagcagaaaa gaaattaaaa gaaaaaggca tataaagaa 109 <210> 138 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus 1810027O10Rik 3'-UTR BC117077 <400> 138 agtctcttgt ttaagcgccc agtcctggcc tttctgggta attgggcgc 49 <210> 139 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5o 3'-UTR NM_138597 <400> 139 gagactgtca cctgtgtgag ctcttgtcct tggagcaaca ataaaatgct tcctg 55 <210> 140 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Shfm1 3'-UTR NM_009169 <400> 140 catctgggaa tgtcccagga acctcaatca tggactctac cacagtctag gacagagaaa 60 gcaggacggg atactttaaa gaacatgttt atttcattat ctgcttcaat ttatttttgt 120 tttataacaa aaaaaataag taaataaatg ttttgattta atctttttgg ttca 174 <210> 141 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tspo 3'-UTR NM_009775 <400> 141 aggcacccag ccatcaggaa tgcagccctg ccagccaggc accatgggtg gcagccatca 60 tgcttttatg accattgggc ctgctggtct acctggtctt agcccaggaa gccaccaggt 120 aggttagggt ggtcagtgcc gagtctcctg cagacacagt tatacctgcc tttctgcact 180 gctccaggca tgcccttaga gcatggtgtt ttaaagctaa ataaagtctc taacttcatg 240 tgtaaaaaaa aaaaaaaaaa 260 <210> 142 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus S100a6 3'-UTR NM_011313 <400> 142 aatgggaccg ttgagatgac ttccgggggc ctctctcggt caaatccagt ggtgggtagt 60 tatacaataa atatttcgtt tttgttatgc ct 92 <210> 143 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Taldo1 3'-UTR NM_011528 <400> 143 tgcaacaccc gaggccccag tcctgcaccg aggctgaccc cagacctgca ctgcctttga 60 gctgggtcct aattgcacat ggcttgtgac gaatgaatct tgcatttttt agtgatcgga 120 gaagggatgg atcataggat tctgatttta tgtgaaattt tgtctaattc attaaagcag 180 ttgcttttcc tatgctgttt 200 <210> 144 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Bloc1s1 3'-UTR NM_015740 <400> 144 actaaaaccc acccctctta cttcaccctc ctggacagga gggaaactgg tgagccacga 60 ataaaaacac aagcttccat tct 83 <210> 145 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufb11 3'-UTR NM_019435 <400> 145 tggcttaccg agcagggcct aagaagcatt actcatccgc tgcttgttat ttacctggtt 60 cctcagaaca ccttattaaa ggaattgaaa gta 93 <210> 146 <211> 454 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Map1lc3a 3'-UTR NM_025735 <400> 146 gtcaagagga ggggaggggg gtggctggga gttctggtca ggttctcccc agggaggtcc 60 tggctcctaa actaagctat ttcagtcccc agtggattag gcagagatgt gacacccact 120 ccccccccca ggtaggggcc accagccagc ctaccacatc ctgggtaggt cctgggccag 180 tcatgttcgg gttgctcttt tgggtgctgg ctgggttggg agtgggtggg gagcagcatc 240 cctgctctgt ggggtttgtc attttgttag gcccttgcct gtctgcccat cttgcccctc 300 atccacctga ggctttgcct cctgccagga cctgccccac ccctgaaagg ctggctcccc 360 ttgtcctgac tcggtgtatg gatctgtggt catttcctct gcagaaagaa taaagactgc 420 tcaggcctgc ctggccaaaa aaaaaaaaaa aaaa 454 <210> 147 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Morn2 3'-UTR NM_194269 <400> 147 acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60 ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcacccaca 120 aaaaaaaaaa aaaaa 135 <210> 148 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gpx4 3'-UTR NM_008162.2 <400> 148 ctagccctac aagtgtgtgc ccctacaccg agcccccctg ccctgtgacc cctggagcct 60 tccaccccgg cactcatgaa ggtctgcctg aaaaccagcc tgctggtggg gcagtcctga 120 ggacctggcg tgcatccctg ccggaggaag gtccagaggc ctgtggccct gggctcgagc 180 ttcaccctgg ctgccttgtg ggaataaaat gtagaaatgt gaaaaaaaaa aaaaaaaa 238 <210> 149 <211> 124 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mif 3'-UTR NM_010798.2 <400> 149 gtcctggccc cacttacctg caccgctgtt ctttgagcct cgctccacgt agtgttctgt 60 gtttatccac cggtagcgat gcccaccttc cagccgggag aaataaatgg tttataagag 120 acca 124 <210> 150 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cox6b1 3'-UTR NM_025628 <400> 150 cctggctccg cccacctctc ctctgttctt tgtctttctc cccggataga aaagggggac 60 ctcagcatat gatggtcctt accctgggac cctgaatcat gatgcaacta ctaataaaaa 120 ctcactggaa aagtt 135 <210> 151 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus RIKEN cDNA2900010J23 (Swi5) 3'-UTR NM_175190 <400> 151 gcagcttctt ggagattttc atctacagcc cacagggaca ggaggatggg ggcataaaag 60 gcagagtcta gacagtatgt tcatatggtt ttcagatttt aaaagatgct agaagccctc 120 caaagtttgg ggtgggttct agagaagagg agtattggga ggggtgggta ttgtcaatgt 180 taaggttcct aaacatactt gtgagtaggt gtgtgtggtt gtcccttttg ttaataaaca 240 tatgagcagt caaaaaaaaa aaaaaaa 267 <210> 152 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Sec61g 3'-UTR NM_011343.3 <400> 152 gtccttctca tcatgggacg agtgagccag agcgggggaa agggcatgaa gtaaagcgtt 60 gcctgaatgc tgtgtggtgt tttgtttctt cctccttcct atgaggtttt ctacttctca 120 attaaaataa tttcaaaata aacacttttt ccataacaga 160 <210> 153 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus 2900010M23Rik 3'-UTR BC_030629 <400> 153 ccgtggggtc tgatactcat caataaaact gcctggtttc tcccacaaaa aaaaaaaaaa 60 aa 62 <210> 154 <211> 338 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Anapc5 3'-UTR Anapc5-201 ENSMUST00000086216 <400> 154 ccaggactcc ctgcttgatg gtgtgcattt aggggtgggt cattacatgc tatcttgtca 60 ataaactgtt ctgatcagtt tgtctgaagt gggttttttt ttatttttct gggttgaatt 120 gtcagtatct ttgttaagaa ctgtgtatct aggggctgga gagatggctt agcagttaag 180 agcactaact gttcttctaa aggacctggg ttcaattcct agcaccctca tgacagctca 240 cagctgtctg taactcctgt tccagggact ctgacaccct caggcagaca taaaagcagt 300 caaaacaccg atgtacataa aattaaaata aattattt 338 <210> 155 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mars2 3'-UTR BC132343.1 <400> 155 gaactcagct cttactgact ggtagtaaaa gatcaaatgt attctttttg cgtttttaag 60 taaagtcatg c 71 <210> 156 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Phpt1 3'-UTR NM_029293 <400> 156 agctctgccc caccccccac cccccggact aagtcaggtc tctgctcttg ctgtgttctg 60 ttttgagggg ctggccctgt gctttccttt tgtaccttag gcagcatagc acctgccagg 120 ccttagaggc cagaccaatc tggtccatag gaattaaaag cattgatatg cctact 176 <210> 157 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufb8 3'-UTR NM_026061 <400> 157 ggaggcttga tgggcttttt gccctcgttc ctagaggctt aaccataata aaatccctaa 60 taaagc 66 <210> 158 <211> 170 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Pfdn5 3'-UTR NM_027044 <400> 158 gagtgcactg cagaaatgaa gcagagtgag ggacccttct tcaaggggcc tgggactttt 60 tccggcaatg gcctcctggg aaagtggcct gggaagagag tgttttgtgt ttaatgttaa 120 taaatgtgac cgctgcgcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 170 <210> 159 <211> 278 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Arpc3 3'-UTR NM_019824 <400> 159 gaggagcctg ggcagcacca tcacgtggag acacatcata ggacacacag gccaatgtgt 60 ctgttcatac ctaccgtatc aaggagagaa gagagcctgt ctttgctgga aaagctcttg 120 gtcaagaatt gggagggtgg gtgttgggcg atttcgattt ttggcagttt taagctggta 180 cttaatatat aataaatgtc actgcttatg ttagacattg aattaaaaca tttttgagaa 240 aaagctttaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 278 <210> 160 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufb7 3'-UTR NM_025843 <400> 160 ggattacccg ccagcctgtg gacctatcag tgaaataaaa gctttgggtc acctgcct 58 <210> 161 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5h 3'-UTR NM_027862 <400> 161 agcagcctgg gacggagccc cggccgacat gaaataaaac atttaaatag t 51 <210> 162 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mrpl23 3'-UTR NM_011288 <400> 162 cctatgacag caggatttgg accacagacc ctagtgagca cagtggttct gacaagccca 60 aataaaaatt ctttgtggag 80 <210> 163 <211> 387 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tomm6 3'-UTR NM_025365.3 <400> 163 ccagagaatg gaactcctgt gtattcagac tttccaaaga cagcctactg tctgtgacca 60 caagatccta cctgagtggc agctgaagtt gactccctct ccttgcctga accccccccc 120 actgcccccc catcccccag tgtcggctga gatgttgcct ctgcacggtt ctgtgtgcag 180 ttcccaactt tctgcagaag atggtccttg cccttgtcct gaagagtagt aatggttctt 240 gaaaaagatt tcaaataaag cctgcacata aaagacaggt attttattct tttaataaga 300 aacttattac aaaaacaagg tgtaaaaagt ccgcttacaa aaatcaaata aacatgactt 360 gtatttcaaa aaaaaaaaaa aaaaaaa 387 <210> 164 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tomm6 3'-UTR Tomm6-002 ENSMUST00000113301 <400> 164 ccaggtgaga gcagttctcc tgtgtttccc cgtttctgat gctgttatct gcttacagag 60 aatggaactc ctgtgtattc agactttcca aagacagcct actgtctgtg accacaagat 120 cctacctgag tggcagctga agttgactcc ctctccttgc ctgaaccccc ccccactgcc 180 cccccatccc ccagtgtcgg ctgagatgtt gcctctgcac ggttctgtgt gcagttccca 240 actttctgca gaagatggtc cttgcccttg tcctgaagag tagtaatggt tcttgaaaaa 300 gatttcaaat aaagcctgca cataaaa 327 <210> 165 <211> 273 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tomm6 3'-UTR <400> 165 ccagagaatg gaactcctgt gtattcagac tttccaaaga cagcctactg tctgtgacca 60 caagatccta cctgagtggc agctgaagtt gactccctct ccttgcctga accccccccc 120 actgcccccc catcccccag tgtcggctga gatgttgcct ctgcacggtt ctgtgtgcag 180 ttcccaactt tctgcagaag atggtccttg cccttgtcct gaagagtagt aatggttctt 240 gaaaaagatt tcaaataaag cctgcacata aaa 273 <210> 166 <211> 631 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mtch1 3'-UTR NM_019880 <400> 166 cctaagctgc ccgaccaaac atttatgggg tcttagccta cccctggtga ggacccatca 60 tctcagatgc ccaagggtga ctccagccca gcctggcttc atgtccatat ttgccatgtg 120 tctgtccaga tgtgggctgg tggaggtggg tcacctggga cctggggaag cctgggggag 180 cagtgttggg gtggcatccc cttcctgcct agaggtactg gagtccatct tgtactcagg 240 cagaggcagg ctgcagaggc aaacgtcact cagtggcaag gcttccctgc acctctagcc 300 cagctcatcc tgccagtcag ccagaagcac ccccgccccc cacttcctgc tttgtaaatt 360 gggcgccatc acacctgggc catgggaggc tggagctatg ttcccaacac taattttctt 420 atacaagggt ggtgccttct cctgaatagg aaatcatgtt ctcctcagac catcccctca 480 tctgcttgtc tgtgctggtg acgccaggtg tgagggttca gtcactgtgc tgggtgcgaa 540 tacgcacagg ttacataggc cgacatctag tcctcccctc gtggtaagat agacccatct 600 cctcgaataa atgtattggt ggtgatttgg a 631 <210> 167 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Pcbd2 3'-UTR NM_028281 <400> 167 tctgcgcctg ccttgtctgc agcgttgttt gcaagccact tatgttaata aattgtcata 60 aagtagttca tagttacatg tatacattgt tgtatgattg atgctcaaat acagaatgat 120 ttgaagccaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 158 <210> 168 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ecm1 3'-UTR NM_007899 <400> 168 gtcaccctga gcctcagagg attagatggg ggaactccgc cctactccac cctcctcgaa 60 cactcattac aataaatgcc tcttggattt ggc 93 <210> 169 <211> 458 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Hrsp12 3'-UTR Hrsp12-001 ENSMUST00000022946 <400> 169 ctataagtag ccatgctgat gttgactccg gaggttttag aatgtctttc acactttaat 60 ttttacaaat gatgctggga agtataaaaa tgaccagagt ggttgaagtt attgtggaag 120 tgatcaaata tgtggagatt tgacattaat tggagattat tcagtatagt gactgatgtt 180 ctaatttcac ttatgttgct gggtgtgaga gaagaggtgc acagctactg agatgggaag 240 cagaaggaaa gatgggctgt tgtacatgag aaatagtaag gagcacatct acttaaatca 300 tattaatttg ctcatgtgaa atacttagtt cttatgttag atataagaaa ctaaattgaa 360 atattcaaac ttgaatagta ccaggagaac aagtggacca aaatcttata cagataatat 420 tactttaatt gaaataaaaa atagatgtgt aactttcc 458 <210> 170 <211> 183 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mecr 3'-UTR NM_025297 <400> 170 ttgctccaga ggaccaggag gaaagcagga gaggcaagac tggctgtctg ctggcccctc 60 catgagaacc ccagccttcc cagactgcct cacccatatt gtctcttcct accaggaggg 120 tgggggacca actctaggct ccctaataaa cccttaactt cccgagtgga ggatgaagag 180 tac 183 <210> 171 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Uqcrq 3'-UTR NM_025352 <400> 171 acggcctgca cctgggtgac agtcccctgc ctctgaaaga cccttctctg ggagaggaat 60 ccacactgta gtcttgaaga caataaacta cttatggact tccctttgaa aaaaaaaaaa 120 <210> 172 <211> 511 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gstm3 3'-UTR NM_010359 <400> 172 gcccctgcca tgctgtcact cagagtgggg gacctgtcca tactgcggat cctgcaggct 60 ctgggtgggg acagcaccct ggccttctgc actgtggctc ccggttctct ctccttcccg 120 ctcccttctg cagcttggtc agccccatct cctcatcctc accccagtca agcccatgca 180 gcctttattc tccccatttt tttttcacat ggccccttct tcattggtgc ccagacccaa 240 cctcacagcc cttttctgca atctgaggtc tgtcctgaac tcaggctccc tagagttacc 300 ccaatggtca acactatctt agtgccagcc ctccctagag ataccctgat ggtcaatact 360 atcttagtga cggccctccc tagagttacc ctgaaggtca atactcgagt gccagcctgt 420 tcctgtttaa ggagctgccc caggcctgtc tcatgtacaa taaagcctga aacacacttg 480 aaacacaata aacactgaac acttgctgtg a 511 <210> 173 <211> 312 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Lsm4 3'-UTR NM_015816 <400> 173 tcactccctg cctgagccga gcccagaacg gtgggtgagg cctcagggca cctttgtgtg 60 aagccccact tggcgtctgg tccagtgaag tccctcgctg gccactgact cagtttctgg 120 aaggttccga gtctgaggtg cctgtggagc cttagatgcc ctttgaaggg ctgacttctt 180 ccaggcatgt ttgagtttca gttggagctg caggctcagc ccatggcggc tcacctgtcc 240 tttaccagcc ataccctgta catcttctgt ttgaaaaata aaagcaaaca ccatagaaag 300 aaaaaaaaaa aa 312 <210> 174 <211> 195 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Park7 3'-UTR NM_020569 <400> 174 agcccaagcc ctgggcccca cgcttgagca ggcattggaa gcccactggt gtgtccagag 60 cccagggaac ctcagcagta gtatgtgaag cagccgccac acggggctct catcccgggt 120 ctgtatgttt ctgaaccttg ctagtagaat aaacagttta ccaagctcct gccagctaaa 180 aaaaaaaaaa aaaaa 195 <210> 175 <211> 131 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Usmg5 3'-UTR NM_023211 <400> 175 atggattttg aaatgtctga cctcacctgt taagtcccat gcctgaagaa gctgatgtga 60 actcatcatg taatactcaa tttgtacaat aaattatgaa cccaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa a 131 <210> 176 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cox8a 3'-UTR NM_007750 <400> 176 agggagcagt cttccctcat cctttgacta gaccactttt gccagcccac cttgatcatg 60 ttgcctgcat tcctggctgg ccttccccgg gatcatgtta ttcaattcca gtcacctctt 120 ctgcaatcat gacctctcga tgtctccatg gtgacaactg ggaccacatg tattggctct 180 gcttggtggg gtcccccttt gtaacaataa agtctattta aaccttgctc c 231 <210> 177 <211> 403 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ly6c1 3'-UTR NM_010741 <400> 177 tggtccttcc aatgaccccc acccttttcc ttttatcttc atgtgcaacc actctttcct 60 ggagtcctct agtgacaaat tatatgttat agaaggtcca atgtggggat agtgtgtgga 120 acaccctgtt tcacctttat agcccctgct gggtaagtgc ccgactcctc tctagggctt 180 tcaaatctgt acttcttgca atgccattta gttgtggatt tctattcttg gccctggagg 240 catgtggcca gcacatgcaa caggcagtat tccaaggtat tatagtatca ccatccacac 300 ataagtatct ggggtcctgc agggttccca tgtatgcctg tcaatgaccc ctgttgagtc 360 caataaaagc tttgttctcc cagccaaaaa aaaaaaaaaa aaa 403 <210> 178 <211> 309 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ly6c1 3'-UTR NM_001252058.1 <400> 178 actcataaaa atgctcctgc ctcggtcttc caagttctag gattgcaagt ctgacttcaa 60 catgccttac agacaactct gggacatcca ggcctagtgg catgttgccc agatatgggg 120 atgctctgtg gcccctgcat aagaagtgag tcactccctg atttcttgca gactctcaaa 180 gaaggaaact aaagacccgt cagtgccttt ctttctgccc tgctggtgtg ccaatcaggg 240 atcctaacat cagggagagg acttcctgtt gcagcgaaga cctctgcaat gcagcagttc 300 ccactgcag 309 <210> 179 <211> 802 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cox7b 3'-UTR NM_025379 <400> 179 tcgtgccagc tggtacaata atcaaggaat tgtttaaaac caacttataa gtgaatgcca 60 agtcaaagaa tcatgtactc attatactat ggcagattga agaacaaata aagaaataaa 120 gtaccttaac cttcattcta ggctttgttt ttttcctttg taaatgaagc ccaagcatgg 180 tgacttctca tttatttaag ctgtattgtc tcttaaaatg gctttttacc ctatgaggtg 240 gtatgaggga aatctatgat caggagggca cctttatagt aagctgaaat tacagagaat 300 gaagaaataa gcacagagct gttttaggag cccactgggt cattggccat ataggttatg 360 cttactgccc tctacctcgt ggttatattt ggaattgcca ttagctccct tctgcttaga 420 gactggactg tcaccaaacc caaggggata gtgatcctgt aatgatcctg tgtgaactag 480 gtttgctaaa gactaccacc tccttacact gtatggcata ttcatctgaa ataggtgcta 540 atttttcagc ataatcctta atctttagga tctgtcatac ttcctagtaa tttaactgtt 600 gctgaagaaa taaaggctat ctgttaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 660 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780 aaaaaaaaaa aaaaaaaaaa aa 802 <210> 180 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ppib 3'-UTR NM_011149 <400> 180 agagcctggg ggacctcatc cctctaagca gctgtctgtg tgggtcctgt caatccccac 60 acagacgaag gtagccagtc acaaggttct gtgccaccct ggccctagtg cttccatctg 120 atggggtgac cacacccctc acattccaca ggcctgattt ttataaaaaa ctaccaatgc 180 tgatcaataa agtgggtttt ttttatagct tgaaaaaaaa aaaaaaaaaa a 231 <210> 181 <211> 205 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Bag1 3'-UTR NM_009736 <400> 181 agtgcagtgg agagtggctg tactggcctg aagagcagct ttacagccct gccctctctg 60 gaacagaagt cgcctgtttc tccatggctg ccaggggcaa ctagccaaat gtcaatttcc 120 ctgctcctcc gtcggttctc aatgaaaaag tcctgtcttt gcaacctgaa ttagacttgt 180 gttttctcaa aaaaaaaaaa aaaaa 205 <210> 182 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus S100a4 3'-UTR S100a4-201 ENSMUST00000001046 <400> 182 agactcctca gatgaagtgt tggggtgtag tttgccagtg ggggatcttc cctgttggct 60 gtgagcatag tgccttactc tggcttcttc gcacatgtgc acagtgctga gcaaattcaa 120 taaaaggttt tgaaactatt 140 <210> 183 <211> 374 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Bcap31 3'-UTR NM_012060 <400> 183 aggcttggtg tttccctgcc tgccgctggc ttctacctga cccatgctta ctgcttcctt 60 ggagcccaga ctatccctct ggtacttggg tttattccct acttccccaa ttttcttcca 120 tggcttatag atcattattt tggcaccatt acacatactg ctcttatacc aaaagggacc 180 tgattgttgt ttattcagag tacttttgcc actgttctgc ctggctaggg cactttccac 240 tcctggaagt gtagaaaagc actggtgacc tggcctgcag tttgaacccc tttttatttt 300 gcaatgtacc ctaaaggagg ctgctgtgaa gcaggtcaac tgttttatcc tgaggggaat 360 aaatgttgtt atgt 374 <210> 184 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tecr 3'-UTR NM_134118 <400> 184 gcagctcctc acggctctgc ccagtaatac tctccacccc tcactgcccc tgtcctgatg 60 tgtggctggc catggctctc cagcagcaac aataaaacct gcttacccaa aaaaaaaaaa 120 aaaaaa 126 <210> 185 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Rabac1 3'-UTR NM_010261 <400> 185 agtgtcctcc aggacctgcc ggcctctcct gccggccggc tgtcccatct ctgtctgttc 60 tcgtcctacc tggccttgct gctcagctcc gagccttcca cctgaggcct caaacccagg 120 gaggggcttt tgtctttgga aataaagctg ttacaattgc tatttggcca a 171 <210> 186 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Robld3 3'-UTR NM_031248 (Lamtor2) <400> 186 cagcgtgatg gaggctggag tagaaaaggg atgatgatct ggagggaggg gcggggccct 60 agaaacgcca tatcgggcga ggtacaggaa gggggggttg cttttttctg aataaatttt 120 caactcttaa aaaaaaaaaa aaaa 144 <210> 187 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Sod1 3'-UTR NM_011434 <400> 187 acattccctg tgtggtctga gtctcagact catctgctac cctcaaacca ttaaactgta 60 atctgaaaaa aaaaaaaaaa 80 <210> 188 <211> 262 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Nedd8 3'-UTR NM_008683 <400> 188 agaaacttgg ttccgtttac ctccttgccc tgccaatcat aatgtggcat cacatatcct 60 ctcactctct gggacaccag agccactgcc ccctctcttg gatgcccaat cttgtgtgtc 120 tactggtggg agaatgtgag gaccccaggg tgcagtgttc ctggcccaga tggcccctgc 180 tggctattgg gttttagttt gcagtcatgt gtgcttccct gtcttatggc tgtatccttg 240 gttatcaata aaatatttcc tg 262 <210> 189 <211> 257 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Higd2a 3'-UTR NM_025933 <400> 189 gtatagccgg gtcttaaagc gccatggaaa ccattacaaa acccaggaac aacagacatc 60 cctgtcagac ttgctccctc cgtttcagac cggaccttat tgtcatttgg gtgaggaagt 120 ggccgatttt gtaactgatt tgcgcttcca ccgctgcccc ctcccgctcc caaaatccca 180 ggttcatttc agttgggttg catgcttcta tttgtgatgc gtccccttaa ttacttaata 240 aaagcttatt acacttg 257 <210> 190 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Trappc6a 3'-UTR Trappc6a-001 ENSMUST00000002112 <400> 190 ggaccccaga ccccaggctt gcccttccct aagcttagcc tcggaatgtg gcacctgacc 60 ctgcctcact gctcaccttt gcaggtcgcc ttgaagctgg agctcacagg ctctggggag 120 gtcacatgtg cttcagacaa gggaatgaaa gggccgggag ggtcccggga ggtgggacca 180 tcccctgagt tccaagtcag catggaggga cattagggca tcacccagat gacagatgtt 240 cagtaaaggt tctttatgtg caaacaga 268 <210> 191 <211> 188 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ldhb 3'-UTR Ldhb-001 ENSMUST00000032373 <400> 191 ctgccagtct ctaggctgta gaacacaaac ctccaatgtg accatgaacc tttagtcttc 60 agccatgtat gtaggtcaca gtttgcttct tccctgacat gtgatatgag ctcacagatc 120 aaagcccagg cttgtttgat gtttgcacta ggagctcctg atcaaataaa gttagcaatt 180 gcagcata 188 <210> 192 <211> 112 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Nme2 3'-UTR Nme2-001 ENSMUST00000021217 <400> 192 acatgaagaa accagaatcc ttttcagcac tactgatggg tttctggaca gagctcttca 60 tcccactgac aggatggatc atcttttcta aaacaataaa gactttggaa ct 112 <210> 193 <211> 119 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Snrpg 3'-UTR NM_026506 <400> 193 cctgtgctca gcaagcagtg tccacatccc tccccaaagg cctgtttgat tgtgatgtag 60 aattaggtca tgtacatttt catatggaac tttttactaa ataaactttt gtgatactc 119 <210> 194 <211> 235 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa2 3'-UTR NM_010885 <400> 194 aggtctccac tgaggactgt gagcgagagc agctgaacct gctggactga agacagtgtg 60 gggaaatgtg tgctttgggt ccttataaag cttacgctgt acagtgtccc ttcagaatgt 120 cctcttcatt accttctccc tcttactgcg caacactgag gcaaagtagt tttatataaa 180 aatactcctt tatttctcct caaaaaaaaa aaaaaaaaaa acccaccagg tgcca 235 <210> 195 <211> 196 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Serf1 3'-UTR Serf1-003 ENSMUST00000142155 <400> 195 tgactggctt tttggaaaac ctgggtgcta ttgccagtgg gtgcatcata cgctctaaga 60 ttaaaatttc acagtgacta atcattatat gtgttataac ttgtccttat aaaactattt 120 taaactttac tcttcagcct atcttaatgt gatgttttaa gaccatcaaa aaataaagta 180 ctgaccttgc atgtaa 196 <210> 196 <211> 286 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Oaz1 3'-UTR Oaz1-001 ENSMUST00000180036 <400> 196 gtgccagccc tgcccagtgt ccctgtgccc tctcctgggt tagtccacat gtcgtgattg 60 tgcagaataa acgctcactc cattagcggg gtgcttcttc gagctgaatg ctgtgtttgt 120 cacactcaag tgttggcttt aattctaaat aaaggtttct attttacttt tttattgctg 180 tttaagatgg tcaggtgacc tatgctatag cagtctcctt tgaagtctgg aaaaatagtg 240 tcacctcccc tggctcaaat ccaataaagt gatctcgttc attggc 286 <210> 197 <211> 418 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ybx1 3'-UTR Ybx1-001 ENSMUST00000079644 <400> 197 atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60 tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120 tttgccctct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180 tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240 aaaaaaaaag gcctggtttt tctcaataca cctttaacgg tttttaaatt gtttcatatc 300 tggtcaagtt gagattttta agaacttcat ttttaatttg taataaagtt tacaacttga 360 ttttttcaaa aaagtcaaca aactgcaagc acctgttaat aaaggtctta aataataa 418 <210> 198 <211> 421 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ybx1(v2) 3'-UTR with mutation T128bpG and deletion del236-237bp <400> 198 tttttatgcc ggcttaccat ctctaccatc atccggtttg gtcatccaac aagaagaaat 60 gaatatgaaa ttccagcaat aagaaatgaa caaagattgg agctgaagac cttaagtgct 120 tgctttttgc ccgctgacca gataacatta gaactatctg cattatctat gcagcatggg 180 gtttttatta tttttaccta aagatgtctc tttttggtaa tgacaaacgt gttttttaag 240 aaaaaaaaaa aaggcctggt ttttctcaat acacctttaa cggtttttaa attgtttcat 300 atctggtcaa gttgagattt ttaagaactt catttttaat ttgtaataaa gtttacaact 360 tgattttttc aaaaaagtca acaaactgca agcacctgtt aataaaggtc ttaaataata 420 a 421 <210> 199 <211> 798 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Sepp1 3'-UTR NM_009155 <400> 199 attatttaaa acaaggcata cctctcccca actcagtcta aagacacaat ttcattttga 60 gaatgtttac agcccattta attaatcagt gaactaaaag tcatagaaat tggatttgtg 120 caaatgtaga gaaatctacc atattggctt ccaaaattta aaaattttat gccacagaac 180 atttcatcca aatcagattt gtacaatagg gcacctgaaa agtgactgca gcctttggtt 240 aatatgtctt tctttttcct ttttccagtg ttctagttac attaatgaga acagaaacat 300 aaactatgac ctaggggttt ctgttggata gcttgtaatt aagaacggag aaagaacaac 360 aaagacatat tttccagttt tttttttctt tacttaaact ctgaaaacaa cagaaacttt 420 gtcttcctac tcttacattc taaaccgatg aaatctttaa cagattacac tttaaatatc 480 tactcatcat tttctctctc agagtcctag cttgagttgc actgcatgta tctgtgcatc 540 ttgttctctt catttaatgc tgtactgttc tgctgagctc tgagggacta tcttgagaga 600 tgtaatggaa ggaaagcgtg gtgttaatct gcgtactgct taagacagta tttccataat 660 caatgatggt ttcatagaga aactaagtcc tatgaacctg acctctttta tggctaatac 720 gactaagcaa gaatggagta cagaattaag tggctacagt acacacttat caaaataaat 780 gcaattttaa aacctttc 798 <210> 200 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gaa 3'-UTR Gaa-001 ENSMUST00000106259 <400> 200 gagagtccgt cgtttacaga ggcctccagg gaggcagagg gagcttgagc tggctctggc 60 tggtggctcc tgtaaggacc tgcgtcctgc tctcctgaca catctttgag cttttcccac 120 cgtgttactg catgcgcccc tgaagctctg tgttcttagg agagtgaggc tcgcctcacc 180 tgccccaccc cagctgtctg tccctcacct ggcactagag aatgtggagc tcggcgtggg 240 gacatcgtgt ctgcaccaac atcaggctgt gcagccactg cagccgcaac cctgcagaga 300 cagagctggt gccttcacca ggttcccaag actcgagaaa cttactgtga agtgtactta 360 cttttaataa aaaggatatt gtttggaagc 390 <210> 201 <211> 481 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ACTR10 3'-UTR ACTR10-002 ENST00000254286 <400> 201 aagtttgatt aaaaatcaac cttgcttcat atcaaatatt taaccaatta taagcaaatt 60 gtacaaagta tgtaggatgt tttgttatag aggactatag tggaagtgaa agcattctgt 120 gtttactctt tgcattaata tataattctt ttgactttgt ttctcttgtg tagtggtaaa 180 atggtagctg gtgcttattg agatttgctg tatttatatc aataaagtat agtaaagcag 240 tttgattttg gaagtttgtt atgtggcttt tttttttttt ttttttttga gacggagtct 300 cgctctgtca cttaggctgg agtgcagtgg cacaatctct actcattgca agctccgcct 360 cccgggttta cgccattctg tctcagcctc ctgagtagct gggactatag gcatacgcca 420 ccccgcccgg ctaatttttt gtatatttag tagagacggg gtttcaccat gttagccagg 480 a 481 <210> 202 <211> 347 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PIGF 3'-UTR NM_173074 <400> 202 gtaacttaat cctgacaacc gtagtgcaag gtatggccca tctcctgtac gcttggagcg 60 acctttggct acgtggctgg ccttgttatt tcaccactct ggatatactg gaatagaaag 120 caacttacat acaagaacaa ttaactggag caaagggaga tatttctttg tgcagattct 180 gtaagggctg ggcagaaatg tgtatggtca aagccaagca gttccattta cagctctgtt 240 ttttacgtag ttacaacatg atgtgattgt agctttttaa actatgaaac ccctgagaga 300 ttgtaccttc tagttgaaat aaagtattta taatagattg tggcttc 347 <210> 203 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PIGF 3'-UTR NM_002643.3 <400> 203 ctggagcaaa gggagatatt tctttgtgca gattctgtaa gggctgggca gaaatgtgta 60 tggtcaaagc caagcagttc catttacagc tctgtttttt acgtagttac aacatgatgt 120 gattgtagct ttttaaacta tgaaacccct gagagattgt accttctagt tgaaataaag 180 tatttataat agattgtggc ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 233 <210> 204 <211> 116 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MGST3 3'-UTR MGST3-001 ENST00000367889 <400> 204 agaattatag gggtttaaaa actctcattc attttaaatg acttaccttt atttccagtt 60 acattttttt tctaaatata ataaaaactt acctggcatc agcctcatac ctaaaa 116 <210> 205 <211> 913 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SCP2 3'-UTR NM_001193599 <400> 205 agaactccct ttggctactt ttgaaaatca agatgagata tatagatata tatccataca 60 ttttattgtc agaatttaga ctgaaactac acattggcaa atagcgtggg atagatttgt 120 ttcttaatgg gtgtgaccaa tcctgttttt cctatgctct gggtgaatag agcctgatgg 180 tatactactg ctttgcggaa ttgcatacaa ctgtgcatta caaagttaat atggtaatta 240 tggtctgggg taaaattgag tttcagaata aaattaggaa cagtaaaatc caaagaacta 300 tgtaaacaaa aaagcttttg ttttgcttac aaagtatatt taaggattat tctgctgaag 360 attcagttta agagttttcc ttgggagaac taagtaagaa acacaatgcc aacagctggc 420 cagtaattag tgttgtgcac ttcatgtcat taatcaattt ctcaatagtt cttaaaatta 480 gtgagattaa aaatctaaaa attttgcatt tcatgctatc agaaacagta ttttcttccc 540 aaatcaaaat aaaagaaata tgatcagagc ttgaacacag gcttattttt aaaataaaaa 600 tatttttaac atgggtttcc ttattgaaaa atcagtgtat tagtcataaa acaccatcat 660 taagaataat tgaacaataa agtttgcttt cagatgcagt tttcaaatta taatctcatt 720 tcaatttata acgttctcag tcctttgtta taattttcct ttttcatgta agtttaatta 780 tctgcattta tcttttttcc tagtttttct aatactaatg ttatttctta aaattcagtg 840 agatatagga taaaataatg ctttgagaag aatgtttaat agaaaattaa aataactttt 900 tctggcctct ctt 913 <210> 206 <211> 409 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SCP2 3'-UTR SCP2-015 ENST00000435345 <400> 206 agaactccct ttggctactt ttgaaaatca agatgagata tatagatata tatccataca 60 ttttattgtc agaatttaga ctgaaactac acattggcaa atagcgtggg atagatttgt 120 ttcttaatgg gtgtgaccaa tcctgttttt cctatgctct gggtgaatag agcctgatgg 180 tatactactg ctttgcggaa ttgcatacaa ctgtgcatta caaagttaat atggtaatta 240 tggtctgggg taaaattgag tttcagaata aaattaggaa cagtaaaatc caaagaacta 300 tgtaaacaaa aaagcttttg ttttgcttac aaagtatatt taaggattat tctgctgaag 360 attcagttta agagttttcc ttgggagaac taagtaagaa acacaatgc 409 <210> 207 <211> 591 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HPRT1 3'-UTR HPRT1-001 ENST00000298556 <400> 207 gatgagagtt caagttgagt ttggaaacat ctggagtcct attgacatcg ccagtaaaat 60 tatcaatgtt ctagttctgt ggccatctgc ttagtagagc tttttgcatg tatcttctaa 120 gaattttatc tgttttgtac tttagaaatg tcagttgctg cattcctaaa ctgtttattt 180 gcactatgag cctatagact atcagttccc tttgggcgga ttgttgttta acttgtaaat 240 gaaaaaattc tcttaaacca cagcactatt gagtgaaaca ttgaactcat atctgtaaga 300 aataaagaga agatatatta gttttttaat tggtatttta atttttatat atgcaggaaa 360 gaatagaagt gattgaatat tgttaattat accaccgtgt gttagaaaag taagaagcag 420 tcaattttca catcaaagac agcatctaag aagttttgtt ctgtcctgga attattttag 480 tagtgtttca gtaatgttga ctgtattttc caacttgttc aaattattac cagtgaatct 540 ttgtcagcag ttccctttta aatgcaaatc aataaattcc caaaaattta a 591 <210> 208 <211> 283 <212> DNA <213> Artificial Sequence <220> <223> ACSF2 Homo sapiens <400> 208 ataaagcagc aggcctgtcc tggccggttg gcttgactct ctcctgtcag aatgcaacct 60 ggctttatgc acctagatgt ccccagcacc cagttctgag ccaggcacat caaatgtcaa 120 ggaattgact gaacgaacta agagctcctg gatgggtccg ggaactcgcc tgggcacaag 180 gtgccaaaag gcaggcagcc tgcccaggcc ctccctcctg tccatccccc acattcccct 240 gtctgtcctt gtgatttggc ataaagagct tctgttttct ttg 283 <210> 209 <211> 555 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens VPS13A 3'-UTR NM_033305 <400> 209 aattcatatg ttctttattt tacttggaat gtttcattaa catgttttgt atgacttata 60 ccataatgcc catatgtcca tttataggga ggtaaaacac attttctttt aaaatgtttt 120 cctacacatt ttcataaagc aaaataattg tattatttaa gcacagaaaa aaatgtatct 180 tacatccaaa gtagggaggg catccaacat attatagatt tgcttttata tattttatag 240 ctttgtattg catagtttgt ctttaagagt tcaagttaga cttaaatata attttgatgt 300 tcactggttt tattttaaat tgccttctta tttgttagca aaatgccttt ttttaatggt 360 ctctgtaaat tttctgggct ttaatgtaat gccactgtgt aaaaaaaaag gaagaaaata 420 gtaatagcca tttaatgttt tatatttatc attttaaaga tatttttgtc aaatttcttt 480 taataataat aaacatatgt aatctaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540 aaaaaaaaaa aaaaa 555 <210> 210 <211> 724 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CTH 3'-UTR NM_001190463.1 <400> 210 tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60 aatggaccaa caatgagcct ttgcaaaatt ttcaagcgga aattttaagg cacctcatta 120 tctttcataa ctgtaatttt cttagggatc atctctgtta aaaagttttc tgtatgtcat 180 gttataatta caggtcaatt ctgttaatat ctttttgtta attttgctct atgtttgcct 240 ctgaaggagg tgagatttgt gctactttgg gagattatgt tcttttttca tgtctaagat 300 ttattttgat catgtttata atataatggt aattcatttt tgatgttttg tgaagaattt 360 aaatttaaac gaatgttctt aaatcaagtg tgattttttt gcatatcatt gaaaagaaca 420 ttaaaagcaa tggtttacac ttagttacca taagccgaaa atcaaatact tgaaaagttt 480 actgtgaaat tctactgatt taagactata cttaatattt ttaaaaaaat aaatcagctg 540 ggcgcggtgg ctcacgcatg taatgccagc acttttggag gataaggcgg gcggatcacg 600 aggtcaggag attgagacca tcctggctag cgcagtgaaa cccccatctc tactaaaaat 660 gcaaaaaaaa ttagacggac gtggtggcgg gtgcctgtag tcccagctac ttgggaggct 720 gagg 724 <210> 211 <211> 443 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CTH 3'-UTR CTH-001 ENST00000370938 <400> 211 tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60 aatggaccaa caatgagcct ttgcaaaatt ttcaagcgga aattttaagg cacctcatta 120 tctttcataa ctgtaatttt cttagggatc atctctgtta aaaagttttc tgtatgtcat 180 gttataatta caggtcaatt ctgttaatat ctttttgtta attttgctct atgtttgcct 240 ctgaaggagg tgagatttgt gctactttgg gagattatgt tcttttttca tgtctaagat 300 ttattttgat catgtttata atataatggt aattcatttt tgatgttttg tgaagaattt 360 aaatttaaac gaatgttctt aaatcaagtg tgattttttt gcatatcatt gaaaagaaca 420 ttaaaagcaa tggtttacac tta 443 <210> 212 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CTH 3'-UTR CTH-002 ENST00000346806 <400> 212 tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60 aatggaccaa caatgag 77 <210> 213 <211> 286 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NXT2 3'-UTR NXT2-004 ENST00000372107 <400> 213 aggggcaaaa gtccattctc atttggtcca ttagttccag caattgaaat ttatgtgaat 60 tattttgatt gtagaagcac tataatatgt gctgaaacta aatttcttta atattttcta 120 ttcctgtcag caccttttct agcagctgcc agtttggagc attgccctct aagagcttta 180 aaactatttt tttacatgcc ttatatacat tccactaatg acattcttat aataatatta 240 aacacatgat cttggtacta acatactcac tgtgaaccca gcctat 286 <210> 214 <211> 121 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MGST2 3'-UTR NM_002413 <400> 214 ctttttctct tccctttaat gcttgcagaa gctgttccca ccatgaaggt aatatggtat 60 catttgttaa ataaaaataa agtctttatt ctgtttttct tgaaaaaaaa aaaaaaaaaa 120 a 121 <210> 215 <211> 582 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MGST2 3'-UTR NM_001204366.1 <400> 215 ctttttctct tccctttaat gcttgcagaa gctgttccca ccatgaaggc ttgaagccac 60 agtgcatggc cagaaccagc cagacctttg gagttcaaga actcgagagg tgggtgaaaa 120 ctgccattgc ctccacagac tgtcttctcc gtggaaagaa gacctgagtc accagggctg 180 ggaaacctgc accactgaga cgagcacagc ctctgccggc atgcaagtgg ccgctgtcag 240 gacacatgga ctgaaagtgg tttgtcagct gctccattag gtttttttta cccatatgtt 300 tgctaccttt ctttccttga tttaaaaata gggaggggga gcagtctcag ctgtcttcag 360 ctgctaggga gatttttttc cccctcctga gctactgttt cccccaaccc gagcctttct 420 ctcttattgt acccaccctt tctgatgaag tcatcaaagc aaagattgca taactgatgc 480 ataggcctat cttgtgttat actgggagac aggccaatgt ttccattaat agacaagagc 540 accaccacgc tgccaaatgg agctctctgc tgcaaccact ac 582 <210> 216 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C11orf67 3'-UTR AAMDC-005 ENST00000526415 <400> 216 tggagcctta agaggagaat aaatcactaa gtgccta 37 <210> 217 <211> 266 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PCCA 3'-UTR NM_000282 <400> 217 aggatttata acctttcagt catcacccaa tttaattagc catttgcatg atgctttcac 60 acacaattga ttcaagcatt atacaggaac acccctgtgc agctacgttt acgtcgtcat 120 ttattccaca gagtcaagac caatattctg ccaaaaaatc accaatggaa attttcattg 180 atataaatac ttgtacatat gatttgtact tctgctgtga gattccctag tgtcaaaatt 240 aaatcaataa aactgagcat ttgtct 266 <210> 218 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GLMN 3'-UTR NM_053274 <400> 218 aagttccatt tcctaaataa aaactaataa aatatagtac tttccattat gattcattta 60 atacctttat aaaaaatttt tctgtaaaaa tttactgctt gaaaaataaa tgtagctttt 120 ctcatttatc aaaaaaaaaa aa 142 <210> 219 <211> 276 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens DHRS1 3'-UTR NM_001136050 <400> 219 ccctcctggt ctgacactac gtctctgctt gtcttctcat ttggacttgg tggttcgtcc 60 tgtctcagtg aaacagcagc ctttcttgtt tacccatacc cttgatatga agagaagccc 120 tctgctgtgt gtccgtggtg agttctgggg tgcgcctagg tcccttcttt gtgccttggt 180 tttccttgtc cttcttttta ctttttgcct tagtattgaa aaatgctctt ggagctaata 240 aaagtctcat ttctctttca aaaaaaaaaa aaaaaa 276 <210> 220 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PON2 3'-UTR PON2-001 ENST00000433091 <400> 220 attgtacttt tggcatgaaa gtgcgataac ttaacaatta attttctatg aattgctaat 60 tctgagggaa tttaaccagc aacattgacc cagaaatgta tggcatgtgt agttaatttt 120 attccagtaa ggaacggccc ttttagttct tagagcactt ttaacaaaaa aggaaaatga 180 acaggttctt taaaatgcca agcaagggac agaaaagaaa gctgctttcg aataaagtga 240 atacattttg cacaaagtaa gcctcacctt tgccttccaa ctgccagaac atggattcca 300 ctgaaataga gtgaattata tttccttaaa atgtgagtga cctcacttct ggcactgtga 360 ctactatggc tgtttagaac tactgataac gtattttgat gttttgtact tacatctttg 420 tttaccatta aaaagttgga gttatattaa 450 <210> 221 <211> 277 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NME7 3'-UTR NM_013330 <400> 221 tggtgtggaa agtaaagaag tcacaggttg ggacatttag acaagagtga atcacacacg 60 aggaatgtgt tcattctttt attgtccgtt gttttaacct gactgaatac aagatcaaca 120 agagcactgt actcctggca attattacat atgttagaac atggattttg cactgtagac 180 aacatttaac accagtctat ggggtactgc attgcttttt ataaagttca aaataaagat 240 ttattttcaa acaaaaaaaa aaaaaaaaaa aaaaaaa 277 <210> 222 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ETFDH 3'-UTR NM_004453 <400> 222 actgcagcta gccagtttct ttcaagtatg gcaagctaac gttaaaatgt ttagagatta 60 acagatttca gaatgtcttt ctgcatatta ctgaacagaa tagtcacaaa atgattatca 120 aataaaaatt ttatactata tgtaagattg tcccataaag aaa 163 <210> 223 <211> 275 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ALG13 3'-UTR BC117377 <400> 223 gatccagcag tatgaagtat tcttgcactg ccattttctt gctgtttttg tttttaaaaa 60 gtattttatg ttagtggtta aatgatttag gtgattagtg tttactattg tatttgtctt 120 taaaattatt ttatcttttg atttaaaata gtactttaaa attaaggggt attattttgg 180 gctgtgacta aggaaattga gatggatgta caactagccc catattgagc atacttcatt 240 gtattcagct gttttcctgt cagccatttg tcagc 275 <210> 224 <211> 664 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ALG13 3'-UTR NM_001099922.2 <400> 224 gatccagcag tatgaagtat tcttgcactg ccattttctt gctgtttttg tttttaaaaa 60 gtattttatg ttagtggtta aatgatttag gtgattagtg tttactattg tatttgtctt 120 taaaattatt ttatcttttg atttaaaata gtactttaaa attaaggggt attattttgg 180 gctgtgacta aggaaattga gatggatgta caactagccc catattgagc atacttcatt 240 gtattcagct gttttcctgt cagccatttg tcagctttat attagctgat ggtaccaatt 300 gataaaatga atataaagta tttcattggt tcaaaaatca cacatcatat taaaccatgc 360 agaattggag taacttccac ttttttctag aaagtaaaac caagagcctt tgcttctgga 420 taactcactt aatattaaat taaagagctc ttcacgtttc ttgagaatta tctgaagcca 480 gttgcattct gtgatatcag ttttgaaggc acatggttct ctgctttaga tttatcccat 540 atgctattgt ttaatactgg atgtatgtaa gtgttttact gcactgtatt gaattggtgt 600 cttttgcaca gttagcagta aataaaaatt agcatttaaa attgccaaaa aaaaaaaaaa 660 aaaa 664 <210> 225 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens DDX60 3'-UTR DDX60-001 ENST00000393743 <400> 225 aaacaaagtc tatgcaaacc acttaaaaat aattccatag tagtttttca ggtcacgttt 60 ttgattctta tgcttcttgc cagaaataca ttatgataaa gtggaaatac attacgatga 120 agtggaaaga gcaaacactt tggaatcaaa cagagttgca atcaaacctg ccatgttctg 180 tcatgaatac tcacaaatta tttagtatac ctgaatcttg gtttcttttt ataactgagt 240 aataatggtt acatctcagg tagtttgagg attgactaaa aaaatgcgag aatgttgtat 300 gtgactgaat aacaattttt actctgcgaa gccaaagtaa atataatatt atcagtaact 360 ttatccccag tgtcagtatt tataaaatgt ttattaaggc tagaaaaaat gaatacaata 420 tcctgaaggt gaaatatatt ctcttcaatt agcataaata tgatttacat aagttagcta 480 tacagctatt gagatagtac tttctagtaa acttaaacta ctttttaaac atacattttg 540 tgatgattta acaaaaatat agagaatgat ttgctttatt gtaattgtat ataagtgact 600 ggaaaagcac aaagaaataa agtgggttcg atctgtttac 640 <210> 226 <211> 451 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens DYNC2LI1 3'-UTR NM_015522.3 <400> 226 aattcatttg atgtagatga acctgttcac tggaaaatta cagcaattta ttaaaacctc 60 agtaagagca aaacaaggaa gaagattcct tatatcttct tgttagacat cttctgtgat 120 tgttatggca tattacacca atcagagaaa tagagtttta aagtagtggt ttgatattga 180 ttttataatc tctgtaaaaa tgaagataaa aagccagatt gtacaaaagt cacctgacaa 240 agactagatg aagctacaac tttaagcaag gggtagagtt gtaatagcct tcaccatcac 300 tctgtatttt acattcattt cgtttctgtc acttattcag tatcttttta tcatctgaca 360 gctaattaaa ttataaagtt gctatgatgg taacacaagt tcttcaaata caataataaa 420 tatcatcatc tggaaaaaaa aaaaaaaaaa a 451 <210> 227 <211> 606 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens VPS8 3'-UTR NM_001009921, NM_015303 <400> 227 tgactccatg gagcctggcc caggagaacc agagatgatc ccgaggcagc tggggagagg 60 ccccgcctct ggtgggcttg gcctccacca cctcccacgc ttctgagaag aggttccaaa 120 ttgggcttct gtgcccagag cgtccacagc accattccca gtgtagactc ccagtcttct 180 ccacattgct gtcatggcgt cagttcacca gactcattga ttttgttttg cttgttaagc 240 aaaggaatgt cacatacctc tgtccagctt tttaggaaat acatttcgcc tattgcgact 300 ttttccattt accctgaagc ctagaaagta ggtggaactc acacaaatgg cattccagag 360 tctgccatac tccgtctcct ccagctgctg gataatacag aggaacttca acttctacag 420 ggaacagtgg ttggccaggc tgcagtataa ctgaagcatg ccttggagag agcagacact 480 gtgggggcca gggccatctc cctttaatgt gttcatgtta aaacctattt gagtgtaaga 540 cttgcccttt ctaacaataa atgctccgtg tttaagttct gcaggtctca aaaaaaaaaa 600 aaaaaa 606 <210> 228 <211> 360 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ITFG1 3'-UTR NM_030790 <400> 228 cttgccttta atattacata atggaatggc tgttcacttg attagttgaa acacaaattc 60 tggcttgaaa aaatagggga gattaaatat tatttataaa tgatgtatcc catggtaatt 120 attggaaagt attcaaataa atatggtttg aatatgtcac aaggtctttt tttttaaagc 180 actttgtata taaaaatttg ggttctctat tctgtagtgc tgtacatttt tgttcctttg 240 tggaatgtgt tgcatgtact ccagtgtttg tgtatttata atcttatttg catcatgatg 300 atggaaaaag ttgtgtaaat aaaaataatt aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 <210> 229 <211> 215 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CDK5 3'-UTR NM_004935 <400> 229 gccccgggac ccccggcctc caggctgggg cctggcctat ttaagccccc tcttgagagg 60 ggtgagacag tgggggtgcc tggtgcgctg tgctccagca gtgctgggcc cagccggggt 120 ggggtgcctg agcccgaatt tctcactccc tttgtggact ttatttaatt tcataaattg 180 gctcctttcc cacagtcaaa aaaaaaaaaa aaaaa 215 <210> 230 <211> 146 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C1orf112 3'-UTR BC091516 <400> 230 aacttatcac taggcagaac tgggtttgat gctttgtcaa ctgaaaatac ttatgtctgt 60 acattttcta acagatataa aacaaatttt gtaaagttga aaaaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa aaaaaa 146 <210> 231 <211> 239 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IFT52 3'-UTR NM_016004 <400> 231 agaccatgcc tcttgaagct ttttctgcct cctgattctc tctttgtaaa ctattttcaa 60 attgtttttc aactccttat caaaattgtt tatacactct ttcctccatg agctctggaa 120 ggtatatgca tcttctgtaa tactcagata ggtataagat ttttcacaaa atccttatgt 180 aagatacatt ccatttttaa aaattaaatg tatggttgca tctgtctttt tatacccta 239 <210> 232 <211> 146 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CLYBL 3'-UTR CLYBL-003 ENST00000339105 <400> 232 tctgttaaat gaagctgtca tcaggctaaa gggtattgaa gctgcagagg gatcaacttg 60 tgcttgccag aggacgccaa tgaagtttga aacaccaaca atcagagatt ttgtttctgt 120 tcctcattaa atcatgagct tttgtg 146 <210> 233 <211> 477 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens FAM114A2 3'-UTR FAM114A2-006 ENST00000520667 <400> 233 agaatggaga cgttttgacc tgggacttgt gacggccaag gaatgccacc ttattctggc 60 tactcctgca gaaatgaagg agtggggtta ttttagtata taaaaattca ggcaggagag 120 atggtttaaa gaggaagatt gttgccttca gtgtttgatt gaagtattca ggttctcaca 180 gtattctttc cagttgttgt aattcataaa ttatttgaaa agaaactttt gtagaaagtc 240 caagaataat aactctagat aaagattagt gggacactca ggcaaaaatg ttggtctttc 300 tttgacatgt tgcaaaatgt tatcaatttt gtcatggata taatttgcag cccatggata 360 taactggttg ataagccaga gaaaaataat ttagtgttct aaaattcatg gcatgtgtgg 420 tttattaatg ccatgtactt tctcctttct ggaataaaat ctatggcttt aagaaaa 477 <210> 234 <211> 310 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NUDT7 3'-UTR NM_001243661 <400> 234 tttactagag caagagacaa agaactattc acgaggattc tgtgtgtgct tattcgtaga 60 acaacaacaa tgccagctgt tggaatttga caggtgtgaa tattttttct gcagtatgta 120 gttagaatcc ttgcctcttt tccagttgcc ttctattgtc tgaaaaagta aaagccattc 180 aaaaatgaaa actatgttca tagtgttgca tattttcacc cacaatatgt taataatatt 240 tttcttacac atataataaa gaatatctgg cacatactag gcccttaata aagatttttt 300 gaatatataa 310 <210> 235 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens AKD1 3'-UTR NM_001145128 <400> 235 tttacttagg tgatagcagc ctgaatctca agagttatct gaaagtgata gagggaaact 60 gagagaagta gattgaaaat ctgggcctct tggaagtact tttgcctcct gagcaaggta 120 ccatggctgc cagacttcag gtgaactcaa aggtctgcca gccaggaagg agcactctta 180 tggaaacaag ttttaataca attttaaaat gtattgctct ttgcctgaac tttgatgctt 240 taacaaaata aacattctat ttataattcc atatagaaaa gttaagtgac ttatttaata 300 aatgtattat tttccttttt aacattttca gtagaaaagt cagtctctgt taaaattact 360 cattaaatgt tagaaagctt taagacattt aacattgtta taaatgaaac caaaatatgg 420 gttatacatt ttacatacaa aactgtttgt gaactttgtg aacataagat actatcattt 480 tcccaataaa ataaatggat tttgcaacaa ctt 513 <210> 236 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MAGED2 3'-UTR NM_014599 <400> 236 gattttagat attgttaatc ctgccagtct ttctcttcaa gccagggtgc atcctcagaa 60 acctactcaa cacagcactc taggcagcca ctatcaatca attgaagttg acactctgca 120 ttaaatctat ttgccatttc aaaaaaaaaa aaaaaaaaaa 160 <210> 237 <211> 498 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HRSP12 3'-UTR HRSP12-001 ENST00000254878 <400> 237 gtgggcccag tgctgtgtag tctggaattg ttaacatttt aatttttaca attgatgtaa 60 catcttaatt aaccttttaa ttttcacaat tgatgacagt gtgagtttga tgaaaatatc 120 tgaagctatt atggaaatac catgtaatag ggagagttga acatgaatat tagagaagga 180 atccagttac ttttttaaat tacacctgtg tgcacctgta ttactgaata taggaaagag 240 atacccatta catagttact cagtaaacaa aagagaaata ccaggtagga aagaagagtt 300 actattcctg agaaataatc aagaacatat ttaatttaaa ctaatgatgt gaactattta 360 gttttgatgt ccgttatgtg attctgcttt tacttgagta aaattaaagt gtttaaattt 420 gagatcaagg agaagatagt ggaacaaaat gttatataga taatattttt ctaatggaaa 480 taaaataggc agatttcc 498 <210> 238 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens STX8 NM_004853 3'-UTR <400> 238 tggcagtaaa gagaccacca gcagtgacac ctgccaatga cagatgcaag cccaacaccc 60 ttttggtacg caaaacctgc tctcaataaa ttcccccaaa gctctgaaaa aaaaaaaaaa 120 aaaaaaa 127 <210> 239 <211> 386 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ACAT1 3'-UTR ACAT1-001 ENST00000265838 <400> 239 acaacctctg ctatttaagg agacaaccct atgtgaccag aaggcctgct gtaatcagtg 60 tgactactgt gggtcagctt atattcagat aagctgtttc attttttatt attttctatg 120 ttaactttta aaaatcaaaa tgatgaaatc ccaaaacatt ttgaaattaa aaataaattt 180 cttcttctgc ttttttcttg gtaaccttga aaagtttgat acatttttgc attctgagtc 240 tatacttatc gaaatatggt agaaatacca atgtgtaata ttagtgactt acataagtag 300 ctagaagttt ccatttgtga gaacacattt atatttttga ggattgttaa aggtcaagtg 360 aatgctcttt ataggtaatt tacatt 386 <210> 240 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IFT74 3'-UTR IFT74-201 ENST00000433700 <400> 240 gtttaagtcc actgaaagtc tctaaggaag tatcctcttg ctgctaaact tggtacaagt 60 tgactaccaa aaaaaaaaaa agcttacttt tggagtttac ctaaaatttc tgaatgttat 120 aatttttgtg gcctctttta agaatgatat tttaaaatag taaatagttc aataaatggt 180 ttgcatatt 189 <210> 241 <211> 361 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens KIFAP3 3'-UTR NM_014970 <400> 241 taaagtatct gtttccatgt gtaatctcag cttagaagaa atctgtgtgg gttgggttaa 60 ttttggatct ttgcctaata atgcatgttg atgttattgt gggtctgtgt ttgtttttat 120 ttttatatgt tgttagctgc agattaaccc cagcccctct gtcttctgtt aagtacagtt 180 gatactgaca ttgttcactc atcaaaccac atcttgatgc taagtaacat ttcccatgag 240 ccacaaaact gaatgctgaa aagctactag actggaaaac aaacactgca ttatgtatgt 300 taagtgacta atttaatttc aattaaaaag cgtaaagtga aaatgaaaaa aaaaaaaaaa 360 a 361 <210> 242 <211> 783 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CAPN1 3'-UTR NM_005186 <400> 242 ggcagggact cggtccccct tgccgtgctc ccctccctcc tcgtctgcca agcctcgcct 60 cctaccacac cacaccaggc caccccagct gcaagtgcct tccttggagc agagaggcag 120 cctcgtcctc ctgtcccctc tcctcccagc caccatcgtt catctgctcc gggcagaact 180 gtgtggcccc tgcctgtgcc agccatgggc tcgggatgga ctccctgggc cccacccatt 240 gccaagccag gaaggcagct ttcgcttgtt cctgcctcgg gacagccccg ggtttcccca 300 gcatcctgat gtgtcccctc tccccacttc agaggccacc cactcagcac caccggcctg 360 gccttgcctg cagactataa actataacca ctagctcgac acagtctgca gtccaggcgt 420 gtggagccgc ctcccggctc ggggaggccc cggggctggg aacgcctgtg ccttcctgcg 480 ccgaagccaa cgccccctct gtccttccct ggccctgctg ccgaccagga gctgcccagc 540 ctgtgggcgg tcggccttcc ctccttcgct ccttttttat attagtgatt ttaaagggga 600 ctcttcaggg acttgtgtac tggttatggg ggtgccagag gcactaggct tggggtgggg 660 aggtcccgtg ttccatatag aggaacccca aataataaaa ggccccacat ctgtctgtga 720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780 aaa 783 <210> 243 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens COX11 3'-UTR NM_001162861 <400> 243 agagttggca cctttgatgt ggtagtgagc tgatcatcca ctttcttcta aaataaagag 60 aagaaaatgg ccagtaaaaa aaaaaaaa 88 <210> 244 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GLT8D4 3'-UTR BC127733 <400> 244 atattttgtc ttgttgcaag tcaattaggt gtcttgtgaa caaggaaata ctaatctcta 60 agctgcctgg gtctttt 77 <210> 245 <211> 215 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GLT8D4 3'-UTR NM_001080393 <400> 245 atattttgtc ttgttgcaag tcaattaggt gtcttgtgac caaggaaata ctaatctcta 60 agctgcctgg gtctttttgt gtgaatattt aatggtgctc catgactgtt gagttttaaa 120 aacctcgtta aattttgcca aatcagttgc ccccaaaagg gaatatgctt ttccttattt 180 ttttttctaa aatgctattt atctctaagg aaaaa 215 <210> 246 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HACL1 3'-UTR NM_012260 <400> 246 ataaagacgc cagttggtgg tcttgagttt tctctttctt gcaagatgaa attttatttt 60 ccacagcaaa attactctac tgttaaaatt gtgcaaaata aaataaacat ttaaaatgac 120 attttacagt aaaaaaaaaa 140 <210> 247 <211> 273 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IFT88 3'-UTR NM_175605 <400> 247 tattcacttt aatatttatt aaaggaaaga aattgcctta tgagatcatc ctcatgttaa 60 accttggatt aaatatctaa cctgtaatta ttttttttca ctgtcaaaac ttaagtaagt 120 gtattctatt ctgtatgtat gcatttaagt tgtttttttc ttttaaggaa taaaaacagg 180 taaaactaat actttaggcc agtgacttcc ttagcttttt gaaaacattg acacacagga 240 agaaataaat ttcataacac aaaaaaaaaa aaa 273 <210> 248 <211> 187 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IFT88 3'-UTR IFT88-001 ENST00000351808 <400> 248 tattcacttt aatatttatt aaaggaaaga aattgcctta tgagatcatc ctcatgttaa 60 accttggatt aaatatctaa cctgtaatta ttttttttca ctgtcaaaac ttaagtaagt 120 gtattctatt ctgtatgtat gcatttaagt tgtttttttc ttttaaggaa taaaaacagg 180 taaaact 187 <210> 249 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NDUFB3 3'-UTR NM_002491 <400> 249 agataatacc tggaagcatc atagtggttt cttaactctc caaaataaga tttcttctct 60 gtagcctact tgtctggttt atcccttaca gaatattagt aagatttaat caattaaaat 120 atatatatat gccaaaaaaa aaaaaaaaaa 150 <210> 250 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ANO10 3'-UTR NM_018075 <400> 250 gtgcccagcg tgcccagctg ccctgttggc agaggcctgt gtctgtgcca cacctgccac 60 ggtggcaggg ggggtacccg gggcagcatc gtggctcctg aacccagacc caatgcttag 120 ccaaacgaag tggctcccat gtggcaagca cccttctcag tttcgcagtg gcttggctcg 180 ggatccttgg cagttccccc agccccaccc tgtctgctcc ttcccagttc cttcccgggc 240 cccacacgct gctccagctg ccaactttgc tgcagagcca ctgccgccct tgagcctctc 300 accatgagtg agccaccagc tctccacgtt cccctcatag cagtgtcact cccaacccca 360 ccatggccca gggacccgtg gacaggttgg ggatggggtg tgtgcccact gtgctcatca 420 caggagcctc agttgagagt gagcggggta cagtaaggca gtgcttccca cactggacct 480 ctttcctggt tctcttttgc aatacattaa cagacccttt atcaacataa acaatagtaa 540 ctgagctatt aaaggcaacc tctctgactc cttctgccta aaaaaaaaa 589 <210> 251 <211> 263 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ANO10 3'-UTR ANO10-005 ENST00000451430 <400> 251 gtgcccagcg tgcccagctg ccctgttggc agaggcctgt gtctgtgcca cacctgccac 60 ggtggcaggg ggggtacccg gggcagcatc gtggctcctg aacccagacc caatgcttag 120 ccaaacgaag tggctcccat gtggcaagca cccttctcag tttcgcagtg gcttggctcg 180 ggatccttgg cagttccccc agccccaccc tgtctgctcc ttcccagttc cttcccgggc 240 cccacacgct gctccagctg cca 263 <210> 252 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ARL6 3'-UTR NM_032146 <400> 252 aaagataata gttggaaacc tcagcaattt tcaattcaag gaatctatct aagacaaata 60 gaatacattt tgtaaaagat gtttatgcat caaaaaatat aattttctgc ttgcatttat 120 ggactctgac ctttttaaga acataggact tcaggtatgc taatttggcc attaattatt 180 taaaaactaa atattccctc aaaagggctc cctagaatta tcaagttctt agtgaaggtc 240 tacatttgat tgtacgtaga atgtttaaaa gtcagttata agccatctca tcccatcata 300 atttatgata tgtttaatat attttatttt ttaattgtct ttttaaaaaa tttagtttat 360 gactttgcag tatgaattgt gcttgtgaaa aagaacttta aatatttata agggaccatg 420 ggtaattaat atatattcaa tttttactat gtgtcactgt caataaaatg taaaatataa 480 tgtgcc 486 <210> 253 <211> 719 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LPCAT3 3'-UTR NM_005768 <400> 253 tccatttccc tggtggcctg tgcgggactg gtgcagaaac tactcgtctc ccttttcaca 60 gcactccttt gccccagagc agagaatgga aaagccaggg aggtggaaga tcgatgcttc 120 cagctgtgcc tctgctgcca gccaagtctt catttggggc caaaggggaa actttttttt 180 ggagaaggcg tcttgctttg tcacccacgc tggaatgcag tggcgggatc tcagctcacc 240 gcaacctcca cctcctgggt tcaagtgatt ttcctgcctc agcctcccaa gtagctggga 300 atacaggcac gccaccatgc ccagctaatt tttgtatttt cagtagaaac gggatttcac 360 cacgttggcc aggctggtct cgaactcctg accgcaagtg atccacccgc ctccgcctcc 420 caaagtgctg ggattacagg cgtgagccac cgtgcccggc ccaaagggga aactcttgtg 480 ggaggagcag aggggctcac atctcccctc tgattccccc atgcacattg ccttatctct 540 ccccatctag ccaggaatct attgtgtttt tcttctgcca atttactatg attgtgtatg 600 tgccgctacc accacccccc ccatgggggg gtggagaggg gtgcaaggcc ctgcctgctc 660 cactttttct accttggaac tgtattagat aaaatcactt ctgtttgttc agtttttca 719 <210> 254 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ABCD3 3'-UTR NM_001122674 <400> 254 aaaccagaca aatgtattgg ccaggcgtgg tggctcatgc ctgtaatccc agcactttgg 60 gaggctgaga tgggaggatc gcttgaatcc aggagttcga gacaagcctg gacaaaaagc 120 gagacccgct tctttaaaaa ataataataa aaca 154 <210> 255 <211> 448 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens COPG2 3'-UTR NM_012133 <400> 255 atgcttactg gacaagagga aactgatgca cactacatgg tcagtgggct tttaggctag 60 tggcatcagt ttcccagaat cagacttttg aagatgaatg actttggaga agcaaattaa 120 acatttggcc ctgagccagc agatcaagca aatgtctatc tttgcgcatg ggttgttttt 180 tttttttttc tttttattct acttggtcag ctttgggacg atagtgcagc tttgggtgat 240 cttgaaaatc aaatactatc ctatactcca gctgcttaac ttcattttat tctttaatgt 300 gtacctgaaa gctcctggca atgctggaaa atttttatcc cagaggggtg ggggggaggg 360 gggaggggaa gccagagtcc acttttgtca caattcattt ttattaatag aaaataaaca 420 cttattccag tttcaaaaaa aaaaaaaa 448 <210> 256 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MIPEP 3'-UTR NM_005932 <400> 256 aagaaacact ctacacctct taaatcaagg tcatgtagat aatgactttg ttataaatgc 60 tacagctgtg agagcttgtt tctgatttca ttgttcgctt ctgtaattct gaaaaacttt 120 aaactggtag aacttggaat aaataatttg ttttaattaa aaaaaaaaaa aaaaaa 176 <210> 257 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LEPR 3'-UTR NM_002303 <400> 257 tttcactgaa gaaaccttca gatttgtgtt ataatgggta atataaagtg taatagatta 60 tagttgtggg tgggagagag aaaagaaacc agagtcaaat ttgaaaataa ttgttccaaa 120 tgaatgttgt ctgtttgttc tctcttagta acatagacaa aaaatttgag aaagccttca 180 taagcctacc aatgtagaca cgctcttcta ttttattccc aagctctagt gggaaggtcc 240 cttgtttcca gctagaaata agcccaacag acaccatctt ttgtgagatg taattgtttt 300 ttcagagggc gtgttgtttt acctcaagtt tttgttttgt accaacacac acacacacac 360 acattcttaa cacatgtcct tgtgtgtttt gagagtatat tatgtattta tattttgtgc 420 tatcagactg taggatttga agtaggactt tcctaaatgt ttaagataaa cagaattc 478 <210> 258 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LEPR 3'-UTR NM_001198688 <400> 258 gaaatgcttg tagactacgt cctacctcgc tgccgcacct gctctccctg aggtgtgcac 60 aatg 64 <210> 259 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C2orf76 3'-UTR NM_001017927 <400> 259 aaacatctcg agggcttcct ttttgcat 28 <210> 260 <211> 244 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C2orf76 3'-UTR C2orf76-001 ENST00000409466 <400> 260 aaacatctcg agggcttcct ttttgcatac ctgtattaag ctctttattc cactgctgaa 60 tttttgaaat tgacaaacaa atcttaaaaa attaatccca ggctatactc tttgagctaa 120 aatctggtta tttctttctc ttcaggtctt tccttctctc tttctttttc tttgttgttg 180 taaaataata tattatgaga aaaacatttg atctttttaa agggaaataa attgttatta 240 aaaa 244 <210> 261 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ABCA6 3'-UTR NM_080284.2 <400> 261 aacctcaaac ctagtaattt tttgttgatc tcctataaac tcatgtttta tgtaataatt 60 aatagtatgt ttaattttaa agatcattta aaattaacat caggtatatt ttgtaaattt 120 agttaacaaa tacataaatt ttaaaattat tcttcctctc aaacataggg gtgatagcaa 180 acctgtgata aaggcaatac aaaatattag taaagtcacc caaagagtca ggcactgggt 240 attgtggaaa taaaactata taaactt 267 <210> 262 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LY96 3'-UTR NM_015364.4 <400> 262 aataaattga gtatttaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 45 <210> 263 <211> 755 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CROT 3'-UTR NM_ 001243745.1 <400> 263 tgatgatgtt taaagaatga taaataaaaa gtgcatagtt tttattttta aattattgct 60 gtaaaaattt ttacagttat tattgttatt ttcataatcc aaaagaagga atgaatcact 120 taactttggg agttttcagt gggtggattc gggaacttgt taaaatgcag atttgctggg 180 ataagtgatt ctgattcaca tggctggaat gaggcccaga gattcttatt ttaacaatca 240 cttcatgtgg tttggctgca ggtaatctgt agaccatgct gaaggaaaac attttgtcca 300 ggtgactagc ttgaaaaatc agaaacacta aaatagacat gtcacatagg tggcatagaa 360 atattttcgt agtacaatgg agaaagggaa tcattaaaaa tcagagtgga gaatggttat 420 gtatattgta tatttcagtt agataaattg aggaagctag tataataatt attgaaggtc 480 tcaataattt tccacaaaat tctttaactt cttcagctca accatttctg tacttctcta 540 ctatgaatca gaggatgagg ttgtataatt caaaagcatt gccttagtct agaaataatt 600 attgtaccta tcatttagtt ttagaaataa aaagcaagct gatttttttt gatgaaccat 660 ttatatctgt gatggaataa taaaatttca cacttccgga ttcctttgtt ctcaattttg 720 agccttgagt tgttttaatt aaagaggggt aaagg 755 <210> 264 <211> 911 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ENPP5 3'-UTR ENPP5-002 ENST00000230565 <400> 264 tgttactttg aagtggattt gcatattgaa gtggagattc cataattatg tcagtgttta 60 aaggtttcaa attctgggaa accagttcca aacatttgca gaaaccatta agcagttaca 120 tatttaggta tacacacaca cacacacaca catacacaca cacggaccaa aatacttaca 180 cctgcaaagg aataaagatg tgagagtatg tctccattgt tcactgtagc atagggatag 240 ataagatcct gctttatttg gacttggcgc agataatgta tatatttagc aactttgcac 300 tatgtaaagt accttatgta ttgcacttta aatttctctc ctgatgggta ctttaatttg 360 aaatgcactt tatgcacagt tatgtcttat aacttgattg aaaatgacaa ctttttgcac 420 ccatgtcaca gaatacttgt tacgcattgt tcaaactgaa ggaaatttct aataatcccg 480 aataatgaac gtagaaatct atctccataa attgagagaa gaagaaggtg ataagtgttg 540 aaaattaaat gtgataacct ttgaaccttg aattttggag atgtattccc aacagcagaa 600 tgcaactgtg ggcatttctt gtcttatttc tttccagaga acgtggtttt catttatttt 660 tccctcaaaa gagagtcaaa tactgacaga ttcgttctaa atatattgtt tctgtcataa 720 aattattgtg atttcctgat gagtcatatt actgtgattt tcataataat gaagacacca 780 tgaatatact ttttttctat atagttcagc aatggcctga atagaagcaa ccaggcacca 840 tctcagcaat gttttctctt gtttgtaatt atttgctcct ttgaaaatta aatcactatt 900 aattacatta a 911 <210> 265 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SERPINB7 3'-UTR SERPINB7-203 ENST00000546027 <400> 265 aaatccaatt ggtttctgtt atagcagtcc ccacaacatc aaagaaccac cacaagtcaa 60 tagatttgag tttaattgga aaaatgtggt gtttcctttg agtttatttc ttcctaacat 120 tggtcagcag atgacactgg tgacttgacc cttcctagac acctggttga ttgtcctgat 180 ccctgctctt agcattctac caccatgtgt ctcacccatt tctaatttca ttgtctttct 240 tcccacgctc atttctatca ttctccccca tgacccgtct ggaaattatg gagagtgctc 300 <210> 266 <211> 509 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TCP11L2 3'-UTR NM_152772 <400> 266 agaagaactg acattggacg agagattgga aatccagtac tttggtatcc agtccacttc 60 cattgatggc attagagatc cagcacattc tcagtactgt ggtgcagtat tagcccaaat 120 ctgtgtaatg ggtaatatta gcattacaga agacacacac atcacataga ccctcagaag 180 acgtaaacat cacatagacc ctatttgtgc atcattttca agtttaaaac agatatttgt 240 aatgaacaga aaacaatttg taattaatta tattacctat ataatacttg taaatgtttt 300 cttaaccatt tatatttggc ttatgacatt taacccctaa ggagttgttt ttctcacttg 360 ttattatcaa acctaatggt ttttaatttt ggtacaactc cttaaagggt tgaaggttgt 420 gacaataact gagggaactg atgttctgaa taaatgatgt gaagtaaaca caattgtatt 480 tgaaaaaaaa aaaaaaaaaa aaaaaaaaa 509 <210> 267 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IRAK1BP1 3'-UTR NM_001010844 <400> 267 aattccaaac aaattatatt gtacttgtat ctttttacct atttttatac tttttataat 60 gtttacgttt gtcctgaata tata 84 <210> 268 <211> 338 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CDKL2 3'-UTR CDKL2-002 ENST00000307465 <400> 268 gaaccatttt ggttctgaac tggatgatgc tcttgcactt gagatgacat cttcttgcag 60 caagagtgct gatatcccaa gaggagagat tcatggtttt gatcatttcc ttctgaactg 120 cctgcatttt ctgaggaagg ccttctagaa gaaggaaaga caaagacttc caaatgtttc 180 aaaggaagat tgaacaaatg gccctcccca actgttatcc cattaccttt cacgtccacc 240 gatgctattt caagacatat ccagtggaat aacagtgata tggttcttgt tacatgaatg 300 tgtatttact gttaggagat tgtatatttt aagttacc 338 <210> 269 <211> 367 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GHR 3'-UTR GHR-202 ENST00000537449 <400> 269 cctttctttg gtttcccaag agctacgtat ttaatagcaa agaattgact ggggcaataa 60 cgtttaagcc aaaacaatgt ttaaaccttt tttgggggag tgacaggatg gggtatggat 120 tctaaaatgc cttttcccaa aatgttgaaa tatgatgtta aaaaaataag aagaatgctt 180 aatcagatag atattcctat tgtgcaatgt aaatatttta aagaattgtg tcagactgtt 240 tagtagcagt gattgtctta atattgtggg tgttaatttt tgatactaag cattgaatgg 300 ctatgttttt aatgtatagt aaatcacgct ttttgaaaaa gcgaaaaaat caggtggctt 360 ttgcggt 367 <210> 270 <211> 406 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens KIAA1107 3'-UTR NM_015237 <400> 270 gtgttaacat tttggaaaaa tttatgccac tcctttattt tttgatgcct atattatatc 60 caaatgataa ttgcattagc cggatataaa ctttctttaa tattgagtct ttccaattta 120 atgaggtaaa catagtttat ttattaatat atcacatata gaaaaatgtt tttctaaagt 180 ttttgagcat gttttctcta attattagag aaattagaag acttataagg aaaccctagc 240 ttcagttttc ctttcctagc tgatgatttg ttcacttaat cattattcaa gaatttaaaa 300 tgtgaatgca gaagtagatc agtcccttta ctttttgctc tgcatagggt aacatagtaa 360 tttaacaata aaaacttacc gtgcttgtgt ccaaaaaaaa aaaaaa 406 <210> 271 <211> 301 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens RPS6KA6 3'-UTR RPS6KA6-001 ENST00000262752 <400> 271 gatttgtggt gttcctaggc caaactggat gaagatgaaa ttaaatgtgt ggcttttttc 60 ctattcttat caaaggcatc gttgtctgct aaattacttg aatattaagt aatattaaat 120 ccccattttt aggggaagtg agatttaaaa aaccattcac aggtccacaa tattcatact 180 atgtgtttgc agtagtgttc aagtgtttat ttaagcatat aattggtgtc caccaggtcc 240 tcacaacttc tctgcacaca agcttctaaa attcctttca aataaagtta ctttaatatt 300 t 301 <210> 272 <211> 777 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CLGN 3'-UTR NM_004362, NM_001130675 <400> 272 actagattga aatattttta attcccgaga gggatgtttg gcattgtaaa aatcagcatg 60 ccagacctga actttaatca gtctgcacat cctgtttcta atatctagca acattatatt 120 ctttcagaca tttattttag tccttcattt cagaggaaaa agaagcaact ttgaagttac 180 ctcatctttg aatttagaat aaaagtggca cattacatat cggatctaag agattaatac 240 cattagaagt tacacagttt tagttgtttg gagatagttt tggtttgtac agaacaaaat 300 aatatgtagc agcttcattg ctattggaaa aatcagttat tggaatttcc acttaaatgg 360 ctatacaaca atataactgg tagttctata ataaaaatga gcatatgttc tgttgtgaag 420 agctaaatgc aataaagttt ctgtatggtt gtttgattct atcaacaatt gaaagtgttg 480 tatatgaccc acatttacct agtttgtgtc aaattatagt tacagtgagt tgtttgctta 540 aattatagat tcctttaagg acatgccttg ttcataaaat cactggatta tattgcagca 600 tattttacat ttgaatacaa ggataatggg ttttatcaaa acaaaatgat gtacagattt 660 tttttcaagt ttttatagtt gctttatgcc agagtggttt accccattca caaaatttct 720 tatgcataca ttgctattga aaataaaatt taaatatttt ttcatcctga aaaaaaa 777 <210> 273 <211> 466 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CLGN-202 3'-UTR NM_004362, NM_001130675 ENST00000325617 <400> 273 actagattga aatattttta attcccgaga gggatgtttg gcattgtaaa aatcagcatg 60 ccagacctga actttaatca gtctgcacat cctgtttcta atatctagca acattatatt 120 ctttcagaca tttattttag tccttcattt cagaggaaaa agaagcaact ttgaagttac 180 ctcatctttg aatttagaat aaaagtggca cattacatat cggatctaag agattaatac 240 cattagaagt tacacagttt tagttgtttg gagatagttt tggtttgtac agaacaaaat 300 aatatgtagc agcttcattg ctattggaaa aatcagttat tggaatttcc acttaaatgg 360 ctatacaaca atataactgg tagttctata ataaaaatga gcatatgttc tgttgtgaag 420 agctaaatgc aataaagttt ctgtatggtt gtttgattct atcaac 466 <210> 274 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TMEM45A 3'-UTR NM_018004 <400> 274 ctttgatgag cttccagttt ttctagataa accttttctt ttttacattg ttcttggttt 60 tgtttctcga tcttttgttt ggagaacagc tggctaagga tgactctaag tgtactgttt 120 gcatttccaa tttggttaaa gtatttgaat ttaaatattt tctttttagc tttgaaaata 180 ttttgggtga tactttcatt ttgcacatca tgcacatcat ggtattcagg ggctagagtg 240 atttttttcc agattatcta aagttggatg cccacactat gaaagaaata tttgttttat 300 ttgccttata gatatgctca aggttactgg gcttgctact atttgtaact ccttgaccat 360 ggaattatac ttgtttatct tgttgctgca atgagaaata aatgaatgta tgtattttgg 420 tgc 423 <210> 275 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TBC1D8B 3'-UTR TBC1D8B-007 ENST00000276175 <400> 275 atccctagga attgcctatc atagacaagt ttactaacat tcctgtagct gtcagtttga 60 ttcctgtgag tagggctcag ggatttatct tgttaccaat gtgtctgaag gccaaaatat 120 atatccagaa gcacaatgca tcattccttt gt 152 <210> 276 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ACP6 3'-UTR NM_016361 <400> 276 ctgatttata aaagcaggat gtgttgattt taaaataaag tgcctttata caatgccaaa 60 aaaaaaaaaa aaaaaaaaaa a 81 <210> 277 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens RP6-213H19.1 3'-UTR MST4-003 (RBM4B-003 ENST00000496850) <400> 277 gaaacttatt attggcttct gtttcatatg gacccagaga gccccaccaa acctacgtca 60 agattaacaa tgcttaaccc atgagctcca tgtgcctttt ggatctttgc a 111 <210> 278 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SNRPN 3'-UTR NM_022807 <400> 278 catactgttg atccatctca gtcacttttt cccctgcaat gcgtcttgtg aaattgtgta 60 gagtgtttgt gagctttttg ttccctcatt ctgcattaat aatagctaat aataaatgca 120 tagagcaatt aaactgtg 138 <210> 279 <211> 425 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GLRB 3'-UTR GLRB-005 ENST00000512619 <400> 279 gatctaatga cttcagcatt gttggaagct taccaagaga ttttgaacta tccaattatg 60 actgctatgg aaaacccatt gaagttaaca acggacttgg gaaatctcag gctaagaaca 120 acaagaagcc tccccctgcg aaacctgtta ttccaacagc agcaaagcga attgatcttt 180 atgcaagagc attgtttcct ttctgcttct tgttcttcaa tgttatatat tggtctatat 240 atttatgata aatcttttcc atttgtacaa aataaaattc catttcattg tgacctactc 300 ctttcataaa tgccaatctg tgagaacttt tgaattttca tagcaacatt gcattttgga 360 tgccatttga ttgtaataaa actgtggcac cttaattttg aatggcagca tgatcatgta 420 atatc 425 <210> 280 <211> 651 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HERC6 3'-UTR NM_017912 <400> 280 tcacctctga gagactcagg gtgggctttc tcacacttgg atccttctgt tcttccttac 60 acctaaataa tacaagagat taatgaatag tggttagaag tagttgaggg agagattggg 120 ggaatgggga gatgatgatg atggtcaaag ggtgcaaaat ctcacacaag actgaggcag 180 gagaataggg tacagagata gggatctaag gatgacttgg acacactccc tggcactgaa 240 gagtctgaac actggcctgt gattggtcca ttccaggacc ttcatttgca taaggtatca 300 aaccacatca gcctctgatt ggccatgggc cagacctgca ctctggccaa tgattggttc 360 attccaggac attcatttgc ataaggagtc aaaccacacc agtcttggat tggctgtgag 420 ccaattcacc tcagtctcta attggctgtg agtcagtctt tcatttacat agggtgtaac 480 catcaagaaa cctctacagg gtacttaagc cccagaagat tttgctacca gggctcttga 540 gccacttgct ctagcccact cccaccctgt ggaatgtact ttcacttttg ctgcttcact 600 gccttgtgct ccaataaatc cactccttca ccacccaaaa aaaaaaaaaa a 651 <210> 281 <211> 264 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CFH 3'-UTR NM_000186 <400> 281 aatcaatcat aaagtgcaca cctttattca gaactttagt attaaatcag ttctcaattt 60 cattttttat gtattgtttt actccttttt attcatacgt aaaattttgg attaatttgt 120 gaaaatgtaa ttataagctg agaccggtgg ctctcttctt aaaagcacca tattaaatcc 180 tggaaaacta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240 aaaaaaaaaa aaaaaaaaaa aaaa 264 <210> 282 <211> 401 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GALC 3'-UTR GALC-002 ENST00000393569 <400> 282 tacttaacag ggcatcatag aatactctgg attttcttcc cttctttttg gttttggttc 60 agagccaatt cttgtttcat tggaacagta tatgaggctt ttgagactaa aaataatgaa 120 gagtaaaagg ggagagaaat ttatttttaa tttaccctgt ggaagatttt attagaatta 180 attccaaggg gaaaactggt gaatctttaa cattacctgg tgtgttccct aacattcaaa 240 ctgtgcattg gccataccct taggagtggt ttgagtagta cagacctcga agccttgctg 300 ctaacactga ggtagctctc ttcatcttat ttgcaagcgg tcctgtagat ggcagtaact 360 tgatcatcac tgagatgtat ttatgcatgc tgaccgtgtg t 401 <210> 283 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GALC 3'-UTR GALC-005 ENST00000393568 <400> 283 tacttaacag ggcatcatag aatactctgg attttcttcc cttctttttg g 51 <210> 284 <211> 360 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PDE1A 3'-UTR NM_001003683.2 <400> 284 acacctttaa gtaaaacctc gtgcatggtg gcagctctaa tttgaccaaa agacttggag 60 attttgatta tgcttgctgg aaatctaccc tgtcctgtgt gagacaggaa atctattttt 120 gcagattgct caataagcat catgagccac ataaataaca gctgtaaact ccttaattca 180 ccgggctcaa ctgctaccga acagattcat ctagtggcta catcagcacc ttgtgctttc 240 agatatctgt ttcaatggca ttttgtggca tttgtcttta ccgagtgcca ataaattttc 300 tttgagcagc taattgctaa ttttgtcatt tctacaataa agcttggtcc acctgttttc 360 <210> 285 <211> 308 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PDE1A 3'-UTR PDE1A-003 ENST00000410103 <400> 285 acacctttaa gtaaaacctc gtgcatggtg gcagctctaa tttgaccaaa agacttggag 60 attttgatta tgcttgctgg aaatctaccc tgtcctgtgt gagacaggaa atctattttt 120 gcagattgct caataagcat catgagccac ataaataaca gctgtaaact ccttaattca 180 ccgggctcaa ctgctaccga acagattcat ctagtggcta catcagcacc ttgtgctttc 240 agatatctgt ttcaatggca ttttgtggca tttgtcttta ccgagtgcca ataaattttc 300 tttgagca 308 <210> 286 <211> 855 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GSTM5 3'-UTR NM_000851 <400> 286 ggcccagtga tgccagaaga tgggagggag gagccaacct tgctgcctgc gaccctggag 60 gacagcctga ctccctggac ctgccttctt cctttttcct tctttctact ctcttctctt 120 ccccaaggcc tcattggctt cctttcttct aacatcatcc ctccccgcat cgaggctctt 180 taaagcttca gctccccact gtcctccatc aaagtccccc tcctaacgtc ttcctttccc 240 tgcactaacg ccaacctgac tgcttttcct gtcagtgctt ttctcttctt tgagaagcca 300 gactgatctc tgagctccct agcactgtcc tcaaagacca tctgtatgcc ctgctccctt 360 tgctgggtcc ctaccccagc tccgtgtgat gcccagtaaa gcctgaacca tgcctgccat 420 gtcttgtctt attccctgag gctcccttga ctcaggactg tgctcgaatt gtgggtggtt 480 ttttgtcttc tgttgtccac agccagagct tagtggatgg gtgtgtgtgt gtgtgtgttg 540 ggggtggtga tcaggcaggt tcataaattt ccttggtcat ttctgccctc tagccacatc 600 cctctgttcc tcactgtggg gattactaca gaaaggtgct ctgtgccaag ttcctcactc 660 attcgcgctc ctgtaggccg tctagaactg gcatggttca aagaggggct aggctgatgg 720 ggaagggggc tgagcagctc ccaggcagac tgccttcttt caccctgtcc tgatagactt 780 ccctgatcta gatatccttc gtcatgacac ttctcaataa aacgtatccc accgtattgt 840 aaaaaaaaaa aaaaa 855 <210> 287 <211> 419 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CADPS2 3'-UTR CADPS2-002 ENST00000412584 <400> 287 tatcacacag ctttgcagaa ggaaggaaga ccttgatcga cattgttttt tattttttta 60 accttgtcct tgtaattaca ttcattgttt gttttggcca aataaaaatg cttgtatttc 120 tttaaaaagt aagcctgaat gtagagtaaa aggggaaatg ccaagatttt ggggtttttt 180 tgtttccttt ttttgtttgt ttgtttgttt gtttttttgg agaagagcat cctcttttgt 240 gtagtttgac ctaaaaatga accttggctc tgcttgtgat cagaacatga actttttttt 300 ttaaagaaga tttgagcatt tttctgtaat cacatcaaaa tgatgttttc tgtgtaaagc 360 gagatacata tttctcataa tgcagcattg tgagaagtca gttcggacca ctgcaccaa 419 <210> 288 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CADPS2 3'-UTR CADPS2-001 ENST00000449022 <400> 288 tatcacacag ctttgcagaa ggaaggaaga ccttgatcga cattgttttt tattttttta 60 accttgtcct tgtaattaca ttcattgttt gttttggcca aataaaaatg cttgtatttc 120 tttaaaaagt aagcctgaat gtagagtaaa aggggaaatg cc 162 <210> 289 <211> 247 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens AASS 3'-UTR AASS-001 ENST00000417368 <400> 289 ttgggaatta tattttgttt ttttcttccc aggcaataca cctctgaaca tgtgtgtgat 60 aaatgggttt gctaatgtgc tgttttaaag tataaagcat aatatgtttt ggttaacaca 120 atgtactttt tgaactataa atctttattt taatatggaa atgtttggaa caggagatgc 180 aagccactaa cagagaactt taataattct accctgtatt ttataaatac gtatgtgaaa 240 gtgatga 247 <210> 290 <211> 695 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TRIM6-TRIM34 3'-UTR NM_001003819 <400> 290 attttctcat ttcttcacct acaacccttt gtcttgactt atctcctgca actgactcat 60 ctgcaacatt cacaccattg cttccttgtg gtttcccttc tttagaactt ttactcatcc 120 ttgagatgta tggtgtattt ggcttgagtt atgagagatg cttatttatt catttactct 180 ttttcatatt ttcagagaaa gttacctaat ccctcctaaa gacacagcag tatgggtata 240 acatccttgc cttcccattt atccatgttt cactttatca ctgatatgaa gaggcccaaa 300 gcctgttagc caccatccat gctacctagg tagtccatag gaaccacccc catgaccacc 360 accaacatca actaaaggtt cttggagggt atgtcagtgt gttgctcagg ataccccagg 420 tacatcaagg aatcaaggag aggaaaatat gagcaatatg tgtattcaga gtgaagattt 480 tatgtccaga gtatttgagc tcaaaccttg cctgttgttt tctaatcatg atgaatactt 540 tctcagtttc tttttcctga aatataaatt gggatttaag actgtaccta actattaaga 600 tcactgtgta aaactaagtg tctctaaatg taatgcatcg atttagtgtc tggaacataa 660 taaatatttg ctctcatgat tgctaaaaaa aaaaa 695 <210> 291 <211> 918 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SEPP1 3'-UTR NM_005410 <400> 291 atatttaaaa taggacatac tccccaattt agtctagaca caatttcatt tccagcattt 60 ttataaacta ccaaattagt gaaccaaaaa tagaaattag atttgtgcaa acatggagaa 120 atctactgaa ttggcttcca gattttaaat tttatgtcat agaaatattg actcaaacca 180 tattttttat gatggagcaa ctgaaaggtg attgcagctt ttggttaata tgtctttttt 240 tttctttttc cagtgttcta tttgctttaa tgagaataga aacgtaaact atgacctagg 300 ggtttctgtt ggataattag cagtttagaa tggaggaaga acaacaaaga catgctttcc 360 atttttttct ttacttatct ctcaaaacaa tattactttg tcttttcaat cttctacttt 420 taactaataa aataagtgga ttttgtattt taagatccag aaatacttaa cacgtgaata 480 ttttgctaaa aaagcatata taactatttt aaatatccat ttatcttttg tatatctaag 540 actcatcctg atttttacta tcacacatga ataaagcctt tgtatctttc tttctctaat 600 gttgtatcat actcttctaa aacttgagtg gctgtcttaa aagatataag gggaaagata 660 atattgtctg tctctatatt gcttagtaag tatttccata gtcaatgatg gtttaatagg 720 taaaccaaac cctataaacc tgacctcctt tatggttaat actattaagc aagaatgcag 780 tacagaattg gatacagtac ggatttgtcc aaataaattc aataaaaacc ttaaagctga 840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900 aaaaaaaaaa aaaaaaaa 918 <210> 292 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SEPP1 3'-UTR SEPP1-004 ENST00000506577 <400> 292 atatttaaaa taggacatac tccccaattt agtctagaca caatttcatt tccagcattt 60 ttataaacta ccaaattagt gaaccaaaaa tagaaattag atttgtgcaa acatggagaa 120 atctactgaa ttggcttcca gattttaaat tttatgtcat agaaatattg actcaaacca 180 tattttttat gatggagcaa ctgaaaggtg attgcagctt ttggttaata tgtctttttt 240 tttctttttc cagtgttcta tttgctttaa tgagaataga aacgtaaact atgacctagg 300 ggtttctgtt ggataattag cagtttagaa tggaggaaga acaacaaaga catgctttcc 360 atttttttct ttacttatct ctcaaaacaa tattactttg tcttttcaat cttctacttt 420 taactaataa aataagtgga ttttgtattt taagatccag aaatacttaa cacgtgaata 480 ttttgctaaa aaagcatata taactatttt aaatatccat ttatcttttg tatatctaag 540 actcatcctg atttttacta tcacacatga ataaagcctt tgtatcttt 589 <210> 293 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PDE5A 3'-UTR PDE5A-002 ENST00000264805 <400> 293 gtggcctatt tcatgcagag ttgaagttta cagagatggt gtgttctgca atatgcctag 60 <210> 294 <211> 422 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SATB1 3'-UTR SATB1-004 ENST00000417717 <400> 294 gataaaagta tttgtttcgt tcaacagtgc cactggtatt tactaacaaa atgaaaagtc 60 caccttgtct tctctcagaa aacctttgtt gttcattgtt tggccaatga atcttcaaaa 120 acttgcacaa acagaaaagt tggaaaagga taatacagac tgcactaaat gttttcctct 180 gttttacaaa ctgcttggca gccccaggtg aagcatcaag gattgtttgg tattaaaatt 240 tgtgttcacg ggatgcacca aagtgtgtac cccgtaagca tgaaaccagt gttttttgtt 300 ttttttttag ttcttattcc ggagcctcaa acaagcatta taccttctgt gattatgatt 360 tcctctccta taattatttc tgtagcactc cacactgatc tttggaaact tgccccttat 420 tt 422 <210> 295 <211> 981 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CCPG1 3'-UTR CCPG1-002 ENST00000442196 <400> 295 ttcacaattg agttaaatta gacaactgta agagaaaaat ttatgctttg tataatgttt 60 ggtattgaaa ctaatgaaat taccaagatg acaatgtctt ttcttttgtt tctaagtatc 120 agtttgataa ctttatatta ttcctcagaa gcattagtta aaagtctact aacctgcatt 180 ttcctgtagt ttagcttcgt tgaatttttt ttgacactgg aaatgttcaa ctgtagtttt 240 attaaggaag ccaggcatgc aacagatttt gtgcatgaaa tgagacttcc tttcagtgta 300 agagcttaaa gcaagctcag tcatacatga caaagtgtaa ttaacactga tgtttgtgtt 360 aaatttgcag cagagcttga gaaaagtaca ttgttctgga atttcatcat taacatttta 420 taatcttaca ctcacttctt gtctttttgt gggttcaaga gccctctgac ttgtgaagaa 480 tttgctgccc tcttaagagc ttgctgactt gttttcttgt gaaatttttt gcacatctga 540 atatcgtgga agaaacaata aaactacacc atgaggaaaa ctaaaggtct ttatttaaaa 600 tctggcattg tattaacatg taattttata ctatgtggta ttttatacat ttcctcagta 660 gtgatatttg gtaaagcagt tcatacagct tttttctaag ttccatgaat cttacccagt 720 gtttaccgaa gtatttaagc agcatctgaa tatttccacc cagcaatgtt aatttatcta 780 ggaaagttca gaatttcatc ttcatgttga atttcccttt taacttccgt tcatagacat 840 atatgtgact tccaattcga ccctctggca agtgagtgtg gaagaaaaca gcagttcttt 900 tataattgct tgaaattagg aaagcgctta tttcctagaa gcaaataaat gtttaagtaa 960 ataaaggcta cattttgctg a 981 <210> 296 <211> 575 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CCPG1 3'-UTR CCPG1-004 ENST00000425574 <400> 296 ttcacaattg agttaaatta gacaactgta agagaaaaat ttatgctttg tataatgttt 60 ggtattgaaa ctaatgaaat taccaagatg acaatgtctt ttcttttgtt tctaagtatc 120 agtttgataa ctttatatta ttcctcagaa gcattagtta aaagtctact aacctgcatt 180 ttcctgtagt ttagcttcgt tgaatttttt ttgacactgg aaatgttcaa ctgtagtttt 240 attaaggaag ccaggcatgc aacagatttt gtgcatgaaa tgagacttcc tttcagtgta 300 agagcttaaa gcaagctcag tcatacatga caaagtgtaa ttaacactga tgtttgtgtt 360 aaatttgcag cagagcttga gaaaagtaca ttgttctgga atttcatcat taacatttta 420 taatcttaca ctcacttctt gtctttttgt gggttcaaga gccctctgac ttgtgaagaa 480 tttgctgccc tcttaagagc ttgctgactt gttttcttgt gaaatttttt gcacatctga 540 atatcgtgga agaaacaata aaactacacc atgag 575 <210> 297 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1 3'-UTR CNTN1-002 ENST00000348761 <400> 297 atgtgttgtg acagctgctg ttcccatccc agctcagaag acacccttca accctgggat 60 gaccacaatt ccttccaatt tctgcggctc catcctaagc caaataaatt atactttaac 120 aaactattca actgatttac aacacacatg atgactgagg cattcgggaa ccccttcatc 180 caaaagaata aacttttaaa tggatataaa tgatttttaa ctcgttccaa 230 <210> 298 <211> 922 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1 3'-UTR CNTN1-004 ENST00000547849 <400> 298 tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60 tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120 atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180 ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240 tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300 aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360 ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420 tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480 tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540 caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600 gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660 ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720 tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780 ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840 ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900 ataattttga ttttcttaga ca 922 <210> 299 <211> 928 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CNTN1 3'-UTR CNTN1-004 ENST00000547849 +T at pos. 30bp, mutations G727bpT, A840bpG <400> 299 ttttttcgtt gacactcacc atttctgtga aagacttttt ttttttttaa catattatac 60 tagatttgac taactcaatc ttgtagcttc tgcagttctc cccaccccca acctagttct 120 tagagtatgt ttcccctttt gaaacatgta aacatacttt gggcataaat attttttaaa 180 atataactat aatgcttcac taatacctta aaaatgccta gtgaactaac tcagtacatt 240 atataatggc caagtgaaag ttttgtgttt tcatgtcctg tttttctttg aaattatata 300 gcccagaaat tagctcatta tctgaaaaac gtatgaagaa ctgatgaatt gtataataca 360 ggagtattgc cattgaatgt actgtttgat ttattcaagc aggtaatgaa caatgttgtc 420 aaactctcta atgagacatc ataattagga cataagctaa aaggggcatt actccggcag 480 tctttttttc ttaatcctag taccatacat attctttggc atgaaagaat gaaaagcatt 540 agtaaacaac tgaagtccta ccatggctct gtagggtttt tggaacaatt cctggaattg 600 gaaagtgaaa atggatagca tgtgggggaa accctcatct gagtagcaag attttagtaa 660 agatgactaa gccattaaca gcatgcattc atatttaatt ttattgactc ctgccatcag 720 cttttgtaga tcttttgggt ggaaggttgt gatttttact gggaggactt gagtagaagt 780 ggatgattaa aattgaggag tatataattc tttctgggac tgcttaaatg ttattgtttg 840 aaaatgcctt cactttcccc ctttggtcaa agagatgtgc ttaaaattct tattccttca 900 caataaataa ttttgatttt cttagaca 928 <210> 300 <211> 734 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LMBRD2 3'-UTR <400> 300 agtctgaaaa agtttgtggg accactaacc aaggtcaaca catcagttca gtcttgatga 60 acatctgtgt accctagaat ttcctctata cacagtgaaa agtgtcaaga taacaaaaaa 120 ggcactgaga attaattata tcttaggaat aatagtttaa tgtgcattga atagagtatc 180 acctttttca acaagattta ttacatatca tttcctaagc atctgcctta gaaatacagt 240 tacagtggaa ggactttaag aaagatcaac atatgttaag aacatgcagt tcagtttgtt 300 tcagattaat tttttttcaa gagagttatt ttaaagattc aaggaagcca taagtcatac 360 taaataatat tatatacagt tttgttattg tgacttacat ttttgttact tctaaaaagt 420 atattcaacc tgtatttccc aaagaaatgt aagtgaatgg agacctcaaa taataactgt 480 attcataaaa ctcgtgtctt aaaacaaggc ttacttacta gacataactg aatgtaaaaa 540 gtgctttttc aaatctgttt gcaaactcgt gggggatttt tgcatgtata agattaagat 600 tatacttcaa gtgatgcgtg tctgtgtatt tagcatgtgt actataatca ggtgatatag 660 tattccttca gtctttgtag taactggatt tttttatgct tctggtattg ctttataaaa 720 gattttcatt tcag 734 <210> 301 <211> 241 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TLR3 3'-UTR NM_003265 <400> 301 atttatttaa atattcaatt agcaaaggag aaactttctc aatttaaaaa gttctatggc 60 aaatttaagt tttccataaa ggtgttataa tttgtttatt catatttgta aatgattata 120 ttctatcaca attacatctc ttctaggaaa atgtgtctcc ttatttcagg cctatttttg 180 acaattgact taattttacc caaaataaaa catataagca cgtaaaaaaa aaaaaaaaaa 240 a 241 <210> 302 <211> 527 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BCAT1 3'-UTR BCAT1-002 ENST00000342945 <400> 302 atggaaaata gaggatacaa tggaaaatag aggataccaa ctgtatgcta ctgggacaga 60 ctgttgcatt tgaattgtga tagatttctt tggctacctg tgcataatgt agtttgtagt 120 atcaatgtgt tacaagagtg attgtttctt catgccagag aaaatgaatt gcaatcatca 180 aatggtgttt cataacttgg tagtagtaac ttaccttacc ttacctagaa aaacattaat 240 gtaagccata taacatggga ttttcctcaa tgattttagt gcctcctttt gtacttcact 300 cagatactaa atagtagttt attctttaat ataagttaca ttctgctcct caaacaaatg 360 caattttttg tgtgtgtttg aaagctaatt tgagaaaatt tcataggtta catttcctgc 420 agcctatctt tatccacaga aagtgttttc ttttttttaa atcaagactt ttaaaactgg 480 atttcctccc atcactgttt tttgaaggtc ctccaagtcc gtgttaa 527 <210> 303 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BCAT1 3'-UTR <400> 303 atggaaaata gaggatacaa tggaaaatag aggataccaa ctgtatgcta ctgggacaga 60 ctgttgcatt tgaattgtga tagatttctt tggctacctg tgcataatgt agtttgtagt 120 atcaatgtgt tacaagagtg attgtttctt catgccagag aaaatgaatt gcaatcatca 180 aatggtgttt cataacttg 199 <210> 304 <211> 716 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TOM1L1 3'-UTR TOM1L1-001 ENST00000575882 <400> 304 gaagaaagtg gatgatcagc tcactaccac atcaaaggtg ccaactctct aaaacgtaga 60 ctctgtgcag ctttgaagcc tggaagacaa tacctaccaa catgtcaaag ccatggtggc 120 acatttctgc tataatgaag attaaataga ataacagttc caggataaca ctgattcctg 180 acaacagcgt gagatttcaa cagaacttgt ttggaacaaa tactcactta aaacttcagc 240 agaagaaaaa ttacttagtc cttaggccaa ccaatttaac tgcagtgtca tgtttcacag 300 gccttcctac atttagaaat cgtcacacag ctgtgataag agtagattat tttactatga 360 aataattctg aatagatgaa agcataaaat gtgagaaact gaatgtatta ttcaggaaga 420 atactgagtg ccttcattta actaaagttg aatgtaaaag tcaatttgca cttctttata 480 atcctctggt ttagaattat aaattgttaa aaccttgata attgtcattt aattatattt 540 caggtgtcct gaacaggtca ctagactcta cattgggcag cctttaaata tgattctttg 600 taatgctaaa tagccttttt ttctcttttt actgcaactt aatatttcta tttagaacac 660 agaaaatgaa aatatttaga ataagttgta catttgatga caaataaatc actatt 716 <210> 305 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SLC35A1 3'-UTR SLC35A1-201 ENST00000369556 <400> 305 ttttagcctc acgtgagact ccttttaaga ctaaaccatt tgcattaaac tagagcctta 60 agtcaatctc agaaggtagc ataaacaaat aaaaattaac tgtatggcat gatcagtgcg 120 gttatgtgga aacaacaaca aacaaacgaa gctatctgag tgaactgcta atacagaaac 180 ttaatgtaga cctgtttggg gtctactatt gttttagaat gaaggaattg tattattgtg 240 tgtatatata atttgtaaat aaaaagtatg gagatgatac ggtgttaaaa aaaatcatgg 300 taaggctaca atactcaagt aacaaggttt gggacaatgt ctaagggtta aagtgccaaa 360 gccatttctg tactaactgt tctcttgttc cggtaccggg gagaaggatg acccctcctt 420 attctccaat tcatgtacag tattttgtcc tagcagcata aagacctagc tcttttctta 480 caagaggcag aaacaagaca ggctagttca taaacaaact gtgtaacttc tcaaaatgaa 540 tctatttcat aactcggaca atttctgggt ggtgactgag taccccttta gtgagtaccc 600 ctttagtgct atatttgtgc cattcattat ctggttcata tttcttttct gttagatgat 660 acacatttct tcaaaaaaat ttctaatgtc acttttgtac ttttttaaat aaagtatgtt 720 taactgttgg gctctcaata atttgtgaaa tttcagtgtt ttctataatg ttaatgggga 780 aattcagcaa taaactttat ttgt 804 <210> 306 <211> 332 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GLYATL2 3'-UTR GLYATL2-003 ENST00000532258 <400> 306 ttgattccac tgtccatttc aaatctttct tatcagtaaa aaaacattaa ttcaaacaca 60 agcattgtga tctacattag cacaaaatgc aactgattat ctaggatctg tgtattactt 120 aagctcaccc ttaacagttt taccttcctt ctcctctgta ttcttacaga aaattagaag 180 ctcaatttta tggtctcata atttccttta tgacagacat ctcagaatta aaatcaccca 240 aagccaatca ttagtgccaa gataaccctt taacggcaac actttcttaa atgaagacta 300 tttctttcat gaaaaaattc acttttatga ct 332 <210> 307 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens STAT4 3'-UTR STAT4-002 ENST00000392320 <400> 307 caggataaac tctgacgcac caagaaagga agcaaatgaa aaagtttaaa gactgttctt 60 tgcccaataa ccacatttta tttcttcagc tttgtaaata ccaggttcta ggaaatgttt 120 gacatctgaa gctctcttca cactcccgtg gcactcctca attgggagtg ttgtgactga 180 aatgcttgaa accaaagctt cagataaact tgcaagataa gacaacttta agaaaccagt 240 gttaataaca atattaacag 260 <210> 308 <211> 270 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GULP1 3'-UTR GULP1-002 ENST00000409609 <400> 308 catcaagaac aagaaatcct gattcatgtt aaatgtgttt gtatacacat gtcatttatt 60 attattactt taagataggt attattcatg tgtcaatgtt tttgaatatt ttaatatttt 120 gaaaattttc tcagttaaat ttcctcacct tcactattga tctgtaattt ttattttaaa 180 aacagcttac tgtaaagtag atcatacttt tatgttcctt tctgtttcta ctgtagatga 240 atttgtaatt gaaagacata ttatacaaat 270 <210> 309 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GULP1 3'-UTR GULP1-010 ENST00000409805 <400> 309 catcaagaac aagaaatcct gattcatgtt aaatgtgttt gtatacacat gtcatttatt 60 attattactt taagatagg 79 <210> 310 <211> 256 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens EHHADH 3'-UTR EHHADH-002 ENST00000456310 <400> 310 ttcagtcttc cagattatgc ctcacatgct agcatcaggt aatgctgact gaatttcagt 60 gaaattaaat caaaaatcca aagtaagatt gttctgaaat acaaagcaaa ataaataatc 120 attagaatct tctgtgtaac gactctaatg gtcaaatctt taggaatgtg cttcctatgc 180 ctctgaatct gtccttatca gataaattca atgcatgaac ttgtgtgaat ataataccat 240 aatagctaat gaaaga 256 <210> 311 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NBEAL1 3'-UTR NM_001114132.1 <400> 311 ttgttatttc cattttctgt tatgattact gaaacctgat ttattgcttt gtcactttaa 60 ccacatctct caactctctg caatgttgca aggcttttat ccctgaaaat catttacaga 120 taaccacaat ttgctgtggt atataaacta attcttggtc tatactaaga tgtatttgag 180 aaaatacatt tgatttgatt ttgtggccca ttcctaaagg tcattgtatc catttttaaa 240 acaaactaaa atgagaacat taggttcaat tttcttatta ttccaaatga taaaatttaa 300 gatttttcta ataaaagagt acagataatg ggacagttga gagagatggc tttaaataca 360 ttcttaagta atcattttcc tatttactga ccactgtaat gaaaatatat caatttattt 420 atggaactcc tgattgggga taatatttta aaggtatctg ttgcacactt ggattttcaa 480 aactcggtga aagttacaag tttgcatggt aagaataaaa taagaatatt gaaactggta 540 cattagctaa ttctattact acttagcgtg tttctaatga gaagttactg aaatctatta 600 ctgtccttaa taaaaattga gtagaaaaaa gtggaactag 640 <210> 312 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens KIAA1598 3'-UTR NM_001258299.1 <400> 312 tctgaatcag aaaatactgc aactccttcc tccttttgtc tgccttttgt tctccaaaag 60 taagtggaaa ttacatttcc aagaaaggaa atgaaataat tgcaggccca aggtctgcaa 120 aatatgtgtt gaattgacag tgaaaaggat ccatgtgttg acagacacag ttgttagatg 180 ccataaaggc agatgtgaag ctcaatttat ttctcatctt gcttg 225 <210> 313 <211> 991 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HFE 3'-UTR HFE-006 ENST00000317896 <400> 313 cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60 catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120 gaactccttg attttagcct tctctgttca tttcctcaaa aagatttccc catttaggtt 180 tctgagttcc tgcatgccgg tgatccctag ctgtgacctc tcccctggaa ctgtctctca 240 tgaacctcaa gctgcatcta gaggcttcct tcatttcctc cgtcacctca gagacataca 300 cctatgtcat ttcatttcct atttttggaa gaggactcct taaatttggg ggacttacat 360 gattcatttt aacatctgag aaaagctttg aaccctggga cgtggctagt cataacctta 420 ccagattttt acacatgtat ctatgcattt tctggacccg ttcaactttt cctttgaatc 480 ctctctctgt gttacccagt aactcatctg tcaccaagcc ttggggattc ttccatctga 540 ttgtgatgtg agttgcacag ctatgaaggc tgtacactgc acgaatggaa gaggcacctg 600 tcccagaaaa agcatcatgg ctatctgtgg gtagtatgat gggtgttttt agcaggtagg 660 aggcaaatat cttgaaaggg gttgtgaaga ggtgtttttt ctaattggca tgaaggtgtc 720 atacagattt gcaaagttta atggtgcctt catttgggat gctactctag tattccagac 780 ctgaagaatc acaataattt tctacctggt ctctccttgt tctgataatg aaaattatga 840 taaggatgat aaaagcactt acttcgtgtc cgactcttct gagcacctac ttacatgcat 900 tactgcatgc acttcttaca ataattctat gagataggta ctattatccc catttctttt 960 ttaaatgaag aaagtgaagt aggccgggca c 991 <210> 314 <211> 761 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HFE 3'-UTR HFE-004 ENST00000349999 <400> 314 cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60 catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120 gaactccttg attttagcct tctctgttca tttcctcaaa aagatttccc catttaggtt 180 tctgagttcc tgcatgccgg tgatccctag ctgtgacctc tcccctggaa ctgtctctca 240 tgaacctcaa gctgcatcta gaggcttcct tcatttcctc cgtcacctca gagacataca 300 cctatgtcat ttcatttcct atttttggaa gaggactcct taaatttggg ggacttacat 360 gattcatttt aacatctgag aaaagctttg aaccctggga cgtggctagt cataacctta 420 ccagattttt acacatgtat ctatgcattt tctggacccg ttcaactttt cctttgaatc 480 ctctctctgt gttacccagt aactcatctg tcaccaagcc ttggggattc ttccatctga 540 ttgtgatgtg agttgcacag ctatgaaggc tgtacactgc acgaatggaa gaggcacctg 600 tcccagaaaa agcatcatgg ctatctgtgg gtagtatgat gggtgttttt agcaggtagg 660 aggcaaatat cttgaaaggg gttgtgaaga ggtgtttttt ctaattggca tgaaggtgtc 720 atacagattt gcaaagttta atggtgcctt catttgggat g 761 <210> 315 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HFE 3'-UTR HFE-005 ENST00000397022 <400> 315 cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60 catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120 gaactccttg attttagcct tc 142 <210> 316 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HFE 3'-UTR HFE-012 ENST00000336625 <400> 316 cacgcagcct gcagactcac tgtgggaagg a 31 <210> 317 <211> 394 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens KIAA1324L 3'-UTR KIAA1324L-005 ENST00000416314 <400> 317 agagacagtg ctgtagcctt gagactaatg aacaaagaaa cctgctctag ttttacagga 60 ccatatttta gggtctgtcc tcatacctgt cacattggtg atctcacaga ggagggccat 120 gccgctgaaa agggaaggag attgaaacat ttgattgcct tatcacatgg tcaagtacct 180 tgccaaataa aggaaagcaa atgatttggg tctcaactga agatgaagct caactcagga 240 agagatttat ctgtatatac acataactga aaaccaagtt taagcccacc aatgcactgc 300 tgatgcatgc catataatta atgggtaact tttattcttt atgatgtcta cataacaagt 360 gtgatttgga aggcacatgt gagcatatgc atta 394 <210> 318 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MANSC1 NM_018050 3'-UTR <400> 318 ggatggaact cggtgtctct taattcattt agtaaccaga agcccaaatg caatgagttt 60 ctgctgactt gctagtctta gcaggaggtt gtattttgaa gacaggaaaa tgcccccttc 120 tgctttcctt tttttttttt ggagacagag tcttgctttg ttgcccaggc tggagtgcag 180 tagcacgatc tcggctctca ccgcaacctc cgtctcctgg gttcaagcga ttctcctgcc 240 tcagcctcct aagtatctgg gattacaggc atgtgccacc acacctgggt gatttttgta 300 tttttagtag agacggggtt tcaccatgtt ggtcaggctg gtctcaaact cctgacctag 360 tgatccaccc tcctcggcct cccaaagtgc tgggattaca ggcatgagcc accacagctg 420 gcccccttct gttttatgtt tggtttttga gaaggaatga agtgggaacc aaattaggta 480 attttgggta atctgtctct aaaatattag ctaaaaacaa agctctatgt aaagtaataa 540 agtataattg ccatataaat ttcaaaattc aactggcttt tatgcaaaga aacaggttag 600 gacatctagg ttccaattca ttcacattct tggttccaga taaaatcaac tgtttatatc 660 aatttctaat ggatttgctt ttctttttat atggattcct ttaaaactta ttccagatgt 720 agttccttcc aattaaatat ttg 743 <210> 319 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LTA4H 5'-UTR LTA4H-001 ENST00000228740 <400> 319 aagaaacttc ctttcccggc gtgcaccgcg aatccctcct cctcttcttt acctctctcc 60 ctcctcctca ggttctctat cgacgagtct ggtagctgag cgttgggctg taggtcgctg 120 tgctgtgtga tcccccagag cc 142 <210> 320 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens DECR1 5'-UTR DECR1-001 ENST00000220764 <400> 320 tccagccccg agaactttgt tctttttgtc ccgccccctg cgcccaaccg cctgcgccgc 60 cttccggccc gagttctgga gactcaac 88 <210> 321 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PIGK 5'-UTR <400> 321 actgcctccg ccccttcagg tgcgggaagt ctgaagccgg taaac 45 <210> 322 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BRP44L 5'-UTR BRP44L-001 <400> 322 gtcgtgaggc gggccttcgg gctggctcgc cgtcggctgc cggggggttg gccggggtgt 60 cattggctct gggaagcggc agcagaggca gggaccactc ggggtctggt gtcggcacag 120 cc 122 <210> 323 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ACADSB 5'-UTR ACADSB-004 NM_001609.3 ENST00000368869 <400> 323 agggattaag ggggggtgtg tgcggggcgg gtactgagtg ggcggggcct tgctcgggta 60 actcccaggg gctggctaga gacccagagg cgcagagcgg agaggcctgc ggcgagg 117 <210> 324 <211> 166 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens SUPT3H 5'-UTR SUPT3H-006 ENST00000371459 <400> 324 cacagccgag tcaccttttc cctttctaca ctccacactc tcagtccccc accccgcccc 60 tttccaagcg tgtcccgggc cgcagcagca gaaaccgcac catctccacc cccacattct 120 cctcgcggga agcgcagcag tgcctccaag ggttcttaaa gcagag 166 <210> 325 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TMEM14A 5'-UTR NM_014051.3 <400> 325 gtttccagga gggagcggcc tttgctcagc gcgagacggc tgggcgccga gtgggacagc 60 gctggtgcgg agactgcttc cggactccag gtaccgcgct tggcggcagc tggccccaga 120 cttctgtctt ttcagctgca gtgaaggctc ggggctgcag aattgcaacc ttgcca 176 <210> 326 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C9orf46 5'-UTR AF225420.1 <400> 326 gagcgaggcc cggtccctgc agcgggcgaa aggagcccgg gcctggaggt ttgcgtaccg 60 gtcgcctggt cccggcacca gcgccgccca gtgtggtttc ccataaggaa gctcttcttc 120 ctgcttggct tccaccttta acccttccac ctgggagcgt cctctaacac attcagacta 180 caagtccaga cccaggagag caaggcccag aaagaggtca aa 222 <210> 327 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ANXA4 5'-UTR NM_001153.3 <400> 327 gccccaggtg cgcttcccct agagagggat tttccggtct cgtgggcaga ggaacaacca 60 ggaacttggg ctcagtctcc accccacagt ggggcggatc cgtcccggat aagacccgct 120 gtctggccct gagtagggtg tgacctccgc agccgcagag gaggagcgca gcccggcctc 180 gaagaacttc tgcttgggtg gctgaactct gatcttgacc tagagtc 227 <210> 328 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens IFI6 5'-UTR NM_022873.2 <400> 328 ccagccttca gccggagaac cgtttactcg ctgctgtgcc catctatcag caggctccgg 60 gctgaagatt gcttctcttc tctcctccaa ggtctagtga cggagcccgc gcgcggcgcc 120 acc 123 <210> 329 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C2orf34 5'-UTR CAMKMT -008 ENST00000402247 <400> 329 tcctggcagg ggacgagctg cggcggtggc acctccgggt gtggaaggct ccagtgag 58 <210> 330 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens C2orf34 5'-UTR NM_024766.3 <400> 330 gagggtgccg ggcgtcacag gtcctgacag ggaagaagtt ggcaggtcct ggcaggggac 60 gagctgcggc ggtggcacct ccgggtgtgg aaggctccag tgag 104 <210> 331 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ALDH6A1 5'-UTR ALDH6A1-002 ENST00000350259 <400> 331 agtgcttctg ggcagtagag gcgcggggtg cggagctagg gcggccgaga gcc 53 <210> 332 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CCDC53 5'-UTR CCDC53-002 ENST00000545679 <400> 332 ggaagggccc cggaggcggg cacttggggg gaaagttgag acgtgattac cgggttgggc 60 gggccccatc tgggaggggt ttgtgggtga actcggggtc caccgcccgc tgaggag 117 <210> 333 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CASP1 5'-UTR NM_001257119.1 <400> 333 atactttcag tttcagtcac acaagaaggg aggagagaaa agcc 44 <210> 334 <211> 124 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NDUFB6 5'-UTR NM_182739.2 <400> 334 gtaataaccg cgcgcggcgc tcggcgttcc cgcaaggtcg ctttgcagag cgggagcgcg 60 cttaagtaac tagtccgtag ttcgagggtg cgccgtgtcc ttttgcgttg gtaccagcgg 120 cgac 124 <210> 335 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BCKDHB 5'-UTR BCKDHB-002 ENST00000369760 <400> 335 aggcggcgtg cggctgcata gcctgagaat cccggtggtg agcgggg 47 <210> 336 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BCKDHB 5'-UTR NM_001164783.1 <400> 336 ctacgtgagt gccggaccgc tgagtggttg ttagccaag 39 <210> 337 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens BBS2 5'-UTR NM_031885.3 <400> 337 cacagaaggc gccgaggctc caccgcgcag ccgcaaaaag agcggacggg tctgcgccgc 60 cgcaggagga gcaggcggta cctggacggg ttcgtcccgg gctgtttcgc gtccggcctg 120 aggcggctgg ggccgcgcag gtagtgtccc tgcacttctt gcccgggcgc gtgaggccag 180 ctccgctgcg cttgtctcca gcttccagcc ctcctcccct aagccgccgc catc 234 <210> 338 <211> 153 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens HERC5 5'-UTR HERC5-001 ENST00000264350 <400> 338 tcagtagctg aggctgcggt tccccgacgc cacgcagctg cgcgcagctg gttcccgctc 60 tgcagcgcaa cgcctgaggc agtgggcgcg ctcagtcccg ggaccaggcg ttctctcctc 120 tcgcctctgg gcctgggacc ccgcaaagcg gcg 153 <210> 339 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens FAM175A 5'-UTR NM_139076.2 <400> 339 accacagggt cttgcctccg cgcgccccgc cctcgtcctc ttgtgtagcc tgaggcggcg 60 gtagc 65 <210> 340 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NT5DC1 5'-UTR NT5DC1-002 ENST00000319550 <400> 340 cggtcctgtc ccgcagcgtc ccgccagcca gctccttgca cccttcgcgg ccgaggcgct 60 ccctggtgct ccccgcgcag cc 82 <210> 341 <211> 246 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens RAB7A 5'-UTR RAB7A-001 ENST00000265062 <400> 341 gtctcgtgac aggtacttcc gctcggggcg gcggcggtgg cggaagtggg agcgggcctg 60 gagtcttggc cataaagcct gaggcggcgg cagcggcgga gttggcggct tggagagctc 120 gggagagttc cctggaacca gaacttggac cttctcgctt ctgtcctccg tttagtctcc 180 tcctcggcgg gagccctcgc gacgcgcccg gcccggagcc cccagcgcag cggccgcgtt 240 tgaagg 246 <210> 342 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens AGA 5'-UTR AGA-001 ENST00000264595 <400> 342 agggacgcct gagcgaaccc ccgagagagc gggcgtgggc gccaggcggg cggggcactg 60 gggattaatt gttcggcgat cgctggctgc cgggactttt ctcgcgctgg tctcttcggt 120 ggtcaggg 128 <210> 343 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TPK1 5'-UTR TPK1-001 ENST00000360057 <400> 343 aaggctcctc agccgagcgc cgagcggtcg atcgccgtag ctcccgcagc ctgcgatctc 60 cagtctgtgg ctcctaccag ccattgtagg ccaataatcc gtt 103 <210> 344 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MBNL3 5'-UTR MBNL3-001 ENST00000370839 <400> 344 aattcatttt taatccttta atagtccaca gtaatattgt cctaaagagg gtacattgga 60 ttttaatttt gctttcaat 79 <210> 345 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens MCCC2 5'-UTR MCCC2-001 ENST00000340941 <400> 345 agaatcagag aaaccttctc tggggctgca aggacctgag ctcagcttcc gccccagcca 60 gggaagcggc aggggaaagc accggctcca ggccagcgtg ggccgctctc tcgctcggtg 120 cccgccgcc 129 <210> 346 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CAT 5'-UTR CAT-001 ENST00000241052 <400> 346 actcggggca acaggcagat ttgcctgctg agggtggaga cccacgagcc gaggcctcct 60 gcagtgttct gcacagcaaa ccgcacgct 89 <210> 347 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ANAPC4 5'-UTR ANAPC4-001 ENST00000315368 <400> 347 cccgacgccg gaagtgcctg gagcgcgcga cagcggcggg gcggggcggc ctggaggctg 60 tggcgcgcgg ccggcagagg gaggggagag gccactgggg ccgtgttagt ctgccggtgg 120 ggactcttgc agggccgtcc cc 142 <210> 348 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PHKB 5'-UTR PHKB-002 ENST00000323584 <400> 348 ggccaaggcg gcgaccggag cgcg 24 <210> 349 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens ABCB7 5'-UTR ABCB7-001 ENST00000253577 <400> 349 ctcggttcct ctttcctcgc tcaag 25 <210> 350 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GPD2 5'-UTR GPD2-002 ENST00000438166 <400> 350 cccgcgcgcc tcgctgggag cacccgggcc gaggctctga ttctgggggg aggccgactc 60 caccctggct ggaggaactg ggtgctcctg cccgctggcc cctcgcgcgt gaggatctat 120 ctcaggctaa gaa 133 <210> 351 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens TMEM38B 5'-UTR TMEM38B-001 ENST00000374692 <400> 351 gctggagccg gcgcggagga gcgggcggcc gcggctgtgc cctctcctac tcctcaccgc 60 gcgagcgcgg ggaaccagta gccgcggctg cttcggttgc cgcggtcggt ggtcgtt 117 <210> 352 <211> 206 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NFU1 5'-UTR NM_001002755.2 <400> 352 gggaaaggtt ccccggcctc tcttggtcag ggtgacgcag tagcctgcaa acctcggcgc 60 gtaggccacc gcacttatcc gcagcaggac cgcccgcagc cggtagggtg ggctcttccc 120 agtgcccgcc cagctaccgg ccagcctgcg gctgcgcaga tctttcgtgg ttctgtcagg 180 gagaccctta ggcactccgg actaag 206 <210> 353 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LOC128322/NUTF2 5'-UTR NM_005796.1 <400> 353 ggaagggaca gtcggccgca gaccgcgctg ggttgccgct gccgctgccg ccatcgtgcc 60 agcccctcgg gtctccgtga ggccgggtga cgctccaga 99 <210> 354 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens NUBPL 5'-UTR NM_025152.2 <400> 354 actccgcgcc acccgcgaca gtttcccagc agggctcaca gcagcgttcc gcgtc 55 <210> 355 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens LANCL1 5'-UTR LANCL1-004 ENST00000233714 <400> 355 gagaagggct tcaggacgcg ggaggcgcac ttgcttcaag tcgcgggcgt gggaacgggg 60 cttgcttccg gcgtc 75 <210> 356 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens PIR 5'-UTR PIR-002 ENST00000380420 <400> 356 cctcccgcct cctctaggcc gccggccgcg aagcgctgag tcacggtgag gctactggac 60 ccacactctc ttaacctgcc ctccctgcac tcgctcccgg cggctcttcg cgtcaccccc 120 gccgctaagg ctccaggtgc cgctaccgca gcccctccat cctctacagc tcagcatcag 180 aacactctct ttttagactc cgat 204 <210> 357 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens CTBS 5'-UTR NM_004388.2 <400> 357 gacgcgcagc aggccccgcc cacccaggcg gtaggaaccc actccggccc gctagacctg 60 ctgct 65 <210> 358 <211> 314 <212> DNA <213> Artificial Sequence <220> <223> Homo sapiens GSTM4 5'-UTR NM_000850.4 <400> 358 aagctggcga ggccgagccc ctcctagtgc ttccggacct tgctccctga acactcggag 60 gtggcggtgg atcttactcc ttccagccag tgaggatcca gcaacctgct ccgtgcctcc 120 cgcgcctgtt ggttggaagt gacgaccttg aagatcggcc ggttggaagt gacgaccttg 180 aagatcggcg ggcgcagcgg ggccgagggg gcgggtctgg cgctaggtcc agcccctgcg 240 tgccgggaac cccagaggag gtcgcagttc agcccagctg aggcctgtct gcagaatcga 300 caccaaccag catc 314 <210> 359 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa1 5'-UTR Ndufa1-001 ENSMUST00000016571 <400> 359 gccggaagag aggtaaagcc gggtcacctc tgaggagccg gtgacgggtt ggcgtgcgag 60 taacggtgcg gag 73 <210> 360 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5e 5'-UTR NM_025983 <400> 360 cccacccctt ccgctactca ggcctgacct tcctgctgcc gggccggttt gaggctactc 60 tgaagcgacc cagcggttct gcccgacgcg cccgctcgag acacc 105 <210> 361 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gstm5 5'-UTR NM_010360 <400> 361 gagacagttc ggtcgcgtca gcccggccca cagcgtccag tataaagtta gccgcccaca 60 gtccatcgct gtatccccga aggggctaag atcgcccaaa 100 <210> 362 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cbr2 5'-UTR NM_007621 <400> 362 ataaaagctg agcccatctc ttgcttcgga agaagctggt gtcagcagc 49 <210> 363 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Anapc13 5'-UTR NM_181394 <400> 363 gtgacccaga agaagggcgg ggccgggagg aagccgacgc gcgcgcagtg ggcctgacaa 60 gatcaaagct gcaggagg 78 <210> 364 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa7 5'-UTR NM_023202 <400> 364 tcggagcgga aggaat 16 <210> 365 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5k 5'-UTR NM_007507 <400> 365 cgaaggtcac ggacaaa 17 <210> 366 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Cox4i1 5'-UTR NM_009941 <400> 366 cttccggtcg cgagcacccc agggtgtaga gggcggtcgc ggcggtcgcc tgggcagcgg 60 tggcaga 67 <210> 367 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufs6 5'-UTR NM_010888 <400> 367 ttggtacgac gcgtggggtc aagggtcacc ggcaag 36 <210> 368 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Sec61b 5'-UTR NM_024171 <400> 368 agagcctgta tctacgagag ttctgagtgc tcggcaactt cacgacttcc ctcttcctgc 60 ctcctgtgcc caccgttctt aggcatcagc 90 <210> 369 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Snrpd2 5'-UTR NM_026943 <400> 369 aaggctggag caacgcgctt ggaggcggga gtgatctgcg agcgaaacct acacc 55 <210> 370 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mgst3 5'-UTR NM_025569 <400> 370 actgctgtgc ttctcaggtc tgtaccaggc gcacgaaggt gagccagagc caag 54 <210> 371 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Mp68 (2010107E04Rik) 5'-UTR NM_027360 <400> 371 ctttcccatt ctgtagcaga atttggtgtt gcctgtggtc ttggtcccgc ggag 54 <210> 372 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Prdx4-001, 5'-UTR NM_016764 <400> 372 gcgcggtctc cagcgcgccg ttttagctgg ctgcctggcg gcaggggact ctgtgcttta 60 gcagagggac gtgttttcgc gcttgcttgg tc 92 <210> 373 <211> 215 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Pgcp 5'-UTR NM_176073 <400> 373 gctgtcctgg cacacaaaga agccaggcct gcagactact ggggctccgg gctgttcctg 60 aggcctctgg aggcccgccc tgtggctcca gtgcgctctg aggaccttcc tggtcccgcc 120 cccgaacgtg cctgtggtct gcaggcctca ccgggtgttg tggccgctgc tgctccgcag 180 agcctcgtga tcaggaagaa aagcaactag gaaca 215 <210> 374 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Myeov2 5'-UTR NM_001163425 <400> 374 agaaggggct ggccggaagt gagcgcaacg ccgccttgtc gag 43 <210> 375 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufa4 5'-UTR NM_010886 <400> 375 gtccgctcag ccaggttgca gaagcggctt agcgtgtgtc ctaatcttct ctctgcgtgt 60 aggtaggcct gtgccgcaaa c 81 <210> 376 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Ndufs5 5'-UTR NM_001030274 <400> 376 acggcaggcg tctgcgtcct cccgcagccg gcggtcggga attgcaccag ggacctgaca 60 agggcactgc agagcc 76 <210> 377 <211> 198 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Gstm1 5'-UTR NM_010358 <400> 377 ctgccttccg ctttagggtc tgctgctctg gttacagacc taggaagggg agtgcctaat 60 tgggattggt gcagggttgg gagggacccg ctgttttgtc ctgcccacgt ttctctagta 120 gtctgtataa agtcacaact ccaaacacac aggtcagtcc tgctgaagcc agtttgagaa 180 gaccacagca ccagcacc 198 <210> 378 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Atp5o 5'-UTR NM_138597 <400> 378 ctggcgcgcg cgcgtgcgct ctggcgccag tagtctcttt tcatttgggt ttgacctaca 60 gccgcccggg aaaag 75 <210> 379 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Tspo 5'-UTR NM_009775 <400> 379 gtcagcggct accaacctct gtgcgcagtg tccttcacgg aacaaccagc gactgcgtga 60 gcggggctgt ggatctttcc agaacatcag ttgcaatcac c 101 <210> 380 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Taldo1 5'-UTR NM_011528 <400> 380 gacgcgcggg gcattgtggg ttagcacgca ccggctaccg cctcagctgt tcgcgtttcg 60 cc 62 <210> 381 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Bloc1s1 5'-UTR NM_015740 <400> 381 gtgacgcctt ccgggtgagc caaggcatag tccagttcct gcagccttag ggaggggtcc 60 gccgtgccca cacccagcca gactcgacc 89 <210> 382 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Mus musculus Hexa 5'-UTR NM_010421 <400> 382 agctgaccgg ggctcacgtg ggctcagcct gctggaaggg gagctggccg gtgggcc 57 <210> 383 <211> 1810 <212> RNA <213> Artificial Sequence <220> <223> 32L4 - PpLuc(GC) - A64-C30-hSL <400> 383 gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60 cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120 ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180 guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240 ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300 ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360 gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420 gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480 gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540 cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600 caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660 cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720 cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780 ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840 gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900 cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960 gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020 cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080 ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140 ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200 gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260 cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320 cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380 gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440 cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500 gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560 cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620 ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguagau 1680 cuaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740 aaaaaaugca uccccccccc cccccccccc cccccccccc ccaaaggcuc uuuucagagc 1800 caccagaauu 1810 <210> 384 <211> 1927 <212> RNA <213> Artificial Sequence <220> <223> PpLuc(GC) - morn2- A64 - C30 - hSL <400> 384 gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60 cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120 ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180 guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240 ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300 ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360 gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420 gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480 gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540 cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600 caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660 cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720 cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780 ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840 gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900 cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960 gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020 cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080 ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140 ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200 gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260 cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320 cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380 gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440 cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500 gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560 cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620 ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguaccu 1680 gcugccuuaa cgcugagaug uggccucugc aaccccccuu aggcaaagca acugaaccuu 1740 cugcuaaagu gaccugcccu cuuccguaag uccaauaaag uugucaugca cccagaucua 1800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860 aaaugcaucc cccccccccc cccccccccc ccccccccca aaggcucuuu ucagagccac 1920 cagaauu 1927 <210> 385 <211> 1943 <212> RNA <213> Artificial Sequence <220> <223> PpLuc(GC) - ndufa1- A64 - C30 - hSL <400> 385 gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60 cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120 ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180 guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240 ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300 ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360 gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420 gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480 gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540 cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600 caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660 cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720 cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780 ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840 gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900 cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960 gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020 cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080 ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140 ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200 gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260 cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320 cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380 gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440 cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500 gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560 cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620 ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguggaa 1680 gcauuuuccu ggcugauuaa aagaaauuac ucagcuaugg ucaucuguuc cuguuagaag 1740 gcuaugcagc auauuauaua cuaugcgcau guuaugaaau gcauaauaaa aaauuuuaaa 1800 aaaucuaaaa gaucuaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860 aaaaaaaaaa aaaaaaaaau gcaucccccc cccccccccc cccccccccc cccccaaagg 1920 cucuuuucag agccaccaga auu 1943 <210> 386 <211> 1941 <212> RNA <213> Artificial Sequence <220> <223> PpLuc(GC) - NDUFA1- A64 - C30 - hSL <400> 386 gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60 cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120 ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180 guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240 ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300 ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360 gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420 gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480 gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540 cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600 caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660 cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720 cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780 ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840 gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900 cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960 gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020 cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080 ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140 ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200 gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260 cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320 cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380 gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440 cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500 gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560 cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620 ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguggaa 1680 gcauuuuccu gauugaugaa aaaaauaacu caguuauggc caucuacccc ugcuagaagg 1740 uuacagugua uuauguagca ugcaaugugu uauguagugc uuaauaaaaa uaaaaugaaa 1800 aaaaugcaga ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860 aaaaaaaaaa aaaaaaaugc aucccccccc cccccccccc cccccccccc cccaaaggcu 1920 cuuuucagag ccaccagaau u 1941 <210> 387 <211> 1861 <212> RNA <213> Artificial Sequence <220> <223> Mp68 - PpLuc(GC) - A64 - C30 - hSL <400> 387 gggcuuuccc auucuguagc agaauuuggu guugccugug gucuuggucc cgcggagaag 60 cuugaggaug gaggacgcca agaacaucaa gaagggcccg gcgcccuucu acccgcugga 120 ggacgggacc gccggcgagc agcuccacaa ggccaugaag cgguacgccc uggugccggg 180 cacgaucgcc uucaccgacg cccacaucga ggucgacauc accuacgcgg aguacuucga 240 gaugagcgug cgccuggccg aggccaugaa gcgguacggc cugaacacca accaccggau 300 cguggugugc ucggagaaca gccugcaguu cuucaugccg gugcugggcg cccucuucau 360 cggcguggcc gucgccccgg cgaacgacau cuacaacgag cgggagcugc ugaacagcau 420 ggggaucagc cagccgaccg ugguguucgu gagcaagaag ggccugcaga agauccugaa 480 cgugcagaag aagcugccca ucauccagaa gaucaucauc auggacagca agaccgacua 540 ccagggcuuc cagucgaugu acacguucgu gaccagccac cucccgccgg gcuucaacga 600 guacgacuuc gucccggaga gcuucgaccg ggacaagacc aucgcccuga ucaugaacag 660 cagcggcagc accggccugc cgaagggggu ggcccugccg caccggaccg ccugcgugcg 720 cuucucgcac gcccgggacc ccaucuucgg caaccagauc aucccggaca ccgccauccu 780 gagcguggug ccguuccacc acggcuucgg cauguucacg acccugggcu accucaucug 840 cggcuuccgg gugguccuga uguaccgguu cgaggaggag cuguuccugc ggagccugca 900 ggacuacaag auccagagcg cgcugcucgu gccgacccug uucagcuucu ucgccaagag 960 cacccugauc gacaaguacg accugucgaa ccugcacgag aucgccagcg ggggcgcccc 1020 gcugagcaag gaggugggcg aggccguggc caagcgguuc caccucccgg gcauccgcca 1080 gggcuacggc cugaccgaga ccacgagcgc gauccugauc acccccgagg gggacgacaa 1140 gccgggcgcc gugggcaagg uggucccguu cuucgaggcc aagguggugg accuggacac 1200 cggcaagacc cugggcguga accagcgggg cgagcugugc gugcgggggc cgaugaucau 1260 gagcggcuac gugaacaacc cggaggccac caacgcccuc aucgacaagg acggcuggcu 1320 gcacagcggc gacaucgccu acugggacga ggacgagcac uucuucaucg ucgaccggcu 1380 gaagucgcug aucaaguaca agggcuacca gguggcgccg gccgagcugg agagcauccu 1440 gcuccagcac cccaacaucu ucgacgccgg cguggccggg cugccggacg acgacgccgg 1500 cgagcugccg gccgcggugg uggugcugga gcacggcaag accaugacgg agaaggagau 1560 cgucgacuac guggccagcc aggugaccac cgccaagaag cugcggggcg gcgugguguu 1620 cguggacgag gucccgaagg gccugaccgg gaagcucgac gcccggaaga uccgcgagau 1680 ccugaucaag gccaagaagg gcggcaagau cgccguguaa gacuaguaga ucuaaaaaaa 1740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc 1800 aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag ccaccagaau 1860 u 1861 <210> 388 <211> 1888 <212> RNA <213> Artificial Sequence <220> <223> Ndufa4 - PpLuc(GC) - A64 - C30 - hSL <400> 388 gggguccgcu cagccagguu gcagaagcgg cuuagcgugu guccuaaucu ucucucugcg 60 uguagguagg ccugugccgc aaacaagcuu gaggauggag gacgccaaga acaucaagaa 120 gggcccggcg cccuucuacc cgcuggagga cgggaccgcc ggcgagcagc uccacaaggc 180 caugaagcgg uacgcccugg ugccgggcac gaucgccuuc accgacgccc acaucgaggu 240 cgacaucacc uacgcggagu acuucgagau gagcgugcgc cuggccgagg ccaugaagcg 300 guacggccug aacaccaacc accggaucgu ggugugcucg gagaacagcc ugcaguucuu 360 caugccggug cugggcgccc ucuucaucgg cguggccguc gccccggcga acgacaucua 420 caacgagcgg gagcugcuga acagcauggg gaucagccag ccgaccgugg uguucgugag 480 caagaagggc cugcagaaga uccugaacgu gcagaagaag cugcccauca uccagaagau 540 caucaucaug gacagcaaga ccgacuacca gggcuuccag ucgauguaca cguucgugac 600 cagccaccuc ccgccgggcu ucaacgagua cgacuucguc ccggagagcu ucgaccggga 660 caagaccauc gcccugauca ugaacagcag cggcagcacc ggccugccga aggggguggc 720 ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc cgggacccca ucuucggcaa 780 ccagaucauc ccggacaccg ccauccugag cguggugccg uuccaccacg gcuucggcau 840 guucacgacc cugggcuacc ucaucugcgg cuuccgggug guccugaugu accgguucga 900 ggaggagcug uuccugcgga gccugcagga cuacaagauc cagagcgcgc ugcucgugcc 960 gacccuguuc agcuucuucg ccaagagcac ccugaucgac aaguacgacc ugucgaaccu 1020 gcacgagauc gccagcgggg gcgccccgcu gagcaaggag gugggcgagg ccguggccaa 1080 gcgguuccac cucccgggca uccgccaggg cuacggccug accgagacca cgagcgcgau 1140 ccugaucacc cccgaggggg acgacaagcc gggcgccgug ggcaaggugg ucccguucuu 1200 cgaggccaag gugguggacc uggacaccgg caagacccug ggcgugaacc agcggggcga 1260 gcugugcgug cgggggccga ugaucaugag cggcuacgug aacaacccgg aggccaccaa 1320 cgcccucauc gacaaggacg gcuggcugca cagcggcgac aucgccuacu gggacgagga 1380 cgagcacuuc uucaucgucg accggcugaa gucgcugauc aaguacaagg gcuaccaggu 1440 ggcgccggcc gagcuggaga gcauccugcu ccagcacccc aacaucuucg acgccggcgu 1500 ggccgggcug ccggacgacg acgccggcga gcugccggcc gcgguggugg ugcuggagca 1560 cggcaagacc augacggaga aggagaucgu cgacuacgug gccagccagg ugaccaccgc 1620 caagaagcug cggggcggcg ugguguucgu ggacgagguc ccgaagggcc ugaccgggaa 1680 gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc aagaagggcg gcaagaucgc 1740 cguguaagac uaguagaucu aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800 aaaaaaaaaa aaaaaaaaaa aaaaugcauc cccccccccc cccccccccc cccccccccc 1860 aaaggcucuu uucagagcca ccagaauu 1888

Claims

a. 적어도 하나의 오픈 리딩 프레임(ORF); 및
b. 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 안정한 mRNA로부터 유도되는, 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 적어도 하나의 5'-비번역된 영역 요소(5'-UTR 요소)
를 포함하는 인공 핵산 분자.
제1항에 있어서, 상기 오픈 리딩 프레임은 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 유도된 유전자와 다른 유전자로부터 유도된 인공 핵산 분자.
제1항 또는 제2항에 있어서, 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자.
제3항에 있어서, 상기 각각의 적어도 하나의 오픈 리딩 프레임, 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소는 서로 이종 기원(heterologous)인 인공 핵산 분자.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 유도된 안정한 mRNA는 mRNA 붕괴를 특징으로 하며, 제1시점에 상기 mRNA의 양에 비해 제2시점에 상기 mRNA의 양의 비율은 적어도 0.5(50%), 적어도 0.6(60%), 적어도 0.7(70%), 적어도 0.75(75%), 적어도 0.8(80%), 적어도 0.85(85%), 적어도 0.9(90%), 또는 적어도 0.95(95%)인 인공 핵산 분자.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 리보좀 단백질 S6, RPL36AL, rps16 또는 리보좀 단백질 L9의 3'-UTR 및/또는 5'-UTR을 포함하지 않으며 상기 인공 핵산 분자의 오픈 리딩 프레임은 GFP 단백질을 코드(code)하지 않는 인공 핵산 분자.
제6항에 있어서, 상기 인공 핵산 분자의 오픈 리딩 프레임은 리포터 단백질을 코드하지 않는 인공 핵산 분자.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 진핵생물 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR, 바람직하게 척추동물 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR, 더욱 바람직하게 포유동물 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR, 더욱 더 바람직하게 영장류 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제8항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 인간 또는 쥣과 단백질 코딩 유전자의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제8항 또는 제9항에 있어서,
(i) 상기 핵산 분자는 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소를 포함하며,
(ii) 상기 적어도 하나의 3'-UTR 요소, 적어도 하나의 5'-UTR 요소 및 적어도 하나의 오픈 리딩 프레임은 서로 이종 기원이며;
(iii) 상기 적어도 하나의 3'-UTR 요소는 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자로 이루어진 그룹으로부터 선택된 유전자로부터 유도되며; 및
(iv) 상기 3'UTR은 리보좀 단백질을 코딩하는 유전자 또는 Fig4 유전자로부터 유도되지 않는 인공 핵산 분자.
제8항 내지 제10항 중 어느 한 항에 있어서,
(i) 상기 핵산 분자는 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소를 포함하며;
(ii) 상기 적어도 하나의 3'-UTR 요소, 적어도 하나의 5'-UTR 요소 및 적어도 하나의 오픈 리딩 프레임은 서로 이종 기원이며;
(iii) 상기 적어도 하나의 5'-UTR 요소는 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자로 이루어진 그룹으로부터 선택된 유전자로부터 유도되며;
(iv) 상기 5'-UTR은 바람직하게 5'TOP UTR이 아니며; 및
(v) 상기 3'-UTR은 바람직하게 리보좀 단백질 또는 알부민을 코딩하는 유전자 또는 Fig4 유전자로부터 유도되지 않는 인공 핵산 분자.
제10항 또는 제11항에 있어서,
(i) 상기 핵산 분자는 적어도 하나의 3'-UTR 요소 및 적어도 하나의 5'-UTR 요소를 포함하며;
(ii) 상기 적어도 하나의 3'-UTR 요소, 적어도 하나의 5'-UTR 요소 및 적어도 하나의 오픈 리딩 프레임은 서로 이종 기원이며;
(iii) 상기 적어도 하나의 3'UTR 요소는 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자로 이루어진 그룹으로부터 선택된 인간 또는 쥣과 유전자로부터 유도되며;
(iv) 상기 3'UTR은 리보좀 단백질 또는 알부민을 코딩하는 유전자 또는 Fig4 유전자로부터 유도되지 않으며;
(v) 상기 적어도 하나의 5'-UTR 요소는 하우스키핑 유전자, 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자로 이루어진 그룹으로부터 선택된 인간 또는 쥣과 유전자로부터 유도되며; 및
(vi) 상기 5'-UTR은 5' TOP UTR이 아닌 인공 핵산 분자.
제10항 내지 제12항 중 어느 한 항에 있어서, 상기 3'-UTR 및 5'-UTR은 인간 또는 쥣과 하우스키핑 유전자로부터 유도된 인공 핵산 분자.
제12항에 있어서, 상기 3'-UTR 및 5'-UTR은 막 단백질을 코딩하는 유전자, 세포 대사에 포함된 유전자, 전사, 번역 및 복제 과정에 포함된 유전자, 단백질 변형에 포함된 유전자 및 세포 분할에 포함된 유전자로 이루어진 그룹으로부터 선택된 인간 또는 쥣과 유전자로부터 유도되며 상기 3'-UTR 및 5'-UTR은 다른 유전자 종류로부터 선택된 인공 핵산 분자.
제1항 내지 제14항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 각각 3'-UTR 및/또는 적어도 하나의 5'-UTR이 없는 참조 핵산 분자로부터 단백질 생산에 비해, 적어도 1.2배, 바람직하게 적어도 1.5배, 더욱 바람직하게 적어도 2배, 더욱 더 바람직하게 적어도 2.5배 상기 인공 핵산 분자로부터 단백질 생산을 연장시키며, 및/또는 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 각각 3'-UTR 및/또는 적어도 하나의 5'-UTR이 없는 참조 핵산 분자로부터 단백질 생산에 비해, 적어도 1.5배, 바람직하게 적어도 2배, 더욱 더 바람직하게 적어도 2.5배 상기 인공 핵산 분자로부터 단백질 생산을 증가시키는 인공 핵산 분자.
제1항 내지 제15항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과(readthrough) 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹; 바람직하게 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제(유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제16항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, , PIR, ACAA2, CTBS, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹으로부터 선택된 인간 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함하는 인공 핵산 분자.
제16항에 있어서, 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1), Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Sepp1, 및 Gaa로 이루어진 그룹으로부터 선택된 쥣과 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함하는 인공 핵산 분자.
제16항 내지 제18항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체(readthrough transcript)), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 상기 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제19항에 있어서, 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹으로부터 선택된 인간 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 인간 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제19항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1), Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, 및 Gaa로 이루어진 그룹으로부터 선택된 쥣과 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 상기 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 쥣과 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제16항 내지 제18항 중 어느 한 항에 있어서, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, TMEM14A, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; 및 Hexa로 이루어진 그룹으로부터 선택된 유전자 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함하며, 바람직하게, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제22항에 있어서, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, TMEM14A, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, 및 GSTM4로 이루어진 그룹으로부터 선택된 인간 유전자 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 인간 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제22항에 있어서, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; 및 Hexa로 이루어진 그룹으로부터 선택된 쥣과 유전자 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4)의 쥣과 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 인공 핵산 분자.
제1항 내지 제21항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 서열번호: 1 내지 24 및 서열번호: 49 내지 318로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지거나 또는 상기 적어도 하나의 3'-UTR 요소는 서열번호: 1 내지 24 및 서열번호: 49 내지 318로 이루어진 그룹으로부터 선택된 핵산 서열의 절편에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어진 인공 핵산 분자.
제1항 내지 제18항 및 제22항 내지 제24항 중 어느 한 항에 있어서, 상기 적어도 하나의 5'-UTR 요소는 서열번호: 25 내지 30 및 서열번호: 319 내지 382로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지거나 또는 상기 적어도 하나의 5'-UTR 요소는 서열번호: 25 내지 30 및 서열번호: 319 내지 382로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어진 인공 핵산 분자.
제25항 또는 제26항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개 뉴클레오티드, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타내는 인공 핵산 분자.
제1항 내지 제27항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타내는 인공 핵산 분자.
제1항 내지 제28항 중 어느 한 항에 있어서,
c. 폴리(A) 서열 및/또는 폴리아데닐화 신호
를 추가적으로 포함하는 인공 핵산 분자.
제29항에 있어서, 상기 폴리(A) 서열 또는 폴리아데닐화 신호는 3'-UTR 요소의 3'에 위치한 인공 핵산 분자.
제29항 또는 제30항에 있어서, 상기 폴리아데닐화 신호는 N = A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함하는 인공 핵산 분자.
제29항 내지 제31항 중 어느 한 항에 있어서, 상기 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 3'-UTR 요소의 3'-말단에 약 50개 미만의 뉴클레오티드 다운스트림에 위치한 인공 핵산 분자.
제29항 내지 제32항 중 어느 한 항에 있어서, 상기 폴리(A) 서열은 약 20 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 50 내지 약 100개 아데닌 뉴클레오티드, 더욱 더 바람직하게 약 60 내지 약 70개 아데닌 뉴클레오티드의 길이를 갖는 인공 핵산 분자.
제1항 내지 제33항 중 어느 한 항에 있어서, 5'-캡 구조, 폴리(C) 서열, 히스톤 스템-루프, 및/또는 IRES-모티프를 추가적으로 포함하는 인공 핵산 분자.
제1항 내지 제34항 중 어느 한 항에 있어서, 상기 히스톤 스템-루프는 서열번호: 34에 따른 서열을 포함하는 인공 핵산 분자.
제1항 내지 제35항 중 어느 한 항에 있어서, 상기 핵산은 프로모터를 포함하는 인공 핵산 분자.
제1항 내지 제36항 중 어느 한 항에 있어서, 상기 핵산은 5'-TOP UTR을 포함하는 인공 핵산 분자.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 핵산은 알부민 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 3'-UTR을 포함하는 인공 핵산 분자.
제1항 내지 제38항 중 어느 한 항에 있어서, 상기 인공 핵산 분자, 바람직하게 상기 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되며, 바람직하게 상기 오픈 리딩 프레임의 G/C 함량은 야생형 오픈 리딩 프레임에 비해 증가된 인공 핵산 분자.
제1항 내지 제39항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임은 코돈-최적화된 영역을 포함하며, 바람직하게 상기 오픈 리딩 프레임은 코돈-최적화된 인공 핵산 분자.
제1항 내지 제40항 중 어느 한 항에 있어서, RNA, 바람직하게 mRNA 분자인 인공 핵산 분자.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자를 포함하는 벡터.
제42항에 있어서, DNA 벡터인 벡터.
제42항 또는 제43항에 있어서, 플라스미드 벡터 또는 바이러스 벡터, 바람직하게 플라스미드 벡터인 벡터.
제42항 내지 제44항 중 어느 한 항에 있어서, 원형 분자인 벡터.
제42항에 있어서, 코딩 가닥(strand)의 폴리(A) 서열, 폴리(C) 서열, 히스톤 스템 루프 또는 3'-UTR 요소 다음에 원형 벡터 분자의 선형화를 위한 제한 부위가 5'->3' 방향으로 뒤따르는 벡터.
제1항 내지 제39항 중 어느 한 항에 따른 인공 핵산 분자 또는 제42항 내지 제46항 중 어느 한 항에 따른 벡터를 포함하는 세포.
제47항에 있어서, 포유동물 세포인 세포.
제47항 또는 제48항에 있어서, 포유동물 개체의 세포, 바람직하게 포유동물 개체, 바람직하게 인간 개체의 분리된 세포인 세포.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자, 제42항 내지 제46항 중 어느 한 항에 따른 벡터, 또는 제47항 내지 제49항 중 어느 한 항에 따른 세포를 포함하는 약학적 조성물.
제50항에 있어서, 하나 이상의 약학적으로 허용 가능한 비히클(vehicle), 희석제 및/또는 부형제 및/또는 하나 이상의 어쥬번트(adjuvants)를 추가적으로 포함하는 약학적 조성물.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자, 제42항 내지 제46항 중 어느 한 항에 따른 벡터, 제47항 내지 제49항 중 어느 한 항에 따른 세포, 또는 제50항 또는 제51항에 따른 약학적 조성물의 약제 용도.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자, 제42항 내지 제46항 중 어느 한 항에 따른 벡터, 제47항 내지 제49항 중 어느 한 항에 따른 세포, 또는 제50항 또는 제51항에 따른 약학적 조성물의 백신 용도 또는 유전자 치료 용도.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자, 제42항 내지 제46항 중 어느 한 항에 따른 벡터, 제47항 내지 제49항 중 어느 한 항에 따른 세포, 또는 제50항 또는 제51항에 따른 약학적 조성물을 이것이 필요한 개체에 투여하는 단계를 포함하는 질환(disorder)을 치료 또는 예방하는 방법.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자 또는 제42항 내지 제46항 중 어느 한 항에 따른 벡터를 세포에 형질주입하는 단계를 포함하는 질환을 치료 또는 예방하는 방법.
제55항에 있어서, 상기 세포의 형질주입은 인비트로(in vitro)/엑스비보(ex vivo)에서 수행되며, 형질주입된 세포는 이것이 필요한 개체, 바람직하게 인간 환자에 투여되는 방법.
제56항에 있어서, 인비트로에서 형질주입되는 상기 세포는 개체, 바람직하게 인간 환자의 분리된 세포인 방법.
제54항 내지 제57항 중 어느 한 항에 있어서, 백신 접종 방법 또는 유전자 치료 방법인 방법.
3'-UTR 요소 및/또는 5'-UTR 요소와 오픈 리딩 프레임을 결합(associating)시키는 단계를 포함하며, 상기 3'-UTR 요소 및/또는 5'-UTR 요소는 생성되는 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키며, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소는 제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게 mRNA 분자, 또는 제42항 내지 제46항 중 어느 한 항에 따른 벡터를 수득하기 위해 안정한 mRNA로부터 유도되는, 인공 핵산 분자로부터, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증가 및/또는 연장시키는 방법.
제59항에 있어서, 상기 3'-UTR 요소 및/또는 5'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, , Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹으로부터; 바람직하게 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진, 인공 핵산 분자로부터, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증가 및/또는 연장시키는 방법.
NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹; 바람직하게 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어지며, 인공 핵산 분자로부터, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증가 및/또는 연장시키기 위한 3'-UTR 요소 및/또는 5'-UTR 요소의 용도.
제60항 또는 제61항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹으로부터 선택된 인간 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함하는 제60항에 따른 방법 또는 제61항에 따른 용도.
제60항 또는 제61항에 있어서, 상기 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소가 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), CNTN1 (콘택틴 1), Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Sepp1, 및 Gaa로 이루어진 그룹으로부터 선택된 쥣과 유전자 전사체의 3'-UTR 및/또는 5'-UTR로부터 유도된 핵산 서열을 포함하는 제60항에 따른 방법 또는 제61항에 따른 용도.
제60항 내지 제63항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (번역초과 전사체), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L, 및 MANSC1로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 상기 적어도 하나의 3'-UTR 요소는 NDUFA1 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체), GNAS (구아닌 뉴클레오티드 결합 단백질, 알파 자극 복합체 위치), MORN2 (MORN 반복 포함 2), GSTM1 (글루타치온 S-트랜스퍼라제, mu 1), CBR2 (카보닐 리덕타제 2), Ybx1 (Y-박스 결합 단백질 1), Ndufb8 (NADH 디히드로게나제 (유비퀴논) 1 베타 서브복합체 8), 및 CNTN1 (콘택틴 1)로 이루어진 그룹으로부터 선택된 유전자 전사체의 3'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 방법 또는 용도.
제60항 내지 제63항 중 어느 한 항에 있어서, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자), NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, TMEM14A, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, , Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; 및 Hexa로 이루어진 그룹으로부터 선택된 유전자 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함하며; 바람직하게, 상기 적어도 하나의 5'-UTR 요소는 MP68 (RIKEN cDNA 2010107E04 유전자) 또는 NDUFA4 (NADH 디히드로게나제 (유비퀴논) 1 알파 서브복합체 4) 전사체의 5'-UTR로부터 유도된 핵산 서열을 포함 또는 이로 이루어진 방법 또는 용도.
제60항 내지 제64항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 서열번호: 1 내지 24 및 서열번호: 49 내지 318로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지거나 또는 상기 3'-UTR 요소는 서열번호: 1 내지 24 및 서열번호: 49 내지 318로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어진 방법 또는 용도.
제60항 내지 제63항 및 제65항 중 어느 한 항에 있어서, 상기 5'-UTR 요소는 서열번호: 25 내지 30 및 서열번호: 319 내지 382로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함 또는 이로 이루어지거나 또는 상기 5'-UTR 요소는 서열번호: 25 내지 30 및 서열번호: 319 내지 382로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함 또는 이로 이루어진 방법 또는 용도.
제66항 또는 제67항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타내는 방법 또는 용도.
제60항 내지 제68항 중 어느 한 항에 있어서, 상기 3'-UTR 요소 및/또는 5'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타내는 방법 또는 용도.
제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자, 제42항 내지 제46항 중 어느 한 항에 따른 벡터, 제47항 내지 제49항 중 어느 한 항에 따른 세포, 및/또는 제50항 또는 제51항에 따른 약학적 조성물을 포함하는 키트 또는 일부(parts)의 키트.
제70항에 있어서, 사용을 위한 지침(instructions), 형질전환을 위한 세포, 어쥬번트, 약학적 조성물의 투여를 위한 수단, 약학적으로 허용 가능한 담체(carrier) 및/또는 인공 핵산 분자, 벡터, 세포 또는 약학적 조성물의 용해 또는 희석을 위한 약학적으로 허용 가능한 용액을 추가적으로 포함하는 키트.
a) 하기 하위-단계를 포함하는 mRNA의 안정성을 분석하는 단계:
i. 상기 mRNA의 붕괴 과정 동안 제1시점의 상기 mRNA의 양을 측정하는 단계,
ii. 상기 mRNA의 붕괴 과정 동안 제2시점의 상기 mRNA의 양을 측정하는 단계, 및
iii. (ii) 단계에서 측정된 상기 mRNA의 양에 비해 (i) 단계에서 측정된 상기 mRNA의 양의 비율을 계산하는 단계;
b) 적어도 0.5(50%), 적어도 0.6(60%), 적어도 0.7(70%), 적어도 0.75(75%), 적어도 0.8(80%), 적어도 0.85(85%), 적어도 0.9(90%), 또는 적어도 0.95(95%)의 하위-단계 (iii)에서 계산된 비율을 갖는 안정한 mRNA를 선택하는 단계; 및
c) 상기 안정한 mRNA의 3'- 및/또는 5'-UTR 요소의 뉴클레오티드 서열을 결정하는 단계
를 포함하는 안정한 mRNA로부터 유도된, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 방법.
a) 하기 하위-단계를 포함하는 다수의 mRNA 종의 안정성을 분석하는 단계:
i. 상기 mRNA 종의 붕괴 과정 동안 제1시점의 상기 다수의 mRNA 종의 각 mRNA 종의 양을 측정하는 단계,
ii. 상기 mRNA 종의 붕괴 과정 동안 제2시점의 상기 다수의 mRNA 종의 각 mRNA 종의 양을 측정하는 단계,
iii. (ii) 단계에서 측정된 상기 mRNA 종의 양에 비해 (i) 단계에서 측정된 상기 mRNA 종의 양의 비율을 상기 다수의 mRNA 종 비율을 각각 mRNA 종에 대해 계산하는 단계;
b) 각각의 mRNA 종에 대해 하위-단계 (iii)에서 계산된 비율에 따라 다수의 mRNA 종 가운데 mRNA 종을 순위화하는 단계;
c) 가장 높은 비율 또는 하위-단계 (iii)에서 계산된 가장 높은 비율을 갖는 하나 이상의 mRNA 종을 선택하는 단계; 및
d) 상기 mRNA의 3'- 및/또는 5'-UTR 요소의 뉴클레오티드 서열을 결정하는 단계
를 포함하는 안정한 mRNA로부터 유도된, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 방법.
제72항 또는 제73항에 있어서, 상기 제1시점 및 제2시점 사이의 시간 간격(time period)은 적어도 5시간, 바람직하게 적어도 6시간, 바람직하게 적어도 7시간, 더욱 바람직하게 적어도 8시간, 더욱 바람직하게 적어도 9시간, 더욱 더 바람직하게 적어도 10시간, 더욱 더 바람직하게 적어도 11시간, 및 특히 바람직하게 적어도 12시간인 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법.
제72항 내지 제74항 중 어느 한 항에 있어서, 상기 mRNA의 안정성은 펄스 표지를 통해, 바람직하게 펄스-추적 방법을 사용하여 분석되는 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법.
a) 제72항 내지 제75항 중 어느 한 항에 따른 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법을 통해 안정한 mRNA로부터 유도된 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 단계;
b) 적어도 하나의 오픈 리딩 프레임 및 a) 단계에서 식별된 3'-UTR 요소 및/또는 5'-UTR 요소에 상응하거나 또는 이에 포함된 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자를 합성하는 단계;
c) b) 단계에서 합성된 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임에 의해 부호화된 단백질의 발현을 분석하는 단계;
d) 3'-UTR 요소 및/또는 5'-UTR 요소가 없는 참조 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임(ORF)에 의해 부호화된 단백질의 발현을 분석하는 단계;
e) d) 단계에서 분석된 참조 인공 핵산 분자로부터 단백질 발현에 비해 c) 단계에서 분석된 인공 핵산 분자로부터 단백질 발현을 비교하는 단계; 및
f) c) 단계에서 분석된 인공 핵산 분자로부터 단백질 발현이 d) 단계에서 분석된 참조 인공 핵산 분자로부터 단백질 발현에 비해 연장 및/또는 증가되는 경우 3'-UTR 요소 및/또는 5'-UTR 요소를 선택하는 단계
를 포함하는 안정한 mRNA로부터 유도된, 인공 핵산 분자로부터 단백질 생산을 연장 및/또는 증가시키는, 3'-비번역된 영역 요소(3'-UTR 요소) 및/또는 5'-비번역된 영역 요소(5'-UTR 요소)를 식별하는 방법.
적어도 하나의 오픈 리딩 프레임 및 제72항 내지 제76항 중 어느 한 항에 따른 3'-UTR 요소 및/또는 5'-UTR 요소를 식별하는 방법을 통해 식별된 적어도 하나의 3'-UTR 요소 및/또는 적어도 하나의 5'-UTR 요소를 포함하는 인공 핵산 분자가 합성되는, 인공 핵산 분자를 생산하는 방법.
제77항에 있어서, 제42항 내지 제46항 중 어느 한 항에 따른 벡터가 인공 핵산 분자의 합성에 사용되는 인공 핵산 분자를 생산하는 방법.
제77항 또는 78항에 있어서, 상기 인공 핵산 분자는 제1항 내지 제41항 중 어느 한 항에 따른 인공 핵산 분자인 인공 핵산 분자를 생산하는 방법.
제77항 내지 제79항 중 어느 한 항에 따른 인공 핵산 분자를 생산하는 방법을 통해 수득 가능한 인공 핵산 분자.