KR20160104062A

KR20160104062A - 인공 핵산 분자

Info

Publication number: KR20160104062A
Application number: KR1020167020951A
Authority: KR
Inventors: 안드레아스 테스
Original assignee: 큐어백 아게
Priority date: 2013-12-30
Filing date: 2014-12-30
Publication date: 2016-09-02
Also published as: BR112016014462A2; CA2927862A1; WO2015101414A2; RU2016131391A3; MX2020003245A; JP6997251B2; US10047375B2; CA2927862C; KR102399799B1; WO2015101414A3; SG11201603144QA; DK3090053T3; JP2020184995A; AU2014375402B2; ES2712092T3; JP2017502670A; US20220136001A1; CN105874072A; JP6704850B2; RU2717986C2

Abstract

본 발명은 적어도 하나의 오픈 리딩 프레임 및 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR) 요소를 포함하는 인공 핵산 분자에 관한 것이다. 나아가 본 발명은 유전자 치료 및/또는 유전자 백신 접종에 이러한 인공 핵산 분자의 용도에 관한 것이다. 게다가, 본 발명은 이러한 3'-UTR 요소를 포함하는 핵산 서열로부터 단백질 발현을 증진, 안정 및/또는 연장시키기 위한 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 3'-UTR 요소의 용도에 관한 것이다.

Description

인공 핵산 분자{Artificial nucleic acid molecules}

본 발명은 오픈 리딩 프레임, 3'-비번역된 영역 요소(3'-UTR 요소) 및 선택적으로 폴리(A) 서열 및/또는 폴리아데닐화 신호를 포함하는 인공 핵산 분자에 관한 것이다. 또한 본 발명은 바람직하게 유전자 요법 및/또는 유전자 백신 접종(genetic vaccination)의 분야에 사용하기 위한, 3'-UTR 요소를 포함하는 벡터, 상기 인공 핵산 분자 또는 벡터를 포함하는 세포, 상기 인공 핵산 분자 또는 벡터를 포함하는 약학적 조성물 및 인공 핵산 분자, 벡터 및/또는 약학적 조성물을 포함하는 키트에 관한 것이다.

유전자 요법 및 유전자 백신 접종은 현대 의학의 가장 촉망되고 빠르게 발달하는 방법에 속한다. 이들은 많은 다양한 질병의 치료를 위해 매우 특이적이고 개별적인 선택 사항을 제공할 수 있다. 특히, 유전된 유전자 질병, 염증성 질병뿐만 아니라, 자가면역 질병, 암 또는 종양 관련 질병은 이러한 치료적 접근 방법의 대상이 될 수 있다. 또한, 이러한 접근 방법에 의해 상기 질병의 조기 발병을 예방하는 것이 예상된다.

유전자 치료 배후에 주요 개념의 이론적 근거는 특정한 질병의 병리학적 상태와 관련된 손상된 유전자의 적절한 조절이다. 병리학적으로 변형된 유전자 발현은 필수적인 유전자 산물, 예를 들어 호르몬, 하우스키핑 인자, 대사 효소 또는 구조 단백질 등과 같은 신호 인자의 부족 또는 과발현을 초래할 수 있다. 변형된 유전자 발현은 전사 및/또는 번역의 잘못된 조절에 의한 것뿐만 아니라, 특정한 단백질에 대한 ORF 코딩 내 변이에 의한 것일 수 있다. 병리학적인 변이는 예를 들어 염색체 이상에 의해, 또는 점 또는 프레임-쉬프트-돌연변이, 제한된 기능성을 초래, 및 잠재적으로 유전자 산물의 기능을 전부 상실하게 하는 이들 모두와 같은 보다 특이적인 변이에 의해 유발될 수 있다. 그러나, 만약 돌연변이가 세포의 전사 또는 번역 기관에 포함된 단백질을 코딩하는 유전자에 영향을 미친다면, 전사 또는 번역의 잘못된 조절이 또한 발생할 수 있다. 이러한 돌연변이는 보통 기능적인 유전자의 병리학적인 상향 또는 하향 조절을 일으킬 수 있다. 이러한 조절 기능을 수행하는 유전자 산물을 코딩하는 유전자는 예를 들어 전사 인자, 신호 수용체 또는 메신저 단백질 등일 수 있다. 그러나, 조절 단백질을 코딩하는 이러한 유전자의 기능의 상실은, 특정한 상황 하에, 손상된 유전자 산물의 보다 다운스트림(downstream)으로 활동하는 다른 요소의 인공적인 도입에 의해 역전될 수 있다. 이러한 유전자 결함은 또한 영향을 받은 유전자 자체의 치환을 통한 유전자 요법에 의해 보상될 수 있다.

유전자 백신 접종은 박테리아 표면, 바이러스 입자 또는 종양 항원 등과 같은 특유의 구성 요소와 같은 선택된 항원에 바람직한 면역 반응을 유발한다. 일반적으로, 백신 접종은 현대 의학의 중심적인 업적 가운데 하나이다. 그러나, 효과적인 백신 접종은 현재 제한된 수의 질병에 대해서만 가능하다. 따라서, 백신 접종에 의해 예방이 불가능한 감연은 여전히 매년 수백만명의 사람들에게 영향을 미친다.

일반적으로, 백신은 "제1", "제2" 및 "제3" 세대 백신으로 세분될 수 있다. "제1세대" 백신은 전형적으로 전체 유기체 백신이다. 이들은 생존하고 약화된 또는 사멸된 병원체, 예를 들어 바이러스 또는 박테리아 등에 기초한다. 생존 및 약화된 백신의 주요한 결점은 생명을 위협하는 변이체에 회귀(reversion)에 대한 위험이다. 따라서, 비록 약화되더라도, 이러한 병원체는 여전히 예상치 못한 위험을 본질적으로 가질 수 있다. 사멸된 병원체는 특이적 면역 반응을 발생시키는데 바람직할만큼 효과적이지 않을 수 있다. 이들 위험을 최소화하기 위해, "제2세대" 백신이 개발되었다. 이들은 전형적으로, 병원체로부터 유도된 정의된 항원 또는 재조합 단백질 구성 요소로 이루어진 서브유닛 백신이다.

유전자 백신, 즉 유전자 백신 접종을 위한 백신은 일반적으로 "제3세대" 백신으로 알려져 있다. 그들은 전형적으로 인비보(in vivo) 병원체 또는 종양 항원에 대한 펩타이드 또는 단백질(항원) 절편의 발현을 허용하는 유전적으로 조작된 핵산 분자로 구성된다. 유전자 백신은 표적 세포의 흡수 이후 환자에게 투여될 때 발현된다. 투여된 핵산의 발현은 코딩된 단백질의 생산을 초래한다. 이들 단백질이 환자의 면역계에 의해 외부 물질로 인식될 경우, 면역 반응이 촉발된다.

상기와 같이, 유전자 치료 및 유전자 백신 접종 모두 환자에 핵산 분자의 투여 및 이후 코딩된 유전자 정보의 전사 및/또는 번역에 필수적으로 기초한다. 그렇지 않으면, 유전자 백신 접종 또는 유전자 치료는 또한 치료되는 환자로부터 특정한 체세포의 분리, 이후 이러한 세포의 엑스비보(ex vivo) 형질전환, 및 환자에 처리된 세포의 재투여를 포함하는 방법을 포함할 수 있다.

DNA뿐만 아니라 RNA는 유전자 치료 또는 유전자 백신 접종의 맥락에서 투여를 위한 핵산 분자로 사용될 수 있다. DNA는 상대적으로 안정하고 다루기 쉬운 것으로 알려져 있다. 그러나, DNA의 사용은 잠재적으로 손상된 유전자의 기능의 상실과 같이 돌연변이 현상을 초래하는, 환자의 유전체로 투여된 DNA 절편의 바람직하지 않은 삽입의 위험을 갖는다. 또 다른 위험으로, 항-DNA 항체의 바람직하지 않은 발생이 나타났다. DNA는 생산되는 mRNA가 번역되기 전에 전사되기 위해 반드시 핵에 들어가야 하므로, 다른 결점은 DNA 투여로 성취되는 코딩된 펩타이드 또는 단백질의 제한된 발현 수준이다. 다른 이유들 가운데, 투여된 DNA의 발현 수준은 DNA 전사를 조절하는 특정한 전사 인자의 존재에 의존할 것이다. 이러한 요소들이 없다면, DNA 전사는 RNA의 충분한 양을 생산하지 않을 것이다. 결과적으로 번역된 펩타이드 또는 수득된 단백질의 수준은 제한된다.

유전자 치료 또는 유전자 백신 접종을 위한 DNA 대신 RNA를 사용함으로써, 바람직하지 않은 유전체 삽입 및 항-DNA 항체의 형성의 위험은 최소화 또는 회피된다. 그러나, RNA는 유비쿼터스(ubiquitous) RNAse에 의해 쉽게 분해될 수 있는 상당히 불안정한 분자 종으로 여겨진다.

인비보(in vivo), RNA 분해는 RNA 반감기의 조절에 기여한다. 상기 효과는 진핵세포 유전자 발현의 조절을 세밀하게 조정하는 것으로 여겨지고 증명되었다(Friedel et al., 2009. Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17): 1-12). 따라서, 각각의 자연 발생 mRNA는 mRNA가 유도된 유전자 및 이것이 발현되는 세포 타입에 의존하는 이의 개별적인 반감기를 갖는다. 이는 이러한 유전자의 발현 수준의 조절에 기여한다. 불안정한 RNAs는 특정한 시점에서 일시적인 유전자 발현을 깨닫는데 중요하다. 그러나, 오래 생존한 RNA는 특정한 단백질의 축적 또는 유전자의 지속적인 발현과 관련될 수 있다. 인비보(in vivo), mRNA의 반감기는 또한 예를 들어 인슐린 유사 성장 인자 I, 액틴 및 알부민 mRNA에서 나타나는 것처럼, 호르몬 치료와 같은 환경적인 요소에 의존할 수 있다(Johnson et al., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, pp. 5287-5291, 1991).

유전자 치료 및 유전자 백신 접종을 위해 보통 안정한 RNA가 바람직하다. 이는 반면, 생산물이 RNA 서열에 의해 코딩되는 것이 보통 바람직한 사실 문에, 인비보(in vivo) 축적된다. 반면, RNA는 적절한 투여 형태로 제조, 이의 저장 과정 및 투여될 때 이의 구조적 및 기능적인 온전성을 유지해야 한다. 따라서, 조기에 분해 또는 부식되는 것으로부터 예방하기 위하여, 유전자 치료 또는 유전자 백신 접종을 위해 적절한 RNA 분자를 제공하기 위한 노력이 있었다.

핵산 분자의 G/C-함량은 그들의 안정성에 영향을 미칠 수 있는 것으로 보고되었다. 따라서, 구아닌(G) 및/또는 시토신(C) 잔기의 증가된 양을 포함하는 핵산은 많은 양의 아데닌(A) 및 티민(T) 또는 우라실(U) 뉴클레오티드를 포함하는 핵산에 비해 기능적으로 보다 안정할 수 있다. 이러한 맥락에서, WO02/098443는 코딩 영역 내 서열 변형에 의해 안정되는 mRNA를 포함하는 약학적 조성물을 제공한다. 이러한 서열 변형은 유전자 코드의 퇴화의 장점을 가진다. 따라서, 뉴클레오티드(RNA 안정성의 관점에서 덜 바람직한)의 덜 바람직한 조합을 포함하는 코돈은 코딩된 아미노산 서열의 변형 없이 대체 코돈에 의해 치환될 수 있다. 이러한 RNA 안정화 방법은 바람직한 아미노산 서열의 공간을 남기지 않는, 각 단일 RNA 분자의 특정한 뉴클레오티드 서열의 제공에 의해 제한된다. 또한, 그러한 접근 방법은 RNA의 코딩 영역에 대하여 제한된다.

mRNA 안정화를 위한 대안적 선택으로서, 자연 발생 진핵 mRNA 분자는 특유의 안정화 요소를 포함하는 것으로 밝혀졌다. 예를 들어, 그들은 그들의 5'-말단(5'-UTR) 및/또는 그들의 3'-말단(3'-UTR)에 소위 비번역된 영역(UTR)뿐만 아니라 5'-캡 구조 또는 3'-폴리(A) 테일과 같은 다른 구조적인 특징을 포함할 수 있다. 5'-UTR 및 3'-UTR은 모두 전형적으로 유전체 DNA로부터 전사되며, 따라서 조숙 mRNA의 요소이다. 5'-캡 및 3'-폴리(A) 테일(소위 폴리(A)테일 또는 폴리(A) 서열)과 같은 성숙 mRNA의 특유한 구조적인 특징은 일반적으로 mRNA 가공 도중 전사된 (조숙) mRNA에 추가된다.

3'-폴리(A) 테일은 전형적으로 전사된 mRNA의 3'-말단에 첨가된 아데노신 뉴클레오티드의 단조로운(monotonous) 서열 스트레치이다. 이는 약 400개까지의 아데노신 뉴클레오티드를 포함할 수 있다. 이러한 3'-폴리(A) 테일의 길이는 각 mRNA의 안정성에 대하여 잠재적으로 중요한 요소인 것으로 밝혀졌다.

또한, 알파-글로빈 mRNA의 3'-UTR은 알파-글로빈 mRNA의 잘 알려진 안정성에 중요한 요소일 수 있는 것으로 나타났다(Rodgers et al., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, pp. 1526-1537, 2002). 알파-글로빈 mRNA의 3'-UTR은 이의 존재가 인비트로(in vitro)에 mRNA 안정성과 연관된, 특정한 리보뉴클레오단백질-복합체, 알파-콤플렉스의 형성에 명백하게 포함된다(Wang et al., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular biology, Vol 19, No. 7, July 1999, p. 4552-4560).

흥미로운 조절 기능은 리보좀 단백질 mRNA 내 UTR에 대하여 추가적으로 입증되었다: 반면 리보좀 단백질 mRNA의 5'-UTR은 mRNA의 성장과 관련된 번역을 조절하며, 그러한 조절의 엄격성은 리보좀 단백질 mRNA 내 각각의 3'-UTR에 의해 주어진다(Ledda et al., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, Vol. 344, 2005, p. 213-220). 이러한 메커니즘은 일정한 방식으로 전형적으로 전사되는 리보좀 단백질의 특정한 발현 패턴에 기여하며, 리보좀 단백질 S9 또는 리보좀 단백질 L32와 같은 일부 리보좀 단백질 mRNA는 하우스키핑 유전자로 고려된다(Janovick-Guretzky et al., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., Vol. 90, 2007, p. 2246-2252). 리보좀 단백질의 성장 관련된 발현 패턴은 따라서 주로 번역의 수준에 조절 때문이다.

mRNA 안정성에 영향을 주는 요소와 무관하게, 표적 세포 또는 조직에 의해 투여된 핵산 분자의 효과적인 번역은 유전자 치료 또는 유전자 백신 접종을 위한 핵산 분자를 사용하는 어느 접근 방법에 중요하다. 상기 언급된 실시예에서 볼 수 있듯이, 안정성의 조절에 따라 또한 주요 mRNA의 번역은 UTR, 5'-캡 및 3'-폴리(A) 테일과 같은 구조적 특징에 의해 조절된다. 이러한 맥락에서, 폴리(A) 테일의 길이는 전사 효율성을 위해서도 중요한 역할을 수행할 수 있는 것으로 보고되었다. 그러나, 3'-요소의 안정화는 또한 번역에 약화 효과를 가질 수 있다.

본 발명의 목적은 유전자 치료 및/또는 유전자 백신 접종에 적용하기에 적절할 수 있는, 핵산 분자를 제공하는 것이다. 특히, 본 발명의 목적은 번역 효율에 현저한 기능적 손실을 보이지 않는, 조기 분해 또는 붕괴(decay)에 대하여 안정한 mRNA 종을 제공하는 것이다. 또한, 본 발명의 목적은 상기 핵산 분자에 의해 코딩된 각각 단백질의 증가된 발현에 의해 특성화된, 인공 핵산 분자, 바람직하게 mRNA를 제공하는 것이다. 본 발명의 특정한 목적은 각 코딩된 단백질의 번역 효율이 향상된 mRNA를 제공하는 것이다. 본 발명의 다른 목적은 유전자 치료 및/또는 유전자 백신 접종에 잘 사용할 수 있는, 이러한 우수한 mRNA 종을 코딩하는 핵산 분자를 제공하는 것이다. 본 발명의 다른 목적은 유전자 치료 및/또는 유전자 백신 접종에 사용하기 위한 약학적 조성물을 제공하는 것이다. 요약하면, 본 발명의 목적은 비용 효율적이며, 간단한 방법에 의해 상기 개시된 선행 기술의 단점을 극복한 향상된 핵산 종을 제공하는 것이다.

본 발명의 기초가 되는 목적은 청구항의 대상에 의해 해결된다.

본 발명은 DARPA에 의해 수여된 협정 No. HR0011-11-3-0001에서 정부의 지원을 받아 완성되었다. 상기 정부는 본 발명에 특정한 권리를 갖는다.

명확성 및 가독성을 위해 하기 정의가 제공된다. 이들 정의에 대하여 개시된 어느 기술적 특징은 본 발명의 실시예 각각 및 모두에서 읽을 수 있다. 추가적인 정의 및 설명은 이들 실시예의 맥락에서 구체적으로 제공될 수 있다.

적응 면역 반응: 자가 면역 반응은 면역 시스템의 항원 특이적 반응으로 전형적으로 이해된다. 항원 특이성은 특이적 병원체 또는 병원체 감염된 세포에 맞춰진 반응의 발생을 허용한다. 이들 맞춰진 반응을 시작하는 능력은 “기억 세포”에 의해 체내에 보통 유지된다. 병원체가 인체를 한번 이상 감염해야 하고, 이들 특이적 기억 세포는 이를 빠르게 제거하는데 사용된다. 이러한 맥락에서, 적응 면역 반응의 첫번째 단계는 항원 제시 세포에 의한 항원 특이적 면역 반응을 유도할 수 있는 순수한 항원 특이적 T 세포 또는 다른 면역 세포의 활성화이다. 이는 순수한 T 세포가 지속적으로 지나는 림프 조직 및 기관 내에 발생한다. 항원 제시 세포로 제공될 수 있는 세가지 세포 타입은 수상돌기세포, 대식세포, 및 B 세포이다. 이들 세포의 각각은 면역 반응을 유도하는데 뚜렷한 기능을 갖는다. 수상 돌기세포는 그들이 성숙 수상돌기세포로 분화하는 곳에서 식균작용(phagocytosis) 및 대식세포작용(micropinocytosis)에 의해 항원을 흡수할 수 있고 예를 들어 국소 림프 조직에 외래 항원을 이동시킴과 함께 접촉에 의해 자극될 수 있다. 대식세포는 박테리아와 같은 입자 항원을 섭취하고 MHC 분자를 발현하는 감염성 항원 또는 다른 적절한 자극에 의해 유도된다. 그들의 수용체를 통해 용해성 단백질 항원을 결합 및 내재화(internalize)하는 B 세포의 특수한 능력은 T 세포를 유도하는데 또한 중요할 수 있다. MHC 분자는 전형적으로 T-세포에 항원의 존재에 책임을 진다. 그 안에, MHC 분자에 항원의 제시는 무장(armed) 주효 T 세포로 그들의 증식 및 분화를 유도하는 T 세포의 활성화를 유도한다. 주효 T 세포의 가장 중요한 기능은 함께 세포-매개 면역을 일으키는 CD8+ 세포독성 T 세포에 의한 감염된 세포의 사멸 및 Th1 세포에 의한 대식세포의 활성화, 및 그에 따라 체액성 면역 반응을 일으키는, 다른 종류의 항체를 생산하는 Th2 및 Th1 모두에 의한 B 세포의 활성화이다. T 세포는 항원을 직접적으로 인식 및 결합하지 못하는 그들의 T 세포 수용체에 의한 항원을 인식하지만, 그러나 대신 다른 세포의 표면에 MHC 분자에 결합하는, 예를 들어 병원체 유래 단백질 항원, 예를 들어 소위 에피토프(epitopes)의, 짧은 펩타이드 절편을 인식한다.

적응 면역 시스템: 적응 면역 시스템은 전형적으로 병원체 생장을 제거 또는 방해하는 데 필수적으로 헌신한다. 이는 전형적으로 특정한 병원체(면역성을 발생시키는)를 인식 및 기억하고, 병원균을 맞닥뜨릴 때마다 강한 공격을 시작하는 능력과 함께 척추동물 면역 시스템 제공에 의한 적응 면역 반응을 조절한다. 시스템은 체세포초돌연변이(somatic hypermutation)(가속된 체세포 돌연 변이의 과정), 및 V(D)J 재조합(항원 수용체 유전자 부분(segments)의 비가역적 유전적 재조합)에 의해 매우 적응할 수 있다. 이러한 메커니즘은 이후 각 개별적인 림프구에 독특하게 발현된 이후, 다른 항원 수용체의 방대한 수를 발생시키는 유전자의 소수를 허용한다. 유전자 재배열은 각 세포의 DNA에 비가역적 변화를 일으키기 때문에, 수명이 긴 특이적 면역에 대해 핵심(key)인 기억 B 세포 및 기억 T 세포를 포함하는, 그 세포의 자손(progeny)(후손(offspring)) 모두는 이후 동일한 수용체 특이성을 코딩하는 유전자를 상속할 것이다.

어쥬번트 / 어쥬번트 성분(component): 넓은 의미의 어쥬번트 또는 어쥬번트 성분은 전형적으로 약물 또는 백신과 같은, 다른 제제의 효과를 변형, 예를 들어 강화할 수 있는 약학적 및/또는 면역학적 제제이다. 이는 넓은 의미로 해석되고 물질의 넓은 범위를 나타낸다. 전형적으로, 이들 물질은 항원의 면역성을 증가시킬 수 있다. 예를 들어, 어쥬번트는 선천적 면역 시스템에 의해 인식될 수 있으며, 예를 들어 선천적 면역 반응을 유도할 수 있다. “어쥬번트”는 전형적으로 적응 면역 반응을 유도하지 않는다. 이러한 한도에서는(insofar), “어쥬번트”가 항원으로써 자격을 갖지 않는다. 그들의 행동 방식은 적응 면역 반응을 초래하는 항원에 의해 시작되는 효과로부터 명백하다.

항원: 본 발명의 맥락에서 “항원”은 전형적으로 면역 시스템에 의해, 바람직하게는 적응 면역 시스템에 의해 인지될 수 있고 항원 특이적 면역 반응을, 예를 들어 적응 면역 반응의 일부로써 항체 및/또는 항원 특이적 T 세포의 형성에 의해 시작할 수 있는 물질을 말한다. 전형적으로, 항원은 T-세포에 MHC에 의해 나타날 수 있는 펩타이드 또는 단백질이거나 이를 포함할 수 있다. 본 발명에 있어서 항원은 제공된 핵산 분자, 바람직하게 본 발명에 정의된 mRNA의 번역된 생산물일 수 있다. 이러한 맥락에서, 또한 펩타이드의 절편, 변이체 및 유도체 적어도 하나의 에피토프를 포함하는 단백질은 항원으로 이해된다. 본 발명의 맥락에서, 본 발명에 정의된 종양 항원 및 병원체 항원이 특히 바람직하다.

인공 핵산 분자: 인공 핵산 분자는 전형적으로 핵산 분자, 예를 들어 자연 발생하지 않는 DNA 또는 RNA로 이해될 수 있다. 다시 말해서, 인공 핵산 분자는 비천연 핵산 분자로 이해될 수 있다. 이러한 핵산 분자는 이의 개별 서열(자연적으로 발생하지 않는) 때문에 및/또는 다른 변형, 예를 들어 자연적으로 발생하지 않는 뉴클레오타이드의 구조적 변형 때문에 비-천연적일 수 있다. 인공 핵산 분자는 DNA 분자, RNA 분자 또는 DNA 및 RNA 부분을 포함하는 하이브리드 분자일 수 있다. 전형적으로, 인공 핵산 분자는 뉴클레오타이드의 원하는 인공 서열(이종(heterologous) 서열)에 대응하는 유전자 조작 방법에 의해 계획되거나/또는 발생될 수 있다. 이러한 맥락에서 인공 서열은 보통 자연적으로 발생하지 않는, 즉 적어도 하나의 뉴클레오타이드에 의해 야생형 서열과 다른 서열이다. 용어 '야생형'은 자연에서 발생하는 서열로서 이해될 수 있다. 나아가, 용어 '인공 핵산 분자'는 '하나의 단일 분자'를 의미하는 것으로 제한되지 않으며, 전형적으로 동일한 분자의 총체(ensemble)를 포함하는 것으로 이해된다. 따라서, 이는 표본(aliquot)에 포함되는 동일한 분자의 다수에 관련될 수 있다.

바이시스트로닉 RNA, 멀티시스트로닉 RNA: 바이시스트로닉 또는 멀티시스트로닉 RNA는 전형적으로 둘 (바이시스트로닉) 또는 그 이상의 (멀티시스트로닉) 오픈 리딩 프레임(ORF)를 가질 수 있는 전형적으로 RNA, 바람직하게는 mRNA이다. 이러한 맥락에서 오픈 리딩 프레임은 펩타이드 또는 단백질로 번역될 수 있는 코돈의 서열이다.

담체 / 폴리머 담체 : 본 발명의 맥락에서 담체는 전형적으로 다른 화합물(화물)의 수송 및/또는 복합화를 용이하게 하는 화합물일 수 있다. 폴리머 담체는 전형적으로 폴리머의 형성된 담체이다. 담체는 공유 또는 비공유 상호작용에 의해 이의 화물에 관련될 수 있다. 담체는 표적 세포에 핵산, 예를 들어 RNA 또는 DNA를 수송할 수 있다. 담체는 - 일부 실시예에서 - 양이온성 성분일 수 있다.

양이온성 성분: 용어 "양이온성 성분"은 전형적으로 전하를 띤 분자를 말하며, 이는 약 전형적으로 1 내지 9의 pH 값에, 바람직하게는 또는 9 미만(예를 들어 5 내지 9)의, 또는 8 미만(예를 들어 5 내지8)의, 또는 7미만(예를 들어 5 내지 7)의, 가장 바람직하게는 예를 들어 약 7.3 내지 7.4 생리학적 pH 값에 양전하를(양이온) 띤다. 따라서, 양이온성 성분은 어느 양전하를 띤 화합물 또는 폴리머, 바람직하게는 생리학적 조건 하에서, 특히 체내 생리학적 조건 하에서 양전하를 띤, 양이온성 펩타이드 또는 단백질일 수 있다. "양이온성 펩타이드 또는 단백질"은 적어도 하나의 양전하를 띤 아미노산 또는 하나 이상의 양전하를 띤 아미노산, 예를 들어 Arg, His, Lys 또는 Orn으로부터 선택된 것을 포함할 수 있다. 따라서 '다중양이온성' 성분은 또한 주어진 조건 하에서 하나 이상의 양전하를 보이는 범위 내이다.

5'-캡: 5'-캡은 일반적으로 성숙 mRNA의 5'-말단을 "덮는(caps)" 독립체, 전형적으로 변형된 뉴클레오티드 독립체이다. 5'-캡은 전형적으로 변형된 뉴클레오티드에 의해, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게는, 5'-캡은 5'-5'-삼인산염 연결을 통해 5'-말단에 연결된다. 5'-캡은 메틸화될수 있으며, 예를 들어 m7GpppN, 상기 N은 5'-캡을 수송하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 RNA의 5'-말단이다. 5'캡 구조의 추가적 예시는 글리세릴, 역 디옥시 비염기 잔기(inverted deoxy abasic residue)(일부), 4',5' 메틸렌 뉴클레오타이드, 1-(베타-D-에리쓰로푸라노실) 뉴클레오타이드, 4'-티오 뉴클레오타이드, 카르보사이클릭 뉴클레오타이드, 1,5-무수헥시톨 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형된 염기 뉴클레오티드, 트레오-펜토푸라노실 뉴클레오티드, 비환식(acyclic) 3',4'-세코 뉴클레오티드, 비환식 3,4-디하이드록시부틸 뉴클레오티드, 비환식 3,5 디하이드록시펜틸 뉴클레오티드, 3'-3'-역 뉴클레오티드 일부, 3'-3'-역 비염기 일부, 3'-2'-역 뉴클레오티드 일부, 3'-2'-역 비염기 일부, 1,4-부탄디올 포스페이트, 3'-포스포라미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'포스포로티오에이트, 포스포로디티오에이트, 또는 브릿징(bridging) 또는 논-브릿징 메틸포스포네이트 일부를 포함한다.

세포성 면역/세포성 면역 반응: 세포성 면역은 전형적으로 대식세포, 자연 살생 세포(NK), 항원 특이적 세포독성 T-림프구의 활성화, 및 항원에 반응하여 다양한 사이토카인의 방출에 관련된다. 더 일반적인 용어에서, 세포성 면역은 항체가 아닌 면역 시스템의 세포의 활성화에 기초한다. 전형적으로 세포성 면역 반응은 예를 들어 세포, 예를 들어 그들의 표면에 외래 항원의 에피토프를 보이는 수지상 세포(dendritic cells) 또는 다른 세포와 같은 특이적 면역 세포에 세포자멸을 유도할 수 있는 항원 특이적 세포독성 T-림프구의 활성화에 의해 특성화될 수 있다. 이러한 세포는 바이러스 감염되거나 세포내 박테리아에 의해 감염된 것일 수 있으며, 또는 종양 항원을 제시하는 암 세포이다. 추가적인 특징들은 그들이 병원체를 파괴하게 하는 대식세포 및 자연 살생 세포의 활성화 및 적응 면역 반응 및 선천적 면역 반응에 포함된 다른 세포의 기능에 영향을 주는 다양한 사이토카인을 방출하는 세포의 자극일 수 있다.

DNA: DNA는 디옥시-리보핵-산(deoxy-ribonucleic-acid)에 대한 일반적인 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 폴리머이다. 이들 뉴클레오티드는 보통 디옥시-아데노신-모노포스페이트, 디옥시-티미딘-모노포스페이트, 디옥시-구아노신-모노포스페이트 및 디옥시-시티딘-모노포스페이트 모노머이며, 이들은 - 그들 자신에 의해 - 당 일부(디옥시리보스), 염기 일부 및 포스페이트 일부로 이루어지고, 특유의 백본(backbone) 구조에 의해 중합한다. 백본 구조는 전형적으로 첫째 뉴클레오티드의 당 일부, 즉 디옥시리보스 및 둘째 포스페이트 일부, 인접한 모노머 사이의포스포디에스터 결합에 의해 형성된다. 모노머의 특정한 순서, 즉 당/포스페이트 백본에 연결된 염기들의 순서는 DNA 서열로 불린다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 형태에서 첫번째 가닥의 뉴클레오티드는 전형적으로 두번째 가닥의 뉴클레오티드와 혼성화하며, 예를 들어 A/T 염기쌍 및 G/C 염기쌍에 의한다.

에피토프 (Epitope): 에피토프(소위 "항원 결정요인")는 T 세포 에피토프 및 B 세포 에피토프로 구별될 수 있다. 본 발명의 맥락에서 T 세포 에피토프 또는 단백질의 일부는 바람직하게는 약 6 내지 약 20의 길이 또는 그 이상의 아미노산을 갖는, 예를 들어 MHC 클래스 I 분자에 의해 가공되고 나타나는 절편, 바람직하게는 약 8 내지 약 10 아미노산의 길이, 예를 들어 8, 9, 또는 10, (또는 11, 또는 12 아미노산)의 길이를 갖는, 또는 MHC 클래스 II 분자에 의해 가공되고 나타나는 절편, 바람직하게는 약 13 또는 그 이상의 아미노산, 예를 들어 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상의 아미노산의 길이를 갖는 절편을 포함할 수 있으며, 상기 이들 절편은 아미노산 서열의 어느 일부로부터 선택될 수 있다. 이들 절편은 전형적으로 펩타이드 절편 및 MHC 분자로 이루어진 복합체의 형태인 T 세포에 의해 인식될 수 있으며, 즉 절편은 전형적으로 그들의 자연 형태로 인식되지 않는다. B 세포 에피토프는 전형적으로 바람직하게는 5 내지 15 아미노산을 갖는, 더욱 바람직하게는 5 내지 12 아미노산을 갖는, 더욱 더 바람직하게는 6 내지 9 아미노산을 갖는, 항체에 의해 인식될 수 있는, 즉 그들의 천연 형태로 본 발명에 정의된 (천연) 단백질 또는 펩타이드 항원의 외부 표면에 위치한다.

단백질 또는 펩타이드의 이러한 에피토프는 나아가 본 발명에 언급된 이러한 단백질 또는 펩타이드의 어느 변이체로부터 선택될 수 있다. 이러한 맥락에서 항원 결정요인은 본 발명에 정의된 단백질 또는 펩타이드의 아미노산 서열 내 불연속적이나 삼차원 구조 또는 단일 폴리펩타이드 사슬로 이루어진 연속적 또는 선형의 에피토프로 합쳐진 본 발명에 정의된 단백질 또는 펩타이드의 부분으로 이루어진 형태적(conformational)이거나 불연속적(discontinuous)인 에피토프일 수 있다.

서열의 절편: 서열의 절편은 전형적으로 예를 들어 핵산 분자 또는 아미노산 서열의 전장(full length) 서열의 짧은 일부일 수 있다. 따라서 절편은 전형적으로 전장 서열 내 상응하는 스트레치와 동일한 서열로 이루어진다. 본 발명의 맥락에서 바람직한 서열의 절편은, 절편이 유도된 것으로부터 총(즉 전장) 분자의 적어도 5%, 10%, 20%, 바람직하게는 적어도 30%, 더욱 바람직하게는 적어도 40%, 더욱 바람직하게는 적어도 50%, 더욱 더 바람직하게는 적어도 60%, 더욱 더 바람직하게는 적어도 70%, 가장 바람직하게는 적어도 80%를 나타내는, 절편이 유도된 분자 내 독립체의 연속적인 스트레치에 상응하는 뉴클레오티드 또는 아미노산과 같은 연속적인 독립체의 스트레치로 이루어진다.

G/C 변형(modified): G/C 변형된 핵산은 전형적으로 야생형 서열에 비해 구아노신 및/또는 시토신의 바람직하게 증가된 수를 포함하는 변형된 야생형 서열에 기초하는 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자일 수 있다. 이러한 증가된 수는 구아노신 또는 시토신 뉴클레오티드를 포함하는 코돈에 의해 아데노신 또는 티미딘 뉴클레오티드를 포함하는 코돈의 치환에 의해 발생될 수 있다. 증가된 G/C 함량이 DNA 또는 RNA의 코딩 영역에 발생하는 경우, 이는 유전적 코드의 축퇴(degeneracy)의 사용을 만든다. 따라서 코돈 치환은 바람직하게는 코딩된 아미노산 잔기를 변화시키지 않으나, 핵산 분자의 G/C 함량을 독점적으로 증가시킨다.

유전자 치료: 유전자 치료는 전형적으로 환자 신체의 치료 또는 환자 신체의 분리된 요소, 예를 들어 분리된 조직/세포, 펩타이드 또는 단백질을 코딩하는 핵산에 의한 것을 의미하는 것으로 이해될 수 있다. 이는 전형적으로 a) 환자에게 직접적으로 - 어떠한 투여 경로를 통해서 - 또는 인비보(in vivo)/엑스비보(ex vivo) 또는 인비트로(in vitro) 환자의 세포의 형질전환을 초래하는, 환자의 분리된 세포/조직에 인비트로에서 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자를 투여; b) 투여된 핵산 분자의 전사 및/또는 번역; 및 선택적으로 c) 만약 핵산이 환자에게 직접 투여되지 않은 경우, 환자에게 분리된, 형질전환된 세포를 재투여하는 단계의 적어도 하나를 포함할 수 있다.

유전자 백신 접종: 유전자 백신 접종은 전형적으로 항원 또는 면역원 또는 이의 절편을 코딩하는 핵산 분자의 투여에 의해 백신 접종되는 것으로 이해된다. 핵산 분자는 개체의 신체 또는 개체의 분리된 세포에 투여될 수 있다. 신체의 특정한 세포의 형질전환 또는 분리된 세포의 형질전환에, 항원 또는 면역원은 이들 세포에 의해 나타날 수 있고 그 뒤에 면역 시스템, 적응을 유도하는, 즉 항원 특이적 면역 반응에 나타난다. 따라서, 유전자 백신 접종은 전형적으로 a) 개체, 바람직하게는 환자에, 또는 인비보 또는 인비트로에서 개체의 세포의 형질전환을 보통 초래하는 개체, 바람직하게는 환자의 분리된 세포에, 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자의 투여; b) 투여된 핵산 분자의 전사 및/또는 번역; 및 선택적으로 c) 만약 핵산이 환자에 직접 투여되지 않았다면 개체, 바람직하게는 환자에 분리된 형질전환된 세포의 재투여하는 단계의 적어도 하나를 포함한다.

이종 서열: 두 서열은 만약 그들이 동일한 유전자로부터 유도되지 않았다면 전형적으로 '이종'인 것으로 이해된다. 즉, 비록 이종 서열이 동일한 유기체로부터 유도될 수 있어도, 그들은 자연적으로(자연에서) 동일한 mRNA에서와 같이, 동일한 핵산 분자로 발생하지 않는다.

체액성 면역/ 체액성 면역 반응: 체액성 면역은 전형적으로 항체 생산 및 선택적으로 항체 생산을 동반하는 부가적 과정을 말한다. 체액성 면역 반응은 예를 들어 Th2 활성화 및 사이토카인 생산, 배중심(germinal center) 형성 및 동형(isotype) 전환, 친화도 성숙 및 기억 세포 발생에 의해, 전형적으로 특성화될 수 있다. 체액성 면역은 또한 병원체 및 독소 중성화, 고전적 보체 활성화, 및 식균 작용 및 병원체 제거의 옵소닌 촉진을 포함하는 전형적으로 항체의 주효 기능을 나타낼 수 있다.

면역원: 본 발명의 맥락에서 면역원은 면역 반응을 촉진할 수 있는 화합물로 전형적으로 이해된다. 바람직하게는 면역원은 펩타이드, 폴리펩타이드, 또는 단백질이다. 특히 바람직한 실시예에서, 본 발명의 의미의 면역원은 제공된 핵산 분자, 바람직하게는 본 발명에 정의된 인공 핵산 분자의 번역의 생산물이다. 전형적으로 면역원은 적어도 적응 면역 반응을 유도한다.

면역자극성 구성요소: 본 발명의 맥락에서, 면역자극성 구성요소는 전형적으로 면역 반응을 유도할 수 있는 또는 면역 반응을 유도할 수 있는 성분이 유도될 수 있는 것으로부터 적어도 하나의 성분을 포함하는 구성요소로 이해된다. 이러한 면역 반응은 바람직하게는 선천적 면역 반응 또는 적응 및 선천적 면역 반응의 조합일 수 있다. 바람직하게는 본 발명의 맥락에서 면역자극성 구성요소는 적어도 하나의 인공 핵산 분자, 더욱 바람직하게는 RNA, 예를 들어 mRNA 분자를 포함한다. mRNA와 같은 면역자극성 구성요소는 적절한 담체와 함께 복합체화될 수 있다. 따라서 면역자극성 구성요소는 mRNA/담체 복합체를 포함할 수 있다. 나아가, 면역자극성 구성요소는 어쥬번트 및/또는 mRNA와 같은 면역자극성 구성요소에 적절한 수송체를 포함할 수 있다.

면역 반응: 면역 반응은 전형적으로 특정한 항원에 적응 면역 시스템의 특이적 반응(소위 특이적 또는 적응 면역 반응) 또는 선천적 면역 시스템의 비특이적 반응(소위 비특이적 또는 선천적 면역 반응), 또는 이들의 조합일 수 있다.

면역 시스템: 면역 시스템은 감염으로부터 유기체를 보호할 수 있다. 만약 병원체가 유기체의 물리적 장벽을 통과하는데 성공하여 이러한 유기체에 침입한다면, 선천적 면역 시스템은 즉시, 단 비 특이적인 반응을 제공한다. 만약 병원체가 선천적 반응을 피한다면, 척추동물은 두번째 방어층, 적응 면역 시스템을 갖는다. 여기에 면역 시스템은 병원체에 대한 이의 인식을 증가시키기 위해 감염 동안 이의 반응을 조정한다. 증가된 반응은 이후 면역학적 기억의 형태로 병원체가 제거된 다음에도 유지되며, 적응 면역 시스템을 보다 빠르게 시작하고 이 병원체를 맞닥뜨릴때마다 보다 강하게 공격하도록 허용한다. 이에 따르면, 면역 시스템은 선천적 및 적응 면역 시스템을 포함한다. 이들 두 파트의 각각은 전형적으로 소위 체액성 및 세포성 성분을 포함한다.

면역자극성 RNA: 본 발명의 맥락에서 면역자극성 RNA(isRNA)는 전형적으로 선천적 면역 반응을 유도할 수 있는 RNA일 수 있다. 이는 일반적으로 오픈 리딩 프레임을 갖지 않으며 따라서 펩타이드 항원 또는 면역원을 제공하지 않으나 예를 들어 톨(Toll) 유사 수용체(TLR) 또는 다른 적절한 수용체의 특정한 종류에 결합에 의한 면역 반응을 촉진한다. 그러나 물론 또한 오픈 리딩 프레임을 가지며 펩타이드/단백질을 코딩하는 mRNAs는 선천적 면역 반응을 유도할 수 있으며, 따라서 면역자극성 RNAs일 수 있다.

선천적 면역 반응: 선천적 면역 반응, 또한 비특이적(또는 불특정(unspecific)) 면역 시스템으로 알려진 것은 전형적으로 세포 및 비특이적 조건에서 다른 유기체에 의한 감염으로부터 숙주를 방어하는 메커니즘을 포함한다. 이는 선천적 면역 시스템의 세포는 일반적인 방법으로 병원체를 인식 및 반응하지만, 적응 면역 시스템과는 다르게 숙주에 오래 지속되거나 방어적 면역을 부여하지 않는 것을 의미한다. 선천적 면역 시스템은 예를 들어 Toll-유사 수용체(TLRs)의 리간드 또는 리포폴리다당류(lipopolysaccharides), TNF-알파, CD40 리간드, 또는 사이토카인, 모노카인(monokines), 림포카인(lymphokines), 인터루킨(interleukins) 또는 케모카인(chemokines), IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-알파, IFN-베타, IFN-감마, GM-CSF, G-CSF, M-CSF, LT-베타, TNF-알파, 성장 인자, 및 hGH와 같은 다른 보조(auxiliary) 물질, 인간 Toll-유사 수용체 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10의 리간드, 쥣과(murine) Toll-유사 수용체 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 또는 TLR13의 리간드, NOD-유사 수용체의 리간드, RIG-I 유사 수용체의 리간드, 면역자극성 핵산, 면역자극성 RNA(isRNA), CpG-DNA, 항생제, 또는 항바이러스제에 의해 활성화될 수 있다. 본 발명에 따르는 약학적 조성물은 하나 또는 그 이상의 이러한 물질을 포함할 수 있다. 전형적으로 선천적 면역 시스템의 반응은 사이토카인으로 불리는 특수한 화학 조절자를 포함하는, 화학적 인자의 생산을 통해, 감염의 부위에 면역 세포를 모으는 것(recruiting); 보체 연쇄(cascade)의 활성화; 특수한 백혈구 세포에 의해 기관, 조직, 혈액 및 림프 내에 존재하는 외래 물질의 선별 및 제거; 적응 면역 시스템의 활성화; 및/또는 감염성 제제에 물리적 및 화학적 장벽으로 행동을 포함한다.

클로닝 부위: 클로닝 부위는 전형적으로 핵산 서열, 예를 들어 오픈 리딩 프레임을 포함하는 핵산 서열의 삽입에 적절한 핵산 분자의 일부로 이해된다. 삽입은 본 발명이 속하는 기술분야에서 통상의 기술자에게 알려진 어느 분자 생물학적 방법을 통해, 예를 들어 제한(restriction) 및 결찰(ligation)에 의해 수행될 수 있다. 클로닝 부위는 전형적으로 하나 또는 그 이상의 제한 효소 인식 부위(제한 부위)를 포함한다. 이들 하나 또는 그 이상의 제한 부위는 이들 부위에 DNA를 쪼개는 제한 효소에 의해 인식될 수 있다. 하나 이상의 제한 부위를 포함하는 클로닝 부위는 또한 멀티플 클로닝 부위(MCS) 또는 폴리링커(polylinker)로 불릴 수 있다.

핵산 분자: 핵산 분자는 바람직하게는 핵산 성분을 포함하는, 바람직하게는 이로 이루어진 분자이다. 용어 핵산 분자는 바람직하게는 DNA 또는 RNA 분자를 말한다. 이는 바람직하게는 용어 “폴리뉴클레오티드”와 동의어로 사용된다. 바람직하게는 핵산 분자는 당/인산 백본의 포스포디에스터 결합에 의해 서로 공유결합된 뉴클레이티드 모노머를 포함 또는 이로 이루어진 폴리머이다. 용어 “핵산 분자”는 또한 염기 변형된, 당 변형된 또는 백본 변형된 등의 DNA 또는 RNA 분자와 같은, 변형된 핵산 분자를 포함한다.

오픈 리딩 프레임: 본 발명의 맥락에서 오픈 리딩 프레임(ORF)는 전형적으로 펩타이드 또는 단백질로 번역될 수 있는 몇몇 뉴클레오티드 트리플렛(triplets)의 서열일 수 있다. 오픈 리딩 프레임은 바람직하게는 시작 코돈, 즉 이의 5'-말단에 아미노산 메티오닌(ATG)을 일반적으로 코딩하는 세개의 후속 뉴클레오티드의 조합 및 보통 3 뉴클레오티드의 배수인 길이를 보이는 후속 영역을 포함한다. ORF는 바람직하게는 정지 코돈(예를 들어 TAA, TAG, TGA)에 의해 종결된다. 전형적으로 이는 오픈 리딩 프레임의 유일한 정지 코돈이다. 따라서 본 발명의 맥락에서 오픈 리딩 프레임은 바람직하게는 시작 코돈(예를 들어 ATG)로 시작하고 바람직하게는 정지 코돈(예를 들어 TAA, TGA, 또는 TAG)으로 종결되는, 세개로 나뉠 수 있는 뉴클레오티드의 수로 이루어진 뉴클레오티드 서열이다. 오픈 리딩 프레임은 분리 또는 보다 긴 핵산 서열, 예를 들어 벡터 또는 mRNA에 병합될 수 있다. 오픈 리딩 프레임은 또한 "단백질 코딩 영역"으로 불릴 수 있다.

펩타이드 : 펩타이드 또는 폴리펩타이드는 전형적으로 펩타이드 결합으로 연결된 아미노산 모노머의 폴리머이다. 이는 전형적으로 50 모노머 단위 미만을 포함한다. 그럼에도 불구하고, 용어 펩타이드는 50 모노머 단위 이상을 갖는 분자를 제외하는 것은 아니다. 긴 펩타이드는 또한 전형적으로 50 및 600 모노머 단위 사이를 갖는 폴리펩타이드로 불린다.

약학적으로 유효한 량: 본 발명의 맥락에서 약학적으로 유효한 량은 전형적으로 면역 반응, 발현된 펩타이드 또는 단백질의 병리학적 수준을 변화, 또는 부족한 유전자 생산물의 치환, 예를 들어 병리학적 상황의 경우와 같이 약학적인 효과를 유도하기에 충분한 양으로 이해된다.

단백질 단백질은 전형적으로 하나 또는 그 이상의 펩타이드 또는 폴리펩타이드를 포함한다. 단백질은 전형적으로 단백질이 이의 생물학적 기능을 행사하는데 필요할 수 있는, 3차원 형태로 접힌다.

폴리 (A) 서열: 폴리(A) 서열, 소위 폴리(A) 꼬리 또는 3'-폴리(A) 꼬리는 전형적으로 아데노신 뉴클레오티드, 예를 들어 약 400 아데노신 뉴클레오티드에 이르는, 예를 들어 약 25 내지 약 400, 바람직하게는 약 50 내지 약 400, 더욱 바람직하게는 약 50 내지 약 300, 더욱 더 바람직하게는 약 50 내지 약 250, 가장 바람직하게는 약 60 내지 약 250 아데노신 뉴클레오티드의 서열로 이해된다. 폴리(A) 서열은 전형적으로 mRNA의 3'말단에 위치한다. 본 발명의 맥락에서, 폴리(A) 서열은 예를 들어 벡터 내, 예를 들어 RNA, 바람직하게는 mRNA의 발생, 예를 들어 벡터의 전사에 의한 것을 위해 주형(template)으로서 제공하는, 벡터 내와 같이, mRNA 또는 어느 다른 핵산 분자 내에 위치할 수 있다.

폴리아데닐화: 폴리아데닐화는 전형적으로 RNA 분자와 같은 핵산 분자에, 예를 들어 조숙 mRNA에 폴리(A)서열의 첨가로 이해된다. 폴리아데닐화는 소위 폴리아데닐화 신호에 의해 유도될 수 있다. 이러한 신호는 바람직하게는 폴리아데닐화되는 RNA 분자와 같은 핵산 분자의 3'-말단에 뉴클레오티드의 스트레치 내에 위치한다. 폴리아데닐화 신호는 전형적으로 아데닌 또는 우라실/티민 뉴클레오티드, 바람직하게는 헥사머 서열 AAUAAA로 이루어진 헥사머를 포함한다. 다른 서열, 바람직하게는 헥사머 서열은 또한 생각될 수 있다. 폴리아데닐화는 전형적으로 Pre-mRNA(소위 조숙-mRNA)의 가공 중에 발생한다. 전형적으로 RNA 성숙(pre-mRNA로부터 성숙 mRNA로)은 폴리아데닐화 단계를 포함한다.

제한 부위: 제한 부위는, 또한 '제한 효소 인식 부위'로 불림, 제한 효소에 의해 인식되는 뉴클레오티드 서열이다. 제한 부위는 전형적으로 짧은, 바람직하게는 회문식(palindromic) 뉴클레오티드 서열, 예를 들어 4 내지 8 뉴클레오티드를 포함하는 서열이다. 제한 부위는 바람직하게는 제한 효소에 의해 특이적으로 인식된다. 제한 효소는 전형적으로 이러한 부위에 제한 부위를 포함하는 뉴클레오티드 서열을 쪼갠다. 이중 나선 DNA 서열과 같은 이중 가닥 뉴클레오티드 서열에서, 제한 효소는 전형적으로 뉴클레오티드 서열의 양쪽 가닥 모두를 절단한다.

RNA, mRNA: RNA는 보통 리보핵산의 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 폴리머이다. 이들 뉴클레오티드는 보통 소위 백본을 통해 서로 연결된 아데노신-모노포스페이트, 우리딘-모노포스페이트, 구아노신-모노포스페이트 및 시티딘 모노포스페이트 모노머이다. 백본은 첫번째로 당, 즉 리보스 및 두번째로 인접 모노머, 포스페이트 일부 사이의 포스포디에스터 결합에 의해 형성된다. 모노머들의 특이적인 연속은 RNA 서열로 불린다. 보통 RNA는 DNA 서열의 전사에 의해, 예를 들어 세포 내에서 얻어질 수 있다. 진핵 세포에서, 전사는 전형적으로 핵 또는 미토콘드리아 내에서 수행된다. 체내에서, DNA의 전사는 보통 보통 mRNA로 축약되는, 소위 메신저 RNA로 가공되는 소위 조숙 RNA를 초래한다. 예를 들어 진핵 유기체 내에서 조숙 RNA의 가공은 스플라이싱, 5'-캡핑, 폴리아데닐화, 핵 또는 미토콘드리아 및 그와 유사한 것으로부터 배출과 같은 다른 다양한 전사후 변형을 포함한다. 이들 가공의 합은 소위 RNA의 성숙이다. 성숙 메신저 RNA는 보통 특정한 펩타이드 또는 단백질의 아미노산 서열로 번역될 수 있는 뉴클레오티드 서열을 제공한다. 전형적으로, 성숙 mRNA는 5'-캡, 5'UTR, 오픈 리딩 프레임, 3'UTR 및 폴리(A) 서열을 포함한다. 메신저 RNA를 제외하고, 전사 및/또는 번역의 조절에 포함될 수 있는 RNA의 몇몇 비코딩 형태가 존재한다.

핵산 분자의 서열: 핵산 분자의 서열은 전형적으로 특정하고 개별적인 순서, 즉 이의 뉴클레오티드의 연속으로 이해된다. 단백질 또는 펩타이드의 서열은 전형적으로 순서, 즉 이의 아미노산의 연속으로 이해된다.

서열 상동성 (identity): 만약 그들이 뉴클레오티드 또는 아미노산의 동일한 길이 및 순서를 보이는 경우, 둘 또는 그 이상의 서열이 동일한 것이다. 상동성의 백분율은 전형적으로 두 서열이 동일한 정도를 설명, 즉 이는 전형적으로 참조-서열의 동일한 뉴클레오티드와 그들 서열 위치가 일치하는 뉴클레오티드의 백분율을 설명한다. 상동성의 정도를 결정하기 위해, 비교되는 서열은 동일한 길이, 즉 비교되는 서열의 가장 긴 서열의 길이를 보이는 것으로 여겨진다. 이는 8 뉴클레오티드로 이루어지는 첫번째 서열은 첫번째 서열을 포함하는 10 뉴클레오티드로 이루어진 두번째 서열과 80% 동일한 것을 의미한다. 다시 말해서, 본 발명의 맥락에서, 서열의 상동성은 바람직하게는 동일한 길이를 갖는 둘 또는 그 이상의 서열 내 동일한 위치를 갖는 서열의 뉴클레오티드의 백분율과 관련된다. 갭은 보통 정렬 내 그들의 실제 위치와 관계 없이 비상동(non-identical) 위치로 간주된다.

안정화된 핵산 분자: 안정화된 핵산 분자는 변형이 없는 핵산 분자에 비해, 엑소- 또는 엔도뉴클레아제 분해(degradation)에 의한 것처럼 예를 들어 환경적 인자 또는 효소적 소화에 의한 붕괴(disintegration) 또는 분해(degradation)에 더욱 안정하게 변화된 핵산 분자, 바람직하게는 DNA 또는 RNA 분자이다. 바람직하게는 본 발명의 맥락에서 안정화된 핵산 분자는 원핵 또는 진핵 세포와 같은 세포, 바람직하게는 인간 세포와 같은 포유동물 세포 내에 안정된다. 안정화 효과는 또한 세포의 외부, 예를 들어 버퍼 용액 내 등, 예를 들어 안정화된 핵산 분자를 포함하는 약학적 조성물의 제조 과정에 영향을 줄 수 있다.

형질전환: 용어 "형질전환"은 DNA 또는 RNA(예를 들어 mRNA) 분자와 같은 핵산 분자의 세포 내, 바람직하게는 진핵 세포 내에 도입을 말한다. 본 발명의 맥락에서, 용어 "형질전환"은 세포 내로, 바람직하게는 포유동물 세포 내와 같이 진핵 세포 내로 핵산 분자를 도입하기 위한 통상의 기술자에게 알려진 어느 방법을 포함한다. 이러한 방법은 예를 들어 전기천공, 예를 들어 양이온성 지질 및/또는 리포좀에 기초한 리포펙션(lipofection), 칼슘 포스페이트 침전, 나노입자 기초의 형질전환, 바이러스 기초의 형질전환, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머 기초의 형질전환을 포함한다. 바람직하게는 도입은 비-바이러스성이다.

백신: 백신은 전형적으로 적어도 하나의 항원, 바람직하게는 면역원을 제공하는 예방 또는 치료적 물질로 이해된다. 항원 또는 면역원은 백신 접종에 적합한 어느 물질로부터 유래될(derived) 수 있다. 예를 들어, 항원 또는 면역원은 박테리아 또는 바이러스 입자 등으로부터 또는 종양 또는 암 조직으로부터와 같은 병원체로부터 유래될 수 있다. 항원 또는 면역원은 적응 면역 반응을 제공하는 몸의 적응 면역 시스템을 자극한다.

벡터: 용어 "벡터"는 핵산 분자, 바람직하게는 인공 핵산 분자를 말한다. 본 발명의 맥락에서 벡터는 오픈 리딩 프레임을 포함하는 핵산 서열과 같은, 원하는 핵산 서열을 합체 또는 보유하는데 적합하다. 이러한 벡터는 저장 벡터, 발현 벡터, 클로닝 벡터, 수송 벡터 등일 수 있다. 저장 벡터는 핵산 분자, 예를 들어 mRNA 분자의 간편한 저장을 허용하는 벡터이다. 따라서 벡터는 예를 들어 오픈 리딩 프레임 및 mRNA의 3'UTR에 상응하는 서열과 같이, 원하는 mRNA 서열 또는 이의 일부에 상응하는 서열을 포함할 수 있다. 발현 벡터는 RNA, 예를 들어 mRNA, 또는 펩타이드, 폴리펩타이드 또는 단백질과 같은 발현 생산물의 생산에 사용될 수 있다. 예를 들어 발현 벡터는 프로모터 서열, 예를 들어 RNA 폴리머라제 프로모터 서열과 같은 벡터의 서열 스트레치의 전사에 필요한 서열을 포함할 수 있다. 클로닝 벡터는 전형적으로 벡터 내로 핵산 서열을 합체하는데 사용될 수 있는 클로닝 부위를 포함하는 벡터이다. 클로닝 벡터는 예를 들어 플라스미드 벡터 또는 박테리오파지 벡터일 수 있다. 수송 벡터는 세포 또는 유기체 내로 핵산 분자를 수송하는데 적합한 벡터, 예를 들어 바이러스 벡터일 수 있다. 본 발명의 맥락에서 벡터는 예를 들어 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게는 벡터는 DNA 분자이다. 바람직하게는 본 출원의 의미 내 벡터는 클로닝 부위, 항생제 저항성 인자와 같은 선별 마커, 및 복제 원점과 같은 벡터의 증폭에 적합한 서열을 포함한다. 바람직하게는 본 출원의 맥락에서 벡터는 플라스미드 벡터이다.

수송체 (Vehicle): 수송체는 전형적으로 약학적으로 활성인 화합물과 같은 화합물 저장, 수송, 및/또는 투여에 적합한 물질로 이해된다. 예를 들어, 이는 약학적으로 활성인 화합물 저장, 수송, 및/또는 투여에 적합한 생리학적으로 허용 가능한 액체이다.

3'- 비번역된 영역(3'-UTR): 일반적으로, 용어 "3'-UTR"은 오픈 리딩 프레임의 3'(즉 "다운스트림")에 위치하고 단백질로 번역되지 않는 인공 핵산 분자의 일부를 말한다. 전형적으로, 3'-UTR은 단백질 코딩 영역(오픈 리딩 프레임(ORF)) 또는 코딩 서열(CDS)) 및 mRNA의 폴리(A) 서열 사이에 위치한 mRNA의 일부이다. 본 발명의 맥락에서, 용어 3'-UTR은 또한 RNA가 전사된 주형(template)으로 코딩되지 않은 요소를 포함할 수 있으나, 전사 이후 성숙 도중에 첨가된다, 예를 들어 폴리(A) 서열. mRNA의 3'-UTR은 아미노산 서열로 번역되지 않는다. 3'UTR 서열은 보통 유전자 발현 과정 중에 각각 mRNA로 전사되는 유전자에 의해 코딩된다. 유전체 서열은 선택적 인트론을 포함하는 조숙 mRNA로 우선 전사된다. 조숙 mRNA는 이후 성숙 과정에서 성숙 mRNA로 추가적으로 가공된다. 이러한 성숙 과정은 5'캡핑, 조숙 mRNA를 선택적 인트론으로 자르는 스플라이싱 및 조숙 mRNA의 3'-말단의 폴리아데닐화와 같은 3'-말단의 변형 및 선택적 엔도-/ 또는 엑소뉴클레아제 분해 등의 단계를 포함한다. 본 발명의 이러한 맥락에서, 3'UTR은 단백질 코딩 영역의 정지 코돈 사이에, 바람직하게는 단백질 코딩 영역의 정지 코돈에 3' 바로 옆에 위치한 성숙 mRNA의 서열, 및 mRNA의 폴리(A) 서열에 상응한다. 용어 “상응”은 3'UTR 서열은 3'UTR 서열을 정의하는데 사용되는 mRNA 서열에서와 같이 RNA 서열, 또는 이러한 RNA 서열에 상응하는 DNA 서열일 수 있음을 의미한다. 본 발명의 맥락에서, 용어 “리보좀 단백질 유전자의 3'UTR”과 같은, “유전자의 3'UTR”은 이러한 유전자로부터 유도된 성숙 mRNA의 3'UTR에 상응하는 서열로, 즉 mRNA는 유전자의 전사 및 조숙 mRNA의 성숙에 의해 얻어진다. 용어 “유전자의 3'UTR”은 3'UTR의 DNA 서열 및 RNA 서열(센스(sense) 및 안티센스(antisense) 가닥 모두 및 성숙 및 비성숙 모두)을 포함한다.

5'- 비번역된 영역( 5'UTR ): 5'UTR은 전형적으로 메신저 RNA(mRNA)의 특정한 구획(section)으로 이해된다. 이는 mRNA의 오픈 리딩 프레임의 5'에 위치한다. 전형적으로 5'UTR은 전사 시작 부위에서 시작하고 오픈 리딩 프레임의 시작 코돈 전 한 뉴클레오티드에서 종결된다. 5'UTR은 유전자 발현을 조절하는 요소, 소위 조절 요소를 포함할 수 있다. 이러한 조절 요소는 예를 들어 리보솜 결합 부위일 수 있다. 5'UTR은 예를 들어 5'-CAP의 추가에 의해 전사후 변형될 수 있다. 본 발명의 맥락에서 5'UTR은 5'-CAP 및 시작 코돈 사이에 위치한 성숙 mRNA의 서열에 상응한다. 바람직하게는 5'UTR은 3' 위치한 뉴클레오티드로부터 5'-CAP까지, 바람직하게는 3' 바로 옆에 위치한 뉴클레오티드로부터 5'CAP까지, 단백질 코딩 영역의 시작 코돈에 5' 위치한 뉴클레오티드에, 바람직하게는 단백질 코딩 영역의 시작 코돈에 5' 바로 옆에 위치한 뉴클레오티드의 서열에 상응한다. 성숙 mRNA의 3' 바로 옆에서 5'-CAP에 위치한 뉴클레오티드는 전형적으로 전사 시작 부위에 상응한다. 용어 “상응”은 5'UTR 서열이 5'UTR 서열을 정의하는데 사용된 mRNA 서열에서와 같은 RNA 서열, 또는 이러한 RNA 서열에 상응하는 DNA 서열일 수 있음을 의미한다. 본 발명의 맥락에서, 용어 “유전자의 5'UTR”은 이 유전자로부터 유도된 성숙 mRNA의 5'UTR에 상응하는 서열이며, 즉 mRNA는 유전자의 전사 및 조숙 mRNA의 성숙에 의해 얻어진다. 용어 “유전자의 5'-UTR”은 5'-UTR의 DNA 서열 및 RNA 서열을 포함한다. 본 발명의 실시예에 의해 이러한 5'-UTR은 OTR의 5'-말단에 제공될 수 있다. 이의 길이는 전형적으로 500, 400, 300, 250 또는 200개 미만의 뉴클레오티드이다. 다른 실시예에서, 이의 길이는 적어도 10, 20, 30 또는 40, 바람직하게 100 또는 150개까지 뉴클레오티드의 범위일 수 있다.

5'말단 올리고피리미딘 트랙트 (TOP): 5'말단 올리고피리미딘 트랙트(TOP)는 전형적으로 특정한 mRNA 분자의 5'말단 영역 또는 특정한 유전자의 기능적 독립체의 5'말단 영역, 예를 들에 전사된 영역과 같은, 핵산 분자의 5'말단 영역에 위치한 피리미딘 뉴클레오타이드의 스트레치이다. 서열은 보통 전사 시작 부위에 상응하는 시티딘으로 시작하며, 보통 약 3 내지 30 피리미딘 뉴클레오티드의 스트레치가 뒤따른다. 예를 들어, TOP는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 그 이상의 뉴클레오티드를 포함할 수 있다. 피리미딘 스트레치 및 따라서 5'TOP는 TOP의 다운스트림에 위치한 첫번째 퓨린 뉴클레오티드에 5' 하나의 뉴클레오티드로 종결한다. 5'말단 올리고피리미딘 트랙트를 포함하는 메신저 RNA는 종종 TOP mRNA로 언급된다. 따라서 이러한 메신저 RNAs를 제공하는 유전자는 TOP 유전자로 언급된다. TOP 서열은 예를 들어 유전자 및 펩타이드 신장 인자를 코딩하는 mRNAs 및 리보솜 단백질에서 발견되었다.

TOP 모티프: 본 발명의 맥락에서, TOP 모티프는 상기 정의된 5'TOP에 상응하는 핵산 서열이다. 따라서, 본 발명의 맥락에서 TOP 모티프는 바람직하게는 3-30 뉴클레오티드의 길이를 갖는 피리미딘 뉴클레오티드의 스트레치이다. 바람직하게는, TOP-모티프는 적어도 3 피리미딘 뉴클레오티드, 바람직하게는 적어도 4 피리미딘 뉴클레오티드, 바람직하게는 적어도 5 피리미딘 뉴클레오티드, 더욱 바람직하게는 적어도 6 뉴클레오티드, 더욱 바람직하게는 적어도 7 뉴클레오티드, 가장 바람직하게는 적어도 8 피리미딘 뉴클레오티드로 이루어지며, 상기 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 시토신 뉴클레오티드의 5'말단에서 시작한다. TOP 유전자 및 TOP mRNAs에서, TOP-모티프는 바람직하게는 전사 시작 부위와 함께 이의 5'말단에서 시작하며 상기 유전자 또는 mRNA 내 첫번째 퓨린 잔기에 5' 하나의 뉴클레오티드에 종결한다. 본 발명의 의미에서 TOP 모티프는 바람직하게는 5'UTR을 나타내는 서열의 5'말단에 또는 5'UTR을 코딩하는 서열의 5'말단에 위치한다. 따라서 바람직하게는 3 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는, 만약 이러한 스트레치가 인공 핵산 분자, 상기 인공 핵산 분자의 5'UTR 요소, 또는 본 발명에 정의된 TOP 유전자의 5'UTR로부터 유도된 핵산 분자와 같은, 각각 서열의 5'말단에 위치하는 경우에, 본 발명의 의미에서 “TOP 모티프”로 불린다. 다시 말하면, 5'UTR 또는 5'UTR 요소의 5'-말단에 위치하지 않으나 5'UTR 또는 5'UTR 요소 내 어느 곳에 위치한 3 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 “TOP 모티프”가 아니다.

TOP 유전자: TOP 유전자는 전형적으로 5' 말단 올리고피리미딘 트랙트의 존재에 의해 특성화된다. 나아가, 대부분 TOP 유전자는 성장 관련된 번역 조절에 의해 특성화된다. 그러나 또한 조직 특이적 번역 조절과 함께 TOP 유전자는 알려졌다. 상기 정의된 바처럼, TOP 유전자의 5'UTR은 바람직하게는 시작 코돈에 5' 위치한 뉴클레오티드에 3'에 위치한 뉴클레오티드로부터 5'캡에까지 이르는, TOP 유전자로부터 유도된(derived) 성숙 mRNA의 5'UTR의 서열에 상응한다. TOP 유전자의 5'UTR은 전형적으로 어떠한 시작 코돈도 포함하지 않으며, 바람직하게는 업스트림 AUGs(uAUGs) 또는 업스트림 오픈 리딩 프레임(uORFs)이 없다. 그 안에, 업스트림 AUGs 및 업스트림 오픈 리딩 프레임은 전형적으로 번역될 오픈 리딩 프레임의 시작 코돈(AUG)의 5'에 발생하는 AUGs 및 오픈 리딩 프레임으로 이해된다. TOP 유전자의 5'UTRs는 일반적으로 보다 짧다. TOP 유전자의 5'UTRs의 길이는 20 뉴클레오티드 내지 500 뉴클레오티드 사이에서 다양할 수 있으며, 전형적으로 약 200 뉴클레오티드 미만, 바람직하게는 약 150 뉴클레오티드 미만, 더욱 바람직하게는 약 100 뉴클레오티드 미만이다. 본 발명의 의미에서 예시적인 TOP 유전자의 5'UTRs는 본 발명에 참고문헌으로 병합된 특허출원 WO2013/143700의 SEQ ID NOs. 1-1363에 따르는 서열 내 위치 5에 뉴클레오티드로부터 시작 코돈(예를 들어 ATG)에 5' 바로 옆에 위치한 뉴클레오티드까지의 핵산 서열이다. 이러한 맥락에서, TOP 유전자의 5'UTR의 특히 바람직한 절편은 5'TOP 모티프가 없는 TOP 유전자의 5'UTR이다. 용어 "TOP 유전자의 5'UTR" 또는 "5'-TOP UTR"은 바람직하게 자연 발생 TOP 유전자의 5'UTR을 의미한다.

첫번째 양태에서, 본 발명은 하기를 포함하는 인공 핵산 분자에 관한 것이다

a. 적어도 하나의 오픈 리딩 프레임(ORF); 및

b. 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 이루어진 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소).

용어 "3'-UTR 요소"는 3'-UTR로부터 또는 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함 또는 이로 구성된 핵산 서열을 의미한다. "3'-UTR 요소"는 바람직하게 인공 mRNA와 같은 인공 핵산 서열의 3'-UTR을 나타내는, 또는 인공 핵산 분자의 3'-UTR을 코딩하는 핵산 서열을 의미한다. 따라서, 본 발명의 관점에서 바람직하게 3'-UTR 요소는 mRNA의, 바람직하게 인공 mRNA의 3'-UTR일 수 있거나, mRNA의 3'-UTR에 대한 전사 주형(template)일 수 있다. 따라서, 3'-UTR 요소는 바람직하게 mRNA의 3'-UTR에, 바람직하게 유전적으로 조작된 벡터 구조의 전사에 의해 수득된 mRNA와 같은, 인공 mRNA의 3'-UTR에 상응하는 핵산 서열이다. 바람직하게, 본 발명의 의미 내 3'-UTR 요소는 3'-UTR로서 기능하거나 3'-UTR의 기능을 수행하는 뉴클레오티드 서열을 코딩한다.

용어 "리보좀 단백질 유전자"는 전형적으로 리보좀 단백질을 코딩하는 유전자를 의미한다. 본 발명에 사용된 것처럼, 상기 용어는 종과 무관하게 이것이 유도된 어느 리보좀 단백질 유전자를 의미한다. 구체적으로, 상기 용어는 진핵 리보좀 단백질 유전자를 의미한다. 게다가, 본 발명의 맥락에서, 용어 "리보좀 단백질 유전자"는 또한 리보좀 단백질 유전자와, 구조적 또는 기능적으로 유사한 유전자를 의미할 수 있다. 특히, 상기 용어는 또한 "리보좀 단백질-유사" 유전자, 위유전자(pseudogene) 및 특히 리보좀 단백질 유전자와 함께 그들의 3'-UTR 영역에 서열 또는 구조적 특징을 공유하는 유전자를 포함한다. 바람직하게, 상기 용어는 척추동물 리보좀 단백질 유전자, 더욱 바람직하게 포유동물 리보좀 단백질 유전자, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자를 의미한다. 게다가, 용어 "리보좀 단백질 유전자"는 또한 설치류 리보좀 단백질 유전자, 특히 쥣과 리보좀 단백질 유전자를 포함한다. 본 발명의 의미 내 리보좀 단백질 유전자의 예시는 리보좀 단백질　L9 (RPL9), 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L4 (RPL4), 리보좀 단백질　L5 (RPL5), 리보좀 단백질　L6 (RPL6), 리보좀 단백질　L7 (RPL7), 리보좀 단백질　L7a (RPL7A), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L12 (RPL12), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L18 (RPL18), 리보좀 단백질　L18a (RPL18A), 리보좀 단백질　L19 (RPL19), 리보좀 단백질　L21 (RPL21), 리보좀 단백질　L22 (RPL22), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L17 (RPL17), 리보좀 단백질　L24 (RPL24), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L30 (RPL30), 리보좀 단백질　L27a (RPL27A), 리보좀 단백질　L28 (RPL28), 리보좀 단백질　L29 (RPL29), 리보좀 단백질　L31 (RPL31), 리보좀 단백질　L32 (RPL32), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L37 (RPL37), 리보좀 단백질　L37a (RPL37A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　L39 (RPL39), 리보좀 단백질,　라지,　P0 (RPLP0), 리보좀 단백질,　라지,　P1 (RPLP1), 리보좀 단백질,　라지,　P2 (RPLP2), 리보좀 단백질　S3 (RPS3), 리보좀 단백질　S3A (RPS3A), 리보좀 단백질　S4,　X-연결된(RPS4X), 리보좀 단백질　S4,　Y-연결된 1 (RPS4Y1), 리보좀 단백질　S5 (RPS5), 리보좀 단백질　S6 (RPS6), 리보좀 단백질　S7 (RPS7), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S10 (RPS10), 리보좀 단백질　S11 (RPS11), 리보좀 단백질　S12 (RPS12), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S15 (RPS15), 리보좀 단백질　S15a (RPS15A), 리보좀 단백질　S16 (RPS16), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S20 (RPS20), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S25 (RPS25), 리보좀 단백질　S26 (RPS26), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S27a (RPS27a), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L15 (RPL15), 리보좀 단백질　S2 (RPS2), 리보좀 단백질　L14 (RPL14), 리보좀 단백질　S14 (RPS14), 리보좀 단백질　L10 (RPL10), 리보좀 단백질　L10a (RPL10A), 리보좀 단백질　L35 (RPL35), 리보좀 단백질　L13a (RPL13A), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　L41 (RPL41), 리보좀 단백질　S18 (RPS18), 리보좀 단백질　S24 (RPS24), 리보좀 단백질　L8 (RPL8), 리보좀 단백질　L34 (RPL34), 리보좀 단백질　S17 (RPS17), 리보좀 단백질　SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스(FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사(RPL39L), 리보좀 단백질 L10-유사(RPL10L), 리보좀 단백질 L36a-유사(RPL36AL), 리보좀 단백질 L3-유사(RPL3L), 리보좀 단백질 S27-유사(RPS27L), 리보좀 단백질 L26- 유사 1 (RPL26L1), 리보좀 단백질 L7- 유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자(RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)를 포함하나, 이에 제한되지 않는다. 바람직하게, 상기 용어 "리보좀 단백질 유전자"는 포유동물로부터 유래된, 바람직하게 호모 사피엔스(Homo sapiens) 또는 생쥐(Mus musculus)로부터 유래된 상기 유전자의 하나를 의미한다.

바람직하게, 적어도 하나의 오픈 리딩 프레임 및 적어도 하나의 3'-UTR 요소는 이종 기원(heterologous)이다. 이러한 맥락에서 용어 "이종 기원"은 오픈 리딩 프레임 및 3'-UTR 요소와 같은 인공 핵산 분자에 의해 구성된 두 서열 요소가 이러한 조합으로 자연적으로(천연) 발생하지 않음을 의미한다. 바람직하게, 3'-UTR 요소는 오픈 리딩 프레임 보다 다른 유전자로부터 유도된다. 예를 들어, 상기 ORF는 예를 들어 다른 유전자 또는 동일한 단백질을 코딩하나 다른 종 등의 3'-UTR 요소보다 다른 유전자로부터 유도될 수 있다. 바람직하게, 상기 오픈 리딩 프레임은 리보좀 단백질을 코딩하지 않는다. 바람직한 실시예에서, ORF는 인간 리보좀 단백질 또는 식물(특히 아라비답시스) 리보좀 단백질, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는다. 더욱 바람직한 실시예에서, 오픈 리딩 프레임은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는다.

특정한 실시예에서, 오픈 리딩 프레임은 리포터 단백질, 예를 들어, 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, GFP 단백질 또는 이의 변이체, 예를 들어 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질과 적어도 70% 서열 상동성을 보이는 변이체로 구성된 그룹으로부터 선택된 것을 코딩하지 않는 것이 바람직하다. 특히 바람직한 실시예에서, 오픈 리딩 프레임은 리포터 유전자를 코딩하지 않거나 리포터 유전자로부터 유도되지 않으며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체로 이루어진 그룹으로부터 선택되지 않으며, 바람직하게 이들 리포터 유전자, 바람직하게 글로빈 단백질, 루시퍼라제 단백질 또는 GFP 단백질의 어느 것에 전형적으로 적어도 70% 서열 상동성을 보이는 EGFP, 또는 상기 유전자의 어느 변이체로부터 선택되지 않는다.

더욱 더 바람직하게, 상기 3'-UTR 요소는 본 발명에 정의된 인공 핵산에 포함된 어느 다른 요소에 이종 기원이다. 예를 들어, 본 발명에 따르는 인공 핵산 분자가 주어진 유전자로부터 3'-UTR 요소를 포함한다면, 바람직하게 유전자의 ORF의 5' 및 3' 말단에 이의 조절 서열을 포함하는 어느 다른 핵산 서열, 특히 동일 유전자로부터 비기능적 핵산 서열(예를 들어 코딩 또는 조절 서열 요소)을 포함하지 않는다. 특히 바람직한 실시예에서, 인공 핵산 분자는 ORF, 3'-UTR 및 5'-UTR을 포함하며, 상기 모두는 서로 이종 기원이며, 예를 들어 그들은 그들 각각이 다른 유전자로부터 유도된 것(및 그들의 5' 및 3' UTR's)과 같은 재조합물이다. 다른 바람직한 실시예에서, 상기 3'-UTR은 바이러스 유전자의 3'-UTR로부터 유도되지 않거나 비-바이러스 원천이다.

바람직하게, 적어도 하나의 3'-UTR 요소는 ORF에 기능적으로 연결된다. 이는 바람직하게 코딩된 펩타이드 또는 단백질의 발현에 증진 또는 안정화 기능 또는 인공 핵산 분자의 안정화 기능과 같이, 3'-UTR 요소가 기능을 수행할 수 있는 ORF와 관련되는 것을 의미한다. 바람직하게, ORF 및 3'-UTR 요소는 5'→3' 방향에 관련된다. 따라서 바람직하게 인공 핵산 분자는 5'-ORF-(선택적)-연결자-3'-UTR 요소-3'의 구조를 포함하며, 상기 연결자는 존재하거나 존재하지 않을 수 있다. 예를 들어, 상기 연결자는 1-50 또는 1-20 뉴클레오티드의 스트레치와 같이 예를 들어 하나 또는 그 이상의 제한 효소 인식 부위(제한 부위)를 포함하거나 또는 이로 구성된, 하나 또는 그 이상의 뉴클레오티드일 수 있다.

바람직하게, 적어도 하나의 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자의 3'-UTR로부터, 특히 인간 리보좀 단백질 유전자로부터 유도된 또는 설치류 리보좀 단백질 유전자, 특히 쥣과 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함한다.

바람직한 실시예에서, 적어도 하나의 3'-UTR 요소는 NM_000661.4, NM_001024921.2, NM_000967.3, NM_001033853.1, NM_000968.3, NM_000969.3, NM_001024662.1, NM_000970.3, NM_000971.3, NM_000972.2, NM_000975.3, NM_001199802.1, NM_000976.3, NM_000977.3, NM_033251.2, NM_001243130.1, NM_001243131, NM_000978.3, NM_000979.3, NM_001270490.1, NM_000980.3, NM_000981.3, NM_000982.3, NM_000983.3, NM_000984.5, NM_000985.4, NM_001035006.2, NM_001199340.1, NM_001199341.1, NM_001199342.1, NM_001199343.1, NM_001199344.1, NM_001199345.1, NM_000986.3, NM_000987.3, NM_000988.3, NM_000989.3, NM_000990.4, NM_001136134.1, NM_000991.4, NM_001136135.1, NM_001136136.1, NM_001136137.1, NM_000992.2, NM_000993.4, NM_001098577.2, NM_001099693.1, NM_000994.3, NM_001007073.1, NM_001007074.1, NM_000996.2, NM_000997.4, NM_000998.4, NM_000999.3, NM_001035258.1, NM_001000.3, NM_001002.3, NM_053275.3, NM_001003.2, NM_213725.1, NM_001004.3 , NM_001005.4, NM_001256802.1, NM_001260506.1, NM_001260507.1 , NM_001006.4, NM_001267699.1, NM_001007.4, NM_001008.3, NM_001009.3, NM_001010.2, NM_001011.3, NM_001012.1, NM_001013.3, NM_001203245.2, NM_001014.4, NM_001204091.1, NM_001015.4, NM_001016.3, NM_001017.2, NM_001018.3, NM_001030009.1, NM_001019.4, NM_001020.4, NM_001022.3, NM_001146227.1, NM_001023.3, NM_001024.3, NM_001025.4, NM_001028.2, NM_001029.3, NM_001030.4, NM_002954, NM_001135592.2, NM_001177413.1, NM_001031.4, NM_001032.4, NM_001030001.2, NM_002948.3, NM_001253379.1, NM_001253380.1, NM_001253382.1, NM_001253383.1, NM_001253384.1, NM_002952.3, NM_001034996.2, NM_001025071.1, NM_001025070.1, NM_005617.3, NM_006013.3, NM_001256577.1, NM_001256580.1, NM_007104.4, NM_007209.3, NM_012423.3, NM_001270491.1, NM_033643.2, NM_015414.3, NM_021029.5, NM_001199972.1, NM_021104.1, NM_022551.2, NM_033022.3, NM_001142284.1, NM_001026.4, NM_001142285.1, NM_001142283.1, NM_001142282.1, NM_000973.3, NM_033301.1, NM_000995.3, NM_033625.2, NM_001021.3, NM_002295.4, NM_001012321.1, NM_001033930.1, NM_003333.3, NM_001997.4, NM_001099645.1, NM_001021.3, NM_052969.1, NM_080746.2, NM_001001.4 , NM_005061.2 , NM_015920.3 , NM_016093.2 , NM_198486.2 , NG_011172.1, NG_011253.1, NG_000952.4, NR_002309.1, NG_010827.2, NG_009952.2, NG_009517.1, NM_052835.3, NM_011287.2, NM_001162933.1, NM_009076.3, NM_009438.5, NM_025974.2, NM_025586.3, NM_001002239.3, NM_009077.2, NM_029751.4, NM_009078.2, NM_019647.6, NM_009079.3, NM_022891.3, NM_024218.4, NM_011975.3, NM_009081.2, NM_009082.2, NM_009083.4, NM_053257.3, ENSMUST00000081840 (NM_172086.2), NM_026724.2, NM_025592.3, NM_025589.4, NM_026069.3, NM_009084, NM_026055.1, NM_026594.2, NM_001163945.1, NM_024212.4, NM_016980.2, NM_011290.5, NM_011291.5, ENSMUST00000102898 (NM_013721.3), NM_025433.3, NM_012053.2, NM_011292.2, NM_007475.5, NM_018853.3, NM_026020.6, NM_025963.3, NM_013725.4, NM_011295.6, NM_020600.4, NM_009091.2, NM_170669.2, NM_013647.2, NM_009092.3, NM_008503.5, NM_026147.5 / ENSMUST00000138502 , NM _207635.1, NM_024266.3, NM_013765.2, NM_024277.2, NM_026467.3, NM_012052.2, NM_016959.4, ENSMUST00000071745 , NM_009095.2, NM_009096.3, NM_011300.3, NM_011029.4, NM_018860.4, NM_001277113.1, NM_001277114.1, NM_001271590.1, NM_007990, NM_025919, NM_016738, NM_026517, NM_207523, NM_009080, NM_011289, NM_013762, NM_ 021338 , NM _018730, NM_019865, NM_023372.2, NM_026533.3, NM_009092, NM_011296, NM_023133, ENSMUST00000059080 (NM_025587.2), NM_024175, NM_027015, NM_016844, NM_009093.2, NM_009094, NM_009098, NM_029767, 및 NM_019883으로 이루어진 그룹으로부터 선택된 전사체의 3'-UTR 서열로부터 유도된, 핵산 서열을 포함하거나 이에 대응된다.

구절 "리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열"은 바람직하게 리보좀 단백질 유전자의 3'-UTR 서열 또는 이의 절편 또는 일부에 기초한 핵산 서열을 의미한다. 이러한 구절은 전체 3'-UTR 서열에 상응하는 서열, 즉 리보좀 단백질 유전자의 전장 3'-UTR 서열, 및 리보좀 단백질 유전자의 3'-UTR 서열의 절편에 상응하는 서열을 포함한다. 바람직하게, 리보좀 단백질 유전자의 3'-UTR의 절편은 리보좀 단백질 유전자의 전장 3'-UTR에 적어도 5%, 10%, 20%, 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 더 바람직하게 적어도 60^, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 및 가장 바람직하게 적어도 90%를 나타내는, 리보좀 단백질 유전자의 전장 3'-UTR 내 뉴클레오티드의 연속적인 스트레치에 상응하는 뉴클레오티드의 연속적인 스트레치로 구성된다. 본 발명의 의미 내 이러한 절편은 바람직하게 본 발명에 설명된 기능적 절편이다. 바람직하게, 상기 절편은 3'-UTR에 연결된 ORF 또는 이의 절편의 번역을 위한 조절 기능을 보유한다.

용어 "리보좀 단백질 유전자의 3'-UTR"은 바람직하게 리보좀 단백질 유전자를 자연적으로 발생시키는 3'-UTR을 의미한다.

상기 용어 "리보좀 단백질 유전자의 3'-UTR의 변이체" 및 리보좀 단백질 유전자의 3'-UTR의 맥락에서 "이의 변이체"는 자연 발생 리보좀 단백질 유전자의 3'-UTR의 변이체, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR의 변이체, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR의 변이체, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 상기 설명된 인간 리보좀 단백질 유전자의 3'-UTR의 변이체를 의미한다. 이러한 변이체는 리보좀 단백질 유전자의 변형된 3'-UTR일 수 있다. 예를 들어, 변이체 3'-UTR은 변이체가 유도된 자연 발생 3'-UTR에 비해 하나 또는 그 이상의 뉴클레오티드 결실, 삽입, 추가 및/또는 치환을 보일 수 있다. 바람직하게, 리보좀 단백질 유전자의 3'-UTR의 변이체는 이것이 유도된 자연 발생 3'-UTR 변이체에 적어도 40%, 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 더욱 더 바람직하게 적어도 90%, 가장 바람직하게 적어도 95%의 상동성이다. 바람직하게, 상기 변이체는 본 발명에 설명된 기능적 변이체이다.

구절 "리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열"은 바람직하게 리보좀 단백질 유전자의 3'-UTR 서열의 변이체에 기초한 핵산 서열 또는 상기 설명된 이의 절편 또는 일부를 의미한다. 이러한 구절은 리보좀 단백질 유전자의 3'-UTR의 변이체의 전체 서열에 상응하는 서열, 즉 리보좀 단백질 유전자의 전장 변이체 3'-UTR 서열, 및 리보좀 단백질 유전자의 변이체 3'-UTR 서열의 절편에 상응하는 서열을 포함한다. 바람직하게, 리보좀 단백질 유전자의 3'-UTR의 변이체의 절편은 리보좀 단백질 유전자의 3'-UTR의 전장 변이체의 적어도 20%, 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 더 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 및 가장 바람직하게 적어도 90%를 나타내는, 리보좀 단백질 유전자의 3'-UTR의 전장 변이체 내 뉴클레오티드의 연속적인 스트레치에 상응하는 뉴클레오티드의 연속적인 스트레치로 구성된다. 본 발명의 의미 내, 이러한 변이체의 절편은 바람직하게 본 발명에 설명된 변이체의 기능적 절편이다.

본 발명의 맥락에서 상기 용어 "기능적 변이체", "기능적 절편", 및 "변이체의 기능적 절편"(또한 "기능적 변이체 절편"으로 명명)은 리보좀 단백질 유전자의 3'-UTR의 절편, 3'-UTR의 변이체, 또는 3'-UTR의 변이체의 절편이 변이체, 절편, 또는 변이체의 절편이 유도된 리보좀 단백질 유전자의 자연 발생 3'-UTR의 적어도 하나의, 바람직하게 하나 이상의 기능을 수행하는 것을 의미한다. 이러한 기능은 예를 들어 mRNA를 안정화 및/또는 mRNA로부터 단백질 생산을 증진, 안정화 및/또는 연장 및/또는, 바람직하게 인간 세포와 같은 포유동물 세포 내 mRNA로부터 단백질 발현 또는 전체 단백질 생산을 증가시키는 것일 수 있다. 바람직하게 3'-UTR의 기능은 ORF에 의해 코딩된 단백질의 번역에 관련된다. 더욱 바람직하게, 상기 기능은 3'-UTR 또는 이의 절편 또는 변이체에 연결된 ORF의 번역 효율을 증진시키는 것을 포함한다. 본 발명의 맥락 내 변이체, 절편, 및 변이체 절편은 참고 3'-UTR 또는 3'-UTR이 없는 것을 포함하는 mRNA에 비해, 바람직하게 인간 세포와 같은 포유동물 세포 내 mRNA를 안정화하는 기능, 및/또는 참조 3'-UTR 또는 3'-UTR이 없는 것을 포함하는 mRNA에 비해, 바람직하게 인간 세포와 같은 포유동물 세포 내, mRNA로부터 단백질 생산을 증진, 안정화 및/또는 연장하는 기능, 및/또는 참조 3'-UTR 또는 3'-UTR이 없는 것을 포함하는 mRNA에 비해, 바람직하게 인간 세포와 같은 포유동물 세포 내, mRNA로부터 단백질 생산을 증가시키는 기능을 수행하는 것이 특히 바람직하다. 참고 3'-UTR은 예를 들어 ORF와 자연 발생 조합된 3'-UTR일 수 있다. 게다가, 리보좀 단백질 유전자의 3'-UTR의 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편은 바람직하게 변이체, 절편, 또는 변이체 절편이 유도된 야생형 3'-UTR에 비해 이러한 3'-UTR의 변이체, 절편, 또는 변이체 절편을 포함하는 mRNA의 번역의 효율성에 실질적인 감소 효과를 가지지 않는다. 본 발명의 맥락에서 리보좀 단백질 유전자의 3'-UTR의 "기능적 절편", "기능적 변이체" 또는 "변이체의 기능적 절편"의 특히 바람직한 기능은 상기 설명된 기능적 절편, 기능적 변이체 또는 변이체의 기능적 절편을 이송하는(carrying) mRNA의 발현에 의한 단백질 생산의 증진, 안정화 및/또는 연장이다.

바람직하게, mRNA 및/또는 단백질 생산 안정화 효율 및/또는 단백질 생산 증가 효율과 같이, 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편에 의해 수행되는 하나 또는 그 이상의 기능의 효율성은 변이체, 절편 또는 변이체 절편이 유도된 리보좀 단백질 유전자의 자연 발생 3'-UTR에 의해 보이는 mRNA 및/또는 단백질 생산 안정화 효율 및/또는 단백질 생산 증가 효율에 대하여 적어도 5%, 더욱 바람직하게 적어도 10%, 더욱 바람직하게 적어도 20%, 더욱 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90% 증가된다.

본 발명의 맥락에서, 리보좀 단백질 유전자의 3'-UTR의 또는 리보좀 단백질 유전자의 3'-UTR의 변이체의 절편은 바람직하게 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 나타낸다. 바람직하게, 이러한 리보좀 단백질 유전자의 3'-UTR 또는 리보좀 단백질 유전자의 3'-UTR의 변이체의 절편은 상기 설명된 기능적 절편이다. 바람직한 실시예에서, 리보좀 단백질 유전자의 3'-UTR 또는 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 보인다.

바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 리보좀 단백질 유전자의 3'-UTR의 "기능적 절편", "기능적 변이체" 또는 "변이체의 기능적 절편"을 포함하거나 이로 구성된다.

바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 인공 핵산 분자의 안전성을 증가, 예를 들어 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산(참고 핵산)에 비해 본 발명에 따르는 mRNA의 안전성을 증가시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 본 발명에 따르는 인공 핵산 분자로부터, 예를 들어 ORF와 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산에 비해 본 발명에 따르는 mRNA로부터 단백질 생산의 안전성을 증가시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 본 발명에 따르는 인공 핵산 분자로부터, 예를 들어 ORF와 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산에 비해 본 발명에 따르는 mRNA로부터 단백질 생산을 연장시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 본 발명에 따르는 인공 핵산 분자로부터, 예를 들어 ORF와 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산에 비해 본 발명에 따르는 mRNA로부터 단백질 발현 및/또는 총 단백질 생산을 증가시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR은 ORF와 자연 발생적으로 조합된 3'-UTR과 같이 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산의 번역 효율에 비해, 핵산의 번역 효율에 음성적으로 영향을 미치지 않는다. 더욱 더 바람직하게, 번역 효율은 이의 자연적인 맥락에서 각각의 ORF에 의해 코딩된 단백질의 번역 효율에 비해 3'-UTR에 의해 증진된다.

이러한 맥락에서 용어 "각각의 핵산 분자" 또는 "참고 핵산 분자"는 - 다른 3'-UTRs로부터 떨어진 - 참고 핵산 분자가 3'-UTR 요소를 포함하는 본 발명의 인공 핵산 분자에 대해 비교 가능한, 바람직하게 동일한 것을 의미한다.

상기 용어 인공 mRNA와 같은 인공 핵산 분자로부터 "단백질 생산을 안정화 및/또는 연장"은 바람직하게 인공 mRNA와 같은 인공 핵산 분자로부터 단백질 생산이 예를 들어 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내에서, 참고 3'-UTR을 포함하거나 3'-UTR이 없는 참고 mRNA와 같은 참고 핵산 분자로부터 단백질 생산에 비해 안정화 및/또는 연장되는 것을 의미한다. 따라서, 인공 mRNA와 같은 인공 핵산 분자로부터 생산된 단백질은 참고 핵산 분자로부터 생산된 단백질이 보일 수 있는 것에 비해 보다 긴 기간 동안 관찰 가능하다. 즉, 시간에 따라 측정된 인공 mRNA와 같은 인공 핵산 분자로부터 생산된 단백질의 양은 시간에 따라 측정된 참고 mRNA와 같은 참고 핵산 분자로부터 생산된 단백질의 양에 비해, 보다 늦은 시점에 역치 값(threshold value)을 약화(undercuts)시켰다. 이러한 역치 값은 예를 들어 핵산 분자의 후기 형질전환과 같이, 발현의 시작 이후 1, 2, 3, 4, 5 또는 6시간과 같이, 발현의 초기 단계에 측정된 단백질의 양일 수 있다.

예를 들어, 인공 mRNA와 같은 인공 핵산 분자로부터 단백질 생산은 - 핵산 분자의 후기 형질전환과 같은, 발현의 시작 1, 2, 3, 4, 5, 또는 6시간 이후와 같이, 발현의 초기 단계에 관찰된 최소 양의 양으로 - 포유동물 세포, 예를 들어 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내 참고 mRNA와 같은 참고 핵산 분자로부터 단백질 생산에 비해, 적어도 약 5시간, 바람직하게 적어도 약 10시간, 더욱 바람직하게 적어도 약 24시간 연장된다. 따라서, 본 발명에 따른 인공 핵산 분자는 바람직하게 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자에 비해, 적어도 약 5시간, 바람직하게 적어도 약 10시간, 더욱 바람직하게 적어도 약 24시간 동안, 후기 형질전환과 같이, 발현의 시작 1, 2, 3, 4, 5, 또는 6시간 이후와 같이, 발현의 초기 단계에 관찰된 최소 양인 양으로 연장된 단백질 생산을 허용한다.

바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자로부터 단백질 생산의 기간은 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터 단백질 생산에 비해, 적어도 1.5배, 바람직하게 적어도 2배, 더욱 바람직하게 적어도 2.5배 확장된다.

단백질 생산을 연장시키는 이러한 효과는 (i) 예를 들어, 시간에 따라 루시퍼라제와 같은 코딩된 리포터 단백질의 발현에 의해 수득된, 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내 단백질 양을 측정하는 단계, (ii) 단백질의 양이 관찰된 단백질의 양을 약화(undercuts)시키는 시점, 예를 들어 발현의 시작 이후 1, 2, 3, 4, 5, 또는 6시간, 예를 들어 인공 핵산 분자의 형질전환 후 1, 2, 3, 4, 5, 또는 6시간을 결정하는 단계, 및 (iii) 3'-UTR이 없거나 참고 3'-UTR을 포함하는 핵산 분자에 대해 결정된 시점에 발현의 시작 이후 1, 2, 3, 4, 5, 또는 6시간에, 단백질 양이 관찰된 단백질의 양을 약화시키는 시점을 비교하는 단계에 의해 결정될 수 있다.

바람직하게, 본 발명에 따르는 인공 핵산 분자로부터 생산된 단백질의 총량은, 예를 들어 48 또는 72 시간의 시간 범위 내에, 인공 핵산 분자의 ORF와 함께 자연적으로 발생하는 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터 생산된 단백질의 최소량인 동안, 단백질 생산에 이러한 안정화 및/또는 연장 효과가 달성된다. 따라서, 본 발명은 포유동물 세포 내에 같은, 포유동물 발현 시스템 내, 예를 들어 상기 개시된 HeLa 또는 HDF 세포에서 단백질 생산을 연장 및/또는 안정화시키는 인공 핵산 분자를 제공하며, 상기 인공 핵산 분자로부터 생산된 단백질의 총량은, 예를 들어 48 또는 72시간의 시간 범위 내, 적어도, 예를 들어 상기 시간 범위 내, 인공 핵산 분자의 ORF와 함께 자연 발생한 3'-UTR과 같은, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터 생산된 단백질의 총량이다.

따라서, "안정화된 단백질 발현"은 바람직하게 참고 핵산 분자, 예를 들어 참고 3'-UTR을 포함하거나 3'-UTR이 없는 mRNA와 비교할 때, 24시간 동안, 더욱 바람직하게 48시간 동안, 더욱 더 바람직하게 72시간 동안과 같이, 미리 정해진 시간 동안 본 발명에 따른 인공 핵산 분자로부터 보다 균일한 단백질 생산을 의미한다. 따라서, 본 발명에 따른 3'-UTR 요소를 포함하는 인공 핵산 분자로부터, 예를 들어 본 발명에 따른 mRNA로부터, 예를 들어 포유동물 시스템 내 단백질 생산의 수준은 바람직하게 상기 설명된 참고 mRNA와 같은 참고 핵산 분자에 대하여 관찰된 정도로 떨어지지 않는다. 예를 들어, 발현의 시작 6시간 이후, 예를 들어 포유동물 세포와 같은 세포로 본 발명에 따른 인공 핵산 분자의 형질전환 6시간 이후, 관찰된 단백질의 양(ORF에 의해 코딩된 것)은 발현의 시작 48시간 이후, 예를 들어 형질전환 48시간 이후 관찰된 단백질의 양과 비교될 수 있다. 따라서, 발현의 시작 6시간 이후 관찰된 단백질의 양에 비해, 발현의 시작 48시간 이후, 예를 들어 형질전환 48시간 이후 관찰된, 리포터 단백질, 예를 들어 루시퍼라제와 같은 ORF에 의해 코딩된 단백질의 양의 비율은 바람직하게 적어도 약 0.4, 더욱 바람직하게 적어도 약 0.5, 더욱 바람직하게 적어도 약 0.6, 더욱 더 바람직하게 적어도 약 0.7이다. 바람직하게, 상기 비율은 본 발명에 따른 핵산 분자에 대하여 약 0.4 내지 약 4, 바람직하게 약 0.65 내지 약 3, 더욱 바람직하게 약 0.7 내지 2이다. 각각의 참고 핵산 분자, 예를 들어 참고 3'-UTR을 포함하거나 3'-UTR이 없는 mRNA에 대하여, 상기 비율은 예를 들어 약 0.05 내지 약 0.3일 수 있다.

따라서, 본 발명은 상기 설명된 ORF 및 3'-UTR을 포함하는 인공 핵산 분자를 제공하며, 바람직하게 포유동물 세포와 같은 포유동물 발현 시스템, 예를 들어 HeLa 세포에서, 발현의 시작 6시간 이후 관찰된 (리포터) 단백질 양에 비해 발현의 시작 이후 48시간에 관찰된, 상기 (리포터) 단백질 양, 예를 들어 루시퍼라제의 양의 비율은 바람직하게 약 0.4 이상, 더욱 바람직하게 약 0.5 이상, 더욱 바람직하게 약 0.6 이상, 더욱 더 바람직하게 약 0.7 이상, 예를 들어 약 0.4 내지 약 4 사이, 바람직하게 약 0.65 내지 약 3 사이, 더욱 바람직하게 약 0.7 내지 2 사이이며, 상기 예를 들어 48시간의 시간 범위 내에, 상기 인공 핵산 분자로부터 생산된 단백질의 총량은, 인공 핵산 분자의 ORF와 함께 자연 발생하는 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터, 예를 들어 상기 시간 범위 내에, 생산된 단백질의 최소 총량이다. 바람직한 실시예에서, 본 발명은 상기 설명된 ORF 및 3'-UTR 요소를 포함하는 인공 핵산 분자를 제공하며, 바람직하게 포유동물 세포와 같은, 포유동물 발현 시스템, 예를 들어 HeLa 세포 내에서, 발현의 시작 6시간 이후 관찰된 (리포터) 단백질 양에 비해 발현 시작 72시간 이후 관찰된, 상기 (리포터) 단백질 양, 예를 들어 루시퍼라제의 양의 비율은 바람직하게 약 0.4 이상, 더욱 바람직하게 약 0.5 이상, 더욱 바람직하게 약 0.6 이상, 더욱 더 바람직하게 약 0.7 이상, 예를 들어 약 0.4 내지 1.5 사이, 바람직하게 약 0.65 내지 약 1.1.5 사이, 더욱 바람직하게 약 0.7 내지 1.0 사이이며, 상기 예를 들어 72시간의 시간 범위 내에, 바람직하게 인공 핵산 분자로부터 생산된 단백질의 총량은 인공 핵산 분자의 ORF와 함께 자연적으로 발생하는 3'-UTR과 같이 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터, 예를 들어 상기 시간 범위 내에, 생산된 단백질의 최소 총량이다.

본 발명의 맥락에서 "증가된(increased) 단백질 발현" 또는 "증진된(enhanced) 단백질 발현"은 바람직하게 발현의 시작 이후 한 시점에 증가된/증진된 단백질 발현 또는 참고 핵산 분자에 의해 유도된 발현에 비해 발현된 단백질의 증가된/증진된 총량을 의미한다. 따라서, 본 발명에 따른 인공 핵산 분자의 발현의 시작 이후, 예를 들어 형질전환 이후, 예를 들어 본 발명에 따른 mRNA의 형질전환 이후, 특정한 시점, 예를 들어 형질전환 이후 6, 12, 24, 48 또는 72시간에 관찰된 단백질 수준은 바람직하게 참고 3'-UTR을 포함하거나 3'-UTR이 없는 참고 mRNA와 같은, 참고 핵산 분자의 발현의 시작 이후, 예를 들어 형질전환 이후 동일한 시점에 관찰된 단백질 수준에 비해 높다. 바람직한 실시예에서, 인공 핵산 분자로부터 발현된 단백질의 최대량(예를 들어 단백질 활성 또는 질량에 의해 결정된 것과 같음)은 참고 3'-UTR을 포함하거나 3'-UTR이 없는 참고 핵산으로부터 발현된 단백질 양에 대하여 증가된다. 피크(peak) 발현 수준은 바람직하게 예를 들어 형질전환, 48시간 내, 더욱 바람직하게 24시간 내, 및 더욱 더 바람직하게 12시간 이후에 도달한다.

일 실시예에서, 본 발명에 따른 인공 핵산 분자로부터 "증가된 총 단백질 생산" 또는 "증진된 총 단백질 생산"은, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자에 비해, 바람직하게 포유동물 세포와 같은, 포유동물 발현 시스템 내, 예를 들어 HeLa 또는 HDF 세포 내, 단백질이 인공 핵산 분자로부터 생산된, 시간 범위에 따라 증가된/증진된 단백질 생산을 의미한다. 바람직한 실시예에 따르면, 시간에 따라 발현된 단백질의 누적량은 본 발명에 따른 인공 핵산 분자를 사용할 때 증가된다.

본 발명에 따르면, 적어도 하나의 3'-UTR 요소가 없거나 또는 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하는 참고 3'-UTR("참고 핵산")을 포함하는 각각의 핵산 분자에 비해 코딩된 단백질의 증가된 발현에 의해 특징지어진, 인공 핵산 분자가 제공된다. 본 발명의 인공 핵산 분자에 의해 생산된 인비보(in vivo) 단백질을 측정하기 위해, 코딩된 단백질의 발현은 표적 세포/조직에 본 발명의 인공 핵산 분자의 주입/형질전환에 따라 결정되고 참고 핵산에 의해 유도된 단백질 발현에 비교된다. 단백질 발현을 결정하는 정량적인 방법은 기술분야에 알려져 있다(예를 들어 웨스턴-블롯, FACS, ELISA, 질량분광법). 이러한 맥락에서 특히 유용한 것은 루시퍼라제, 녹색 형광 단백질(GFP), 또는 분비된 알칼라인 포스파타제(SEAP)과 같은 리포터 단백질의 발현의 결정이다. 따라서, 본 발명에 따른 인공 핵산 또는 참고 핵산은 표적 조직 또는 세포에, 예를 들어 형질전환 또는 주사를 통해 도입된다. 발현의 시작 이후 또는 핵산 분자의 도입 이후 몇시간 또는 몇일(예를 들어 6, 12, 24, 48 또는 72시간), 표적 세포 샘플은 수집되고 FACS를 통해 측정되며 및/또는 용해되었다. 이후 용해물은 몇몇 방법, 예를 들어 웨스턴-블롯, FACS, ELISA, 질량분광법 또는 형광 또는 발광 측정을 사용하여 발현된 단백질을 검출하는데(및 그에 따라 단백질 발현의 효율을 결정하는데) 사용될 수 있다.

따라서, 만약 본 발명에 따른 인공 핵산 분자로부터 단백질 발현을 특정한 시점(예를 들어 발현의 시작 후 또는 핵산 분자의 도입 후 6, 12, 24, 48 또는 72시간)에 참고 핵산 분자로부터 단백질 발현에 비교한다면, 양쪽 핵산 분자는 표적 조직/세포에 분리되어 도입되고, 조직/세포로부터 샘플은 특정한 시점 이후 수집되고, 단백질 용해물은 특정한 검출 방법(예를 들어 기술분야에 알려진 웨스턴 블롯, ELISA 등)에 적용된 특정한 프로토콜에 따라 제조되며, 상기 단백질은 선택된 검출 방법에 의해 검출된다. 세포 용해물 내 발현된 단백질 양의 측정에 대안으로서, - 또는 수집된 세포의 용해 전 세포 용해물 내 단백질 양의 측정에 추가하여 또는 동시에 부분 표본을 사용하여 - 단백질 양은 또한 FACS 분석을 사용하여 결정될 수 있다.

만약 특정한 시기에 단백질의 총량이 측정된다면, 조직 또는 세포는 인공 핵산 분자의 도입 이후 몇몇 시점 이후 (예를 들어 발현의 시작 이후 또는 핵산 분자의 도입 이후 6, 12, 24, 48 및 72시간) 수집될 수 있고, 시점마다 단백질 양은 상기 설명된 것처럼 결정될 수 있다. 누적되는 단백질 양을 계산하기 위해, 단백질의 총량을 결정하는 수학적인 방법이 사용될 수 있으며, 예를 들어 곡선 아래 영역(AUC)은 하기 식에 따라 결정될 수 있다:

단백질의 총량에 대한 곡선 아래 영역을 계산하기 위해, 각 종점(a 및 b)로부터 발현 곡선의 방정식의 적분이 계산된다.

따라서, "총 단백질 생산"은 바람직하게 시간에 따른 단백질 생산을 나타내는 곡선 아래 영역(AUC)를 의미한다.

상기 인공 핵산 분자의 안전성에 증가, 상기 단백질 생산의 안전성에 증가, 상기 단백질 생산의 연장 및/또는 상기 단백질 발현 및/또는 총 단백질 생산에 증가/증진은 바람직하게 3'-UTR이 없는 각각의 참고 핵산 분자, 예를 들어 3'-UTR이 없는 mRNA, 또는 상기 설명된 ORF와 함께 자연 발생 3'-UTR과 같은 참고 3'-UTR을 포함하는 참고 핵산 분자와 비교에 의해 결정된다.

mRNA 및/또는 단백질 생산 안정화 효과 및 효율 및/또는 리보좀 단백질 유전자의 3'-UTR의 변이체, 절편 및/또는 변이체 절편의 단백질 생산 증가 효과 및 효율뿐만 아니라 mRNA 및/또는 단백질 생산 안정화 효과 및 효율 및/또는 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소의 단백질 생산 증가 효과 및 효율은 통상의 기술자에게 알려진 이러한 목적을 위해 적절한 어느 방법을 통해 결정될 수 있다. 예를 들어, 인공 mRNA 분자는 루시퍼라제와 같은 리포터 단백질에 대해 코딩 서열/오픈 리딩 프레임(ORF)을 포함하며, 3'-UTR, 자연 발생 리보좀 단백질 유전자로부터 유도된 3'-UTR, 참고 유전자(즉 ORF와 함께 자연 발생 3'-UTR과 같은, 참고 3'-UTR)로부터 유도된 3'-UTR, 리보좀 단백질 유전자의 3'-UTR의 3'-UTR 변이체와 같은 것, 자연 발생 리보좀 단백질 유전자의 3'-UTR 절편과 같은 것, 또는 리보좀 단백질 유전자의 3'-UTR의 변이체의 3'-UTR 절편과 같은 것을 포함하지 않고, 발생될 수 있다. 이러한 mRNA는 예를 들어 T7 프로모터 및 각각의 mRNA 서열을 코딩하는 서열을 포함하는, 예를 들어 플라스미드 벡터와 같은 각각의 벡터의 인비트로(in vitro) 전사에 의해, 발생될 수 있다. 발생된 mRNA 분자는 mRNA를 형질전환하기에 적절한 어느 형질전환 방법에 의해 세포로 형질전환될 수 있으며, 예를 들어 그들은 HELA 세포와 같은 포유동물 세포로 전기천공될 수 있으며, 샘플들은 형질전환 이후 특정 시점, 예를 들어 형질전환 이후 6시간, 24시간, 48시간, 및 72시간에 분석될 수 있다. 상기 샘플들은 통상의 기술자에게 잘 알려진 방법에 의해 mRNA 정량 및/또는 단백질 정량을 위해 분석될 수 있다. 예를 들어, 샘플 시점에 세포 내 리포터 mRNA 존재의 정량은 정량적 PCR 방법을 통해 결정될 수 있다. 각각의 mRNA에 의해 코딩된 리포터 단백질의 정량은 예를 들어 웨스턴 블롯, ELISA 분석, FACS 분석 또는 사용되는 리포터 단백질에 의존한 루시퍼라제 분석과 같은 리포터 분석에 의해 결정될 수 있다. 단백질 발현을 안정화 및/또는 단백질 발현을 연장시키는 효과는 예를 들어 형질전환 이후 48시간에 관찰된 단백질 수준의 비율 및 형질전환 6시간 이후 관찰된 단백질 수준을 결정함으로써 분석될 수 있다. 바람직하게, 이러한 비율의 값은 1보다 크며, 즉 이후 시점에 단백질 발현은 보다 이른 시점에 단백질 발현에 비해 크다. 만약 상기 비율 값이 1보다 낮으면, 상기 단백질은 상기 값이 1에 가까워 질수록 보다 안정하다. 이러한 측정은 물론 또한 72 또는 그 이상의 시간에 수행될 수 있으며, 형질전환 72시간 이후 관찰된 단백질 수준의 비율 및 형질전환 6시간 이후 관찰된 단백질 수준은 단백질 발현의 안정성을 결정하기 위해 결정될 수 있다.

바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자의 3'-UTR 영역으로부터, 바람직하게 리보좀 단백질 L9 (RPL9), 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L4 (RPL4), 리보좀 단백질　L5 (RPL5), 리보좀 단백질　L6 (RPL6), 리보좀 단백질　L7 (RPL7), 리보좀 단백질　L7a (RPL7A), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L12 (RPL12), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L18 (RPL18), 리보좀 단백질　L18a (RPL18A), 리보좀 단백질　L19 (RPL19), 리보좀 단백질　L21 (RPL21), 리보좀 단백질　L22 (RPL22), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L17 (RPL17), 리보좀 단백질　L24 (RPL24), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L30 (RPL30), 리보좀 단백질　L27a (RPL27A), 리보좀 단백질　L28 (RPL28), 리보좀 단백질　L29 (RPL29), 리보좀 단백질　L31 (RPL31), 리보좀 단백질　L32 (RPL32), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L37 (RPL37), 리보좀 단백질　L37a (RPL37A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　L39 (RPL39), 리보좀 단백질,　라지,　P0 (RPLP0), 리보좀 단백질,　라지,　P1 (RPLP1), 리보좀 단백질,　라지,　P2 (RPLP2), 리보좀 단백질　S3 (RPS3), 리보좀 단백질　S3A (RPS3A), 리보좀 단백질　S4,　X-연결된(RPS4X), 리보좀 단백질　S4,　Y-연결된1 (RPS4Y1), 리보좀 단백질　S5 (RPS5), 리보좀 단백질　S6 (RPS6), 리보좀 단백질　S7 (RPS7), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S10 (RPS10), 리보좀 단백질　S11 (RPS11), 리보좀 단백질　S12 (RPS12), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S15 (RPS15), 리보좀 단백질　S15a (RPS15A), 리보좀 단백질　S16 (RPS16), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S20 (RPS20), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S25 (RPS25), 리보좀 단백질　S26 (RPS26), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S27a (RPS27a), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L15 (RPL15), 리보좀 단백질　S2 (RPS2), 리보좀 단백질　L14 (RPL14), 리보좀 단백질　S14 (RPS14), 리보좀 단백질　L10 (RPL10), 리보좀 단백질　L10a (RPL10A), 리보좀 단백질　L35 (RPL35), 리보좀 단백질　L13a (RPL13A), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　L41 (RPL41), 리보좀 단백질　S18 (RPS18), 리보좀 단백질　S24 (RPS24), 리보좀 단백질　L8 (RPL8), 리보좀 단백질　L34 (RPL34), 리보좀 단백질　S17 (RPS17), 리보좀 단백질　SA (RPSA) or 리보좀 단백질 S17 (RPS17) 의 3'-UTR 영역으로부터 유도된다. 대안적인 실시예에서, 상기 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자로부터 또는 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU), 리보좀 단백질 L22-유사1 (RPL22L1), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자 (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로부터 선택된 유전자로부터 유도될 수 있다. 게다가, 본 발명에 따른 인공 핵산 분자의 3'-UTR 요소는 바람직하게 리보좀 단백질 S4-유사 (RPS4l), 추정(putative) 60S 리보좀 단백질 L13a, 추정 60S 리보좀 단백질 L37a-유사 단백질, 추정 40S 리보좀 단백질 S10-유사, 추정 40S 리보좀 단백질 S26-유사 1, 추정 60S 리보좀 단백질 L39-유사 5, 또는 60S 산성 리보좀 단백질 P0-유사로 이루어진 군에서 선택된 유전자의 3'-UTR 영역으로부터 유도된다.

특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자의 3'-UTR 영역으로부터, 바람직하게 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　S4,　X-linked (RPS4X), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　S18 (RPS18) or 리보좀 단백질 S17 (RPS17)의 3'-UTR 영역으로부터 유도된다. 다른 바람직한 실시예에서, 상기 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자로부터 또는 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된 (FAU) 및 리보좀 단백질 L22-유사 1 (RPL22L1)로부터 선택된 유전자로부터 유도될 수 있다.

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는, SEQ ID Nos: 10 내지 115에 따른 핵산 서열 또는 상응하는 RNA 서열과 같은, 리보좀 단백질 유전자의 3'-UTR의 핵산 서열에 대해 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%의, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100% 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다:

호모 사피엔스 리보좀 단백질　L9 (RPL9)

gatctaagagttacctggctacagaaagaagatgccagatgacacttaagacctacttgtgatatttaaatgatgcaataaaagacctattgatttggaccttcttctt

(SEQ ID NO:10)

호모 사피엔스 리보좀 단백질　L3 (RPL3)

tgccaggaacagattttgcagttggtggggtctcaataaaagttattttccactgac

(SEQ ID NO:11)

호모 사피엔스 리보좀 단백질　L4 (RPL4)

actcttaaatttgattattccataaaggtcaaatcattttggacagcttcttttgaataaagacctgattatacaggcagtgagaaacatg

(SEQ ID NO:12)

호모 사피엔스 리보좀 단백질　L5 (RPL5)

acccagcaattttctatgattttttcagatatagataataaacttatgaacagcaact

(SEQ ID NO:13)

호모 사피엔스 리보좀 단백질　L6 (RPL6)

atgtcttaagaacctaattaaatagctgactac

(SEQ ID NO:14)

호모 사피엔스 리보좀 단백질　L7 (RPL7)

ggtgtctaccatgattatttttctaagctggttggttaataaacagtacctgctctcaaattgaaat

(SEQ ID NO:15)

호모 사피엔스 리보좀 단백질　L7a (RPL7A)

atgtacactgttgagttttctgtacataaaaataattgaaataatacaaattttccttc

(SEQ ID NO:16)

호모 사피엔스 리보좀 단백질　L11 (RPL11)

attcccgtttctatccaaaagagcaataaaaagttttcagtgaaatgtgc

(SEQ ID NO:17)

호모 사피엔스 리보좀 단백질　L12 (RPL12)

gcacaaaggaaaacatttcaataaaggatcatttgacaactggtgg

(SEQ ID NO:18)

호모 사피엔스 리보좀 단백질　L13 (RPL13)

ctctggggcagcctcccacagtgggtggggctttgccagcagtgcccacgggggtcatggggccaggcgcgctccggcgcctgcagaactgatcggggatagtctcaggaggcgctagtcacgtgccccggtgatcggggatagtctcagaaggcgctagtctcctgccccggtgatcggggatagtctcaggaggcacgagtcgcctgcctcggtgatgcaccgtttctcacaccggctgctctggcccgagctaaaggggaagacgtgtgcggataggagctgcacacaattttcctccatgtattgtttattttgctttttcttttggctagacattaggaatttcagttttcccaagttgtatttttccttttctattttaaaattatcatgcagggctgggtgaggtcgctcacgcctatagtctcaaaactttgggaggctgaggggggaggatggcatgagcccaggagtttaaggctgcagtgagccgagatcgctccactgtcctccagcctgcatgacagagcgagaccctatctcaggaaaaaaaaaaacaaaactattatgcagtagtttcgaccctggaagacgagtgtgcatctttgagttgtaacacgtgtacctcgcccatccaggcgtagtttcatttggaatctggttatcctgtagttgctttgttaaaaatatatgtaattgcaaatcattt

(SEQ ID NO:19)

호모 사피엔스 리보좀 단백질　L23 (RPL23)

ttctccagtatatttgtaaaaaataaaaaaaaaaactaaacccattaaaaagtatttgtttgc

(SEQ ID NO:20)

호모 사피엔스 리보좀 단백질　L18 (RPL18)

ccctggatcctactctcttattaaaaagatttttgctgacagtgc

(SEQ ID NO:21)

호모 사피엔스 리보좀 단백질　L18a (RPL18A)

gtgcagggccctcgtccgggtgtgccccaaataaactcaggaacgccccggtgctcgccgc

(SEQ ID NO:22)

호모 사피엔스 리보좀 단백질　L19 (RPL19)

aacctcccactttgtctgtacatactggcctctgtgattacatagatcagccattaaaataaaacaagccttaatctgc

(SEQ ID NO:23)

호모 사피엔스 리보좀 단백질　L21 (RPL21)

taggtgttaaaaaaaaaaataaaggacctctgggctac

(SEQ ID NO:24)

호모 사피엔스 리보좀 단백질　L22 (RPL22)

agtaatgcaaaagtgtctgcattagaatttacggtgtctaaaattcatgtttttaaaagagcttgcctacagatggtttccacacttgaaattgtgccctgcgagttgcatagctggaagttcaatgctcagtcctaccttggctcccattaaacatttggtgctctgtggattgagttgaacgtgttgaggctttgcaatttcacttgtgttaaaggctctggcatttttccatttctatgcaaatttctttgaagcagaattgcttgcatatttcttctctgccgtcacagaaagcagagtttctttcaaacttcactgaggcatcagttgctctttggcaatgtcccttaaccatgattattaactaagtttgtggcttgagtttacaaattctacttgttgcattgatgttcccatgtagtaagtcatttttagtttggttgtgaaaaaaccctgggctgaagttggcatttcagttaaaagaaaaaaagaaactagtcccagatttgaaaacttgtaataaaattgaaactcactggttttctatgtctttttgaactcttgtaatcgagttttgatcatattttctattaaagtggctaacacctggctactcttactgt

(SEQ ID NO:25)

호모 사피엔스 리보좀 단백질　L23a (RPL23A)

actgagtccagctgcctaattctgaatatatatatatatatatcttttcaccatatacatgcctgtctgtcaatttctggttgggctgggaggccacacacacacactgacatgacagggcttgggcaagactcctgttctacttatccttttgaaatacctcaccctgccactccaccatgtatgatcattccagagatctttgtgactagagttagtgtcctaggaaaaccagaactcagaacttgcctccatggttgagtaacaagctgtacaagaaccccttttatccctggaagaggctgtgtatgaaaccaatgcccagggtttgaagggtgttagcatccatttcaggggagtgtggattggctggctctctggtagcattttgtcctcacacacccatctactatgtccaaccggtctgtctgcttccctcaccccttgcccaataaaggacaaggacttcagagg

(SEQ ID NO:26)

호모 사피엔스 리보좀 단백질　L17 (RPL17)

attcagcattaaaataaatgtaattaaaaggaaaag

(SEQ ID NO:27)

호모 사피엔스 리보좀 단백질　L24 (RPL24)

actggcagattagatttttaaataaagattggattataactctag

(SEQ ID NO:28)

호모 사피엔스 리보좀 단백질　L26 (RPL26)

agtaatcttatatacaagctttgattaaaacttgaaacaaagagcctg

(SEQ ID NO:29)

호모 사피엔스 리보좀 단백질　L27 (RPL27)

atgctttgttttgatcattaaaaattataaag

(SEQ ID NO:30)

호모 사피엔스 리보좀 단백질　L30 (RPL30)

accttttcacctacaaaatttcacctgcaaaccttaaacctgcaaaattttcctttaataaaatttgcttgttttaaaaacattgtatct

(SEQ ID NO:31)

호모 사피엔스 리보좀 단백질　L27a (RPL27A)

tcggccgcgttcatcagtcagcacgacccgacctcagtggcgtcctcacaacacagaccggaccttgggtcttaccccggcacctgagaaccacttccggtgagtagcttctacttccggagacgatgactcccccgcgtcccagaccggaagaagcccggcggagaccggcctcgctcggccacttccggcaagggcggagccggccagtggtgcgcgagcgcagataactcccctggagaggcgggatgttcaactccacccctggtccttgggcggccgtgggtccccttcgaagcggaggaatggccaacctcgccgcacttcgagcccctttagggtgcgtttaagaacagtgggcgtggcctttacgtaaatcttcgagatgggaacctccagaatttgtctcaattgtctaaaaggtaatgagcgtcagcgacattcaagggcactttgggctaaaaaagaaagtgcttgtacacggatggaaatattctagaagaacataaaaggaatttcctcttaggaggttagggaaatgagcacgaagtatgttttggtgcagttttttgttcaacccaatgcgtattttcatattgagaggcaatataaatggagcgaaagtatcttgagaaaaaaaaaaaaactaccagaacttgccgttgctgaaaagtaatattttctctttcgagagttttcatggccttttaaattacacccccacctccacaggcaaataaatttgttttggaatgcataccacatcatctggctctagaaacgtattttgtgtagctcccctagcaagaatataggttaaagcgtaaatttaattcctggctctattttacatcccaatttttattttcctctcattcccactttacgttgtttcaaataacctagtttgtgtatccctgtaagtcattttggtataaagtaggttataagtgtacatgcgaaaagatgtttttaacaaaaatgtaactg

(SEQ ID NO:32)

호모 사피엔스 리보좀 단백질　L28 (RPL28)

gacttgggcagctcgtttagtagcaccgtgcctcagtttcccatatgtaaaaggccattttgagtgcctttcacagccctgcataaggcaggtgtctcagtgttcactgctgtctctccagctcttagtccagtagctgcatggtgagtgagcgtagggcgcaccctggaaggctgccaagcccaaagttgtgcagagcgctggggactccagactccccacagcagcagagactcgggactgaggcatcctctgttcacaggacatgctggcatctactgggtcagggctctgctgctcggtggctgtgcaaccttgggcaagttcctcaacctctctgtgtcttcgtaccctcatctgtaacatgcgtgtcgatagaccctactactcagggttgatgagaagattaaatgtgcaaaacctgcttgactgtgcccacaaatcctgattgtaggaataaattaatgactttttataaatattttgatcagatggactcatgatcacagatgtcttcacatgcctatgactaatttgtacacaaactaatgctcgtgtttcccaagcacctggaagacatgccagatccatgtgcagtaatgcctggtggctccaggtctgccccgccgtcctgtggggctgtgagctttcccagcctcctgcccgtgtttgtgaatatcattctgtcctcagctgcatttccagcccaggctgtttggcgctgcccaggaatggtatcaattcccctgtttctcttgtagccagttactagaataaaatcatctacttt

(SEQ ID NO:33)

호모 사피엔스 리보좀 단백질　L28 (RPL28)

ttttttactgtcaggcaggaagagcggtaactgccatcgcggcgggcatccctggcgccagggtgttggtctgggtaccggcttccctctcggccgacttgtcagctctgtgagccgcgcgcgtctgagcccgtgtcctcacctgtaaagtggagaaatgaaaaaggacctgaacttcctcggtggttgttgagagttaaggcacggggttgatgttttcagatgaaattctcaaagcaagtcagggtggggatggatggtttcatcccacaggtgggaagattgagg

(SEQ ID NO:34)

호모 사피엔스 리보좀 단백질　L28 (RPL28)

gtttttctcaggtccttgattggaactgcctcagagccaagggtccttttactcagtggcagcaacaaacgcagtctgttggctagtgatcctcctgtctcagggacacgtagtccagggagcagccaattgcttggcacttggggaccccgttctggggagtcctgaaagctttcacctcttggattgccgaatacatgggtggcccttcctagactaagggactggcctgagtgaggctgggcctctcagccaagctgatgttgaaccactgctgtggggatgggcctggggttcctgggaagctgttcatacccattgccaggagcgtgggctctggctggacctggatcagatcctaactgaagcggcagctttctggcatgagaaaggagtgttttcatggtggacagaattgggctatgagtgt

(SEQ ID NO:35)

호모 사피엔스 리보좀 단백질　L29 (RPL29)

atatctctgccaacatgaggacagaaggactggtgcgaccccccacccccgcccctgggctaccatctgcatggggctggggtcctcctgtgctatttgtacaaataaacctgaggcagg

(SEQ ID NO:36)

호모 사피엔스 리보좀 단백질　L31 (RPL31)

agggagccctcctggaagtggatgaggccttgggtctcggctcttcattgcttcctgagctgcagcagatgcctttacaaccaagctcaccgaggacgtctgtctcccatattaccctggcagagggccaggcctgttctacacggccggggtttcaacaaggtactgatgtcttctgcccttgcctcttcgacaggcaagtaataagacttaagtgaagagaattctttaggcacacaaattcacatttgatgtaatctcattatacttcctgatctgtgattgaaaactttcatttcgtaactagtatgtctgtcccacctttaaaaagtttttcattatgaaagtaagtatttgttagaattaagtctatttaaatgaaaaaaacttagatatgagtctgcatggcctcaggaaaatgatgttttaaaatagagattttaggttgtctgcactctagcttttttgtcgttttcttaaggcttttttaactgcatcaaaaattcagatacgaaacatacactaaaaaataatacatcatatcttaatttccactgaacttgatttaaattcagagttacacagtatgaatatcacaatcagatatgttcaaaaaggtctgaacaattgattttctgaaaccatgaaggactac

(SEQ ID NO:37)

호모 사피엔스 리보좀 단백질　L31 (RPL31)

agccatttaaattcattagaaaaatgtccttacctcttaaaatgtgaattcatctgttaagctaggggtgacacacgtcattgtaccctttttaaattgttggtgtgggaagatgctaaagaatgcaaaactgatccatatctgggatgtaaaaaggttgtggaaaatagaatgcccagacccgtctacaaaaggtttttagagttgaaatatgaaatgtgatgtgggtatggaaattgactgttacttcctttacagatctacagacagtcaatgtggatgagaactaatcgctgatcgtcagatcaaataaagttataaaattgccttc

(SEQ ID NO:38)

호모 사피엔스 리보좀 단백질　L32 (RPL32)

tcaacttagcagaaatgctgcgctgggtataataaagcttttctacttctagtctagacaggaatcttacagattgtctcctgttcaaaacctagtcataaatatttataatgcaaactggtccttc

(SEQ ID NO:39)

호모 사피엔스 리보좀 단백질　L35a (RPL35A)

actaacgaaaaatcaataaataaatgtggatttgtgctcttgtatttttaagtggattaaaaaacttactacctt

(SEQ ID NO:40)

호모 사피엔스 리보좀 단백질　L37 (RPL37)

ttacttgtaacctggaatggctttataatgtgctagctaattgctactctcatcttgtattttaactcctaatttacccttcaggtctcagcttcagaacattcacttataaagaaaccctgctgattaaatctctcttgggcttcctccc

(SEQ ID NO:41)

호모 사피엔스 리보좀 단백질　L37a (RPL37A)

acgctcctctactctttgagacatcactggcctataataaatgggttaatttatgtaac

(SEQ ID NO:42)

호모 사피엔스 리보좀 단백질　L38 (RPL38)

accagacacactgattggaactgtattatattaaaatactaaaaatcct

(SEQ ID NO:43)

호모 사피엔스 리보좀 단백질　L39 (RPL39)

ggaattgcacatgagatggcacacatatttatgctgtctgaaggtcacgatcatgttaccatatcaagctgaaaatgtcaccactatctggagatttcgacgtgttttcctctctgaatctgttatgaacacgttggttggctggattcagtaataaatatgtaaggcctttcttttt

(SEQ ID NO:44)

호모 사피엔스 리보좀 단백질,　라지,　P0 (RPLP0)

tcaccaaaaagcaaccaacttagccagttttatttgcaaaacaaggaaataaaggcttacttctttaaaaagt

(SEQ ID NO:45)

호모 사피엔스 리보좀 단백질,　라지,　P1 (RPLP1)

acctcttttataacatgttcaataaaaagctgaacttt

(SEQ ID NO:46)

호모 사피엔스 리보좀 단백질,　라지,　P2 (RPLP2)

attcctgctcccctgcaaataaagcctttttacacatctc

(SEQ ID NO:47)

호모 사피엔스 리보좀 단백질　S3 (RPS3)

actcataaattggtcatcttaaccatttaagtgtacacttctatagtgacagagttagccctctgtccaagggatttgcatctgtggattcaaccaactttgggtcaaaaataatcaaaaaggatggttgtgtgtgtattgaacatgtagacttatttttcttattttcaaaatactatattttcttgtcacttattttcttgtacactgcagttgtaacagctatgtagcatgtacattaggtattaaaagtaatccagtgaagattgaaagtct

(SEQ ID NO:48)

호모 사피엔스 리보좀 단백질　S3 (RPS3)

cagcctcttccatgagtggggagcccgctgcttgtctccagctcctagcagtgagtcctgataatctcaaatttaaggacagtaactttgtctgggatgagtgtgggaaaggatgtgtttgggaacagacgcgagcctgcagaggtgtttgtaaccatctctttctaagtggtgggaagcagacattttattctttaactgttaatatatatagtgtgtgttttttatgcatgaaatattttatagtttttaaaaatgcccacactactattttgaaagtaaatgaggtaatgtatgtgtcagaacccaatacccaaagcgatcgtagtaagaggtggggcctttgggaaggcattaaattgcttagggaatgagggtggaaccctcatgaatgagattagagccttataggagaggttggagggagttgcctggcctccctctcccatgtgaagactcagcaagaaaacattatttaggaagcagagagccctcatcaaacaccagatctgctggccacctgatctggcactttccagccttcagaactgtgagaaataaatttctgttgtctat

(SEQ ID NO:49)

호모 사피엔스 리보좀 단백질　S3A (RPS3A)

agttcagacttcaaatagtggcaaataaaaagtgctatttgtgatggtttgcttctg

(SEQ ID NO:50)

호모 사피엔스 리보좀 단백질　S3A (RPS3A)

gttagctaagagggtgtaatggaaaaagcataaggcttggactcagaagactctactaactttgccactagctagctatgtaattcagatcatctatcctttacatgtgaaaggtaaataatggcttatcttaacaggaggatttatgcaggttaaatgaggtaggtgttatgtgtaggtttattccaaggcttctctacttttaaaggaaatggcttatatctgagaactaggacttttagaaaaaaatttactgttactggtttgcaggattccagacagcattggaaaagacatag

(SEQ ID NO:51)

호모 사피엔스 리보좀 단백질　S4,　X-연결된 (RPS4X)

aatgggtccctgggtgacatgtcagatctttgtacgtaattaaaaatattgtggcaggattaatagca

(SEQ ID NO:52)

호모 사피엔스 리보좀 단백질　S4,　Y-연결된　1 (RPS4Y1)

attgcagtagcagcatatctttttttctttgcacaaataaacagtgaattctcgtttctt

(SEQ ID NO:53)

호모 사피엔스 리보좀 단백질　S5 (RPS5)

ttttcccagctgctgcccaataaacctgtctgccctttggggcagtcccagcc

(SEQ ID NO:54)

호모 사피엔스 리보좀 단백질　S6 (RPS6)

gattttttgagtaacaaataaataagatcagactctg

(SEQ ID NO:55)

호모 사피엔스 리보좀 단백질　S7 (RPS7)

acaaaaatgactaaataaaaagtatatattcacagt

(SEQ ID NO:56)

호모 사피엔스 리보좀 단백질　S8 (RPS8)

atccttgttttgtcttcacccatgtaataaaggtgtttattgttttgttcccaca

(SEQ ID NO:57)

호모 사피엔스 리보좀 단백질　S9 (RPS9)

gtccacctgtccctcctgggctgctggattgtctcgttttcctgccaaataaacaggatcagcgctttac

(SEQ ID NO:58)

호모 사피엔스 리보좀 단백질　S10 (RPS10)

aattggagaggattcttttgcattgaataaacttacagccaaaaaacctt

(SEQ ID NO:59)

호모 사피엔스 리보좀 단백질　S11 (RPS11)

ggctggacatcggcccgctccccacaatgaaataaagttattttctcattcccaggccagacttgggatcttccgcg

(SEQ ID NO:60)

호모 사피엔스 리보좀 단백질　S12 (RPS12)

agaaataaatctttggctcac

(SEQ ID NO:61)

호모 사피엔스 리보좀 단백질　S13 (RPS13)

atttgtctgtgtactcaagcaataaaatgattgtttaacta

(SEQ ID NO:62)

호모 사피엔스 리보좀 단백질　S15 (RPS15)

tggctcagctaataaaggcgcacatgactcc

(SEQ ID NO:63)

호모 사피엔스 리보좀 단백질　S15a (RPS15A)

ggatgtaatacatatatttacaaataaaatgcctcatggactctggtgcttcc

(SEQ ID NO:64)

호모 사피엔스 리보좀 단백질　S16 (RPS16)

gcccatcgtgactcaaaactcacttgtataataaacagtttttgagggattttaaagtttcaag

(SEQ ID NO:65)

호모 사피엔스 리보좀 단백질　S19 (RPS19)

aacaaaccatgctgggttaataaattgcctcattcgt

(SEQ ID NO:66)

호모 사피엔스 리보좀 단백질　S20 (RPS20)

ctgcattctcctccgccaaaaaagtgaccaagcagagtctttctctgtcacccaggctggagtgcaatggcgtgatctcagctcactgcaacctctgcctcctgggttcaagtgattctcgtgtctcagcctcctgagtagctgagactacaggtgtgcaccagtgttcccagctgatttttgtattttatgtagagatggggttatgccattttggccaggctagtctcgaactcctgagctcaggtgatacacacacctcagcaaatcttttaaattatacattctgtgatatttccttgactttcttatccagcacttgtattgattatttttcattttgataatgttgggtttttaaaaactcctttatgatggaaaatttc

(SEQ ID NO:67)

호모 사피엔스 리보좀 단백질　S20 (RPS20)

gtcaactattttaataaattgatgaccagttgttaacttctgttggtttttattcagaatactggcagattttaggaatataaaggtgtactatgagacttccacttttcaggtggaatatatgggtatcttagagtggtctatcctgttttcgttgtcgtttgagtcatttgaaaactggattccgttaactacataatatgtgagacctgactggttttattggacactggcagtttataactttggcatactctagataaattctgattggtatgggg

(SEQ ID NO:68)

호모 사피엔스 리보좀 단백질　S21 (RPS21)

ctggagagaatcacagatgtggaatatttgtcataaataaataatgaaaacct

(SEQ ID NO:69)

호모 사피엔스 리보좀 단백질　S23 (RPS23)

acttaactcaaaatggatcatatatctaaatgtaaaatggaaagctataaaactgaaaacagactatctttacaacctaggcgtaggtatagtttttagacattacaccaaaagcacatgccgtaaaagaaaaaatagataaattggtggatttcattaaaattaaaaaactttttctctctgaaaaatcctgttaagctgggcgctgtggttcatgcctgtaatcccagcactttgggaggctgagttgggaagaaattaatagcttgaggccaggagttcaagatcatcctgggcagcaaagtcatacactcttgagggaagagagagaccttctcatattgttttatattgttttatactcagtacctgttttaagaaaaaaacaaggaagtgaaatcaaagacaggcagcccggcaccaggcctgaaaccagccctgggcctgcctggcctaaacctagtagttaaaaatcaacttacgacttagaacctgatgttatccgtagattccaagcattgtataaaaaaattgtgaaactccctgttgtgttctgtaccagtgcatgaaacccctgtcacatatcccctagattgctcaatcaatcacgaccctttcatgtgaaatctttagtgttgtgagcccttaaaagggacagaaattgtgcacttgaggagctcagattttaaggctgtagcttgccgatgctcccagctgaataaagcccttccttct

(SEQ ID NO:70)

호모 사피엔스 리보좀 단백질　S25 (RPS25)

ataggtccaaccagctgtacatttggaaaaataaaactttattaaatc

(SEQ ID NO:71)

호모 사피엔스 리보좀 단백질　S26 (RPS26)

ggagctgagttcttaaagactgaagacaggctattctctggagaaaaataaaatggaaattgtactt

(SEQ ID NO:72)

호모 사피엔스 리보좀 단백질　S27 (RPS27)

aagcactctgagtcaagatgagtgggaaaccatctcaataaacacattttggataaatcctg

(SEQ ID NO:73)

호모 사피엔스 리보좀 단백질　S27a (RPS27a)

ctgtatgagttaataaaagacatgaactaacatttattgttgggttttattgcagtaaaaagaatggtttttaagcaccaaattgatggtcacaccatttccttttagtagtgctactgctatcgctgtgtgaatgttgcctctggggattatgtgacccagtggttctgtatacctgccaggtgccaaccacttgtaaaggtcttgatattttcaattcttagactacctatactttggcagaagttatatttaatgtaagttgtctaaatataa

(SEQ ID NO:74)

호모 사피엔스 리보좀 단백질　S28 (RPS28)

gcttggctgctcgctgggtcttggatgtcgggttcgaccacttggccgatgggaatggtctgtcacagtctgctccttttttttgtccgccacacgtaactgagatgctcctttaaataaagcgtttgtgtttcaagtt

(SEQ ID NO:75)

호모 사피엔스 리보좀 단백질　S29 (RPS29)

atgctcttccttcagaggattatccggggcatctactcaatgaaaaaccatgataattctttgtatataaaataaacatttgaaaaaacccttc

(SEQ ID NO:76)

호모 사피엔스 리보좀 단백질　L15 (RPL15)

ccatgtcttccaggagactagactactgttgtccagggtcaatttgagtgtaaagaaaatgtagacaaggaattgcccaattttaaattctgactttgctgacttaatttaaatgctcgttctgaaccaattttctcctatcttctctaggggtttcaaaagactcagttaattgatttccaggaagtactcatagcaagttcataaaagttcttgagacctaaatttcttcacaaaaaaagaaaagatcttaagtcatacattttaattgtgtagaggttgttcaactgaaggaataaatgtctattaaactaaaacaaatggaccttc

(SEQ ID NO:77)

호모 사피엔스 리보좀 단백질　L15 (RPL15)

atagataatacattaacgttaaaaattcaaaagataagtataggctctacagtacaaacccttctgcctcctagttcctctccctggaggcaaggtgatcagtttaacaatatttttttattttgagacagggtctcactgttgcccaggctggagtgtagtggcgcgttcacaacttactgtagcctcaacctcctggctcaagcaatcctcccacctcagcctgtcgagtagctggaaccacaggtgcacaccaccatgccaggctaatttttgtattttttgtagagacagggtttcaccatgttgttcaggctggtctcaaagtcctgggctcaagcaatcttcctgtctctgcttcccaaagtgctgggattacagatgtgggccacggtgcctggcctacatatgtattttttccttttcttccccaagtggtaggatatgatacacattgttgatttttttgtttagttatgtatctcagagcttattctttatcagctcatgaggaacttcatttttttttttttttttgagatgtagttttgctcttatagcccaggttggagtacagtaacacaatcttggctcgcagcaacttctgcctcccaggttcaagcgattctcctgcctcagcctccgagtagctaggattacaggtgcctgccactacatccagctatttttgtattttcagtagagacggggtttcaccattttggccaagctggtctcgaactcctgacctcaggtgatccgcccatctcagcctcccaaagtagtgggattacaggcatgagcaaccgtgcccggctggaacttcattcttttggtataactgcatggtatcccatcatgtggatgtaccatgattcattggatgtggaccctcctgatggacatttaaatttcttccaatctgttgctattacaaaaagaaaaatgtgtgcatacatctttattcatctgtagaataaattcttagaagt

(SEQ ID NO:78)

호모 사피엔스 리보좀 단백질　S2 (RPS2)

ggtttttatacaagaaaaataaagtgaattaagcgtg

(SEQ ID NO:79)

호모 사피엔스 리보좀 단백질　L14 (RPL14)

gtggcaatcataaaaagtaataaaggttctttttgacctgttgacaaatgtatttaagcctttggatttaaagcctgttgaggctggagttaggaggcagattgatagtaggattataataaacattaaataatcagttc

(SEQ ID NO:80)

호모 사피엔스 리보좀 단백질　S14 (RPS14)

acaagattcctcaaaatattttctgttaataaattgccttcatgtaaactgtttc

(SEQ ID NO:81)

호모 사피엔스 리보좀 단백질　L10 (RPL10)

tctagcgtcccagccagtgtttttcctgacctctgttctttggagaggaggatggaagggaggggtccggcacgctgctggcattttgctgtgtcctgcagcccctttccgggacacctgggttcacacagctttttagcttacataactggtgcagattttctgtgtggagatgttgccttgaccagccttggctggactttaccaggcatgcagaagcctgtaccaacacagactacagcacccaggaggtgcgagtgtggctgctcagcggttataacaggcctgactgcattgttcaccggattataatgagccaaaatgtttcccggtgtttgctggtttcagggaaggagtttgatatagcagattaaccaccctccttgtagctattggggcttaatggtttcctggtgattcttaccaatccacaataaacatggcccattggcatatctgc

(SEQ ID NO:82)

호모 사피엔스 리보좀 단백질　L10a (RPL10A)

ggcacatttgaataaattctattaccagttc

(SEQ ID NO:83)

호모 사피엔스 리보좀 단백질　L35 (RPL35)

ggggcgcattgtcaataaagcacagctggctgagactgc

(SEQ ID NO:84)

호모 사피엔스 리보좀 단백질　L13a (RPL13A)

gcccaataaagactgttaattcctcatgcgttgcctgcccttcctccattgttgccctggaatgtacgggacccaggggcagcagcagtccaggtgccacaggcagccctgggacataggaagctgggagcaaggaaagggtcttagtcactgcctcccgaagttgcttgaaagcactcggagaattgtgcaggtgtcatttatctatgaccaataggaagagcaaccagttactatgagtgaaagggagccagaagactgattggagggccctatcttgtgagtggggcatctgttggactttccacctggtcatatactctgcagctgttagaatgtgcaagcacttggggacagcatgagcttgctgttgtacacagggtatttctagaagcagaaatagactgggaagatgcacaaccaaggggttacaggcatcgcccatgctcctcacctgtattttgtaatcagaaataaattgctttt

(SEQ ID NO:85)

호모 사피엔스 리보좀 단백질　L36 (RPL36)

gcccctcccctgccctctccctgaaataaagaacagcttgacag

(SEQ ID NO:86)

호모 사피엔스 리보좀 단백질　L36a (RPL36A)

gtgtcatcttttattatgaagacaataaaatcttgagtttatgttcacttcatttgtttgctgttcatcttttgggagggaataagctagagccatcaatacaattccgcttgtggggaaatttatgcctcttactggtactacttgttttgcattgaagctgactggttgagttcacatcatatgttgcaattttctaatttggcacttcaatcactaggggccttatgaggcagtttgtcattatgcaatggttattggttatcatgtgagtagacacatttcaggctaatagggagaagtcagtaacacattcatagtgaatatgagatgtctttgctaagagttaagtgtcagatctttgttataacagttaatttaataaagaattttggcattgttcttc

(SEQ ID NO:87)

호모 사피엔스 리보좀 단백질　L36a (RPL36A)

gcgggtggatcacctgaggtcaggagttcgagaccagcctggccaagatagtgaaaccccgtctctagtaaaaatacaaaaattagccgggcttgtggtgtgggcctgtaatctcagccacccgggaggctgaggcaggagaatcgctggaacctgggaggcagaggctgcagtgagccgagatcacgccactgtactccagcctgggcgacagagcaagactccatctcaaaaaaaaaaaaaaaaaaaagggaaaaagaaaatgcacctatacacagtggtactattcagccataaaaagaatgagatccagtcatttacaacaacatgggtggaactggagatcgttatgttaagtgaaataggcacacaaagacaagcatcacatgttcttgtttgtgggatctaaaaatcaaaacaagtggacttgtcatatagagagtagaaggatggttaccagaagctgagaacttctggtggcgggaggtggggatggttaatgggtacaaaaagaaaaaagaatgaattagaccaactatttgatagcacgacagcgtgactaaagtcaataacttagttacatattttaaaataacttagagtgtaattggattgtttgtacctcaaagaaaaaatgcaataaaactttacagtggagaaacctaacaagcactacctcagccaggtaatcaaggttaacatcaacagtcacgagtcatgttgatatatacccttgataaggtgtgatgaaaatgacacttaaacctaaaaatccataaccctatctaatgagaaaaataacaaatcccaagaggggcattttacaaaatacttgaccagtagtgcggaaattgtcaaggtcatcaaaaaagtctgagaaattgccacagccaaaggagtctagagacatgatgactaaatgttaggtggtgtcctgcgtggggtcctagaacagaaaaaggacattag

(SEQ ID NO:88)

호모 사피엔스 리보좀 단백질　L41 (RPL41)

accgctagcttgttgcaccgtggaggccacaggagcagaaacatggaatgccagacgctggggatgctggtacaagttgtgggactgcatgctactgtctagagcttgtctcaatggatctagaacttcatcgccctctgatcgccgatcacctctgagacccaccttgctcataaacaaaatgcccatgttggtcctctgccctggacctgtgacattctggactatttctgtgtttatttgtggccgagtgtaacaaccatataataaatcacctcttccgctgttttagctgaagaattaaatc

(SEQ ID NO:89)

호모 사피엔스 리보좀 단백질　S18 (RPS18)

gtctgtaggccttgtctgttaataaatagtttatatac

(SEQ ID NO:90)

호모 사피엔스 리보좀 단백질　S24 (RPS24)

agtgtctagcagtgagctggagattggatcacagccgaaggagtaaaggtgctgcaatgatgttagctgtggccactgtggatttttcgcaagaacattaataaactaaaaacttcatgtgtctggttgtttg

(SEQ ID NO:91)

호모 사피엔스 리보좀 단백질　S24 (RPS24)

ccaccgtgcctggctggacatcttgttattaaagcttcttctctctttgtaggggagggggagatgcctctggtggagaagaccagtgtggcagtgactgtgtctgttagtgaacctggtggctggttgagggtctgtcgtggtgactgaggacacatacaaagtgcttttctcagtggtcaccttggtgttggtgaataagggtcagaagatggctcctgtcctagggcactgccagtcggtttggaagctgaaatgcctgcttagcagtttgaggaaacacagaccttggaggatcttctggttgcctcttcaagaattcattctattccccttctgctccccaaatttgcttttcttggggtgggtcttggttggcctaagccaagaaagtatggcatctactccttccatagcaatagctcaggaataggcagtgacccagacctgaaccaatcagtgcatggaattacccctggccaaagtggttgattgaggctgggtgcaagcagagttgtgagaaggctcccatttggtggttggagagatcgcacttgctccagaggtcataatgtgcagatctgaggcttggaactgctgcagacattttgctaccacaagtgaagccaccctgacgacacagttgacaatttggagcagggcagagctgagagaacagcagggaaacagccagagtcttgctcaagcctccctgaagtatctatacccctggactctagttatgggggctaataaatgttatatactgtttaaggt

(SEQ ID NO:92)

호모 사피엔스 리보좀 단백질　L8 (RPL8)

tgctgagggcctcaataaagtttgtgtttatgcc

(SEQ ID NO:93)

호모 사피엔스 리보좀 단백질　L34 (RPL34)

aaaaatgaaacttttttgagtaataaaaatgaaaagacgctgtccaatagaaaaagttggtgtgctggagctacctcacctcagcttgagagagccagttgtgtgcatctctttccagttttgcatccagtgacgtctgcttggcatcttgagattgttatggtgagagtatttacacctcagcaaatgctgcaaaatcctgttttcccccagagagctggaggttaaatactaccagcacatccctagatactactcaagttacagtatatgatcactaatatagtatgctcttggtaccaggagctctgatatatatctggtacatgtttgataatgacttgattgttattataagtacttattaatacttcgattctgtaaagagtttagggtttgattttataaaatccaaaatgagccttttattgaatccagttctctatgtgaccagttctctgtatgaatggaagggaaaagaattaaaaatcttgcaaagggg

(SEQ ID NO:94)

호모 사피엔스 리보좀 단백질　L34 (RPL34)

(SEQ ID NO:95)

호모 사피엔스 리보좀 단백질　S17 (RPS17)

attttttctgtagtgctgtattattttcaataaatctgggacaacagc

(SEQ ID NO:96)

호모 사피엔스 리보좀 단백질　SA (RPSA)

gctgttcttgcataggctcttaagcagcatggaaaaatggttgatggaaaataaacatcagtttctaaaagttgtcttcatttagtttgctttttactccagatcagaatacctgggattgcatatcaaagcataataataaatacatgtctcgacatgagttgtacttct

(SEQ ID NO:97)

호모 사피엔스 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52)

ccagtttggggactttcacaaaagacccccatgactcagggttttgagttcttaactgatcgaatgaaggattcaaaattaaccactccaaggggggattgaaggaagaaccactcttaatggacaaaaagaaagaaaggggagggagtaacagggatatgagctctagccgcccaagctagcaatggcaacccttctgggtccccttccagcatgtggaagctttcctttcgcttcattcaataaacagctgctgctc

(SEQ ID NO:98)

호모 사피엔스 Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU)

gtcttttgtaattctggctttctctaataaaaaagccacttagttcagtcatcgaaaa

(SEQ ID NO:99)

호모 사피엔스 리보좀 단백질 L22-유사 1 (RPL22L1)

tgtactgctgagcctgatggtggtgccactacttcaggtacttagatgagtcttgatgctaatagaattgtgtcgccaaacatatctggacagttacaacctaatctatgcattaattggtttgggaattgcttgaaattattgtttaattcaatgttttaattcgttttcctaaaaatttaagtgcccccatcatcgtgcaatacctcagtgcagcaactccttgattcttggatgactgaacttcctaacttggctctgccccattgttcccatttttcatgtttttcacaaatagttaaccaggtacctactactgtgcaccgctgcagagcattgaggatgtatgtgatgagtaaaaacacccagcctgctctgctgtgttagtattatgacggaaactgatcaaatcacatgtgaacaaatttactgctacaaaagggagggcttaataaaaggaatttcatctgggaaggc

(SEQ ID NO:100)

호모 사피엔스 리보좀 단백질 S17 (RPS17)

attttttctgtagtgctgtattattttcaataaatctgggacaacagc

(SEQ ID NO:101)

호모 사피엔스 리보좀 단백질 L39-유사 (RPL39L)

ggaattgcacatgagatggcacacatatttatgctgtatcaagttcacgatcatcttacgatatcaagctgaaaatgtcaccactacctggacagttgcacatgttttactgggaatatttttttctgtttttctgtatgctctgtgctagtagggtggattcagtaataaatatgtgaaagcttttgtttcc

(SEQ ID NO:102)

호모 사피엔스 리보좀 단백질 L10-유사 (RPL10L)

aggttttggcagtactgtctccttgggccatgctggtctgacttatgcttactaataaattctgtttactggc

(SEQ ID NO:103)

호모 사피엔스 리보좀 단백질 L36a-유사 (RPL36AL)

actttgggatatttttcttcaattttgaagagaaaatggtgaagccatagaaaagttacccgagggaaaataaatacagtgatattcttacgc

(SEQ ID NO:104)

호모 사피엔스 리보좀 단백질 L3-유사 (RPL3L)

gctgtgtggggtggatgaaccctgaagcgcaccgcactgtctgccccaatgtctaacaaaggccggaggcgactcttcctgcgaggtctcagagcgctgtgtaaccgcccaaggggttcaccttgcctgctgcctagacaaagccgattcattaagacaggggaattgcaatagagaaagagtaattcacacagagctggctgtgcgggagaccggagttttatgttttattattactcaaatcgatctctttgagc

(SEQ ID NO:105)

호모 사피엔스 리보좀 단백질 S27-유사 (RPS27L)

tgattcaaacagcttcctgaattttaattttgtgttgtctcacagaaagccttatcataaattccataattctaattaatttaccaagataatgtaattacatttggttttgtaaggtatacagcagtaatctcctattttggtgtcagtttttcaataaagttttgattatgggcaaatcccctctttttctttttttaaaatatatttgagtatgccatacatttatatatatggtgtatatgaatttggtttaaacattttaaaatttattctgattagtttgtgtctttttttttttttttgagagagagagtcctgctctgtcactcaagctggagtgcagtggtgcgatctcggctcactgcaacctccgcctcccaggtccaagcaattctcttgccttgtcctcccaagtagctgggattataggcacacaccaccatgcctggctaatttgtgtctcattttcaagagtagaaaccctaaatattttattttcattccttttccaaattgctatgaatgggattaaaggattacagatgtaaagtctattatttgtgaattctaaatgtagttctgctgttgtacctgtggaaacatcttaaagaagtacatattttgcacgtcctgcacgtgtaccccagaacttaaactataattaaaaagaatagtttcaaaaaaataca

(SEQ ID NO:106)

호모 사피엔스 리보좀 단백질 L26-유사 1 (RPL26L1)

atagaacctgttgtgcaaccacggtttaaccggagattttgaggctagggtgtgtttctttcgaacttttcggaatgtctggaacatttcatttcctgttttgttacctgtgcctctgtaaatctacttttgcaattttaagtaataattttatgaataaaaatgggaaatgcttcctaattccacatagtatttgcattgttttataaataaattccacttactatc

(SEQ ID NO:107)

호모 사피엔스 리보좀 단백질 L7-유사 1 (RPL7L1)

acccaggtgaggcagggctgaaaactgcccttgggctgacttttgataggccatgccttgccactttacaagttctttttgcatttactagtatttaagagtaaccttgagattgggaggaatagaggaggctggtacaaatagatggagacctgctgggatcagtgaatgcctgattaggacatggggctatgcatagcctaagagttataggcttaaagatgtcgagtaactaaaaactgtattgctggccgggcgcggtggctcacgcctgtaatcccagcactttgggaggccaaggcgggcagaccatgaggtcaggagattgagaccatcctggccaacatggtgaaaccctgtctctactaaaaatacaaaaatgagctgggtgtggtggcacgtgcctgtagtcccagctactcgagaggctaaggcaggaaaatcgcttgaacccaggaggcagagattgcagtgagccaagattgcaccagtgcactccagctgggcgacagagcgagactccatctcg

(SEQ ID NO:108)

호모 사피엔스 리보좀 단백질 L13a 위유전자 (RPL13AP)

gtggaaaagaacatgaaaaagaaaactgacaaatacacacaggtctcctcaagatccatggacttctggtctgagcctaataaagactgtttgtttattcctcaaaaacaaacaaacaaaaaaaaaccctctgtattataaattattctgtgtaatggtgtgttaccatacatt

(SEQ ID NO:109)

호모 사피엔스 리보좀 단백질 L37a 위유전자 8 (RPL37AP8)

atgctcctctactctttgagacatctctggcctataacaaatgggttaatttatgttaaaaaaaaaaaaagagagagagagtgaaacaacaatctacacaatcagagaaaatatttgcaaatcttatatctgattagaaattagtatctggaacat

(SEQ ID NO:110)

호모 사피엔스 리보좀 단백질 S10 위유전자 5 (RPS10P5)

aattggagaggattatttcacattgaataaacttacagccaaaaaa

(SEQ ID NO:111)

호모 사피엔스 리보좀 단백질 S26 위유전자 11 (RPS26P11)

ggagctgagttcttaaagactgaagacaggctattctctggagaaaaataaaatggaaattgtactt

(SEQ ID NO:112)

호모 사피엔스 리보좀 단백질 L39 위유전자 5 (RPL39P5)

ggaattgaacatgagatggcacacatatttatgctgtctaaaggtcacaatcatgttaccatatcaagctgaaaatgtcaccactatctggacagttggacatgtttttttgggaatatactttttctctctgaatctgttaggaactttctggttggctgggttccgtaataaatacatgagacctttcatttcaaaaaaaagaaaaataggcctccttcccaggggctccggatttcatcagccttctgtgcatgcccagccatacaaaccacgcagggatggctccaagtg

(SEQ ID NO:113)

호모 사피엔스 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6)

tcaccaaaaagcaaccaacttagccagctttatttgcaaaacaaggaaataaaggcttacttctttaaaaaataaataaataaataaataaataaataataaataaataaataaataaataaatagataaataaataaaaagttttctactcacactgaagtgacgaagtc

(SEQ ID NO:114)

호모 사피엔스 리보좀 단백질 L36 위유전자 14 (RPL36P14)

gcccccttcccctgccctctccctgaaataaagaatagcttgacagaaa

(SEQ ID NO:115)

보다 바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는, SEQ ID Nos: 116 내지 205에 따른 핵산 서열 또는 상응하는 RNA 서열과 같은, 리보좀 단백질 유전자의 3'-UTR의 핵산 서열에 대해 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%의, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100% 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다:

Mus 머스쿨러스(musculus) 리보좀 단백질 L9 (RPL9)

GGAGGCCTCAGTTCCTGGCCCCAGAAACGAGATCCTGACCACATGAACAATTTGGGCTCTTTTGGGAGAATAAAAGACTTATATATTG

(SEQ ID NO:116)

Mus 머스쿨러스 리보좀 단백질　L3 (RPL3)

TTCCAGGACCACTTTGTGCAGATGGTGGGGTCTCACCAATAAAATATTTCTACTCACACTGGTTTTCCC

(SEQ ID NO:117)

Mus 머스쿨러스 리보좀 단백질　L4 (RPL4)

ACTATTAAAAATTGTTAAATTCCAGAGAGCAAGTAGAGACCGCATATTTCAATAAATCAAACATGTGGTGACAAACCCTTGTGTGACTCTTAAATTGTGGATGTTTCCAAGCCCCTTG

(SEQ ID NO:118)

Mus 머스쿨러스 리보좀 단백질　L5 (RPL5)

AGCAGTTTTCTATGAAGATTTTTTCATAAAGACAATAAACATATTGATCAAGCAGCTTTTTCTGTGTTAAGCTGTTATTAATGAGACTATAGGAAATAGTGTGAAATTACAAAAGCAAAGAAGTAGATAGTTATTTAATTAATTAAATTAATTTTACCTTTTGTGTTGCACCATAACCTACCACTGGTGGGATTAAGGGCAAGTATTACCATGCCTAGCTGAGAGTCTTTCTCCAGGAAAAACCAGCTTACATGGGTTCCTGCAAATCTCATGAGTGTTTCTTGGGTTTCTAGTCTTCCTGGGAGGTGTCCTTATCTTTCAGATTTTCAGATCTGGTAATTAGCATGATCATCAGGACATTTATTACAAACAAATTGATTAGTGGGAAGAAAGTATCTCAAGGTCAATCTTGGAAGTGAACAACTGGTGCTAATCCATGGCTTTAAAGATTTGAGAACAACGGTGAAATTTGGTTTGAGGAGAAGGGGGTGTCTAGGACGTTTCATTTTTATGGTACATGCCAGACATGAATGTACATAGGAAAATAACTTGAAAGGGTCAAATATTAAACCTTGAATATCAGGTTCACTTGGGAAAGCATTAGGTGCTTATGCCTCTTAGTAAATAGCCCTTCATCCCAGAAGGAGCAAGAATTGTCTTCCTGACTTAATCCAGTCTTAGCTGAGGTGCTGTGCATCTTTATCATCTTTGCCTTGCCTCACAGTGTCAGGCTCTGTGGTACTGGGGCTACACAGGTCAGGTAAACAGTTAACTGCTTACCTACATCCCCAGCAAAGATAATGTGACGATACTAAGATGAACCTATCAGAGCTTAAAGATAATGAGTTTCAGTCACAGTGATAACTGCATGCTAACTTCAGCATGTAGAATATATGCCGAAGCTAAAAGCCATTCCACAGTTGACTCCATCTGAAGTTAAAGTGTGTAAGTACACAGTAAATCATGCTATATTAACTGAACTTTTTAATAAATGAGTCATTTGAATTT

(SEQ ID NO:119)

Mus 머스쿨러스 리보좀 단백질　L6 (RPL6)

ATTGTTAACCTAATTAAACAGCTTCATAGGTTCTTTTGGTGTCCTTTTTGTGTGTTGTGTGTGCACATGTTTGTTGGGTGGGTGTTTTGCTGGTGTCTTTTCCTCTGTGTCTTCCTCTGGCCCTTTCTGGAAAGACCTGCTTAATCTGAAGCATGTGAGCTAGGCTAGTCCACTGGGTCCTGCTCTCTGCCCATCCCCAGCTGGCTTTGGATTAGAGGCACATACACTGCCATGGCTGCCTTTTACTGTGGCTGTGGTTTTGCCCTTTTTTTTTAAGCAAATAGAAAATGCTGCTGACTATACTGG

(SEQ ID NO:120)

Mus 머스쿨러스 리보좀 단백질　L7 (RPL7)

GGTGTCACCCATTGTATTTTTGTAATCTGGTCAGTTAATAAACAGTCACAGCTTGGCAAATTG

(SEQ ID NO:121)

Mus 머스쿨러스 리보좀 단백질　L7a (RPL7A)

ATGTACACTAAATTTTCTGTACCTAAATATAATTACAAAATTATCTTGA

(SEQ ID NO:122)

Mus 머스쿨러스 리보좀 단백질　L11 (RPL11)

ACTTGATCCAAAAAGCTAATAAAATTTTCTCAGAAATGC

(SEQ ID NO:123)

Mus 머스쿨러스 리보좀 단백질　L12 (RPL12)

GAAGCAACAAGAAAATATTCCAATAAAAGACTATCTGATAACCAGTG

(SEQ ID NO:124)

Mus 머스쿨러스 리보좀 단백질　L13 (RPL13)

TTCTGTGTTGGAGAGCTGCAATAAATTTTCCATAAAGCAAAA

(SEQ ID NO:125)

Mus 머스쿨러스 리보좀 단백질　L23 (RPL23)

TTCTCCAGTGTATTTGTAAAATATATTCATTAAAGTCTCTGCTCTGAGAGCTGGTCTTCTTGACACCTTTTCCAATATCAGCTTTGCAGAAGGAAACTTAAATTTCAGTTCAGGGCATGACCTTCATGACCTTGCAGAACTTCTTCACTTTCCAGGTTAAGTAAAGGCGATCTTTAGGGGCTGTCCAGATGGATCAGCTATAAAGATTCAATTGTAGAAGGTTCACGTCTCAATGCCCACGTGGTAGCTGTAACTTCAATTAAAAAACAAAAACAGCCGGGCGTGGTGGTGCACGCCTTTAATCCCAGCACTTGGGAGGCAGAGGCAGGCGGATTTCTGAGGCCAGCCTGATCTACAGAGTGAGTTCCAGGACAGCCAGGAATACACAGAGAAACCCTTGTCTCCAAAAACCAAAAAAAACAAAACACGCATTCTTTTCAGGTCTTTGCTGGGACCAGGTACACATAACACAGATAAATATTAGAGCAAACCATGCACATATGGTAAATTATCTTTGGGTTTTGGGTCCCTAAAATAAAGTGGTGTGTTCATTGTG

(SEQ ID NO:126)

Mus 머스쿨러스 리보좀 단백질　L18 (RPL18)

CCCTGGATCTTAACTGTTAATAAAAAAAACATTGGATGATGATGGTA

(SEQ ID NO:127)

Mus 머스쿨러스 리보좀 단백질　L18a (RPL18A)

ACACAGAGACCCACTGAATAAAAACTTGAGACTGTCCTTGCTTGTTTGCTTCTATGTCCCTGGAGAGGTCCCAGTTGGTCCCGTCCCTAACAACATGCTAGCCCTGCTCACCTGCCTGTCAGCCTTGCTCAGTGGCATCTTTCCATAGGTGTGTATCCCCTTAGATTAGCTTCAGCCCCACTACGATTTGTCTAGGACATAGCCTGAGCCCTGCCTGTGACACTGAGGGGTAGCAGTCTGTTTCTGGACTCCAGGGTGCTGCTGTCTCAGGCCTAAGAATTCCAGACATGACTATAATCCAAGCCTGGGGACCTGGTTGAGCTTTTTATCCTGCTGGCTCTAAGCTTCAGCTAGGTGGAAATGAGGCCAGCCAAGCCCCACAGTGAGCTTGCAAGCTTTAGATGGGGACAGGGTTACGCTTTGGTGAATGATGGAGGAAACATGGGGGTTCCTTTTGTTGGGTGCAGCCAGCACGGCATCATCATGGTGCCCAATCTTGAAAGGGCACAGGCCTGAAGCTTCCTGGGACTGTTCTGTCACAGGGAGGAACCTACTGCAGTTGCCTACAATTGCTACCTCTGAGGGACTTGCCTCTGGCCCCTTGTAGACATTTCCATGTCTACACATGGCCCAGAGTACTTTCAGGGATAGCAATGTGTGAATGGCACTTAGAAGATAACATGTGAAAGCCAT

(SEQ ID NO:128)

Mus 머스쿨러스 리보좀 단백질　L19 (RPL19)

AGCTTCCCTCGTGTCTGTACATAGCGGCCTGGCTGTGGCCTCATGTGGATCAGTCTTTAAAATAAAACAAGCCTTTGTCTGTTGCCCTCTTGTTTAGC

(SEQ ID NO:129)

Mus 머스쿨러스 리보좀 단백질　L21 (RPL21)

CCAGTCCTTGGTTGTGGTGATTCTGTTAGCATTAAATGCACTGGAGAGCTTC

(SEQ ID NO:130)

Mus 머스쿨러스 리보좀 단백질　L22 (RPL22)

GGAAATGTCTTTATCAAGGGTTACCTTGGAAGAGGTCCCAACACTGTAGGGTGCTCCTGTTGTCAAAACCTATGCAGAGGCATCTGCTTGCTCTCTAATAACAGTATGCAATGCTAAAGGGCTCGCTTACAGCCGGTGGCCACACTGGAGGCCTGCACATCAGGTGGCCACAAGTTCTGCTGCTGCGCCTCCGAGGAAACACTTGGTCCTCCGATCGATTTTAACCTGTTGAGGCTTTGCAATCCCCCTGTGGCAAAGGCTCCAGTGTTTTCTATTTCTATGCAAATTTCTTGAAGCAGAACTGTTACTGTCTTTCTCCTCTGCCCTGGGAGGAGGCGCTAGCGTTTCCTTCCAACTTCAGGTGCAGCCCCCCTCGTGGTTAGCGGTCTTAAGTTCGTGACTTGGGTTTGCAGATCTTTTTTGTTACATCGCCGGACCATGTGGTGGTCTTTAGCTGTAAACAACATTAACCCTGGGTTGATTAGCATATGCTTCTAAAAGATGGTCCCAGATTCTGCGACTTGTAATAAAATGGAAACTTGCTGGTTTTTATGCCTTTCTAACTCTTGTATTTGAATGAATGTTGATCACTTTTTGTATTAAAGTGGCTGACACATGGCTACTGTCACTGTG

(SEQ ID NO:131)

Mus 머스쿨러스 리보좀 단백질　L22 (RPL22)

CTGTGGTAGAATGCTAGCCTGGTGTGCTCCAGGTTTAATCTCCATCACTGCAGAAATGAGTCCAAGCTGTGTGTACCTCCAGGGCACTGGGCATGGGGTTCCCTTGCCATTGTGTGTGCCCGGAGAACTGGCAGGCGGGAAATGTCTTTATCAAGGGTTACCTTGGAAGAGGTCCCAACACTGTAGGGTGCTCCTGTTGTCAAAACCTATGCAGAGGCATCTGCTTGCTCTCTAATAACAGTATGCAATGCTAAAGGGCTCGCTTACAGCCGGTGGCCACACTGGAGGCCTGCACATCAGGTGGCCACAAGTTCTGCTGCTGCGCCTCCGAGGAAACACTTGGTCCTCCGATCGATTTTAACCTGTTGAGGCTTTGCAATCCCCCTGTGGCAAAGGCTCCAGTGTTTTCTATTTCTATGCAAATTTCTTGAAGCAGAACTGTTACTGTCTTTCTCCTCTGCCCTGGGAGGAGGCGCTAGCGTTTCCTTCCAACTTCAGGTGCAGCCCCCCTCGTGGTTAGCGGTCTTAAGTTCGTGACTTGGGTTTGCAGATCTTTTTTGTTACATCGCCGGACCATGTGGTGGTCTTTAGCTGTAAACAACATTAACCCTGGGTTGATTAGCATATGCTTCTAAAAGATGGTCCCAGATTCTGCGACTTGTAATAAAATGGAAACTTGCTGGTTTTTATGCCTTTCTAACTCTTGTATTTGAATGAATGTTGATCACTTTTTGTATTAAAGTGGCTGACACATGGCTACTGTCACTGTG

(SEQ ID NO:132)

Mus 머스쿨러스 리보좀 단백질　L23a (RPL23A)

ACTGAGTCCAGATGGCTAATTCTAAATATATACTTTTTTCACCATAAA

(SEQ ID NO:133)

Mus 머스쿨러스 리보좀 단백질　L17 (RPL17)

ATTCAGCATAAAATAAAGGCAGATAAAGTTAAAGGTCTTCTGGTGGTCTTTAATGAGCCCTGTTGGGAGTGAGGTGCTTTAACATGGAGAAGCATGTTATTAAACAGTGAAATAGATGGTTCAAAACCACGTGACCATGT

(SEQ ID NO:134)

Mus 머스쿨러스 리보좀 단백질　L24 (RPL24)

TGTGGTAGAGCAGAGTTGGAAATAAAGCTCTATCTTTAACTCTAGG

(SEQ ID NO:135)

Mus 머스쿨러스 리보좀 단백질　L26 (RPL26)

AGACATCTCGTGCACGGCTTTCATTAAAGACTGCTTAAGT

(SEQ ID NO:136)

Mus 머스쿨러스 리보좀 단백질　L27 (RPL27)

GTATATTTTTGTTTTGGTCATTAAAAATTAAAAAAAAAAAAATACAAGTGTCTGCCTATTGCATTTGTGTGGGAAGAGACTGG GGAAATAAAACAGGTGTGCTGTTGTG

(SEQ ID NO:137)

Mus 머스쿨러스 리보좀 단백질　L30 (RPL30)

ACAAGAAAGTTTTCCTTTAATAAAACTTTGCCAGAGCTCCTTTTG

(SEQ ID NO:138)

Mus 머스쿨러스 리보좀 단백질　L27a (RPL27A)

AAGCCACACCGGAGGTTAATTAAATGCTAACATTTTCCATGTGGTCTTTGCATCCTTCCTTGTCTGCATGTTGGAAATCTGCCTAACATTCTAGGAAGAGGTGAGGTGTGGGCCCTTGAGAGTCAGTCTGTGGGAATAAGTGTAGCCCAACTATGCACAGTTGTAAATTCCTACATCCCCGTGTGTATTGGTCTTGATATTCAAAGAATTGATGAATGCCATTACTTTCAGTCCAAAGTGAAGAAACCTGGTCTCAAAAAATCCCGAGGACCAGAAATGAGATGGGTTTTCCTGAAAATCTAAAGTTCTTGAAAAACCTTGCCATCCAGATTGCTAGCAACTGCCTAGCTTTGTAAGCTTACTGTGATGGACAGGTAGCTCAGGACGACTGGTCACTTAATACTGGACAGATTAGCATGGAAAACTTAAGGGGAGGAGGAGGTAGTAGGTTCCATCCAGCTTCGCTTTGTTGGTGGCATCTAGGTGTTGTTCCAAGGGAGCATGCCTACCTGCAACAGGACATCACTGGTTGGGAATACTGTAGAACCAGAGCTGTGACCTTTGAACTACTAGAAAGATGAAATTTTATGTAAAGAGTACCTTGGAGTAAATAAATAAAGCCCAAGATCCTGATTGTCTA

(SEQ ID NO:139)

Mus 머스쿨러스 리보좀 단백질　L28 (RPL28)

GCCCCACACGCCCGAAGCAATAAAGAGTCCACTGACTTCC

(SEQ ID NO:140)

Mus 머스쿨러스 리보좀 단백질　L29 (RPL29)

AAAAGGCTCCTGCCAGTGTGAAGACAGACGGACTGCTGTGACACACCTCCCCACACACTATTTGCAGATGACCAGTGTCCTATGCTGTTCTTACAAATAAACTCAGGCAAGATCTGTTAGCTTG

(SEQ ID NO:141)

Mus 머스쿨러스 리보좀 단백질　L31 (RPL31)

CCTGCTCGTGTCAAATAAAGTTGCAGAACTGCCTTCAGGGTTTGGTTTTCCTTTCTGTTGTCTGCCTCATGGGTGGAATTTTTGGGTCTACAGGGTGTTGGAAATTAATCTGAGAATCTCTGTTCTGGGTACATGGGAAATTAGAAATACGTGAAACATTCTTTTCACAGAAGTCACTTTATTAGGATTGTGGATTTGGGTTGGTTTTGAAACAGGGTTTCTTGTGGCACTGCTTGTTCTATAGAATAGGGTGGCCTTGAACTCAGAAATCCACCTGCCTTTTCCTCCCTAGTATTGGCAATTAAATGCCCAGCTTGTTTGTAAGCTCTCATTTTCAGTTCCAGGTTTATGTGTGAGCCTAAGATTAGGTAAAGATTGAGGTTATAACTTAAACGTACTGAATTAACTTATGTTGTGTGGGTCCCAGGAATTGGACCTGGGACATCAACTCTGCCTTTCCAGCCATCTTTGCCAACCAGTAGCTCATCTCTGGGATGTGTCTGCCCTCAAAATGACATTTTAAAAAAGTCAGTACAAAAGAACGATTTTTATTAAAAACCTTGAGGACAAACATT

(SEQ ID NO:142)

Mus 머스쿨러스 리보좀 단백질　L32 (RPL32)

ATGGCTTGTGTGCATGTTTTATGTTTAAATAAAATCACAAAACCTGCCGTCGTA

(SEQ ID NO:143)

Mus 머스쿨러스 리보좀 단백질　L35a (RPL35A)

ACTAATGGAGAGTAAATAAATAAAAGTAGATTTGTGCTCTTGTATTTTTTTTTCACATCTGTCCTAAA

(SEQ ID NO:144)

Mus 머스쿨러스 리보좀 단백질　L37 (RPL37)

GGATTTCAATCAGTCATAAAATAAATGTTCTGCTTTCAAAAATTCTGTGGTGATCTAAGGTACTTTAACATCGGTTCAGAGTTCGGTTATATGATTGCTCTGGGATCCTACGCTTCTTCCTTCATAGTTCCTGTGGGTCCGAAGCTGGGAGGGGCTGGGTGGACTCTCGGGAAAGATACTCTGAGCCTGTCTCGGTCCCCATCGTGTTTGCTTGGCCCTGGGCATGGAAGTGGGTGAGTGATGAGCTGAACGAGCAGGCTTGCTAGAGATGAGGACAGTTACTGGTGTGGTTATATCACTACCATGCCTACAGTGTCTTAAGACGCTTACAGTCTGTAAGGGACTTAAATGATTTGAGCTCTTACTTATCCTGTAGTTTCTGATTTTTAACATTTACTTGAATAAAGCCAAGCAAGATAAGCCTTTATTCCCAGCACTTGGTGACAGGTGGATCTATGAGTTGGGGATCAGAGCTACACATTAAAACTCTTAATTCATCTTACT

(SEQ ID NO:145)

Mus 머스쿨러스 리보좀 단백질　L37 (RPL37)

GGATTTCAATCAGTCATAAAATAAATGTTCTGCTTTCAAAAAAAAAAAAAATTAATCCTCTGTGATGGCCAGCAGTTAACATTCAACAGTTTCTCTCTAGGCTCTTGATTCTCTGACTATTGTAGGGATTCGATCAGCACTCGCATACCAGAAGTGTGAGATGGTCCGTCCTTTTTCAAGACAAGATTTCTCTGTGTAGCCCTGGCTGTCCTGGAACCCACTCTGTAGACCAGGCTGGCCTTGAATTTACAGAGATCCCCTTGCCTCCGCTTGCTGAGTGCTAGGATTAAAGGCATGCGCACTATG

(SEQ ID NO:146)

Mus 머스쿨러스 리보좀 단백질　L37a (RPL37A)

AAGCCCTGCTGTCTGAGACTTGCCTAGCCTGCAATAAACGGGTTATTTACGTAACTTTTTTTTTTTTGCCTTGTTTGTGGTTAATTAAAACATTTGGTGTGTGTTCTATTTTTTATTTTCGAAAGATGCTTGTTTTGAGACATACTGTGTGACCCTGGCTGGCCTTGAGTGCCTGGTTCTCCTTACAAGTGTAGATACATCTGGCTTAAGATTTTAGTCTTTCAGAAATAAAAATGTTGCTAAGAC

(SEQ ID NO:147)

Mus 머스쿨러스 리보좀 단백질　L38 (RPL38)

ACCAGCCCTCTGCGTGTGACTATTAAAAACCCTGAAAAGTG

(SEQ ID NO:148)

Mus 머스쿨러스 리보좀 단백질　L39 (RPL39)

GGATTCACACAATGGCAAGACTGAGGATTTATACTGAATTGTCATCAATCAGTCCTACCAGATGGATTTCAACATTTAAACCTGGAGACTCTTCGTGTCTTGAATTAGGATGTTTGTCCAGTAATAAAATATAGAACCTTTCAAAATGCTTTTCTGGTTTATAAAGTACTGAATTGCCCTT

(SEQ ID NO:149)

Mus 머스쿨러스 리보좀 단백질,　라지,　P0 (RPLP0)

TCCCGCCAAAGCAACCAAGTCAGCCTGCTTAATTTGAGAAAGATGGAAATAAAGGCTTACTTCTCTTAAAACTCCGGTCTGGATTTATTTAGTTTGTTCACTTAAGCAGGATGAAAAAGCAAAACCGCTACTGTTTACTTTGTGTTGGCATCTTTGTTTCTAAAATTAAAGCTCCTAGTGTTTTTGTGGGCTTTGTTTGTTTTTTGAGACAGTCTCTTGACTTGGTGCCATAGCTAGTCTGGGACAAAGATTTTCCAGGTGTGAATTAAAGGTGTATGTCATCAA

(SEQ ID NO:150)

Mus 머스쿨러스 리보좀 단백질,　라지,　P1 (RPLP1)

ACTGCTTTTGTTAAGTTGGCTAATAAAGAGCTGAACCTGT

(SEQ ID NO:151)

Mus 머스쿨러스 리보좀 단백질,　라지,　P2 (RPLP2)

ATTCCTGCTCCCCTGCAAATAAAGTCTTTTTATGTATCTTGA

(SEQ ID NO:152)

Mus 머스쿨러스 리보좀 단백질　S3 (RPS3)

AATAAAGTGTGCAACCTTCATCTGGTTGATTAAA

(SEQ ID NO:153)

Mus 머스쿨러스 리보좀 단백질　S3A (RPS3A)

AATCCAGATTTTTAATAGTGACAAATAAAAAGTCCTATTTGTGATCGTT

(SEQ ID NO:154)

Mus 머스쿨러스 리보좀 단백질　S4,　X-연결된 (RPS4X)

AATGGTCTCTAGGAGACATGCTGGAAAAGTGTTTGTACAAGCCTTTCTAGGCAACATACATGCTAGATTAAACAGCATGGTGAAACT

(SEQ ID NO:155)

Mus 머스쿨러스 리보좀 단백질　S4-유사 (RPS4l)

AGTGGACTCTGAGGGACATTGCGGGGAAGGGGCGTTTACGTTTGTTTATACTTAAAAGTTTTTTAAGCAGCATGTTGAATTAAAAAAGAAAGCAAGCTTC

(SEQ ID NO:156)

Mus 머스쿨러스 리보좀 단백질　S5 (RPS5)

TTTCCCAGCTGCTGCCTAATAAACTGTGTCCTTTGGAACAACTAT

(SEQ ID NO:157)

Mus 머스쿨러스 리보좀 단백질　S6 (RPS6)

GTCTTTAAGAGCAACAAATAAATAATGACCTTGAATCTTTCATTGGCTTTCATTAATAGTGTAACTAGATAAATGATGGGAAAGATGAGACAGAAGAAGGAATACATCTATAGGACTGCTAGAATATGGGGAGAGTGATTATTTTCAAATTAATATGTATCGAGCTTCTACCCCAAGGTAAATAAATAACATTTGGAGACCATTAAAATGTAGGATGGCATAGAAGAGGCCTTTACTAAGATTAATAATTAAAGAAACACAGCCTTTAAAGTAAAAAACACACTGTGCCTTTGAAACTTGCTAAAAAGATTAACTTCTGTCCCAAAAGGTATCAGCCATGCGCTACCAGCCTCCCTGCCCCTACAGTGGCAGTGGCTGCATTCTTGGTGAATGGTAGTGGAAGGGATTAAACCTAGGCCTCAGTCATGCTTCCCAGTCACTGGTACTGATTTGTATGCACCCGCTTAGGTGTGAAGGTAGTTTTGGTGTGTATCACAAGTTAGCCTGTGTAGCGAAGACAGGTTTTCTCCACCGTGTTTTTTGTTACACATGACTATTCACAAATGTGCTGCAGACAGTAAAATGAGAAATACCCTTCCAAGG

(SEQ ID NO:158)

Mus 머스쿨러스 리보좀 단백질　S7 (RPS7)

AGAAAATGACTGAATAAAGTGTCATTCATAGTATTTGGTTGTAGTAACTTGTCAAAATCTCAGGGCCATGGGTGCACGACAGCAGTAGCTTCTTGAATGAACTGAAGTTTTCAAGAGGTGCCTGGAAGGTGAAAAACACACTGAAGCCAGTCATGTTGATATGGGGGCATTCTGCTGCTGTGAAACAGACTGGGGTTCACACCCACCTTGCGGGATTAGAACTTCACTGCCCTCCAACTTCTTTCTTTGTAAACAACTGTCCACATTTT

(SEQ ID NO:159)

Mus 머스쿨러스 리보좀 단백질　S8 (RPS8)

GCCTCATGTGTAGTGTAATAAAGGTGTCTGCTGTTCTATCTG

(SEQ ID NO:160)

Mus 머스쿨러스 리보좀 단백질　S9 (RPS9)

TTAATACTTGGCTGAACTGGAGGATTGTCTAGTTTTCCAGCTGAAAAATAAAAAAGAATTGATACTTGG

(SEQ ID NO:161)

Mus 머스쿨러스 리보좀 단백질　S10 (RPS10)

AGTTGGAGTTTATGTTGTATTGAATAAACTTTAAAG

(SEQ ID NO:162)

Mus 머스쿨러스 리보좀 단백질　S11 (RPS11)

GGGGACTCTGGCCAATGCCCTAGAACAAATAAAGTTATTTTCCAACG

(SEQ ID NO:163)

Mus 머스쿨러스 리보좀 단백질　S12 (RPS12)

ATAAATTTTGGCTGATTTTTCTCTTGTATTTCTTGTTTGCTGGTATAAAA

(SEQ ID NO:164)

Mus 머스쿨러스 리보좀 단백질　S13 (RPS13)

ATGCTGTTGTGTGCACAAGCAATAAAATCACTTTGAGTAACTT

(SEQ ID NO:165)

Mus 머스쿨러스 리보좀 단백질　S15 (RPS15)

CCGAGGCCAATAAAGACTGGTTTTGGTCCCTGGA

(SEQ ID NO:166)

Mus 머스쿨러스 리보좀 단백질　S15a (RPS15A)

TGTTTACTTAGTAAACTACTAAATGTATGCACGTGTAAGCTTTTGCCTTGATTGAGGTCAAGCTGTCGAGAAATGGTTCTCTTTACAGTGGATCCAGTCAGGATTGGCAGCAAGCACCTTTGCCTGCTGAGCCTACATGTTGTATAGAATGGCAACGTTGTGTAGAATGGCAGTACATTAAATGGGTTTTTCATTTA

(SEQ ID NO:167)

Mus 머스쿨러스 리보좀 단백질　S16 (RPS16)

GCCCATCTCAAGGATCGGGGTTTACCTTTGTAATAAACATCCTAGGATTTTAACGTTCC

(SEQ ID NO:168)

Mus 머스쿨러스 리보좀 단백질　S19 (RPS19)

AACAAAGGATGCTGGGTTAATAAATTGCCTCATTC

(SEQ ID NO:169)

Mus 머스쿨러스 리보좀 단백질　S20 (RPS20)

GTAGAAGAAAAAAACCCCAGCTCCCACAAGTTATCTGGCCCTCTGCACACATATAAATAGTGCAATAAAAATTAACCATTTAAAAATATAAA

(SEQ ID NO:170)

Mus 머스쿨러스 리보좀 단백질　S21 (RPS21)

GCAGAAGAAATCGGGAATTTGTTACAAATAAAAGTTTTAAGTACCTGTGACAGTTAAG

(SEQ ID NO:171)

Mus 머스쿨러스 리보좀 단백질　S23 (RPS23)

AATTTGACAATGGAAACACAGTAATAAATTTTCATATTCTGAAAAAATA

(SEQ ID NO:172)

Mus 머스쿨러스 리보좀 단백질　S25 (RPS25)

ACAGGTTCAATCAGCTGTACATTTGGAAAAATAAAACTTTATTGAATCAAATGAATGGGTGCATCTGTTTCCTAAGGCAGCCGGGGAGGATTTGGTCTTAGGAATAATAGCTGGAATTGGTTTGTTGGCCATGAAGTCAGATGCAATTGCGCCTGGGAACCTTCAGCTTTTCCCTTTACGTGGTTGCTTGCTTCTTGTTGCAGCTTCGGTTTTGAATTGATGCCTGAAAGAAAATAAAAACTTAGCAAGACTAATGGTAAATCT

(SEQ ID NO:173)

Mus 머스쿨러스 리보좀 단백질　S26 (RPS26)

AGAGGCCGTTTTGTAAGGACGGAAGGAAAATTACCCTGGAAAAATAAAATGGAAGTTGTACTTTACATGGC

(SEQ ID NO:174)

Mus 머스쿨러스 리보좀 단백질　S27 (RPS27)

AAGCCCCTGATTGAAGATGAGTGGGAACCTTCCCAATAAACACGTTTTGGATATAT

(SEQ ID NO:175)

Mus 머스쿨러스 리보좀 단백질　S27a (RPS27a)

TTGTGTATGCGTTAATAAAAAGAAGGAACTCGTACTTA

(SEQ ID NO:176)

Mus 머스쿨러스 리보좀 단백질　S28 (RPS28)

TCTTGCAGCTGGGTTCTGGATATCCACTACTTAGCCCACGGAATGATCTGCAACTGTTAAATAAAGCATTTATATTAATTCTTGTCTAGAAA

(SEQ ID NO:177)

Mus 머스쿨러스 리보좀 단백질　S29 (RPS29)

GCGACCTTGAATGGATTCGACTGACTACTACCAAGTGGAACCGATCATGCTAGTCTTTGTACACAAAGAATAAAAATGTGAAGAACTTTAA

(SEQ ID NO:178)

Mus 머스쿨러스 리보좀 단백질　L15 (RPL15)

TTAAATTGGTTTTCCTTTGGAGATTTTAAAAGGATGATTTGATTTCCAGAAAATACTAGACTCAAAATCTTGATAGCTAAAATTCTTTTCTATTCAGCAAAACAAGTCACTGTATAGAGGTTGTTCAAATCAACTAAAGTAATAAATGTCTTAAACAAGTGG (SEQ ID NO:179)

Mus 머스쿨러스 리보좀 단백질　S2 (RPS2)

GGGTTTTTATATGAGAAAAATAAAAGAATTAAGTCTGCTGATT

(SEQ ID NO:180)

Mus 머스쿨러스 리보좀 단백질　L14 (RPL14)

GGCTACACAGAATAATAAAGGTTCTTTTTGACGGTGGTAAATCTCATGTGTGGACTCTAAGCTTGTCGCCAAGTGGGAAATAGACTGGTGGGATTGTAGATAGGATGGGCTACTTAAACTCATTCTACCCAGGCCTTAGTACTTAGCATACAGCCAGAGTCAAACTGATCCTTTATACAGGGGGTACCATGACAGTACAACAGTGTCGTTAACCCTAACAAATAAATTTCCCACCAACGGGTGGAATTCCTTCATTTTG

(SEQ ID NO:181)

Mus 머스쿨러스 리보좀 단백질　S14 (RPS14)

ACAGGACTTCTCATTATTTTCTGTTAATAAATTGCTTTGTGTAAGCTA

(SEQ ID NO:182)

Mus 머스쿨러스 리보좀 단백질　L10 (RPL10)

AGGCTTCAATAGTTCTCCTATACCCTACCAAATCGTTCAATAATAAAATCTCGCATCAAGTTCGCTT

(SEQ ID NO:183)

Mus 머스쿨러스 리보좀 단백질　L10a (RPL10A)

GATGCTCCAATAAACCTCACTGCTGCCACTCAG

(SEQ ID NO:184)

Mus 머스쿨러스 리보좀 단백질　L35 (RPL35)

GATGACAACGACAATAAAGTGCGAGACTGACTGGCT

(SEQ ID NO:185)

Mus 머스쿨러스 리보좀 단백질　L13a (RPL13A)

ACCCAATAAAGACTGTTTGCCTCATGCCTGCCTGGCCTGCCCTTCCTCCGCCGCCAACTAGGGAAGTGGGGACCAAAGGTTCCTTAGGCACTGCTCCTGTGGGTAGAGGGGACATTAGAGAGCTGACAGCGCACCACCTGCATGAGTTTTTATTAAAGTGCAAACCATGGGATGAATCAGTTGAGCTTCAGTGTTGAAAATGAGTAGCAGGGCTGCCCCACCCACCTGACCAAGTACCCTATTCTGCAGCTATGAAAATGAGATCTGCACATGAGCTGGGGTTCACAAGTGCACACTTGGAGCACTGCCTTGCTCCTTCCCAGCAGACCACAAAGCAGTATTTTTCTGGAGGATTTTATGTGCTAATAAATTATTTGACTTAAGTGTG

(SEQ ID NO:186)

Mus 머스쿨러스 리보좀 단백질　L36 (RPL36)

TGAACCCTCCCCCAATAAAAGATGGTTCCTAC

(SEQ ID NO:187)

Mus 머스쿨러스 리보좀 단백질　L36a (RPL36A)

GCAGATTTTGTTATGAAGACAATAAAATCTTGACCTTTCAACCCCTTTGATTGCAGTTGTTCGTTTGGGAGGGAATACATTAAAAGCTTTCAGAAATTACCTG

(SEQ ID NO:188)

Mus 머스쿨러스 리보좀 단백질　L41 (RPL41)

GCCAGCCCGTGCACCTACGACGCCTGCAGGAGCAGAAGTGAGGGATGCTGAGGGCCGGGACAAGCTATCGGACTGTGTGCTGCCATCGGTAATGAGTCTCAGTAGACCTGGAACGTCACCTCGCCGCGATCGCCTGGAGAAATGACCGCCTTTCTTACAACCAAAACAGTCCCTCTGCCCTGGACCCCCGGCACTCTGGACTAGCTCTGTTCTCTTGTGGCCAAGTGTAGCTCGTGTACAATAAACCCTCTTGCAGTCAGCTGAAGAATCAAACTGC

(SEQ ID NO:189)

Mus 머스쿨러스 리보좀 단백질　S18 (RPS18)

GTCTCTGGGCCTTTGCTGTTAATAAATAGTTTATATACCTATGA

(SEQ ID NO:190)

Mus 머스쿨러스 리보좀 단백질　S24 (RPS24)

AATACCTAGCAGTGAGTGGAGATTGGATACAGCCAAAGGAGTAGATCTGCGGTGACTTGATGTTTTGCTGTGATGTGCAGATTTCTGAGAGGACAAATAAACTAAAAAGCTCCTACACGTCTGCTCTGCTGCTTATTGGGCATTAGAAGAATCAGGTGGCTGCTTGGGTGTTGATGCAGTCAAGTGCACTGGGCTTGGTGAAAAGCCCAGTGTAAGAGGCCGGTACAGATCCTTCCTGGCAGAGGGTGGTGATGGAGAGAACATAAATAACTACATGGGCAAAGTGTAGGACCAATTACCCTGTTAGCATCGTCTTTGCTCAACACCTTTCTGTGTCCCTAGACTCTGAGTTTTTTTCTAATTGATTTTTATTGAACACTGAGTGTTTTGAGGTTTTATTTTTT

(SEQ ID NO:191)

Mus 머스쿨러스 리보좀 단백질　L8 (RPL8)

AGTTCAGGAGCTAATAAAGTACGTCCTTTGGCTAATCCG

(SEQ ID NO:192)

Mus 머스쿨러스 리보좀 단백질　L34 (RPL34)

ATATGCACATTTTTTAAGTAATAAAAATCAAGACTTGATCTACGCTTC

(SEQ ID NO:193)

Mus 머스쿨러스 리보좀 단백질　S17 (RPS17)

TCTGTTATGCCATATTTTCAATAAACCTGAAAACAA

(SEQ ID NO:194)

Mus 머스쿨러스 리보좀 단백질　SA (RPSA)

GCTGCTGTGCAGGTGCCTGAGCAAAGGGAAAAAAGATGGAAGGAAAATAAAGTTGCTAAAAGCTGTCTTATGGTCCTCACTGCAGACTGTACCTGGATTGGCATTTGGCTATACAACAGAGGCATGGTCCTACTGACATGTTTTGTGTTGAATACTTAAGCATGTGAACACATGGGTTTTTTTTTTTTTTAATGTAAAATGTAGTAACACAATGTTTAGGTGGCTTTGGTGTTAGCTCTGGAGACTTCATGTGTCATCTAGGTGAGGTGTTCTTTAACACAGGGTCTCTGTTCTGTCATGCCTCATAGATCCTTCTACCTCCAGATTGGAGAGGGAAAAGGCTTATGTCACTGAACCTGGCCAGATTGGGATTTTGTGTCCCAGGAACAAAGTTAATGCTAAAAAGTTAATGCCTTGGTGAGACTGATAGTCTGATGGTGTGAATTCACAGTAAGTGGTTGGGATTGCCAGATGGAATTCCCTGAGCTGCCGTGACAGGTGGCATTGCAGAAGTGAAGGATTCAGGAATTTGAGTGTTGGGTGGGGGCCTGTGAATAGCACTTGGGCTGGGAGGGGAGACTGCTGCCCCTGAATGTCCTGGAATTCAAGGACAGTACCTGGTTAAATGTTTTTCTAGCTTTTCTAAAAAGTTTGTTAGGCCTGGCATTGGCGGCGCACACCTTTAATCCCAGCACTTGGGAGTCAGGCAGGTGGATTTCTGGCCTGGTCTACAGAGAGTTCCAGGATAGCCAGGGATACACAGAAATCCTGCCTCAGGAAAAAACCAAAAAGAAGTTTGCTAAAAATAAGCATTTTTGCTTGATGGTATTGAAGATTGTAAGACATTAAATTGTGTCATTACTTCTCCAGGTACT

(SEQ ID NO:195)

Mus 머스쿨러스 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52)

AGCTGTGGTCATACCTGGCATGTGACCCCGGGACCAAATAAAGTCCCCTTCCATCCACTGGAGCAGC

(SEQ ID NO:196)

Mus 머스쿨러스 Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU)

GTCCTATTGCCACCCTGCCATGCTAATAAAGCCACTGTGTCCAGACTTCT

(SEQ ID NO:197)

Mus 머스쿨러스 리보좀 단백질 L22-유사 1 (RPL22L1)

TTGGCCTCTGCTTGTAATACAATGAAAGTATTCTAAAGAAATATAAAATTGGACTTTATGAGAAAATAAAAGTCATTTCACTCT

(SEQ ID NO:198)

Mus 머스쿨러스 리보좀 단백질 S17 (RPS17)

TCTGTTATGCCATATTTTCAATAAACCTGAAAACAA

(SEQ ID NO:199)

Mus 머스쿨러스 리보좀 단백질 L39-유사 (RPL39L)

GGAACCACACGTACTTATGCTGTAACTTACTGTAGCGTTTACAGCGTTACCGCTGTCTGGACAGCTGAGTGTGTTTCTTAGGAATATAAGTTTTCTTTCTGTGCTTTAGTGAGTTCATTCAGCAGTTCAGTAATAAATATGTGAAACCTTTTGTTTCGAAAAAAATTGCTTCTGTGTTACAACTTACTTTGTTTTATGGTTCAGGATCATCTGCATAATAGACAAGTATTCTATCAGTGAGCGATATCCTGGATCTTGTTTGTGTAGTTTGGGGTTGAGACAAGTCCAGACTGCCCTAAAACTCACGATCTTCCTTCCTCGGCCTTCTAAATGATTGGAGGACTCCAAACCTAAGTGATGGAAGTAAAAAGAAACTTATATGTCAAGACTCATTTTCTCTATCATTTCATGTGACAATTGAAATTAGATTATTTCTTTTTTCAATC

(SEQ ID NO:200)

Mus 머스쿨러스 리보좀 단백질 L10-유사 (RPL10L)

GGACTTTGCTGGCAGAAAAGAAGTACAGATGAGGTTATAGTTTGAAAAACGTTAATTCCGTTTATTGACTTTAGAATGTTACTTTGCATAGTATAGACCATTACAATGGAAAGTACCTGCCTTAAGAAACAAGAAAACTGCAGTTTATAGAGAAAGAATTTTCAATTTTGACCCATGTACTTAAAATTTTTGGTGTATACTGCAGTGTAGCAAATGTTTTGTGGTGACGGTATAAATGGTACTGTTTGTTATCTTGGATTAAGAGTGGCTAGAGAAGTTGGAAGACGTGTGAGAAGTTCTTTATAGAGAATTAAACATGAAAATTACATCTC

(SEQ ID NO:201)

Mus 머스쿨러스 리보좀 단백질 L36a-유사 (RPL36AL)

AACTTGTGTTCTCTGAGAGGAAAATACTGAAGCAGTAGAGAAATGACCTGCTAGAGAATAAAGTTACTGTTAATGATACC

(SEQ ID NO:202)

Mus 머스쿨러스 리보좀 단백질 L3-유사 (RPL3L)

GATGTCTGGAATGGAGCACACCTGGGATGTAGCACTCTTGCTATCTGTCCGGTCCTTTTTGTTCAATAAAGTCCTGAGGCAACTCTCTCTGTC

(SEQ ID NO:203)

Mus 머스쿨러스 리보좀 단백질 S27-유사 (RPS27L)

TGAGCTATGAAGTTCCGGAATTTGTGTTTTTCACAGAAAGCCTTACCAACTTCAGTTACTTTACCAAGACAATGTAATTATTGTTTGATTTTATAAAGTCTACAACAATGATCTCCTATTTTGGTGTCAGTTTTTCAATAAAGTTTTAATTA

(SEQ ID NO:204)

Mus 머스쿨러스 리보좀 단백질 L7-유사 1 (RPL7L1)

AACTGATCATTGGGAAATGAGGTGACCAAAAATGCATCGCAACCTTGGACAAACAGCATGGCTATTTAACATTCTGGGATCCTGCAGAATCCTGCATCTTCCTAAGTAGGGAAGCACTGTAGCATTGGAGAGAGGCCTGGGCGAGCAGAGCTAAGGCTTCCATTTCTGGCTTGCTTGGAATTTAAAACAAGCTTTTTTCTATATAGTAAAAGATTGTTTTTAAGATTTTTGCGTGTGAGTACATGCCAAAGTAGCCAGGAAGTGTCACTTGCCCTGGAGCTAGAATTACTGGCAAATGAAGGCTCAGAGGTGGATGCTGGGACCAATTCTAGGCCCTCTGAGAAAGCAGGTGCACTTGGCTTGTGCCTCCAGCCCCAAAGGCGATGGCTTATTGTGAGCCTGAGGCCAGCCAGGGTTACAGAGACTCAAGAAACAAGTGGGGTTGTCCATGTTGCTGGAGATGACCCAGGTCTATTAGGACCTTGACTACATGGATAGACATTCTGGCAGCTAGTATACTGCCATTGGGGCCTATGGAGAAGTAGCCACCGAGCCTATTTAGAAAGAAGGACTGCTGGCAAGCTTGGTGTCACTATGAAGGCAGACAAAGATCGATGTATTAACGACCCCGACTCCAAAAACACTCGAGGGGGCCCAAGGTGGGCTCAGTGGTTAAGAGCCGTTCGCCCAGGGGCTGGAGAGTTGGCTCAGTGGTACCACATGGTGGCTCACAACCATCTGTAATGAGATCTGACGCCCTCTTCTGGTGTATCTGAAGACAGCTACAGTGTACTTACATAAAATAAATAAATCTTT

(SEQ ID NO:205)

바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 리보좀 단백질 스몰 9(RPS9)의 3'-UTR 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다. 가장 바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 SEQ ID NO: 1 또는 SEQ ID NO: 2에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다.

SEQ ID NO: 1

GTCCACCTGTCCCTCCTGGGCTGCTGGATTGTCTCGTTTTCCTGCCAAATAAACAGGATCAGCGCTTTAC

SEQ ID NO: 2

GUCCACCUGUCCCUCCUGGGCUGCUGGAUUGUCUCGUUUUCCUGCCAAAUAAACAGGAUCAGCGCUUUAC

본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 또한 SEQ ID Nos: 10 내지 205에 따른 서열의 3'-UTR와 같은, 리보좀 단백질 유전자의 3'-UTR에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성되며, 상기 절편은 바람직하게 상기 설명된 기능적 절편, 기능적 변이체 절편이다. 이러한 절편은 바람직하게 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 보인다. 바람직한 실시예에서, 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개 뉴클레오티드, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 보인다.

바람직하게, 상기 변이체, 절편 또는 변이체 절편은, 바람직하게 SEQ ID NO. 1 또는 SEQ ID NO. 2에 따른 핵산 서열을 포함하는 인공 핵산 분자에 의해 나타나는 안정화 효율 및/또는 단백질 생산 증가 효율의 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90%의 효율과 함께, 본 발명에 따른 인공 핵산 분자의 안정성, 본 발명에 따른 인공 핵산 분자로부터 단백질 발현의 안정화 및/또는 연장, 및/또는 단백질 생산물의 증가와 같이, SEQ ID Nos: 10 내지 205에 따른 핵산 서열의 적어도 하나의 기능을 보이는, 상기 설명된 기능적 변이체, 기능적 절편 또는 기능적 변이체 절편이다.

바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 보인다. 3'-UTR 요소의 길이에 대한 상한은 500개 뉴클레오티드 또는 그 미만, 예를 들어 400, 300, 200, 150 또는 100개 뉴클레오티드일 수 있다. 다른 예를 들어, 상기 상한은 50 내지 100개 뉴클레오티드의 범위 내에서 선택될 수 있다. 예를 들어, 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 10 내지 90개 뉴클레오티드, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타낼 수 있다.

게다가, 본 발명에 따른 인공 핵산 분자는 상기 설명된 하나 이상의 3'-UTR 요소를 포함할 수 있다. 예를 들어, 본 발명에 따른 인공 핵산 분자는 하나, 둘, 셋, 넷 또는 그 이상의 3'-UTR 요소를 포함할 수 있으며, 상기 각각의 3'-UTR 요소는 동일하거나 다를 수 있다. 예를 들어, 본 발명에 따른 인공 핵산 분자는 상기 설명된 두 본질적으로 동일한 3'-UTR 요소, 예를 들어 SEQ ID NO: 10 내지 205에 따른 서열과 같은, 리보좀 단백질 유전자의 3'-UTR로부터 유도된, 또는 SEQ ID No. 1 또는 2,에 따른 핵산 서열, 상기 설명된 이의 기능적 변이체, 이의 기능적 절편, 또는 이의 기능적 변이체 절편과 같은, 리보좀 단백질 유전자의 3'-UTR의 절편 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 두 3'-UTR 요소를 포함할 수 있다.

놀랍게도, 본 발명자들은 상기 설명된 3'-UTR 요소를 포함하는 인공 핵산 분자가 나타날 수 있거나 또는 단백질 생산은 증진, 연장 및/또는 안정화시키는 mRNA 분자를 제공할 수 있음을 발견하였다. 따라서, 본 발명에 설명된 3'-UTR 요소는 mRNA 분자로부터 단백질 발현의 안정성을 증진 및/또는 번역 효율을 증진시킬 수 있다.

본 발명에 따른 인공 핵산 분자는 mRNA, DNA 벡터와 같은 DNA와 같은 RNA일 수 있거나, 변형된 RNA 또는 DNA 분자일 수 있다. 이는 예를 들어 센스 가닥 및 안티-센스 가닥을 갖는 DNA 분자와 같이, 센스 가닥(strand) 및 안티-센스 가닥을 갖는 이중 가닥 분자로 제공될 수 있다.

본 발명에 따른 인공 핵산 분자는 추가로 5'-UTR 및/또는 5'-캡(cap)을 선택적으로 포함할 수 있다. 상기 선택적 5'-캡 및/또는 5'-UTR은 바람직하게 본 발명에 따른 인공 핵산 분자 내 ORF에 5'에 위치할 수 있다.

바람직하게, 본 발명에 따른 인공 핵산 분자는 추가로 폴리(A) 서열 및/또는 폴리아데닐화 신호를 포함한다. 바람직하게, 선택적 폴리(A) 서열은 적어도 하나의 3'-UTR 요소에 위치하며, 바람직하게 선택적 폴리(A) 서열은 3'-UTR 요소의 3'-말단에 연결된다. 상기 연결은 예를 들어 1-50개의 링커, 바람직하게 1-20개 뉴클레오티드, 예를 들어 하나 또는 그 이상의 제한 부위를 포함하거나 구성된 것을 통해서와 같이, 2, 4, 6, 8, 10, 20개 등의 뉴클레오티드의 스트레치를 통해, 직접적 또는 간접적일 수 있다.

일 실시예에서, 선택적 폴리아데닐화 신호는 3'-UTR 요소의 3' 다운스트림에 위치한다. 바람직하게, 상기 폴리아데닐화 신호는 N = A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함한다. 이러한 공통 서열은 대부분의 동물 및 박테리아 세포 시스템을 통해, 예를 들어 CstF, PAP, PAB2, CFI 및/또는 CFII와 협동하는 분열(cleavage)/폴리아데닐화 특이성 요소(CPSF)와 같은, 폴리아데닐화-인자를 통해 인식될 수 있다. 바람직하게, 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 약 50개 뉴클레오티드 미만, 더욱 바람직하게 약 30개 염기 미만, 가장 바람직하게 약 25개 염기 미만, 예를 들어 21개 염기, 3'-UTR 요소의 3'-말단의 다운스트림에 위치한다.

본 발명에 따른 인공 핵산 분자, 예를 들어 3'-UTR 요소의 폴리아데닐화 신호 다운스트림을 포함하는 인공 DNA 분자의 전사는 이의 3'-UTR 요소의 폴리아데닐화 신호 다운스트림을 포함하는 조숙-RNA를 초래할 것이다. 예를 들어, SEQ ID No. 1에 따른 3'-UTR 요소를 포함하는 DNA 분자의 전사는 서열 SEQ ID No. 2에 따른 3'-UTR 요소를 갖는 RNA를 초래할 것이다.

적절한 전사 시스템을 사용하는 것은 이후 조숙-RNA에 폴리(A) 서열의 결합을 유도할 것이다. 예를 들어, 본 발명의 인공 핵산 분자는 상기 설명된 3'-UTR 요소 및 폴리아데닐화 신호를 포함하는 DNA 분자일 수 있으며, 이러한 DNA 분자의 전사에 따라 RNA의 폴리아데닐화가 초래될 수 있다. 따라서, 생산된(resulting) RNA는 본 발명의 3'-UTR 요소 이후 폴리(A) 서열의 조합을 포함할 수 있다.

잠재적 전사 시스템은 인비트로(in vitro) 전사 시스템 또는 세포 전사 시스템 등이다. 따라서, 본 발명에 따른 인공 핵산 분자의 전사, 예를 들어, 오픈 리딩 프레임, 3'-UTR 요소 및 폴리아데닐화 신호를 포함하는 인공 핵산 분자의 전사는 오픈 리딩 프레임, 3'-UTR 요소 및 폴리(A) 서열을 포함하는 mRNA 분자를 초래할 수 있다.

따라서, 본 발명은 또한 오픈 리딩 프레임, 상기 설명된 3'-UTR 요소 및 폴리(A) 서열을 포함하는 mRNA 분자인, 인공 핵산 분자를 제공한다.

일 실시예에서, 본 발명은 오픈 리딩 프레임 및 SEQ ID No. 1에 따른 서열 또는 SEQ ID No.1에 적어도 약 40% 또는 그 이상의 상동성을 갖는 서열 또는 상기 설명된 이의 절편을 포함하는 인공 DNA 분자인, 인공 핵산 분자를 제공한다. 게다가, 본 발명은 오픈 리딩 프레임 및 SEQ ID NO. 2에 따른 서열 또는 SEQ ID No. 2에 적어도 약 40% 이상의 상동성을 갖는 서열 또는 상기 설명된 이의 절편을 포함하는 인공 RNA 분자인 인공 핵산 분자를 제공한다.

따라서, 본 발명은 번역 효율에 대하여 안정화되고 최적화된, RNA 분자, 바람직하게 mRNA 분자에 대한 주형(template)으로 제공될 수 있는 인공 핵산 분자를 제공한다. 다시 말해, 상기 인공 핵산 분자는 mRNA의 생산을 위한 주형으로 사용될 수 있는 DNA일 수 있다. 수득 가능한 mRNA는 오픈 리딩 프레임에 의해 코딩된 목적하는 펩타이드 또는 단백질의 생산을 위해 차례로 번역될 수 있다. 만약 인공 핵산 분자가 DNA일 경우, 이는 예를 들어 mRNA의 계속되고 반복적인 인비트로(in vitro) 또는 인비보(in vivo) 생산을 위한 이중 가닥의 저장 형태로 사용될 수 있다.

다른 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR은 폴리아데닐화 신호 또는 폴리(A) 서열을 포함하지 않을 수 있다. 보다 바람직하게, 본 발명에 따른 인공 핵산 분자는 폴리아데닐화 신호 또는 폴리(A) 서열을 포함하지 않을 수 있다. 더욱 바람직하게, 상기 인공 핵산 분자의 3'-UTR 또는 이러한 본 발명의 인공 핵산 분자는 폴리아데닐화 신호를 포함하지 않으며, 특히 폴리아데닐화 신호 AAU/TAAA를 포함하지 않는다.

일 실시예에서, 본 발명에 따른 인공 핵산 분자는 추가로 폴리(A) 서열을 포함한다. 예를 들어, ORF 다음 리보좀 3' UTR을 포함하는 DNA 분자는 결과물 mRNA 내 폴리(A) 서열에 전사될 수 있는, 티미딘 뉴클레오티드의 스트레치를 포함할 수 있다. 폴리(A) 서열의 길이는 다양할 수 있다. 예를 들어, 상기 폴리(A) 서열은 약 20개 아데닌 뉴클레오티드 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40개 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 60, 70, 80, 90 또는 100개 아데닌 뉴클레오티드와 같이 약 50개 내지 약 100개 아데닌 뉴클레오티드의 길이를 가질 수 있다. 가장 바람직하게 본 발명의 핵산은 약 60 내지 약 70개 뉴클레오티드, 가장 바람직하게 64개 아데닌 뉴클레오티드의 폴리(A) 서열을 포함한다.

예를 들어, 본 발명에 따른 인공 핵산 분자는 하기 DNA-서열에 상응하는 핵산 서열을 포함할 수 있다

GTCCACCTGTCCCTCCTGGGCTGCTGGATTGTCTCGTTTTCCTGCCAAATAAACAGGATCAGCGCTTTACAGATCTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA (SEQ　ID　No.　3).

이러한 서열의 전사는 하기 서열을 포함하는 인공 핵산 분자를 초래할 수 있다.

GUCCACCUGUCCCUCCUGGGCUGCUGGAUUGUCUCGUUUUCCUGCCAAAUAAACAGGAUCAGCGCUUUACAGAUCUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA (SEQ　ID　No.　4).

이러한 인공 RNA 분자, 즉 SEQ ID No. 4에 따른 서열을 포함하는 인공 핵산 분자는 또한, DNA-시초(progenitor)로부터 필수적으로 전사됨이 없이, 화학적 합성의 일반적인 방법을 통해 인비트로(in vitro) 수득될 수 있다.

특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 RNA 분자, 바람직하게 5'- 에서 3'- 방향 오픈 리딩 프레임, 상기 설명된 3'-UTR 요소 및 폴리(A) 서열을 포함하는 mRNA 분자이다.

바람직하게, 상기 오픈 리딩 프레임은 리보좀 단백질에 대해 코딩하지 않는다. 바람직한 실시예에서, 오픈 리딩 프레임은 본 발명의 인공 핵산 분자의 3'-UTR 요소가 유도된 리보좀 단백질을 코딩하지 않으며, 특히 상기 3'-UTR 요소가 포유동물 리보좀 단백질 유전자의 3'-UTR과 동일한 경우에 포유동물 리보좀 단백질을 코딩하지 않는다. 일부 보다 바람직한 실시예에서, 오픈 리딩 프레임은 3'-UTR 요소가 SEQ ID No. 1 또는 SEQ ID No. 2와 동일한 서열일 경우 RPS9 또는 이의 변이체를 코딩하지 않는다.

바람직한 실시예에서, 상기 ORF는 인간 또는 식물, 특히 아라비답시스, 리보좀 단백질을 코딩하지 않으며, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는다. 보다 바람직한 실시예에서, 상기 오픈 리딩 프레임(ORF)는 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 어떠한 원천(origin)이든지 리보좀 단백질 S16(RPS16)을 코딩하지 않는다.

일 실시예에서, 본 발명은 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된, 리보좀 단백질 외의 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 1에 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소; 더욱 더 바람직하게 SEQ ID No. 1에 100% 서열 상동성; 및 폴리아데닐화 신호 및/또는 폴리(A) 서열을 포함하는 인공 DNA 분자를 제공한다. 게다가, 본 발명은 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된 리보좀 단백질 외에 어느 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 3과 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소를 포함하는 인공 DNA 분자를 제공한다.

게다가, 본 발명은 인공 RNA 분자, 바람직하게 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된 리보좀 단백질 외의 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 2에 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소; 및 폴리아데닐화 신호 및/또는 폴리(A) 서열을 포함하는 인공 mRNA 분자 또는 인공 바이러스 RNA 분자를 제공한다. 게다가, 본 발명은 인공 RNA 분자, 바람직하게 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된 리보좀 단백질 외의 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 4에 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소를 포함하는 인공 mRNA 분자 또는 인공 바이러스 RNA 분자를 제공한다.

본 발명은 코딩된 펩타이드 또는 단백질의 증진된 안정성 및 연장된 발현에 의해 특징지어질 수 있는 인공 핵산 분자, 바람직하게 인공 mRNA를 제공한다. 어느 이론에 한정됨이 없이, 단백질 발현의 증진된 안정성 및 그에 따른 연장된 단백질 발현은 본 발명에 따른 인공 mRNA 분자와 같은 인공 핵산 분자의 분해에 감소로부터 초래될 수 있다. 따라서, 본 발명의 3'-UTR 요소는 분해 및 붕괴(decay)로부터 인공 핵산을 예방할 수 있다.

일부 실시예에서, 본 발명의 인공 핵산 분자는 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열에 추가로 히스톤 스템-루프를 포함할 수 있다. 본 발명에 따른 이러한 인공 핵산 분자는 예를 들어 5'-에서 3'-방향 ORF, 3'-UTR 요소, 선택적 히스톤 스템-루프 서열, 선택적 폴리(A) 서열 또는 폴리아데닐화 신호 및 선택적 폴리(C) 서열을 포함할 수 있다. 이는 또한 5'-에서 3'-방향 ORF, 3'-UTR 요소, 선택적 폴리(A) 서열, 선택적 폴리(C) 서열 및 선택적 히스톤 스템-루프 서열을 포함할 수 있다.

바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 적어도 하나의 히스톤 스템-루프 서열을 포함한다.

이러한 히스톤 스템-루프 서열을 바람직하게 이의 공개가 참고문헌으로 본 발명에 병합된 WO 2012/019780에 개시된 히스톤 스템-루프 서열로부터 선택될 수 있다.

본 발명에서 사용되기에 적절한 히스톤 스템-루프 서열은 바람직하게 하기 화학식 (I) 또는 (II) 중 적어도 하나로부터 선택될 수 있다:

화학식 (I) (스템 경계 요소가 없는 스템-루프 서열):

화학식 (II) (스템 경계 요소가 있는 스템-루프 서열):

상기:

스템1 또는 스템2 경계 요소 N_1-6은 1 내지 6개, 바람직하게 2 내지 6개, 더욱 바람직하게 2 내지 5개, 더욱 더 바람직하게 3 내지 5개, 가장 바람직하게 4 내지 5개 또는 5개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;

스템1[N_0-2GN_3-5]은 요소 스템2와 역 상보적 또는 부분적으로 역 상보적이며, 5 내지 7개 뉴클레오티드의 연속적인 서열임;

상기 N_0-2는 0 내지 2개, 바람직하게 0 내지 1개, 더욱 바람직하게 1개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;

상기 N_3-5는 3 내지 5개, 바람직하게 4 내지 5개, 더욱 바람직하게 4개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택되며, 및

상기 G는 구아노신 또는 이의 유사체이며, 스템2 내 이의 상보적인 뉴클레오티드 시티딘이 구아노신에 의해 교체되는 경우, 시티딘 또는 이의 유사체에 의해 선택적으로 교체될 수 있으며;

루프 서열[N_0-4(U/T)N_0-4]는 요소 스템1 및 스템2 사이에 위치하며, 3 내지 5개 뉴클레오티드, 더욱 바람직하게 4개 뉴클레오티드의 연속적인 서열이며;

상기 각 N_0-4는 서로 독립적으로 0 내지 4개, 바람직하게 1 내지 3개, 더욱 바람직하게 1 내지 2개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택되며; 및

상기 U/T는 우리딘, 또는 선택적으로 티미딘을 나타냄;

스템2[N_3-5CN_0-2]는 요소 스템1과 역 상보적 또는 부분적으로 역 상보적이며, 5 내지 7개 뉴클레오티드의 연속적인 서열이며;

상기 N_3-5는 3 내지 5개, 바람직하게 4 내지 5개, 더욱 바람직하게 4개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;

상기 N_0-2는 0 내지 2개, 바람직하게 0 내지 1개, 더욱 바람직하게 1개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 또는 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨; 및

상기 C는 시티딘 또는 이의 유사체이며, 스템1 내 이의 상보성 뉴클레오시드 구아노신이 시티딘에 의해 교체되는 경우 선택적으로 구아노신 또는 이의 유사체에 의해 교체될 수 있음;

상기

스템1 및 스템2는 염기쌍이 예를 들어 뉴클레오티드 A 및 U/T 또는 G 및 C의 왓슨-크릭 염기쌍에 의해 또는 비-왓슨-크릭 염기쌍, 예를 들어 워블 염기쌍, 역 왓슨-크릭 염기쌍, 후그스틴 염기쌍, 역 후그스틴 염기쌍에 의해 스템1 및 스템2 사이에 발생할 수 있는, 서로 역 상보적 서열을 형성하는 염기쌍이 가능하며, 또는 하나의 스템 내 하나 또는 그 이상의 염기가 다른 스템의 역 상보적 서열 내 상보적 염기를 갖지 않음에 기초하여, 불완전 염기쌍이 스템1 및 스템2 사이에 발생할 수 있는, 부분적으로 역 상보적 서열을 서로 형성하는 염기쌍이 가능하다.

더욱 바람직한 실시예에 따르면, 히스톤 스템-루프 서열은 하기 특정한 화학식 (Ia) 또는 (IIa)의 적어도 하나에 따라 선택될 수 있다:

화학식(Ia) (스템 경계 요소가 없는 스템-루프 서열):

화학식(IIa) (스템 경계 요소가 있는 스템-루프 서열):

상기:

N, C, G, T 및 U는 상기 정의된 것과 같음.

일 양태의 더욱 더 특히 바람직한 실시예에 따르면, 인공 핵산 분자 서열은 하기 특정한 화학식 (Ib) 또는 (IIb)의 적어도 하나에 따른 적어도 하나의 히스톤 스템-루프 서열을 포함할 수 있다:

화학식 (Ib) (스템 경계 요소가 없는 스템-루프 서열):

화학식 (IIb) (스템 경게 요소가 있는 스템-루프 서열):

상기:

N, C, G, T 및 U는 상기 정의된 것과 같음.

특히 바람직한 히스톤 스템-루프 서열은 SEQ ID NO: 5: CAAAGGCTCTTTTCAGAGCCACCA에 따른 서열 또는 더욱 바람직하게 SEQ ID NO: 5에 따른 핵산 서열의 상응하는 RNA 서열이다.

예를 들어, 상기 단일 요소는 하기 순서의 인공 핵산 분자로 나타낼 수 있다:

5'-캡- 5'-UTR - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C)　서열;

5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C)　서열 - 히스톤 스템-루프;

5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C)　서열;

5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C)　서열 - 폴리(A)/(C) 서열;

5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 폴리(A)/(C)　서열 - 히스톤 스템-루프;

5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 폴리(A)/(C)　서열 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;

5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C)　서열 - 폴리(A)/(C) 서열;

5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템 루프; 등.

일부 실시예에서, 인공 핵산 분자는 5'-캡, 폴리(C) 서열 및/또는 IRES-모티프와 같은 추가적인 요소를 포함한다. 5'-캡은 RNA의 5' 말단에 전사 동안 또는 후기-전사적으로(post-transcriptionally) 첨가될 수 있다. 게다가, 본 발명의 인공 핵산 분자는 특히 핵산이 mRNA의 형태이거나 또는 mRNA를 코딩할 경우, 적어도 10개 시티딘, 바람직하게 적어도 20개 시티딘, 더욱 바람직하게 적어도 30개 시티딘(소위 "폴리(C) 서열")의 서열에 의해 변형될 수 있다. 특히, 본 발명의 인공 핵산 분자는 특히 핵산이 (m)RNA의 형태이거나 mRNA를 코딩할 때, 약 10 내지 200개 시티딘 뉴클레오티드, 바람직하게 약 10 내지 100개 시티딘 뉴클레오티드, 더욱 바람직하게 약 10 내지 70개 시티딘 뉴클레오티드 또는 더욱 더 바람직하게 약 20 내지 50개 뉴클레오티드 또는 더욱 더 20 내지 30개 시티딘 뉴클레오티드의 폴리(C) 서열을 포함할 수 있다. 더욱 바람직하게, 본 발명의 핵산은 30개 시티딘 잔기의 폴리(C) 서열을 포함한다. 따라서 바람직하게 본 발명에 따른 인공 핵산 분자는 5'-내지 3' 방향으로, ORF, 상기 설명된 적어도 하나의 3'-UTR 요소, 폴리(A) 서열 또는 폴리아데닐화 신호, 및 폴리(C) 서열을 포함한다.

내부 리보좀 유입 부위(IRES) 서열 또는 IRES-모티프는 예를 들어 만약 인공 핵산 분자가 둘 또는 그 이상의 펩타이드 또는 단백질을 코딩하는 경우, 몇몇 오픈 리딩 프레임을 분리할 수 있다. IRES-서열은 만약 상기 인공 핵산 분자가 바이-(bi-) 또는 멀티시스트로닉 핵산 분자일 경우에, 특히 유용할 수 있다.

게다가, 인공 핵산 분자는 추가적 5'-요소, 바람직하게 5'-UTR, 프로모터 또는 5'-UTR 및 프로모터 포함 서열을 포함할 수 있다. 상기 프로모터는 본 발명에 따른 인공 핵산 분자, 예를 들어 본 발명에 따른 인공 DNA 분자의 전사를 일으키고 또는 조절할 수 있다. 게다가, 상기 5'-UTR은 본 발명에 정의된 유전자의 5'-UTR로 구성될 수 있거나 또는 포함할 수 있다. 게다가 상기 5'-UTR은 본 발명의 3'-UTR과 상호작용할 수 있으며, 따라서 본 발명의 3'-UTR 요소의 안정화 효과를 도울 수 있다. 이러한 요소는 추가적으로 안정성 및 번역 효율을 도울 수 있다. 따라서, 일부 실시예에서, 본 발명은 하기 구조의 적어도 하나의 5'-에서 3'-방향으로 포함하는, 인공 핵산 분자, 바람직하게 mRNA 분자를 제공한다

5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C)　서열;

5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템 루프.

본 발명 인공 핵산 분자의 특히 바람직한 실시예는 500, 400, 300, 250, 200, 150 또는 100개 뉴클레오티드 미만의 및/또는 20, 30, 40, 50 또는 60개 뉴클레오티드 이상의 길이의 적어도 하나의 5'-비번역된 영역 요소(5'UTR 요소), 바람직하게 TOP 유전자의 5'UTR로부터 유도된 또는 TOP 유전자의 5'UTR의 절편, 상동체 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 것을 포함한다.

5'UTR 요소는 상기 정의된 TOP-모티프 또는 5'TOP를 포함하지 않는 것이 특히 바람직하다.

TOP 유전자의 5'UTR로부터 유도된 핵산 서열은 진핵 TOP 유전자, 바람직하게 식물 또는 동물 TOP 유전자, 더욱 바람직하게 척색동물 TOP 유전자, 더욱 더 바람직하게 척추동물 TOP 유전자, 가장 바람직하게 인간 TOP 유전자와 같은, 포유동물 TOP 유전자로부터 유도된다.

예를 들어 5'UTR 요소는 바람직하게 공개가 본 발명에 참고문헌으로 병합된 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422로 구성된 그룹으로부터 선택된 핵산 서열로부터, 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체로부터, 이의 변이체로부터 또는 바람직하게 상응하는 RNA 서열로부터 유도된, 핵산 서열을 포함하거나 이로 구성된 5'-UTR 요소로부터 선택된다. 용어 "특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체"는 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422에 따른 서열에 상동인, 호모 사피엔스 외 다른 종의 서열을 의미한다.

바람직한 실시예에서, 5'UTR 요소는 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422로부터, 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체로부터, 이의 변이체, 또는 상응하는 RNA 서열로부터 선택된 핵산 서열의 뉴클레오티드 위치 5(즉 서열 내 위치 5에 위치한 뉴클레오티드)에서 시작 코돈(서열의 3'-말단에 위치)에 뉴클레오티드 위치 바로 옆 5', 예를 들어 ATG 서열에 뉴클레오티드 위치 바로 옆 5'까지 확장하는 핵산 서열로부터 유도된, 핵산 서열을 포함하거나 이로 구성된다. 5' UTR 요소는 5'TOP에 뉴클레오티드 위치 바로 옆 3'으로부터 시작 코돈(서열의 3' 말단에 위치한)에 뉴클레오티드 위치 바로 옆 5', 예를 들어 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 142로부터, 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체로부터, 이의 변이체, 또는 상응하는 RNA 서열로부터 선택된 핵산 서열의 ATG 서열의 뉴클레오티드 위치 바로 옆 5'까지 확장하는 핵산 서열로부터 유도되는 것이 특히 바람직하다.

특히 바람직한 실시예에서, 5'UTR 요소는 리보좀 단백질을 코딩하는 TOP 유전자의 5'UTR 또는 리보좀 단백질을 코딩하는 TOP 유전자의 5'UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된다. 예를 들어, 5'UTR 요소는 특허 출원 WO2013/143700의 SEQ ID NOs: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359, 또는 1360의 어느 것에 따르는 핵산 서열의 5'UTR로부터 유도된 핵산 서열, 상응하는 RNA 서열, 이의 상동체, 본 발명에 설명된 이의 변이체, 바람직하게 5'TOP 모티프가 없는 것을 포함하거나 이로 구성된다. 상기와 같이, 뉴클레오티드 바로 옆 5'에 위치 5로부터 ATG(서열의 3'말단에 위치한)까지 확장하는 서열은 상기 서열의 5'UTR에 상응한다.

바람직하게, 5'UTR 요소는 리보좀 라지 단백질(RPL)을 코딩하는 TOP 유전자의 5'UTR로부터 또는 리보좀 라지 단백질(RPL)을 코딩하는 TOP 유전자의 5'UTR의 상동체 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된다. 예를 들어, 상기 5'UTR 요소는 특허 출원 WO2013/143700의 SEQ ID NOs: SEQ ID NOs: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 및 1422의 어느 것에 따른 핵산 서열의 5'UTR로부터 유도된 핵산 서열, 상응하는 RNA 서열, 본 발명에 설명된 이의 상동체, 또는 이의 변이체, 바람직하게 5'TOP 모티프가 없는 것을 포함하거나 이로 구성된다.

특히 바람직한 실시예에서, 상기 5'UTR 요소는 리보좀 단백질 라지 32 유전자의 5'UTR로부터, 바람직하게 척추동물 리보좀 단백질 라지 32(L32) 유전자로부터, 더욱 바람직하게 포유동물 리보좀 단백질 라지 32(L32) 유전자로부터, 가장 바람직하게 인간 리보좀 단백질 라지 32(L32) 유전자로부터, 또는 리보좀 단백질 라지 32 유전자의 5'UTR의 변이체로부터, 바람직하게 척추동물 리보좀 단백질 라지 32(L32) 유전자로부터, 더욱 바람직하게 포유동물 리보좀 단백질 라지 32(L32) 유전자로부터, 가장 바람직하게 인간 리보좀 단백질 라지 32(L32) 유전자로부터 유도된 핵산 서열을 포함하거나 이로 구성되며, 바람직하게 상기 5'UTR 요소는 상기 유전자의 5'TOP를 포함하지 않는다.

따라서, 특히 바람직한 실시예에서, 5'UTR 요소는 SEQ ID No. 6(5' 말단 올리고피리미딘 트랙트(tract)가 없는 인간 리보좀 단백질 라지 32의 5'-UTR: GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; 특허 출원 WO2013/143700의 SEQ ID No. 1368에 상응)에 따른 핵산 서열 또는 바람직하게 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는, 핵산 서열을 포함하거나 이로 구성되며, 또는 상기 적어도 하나의 5'UTR 요소는 SEQ ID No. 6에 따른 핵산 서열 또는 더욱 바람직하게 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성되며, 바람직하게 상기 절편은 상기 설명된 것과 같으며, 즉 전장 5'UTR의 적어도 20% 드을 나타내는 뉴클레오티드의 연속적인 스트레치이다. 바람직하게, 상기 절편은 적어도 약 20개 뉴클레오티드 또는 그 이상, 바람직하게 적어도 약 30개 뉴클레오티드 또는 그 이상, 더욱 바람직하게 적어도 약 40개 뉴클레오티드 또는 그 이상의 길이를 보인다. 바람직하게 상기 절편은 본 발명에 설명된 기능적 절편이다.

일부 실시예에서, 인공 핵산 분자는 RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB로부터 선택된 포유동물과 같은 척추동물 TOP 유전자, 예를 들어 인간 TOP 유전자의 5'UTR로부터, 또는 이의 상동체 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 5'UTR 요소를 포함하며, 상기 바람직하게 5'UTR 요소는 TOP-모티프 또는 상기 유전자의 5'TOP를 포함하지 않으며, 상기 선택적으로 5'UTR 요소는 5' 말단 올리고피리미딘 트랙트(TOP)의 위치 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 다운스트림에 위치한 뉴클레오티드와 함께 이의 5'-말단에서 시작하며, 상기 TOP 유전자의 5'UTR로부터 유도된 보다 선택적인 5'UTR 요소는 이것이 유도된 유전자의 시작 코돈 (A(U/T)G)의 위치 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 업스트림에 위치한 뉴클레오티드와 함께 이의 3'-말단에서 종결한다.

바람직하게, 상기 본 발명에 따른 인공 핵산 분자, 바람직하게 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되었다. 따라서, 본 발명의 인공 핵산 분자는 분자의 G(구아노신)/C(시티딘) 함량을 변형함으로써 열역학적으로 안정화될 수 있다. 본 발명에 따른 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량은 바람직하게 유전자 코드의 축퇴(degeneration)를 사용하여, 상응하는 야생형 서열의 오픈 리딩 프레임의 G/C 함량에 비해 증가될 수 있다. 따라서, 인공 핵산 분자의 코딩된 아미노산 서열은 바람직하게 특정한 야생형 서열의 코딩된 아미노산 서열에 비해 G/C 변형에 의해 변형되지 않는다. 코딩 서열의 코돈 또는 전체 인공 핵산 분자, 예를 들어 mRNA는 따라서 야생형 코딩 서열에 비해 다양할 수 있으며, 그들은 증가된 함량의 G/C 뉴클레오티드를 포함하는 반면 번역된 아미노산 서열은 유지된다. 몇몇 코돈이 하나 및 동일한 아미노산(소위 유전자 코드위 축퇴)을 코드(code)하는 사실 때문에, 코딩된 펩타이드/단백질 서열을 변화시키지 않고(소위 대안적(alternative) 코돈 사용), 코돈을 변형하는 것이 가능하다. 따라서, RNA의 안전성에 관하여 및/또는 개체 내 코돈 사용(소위 코돈 최적화)에 관하여 보다 바람직한, 특정 코돈을 특이적으로 도입(동일한 아미노산을 코딩하는 각각의 야생형 코돈을 교환)하는 것이 가능하다.

본 발명에 정의된 본 발명의 인공 핵산 분자의 코딩 영역에 의해 코딩되는 아미노산에 의존하여, 이의 야생형 코딩 영역에 비해, 핵산 서열, 예를 들어 오픈 리딩 프레임의 변형의 다양한 가능성이 있다. 독점적으로 G 또는 C 뉴클레오티드를 포함하는 코돈에 의해 코딩된 아미노산의 경우에, 코돈의 변형이 없는 것이 필수적이다. 따라서 Pro (CCC 또는 CCG), Arg (CGC 또는 CGG), Ala (GCC 또는 GCG) 및 Gly (GGC 또는 GGG)에 대한 코돈은, A 또는 U/T가 존재하지 않으므로, 변형을 요구하지 않는다.

대조적으로 A 및/또는 U/T 뉴클레오티드를 포함하는 코돈은 동일한 아미노산을 코딩하지만 A 및/또는 U/T를 포함하지 않는 다른 코돈의 치환에 의해 변형될 수 있다. 예를 들어

Pro에 대한 코돈은 CC(U/T) 또는 CCA로부터 CCC 또는 CCG로 변형될 수 있으며;

Arg에 대한 코돈은 CG(U/T) 또는 CGA 또는 AGA 또는 AGG로부터 CGC 또는 CGG로 변형될 수 있으며;

Ala에 대한 코돈은 GC(U/T) 또는 GCA로부터 GCC 또는 GCG로 변형될 수 있으며;

Gly에 대한 코돈은 GG(U/T) 또는 GGA로부터 GGC 또는 GGG로 변형될 수 있다.

다른 경우에, 비록 A 또는 (U/T) 뉴클레오티드가 코돈으로부터 제거되지 않더라도, 그러나 A 및/또는 (U/T) 뉴클레오티드의 낮은 함량을 포함하는 코돈을 사용함으로써 A 및 (U/T) 함량을 감소시키는 것이 가능하다. 이들의 예시는 하기와 같다:

Phe에 대한 코돈은 (U/T)(U/T)(U/T)로부터 (U/T) (U/T)C로 변형될 수 있으며;

Leu에 대한 코돈은 (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) 또는 C(U/T)A로부터 C(U/T)C 또는 C(U/T)G로 변형될 수 있으며;

Ser에 대한 코돈은 (U/T)C(U/T) 또는 (U/T)CA 또는 AG(U/T)로부터 (U/T)CC, (U/T)CG 또는 AGC로 변형될 수 있으며;

Tyr에 대한 코돈은 (U/T)A(U/T)로부터 (U/T)AC로 변형될 수 있으며;

Cys에 대한 코돈은 (U/T)G(U/T)로부터 (U/T)GC로 변형될 수 있으며;

His에 대한 코돈은 CA(U/T)로부터 CAC로 변형될 수 있으며;

Gln에 대한 코돈은 CAA로부터 CAG로 변형될 수 있으며;

Ile에 대한 코돈은 A(U/T)(U/T) 또는 A(U/T)A로부터 A(U/T)C로 변형될 수 있으며;

Thr에 대한 코돈은 AC(U/T) 또는 ACA로부터 ACC 또는 ACG로 변형될 수 있으며;

Asn에 대한 코돈은 AA(U/T)로부터 AAC로 변형될 수 있으며;

Lys에 대한 코돈은 AAA로부터 AAG로 변형될 수 있으며;

Val에 대한 코돈은 G(U/T)(U/T) 또는 G(U/T)A로부터 G(U/T)C 또는 G(U/T)G로 변형될 수 있으며;

Asp에 대한 코돈은 GA(U/T)로부터 GAC로 변형될 수 있으며;

Glu에 대한 코돈은 GAA로부터 GAG로 변형될 수 있으며;

정지 코돈 (U/T)AA는 (U/T)AG 또는 (U/T)GA로 변형될 수 있다.

Met (A(U/T)G) 및 Trp ((U/T)GG)에 대한 코돈의 경우에는, 반면 코딩된 아미노산 서열이 바뀌지 않는다면 서열 변형의 가능성은 없다.

상기 개시된 치환들은 이의 특정한 야생형 오픈 리딩 프레임(즉 본래 서열)에 비해, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량을 증가시키기 위해 각각 또는 모두 가능한 조합으로 사용될 수 있다. 따라서 예를 들어 야생형 서열에 발생하는 Thr에 대한 모든 코돈은 ACC(또는 ACG)로 변형될 수 있다.

바람직하게 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량은 코딩된 아미노산 서열의 변화 없이, 즉 유전자 코드의 축퇴를 사용하여, 야생형 코딩 영역의 G/C 함량에 비해 적어도 7%, 더욱 바람직하게는 적어도 15%, 특히 바람직하게는 적어도 20% 증가된다. 특정한 실시예에 따르면 본 발명의 인공 핵산 분자 또는 절편, 변이체 또는 이의 유도체의 오픈 리딩 프레임 내 치환가능한 코돈의 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 더욱 바람직하게는 적어도 70%, 더욱 더 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90%, 95% 또는 100%는 치환되며, 그에 따라 상기 오픈 리딩 프레임의 G/C 함량이 증가한다.

이러한 맥락에서 이는 코딩된 아미노산 서열의 변화 없이, 야생형 오픈 리딩 프레임에 비해, 최대한(즉 치환 가능한 코돈의 100%), 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량을 증가시키기 위해 특히 바람직하다.

나아가 오픈 리딩 프레임은 바람직하게는 적어도 부분적으로 코돈-최적화되었다. 코돈-최적화는 번역 효율이 세포 내 트랜스퍼 RNAs(tRNAs)의 발생의 다른 빈도에 의해 결정될 수 있다는 발견에 기초한다. 따라서 만약 소위 “드문 코돈”이 본 발명에 정의된 본 발명의 인공 핵산 분자의 코딩 영역에 존재하는 경우에, 증가된 범위에, 상응하는 변형된 핵산 서열의 번역은 상대적으로 “빈번한” tRNAs를 코딩하는 코돈이 존재하는 경우에 비해 덜 효율적이다.

따라서, 본 발명의 인공 핵산 분자의 오픈 리딩 프레임은 바람직하게는 세포 내 상대적으로 드문, tRNA를 코딩하는 야생형 서열의 적어도 하나의 코돈과 같이 상응하는 야생형 코딩 영역에 비해 변형되며, 세포 내 상대적으로 빈번하며 상대적으로 드문 tRNA와 같은 동일한 아미노산을 수송하는 tRNA를 코딩하는 코돈에 대해 교환된다. 이러한 변형에 의해, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임은 변형되어, 빈번하게 발생하는 tRNAs가 가능한 코돈은 드문 tRNAs에 상응하는 코돈을 교체할 수 있다. 다시 말해서 본 발명에 따르면, 이러한 변형에 의해 드문 tRNA를 코딩하는 야생형 오픈 리딩 프레임의 모든 코돈은 세포 내 보다 빈번한 tRNA를 코딩하는 코돈으로 교환될 수 있으며 드문 tRNA로서 동일한 아미노산을 수송한다. 세포 내 상대적으로 빈번하게 발생하는 tRNAs 및 반대로 상대적으로 드물게 발생하는 것은 기술분야에서 통상의 기술자에게 알려져 있다; 예를 들어 Akashi, Curr. Opin. Genet. Dev. 2001, 11(6): 660-666 참조. 따라서 바람직하게는 오픈 리딩 프레임은 바람직하게는 본 발명에 따르는 인공 핵산 분자가 발현되는 시스템에 관하여, 바람직하게는 본 발명에 따르는 인공 핵산 분자가 번역되는 시스템에 관하여, 코돈 최적화된다. 바람직하게는 오픈 리딩 프레임의 코돈 사용은 포유동물 코돈 사용에 따라서, 더욱 바람직하게는 인간 코돈 사용에 따라서 코돈 최적화된다. 바람직하게는 오픈 리딩 프레임은 코돈-최적화되고 G/C 함량 변형된다.

추가적인 분해(degradation) 저항성, 예를 들어 엑소- 또는 엔도뉴클레아제에 의한 인비보 분해에 대한 저항성의 증가를 위해, 및/또는 본 발명에 따르는 인공 핵산 분자로부터 단백질 발현의 안정성을 보다 향상시키기 위해, 상기 인공 핵산 분자는 백본 변형, 당 변형 및/또는 염기 변형, 예를 들어 지질-변형 또는 그와 유사한 것과 같은 변형을 추가적으로 포함할 수 있다. 바람직하게는, 본 발명에 따르는 인공 핵산 분자의 전사 및 또는 번역은 상기 변형에 의해 현저하게 손상되지 않는다.

일반적으로, 본 발명의 인공 핵산 분자는 어느 천연(=자연적으로 발생) 뉴클레오티드, 예를 들어 구아노신, 우라실, 아데노신, 및/또는 시토신 또는 이의 유사체를 포함할 수 있다. 이와 관련하여, 뉴클레오티드 유사체는 자연적으로 발생한 뉴클레오티드 아데노신, 시토신, 티미딘, 구아노신 및 우리딘의 천연적 및 비-천연적으로 발생한 변이체로 정의된다. 따라서, 유사체는 예를 들어 바람직하게 자연적으로 발생한 뉴클레오티드로부터 첨가 또는 삭제된 또는 뉴클레오티드의 자연적으로 발생한 기능기를 치환하는, 비-자연적으로 발생한 기능기를 갖는 화학적으로 유도된 뉴클레오티드이다. 따라서, 자연적으로 발생하는 뉴클레오티드의 각 구성요소는 변형된, 즉 염기 구성요소, 당(리보스) 구성요소 및/또는 RNA 서열의 백본(상기 참조)을 형성하는 포스페이트 구성요소일 수 있다. 구아노신, 우리딘, 아데노신, 티미딘 및 시토신의 유사체는 예를 들어 1-메틸-아데노신, 1-메틸-구아노신, 1-메틸-이노신, 2,2-디메틸-구아노신, 2,6-디아미노퓨린, 2'-아미노-2'-디옥시아데노신, 2'-아미노-2'-디옥시시티딘, 2'-아미노-2'-디옥시구아노신, 2'-아미노-2'-디옥시우리딘, 2-아미노-6-클로로퓨린리보사이드, 2-아미노퓨린-리보사이드, 2'-아라아데노신, 2'-아라시티딘, 2'-아라우리딘, 2'-아지도-2'-디옥시아데노신, 2'-아지도-2'-디옥시시티딘, 2'-아지도-2'-디옥시구아노신, 2'-아지도-2'-디옥시우리딘, 2-클로로아데노신, 2'-플루오로-2'-디옥시아데노신, 2'-플루오로-2'-디옥시시티딘, 2'-플루오로-2'-디옥시구아노신, 2'-플루오로-2'-디옥시우리딘, 2'-플루오로티미딘, 2-메틸-아데노신, 2-메틸-구아노신, 2-메틸-티오-N6-이소페네닐-아데노신, 2'-O-메틸-2-아미노아데노신, 2'-O-메틸-2'-디옥시아데노신, 2'-O-메틸-2'-디옥시시티딘, 2'-O-메틸-2'-디옥시구아노신, 2'-O-메틸-2'-디옥시우리딘, 2'-O-메틸-5-메틸우리딘, 2'-O-메틸이노신, 2'-O-메틸슈도우리딘, 2-티오시티딘, 2-티오-시토신, 3-메틸-시토신, 4-아세틸-시토신, 4-티오우리딘, 5-(카르복시하이드록시메틸)-우라실, 5,6-디하이드로우리딘, 5-아미노알릴시티딘, 5-아미노알릴-디옥시-우리딘, 5-브로모우리딘, 5-카르복시메틸아미노메틸-2-티오-우라실, 5-카르복시메틸아모노메틸-우라실, 5-클로로-아라-시토신, 5-플루오로-우리딘, 5-아이오도우리딘, 5-메톡시카르보닐메틸-우리딘, 5-메톡시-우리딘, 5-메틸-2-티오-우리딘, 6-아자시티딘, 6-아자우리딘, 6-클로로-7-디아자-구아노신, 6-클로로퓨린리보사이드, 6-메르캅토-구아노신, 6-메틸-메르캅토퓨린-리보사이드, 7-디아자-2'-디옥시-구아노신, 7-디아자아데노신, 7-메틸-구아노신, 8-아자아데노신, 8-브로모-아데노신, 8-브로모-구아노신, 8-메르캅토-구아노신, 8-옥소구아노신, 벤지미다졸-리보사이드, 베타-D-만노실-큐오신(queosine), 디하이드로-우라실, 이노신, N1-메틸아데노신, N6-([6-아미노헥실]카르바모일메틸)-아데노신, N6-이소펜테닐-아데노신, N6-메틸-아데노신, N7-메틸-잔토신, N-우라실-5-옥시아세트산 메틸 에스터, 퓨로마이신, 큐오신, 우라실-5-옥시아세트산, 우라실-5-옥시아세트산 메틸 에스터, 위보톡소신(Wybutoxosine), 잔토신, 및 자일로-아데노신을 포함하는 화학적으로 변형된, 예를 들어 아세틸화, 메틸화, 하이드록실화 등에 의해, 어느 자연적 발생 또는 비-자연적 발생한 구아노신, 우리딘, 아데노신, 티미딘 또는 시토신을 포함하나, 이에 제한되지 않는다. 이러한 유사체의 제조는 예를 들어 US 특허 4,373,071, US 4,401,796, US 4,415,732, US 4,458,066, US 4,500,707, US 4,668,777, US 4,973,679, US 5,047,524, US 5,132,418, US 5,153,319, US 5,262,530 및 5,700,642로부터, 통상의 기술자에게 알려져 있다. 상기 설명된 유사체의 경우, 특히 바람직한 것은 코딩된 펩타이드 또는 단백질의 단백질의 발현을 증가시키는, 또는 본 발명의 인공 핵산 분자의 면역원성을 증가시키며 및/또는 도입된 인공 핵산 분자의 추가적 변형을 방해하지 않는, 이들 유사체에 대하여 본 발명의 특정한 실시예에 따라 주어질 수 있다.

특정한 실시예에 따르면, 본 발명의 인공 핵산 분자는 지질 변형을 포함할 수 있다.

바람직한 실시예에서, 인공 핵산 분자는 바람직하게 5'에서 3' 방향으로 하기 요소를 포함한다:

5'-UTR;

적어도 하나의 오픈 리딩 프레임(ORF), 상기 ORF는 바람직하게 야생형 서열에 관하여 적어도 하나의 변형을 포함함;

리보좀 단백질의 3'UTR로부터, 바람직하게 SEQ ID NOs: 10 내지 115의, 더욱 바람직하게 RPS9의 3'UTR의, 더욱 바람직하게 인간 RPS9의 3'UTR의 어느 것에 따른 핵산 서열로부터 유도된 3'-UTR;

폴리(A) 서열, 바람직하게 64개 아데닐레이트(adenylates)를 포함;

폴리(C) 서열, 바람직하게 30개 시티딜레이트(cytidylates)를 포함;

히스톤 스템-루프 서열.

다른 바람직한 실시예에서, 인공 핵산 분자는 SEQ ID NO: 7(도 3 참조)에 따라 나타난 뉴클레오티드 서열 또는 상보적인 DNA 서열을 포함하거나 이로 구성된다.

특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 하기에 설명된 하나 또는 그 이상의 변형을 추가적으로 포함할 수 있다:

화학적 변형:

인공 핵산 분자에 관하여 본 발명에 사용된 용어 "변형"은 백본 변형뿐만 아니라 당 변형 또는 염기 변형을 포함하는 화학적 변형을 의미할 수 있다.

이러한 맥락에서, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자는 뉴클레오티드 유사체/변형, 예를 들어 백본 변형, 당 변형 또는 염기 변형을 포함할 수 있다. 본 발명에 관련하여 백본 변형은 본 발명에 정의된 핵산 분자 내 포함된 뉴클레오티드의 백본의 포스페이트가 화학적으로 변형된, 변형이다. 본 발명에 관하여 당 변형은 본 발명에 정의된 핵산 분자의 뉴클레오티드의 당의 화학적 변형이다. 게다가, 본 발명에 관하여 염기 변형은 핵산 분자의 핵산 분자의 뉴클레오티드의 염기 일부의 화학적 변형이다. 이러한 맥락에서, 뉴클레오티드 유사체 또는 변형은 바람직하게 전사 및/또는 번역을 위해 적용 가능한 뉴클레오티드 유사체로부터 선택된다.

당 변형:

본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA에 병합될 수 있는 변형된 뉴클레오시드 및 뉴클레오티드는 당 일부에 변형될 수 있다. 예를 들어, RNA 분자의 2'하이드록실기(OH)는 다른 많은 "옥시" 또는 "디옥시" 치환기로 변형되거나 교체될 수 있다. "옥시"-2' 하이드록실기 변형의 예시는 알콕시 또는 알릴옥시(-OR, 예를 들어, R = H, 알킬, 사이클로알킬, 아릴, 아랄킬, 헤테로아릴 또는 당); 폴리에틸렌글리콜(PEG), -0(CH2CH2o)nCH2CH2OR; 2'하이드록실이 연결된 "잠긴(locked)" 핵산(LNA), 예를 들어 동일한 리보스 당의 4' 탄소에 메틸렌 브릿지에 의한 것; 및 아미노기(-O-아미노, 상기 아미노기, 예를 들어 NRR은 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴 아미노, 에틸렌 디아민, 폴리아미노일 수 있음) 또는 아미노알콕시를 포함하나, 이에 제한되지 않는다.

"디옥시" 변형은 수소, 아미노(예를 들어 NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴 아미노, 디헤테로아릴 아미노, 또는 아미노산)를 포함; 또는 아미노기는 링커를 통해 당에 결합될 수 있으며, 상기 링커는 하나 또는 그 이상의 원자 C, N, 및 O를 포함한다.

상기 당 그룹은 또한 리보스 내 상응하는 탄소에 비해 반대의 입체 화학적 배치를 갖는 하나 또는 그 이상의 탄소를 포함한다. 따라서, 변형된 핵산 분자는 예를 들어 당과 같은 아라비노스를 포함하는 뉴클레오티드를 포함할 수 있다.

백본 변형:

포스페이트 백본은 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA로 병합될 수 있는, 변형된 뉴클레오시드 및 뉴클레오티드에서 더욱 변형될 수 있다. 백본의 포스페이트 기는 다른 치환기와 함께 산소 원자의 하나 또는 그 이상의 교체에 의해 변형될 수 있다. 게다가, 변형된 뉴클레오시드 및 뉴클레오티드는 본 발명에 설명된 변형된 포스페이트와 함께 비변형된 포스페이트 일부의 완전한 교체를 포함할 수 있다. 변형된 포스페이트 기의 예시는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스터, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스터를 포함하나, 이에 제한되지 않는다. 포스포로디티오에이트는 황에 의해 교체된 양쪽 비-연결 산소를 갖는다. 포스페이트 링커는 또한 질소(가교된(bridged) 포스포로아미데이트), 황(가교된 포스포로티오에이트) 및 탄소(가교된 메틸렌포스포네이트)와 함께 연결 산소의 치환에 의해 변형될 수 있다.

염기 변형:

본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자로 병합될 수 있는, 변형된 뉴클레오시드 및 뉴클레오티드는 핵염기 일부에 추가로 변형될 수 있다. RNA에서 발견된 핵염기의 예시는 아데닌, 구아닌, 시토신 및 우라실을 포함하나, 이에 제한되지 않는다. 예를 들어, 본 발명에 정의된 뉴클레오시드 및 뉴클레오티드는 메이저 그루브(major groove) 페이스에 화학적으로 변형될 수 있다. 일부 실시예에서, 메이저 그루브 화학적 변형은 아미노기, 티올기, 알킬기, 또는 할로기를 포함할 수 있다.

본 발명의 특히 바람직한 실시예에서, 뉴클레오티드 유사체/변형은 2-아미노-6-클로로퓨린리보사이드-5'-트리포스페이트, 2-아미노퓨린-리보사이드-5'-트리포스페이트; 2-아미노아데노신-5'-트리포스페이트, 2'-아미노-2'-디옥시시티딘-트리포스페이트, 2-티오시티딘-5'-트리포스페이트, 2-티오우리딘-5'-트리포스페이트, 2'-플루오로티미딘-5'-트리포스페이트, 2'-O-메틸 이노신-5'-트리포스페이트 4-티오우리딘-5'-트리포스페이트, 5-아미노알릴 시티딘-5'-트리포스페이트, 5-아미노알릴우리딘-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 5-브로모우리딘-5'-트리포스페이트, 5-브로모-2'-디옥시시티딘-5'-트리포스페이트, 5-브로모-2'-디옥시우리딘-5'-트리포스페이트, 5-아이오도시티딘-5'-트리포스페이트, 5-아이오도-2'-디옥시시티딘-5'-트리포스페이트, 5-아이오도우리딘-5'-트리포스페이트, 5-아이오도-2'-디옥시우리딘-5'-트리포스페이트, 5-메틸시티딘-5'-트리포스페이트, 5-메틸우리딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시시티딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시우리딘-5'-트리포스페이트, 6-아자시티딘-5'-트리포스페이트, 6-아자우리딘-5'-트리포스페이트, 6-클로로퓨린리보사이드-5'-트리포스페이트, 7-디아자아데노신-5'-트리포스페이트, 7-디아자구아노신-5'-트리포스페이트, 8-아자아데노신-5'-트리포스페이트, 8-아지도아데노신-5'-트리포스페이트, 벤지미다졸-리보사이드-5'-트리포스페이트, N1-메틸아데노신-5'-트리포스페이트, N1-메틸구아노신-5'-트리포스페이트, N6-메틸아데노신-5'-트리포스페이트, O6-메틸 구아노신-5'-트리포스페이트, 슈도우리딘-5'-트리포스페이트, 또는 퓨로마이신-5'-트리포스페이트, 잔토신-5'-트리포스페이트로부터 바람직하게 선택된 염기 변형으로부터 선택된다. 특히 바람직한 것은 5-메틸시티딘-5'-트리포스페이트, 7-디아자구아노신-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 및 슈도우리딘-5'-트리포스페이트로 구성된 염기 변형된 뉴클레오티드의 그룹으로부터 선택된 염기 변형에 대하여 뉴클레오티드로 주어졌다.

일부 실시예에서, 변형된 뉴클레오시드는 피리딘-4-온 리보뉴클레오시드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카르복시메틸-우리딘, 1-카르복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-디아자-슈도우리딘, 2-티오-1-메틸-1-디아자-슈도우리딘, 디하이드로우리딘, 디하이드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 및 4-메톡시-2-티오-슈도우리딘을 포함한다.

일부 실시예에서, 변형된 뉴클레오시드는 5-아자-시티딘, 슈도이소시티딘, 3-메틸-시티딘, N4-아세틸시티딘, 5-포밀시티딘, N4-메틸시티딘, 5-하이드록시메틸시티딘, 1-메틸-슈도이소시티딘, 피롤로-시티딘, 피롤로-슈도이소시티딘, 2-티오-시티딘, 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-디아자-슈도이소시티딘, 1-메틸-1-디아자-슈도이소시티딘, 제부라린(zebularine), 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 및 4-메톡시-l-메틸-슈도이소시티딘을 포함한다.

다른 실시예에서, 변형된 뉴클레오시드는 2-아미노퓨린, 2, 6-디아미노퓨린, 7-디아자-아데닌, 7-디아자-8-아자-아데닌, 7-디아자-2-아미노퓨린, 7-디아자-8-아자-2-아미노퓨린, 7-디아자-2,6-di아미노퓨린, 7-디아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜틸아데노신, N6-(시스-하이드록시이소펜틸)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐) 아데노신, N6-글리시닐카르바모일아데노신, N6-트레오닐카르바모일아데노신, 2-메틸티오-N6-트레오닐 카르바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌을 포함한다.

다른 실시예에서, 변형된 뉴클레오시드는 이노신, 1-메틸-이노신, 위오신, 위부토신, 7-디아자-구아노신, 7-디아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-디아자-구아노신, 6-티오-7-디아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, l-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신을 포함한다.

일부 실시예에서, 뉴클레오티드는 메이저 그루브 페이스에 변형될 수 있으며 메틸기 또는 할로기로 우라실의 C-5에 수소의 교체를 포함할 수 있다.

특정한 실시예에서, 변형된 뉴클레오시드는 5'-O-(1-티오포스페이트)-아데노신, 5'-O-(1-티오포스페이트)-시티딘, 5'-O-(1-티오포스페이트)-구아노신, 5'-O-(1-티오포스페이트)-우리딘 또는 5'-O-(1-티오포스페이트)-슈도우리딘이다.

보다 특정한 실시예에서 인공 핵산 분자, 바람직하게 RNA 분자는 6-아자-시티딘, 2-티오-시티딘, 알파-티오-시티딘, 슈도-이소-시티딘, 5-아미노알릴-우리딘, 5-아이오도-우리딘, N1-메틸-슈도우리딘, 5,6-디하이드로우리딘, 알파-티오-우리딘, 4-티오-우리딘, 6-아자-우리딘, 5-하이드록시-우리딘, 디옥시-티미딘, 5-메틸-우리딘, 피롤로-시티딘, 이노신, 알파-티오-구아노신, 6-메틸-구아노신, 5-메틸-시티딘, 8-옥소-구아노신, 7-디아자-구아노신, N1-메틸-아데노신, 2-아미노-6-클로로-퓨린, N6-메틸-2-아미노-퓨린, 슈도-이소-시티딘, 6-클로로-퓨린, N6-메틸-아데노신, 알파-티오-아데노신, 8-아지도-아데노신, 7-디아자-아데노신으로부터 선택된 뉴클레오시드 변형을 포함할 수 있다.

지질 변형:

추가적 실시예에 따르면, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA는 지질 변형을 포함할 수 있다. 이러한 지질 변형된 RNA는 전형적으로 본 발명에 정의된 RNA를 포함한다. 본 발명에 정의된 이러한 지질 변형된 RNA 분자는 전형적으로 RNA 분자와 공유 결합된 적어도 하나의 링커, 및 각각의 링커와 공유 결합된 적어도 하나의 지질을 추가로 포함한다. 그렇지 않으면, 상기 지질 변형된 RNA 분자는 본 발명에 정의된 적어도 하나의 RNA 분자 및 RNA 분자와 공유 결합된(링커 없이) 적어도 하나의 (이기능성(bifunctional)) 지질을 포함한다. 세번째 대안에 따르면, 지질 변형된 RNA 분자는 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자, 상기 RNA 분자와 공유 결합된 적어도 하나의 링커, 및 각각의 링커에 공유 결합된 적어도 하나의 지질, 및 또한 RNA 분자와 공유 결합된(링커 없이) 적어도 하나의 (이기능성) 지질을 포함한다. 이러한 맥락에서, 상기 지질 변형은 선형 RNA 서열의 말단에 존재하는 것이 특히 바람직하다.

변형된 RNA의 5'-말단의 변형:

본 발명의 다른 바람직한 실시예에 따르면, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자는 소위 "5' 캡(CAP)" 구조의 추가에 의해 변형될 수 있다.

5'-캡은 독립체, 전형적으로 변형된 뉴클레오티드 독립체이며, 일반적으로 성숙 mRNA의 5'-말단 "캡"이다. 5'-캡은 전형적으로 변형된 뉴클레오티드에 의해, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게, 5'-캡은 5'-5'-트리포스페이트 연결을 통해 5'-말단에 연결된다. 5'-캡은 메틸화, 예를 들어 m7GpppN될 수 있으며, 상기 N은 5'-캡을 수송하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 RNA의 5'-말단이다. m7GpppN은 폴리머라제 II에 의해 전사된 mRNA에서 자연적으로 발생하는 5'-캡 구조이며, 따라서 본 발명에 따른 변형된 RNA에 포함된 변형으로 고려되지 않는다. 이는 본 발명에 따른 인공 핵산 분자, 바람직하게 RNA 분자가 5'-캡으로 m7GpppN을 포함할 수 있음을 의미하지만, 추가적으로 상기 인공 핵산 분자, 바람직하게 RNA 분자는 본 발명에 정의된 적어도 하나의 추가적 변형을 포함한다.

5' 캡 구조의 추가적인 예시는 글리세릴, 인버티드(inverted) 디옥시 무염기(abasic) 잔기(일부), 4',5' 메틸렌 뉴클레오티드, 1-(베타-D-에리쓰로퓨라노실) 뉴클레오티드, 4'-티오 뉴클레오티드, 카르복실릭 뉴클레오티드, 1,5-무수헥시톨(anhydrohexitol) 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형된 염기 뉴클레오티드, 트레오-펜토퓨라노실 뉴클레오티드, 아실릭 3',4'-세코 뉴클레오티드, 아실릭 3,4-디하이드록시부틸 뉴클레오티드, 아실릭 3,5 디하이드록시펜틸 뉴클레오티드, 3'-3'-인버티드 뉴클레오티드 일부, 3'-3'-인버티드 무염기 일부, 3'-2'-인버티드 뉴클레오티드 일부, 3'-2'-인버티드 무염기 일부, 1,4-부탄디올 포스페이트, 3'-포스포아미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'포스포로 티오에이트, 포스포로디티오에이트, 또는 가교 또는 비가교 메틸렌포스포네이트 일부를 포함한다. 이들 변형된 5'-CAP 구조는 본 발명에 따른 인공 핵산 분자, 바람직하게 RNA 분자 내 포함된 적어도 하나의 변형으로 여겨진다.

특히 바람직한 변형된 5'-CAP 구조는 CAP1 (m7G의 인접 뉴클레오티드의 리보스의 메틸화), CAP2 (m7G의 2^nd 뉴클레오티드 다운스트림의 리보스의 메틸화), CAP3 (m7G의 3^rd 뉴클레오티드의 리보스의 메틸화), CAP4(m7G의 4^th 뉴클레오티드 다운스트림의 리보스의 메틸화), ARCA (안티-리버스 CAP 유사체, 변형된 ARCA(예를 들어 포스포티오에이트 변형된 ARCA), 이노신, N1-메틸-구아노신, 2'-플루오로-구아노신, 7-디아자-구아노신, 8-옥소-구아노신, 2-아미노-구아노신, LNA-구아노신, 및 2-아지도-구아노신이다.

바람직한 실시예에서, 적어도 하나의 오픈 리딩 프레임은 치료 단백질 또는 펩타이드를 코딩한다. 다른 실시예에서, 항원은 병원성 항원, 종양 항원, 알러지성 항원 또는 자가면역 항원과 같은, 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다. 이하, 항원을 코딩하는 인공 핵산 분자의 투여는 상기 항원을 포함하는 질병에 대한 유전적 백신접종 접근방법에 사용된다.

대안적 실시예에서, 항원은 본 발명에 따른 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다.

항원:

병원성 항원:

본 발명에 따른 인공 핵산 분자는 병원성 항원 또는 절편, 이의 변이체 또는 유도체를 포함하는 단백질 또는 펩타이드를 코딩한다. 이러한 병원성 항원은 개체, 특히 포유동물 개체, 보다 특히 인간 내 면역학적 반응을 일으키는 병원성 유기체, 특히 박테리아, 바이러스 또는 원생동물(다세포) 병원성 유기체로부터 유도된다. 보다 구체적으로, 병원성 항원은 바람직하게 바이러스 또는 박테리아 또는 원생동물 유기체의 표면에 위치한 표면 항원, 예를 들어 단백질(또는 단백질의 절편, 예를 들어 표면 항원의 외부 일부)이다.

병원성 항원은 바람직하게 감염성 질병과 관련된 병원체로부터 유도된 펩타이드 또는 단백질 항원이며, 바람직하게 병원체 아시네토박터 바우마니(Acinetobacter baumannii), 아나플라즈마 속(Anaplasma genus), 아나플라즈마 파고사이토필리움(Anaplasma phagocytophilum), 브라질구충(Ancylostoma braziliense), 십이지장충(Ancylostoma duodenale), 용혈성 아카노박테리아균(Arcanobacterium haemolyticum), 회충(Ascaris lumbricoides), 아스페르길루스 속(Aspergillus genus), 아스트로비리다에(Astroviridae), 바베시아 속(Babesia genus), 탄저균(Bacillus anthracis), 바실러스 세레우스(Bacillus cereus), 바르토넬라 헨셀라에(Bartonella henselae), BK 바이러스, 블라스토시스티스 호미니스(Blastocystis hominis), 블라스토미세스 더마티티디스(Blastomyces dermatitidis), 백일해균(Bordetella pertussis), 보렐리아 부르그도르페리(Borrelia burgdorferi), 보렐리아 속(Borrelia genus), 보렐리아 종(Borrelia spp), 브루셀라 속(Brucella genus), 말레이사상충(Brugia malayi), 부니아바이러스 과(Bunyaviridae family), 부르크홀데리아 세파시아(Burkholderia cepacia) 및 다른 부르크홀데리아 종, 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이, 칼리시비리다에 과(Caliciviridae family), 캄필로박터 속(Campylobacter genus), 칸디다 알비칸스(Candida albicans), 칸디다 종(Candida spp), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미도필라 뉴모니아(Chlamydophila pneumoniae), 클라미도필라 프시타시(Chlamydophila psittaci), CJD 프리온, 간흡충(Clonorchis sinensis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실리(Clostridium difficile), 클로스트리듐 페르프린젠스(Clostridium perfringens), 클로스트리듐 페르프린젠스, 클로스트리듐 종(Clostridium spp), 클로스트리듐 테타니(Clostridium tetani), 콕시디오이데스 종(Coccidioides spp), 코로나바이러스(coronaviruses), 디프테리아균(Corynebacterium diphtheria), 콕시엘라 부르네티(Coxiella burnetii), 크리민 콩고 출혈열 바이러스(Crimean-Congo hemorrhagic fever virus), 크립토콕쿠스 네오포르만스(Cryptococcus neoformans), 크립토스포리디움 속(Cryptosporidium genus), 사이토메갈로바이러스(Cytomegalovirus, CMV), 뎅기 바이러스(Dengue viruses) (DEN-1, DEN-2, DEN-3 및 DEN-4), 이핵아메바(Dientamoeba fragilis), 에볼라바이러스(Ebolavirus, EBOV), 에키노코쿠스 종(Echinococcus genus), 에를리히아 샤펜시스(Ehrlichia chaffeensis), 엘리키아 에윈기(Ehrlichia ewingii), 엘리키아 속(Ehrlichia genus), 이질 아메바(Entamoeba histolytica), 장구균 속(Enterococcus genus), 장내 바이러스 속(Enterovirus genus), 장내 바이러스(Enteroviruses), 주로 콕사키 A 바이러스(Coxsackie A virus) 및 장내 바이러스 71 (EV71), 표피사상균 종(Epidermophyton spp), 엡스테인-바 바이러스(Epstein-Barr Virus, EBV), 대장균(Escherichia coli) O157:H7, O111 및 O104:H4, 간질(Fasciola hepatica) 및 거대 간질(Fasciola gigantica), FFI 프리온, 필라리오이데아 상과(Filarioidea superfamily), 플라비바이러스(Flaviviruses), 야토병균(Francisella tularensis), 푸소박테리움 속(Fusobacterium genus), 게오트리쿰 칸디둠(Geotrichum candidum), 지알디아편모충(Giardia intestinalis), 악구충속 종(Gnathostoma spp), GSS 프리온, 구아나리토 바이러스(Guanarito virus), 헤모필루스 듀크레이(Haemophilus ducreyi), 헤모필루스 인플루엔자(Haemophilus influenza), 헬리코박터 파일로리(Helicobacter pylori), 헤니파바이러스(Henipavirus) (Hendra virus Nipah virus), 간염 A 바이러스, 간염 B 바이러스(HBV), 간염 C 바이러스(HCV), 간염 D 바이러스, 간염 E 바이러스, 단순포진 바이러스 1 및 2 (HSV-1 및 HSV-2), 히스토플라스마 캡슐라툼(Histoplasma capsulatum), HIV (인간 면역결핍 바이러스, Human immunodeficiency virus), 호르테아 웨넥키(Hortaea werneckii), 인간 보카바이러스(Human bocavirus) (HBoV), 인간 헤르페스 바이러스 6(Human herpesvirus 6, HHV-6) 및 인간 헤르페스 바이러스 7 (HHV-7), 인간 메타뉴모바이러스(Human metapneumovirus, hMPV), 인간 파필로마바이러스(Human papillomavirus, HPV), 인간 파라인플루엔자 바이러스(Human parainfluenza viruses, HPIV), 일본 뇌염 바이러스(Japanese encephalitis virus), JC 바이러스, 주닌(Junin) 바이러스, 킨젤라 킨가에(Kingella kingae), 클레브시엘라 글라눌로마티스(Klebsiella granulomatis), 쿠루 프리온(Kuru prion), 라싸 바이러스(Lassa virus), 레지오넬라 뉴모필라(Legionella pneumophila), 레슈마니아 속(Leishmania genus), 렙토스피라 속(Leptospira genus), 리스테리아 모노사이토게네스(Listeria monocytogenes), 림프구성 맥락수막염바이러스(Lymphocytic choriomeningitis virus) (LCMV), 마츄포 바이러스(Machupo virus), 말라세지아 종(Malassezia spp), 마르부르그 바이러스(Marburg virus), 홍역 바이러스(Measles virus), 메타고니무스 요카가와이(Metagonimus yokagawai), 마이크로스포리디아 필룸(Microsporidia phylum), 전염성 연속종 바이러스(Molluscum contagiosum virus) (MCV), 귀밑샘염 바이러스(Mumps virus), 나균(Mycobacterium leprae) 및 마이코박테리아 레프로마토시스(Mycobacterium lepromatosis), 마이코박테리움 투베쿨로시스(Mycobacterium tuberculosis), 마이코박테리움 우르세란스(Mycobacterium ulcerans), 마이코플라즈마 폐렴(Mycoplasma pneumoniae), 파울러 자유아메바(Naegleria fowleri), 아메리카 구충(Necator americanus), 임균(Neisseria gonorrhoeae), 수막염균(Neisseria meningitides), 노카디아 아스테로이드(Nocardia asteroids), 노카디아 종(Nocardia spp), 온코세르카 볼부루스(Onchocerca volvulus), 오리엔티아 쯔쯔가무시(Orientia tsutsugamushi), 오르토믹소 바이러스과(Orthomyxoviridae family, 인플루엔자), 브라질 파라콕시디오이디즈(Paracoccidioides brasiliensis), 폐흡충 종(Paragonimus spp), 폐디스토마(Paragonimus westermani), 파보바이러스(Parvovirus) B19, 파스퇴렐라 속(Pasteurella genus), 플라스모디움 속(Plasmodium genus), 폐포자충(Pneumocystis jirovecii), 폴리오바이러스(Poliovirus), 라비 바이러스(Rabies virus), 호흡기 합포체 바이러스(Respiratory syncytial virus, RSV), 리노바이러스(Rhinovirus), 리노바이러스, 리케치아 아카리(Rickettsia akari), 리케치아 속(Rickettsia genus), 발진티푸스 리케치아(Rickettsia prowazekii), 로키산 홍반열 리케치아(Rickettsia rickettsia), 발진열 리케치아(Rickettsia typhi), 리프트벨리열 바이러스(Rift Valley fever virus), 로타바이러스(Rotavirus), 풍진 바이러스(Rubella virus), 사비아 바이러스(Sabia virus), 살모넬라 속(Salmonella genus), 천공 개선충(Sarcoptes scabiei), SARS 코로나바이러스, 주혈흡충 속(Schistosoma genus), 시겔라 속(Shigella genus), 신 놈브레 바이러스(Sin Nombre virus), 한타바이러스(Hantavirus), 스포로트릭스 셴키(Sporothrix schenckii), 스타필로코커스 속(Staphylococcus genus), 스타필로코커스 속, 스트렙토코커스 아갈락티아(Streptococcus agalactiae), 폐렴연쇄구균(Streptococcus pneumoniae), 화농성연쇄구균(Streptococcus pyogenes), 분선충(Strongyloides stercoralis), 테니아 속(Taenia genus), 유구조충(Taenia solium), 진드기매개뇌염(Tick-borne encephalitis virus, TBEV), 견회충(Toxocara canis) 또는 고양이 회충(Toxocara cati), 톡소플라즈마 곤디(Toxoplasma gondii), 트레포네마 팔리둠(Treponema pallidum), 선모충(Trichinella spiralis), 질트리코모나스(Trichomonas vaginalis), 백선균 종(Trichophyton spp), 편충(Trichuris trichiura), 트리파노소마 브루세이(Trypanosoma brucei), 트리파노소마 크루지(Trypanosoma cruzi), 우레아플라즈마 우레알리티쿰(Ureaplasma urealyticum), 수두 대상 포진 바이러스(Varicella zoster virus) (VZV), 수두 대상 포진 바이러스 (VZV), 천연두 메이저(Variola major) 또는 천연두 마이너(Variola minor), vCJD 프리온, 베네스 웰라형 마뇌염 바이러스(Venezuelan equine encephalitis virus), 비브리오 콜레라(Vibrio cholera), 웨스트 나일 바이러스(West Nile virus), 서부형 마뇌염 바이러스(Western equine encephalitis virus), 반크로프트 사상충(Wuchereria bancrofti), 황열병 바이러스(Yellow fever virus), 여시니아 엔테로콜리티카(Yersinia enterocolitica), 여시니아 페스티스(Yersinia pestis), 및 여시니아 슈도투베르쿨로시스( Yersinia pseudotuberculosis)로부터 유도된 항원으로부터 선택된다.

이러한 맥락에서, 인플루엔자 바이러스, 호흡기 합포체 바이러스 (RSV), 단순 포진 바이러스 (HSV), 인유두종 바이러스 (HPV), 인간 면역결핍 바이러스 (HIV), 플라스모디움, 황색포도상구균, 뎅기 바이러스, 트라코마 클라미디아, 시토메갈로바이러스(CMV), 간염 B 바이러스 (HBV), 결핵균, 광견병 바이러스, 및 황열병 바이러스로부터 선택된 병원체로부터 항원이 특히 바람직하다.

종양 항원:

추가적 실시예에서 본 발명에 따른 인공 핵산 분자는 종양 항원, 절편, 상기 종양 항원의 변이체 또는 유도체를 포함하는 펩타이드 또는 단백질을 포함하는 단백질 또는 펩타이드를 코딩할 수 있으며, 바람직하게 상기 종양 항원은 멜라닌 세포-특이적 항원, 고환암 항원 또는 종양 특이적 항원, 바람직하게 CT-X 항원, 비-X CT-항원, CT-X 항원에 대한 결합 파트너 또는 비-X CT-항원 또는 종양 특이적 항원에 대한 결합 파트너, 더욱 바람직하게 CT-X 항원, 비-X CT-항원에 대한 결합 파트너 또는 종양-특이적 항원 또는 상기 종양 항원의 변이체 또는 유도체이며; 및 상기 각각의 핵산 서열은 다른 펩타이드 또는 단백질을 코딩하며; 및 상기 적어도 하나의 핵산 서열은 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, 알파-5-베타-1-인테그린, 알파-5-베타-6-인테그린, 알파-액티닌-4/m, 알파-메틸아실-코엔자임 A 라세메이즈, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, 베타-카테닌/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA 19-9, CA72-4, CA125, 칼레티쿨린(calreticulin), CAMEL, CASP-8/m, 카뎁신 B(cathepsin B), 카뎁신 L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, 코액토신-유사 단백질, 콜라주(collage) XXIII, COX-2, CT-9/BRD6, Cten, 사이클린 B1, 사이클린 D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, 헵신, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, 호메오박스 NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, 미숙 라미닌 수용체, 칼리크레인(kallikrein)-2, 크레인-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, 맘마글로빈(mammaglobin) A, MART-1/멜란-A, MART-2, MART-2/m, 기질 단백질(matrix protein) 22, MC1R, M-CSF, ME1/m, 메소텔린(mesothelin), MG50/PXDN, MMP11, MN/CA IX-항원, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, 미오신 클래스 I/m, NA88-A, N-아세틸글루코사미닐트랜스퍼라제-V, 네오-PAP, 네오-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, 오스테오칼신, 오스테오폰틴, p15, p190 마이너 bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PAP, PART-1, PATE, PDEF, Pim-1-키나제, Pin-1, Pml/PAR알파, POTE, PRAME, PRDX5/m, 프로스테인, 프로테이나제-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP-1, 서바이빈, 서바이빈-2B, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGF베타, TGF베타RII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, 티로시나제, UPA, VEGFR1, VEGFR-2/FLK-1, WT1 및 림프성 혈구의 면역글로불린 유전자형 또는 림프구 혈구의 T 세포 수용체 유전자형, 또는 상기 종양 항원의 절편, 변이체 또는 유도체; 바람직하게 서바이빈 또는 이의 유사체, MAGE-과로부터 항원 또는 이의 결합 파트너 상기 종양 항원의 절편, 변이체 또는 유도체를 코딩한다. 이러한 맥락에서 종양 항원 NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, 서바이빈, Muc-1, PSA, PSMA, PSCA, STEAP 및 PAP가 특히 바람직하다.

바람직한 실시예에서, 상기 인공 핵산 분자는 치료적 단백질 또는 절편, 이의 변이체 또는 유도체를 포함하는, 단백질 또는 펩타이드를 코딩한다.

본 발명에 정의된 치료 단백질은 어느 유전된 또는 후천적 질병의 치료에 유용한 또는 개인의 상태를 개선시키는 펩타이드 또는 단백질이다. 특히, 치료 단백질은 다른 기능들 가운데, 유전적 결함의 변형 및 치료, 암 세포 또는 병원체 감염된 세포의 파괴, 면역계 질환 치료, 대사성 또는 내분비 질환의 치료를 할 수 있는, 치료제의 생성에 중요한 역할을 수행한다. 예를 들어, 에리쓰로포이에틴(EPO), 단백질 호르몬은 신장 합병증의 일반적 원인인, 적혈구 결핍증이 있는 환자를 치료하는데 활용될 수 있다. 게다가 어쥬번트 단백질, 치료 항체는 치료 단백질 및 또한 예를 들어 폐경기 여성의 치료에 사용될 수 있는 호르몬 교체 치료에 포함된다. 보다 최근 연구에서, 환자의 체세포는 논란이 되는 줄기 세포 치료를 대체하는 다능성 줄기 세포로 그들을 재프로그램하는데 사용된다. 또한, 체세포의 재프로그래밍에 사용되거나 줄기세포의 분화에 사용된 이들 단백질은 치료 단백질로 본 발명에 정의된다. 게다가, 치료 단백질은 다른 목적, 예를 들어 상처 치료, 조직 재생, 혈관형성 등을 위해 사용될 수 있다. 게다가, 항원-특이적 B 세포 수용체 및 이의 절편 및 변이체는 치료 단백질로 본 발명에 정의된다.

따라서 치료 단백질은 유전적 또는 후천적인 것과 독립적으로, 예를 들어 감염성 질병, 종양(neoplasm) (예를 들어 암 또는 종양 질환), 혈액 및 혈액 형성 기관의 질병, 내분비, 영양 및 대사성 질병, 신경계 질병, 순환계 질병, 호흡계 질병, 소환계 질병, 피부 및 피하 조직 질병, 근골격계 질병 및 결합 조직, 및 비뇨생식기계 질병과 같은 다양한 질병의 치료를 포함하는 다양한 목적으로 사용될 수 있다.

이러한 맥락에서, 대사성 또는 내분비 질환의 치료에 그 중에서도 사용될 수 있는 특히 바람직한 치료 단백질은 하기로부터 선택됨(괄호 내 치료 단백질이 치료에 사용되는 특정 질병): 산 스핑고미엘리나아제(Acid sphingomyelinase) (니만 피크병, Niemann-Pick disease), 아디포티드(Adipotide) (비만), 아갈시다제-베타(Agalsidase-beta) (인간 갈락토시다제 A) (파브리 병(Fabry disease); 신장 및 심혈관 합병증을 유도하는 지질의 축적을 방지), 알글루코시다제(Alglucosidase) (폼페병(Pompe disease) (글리코겐 저장 질병 타입 II)), 알파-갈락토시다제 A (알파-GAL A, 아갈시다제 알파) (파브리 질병), 알파-글루코시다제(글리코겐 저장 질병(GSD), 폼페 병(Morbus Pompe)), 알파-L-이두로니다제(alpha-L-iduronidase) (뮤코다당증 (MPS), 후를러 증후군(Hurler syndrome), 샤이 증후군(Scheie syndrome)), 알파-N-아세틸글루코사미니다제(alpha-N-acetylglucosaminidase) (산필립포 증후군, Sanfilippo syndrome), 암피레굴린(Amphiregulin) (암, 대사성 질환), 안지오포이에틴(Angiopoietin) ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (혈관 형성, 혈관 안정), 부타세룰린(Betacellulin) (대사성 질환), 베타-글루쿠로니다제(Beta-glucuronidase) (슬리 증후군(Sly syndrome)), 골 형태발생 단백질(Bone morphogenetic protein) BMPs (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP10, BMP15) (재생적 영향, 뼈 관련 증상, 만성 신장 질환(CKD)), CLN6 단백질 (CLN6 질병 - 비정형 후기 영아(Atypical Late Infantile), 늦은 발병 변이(Late Onset variant), 조기 유년(Early Juvenile), 뉴런 세로이드 리포푸시노스(Neuronal Ceroid Lipofuscinoses, NCL)), 표피 성장 인자(EGF) (상처 치료, 세포 성장, 증식 및 분화의 조절), 에피겐(Epigen) (대사성 질환), 에피레귤린(Epiregulin) (대사성 질환), 섬유아세포 성장촉진 인자(Fibroblast Growth Factor) (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (상처 치료, 혈관 생성, 내분비 질환, 조직 재생), 갈술파제(Galsulphase) (뮤코다당침착(Mucopolysaccharidosis) VI), 그렐린(Ghrelin) (과민성 대장 증후군(irritable bowel syndrome, IBS), 비만, 프라더-윌리 증후군(Prader-Willi syndrome), 타입 II 진성 당뇨병(diabetes mellitus), 글루코세레브로시다아제(Glucocerebrosidase) (고셰병(Gaucher's disease)), GM-CSF (재생적 효과, 백혈구 생산, 암), 헤파린-결합 EGF-유사 성장 인자(HB-EGF) (상처 치료, 심장 비대 및 심장 발달 및 기능), 간세포 생장 인자(Hepatocyte growth factor, HGF) (재생 효과, 상처 치료), 헵시딘(Hepcidin) (철 대사 질환, 베타 지중해 빈혈(Beta-thalassemia)), 인간 알부민(알부민의 감소된 생산 (저단백혈증), 증가된 알부민의 감소(신장 증후군), 하이포볼레미아(hypovolaemia), 고빌리루빈혈증(hyperbilirubinaemia)), 이둘설파제(Idursulphase) (이두로네이트-2-설파타제, Iduronate-2-sulphatase) (뮤코다당침착(Mucopolysaccharidosis) II (헌터 증후군, Hunter syndrome)), 인테그린 αVβ3, αVβ5 및 α5β1 (결합 기질 고분자 및 단백질분해효소(Bind matrix macromolecules and proteinases), 혈관 생성), 이우두로네이트 설파타제(Iuduronate sulfatase) (헌터 증후군(Hunter syndrome)), 라로니다제(Laronidase) (뮤코다당침착 I의 후를러 및 후를러-샤이 형태), N-아세틸갈락토사민-4-설파타제(rhASB; 갈설파제(galsulfase), 아릴설파타제 A(Arylsulfatase A) (ARSA), 아릴설파타제 B (ARSB)) (아릴설파타제 B 결핍, 마로토-라미 증후군(Maroteaux-Lamy syndrome), 뮤코다당침착 VI), N-아세틸글루코사민-6-설파타제(N-acetylglucosamine-6-sulfatase) (산필리포 증후군(Sanfilippo syndrome)), 신경 성장 인자(Nerve growth factor) (NGF, 뇌 유도된 신경영양성 인자(Brain-Derived Neurotrophic Factor, BDNF), 뉴로트로핀-3(Neurotrophin-3, NT-3), 및 뉴로트로핀 4/5 (NT-4/5) (재생 효과, 심혈관 질병, 관상동맥 죽상경화증(coronary atherosclerosis), 비만, 제2형 당뇨병, 대사성 증후군, 급성 관동맥 증후군, 치매, 우울증, 정신 분열병(schizophrenia), 자폐증, 레트 증후군(Rett syndrome), 신경성 무식욕증(anorexia nervosa), 신경성 식욕 항진증(bulimia nervosa), 상처 치료, 피부 궤양, 각막 궤양, 알츠하이머병), 뉴레귤린(Neuregulin) (NRG1, NRG2, NRG3, NRG4) (대사성 질환, 정신 분열병), 뉴로필린(Neuropilin) (NRP-1, NRP-2) (혈관 생성, 축색 돌기 유도(axon guidance), 세포 생존, 이동), 오베스타틴(Obestatin) (과민성 대장 증후군(irritable bowel syndrome, IBS), 비만, 프라더-윌리 증후군(Prader-Willi syndrome), 제2형 진성 당뇨병), 혈소판 유래 증식 인자(Platelet Derived Growth factor) (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (재생 효과, 상처 치료, 혈관 생성에 질환, 동맥 경화증, 섬유증, 암), TGF 베타 수용체 (엔도글린(endoglin), TGF-베타 1 수용체, TGF-베타 2 수용체, TGF-베타 3 수용체) (신장 섬유증(renal fibrosis), 신장 질병, 당뇨병, 궁극적 말기 신장 질환(ESRD), 혈관 생성), 트롬보포이에틴 (THPO) (거대 핵세포(Megakaryocyte) 성장 및 발달 인자 (MGDF)) (혈소판 장애, 기증(donation)에 대한 혈소판, 골수 억제 항암 화학요법(myelosuppressive chemotherapy) 이후 혈소판 수의 회복, 변형 성장 인자(Transforming Growth factor) (TGF (TGF-알파, TGF-베타 (TGF베타1, TGF베타2, 및 TGF베타3))) (재생 효과, 상처 치료, 면역력, 암, 심장 질병, 당뇨병, 말판 증후군(Marfan syndrome), 로이 디에츠 증후군(Loeys-Dietz syndrome)), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F 및 PIGF) (재생 효과, 혈관 생성, 상처 치료, 암, 삼투성), 네시리타이드(Nesiritide) (급성 비 대상성 충혈성 심부전(Acute decompensated congestive heart failure), 트립신 (욕창(Decubitus ulcer), 정맥류성 궤양(varicose ulcer), 딱지(eschar)의 창상 절제(debridement), 열개성 상처(dehiscent wound), 화상(sunburn), 태변성 일레우스(meconium ileus)), 부신피질 자극호르몬(adrenocorticotrophic hormone, ACTH) ("에디슨 병, 소세포 암종, 부신백질 이영양증(Adrenoleukodystrophy), 선천성 부신 증식증(Congenital adrenal hyperplasia), 쿠싱 증후군(Cushing's syndrome), 넬슨 증후군(Nelson's syndrome), 유아성 경련(Infantile 넴는)), 심방 나트륨이뇨 펩티드(Atrial-natriuretic peptide, ANP) (내분비 질환), 콜레시스토키닌(Cholecystokinin) (다양한), 가스트린(Gastrin) (저가스트린혈증, hypogastrinemia), 렙틴(Leptin) (당뇨병(Diabetes), 과트리글리세라이드혈증(hypertriglyceridemia), 당뇨병), 옥시토신(Oxytocin) (모유 영양(breastfeeding) 자극, 분만의 비진행), 소마토스타틴(Somatostatin) (카르시노이드 증후군(carcinoid syndrome)의 대증 요법, 급성 정맥류 출혈(acute variceal bleeding), 및 말단 비대증(acromegaly), 간 및 신장의 다낭성 질병, 신경 내분비 종양에 의한 말단 비대증 및 증상), 바소프레신 (항이뇨 호르몬) (요붕증(diabetes insipidus)), 칼시토닌 (폐경기후 골다공증(Postmenopausal osteoporosis), 고칼슘혈증(Hypercalcaemia), 파제트병(Paget's disease), 골 전이, 환상지통(Phantom limb pain), 척추관 협착증(Spinal Stenosis)), 엑세나티드(Exenatide) (메트포민(metformin) 및 설포닐우레아(sulphonylurea)로 치료에 내성인 제2형 당뇨병), 성장 호르몬 (GH), 소마토트로핀 (GH 결핍 또는 만성 신부전식(chronic renal insufficiency)에 따른 성장 부전), 프라더-윌리 증후군(Prader-Willi syndrome), 터너 증후군, 에이즈 낭비(AIDS wasting) 또는 항바이러스 치료와 함께 악액질(cachexia)), 인슐린 (진성 당뇨병, 당뇨병성 케토애시도시스(diabetic ketoacidosis), 고칼륨혈증(hyperkalaemia)), 인슐린 유사 성장 인자 1 IGF-1 (GH 유전자 결실 또는 심각한 주요 IGF1 결핍(severe primary IGF1 deficiency)로 어린이 성장 부전, 신경퇴행성 질병(neurodegenerative disease), 심혈관 질병, 심부전), 메카세르민 린파베이트(Mecasermin rinfabate), IGF-1 유사체(analog) (GH 유전자 결실 또는 심각한 주요 IGF1 결핍으로 어린이 성장 부전, 신경퇴행성 질병, 심혈관 질병, 심부전), 메카세르민(Mecasermin), IGF-1 유사체 (GH 유전자 결실 또는 심각한 주요 IGF1 결핍으로 어린이 성장 부전, 신경퇴행성 질병, 심혈관 질병, 심부전), 페그비소만트(Pegvisomant) (말단 비대증(Acromegaly)), 프람린티드(Pramlintide) (진성 당뇨병, 인슐린과 조합), 테리파라타이드(Teriparatide) (인간 파라티로이드 호르몬 잔기 1-34) (심한 골다공증, Severe osteoporosis), 베카프레르민(Becaplermin) (당뇨병성 궤양에 대한 창상 절제 부가(Debridement adjunct)), 디보테르민-알파(Dibotermin-alpha) (골 형태 발생 단백질 2(Bone morphogenetic protein 2)) (척추 융합술(Spinal fusion surgery), 골 상처 회복), 히스트렐린 아세테이트(Histrelin acetate) (고나도트로핀 방출 호르(gonadotropin releasing hormone); GnRH) (조숙(Precocious puberty)), 옥트레오타이드(Octreotide) (말단 비대증, VIP-분비 아데노마 및 전이성 암양종 종양(metastatic carcinoid tumours)의 증상 완화) 및 팔리페르민(Palifermin) (케라틴세포 생장인자(keratinocyte growth factor; KGF)) (화학 요법을 겪는 환자 내 심각한 구강 점막염, 상처 회복).

이들 및 다른 단백질은 그들이 충분한 양의 기능성 단백질의 이의 결함이 있는 내인성 생산을 교체함으로써 개체를 치료하는 것을 의미하는 것과 같이, 치료적인 것으로 이해된다. 따라서, 이러한 치료 단백질은 전형적으로 포유동물, 특히 인간 단백질이다.

혈액 질환, 순환계 질병, 호흡계 질병, 암 또는 종양 질병, 감염성 질병 또는 면역결핍증에 대하여, 하기 치료 단백질이 사용될 수 있다: 알트플라제(Alteplase) (조직 플라스미노겐 활성자(tissue plasminogen activator); tPA) (폐색전(Pulmonary embolism), 심근경색(myocardial infarction), 급성 허혈성 발작(acute ischaemic stroke), 중심정맥 접근장치의 폐색(occlusion of central venous access devices)), 아니스트리플라제(Anistreplase) (혈전 용해), 안티트롬빈 III (AT-III) (유전적 AT-III 결핍, 혈전 색전증), 비발리루딘(Bivalirudin) (관상동맥 형성술 및 헤파린 유도 저혈소판증에 혈액 응고 위험의 감소), 다르베포이에틴-알파(Darbepoetin-alpha) (만성 신부전(renal insufficiency) 및 만성 신부전(renal failure)(+/- 투석)을 갖는 환자에 빈혈의 치료), 드로트리코긴-알파(Drotrecogin-alpha) (활성화된 단백질 C) (사망의 위험이 높은 중증 패혈증(severe sepsis)), 에리쓰로포이에틴(Erythropoietin), 에포에틴-알파(Epoetin-alpha), 에리쓰로포이에틴(erythropoietin), 에쓰로포이에틴(erthropoyetin) (만성 질병의 빈혈, 골수이형성(myelodysplasia), 신부전에 또는 화학요법에 따른 빈혈, 수술전 준비), 인자 IX (혈우병(Haemophilia) B), 인자 VIIa (혈우병 A 또는 B 및 인자 VIII 또는 인자 IX에 억제자를 갖는 환자의 출혈), 인자 VIII (혈우병 A), 레피루딘(Lepirudin) (헤파린 유도된 저혈소판증), 단백질 C 농축(concentrate) (정맥혈전증(Venous thrombosis), 전격성자반(Purpura fulminans)), 레테플라제(Reteplase) (tPA의 삭제 돌연변이) (급성 심근경색의 조절, 좌심실 기능의 증진), 스트렙토키나제(Streptokinase) (급성 진화 전층 심근경색(Acute evolving transmural myocardial infarction), 폐색전(pulmonary embolism), 심부정맥 혈전증(deep vein thrombosis), 동맥 혈전증 또는 색전증, 동정맥 캐뉼라의 폐색), 테넥테플라제(Tenecteplase) (급성 심근경색), 우로키나제(Urokinase) (폐색전), 엔지오스타틴(Angiostatin) (암), 항-CD22 면역독소 (재발된(relapsed) CD33+ 급성 골수 백혈병), 데니루킨 디프티톡스(Denileukin diftitox) (피부 T-세포 림프종(Cutaneous T-cell lymphoma, CTCL)), 이뮤노시아닌(Immunocyanin) (방광 및 전립선 암), MPS (메탈로팬스티물린, Metallopanstimulin) (암), 아플리베르셉트(Aflibercept) (비소세포 폐암 (NSCLC), 전이성 대장암 (mCRC), 호르몬 불응성 전이성 전립선암, 습식 황반변성), 엔도스타틴(Endostatin) (암, 류마티스 관절염뿐만 아니라 크론병, 당뇨병성 망막증, 건선, 및 자궁 내막증과 같은 염증성 질병), 콜라게나제 (만성 피부 궤양의 창상 절제 및 중증 화상 부위, 듀푸이트렌 구축(Dupuytren's contracture), 페이로니병(Peyronie's disease)), 인간 디옥시-리보뉴클레아제 I, 도르나제(dornase) (낭포성 섬유증(Cystic fibrosis); 예견된 40%보다 큰 FVC를 갖는 선택된 환자에 호흡기 감염 감소), 히알루로니다제(Hyaluronidase) (주사된 약물, 특히 안과 수술 및 특정 조영제의 흡수 및 분산을 향상시키는 어쥬번트로 사용됨), 파파인(Papain) (욕창, 정맥류(varicose) 및 당뇨성 궤양, 화상, 수술 후 상처, 모소낭포 상처, 피하 조직 염증(carbuncles), 및 다른 상처와 같은 급성 및 만성 병변에 괴사 조직의 창상 절제 또는 고통(slough)의 액화(liquefication)), L-아스파라기나제(L-Asparaginase) (증식을 위한 외인성 아스파라긴을 필요로 하는, 급성 림프구성 백혈병), 페그-아스파라기나제(Peg-asparaginase) (증식을 위한 외인성 아스파라긴을 필요로 하는 급성 림프구성 백혈병), 라스부리카제(Rasburicase) (항암 치료중인 백혈병, 림프종, 및 고형 종양을 갖는 소아 환자는 종양 용해 증후군을 일으킬 수 있음), 인간 만성 고나도트로핀(Human chorionic gonadotropin, HCG) (보조 생식(Assisted reproduction)), 인간 난포 자극 호르몬(Human follicle-stimulating hormone, FSH) (보조 생식), 루트로핀-알파(Lutropin-alpha) (황체형성 호르몬 결핍과 함께 불임), 프로락틴(Prolactin) (프로락틴 혈증(Hypoprolactinemia), 혈청 프로락틴 결핍, 여성의 난소 기능 장애, 불안, 남자의 동맥성 발기 부전(arteriogenic erectile dysfunction), 조루(premature ejaculation), 정자 감소증(oligozoospermia), 정자 무력증(asthenospermia), 정액낭(seminal vesicles)의 기능 부전, 남성호르몬감소증(hypoandrogenism)), 알파-1-프로테이나제 억제자 (선천성 트립신 결핍증(Congenital antitrypsin deficiency)), 락타제(Lactase) (락토스 소화 불능에 따른 가스, 팽만감(bloating), 경련 및 설사), 췌장 효소(Pancreatic enzymes) (리파제(lipase), 아밀라제(amylase), 프로테아제(protease)) (낭포성 섬유증(Cystic fibrosis), 만성 췌장염(chronic pancreatitis), 췌장 부전(pancreatic insufficiency), 포스트-빌로스 II 위 우회술(post-Billroth II gastric bypass surgery), 췌관 폐색(pancreatic duct obstruction), 지방변(steatorrhoea), 소화 불량(poor digestion), 가스, 팽만감), 아데노신 디아미나제(Adenosine deaminase) (페가데마제 보빈(pegademase bovine), PEG-ADA) (아데노신 디아미나제 결핍에 의한 중증 조합된 면역결핍 질병), 아바타셉트(Abatacept) (류마티스성 관절염 (특히 TNF 알파 억제에 대해 내성(refractory)일 때)), 알레파셉트(Alefacept) (판 건선(Plaque Psoriasis)), 아나킨라(Anakinra) (류마티스성 관절염), 에타너셉트(Etanercept) (류마티스성 관절염, 다관절 과정 청소년 류마티스성 관절염(polyarticular-course juvenile rheumatoid arthritis), 건선 관절염, 강직성 척수염(ankylosing spondylitis), 판 건선, 강직성 척수염), 인터루킨-1 (IL-1) 수용체 길항제, 아나킨라(Anakinra) (류마티스성 관절염과 관련된 염증 및 연골 퇴행), 티물린(Thymulin) (신경퇴행성 질병, 류마티즘, 신경성 무식욕증), TNF-알파 길항자 (류마티스성 관절염, 강직성 척수염, 크론병, 건선, 화농성 한선염, 난치성 천식과 같은 자가면역 질환), 엔푸빌티드(Enfuvirtide) (HIV-1 감염), 및 티모신(Thymosin) α1 (간염 B 및 C).

(괄호 안은 치료에 사용되는 치료 단백질에 대한 특정한 질병임)

추가적 양태에서, 본 발명은 하기를 포함하는 벡터를 제공한다

a. 오픈 리딩 프레임(ORF) 및/또는 클로닝 부위, 예를 들어 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열의 삽입을 위한 것; 및

b. 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소).

적어도 하나의 3'-UTR 요소 및 ORF는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것과 같다. 상기 클로닝 부위는 하나 또는 그 이상의 제한 부위와 같이, 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열을 도입하는데 적절한 어느 서열일 수 있다. 따라서, 클로닝 부위를 포함하는 벡터는 바람직하게 벡터로 오픈 리딩 프레임을 삽입, 바람직하게 3'-UTR 요소에 오픈 리딩 프레임 5'을 삽입하기에 적절하다. 바람직하게, 클로닝 부위 또는 ORF는 3'-UTR 요소에 5'에, 바람직하게 3'-UTR 요소의 5'-말단에 아주 가깝게 위치한다. 예를 들어, 클로닝 부위 또는 ORF는 3'-UTR 요소의 5'-말단에 직접적으로 연결될 수 있거나, 그들은 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것과 같이, 2, 4, 6, 8, 10, 20개 등 뉴클레오티드의 스트레치에 의한 것과 같이, 뉴클레오티드의 스트레치를 통해 연결될 수 있다.

바람직하게, 본 발명에 따르는 벡터는 본 발명에 따르는 인공 핵산 분자를 생산하는데, 바람직하게 본 발명에 따르는 인공 mRNA를 생산하는데, 예를 들어 벡터로 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열을 선택적으로 삽입하고 벡터를 전사함으로써, 적합하다. 따라서 바람직하게는 벡터는 프로모터, 예를 들어 RNA 중합효소 프로모터와 같은, 전사를 위해 필요한 요소를 포함한다. 바람직하게는 벡터는 진핵 세포, 원핵 세포, 또는 진핵, 원핵, 바이러스 또는 파지 인비트로 전사 시스템과 같은, 진핵 생물, 원핵 생물, 바이러스 또는 파지 전사 시스템을 사용하는 전사에 적합하다. 따라서 예를 들어 벡터는 RNA 중합효소와 같은 중합효소에 의해, 예를 들어 진핵, 원핵, 바이러스, 또는 파지 RNA 중합효소에 의해 인식되는 프로모터 서열을 포함할 수 있다. 바람직한 실시예에서 상기 벡터는 SP6 또는 T7과 같은 파지 RNA 중합효소 프로모터, 바람직하게는 T7 프로모터를 포함할 수 있다. 바람직하게, 상기 벡터는 인비트로(in vitro) 전사 시스템에 기초한 T7 RNA 중합효소와 같은 인비트로 전사 시스템에 기초한 파지를 사용하는 인비트로 전사에 적절하다.

다른 바람직한 실시예에서, 상기 벡터는 세포 또는 조직 내 코딩된 펩타이드 또는 단백질의 발현에 직접적으로 사용될 수 있다. 이러한 목적을 위해, 상기 벡터는 그들 세포/ 조직 내 발현을 위해 필수적인 특정한 요소, 예를 들어 CMV 프로모터와 같은 특정 프로모터 서열을 포함한다.

상기 벡터는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가적으로 포함할 수 있다.

상기 벡터는 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게, 상기 벡터는 DNA 벡터이다. 상기 벡터는 바이러스 벡터 또는 플라스미드 벡터와 같이, 통상의 기술자에게 알려진 어느 벡터일 수 있다. 바람직하게 상기 벡터는 플라스미드 벡터, 바람직하게 DNA 플라스미드 벡터이다.

바람직한 실시예에서, 본 발명에 따른 벡터는 본 발명에 따른 인공 핵산 분자를 포함한다.

일 실시예에서, 본 발명에 따른 DNA 벡터는 SEQ ID Nos: 10 내지 115에 따른 핵산 서열과 같이, 리보좀 단백질 유전자의 3'-UTR의 핵산 서열에 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함한다.

바람직하게, 본 발명에 따른 DNA 벡터는 SEQ　ID　No.　1, SEQ　ID　No.　3, SEQ ID No. 7에 상보적인 서열에 따른 서열 또는 SEQ ID No: 1, SEQ ID No. 3, SEQ ID No. 7에 따른 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 서열 상동성을 갖는 서열 또는 상기 설명된 이의 절편, 바람직하게 이의 기능적 절편을 포함한다.

바람직하게, 본 발명에 따른 RNA 벡터는 SEQ　ID　No.　2, SEQ　ID　No.　4, SEQ ID No.　7 에 따른 서열 또는 SEQ　ID　No.　2, SEQ　ID　No.　4, SEQ ID No.　7 에 따른 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 서열 상동성을 갖는 서열 또는 이의 절편, 바람직하게 이의 기능적 절편을 포함한다.

바람직하게, 상기 벡터는 원형 분자이다. 바람직하게, 상기 벡터는 이중 가닥 DNA 분자와 같은 이중 가닥 분자이다. 이러한 원형, 바람직하게 이중 가닥 DNA 분자는 본 발명의 인공 핵산 분자를 위한 저장 형태로써 편리하게 사용될 수 있다. 게다가, 이는 세포, 예를 들어 배양된 세포의 형질전환을 위해 사용될 수 있다. 또한 이는 본 발명에 따른 인공 RNA 분자를 수득하기 위한 인비트로(in vitro) 전사를 위해 사용될 수 있다.

바람직하게, 상기 벡터, 바람직하게 원형 벡터는, 예를 들어 제한 효소 소화에 의해 선형화된다. 바람직한 실시예에서, 상기 벡터는 제한 부위와 같은 절단 부위, 바람직하게 3'-UTR 요소에 바로 옆 3'에 위치한, 또는 -만약 존재한다면 - 폴리(A) 서열 또는 폴리아데닐화 신호에 3' 위치한, 또는 - 만약 존재한다면 - 폴리(C) 서열에 3' 위치한, 또는 - 만약 존재한다면 - 히스톤 스템-루프에 3' 위치한 특별한 절단 부위를 포함한다. 따라서, 바람직하게, 벡터를 선형화함으로써 수득된 생산물은 3'-UTR 요소의 3'-말단과 함께, 또는 - 만약 존재한다면 - 폴리(A) 서열 또는 폴리아데닐화 신호의 3'-말단과 함께, 또는 - 만약 존재한다면 - 폴리(C) 서열의 3'-말단과 함께 종결한다. 실시예에서, 본 발명에 따른 벡터는 본 발명에 따른 인공 핵산 분자를 포함하며, 제한 부위, 바람직하게 특수한 제한 부위는 바람직하게 상기 인공 핵산 분자의 3'-말단에 바로 옆 3'에 위치한다.

추가적 양태에서, 본 발명은 본 발명에 따르는 인공 핵산 분자 또는 본 발명에 따르는 벡터를 포함하는 세포에 관한 것이다. 세포는 박테리아 세포, 곤충 세포, 식물 세포, 척추동물 세포, 예를 들어 포유동물 세포와 같은 어떠한 세포일 수 있다. 이러한 세포는, 예를 들어 박테리아 세포 내에서, 예를 들어 본 발명에 벡터의 복제에 사용될 수 있다. 나아가, 세포는 본 발명에 따르는 인공 핵산 분자 또는 벡터를 전사 및/또는 본 발명에 따르는 인공 핵산 분자 또는 벡터의 오픈 리딩 프레임을 번역하는데 사용될 수 있다. 예를 들어, 세포는 재조합 단백질 생산을 위해 사용될 수 있다.

본 발명에 따르는 세포는 예를 들어 표준 형질전환(transfection), 형질도입(transduction) 또는 형질변환(transformation) 방법과 같은, 표준 핵산 전달 방법에 의해 획득될 수 있다. 예를 들어 본 발명에 따르는 인공 핵산 분자 또는 벡터는 전기천공법, 리포펙션(lipofection)에 의해, 예를 들어 양이온성 지질 및/또는 리포솜, 칼슘 포스페이트 침전, 나노입자 기초의 형질전환, 바이러스 기초의 형질전환에 기초하여, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머에 기초하여, 세포 내로 형질전환될 수 있다.

바람직하게 상기 세포는 인간 개체의 세포와 같은 포유동물 세포, 가축, 마우스 또는 랫과 같은 실험용 동물 세포이다. 바람직하게는 세포는 인간 세포이다. 상기 세포는 CHO, BHK, 293T, COS-7, HELA, HEK 등 세포와 같은, 확립된(established) 세포 라인의 세포일 수 있으며 또는 상기 세포는 인간 피부 아세포(HDF) 등과 같은 일차 세포, 바람직하게 유기체로부터 분리된 세포일 수 있다. 바람직한 실시예에서, 세포는 포유동물 개체의, 바람직하게는 인간 개체의 분리된 세포이다. 예를 들어 세포는 바람직하게는 포유동물 개체의, 바람직하게는 인간 개체의 수상돌기 세포, 암 또는 종양 세포, 또는 어느 체세포 등 과 같은 면역 세포일 수 있다.

추가적 양태에서, 본 발명은 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 또는 본 발명에 따르는 세포를 포함하는 약학적 조성물을 제공한다. 본 발명에 따르는 약학적 조성물은 예를 들어 백신으로서, 예를 들어 유전자적 백신 접종을 위해 사용될 수 있다. 따라서 ORF는 예를 들어 백신 접종을 위해 환자에게 투여되는 항원을 코딩할 수 있다. 따라서 바람직한 실시예에서 본 발명에 따르는 약학적 조성물은 백신이다. 나아가 본 발명에 따르는 약학적 조성물은 예를 들어 유전자 치료를 위해 사용될 수 있다.

바람직하게, 상기 약학적 조성물은 하나 또는 그 이상의 약학적으로 허용가능한 수송체(vehicles), 희석제(diluents) 및/또는 부형제(excipients) 및/또는 하나 또는 그 이상의 어쥬번트를 추가적으로 포함할 수 있다. 본 발명의 맥락에서, 약학적으로 허용가능한 수송체는 전형적으로 본 발명의 약학적 조성물을 위해 액체 또는 비액체 기초(basis)를 포함한다. 일 실시예에서, 약학적 조성물은 액체 형태로 제공된다. 이러한 맥락에서, 바람직하게는 수송체는 무-피로겐 물, 등장성 식염수(isotonic saline) 또는 버퍼 (수용성) 용액, 예를 들어 포스페이트, 시트레이트 등 버퍼 용액과 같은, 물에 기초한다. 버퍼는 특정한 참조 배지에 비해 참조(reference)와 함께 고장성(hypertonic), 등장성(isotonic) 또는 저장성(hypotonic)일 수 있으며, 즉 버퍼는 특정한 참조 배지에 비해 참조와 함께 높은, 동일한 또는 낮은 염 함량을 가질 수 있으며, 상기 바람직하게는 앞서 언급된 이러한 농도는 삼투압 또는 다른 농도 효과에 따르는 포유동물 세포의 피해를 유도하지 않게, 사용될 수 있다. 참조 배지는 예를 들어 피, 림프, 세포질 액체, 또는 다른 체내 액체와 같은 “인비보(in vivo)" 방법에서 발생하는 액체 또는 예를 들어 통상 버퍼 또는 액체와 같은 “인비트로(in vitro)" 방법에서 참조 배지로서 사용될 수 있는 액체이다. 이러한 통상의 버퍼 또는 액체는 통상의 기술자에게 알려져 있다. 링거-락테이트 용액은 액체 베이스로서 특히 바람직하다.

환자에게 투여하기 적절한 하나 또는 그 이상의 호환 가능한 고체 또는 액체 필러 또는 희석제 또는 캡슐화(encapsulating) 화합물은 본 발명의 약학적 조성물에도 사용될 수 있다. 본 발명에 사용된 용어 “호환 가능한”은 바람직하게는 이들 본 발명의 약학적 조성물의 구성 요소가 전형적 사용 조건하에 본 발명의 약학적 조성물의 약학적 효과를 지속적으로 감소시킬 수 있는 상호 작용이 일어나지 않는 환경에서 본 발명에 정의된 본 발명의 인공 핵산, 벡터 또는 세포와 혼합될 수 있다는 것을 의미한다.

본 발명에 따르는 약학적 조성물은 선택적으로 하나 또는 그 이상의 추가적인 약학적으로 활성인 성분을 더 포함할 수 있다. 이러한 맥락에서 약학적으로 활성인 성분은 특정한 증상(indication) 또는 질병에 회복, 개선 또는 예방에 치료적 효과를 보이는 화합물이다. 이러한 화합물은 어떠한 제한을 의미함이 없이, 펩타이드 또는 단백질, 핵산, (치료적으로 활성인) 저분자량 유기 또는 무기 화합물 (5000 미만, 바람직하게는 1000 미만의 분자량), 당, 항원 또는 항체, 선행기술에서 알려진 치료적 제제, 항원 세포, 항원 세포 절편, 세포 분획, 세포벽 성분(예를 들어 폴리사카라이드), 변형된, 약화된 또는 비활성화된(예를 들어 화학적으로 또는 방사선에 의해) 병원체(바이러스, 박테리아 등)를 포함한다.

나아가 본 발명의 약학적 조성물은 인공 핵산 분자 또는 벡터를 위한 담체를 포함할 수 있다. 이러한 담체는 생리학적으로 허용가능한 액체의 용해를 조절, 약학적으로 활성인 인공 핵산 분자 또는 벡터의 수송 및 세포 흡수에 적합할 수 있다. 따라서 이러한 담체는 본 발명에 따르는 인공 핵산 분자 또는 벡터의 보관 및 전달에 적합할 수 있는 성분일 수 있다. 이러한 성분은 예를 들어 형질전환 또는 복합화 제제를 제공할 수 있는 양이온성 또는 다중양이온성 담체 또는 화합물일 수 있다.

이러한 맥락에서 특히 바람직한 형질전환 또는 복합화 제제는 프로타민, 뉴클레올린, 스페르민 또는 스페르미딘, 또는 다른 양이온성 펩타이드 또는 단백질, 폴리-L-리신(PLL), 폴리-아르기닌, 염기성 폴리펩타이드, HIV-결합펩타이드, HIV-1 Tat (HIV), Tat-유도된 펩타이드, 페네트라틴(Penetratin)을 포함하는 세포 관통 펩타이드(CPPs), VP22 유도된 또는 유사체 펩타이드, HSV VP22(단순 포진, Herpes simplex), MAP, KALA 또는 단백질 전달(transduction) 도메인(PTDs), PpT620, 프롤린-풍부 펩타이드, 아르기닌-풍부 펩타이드, 리신-풍부 펩타이드, MPG-펩타이드(들), Pep-1, L-올리고머, 칼시토닌 펩타이드(들), 안테나페디아(Antennapedia)-유도된 펩타이드(특히 초파리(Drosophila antennapedia)로부터), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24, SynB, SynB(1), pVEC, hCT-유도된 펩타이드, SAP, 또는 히스톤과 같은, 양이온성 또는 다중양이온성 화합물이다.

게다가, 이러한 양이온성 또는 다중양이온성 화합물 또는 담체는 바람직하게 적어도 하나의 -SH 일부를 포함하거나 포함하도록 추가적으로 변형된, 양이온성 또는 다중양이온성 펩타이드 또는 단백질일 수 있다. 바람직하게 양이온성 또는 다중양이온성 담체는 하기 합계식(I)을 갖는 양이온성 펩타이드로부터 선택된다:

{(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x}; 식 (I)

상기 l + m + n + o + x = 3-100, 및 서로 독립적으로 l, m, n 또는 o는 Arg(아르기닌), Lys(리신), His(히스티딘) 및 Orn(오르니틴)의 총량이 올리고펩타이드의 전체 아미노산의 적어도 10%를 나타내는 경우 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 및 91-100로부터 선택된 어느 수이며; Xaa는 Arg, Lys, His 또는 Orn을 제외하고 천연(=자연적으로 발생하는) 또는 비천연 아미노산으로부터 선택된 어느 아미노산이며; X는 Xaa의 총량이 올리고펩타이드의 전체 아미노산의 90%를 초과하지 않는 경우, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90로부터 선택된 어느 수이다. 아미노산 Arg, Lys, His, Orn 및 Xaa의 어느 것은 펩타이드의 어느 위치에 위치될 수 있다. 이러한 맥락에서 7-30 아미노산의 범위 내 양이온성 펩타이드 또는 단백질은 특히 바람직하다.

나아가, 적어도 하나의 -SH 일부를 포함하거나 포함하도록 추가적으로 변형된, 화학식 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (화학식 (I))에 따라 정의될 때, 상기 개시된 양이온성 또는 다중양이온성 펩타이드 또는 단백질은, 이에 제한되지 않고, 하위 화학식(Ia)로부터 선택될 수 있다:

{(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa')_x (Cys)_y} 하위 화학식 (Ia)

상기 (Arg)l;(Lys)m;(His)n;(Orn)o; 및 x는 본 발명에 정의된 바와 같으며, Arg(아르기닌), Lys(리신), His(히스티딘) 및 Orn(오르니틴)의 총량이 올리고펩타이드의 전체 아미노산의 적어도 10%를 나타내는 경우, Xaa'는 Arg, Lys, His, Orn 또는 Cys를 제외한 천연(=자연적으로 발생) 또는 비천연 아미노산으로부터 선택된 어느 아미노산이며 Y는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 및 81-90으로부터 선택된 어느 수이다. 나아가, 양이온성 또는 다중양이온성 펩타이드는 하위 화학식 (Ib)로부터 선택될 수 있다:

Cys₁ {(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x} Cys₂ 하위 화학식(Ib)

상기 실험식 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (화학식(III))은 본 발명에 정의된 바와 같으며 반실험(semiempirical) 화학식(III)에 따르는 아미노산 서열의 코어를 형성하며 상기 Cys1 및 Cys2는 (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x 근위(proximal)에, 또는 말단에 시스테인이다.

나아가 형질전환 또는 복합화 제제로 사용될 수 있는 바람직한 양이온성 또는 다중양이온성 화합물은 양이온성 폴리사카라이드, 예를 들어 키토산, 폴리벤, 양이온성 폴리머, 예를 들어 폴리에틸렌이민(PEI), 양이온성 지질, 예를 들어 DOTMA: [1-(2,3-시오레일옥시)프로필)]-N,N,N-트리메틸암모니움 클로라이트([1-(2,3-sioleyloxy)propyl)]-N,N,N-trimethylammonium chloride), DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민(Dioleyl phosphatidylethanol-amine), DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스페르민(Dioctadecylamidoglicylspermin), DIMRI: 디미리스토-옥시프로필 디메틸 히드록시에틸 암모늄 브로마이드(Dimyristo-oxypropyl dimethyl hydroxyethyl ammonium bromide), DOTAP: 디올레오일옥시-3-(트리메틸암모니오)프로판(dioleoyloxy-3-(trimethylammonio)propane), DC-6-14: O,O-디테트라데카노일-N-(α-트리메틸암모니오아세틸)디에타놀아민 클로라이드(O,O-ditetradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride), CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-히드록시에틸)]-디메틸암모니움 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]트리메틸암모니움, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시석시닐옥시)에틸]-트리메틸암모니움, 올리고펙타민, 또는 양이온성 또는 다중양이온성 폴리머, 예를 들어 β-아미노산-폴리머 또는 역(reversed) 폴리아미드 등과 같은 변형된 폴리아미노산, PVP(폴리(N-에틸-4-비닐피리디니움 브로마이드)), 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)), 등과 같은 변형된 아크릴레이트, pAMAM (폴리(아미도아민)), 등과 같은 변형된 아미도아민, 디아민 및 변형된 1,4 부탄디올 디아크릴레이트-코-5-아미노-1-펜타놀 폴리머, 등과 같은 변형된 폴리베타아미노에스터(PBAE), 폴리프로필아민 덴드리머 또는 pAMAM 기초의 덴드리머 등과 같은 덴드리머, PEI:폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 폴리알릴아민, 사이클로덱스트린 기초의 폴리머, 덱스트란 기초의 폴리머, 키토산 등과 같은 당 백본 기초의 폴리머, PMOXA-PDMS 코폴리머 등과 같은 실란 백본 기초의 폴리머, 하나 또는 그 이상의 양이온성 블록(예를 들어 상기 언급된 양이온성 폴리머로부터 선택된 것)의 조합 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜); 등으로 이루어진 블록폴리머를 포함할 수 있다.

다른 실시예에 따르면, 본 발명에 따른 약학적 조성물은 약학적 조성물의 면역 자극성 특성을 증진시키기 위해 어쥬번트를 포함할 수 있다. 이러한 맥락에서, 상기 어쥬번트는 본 발명에 따른 약학적 조성물에 포함된 인공 핵산 분자 또는 벡터와 같은 구성 요소의 투여 및 전달을 돕기에 적절한 어느 화합물로 이해될 수 있다. 게다가, 이러한 어쥬번트는 선천적 면역계의 면역 반응을 개시 또는 증진시킬 수 있으나, 이에 제한되지 않는다. 다시 말해, 투여될 때, 본 발명에 따른 약학적 조성물은 전형적으로 인공 핵산 분자에 의해 코딩된 항원과 직결된 후천적 변역 반응을 개시한다. 추가로, 본 발명에 따른 약학적 조성물은 본 발명에 따른 약학적 조성물에 본 발명에 정의된 어쥬번트의 추가에 따른 (보조적(supportive)) 선천적 면역 반응을 발생시킬 수 있다.

이러한 어쥬번트는 통상의 기술자에게 알려진 어느 어쥬번트로부터 선택될 수 있으며, 본 발명의 경우, 즉 포유동물 내 면역 반응의 유도를 돕는 경우에 적합하다. 바람직하게 상기 어쥬번트는 TDM, MDP, 무라밀 디펩티드(muramyl dipeptide), 플루로닉(pluronics), 알룸(alum) 용액, 알루미늄 하이드록사이드, ADJUMER^TM (폴리포스파젠); 알루미늄 포스페이트 겔; 조류(algae)로부터 글루칸; 알감물린(algammulin); 알루미늄 하이드록사이드 겔(알룸, alum); 고 단백질 흡수 알루미늄 하이드록사이드 겔; 저점도 알루미늄 하이드록사이드 겔; AF 또는 SPT (스쿠알렌의 에멀전(5%), 트윈 80(Tween 80) (0.2%), 플루로닉 L121 (1.25%), 인산염 버퍼 식염수, pH 7.4); AVRIDINE^TM (프로판디아민); BAY R1005^TM (N-(2-디옥시-2-L-류실아미노-b-D-글루코피라노실)-N-옥타데실-도데카노일-아미드 하이드로아세테이트((N-(2-deoxy-2-L-leucylamino-b-D-glucopyranosyl)-N-octadecyl-dodecanoyl-amide hydroacetate); CALCITRIOL^TM (1-알파,25-디하이드록시-비타민 D3(1-alpha,25-dihydroxy-vitamin D3)); 칼슘 포스페이트 겔(calcium phosphate gel); CAP^TM (칼슘 포스페이트 나노입자); 콜레라 완전독소(cholera holotoxin), 콜레라-독소-A1-단백질-A-D-절편 융합 단백질(cholera-toxin-A1-protein-A-D-fragment fusion protein), 콜레라 독소의 서브유닛 B; CRL 1005 (블록 코폴리머 P1205); 사이토카인 포함 리포좀; DDA (디메틸디옥타데실암모늄 브로마이드(dimethyldioctadecylammonium bromide)); DHEA (디하이드로에피안드로스테론(dehydroepiandrosterone)); DMPC (디미리스토일포스파티딜콜린(dimyristoylphosphatidylcholine)); DMPG (디미리스토일포스파티딜글리세롤(dimyristoylphosphatidylglycerol)); DOC/알룸 복합체(디옥시콜산 소듐 염); 프로인트 완전 어쥬번트(Freund's complete adjuvant); 프로인트 불완전 어쥬번트; 감마 이눌린(gamma inulin); 게르부 어쥬번트(Gerbu adjuvant) (하기의 혼합: i) N-아세틸글루코사미닐-(P1-4)-N-아세틸무라밀-L-알라닐-D-글루타민(N-acetylglucosaminyl-(P1-4)-N-acetylmuramyl-L-alanyl-D-glutamine, GMDP), ii) 디메틸디옥타데실암모늄 클로라이드(dimethyldioctadecylammonium chloride, DDA), iii) 아연-L-프롤린염 복합체(zinc-L-proline salt complex, ZnPro-8); GM-CSF); GMDP (N-아세틸글루코마닐-(베타-1-4)-N-아세틸무라밀-L-알라닐-D-이소글루타민(N-acetylglucosaminyl-(beta-1-4)-N-acetylmuramyl-L-alanyl-D-isoglutamine)); 이미퀴모드(imiquimod) (1-(2-메틸프로필)-1H-이미다조[4,5-c]퀴놀린-4-아민(1-(2-methylpropyl)-1H-imidazo[4,5-c]quinoline-4-amine)); ImmTher^TM (N-아세틸글루코사미닐-N-아세틸무라밀-L-Ala-D-isoGlu-L-Ala-글리세롤 디팔미테이트(N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-glycerol dipalmitate)); DRVs (탈수-재수화 소포(vesicles)로부터 제조된 면역리포좀); 인터페론-감마; 인터루킨-1베타; 인터루킨-2; 인터루킨-7; 인터루킨-12; ISCOMS^TM; ISCOPREP 7.0.3. ^TM; 리포좀; LOXORIBINE^TM (7-알릴-8-옥소구아노신); LT 구강 어쥬번트 (E.coli 불안정한 내독소-독소전구물질); 어느 화합물의 마이크로스피어 및 마이크로파티클; MF59^TM; (스쿠알렌-물 에멀전); MONTANIDE ISA 51^TM (정제된 불완전 프로인트 어쥬번트); MONTANIDE ISA 720^TM (대사 작용 오일 어쥬번트(metabolisable oil adjuvant)); MPL^TM (3-Q-데사실-4'-모노포스포릴 지질 A(3-Q-desacyl-4'-monophosphoryl lipid A)); MTP-PE 및 MTP-PE 리포좀 ((N-아세틸-L-알라닐-D-이소글루타미닐-L-알라닌-2-(1,2-디팔미토일-sn-글리세로-3-(하이드록시포스포릴옥시))-에틸아미드, 모노소듐염); MURAMETIDE^TM (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE^TM 및 D-MURAPALMITINE^TM (Nac-Mur-L-Thr-D-isoGIn-sn-글리세롤디팔미토일); NAGO (뉴라미니다제-갈락토스 옥시다제); 어느 조성물의 나노스피어 또는 나노파티클; NISVs (비이온성 계면활성제 수송체); PLEURAN^TM (베타-글루칸); PLGA, PGA 및 PLA (젖산 및 글리콜산의 호모- 및 코-폴리머; 마이크로스피어/나노스피어); PLURONIC L121^TM; PMMA (폴리메틸 메타크릴레이트); PODDSTM (프로테이노이드 마이크로스피어); 폴리에틸렌 카바메이트 유도체; 폴리-rA: 폴리-rU (폴리아데닐산-폴리우리딜산 복합체); 폴리소르베이트 80 (트윈 80); 단백질 코클레이트(protein cochleates) (Avanti Polar Lipids, Inc., Alabaster, AL); STIMULON^TM (QS-21); 큐일-A(Quil-A) (Quil-A 사포닌); S-28463 (4-아미노-옥텍-디메틸-2-에톡시메틸-1H-이미다조[4,5 c]퀴놀린-1-에탄올(4-amino-otec-dimethyl-2-ethoxymethyl-1H-imidazo[4,5 c]quinoline-1-ethanol)); SAF-1^TM ("신텍스 어쥬번트 제형(Syntex adjuvant formulation)"); 센다이 프로테오리포좀(Sendai proteoliposomes) 및 센다이 포함 지질 기질; 스판-85(Span-85) (소르비탄 트리올레이트(sorbitan trioleate)); Specol (Marcol 52, Span 85 및 Tween 85의 현탁액); 스쿠알렌 또는 Robane® (2,6,10,15,19,23-헥사메틸테트라코산 및 2,6,10,15,19,23-헥사메틸-2,6,10,14,18,22-테트라코사헥산); 스테아릴티로신(stearyltyrosine) (옥타데실티로신 하이드로클로라이드); 테라미드(Theramid)® (N-아세틸글루코사미닐-N-아세틸무라밀-L-Ala-D-isoGlu-L-Ala-디팔미톡시프로필아미드(N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-dipalmitoxypropylamide)); 테로닐-MDP(Theronyl-MDP) (터머티드TM(TermurtideTM) 또는 [thr 1]-MDP; N-아세틸무라밀-L-트레오닐-D-이소글루타민); Ty 입자 (Ty-VLPs 또는 바이러스 유사 입자); 워터-리드 리포좀(Walter-Reed liposomes) (알루미늄 하이드록사이드에 흡수된 지질 A를 포함하는 리포좀), 및 Pam3Cys, 특히 어쥬-포스(Adju-phos), 올하이드로겔(Alhydrogel), 리하이드라겔(Rehydragel)과 같은 알루미늄 염을 포함하는 리포펩타이드; CFA, SAF, IFA, MF59, 프로박스(Provax), 티터맥스(TiterMax), 몬타니드(Montanide), 백스펙틴(Vaxfectin)을 포함하는 에멀전; 옵티박스(Optivax) (CRL1005), L121, 폴로악스머4010(Poloaxmer4010)) 등을 포함하는 코폴리머; 스텔스(Stealth)를 포함하는 리포좀, BIORAL을 포함하는 코클레이트; QS21, 큐일 A(Quil A), 이스코매트릭스(Iscomatrix), ISCOM을 포함하는 식물 유도된 어쥬번트; 토마틴(Tomatine), PLG, PMM, 이눌린을 포함하는 바이오폴리머를 포함하는 공동 자극(costimulation)에 적합한 어쥬번트; 로물티드(Romurtide), DETOX, MPL, CWS, 만노스(Mannose), CpG 핵산 서열, CpG7909, 인간 TLR 1-10의 리간드, 쥣과의 TLR 1-13 리간드, ISS-1018, IC31, 이미다조퀴놀린, 암플리겐(Ampligen), Ribi529, 이목신(IMOxine), IRIVs, VLPs, 콜레라 독소, 열내성 독소, Pam3Cys, 플라겔린(Flagellin), GPI 앵커(anchor), LNFPIII/Lewis X, 항미생물 펩타이드, UC-1V150, RSV 융합 단백질, cdiGMP를 포함하는 미생물 유도된 어쥬번트; 및 CGRP 뉴로펩타이드를 포함하는 길항제로 적합한 어쥬번트로 이루어진 군으로부터 선택될 수 있으나, 이에 제한되지 않는다.

적절한 어쥬번트는 또한 양이온성 또는 다가양이온성 화합물로부터 선택될 수 있으며, 상기 어쥬번트는 바람직하게 양이온성 또는 다가양이온성 화합물과 함께 약학적 조성물의 인공 핵산 분자 또는 벡터를 혼합하여 제조된다. 본 발명에 정의된 양이온성 또는 다가양이온성 화합물과 인공 핵산 분자 또는 약학적 조성물의 벡터를 회합(association) 또는 혼합(complexing)은 바람직하게 어쥬번트 특성을 제공하고 약학적 조성물의 인공 핵산 분자 또는 벡터를 안정화시키는 효과를 부여한다. 특히 바람직하게, 이러한 양이온성 또는 다가양이온성 화합물은 프로타민, 뉴클레올린, 스페르민 또는 스페르미딘을 포함하는 양이온성 또는 다가양이온성 펩타이드 또는 단백질, 또는 폴리-L-라이신 (PLL), 폴리-아르기닌, 염기성 폴리펩타이드, 세포 투과 펩타이드(CPPs), HIV-결합 펩타이드, Tat, HIV-1 Tat (HIV), Tat-유도된 펩타이드, 페네트라틴, VP22 유도된 또는 유사체 펩타이드, HSV VP22 (단순 포진), MAP, KALA 또는 단백질 이송 도메인 (PTDs, PpT620, 프롤린-풍부 펩타이드, 아르기닌 풍부 펩타이드, 리신-풍부 펩타이드, MPG-펩타이드(들), Pep-1, L-올리고머, 칼시토닌 펩타이드(들), 안테나페디아(Antennapedia)-유도된 펩타이드 (특히 초파리(Drosophila antennapedia)로부터), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24, SynB, SynB(1), pVEC, hCT-유도된 펩타이드, SAP, 프로타민, 스페르민, 스페르미딘, 또는 히스톤을 포함하는 것과 같은 다른 양이온성 펩타이드 또는 단백질로부터 선택된다. 더욱 바람직한 양이온성 또는 다가양이온성 화합물은 양이온성 폴리사카라이드, 예를 들어 키토산, 폴리브렌(polybrene), 양이온성 폴리머, 예를 들어 폴리에틸렌이민 (PEI), 양이온성 지질, 예를 들어 DOTMA: 1-(2,3-시올레일옥시)프로필) -N,N,N-트리메틸암모늄 클로라이드, DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민, DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스페르민, DIMRI: 디미리스토-옥시프로필 디메틸 하이드록시에틸 암모늄 브로마이드, DOTAP: 디올레일옥시-3-(트리메틸암모니오)프로판, DC-6-14: O,O-디테트라데카노일-N-( -트리메틸암모니오아세틸)디에탄올아민 클로라이드, CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-하이드록시에틸)]-디메틸암모늄 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]-트리메틸암모늄, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시숙시닐옥시)에틸]-트리메틸암모늄, 올리고펙타민, 또는 양이온성 또는 다가양이온성 폴리머, 예를 들어 -아미노산-폴리머 또는 역전된 폴리아미드 등과 같은 변형된 폴리아미노산, PVP(폴리(N-에틸-4-비닐피리디늄 브로마이드)) 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)) 등과 같은 변형된 아크릴레이트, pAMAM(폴리(아미도아민)) 등과 같은 변형된 아미도아민, 디아민 및 변형된 1,4 부탄디올 디아크릴레이트-코-5-아미노-1-펜타놀 폴리머 등과 같은 변형된 폴리베타아미노에스터(PBAE), 폴리프로필아민 덴드리머 또는 pAMAM 기초의 덴드리머 등과 같은 덴드리머, PEI: 폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 사이클로덱스트린 기초의 폴리머, 덱스트란 기초의 폴리머, 키토산 등과 같은 폴리아릴아민, 당 백본 기초의 폴리머, PMOXA-PDMS 코폴리머 등과 같은 실란 백본 기초의 폴리머, 하나 또는 그 이상의 양이온성 블록(예를 들어 상기 언급된 양이온성 폴리머로부터 선택된) 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜)의 조합으로 이루어진 블록폴리머 등을 포함할 수 있다.

추가적으로, 조성물의 인공 핵산 분자 또는 벡터, 바람직하게 RNA를 혼합함으로써 어쥬번트로 사용될 수 있는, 바람직한 양이온성 또는 다가양이온성 단백질 또는 펩타이드는 하기 전체 화학식 (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x를 갖는 하기 단백질 또는 펩타이드로부터 선택될 수 있으며, Arg, Lys, His 및 Orn의 총 함량이 올리고펩타이드의 전체 아미노산의 적어도 50%를 나타내는 경우, 상기 l + m + n + o + x = 8-15이며, l, m, n 또는 o는 서로 독립적으로 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15로부터 선택된 어느 수일 수 있고; Xaa는 Arg, Lys, His 또는 Orn을 제외한 천연(=자연적으로 발생) 또는 비-천연 아미노산으로부터 선택된 어느 아미노산일 수 있으며; Xaa의 총 함량이 올리고펩타이드의 전체 아미노산의 50%를 초과하지 않는 경우, X는 0, 1, 2, 3 또는 4로부터 선택된 어느 수일 수 있다. 본 발명에 있어서 특히 바람직한 올리고아르기닌은 예를 들어 Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R 등이다.

양이온성 또는 다가양이온성 화합물 대비 인공 핵산 또는 벡터의 비율은 전체 핵산 복합체의 질소/인 비율(N/P-비율)을 기초로 계산될 수 있다. 예를 들어, RNA가 염기의 통계적 분포를 보인다면, 1 ㎍ RNA는 전형적으로 약 3 nmol 포스페이트 잔기를 포함한다. 추가로, 1 ㎍ 펩타이드는 염기성 아미노산의 분자량 및 수에 의존하여, 전형적으로 약 x nmol 질소 잔기를 포함한다. (Arg)9(분자량 1424g/mol, 9개 질소 원자)에 대하여 예시적으로 계산할 때, 1 ㎍ (Arg)9은 약 700 pmol (Arg)9, 따라서 700 x 9=6300 pmol 염기성 아미노산 = 6.3 nmol 질소 원자를 포함한다. 약 1:1 RNA/(Arg)9의 질량비에 대하여 약 2의 N/P 비율이 계산될 수 있다. 2 ㎍ RNA과 함께 약 2:1의 질량비를 갖는 프로타민(연어로부터 프로타민이 사용될 때, 분자량 약 4250 g/mol, 21개 질소 원자)에 대하여 예시적으로 계산할 때, 6 nmol 포스페이트는 RNA에 대하여 계산될 수 있다; 1 ㎍ 프로타민은 약 235 pmol 프로타민 분자 및 따라서 235 x 21 = 4935 pmol 염기성 질소 원자 = 4.9 nmol 질소 원자를 포함한다. 약 2:1 RNA/프로타민의 질량비에 대하여 약 0.81의 N/P 비율이 계산될 수 있다. 약 8:1 RNA/프로타민의 질량비에 대하여 약 0.2의 N/P 비율이 계산될 수 있다. 본 발명의 맥락에서, N/P-비율은 복합체 내 핵산:펩타이드의 비율에 관하여, 바람직하게 약 0.1-10의 범위, 바람직하게 0.3-4의 범위, 및 가장 바람직하게 약 0.5-2 또는 0.7-2의 범위, 가장 바람직하게 약 0.7-1.5의 범위이다.

이의 공개가 본 발명에 참고문헌으로 병합된 특허출원 WO2010/037539는 면역자극성 조성물 및 면역자극성 조성물의 제조를 위한 방법을 개시한다. 그에 따라, 상기 발명의 바람직한 실시예에서, 상기 조성물은 상기 발명에 따른 인공 핵산 분자의 충분한 면역자극성 효과 및 효과적인 번역 모두를 얻기 위해, 분리된 두 단계로 수득된다. 이에, 소위 "어쥬번트 조성물"은 - 첫번째 단계 - 안정한 복합체를 형성하기 위해 특정한 비율로 양이온성 또는 다가 양이온성 화합물과 함게 어쥬번트 구성요소의 인공 핵산 분자 또는 벡터, 바람직하게 RNA를 혼합함으로써 제조된다. 이러한 맥락에서, 자유 양이온성 또는 다가양이온성 화합물이 없거나 또는 오직 무시할 수 있는 소량만이 핵산의 혼합 이후 어쥬번트 구성 요소에 남아 있는 것이 중요하다. 따라서, 어쥬번트 구성 요소 내 핵산 및 양이온성 또는 다가양이온성 화합물의 비율은 핵산이 완전히 혼합되고 자유 양이온성 또는 다가양이온성 화합물이 없거나 또는 오직 무시할 만한 소량으로 조성물 내 남아있는 범위 내에서 전형적으로 선택된다. 어쥬번트 구성 요소의 바람직한 범위, 즉 양이온성 또는 다가양이온성 화합물 대비 핵산의 비율은 약 6:1(w/w) 내지 약 0,25:1(w/w), 더욱 바람직하게 약 5:1(w/w) 내지 약 0,5:1(w/w), 더욱 더 바람직하게 약 4:1(w/w) 내지 약 1:1(w/w) 또는 약 3:1(w/w) 내지 약 1:1(w/w), 및 가장 바람직하게 약 3:1(w/w) 내지 약 2:1(w/w)의 비율의 범위로부터 선택된다.

바람직한 실시예에 따르면, 본 발명에 따른 인공 핵산 분자 또는 벡터, 바람직하게 RNA 분자는 본 발명의 (면역자극성) 조성물을 형성하기 위해 어쥬번트 구성 요소의 혼합된 핵산 분자, 바람직한 RNA에 두번째 단계에 첨가된다. 이에 따라, 본 발명의 인공 산 분자 또는 벡터, 바람직하게 RNA는 자유 핵산, 즉 다른 화합물과 혼합되지 않는 핵산으로서 첨가된다. 첨가 전, 자유 인공 핵산 분자 또는 벡터는 혼합되지 않으며, 바람직하게 어쥬번트 구성 요소의 첨가에 따른 검출 가능한 또는 현저한 어느 혼합 반응을 수행하지 않는다.

적절한 어쥬번트는 나아가 화학식 (II): GlXmGn을 갖는 핵산으로부터 선택될 수 있으며, 상기: G는 구아노신, 우라실 또는 구아노신 또는 우라실의 유사체이며; X는 구아노신, 우라실, 아데노신, 티미딘, 시토신 또는 상기 뉴클레오티드의 유사체이며; l은 1 내지 40의 정수이며, 상기 l=1일 때 G는 구아노신 또는 이의 유사체이며, l>1일 때 뉴클레오티드의 적어도 50%는 구아노신 또는 이의 유사체이며; m은 정수이며 적어도 3이며; 상기 m=3일 때 X는 우라실 또는 이의 유사체이며, 상기 m>3일 때 적어도 3개 연속적인 우라실 또는 우라실의 유도체가 발생하며; n은 1 내지 40의 정수이며, 상기 n=1일 때 G는 구아노신 또는 이의 유사체이며, n>1일 때 적어도 50%의 뉴클레오티드는 구아노신 또는 이의 유사체이다.

다른 적절한 어쥬번트는 나아가 화학식 (III): ClXmCn을 갖는 핵산으로부터 선택될 수 있으며, 상기: C는 시토신, 우라실 또는 시토신 또는 우라실의 유사체이며; X는 구아노신, 우라실, 아데노신, 티미딘, 시토신 또는 상기 뉴클레오티드의 유사체이며; l은 1 내지 40의 정수이며, 상기 l=1일 때 C는 시토신 또는 이의 유사체이며, 상기 l>1일 때 적어도 50%의 뉴클레오티드는 시토신 또는 이의 유사체이며; m은 정수이며 적어도 3이며; 상기 m=3일 때 X는 우라실 또는 이의 유사체이며, 상기 m>3일 때 적어도 3개 연속적인 우라실 또는 우라실의 유사체가 발생하며; n은 1 내지 40의 정수이며, 상기 n=1일 때 C는 시토신 또는 이의 유사체이며, 상기 n>1일 때 적어도 50%의 뉴클레오티드는 시토신 또는 이의 유사체이다.

본 발명에 따르는 약학적 조성물은 바람직하게는 약학적 조성물의, 특히 본 발명에 정의된 본 발명의 인공 핵산 분자, 벡터 및/또는 세포의 구성 성분의 “안전하고 유효한 양”을 포함한다. 본 발명에 사용된 “안전하고 유효한 양”은 본 발명에 정의된 질병 또는 질환의 긍정적 변형을 현저하게 유도하는 충분한 양을 의미한다. 동시에 그러나 “안정하고 효과적인 양”은 바람직하게는 심각한 부작용을 회피하며 장점 및 위험 사이의 민감한 관계를 허용한다. 이들 한계의 결정은 전형적으로 민감한 의학적 판단 내에 있다.

추가적 양태에서, 본 발명은 의약품(medicament)으로서, 예를 들어 백신(유전자적 백신 접종) 또는 유전자 치료에서, 사용을 위한, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 치료적 행동의 사용 또는 펩타이드, 폴리펩타이드 또는 단백질의 효과를 만드는 어느 의학적 적용에, 또는 특정한 펩타이드 또는 단백질의 보충이 필요한 곳에 특히 적절하다. 따라서 본 발명은 펩타이드, 폴리펩타이드 또는 단백질의 치료적 행동 또는 효과에 의해 치료할 수 있거나 특정한 펩타이드, 폴리펩타이드 또는 단백질의 보충에 의해 치료할 수 있는 질병 또는 질환의 치료 또는 예방에 사용을 위해 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다. 예를 들어 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 유전적 질병, 자가면역 질병, 암 또는 종양 관련된 질병, 감염성 질병, 만성 질병 또는 그와 같은 것, 예를 들어 유전적 백신 접종 또는 유전자 치료에 의한 것에 의해 치료 또는 예방을 위해 사용될 수 있다.

특히 치료되는 개체에 치료적 펩타이드, 폴리펩타이드 또는 단백질의 안정하고 연장된 존재로부터 유익한 이러한 치료(therapeutic treatments)는, 본 발명의 3'-UTR 요소가 본 발명의 인공 핵산 분자 또는 벡터의 코딩된 펩타이드 또는 단백질의 안정하고 연장된 발현을 제공하기 때문에, 본 발명의 맥락에서 의학적 적용으로 특히 적절하다. 따라서 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 본 발명에 따르는 약학적 조성물의 특히 적절한 의학적 적용은 백신 접종이다. 따라서 본 발명은 개체, 바람직하게 포유동물 개체, 더욱 바람직하게 인간 개체의 백신 접종을 위한, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다. 바람직한 백신 접종 치료는 박테리아, 원생동물 또는 바이러스 감염과 같은 감염성 질병에 대한 백신 접종 및 항 종양 백신 접종이다. 이러한 백신 접종 치료는 예방을 위한 것 또는 치료를 위한 것일 수 있다.

치료 또는 예방되는 질병에 의존하여 ORF는 선택될 수 있다. 예를 들어 오픈 리딩 프레임은 유전적 질병을 겪는 환자와 같이, 단백질의 기능의 전체 부족 또는 적어도 부분적 결실을 겪는 환자에게 공급되는 단백질에 대해 코딩할 수 있다. 추가적으로 오픈 리딩 프레임은 개체의 질병 또는 상태에 유익하게 영향을 주는 펩타이드 또는 단백질을 코딩하는 ORF로부터 선택될 수 있다. 나아가 오픈 리딩 프레임은 천연 펩타이드 또는 단백질의 병리학적 과생산의 하향-조절 또는 단백질 또는 펩타이드를 병리학적으로 발현하는 세포의 제거에 영향을 주는 펩타이드 또는 단백질을 코딩할 수 있다. 이러한 기능 또는 과생산의 부족, 상실은 예를 들어 종양 및 종양 형성(neoplasia), 자가면역 질병, 알러지, 감염, 만성 질환 또는 이와 유사한 것의 맥락에서 발생할 수 있다. 나아가 오픈 리딩 프레임은 항원 또는 면역원, 예를 들어 병원체의 에피토프에 대한 또는 종양 항원에 대한 것을 코딩할 수 있다. 따라서 바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자 또는 벡터는 항원 또는 면역원, 예를 들어 병원체의 에피토프 또는 종양 관련된 항원, 상기 설명된 3'-UTR 요소, 및 폴리(A) 서열 등과 같은 선택적인 추가 구성 요소를 포함하거나 이로 구성된 아미노산 서열을 코딩하는 ORF를 포함한다.

의학적 적용의 맥락에서, 특히 백신 접종의 맥락에서, DNA는 항-DNA 면역 반응을 유도하는 위험을 가지며 유전체 DNA에 삽입되려는 경향이 있으므로, 본 발명에 따르는 인공 핵산 분자는 RNA, 바람직하게는 mRNA인 것이 바람직하다. 그러나 일부 실시예에서, 예를 들어 만약 아데노바이러스 전달 수송체와 같은, 바이러스 전달 수송체가 본 발명에 따르는 인공 핵산 분자 또는 벡터의 전달을 위해 사용된다면, 예를 들어 유전자 치료의 맥락에서, 인공 핵산 분자 또는 벡터가 DNA 분자인 것이 바람직할 수 있다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 경구적으로, 비경구적으로, 흡입 스프레이에 의해, 국소적으로, 직장으로, 비강으로, 구강으로, 질로 또는 이식된 병원소(implanted reservoir)를 통해 또는 제트 인젝션(jet injection)을 통해 투여될 수 있다. 본 발명에 사용된 용어 비경구적은 피하, 정맥내, 근육내, 관절내, 활액내(intra-synovial), 흉골내, 척추강내, 간장내, 병소내, 두개내, 경피내, 피내, 폐내(intrapulmonal), 복강내, 심장 내, 동맥내, 및 설하 주사 또는 투입(infusion) 기술을 포함한다. 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자, 본 발명에 따른 벡터, 본 발명에 따른 세포, 또는 본 발명에 따른 약학적 조성물은 무바늘 주사(예를 들어 제트 인젝션)를 통해 투여된다.

바람직하게는 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 비경구적으로, 예를 들어 비경구적 주사에 의해, 더욱 바람직하게는 피하, 정맥내, 근육내, 관절내, 활액내, 흉골내, 척추강내, 간장내, 병소내, 두개내, 경피내, 피내, 폐내, 복강내, 심장내, 동맥내, 및 설하 주사 또는 투입 기술에 의해 투여된다. 특히 바람직한 것은 피내 및 근육내 주사이다. 독창적 약학적 조성물의 살균 주사가능한 형태는 수용성 또는 유성 현탁액일 수 있다. 이들 현탁액은 적절한 분산 또는 습윤제 및 현탁제를 사용하여 기술분야에 알려진 기술에 따라 제조될 수 있다. 바람직하게, 상기 용액 또는 현탁액은 무바늘 주사(예를 들어 제트 인젝션)를 통해 투여된다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 또한 캡슐, 정제, 수용성 현탁액 또는 용액을 포함하나, 이에 제한되지 않고, 어느 구두로 허용 가능한 투여 형태로 구두로(orally) 투여될 수 있다.

본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 또한, 특히 치료의 목표가 국소적 처리에 의해 용이하게 접근 가능한 지역(areas) 또는 기관, 예를 들어 피부의 또는 어느 다른 접근 가능한 상피 조직의 질병을 포함하는 것을 포함할 때 국소적으로 투여될 수 있다. 적절한 국소적 제형은 이들 지역 또는 기관의 각각에 대해 용이하게 제조될 수 있다. 국소적 적용을 위해, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 하나 또는 그 이상의 담체에 현탁 또는 용해된 적절한 연고로 제조될 수 있다.

일 실시예에서, 의약품으로서 사용은 포유동물 세포의 형질전환의 단계, 바람직하게는 포유동물 세포의 인비트로(in vitro) 또는 엑스비보(ex vivo) 형질전환, 더욱 바람직하게는 의약품에 의해 치료될 개체의 분리된 세포의 인비트로 형질전환을 포함한다. 만약 사용이 분리된 세포의 인비트로 형질전환을 포함한다면, 의약품으로서 사용은 환자에 형질전환된 세포의 재투여를 추가적으로 포함할 수 있다. 의약품으로서 본 발명의 인공 핵산 분자 또는 벡터의 사용은 성공적으로 형질전환된 분리된 세포의 선별의 단계를 추가로 포함할 수 있다. 따라서, 만약 벡터가 선별 마커를 추가적으로 포함하는 경우 유익할 수 있다. 또한 의약품으로서 사용은 분리된 세포의 인비트로 형질전환 및 발현 생산물, 즉 이들 세포로부터 코딩된 펩타이드 또는 단백질의 정제를 포함할 수 있다. 이들 정제된 펩타이드 또는 단백질은 차후에 이것이 필요한 개체에 투여될 수 있다.

본 발명은 또한 이것이 필요한 개체에 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 투여하는 것을 포함하는 상기 설명된 질병 또는 질환을 치료 또는 예방하는 방법을 제공한다.

나아가, 본 발명은 본 발명에 따른 인공 핵산 분자와 함께 세포의 형질전환을 포함하는 질병 또는 질환을 치료 또는 예방하는 방법을 제공한다. 상기 형질전환은 인비트로, 엑스비보 또는 인비보에서 수행될 수 있다. 바람직한 실시예에서, 세포의 형질전환은 인비트로 수행되며 형질전환된 세포는 이것이 필요한 개체에, 바람직하게는 인간 환자에 투여된다. 바람직하게는 인비트로 형질전환되는 세포는 개체, 바람직하게는 인간 환자의 분리된 세포이다. 따라서 본 발명은 개체로부터, 바람직하게는 인간 환자로부터 세포를 분리하는 단계, 본 발명에 따르는 인공 핵산 또는 본 발명에 따르는 벡터로 분리된 세포를 형질전환 하는 단계, 및 개체, 바람직하게는 인간 환자에 형질전환된 세포를 투여하는 단계를 포함하는 치료 방법을 제공한다.

본 발명에 따르는 질환을 치료 또는 예방하는 방법은 바람직하게 상기 설명된 백신 접종 방법 또는 유전자 치료 방법이다.

상기 설명된 바와 같이, 본 발명은 3'-UTR 요소는 mRNA 분자를 안정화 및/또는 mRNA 분자로부터 단백질 생산을 증진, 안정화 및/또는 연장할 수 있다. 따라서, 추가적 양태에서, 본 발명은 리보좀 단백질 유전자의 3'-UTR 또는 리보좀 단백질 유전자의 3'-UTR의 변이체, 바람직하게 상기 설명된 3'-UTR 요소로부터 유도된 핵산 서열을 포함하거나 이로 구성된 3'-UTR 요소와 함께, RNA 분자, 바람직하게 mRNA 분자, 또는 RNA 분자를 코딩하는 벡터를 회합하는(associating) 단계를 포함하는, RNA 분자, 바람직하게 mRNA 분자를 안정화시키기 위한 방법에 관한 것이다.

나아가, 본 발명은 인공 핵산 분자로부터 또는 벡터로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 증진, 안정화 및/또는 연장시키는 및/또는 인공 핵산 분자로부터 또는 벡터로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 안정화 및/또는 연장시키는 방법에 관한 것이며, 상기 방법은 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 3'-UTR 요소와 함께, 바람직하게 상기 설명된 3'-UTR 요소와 함께, 인공 핵산 분자 또는 벡터, 바람직하게 mRNA 분자를 회합시키는 단계를 포함한다.

본 발명의 맥락에서 용어 “3'-UTR 요소와 함께 인공 핵산 분자 또는 벡터를 회합”은 바람직하게 3'-UTR 요소와 함께 인공 핵산 분자 또는 벡터를 기능적으로 회합 또는 기능적으로 조합하는 것을 의미한다. 이는 상기 인공 핵산 분자 또는 벡터 및 3'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소가 3'-UTR 요소의 기능, 예를 들어 RNA 및/또는 단백질 생산 안정화 기능이 수행되도록, 회합되거나 짝지어짐을 의미한다. 전형적으로, 이는 3'-UTR 요소가 인공 핵산 분자 또는 벡터, 바람직하게 mRNA 분자, 오픈 리딩 프레임에 3', 바람직하게 오픈 리딩 프레임의 바로 옆 3', 바람직하게 오픈 리딩 프레임 및 폴리(A) 서열 또는 폴리아데닐화 신호 사이에 통합되는 것을 의미한다. 바람직하게, 상기 3'-UTR 요소는 3'-UTR과 같은 인공 핵산 분자 또는 벡터, 바람직하게 mRNA로 통합되며, 즉 3'-UTR 요소는 인공 핵산 분자 또는 벡터, 바람직하게 mRNA의 3'-UTR이며, 즉, 이는 오픈 리딩 프레임의 3'-측에서 폴리(A) 서열 또는 폴리아데닐화 신호의 5'-측까지, 선택적으로 하나 이상의 제한 부위를 포함하거나 이로 구성된 서열와 같은 짧은 링커를 통해 연결되어 확장된다. 따라서, 바람직하게 상기 용어 “3'-UTR 요소와 함께 인공 핵산 분자 또는 벡터를 회합”하는 것은 인공 핵산 분자 또는 벡터 내, 바람직하게 mRNA 분자 내 위치한 오픈 리딩 프레임과 3'-UTR 요소가 기능적으로 회합되는 것을 의미한다. 상기 3'-UTR 및 ORF는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것, 예를 들어 바람직하게 상기 ORF 및 3'-UTR은 이종 기원(heterologous), 예를 들어 상기 설명된 것처럼 다른 유전자로부터 유도된 것이다.

추가적 양태에서, 본 발명은 3'-UTR 요소가 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된, RNA 분자의, 바람직하게 mRNA 분자의 안정성을 향상시키기 위한 3'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소의 용도를 제공한다.

게다가, 본 발명은 3'-UTR 요소가 상기 설명된 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 인공 핵산 분자 또는 벡터로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 향상시키기 위한, 및/또는 인공 핵산 분자 또는 벡터 분자로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 안정화 및/또는 연장시키기 위한, 3'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소의 용도를 제공한다.

본 발명에 따른 용도는 바람직하게 상기 설명된 3'-UTR 요소와 함께 상기 인공 핵산 분자, 벡터 또는 RNA를 회합시키는 것을 포함한다.

본 발명의 약학적 조성물의 화합물 및 성분은 또한 각각 분리되어 제조 및 거래될 수 있다. 따라서, 본 발명은 나아가 본 발명에 따른 인공 핵산 분자, 본 발명에 따른 벡터, 본 발명에 따른 세포, 및/또는 본 발명에 따른 약학적 조성물을 포함하는 키트 또는 일부(parts)의 키트에 관한 것이다. 바람직하게, 이러한 키트 또는 일부의 키트는 추가적으로 사용을 위한 지침, 형질전환을 위한 세포, 어쥬번트, 약학적 조성물의 투여를 위한 수단, 약학적으로 허용 가능한 담체 및/또는 인공 핵산 분자, 벡터, 세포 또는 약학적 조성물의 용해 또는 희석을 위한 약학적으로 허용 가능한 용액을 포함할 수 있다.

하기 도면, 서열 및 실시예는 본 발명을 추가로 설명하기 위한 의도이다. 이들은 본 발명의 목적을 이에 제한하려는 의도는 아니다.

본 발명의 인공 핵산 분자는 유전자 치료 및/또는 유전자 백신 접종에 효과적으로 사용될 수 있다. 또한, 본 발명의 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 3'-UTR 요소는 단백질 발현을 증진, 안정 및/또는 연장시킬 수 있다.

도 1 내지 3은 인비트로(in vitro) 전사를 통해 수득될 수 있는 mRNA를 코딩하는 서열을 나타낸다. 하기 약어가 사용되었다:
* rpl32: 5' 말단 올리고피리미딘 트랙트(tract)가 없는 인간 리보좀 단백질 라지 32의 5'-UTR
* PpLuc (GC): 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 mRNA 서열
* A64: 64개 아데닐레이트(adenylates)를 갖는 폴리(A)-서열
* ag: 인간 α-글로빈의 3'-UTR의 중심, α-복합체 결합 일부
* rps9: 인간 리보좀 단백질 스몰 9의 3'-UTR로부터 유도된 3'-UTR
* C30: 30개 시티딜레이트(cytidylates)를 갖는 폴리(C)-서열
* 히스톤SL: (Cakmakci, Lerner, Wagner, Zheng, & William F Marzluff, 2008. Mol. Cell. Biol. 28(3):1182-94)로부터 수득한 히스톤 스템-루프 서열;
* 알부민: 인간 알부민의 3'-UTR.
도 1: mRNA rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL (SEQ ID NO:8)을 코딩하는 서열을 나타냄
도 2: mRNA rpl32 - PpLuc(GC) - ag - A64 - C30 - 히스톤SL (SEQ ID NO:9)을 코딩하는 서열을 나타냄. 인간 α-글로빈의 3'-UTR의 중앙, α-복합체 결합 일부는 ORF 및 폴리(A) 사이에 삽입되었음. PpLuc(GC) ORF는 이탤릭체로 강조됨. 상기 α-글로빈으로부터 유도된 3'-UTR 요소는 밑줄침.
도 3: rpl32 - PpLuc(GC) - rps9 - A64 - C30 - hSL (SEQ ID NO:7)의 mRNA 서열. 인간 리보좀 단백질 스몰 9의 3'-UTR은 ORF 및 폴리(A) 사이에 삽입됨. PpLuc(GC) ORF는 이탤릭체로 강조되며, 상기 rps9로부터 유도된 3' UTR 요소는 밑줄침.
도 4: 리보좀 단백질 스몰 9의 3'-UTR이 mRNA로부터 단백질 발현을 현저하게 증가시킴을 나타냄.
3'-UTR이 없거나 인간 α-글로빈 3'-UTR을 포함하는 mRNA로부터 루시퍼라제 발현과 비교하여, mRNA로부터 루시퍼라제 발현에 본 발명의 인간 리보좀 단백질 스몰 9의 3'-UTR의 효과를 실험함. 그에 따라 다른 mRNA는 리포펙션(lipofection)에 의해 인간 피부 아세포(HDF)로 형질전환됨. 루시퍼라제 수준은 형질전환 이후 6, 24, 48, 및 72 시간에 측정됨. 루시퍼라제는 3'-UTR이 없는 mRNA로부터 명확하게 발현됨. 그러나, 루시퍼라제 발현은 잘 알려진 α-글로빈 3'-UTR에 의해 증가되지 않음. 대조적으로, 리보좀 단백질 스몰 9의 3'-UTR은 루시퍼라제 발현을 현저하게 증가시킴. 데이터는 3회 형질전환에 대해 평균 RLU ± SEM (상대적은 광 단위 ± 표준 오차)로 그래프로 나타냄. RLU는 실시예 5.1에 요약됨.
도 5: mRNA rpl32 - PpLuc(GC) - 알부민 - A64 - C30 - 히스톤SL(SEQ ID NO: 206)을 코딩하는 서열을 나타냄. 인간 알부민의 3'-UTR은 ORF 및 폴리(A) 사이에 삽입됨. PpLuc(GC) ORF는 이탤릭체로 강조됨. 알부민으로부터 유도된 3'-UTR 요소는 밑줄침.
도 6: 쥣과 리보좀 단백질 유전자 rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HDF 세포(인간 피부 아세포) 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 7: 쥣과 리보좀 단백질 유전자 rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, Hela 세포 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 8: 쥣과 리보좀 단백질 유전자 rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HDF 세포(인간 피부 아세포) 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 9: 쥣과 리보좀 단백질 유전자 rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HeLa 세포 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.

실시예

1. DNA-주형(templates)의 제조

인비트로(in vitro) 전사를 위한 벡터는 T7 프로모터 및 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 서열(PpLuc(GC))을 포함하여 구성되었다. 리보좀 단백질 라지 32의 5' 비번역된 영역(5'-UTR)은 PpLuc(GC)의 5'에 삽입되었다. A64 폴리(A) 서열 이후 C30 및 히스톤 스템-루프 서열이 PpLuc(GC)의 3'으로 삽입되었다. 상기 히스톤 스템-루프 서열 다음 인비트로 전사 전 벡터의 선형화를 위해 사용된 제한 부위가 따랐다. 인비트로 전사에 따라 이러한 벡터로부터 수득된 mRNA는 "rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL"로 설계되었다.

이러한 벡터는 오픈 리딩 프레임의 비번역된 서열 3'(3'-UTR)을 포함하도록 변형되었다. 요약하면, 하기 mRNA 코딩 서열을 포함하는 벡터가 생산되었다(mRNA 코딩 서열의 일부는 도 1 내지 3에 실시예로 묘사됨):

rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL (SEQ ID NO:8, Fig. 1)

rpl32 - PpLuc(GC) - ag - A64 - C30 - 히스톤SL (SEQ ID NO:9, Fig. 2)

rpl32 - PpLuc(GC) - rps9 - A64 - C30 - 히스톤SL (SEQ ID NO:7, Fig. 3)

rpl32 - PpLuc(GC) - rps21 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps29 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps9 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps27 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps28 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps19 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl35a - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl13 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl23a - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - uba52 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl22l1 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps4x - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps23 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps13 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps17 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps18 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - Fau - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rps13 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - 히스톤SL

rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - 히스톤SL

2. 인비트로(In vitro) 전사

실시예 1에 따른 DNA 주형은 선형화되고 선형화되고 T7-RNA 중합효소를 사용하여 인비트로(in vitro) 전사되었다. 상기 DNA 주형은 이후 DNase-처리에 의해 소화되었다. mRNA 전사체는 전사 반응에 N7-메틸-구아노신-5'-트리포스페이트-5'-구아노신의 과량 첨가하여 수득된 5'-캡 구조를 포함한다. 그에 따라 수득된 mRNA는 정제되고 물에 재현탁되었다.

3. mRNA 리포펙션에 의한 루시퍼라제 발현

인간 피부 아세포(HDF) 또는 HeLa 세포는 배지(10% FCS, 1% Pen/Strep, 1%글루타민이 첨가된 L-글루타민 및 25mM Hepes(Lonza, Basel, Switzerland)가 있는 RPMI 1640 배지) 내 웰당 3x10⁴ 세포의 농도로 형질전환 전 3일 동안 24개 웰 플레이트에 시드되었다. 리포펙션 직전, 세포는 Opti-MEM 내 세척되었다. 세포는 리포펙타민2000과 함께 복합화된 웰 당 PpLuc-코딩 mRNA의 25 ng으로 리포펙트되었다. 레닐라 레니포르미스(Renilla reniformis) 루시퍼라제(RrLuc)를 코딩하는 mRNA는 형질전환 효율을 위해 대조군에 PpLuc mRNA와 함께 형질전환되었다(웰 당 RrLuc mRNA의 2.5 ng). 형질전환의 시작 90분 이후, Opti-MEM은 배지에 대해 교체되었다. 형질전환 6, 24, 48, 및 72시간 이후, 배지는 흡입되고(aspirated) 세포는 용해 버퍼(Passive Lysis Buffer, Promega)의 100 ㎕ 내 용해되었다. 용해물은 루시퍼라제 활성이 측정될 때까지 -80°C에서 저장되었다.

4. 루시퍼라제 측정

루시퍼라제 활성은 하이덱스 카멜레온(Hidex Chameleon) 플레이트 리더에서 상대적인 광 단위(RLU)로 측정되었다. PpLuc 활성은 20 ㎕의 용해물 및 50 ㎕의 루시페린 버퍼(Beetle-Juice, PJK GmbH)를 사용하여 2초 측정 시간에 측정되었다. RrLuc 활성은 20 ㎕의 용해물 및 50 ㎕의 코엘렌테라진 버퍼(Renilla-Juice, PJK GmbH)를 사용하여 2초 측정 시간에 측정되었다.

5. 결과

5.1 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.

mRNA로부터 단백질 발현에 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 3'-UTR이 없거나, 또는 인간 α-글로빈의 3'-UTR의 중심, α-복합체 결합 일부(ag) 포함된, 또는 인간 리보좀 단백질 스몰 9의 3'-UTR(rps9) 포함된 mRNA들. 루시퍼라제를 코딩하는 mRNA는 인간 피부 아세포(HDF)로 형질전환되었다. 루시퍼라제 수준은 형질전환 이후 6, 24, 48, 및 72 시간에 측정되었다. 이러한 데이터들로부터, 0 내지 72 시간에 발현된 총 단백질이 곡선 하 영역(AUC)으로 계산되었다(하기 표 1 및 도 4 참조).

3'-UTR	6시간에 RLU	24시간에 RLU	48시간에 RLU	72시간에 RLU	AUC
없음(none)	1183752	2703805	2040979	536076	126400000
ag	696317	2188117	1630769	273142	96720000
rps9	1650962	4513651	4273634	755401	226200000

루시퍼라제는 3-UTR이 없는 mRNA로부터 명확하게 발현되었다. 그러나 루시퍼라제 발현은 잘 알려진 α-글로빈 3'-UTR에 의해 증가되지 않았다. 대조적으로, 리보좀 단백질 스몰 9의 3'-UTR은 루시퍼라제 발현을 현저하게 증가시켰다.

5.2 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.

mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질(rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a)의 3'-UTR을 포함하며, mRNA로부터 단백질 발현을 증가시키는 것으로 알려진(WO2013143698) 알부민의 3'-UTR 비교를 위한 mRNA. 루시퍼라제를 코딩하는 mRNA는 인간 피부아세포(HDF)로 형질전환되었다. 루시퍼라제 수준은 형질전환 24, 48, 및 72 시간 이후에 측정되었다(하기 표 2 및 도 7 참조).

	24시간에 RLU	48시간에 RLU	72시간에 RLU
rpl32- PpLuc(GC)-알부민	1468876	720609	199437
rpl32- PpLuc(GC)-알부민	1407897	580822	181030
rpl32- PpLuc(GC)-rps21	2974366	779239	191021
rpl32- PpLuc(GC)-rps29	4040760	856996	216321
rpl32- PpLuc(GC)-rps9	2930305	802405	219681
rpl32- PpLuc(GC)-rps27	4503067	1090230	274320
rpl32- PpLuc(GC)-rps28	2026219	448372	103269
rpl32- PpLuc(GC)-rps19	4249503	1075621	206846
rpl32- PpLuc(GC)-rpl35a	3907863	1223672	262108
rpl32- PpLuc(GC)-rpl13	2543231	782597	165374
rpl32- PpLuc(GC)-rpl36	2880198	683174	143539
rpl32- PpLuc(GC)-rpl23a	2872413	606451	120915
세포	118	213	191

상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 설명된, 알부민의 3'-UTR을 포함하는 mRNA에 비해 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현됨을 나타낸다.

5.3 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.

mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질(rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a)의 3'-UTR을 포함하며, 알부민의 3'-UTR을 비교하기 위한 mRNA들. 루시퍼라제를 코딩하는 mRNA는 HeLa 세포로 형질전환되었다. 루시퍼라제 수준은 형질전환 24, 48, 및 72시간 이후에 측정되었다.(하기 표 3 및 도 7 참조).

	24시간에 RLU	48시간에 RLU	72시간에 RLU
rpl32- PpLuc(GC)-알부민	482053	131028	16580
rpl32- PpLuc(GC)-알부민	525908	86636	21971
rpl32- PpLuc(GC)-rps21	1452649	307127	38317
rpl32- PpLuc(GC)-rps29	1413088	293924	27114
rpl32- PpLuc(GC)-rps9	1399948	304061	36627
rpl32- PpLuc(GC)-rps27	1460812	235486	28608
rpl32- PpLuc(GC)-rps28	1384794	201359	25787
rpl32- PpLuc(GC)-rps19	1446100	303612	40591
rpl32- PpLuc(GC)-rpl35a	1848259	307848	47293
rpl32- PpLuc(GC)-rpl13	772371	138186	27188
rpl32- PpLuc(GC)-rpl36	837643	147108	36641
rpl32- PpLuc(GC)-rpl23a	887643	157330	24916
세포	97	193	117

상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 알려진 알부민의 3'-UTR을 포함하는 mRNA에 비해, 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현됨을 나타낸다.

5.4 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.

mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질의 3'-UTR(rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38)을 포함하며 알부민의 3'-UTR을 비교하기 위한 mRNA들. 루시퍼라제를 코딩하는 mRNA들은 인간 피부 아세포(HDF)로 형질전환되었다. 루시퍼라제 수준은 형질전환 24, 48, 및 72 시간 이후에 측정되었다. (하기 표 4 및 도 8 참조).

	24시간에 RLU	48시간에 RLU	72시간에 RLU
rpl32-PpLuc(GC)-알부민	2181914	921116	474521
rpl32-PpLuc(GC)-rpl23	4836067	1365445	444623
rpl32-PpLuc(GC)-uba52	4404508	1572170	517874
rpl32-PpLuc(GC)-rpl22l1	4124152	1057264	346186
rpl32-PpLuc(GC)-rpl36a	4326843	1328764	510755
rpl32-PpLuc(GC)-rps4x	2879407	724050	246616
rpl32-PpLuc(GC)-rpl27	3391506	830016	254254
rpl32-PpLuc(GC)-rpl3	4889331	1074353	427856
rpl32-PpLuc(GC)-알부민	2870659	1252124	437208
rpl32-PpLuc(GC)-rps23	4321886	911262	308560
rpl32-PpLuc(GC)-rps13	4313724	1173245	373579
rpl32-PpLuc(GC)-rpl26	4405685	1450797	455755
rpl32-PpLuc(GC)-rps17	4661966	1138370	359931
rpl32-PpLuc(GC)-rps18	4580492	1224085	329321
rpl32-PpLuc(GC)-rps8	5043669	1255188	380314
rpl32-PpLuc(GC)-Fau	5495042	1277753	416901
rpl32-PpLuc(GC)-rps13	4879517	1307823	361588
rpl32-PpLuc(GC)-rpl11	4273583	1264210	436367
rpl32-PpLuc(GC)-rpl38	4891163	1477135	464923

상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 알려진 알부민의 3'-UTR을 포함하는 mRNA에 비해, 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현되는 것을 나타낸다.

5.5 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.

mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질의 3'-UTR(rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38)을 포함하며, 알부민의 3'-UTR과 비교를 위한 mRNA들. 루시퍼라제를 코딩하는 mRNA는 HeLa 세포로 형질전환되었다. 루시퍼라제 수준은 형질전환 이후 24, 48, 및 72 시간에 측정되었다. (하기 표 5 및 도 9 참조).

	24시간에 RLU	48시간에 RLU	72시간에 RLU
rpl32-PpLuc(GC)-알부민	1370770	383733	69772
rpl32-PpLuc(GC)-rpl23	2860370	711666	78196
rpl32-PpLuc(GC)-uba52	2954670	820157	97648
rpl32-PpLuc(GC)-rpl22l1	3211757	822579	86780
rpl32-PpLuc(GC)-rpl36a	3198982	878820	115778
rpl32-PpLuc(GC)-rps4x	3282181	500040	45538
rpl32-PpLuc(GC)-rpl27	2544927	533978	66691
rpl32-PpLuc(GC)-rpl3	3081117	653787	83858
rpl32-PpLuc(GC)-알부민	1692963	397629	73285
rpl32-PpLuc(GC)-rps23	3828806	864761	94624
rpl32-PpLuc(GC)-rps13	3627626	898377	135420
rpl32-PpLuc(GC)-rpl26	3981814	839608	149750
rpl32-PpLuc(GC)-rps17	4607487	1029902	182204
rpl32-PpLuc(GC)-rps18	4071557	742337	101819
rpl32-PpLuc(GC)-rps8	4459446	1032970	125825
rpl32-PpLuc(GC)-Fau	4486972	1066363	147843
rpl32-PpLuc(GC)-rps13	4811136	955703	123026
rpl32-PpLuc(GC)-rpl11	4405071	1231676	252711
rpl32-PpLuc(GC)-rpl38	5485224	1023424	170059

SEQUENCE LISTING <110> CureVac GmbH <120> Artificial nucleic acid molecules <130> IMP162737DE <160> 206 <170> PatentIn version 3.5 <210> 1 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9) <400> 1 gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60 agcgctttac 70 <210> 2 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9) <400> 2 guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60 agcgcuuuac 70 <210> 3 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9) + poly A <400> 3 gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60 agcgctttac agatctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa 140 <210> 4 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9) + poly A <400> 4 guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60 agcgcuuuac agaucuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa 140 <210> 5 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> A particular preferred histone stem-loop sequence <400> 5 caaaggctct tttcagagcc acca 24 <210> 6 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> 5-UTR of human ribosomal protein Large 32 lacking the 5 terminal oligopyrimidine tract <400> 6 ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42 <210> 7 <211> 1918 <212> DNA <213> Artificial Sequence <220> <223> rpl32 PpLuc(GC) rps9 A64 C30 histoneSL <400> 7 ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60 gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120 ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180 accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240 ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300 gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360 gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420 ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480 ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540 tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600 ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660 ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720 cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780 ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840 gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900 cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960 aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020 gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080 accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140 ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200 ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260 aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320 atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380 aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440 aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500 gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560 gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620 ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680 aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740 gattgtctcg ttttcctgcc aaataaacag gatcagcgct ttacagatct aaaaaaaaaa 1800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc 1860 cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918 <210> 8 <211> 1848 <212> DNA <213> Artificial Sequence <220> <223> rpl32 PpLuc(GC) A64 C30 histoneSL <400> 8 ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60 gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120 ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180 accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240 ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300 gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360 gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420 ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480 ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540 tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600 ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660 ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720 cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780 ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840 gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900 cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960 aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020 gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080 accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140 ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200 ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260 aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320 atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380 aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440 aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500 gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560 gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620 ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680 aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800 cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848 <210> 9 <211> 1914 <212> DNA <213> Artificial Sequence <220> <223> rpl32 PpLuc(GC) ag A64 C30 histoneSL <400> 9 ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60 gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120 ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180 accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240 ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300 gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360 gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420 ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480 ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540 tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600 ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660 ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720 cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780 ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840 gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900 cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960 aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020 gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080 accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140 ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200 ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260 aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320 atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380 aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440 aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500 gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560 gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620 ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680 aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740 tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tgcatccccc 1860 cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914 <210> 10 <211> 109 <212> DNA <213> Homo sapiens <400> 10 gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60 gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109 <210> 11 <211> 57 <212> DNA <213> Homo sapiens <400> 11 tgccaggaac agattttgca gttggtgggg tctcaataaa agttattttc cactgac 57 <210> 12 <211> 91 <212> DNA <213> Homo sapiens <400> 12 actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60 agacctgatt atacaggcag tgagaaacat g 91 <210> 13 <211> 58 <212> DNA <213> Homo sapiens <400> 13 acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58 <210> 14 <211> 33 <212> DNA <213> Homo sapiens <400> 14 atgtcttaag aacctaatta aatagctgac tac 33 <210> 15 <211> 67 <212> DNA <213> Homo sapiens <400> 15 ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60 ttgaaat 67 <210> 16 <211> 59 <212> DNA <213> Homo sapiens <400> 16 atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59 <210> 17 <211> 50 <212> DNA <213> Homo sapiens <400> 17 attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50 <210> 18 <211> 46 <212> DNA <213> Homo sapiens <400> 18 gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46 <210> 19 <211> 3787 <212> DNA <213> Homo sapiens <400> 19 agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60 cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120 tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180 gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240 gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300 gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360 acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420 tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480 agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540 aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600 cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660 aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720 aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780 tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840 agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900 cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960 atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020 ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080 aaccccagag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140 cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200 tacctctgct gctgcactca cagccacact tgatacacga tgacaccttg cttgtttgga 1260 aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320 tgtatatgtt aacttcgtga tcagtttgta tgtttgggac tcttgtccta tgtaaagtta 1380 aggtgggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440 ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500 cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560 agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620 ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680 gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740 tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800 cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860 ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920 tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980 ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040 catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100 gcttaatcta ttaagagccc taacaggaga ggatgggctt tctctgttgt ctggggccct 2160 gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220 gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280 cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340 aggcttctgc aggatagctg gggggctggg caggtgggtg aggcagcctc cctgctgaca 2400 ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460 aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520 ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580 gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640 gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccgggctgga accagccctc 2700 tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtgggtca 2760 ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820 tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880 gacctgtgtg ccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940 gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000 gcccccgggg agcacgggct ggctctgtgg tgcccgtggc cttttgtaga agcgttggtt 3060 ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120 ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180 caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240 tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300 tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360 cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420 tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480 gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540 gagcccagga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600 gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660 ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720 agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780 atcattt 3787 <210> 20 <211> 63 <212> DNA <213> Homo sapiens <400> 20 ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60 tgc 63 <210> 21 <211> 45 <212> DNA <213> Homo sapiens <400> 21 ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45 <210> 22 <211> 61 <212> DNA <213> Homo sapiens <400> 22 gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60 c 61 <210> 23 <211> 79 <212> DNA <213> Homo sapiens <400> 23 aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60 aaaacaagcc ttaatctgc 79 <210> 24 <211> 38 <212> DNA <213> Homo sapiens <400> 24 taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38 <210> 25 <211> 1651 <212> DNA <213> Homo sapiens <400> 25 atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60 tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120 gggcttccct tggttcgcca ctcatttatt tgtaacttga cttctttttt tttctgctta 180 aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240 cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300 ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360 atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420 aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480 caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540 ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600 ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660 ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720 tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780 cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggaggtggg 840 aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900 gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960 caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020 caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080 aaagagcttg cctacagatg gtttccacac ttgaaattgt gccctgcgag ttgcatagct 1140 ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200 agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260 ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320 agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380 catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440 cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500 tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560 tcactggttt tctatgtctt tttgaactct tgtaatcgag ttttgatcat attttctatt 1620 aaagtggcta acacctggct actcttactg t 1651 <210> 26 <211> 474 <212> DNA <213> Homo sapiens <400> 26 actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60 gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120 cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180 tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240 agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300 ggctgtgtat gaaaccaatg cccagggttt gaagggtgtt agcatccatt tcaggggagt 360 gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420 cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474 <210> 27 <211> 36 <212> DNA <213> Homo sapiens <400> 27 attcagcatt aaaataaatg taattaaaag gaaaag 36 <210> 28 <211> 45 <212> DNA <213> Homo sapiens <400> 28 actggcagat tagattttta aataaagatt ggattataac tctag 45 <210> 29 <211> 48 <212> DNA <213> Homo sapiens <400> 29 agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48 <210> 30 <211> 32 <212> DNA <213> Homo sapiens <400> 30 atgctttgtt ttgatcatta aaaattataa ag 32 <210> 31 <211> 90 <212> DNA <213> Homo sapiens <400> 31 accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60 aaatttgctt gttttaaaaa cattgtatct 90 <210> 32 <211> 4065 <212> DNA <213> Homo sapiens <400> 32 agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60 gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120 gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180 cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240 ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300 ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360 cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420 cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480 agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540 cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600 tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660 gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720 gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780 tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840 aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900 atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960 aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020 atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080 cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140 gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200 atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260 gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320 caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380 taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440 aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500 gagaatctcc aggaggcgga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560 gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620 gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680 agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740 agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800 ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860 cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920 cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980 cccggctaat tttttgcatt tttagtagag acagggtttc accgtgttag ccaggatggt 2040 ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100 accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160 ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220 gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280 tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340 ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400 cgggacttgg agactgaatt gtagtgggcc gaccacaaaa tgataaggca tggaaggaag 2460 tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520 taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580 tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640 gaaaatagtt ttgagcccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700 aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760 ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820 tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880 atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940 gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000 gagcagacag cccacggacg gactgcaagt cggaagcgcg ggcggaagct gtgcagcgcc 3060 cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120 tcacaacaca gaccggacct tgggtcttac cccggcacct gagaaccact tccggtgagt 3180 agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240 gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300 gataactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360 gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420 tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480 tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540 agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600 ggaggttagg gaaatgagca cgaagtatgt tttggtgcag ttttttgttc aacccaatgc 3660 gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720 actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780 ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840 catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900 aaatttaatt cctggctcta ttttacatcc caatttttat tttcctctca ttcccacttt 3960 acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020 tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065 <210> 33 <211> 3865 <212> DNA <213> Homo sapiens <400> 33 gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60 gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120 cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180 tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240 ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300 ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360 tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420 cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480 gctgggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540 tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600 gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660 cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720 gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780 cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840 accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900 ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960 gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020 ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080 tgcagtgagc ccatgagccc caccactaca ctccagcctg gaagacacca tgacacacag 1140 tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200 ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260 atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320 tgactgagag taaggggact gtcagggcct cgacttgcca ttggttgggg tcgtacgggg 1380 ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440 agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500 attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560 ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620 cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680 ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740 gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800 cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860 gtttatctgt ctcatgtttg tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc 1920 atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980 agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040 tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100 gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160 gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220 tcaaattacc cacctgcctc agcctcccaa agtgctggca ttacaggcgc tcgaggcttt 2280 ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340 aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400 tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460 ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520 ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagagggct ggagggaggg 2580 agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640 catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700 agctttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760 aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820 aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880 tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940 acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcagggc 3000 taatggttca cggaagccag gaatcaaact gcctgggttc cagtcccagc tctgccagtt 3060 atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120 tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180 actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240 ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300 agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360 agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420 tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480 attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540 tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600 atgactaatt tgtacacaaa ctaatgctcg tgtttcccaa gcacctggaa gacatgccag 3660 atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720 gctttcccag cctcctgccc gtgtttgtga atatcattct gtcctcagct gcatttccag 3780 cccaggctgt ttggcgctgc ccaggaatgg tatcaattcc cctgtttctc ttgtagccag 3840 ttactagaat aaaatcatct acttt 3865 <210> 34 <211> 288 <212> DNA <213> Homo sapiens <400> 34 ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60 gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120 gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180 cggtggttgt tgagagttaa ggcacggggt tgatgttttc agatgaaatt ctcaaagcaa 240 gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288 <210> 35 <211> 430 <212> DNA <213> Homo sapiens <400> 35 gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60 agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120 agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180 cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240 tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatgggcct ggggttcctg 300 ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360 aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattggg 420 ctatgagtgt 430 <210> 36 <211> 120 <212> DNA <213> Homo sapiens <400> 36 atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60 taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120 <210> 37 <211> 655 <212> DNA <213> Homo sapiens <400> 37 agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60 tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120 cagagggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180 cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240 attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300 taactagtat gtctgtccca cctttaaaaa gtttttcatt atgaaagtaa gtatttgtta 360 gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420 gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480 ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540 tatcttaatt tccactgaac ttgatttaaa ttcagagtta cacagtatga atatcacaat 600 cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655 <210> 38 <211> 331 <212> DNA <213> Homo sapiens <400> 38 agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60 gctaggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120 gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180 cccgtctaca aaaggttttt agagttgaaa tatgaaatgt gatgtgggta tggaaattga 240 ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300 tcagatcaaa taaagttata aaattgcctt c 331 <210> 39 <211> 1152 <212> DNA <213> Homo sapiens <400> 39 gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60 ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120 ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180 tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240 gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300 cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360 aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420 atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480 gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540 ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600 tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660 tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720 cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780 cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840 tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900 tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960 ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020 cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080 agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140 aactggtcct tc 1152 <210> 40 <211> 75 <212> DNA <213> Homo sapiens <400> 40 actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60 aaaacttact acctt 75 <210> 41 <211> 1176 <212> DNA <213> Homo sapiens <400> 41 gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60 tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120 actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180 ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240 gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300 ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360 caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420 tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480 gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540 ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600 ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660 caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720 ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780 cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840 aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900 atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960 taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020 cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080 tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140 aaccctgctg attaaatctc tcttgggctt cctccc 1176 <210> 42 <211> 59 <212> DNA <213> Homo sapiens <400> 42 acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59 <210> 43 <211> 49 <212> DNA <213> Homo sapiens <400> 43 accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49 <210> 44 <211> 178 <212> DNA <213> Homo sapiens <400> 44 ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60 atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120 tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178 <210> 45 <211> 73 <212> DNA <213> Homo sapiens <400> 45 tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60 ttctttaaaa agt 73 <210> 46 <211> 38 <212> DNA <213> Homo sapiens <400> 46 acctctttta taacatgttc aataaaaagc tgaacttt 38 <210> 47 <211> 40 <212> DNA <213> Homo sapiens <400> 47 attcctgctc ccctgcaaat aaagcctttt tacacatctc 40 <210> 48 <211> 1301 <212> DNA <213> Homo sapiens <400> 48 cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60 aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120 tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180 gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240 aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300 tttagaagag ggatatgttt gagtttttcc tatgcataag gcgatccacg ttgcacatag 360 aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420 tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480 cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540 tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600 gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660 agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720 ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780 atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840 ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900 tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960 cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020 ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080 tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttgggt caaaaataat 1140 caaaaaggat ggttgtgtgt gtattgaaca tgtagactta tttttcttat tttcaaaata 1200 ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260 acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301 <210> 49 <211> 576 <212> DNA <213> Homo sapiens <400> 49 cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60 ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120 gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180 agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240 ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300 cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360 tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420 gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480 aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540 cttcagaact gtgagaaata aatttctgtt gtctat 576 <210> 50 <211> 57 <212> DNA <213> Homo sapiens <400> 50 agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57 <210> 51 <211> 1324 <212> DNA <213> Homo sapiens <400> 51 agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60 tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120 ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180 agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240 ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300 tgtctgtgaa tccttctagc tatatctctt taagtgaaag agtgttaagt actcagtaaa 360 tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420 tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctgggtt caagcagttc 480 ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540 ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600 ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660 ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttcccctact 720 tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780 gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840 ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900 aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960 aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020 atacagttag ctaagagggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080 ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140 aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200 taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260 cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320 atag 1324 <210> 52 <211> 68 <212> DNA <213> Homo sapiens <400> 52 aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60 taatagca 68 <210> 53 <211> 60 <212> DNA <213> Homo sapiens <400> 53 attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60 <210> 54 <211> 53 <212> DNA <213> Homo sapiens <400> 54 ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53 <210> 55 <211> 37 <212> DNA <213> Homo sapiens <400> 55 gattttttga gtaacaaata aataagatca gactctg 37 <210> 56 <211> 36 <212> DNA <213> Homo sapiens <400> 56 acaaaaatga ctaaataaaa agtatatatt cacagt 36 <210> 57 <211> 55 <212> DNA <213> Homo sapiens <400> 57 atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55 <210> 58 <211> 70 <212> DNA <213> Homo sapiens <400> 58 gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60 agcgctttac 70 <210> 59 <211> 50 <212> DNA <213> Homo sapiens <400> 59 aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50 <210> 60 <211> 77 <212> DNA <213> Homo sapiens <400> 60 ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60 acttgggatc ttccgcg 77 <210> 61 <211> 21 <212> DNA <213> Homo sapiens <400> 61 agaaataaat ctttggctca c 21 <210> 62 <211> 41 <212> DNA <213> Homo sapiens <400> 62 atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41 <210> 63 <211> 31 <212> DNA <213> Homo sapiens <400> 63 tggctcagct aataaaggcg cacatgactc c 31 <210> 64 <211> 53 <212> DNA <213> Homo sapiens <400> 64 ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53 <210> 65 <211> 64 <212> DNA <213> Homo sapiens <400> 65 gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60 caag 64 <210> 66 <211> 37 <212> DNA <213> Homo sapiens <400> 66 aacaaaccat gctgggttaa taaattgcct cattcgt 37 <210> 67 <211> 386 <212> DNA <213> Homo sapiens <400> 67 ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60 agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120 gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgattt 180 ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240 gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300 tgactttctt atccagcact tgtattgatt atttttcatt ttgataatgt tgggttttta 360 aaaactcctt tatgatggaa aatttc 386 <210> 68 <211> 281 <212> DNA <213> Homo sapiens <400> 68 gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60 actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120 tatgggtatc ttagagtggt ctatcctgtt ttcgttgtcg tttgagtcat ttgaaaactg 180 gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240 taactttggc atactctaga taaattctga ttggtatggg g 281 <210> 69 <211> 53 <212> DNA <213> Homo sapiens <400> 69 ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53 <210> 70 <211> 2785 <212> DNA <213> Homo sapiens <400> 70 atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60 tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120 ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180 ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240 ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300 aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360 ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420 ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480 ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540 gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600 gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660 tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720 gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780 gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840 gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900 gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960 ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020 gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080 tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140 ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200 tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260 tagtctctcc ctccgcaagg gcggaaaggc tgcctgttgg tttgtaccag tgtttcctaa 1320 cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380 atgagcctta actgacccaa tcctttgtga tgcgggagag attgctaggc ctcgctcacc 1440 tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500 cgcggggtgg gcagctctcc ccgggcggtg gggcccttgt gaccgcgagg cggggcgcac 1560 caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620 gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcacccagga 1680 cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740 aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800 tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860 tgtatccatg gaggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920 tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980 caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040 tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100 aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160 aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220 ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280 cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340 cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400 attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460 cagcccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520 aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580 attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640 agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700 agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760 ccagctgaat aaagcccttc cttct 2785 <210> 71 <211> 48 <212> DNA <213> Homo sapiens <400> 71 ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48 <210> 72 <211> 67 <212> DNA <213> Homo sapiens <400> 72 ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60 tgtactt 67 <210> 73 <211> 62 <212> DNA <213> Homo sapiens <400> 73 aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60 tg 62 <210> 74 <211> 276 <212> DNA <213> Homo sapiens <400> 74 ctgtatgagt taataaaaga catgaactaa catttattgt tgggttttat tgcagtaaaa 60 agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120 tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180 aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240 cagaagttat atttaatgta agttgtctaa atataa 276 <210> 75 <211> 139 <212> DNA <213> Homo sapiens <400> 75 gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60 tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac tgagatgctc ctttaaataa 120 agcgtttgtg tttcaagtt 139 <210> 76 <211> 94 <212> DNA <213> Homo sapiens <400> 76 atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60 ttgtatataa aataaacatt tgaaaaaacc cttc 94 <210> 77 <211> 1355 <212> DNA <213> Homo sapiens <400> 77 tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60 acaggtgtta tttgtctgtt aaaactagtc tgcagatgtt tcttgaatgc tttgtcaaat 120 taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180 ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240 aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300 ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360 gctctgctgg tttattttca agtggctgcg ttttttttag tttggcaggt gtagactttt 420 taagttgggc tttagaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480 ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540 tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600 tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660 tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720 cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780 ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840 tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900 ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960 ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020 ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080 aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140 ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200 atttccagga agtactcata gcaagttcat aaaagttctt gagacctaaa tttcttcaca 1260 aaaaaagaaa agatcttaag tcatacattt taattgtgta gaggttgttc aactgaagga 1320 ataaatgtct attaaactaa aacaaatgga ccttc 1355 <210> 78 <211> 2017 <212> DNA <213> Homo sapiens <400> 78 gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60 agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120 aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180 tgagccacca cccccagccc aatttttatt ttttgtacag acaggatctc actatgttgc 240 ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300 aattatagga atgagccacc acaccgggcc caaatttact ttagtaataa caacaattgg 360 ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420 ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480 aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540 tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600 aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660 cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720 gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780 gcacgatctc agctcactgc aacccgggtt caagcgattc tcctgcctca gcctcccgag 840 tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900 cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960 ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020 ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080 aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140 ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200 cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260 tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320 gtttcaccat gttgttcagg ctggtctcaa agtcctgggc tcaagcaatc ttcctgtctc 1380 tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440 ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500 tatgtatctc agagcttatt ctttatcagc tcatgaggaa cttcattttt tttttttttt 1560 ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620 cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680 attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740 accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800 cccaaagtag tgggattaca ggcatgagca accgtgcccg gctggaactt cattcttttg 1860 gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920 ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980 acatctttat tcatctgtag aataaattct tagaagt 2017 <210> 79 <211> 37 <212> DNA <213> Homo sapiens <400> 79 ggtttttata caagaaaaat aaagtgaatt aagcgtg 37 <210> 80 <211> 140 <212> DNA <213> Homo sapiens <400> 80 gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60 tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120 aaacattaaa taatcagttc 140 <210> 81 <211> 55 <212> DNA <213> Homo sapiens <400> 81 acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55 <210> 82 <211> 1485 <212> DNA <213> Homo sapiens <400> 82 gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60 ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa cctttgggtc 120 attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180 ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240 cctccccagg tcctaggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300 tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360 cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420 gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480 gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540 caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600 acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660 gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720 cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780 tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840 gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900 ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960 tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020 acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080 aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140 acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200 ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260 ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320 tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380 gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440 gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485 <210> 83 <211> 31 <212> DNA <213> Homo sapiens <400> 83 ggcacatttg aataaattct attaccagtt c 31 <210> 84 <211> 39 <212> DNA <213> Homo sapiens <400> 84 ggggcgcatt gtcaataaag cacagctggc tgagactgc 39 <210> 85 <211> 486 <212> DNA <213> Homo sapiens <400> 85 gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60 aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120 aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180 gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240 tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300 ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360 gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420 ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480 gctttt 486 <210> 86 <211> 44 <212> DNA <213> Homo sapiens <400> 86 gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44 <210> 87 <211> 406 <212> DNA <213> Homo sapiens <400> 87 gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60 ctgttcatct tttgggaggg aataagctag agccatcaat acaattccgc ttgtggggaa 120 atttatgcct cttactggta ctacttgttt tgcattgaag ctgactggtt gagttcacat 180 catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240 tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300 agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360 tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406 <210> 88 <211> 1994 <212> DNA <213> Homo sapiens <400> 88 ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60 agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120 ctcatgtctg actagtccac aatactgcac tatttcagtg tttacgattt tttatccttt 180 cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240 agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300 cgcttgttgg ttgcactaag aattgttctg ttgtttctca tcacagaaat ctgcagtcaa 360 ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420 gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480 gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540 cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600 gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660 tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720 tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780 attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840 gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900 agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960 taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020 ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080 accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140 agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200 agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260 aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320 aaaaagaatg agatccagtc atttacaaca acatgggtgg aactggagat cgttatgtta 1380 agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440 aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500 ggtggcggga ggtggggatg gttaatgggt acaaaaagaa aaaagaatga attagaccaa 1560 ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620 cttagagtgt aattggattg tttgtacctc aaagaaaaaa tgcaataaaa ctttacagtg 1680 gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740 tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800 ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860 accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920 ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980 aaaaaggaca ttag 1994 <210> 89 <211> 307 <212> DNA <213> Homo sapiens <400> 89 accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60 gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120 tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180 aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240 ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300 ttaaatc 307 <210> 90 <211> 38 <212> DNA <213> Homo sapiens <400> 90 gtctgtaggc cttgtctgtt aataaatagt ttatatac 38 <210> 91 <211> 133 <212> DNA <213> Homo sapiens <400> 91 agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60 tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120 gtctggttgt ttg 133 <210> 92 <211> 1802 <212> DNA <213> Homo sapiens <400> 92 tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60 tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120 tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct ccccacgccc 180 ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240 accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300 attttcttgt ttattggtat tttcccacta gaaatgaagc tgcgtgaagt tagagatttt 360 tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420 cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480 acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540 gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600 ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660 tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720 agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780 tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840 caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900 cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960 tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020 atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080 agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140 ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200 gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260 cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320 atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380 ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440 gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500 ctggccaaag tggttgattg aggctgggtg caagcagagt tgtgagaagg ctcccatttg 1560 gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620 tgctgcagac attttgctac cacaagtgaa gccaccctga cgacacagtt gacaatttgg 1680 agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740 aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800 gt 1802 <210> 93 <211> 34 <212> DNA <213> Homo sapiens <400> 93 tgctgagggc ctcaataaag tttgtgttta tgcc 34 <210> 94 <211> 502 <212> DNA <213> Homo sapiens <400> 94 aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 60 tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120 ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180 cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240 catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300 caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360 cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420 gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480 aattaaaaat cttgcaaagg gg 502 <210> 95 <211> 502 <212> DNA <213> Homo sapiens <400> 95 aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 60 tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120 ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180 cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240 catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300 caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360 cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420 gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480 aattaaaaat cttgcaaagg gg 502 <210> 96 <211> 48 <212> DNA <213> Homo sapiens <400> 96 attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48 <210> 97 <211> 171 <212> DNA <213> Homo sapiens <400> 97 gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60 gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120 gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171 <210> 98 <211> 2309 <212> DNA <213> Homo sapiens <400> 98 ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60 aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120 gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180 acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240 ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300 gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360 gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420 gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480 ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540 tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600 tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660 gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720 cgagtagctg ggactacagg tgcccgccac aactcctggc taattttttg tatttttagt 780 agagacgggg tttcactggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840 tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900 actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960 tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020 cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080 caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140 caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200 aggtgggcaa atcataaggt caagagtttt ttagatgggg tgagcacaga ccaattcctg 1260 ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320 ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380 agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440 gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500 ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560 gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620 cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680 ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740 ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800 agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860 tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920 aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980 gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040 acttcctggg ccagtttggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100 cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160 ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220 cgcccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280 tcgcttcatt caataaacag ctgctgctc 2309 <210> 99 <211> 58 <212> DNA <213> Homo sapiens <400> 99 gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58 <210> 100 <211> 1502 <212> DNA <213> Homo sapiens <400> 100 gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60 ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120 tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180 cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240 gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300 acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360 ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420 tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480 tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540 tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600 tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660 agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720 gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780 tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840 cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900 attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960 atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020 ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080 atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140 attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200 aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260 tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320 tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380 gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440 tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500 gc 1502 <210> 101 <211> 48 <212> DNA <213> Homo sapiens <400> 101 attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48 <210> 102 <211> 193 <212> DNA <213> Homo sapiens <400> 102 ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60 atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120 tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180 agcttttgtt tcc 193 <210> 103 <211> 73 <212> DNA <213> Homo sapiens <400> 103 aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60 tctgtttact ggc 73 <210> 104 <211> 93 <212> DNA <213> Homo sapiens <400> 104 actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60 cgagggaaaa taaatacagt gatattctta cgc 93 <210> 105 <211> 257 <212> DNA <213> Homo sapiens <400> 105 gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60 ggccggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120 ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180 agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240 aatcgatctc tttgagc 257 <210> 106 <211> 692 <212> DNA <213> Homo sapiens <400> 106 tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60 attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120 acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180 cccctctttt tcttttttta aaatatattt gagtatgcca tacatttata tatatggtgt 240 atatgaattt ggtttaaaca ttttaaaatt tattctgatt agtttgtgtc tttttttttt 300 tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360 ctcactgcaa cctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420 ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480 aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540 tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600 aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660 ataattaaaa agaatagttt caaaaaaata ca 692 <210> 107 <211> 228 <212> DNA <213> Homo sapiens <400> 107 atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60 tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120 aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180 ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228 <210> 108 <211> 529 <212> DNA <213> Homo sapiens <400> 108 acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60 ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120 aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180 gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240 tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300 gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360 ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420 tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480 gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529 <210> 109 <211> 174 <212> DNA <213> Homo sapiens <400> 109 gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60 gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120 aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174 <210> 110 <211> 156 <212> DNA <213> Homo sapiens <400> 110 atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60 aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120 atcttatatc tgattagaaa ttagtatctg gaacat 156 <210> 111 <211> 46 <212> DNA <213> Homo sapiens <400> 111 aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46 <210> 112 <211> 67 <212> DNA <213> Homo sapiens <400> 112 ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60 tgtactt 67 <210> 113 <211> 294 <212> DNA <213> Homo sapiens <400> 113 ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60 atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120 ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180 gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240 tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294 <210> 114 <211> 171 <212> DNA <213> Homo sapiens <400> 114 tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60 ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120 aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171 <210> 115 <211> 49 <212> DNA <213> Homo sapiens <400> 115 gcccccttcc cctgccctct ccctgaaata aagaatagct tgacagaaa 49 <210> 116 <211> 88 <212> DNA <213> Mus musculus <400> 116 ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60 tttgggagaa taaaagactt atatattg 88 <210> 117 <211> 69 <212> DNA <213> Mus musculus <400> 117 ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60 ggttttccc 69 <210> 118 <211> 118 <212> DNA <213> Mus musculus <400> 118 actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60 acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118 <210> 119 <211> 1008 <212> DNA <213> Mus musculus <400> 119 agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60 tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120 aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180 ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240 aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300 gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360 ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420 caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480 agaagggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540 gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600 ttaggtgctt atgcctctta gtaaatagcc cttcatccca gaaggagcaa gaattgtctt 660 cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720 acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780 ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840 aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900 agctaaaagc cattccacag ttgactccat ctgaagttaa agtgtgtaag tacacagtaa 960 atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008 <210> 120 <211> 306 <212> DNA <213> Mus musculus <400> 120 attgttaacc taattaaaca gcttcatagg ttcttttggt gtcctttttg tgtgttgtgt 60 gtgcacatgt ttgttgggtg ggtgttttgc tggtgtcttt tcctctgtgt cttcctctgg 120 ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180 tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240 ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300 tactgg 306 <210> 121 <211> 63 <212> DNA <213> Mus musculus <400> 121 ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60 ttg 63 <210> 122 <211> 49 <212> DNA <213> Mus musculus <400> 122 atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49 <210> 123 <211> 39 <212> DNA <213> Mus musculus <400> 123 acttgatcca aaaagctaat aaaattttct cagaaatgc 39 <210> 124 <211> 47 <212> DNA <213> Mus musculus <400> 124 gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47 <210> 125 <211> 42 <212> DNA <213> Mus musculus <400> 125 ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42 <210> 126 <211> 556 <212> DNA <213> Mus musculus <400> 126 ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60 tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120 ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttagggg 180 ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240 gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300 aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360 tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420 caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480 ttagagcaaa ccatgcacat atggtaaatt atctttgggt tttgggtccc taaaataaag 540 tggtgtgttc attgtg 556 <210> 127 <211> 47 <212> DNA <213> Mus musculus <400> 127 ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47 <210> 128 <211> 693 <212> DNA <213> Mus musculus <400> 128 acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60 tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120 agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180 ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240 tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300 aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360 atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420 ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480 atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540 agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600 cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660 aatggcactt agaagataac atgtgaaagc cat 693 <210> 129 <211> 98 <212> DNA <213> Mus musculus <400> 129 agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60 aataaaacaa gcctttgtct gttgccctct tgtttagc 98 <210> 130 <211> 1077 <212> DNA <213> Mus musculus <400> 130 tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60 tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120 cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180 tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240 cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300 ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360 tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420 agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480 atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540 tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600 aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660 tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720 atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780 cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840 ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900 taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960 tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020 ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077 <210> 131 <211> 1658 <212> DNA <213> Mus musculus <400> 131 gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60 tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120 ttaactgggc tgctgctcct ttgtatatag acactttttt cctgctcaga aacttgagtt 180 ctccagtagc aatggccaaa cagaagaacc aggctagggg gctgcatctg acagagcaag 240 tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300 atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360 caggtgattt ctttgtgtga tttttctttt cccctgggac aatgacagtc agtaagacag 420 gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480 cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540 tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600 ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660 gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720 ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780 caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840 actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900 gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960 gtacctccag ggcactgggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020 aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080 cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140 aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200 tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260 tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320 gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380 cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440 cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500 ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560 aaacttgctg gtttttatgc ctttctaact cttgtatttg aatgaatgtt gatcactttt 1620 tgtattaaag tggctgacac atggctactg tcactgtg 1658 <210> 132 <211> 1795 <212> DNA <213> Mus musculus <400> 132 aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60 ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagaggagg 120 aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180 tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240 tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300 gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360 gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420 agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480 tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540 gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600 cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660 tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720 ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780 gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840 gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900 ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960 aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020 cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080 atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140 gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200 caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260 taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320 atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380 ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440 tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500 ctagcgtttc cttccaactt caggtgcagc ccccctcgtg gttagcggtc ttaagttcgt 1560 gacttgggtt tgcagatctt ttttgttaca tcgccggacc atgtggtggt ctttagctgt 1620 aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680 gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740 gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795 <210> 133 <211> 48 <212> DNA <213> Mus musculus <400> 133 actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48 <210> 134 <211> 140 <212> DNA <213> Mus musculus <400> 134 attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60 tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120 tcaaaaccac gtgaccatgt 140 <210> 135 <211> 46 <212> DNA <213> Mus musculus <400> 135 tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46 <210> 136 <211> 40 <212> DNA <213> Mus musculus <400> 136 agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40 <210> 137 <211> 109 <212> DNA <213> Mus musculus <400> 137 gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60 gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109 <210> 138 <211> 45 <212> DNA <213> Mus musculus <400> 138 acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45 <210> 139 <211> 640 <212> DNA <213> Mus musculus <400> 139 aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60 tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120 agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180 gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240 aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300 taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360 actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420 aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480 taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540 gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaagagtac 600 cttggagtaa ataaataaag cccaagatcc tgattgtcta 640 <210> 140 <211> 40 <212> DNA <213> Mus musculus <400> 140 gccccacacg cccgaagcaa taaagagtcc actgacttcc 40 <210> 141 <211> 124 <212> DNA <213> Mus musculus <400> 141 aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60 tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120 cttg 124 <210> 142 <211> 575 <212> DNA <213> Mus musculus <400> 142 cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60 tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120 tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180 attaggattg tggatttggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240 atagaatagg gtggccttga actcagaaat ccacctgcct tttcctccct agtattggca 300 attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360 aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420 gtcccaggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480 agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540 aacgattttt attaaaaacc ttgaggacaa acatt 575 <210> 143 <211> 54 <212> DNA <213> Mus musculus <400> 143 atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54 <210> 144 <211> 68 <212> DNA <213> Mus musculus <400> 144 actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60 gtcctaaa 68 <210> 145 <211> 504 <212> DNA <213> Mus musculus <400> 145 ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60 tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120 ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180 ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240 atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300 accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360 cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420 gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480 ttaaaactct taattcatct tact 504 <210> 146 <211> 306 <212> DNA <213> Mus musculus <400> 146 ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60 tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120 tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180 acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240 ttgaatttac agagatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300 actatg 306 <210> 147 <211> 246 <212> DNA <213> Mus musculus <400> 147 aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60 tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120 gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180 ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240 taagac 246 <210> 148 <211> 41 <212> DNA <213> Mus musculus <400> 148 accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41 <210> 149 <211> 181 <212> DNA <213> Mus musculus <400> 149 ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60 gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120 gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180 t 181 <210> 150 <211> 285 <212> DNA <213> Mus musculus <400> 150 tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60 ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120 aaaaccgcta ctgtttactt tgtgttggca tctttgtttc taaaattaaa gctcctagtg 180 tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240 gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285 <210> 151 <211> 40 <212> DNA <213> Mus musculus <400> 151 actgcttttg ttaagttggc taataaagag ctgaacctgt 40 <210> 152 <211> 42 <212> DNA <213> Mus musculus <400> 152 attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42 <210> 153 <211> 1059 <212> DNA <213> Mus musculus <400> 153 cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60 tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120 ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180 tcatgaagtt ggtgaccctg tgttgaacaa ttgagggtta gaagagcagt ttggttttgg 240 tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300 gctgtgtctc tggcctggag tagtctttct tgcttttttt tttttttttt tttttctcta 360 gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420 gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480 aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540 atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600 gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660 ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720 attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780 attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840 aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900 ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960 cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020 ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059 <210> 154 <211> 49 <212> DNA <213> Mus musculus <400> 154 aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49 <210> 155 <211> 87 <212> DNA <213> Mus musculus <400> 155 aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60 tgctagatta aacagcatgg tgaaact 87 <210> 156 <211> 100 <212> DNA <213> Mus musculus <400> 156 agtggactct gagggacatt gcggggaagg ggcgtttacg tttgtttata cttaaaagtt 60 ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100 <210> 157 <211> 45 <212> DNA <213> Mus musculus <400> 157 tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45 <210> 158 <211> 603 <212> DNA <213> Mus musculus <400> 158 gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60 gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120 agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180 aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240 attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300 ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360 ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420 cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480 ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540 ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600 agg 603 <210> 159 <211> 269 <212> DNA <213> Mus musculus <400> 159 agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60 cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120 cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180 tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240 ctttctttgt aaacaactgt ccacatttt 269 <210> 160 <211> 42 <212> DNA <213> Mus musculus <400> 160 gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42 <210> 161 <211> 69 <212> DNA <213> Mus musculus <400> 161 ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60 gatacttgg 69 <210> 162 <211> 36 <212> DNA <213> Mus musculus <400> 162 agttggagtt tatgttgtat tgaataaact ttaaag 36 <210> 163 <211> 47 <212> DNA <213> Mus musculus <400> 163 ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47 <210> 164 <211> 50 <212> DNA <213> Mus musculus <400> 164 ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaa 50 <210> 165 <211> 43 <212> DNA <213> Mus musculus <400> 165 atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43 <210> 166 <211> 34 <212> DNA <213> Mus musculus <400> 166 ccgaggccaa taaagactgg ttttggtccc tgga 34 <210> 167 <211> 3272 <212> DNA <213> Mus musculus <400> 167 acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60 ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120 gttttatgta gatattgaaa gcatgaccat tgtcttcact tcacctccag cttgggttgt 180 atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240 gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300 cctttcatca cccagacttg gtagacttac attctgtcac actgttggct cttaatctca 360 gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420 ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttgggttc gcaggttatt 480 ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540 atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600 ctggtttcac tgtccatggt tagtatctgg tgggtggaca cctggtggaa ccaagctgct 660 catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720 cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780 aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840 cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900 ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960 ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020 atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080 tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140 ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200 tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260 cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320 gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380 ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440 ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500 tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560 ggaagttaag cttgctcatt tgtagattag tggtcggtta cactgcaatt tagagtatca 1620 tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680 tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740 tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800 atgtgatgag tggtctttta aagattatct tttatttttt ttgagatggg gtttttctgt 1860 gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920 cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980 gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040 tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100 atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160 aatgaataga cttaccaaat tctgctgtct ccttggtaga tgtgaagttg ttggaagagt 2220 cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280 tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340 tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400 ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460 tatctggaga tccttgatta atttgaacaa gagctacctt gggttatgca gtttatgcct 2520 ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580 tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640 gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700 gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760 ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820 ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880 tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940 tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000 tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060 agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120 ccttgattga ggtcaagctg tcgagaaatg gttctcttta cagtggatcc agtcaggatt 3180 ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240 aatggcagta cattaaatgg gtttttcatt ta 3272 <210> 168 <211> 59 <212> DNA <213> Mus musculus <400> 168 gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59 <210> 169 <211> 35 <212> DNA <213> Mus musculus <400> 169 aacaaaggat gctgggttaa taaattgcct cattc 35 <210> 170 <211> 3167 <212> DNA <213> Mus musculus <400> 170 gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60 ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120 accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180 actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240 tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300 gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360 ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420 ttgcctctgc tcccagagta ctggaattaa aggcagggac cactgtatta gccattctga 480 gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540 gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600 ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660 ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720 ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780 tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840 gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900 catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960 cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020 ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080 ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140 ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200 acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260 tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320 acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380 tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440 tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500 atttcttaca tgaattgcac tttgtacatg cttttggata tgggcctagg cttttgcttt 1560 tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620 gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680 ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740 acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800 acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860 tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920 gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980 aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040 atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100 tcttcagtga cttaggatac taatagtatc tgcctcaaaa gtgtatgtgg ttatttttgt 2160 cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220 tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280 agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340 tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400 tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460 ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520 ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580 gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640 agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700 tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760 tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820 tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880 tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940 aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000 gaaagtagct cacagtgggt aaaagccatt tgttgccaat cctaacagcc tgagttcaat 3060 cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120 cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167 <210> 171 <211> 58 <212> DNA <213> Mus musculus <400> 171 gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58 <210> 172 <211> 49 <212> DNA <213> Mus musculus <400> 172 aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49 <210> 173 <211> 264 <212> DNA <213> Mus musculus <400> 173 acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60 gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120 tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180 tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240 cttagcaaga ctaatggtaa atct 264 <210> 174 <211> 71 <212> DNA <213> Mus musculus <400> 174 agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60 ctttacatgg c 71 <210> 175 <211> 56 <212> DNA <213> Mus musculus <400> 175 aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56 <210> 176 <211> 38 <212> DNA <213> Mus musculus <400> 176 ttgtgtatgc gttaataaaa agaaggaact cgtactta 38 <210> 177 <211> 92 <212> DNA <213> Mus musculus <400> 177 tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60 ataaagcatt tatattaatt cttgtctaga aa 92 <210> 178 <211> 91 <212> DNA <213> Mus musculus <400> 178 gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60 acacaaagaa taaaaatgtg aagaacttta a 91 <210> 179 <211> 1187 <212> DNA <213> Mus musculus <400> 179 tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60 aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120 aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180 gcattatctg cttatgagat taagtgtata tagtgtttgt gccaagtggt gttctgtgtg 240 taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300 tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360 gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420 caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480 atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540 gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600 ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660 gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720 gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780 agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840 ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900 aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960 gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020 ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080 ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140 agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187 <210> 180 <211> 43 <212> DNA <213> Mus musculus <400> 180 gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43 <210> 181 <211> 259 <212> DNA <213> Mus musculus <400> 181 ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60 gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120 cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180 ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240 gtggaattcc ttcattttg 259 <210> 182 <211> 48 <212> DNA <213> Mus musculus <400> 182 acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48 <210> 183 <211> 67 <212> DNA <213> Mus musculus <400> 183 aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60 ttcgctt 67 <210> 184 <211> 33 <212> DNA <213> Mus musculus <400> 184 gatgctccaa taaacctcac tgctgccact cag 33 <210> 185 <211> 36 <212> DNA <213> Mus musculus <400> 185 gatgacaacg acaataaagt gcgagactga ctggct 36 <210> 186 <211> 388 <212> DNA <213> Mus musculus <400> 186 acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60 gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120 agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180 ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240 attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300 agcactgcct tgctccttcc cagcagacca caaagcagta tttttctgga ggattttatg 360 tgctaataaa ttatttgact taagtgtg 388 <210> 187 <211> 32 <212> DNA <213> Mus musculus <400> 187 tgaaccctcc cccaataaaa gatggttcct ac 32 <210> 188 <211> 103 <212> DNA <213> Mus musculus <400> 188 gcagattttg ttatgaagac aataaaatct tgacctttca acccctttga ttgcagttgt 60 tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103 <210> 189 <211> 277 <212> DNA <213> Mus musculus <400> 189 gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60 caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120 tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180 tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240 ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277 <210> 190 <211> 44 <212> DNA <213> Mus musculus <400> 190 gtctctgggc ctttgctgtt aataaatagt ttatatacct atga 44 <210> 191 <211> 404 <212> DNA <213> Mus musculus <400> 191 aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60 tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120 ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180 caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240 agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300 ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360 attgattttt attgaacact gagtgttttg aggttttatt tttt 404 <210> 192 <211> 39 <212> DNA <213> Mus musculus <400> 192 agttcaggag ctaataaagt acgtcctttg gctaatccg 39 <210> 193 <211> 48 <212> DNA <213> Mus musculus <400> 193 atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48 <210> 194 <211> 36 <212> DNA <213> Mus musculus <400> 194 tctgttatgc catattttca ataaacctga aaacaa 36 <210> 195 <211> 875 <212> DNA <213> Mus musculus <400> 195 gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60 agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120 ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180 tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240 gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300 cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360 ccagattggg attttgtgtc ccaggaacaa agttaatgct aaaaagttaa tgccttggtg 420 agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480 cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540 gtgggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600 gaattcaagg acagtacctg gttaaatgtt tttctagctt ttctaaaaag tttgttaggc 660 ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720 ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780 aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840 agacattaaa ttgtgtcatt acttctccag gtact 875 <210> 196 <211> 67 <212> DNA <213> Mus musculus <400> 196 agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60 gagcagc 67 <210> 197 <211> 50 <212> DNA <213> Mus musculus <400> 197 gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50 <210> 198 <211> 84 <212> DNA <213> Mus musculus <400> 198 ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60 agaaaataaa agtcatttca ctct 84 <210> 199 <211> 36 <212> DNA <213> Mus musculus <400> 199 tctgttatgc catattttca ataaacctga aaacaa 36 <210> 200 <211> 446 <212> DNA <213> Mus musculus <400> 200 ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60 acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120 agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180 aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240 gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300 actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360 gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420 aaattagatt atttcttttt tcaatc 446 <210> 201 <211> 332 <212> DNA <213> Mus musculus <400> 201 ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60 tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120 cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180 ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240 actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300 ttatagagaa ttaaacatga aaattacatc tc 332 <210> 202 <211> 80 <212> DNA <213> Mus musculus <400> 202 aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60 aagttactgt taatgatacc 80 <210> 203 <211> 93 <212> DNA <213> Mus musculus <400> 203 gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60 gttcaataaa gtcctgaggc aactctctct gtc 93 <210> 204 <211> 152 <212> DNA <213> Mus musculus <400> 204 tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60 ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120 ttggtgtcag tttttcaata aagttttaat ta 152 <210> 205 <211> 1841 <212> DNA <213> Mus musculus <400> 205 agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60 tcaagtatct tcagagaaga ttattttctg ccttcagaaa ctgaaggaag gcttgggcct 120 agagaacgac agtaaggtgc gagcaccgga gacacttaac acagctcagt ccatggaagg 180 acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240 ccctgctcat cctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300 tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360 catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420 ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480 tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540 cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600 ctgaagttta atcacttgtc ttctattaaa aactagtgtt tgcctgggcc tggtgtgtat 660 acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720 caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780 taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840 gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900 ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960 gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020 gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080 gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140 actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200 tggaatttaa aacaagcttt tttctatata gtaaaagatt gtttttaaga tttttgcgtg 1260 tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320 atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380 ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg ccagccaggg 1440 ttacagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500 taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560 ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620 tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgagggggcc 1680 caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740 accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800 aagacagcta cagtgtactt acataaaata aataaatctt t 1841 <210> 206 <211> 2035 <212> DNA <213> Artificial Sequence <220> <223> sequence encoding the mRNA rpl32 - PpLuc(GC) - albumin - A64 - C30 - histoneSL <400> 206 ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60 gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120 ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180 accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240 ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300 gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360 gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420 ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480 ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540 tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600 ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660 ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720 cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780 ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840 gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900 cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960 aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020 gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080 accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140 ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200 ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260 aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320 atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380 aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440 aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500 gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560 gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620 ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680 aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740 taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800 tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860 cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980 cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035

Claims

a. 적어도 하나의 오픈 리딩 프레임(ORF); 및
b. 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소)
를 포함하는 인공 핵산 분자.
제1항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 상기 인공 핵산 분자로부터 단백질 생산을 증진, 안정 및/또는 연장시키는 것을 특징으로 하는 인공 핵산 분자.
제1항 또는 제2항에 있어서, 상기 3'-UTR은 ORF에 이종 기원(heterologous)인 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자, 또는 설치류 리보좀 단백질 유전자, 특히 쥣과 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리포터 유전자를 코딩하지 않거나 리포터 유전자로부터 유도되지 않으며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체로 이루어진 그룹으로부터 선택되지 않으며, 바람직하게 EGFP, 또는 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질에 적어도 70% 서열 상동성을 보이는 변이체가 아닌 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질을 코딩하지 않으며, 바람직하게 진핵생물 리보좀 단백질을 코딩하지 않는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 인간 또는 식물 리보좀 단백질, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 3'-UTR은 바이러스로부터 유도되지 않는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 3'-UTR, 바람직하게 인공 핵산 분자는 폴리(A) 서열 또는 폴리아데닐화 신호를 포함하지 않으며,
또는
상기 3'-UTR, 바람직하게 인공 핵산 분자는 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가로 포함하는 것을 특징으로 하는 인공 핵산 분자.
제10항에 있어서, 상기 폴리(A) 서열 또는 폴리아데닐화 신호는 3'-UTR 요소에 3'-말단에 위치한 것을 특징으로 하는 인공 핵산 분자.
제10항 또는 제11항에 있어서, 상기 폴리아데닐화 신호는 N=A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함하는 것을 특징으로 하는 인공 핵산 분자.
제10항 내지 제12항 중 어느 한 항에 있어서, 상기 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 3'UTR 요소의 3'-말단의 약 50개 미만의 뉴클레오티드 다운스트림에 위치한 것을 특징으로 하는 인공 핵산 분자.
제10항 내지 제13항 중 어느 한 항에 있어서, 상기 폴리(A) 서열은 약 20 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 50 내지 약 100개 아데닌 뉴클레오티드, 더욱 더 바람직하게 약 60 내지 약 70개 아데닌 뉴클레오티드의 길이를 갖는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제14항 중 어느 한 항에 있어서, 상기 핵산은 추가적인 5'-말단 요소, 바람직하게 5'-UTR, 프로모터, 또는 5'-UTR 및 프로모터 포함-서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
제15항에 있어서, 상기 5'-UTR은 5'-TOP UTR인 것을 특징으로 하는 인공 핵산 분자.
제15항 또는 제16항에 있어서, 상기 5'-UTR은 5'TOP 모티프를 포함하지 않는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 5'-UTR을 추가로 포함하며, 상기 3'-UTR, ORF 및 5'-UTR 모두는 서로 이종 기원인 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제18항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 리보좀 단백질　L9 (RPL9), 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L4 (RPL4), 리보좀 단백질　L5 (RPL5), 리보좀 단백질　L6 (RPL6), 리보좀 단백질　L7 (RPL7), 리보좀 단백질　L7a (RPL7A), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L12 (RPL12), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L18 (RPL18), 리보좀 단백질　L18a (RPL18A), 리보좀 단백질　L19 (RPL19), 리보좀 단백질　L21 (RPL21), 리보좀 단백질　L22 (RPL22), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L17 (RPL17), 리보좀 단백질　L24 (RPL24), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L30 (RPL30), 리보좀 단백질　L27a (RPL27A), 리보좀 단백질　L28 (RPL28), 리보좀 단백질　L29 (RPL29), 리보좀 단백질　L31 (RPL31), 리보좀 단백질　L32 (RPL32), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L37 (RPL37), 리보좀 단백질　L37a (RPL37A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　L39 (RPL39), 리보좀 단백질,　라지,　P0 (RPLP0), 리보좀 단백질,　라지,　P1 (RPLP1), 리보좀 단백질,　라지,　P2 (RPLP2), 리보좀 단백질　S3 (RPS3), 리보좀 단백질　S3A (RPS3A), X-연결된 리보좀 단백질　S4 (RPS4X), Y-연결된 1 리보좀 단백질　S4 (RPS4Y1), 리보좀 단백질　S5 (RPS5), 리보좀 단백질　S6 (RPS6), 리보좀 단백질　S7 (RPS7), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S10 (RPS10), 리보좀 단백질　S11 (RPS11), 리보좀 단백질　S12 (RPS12), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S15 (RPS15), 리보좀 단백질　S15a (RPS15A), 리보좀 단백질　S16 (RPS16), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S20 (RPS20), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S25 (RPS25), 리보좀 단백질　S26 (RPS26), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S27a (RPS27a), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L15 (RPL15), 리보좀 단백질　S2 (RPS2), 리보좀 단백질　L14 (RPL14), 리보좀 단백질　S14 (RPS14), 리보좀 단백질　L10 (RPL10), 리보좀 단백질　L10a (RPL10A), 리보좀 단백질　L35 (RPL35), 리보좀 단백질　L13a (RPL13A), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　L41 (RPL41), 리보좀 단백질　S18 (RPS18), 리보좀 단백질　S24 (RPS24), 리보좀 단백질　L8 (RPL8), 리보좀 단백질　L34 (RPL34), 리보좀 단백질　S17 (RPS17), 리보좀 단백질　SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자(pseudogene) (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로 이루어진 군으로부터 선택된 서열의 3'-UTR로부터 유도된 핵산 서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제19항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 또는 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성된 것을 특징으로 하는 인공 핵산 분자.
제20항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제21항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제22항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 5'-캡 구조, 폴리(C) 서열, 히스톤 스템-루프, 및/또는 IRES-모티프를 추가로 포함하는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제23항 중 어느 한 항에 있어서, 상기 히스톤 스템-루프는 SEQ ID NO: 5에 따른 서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제24항 중 어느 한 항에 있어서, 상기 인공 핵산 분자, 바람직하게 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되고, 바람직하게 상기 오픈 리딩 프레임의 G/C 함량은 야생형 오픈 리딩 프레임에 비해 증가된 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제25항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임은 코돈 최적화된 영역을 포함하며, 바람직하게, 상기 오픈 리딩 프레임은 코돈 최적화된 것을 특징으로 하는 인공 핵산 분자.
제1항 내지 제26항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 RNA, 바람직하게 mRNA 분자인 것을 특징으로 하는 인공 핵산 분자.
a. 오픈 리딩 프레임 및/또는 클로닝 부위; 및
b. 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소)
를 포함하는 벡터.
제28항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 벡터.
제28항 또는 제29항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리포터 유전자를 코딩하지 않거나 리포터 유전자로부터 유도되지 않으며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체로 이루어진 그룹으로부터 선택되지 않으며, 바람직하게 EGFP, 또는 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질에 적어도 70% 서열 상동성을 보이는 변이체가 아닌 것을 특징으로 하는 벡터.
제28항 내지 제30항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 벡터.
제28항 내지 제31항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 벡터.
제28항 내지 제32항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질 유전자를 코딩하지 않으며, 바람직하게 진핵생물 리보좀 단백질 유전자를 코딩하지 않는 것을 특징으로 하는 벡터.
제28항 내지 제33항 중 어느 한 항에 있어서, 상기 3'-UTR은 바이러스로부터 유도되지 않는 것을 특징으로 하는 벡터.
제28항 내지 제34항 중 어느 한 항에 있어서, 상기 벡터는 추가적인 5'-요소, 바람직하게 5'-UTR, 프로모터, 또는 5'-UTR 및 프로모터 포함-서열을 포함하는 것을 특징으로 하는 벡터.
제35항에 있어서, 상기 5'-UTR은 5'-TOP UTR인 것을 특징으로 하는 벡터.
제35항 또는 제36항에 있어서, 상기 5'-UTR은 5' TOP 모티프를 포함하지 않는 것을 특징으로 하는 벡터.
제28항 내지 제37항 중 어느 한 항에 있어서, 상기 3'-UTR은 ORF에 이종 기원인 것을 특징으로 하는 벡터.
제28항 내지 제38항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 5'-UTR을 추가로 포함하며, 상기 3'-UTR, ORF 및 5'-UTR 모두는 서로 이종 기원인 것을 특징으로 하는 벡터.
제28항 내지 제39항 중 어느 한 항에 있어서, 상기 3'-UTR, 바람직하게 벡터는 폴리(A) 서열 또는 폴리아데닐화 신호를 포함하지 않으며,
또는
상기 3'-UTR, 바람직하게 벡터는 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가로 포함하는 것을 특징으로 하는 벡터.
제40항에 있어서, 상기 폴리(A) 서열 또는 폴리아데닐화 신호는 3'-UTR 요소의 3'에 위치한 것을 특징으로 하는 벡터.
제40항 또는 제41항에 있어서, 상기 폴리아데닐화 신호는 N = A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함하는 것을 특징으로 하는 벡터.
제40항 내지 제42항 중 어느 한 항에 있어서, 상기 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 3'-UTR 요소의 3'-말단에 약 50개 미만의 뉴클레오티드 다운스트림에 위치한 것을 특징으로 하는 벡터.
제40항 내지 제43항 중 어느 한 항에 있어서, 상기 폴리(A) 서열은 약 20 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 50 내지 약 100개 아데닌 뉴클레오티드, 더욱 더 바람직하게 약 60 내지 약 70개 아데닌 뉴클레오티드의 길이를 갖는 것을 특징으로 하는 벡터.
제28항 내지 제44항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 리보좀 단백질　L9 (RPL9), 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L4 (RPL4), 리보좀 단백질　L5 (RPL5), 리보좀 단백질　L6 (RPL6), 리보좀 단백질　L7 (RPL7), 리보좀 단백질　L7a (RPL7A), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L12 (RPL12), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L18 (RPL18), 리보좀 단백질　L18a (RPL18A), 리보좀 단백질　L19 (RPL19), 리보좀 단백질　L21 (RPL21), 리보좀 단백질　L22 (RPL22), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L17 (RPL17), 리보좀 단백질　L24 (RPL24), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L30 (RPL30), 리보좀 단백질　L27a (RPL27A), 리보좀 단백질　L28 (RPL28), 리보좀 단백질　L29 (RPL29), 리보좀 단백질　L31 (RPL31), 리보좀 단백질　L32 (RPL32), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L37 (RPL37), 리보좀 단백질　L37a (RPL37A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　L39 (RPL39), 리보좀 단백질,　라지,　P0 (RPLP0), 리보좀 단백질,　라지,　P1 (RPLP1), 리보좀 단백질,　라지,　P2 (RPLP2), 리보좀 단백질　S3 (RPS3), 리보좀 단백질　S3A (RPS3A), X-연결된 리보좀 단백질　S4 (RPS4X), Y-연결된 1 리보좀 단백질　S4 (RPS4Y1), 리보좀 단백질　S5 (RPS5), 리보좀 단백질　S6 (RPS6), 리보좀 단백질　S7 (RPS7), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S10 (RPS10), 리보좀 단백질　S11 (RPS11), 리보좀 단백질　S12 (RPS12), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S15 (RPS15), 리보좀 단백질　S15a (RPS15A), 리보좀 단백질　S16 (RPS16), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S20 (RPS20), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S25 (RPS25), 리보좀 단백질　S26 (RPS26), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S27a (RPS27a), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L15 (RPL15), 리보좀 단백질　S2 (RPS2), 리보좀 단백질　L14 (RPL14), 리보좀 단백질　S14 (RPS14), 리보좀 단백질　L10 (RPL10), 리보좀 단백질　L10a (RPL10A), 리보좀 단백질　L35 (RPL35), 리보좀 단백질　L13a (RPL13A), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　L41 (RPL41), 리보좀 단백질　S18 (RPS18), 리보좀 단백질　S24 (RPS24), 리보좀 단백질　L8 (RPL8), 리보좀 단백질　L34 (RPL34), 리보좀 단백질　S17 (RPS17), 리보좀 단백질　SA (RPSA), 유비퀴틴A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된 (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자 (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로 이루어진 군으로부터 선택된 서열의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 벡터.
제28항 내지 제45항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 또는 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성된 것을 특징으로 하는 벡터.
제46항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 벡터.
제28항 내지 제47항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 벡터.
제28항 내지 제48항 중 어느 한 항에 있어서, 상기 벡터는 폴리(C) 서열, 히스톤 스템-루프, 및/또는 IRES-모티프를 추가로 포함하는 것을 특징으로 하는 벡터.
제28항 내지 제49항 중 어느 한 항에 있어서, 상기 벡터는 적어도 부분적으로 G/C 변형되고, 바람직하게 상기 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되며, 바람직하게 상기 오픈 리딩 프레임의 G/C 함량은 야생형 오픈 리딩 프레임에 비해 증가된 것을 특징으로 하는 벡터.
제28항 내지 제50항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임은 코돈 최적화된 영역을 포함하며, 바람직하게, 상기 오픈 리딩 프레임은 코돈 최적화된 것을 특징으로 하는 벡터.
제28항 내지 제51항 중 어느 한 항에 있어서, 상기 벡터는 DNA 벡터인 것을 특징으로 하는 벡터.
제28항 내지 제52항 중 어느 한 항에 있어서, 상기 벡터는 플라스미드 벡터 또는 바이러스 벡터, 바람직하게 플라스미드 벡터인 것을 특징으로 하는 벡터.
제28항 내지 제53항 중 어느 한 항에 있어서, 상기 벡터는 제1항 내지 제25항 중 어느 한 항에 따른 인공 핵산 분자를 포함하는 것을 특징으로 하는 벡터.
제28항 내지 제54항 중 어느 한 항에 있어서, 상기 벡터는 원형 분자인 것을 특징으로 하는 벡터.
제55항에 있어서, 코딩 가닥(strand)의 폴리(A) 서열, 폴리(C) 서열, 히스톤 스템 루프 또는 3'-UTR 요소는 선형 벡터 분자의 선형화를 위한 제한 부위에 의해 5'→3' 방향에 따르는 것을 특징으로 하는 벡터.
제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자 또는 제28항 내지 제56항 중 어느 한 항에 따른 벡터를 포함하는 세포.
제57항에 있어서, 상기 세포는 포유동물 세포인 것을 특징으로 하는 세포.
제57항 또는 제58항에 있어서, 상기 세포는 포유동물 개체의 세포, 바람직하게 포유동물 개체, 바람직하게 인간 개체의 분리된 세포인 것을 특징으로 하는 세포.
제1항 내지 제27항 중 어느 한 항에 따르는 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따르는 벡터, 또는 제57항 내지 제59항 중 어느 한 항에 따르는 세포를 포함하는 약학적 조성물.
제60항에 있어서, 상기 약학적 조성물은 하나 이상의 약학적으로 허용 가능한 담체, 희석제 및/또는 부형제 및/또는 하나 이상의 어쥬번트를 추가로 포함하는 것을 특징으로 하는 약학적 조성물.
제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 또는 제60항 또는 제61항에 따른 약학적 조성물의 약제(medicament)로서의 용도.
제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 또는 제60항 또는 제61항에 따른 약학적 조성물의 백신으로서 또는 유전자 치료를 위한 용도.
제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 또는 제60항 또는 제61항에 따른 약학적 조성물을 필요한 개체에 투여하는 단계를 포함하는 질환의 치료 또는 예방 방법.
제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자 또는 제28항 내지 제56항 중 어느 한 항에 따른 벡터와 함께 세포의 형질전환을 포함하는 장애(disorder)의 치료 또는 예방 방법.
제65항에 있어서, 상기 세포의 형질전환은 인비트로(in vitro)/엑스비보(ex vivo)로 수행되며, 형질전환된 세포는 필요한 개체, 바람직하게 인간 환자에 투여되는 것을 특징으로 하는 방법.
제66항에 있어서, 상기 인비트로(in vitro) 형질전환되는 세포는 개체, 바람직하게 인간 환자의 분리된 세포인 것을 특징으로 하는 방법.
제64항 내지 제67항 중 어느 한 항에 있어서, 상기 방법은 백신 접종 방법 또는 유전자 치료 방법인 것을 특징으로 하는 방법.
리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 3'-UTR 요소와 함께 핵산 분자, 바람직하게 mRNA 분자 또는 벡터를 회합(associating)하는 단계를 포함하는, 인공 핵산 분자, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증진, 안정 및/또는 연장시키는 방법.
리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되며, 핵산 분자, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증진, 안정 및/또는 연장시키기 위한 3'-UTR 요소의 용도.
제69항 또는 제70항에 있어서, 상기 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 제69항에 따른 방법 또는 제70항에 따른 용도.
제69항 내지 제71항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 리보좀 단백질　L9 (RPL9), 리보좀 단백질　L3 (RPL3), 리보좀 단백질　L4 (RPL4), 리보좀 단백질　L5 (RPL5), 리보좀 단백질　L6 (RPL6), 리보좀 단백질　L7 (RPL7), 리보좀 단백질　L7a (RPL7A), 리보좀 단백질　L11 (RPL11), 리보좀 단백질　L12 (RPL12), 리보좀 단백질　L13 (RPL13), 리보좀 단백질　L23 (RPL23), 리보좀 단백질　L18 (RPL18), 리보좀 단백질　L18a (RPL18A), 리보좀 단백질　L19 (RPL19), 리보좀 단백질　L21 (RPL21), 리보좀 단백질　L22 (RPL22), 리보좀 단백질　L23a (RPL23A), 리보좀 단백질　L17 (RPL17), 리보좀 단백질　L24 (RPL24), 리보좀 단백질　L26 (RPL26), 리보좀 단백질　L27 (RPL27), 리보좀 단백질　L30 (RPL30), 리보좀 단백질　L27a (RPL27A), 리보좀 단백질　L28 (RPL28), 리보좀 단백질　L29 (RPL29), 리보좀 단백질　L31 (RPL31), 리보좀 단백질　L32 (RPL32), 리보좀 단백질　L35a (RPL35A), 리보좀 단백질　L37 (RPL37), 리보좀 단백질　L37a (RPL37A), 리보좀 단백질　L38 (RPL38), 리보좀 단백질　L39 (RPL39), 리보좀 단백질,　라지,　P0 (RPLP0), 리보좀 단백질,　라지,　P1 (RPLP1), 리보좀 단백질,　라지,　P2 (RPLP2), 리보좀 단백질　S3 (RPS3), 리보좀 단백질　S3A (RPS3A), X-연결된 리보좀 단백질　S4 (RPS4X), Y-연결된 1 리보좀 단백질　S4 (RPS4Y1), 리보좀 단백질　S5 (RPS5), 리보좀 단백질　S6 (RPS6), 리보좀 단백질　S7 (RPS7), 리보좀 단백질　S8 (RPS8), 리보좀 단백질　S9 (RPS9), 리보좀 단백질　S10 (RPS10), 리보좀 단백질　S11 (RPS11), 리보좀 단백질　S12 (RPS12), 리보좀 단백질　S13 (RPS13), 리보좀 단백질　S15 (RPS15), 리보좀 단백질　S15a (RPS15A), 리보좀 단백질　S16 (RPS16), 리보좀 단백질　S19 (RPS19), 리보좀 단백질　S20 (RPS20), 리보좀 단백질　S21 (RPS21), 리보좀 단백질　S23 (RPS23), 리보좀 단백질　S25 (RPS25), 리보좀 단백질　S26 (RPS26), 리보좀 단백질　S27 (RPS27), 리보좀 단백질　S27a (RPS27a), 리보좀 단백질　S28 (RPS28), 리보좀 단백질　S29 (RPS29), 리보좀 단백질　L15 (RPL15), 리보좀 단백질　S2 (RPS2), 리보좀 단백질　L14 (RPL14), 리보좀 단백질　S14 (RPS14), 리보좀 단백질　L10 (RPL10), 리보좀 단백질　L10a (RPL10A), 리보좀 단백질　L35 (RPL35), 리보좀 단백질　L13a (RPL13A), 리보좀 단백질　L36 (RPL36), 리보좀 단백질　L36a (RPL36A), 리보좀 단백질　L41 (RPL41), 리보좀 단백질　S18 (RPS18), 리보좀 단백질　S24 (RPS24), 리보좀 단백질　L8 (RPL8), 리보좀 단백질　L34 (RPL34), 리보좀 단백질　S17 (RPS17), 리보좀 단백질　SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된 (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자 (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로 이루어진 군으로부터 선택된 서열의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 방법 또는 용도.
제69항 내지 제72항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 또는 상기 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성된 것을 특징으로 하는 방법 또는 용도.
제73항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 방법 또는 용도.
제69항 내지 제73항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 방법 또는 용도.
제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 및/또는 제60항 또는 제61항에 따른 약학적 조성물을 포함하는 키트 또는 일부(parts)의 키트.
제76항에 있어서, 상기 키트는 사용을 위한 지침(instructions), 형질전환을 위한 세포, 어쥬번트, 약학적 조성물의 투여를 위한 수단, 약학적으로 허용 가능한 담체 및/또는 인공 핵산 분자, 벡터, 세포 또는 약학적 조성물의 용해 또는 희석을 위한 약학적으로 허용 가능한 용액을 추가적으로 포함하는 것을 특징으로 하는 키트.