KR20160104062A - 인공 핵산 분자 - Google Patents
인공 핵산 분자 Download PDFInfo
- Publication number
- KR20160104062A KR20160104062A KR1020167020951A KR20167020951A KR20160104062A KR 20160104062 A KR20160104062 A KR 20160104062A KR 1020167020951 A KR1020167020951 A KR 1020167020951A KR 20167020951 A KR20167020951 A KR 20167020951A KR 20160104062 A KR20160104062 A KR 20160104062A
- Authority
- KR
- South Korea
- Prior art keywords
- ribosomal protein
- utr
- nucleic acid
- protein
- gene
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 적어도 하나의 오픈 리딩 프레임 및 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR) 요소를 포함하는 인공 핵산 분자에 관한 것이다. 나아가 본 발명은 유전자 치료 및/또는 유전자 백신 접종에 이러한 인공 핵산 분자의 용도에 관한 것이다. 게다가, 본 발명은 이러한 3'-UTR 요소를 포함하는 핵산 서열로부터 단백질 발현을 증진, 안정 및/또는 연장시키기 위한 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 3'-UTR 요소의 용도에 관한 것이다.
Description
본 발명은 오픈 리딩 프레임, 3'-비번역된 영역 요소(3'-UTR 요소) 및 선택적으로 폴리(A) 서열 및/또는 폴리아데닐화 신호를 포함하는 인공 핵산 분자에 관한 것이다. 또한 본 발명은 바람직하게 유전자 요법 및/또는 유전자 백신 접종(genetic vaccination)의 분야에 사용하기 위한, 3'-UTR 요소를 포함하는 벡터, 상기 인공 핵산 분자 또는 벡터를 포함하는 세포, 상기 인공 핵산 분자 또는 벡터를 포함하는 약학적 조성물 및 인공 핵산 분자, 벡터 및/또는 약학적 조성물을 포함하는 키트에 관한 것이다.
유전자 요법 및 유전자 백신 접종은 현대 의학의 가장 촉망되고 빠르게 발달하는 방법에 속한다. 이들은 많은 다양한 질병의 치료를 위해 매우 특이적이고 개별적인 선택 사항을 제공할 수 있다. 특히, 유전된 유전자 질병, 염증성 질병뿐만 아니라, 자가면역 질병, 암 또는 종양 관련 질병은 이러한 치료적 접근 방법의 대상이 될 수 있다. 또한, 이러한 접근 방법에 의해 상기 질병의 조기 발병을 예방하는 것이 예상된다.
유전자 치료 배후에 주요 개념의 이론적 근거는 특정한 질병의 병리학적 상태와 관련된 손상된 유전자의 적절한 조절이다. 병리학적으로 변형된 유전자 발현은 필수적인 유전자 산물, 예를 들어 호르몬, 하우스키핑 인자, 대사 효소 또는 구조 단백질 등과 같은 신호 인자의 부족 또는 과발현을 초래할 수 있다. 변형된 유전자 발현은 전사 및/또는 번역의 잘못된 조절에 의한 것뿐만 아니라, 특정한 단백질에 대한 ORF 코딩 내 변이에 의한 것일 수 있다. 병리학적인 변이는 예를 들어 염색체 이상에 의해, 또는 점 또는 프레임-쉬프트-돌연변이, 제한된 기능성을 초래, 및 잠재적으로 유전자 산물의 기능을 전부 상실하게 하는 이들 모두와 같은 보다 특이적인 변이에 의해 유발될 수 있다. 그러나, 만약 돌연변이가 세포의 전사 또는 번역 기관에 포함된 단백질을 코딩하는 유전자에 영향을 미친다면, 전사 또는 번역의 잘못된 조절이 또한 발생할 수 있다. 이러한 돌연변이는 보통 기능적인 유전자의 병리학적인 상향 또는 하향 조절을 일으킬 수 있다. 이러한 조절 기능을 수행하는 유전자 산물을 코딩하는 유전자는 예를 들어 전사 인자, 신호 수용체 또는 메신저 단백질 등일 수 있다. 그러나, 조절 단백질을 코딩하는 이러한 유전자의 기능의 상실은, 특정한 상황 하에, 손상된 유전자 산물의 보다 다운스트림(downstream)으로 활동하는 다른 요소의 인공적인 도입에 의해 역전될 수 있다. 이러한 유전자 결함은 또한 영향을 받은 유전자 자체의 치환을 통한 유전자 요법에 의해 보상될 수 있다.
유전자 백신 접종은 박테리아 표면, 바이러스 입자 또는 종양 항원 등과 같은 특유의 구성 요소와 같은 선택된 항원에 바람직한 면역 반응을 유발한다. 일반적으로, 백신 접종은 현대 의학의 중심적인 업적 가운데 하나이다. 그러나, 효과적인 백신 접종은 현재 제한된 수의 질병에 대해서만 가능하다. 따라서, 백신 접종에 의해 예방이 불가능한 감연은 여전히 매년 수백만명의 사람들에게 영향을 미친다.
일반적으로, 백신은 "제1", "제2" 및 "제3" 세대 백신으로 세분될 수 있다. "제1세대" 백신은 전형적으로 전체 유기체 백신이다. 이들은 생존하고 약화된 또는 사멸된 병원체, 예를 들어 바이러스 또는 박테리아 등에 기초한다. 생존 및 약화된 백신의 주요한 결점은 생명을 위협하는 변이체에 회귀(reversion)에 대한 위험이다. 따라서, 비록 약화되더라도, 이러한 병원체는 여전히 예상치 못한 위험을 본질적으로 가질 수 있다. 사멸된 병원체는 특이적 면역 반응을 발생시키는데 바람직할만큼 효과적이지 않을 수 있다. 이들 위험을 최소화하기 위해, "제2세대" 백신이 개발되었다. 이들은 전형적으로, 병원체로부터 유도된 정의된 항원 또는 재조합 단백질 구성 요소로 이루어진 서브유닛 백신이다.
유전자 백신, 즉 유전자 백신 접종을 위한 백신은 일반적으로 "제3세대" 백신으로 알려져 있다. 그들은 전형적으로 인비보(in vivo) 병원체 또는 종양 항원에 대한 펩타이드 또는 단백질(항원) 절편의 발현을 허용하는 유전적으로 조작된 핵산 분자로 구성된다. 유전자 백신은 표적 세포의 흡수 이후 환자에게 투여될 때 발현된다. 투여된 핵산의 발현은 코딩된 단백질의 생산을 초래한다. 이들 단백질이 환자의 면역계에 의해 외부 물질로 인식될 경우, 면역 반응이 촉발된다.
상기와 같이, 유전자 치료 및 유전자 백신 접종 모두 환자에 핵산 분자의 투여 및 이후 코딩된 유전자 정보의 전사 및/또는 번역에 필수적으로 기초한다. 그렇지 않으면, 유전자 백신 접종 또는 유전자 치료는 또한 치료되는 환자로부터 특정한 체세포의 분리, 이후 이러한 세포의 엑스비보(ex vivo) 형질전환, 및 환자에 처리된 세포의 재투여를 포함하는 방법을 포함할 수 있다.
DNA뿐만 아니라 RNA는 유전자 치료 또는 유전자 백신 접종의 맥락에서 투여를 위한 핵산 분자로 사용될 수 있다. DNA는 상대적으로 안정하고 다루기 쉬운 것으로 알려져 있다. 그러나, DNA의 사용은 잠재적으로 손상된 유전자의 기능의 상실과 같이 돌연변이 현상을 초래하는, 환자의 유전체로 투여된 DNA 절편의 바람직하지 않은 삽입의 위험을 갖는다. 또 다른 위험으로, 항-DNA 항체의 바람직하지 않은 발생이 나타났다. DNA는 생산되는 mRNA가 번역되기 전에 전사되기 위해 반드시 핵에 들어가야 하므로, 다른 결점은 DNA 투여로 성취되는 코딩된 펩타이드 또는 단백질의 제한된 발현 수준이다. 다른 이유들 가운데, 투여된 DNA의 발현 수준은 DNA 전사를 조절하는 특정한 전사 인자의 존재에 의존할 것이다. 이러한 요소들이 없다면, DNA 전사는 RNA의 충분한 양을 생산하지 않을 것이다. 결과적으로 번역된 펩타이드 또는 수득된 단백질의 수준은 제한된다.
유전자 치료 또는 유전자 백신 접종을 위한 DNA 대신 RNA를 사용함으로써, 바람직하지 않은 유전체 삽입 및 항-DNA 항체의 형성의 위험은 최소화 또는 회피된다. 그러나, RNA는 유비쿼터스(ubiquitous) RNAse에 의해 쉽게 분해될 수 있는 상당히 불안정한 분자 종으로 여겨진다.
인비보(in vivo), RNA 분해는 RNA 반감기의 조절에 기여한다. 상기 효과는 진핵세포 유전자 발현의 조절을 세밀하게 조정하는 것으로 여겨지고 증명되었다(Friedel et al., 2009. Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17): 1-12). 따라서, 각각의 자연 발생 mRNA는 mRNA가 유도된 유전자 및 이것이 발현되는 세포 타입에 의존하는 이의 개별적인 반감기를 갖는다. 이는 이러한 유전자의 발현 수준의 조절에 기여한다. 불안정한 RNAs는 특정한 시점에서 일시적인 유전자 발현을 깨닫는데 중요하다. 그러나, 오래 생존한 RNA는 특정한 단백질의 축적 또는 유전자의 지속적인 발현과 관련될 수 있다. 인비보(in vivo), mRNA의 반감기는 또한 예를 들어 인슐린 유사 성장 인자 I, 액틴 및 알부민 mRNA에서 나타나는 것처럼, 호르몬 치료와 같은 환경적인 요소에 의존할 수 있다(Johnson et al., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, pp. 5287-5291, 1991).
유전자 치료 및 유전자 백신 접종을 위해 보통 안정한 RNA가 바람직하다. 이는 반면, 생산물이 RNA 서열에 의해 코딩되는 것이 보통 바람직한 사실 문에, 인비보(in vivo) 축적된다. 반면, RNA는 적절한 투여 형태로 제조, 이의 저장 과정 및 투여될 때 이의 구조적 및 기능적인 온전성을 유지해야 한다. 따라서, 조기에 분해 또는 부식되는 것으로부터 예방하기 위하여, 유전자 치료 또는 유전자 백신 접종을 위해 적절한 RNA 분자를 제공하기 위한 노력이 있었다.
핵산 분자의 G/C-함량은 그들의 안정성에 영향을 미칠 수 있는 것으로 보고되었다. 따라서, 구아닌(G) 및/또는 시토신(C) 잔기의 증가된 양을 포함하는 핵산은 많은 양의 아데닌(A) 및 티민(T) 또는 우라실(U) 뉴클레오티드를 포함하는 핵산에 비해 기능적으로 보다 안정할 수 있다. 이러한 맥락에서, WO02/098443는 코딩 영역 내 서열 변형에 의해 안정되는 mRNA를 포함하는 약학적 조성물을 제공한다. 이러한 서열 변형은 유전자 코드의 퇴화의 장점을 가진다. 따라서, 뉴클레오티드(RNA 안정성의 관점에서 덜 바람직한)의 덜 바람직한 조합을 포함하는 코돈은 코딩된 아미노산 서열의 변형 없이 대체 코돈에 의해 치환될 수 있다. 이러한 RNA 안정화 방법은 바람직한 아미노산 서열의 공간을 남기지 않는, 각 단일 RNA 분자의 특정한 뉴클레오티드 서열의 제공에 의해 제한된다. 또한, 그러한 접근 방법은 RNA의 코딩 영역에 대하여 제한된다.
mRNA 안정화를 위한 대안적 선택으로서, 자연 발생 진핵 mRNA 분자는 특유의 안정화 요소를 포함하는 것으로 밝혀졌다. 예를 들어, 그들은 그들의 5'-말단(5'-UTR) 및/또는 그들의 3'-말단(3'-UTR)에 소위 비번역된 영역(UTR)뿐만 아니라 5'-캡 구조 또는 3'-폴리(A) 테일과 같은 다른 구조적인 특징을 포함할 수 있다. 5'-UTR 및 3'-UTR은 모두 전형적으로 유전체 DNA로부터 전사되며, 따라서 조숙 mRNA의 요소이다. 5'-캡 및 3'-폴리(A) 테일(소위 폴리(A)테일 또는 폴리(A) 서열)과 같은 성숙 mRNA의 특유한 구조적인 특징은 일반적으로 mRNA 가공 도중 전사된 (조숙) mRNA에 추가된다.
3'-폴리(A) 테일은 전형적으로 전사된 mRNA의 3'-말단에 첨가된 아데노신 뉴클레오티드의 단조로운(monotonous) 서열 스트레치이다. 이는 약 400개까지의 아데노신 뉴클레오티드를 포함할 수 있다. 이러한 3'-폴리(A) 테일의 길이는 각 mRNA의 안정성에 대하여 잠재적으로 중요한 요소인 것으로 밝혀졌다.
또한, 알파-글로빈 mRNA의 3'-UTR은 알파-글로빈 mRNA의 잘 알려진 안정성에 중요한 요소일 수 있는 것으로 나타났다(Rodgers et al., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, pp. 1526-1537, 2002). 알파-글로빈 mRNA의 3'-UTR은 이의 존재가 인비트로(in vitro)에 mRNA 안정성과 연관된, 특정한 리보뉴클레오단백질-복합체, 알파-콤플렉스의 형성에 명백하게 포함된다(Wang et al., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular biology, Vol 19, No. 7, July 1999, p. 4552-4560).
흥미로운 조절 기능은 리보좀 단백질 mRNA 내 UTR에 대하여 추가적으로 입증되었다: 반면 리보좀 단백질 mRNA의 5'-UTR은 mRNA의 성장과 관련된 번역을 조절하며, 그러한 조절의 엄격성은 리보좀 단백질 mRNA 내 각각의 3'-UTR에 의해 주어진다(Ledda et al., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, Vol. 344, 2005, p. 213-220). 이러한 메커니즘은 일정한 방식으로 전형적으로 전사되는 리보좀 단백질의 특정한 발현 패턴에 기여하며, 리보좀 단백질 S9 또는 리보좀 단백질 L32와 같은 일부 리보좀 단백질 mRNA는 하우스키핑 유전자로 고려된다(Janovick-Guretzky et al., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., Vol. 90, 2007, p. 2246-2252). 리보좀 단백질의 성장 관련된 발현 패턴은 따라서 주로 번역의 수준에 조절 때문이다.
mRNA 안정성에 영향을 주는 요소와 무관하게, 표적 세포 또는 조직에 의해 투여된 핵산 분자의 효과적인 번역은 유전자 치료 또는 유전자 백신 접종을 위한 핵산 분자를 사용하는 어느 접근 방법에 중요하다. 상기 언급된 실시예에서 볼 수 있듯이, 안정성의 조절에 따라 또한 주요 mRNA의 번역은 UTR, 5'-캡 및 3'-폴리(A) 테일과 같은 구조적 특징에 의해 조절된다. 이러한 맥락에서, 폴리(A) 테일의 길이는 전사 효율성을 위해서도 중요한 역할을 수행할 수 있는 것으로 보고되었다. 그러나, 3'-요소의 안정화는 또한 번역에 약화 효과를 가질 수 있다.
본 발명의 목적은 유전자 치료 및/또는 유전자 백신 접종에 적용하기에 적절할 수 있는, 핵산 분자를 제공하는 것이다. 특히, 본 발명의 목적은 번역 효율에 현저한 기능적 손실을 보이지 않는, 조기 분해 또는 붕괴(decay)에 대하여 안정한 mRNA 종을 제공하는 것이다. 또한, 본 발명의 목적은 상기 핵산 분자에 의해 코딩된 각각 단백질의 증가된 발현에 의해 특성화된, 인공 핵산 분자, 바람직하게 mRNA를 제공하는 것이다. 본 발명의 특정한 목적은 각 코딩된 단백질의 번역 효율이 향상된 mRNA를 제공하는 것이다. 본 발명의 다른 목적은 유전자 치료 및/또는 유전자 백신 접종에 잘 사용할 수 있는, 이러한 우수한 mRNA 종을 코딩하는 핵산 분자를 제공하는 것이다. 본 발명의 다른 목적은 유전자 치료 및/또는 유전자 백신 접종에 사용하기 위한 약학적 조성물을 제공하는 것이다. 요약하면, 본 발명의 목적은 비용 효율적이며, 간단한 방법에 의해 상기 개시된 선행 기술의 단점을 극복한 향상된 핵산 종을 제공하는 것이다.
본 발명의 기초가 되는 목적은 청구항의 대상에 의해 해결된다.
본 발명은 DARPA에 의해 수여된 협정 No. HR0011-11-3-0001에서 정부의 지원을 받아 완성되었다. 상기 정부는 본 발명에 특정한 권리를 갖는다.
명확성 및 가독성을 위해 하기 정의가 제공된다. 이들 정의에 대하여 개시된 어느 기술적 특징은 본 발명의 실시예 각각 및 모두에서 읽을 수 있다. 추가적인 정의 및 설명은 이들 실시예의 맥락에서 구체적으로 제공될 수 있다.
적응 면역 반응: 자가 면역 반응은 면역 시스템의 항원 특이적 반응으로 전형적으로 이해된다. 항원 특이성은 특이적 병원체 또는 병원체 감염된 세포에 맞춰진 반응의 발생을 허용한다. 이들 맞춰진 반응을 시작하는 능력은 “기억 세포”에 의해 체내에 보통 유지된다. 병원체가 인체를 한번 이상 감염해야 하고, 이들 특이적 기억 세포는 이를 빠르게 제거하는데 사용된다. 이러한 맥락에서, 적응 면역 반응의 첫번째 단계는 항원 제시 세포에 의한 항원 특이적 면역 반응을 유도할 수 있는 순수한 항원 특이적 T 세포 또는 다른 면역 세포의 활성화이다. 이는 순수한 T 세포가 지속적으로 지나는 림프 조직 및 기관 내에 발생한다. 항원 제시 세포로 제공될 수 있는 세가지 세포 타입은 수상돌기세포, 대식세포, 및 B 세포이다. 이들 세포의 각각은 면역 반응을 유도하는데 뚜렷한 기능을 갖는다. 수상 돌기세포는 그들이 성숙 수상돌기세포로 분화하는 곳에서 식균작용(phagocytosis) 및 대식세포작용(micropinocytosis)에 의해 항원을 흡수할 수 있고 예를 들어 국소 림프 조직에 외래 항원을 이동시킴과 함께 접촉에 의해 자극될 수 있다. 대식세포는 박테리아와 같은 입자 항원을 섭취하고 MHC 분자를 발현하는 감염성 항원 또는 다른 적절한 자극에 의해 유도된다. 그들의 수용체를 통해 용해성 단백질 항원을 결합 및 내재화(internalize)하는 B 세포의 특수한 능력은 T 세포를 유도하는데 또한 중요할 수 있다. MHC 분자는 전형적으로 T-세포에 항원의 존재에 책임을 진다. 그 안에, MHC 분자에 항원의 제시는 무장(armed) 주효 T 세포로 그들의 증식 및 분화를 유도하는 T 세포의 활성화를 유도한다. 주효 T 세포의 가장 중요한 기능은 함께 세포-매개 면역을 일으키는 CD8+ 세포독성 T 세포에 의한 감염된 세포의 사멸 및 Th1 세포에 의한 대식세포의 활성화, 및 그에 따라 체액성 면역 반응을 일으키는, 다른 종류의 항체를 생산하는 Th2 및 Th1 모두에 의한 B 세포의 활성화이다. T 세포는 항원을 직접적으로 인식 및 결합하지 못하는 그들의 T 세포 수용체에 의한 항원을 인식하지만, 그러나 대신 다른 세포의 표면에 MHC 분자에 결합하는, 예를 들어 병원체 유래 단백질 항원, 예를 들어 소위 에피토프(epitopes)의, 짧은 펩타이드 절편을 인식한다.
적응 면역 시스템: 적응 면역 시스템은 전형적으로 병원체 생장을 제거 또는 방해하는 데 필수적으로 헌신한다. 이는 전형적으로 특정한 병원체(면역성을 발생시키는)를 인식 및 기억하고, 병원균을 맞닥뜨릴 때마다 강한 공격을 시작하는 능력과 함께 척추동물 면역 시스템 제공에 의한 적응 면역 반응을 조절한다. 시스템은 체세포초돌연변이(somatic hypermutation)(가속된 체세포 돌연 변이의 과정), 및 V(D)J 재조합(항원 수용체 유전자 부분(segments)의 비가역적 유전적 재조합)에 의해 매우 적응할 수 있다. 이러한 메커니즘은 이후 각 개별적인 림프구에 독특하게 발현된 이후, 다른 항원 수용체의 방대한 수를 발생시키는 유전자의 소수를 허용한다. 유전자 재배열은 각 세포의 DNA에 비가역적 변화를 일으키기 때문에, 수명이 긴 특이적 면역에 대해 핵심(key)인 기억 B 세포 및 기억 T 세포를 포함하는, 그 세포의 자손(progeny)(후손(offspring)) 모두는 이후 동일한 수용체 특이성을 코딩하는 유전자를 상속할 것이다.
어쥬번트 / 어쥬번트 성분(component): 넓은 의미의 어쥬번트 또는 어쥬번트 성분은 전형적으로 약물 또는 백신과 같은, 다른 제제의 효과를 변형, 예를 들어 강화할 수 있는 약학적 및/또는 면역학적 제제이다. 이는 넓은 의미로 해석되고 물질의 넓은 범위를 나타낸다. 전형적으로, 이들 물질은 항원의 면역성을 증가시킬 수 있다. 예를 들어, 어쥬번트는 선천적 면역 시스템에 의해 인식될 수 있으며, 예를 들어 선천적 면역 반응을 유도할 수 있다. “어쥬번트”는 전형적으로 적응 면역 반응을 유도하지 않는다. 이러한 한도에서는(insofar), “어쥬번트”가 항원으로써 자격을 갖지 않는다. 그들의 행동 방식은 적응 면역 반응을 초래하는 항원에 의해 시작되는 효과로부터 명백하다.
항원: 본 발명의 맥락에서 “항원”은 전형적으로 면역 시스템에 의해, 바람직하게는 적응 면역 시스템에 의해 인지될 수 있고 항원 특이적 면역 반응을, 예를 들어 적응 면역 반응의 일부로써 항체 및/또는 항원 특이적 T 세포의 형성에 의해 시작할 수 있는 물질을 말한다. 전형적으로, 항원은 T-세포에 MHC에 의해 나타날 수 있는 펩타이드 또는 단백질이거나 이를 포함할 수 있다. 본 발명에 있어서 항원은 제공된 핵산 분자, 바람직하게 본 발명에 정의된 mRNA의 번역된 생산물일 수 있다. 이러한 맥락에서, 또한 펩타이드의 절편, 변이체 및 유도체 적어도 하나의 에피토프를 포함하는 단백질은 항원으로 이해된다. 본 발명의 맥락에서, 본 발명에 정의된 종양 항원 및 병원체 항원이 특히 바람직하다.
인공 핵산 분자: 인공 핵산 분자는 전형적으로 핵산 분자, 예를 들어 자연 발생하지 않는 DNA 또는 RNA로 이해될 수 있다. 다시 말해서, 인공 핵산 분자는 비천연 핵산 분자로 이해될 수 있다. 이러한 핵산 분자는 이의 개별 서열(자연적으로 발생하지 않는) 때문에 및/또는 다른 변형, 예를 들어 자연적으로 발생하지 않는 뉴클레오타이드의 구조적 변형 때문에 비-천연적일 수 있다. 인공 핵산 분자는 DNA 분자, RNA 분자 또는 DNA 및 RNA 부분을 포함하는 하이브리드 분자일 수 있다. 전형적으로, 인공 핵산 분자는 뉴클레오타이드의 원하는 인공 서열(이종(heterologous) 서열)에 대응하는 유전자 조작 방법에 의해 계획되거나/또는 발생될 수 있다. 이러한 맥락에서 인공 서열은 보통 자연적으로 발생하지 않는, 즉 적어도 하나의 뉴클레오타이드에 의해 야생형 서열과 다른 서열이다. 용어 '야생형'은 자연에서 발생하는 서열로서 이해될 수 있다. 나아가, 용어 '인공 핵산 분자'는 '하나의 단일 분자'를 의미하는 것으로 제한되지 않으며, 전형적으로 동일한 분자의 총체(ensemble)를 포함하는 것으로 이해된다. 따라서, 이는 표본(aliquot)에 포함되는 동일한 분자의 다수에 관련될 수 있다.
바이시스트로닉 RNA, 멀티시스트로닉 RNA: 바이시스트로닉 또는 멀티시스트로닉 RNA는 전형적으로 둘 (바이시스트로닉) 또는 그 이상의 (멀티시스트로닉) 오픈 리딩 프레임(ORF)를 가질 수 있는 전형적으로 RNA, 바람직하게는 mRNA이다. 이러한 맥락에서 오픈 리딩 프레임은 펩타이드 또는 단백질로 번역될 수 있는 코돈의 서열이다.
담체 / 폴리머 담체 : 본 발명의 맥락에서 담체는 전형적으로 다른 화합물(화물)의 수송 및/또는 복합화를 용이하게 하는 화합물일 수 있다. 폴리머 담체는 전형적으로 폴리머의 형성된 담체이다. 담체는 공유 또는 비공유 상호작용에 의해 이의 화물에 관련될 수 있다. 담체는 표적 세포에 핵산, 예를 들어 RNA 또는 DNA를 수송할 수 있다. 담체는 - 일부 실시예에서 - 양이온성 성분일 수 있다.
양이온성 성분: 용어 "양이온성 성분"은 전형적으로 전하를 띤 분자를 말하며, 이는 약 전형적으로 1 내지 9의 pH 값에, 바람직하게는 또는 9 미만(예를 들어 5 내지 9)의, 또는 8 미만(예를 들어 5 내지8)의, 또는 7미만(예를 들어 5 내지 7)의, 가장 바람직하게는 예를 들어 약 7.3 내지 7.4 생리학적 pH 값에 양전하를(양이온) 띤다. 따라서, 양이온성 성분은 어느 양전하를 띤 화합물 또는 폴리머, 바람직하게는 생리학적 조건 하에서, 특히 체내 생리학적 조건 하에서 양전하를 띤, 양이온성 펩타이드 또는 단백질일 수 있다. "양이온성 펩타이드 또는 단백질"은 적어도 하나의 양전하를 띤 아미노산 또는 하나 이상의 양전하를 띤 아미노산, 예를 들어 Arg, His, Lys 또는 Orn으로부터 선택된 것을 포함할 수 있다. 따라서 '다중양이온성' 성분은 또한 주어진 조건 하에서 하나 이상의 양전하를 보이는 범위 내이다.
5'-캡: 5'-캡은 일반적으로 성숙 mRNA의 5'-말단을 "덮는(caps)" 독립체, 전형적으로 변형된 뉴클레오티드 독립체이다. 5'-캡은 전형적으로 변형된 뉴클레오티드에 의해, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게는, 5'-캡은 5'-5'-삼인산염 연결을 통해 5'-말단에 연결된다. 5'-캡은 메틸화될수 있으며, 예를 들어 m7GpppN, 상기 N은 5'-캡을 수송하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 RNA의 5'-말단이다. 5'캡 구조의 추가적 예시는 글리세릴, 역 디옥시 비염기 잔기(inverted deoxy abasic residue)(일부), 4',5' 메틸렌 뉴클레오타이드, 1-(베타-D-에리쓰로푸라노실) 뉴클레오타이드, 4'-티오 뉴클레오타이드, 카르보사이클릭 뉴클레오타이드, 1,5-무수헥시톨 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형된 염기 뉴클레오티드, 트레오-펜토푸라노실 뉴클레오티드, 비환식(acyclic) 3',4'-세코 뉴클레오티드, 비환식 3,4-디하이드록시부틸 뉴클레오티드, 비환식 3,5 디하이드록시펜틸 뉴클레오티드, 3'-3'-역 뉴클레오티드 일부, 3'-3'-역 비염기 일부, 3'-2'-역 뉴클레오티드 일부, 3'-2'-역 비염기 일부, 1,4-부탄디올 포스페이트, 3'-포스포라미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'포스포로티오에이트, 포스포로디티오에이트, 또는 브릿징(bridging) 또는 논-브릿징 메틸포스포네이트 일부를 포함한다.
세포성 면역/세포성 면역 반응: 세포성 면역은 전형적으로 대식세포, 자연 살생 세포(NK), 항원 특이적 세포독성 T-림프구의 활성화, 및 항원에 반응하여 다양한 사이토카인의 방출에 관련된다. 더 일반적인 용어에서, 세포성 면역은 항체가 아닌 면역 시스템의 세포의 활성화에 기초한다. 전형적으로 세포성 면역 반응은 예를 들어 세포, 예를 들어 그들의 표면에 외래 항원의 에피토프를 보이는 수지상 세포(dendritic cells) 또는 다른 세포와 같은 특이적 면역 세포에 세포자멸을 유도할 수 있는 항원 특이적 세포독성 T-림프구의 활성화에 의해 특성화될 수 있다. 이러한 세포는 바이러스 감염되거나 세포내 박테리아에 의해 감염된 것일 수 있으며, 또는 종양 항원을 제시하는 암 세포이다. 추가적인 특징들은 그들이 병원체를 파괴하게 하는 대식세포 및 자연 살생 세포의 활성화 및 적응 면역 반응 및 선천적 면역 반응에 포함된 다른 세포의 기능에 영향을 주는 다양한 사이토카인을 방출하는 세포의 자극일 수 있다.
DNA: DNA는 디옥시-리보핵-산(deoxy-ribonucleic-acid)에 대한 일반적인 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 폴리머이다. 이들 뉴클레오티드는 보통 디옥시-아데노신-모노포스페이트, 디옥시-티미딘-모노포스페이트, 디옥시-구아노신-모노포스페이트 및 디옥시-시티딘-모노포스페이트 모노머이며, 이들은 - 그들 자신에 의해 - 당 일부(디옥시리보스), 염기 일부 및 포스페이트 일부로 이루어지고, 특유의 백본(backbone) 구조에 의해 중합한다. 백본 구조는 전형적으로 첫째 뉴클레오티드의 당 일부, 즉 디옥시리보스 및 둘째 포스페이트 일부, 인접한 모노머 사이의포스포디에스터 결합에 의해 형성된다. 모노머의 특정한 순서, 즉 당/포스페이트 백본에 연결된 염기들의 순서는 DNA 서열로 불린다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 형태에서 첫번째 가닥의 뉴클레오티드는 전형적으로 두번째 가닥의 뉴클레오티드와 혼성화하며, 예를 들어 A/T 염기쌍 및 G/C 염기쌍에 의한다.
에피토프 (Epitope): 에피토프(소위 "항원 결정요인")는 T 세포 에피토프 및 B 세포 에피토프로 구별될 수 있다. 본 발명의 맥락에서 T 세포 에피토프 또는 단백질의 일부는 바람직하게는 약 6 내지 약 20의 길이 또는 그 이상의 아미노산을 갖는, 예를 들어 MHC 클래스 I 분자에 의해 가공되고 나타나는 절편, 바람직하게는 약 8 내지 약 10 아미노산의 길이, 예를 들어 8, 9, 또는 10, (또는 11, 또는 12 아미노산)의 길이를 갖는, 또는 MHC 클래스 II 분자에 의해 가공되고 나타나는 절편, 바람직하게는 약 13 또는 그 이상의 아미노산, 예를 들어 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상의 아미노산의 길이를 갖는 절편을 포함할 수 있으며, 상기 이들 절편은 아미노산 서열의 어느 일부로부터 선택될 수 있다. 이들 절편은 전형적으로 펩타이드 절편 및 MHC 분자로 이루어진 복합체의 형태인 T 세포에 의해 인식될 수 있으며, 즉 절편은 전형적으로 그들의 자연 형태로 인식되지 않는다. B 세포 에피토프는 전형적으로 바람직하게는 5 내지 15 아미노산을 갖는, 더욱 바람직하게는 5 내지 12 아미노산을 갖는, 더욱 더 바람직하게는 6 내지 9 아미노산을 갖는, 항체에 의해 인식될 수 있는, 즉 그들의 천연 형태로 본 발명에 정의된 (천연) 단백질 또는 펩타이드 항원의 외부 표면에 위치한다.
단백질 또는 펩타이드의 이러한 에피토프는 나아가 본 발명에 언급된 이러한 단백질 또는 펩타이드의 어느 변이체로부터 선택될 수 있다. 이러한 맥락에서 항원 결정요인은 본 발명에 정의된 단백질 또는 펩타이드의 아미노산 서열 내 불연속적이나 삼차원 구조 또는 단일 폴리펩타이드 사슬로 이루어진 연속적 또는 선형의 에피토프로 합쳐진 본 발명에 정의된 단백질 또는 펩타이드의 부분으로 이루어진 형태적(conformational)이거나 불연속적(discontinuous)인 에피토프일 수 있다.
서열의 절편: 서열의 절편은 전형적으로 예를 들어 핵산 분자 또는 아미노산 서열의 전장(full length) 서열의 짧은 일부일 수 있다. 따라서 절편은 전형적으로 전장 서열 내 상응하는 스트레치와 동일한 서열로 이루어진다. 본 발명의 맥락에서 바람직한 서열의 절편은, 절편이 유도된 것으로부터 총(즉 전장) 분자의 적어도 5%, 10%, 20%, 바람직하게는 적어도 30%, 더욱 바람직하게는 적어도 40%, 더욱 바람직하게는 적어도 50%, 더욱 더 바람직하게는 적어도 60%, 더욱 더 바람직하게는 적어도 70%, 가장 바람직하게는 적어도 80%를 나타내는, 절편이 유도된 분자 내 독립체의 연속적인 스트레치에 상응하는 뉴클레오티드 또는 아미노산과 같은 연속적인 독립체의 스트레치로 이루어진다.
G/C 변형(modified): G/C 변형된 핵산은 전형적으로 야생형 서열에 비해 구아노신 및/또는 시토신의 바람직하게 증가된 수를 포함하는 변형된 야생형 서열에 기초하는 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자일 수 있다. 이러한 증가된 수는 구아노신 또는 시토신 뉴클레오티드를 포함하는 코돈에 의해 아데노신 또는 티미딘 뉴클레오티드를 포함하는 코돈의 치환에 의해 발생될 수 있다. 증가된 G/C 함량이 DNA 또는 RNA의 코딩 영역에 발생하는 경우, 이는 유전적 코드의 축퇴(degeneracy)의 사용을 만든다. 따라서 코돈 치환은 바람직하게는 코딩된 아미노산 잔기를 변화시키지 않으나, 핵산 분자의 G/C 함량을 독점적으로 증가시킨다.
유전자 치료: 유전자 치료는 전형적으로 환자 신체의 치료 또는 환자 신체의 분리된 요소, 예를 들어 분리된 조직/세포, 펩타이드 또는 단백질을 코딩하는 핵산에 의한 것을 의미하는 것으로 이해될 수 있다. 이는 전형적으로 a) 환자에게 직접적으로 - 어떠한 투여 경로를 통해서 - 또는 인비보(in vivo)/엑스비보(ex vivo) 또는 인비트로(in vitro) 환자의 세포의 형질전환을 초래하는, 환자의 분리된 세포/조직에 인비트로에서 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자를 투여; b) 투여된 핵산 분자의 전사 및/또는 번역; 및 선택적으로 c) 만약 핵산이 환자에게 직접 투여되지 않은 경우, 환자에게 분리된, 형질전환된 세포를 재투여하는 단계의 적어도 하나를 포함할 수 있다.
유전자 백신 접종: 유전자 백신 접종은 전형적으로 항원 또는 면역원 또는 이의 절편을 코딩하는 핵산 분자의 투여에 의해 백신 접종되는 것으로 이해된다. 핵산 분자는 개체의 신체 또는 개체의 분리된 세포에 투여될 수 있다. 신체의 특정한 세포의 형질전환 또는 분리된 세포의 형질전환에, 항원 또는 면역원은 이들 세포에 의해 나타날 수 있고 그 뒤에 면역 시스템, 적응을 유도하는, 즉 항원 특이적 면역 반응에 나타난다. 따라서, 유전자 백신 접종은 전형적으로 a) 개체, 바람직하게는 환자에, 또는 인비보 또는 인비트로에서 개체의 세포의 형질전환을 보통 초래하는 개체, 바람직하게는 환자의 분리된 세포에, 핵산, 바람직하게는 본 발명에 정의된 인공 핵산 분자의 투여; b) 투여된 핵산 분자의 전사 및/또는 번역; 및 선택적으로 c) 만약 핵산이 환자에 직접 투여되지 않았다면 개체, 바람직하게는 환자에 분리된 형질전환된 세포의 재투여하는 단계의 적어도 하나를 포함한다.
이종 서열: 두 서열은 만약 그들이 동일한 유전자로부터 유도되지 않았다면 전형적으로 '이종'인 것으로 이해된다. 즉, 비록 이종 서열이 동일한 유기체로부터 유도될 수 있어도, 그들은 자연적으로(자연에서) 동일한 mRNA에서와 같이, 동일한 핵산 분자로 발생하지 않는다.
체액성 면역/ 체액성 면역 반응: 체액성 면역은 전형적으로 항체 생산 및 선택적으로 항체 생산을 동반하는 부가적 과정을 말한다. 체액성 면역 반응은 예를 들어 Th2 활성화 및 사이토카인 생산, 배중심(germinal center) 형성 및 동형(isotype) 전환, 친화도 성숙 및 기억 세포 발생에 의해, 전형적으로 특성화될 수 있다. 체액성 면역은 또한 병원체 및 독소 중성화, 고전적 보체 활성화, 및 식균 작용 및 병원체 제거의 옵소닌 촉진을 포함하는 전형적으로 항체의 주효 기능을 나타낼 수 있다.
면역원: 본 발명의 맥락에서 면역원은 면역 반응을 촉진할 수 있는 화합물로 전형적으로 이해된다. 바람직하게는 면역원은 펩타이드, 폴리펩타이드, 또는 단백질이다. 특히 바람직한 실시예에서, 본 발명의 의미의 면역원은 제공된 핵산 분자, 바람직하게는 본 발명에 정의된 인공 핵산 분자의 번역의 생산물이다. 전형적으로 면역원은 적어도 적응 면역 반응을 유도한다.
면역자극성 구성요소: 본 발명의 맥락에서, 면역자극성 구성요소는 전형적으로 면역 반응을 유도할 수 있는 또는 면역 반응을 유도할 수 있는 성분이 유도될 수 있는 것으로부터 적어도 하나의 성분을 포함하는 구성요소로 이해된다. 이러한 면역 반응은 바람직하게는 선천적 면역 반응 또는 적응 및 선천적 면역 반응의 조합일 수 있다. 바람직하게는 본 발명의 맥락에서 면역자극성 구성요소는 적어도 하나의 인공 핵산 분자, 더욱 바람직하게는 RNA, 예를 들어 mRNA 분자를 포함한다. mRNA와 같은 면역자극성 구성요소는 적절한 담체와 함께 복합체화될 수 있다. 따라서 면역자극성 구성요소는 mRNA/담체 복합체를 포함할 수 있다. 나아가, 면역자극성 구성요소는 어쥬번트 및/또는 mRNA와 같은 면역자극성 구성요소에 적절한 수송체를 포함할 수 있다.
면역 반응: 면역 반응은 전형적으로 특정한 항원에 적응 면역 시스템의 특이적 반응(소위 특이적 또는 적응 면역 반응) 또는 선천적 면역 시스템의 비특이적 반응(소위 비특이적 또는 선천적 면역 반응), 또는 이들의 조합일 수 있다.
면역 시스템: 면역 시스템은 감염으로부터 유기체를 보호할 수 있다. 만약 병원체가 유기체의 물리적 장벽을 통과하는데 성공하여 이러한 유기체에 침입한다면, 선천적 면역 시스템은 즉시, 단 비 특이적인 반응을 제공한다. 만약 병원체가 선천적 반응을 피한다면, 척추동물은 두번째 방어층, 적응 면역 시스템을 갖는다. 여기에 면역 시스템은 병원체에 대한 이의 인식을 증가시키기 위해 감염 동안 이의 반응을 조정한다. 증가된 반응은 이후 면역학적 기억의 형태로 병원체가 제거된 다음에도 유지되며, 적응 면역 시스템을 보다 빠르게 시작하고 이 병원체를 맞닥뜨릴때마다 보다 강하게 공격하도록 허용한다. 이에 따르면, 면역 시스템은 선천적 및 적응 면역 시스템을 포함한다. 이들 두 파트의 각각은 전형적으로 소위 체액성 및 세포성 성분을 포함한다.
면역자극성 RNA: 본 발명의 맥락에서 면역자극성 RNA(isRNA)는 전형적으로 선천적 면역 반응을 유도할 수 있는 RNA일 수 있다. 이는 일반적으로 오픈 리딩 프레임을 갖지 않으며 따라서 펩타이드 항원 또는 면역원을 제공하지 않으나 예를 들어 톨(Toll) 유사 수용체(TLR) 또는 다른 적절한 수용체의 특정한 종류에 결합에 의한 면역 반응을 촉진한다. 그러나 물론 또한 오픈 리딩 프레임을 가지며 펩타이드/단백질을 코딩하는 mRNAs는 선천적 면역 반응을 유도할 수 있으며, 따라서 면역자극성 RNAs일 수 있다.
선천적 면역 반응: 선천적 면역 반응, 또한 비특이적(또는 불특정(unspecific)) 면역 시스템으로 알려진 것은 전형적으로 세포 및 비특이적 조건에서 다른 유기체에 의한 감염으로부터 숙주를 방어하는 메커니즘을 포함한다. 이는 선천적 면역 시스템의 세포는 일반적인 방법으로 병원체를 인식 및 반응하지만, 적응 면역 시스템과는 다르게 숙주에 오래 지속되거나 방어적 면역을 부여하지 않는 것을 의미한다. 선천적 면역 시스템은 예를 들어 Toll-유사 수용체(TLRs)의 리간드 또는 리포폴리다당류(lipopolysaccharides), TNF-알파, CD40 리간드, 또는 사이토카인, 모노카인(monokines), 림포카인(lymphokines), 인터루킨(interleukins) 또는 케모카인(chemokines), IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-알파, IFN-베타, IFN-감마, GM-CSF, G-CSF, M-CSF, LT-베타, TNF-알파, 성장 인자, 및 hGH와 같은 다른 보조(auxiliary) 물질, 인간 Toll-유사 수용체 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10의 리간드, 쥣과(murine) Toll-유사 수용체 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 또는 TLR13의 리간드, NOD-유사 수용체의 리간드, RIG-I 유사 수용체의 리간드, 면역자극성 핵산, 면역자극성 RNA(isRNA), CpG-DNA, 항생제, 또는 항바이러스제에 의해 활성화될 수 있다. 본 발명에 따르는 약학적 조성물은 하나 또는 그 이상의 이러한 물질을 포함할 수 있다. 전형적으로 선천적 면역 시스템의 반응은 사이토카인으로 불리는 특수한 화학 조절자를 포함하는, 화학적 인자의 생산을 통해, 감염의 부위에 면역 세포를 모으는 것(recruiting); 보체 연쇄(cascade)의 활성화; 특수한 백혈구 세포에 의해 기관, 조직, 혈액 및 림프 내에 존재하는 외래 물질의 선별 및 제거; 적응 면역 시스템의 활성화; 및/또는 감염성 제제에 물리적 및 화학적 장벽으로 행동을 포함한다.
클로닝 부위: 클로닝 부위는 전형적으로 핵산 서열, 예를 들어 오픈 리딩 프레임을 포함하는 핵산 서열의 삽입에 적절한 핵산 분자의 일부로 이해된다. 삽입은 본 발명이 속하는 기술분야에서 통상의 기술자에게 알려진 어느 분자 생물학적 방법을 통해, 예를 들어 제한(restriction) 및 결찰(ligation)에 의해 수행될 수 있다. 클로닝 부위는 전형적으로 하나 또는 그 이상의 제한 효소 인식 부위(제한 부위)를 포함한다. 이들 하나 또는 그 이상의 제한 부위는 이들 부위에 DNA를 쪼개는 제한 효소에 의해 인식될 수 있다. 하나 이상의 제한 부위를 포함하는 클로닝 부위는 또한 멀티플 클로닝 부위(MCS) 또는 폴리링커(polylinker)로 불릴 수 있다.
핵산 분자: 핵산 분자는 바람직하게는 핵산 성분을 포함하는, 바람직하게는 이로 이루어진 분자이다. 용어 핵산 분자는 바람직하게는 DNA 또는 RNA 분자를 말한다. 이는 바람직하게는 용어 “폴리뉴클레오티드”와 동의어로 사용된다. 바람직하게는 핵산 분자는 당/인산 백본의 포스포디에스터 결합에 의해 서로 공유결합된 뉴클레이티드 모노머를 포함 또는 이로 이루어진 폴리머이다. 용어 “핵산 분자”는 또한 염기 변형된, 당 변형된 또는 백본 변형된 등의 DNA 또는 RNA 분자와 같은, 변형된 핵산 분자를 포함한다.
오픈 리딩 프레임: 본 발명의 맥락에서 오픈 리딩 프레임(ORF)는 전형적으로 펩타이드 또는 단백질로 번역될 수 있는 몇몇 뉴클레오티드 트리플렛(triplets)의 서열일 수 있다. 오픈 리딩 프레임은 바람직하게는 시작 코돈, 즉 이의 5'-말단에 아미노산 메티오닌(ATG)을 일반적으로 코딩하는 세개의 후속 뉴클레오티드의 조합 및 보통 3 뉴클레오티드의 배수인 길이를 보이는 후속 영역을 포함한다. ORF는 바람직하게는 정지 코돈(예를 들어 TAA, TAG, TGA)에 의해 종결된다. 전형적으로 이는 오픈 리딩 프레임의 유일한 정지 코돈이다. 따라서 본 발명의 맥락에서 오픈 리딩 프레임은 바람직하게는 시작 코돈(예를 들어 ATG)로 시작하고 바람직하게는 정지 코돈(예를 들어 TAA, TGA, 또는 TAG)으로 종결되는, 세개로 나뉠 수 있는 뉴클레오티드의 수로 이루어진 뉴클레오티드 서열이다. 오픈 리딩 프레임은 분리 또는 보다 긴 핵산 서열, 예를 들어 벡터 또는 mRNA에 병합될 수 있다. 오픈 리딩 프레임은 또한 "단백질 코딩 영역"으로 불릴 수 있다.
펩타이드 : 펩타이드 또는 폴리펩타이드는 전형적으로 펩타이드 결합으로 연결된 아미노산 모노머의 폴리머이다. 이는 전형적으로 50 모노머 단위 미만을 포함한다. 그럼에도 불구하고, 용어 펩타이드는 50 모노머 단위 이상을 갖는 분자를 제외하는 것은 아니다. 긴 펩타이드는 또한 전형적으로 50 및 600 모노머 단위 사이를 갖는 폴리펩타이드로 불린다.
약학적으로 유효한 량: 본 발명의 맥락에서 약학적으로 유효한 량은 전형적으로 면역 반응, 발현된 펩타이드 또는 단백질의 병리학적 수준을 변화, 또는 부족한 유전자 생산물의 치환, 예를 들어 병리학적 상황의 경우와 같이 약학적인 효과를 유도하기에 충분한 양으로 이해된다.
단백질 단백질은 전형적으로 하나 또는 그 이상의 펩타이드 또는 폴리펩타이드를 포함한다. 단백질은 전형적으로 단백질이 이의 생물학적 기능을 행사하는데 필요할 수 있는, 3차원 형태로 접힌다.
폴리 (A) 서열: 폴리(A) 서열, 소위 폴리(A) 꼬리 또는 3'-폴리(A) 꼬리는 전형적으로 아데노신 뉴클레오티드, 예를 들어 약 400 아데노신 뉴클레오티드에 이르는, 예를 들어 약 25 내지 약 400, 바람직하게는 약 50 내지 약 400, 더욱 바람직하게는 약 50 내지 약 300, 더욱 더 바람직하게는 약 50 내지 약 250, 가장 바람직하게는 약 60 내지 약 250 아데노신 뉴클레오티드의 서열로 이해된다. 폴리(A) 서열은 전형적으로 mRNA의 3'말단에 위치한다. 본 발명의 맥락에서, 폴리(A) 서열은 예를 들어 벡터 내, 예를 들어 RNA, 바람직하게는 mRNA의 발생, 예를 들어 벡터의 전사에 의한 것을 위해 주형(template)으로서 제공하는, 벡터 내와 같이, mRNA 또는 어느 다른 핵산 분자 내에 위치할 수 있다.
폴리아데닐화: 폴리아데닐화는 전형적으로 RNA 분자와 같은 핵산 분자에, 예를 들어 조숙 mRNA에 폴리(A)서열의 첨가로 이해된다. 폴리아데닐화는 소위 폴리아데닐화 신호에 의해 유도될 수 있다. 이러한 신호는 바람직하게는 폴리아데닐화되는 RNA 분자와 같은 핵산 분자의 3'-말단에 뉴클레오티드의 스트레치 내에 위치한다. 폴리아데닐화 신호는 전형적으로 아데닌 또는 우라실/티민 뉴클레오티드, 바람직하게는 헥사머 서열 AAUAAA로 이루어진 헥사머를 포함한다. 다른 서열, 바람직하게는 헥사머 서열은 또한 생각될 수 있다. 폴리아데닐화는 전형적으로 Pre-mRNA(소위 조숙-mRNA)의 가공 중에 발생한다. 전형적으로 RNA 성숙(pre-mRNA로부터 성숙 mRNA로)은 폴리아데닐화 단계를 포함한다.
제한 부위: 제한 부위는, 또한 '제한 효소 인식 부위'로 불림, 제한 효소에 의해 인식되는 뉴클레오티드 서열이다. 제한 부위는 전형적으로 짧은, 바람직하게는 회문식(palindromic) 뉴클레오티드 서열, 예를 들어 4 내지 8 뉴클레오티드를 포함하는 서열이다. 제한 부위는 바람직하게는 제한 효소에 의해 특이적으로 인식된다. 제한 효소는 전형적으로 이러한 부위에 제한 부위를 포함하는 뉴클레오티드 서열을 쪼갠다. 이중 나선 DNA 서열과 같은 이중 가닥 뉴클레오티드 서열에서, 제한 효소는 전형적으로 뉴클레오티드 서열의 양쪽 가닥 모두를 절단한다.
RNA, mRNA: RNA는 보통 리보핵산의 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 폴리머이다. 이들 뉴클레오티드는 보통 소위 백본을 통해 서로 연결된 아데노신-모노포스페이트, 우리딘-모노포스페이트, 구아노신-모노포스페이트 및 시티딘 모노포스페이트 모노머이다. 백본은 첫번째로 당, 즉 리보스 및 두번째로 인접 모노머, 포스페이트 일부 사이의 포스포디에스터 결합에 의해 형성된다. 모노머들의 특이적인 연속은 RNA 서열로 불린다. 보통 RNA는 DNA 서열의 전사에 의해, 예를 들어 세포 내에서 얻어질 수 있다. 진핵 세포에서, 전사는 전형적으로 핵 또는 미토콘드리아 내에서 수행된다. 체내에서, DNA의 전사는 보통 보통 mRNA로 축약되는, 소위 메신저 RNA로 가공되는 소위 조숙 RNA를 초래한다. 예를 들어 진핵 유기체 내에서 조숙 RNA의 가공은 스플라이싱, 5'-캡핑, 폴리아데닐화, 핵 또는 미토콘드리아 및 그와 유사한 것으로부터 배출과 같은 다른 다양한 전사후 변형을 포함한다. 이들 가공의 합은 소위 RNA의 성숙이다. 성숙 메신저 RNA는 보통 특정한 펩타이드 또는 단백질의 아미노산 서열로 번역될 수 있는 뉴클레오티드 서열을 제공한다. 전형적으로, 성숙 mRNA는 5'-캡, 5'UTR, 오픈 리딩 프레임, 3'UTR 및 폴리(A) 서열을 포함한다. 메신저 RNA를 제외하고, 전사 및/또는 번역의 조절에 포함될 수 있는 RNA의 몇몇 비코딩 형태가 존재한다.
핵산 분자의 서열: 핵산 분자의 서열은 전형적으로 특정하고 개별적인 순서, 즉 이의 뉴클레오티드의 연속으로 이해된다. 단백질 또는 펩타이드의 서열은 전형적으로 순서, 즉 이의 아미노산의 연속으로 이해된다.
서열 상동성 (identity): 만약 그들이 뉴클레오티드 또는 아미노산의 동일한 길이 및 순서를 보이는 경우, 둘 또는 그 이상의 서열이 동일한 것이다. 상동성의 백분율은 전형적으로 두 서열이 동일한 정도를 설명, 즉 이는 전형적으로 참조-서열의 동일한 뉴클레오티드와 그들 서열 위치가 일치하는 뉴클레오티드의 백분율을 설명한다. 상동성의 정도를 결정하기 위해, 비교되는 서열은 동일한 길이, 즉 비교되는 서열의 가장 긴 서열의 길이를 보이는 것으로 여겨진다. 이는 8 뉴클레오티드로 이루어지는 첫번째 서열은 첫번째 서열을 포함하는 10 뉴클레오티드로 이루어진 두번째 서열과 80% 동일한 것을 의미한다. 다시 말해서, 본 발명의 맥락에서, 서열의 상동성은 바람직하게는 동일한 길이를 갖는 둘 또는 그 이상의 서열 내 동일한 위치를 갖는 서열의 뉴클레오티드의 백분율과 관련된다. 갭은 보통 정렬 내 그들의 실제 위치와 관계 없이 비상동(non-identical) 위치로 간주된다.
안정화된 핵산 분자: 안정화된 핵산 분자는 변형이 없는 핵산 분자에 비해, 엑소- 또는 엔도뉴클레아제 분해(degradation)에 의한 것처럼 예를 들어 환경적 인자 또는 효소적 소화에 의한 붕괴(disintegration) 또는 분해(degradation)에 더욱 안정하게 변화된 핵산 분자, 바람직하게는 DNA 또는 RNA 분자이다. 바람직하게는 본 발명의 맥락에서 안정화된 핵산 분자는 원핵 또는 진핵 세포와 같은 세포, 바람직하게는 인간 세포와 같은 포유동물 세포 내에 안정된다. 안정화 효과는 또한 세포의 외부, 예를 들어 버퍼 용액 내 등, 예를 들어 안정화된 핵산 분자를 포함하는 약학적 조성물의 제조 과정에 영향을 줄 수 있다.
형질전환: 용어 "형질전환"은 DNA 또는 RNA(예를 들어 mRNA) 분자와 같은 핵산 분자의 세포 내, 바람직하게는 진핵 세포 내에 도입을 말한다. 본 발명의 맥락에서, 용어 "형질전환"은 세포 내로, 바람직하게는 포유동물 세포 내와 같이 진핵 세포 내로 핵산 분자를 도입하기 위한 통상의 기술자에게 알려진 어느 방법을 포함한다. 이러한 방법은 예를 들어 전기천공, 예를 들어 양이온성 지질 및/또는 리포좀에 기초한 리포펙션(lipofection), 칼슘 포스페이트 침전, 나노입자 기초의 형질전환, 바이러스 기초의 형질전환, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머 기초의 형질전환을 포함한다. 바람직하게는 도입은 비-바이러스성이다.
백신: 백신은 전형적으로 적어도 하나의 항원, 바람직하게는 면역원을 제공하는 예방 또는 치료적 물질로 이해된다. 항원 또는 면역원은 백신 접종에 적합한 어느 물질로부터 유래될(derived) 수 있다. 예를 들어, 항원 또는 면역원은 박테리아 또는 바이러스 입자 등으로부터 또는 종양 또는 암 조직으로부터와 같은 병원체로부터 유래될 수 있다. 항원 또는 면역원은 적응 면역 반응을 제공하는 몸의 적응 면역 시스템을 자극한다.
벡터: 용어 "벡터"는 핵산 분자, 바람직하게는 인공 핵산 분자를 말한다. 본 발명의 맥락에서 벡터는 오픈 리딩 프레임을 포함하는 핵산 서열과 같은, 원하는 핵산 서열을 합체 또는 보유하는데 적합하다. 이러한 벡터는 저장 벡터, 발현 벡터, 클로닝 벡터, 수송 벡터 등일 수 있다. 저장 벡터는 핵산 분자, 예를 들어 mRNA 분자의 간편한 저장을 허용하는 벡터이다. 따라서 벡터는 예를 들어 오픈 리딩 프레임 및 mRNA의 3'UTR에 상응하는 서열과 같이, 원하는 mRNA 서열 또는 이의 일부에 상응하는 서열을 포함할 수 있다. 발현 벡터는 RNA, 예를 들어 mRNA, 또는 펩타이드, 폴리펩타이드 또는 단백질과 같은 발현 생산물의 생산에 사용될 수 있다. 예를 들어 발현 벡터는 프로모터 서열, 예를 들어 RNA 폴리머라제 프로모터 서열과 같은 벡터의 서열 스트레치의 전사에 필요한 서열을 포함할 수 있다. 클로닝 벡터는 전형적으로 벡터 내로 핵산 서열을 합체하는데 사용될 수 있는 클로닝 부위를 포함하는 벡터이다. 클로닝 벡터는 예를 들어 플라스미드 벡터 또는 박테리오파지 벡터일 수 있다. 수송 벡터는 세포 또는 유기체 내로 핵산 분자를 수송하는데 적합한 벡터, 예를 들어 바이러스 벡터일 수 있다. 본 발명의 맥락에서 벡터는 예를 들어 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게는 벡터는 DNA 분자이다. 바람직하게는 본 출원의 의미 내 벡터는 클로닝 부위, 항생제 저항성 인자와 같은 선별 마커, 및 복제 원점과 같은 벡터의 증폭에 적합한 서열을 포함한다. 바람직하게는 본 출원의 맥락에서 벡터는 플라스미드 벡터이다.
수송체 (Vehicle): 수송체는 전형적으로 약학적으로 활성인 화합물과 같은 화합물 저장, 수송, 및/또는 투여에 적합한 물질로 이해된다. 예를 들어, 이는 약학적으로 활성인 화합물 저장, 수송, 및/또는 투여에 적합한 생리학적으로 허용 가능한 액체이다.
3'- 비번역된 영역(3'-UTR): 일반적으로, 용어 "3'-UTR"은 오픈 리딩 프레임의 3'(즉 "다운스트림")에 위치하고 단백질로 번역되지 않는 인공 핵산 분자의 일부를 말한다. 전형적으로, 3'-UTR은 단백질 코딩 영역(오픈 리딩 프레임(ORF)) 또는 코딩 서열(CDS)) 및 mRNA의 폴리(A) 서열 사이에 위치한 mRNA의 일부이다. 본 발명의 맥락에서, 용어 3'-UTR은 또한 RNA가 전사된 주형(template)으로 코딩되지 않은 요소를 포함할 수 있으나, 전사 이후 성숙 도중에 첨가된다, 예를 들어 폴리(A) 서열. mRNA의 3'-UTR은 아미노산 서열로 번역되지 않는다. 3'UTR 서열은 보통 유전자 발현 과정 중에 각각 mRNA로 전사되는 유전자에 의해 코딩된다. 유전체 서열은 선택적 인트론을 포함하는 조숙 mRNA로 우선 전사된다. 조숙 mRNA는 이후 성숙 과정에서 성숙 mRNA로 추가적으로 가공된다. 이러한 성숙 과정은 5'캡핑, 조숙 mRNA를 선택적 인트론으로 자르는 스플라이싱 및 조숙 mRNA의 3'-말단의 폴리아데닐화와 같은 3'-말단의 변형 및 선택적 엔도-/ 또는 엑소뉴클레아제 분해 등의 단계를 포함한다. 본 발명의 이러한 맥락에서, 3'UTR은 단백질 코딩 영역의 정지 코돈 사이에, 바람직하게는 단백질 코딩 영역의 정지 코돈에 3' 바로 옆에 위치한 성숙 mRNA의 서열, 및 mRNA의 폴리(A) 서열에 상응한다. 용어 “상응”은 3'UTR 서열은 3'UTR 서열을 정의하는데 사용되는 mRNA 서열에서와 같이 RNA 서열, 또는 이러한 RNA 서열에 상응하는 DNA 서열일 수 있음을 의미한다. 본 발명의 맥락에서, 용어 “리보좀 단백질 유전자의 3'UTR”과 같은, “유전자의 3'UTR”은 이러한 유전자로부터 유도된 성숙 mRNA의 3'UTR에 상응하는 서열로, 즉 mRNA는 유전자의 전사 및 조숙 mRNA의 성숙에 의해 얻어진다. 용어 “유전자의 3'UTR”은 3'UTR의 DNA 서열 및 RNA 서열(센스(sense) 및 안티센스(antisense) 가닥 모두 및 성숙 및 비성숙 모두)을 포함한다.
5'- 비번역된 영역( 5'UTR ): 5'UTR은 전형적으로 메신저 RNA(mRNA)의 특정한 구획(section)으로 이해된다. 이는 mRNA의 오픈 리딩 프레임의 5'에 위치한다. 전형적으로 5'UTR은 전사 시작 부위에서 시작하고 오픈 리딩 프레임의 시작 코돈 전 한 뉴클레오티드에서 종결된다. 5'UTR은 유전자 발현을 조절하는 요소, 소위 조절 요소를 포함할 수 있다. 이러한 조절 요소는 예를 들어 리보솜 결합 부위일 수 있다. 5'UTR은 예를 들어 5'-CAP의 추가에 의해 전사후 변형될 수 있다. 본 발명의 맥락에서 5'UTR은 5'-CAP 및 시작 코돈 사이에 위치한 성숙 mRNA의 서열에 상응한다. 바람직하게는 5'UTR은 3' 위치한 뉴클레오티드로부터 5'-CAP까지, 바람직하게는 3' 바로 옆에 위치한 뉴클레오티드로부터 5'CAP까지, 단백질 코딩 영역의 시작 코돈에 5' 위치한 뉴클레오티드에, 바람직하게는 단백질 코딩 영역의 시작 코돈에 5' 바로 옆에 위치한 뉴클레오티드의 서열에 상응한다. 성숙 mRNA의 3' 바로 옆에서 5'-CAP에 위치한 뉴클레오티드는 전형적으로 전사 시작 부위에 상응한다. 용어 “상응”은 5'UTR 서열이 5'UTR 서열을 정의하는데 사용된 mRNA 서열에서와 같은 RNA 서열, 또는 이러한 RNA 서열에 상응하는 DNA 서열일 수 있음을 의미한다. 본 발명의 맥락에서, 용어 “유전자의 5'UTR”은 이 유전자로부터 유도된 성숙 mRNA의 5'UTR에 상응하는 서열이며, 즉 mRNA는 유전자의 전사 및 조숙 mRNA의 성숙에 의해 얻어진다. 용어 “유전자의 5'-UTR”은 5'-UTR의 DNA 서열 및 RNA 서열을 포함한다. 본 발명의 실시예에 의해 이러한 5'-UTR은 OTR의 5'-말단에 제공될 수 있다. 이의 길이는 전형적으로 500, 400, 300, 250 또는 200개 미만의 뉴클레오티드이다. 다른 실시예에서, 이의 길이는 적어도 10, 20, 30 또는 40, 바람직하게 100 또는 150개까지 뉴클레오티드의 범위일 수 있다.
5'말단 올리고피리미딘 트랙트 (TOP): 5'말단 올리고피리미딘 트랙트(TOP)는 전형적으로 특정한 mRNA 분자의 5'말단 영역 또는 특정한 유전자의 기능적 독립체의 5'말단 영역, 예를 들에 전사된 영역과 같은, 핵산 분자의 5'말단 영역에 위치한 피리미딘 뉴클레오타이드의 스트레치이다. 서열은 보통 전사 시작 부위에 상응하는 시티딘으로 시작하며, 보통 약 3 내지 30 피리미딘 뉴클레오티드의 스트레치가 뒤따른다. 예를 들어, TOP는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 그 이상의 뉴클레오티드를 포함할 수 있다. 피리미딘 스트레치 및 따라서 5'TOP는 TOP의 다운스트림에 위치한 첫번째 퓨린 뉴클레오티드에 5' 하나의 뉴클레오티드로 종결한다. 5'말단 올리고피리미딘 트랙트를 포함하는 메신저 RNA는 종종 TOP mRNA로 언급된다. 따라서 이러한 메신저 RNAs를 제공하는 유전자는 TOP 유전자로 언급된다. TOP 서열은 예를 들어 유전자 및 펩타이드 신장 인자를 코딩하는 mRNAs 및 리보솜 단백질에서 발견되었다.
TOP 모티프: 본 발명의 맥락에서, TOP 모티프는 상기 정의된 5'TOP에 상응하는 핵산 서열이다. 따라서, 본 발명의 맥락에서 TOP 모티프는 바람직하게는 3-30 뉴클레오티드의 길이를 갖는 피리미딘 뉴클레오티드의 스트레치이다. 바람직하게는, TOP-모티프는 적어도 3 피리미딘 뉴클레오티드, 바람직하게는 적어도 4 피리미딘 뉴클레오티드, 바람직하게는 적어도 5 피리미딘 뉴클레오티드, 더욱 바람직하게는 적어도 6 뉴클레오티드, 더욱 바람직하게는 적어도 7 뉴클레오티드, 가장 바람직하게는 적어도 8 피리미딘 뉴클레오티드로 이루어지며, 상기 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 시토신 뉴클레오티드의 5'말단에서 시작한다. TOP 유전자 및 TOP mRNAs에서, TOP-모티프는 바람직하게는 전사 시작 부위와 함께 이의 5'말단에서 시작하며 상기 유전자 또는 mRNA 내 첫번째 퓨린 잔기에 5' 하나의 뉴클레오티드에 종결한다. 본 발명의 의미에서 TOP 모티프는 바람직하게는 5'UTR을 나타내는 서열의 5'말단에 또는 5'UTR을 코딩하는 서열의 5'말단에 위치한다. 따라서 바람직하게는 3 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는, 만약 이러한 스트레치가 인공 핵산 분자, 상기 인공 핵산 분자의 5'UTR 요소, 또는 본 발명에 정의된 TOP 유전자의 5'UTR로부터 유도된 핵산 분자와 같은, 각각 서열의 5'말단에 위치하는 경우에, 본 발명의 의미에서 “TOP 모티프”로 불린다. 다시 말하면, 5'UTR 또는 5'UTR 요소의 5'-말단에 위치하지 않으나 5'UTR 또는 5'UTR 요소 내 어느 곳에 위치한 3 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 “TOP 모티프”가 아니다.
TOP 유전자: TOP 유전자는 전형적으로 5' 말단 올리고피리미딘 트랙트의 존재에 의해 특성화된다. 나아가, 대부분 TOP 유전자는 성장 관련된 번역 조절에 의해 특성화된다. 그러나 또한 조직 특이적 번역 조절과 함께 TOP 유전자는 알려졌다. 상기 정의된 바처럼, TOP 유전자의 5'UTR은 바람직하게는 시작 코돈에 5' 위치한 뉴클레오티드에 3'에 위치한 뉴클레오티드로부터 5'캡에까지 이르는, TOP 유전자로부터 유도된(derived) 성숙 mRNA의 5'UTR의 서열에 상응한다. TOP 유전자의 5'UTR은 전형적으로 어떠한 시작 코돈도 포함하지 않으며, 바람직하게는 업스트림 AUGs(uAUGs) 또는 업스트림 오픈 리딩 프레임(uORFs)이 없다. 그 안에, 업스트림 AUGs 및 업스트림 오픈 리딩 프레임은 전형적으로 번역될 오픈 리딩 프레임의 시작 코돈(AUG)의 5'에 발생하는 AUGs 및 오픈 리딩 프레임으로 이해된다. TOP 유전자의 5'UTRs는 일반적으로 보다 짧다. TOP 유전자의 5'UTRs의 길이는 20 뉴클레오티드 내지 500 뉴클레오티드 사이에서 다양할 수 있으며, 전형적으로 약 200 뉴클레오티드 미만, 바람직하게는 약 150 뉴클레오티드 미만, 더욱 바람직하게는 약 100 뉴클레오티드 미만이다. 본 발명의 의미에서 예시적인 TOP 유전자의 5'UTRs는 본 발명에 참고문헌으로 병합된 특허출원 WO2013/143700의 SEQ ID NOs. 1-1363에 따르는 서열 내 위치 5에 뉴클레오티드로부터 시작 코돈(예를 들어 ATG)에 5' 바로 옆에 위치한 뉴클레오티드까지의 핵산 서열이다. 이러한 맥락에서, TOP 유전자의 5'UTR의 특히 바람직한 절편은 5'TOP 모티프가 없는 TOP 유전자의 5'UTR이다. 용어 "TOP 유전자의 5'UTR" 또는 "5'-TOP UTR"은 바람직하게 자연 발생 TOP 유전자의 5'UTR을 의미한다.
첫번째 양태에서, 본 발명은 하기를 포함하는 인공 핵산 분자에 관한 것이다
a. 적어도 하나의 오픈 리딩 프레임(ORF); 및
b. 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 이루어진 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소).
용어 "3'-UTR 요소"는 3'-UTR로부터 또는 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함 또는 이로 구성된 핵산 서열을 의미한다. "3'-UTR 요소"는 바람직하게 인공 mRNA와 같은 인공 핵산 서열의 3'-UTR을 나타내는, 또는 인공 핵산 분자의 3'-UTR을 코딩하는 핵산 서열을 의미한다. 따라서, 본 발명의 관점에서 바람직하게 3'-UTR 요소는 mRNA의, 바람직하게 인공 mRNA의 3'-UTR일 수 있거나, mRNA의 3'-UTR에 대한 전사 주형(template)일 수 있다. 따라서, 3'-UTR 요소는 바람직하게 mRNA의 3'-UTR에, 바람직하게 유전적으로 조작된 벡터 구조의 전사에 의해 수득된 mRNA와 같은, 인공 mRNA의 3'-UTR에 상응하는 핵산 서열이다. 바람직하게, 본 발명의 의미 내 3'-UTR 요소는 3'-UTR로서 기능하거나 3'-UTR의 기능을 수행하는 뉴클레오티드 서열을 코딩한다.
용어 "리보좀 단백질 유전자"는 전형적으로 리보좀 단백질을 코딩하는 유전자를 의미한다. 본 발명에 사용된 것처럼, 상기 용어는 종과 무관하게 이것이 유도된 어느 리보좀 단백질 유전자를 의미한다. 구체적으로, 상기 용어는 진핵 리보좀 단백질 유전자를 의미한다. 게다가, 본 발명의 맥락에서, 용어 "리보좀 단백질 유전자"는 또한 리보좀 단백질 유전자와, 구조적 또는 기능적으로 유사한 유전자를 의미할 수 있다. 특히, 상기 용어는 또한 "리보좀 단백질-유사" 유전자, 위유전자(pseudogene) 및 특히 리보좀 단백질 유전자와 함께 그들의 3'-UTR 영역에 서열 또는 구조적 특징을 공유하는 유전자를 포함한다. 바람직하게, 상기 용어는 척추동물 리보좀 단백질 유전자, 더욱 바람직하게 포유동물 리보좀 단백질 유전자, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자를 의미한다. 게다가, 용어 "리보좀 단백질 유전자"는 또한 설치류 리보좀 단백질 유전자, 특히 쥣과 리보좀 단백질 유전자를 포함한다. 본 발명의 의미 내 리보좀 단백질 유전자의 예시는 리보좀 단백질 L9 (RPL9), 리보좀 단백질 L3 (RPL3), 리보좀 단백질 L4 (RPL4), 리보좀 단백질 L5 (RPL5), 리보좀 단백질 L6 (RPL6), 리보좀 단백질 L7 (RPL7), 리보좀 단백질 L7a (RPL7A), 리보좀 단백질 L11 (RPL11), 리보좀 단백질 L12 (RPL12), 리보좀 단백질 L13 (RPL13), 리보좀 단백질 L23 (RPL23), 리보좀 단백질 L18 (RPL18), 리보좀 단백질 L18a (RPL18A), 리보좀 단백질 L19 (RPL19), 리보좀 단백질 L21 (RPL21), 리보좀 단백질 L22 (RPL22), 리보좀 단백질 L23a (RPL23A), 리보좀 단백질 L17 (RPL17), 리보좀 단백질 L24 (RPL24), 리보좀 단백질 L26 (RPL26), 리보좀 단백질 L27 (RPL27), 리보좀 단백질 L30 (RPL30), 리보좀 단백질 L27a (RPL27A), 리보좀 단백질 L28 (RPL28), 리보좀 단백질 L29 (RPL29), 리보좀 단백질 L31 (RPL31), 리보좀 단백질 L32 (RPL32), 리보좀 단백질 L35a (RPL35A), 리보좀 단백질 L37 (RPL37), 리보좀 단백질 L37a (RPL37A), 리보좀 단백질 L38 (RPL38), 리보좀 단백질 L39 (RPL39), 리보좀 단백질, 라지, P0 (RPLP0), 리보좀 단백질, 라지, P1 (RPLP1), 리보좀 단백질, 라지, P2 (RPLP2), 리보좀 단백질 S3 (RPS3), 리보좀 단백질 S3A (RPS3A), 리보좀 단백질 S4, X-연결된(RPS4X), 리보좀 단백질 S4, Y-연결된 1 (RPS4Y1), 리보좀 단백질 S5 (RPS5), 리보좀 단백질 S6 (RPS6), 리보좀 단백질 S7 (RPS7), 리보좀 단백질 S8 (RPS8), 리보좀 단백질 S9 (RPS9), 리보좀 단백질 S10 (RPS10), 리보좀 단백질 S11 (RPS11), 리보좀 단백질 S12 (RPS12), 리보좀 단백질 S13 (RPS13), 리보좀 단백질 S15 (RPS15), 리보좀 단백질 S15a (RPS15A), 리보좀 단백질 S16 (RPS16), 리보좀 단백질 S19 (RPS19), 리보좀 단백질 S20 (RPS20), 리보좀 단백질 S21 (RPS21), 리보좀 단백질 S23 (RPS23), 리보좀 단백질 S25 (RPS25), 리보좀 단백질 S26 (RPS26), 리보좀 단백질 S27 (RPS27), 리보좀 단백질 S27a (RPS27a), 리보좀 단백질 S28 (RPS28), 리보좀 단백질 S29 (RPS29), 리보좀 단백질 L15 (RPL15), 리보좀 단백질 S2 (RPS2), 리보좀 단백질 L14 (RPL14), 리보좀 단백질 S14 (RPS14), 리보좀 단백질 L10 (RPL10), 리보좀 단백질 L10a (RPL10A), 리보좀 단백질 L35 (RPL35), 리보좀 단백질 L13a (RPL13A), 리보좀 단백질 L36 (RPL36), 리보좀 단백질 L36a (RPL36A), 리보좀 단백질 L41 (RPL41), 리보좀 단백질 S18 (RPS18), 리보좀 단백질 S24 (RPS24), 리보좀 단백질 L8 (RPL8), 리보좀 단백질 L34 (RPL34), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스(FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사(RPL39L), 리보좀 단백질 L10-유사(RPL10L), 리보좀 단백질 L36a-유사(RPL36AL), 리보좀 단백질 L3-유사(RPL3L), 리보좀 단백질 S27-유사(RPS27L), 리보좀 단백질 L26- 유사 1 (RPL26L1), 리보좀 단백질 L7- 유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자(RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)를 포함하나, 이에 제한되지 않는다. 바람직하게, 상기 용어 "리보좀 단백질 유전자"는 포유동물로부터 유래된, 바람직하게 호모 사피엔스(Homo sapiens) 또는 생쥐(Mus musculus)로부터 유래된 상기 유전자의 하나를 의미한다.
바람직하게, 적어도 하나의 오픈 리딩 프레임 및 적어도 하나의 3'-UTR 요소는 이종 기원(heterologous)이다. 이러한 맥락에서 용어 "이종 기원"은 오픈 리딩 프레임 및 3'-UTR 요소와 같은 인공 핵산 분자에 의해 구성된 두 서열 요소가 이러한 조합으로 자연적으로(천연) 발생하지 않음을 의미한다. 바람직하게, 3'-UTR 요소는 오픈 리딩 프레임 보다 다른 유전자로부터 유도된다. 예를 들어, 상기 ORF는 예를 들어 다른 유전자 또는 동일한 단백질을 코딩하나 다른 종 등의 3'-UTR 요소보다 다른 유전자로부터 유도될 수 있다. 바람직하게, 상기 오픈 리딩 프레임은 리보좀 단백질을 코딩하지 않는다. 바람직한 실시예에서, ORF는 인간 리보좀 단백질 또는 식물(특히 아라비답시스) 리보좀 단백질, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는다. 더욱 바람직한 실시예에서, 오픈 리딩 프레임은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는다.
특정한 실시예에서, 오픈 리딩 프레임은 리포터 단백질, 예를 들어, 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, GFP 단백질 또는 이의 변이체, 예를 들어 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질과 적어도 70% 서열 상동성을 보이는 변이체로 구성된 그룹으로부터 선택된 것을 코딩하지 않는 것이 바람직하다. 특히 바람직한 실시예에서, 오픈 리딩 프레임은 리포터 유전자를 코딩하지 않거나 리포터 유전자로부터 유도되지 않으며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체로 이루어진 그룹으로부터 선택되지 않으며, 바람직하게 이들 리포터 유전자, 바람직하게 글로빈 단백질, 루시퍼라제 단백질 또는 GFP 단백질의 어느 것에 전형적으로 적어도 70% 서열 상동성을 보이는 EGFP, 또는 상기 유전자의 어느 변이체로부터 선택되지 않는다.
더욱 더 바람직하게, 상기 3'-UTR 요소는 본 발명에 정의된 인공 핵산에 포함된 어느 다른 요소에 이종 기원이다. 예를 들어, 본 발명에 따르는 인공 핵산 분자가 주어진 유전자로부터 3'-UTR 요소를 포함한다면, 바람직하게 유전자의 ORF의 5' 및 3' 말단에 이의 조절 서열을 포함하는 어느 다른 핵산 서열, 특히 동일 유전자로부터 비기능적 핵산 서열(예를 들어 코딩 또는 조절 서열 요소)을 포함하지 않는다. 특히 바람직한 실시예에서, 인공 핵산 분자는 ORF, 3'-UTR 및 5'-UTR을 포함하며, 상기 모두는 서로 이종 기원이며, 예를 들어 그들은 그들 각각이 다른 유전자로부터 유도된 것(및 그들의 5' 및 3' UTR's)과 같은 재조합물이다. 다른 바람직한 실시예에서, 상기 3'-UTR은 바이러스 유전자의 3'-UTR로부터 유도되지 않거나 비-바이러스 원천이다.
바람직하게, 적어도 하나의 3'-UTR 요소는 ORF에 기능적으로 연결된다. 이는 바람직하게 코딩된 펩타이드 또는 단백질의 발현에 증진 또는 안정화 기능 또는 인공 핵산 분자의 안정화 기능과 같이, 3'-UTR 요소가 기능을 수행할 수 있는 ORF와 관련되는 것을 의미한다. 바람직하게, ORF 및 3'-UTR 요소는 5'→3' 방향에 관련된다. 따라서 바람직하게 인공 핵산 분자는 5'-ORF-(선택적)-연결자-3'-UTR 요소-3'의 구조를 포함하며, 상기 연결자는 존재하거나 존재하지 않을 수 있다. 예를 들어, 상기 연결자는 1-50 또는 1-20 뉴클레오티드의 스트레치와 같이 예를 들어 하나 또는 그 이상의 제한 효소 인식 부위(제한 부위)를 포함하거나 또는 이로 구성된, 하나 또는 그 이상의 뉴클레오티드일 수 있다.
바람직하게, 적어도 하나의 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자의 3'-UTR로부터, 특히 인간 리보좀 단백질 유전자로부터 유도된 또는 설치류 리보좀 단백질 유전자, 특히 쥣과 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함한다.
바람직한 실시예에서, 적어도 하나의 3'-UTR 요소는 NM_000661.4, NM_001024921.2, NM_000967.3, NM_001033853.1, NM_000968.3, NM_000969.3, NM_001024662.1, NM_000970.3, NM_000971.3, NM_000972.2, NM_000975.3, NM_001199802.1, NM_000976.3, NM_000977.3, NM_033251.2, NM_001243130.1, NM_001243131, NM_000978.3, NM_000979.3, NM_001270490.1, NM_000980.3, NM_000981.3, NM_000982.3, NM_000983.3, NM_000984.5, NM_000985.4, NM_001035006.2, NM_001199340.1, NM_001199341.1, NM_001199342.1, NM_001199343.1, NM_001199344.1, NM_001199345.1, NM_000986.3, NM_000987.3, NM_000988.3, NM_000989.3, NM_000990.4, NM_001136134.1, NM_000991.4, NM_001136135.1, NM_001136136.1, NM_001136137.1, NM_000992.2, NM_000993.4, NM_001098577.2, NM_001099693.1, NM_000994.3, NM_001007073.1, NM_001007074.1, NM_000996.2, NM_000997.4, NM_000998.4, NM_000999.3, NM_001035258.1, NM_001000.3, NM_001002.3, NM_053275.3, NM_001003.2, NM_213725.1, NM_001004.3 , NM_001005.4, NM_001256802.1, NM_001260506.1, NM_001260507.1 , NM_001006.4, NM_001267699.1, NM_001007.4, NM_001008.3, NM_001009.3, NM_001010.2, NM_001011.3, NM_001012.1, NM_001013.3, NM_001203245.2, NM_001014.4, NM_001204091.1, NM_001015.4, NM_001016.3, NM_001017.2, NM_001018.3, NM_001030009.1, NM_001019.4, NM_001020.4, NM_001022.3, NM_001146227.1, NM_001023.3, NM_001024.3, NM_001025.4, NM_001028.2, NM_001029.3, NM_001030.4, NM_002954, NM_001135592.2, NM_001177413.1, NM_001031.4, NM_001032.4, NM_001030001.2, NM_002948.3, NM_001253379.1, NM_001253380.1, NM_001253382.1, NM_001253383.1, NM_001253384.1, NM_002952.3, NM_001034996.2, NM_001025071.1, NM_001025070.1, NM_005617.3, NM_006013.3, NM_001256577.1, NM_001256580.1, NM_007104.4, NM_007209.3, NM_012423.3, NM_001270491.1, NM_033643.2, NM_015414.3, NM_021029.5, NM_001199972.1, NM_021104.1, NM_022551.2, NM_033022.3, NM_001142284.1, NM_001026.4, NM_001142285.1, NM_001142283.1, NM_001142282.1, NM_000973.3, NM_033301.1, NM_000995.3, NM_033625.2, NM_001021.3, NM_002295.4, NM_001012321.1, NM_001033930.1, NM_003333.3, NM_001997.4, NM_001099645.1, NM_001021.3, NM_052969.1, NM_080746.2, NM_001001.4 , NM_005061.2 , NM_015920.3 , NM_016093.2 , NM_198486.2 , NG_011172.1, NG_011253.1, NG_000952.4, NR_002309.1, NG_010827.2, NG_009952.2, NG_009517.1, NM_052835.3, NM_011287.2, NM_001162933.1, NM_009076.3, NM_009438.5, NM_025974.2, NM_025586.3, NM_001002239.3, NM_009077.2, NM_029751.4, NM_009078.2, NM_019647.6, NM_009079.3, NM_022891.3, NM_024218.4, NM_011975.3, NM_009081.2, NM_009082.2, NM_009083.4, NM_053257.3, ENSMUST00000081840 (NM_172086.2), NM_026724.2, NM_025592.3, NM_025589.4, NM_026069.3, NM_009084, NM_026055.1, NM_026594.2, NM_001163945.1, NM_024212.4, NM_016980.2, NM_011290.5, NM_011291.5, ENSMUST00000102898 (NM_013721.3), NM_025433.3, NM_012053.2, NM_011292.2, NM_007475.5, NM_018853.3, NM_026020.6, NM_025963.3, NM_013725.4, NM_011295.6, NM_020600.4, NM_009091.2, NM_170669.2, NM_013647.2, NM_009092.3, NM_008503.5, NM_026147.5 / ENSMUST00000138502 , NM _207635.1, NM_024266.3, NM_013765.2, NM_024277.2, NM_026467.3, NM_012052.2, NM_016959.4, ENSMUST00000071745 , NM_009095.2, NM_009096.3, NM_011300.3, NM_011029.4, NM_018860.4, NM_001277113.1, NM_001277114.1, NM_001271590.1, NM_007990, NM_025919, NM_016738, NM_026517, NM_207523, NM_009080, NM_011289, NM_013762, NM_ 021338 , NM _018730, NM_019865, NM_023372.2, NM_026533.3, NM_009092, NM_011296, NM_023133, ENSMUST00000059080 (NM_025587.2), NM_024175, NM_027015, NM_016844, NM_009093.2, NM_009094, NM_009098, NM_029767, 및 NM_019883으로 이루어진 그룹으로부터 선택된 전사체의 3'-UTR 서열로부터 유도된, 핵산 서열을 포함하거나 이에 대응된다.
구절 "리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열"은 바람직하게 리보좀 단백질 유전자의 3'-UTR 서열 또는 이의 절편 또는 일부에 기초한 핵산 서열을 의미한다. 이러한 구절은 전체 3'-UTR 서열에 상응하는 서열, 즉 리보좀 단백질 유전자의 전장 3'-UTR 서열, 및 리보좀 단백질 유전자의 3'-UTR 서열의 절편에 상응하는 서열을 포함한다. 바람직하게, 리보좀 단백질 유전자의 3'-UTR의 절편은 리보좀 단백질 유전자의 전장 3'-UTR에 적어도 5%, 10%, 20%, 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 더 바람직하게 적어도 60^, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 및 가장 바람직하게 적어도 90%를 나타내는, 리보좀 단백질 유전자의 전장 3'-UTR 내 뉴클레오티드의 연속적인 스트레치에 상응하는 뉴클레오티드의 연속적인 스트레치로 구성된다. 본 발명의 의미 내 이러한 절편은 바람직하게 본 발명에 설명된 기능적 절편이다. 바람직하게, 상기 절편은 3'-UTR에 연결된 ORF 또는 이의 절편의 번역을 위한 조절 기능을 보유한다.
용어 "리보좀 단백질 유전자의 3'-UTR"은 바람직하게 리보좀 단백질 유전자를 자연적으로 발생시키는 3'-UTR을 의미한다.
상기 용어 "리보좀 단백질 유전자의 3'-UTR의 변이체" 및 리보좀 단백질 유전자의 3'-UTR의 맥락에서 "이의 변이체"는 자연 발생 리보좀 단백질 유전자의 3'-UTR의 변이체, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR의 변이체, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR의 변이체, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 상기 설명된 인간 리보좀 단백질 유전자의 3'-UTR의 변이체를 의미한다. 이러한 변이체는 리보좀 단백질 유전자의 변형된 3'-UTR일 수 있다. 예를 들어, 변이체 3'-UTR은 변이체가 유도된 자연 발생 3'-UTR에 비해 하나 또는 그 이상의 뉴클레오티드 결실, 삽입, 추가 및/또는 치환을 보일 수 있다. 바람직하게, 리보좀 단백질 유전자의 3'-UTR의 변이체는 이것이 유도된 자연 발생 3'-UTR 변이체에 적어도 40%, 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 더욱 더 바람직하게 적어도 90%, 가장 바람직하게 적어도 95%의 상동성이다. 바람직하게, 상기 변이체는 본 발명에 설명된 기능적 변이체이다.
구절 "리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열"은 바람직하게 리보좀 단백질 유전자의 3'-UTR 서열의 변이체에 기초한 핵산 서열 또는 상기 설명된 이의 절편 또는 일부를 의미한다. 이러한 구절은 리보좀 단백질 유전자의 3'-UTR의 변이체의 전체 서열에 상응하는 서열, 즉 리보좀 단백질 유전자의 전장 변이체 3'-UTR 서열, 및 리보좀 단백질 유전자의 변이체 3'-UTR 서열의 절편에 상응하는 서열을 포함한다. 바람직하게, 리보좀 단백질 유전자의 3'-UTR의 변이체의 절편은 리보좀 단백질 유전자의 3'-UTR의 전장 변이체의 적어도 20%, 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 더 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 및 가장 바람직하게 적어도 90%를 나타내는, 리보좀 단백질 유전자의 3'-UTR의 전장 변이체 내 뉴클레오티드의 연속적인 스트레치에 상응하는 뉴클레오티드의 연속적인 스트레치로 구성된다. 본 발명의 의미 내, 이러한 변이체의 절편은 바람직하게 본 발명에 설명된 변이체의 기능적 절편이다.
본 발명의 맥락에서 상기 용어 "기능적 변이체", "기능적 절편", 및 "변이체의 기능적 절편"(또한 "기능적 변이체 절편"으로 명명)은 리보좀 단백질 유전자의 3'-UTR의 절편, 3'-UTR의 변이체, 또는 3'-UTR의 변이체의 절편이 변이체, 절편, 또는 변이체의 절편이 유도된 리보좀 단백질 유전자의 자연 발생 3'-UTR의 적어도 하나의, 바람직하게 하나 이상의 기능을 수행하는 것을 의미한다. 이러한 기능은 예를 들어 mRNA를 안정화 및/또는 mRNA로부터 단백질 생산을 증진, 안정화 및/또는 연장 및/또는, 바람직하게 인간 세포와 같은 포유동물 세포 내 mRNA로부터 단백질 발현 또는 전체 단백질 생산을 증가시키는 것일 수 있다. 바람직하게 3'-UTR의 기능은 ORF에 의해 코딩된 단백질의 번역에 관련된다. 더욱 바람직하게, 상기 기능은 3'-UTR 또는 이의 절편 또는 변이체에 연결된 ORF의 번역 효율을 증진시키는 것을 포함한다. 본 발명의 맥락 내 변이체, 절편, 및 변이체 절편은 참고 3'-UTR 또는 3'-UTR이 없는 것을 포함하는 mRNA에 비해, 바람직하게 인간 세포와 같은 포유동물 세포 내 mRNA를 안정화하는 기능, 및/또는 참조 3'-UTR 또는 3'-UTR이 없는 것을 포함하는 mRNA에 비해, 바람직하게 인간 세포와 같은 포유동물 세포 내, mRNA로부터 단백질 생산을 증진, 안정화 및/또는 연장하는 기능, 및/또는 참조 3'-UTR 또는 3'-UTR이 없는 것을 포함하는 mRNA에 비해, 바람직하게 인간 세포와 같은 포유동물 세포 내, mRNA로부터 단백질 생산을 증가시키는 기능을 수행하는 것이 특히 바람직하다. 참고 3'-UTR은 예를 들어 ORF와 자연 발생 조합된 3'-UTR일 수 있다. 게다가, 리보좀 단백질 유전자의 3'-UTR의 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편은 바람직하게 변이체, 절편, 또는 변이체 절편이 유도된 야생형 3'-UTR에 비해 이러한 3'-UTR의 변이체, 절편, 또는 변이체 절편을 포함하는 mRNA의 번역의 효율성에 실질적인 감소 효과를 가지지 않는다. 본 발명의 맥락에서 리보좀 단백질 유전자의 3'-UTR의 "기능적 절편", "기능적 변이체" 또는 "변이체의 기능적 절편"의 특히 바람직한 기능은 상기 설명된 기능적 절편, 기능적 변이체 또는 변이체의 기능적 절편을 이송하는(carrying) mRNA의 발현에 의한 단백질 생산의 증진, 안정화 및/또는 연장이다.
바람직하게, mRNA 및/또는 단백질 생산 안정화 효율 및/또는 단백질 생산 증가 효율과 같이, 기능적 변이체, 기능적 절편, 또는 기능적 변이체 절편에 의해 수행되는 하나 또는 그 이상의 기능의 효율성은 변이체, 절편 또는 변이체 절편이 유도된 리보좀 단백질 유전자의 자연 발생 3'-UTR에 의해 보이는 mRNA 및/또는 단백질 생산 안정화 효율 및/또는 단백질 생산 증가 효율에 대하여 적어도 5%, 더욱 바람직하게 적어도 10%, 더욱 바람직하게 적어도 20%, 더욱 바람직하게 적어도 30%, 더욱 바람직하게 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90% 증가된다.
본 발명의 맥락에서, 리보좀 단백질 유전자의 3'-UTR의 또는 리보좀 단백질 유전자의 3'-UTR의 변이체의 절편은 바람직하게 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 나타낸다. 바람직하게, 이러한 리보좀 단백질 유전자의 3'-UTR 또는 리보좀 단백질 유전자의 3'-UTR의 변이체의 절편은 상기 설명된 기능적 절편이다. 바람직한 실시예에서, 리보좀 단백질 유전자의 3'-UTR 또는 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 보인다.
바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 리보좀 단백질 유전자의 3'-UTR의 "기능적 절편", "기능적 변이체" 또는 "변이체의 기능적 절편"을 포함하거나 이로 구성된다.
바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 인공 핵산 분자의 안전성을 증가, 예를 들어 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산(참고 핵산)에 비해 본 발명에 따르는 mRNA의 안전성을 증가시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 본 발명에 따르는 인공 핵산 분자로부터, 예를 들어 ORF와 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산에 비해 본 발명에 따르는 mRNA로부터 단백질 생산의 안전성을 증가시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 본 발명에 따르는 인공 핵산 분자로부터, 예를 들어 ORF와 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산에 비해 본 발명에 따르는 mRNA로부터 단백질 생산을 연장시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 본 발명에 따르는 인공 핵산 분자로부터, 예를 들어 ORF와 자연 발생적으로 조합된 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산에 비해 본 발명에 따르는 mRNA로부터 단백질 발현 및/또는 총 단백질 생산을 증가시킨다. 바람직하게, 본 발명에 따르는 인공 핵산 분자의 적어도 하나의 3'-UTR은 ORF와 자연 발생적으로 조합된 3'-UTR과 같이 3'-UTR이 없거나 참고 3'-UTR을 포함하는 각각의 핵산의 번역 효율에 비해, 핵산의 번역 효율에 음성적으로 영향을 미치지 않는다. 더욱 더 바람직하게, 번역 효율은 이의 자연적인 맥락에서 각각의 ORF에 의해 코딩된 단백질의 번역 효율에 비해 3'-UTR에 의해 증진된다.
이러한 맥락에서 용어 "각각의 핵산 분자" 또는 "참고 핵산 분자"는 - 다른 3'-UTRs로부터 떨어진 - 참고 핵산 분자가 3'-UTR 요소를 포함하는 본 발명의 인공 핵산 분자에 대해 비교 가능한, 바람직하게 동일한 것을 의미한다.
상기 용어 인공 mRNA와 같은 인공 핵산 분자로부터 "단백질 생산을 안정화 및/또는 연장"은 바람직하게 인공 mRNA와 같은 인공 핵산 분자로부터 단백질 생산이 예를 들어 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내에서, 참고 3'-UTR을 포함하거나 3'-UTR이 없는 참고 mRNA와 같은 참고 핵산 분자로부터 단백질 생산에 비해 안정화 및/또는 연장되는 것을 의미한다. 따라서, 인공 mRNA와 같은 인공 핵산 분자로부터 생산된 단백질은 참고 핵산 분자로부터 생산된 단백질이 보일 수 있는 것에 비해 보다 긴 기간 동안 관찰 가능하다. 즉, 시간에 따라 측정된 인공 mRNA와 같은 인공 핵산 분자로부터 생산된 단백질의 양은 시간에 따라 측정된 참고 mRNA와 같은 참고 핵산 분자로부터 생산된 단백질의 양에 비해, 보다 늦은 시점에 역치 값(threshold value)을 약화(undercuts)시켰다. 이러한 역치 값은 예를 들어 핵산 분자의 후기 형질전환과 같이, 발현의 시작 이후 1, 2, 3, 4, 5 또는 6시간과 같이, 발현의 초기 단계에 측정된 단백질의 양일 수 있다.
예를 들어, 인공 mRNA와 같은 인공 핵산 분자로부터 단백질 생산은 - 핵산 분자의 후기 형질전환과 같은, 발현의 시작 1, 2, 3, 4, 5, 또는 6시간 이후와 같이, 발현의 초기 단계에 관찰된 최소 양의 양으로 - 포유동물 세포, 예를 들어 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내 참고 mRNA와 같은 참고 핵산 분자로부터 단백질 생산에 비해, 적어도 약 5시간, 바람직하게 적어도 약 10시간, 더욱 바람직하게 적어도 약 24시간 연장된다. 따라서, 본 발명에 따른 인공 핵산 분자는 바람직하게 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자에 비해, 적어도 약 5시간, 바람직하게 적어도 약 10시간, 더욱 바람직하게 적어도 약 24시간 동안, 후기 형질전환과 같이, 발현의 시작 1, 2, 3, 4, 5, 또는 6시간 이후와 같이, 발현의 초기 단계에 관찰된 최소 양인 양으로 연장된 단백질 생산을 허용한다.
바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자로부터 단백질 생산의 기간은 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터 단백질 생산에 비해, 적어도 1.5배, 바람직하게 적어도 2배, 더욱 바람직하게 적어도 2.5배 확장된다.
단백질 생산을 연장시키는 이러한 효과는 (i) 예를 들어, 시간에 따라 루시퍼라제와 같은 코딩된 리포터 단백질의 발현에 의해 수득된, 바람직하게 HeLa 또는 HDF 세포와 같은 포유동물 발현 시스템 내 단백질 양을 측정하는 단계, (ii) 단백질의 양이 관찰된 단백질의 양을 약화(undercuts)시키는 시점, 예를 들어 발현의 시작 이후 1, 2, 3, 4, 5, 또는 6시간, 예를 들어 인공 핵산 분자의 형질전환 후 1, 2, 3, 4, 5, 또는 6시간을 결정하는 단계, 및 (iii) 3'-UTR이 없거나 참고 3'-UTR을 포함하는 핵산 분자에 대해 결정된 시점에 발현의 시작 이후 1, 2, 3, 4, 5, 또는 6시간에, 단백질 양이 관찰된 단백질의 양을 약화시키는 시점을 비교하는 단계에 의해 결정될 수 있다.
바람직하게, 본 발명에 따르는 인공 핵산 분자로부터 생산된 단백질의 총량은, 예를 들어 48 또는 72 시간의 시간 범위 내에, 인공 핵산 분자의 ORF와 함께 자연적으로 발생하는 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터 생산된 단백질의 최소량인 동안, 단백질 생산에 이러한 안정화 및/또는 연장 효과가 달성된다. 따라서, 본 발명은 포유동물 세포 내에 같은, 포유동물 발현 시스템 내, 예를 들어 상기 개시된 HeLa 또는 HDF 세포에서 단백질 생산을 연장 및/또는 안정화시키는 인공 핵산 분자를 제공하며, 상기 인공 핵산 분자로부터 생산된 단백질의 총량은, 예를 들어 48 또는 72시간의 시간 범위 내, 적어도, 예를 들어 상기 시간 범위 내, 인공 핵산 분자의 ORF와 함께 자연 발생한 3'-UTR과 같은, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터 생산된 단백질의 총량이다.
따라서, "안정화된 단백질 발현"은 바람직하게 참고 핵산 분자, 예를 들어 참고 3'-UTR을 포함하거나 3'-UTR이 없는 mRNA와 비교할 때, 24시간 동안, 더욱 바람직하게 48시간 동안, 더욱 더 바람직하게 72시간 동안과 같이, 미리 정해진 시간 동안 본 발명에 따른 인공 핵산 분자로부터 보다 균일한 단백질 생산을 의미한다. 따라서, 본 발명에 따른 3'-UTR 요소를 포함하는 인공 핵산 분자로부터, 예를 들어 본 발명에 따른 mRNA로부터, 예를 들어 포유동물 시스템 내 단백질 생산의 수준은 바람직하게 상기 설명된 참고 mRNA와 같은 참고 핵산 분자에 대하여 관찰된 정도로 떨어지지 않는다. 예를 들어, 발현의 시작 6시간 이후, 예를 들어 포유동물 세포와 같은 세포로 본 발명에 따른 인공 핵산 분자의 형질전환 6시간 이후, 관찰된 단백질의 양(ORF에 의해 코딩된 것)은 발현의 시작 48시간 이후, 예를 들어 형질전환 48시간 이후 관찰된 단백질의 양과 비교될 수 있다. 따라서, 발현의 시작 6시간 이후 관찰된 단백질의 양에 비해, 발현의 시작 48시간 이후, 예를 들어 형질전환 48시간 이후 관찰된, 리포터 단백질, 예를 들어 루시퍼라제와 같은 ORF에 의해 코딩된 단백질의 양의 비율은 바람직하게 적어도 약 0.4, 더욱 바람직하게 적어도 약 0.5, 더욱 바람직하게 적어도 약 0.6, 더욱 더 바람직하게 적어도 약 0.7이다. 바람직하게, 상기 비율은 본 발명에 따른 핵산 분자에 대하여 약 0.4 내지 약 4, 바람직하게 약 0.65 내지 약 3, 더욱 바람직하게 약 0.7 내지 2이다. 각각의 참고 핵산 분자, 예를 들어 참고 3'-UTR을 포함하거나 3'-UTR이 없는 mRNA에 대하여, 상기 비율은 예를 들어 약 0.05 내지 약 0.3일 수 있다.
따라서, 본 발명은 상기 설명된 ORF 및 3'-UTR을 포함하는 인공 핵산 분자를 제공하며, 바람직하게 포유동물 세포와 같은 포유동물 발현 시스템, 예를 들어 HeLa 세포에서, 발현의 시작 6시간 이후 관찰된 (리포터) 단백질 양에 비해 발현의 시작 이후 48시간에 관찰된, 상기 (리포터) 단백질 양, 예를 들어 루시퍼라제의 양의 비율은 바람직하게 약 0.4 이상, 더욱 바람직하게 약 0.5 이상, 더욱 바람직하게 약 0.6 이상, 더욱 더 바람직하게 약 0.7 이상, 예를 들어 약 0.4 내지 약 4 사이, 바람직하게 약 0.65 내지 약 3 사이, 더욱 바람직하게 약 0.7 내지 2 사이이며, 상기 예를 들어 48시간의 시간 범위 내에, 상기 인공 핵산 분자로부터 생산된 단백질의 총량은, 인공 핵산 분자의 ORF와 함께 자연 발생하는 3'-UTR과 같이, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터, 예를 들어 상기 시간 범위 내에, 생산된 단백질의 최소 총량이다. 바람직한 실시예에서, 본 발명은 상기 설명된 ORF 및 3'-UTR 요소를 포함하는 인공 핵산 분자를 제공하며, 바람직하게 포유동물 세포와 같은, 포유동물 발현 시스템, 예를 들어 HeLa 세포 내에서, 발현의 시작 6시간 이후 관찰된 (리포터) 단백질 양에 비해 발현 시작 72시간 이후 관찰된, 상기 (리포터) 단백질 양, 예를 들어 루시퍼라제의 양의 비율은 바람직하게 약 0.4 이상, 더욱 바람직하게 약 0.5 이상, 더욱 바람직하게 약 0.6 이상, 더욱 더 바람직하게 약 0.7 이상, 예를 들어 약 0.4 내지 1.5 사이, 바람직하게 약 0.65 내지 약 1.1.5 사이, 더욱 바람직하게 약 0.7 내지 1.0 사이이며, 상기 예를 들어 72시간의 시간 범위 내에, 바람직하게 인공 핵산 분자로부터 생산된 단백질의 총량은 인공 핵산 분자의 ORF와 함께 자연적으로 발생하는 3'-UTR과 같이 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자로부터, 예를 들어 상기 시간 범위 내에, 생산된 단백질의 최소 총량이다.
본 발명의 맥락에서 "증가된(increased) 단백질 발현" 또는 "증진된(enhanced) 단백질 발현"은 바람직하게 발현의 시작 이후 한 시점에 증가된/증진된 단백질 발현 또는 참고 핵산 분자에 의해 유도된 발현에 비해 발현된 단백질의 증가된/증진된 총량을 의미한다. 따라서, 본 발명에 따른 인공 핵산 분자의 발현의 시작 이후, 예를 들어 형질전환 이후, 예를 들어 본 발명에 따른 mRNA의 형질전환 이후, 특정한 시점, 예를 들어 형질전환 이후 6, 12, 24, 48 또는 72시간에 관찰된 단백질 수준은 바람직하게 참고 3'-UTR을 포함하거나 3'-UTR이 없는 참고 mRNA와 같은, 참고 핵산 분자의 발현의 시작 이후, 예를 들어 형질전환 이후 동일한 시점에 관찰된 단백질 수준에 비해 높다. 바람직한 실시예에서, 인공 핵산 분자로부터 발현된 단백질의 최대량(예를 들어 단백질 활성 또는 질량에 의해 결정된 것과 같음)은 참고 3'-UTR을 포함하거나 3'-UTR이 없는 참고 핵산으로부터 발현된 단백질 양에 대하여 증가된다. 피크(peak) 발현 수준은 바람직하게 예를 들어 형질전환, 48시간 내, 더욱 바람직하게 24시간 내, 및 더욱 더 바람직하게 12시간 이후에 도달한다.
일 실시예에서, 본 발명에 따른 인공 핵산 분자로부터 "증가된 총 단백질 생산" 또는 "증진된 총 단백질 생산"은, 3'-UTR이 없거나 참고 3'-UTR을 포함하는 참고 핵산 분자에 비해, 바람직하게 포유동물 세포와 같은, 포유동물 발현 시스템 내, 예를 들어 HeLa 또는 HDF 세포 내, 단백질이 인공 핵산 분자로부터 생산된, 시간 범위에 따라 증가된/증진된 단백질 생산을 의미한다. 바람직한 실시예에 따르면, 시간에 따라 발현된 단백질의 누적량은 본 발명에 따른 인공 핵산 분자를 사용할 때 증가된다.
본 발명에 따르면, 적어도 하나의 3'-UTR 요소가 없거나 또는 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하는 참고 3'-UTR("참고 핵산")을 포함하는 각각의 핵산 분자에 비해 코딩된 단백질의 증가된 발현에 의해 특징지어진, 인공 핵산 분자가 제공된다. 본 발명의 인공 핵산 분자에 의해 생산된 인비보(in vivo) 단백질을 측정하기 위해, 코딩된 단백질의 발현은 표적 세포/조직에 본 발명의 인공 핵산 분자의 주입/형질전환에 따라 결정되고 참고 핵산에 의해 유도된 단백질 발현에 비교된다. 단백질 발현을 결정하는 정량적인 방법은 기술분야에 알려져 있다(예를 들어 웨스턴-블롯, FACS, ELISA, 질량분광법). 이러한 맥락에서 특히 유용한 것은 루시퍼라제, 녹색 형광 단백질(GFP), 또는 분비된 알칼라인 포스파타제(SEAP)과 같은 리포터 단백질의 발현의 결정이다. 따라서, 본 발명에 따른 인공 핵산 또는 참고 핵산은 표적 조직 또는 세포에, 예를 들어 형질전환 또는 주사를 통해 도입된다. 발현의 시작 이후 또는 핵산 분자의 도입 이후 몇시간 또는 몇일(예를 들어 6, 12, 24, 48 또는 72시간), 표적 세포 샘플은 수집되고 FACS를 통해 측정되며 및/또는 용해되었다. 이후 용해물은 몇몇 방법, 예를 들어 웨스턴-블롯, FACS, ELISA, 질량분광법 또는 형광 또는 발광 측정을 사용하여 발현된 단백질을 검출하는데(및 그에 따라 단백질 발현의 효율을 결정하는데) 사용될 수 있다.
따라서, 만약 본 발명에 따른 인공 핵산 분자로부터 단백질 발현을 특정한 시점(예를 들어 발현의 시작 후 또는 핵산 분자의 도입 후 6, 12, 24, 48 또는 72시간)에 참고 핵산 분자로부터 단백질 발현에 비교한다면, 양쪽 핵산 분자는 표적 조직/세포에 분리되어 도입되고, 조직/세포로부터 샘플은 특정한 시점 이후 수집되고, 단백질 용해물은 특정한 검출 방법(예를 들어 기술분야에 알려진 웨스턴 블롯, ELISA 등)에 적용된 특정한 프로토콜에 따라 제조되며, 상기 단백질은 선택된 검출 방법에 의해 검출된다. 세포 용해물 내 발현된 단백질 양의 측정에 대안으로서, - 또는 수집된 세포의 용해 전 세포 용해물 내 단백질 양의 측정에 추가하여 또는 동시에 부분 표본을 사용하여 - 단백질 양은 또한 FACS 분석을 사용하여 결정될 수 있다.
만약 특정한 시기에 단백질의 총량이 측정된다면, 조직 또는 세포는 인공 핵산 분자의 도입 이후 몇몇 시점 이후 (예를 들어 발현의 시작 이후 또는 핵산 분자의 도입 이후 6, 12, 24, 48 및 72시간) 수집될 수 있고, 시점마다 단백질 양은 상기 설명된 것처럼 결정될 수 있다. 누적되는 단백질 양을 계산하기 위해, 단백질의 총량을 결정하는 수학적인 방법이 사용될 수 있으며, 예를 들어 곡선 아래 영역(AUC)은 하기 식에 따라 결정될 수 있다:
단백질의 총량에 대한 곡선 아래 영역을 계산하기 위해, 각 종점(a 및 b)로부터 발현 곡선의 방정식의 적분이 계산된다.
따라서, "총 단백질 생산"은 바람직하게 시간에 따른 단백질 생산을 나타내는 곡선 아래 영역(AUC)를 의미한다.
상기 인공 핵산 분자의 안전성에 증가, 상기 단백질 생산의 안전성에 증가, 상기 단백질 생산의 연장 및/또는 상기 단백질 발현 및/또는 총 단백질 생산에 증가/증진은 바람직하게 3'-UTR이 없는 각각의 참고 핵산 분자, 예를 들어 3'-UTR이 없는 mRNA, 또는 상기 설명된 ORF와 함께 자연 발생 3'-UTR과 같은 참고 3'-UTR을 포함하는 참고 핵산 분자와 비교에 의해 결정된다.
mRNA 및/또는 단백질 생산 안정화 효과 및 효율 및/또는 리보좀 단백질 유전자의 3'-UTR의 변이체, 절편 및/또는 변이체 절편의 단백질 생산 증가 효과 및 효율뿐만 아니라 mRNA 및/또는 단백질 생산 안정화 효과 및 효율 및/또는 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소의 단백질 생산 증가 효과 및 효율은 통상의 기술자에게 알려진 이러한 목적을 위해 적절한 어느 방법을 통해 결정될 수 있다. 예를 들어, 인공 mRNA 분자는 루시퍼라제와 같은 리포터 단백질에 대해 코딩 서열/오픈 리딩 프레임(ORF)을 포함하며, 3'-UTR, 자연 발생 리보좀 단백질 유전자로부터 유도된 3'-UTR, 참고 유전자(즉 ORF와 함께 자연 발생 3'-UTR과 같은, 참고 3'-UTR)로부터 유도된 3'-UTR, 리보좀 단백질 유전자의 3'-UTR의 3'-UTR 변이체와 같은 것, 자연 발생 리보좀 단백질 유전자의 3'-UTR 절편과 같은 것, 또는 리보좀 단백질 유전자의 3'-UTR의 변이체의 3'-UTR 절편과 같은 것을 포함하지 않고, 발생될 수 있다. 이러한 mRNA는 예를 들어 T7 프로모터 및 각각의 mRNA 서열을 코딩하는 서열을 포함하는, 예를 들어 플라스미드 벡터와 같은 각각의 벡터의 인비트로(in vitro) 전사에 의해, 발생될 수 있다. 발생된 mRNA 분자는 mRNA를 형질전환하기에 적절한 어느 형질전환 방법에 의해 세포로 형질전환될 수 있으며, 예를 들어 그들은 HELA 세포와 같은 포유동물 세포로 전기천공될 수 있으며, 샘플들은 형질전환 이후 특정 시점, 예를 들어 형질전환 이후 6시간, 24시간, 48시간, 및 72시간에 분석될 수 있다. 상기 샘플들은 통상의 기술자에게 잘 알려진 방법에 의해 mRNA 정량 및/또는 단백질 정량을 위해 분석될 수 있다. 예를 들어, 샘플 시점에 세포 내 리포터 mRNA 존재의 정량은 정량적 PCR 방법을 통해 결정될 수 있다. 각각의 mRNA에 의해 코딩된 리포터 단백질의 정량은 예를 들어 웨스턴 블롯, ELISA 분석, FACS 분석 또는 사용되는 리포터 단백질에 의존한 루시퍼라제 분석과 같은 리포터 분석에 의해 결정될 수 있다. 단백질 발현을 안정화 및/또는 단백질 발현을 연장시키는 효과는 예를 들어 형질전환 이후 48시간에 관찰된 단백질 수준의 비율 및 형질전환 6시간 이후 관찰된 단백질 수준을 결정함으로써 분석될 수 있다. 바람직하게, 이러한 비율의 값은 1보다 크며, 즉 이후 시점에 단백질 발현은 보다 이른 시점에 단백질 발현에 비해 크다. 만약 상기 비율 값이 1보다 낮으면, 상기 단백질은 상기 값이 1에 가까워 질수록 보다 안정하다. 이러한 측정은 물론 또한 72 또는 그 이상의 시간에 수행될 수 있으며, 형질전환 72시간 이후 관찰된 단백질 수준의 비율 및 형질전환 6시간 이후 관찰된 단백질 수준은 단백질 발현의 안정성을 결정하기 위해 결정될 수 있다.
바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자의 3'-UTR 영역으로부터, 바람직하게 리보좀 단백질 L9 (RPL9), 리보좀 단백질 L3 (RPL3), 리보좀 단백질 L4 (RPL4), 리보좀 단백질 L5 (RPL5), 리보좀 단백질 L6 (RPL6), 리보좀 단백질 L7 (RPL7), 리보좀 단백질 L7a (RPL7A), 리보좀 단백질 L11 (RPL11), 리보좀 단백질 L12 (RPL12), 리보좀 단백질 L13 (RPL13), 리보좀 단백질 L23 (RPL23), 리보좀 단백질 L18 (RPL18), 리보좀 단백질 L18a (RPL18A), 리보좀 단백질 L19 (RPL19), 리보좀 단백질 L21 (RPL21), 리보좀 단백질 L22 (RPL22), 리보좀 단백질 L23a (RPL23A), 리보좀 단백질 L17 (RPL17), 리보좀 단백질 L24 (RPL24), 리보좀 단백질 L26 (RPL26), 리보좀 단백질 L27 (RPL27), 리보좀 단백질 L30 (RPL30), 리보좀 단백질 L27a (RPL27A), 리보좀 단백질 L28 (RPL28), 리보좀 단백질 L29 (RPL29), 리보좀 단백질 L31 (RPL31), 리보좀 단백질 L32 (RPL32), 리보좀 단백질 L35a (RPL35A), 리보좀 단백질 L37 (RPL37), 리보좀 단백질 L37a (RPL37A), 리보좀 단백질 L38 (RPL38), 리보좀 단백질 L39 (RPL39), 리보좀 단백질, 라지, P0 (RPLP0), 리보좀 단백질, 라지, P1 (RPLP1), 리보좀 단백질, 라지, P2 (RPLP2), 리보좀 단백질 S3 (RPS3), 리보좀 단백질 S3A (RPS3A), 리보좀 단백질 S4, X-연결된(RPS4X), 리보좀 단백질 S4, Y-연결된1 (RPS4Y1), 리보좀 단백질 S5 (RPS5), 리보좀 단백질 S6 (RPS6), 리보좀 단백질 S7 (RPS7), 리보좀 단백질 S8 (RPS8), 리보좀 단백질 S9 (RPS9), 리보좀 단백질 S10 (RPS10), 리보좀 단백질 S11 (RPS11), 리보좀 단백질 S12 (RPS12), 리보좀 단백질 S13 (RPS13), 리보좀 단백질 S15 (RPS15), 리보좀 단백질 S15a (RPS15A), 리보좀 단백질 S16 (RPS16), 리보좀 단백질 S19 (RPS19), 리보좀 단백질 S20 (RPS20), 리보좀 단백질 S21 (RPS21), 리보좀 단백질 S23 (RPS23), 리보좀 단백질 S25 (RPS25), 리보좀 단백질 S26 (RPS26), 리보좀 단백질 S27 (RPS27), 리보좀 단백질 S27a (RPS27a), 리보좀 단백질 S28 (RPS28), 리보좀 단백질 S29 (RPS29), 리보좀 단백질 L15 (RPL15), 리보좀 단백질 S2 (RPS2), 리보좀 단백질 L14 (RPL14), 리보좀 단백질 S14 (RPS14), 리보좀 단백질 L10 (RPL10), 리보좀 단백질 L10a (RPL10A), 리보좀 단백질 L35 (RPL35), 리보좀 단백질 L13a (RPL13A), 리보좀 단백질 L36 (RPL36), 리보좀 단백질 L36a (RPL36A), 리보좀 단백질 L41 (RPL41), 리보좀 단백질 S18 (RPS18), 리보좀 단백질 S24 (RPS24), 리보좀 단백질 L8 (RPL8), 리보좀 단백질 L34 (RPL34), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 SA (RPSA) or 리보좀 단백질 S17 (RPS17) 의 3'-UTR 영역으로부터 유도된다. 대안적인 실시예에서, 상기 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자로부터 또는 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU), 리보좀 단백질 L22-유사1 (RPL22L1), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자 (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로부터 선택된 유전자로부터 유도될 수 있다. 게다가, 본 발명에 따른 인공 핵산 분자의 3'-UTR 요소는 바람직하게 리보좀 단백질 S4-유사 (RPS4l), 추정(putative) 60S 리보좀 단백질 L13a, 추정 60S 리보좀 단백질 L37a-유사 단백질, 추정 40S 리보좀 단백질 S10-유사, 추정 40S 리보좀 단백질 S26-유사 1, 추정 60S 리보좀 단백질 L39-유사 5, 또는 60S 산성 리보좀 단백질 P0-유사로 이루어진 군에서 선택된 유전자의 3'-UTR 영역으로부터 유도된다.
특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자의 3'-UTR 영역으로부터, 바람직하게 리보좀 단백질 L3 (RPL3), 리보좀 단백질 L11 (RPL11), 리보좀 단백질 L13 (RPL13), 리보좀 단백질 L23 (RPL23), 리보좀 단백질 L23a (RPL23A), 리보좀 단백질 L26 (RPL26), 리보좀 단백질 L27 (RPL27), 리보좀 단백질 L35a (RPL35A), 리보좀 단백질 L38 (RPL38), 리보좀 단백질 S4, X-linked (RPS4X), 리보좀 단백질 S8 (RPS8), 리보좀 단백질 S9 (RPS9), 리보좀 단백질 S13 (RPS13), 리보좀 단백질 S19 (RPS19), 리보좀 단백질 S21 (RPS21), 리보좀 단백질 S23 (RPS23), 리보좀 단백질 S27 (RPS27), 리보좀 단백질 S28 (RPS28), 리보좀 단백질 S29 (RPS29), 리보좀 단백질 L36 (RPL36), 리보좀 단백질 L36a (RPL36A), 리보좀 단백질 S18 (RPS18) or 리보좀 단백질 S17 (RPS17)의 3'-UTR 영역으로부터 유도된다. 다른 바람직한 실시예에서, 상기 3'-UTR 요소는 리보좀 단백질을 코딩하는 유전자로부터 또는 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된 (FAU) 및 리보좀 단백질 L22-유사 1 (RPL22L1)로부터 선택된 유전자로부터 유도될 수 있다.
바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는, SEQ ID Nos: 10 내지 115에 따른 핵산 서열 또는 상응하는 RNA 서열과 같은, 리보좀 단백질 유전자의 3'-UTR의 핵산 서열에 대해 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%의, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100% 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다:
호모 사피엔스 리보좀 단백질 L9 (RPL9)
gatctaagagttacctggctacagaaagaagatgccagatgacacttaagacctacttgtgatatttaaatgatgcaataaaagacctattgatttggaccttcttctt
(SEQ ID NO:10)
호모 사피엔스 리보좀 단백질 L3 (RPL3)
tgccaggaacagattttgcagttggtggggtctcaataaaagttattttccactgac
(SEQ ID NO:11)
호모 사피엔스 리보좀 단백질 L4 (RPL4)
actcttaaatttgattattccataaaggtcaaatcattttggacagcttcttttgaataaagacctgattatacaggcagtgagaaacatg
(SEQ ID NO:12)
호모 사피엔스 리보좀 단백질 L5 (RPL5)
acccagcaattttctatgattttttcagatatagataataaacttatgaacagcaact
(SEQ ID NO:13)
호모 사피엔스 리보좀 단백질 L6 (RPL6)
atgtcttaagaacctaattaaatagctgactac
(SEQ ID NO:14)
호모 사피엔스 리보좀 단백질 L7 (RPL7)
ggtgtctaccatgattatttttctaagctggttggttaataaacagtacctgctctcaaattgaaat
(SEQ ID NO:15)
호모 사피엔스 리보좀 단백질 L7a (RPL7A)
atgtacactgttgagttttctgtacataaaaataattgaaataatacaaattttccttc
(SEQ ID NO:16)
호모 사피엔스 리보좀 단백질 L11 (RPL11)
attcccgtttctatccaaaagagcaataaaaagttttcagtgaaatgtgc
(SEQ ID NO:17)
호모 사피엔스 리보좀 단백질 L12 (RPL12)
gcacaaaggaaaacatttcaataaaggatcatttgacaactggtgg
(SEQ ID NO:18)
호모 사피엔스 리보좀 단백질 L13 (RPL13)
ctctggggcagcctcccacagtgggtggggctttgccagcagtgcccacgggggtcatggggccaggcgcgctccggcgcctgcagaactgatcggggatagtctcaggaggcgctagtcacgtgccccggtgatcggggatagtctcagaaggcgctagtctcctgccccggtgatcggggatagtctcaggaggcacgagtcgcctgcctcggtgatgcaccgtttctcacaccggctgctctggcccgagctaaaggggaagacgtgtgcggataggagctgcacacaattttcctccatgtattgtttattttgctttttcttttggctagacattaggaatttcagttttcccaagttgtatttttccttttctattttaaaattatcatgcagggctgggtgaggtcgctcacgcctatagtctcaaaactttgggaggctgaggggggaggatggcatgagcccaggagtttaaggctgcagtgagccgagatcgctccactgtcctccagcctgcatgacagagcgagaccctatctcaggaaaaaaaaaaacaaaactattatgcagtagtttcgaccctggaagacgagtgtgcatctttgagttgtaacacgtgtacctcgcccatccaggcgtagtttcatttggaatctggttatcctgtagttgctttgttaaaaatatatgtaattgcaaatcattt
(SEQ ID NO:19)
호모 사피엔스 리보좀 단백질 L23 (RPL23)
ttctccagtatatttgtaaaaaataaaaaaaaaaactaaacccattaaaaagtatttgtttgc
(SEQ ID NO:20)
호모 사피엔스 리보좀 단백질 L18 (RPL18)
ccctggatcctactctcttattaaaaagatttttgctgacagtgc
(SEQ ID NO:21)
호모 사피엔스 리보좀 단백질 L18a (RPL18A)
gtgcagggccctcgtccgggtgtgccccaaataaactcaggaacgccccggtgctcgccgc
(SEQ ID NO:22)
호모 사피엔스 리보좀 단백질 L19 (RPL19)
aacctcccactttgtctgtacatactggcctctgtgattacatagatcagccattaaaataaaacaagccttaatctgc
(SEQ ID NO:23)
호모 사피엔스 리보좀 단백질 L21 (RPL21)
taggtgttaaaaaaaaaaataaaggacctctgggctac
(SEQ ID NO:24)
호모 사피엔스 리보좀 단백질 L22 (RPL22)
agtaatgcaaaagtgtctgcattagaatttacggtgtctaaaattcatgtttttaaaagagcttgcctacagatggtttccacacttgaaattgtgccctgcgagttgcatagctggaagttcaatgctcagtcctaccttggctcccattaaacatttggtgctctgtggattgagttgaacgtgttgaggctttgcaatttcacttgtgttaaaggctctggcatttttccatttctatgcaaatttctttgaagcagaattgcttgcatatttcttctctgccgtcacagaaagcagagtttctttcaaacttcactgaggcatcagttgctctttggcaatgtcccttaaccatgattattaactaagtttgtggcttgagtttacaaattctacttgttgcattgatgttcccatgtagtaagtcatttttagtttggttgtgaaaaaaccctgggctgaagttggcatttcagttaaaagaaaaaaagaaactagtcccagatttgaaaacttgtaataaaattgaaactcactggttttctatgtctttttgaactcttgtaatcgagttttgatcatattttctattaaagtggctaacacctggctactcttactgt
(SEQ ID NO:25)
호모 사피엔스 리보좀 단백질 L23a (RPL23A)
actgagtccagctgcctaattctgaatatatatatatatatatcttttcaccatatacatgcctgtctgtcaatttctggttgggctgggaggccacacacacacactgacatgacagggcttgggcaagactcctgttctacttatccttttgaaatacctcaccctgccactccaccatgtatgatcattccagagatctttgtgactagagttagtgtcctaggaaaaccagaactcagaacttgcctccatggttgagtaacaagctgtacaagaaccccttttatccctggaagaggctgtgtatgaaaccaatgcccagggtttgaagggtgttagcatccatttcaggggagtgtggattggctggctctctggtagcattttgtcctcacacacccatctactatgtccaaccggtctgtctgcttccctcaccccttgcccaataaaggacaaggacttcagagg
(SEQ ID NO:26)
호모 사피엔스 리보좀 단백질 L17 (RPL17)
attcagcattaaaataaatgtaattaaaaggaaaag
(SEQ ID NO:27)
호모 사피엔스 리보좀 단백질 L24 (RPL24)
actggcagattagatttttaaataaagattggattataactctag
(SEQ ID NO:28)
호모 사피엔스 리보좀 단백질 L26 (RPL26)
agtaatcttatatacaagctttgattaaaacttgaaacaaagagcctg
(SEQ ID NO:29)
호모 사피엔스 리보좀 단백질 L27 (RPL27)
atgctttgttttgatcattaaaaattataaag
(SEQ ID NO:30)
호모 사피엔스 리보좀 단백질 L30 (RPL30)
accttttcacctacaaaatttcacctgcaaaccttaaacctgcaaaattttcctttaataaaatttgcttgttttaaaaacattgtatct
(SEQ ID NO:31)
호모 사피엔스 리보좀 단백질 L27a (RPL27A)
tcggccgcgttcatcagtcagcacgacccgacctcagtggcgtcctcacaacacagaccggaccttgggtcttaccccggcacctgagaaccacttccggtgagtagcttctacttccggagacgatgactcccccgcgtcccagaccggaagaagcccggcggagaccggcctcgctcggccacttccggcaagggcggagccggccagtggtgcgcgagcgcagataactcccctggagaggcgggatgttcaactccacccctggtccttgggcggccgtgggtccccttcgaagcggaggaatggccaacctcgccgcacttcgagcccctttagggtgcgtttaagaacagtgggcgtggcctttacgtaaatcttcgagatgggaacctccagaatttgtctcaattgtctaaaaggtaatgagcgtcagcgacattcaagggcactttgggctaaaaaagaaagtgcttgtacacggatggaaatattctagaagaacataaaaggaatttcctcttaggaggttagggaaatgagcacgaagtatgttttggtgcagttttttgttcaacccaatgcgtattttcatattgagaggcaatataaatggagcgaaagtatcttgagaaaaaaaaaaaaactaccagaacttgccgttgctgaaaagtaatattttctctttcgagagttttcatggccttttaaattacacccccacctccacaggcaaataaatttgttttggaatgcataccacatcatctggctctagaaacgtattttgtgtagctcccctagcaagaatataggttaaagcgtaaatttaattcctggctctattttacatcccaatttttattttcctctcattcccactttacgttgtttcaaataacctagtttgtgtatccctgtaagtcattttggtataaagtaggttataagtgtacatgcgaaaagatgtttttaacaaaaatgtaactg
(SEQ ID NO:32)
호모 사피엔스 리보좀 단백질 L28 (RPL28)
gacttgggcagctcgtttagtagcaccgtgcctcagtttcccatatgtaaaaggccattttgagtgcctttcacagccctgcataaggcaggtgtctcagtgttcactgctgtctctccagctcttagtccagtagctgcatggtgagtgagcgtagggcgcaccctggaaggctgccaagcccaaagttgtgcagagcgctggggactccagactccccacagcagcagagactcgggactgaggcatcctctgttcacaggacatgctggcatctactgggtcagggctctgctgctcggtggctgtgcaaccttgggcaagttcctcaacctctctgtgtcttcgtaccctcatctgtaacatgcgtgtcgatagaccctactactcagggttgatgagaagattaaatgtgcaaaacctgcttgactgtgcccacaaatcctgattgtaggaataaattaatgactttttataaatattttgatcagatggactcatgatcacagatgtcttcacatgcctatgactaatttgtacacaaactaatgctcgtgtttcccaagcacctggaagacatgccagatccatgtgcagtaatgcctggtggctccaggtctgccccgccgtcctgtggggctgtgagctttcccagcctcctgcccgtgtttgtgaatatcattctgtcctcagctgcatttccagcccaggctgtttggcgctgcccaggaatggtatcaattcccctgtttctcttgtagccagttactagaataaaatcatctacttt
(SEQ ID NO:33)
호모 사피엔스 리보좀 단백질 L28 (RPL28)
ttttttactgtcaggcaggaagagcggtaactgccatcgcggcgggcatccctggcgccagggtgttggtctgggtaccggcttccctctcggccgacttgtcagctctgtgagccgcgcgcgtctgagcccgtgtcctcacctgtaaagtggagaaatgaaaaaggacctgaacttcctcggtggttgttgagagttaaggcacggggttgatgttttcagatgaaattctcaaagcaagtcagggtggggatggatggtttcatcccacaggtgggaagattgagg
(SEQ ID NO:34)
호모 사피엔스 리보좀 단백질 L28 (RPL28)
gtttttctcaggtccttgattggaactgcctcagagccaagggtccttttactcagtggcagcaacaaacgcagtctgttggctagtgatcctcctgtctcagggacacgtagtccagggagcagccaattgcttggcacttggggaccccgttctggggagtcctgaaagctttcacctcttggattgccgaatacatgggtggcccttcctagactaagggactggcctgagtgaggctgggcctctcagccaagctgatgttgaaccactgctgtggggatgggcctggggttcctgggaagctgttcatacccattgccaggagcgtgggctctggctggacctggatcagatcctaactgaagcggcagctttctggcatgagaaaggagtgttttcatggtggacagaattgggctatgagtgt
(SEQ ID NO:35)
호모 사피엔스 리보좀 단백질 L29 (RPL29)
atatctctgccaacatgaggacagaaggactggtgcgaccccccacccccgcccctgggctaccatctgcatggggctggggtcctcctgtgctatttgtacaaataaacctgaggcagg
(SEQ ID NO:36)
호모 사피엔스 리보좀 단백질 L31 (RPL31)
agggagccctcctggaagtggatgaggccttgggtctcggctcttcattgcttcctgagctgcagcagatgcctttacaaccaagctcaccgaggacgtctgtctcccatattaccctggcagagggccaggcctgttctacacggccggggtttcaacaaggtactgatgtcttctgcccttgcctcttcgacaggcaagtaataagacttaagtgaagagaattctttaggcacacaaattcacatttgatgtaatctcattatacttcctgatctgtgattgaaaactttcatttcgtaactagtatgtctgtcccacctttaaaaagtttttcattatgaaagtaagtatttgttagaattaagtctatttaaatgaaaaaaacttagatatgagtctgcatggcctcaggaaaatgatgttttaaaatagagattttaggttgtctgcactctagcttttttgtcgttttcttaaggcttttttaactgcatcaaaaattcagatacgaaacatacactaaaaaataatacatcatatcttaatttccactgaacttgatttaaattcagagttacacagtatgaatatcacaatcagatatgttcaaaaaggtctgaacaattgattttctgaaaccatgaaggactac
(SEQ ID NO:37)
호모 사피엔스 리보좀 단백질 L31 (RPL31)
agccatttaaattcattagaaaaatgtccttacctcttaaaatgtgaattcatctgttaagctaggggtgacacacgtcattgtaccctttttaaattgttggtgtgggaagatgctaaagaatgcaaaactgatccatatctgggatgtaaaaaggttgtggaaaatagaatgcccagacccgtctacaaaaggtttttagagttgaaatatgaaatgtgatgtgggtatggaaattgactgttacttcctttacagatctacagacagtcaatgtggatgagaactaatcgctgatcgtcagatcaaataaagttataaaattgccttc
(SEQ ID NO:38)
호모 사피엔스 리보좀 단백질 L32 (RPL32)
tcaacttagcagaaatgctgcgctgggtataataaagcttttctacttctagtctagacaggaatcttacagattgtctcctgttcaaaacctagtcataaatatttataatgcaaactggtccttc
(SEQ ID NO:39)
호모 사피엔스 리보좀 단백질 L35a (RPL35A)
actaacgaaaaatcaataaataaatgtggatttgtgctcttgtatttttaagtggattaaaaaacttactacctt
(SEQ ID NO:40)
호모 사피엔스 리보좀 단백질 L37 (RPL37)
ttacttgtaacctggaatggctttataatgtgctagctaattgctactctcatcttgtattttaactcctaatttacccttcaggtctcagcttcagaacattcacttataaagaaaccctgctgattaaatctctcttgggcttcctccc
(SEQ ID NO:41)
호모 사피엔스 리보좀 단백질 L37a (RPL37A)
acgctcctctactctttgagacatcactggcctataataaatgggttaatttatgtaac
(SEQ ID NO:42)
호모 사피엔스 리보좀 단백질 L38 (RPL38)
accagacacactgattggaactgtattatattaaaatactaaaaatcct
(SEQ ID NO:43)
호모 사피엔스 리보좀 단백질 L39 (RPL39)
ggaattgcacatgagatggcacacatatttatgctgtctgaaggtcacgatcatgttaccatatcaagctgaaaatgtcaccactatctggagatttcgacgtgttttcctctctgaatctgttatgaacacgttggttggctggattcagtaataaatatgtaaggcctttcttttt
(SEQ ID NO:44)
호모 사피엔스 리보좀 단백질, 라지, P0 (RPLP0)
tcaccaaaaagcaaccaacttagccagttttatttgcaaaacaaggaaataaaggcttacttctttaaaaagt
(SEQ ID NO:45)
호모 사피엔스 리보좀 단백질, 라지, P1 (RPLP1)
acctcttttataacatgttcaataaaaagctgaacttt
(SEQ ID NO:46)
호모 사피엔스 리보좀 단백질, 라지, P2 (RPLP2)
attcctgctcccctgcaaataaagcctttttacacatctc
(SEQ ID NO:47)
호모 사피엔스 리보좀 단백질 S3 (RPS3)
actcataaattggtcatcttaaccatttaagtgtacacttctatagtgacagagttagccctctgtccaagggatttgcatctgtggattcaaccaactttgggtcaaaaataatcaaaaaggatggttgtgtgtgtattgaacatgtagacttatttttcttattttcaaaatactatattttcttgtcacttattttcttgtacactgcagttgtaacagctatgtagcatgtacattaggtattaaaagtaatccagtgaagattgaaagtct
(SEQ ID NO:48)
호모 사피엔스 리보좀 단백질 S3 (RPS3)
cagcctcttccatgagtggggagcccgctgcttgtctccagctcctagcagtgagtcctgataatctcaaatttaaggacagtaactttgtctgggatgagtgtgggaaaggatgtgtttgggaacagacgcgagcctgcagaggtgtttgtaaccatctctttctaagtggtgggaagcagacattttattctttaactgttaatatatatagtgtgtgttttttatgcatgaaatattttatagtttttaaaaatgcccacactactattttgaaagtaaatgaggtaatgtatgtgtcagaacccaatacccaaagcgatcgtagtaagaggtggggcctttgggaaggcattaaattgcttagggaatgagggtggaaccctcatgaatgagattagagccttataggagaggttggagggagttgcctggcctccctctcccatgtgaagactcagcaagaaaacattatttaggaagcagagagccctcatcaaacaccagatctgctggccacctgatctggcactttccagccttcagaactgtgagaaataaatttctgttgtctat
(SEQ ID NO:49)
호모 사피엔스 리보좀 단백질 S3A (RPS3A)
agttcagacttcaaatagtggcaaataaaaagtgctatttgtgatggtttgcttctg
(SEQ ID NO:50)
호모 사피엔스 리보좀 단백질 S3A (RPS3A)
gttagctaagagggtgtaatggaaaaagcataaggcttggactcagaagactctactaactttgccactagctagctatgtaattcagatcatctatcctttacatgtgaaaggtaaataatggcttatcttaacaggaggatttatgcaggttaaatgaggtaggtgttatgtgtaggtttattccaaggcttctctacttttaaaggaaatggcttatatctgagaactaggacttttagaaaaaaatttactgttactggtttgcaggattccagacagcattggaaaagacatag
(SEQ ID NO:51)
호모 사피엔스 리보좀 단백질 S4, X-연결된 (RPS4X)
aatgggtccctgggtgacatgtcagatctttgtacgtaattaaaaatattgtggcaggattaatagca
(SEQ ID NO:52)
호모 사피엔스 리보좀 단백질 S4, Y-연결된 1 (RPS4Y1)
attgcagtagcagcatatctttttttctttgcacaaataaacagtgaattctcgtttctt
(SEQ ID NO:53)
호모 사피엔스 리보좀 단백질 S5 (RPS5)
ttttcccagctgctgcccaataaacctgtctgccctttggggcagtcccagcc
(SEQ ID NO:54)
호모 사피엔스 리보좀 단백질 S6 (RPS6)
gattttttgagtaacaaataaataagatcagactctg
(SEQ ID NO:55)
호모 사피엔스 리보좀 단백질 S7 (RPS7)
acaaaaatgactaaataaaaagtatatattcacagt
(SEQ ID NO:56)
호모 사피엔스 리보좀 단백질 S8 (RPS8)
atccttgttttgtcttcacccatgtaataaaggtgtttattgttttgttcccaca
(SEQ ID NO:57)
호모 사피엔스 리보좀 단백질 S9 (RPS9)
gtccacctgtccctcctgggctgctggattgtctcgttttcctgccaaataaacaggatcagcgctttac
(SEQ ID NO:58)
호모 사피엔스 리보좀 단백질 S10 (RPS10)
aattggagaggattcttttgcattgaataaacttacagccaaaaaacctt
(SEQ ID NO:59)
호모 사피엔스 리보좀 단백질 S11 (RPS11)
ggctggacatcggcccgctccccacaatgaaataaagttattttctcattcccaggccagacttgggatcttccgcg
(SEQ ID NO:60)
호모 사피엔스 리보좀 단백질 S12 (RPS12)
agaaataaatctttggctcac
(SEQ ID NO:61)
호모 사피엔스 리보좀 단백질 S13 (RPS13)
atttgtctgtgtactcaagcaataaaatgattgtttaacta
(SEQ ID NO:62)
호모 사피엔스 리보좀 단백질 S15 (RPS15)
tggctcagctaataaaggcgcacatgactcc
(SEQ ID NO:63)
호모 사피엔스 리보좀 단백질 S15a (RPS15A)
ggatgtaatacatatatttacaaataaaatgcctcatggactctggtgcttcc
(SEQ ID NO:64)
호모 사피엔스 리보좀 단백질 S16 (RPS16)
gcccatcgtgactcaaaactcacttgtataataaacagtttttgagggattttaaagtttcaag
(SEQ ID NO:65)
호모 사피엔스 리보좀 단백질 S19 (RPS19)
aacaaaccatgctgggttaataaattgcctcattcgt
(SEQ ID NO:66)
호모 사피엔스 리보좀 단백질 S20 (RPS20)
ctgcattctcctccgccaaaaaagtgaccaagcagagtctttctctgtcacccaggctggagtgcaatggcgtgatctcagctcactgcaacctctgcctcctgggttcaagtgattctcgtgtctcagcctcctgagtagctgagactacaggtgtgcaccagtgttcccagctgatttttgtattttatgtagagatggggttatgccattttggccaggctagtctcgaactcctgagctcaggtgatacacacacctcagcaaatcttttaaattatacattctgtgatatttccttgactttcttatccagcacttgtattgattatttttcattttgataatgttgggtttttaaaaactcctttatgatggaaaatttc
(SEQ ID NO:67)
호모 사피엔스 리보좀 단백질 S20 (RPS20)
gtcaactattttaataaattgatgaccagttgttaacttctgttggtttttattcagaatactggcagattttaggaatataaaggtgtactatgagacttccacttttcaggtggaatatatgggtatcttagagtggtctatcctgttttcgttgtcgtttgagtcatttgaaaactggattccgttaactacataatatgtgagacctgactggttttattggacactggcagtttataactttggcatactctagataaattctgattggtatgggg
(SEQ ID NO:68)
호모 사피엔스 리보좀 단백질 S21 (RPS21)
ctggagagaatcacagatgtggaatatttgtcataaataaataatgaaaacct
(SEQ ID NO:69)
호모 사피엔스 리보좀 단백질 S23 (RPS23)
acttaactcaaaatggatcatatatctaaatgtaaaatggaaagctataaaactgaaaacagactatctttacaacctaggcgtaggtatagtttttagacattacaccaaaagcacatgccgtaaaagaaaaaatagataaattggtggatttcattaaaattaaaaaactttttctctctgaaaaatcctgttaagctgggcgctgtggttcatgcctgtaatcccagcactttgggaggctgagttgggaagaaattaatagcttgaggccaggagttcaagatcatcctgggcagcaaagtcatacactcttgagggaagagagagaccttctcatattgttttatattgttttatactcagtacctgttttaagaaaaaaacaaggaagtgaaatcaaagacaggcagcccggcaccaggcctgaaaccagccctgggcctgcctggcctaaacctagtagttaaaaatcaacttacgacttagaacctgatgttatccgtagattccaagcattgtataaaaaaattgtgaaactccctgttgtgttctgtaccagtgcatgaaacccctgtcacatatcccctagattgctcaatcaatcacgaccctttcatgtgaaatctttagtgttgtgagcccttaaaagggacagaaattgtgcacttgaggagctcagattttaaggctgtagcttgccgatgctcccagctgaataaagcccttccttct
(SEQ ID NO:70)
호모 사피엔스 리보좀 단백질 S25 (RPS25)
ataggtccaaccagctgtacatttggaaaaataaaactttattaaatc
(SEQ ID NO:71)
호모 사피엔스 리보좀 단백질 S26 (RPS26)
ggagctgagttcttaaagactgaagacaggctattctctggagaaaaataaaatggaaattgtactt
(SEQ ID NO:72)
호모 사피엔스 리보좀 단백질 S27 (RPS27)
aagcactctgagtcaagatgagtgggaaaccatctcaataaacacattttggataaatcctg
(SEQ ID NO:73)
호모 사피엔스 리보좀 단백질 S27a (RPS27a)
ctgtatgagttaataaaagacatgaactaacatttattgttgggttttattgcagtaaaaagaatggtttttaagcaccaaattgatggtcacaccatttccttttagtagtgctactgctatcgctgtgtgaatgttgcctctggggattatgtgacccagtggttctgtatacctgccaggtgccaaccacttgtaaaggtcttgatattttcaattcttagactacctatactttggcagaagttatatttaatgtaagttgtctaaatataa
(SEQ ID NO:74)
호모 사피엔스 리보좀 단백질 S28 (RPS28)
gcttggctgctcgctgggtcttggatgtcgggttcgaccacttggccgatgggaatggtctgtcacagtctgctccttttttttgtccgccacacgtaactgagatgctcctttaaataaagcgtttgtgtttcaagtt
(SEQ ID NO:75)
호모 사피엔스 리보좀 단백질 S29 (RPS29)
atgctcttccttcagaggattatccggggcatctactcaatgaaaaaccatgataattctttgtatataaaataaacatttgaaaaaacccttc
(SEQ ID NO:76)
호모 사피엔스 리보좀 단백질 L15 (RPL15)
ccatgtcttccaggagactagactactgttgtccagggtcaatttgagtgtaaagaaaatgtagacaaggaattgcccaattttaaattctgactttgctgacttaatttaaatgctcgttctgaaccaattttctcctatcttctctaggggtttcaaaagactcagttaattgatttccaggaagtactcatagcaagttcataaaagttcttgagacctaaatttcttcacaaaaaaagaaaagatcttaagtcatacattttaattgtgtagaggttgttcaactgaaggaataaatgtctattaaactaaaacaaatggaccttc
(SEQ ID NO:77)
호모 사피엔스 리보좀 단백질 L15 (RPL15)
atagataatacattaacgttaaaaattcaaaagataagtataggctctacagtacaaacccttctgcctcctagttcctctccctggaggcaaggtgatcagtttaacaatatttttttattttgagacagggtctcactgttgcccaggctggagtgtagtggcgcgttcacaacttactgtagcctcaacctcctggctcaagcaatcctcccacctcagcctgtcgagtagctggaaccacaggtgcacaccaccatgccaggctaatttttgtattttttgtagagacagggtttcaccatgttgttcaggctggtctcaaagtcctgggctcaagcaatcttcctgtctctgcttcccaaagtgctgggattacagatgtgggccacggtgcctggcctacatatgtattttttccttttcttccccaagtggtaggatatgatacacattgttgatttttttgtttagttatgtatctcagagcttattctttatcagctcatgaggaacttcatttttttttttttttttgagatgtagttttgctcttatagcccaggttggagtacagtaacacaatcttggctcgcagcaacttctgcctcccaggttcaagcgattctcctgcctcagcctccgagtagctaggattacaggtgcctgccactacatccagctatttttgtattttcagtagagacggggtttcaccattttggccaagctggtctcgaactcctgacctcaggtgatccgcccatctcagcctcccaaagtagtgggattacaggcatgagcaaccgtgcccggctggaacttcattcttttggtataactgcatggtatcccatcatgtggatgtaccatgattcattggatgtggaccctcctgatggacatttaaatttcttccaatctgttgctattacaaaaagaaaaatgtgtgcatacatctttattcatctgtagaataaattcttagaagt
(SEQ ID NO:78)
호모 사피엔스 리보좀 단백질 S2 (RPS2)
ggtttttatacaagaaaaataaagtgaattaagcgtg
(SEQ ID NO:79)
호모 사피엔스 리보좀 단백질 L14 (RPL14)
gtggcaatcataaaaagtaataaaggttctttttgacctgttgacaaatgtatttaagcctttggatttaaagcctgttgaggctggagttaggaggcagattgatagtaggattataataaacattaaataatcagttc
(SEQ ID NO:80)
호모 사피엔스 리보좀 단백질 S14 (RPS14)
acaagattcctcaaaatattttctgttaataaattgccttcatgtaaactgtttc
(SEQ ID NO:81)
호모 사피엔스 리보좀 단백질 L10 (RPL10)
tctagcgtcccagccagtgtttttcctgacctctgttctttggagaggaggatggaagggaggggtccggcacgctgctggcattttgctgtgtcctgcagcccctttccgggacacctgggttcacacagctttttagcttacataactggtgcagattttctgtgtggagatgttgccttgaccagccttggctggactttaccaggcatgcagaagcctgtaccaacacagactacagcacccaggaggtgcgagtgtggctgctcagcggttataacaggcctgactgcattgttcaccggattataatgagccaaaatgtttcccggtgtttgctggtttcagggaaggagtttgatatagcagattaaccaccctccttgtagctattggggcttaatggtttcctggtgattcttaccaatccacaataaacatggcccattggcatatctgc
(SEQ ID NO:82)
호모 사피엔스 리보좀 단백질 L10a (RPL10A)
ggcacatttgaataaattctattaccagttc
(SEQ ID NO:83)
호모 사피엔스 리보좀 단백질 L35 (RPL35)
ggggcgcattgtcaataaagcacagctggctgagactgc
(SEQ ID NO:84)
호모 사피엔스 리보좀 단백질 L13a (RPL13A)
gcccaataaagactgttaattcctcatgcgttgcctgcccttcctccattgttgccctggaatgtacgggacccaggggcagcagcagtccaggtgccacaggcagccctgggacataggaagctgggagcaaggaaagggtcttagtcactgcctcccgaagttgcttgaaagcactcggagaattgtgcaggtgtcatttatctatgaccaataggaagagcaaccagttactatgagtgaaagggagccagaagactgattggagggccctatcttgtgagtggggcatctgttggactttccacctggtcatatactctgcagctgttagaatgtgcaagcacttggggacagcatgagcttgctgttgtacacagggtatttctagaagcagaaatagactgggaagatgcacaaccaaggggttacaggcatcgcccatgctcctcacctgtattttgtaatcagaaataaattgctttt
(SEQ ID NO:85)
호모 사피엔스 리보좀 단백질 L36 (RPL36)
gcccctcccctgccctctccctgaaataaagaacagcttgacag
(SEQ ID NO:86)
호모 사피엔스 리보좀 단백질 L36a (RPL36A)
gtgtcatcttttattatgaagacaataaaatcttgagtttatgttcacttcatttgtttgctgttcatcttttgggagggaataagctagagccatcaatacaattccgcttgtggggaaatttatgcctcttactggtactacttgttttgcattgaagctgactggttgagttcacatcatatgttgcaattttctaatttggcacttcaatcactaggggccttatgaggcagtttgtcattatgcaatggttattggttatcatgtgagtagacacatttcaggctaatagggagaagtcagtaacacattcatagtgaatatgagatgtctttgctaagagttaagtgtcagatctttgttataacagttaatttaataaagaattttggcattgttcttc
(SEQ ID NO:87)
호모 사피엔스 리보좀 단백질 L36a (RPL36A)
gcgggtggatcacctgaggtcaggagttcgagaccagcctggccaagatagtgaaaccccgtctctagtaaaaatacaaaaattagccgggcttgtggtgtgggcctgtaatctcagccacccgggaggctgaggcaggagaatcgctggaacctgggaggcagaggctgcagtgagccgagatcacgccactgtactccagcctgggcgacagagcaagactccatctcaaaaaaaaaaaaaaaaaaaagggaaaaagaaaatgcacctatacacagtggtactattcagccataaaaagaatgagatccagtcatttacaacaacatgggtggaactggagatcgttatgttaagtgaaataggcacacaaagacaagcatcacatgttcttgtttgtgggatctaaaaatcaaaacaagtggacttgtcatatagagagtagaaggatggttaccagaagctgagaacttctggtggcgggaggtggggatggttaatgggtacaaaaagaaaaaagaatgaattagaccaactatttgatagcacgacagcgtgactaaagtcaataacttagttacatattttaaaataacttagagtgtaattggattgtttgtacctcaaagaaaaaatgcaataaaactttacagtggagaaacctaacaagcactacctcagccaggtaatcaaggttaacatcaacagtcacgagtcatgttgatatatacccttgataaggtgtgatgaaaatgacacttaaacctaaaaatccataaccctatctaatgagaaaaataacaaatcccaagaggggcattttacaaaatacttgaccagtagtgcggaaattgtcaaggtcatcaaaaaagtctgagaaattgccacagccaaaggagtctagagacatgatgactaaatgttaggtggtgtcctgcgtggggtcctagaacagaaaaaggacattag
(SEQ ID NO:88)
호모 사피엔스 리보좀 단백질 L41 (RPL41)
accgctagcttgttgcaccgtggaggccacaggagcagaaacatggaatgccagacgctggggatgctggtacaagttgtgggactgcatgctactgtctagagcttgtctcaatggatctagaacttcatcgccctctgatcgccgatcacctctgagacccaccttgctcataaacaaaatgcccatgttggtcctctgccctggacctgtgacattctggactatttctgtgtttatttgtggccgagtgtaacaaccatataataaatcacctcttccgctgttttagctgaagaattaaatc
(SEQ ID NO:89)
호모 사피엔스 리보좀 단백질 S18 (RPS18)
gtctgtaggccttgtctgttaataaatagtttatatac
(SEQ ID NO:90)
호모 사피엔스 리보좀 단백질 S24 (RPS24)
agtgtctagcagtgagctggagattggatcacagccgaaggagtaaaggtgctgcaatgatgttagctgtggccactgtggatttttcgcaagaacattaataaactaaaaacttcatgtgtctggttgtttg
(SEQ ID NO:91)
호모 사피엔스 리보좀 단백질 S24 (RPS24)
ccaccgtgcctggctggacatcttgttattaaagcttcttctctctttgtaggggagggggagatgcctctggtggagaagaccagtgtggcagtgactgtgtctgttagtgaacctggtggctggttgagggtctgtcgtggtgactgaggacacatacaaagtgcttttctcagtggtcaccttggtgttggtgaataagggtcagaagatggctcctgtcctagggcactgccagtcggtttggaagctgaaatgcctgcttagcagtttgaggaaacacagaccttggaggatcttctggttgcctcttcaagaattcattctattccccttctgctccccaaatttgcttttcttggggtgggtcttggttggcctaagccaagaaagtatggcatctactccttccatagcaatagctcaggaataggcagtgacccagacctgaaccaatcagtgcatggaattacccctggccaaagtggttgattgaggctgggtgcaagcagagttgtgagaaggctcccatttggtggttggagagatcgcacttgctccagaggtcataatgtgcagatctgaggcttggaactgctgcagacattttgctaccacaagtgaagccaccctgacgacacagttgacaatttggagcagggcagagctgagagaacagcagggaaacagccagagtcttgctcaagcctccctgaagtatctatacccctggactctagttatgggggctaataaatgttatatactgtttaaggt
(SEQ ID NO:92)
호모 사피엔스 리보좀 단백질 L8 (RPL8)
tgctgagggcctcaataaagtttgtgtttatgcc
(SEQ ID NO:93)
호모 사피엔스 리보좀 단백질 L34 (RPL34)
aaaaatgaaacttttttgagtaataaaaatgaaaagacgctgtccaatagaaaaagttggtgtgctggagctacctcacctcagcttgagagagccagttgtgtgcatctctttccagttttgcatccagtgacgtctgcttggcatcttgagattgttatggtgagagtatttacacctcagcaaatgctgcaaaatcctgttttcccccagagagctggaggttaaatactaccagcacatccctagatactactcaagttacagtatatgatcactaatatagtatgctcttggtaccaggagctctgatatatatctggtacatgtttgataatgacttgattgttattataagtacttattaatacttcgattctgtaaagagtttagggtttgattttataaaatccaaaatgagccttttattgaatccagttctctatgtgaccagttctctgtatgaatggaagggaaaagaattaaaaatcttgcaaagggg
(SEQ ID NO:94)
호모 사피엔스 리보좀 단백질 L34 (RPL34)
aaaaatgaaacttttttgagtaataaaaatgaaaagacgctgtccaatagaaaaagttggtgtgctggagctacctcacctcagcttgagagagccagttgtgtgcatctctttccagttttgcatccagtgacgtctgcttggcatcttgagattgttatggtgagagtatttacacctcagcaaatgctgcaaaatcctgttttcccccagagagctggaggttaaatactaccagcacatccctagatactactcaagttacagtatatgatcactaatatagtatgctcttggtaccaggagctctgatatatatctggtacatgtttgataatgacttgattgttattataagtacttattaatacttcgattctgtaaagagtttagggtttgattttataaaatccaaaatgagccttttattgaatccagttctctatgtgaccagttctctgtatgaatggaagggaaaagaattaaaaatcttgcaaagggg
(SEQ ID NO:95)
호모 사피엔스 리보좀 단백질 S17 (RPS17)
attttttctgtagtgctgtattattttcaataaatctgggacaacagc
(SEQ ID NO:96)
호모 사피엔스 리보좀 단백질 SA (RPSA)
gctgttcttgcataggctcttaagcagcatggaaaaatggttgatggaaaataaacatcagtttctaaaagttgtcttcatttagtttgctttttactccagatcagaatacctgggattgcatatcaaagcataataataaatacatgtctcgacatgagttgtacttct
(SEQ ID NO:97)
호모 사피엔스 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52)
ccagtttggggactttcacaaaagacccccatgactcagggttttgagttcttaactgatcgaatgaaggattcaaaattaaccactccaaggggggattgaaggaagaaccactcttaatggacaaaaagaaagaaaggggagggagtaacagggatatgagctctagccgcccaagctagcaatggcaacccttctgggtccccttccagcatgtggaagctttcctttcgcttcattcaataaacagctgctgctc
(SEQ ID NO:98)
호모 사피엔스 Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU)
gtcttttgtaattctggctttctctaataaaaaagccacttagttcagtcatcgaaaa
(SEQ ID NO:99)
호모 사피엔스 리보좀 단백질 L22-유사 1 (RPL22L1)
tgtactgctgagcctgatggtggtgccactacttcaggtacttagatgagtcttgatgctaatagaattgtgtcgccaaacatatctggacagttacaacctaatctatgcattaattggtttgggaattgcttgaaattattgtttaattcaatgttttaattcgttttcctaaaaatttaagtgcccccatcatcgtgcaatacctcagtgcagcaactccttgattcttggatgactgaacttcctaacttggctctgccccattgttcccatttttcatgtttttcacaaatagttaaccaggtacctactactgtgcaccgctgcagagcattgaggatgtatgtgatgagtaaaaacacccagcctgctctgctgtgttagtattatgacggaaactgatcaaatcacatgtgaacaaatttactgctacaaaagggagggcttaataaaaggaatttcatctgggaaggc
(SEQ ID NO:100)
호모 사피엔스 리보좀 단백질 S17 (RPS17)
attttttctgtagtgctgtattattttcaataaatctgggacaacagc
(SEQ ID NO:101)
호모 사피엔스 리보좀 단백질 L39-유사 (RPL39L)
ggaattgcacatgagatggcacacatatttatgctgtatcaagttcacgatcatcttacgatatcaagctgaaaatgtcaccactacctggacagttgcacatgttttactgggaatatttttttctgtttttctgtatgctctgtgctagtagggtggattcagtaataaatatgtgaaagcttttgtttcc
(SEQ ID NO:102)
호모 사피엔스 리보좀 단백질 L10-유사 (RPL10L)
aggttttggcagtactgtctccttgggccatgctggtctgacttatgcttactaataaattctgtttactggc
(SEQ ID NO:103)
호모 사피엔스 리보좀 단백질 L36a-유사 (RPL36AL)
actttgggatatttttcttcaattttgaagagaaaatggtgaagccatagaaaagttacccgagggaaaataaatacagtgatattcttacgc
(SEQ ID NO:104)
호모 사피엔스 리보좀 단백질 L3-유사 (RPL3L)
gctgtgtggggtggatgaaccctgaagcgcaccgcactgtctgccccaatgtctaacaaaggccggaggcgactcttcctgcgaggtctcagagcgctgtgtaaccgcccaaggggttcaccttgcctgctgcctagacaaagccgattcattaagacaggggaattgcaatagagaaagagtaattcacacagagctggctgtgcgggagaccggagttttatgttttattattactcaaatcgatctctttgagc
(SEQ ID NO:105)
호모 사피엔스 리보좀 단백질 S27-유사 (RPS27L)
tgattcaaacagcttcctgaattttaattttgtgttgtctcacagaaagccttatcataaattccataattctaattaatttaccaagataatgtaattacatttggttttgtaaggtatacagcagtaatctcctattttggtgtcagtttttcaataaagttttgattatgggcaaatcccctctttttctttttttaaaatatatttgagtatgccatacatttatatatatggtgtatatgaatttggtttaaacattttaaaatttattctgattagtttgtgtctttttttttttttttgagagagagagtcctgctctgtcactcaagctggagtgcagtggtgcgatctcggctcactgcaacctccgcctcccaggtccaagcaattctcttgccttgtcctcccaagtagctgggattataggcacacaccaccatgcctggctaatttgtgtctcattttcaagagtagaaaccctaaatattttattttcattccttttccaaattgctatgaatgggattaaaggattacagatgtaaagtctattatttgtgaattctaaatgtagttctgctgttgtacctgtggaaacatcttaaagaagtacatattttgcacgtcctgcacgtgtaccccagaacttaaactataattaaaaagaatagtttcaaaaaaataca
(SEQ ID NO:106)
호모 사피엔스 리보좀 단백질 L26-유사 1 (RPL26L1)
atagaacctgttgtgcaaccacggtttaaccggagattttgaggctagggtgtgtttctttcgaacttttcggaatgtctggaacatttcatttcctgttttgttacctgtgcctctgtaaatctacttttgcaattttaagtaataattttatgaataaaaatgggaaatgcttcctaattccacatagtatttgcattgttttataaataaattccacttactatc
(SEQ ID NO:107)
호모 사피엔스 리보좀 단백질 L7-유사 1 (RPL7L1)
acccaggtgaggcagggctgaaaactgcccttgggctgacttttgataggccatgccttgccactttacaagttctttttgcatttactagtatttaagagtaaccttgagattgggaggaatagaggaggctggtacaaatagatggagacctgctgggatcagtgaatgcctgattaggacatggggctatgcatagcctaagagttataggcttaaagatgtcgagtaactaaaaactgtattgctggccgggcgcggtggctcacgcctgtaatcccagcactttgggaggccaaggcgggcagaccatgaggtcaggagattgagaccatcctggccaacatggtgaaaccctgtctctactaaaaatacaaaaatgagctgggtgtggtggcacgtgcctgtagtcccagctactcgagaggctaaggcaggaaaatcgcttgaacccaggaggcagagattgcagtgagccaagattgcaccagtgcactccagctgggcgacagagcgagactccatctcg
(SEQ ID NO:108)
호모 사피엔스 리보좀 단백질 L13a 위유전자 (RPL13AP)
gtggaaaagaacatgaaaaagaaaactgacaaatacacacaggtctcctcaagatccatggacttctggtctgagcctaataaagactgtttgtttattcctcaaaaacaaacaaacaaaaaaaaaccctctgtattataaattattctgtgtaatggtgtgttaccatacatt
(SEQ ID NO:109)
호모 사피엔스 리보좀 단백질 L37a 위유전자 8 (RPL37AP8)
atgctcctctactctttgagacatctctggcctataacaaatgggttaatttatgttaaaaaaaaaaaaagagagagagagtgaaacaacaatctacacaatcagagaaaatatttgcaaatcttatatctgattagaaattagtatctggaacat
(SEQ ID NO:110)
호모 사피엔스 리보좀 단백질 S10 위유전자 5 (RPS10P5)
aattggagaggattatttcacattgaataaacttacagccaaaaaa
(SEQ ID NO:111)
호모 사피엔스 리보좀 단백질 S26 위유전자 11 (RPS26P11)
ggagctgagttcttaaagactgaagacaggctattctctggagaaaaataaaatggaaattgtactt
(SEQ ID NO:112)
호모 사피엔스 리보좀 단백질 L39 위유전자 5 (RPL39P5)
ggaattgaacatgagatggcacacatatttatgctgtctaaaggtcacaatcatgttaccatatcaagctgaaaatgtcaccactatctggacagttggacatgtttttttgggaatatactttttctctctgaatctgttaggaactttctggttggctgggttccgtaataaatacatgagacctttcatttcaaaaaaaagaaaaataggcctccttcccaggggctccggatttcatcagccttctgtgcatgcccagccatacaaaccacgcagggatggctccaagtg
(SEQ ID NO:113)
호모 사피엔스 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6)
tcaccaaaaagcaaccaacttagccagctttatttgcaaaacaaggaaataaaggcttacttctttaaaaaataaataaataaataaataaataaataataaataaataaataaataaataaatagataaataaataaaaagttttctactcacactgaagtgacgaagtc
(SEQ ID NO:114)
호모 사피엔스 리보좀 단백질 L36 위유전자 14 (RPL36P14)
gcccccttcccctgccctctccctgaaataaagaatagcttgacagaaa
(SEQ ID NO:115)
보다 바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는, SEQ ID Nos: 116 내지 205에 따른 핵산 서열 또는 상응하는 RNA 서열과 같은, 리보좀 단백질 유전자의 3'-UTR의 핵산 서열에 대해 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%의, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100% 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다:
Mus 머스쿨러스(musculus) 리보좀 단백질 L9 (RPL9)
GGAGGCCTCAGTTCCTGGCCCCAGAAACGAGATCCTGACCACATGAACAATTTGGGCTCTTTTGGGAGAATAAAAGACTTATATATTG
(SEQ ID NO:116)
Mus 머스쿨러스 리보좀 단백질 L3 (RPL3)
TTCCAGGACCACTTTGTGCAGATGGTGGGGTCTCACCAATAAAATATTTCTACTCACACTGGTTTTCCC
(SEQ ID NO:117)
Mus 머스쿨러스 리보좀 단백질 L4 (RPL4)
ACTATTAAAAATTGTTAAATTCCAGAGAGCAAGTAGAGACCGCATATTTCAATAAATCAAACATGTGGTGACAAACCCTTGTGTGACTCTTAAATTGTGGATGTTTCCAAGCCCCTTG
(SEQ ID NO:118)
Mus 머스쿨러스 리보좀 단백질 L5 (RPL5)
AGCAGTTTTCTATGAAGATTTTTTCATAAAGACAATAAACATATTGATCAAGCAGCTTTTTCTGTGTTAAGCTGTTATTAATGAGACTATAGGAAATAGTGTGAAATTACAAAAGCAAAGAAGTAGATAGTTATTTAATTAATTAAATTAATTTTACCTTTTGTGTTGCACCATAACCTACCACTGGTGGGATTAAGGGCAAGTATTACCATGCCTAGCTGAGAGTCTTTCTCCAGGAAAAACCAGCTTACATGGGTTCCTGCAAATCTCATGAGTGTTTCTTGGGTTTCTAGTCTTCCTGGGAGGTGTCCTTATCTTTCAGATTTTCAGATCTGGTAATTAGCATGATCATCAGGACATTTATTACAAACAAATTGATTAGTGGGAAGAAAGTATCTCAAGGTCAATCTTGGAAGTGAACAACTGGTGCTAATCCATGGCTTTAAAGATTTGAGAACAACGGTGAAATTTGGTTTGAGGAGAAGGGGGTGTCTAGGACGTTTCATTTTTATGGTACATGCCAGACATGAATGTACATAGGAAAATAACTTGAAAGGGTCAAATATTAAACCTTGAATATCAGGTTCACTTGGGAAAGCATTAGGTGCTTATGCCTCTTAGTAAATAGCCCTTCATCCCAGAAGGAGCAAGAATTGTCTTCCTGACTTAATCCAGTCTTAGCTGAGGTGCTGTGCATCTTTATCATCTTTGCCTTGCCTCACAGTGTCAGGCTCTGTGGTACTGGGGCTACACAGGTCAGGTAAACAGTTAACTGCTTACCTACATCCCCAGCAAAGATAATGTGACGATACTAAGATGAACCTATCAGAGCTTAAAGATAATGAGTTTCAGTCACAGTGATAACTGCATGCTAACTTCAGCATGTAGAATATATGCCGAAGCTAAAAGCCATTCCACAGTTGACTCCATCTGAAGTTAAAGTGTGTAAGTACACAGTAAATCATGCTATATTAACTGAACTTTTTAATAAATGAGTCATTTGAATTT
(SEQ ID NO:119)
Mus 머스쿨러스 리보좀 단백질 L6 (RPL6)
ATTGTTAACCTAATTAAACAGCTTCATAGGTTCTTTTGGTGTCCTTTTTGTGTGTTGTGTGTGCACATGTTTGTTGGGTGGGTGTTTTGCTGGTGTCTTTTCCTCTGTGTCTTCCTCTGGCCCTTTCTGGAAAGACCTGCTTAATCTGAAGCATGTGAGCTAGGCTAGTCCACTGGGTCCTGCTCTCTGCCCATCCCCAGCTGGCTTTGGATTAGAGGCACATACACTGCCATGGCTGCCTTTTACTGTGGCTGTGGTTTTGCCCTTTTTTTTTAAGCAAATAGAAAATGCTGCTGACTATACTGG
(SEQ ID NO:120)
Mus 머스쿨러스 리보좀 단백질 L7 (RPL7)
GGTGTCACCCATTGTATTTTTGTAATCTGGTCAGTTAATAAACAGTCACAGCTTGGCAAATTG
(SEQ ID NO:121)
Mus 머스쿨러스 리보좀 단백질 L7a (RPL7A)
ATGTACACTAAATTTTCTGTACCTAAATATAATTACAAAATTATCTTGA
(SEQ ID NO:122)
Mus 머스쿨러스 리보좀 단백질 L11 (RPL11)
ACTTGATCCAAAAAGCTAATAAAATTTTCTCAGAAATGC
(SEQ ID NO:123)
Mus 머스쿨러스 리보좀 단백질 L12 (RPL12)
GAAGCAACAAGAAAATATTCCAATAAAAGACTATCTGATAACCAGTG
(SEQ ID NO:124)
Mus 머스쿨러스 리보좀 단백질 L13 (RPL13)
TTCTGTGTTGGAGAGCTGCAATAAATTTTCCATAAAGCAAAA
(SEQ ID NO:125)
Mus 머스쿨러스 리보좀 단백질 L23 (RPL23)
TTCTCCAGTGTATTTGTAAAATATATTCATTAAAGTCTCTGCTCTGAGAGCTGGTCTTCTTGACACCTTTTCCAATATCAGCTTTGCAGAAGGAAACTTAAATTTCAGTTCAGGGCATGACCTTCATGACCTTGCAGAACTTCTTCACTTTCCAGGTTAAGTAAAGGCGATCTTTAGGGGCTGTCCAGATGGATCAGCTATAAAGATTCAATTGTAGAAGGTTCACGTCTCAATGCCCACGTGGTAGCTGTAACTTCAATTAAAAAACAAAAACAGCCGGGCGTGGTGGTGCACGCCTTTAATCCCAGCACTTGGGAGGCAGAGGCAGGCGGATTTCTGAGGCCAGCCTGATCTACAGAGTGAGTTCCAGGACAGCCAGGAATACACAGAGAAACCCTTGTCTCCAAAAACCAAAAAAAACAAAACACGCATTCTTTTCAGGTCTTTGCTGGGACCAGGTACACATAACACAGATAAATATTAGAGCAAACCATGCACATATGGTAAATTATCTTTGGGTTTTGGGTCCCTAAAATAAAGTGGTGTGTTCATTGTG
(SEQ ID NO:126)
Mus 머스쿨러스 리보좀 단백질 L18 (RPL18)
CCCTGGATCTTAACTGTTAATAAAAAAAACATTGGATGATGATGGTA
(SEQ ID NO:127)
Mus 머스쿨러스 리보좀 단백질 L18a (RPL18A)
ACACAGAGACCCACTGAATAAAAACTTGAGACTGTCCTTGCTTGTTTGCTTCTATGTCCCTGGAGAGGTCCCAGTTGGTCCCGTCCCTAACAACATGCTAGCCCTGCTCACCTGCCTGTCAGCCTTGCTCAGTGGCATCTTTCCATAGGTGTGTATCCCCTTAGATTAGCTTCAGCCCCACTACGATTTGTCTAGGACATAGCCTGAGCCCTGCCTGTGACACTGAGGGGTAGCAGTCTGTTTCTGGACTCCAGGGTGCTGCTGTCTCAGGCCTAAGAATTCCAGACATGACTATAATCCAAGCCTGGGGACCTGGTTGAGCTTTTTATCCTGCTGGCTCTAAGCTTCAGCTAGGTGGAAATGAGGCCAGCCAAGCCCCACAGTGAGCTTGCAAGCTTTAGATGGGGACAGGGTTACGCTTTGGTGAATGATGGAGGAAACATGGGGGTTCCTTTTGTTGGGTGCAGCCAGCACGGCATCATCATGGTGCCCAATCTTGAAAGGGCACAGGCCTGAAGCTTCCTGGGACTGTTCTGTCACAGGGAGGAACCTACTGCAGTTGCCTACAATTGCTACCTCTGAGGGACTTGCCTCTGGCCCCTTGTAGACATTTCCATGTCTACACATGGCCCAGAGTACTTTCAGGGATAGCAATGTGTGAATGGCACTTAGAAGATAACATGTGAAAGCCAT
(SEQ ID NO:128)
Mus 머스쿨러스 리보좀 단백질 L19 (RPL19)
AGCTTCCCTCGTGTCTGTACATAGCGGCCTGGCTGTGGCCTCATGTGGATCAGTCTTTAAAATAAAACAAGCCTTTGTCTGTTGCCCTCTTGTTTAGC
(SEQ ID NO:129)
Mus 머스쿨러스 리보좀 단백질 L21 (RPL21)
CCAGTCCTTGGTTGTGGTGATTCTGTTAGCATTAAATGCACTGGAGAGCTTC
(SEQ ID NO:130)
Mus 머스쿨러스 리보좀 단백질 L22 (RPL22)
GGAAATGTCTTTATCAAGGGTTACCTTGGAAGAGGTCCCAACACTGTAGGGTGCTCCTGTTGTCAAAACCTATGCAGAGGCATCTGCTTGCTCTCTAATAACAGTATGCAATGCTAAAGGGCTCGCTTACAGCCGGTGGCCACACTGGAGGCCTGCACATCAGGTGGCCACAAGTTCTGCTGCTGCGCCTCCGAGGAAACACTTGGTCCTCCGATCGATTTTAACCTGTTGAGGCTTTGCAATCCCCCTGTGGCAAAGGCTCCAGTGTTTTCTATTTCTATGCAAATTTCTTGAAGCAGAACTGTTACTGTCTTTCTCCTCTGCCCTGGGAGGAGGCGCTAGCGTTTCCTTCCAACTTCAGGTGCAGCCCCCCTCGTGGTTAGCGGTCTTAAGTTCGTGACTTGGGTTTGCAGATCTTTTTTGTTACATCGCCGGACCATGTGGTGGTCTTTAGCTGTAAACAACATTAACCCTGGGTTGATTAGCATATGCTTCTAAAAGATGGTCCCAGATTCTGCGACTTGTAATAAAATGGAAACTTGCTGGTTTTTATGCCTTTCTAACTCTTGTATTTGAATGAATGTTGATCACTTTTTGTATTAAAGTGGCTGACACATGGCTACTGTCACTGTG
(SEQ ID NO:131)
Mus 머스쿨러스 리보좀 단백질 L22 (RPL22)
CTGTGGTAGAATGCTAGCCTGGTGTGCTCCAGGTTTAATCTCCATCACTGCAGAAATGAGTCCAAGCTGTGTGTACCTCCAGGGCACTGGGCATGGGGTTCCCTTGCCATTGTGTGTGCCCGGAGAACTGGCAGGCGGGAAATGTCTTTATCAAGGGTTACCTTGGAAGAGGTCCCAACACTGTAGGGTGCTCCTGTTGTCAAAACCTATGCAGAGGCATCTGCTTGCTCTCTAATAACAGTATGCAATGCTAAAGGGCTCGCTTACAGCCGGTGGCCACACTGGAGGCCTGCACATCAGGTGGCCACAAGTTCTGCTGCTGCGCCTCCGAGGAAACACTTGGTCCTCCGATCGATTTTAACCTGTTGAGGCTTTGCAATCCCCCTGTGGCAAAGGCTCCAGTGTTTTCTATTTCTATGCAAATTTCTTGAAGCAGAACTGTTACTGTCTTTCTCCTCTGCCCTGGGAGGAGGCGCTAGCGTTTCCTTCCAACTTCAGGTGCAGCCCCCCTCGTGGTTAGCGGTCTTAAGTTCGTGACTTGGGTTTGCAGATCTTTTTTGTTACATCGCCGGACCATGTGGTGGTCTTTAGCTGTAAACAACATTAACCCTGGGTTGATTAGCATATGCTTCTAAAAGATGGTCCCAGATTCTGCGACTTGTAATAAAATGGAAACTTGCTGGTTTTTATGCCTTTCTAACTCTTGTATTTGAATGAATGTTGATCACTTTTTGTATTAAAGTGGCTGACACATGGCTACTGTCACTGTG
(SEQ ID NO:132)
Mus 머스쿨러스 리보좀 단백질 L23a (RPL23A)
ACTGAGTCCAGATGGCTAATTCTAAATATATACTTTTTTCACCATAAA
(SEQ ID NO:133)
Mus 머스쿨러스 리보좀 단백질 L17 (RPL17)
ATTCAGCATAAAATAAAGGCAGATAAAGTTAAAGGTCTTCTGGTGGTCTTTAATGAGCCCTGTTGGGAGTGAGGTGCTTTAACATGGAGAAGCATGTTATTAAACAGTGAAATAGATGGTTCAAAACCACGTGACCATGT
(SEQ ID NO:134)
Mus 머스쿨러스 리보좀 단백질 L24 (RPL24)
TGTGGTAGAGCAGAGTTGGAAATAAAGCTCTATCTTTAACTCTAGG
(SEQ ID NO:135)
Mus 머스쿨러스 리보좀 단백질 L26 (RPL26)
AGACATCTCGTGCACGGCTTTCATTAAAGACTGCTTAAGT
(SEQ ID NO:136)
Mus 머스쿨러스 리보좀 단백질 L27 (RPL27)
GTATATTTTTGTTTTGGTCATTAAAAATTAAAAAAAAAAAAATACAAGTGTCTGCCTATTGCATTTGTGTGGGAAGAGACTGG GGAAATAAAACAGGTGTGCTGTTGTG
(SEQ ID NO:137)
Mus 머스쿨러스 리보좀 단백질 L30 (RPL30)
ACAAGAAAGTTTTCCTTTAATAAAACTTTGCCAGAGCTCCTTTTG
(SEQ ID NO:138)
Mus 머스쿨러스 리보좀 단백질 L27a (RPL27A)
AAGCCACACCGGAGGTTAATTAAATGCTAACATTTTCCATGTGGTCTTTGCATCCTTCCTTGTCTGCATGTTGGAAATCTGCCTAACATTCTAGGAAGAGGTGAGGTGTGGGCCCTTGAGAGTCAGTCTGTGGGAATAAGTGTAGCCCAACTATGCACAGTTGTAAATTCCTACATCCCCGTGTGTATTGGTCTTGATATTCAAAGAATTGATGAATGCCATTACTTTCAGTCCAAAGTGAAGAAACCTGGTCTCAAAAAATCCCGAGGACCAGAAATGAGATGGGTTTTCCTGAAAATCTAAAGTTCTTGAAAAACCTTGCCATCCAGATTGCTAGCAACTGCCTAGCTTTGTAAGCTTACTGTGATGGACAGGTAGCTCAGGACGACTGGTCACTTAATACTGGACAGATTAGCATGGAAAACTTAAGGGGAGGAGGAGGTAGTAGGTTCCATCCAGCTTCGCTTTGTTGGTGGCATCTAGGTGTTGTTCCAAGGGAGCATGCCTACCTGCAACAGGACATCACTGGTTGGGAATACTGTAGAACCAGAGCTGTGACCTTTGAACTACTAGAAAGATGAAATTTTATGTAAAGAGTACCTTGGAGTAAATAAATAAAGCCCAAGATCCTGATTGTCTA
(SEQ ID NO:139)
Mus 머스쿨러스 리보좀 단백질 L28 (RPL28)
GCCCCACACGCCCGAAGCAATAAAGAGTCCACTGACTTCC
(SEQ ID NO:140)
Mus 머스쿨러스 리보좀 단백질 L29 (RPL29)
AAAAGGCTCCTGCCAGTGTGAAGACAGACGGACTGCTGTGACACACCTCCCCACACACTATTTGCAGATGACCAGTGTCCTATGCTGTTCTTACAAATAAACTCAGGCAAGATCTGTTAGCTTG
(SEQ ID NO:141)
Mus 머스쿨러스 리보좀 단백질 L31 (RPL31)
CCTGCTCGTGTCAAATAAAGTTGCAGAACTGCCTTCAGGGTTTGGTTTTCCTTTCTGTTGTCTGCCTCATGGGTGGAATTTTTGGGTCTACAGGGTGTTGGAAATTAATCTGAGAATCTCTGTTCTGGGTACATGGGAAATTAGAAATACGTGAAACATTCTTTTCACAGAAGTCACTTTATTAGGATTGTGGATTTGGGTTGGTTTTGAAACAGGGTTTCTTGTGGCACTGCTTGTTCTATAGAATAGGGTGGCCTTGAACTCAGAAATCCACCTGCCTTTTCCTCCCTAGTATTGGCAATTAAATGCCCAGCTTGTTTGTAAGCTCTCATTTTCAGTTCCAGGTTTATGTGTGAGCCTAAGATTAGGTAAAGATTGAGGTTATAACTTAAACGTACTGAATTAACTTATGTTGTGTGGGTCCCAGGAATTGGACCTGGGACATCAACTCTGCCTTTCCAGCCATCTTTGCCAACCAGTAGCTCATCTCTGGGATGTGTCTGCCCTCAAAATGACATTTTAAAAAAGTCAGTACAAAAGAACGATTTTTATTAAAAACCTTGAGGACAAACATT
(SEQ ID NO:142)
Mus 머스쿨러스 리보좀 단백질 L32 (RPL32)
ATGGCTTGTGTGCATGTTTTATGTTTAAATAAAATCACAAAACCTGCCGTCGTA
(SEQ ID NO:143)
Mus 머스쿨러스 리보좀 단백질 L35a (RPL35A)
ACTAATGGAGAGTAAATAAATAAAAGTAGATTTGTGCTCTTGTATTTTTTTTTCACATCTGTCCTAAA
(SEQ ID NO:144)
Mus 머스쿨러스 리보좀 단백질 L37 (RPL37)
GGATTTCAATCAGTCATAAAATAAATGTTCTGCTTTCAAAAATTCTGTGGTGATCTAAGGTACTTTAACATCGGTTCAGAGTTCGGTTATATGATTGCTCTGGGATCCTACGCTTCTTCCTTCATAGTTCCTGTGGGTCCGAAGCTGGGAGGGGCTGGGTGGACTCTCGGGAAAGATACTCTGAGCCTGTCTCGGTCCCCATCGTGTTTGCTTGGCCCTGGGCATGGAAGTGGGTGAGTGATGAGCTGAACGAGCAGGCTTGCTAGAGATGAGGACAGTTACTGGTGTGGTTATATCACTACCATGCCTACAGTGTCTTAAGACGCTTACAGTCTGTAAGGGACTTAAATGATTTGAGCTCTTACTTATCCTGTAGTTTCTGATTTTTAACATTTACTTGAATAAAGCCAAGCAAGATAAGCCTTTATTCCCAGCACTTGGTGACAGGTGGATCTATGAGTTGGGGATCAGAGCTACACATTAAAACTCTTAATTCATCTTACT
(SEQ ID NO:145)
Mus 머스쿨러스 리보좀 단백질 L37 (RPL37)
GGATTTCAATCAGTCATAAAATAAATGTTCTGCTTTCAAAAAAAAAAAAAATTAATCCTCTGTGATGGCCAGCAGTTAACATTCAACAGTTTCTCTCTAGGCTCTTGATTCTCTGACTATTGTAGGGATTCGATCAGCACTCGCATACCAGAAGTGTGAGATGGTCCGTCCTTTTTCAAGACAAGATTTCTCTGTGTAGCCCTGGCTGTCCTGGAACCCACTCTGTAGACCAGGCTGGCCTTGAATTTACAGAGATCCCCTTGCCTCCGCTTGCTGAGTGCTAGGATTAAAGGCATGCGCACTATG
(SEQ ID NO:146)
Mus 머스쿨러스 리보좀 단백질 L37a (RPL37A)
AAGCCCTGCTGTCTGAGACTTGCCTAGCCTGCAATAAACGGGTTATTTACGTAACTTTTTTTTTTTTGCCTTGTTTGTGGTTAATTAAAACATTTGGTGTGTGTTCTATTTTTTATTTTCGAAAGATGCTTGTTTTGAGACATACTGTGTGACCCTGGCTGGCCTTGAGTGCCTGGTTCTCCTTACAAGTGTAGATACATCTGGCTTAAGATTTTAGTCTTTCAGAAATAAAAATGTTGCTAAGAC
(SEQ ID NO:147)
Mus 머스쿨러스 리보좀 단백질 L38 (RPL38)
ACCAGCCCTCTGCGTGTGACTATTAAAAACCCTGAAAAGTG
(SEQ ID NO:148)
Mus 머스쿨러스 리보좀 단백질 L39 (RPL39)
GGATTCACACAATGGCAAGACTGAGGATTTATACTGAATTGTCATCAATCAGTCCTACCAGATGGATTTCAACATTTAAACCTGGAGACTCTTCGTGTCTTGAATTAGGATGTTTGTCCAGTAATAAAATATAGAACCTTTCAAAATGCTTTTCTGGTTTATAAAGTACTGAATTGCCCTT
(SEQ ID NO:149)
Mus 머스쿨러스 리보좀 단백질, 라지, P0 (RPLP0)
TCCCGCCAAAGCAACCAAGTCAGCCTGCTTAATTTGAGAAAGATGGAAATAAAGGCTTACTTCTCTTAAAACTCCGGTCTGGATTTATTTAGTTTGTTCACTTAAGCAGGATGAAAAAGCAAAACCGCTACTGTTTACTTTGTGTTGGCATCTTTGTTTCTAAAATTAAAGCTCCTAGTGTTTTTGTGGGCTTTGTTTGTTTTTTGAGACAGTCTCTTGACTTGGTGCCATAGCTAGTCTGGGACAAAGATTTTCCAGGTGTGAATTAAAGGTGTATGTCATCAA
(SEQ ID NO:150)
Mus 머스쿨러스 리보좀 단백질, 라지, P1 (RPLP1)
ACTGCTTTTGTTAAGTTGGCTAATAAAGAGCTGAACCTGT
(SEQ ID NO:151)
Mus 머스쿨러스 리보좀 단백질, 라지, P2 (RPLP2)
ATTCCTGCTCCCCTGCAAATAAAGTCTTTTTATGTATCTTGA
(SEQ ID NO:152)
Mus 머스쿨러스 리보좀 단백질 S3 (RPS3)
AATAAAGTGTGCAACCTTCATCTGGTTGATTAAA
(SEQ ID NO:153)
Mus 머스쿨러스 리보좀 단백질 S3A (RPS3A)
AATCCAGATTTTTAATAGTGACAAATAAAAAGTCCTATTTGTGATCGTT
(SEQ ID NO:154)
Mus 머스쿨러스 리보좀 단백질 S4, X-연결된 (RPS4X)
AATGGTCTCTAGGAGACATGCTGGAAAAGTGTTTGTACAAGCCTTTCTAGGCAACATACATGCTAGATTAAACAGCATGGTGAAACT
(SEQ ID NO:155)
Mus 머스쿨러스 리보좀 단백질 S4-유사 (RPS4l)
AGTGGACTCTGAGGGACATTGCGGGGAAGGGGCGTTTACGTTTGTTTATACTTAAAAGTTTTTTAAGCAGCATGTTGAATTAAAAAAGAAAGCAAGCTTC
(SEQ ID NO:156)
Mus 머스쿨러스 리보좀 단백질 S5 (RPS5)
TTTCCCAGCTGCTGCCTAATAAACTGTGTCCTTTGGAACAACTAT
(SEQ ID NO:157)
Mus 머스쿨러스 리보좀 단백질 S6 (RPS6)
GTCTTTAAGAGCAACAAATAAATAATGACCTTGAATCTTTCATTGGCTTTCATTAATAGTGTAACTAGATAAATGATGGGAAAGATGAGACAGAAGAAGGAATACATCTATAGGACTGCTAGAATATGGGGAGAGTGATTATTTTCAAATTAATATGTATCGAGCTTCTACCCCAAGGTAAATAAATAACATTTGGAGACCATTAAAATGTAGGATGGCATAGAAGAGGCCTTTACTAAGATTAATAATTAAAGAAACACAGCCTTTAAAGTAAAAAACACACTGTGCCTTTGAAACTTGCTAAAAAGATTAACTTCTGTCCCAAAAGGTATCAGCCATGCGCTACCAGCCTCCCTGCCCCTACAGTGGCAGTGGCTGCATTCTTGGTGAATGGTAGTGGAAGGGATTAAACCTAGGCCTCAGTCATGCTTCCCAGTCACTGGTACTGATTTGTATGCACCCGCTTAGGTGTGAAGGTAGTTTTGGTGTGTATCACAAGTTAGCCTGTGTAGCGAAGACAGGTTTTCTCCACCGTGTTTTTTGTTACACATGACTATTCACAAATGTGCTGCAGACAGTAAAATGAGAAATACCCTTCCAAGG
(SEQ ID NO:158)
Mus 머스쿨러스 리보좀 단백질 S7 (RPS7)
AGAAAATGACTGAATAAAGTGTCATTCATAGTATTTGGTTGTAGTAACTTGTCAAAATCTCAGGGCCATGGGTGCACGACAGCAGTAGCTTCTTGAATGAACTGAAGTTTTCAAGAGGTGCCTGGAAGGTGAAAAACACACTGAAGCCAGTCATGTTGATATGGGGGCATTCTGCTGCTGTGAAACAGACTGGGGTTCACACCCACCTTGCGGGATTAGAACTTCACTGCCCTCCAACTTCTTTCTTTGTAAACAACTGTCCACATTTT
(SEQ ID NO:159)
Mus 머스쿨러스 리보좀 단백질 S8 (RPS8)
GCCTCATGTGTAGTGTAATAAAGGTGTCTGCTGTTCTATCTG
(SEQ ID NO:160)
Mus 머스쿨러스 리보좀 단백질 S9 (RPS9)
TTAATACTTGGCTGAACTGGAGGATTGTCTAGTTTTCCAGCTGAAAAATAAAAAAGAATTGATACTTGG
(SEQ ID NO:161)
Mus 머스쿨러스 리보좀 단백질 S10 (RPS10)
AGTTGGAGTTTATGTTGTATTGAATAAACTTTAAAG
(SEQ ID NO:162)
Mus 머스쿨러스 리보좀 단백질 S11 (RPS11)
GGGGACTCTGGCCAATGCCCTAGAACAAATAAAGTTATTTTCCAACG
(SEQ ID NO:163)
Mus 머스쿨러스 리보좀 단백질 S12 (RPS12)
ATAAATTTTGGCTGATTTTTCTCTTGTATTTCTTGTTTGCTGGTATAAAA
(SEQ ID NO:164)
Mus 머스쿨러스 리보좀 단백질 S13 (RPS13)
ATGCTGTTGTGTGCACAAGCAATAAAATCACTTTGAGTAACTT
(SEQ ID NO:165)
Mus 머스쿨러스 리보좀 단백질 S15 (RPS15)
CCGAGGCCAATAAAGACTGGTTTTGGTCCCTGGA
(SEQ ID NO:166)
Mus 머스쿨러스 리보좀 단백질 S15a (RPS15A)
TGTTTACTTAGTAAACTACTAAATGTATGCACGTGTAAGCTTTTGCCTTGATTGAGGTCAAGCTGTCGAGAAATGGTTCTCTTTACAGTGGATCCAGTCAGGATTGGCAGCAAGCACCTTTGCCTGCTGAGCCTACATGTTGTATAGAATGGCAACGTTGTGTAGAATGGCAGTACATTAAATGGGTTTTTCATTTA
(SEQ ID NO:167)
Mus 머스쿨러스 리보좀 단백질 S16 (RPS16)
GCCCATCTCAAGGATCGGGGTTTACCTTTGTAATAAACATCCTAGGATTTTAACGTTCC
(SEQ ID NO:168)
Mus 머스쿨러스 리보좀 단백질 S19 (RPS19)
AACAAAGGATGCTGGGTTAATAAATTGCCTCATTC
(SEQ ID NO:169)
Mus 머스쿨러스 리보좀 단백질 S20 (RPS20)
GTAGAAGAAAAAAACCCCAGCTCCCACAAGTTATCTGGCCCTCTGCACACATATAAATAGTGCAATAAAAATTAACCATTTAAAAATATAAA
(SEQ ID NO:170)
Mus 머스쿨러스 리보좀 단백질 S21 (RPS21)
GCAGAAGAAATCGGGAATTTGTTACAAATAAAAGTTTTAAGTACCTGTGACAGTTAAG
(SEQ ID NO:171)
Mus 머스쿨러스 리보좀 단백질 S23 (RPS23)
AATTTGACAATGGAAACACAGTAATAAATTTTCATATTCTGAAAAAATA
(SEQ ID NO:172)
Mus 머스쿨러스 리보좀 단백질 S25 (RPS25)
ACAGGTTCAATCAGCTGTACATTTGGAAAAATAAAACTTTATTGAATCAAATGAATGGGTGCATCTGTTTCCTAAGGCAGCCGGGGAGGATTTGGTCTTAGGAATAATAGCTGGAATTGGTTTGTTGGCCATGAAGTCAGATGCAATTGCGCCTGGGAACCTTCAGCTTTTCCCTTTACGTGGTTGCTTGCTTCTTGTTGCAGCTTCGGTTTTGAATTGATGCCTGAAAGAAAATAAAAACTTAGCAAGACTAATGGTAAATCT
(SEQ ID NO:173)
Mus 머스쿨러스 리보좀 단백질 S26 (RPS26)
AGAGGCCGTTTTGTAAGGACGGAAGGAAAATTACCCTGGAAAAATAAAATGGAAGTTGTACTTTACATGGC
(SEQ ID NO:174)
Mus 머스쿨러스 리보좀 단백질 S27 (RPS27)
AAGCCCCTGATTGAAGATGAGTGGGAACCTTCCCAATAAACACGTTTTGGATATAT
(SEQ ID NO:175)
Mus 머스쿨러스 리보좀 단백질 S27a (RPS27a)
TTGTGTATGCGTTAATAAAAAGAAGGAACTCGTACTTA
(SEQ ID NO:176)
Mus 머스쿨러스 리보좀 단백질 S28 (RPS28)
TCTTGCAGCTGGGTTCTGGATATCCACTACTTAGCCCACGGAATGATCTGCAACTGTTAAATAAAGCATTTATATTAATTCTTGTCTAGAAA
(SEQ ID NO:177)
Mus 머스쿨러스 리보좀 단백질 S29 (RPS29)
GCGACCTTGAATGGATTCGACTGACTACTACCAAGTGGAACCGATCATGCTAGTCTTTGTACACAAAGAATAAAAATGTGAAGAACTTTAA
(SEQ ID NO:178)
Mus 머스쿨러스 리보좀 단백질 L15 (RPL15)
TTAAATTGGTTTTCCTTTGGAGATTTTAAAAGGATGATTTGATTTCCAGAAAATACTAGACTCAAAATCTTGATAGCTAAAATTCTTTTCTATTCAGCAAAACAAGTCACTGTATAGAGGTTGTTCAAATCAACTAAAGTAATAAATGTCTTAAACAAGTGG (SEQ ID NO:179)
Mus 머스쿨러스 리보좀 단백질 S2 (RPS2)
GGGTTTTTATATGAGAAAAATAAAAGAATTAAGTCTGCTGATT
(SEQ ID NO:180)
Mus 머스쿨러스 리보좀 단백질 L14 (RPL14)
GGCTACACAGAATAATAAAGGTTCTTTTTGACGGTGGTAAATCTCATGTGTGGACTCTAAGCTTGTCGCCAAGTGGGAAATAGACTGGTGGGATTGTAGATAGGATGGGCTACTTAAACTCATTCTACCCAGGCCTTAGTACTTAGCATACAGCCAGAGTCAAACTGATCCTTTATACAGGGGGTACCATGACAGTACAACAGTGTCGTTAACCCTAACAAATAAATTTCCCACCAACGGGTGGAATTCCTTCATTTTG
(SEQ ID NO:181)
Mus 머스쿨러스 리보좀 단백질 S14 (RPS14)
ACAGGACTTCTCATTATTTTCTGTTAATAAATTGCTTTGTGTAAGCTA
(SEQ ID NO:182)
Mus 머스쿨러스 리보좀 단백질 L10 (RPL10)
AGGCTTCAATAGTTCTCCTATACCCTACCAAATCGTTCAATAATAAAATCTCGCATCAAGTTCGCTT
(SEQ ID NO:183)
Mus 머스쿨러스 리보좀 단백질 L10a (RPL10A)
GATGCTCCAATAAACCTCACTGCTGCCACTCAG
(SEQ ID NO:184)
Mus 머스쿨러스 리보좀 단백질 L35 (RPL35)
GATGACAACGACAATAAAGTGCGAGACTGACTGGCT
(SEQ ID NO:185)
Mus 머스쿨러스 리보좀 단백질 L13a (RPL13A)
ACCCAATAAAGACTGTTTGCCTCATGCCTGCCTGGCCTGCCCTTCCTCCGCCGCCAACTAGGGAAGTGGGGACCAAAGGTTCCTTAGGCACTGCTCCTGTGGGTAGAGGGGACATTAGAGAGCTGACAGCGCACCACCTGCATGAGTTTTTATTAAAGTGCAAACCATGGGATGAATCAGTTGAGCTTCAGTGTTGAAAATGAGTAGCAGGGCTGCCCCACCCACCTGACCAAGTACCCTATTCTGCAGCTATGAAAATGAGATCTGCACATGAGCTGGGGTTCACAAGTGCACACTTGGAGCACTGCCTTGCTCCTTCCCAGCAGACCACAAAGCAGTATTTTTCTGGAGGATTTTATGTGCTAATAAATTATTTGACTTAAGTGTG
(SEQ ID NO:186)
Mus 머스쿨러스 리보좀 단백질 L36 (RPL36)
TGAACCCTCCCCCAATAAAAGATGGTTCCTAC
(SEQ ID NO:187)
Mus 머스쿨러스 리보좀 단백질 L36a (RPL36A)
GCAGATTTTGTTATGAAGACAATAAAATCTTGACCTTTCAACCCCTTTGATTGCAGTTGTTCGTTTGGGAGGGAATACATTAAAAGCTTTCAGAAATTACCTG
(SEQ ID NO:188)
Mus 머스쿨러스 리보좀 단백질 L41 (RPL41)
GCCAGCCCGTGCACCTACGACGCCTGCAGGAGCAGAAGTGAGGGATGCTGAGGGCCGGGACAAGCTATCGGACTGTGTGCTGCCATCGGTAATGAGTCTCAGTAGACCTGGAACGTCACCTCGCCGCGATCGCCTGGAGAAATGACCGCCTTTCTTACAACCAAAACAGTCCCTCTGCCCTGGACCCCCGGCACTCTGGACTAGCTCTGTTCTCTTGTGGCCAAGTGTAGCTCGTGTACAATAAACCCTCTTGCAGTCAGCTGAAGAATCAAACTGC
(SEQ ID NO:189)
Mus 머스쿨러스 리보좀 단백질 S18 (RPS18)
GTCTCTGGGCCTTTGCTGTTAATAAATAGTTTATATACCTATGA
(SEQ ID NO:190)
Mus 머스쿨러스 리보좀 단백질 S24 (RPS24)
AATACCTAGCAGTGAGTGGAGATTGGATACAGCCAAAGGAGTAGATCTGCGGTGACTTGATGTTTTGCTGTGATGTGCAGATTTCTGAGAGGACAAATAAACTAAAAAGCTCCTACACGTCTGCTCTGCTGCTTATTGGGCATTAGAAGAATCAGGTGGCTGCTTGGGTGTTGATGCAGTCAAGTGCACTGGGCTTGGTGAAAAGCCCAGTGTAAGAGGCCGGTACAGATCCTTCCTGGCAGAGGGTGGTGATGGAGAGAACATAAATAACTACATGGGCAAAGTGTAGGACCAATTACCCTGTTAGCATCGTCTTTGCTCAACACCTTTCTGTGTCCCTAGACTCTGAGTTTTTTTCTAATTGATTTTTATTGAACACTGAGTGTTTTGAGGTTTTATTTTTT
(SEQ ID NO:191)
Mus 머스쿨러스 리보좀 단백질 L8 (RPL8)
AGTTCAGGAGCTAATAAAGTACGTCCTTTGGCTAATCCG
(SEQ ID NO:192)
Mus 머스쿨러스 리보좀 단백질 L34 (RPL34)
ATATGCACATTTTTTAAGTAATAAAAATCAAGACTTGATCTACGCTTC
(SEQ ID NO:193)
Mus 머스쿨러스 리보좀 단백질 S17 (RPS17)
TCTGTTATGCCATATTTTCAATAAACCTGAAAACAA
(SEQ ID NO:194)
Mus 머스쿨러스 리보좀 단백질 SA (RPSA)
GCTGCTGTGCAGGTGCCTGAGCAAAGGGAAAAAAGATGGAAGGAAAATAAAGTTGCTAAAAGCTGTCTTATGGTCCTCACTGCAGACTGTACCTGGATTGGCATTTGGCTATACAACAGAGGCATGGTCCTACTGACATGTTTTGTGTTGAATACTTAAGCATGTGAACACATGGGTTTTTTTTTTTTTTAATGTAAAATGTAGTAACACAATGTTTAGGTGGCTTTGGTGTTAGCTCTGGAGACTTCATGTGTCATCTAGGTGAGGTGTTCTTTAACACAGGGTCTCTGTTCTGTCATGCCTCATAGATCCTTCTACCTCCAGATTGGAGAGGGAAAAGGCTTATGTCACTGAACCTGGCCAGATTGGGATTTTGTGTCCCAGGAACAAAGTTAATGCTAAAAAGTTAATGCCTTGGTGAGACTGATAGTCTGATGGTGTGAATTCACAGTAAGTGGTTGGGATTGCCAGATGGAATTCCCTGAGCTGCCGTGACAGGTGGCATTGCAGAAGTGAAGGATTCAGGAATTTGAGTGTTGGGTGGGGGCCTGTGAATAGCACTTGGGCTGGGAGGGGAGACTGCTGCCCCTGAATGTCCTGGAATTCAAGGACAGTACCTGGTTAAATGTTTTTCTAGCTTTTCTAAAAAGTTTGTTAGGCCTGGCATTGGCGGCGCACACCTTTAATCCCAGCACTTGGGAGTCAGGCAGGTGGATTTCTGGCCTGGTCTACAGAGAGTTCCAGGATAGCCAGGGATACACAGAAATCCTGCCTCAGGAAAAAACCAAAAAGAAGTTTGCTAAAAATAAGCATTTTTGCTTGATGGTATTGAAGATTGTAAGACATTAAATTGTGTCATTACTTCTCCAGGTACT
(SEQ ID NO:195)
Mus 머스쿨러스 유비퀴틴 A-52 잔기 리보좀 단백질 융합 생산물 1 (UBA52)
AGCTGTGGTCATACCTGGCATGTGACCCCGGGACCAAATAAAGTCCCCTTCCATCCACTGGAGCAGC
(SEQ ID NO:196)
Mus 머스쿨러스 Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU)
GTCCTATTGCCACCCTGCCATGCTAATAAAGCCACTGTGTCCAGACTTCT
(SEQ ID NO:197)
Mus 머스쿨러스 리보좀 단백질 L22-유사 1 (RPL22L1)
TTGGCCTCTGCTTGTAATACAATGAAAGTATTCTAAAGAAATATAAAATTGGACTTTATGAGAAAATAAAAGTCATTTCACTCT
(SEQ ID NO:198)
Mus 머스쿨러스 리보좀 단백질 S17 (RPS17)
TCTGTTATGCCATATTTTCAATAAACCTGAAAACAA
(SEQ ID NO:199)
Mus 머스쿨러스 리보좀 단백질 L39-유사 (RPL39L)
GGAACCACACGTACTTATGCTGTAACTTACTGTAGCGTTTACAGCGTTACCGCTGTCTGGACAGCTGAGTGTGTTTCTTAGGAATATAAGTTTTCTTTCTGTGCTTTAGTGAGTTCATTCAGCAGTTCAGTAATAAATATGTGAAACCTTTTGTTTCGAAAAAAATTGCTTCTGTGTTACAACTTACTTTGTTTTATGGTTCAGGATCATCTGCATAATAGACAAGTATTCTATCAGTGAGCGATATCCTGGATCTTGTTTGTGTAGTTTGGGGTTGAGACAAGTCCAGACTGCCCTAAAACTCACGATCTTCCTTCCTCGGCCTTCTAAATGATTGGAGGACTCCAAACCTAAGTGATGGAAGTAAAAAGAAACTTATATGTCAAGACTCATTTTCTCTATCATTTCATGTGACAATTGAAATTAGATTATTTCTTTTTTCAATC
(SEQ ID NO:200)
Mus 머스쿨러스 리보좀 단백질 L10-유사 (RPL10L)
GGACTTTGCTGGCAGAAAAGAAGTACAGATGAGGTTATAGTTTGAAAAACGTTAATTCCGTTTATTGACTTTAGAATGTTACTTTGCATAGTATAGACCATTACAATGGAAAGTACCTGCCTTAAGAAACAAGAAAACTGCAGTTTATAGAGAAAGAATTTTCAATTTTGACCCATGTACTTAAAATTTTTGGTGTATACTGCAGTGTAGCAAATGTTTTGTGGTGACGGTATAAATGGTACTGTTTGTTATCTTGGATTAAGAGTGGCTAGAGAAGTTGGAAGACGTGTGAGAAGTTCTTTATAGAGAATTAAACATGAAAATTACATCTC
(SEQ ID NO:201)
Mus 머스쿨러스 리보좀 단백질 L36a-유사 (RPL36AL)
AACTTGTGTTCTCTGAGAGGAAAATACTGAAGCAGTAGAGAAATGACCTGCTAGAGAATAAAGTTACTGTTAATGATACC
(SEQ ID NO:202)
Mus 머스쿨러스 리보좀 단백질 L3-유사 (RPL3L)
GATGTCTGGAATGGAGCACACCTGGGATGTAGCACTCTTGCTATCTGTCCGGTCCTTTTTGTTCAATAAAGTCCTGAGGCAACTCTCTCTGTC
(SEQ ID NO:203)
Mus 머스쿨러스 리보좀 단백질 S27-유사 (RPS27L)
TGAGCTATGAAGTTCCGGAATTTGTGTTTTTCACAGAAAGCCTTACCAACTTCAGTTACTTTACCAAGACAATGTAATTATTGTTTGATTTTATAAAGTCTACAACAATGATCTCCTATTTTGGTGTCAGTTTTTCAATAAAGTTTTAATTA
(SEQ ID NO:204)
Mus 머스쿨러스 리보좀 단백질 L7-유사 1 (RPL7L1)
AACTGATCATTGGGAAATGAGGTGACCAAAAATGCATCGCAACCTTGGACAAACAGCATGGCTATTTAACATTCTGGGATCCTGCAGAATCCTGCATCTTCCTAAGTAGGGAAGCACTGTAGCATTGGAGAGAGGCCTGGGCGAGCAGAGCTAAGGCTTCCATTTCTGGCTTGCTTGGAATTTAAAACAAGCTTTTTTCTATATAGTAAAAGATTGTTTTTAAGATTTTTGCGTGTGAGTACATGCCAAAGTAGCCAGGAAGTGTCACTTGCCCTGGAGCTAGAATTACTGGCAAATGAAGGCTCAGAGGTGGATGCTGGGACCAATTCTAGGCCCTCTGAGAAAGCAGGTGCACTTGGCTTGTGCCTCCAGCCCCAAAGGCGATGGCTTATTGTGAGCCTGAGGCCAGCCAGGGTTACAGAGACTCAAGAAACAAGTGGGGTTGTCCATGTTGCTGGAGATGACCCAGGTCTATTAGGACCTTGACTACATGGATAGACATTCTGGCAGCTAGTATACTGCCATTGGGGCCTATGGAGAAGTAGCCACCGAGCCTATTTAGAAAGAAGGACTGCTGGCAAGCTTGGTGTCACTATGAAGGCAGACAAAGATCGATGTATTAACGACCCCGACTCCAAAAACACTCGAGGGGGCCCAAGGTGGGCTCAGTGGTTAAGAGCCGTTCGCCCAGGGGCTGGAGAGTTGGCTCAGTGGTACCACATGGTGGCTCACAACCATCTGTAATGAGATCTGACGCCCTCTTCTGGTGTATCTGAAGACAGCTACAGTGTACTTACATAAAATAAATAAATCTTT
(SEQ ID NO:205)
바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 리보좀 단백질 스몰 9(RPS9)의 3'-UTR 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다. 가장 바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 SEQ ID NO: 1 또는 SEQ ID NO: 2에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
SEQ ID NO: 1
GTCCACCTGTCCCTCCTGGGCTGCTGGATTGTCTCGTTTTCCTGCCAAATAAACAGGATCAGCGCTTTAC
SEQ ID NO: 2
GUCCACCUGUCCCUCCUGGGCUGCUGGAUUGUCUCGUUUUCCUGCCAAAUAAACAGGAUCAGCGCUUUAC
본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 또한 SEQ ID Nos: 10 내지 205에 따른 서열의 3'-UTR와 같은, 리보좀 단백질 유전자의 3'-UTR에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성되며, 상기 절편은 바람직하게 상기 설명된 기능적 절편, 기능적 변이체 절편이다. 이러한 절편은 바람직하게 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 보인다. 바람직한 실시예에서, 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개 뉴클레오티드, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 보인다.
바람직하게, 상기 변이체, 절편 또는 변이체 절편은, 바람직하게 SEQ ID NO. 1 또는 SEQ ID NO. 2에 따른 핵산 서열을 포함하는 인공 핵산 분자에 의해 나타나는 안정화 효율 및/또는 단백질 생산 증가 효율의 적어도 40%, 더욱 바람직하게 적어도 50%, 더욱 바람직하게 적어도 60%, 더욱 더 바람직하게 적어도 70%, 더욱 더 바람직하게 적어도 80%, 가장 바람직하게 적어도 90%의 효율과 함께, 본 발명에 따른 인공 핵산 분자의 안정성, 본 발명에 따른 인공 핵산 분자로부터 단백질 발현의 안정화 및/또는 연장, 및/또는 단백질 생산물의 증가와 같이, SEQ ID Nos: 10 내지 205에 따른 핵산 서열의 적어도 하나의 기능을 보이는, 상기 설명된 기능적 변이체, 기능적 절편 또는 기능적 변이체 절편이다.
바람직하게, 본 발명에 따른 인공 핵산 분자의 적어도 하나의 3'-UTR 요소는 적어도 약 3개 뉴클레오티드, 바람직하게 적어도 약 5개 뉴클레오티드, 더욱 바람직하게 적어도 약 10, 15, 20, 25 또는 30개 뉴클레오티드, 더욱 더 바람직하게 적어도 약 50개 뉴클레오티드, 가장 바람직하게 적어도 약 70개 뉴클레오티드의 길이를 보인다. 3'-UTR 요소의 길이에 대한 상한은 500개 뉴클레오티드 또는 그 미만, 예를 들어 400, 300, 200, 150 또는 100개 뉴클레오티드일 수 있다. 다른 예를 들어, 상기 상한은 50 내지 100개 뉴클레오티드의 범위 내에서 선택될 수 있다. 예를 들어, 이의 절편 또는 변이체는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 10 내지 90개 뉴클레오티드, 가장 바람직하게 20 내지 70개 뉴클레오티드의 길이를 나타낼 수 있다.
게다가, 본 발명에 따른 인공 핵산 분자는 상기 설명된 하나 이상의 3'-UTR 요소를 포함할 수 있다. 예를 들어, 본 발명에 따른 인공 핵산 분자는 하나, 둘, 셋, 넷 또는 그 이상의 3'-UTR 요소를 포함할 수 있으며, 상기 각각의 3'-UTR 요소는 동일하거나 다를 수 있다. 예를 들어, 본 발명에 따른 인공 핵산 분자는 상기 설명된 두 본질적으로 동일한 3'-UTR 요소, 예를 들어 SEQ ID NO: 10 내지 205에 따른 서열과 같은, 리보좀 단백질 유전자의 3'-UTR로부터 유도된, 또는 SEQ ID No. 1 또는 2,에 따른 핵산 서열, 상기 설명된 이의 기능적 변이체, 이의 기능적 절편, 또는 이의 기능적 변이체 절편과 같은, 리보좀 단백질 유전자의 3'-UTR의 절편 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 두 3'-UTR 요소를 포함할 수 있다.
놀랍게도, 본 발명자들은 상기 설명된 3'-UTR 요소를 포함하는 인공 핵산 분자가 나타날 수 있거나 또는 단백질 생산은 증진, 연장 및/또는 안정화시키는 mRNA 분자를 제공할 수 있음을 발견하였다. 따라서, 본 발명에 설명된 3'-UTR 요소는 mRNA 분자로부터 단백질 발현의 안정성을 증진 및/또는 번역 효율을 증진시킬 수 있다.
본 발명에 따른 인공 핵산 분자는 mRNA, DNA 벡터와 같은 DNA와 같은 RNA일 수 있거나, 변형된 RNA 또는 DNA 분자일 수 있다. 이는 예를 들어 센스 가닥 및 안티-센스 가닥을 갖는 DNA 분자와 같이, 센스 가닥(strand) 및 안티-센스 가닥을 갖는 이중 가닥 분자로 제공될 수 있다.
본 발명에 따른 인공 핵산 분자는 추가로 5'-UTR 및/또는 5'-캡(cap)을 선택적으로 포함할 수 있다. 상기 선택적 5'-캡 및/또는 5'-UTR은 바람직하게 본 발명에 따른 인공 핵산 분자 내 ORF에 5'에 위치할 수 있다.
바람직하게, 본 발명에 따른 인공 핵산 분자는 추가로 폴리(A) 서열 및/또는 폴리아데닐화 신호를 포함한다. 바람직하게, 선택적 폴리(A) 서열은 적어도 하나의 3'-UTR 요소에 위치하며, 바람직하게 선택적 폴리(A) 서열은 3'-UTR 요소의 3'-말단에 연결된다. 상기 연결은 예를 들어 1-50개의 링커, 바람직하게 1-20개 뉴클레오티드, 예를 들어 하나 또는 그 이상의 제한 부위를 포함하거나 구성된 것을 통해서와 같이, 2, 4, 6, 8, 10, 20개 등의 뉴클레오티드의 스트레치를 통해, 직접적 또는 간접적일 수 있다.
일 실시예에서, 선택적 폴리아데닐화 신호는 3'-UTR 요소의 3' 다운스트림에 위치한다. 바람직하게, 상기 폴리아데닐화 신호는 N = A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함한다. 이러한 공통 서열은 대부분의 동물 및 박테리아 세포 시스템을 통해, 예를 들어 CstF, PAP, PAB2, CFI 및/또는 CFII와 협동하는 분열(cleavage)/폴리아데닐화 특이성 요소(CPSF)와 같은, 폴리아데닐화-인자를 통해 인식될 수 있다. 바람직하게, 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 약 50개 뉴클레오티드 미만, 더욱 바람직하게 약 30개 염기 미만, 가장 바람직하게 약 25개 염기 미만, 예를 들어 21개 염기, 3'-UTR 요소의 3'-말단의 다운스트림에 위치한다.
본 발명에 따른 인공 핵산 분자, 예를 들어 3'-UTR 요소의 폴리아데닐화 신호 다운스트림을 포함하는 인공 DNA 분자의 전사는 이의 3'-UTR 요소의 폴리아데닐화 신호 다운스트림을 포함하는 조숙-RNA를 초래할 것이다. 예를 들어, SEQ ID No. 1에 따른 3'-UTR 요소를 포함하는 DNA 분자의 전사는 서열 SEQ ID No. 2에 따른 3'-UTR 요소를 갖는 RNA를 초래할 것이다.
적절한 전사 시스템을 사용하는 것은 이후 조숙-RNA에 폴리(A) 서열의 결합을 유도할 것이다. 예를 들어, 본 발명의 인공 핵산 분자는 상기 설명된 3'-UTR 요소 및 폴리아데닐화 신호를 포함하는 DNA 분자일 수 있으며, 이러한 DNA 분자의 전사에 따라 RNA의 폴리아데닐화가 초래될 수 있다. 따라서, 생산된(resulting) RNA는 본 발명의 3'-UTR 요소 이후 폴리(A) 서열의 조합을 포함할 수 있다.
잠재적 전사 시스템은 인비트로(in vitro) 전사 시스템 또는 세포 전사 시스템 등이다. 따라서, 본 발명에 따른 인공 핵산 분자의 전사, 예를 들어, 오픈 리딩 프레임, 3'-UTR 요소 및 폴리아데닐화 신호를 포함하는 인공 핵산 분자의 전사는 오픈 리딩 프레임, 3'-UTR 요소 및 폴리(A) 서열을 포함하는 mRNA 분자를 초래할 수 있다.
따라서, 본 발명은 또한 오픈 리딩 프레임, 상기 설명된 3'-UTR 요소 및 폴리(A) 서열을 포함하는 mRNA 분자인, 인공 핵산 분자를 제공한다.
일 실시예에서, 본 발명은 오픈 리딩 프레임 및 SEQ ID No. 1에 따른 서열 또는 SEQ ID No.1에 적어도 약 40% 또는 그 이상의 상동성을 갖는 서열 또는 상기 설명된 이의 절편을 포함하는 인공 DNA 분자인, 인공 핵산 분자를 제공한다. 게다가, 본 발명은 오픈 리딩 프레임 및 SEQ ID NO. 2에 따른 서열 또는 SEQ ID No. 2에 적어도 약 40% 이상의 상동성을 갖는 서열 또는 상기 설명된 이의 절편을 포함하는 인공 RNA 분자인 인공 핵산 분자를 제공한다.
따라서, 본 발명은 번역 효율에 대하여 안정화되고 최적화된, RNA 분자, 바람직하게 mRNA 분자에 대한 주형(template)으로 제공될 수 있는 인공 핵산 분자를 제공한다. 다시 말해, 상기 인공 핵산 분자는 mRNA의 생산을 위한 주형으로 사용될 수 있는 DNA일 수 있다. 수득 가능한 mRNA는 오픈 리딩 프레임에 의해 코딩된 목적하는 펩타이드 또는 단백질의 생산을 위해 차례로 번역될 수 있다. 만약 인공 핵산 분자가 DNA일 경우, 이는 예를 들어 mRNA의 계속되고 반복적인 인비트로(in vitro) 또는 인비보(in vivo) 생산을 위한 이중 가닥의 저장 형태로 사용될 수 있다.
다른 실시예에서, 본 발명에 따른 인공 핵산 분자의 3'-UTR은 폴리아데닐화 신호 또는 폴리(A) 서열을 포함하지 않을 수 있다. 보다 바람직하게, 본 발명에 따른 인공 핵산 분자는 폴리아데닐화 신호 또는 폴리(A) 서열을 포함하지 않을 수 있다. 더욱 바람직하게, 상기 인공 핵산 분자의 3'-UTR 또는 이러한 본 발명의 인공 핵산 분자는 폴리아데닐화 신호를 포함하지 않으며, 특히 폴리아데닐화 신호 AAU/TAAA를 포함하지 않는다.
일 실시예에서, 본 발명에 따른 인공 핵산 분자는 추가로 폴리(A) 서열을 포함한다. 예를 들어, ORF 다음 리보좀 3' UTR을 포함하는 DNA 분자는 결과물 mRNA 내 폴리(A) 서열에 전사될 수 있는, 티미딘 뉴클레오티드의 스트레치를 포함할 수 있다. 폴리(A) 서열의 길이는 다양할 수 있다. 예를 들어, 상기 폴리(A) 서열은 약 20개 아데닌 뉴클레오티드 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40개 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 60, 70, 80, 90 또는 100개 아데닌 뉴클레오티드와 같이 약 50개 내지 약 100개 아데닌 뉴클레오티드의 길이를 가질 수 있다. 가장 바람직하게 본 발명의 핵산은 약 60 내지 약 70개 뉴클레오티드, 가장 바람직하게 64개 아데닌 뉴클레오티드의 폴리(A) 서열을 포함한다.
예를 들어, 본 발명에 따른 인공 핵산 분자는 하기 DNA-서열에 상응하는 핵산 서열을 포함할 수 있다
GTCCACCTGTCCCTCCTGGGCTGCTGGATTGTCTCGTTTTCCTGCCAAATAAACAGGATCAGCGCTTTACAGATCTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA (SEQ ID No. 3).
이러한 서열의 전사는 하기 서열을 포함하는 인공 핵산 분자를 초래할 수 있다.
GUCCACCUGUCCCUCCUGGGCUGCUGGAUUGUCUCGUUUUCCUGCCAAAUAAACAGGAUCAGCGCUUUACAGAUCUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA (SEQ ID No. 4).
이러한 인공 RNA 분자, 즉 SEQ ID No. 4에 따른 서열을 포함하는 인공 핵산 분자는 또한, DNA-시초(progenitor)로부터 필수적으로 전사됨이 없이, 화학적 합성의 일반적인 방법을 통해 인비트로(in vitro) 수득될 수 있다.
특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 RNA 분자, 바람직하게 5'- 에서 3'- 방향 오픈 리딩 프레임, 상기 설명된 3'-UTR 요소 및 폴리(A) 서열을 포함하는 mRNA 분자이다.
바람직하게, 상기 오픈 리딩 프레임은 리보좀 단백질에 대해 코딩하지 않는다. 바람직한 실시예에서, 오픈 리딩 프레임은 본 발명의 인공 핵산 분자의 3'-UTR 요소가 유도된 리보좀 단백질을 코딩하지 않으며, 특히 상기 3'-UTR 요소가 포유동물 리보좀 단백질 유전자의 3'-UTR과 동일한 경우에 포유동물 리보좀 단백질을 코딩하지 않는다. 일부 보다 바람직한 실시예에서, 오픈 리딩 프레임은 3'-UTR 요소가 SEQ ID No. 1 또는 SEQ ID No. 2와 동일한 서열일 경우 RPS9 또는 이의 변이체를 코딩하지 않는다.
바람직한 실시예에서, 상기 ORF는 인간 또는 식물, 특히 아라비답시스, 리보좀 단백질을 코딩하지 않으며, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는다. 보다 바람직한 실시예에서, 상기 오픈 리딩 프레임(ORF)는 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 어떠한 원천(origin)이든지 리보좀 단백질 S16(RPS16)을 코딩하지 않는다.
일 실시예에서, 본 발명은 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된, 리보좀 단백질 외의 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 1에 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소; 더욱 더 바람직하게 SEQ ID No. 1에 100% 서열 상동성; 및 폴리아데닐화 신호 및/또는 폴리(A) 서열을 포함하는 인공 DNA 분자를 제공한다. 게다가, 본 발명은 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된 리보좀 단백질 외에 어느 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 3과 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소를 포함하는 인공 DNA 분자를 제공한다.
게다가, 본 발명은 인공 RNA 분자, 바람직하게 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된 리보좀 단백질 외의 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 2에 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소; 및 폴리아데닐화 신호 및/또는 폴리(A) 서열을 포함하는 인공 mRNA 분자 또는 인공 바이러스 RNA 분자를 제공한다. 게다가, 본 발명은 인공 RNA 분자, 바람직하게 오픈 리딩 프레임, 바람직하게 3'-UTR이 유도된 리보좀 단백질 외의 펩타이드 또는 단백질을 코딩하는 오픈 리딩 프레임; SEQ ID No. 4에 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%; 더욱 더 바람직하게 적어도 99%, 더욱 더 바람직하게 100% 서열 상동성을 갖는 서열을 포함하거나 이로 구성된 3'-UTR 요소를 포함하는 인공 mRNA 분자 또는 인공 바이러스 RNA 분자를 제공한다.
본 발명은 코딩된 펩타이드 또는 단백질의 증진된 안정성 및 연장된 발현에 의해 특징지어질 수 있는 인공 핵산 분자, 바람직하게 인공 mRNA를 제공한다. 어느 이론에 한정됨이 없이, 단백질 발현의 증진된 안정성 및 그에 따른 연장된 단백질 발현은 본 발명에 따른 인공 mRNA 분자와 같은 인공 핵산 분자의 분해에 감소로부터 초래될 수 있다. 따라서, 본 발명의 3'-UTR 요소는 분해 및 붕괴(decay)로부터 인공 핵산을 예방할 수 있다.
일부 실시예에서, 본 발명의 인공 핵산 분자는 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열에 추가로 히스톤 스템-루프를 포함할 수 있다. 본 발명에 따른 이러한 인공 핵산 분자는 예를 들어 5'-에서 3'-방향 ORF, 3'-UTR 요소, 선택적 히스톤 스템-루프 서열, 선택적 폴리(A) 서열 또는 폴리아데닐화 신호 및 선택적 폴리(C) 서열을 포함할 수 있다. 이는 또한 5'-에서 3'-방향 ORF, 3'-UTR 요소, 선택적 폴리(A) 서열, 선택적 폴리(C) 서열 및 선택적 히스톤 스템-루프 서열을 포함할 수 있다.
바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 적어도 하나의 히스톤 스템-루프 서열을 포함한다.
이러한 히스톤 스템-루프 서열을 바람직하게 이의 공개가 참고문헌으로 본 발명에 병합된 WO 2012/019780에 개시된 히스톤 스템-루프 서열로부터 선택될 수 있다.
본 발명에서 사용되기에 적절한 히스톤 스템-루프 서열은 바람직하게 하기 화학식 (I) 또는 (II) 중 적어도 하나로부터 선택될 수 있다:
화학식 (I) (스템 경계 요소가 없는 스템-루프 서열):
화학식 (II) (스템 경계 요소가 있는 스템-루프 서열):
상기:
스템1 또는 스템2 경계 요소 N1-6은 1 내지 6개, 바람직하게 2 내지 6개, 더욱 바람직하게 2 내지 5개, 더욱 더 바람직하게 3 내지 5개, 가장 바람직하게 4 내지 5개 또는 5개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;
스템1[N0-2GN3-5]은 요소 스템2와 역 상보적 또는 부분적으로 역 상보적이며, 5 내지 7개 뉴클레오티드의 연속적인 서열임;
상기 N0-2는 0 내지 2개, 바람직하게 0 내지 1개, 더욱 바람직하게 1개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;
상기 N3-5는 3 내지 5개, 바람직하게 4 내지 5개, 더욱 바람직하게 4개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택되며, 및
상기 G는 구아노신 또는 이의 유사체이며, 스템2 내 이의 상보적인 뉴클레오티드 시티딘이 구아노신에 의해 교체되는 경우, 시티딘 또는 이의 유사체에 의해 선택적으로 교체될 수 있으며;
루프 서열[N0-4(U/T)N0-4]는 요소 스템1 및 스템2 사이에 위치하며, 3 내지 5개 뉴클레오티드, 더욱 바람직하게 4개 뉴클레오티드의 연속적인 서열이며;
상기 각 N0-4는 서로 독립적으로 0 내지 4개, 바람직하게 1 내지 3개, 더욱 바람직하게 1 내지 2개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택되며; 및
상기 U/T는 우리딘, 또는 선택적으로 티미딘을 나타냄;
스템2[N3-5CN0-2]는 요소 스템1과 역 상보적 또는 부분적으로 역 상보적이며, 5 내지 7개 뉴클레오티드의 연속적인 서열이며;
상기 N3-5는 3 내지 5개, 바람직하게 4 내지 5개, 더욱 바람직하게 4개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨;
상기 N0-2는 0 내지 2개, 바람직하게 0 내지 1개, 더욱 바람직하게 1개 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 또는 C로부터 선택된 뉴클레오티드 또는 이의 뉴클레오티드 유사체로부터 서로 독립적으로 선택됨; 및
상기 C는 시티딘 또는 이의 유사체이며, 스템1 내 이의 상보성 뉴클레오시드 구아노신이 시티딘에 의해 교체되는 경우 선택적으로 구아노신 또는 이의 유사체에 의해 교체될 수 있음;
상기
스템1 및 스템2는 염기쌍이 예를 들어 뉴클레오티드 A 및 U/T 또는 G 및 C의 왓슨-크릭 염기쌍에 의해 또는 비-왓슨-크릭 염기쌍, 예를 들어 워블 염기쌍, 역 왓슨-크릭 염기쌍, 후그스틴 염기쌍, 역 후그스틴 염기쌍에 의해 스템1 및 스템2 사이에 발생할 수 있는, 서로 역 상보적 서열을 형성하는 염기쌍이 가능하며, 또는 하나의 스템 내 하나 또는 그 이상의 염기가 다른 스템의 역 상보적 서열 내 상보적 염기를 갖지 않음에 기초하여, 불완전 염기쌍이 스템1 및 스템2 사이에 발생할 수 있는, 부분적으로 역 상보적 서열을 서로 형성하는 염기쌍이 가능하다.
더욱 바람직한 실시예에 따르면, 히스톤 스템-루프 서열은 하기 특정한 화학식 (Ia) 또는 (IIa)의 적어도 하나에 따라 선택될 수 있다:
화학식(Ia) (스템 경계 요소가 없는 스템-루프 서열):
화학식(IIa) (스템 경계 요소가 있는 스템-루프 서열):
상기:
N, C, G, T 및 U는 상기 정의된 것과 같음.
일 양태의 더욱 더 특히 바람직한 실시예에 따르면, 인공 핵산 분자 서열은 하기 특정한 화학식 (Ib) 또는 (IIb)의 적어도 하나에 따른 적어도 하나의 히스톤 스템-루프 서열을 포함할 수 있다:
화학식 (Ib) (스템 경계 요소가 없는 스템-루프 서열):
화학식 (IIb) (스템 경게 요소가 있는 스템-루프 서열):
상기:
N, C, G, T 및 U는 상기 정의된 것과 같음.
특히 바람직한 히스톤 스템-루프 서열은 SEQ ID NO: 5: CAAAGGCTCTTTTCAGAGCCACCA에 따른 서열 또는 더욱 바람직하게 SEQ ID NO: 5에 따른 핵산 서열의 상응하는 RNA 서열이다.
예를 들어, 상기 단일 요소는 하기 순서의 인공 핵산 분자로 나타낼 수 있다:
5'-캡- 5'-UTR - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템 루프; 등.
일부 실시예에서, 인공 핵산 분자는 5'-캡, 폴리(C) 서열 및/또는 IRES-모티프와 같은 추가적인 요소를 포함한다. 5'-캡은 RNA의 5' 말단에 전사 동안 또는 후기-전사적으로(post-transcriptionally) 첨가될 수 있다. 게다가, 본 발명의 인공 핵산 분자는 특히 핵산이 mRNA의 형태이거나 또는 mRNA를 코딩할 경우, 적어도 10개 시티딘, 바람직하게 적어도 20개 시티딘, 더욱 바람직하게 적어도 30개 시티딘(소위 "폴리(C) 서열")의 서열에 의해 변형될 수 있다. 특히, 본 발명의 인공 핵산 분자는 특히 핵산이 (m)RNA의 형태이거나 mRNA를 코딩할 때, 약 10 내지 200개 시티딘 뉴클레오티드, 바람직하게 약 10 내지 100개 시티딘 뉴클레오티드, 더욱 바람직하게 약 10 내지 70개 시티딘 뉴클레오티드 또는 더욱 더 바람직하게 약 20 내지 50개 뉴클레오티드 또는 더욱 더 20 내지 30개 시티딘 뉴클레오티드의 폴리(C) 서열을 포함할 수 있다. 더욱 바람직하게, 본 발명의 핵산은 30개 시티딘 잔기의 폴리(C) 서열을 포함한다. 따라서 바람직하게 본 발명에 따른 인공 핵산 분자는 5'-내지 3' 방향으로, ORF, 상기 설명된 적어도 하나의 3'-UTR 요소, 폴리(A) 서열 또는 폴리아데닐화 신호, 및 폴리(C) 서열을 포함한다.
내부 리보좀 유입 부위(IRES) 서열 또는 IRES-모티프는 예를 들어 만약 인공 핵산 분자가 둘 또는 그 이상의 펩타이드 또는 단백질을 코딩하는 경우, 몇몇 오픈 리딩 프레임을 분리할 수 있다. IRES-서열은 만약 상기 인공 핵산 분자가 바이-(bi-) 또는 멀티시스트로닉 핵산 분자일 경우에, 특히 유용할 수 있다.
게다가, 인공 핵산 분자는 추가적 5'-요소, 바람직하게 5'-UTR, 프로모터 또는 5'-UTR 및 프로모터 포함 서열을 포함할 수 있다. 상기 프로모터는 본 발명에 따른 인공 핵산 분자, 예를 들어 본 발명에 따른 인공 DNA 분자의 전사를 일으키고 또는 조절할 수 있다. 게다가, 상기 5'-UTR은 본 발명에 정의된 유전자의 5'-UTR로 구성될 수 있거나 또는 포함할 수 있다. 게다가 상기 5'-UTR은 본 발명의 3'-UTR과 상호작용할 수 있으며, 따라서 본 발명의 3'-UTR 요소의 안정화 효과를 도울 수 있다. 이러한 요소는 추가적으로 안정성 및 번역 효율을 도울 수 있다. 따라서, 일부 실시예에서, 본 발명은 하기 구조의 적어도 하나의 5'-에서 3'-방향으로 포함하는, 인공 핵산 분자, 바람직하게 mRNA 분자를 제공한다
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 히스톤 스템-루프 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;
5'-캡 - 5'-UTR - ORF - IRES - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템-루프;
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열;
5'-캡 - 5'-UTR - ORF - 3'-UTR 요소 - 폴리(A)/(C) 서열 - 폴리(A)/(C) 서열 - 히스톤 스템 루프.
본 발명 인공 핵산 분자의 특히 바람직한 실시예는 500, 400, 300, 250, 200, 150 또는 100개 뉴클레오티드 미만의 및/또는 20, 30, 40, 50 또는 60개 뉴클레오티드 이상의 길이의 적어도 하나의 5'-비번역된 영역 요소(5'UTR 요소), 바람직하게 TOP 유전자의 5'UTR로부터 유도된 또는 TOP 유전자의 5'UTR의 절편, 상동체 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 것을 포함한다.
5'UTR 요소는 상기 정의된 TOP-모티프 또는 5'TOP를 포함하지 않는 것이 특히 바람직하다.
TOP 유전자의 5'UTR로부터 유도된 핵산 서열은 진핵 TOP 유전자, 바람직하게 식물 또는 동물 TOP 유전자, 더욱 바람직하게 척색동물 TOP 유전자, 더욱 더 바람직하게 척추동물 TOP 유전자, 가장 바람직하게 인간 TOP 유전자와 같은, 포유동물 TOP 유전자로부터 유도된다.
예를 들어 5'UTR 요소는 바람직하게 공개가 본 발명에 참고문헌으로 병합된 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422로 구성된 그룹으로부터 선택된 핵산 서열로부터, 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체로부터, 이의 변이체로부터 또는 바람직하게 상응하는 RNA 서열로부터 유도된, 핵산 서열을 포함하거나 이로 구성된 5'-UTR 요소로부터 선택된다. 용어 "특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체"는 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422에 따른 서열에 상동인, 호모 사피엔스 외 다른 종의 서열을 의미한다.
바람직한 실시예에서, 5'UTR 요소는 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422로부터, 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체로부터, 이의 변이체, 또는 상응하는 RNA 서열로부터 선택된 핵산 서열의 뉴클레오티드 위치 5(즉 서열 내 위치 5에 위치한 뉴클레오티드)에서 시작 코돈(서열의 3'-말단에 위치)에 뉴클레오티드 위치 바로 옆 5', 예를 들어 ATG 서열에 뉴클레오티드 위치 바로 옆 5'까지 확장하는 핵산 서열로부터 유도된, 핵산 서열을 포함하거나 이로 구성된다. 5' UTR 요소는 5'TOP에 뉴클레오티드 위치 바로 옆 3'으로부터 시작 코돈(서열의 3' 말단에 위치한)에 뉴클레오티드 위치 바로 옆 5', 예를 들어 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 142로부터, 특허 출원 WO2013/143700의 SEQ ID NOs. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 및 SEQ ID NO. 1422의 상동체로부터, 이의 변이체, 또는 상응하는 RNA 서열로부터 선택된 핵산 서열의 ATG 서열의 뉴클레오티드 위치 바로 옆 5'까지 확장하는 핵산 서열로부터 유도되는 것이 특히 바람직하다.
특히 바람직한 실시예에서, 5'UTR 요소는 리보좀 단백질을 코딩하는 TOP 유전자의 5'UTR 또는 리보좀 단백질을 코딩하는 TOP 유전자의 5'UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된다. 예를 들어, 5'UTR 요소는 특허 출원 WO2013/143700의 SEQ ID NOs: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359, 또는 1360의 어느 것에 따르는 핵산 서열의 5'UTR로부터 유도된 핵산 서열, 상응하는 RNA 서열, 이의 상동체, 본 발명에 설명된 이의 변이체, 바람직하게 5'TOP 모티프가 없는 것을 포함하거나 이로 구성된다. 상기와 같이, 뉴클레오티드 바로 옆 5'에 위치 5로부터 ATG(서열의 3'말단에 위치한)까지 확장하는 서열은 상기 서열의 5'UTR에 상응한다.
바람직하게, 5'UTR 요소는 리보좀 라지 단백질(RPL)을 코딩하는 TOP 유전자의 5'UTR로부터 또는 리보좀 라지 단백질(RPL)을 코딩하는 TOP 유전자의 5'UTR의 상동체 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된다. 예를 들어, 상기 5'UTR 요소는 특허 출원 WO2013/143700의 SEQ ID NOs: SEQ ID NOs: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 및 1422의 어느 것에 따른 핵산 서열의 5'UTR로부터 유도된 핵산 서열, 상응하는 RNA 서열, 본 발명에 설명된 이의 상동체, 또는 이의 변이체, 바람직하게 5'TOP 모티프가 없는 것을 포함하거나 이로 구성된다.
특히 바람직한 실시예에서, 상기 5'UTR 요소는 리보좀 단백질 라지 32 유전자의 5'UTR로부터, 바람직하게 척추동물 리보좀 단백질 라지 32(L32) 유전자로부터, 더욱 바람직하게 포유동물 리보좀 단백질 라지 32(L32) 유전자로부터, 가장 바람직하게 인간 리보좀 단백질 라지 32(L32) 유전자로부터, 또는 리보좀 단백질 라지 32 유전자의 5'UTR의 변이체로부터, 바람직하게 척추동물 리보좀 단백질 라지 32(L32) 유전자로부터, 더욱 바람직하게 포유동물 리보좀 단백질 라지 32(L32) 유전자로부터, 가장 바람직하게 인간 리보좀 단백질 라지 32(L32) 유전자로부터 유도된 핵산 서열을 포함하거나 이로 구성되며, 바람직하게 상기 5'UTR 요소는 상기 유전자의 5'TOP를 포함하지 않는다.
따라서, 특히 바람직한 실시예에서, 5'UTR 요소는 SEQ ID No. 6(5' 말단 올리고피리미딘 트랙트(tract)가 없는 인간 리보좀 단백질 라지 32의 5'-UTR: GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; 특허 출원 WO2013/143700의 SEQ ID No. 1368에 상응)에 따른 핵산 서열 또는 바람직하게 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는, 핵산 서열을 포함하거나 이로 구성되며, 또는 상기 적어도 하나의 5'UTR 요소는 SEQ ID No. 6에 따른 핵산 서열 또는 더욱 바람직하게 상응하는 RNA 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성되며, 바람직하게 상기 절편은 상기 설명된 것과 같으며, 즉 전장 5'UTR의 적어도 20% 드을 나타내는 뉴클레오티드의 연속적인 스트레치이다. 바람직하게, 상기 절편은 적어도 약 20개 뉴클레오티드 또는 그 이상, 바람직하게 적어도 약 30개 뉴클레오티드 또는 그 이상, 더욱 바람직하게 적어도 약 40개 뉴클레오티드 또는 그 이상의 길이를 보인다. 바람직하게 상기 절편은 본 발명에 설명된 기능적 절편이다.
일부 실시예에서, 인공 핵산 분자는 RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB로부터 선택된 포유동물과 같은 척추동물 TOP 유전자, 예를 들어 인간 TOP 유전자의 5'UTR로부터, 또는 이의 상동체 또는 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 5'UTR 요소를 포함하며, 상기 바람직하게 5'UTR 요소는 TOP-모티프 또는 상기 유전자의 5'TOP를 포함하지 않으며, 상기 선택적으로 5'UTR 요소는 5' 말단 올리고피리미딘 트랙트(TOP)의 위치 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 다운스트림에 위치한 뉴클레오티드와 함께 이의 5'-말단에서 시작하며, 상기 TOP 유전자의 5'UTR로부터 유도된 보다 선택적인 5'UTR 요소는 이것이 유도된 유전자의 시작 코돈 (A(U/T)G)의 위치 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 업스트림에 위치한 뉴클레오티드와 함께 이의 3'-말단에서 종결한다.
바람직하게, 상기 본 발명에 따른 인공 핵산 분자, 바람직하게 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되었다. 따라서, 본 발명의 인공 핵산 분자는 분자의 G(구아노신)/C(시티딘) 함량을 변형함으로써 열역학적으로 안정화될 수 있다. 본 발명에 따른 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량은 바람직하게 유전자 코드의 축퇴(degeneration)를 사용하여, 상응하는 야생형 서열의 오픈 리딩 프레임의 G/C 함량에 비해 증가될 수 있다. 따라서, 인공 핵산 분자의 코딩된 아미노산 서열은 바람직하게 특정한 야생형 서열의 코딩된 아미노산 서열에 비해 G/C 변형에 의해 변형되지 않는다. 코딩 서열의 코돈 또는 전체 인공 핵산 분자, 예를 들어 mRNA는 따라서 야생형 코딩 서열에 비해 다양할 수 있으며, 그들은 증가된 함량의 G/C 뉴클레오티드를 포함하는 반면 번역된 아미노산 서열은 유지된다. 몇몇 코돈이 하나 및 동일한 아미노산(소위 유전자 코드위 축퇴)을 코드(code)하는 사실 때문에, 코딩된 펩타이드/단백질 서열을 변화시키지 않고(소위 대안적(alternative) 코돈 사용), 코돈을 변형하는 것이 가능하다. 따라서, RNA의 안전성에 관하여 및/또는 개체 내 코돈 사용(소위 코돈 최적화)에 관하여 보다 바람직한, 특정 코돈을 특이적으로 도입(동일한 아미노산을 코딩하는 각각의 야생형 코돈을 교환)하는 것이 가능하다.
본 발명에 정의된 본 발명의 인공 핵산 분자의 코딩 영역에 의해 코딩되는 아미노산에 의존하여, 이의 야생형 코딩 영역에 비해, 핵산 서열, 예를 들어 오픈 리딩 프레임의 변형의 다양한 가능성이 있다. 독점적으로 G 또는 C 뉴클레오티드를 포함하는 코돈에 의해 코딩된 아미노산의 경우에, 코돈의 변형이 없는 것이 필수적이다. 따라서 Pro (CCC 또는 CCG), Arg (CGC 또는 CGG), Ala (GCC 또는 GCG) 및 Gly (GGC 또는 GGG)에 대한 코돈은, A 또는 U/T가 존재하지 않으므로, 변형을 요구하지 않는다.
대조적으로 A 및/또는 U/T 뉴클레오티드를 포함하는 코돈은 동일한 아미노산을 코딩하지만 A 및/또는 U/T를 포함하지 않는 다른 코돈의 치환에 의해 변형될 수 있다. 예를 들어
Pro에 대한 코돈은 CC(U/T) 또는 CCA로부터 CCC 또는 CCG로 변형될 수 있으며;
Arg에 대한 코돈은 CG(U/T) 또는 CGA 또는 AGA 또는 AGG로부터 CGC 또는 CGG로 변형될 수 있으며;
Ala에 대한 코돈은 GC(U/T) 또는 GCA로부터 GCC 또는 GCG로 변형될 수 있으며;
Gly에 대한 코돈은 GG(U/T) 또는 GGA로부터 GGC 또는 GGG로 변형될 수 있다.
다른 경우에, 비록 A 또는 (U/T) 뉴클레오티드가 코돈으로부터 제거되지 않더라도, 그러나 A 및/또는 (U/T) 뉴클레오티드의 낮은 함량을 포함하는 코돈을 사용함으로써 A 및 (U/T) 함량을 감소시키는 것이 가능하다. 이들의 예시는 하기와 같다:
Phe에 대한 코돈은 (U/T)(U/T)(U/T)로부터 (U/T) (U/T)C로 변형될 수 있으며;
Leu에 대한 코돈은 (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) 또는 C(U/T)A로부터 C(U/T)C 또는 C(U/T)G로 변형될 수 있으며;
Ser에 대한 코돈은 (U/T)C(U/T) 또는 (U/T)CA 또는 AG(U/T)로부터 (U/T)CC, (U/T)CG 또는 AGC로 변형될 수 있으며;
Tyr에 대한 코돈은 (U/T)A(U/T)로부터 (U/T)AC로 변형될 수 있으며;
Cys에 대한 코돈은 (U/T)G(U/T)로부터 (U/T)GC로 변형될 수 있으며;
His에 대한 코돈은 CA(U/T)로부터 CAC로 변형될 수 있으며;
Gln에 대한 코돈은 CAA로부터 CAG로 변형될 수 있으며;
Ile에 대한 코돈은 A(U/T)(U/T) 또는 A(U/T)A로부터 A(U/T)C로 변형될 수 있으며;
Thr에 대한 코돈은 AC(U/T) 또는 ACA로부터 ACC 또는 ACG로 변형될 수 있으며;
Asn에 대한 코돈은 AA(U/T)로부터 AAC로 변형될 수 있으며;
Lys에 대한 코돈은 AAA로부터 AAG로 변형될 수 있으며;
Val에 대한 코돈은 G(U/T)(U/T) 또는 G(U/T)A로부터 G(U/T)C 또는 G(U/T)G로 변형될 수 있으며;
Asp에 대한 코돈은 GA(U/T)로부터 GAC로 변형될 수 있으며;
Glu에 대한 코돈은 GAA로부터 GAG로 변형될 수 있으며;
정지 코돈 (U/T)AA는 (U/T)AG 또는 (U/T)GA로 변형될 수 있다.
Met (A(U/T)G) 및 Trp ((U/T)GG)에 대한 코돈의 경우에는, 반면 코딩된 아미노산 서열이 바뀌지 않는다면 서열 변형의 가능성은 없다.
상기 개시된 치환들은 이의 특정한 야생형 오픈 리딩 프레임(즉 본래 서열)에 비해, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량을 증가시키기 위해 각각 또는 모두 가능한 조합으로 사용될 수 있다. 따라서 예를 들어 야생형 서열에 발생하는 Thr에 대한 모든 코돈은 ACC(또는 ACG)로 변형될 수 있다.
바람직하게 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량은 코딩된 아미노산 서열의 변화 없이, 즉 유전자 코드의 축퇴를 사용하여, 야생형 코딩 영역의 G/C 함량에 비해 적어도 7%, 더욱 바람직하게는 적어도 15%, 특히 바람직하게는 적어도 20% 증가된다. 특정한 실시예에 따르면 본 발명의 인공 핵산 분자 또는 절편, 변이체 또는 이의 유도체의 오픈 리딩 프레임 내 치환가능한 코돈의 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 더욱 바람직하게는 적어도 70%, 더욱 더 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90%, 95% 또는 100%는 치환되며, 그에 따라 상기 오픈 리딩 프레임의 G/C 함량이 증가한다.
이러한 맥락에서 이는 코딩된 아미노산 서열의 변화 없이, 야생형 오픈 리딩 프레임에 비해, 최대한(즉 치환 가능한 코돈의 100%), 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임의 G/C 함량을 증가시키기 위해 특히 바람직하다.
나아가 오픈 리딩 프레임은 바람직하게는 적어도 부분적으로 코돈-최적화되었다. 코돈-최적화는 번역 효율이 세포 내 트랜스퍼 RNAs(tRNAs)의 발생의 다른 빈도에 의해 결정될 수 있다는 발견에 기초한다. 따라서 만약 소위 “드문 코돈”이 본 발명에 정의된 본 발명의 인공 핵산 분자의 코딩 영역에 존재하는 경우에, 증가된 범위에, 상응하는 변형된 핵산 서열의 번역은 상대적으로 “빈번한” tRNAs를 코딩하는 코돈이 존재하는 경우에 비해 덜 효율적이다.
따라서, 본 발명의 인공 핵산 분자의 오픈 리딩 프레임은 바람직하게는 세포 내 상대적으로 드문, tRNA를 코딩하는 야생형 서열의 적어도 하나의 코돈과 같이 상응하는 야생형 코딩 영역에 비해 변형되며, 세포 내 상대적으로 빈번하며 상대적으로 드문 tRNA와 같은 동일한 아미노산을 수송하는 tRNA를 코딩하는 코돈에 대해 교환된다. 이러한 변형에 의해, 본 발명에 정의된 본 발명의 인공 핵산 분자의 오픈 리딩 프레임은 변형되어, 빈번하게 발생하는 tRNAs가 가능한 코돈은 드문 tRNAs에 상응하는 코돈을 교체할 수 있다. 다시 말해서 본 발명에 따르면, 이러한 변형에 의해 드문 tRNA를 코딩하는 야생형 오픈 리딩 프레임의 모든 코돈은 세포 내 보다 빈번한 tRNA를 코딩하는 코돈으로 교환될 수 있으며 드문 tRNA로서 동일한 아미노산을 수송한다. 세포 내 상대적으로 빈번하게 발생하는 tRNAs 및 반대로 상대적으로 드물게 발생하는 것은 기술분야에서 통상의 기술자에게 알려져 있다; 예를 들어 Akashi, Curr. Opin. Genet. Dev. 2001, 11(6): 660-666 참조. 따라서 바람직하게는 오픈 리딩 프레임은 바람직하게는 본 발명에 따르는 인공 핵산 분자가 발현되는 시스템에 관하여, 바람직하게는 본 발명에 따르는 인공 핵산 분자가 번역되는 시스템에 관하여, 코돈 최적화된다. 바람직하게는 오픈 리딩 프레임의 코돈 사용은 포유동물 코돈 사용에 따라서, 더욱 바람직하게는 인간 코돈 사용에 따라서 코돈 최적화된다. 바람직하게는 오픈 리딩 프레임은 코돈-최적화되고 G/C 함량 변형된다.
추가적인 분해(degradation) 저항성, 예를 들어 엑소- 또는 엔도뉴클레아제에 의한 인비보 분해에 대한 저항성의 증가를 위해, 및/또는 본 발명에 따르는 인공 핵산 분자로부터 단백질 발현의 안정성을 보다 향상시키기 위해, 상기 인공 핵산 분자는 백본 변형, 당 변형 및/또는 염기 변형, 예를 들어 지질-변형 또는 그와 유사한 것과 같은 변형을 추가적으로 포함할 수 있다. 바람직하게는, 본 발명에 따르는 인공 핵산 분자의 전사 및 또는 번역은 상기 변형에 의해 현저하게 손상되지 않는다.
일반적으로, 본 발명의 인공 핵산 분자는 어느 천연(=자연적으로 발생) 뉴클레오티드, 예를 들어 구아노신, 우라실, 아데노신, 및/또는 시토신 또는 이의 유사체를 포함할 수 있다. 이와 관련하여, 뉴클레오티드 유사체는 자연적으로 발생한 뉴클레오티드 아데노신, 시토신, 티미딘, 구아노신 및 우리딘의 천연적 및 비-천연적으로 발생한 변이체로 정의된다. 따라서, 유사체는 예를 들어 바람직하게 자연적으로 발생한 뉴클레오티드로부터 첨가 또는 삭제된 또는 뉴클레오티드의 자연적으로 발생한 기능기를 치환하는, 비-자연적으로 발생한 기능기를 갖는 화학적으로 유도된 뉴클레오티드이다. 따라서, 자연적으로 발생하는 뉴클레오티드의 각 구성요소는 변형된, 즉 염기 구성요소, 당(리보스) 구성요소 및/또는 RNA 서열의 백본(상기 참조)을 형성하는 포스페이트 구성요소일 수 있다. 구아노신, 우리딘, 아데노신, 티미딘 및 시토신의 유사체는 예를 들어 1-메틸-아데노신, 1-메틸-구아노신, 1-메틸-이노신, 2,2-디메틸-구아노신, 2,6-디아미노퓨린, 2'-아미노-2'-디옥시아데노신, 2'-아미노-2'-디옥시시티딘, 2'-아미노-2'-디옥시구아노신, 2'-아미노-2'-디옥시우리딘, 2-아미노-6-클로로퓨린리보사이드, 2-아미노퓨린-리보사이드, 2'-아라아데노신, 2'-아라시티딘, 2'-아라우리딘, 2'-아지도-2'-디옥시아데노신, 2'-아지도-2'-디옥시시티딘, 2'-아지도-2'-디옥시구아노신, 2'-아지도-2'-디옥시우리딘, 2-클로로아데노신, 2'-플루오로-2'-디옥시아데노신, 2'-플루오로-2'-디옥시시티딘, 2'-플루오로-2'-디옥시구아노신, 2'-플루오로-2'-디옥시우리딘, 2'-플루오로티미딘, 2-메틸-아데노신, 2-메틸-구아노신, 2-메틸-티오-N6-이소페네닐-아데노신, 2'-O-메틸-2-아미노아데노신, 2'-O-메틸-2'-디옥시아데노신, 2'-O-메틸-2'-디옥시시티딘, 2'-O-메틸-2'-디옥시구아노신, 2'-O-메틸-2'-디옥시우리딘, 2'-O-메틸-5-메틸우리딘, 2'-O-메틸이노신, 2'-O-메틸슈도우리딘, 2-티오시티딘, 2-티오-시토신, 3-메틸-시토신, 4-아세틸-시토신, 4-티오우리딘, 5-(카르복시하이드록시메틸)-우라실, 5,6-디하이드로우리딘, 5-아미노알릴시티딘, 5-아미노알릴-디옥시-우리딘, 5-브로모우리딘, 5-카르복시메틸아미노메틸-2-티오-우라실, 5-카르복시메틸아모노메틸-우라실, 5-클로로-아라-시토신, 5-플루오로-우리딘, 5-아이오도우리딘, 5-메톡시카르보닐메틸-우리딘, 5-메톡시-우리딘, 5-메틸-2-티오-우리딘, 6-아자시티딘, 6-아자우리딘, 6-클로로-7-디아자-구아노신, 6-클로로퓨린리보사이드, 6-메르캅토-구아노신, 6-메틸-메르캅토퓨린-리보사이드, 7-디아자-2'-디옥시-구아노신, 7-디아자아데노신, 7-메틸-구아노신, 8-아자아데노신, 8-브로모-아데노신, 8-브로모-구아노신, 8-메르캅토-구아노신, 8-옥소구아노신, 벤지미다졸-리보사이드, 베타-D-만노실-큐오신(queosine), 디하이드로-우라실, 이노신, N1-메틸아데노신, N6-([6-아미노헥실]카르바모일메틸)-아데노신, N6-이소펜테닐-아데노신, N6-메틸-아데노신, N7-메틸-잔토신, N-우라실-5-옥시아세트산 메틸 에스터, 퓨로마이신, 큐오신, 우라실-5-옥시아세트산, 우라실-5-옥시아세트산 메틸 에스터, 위보톡소신(Wybutoxosine), 잔토신, 및 자일로-아데노신을 포함하는 화학적으로 변형된, 예를 들어 아세틸화, 메틸화, 하이드록실화 등에 의해, 어느 자연적 발생 또는 비-자연적 발생한 구아노신, 우리딘, 아데노신, 티미딘 또는 시토신을 포함하나, 이에 제한되지 않는다. 이러한 유사체의 제조는 예를 들어 US 특허 4,373,071, US 4,401,796, US 4,415,732, US 4,458,066, US 4,500,707, US 4,668,777, US 4,973,679, US 5,047,524, US 5,132,418, US 5,153,319, US 5,262,530 및 5,700,642로부터, 통상의 기술자에게 알려져 있다. 상기 설명된 유사체의 경우, 특히 바람직한 것은 코딩된 펩타이드 또는 단백질의 단백질의 발현을 증가시키는, 또는 본 발명의 인공 핵산 분자의 면역원성을 증가시키며 및/또는 도입된 인공 핵산 분자의 추가적 변형을 방해하지 않는, 이들 유사체에 대하여 본 발명의 특정한 실시예에 따라 주어질 수 있다.
특정한 실시예에 따르면, 본 발명의 인공 핵산 분자는 지질 변형을 포함할 수 있다.
바람직한 실시예에서, 인공 핵산 분자는 바람직하게 5'에서 3' 방향으로 하기 요소를 포함한다:
5'-UTR;
적어도 하나의 오픈 리딩 프레임(ORF), 상기 ORF는 바람직하게 야생형 서열에 관하여 적어도 하나의 변형을 포함함;
리보좀 단백질의 3'UTR로부터, 바람직하게 SEQ ID NOs: 10 내지 115의, 더욱 바람직하게 RPS9의 3'UTR의, 더욱 바람직하게 인간 RPS9의 3'UTR의 어느 것에 따른 핵산 서열로부터 유도된 3'-UTR;
폴리(A) 서열, 바람직하게 64개 아데닐레이트(adenylates)를 포함;
폴리(C) 서열, 바람직하게 30개 시티딜레이트(cytidylates)를 포함;
히스톤 스템-루프 서열.
다른 바람직한 실시예에서, 인공 핵산 분자는 SEQ ID NO: 7(도 3 참조)에 따라 나타난 뉴클레오티드 서열 또는 상보적인 DNA 서열을 포함하거나 이로 구성된다.
특히 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자는 하기에 설명된 하나 또는 그 이상의 변형을 추가적으로 포함할 수 있다:
화학적 변형:
인공 핵산 분자에 관하여 본 발명에 사용된 용어 "변형"은 백본 변형뿐만 아니라 당 변형 또는 염기 변형을 포함하는 화학적 변형을 의미할 수 있다.
이러한 맥락에서, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자는 뉴클레오티드 유사체/변형, 예를 들어 백본 변형, 당 변형 또는 염기 변형을 포함할 수 있다. 본 발명에 관련하여 백본 변형은 본 발명에 정의된 핵산 분자 내 포함된 뉴클레오티드의 백본의 포스페이트가 화학적으로 변형된, 변형이다. 본 발명에 관하여 당 변형은 본 발명에 정의된 핵산 분자의 뉴클레오티드의 당의 화학적 변형이다. 게다가, 본 발명에 관하여 염기 변형은 핵산 분자의 핵산 분자의 뉴클레오티드의 염기 일부의 화학적 변형이다. 이러한 맥락에서, 뉴클레오티드 유사체 또는 변형은 바람직하게 전사 및/또는 번역을 위해 적용 가능한 뉴클레오티드 유사체로부터 선택된다.
당 변형:
본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA에 병합될 수 있는 변형된 뉴클레오시드 및 뉴클레오티드는 당 일부에 변형될 수 있다. 예를 들어, RNA 분자의 2'하이드록실기(OH)는 다른 많은 "옥시" 또는 "디옥시" 치환기로 변형되거나 교체될 수 있다. "옥시"-2' 하이드록실기 변형의 예시는 알콕시 또는 알릴옥시(-OR, 예를 들어, R = H, 알킬, 사이클로알킬, 아릴, 아랄킬, 헤테로아릴 또는 당); 폴리에틸렌글리콜(PEG), -0(CH2CH2o)nCH2CH2OR; 2'하이드록실이 연결된 "잠긴(locked)" 핵산(LNA), 예를 들어 동일한 리보스 당의 4' 탄소에 메틸렌 브릿지에 의한 것; 및 아미노기(-O-아미노, 상기 아미노기, 예를 들어 NRR은 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴 아미노, 에틸렌 디아민, 폴리아미노일 수 있음) 또는 아미노알콕시를 포함하나, 이에 제한되지 않는다.
"디옥시" 변형은 수소, 아미노(예를 들어 NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴 아미노, 디헤테로아릴 아미노, 또는 아미노산)를 포함; 또는 아미노기는 링커를 통해 당에 결합될 수 있으며, 상기 링커는 하나 또는 그 이상의 원자 C, N, 및 O를 포함한다.
상기 당 그룹은 또한 리보스 내 상응하는 탄소에 비해 반대의 입체 화학적 배치를 갖는 하나 또는 그 이상의 탄소를 포함한다. 따라서, 변형된 핵산 분자는 예를 들어 당과 같은 아라비노스를 포함하는 뉴클레오티드를 포함할 수 있다.
백본 변형:
포스페이트 백본은 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA로 병합될 수 있는, 변형된 뉴클레오시드 및 뉴클레오티드에서 더욱 변형될 수 있다. 백본의 포스페이트 기는 다른 치환기와 함께 산소 원자의 하나 또는 그 이상의 교체에 의해 변형될 수 있다. 게다가, 변형된 뉴클레오시드 및 뉴클레오티드는 본 발명에 설명된 변형된 포스페이트와 함께 비변형된 포스페이트 일부의 완전한 교체를 포함할 수 있다. 변형된 포스페이트 기의 예시는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스터, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스터를 포함하나, 이에 제한되지 않는다. 포스포로디티오에이트는 황에 의해 교체된 양쪽 비-연결 산소를 갖는다. 포스페이트 링커는 또한 질소(가교된(bridged) 포스포로아미데이트), 황(가교된 포스포로티오에이트) 및 탄소(가교된 메틸렌포스포네이트)와 함께 연결 산소의 치환에 의해 변형될 수 있다.
염기 변형:
본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자로 병합될 수 있는, 변형된 뉴클레오시드 및 뉴클레오티드는 핵염기 일부에 추가로 변형될 수 있다. RNA에서 발견된 핵염기의 예시는 아데닌, 구아닌, 시토신 및 우라실을 포함하나, 이에 제한되지 않는다. 예를 들어, 본 발명에 정의된 뉴클레오시드 및 뉴클레오티드는 메이저 그루브(major groove) 페이스에 화학적으로 변형될 수 있다. 일부 실시예에서, 메이저 그루브 화학적 변형은 아미노기, 티올기, 알킬기, 또는 할로기를 포함할 수 있다.
본 발명의 특히 바람직한 실시예에서, 뉴클레오티드 유사체/변형은 2-아미노-6-클로로퓨린리보사이드-5'-트리포스페이트, 2-아미노퓨린-리보사이드-5'-트리포스페이트; 2-아미노아데노신-5'-트리포스페이트, 2'-아미노-2'-디옥시시티딘-트리포스페이트, 2-티오시티딘-5'-트리포스페이트, 2-티오우리딘-5'-트리포스페이트, 2'-플루오로티미딘-5'-트리포스페이트, 2'-O-메틸 이노신-5'-트리포스페이트 4-티오우리딘-5'-트리포스페이트, 5-아미노알릴 시티딘-5'-트리포스페이트, 5-아미노알릴우리딘-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 5-브로모우리딘-5'-트리포스페이트, 5-브로모-2'-디옥시시티딘-5'-트리포스페이트, 5-브로모-2'-디옥시우리딘-5'-트리포스페이트, 5-아이오도시티딘-5'-트리포스페이트, 5-아이오도-2'-디옥시시티딘-5'-트리포스페이트, 5-아이오도우리딘-5'-트리포스페이트, 5-아이오도-2'-디옥시우리딘-5'-트리포스페이트, 5-메틸시티딘-5'-트리포스페이트, 5-메틸우리딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시시티딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시우리딘-5'-트리포스페이트, 6-아자시티딘-5'-트리포스페이트, 6-아자우리딘-5'-트리포스페이트, 6-클로로퓨린리보사이드-5'-트리포스페이트, 7-디아자아데노신-5'-트리포스페이트, 7-디아자구아노신-5'-트리포스페이트, 8-아자아데노신-5'-트리포스페이트, 8-아지도아데노신-5'-트리포스페이트, 벤지미다졸-리보사이드-5'-트리포스페이트, N1-메틸아데노신-5'-트리포스페이트, N1-메틸구아노신-5'-트리포스페이트, N6-메틸아데노신-5'-트리포스페이트, O6-메틸 구아노신-5'-트리포스페이트, 슈도우리딘-5'-트리포스페이트, 또는 퓨로마이신-5'-트리포스페이트, 잔토신-5'-트리포스페이트로부터 바람직하게 선택된 염기 변형으로부터 선택된다. 특히 바람직한 것은 5-메틸시티딘-5'-트리포스페이트, 7-디아자구아노신-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 및 슈도우리딘-5'-트리포스페이트로 구성된 염기 변형된 뉴클레오티드의 그룹으로부터 선택된 염기 변형에 대하여 뉴클레오티드로 주어졌다.
일부 실시예에서, 변형된 뉴클레오시드는 피리딘-4-온 리보뉴클레오시드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카르복시메틸-우리딘, 1-카르복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-디아자-슈도우리딘, 2-티오-1-메틸-1-디아자-슈도우리딘, 디하이드로우리딘, 디하이드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 및 4-메톡시-2-티오-슈도우리딘을 포함한다.
일부 실시예에서, 변형된 뉴클레오시드는 5-아자-시티딘, 슈도이소시티딘, 3-메틸-시티딘, N4-아세틸시티딘, 5-포밀시티딘, N4-메틸시티딘, 5-하이드록시메틸시티딘, 1-메틸-슈도이소시티딘, 피롤로-시티딘, 피롤로-슈도이소시티딘, 2-티오-시티딘, 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-디아자-슈도이소시티딘, 1-메틸-1-디아자-슈도이소시티딘, 제부라린(zebularine), 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 및 4-메톡시-l-메틸-슈도이소시티딘을 포함한다.
다른 실시예에서, 변형된 뉴클레오시드는 2-아미노퓨린, 2, 6-디아미노퓨린, 7-디아자-아데닌, 7-디아자-8-아자-아데닌, 7-디아자-2-아미노퓨린, 7-디아자-8-아자-2-아미노퓨린, 7-디아자-2,6-di아미노퓨린, 7-디아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜틸아데노신, N6-(시스-하이드록시이소펜틸)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐) 아데노신, N6-글리시닐카르바모일아데노신, N6-트레오닐카르바모일아데노신, 2-메틸티오-N6-트레오닐 카르바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌을 포함한다.
다른 실시예에서, 변형된 뉴클레오시드는 이노신, 1-메틸-이노신, 위오신, 위부토신, 7-디아자-구아노신, 7-디아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-디아자-구아노신, 6-티오-7-디아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, l-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신을 포함한다.
일부 실시예에서, 뉴클레오티드는 메이저 그루브 페이스에 변형될 수 있으며 메틸기 또는 할로기로 우라실의 C-5에 수소의 교체를 포함할 수 있다.
특정한 실시예에서, 변형된 뉴클레오시드는 5'-O-(1-티오포스페이트)-아데노신, 5'-O-(1-티오포스페이트)-시티딘, 5'-O-(1-티오포스페이트)-구아노신, 5'-O-(1-티오포스페이트)-우리딘 또는 5'-O-(1-티오포스페이트)-슈도우리딘이다.
보다 특정한 실시예에서 인공 핵산 분자, 바람직하게 RNA 분자는 6-아자-시티딘, 2-티오-시티딘, 알파-티오-시티딘, 슈도-이소-시티딘, 5-아미노알릴-우리딘, 5-아이오도-우리딘, N1-메틸-슈도우리딘, 5,6-디하이드로우리딘, 알파-티오-우리딘, 4-티오-우리딘, 6-아자-우리딘, 5-하이드록시-우리딘, 디옥시-티미딘, 5-메틸-우리딘, 피롤로-시티딘, 이노신, 알파-티오-구아노신, 6-메틸-구아노신, 5-메틸-시티딘, 8-옥소-구아노신, 7-디아자-구아노신, N1-메틸-아데노신, 2-아미노-6-클로로-퓨린, N6-메틸-2-아미노-퓨린, 슈도-이소-시티딘, 6-클로로-퓨린, N6-메틸-아데노신, 알파-티오-아데노신, 8-아지도-아데노신, 7-디아자-아데노신으로부터 선택된 뉴클레오시드 변형을 포함할 수 있다.
지질 변형:
추가적 실시예에 따르면, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA는 지질 변형을 포함할 수 있다. 이러한 지질 변형된 RNA는 전형적으로 본 발명에 정의된 RNA를 포함한다. 본 발명에 정의된 이러한 지질 변형된 RNA 분자는 전형적으로 RNA 분자와 공유 결합된 적어도 하나의 링커, 및 각각의 링커와 공유 결합된 적어도 하나의 지질을 추가로 포함한다. 그렇지 않으면, 상기 지질 변형된 RNA 분자는 본 발명에 정의된 적어도 하나의 RNA 분자 및 RNA 분자와 공유 결합된(링커 없이) 적어도 하나의 (이기능성(bifunctional)) 지질을 포함한다. 세번째 대안에 따르면, 지질 변형된 RNA 분자는 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자, 상기 RNA 분자와 공유 결합된 적어도 하나의 링커, 및 각각의 링커에 공유 결합된 적어도 하나의 지질, 및 또한 RNA 분자와 공유 결합된(링커 없이) 적어도 하나의 (이기능성) 지질을 포함한다. 이러한 맥락에서, 상기 지질 변형은 선형 RNA 서열의 말단에 존재하는 것이 특히 바람직하다.
변형된 RNA의 5'-말단의 변형:
본 발명의 다른 바람직한 실시예에 따르면, 본 발명에 정의된 인공 핵산 분자, 바람직하게 RNA 분자는 소위 "5' 캡(CAP)" 구조의 추가에 의해 변형될 수 있다.
5'-캡은 독립체, 전형적으로 변형된 뉴클레오티드 독립체이며, 일반적으로 성숙 mRNA의 5'-말단 "캡"이다. 5'-캡은 전형적으로 변형된 뉴클레오티드에 의해, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게, 5'-캡은 5'-5'-트리포스페이트 연결을 통해 5'-말단에 연결된다. 5'-캡은 메틸화, 예를 들어 m7GpppN될 수 있으며, 상기 N은 5'-캡을 수송하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 RNA의 5'-말단이다. m7GpppN은 폴리머라제 II에 의해 전사된 mRNA에서 자연적으로 발생하는 5'-캡 구조이며, 따라서 본 발명에 따른 변형된 RNA에 포함된 변형으로 고려되지 않는다. 이는 본 발명에 따른 인공 핵산 분자, 바람직하게 RNA 분자가 5'-캡으로 m7GpppN을 포함할 수 있음을 의미하지만, 추가적으로 상기 인공 핵산 분자, 바람직하게 RNA 분자는 본 발명에 정의된 적어도 하나의 추가적 변형을 포함한다.
5' 캡 구조의 추가적인 예시는 글리세릴, 인버티드(inverted) 디옥시 무염기(abasic) 잔기(일부), 4',5' 메틸렌 뉴클레오티드, 1-(베타-D-에리쓰로퓨라노실) 뉴클레오티드, 4'-티오 뉴클레오티드, 카르복실릭 뉴클레오티드, 1,5-무수헥시톨(anhydrohexitol) 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형된 염기 뉴클레오티드, 트레오-펜토퓨라노실 뉴클레오티드, 아실릭 3',4'-세코 뉴클레오티드, 아실릭 3,4-디하이드록시부틸 뉴클레오티드, 아실릭 3,5 디하이드록시펜틸 뉴클레오티드, 3'-3'-인버티드 뉴클레오티드 일부, 3'-3'-인버티드 무염기 일부, 3'-2'-인버티드 뉴클레오티드 일부, 3'-2'-인버티드 무염기 일부, 1,4-부탄디올 포스페이트, 3'-포스포아미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'포스포로 티오에이트, 포스포로디티오에이트, 또는 가교 또는 비가교 메틸렌포스포네이트 일부를 포함한다. 이들 변형된 5'-CAP 구조는 본 발명에 따른 인공 핵산 분자, 바람직하게 RNA 분자 내 포함된 적어도 하나의 변형으로 여겨진다.
특히 바람직한 변형된 5'-CAP 구조는 CAP1 (m7G의 인접 뉴클레오티드의 리보스의 메틸화), CAP2 (m7G의 2nd 뉴클레오티드 다운스트림의 리보스의 메틸화), CAP3 (m7G의 3rd 뉴클레오티드의 리보스의 메틸화), CAP4(m7G의 4th 뉴클레오티드 다운스트림의 리보스의 메틸화), ARCA (안티-리버스 CAP 유사체, 변형된 ARCA(예를 들어 포스포티오에이트 변형된 ARCA), 이노신, N1-메틸-구아노신, 2'-플루오로-구아노신, 7-디아자-구아노신, 8-옥소-구아노신, 2-아미노-구아노신, LNA-구아노신, 및 2-아지도-구아노신이다.
바람직한 실시예에서, 적어도 하나의 오픈 리딩 프레임은 치료 단백질 또는 펩타이드를 코딩한다. 다른 실시예에서, 항원은 병원성 항원, 종양 항원, 알러지성 항원 또는 자가면역 항원과 같은, 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다. 이하, 항원을 코딩하는 인공 핵산 분자의 투여는 상기 항원을 포함하는 질병에 대한 유전적 백신접종 접근방법에 사용된다.
대안적 실시예에서, 항원은 본 발명에 따른 인공 핵산 분자의 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다.
항원:
병원성 항원:
본 발명에 따른 인공 핵산 분자는 병원성 항원 또는 절편, 이의 변이체 또는 유도체를 포함하는 단백질 또는 펩타이드를 코딩한다. 이러한 병원성 항원은 개체, 특히 포유동물 개체, 보다 특히 인간 내 면역학적 반응을 일으키는 병원성 유기체, 특히 박테리아, 바이러스 또는 원생동물(다세포) 병원성 유기체로부터 유도된다. 보다 구체적으로, 병원성 항원은 바람직하게 바이러스 또는 박테리아 또는 원생동물 유기체의 표면에 위치한 표면 항원, 예를 들어 단백질(또는 단백질의 절편, 예를 들어 표면 항원의 외부 일부)이다.
병원성 항원은 바람직하게 감염성 질병과 관련된 병원체로부터 유도된 펩타이드 또는 단백질 항원이며, 바람직하게 병원체 아시네토박터 바우마니(Acinetobacter baumannii), 아나플라즈마 속(Anaplasma genus), 아나플라즈마 파고사이토필리움(Anaplasma phagocytophilum), 브라질구충(Ancylostoma braziliense), 십이지장충(Ancylostoma duodenale), 용혈성 아카노박테리아균(Arcanobacterium haemolyticum), 회충(Ascaris lumbricoides), 아스페르길루스 속(Aspergillus genus), 아스트로비리다에(Astroviridae), 바베시아 속(Babesia genus), 탄저균(Bacillus anthracis), 바실러스 세레우스(Bacillus cereus), 바르토넬라 헨셀라에(Bartonella henselae), BK 바이러스, 블라스토시스티스 호미니스(Blastocystis hominis), 블라스토미세스 더마티티디스(Blastomyces dermatitidis), 백일해균(Bordetella pertussis), 보렐리아 부르그도르페리(Borrelia burgdorferi), 보렐리아 속(Borrelia genus), 보렐리아 종(Borrelia spp), 브루셀라 속(Brucella genus), 말레이사상충(Brugia malayi), 부니아바이러스 과(Bunyaviridae family), 부르크홀데리아 세파시아(Burkholderia cepacia) 및 다른 부르크홀데리아 종, 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이, 칼리시비리다에 과(Caliciviridae family), 캄필로박터 속(Campylobacter genus), 칸디다 알비칸스(Candida albicans), 칸디다 종(Candida spp), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미도필라 뉴모니아(Chlamydophila pneumoniae), 클라미도필라 프시타시(Chlamydophila psittaci), CJD 프리온, 간흡충(Clonorchis sinensis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실리(Clostridium difficile), 클로스트리듐 페르프린젠스(Clostridium perfringens), 클로스트리듐 페르프린젠스, 클로스트리듐 종(Clostridium spp), 클로스트리듐 테타니(Clostridium tetani), 콕시디오이데스 종(Coccidioides spp), 코로나바이러스(coronaviruses), 디프테리아균(Corynebacterium diphtheria), 콕시엘라 부르네티(Coxiella burnetii), 크리민 콩고 출혈열 바이러스(Crimean-Congo hemorrhagic fever virus), 크립토콕쿠스 네오포르만스(Cryptococcus neoformans), 크립토스포리디움 속(Cryptosporidium genus), 사이토메갈로바이러스(Cytomegalovirus, CMV), 뎅기 바이러스(Dengue viruses) (DEN-1, DEN-2, DEN-3 및 DEN-4), 이핵아메바(Dientamoeba fragilis), 에볼라바이러스(Ebolavirus, EBOV), 에키노코쿠스 종(Echinococcus genus), 에를리히아 샤펜시스(Ehrlichia chaffeensis), 엘리키아 에윈기(Ehrlichia ewingii), 엘리키아 속(Ehrlichia genus), 이질 아메바(Entamoeba histolytica), 장구균 속(Enterococcus genus), 장내 바이러스 속(Enterovirus genus), 장내 바이러스(Enteroviruses), 주로 콕사키 A 바이러스(Coxsackie A virus) 및 장내 바이러스 71 (EV71), 표피사상균 종(Epidermophyton spp), 엡스테인-바 바이러스(Epstein-Barr Virus, EBV), 대장균(Escherichia coli) O157:H7, O111 및 O104:H4, 간질(Fasciola hepatica) 및 거대 간질(Fasciola gigantica), FFI 프리온, 필라리오이데아 상과(Filarioidea superfamily), 플라비바이러스(Flaviviruses), 야토병균(Francisella tularensis), 푸소박테리움 속(Fusobacterium genus), 게오트리쿰 칸디둠(Geotrichum candidum), 지알디아편모충(Giardia intestinalis), 악구충속 종(Gnathostoma spp), GSS 프리온, 구아나리토 바이러스(Guanarito virus), 헤모필루스 듀크레이(Haemophilus ducreyi), 헤모필루스 인플루엔자(Haemophilus influenza), 헬리코박터 파일로리(Helicobacter pylori), 헤니파바이러스(Henipavirus) (Hendra virus Nipah virus), 간염 A 바이러스, 간염 B 바이러스(HBV), 간염 C 바이러스(HCV), 간염 D 바이러스, 간염 E 바이러스, 단순포진 바이러스 1 및 2 (HSV-1 및 HSV-2), 히스토플라스마 캡슐라툼(Histoplasma capsulatum), HIV (인간 면역결핍 바이러스, Human immunodeficiency virus), 호르테아 웨넥키(Hortaea werneckii), 인간 보카바이러스(Human bocavirus) (HBoV), 인간 헤르페스 바이러스 6(Human herpesvirus 6, HHV-6) 및 인간 헤르페스 바이러스 7 (HHV-7), 인간 메타뉴모바이러스(Human metapneumovirus, hMPV), 인간 파필로마바이러스(Human papillomavirus, HPV), 인간 파라인플루엔자 바이러스(Human parainfluenza viruses, HPIV), 일본 뇌염 바이러스(Japanese encephalitis virus), JC 바이러스, 주닌(Junin) 바이러스, 킨젤라 킨가에(Kingella kingae), 클레브시엘라 글라눌로마티스(Klebsiella granulomatis), 쿠루 프리온(Kuru prion), 라싸 바이러스(Lassa virus), 레지오넬라 뉴모필라(Legionella pneumophila), 레슈마니아 속(Leishmania genus), 렙토스피라 속(Leptospira genus), 리스테리아 모노사이토게네스(Listeria monocytogenes), 림프구성 맥락수막염바이러스(Lymphocytic choriomeningitis virus) (LCMV), 마츄포 바이러스(Machupo virus), 말라세지아 종(Malassezia spp), 마르부르그 바이러스(Marburg virus), 홍역 바이러스(Measles virus), 메타고니무스 요카가와이(Metagonimus yokagawai), 마이크로스포리디아 필룸(Microsporidia phylum), 전염성 연속종 바이러스(Molluscum contagiosum virus) (MCV), 귀밑샘염 바이러스(Mumps virus), 나균(Mycobacterium leprae) 및 마이코박테리아 레프로마토시스(Mycobacterium lepromatosis), 마이코박테리움 투베쿨로시스(Mycobacterium tuberculosis), 마이코박테리움 우르세란스(Mycobacterium ulcerans), 마이코플라즈마 폐렴(Mycoplasma pneumoniae), 파울러 자유아메바(Naegleria fowleri), 아메리카 구충(Necator americanus), 임균(Neisseria gonorrhoeae), 수막염균(Neisseria meningitides), 노카디아 아스테로이드(Nocardia asteroids), 노카디아 종(Nocardia spp), 온코세르카 볼부루스(Onchocerca volvulus), 오리엔티아 쯔쯔가무시(Orientia tsutsugamushi), 오르토믹소 바이러스과(Orthomyxoviridae family, 인플루엔자), 브라질 파라콕시디오이디즈(Paracoccidioides brasiliensis), 폐흡충 종(Paragonimus spp), 폐디스토마(Paragonimus westermani), 파보바이러스(Parvovirus) B19, 파스퇴렐라 속(Pasteurella genus), 플라스모디움 속(Plasmodium genus), 폐포자충(Pneumocystis jirovecii), 폴리오바이러스(Poliovirus), 라비 바이러스(Rabies virus), 호흡기 합포체 바이러스(Respiratory syncytial virus, RSV), 리노바이러스(Rhinovirus), 리노바이러스, 리케치아 아카리(Rickettsia akari), 리케치아 속(Rickettsia genus), 발진티푸스 리케치아(Rickettsia prowazekii), 로키산 홍반열 리케치아(Rickettsia rickettsia), 발진열 리케치아(Rickettsia typhi), 리프트벨리열 바이러스(Rift Valley fever virus), 로타바이러스(Rotavirus), 풍진 바이러스(Rubella virus), 사비아 바이러스(Sabia virus), 살모넬라 속(Salmonella genus), 천공 개선충(Sarcoptes scabiei), SARS 코로나바이러스, 주혈흡충 속(Schistosoma genus), 시겔라 속(Shigella genus), 신 놈브레 바이러스(Sin Nombre virus), 한타바이러스(Hantavirus), 스포로트릭스 셴키(Sporothrix schenckii), 스타필로코커스 속(Staphylococcus genus), 스타필로코커스 속, 스트렙토코커스 아갈락티아(Streptococcus agalactiae), 폐렴연쇄구균(Streptococcus pneumoniae), 화농성연쇄구균(Streptococcus pyogenes), 분선충(Strongyloides stercoralis), 테니아 속(Taenia genus), 유구조충(Taenia solium), 진드기매개뇌염(Tick-borne encephalitis virus, TBEV), 견회충(Toxocara canis) 또는 고양이 회충(Toxocara cati), 톡소플라즈마 곤디(Toxoplasma gondii), 트레포네마 팔리둠(Treponema pallidum), 선모충(Trichinella spiralis), 질트리코모나스(Trichomonas vaginalis), 백선균 종(Trichophyton spp), 편충(Trichuris trichiura), 트리파노소마 브루세이(Trypanosoma brucei), 트리파노소마 크루지(Trypanosoma cruzi), 우레아플라즈마 우레알리티쿰(Ureaplasma urealyticum), 수두 대상 포진 바이러스(Varicella zoster virus) (VZV), 수두 대상 포진 바이러스 (VZV), 천연두 메이저(Variola major) 또는 천연두 마이너(Variola minor), vCJD 프리온, 베네스 웰라형 마뇌염 바이러스(Venezuelan equine encephalitis virus), 비브리오 콜레라(Vibrio cholera), 웨스트 나일 바이러스(West Nile virus), 서부형 마뇌염 바이러스(Western equine encephalitis virus), 반크로프트 사상충(Wuchereria bancrofti), 황열병 바이러스(Yellow fever virus), 여시니아 엔테로콜리티카(Yersinia enterocolitica), 여시니아 페스티스(Yersinia pestis), 및 여시니아 슈도투베르쿨로시스( Yersinia pseudotuberculosis)로부터 유도된 항원으로부터 선택된다.
이러한 맥락에서, 인플루엔자 바이러스, 호흡기 합포체 바이러스 (RSV), 단순 포진 바이러스 (HSV), 인유두종 바이러스 (HPV), 인간 면역결핍 바이러스 (HIV), 플라스모디움, 황색포도상구균, 뎅기 바이러스, 트라코마 클라미디아, 시토메갈로바이러스(CMV), 간염 B 바이러스 (HBV), 결핵균, 광견병 바이러스, 및 황열병 바이러스로부터 선택된 병원체로부터 항원이 특히 바람직하다.
종양 항원:
추가적 실시예에서 본 발명에 따른 인공 핵산 분자는 종양 항원, 절편, 상기 종양 항원의 변이체 또는 유도체를 포함하는 펩타이드 또는 단백질을 포함하는 단백질 또는 펩타이드를 코딩할 수 있으며, 바람직하게 상기 종양 항원은 멜라닌 세포-특이적 항원, 고환암 항원 또는 종양 특이적 항원, 바람직하게 CT-X 항원, 비-X CT-항원, CT-X 항원에 대한 결합 파트너 또는 비-X CT-항원 또는 종양 특이적 항원에 대한 결합 파트너, 더욱 바람직하게 CT-X 항원, 비-X CT-항원에 대한 결합 파트너 또는 종양-특이적 항원 또는 상기 종양 항원의 변이체 또는 유도체이며; 및 상기 각각의 핵산 서열은 다른 펩타이드 또는 단백질을 코딩하며; 및 상기 적어도 하나의 핵산 서열은 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, 알파-5-베타-1-인테그린, 알파-5-베타-6-인테그린, 알파-액티닌-4/m, 알파-메틸아실-코엔자임 A 라세메이즈, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, 베타-카테닌/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA 19-9, CA72-4, CA125, 칼레티쿨린(calreticulin), CAMEL, CASP-8/m, 카뎁신 B(cathepsin B), 카뎁신 L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, 코액토신-유사 단백질, 콜라주(collage) XXIII, COX-2, CT-9/BRD6, Cten, 사이클린 B1, 사이클린 D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, 헵신, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, 호메오박스 NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, 미숙 라미닌 수용체, 칼리크레인(kallikrein)-2, 크레인-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, 맘마글로빈(mammaglobin) A, MART-1/멜란-A, MART-2, MART-2/m, 기질 단백질(matrix protein) 22, MC1R, M-CSF, ME1/m, 메소텔린(mesothelin), MG50/PXDN, MMP11, MN/CA IX-항원, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, 미오신 클래스 I/m, NA88-A, N-아세틸글루코사미닐트랜스퍼라제-V, 네오-PAP, 네오-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, 오스테오칼신, 오스테오폰틴, p15, p190 마이너 bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PAP, PART-1, PATE, PDEF, Pim-1-키나제, Pin-1, Pml/PAR알파, POTE, PRAME, PRDX5/m, 프로스테인, 프로테이나제-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP-1, 서바이빈, 서바이빈-2B, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGF베타, TGF베타RII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, 티로시나제, UPA, VEGFR1, VEGFR-2/FLK-1, WT1 및 림프성 혈구의 면역글로불린 유전자형 또는 림프구 혈구의 T 세포 수용체 유전자형, 또는 상기 종양 항원의 절편, 변이체 또는 유도체; 바람직하게 서바이빈 또는 이의 유사체, MAGE-과로부터 항원 또는 이의 결합 파트너 상기 종양 항원의 절편, 변이체 또는 유도체를 코딩한다. 이러한 맥락에서 종양 항원 NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, 서바이빈, Muc-1, PSA, PSMA, PSCA, STEAP 및 PAP가 특히 바람직하다.
바람직한 실시예에서, 상기 인공 핵산 분자는 치료적 단백질 또는 절편, 이의 변이체 또는 유도체를 포함하는, 단백질 또는 펩타이드를 코딩한다.
본 발명에 정의된 치료 단백질은 어느 유전된 또는 후천적 질병의 치료에 유용한 또는 개인의 상태를 개선시키는 펩타이드 또는 단백질이다. 특히, 치료 단백질은 다른 기능들 가운데, 유전적 결함의 변형 및 치료, 암 세포 또는 병원체 감염된 세포의 파괴, 면역계 질환 치료, 대사성 또는 내분비 질환의 치료를 할 수 있는, 치료제의 생성에 중요한 역할을 수행한다. 예를 들어, 에리쓰로포이에틴(EPO), 단백질 호르몬은 신장 합병증의 일반적 원인인, 적혈구 결핍증이 있는 환자를 치료하는데 활용될 수 있다. 게다가 어쥬번트 단백질, 치료 항체는 치료 단백질 및 또한 예를 들어 폐경기 여성의 치료에 사용될 수 있는 호르몬 교체 치료에 포함된다. 보다 최근 연구에서, 환자의 체세포는 논란이 되는 줄기 세포 치료를 대체하는 다능성 줄기 세포로 그들을 재프로그램하는데 사용된다. 또한, 체세포의 재프로그래밍에 사용되거나 줄기세포의 분화에 사용된 이들 단백질은 치료 단백질로 본 발명에 정의된다. 게다가, 치료 단백질은 다른 목적, 예를 들어 상처 치료, 조직 재생, 혈관형성 등을 위해 사용될 수 있다. 게다가, 항원-특이적 B 세포 수용체 및 이의 절편 및 변이체는 치료 단백질로 본 발명에 정의된다.
따라서 치료 단백질은 유전적 또는 후천적인 것과 독립적으로, 예를 들어 감염성 질병, 종양(neoplasm) (예를 들어 암 또는 종양 질환), 혈액 및 혈액 형성 기관의 질병, 내분비, 영양 및 대사성 질병, 신경계 질병, 순환계 질병, 호흡계 질병, 소환계 질병, 피부 및 피하 조직 질병, 근골격계 질병 및 결합 조직, 및 비뇨생식기계 질병과 같은 다양한 질병의 치료를 포함하는 다양한 목적으로 사용될 수 있다.
이러한 맥락에서, 대사성 또는 내분비 질환의 치료에 그 중에서도 사용될 수 있는 특히 바람직한 치료 단백질은 하기로부터 선택됨(괄호 내 치료 단백질이 치료에 사용되는 특정 질병): 산 스핑고미엘리나아제(Acid sphingomyelinase) (니만 피크병, Niemann-Pick disease), 아디포티드(Adipotide) (비만), 아갈시다제-베타(Agalsidase-beta) (인간 갈락토시다제 A) (파브리 병(Fabry disease); 신장 및 심혈관 합병증을 유도하는 지질의 축적을 방지), 알글루코시다제(Alglucosidase) (폼페병(Pompe disease) (글리코겐 저장 질병 타입 II)), 알파-갈락토시다제 A (알파-GAL A, 아갈시다제 알파) (파브리 질병), 알파-글루코시다제(글리코겐 저장 질병(GSD), 폼페 병(Morbus Pompe)), 알파-L-이두로니다제(alpha-L-iduronidase) (뮤코다당증 (MPS), 후를러 증후군(Hurler syndrome), 샤이 증후군(Scheie syndrome)), 알파-N-아세틸글루코사미니다제(alpha-N-acetylglucosaminidase) (산필립포 증후군, Sanfilippo syndrome), 암피레굴린(Amphiregulin) (암, 대사성 질환), 안지오포이에틴(Angiopoietin) ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (혈관 형성, 혈관 안정), 부타세룰린(Betacellulin) (대사성 질환), 베타-글루쿠로니다제(Beta-glucuronidase) (슬리 증후군(Sly syndrome)), 골 형태발생 단백질(Bone morphogenetic protein) BMPs (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP10, BMP15) (재생적 영향, 뼈 관련 증상, 만성 신장 질환(CKD)), CLN6 단백질 (CLN6 질병 - 비정형 후기 영아(Atypical Late Infantile), 늦은 발병 변이(Late Onset variant), 조기 유년(Early Juvenile), 뉴런 세로이드 리포푸시노스(Neuronal Ceroid Lipofuscinoses, NCL)), 표피 성장 인자(EGF) (상처 치료, 세포 성장, 증식 및 분화의 조절), 에피겐(Epigen) (대사성 질환), 에피레귤린(Epiregulin) (대사성 질환), 섬유아세포 성장촉진 인자(Fibroblast Growth Factor) (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (상처 치료, 혈관 생성, 내분비 질환, 조직 재생), 갈술파제(Galsulphase) (뮤코다당침착(Mucopolysaccharidosis) VI), 그렐린(Ghrelin) (과민성 대장 증후군(irritable bowel syndrome, IBS), 비만, 프라더-윌리 증후군(Prader-Willi syndrome), 타입 II 진성 당뇨병(diabetes mellitus), 글루코세레브로시다아제(Glucocerebrosidase) (고셰병(Gaucher's disease)), GM-CSF (재생적 효과, 백혈구 생산, 암), 헤파린-결합 EGF-유사 성장 인자(HB-EGF) (상처 치료, 심장 비대 및 심장 발달 및 기능), 간세포 생장 인자(Hepatocyte growth factor, HGF) (재생 효과, 상처 치료), 헵시딘(Hepcidin) (철 대사 질환, 베타 지중해 빈혈(Beta-thalassemia)), 인간 알부민(알부민의 감소된 생산 (저단백혈증), 증가된 알부민의 감소(신장 증후군), 하이포볼레미아(hypovolaemia), 고빌리루빈혈증(hyperbilirubinaemia)), 이둘설파제(Idursulphase) (이두로네이트-2-설파타제, Iduronate-2-sulphatase) (뮤코다당침착(Mucopolysaccharidosis) II (헌터 증후군, Hunter syndrome)), 인테그린 αVβ3, αVβ5 및 α5β1 (결합 기질 고분자 및 단백질분해효소(Bind matrix macromolecules and proteinases), 혈관 생성), 이우두로네이트 설파타제(Iuduronate sulfatase) (헌터 증후군(Hunter syndrome)), 라로니다제(Laronidase) (뮤코다당침착 I의 후를러 및 후를러-샤이 형태), N-아세틸갈락토사민-4-설파타제(rhASB; 갈설파제(galsulfase), 아릴설파타제 A(Arylsulfatase A) (ARSA), 아릴설파타제 B (ARSB)) (아릴설파타제 B 결핍, 마로토-라미 증후군(Maroteaux-Lamy syndrome), 뮤코다당침착 VI), N-아세틸글루코사민-6-설파타제(N-acetylglucosamine-6-sulfatase) (산필리포 증후군(Sanfilippo syndrome)), 신경 성장 인자(Nerve growth factor) (NGF, 뇌 유도된 신경영양성 인자(Brain-Derived Neurotrophic Factor, BDNF), 뉴로트로핀-3(Neurotrophin-3, NT-3), 및 뉴로트로핀 4/5 (NT-4/5) (재생 효과, 심혈관 질병, 관상동맥 죽상경화증(coronary atherosclerosis), 비만, 제2형 당뇨병, 대사성 증후군, 급성 관동맥 증후군, 치매, 우울증, 정신 분열병(schizophrenia), 자폐증, 레트 증후군(Rett syndrome), 신경성 무식욕증(anorexia nervosa), 신경성 식욕 항진증(bulimia nervosa), 상처 치료, 피부 궤양, 각막 궤양, 알츠하이머병), 뉴레귤린(Neuregulin) (NRG1, NRG2, NRG3, NRG4) (대사성 질환, 정신 분열병), 뉴로필린(Neuropilin) (NRP-1, NRP-2) (혈관 생성, 축색 돌기 유도(axon guidance), 세포 생존, 이동), 오베스타틴(Obestatin) (과민성 대장 증후군(irritable bowel syndrome, IBS), 비만, 프라더-윌리 증후군(Prader-Willi syndrome), 제2형 진성 당뇨병), 혈소판 유래 증식 인자(Platelet Derived Growth factor) (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (재생 효과, 상처 치료, 혈관 생성에 질환, 동맥 경화증, 섬유증, 암), TGF 베타 수용체 (엔도글린(endoglin), TGF-베타 1 수용체, TGF-베타 2 수용체, TGF-베타 3 수용체) (신장 섬유증(renal fibrosis), 신장 질병, 당뇨병, 궁극적 말기 신장 질환(ESRD), 혈관 생성), 트롬보포이에틴 (THPO) (거대 핵세포(Megakaryocyte) 성장 및 발달 인자 (MGDF)) (혈소판 장애, 기증(donation)에 대한 혈소판, 골수 억제 항암 화학요법(myelosuppressive chemotherapy) 이후 혈소판 수의 회복, 변형 성장 인자(Transforming Growth factor) (TGF (TGF-알파, TGF-베타 (TGF베타1, TGF베타2, 및 TGF베타3))) (재생 효과, 상처 치료, 면역력, 암, 심장 질병, 당뇨병, 말판 증후군(Marfan syndrome), 로이 디에츠 증후군(Loeys-Dietz syndrome)), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F 및 PIGF) (재생 효과, 혈관 생성, 상처 치료, 암, 삼투성), 네시리타이드(Nesiritide) (급성 비 대상성 충혈성 심부전(Acute decompensated congestive heart failure), 트립신 (욕창(Decubitus ulcer), 정맥류성 궤양(varicose ulcer), 딱지(eschar)의 창상 절제(debridement), 열개성 상처(dehiscent wound), 화상(sunburn), 태변성 일레우스(meconium ileus)), 부신피질 자극호르몬(adrenocorticotrophic hormone, ACTH) ("에디슨 병, 소세포 암종, 부신백질 이영양증(Adrenoleukodystrophy), 선천성 부신 증식증(Congenital adrenal hyperplasia), 쿠싱 증후군(Cushing's syndrome), 넬슨 증후군(Nelson's syndrome), 유아성 경련(Infantile 넴는)), 심방 나트륨이뇨 펩티드(Atrial-natriuretic peptide, ANP) (내분비 질환), 콜레시스토키닌(Cholecystokinin) (다양한), 가스트린(Gastrin) (저가스트린혈증, hypogastrinemia), 렙틴(Leptin) (당뇨병(Diabetes), 과트리글리세라이드혈증(hypertriglyceridemia), 당뇨병), 옥시토신(Oxytocin) (모유 영양(breastfeeding) 자극, 분만의 비진행), 소마토스타틴(Somatostatin) (카르시노이드 증후군(carcinoid syndrome)의 대증 요법, 급성 정맥류 출혈(acute variceal bleeding), 및 말단 비대증(acromegaly), 간 및 신장의 다낭성 질병, 신경 내분비 종양에 의한 말단 비대증 및 증상), 바소프레신 (항이뇨 호르몬) (요붕증(diabetes insipidus)), 칼시토닌 (폐경기후 골다공증(Postmenopausal osteoporosis), 고칼슘혈증(Hypercalcaemia), 파제트병(Paget's disease), 골 전이, 환상지통(Phantom limb pain), 척추관 협착증(Spinal Stenosis)), 엑세나티드(Exenatide) (메트포민(metformin) 및 설포닐우레아(sulphonylurea)로 치료에 내성인 제2형 당뇨병), 성장 호르몬 (GH), 소마토트로핀 (GH 결핍 또는 만성 신부전식(chronic renal insufficiency)에 따른 성장 부전), 프라더-윌리 증후군(Prader-Willi syndrome), 터너 증후군, 에이즈 낭비(AIDS wasting) 또는 항바이러스 치료와 함께 악액질(cachexia)), 인슐린 (진성 당뇨병, 당뇨병성 케토애시도시스(diabetic ketoacidosis), 고칼륨혈증(hyperkalaemia)), 인슐린 유사 성장 인자 1 IGF-1 (GH 유전자 결실 또는 심각한 주요 IGF1 결핍(severe primary IGF1 deficiency)로 어린이 성장 부전, 신경퇴행성 질병(neurodegenerative disease), 심혈관 질병, 심부전), 메카세르민 린파베이트(Mecasermin rinfabate), IGF-1 유사체(analog) (GH 유전자 결실 또는 심각한 주요 IGF1 결핍으로 어린이 성장 부전, 신경퇴행성 질병, 심혈관 질병, 심부전), 메카세르민(Mecasermin), IGF-1 유사체 (GH 유전자 결실 또는 심각한 주요 IGF1 결핍으로 어린이 성장 부전, 신경퇴행성 질병, 심혈관 질병, 심부전), 페그비소만트(Pegvisomant) (말단 비대증(Acromegaly)), 프람린티드(Pramlintide) (진성 당뇨병, 인슐린과 조합), 테리파라타이드(Teriparatide) (인간 파라티로이드 호르몬 잔기 1-34) (심한 골다공증, Severe osteoporosis), 베카프레르민(Becaplermin) (당뇨병성 궤양에 대한 창상 절제 부가(Debridement adjunct)), 디보테르민-알파(Dibotermin-alpha) (골 형태 발생 단백질 2(Bone morphogenetic protein 2)) (척추 융합술(Spinal fusion surgery), 골 상처 회복), 히스트렐린 아세테이트(Histrelin acetate) (고나도트로핀 방출 호르(gonadotropin releasing hormone); GnRH) (조숙(Precocious puberty)), 옥트레오타이드(Octreotide) (말단 비대증, VIP-분비 아데노마 및 전이성 암양종 종양(metastatic carcinoid tumours)의 증상 완화) 및 팔리페르민(Palifermin) (케라틴세포 생장인자(keratinocyte growth factor; KGF)) (화학 요법을 겪는 환자 내 심각한 구강 점막염, 상처 회복).
이들 및 다른 단백질은 그들이 충분한 양의 기능성 단백질의 이의 결함이 있는 내인성 생산을 교체함으로써 개체를 치료하는 것을 의미하는 것과 같이, 치료적인 것으로 이해된다. 따라서, 이러한 치료 단백질은 전형적으로 포유동물, 특히 인간 단백질이다.
혈액 질환, 순환계 질병, 호흡계 질병, 암 또는 종양 질병, 감염성 질병 또는 면역결핍증에 대하여, 하기 치료 단백질이 사용될 수 있다: 알트플라제(Alteplase) (조직 플라스미노겐 활성자(tissue plasminogen activator); tPA) (폐색전(Pulmonary embolism), 심근경색(myocardial infarction), 급성 허혈성 발작(acute ischaemic stroke), 중심정맥 접근장치의 폐색(occlusion of central venous access devices)), 아니스트리플라제(Anistreplase) (혈전 용해), 안티트롬빈 III (AT-III) (유전적 AT-III 결핍, 혈전 색전증), 비발리루딘(Bivalirudin) (관상동맥 형성술 및 헤파린 유도 저혈소판증에 혈액 응고 위험의 감소), 다르베포이에틴-알파(Darbepoetin-alpha) (만성 신부전(renal insufficiency) 및 만성 신부전(renal failure)(+/- 투석)을 갖는 환자에 빈혈의 치료), 드로트리코긴-알파(Drotrecogin-alpha) (활성화된 단백질 C) (사망의 위험이 높은 중증 패혈증(severe sepsis)), 에리쓰로포이에틴(Erythropoietin), 에포에틴-알파(Epoetin-alpha), 에리쓰로포이에틴(erythropoietin), 에쓰로포이에틴(erthropoyetin) (만성 질병의 빈혈, 골수이형성(myelodysplasia), 신부전에 또는 화학요법에 따른 빈혈, 수술전 준비), 인자 IX (혈우병(Haemophilia) B), 인자 VIIa (혈우병 A 또는 B 및 인자 VIII 또는 인자 IX에 억제자를 갖는 환자의 출혈), 인자 VIII (혈우병 A), 레피루딘(Lepirudin) (헤파린 유도된 저혈소판증), 단백질 C 농축(concentrate) (정맥혈전증(Venous thrombosis), 전격성자반(Purpura fulminans)), 레테플라제(Reteplase) (tPA의 삭제 돌연변이) (급성 심근경색의 조절, 좌심실 기능의 증진), 스트렙토키나제(Streptokinase) (급성 진화 전층 심근경색(Acute evolving transmural myocardial infarction), 폐색전(pulmonary embolism), 심부정맥 혈전증(deep vein thrombosis), 동맥 혈전증 또는 색전증, 동정맥 캐뉼라의 폐색), 테넥테플라제(Tenecteplase) (급성 심근경색), 우로키나제(Urokinase) (폐색전), 엔지오스타틴(Angiostatin) (암), 항-CD22 면역독소 (재발된(relapsed) CD33+ 급성 골수 백혈병), 데니루킨 디프티톡스(Denileukin diftitox) (피부 T-세포 림프종(Cutaneous T-cell lymphoma, CTCL)), 이뮤노시아닌(Immunocyanin) (방광 및 전립선 암), MPS (메탈로팬스티물린, Metallopanstimulin) (암), 아플리베르셉트(Aflibercept) (비소세포 폐암 (NSCLC), 전이성 대장암 (mCRC), 호르몬 불응성 전이성 전립선암, 습식 황반변성), 엔도스타틴(Endostatin) (암, 류마티스 관절염뿐만 아니라 크론병, 당뇨병성 망막증, 건선, 및 자궁 내막증과 같은 염증성 질병), 콜라게나제 (만성 피부 궤양의 창상 절제 및 중증 화상 부위, 듀푸이트렌 구축(Dupuytren's contracture), 페이로니병(Peyronie's disease)), 인간 디옥시-리보뉴클레아제 I, 도르나제(dornase) (낭포성 섬유증(Cystic fibrosis); 예견된 40%보다 큰 FVC를 갖는 선택된 환자에 호흡기 감염 감소), 히알루로니다제(Hyaluronidase) (주사된 약물, 특히 안과 수술 및 특정 조영제의 흡수 및 분산을 향상시키는 어쥬번트로 사용됨), 파파인(Papain) (욕창, 정맥류(varicose) 및 당뇨성 궤양, 화상, 수술 후 상처, 모소낭포 상처, 피하 조직 염증(carbuncles), 및 다른 상처와 같은 급성 및 만성 병변에 괴사 조직의 창상 절제 또는 고통(slough)의 액화(liquefication)), L-아스파라기나제(L-Asparaginase) (증식을 위한 외인성 아스파라긴을 필요로 하는, 급성 림프구성 백혈병), 페그-아스파라기나제(Peg-asparaginase) (증식을 위한 외인성 아스파라긴을 필요로 하는 급성 림프구성 백혈병), 라스부리카제(Rasburicase) (항암 치료중인 백혈병, 림프종, 및 고형 종양을 갖는 소아 환자는 종양 용해 증후군을 일으킬 수 있음), 인간 만성 고나도트로핀(Human chorionic gonadotropin, HCG) (보조 생식(Assisted reproduction)), 인간 난포 자극 호르몬(Human follicle-stimulating hormone, FSH) (보조 생식), 루트로핀-알파(Lutropin-alpha) (황체형성 호르몬 결핍과 함께 불임), 프로락틴(Prolactin) (프로락틴 혈증(Hypoprolactinemia), 혈청 프로락틴 결핍, 여성의 난소 기능 장애, 불안, 남자의 동맥성 발기 부전(arteriogenic erectile dysfunction), 조루(premature ejaculation), 정자 감소증(oligozoospermia), 정자 무력증(asthenospermia), 정액낭(seminal vesicles)의 기능 부전, 남성호르몬감소증(hypoandrogenism)), 알파-1-프로테이나제 억제자 (선천성 트립신 결핍증(Congenital antitrypsin deficiency)), 락타제(Lactase) (락토스 소화 불능에 따른 가스, 팽만감(bloating), 경련 및 설사), 췌장 효소(Pancreatic enzymes) (리파제(lipase), 아밀라제(amylase), 프로테아제(protease)) (낭포성 섬유증(Cystic fibrosis), 만성 췌장염(chronic pancreatitis), 췌장 부전(pancreatic insufficiency), 포스트-빌로스 II 위 우회술(post-Billroth II gastric bypass surgery), 췌관 폐색(pancreatic duct obstruction), 지방변(steatorrhoea), 소화 불량(poor digestion), 가스, 팽만감), 아데노신 디아미나제(Adenosine deaminase) (페가데마제 보빈(pegademase bovine), PEG-ADA) (아데노신 디아미나제 결핍에 의한 중증 조합된 면역결핍 질병), 아바타셉트(Abatacept) (류마티스성 관절염 (특히 TNF 알파 억제에 대해 내성(refractory)일 때)), 알레파셉트(Alefacept) (판 건선(Plaque Psoriasis)), 아나킨라(Anakinra) (류마티스성 관절염), 에타너셉트(Etanercept) (류마티스성 관절염, 다관절 과정 청소년 류마티스성 관절염(polyarticular-course juvenile rheumatoid arthritis), 건선 관절염, 강직성 척수염(ankylosing spondylitis), 판 건선, 강직성 척수염), 인터루킨-1 (IL-1) 수용체 길항제, 아나킨라(Anakinra) (류마티스성 관절염과 관련된 염증 및 연골 퇴행), 티물린(Thymulin) (신경퇴행성 질병, 류마티즘, 신경성 무식욕증), TNF-알파 길항자 (류마티스성 관절염, 강직성 척수염, 크론병, 건선, 화농성 한선염, 난치성 천식과 같은 자가면역 질환), 엔푸빌티드(Enfuvirtide) (HIV-1 감염), 및 티모신(Thymosin) α1 (간염 B 및 C).
(괄호 안은 치료에 사용되는 치료 단백질에 대한 특정한 질병임)
추가적 양태에서, 본 발명은 하기를 포함하는 벡터를 제공한다
a.
오픈 리딩 프레임(ORF) 및/또는 클로닝 부위, 예를 들어 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열의 삽입을 위한 것; 및
b.
리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소).
적어도 하나의 3'-UTR 요소 및 ORF는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것과 같다. 상기 클로닝 부위는 하나 또는 그 이상의 제한 부위와 같이, 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열을 도입하는데 적절한 어느 서열일 수 있다. 따라서, 클로닝 부위를 포함하는 벡터는 바람직하게 벡터로 오픈 리딩 프레임을 삽입, 바람직하게 3'-UTR 요소에 오픈 리딩 프레임 5'을 삽입하기에 적절하다. 바람직하게, 클로닝 부위 또는 ORF는 3'-UTR 요소에 5'에, 바람직하게 3'-UTR 요소의 5'-말단에 아주 가깝게 위치한다. 예를 들어, 클로닝 부위 또는 ORF는 3'-UTR 요소의 5'-말단에 직접적으로 연결될 수 있거나, 그들은 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것과 같이, 2, 4, 6, 8, 10, 20개 등 뉴클레오티드의 스트레치에 의한 것과 같이, 뉴클레오티드의 스트레치를 통해 연결될 수 있다.
바람직하게, 본 발명에 따르는 벡터는 본 발명에 따르는 인공 핵산 분자를 생산하는데, 바람직하게 본 발명에 따르는 인공 mRNA를 생산하는데, 예를 들어 벡터로 오픈 리딩 프레임 또는 오픈 리딩 프레임을 포함하는 서열을 선택적으로 삽입하고 벡터를 전사함으로써, 적합하다. 따라서 바람직하게는 벡터는 프로모터, 예를 들어 RNA 중합효소 프로모터와 같은, 전사를 위해 필요한 요소를 포함한다. 바람직하게는 벡터는 진핵 세포, 원핵 세포, 또는 진핵, 원핵, 바이러스 또는 파지 인비트로 전사 시스템과 같은, 진핵 생물, 원핵 생물, 바이러스 또는 파지 전사 시스템을 사용하는 전사에 적합하다. 따라서 예를 들어 벡터는 RNA 중합효소와 같은 중합효소에 의해, 예를 들어 진핵, 원핵, 바이러스, 또는 파지 RNA 중합효소에 의해 인식되는 프로모터 서열을 포함할 수 있다. 바람직한 실시예에서 상기 벡터는 SP6 또는 T7과 같은 파지 RNA 중합효소 프로모터, 바람직하게는 T7 프로모터를 포함할 수 있다. 바람직하게, 상기 벡터는 인비트로(in vitro) 전사 시스템에 기초한 T7 RNA 중합효소와 같은 인비트로 전사 시스템에 기초한 파지를 사용하는 인비트로 전사에 적절하다.
다른 바람직한 실시예에서, 상기 벡터는 세포 또는 조직 내 코딩된 펩타이드 또는 단백질의 발현에 직접적으로 사용될 수 있다. 이러한 목적을 위해, 상기 벡터는 그들 세포/ 조직 내 발현을 위해 필수적인 특정한 요소, 예를 들어 CMV 프로모터와 같은 특정 프로모터 서열을 포함한다.
상기 벡터는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가적으로 포함할 수 있다.
상기 벡터는 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게, 상기 벡터는 DNA 벡터이다. 상기 벡터는 바이러스 벡터 또는 플라스미드 벡터와 같이, 통상의 기술자에게 알려진 어느 벡터일 수 있다. 바람직하게 상기 벡터는 플라스미드 벡터, 바람직하게 DNA 플라스미드 벡터이다.
바람직한 실시예에서, 본 발명에 따른 벡터는 본 발명에 따른 인공 핵산 분자를 포함한다.
일 실시예에서, 본 발명에 따른 DNA 벡터는 SEQ ID Nos: 10 내지 115에 따른 핵산 서열과 같이, 리보좀 단백질 유전자의 3'-UTR의 핵산 서열에 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%, 가장 바람직하게 100%의 상동성을 갖는 핵산 서열을 포함한다.
바람직하게, 본 발명에 따른 DNA 벡터는 SEQ ID No. 1, SEQ ID No. 3, SEQ ID No. 7에 상보적인 서열에 따른 서열 또는 SEQ ID No: 1, SEQ ID No. 3, SEQ ID No. 7에 따른 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 서열 상동성을 갖는 서열 또는 상기 설명된 이의 절편, 바람직하게 이의 기능적 절편을 포함한다.
바람직하게, 본 발명에 따른 RNA 벡터는 SEQ ID No. 2, SEQ ID No. 4, SEQ ID No. 7 에 따른 서열 또는 SEQ ID No. 2, SEQ ID No. 4, SEQ ID No. 7 에 따른 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 서열 상동성을 갖는 서열 또는 이의 절편, 바람직하게 이의 기능적 절편을 포함한다.
바람직하게, 상기 벡터는 원형 분자이다. 바람직하게, 상기 벡터는 이중 가닥 DNA 분자와 같은 이중 가닥 분자이다. 이러한 원형, 바람직하게 이중 가닥 DNA 분자는 본 발명의 인공 핵산 분자를 위한 저장 형태로써 편리하게 사용될 수 있다. 게다가, 이는 세포, 예를 들어 배양된 세포의 형질전환을 위해 사용될 수 있다. 또한 이는 본 발명에 따른 인공 RNA 분자를 수득하기 위한 인비트로(in vitro) 전사를 위해 사용될 수 있다.
바람직하게, 상기 벡터, 바람직하게 원형 벡터는, 예를 들어 제한 효소 소화에 의해 선형화된다. 바람직한 실시예에서, 상기 벡터는 제한 부위와 같은 절단 부위, 바람직하게 3'-UTR 요소에 바로 옆 3'에 위치한, 또는 -만약 존재한다면 - 폴리(A) 서열 또는 폴리아데닐화 신호에 3' 위치한, 또는 - 만약 존재한다면 - 폴리(C) 서열에 3' 위치한, 또는 - 만약 존재한다면 - 히스톤 스템-루프에 3' 위치한 특별한 절단 부위를 포함한다. 따라서, 바람직하게, 벡터를 선형화함으로써 수득된 생산물은 3'-UTR 요소의 3'-말단과 함께, 또는 - 만약 존재한다면 - 폴리(A) 서열 또는 폴리아데닐화 신호의 3'-말단과 함께, 또는 - 만약 존재한다면 - 폴리(C) 서열의 3'-말단과 함께 종결한다. 실시예에서, 본 발명에 따른 벡터는 본 발명에 따른 인공 핵산 분자를 포함하며, 제한 부위, 바람직하게 특수한 제한 부위는 바람직하게 상기 인공 핵산 분자의 3'-말단에 바로 옆 3'에 위치한다.
추가적 양태에서, 본 발명은 본 발명에 따르는 인공 핵산 분자 또는 본 발명에 따르는 벡터를 포함하는 세포에 관한 것이다. 세포는 박테리아 세포, 곤충 세포, 식물 세포, 척추동물 세포, 예를 들어 포유동물 세포와 같은 어떠한 세포일 수 있다. 이러한 세포는, 예를 들어 박테리아 세포 내에서, 예를 들어 본 발명에 벡터의 복제에 사용될 수 있다. 나아가, 세포는 본 발명에 따르는 인공 핵산 분자 또는 벡터를 전사 및/또는 본 발명에 따르는 인공 핵산 분자 또는 벡터의 오픈 리딩 프레임을 번역하는데 사용될 수 있다. 예를 들어, 세포는 재조합 단백질 생산을 위해 사용될 수 있다.
본 발명에 따르는 세포는 예를 들어 표준 형질전환(transfection), 형질도입(transduction) 또는 형질변환(transformation) 방법과 같은, 표준 핵산 전달 방법에 의해 획득될 수 있다. 예를 들어 본 발명에 따르는 인공 핵산 분자 또는 벡터는 전기천공법, 리포펙션(lipofection)에 의해, 예를 들어 양이온성 지질 및/또는 리포솜, 칼슘 포스페이트 침전, 나노입자 기초의 형질전환, 바이러스 기초의 형질전환에 기초하여, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머에 기초하여, 세포 내로 형질전환될 수 있다.
바람직하게 상기 세포는 인간 개체의 세포와 같은 포유동물 세포, 가축, 마우스 또는 랫과 같은 실험용 동물 세포이다. 바람직하게는 세포는 인간 세포이다. 상기 세포는 CHO, BHK, 293T, COS-7, HELA, HEK 등 세포와 같은, 확립된(established) 세포 라인의 세포일 수 있으며 또는 상기 세포는 인간 피부 아세포(HDF) 등과 같은 일차 세포, 바람직하게 유기체로부터 분리된 세포일 수 있다. 바람직한 실시예에서, 세포는 포유동물 개체의, 바람직하게는 인간 개체의 분리된 세포이다. 예를 들어 세포는 바람직하게는 포유동물 개체의, 바람직하게는 인간 개체의 수상돌기 세포, 암 또는 종양 세포, 또는 어느 체세포 등 과 같은 면역 세포일 수 있다.
추가적 양태에서, 본 발명은 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 또는 본 발명에 따르는 세포를 포함하는 약학적 조성물을 제공한다. 본 발명에 따르는 약학적 조성물은 예를 들어 백신으로서, 예를 들어 유전자적 백신 접종을 위해 사용될 수 있다. 따라서 ORF는 예를 들어 백신 접종을 위해 환자에게 투여되는 항원을 코딩할 수 있다. 따라서 바람직한 실시예에서 본 발명에 따르는 약학적 조성물은 백신이다. 나아가 본 발명에 따르는 약학적 조성물은 예를 들어 유전자 치료를 위해 사용될 수 있다.
바람직하게, 상기 약학적 조성물은 하나 또는 그 이상의 약학적으로 허용가능한 수송체(vehicles), 희석제(diluents) 및/또는 부형제(excipients) 및/또는 하나 또는 그 이상의 어쥬번트를 추가적으로 포함할 수 있다. 본 발명의 맥락에서, 약학적으로 허용가능한 수송체는 전형적으로 본 발명의 약학적 조성물을 위해 액체 또는 비액체 기초(basis)를 포함한다. 일 실시예에서, 약학적 조성물은 액체 형태로 제공된다. 이러한 맥락에서, 바람직하게는 수송체는 무-피로겐 물, 등장성 식염수(isotonic saline) 또는 버퍼 (수용성) 용액, 예를 들어 포스페이트, 시트레이트 등 버퍼 용액과 같은, 물에 기초한다. 버퍼는 특정한 참조 배지에 비해 참조(reference)와 함께 고장성(hypertonic), 등장성(isotonic) 또는 저장성(hypotonic)일 수 있으며, 즉 버퍼는 특정한 참조 배지에 비해 참조와 함께 높은, 동일한 또는 낮은 염 함량을 가질 수 있으며, 상기 바람직하게는 앞서 언급된 이러한 농도는 삼투압 또는 다른 농도 효과에 따르는 포유동물 세포의 피해를 유도하지 않게, 사용될 수 있다. 참조 배지는 예를 들어 피, 림프, 세포질 액체, 또는 다른 체내 액체와 같은 “인비보(in vivo)" 방법에서 발생하는 액체 또는 예를 들어 통상 버퍼 또는 액체와 같은 “인비트로(in vitro)" 방법에서 참조 배지로서 사용될 수 있는 액체이다. 이러한 통상의 버퍼 또는 액체는 통상의 기술자에게 알려져 있다. 링거-락테이트 용액은 액체 베이스로서 특히 바람직하다.
환자에게 투여하기 적절한 하나 또는 그 이상의 호환 가능한 고체 또는 액체 필러 또는 희석제 또는 캡슐화(encapsulating) 화합물은 본 발명의 약학적 조성물에도 사용될 수 있다. 본 발명에 사용된 용어 “호환 가능한”은 바람직하게는 이들 본 발명의 약학적 조성물의 구성 요소가 전형적 사용 조건하에 본 발명의 약학적 조성물의 약학적 효과를 지속적으로 감소시킬 수 있는 상호 작용이 일어나지 않는 환경에서 본 발명에 정의된 본 발명의 인공 핵산, 벡터 또는 세포와 혼합될 수 있다는 것을 의미한다.
본 발명에 따르는 약학적 조성물은 선택적으로 하나 또는 그 이상의 추가적인 약학적으로 활성인 성분을 더 포함할 수 있다. 이러한 맥락에서 약학적으로 활성인 성분은 특정한 증상(indication) 또는 질병에 회복, 개선 또는 예방에 치료적 효과를 보이는 화합물이다. 이러한 화합물은 어떠한 제한을 의미함이 없이, 펩타이드 또는 단백질, 핵산, (치료적으로 활성인) 저분자량 유기 또는 무기 화합물 (5000 미만, 바람직하게는 1000 미만의 분자량), 당, 항원 또는 항체, 선행기술에서 알려진 치료적 제제, 항원 세포, 항원 세포 절편, 세포 분획, 세포벽 성분(예를 들어 폴리사카라이드), 변형된, 약화된 또는 비활성화된(예를 들어 화학적으로 또는 방사선에 의해) 병원체(바이러스, 박테리아 등)를 포함한다.
나아가 본 발명의 약학적 조성물은 인공 핵산 분자 또는 벡터를 위한 담체를 포함할 수 있다. 이러한 담체는 생리학적으로 허용가능한 액체의 용해를 조절, 약학적으로 활성인 인공 핵산 분자 또는 벡터의 수송 및 세포 흡수에 적합할 수 있다. 따라서 이러한 담체는 본 발명에 따르는 인공 핵산 분자 또는 벡터의 보관 및 전달에 적합할 수 있는 성분일 수 있다. 이러한 성분은 예를 들어 형질전환 또는 복합화 제제를 제공할 수 있는 양이온성 또는 다중양이온성 담체 또는 화합물일 수 있다.
이러한 맥락에서 특히 바람직한 형질전환 또는 복합화 제제는 프로타민, 뉴클레올린, 스페르민 또는 스페르미딘, 또는 다른 양이온성 펩타이드 또는 단백질, 폴리-L-리신(PLL), 폴리-아르기닌, 염기성 폴리펩타이드, HIV-결합펩타이드, HIV-1 Tat (HIV), Tat-유도된 펩타이드, 페네트라틴(Penetratin)을 포함하는 세포 관통 펩타이드(CPPs), VP22 유도된 또는 유사체 펩타이드, HSV VP22(단순 포진, Herpes simplex), MAP, KALA 또는 단백질 전달(transduction) 도메인(PTDs), PpT620, 프롤린-풍부 펩타이드, 아르기닌-풍부 펩타이드, 리신-풍부 펩타이드, MPG-펩타이드(들), Pep-1, L-올리고머, 칼시토닌 펩타이드(들), 안테나페디아(Antennapedia)-유도된 펩타이드(특히 초파리(Drosophila antennapedia)로부터), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24, SynB, SynB(1), pVEC, hCT-유도된 펩타이드, SAP, 또는 히스톤과 같은, 양이온성 또는 다중양이온성 화합물이다.
게다가, 이러한 양이온성 또는 다중양이온성 화합물 또는 담체는 바람직하게 적어도 하나의 -SH 일부를 포함하거나 포함하도록 추가적으로 변형된, 양이온성 또는 다중양이온성 펩타이드 또는 단백질일 수 있다. 바람직하게 양이온성 또는 다중양이온성 담체는 하기 합계식(I)을 갖는 양이온성 펩타이드로부터 선택된다:
{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x};
식 (I)
상기 l + m + n + o + x = 3-100, 및 서로 독립적으로 l, m, n 또는 o는 Arg(아르기닌), Lys(리신), His(히스티딘) 및 Orn(오르니틴)의 총량이 올리고펩타이드의 전체 아미노산의 적어도 10%를 나타내는 경우 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 및 91-100로부터 선택된 어느 수이며; Xaa는 Arg, Lys, His 또는 Orn을 제외하고 천연(=자연적으로 발생하는) 또는 비천연 아미노산으로부터 선택된 어느 아미노산이며; X는 Xaa의 총량이 올리고펩타이드의 전체 아미노산의 90%를 초과하지 않는 경우, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90로부터 선택된 어느 수이다. 아미노산 Arg, Lys, His, Orn 및 Xaa의 어느 것은 펩타이드의 어느 위치에 위치될 수 있다. 이러한 맥락에서 7-30 아미노산의 범위 내 양이온성 펩타이드 또는 단백질은 특히 바람직하다.
나아가, 적어도 하나의 -SH 일부를 포함하거나 포함하도록 추가적으로 변형된, 화학식 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (화학식 (I))에 따라 정의될 때, 상기 개시된 양이온성 또는 다중양이온성 펩타이드 또는 단백질은, 이에 제한되지 않고, 하위 화학식(Ia)로부터 선택될 수 있다:
{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa')x (Cys)y}
하위 화학식 (Ia)
상기 (Arg)l;(Lys)m;(His)n;(Orn)o; 및 x는 본 발명에 정의된 바와 같으며, Arg(아르기닌), Lys(리신), His(히스티딘) 및 Orn(오르니틴)의 총량이 올리고펩타이드의 전체 아미노산의 적어도 10%를 나타내는 경우, Xaa'는 Arg, Lys, His, Orn 또는 Cys를 제외한 천연(=자연적으로 발생) 또는 비천연 아미노산으로부터 선택된 어느 아미노산이며 Y는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 및 81-90으로부터 선택된 어느 수이다. 나아가, 양이온성 또는 다중양이온성 펩타이드는 하위 화학식 (Ib)로부터 선택될 수 있다:
Cys1 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} Cys2
하위 화학식(Ib)
상기 실험식 {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (화학식(III))은 본 발명에 정의된 바와 같으며 반실험(semiempirical) 화학식(III)에 따르는 아미노산 서열의 코어를 형성하며 상기 Cys1 및 Cys2는 (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x 근위(proximal)에, 또는 말단에 시스테인이다.
나아가 형질전환 또는 복합화 제제로 사용될 수 있는 바람직한 양이온성 또는 다중양이온성 화합물은 양이온성 폴리사카라이드, 예를 들어 키토산, 폴리벤, 양이온성 폴리머, 예를 들어 폴리에틸렌이민(PEI), 양이온성 지질, 예를 들어 DOTMA: [1-(2,3-시오레일옥시)프로필)]-N,N,N-트리메틸암모니움 클로라이트([1-(2,3-sioleyloxy)propyl)]-N,N,N-trimethylammonium chloride), DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민(Dioleyl phosphatidylethanol-amine), DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스페르민(Dioctadecylamidoglicylspermin), DIMRI: 디미리스토-옥시프로필 디메틸 히드록시에틸 암모늄 브로마이드(Dimyristo-oxypropyl dimethyl hydroxyethyl ammonium bromide), DOTAP: 디올레오일옥시-3-(트리메틸암모니오)프로판(dioleoyloxy-3-(trimethylammonio)propane), DC-6-14: O,O-디테트라데카노일-N-(α-트리메틸암모니오아세틸)디에타놀아민 클로라이드(O,O-ditetradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride), CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-히드록시에틸)]-디메틸암모니움 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]트리메틸암모니움, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시석시닐옥시)에틸]-트리메틸암모니움, 올리고펙타민, 또는 양이온성 또는 다중양이온성 폴리머, 예를 들어 β-아미노산-폴리머 또는 역(reversed) 폴리아미드 등과 같은 변형된 폴리아미노산, PVP(폴리(N-에틸-4-비닐피리디니움 브로마이드)), 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)), 등과 같은 변형된 아크릴레이트, pAMAM (폴리(아미도아민)), 등과 같은 변형된 아미도아민, 디아민 및 변형된 1,4 부탄디올 디아크릴레이트-코-5-아미노-1-펜타놀 폴리머, 등과 같은 변형된 폴리베타아미노에스터(PBAE), 폴리프로필아민 덴드리머 또는 pAMAM 기초의 덴드리머 등과 같은 덴드리머, PEI:폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 폴리알릴아민, 사이클로덱스트린 기초의 폴리머, 덱스트란 기초의 폴리머, 키토산 등과 같은 당 백본 기초의 폴리머, PMOXA-PDMS 코폴리머 등과 같은 실란 백본 기초의 폴리머, 하나 또는 그 이상의 양이온성 블록(예를 들어 상기 언급된 양이온성 폴리머로부터 선택된 것)의 조합 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜); 등으로 이루어진 블록폴리머를 포함할 수 있다.
다른 실시예에 따르면, 본 발명에 따른 약학적 조성물은 약학적 조성물의 면역 자극성 특성을 증진시키기 위해 어쥬번트를 포함할 수 있다. 이러한 맥락에서, 상기 어쥬번트는 본 발명에 따른 약학적 조성물에 포함된 인공 핵산 분자 또는 벡터와 같은 구성 요소의 투여 및 전달을 돕기에 적절한 어느 화합물로 이해될 수 있다. 게다가, 이러한 어쥬번트는 선천적 면역계의 면역 반응을 개시 또는 증진시킬 수 있으나, 이에 제한되지 않는다. 다시 말해, 투여될 때, 본 발명에 따른 약학적 조성물은 전형적으로 인공 핵산 분자에 의해 코딩된 항원과 직결된 후천적 변역 반응을 개시한다. 추가로, 본 발명에 따른 약학적 조성물은 본 발명에 따른 약학적 조성물에 본 발명에 정의된 어쥬번트의 추가에 따른 (보조적(supportive)) 선천적 면역 반응을 발생시킬 수 있다.
이러한 어쥬번트는 통상의 기술자에게 알려진 어느 어쥬번트로부터 선택될 수 있으며, 본 발명의 경우, 즉 포유동물 내 면역 반응의 유도를 돕는 경우에 적합하다. 바람직하게 상기 어쥬번트는 TDM, MDP, 무라밀 디펩티드(muramyl dipeptide), 플루로닉(pluronics), 알룸(alum) 용액, 알루미늄 하이드록사이드, ADJUMERTM (폴리포스파젠); 알루미늄 포스페이트 겔; 조류(algae)로부터 글루칸; 알감물린(algammulin); 알루미늄 하이드록사이드 겔(알룸, alum); 고 단백질 흡수 알루미늄 하이드록사이드 겔; 저점도 알루미늄 하이드록사이드 겔; AF 또는 SPT (스쿠알렌의 에멀전(5%), 트윈 80(Tween 80) (0.2%), 플루로닉 L121 (1.25%), 인산염 버퍼 식염수, pH 7.4); AVRIDINETM (프로판디아민); BAY R1005TM (N-(2-디옥시-2-L-류실아미노-b-D-글루코피라노실)-N-옥타데실-도데카노일-아미드 하이드로아세테이트((N-(2-deoxy-2-L-leucylamino-b-D-glucopyranosyl)-N-octadecyl-dodecanoyl-amide hydroacetate); CALCITRIOLTM (1-알파,25-디하이드록시-비타민 D3(1-alpha,25-dihydroxy-vitamin D3)); 칼슘 포스페이트 겔(calcium phosphate gel); CAPTM (칼슘 포스페이트 나노입자); 콜레라 완전독소(cholera holotoxin), 콜레라-독소-A1-단백질-A-D-절편 융합 단백질(cholera-toxin-A1-protein-A-D-fragment fusion protein), 콜레라 독소의 서브유닛 B; CRL 1005 (블록 코폴리머 P1205); 사이토카인 포함 리포좀; DDA (디메틸디옥타데실암모늄 브로마이드(dimethyldioctadecylammonium bromide)); DHEA (디하이드로에피안드로스테론(dehydroepiandrosterone)); DMPC (디미리스토일포스파티딜콜린(dimyristoylphosphatidylcholine)); DMPG (디미리스토일포스파티딜글리세롤(dimyristoylphosphatidylglycerol)); DOC/알룸 복합체(디옥시콜산 소듐 염); 프로인트 완전 어쥬번트(Freund's complete adjuvant); 프로인트 불완전 어쥬번트; 감마 이눌린(gamma inulin); 게르부 어쥬번트(Gerbu adjuvant) (하기의 혼합: i) N-아세틸글루코사미닐-(P1-4)-N-아세틸무라밀-L-알라닐-D-글루타민(N-acetylglucosaminyl-(P1-4)-N-acetylmuramyl-L-alanyl-D-glutamine, GMDP), ii) 디메틸디옥타데실암모늄 클로라이드(dimethyldioctadecylammonium chloride, DDA), iii) 아연-L-프롤린염 복합체(zinc-L-proline salt complex, ZnPro-8); GM-CSF); GMDP (N-아세틸글루코마닐-(베타-1-4)-N-아세틸무라밀-L-알라닐-D-이소글루타민(N-acetylglucosaminyl-(beta-1-4)-N-acetylmuramyl-L-alanyl-D-isoglutamine)); 이미퀴모드(imiquimod) (1-(2-메틸프로필)-1H-이미다조[4,5-c]퀴놀린-4-아민(1-(2-methylpropyl)-1H-imidazo[4,5-c]quinoline-4-amine)); ImmTherTM (N-아세틸글루코사미닐-N-아세틸무라밀-L-Ala-D-isoGlu-L-Ala-글리세롤 디팔미테이트(N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-glycerol dipalmitate)); DRVs (탈수-재수화 소포(vesicles)로부터 제조된 면역리포좀); 인터페론-감마; 인터루킨-1베타; 인터루킨-2; 인터루킨-7; 인터루킨-12; ISCOMSTM; ISCOPREP 7.0.3. TM; 리포좀; LOXORIBINETM (7-알릴-8-옥소구아노신); LT 구강 어쥬번트 (E.coli 불안정한 내독소-독소전구물질); 어느 화합물의 마이크로스피어 및 마이크로파티클; MF59TM; (스쿠알렌-물 에멀전); MONTANIDE ISA 51TM (정제된 불완전 프로인트 어쥬번트); MONTANIDE ISA 720TM (대사 작용 오일 어쥬번트(metabolisable oil adjuvant)); MPLTM (3-Q-데사실-4'-모노포스포릴 지질 A(3-Q-desacyl-4'-monophosphoryl lipid A)); MTP-PE 및 MTP-PE 리포좀 ((N-아세틸-L-알라닐-D-이소글루타미닐-L-알라닌-2-(1,2-디팔미토일-sn-글리세로-3-(하이드록시포스포릴옥시))-에틸아미드, 모노소듐염); MURAMETIDETM (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINETM 및 D-MURAPALMITINETM (Nac-Mur-L-Thr-D-isoGIn-sn-글리세롤디팔미토일); NAGO (뉴라미니다제-갈락토스 옥시다제); 어느 조성물의 나노스피어 또는 나노파티클; NISVs (비이온성 계면활성제 수송체); PLEURANTM (베타-글루칸); PLGA, PGA 및 PLA (젖산 및 글리콜산의 호모- 및 코-폴리머; 마이크로스피어/나노스피어); PLURONIC L121TM; PMMA (폴리메틸 메타크릴레이트); PODDSTM (프로테이노이드 마이크로스피어); 폴리에틸렌 카바메이트 유도체; 폴리-rA: 폴리-rU (폴리아데닐산-폴리우리딜산 복합체); 폴리소르베이트 80 (트윈 80); 단백질 코클레이트(protein cochleates) (Avanti Polar Lipids, Inc., Alabaster, AL); STIMULONTM (QS-21); 큐일-A(Quil-A) (Quil-A 사포닌); S-28463 (4-아미노-옥텍-디메틸-2-에톡시메틸-1H-이미다조[4,5 c]퀴놀린-1-에탄올(4-amino-otec-dimethyl-2-ethoxymethyl-1H-imidazo[4,5 c]quinoline-1-ethanol)); SAF-1TM ("신텍스 어쥬번트 제형(Syntex adjuvant formulation)"); 센다이 프로테오리포좀(Sendai proteoliposomes) 및 센다이 포함 지질 기질; 스판-85(Span-85) (소르비탄 트리올레이트(sorbitan trioleate)); Specol (Marcol 52, Span 85 및 Tween 85의 현탁액); 스쿠알렌 또는 Robane® (2,6,10,15,19,23-헥사메틸테트라코산 및 2,6,10,15,19,23-헥사메틸-2,6,10,14,18,22-테트라코사헥산); 스테아릴티로신(stearyltyrosine) (옥타데실티로신 하이드로클로라이드); 테라미드(Theramid)® (N-아세틸글루코사미닐-N-아세틸무라밀-L-Ala-D-isoGlu-L-Ala-디팔미톡시프로필아미드(N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-dipalmitoxypropylamide)); 테로닐-MDP(Theronyl-MDP) (터머티드TM(TermurtideTM) 또는 [thr 1]-MDP; N-아세틸무라밀-L-트레오닐-D-이소글루타민); Ty 입자 (Ty-VLPs 또는 바이러스 유사 입자); 워터-리드 리포좀(Walter-Reed liposomes) (알루미늄 하이드록사이드에 흡수된 지질 A를 포함하는 리포좀), 및 Pam3Cys, 특히 어쥬-포스(Adju-phos), 올하이드로겔(Alhydrogel), 리하이드라겔(Rehydragel)과 같은 알루미늄 염을 포함하는 리포펩타이드; CFA, SAF, IFA, MF59, 프로박스(Provax), 티터맥스(TiterMax), 몬타니드(Montanide), 백스펙틴(Vaxfectin)을 포함하는 에멀전; 옵티박스(Optivax) (CRL1005), L121, 폴로악스머4010(Poloaxmer4010)) 등을 포함하는 코폴리머; 스텔스(Stealth)를 포함하는 리포좀, BIORAL을 포함하는 코클레이트; QS21, 큐일 A(Quil A), 이스코매트릭스(Iscomatrix), ISCOM을 포함하는 식물 유도된 어쥬번트; 토마틴(Tomatine), PLG, PMM, 이눌린을 포함하는 바이오폴리머를 포함하는 공동 자극(costimulation)에 적합한 어쥬번트; 로물티드(Romurtide), DETOX, MPL, CWS, 만노스(Mannose), CpG 핵산 서열, CpG7909, 인간 TLR 1-10의 리간드, 쥣과의 TLR 1-13 리간드, ISS-1018, IC31, 이미다조퀴놀린, 암플리겐(Ampligen), Ribi529, 이목신(IMOxine), IRIVs, VLPs, 콜레라 독소, 열내성 독소, Pam3Cys, 플라겔린(Flagellin), GPI 앵커(anchor), LNFPIII/Lewis X, 항미생물 펩타이드, UC-1V150, RSV 융합 단백질, cdiGMP를 포함하는 미생물 유도된 어쥬번트; 및 CGRP 뉴로펩타이드를 포함하는 길항제로 적합한 어쥬번트로 이루어진 군으로부터 선택될 수 있으나, 이에 제한되지 않는다.
적절한 어쥬번트는 또한 양이온성 또는 다가양이온성 화합물로부터 선택될 수 있으며, 상기 어쥬번트는 바람직하게 양이온성 또는 다가양이온성 화합물과 함께 약학적 조성물의 인공 핵산 분자 또는 벡터를 혼합하여 제조된다. 본 발명에 정의된 양이온성 또는 다가양이온성 화합물과 인공 핵산 분자 또는 약학적 조성물의 벡터를 회합(association) 또는 혼합(complexing)은 바람직하게 어쥬번트 특성을 제공하고 약학적 조성물의 인공 핵산 분자 또는 벡터를 안정화시키는 효과를 부여한다. 특히 바람직하게, 이러한 양이온성 또는 다가양이온성 화합물은 프로타민, 뉴클레올린, 스페르민 또는 스페르미딘을 포함하는 양이온성 또는 다가양이온성 펩타이드 또는 단백질, 또는 폴리-L-라이신 (PLL), 폴리-아르기닌, 염기성 폴리펩타이드, 세포 투과 펩타이드(CPPs), HIV-결합 펩타이드, Tat, HIV-1 Tat (HIV), Tat-유도된 펩타이드, 페네트라틴, VP22 유도된 또는 유사체 펩타이드, HSV VP22 (단순 포진), MAP, KALA 또는 단백질 이송 도메인 (PTDs, PpT620, 프롤린-풍부 펩타이드, 아르기닌 풍부 펩타이드, 리신-풍부 펩타이드, MPG-펩타이드(들), Pep-1, L-올리고머, 칼시토닌 펩타이드(들), 안테나페디아(Antennapedia)-유도된 펩타이드 (특히 초파리(Drosophila antennapedia)로부터), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24, SynB, SynB(1), pVEC, hCT-유도된 펩타이드, SAP, 프로타민, 스페르민, 스페르미딘, 또는 히스톤을 포함하는 것과 같은 다른 양이온성 펩타이드 또는 단백질로부터 선택된다. 더욱 바람직한 양이온성 또는 다가양이온성 화합물은 양이온성 폴리사카라이드, 예를 들어 키토산, 폴리브렌(polybrene), 양이온성 폴리머, 예를 들어 폴리에틸렌이민 (PEI), 양이온성 지질, 예를 들어 DOTMA: 1-(2,3-시올레일옥시)프로필) -N,N,N-트리메틸암모늄 클로라이드, DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민, DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스페르민, DIMRI: 디미리스토-옥시프로필 디메틸 하이드록시에틸 암모늄 브로마이드, DOTAP: 디올레일옥시-3-(트리메틸암모니오)프로판, DC-6-14: O,O-디테트라데카노일-N-( -트리메틸암모니오아세틸)디에탄올아민 클로라이드, CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-하이드록시에틸)]-디메틸암모늄 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]-트리메틸암모늄, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시숙시닐옥시)에틸]-트리메틸암모늄, 올리고펙타민, 또는 양이온성 또는 다가양이온성 폴리머, 예를 들어 -아미노산-폴리머 또는 역전된 폴리아미드 등과 같은 변형된 폴리아미노산, PVP(폴리(N-에틸-4-비닐피리디늄 브로마이드)) 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)) 등과 같은 변형된 아크릴레이트, pAMAM(폴리(아미도아민)) 등과 같은 변형된 아미도아민, 디아민 및 변형된 1,4 부탄디올 디아크릴레이트-코-5-아미노-1-펜타놀 폴리머 등과 같은 변형된 폴리베타아미노에스터(PBAE), 폴리프로필아민 덴드리머 또는 pAMAM 기초의 덴드리머 등과 같은 덴드리머, PEI: 폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 사이클로덱스트린 기초의 폴리머, 덱스트란 기초의 폴리머, 키토산 등과 같은 폴리아릴아민, 당 백본 기초의 폴리머, PMOXA-PDMS 코폴리머 등과 같은 실란 백본 기초의 폴리머, 하나 또는 그 이상의 양이온성 블록(예를 들어 상기 언급된 양이온성 폴리머로부터 선택된) 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜)의 조합으로 이루어진 블록폴리머 등을 포함할 수 있다.
추가적으로, 조성물의 인공 핵산 분자 또는 벡터, 바람직하게 RNA를 혼합함으로써 어쥬번트로 사용될 수 있는, 바람직한 양이온성 또는 다가양이온성 단백질 또는 펩타이드는 하기 전체 화학식 (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x를 갖는 하기 단백질 또는 펩타이드로부터 선택될 수 있으며, Arg, Lys, His 및 Orn의 총 함량이 올리고펩타이드의 전체 아미노산의 적어도 50%를 나타내는 경우, 상기 l + m + n + o + x = 8-15이며, l, m, n 또는 o는 서로 독립적으로 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15로부터 선택된 어느 수일 수 있고; Xaa는 Arg, Lys, His 또는 Orn을 제외한 천연(=자연적으로 발생) 또는 비-천연 아미노산으로부터 선택된 어느 아미노산일 수 있으며; Xaa의 총 함량이 올리고펩타이드의 전체 아미노산의 50%를 초과하지 않는 경우, X는 0, 1, 2, 3 또는 4로부터 선택된 어느 수일 수 있다. 본 발명에 있어서 특히 바람직한 올리고아르기닌은 예를 들어 Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R 등이다.
양이온성 또는 다가양이온성 화합물 대비 인공 핵산 또는 벡터의 비율은 전체 핵산 복합체의 질소/인 비율(N/P-비율)을 기초로 계산될 수 있다. 예를 들어, RNA가 염기의 통계적 분포를 보인다면, 1 ㎍ RNA는 전형적으로 약 3 nmol 포스페이트 잔기를 포함한다. 추가로, 1 ㎍ 펩타이드는 염기성 아미노산의 분자량 및 수에 의존하여, 전형적으로 약 x nmol 질소 잔기를 포함한다. (Arg)9(분자량 1424g/mol, 9개 질소 원자)에 대하여 예시적으로 계산할 때, 1 ㎍ (Arg)9은 약 700 pmol (Arg)9, 따라서 700 x 9=6300 pmol 염기성 아미노산 = 6.3 nmol 질소 원자를 포함한다. 약 1:1 RNA/(Arg)9의 질량비에 대하여 약 2의 N/P 비율이 계산될 수 있다. 2 ㎍ RNA과 함께 약 2:1의 질량비를 갖는 프로타민(연어로부터 프로타민이 사용될 때, 분자량 약 4250 g/mol, 21개 질소 원자)에 대하여 예시적으로 계산할 때, 6 nmol 포스페이트는 RNA에 대하여 계산될 수 있다; 1 ㎍ 프로타민은 약 235 pmol 프로타민 분자 및 따라서 235 x 21 = 4935 pmol 염기성 질소 원자 = 4.9 nmol 질소 원자를 포함한다. 약 2:1 RNA/프로타민의 질량비에 대하여 약 0.81의 N/P 비율이 계산될 수 있다. 약 8:1 RNA/프로타민의 질량비에 대하여 약 0.2의 N/P 비율이 계산될 수 있다. 본 발명의 맥락에서, N/P-비율은 복합체 내 핵산:펩타이드의 비율에 관하여, 바람직하게 약 0.1-10의 범위, 바람직하게 0.3-4의 범위, 및 가장 바람직하게 약 0.5-2 또는 0.7-2의 범위, 가장 바람직하게 약 0.7-1.5의 범위이다.
이의 공개가 본 발명에 참고문헌으로 병합된 특허출원 WO2010/037539는 면역자극성 조성물 및 면역자극성 조성물의 제조를 위한 방법을 개시한다. 그에 따라, 상기 발명의 바람직한 실시예에서, 상기 조성물은 상기 발명에 따른 인공 핵산 분자의 충분한 면역자극성 효과 및 효과적인 번역 모두를 얻기 위해, 분리된 두 단계로 수득된다. 이에, 소위 "어쥬번트 조성물"은 - 첫번째 단계 - 안정한 복합체를 형성하기 위해 특정한 비율로 양이온성 또는 다가 양이온성 화합물과 함게 어쥬번트 구성요소의 인공 핵산 분자 또는 벡터, 바람직하게 RNA를 혼합함으로써 제조된다. 이러한 맥락에서, 자유 양이온성 또는 다가양이온성 화합물이 없거나 또는 오직 무시할 수 있는 소량만이 핵산의 혼합 이후 어쥬번트 구성 요소에 남아 있는 것이 중요하다. 따라서, 어쥬번트 구성 요소 내 핵산 및 양이온성 또는 다가양이온성 화합물의 비율은 핵산이 완전히 혼합되고 자유 양이온성 또는 다가양이온성 화합물이 없거나 또는 오직 무시할 만한 소량으로 조성물 내 남아있는 범위 내에서 전형적으로 선택된다. 어쥬번트 구성 요소의 바람직한 범위, 즉 양이온성 또는 다가양이온성 화합물 대비 핵산의 비율은 약 6:1(w/w) 내지 약 0,25:1(w/w), 더욱 바람직하게 약 5:1(w/w) 내지 약 0,5:1(w/w), 더욱 더 바람직하게 약 4:1(w/w) 내지 약 1:1(w/w) 또는 약 3:1(w/w) 내지 약 1:1(w/w), 및 가장 바람직하게 약 3:1(w/w) 내지 약 2:1(w/w)의 비율의 범위로부터 선택된다.
바람직한 실시예에 따르면, 본 발명에 따른 인공 핵산 분자 또는 벡터, 바람직하게 RNA 분자는 본 발명의 (면역자극성) 조성물을 형성하기 위해 어쥬번트 구성 요소의 혼합된 핵산 분자, 바람직한 RNA에 두번째 단계에 첨가된다. 이에 따라, 본 발명의 인공 산 분자 또는 벡터, 바람직하게 RNA는 자유 핵산, 즉 다른 화합물과 혼합되지 않는 핵산으로서 첨가된다. 첨가 전, 자유 인공 핵산 분자 또는 벡터는 혼합되지 않으며, 바람직하게 어쥬번트 구성 요소의 첨가에 따른 검출 가능한 또는 현저한 어느 혼합 반응을 수행하지 않는다.
적절한 어쥬번트는 나아가 화학식 (II): GlXmGn을 갖는 핵산으로부터 선택될 수 있으며, 상기: G는 구아노신, 우라실 또는 구아노신 또는 우라실의 유사체이며; X는 구아노신, 우라실, 아데노신, 티미딘, 시토신 또는 상기 뉴클레오티드의 유사체이며; l은 1 내지 40의 정수이며, 상기 l=1일 때 G는 구아노신 또는 이의 유사체이며, l>1일 때 뉴클레오티드의 적어도 50%는 구아노신 또는 이의 유사체이며; m은 정수이며 적어도 3이며; 상기 m=3일 때 X는 우라실 또는 이의 유사체이며, 상기 m>3일 때 적어도 3개 연속적인 우라실 또는 우라실의 유도체가 발생하며; n은 1 내지 40의 정수이며, 상기 n=1일 때 G는 구아노신 또는 이의 유사체이며, n>1일 때 적어도 50%의 뉴클레오티드는 구아노신 또는 이의 유사체이다.
다른 적절한 어쥬번트는 나아가 화학식 (III): ClXmCn을 갖는 핵산으로부터 선택될 수 있으며, 상기: C는 시토신, 우라실 또는 시토신 또는 우라실의 유사체이며; X는 구아노신, 우라실, 아데노신, 티미딘, 시토신 또는 상기 뉴클레오티드의 유사체이며; l은 1 내지 40의 정수이며, 상기 l=1일 때 C는 시토신 또는 이의 유사체이며, 상기 l>1일 때 적어도 50%의 뉴클레오티드는 시토신 또는 이의 유사체이며; m은 정수이며 적어도 3이며; 상기 m=3일 때 X는 우라실 또는 이의 유사체이며, 상기 m>3일 때 적어도 3개 연속적인 우라실 또는 우라실의 유사체가 발생하며; n은 1 내지 40의 정수이며, 상기 n=1일 때 C는 시토신 또는 이의 유사체이며, 상기 n>1일 때 적어도 50%의 뉴클레오티드는 시토신 또는 이의 유사체이다.
본 발명에 따르는 약학적 조성물은 바람직하게는 약학적 조성물의, 특히 본 발명에 정의된 본 발명의 인공 핵산 분자, 벡터 및/또는 세포의 구성 성분의 “안전하고 유효한 양”을 포함한다. 본 발명에 사용된 “안전하고 유효한 양”은 본 발명에 정의된 질병 또는 질환의 긍정적 변형을 현저하게 유도하는 충분한 양을 의미한다. 동시에 그러나 “안정하고 효과적인 양”은 바람직하게는 심각한 부작용을 회피하며 장점 및 위험 사이의 민감한 관계를 허용한다. 이들 한계의 결정은 전형적으로 민감한 의학적 판단 내에 있다.
추가적 양태에서, 본 발명은 의약품(medicament)으로서, 예를 들어 백신(유전자적 백신 접종) 또는 유전자 치료에서, 사용을 위한, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다.
본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 치료적 행동의 사용 또는 펩타이드, 폴리펩타이드 또는 단백질의 효과를 만드는 어느 의학적 적용에, 또는 특정한 펩타이드 또는 단백질의 보충이 필요한 곳에 특히 적절하다. 따라서 본 발명은 펩타이드, 폴리펩타이드 또는 단백질의 치료적 행동 또는 효과에 의해 치료할 수 있거나 특정한 펩타이드, 폴리펩타이드 또는 단백질의 보충에 의해 치료할 수 있는 질병 또는 질환의 치료 또는 예방에 사용을 위해 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다. 예를 들어 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 유전적 질병, 자가면역 질병, 암 또는 종양 관련된 질병, 감염성 질병, 만성 질병 또는 그와 같은 것, 예를 들어 유전적 백신 접종 또는 유전자 치료에 의한 것에 의해 치료 또는 예방을 위해 사용될 수 있다.
특히 치료되는 개체에 치료적 펩타이드, 폴리펩타이드 또는 단백질의 안정하고 연장된 존재로부터 유익한 이러한 치료(therapeutic treatments)는, 본 발명의 3'-UTR 요소가 본 발명의 인공 핵산 분자 또는 벡터의 코딩된 펩타이드 또는 단백질의 안정하고 연장된 발현을 제공하기 때문에, 본 발명의 맥락에서 의학적 적용으로 특히 적절하다. 따라서 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 본 발명에 따르는 약학적 조성물의 특히 적절한 의학적 적용은 백신 접종이다. 따라서 본 발명은 개체, 바람직하게 포유동물 개체, 더욱 바람직하게 인간 개체의 백신 접종을 위한, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 제공한다. 바람직한 백신 접종 치료는 박테리아, 원생동물 또는 바이러스 감염과 같은 감염성 질병에 대한 백신 접종 및 항 종양 백신 접종이다. 이러한 백신 접종 치료는 예방을 위한 것 또는 치료를 위한 것일 수 있다.
치료 또는 예방되는 질병에 의존하여 ORF는 선택될 수 있다. 예를 들어 오픈 리딩 프레임은 유전적 질병을 겪는 환자와 같이, 단백질의 기능의 전체 부족 또는 적어도 부분적 결실을 겪는 환자에게 공급되는 단백질에 대해 코딩할 수 있다. 추가적으로 오픈 리딩 프레임은 개체의 질병 또는 상태에 유익하게 영향을 주는 펩타이드 또는 단백질을 코딩하는 ORF로부터 선택될 수 있다. 나아가 오픈 리딩 프레임은 천연 펩타이드 또는 단백질의 병리학적 과생산의 하향-조절 또는 단백질 또는 펩타이드를 병리학적으로 발현하는 세포의 제거에 영향을 주는 펩타이드 또는 단백질을 코딩할 수 있다. 이러한 기능 또는 과생산의 부족, 상실은 예를 들어 종양 및 종양 형성(neoplasia), 자가면역 질병, 알러지, 감염, 만성 질환 또는 이와 유사한 것의 맥락에서 발생할 수 있다. 나아가 오픈 리딩 프레임은 항원 또는 면역원, 예를 들어 병원체의 에피토프에 대한 또는 종양 항원에 대한 것을 코딩할 수 있다. 따라서 바람직한 실시예에서, 본 발명에 따르는 인공 핵산 분자 또는 벡터는 항원 또는 면역원, 예를 들어 병원체의 에피토프 또는 종양 관련된 항원, 상기 설명된 3'-UTR 요소, 및 폴리(A) 서열 등과 같은 선택적인 추가 구성 요소를 포함하거나 이로 구성된 아미노산 서열을 코딩하는 ORF를 포함한다.
의학적 적용의 맥락에서, 특히 백신 접종의 맥락에서, DNA는 항-DNA 면역 반응을 유도하는 위험을 가지며 유전체 DNA에 삽입되려는 경향이 있으므로, 본 발명에 따르는 인공 핵산 분자는 RNA, 바람직하게는 mRNA인 것이 바람직하다. 그러나 일부 실시예에서, 예를 들어 만약 아데노바이러스 전달 수송체와 같은, 바이러스 전달 수송체가 본 발명에 따르는 인공 핵산 분자 또는 벡터의 전달을 위해 사용된다면, 예를 들어 유전자 치료의 맥락에서, 인공 핵산 분자 또는 벡터가 DNA 분자인 것이 바람직할 수 있다.
본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 경구적으로, 비경구적으로, 흡입 스프레이에 의해, 국소적으로, 직장으로, 비강으로, 구강으로, 질로 또는 이식된 병원소(implanted reservoir)를 통해 또는 제트 인젝션(jet injection)을 통해 투여될 수 있다. 본 발명에 사용된 용어 비경구적은 피하, 정맥내, 근육내, 관절내, 활액내(intra-synovial), 흉골내, 척추강내, 간장내, 병소내, 두개내, 경피내, 피내, 폐내(intrapulmonal), 복강내, 심장 내, 동맥내, 및 설하 주사 또는 투입(infusion) 기술을 포함한다. 바람직한 실시예에서, 본 발명에 따른 인공 핵산 분자, 본 발명에 따른 벡터, 본 발명에 따른 세포, 또는 본 발명에 따른 약학적 조성물은 무바늘 주사(예를 들어 제트 인젝션)를 통해 투여된다.
바람직하게는 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 비경구적으로, 예를 들어 비경구적 주사에 의해, 더욱 바람직하게는 피하, 정맥내, 근육내, 관절내, 활액내, 흉골내, 척추강내, 간장내, 병소내, 두개내, 경피내, 피내, 폐내, 복강내, 심장내, 동맥내, 및 설하 주사 또는 투입 기술에 의해 투여된다. 특히 바람직한 것은 피내 및 근육내 주사이다. 독창적 약학적 조성물의 살균 주사가능한 형태는 수용성 또는 유성 현탁액일 수 있다. 이들 현탁액은 적절한 분산 또는 습윤제 및 현탁제를 사용하여 기술분야에 알려진 기술에 따라 제조될 수 있다. 바람직하게, 상기 용액 또는 현탁액은 무바늘 주사(예를 들어 제트 인젝션)를 통해 투여된다.
본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 또한 캡슐, 정제, 수용성 현탁액 또는 용액을 포함하나, 이에 제한되지 않고, 어느 구두로 허용 가능한 투여 형태로 구두로(orally) 투여될 수 있다.
본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 또한, 특히 치료의 목표가 국소적 처리에 의해 용이하게 접근 가능한 지역(areas) 또는 기관, 예를 들어 피부의 또는 어느 다른 접근 가능한 상피 조직의 질병을 포함하는 것을 포함할 때 국소적으로 투여될 수 있다. 적절한 국소적 제형은 이들 지역 또는 기관의 각각에 대해 용이하게 제조될 수 있다. 국소적 적용을 위해, 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물은 하나 또는 그 이상의 담체에 현탁 또는 용해된 적절한 연고로 제조될 수 있다.
일 실시예에서, 의약품으로서 사용은 포유동물 세포의 형질전환의 단계, 바람직하게는 포유동물 세포의 인비트로(in vitro) 또는 엑스비보(ex vivo) 형질전환, 더욱 바람직하게는 의약품에 의해 치료될 개체의 분리된 세포의 인비트로 형질전환을 포함한다. 만약 사용이 분리된 세포의 인비트로 형질전환을 포함한다면, 의약품으로서 사용은 환자에 형질전환된 세포의 재투여를 추가적으로 포함할 수 있다. 의약품으로서 본 발명의 인공 핵산 분자 또는 벡터의 사용은 성공적으로 형질전환된 분리된 세포의 선별의 단계를 추가로 포함할 수 있다. 따라서, 만약 벡터가 선별 마커를 추가적으로 포함하는 경우 유익할 수 있다. 또한 의약품으로서 사용은 분리된 세포의 인비트로 형질전환 및 발현 생산물, 즉 이들 세포로부터 코딩된 펩타이드 또는 단백질의 정제를 포함할 수 있다. 이들 정제된 펩타이드 또는 단백질은 차후에 이것이 필요한 개체에 투여될 수 있다.
본 발명은 또한 이것이 필요한 개체에 본 발명에 따르는 인공 핵산 분자, 본 발명에 따르는 벡터, 본 발명에 따르는 세포, 또는 본 발명에 따르는 약학적 조성물을 투여하는 것을 포함하는 상기 설명된 질병 또는 질환을 치료 또는 예방하는 방법을 제공한다.
나아가, 본 발명은 본 발명에 따른 인공 핵산 분자와 함께 세포의 형질전환을 포함하는 질병 또는 질환을 치료 또는 예방하는 방법을 제공한다. 상기 형질전환은 인비트로, 엑스비보 또는 인비보에서 수행될 수 있다. 바람직한 실시예에서, 세포의 형질전환은 인비트로 수행되며 형질전환된 세포는 이것이 필요한 개체에, 바람직하게는 인간 환자에 투여된다. 바람직하게는 인비트로 형질전환되는 세포는 개체, 바람직하게는 인간 환자의 분리된 세포이다. 따라서 본 발명은 개체로부터, 바람직하게는 인간 환자로부터 세포를 분리하는 단계, 본 발명에 따르는 인공 핵산 또는 본 발명에 따르는 벡터로 분리된 세포를 형질전환 하는 단계, 및 개체, 바람직하게는 인간 환자에 형질전환된 세포를 투여하는 단계를 포함하는 치료 방법을 제공한다.
본 발명에 따르는 질환을 치료 또는 예방하는 방법은 바람직하게 상기 설명된 백신 접종 방법 또는 유전자 치료 방법이다.
상기 설명된 바와 같이, 본 발명은 3'-UTR 요소는 mRNA 분자를 안정화 및/또는 mRNA 분자로부터 단백질 생산을 증진, 안정화 및/또는 연장할 수 있다. 따라서, 추가적 양태에서, 본 발명은 리보좀 단백질 유전자의 3'-UTR 또는 리보좀 단백질 유전자의 3'-UTR의 변이체, 바람직하게 상기 설명된 3'-UTR 요소로부터 유도된 핵산 서열을 포함하거나 이로 구성된 3'-UTR 요소와 함께, RNA 분자, 바람직하게 mRNA 분자, 또는 RNA 분자를 코딩하는 벡터를 회합하는(associating) 단계를 포함하는, RNA 분자, 바람직하게 mRNA 분자를 안정화시키기 위한 방법에 관한 것이다.
나아가, 본 발명은 인공 핵산 분자로부터 또는 벡터로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 증진, 안정화 및/또는 연장시키는 및/또는 인공 핵산 분자로부터 또는 벡터로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 안정화 및/또는 연장시키는 방법에 관한 것이며, 상기 방법은 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 3'-UTR 요소와 함께, 바람직하게 상기 설명된 3'-UTR 요소와 함께, 인공 핵산 분자 또는 벡터, 바람직하게 mRNA 분자를 회합시키는 단계를 포함한다.
본 발명의 맥락에서 용어 “3'-UTR 요소와 함께 인공 핵산 분자 또는 벡터를 회합”은 바람직하게 3'-UTR 요소와 함께 인공 핵산 분자 또는 벡터를 기능적으로 회합 또는 기능적으로 조합하는 것을 의미한다. 이는 상기 인공 핵산 분자 또는 벡터 및 3'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소가 3'-UTR 요소의 기능, 예를 들어 RNA 및/또는 단백질 생산 안정화 기능이 수행되도록, 회합되거나 짝지어짐을 의미한다. 전형적으로, 이는 3'-UTR 요소가 인공 핵산 분자 또는 벡터, 바람직하게 mRNA 분자, 오픈 리딩 프레임에 3', 바람직하게 오픈 리딩 프레임의 바로 옆 3', 바람직하게 오픈 리딩 프레임 및 폴리(A) 서열 또는 폴리아데닐화 신호 사이에 통합되는 것을 의미한다. 바람직하게, 상기 3'-UTR 요소는 3'-UTR과 같은 인공 핵산 분자 또는 벡터, 바람직하게 mRNA로 통합되며, 즉 3'-UTR 요소는 인공 핵산 분자 또는 벡터, 바람직하게 mRNA의 3'-UTR이며, 즉, 이는 오픈 리딩 프레임의 3'-측에서 폴리(A) 서열 또는 폴리아데닐화 신호의 5'-측까지, 선택적으로 하나 이상의 제한 부위를 포함하거나 이로 구성된 서열와 같은 짧은 링커를 통해 연결되어 확장된다. 따라서, 바람직하게 상기 용어 “3'-UTR 요소와 함께 인공 핵산 분자 또는 벡터를 회합”하는 것은 인공 핵산 분자 또는 벡터 내, 바람직하게 mRNA 분자 내 위치한 오픈 리딩 프레임과 3'-UTR 요소가 기능적으로 회합되는 것을 의미한다. 상기 3'-UTR 및 ORF는 본 발명에 따른 인공 핵산 분자에 대해 상기 설명된 것, 예를 들어 바람직하게 상기 ORF 및 3'-UTR은 이종 기원(heterologous), 예를 들어 상기 설명된 것처럼 다른 유전자로부터 유도된 것이다.
추가적 양태에서, 본 발명은 3'-UTR 요소가 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된, RNA 분자의, 바람직하게 mRNA 분자의 안정성을 향상시키기 위한 3'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소의 용도를 제공한다.
게다가, 본 발명은 3'-UTR 요소가 상기 설명된 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하거나 이로 구성된 인공 핵산 분자 또는 벡터로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 향상시키기 위한, 및/또는 인공 핵산 분자 또는 벡터 분자로부터, 바람직하게 mRNA 분자로부터 단백질 생산을 안정화 및/또는 연장시키기 위한, 3'-UTR 요소, 바람직하게 상기 설명된 3'-UTR 요소의 용도를 제공한다.
본 발명에 따른 용도는 바람직하게 상기 설명된 3'-UTR 요소와 함께 상기 인공 핵산 분자, 벡터 또는 RNA를 회합시키는 것을 포함한다.
본 발명의 약학적 조성물의 화합물 및 성분은 또한 각각 분리되어 제조 및 거래될 수 있다. 따라서, 본 발명은 나아가 본 발명에 따른 인공 핵산 분자, 본 발명에 따른 벡터, 본 발명에 따른 세포, 및/또는 본 발명에 따른 약학적 조성물을 포함하는 키트 또는 일부(parts)의 키트에 관한 것이다. 바람직하게, 이러한 키트 또는 일부의 키트는 추가적으로 사용을 위한 지침, 형질전환을 위한 세포, 어쥬번트, 약학적 조성물의 투여를 위한 수단, 약학적으로 허용 가능한 담체 및/또는 인공 핵산 분자, 벡터, 세포 또는 약학적 조성물의 용해 또는 희석을 위한 약학적으로 허용 가능한 용액을 포함할 수 있다.
하기 도면, 서열 및 실시예는 본 발명을 추가로 설명하기 위한 의도이다. 이들은 본 발명의 목적을 이에 제한하려는 의도는 아니다.
본 발명의 인공 핵산 분자는 유전자 치료 및/또는 유전자 백신 접종에 효과적으로 사용될 수 있다. 또한, 본 발명의 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 3'-UTR 요소는 단백질 발현을 증진, 안정 및/또는 연장시킬 수 있다.
도 1 내지 3은 인비트로(in vitro) 전사를 통해 수득될 수 있는 mRNA를 코딩하는 서열을 나타낸다. 하기 약어가 사용되었다:
* rpl32: 5' 말단 올리고피리미딘 트랙트(tract)가 없는 인간 리보좀 단백질 라지 32의 5'-UTR
* PpLuc (GC): 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 mRNA 서열
* A64: 64개 아데닐레이트(adenylates)를 갖는 폴리(A)-서열
* ag: 인간 α-글로빈의 3'-UTR의 중심, α-복합체 결합 일부
* rps9: 인간 리보좀 단백질 스몰 9의 3'-UTR로부터 유도된 3'-UTR
* C30: 30개 시티딜레이트(cytidylates)를 갖는 폴리(C)-서열
* 히스톤SL: (Cakmakci, Lerner, Wagner, Zheng, & William F Marzluff, 2008. Mol. Cell. Biol. 28(3):1182-94)로부터 수득한 히스톤 스템-루프 서열;
* 알부민: 인간 알부민의 3'-UTR.
도 1: mRNA rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL (SEQ ID NO:8)을 코딩하는 서열을 나타냄
도 2: mRNA rpl32 - PpLuc(GC) - ag - A64 - C30 - 히스톤SL (SEQ ID NO:9)을 코딩하는 서열을 나타냄. 인간 α-글로빈의 3'-UTR의 중앙, α-복합체 결합 일부는 ORF 및 폴리(A) 사이에 삽입되었음. PpLuc(GC) ORF는 이탤릭체로 강조됨. 상기 α-글로빈으로부터 유도된 3'-UTR 요소는 밑줄침.
도 3: rpl32 - PpLuc(GC) - rps9 - A64 - C30 - hSL (SEQ ID NO:7)의 mRNA 서열. 인간 리보좀 단백질 스몰 9의 3'-UTR은 ORF 및 폴리(A) 사이에 삽입됨. PpLuc(GC) ORF는 이탤릭체로 강조되며, 상기 rps9로부터 유도된 3' UTR 요소는 밑줄침.
도 4: 리보좀 단백질 스몰 9의 3'-UTR이 mRNA로부터 단백질 발현을 현저하게 증가시킴을 나타냄.
3'-UTR이 없거나 인간 α-글로빈 3'-UTR을 포함하는 mRNA로부터 루시퍼라제 발현과 비교하여, mRNA로부터 루시퍼라제 발현에 본 발명의 인간 리보좀 단백질 스몰 9의 3'-UTR의 효과를 실험함. 그에 따라 다른 mRNA는 리포펙션(lipofection)에 의해 인간 피부 아세포(HDF)로 형질전환됨. 루시퍼라제 수준은 형질전환 이후 6, 24, 48, 및 72 시간에 측정됨. 루시퍼라제는 3'-UTR이 없는 mRNA로부터 명확하게 발현됨. 그러나, 루시퍼라제 발현은 잘 알려진 α-글로빈 3'-UTR에 의해 증가되지 않음. 대조적으로, 리보좀 단백질 스몰 9의 3'-UTR은 루시퍼라제 발현을 현저하게 증가시킴. 데이터는 3회 형질전환에 대해 평균 RLU ± SEM (상대적은 광 단위 ± 표준 오차)로 그래프로 나타냄. RLU는 실시예 5.1에 요약됨.
도 5: mRNA rpl32 - PpLuc(GC) - 알부민 - A64 - C30 - 히스톤SL(SEQ ID NO: 206)을 코딩하는 서열을 나타냄. 인간 알부민의 3'-UTR은 ORF 및 폴리(A) 사이에 삽입됨. PpLuc(GC) ORF는 이탤릭체로 강조됨. 알부민으로부터 유도된 3'-UTR 요소는 밑줄침.
도 6: 쥣과 리보좀 단백질 유전자 rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HDF 세포(인간 피부 아세포) 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 7: 쥣과 리보좀 단백질 유전자 rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, Hela 세포 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 8: 쥣과 리보좀 단백질 유전자 rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HDF 세포(인간 피부 아세포) 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 9: 쥣과 리보좀 단백질 유전자 rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HeLa 세포 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
* rpl32: 5' 말단 올리고피리미딘 트랙트(tract)가 없는 인간 리보좀 단백질 라지 32의 5'-UTR
* PpLuc (GC): 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 mRNA 서열
* A64: 64개 아데닐레이트(adenylates)를 갖는 폴리(A)-서열
* ag: 인간 α-글로빈의 3'-UTR의 중심, α-복합체 결합 일부
* rps9: 인간 리보좀 단백질 스몰 9의 3'-UTR로부터 유도된 3'-UTR
* C30: 30개 시티딜레이트(cytidylates)를 갖는 폴리(C)-서열
* 히스톤SL: (Cakmakci, Lerner, Wagner, Zheng, & William F Marzluff, 2008. Mol. Cell. Biol. 28(3):1182-94)로부터 수득한 히스톤 스템-루프 서열;
* 알부민: 인간 알부민의 3'-UTR.
도 1: mRNA rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL (SEQ ID NO:8)을 코딩하는 서열을 나타냄
도 2: mRNA rpl32 - PpLuc(GC) - ag - A64 - C30 - 히스톤SL (SEQ ID NO:9)을 코딩하는 서열을 나타냄. 인간 α-글로빈의 3'-UTR의 중앙, α-복합체 결합 일부는 ORF 및 폴리(A) 사이에 삽입되었음. PpLuc(GC) ORF는 이탤릭체로 강조됨. 상기 α-글로빈으로부터 유도된 3'-UTR 요소는 밑줄침.
도 3: rpl32 - PpLuc(GC) - rps9 - A64 - C30 - hSL (SEQ ID NO:7)의 mRNA 서열. 인간 리보좀 단백질 스몰 9의 3'-UTR은 ORF 및 폴리(A) 사이에 삽입됨. PpLuc(GC) ORF는 이탤릭체로 강조되며, 상기 rps9로부터 유도된 3' UTR 요소는 밑줄침.
도 4: 리보좀 단백질 스몰 9의 3'-UTR이 mRNA로부터 단백질 발현을 현저하게 증가시킴을 나타냄.
3'-UTR이 없거나 인간 α-글로빈 3'-UTR을 포함하는 mRNA로부터 루시퍼라제 발현과 비교하여, mRNA로부터 루시퍼라제 발현에 본 발명의 인간 리보좀 단백질 스몰 9의 3'-UTR의 효과를 실험함. 그에 따라 다른 mRNA는 리포펙션(lipofection)에 의해 인간 피부 아세포(HDF)로 형질전환됨. 루시퍼라제 수준은 형질전환 이후 6, 24, 48, 및 72 시간에 측정됨. 루시퍼라제는 3'-UTR이 없는 mRNA로부터 명확하게 발현됨. 그러나, 루시퍼라제 발현은 잘 알려진 α-글로빈 3'-UTR에 의해 증가되지 않음. 대조적으로, 리보좀 단백질 스몰 9의 3'-UTR은 루시퍼라제 발현을 현저하게 증가시킴. 데이터는 3회 형질전환에 대해 평균 RLU ± SEM (상대적은 광 단위 ± 표준 오차)로 그래프로 나타냄. RLU는 실시예 5.1에 요약됨.
도 5: mRNA rpl32 - PpLuc(GC) - 알부민 - A64 - C30 - 히스톤SL(SEQ ID NO: 206)을 코딩하는 서열을 나타냄. 인간 알부민의 3'-UTR은 ORF 및 폴리(A) 사이에 삽입됨. PpLuc(GC) ORF는 이탤릭체로 강조됨. 알부민으로부터 유도된 3'-UTR 요소는 밑줄침.
도 6: 쥣과 리보좀 단백질 유전자 rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HDF 세포(인간 피부 아세포) 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 7: 쥣과 리보좀 단백질 유전자 rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, Hela 세포 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 8: 쥣과 리보좀 단백질 유전자 rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HDF 세포(인간 피부 아세포) 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
도 9: 쥣과 리보좀 단백질 유전자 rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38로부터 유도된 3'-UTR이 mRNA로부터 단백질 발현을 증가시키는 것으로 이미 알려진(WO2013143698), 알부민 유전자의 3'-UTR을 포함하는 mRNA와 최소 동일한 범위로, HeLa 세포 내 mRNA로부터 단백질 발현을 증가시킴을 나타냄.
실시예
1. DNA-주형(templates)의 제조
인비트로(in vitro) 전사를 위한 벡터는 T7 프로모터 및 포티너스 피랄리스(Photinus pyralis) 루시퍼라제를 코딩하는 GC-풍부 서열(PpLuc(GC))을 포함하여 구성되었다. 리보좀 단백질 라지 32의 5' 비번역된 영역(5'-UTR)은 PpLuc(GC)의 5'에 삽입되었다. A64 폴리(A) 서열 이후 C30 및 히스톤 스템-루프 서열이 PpLuc(GC)의 3'으로 삽입되었다. 상기 히스톤 스템-루프 서열 다음 인비트로 전사 전 벡터의 선형화를 위해 사용된 제한 부위가 따랐다. 인비트로 전사에 따라 이러한 벡터로부터 수득된 mRNA는 "rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL"로 설계되었다.
이러한 벡터는 오픈 리딩 프레임의 비번역된 서열 3'(3'-UTR)을 포함하도록 변형되었다. 요약하면, 하기 mRNA 코딩 서열을 포함하는 벡터가 생산되었다(mRNA 코딩 서열의 일부는 도 1 내지 3에 실시예로 묘사됨):
rpl32 - PpLuc(GC) - A64 - C30 - 히스톤SL (SEQ ID NO:8, Fig. 1)
rpl32 - PpLuc(GC) - ag - A64 - C30 - 히스톤SL (SEQ ID NO:9, Fig. 2)
rpl32 - PpLuc(GC) - rps9 - A64 - C30 - 히스톤SL (SEQ ID NO:7, Fig. 3)
rpl32 - PpLuc(GC) - rps21 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps29 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps9 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps27 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps28 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps19 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl35a - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl13 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl23a - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - uba52 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl22l1 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps4x - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps23 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps13 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps17 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps18 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - Fau - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rps13 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - 히스톤SL
rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - 히스톤SL
2. 인비트로(In vitro) 전사
실시예 1에 따른 DNA 주형은 선형화되고 선형화되고 T7-RNA 중합효소를 사용하여 인비트로(in vitro) 전사되었다. 상기 DNA 주형은 이후 DNase-처리에 의해 소화되었다. mRNA 전사체는 전사 반응에 N7-메틸-구아노신-5'-트리포스페이트-5'-구아노신의 과량 첨가하여 수득된 5'-캡 구조를 포함한다. 그에 따라 수득된 mRNA는 정제되고 물에 재현탁되었다.
3. mRNA 리포펙션에 의한 루시퍼라제 발현
인간 피부 아세포(HDF) 또는 HeLa 세포는 배지(10% FCS, 1% Pen/Strep, 1%글루타민이 첨가된 L-글루타민 및 25mM Hepes(Lonza, Basel, Switzerland)가 있는 RPMI 1640 배지) 내 웰당 3x104 세포의 농도로 형질전환 전 3일 동안 24개 웰 플레이트에 시드되었다. 리포펙션 직전, 세포는 Opti-MEM 내 세척되었다. 세포는 리포펙타민2000과 함께 복합화된 웰 당 PpLuc-코딩 mRNA의 25 ng으로 리포펙트되었다. 레닐라 레니포르미스(Renilla reniformis) 루시퍼라제(RrLuc)를 코딩하는 mRNA는 형질전환 효율을 위해 대조군에 PpLuc mRNA와 함께 형질전환되었다(웰 당 RrLuc mRNA의 2.5 ng). 형질전환의 시작 90분 이후, Opti-MEM은 배지에 대해 교체되었다. 형질전환 6, 24, 48, 및 72시간 이후, 배지는 흡입되고(aspirated) 세포는 용해 버퍼(Passive Lysis Buffer, Promega)의 100 ㎕ 내 용해되었다. 용해물은 루시퍼라제 활성이 측정될 때까지 -80°C에서 저장되었다.
4. 루시퍼라제 측정
루시퍼라제 활성은 하이덱스 카멜레온(Hidex Chameleon) 플레이트 리더에서 상대적인 광 단위(RLU)로 측정되었다. PpLuc 활성은 20 ㎕의 용해물 및 50 ㎕의 루시페린 버퍼(Beetle-Juice, PJK GmbH)를 사용하여 2초 측정 시간에 측정되었다. RrLuc 활성은 20 ㎕의 용해물 및 50 ㎕의 코엘렌테라진 버퍼(Renilla-Juice, PJK GmbH)를 사용하여 2초 측정 시간에 측정되었다.
5. 결과
5.1 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.
mRNA로부터 단백질 발현에 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 3'-UTR이 없거나, 또는 인간 α-글로빈의 3'-UTR의 중심, α-복합체 결합 일부(ag) 포함된, 또는 인간 리보좀 단백질 스몰 9의 3'-UTR(rps9) 포함된 mRNA들. 루시퍼라제를 코딩하는 mRNA는 인간 피부 아세포(HDF)로 형질전환되었다. 루시퍼라제 수준은 형질전환 이후 6, 24, 48, 및 72 시간에 측정되었다. 이러한 데이터들로부터, 0 내지 72 시간에 발현된 총 단백질이 곡선 하 영역(AUC)으로 계산되었다(하기 표 1 및 도 4 참조).
3'-UTR | 6시간에 RLU | 24시간에 RLU | 48시간에 RLU | 72시간에 RLU | AUC |
없음(none) | 1183752 | 2703805 | 2040979 | 536076 | 126400000 |
ag | 696317 | 2188117 | 1630769 | 273142 | 96720000 |
rps9 | 1650962 | 4513651 | 4273634 | 755401 | 226200000 |
루시퍼라제는 3-UTR이 없는 mRNA로부터 명확하게 발현되었다. 그러나 루시퍼라제 발현은 잘 알려진 α-글로빈 3'-UTR에 의해 증가되지 않았다. 대조적으로, 리보좀 단백질 스몰 9의 3'-UTR은 루시퍼라제 발현을 현저하게 증가시켰다.
5.2 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.
mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질(rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a)의 3'-UTR을 포함하며, mRNA로부터 단백질 발현을 증가시키는 것으로 알려진(WO2013143698) 알부민의 3'-UTR 비교를 위한 mRNA. 루시퍼라제를 코딩하는 mRNA는 인간 피부아세포(HDF)로 형질전환되었다. 루시퍼라제 수준은 형질전환 24, 48, 및 72 시간 이후에 측정되었다(하기 표 2 및 도 7 참조).
24시간에 RLU | 48시간에 RLU | 72시간에 RLU | |
rpl32- PpLuc(GC)-알부민 | 1468876 | 720609 | 199437 |
rpl32- PpLuc(GC)-알부민 | 1407897 | 580822 | 181030 |
rpl32- PpLuc(GC)-rps21 | 2974366 | 779239 | 191021 |
rpl32- PpLuc(GC)-rps29 | 4040760 | 856996 | 216321 |
rpl32- PpLuc(GC)-rps9 | 2930305 | 802405 | 219681 |
rpl32- PpLuc(GC)-rps27 | 4503067 | 1090230 | 274320 |
rpl32- PpLuc(GC)-rps28 | 2026219 | 448372 | 103269 |
rpl32- PpLuc(GC)-rps19 | 4249503 | 1075621 | 206846 |
rpl32- PpLuc(GC)-rpl35a | 3907863 | 1223672 | 262108 |
rpl32- PpLuc(GC)-rpl13 | 2543231 | 782597 | 165374 |
rpl32- PpLuc(GC)-rpl36 | 2880198 | 683174 | 143539 |
rpl32- PpLuc(GC)-rpl23a | 2872413 | 606451 | 120915 |
세포 | 118 | 213 | 191 |
상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 설명된, 알부민의 3'-UTR을 포함하는 mRNA에 비해 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현됨을 나타낸다.
5.3 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.
mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질(rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 및 rpl23a)의 3'-UTR을 포함하며, 알부민의 3'-UTR을 비교하기 위한 mRNA들. 루시퍼라제를 코딩하는 mRNA는 HeLa 세포로 형질전환되었다. 루시퍼라제 수준은 형질전환 24, 48, 및 72시간 이후에 측정되었다.(하기 표 3 및 도 7 참조).
24시간에 RLU | 48시간에 RLU | 72시간에 RLU | |
rpl32- PpLuc(GC)-알부민 | 482053 | 131028 | 16580 |
rpl32- PpLuc(GC)-알부민 | 525908 | 86636 | 21971 |
rpl32- PpLuc(GC)-rps21 | 1452649 | 307127 | 38317 |
rpl32- PpLuc(GC)-rps29 | 1413088 | 293924 | 27114 |
rpl32- PpLuc(GC)-rps9 | 1399948 | 304061 | 36627 |
rpl32- PpLuc(GC)-rps27 | 1460812 | 235486 | 28608 |
rpl32- PpLuc(GC)-rps28 | 1384794 | 201359 | 25787 |
rpl32- PpLuc(GC)-rps19 | 1446100 | 303612 | 40591 |
rpl32- PpLuc(GC)-rpl35a | 1848259 | 307848 | 47293 |
rpl32- PpLuc(GC)-rpl13 | 772371 | 138186 | 27188 |
rpl32- PpLuc(GC)-rpl36 | 837643 | 147108 | 36641 |
rpl32- PpLuc(GC)-rpl23a | 887643 | 157330 | 24916 |
세포 | 97 | 193 | 117 |
상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 알려진 알부민의 3'-UTR을 포함하는 mRNA에 비해, 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현됨을 나타낸다.
5.4 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.
mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질의 3'-UTR(rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38)을 포함하며 알부민의 3'-UTR을 비교하기 위한 mRNA들. 루시퍼라제를 코딩하는 mRNA들은 인간 피부 아세포(HDF)로 형질전환되었다. 루시퍼라제 수준은 형질전환 24, 48, 및 72 시간 이후에 측정되었다. (하기 표 4 및 도 8 참조).
24시간에 RLU | 48시간에 RLU | 72시간에 RLU | |
rpl32-PpLuc(GC)-알부민 | 2181914 | 921116 | 474521 |
rpl32-PpLuc(GC)-rpl23 | 4836067 | 1365445 | 444623 |
rpl32-PpLuc(GC)-uba52 | 4404508 | 1572170 | 517874 |
rpl32-PpLuc(GC)-rpl22l1 | 4124152 | 1057264 | 346186 |
rpl32-PpLuc(GC)-rpl36a | 4326843 | 1328764 | 510755 |
rpl32-PpLuc(GC)-rps4x | 2879407 | 724050 | 246616 |
rpl32-PpLuc(GC)-rpl27 | 3391506 | 830016 | 254254 |
rpl32-PpLuc(GC)-rpl3 | 4889331 | 1074353 | 427856 |
rpl32-PpLuc(GC)-알부민 | 2870659 | 1252124 | 437208 |
rpl32-PpLuc(GC)-rps23 | 4321886 | 911262 | 308560 |
rpl32-PpLuc(GC)-rps13 | 4313724 | 1173245 | 373579 |
rpl32-PpLuc(GC)-rpl26 | 4405685 | 1450797 | 455755 |
rpl32-PpLuc(GC)-rps17 | 4661966 | 1138370 | 359931 |
rpl32-PpLuc(GC)-rps18 | 4580492 | 1224085 | 329321 |
rpl32-PpLuc(GC)-rps8 | 5043669 | 1255188 | 380314 |
rpl32-PpLuc(GC)-Fau | 5495042 | 1277753 | 416901 |
rpl32-PpLuc(GC)-rps13 | 4879517 | 1307823 | 361588 |
rpl32-PpLuc(GC)-rpl11 | 4273583 | 1264210 | 436367 |
rpl32-PpLuc(GC)-rpl38 | 4891163 | 1477135 | 464923 |
상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 알려진 알부민의 3'-UTR을 포함하는 mRNA에 비해, 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현되는 것을 나타낸다.
5.5 쥣과 리보좀 단백질 유전자의 3'-UTR은 단백질 발현을 증가시킨다.
mRNA로부터 단백질 발현에 쥣과 리보좀 단백질 유전자의 3'-UTR의 효과를 조사하기 위해, 다른 UTR을 갖는 mRNA들이 합성되었다: 다른 쥣과 리보좀 단백질의 3'-UTR(rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 및 rpl38)을 포함하며, 알부민의 3'-UTR과 비교를 위한 mRNA들. 루시퍼라제를 코딩하는 mRNA는 HeLa 세포로 형질전환되었다. 루시퍼라제 수준은 형질전환 이후 24, 48, 및 72 시간에 측정되었다. (하기 표 5 및 도 9 참조).
24시간에 RLU | 48시간에 RLU | 72시간에 RLU | |
rpl32-PpLuc(GC)-알부민 | 1370770 | 383733 | 69772 |
rpl32-PpLuc(GC)-rpl23 | 2860370 | 711666 | 78196 |
rpl32-PpLuc(GC)-uba52 | 2954670 | 820157 | 97648 |
rpl32-PpLuc(GC)-rpl22l1 | 3211757 | 822579 | 86780 |
rpl32-PpLuc(GC)-rpl36a | 3198982 | 878820 | 115778 |
rpl32-PpLuc(GC)-rps4x | 3282181 | 500040 | 45538 |
rpl32-PpLuc(GC)-rpl27 | 2544927 | 533978 | 66691 |
rpl32-PpLuc(GC)-rpl3 | 3081117 | 653787 | 83858 |
rpl32-PpLuc(GC)-알부민 | 1692963 | 397629 | 73285 |
rpl32-PpLuc(GC)-rps23 | 3828806 | 864761 | 94624 |
rpl32-PpLuc(GC)-rps13 | 3627626 | 898377 | 135420 |
rpl32-PpLuc(GC)-rpl26 | 3981814 | 839608 | 149750 |
rpl32-PpLuc(GC)-rps17 | 4607487 | 1029902 | 182204 |
rpl32-PpLuc(GC)-rps18 | 4071557 | 742337 | 101819 |
rpl32-PpLuc(GC)-rps8 | 4459446 | 1032970 | 125825 |
rpl32-PpLuc(GC)-Fau | 4486972 | 1066363 | 147843 |
rpl32-PpLuc(GC)-rps13 | 4811136 | 955703 | 123026 |
rpl32-PpLuc(GC)-rpl11 | 4405071 | 1231676 | 252711 |
rpl32-PpLuc(GC)-rpl38 | 5485224 | 1023424 | 170059 |
상기 결과는 보다 많은 루시퍼라제가 단백질 생산을 증가시키는 것으로 이미 알려진 알부민의 3'-UTR을 포함하는 mRNA에 비해, 쥣과 리보좀 단백질의 3'-UTR을 포함하는 mRNA로부터 발현되는 것을 나타낸다.
SEQUENCE LISTING
<110> CureVac GmbH
<120> Artificial nucleic acid molecules
<130> IMP162737DE
<160> 206
<170> PatentIn version 3.5
<210> 1
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9)
<400> 1
gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60
agcgctttac 70
<210> 2
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9)
<400> 2
guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60
agcgcuuuac 70
<210> 3
<211> 140
<212> DNA
<213> Artificial Sequence
<220>
<223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9) + poly
A
<400> 3
gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60
agcgctttac agatctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa 140
<210> 4
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<223> 3-UTR element of Homo sapiens ribosomal protein S9 (RPS9) + poly
A
<400> 4
guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60
agcgcuuuac agaucuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa 140
<210> 5
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> A particular preferred histone stem-loop sequence
<400> 5
caaaggctct tttcagagcc acca 24
<210> 6
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 5-UTR of human ribosomal protein Large 32 lacking the 5 terminal
oligopyrimidine tract
<400> 6
ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42
<210> 7
<211> 1918
<212> DNA
<213> Artificial Sequence
<220>
<223> rpl32 PpLuc(GC) rps9 A64 C30 histoneSL
<400> 7
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740
gattgtctcg ttttcctgcc aaataaacag gatcagcgct ttacagatct aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc 1860
cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918
<210> 8
<211> 1848
<212> DNA
<213> Artificial Sequence
<220>
<223> rpl32 PpLuc(GC) A64 C30 histoneSL
<400> 8
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800
cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848
<210> 9
<211> 1914
<212> DNA
<213> Artificial Sequence
<220>
<223> rpl32 PpLuc(GC) ag A64 C30 histoneSL
<400> 9
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740
tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tgcatccccc 1860
cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914
<210> 10
<211> 109
<212> DNA
<213> Homo sapiens
<400> 10
gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60
gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109
<210> 11
<211> 57
<212> DNA
<213> Homo sapiens
<400> 11
tgccaggaac agattttgca gttggtgggg tctcaataaa agttattttc cactgac 57
<210> 12
<211> 91
<212> DNA
<213> Homo sapiens
<400> 12
actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60
agacctgatt atacaggcag tgagaaacat g 91
<210> 13
<211> 58
<212> DNA
<213> Homo sapiens
<400> 13
acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58
<210> 14
<211> 33
<212> DNA
<213> Homo sapiens
<400> 14
atgtcttaag aacctaatta aatagctgac tac 33
<210> 15
<211> 67
<212> DNA
<213> Homo sapiens
<400> 15
ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60
ttgaaat 67
<210> 16
<211> 59
<212> DNA
<213> Homo sapiens
<400> 16
atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59
<210> 17
<211> 50
<212> DNA
<213> Homo sapiens
<400> 17
attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50
<210> 18
<211> 46
<212> DNA
<213> Homo sapiens
<400> 18
gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46
<210> 19
<211> 3787
<212> DNA
<213> Homo sapiens
<400> 19
agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60
cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120
tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180
gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240
gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300
gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360
acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420
tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480
agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540
aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600
cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660
aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720
aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780
tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840
agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900
cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960
atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020
ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080
aaccccagag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140
cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200
tacctctgct gctgcactca cagccacact tgatacacga tgacaccttg cttgtttgga 1260
aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320
tgtatatgtt aacttcgtga tcagtttgta tgtttgggac tcttgtccta tgtaaagtta 1380
aggtgggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440
ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500
cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560
agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620
ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680
gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740
tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800
cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860
ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920
tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980
ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040
catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100
gcttaatcta ttaagagccc taacaggaga ggatgggctt tctctgttgt ctggggccct 2160
gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220
gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280
cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340
aggcttctgc aggatagctg gggggctggg caggtgggtg aggcagcctc cctgctgaca 2400
ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460
aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520
ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580
gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640
gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccgggctgga accagccctc 2700
tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtgggtca 2760
ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820
tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880
gacctgtgtg ccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940
gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000
gcccccgggg agcacgggct ggctctgtgg tgcccgtggc cttttgtaga agcgttggtt 3060
ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120
ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180
caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240
tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300
tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360
cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420
tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480
gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540
gagcccagga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600
gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660
ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720
agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780
atcattt 3787
<210> 20
<211> 63
<212> DNA
<213> Homo sapiens
<400> 20
ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60
tgc 63
<210> 21
<211> 45
<212> DNA
<213> Homo sapiens
<400> 21
ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45
<210> 22
<211> 61
<212> DNA
<213> Homo sapiens
<400> 22
gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60
c 61
<210> 23
<211> 79
<212> DNA
<213> Homo sapiens
<400> 23
aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60
aaaacaagcc ttaatctgc 79
<210> 24
<211> 38
<212> DNA
<213> Homo sapiens
<400> 24
taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38
<210> 25
<211> 1651
<212> DNA
<213> Homo sapiens
<400> 25
atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60
tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120
gggcttccct tggttcgcca ctcatttatt tgtaacttga cttctttttt tttctgctta 180
aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240
cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300
ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360
atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420
aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480
caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540
ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600
ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660
ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720
tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780
cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggaggtggg 840
aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900
gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960
caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020
caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080
aaagagcttg cctacagatg gtttccacac ttgaaattgt gccctgcgag ttgcatagct 1140
ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200
agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260
ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320
agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380
catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440
cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500
tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560
tcactggttt tctatgtctt tttgaactct tgtaatcgag ttttgatcat attttctatt 1620
aaagtggcta acacctggct actcttactg t 1651
<210> 26
<211> 474
<212> DNA
<213> Homo sapiens
<400> 26
actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60
gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120
cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180
tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240
agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300
ggctgtgtat gaaaccaatg cccagggttt gaagggtgtt agcatccatt tcaggggagt 360
gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420
cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474
<210> 27
<211> 36
<212> DNA
<213> Homo sapiens
<400> 27
attcagcatt aaaataaatg taattaaaag gaaaag 36
<210> 28
<211> 45
<212> DNA
<213> Homo sapiens
<400> 28
actggcagat tagattttta aataaagatt ggattataac tctag 45
<210> 29
<211> 48
<212> DNA
<213> Homo sapiens
<400> 29
agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48
<210> 30
<211> 32
<212> DNA
<213> Homo sapiens
<400> 30
atgctttgtt ttgatcatta aaaattataa ag 32
<210> 31
<211> 90
<212> DNA
<213> Homo sapiens
<400> 31
accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60
aaatttgctt gttttaaaaa cattgtatct 90
<210> 32
<211> 4065
<212> DNA
<213> Homo sapiens
<400> 32
agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60
gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120
gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180
cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240
ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300
ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360
cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420
cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480
agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540
cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600
tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660
gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720
gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780
tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840
aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900
atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960
aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020
atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080
cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140
gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200
atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260
gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320
caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380
taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440
aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500
gagaatctcc aggaggcgga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560
gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620
gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680
agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740
agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800
ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860
cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920
cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980
cccggctaat tttttgcatt tttagtagag acagggtttc accgtgttag ccaggatggt 2040
ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100
accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160
ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220
gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280
tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340
ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400
cgggacttgg agactgaatt gtagtgggcc gaccacaaaa tgataaggca tggaaggaag 2460
tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520
taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580
tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640
gaaaatagtt ttgagcccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700
aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760
ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820
tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880
atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940
gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000
gagcagacag cccacggacg gactgcaagt cggaagcgcg ggcggaagct gtgcagcgcc 3060
cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120
tcacaacaca gaccggacct tgggtcttac cccggcacct gagaaccact tccggtgagt 3180
agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240
gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300
gataactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360
gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420
tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480
tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540
agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600
ggaggttagg gaaatgagca cgaagtatgt tttggtgcag ttttttgttc aacccaatgc 3660
gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720
actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780
ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840
catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900
aaatttaatt cctggctcta ttttacatcc caatttttat tttcctctca ttcccacttt 3960
acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020
tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065
<210> 33
<211> 3865
<212> DNA
<213> Homo sapiens
<400> 33
gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60
gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120
cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180
tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240
ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300
ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360
tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420
cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480
gctgggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540
tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600
gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660
cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720
gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780
cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840
accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900
ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960
gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020
ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080
tgcagtgagc ccatgagccc caccactaca ctccagcctg gaagacacca tgacacacag 1140
tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200
ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260
atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320
tgactgagag taaggggact gtcagggcct cgacttgcca ttggttgggg tcgtacgggg 1380
ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440
agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500
attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560
ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620
cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680
ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740
gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800
cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860
gtttatctgt ctcatgtttg tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc 1920
atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980
agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040
tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100
gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160
gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220
tcaaattacc cacctgcctc agcctcccaa agtgctggca ttacaggcgc tcgaggcttt 2280
ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340
aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400
tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460
ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520
ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagagggct ggagggaggg 2580
agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640
catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700
agctttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760
aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820
aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880
tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940
acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcagggc 3000
taatggttca cggaagccag gaatcaaact gcctgggttc cagtcccagc tctgccagtt 3060
atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120
tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180
actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240
ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300
agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360
agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420
tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480
attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540
tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600
atgactaatt tgtacacaaa ctaatgctcg tgtttcccaa gcacctggaa gacatgccag 3660
atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720
gctttcccag cctcctgccc gtgtttgtga atatcattct gtcctcagct gcatttccag 3780
cccaggctgt ttggcgctgc ccaggaatgg tatcaattcc cctgtttctc ttgtagccag 3840
ttactagaat aaaatcatct acttt 3865
<210> 34
<211> 288
<212> DNA
<213> Homo sapiens
<400> 34
ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60
gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120
gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180
cggtggttgt tgagagttaa ggcacggggt tgatgttttc agatgaaatt ctcaaagcaa 240
gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288
<210> 35
<211> 430
<212> DNA
<213> Homo sapiens
<400> 35
gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60
agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120
agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180
cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240
tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatgggcct ggggttcctg 300
ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360
aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattggg 420
ctatgagtgt 430
<210> 36
<211> 120
<212> DNA
<213> Homo sapiens
<400> 36
atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60
taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120
<210> 37
<211> 655
<212> DNA
<213> Homo sapiens
<400> 37
agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60
tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120
cagagggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180
cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240
attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300
taactagtat gtctgtccca cctttaaaaa gtttttcatt atgaaagtaa gtatttgtta 360
gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420
gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480
ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540
tatcttaatt tccactgaac ttgatttaaa ttcagagtta cacagtatga atatcacaat 600
cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655
<210> 38
<211> 331
<212> DNA
<213> Homo sapiens
<400> 38
agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60
gctaggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120
gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180
cccgtctaca aaaggttttt agagttgaaa tatgaaatgt gatgtgggta tggaaattga 240
ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300
tcagatcaaa taaagttata aaattgcctt c 331
<210> 39
<211> 1152
<212> DNA
<213> Homo sapiens
<400> 39
gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60
ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120
ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180
tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240
gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300
cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360
aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420
atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480
gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540
ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600
tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660
tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720
cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780
cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840
tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900
tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960
ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020
cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080
agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140
aactggtcct tc 1152
<210> 40
<211> 75
<212> DNA
<213> Homo sapiens
<400> 40
actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60
aaaacttact acctt 75
<210> 41
<211> 1176
<212> DNA
<213> Homo sapiens
<400> 41
gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60
tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120
actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180
ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240
gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300
ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360
caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420
tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480
gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540
ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600
ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660
caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720
ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780
cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840
aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900
atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960
taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020
cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080
tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140
aaccctgctg attaaatctc tcttgggctt cctccc 1176
<210> 42
<211> 59
<212> DNA
<213> Homo sapiens
<400> 42
acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59
<210> 43
<211> 49
<212> DNA
<213> Homo sapiens
<400> 43
accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49
<210> 44
<211> 178
<212> DNA
<213> Homo sapiens
<400> 44
ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60
atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120
tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178
<210> 45
<211> 73
<212> DNA
<213> Homo sapiens
<400> 45
tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60
ttctttaaaa agt 73
<210> 46
<211> 38
<212> DNA
<213> Homo sapiens
<400> 46
acctctttta taacatgttc aataaaaagc tgaacttt 38
<210> 47
<211> 40
<212> DNA
<213> Homo sapiens
<400> 47
attcctgctc ccctgcaaat aaagcctttt tacacatctc 40
<210> 48
<211> 1301
<212> DNA
<213> Homo sapiens
<400> 48
cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60
aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120
tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180
gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240
aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300
tttagaagag ggatatgttt gagtttttcc tatgcataag gcgatccacg ttgcacatag 360
aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420
tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480
cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540
tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600
gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660
agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720
ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780
atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840
ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900
tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960
cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020
ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080
tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttgggt caaaaataat 1140
caaaaaggat ggttgtgtgt gtattgaaca tgtagactta tttttcttat tttcaaaata 1200
ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260
acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301
<210> 49
<211> 576
<212> DNA
<213> Homo sapiens
<400> 49
cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60
ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120
gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180
agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240
ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300
cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360
tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420
gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480
aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540
cttcagaact gtgagaaata aatttctgtt gtctat 576
<210> 50
<211> 57
<212> DNA
<213> Homo sapiens
<400> 50
agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57
<210> 51
<211> 1324
<212> DNA
<213> Homo sapiens
<400> 51
agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60
tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120
ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180
agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240
ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300
tgtctgtgaa tccttctagc tatatctctt taagtgaaag agtgttaagt actcagtaaa 360
tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420
tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctgggtt caagcagttc 480
ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540
ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600
ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660
ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttcccctact 720
tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780
gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840
ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900
aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960
aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020
atacagttag ctaagagggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080
ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140
aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200
taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260
cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320
atag 1324
<210> 52
<211> 68
<212> DNA
<213> Homo sapiens
<400> 52
aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60
taatagca 68
<210> 53
<211> 60
<212> DNA
<213> Homo sapiens
<400> 53
attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60
<210> 54
<211> 53
<212> DNA
<213> Homo sapiens
<400> 54
ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53
<210> 55
<211> 37
<212> DNA
<213> Homo sapiens
<400> 55
gattttttga gtaacaaata aataagatca gactctg 37
<210> 56
<211> 36
<212> DNA
<213> Homo sapiens
<400> 56
acaaaaatga ctaaataaaa agtatatatt cacagt 36
<210> 57
<211> 55
<212> DNA
<213> Homo sapiens
<400> 57
atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55
<210> 58
<211> 70
<212> DNA
<213> Homo sapiens
<400> 58
gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60
agcgctttac 70
<210> 59
<211> 50
<212> DNA
<213> Homo sapiens
<400> 59
aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50
<210> 60
<211> 77
<212> DNA
<213> Homo sapiens
<400> 60
ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60
acttgggatc ttccgcg 77
<210> 61
<211> 21
<212> DNA
<213> Homo sapiens
<400> 61
agaaataaat ctttggctca c 21
<210> 62
<211> 41
<212> DNA
<213> Homo sapiens
<400> 62
atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41
<210> 63
<211> 31
<212> DNA
<213> Homo sapiens
<400> 63
tggctcagct aataaaggcg cacatgactc c 31
<210> 64
<211> 53
<212> DNA
<213> Homo sapiens
<400> 64
ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53
<210> 65
<211> 64
<212> DNA
<213> Homo sapiens
<400> 65
gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60
caag 64
<210> 66
<211> 37
<212> DNA
<213> Homo sapiens
<400> 66
aacaaaccat gctgggttaa taaattgcct cattcgt 37
<210> 67
<211> 386
<212> DNA
<213> Homo sapiens
<400> 67
ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60
agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120
gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgattt 180
ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240
gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300
tgactttctt atccagcact tgtattgatt atttttcatt ttgataatgt tgggttttta 360
aaaactcctt tatgatggaa aatttc 386
<210> 68
<211> 281
<212> DNA
<213> Homo sapiens
<400> 68
gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60
actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120
tatgggtatc ttagagtggt ctatcctgtt ttcgttgtcg tttgagtcat ttgaaaactg 180
gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240
taactttggc atactctaga taaattctga ttggtatggg g 281
<210> 69
<211> 53
<212> DNA
<213> Homo sapiens
<400> 69
ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53
<210> 70
<211> 2785
<212> DNA
<213> Homo sapiens
<400> 70
atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60
tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120
ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180
ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240
ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300
aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360
ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420
ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480
ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540
gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600
gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660
tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720
gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780
gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840
gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900
gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960
ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020
gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080
tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140
ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200
tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260
tagtctctcc ctccgcaagg gcggaaaggc tgcctgttgg tttgtaccag tgtttcctaa 1320
cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380
atgagcctta actgacccaa tcctttgtga tgcgggagag attgctaggc ctcgctcacc 1440
tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500
cgcggggtgg gcagctctcc ccgggcggtg gggcccttgt gaccgcgagg cggggcgcac 1560
caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620
gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcacccagga 1680
cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740
aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800
tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860
tgtatccatg gaggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920
tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980
caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040
tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100
aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160
aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220
ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280
cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340
cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400
attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460
cagcccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520
aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580
attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640
agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700
agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760
ccagctgaat aaagcccttc cttct 2785
<210> 71
<211> 48
<212> DNA
<213> Homo sapiens
<400> 71
ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48
<210> 72
<211> 67
<212> DNA
<213> Homo sapiens
<400> 72
ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60
tgtactt 67
<210> 73
<211> 62
<212> DNA
<213> Homo sapiens
<400> 73
aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60
tg 62
<210> 74
<211> 276
<212> DNA
<213> Homo sapiens
<400> 74
ctgtatgagt taataaaaga catgaactaa catttattgt tgggttttat tgcagtaaaa 60
agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120
tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180
aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240
cagaagttat atttaatgta agttgtctaa atataa 276
<210> 75
<211> 139
<212> DNA
<213> Homo sapiens
<400> 75
gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60
tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac tgagatgctc ctttaaataa 120
agcgtttgtg tttcaagtt 139
<210> 76
<211> 94
<212> DNA
<213> Homo sapiens
<400> 76
atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60
ttgtatataa aataaacatt tgaaaaaacc cttc 94
<210> 77
<211> 1355
<212> DNA
<213> Homo sapiens
<400> 77
tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60
acaggtgtta tttgtctgtt aaaactagtc tgcagatgtt tcttgaatgc tttgtcaaat 120
taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180
ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240
aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300
ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360
gctctgctgg tttattttca agtggctgcg ttttttttag tttggcaggt gtagactttt 420
taagttgggc tttagaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480
ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540
tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600
tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660
tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720
cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780
ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840
tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900
ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960
ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020
ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080
aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140
ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200
atttccagga agtactcata gcaagttcat aaaagttctt gagacctaaa tttcttcaca 1260
aaaaaagaaa agatcttaag tcatacattt taattgtgta gaggttgttc aactgaagga 1320
ataaatgtct attaaactaa aacaaatgga ccttc 1355
<210> 78
<211> 2017
<212> DNA
<213> Homo sapiens
<400> 78
gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60
agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120
aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180
tgagccacca cccccagccc aatttttatt ttttgtacag acaggatctc actatgttgc 240
ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300
aattatagga atgagccacc acaccgggcc caaatttact ttagtaataa caacaattgg 360
ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420
ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480
aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540
tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600
aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660
cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720
gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780
gcacgatctc agctcactgc aacccgggtt caagcgattc tcctgcctca gcctcccgag 840
tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900
cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960
ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020
ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080
aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140
ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200
cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260
tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320
gtttcaccat gttgttcagg ctggtctcaa agtcctgggc tcaagcaatc ttcctgtctc 1380
tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440
ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500
tatgtatctc agagcttatt ctttatcagc tcatgaggaa cttcattttt tttttttttt 1560
ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620
cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680
attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740
accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800
cccaaagtag tgggattaca ggcatgagca accgtgcccg gctggaactt cattcttttg 1860
gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920
ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980
acatctttat tcatctgtag aataaattct tagaagt 2017
<210> 79
<211> 37
<212> DNA
<213> Homo sapiens
<400> 79
ggtttttata caagaaaaat aaagtgaatt aagcgtg 37
<210> 80
<211> 140
<212> DNA
<213> Homo sapiens
<400> 80
gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60
tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120
aaacattaaa taatcagttc 140
<210> 81
<211> 55
<212> DNA
<213> Homo sapiens
<400> 81
acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55
<210> 82
<211> 1485
<212> DNA
<213> Homo sapiens
<400> 82
gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60
ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa cctttgggtc 120
attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180
ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240
cctccccagg tcctaggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300
tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360
cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420
gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480
gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540
caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600
acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660
gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720
cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780
tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840
gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900
ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960
tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020
acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080
aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140
acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200
ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260
ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320
tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380
gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440
gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485
<210> 83
<211> 31
<212> DNA
<213> Homo sapiens
<400> 83
ggcacatttg aataaattct attaccagtt c 31
<210> 84
<211> 39
<212> DNA
<213> Homo sapiens
<400> 84
ggggcgcatt gtcaataaag cacagctggc tgagactgc 39
<210> 85
<211> 486
<212> DNA
<213> Homo sapiens
<400> 85
gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60
aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120
aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180
gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240
tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300
ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360
gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420
ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480
gctttt 486
<210> 86
<211> 44
<212> DNA
<213> Homo sapiens
<400> 86
gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44
<210> 87
<211> 406
<212> DNA
<213> Homo sapiens
<400> 87
gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60
ctgttcatct tttgggaggg aataagctag agccatcaat acaattccgc ttgtggggaa 120
atttatgcct cttactggta ctacttgttt tgcattgaag ctgactggtt gagttcacat 180
catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240
tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300
agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360
tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406
<210> 88
<211> 1994
<212> DNA
<213> Homo sapiens
<400> 88
ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60
agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120
ctcatgtctg actagtccac aatactgcac tatttcagtg tttacgattt tttatccttt 180
cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240
agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300
cgcttgttgg ttgcactaag aattgttctg ttgtttctca tcacagaaat ctgcagtcaa 360
ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420
gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480
gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540
cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600
gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660
tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720
tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780
attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840
gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900
agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960
taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020
ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080
accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140
agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200
agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260
aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320
aaaaagaatg agatccagtc atttacaaca acatgggtgg aactggagat cgttatgtta 1380
agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440
aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500
ggtggcggga ggtggggatg gttaatgggt acaaaaagaa aaaagaatga attagaccaa 1560
ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620
cttagagtgt aattggattg tttgtacctc aaagaaaaaa tgcaataaaa ctttacagtg 1680
gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740
tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800
ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860
accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920
ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980
aaaaaggaca ttag 1994
<210> 89
<211> 307
<212> DNA
<213> Homo sapiens
<400> 89
accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60
gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120
tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180
aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240
ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300
ttaaatc 307
<210> 90
<211> 38
<212> DNA
<213> Homo sapiens
<400> 90
gtctgtaggc cttgtctgtt aataaatagt ttatatac 38
<210> 91
<211> 133
<212> DNA
<213> Homo sapiens
<400> 91
agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60
tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120
gtctggttgt ttg 133
<210> 92
<211> 1802
<212> DNA
<213> Homo sapiens
<400> 92
tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60
tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120
tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct ccccacgccc 180
ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240
accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300
attttcttgt ttattggtat tttcccacta gaaatgaagc tgcgtgaagt tagagatttt 360
tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420
cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480
acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540
gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600
ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660
tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720
agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780
tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840
caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900
cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960
tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020
atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080
agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140
ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200
gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260
cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320
atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380
ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440
gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500
ctggccaaag tggttgattg aggctgggtg caagcagagt tgtgagaagg ctcccatttg 1560
gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620
tgctgcagac attttgctac cacaagtgaa gccaccctga cgacacagtt gacaatttgg 1680
agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740
aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800
gt 1802
<210> 93
<211> 34
<212> DNA
<213> Homo sapiens
<400> 93
tgctgagggc ctcaataaag tttgtgttta tgcc 34
<210> 94
<211> 502
<212> DNA
<213> Homo sapiens
<400> 94
aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 60
tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120
ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180
cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240
catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300
caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360
cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420
gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480
aattaaaaat cttgcaaagg gg 502
<210> 95
<211> 502
<212> DNA
<213> Homo sapiens
<400> 95
aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 60
tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120
ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180
cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240
catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300
caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360
cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420
gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480
aattaaaaat cttgcaaagg gg 502
<210> 96
<211> 48
<212> DNA
<213> Homo sapiens
<400> 96
attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48
<210> 97
<211> 171
<212> DNA
<213> Homo sapiens
<400> 97
gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60
gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120
gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171
<210> 98
<211> 2309
<212> DNA
<213> Homo sapiens
<400> 98
ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60
aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120
gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180
acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240
ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300
gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360
gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420
gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480
ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540
tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600
tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660
gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720
cgagtagctg ggactacagg tgcccgccac aactcctggc taattttttg tatttttagt 780
agagacgggg tttcactggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840
tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900
actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960
tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020
cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080
caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140
caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200
aggtgggcaa atcataaggt caagagtttt ttagatgggg tgagcacaga ccaattcctg 1260
ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320
ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380
agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440
gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500
ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560
gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620
cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680
ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740
ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800
agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860
tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920
aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980
gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040
acttcctggg ccagtttggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100
cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160
ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220
cgcccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280
tcgcttcatt caataaacag ctgctgctc 2309
<210> 99
<211> 58
<212> DNA
<213> Homo sapiens
<400> 99
gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58
<210> 100
<211> 1502
<212> DNA
<213> Homo sapiens
<400> 100
gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60
ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120
tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180
cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240
gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300
acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360
ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420
tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480
tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540
tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600
tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660
agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720
gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780
tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840
cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900
attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960
atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020
ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080
atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140
attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200
aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260
tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320
tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380
gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440
tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500
gc 1502
<210> 101
<211> 48
<212> DNA
<213> Homo sapiens
<400> 101
attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48
<210> 102
<211> 193
<212> DNA
<213> Homo sapiens
<400> 102
ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60
atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120
tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180
agcttttgtt tcc 193
<210> 103
<211> 73
<212> DNA
<213> Homo sapiens
<400> 103
aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60
tctgtttact ggc 73
<210> 104
<211> 93
<212> DNA
<213> Homo sapiens
<400> 104
actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60
cgagggaaaa taaatacagt gatattctta cgc 93
<210> 105
<211> 257
<212> DNA
<213> Homo sapiens
<400> 105
gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60
ggccggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120
ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180
agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240
aatcgatctc tttgagc 257
<210> 106
<211> 692
<212> DNA
<213> Homo sapiens
<400> 106
tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60
attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120
acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180
cccctctttt tcttttttta aaatatattt gagtatgcca tacatttata tatatggtgt 240
atatgaattt ggtttaaaca ttttaaaatt tattctgatt agtttgtgtc tttttttttt 300
tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360
ctcactgcaa cctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420
ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480
aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540
tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600
aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660
ataattaaaa agaatagttt caaaaaaata ca 692
<210> 107
<211> 228
<212> DNA
<213> Homo sapiens
<400> 107
atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60
tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120
aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180
ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228
<210> 108
<211> 529
<212> DNA
<213> Homo sapiens
<400> 108
acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60
ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120
aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180
gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240
tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300
gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360
ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420
tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480
gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529
<210> 109
<211> 174
<212> DNA
<213> Homo sapiens
<400> 109
gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60
gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120
aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174
<210> 110
<211> 156
<212> DNA
<213> Homo sapiens
<400> 110
atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60
aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120
atcttatatc tgattagaaa ttagtatctg gaacat 156
<210> 111
<211> 46
<212> DNA
<213> Homo sapiens
<400> 111
aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46
<210> 112
<211> 67
<212> DNA
<213> Homo sapiens
<400> 112
ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60
tgtactt 67
<210> 113
<211> 294
<212> DNA
<213> Homo sapiens
<400> 113
ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60
atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120
ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180
gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240
tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294
<210> 114
<211> 171
<212> DNA
<213> Homo sapiens
<400> 114
tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60
ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120
aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171
<210> 115
<211> 49
<212> DNA
<213> Homo sapiens
<400> 115
gcccccttcc cctgccctct ccctgaaata aagaatagct tgacagaaa 49
<210> 116
<211> 88
<212> DNA
<213> Mus musculus
<400> 116
ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60
tttgggagaa taaaagactt atatattg 88
<210> 117
<211> 69
<212> DNA
<213> Mus musculus
<400> 117
ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60
ggttttccc 69
<210> 118
<211> 118
<212> DNA
<213> Mus musculus
<400> 118
actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60
acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118
<210> 119
<211> 1008
<212> DNA
<213> Mus musculus
<400> 119
agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60
tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120
aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180
ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240
aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300
gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360
ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420
caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480
agaagggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540
gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600
ttaggtgctt atgcctctta gtaaatagcc cttcatccca gaaggagcaa gaattgtctt 660
cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720
acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780
ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840
aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900
agctaaaagc cattccacag ttgactccat ctgaagttaa agtgtgtaag tacacagtaa 960
atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008
<210> 120
<211> 306
<212> DNA
<213> Mus musculus
<400> 120
attgttaacc taattaaaca gcttcatagg ttcttttggt gtcctttttg tgtgttgtgt 60
gtgcacatgt ttgttgggtg ggtgttttgc tggtgtcttt tcctctgtgt cttcctctgg 120
ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180
tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240
ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300
tactgg 306
<210> 121
<211> 63
<212> DNA
<213> Mus musculus
<400> 121
ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60
ttg 63
<210> 122
<211> 49
<212> DNA
<213> Mus musculus
<400> 122
atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49
<210> 123
<211> 39
<212> DNA
<213> Mus musculus
<400> 123
acttgatcca aaaagctaat aaaattttct cagaaatgc 39
<210> 124
<211> 47
<212> DNA
<213> Mus musculus
<400> 124
gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47
<210> 125
<211> 42
<212> DNA
<213> Mus musculus
<400> 125
ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42
<210> 126
<211> 556
<212> DNA
<213> Mus musculus
<400> 126
ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60
tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120
ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttagggg 180
ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240
gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300
aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360
tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420
caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480
ttagagcaaa ccatgcacat atggtaaatt atctttgggt tttgggtccc taaaataaag 540
tggtgtgttc attgtg 556
<210> 127
<211> 47
<212> DNA
<213> Mus musculus
<400> 127
ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47
<210> 128
<211> 693
<212> DNA
<213> Mus musculus
<400> 128
acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60
tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120
agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180
ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240
tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300
aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360
atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420
ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480
atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540
agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600
cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660
aatggcactt agaagataac atgtgaaagc cat 693
<210> 129
<211> 98
<212> DNA
<213> Mus musculus
<400> 129
agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60
aataaaacaa gcctttgtct gttgccctct tgtttagc 98
<210> 130
<211> 1077
<212> DNA
<213> Mus musculus
<400> 130
tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60
tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120
cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180
tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240
cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300
ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360
tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420
agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480
atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540
tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600
aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660
tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720
atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780
cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840
ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900
taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960
tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020
ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077
<210> 131
<211> 1658
<212> DNA
<213> Mus musculus
<400> 131
gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60
tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120
ttaactgggc tgctgctcct ttgtatatag acactttttt cctgctcaga aacttgagtt 180
ctccagtagc aatggccaaa cagaagaacc aggctagggg gctgcatctg acagagcaag 240
tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300
atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360
caggtgattt ctttgtgtga tttttctttt cccctgggac aatgacagtc agtaagacag 420
gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480
cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540
tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600
ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660
gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720
ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780
caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840
actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900
gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960
gtacctccag ggcactgggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020
aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080
cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140
aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200
tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260
tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320
gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380
cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440
cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500
ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560
aaacttgctg gtttttatgc ctttctaact cttgtatttg aatgaatgtt gatcactttt 1620
tgtattaaag tggctgacac atggctactg tcactgtg 1658
<210> 132
<211> 1795
<212> DNA
<213> Mus musculus
<400> 132
aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60
ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagaggagg 120
aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180
tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240
tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300
gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360
gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420
agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480
tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540
gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600
cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660
tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720
ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780
gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840
gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900
ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960
aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020
cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080
atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140
gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200
caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260
taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320
atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380
ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440
tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500
ctagcgtttc cttccaactt caggtgcagc ccccctcgtg gttagcggtc ttaagttcgt 1560
gacttgggtt tgcagatctt ttttgttaca tcgccggacc atgtggtggt ctttagctgt 1620
aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680
gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740
gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795
<210> 133
<211> 48
<212> DNA
<213> Mus musculus
<400> 133
actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48
<210> 134
<211> 140
<212> DNA
<213> Mus musculus
<400> 134
attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60
tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120
tcaaaaccac gtgaccatgt 140
<210> 135
<211> 46
<212> DNA
<213> Mus musculus
<400> 135
tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46
<210> 136
<211> 40
<212> DNA
<213> Mus musculus
<400> 136
agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40
<210> 137
<211> 109
<212> DNA
<213> Mus musculus
<400> 137
gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60
gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109
<210> 138
<211> 45
<212> DNA
<213> Mus musculus
<400> 138
acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45
<210> 139
<211> 640
<212> DNA
<213> Mus musculus
<400> 139
aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60
tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120
agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180
gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240
aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300
taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360
actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420
aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480
taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540
gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaagagtac 600
cttggagtaa ataaataaag cccaagatcc tgattgtcta 640
<210> 140
<211> 40
<212> DNA
<213> Mus musculus
<400> 140
gccccacacg cccgaagcaa taaagagtcc actgacttcc 40
<210> 141
<211> 124
<212> DNA
<213> Mus musculus
<400> 141
aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60
tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120
cttg 124
<210> 142
<211> 575
<212> DNA
<213> Mus musculus
<400> 142
cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60
tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120
tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180
attaggattg tggatttggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240
atagaatagg gtggccttga actcagaaat ccacctgcct tttcctccct agtattggca 300
attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360
aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420
gtcccaggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480
agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540
aacgattttt attaaaaacc ttgaggacaa acatt 575
<210> 143
<211> 54
<212> DNA
<213> Mus musculus
<400> 143
atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54
<210> 144
<211> 68
<212> DNA
<213> Mus musculus
<400> 144
actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60
gtcctaaa 68
<210> 145
<211> 504
<212> DNA
<213> Mus musculus
<400> 145
ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60
tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120
ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180
ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240
atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300
accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360
cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420
gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480
ttaaaactct taattcatct tact 504
<210> 146
<211> 306
<212> DNA
<213> Mus musculus
<400> 146
ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60
tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120
tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180
acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240
ttgaatttac agagatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300
actatg 306
<210> 147
<211> 246
<212> DNA
<213> Mus musculus
<400> 147
aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60
tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120
gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180
ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240
taagac 246
<210> 148
<211> 41
<212> DNA
<213> Mus musculus
<400> 148
accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41
<210> 149
<211> 181
<212> DNA
<213> Mus musculus
<400> 149
ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60
gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120
gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180
t 181
<210> 150
<211> 285
<212> DNA
<213> Mus musculus
<400> 150
tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60
ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120
aaaaccgcta ctgtttactt tgtgttggca tctttgtttc taaaattaaa gctcctagtg 180
tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240
gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285
<210> 151
<211> 40
<212> DNA
<213> Mus musculus
<400> 151
actgcttttg ttaagttggc taataaagag ctgaacctgt 40
<210> 152
<211> 42
<212> DNA
<213> Mus musculus
<400> 152
attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42
<210> 153
<211> 1059
<212> DNA
<213> Mus musculus
<400> 153
cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60
tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120
ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180
tcatgaagtt ggtgaccctg tgttgaacaa ttgagggtta gaagagcagt ttggttttgg 240
tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300
gctgtgtctc tggcctggag tagtctttct tgcttttttt tttttttttt tttttctcta 360
gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420
gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480
aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540
atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600
gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660
ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720
attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780
attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840
aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900
ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960
cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020
ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059
<210> 154
<211> 49
<212> DNA
<213> Mus musculus
<400> 154
aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49
<210> 155
<211> 87
<212> DNA
<213> Mus musculus
<400> 155
aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60
tgctagatta aacagcatgg tgaaact 87
<210> 156
<211> 100
<212> DNA
<213> Mus musculus
<400> 156
agtggactct gagggacatt gcggggaagg ggcgtttacg tttgtttata cttaaaagtt 60
ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100
<210> 157
<211> 45
<212> DNA
<213> Mus musculus
<400> 157
tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45
<210> 158
<211> 603
<212> DNA
<213> Mus musculus
<400> 158
gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60
gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120
agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180
aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240
attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300
ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360
ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420
cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480
ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540
ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600
agg 603
<210> 159
<211> 269
<212> DNA
<213> Mus musculus
<400> 159
agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60
cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120
cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180
tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240
ctttctttgt aaacaactgt ccacatttt 269
<210> 160
<211> 42
<212> DNA
<213> Mus musculus
<400> 160
gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42
<210> 161
<211> 69
<212> DNA
<213> Mus musculus
<400> 161
ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60
gatacttgg 69
<210> 162
<211> 36
<212> DNA
<213> Mus musculus
<400> 162
agttggagtt tatgttgtat tgaataaact ttaaag 36
<210> 163
<211> 47
<212> DNA
<213> Mus musculus
<400> 163
ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47
<210> 164
<211> 50
<212> DNA
<213> Mus musculus
<400> 164
ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaa 50
<210> 165
<211> 43
<212> DNA
<213> Mus musculus
<400> 165
atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43
<210> 166
<211> 34
<212> DNA
<213> Mus musculus
<400> 166
ccgaggccaa taaagactgg ttttggtccc tgga 34
<210> 167
<211> 3272
<212> DNA
<213> Mus musculus
<400> 167
acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60
ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120
gttttatgta gatattgaaa gcatgaccat tgtcttcact tcacctccag cttgggttgt 180
atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240
gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300
cctttcatca cccagacttg gtagacttac attctgtcac actgttggct cttaatctca 360
gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420
ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttgggttc gcaggttatt 480
ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540
atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600
ctggtttcac tgtccatggt tagtatctgg tgggtggaca cctggtggaa ccaagctgct 660
catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720
cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780
aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840
cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900
ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960
ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020
atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080
tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140
ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200
tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260
cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320
gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380
ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440
ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500
tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560
ggaagttaag cttgctcatt tgtagattag tggtcggtta cactgcaatt tagagtatca 1620
tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680
tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740
tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800
atgtgatgag tggtctttta aagattatct tttatttttt ttgagatggg gtttttctgt 1860
gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920
cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980
gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040
tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100
atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160
aatgaataga cttaccaaat tctgctgtct ccttggtaga tgtgaagttg ttggaagagt 2220
cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280
tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340
tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400
ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460
tatctggaga tccttgatta atttgaacaa gagctacctt gggttatgca gtttatgcct 2520
ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580
tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640
gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700
gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760
ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820
ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880
tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940
tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000
tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060
agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120
ccttgattga ggtcaagctg tcgagaaatg gttctcttta cagtggatcc agtcaggatt 3180
ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240
aatggcagta cattaaatgg gtttttcatt ta 3272
<210> 168
<211> 59
<212> DNA
<213> Mus musculus
<400> 168
gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59
<210> 169
<211> 35
<212> DNA
<213> Mus musculus
<400> 169
aacaaaggat gctgggttaa taaattgcct cattc 35
<210> 170
<211> 3167
<212> DNA
<213> Mus musculus
<400> 170
gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60
ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120
accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180
actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240
tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300
gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360
ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420
ttgcctctgc tcccagagta ctggaattaa aggcagggac cactgtatta gccattctga 480
gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540
gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600
ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660
ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720
ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780
tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840
gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900
catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960
cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020
ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080
ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140
ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200
acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260
tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320
acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380
tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440
tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500
atttcttaca tgaattgcac tttgtacatg cttttggata tgggcctagg cttttgcttt 1560
tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620
gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680
ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740
acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800
acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860
tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920
gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980
aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040
atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100
tcttcagtga cttaggatac taatagtatc tgcctcaaaa gtgtatgtgg ttatttttgt 2160
cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220
tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280
agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340
tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400
tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460
ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520
ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580
gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640
agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700
tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760
tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820
tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880
tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940
aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000
gaaagtagct cacagtgggt aaaagccatt tgttgccaat cctaacagcc tgagttcaat 3060
cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120
cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167
<210> 171
<211> 58
<212> DNA
<213> Mus musculus
<400> 171
gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58
<210> 172
<211> 49
<212> DNA
<213> Mus musculus
<400> 172
aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49
<210> 173
<211> 264
<212> DNA
<213> Mus musculus
<400> 173
acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60
gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120
tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180
tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240
cttagcaaga ctaatggtaa atct 264
<210> 174
<211> 71
<212> DNA
<213> Mus musculus
<400> 174
agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60
ctttacatgg c 71
<210> 175
<211> 56
<212> DNA
<213> Mus musculus
<400> 175
aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56
<210> 176
<211> 38
<212> DNA
<213> Mus musculus
<400> 176
ttgtgtatgc gttaataaaa agaaggaact cgtactta 38
<210> 177
<211> 92
<212> DNA
<213> Mus musculus
<400> 177
tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60
ataaagcatt tatattaatt cttgtctaga aa 92
<210> 178
<211> 91
<212> DNA
<213> Mus musculus
<400> 178
gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60
acacaaagaa taaaaatgtg aagaacttta a 91
<210> 179
<211> 1187
<212> DNA
<213> Mus musculus
<400> 179
tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60
aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120
aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180
gcattatctg cttatgagat taagtgtata tagtgtttgt gccaagtggt gttctgtgtg 240
taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300
tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360
gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420
caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480
atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540
gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600
ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660
gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720
gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780
agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840
ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900
aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960
gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020
ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080
ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140
agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187
<210> 180
<211> 43
<212> DNA
<213> Mus musculus
<400> 180
gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43
<210> 181
<211> 259
<212> DNA
<213> Mus musculus
<400> 181
ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60
gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120
cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180
ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240
gtggaattcc ttcattttg 259
<210> 182
<211> 48
<212> DNA
<213> Mus musculus
<400> 182
acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48
<210> 183
<211> 67
<212> DNA
<213> Mus musculus
<400> 183
aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60
ttcgctt 67
<210> 184
<211> 33
<212> DNA
<213> Mus musculus
<400> 184
gatgctccaa taaacctcac tgctgccact cag 33
<210> 185
<211> 36
<212> DNA
<213> Mus musculus
<400> 185
gatgacaacg acaataaagt gcgagactga ctggct 36
<210> 186
<211> 388
<212> DNA
<213> Mus musculus
<400> 186
acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60
gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120
agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180
ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240
attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300
agcactgcct tgctccttcc cagcagacca caaagcagta tttttctgga ggattttatg 360
tgctaataaa ttatttgact taagtgtg 388
<210> 187
<211> 32
<212> DNA
<213> Mus musculus
<400> 187
tgaaccctcc cccaataaaa gatggttcct ac 32
<210> 188
<211> 103
<212> DNA
<213> Mus musculus
<400> 188
gcagattttg ttatgaagac aataaaatct tgacctttca acccctttga ttgcagttgt 60
tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103
<210> 189
<211> 277
<212> DNA
<213> Mus musculus
<400> 189
gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60
caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120
tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180
tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240
ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277
<210> 190
<211> 44
<212> DNA
<213> Mus musculus
<400> 190
gtctctgggc ctttgctgtt aataaatagt ttatatacct atga 44
<210> 191
<211> 404
<212> DNA
<213> Mus musculus
<400> 191
aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60
tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120
ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180
caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240
agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300
ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360
attgattttt attgaacact gagtgttttg aggttttatt tttt 404
<210> 192
<211> 39
<212> DNA
<213> Mus musculus
<400> 192
agttcaggag ctaataaagt acgtcctttg gctaatccg 39
<210> 193
<211> 48
<212> DNA
<213> Mus musculus
<400> 193
atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48
<210> 194
<211> 36
<212> DNA
<213> Mus musculus
<400> 194
tctgttatgc catattttca ataaacctga aaacaa 36
<210> 195
<211> 875
<212> DNA
<213> Mus musculus
<400> 195
gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60
agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120
ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180
tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240
gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300
cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360
ccagattggg attttgtgtc ccaggaacaa agttaatgct aaaaagttaa tgccttggtg 420
agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480
cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540
gtgggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600
gaattcaagg acagtacctg gttaaatgtt tttctagctt ttctaaaaag tttgttaggc 660
ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720
ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780
aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840
agacattaaa ttgtgtcatt acttctccag gtact 875
<210> 196
<211> 67
<212> DNA
<213> Mus musculus
<400> 196
agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60
gagcagc 67
<210> 197
<211> 50
<212> DNA
<213> Mus musculus
<400> 197
gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50
<210> 198
<211> 84
<212> DNA
<213> Mus musculus
<400> 198
ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60
agaaaataaa agtcatttca ctct 84
<210> 199
<211> 36
<212> DNA
<213> Mus musculus
<400> 199
tctgttatgc catattttca ataaacctga aaacaa 36
<210> 200
<211> 446
<212> DNA
<213> Mus musculus
<400> 200
ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60
acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120
agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180
aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240
gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300
actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360
gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420
aaattagatt atttcttttt tcaatc 446
<210> 201
<211> 332
<212> DNA
<213> Mus musculus
<400> 201
ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60
tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120
cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180
ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240
actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300
ttatagagaa ttaaacatga aaattacatc tc 332
<210> 202
<211> 80
<212> DNA
<213> Mus musculus
<400> 202
aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60
aagttactgt taatgatacc 80
<210> 203
<211> 93
<212> DNA
<213> Mus musculus
<400> 203
gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60
gttcaataaa gtcctgaggc aactctctct gtc 93
<210> 204
<211> 152
<212> DNA
<213> Mus musculus
<400> 204
tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60
ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120
ttggtgtcag tttttcaata aagttttaat ta 152
<210> 205
<211> 1841
<212> DNA
<213> Mus musculus
<400> 205
agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60
tcaagtatct tcagagaaga ttattttctg ccttcagaaa ctgaaggaag gcttgggcct 120
agagaacgac agtaaggtgc gagcaccgga gacacttaac acagctcagt ccatggaagg 180
acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240
ccctgctcat cctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300
tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360
catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420
ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480
tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540
cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600
ctgaagttta atcacttgtc ttctattaaa aactagtgtt tgcctgggcc tggtgtgtat 660
acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720
caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780
taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840
gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900
ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960
gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020
gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080
gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140
actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200
tggaatttaa aacaagcttt tttctatata gtaaaagatt gtttttaaga tttttgcgtg 1260
tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320
atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380
ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg ccagccaggg 1440
ttacagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500
taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560
ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620
tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgagggggcc 1680
caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740
accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800
aagacagcta cagtgtactt acataaaata aataaatctt t 1841
<210> 206
<211> 2035
<212> DNA
<213> Artificial Sequence
<220>
<223> sequence encoding the mRNA rpl32 - PpLuc(GC) - albumin - A64 -
C30 - histoneSL
<400> 206
ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60
gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120
ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180
accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240
ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300
gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360
gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420
ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480
ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540
tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600
ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660
ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720
cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780
ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840
gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900
cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960
aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020
gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080
accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140
ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200
ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260
aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320
atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380
aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440
aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500
gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560
gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620
ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680
aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740
taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800
tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860
cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980
cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035
Claims (77)
- a. 적어도 하나의 오픈 리딩 프레임(ORF); 및
b. 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소)
를 포함하는 인공 핵산 분자. - 제1항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 상기 인공 핵산 분자로부터 단백질 생산을 증진, 안정 및/또는 연장시키는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 또는 제2항에 있어서, 상기 3'-UTR은 ORF에 이종 기원(heterologous)인 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자, 또는 설치류 리보좀 단백질 유전자, 특히 쥣과 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리포터 유전자를 코딩하지 않거나 리포터 유전자로부터 유도되지 않으며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체로 이루어진 그룹으로부터 선택되지 않으며, 바람직하게 EGFP, 또는 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질에 적어도 70% 서열 상동성을 보이는 변이체가 아닌 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질을 코딩하지 않으며, 바람직하게 진핵생물 리보좀 단백질을 코딩하지 않는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 인간 또는 식물 리보좀 단백질, 특히 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 3'-UTR은 바이러스로부터 유도되지 않는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 3'-UTR, 바람직하게 인공 핵산 분자는 폴리(A) 서열 또는 폴리아데닐화 신호를 포함하지 않으며,
또는
상기 3'-UTR, 바람직하게 인공 핵산 분자는 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가로 포함하는 것을 특징으로 하는 인공 핵산 분자. - 제10항에 있어서, 상기 폴리(A) 서열 또는 폴리아데닐화 신호는 3'-UTR 요소에 3'-말단에 위치한 것을 특징으로 하는 인공 핵산 분자.
- 제10항 또는 제11항에 있어서, 상기 폴리아데닐화 신호는 N=A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함하는 것을 특징으로 하는 인공 핵산 분자.
- 제10항 내지 제12항 중 어느 한 항에 있어서, 상기 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 3'UTR 요소의 3'-말단의 약 50개 미만의 뉴클레오티드 다운스트림에 위치한 것을 특징으로 하는 인공 핵산 분자.
- 제10항 내지 제13항 중 어느 한 항에 있어서, 상기 폴리(A) 서열은 약 20 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 50 내지 약 100개 아데닌 뉴클레오티드, 더욱 더 바람직하게 약 60 내지 약 70개 아데닌 뉴클레오티드의 길이를 갖는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 핵산은 추가적인 5'-말단 요소, 바람직하게 5'-UTR, 프로모터, 또는 5'-UTR 및 프로모터 포함-서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
- 제15항에 있어서, 상기 5'-UTR은 5'-TOP UTR인 것을 특징으로 하는 인공 핵산 분자.
- 제15항 또는 제16항에 있어서, 상기 5'-UTR은 5'TOP 모티프를 포함하지 않는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 5'-UTR을 추가로 포함하며, 상기 3'-UTR, ORF 및 5'-UTR 모두는 서로 이종 기원인 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 리보좀 단백질 L9 (RPL9), 리보좀 단백질 L3 (RPL3), 리보좀 단백질 L4 (RPL4), 리보좀 단백질 L5 (RPL5), 리보좀 단백질 L6 (RPL6), 리보좀 단백질 L7 (RPL7), 리보좀 단백질 L7a (RPL7A), 리보좀 단백질 L11 (RPL11), 리보좀 단백질 L12 (RPL12), 리보좀 단백질 L13 (RPL13), 리보좀 단백질 L23 (RPL23), 리보좀 단백질 L18 (RPL18), 리보좀 단백질 L18a (RPL18A), 리보좀 단백질 L19 (RPL19), 리보좀 단백질 L21 (RPL21), 리보좀 단백질 L22 (RPL22), 리보좀 단백질 L23a (RPL23A), 리보좀 단백질 L17 (RPL17), 리보좀 단백질 L24 (RPL24), 리보좀 단백질 L26 (RPL26), 리보좀 단백질 L27 (RPL27), 리보좀 단백질 L30 (RPL30), 리보좀 단백질 L27a (RPL27A), 리보좀 단백질 L28 (RPL28), 리보좀 단백질 L29 (RPL29), 리보좀 단백질 L31 (RPL31), 리보좀 단백질 L32 (RPL32), 리보좀 단백질 L35a (RPL35A), 리보좀 단백질 L37 (RPL37), 리보좀 단백질 L37a (RPL37A), 리보좀 단백질 L38 (RPL38), 리보좀 단백질 L39 (RPL39), 리보좀 단백질, 라지, P0 (RPLP0), 리보좀 단백질, 라지, P1 (RPLP1), 리보좀 단백질, 라지, P2 (RPLP2), 리보좀 단백질 S3 (RPS3), 리보좀 단백질 S3A (RPS3A), X-연결된 리보좀 단백질 S4 (RPS4X), Y-연결된 1 리보좀 단백질 S4 (RPS4Y1), 리보좀 단백질 S5 (RPS5), 리보좀 단백질 S6 (RPS6), 리보좀 단백질 S7 (RPS7), 리보좀 단백질 S8 (RPS8), 리보좀 단백질 S9 (RPS9), 리보좀 단백질 S10 (RPS10), 리보좀 단백질 S11 (RPS11), 리보좀 단백질 S12 (RPS12), 리보좀 단백질 S13 (RPS13), 리보좀 단백질 S15 (RPS15), 리보좀 단백질 S15a (RPS15A), 리보좀 단백질 S16 (RPS16), 리보좀 단백질 S19 (RPS19), 리보좀 단백질 S20 (RPS20), 리보좀 단백질 S21 (RPS21), 리보좀 단백질 S23 (RPS23), 리보좀 단백질 S25 (RPS25), 리보좀 단백질 S26 (RPS26), 리보좀 단백질 S27 (RPS27), 리보좀 단백질 S27a (RPS27a), 리보좀 단백질 S28 (RPS28), 리보좀 단백질 S29 (RPS29), 리보좀 단백질 L15 (RPL15), 리보좀 단백질 S2 (RPS2), 리보좀 단백질 L14 (RPL14), 리보좀 단백질 S14 (RPS14), 리보좀 단백질 L10 (RPL10), 리보좀 단백질 L10a (RPL10A), 리보좀 단백질 L35 (RPL35), 리보좀 단백질 L13a (RPL13A), 리보좀 단백질 L36 (RPL36), 리보좀 단백질 L36a (RPL36A), 리보좀 단백질 L41 (RPL41), 리보좀 단백질 S18 (RPS18), 리보좀 단백질 S24 (RPS24), 리보좀 단백질 L8 (RPL8), 리보좀 단백질 L34 (RPL34), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된(ubiquitously expressed) (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자(pseudogene) (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로 이루어진 군으로부터 선택된 서열의 3'-UTR로부터 유도된 핵산 서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 1, 2, 3, 4, 5, 10, 15, 20, 30 또는 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 또는 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 핵산 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성된 것을 특징으로 하는 인공 핵산 분자.
- 제20항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 5'-캡 구조, 폴리(C) 서열, 히스톤 스템-루프, 및/또는 IRES-모티프를 추가로 포함하는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 히스톤 스템-루프는 SEQ ID NO: 5에 따른 서열을 포함하는 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 인공 핵산 분자, 바람직하게 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되고, 바람직하게 상기 오픈 리딩 프레임의 G/C 함량은 야생형 오픈 리딩 프레임에 비해 증가된 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임은 코돈 최적화된 영역을 포함하며, 바람직하게, 상기 오픈 리딩 프레임은 코돈 최적화된 것을 특징으로 하는 인공 핵산 분자.
- 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 RNA, 바람직하게 mRNA 분자인 것을 특징으로 하는 인공 핵산 분자.
- a. 오픈 리딩 프레임 및/또는 클로닝 부위; 및
b. 리보좀 단백질 유전자의 3'-UTR로부터 또는 리보좀 단백질 유전자의 3'-UTR의 변이체로부터 유도된 핵산 서열을 포함하는 적어도 하나의 3'-비번역된 영역 요소(3'-UTR 요소)
를 포함하는 벡터. - 제28항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 벡터.
- 제28항 또는 제29항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리포터 유전자를 코딩하지 않거나 리포터 유전자로부터 유도되지 않으며, 상기 리포터 유전자는 바람직하게 글로빈 단백질(특히 베타-글로빈), 루시퍼라제 단백질, 베타-글루쿠로니다제(GUS) 및 GFP 단백질 또는 이의 변이체로 이루어진 그룹으로부터 선택되지 않으며, 바람직하게 EGFP, 또는 글로빈 단백질, 루시퍼라제 단백질, 또는 GFP 단백질에 적어도 70% 서열 상동성을 보이는 변이체가 아닌 것을 특징으로 하는 벡터.
- 제28항 내지 제30항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 인간 리보좀 단백질 S6(RPS6), 인간 리보좀 단백질 L36a-유사(RPL36AL) 또는 아라비답시스 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 벡터.
- 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질 S6(RPS6), 리보좀 단백질 L36a-유사(RPL36AL) 또는 리보좀 단백질 S16(RPS16)을 코딩하지 않는 것을 특징으로 하는 벡터.
- 제28항 내지 제32항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임(ORF)은 리보좀 단백질 유전자를 코딩하지 않으며, 바람직하게 진핵생물 리보좀 단백질 유전자를 코딩하지 않는 것을 특징으로 하는 벡터.
- 제28항 내지 제33항 중 어느 한 항에 있어서, 상기 3'-UTR은 바이러스로부터 유도되지 않는 것을 특징으로 하는 벡터.
- 제28항 내지 제34항 중 어느 한 항에 있어서, 상기 벡터는 추가적인 5'-요소, 바람직하게 5'-UTR, 프로모터, 또는 5'-UTR 및 프로모터 포함-서열을 포함하는 것을 특징으로 하는 벡터.
- 제35항에 있어서, 상기 5'-UTR은 5'-TOP UTR인 것을 특징으로 하는 벡터.
- 제35항 또는 제36항에 있어서, 상기 5'-UTR은 5' TOP 모티프를 포함하지 않는 것을 특징으로 하는 벡터.
- 제28항 내지 제37항 중 어느 한 항에 있어서, 상기 3'-UTR은 ORF에 이종 기원인 것을 특징으로 하는 벡터.
- 제28항 내지 제38항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 5'-UTR을 추가로 포함하며, 상기 3'-UTR, ORF 및 5'-UTR 모두는 서로 이종 기원인 것을 특징으로 하는 벡터.
- 제28항 내지 제39항 중 어느 한 항에 있어서, 상기 3'-UTR, 바람직하게 벡터는 폴리(A) 서열 또는 폴리아데닐화 신호를 포함하지 않으며,
또는
상기 3'-UTR, 바람직하게 벡터는 폴리(A) 서열 및/또는 폴리아데닐화 신호를 추가로 포함하는 것을 특징으로 하는 벡터. - 제40항에 있어서, 상기 폴리(A) 서열 또는 폴리아데닐화 신호는 3'-UTR 요소의 3'에 위치한 것을 특징으로 하는 벡터.
- 제40항 또는 제41항에 있어서, 상기 폴리아데닐화 신호는 N = A 또는 U인 공통 서열 NN(U/T)ANA, 바람직하게 AA(U/T)AAA 또는 A(U/T)(U/T)AAA를 포함하는 것을 특징으로 하는 벡터.
- 제40항 내지 제42항 중 어느 한 항에 있어서, 상기 폴리아데닐화 신호, 바람직하게 공통 서열 NNUANA는 3'-UTR 요소의 3'-말단에 약 50개 미만의 뉴클레오티드 다운스트림에 위치한 것을 특징으로 하는 벡터.
- 제40항 내지 제43항 중 어느 한 항에 있어서, 상기 폴리(A) 서열은 약 20 내지 약 300개 아데닌 뉴클레오티드, 바람직하게 약 40 내지 약 200개 아데닌 뉴클레오티드, 더욱 바람직하게 약 50 내지 약 100개 아데닌 뉴클레오티드, 더욱 더 바람직하게 약 60 내지 약 70개 아데닌 뉴클레오티드의 길이를 갖는 것을 특징으로 하는 벡터.
- 제28항 내지 제44항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 리보좀 단백질 L9 (RPL9), 리보좀 단백질 L3 (RPL3), 리보좀 단백질 L4 (RPL4), 리보좀 단백질 L5 (RPL5), 리보좀 단백질 L6 (RPL6), 리보좀 단백질 L7 (RPL7), 리보좀 단백질 L7a (RPL7A), 리보좀 단백질 L11 (RPL11), 리보좀 단백질 L12 (RPL12), 리보좀 단백질 L13 (RPL13), 리보좀 단백질 L23 (RPL23), 리보좀 단백질 L18 (RPL18), 리보좀 단백질 L18a (RPL18A), 리보좀 단백질 L19 (RPL19), 리보좀 단백질 L21 (RPL21), 리보좀 단백질 L22 (RPL22), 리보좀 단백질 L23a (RPL23A), 리보좀 단백질 L17 (RPL17), 리보좀 단백질 L24 (RPL24), 리보좀 단백질 L26 (RPL26), 리보좀 단백질 L27 (RPL27), 리보좀 단백질 L30 (RPL30), 리보좀 단백질 L27a (RPL27A), 리보좀 단백질 L28 (RPL28), 리보좀 단백질 L29 (RPL29), 리보좀 단백질 L31 (RPL31), 리보좀 단백질 L32 (RPL32), 리보좀 단백질 L35a (RPL35A), 리보좀 단백질 L37 (RPL37), 리보좀 단백질 L37a (RPL37A), 리보좀 단백질 L38 (RPL38), 리보좀 단백질 L39 (RPL39), 리보좀 단백질, 라지, P0 (RPLP0), 리보좀 단백질, 라지, P1 (RPLP1), 리보좀 단백질, 라지, P2 (RPLP2), 리보좀 단백질 S3 (RPS3), 리보좀 단백질 S3A (RPS3A), X-연결된 리보좀 단백질 S4 (RPS4X), Y-연결된 1 리보좀 단백질 S4 (RPS4Y1), 리보좀 단백질 S5 (RPS5), 리보좀 단백질 S6 (RPS6), 리보좀 단백질 S7 (RPS7), 리보좀 단백질 S8 (RPS8), 리보좀 단백질 S9 (RPS9), 리보좀 단백질 S10 (RPS10), 리보좀 단백질 S11 (RPS11), 리보좀 단백질 S12 (RPS12), 리보좀 단백질 S13 (RPS13), 리보좀 단백질 S15 (RPS15), 리보좀 단백질 S15a (RPS15A), 리보좀 단백질 S16 (RPS16), 리보좀 단백질 S19 (RPS19), 리보좀 단백질 S20 (RPS20), 리보좀 단백질 S21 (RPS21), 리보좀 단백질 S23 (RPS23), 리보좀 단백질 S25 (RPS25), 리보좀 단백질 S26 (RPS26), 리보좀 단백질 S27 (RPS27), 리보좀 단백질 S27a (RPS27a), 리보좀 단백질 S28 (RPS28), 리보좀 단백질 S29 (RPS29), 리보좀 단백질 L15 (RPL15), 리보좀 단백질 S2 (RPS2), 리보좀 단백질 L14 (RPL14), 리보좀 단백질 S14 (RPS14), 리보좀 단백질 L10 (RPL10), 리보좀 단백질 L10a (RPL10A), 리보좀 단백질 L35 (RPL35), 리보좀 단백질 L13a (RPL13A), 리보좀 단백질 L36 (RPL36), 리보좀 단백질 L36a (RPL36A), 리보좀 단백질 L41 (RPL41), 리보좀 단백질 S18 (RPS18), 리보좀 단백질 S24 (RPS24), 리보좀 단백질 L8 (RPL8), 리보좀 단백질 L34 (RPL34), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 SA (RPSA), 유비퀴틴A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된 (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자 (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로 이루어진 군으로부터 선택된 서열의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 벡터.
- 제28항 내지 제45항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 또는 상기 적어도 하나의 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성된 것을 특징으로 하는 벡터.
- 제46항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 벡터.
- 제28항 내지 제47항 중 어느 한 항에 있어서, 상기 적어도 하나의 3'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 벡터.
- 제28항 내지 제48항 중 어느 한 항에 있어서, 상기 벡터는 폴리(C) 서열, 히스톤 스템-루프, 및/또는 IRES-모티프를 추가로 포함하는 것을 특징으로 하는 벡터.
- 제28항 내지 제49항 중 어느 한 항에 있어서, 상기 벡터는 적어도 부분적으로 G/C 변형되고, 바람직하게 상기 오픈 리딩 프레임은 적어도 부분적으로 G/C 변형되며, 바람직하게 상기 오픈 리딩 프레임의 G/C 함량은 야생형 오픈 리딩 프레임에 비해 증가된 것을 특징으로 하는 벡터.
- 제28항 내지 제50항 중 어느 한 항에 있어서, 상기 오픈 리딩 프레임은 코돈 최적화된 영역을 포함하며, 바람직하게, 상기 오픈 리딩 프레임은 코돈 최적화된 것을 특징으로 하는 벡터.
- 제28항 내지 제51항 중 어느 한 항에 있어서, 상기 벡터는 DNA 벡터인 것을 특징으로 하는 벡터.
- 제28항 내지 제52항 중 어느 한 항에 있어서, 상기 벡터는 플라스미드 벡터 또는 바이러스 벡터, 바람직하게 플라스미드 벡터인 것을 특징으로 하는 벡터.
- 제28항 내지 제53항 중 어느 한 항에 있어서, 상기 벡터는 제1항 내지 제25항 중 어느 한 항에 따른 인공 핵산 분자를 포함하는 것을 특징으로 하는 벡터.
- 제28항 내지 제54항 중 어느 한 항에 있어서, 상기 벡터는 원형 분자인 것을 특징으로 하는 벡터.
- 제55항에 있어서, 코딩 가닥(strand)의 폴리(A) 서열, 폴리(C) 서열, 히스톤 스템 루프 또는 3'-UTR 요소는 선형 벡터 분자의 선형화를 위한 제한 부위에 의해 5'→3' 방향에 따르는 것을 특징으로 하는 벡터.
- 제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자 또는 제28항 내지 제56항 중 어느 한 항에 따른 벡터를 포함하는 세포.
- 제57항에 있어서, 상기 세포는 포유동물 세포인 것을 특징으로 하는 세포.
- 제57항 또는 제58항에 있어서, 상기 세포는 포유동물 개체의 세포, 바람직하게 포유동물 개체, 바람직하게 인간 개체의 분리된 세포인 것을 특징으로 하는 세포.
- 제1항 내지 제27항 중 어느 한 항에 따르는 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따르는 벡터, 또는 제57항 내지 제59항 중 어느 한 항에 따르는 세포를 포함하는 약학적 조성물.
- 제60항에 있어서, 상기 약학적 조성물은 하나 이상의 약학적으로 허용 가능한 담체, 희석제 및/또는 부형제 및/또는 하나 이상의 어쥬번트를 추가로 포함하는 것을 특징으로 하는 약학적 조성물.
- 제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 또는 제60항 또는 제61항에 따른 약학적 조성물의 약제(medicament)로서의 용도.
- 제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 또는 제60항 또는 제61항에 따른 약학적 조성물의 백신으로서 또는 유전자 치료를 위한 용도.
- 제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 또는 제60항 또는 제61항에 따른 약학적 조성물을 필요한 개체에 투여하는 단계를 포함하는 질환의 치료 또는 예방 방법.
- 제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자 또는 제28항 내지 제56항 중 어느 한 항에 따른 벡터와 함께 세포의 형질전환을 포함하는 장애(disorder)의 치료 또는 예방 방법.
- 제65항에 있어서, 상기 세포의 형질전환은 인비트로(in vitro)/엑스비보(ex vivo)로 수행되며, 형질전환된 세포는 필요한 개체, 바람직하게 인간 환자에 투여되는 것을 특징으로 하는 방법.
- 제66항에 있어서, 상기 인비트로(in vitro) 형질전환되는 세포는 개체, 바람직하게 인간 환자의 분리된 세포인 것을 특징으로 하는 방법.
- 제64항 내지 제67항 중 어느 한 항에 있어서, 상기 방법은 백신 접종 방법 또는 유전자 치료 방법인 것을 특징으로 하는 방법.
- 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 3'-UTR 요소와 함께 핵산 분자, 바람직하게 mRNA 분자 또는 벡터를 회합(associating)하는 단계를 포함하는, 인공 핵산 분자, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증진, 안정 및/또는 연장시키는 방법.
- 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되며, 핵산 분자, 바람직하게 mRNA 분자 또는 벡터로부터 단백질 생산을 증진, 안정 및/또는 연장시키기 위한 3'-UTR 요소의 용도.
- 제69항 또는 제70항에 있어서, 상기 3'-UTR 요소는 진핵생물 리보좀 단백질 유전자의 3'-UTR로부터, 바람직하게 척추동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 바람직하게 포유동물 리보좀 단백질 유전자의 3'-UTR로부터, 더욱 더 바람직하게 영장류 리보좀 단백질 유전자, 특히 인간 리보좀 단백질 유전자의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 제69항에 따른 방법 또는 제70항에 따른 용도.
- 제69항 내지 제71항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 리보좀 단백질 L9 (RPL9), 리보좀 단백질 L3 (RPL3), 리보좀 단백질 L4 (RPL4), 리보좀 단백질 L5 (RPL5), 리보좀 단백질 L6 (RPL6), 리보좀 단백질 L7 (RPL7), 리보좀 단백질 L7a (RPL7A), 리보좀 단백질 L11 (RPL11), 리보좀 단백질 L12 (RPL12), 리보좀 단백질 L13 (RPL13), 리보좀 단백질 L23 (RPL23), 리보좀 단백질 L18 (RPL18), 리보좀 단백질 L18a (RPL18A), 리보좀 단백질 L19 (RPL19), 리보좀 단백질 L21 (RPL21), 리보좀 단백질 L22 (RPL22), 리보좀 단백질 L23a (RPL23A), 리보좀 단백질 L17 (RPL17), 리보좀 단백질 L24 (RPL24), 리보좀 단백질 L26 (RPL26), 리보좀 단백질 L27 (RPL27), 리보좀 단백질 L30 (RPL30), 리보좀 단백질 L27a (RPL27A), 리보좀 단백질 L28 (RPL28), 리보좀 단백질 L29 (RPL29), 리보좀 단백질 L31 (RPL31), 리보좀 단백질 L32 (RPL32), 리보좀 단백질 L35a (RPL35A), 리보좀 단백질 L37 (RPL37), 리보좀 단백질 L37a (RPL37A), 리보좀 단백질 L38 (RPL38), 리보좀 단백질 L39 (RPL39), 리보좀 단백질, 라지, P0 (RPLP0), 리보좀 단백질, 라지, P1 (RPLP1), 리보좀 단백질, 라지, P2 (RPLP2), 리보좀 단백질 S3 (RPS3), 리보좀 단백질 S3A (RPS3A), X-연결된 리보좀 단백질 S4 (RPS4X), Y-연결된 1 리보좀 단백질 S4 (RPS4Y1), 리보좀 단백질 S5 (RPS5), 리보좀 단백질 S6 (RPS6), 리보좀 단백질 S7 (RPS7), 리보좀 단백질 S8 (RPS8), 리보좀 단백질 S9 (RPS9), 리보좀 단백질 S10 (RPS10), 리보좀 단백질 S11 (RPS11), 리보좀 단백질 S12 (RPS12), 리보좀 단백질 S13 (RPS13), 리보좀 단백질 S15 (RPS15), 리보좀 단백질 S15a (RPS15A), 리보좀 단백질 S16 (RPS16), 리보좀 단백질 S19 (RPS19), 리보좀 단백질 S20 (RPS20), 리보좀 단백질 S21 (RPS21), 리보좀 단백질 S23 (RPS23), 리보좀 단백질 S25 (RPS25), 리보좀 단백질 S26 (RPS26), 리보좀 단백질 S27 (RPS27), 리보좀 단백질 S27a (RPS27a), 리보좀 단백질 S28 (RPS28), 리보좀 단백질 S29 (RPS29), 리보좀 단백질 L15 (RPL15), 리보좀 단백질 S2 (RPS2), 리보좀 단백질 L14 (RPL14), 리보좀 단백질 S14 (RPS14), 리보좀 단백질 L10 (RPL10), 리보좀 단백질 L10a (RPL10A), 리보좀 단백질 L35 (RPL35), 리보좀 단백질 L13a (RPL13A), 리보좀 단백질 L36 (RPL36), 리보좀 단백질 L36a (RPL36A), 리보좀 단백질 L41 (RPL41), 리보좀 단백질 S18 (RPS18), 리보좀 단백질 S24 (RPS24), 리보좀 단백질 L8 (RPL8), 리보좀 단백질 L34 (RPL34), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 SA (RPSA), 유비퀴틴 A-52 잔기 리보좀 단백질 융합 산물 1 (UBA52), Finkel-Biskis-Reilly 쥣과 육종 바이러스 (FBR-MuSV) 흔하게 발현된 (FAU), 리보좀 단백질 L22-유사 1 (RPL22L1), 리보좀 단백질 S17 (RPS17), 리보좀 단백질 L39-유사 (RPL39L), 리보좀 단백질 L10-유사 (RPL10L), 리보좀 단백질 L36a-유사 (RPL36AL), 리보좀 단백질 L3-유사 (RPL3L), 리보좀 단백질 S27-유사 (RPS27L), 리보좀 단백질 L26-유사 1 (RPL26L1), 리보좀 단백질 L7-유사 1 (RPL7L1), 리보좀 단백질 L13a 위유전자 (RPL13AP), 리보좀 단백질 L37a 위유전자 8 (RPL37AP8), 리보좀 단백질 S10 위유전자 5 (RPS10P5), 리보좀 단백질 S26 위유전자 11 (RPS26P11), 리보좀 단백질 L39 위유전자 5 (RPL39P5), 리보좀 단백질, 라지, P0 위유전자 6 (RPLP0P6) 및 리보좀 단백질 L36 위유전자 14 (RPL36P14)로 이루어진 군으로부터 선택된 서열의 3'-UTR로부터 유도된 핵산 서열을 포함하거나 이로 구성되는 것을 특징으로 하는 방법 또는 용도.
- 제69항 내지 제72항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 또는 상기 3'-UTR 요소는 SEQ ID NOs: 10 내지 205로 이루어진 그룹으로부터 선택된 서열에 적어도 약 40%, 바람직하게 적어도 약 50%, 바람직하게 적어도 약 60%, 바람직하게 적어도 약 70%, 더욱 바람직하게 적어도 약 80%, 더욱 바람직하게 적어도 약 90%, 더욱 더 바람직하게 적어도 약 95%, 더욱 더 바람직하게 적어도 약 99%의 상동성을 갖는 핵산 서열의 절편을 포함하거나 이로 구성된 것을 특징으로 하는 방법 또는 용도.
- 제73항에 있어서, 상기 절편은 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 방법 또는 용도.
- 제69항 내지 제73항 중 어느 한 항에 있어서, 상기 3'-UTR 요소는 3 내지 약 500개 뉴클레오티드, 바람직하게 5 내지 약 150개 뉴클레오티드, 더욱 바람직하게 10 내지 100개 뉴클레오티드, 더욱 더 바람직하게 15 내지 90개, 가장 바람직하게 20 내지 70개의 길이를 나타내는 것을 특징으로 하는 방법 또는 용도.
- 제1항 내지 제27항 중 어느 한 항에 따른 인공 핵산 분자, 제28항 내지 제56항 중 어느 한 항에 따른 벡터, 제57항 내지 제59항 중 어느 한 항에 따른 세포, 및/또는 제60항 또는 제61항에 따른 약학적 조성물을 포함하는 키트 또는 일부(parts)의 키트.
- 제76항에 있어서, 상기 키트는 사용을 위한 지침(instructions), 형질전환을 위한 세포, 어쥬번트, 약학적 조성물의 투여를 위한 수단, 약학적으로 허용 가능한 담체 및/또는 인공 핵산 분자, 벡터, 세포 또는 약학적 조성물의 용해 또는 희석을 위한 약학적으로 허용 가능한 용액을 추가적으로 포함하는 것을 특징으로 하는 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EPPCT/EP2013/003946 | 2013-12-30 | ||
EP2013003946 | 2013-12-30 | ||
PCT/EP2014/003480 WO2015101414A2 (en) | 2013-12-30 | 2014-12-30 | Artificial nucleic acid molecules |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160104062A true KR20160104062A (ko) | 2016-09-02 |
KR102399799B1 KR102399799B1 (ko) | 2022-05-18 |
Family
ID=49920310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167020951A KR102399799B1 (ko) | 2013-12-30 | 2014-12-30 | 인공 핵산 분자 |
Country Status (13)
Country | Link |
---|---|
US (2) | US10047375B2 (ko) |
JP (2) | JP6704850B2 (ko) |
KR (1) | KR102399799B1 (ko) |
CN (2) | CN105874072A (ko) |
AU (1) | AU2014375402B2 (ko) |
BR (1) | BR112016014462A2 (ko) |
CA (1) | CA2927862C (ko) |
DK (1) | DK3090053T3 (ko) |
ES (1) | ES2712092T3 (ko) |
MX (2) | MX2016008551A (ko) |
RU (1) | RU2717986C2 (ko) |
SG (2) | SG10201903381TA (ko) |
WO (1) | WO2015101414A2 (ko) |
Families Citing this family (169)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012116714A1 (en) | 2011-03-02 | 2012-09-07 | Curevac Gmbh | Vaccination in elderly patients |
WO2012135805A2 (en) | 2011-03-31 | 2012-10-04 | modeRNA Therapeutics | Delivery and formulation of engineered nucleic acids |
KR102128248B1 (ko) | 2011-06-08 | 2020-07-01 | 샤이어 휴먼 지네틱 테라피즈 인크. | Mrna 전달을 위한 지질 나노입자 조성물 및 방법 |
WO2013120497A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein |
RU2658490C2 (ru) * | 2012-03-27 | 2018-06-21 | Кьюрвак Аг | Искусственные молекулы нуклеиновых кислот для улучшенной экспрессии белков или пептидов |
SG11201405545XA (en) * | 2012-03-27 | 2014-11-27 | Curevac Gmbh | Artificial nucleic acid molecules comprising a 5'top utr |
EA201492055A1 (ru) | 2012-06-08 | 2015-11-30 | Шир Хьюман Дженетик Терапис, Инк. | ИНГАЛЯЦИОННАЯ ДОСТАВКА мРНК В НЕЛЕГОЧНЫЕ КЛЕТКИ-МИШЕНИ |
DK2958588T3 (da) | 2013-02-22 | 2017-11-20 | Curevac Ag | Kombination af vaccination og hæmning af PD-1-reaktionsvejen |
AU2014239184B2 (en) | 2013-03-14 | 2018-11-08 | Translate Bio, Inc. | Methods and compositions for delivering mRNA coded antibodies |
DK2968586T3 (en) | 2013-03-14 | 2018-10-08 | Translate Bio Inc | CFTR MRNA COMPOSITIONS AND RELATED PROCEDURES AND APPLICATIONS |
US11377470B2 (en) | 2013-03-15 | 2022-07-05 | Modernatx, Inc. | Ribonucleic acid purification |
EP3757570B1 (en) | 2013-03-15 | 2023-10-11 | Translate Bio, Inc. | Synergistic enhancement of the delivery of nucleic acids via blended formulations |
EP3971287A1 (en) | 2013-07-11 | 2022-03-23 | ModernaTX, Inc. | Compositions comprising synthetic polynucleotides encoding crispr related proteins and synthetic sgrnas and methods of use |
RU2712743C2 (ru) | 2013-08-21 | 2020-01-30 | Куревак Аг | Вакцина против бешенства |
SG10201801428RA (en) | 2013-08-21 | 2018-03-28 | Curevac Ag | Method for increasing expression of rna-encoded proteins |
BR112016003361A2 (pt) | 2013-08-21 | 2017-11-21 | Curevac Ag | vacina do vírus sincicial respiratório (rsv) |
AU2014310935B2 (en) | 2013-08-21 | 2019-11-21 | CureVac SE | Combination vaccine |
ES2806575T3 (es) | 2013-11-01 | 2021-02-18 | Curevac Ag | ARN modificado con propiedades inmunoestimuladoras disminuidas |
WO2015101415A1 (en) | 2013-12-30 | 2015-07-09 | Curevac Gmbh | Artificial nucleic acid molecules |
SG11201604198YA (en) | 2013-12-30 | 2016-07-28 | Curevac Ag | Methods for rna analysis |
US11254951B2 (en) | 2014-12-30 | 2022-02-22 | Curevac Ag | Artificial nucleic acid molecules |
JP6704850B2 (ja) | 2013-12-30 | 2020-06-03 | キュアバック アーゲー | 人工核酸分子 |
WO2015149944A2 (en) | 2014-04-01 | 2015-10-08 | Curevac Gmbh | Polymeric carrier cargo complex for use as an immunostimulating agent or as an adjuvant |
ES2727776T3 (es) | 2014-06-10 | 2019-10-18 | Curevac Ag | Método para mejorar la producción de ARN |
ES2834556T3 (es) | 2014-06-25 | 2021-06-17 | Acuitas Therapeutics Inc | Lípidos y formulaciones de nanopartículas lipídicas novedosos para la entrega de ácidos nucleicos |
PL3708668T3 (pl) | 2014-12-12 | 2022-12-05 | Curevac Ag | Sztuczne cząsteczki kwasu nukleinowego dla poprawy ekspresji białka |
KR102580696B1 (ko) * | 2014-12-30 | 2023-09-19 | 큐어백 에스이 | 신규 인공 핵산 분자 |
EP4353257A2 (en) | 2015-04-13 | 2024-04-17 | CureVac Manufacturing GmbH | Method for producing rna compositions |
SG11201707663SA (en) | 2015-04-17 | 2017-11-29 | Curevac Ag | Lyophilization of rna |
MX2017013321A (es) | 2015-04-22 | 2018-07-06 | Curevac Ag | Composicion que contiene arn para tratamiento de enfermedades tumorales. |
WO2016174271A1 (en) | 2015-04-30 | 2016-11-03 | Curevac Ag | Immobilized poly(n)polymerase |
DK3294885T3 (da) | 2015-05-08 | 2020-08-10 | Curevac Real Estate Gmbh | Fremgangsmåde til at fremstille rna |
DK3294326T3 (da) | 2015-05-15 | 2021-05-31 | Curevac Ag | Prime-boost-regimer indbefattende indgivelse af mindst én mrna-konstruktion |
CN107635587A (zh) | 2015-05-20 | 2018-01-26 | 库瑞瓦格股份公司 | 包含长链rna的干燥粉末组合物 |
EP3297682B1 (en) | 2015-05-20 | 2021-07-14 | CureVac AG | Dry powder composition comprising long-chain rna |
CN107873055B (zh) | 2015-05-29 | 2021-09-17 | 库瑞瓦格房地产有限公司 | 包括至少一个切向流过滤步骤的产生和纯化rna的方法 |
EP4098743A1 (en) | 2015-05-29 | 2022-12-07 | CureVac AG | Method for adding cap structures to rna using immobilized enzymes |
JP7072386B2 (ja) | 2015-06-29 | 2022-05-20 | アクイタス セラピューティクス インコーポレイテッド | 核酸の送達のための脂質および脂質ナノ粒子製剤 |
US10501768B2 (en) | 2015-07-13 | 2019-12-10 | Curevac Ag | Method of producing RNA from circular DNA and corresponding template DNA |
WO2017036580A1 (en) | 2015-08-28 | 2017-03-09 | Curevac Ag | Artificial nucleic acid molecules |
JP2018527003A (ja) * | 2015-09-17 | 2018-09-20 | モデルナティエックス インコーポレイテッドModernaTX,Inc. | 安定化尾部領域を含むポリヌクレオチド |
HRP20220156T1 (hr) | 2015-09-17 | 2022-04-15 | Modernatx, Inc. | Spojevi i pripravci za unutarstaničnu isporuku terapeutskih sredstava |
WO2017059902A1 (en) * | 2015-10-07 | 2017-04-13 | Biontech Rna Pharmaceuticals Gmbh | 3' utr sequences for stabilization of rna |
US11225682B2 (en) | 2015-10-12 | 2022-01-18 | Curevac Ag | Automated method for isolation, selection and/or detection of microorganisms or cells comprised in a solution |
ES2914225T3 (es) | 2015-10-16 | 2022-06-08 | Modernatx Inc | Análogos de cap de ARNm con enlace de fosfato modificado |
WO2017066791A1 (en) | 2015-10-16 | 2017-04-20 | Modernatx, Inc. | Sugar substituted mrna cap analogs |
CA3001014A1 (en) | 2015-10-16 | 2017-04-20 | Modernatx, Inc. | Mrna cap analogs and methods of mrna capping |
WO2017066789A1 (en) | 2015-10-16 | 2017-04-20 | Modernatx, Inc. | Mrna cap analogs with modified sugar |
WO2017066782A1 (en) | 2015-10-16 | 2017-04-20 | Modernatx, Inc. | Hydrophobic mrna cap analogs |
MA47016A (fr) | 2015-10-22 | 2018-08-29 | Modernatx Inc | Vaccins contre les virus respiratoires |
CN108368028B (zh) | 2015-10-28 | 2021-09-03 | 爱康泰生治疗公司 | 用于递送核酸的新型脂质和脂质纳米颗粒制剂 |
US11413346B2 (en) | 2015-11-09 | 2022-08-16 | Curevac Ag | Rotavirus vaccines |
WO2017109134A1 (en) | 2015-12-22 | 2017-06-29 | Curevac Ag | Method for producing rna molecule compositions |
DK3394030T3 (da) | 2015-12-22 | 2022-03-28 | Modernatx Inc | Forbindelser og sammensætninger til intracellulær afgivelse af midler |
US11248223B2 (en) | 2015-12-23 | 2022-02-15 | Curevac Ag | Method of RNA in vitro transcription using a buffer containing a dicarboxylic acid or tricarboxylic acid or a salt thereof |
EP3405579A1 (en) | 2016-01-22 | 2018-11-28 | Modernatx, Inc. | Messenger ribonucleic acids for the production of intracellular binding polypeptides and methods of use thereof |
MX2018009917A (es) | 2016-02-17 | 2019-08-14 | Curevac Ag | Vacuna contra el virus del zika. |
WO2017149139A1 (en) | 2016-03-03 | 2017-09-08 | Curevac Ag | Rna analysis by total hydrolysis |
KR102475301B1 (ko) | 2016-04-08 | 2022-12-09 | 트랜슬레이트 바이오 인코포레이티드 | 다량체 코딩 핵산 및 그 용도 |
US20190167811A1 (en) | 2016-04-13 | 2019-06-06 | Modernatx, Inc. | Lipid compositions and their uses for intratumoral polynucleotide delivery |
WO2017186928A1 (en) | 2016-04-29 | 2017-11-02 | Curevac Ag | Rna encoding an antibody |
EP3452101A2 (en) | 2016-05-04 | 2019-03-13 | CureVac AG | Rna encoding a therapeutic protein |
EP3452493A1 (en) | 2016-05-04 | 2019-03-13 | CureVac AG | Nucleic acid molecules and uses thereof |
SI3458083T1 (sl) | 2016-05-18 | 2023-03-31 | Modernatx, Inc. | Polinukleotidi, ki kodirajo interlevkin-12 (IL12) in njihova uporaba |
BR112018075479A2 (pt) | 2016-06-09 | 2019-03-19 | Curevac Ag | portadores híbridos para carga de ácido nucleico |
JP2019522047A (ja) | 2016-06-13 | 2019-08-08 | トランスレイト バイオ, インコーポレイテッド | オルニチントランスカルバミラーゼ欠損症治療のためのメッセンジャーrna療法 |
US20200069599A1 (en) | 2016-06-14 | 2020-03-05 | Modernatx, Inc. | Stabilized formulations of lipid nanoparticles |
US11253601B2 (en) | 2016-07-11 | 2022-02-22 | Translate Bio Ma, Inc. | Nucleic acid conjugates and uses thereof |
US11583504B2 (en) | 2016-11-08 | 2023-02-21 | Modernatx, Inc. | Stabilized formulations of lipid nanoparticles |
WO2018096179A1 (en) | 2016-11-28 | 2018-05-31 | Curevac Ag | Method for purifying rna |
EP4035659A1 (en) | 2016-11-29 | 2022-08-03 | PureTech LYT, Inc. | Exosomes for delivery of therapeutic agents |
EP3551193A4 (en) | 2016-12-08 | 2020-08-19 | Modernatx, Inc. | NUCLEIC ACID VACCINES AGAINST RESPIRATORY VIRUSES |
JP2020501545A (ja) | 2016-12-08 | 2020-01-23 | キュアバック アーゲー | 肝疾患の処置または予防のためのrna |
US11542490B2 (en) | 2016-12-08 | 2023-01-03 | CureVac SE | RNAs for wound healing |
WO2018115527A2 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Mers coronavirus vaccine |
WO2018115525A1 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Lassa virus vaccine |
WO2018115507A2 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Henipavirus vaccine |
AU2018224326B2 (en) | 2017-02-27 | 2024-01-04 | Translate Bio, Inc. | Novel codon-optimized CFTR mRNA |
KR20190132405A (ko) | 2017-03-15 | 2019-11-27 | 모더나티엑스, 인크. | 치료제의 세포내 전달을 위한 화합물 및 조성물 |
AU2018234828A1 (en) | 2017-03-15 | 2019-09-19 | Modernatx, Inc. | Lipid nanoparticle formulation |
MA47790A (fr) | 2017-03-17 | 2021-05-05 | Modernatx Inc | Vaccins à base d'arn contre des maladies zoonotiques |
SG11201906297QA (en) | 2017-03-24 | 2019-10-30 | Curevac Ag | Nucleic acids encoding crispr-associated proteins and uses thereof |
US11357856B2 (en) | 2017-04-13 | 2022-06-14 | Acuitas Therapeutics, Inc. | Lipids for delivery of active agents |
EP3618859A4 (en) | 2017-04-27 | 2021-05-05 | Vanderbilt University | HEPATITIS C VIRUS SEQUENCES AND METHODS OF USING THEREFORE |
IL301115A (en) | 2017-04-28 | 2023-05-01 | Acuitas Therapeutics Inc | New lipid carbonyl and lipid nanoparticle formulations for delivery of nucleic acids |
MA49138A (fr) | 2017-05-16 | 2020-03-25 | Translate Bio Inc | Traitement de la fibrose kystique par administration d'arnm à codons optimisés codant pour la cftr |
US20200131498A1 (en) | 2017-06-14 | 2020-04-30 | Modernatx, Inc. | Polynucleotides encoding methylmalonyl-coa mutase |
US20210198200A1 (en) | 2017-06-14 | 2021-07-01 | Modernatx, Inc. | Compounds and compositions for intracellular delivery of agents |
SG11201911430PA (en) | 2017-07-04 | 2020-01-30 | Curevac Ag | Novel nucleic acid molecules |
CA3073020A1 (en) | 2017-08-16 | 2019-02-21 | Acuitas Therapeutics, Inc. | Lipids for use in lipid nanoparticle formulations |
WO2019036028A1 (en) | 2017-08-17 | 2019-02-21 | Acuitas Therapeutics, Inc. | LIPIDS FOR USE IN LIPID NANOPARTICULAR FORMULATIONS |
WO2019036030A1 (en) | 2017-08-17 | 2019-02-21 | Acuitas Therapeutics, Inc. | LIPIDS FOR USE IN LIPID NANOPARTICLE FORMULATIONS |
WO2019036638A1 (en) | 2017-08-18 | 2019-02-21 | Modernatx, Inc. | METHODS FOR PREPARING MODIFIED RNA |
US11602557B2 (en) | 2017-08-22 | 2023-03-14 | Cure Vac SE | Bunyavirales vaccine |
WO2019046809A1 (en) | 2017-08-31 | 2019-03-07 | Modernatx, Inc. | METHODS OF MANUFACTURING LIPID NANOPARTICLES |
BR112020004351A2 (pt) * | 2017-10-19 | 2020-09-08 | Curevac Ag | moléculas de ácido nucleico artificial |
EP3707271A1 (en) | 2017-11-08 | 2020-09-16 | CureVac AG | Rna sequence adaptation |
US11931406B2 (en) | 2017-12-13 | 2024-03-19 | CureVac SE | Flavivirus vaccine |
EP3727428A1 (en) | 2017-12-20 | 2020-10-28 | Translate Bio, Inc. | Improved composition and methods for treatment of ornithine transcarbamylase deficiency |
SG11202005760PA (en) | 2017-12-21 | 2020-07-29 | Curevac Ag | Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna |
EP3746090A4 (en) | 2018-01-29 | 2021-11-17 | ModernaTX, Inc. | RSV RNA Vaccines |
AU2019243155A1 (en) * | 2018-03-27 | 2020-10-15 | Factor Bioscience Inc. | Nucleic acid-based therapeutics |
WO2020061367A1 (en) | 2018-09-19 | 2020-03-26 | Modernatx, Inc. | Compounds and compositions for intracellular delivery of therapeutic agents |
WO2020061457A1 (en) | 2018-09-20 | 2020-03-26 | Modernatx, Inc. | Preparation of lipid nanoparticles and methods of administration thereof |
AU2020214843A1 (en) | 2019-01-31 | 2021-08-19 | Modernatx, Inc. | Methods of preparing lipid nanoparticles |
JP2022523117A (ja) | 2019-01-31 | 2022-04-21 | モデルナティエックス インコーポレイテッド | ボルテックスミキサならびにその関連する方法、システム、及び装置 |
US11351242B1 (en) | 2019-02-12 | 2022-06-07 | Modernatx, Inc. | HMPV/hPIV3 mRNA vaccine composition |
CN112190591B (zh) * | 2019-07-08 | 2021-12-17 | 中国农业科学院兰州兽医研究所 | 核糖体蛋白rpl13抑制剂在制备抑制ires-依赖性翻译的病毒复制的药物中的应用 |
CN115175698A (zh) | 2020-01-28 | 2022-10-11 | 摩登纳特斯有限公司 | 冠状病毒rna疫苗 |
US11576966B2 (en) | 2020-02-04 | 2023-02-14 | CureVac SE | Coronavirus vaccine |
US11241493B2 (en) | 2020-02-04 | 2022-02-08 | Curevac Ag | Coronavirus vaccine |
WO2021159040A2 (en) | 2020-02-07 | 2021-08-12 | Modernatx, Inc. | Sars-cov-2 mrna domain vaccines |
MX2022012630A (es) | 2020-04-09 | 2022-11-07 | Suzhou Abogen Biosciences Co Ltd | Composicion de nanoparticulas lipidicas. |
EP4132576A1 (en) | 2020-04-09 | 2023-02-15 | Suzhou Abogen Biosciences Co., Ltd. | Nucleic acid vaccines for coronavirus |
WO2021222304A1 (en) | 2020-04-27 | 2021-11-04 | Modernatx, Inc. | Sars-cov-2 rna vaccines |
WO2021159130A2 (en) | 2020-05-15 | 2021-08-12 | Modernatx, Inc. | Coronavirus rna vaccines and methods of use |
CN111621588A (zh) * | 2020-06-08 | 2020-09-04 | 华中农业大学 | 光亮果皮番茄品种选育的分子标记及其应用 |
WO2022002040A1 (en) | 2020-06-30 | 2022-01-06 | Suzhou Abogen Biosciences Co., Ltd. | Lipid compounds and lipid nanoparticle compositions |
WO2022016070A1 (en) | 2020-07-16 | 2022-01-20 | Acuitas Therapeutics, Inc. | Cationic lipids for use in lipid nanoparticles |
CN114391008B (zh) | 2020-08-20 | 2024-05-03 | 苏州艾博生物科技有限公司 | 脂质化合物和脂质纳米颗粒组合物 |
US20230355743A1 (en) | 2020-09-25 | 2023-11-09 | Modernatx, Inc. | Multi-proline-substituted coronavirus spike protein vaccines |
US11771652B2 (en) | 2020-11-06 | 2023-10-03 | Sanofi | Lipid nanoparticles for delivering mRNA vaccines |
AU2021405281A1 (en) | 2020-12-22 | 2023-07-06 | CureVac SE | Rna vaccine against sars-cov-2 variants |
CN114717230A (zh) * | 2021-01-05 | 2022-07-08 | 麦塞拿治疗(香港)有限公司 | 成纤维细胞生长因子mRNA的无细胞和无载体体外RNA转录方法和核酸分子 |
CN114717238A (zh) * | 2021-01-05 | 2022-07-08 | 麦塞拿治疗(香港)有限公司 | 表皮生长因子mRNA的无细胞和无载体体外RNA转录方法和核酸分子 |
WO2022150717A1 (en) | 2021-01-11 | 2022-07-14 | Modernatx, Inc. | Seasonal rna influenza virus vaccines |
WO2022152141A2 (en) | 2021-01-14 | 2022-07-21 | Suzhou Abogen Biosciences Co., Ltd. | Polymer conjugated lipid compounds and lipid nanoparticle compositions |
WO2022152109A2 (en) | 2021-01-14 | 2022-07-21 | Suzhou Abogen Biosciences Co., Ltd. | Lipid compounds and lipid nanoparticle compositions |
JP2024503698A (ja) | 2021-01-15 | 2024-01-26 | モデルナティエックス インコーポレイテッド | 変異型株ベースのコロナウイルスワクチン |
CA3208303A1 (en) | 2021-01-15 | 2022-07-21 | Modernatx, Inc. | Variant strain-based coronavirus vaccines |
JP2024511346A (ja) | 2021-03-15 | 2024-03-13 | モデルナティエックス インコーポレイテッド | Sars-cov-2 mrnaドメインワクチンの治療的使用 |
AU2022258335A1 (en) | 2021-04-13 | 2023-11-23 | Modernatx, Inc. | Respiratory virus combination vaccines |
WO2022221440A1 (en) | 2021-04-14 | 2022-10-20 | Modernatx, Inc. | Influenza-coronavirus combination vaccines |
WO2022245888A1 (en) | 2021-05-19 | 2022-11-24 | Modernatx, Inc. | Seasonal flu rna vaccines and methods of use |
EP4204390A1 (en) | 2021-05-24 | 2023-07-05 | Suzhou Abogen Biosciences Co., Ltd. | Lipid compounds and lipid nanoparticle compositions |
CA3224175A1 (en) | 2021-06-18 | 2022-12-22 | Sanofi | Multivalent influenza vaccines |
AU2021461416A1 (en) | 2021-08-24 | 2024-02-22 | BioNTech SE | In vitro transcription technologies |
CA3231523A1 (en) | 2021-09-14 | 2023-03-23 | Renagade Therapeutics Management Inc. | Acyclic lipids and methods of use thereof |
WO2023044333A1 (en) | 2021-09-14 | 2023-03-23 | Renagade Therapeutics Management Inc. | Cyclic lipids and methods of use thereof |
EP4204391A1 (en) | 2021-10-08 | 2023-07-05 | Suzhou Abogen Biosciences Co., Ltd. | Lipid compounds and lipid nanoparticle compositions |
AR127312A1 (es) | 2021-10-08 | 2024-01-10 | Suzhou Abogen Biosciences Co Ltd | Compuestos lipídicos ycomposiciones de nanopartículas lipídicas |
CN116064598B (zh) | 2021-10-08 | 2024-03-12 | 苏州艾博生物科技有限公司 | 冠状病毒的核酸疫苗 |
CA3235867A1 (en) | 2021-10-22 | 2023-04-27 | Munir MOSAHEB | Mrna vaccine composition |
US20230302112A1 (en) | 2021-11-05 | 2023-09-28 | Sanofi | Respiratory synctial virus rna vaccine |
WO2023092069A1 (en) | 2021-11-18 | 2023-05-25 | Modernatx, Inc. | Sars-cov-2 mrna domain vaccines and methods of use |
CA3238764A1 (en) | 2021-11-23 | 2023-06-01 | Siddharth Patel | A bacteria-derived lipid composition and use thereof |
WO2023102373A1 (en) | 2021-11-30 | 2023-06-08 | Sanofi Pasteur Inc. | Human metapneumovirus vaccines |
WO2023107999A2 (en) | 2021-12-08 | 2023-06-15 | Modernatx, Inc. | Herpes simplex virus mrna vaccines |
WO2023111262A1 (en) | 2021-12-17 | 2023-06-22 | Sanofi | Lyme disease rna vaccine |
AU2022421841A1 (en) | 2021-12-20 | 2024-06-27 | Sail Biomedicines, Inc. | Mrna therapeutic compositions |
WO2023122752A1 (en) | 2021-12-23 | 2023-06-29 | Renagade Therapeutics Management Inc. | Constrained lipids and methods of use thereof |
WO2023116804A1 (zh) | 2021-12-23 | 2023-06-29 | 苏州艾博生物科技有限公司 | 脂质化合物和脂质纳米颗粒组合物 |
WO2023196931A1 (en) | 2022-04-07 | 2023-10-12 | Renagade Therapeutics Management Inc. | Cyclic lipids and lipid nanoparticles (lnp) for the delivery of nucleic acids or peptides for use in vaccinating against infectious agents |
WO2023196914A1 (en) | 2022-04-08 | 2023-10-12 | Modernatx, Inc. | Influenza nucleic acid compositions and uses thereof |
TW202408567A (zh) | 2022-05-06 | 2024-03-01 | 法商賽諾菲公司 | 用於核酸疫苗之訊息序列 |
WO2023217267A1 (zh) * | 2022-05-13 | 2023-11-16 | 上海瑞宏迪医药有限公司 | 包含utr的核酸构建体及其应用 |
WO2023230481A1 (en) | 2022-05-24 | 2023-11-30 | Modernatx, Inc. | Orthopoxvirus vaccines |
WO2024015890A1 (en) | 2022-07-13 | 2024-01-18 | Modernatx, Inc. | Norovirus mrna vaccines |
WO2024037578A1 (en) | 2022-08-18 | 2024-02-22 | Suzhou Abogen Biosciences Co., Ltd. | Composition of lipid nanoparticles |
WO2024044108A1 (en) | 2022-08-22 | 2024-02-29 | The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. | Vaccines against coronaviruses |
WO2024050483A1 (en) | 2022-08-31 | 2024-03-07 | Modernatx, Inc. | Variant strain-based coronavirus vaccines and uses thereof |
WO2024083345A1 (en) | 2022-10-21 | 2024-04-25 | BioNTech SE | Methods and uses associated with liquid compositions |
WO2024094876A1 (en) | 2022-11-04 | 2024-05-10 | Sanofi | Methods for messenger rna tailing |
WO2024094881A1 (en) | 2022-11-04 | 2024-05-10 | Sanofi | Respiratory syncytial virus rna vaccination |
WO2024102434A1 (en) | 2022-11-10 | 2024-05-16 | Senda Biosciences, Inc. | Rna compositions comprising lipid nanoparticles or lipid reconstructed natural messenger packs |
WO2024126809A1 (en) | 2022-12-15 | 2024-06-20 | Sanofi | Mrna encoding influenza virus-like particle |
WO2024126847A1 (en) | 2022-12-15 | 2024-06-20 | Sanofi | Mrna recombinant capping enzymes |
CN116159127B (zh) * | 2023-01-17 | 2024-04-02 | 西安交通大学医学院第一附属医院 | 酸性核糖体蛋白p2在治疗焦虑症中的应用 |
CN116004696B (zh) * | 2023-02-01 | 2024-03-29 | 郑州贝贝生物科技有限公司 | 可与IRES组合的3ˊUTR加茎环结构基因及其应用、mRNA表达系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090181427A1 (en) * | 2005-12-12 | 2009-07-16 | Research Corporation Technologies, Inc. | Hybrid 3' untranslated regions suitable for efficient protein expression in mammalian cells |
KR20110061629A (ko) * | 2008-09-30 | 2011-06-09 | 아보트 러보러터리즈 | 개선된 항체 라이브러리 |
KR20130010121A (ko) * | 2010-03-23 | 2013-01-25 | 인트렉손 코포레이션 | 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도 |
WO2013143700A2 (en) * | 2012-03-27 | 2013-10-03 | Curevac Gmbh | Artificial nucleic acid molecules comprising a 5'top utr |
WO2013143699A1 (en) * | 2012-03-27 | 2013-10-03 | Curevac Gmbh | Artificial nucleic acid molecules for improved protein or peptide expression |
Family Cites Families (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5132418A (en) | 1980-02-29 | 1992-07-21 | University Patents, Inc. | Process for preparing polynucleotides |
US4458066A (en) | 1980-02-29 | 1984-07-03 | University Patents, Inc. | Process for preparing polynucleotides |
US4500707A (en) | 1980-02-29 | 1985-02-19 | University Patents, Inc. | Nucleosides useful in the preparation of polynucleotides |
US4668777A (en) | 1981-03-27 | 1987-05-26 | University Patents, Inc. | Phosphoramidite nucleoside compounds |
US4415732A (en) | 1981-03-27 | 1983-11-15 | University Patents, Inc. | Phosphoramidite compounds and processes |
US4973679A (en) | 1981-03-27 | 1990-11-27 | University Patents, Inc. | Process for oligonucleo tide synthesis using phosphormidite intermediates |
US4373071A (en) | 1981-04-30 | 1983-02-08 | City Of Hope Research Institute | Solid-phase synthesis of polynucleotides |
US4401796A (en) | 1981-04-30 | 1983-08-30 | City Of Hope Research Institute | Solid-phase synthesis of polynucleotides |
US5153319A (en) | 1986-03-31 | 1992-10-06 | University Patents, Inc. | Process for preparing polynucleotides |
US5047524A (en) | 1988-12-21 | 1991-09-10 | Applied Biosystems, Inc. | Automated system for polynucleotide synthesis and purification |
US5262530A (en) | 1988-12-21 | 1993-11-16 | Applied Biosystems, Inc. | Automated system for polynucleotide synthesis and purification |
US5908779A (en) | 1993-12-01 | 1999-06-01 | University Of Connecticut | Targeted RNA degradation using nuclear antisense RNA |
US5700642A (en) | 1995-05-22 | 1997-12-23 | Sri International | Oligonucleotide sizing using immobilized cleavable primers |
IL131979A0 (en) | 1997-03-21 | 2001-03-19 | Enzo Therapeutics Inc | Vectors and viral vectors and packaging cell lines for propagating the same |
WO2001007590A2 (en) * | 1999-07-27 | 2001-02-01 | Syngenta Participations Ag | Chimeric genes for plastid expression |
US6423885B1 (en) | 1999-08-13 | 2002-07-23 | Commonwealth Scientific And Industrial Research Organization (Csiro) | Methods for obtaining modified phenotypes in plant cells |
EP1604688B1 (de) | 2001-06-05 | 2010-02-03 | CureVac GmbH | Stabilisierte Tumorantigen-mRNA mit erhöhtem G/C-Gehalt |
US8021875B2 (en) | 2001-08-27 | 2011-09-20 | Roche Madison Inc. | Methods for expression of transgenes |
US7985553B2 (en) | 2001-10-29 | 2011-07-26 | Nathaniel Heintz | Method for isolating cell type-specific mRNAs |
DE10162480A1 (de) | 2001-12-19 | 2003-08-07 | Ingmar Hoerr | Die Applikation von mRNA für den Einsatz als Therapeutikum gegen Tumorerkrankungen |
DE10229872A1 (de) | 2002-07-03 | 2004-01-29 | Curevac Gmbh | Immunstimulation durch chemisch modifizierte RNA |
EP2500437B1 (en) | 2003-01-21 | 2016-11-30 | PTC Therapeutics, Inc. | Methods for identifying compounds that modulate untranslated region-dependent gene expression and methods of using same |
US9068234B2 (en) * | 2003-01-21 | 2015-06-30 | Ptc Therapeutics, Inc. | Methods and agents for screening for compounds capable of modulating gene expression |
DE10335833A1 (de) | 2003-08-05 | 2005-03-03 | Curevac Gmbh | Transfektion von Blutzellen mit mRNA zur Immunstimulation und Gentherapie |
PL1685251T3 (pl) * | 2003-10-10 | 2014-07-31 | Powderject Vaccines Inc | Konstrukty kwasu nukleinowego |
DE102004035227A1 (de) | 2004-07-21 | 2006-02-16 | Curevac Gmbh | mRNA-Gemisch zur Vakzinierung gegen Tumorerkrankungen |
DE102004042546A1 (de) | 2004-09-02 | 2006-03-09 | Curevac Gmbh | Kombinationstherapie zur Immunstimulation |
GB0509965D0 (en) * | 2005-05-17 | 2005-06-22 | Ml Lab Plc | Improved expression elements |
DE102005023170A1 (de) | 2005-05-19 | 2006-11-23 | Curevac Gmbh | Optimierte Formulierung für mRNA |
EP4332227A1 (en) | 2005-08-23 | 2024-03-06 | The Trustees of the University of Pennsylvania | Rna containing modified nucleosides and methods of use thereof |
DE102006035618A1 (de) | 2006-07-31 | 2008-02-07 | Curevac Gmbh | Nukleinsäure der Formel (I): GlXmGn, insbesondere als immunstimulierendes Adjuvanz |
WO2008014979A2 (en) | 2006-07-31 | 2008-02-07 | Curevac Gmbh | NUCLEIC ACID OF FORMULA (I): GIXmGn, OR (II): CIXmCn, IN PARTICULAR AS AN IMMUNE-STIMULATING AGENT/ADJUVANT |
DE102006061015A1 (de) | 2006-12-22 | 2008-06-26 | Curevac Gmbh | Verfahren zur Reinigung von RNA im präparativen Maßstab mittels HPLC |
DE102007001370A1 (de) | 2007-01-09 | 2008-07-10 | Curevac Gmbh | RNA-kodierte Antikörper |
WO2009030254A1 (en) | 2007-09-04 | 2009-03-12 | Curevac Gmbh | Complexes of rna and cationic peptides for transfection and for immunostimulation |
WO2009046738A1 (en) | 2007-10-09 | 2009-04-16 | Curevac Gmbh | Composition for treating lung cancer, particularly of non-small lung cancers (nsclc) |
WO2009046739A1 (en) | 2007-10-09 | 2009-04-16 | Curevac Gmbh | Composition for treating prostate cancer (pca) |
SG188104A1 (en) | 2008-01-31 | 2013-03-28 | Curevac Gmbh | Nucleic acids comprising formula (nuglxmgnnv)a and derivatives thereof as an immunostimulating agents /adjuvants |
WO2009155950A1 (en) * | 2008-06-27 | 2009-12-30 | King Faisal Specialist Hospital And Research Centre | Cloning-free method of generating transcriptionally and post-transcriptionally controllable expression active linear reporter constructs |
GB0815872D0 (en) | 2008-09-01 | 2008-10-08 | Pasteur Institut | Novel method and compositions |
WO2010037408A1 (en) | 2008-09-30 | 2010-04-08 | Curevac Gmbh | Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof |
US8343497B2 (en) | 2008-10-12 | 2013-01-01 | The Brigham And Women's Hospital, Inc. | Targeting of antigen presenting cells with immunonanotherapeutics |
AU2010248761B2 (en) | 2009-05-15 | 2016-02-11 | Irx Therapeutics, Inc. | Vaccine immunotherapy |
US20110053829A1 (en) | 2009-09-03 | 2011-03-03 | Curevac Gmbh | Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids |
WO2011069529A1 (en) | 2009-12-09 | 2011-06-16 | Curevac Gmbh | Mannose-containing solution for lyophilization, transfection and/or injection of nucleic acids |
ES2558106T3 (es) | 2010-07-30 | 2016-02-02 | Curevac Ag | Formación de complejos de ácidos nucleicos con componentes catiónicos disulfuro-reticulados para la transfección e inmunoestimulación |
WO2012019630A1 (en) | 2010-08-13 | 2012-02-16 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein |
DK2611915T3 (da) * | 2010-09-01 | 2015-06-22 | Cellagenics B V | Nukleinsyrefragmenter fra en ribosomal proteinpromoter til forstærkning af genekspression |
WO2012089225A1 (en) | 2010-12-29 | 2012-07-05 | Curevac Gmbh | Combination of vaccination and inhibition of mhc class i restricted antigen presentation |
WO2012116715A1 (en) | 2011-03-02 | 2012-09-07 | Curevac Gmbh | Vaccination in newborns and infants |
WO2012113413A1 (en) | 2011-02-21 | 2012-08-30 | Curevac Gmbh | Vaccine composition comprising complexed immunostimulatory nucleic acids and antigens packaged with disulfide-linked polyethyleneglycol/peptide conjugates |
WO2012116714A1 (en) | 2011-03-02 | 2012-09-07 | Curevac Gmbh | Vaccination in elderly patients |
WO2013113325A1 (en) | 2012-01-31 | 2013-08-08 | Curevac Gmbh | Negatively charged nucleic acid comprising complexes for immunostimulation |
WO2013113326A1 (en) | 2012-01-31 | 2013-08-08 | Curevac Gmbh | Pharmaceutical composition comprising a polymeric carrier cargo complex and at least one protein or peptide antigen |
WO2013120500A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded tumour antigen |
WO2013120498A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded allergenic antigen or an autoimmune self-antigen |
WO2013120499A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly (a) sequence or a polyadenylation signal for increasing the expression of an encoded pathogenic antigen |
WO2013120497A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein |
SG11201405542UA (en) * | 2012-03-27 | 2014-10-30 | Curevac Gmbh | Artificial nucleic acid molecules |
WO2013174409A1 (en) | 2012-05-25 | 2013-11-28 | Curevac Gmbh | Reversible immobilization and/or controlled release of nucleic acid containing nanoparticles by (biodegradable) polymer coatings |
JP6144355B2 (ja) | 2012-11-26 | 2017-06-07 | モデルナティエックス インコーポレイテッドModernaTX,Inc. | 化学修飾mRNA |
RU2712743C2 (ru) | 2013-08-21 | 2020-01-30 | Куревак Аг | Вакцина против бешенства |
BR112016003361A2 (pt) | 2013-08-21 | 2017-11-21 | Curevac Ag | vacina do vírus sincicial respiratório (rsv) |
ES2806575T3 (es) | 2013-11-01 | 2021-02-18 | Curevac Ag | ARN modificado con propiedades inmunoestimuladoras disminuidas |
SG11201604198YA (en) | 2013-12-30 | 2016-07-28 | Curevac Ag | Methods for rna analysis |
WO2015101415A1 (en) | 2013-12-30 | 2015-07-09 | Curevac Gmbh | Artificial nucleic acid molecules |
JP6704850B2 (ja) * | 2013-12-30 | 2020-06-03 | キュアバック アーゲー | 人工核酸分子 |
WO2015135558A1 (en) | 2014-03-12 | 2015-09-17 | Curevac Gmbh | Combination of vaccination and ox40 agonists |
WO2015149944A2 (en) | 2014-04-01 | 2015-10-08 | Curevac Gmbh | Polymeric carrier cargo complex for use as an immunostimulating agent or as an adjuvant |
-
2014
- 2014-12-30 JP JP2016543590A patent/JP6704850B2/ja active Active
- 2014-12-30 SG SG10201903381TA patent/SG10201903381TA/en unknown
- 2014-12-30 MX MX2016008551A patent/MX2016008551A/es active IP Right Grant
- 2014-12-30 BR BR112016014462A patent/BR112016014462A2/pt not_active Application Discontinuation
- 2014-12-30 DK DK14854873.8T patent/DK3090053T3/en active
- 2014-12-30 CN CN201480065035.1A patent/CN105874072A/zh active Pending
- 2014-12-30 RU RU2016131391A patent/RU2717986C2/ru active
- 2014-12-30 WO PCT/EP2014/003480 patent/WO2015101414A2/en active Application Filing
- 2014-12-30 ES ES14854873T patent/ES2712092T3/es active Active
- 2014-12-30 CN CN202010090980.4A patent/CN111304231A/zh active Pending
- 2014-12-30 KR KR1020167020951A patent/KR102399799B1/ko active IP Right Grant
- 2014-12-30 CA CA2927862A patent/CA2927862C/en active Active
- 2014-12-30 SG SG11201603144QA patent/SG11201603144QA/en unknown
- 2014-12-30 AU AU2014375402A patent/AU2014375402B2/en active Active
-
2016
- 2016-06-27 MX MX2020003245A patent/MX2020003245A/es unknown
- 2016-06-28 US US15/195,934 patent/US10047375B2/en active Active
-
2020
- 2020-05-13 JP JP2020084213A patent/JP6997251B2/ja active Active
-
2022
- 2022-01-14 US US17/576,583 patent/US20220136001A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090181427A1 (en) * | 2005-12-12 | 2009-07-16 | Research Corporation Technologies, Inc. | Hybrid 3' untranslated regions suitable for efficient protein expression in mammalian cells |
KR20110061629A (ko) * | 2008-09-30 | 2011-06-09 | 아보트 러보러터리즈 | 개선된 항체 라이브러리 |
KR20130010121A (ko) * | 2010-03-23 | 2013-01-25 | 인트렉손 코포레이션 | 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도 |
WO2013143700A2 (en) * | 2012-03-27 | 2013-10-03 | Curevac Gmbh | Artificial nucleic acid molecules comprising a 5'top utr |
WO2013143699A1 (en) * | 2012-03-27 | 2013-10-03 | Curevac Gmbh | Artificial nucleic acid molecules for improved protein or peptide expression |
Also Published As
Publication number | Publication date |
---|---|
BR112016014462A2 (pt) | 2017-10-24 |
CA2927862A1 (en) | 2015-07-09 |
WO2015101414A2 (en) | 2015-07-09 |
RU2016131391A3 (ko) | 2018-08-23 |
MX2020003245A (es) | 2020-07-20 |
JP6997251B2 (ja) | 2022-01-17 |
US10047375B2 (en) | 2018-08-14 |
CA2927862C (en) | 2024-01-23 |
KR102399799B1 (ko) | 2022-05-18 |
WO2015101414A3 (en) | 2015-10-08 |
SG11201603144QA (en) | 2016-07-28 |
DK3090053T3 (en) | 2019-02-25 |
JP2020184995A (ja) | 2020-11-19 |
AU2014375402B2 (en) | 2020-10-01 |
ES2712092T3 (es) | 2019-05-09 |
JP2017502670A (ja) | 2017-01-26 |
US20220136001A1 (en) | 2022-05-05 |
CN105874072A (zh) | 2016-08-17 |
JP6704850B2 (ja) | 2020-06-03 |
RU2717986C2 (ru) | 2020-03-27 |
SG10201903381TA (en) | 2019-05-30 |
RU2016131391A (ru) | 2018-02-02 |
CN111304231A (zh) | 2020-06-19 |
US20170029847A1 (en) | 2017-02-02 |
MX2016008551A (es) | 2016-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102399799B1 (ko) | 인공 핵산 분자 | |
JP7245878B2 (ja) | 人工核酸分子 | |
KR102580696B1 (ko) | 신규 인공 핵산 분자 | |
US11345920B2 (en) | Artificial nucleic acid molecules for improved protein expression | |
US20230399649A1 (en) | Artificial nucleic acid molecules | |
AU2014375402A1 (en) | Artificial nucleic acid molecules | |
US11254951B2 (en) | Artificial nucleic acid molecules | |
EP3090053B1 (en) | Artificial nucleic acid molecules | |
RU2774415C1 (ru) | Искусственные молекулы нуклеиновой кислоты | |
RU2772349C2 (ru) | Искусственные молекулы нуклеиновой кислоты | |
EP3090052B1 (en) | Artificial nucleic acid molecules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |