KR20140113666A - 발현 카세트 - Google Patents
발현 카세트 Download PDFInfo
- Publication number
- KR20140113666A KR20140113666A KR1020147018672A KR20147018672A KR20140113666A KR 20140113666 A KR20140113666 A KR 20140113666A KR 1020147018672 A KR1020147018672 A KR 1020147018672A KR 20147018672 A KR20147018672 A KR 20147018672A KR 20140113666 A KR20140113666 A KR 20140113666A
- Authority
- KR
- South Korea
- Prior art keywords
- genomic dna
- dna sequence
- promoter
- gapdh
- upstream
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 발현에 유용한 발현 카세트에 관한 것이다.
Description
본 발명은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 발현에 유용한 발현 카세트(expression cassette)에 관한 것이다. 또한, 본 발명은 숙주 세포로부터 폴리펩티드의 생성을 위한 발현 카세트 및 발현 카세트의 용도를 포함하는 벡터 및 숙주 세포에 관한 것이다.
재조합 폴리펩티드의 생성을 위한 발현 시스템은 당업계에서 잘 알려져 있고, 예를 들면, Marino MH (1989) Biopharm, 2: 18-33; Goeddel DV et al., (1990) Methods Enzymol 185: 3-7; Wurm F & Bernard A (1999) Curr Opin Biotechnol 10: 156-159에 의해 설명되어 있다. 일반적으로, 약학적 적용에서 용도를 위한 폴리펩티드는 바람직하게는 CHO 세포, NSO 세포, SP2/0 세포, COS 세포, HEK 세포, BHK 세포 또는 등과 같은 포유동물 세포에서 생성된다. 상기 목적을 위해 사용된 발현 벡터의 필수적 요소는 복제의 원핵생물 기원(origin) 및 원핵생물 선별가능한 마커(selectable marker), 선택적으로 진핵생물 선별가능한 마커, 및 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 선택적으로 폴리아데닐레이션 신호를 포함하는 전사 종결자를 포함하는 각각의 관심의 구조적 유전자의 발현을 위한 하나 또는 그 이상의 발현 카세트를 포함하는 원핵생물 플라스미드 증식 유닛(propagation unit), 예를 들면, E. coli로부터 선택된다. 포유동물 세포에서 일시적 발현을 위하여, SV40 Ori 또는 OriP와 같은 복제의 포유동물 기원이 포함될 수 있다. 프로모터로서 구조적(constitutive) 또는 유발하는(inducible) 프로모터가 선택될 수 있다. 최적화된 전사를 위해서, 코작(Kozak) 서열이 5' 비번역 영역에 포함될 수 있다. mRNA 진행, 특히 mRNA 스플라이싱(splicing) 및 전사 종료(transcription termination)를 위해서, 폴리아데닐레이션 신호뿐만 아니라 구조적 유전자(엑손/인트론 조합)의 조합에 따른 mRNA 스플라이싱 신호가 포함될 수 있다. 유전자의 발현은 일시적 또는 안정 세포주를 사용하여 수행될 수 있다. 생성 세포주에서 안정 수준 및 폴리펩티드의 고발현은 재조합 폴리펩티드의 생성의 전체 진행에 중대하다. 단백질과 같은 생물 분자 및 특정 항체 또는 항체단편을 위한 요구는 지난 수년에 걸쳐 현저히 증가하고 있다. 고비용과 낮은 수율은 생물 분자의 활용성에 있어서 제한요인이 되어왔고 산업적 규모에서 원하는 생물 분자의 수율을 증가시키는 강건한 진행을 발달시키는데 주요 도전이 되어왔다. 따라서, 재조합 폴리펩티드 생성에서 고발현을 얻기 위하여 발현 벡터의 효율을 개선시키기 위한 필요성이 아직 있다.
도 1은 마우스 거대세포바이러스(cytomegalovirus) 프로모터(mCMV), 첫번째 인트론을 포함하는 Ig 기증 수용체 단편(IgDA), IgG1 항체 경쇄(IgG1 LC), 뇌심근염바이러스(Encephalomyocarditis)로부터 유래된 내부 리보좀 입구부위(Internal Ribosomal Entry Sites)(IRES), IgG1 항체 중쇄(IgG1 HC), 녹색 형광 단백질(GFP) 및 시미안 바이러스 40 폴리아데닐레이션 신호(poly (A))를 구성하는 리포터 발현 구조체(REP)를 나타낸다.
도 2는 형질전환 후 5일째에 CHO-S 세포에서 IgG1 항체의 일시적 발현을 나타낸다(IgG 적정량(titers)의 평균이 두 개 별개의 형질전환에 대해 플롯됨). 세포를 GAPDH_A 및 GAPDH_B 벡터(GAPDH_A 및 GAPDH_B), GAPDH 업스트림 및 다운스트림 요소 (A 및 B)가 없는 동일한 벡터 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 형질전환하였다. 상층액에 축적된 IgG1 항체의 농도를 옥테트(Octet) 기구(Fortebio, Menlo, CA, USA)를 사용하여 결정하였다.
도 3은 HEK293 EBNA 세포에서 IgG1 항체의 발현을 나타낸다. 세포를 GAPDH_A 및 GAPDH_B 벡터(GAPDH_A 및 GAPDH_B) 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 형질전환하였다. 상층액을 옥테트(Octet) 기구를 사용하여 형질전환 후 10일째에 수확하고 분석하였다. 데이타는 벡터 당 튜브스핀에서 N = 3 독립 형질전환을 나타낸다.
도 4는 세포 풀(pools)을 사용하여 일괄(batch) 생성에 대한 발현 수준 연구를 나타낸다. 세포를 형질전환하고 안정 세포의 풀을 GAPDH_A 및 GAPDH_B 벡터 (GAPDH_A(1), GAPDH_A(2), GAPDH_B(1) 및 GAPDH_B(2)), GAPDH 업스트림 및 다운스트림 요소(A(1) 및 A(2))가 없는 동일한 벡터 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 제조하였다. 배양 7일 후에 상층액을 상층액에 축적된 항체에 대해 옥테트 기구를 사용하여 분석하였다. IgG 적정량의 평균이 각각 풀에 대해 (㎍/㎖)주어졌다. 데이타는 풀 당 N = 2 일괄(batches)을 나타낸다.
도 5는 안정 형질전환 및 제한 희석에 의해 생성된 집단(populations) 상에서 발현 수준 연구를 나타낸 도이다. 세포를 GAPDH_A 및 GAPDH_B 벡터(GAPDH_A 및 GAPDH_B), GAPDH 업스트림 및 다운스트림 요소가 없는 동일한 벡터(A 및 B) 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 형질전환하였다. 안정 형질전환으로부터 클론 및 미니풀에 의해 발현된 GFP 형광의 평균 값을 형질전환 후에 14일째에 측정하였다. 세포를 96-웰 플레이트에서 선별 압력(selection pressure)하에서 배양하였다. 데이타는 벡터당 N = 48 클론 또는 미니풀을 나타낸다.
도 6은 상층액에서 IgG1 항체의 발현 상에 대한 배지 첨가제인 인슐린 및 PMA (포르볼 12-미리스테이트 13-아세테이트, 포르볼 에스테르)(phorbol 12-myristate 13-acetate, a phorbol ester)의 효과를 나타낸다. GAPDH_A 벡터(GAPDH_A)와 대조군(pGLEX41)로서 pGLEX41 벡터로 형질전환 후에 세포를 PowerCHO2 배지, 4mM Gln, +/- 인슐린 및 PowerCHO2, 4mM Gln, PMA +/- 인슐린에서 희석하였다. pGLEX41(채워진 바(filled bars)) 또는 GAPDH_A(공개 바(open bars))에 대하여 표준 배지와 비교하여 발현에서 차이가 없음을 관찰하였다.
도 7은 인간 GAPDH 유전자 자리(locus)의 개요를 나타낸다. GAPDH 유전자는 유전자 NCAPD2 및 IFFO1 옆에 있다(flanked).
도 8은 인간 GAPDH 유전자, GAPDH 업- 및 다운스트림 요소 및 GAPDH 업스트림 단편화 연구 분석을 위해 제조된 단편의 세부를 나타낸다. NruI 제한 자리는 클로닝 단계를 용이하게 하기 위하여 도입되었고 게놈 5' GAPDH 업스트림 서열(이는 별표(asterisk)를 사용하여 강조됨)의 일부가 아니다. 단편의 크기는 하기와 같다: 단편 1 (서열번호: 9): 511 bps, 단편 2 (서열번호: 10): 2653 bps, 단편 3 (서열번호: 11): 1966 bps, 단편 4 (서열번호: 12): 1198 bps, 단편 8 (서열번호: 13): 259 bps, 단편 9 (서열번호: 14): 1947 bps, 단편 11 (서열번호: 15): 1436 bps, 및 단편 17 (서열번호: 16): 1177 bps.
도 9는 GAPDH 업스트림 및 다운스트림 요소의 단편화의 발현 결과를 나타낸다. 발현 결과를 형질전환 후에 10일째에 CHO 세포에서 일시적 형질전환으로 얻었다. 정량화를 옥테트 기구를 사용하여 수행하였다. 벡터 pGLEX41는 음성 대조군으로서 이용되었다. 또한, pGLEX41-ampiA는 GAPDH 인접 요소가 없는 벡터의 기저 발현을 나타내는 음성 대조군이다. pGLEX41-업/다운은 전장 인접(업스트림 및 다운스트림) 영역을 포함하고 양성 대조군h으로서 이용되었다. pGLEX41-업은 단지 업스트림 인접 영역을 포함하고 pGLEX41-다운은 단지 다운스트림 인접 영역을 포함한다. 모든 다른 구조체는 도 8에 설명된 단편을 포함한다. 단편 2 및 3은 IgG1 LC 및 IgG1 HC로서 동일한 방향으로 클론되거나 또는 IgG1 LC 및 IgG1 HC(AS)와 관련하여 반대 방향으로 클론되었다.
도 10은 형질전환 후 8일째에 CHO-S 세포에서 IgG1 항체의 일시적 발현을 나타낸다(IgG의 적정량의 평균은 세 개의 독립 형질전환에 대하여 플롯됨; 에러바: SD +/-). 세포를 마우스 CMV(A_GAPDH_UP) 또는 차이니즈 햄스터 GAPDH 프로모터 (A_GAPDH_UP_PR)와 조합된 차이니즈 햄스터 GAPDH 업스트림 요소를 갖는 벡터를 사용하여 형질전환하였다. 단지 마우스 CMV (A) 또는 차이니즈 햄스터 GAPDH 프로모터 (A_PR)를 갖는 플라스미드는 대조군으로서 형질전환되었다. 상층액에 축적된 IgG1 항체의 농도는 옥테트 QK 기구를 사용하여 결정되었다(Fortebio, Menlo, CA, USA).
도 2는 형질전환 후 5일째에 CHO-S 세포에서 IgG1 항체의 일시적 발현을 나타낸다(IgG 적정량(titers)의 평균이 두 개 별개의 형질전환에 대해 플롯됨). 세포를 GAPDH_A 및 GAPDH_B 벡터(GAPDH_A 및 GAPDH_B), GAPDH 업스트림 및 다운스트림 요소 (A 및 B)가 없는 동일한 벡터 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 형질전환하였다. 상층액에 축적된 IgG1 항체의 농도를 옥테트(Octet) 기구(Fortebio, Menlo, CA, USA)를 사용하여 결정하였다.
도 3은 HEK293 EBNA 세포에서 IgG1 항체의 발현을 나타낸다. 세포를 GAPDH_A 및 GAPDH_B 벡터(GAPDH_A 및 GAPDH_B) 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 형질전환하였다. 상층액을 옥테트(Octet) 기구를 사용하여 형질전환 후 10일째에 수확하고 분석하였다. 데이타는 벡터 당 튜브스핀에서 N = 3 독립 형질전환을 나타낸다.
도 4는 세포 풀(pools)을 사용하여 일괄(batch) 생성에 대한 발현 수준 연구를 나타낸다. 세포를 형질전환하고 안정 세포의 풀을 GAPDH_A 및 GAPDH_B 벡터 (GAPDH_A(1), GAPDH_A(2), GAPDH_B(1) 및 GAPDH_B(2)), GAPDH 업스트림 및 다운스트림 요소(A(1) 및 A(2))가 없는 동일한 벡터 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 제조하였다. 배양 7일 후에 상층액을 상층액에 축적된 항체에 대해 옥테트 기구를 사용하여 분석하였다. IgG 적정량의 평균이 각각 풀에 대해 (㎍/㎖)주어졌다. 데이타는 풀 당 N = 2 일괄(batches)을 나타낸다.
도 5는 안정 형질전환 및 제한 희석에 의해 생성된 집단(populations) 상에서 발현 수준 연구를 나타낸 도이다. 세포를 GAPDH_A 및 GAPDH_B 벡터(GAPDH_A 및 GAPDH_B), GAPDH 업스트림 및 다운스트림 요소가 없는 동일한 벡터(A 및 B) 및 대조군(pGLEX41)으로서 pGLEX41 벡터를 사용하여 형질전환하였다. 안정 형질전환으로부터 클론 및 미니풀에 의해 발현된 GFP 형광의 평균 값을 형질전환 후에 14일째에 측정하였다. 세포를 96-웰 플레이트에서 선별 압력(selection pressure)하에서 배양하였다. 데이타는 벡터당 N = 48 클론 또는 미니풀을 나타낸다.
도 6은 상층액에서 IgG1 항체의 발현 상에 대한 배지 첨가제인 인슐린 및 PMA (포르볼 12-미리스테이트 13-아세테이트, 포르볼 에스테르)(phorbol 12-myristate 13-acetate, a phorbol ester)의 효과를 나타낸다. GAPDH_A 벡터(GAPDH_A)와 대조군(pGLEX41)로서 pGLEX41 벡터로 형질전환 후에 세포를 PowerCHO2 배지, 4mM Gln, +/- 인슐린 및 PowerCHO2, 4mM Gln, PMA +/- 인슐린에서 희석하였다. pGLEX41(채워진 바(filled bars)) 또는 GAPDH_A(공개 바(open bars))에 대하여 표준 배지와 비교하여 발현에서 차이가 없음을 관찰하였다.
도 7은 인간 GAPDH 유전자 자리(locus)의 개요를 나타낸다. GAPDH 유전자는 유전자 NCAPD2 및 IFFO1 옆에 있다(flanked).
도 8은 인간 GAPDH 유전자, GAPDH 업- 및 다운스트림 요소 및 GAPDH 업스트림 단편화 연구 분석을 위해 제조된 단편의 세부를 나타낸다. NruI 제한 자리는 클로닝 단계를 용이하게 하기 위하여 도입되었고 게놈 5' GAPDH 업스트림 서열(이는 별표(asterisk)를 사용하여 강조됨)의 일부가 아니다. 단편의 크기는 하기와 같다: 단편 1 (서열번호: 9): 511 bps, 단편 2 (서열번호: 10): 2653 bps, 단편 3 (서열번호: 11): 1966 bps, 단편 4 (서열번호: 12): 1198 bps, 단편 8 (서열번호: 13): 259 bps, 단편 9 (서열번호: 14): 1947 bps, 단편 11 (서열번호: 15): 1436 bps, 및 단편 17 (서열번호: 16): 1177 bps.
도 9는 GAPDH 업스트림 및 다운스트림 요소의 단편화의 발현 결과를 나타낸다. 발현 결과를 형질전환 후에 10일째에 CHO 세포에서 일시적 형질전환으로 얻었다. 정량화를 옥테트 기구를 사용하여 수행하였다. 벡터 pGLEX41는 음성 대조군으로서 이용되었다. 또한, pGLEX41-ampiA는 GAPDH 인접 요소가 없는 벡터의 기저 발현을 나타내는 음성 대조군이다. pGLEX41-업/다운은 전장 인접(업스트림 및 다운스트림) 영역을 포함하고 양성 대조군h으로서 이용되었다. pGLEX41-업은 단지 업스트림 인접 영역을 포함하고 pGLEX41-다운은 단지 다운스트림 인접 영역을 포함한다. 모든 다른 구조체는 도 8에 설명된 단편을 포함한다. 단편 2 및 3은 IgG1 LC 및 IgG1 HC로서 동일한 방향으로 클론되거나 또는 IgG1 LC 및 IgG1 HC(AS)와 관련하여 반대 방향으로 클론되었다.
도 10은 형질전환 후 8일째에 CHO-S 세포에서 IgG1 항체의 일시적 발현을 나타낸다(IgG의 적정량의 평균은 세 개의 독립 형질전환에 대하여 플롯됨; 에러바: SD +/-). 세포를 마우스 CMV(A_GAPDH_UP) 또는 차이니즈 햄스터 GAPDH 프로모터 (A_GAPDH_UP_PR)와 조합된 차이니즈 햄스터 GAPDH 업스트림 요소를 갖는 벡터를 사용하여 형질전환하였다. 단지 마우스 CMV (A) 또는 차이니즈 햄스터 GAPDH 프로모터 (A_PR)를 갖는 플라스미드는 대조군으로서 형질전환되었다. 상층액에 축적된 IgG1 항체의 농도는 옥테트 QK 기구를 사용하여 결정되었다(Fortebio, Menlo, CA, USA).
발명요약
본 발명은 일반적으로 재조합 폴리펩티드 생성에서 증가된 발현을 얻기 위하여 사용될 수 있는 발현 카세트 및 발현 벡터와 같은 발현 시스템에 관한 것이다. 하나의 측면에서, 본 개시는 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물 글리세르알데하이드 3-포스페이트 디하드로제네이즈(Glyceraldehyde 3-phosphate dehydrogenase (GAPDH)) 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하는 발현 카세트를 제공하고, 여기서 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치로부터 +7000 주위의 뉴클레오티드 위치까지 영역거리(region spanning)내에서 시작하고, 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 100 주위부터 15000 주위의 뉴클레오티드까지이다.
추가적 측면에서, 본 개시는 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림을 제공하고, 여기서 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터 5'말단 주위로부터 -3500 주위의 뉴클레오티드 위치까지 영역 거리내에서 시작하고, 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 발현 카세트는 진핵생물 GAPDH 프로모터 또는 이의 단편을 포함하지 않는다는 조건으로 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100부터 15000 주위의 뉴클레오티드까지이다.
추가적 측면에서, 본 개시는 발현 카세트를 포함하는 발현 벡터 및 발현 카세트 또는 발현 카세트를 포함하는 발현 벡터를 포함하는 숙주세포를 제공한다
더욱 추가적 측면에서, 본 개시는 발현 카세트 또는 발현 벡터를 갖는 숙주세포 형질전환 및 폴리펩티드 회수를 포함하는, 폴리펩티드 발현을 위한 시험관 내 방법 및 포유동물 숙주 세포로부터 이종 폴리펩티드의 발현을 위한 발현 카세트 또는 발현 벡터의 용도를 제공한다.
본 발명의 상세한 설명
본 개시는 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열 및 진핵생물 글리세르알데하이드 3-포스페이트 디하드로제네이즈(Glyceraldehyde 3-phosphate dehydrogenase(GAPDH)) 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하는 발현 카세트 및 발현 벡터에 관한 것이고, 여기서 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치로부터 +7000 주위의 뉴클레오티드 위치까지 영역거리(region spanning)내에서 시작하고, 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 100 주위부터 15000 주위의 뉴클레오티드까지이다.
본 개시는 추가적으로 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림을 포함하는 발현 카세트에 관한 것이고, 여기서 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고,
진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5'말단 주위로부터 -3500 주위의 뉴클레오티드 위치까지 영역 거리내에서 시작하고, 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 발현 카세트는 진핵생물 GAPDH 프로모터 또는 이의 단편을 포함하지 않는다는 조건으로 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100부터 15000 주위 뉴클레오티드까지이다.
본 명세서에서 사용된 용어 "발현 카세트"는 시스-엑팅 전사 조절 요소(cis-acting transcriptional control elements)의 임의 조합을 포함하는 발현되록 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열 및 프로모터 및 선택적으로 인핸서(enhancer) 서열과 같은 자체의 발현을 조절하는 서열을 포함한다. 유전자 발현을 조절하는 서열은, 예를 들면, 전사 생성물의 자체의 전사 및 번역은 조절유닛(regulatory unit)으로서 일반적으로 언급된다. 조절유닛의 대부분은 유전자의 코딩 서열의 업스트림에 위치해 있고, 실시가능하도록 거기에 연결되어 있다. 발현카세트는 폴리아데닐레이션 자리를 포함하는 다운스트림 3' 비번역 영역을 포함할 수 있다. 본 발명의 조절 유닛은 전사유닛과 같은 발현되는 유전자에 실시가능하도록 연결되거나 또는 예를 들면, 이종 유전자의 5 '-비번역된 영역과 같은 간섭 DNA에 의해 거기로부터 분리된다. 바람직하게는 발현 카세트는 벡터로 발현 카세트의 삽입 및/또는 벡터로부터 자체의 절제를 가능하도록 하기 위하여 하나 또는 그 이상의 적절한 제한효소에 의해 옆에 있다. 따라서, 본 발명에 따른 발현 카세트는 발현 벡터, 특히, 포유동물 발현 벡터의 구조체에 사용될 수 있다. 본 발명의 발현 카세트는 하나 또는 그 이상, 예를 들면, 진핵생물 GAPDH 프로모터 또는 이의 단편의 2개, 3개 또는 그 이상의 비번역된 게놈 DNA 서열 다운스트림, 및/또는 하나 또는 그 이상, 예를 들면, 진핵생물 GAPDH 프로모터 또는 이의 단편의 2개, 3개 또는 그 이상의 비번역된 게놈 DNA 서열 업스트림을 포함할 수 있다. 만약 본 발명의 발현 카세트가 진핵생물 GAPDH 프로모터 또는 이의 단편의 하나 이상의 DNA 서열 다운스트림 및/또는 업스트림을 포함한다면, 상기 DNA 서열은 직접적으로 연결되는, 즉, 예를 들면, 5' 및 3' 말단에 부착되고 서열 또는 이의 단편의 일련의 클로닝을 수월하게 하는 제한효소 자리를 포함하는 링커서열을 포함할 수 있다. 진핵생물 GAPDH 프로모터 또는 이의 단편은 DNA 서열 다운스트림 및/또는 업스트림은 직접적으로 연결되지 않을 수 있다, 즉, 간섭 DNA 서열로 클론될 수 있다.
본 명세서에서 사용된 용어 "폴리펩티드를 암호화하는 폴리뉴클레오티드 서열"은 유전자, 바람직하게는 폴리펩티드를 발현하는 이종 유전자를 위한 DNA 코딩을 포함한다.
용어 "이종 코딩 서열", "이종 유전자 서열", " 이종 유전자", "재조합 유전자", 또는 "유전자"는 교체사용될 수 있다. 상기 용어는 재조합, 특히 숙주세포, 바람직하게는 포유동물 세포에서 발현되고 수확되어야만 하는 재조합 이종 단백질 생성물에 대해 코드하는 DNA 서열을 의미한다. 상기 유전자의 생성물은 폴리펩티드일 수 있다. 상기 이종 유전자 서열은 숙주 세포에 자연적으로 존재하지 않고 동일한 또는 상이한 종으로부터 유래되고 유전적으로 변형될 수 있다.
상기 용어 "단백질" 및 "폴리펩티드"는 붙어있는 잔기의 알파-아미노와 카르복시기 사이의 펩티드 결합에 의해 다른 것과 연결된 일련의 아미노산 잔기를 포함하도록 교체될 수 있다.
본 명세서에서 사용된 상기 용어 "비번역 게놈 DNA 서열"은 유기체의 유전자 정보를 구성하는 DNA를 포함한다. 대부분의 모든 유기체의 게놈은 DNA이고, 단지 RNA 게놈을 갖는 일부 바이러스는 예외이다. 대부분의 유기체에서 게놈 DNA 분자는 염색체라고 불리는 DNA-단백질 복합체로 구성체로 조직화되어 있다. 크기, 염색체의 수, 게놈 DNA의 성질은 다른 유기체 사이에서 다양하다. 바이러스 DNA 게놈은 단일- 또는 이중-가닥, 직선 또는 원형일 수 있다. 박테리아는 단일, 원형 염색체를 가진다. 진핵생물에서, 대부분의 게놈 DNA는 다른 크기의 다수의 직선 염색체로서 핵(핵의 DNA) 내에 위치해 있다. 진핵생물 세포는 미토콘드리아 및, 식물 및 저등 진핵생물, 클로로플라스트(chlorop마지막s)에서 추가적으로 게놈 DNA를 포함한다. 상기 DNA는 원형분자이고 상기 세포기관 내에 다수의 복사본으로 존재한다. 비번역된 게놈 DNA 서열은 일반적으로 프로모터에 실시가능하도록 연결되어 있지 않으므로 번역되지 않는다. 상기는 예를 들면, 발현되지 않는 단백질을 암호화하는 유전자, 따라서, 번역되지 않는 유전자를 포함할 수 있다.
본 명세서에서 사용된 상기 용어 "진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림"은 진핵생물 GAPDH 프로모터의 비번역된 진핵생물 게놈 DNA 3'에 해당한다. 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치, 바람직하게는 +1 뉴클레오티드 위치에서 시작하고, 여기서, 뉴클레오티드 위치는 GAPDH mRNA의 전사시작에 비례, 즉, GAPDH에 대한 진핵생물 유전자 코딩의 전사 시작의 기원(origin)에 비례한다. 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 항상 진핵생물 GAPDH 프로모터로서 동일한 기원이고, 예를 들면, 만약 GAPDH 프로모터가 인간 기원이면, 인간 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 더욱이 인간 기원이고 자연적으로 발생하는 인간 GAPDH 프로모터의 인간 게놈 DNA 서열 다운스트림에 해당함으로써, 항상 동일한 기원이다.
본 명세서에서 사용된 용어 "진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 비번역된 진핵생물 게놈 DNA 5'에 해당한다. 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 일반적으로 진핵생물 GAPDH 프로모터의 5' 주위의 뉴클레오티드 위치, 바람직하게는 진핵생물 GAPDH 프로모터 5' 말단 후 즉시의 뉴클레오티드 위치에서 시작한다. 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터, 예를 들면, 만약 GAPDH 프로모터가 인간 기원이면, 인간 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 더욱이 인간 기원이고 자연적으로 발생하는 인간 GAPDH 프로모터의 인간 게놈 DNA 서열 업스트림에 해당함으로써, 항상 동일한 기원이다.
본 명세서에서 나타낸 진핵생물 GAPDH 프로모터의 위치, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 또는 업스트림 및 다른 DNA 서열은 GAPDH mRNA의 전사 시작에 비례, 예를 들면, 특정적으로 지적하지 않는 한, 진핵생물 GAPDH의 전사 시작의 기원에 비레한다.
상기 용어 "진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 확장한다" 또는 "진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 확장한다"는 시작으로부터 특정 유전적 요소까지 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림의 길이 확장(extension), 예를 들면, 인트론(intron)으로 확장을 정의하는데 사용된다. 상기 확장은 유전적 요소를 암호화하는 전장의 DNA 서열, 예를 들면, 인트론 또는 이의 일부를 포함한다.
진핵생물 GAPDH 프로모터 및 GAPDH 프로모터의 진핵생물 게놈 DNA 업스트림 and/or 다운스트림은 NCBI 공동 데이타은행(public databank)에 있는 인간, 래트 및 마우스에 대하여 발견될 수 있고(인간, 마우스, 래트 및 차이니즈 햄스터 GAPDH 유전자 가입은 각각 유전자 IDs 2597(mRNA: NM_002046.3), 14433(mRMA: NM_008084.2), 24383(mRNA: NM_017008.3) 및 100736557(mRNA: NM_001244854.2); 생물기술 정보를 위한 국가센터(NCBI): http://www.ncbi.nlm.nih.gov/), 인간 GAPDH 유전자에 대하여 도 7 및 8에서 예로써 나타낸다.
진핵생물 GAPDH 프로모터는 GAPDH mRNA의 전사 시작에 비례하여 bps -500 주위로부터 +50 주위까지 스트레치 되도록 항상 고려된다. 인간 GAPDH 프로모터는 염색체 12 상에 위치해 있다. 인간 GAPDH 프로모터는 단편화(fragmentation) 연구에 기반한 GAPDH mRNA의 전서 시작에 비례하여 bps -488 까지 +20 스트레치(stretch) 되도록 Graven et al.(Graven et al., (1999) Biochimica et Biophysics Acta, 147: 203-218)에 의해 고려된다. NCBI 공동 데이타은행에 따라 인간 GAPDH 프로모터는 NCBI 공동 데이타은행에 의해 정의된 GAPDH mRN의 전사 시작에 비례하여 bps -462부터 +46까지 스트레치한다. 특정적으로 달리 지적되지 않는 한, 본 명세서에서 언급된 인간 GAPDH 프로모터는 4071부터 서열번호: 17의 4578까지 스트레칭하는 서열에 해당하는 GAPDH mRNA의 전사 시작에 비례하여 -462부터 +46 위치까지 스트레치한다.
본 명세서에서 언급된 인간, 마우스 및 래트 기원의 GAPDH 유전자, IFF01 유전자 및 NCAPD2 유전자의 DNA에 대해 사용된 숫자는 NCBI 공동 데이타 은행(http://www.ncbi.nlm.nih.gov/)에 있는 상기 유전자에 대해 사용된 숫자에 해당한다.
본 명세서에서 사용된 용어 "프로모터"는 DNA에 결합하는 RNA 중합효소를 감독하거나 RNA 합성을 개시하여 전사의 개시를 매개하는 유전자의 업스트림에 일반적으로 위치한 조절 DNA 서열을 정의한다.
본 명세서에서 사용된 용어 "인핸서(enhncer)"는 유전자의 정체성(identity), 유전자에 관련한 서열 위치 또는 서열의 방향(orientation)에 독립적으로 유전자의 전사를 강력하게 행하는 뉴클레오티드 서열을 정의한다.
상기 용어 "기능적으로 연결된(functionally linked)" 및 "실시가능하게 연결된(operably linked)"는 교체적으로 사용되고 두 개 이상의 DNA 시그먼트(segments), 특히, 발현되는 유전자 서열과 자체의 발현을 조절하는 상기 서열 사이에서의 기능적 관계를 언급한다. 예를 들면, 만약 프로모터 및/또는 인핸서 서열이 적절한 숙주 세포 또는 다른 발현 시스템에서 코딩 서열의 전사를 촉진 또는 조절하면 시스-엑팅(cis-acting) 전사 조절요소의 임의 조합을 포함하는, 프로모터 및/또는 인핸서 서열은 코딩 서열에 실시가능하게 연결된다. 전사된 유전자 서열에 실시가능하게 연결된 프로모터 조절 서열은 전사된 서열에 물리적으로 근접하다.
"방향(Orientation)"은 주어진 DNA 서열에서 뉴클레오티드 순서를 언급한다. 예를 들면, 얻어진 서열로부터의 DNA에서 참조 포인트와 비교하였을 때 다른 DNA 서열과 관련하여 반대 방향으로 DNA 서열의 방향은 다른 서열이 역방향된 것과 관련하는 서열의 5'에서 3'으로의 순서인 것이다. 상기 참조 포인트는 원천 DNA에 있는 다른 특정된 DNA 서열의 전사 방향 및/또는 서열을 포함하는 반복가능한 벡터의 복제의 기원을 포함한다.
본 명세서에서 사용된 용어 "발현 벡터"는 적절한 숙주 세포로 형질전환이 숙주 세포 내에 재조합 유전자 생성물의 고수준의 발현을 제공하는 분리되고 정제된 DNA 분자를 포함한다. 재조합 또는 유전자 생성물에 대한 DNA 서열 코딩에 추가하여, 발현 벡터는 mRNA로 DNA 코딩 서열의 효율적 전사 및 숙주 세포주의 단백질의 mRNA의 효율적 번역에 대해 요구되는 조절 DNA 서열을 포함한다.
본 명세서에서 사용된 용어 "숙주 세포" 또는 "숙주 세포주"는 배양에서 자라게 하고 원하는 재조합 생성 단백질을 발현하는 것이 가능한 임의 세포, 특히 포유동물 세포를 포함한다.
본 명세서에서 사용된 용어 "단편(fragment)"은 각각의 뉴클레오티드 서열, 예를 들면, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림의 일부 또는 프로모터와 같은 특정 유전적 요소를 암호화하는 뉴클레오티드 서열의 일부를 포함한다. 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림의 단편은 생물 활성을 유지할 수 있고 따라서 변경, 예를 들면, 프로모터에 실시가능하게 연결된 코딩 서열의 발현 패턴을 증가할 수 있다. 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림의 단편은 적어도 약 100부터 약 3000 bp까지, 바람직하게는 약 200부터 약 2800 bp까지, 더욱 바람직하게는 약 300부터 약 2000 bp까지 뉴클레오티드, 특히 약 500부터 약 1500까지 bp 뉴클레오티드의 범위일 수 있다. 본 발명의 발현 카세트에서 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림의 단편을 클론하기 위하여, 클로닝을 수월하게 하는 제한효소 자리를 포함하는 링커 서열은 단편의 5' 및 3' 말단에 항상 부착된다.
본 명세서에서 사용된 용어 "뉴클레오티드 서열 정체성" 또는 " 동일한 뉴클레오티드 서열"은 가능하면, 최대 퍼센트 서열 정체성(identity)를 얻기 위하여 서열 및 도입 갭(introducing gap)을 정렬시킨 후에, 예를 들면,진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림의 뉴클레오티드 서열과 동일한 후보서열에서 뉴클레오티드의 퍼센트를 포함한다. 따라서, 서열의 정체성은 두개의 뉴클레오티드 서열의 뉴클레오티드 위치에 있는 유사성을 비교하기 위하여 사용되는 표준 방법에 의해 결정될 수 있다. 항상 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림에 대한 후보 서열의 뉴클레오티드 서열의 정체성은 예를 들면, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 100%를 포함하여, 적어도 80%, 바람직하게는 적어도 85%, 더욱 바람직하게는 적어도 90%, 및 가장 바람직하게는 적어도 95%, 특히 96%, 더욱 특히 97%, 더욱 더 특히 98%, 가장 특히 99%에 있다.
본 명세서에서 사용된 용어 "CpG 자리"는 시토신(cytosine) 뉴클레오티드가 자체의 길이를 따라 베이스(bases)의 직선서열에서 구아닌(guanine) 뉴클레오티드 옆에서 일어나는 DNA 영역을 포함한다. "CpG"는 "-C-포스페이트-G-"에 대해 함축되고, 즉, 시토신 및 구아닌이 단지 하나의 포스페이트에 의해 분리된 것; 포스페이트는 DNA에서 임의 두 개의 뉴클레오사이드와 함께 연결된다. "CpG" 표기법은 시토신 및 구아닌의 CG 베이스-짝짓기로부터 상기 직선 서열을 구별하도록 사용된다.
본 명세서에서 사용된 용어 "선택적 코돈 사용(alternative codon usage)"은 CpG 서열 모티프를 피하기 위하여 동일한 아미노산을 위한 선택적 코돈 코딩의 사용을 포함한다. 상기는 새로운 CpG 자리를 유도하는 두 개의 코돈 결합을 회피하는 것뿐만 아니라 내부의 CpG 자리를 가지지 않는 바람직한 코돈 사용을 포함한다(예를 들면, 알라닌(Alanine)을 위한 GCG 코딩 및 CpG 자리를 포함하는 것은 GCT, GCC 또는 GCA에 의해 교체될 수 있다)
GAPDH mRNA의 전사시작에 비례한, 예를 들면, 진핵생물의 전사 시작의 기원에 비례하는 DNA 서열의 길이와 관련 및 뉴클레오티드 위치와 관련한 본 명세서에서 사용된 용어 "주위(around)"는 최대 ±50 % 편차 값을 포함하고, 기술된 값, 예를 들면, "3000 뉴클레오티드 주위"의 항상 최대 ±10 %는 2700 내지 3300 뉴클레오티드, 바람직하게는 2900 내지 3100 뉴클레오티드, 더욱 바람직하게는 2995 내지 3005 뉴클레오티드를 포함하고, "100 뉴클레오티드 주위"는 50 내지 150 뉴클레오티드, 바람직하게는 90 내지 110 뉴클레오티드, 더욱 바람직하게는 95 내지 105 뉴클레오티드의 값을 포함하고, "15000 뉴클레오티드 주위"는 13500 내지 16500 뉴클레오티드, 바람직하게는 14500 내지 15500 뉴클레오티드, 더욱 바람직하게는 14990 내지 15010 뉴클레오티드, 가장 바람직하게는 14995 내지 15005 뉴클레오티드 값을 포함하고, "200 뉴클레오티드 주위"는 50 to 250 뉴클레오티드s, 바람직하게는 190 to 210 뉴클레오티드s, 더욱 바람직하게는 195 to 205 뉴클레오티드 값을 포함하고, "8000 뉴클레오티드 주위"는 7200 내지 8800, 바람직하게는 7500 내지 8500 뉴클레오티드, 더욱 바람직하게는 7990 내지 8010 뉴클레오티드, 가장 바람직하게는 7995 내지 8005 뉴클레오티드이 값을 포함하고, "500 뉴클레오티드 주위"는 50 내지 550 뉴클레오티드, 바람직하게는 475 내지 525, 더욱 바람직하게는 490 내지 510, 가장 바람직하게는 495 내지 505 뉴클레오티드의 값을 포함하고, "5000 뉴클레오티드 주위"는 4500 내지 5500 뉴클레오티드, 바람직하게는 4750 내지 5250, 더욱 바람직하게는 4990 내지 5010, 가장 바람직하게는 4995 내지 5005 뉴클레오티드의 값을 포함하고, "1000 뉴클레오티드 주위"는 900 내지 1100 뉴클레오티드, 바람직하게는 950 내지 1050, 더욱 바람직하게는 990 내지 1010, 가장 바람직하게는 995 내지 1005 뉴클레오티드의 값을 포함하고, "4500 뉴클레오티드 주위"는 4050 내지 4950 뉴클레오티드, 바람직하게는 4250 내지 4750, 더욱 바람직하게는 4490 내지 4510, 가장 바람직하게는 4495 내지 4505 뉴클레오티드의 값을 포함하고, "1500 뉴클레오티드 주위"는 1350 내지 1650 뉴클레오티드, 바람직하게는 1450 내지 1550, 더욱 바람직하게는 1490 내지 1510, 가장 바람직하게는 1495 내지 1505 뉴클레오티드의 값을 포함하고, "4000 뉴클레오티드 주위"는 3600 내지 4400 뉴클레오티드, 바람직하게는 3800 내지 4200, 더욱 바람직하게는 3990 내지 4010, 더욱 바람직하게는 3995 내지 4005 뉴클레오티드의 값을 포함하고, "2000 뉴클레오티드 주위"는 1800 내지 2200 뉴클레오티드, 바람직하게는 1900 내지 2100, 더욱 바람직하게는 1990 내지 2010, 가장 바람직하게는 1995 내지 2005 뉴클레오티드의 값을 포함하고, "2700 뉴클레오티드 주위"는 2430 내지 2970 뉴클레오티드, 바람직하게는 2600 내지 2800, 더욱 바람직하게는 2690 내지 2710, 가장 바람직하게는 2695 내지 2705 뉴클레오티드의 값을 포함하고, "3300 뉴클레오티드 주위"는 2970 내지 3630 뉴클레오티드s 바람직하게는 3100 내지 3500, 더욱 바람직하게는 3290 내지 3310, 가장 바람직하게는 3295 내지 3305 뉴클레오티드의 값을 포함하고, "3200 뉴클레오티드 주위"는 2880 내지 3520 뉴클레오티드s, 바람직하게는 3000 내지 3400, 더욱 바람직하게는 3190 내지 3210, 가장 바람직하게는 3195 내지 3205 뉴클레오티드의 값을 포함하고, +7000 주위 또는 위치 +7000 주위는 위치 +6300 내지 +7700, 바람직하게는 위치 +6700 내지 +7300, 더욱 바람직하게는 위치 +6990 내지 +7010, 가장 바람직하게는 위치 +6995 내지 +7005를 포함하고, +1 주위 또는 위치 +1 주위는 위치 -10 내지 +10, 바람직하게는 위치 -5 내지 +5, 더욱 바람직하게는 위치 -1 내지 +2를 포함하고, -3500 주위 또는 위치 -3500 주위는 위치 -3150 내지 -3850, 바람직하게는 위치 -3300 내지 -3700, 더욱 바람직하게는 위치 -3490 내지 -5010, 가장 바람직하게는 위치 -3495 내지 -3505을 포함한다.
SEQ ID 번호의 서열에서 위치와 관련하여 본 명세서에서 언급되거나 사용된 인간, 마우스 및 래트 기원의 GAPDH 유전자, IFF01 유전자 및 NCAPD2 유전자의 DNA에 사용된 번호와 관련하여 본 명세서에서 사용된 용어 "주위(round)"는 최대 ± 500 bps, 바람직하게는 ± 100 bps, 더욱 바람직하게는 ± 10 bps, 가장 바람직하게는 ± 5 bps의 편차 값을 포함한다.
일실시형태에서, 본 개시는 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하는 발현 카세트를 제공하고, 여기서, 폴리뉴클레오티드 서열에 의해 암호화되는 폴리뉴클레오티드 서열은 GAPDH가 아니고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치부터 +7000 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 100 주위부터 15000 주위 뉴클레오티드까지이다.
일실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 적어도 100 뉴클레오티드 주위이고 자체 최대에서 IFF01 유전자의 두 번째 인트론 또는 이의 일부까지 연장한다. 일실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 적어도 100 뉴클레오티드 주위이고 자체 최대에서 IFF01 유전자의 마지막 인트론까지 연장한다.
인간 IFF01 유전자는 염색체 12 (NCBI 유전자 ID: 25900)의 bps 6665249 내지 6648694 주위의 인간 DNA에 위치해 있다. 일실시형태에서, 인간의 IFF01 유전자의 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 인간의 IFF01 유전자(위치 +7021)에 대한 염색체 12 코딩의 bps 6650677 주위까지 자체의 최대에서 스트레치한다. 일실시형태에서, 인간의 IFF01 유전자의 두번째 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 인간(위치 + 13574)의 IFF01 유전자에 대한 염색체 12 코딩의 bps 6657230 주위까지 자체의 최대에서 스트레치한다. 각각 인간의 IFF01 유전자의 마지막 인트론 및 IFF01 유전자의 두 번째 마지막까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 염색체 12 (NCBI 유전자 ID: 25900)의 bps 6657230 내지 6639125를 나타내는 서열번호: 17에 포함된다. 상기 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 17에 의해 나타낸 뉴클레오티드 서열의 bps 11553 주위까지 스트레치하고 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 17에 의해 나타낸 뉴클레오티드 서열의 bps 18106 주위까지 스트레치한다.
마우스 IFF01 유전자 (NCBI 유전자 ID: 320678)는 염색체 6의 bps 125095259 내지 125111800 주위의 마우스 DNA에 위치해 있다. 일실시형태에서, 마우스의 IFF01 유전자의 마지막 인트론까지 자체 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 마우스의 IFF01 유전자 (위치 + 6391)에 대한 염색체 6 코딩의 bps 125109211 주위의 자체 최대에서 스트레치한다. 일실시형태에서, 마우스의 IFF01 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 마우스 IFF01 유전자(위치 +12081)에 대한 염색체 6 코딩의 bps 125103521 주위까지 자체의 최대에서 한다. 마우스의 IFF01 유전자의 마지막 인트론 및 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 염색체 6(NCBI 유전자 ID: 320678)의 bps 125103521 내지 125119832를 나타내는 서열번호: 18에서 각각 포함된다. 마우스의 IFFO1 유전자의 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 18에 의해 나타내는 뉴클레오티드 서열의 bps 10622 주위까지 스트레치하고 마우스의 IFFO1 유전자의 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 18에 의해 나타내는 뉴클레오티드 서열의 bps 16312 주위까지 스트레치한다.
래트 IFF01 유전자(NCBI 유전자 ID: 362437)는 염색체 4의 bps 161264966 내지 161282150 주위의 래트 DNA에 위치해 있다. 일실시형태에서, 래트의 IFF01 유전자의 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 래트의 IFF01 유전자(위치 + 5154)에 대한 염색체 4 코딩의 bps 161280937 주위까지 자체의 최대에서 스트레치한다. 일실시형태에서, 래트의 IFF01 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 래트의 IFF01 유전자(위치 +6640)에 대한 염색체 4 코딩의 bps 161279451 주위까지 자체의 최대에서 스트레치한다.
래트의 IFF01 유전자의 마지막 인트론 및 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 염색체 4(NCBI 유전자 ID: 362437)의 bps 161279451 내지 161290508를 나타내는 서열번호: 19에서 각각 포함된다. IFFO1 유전자의 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 19에 의해 나타내는 뉴클레오티드 서열의 bps 9572 주위까지 스트레치하고 IFFO1 유전자의 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 19에 의해 나타내는 뉴클레오티드 서열의 bps 11058까지 스트레치한다.
차이니즈 햄스터 IFFO1 유전자(NCBI 유전자 ID: 100753382)는 bps 3577293 내지 3593683 주위의 차이니즈 햄스터 DNA에 위치해 있다. 일실시형태에서, 차이니즈 햄스터에서 IFF01 유전자의 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 차이니즈 햄스터 (위치 +6883)에서 IFF01 유전자에 대한 bps 3579014 코딩 주위까지 자체의 최대에서 스트레치한다. 일실시형태에서, 차이니즈 햄스터의 IFF01 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 차이니즈 햄스터의 IFFO1 유전자(위치 +12930)에 대한 bps 3585061 코딩 주위에 자체의 최대에서 스트레치한다. 염색체의 위치는 염색체의 데이타뱅크에서 아직 주석이 달리지 않았고 현재 서열정보는 많은 알려지지 않은 베이스를 포함한다. 그러므로 한계의 정확한 표기법은 더 많은 정확한 서열 정보의 활용가능성으로 변할 수 있다.
차이니즈 햄스터의 IFF01 유전자의 마지막 및 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 bps 3567932 내지 3585061를 나타내는 서열번호: 29에 각각 포함된다. IFFO1 유전자의 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 29에 의해 나타낸 바와 같이 뉴클레오티드 서열의 bps 11083 주위까지 스트레치하고 IFFO1 유전자의 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 29에 의해 나타낸 바와 같이 뉴클레오티드 서열의 bps 17130 주위까지 스트레치한다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 진핵생물 GAPDH 폴리아데닐레이션 자리에서 시작하고, 예를 들면, 진핵생물 GAPDH 폴리아데닐레이션 자리를 암호화하는 첫 번째 뉴클레오티드에서 시작한다. 바람직하게는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 진핵생물 GAPDH 폴리아데닐레이션 자리의 다운스트림에서 시작하고, 예를 들면, 진핵생물 GAPDH 폴리아데닐레이션 자리를 암호화하는 마지막 뉴클레오티드 후에 즉시 시작한다. 더욱 더 바람직하게는, 진핵생물 GAPDH 프로모터의 진핵생물 GAPDH 프로모터는 진핵생물 GAPDH 폴리아데닐레이션 자리의 다운스트림에서 시작하고 진핵생물 GAPDH 프로모터는 비번역된 게놈 DNA 서열 다운스트림의 길이는 적어도 100 뉴클레오티드 주위이고 IFF01 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장한다.
일실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +3881 주위의 뉴클레오티드 위치로부터 +5000 주위의 뉴클레오티드 위치까지 내에서 시작하고, 바람직하게는 +3931 주위의 뉴클레오티드 위치로부터 +5000 주위의 뉴클레오티드 위치까지 영역거리 내에서, 더욱 바람직하게는 +4070 주위의 뉴클레오티드 위치로부터 +5000 주위의 뉴클레오티드 위치까지 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례한다.
진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은, 예를 들면, 본 발명에서 사용된 진핵생물 GAPDH 폴리아데닐레이션 자리의 다운스트림은 항상 위치 +3931 주위의 뉴클레오티드 위치에서 시작하고, 바람직하게는 +4070 주위의 뉴클레오티드 위치에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례한다.
인간 GAPDH 폴리아데닐레이션 자리의 인간 비번역된 게놈 DNA 서열 다운스트림은 뉴클레오티드 위치 +3931(서열번호: 17에서 나타낸 바와 같이 bp 8463에 해당하는 GAPDH mRNA의 전사 시작에 비례하여) 주위에서 시작한다. 바람직하게는, 만약 GAPDH 폴리아데닐레이션 자리의 비번역된 게놈 DNA 서열 다운스트림은 인간으로부터 이면, GAPDH 폴리아데닐레이션 자리의 비번역된 게놈 DNA 서열 다운스트림은 +3931 주위에서 시작하고(서열번호: 17에 나타낸 바와 같이 bp 8463에 해당하는 GAPDH mRNA의 전사 시작에 비례하여) 자체의 길이는 서열번호: 17에서 나타낸 바와 같이 bps 8463 주위로부터 11819 주위까지의 서열에 해당하는 3357 bps 주위이고 더욱 바람직하게는 이것은 +4070 주위에서 시작하고(서열번호: 17에서 나타낸 바와 같이 bps 8602에 해당하는 GAPDH mRNA의 전사 시작에 비례하여) 자체의 길이는 서열번호: 17에 나타낸 바와 같이 bps 8602 주위부터 11819 주위까지의 서열에 해당하는 3218 bps 주위이다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함한다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상보적인 뉴클레오티드 서열을 포함한다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열을 포함한다.
일부 실시형태에서, 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열은 5개 또는 미만, 4개 또는 미만, 더욱 바람직하게는 3개 또는 미만, 가장 바람직하게는 2개 또는 미만, 특히, 1 개 핵산 변형, 상기 핵산 변형은 바람직하게는 핵산 치환이다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 바람직하게는 200 주위부터 8000 주위까지 뉴클레오티드이고, 더욱 바람직하게는 500 주위부터 5000 주위까지 뉴클레오티드이고, 더욱 더 바람직하게는 1000 주위부터 4500 주위까지 뉴클레오티드이고, 가장 바람직하게는 1500 주위부터 4000 주위까지 뉴클레오티드이고, 특히 2000 주위부터 3500 주위까지 뉴클레오티드, 더욱 특히 2700 주위부터 3300 주위까지, 더욱 더 특히 3200 주위, 가장 특히 3218 뉴클레오티드이다. 본 명세서에서 정의된 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 비번역된 게놈 DNA 서열에 첨가된 임의 링커 서열을 포함한다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향되었다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열에 관하여 반대 방향으로 지향되었다.
일부 실시형태에서, 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하는 발현 카세트는 추가적으로 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림을 포함하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지 영역내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100 주위부터 15000 주위까지 뉴클레오티드이다.
다른 실시형태에서, 발현 카세트는 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하고, 상기 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비레하고, 발현 카세트가 진핵생물 GAPDH 프로모터 또는 이의 단편을 포함하지 않는 것에 기반하여 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100부터 15000 주위의 뉴클레오티드까지이다.
일부 실시형태에서, 상기 발현 카세트는 추가적으로 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치부터 +7000 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 100 주위부터 15000 주위까지의 뉴클레오티드이다. 상기 실시형태에서 사용된 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은, 예를 들면, 상기에 설명되어 있다.
일부 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 바람직하게는 200 주위부터 8000주위까지 뉴클레오티드이고, 더욱 바람직하게는 500 주위부터 5000 주위까지 뉴클레오티드이고, 더욱 더 바람직하게는
1000 주위부터 4500 주위의 뉴클레오티드, 가장 바람직하게는 1500 주위부터 4000 주위의 뉴클레오티드, 특히 길이에서 2000 주위부터 3500 주위의 뉴클레오티드, 더욱 특히 2700 주위부터 3300 주위까지, 더욱 더 특히 3200 주위, 가장 특히 3158 뉴클레오티드이다. 본 명세서에서 정의된 바와 같이 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 비번역된 게놈 DNA 서열에 첨가된 임의 링커 서열을 포함하지 않는다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드 주위이고 NCAPD2 유전자의 시작 코돈까지 자체의 최대에서 확장한다. 추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드 주위이고 NCAPD2 유전자의 세 번째 마지막 인트론까지 자체의 최대에서 확장한다. 추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드 주위이고 NCAPD2 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장한다. 추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드 주위이고 NCAPD2 유전자의 마지막 인트론까지 자체의 최대에서 확장한다.
인간 NCAPD2 유전자 (NCBI 유전자 ID: 9918)는 염색체 12의 bps 6603298 내지 6641132 주위의 인간 DNA에 위치해 있다. 일실시형태에서, 인간 NCAPD2 유전자의 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 인간의 NCAPD2 유전자에 대한 염색체 12 코딩의 6640243 bps 주위까지 자체의 최대에서 스트레치한다(서열번호: 17에서 bp 1119에 해당하는 GAPDH 유전자의 전사 시작에 비례하여 -3414위치).
일실시형태에서, 인간의 NCAPD2 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림이 길이는 인간의 NCAPD2 유전자에 대한 염색체 12 코딩의 6639984 bps 주위까지 자체의 최대에서 스트레치한다(서열번호: 17에서 bp 860에 해당하는 GAPDH 유전자의 전사 시작에 비례하여 -3673 위치).
일실시형태에서, 인간의 NCAPD2 유전자의 세 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 인간의 NCAPD2 유전자에 대한 염색체 12 코딩의 6639125 bps 주위까지 자체의 최대에서 스트레치한다(서열번호: 17에서 bp 1에 해당하는 GAPDH 유전자의 전사 시작에 비례하여 -4532 위치).
인간의 NCAPD2 유전자의 마지막 인트론, 두 번째 마지막 인트론 및 세 번째 마지막 인트론까지, 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 17에 각각 포함되고, 이는 염색체 12의 bps 6657230 내지 6639125(NCBI 유전자 ID: 9918)를 나타낸다.
마우스 NCAPD2 유전자(Gene ID: 68298)는 염색체 6의 125118025 내지 125141604 위치 주위의 마우스 DNA에 위치해 있다. 일실시형태에서, 마우스의 NCAPD2 유전자의 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는(전사 시작의 500 bps 업스트림의 길이를 가지는 것으로 추정됨) 마우스의 NCAPD2 유전자에 대한 염색체 6 코딩의 bps 125118607 주위까지 자체의 최대에서 스트레치한다.
일실시형태에서, 마우스의 NCAPD2 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 마우스의 NCAPD2 유전자에 대한 염색체 6 코딩의 125118880 bps 주위까지 자체의 최대에서 스트레치한다.
일실시형태에서, 마우스의 NCAPD2 유전자의 세 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 마우스의 NCAPD2 유전자에 대한 염색체 6 코딩의 125119832 bps 주위까지 자체의 최대에서 확장한다.
마우스의 NCAPD2 유전자의 마지막 인트론, 두 번째 마지막 인트론 및 세 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 18에 각각 포함되고, 이는 염색체 6의 bps 125103521 내지 125119832(NCBI 유전자 ID: 68298)를 나타낸다. 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 18(마우스 GAPDH mRNA의 전사 시작에 비례하여 -3006)에 의해 나타낸 바와 같이 뉴클레오티드 서열의 bp1226 주위까지 스트레치한다. 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 18에 의해 나타낸 바와 같이 뉴클레오티드 서열의 bps 953 주위까지 스트레치한다(마우스 GAPDH mRNA의 전사 시작에 비례하여 -3279). 세 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 18에 나타낸 바와 같이 뉴클레오티드 서열의 bp 1 주위까지(마우스 GAPDH mRNA의 전사 시작에 비례하여 -4231)스트레치한다.
래트 NCAPD2 유전자(Gene ID: 362438)는 염색체 4의 161288671 내지 161310417위치 주위의 진핵생물 DNA에 위치해 있다. 일실시형태에서, 래트의 NCAPD2 유전자의 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 래트의 NCAPD2 유전자에 대한 염색체 4 코딩의 161289191 bps 주위까지 자체의 최대에서 스트레치한다. 일실시형태에서, 래트의 NCAPD2 유전자의 두 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 래트의 NCAPD2 유전자에 대한 염색체 4 코딩의 161289446 bps 주위까지 자체의 최대에서 스트레치한다. 일실시형태에서, 래트의 NCAPD2 유전자의 세 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 래트의 NCAPD2 유전자에 대한 염색체 4 코딩의 161290508 bps 주위까지 자체의 최대에서 스트레치한다.
래트의 NCAPD2 유전자의 마지막 인트론, 두 번째 마지막 인트론 및 세 번째 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 19에 각각 포함되고, 염색체 4의 bps 161279451 내지 161290508(NCBI 유전자 ID: 362438)를 나타낸다. 마지막 인트론을 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 19에 나타낸 바와 같이 뉴클레오티드 서열의 bps 1318 주위까지 스트레치한다(래트 GAPDH mRNA의 전사 시작에 비례하여 -3101). 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 19에 의해 나타낸 바와 같은 뉴클레오티드 서열의 bps 1063 주위까지 스트레치한다(래트 GAPDH mRNA의 전사시작에 비례하여 -3356 위치). 세 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 19에 의해 나타낸 바와 같은 뉴클레오티드 서열의 bp 1 주위까지 스트레치한다(래트 GAPDH mRNA의 전사 시작에 비례하여 -4418 위치).
차이니즈 햄스터 NCAPD2 유전자(Gene ID: 100753087)는 3544184 내지 3569879 위치 주위의 진핵생물 DNA에 위치해 있다. 염색체의 위치는 NCBI 데이타베이스 상에서 활용되지 않는다. 일실시형태에서, 차이니즈 햄스터의 NCAPD2 유전자의 마지막 인트론까지 자체의 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 차이니즈 햄스터에서 3569380 bps 주위에서 자체 최대에서 스트레치한다. 일실시형태에서, 차이니즈 햄스터의 NCAPD2 유전자의 두 번째 마지막 인트론까지 자체 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 차이니즈 햄스터의 3569131 bps 주위까지 자체 최대에서 스트레치한다. 일실시형태에서, 차이니즈 햄스터의 NCAPD2 유전자의 세 번째 마지막 인트론까지 자체 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 차이니즈 햄스터의 3567932 bps 주위까지 자체 최대에서 스트레치한다.
차이니즈 햄스터의 NCAPD2 유전자의 마지막 인트론, 두 번째 마지막 인트론 및 세 번째 마지막 인트론까지 자체 최대에서 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 각각 서열번호: 29에 포함되고, 이는 bps 3567932 내지 3585061를 나타낸다. 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 29에 의해 나타낸 바와 같이 뉴클레오티드 서열의 bps 1449 주위까지 스트레치한다(차이니즈 햄스터 GAPDH mRNA의 전사시작에 비례하여 -2752). 두 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 29(차이니즈 햄스터 GAPDH mRNA의 전사시작에 비례하여 -3001 위치)에 의해 나타낸 바와 같은 뉴클레오티드 서열의 bps 1200 주위까지 스트레치한다. 세 번째 마지막 인트론까지 확장하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 29에 의해 나타낸 바와 같은 뉴클레오티드 서열의 bp 1까지 스트레치한다(차이니즈 햄스터 GAPDH mRNA의 전사시작에 비례하여 -4200 위치).
일부 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 -500 주위 위치의 뉴클레오티드부터 -3500주위 위치의 뉴클레오티드까지 영역거리 내, 바람직하게는 -576 주위 위치의 뉴클레오티드부터 -3500 주위 위치의 뉴클레오티드까지 영역거리 내에서 항상 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사시작에 비례한다.
일부 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 -500 주위 뉴클레오티드 위치에서, 바람직하게는 -576 주위 뉴클레오티드 위치에서 항상 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사시작에 비례한다.
인간에서 인간 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 뉴클레오티드 위치 -463 주위에서 시작한다(서열번호: 17에 나타낸 바와 같은 bp 4533에 해당하는 GAPDH mRNA의 전사시작에 비례하여). 바람직하게는, 만약 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림이 인간으로부터이면, GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 -500 주위에서 시작한다(서열번호: 17에 나타낸 바와 같이 bp 4533에 해당하는; GAPDH mRNA의 전사시작에 비례하여). 더욱 바람직하게는, 만약 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림이 인간으로부터이면, GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 -576 주위에서 시작하고(GAPDH mRNA의 전사시작에 비례하여; 서열번호: 17에 나타낸 바와 같이 bp 4533에 해당하는) 자체의 길이는 서열번호: 17에 나타낸 바와 같이 bps 800 주위부터 3957주위까지 서열에 해당하는 3158 bps 주위이다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열, 바람직하게는 서열번호: 7, 9, 10, 11, 12, 13, 14, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열, 또는 서열번호: 20, 22, 23, 24, 25, 26, 27, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 더욱 바람직한 것은 서열번호: 10, 12, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열, 더욱 바람직하게는 서열번호: 10, 12, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열이고, 상기 서열번호: 10 및/또는 16을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열과 관련하여 반대 방향으로 지향되고, 서열번호: 12 및/또는 15를 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향된다. 마찬가지로 더욱 바람직한 것은 서열번호: 23, 25, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열, 더욱 바람직하게는 서열번호: 23, 25, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열이고, 상기 서열번호: 23 및/또는 16을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열과 관련하여 반대 방향으로 지향되고 서열번호: 25 및/또는 28을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향된다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완라는 뉴클레오티드 서열, 바람직하게는 서열번호: 7, 9, 10, 11, 12, 13, 14, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완적인 뉴클레오티드 서열, 또는 서열번호: 20, 22, 23, 24, 25, 26, 27, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완적인 뉴클레오티드 서열을 포함한다. 더욱 바람직한 것은 서열번호: 10, 12, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완되는 뉴클레오티드 서열이다. 마찬가지로 더욱 바람직한 것은 서열번호: 23, 25, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완적인 뉴클레오티드 서열이다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열을 포함하고, 바람직하게는 서열번호: 7, 9, 10, 11, 12, 13, 14, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열, 또는 서열번호: 20, 22, 23, 24, 25, 26, 27, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열을 포함한다. 더욱 바람직한 것은 서열번호: 10, 12, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 80% 일치하는 뉴클레오티드 서열, 더욱 바람직하게는 서열번호: 10, 12, 15 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 80% 일치하는 뉴클레오티드 서열이고, 상기 서열번호: 10 및/또는 16을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열과 관련하여 반대 방향으로 지향되고, 서열번호: 12 및/또는 15을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향된다. 마찬가지로 더욱 바람직한 것은 서열번호: 23, 25, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열이고, 더욱 바람직하게는 서열번호: 23, 25, 28 및 16 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열이고, 상기 서열번호: 23 및/또는 16을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열과 관련하여 반대 방향으로 지향되고, 서열번호: 25 및/또는 28을 포함하는 뉴클레오티드 서열은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향된다.
일부 실시형태에서, 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열은 5개 또는 미만, 바람직하게는 4개 또는 미만, 더욱 바람직하게는 3개 또는 미만, 가장 바람직하게는 2개 또는 미만, 특히 핵산 변형이고, 상기 핵산 변형은 바람직하게는 핵산 치환이다.
일부 실시형태에서, 서열번호: 7, 9, 11, 14, 20, 22, 24 및 27 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열은 5개 또는 미만, 바람직하게는 4개 또는 미만, 더욱 바람직하게는 3개 또는 미만, 가장 바람직하게는 2개 또는 미만, 특히 핵산 변형을 포함하고, 상기 핵산 변형은 바람직하게는 핵산 치환이다.
일부 실시형태에서, 서열번호: 7, 9, 11, 14, 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열은 서열번호: 7, 9, 11, 14의 뉴클레오티드 서열의 시작에 비례하여 16 위치에서 하나의 핵산 치환을 포함한다. 바람직하게는 뉴클레오티드 서열의 시작에 비례하는 16 위치에서 G는 T로 대체될 수 있다.
일부 실시형태에서, 서열번호: 20, 22, 24 및 27 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열은 서열번호: 20, 22, 24 및 27의 뉴클레오티드 서열의 시작에 비례하여 13 위치에서 하나의 핵산 치환을 포함한다. 바람직하게는 뉴클레오티드 서열의 전사에 비례하여 13 위치의 G는 T로 대체된다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향된다.
추가 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열에 비례하여 반대 방향으로 지향된다.
바람직한 실시형태에서, 발현 카세트는 상기에서 설명된 바와 같이 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림을 포함한다. 바람직하게는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 기원은 동일하고, 예를 들면, 동일한 종(species)이다. 더욱 바람직하게는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림, 진핵생물 GAPDH 프로모터 및 숙주 세포의 비번역된 게놈 DNA 서열 업스트림의 기원은 동일하고, 예를 들면, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림 및 숙주 세포의 기원은 동일한 포유동물이고, 예를 들면, 인간으로부터이다.
일부 실시형태에서, 만약 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림이 하나의 종으로부터 비번역된 게놈 DNA 서열이면, 발현 카세트의 프로모터는 동일한 동일한 종으로부터의 GAPDH 프로모터가 아니다.
일부 실시형태에서, 만약 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림이 인간 기원의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림이면, 발현 카세트의 프로모터는 인간 GAPDH 프로모터가 아니다.
일부 실시형태에서, 발현 카세트의 프로모터는 GAPDH 프로모터가 아니다.
일실시형태에서, 만약 발현 카세트가 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물 글리세르알데하이드 3-포스페이트 디하드로제네즈(Glyceraldehyde 3-phosphate dehydrogenase (GAPDH)) 프로모터를 포함한다면, 상기 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치부터 +7000 주위의 뉴클레오티드 위치까지 영역거리 내에서 시작하고, 뉴클레오티드 위치는 GAPDH mRNA의 전사시작에 비례하고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 100 주위부터 15000 주위의 뉴클레오티드까지이고, 상기 발현 카세트는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림을 추가적으로 포함하고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100 주위부터 15000 주위의 뉴클레오티드까지이면, 발현 카세트의 프로모터는 진핵생물 GAPDH 프로모터, 바람직하게는 포유동물 GAPDH 프로모터, 더욱 바람직하게는 설치류(설치류) 또는 인간 GAPDH 프로모터일 수 있다. 상기 실시형태에서, 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지 영역거리 내에서 시작하는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 바람직하게는 진핵생물 GAPDH 프로모터의 업스트림에 직접적으로 위치해 있고, 더욱 바람직하게는 상기 실시형태에서 발현 카세트는 진핵생물 GAPDH 프로모터를 포함하는 자연적으로 발생하는 게놈 DNA 서열 및 -3500 주위의 뉴클레오티드 위치까지 확장을 포함하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례한다
일부 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 포유동물 기원이고, 예를 들면, 진핵생물 GAPDH 프로모터는 포유동물 GAPDH 프로모터이고 포유동물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 본 명세서에서 설명된 바와 같이 사용될 수 있다.
일부 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 설치류 또는 인간 기원이고, 예를 들면, 진핵생물 GAPDH 프로모터는 설치류 또는 인간 GAPDH 프로모터이고 설치류 또는 인간 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 본 명세서에서 설명된 바와 같이 사용된다.
바람직하게는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 인간, 래트 또는 마우스 기원, 더욱 바람직하게는 인간 또는 마우스 기원으로부터, 가장 바람직하게는 인간 기원으로부터 선택된다.
일부 실시형태에서, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열에 실시가능하게 연결되지 않는다.
일부 실시형태에서, 발현 카세트는 폴리아데닐레이션 자리를 포함한다. 바람직하게는 폴리아데닐레이션 자리는 SV40 poly(A) 및 BGH(Bovine Growth Hormone) poly(A)로 구성된 군으부터 선택된다.
일부 실시형태에서, 발현 카세트의 프로모터 및 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열은 실시가능하도록 연결된다.
일부 실시형태에서, 발현 카세트의 프로모터는 SV40 프로모터, 인간 tk 프로모터, MPSV 프로모터, 마우스 CMV, 인간 CMV, 래트 CMV, 인간 EF1알파, 차이니즈 햄스터 EF1알파, 인간 GAPDH, MYC, HYK 및 CX 프로모터를 포함하는 하이브리드 프로모터로 구성된 군으로부터 선택된다.
일부 실시형태에서, 발현 카세트에 의해 암호화되는 폴리펩티드는 비당화(non-glycosylated) 및 당화된(glycosylated) 폴리펩티드일 수 있다. 당화된 폴리펩티드는 적어도 하나의 올리고사카라이드(oligosaccharide) 사슬을 갖는 폴리펩티드를 의미한다.
비당화된 단백질의 예로는, 예를 들면, 비당화된 호르몬; 비당화된 효소; 신경 성장 요인(NGF) 페밀리, 상피 성장 요인(EGF) 및 섬유모세포 성장요인(fibroblast growth factor(FGF))페밀리의 비당화된 성장 요인 및 호르몬 및 성장요인에 대한 비당화된 수용체이다.
당화된 단백질의 예로는 호르몬 및 호르몬 방출요인, 응고요인(clotting factors), 항응고 요인, 호르몬 또는 성장요인에 대한 수용체, 신경영양성 요인 사이토카인(neurotrophic factors cytokines) 및 이의 수용체, T-세포 수용체, 표면 메브린 단백질, 운반 단백질, 귀소수용체(homing receptors), 어드레신(addressins), 조절 단백질, 항체, 면역접합체(immunoadhesins)와 같은 키메릭 단백질, 및 당화된 단백질의 임의 단편이다. 바람직하게는 항체, 항체 단편 또는 항체 유도체(예를 들면, Fc 융합 단백질 및 양특이성 항체(bispecific antibodies)와 같은 특정 항체 포맷)로 구성된 군으로부터 선택된다. 본 명세서에서 사용된 항체 단편은 (i) 도메인, (ii) Fab' 및 Fab'-SH를 포함하여, VL, VH, CL 또는 CK 및 CH1 도메인을 구성하는 Fab 단편, (iii) VH 및 CH1 도메인을 구성하는 Fd 단편, (iv) 단일 가변 도메인(variable domain)으로 구성된 dAb 단편(ard ES et al., (1989) Nature, 341(6242): 544-6) (v) F(ab')2 단편, 2 개 연결된 Fab 단편을 포함하는 이가단편(bivalent fragment) (vi) 단일 사슬 Fv 분자 (scFv), 상기 VH 도메인 및 VL 도메인은 항원결합 자리를 형성하기 위해 연합된 두 개의 도메인을 가능하게 하는 결합 링커에 의해 연결된다(Bird RE et al ., (1988) Science, 242(4877): 423-6; Huston JS et al., (1988) Proc Natl Acad Sci U S A, 85(16): 5879-83), (vii) "이중체(diabodies)" 또는 "삼중체(triabodies)", 다가(multivalent) 또는 유전자 융합에 의한 다중특정 단편 구조체(Holliger P et al., (1993) Proc Natl Acad Sci U S A, 90(14): 6444-8; Holliger P et al., (2000) Methods Enzymol, 326: 461-79), (viii) scFv, 이중체 또는 Fc 영역에 융합된 도메인 항체 및 (ix) 동일한 또는 상이한 항체에 융합된 scFv을 포함하나, 이에 한정하지 않는다.
일부 실시형태에서 발현 카세트는 프로모터, 인핸서, 전사 대조군 요소, 및 선별가능한 마커, 바람직하게는 동물세포에서 발현되는 선별가능한 마커로 구성된 군으로부터 선택되는 유전적 요소를 추가적으로 포함한다. 전사 대조군 요소, 예를 들면, 코작(Kozak) 서열 또는 전사 종결자 요소(transcriptional terminator element)이다.
일실시형태에서, 유전적 요소는 선별가능한 마커를 암호화하는 폴리뉴클레오티드 서열에 포함된 CpG 자리의 내용이 45 또는 미만, 바람직하게는 40 또는 미만, 더욱 바람직하게는 20 또는 미만, 특히 10 또는 미만, 더욱 특히 5 또는 미만, 가장 특히 0(CpG 자리가 완전히 제거됨)인 선별가능한 마커이다.
추가적 측면에서, 본 개시는 발현 벡터, 바람직하게는 상기에서 설명된 바와 같이 발현 카세트를 포함하는 포유동물 발현 벡터를 제공한다. 일부 실시형태에서, 발현 벡터는 적어도 두 개의 별도의 전사 유닛을 포함한다. 두 개의 별도의 전사 유닛을 갖는 발현 벡터는 또한 이중-유전자 벡터로서 언급된다. 이의 실시예로는 첫 번째 전사 유닛은 항체 또는 이의 단편의 중쇄를 암호화하고 두 번째 전사 유닛은 항체의 경쇄를 암호화하는 벡터이다. 다른 실시예로는 두 개의 전사 유닛이 효소와 같은 단백질의 두 개의 상이한 서부유닛을 암호화하는 이중-유전자 벡터이다. 그러나, 본 발명의 발현 벡터는 두 개 이상의 별도의 전사 유닛, 예를 들면, 3개, 4개 또는 그 이상의 별도의 상이한 폴리펩티드 사슬을 암호화하는 다른 뉴클레오티드 서열을 포함하는 각각의 전사유닛을 포함하는 것이 또한 가능하다. 따라서, 실시예는 각각은 4개의 상이한 서브유닛으로 구성된 효소의 하나의 서브유닛을 암호화하는 상이한 뉴클레오티드 서열을 포함하는 4 개의 별도의 전사 유닛을 갖는 벡터이다.
일부 실시형태에서, 발현 벡터는 추가 프로모터, 인핸서, 전사 대조군 요소, 복제 기원 및 선별가능한 마커로 구성된 군으로부터 선택되는 유전적 요소를 추가적으로 포함한다.
일부 실시형태에서, 발현 벡터는 복제 기원 및 선별가능한 마커를 암호화하는 발현 벡터의 폴리뉴클레오티드 서열에 포함된 CpG 자리의 내용이 200 또는 미만, 바람직하게는 150 또는 미만, 특히 100 또는 미만, 더욱 특히 50 또는 미만, 가장 특히 30 또는 미만인 복제 기원 및 선별가능한 마커를 추가적으로 포함한다.
티미딘 키나제(thymidine kinase(tk)), 디하이드로폴레이트 리덕타제(dihydrofolate reductase (DHFR)), 퓨로마이신, 네오마이신 또는 글루타민 합성효소(glutamine synthetase(GS))와 같은 일반적으로 사용되는 임의 선별가능한 마커는 본 발명의 발현 카세트 또는 발현 벡터에 사용될 수 있다. 바람직하게는, 본 발명의 발현 벡터는 본 발명의 이종 단백질의 배출(secretion)에 대한 발현 카세트의 삽입체를 위한 유용한 제한효소 자리의 제한된 수를 또한 구성한다. 단지 일시적/유전차 부체(episomal) 발현에 특히 사용되는 경우에, 본 발명의 발현 벡터는 진핵생물 숙주 세포에서 자율복제/유전자 부체 유지를 위한 엡스타인-바바이러스(Epstein Barr Virus(EBV)) 또는 SV40 바이러스의 oriP 기원과 같은 복제의 기원이 추가적으로 포함될 수 있으나 선별가능한 마커가 결핍될 수 있다. 벡터의 복제를 용이하게 하는 관련 요인이 부족한 세포에서 일시적 발현이 또한 가능하다.
발현 카세트를 정박하는 발현 벡터는 형광마커, ncRNA를 코딩하는 발현 카세트, 항세포사멸 단백질을 코딩하는 발현 카세트, 또는 배출 경로의 용량을 증가시키는 단백질을 코딩하는 발현 카세트를 추가적으로 포함할 수 있다.
추가적 측면에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림
b) 프로모터
c) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
d) 폴리아데닐레이션 자리
e) 인핸서
f) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림, 또는
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림
b) 인핸서
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림, 또는
a) 인핸서
b) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림,
만약 a) 또는 b)가 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림이면 f)는 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림이고 만약 a) 또는 b)가 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림이면 f)는 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림이라는 조건으로, 상기 인핸서의 포함은 선택적이고, 상기 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치부터 +7000 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 100 주위부터 15000 주위 뉴클레오티드까지이고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100 주위부터 15000 주위의 뉴클레오티드까지이다.
일부 실시형태에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림
b) 프로모터
c) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
d) 폴리아데닐레이션 자리
e) 인핸서
f) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림, 상기 인핸서의 포함은 선택적이다.
추가적 측면에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림
b) 인핸서
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림, 상기 인핸서의 포함은 선택적이다.
추가적 측면에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 인핸서
b) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림, 상기 인핸서의 포함은 선택적이다.
추가적 측면에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림
b) 프로모터
c) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
d) 폴리아데닐레이션 자리
e) 인핸서
f) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림, 상기 인핸서의 포함은 선택적이다.
추가적 측면에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림
b) 인핸서
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림, 상기 인핸서의 포함은 선택적이다.
추가적 측면에서, 본 개시는 하기의 순서를 포함하는 발현 벡터를 제공한다:
a) 인핸서
b) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림, 상기 인핸서의 포함은 선택적이다.
진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림, 인핸서, 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 폴리아데닐레이션 자리 및 발현 벡터의 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은, 예를 들면, 상기에서 설명된 바와 같다.
추가적 측면에서, 본 개시는 상기에서 설명된 바와 같이 발현 카세트 또는 발현 벡터를 포함하는 숙주 세포를 제공한다. 숙주 세포는 인간 또는 비인간 세포일 수 있다. 바람직한 숙주 세포는 포유동물 세포이다. 포유동물 숙주 세포의 바람직한 실시예는, 제한 없이, 인간 배아 신장(human embryonic kidney) 세포(Graham FL et al., J. Gen. Virol. 36: 59-74), MRC5 인간 섬유모세포(fibroblasts), 983M 인간 흑색종(melanoma) 세포, MDCK 카닌 신장(canine kidney)세포, 스프라그-다우리 래트로부터 분리된 RF 배양된 래트 폐 섬유모세포, B16BL6 마우스 흑색종(murine melanoma) 세포, P815 마우스 비만 세포, MTl A2 마우스 유방 샘암종(murine mammary adenocarcinoma) 세포, PER:C6 세포(Leiden, Netherlands) 및 차이니즈 햄스터 난소(CHO) 세포 또는 세포주(Puck et al., 1958, J. Exp. Med. 108: 945-955)를 포함한다.
특히 바람직한 실시형태에서 숙주 세포는 차이니즈 햄스터 난소(CHO) 세포 또는 세포주이다. 적합한 CHO 세포주는, 예를 들면, CHO-S(Invitrogen, Carlsbad, CA, USA), CHO Kl(ATCC CCL-61), CHO pro3-, CHO DG44, CHO P12 또는 dhfr- CHO 세포주 DUK-BII(Chasin et al., PNAS 77, 1980, 4216-4220), DUXBI l(Simonsen et al., PNAS 80, 1983, 2495-2499), 또는 CHO-K1SV(Lonza, 베이스l, Switzerland)를 포함한다.
추가적 측면에서, 본 개시는 상기에서 설명된 바와 같이 발현 카세트 또는 발현 벡터를 갖는 숙주 세포를 형질전환시키는 것 및 폴리펩티드를 회수하는 것을 포함하는, 폴리펩티드의 발현을 위한 시험관 내 방법을 제공한다. 상기 폴리펩티드는 바람직하게는 이종(heterologous), 더욱 바람직하게는 인간 폴리펩티드이다.
발현 카세트 또는 발현 벡터를 본 발명에 따른 숙주세포로 형질전환을 위하여, 당업계에서 잘 알려진 기술, 예를 들면, 전기천공법(electoporation), 칼슘포스페이트 공용침전법(calcium phophste co-precipitation), DEAE-덱스트란 형질전환, 리포펙틴과 같은 임의 형질전환 기술은 만약 주어진 숙주 세포 형태가 적절하다면 사용될 수 있다. 본 발명의 발현 카세트 또는 발현 벡터를 갖는 형질전환된 숙주 세포는 일시적 또는 안정적으로 형질전환된 세포주로서 해석되는 것을 알려져 있다. 따라서, 본 발명에 따라 본 발명의 발현 카세트 또는 발현 벡터는 유전자 부체(episomally)로 유지될 수 있고, 예를 들면, 일시적으로 형질전환될 수 있거나 숙주 세포의 게놈에서 안정적으로 통합(integration)될 수 있고, 예를 들면, 안정적으로 형질전환될 수 있다.
일시적 형질전환은 벡터 운반 선별가능한 마커를 위한 임의 선별 압력(selection pressure)의 비장치(non-appliance)에 의해 특징될 수 있다. 형질전환 후 통상적으로 마지막 2일부터 10일 까지 지속하는 일시적 발현 실험에서, 형질전환된 발현 카세트 또는 발현 벡터는 유전자 부체 요소로서 유지되고 게놈으로 통합되지 않는다. 즉 형질전환된 DNA는 항상 숙주 세포 게놈으로 통합되지 않는다. 숙주 세포는 형질전환된 DNA를 손실하는 경향이 있고 일시적으로 형질전환된 세포 풀의 배양에 따른 집단에서 형질전환된 세포를 과성장시키는 경향이 있다. 따라서 발현은 형질전환 즈후에 가장 강하고 시간이 지나면서 감소한다. 바람직하게는, 본 발명에 따른 일시적 형질전환체는 형질전환 후 2 내지 10일까지 선별 압력의 부재에서 세포 배양에서 유지되는 세포로서 이해된다.
본 발명의 바람직한 실시형태에서 숙주 세포 예를 들면, CHO 숙주 세포는 본 발명의 발현 카세트 또는 발현 벡터를 같이 안정적으로 형질전환된다. 안정적 형질전환은 벡터 DNA와 같은 새로이 도입된 외부 DNA가 게놈 DNA로 항상 무작위, 비상동재조합 사건에 의해 혼합되는 것이다. 벡터 DNA의 복제수(copy number) 및 동시에 유전자 생성의 수는 벡터 서열이 숙주 세포의 DNA로 통합 후에 증폭되어 왔다. 따라서, 상기 안정적 통합(integration)은, 유전자 증폭을 위한 선별 압력에서 추가적으로 증가하는 유출에 따라, CHO 세포에서 이중분 염색체로 발생한다. 추가적으로, 안정적 형질전환은 예를 들면, 박테리아 복제수 조절 영역이 게놈 통합에 따른 과잉 (superfluous)을 표현하는 것과 같은 재조합 유전자 생성의 발현과 직접적으로 관련되지 않은 벡터 서열 부분의 손실을 초래할 수 있다. 따라서, 형질전환된 숙주 세포는 게놈으로 발현 카세트 또는 발현 벡터의 적어도 일부 또는 상이한 일부를 통합한다.
추가적 측면에서, 본 개시는 포유동물 숙주 세포로부터 이종 폴리펩티드의 발현을 위한, 특히 포유동물 숙주 세포로부터 이종 폴리펩티드의 시험관 내 발현을 위한 상기에서 설명된 발현 카세트 또는 발현 벡터의 용도를 제공한다.
단백질의 발현 및 회수는 당업자에 알려진 방법에 따라 수행될 수 있다.
폴리펩티드의 발현을 위하여, 상기에서 설명된 발현 카세트 또는 발현 벡터의 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림 및 상기에서 설명된 숙주 세포사 사용되고 항상 동일한 기원이다. 놀랍게도 발현의 증가는 만약 발현 카세트 또는 발현 벡터 및 숙주 세포의 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림이 상이한 기원이라면, 예를 들면, 진핵생물 GAPDH 프로모터의 인간 DNA 서열 다운스트림 및/또는 업스트림이 CHO 세포에서 사용되면 얻어진다.
추가적 측면에서, 본 개시는 장애의 치료를 위한 의약 제조를 위한 상기에서 설명된 발현 카세트 또는 발현 벡터의 용도를 제공한다.
추가적 측면에서, 본 개시는 장애의 치료를 위한 의약용으로서 상기에서 설명된 발현 카세트 또는 발현 벡터를 제공한다.
추가적 측면에서, 본 개시는 유전자 치료에서 용도를 위한 상기에서 언급된 발현 카세트 또는 발현 벡터를 제공한다.
실시예
실시예
1: 발현 벡터의
클로닝
:
I. 재료 및 방법
I.1 플라스미드 구조체
I.1.1.
LB
배양 플레이트
500 ㎖의 물을 16 g의 LB 아가(Invitrogen, Carlsbad, CA, USA)와 혼합하고 끓였다(1 litre의 LB는 10 g 트립톤, 5 g 이스트 추출물 및 10 g NaCl을 포함한다). 냉각 후, 각각의 항생물질을 플레이트 될 용액(100 ㎍/ml 엠피실린 플레이트 및 50 ㎍/ml 카나마이신 플레이트)으로 첨가하였다.
I.1.2.
중합효소연쇄반응
(
PCR
)
모든 PCR은 50㎕ 최종 부페에서 1 ㎕의 dNTPs(각각의 dNTP에 대해 10 mM; Invitrogen, Carlsbad, CA, USA), 2 유닛의 Phusion®DNA 중합효소 (Finnzymes Oy, Espoo, Finland), 25 nmol의 프라이머 A(Mycrosynth, Balgach, Switzerland), 25 nmol의 프라이머 B (Mycrosynth, Balgach, Switzerland), 1.5 ㎕의 디메틸설폭사이드(DMSO, Finnzymes, Espoo, Finland) 및 1-3 ㎕의 템플레이트(1-2 ㎍)을 사용하여 수행하였다. 모든 프라이머는 표1에 나타냈다.
상기 PCR은 98℃에서 3분 동안 초기 변성(denaturation)에 의해 시작되었고, 98℃에서 30초 변성, 프라이머-특정 온도(CG 함량에 따라)에서 30초 풀림(annealing) 및 72℃에서 2 분 연장(elongation)의 35 사이클을 하였다. 10 분 동안 72℃에서 최종 연장을 냉각 전에 수행하였고 4℃에 보관하였다.
표 1: PCRs 에 사용된 프라이머의 요약 GAPDH: 글리세르알데하이드 3-포스페이트 디하이드로제네즈(glyceraldehyde 3-phosphate dehydrogenase)서열, 5': 업스트림 서열, 3': 다운스트림 서열 프라이머 GlnPr1172에 있는 “T ”(밑줄침)은 프라이머 다이머의 형성을 피하기 위하여 도입되었다.
프라이머 | 프라이머 서열 | 서열 증폭 | Seq ID |
GlnPr 1171 |
ATTATTCGCGATGGCTCCTGGCATCTCTGGGACCGAGGC | 5' GAPDH |
서열번호: 1 |
GlnPr 1172 |
ATCGTCGCGAAGCTTGAGATTGTCCAAGCAGGTAGCCAG | 서열번호: 2 | |
GlnPr 1173 |
AGCAAGTACTTCTGAGCCTTCAGTAATGGCTGCCTG | 3' GAPDH |
서열번호: 3 |
GlnPr 1174 |
TGGCAGTACTAAGCTGGCACCACTACTTCAGAGAACAAG | 서열번호: 4 |
I.1.3. 제한 분해(
Restriction
digest
)
모든 제한 분해를 위하여, 약 1 ㎍의 플라스미드 DNA(나노드롭으로 정량화, ND-1000 분광강도계(Thermo Scientific, Wilmington, DE, USA))를 각각의 10-20 유닛효소, 4 ㎕의 해당 10 X NE버퍼(NEB, Ipswich, MA, USA)와 혼합하였고 부피는 물로 40㎕로 채웠다. 추가 지시 없이, 분해를 37℃ 1 시간 배양하였다.
각각의 백본(backbone)의 예비 분해 후에, 1 유닛의 송아지 장 알칼린 포스파타제(CIP; NEB, Ipswich, MA, USA)를 첨가하고 37℃에서 30 분 배양하였다.
만약 분해가 NEB버퍼 3(NEB, Ipswich, MA, USA)에서 완성되면, 상기 효소는 상기 버퍼에서 강한 활성을 가지고 외부 말단의 뉴클레오티드의 일부를 또한 분해할 수 있기 때문에 상기 버퍼를 CIP 첨가전에 NEB 버퍼 4로 변경하였다
I.1.4.
PCR
정제 및
아가로우즈
젤 전기이동(
agarose
gel
electrophoresis
)
I.1.4.1.
PCR
클린업(
clean
up
)
분해를 하기 위해서 모든 PCR 단편은 맥커리 나겔 추출 II 키트(Macherey Nagel Extract II kit)(Macherey Nagel, Oensingen, Switzerland)를 사용하여 40 ㎕의 용출버퍼를 사용하여 제조사의 매뉴얼을 따라 제한 분해 전에 클린되었다. 상기 프로토콜은 DNA 시료의 변경버퍼(changing buffer)를 위해 또한 사용되었다.
I.1.4.2.
DNA
추출
젤 전기이동을 위하여, 1% 젤을 울트라퓨어TM아가로우즈(UltraPureTM Agarose)(Invitrogen, Carlsbad, CA, USA) 및 50X 트리스아세트산(Tris Acetic Acid)EDTA 버퍼(TAE, pH 8.3; Bio RAD, Munich, Germany)을 사용하여 제조하였다. DNA 염색을 위하여 1 ㎕의 젤 레드 다이(Gel Red Dye (Biotum, Hayward, CA, USA))를 100 ㎖의 아가로우즈 젤에 첨가하였다. 사이즈 마커로서 2 ㎍의 1 kb DNA 래더(NEB, Ipswich, MA, USA)를 사용하였다. 전기이동은 125 볼트에서 약 1시간 동안 실행하였다. 관심 밴드는 키트 추출 II(kit Extract II)(Macherey-Nagel, Oensingen, Switzerland)에 이어서 40 ㎕의 용출버퍼를 사용하여 제조사의 매뉴얼을 사용하여 아가로우즈 젤로부터 잘랐다.
I.1.5. 결찰(
Ligation
)
각각의 결찰을 위하여, 4 ㎕의 삽입체를 10 ㎕ 부피에서 1 ㎕의 벡터, 400 유닛의 라이게이즈(T4 DNA 라이게이즈, NEB, Ipswich, MA, USA), 1 ㎕의 10X 라이게이즈 버퍼(T4 DNA ligase 버퍼; NEB, Ipswich, MA, USA)에 혼합하였다. 혼합은 RT에서 1-2 시간 배양하였다.
I.1.6.
컴피턴트
박테리아로 결찰 생성물의 변형
pGLEX41-[REP]의 클로닝 및 복제의 표준 기원을 포함하는 pCR-블런트 벡터로 만들어진 구조체를 위하여, TOP 10(One Shot®TOP 10 컴피턴트 E. coli; Invitrogen, Carlsbad, CA, USA)을 사용하였다.
복제의 R6K 기원을 포함하는 플라스미드의 복제 개시를 위하여, pir 서열에 의한 코드된π 단백질의 발현이 요구된다. π 단백질은 One Shot®PIR1 컴피턴트 E. coli(Invitrogen, Carlsbad, CA, USA)에 발현된다. 상기 박테리아는 R6K 서열을 포함하는 모든 벡터에 사용된다.
결찰 생성물을 갖는 컴피턴트 생성물을 갖는 컴피턴트 박테리아를 변형하기 위하여, 25-50 ㎕의 박테리아는 5분 동안 얼음 상에서 녹였다. 이후 3-5 ㎕의 결찰 생성물을 컴피턴트 박테리아에 첨가하고 42℃에서 1분 동안 열충격(thermic shock) 전에 얼음 상에서 20-30 분 동안 배양하였다. 이 후, 500 ㎕의 S.O.C 배지 (Invitrogen, Carlsbad, CA, USA)를 튜브 당 첨가하였고 교반하에서 37℃에서 1 시간 동안 배양하였다. 최종적으로, 박테리아를 엠피실린이 있는 LB 플레이트(Sigma-Aldrich, St. Louis, MO, USA) 상에 넣고 37℃에서 밤사이 배양하였다. pCR-Blunt 벡터에서 클로닝을 위하여, 카나마이신이 있는 플레이트(Sigma-Aldrich, St. Louis, MO, USA)를 사용하였다.
I.1.7. 소량 (미니(
mini
)) 및 중급 규모 (미디(
midi
))의 플라스미드 제조
I.1.7.1. 미니제조(Minipreparation)
미니 제조를 위하여, 형질전환 박테리아의 콜로니를 37℃, 200 rpm에서 LB 및 엠피실린 또는 카나마이신의 2.5 ㎖에서 6-16 시간 동안 자라게 하였다. DNA를 E.coli (QuickPure, Macherey Nagel, Oensingen, Switzerland)를 위한 플라스미드 정제 키트에 이어서 제공된 매뉴얼로 추출하였다.
미니 제조로부터 플라스미드 DNA를 260 nm에서 흡광도를 측정하여 나노드롭 ND-1000 분광강도계 (Thermo Scientific, Wilmington, DE, USA)로 일단 정량화하고 1.8과 2사이이어야만 하는 OD260 nm/OD280 nmA의 비율을 평가하였다. 조절 분해는 서열 확인을 위해 Fasteris SA(Geneva, Switzerland)로 시료를 보내기 전에 수행되었다.
BAC 추출을 위해, 퀵퓨어 키트(QuickPure kit)(Macherey Nagel, Oensingen, Switzerland)를 프로토콜의 하기의 변형으로 사용하였다: LB 및 클로람페니콜(12.5 ㎍/ml)(Sigma-Aldrich, St. Louis, MO, USA)은 pBACe3.6 벡터를 포함하는 박테리아로 분주하였다. 37℃에서 밤사이 동안 흔들기 플랫폼 상에서 배양한 후에 배양은 500 ㎕의 A1 버퍼에서 재현탁하기 전에 배양은 13300 rpm에서 5 분 동안 원심분리하였다. 500 ㎕의 A2 용해 버퍼를 첨가하였고 용액을 상온에서 5 분 동안 배양하였다. 이 후, 600 ㎕의 A3 버퍼로 중성화하고 13300 rpm에서 10 분 원심분리하였다. 상층액을 컬럼상에 로드하고 상기 단계로부터 퀵퓨어 미니프렙 키트의 표준 프로토콜에 따라서 사용하였다.
I.1.7.2. 미디제조(
Midipreparation
)
미디제조를 위하여, 형질전환된 박테리아를 LB 및 엠피실린(또는 kanamycin)의 200 내지 400 ㎖에서 밤사이 동안 37℃ 밤사이 동안 자라게 하였다. 이 후, 배양은 20 분 동안 725 g에서 원심분리하였고 플라스미드를 상업적 키트(NucleoBond Xtra Midi; Macherey Nagel, Oensingen, Switzerland)에 이어서 제조사의 매뉴얼에 제공된 낮은 플라스미드 프로토콜을 사용하여 정제하였다.
미디제조로부터 플라스미드-DNA를 나노드롭 ND-1000 분광강도계로 3회 정량화하고 제한 분해로 확인하고 최종적으로 시퀀싱을 보냈다(Fasteris SA, 유전자va, Switzerland).
II
. 결과 및 토론
II
.1.
GAPDH
발현카세트(5' 및 3'
GAPDH
)의
DNA
영역
업스트림
및
다운스트림의
클로닝
BAC 클론 RPCIB753F11841Q을 이메진Imagene (Berlin, Germany)에 주문하였다. 상기 클론은 클로람페니콜(chloramphenicol) 저항 유전자를 포함하는 pBACe3.6 벡터 백본에서 인간 GAPDH 서열을 포함한다. 미디제조(midipreparation)에 의해 DNA 추출 후에, 벡터 농도를 나노드롭에 의해 27 ng/㎕으로 결정하였다.
프로모터의 GAPDH 발현 카세트 업스트림 및 폴리-아네닐레이션 자리의 다운스트림을 둘러싼 직후의 DNA 서열은 템플레이트로서 27 ng의 정제된 클론 RPCIB753F11841Q 을 사용하여 증폭되었다. 프로모터의 3 kb 단편 업스트림은 서열번호. 5을 갖는 엠플리콘으로 유도하는 프라이머 GlnPr1171(서열번호: 1) 및 GlnPr1172(서열번호: 2)으로 증폭되었다. 프라이머 GlnPr1172(서열번호: 2)는 템플레이트 서열에 비례하여 베이스(base) 변경(G에서 T로)을 옮기기 때문에, 상기 PCR 반응으로부터 유래된 모든 서열은 상기 베이스 변경을 역시 옮길 것이다. 상기 변경은 GAPDH 유전자(서열번호: 17의 bp 812, 서열번호: 5의 시작에 비레하여 위치 23)의 전사시작에 비례하여 위치 -3721에 위치해 있다. 폴리아데닐레이션 자리의 3kb 단편 다운스트림은 서열번호: 6(표 1)를 갖는 엠플리콘으로 유도하는 프라이머 GlnPr1173(서열번호: 3) 및 GlnPr1174(서열번호: 4)로 증폭되었다. PCRs에 사용된 풀림 온도는 72℃이었다.
5' 및 3'GAPDH 단편(서열번호: 5 및 6)을 pCR-Blunt, 상업적으로 활용가능한 PCR-생성물 클로닝 벡터(pCR-Blunt, PCR Zero Blunt 클로닝 키트, Invitrogen)에서 클론되었다. 결찰 생성물을 TOP10 컴피턴트 박테리아로 형질전환되었고 카나마이신 LB-아가 플레이트 상에서 분주하였다. 콜로니는 증폭되었고 플라스미드는 미니프렙에 의해 분리되었다. 조절 분해는 pCR-Blunt-5' GAPDH 및 pCR-Blunt-3' GAPDH 구조체를 수율하는 양성 클론을 식별하기 위하여 수행되었다.
II
.2. 리포터 단백질
GFP
및 재조합
IgG1
단클론
항체(
LC
-
IRES
-
HC
-
IRES
-
GFP
)를 위한
DNA
단편 코딩의 제조
본 발명에서 사용된 리포터 구조체(REP)는 폴리시스트로닉 유전자로 구성된다: IgG1 단클론 항체 경쇄 (LC)-IRES- IgG1 단클론 항체 중쇄(HC)-IRES-녹색형광 단백질(GFP). 뇌심(장)근(육)염 바이러스(Encephalomyocarditis virus)로부터 유래된 내부 리보좀 엔트리 사이트(Internal Ribosomal Entry Sites(IRES)(Gurtu et al., Biochem Biophys Res Commun.; 229(1): 295-298, 1996))는 3 펩티드 IgG1 단클론 항체 경쇄 (LC), IgG1 단클론 항체 중쇄 (HC) 및 GFP (도 1)의 번역을 허가하게 한다. 따라서, 형질전환된 세포는 IgG1 단클론 항체를 배출할 것이고 의존적 방법으로 세포 내 GFP를 축적한다. 그러나, 폴리크리토닉 mRNA는 진핵생물 세포에서 일반적이지 않고 자체의 번역은 상대적 낮은 적정량의 IgG1 및 GFP 발현을 유도하여, 매우 효율적이지 않다. REP 구조체를 포함하는 벡터는 제한효소 NheI 및 BstBI(BstBI는 65℃에서 사용됨)을 사용하여 절단된다. 발현 구조체를 포함하는 REP 단편은 자르고, 추가적으로 클로닝 단계에 사용된다.
II
.3. 발현 벡터의
클로닝
벡터 pGLEX41, pcDNA3.1 (+) (Invitrogen, Carlsbad, CA)로 부터 유래된 발현 벡터는 안정 세포주 생성에 사용된다. GAPDH 서열이 있고 없이 벡터 A 및 B의 두 번째 생성을 생성시키는 변형된 초기 백본으로서 사용되었다. 모든 벡터를 위하여 동일한 프로모터-인트론 조합(mCMV 및 첫 번째 인트론 (IgDA)을 위한 기증자-수용체 단편 코딩)이 사용되었다(Gorman et al., (1990) Proc Natl Acad Sci USA, 87: 5459-5463).
중간 벡터
pGLEX41
-
HM
-
MCS
-
ampiA
의
클로닝
:
새로운 벡터 생성의 개발은 pGLEX41로부터 시작되었다. 상기 벡터를 엠피실린 저항 카세트를 방출하기 위하여 제한효소 NruI 및 BspHI를 사용하여 자른다. 백본 단편은 CIP되고 젤 전기이동에 의해 정제된다. 엠피실린 저항 유전자(블라(bla) 프로모터를 포함하여)의 코돈 최적화 버젼(E. coli에서 발현을 위하여)을 위한 DNA 단편 코딩은 진아트(GeneArt)로부터 주문되었다. 삽입체는 제한효소 NruI 및 BspHI(백본으로서 사용된 동일한 효소)를 사용하여 진아트(GeneArt) 클로닝 벡터 #1013237 밖으로 잘렸고, 정제되었고 백본으로 클론되었다.
미니프렙은 제한 분해에 의해 분석되었다. 클론 pGLEX41-HM-MCS-ampiA#2는 기대된 제한 프로파일을 가졌고 정확한 단편의 통합은 시퀀싱으로 확인되었다.
중간 벡터
pGLEX41
-
MCS
-
R6K
-
ampiA
의
클로닝
벡터 pGLEX41-HM-MCS-ampiA#2의 복제의 pUC 기원을 교화하기 위하여 벡터는 PvuI 및 BspHI를 사용하여 절단되었다. 백본 단편은 CIP되고 정제되었다. 새로운 삽입체 단편은 발현 카세트의 일부로서 복제의 R6K 기원 및 변형된 SV40 poly(A) 서열을 포함한다. SV40 poly(A) 주위의 불필요한 박테리아 또는 바이러스 백본 서열은 삭제되어 왔다(하기의 표 2를 참조). 삽입체 단편은 진아트(GeneArt)로부터 주문되었고; 효소 PvuI 및 BspHI(백본을 위하여 사용된 바와 같이 동일함)을 사용하여 진아트 클로닝 벡터 밖으로 잘렸고, 정제되었고 백본 단편으로 클론되었다. 미니프렙을 준비하였고 서열 분석에 의해 확인되었다. 클론 pGLEX41-MCS-R6K-ampiA#1은 정확한 서열을 가졌다.
표 2: 상이한 벡터에서 CPG 함량
발현 벡터에서 CpG 함량 | |||
pGLEX41 |
코돈 최적화된
벡터: "A" |
CpG
감소된
벡터 "B" |
|
엠피실린(Ampicillin) 저항 |
49 | 43 | 19 |
퓨로마이신(Puromycin) 저항 |
93 | 36 | 1 |
제네티신(Geneticin) 저항 |
74 | 51 | 0 |
복제의 기원 (Origin of replication) |
45 | 9 | 9 |
합계: |
261 | 139 | 29 |
중간 벡터
pGLEX41
-
MCS
-
R6K
-
엠피
B의
클로닝
벡터 pGLEX41- MCS-R6K-ampiA#1은 제한효소 BspHI을 사용하여 열렸고 엠피실린 저항을 방출하기 위하여 CIP되었다. 새로운 삽입체 단편은 E. coli에서 발현을 위하여 엠피실린 저항 코돈 최적화를 포함하나, 선택적 코돈 사용에 의해 삭제될 수 있는 모든 CpG 서열은 대체될 수 있다(상기 표 2를 참조). 상기 단편은 진아트에서 주문되었다. 삽입체 단편을 방출하기 위하여, 진아트 클로닝 벡터 #1016138는 BspHI을 사용하여 절단되었다. 젤 전기이동에 의해 삽입체 및 백본 단편 모두의 정제 후에, 이들은 결찰되었고 PIR1 박테리아로 형질전환되었다. 미니프렙은 시퀀싱을 위해 직접 보내졌다. pGLEX41-R6K-MCS-엠피B#1은 정확한 서열을 가졌고 추가 클로닝 단계에 사용되었다.
pGLEX41
-
derived
발현 벡터에서 리포터 구조체의
클로닝
발현 벡터 pGLEX41- MCS-R6K-ampiA 및 pGLEX41-MCS-R6K-엠피B에서 리포터 구조체 REP를 클론하기 위하여, 벡터를 제한효소 NheI 및 ClaI을 사용하여 잘랐다. 발현 벡터 pGLEX41-HM-MCS는 제한효소 NheI 및 BstBI을 사용하여(65℃에서) 오픈하였다. 모든 벡터 백본은 분해 후에 CIP로 처리되었고 백본은 젤 전기이동에 의해 정제되었다. 백본은 리포터 구조체 REP를 위하여 코딩하는 NheI/BstBI 단편으로 결찰되었다(BstBI은 ClaI으로 호환됨). 결찰 생성물은 PIR1 또는 TOP 10 컴피턴트 박테리아로 형질전환되었고 엠피실린 LB-아가 플레이트 상에 플레이트되었다. 콜로니는 증폭되었고 플라스미드는 미니프렙에 의해 분리되었다. 양성 클론은 미니프렙의 제한 분해에 의해 식별될 수 있고 후속의 서열은 Fasteris SA에 의해 확인되었다.
pGLEX41
유래된
발현 벡터에서 인접
GAPDH
서열의 첨가
상기 단락의 모든 제한 분해는 80 ㎕ 최종 부피에서 수행되고 37℃에서 밤사이 배양되었다.
5' GAPDH 서열 (서열번호: 7)은 제한효소 NruI을 사용하여 pCR-blunt-5' GAPDH으로부터 절단되고 NruI을 사용하여 직선화된 발현 벡터 pGLEX41-R6K-ampiA-[REP] 및 pGLEX41-R6K-엠피B-[REP]에서 결찰되었고 재순환을 피하기 위하여 CIP 처리되었다. PIR1 콜로니의 증폭 후에(결찰 생성물의 변형에 의해 얻어짐), 미니프렙을 제한 분해에 의해 분석하였다. 클론 pGLEX41-R6K-ampiA-5?APDH-[REP] #2 및 pGLEX41-R6K-엠피B-5' GAPDH-[REP] #1은 제한 분석에서 예상된 사이즈의 밴드를 나타냈고 후속적으로 시퀀싱에 의해 확인되었고 추가 클로닝 단계에 사용되었다. 상기 새로운 벡터는 ScaI을 오픈되었고 CIP로 처리하였다. 3' GAPDH 단편(서열번호: 8)은 동일한 효소를 사용하여 pCR-Blunt-3'GAPDH로부터 절단되고 pGLEX41-R6K-ampiA-GAPDH-[REP] 및 pGLEX41-R6K-엠피B-GAPDH-[REP] 발현 벡터를 생성하기 위하여 2개의 백본으로 결찰되었다.
클론 pGLEX41-R6K-ampiA-GAPDH-[REP] #2 및 pGLEX41-R6K-엠피B-GAPDH-[REP] #8은 조절 분해는 제한 분석에서 예상되는 사이즈의 밴드를 나타냈다. 정확한 방향으로 3' GAPDH 단편의 삽입은 후속적으로 시퀀싱에 의해 확인되었다(Fasteris).
II
.4. 저항 벡터의
클로닝
저항 벡터의 클로닝을 위한 시작점은 벡터 pGLEX-MCS-R6K-ampiA#1이다. 저항 유전자의 발현에 있어서 약한 프로모터는 충분하고, mCMV 프로모터는 SV40 프로모터에 의해 대체될 수 있다. 저항 유전자를 위해 코딩하는 유전자는 진아트 SA(Regensburg, Germany)로부터 주문되었고 선별 코돈 사용에 의해(퓨로마이신: 퓨로B 및 네오마이신: neoB) 차이니즈 햄스터(퓨로마이신: 퓨로A 및 네오마이신: neoA)에서 최적화되거나 CpG 함량에서 감소된다.
pGLEX
-
R6K
-
ampiA
-
puroA
/
puro
B의
클로닝
:
발현 카세트에서 퓨로마이신 저항을 클론하기 위하여, 벡터 pGLEX41-MCS-R6K-ampiA#1는 제한효소 NruI 및 XbaI을 사용하여 오픈되었고 이어서 CIP 처리되었다. 삽입체 단편은 진아트로부터 주문되었고 진아트 클로닝 벡터 #1013239에서 삽입체로서 제공되었다. 이는 퓨로마이신 저항(CHO 세포의 코돈 사용을 위하여)을 위한 SV40 프로모터 및 코돈 최적화 유전자를 포함한다. 삽입체는 효소 NruI 및 XbaI(백본을 위해 사용된 바와 같이 동일함)을 사용하여 진아트 클로닝 벡터 밖으로 잘랐고, 정제되었고 백본 단편으로 클론되었다. 미니프렙을 준비하고 제한 분해로 분석하였다. 클론 pGLEX-MCS-R6K-ampiA-퓨로A#1은 정확한 프로파일을 나타냈고 시퀀싱에 의해 확인할 수 있었다.
상기 벡터는 퓨로마이신 저항 유전자를 위한 코딩 영역의 교환에 의해 벡터 pGLEX-MCS-R6K-ampiA-퓨로B의 클로닝을 위해 사용도었고 반면에 SV40 프로모터를 남겼다. 새로운 삽입체 단편은 선택적 코돈 사용에 의해 삭제될 수 있는 모든 CpG 서열이 대체될 수 있는 퓨로마이신 유전자의 코돈-최적화된 버젼을 포함한다. 상기 단편은 진아트에 의해 주문되고 삽입체 단편을 방출하기 위하여 클로닝 벡터 # 1016139에 운반되었고, 진아트 벡터는 제한효소 XbaI 및 NotI을 사용하여 절단되었다. 삽입체 단편은 젤 전기이동에 의해 정제되었고 XbaI 및 NotI을 사용하여 제한 분해에 의해 퓨로마이신 오픈 리딩 프레임으 방출 후, CIP 처리에 의해 pGLEX-MCS-R6K-ampiA-퓨로A의 백본으로 클론되었다. 얻어진 벡터 pGLEX-MCS-R6K-ampiA-퓨로B#1은 서열 분석에 의해 직접 확인되었다.
벡터
pGLEX
-
R6K
-
ampiA
-
NeoA
및
pGLEX
-
R6K
-
ampiA
-
NeoB
의
클로닝
발현 카세트에서 네오마이신 저항을 클론하기 위하여, 벡터 pGLEX-R6K-puroA#1를 제한효소 XbaI 및 NotI을 사용하여 오픈되었고, 이어서 CIP처리 되었다. 삽입체 단편은 진아트로부터 주문되었고 진아트 클로닝 벡터 #1013242(neoA) 및 #1026894(neoB)에서 삽입체로서 재공되었다. 이들은 각각 CHO 세포에서 코돈 사용에 대한 네오마이신 저항을 위한 코돈 최적화 유전자 및 CpG가 감소된 네오마이신 저항을 포함한다. 삽입체는 효소 XbaI 및 NotI(백본을 위해 사용된 바와 같이 동일함)을 사용하여 진아트 클로닝 벡터 밖으로 자르고, 정제되고, 백본 단편으로 클론되었다. 미니프렙을 제조하고 클론을 시퀀싱으로 확인하였다.
벡터
pGLEX
-
R6K
-
ampiB
-
NeoB
및
pGLEX41
-
R6K
-
ampiB
-
puroB
의
클로닝
:
벡터 pGLEX41-R6K-puroB#1은 제한효소 BspHI을 사용하여 오픈되었고 후속적으로 CIP되었다. 삽입체 단편은 E. coli에서 발현을 위한 코돈 최적화된 엠피실린 저항 유전자를 포함하고, 반면에 선택적 코돈에 의해 삭제될 수 있는 모든 CpG 서열은 대체되어 왔다. 상기 단편은 진아트에서 주문되었고 클로닝 벡터 #1016138에서 도달되었다. 삽입체 단편을 방출하기 위하여 진아트 클로닝 벡터는 BspHI을 사용하여 절단되었다. 젤 전기이동에 의해 삽입체 및 백본 단편 모두의 정제 후에, 이들은 결찰되었고 PIR1 박테리아로 형질전환되었다. 미니프렙은 시퀀싱을 위해 직접 보내졌고 확인할 수 있었다(pGLEX41-ampiB-R6K-puroB#1).
벡터 pGLEX-R6K-neoB-엠피B로 유도하는 클로닝은 백본 단편을 제조하기 위하여 제한효소 BspHI을 사용하여 pGLEX-R6K-neoB-ampiA을 오픈하여 행하여졌다. 동일한 제한효소 조합을 사용하여 pGLEX-R6K-ampiB-hygroB의 분해는 ampiB를 위하여 삽입체 단편 코딩을 수율하였다. 상기 ampiB 삽입체는 pGLEX-R6K-neoB-ampiA 백본으로 클론되었다.
II
.5 저항 벡터로 인간
GAPDH
유전자의 서열
업스트림
및
다운스트림의
첨가
5' GAPDH 삽입체(3164 bps)를 얻기 위하여 벡터 pCR-blunt-5' GAPDH를 NruI으로 절단하였다. 저항 유전자를 코딩하는 벡터는 NruI로 절단되었고, 백본 단편을 제조하기 위하여 후속적으로 CIP 처리되었다(Calf intestinal phosphatase, NEB, Ipswich, MA). 4개의 상이한 백본 단편(pGLEX-R6K-neoA-ampiA, pGLEX-R6K-neoB-ampiB, pGLEX-R6K-puroA-ampiA 및 pGLEX-puroB-ampiB)은 3164 bps 5' GAPDH 삽입체로 결찰되었고 PIR1 컴피컨트 박테리아로 형질전환되었다. ApalI을 사용하여 미니프렙의 제한분해는 클론 pGLEX-R6K-neoB-ampiB-5'GAPDH #5, pGLEX-R6K-neoA-ampiA-5'GAPDH #6, pGLEX-R6K-puroA-ampiA-5'GAPDH #16 및 pGLEX-puroB-ampiB-5'GAPDH #5의 식별을 가능하게 하였다.
상기 중간 벡터를 제한효소 ScaI로 자르고 결찰을 위한 백본을 제조하기 위 하여 CIP 처리하였다. 두 번째 삽입체 단편을 운반하는 벡터, pCR-Blunt-3'GAPDH를 삽입체 단편 (3224 bps) GAPDH 다운스트림 인접 영역을 방출하기 위하여 ScaI을 사용하여 잘랐다. 4 개의 상이한 백본 분자는 정제된 3224 bps 삽입체 단편으로 결찰되고 PIR1 컴피턴트 세포로 형질전환되었다. 미니프렙은 제한 분해에 의해 분석되었다. 예상되는 사이즈의 제한 단편을 나타내는 클론은 pGLEX-R6K-neoB-ampiB-GAPDH #8, pGLEX-R6K-neoA-ampiA-GAPDH #1, pGLEX-R6K-puroA-ampiA-GAPDH #1 및 pGLEX-puroB-ampiB-GAPDH #4이었다. 후속적으로 클론을 시퀀싱 분석에 의해 확인하였다(Fasteris, geneva, Switzerland).
II
.1.5. 형질전환을 위한 플라스미드 클론의
미디제조
충분한 적정량의 플라스미드를 가지기 위하여, 미디프렙은 맥케레이나겔 키트(NucleoBond Xtra Midi; Macherey Nagel, Oensingen, Switzerland)를 사용하여 제조되었다. 제한 분해에 의해 확인하고 시퀀싱한 후에, 플라스미드를 직선화하고 CHO-S 세포에서 형질전환을 위해 사용되었다. 표 3은 미디제조에서 얻어진 플라스미드 DNA 일괄의 농도를 요약하고 서열을 각각의 플라스미드의 식별 및 서열 정보를 확인하는 Fasteris SA로부터 파일한다. 모든 미디프렙은 형질전환에 사용되기 전에 시퀀싱에 의해 확인되었다.
표 3: 클론된 플라스미드의 요약. DNA 미디제조의 농도 및 직선화된 미디제조(해당 효소와 같이). GSC 숫자는 각각의 플라스미드에 대해 코드하고 관련있는 서열파일을 식별하는 것을 허가한다.
플라스미드 | 미디제조의 농도(㎍/㎖) | 직선화를 위한 효소 |
직선화된 플라스미드의 농도
(㎍/㎖) |
글렌마크
( Glenmark ) 플라스미드 코드 |
pGLEX41-R6K-ampiA-[REP]-GAPDH | 1538 | EcoRV | 1019 | GSC 2774 |
pGLEX41-R6K-ampiB-[REP]-GAPDH | 1243 | EcoRV | 1233 | GSC 2775 |
pGLEX-R6K-ampiA-neoA- GAPDH | 890 | AseI | 766 | GSC 2776 |
pGLEX-R6K-ampiB-neoB- GAPDH | 594 | AseI | 979 | GSC 2777 |
pGLEX-R6K-ampiA-puroA- GAPDH | 917 | AseI | 859 | GSC 2778 |
pGLEX-ampiB-퓨로B- GAPDH |
869 | AseI | 1049 | GSC 2779 |
pGLEX41-[REP] |
2119 | BspHI | 868 | GSC 2239 |
pGLEX41-R6K-ampiA-[REP] |
865 | BspHI | 779 | GSC 2240 |
pGLEX41-R6K-ampiB-[REP] |
1751 | BspHI | 806 | GSC 2249 |
pGLEX-R6K-ampiA-neoA |
890 | BspHI | 764 | GSC 2214 |
pGLEX-R6K-ampiB-neoB |
767 | BspHI | 654 | GSC 2244 |
pGLEX-R6K-ampiA-puroA |
708 | BspHI | 659 | GSC 2220 |
pGLEX-R6K-ampiB-puroB |
574 | BspHI | 746 | GSC 2213 |
실시예
2: 발현 벡터를 갖는 세포의 형질전환 :
1.
재료 및 방법
CHO
-S 세포 및
HEK293
세포
포유동물 세포는 재조합 단백질의 정확한 폴딩, 집합 및 전사후 변형을 할 수 있기 때문에 단백질을 발현시키는 바람직한 숙주이다. CHO 세포주는 잘 특징되어있고 대부분의 인간 발병의 바이러스를 위한 숙주로서 제공하지 않기 때문에, 안정된 치료 단백질생성을 위한 상대적으로 안전한 숙주를 만드는데 사용된다. 차이니즈 햄스터 Ovary 세포 (CHO-S, Invitrogen, Carlsbad, CA, USA)는 4 mM L-glutamine (Applichem, Germany)으로 보충되는 PowerCHO-2 CD 배지 (Lonza, Verviers, Belgium)에서 현탁으로 배양되고 37℃, 5% CO2 및 80% 습도에서 진탕 배양기(2.5 cm의 원형 스트로크를 갖는200 rpm)에서 배양된다. HEK293 세포는 형질전환되기 쉽고 낮은 그램량까지 재조합 단백질의 빠른 생성을 하게 하기 때문에 사용된다. 사용되는 세포는 HEK293-EBNA 세포 (ATCC, Manassas, VA)이고 Ex-cell 293 배지에서 현탁으로 일상적으로 배양된다(Sigma-Aldrich, St. Louis, MI).
CHO-S 및 HEK293 EBNA 세포의 계대배양은 신선한 배지에 0.5x106 살아있는 세포/ml의 분주 밀도를 사용하여 매일 3-4일 일상적으로 수행하였다. 세포를 가스교환할 수 있도록 침투할 수 있는 필터를 포함하는 50 ㎖ 생물반응장치(bioreactor) 튜브에서 10 ㎖의 배지를 사용하여 배양하였다(Tubespin Bioreactor 50; TPP, Trasadingen, Switzerland). 세포 생존율 및 농도는 트립판 블루 세포 배제 방법을 사용하여 카운티스 자동화된 세포 카운터(Countess automated cell counter)로 결정되었다. 세포 농도는 CHO-S 세포에 대하여 PCV 튜브 (TPP, Trasadingen, Switzerland)를 사용하여 농축 세포 부피(PCV) 방법의 결정으로 확인되었다.
농축 세포 부피 (
PCV
)
PCV 방법은 5000 rpm에서 1 분 동안 미니-PCV 튜브 (PCV 팩된 세포 부피 튜브; TPP, Trasadingen, Switzerland)에서 배양 액체의 특정 부피의 원심분리 상에서 기초되었다. 원심분리 동안에, 세포는 튜브의 베이스에서 눈금 측정기로 펠렛되었다. 농축 세포 부피의 퍼센트는 원심분리된 세포 배양액에 관계하여 펠렛의 부피를 측정하여 결정된다. 예를 들면, 1% PCV는 세포 펠렛의 10 ㎕는 1 ㎖의 배양액에 존재하는 것을 나타낸다.
세포의 수를 세는 일상적인 세포를 위하여, 각각의 시료의 200 ㎕를 PCV 튜브에 파이펫하고 해당 펠렛의 부피(㎕에서)는 자(ruler)로 읽었다("easy read" 측정 기구; TPP, Trasadingen, Switzerland). 상기 부피는 1 ㎖에 대해 값을 갖도록 5를 곱한 후 살아있는 세포의 농도 측정을 얻도록 세포 특정 연관 요인을 사용하여 곱하였다(세포의 백만/ml에서)
"자동화" 세포 측정
세포 농도 및 생존율은 트립판 블루의 동일한 양으로 시료를 혼합하여 카운티스®자동화된 세포 카운터(Countess®Automated cell Counter)로 결정하였다. 용액은 기구에 의해 읽혀지기 전에 카운티스®챔버 슬라이드로 파이펫되었다. 상기 기구는, 교정 후에, 뉴바우어 챔버의 자동화 읽기를 허가하였고 죽고 살아있는 세포의 세포 생존율 및 농도를 결정한다.
유동세포측정 분석
유동세포측정은 각각의 세포의 다수 파라미터의 분석에 대한 기술이다. 상기 기술은 서로 표현형적으로 다른 세포, 예를 들면, 살아있는 세포로부터 죽은(세포의 크기 및 입상에 따른)세포의 정량적 및 질적 분석을 허가한다. 이는 또한 GFP와 같은 관심 단백질을 발현하는 세포의 정량을 허가한다. 세포는 300 ㎕의 시료를 멸균 파이펫팅에 의해 배양으로부터 수득되고 488 nm에서 공기-냉각된 아르곤 레이저 방출이 장착된 형광-연관된 세포 구분(FACS) 칼리브라 유동세포측정기(Becton, Dickinson 및 Company, Franklin Lakes, NJ, USA)로 분석하였다. 분석체는 셀퀘스트 소프트웨어로 만들어졌다. GFP 방출은 530/30-nm 밴드 패스 필터를 사용하여, FL-1로 검출되었다.
첫 번째 문에서, 죽은 세포뿐만 아니라 세포 부스러기(debris)는 직선 규모 상의 SSC/FSC 점선에서 분석으로부터 배제되었다. 이후, 살아있는 세포의 GFP 형광은 대수(logarithmic) 규모상에서 히스토그람에서 디스플레이되었다. 형광 분포의 정중 값(median value)은 분석된 세포 집단의 GFP 발현 수준을 평가하는데 사용되었다.
IgG
정량적 방법:
OCTET
QK
옥테트 QK 시스템(ForteBio, Menlo Park, CA, USA)은 항체, 단백질, 결합, DNA 및 다른 항체의 라벨-프리 정량을 수행하고 생분자 결합 상호작용의 운동특성(kinetic characterization)을 제공한다. 시료의 결합 비율(binding rate) 및 축적된 IgG1 농도 (㎍/ml) 사이에 연관성은 표준곡선을 갖는 IgG 적정량의 정량화를 허가한다.
세포 시료는 300 g에서 5 분간 원심분리한다. 이후 웰 당 항체 농도를 얻기 위하여 단백질 A 바이오센서(Protein A DIP 및 READTM Biosensor, Forte Bio, USA)를 사용하여 옥테트(Octet)로 분석되기 전에 상층액을 96웰 플레이트에서 옥테트버퍼로 희석(IgG1 항체에 대하여 1/5)하였다.
JetPEI
을 사용하여 일시적 형질전환
CHO-S 및 HEK293 EBNA 세포의 일시적 및 안정적 형질전환은 폴리에틸렌이민(PEI; JetPEI, Polyplus-형질전환, Illkirch, France)을 사용하여 수행되었다. PEI는 DNA와 같은 음이온 전하된 분자를 갖도록 복합체를 형성할 수 있는 양이온 중합체(cationic polymer)이다. 양이온 전하된 DNA-PEI 복합체는 음이온으로 전하된 세포표면에 결합하고 엔도시토시스(endocytosis)에 의해 내부화(internalized)된다. 이는 융해(lysis)에 의해 핵으로 방출되는 곳으로부터 라이이소좀(lysosome) 구획에 도달한다. DNA-PEI 복합체를 갖는 높은 형질전환 효율은 라이소좀 분해로부터 DNA를 보호하기 위하여 PEI의 능력때문이다. 상기 세포는 제조사에 의해 제공된 매뉴얼에 따라 형질전환된다.
모든 플라스미드는 안정 형질전환 (100 ㎕ Tris-EDTA, pH 7.5에 재현탁된 100 ㎍의 DNA)전에 직선화되었다. 일시적 형질전환을 위하여, 원형 플라스미드는 미디제조 DNA로부터 직접 사용된다. 상기 연구에서 일시적 형질전환은 50 ㎖ 생물반응기 튜브에서 보존하고 항생제를 첨가하지 않았다.
IgG1 및 GFP를 발현하는 안정적 CHO-S 클론은 하나의 발현 벡터 및 두 개의 저항 벡터를 공동-형질전환에 의하여 얻어질 수 있다(각각 퓨로마이신 또는 네오마이신 저항에 대하여 코딩).
안정적 풀 및 미니 풀(
minipools
)의 선별
형질전환 효율은 세포 내 GFP 발현을 분석함으로써 유동세포측정 (BD FACS Calibur cytometer, #1293)에 의해 형질전환 후 24시간에 결정되었다. 만약 GPF 양성 세포의 퍼센트가 20 %보다 높으면, 형질전환된 세포는 선택 배지로 희석되고 96 웰 플레이트로(분리된 안정적 미니 풀을 생성하기 위해 제한 희석을 위하여) 또는 T-플라스크(안정적 풀을 생성하기 위하여)에 분포되었다. 사용된 선택 배지는 제네티신 및 퓨로마이신의 상이한 농도로 보충되는, PowerCHO-2, 4 mM 글루타민이었다.
형질전환 후 7일째에, 선별 엄중성(selection stringency)은 세포로 선별배지를 첨가하여 새롭게 하였다. 96 웰 플레이트에 있는 콜로니가 융합되자마자, 플레이트는 형광 리더를 사용하여 측정되었다.
T-플라스크에 있는 풀은 항생제가 없는 PowerCHO-2, 4 mM L-글루타민을 사용하여 튜브스핀(tubespin) 규모로 확장되었다. 이의 생존율 및 농도는 카운티스 자동화된 세포 카운터로 평가되었다(Invitrogen, Carlsbad, CA, USA). 세포농도가 상기를 허락하자마자, 씨드 연쇄(seed train)는 50 ㎖ 생물반응기 튜브(5% CO2, 37℃ 및 80% 습도에서 진탕기(200 rpm)에서 배양)에서 10 ㎖ 배지의 0.5x106 세포/㎖의 농도에서 세포 분주에 의해 각각의 풀에 대하여 시작되었다. 각각의 씨드 연쇄(seed train)는 성장 배지에서 0.5x106 세포/ml에서 세포를 분주하여 주 당 2회 계대하였다(세포농도는 PCV 분석에 의해 결정되었다). 씨드 연쇄는 모든 생성물의 실행(productions runs)의 접종원(inoculum)에 대하여 사용되었다(일괄).
다음 4-5 주 동안에 생성물의 실행은 중복(duplicates)으로 주 당 한번 분주 되었다. 풀의 안정성은 클론의 집단에 대하여 상기에서 언급된 바와 같이 FACS 및 IgG 발현에 의해 평가되었다.
생성물 실행(
Production
runs
) (
비연속
발효(
batch
fermentation
))
세포 풀의 일괄 실행은 접종을 위한 씨드 연쇄(seed train)를 사용하여 0.5x106 세포/ml의 농도에서 분주되었고 세포는 공급배지(Feed media)에서 7일 동안 배양되었다. 4 및 8일째에, 200 ㎕의 세포를 300 g에서 5 분 동안 원심분리하였고 상층액을 옥테트(Octet)를 사용하여 축적된 IgG에 대하여 분석하였다. 추가적으로, 각각 일괄에 대한 GFP 발현을 FACS로 분석하였다.
2
. 결과
2.1
CHO
세포에서 일시적 발현:
상기 연구와 비교하여 벡터는 자체의 백본에서 주요하게 다르다. 전체 발현 카세트(프로모터, 첫 번? 인트론, 발현 구조체, 폴리 (A))는 모든 벡터에 대하여 정확히 동일하다. 상기 벡터는 실시예 1에서 설명된 바와 같이 벡터 pGLEX41로부터 유래되었다. 하나의 벡터에서, 엠피실린 저항 유전자는 E. coli에서 발현을 위해 코돈 최적화되었고 박테리아 백본은 최소로 감소되었다: pGLEX41-R6K-ampiA-[REP](짧은 A에서). 두 번째 벡터에서, 엠피실린 저항 유전자는 E. coli에서 발현을 위해 코돈 최적화되었으나, 모든 CpG 서열은 선택적 코돈 사용에 의해(가능할 때), 회피되었다: 상기 벡터는 pGLEX41-R6K-AmpiB-[REP] (짧은 B에서)로 불린다. 세 번째 변형은 벡터 pGLEX41-R6K-ampiA-[REP]-GAPDH(짧은 GAPDH_A에서) 및 pGLEX41-R6K-AmpiB-[REP]-GAPDH(짧은 GAPDH_B에서)를 주는 벡터 A 및 B의 발현 카세트의 업스트림 및 다운스트림이 클론되는 GAPDH 인접 서열의 용도를 포함한다.
상이한 플라스미드 백본의 맥락에서 발현되는 리포터 단백질의 발현 수준을 비교하기 위하여 CHO-S 세포 (Invitrogen)의 일시적 형질전환이 행하여졌다. 상기 형질전환(중복)을 10 ㎖의 최종 배지 부피를 사용하여 50 ㎖ 생물 반응기 튜브(TPP, Trasadingen, Switzerland)에서 수행하였고 옥테트에 의해 형질전환 후 5일째에 분석하였다(도 2).
정확한 백본이 있는 모든 벡터(A 및 B)는 대조군 벡터 pGLEX41보다 약간 높은 발현 수준을 나타낸다. 벡터 A 및 B 사이에는 단지 최소 차이만 있다. 이는 예상되는데, 왜내하면 백본에서 단지 차이가 일시적 발현 상에서 영향을 갖지 않아야만 하는 엠피실린 저항이기 때문이다.
가장 현저한 관찰은 발현 상에서 GAPDH 서열의 긍정적 효과이다. 2-배 높은 발현 수준은 GAPDH 서열이 없는 하나에 비교하여 GAPDH 인접 서열에 정착하는 플라스미드와 같이 얻어진다. 이는 A 및 B 구조체 모두에 대해 사실이다. pGLEX41 벡터와 비교하여, 3-배 높은 발현이 관찰되었다. 상기는 만약 플라스미드의 사이즈가 고려된다면 더욱 더 놀랍다. 벡터 A (7048 bps)는 벡터 GAPDH-A (13436 bps)와 비교하여 거의 절반 사이즈이다. 따라서, 일시적 형질전환 과정 동안에 운반된 DNA의 양은 모든 플라스미드에 대하여 동일하고, GAPDH-A의 몰라 양의 단지 절반만이 핵으로 운반된다고 추정된다.
2.2
HEK293
세포에서 일시적 발현
상이한 플라스미드 백본의 맥락에서 발현된 리포터 단백질의 발현 수준과 ㅂ비빅비교하기 위하여 HEK293 EBNA 세포의 일시적 형질전환을 수행하였다. 형질전환 (중복)을 10 ㎖ 의 최종 배지 부피를 사용하여 50 ㎖ 생물반응기 튜브(TPP, Trasadingen, Switzerland)에서 수행하였고 옥테트에 의해 형질전환 후 10일째에 분석하였다(도 3).
도 3에 나타낸 결과는 HEK293 EBNA 세포에서 GAPDH 인접 영역을 사용하여 얻어질 수 있는 발현에서 현저한 증가를 나타냈다. GAPDH-B 벡터은 발현에서 3배 증가를 나타내는 반면, GAPDH-A 벡터는 5 배의 발현에서 더욱 높은 증가를 나타낸다. 상기 벡터는 oriP 요소를 포함하지 않고 따라서 더욱 높은 적정량에 대한 잠재성을 가질 수 있다.
2.3 안정적
CHO
세포주에서 발현
안정적 형질전환된 세포의 구축
안정적 집단은 저항 유전자에 대하여 코딩하는 발현 벡터 및 벡터 코딩에 의하여, 이어서 항생제에 의해 매개되는 선별 압력에 의해 생성된다. 선별압력은 형질전환 후 14일째에 제거되었다. 상기 단계는 상이한 구조체 및 발현의 안정성의 리포터 단백질(IgG1 항체 및 GFP)의 발현 수준과 비교하기 위하여 생성물 실행에서 정기적 간격으로 배양되는 안정적 미니 풀 및 안정적 풀의 생성을 허가하였다
세포 풀로 수행된 생성물 실행 상에서 리포터 단백질 발현 연구
풀은 안정적 형질전환에 의해 생성되었다. 선별 절차 동안(형질전환 후 첫 번째 14일째)에 풀은 FACS에 의해 분석되었다. 배양의 생존율과 같이 GFP 양성세포 분획의 증가는 시간이 지남에 따라 관찰된다. 항생제에 의해 매개되는 선별압력은 14일 후에 풀로부터 제거되었다. 상기 접근법을 사용하여 "B" 플라스미드로 형질전환된 세포 풀은 얻을 수 없었다. 생성된 풀의 발현 수준은 세포가 50 ㎖ 생물반응기 튜브에서 배양될 수 있자마자 분석되었다. 일괄은 중복으로 행하여졌다. 세포는 GFP 발현을 위해 FACS에 의해 분석되었고 상층액에서 IgG의 축적은 발현 8일째 후에 옥테트에 의해 분석되었다.
비례적 관계를 IgG 적정량 및 풀의 GFP 발현 사이에서 관찰할 수 있다. 따라서, 단지 IgG 데이타를 도 4에 나타냈다. GAPDH 서열을 포함하는 벡터를 갖는 형질전환된 모든 풀은 벡터 pGLEX41 또는 GAPDH 서열 없이 동일한 벡터(A 및 A-GAPDH 사이의 2.8 요소. B 풀이 생존하지 않았기 때문에 B 및 B-GAPDH 사이에서 결론을 나타낼 수 없음)와 비교하여 높은 발현을 나타낸다. A-GAPDH 및 B-GADPH로 수행된 형질전환은 pGLEX41 형질전환 (일괄-2에 대하여)보다 높은 발현의 IgG(각각 2.7 및 3.5 폴드 이상)를 유도하였다. 따라서, 풀에서, GAPDH 인접 서열은 단백질 생성에 대하여 호의적으로 보인다.
최종적으로, B-GADPH 벡터로 수행된 형질전환은 A-GAPDH로 수행된 형질전환보다 높은 발현의 IgG를 유도하였다(1.25 요소). 따라서, 저항 유전자에서 CpG 감소는 역시 단백질의 안정적 생성을 위해 호의적으로 보인다.
of 1.25).
클론의
집단 상에서
발현 수준 연구
세포를 형질전환하고 클론 또는 올리고클론 집단을 얻기 위하여 선택 배지에서 96 웰 플레이트에 분포하였다. 7일 후에 선별압력을 세포로 선택 배지 첨가에 의해 새롭게하였다. GFP의 발현을 ELISA-플레이트 리더를 사용하여 형질전환 후에 14일째에 평가하였다. 상기 결과를 도 5에 나타냈다.
세포 내 풀에서 얻어진 결과를 확인함으로써, GAPDH 인접 서열을 포함하는 벡터로 형질전환된 세포는 GAPDH 업-및 다운스트림 서열(1.7부터 2 폴드까지 요소) 없는 동일한 백본 또는 대조군으로서 사용된 다른 벡터(pGLEX41: 2.5 폴드)보다 현저히 더 많은 GFP를 발현한다(도 5). 추가적으로, 단지 코돈 최적화된 해당 벡터 (A)보다 CpG 감소된 저항 서열을 포함하는 벡터(B)를 갖는 집단은 높은 발현을 유도하였다(A 및 B사이에서 1.5 폴드; B 및 B-GAPDH 사이에서 1.2 폴드).
발현연구로부터 몇 가지 결론을 그릴 수 있다, 첫째, GAPDH 업-및 다운스트림 서열은 벤치마크(pGLEX41)로서 사용된 표준 벡터보다 높은 발현을 허가하였다. 또한 세포가 GAPDH 서열이 없는 동일한 벡터 백본으로 형질전환될 때 낮은 발현 수준이 얻어짐으로써 발현 상에서의 유익한 효과는 삽입된 GAPDH 인접 서열과 관련됨을 확인하였다. 추가적으로, 플라스미드의 발현 및 선별에서 CpG 수의 감소는 발현에 대해 역시 약간 호의적으로 보인다.
실시예
3: 새롭게 디자인된 벡터로 형질전환된
CHO
-S
GMP
세포의 일시적 발현 수준
GAPDH 프로모터의 5' 영역이 포볼 에스테르 응답 요소(phorbol ester response elememnt) 뿐만 아니라 잠재적 인슐린을 정착한다는 것은 문헌에서 설명되어 있다(Alexander-Bridges et al., (1992) Advan Enzyme Regul, 32: 149-159). 포볼 에스테르 응답 요소(-1040 -1010 bps) 는 GAPDH 프로모터 (-488 - +20)로서 항상 언급되는 것의 업스트림에 위치해 있다. 안정적 H35 간암 세포주에서 수행된 삭제연구에서, 발명자는 베이스짝(basepairs) -1200 내지 -488(전사시작 점에 비례하여)의 삭제의 현저한 효과를 나타낼 수 없었다. 따라서, 포볼 에스테르 응답 요소는 GAPDH 프로모터로부터 유도된 발현과 기능적으로 연결될 수 없다. 그럼에도 불구하고 GAPDH 인접 요소를 포함하는 플라스미드를 사용하여 관찰되는 일시적 및 안정 적 발현의 증가에서 인슐린 및 PMA(phorbol-12-myristate-13-acetate, the most common phorbol ester)의 기여를 평가하기 위하여 일시적 형질전환 실험을 수행하였다.
인슐린이 없는 성장 배지를 얻기 위하여, PowerCHO2를 분말 배지로부터 제조하고 인슐린을 첨가하지 않았다. PMA를 시그마(St. Louis, MO)로부터 구입하였고, PowerCHO2(+/- 인슐린)에서 1.6μM의 최종농도(H35 간암 세포주 상에서 알렉산더-브릿지(Alexander-Bridges)에 의하여 사용된 농도에 해당함)로 투여하였다.
형질전환을 상기에서 설명한 바와 같이 50 ㎖ 생물반응기(bioreactor) 튜브(Tubespins, TPP, Trasadingen, Switzerland)에서 수행하였다. 옵티MEM(OptiMEM) (Life technologies, Carlsbad, CA)에 의해 제공된 인슐린의 존재를 피하기 위하여, 형질전환 배지를 4 mM Gln 및 25 mM 헤페스로 보충된 RPMI1640 (PAA, Pasching, Austria)로 변경하였다. 형질전환 후, 세포를 12 웰 플레이트에 분포하고 4개의 상이한 배지의 1 ㎖를 첨가하였다(PowerCHO2, 4mM Gln, +/-인슐린; PowerCHO2, 4mM Gln, 1.6 ? PMA, +/- 인슐린). 다시, 2개의 IRES를 사용하여 IgG1 및 GFP를 발현하는 리포터 구조체를 사용하였다(실시예 2에서 설명됨). 상기 벡터는 형질전환 효율을 검증하는것을 허가하였다. 형질전환된 세포의 퍼센트 및 생존율을 모든 4 개의 상이한 배지 제조에서 유사함을 발견하였다.
도 6에 나타낸 바와 같이, 인슐린 고갈 및/또는 PMA 첨가의 현저한 효과를 상기 실험 동안에 관찰할 수 없었다. 유사한 적정량을 발현에 사용된 모든 배지에서 얻었다. 상기는 GAPDH 유전자의 업스트림 인접 서열에 존재하는 잠재적 포볼 에스테르 및 인슐린 응답요소가 일시적 외래유전자(transgene) 발현에 영향을 주지 않는다는 것을 제시한다.
실시예
4: 리포터 유전자 발현 상의 효과를 연구하기 위하여 프로모터의
업스트림
및
polyA 자리의
다운스트림
GAPDH
발현 카세트 인접하는
DNA
의 단편화 분석
인간 GAPDH 자리(locus)는 인간 게놈의 염색체 12 상에 위치해 있다. GAPDH는 효소가 글루코오스의 대사(metabolism)에서 핵심역할인 것처럼, 포유동물 기원의 모든 세포에서 계속적으로 활성되도록 설명된다. 프로모터의 업스트림, GAPDH 유전자는 NCAPD2, 30000 bp 보다 이상으로 스트레치하는 유전자에 의해 옆에 있다. 폴리아데닐레이션 자리의 다운스트림, GAPDH 유전자는 IFFO1에 의해 옆에 있다(상세설명을 위해 도 7을 참조).
GAPDH 및 프로모터 뿐만아니라, 또한 인접 영역은 상이한 종(species) 사이에서 잘 보존된다(표 4를 참조).
표 4: 인간, 래트 및 마우스 GAPDH 인접 영역 사이에서 높은 상동(homologies)의 스트레치. 분석을 클론 매니저 9(manager 9)(ScieED, Cary, NC, USA)을 사용하여 행하였다. 숫자화는 각각 업스트림 또는 다운스트림 인접 요소(각각 서열 ID NO: 7 및 서열 ID NO: 8)의 첫 번째 베이스에 비례한다. 정렬에 사용된 서열은 서열 ID No 18의 마우스 베이스 532-3731 (업스트림) 및 8164-11364 (다운스트림) 및 서열 ID No 19의 래트 베이스 719-3918 (업스트림) 및 8495-11058 (다운스트림)에 대하여 사용된다.
업스트림 영역 | 다운스트림 | ||||||
상동( homology )의 서열 [ 래트 ] | 상동( homology )의 서열 [마우스] | 상동( homology )의 서열 [래트] | 상동( homology )의 서열[마우스] | ||||
>80 % | >90 % | >80 % | >90 % | >80 % | >90 % | >80 % | >90 % |
161-249 | 279-331 | 15-69 | 278-329 | 1608-1764 | 1706-1764 | 1614-1671 | 1904-2061 |
256-338 | 554-623 | 159-249 | 546-626 | 1894-2067 | 1912-2061 | 1888-2072 | 2927-3071 |
515-659 | 273-342 | 2918-3082 | |||||
2296-2349 | 515-647 | ||||||
2381-2513 | 1143-1223 | ||||||
2736-2818 | 1957-2009 | ||||||
2029-2080 | |||||||
2375-2485 | |||||||
2730-2821 |
설치류 및 인간 사이에서 DNA 상동(homology)의 비교는 38%의 최소 DNA 보존을 나타낸다. 프로모터 영역 또는 유전자에 대해 코딩하는 영역에 대한 DNA 외부의 보존된 스트레치의 존재는 DNA 서열을 유지하거나 단지 특정/소수 변경을 허가하는 세포 상에서의선별 압력일 수 있음을 나타낸다. 본 발명의 특정 경우에, GAPDH 인접 영역은 GAPDH 유전자의 높은 발현 수준을 유지하기 때문에 세포에 대해 중요할 수 있다. 발현 감소를 유도하는 DNA 서열에서의 변경은 이에 대하여 선별될 수 있다.
발현에서 증가가 관찰된 업스트림 및 다운스트림 GAPDH 요소의 기여를 평가하기 위하여, 구조체는 단지 업스트림 GAPDH 인접 영역(서열번호: 7), 업스트림 GAPDH 인접 영역 또는 다운스트림 GAPDH 인접 영역(서열번호: 8)의 단편을 포함하도록 만들어져졌다. 리포터 IgG1 타입 항체는 RES 구조체 (경쇄-IRES-중쇄)에 의해 발현되고, 따라서 다수의 플라스미드의 공동-형질전환을 피한다. GAPDH 업스트림 단편의 단편화에 대한 상세설명을 도 8에 나타냈다. 하기의 업스트림 GAPDH 인접 영역의 단편이 사용되었다: 단편 1 (서열번호: 9), 단편 2 (서열번호: 10), 단편 3 (서열번호: 11), 단편 4 (서열번호: 12), 단편 8 (서열번호: 13), 단편 9 (서열번호: 14), 단편 11 (서열번호: 15), 단편 17 (서열번호: 16).
사용된 업스트림 GAPDH 인접 영역(서열번호: 7)은 3개가 자체의 5'에 게놈 DNA에 연결되고 3 개가 자체의 3'말단에 게놈 DNA에 연결된 NruI 제한 자리의 2 곱하기 3(총 6)의 뉴클레오티드를 포함한다. 사용된 다운스트림 GAPDH 인접 영역(서열번호: 8)은 3개가 자체의 5'에 게놈 DNA에 연결되고 3 개가 자체의 3'말단에 게놈 DNA에 연결된 ScaI 제한 자리의 2 곱하기 3(총 6)의 뉴클레오티드를 포함한다. 각각의 제한 자리의 뉴클레오티드가 없는 업스트림 GAPDH 인접 영역 및 다운스트림 GAPDH 인접 영역은 서열번호: 20(제한효소 자리 없는 업스트림 GAPDH 인접 영역) 및 서열번호: 21(제한효소 자리 없는 다운스트림 GAPDH 인접 영역)에 나타낸다. 사용된 업스트림 GAPDH 인접 영역의 단편은 게놈 DNA(단편 1은 자체의 5' 말단에 NruI 제한 자리(restriction site)의 3 뉴클레오티드를 포함하고; 단편 2는 자체의 3' 말단에 NruI 제한 자리의 3 뉴클레오티드를 포함하고; 단편 3은 자체의 5' 말단에 NruI 제한 자리의 3 뉴클레오티드를 포함하고; 단편 4는 자체의 3' 말단에 NruI 제한 자리의 3 뉴클레오티드를 포함하고; 단편 8은 자체의 3'말단에 NruI 제한 자리의 3 뉴클레오티드를 포함하고; 단편 9는 자체의 5'말단에 NruI 제한 자리의 3 뉴클레오티드 및 자체의 3' 말단에 NruI 제한 자리의 3 뉴클레오티드를 포함하고; 단편 11은 자체의 3'말단에 NruI 제한 자리의 3 뉴클레오티드를 포함한다)에 연결된 자체의 5' 및/또는 자체의 3' 말단에 있는 각각의 제한 자리의 3 뉴클레오티드를 각각 포함한다. 단편 17은 제한 자리의 뉴클레오티드를 포함하지 않는다. 각각의 제한 자리의 뉴클레오티드가 없는 업스트림 GAPDH 인접 영역의 단편은 서열번호: 22 (제한 자리 없는 단편 1), 서열번호: 23 (제한 자리 없는 단편 2) 서열번호: 24 (제한 자리 없는 단편 3), 서열번호: 25 (제한 자리 없는 단편 4), 서열번호: 26 (제한 자리 없는 단편 8), 서열번호: 27 (제한 자리 없는 단편 9), 서열번호: 28 (제한 자리 없는 단편 11)에 나타냈다.
발현 상의 업스트림 및 다운스트림 GAPDH 요소의 효과는 상층액에서 배출된 IgG1의 양을 정량화하기 위하여 옥테트(Fortebio, Menlo, CA, USA)를 사용하여 형질전환 후 10일 째에 평가되었다(도 9 참조). pGLEX41, 본래 벡터는 pGLEX41-ampiA 백본에 사용된 개선된 새로운 벡터 디자인과 비교하여 낮은 발현 결과(80%)를 준다. 본래 pGLEX41 백본과 비교하여 새로운 디자인은 복제의 상이한 기원(복제의 pUC 기원 대신에 R6K), E. coli에서 엠피실린 저항에 필요한 ampiA 유전자의 코돈 최적화 및 박테리아 기원의 불필요한 링커(또는 스페이서)서열의 제거를 포함한다. 벡터 모두는 대략 동일한 사이즈를 가진다.
놀랍게도, 업스트림(서열번호: 7) 및 다운스트림 요소(서열번호: 8)을 포함하는 pGLEX41-ampiA (발현 결과를 나타내는 도 9에서 pGLEX41-업/다운으로 명명)는, 업스트림 및 다운스트림 서열없는 동일한 벡터와 비교하여 높은 발현(1.5 지수)을 준다. 만약 누군가 사이즈에서 차이(업/다운 단편은 대략 6000 bps에 의해 플라스미드의 사이즈를 증가시킴) 및 따라서 형질전환 동안에 운반된 플라스미드 복제에서 차이를 고려하면, 효과는 플라스미드 기본 당(per plasmid basis)에서 더욱 더 중요할 수 있다
단지 업스트림 단편(업)을 포함하는 벡터는 본래 발현 구조체 pGLEX41-ampiA에 유사한 발현 수준을 나타낸다. 단지 다운스트림 단편(다운)을 포함하는 벡터는 본래 발현 구조체 pGLEX41-ampiA과 비교하여 발현에서 현저한 증가(1.2 지수)을 나타내고 있다. 발현에서 추가 증가는 만약 업- 및 다운스트림 단편 모두가 존재한다면, 관찰될 수 있다. 상기는 업스트림 단편의 단편화에 의해 확인된다. 단편 9 및 프로모터 근부(proximal) 단편 8은 pGLEX41-ampiA와 비교하여 발현에서 임의 차이를 나타내지 않는다. 단편 1, 11 및 17은 발현에서 증가를 나타낸다. 가장 높은 증가는 단편 4에서 관찰되었다. 프로모터 근부(proximal) 단편 8이 임의 효과를 나타내지 않음이 강조되어야만 한다. 따라서 발현에서 증가는 기존에 게재된 서열에 의해 설명될 수 없다(Alexander-Bridges et al., (1992) Advan 효소 Regul, 32: 149-159), Graven et al., (1999) Biochimica et Biophysics Acta 147: 203-218).
흥미롭게도, 단편 2 및 3은 발현에서 현저한 감소를 유도한다. 상기는 예상되지 않았고, 특히 상기 단편이 반대 방향(도 9에서 안티센스(AS))으로 클론되는 사실의 관점에서 상기 효과를 초래하지 않는다. 단편 1, 8, 9, 11 및 17에 대하여 센스 또는 안티센스 방향(orientation)(데이타를 나타내지 않음)으로 통합된 단편에 대하여 발현에서 차이가 관찰되지 않았다. 비록 단편 2의 일부이지만, 단편 11은 상기 효과를 나타내지 않는다. 따라서 발현에 해를 끼치는 것처럼 보이는 서열 요소는 단편 11을 얻기 위하여 단편 2에서 삭제된 BstBI-BstBI 단편 상에 적어도 부분적으로 있어야만 한다.
추가적으로, 부정적 요소가 BstBI-BstBI 단편 상에 위치한다는 가설은 단편 3 (BstBI-BstBI 단편을 포함하는) 및 단편 1 사이에 관찰된 발현에서 증가에 의해 지지된다.
부정적 효과(BstBI-BstBI)를 가지는 단편을 국한시키기에 쉬운 것으로 보이는 반면에, 상기 연구로부터 단편 2 및 3에서 관찰되는 부정적 효과가 어떻게 완전한 업스트림 단편에서 서열 요소 존재에 의해 보상되는 지는 덜 분명하다. 상기 부정적 효과는 단편 1 및 단편 4(그러나 단편 1에 대한 발현에서 증가는 단편 4보다 약함)에 의해 관찰된 적은 긍정적 효과에 의해 균형될 수 있다. 그럼에도 불구하고 상기 관찰된 단편 4에 대한 긍정적 효과(1.25 지수)가 부정적 효과 (0.4 지수)와 비교하여 덜 중요한 것처럼 보인다. 추가적으로 BstBI-BstBI 단편이 없는 전체 업스트림 영역인 단편 9은 전체 GAPDH 업스트림 인접 영역(nevertheless, 단편 9 포함한다s the EcoRV-BstBI 단편 which is part of 단편 2 및 3 및 might have a 부정적 효과 on 발현)과 비교하여 증가된 발현을 나타내지 않는다(그럼에도 불구하고, 단편 9은 단편 2 및 3의 일부인 EcoRV-BstBI 단편을 포함하고 발현 상에서 정적 효과를 가질 수 있다)
관찰된 효과 뒤의 기전에 대하여 단지 추측될 수 있다. 단편 2 및 3으로 관찰된 발현 상의 부정적 효과의 방향 의존성은 단지 하나의 방향의 발현을 유발할 수 있는 둘러싸는 프로모터가 없기 때문에, 비식별된 오픈리딩프레임의 발현(예를 들면, ncRNA의 발현)을 배제한다. 발현이 기저 수준 밑으로 감소된 사실은 긍정적 효과(예를 들면, 인핸서 활성)의 부재 뿐만아니라 부정적 효과에 의존하는 방향의 존재도 나타낸다.
요약하면, CHO 세포에서 일시적 발현의 놀라운 증가는 만약 인접 영역, 업스트림 및 다운스트림 영역 모두가 발현 플라스미드에서 존재하면, 관찰된다. 비록 단편 4는 발현상에서 현저한 긍정적 효과를 가지지만, 단일 단편은 관찰되는 발현의 전체 증가에 책임되는 것으로 확인될 수 없다. 발현 벡터 GLEX41-ampiA (up/down) 발현 증가는 up- 및 다운스트림 인접 영역 모두의 효과를 요약하는 것으로 보인다.
실시예
5:
차이니즈
햄스터
GAPDH
유전자 및
차이니즈
햄스터 프로모터의
비번역된
게놈
DNA
서열
업스트림의
클로닝
1.1 발현 벡터로
차이니즈
햄스터
GAPDH
유전자의
비번역된
게놈
DNA
서열
업스트림
의
클로닝
차이니즈 햄스터 GAPDH 유전자의 비번역된 게놈 DNA 서열 업스트림은 PCR에 의해 CHO-S (Life Technologies) 세포의 게놈 DNA로부터 증폭되었다. 게놈 DNA는 실시예 1에서 설명된 바와 같이 추출되었다. 구조체는 실시예 1에서 설명된 바와 같이 리포터 유전자 구조체 [REP]의 발현을 위하여 마우스 CMV 프로모터 또는 차이니즈 햄스터 GAPDH 프로모터를 사용하여 제조된다.
마우스 CMV 프로모터와 혼합하여 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림의 클로닝을 위하여, 프라이머 GlnPr1896 및 GlnPr1897는 실시예 1에서 설명된 PCR 프로토콜을 사용하고 서열번호 30으로 엠플리콘을 유도하여 3 kbs 단편 (bps 672 to 3671 of 서열번호 29)의 증폭에 사용되었다. 엠플리콘은 프라이머에 의해 도입된 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림 및 5' 및 3' 제한효소 자리를 포함한다.
차이니즈 햄스터 GAPDH 프로모터와 혼합하여 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림의 클로닝을 위하여, 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림 및 서열번호 31로 엠플리콘을 유도하는 GAPDH 프로모터 (bps 672 to 4179 of 서열번호 29) 를 포함하는 게놈 DNA 서열을 포함하는 3508 bps 단편을 증폭하기 위하여 프라이머 GlnPr1902 및 GlnPr1905가 사용되었다. 두 번째 PCR에서, GlnPr1901 및 GlnPr1902은 서열번호 32로 유도하는, 단지 프로모터 영역(bps 3672 to 4179 of 서열번호 29)을 포함하는 508 bps 단편의 증폭에 사용되었다. 벡터"A"에서 사용된 인트론(실시예 1에서 설명됨)은 프라이머 GlnPr1903 및 GlnPr1904를 사용하여 증폭되었다.
첫번째 융합 PCR은 템플레이트로서 서열번호: 32를 갖는 엠플리콘 및 인트론 서열을 갖는 엠플리콘을 사용하여 프라이머 GlnPr1904 및 GlnPr1901로 수행되었다. 상기 엠플리콘은 차이니즈 햄스터 GAPDH 프로모터, 인트론 및 프라이머에 의해 도입된 5' 및 3' 제한효소 자리를 포함한다. 모든 프라이머는 표5에 나타냈다.
두 번째 융합 PCR은 템플레이트로서 서열번호 31을 갖는 엠플리콘 및 인트론 서열을 갖는 엠플리콘을 사용하여 프라이머 GlnPr1905 및 GlnPr1904으로 수행되었다. 엠플리콘은 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림, 차이니즈 햄스터 GAPDH 프로모터, 인트론 및 프라이머에 의해 도입된 5' 및 3' 제한효소 자리를 포함한다.
1% 아가로우즈 젤에서 정제 후에, "뉴클레오스핀 젤 및 PCR 클린업(NucleoSpin Gel and PCR Clean-up)" (Macherey Nagel, Oensingen, Switzerland)를 사용하여 관심의 밴드를 자르고 정제하였다. 정제된 단편은 제로블런트 PCR 클로닝 키트(Zero Blunt PCR cloning kit) (Invitrogen, Carlsbad, CA, USA)를 사용하여 플라스미드 pCR_Blunt로 클론되었다. 결찰 생성물(Ligation products)은 컴피턴트(competent) E. Coli TOP10(One Shot®TOP 10 Competent E. Coli; Invitrogen, Carlsbad, CA, USA)으로 형질전환되었고 미니프렙의 제한 분석으로 분석되었다. 상기는 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림을 포함하는 플라스미드 pCR_blunt[CHO-업스트림GAPDH], 벡터"A"로부터 차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림 및 GAPDH 프로모터 및 인트론을 포함하는 pCR_Blunt[CHO-upstreamGAPDH_GAPDH프로모터] 및 벡터"B"로부터 GAPDH 프로모터 및 인트론을 포함하는 pCR_Blunt[CHO-GAPDH프로모터]로 유도한다.
배출된 유전자의 발현에 대한 자체 효과상에서 엠플리콘의 평가를 위하여, 벡터"A"(실시예 1에서 설명됨)가 사용되었다. 이전에 설명한 바와 같이, 상기 벡터에 사용된 발현 카세트는 배출된 IgG1 및 GFP를 위한 폴리시스트로닉(polycistronic) 유전자 코딩을 포함한다(실시예 1 참조). 따라서 형질전환된 세포는 IgG1 단클론 항체를 배출할 것이고 의존적 방식으로 세포 내 GFP를 축적할 것이다.
차이니즈 햄스터 GAPDH 유전자의 게놈 DNA 서열 업스트림을 포함하는 3 kb 삽입체 단편을 배출하기 위하여, 플라스미드 pCR_Blunt[CHO-upstreamGAPDH]를 제한효소 NaeI를 사용하여 절단하였다. 상기 삽입체는 "A"의 백본 상에서 클론되고 제한효소 NruI를 사용하여 절단되고 CIP처리되었다(CIP; NEB, Ipswich, MA, USA). 백본 및 삽입체는 T4 DNA 라이게이즈를 사용하여 결찰되었고(T4 DNA ligase, NEB, Ipswich, MA, USA) 후속적으로 컴피턴트 E. coli PIR1으로 형질전환되었다. 클론은 미니프렙 제조을 위하여 선택되고 후속적으로 제한분석을 히였다. 얻어진 플라스미드는 "A_GAPDH_UP"으로 명명하였고, 시퀀싱 분석으로 확인하였고 뉴클레오본드 엑스트라 미디키트(NucleoBond Xtra Midi kit)(Macherey Nagel, Oensingen, Switzerland)를 사용하여 미디프렙 규모로 생성되었다.
차이니즈 햄스터 GAPDH 프로모터를 사용하여 발현 구조체의 클로닝을 위하여, 삽입체 단편은 제한효소 NheI 및 NruI을 사용하여 분해에 의해 플라스미드 pCR_Blunt[CHO-업스트림GAPDH_GAPDH 프로모터] 및 pCR_Blunt[CHO-GAPDH프로모터]로부터 방출되었다. 얻어진 단편은 벡터 "A"의 백본에서 클론되었고 동일한 효소를 사용하여 오픈되었고 CIP처리되었다. T4 DNA 라이게이즈로 결찰 및 컴피턴트 E.coli PIR1로 전환 후에, 클론은 미니 제한 분석을 위해 선택되었다. 얻어진 플라스미드는 "A_GAPDH_UP_Prom" (차이니즈 햄스터 GAPDH 및 프로모터의 비번역된 게놈 DNA 서열 업스트림을 갖는 플라스미드)으로 명명되었고 "A_PR"(단지 프로모터를 갖는 플라스미드)는 시퀀싱 분석에 의해 확인되었고 키트 뉴클레오본드 엑스트라 미디키트(NucleoBond Xtra Midi)(Macherey Nagel, Oensingen, Switzerland)를 사용하여 미디프렙 규모로 생성되었다.
2. 리포터 유전자 구조체의 발현 상에서
차이니즈
햄스터
GAPDH
유전자의
비번역된
게놈
DNA
서열
업스트림의
평가
CHO-S 세포는 10 ml의 배지 부피(실시예 2에서 설명됨)를 사용하여 튜브스핀생물반응기(tubespins bioreactors)에서 형질전환되었다. 형질전환된 세포는 37℃, 5 % CO2 및 80 % 습도에서 200 rpm 진탕으로 진탕 배양기에서 배양되었다. 세포의 상층액은 단백질 A 바이오센서 (ForteBio, Menlo Park, CA, USA)가 있는 옥테트 QK 시스템을 사용하여 IgG1 발현에 대하여 분석되었다. 결과는 도 10에 나타냈다.
마우스 CMV 프로모터 (A)와 비교하여 GAPDH 프로모터("A_PR")를 포함하는 플라스미드의 발현 수준은 50 %에 의해 감소되었고, 차이니즈 햄스터 GAPDH 프로모터는 바이러스 프로모터만큼 강하지 않다. 차이니즈 햄스터 GAPDH 프로모터 ("A_GAPDH_UP_Prom")와 혼합하여 차이니즈 햄스터 GAPDH 유전자의 비번역된 게놈 DNA 서열 업스트림을 포함하는 플라스미드는 단지 GAPDH프로모터("A_PR")을 갖는 구조체와 비교하여 발현에서 2 폴드 증가를 나타낸다. 차이니즈 햄스터 GAPDH 유전자의 비번역된 게놈 DNA 서열 업스트림 및 마우스 CMV 프로모터 ("A_GAPDH_UP")을 포함하는 플라스미드는 단지 마우스 CMV 프로모터("A")를 포함하는 플라스미드에서 40% 이상의 가징 높은 발현 및 증가를 나타낸다("A"). 상기는 차이니즈 햄스터 GAPDH 유전자의 비번역된 게놈 DNA 서열 업스트림은 리포터 단백질의 발현 상에서 인핸서 효과를 가진다.
표 5:
실시예
5에서
클로닝에
사용된
프라이머
프라이머 |
서열식별번호
( SEQ ID No ) |
서열 |
방향
( Orientation ) |
제한자리 ( Restrn . site) |
GlnPr 1896 | 서열식별번호 33 | TACGGCCGGCTTCACTGTACAGTGGCACAT | 정방향 | NaeI |
GlnPr 1897 | 서열식별번호 34 | TCAGGCCGGCCGTGGTTCTTCGGTAGTGAC | 역방향 | NaeI |
GlnPr 1901 | 서열식별번호 35 | TACTCGCGAAGAAGATCCTCAACTTTTCCACAGCC | 정방향 | NruI |
GlnPr 1902 | 서열식별번호 36 | GTTCACTAAACGAGCTCTGCTATTTATAGGAACTGGGGTG | 역방향 | / |
GlnPr 1903 | 서열식별번호 37 | CACCCCAGTTCCTATAAATAGCAGAGCTCGTTTAGTGAAC | 정방향 | / |
GlnPr 1904 | 서열식별번호 38 | CGCTAGCACCGGTCGATCGA | 역방향 | NheI |
GlnPr 1905 | 서열식별번호 39 | TACTCGCGATTCACTGTACAGTGGCACATAC | 정방향 | NruI |
<110> Glenmark Pharmaceuticals SA
<120> Expression Cassette
<130> 2014fpi-06-003
<150> PCT/US US 61/567,675
<151> 2011-12-07
<160> 39
<170> KopatentIn 2.0
<210> 1
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 1
<400> 1
attattcgcg atggctcctg gcatctctgg gaccgaggc 39
<210> 2
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 2
<400> 2
atcgtcgcga agcttgagat tgtccaagca ggtagccag 39
<210> 3
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 3
<400> 3
agcaagtact tctgagcctt cagtaatggc tgcctg 36
<210> 4
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 4
<400> 4
tggcagtact aagctggcac cactacttca gagaacaag 39
<210> 5
<211> 3179
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' GAPDH fragment
<400> 5
atcgtcgcga agcttgagat tgtccaagca ggtagccaga gagcgccatc agccaagaaa 60
ccatccactg gtacgtaagg cagcctgtgc gggcgagacc agactgggcc ctcccctcct 120
gcagtgattt gtttcttctt cttttttaaa tcacgttttc ctgccttttc taggttctag 180
gtaccagcct ctggcttcta cagcctcaga caatgacttt gtcacaccag agccccgccg 240
tactacccgt cggcatccaa acacccagca gcgagcttcc aaaaagaaac ccaaagttgt 300
cttctcaagt gatgagtcca gtgaggaagg tatgatgctc ccgcctgttc ccggccgaga 360
aggcacacag ctagggtgca gagggctggt ttccatagga cctgctgcgg gggcctgagt 420
gtagatgctc tgccccactg ccgcagaagg gcctctcctg tacagcttgg attttatttc 480
ttctgtgcgg tgtgggattg tctcacttgt tctctgatat ctattttttc accatctttg 540
tgactcagct ttttcttatt cctttaattc tttgcataga tctttcagca gagatgacag 600
aagacgagac acccaagaaa acaactccca ttctcagagc atcggctcgc aggcacagat 660
cctaggaagt ctgttcctgt cctccctgtg cagggtatcc tgtagggtga cctggaattc 720
gaattctgtt tcccttgtaa aatatttgtc tgtctctttt ttttaaaaaa aaaaaaggcc 780
gggcactgtg gctcacgcct gtaatcccag cactttgcga taccaaggcg ggtggataac 840
ctgaggtagg gagttcgaga ccagcctgac caacatggag aaaccccatc tctactaaaa 900
ataaaaaatt agccgggcgt attggcgtgc gcctgtaatc ccagctactc aagaggctga 960
ggcaggagaa tcgcctgaac ccagaggcgg aggttgtagt gagccgaaat cacaccattg 1020
cactccagct tgggcaacaa tagcgaacct ccatctcaaa ttaaaaaaaa aatgcctaca 1080
cgctctttaa aatgcaaggc tttctcttaa attagcctaa ctgaactgcg ttgagctgct 1140
tcaactttgg aatatatgtt tgccaatctc cttgttttct aatgaataaa tgtttttata 1200
tacttttaga cattttttcc taagcttgtc tttgtttcat ctttcacatt agcccagttt 1260
catgcagcag agagagggtt atcagtgcag agagagatga gtgagcccag agtcctaggg 1320
cctgtcccgg gatggcagat gagcttcctg ccccgtcact gccacctttc ccctctcaac 1380
ctctggaccc tgcacagtga ccagacagcc tctctgggga gaattatgca gtgcctaggc 1440
tccagatcag tgcttctgaa ccgggggcaa ttttgtctgc cagaggacat ctgacaacac 1500
ctggggcctg ttttgttgtc atagcctata ggggaagaat gctaccagca tttgtgggaa 1560
gaggccaggg atgtggctca acatcctgca gtgcacagga tggcccctca acaaagaatc 1620
acacggccca caatgtcaat agcgtcacag ttgagaaaac ctgctctaga ccaagggttg 1680
ctttctgccg tgtgcctcac cccaccccca ctcgtgttcc ctaatcccat ctccaaaggt 1740
tggcagcaga ccggcccagg ctcgtggaag ttcagatcat gatcccctcc agctctgcag 1800
gagacaagac ctgtctccca gcattcctca ttgttcccgg gtctgcagag ggcgtgagct 1860
atgctgcagg cgggctgccc cctgaagcct gcgcacccct ctccagctcc tcaagtcttc 1920
tctgctgagt caccttcgaa ccggaggctg tgagctggct gtcgtgacca cactggtgcc 1980
tctgctgtca tgacaacagc acactacgtc agtagtgctc cctgggcact gagctccctc 2040
tttgcgggga gaagacagta atgaaaaatg acaagcatga ggcagagggg aagatcacgc 2100
ttgggtggtg caggagcatg gaggtgctct taatgctctc aatgagaaag ggttaacggt 2160
cctggttgca ggaatagctg agtcagaggt ggggcttcct ccactccccc accccacccc 2220
tttcaccatt agggaccttc ttgccttgct cttgctactc tgctctgggt ggtcattgtg 2280
aaaagcccgc accaaccatg ccagtggcag ccagacgagg acacagcctg gctctgggtc 2340
ccagcaggaa aggcaatccc agaaaggcag ggtcagggac tggagtcctg tgggtgcttt 2400
ttaagcaaag attatcacca ggcaggctaa acttagcaac cggcttttag ctagaagggc 2460
agggggctgg tgtcaggtta tgctgggcca gcaaagaggc ccgggatccc cctcccatgc 2520
acctgctgat gggccaaggc caccccaccc cacccccttc cttacaagtg ttcagcaccc 2580
tcccatccca cactcacaaa cctggccctc tgccctccta ccagaagaat ggatcccctg 2640
tgggaggggg caggggacct gttcccaccg tgtgcccaag acctcttttc ccactttttc 2700
cctcttcttg actcaccctg ccctcaatat cccccggcgc agccagtgaa agggagtccc 2760
tggctcctgg ctcgcctgca cgtcccaggg cggggaggga cttccgccct cacgtcccgc 2820
tcttcgcccc aggctggatg gaatgaaagg cacactgtct ctctccctag gcagcacagc 2880
ccacaggttt ccaggagtgc ctttgtggga ggcctctggg cccccaccag ccatcctgtc 2940
ctccgcctgg ggccccagcc cggagagagc cgctggtgca cacagggccg ggattgtctg 3000
ccctaattat caggtccagg ctacagggct gcaggacatc gtgaccttcc gtgcagaaac 3060
ctccccctcc ccctcaagcc gcctcccgag cctccttcct ctccaggccc ccagtgccca 3120
gtgcccagtg cccagcccag gcctcggtcc cagagatgcc aggagccatc gcgaataat 3179
<210> 6
<211> 3238
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'-GAPDH fragment
<400> 6
tggcagtact aagctggcac cactacttca gagaacaagg ccttttcctc tcctcgctcc 60
agtcctaggc tatctgctgt tggccaaaca tggaagaagc tattctgtgg gcagccccag 120
ggaggctgac aggtggagga agtcagggct cgcactgggc tctgacgctg actggttagt 180
ggagctcagc ctggagctga gctgcagcgg gcaattccag cttggcctcc gcagctgtga 240
ggtcttgagc acgtgctcta ttgctttctg tgccctcgtg tcttatctga ggacatcgtg 300
gccagcccct aaggtcttca agcaggattc atctaggtaa accaagtacc taaaaccatg 360
cccaaggcgg taaggactat ataatgttta aaaatcggta aaaatgccca cctcgcatag 420
ttttgaggaa gatgaactga gatgtgtcag ggtgacttat ttccatcatc gtccttaggg 480
gaacttgggt aggggcaagg cgtgtagctg ggacctaggt ccagacccct ggctctgcca 540
ctgaacggct cagttgcttt gggcagttac tcccgggcct cactttgcac gtgtgcttac 600
ctagtggaga caaaagtaca tacctcggta gagcgcgcac gcctgtaacc ccagcacttt 660
gggaggccaa ggtgggtgta tcacctgagg tcaggagttt gagaccagcc tggccaacat 720
ggtgaaactc cgtctctact aaaattacaa aaatcagcca ggcttcatgg cacatgccta 780
tagtcccagc tacaggcatg ctgaagcagg agaatcgctt gcaccccgga ggcagaggct 840
gcagtgagct gagaccacac cactgcactc cagcctaggc aacagagtat gagactccat 900
ctcaaaaaaa aaaaaagtac ctacctcaga gttcaaacta gtgaatatta ggaagtgctt 960
gagacagtga caccaaagtg cacaataaat actcgccagt ttcattatta ttaaagaatc 1020
catttgaatg tcagctcaac acagcctcct ataccgaggc attgtgaacc gcatctcccc 1080
agcttctcca ggcttttcca agaatcaggg acactgtagc ctgttggtct cagtgtatga 1140
cagacacgga ggaagcacat ctttagctga tacttaaaca gagaccctga gcgcacatac 1200
acccgcgcac acatgcatgg agcttcacct tctctgtcat tctgcagtga ccaggagagc 1260
aagagctccc acctcccttc aaaacactgt gcccatcccg ggcactaagg cctctttaaa 1320
gcacggcacc tccacgaggg agggccacag ccacatacac tccacctggc aggtggacag 1380
cgtgagcacg tggaccatag cagggacaag gtgccccggc cagccccaac gccctctgcc 1440
gctgacaggg acagaagccc tctccagctg cgtgtgctgc agaggccatg cgtagcctcc 1500
agctgcattc tattccactc cagtgcctgg gccagttagc accagtgtgg aagacagtga 1560
gctggctccg gacaacaggg atggaggaaa ggtcccacat tcacattcct gatacgtgga 1620
caaggtgagg ggccgcaatc gctctggcag cattttaaag atggggaagt agcagacacc 1680
cacgcgtgaa ggcaggagag ccccaactgt ggtggaaatg gccccagaat ggtagggcca 1740
agcctagctc cagacacccc agagccctgg agaagccaag actgagggag aaagcctgag 1800
ggaggagcgc cccagtcccc agggaccggc ctggtgcaga gctgcagctg atgttcccct 1860
ctgtgcagcc ccaccctctg cctcgctgag ctccctgctg cgagggcctc gggtgcaagg 1920
gggaggcagg tctctatctc atggagctgt cagatgagac atcgcgatcg gagtcctcag 1980
cctcgcttgg cggcggcggc gggtcgctaa gcgggaccgc agtgaaagca ggagactttc 2040
tagaaaaaaa caccagttgt caaccttggg gcaggcagga atcctgaaga cggacggcac 2100
tcctcctcct gctgcctcac cctctggcag cccgtgagaa gtaccggaag cgagggcggg 2160
gccgcgggat ggcgagggag cggcagggac tgaactctct ccaaacccac cctgacaggg 2220
aaatgggccc cgcctgtgtc ttgggaactc agaggctgag gtcaggcatg atggctcacg 2280
cctgtaattc cagcactttg ggaggcagag gcgggtggat cacgacgtca ggagttcaag 2340
gcaagcctgg ccaacatggt gaaaccccat ctctactaaa aatgcaaaaa ttagccaggt 2400
gtggtggcgg gcgccttgga ggctgaggca agataatcac ttgaacctgg gaggcggagg 2460
ttgtagtgag ccaaaaaaaa aaaaaaaaga aatagctgaa gtcacagtag gagagaagct 2520
gctgagcctc cagcaccctg actctagggc cttggcttta tgtctatctg cagtattttt 2580
gtgattttta aaaattcact ttcttgttgc ggtgtaactt acacagggtc aaatgcacaa 2640
atcatggccc tgactttaga taaaaatctg cccccacaac ccttctgttc cttgccagtt 2700
tttaaactgc ctctaaccag gggaaccacc agagctggtg gccttgggag gtttcagccc 2760
tcccgtcatg aatggacata gctcatccaa ctgccaaggg agagagctgt gggtctgggc 2820
cagccccacc aggtaactcc caaagggcag ccccacagca agatgtgacc cagtcattgc 2880
ctgagggtct ctggggctgt gttccaacct ttctccccgc tgtgtccccc tggaaggccc 2940
catgcccagg ggaggcgcct accggtctcc agactgggtg atgagccggc ggcaggtctc 3000
catctgcacg tccaggccgc gcttcatgct gcacatctcc atgtactcgt gcaggtgccg 3060
gttcatgtcg ttcttggccg tggccaactc cagctgtggt ggggcaggca gggccatcgg 3120
ggttaacagg tggcgttcac agcgcctctg ttgcccccgc caggaggcca acacgccaag 3180
agcagtggct gggccggggg cccaggcagc cattactgaa ggctcagaag tacttgct 3238
<210> 7
<211> 3164
<212> DNA
<213> Artificial Sequence
<220>
<223> Upstream GAPDH flanking region
<400> 7
cgaagcttga gattgtccaa gcaggtagcc agagagcgcc atcagccaag aaaccatcca 60
ctggtacgta aggcagcctg tgcgggcgag accagactgg gccctcccct cctgcagtga 120
tttgtttctt cttctttttt aaatcacgtt ttcctgcctt ttctaggttc taggtaccag 180
cctctggctt ctacagcctc agacaatgac tttgtcacac cagagccccg ccgtactacc 240
cgtcggcatc caaacaccca gcagcgagct tccaaaaaga aacccaaagt tgtcttctca 300
agtgatgagt ccagtgagga aggtatgatg ctcccgcctg ttcccggccg agaaggcaca 360
cagctagggt gcagagggct ggtttccata ggacctgctg cgggggcctg agtgtagatg 420
ctctgcccca ctgccgcaga agggcctctc ctgtacagct tggattttat ttcttctgtg 480
cggtgtggga ttgtctcact tgttctctga tatctatttt ttcaccatct ttgtgactca 540
gctttttctt attcctttaa ttctttgcat agatctttca gcagagatga cagaagacga 600
gacacccaag aaaacaactc ccattctcag agcatcggct cgcaggcaca gatcctagga 660
agtctgttcc tgtcctccct gtgcagggta tcctgtaggg tgacctggaa ttcgaattct 720
gtttcccttg taaaatattt gtctgtctct tttttttaaa aaaaaaaaag gccgggcact 780
gtggctcacg cctgtaatcc cagcactttg cgataccaag gcgggtggat aacctgaggt 840
agggagttcg agaccagcct gaccaacatg gagaaacccc atctctacta aaaataaaaa 900
attagccggg cgtattggcg tgcgcctgta atcccagcta ctcaagaggc tgaggcagga 960
gaatcgcctg aacccagagg cggaggttgt agtgagccga aatcacacca ttgcactcca 1020
gcttgggcaa caatagcgaa cctccatctc aaattaaaaa aaaaatgcct acacgctctt 1080
taaaatgcaa ggctttctct taaattagcc taactgaact gcgttgagct gcttcaactt 1140
tggaatatat gtttgccaat ctccttgttt tctaatgaat aaatgttttt atatactttt 1200
agacattttt tcctaagctt gtctttgttt catctttcac attagcccag tttcatgcag 1260
cagagagagg gttatcagtg cagagagaga tgagtgagcc cagagtccta gggcctgtcc 1320
cgggatggca gatgagcttc ctgccccgtc actgccacct ttcccctctc aacctctgga 1380
ccctgcacag tgaccagaca gcctctctgg ggagaattat gcagtgccta ggctccagat 1440
cagtgcttct gaaccggggg caattttgtc tgccagagga catctgacaa cacctggggc 1500
ctgttttgtt gtcatagcct ataggggaag aatgctacca gcatttgtgg gaagaggcca 1560
gggatgtggc tcaacatcct gcagtgcaca ggatggcccc tcaacaaaga atcacacggc 1620
ccacaatgtc aatagcgtca cagttgagaa aacctgctct agaccaaggg ttgctttctg 1680
ccgtgtgcct caccccaccc ccactcgtgt tccctaatcc catctccaaa ggttggcagc 1740
agaccggccc aggctcgtgg aagttcagat catgatcccc tccagctctg caggagacaa 1800
gacctgtctc ccagcattcc tcattgttcc cgggtctgca gagggcgtga gctatgctgc 1860
aggcgggctg ccccctgaag cctgcgcacc cctctccagc tcctcaagtc ttctctgctg 1920
agtcaccttc gaaccggagg ctgtgagctg gctgtcgtga ccacactggt gcctctgctg 1980
tcatgacaac agcacactac gtcagtagtg ctccctgggc actgagctcc ctctttgcgg 2040
ggagaagaca gtaatgaaaa atgacaagca tgaggcagag gggaagatca cgcttgggtg 2100
gtgcaggagc atggaggtgc tcttaatgct ctcaatgaga aagggttaac ggtcctggtt 2160
gcaggaatag ctgagtcaga ggtggggctt cctccactcc cccaccccac ccctttcacc 2220
attagggacc ttcttgcctt gctcttgcta ctctgctctg ggtggtcatt gtgaaaagcc 2280
cgcaccaacc atgccagtgg cagccagacg aggacacagc ctggctctgg gtcccagcag 2340
gaaaggcaat cccagaaagg cagggtcagg gactggagtc ctgtgggtgc tttttaagca 2400
aagattatca ccaggcaggc taaacttagc aaccggcttt tagctagaag ggcagggggc 2460
tggtgtcagg ttatgctggg ccagcaaaga ggcccgggat ccccctccca tgcacctgct 2520
gatgggccaa ggccacccca ccccaccccc ttccttacaa gtgttcagca ccctcccatc 2580
ccacactcac aaacctggcc ctctgccctc ctaccagaag aatggatccc ctgtgggagg 2640
gggcagggga cctgttccca ccgtgtgccc aagacctctt ttcccacttt ttccctcttc 2700
ttgactcacc ctgccctcaa tatcccccgg cgcagccagt gaaagggagt ccctggctcc 2760
tggctcgcct gcacgtccca gggcggggag ggacttccgc cctcacgtcc cgctcttcgc 2820
cccaggctgg atggaatgaa aggcacactg tctctctccc taggcagcac agcccacagg 2880
tttccaggag tgcctttgtg ggaggcctct gggcccccac cagccatcct gtcctccgcc 2940
tggggcccca gcccggagag agccgctggt gcacacaggg ccgggattgt ctgccctaat 3000
tatcaggtcc aggctacagg gctgcaggac atcgtgacct tccgtgcaga aacctccccc 3060
tccccctcaa gccgcctccc gagcctcctt cctctccagg cccccagtgc ccagtgccca 3120
gtgcccagcc caggcctcgg tcccagagat gccaggagcc atcg 3164
<210> 8
<211> 3224
<212> DNA
<213> Artificial Sequence
<220>
<223> Downstream GAPDH flanking region
<400> 8
actaagctgg caccactact tcagagaaca aggccttttc ctctcctcgc tccagtccta 60
ggctatctgc tgttggccaa acatggaaga agctattctg tgggcagccc cagggaggct 120
gacaggtgga ggaagtcagg gctcgcactg ggctctgacg ctgactggtt agtggagctc 180
agcctggagc tgagctgcag cgggcaattc cagcttggcc tccgcagctg tgaggtcttg 240
agcacgtgct ctattgcttt ctgtgccctc gtgtcttatc tgaggacatc gtggccagcc 300
cctaaggtct tcaagcagga ttcatctagg taaaccaagt acctaaaacc atgcccaagg 360
cggtaaggac tatataatgt ttaaaaatcg gtaaaaatgc ccacctcgca tagttttgag 420
gaagatgaac tgagatgtgt cagggtgact tatttccatc atcgtcctta ggggaacttg 480
ggtaggggca aggcgtgtag ctgggaccta ggtccagacc cctggctctg ccactgaacg 540
gctcagttgc tttgggcagt tactcccggg cctcactttg cacgtgtgct tacctagtgg 600
agacaaaagt acatacctcg gtagagcgcg cacgcctgta accccagcac tttgggaggc 660
caaggtgggt gtatcacctg aggtcaggag tttgagacca gcctggccaa catggtgaaa 720
ctccgtctct actaaaatta caaaaatcag ccaggcttca tggcacatgc ctatagtccc 780
agctacaggc atgctgaagc aggagaatcg cttgcacccc ggaggcagag gctgcagtga 840
gctgagacca caccactgca ctccagccta ggcaacagag tatgagactc catctcaaaa 900
aaaaaaaaag tacctacctc agagttcaaa ctagtgaata ttaggaagtg cttgagacag 960
tgacaccaaa gtgcacaata aatactcgcc agtttcatta ttattaaaga atccatttga 1020
atgtcagctc aacacagcct cctataccga ggcattgtga accgcatctc cccagcttct 1080
ccaggctttt ccaagaatca gggacactgt agcctgttgg tctcagtgta tgacagacac 1140
ggaggaagca catctttagc tgatacttaa acagagaccc tgagcgcaca tacacccgcg 1200
cacacatgca tggagcttca ccttctctgt cattctgcag tgaccaggag agcaagagct 1260
cccacctccc ttcaaaacac tgtgcccatc ccgggcacta aggcctcttt aaagcacggc 1320
acctccacga gggagggcca cagccacata cactccacct ggcaggtgga cagcgtgagc 1380
acgtggacca tagcagggac aaggtgcccc ggccagcccc aacgccctct gccgctgaca 1440
gggacagaag ccctctccag ctgcgtgtgc tgcagaggcc atgcgtagcc tccagctgca 1500
ttctattcca ctccagtgcc tgggccagtt agcaccagtg tggaagacag tgagctggct 1560
ccggacaaca gggatggagg aaaggtccca cattcacatt cctgatacgt ggacaaggtg 1620
aggggccgca atcgctctgg cagcatttta aagatgggga agtagcagac acccacgcgt 1680
gaaggcagga gagccccaac tgtggtggaa atggccccag aatggtaggg ccaagcctag 1740
ctccagacac cccagagccc tggagaagcc aagactgagg gagaaagcct gagggaggag 1800
cgccccagtc cccagggacc ggcctggtgc agagctgcag ctgatgttcc cctctgtgca 1860
gccccaccct ctgcctcgct gagctccctg ctgcgagggc ctcgggtgca agggggaggc 1920
aggtctctat ctcatggagc tgtcagatga gacatcgcga tcggagtcct cagcctcgct 1980
tggcggcggc ggcgggtcgc taagcgggac cgcagtgaaa gcaggagact ttctagaaaa 2040
aaacaccagt tgtcaacctt ggggcaggca ggaatcctga agacggacgg cactcctcct 2100
cctgctgcct caccctctgg cagcccgtga gaagtaccgg aagcgagggc ggggccgcgg 2160
gatggcgagg gagcggcagg gactgaactc tctccaaacc caccctgaca gggaaatggg 2220
ccccgcctgt gtcttgggaa ctcagaggct gaggtcaggc atgatggctc acgcctgtaa 2280
ttccagcact ttgggaggca gaggcgggtg gatcacgacg tcaggagttc aaggcaagcc 2340
tggccaacat ggtgaaaccc catctctact aaaaatgcaa aaattagcca ggtgtggtgg 2400
cgggcgcctt ggaggctgag gcaagataat cacttgaacc tgggaggcgg aggttgtagt 2460
gagccaaaaa aaaaaaaaaa agaaatagct gaagtcacag taggagagaa gctgctgagc 2520
ctccagcacc ctgactctag ggccttggct ttatgtctat ctgcagtatt tttgtgattt 2580
ttaaaaattc actttcttgt tgcggtgtaa cttacacagg gtcaaatgca caaatcatgg 2640
ccctgacttt agataaaaat ctgcccccac aacccttctg ttccttgcca gtttttaaac 2700
tgcctctaac caggggaacc accagagctg gtggccttgg gaggtttcag ccctcccgtc 2760
atgaatggac atagctcatc caactgccaa gggagagagc tgtgggtctg ggccagcccc 2820
accaggtaac tcccaaaggg cagccccaca gcaagatgtg acccagtcat tgcctgaggg 2880
tctctggggc tgtgttccaa cctttctccc cgctgtgtcc ccctggaagg ccccatgccc 2940
aggggaggcg cctaccggtc tccagactgg gtgatgagcc ggcggcaggt ctccatctgc 3000
acgtccaggc cgcgcttcat gctgcacatc tccatgtact cgtgcaggtg ccggttcatg 3060
tcgttcttgg ccgtggccaa ctccagctgt ggtggggcag gcagggccat cggggttaac 3120
aggtggcgtt cacagcgcct ctgttgcccc cgccaggagg ccaacacgcc aagagcagtg 3180
gctgggccgg gggcccaggc agccattact gaaggctcag aagt 3224
<210> 9
<211> 511
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 1
<400> 9
cgaagcttga gattgtccaa gcaggtagcc agagagcgcc atcagccaag aaaccatcca 60
ctggtacgta aggcagcctg tgcgggcgag accagactgg gccctcccct cctgcagtga 120
tttgtttctt cttctttttt aaatcacgtt ttcctgcctt ttctaggttc taggtaccag 180
cctctggctt ctacagcctc agacaatgac tttgtcacac cagagccccg ccgtactacc 240
cgtcggcatc caaacaccca gcagcgagct tccaaaaaga aacccaaagt tgtcttctca 300
agtgatgagt ccagtgagga aggtatgatg ctcccgcctg ttcccggccg agaaggcaca 360
cagctagggt gcagagggct ggtttccata ggacctgctg cgggggcctg agtgtagatg 420
ctctgcccca ctgccgcaga agggcctctc ctgtacagct tggattttat ttcttctgtg 480
cggtgtggga ttgtctcact tgttctctga t 511
<210> 10
<211> 2653
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 2
<400> 10
atctattttt tcaccatctt tgtgactcag ctttttctta ttcctttaat tctttgcata 60
gatctttcag cagagatgac agaagacgag acacccaaga aaacaactcc cattctcaga 120
gcatcggctc gcaggcacag atcctaggaa gtctgttcct gtcctccctg tgcagggtat 180
cctgtagggt gacctggaat tcgaattctg tttcccttgt aaaatatttg tctgtctctt 240
ttttttaaaa aaaaaaaagg ccgggcactg tggctcacgc ctgtaatccc agcactttgc 300
gataccaagg cgggtggata acctgaggta gggagttcga gaccagcctg accaacatgg 360
agaaacccca tctctactaa aaataaaaaa ttagccgggc gtattggcgt gcgcctgtaa 420
tcccagctac tcaagaggct gaggcaggag aatcgcctga acccagaggc ggaggttgta 480
gtgagccgaa atcacaccat tgcactccag cttgggcaac aatagcgaac ctccatctca 540
aattaaaaaa aaaatgccta cacgctcttt aaaatgcaag gctttctctt aaattagcct 600
aactgaactg cgttgagctg cttcaacttt ggaatatatg tttgccaatc tccttgtttt 660
ctaatgaata aatgttttta tatactttta gacatttttt cctaagcttg tctttgtttc 720
atctttcaca ttagcccagt ttcatgcagc agagagaggg ttatcagtgc agagagagat 780
gagtgagccc agagtcctag ggcctgtccc gggatggcag atgagcttcc tgccccgtca 840
ctgccacctt tcccctctca acctctggac cctgcacagt gaccagacag cctctctggg 900
gagaattatg cagtgcctag gctccagatc agtgcttctg aaccgggggc aattttgtct 960
gccagaggac atctgacaac acctggggcc tgttttgttg tcatagccta taggggaaga 1020
atgctaccag catttgtggg aagaggccag ggatgtggct caacatcctg cagtgcacag 1080
gatggcccct caacaaagaa tcacacggcc cacaatgtca atagcgtcac agttgagaaa 1140
acctgctcta gaccaagggt tgctttctgc cgtgtgcctc accccacccc cactcgtgtt 1200
ccctaatccc atctccaaag gttggcagca gaccggccca ggctcgtgga agttcagatc 1260
atgatcccct ccagctctgc aggagacaag acctgtctcc cagcattcct cattgttccc 1320
gggtctgcag agggcgtgag ctatgctgca ggcgggctgc cccctgaagc ctgcgcaccc 1380
ctctccagct cctcaagtct tctctgctga gtcaccttcg aaccggaggc tgtgagctgg 1440
ctgtcgtgac cacactggtg cctctgctgt catgacaaca gcacactacg tcagtagtgc 1500
tccctgggca ctgagctccc tctttgcggg gagaagacag taatgaaaaa tgacaagcat 1560
gaggcagagg ggaagatcac gcttgggtgg tgcaggagca tggaggtgct cttaatgctc 1620
tcaatgagaa agggttaacg gtcctggttg caggaatagc tgagtcagag gtggggcttc 1680
ctccactccc ccaccccacc cctttcacca ttagggacct tcttgccttg ctcttgctac 1740
tctgctctgg gtggtcattg tgaaaagccc gcaccaacca tgccagtggc agccagacga 1800
ggacacagcc tggctctggg tcccagcagg aaaggcaatc ccagaaaggc agggtcaggg 1860
actggagtcc tgtgggtgct ttttaagcaa agattatcac caggcaggct aaacttagca 1920
accggctttt agctagaagg gcagggggct ggtgtcaggt tatgctgggc cagcaaagag 1980
gcccgggatc cccctcccat gcacctgctg atgggccaag gccaccccac cccaccccct 2040
tccttacaag tgttcagcac cctcccatcc cacactcaca aacctggccc tctgccctcc 2100
taccagaaga atggatcccc tgtgggaggg ggcaggggac ctgttcccac cgtgtgccca 2160
agacctcttt tcccactttt tccctcttct tgactcaccc tgccctcaat atcccccggc 2220
gcagccagtg aaagggagtc cctggctcct ggctcgcctg cacgtcccag ggcggggagg 2280
gacttccgcc ctcacgtccc gctcttcgcc ccaggctgga tggaatgaaa ggcacactgt 2340
ctctctccct aggcagcaca gcccacaggt ttccaggagt gcctttgtgg gaggcctctg 2400
ggcccccacc agccatcctg tcctccgcct ggggccccag cccggagaga gccgctggtg 2460
cacacagggc cgggattgtc tgccctaatt atcaggtcca ggctacaggg ctgcaggaca 2520
tcgtgacctt ccgtgcagaa acctccccct ccccctcaag ccgcctcccg agcctccttc 2580
ctctccaggc ccccagtgcc cagtgcccag tgcccagccc aggcctcggt cccagagatg 2640
ccaggagcca tcg 2653
<210> 11
<211> 1966
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 3
<400> 11
cgaagcttga gattgtccaa gcaggtagcc agagagcgcc atcagccaag aaaccatcca 60
ctggtacgta aggcagcctg tgcgggcgag accagactgg gccctcccct cctgcagtga 120
tttgtttctt cttctttttt aaatcacgtt ttcctgcctt ttctaggttc taggtaccag 180
cctctggctt ctacagcctc agacaatgac tttgtcacac cagagccccg ccgtactacc 240
cgtcggcatc caaacaccca gcagcgagct tccaaaaaga aacccaaagt tgtcttctca 300
agtgatgagt ccagtgagga aggtatgatg ctcccgcctg ttcccggccg agaaggcaca 360
cagctagggt gcagagggct ggtttccata ggacctgctg cgggggcctg agtgtagatg 420
ctctgcccca ctgccgcaga agggcctctc ctgtacagct tggattttat ttcttctgtg 480
cggtgtggga ttgtctcact tgttctctga tatctatttt ttcaccatct ttgtgactca 540
gctttttctt attcctttaa ttctttgcat agatctttca gcagagatga cagaagacga 600
gacacccaag aaaacaactc ccattctcag agcatcggct cgcaggcaca gatcctagga 660
agtctgttcc tgtcctccct gtgcagggta tcctgtaggg tgacctggaa ttcgaattct 720
gtttcccttg taaaatattt gtctgtctct tttttttaaa aaaaaaaaag gccgggcact 780
gtggctcacg cctgtaatcc cagcactttg cgataccaag gcgggtggat aacctgaggt 840
agggagttcg agaccagcct gaccaacatg gagaaacccc atctctacta aaaataaaaa 900
attagccggg cgtattggcg tgcgcctgta atcccagcta ctcaagaggc tgaggcagga 960
gaatcgcctg aacccagagg cggaggttgt agtgagccga aatcacacca ttgcactcca 1020
gcttgggcaa caatagcgaa cctccatctc aaattaaaaa aaaaatgcct acacgctctt 1080
taaaatgcaa ggctttctct taaattagcc taactgaact gcgttgagct gcttcaactt 1140
tggaatatat gtttgccaat ctccttgttt tctaatgaat aaatgttttt atatactttt 1200
agacattttt tcctaagctt gtctttgttt catctttcac attagcccag tttcatgcag 1260
cagagagagg gttatcagtg cagagagaga tgagtgagcc cagagtccta gggcctgtcc 1320
cgggatggca gatgagcttc ctgccccgtc actgccacct ttcccctctc aacctctgga 1380
ccctgcacag tgaccagaca gcctctctgg ggagaattat gcagtgccta ggctccagat 1440
cagtgcttct gaaccggggg caattttgtc tgccagagga catctgacaa cacctggggc 1500
ctgttttgtt gtcatagcct ataggggaag aatgctacca gcatttgtgg gaagaggcca 1560
gggatgtggc tcaacatcct gcagtgcaca ggatggcccc tcaacaaaga atcacacggc 1620
ccacaatgtc aatagcgtca cagttgagaa aacctgctct agaccaaggg ttgctttctg 1680
ccgtgtgcct caccccaccc ccactcgtgt tccctaatcc catctccaaa ggttggcagc 1740
agaccggccc aggctcgtgg aagttcagat catgatcccc tccagctctg caggagacaa 1800
gacctgtctc ccagcattcc tcattgttcc cgggtctgca gagggcgtga gctatgctgc 1860
aggcgggctg ccccctgaag cctgcgcacc cctctccagc tcctcaagtc ttctctgctg 1920
agtcaccttc gaaccggagg ctgtgagctg gctgtcgtga ccacac 1966
<210> 12
<211> 1198
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 4
<400> 12
tggtgcctct gctgtcatga caacagcaca ctacgtcagt agtgctccct gggcactgag 60
ctccctcttt gcggggagaa gacagtaatg aaaaatgaca agcatgaggc agaggggaag 120
atcacgcttg ggtggtgcag gagcatggag gtgctcttaa tgctctcaat gagaaagggt 180
taacggtcct ggttgcagga atagctgagt cagaggtggg gcttcctcca ctcccccacc 240
ccaccccttt caccattagg gaccttcttg ccttgctctt gctactctgc tctgggtggt 300
cattgtgaaa agcccgcacc aaccatgcca gtggcagcca gacgaggaca cagcctggct 360
ctgggtccca gcaggaaagg caatcccaga aaggcagggt cagggactgg agtcctgtgg 420
gtgcttttta agcaaagatt atcaccaggc aggctaaact tagcaaccgg cttttagcta 480
gaagggcagg gggctggtgt caggttatgc tgggccagca aagaggcccg ggatccccct 540
cccatgcacc tgctgatggg ccaaggccac cccaccccac ccccttcctt acaagtgttc 600
agcaccctcc catcccacac tcacaaacct ggccctctgc cctcctacca gaagaatgga 660
tcccctgtgg gagggggcag gggacctgtt cccaccgtgt gcccaagacc tcttttccca 720
ctttttccct cttcttgact caccctgccc tcaatatccc ccggcgcagc cagtgaaagg 780
gagtccctgg ctcctggctc gcctgcacgt cccagggcgg ggagggactt ccgccctcac 840
gtcccgctct tcgccccagg ctggatggaa tgaaaggcac actgtctctc tccctaggca 900
gcacagccca caggtttcca ggagtgcctt tgtgggaggc ctctgggccc ccaccagcca 960
tcctgtcctc cgcctggggc cccagcccgg agagagccgc tggtgcacac agggccggga 1020
ttgtctgccc taattatcag gtccaggcta cagggctgca ggacatcgtg accttccgtg 1080
cagaaacctc cccctccccc tcaagccgcc tcccgagcct ccttcctctc caggccccca 1140
gtgcccagtg cccagtgccc agcccaggcc tcggtcccag agatgccagg agccatcg 1198
<210> 13
<211> 259
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 8
<400> 13
cctctgggcc cccaccagcc atcctgtcct ccgcctgggg ccccagcccg gagagagccg 60
ctggtgcaca cagggccggg attgtctgcc ctaattatca ggtccaggct acagggctgc 120
aggacatcgt gaccttccgt gcagaaacct ccccctcccc ctcaagccgc ctcccgagcc 180
tccttcctct ccaggccccc agtgcccagt gcccagtgcc cagcccaggc ctcggtccca 240
gagatgccag gagccatcg 259
<210> 14
<211> 1947
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 9
<400> 14
cgaagcttga gattgtccaa gcaggtagcc agagagcgcc atcagccaag aaaccatcca 60
ctggtacgta aggcagcctg tgcgggcgag accagactgg gccctcccct cctgcagtga 120
tttgtttctt cttctttttt aaatcacgtt ttcctgcctt ttctaggttc taggtaccag 180
cctctggctt ctacagcctc agacaatgac tttgtcacac cagagccccg ccgtactacc 240
cgtcggcatc caaacaccca gcagcgagct tccaaaaaga aacccaaagt tgtcttctca 300
agtgatgagt ccagtgagga aggtatgatg ctcccgcctg ttcccggccg agaaggcaca 360
cagctagggt gcagagggct ggtttccata ggacctgctg cgggggcctg agtgtagatg 420
ctctgcccca ctgccgcaga agggcctctc ctgtacagct tggattttat ttcttctgtg 480
cggtgtggga ttgtctcact tgttctctga tatctatttt ttcaccatct ttgtgactca 540
gctttttctt attcctttaa ttctttgcat agatctttca gcagagatga cagaagacga 600
gacacccaag aaaacaactc ccattctcag agcatcggct cgcaggcaca gatcctagga 660
agtctgttcc tgtcctccct gtgcagggta tcctgtaggg tgacctggaa ttcgaaccgg 720
aggctgtgag ctggctgtcg tgaccacact ggtgcctctg ctgtcatgac aacagcacac 780
tacgtcagta gtgctccctg ggcactgagc tccctctttg cggggagaag acagtaatga 840
aaaatgacaa gcatgaggca gaggggaaga tcacgcttgg gtggtgcagg agcatggagg 900
tgctcttaat gctctcaatg agaaagggtt aacggtcctg gttgcaggaa tagctgagtc 960
agaggtgggg cttcctccac tcccccaccc cacccctttc accattaggg accttcttgc 1020
cttgctcttg ctactctgct ctgggtggtc attgtgaaaa gcccgcacca accatgccag 1080
tggcagccag acgaggacac agcctggctc tgggtcccag caggaaaggc aatcccagaa 1140
aggcagggtc agggactgga gtcctgtggg tgctttttaa gcaaagatta tcaccaggca 1200
ggctaaactt agcaaccggc ttttagctag aagggcaggg ggctggtgtc aggttatgct 1260
gggccagcaa agaggcccgg gatccccctc ccatgcacct gctgatgggc caaggccacc 1320
ccaccccacc cccttcctta caagtgttca gcaccctccc atcccacact cacaaacctg 1380
gccctctgcc ctcctaccag aagaatggat cccctgtggg agggggcagg ggacctgttc 1440
ccaccgtgtg cccaagacct cttttcccac tttttccctc ttcttgactc accctgccct 1500
caatatcccc cggcgcagcc agtgaaaggg agtccctggc tcctggctcg cctgcacgtc 1560
ccagggcggg gagggacttc cgccctcacg tcccgctctt cgccccaggc tggatggaat 1620
gaaaggcaca ctgtctctct ccctaggcag cacagcccac aggtttccag gagtgccttt 1680
gtgggaggcc tctgggcccc caccagccat cctgtcctcc gcctggggcc ccagcccgga 1740
gagagccgct ggtgcacaca gggccgggat tgtctgccct aattatcagg tccaggctac 1800
agggctgcag gacatcgtga ccttccgtgc agaaacctcc ccctccccct caagccgcct 1860
cccgagcctc cttcctctcc aggcccccag tgcccagtgc ccagtgccca gcccaggcct 1920
cggtcccaga gatgccagga gccatcg 1947
<210> 15
<211> 1436
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 11
<400> 15
atctattttt tcaccatctt tgtgactcag ctttttctta ttcctttaat tctttgcata 60
gatctttcag cagagatgac agaagacgag acacccaaga aaacaactcc cattctcaga 120
gcatcggctc gcaggcacag atcctaggaa gtctgttcct gtcctccctg tgcagggtat 180
cctgtagggt gacctggaat tcgaaccgga ggctgtgagc tggctgtcgt gaccacactg 240
gtgcctctgc tgtcatgaca acagcacact acgtcagtag tgctccctgg gcactgagct 300
ccctctttgc ggggagaaga cagtaatgaa aaatgacaag catgaggcag aggggaagat 360
cacgcttggg tggtgcagga gcatggaggt gctcttaatg ctctcaatga gaaagggtta 420
acggtcctgg ttgcaggaat agctgagtca gaggtggggc ttcctccact cccccacccc 480
acccctttca ccattaggga ccttcttgcc ttgctcttgc tactctgctc tgggtggtca 540
ttgtgaaaag cccgcaccaa ccatgccagt ggcagccaga cgaggacaca gcctggctct 600
gggtcccagc aggaaaggca atcccagaaa ggcagggtca gggactggag tcctgtgggt 660
gctttttaag caaagattat caccaggcag gctaaactta gcaaccggct tttagctaga 720
agggcagggg gctggtgtca ggttatgctg ggccagcaaa gaggcccggg atccccctcc 780
catgcacctg ctgatgggcc aaggccaccc caccccaccc ccttccttac aagtgttcag 840
caccctccca tcccacactc acaaacctgg ccctctgccc tcctaccaga agaatggatc 900
ccctgtggga gggggcaggg gacctgttcc caccgtgtgc ccaagacctc ttttcccact 960
ttttccctct tcttgactca ccctgccctc aatatccccc ggcgcagcca gtgaaaggga 1020
gtccctggct cctggctcgc ctgcacgtcc cagggcgggg agggacttcc gccctcacgt 1080
cccgctcttc gccccaggct ggatggaatg aaaggcacac tgtctctctc cctaggcagc 1140
acagcccaca ggtttccagg agtgcctttg tgggaggcct ctgggccccc accagccatc 1200
ctgtcctccg cctggggccc cagcccggag agagccgctg gtgcacacag ggccgggatt 1260
gtctgcccta attatcaggt ccaggctaca gggctgcagg acatcgtgac cttccgtgca 1320
gaaacctccc cctccccctc aagccgcctc ccgagcctcc ttcctctcca ggcccccagt 1380
gcccagtgcc cagtgcccag cccaggcctc ggtcccagag atgccaggag ccatcg 1436
<210> 16
<211> 1177
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 17
<400> 16
atctattttt tcaccatctt tgtgactcag ctttttctta ttcctttaat tctttgcata 60
gatctttcag cagagatgac agaagacgag acacccaaga aaacaactcc cattctcaga 120
gcatcggctc gcaggcacag atcctaggaa gtctgttcct gtcctccctg tgcagggtat 180
cctgtagggt gacctggaat tcgaaccgga ggctgtgagc tggctgtcgt gaccacactg 240
gtgcctctgc tgtcatgaca acagcacact acgtcagtag tgctccctgg gcactgagct 300
ccctctttgc ggggagaaga cagtaatgaa aaatgacaag catgaggcag aggggaagat 360
cacgcttggg tggtgcagga gcatggaggt gctcttaatg ctctcaatga gaaagggtta 420
acggtcctgg ttgcaggaat agctgagtca gaggtggggc ttcctccact cccccacccc 480
acccctttca ccattaggga ccttcttgcc ttgctcttgc tactctgctc tgggtggtca 540
ttgtgaaaag cccgcaccaa ccatgccagt ggcagccaga cgaggacaca gcctggctct 600
gggtcccagc aggaaaggca atcccagaaa ggcagggtca gggactggag tcctgtgggt 660
gctttttaag caaagattat caccaggcag gctaaactta gcaaccggct tttagctaga 720
agggcagggg gctggtgtca ggttatgctg ggccagcaaa gaggcccggg atccccctcc 780
catgcacctg ctgatgggcc aaggccaccc caccccaccc ccttccttac aagtgttcag 840
caccctccca tcccacactc acaaacctgg ccctctgccc tcctaccaga agaatggatc 900
ccctgtggga gggggcaggg gacctgttcc caccgtgtgc ccaagacctc ttttcccact 960
ttttccctct tcttgactca ccctgccctc aatatccccc ggcgcagcca gtgaaaggga 1020
gtccctggct cctggctcgc ctgcacgtcc cagggcgggg agggacttcc gccctcacgt 1080
cccgctcttc gccccaggct ggatggaatg aaaggcacac tgtctctctc cctaggcagc 1140
acagcccaca ggtttccagg agtgcctttg tgggagg 1177
<210> 17
<211> 18106
<212> DNA
<213> Homo sapiens
<400> 17
gtgagcagca caggacactt caatgcctgt tgggttctgg gctggctaag acatctgccg 60
gccctgggca gcatacggct cttgcagtca ccttcccgtc ctccttatcc ccagctgggt 120
tgcaaccaaa ttgccagagt gacctaagac cagatctttg tctccagttc tttttttatt 180
actccaaaaa cacaaccaaa gcagcatctc atccaattct tgtttgtttg tttttaatag 240
tttttatttt tcagagcagt tttaggttca aagcaaaatt gagcagaaag tacagggagt 300
tcccttctac cccttgcccc tacacatcac agccttcccc accttcaaca tcctgcacca 360
gggtggcaca tttgttacag ctgaacctac acttacacat catctcctaa agtcatggtt 420
taccttggag ttcactgcac gtaatgacat gtacccacca ttgcagtatc atacagaaga 480
gtttcactgc cttacaaatc ccctgcactc cacctattta tccctctctc cccacaaccc 540
ctgatctttt tactgttgcc atcactttgt cttttccaga atgtatcatt ggaatgatcc 600
ggtatggagc cttctcacct tggcttctta gtaatgtgcg tttaaggcct ccatgtcttc 660
catggccttg tttcttttta atcagaagta actgttttca ggcctgctct gaatctcctt 720
ttctccctcc aggctataat agatgaattt gagcagaagc ttcgggcctg tcataccaga 780
ggtttggatg gaatcaagga gcttgagatt ggccaagcag gtagccagag agcgccatca 840
gccaagaaac catccactgg tacgtaaggc agcctgtgcg ggcgagacca gactgggccc 900
tcccctcctg cagtgatttg tttcttcttc ttttttaaat cacgttttcc tgccttttct 960
aggttctagg taccagcctc tggcttctac agcctcagac aatgactttg tcacaccaga 1020
gccccgccgt actacccgtc ggcatccaaa cacccagcag cgagcttcca aaaagaaacc 1080
caaagttgtc ttctcaagtg atgagtccag tgaggaaggt atgatgctcc cgcctgttcc 1140
cggccgagaa ggcacacagc tagggtgcag agggctggtt tccataggac ctgctgcggg 1200
ggcctgagtg tagatgctct gccccactgc cgcagaaggg cctctcctgt acagcttgga 1260
ttttatttct tctgtgcggt gtgggattgt ctcacttgtt ctctgatatc tattttttca 1320
ccatctttgt gactcagctt tttcttattc ctttaattct ttgcatagat ctttcagcag 1380
agatgacaga agacgagaca cccaagaaaa caactcccat tctcagagca tcggctcgca 1440
ggcacagatc ctaggaagtc tgttcctgtc ctccctgtgc agggtatcct gtagggtgac 1500
ctggaattcg aattctgttt cccttgtaaa atatttgtct gtctcttttt tttaaaaaaa 1560
aaaaaggccg ggcactgtgg ctcacgcctg taatcccagc actttgcgat accaaggcgg 1620
gtggataacc tgaggtaggg agttcgagac cagcctgacc aacatggaga aaccccatct 1680
ctactaaaaa taaaaaatta gccgggcgta ttggcgtgcg cctgtaatcc cagctactca 1740
agaggctgag gcaggagaat cgcctgaacc cagaggcgga ggttgtagtg agccgaaatc 1800
acaccattgc actccagctt gggcaacaat agcgaacctc catctcaaat taaaaaaaaa 1860
atgcctacac gctctttaaa atgcaaggct ttctcttaaa ttagcctaac tgaactgcgt 1920
tgagctgctt caactttgga atatatgttt gccaatctcc ttgttttcta atgaataaat 1980
gtttttatat acttttagac attttttcct aagcttgtct ttgtttcatc tttcacatta 2040
gcccagtttc atgcagcaga gagagggtta tcagtgcaga gagagatgag tgagcccaga 2100
gtcctagggc ctgtcccggg atggcagatg agcttcctgc cccgtcactg ccacctttcc 2160
cctctcaacc tctggaccct gcacagtgac cagacagcct ctctggggag aattatgcag 2220
tgcctaggct ccagatcagt gcttctgaac cgggggcaat tttgtctgcc agaggacatc 2280
tgacaacacc tggggcctgt tttgttgtca tagcctatag gggaagaatg ctaccagcat 2340
ttgtgggaag aggccaggga tgtggctcaa catcctgcag tgcacaggat ggcccctcaa 2400
caaagaatca cacggcccac aatgtcaata gcgtcacagt tgagaaaacc tgctctagac 2460
caagggttgc tttctgccgt gtgcctcacc ccacccccac tcgtgttccc taatcccatc 2520
tccaaaggtt ggcagcagac cggcccaggc tcgtggaagt tcagatcatg atcccctcca 2580
gctctgcagg agacaagacc tgtctcccag cattcctcat tgttcccggg tctgcagagg 2640
gcgtgagcta tgctgcaggc gggctgcccc ctgaagcctg cgcacccctc tccagctcct 2700
caagtcttct ctgctgagtc accttcgaac cggaggctgt gagctggctg tcgtgaccac 2760
actggtgcct ctgctgtcat gacaacagca cactacgtca gtagtgctcc ctgggcactg 2820
agctccctct ttgcggggag aagacagtaa tgaaaaatga caagcatgag gcagagggga 2880
agatcacgct tgggtggtgc aggagcatgg aggtgctctt aatgctctca atgagaaagg 2940
gttaacggtc ctggttgcag gaatagctga gtcagaggtg gggcttcctc cactccccca 3000
ccccacccct ttcaccatta gggaccttct tgccttgctc ttgctactct gctctgggtg 3060
gtcattgtga aaagcccgca ccaaccatgc cagtggcagc cagacgagga cacagcctgg 3120
ctctgggtcc cagcaggaaa ggcaatccca gaaaggcagg gtcagggact ggagtcctgt 3180
gggtgctttt taagcaaaga ttatcaccag gcaggctaaa cttagcaacc ggcttttagc 3240
tagaagggca gggggctggt gtcaggttat gctgggccag caaagaggcc cgggatcccc 3300
ctcccatgca cctgctgatg ggccaaggcc accccacccc acccccttcc ttacaagtgt 3360
tcagcaccct cccatcccac actcacaaac ctggccctct gccctcctac cagaagaatg 3420
gatcccctgt gggagggggc aggggacctg ttcccaccgt gtgcccaaga cctcttttcc 3480
cactttttcc ctcttcttga ctcaccctgc cctcaatatc ccccggcgca gccagtgaaa 3540
gggagtccct ggctcctggc tcgcctgcac gtcccagggc ggggagggac ttccgccctc 3600
acgtcccgct cttcgcccca ggctggatgg aatgaaaggc acactgtctc tctccctagg 3660
cagcacagcc cacaggtttc caggagtgcc tttgtgggag gcctctgggc ccccaccagc 3720
catcctgtcc tccgcctggg gccccagccc ggagagagcc gctggtgcac acagggccgg 3780
gattgtctgc cctaattatc aggtccaggc tacagggctg caggacatcg tgaccttccg 3840
tgcagaaacc tccccctccc cctcaagccg cctcccgagc ctccttcctc tccaggcccc 3900
cagtgcccag tgcccagtgc ccagcccagg cctcggtccc agagatgcca ggagccagga 3960
gatggggagg gggaagtggg ggctgggaag gaaccacggg cccccgcccg aggcccatgg 4020
gcccctccta ggcctttgcc tgagcagtcc ggtgtcacta ccgcagagcc tcgaggagaa 4080
gttccccaac tttcccgcct ctcagccttt gaaagaaaga aaggggaggg ggcaggccgc 4140
gtgcagccgc gagcggtgct gggctccggc tccaattccc catctcagtc gttcccaaag 4200
tcctcctgtt tcatccaagc gtgtaagggt ccccgtcctt gactccctag tgtcctgctg 4260
cccacagtcc agtcctggga accagcaccg atcacctccc atcgggccaa tctcagtccc 4320
ttccccccta cgtcggggcc cacacgctcg gtgcgtgccc agttgaacca ggcggctgcg 4380
gaaaaaaaaa agcggggaga aagtagggcc cggctactag cggttttacg ggcgcacgta 4440
gctcaggcct caagaccttg ggctgggact ggctgagcct ggcgggaggc ggggtccgag 4500
tcaccgcctg ccgccgcgcc cccggtttct ataaattgag cccgcagcct cccgcttcgc 4560
tctctgctcc tcctgttcga cagtcagccg catcttcttt tgcgtcgcca ggtgaagacg 4620
ggcggagaga aacccgggag gctagggacg gcctgaaggc ggcaggggcg ggcgcaggcc 4680
ggatgtgttc gcgccgctgc ggggtgggcc cgggcggcct ccgcattgca ggggcgggcg 4740
gaggacgtga tgcggcgcgg gctgggcatg gaggcctggt gggggagggg aggggaggcg 4800
tgtgtgtcgg ccggggccac taggcgctca ctgttctctc cctccgcgca gccgagccac 4860
atcgctcaga caccatgggg aaggtgaagg tcggagtcaa cgggtgagtt cgcgggtggc 4920
tggggggccc tgggctgcga ccgcccccga accgcgtcta cgagccttgc gggctccggg 4980
tctttgcagt cgtatggggg cagggtagct gttccccgca aggagagctc aaggtcagcg 5040
ctcggacctg gcggagcccc gcacccaggc tgtggcgccc tgtgcagctc cgcccttgcg 5100
gcgccatctg cccggagcct ccttccccta gtccccagaa acaggaggtc cctactcccg 5160
cccgagatcc cgacccggac ccctaggtgg gggacgcttt ctttcctttc gcgctctgcg 5220
gggtcacgtg tcgcagagga gcccctcccc cacggcctcc ggcaccgcag gccccgggat 5280
gctagtgcgc agcgggtgca tccctgtccg gatgctgcgc ctgcggtaga gcggccgcca 5340
tgttgcaacc gggaaggaaa tgaatgggca gccgttagga aagcctgccg gtgactaacc 5400
ctgcgctcct gcctcgatgg gtggagtcgc gtgtggcggg gaagtcaggt ggagcgaggc 5460
tagctggccc gatttctcct ccgggtgatg cttttcctag attattctct ggtaaatcaa 5520
agaagtgggt ttatggaggt cctcttgtgt cccctccccg cagaggtgtg gtggctgtgg 5580
catggtgcca agccgggaga agctgagtca tgggtagttg gaaaaggaca tttccaccgc 5640
aaaatggccc ctctggtggt ggccccttcc tgcagcgccg gctcacctca cggccccgcc 5700
cttcccctgc cagcctagcg ttgacccgac cccaaaggcc aggctgtaaa tgtcaccggg 5760
aggattgggt gtctgggcgc ctcggggaac ctgcccttct ccccattccg tcttccggaa 5820
accagatctc ccaccgcacc ctggtctgag gttaaatata gctgctgacc tttctgtagc 5880
tgggggcctg ggctggggct ctctcccatc ccttctcccc acacacatgc acttacctgt 5940
gctcccactc ctgatttctg gaaaagagct aggaaggaca ggcaacttgg caaatcaaag 6000
ccctgggact agggggttaa aatacagctt cccctcttcc cacccgcccc agtctctgtc 6060
ccttttgtag gagggactta gagaaggggt gggcttgccc tgtccagtta atttctgacc 6120
tttactcctg ccctttgagt ttgatgatgc tgagtgtaca agcgttttct ccctaaaggg 6180
tgcagctgag ctaggcagca gcaagcattc ctggggtggc atagtggggt ggtgaatacc 6240
atgtacaaag cttgtgccca gactgtgggt ggcagtgccc cacatggccg cttctcctgg 6300
aagggcttcg tatgactggg ggtgttgggc agccctggag ccttcagttg cagccatgcc 6360
ttaagccagg ccagcctggc agggaagctc aagggagata aaattcaacc tcttgggccc 6420
tcctgggggt aaggagatgc tgcattcgcc ctcttaatgg ggaggtggcc tagggctgct 6480
cacatattct ggaggagcct cccctcctca tgccttcttg cctcttgtct cttagatttg 6540
gtcgtattgg gcgcctggtc accagggctg cttttaactc tggtaaagtg gatattgttg 6600
ccatcaatga ccccttcatt gacctcaact acatggtgag tgctacatgg tgagccccaa 6660
agctggtgtg ggaggagcca cctggctgat gggcagcccc ttcataccct cacgtattcc 6720
cccaggttta catgttccaa tatgattcca cccatggcaa attccatggc accgtcaagg 6780
ctgagaacgg gaagcttgtc atcaatggaa atcccatcac catcttccag gagtgagtgg 6840
aagacagaat ggaagaaatg tgctttgggg aggcaactag gatggtgtgg ctcccttggg 6900
tatatggtaa ccttgtgtcc ctcaatatgg tcctgtcccc atctcccccc cacccccata 6960
ggcgagatcc ctccaaaatc aagtggggcg atgctggcgc tgagtacgtc gtggagtcca 7020
ctggcgtctt caccaccatg gagaaggctg gggtgagtgc aggagggccc gcgggagggg 7080
aagctgactc agccctgcaa aggcaggacc cgggttcata actgtctgct tctctgctgt 7140
aggctcattt gcagggggga gccaaaaggg tcatcatctc tgccccctct gctgatgccc 7200
ccatgttcgt catgggtgtg aaccatgaga agtatgacaa cagcctcaag atcatcaggt 7260
gaggaaggca gggcccgtgg agaagcggcc agcctggcac cctatggaca cgctcccctg 7320
acttgcgccc cgctccctct ttctttgcag caatgcctcc tgcaccacca actgcttagc 7380
acccctggcc aaggtcatcc atgacaactt tggtatcgtg gaaggactca tggtatgaga 7440
gctggggaat gggactgagg ctcccacctt tctcatccaa gactggctcc tccctgccgg 7500
ggctgcgtgc aaccctgggg ttgggggttc tggggactgg ctttcccata atttcctttc 7560
aaggtgggga gggaggtaga ggggtgatgt ggggagtacg ctgcagggcc tcactccttt 7620
tgcagaccac agtccatgcc atcactgcca cccagaagac tgtggatggc ccctccggga 7680
aactgtggcg tgatggccgc ggggctctcc agaacatcat ccctgcctct actggcgctg 7740
ccaaggctgt gggcaaggtc atccctgagc tgaacgggaa gctcactggc atggccttcc 7800
gtgtccccac tgccaacgtg tcagtggtgg acctgacctg ccgtctagaa aaacctgcca 7860
aatatgatga catcaagaag gtggtgaagc aggcgtcgga gggccccctc aagggcatcc 7920
tgggctacac tgagcaccag gtggtctcct ctgacttcaa cagcgacacc cactcctcca 7980
cctttgacgc tggggctggc attgccctca acgaccactt tgtcaagctc atttcctggt 8040
atgtggctgg ggccagagac tggctcttaa aaagtgcagg gtctggcgcc ctctggtggc 8100
tggctcagaa aaagggccct gacaactctt ttcatcttct aggtatgaca acgaatttgg 8160
ctacagcaac agggtggtgg acctcatggc ccacatggcc tccaaggagt aagacccctg 8220
gaccaccagc cccagcaaga gcacaagagg aagagagaga ccctcactgc tggggagtcc 8280
ctgccacact cagtccccca ccacactgaa tctcccctcc tcacagttgc catgtagacc 8340
ccttgaagag gggaggggcc tagggagccg caccttgtca tgtaccatca ataaagtacc 8400
ctgtgctcaa ccagttactt gtcctgtctt attctagggt ctggggcaga ggggagggaa 8460
gctgggcttg tgtcaaggtg agacattctt gctggggagg gacctggtat gttctcctca 8520
gactgagggt agggcctcca aacagccttg cttgcttcga gaaccatttg cttcccgctc 8580
agacgtcttg agtgctacag gaagctggca ccactacttc agagaacaag gccttttcct 8640
ctcctcgctc cagtcctagg ctatctgctg ttggccaaac atggaagaag ctattctgtg 8700
ggcagcccca gggaggctga caggtggagg aagtcagggc tcgcactggg ctctgacgct 8760
gactggttag tggagctcag cctggagctg agctgcagcg ggcaattcca gcttggcctc 8820
cgcagctgtg aggtcttgag cacgtgctct attgctttct gtgccctcgt gtcttatctg 8880
aggacatcgt ggccagcccc taaggtcttc aagcaggatt catctaggta aaccaagtac 8940
ctaaaaccat gcccaaggcg gtaaggacta tataatgttt aaaaatcggt aaaaatgccc 9000
acctcgcata gttttgagga agatgaactg agatgtgtca gggtgactta tttccatcat 9060
cgtccttagg ggaacttggg taggggcaag gcgtgtagct gggacctagg tccagacccc 9120
tggctctgcc actgaacggc tcagttgctt tgggcagtta ctcccgggcc tcactttgca 9180
cgtgtgctta cctagtggag acaaaagtac atacctcggt agagcgcgca cgcctgtaac 9240
cccagcactt tgggaggcca aggtgggtgt atcacctgag gtcaggagtt tgagaccagc 9300
ctggccaaca tggtgaaact ccgtctctac taaaattaca aaaatcagcc aggcttcatg 9360
gcacatgcct atagtcccag ctacaggcat gctgaagcag gagaatcgct tgcaccccgg 9420
aggcagaggc tgcagtgagc tgagaccaca ccactgcact ccagcctagg caacagagta 9480
tgagactcca tctcaaaaaa aaaaaaagta cctacctcag agttcaaact agtgaatatt 9540
aggaagtgct tgagacagtg acaccaaagt gcacaataaa tactcgccag tttcattatt 9600
attaaagaat ccatttgaat gtcagctcaa cacagcctcc tataccgagg cattgtgaac 9660
cgcatctccc cagcttctcc aggcttttcc aagaatcagg gacactgtag cctgttggtc 9720
tcagtgtatg acagacacgg aggaagcaca tctttagctg atacttaaac agagaccctg 9780
agcgcacata cacccgcgca cacatgcatg gagcttcacc ttctctgtca ttctgcagtg 9840
accaggagag caagagctcc cacctccctt caaaacactg tgcccatccc gggcactaag 9900
gcctctttaa agcacggcac ctccacgagg gagggccaca gccacataca ctccacctgg 9960
caggtggaca gcgtgagcac gtggaccata gcagggacaa ggtgccccgg ccagccccaa 10020
cgccctctgc cgctgacagg gacagaagcc ctctccagct gcgtgtgctg cagaggccat 10080
gcgtagcctc cagctgcatt ctattccact ccagtgcctg ggccagttag caccagtgtg 10140
gaagacagtg agctggctcc ggacaacagg gatggaggaa aggtcccaca ttcacattcc 10200
tgatacgtgg acaaggtgag gggccgcaat cgctctggca gcattttaaa gatggggaag 10260
tagcagacac ccacgcgtga aggcaggaga gccccaactg tggtggaaat ggccccagaa 10320
tggtagggcc aagcctagct ccagacaccc cagagccctg gagaagccaa gactgaggga 10380
gaaagcctga gggaggagcg ccccagtccc cagggaccgg cctggtgcag agctgcagct 10440
gatgttcccc tctgtgcagc cccaccctct gcctcgctga gctccctgct gcgagggcct 10500
cgggtgcaag ggggaggcag gtctctatct catggagctg tcagatgaga catcgcgatc 10560
ggagtcctca gcctcgcttg gcggcggcgg cgggtcgcta agcgggaccg cagtgaaagc 10620
aggagacttt ctagaaaaaa acaccagttg tcaaccttgg ggcaggcagg aatcctgaag 10680
acggacggca ctcctcctcc tgctgcctca ccctctggca gcccgtgaga agtaccggaa 10740
gcgagggcgg ggccgcggga tggcgaggga gcggcaggga ctgaactctc tccaaaccca 10800
ccctgacagg gaaatgggcc ccgcctgtgt cttgggaact cagaggctga ggtcaggcat 10860
gatggctcac gcctgtaatt ccagcacttt gggaggcaga ggcgggtgga tcacgacgtc 10920
aggagttcaa ggcaagcctg gccaacatgg tgaaacccca tctctactaa aaatgcaaaa 10980
attagccagg tgtggtggcg ggcgccttgg aggctgaggc aagataatca cttgaacctg 11040
ggaggcggag gttgtagtga gccaaaaaaa aaaaaaaaag aaatagctga agtcacagta 11100
ggagagaagc tgctgagcct ccagcaccct gactctaggg ccttggcttt atgtctatct 11160
gcagtatttt tgtgattttt aaaaattcac tttcttgttg cggtgtaact tacacagggt 11220
caaatgcaca aatcatggcc ctgactttag ataaaaatct gcccccacaa cccttctgtt 11280
ccttgccagt ttttaaactg cctctaacca ggggaaccac cagagctggt ggccttggga 11340
ggtttcagcc ctcccgtcat gaatggacat agctcatcca actgccaagg gagagagctg 11400
tgggtctggg ccagccccac caggtaactc ccaaagggca gccccacagc aagatgtgac 11460
ccagtcattg cctgagggtc tctggggctg tgttccaacc tttctccccg ctgtgtcccc 11520
ctggaaggcc ccatgcccag gggaggcgcc taccggtctc cagactgggt gatgagccgg 11580
cggcaggtct ccatctgcac gtccaggccg cgcttcatgc tgcacatctc catgtactcg 11640
tgcaggtgcc ggttcatgtc gttcttggcc gtggccaact ccagctgtgg tggggcaggc 11700
agggccatcg gggttaacag gtggcgttca cagcgcctct gttgcccccg ccaggaggcc 11760
aacacgccaa gagcagtggc tgggccgggg gcccaggcag ccattactga aggctcagat 11820
tttaaaataa accagaccaa ggcagaaggc agcgaataca ccattgtttc ctctgctttt 11880
cctggaaatc tttgcctatg gaggaatgca aaggtactgc tgcaggctgt gttcttttaa 11940
gactgataag agtggtgagg aaagtcagtg tgggcgggat ggagcagatc cacaggctcc 12000
cagggccaca caggttccta tggggcccgg ctcacccctc atcccctgta ctgcgctggt 12060
cctgggctgt cccctcactg cactgtgagc tcccgtaagg gttagcgaca ggttttcctc 12120
atcctggcag acccagacct cgaagggaat taactctctc tgtgacccgt ggcatacaag 12180
cctggctaac tgctgaaagg ggcccaatcc tcttaccatt ctctccttat cactttattt 12240
tctcacctaa aagccatttt cagacactaa aaggaagact cccatattgg aggtgccatt 12300
gattctgaga cctgtcctga tttcagaaat gtcacacgtg gaaaacacgg ggctcagaat 12360
caaagaaatc cggtctccct ccccgggccc attctgcagc ccacactctg aggcaggcgg 12420
agaggcaggg cccaggcagc acaaactcag tgccagggac agtcgactgc ctctctttgt 12480
tttgggtaca aagggcaggg gccgcaaggg gaagcaaaat gaaacttcct ggagatgacg 12540
ttcgtgactg cctgagtgaa gagaacgggg aggataccag ctgccataat gtggattgga 12600
cagagagggt gggaacttag agaaagaagg aaacaggtta cagggccaga cagcagagat 12660
ggtcaggaca gtgacatttg gggtgagatg gcggctggct gggtgagaag ccctagtggg 12720
gacagcttcc ctggcaggct tggatccaca gctggggccc cacagtagtg ggaggagcag 12780
gacacggtga ctgttcaacc cagggggaaa atacagtgcc accagccctt gttcagatca 12840
gctgcctaca ccccaatttc tccaccttgg aagaaccgga gtgcagggag ctgggttctg 12900
gaaccatcac tcagggagac tgggaagaag gaaatgaacc aaatatattc tactgaaata 12960
caaggctagt actgccacca gtagtctctg catatgtcta tgtccccact taattcacaa 13020
atttacagca ggaacaaggt caggaggtga acgtgcatgt caggagatgt ccttgacaag 13080
ccaccttgaa aactgcaggc tcgctgtgtg aacagacttg ggggtgggac gggaggagac 13140
agagagaggt gaggagcggt ggggaagaac tgcctcccgc ccaccactct gggccttggc 13200
tttaccttgc tccatcttag tgaccctgag agatcaaagg tcacaaagat aaaggcacct 13260
tgggtactcc tgaggtcagc aagtcctcct aacggttccc ctaatgcaga agtccccaaa 13320
ccccaggcca cggaccagta cctgtctgtg gcctgttagg aaccaggcca aatagcagga 13380
ggtgagcagt gggcaagtga gtgaagcttc atctgtattt acagctgctc cccatcactg 13440
gcattacagc ctgagctcca cctcctgtca gatccgcggc ggcattagat tctcacagga 13500
tcctgaaccc taccttacgt gaactgtgca tgcgagggat ctaggctgtg tgctccttat 13560
gagaatctaa tgcctgatga tctgtcacta tctcccatca cccccagatg ggaccgtcta 13620
gttgcggaaa acaagttcat ggctcccact gattctacat tatggtgaga tgtataatta 13680
tttcattata tattataatg taataataat agaaataaag tgcacaggcc gggtgcggtg 13740
gctcatgcct gtaatcccag cactttggga ggccgaggtg gtggatcacc tgaggtcggg 13800
agttcgagac cagcttgacc aacatggaga aaccccatct ctactaaaaa tacaaaatta 13860
gccaggcgtg gtggcacatg cccgtaatcc cagctacttg ggaggctgag gcaggagaat 13920
tgcttgagcc cgggaggcgg aggctgcagt gagccaagat tgcgccattg cactccagcc 13980
tgggcaacaa gagcaaaact ctgtctctaa aaataataat aataattttt aaaaatagta 14040
ataaagtaca caataaatgt aatgtttgaa tcatctcaaa atcatttccc ccgggtcagt 14100
ggaaaaactg tcttccacaa accagtccct ggtaccaaaa aggttgggga ctgctgccta 14160
aagtcattgc actgggagag aggaggagtc agatgatttg aaaatacttt tttttttttt 14220
tttcctgaga tggaatcttg ctctgtcacc caggctgtgg tgcagtggca caatctcagc 14280
tcactgcagc ctccacctcc cagattccag caattctcct gcctcagcct cccaagtagc 14340
tgggattaca ggtgcccacc acaatgcctg gctacttttt gtatttttag tagagacggg 14400
gtttcacatg ttggtggcca ggctggtctc acactcctga cctcaagtga tctgcccgcg 14460
ttggcctccc aaagtgctgg gattacaggc gagagccacc acgcccagcc aaaaatagct 14520
taaaaggcat gattccattt aagatattat tttcgttctt tcagatcatg ttttacactg 14580
ggcacttgag gtccagggaa gactagggag agatggcagc ccgagatctc ttctcacgaa 14640
gatggccgca caaaggcccc tagttggttg aaggcacagt gaaaacacaa accttaaatc 14700
caccatccaa aagagggaga caagaatcag gtcaggcagg aggaggaaac agtgagccgc 14760
ggtagacggg agggtgggga gtactggttt cccttgccat gtctttagct agcagcacaa 14820
atccaggaaa cctcatctac ctggccaaga aaaccaggtt tgatgcagga gcaggacagt 14880
ttgatgtgtg ttgggagaat gagtatatag gaaaataatt tctcgacttc cttctcaaac 14940
acctccaatg tgacagcaat aagaataaag tcaaggccgg gcgcggtggc tcacgcctgt 15000
aatcccagca ctttggaagg ccgaggcggg tggatcacga ggtcaggaga tcgagaccat 15060
cctggctaac atggtgaaac cccgtctcta ctaaaaaata caaaaaatta gccgggcgta 15120
gtggcaggcg cctgtagtcc cagctactct ggaggctgag gcaggagaat ggcgtgaacc 15180
tgggaggtgg agcttgcagt gagctgagat cgcgccactg cactccagcc tgggcgacac 15240
agcgagacta cgtctcaaaa aaataaataa ataaataaat aaatgaaaag aataaagtca 15300
ctctctcctt atccactggt ttcactttcc acggcttcag gtacccaagg tgaaccttga 15360
tctgaaaata ttaaatgaaa tattccagaa ataaacaatt cctaagtttt aaattgcacg 15420
ctgttctgag tggcctgata aaatctcact ctctctgccg ggcgcggtgg ctcacgccta 15480
taatcccagc actttgggag gccgaggtgg gcggatcatg aggtcaggag atcgagatca 15540
tcctggctaa cacggtgaaa ccccatctct actaaaaaat acaaaagaaa ttagccgggc 15600
gtgatggcgg gcgcctgtag tcccagctac tcaggaggct gaggcaggag aatggcgtga 15660
acccaggagg tggagcttgc agtgagccga gttcaagcca ctgcactcca gcctgggtga 15720
cacagcgaga ctccgtctcg gaaaaaaaaa aaaaaacctc actctatcca gaccaggaca 15780
tgaaccctcc ctctgtccca aggatccaca ctgtctatac tgcctgccca ttagttactt 15840
aggagccatc tcagtgatga gattgactgt cgtggtatgg cagtgcccgt gttcaaggaa 15900
cccttatttt tacttcataa tggccccaaa gcacaagagt agtgatgctg gcaatttgga 15960
tatgtgaaag agaagccaaa atatgctccc tttaagtgaa aaggtaaaag ttttcaactt 16020
aataagaaaa agaatccgat gctgaggttg gtaagctcta cagtaagaat gaatcttcta 16080
tccgtgaaat tgtaaagaag gaaaaagaaa tttgtgccag ttttgctgtc acacctcgaa 16140
ctgcaaaagg taccgccaca gcgcacgcta agtgcttagt taagatagaa aaggcattga 16200
atgtgtgggt gggagacatg aacagaaaca cgttccagtt gacagcaact ggacccaagc 16260
tatcaggagg tcagtgctat ctttggtttc aggcatccac tgtgggtctt ggaacacatg 16320
ccctgaagat aaggggggac tacgtatgaa tctcccatgt gggcctgaag agaggctgag 16380
acgcagagaa ggctccatgc ctctcccaaa gtcagagcgt cgggaaagga ccacctcacc 16440
aggccaggag agctcacggg ggtcccgtcc atccctcctc ccacagcaac agcaacctcc 16500
attctgtggt tccacaaatc cttcttcctt tgtttgtatt tttgagacgg agtcttgctc 16560
tgtcgcccag gctggagtgc agtggtgcga tctcggctca ctgcaagctc cgcctcccgg 16620
gttcacgcca ttctcctgcc tcagcctccc gagtagctgg gactacaggt gcctgccacc 16680
acggccagct aatttttttt ttttgtattt ttcgtagaga cggggtttca ccgtgttagc 16740
caggatggtc tcgatctcct gacctcgtga tcttcccgcc tcggcctccc aaagtgctgg 16800
gattacaggc gtgagccacc gcgcccggcc tccacaaatc cttcttgcag ctcctaaagc 16860
ctagagtttg agctaaagca ccagctccac ttgcctctag gtacctctag aaggtacttc 16920
aaggcttggg aaaaagcatg gagatttctc tgttatctca aaggctgagt ggaagaaaca 16980
ggaaagtccc agtccatctc tgagtgccat ggcactgata gtgttaataa taataaaaca 17040
gtccccacta tgctacactc gctatgagcc agacactgcc ctaagctcta tatatgcatt 17100
atttcatctg atcttctaaa caaccctata ggtgaggtat tattaaattc ctcattttac 17160
aaataaaaag gcccggcaca gtggctcatg cctgtaatcc caacactttg tggggccgag 17220
ttaggaggac tgcttgaatc cagaagtttg agggcagcct ggaaaacata gtgacaccct 17280
gttctctgta aaaaaaatca aaaaattagc cgggcgtggt agcacacgcc tgtggtccca 17340
gctacttggg aggctgaggt aggaggattg cttggatcca gaagatcacg gctgcagtgg 17400
gcctggagtg acagagcaag accctgtctc aaaaaaagaa agaaagaaag aaagaaagaa 17460
aaagaaacag gtgtagggct ggacacatgg ctcatgtctc taattctagt actttgggag 17520
gccgaggcag gaggatcact taagcccaag agtttaagac ctgcctggga aacacaggga 17580
gacaccatct ctacaaaaaa atacaaataa aaattagctg ggtatggtgg cacacacctg 17640
tgggcccagc tactcagaag gctggggtgg gaggatcact ccagcctagg caacagagtg 17700
aaacagagtg agaccttgtc tcaaaaaaga aaggacagaa agacaaggga gagagggagg 17760
gagggataga gggggagggg aagagagaga gagagagaaa ggaaggaagg aaggaaggaa 17820
agaaaggaaa ggaaaggaaa ggaaaggagg ggctcagagg gaacaagtaa cttattacaa 17880
gttcagggtg gttgtaagta acagagctga gatttgaacc gatatctgtc tgtttccaga 17940
gcctgaggtc ttcagagccc accaggagga ctatagctga gagatcactc ctcctcccaa 18000
gaccttggtc tctagggtcc tgcagcaggg atgaggccac tgcgcctgca gccccactca 18060
aaaccctctg ggacaccacg cccctggctt ccgctcctgc ccttac 18106
<210> 18
<211> 16312
<212> DNA
<213> Mus sp.
<400> 18
gtgagtggtc ctgttaggtt ccggtgcagt aaacttcatc tgcctcccta agtgctctga 60
gactcctgtc tgaactttct gccttgctag cctcactaca gctatggaac cagagtgact 120
aagaccagat cttaattcct ggtccctttt ttaaaggcca ttcatttcct tttttgttaa 180
catgcattgg tattttgcct gtgtatatgt ttgcatgaag gtgccaagtc cccttggaat 240
tggagttaga ctgttgtggg ccctgagaac tgaacacagg tcttttgtaa gagcagccag 300
tgctcctaac cactatgcca ccttcccagc cccagtgaag gccttgagat agggtcttgc 360
tatgtagacc cagctgcctc agactaacag agattcccct gcctctgtct cctggtagta 420
gaggtatgcc gcacatgttt gcactggact gcttctttag agtagtttca tgtttaaagc 480
aaaagtcagt aagtagagct cccatatgct ctgtcccaca cccgcatggc ctccacccca 540
tgaccttctt gtcctggtat acgtggtcct ggatgaagga acgtgattga cagatcagca 600
tccaaagtcc actcactgga cacagtggca catacttacc acttgtgtca tactgggcat 660
tttcaggact ttgaggtcac cttacccccc acccctgtgg tggcatcagt tagttggaat 720
cacagtttca gattggtttc tttagttttc tctcttttca tggctatttc tttttaagca 780
gggagataat gtttccagcc ctgtctttaa ctttctgtcc tccaggctat aatagatgaa 840
tttgagcaga agcttcgtgc ctgtcacacc agaggcatgg atggaataga ggagtttgaa 900
actggccagg gaggcagcca gcgagccctg tctgccaaga aaccctccgc tggtatgaga 960
gggatgcaag cccacatggg gctcctatga gtggtcccca cccttttttt gttcctttgt 1020
ggtttgtttt tggttttgaa atggtcccct tgcctttctt ttctagtctc aaggctacag 1080
cctctgactt ctgtagactc agacaatgac tttgtcacac ctaagccgcg acgtaccaaa 1140
cctggtcgtc cacaaactca gcagcgcaag aagtcccaga ggaaagccaa agttgtcttc 1200
ttgagtgacg agtccagtga ggacggtatg atacaccctc ccaacagatc agctgcctgt 1260
gtggggtctt ccagtggggc ttgcctagct gtggattcat tcttcctggc catgtcttcc 1320
tcactatgca gctcggctga ctttcacagt gtgccgtgtg cgtgtgtgtt tgtgtgtgtg 1380
tttgtgtgtg tgtgtgcaca cgtgtgcgcg tgcgcacgcg cgcatgtgtt tactttgaga 1440
tccattttgc cccatcttta tgactcagct tttgttccta taattctttg aatagaactt 1500
tcagcagaga tgacagaaga agagacaccc aagagaacca cccccatccg cagagcatct 1560
gggcgaagac acaggtccta ggagctgcct ttgcctactc ccgtccctgc cgtgcagggt 1620
atcttactgg atgatcttgg attcagtgcc ccccccccct tgtagaagtg cttgttgtct 1680
gtggttttaa catggaaatg gcctttgcat tgaggtcttt ctcttagagc cctgctgcca 1740
ctttcccttt ctccgagcct gtgccaattg ctgttttcta atgaataaat gtttttatag 1800
acttttaagc atcctgtcct ggctggtctg tcccatcctt agccctgagc tgtgtctgga 1860
tcttcatggc ccctgtggtg cctcatcctt gcacaactga aactctgctg tgcagaatta 1920
tgcggtttct aggttcacgt gaacagttct cagcagtctg gggtactttg caccccagaa 1980
aacattcggt aatacctaga gacttatttc tgtttgcctt gtggggcagg gggctgcagt 2040
gaaagcctta agatgaaggc caccttcatg cacattgtgc cccataacac agcatgtcag 2100
gagtacacaa cttgagaaat gctgctctag acctaaggtt tgtttcctct gtgcgcccca 2160
ccccatcccc cgaagactgg caaatgactc agcctggcta atggcagaga ttatgaaccc 2220
cactcagttc tataggtgac aaggtccatc gccccagagc cagtccttca ctacactaag 2280
gggtctgcag gaggtccagc tgtaagccat gctgtgtgcc caccatcccc aagcccttaa 2340
tctgctgagt cacttggagc aggaggcaca actgctgttt ctgctgccat gacaacagca 2400
cagtgctgct gaagtgctcc ctacctcttg gtgaggggac agtaatgata gatgacaggc 2460
gtgaggcaaa agggaaggtg cacctctgaa acactaggtt agggctgggc tatggaaggg 2520
ctctttgggt aggaaaaggg ttaacgctgt gcatagagcc tcggtaggaa ggcagaaaag 2580
ggactctgaa tctgccatgc ctctcctccc caccactgcg ctggggccac tcccaccctt 2640
cccaccctgt tcatctggcc tgctccccgc tcatgggaag cctgggcacg ggccacacag 2700
ctgtcagtct aacacagcct tggctctggg gccccaagga ggtagggcaa tctggaaggg 2760
caaggagcca agactagatt tggggtgcag cccagcgtgc tccctgcctt ttaagcaaag 2820
gttatcacca ggccagctaa acttagcaat aggctcttga gctagatgag cagggggctg 2880
gtttcatgtt gcactggcct agcaaagagg cgccagagtc cccctgccct gcacctgcta 2940
cagtgctccc aagcccttcc acccttccca gcctccctac ccttcggagt gaagaatccc 3000
ggtctcgaaa agacaaaata aaaccaaaga atgccttttc tcccttccac ttgtggcaag 3060
aggctagggg cttccctgtc ctggctcagg ggtataatat ttcctctcct gtgttctccc 3120
ctcactgatc tcaccctgtg tccacgaggg cagccaaaaa aggagagtcc ctggctccag 3180
ggccagtcag cacgtccctg gatggggagg gacttccgcc ctcacgtccc aactctccac 3240
cctggggcta cagtgggtga aaggggcagt gtctcctagc ctgggcgggg cagctctcag 3300
gttccgagga gggatactat aggaggcctc tgagcctcct ccaattcaac ccttaagagg 3360
gatgctgccc ttaccccggg gtcccagctt aggttcatca ggtaaactca ggagagtgtt 3420
tgtaagtctc aattatcagg tttccaggct gcagggcatc ctgacctatg gcgtagcaat 3480
ctccttttca agcgtcttcc tggccacccc cttgccctca cagcgcggta cacaagccag 3540
gcctctggcc aaagacagaa gccaggaggg gggggggggc agatagggaa atggggctcc 3600
tgagggctcc cgcgggagga aaagtgcccc caccctggca ttttcttcca ctcttttttt 3660
tttcgggggg gggggttgct gtgtcactac cgaagaacaa cgaggagaag atcctcaact 3720
tttccgcagc cttttcaata atggggagag gttcgatgat gcagtggcag ggagacccac 3780
acttctccat ttcccctgtt ctcccatttt actcgggaag cagcattcag gtctctgggt 3840
cctggatgtc cttggtgcac actccaagga ctcctcgtcc ttaagttcat agtctgtatt 3900
ccctgagtcc tatcctggga accatcaccc ggtcacctcc tgagcggggc aatctcagct 3960
cccctccccc tatcagttcg gagcccacac gcttggtgcg tgcacatttc aaaaatgagg 4020
cgggtccaaa gagagggagg aggggaaatg agagaggccc agctactcgc ggctttacgg 4080
gtgcacgtag ctcaggcctc tgcgcccttg agctaggact ggataagcag ggcgggaggc 4140
ggggcgcgcg tcatcagctc ccccccacca tccgggttcc tataaatacg gactgcagcc 4200
ctccctggtg ctctctgctc ctccctgttc cagagacggc cgcatcttct tgtgcagtgc 4260
caggtgaaaa tcgcggagtg ggccgcagga ggccggggac agtcggaaac tgggaagggg 4320
agtgggcact gtacgggtct agggatgctg gtgcgaagtg tgcaagccgg acccaggctc 4380
cgcattgcag gggggggatg atggaggacg tgatggggcg cacggcggga atggaggcgg 4440
ggtgggggag gggactgcct ggtgtccttc gggccacgct aatctcattt tcttctcctg 4500
cagcctcgtc ccgtagacaa aatggtgaag gtcggtgtga acgggtgagt tccagggcgg 4560
ggccctgctc cgttgcctac gcaggtcttg ctgacccggg ggctctgcag tactgtgggg 4620
aggtggatga ggtggccgaa gcgcccaagg agacctcaag gtcagcgctc ggacctggcg 4680
atggctcgca cttgcggccc ccagctgctg cacctctggt aactccgcct ttgcggggat 4740
gagcggcccg gagtcttaag tattaggaac aaccccacgc gcccgttcag acccatcccg 4800
taatccccag tccggggctt ctttctttac tttcgcgccc tgaggagtca cgtgccagga 4860
gggaagcccc tcccccatct cccccttcct cggggtcggt ggcatggcgt tgtgaggtgc 4920
atacctttgc gcatcatctc ccaggcttgg gcttccttta gggtaactgg ccgccgccat 4980
gttgcaaacg ggaaggaaat gaatgaaccg ccgttatgaa atcttgctta ggccttcctt 5040
cttcctagct tgtgactaac ctcattcctc tcggctgggt ggagtgtcct ttatcctgta 5100
ggccaggtga tgcaaggctt ccgtgctctc gagagagttc tacctcacaa tctgtctcac 5160
cttattagcc ttaaaagccc ttgagcctta ttgtcctcgg gcataatgcg tattctagat 5220
tattctctga aaatcaaagc ggacttacag aggtccgctt gacctcccaa ccccagaggt 5280
agttatggcg tagtgcagag ccgtgggatg gggagctgag tcatggtggt tctgaaaaga 5340
aattttccac cacaaaatgg ctcctgtagt agcagcccct tccatcccct gcacttccca 5400
tcacagcctc gcactgaccc aggccctata ggccaggatg taaaggtcat taagaggatt 5460
gggtgtccct gcgcctcaga atcctgccct tctccccgtt ccatcctcca gaaaccagat 5520
ctctccactc cgccctgatc tgaggttaaa tttagccgtg tgacctttct ggatctgggg 5580
tctgagcggg ctctccaccc tgctccccct acacacatct gttgctccgg ctctcatttt 5640
tgcccgagaa gaacaggtgt ttcgcgaacg agccctggga ttagggttgg aaacccccca 5700
catgttttct cagtctttcc ccttagttcg agggacttgg aggacacagg tgggcccgcc 5760
ctgtgctgct cacgctgacc tttagccttg ccctttgagc ttgctgatga atgagttcac 5820
aggtctgccc tgtccagggg gtgtagcctg aagtccagcc atgctggaac aaacttccca 5880
gggcatgagt gatgggggtg atgtgccaag cttgtaccca gactggggca aactgccact 5940
tcttaagaga cttagaatga cttggaggag gtttgctggg caagcaatca cctcttggac 6000
aggaaagaaa cctccacttt ataaccgtgc tataaaagcc ctgccaggcc tcggctgctc 6060
aaagaatata aaattagatc tctttggact ttctagggtg ggaacagtct atatttgggt 6120
tgtacatcca agcattcaac tagctttatt aaagggaatt ctgaacaaaa catgaacttc 6180
ctgatgcata catttctaat gtactgtgtc tgcataaagg cttgtacctt tgttgtggta 6240
cgtgcatagc tgatggctgc aggttctcca cacctatggt gcaacagtat tccactctga 6300
agaacatgag atagcctggg gctcactaca gacccatgag gagttctgat ctcagctccc 6360
ctgtttcttg tctttcagat ttggccgtat tgggcgcctg gtcaccaggg ctgccatttg 6420
cagtggcaaa gtggagattg ttgccatcaa cgaccccttc attgacctca actacatggt 6480
ctacatgttc cagtatgact ccactcacgg caaattcaac ggcacagtca aggccgagaa 6540
tgggaagctt gtcatcaacg ggaagcccat caccatcttc caggagcgag accccactaa 6600
catcaaatgg ggtgaggccg gtgctgagta tgtcgtggag tctactggtg tcttcaccac 6660
catggagaag gccggggtaa gtggccggaa agctgaaggt gacgggcacc cttgatatgg 6720
tgcaacctga aaaccaagaa ctgagtctga aatcaacttc tttcccttaa acaggcccac 6780
ttgaagggtg gagccaaaag ggtcatcatc tccgcccctt ctgccgatgc ccccatgttt 6840
gtgatgggtg tgaaccacga gaaatatgac aactcactca agattgtcag caatgcatcc 6900
tgcaccacca actgcttagc ccccctggcc aaggtcatcc atgacaactt tggcattgtg 6960
gaagggctca tggtatgtag gcagtgggga gacagctcat gcatttctta tcttaccctg 7020
ccatgagtgg acccttcttt gtaggtgtcc cttttgggta gaggggtgcc gtgcaggacc 7080
tcactcattg cccccgtgtt ttctagacca cagtccatgc catcactgcc acccagaaga 7140
ctgtggatgg cccctctgga aagctgtggc gtgatggccg tggggctgcc cagaacatca 7200
tccctgcatc cactggtgct gccaaggctg tgggcaaggt catcccagag ctgaacggga 7260
agctcactgg catggccttc cgtgttccta cccccaatgt gtccgtcgtg gatctgacgt 7320
gccgcctgga gaaacctgta tgtatgggga gagctgggct tgtctctggt gtgacagtga 7380
cttgggacaa ggatagtcat tttggggttt gttcttatca ggccaagtat gatgacatca 7440
agaaggtggt gaagcaggca tctgagggcc cactgaaggg catcttgggc tacactgagg 7500
accaggttgt ctcctgcgac ttcaacagca actcccactc ttccaccttc gatgccgggg 7560
ctggcattgc tctcaatgac aactttgtca agctcatttc ctggtatgtg gggatgggaa 7620
acctgacttt taagagcaac tgggggtttg gtgccctctg gtggctagct cagaaaagaa 7680
acccaaacta acagttgtcc caatttgttc taggtatgac aatgaatacg gctacagcaa 7740
cagggtggtg gacctcatgg cctacatggc ctccaaggag taagaaaccc tggaccaccc 7800
accccagcaa ggacactgag caagagaggc cctatcccaa ctcggccccc aacactgagc 7860
atctccctca caatttccat cccagacccc cataataaca ggaggggcct agggagccct 7920
ccctactctc ttgaatacca tcaataaagt tcgctgcacc cacctctcct tggttttaat 7980
gcggtgttgg gggagggagg gtgtgtatgg ggaggtgaag caggctcaat caacttttgt 8040
gcatgtatct ttattggctc tgacatccag ctgggtgccg gaagtccagg gctacattct 8100
atccaagtcc cagcccaggg cgcctgtcct gaacagctga tatgtctggc aatgcggagg 8160
gtggggcttg acaatgggac aggaaatgca gtctgagact cacttgttgg acagcactga 8220
cttccagagc tcactgctct tgagaaagat cggtgtcctt ttatctgcaa acaaaggtta 8280
attgtaccca gccctcctgc agacagacgt aaaattagat aaaattggaa gggcgcccag 8340
tacagtaaaa cctagtggta tccatgaaga ggggctgtag cactggtcga tgctttggtt 8400
cgtgcgtcac acagtgactc agtgcttggg aagtattcca caccgtcatt gcttttaaag 8460
gttccattcc aatagttcaa catagcgtct cctgggaggt cgtgactgac tccctaggtc 8520
agggacatct taaccttttg gttttgtcag tgacagccat ggcggcatac cctcagctgc 8580
tcactggaga aacaggcccc gagcaccagt aacctgcagg ccacacccat gtgcgggcag 8640
cagcttcacc tcctcagccg cgacctgggc ccagcacagg acttcccaaa ggcgagcctg 8700
cacggccatg ttcactgcaa gaggcaagtg aacagctggg agcatgtgga cagagcaccc 8760
cacaccctcc aaagccttac tagggagcaa agccctatcc caaggtacat gatgaatctg 8820
cttcacacga gtgcctaggc aagttagcac cagtacaaaa tccaagatac ccaaggaata 8880
caggcaggtc ccgtgatcac attccttaca aagtggaaaa gggaggctca caagtgtcct 8940
ggcagcattc cgaagatgga gaagtagcag atacccacat gtgaggaagg caggaaggag 9000
tgtcccaatg tcatgggcgt tgtacaggga gggtggggct gagcctagct ccagacaccc 9060
cagaacctgg ggagggacag cccagggcca ggcttcatgc agtggcacag aagacccaca 9120
cccctgcaga cccacacccc tgccccagtg agctctgggg tgccagacac tggtttctat 9180
ctcatggagc tatcagatga gacgtctcga tcggagtcct cagtctcact cggcggtggc 9240
ggcgggtcgc taagcgggac cgcagtgaaa gcaggagact ttctagaaaa aaacaccagc 9300
tgtcaccttg gaccaagcag gaaggctgca gacttctaag cttgctttct catggccttc 9360
tgaggtacag ggggtgccag gcaagggctg gggagggaag aagacacttc ccttttcaac 9420
ttgatgggga gcagtgcctc tcttatcttg gggggctctg agaggctcag agatcagaaa 9480
agtgcgaagt cacagcacgg agatgccccc tgagccacgc tggggcctta gcttcttgtc 9540
cagcagtaat ctggtatggg ggtgggggct gctggacccc aaaactcctg ggtgcaagca 9600
atcctcttgc ctccaaagtg gctggggtgg agccacagat ctcttgtaag catgcacact 9660
atactcagct tgatgtaatt tgggagattg ggttgggttt tttgttgtct ttgagacagg 9720
gcctgtacgc attcctgtct ggcctggaac tctatacaga ggtgaggctg gcctggtact 9780
tggagtacct gcctgttgct tctatgcatt tgaatgacag atatgcgcta gcacacctga 9840
cttactgtag tttcttggat tttgtttgtt gttgctattt ggtttgtttg ggacaaattt 9900
ttgctgctgt cgtccaggac agcctaaaac tcatgacaat ccttctgcct ctgccttcca 9960
agactgaaac tgcagacatg taccactctg cctggtttgc agtaaatttt aaaaaaaatt 10020
tttaatgtgt gtgtgtctgt gtatgtgtat ctgtctgtgt gtctgtgtgt gtatgtgtgt 10080
gtctgtgtgt gtatctgtct gtgtgtgttt atctgtgtgc ctgtatctgt ctgtgtgtat 10140
gtctgtgtgt atctgtgtgt ctgtgtctgt ctgtgtgtgt atctgtgtgt gtgtgtttgt 10200
atctgtgtgt gtgtctgtgt gtctgactgt ctgcctgtct gtctctgtgt gtgtgtgtgt 10260
gtgtacacag ggccccacac aggctaggca agtcctctac cactaagcta tactccgaaa 10320
ccccagattt actcttacac aaggtcaaac acataaaccc gtgatttgga taagatcctg 10380
tccccgtatc tttggtcctt gcctggttta ggttctaaga cactcagagt tgggacactg 10440
gtcagtttca tctgatggcc aaggcaggga gaggaagctt cattctgggc cacacctaca 10500
ggcgactccc aaggacagct ggacataaag atgtgacctg gtccctgccc acagaccatc 10560
ggggcctatt ccagccttcc tccctgggag agagacccag cccgctcggg gcaggccctt 10620
accggtcccc ggactgtgtg atgagccggc ggcaggtctc catctgcacg tccaggcccc 10680
gcttcatgct gcacatctcc atgtactcat gcaggtgtcg gttcatgtcg ttcttggctg 10740
tggccagctc cagctgcagt aaggtggggt cagggaggac cacggttagc aaacccaggc 10800
aaggccctgg gggccaagca gctcaggaga caagtaagct acaactgcct gtttccccca 10860
ggatatggag gaggggtggg gcaactggcg atctgacttc aggccctcac tgtggctagg 10920
caagggctca ggacagtgct ccccgctcgg ccctgtcctg ccaatccact cctactgcca 10980
cccaagaatc aatcagctga tgtctgagtt ctctgtaaga acagcaagag cacacaacac 11040
agtaaggatg gtgcggtgcg gtgcggtgcg gggagcacgc atccctccag cgcttactcg 11100
gctcaggcag cagggtcccg aaggcaaacc taaatataaa acccggtctc aaaaaggggt 11160
aaggaggcca caccaggcgg ctcagtggat aaggctcctg cgcatctggc aatgtgaatt 11220
tgttctctaa cctccacaca tgcaccgtgg catgtggaga gagagagaca cacacacact 11280
aataacaata ataataaaat ttagtatttt gggggctggt gagatggctc agtgggtaag 11340
agcacccgac tgctcttcca aaggtccaga gttcaaatcc cagcaaccac atggtggctc 11400
acaaccatcc gtaacgagat ctgacgccct cttctggtgt gtctgaagac agctacagtg 11460
tacttacata taataaataa ataaatctta aaaaaaaaaa aaaaaattta gtattttgtt 11520
tgtttgtttt tcgaaacagg gtctctccat gtagccctgg ctgtcctgga actcactcta 11580
tagaccaggc tggcctggaa ctcagaaatg cgcctgcctc tgcctcccga gtgttgggat 11640
taaaggtgtg caccaccact cccggcaagg cagcagttct taacctgtga gtctcaatcc 11700
ccttgggggt tgactatcag acactctgca tgtctgtatt tatgttataa ttcgtaacag 11760
tagcaaaatt agttatgaag cagcaatgaa atagtttatg cctggggcca ccacagcgtg 11820
aagcactgtg ttaagggtca cagcgtctgg aaggctgagc accactgctt taaggacaga 11880
cagggccact catctgtcca tctttgccac tgagcctccc ctcaactgaa gctaattcac 11940
tgtgaaatat tccaaagcct cgctgcaatg gagggaacct ggctgcttct gtttatagca 12000
tttcattcca catcatcttc tcccttatat cctgctcgcc cacataagag agagaccttc 12060
ctcctgagtg attacagggt aaatccccaa caaaagaaat gggggggggg agtctctgta 12120
tcaagaaaag tctcccttcc agagctgact ctgcagccag gtttgaaggc agcaaaaaaa 12180
gtaggctgag gcggaaaagt atctaggcca gagacaaact gcggcctctc tttgtttgtg 12240
atacaaaggc caggggccag atagggagaa tcagactgcg gtggggagat ttgcttggct 12300
gcctgagggc aaagacaagg aggccgagtg gccttgaagc atgtggatca gctgtgggaa 12360
gtcacccgaa acaaatgtga actggaccgg gtgggagtgg gccccaggag cagacaaagg 12420
agacagccag gacactggca ttttgggtca tctgctgaac agctgggtgg taagccacag 12480
aggagatggc ttgaaaggca tgcttgttcc cacagcagac tgcaccattt gtgagaaaaa 12540
catgacactg aggatcagag ctcagctgcc accccccaca gacaaatgca cacagcattc 12600
caggtcagag atcagctgcc acccatgtac atcaacacgc acacacacac acactattac 12660
aggtcagaga gcagctgtca cccatacata ccaacacaca cacacactat tacaggtcag 12720
agagcagctg tcacccatac ataccaacac acacacacac acacacacac acacactatt 12780
acaggtcaga gagcagctgt cacccattca taccaacaca cacacacaca cacacacact 12840
attacaggtc gagagcagct gtcacccata aatacaagca tacccctcac tccctcccct 12900
accccacctc cattatagtc tctcaaagca taaggcagta ctaccagcca tgtctctaag 12960
tgtcatatgt caccctgatt tacacactga aggggaagat gcacattcta gaagatgcct 13020
tcaacaaatc acccccaaat ttcagactca gtgtgggaga ggcaggggta gaggtagata 13080
ggagcgatga aggggcgggg ccatggaaga aaactccacc caccactctg catcaccatt 13140
caataatggg ggctggtcta tctctatgcc aataaccctg agatcaaggg tcatggagat 13200
aaaggtccta cagatgctcc agggagaccc aggagctact ctgctaccaa cgctaccaag 13260
tgagcatcct ttggctttct cctcaactca ttctcccagg agagaacaga agtcatacaa 13320
cttaggaaca gcttcaaaca tgttcccaat ttttttggga gggcaggggg agagtagagg 13380
tttgaagcag ggcttctctg tgcagccctg gccatcctgg aagtagttct gttccccagg 13440
ctgtcctcga actcacagag atcctcctgc ctgttttccc actaccagga ctaaaggtgg 13500
caccaccaca ctccatttta taggtactgg tatcaaacct agggcttcac gcatgaaggt 13560
aggcaggcat tctaccatga gagcacagtc ccagcccagg gtgctcttct ctgtcctacc 13620
acatcatgtt tacacttagt tatttgtggc ctaagggatg aaccacagaa gggcagcagc 13680
tcctgatcac tgtgctaaga ctcctacctg gctgacggta gggaaaaaag gaccaagcct 13740
taaatctacc gtctgtaaga ggtggacaca acccagggag ggggacagga aggaggaagg 13800
agcagtaaga ggagcggaca ggaggagatg ggagatcatt tgtccccagg caaagcttaa 13860
ctggtggcag aacactggct gggtgggaat tctgggttaa aaaccaaaag cactggtttt 13920
cctcagagta gcacggccat ctgacatgtg ctggccactg cagaagagtt acttccaaag 13980
ttccctttca aaatgcaaac agagtgaccc ccatgggcac gggaatgcac cacagggctc 14040
gcagggagcc caatggcatt agtctcctgc ctcatccctg catcagtgtc taagacatag 14100
agccctgttc actgtccaat ggcgaccccc ttcctgcagt ccctgcctgc agtccagcag 14160
gacaatctaa accccagccc caccaccatt catacccgat gccccaaggc tcaaaaaaca 14220
aaagagggag acacctccag gagctccaag gctgagccaa ggagacagga gtccctctgg 14280
gtgctacggc acttagggtg ttcccagtaa taaatgcgca cactaccgca tgtcaacctg 14340
ccagatcctg tcctaagagc cacgcgcgcc tcactctatc tgatcatctt aataaccctg 14400
cctgcctacc agcctgtcgg gagagattat gaacatctct attggacaaa taaagagaca 14460
ggcccaccct tagcagggta gaaaccatct ctaaccctaa caggctgagg caggaggatt 14520
gcctcaagtt tgactggcta cacagaaatc tggtctgggt gggggcttag gatggctcag 14580
tagttaagag catgccctgt tcttgcagag gacccaagtt tattttccag cgcccacatc 14640
aggttcacaa acacctgtga gcgccagctc ctggaaacct gatgcccacc tctgacctcc 14700
aaggagagag ggggagggag ggagggaagg aaggagggag ggagggaggg agggagggag 14760
ggagggaggg agagagagag aaagagagag agagagaaag agagaggaga gatgggggcg 14820
tggatctgcg aggaaggcag gcaggcaaga tgaatgtgtg tgagagccta caacaaaaga 14880
ataaaaagga atgaaggagc tagctgagga acacctcatc agtgggaggc ttactgcaca 14940
gcatgaagac ctgagtttga tcttagaacc catctagaaa ataagctagg gctgaagaga 15000
tggctcagca gttaagagca ctgtgtttgc tcttgcaatt cccagcaacc acatggtagc 15060
tcacaacctg ggacctgatg ccctcttctg gcatgcaggt gtacatacag atagaacact 15120
catatattaa ataaataaat aaataaataa atcttaaaaa aataaaataa actagccata 15180
gtagaacaca cttgcaatcc caaagctaag aatgtacaga cagacagaca gacagacaga 15240
cagacaaaag atgcctaggg ctccctggcc agctcggcct actcagcaag tttcagacca 15300
gtgaaagacc ctgtctcaat taaaaaaaaa aaacaaaaaa cccttaacca cactcaaaga 15360
acactaccca ggtttgtctt ctggcctcca cacttgtatg tgtacacatg tgcgcgtgca 15420
cgcacacaca cacacacaca cacacacaca cacacacaca cacagaggaa aggaggaaga 15480
cccaaggaag gataaaaagc tggtcagtca aagctggctt aaagctcctg ccgtaatcct 15540
atcgcacagg aggcgtgggc agaagcacca ggagcttgag gccaacctag actacaagac 15600
aagatcttga aaagaaacag agaggcaggg gcaggaagga cactcacaag tgcgagagag 15660
cttgcagttg tgatgcacac ttttaatccc aggagaggca cagtaacttc tccagagtga 15720
gttccaggac agccagggct acagagaagc cctgtctgtc agggggaaaa gaaaaaaaaa 15780
agaaaggggg ggacagaaaa gaaaaagata gtctggtggg aaatgattca ccgggtaaag 15840
gcatgagcca ccaagtccaa agacctaaac ttgattgctg tcacccccat ggtaaaagag 15900
aacttcctcc cacacgttgt tctctgacct ctacacatgt gcatggactg cgcatgctct 15960
ctgacactcc atccatccat ccatccatcc atccatccat ccatccagtg tgtgtgtgtg 16020
tgtgtatgtg tgtgtgtgtg tgtgtgtaaa ataaataaaa aggaaggagg gagggacagc 16080
aaaagatttg ttccatgtgg tgacagagcc gggatttgaa cccacatcta tgtgcctcca 16140
gatcctgaag tctcaaggac ctgctacagc taccacaact gagaggatca ctactgacaa 16200
cagatggaag ctcgggccct ggggttcagc gaggaggagg ccagcaacac acctacagcg 16260
tggctcctga gccctggacc tacagcgtgg ctcctgaggc cggcaccctt ac 16312
<210> 19
<211> 11058
<212> DNA
<213> Rattus sp.
<400> 19
gtgagtggac ccggatcact ggccctgttg ggttccggtg taggaaacgg aatccgctct 60
ccctaagtgc tcagagatcc ctgtctggac ttgctagcct cactacagcc gtgcaaccga 120
agtgacttaa ggccagacct tttttttttt ttttttctga gctggggacc gaacccaggg 180
ccttgcgctt gctaggcaag tgctctacca ctgagctaaa tccccaaccc caggccagac 240
cttttttaaa ggccattcgt ttcctctttt atttattttt tagtgtgcac tggtattttg 300
cctatgttta tgtctgtgaa ggagcccagt gccctggagt tggagccaca gacagttgtg 360
ggtgctgaga actaaacaca ggtcttaacc actatgccgc cccccccccc cccagcctca 420
gtaaaggcca ttttctactt gcgatagggt cttgctatgt agacccagct ggcctcaaac 480
taacagagat tcccctgcct ctgtctccag tgtgctggta gtaaaggtgt acccccatgt 540
tcggcactag actgcttctt tagagtggtc tcatgtttaa agtaacactg agttcccatc 600
tgcctgtccc acaccctcat ggcctctacc ccatcacctt atcctcggta cgtgatccta 660
caatctacat tgactgggat gaaggaatga gattgacaga tcagcatcca aagtccactc 720
actgaatcca gtggcacatt cttgccacta gtgtcatact gggcattttc aggactgtga 780
ggtcacctca ctccccaccc tgtggtggta tcagtcagtt ggaatcacag tttcagagtt 840
tgtttcttta acttgctgta tctttcatgg ctgcttttta aatagggaga taatgcttcc 900
gaccccgtct ttaccttttt ctccaggctg taatagatga atttgagcag aagcttcgtg 960
cctgtcacac cagaggcatg gatggaatag aggagcttga aactggccaa ggaggcagcc 1020
agcgggccct gtctgccaag aaaccctccg ccggtgtgag aggcaagccc acgctgggcc 1080
ccacaggcag tcccctcttt tctttttttt cctttgtggt ttgtttttgg ttttgaaatc 1140
atgtccctct gcatattcca gtctcaaggc aacagcctct gacttctgta gactcagaca 1200
atgactttgt cacacctaag cctcgacgta ccaaaccccg tcgtccacaa actcagcaac 1260
gcaagtccca gaggaaagcc aaagttgtct tctcaagtga cgagtccagt gaagatggta 1320
agatacaccc tcccaacagg acaactgctt gtgtggggtc tccagccggg cttgcctggc 1380
tgtggattca ttctccctgg cagtgtcttc cccactgtgc agctgctggg ctgactttca 1440
ctctgtgtgt gtgtttgtgg tgtgtgtcca gatccgtttt gccccatctt tatgactcag 1500
cgtttgttcc tataattctt tgaatagaac tttcagcgga gatgaccgaa gaagagacac 1560
ccaagaaaac cacccccatc cgcagagcat ctgcgcaaag acacaggtcc taggagctgc 1620
ctttgcctat tcccatccct gctgtgcagg gtatcttact gaatgatcga gaattcaacg 1680
cccccccccc ccttggaaaa tacttgttgc ctccttgttt ttaacatgta aatggtcttt 1740
tcgagcaagg cctttctctt agagcccctg actgctactt tccaagatcc aatcaccatg 1800
ttttctagtg aataaatgtt tttatatact tttaagcatt ctggccggct ggtctgttcc 1860
attattaggc agcagatagc agtccagaga gagaacccca ggcatcctga gccatctctg 1920
gaccttcatg gaccctgtgg tgcttcatct ttgcacaact gctgagattt gctgtagaga 1980
gttctgtggt ttctaggttc acataagcac ttctcagcct gggggtactt tgcaccccag 2040
aacacgtttg gcaatatcta gagaccaggg gtgggagaga tggctcagcg attaggagca 2100
cttactgccc ttccagaggt cctgagttca attcccagca accacatggt ggctcacagc 2160
catctgtaat gagatctggt gccctcttcc ggtgtgtcta aagacagcta tataataaat 2220
aaataaatct ttaaaaaaaa aatctagaga cctatttctt ctgcccacct tgtggggcag 2280
gggctgctgt aggcacccag tcagtcagag cctaaggagg aagactcctt catccatagc 2340
actcccaaca cagcatgtcg ggactgtgca actagaggtg ctgctctaga cctgcggttt 2400
gtttcctgtg tgccacaccc catcccagaa gactggcaaa tgagtcagcc tggctggtgg 2460
cagagatcat gccattagct ctgttggtga caaggtccac ctcccaagag tcagtcctcc 2520
actatgctaa ggggtctctc gctcagctgc aggcccaggc tgtgctatgt gctgcccacc 2580
ttccccaagc ccttaatctg ctgagtcact tggagcagga ggcaggactg ttgtttccgc 2640
tgtcatgaca acagcacagt gcagctgagc ctctccctac ctcttggtat ggaaagagta 2700
atgacaggcg tgaggcagaa gaagatgcac ctcagaaaca ctaggttagg ggtggactgt 2760
ggaagggctc ttgagacctc tgggtaggaa aagggttaac tcggtggata gagcctcagt 2820
aggaagacag aaaagggaca gctgagtctg agatgcctgt ctccccagca ctgcactggg 2880
gccactccta ccctttccac cctgtttttg gcctgctccc tgctcatgaa aagcctaggc 2940
atggaccaca cagctgtcag tctaaacaca gctttggctc tggggcccca aggaggtagg 3000
gcaatcccag aagggcaagg agccaggact agatttgggg tgcagcccag cgtgctccct 3060
gccttttaag caaaggttat caccaggcca gctaaactta gcaataggct cttcagctag 3120
aagtgcaggg ggctggtctc aagttgcact gggctagcaa agaagcccca gagtccccct 3180
ggcccgcacc tgctgatggc ccgcacctcc caatcaaccc cttccaccct ttctagcctc 3240
cctaccctgc aaagcaaaca agtccttttc tccctccact gtgcaaagag gctaggggtt 3300
gcctgttctg gctcgggata cttcccttct gctttcttcc ctttctgatc tcaccctgct 3360
tccacgaggg cagccaagga aagagagtcc ttggctcctg ggccagtcag caggtcgcct 3420
ggatggggag ggacttccgc cctcacgtcc cagctctcca ccctggggct gcggtgggtg 3480
aaagggacag tgtctccaat cctgggcggt acaactcagg ttccggggag ggaaggcctc 3540
tgagcctcct ccaacccaac cctcaacagg gatgcttacc ccggggcccc ggtataggtt 3600
cagcaggtaa actcagggaa gtgttgtctc aatcaggttt ccagactgca ggggatcccc 3660
gacctatggc gtaggaatct ccttttcaag cctctagtca cttccttgct ttcacatcgc 3720
ggtacacaag ccaggactct ggcctaagag atagaagcca ggcggtgggg agagaggaaa 3780
atggggctgc gaagggcccc caccggagga aaagtgcccc ccccgtccct cccccagcct 3840
tttcttctgc tccttttttc ggggcggggg gggcgtgctg tgtcactacc gaagaacaac 3900
gagaagatcc tcaacttctc ctaagccttt tcactaatag ggagaagttc gatggggcag 3960
ccttgggcag acccacactt ctgctccatt tccctggttc ctgcagctct cagattctcc 4020
cattttattc gggaagcagc tttctggttt ctgggtcctg gatgtccttg gtgcacactc 4080
caaggactcc tcgtccttaa tccatagtct gtattccctg agtcctatcc tgggaaccct 4140
catccggtca cttcctcggc gggacaatct cagctcccct ccccctctca ggtcggagcc 4200
cacacgcttg gtgcgtgcac atttcaaaaa cgaggcgggt ccaaaaagag ggaggggggg 4260
aatgagagag gcccagctac tcgcggcttt acgggtgcac gtagctcagg cctctgcgcc 4320
cttgagctgg gactggatga gccgagcggg aggcggggcg cgcgtcatca gctcccccca 4380
ccatccagtt cctataaata cggactgcag ccctccctgg tgctctctgc tcctccctgt 4440
tctagagaca gccgcatctt cttgtgcagt gccaggtgaa aaagaaaaga aaaaaaagga 4500
ctgggccgca ggaggccgga gacgaatgga aattaggaat ggggggaagg acgctgtacg 4560
ggtttagggg cgctggtgcg aggtccggaa gccgagccca ggctccgcat tgcagaggat 4620
ggtagaggac gtgatggggc atgcggcggg aatggaggcg ggtgggggga ggggactggc 4680
cacgctaatc tgactttctt ctcccgcagc ctcgtctcat agacaagatg gtgaaggtcg 4740
gtgtgaacgg gtgagttcca gggcggggcc ccgctccgtt gcgcatgccg gtctggctaa 4800
attcggggct gtgctgtagc gtgcggggag gtggataggg tggccgaagt acccaaggag 4860
acctcaaggt cagcgctcgg acctggggaa ggctcgcact taacgggacc ccagctgttg 4920
ctccccttgt aactccgcct ttgctgggga gcggcccgga gtctaaagta gcaggagcac 4980
ccccgacact ggcgcgcacc cgctcaggat ccgacccgta atccccaggc tggggcttct 5040
ttctttactt tcgcgcccag aggagtcacg tgccagaagg ggagcccctc ccccatcgtc 5100
cccttcctca gggtcggtgg cacgggggtg tgaggtgcat acctttgcgc atcttctaag 5160
ggcttcactt atggtaactg gccgccgcca tgttgcaaac gggaaggaaa tgaatgaacc 5220
accgttaaga aatcttcctt cggccttcct cattcttagc ttgtgactaa ctttctcatt 5280
cctctcagct gggtggagtg tcctttattc tgtaggccag gtgatggatg gcagggtttc 5340
cgtgctctca ttagagctct actatacaat ccgtctctcg tcagccttta taggcctcca 5400
gccttatttc cctcgggcat aacttatatt ctagattgtt ctctggaagt cgaagtgcat 5460
ttacagaggt ctacttggcc tcccagcccc ggaggtgcgg tagcaatggc gtagtgccga 5520
gcccgggggt ggggtgggga gctgagtcat gatggtcctg aaaagaaatt ttctgccaca 5580
aaatggctcc ggtggtagca gccccctccc tccagggcct ccacttccat cccagctcag 5640
cactgaccca aaccctatag gccaggatgt aaaggtcact aagaggattg ggtgtctctg 5700
agcctcagga tcctaccctt ttccccaacc catcctccag aaaccagatc tccccattcc 5760
gccctgatct ggggttaaat ttagctgtct gacctttctg tatctggggt ctgagctggg 5820
ctctctgccc tgttcatccc tccacacatc tgttgctcct gctccgattt tttttttttt 5880
ttttttttgg ccgggaaaga caggtgtttt gcaaatgagt cctgggatta gggctggaaa 5940
atcactggtt ttcttgatct ttcccccaga aagggacttg gaggaagcag gtgggctggc 6000
cctgtcctgc tcactctgac ctttagcctt gccctttgag ctgctgatga atgagttctc 6060
tcctgtccgg gagtgtagcc tgaagtccag ccatgctgga accggcttcc caggcctgtg 6120
tggtgggggt gatgaatacc atgtgccaag cttgtaccca gaccggggca aaccgccact 6180
tcttaagaga cttaaaatga ctttggggtg ccgggcaagg ctgtgggcct aatcacctct 6240
tggacaggaa aggaacctcc actttatagc tgctataaaa gtcctgccag ccctgggtgg 6300
ctcaaggaat ataaaattag atctctttgg actttctagg gagggaacat tctatatttg 6360
ggttgtacat ccaagcattc aaccggcttt attaaaggaa attctggaca aaacatgaac 6420
ttcctgctgc ttacgtttct gatgctgtac tgaatcagcg taagaacttg cacctttttg 6480
tgatgcgtgt gtagcgggct gctgtaggat ctccacgccc atggtgcagc gatgctttac 6540
tttctgaaga acatgcgttg gcccagggct gactacaaac ccaggagggg ttcactgatc 6600
ccaactaact cgcctatttc ttgcctcaga tttggccgta tcggacgcct ggttaccagg 6660
gctgccttct cttgtgacaa agtggacatt gttgccatca acgacccctt cattgacctc 6720
aactacatgg tctacatgtt ccagtatgac tctacccacg gcaagttcaa cggcacagtc 6780
aaggctgaga atgggaagct ggtcatcaac gggaaaccca tcaccatctt ccaggagtac 6840
gtatggaaac atgcacaggg tacttcgagg agatggtaag gggcggcatt aactctgtcc 6900
tgttccccgc ctgtaggcga gatcccgcta acatcaaatg gggtgatgct ggtgctgagt 6960
atgtcgtgga gtctactggc gtcttcacca ccatggagaa ggctggggta agtggccagg 7020
aagctggagg taaggggaac ccttgatatg ggtgcaacct ccaaactgaa gagctgagtc 7080
tgaaatcaac ttctcctgca caggctcacc tgaagggtgg ggccaaaagg gtcatcatct 7140
ccgccccttc cgctgatgcc cccatgtttg tgatgggtgt gaaccacgag aaatatgaca 7200
actccctcaa gattgtcagc aatgcatcct gcaccaccaa ctgcttagcc cccctggcca 7260
aggtcatcca tgacaacttt ggcatcgtgg aagggctcat ggtatgtagg caatggagac 7320
agctcatgca tgagtggacc tttctttgaa gatgtccctt tgggtaggag ggctgccctg 7380
caagacctca cccattgcct ctatgctttc tagaccacag tccatgccat cactgccact 7440
cagaagactg tggatggccc ctctggaaag ctgtggcgtg atggccgtgg ggcagcccag 7500
aacatcatcc ctgcatccac tggtgctgcc aaggctgtgg gcaaggtcat cccagagctg 7560
aacgggaagc tcactggcat ggccttccgt gttcctaccc ccaatgtatc cgttgtggat 7620
ctgacatgcc gcctggagaa acctgtacgt agggggagag ctgggtttgt tttgtctatg 7680
gtatggtggt gacttggggc aagagcagtc atctttggtt ttgcccttac aaggccaagt 7740
atgatgacat caagaaggtg gtgaagcagg cggccgaggg cccactaaag ggcatcctgg 7800
gctacactga ggaccaggtt gtctcctgtg acttcaacag caactcccat tcttccacct 7860
ttgatgctgg ggctggcatt gctctcaatg acaactttgt gaagctcatt tcctggtatg 7920
tggggaccgc aagcctggct cttgagagta actgaaggtt tggtgccctc tggtggccag 7980
cttagaaaag aagcccaaac taaccgttgt cccaatctgt tctaggtatg acaatgaata 8040
tggctacagc aacagggtgg tggacctcat ggcctacatg gcctccaagg agtaagaaac 8100
cctggaccac ccagcccagc aaggatactg agagcaagag agaggccctc agttgctgag 8160
gagtccccat cccaactcag cccccaacac tgagcatctc cctcacaatt ccatcccaga 8220
ccccataaca acaggagggg cctggggagc cctcccttct ctcgaatacc atcaataaag 8280
ttcgctgcac cctcttcttg tgtgtgaatg cagtgttgtg ggggttatgg gcaggtgaag 8340
gaggctccat tcggttttgt gcacatatct ttattggctc tgccatccag ctgggtgcta 8400
gaggtccagg gctacattct aaccgagtgc cagcccaggc cgcctgtcca gacacctgat 8460
gtgtctggca gtgtggaggg tggggcttga cactggaaca gaaggtgcag tctttgaaca 8520
gcactgactt tcagagcttg ctgctcttga gaaagatctg tgtcctttat ctgcaaacaa 8580
aggttaattg tacccagctc tcaaagtctc cagatgttaa attaggtaaa gttggaaggg 8640
tgcccagtac agtaggacta attgtgtcca tgaagaggga aggtccctgc tgagctgttc 8700
acctgtcttc aggtgtgggc acttgaaggt gctttggttc tggggcagtg actagccagc 8760
gctcactgtt ggttgggaat gaaatgaagg tgcattacac ggtgactcga ctcaacgcct 8820
tcattgcttt caaaggtccc attcaaatgt cagctctgca tagcctctcc tgggagatcc 8880
tagctcccta ggaccaggga cattgtaacc ttttggtttt gtcagtgaca gccatggagg 8940
cattccctca gctggtcact gaggagacac cctgagcacc cctaaccttg tgcaggccac 9000
acccaagtgt ggcagcagct tcatctcagt ggcgacctgg cccaggcact ggacttccca 9060
aaggcacagc catgttcact gcagtgggca ggtgggcagc tagctgtgag catgtgcagt 9120
gtccacgccc tcaaggcctt cctagggagc aaggtcctat ccaaaggtac atgcggaatc 9180
tgtttcacat gagtgcctag gccagttagc accagtacaa aacccaagga aaacaggcag 9240
gtcccataac cacattcctt acaaatggaa aagggaggct ccaagtgtgc tggcagcatt 9300
ccaaagatgg agaagtagca gatacccaca tgtgaggaag gcaggagtgc cccaatgtgt 9360
tgggagttgt acagggggtg gggccgagcc tagctccaga caccccagaa ccctggagag 9420
gacaagccag ggccaggctt catgcggtgg cacagaagat ggtcctctgc agacccacac 9480
ccctgcccca gagagctctg gggcaccagg ccctggttcc tatctcatgg agctgtcaga 9540
tgagacatct cgatcggagt cctcagtctc gcttggcggc ggcggcgggt cgctaagcgg 9600
gaccgcagtg aaagcaggag actttctaga aagaaatacc agttgtcacc ttggggcaaa 9660
gcaggaaagc tcctgagact tccaaacttg ctttctctgg ccttatcttt tgaggtacag 9720
ggggatgaca ggcaaggacg ggggagggaa ggaaaacttg ttttcaactt gatgggagga 9780
acagtttcgc tctttgggac tcagagatca gaaaagtctg aagtcacagc atggagatgt 9840
tccctgagcc acactaaggc cctagcttct tatccagcaa taattcggtg tgcggggggc 9900
tgtggggact gtaggaggtg agactggggg agtatggggg tttagggggc tgtttcactc 9960
tgttgtcact gctgacccca aattcctggg tgcaagcaat cctcttgcct tcagttgatt 10020
ttcttttttt ttttaattta ttttatttat atgagtacac tgtaactgtt ttcagacata 10080
ccagaagagg gcatcagatc ccattacaga tggttgtgag ccaccatgtg gttgctggga 10140
attgaactca ggacctctgg aagagcagtc agtgctctta accgctgagc catctctcca 10200
gcccctcttg ccttcaaagt ggctggggtg gccacaaacc cagttagcgt gctcaccata 10260
caatgcaatt tggggggtcg ggttgggttg ggttttttgt tctctttgag atgagtcagt 10320
ttgcattcct gcctggcctt gaactcctca cagaggcgag gctggtctag tacttgtggc 10380
aattcacctg cccgttgctt ctgtgcatct gaatgatagg tatgcgctca taagcctgac 10440
ttaactgcca ttccttggat ttttgtttgt tgttgttgct gtttggtttg tgtgggacaa 10500
ggttttactg ctgtccagaa cagcctaaaa ctcatgacaa tccttctgcc tccgccttcc 10560
aagactgaga ctgcagacat gtaccgctag gcctggttta gagatttcta aaaaaatctt 10620
agtgtgtgtg tgtgtgtctg tgtgtgtgtg tgtgtgtgtc tgtgtgtgtg tgtgtgtgtg 10680
tctgtgtgtg tctgtgtgtg tctgtgtgtg tgctagacag gctagacaag gactctacca 10740
ctgagctata ttccaaaacc ccagatttac tcttaaacaa ggtcaaacag ctaaactgtg 10800
atttggattt ggataatcct gtccctctat ttctttgctc cttgccaggt ttgggctctc 10860
agaccctcag agttgggcac tagtcggttt catctgacgg ccaaggcagg gagaggaagc 10920
ttcattctag gccacaccta cagggactcc caaggacagc tggacataaa gatgtgacct 10980
ggtcactccc acaggccact ggggcctgtc cagccttctt ccctgggaga cagccacgcc 11040
actcagggcg gcccttac 11058
<210> 20
<211> 3158
<212> DNA
<213> Homo sapiens
<400> 20
agcttgagat tgtccaagca ggtagccaga gagcgccatc agccaagaaa ccatccactg 60
gtacgtaagg cagcctgtgc gggcgagacc agactgggcc ctcccctcct gcagtgattt 120
gtttcttctt cttttttaaa tcacgttttc ctgccttttc taggttctag gtaccagcct 180
ctggcttcta cagcctcaga caatgacttt gtcacaccag agccccgccg tactacccgt 240
cggcatccaa acacccagca gcgagcttcc aaaaagaaac ccaaagttgt cttctcaagt 300
gatgagtcca gtgaggaagg tatgatgctc ccgcctgttc ccggccgaga aggcacacag 360
ctagggtgca gagggctggt ttccatagga cctgctgcgg gggcctgagt gtagatgctc 420
tgccccactg ccgcagaagg gcctctcctg tacagcttgg attttatttc ttctgtgcgg 480
tgtgggattg tctcacttgt tctctgatat ctattttttc accatctttg tgactcagct 540
ttttcttatt cctttaattc tttgcataga tctttcagca gagatgacag aagacgagac 600
acccaagaaa acaactccca ttctcagagc atcggctcgc aggcacagat cctaggaagt 660
ctgttcctgt cctccctgtg cagggtatcc tgtagggtga cctggaattc gaattctgtt 720
tcccttgtaa aatatttgtc tgtctctttt ttttaaaaaa aaaaaaggcc gggcactgtg 780
gctcacgcct gtaatcccag cactttgcga taccaaggcg ggtggataac ctgaggtagg 840
gagttcgaga ccagcctgac caacatggag aaaccccatc tctactaaaa ataaaaaatt 900
agccgggcgt attggcgtgc gcctgtaatc ccagctactc aagaggctga ggcaggagaa 960
tcgcctgaac ccagaggcgg aggttgtagt gagccgaaat cacaccattg cactccagct 1020
tgggcaacaa tagcgaacct ccatctcaaa ttaaaaaaaa aatgcctaca cgctctttaa 1080
aatgcaaggc tttctcttaa attagcctaa ctgaactgcg ttgagctgct tcaactttgg 1140
aatatatgtt tgccaatctc cttgttttct aatgaataaa tgtttttata tacttttaga 1200
cattttttcc taagcttgtc tttgtttcat ctttcacatt agcccagttt catgcagcag 1260
agagagggtt atcagtgcag agagagatga gtgagcccag agtcctaggg cctgtcccgg 1320
gatggcagat gagcttcctg ccccgtcact gccacctttc ccctctcaac ctctggaccc 1380
tgcacagtga ccagacagcc tctctgggga gaattatgca gtgcctaggc tccagatcag 1440
tgcttctgaa ccgggggcaa ttttgtctgc cagaggacat ctgacaacac ctggggcctg 1500
ttttgttgtc atagcctata ggggaagaat gctaccagca tttgtgggaa gaggccaggg 1560
atgtggctca acatcctgca gtgcacagga tggcccctca acaaagaatc acacggccca 1620
caatgtcaat agcgtcacag ttgagaaaac ctgctctaga ccaagggttg ctttctgccg 1680
tgtgcctcac cccaccccca ctcgtgttcc ctaatcccat ctccaaaggt tggcagcaga 1740
ccggcccagg ctcgtggaag ttcagatcat gatcccctcc agctctgcag gagacaagac 1800
ctgtctccca gcattcctca ttgttcccgg gtctgcagag ggcgtgagct atgctgcagg 1860
cgggctgccc cctgaagcct gcgcacccct ctccagctcc tcaagtcttc tctgctgagt 1920
caccttcgaa ccggaggctg tgagctggct gtcgtgacca cactggtgcc tctgctgtca 1980
tgacaacagc acactacgtc agtagtgctc cctgggcact gagctccctc tttgcgggga 2040
gaagacagta atgaaaaatg acaagcatga ggcagagggg aagatcacgc ttgggtggtg 2100
caggagcatg gaggtgctct taatgctctc aatgagaaag ggttaacggt cctggttgca 2160
ggaatagctg agtcagaggt ggggcttcct ccactccccc accccacccc tttcaccatt 2220
agggaccttc ttgccttgct cttgctactc tgctctgggt ggtcattgtg aaaagcccgc 2280
accaaccatg ccagtggcag ccagacgagg acacagcctg gctctgggtc ccagcaggaa 2340
aggcaatccc agaaaggcag ggtcagggac tggagtcctg tgggtgcttt ttaagcaaag 2400
attatcacca ggcaggctaa acttagcaac cggcttttag ctagaagggc agggggctgg 2460
tgtcaggtta tgctgggcca gcaaagaggc ccgggatccc cctcccatgc acctgctgat 2520
gggccaaggc caccccaccc cacccccttc cttacaagtg ttcagcaccc tcccatccca 2580
cactcacaaa cctggccctc tgccctccta ccagaagaat ggatcccctg tgggaggggg 2640
caggggacct gttcccaccg tgtgcccaag acctcttttc ccactttttc cctcttcttg 2700
actcaccctg ccctcaatat cccccggcgc agccagtgaa agggagtccc tggctcctgg 2760
ctcgcctgca cgtcccaggg cggggaggga cttccgccct cacgtcccgc tcttcgcccc 2820
aggctggatg gaatgaaagg cacactgtct ctctccctag gcagcacagc ccacaggttt 2880
ccaggagtgc ctttgtggga ggcctctggg cccccaccag ccatcctgtc ctccgcctgg 2940
ggccccagcc cggagagagc cgctggtgca cacagggccg ggattgtctg ccctaattat 3000
caggtccagg ctacagggct gcaggacatc gtgaccttcc gtgcagaaac ctccccctcc 3060
ccctcaagcc gcctcccgag cctccttcct ctccaggccc ccagtgccca gtgcccagtg 3120
cccagcccag gcctcggtcc cagagatgcc aggagcca 3158
<210> 21
<211> 3218
<212> DNA
<213> Homo sapiens
<400> 21
aagctggcac cactacttca gagaacaagg ccttttcctc tcctcgctcc agtcctaggc 60
tatctgctgt tggccaaaca tggaagaagc tattctgtgg gcagccccag ggaggctgac 120
aggtggagga agtcagggct cgcactgggc tctgacgctg actggttagt ggagctcagc 180
ctggagctga gctgcagcgg gcaattccag cttggcctcc gcagctgtga ggtcttgagc 240
acgtgctcta ttgctttctg tgccctcgtg tcttatctga ggacatcgtg gccagcccct 300
aaggtcttca agcaggattc atctaggtaa accaagtacc taaaaccatg cccaaggcgg 360
taaggactat ataatgttta aaaatcggta aaaatgccca cctcgcatag ttttgaggaa 420
gatgaactga gatgtgtcag ggtgacttat ttccatcatc gtccttaggg gaacttgggt 480
aggggcaagg cgtgtagctg ggacctaggt ccagacccct ggctctgcca ctgaacggct 540
cagttgcttt gggcagttac tcccgggcct cactttgcac gtgtgcttac ctagtggaga 600
caaaagtaca tacctcggta gagcgcgcac gcctgtaacc ccagcacttt gggaggccaa 660
ggtgggtgta tcacctgagg tcaggagttt gagaccagcc tggccaacat ggtgaaactc 720
cgtctctact aaaattacaa aaatcagcca ggcttcatgg cacatgccta tagtcccagc 780
tacaggcatg ctgaagcagg agaatcgctt gcaccccgga ggcagaggct gcagtgagct 840
gagaccacac cactgcactc cagcctaggc aacagagtat gagactccat ctcaaaaaaa 900
aaaaaagtac ctacctcaga gttcaaacta gtgaatatta ggaagtgctt gagacagtga 960
caccaaagtg cacaataaat actcgccagt ttcattatta ttaaagaatc catttgaatg 1020
tcagctcaac acagcctcct ataccgaggc attgtgaacc gcatctcccc agcttctcca 1080
ggcttttcca agaatcaggg acactgtagc ctgttggtct cagtgtatga cagacacgga 1140
ggaagcacat ctttagctga tacttaaaca gagaccctga gcgcacatac acccgcgcac 1200
acatgcatgg agcttcacct tctctgtcat tctgcagtga ccaggagagc aagagctccc 1260
acctcccttc aaaacactgt gcccatcccg ggcactaagg cctctttaaa gcacggcacc 1320
tccacgaggg agggccacag ccacatacac tccacctggc aggtggacag cgtgagcacg 1380
tggaccatag cagggacaag gtgccccggc cagccccaac gccctctgcc gctgacaggg 1440
acagaagccc tctccagctg cgtgtgctgc agaggccatg cgtagcctcc agctgcattc 1500
tattccactc cagtgcctgg gccagttagc accagtgtgg aagacagtga gctggctccg 1560
gacaacaggg atggaggaaa ggtcccacat tcacattcct gatacgtgga caaggtgagg 1620
ggccgcaatc gctctggcag cattttaaag atggggaagt agcagacacc cacgcgtgaa 1680
ggcaggagag ccccaactgt ggtggaaatg gccccagaat ggtagggcca agcctagctc 1740
cagacacccc agagccctgg agaagccaag actgagggag aaagcctgag ggaggagcgc 1800
cccagtcccc agggaccggc ctggtgcaga gctgcagctg atgttcccct ctgtgcagcc 1860
ccaccctctg cctcgctgag ctccctgctg cgagggcctc gggtgcaagg gggaggcagg 1920
tctctatctc atggagctgt cagatgagac atcgcgatcg gagtcctcag cctcgcttgg 1980
cggcggcggc gggtcgctaa gcgggaccgc agtgaaagca ggagactttc tagaaaaaaa 2040
caccagttgt caaccttggg gcaggcagga atcctgaaga cggacggcac tcctcctcct 2100
gctgcctcac cctctggcag cccgtgagaa gtaccggaag cgagggcggg gccgcgggat 2160
ggcgagggag cggcagggac tgaactctct ccaaacccac cctgacaggg aaatgggccc 2220
cgcctgtgtc ttgggaactc agaggctgag gtcaggcatg atggctcacg cctgtaattc 2280
cagcactttg ggaggcagag gcgggtggat cacgacgtca ggagttcaag gcaagcctgg 2340
ccaacatggt gaaaccccat ctctactaaa aatgcaaaaa ttagccaggt gtggtggcgg 2400
gcgccttgga ggctgaggca agataatcac ttgaacctgg gaggcggagg ttgtagtgag 2460
ccaaaaaaaa aaaaaaaaga aatagctgaa gtcacagtag gagagaagct gctgagcctc 2520
cagcaccctg actctagggc cttggcttta tgtctatctg cagtattttt gtgattttta 2580
aaaattcact ttcttgttgc ggtgtaactt acacagggtc aaatgcacaa atcatggccc 2640
tgactttaga taaaaatctg cccccacaac ccttctgttc cttgccagtt tttaaactgc 2700
ctctaaccag gggaaccacc agagctggtg gccttgggag gtttcagccc tcccgtcatg 2760
aatggacata gctcatccaa ctgccaaggg agagagctgt gggtctgggc cagccccacc 2820
aggtaactcc caaagggcag ccccacagca agatgtgacc cagtcattgc ctgagggtct 2880
ctggggctgt gttccaacct ttctccccgc tgtgtccccc tggaaggccc catgcccagg 2940
ggaggcgcct accggtctcc agactgggtg atgagccggc ggcaggtctc catctgcacg 3000
tccaggccgc gcttcatgct gcacatctcc atgtactcgt gcaggtgccg gttcatgtcg 3060
ttcttggccg tggccaactc cagctgtggt ggggcaggca gggccatcgg ggttaacagg 3120
tggcgttcac agcgcctctg ttgcccccgc caggaggcca acacgccaag agcagtggct 3180
gggccggggg cccaggcagc cattactgaa ggctcaga 3218
<210> 22
<211> 508
<212> DNA
<213> Homo sapiens
<400> 22
agcttgagat tgtccaagca ggtagccaga gagcgccatc agccaagaaa ccatccactg 60
gtacgtaagg cagcctgtgc gggcgagacc agactgggcc ctcccctcct gcagtgattt 120
gtttcttctt cttttttaaa tcacgttttc ctgccttttc taggttctag gtaccagcct 180
ctggcttcta cagcctcaga caatgacttt gtcacaccag agccccgccg tactacccgt 240
cggcatccaa acacccagca gcgagcttcc aaaaagaaac ccaaagttgt cttctcaagt 300
gatgagtcca gtgaggaagg tatgatgctc ccgcctgttc ccggccgaga aggcacacag 360
ctagggtgca gagggctggt ttccatagga cctgctgcgg gggcctgagt gtagatgctc 420
tgccccactg ccgcagaagg gcctctcctg tacagcttgg attttatttc ttctgtgcgg 480
tgtgggattg tctcacttgt tctctgat 508
<210> 23
<211> 2650
<212> DNA
<213> Homo sapiens
<400> 23
atctattttt tcaccatctt tgtgactcag ctttttctta ttcctttaat tctttgcata 60
gatctttcag cagagatgac agaagacgag acacccaaga aaacaactcc cattctcaga 120
gcatcggctc gcaggcacag atcctaggaa gtctgttcct gtcctccctg tgcagggtat 180
cctgtagggt gacctggaat tcgaattctg tttcccttgt aaaatatttg tctgtctctt 240
ttttttaaaa aaaaaaaagg ccgggcactg tggctcacgc ctgtaatccc agcactttgc 300
gataccaagg cgggtggata acctgaggta gggagttcga gaccagcctg accaacatgg 360
agaaacccca tctctactaa aaataaaaaa ttagccgggc gtattggcgt gcgcctgtaa 420
tcccagctac tcaagaggct gaggcaggag aatcgcctga acccagaggc ggaggttgta 480
gtgagccgaa atcacaccat tgcactccag cttgggcaac aatagcgaac ctccatctca 540
aattaaaaaa aaaatgccta cacgctcttt aaaatgcaag gctttctctt aaattagcct 600
aactgaactg cgttgagctg cttcaacttt ggaatatatg tttgccaatc tccttgtttt 660
ctaatgaata aatgttttta tatactttta gacatttttt cctaagcttg tctttgtttc 720
atctttcaca ttagcccagt ttcatgcagc agagagaggg ttatcagtgc agagagagat 780
gagtgagccc agagtcctag ggcctgtccc gggatggcag atgagcttcc tgccccgtca 840
ctgccacctt tcccctctca acctctggac cctgcacagt gaccagacag cctctctggg 900
gagaattatg cagtgcctag gctccagatc agtgcttctg aaccgggggc aattttgtct 960
gccagaggac atctgacaac acctggggcc tgttttgttg tcatagccta taggggaaga 1020
atgctaccag catttgtggg aagaggccag ggatgtggct caacatcctg cagtgcacag 1080
gatggcccct caacaaagaa tcacacggcc cacaatgtca atagcgtcac agttgagaaa 1140
acctgctcta gaccaagggt tgctttctgc cgtgtgcctc accccacccc cactcgtgtt 1200
ccctaatccc atctccaaag gttggcagca gaccggccca ggctcgtgga agttcagatc 1260
atgatcccct ccagctctgc aggagacaag acctgtctcc cagcattcct cattgttccc 1320
gggtctgcag agggcgtgag ctatgctgca ggcgggctgc cccctgaagc ctgcgcaccc 1380
ctctccagct cctcaagtct tctctgctga gtcaccttcg aaccggaggc tgtgagctgg 1440
ctgtcgtgac cacactggtg cctctgctgt catgacaaca gcacactacg tcagtagtgc 1500
tccctgggca ctgagctccc tctttgcggg gagaagacag taatgaaaaa tgacaagcat 1560
gaggcagagg ggaagatcac gcttgggtgg tgcaggagca tggaggtgct cttaatgctc 1620
tcaatgagaa agggttaacg gtcctggttg caggaatagc tgagtcagag gtggggcttc 1680
ctccactccc ccaccccacc cctttcacca ttagggacct tcttgccttg ctcttgctac 1740
tctgctctgg gtggtcattg tgaaaagccc gcaccaacca tgccagtggc agccagacga 1800
ggacacagcc tggctctggg tcccagcagg aaaggcaatc ccagaaaggc agggtcaggg 1860
actggagtcc tgtgggtgct ttttaagcaa agattatcac caggcaggct aaacttagca 1920
accggctttt agctagaagg gcagggggct ggtgtcaggt tatgctgggc cagcaaagag 1980
gcccgggatc cccctcccat gcacctgctg atgggccaag gccaccccac cccaccccct 2040
tccttacaag tgttcagcac cctcccatcc cacactcaca aacctggccc tctgccctcc 2100
taccagaaga atggatcccc tgtgggaggg ggcaggggac ctgttcccac cgtgtgccca 2160
agacctcttt tcccactttt tccctcttct tgactcaccc tgccctcaat atcccccggc 2220
gcagccagtg aaagggagtc cctggctcct ggctcgcctg cacgtcccag ggcggggagg 2280
gacttccgcc ctcacgtccc gctcttcgcc ccaggctgga tggaatgaaa ggcacactgt 2340
ctctctccct aggcagcaca gcccacaggt ttccaggagt gcctttgtgg gaggcctctg 2400
ggcccccacc agccatcctg tcctccgcct ggggccccag cccggagaga gccgctggtg 2460
cacacagggc cgggattgtc tgccctaatt atcaggtcca ggctacaggg ctgcaggaca 2520
tcgtgacctt ccgtgcagaa acctccccct ccccctcaag ccgcctcccg agcctccttc 2580
ctctccaggc ccccagtgcc cagtgcccag tgcccagccc aggcctcggt cccagagatg 2640
ccaggagcca 2650
<210> 24
<211> 1963
<212> DNA
<213> Homo sapiens
<400> 24
agcttgagat tgtccaagca ggtagccaga gagcgccatc agccaagaaa ccatccactg 60
gtacgtaagg cagcctgtgc gggcgagacc agactgggcc ctcccctcct gcagtgattt 120
gtttcttctt cttttttaaa tcacgttttc ctgccttttc taggttctag gtaccagcct 180
ctggcttcta cagcctcaga caatgacttt gtcacaccag agccccgccg tactacccgt 240
cggcatccaa acacccagca gcgagcttcc aaaaagaaac ccaaagttgt cttctcaagt 300
gatgagtcca gtgaggaagg tatgatgctc ccgcctgttc ccggccgaga aggcacacag 360
ctagggtgca gagggctggt ttccatagga cctgctgcgg gggcctgagt gtagatgctc 420
tgccccactg ccgcagaagg gcctctcctg tacagcttgg attttatttc ttctgtgcgg 480
tgtgggattg tctcacttgt tctctgatat ctattttttc accatctttg tgactcagct 540
ttttcttatt cctttaattc tttgcataga tctttcagca gagatgacag aagacgagac 600
acccaagaaa acaactccca ttctcagagc atcggctcgc aggcacagat cctaggaagt 660
ctgttcctgt cctccctgtg cagggtatcc tgtagggtga cctggaattc gaattctgtt 720
tcccttgtaa aatatttgtc tgtctctttt ttttaaaaaa aaaaaaggcc gggcactgtg 780
gctcacgcct gtaatcccag cactttgcga taccaaggcg ggtggataac ctgaggtagg 840
gagttcgaga ccagcctgac caacatggag aaaccccatc tctactaaaa ataaaaaatt 900
agccgggcgt attggcgtgc gcctgtaatc ccagctactc aagaggctga ggcaggagaa 960
tcgcctgaac ccagaggcgg aggttgtagt gagccgaaat cacaccattg cactccagct 1020
tgggcaacaa tagcgaacct ccatctcaaa ttaaaaaaaa aatgcctaca cgctctttaa 1080
aatgcaaggc tttctcttaa attagcctaa ctgaactgcg ttgagctgct tcaactttgg 1140
aatatatgtt tgccaatctc cttgttttct aatgaataaa tgtttttata tacttttaga 1200
cattttttcc taagcttgtc tttgtttcat ctttcacatt agcccagttt catgcagcag 1260
agagagggtt atcagtgcag agagagatga gtgagcccag agtcctaggg cctgtcccgg 1320
gatggcagat gagcttcctg ccccgtcact gccacctttc ccctctcaac ctctggaccc 1380
tgcacagtga ccagacagcc tctctgggga gaattatgca gtgcctaggc tccagatcag 1440
tgcttctgaa ccgggggcaa ttttgtctgc cagaggacat ctgacaacac ctggggcctg 1500
ttttgttgtc atagcctata ggggaagaat gctaccagca tttgtgggaa gaggccaggg 1560
atgtggctca acatcctgca gtgcacagga tggcccctca acaaagaatc acacggccca 1620
caatgtcaat agcgtcacag ttgagaaaac ctgctctaga ccaagggttg ctttctgccg 1680
tgtgcctcac cccaccccca ctcgtgttcc ctaatcccat ctccaaaggt tggcagcaga 1740
ccggcccagg ctcgtggaag ttcagatcat gatcccctcc agctctgcag gagacaagac 1800
ctgtctccca gcattcctca ttgttcccgg gtctgcagag ggcgtgagct atgctgcagg 1860
cgggctgccc cctgaagcct gcgcacccct ctccagctcc tcaagtcttc tctgctgagt 1920
caccttcgaa ccggaggctg tgagctggct gtcgtgacca cac 1963
<210> 25
<211> 1195
<212> DNA
<213> Homo sapiens
<400> 25
tggtgcctct gctgtcatga caacagcaca ctacgtcagt agtgctccct gggcactgag 60
ctccctcttt gcggggagaa gacagtaatg aaaaatgaca agcatgaggc agaggggaag 120
atcacgcttg ggtggtgcag gagcatggag gtgctcttaa tgctctcaat gagaaagggt 180
taacggtcct ggttgcagga atagctgagt cagaggtggg gcttcctcca ctcccccacc 240
ccaccccttt caccattagg gaccttcttg ccttgctctt gctactctgc tctgggtggt 300
cattgtgaaa agcccgcacc aaccatgcca gtggcagcca gacgaggaca cagcctggct 360
ctgggtccca gcaggaaagg caatcccaga aaggcagggt cagggactgg agtcctgtgg 420
gtgcttttta agcaaagatt atcaccaggc aggctaaact tagcaaccgg cttttagcta 480
gaagggcagg gggctggtgt caggttatgc tgggccagca aagaggcccg ggatccccct 540
cccatgcacc tgctgatggg ccaaggccac cccaccccac ccccttcctt acaagtgttc 600
agcaccctcc catcccacac tcacaaacct ggccctctgc cctcctacca gaagaatgga 660
tcccctgtgg gagggggcag gggacctgtt cccaccgtgt gcccaagacc tcttttccca 720
ctttttccct cttcttgact caccctgccc tcaatatccc ccggcgcagc cagtgaaagg 780
gagtccctgg ctcctggctc gcctgcacgt cccagggcgg ggagggactt ccgccctcac 840
gtcccgctct tcgccccagg ctggatggaa tgaaaggcac actgtctctc tccctaggca 900
gcacagccca caggtttcca ggagtgcctt tgtgggaggc ctctgggccc ccaccagcca 960
tcctgtcctc cgcctggggc cccagcccgg agagagccgc tggtgcacac agggccggga 1020
ttgtctgccc taattatcag gtccaggcta cagggctgca ggacatcgtg accttccgtg 1080
cagaaacctc cccctccccc tcaagccgcc tcccgagcct ccttcctctc caggccccca 1140
gtgcccagtg cccagtgccc agcccaggcc tcggtcccag agatgccagg agcca 1195
<210> 26
<211> 256
<212> DNA
<213> Homo sapiens
<400> 26
cctctgggcc cccaccagcc atcctgtcct ccgcctgggg ccccagcccg gagagagccg 60
ctggtgcaca cagggccggg attgtctgcc ctaattatca ggtccaggct acagggctgc 120
aggacatcgt gaccttccgt gcagaaacct ccccctcccc ctcaagccgc ctcccgagcc 180
tccttcctct ccaggccccc agtgcccagt gcccagtgcc cagcccaggc ctcggtccca 240
gagatgccag gagcca 256
<210> 27
<211> 1941
<212> DNA
<213> Homo sapiens
<400> 27
agcttgagat tgtccaagca ggtagccaga gagcgccatc agccaagaaa ccatccactg 60
gtacgtaagg cagcctgtgc gggcgagacc agactgggcc ctcccctcct gcagtgattt 120
gtttcttctt cttttttaaa tcacgttttc ctgccttttc taggttctag gtaccagcct 180
ctggcttcta cagcctcaga caatgacttt gtcacaccag agccccgccg tactacccgt 240
cggcatccaa acacccagca gcgagcttcc aaaaagaaac ccaaagttgt cttctcaagt 300
gatgagtcca gtgaggaagg tatgatgctc ccgcctgttc ccggccgaga aggcacacag 360
ctagggtgca gagggctggt ttccatagga cctgctgcgg gggcctgagt gtagatgctc 420
tgccccactg ccgcagaagg gcctctcctg tacagcttgg attttatttc ttctgtgcgg 480
tgtgggattg tctcacttgt tctctgatat ctattttttc accatctttg tgactcagct 540
ttttcttatt cctttaattc tttgcataga tctttcagca gagatgacag aagacgagac 600
acccaagaaa acaactccca ttctcagagc atcggctcgc aggcacagat cctaggaagt 660
ctgttcctgt cctccctgtg cagggtatcc tgtagggtga cctggaattc gaaccggagg 720
ctgtgagctg gctgtcgtga ccacactggt gcctctgctg tcatgacaac agcacactac 780
gtcagtagtg ctccctgggc actgagctcc ctctttgcgg ggagaagaca gtaatgaaaa 840
atgacaagca tgaggcagag gggaagatca cgcttgggtg gtgcaggagc atggaggtgc 900
tcttaatgct ctcaatgaga aagggttaac ggtcctggtt gcaggaatag ctgagtcaga 960
ggtggggctt cctccactcc cccaccccac ccctttcacc attagggacc ttcttgcctt 1020
gctcttgcta ctctgctctg ggtggtcatt gtgaaaagcc cgcaccaacc atgccagtgg 1080
cagccagacg aggacacagc ctggctctgg gtcccagcag gaaaggcaat cccagaaagg 1140
cagggtcagg gactggagtc ctgtgggtgc tttttaagca aagattatca ccaggcaggc 1200
taaacttagc aaccggcttt tagctagaag ggcagggggc tggtgtcagg ttatgctggg 1260
ccagcaaaga ggcccgggat ccccctccca tgcacctgct gatgggccaa ggccacccca 1320
ccccaccccc ttccttacaa gtgttcagca ccctcccatc ccacactcac aaacctggcc 1380
ctctgccctc ctaccagaag aatggatccc ctgtgggagg gggcagggga cctgttccca 1440
ccgtgtgccc aagacctctt ttcccacttt ttccctcttc ttgactcacc ctgccctcaa 1500
tatcccccgg cgcagccagt gaaagggagt ccctggctcc tggctcgcct gcacgtccca 1560
gggcggggag ggacttccgc cctcacgtcc cgctcttcgc cccaggctgg atggaatgaa 1620
aggcacactg tctctctccc taggcagcac agcccacagg tttccaggag tgcctttgtg 1680
ggaggcctct gggcccccac cagccatcct gtcctccgcc tggggcccca gcccggagag 1740
agccgctggt gcacacaggg ccgggattgt ctgccctaat tatcaggtcc aggctacagg 1800
gctgcaggac atcgtgacct tccgtgcaga aacctccccc tccccctcaa gccgcctccc 1860
gagcctcctt cctctccagg cccccagtgc ccagtgccca gtgcccagcc caggcctcgg 1920
tcccagagat gccaggagcc a 1941
<210> 28
<211> 1433
<212> DNA
<213> Homo sapiens
<400> 28
atctattttt tcaccatctt tgtgactcag ctttttctta ttcctttaat tctttgcata 60
gatctttcag cagagatgac agaagacgag acacccaaga aaacaactcc cattctcaga 120
gcatcggctc gcaggcacag atcctaggaa gtctgttcct gtcctccctg tgcagggtat 180
cctgtagggt gacctggaat tcgaaccgga ggctgtgagc tggctgtcgt gaccacactg 240
gtgcctctgc tgtcatgaca acagcacact acgtcagtag tgctccctgg gcactgagct 300
ccctctttgc ggggagaaga cagtaatgaa aaatgacaag catgaggcag aggggaagat 360
cacgcttggg tggtgcagga gcatggaggt gctcttaatg ctctcaatga gaaagggtta 420
acggtcctgg ttgcaggaat agctgagtca gaggtggggc ttcctccact cccccacccc 480
acccctttca ccattaggga ccttcttgcc ttgctcttgc tactctgctc tgggtggtca 540
ttgtgaaaag cccgcaccaa ccatgccagt ggcagccaga cgaggacaca gcctggctct 600
gggtcccagc aggaaaggca atcccagaaa ggcagggtca gggactggag tcctgtgggt 660
gctttttaag caaagattat caccaggcag gctaaactta gcaaccggct tttagctaga 720
agggcagggg gctggtgtca ggttatgctg ggccagcaaa gaggcccggg atccccctcc 780
catgcacctg ctgatgggcc aaggccaccc caccccaccc ccttccttac aagtgttcag 840
caccctccca tcccacactc acaaacctgg ccctctgccc tcctaccaga agaatggatc 900
ccctgtggga gggggcaggg gacctgttcc caccgtgtgc ccaagacctc ttttcccact 960
ttttccctct tcttgactca ccctgccctc aatatccccc ggcgcagcca gtgaaaggga 1020
gtccctggct cctggctcgc ctgcacgtcc cagggcgggg agggacttcc gccctcacgt 1080
cccgctcttc gccccaggct ggatggaatg aaaggcacac tgtctctctc cctaggcagc 1140
acagcccaca ggtttccagg agtgcctttg tgggaggcct ctgggccccc accagccatc 1200
ctgtcctccg cctggggccc cagcccggag agagccgctg gtgcacacag ggccgggatt 1260
gtctgcccta attatcaggt ccaggctaca gggctgcagg acatcgtgac cttccgtgca 1320
gaaacctccc cctccccctc aagccgcctc ccgagcctcc ttcctctcca ggcccccagt 1380
gcccagtgcc cagtgcccag cccaggcctc ggtcccagag atgccaggag cca 1433
<210> 29
<211> 17130
<212> DNA
<213> Cricetulus griseus
<400> 29
gtgagtggtg cagggtgact ggccctattg ggttcctgtt cagtgaacac agtctgttct 60
tcgagtgctg tgggactctt aacttactgc cgtgctggcc tcactacagc catttaacta 120
gagtgacttg agatcacttt ctatgtccac ttcccggtcc taaaaaaaaa atttattttg 180
tatacattag tattttgcct gtgtgtatgt ccatgtgaag gtgccagatc tggaacttga 240
gttacaggca gttgtgagct gccacatggg tgctgggaac tgaacccagg tcttctgcag 300
gagcagcaag tgccatctct ctagccccca gtaaaagccg atttctagtt gagacatggt 360
ctttctgtgt agctctagct ggcttagaat ttgctaccta gaccaggctg gccccaaatt 420
cagattcccc tgcctctgcc tctcatgtgc tggtaggaaa ggcgtgagtc acatgcttgg 480
cactagacta gctttgtgtt tagagcaaaa ctaagtaagt agagttcccg tttgtccctg 540
tcctctgccc catcatcttc atacccttgg gtactgtgat cttacaatct acagtgacct 600
ggatgaatga gtgtgagtga caatgaatga cagagcagta cccagagtcc acagttcaca 660
ctgatactgg gttcactgta cagtggcaca tacttgtcac cacagtgtca tactggacat 720
tttcatgacc ctaaggccac atcacccctg tggtgtcact cagttgtaat ttcaccctat 780
atagtgattt caggttggct ttttacttag aatataacat ttaaattatg tttctttttt 840
ggttttgagt tttgtttttc gagacagggt ttctctgtat tgctttggag gttgtgctgg 900
aacttgctct ggagaccagg ctggcttcga actcacagag atcctcccac ctctgcctcc 960
cgagtgctgg gattaaaggc gtgcgccacc aatgccccag catctttctg tttctctgtt 1020
tttaaagagg gagataatgt ttccagtgct gtttttaact tttttcctgt aggctaccat 1080
agatgaattt gagcagaagc ttcgggcatg tcataccaga ggcatggatg gaatagagga 1140
gcttgaaact ggccaagaag gcagccagca agccctgtct gccaagaaac cctctgctgg 1200
tatgagagac aagcccacac ggactcccca caaatcatcc ctgtcattta ttggtttttg 1260
tttttaaaat cacatctccc tgccatttct agtctcaagg cgacagcctc tgacttctat 1320
agattcagac aatgactttg tcacacctaa gcctcgacgc accaaccgtc atcgtccaaa 1380
cactcagcaa cgaaagtcca agaagaaagc caaagttgtc ttttcaagtg atgagtccag 1440
tgaggatggt atgactcgcc ctcccggcag ctgcttgctt gccttggggt ctccttgggg 1500
cttgcctggt tgtagagtca ttcttcctgg taatgtgttc cccactgtgc acgttggctc 1560
acctttgcag ctctatgttt taagatccac tttacaccat ctttgtgact cagcttttgt 1620
tcctataatt ctttgaacag aactttcagc ggaaatgacg gaagaagaga ctcccaagag 1680
aaccaccccc atccgcagat catctgcccg aagacacagg tcttaggagt tgcctcacct 1740
attcccatcc ctgctgtgca gggtatctta attgattttt aattcatttc ctcccttgta 1800
aaaatgttgc ctccttgttt ttaatatgta aatggtcttt gcattcaagg cctttctcct 1860
agagcccatc tgactgctgc tttcactttc caacaaacac ttaaccaatc accatgtttt 1920
ctaagaataa atgtttttat atacttttat tctttgctgg tctgtttcat cttccacctt 1980
agcccagatt caggcagcaa tagagggtta tcaaaccaga gagaagatac accagcccag 2040
gcatcctgag gctgtctctg ggtcttcatg tttcctcatt gattcatctt gcacaactga 2100
tgagactcca ctgtagagaa ttctcacttc tcagcctggg ggtactttct acccagagac 2160
ctatttctgt catagccttt tgggacacat aaagcttcct tcctgcatag aacaccccac 2220
aacagtgtat caggagtgta caagttgaca aacaatgctc tagacctacg gttttcttcc 2280
tctgtgtgcc tcatcccaga agagatcatg actcccagga gtcagccttt actatggggt 2340
ctgcaggggc gtccagcccc tcagcggcaa gccatgccca ccctccccaa gtccttaatc 2400
tgctgagtca cttggaacag gagacactga ttctgctgtc atgacaacag cacattgcca 2460
tagaaatgct ccctacctct tacgtgtgtg gtgggggaac agtaatgaca aaccataggc 2520
aggaggcaaa agggaagacg gcacctcaga aacatgtgtt aggttagggc agaactatgg 2580
aggggctcct gagactcttt gatgggaaag ggttaatgct gctcctgaaa cctctgttgg 2640
aaggcagaaa agggacaggg ctgagtcccc gcactgggac catttccatc ctctgcatcc 2700
tgcccccggc tcatggaaag cctgggcatg ggccacacag ctgtcagtct tggctctggg 2760
gccccaagga ggtagggcaa tcccagaatg gcaaggagcc aggactggat ttggggtgca 2820
gcccagcctg ctccctgcct tttaagcaaa ggttatcacc aggccagcta aacttagcaa 2880
ttaggctctt cagctaaaag agcagggggc tggtctcaag ttgcactgac ctagcaaaga 2940
ggccccagga tccccctgcc cagcacctgt ggctgagctc ccaagccctt cccgagagct 3000
caggatccac cctttccacc ctccctactc ttcagaggag gaaccccctt tctccttccc 3060
acttgttgga gggggctggg gccaggctgt tctggcttgg ggtataatac cccctacccc 3120
ttctactttc ccctcctctc agacctcacc ctgcctccac gagggcagcc aagaaaggag 3180
agtccctggc tgcagggcca gtaggcacgt cccaggacgg ggagggactt ccgccctcac 3240
gtccagctct ccgccctggg gctgcagtgg gtgaaagggg cagtgtctcc tagcctgggc 3300
ggtgcaaccc tcaggttccg aggaggaacg ctctgggagg cttctttgcc tcctccaacc 3360
caacccacaa ccaggacatt gtcctcaccc cggggcccca acctagacct taactgagga 3420
acacagaggc cagtttgtaa gtctcaatta tgcagggcat cccgacctgt ggcgtaggga 3480
gcgcccctcc aggccgcttc cctagcctcc tcctggccct cacagcccag gcctctggcc 3540
caagaaatgg aagtgggggt gggggatgga actgcgaatg cgaagggccc ccgcaggagg 3600
caaagtgacc cctcccgggc cttttctgct ccgagacttg tttttgcctg tgtcactacc 3660
gaagaaccac gagaagatcc tcaacttttc cacagccttt gcataaaggg gagagggtcg 3720
gcggtgcagc tgtggcacac acgcacttct gctcaacccg cccccccccg cccccgttcc 3780
tgttccttcc caggttctcc ccattttatc ggggcggcaa cttttaggtc cctgggtcct 3840
ggaagtcctt agtacacact cttcgtcctt aagtccatag tctgtattcc ctcggtccta 3900
tcctgtcccc catcaccggg tcacctcccc agcgaagcaa tctcagttcc cctccccctc 3960
tcagccccga gcccacacgt ttggtgcgtg cacatttcaa aaacgaggcg ggtccaaaga 4020
gagggggtgg ggaggtgccg agtggcccag ctactcgcgg ctttacgggt gcacgtagct 4080
caggcctcag cgcccttgag ctgtgactgg atggatgagc ggggcgggag gcggggcgag 4140
cgtcctcggc gctccccacc accccagttc ctataaatac ggactgcagc cctccccggt 4200
gctctctgct cctccctgtt ctagagacag ccgcatcttt ccgtgcagtg ccaggtgaaa 4260
accgcagagt gggccgcagg tggccgggga cggtcggaaa cggggaaggg gggcgctcag 4320
cccgggactg cgggcgctgg ggcgagctcc actgcccgag cccgggctcc gcattgcaga 4380
ggctggaggg ggaagggatg gggggcgcgg cggggggcac gctgacctct ctttcttctc 4440
tctccctccg cagcctcgct ccggagacgc aatggtgaag gtcggcgtga acgggtgagt 4500
tcgtggctgg gctagggtgg ggctccgggt cccgctccgt cgcgtatgca ggtctacccc 4560
accccggggc tctgcgggag cgtggggtgg ccggtgggtg gccgcagcac ccaaggagac 4620
ctcaaggtca gcgagccacc tcctcccttg cggggatgag cagcgcggag tccnnnnnnn 4680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnaggtcggt 4920
ggcaccgggc cgtgcggtgc ccgctttagc gcatccatca tctcccaagg gcttccttta 4980
gggtggctgg ccgccgccat gttgcaaacg ggaaggaaat gaatgaacca ccgttaggaa 5040
acctcccttc ggccttcctc cttcctagcc cgtgactaac ctccccactc cctccccggg 5100
tggagtcgcc tctgtactgt aagccaggtg atgcaaggct tccgtgctct cgagagagct 5160
ctacctcgcc agctgtctca tattattagc ctcaaagcag ccctcaagcc tcatttacct 5220
tgagcatatg atatattttg tagattctct gagaatcgaa gcggacttgg agaggtctgc 5280
ttgtccttct cccagcccaa aggtggtagc tatggcgtag cgccggaggg gggagtgggg 5340
ggggagctga gtcatggtgg ttctgaaaag aaaatttcca ccacaaaatg gctccggtgc 5400
tagcatcccc ttccccccat aacctctgct tcccatcaca ccctgaccca aaccctgtag 5460
gccagactgt aaaggtcact aagaggattg agtgtctgag cctcggaacc ctgcccttct 5520
ccccatccca tcctctggaa accagatctc ccccgctcca ccctaatctg aggttatatt 5580
tagccggctg acctttcagt atttggggtc tgggccccta cacacatctg ttgctcctgc 5640
tcctgatttt tagctagcaa attcaagtgc tttgcaaatt agagcccagg gattaggggt 5700
tggaaagctc agtggttttc tcagtctttc cctttagggg gagggacttg gaggaagcag 5760
gtgggccgac ccctgtccta ctcattctga cctttaacct tgccctttga gcttgatgat 5820
gctgagtgca cgagttcttc ctgtccaggg ggtgtagcct gaagccaggc caggctagaa 5880
caaacttccc agggggtggg ggtagtgaat gccttgtgcc cacacagggg cacactgcca 5940
cctcttggag acttgaaatg actggtgggg gggttggaca aggctttgag cccaatcacc 6000
tcttggacag gaaagtaacc cccactttat ggccctgctg taaaagccca gtcaaacctc 6060
atttgtccaa ggaagataga cctcttgggg cttcctaagg ataggggtgt tctatatttg 6120
ggccctgctt ctaagcattc agccagcttt attaaaggaa attcataaca aaacttgaat 6180
ttcctgcttc ttaaatacta atagtgtgct ggatctccat taaaaatgct gtcttgcaca 6240
gtaggctatg gtttctgtgg gctctctaca gctatgggac aactggattc tgttttctga 6300
agggcatgtg tcagctcagt actgactata gacctatgag ttctctgacc ccctaactca 6360
cctttttttt tcttgcctca gatttggccg tattggacgc ctggttacca gggctgcctt 6420
cacttctggc aaagtggaag ttgttgccat caatgacccc ttcattgacc tcaactacat 6480
ggtctacatg ttccagtatg actctaccca tggcaagttc aaaggcacag tcaaggctga 6540
gaatggaaag cttgtcatca acgggaaggc catcaccatc ttccaggagc gagatcccgc 6600
caacatcaaa tggggtgatg ctggcgccga gtatgttgtg gaatctactg gcgtcttcac 6660
caccatggag aaggctgggg cccacttgaa gggcggggcc aagagggtca tcatctccgc 6720
cccttctgct gatgccccca tgtttgtgat gggtgtgaac caagacaagt atgacaactc 6780
cctcaagatt gtcaggtgag gatggcagag ggctgtggca aagtgggcaa gcaggggcaa 6840
ggttacaggt gggcgagcct cctaacctgt ctcttctctt cagcaatgcg tcctgcacca 6900
ccaactgctt agcccccctg gccaaggtca tccatgacaa ctttggcatt gtggaaggac 6960
tcatggtatg tagttcatct gtttcatcct gccagcagtg ggcgctgtgg tgggggccct 7020
gcaagacctc actccctgcc tctgtgtctt tcagaccacg gtccatgcca tcactgccac 7080
ccagaagact gtggatggcc cctccgggaa gctgtggcgt gatggccgtg gggctgccca 7140
gaacatcacc cctgcatcca ctggcgctgc caaggctgtg ggcaaagtca gcccagagct 7200
gaacgggaag ctgactggca tggccttccg tgttcctacc cccaacgtgt ccgttgtgga 7260
tctgacatgt cgcctggaga aacctgtatg tctggggtgg gctgagggtt gtctctagtg 7320
gtgaggttgg ggcttgagta gtcaccttga tttttgccct taataggcca agtatgagga 7380
catcaagaag gtggtgaagc aggcatctga gggcccactg aagggcatcc tgggctacac 7440
cgaggaccag gttgtctcct gcgacttcaa cagtgactcc cactcttcca cctttgatgc 7500
tggggctggc attgctctca atgacaactt tgtaaagctc atttcctggt atgtgggatc 7560
agaaacagtc ttttaaaagt aacttggggt ttgtcacccc ttggtgtcta actcaaaaag 7620
taaacccttc ctaactgccc tcccaatgtg ttctaggtat gacaatgaat ttggctacag 7680
caacagagtg gtggacctca tggcctacat ggcctccaag gagtaagaag cccaccctgg 7740
accatccacc ccagcaagga ctcgagcaag agggaggccc tggctgctga gcagtccctg 7800
tccaataacc cccacaccga tcatctccct cacagtgtcc atcccagacc cccagaataa 7860
ggaggggctt agggagccct actctcttga ataccatcaa taaagttcac tgcacccatc 7920
ttccttggcc tttcaatgta aggttggggg agggaggctg tgacctagca aggttgggaa 7980
tcctctgtgt cacttttcaa acagggcact agccacatgc cagcccaggt ttcctgtcct 8040
gaacagatga aaattcacct aaggtgtctt ggtgctggga ggagtggggg ttgacaatgg 8100
gaccagtagt atggtcttag aggcttgggc tggactgcat caagttccag ggctgtgtgt 8160
gtgttatctg caaacaaagg tcaattgtgt ctggaggcct taggtaaaat tggaaggatg 8220
cccaacatag taaaaatgta tcagccaggg gaagtgacta cactgtatct aacctgaaac 8280
agctgagctg taagccagca gctgtcacta tgttcaggtg tggtccgctg gttctggggt 8340
ggtcacttgt atccagtttg ttaggaagtg ttgtcattgc ttgttaggaa gacaacacat 8400
ctcaggctgg gcagtggtag tgcgtgcctc taatgccagc attcccagca cggaagtggc 8460
agaggcagga ggacagcctg gaataacaac ccagggcaga gcccccatct cggaaaagac 8520
aaaaaccaga aagtgcttaa aacattgaca caaaggtgct caaatattcc ttcattgctt 8580
ttagagattc cactgtcagc ttggcatggc ctctagtgag acatcctgac ttggtcccct 8640
gctttccaag gtcaggagaa tgatagccac agaacgttcc ctcagctgat ggctggagaa 8700
ccggggtccc tgagccccca ccctcacacc catgtgcagg agggagcttc acctttccct 8760
ccgagcagtg tctgccttca ggacaccgct ctcagcccag acactgagtc ttctttgtgt 8820
gcatttcccc ggggaaaagc tacacattcc ctgtacagca ggcaggaggg cagctgtgag 8880
ctcatggaca cgggacagaa ggccaggtac cctgcctccc tgcggtaccc cgcctccctt 8940
cgaggcctta ctaggaagca aagccttctc caggtgtacg tgatgcggaa agtctgcaga 9000
aagtcgggga ctcccagatg agtctgctgc acagtgcctg ggccagttag caccagaaca 9060
aaagtccaag atagccaagg agaacaggca ggtcccacaa tcacattcct tacaaacgga 9120
gaagggagga tcacaagtgt tctggcagcg tttcaaagat agagaagtag caaacagtca 9180
gagtgaagaa ggcaggagtg tcccaatgtc atggggatat ccaggaaggg tggggccaag 9240
cctagctcca gacacccagg gagcccgggc gaggagacag ccccagggcc aggcttcatg 9300
cagtggcaca aaagaccccc accccggcct cggtgagctc cagggagcca ggcactggtc 9360
cctatctcat ggagctatca gatgagacat ggcaatcgga gtcctcagtt tcgcttggcg 9420
ctggcggcgg gtcgctaagc gggaccgcag tgaaagcagg agactttcta gaaaaaaaca 9480
ccagatgtca ccttggggca agcaggaagc ccaagcaggc ctgcatgctc gctctccttt 9540
ccatggcctt atcttctggg gtgcagctgg atgccaggca gggaagtggg tgggaagact 9600
tgtccccatt cacctctatg aggaacagtt cccctcttgg aggctctgag aggctcagag 9660
atcaaaaatg tctcaagtca cagcatggag atgcttcctg agcccacagt gtgctgacac 9720
cagggccagc ttcttgtcca gctgtaaagg gggtggggct gtctcactat gttcccaagg 9780
ctgaccccca acacttggta caaagcaatc ctcttgctcc agagtagctg ggatgacaag 9840
caaaggccac taaacctagt gaacatgctg cacactgtgc ctagcttaat gtaattgggg 9900
gagtgggttg gggttttgtt ttgagacagg gtctcagtat gcattcctgg ctggcctgga 9960
attcacagag gagagaccgg cctggtactt gtggcaatct gtagggagac accgtaacca 10020
cgcctcctaa gagctggctc atcagggtgt ggtcaaggtg atgtcagggt gacatgggag 10080
aggtgtaaag ggataaggaa cgcacatggt agctcttttc cctgctgctt tggcttgctc 10140
tgctttcctg ccggttggct acctaataaa tatatcctga ccatcacggg ctatgtatta 10200
gtaattaatc ctaatagccg gtgtctccct acaacaatcc acctgcctgt gacacctatg 10260
tgcttggatg acagatgtac accaccacac ctggcttact gtggttcctt agattttacc 10320
tgttgttgct ggttgtttta ttttaagaca agtttttgct attgtagtcc aggatagcct 10380
caaactcacg gcagtctttt gcttcagcct cccaaggctg ggcttgcaga catgtaccat 10440
catgcctggg ttacacattt ttaatatata atttattttt attctgtgtt aattggtatt 10500
tgcctgcata tatgtctgtg taaaggtatc agaagccctg gaactggagt tacagacact 10560
cgtgtgggtg ctgggaattg aacccaggcc ctctggaaga gcatccagtg ttcttaacta 10620
atgagccatc tctcagcccc caggtttttt tttttttttt tttactctgt gtgtatgtgt 10680
gtgtgtgcac acgcacgcgc atgctcgaac atacaccagc acacagggtc tcacacaggc 10740
tagacaagta ctctaccact gagctatatt ccccaaaccc aaatttactc ttacacaagg 10800
tcaaatactt aaatcatgac ttagactttg gataaaaacc tgcccctgta tctcttcatt 10860
cctagccagg tttcggctct cagacactgg ggcactggta ggagtcgtct gaccaccagg 10920
gcagggagag gaagctatca atctgggcca cacctatagg tgactccaaa ggacagctcc 10980
acttgcagat gtgacctggt caccggccac tgggctggga cgagggccaa tcagagcagg 11040
tccttaccgg tcccccgact gcgtgatcag ggcaggtcct taccggtccc ccgactgtgt 11100
gatgaggcgg cggcaggtct ccatctgcac gtccaagccc cgtttcatgc tgcacatctc 11160
catgtactcg tgcaggtggc ggttcatgtc attcttggct gtggccagct ccagctgcag 11220
aaaagtaggg cagggcagga tgaggaggtt agcaagccca aggcagacag gggattagag 11280
cccagctggg ccccggaggc caggcagcca tggttaaaag ctcggccttc aaaagaaagc 11340
aagcagnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13080
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13140
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13920
nnnnnnnnnn nnnnnnnnac acacacacac acacacacac acacacttac ttcctgagga 13980
agactgcagg gaacaaggct agatagaacc cattattcca ggagacaaaa gtgaagcaaa 14040
aatggtctct taaagcacaa agcagcacta ccaacagtgg tctcttccag cctatatatc 14100
accctagttt acacattgaa gggaaagatg tacattctag aacattttca acaagtcagc 14160
ccccaaattc cagactcagc atgggagatc agagcagtag aggtagatgg aggagataga 14220
ggggccaggg ccatggagga aaactcccac ctgtcatcag ctttaccatc caataatggg 14280
cagctctacc tcagtaacac tgagagatta agggccatac agacaaaagg aacttttgcc 14340
acaaagctac caagtgaact ttctttacct ttctcctcaa gtcattcttc caggaaggac 14400
agaagtcaca caacttagaa acaactttcc atccatgtgc agtatacata tttttatgtg 14460
tgtggataca gatgtgcatg tgtgtggtta catggggaag cctgatgtcg atgcagggaa 14520
tcttcctagg tggttcttat actctgagtc tgtgtaacgg cattggttgt cctggaactt 14580
gatctgtaga ccagactggc ctcaaactca cagagatcta cctgtctctg cctcccgaat 14640
gctgggatta aaagcgtgtg cctcagccgg acgttggtgg cgcatgcctt taatcccagc 14700
actcgggagg cagaggcagg aggatctctg tgagttctag accagcctgg tctacannnn 14760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ctagttccag 14880
ggcagcctcc aaagccacag agaaaccctg tctcaaaaaa caaaacaaaa ataaataaat 14940
aaataaataa aatcctgcgc ctccactgcc cggctcagaa tatttttaaa gacaaggatt 15000
atgtagccca ggctggcctc aaacttgtta tgtagctaag atgatggtgg cctctgatcc 15060
tcctgcctct acctcccaag tgttaggact ataggctggc actaccacac ccggtttcat 15120
gtgggctagg atcacactca ggcagggctt catgcacatt gggcaggcat tctaccaact 15180
gagttacaca gtcccagccc aggatgtctc accagatcac ggttacagct aggcacctgt 15240
ggtctgaggt ttgcaccaca tggcagcccc agtcactgag ctaaggtgaa actcatactt 15300
gactaaaggc acggaatctg aaaggggtgg gtacaaccca ggaggaaaat cggcggaagc 15360
aataagaggc gtcaacaggc aatggtcact tttccccaga caagtctcag ctggaagcag 15420
cacacgggct gggtatctga aactcagaag tttcctgggt taaaaacaaa agccctggtt 15480
tttcttagga tagtatgttc atttgatgtg tgctgggaca ctgagaacac aggaaaataa 15540
cttccaaagt ttgttctcaa aatgcagaca gggtgaacct ttacagggct tgcagggagg 15600
ctgatacaag aggtctcctg cctcattcac ccatcagagt ccaagacaca gtcctcacac 15660
agccccaccc aaccaactgt cctccgacgg tgacctcctc cctacaaacc tgcctgcagc 15720
ccagaaggac agtcagagcc ccagctccat agccatttgt aaaggactcc ccaggctcaa 15780
aaacaaaagg gagactcctc caggagctca caggctgagc caaggaggca ggagtgctcc 15840
ggcacttagg gtgtccgggt gataatgcac aatatgtatg atgtgtcaac ctgccagatc 15900
ctgtcctaag cgccacgtgt ctatctgatc atcctaataa cccagcctgc ggggagagac 15960
atgcacatct ccttctgaca aataaagagg caggcccaag cttagcatgg cagtacacat 16020
ctgtaaccca gcactcaaca ggcagagcag gaggattgac tgcctcctat tccaggccag 16080
tttggctaca cagaaagacc ctgtactgat gctaagagag atggctcaga gttaagagca 16140
cttcctgctc ctggagagga cccaggtttg ctttccagca cccatgtcag gctcacagtc 16200
gcctgtgaac accagctcca ggggatctga tgccctcttc tggcctccag gggcacgcgc 16260
gtgtgcgctc acacacacac acacacacac acacacacac acacacacac acacacacac 16320
acagagtgca aagctgaagt gcagctcaca cccataatcc tagcaaatgg agacaaaagg 16380
accaggagtt cgaggccaac ctagactaca agacaagtac ttgtaaataa atacatatat 16440
acgaaaataa acaaaccaaa aataatgaaa caggcactca gatcaaggga gccagtattg 16500
gtggcacacg cctttaatcc cagcactcag gaggcagagg caggtggatc tctgagtttg 16560
aggccagcct agtctacaga atgagatcca ggactacaca gagaaaccct gtctcaccct 16620
cctctcccct aaaaaaaatt aagaaagaaa agaaagagcc aggggctggt aagcaatgga 16680
tcagcaggta aaggcacaag ccaccaagcc caacaaccta aatttgatcc ctgggaccta 16740
catggtagaa ggagagaact cactgcaagc tgtcctctga cctccacaca cacaccatgg 16800
caggcacatg ctctccccgc cacatacata catacataca tacatacata catacataca 16860
tacatacatg taaacagaaa agaaagtagg aagacaaaag gttcattcta agtggtgaca 16920
gagccaagat ttgaacccac atctatctgc gtctagatcc tgaggtctca agggcccatt 16980
agagctacca aaactggggt ggggtgcact cctcctgtca acaggtggaa ggtcctggtc 17040
ttgggctctg gctgggagga ggccagccag cagcacacct ccagcctggt ttgtgagccc 17100
tgggaacaga gcccctgcca aaccccttac 17130
<210> 30
<211> 3020
<212> DNA
<213> Artificial Sequence
<220>
<223> amplicon
<400> 30
tacggccggc ttcactgtac agtggcacat acttgtcacc acagtgtcat actggacatt 60
ttcatgaccc taaggccaca tcacccctgt ggtgtcactc agttgtaatt tcaccctata 120
tagtgatttc aggttggctt tttacttaga atataacatt taaattatgt ttcttttttg 180
gttttgagtt ttgtttttcg agacagggtt tctctgtatt gctttggagg ttgtgctgga 240
acttgctctg gagaccaggc tggcttcgaa ctcacagaga tcctcccacc tctgcctccc 300
gagtgctggg attaaaggcg tgcgccacca atgccccagc atctttctgt ttctctgttt 360
ttaaagaggg agataatgtt tccagtgctg tttttaactt ttttcctgta ggctaccata 420
gatgaatttg agcagaagct tcgggcatgt cataccagag gcatggatgg aatagaggag 480
cttgaaactg gccaagaagg cagccagcaa gccctgtctg ccaagaaacc ctctgctggt 540
atgagagaca agcccacacg gactccccac aaatcatccc tgtcatttat tggtttttgt 600
ttttaaaatc acatctccct gccatttcta gtctcaaggc gacagcctct gacttctata 660
gattcagaca atgactttgt cacacctaag cctcgacgca ccaaccgtca tcgtccaaac 720
actcagcaac gaaagtccaa gaagaaagcc aaagttgtct tttcaagtga tgagtccagt 780
gaggatggta tgactcgccc tcccggcagc tgcttgcttg ccttggggtc tccttggggc 840
ttgcctggtt gtagagtcat tcttcctggt aatgtgttcc ccactgtgca cgttggctca 900
cctttgcagc tctatgtttt aagatccact ttacaccatc tttgtgactc agcttttgtt 960
cctataattc tttgaacaga actttcagcg gaaatgacgg aagaagagac tcccaagaga 1020
accaccccca tccgcagatc atctgcccga agacacaggt cttaggagtt gcctcaccta 1080
ttcccatccc tgctgtgcag ggtatcttaa ttgattttta attcatttcc tcccttgtaa 1140
aaatgttgcc tccttgtttt taatatgtaa atggtctttg cattcaaggc ctttctccta 1200
gagcccatct gactgctgct ttcactttcc aacaaacact taaccaatca ccatgttttc 1260
taagaataaa tgtttttata tacttttatt ctttgctggt ctgtttcatc ttccacctta 1320
gcccagattc aggcagcaat agagggttat caaaccagag agaagataca ccagcccagg 1380
catcctgagg ctgtctctgg gtcttcatgt ttcctcattg attcatcttg cacaactgat 1440
gagactccac tgtagagaat tctcacttct cagcctgggg gtactttcta cccagagacc 1500
tatttctgtc atagcctttt gggacacata aagcttcctt cctgcataga acaccccaca 1560
acagtgtatc aggagtgtac aagttgacaa acaatgctct agacctacgg ttttcttcct 1620
ctgtgtgcct catcccagaa gagatcatga ctcccaggag tcagccttta ctatggggtc 1680
tgcaggggcg tccagcccct cagcggcaag ccatgcccac cctccccaag tccttaatct 1740
gctgagtcac ttggaacagg agacactgat tctgctgtca tgacaacagc acattgccat 1800
agaaatgctc cctacctctt acgtgtgtgg tgggggaaca gtaatgacaa accataggca 1860
ggaggcaaaa gggaagacgg cacctcagaa acatgtgtta ggttagggca gaactatgga 1920
ggggctcctg agactctttg atgggaaagg gttaatgctg ctcctgaaac ctctgttgga 1980
aggcagaaaa gggacagggc tgagtccccg cactgggacc atttccatcc tctgcatcct 2040
gcccccggct catggaaagc ctgggcatgg gccacacagc tgtcagtctt ggctctgggg 2100
ccccaaggag gtagggcaat cccagaatgg caaggagcca ggactggatt tggggtgcag 2160
cccagcctgc tccctgcctt ttaagcaaag gttatcacca ggccagctaa acttagcaat 2220
taggctcttc agctaaaaga gcagggggct ggtctcaagt tgcactgacc tagcaaagag 2280
gccccaggat ccccctgccc agcacctgtg gctgagctcc caagcccttc ccgagagctc 2340
aggatccacc ctttccaccc tccctactct tcagaggagg aacccccttt ctccttccca 2400
cttgttggag ggggctgggg ccaggctgtt ctggcttggg gtataatacc ccctacccct 2460
tctactttcc cctcctctca gacctcaccc tgcctccacg agggcagcca agaaaggaga 2520
gtccctggct gcagggccag taggcacgtc ccaggacggg gagggacttc cgccctcacg 2580
tccagctctc cgccctgggg ctgcagtggg tgaaaggggc agtgtctcct agcctgggcg 2640
gtgcaaccct caggttccga ggaggaacgc tctgggaggc ttctttgcct cctccaaccc 2700
aacccacaac caggacattg tcctcacccc ggggccccaa cctagacctt aactgaggaa 2760
cacagaggcc agtttgtaag tctcaattat gcagggcatc ccgacctgtg gcgtagggag 2820
cgcccctcca ggccgcttcc ctagcctcct cctggccctc acagcccagg cctctggccc 2880
aagaaatgga agtgggggtg ggggatggaa ctgcgaatgc gaagggcccc cgcaggaggc 2940
aaagtgaccc ctcccgggcc ttttctgctc cgagacttgt ttttgcctgt gtcactaccg 3000
aagaaccacg gccggcctga 3020
<210> 31
<211> 3537
<212> DNA
<213> Artificial Sequence
<220>
<223> amplicon
<400> 31
tactcgcgat tcactgtaca gtggcacata cttgtcacca cagtgtcata ctggacattt 60
tcatgaccct aaggccacat cacccctgtg gtgtcactca gttgtaattt caccctatat 120
agtgatttca ggttggcttt ttacttagaa tataacattt aaattatgtt tcttttttgg 180
ttttgagttt tgtttttcga gacagggttt ctctgtattg ctttggaggt tgtgctggaa 240
cttgctctgg agaccaggct ggcttcgaac tcacagagat cctcccacct ctgcctcccg 300
agtgctggga ttaaaggcgt gcgccaccaa tgccccagca tctttctgtt tctctgtttt 360
taaagaggga gataatgttt ccagtgctgt ttttaacttt tttcctgtag gctaccatag 420
atgaatttga gcagaagctt cgggcatgtc ataccagagg catggatgga atagaggagc 480
ttgaaactgg ccaagaaggc agccagcaag ccctgtctgc caagaaaccc tctgctggta 540
tgagagacaa gcccacacgg actccccaca aatcatccct gtcatttatt ggtttttgtt 600
tttaaaatca catctccctg ccatttctag tctcaaggcg acagcctctg acttctatag 660
attcagacaa tgactttgtc acacctaagc ctcgacgcac caaccgtcat cgtccaaaca 720
ctcagcaacg aaagtccaag aagaaagcca aagttgtctt ttcaagtgat gagtccagtg 780
aggatggtat gactcgccct cccggcagct gcttgcttgc cttggggtct ccttggggct 840
tgcctggttg tagagtcatt cttcctggta atgtgttccc cactgtgcac gttggctcac 900
ctttgcagct ctatgtttta agatccactt tacaccatct ttgtgactca gcttttgttc 960
ctataattct ttgaacagaa ctttcagcgg aaatgacgga agaagagact cccaagagaa 1020
ccacccccat ccgcagatca tctgcccgaa gacacaggtc ttaggagttg cctcacctat 1080
tcccatccct gctgtgcagg gtatcttaat tgatttttaa ttcatttcct cccttgtaaa 1140
aatgttgcct ccttgttttt aatatgtaaa tggtctttgc attcaaggcc tttctcctag 1200
agcccatctg actgctgctt tcactttcca acaaacactt aaccaatcac catgttttct 1260
aagaataaat gtttttatat acttttattc tttgctggtc tgtttcatct tccaccttag 1320
cccagattca ggcagcaata gagggttatc aaaccagaga gaagatacac cagcccaggc 1380
atcctgaggc tgtctctggg tcttcatgtt tcctcattga ttcatcttgc acaactgatg 1440
agactccact gtagagaatt ctcacttctc agcctggggg tactttctac ccagagacct 1500
atttctgtca tagccttttg ggacacataa agcttccttc ctgcatagaa caccccacaa 1560
cagtgtatca ggagtgtaca agttgacaaa caatgctcta gacctacggt tttcttcctc 1620
tgtgtgcctc atcccagaag agatcatgac tcccaggagt cagcctttac tatggggtct 1680
gcaggggcgt ccagcccctc agcggcaagc catgcccacc ctccccaagt ccttaatctg 1740
ctgagtcact tggaacagga gacactgatt ctgctgtcat gacaacagca cattgccata 1800
gaaatgctcc ctacctctta cgtgtgtggt gggggaacag taatgacaaa ccataggcag 1860
gaggcaaaag ggaagacggc acctcagaaa catgtgttag gttagggcag aactatggag 1920
gggctcctga gactctttga tgggaaaggg ttaatgctgc tcctgaaacc tctgttggaa 1980
ggcagaaaag ggacagggct gagtccccgc actgggacca tttccatcct ctgcatcctg 2040
cccccggctc atggaaagcc tgggcatggg ccacacagct gtcagtcttg gctctggggc 2100
cccaaggagg tagggcaatc ccagaatggc aaggagccag gactggattt ggggtgcagc 2160
ccagcctgct ccctgccttt taagcaaagg ttatcaccag gccagctaaa cttagcaatt 2220
aggctcttca gctaaaagag cagggggctg gtctcaagtt gcactgacct agcaaagagg 2280
ccccaggatc cccctgccca gcacctgtgg ctgagctccc aagcccttcc cgagagctca 2340
ggatccaccc tttccaccct ccctactctt cagaggagga accccctttc tccttcccac 2400
ttgttggagg gggctggggc caggctgttc tggcttgggg tataataccc cctacccctt 2460
ctactttccc ctcctctcag acctcaccct gcctccacga gggcagccaa gaaaggagag 2520
tccctggctg cagggccagt aggcacgtcc caggacgggg agggacttcc gccctcacgt 2580
ccagctctcc gccctggggc tgcagtgggt gaaaggggca gtgtctccta gcctgggcgg 2640
tgcaaccctc aggttccgag gaggaacgct ctgggaggct tctttgcctc ctccaaccca 2700
acccacaacc aggacattgt cctcaccccg gggccccaac ctagacctta actgaggaac 2760
acagaggcca gtttgtaagt ctcaattatg cagggcatcc cgacctgtgg cgtagggagc 2820
gcccctccag gccgcttccc tagcctcctc ctggccctca cagcccaggc ctctggccca 2880
agaaatggaa gtgggggtgg gggatggaac tgcgaatgcg aagggccccc gcaggaggca 2940
aagtgacccc tcccgggcct tttctgctcc gagacttgtt tttgcctgtg tcactaccga 3000
agaaccacga gaagatcctc aacttttcca cagcctttgc ataaagggga gagggtcggc 3060
ggtgcagctg tggcacacac gcacttctgc tcaacccgcc cccccccgcc cccgttcctg 3120
ttccttccca ggttctcccc attttatcgg ggcggcaact tttaggtccc tgggtcctgg 3180
aagtccttag tacacactct tcgtccttaa gtccatagtc tgtattccct cggtcctatc 3240
ctgtccccca tcaccgggtc acctccccag cgaagcaatc tcagttcccc tccccctctc 3300
agccccgagc ccacacgttt ggtgcgtgca catttcaaaa acgaggcggg tccaaagaga 3360
gggggtgggg aggtgccgag tggcccagct actcgcggct ttacgggtgc acgtagctca 3420
ggcctcagcg cccttgagct gtgactggat ggatgagcgg ggcgggaggc ggggcgagcg 3480
tcctcggcgc tccccaccac cccagttcct ataaatagca gagctcgttt agtgaac 3537
<210> 32
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> amplicon
<400> 32
tactcgcgaa gaagatcctc aacttttcca cagcctttgc ataaagggga gagggtcggc 60
ggtgcagctg tggcacacac gcacttctgc tcaacccgcc cccccccgcc cccgttcctg 120
ttccttccca ggttctcccc attttatcgg ggcggcaact tttaggtccc tgggtcctgg 180
aagtccttag tacacactct tcgtccttaa gtccatagtc tgtattccct cggtcctatc 240
ctgtccccca tcaccgggtc acctccccag cgaagcaatc tcagttcccc tccccctctc 300
agccccgagc ccacacgttt ggtgcgtgca catttcaaaa acgaggcggg tccaaagaga 360
gggggtgggg aggtgccgag tggcccagct actcgcggct ttacgggtgc acgtagctca 420
ggcctcagcg cccttgagct gtgactggat ggatgagcgg ggcgggaggc ggggcgagcg 480
tcctcggcgc tccccaccac cccagttcct ataaatagca gagctcgttt agtgaac 537
<210> 33
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1896
<400> 33
tacggccggc ttcactgtac agtggcacat 30
<210> 34
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1897
<400> 34
tcaggccggc cgtggttctt cggtagtgac 30
<210> 35
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1901
<400> 35
tactcgcgaa gaagatcctc aacttttcca cagcc 35
<210> 36
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1902
<400> 36
gttcactaaa cgagctctgc tatttatagg aactggggtg 40
<210> 37
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1903
<400> 37
caccccagtt cctataaata gcagagctcg tttagtgaac 40
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1904
<400> 38
cgctagcacc ggtcgatcga 20
<210> 39
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GlnPr1905
<400> 39
tactcgcgat tcactgtaca gtggcacata c 31
Claims (42)
- 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 및 진핵생물(eukaryotic) 글리세르알데하이드 3-포스페이트 디하이드로제네즈(Glyceraldehyde 3-phosphate dehydrogenase(GAPDH)) 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 포함하는 발현 증강 요소를 포함하는 발현 카세트(expression cassette)로서,
여기서, 상기 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치로부터 +7000 주위의 뉴클레오티드 위치까지 영역거리(region spanning)내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 100 주위부터 15000 주위의 뉴클레오티드까지인 발현 카세트.
- 제 1항에 있어서, 상기 발현 카세트는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림(non-translated genomic DNA sequence upstream)을 추가적으로 포함하고,
여기서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100 주위부터 15000 주위까지 뉴클레오티드인 발현 카세트.
- 프로모터, 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열 및 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림을 포함하는 발현 카세트로서,
여기서, 상기 발현 카세트는 진핵생물 GAPDH 프로모터 또는 이의 단편을 포함하지 않는다는 것에 기반하여, 상기 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100부터 15000 주위의 뉴클레오티드인 발현 카세트.
- 제 3항에 있어서, 상기 발현 카세트는 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림을 추가적으로 포함하고,
여기서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치부터 +7000 주위의 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 100 주위부터 15000 주위의 뉴클레오티드까지인 발현 카세트.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열에 실시가능하게(operably) 연결되지 않는 발현 카세트.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 발현 카세트는 폴리아데닐레이션 자리(polyadenylation site)를 포함하는 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 10 뉴클레오티드 주위(around 10 nucleotides)이고 IFF01 유전자의 두 번째 마지막 인트론 또는 이의 일부까지 자체의 최대에서 확장하는(extends) 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 진핵생물 GAPDH 폴리아데닐레이션 자리의 다운스트림에서 시작하고 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 적어도 100 뉴클레오티드 주위이고 IFF01 유전자의 두 번째 마지막 인트론(the second last intron)까지 자체의 최대에서 확장하는 발현 카세트.
- 제 2항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드 주위이고 NCAPD2 유전자의 시작 코돈(start codon)까지 자체의 최대에서 확장하는 발현 카세트.
- 제 2항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드 주위이고 NCAPD2 유전자의 세 번째 마지막 인트론(the third last intron)까지 자체의 최대에서 확장하는 발현 카세트.
- 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드이고 NCAPD2 유전자의 시작 코돈(start codon)까지 자체의 최대에서 확장하는 발현 카세트.
- 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 적어도 100 뉴클레오티드이고 NCAPD2 유전자의 세 번째 마지막 인트론까지 자체의 최대에서 확장하는 발현 카세트.
- 제 1항 내지 제4항 중 어느 한 항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 포유동물 기원(mammalian origin)인 발현 카세트.
- 제 13항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림은 설치류(rodent) 또는 인간 기원인 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완(complementary)하는 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 서열번호: 8 및 21 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는(identical) 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제 2항 또는 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제18항에 있어서, 상기 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열은 5 개 또는 미만의 핵산 변형(nucleic acid modifications)을 포함하는 발현 카세트.
- 제 2항 또는 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 상호보완하는 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제 2항 또는 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 서열번호: 7, 9, 10, 11, 12, 13, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27 및 28 또는 이의 단편으로 구성된 군으로부터 선택되는 뉴클레오티드 서열에 적어도 80% 일치하는 뉴클레오티드 서열을 포함하는 발현 카세트.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 프로모터 및 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열은 작동가능하게 연결된(operatively linked) 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향되는(orientated) 발현 카세트.
- 제 1항 또는 제 4항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 반대 방향으로 지향되는 발현 카세트.
- 제 2항 또는 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 동일한 방향으로 지향되는 발현 카세트.
- 제 2항 또는 제 3항에 있어서, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열로서 반대 방향으로 지향되는 발현 카세트.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 프로모터는 SV40 프로모터, MPSV 프로모터, 마우스 CMV, 인간 tk, 인간 CMV, 래트 CMV, 인간 EF1알파, 차이니즈 햄스터 EF1알파, 인간 GAPDH, MYC, HYK 및 CX 프로모터를 포함하는 하이브리드(hybrid) 프로모터로 구성된 군으로부터 선택되는 발현 카세트.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 폴리펩티드는 항체, 항체 단편(antibody fragments) 또는 항체 유도체(antibody derivates)로 구성된 군으로부터 선택되는 발현 카세트.
- 제 6항에 있어서, 상기 폴리아데닐레이션 자리는 BGH 폴리(A) 및 SV40 폴리(A)로 구성된 군으로부터 선택되는 발현 카세트.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 추가 프로모터(additional promoter), 인핸서(enhancer), 전사조절 요소(transcriptional control elements), 및 선별가능한 마커(selectable marker)로 구성된 군으로부터 선택되는 유전적 요소(genetic element)를 추가적으로 포함하는 발현 카세트.
- 제 30항에 있어서, 상기 유전적 요소는 선별가능한 마커를 암호화하는 폴리뉴클레오티드 서열에 포함된 CpG 자리의 함량(content)이 45 또는 그 미만인 선별감능한 마커인 발현 카세트.
- 제 1항 내지 제 29항 중 어느 한 항의 발현 카세트를 포함하는 발현 벡터.
- 하기의 순서를 포함하는, 발현 벡터로서:
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림
b) 프로모터
c) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
d) 폴리아데닐레이션 자리
e) 인핸서
f) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림, 또는
a) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림
b) 인핸서
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림, 또는
a) 인핸서
b) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림 및/또는 다운스트림
c) 프로모터
d) 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열
e) 폴리아데닐레이션 자리
f) 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림 및/또는 업스트림,
만약 a) 또는 b)가 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림이면 f)는 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림이고 만약 a) 또는 b)가 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 다운스트림이면 f)는 진핵생물 GAPDH의 비번역된 게놈 DNA 서열 업스트림인 조건으로, 상기 인핸서의 포함은 선택적이고, 상기 폴리뉴클레오티드 서열에 의해 암호화되는 폴리펩티드는 GAPDH가 아니고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림은 +1 주위의 뉴클레오티드 위치부터 +7000 주위의 뉴클레오티드 위치까지 영역거리(region spanning) 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사시작에 비례하고(relative to), 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 다운스트림의 길이는 100 주위부터 15000 주위 뉴클레오티드까지이고 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림은 진핵생물 GAPDH 프로모터의 5' 말단 주위부터 -3500 주위 뉴클레오티드 위치까지의 영역거리 내에서 시작하고, 상기 뉴클레오티드 위치는 GAPDH mRNA의 전사 시작에 비례하고, 상기 진핵생물 GAPDH 프로모터의 비번역된 게놈 DNA 서열 업스트림의 길이는 100 주위부터 15000 주위 뉴클레오티드까지인 발현 벡터.
- 제 32항 또는 제 33항에 있어서, 상기 발현 벡터는 추가 프로모터, 인핸서, 전사 조절 요소, 복제의 기원(origin of replication)및 선별가능한 마커로 구성된 군으로부터 선택되는 유전적 요소를 추가적으로 포함하는 발현 벡터.
- 제 32항 또는 제 33항에 있어서, 상기 발현 벡터는 복제의 기원 및 선별가능한 마커를 암호화하는 발현 벡터의 폴리뉴클레오티드 서열에 포함된 CpG 자리의 함량이 200 또는 미만인 복제의 기원 및 선별가능한 마커를 추가적으로 포함하는 발현 벡터.
- 제 1항 내지 제 31항 중 어느 한 항의 발현 카세트 또는 제 32항 내지 제 35항 중 어느 한 항의 발현 벡터를 포함하는 숙주 세포.
- 장애(disorder)의 치료를 위한 의약으로서 용도를 위한 제 1항 내지 제 31항 중 어느 한 항의 발현 카세트 또는 제 32항 내지 제 35항 중 어느 한 항의 발현 벡터.
- 유전자 치료에 용도를 위한 제 1항 내지 제 31항 중 어느 한 항의 발현 카세트 또는 제 32항 내지 제 35항 중 어느 한 항의 발현 벡터.
- 제 1항 내지 제 31항 중 어느 한 항의 발현 카세트 또는 제 32항 내지 제 35항 중 어느 한 항의 발현 벡터로 숙주 세포를 형질전환 및 폴리펩티드를 회수하는 것을 포함하는, 폴리펩티드 발현을 위한 시험관 내(in vitro) 방법.
- 제 39항에 있어서, 상기 발현 카세트 또는 발현 벡터는 안정적으로 형질전환되는 방법.
- 제 39항에 있어서, 상기 발현 카세트 또는 발현 벡터는 일시적으로 형질전환되는 방법.
- 포유동물 숙주 세포(mammalian host cell)로부터 이종폴리펩티드 (heterologous polypeptide)의 발현을 위한 제 1항 내지 제 31항 중 어느 한 항의 발현 카세트 또는 제 32항 내지 제 35항 중 어느 한 항의 발현 벡터의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161567675P | 2011-12-07 | 2011-12-07 | |
US61/567,675 | 2011-12-07 | ||
PCT/IB2012/056977 WO2013084157A1 (en) | 2011-12-07 | 2012-12-05 | Expression cassette |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140113666A true KR20140113666A (ko) | 2014-09-24 |
KR102135745B1 KR102135745B1 (ko) | 2020-07-21 |
Family
ID=47561694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147018672A KR102135745B1 (ko) | 2011-12-07 | 2012-12-05 | 발현 카세트 |
Country Status (15)
Country | Link |
---|---|
US (3) | US20130344604A1 (ko) |
EP (1) | EP2788483B1 (ko) |
JP (3) | JP2015501642A (ko) |
KR (1) | KR102135745B1 (ko) |
CN (1) | CN104093834A (ko) |
AU (2) | AU2012348558A1 (ko) |
BR (1) | BR112014013597A2 (ko) |
CA (1) | CA2856479A1 (ko) |
EA (1) | EA037273B1 (ko) |
ES (1) | ES2679291T3 (ko) |
HK (1) | HK1202578A1 (ko) |
IL (1) | IL232845A0 (ko) |
MX (1) | MX362393B (ko) |
SG (1) | SG11201402477VA (ko) |
WO (1) | WO2013084157A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2962385T3 (es) * | 2014-10-15 | 2024-03-18 | Amgen Inc | Elementos promotores y reguladores para mejorar la expresión de genes heterólogos en células hospederas |
EP3218503A4 (en) * | 2014-11-10 | 2018-06-06 | Murdoch Childrens Research Institute | Vectors and methods for targeted integration in loci comprising constitutively expressed genes |
CN106868044A (zh) * | 2017-02-15 | 2017-06-20 | 扬州大学 | 一种转基因动物毛色报告基因表达盒、表达载体及应用 |
LT3768846T (lt) * | 2018-03-21 | 2023-08-10 | Aldevron, L.L.C. | Virusiniai ir nevirusiniai nanoplazmidiniai vektoriai su patobulinta gamyba |
CN114540352A (zh) * | 2022-02-16 | 2022-05-27 | 艾瑞生命科学技术(常州)有限公司 | 一种多核苷酸、载体元件及表达载体和宿主细胞及应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1308510A1 (en) * | 2000-08-10 | 2003-05-07 | Ono Pharmaceutical Co., Ltd. | Glycerylaldehyde-3-phosphate dehydrogenase promoter inducing cell death |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3584341D1 (de) * | 1984-08-24 | 1991-11-14 | Upjohn Co | Rekombinante dna-verbindungen und expression von polypeptiden wie tpa. |
KR20000006334A (ko) * | 1998-06-26 | 2000-01-25 | 이선경 | 바이러스코딩염기서열이전혀없는고효율레트로바이러스벡터 |
CA2632900A1 (en) * | 2005-12-12 | 2007-06-21 | Research Corporation Technologies, Inc. | Hybrid 3' untranslated regions suitable for efficient protein expression in mammalian cells |
-
2012
- 2012-12-05 EA EA201491034A patent/EA037273B1/ru unknown
- 2012-12-05 CN CN201280069001.0A patent/CN104093834A/zh active Pending
- 2012-12-05 MX MX2014006869A patent/MX362393B/es active IP Right Grant
- 2012-12-05 ES ES12816132.0T patent/ES2679291T3/es active Active
- 2012-12-05 WO PCT/IB2012/056977 patent/WO2013084157A1/en active Application Filing
- 2012-12-05 AU AU2012348558A patent/AU2012348558A1/en not_active Abandoned
- 2012-12-05 EP EP12816132.0A patent/EP2788483B1/en active Active
- 2012-12-05 SG SG11201402477VA patent/SG11201402477VA/en unknown
- 2012-12-05 CA CA2856479A patent/CA2856479A1/en not_active Abandoned
- 2012-12-05 BR BR112014013597-5A patent/BR112014013597A2/pt not_active Application Discontinuation
- 2012-12-05 US US14/003,410 patent/US20130344604A1/en not_active Abandoned
- 2012-12-05 JP JP2014545423A patent/JP2015501642A/ja active Pending
- 2012-12-05 KR KR1020147018672A patent/KR102135745B1/ko active IP Right Grant
-
2014
- 2014-05-28 IL IL232845A patent/IL232845A0/en unknown
-
2015
- 2015-03-23 HK HK15102932.0A patent/HK1202578A1/xx unknown
-
2017
- 2017-05-08 JP JP2017092184A patent/JP2017200476A/ja active Pending
- 2017-07-18 US US15/653,243 patent/US20180163225A1/en not_active Abandoned
-
2018
- 2018-06-18 AU AU2018204332A patent/AU2018204332B2/en active Active
-
2019
- 2019-04-29 US US16/397,006 patent/US20200087679A1/en active Pending
- 2019-07-04 JP JP2019124927A patent/JP7096790B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1308510A1 (en) * | 2000-08-10 | 2003-05-07 | Ono Pharmaceutical Co., Ltd. | Glycerylaldehyde-3-phosphate dehydrogenase promoter inducing cell death |
Also Published As
Publication number | Publication date |
---|---|
AU2012348558A2 (en) | 2014-07-24 |
US20130344604A1 (en) | 2013-12-26 |
CA2856479A1 (en) | 2013-06-13 |
JP2017200476A (ja) | 2017-11-09 |
MX2014006869A (es) | 2014-07-14 |
EA201491034A1 (ru) | 2015-04-30 |
KR102135745B1 (ko) | 2020-07-21 |
MX362393B (es) | 2019-01-15 |
IL232845A0 (en) | 2014-07-31 |
CN104093834A (zh) | 2014-10-08 |
WO2013084157A1 (en) | 2013-06-13 |
BR112014013597A2 (pt) | 2020-08-18 |
US20200087679A1 (en) | 2020-03-19 |
JP2019193659A (ja) | 2019-11-07 |
EP2788483B1 (en) | 2018-06-27 |
EP2788483A1 (en) | 2014-10-15 |
JP7096790B2 (ja) | 2022-07-06 |
HK1202578A1 (en) | 2015-10-02 |
ES2679291T3 (es) | 2018-08-23 |
AU2012348558A1 (en) | 2014-07-10 |
SG11201402477VA (en) | 2014-09-26 |
AU2018204332A1 (en) | 2018-07-05 |
NZ626252A (en) | 2016-06-24 |
JP2015501642A (ja) | 2015-01-19 |
AU2018204332B2 (en) | 2020-09-10 |
EA037273B1 (ru) | 2021-03-02 |
US20180163225A1 (en) | 2018-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102301464B1 (ko) | 종양 세포에 의한 면역 억제를 감소시키기 위한 방법 및 조성물 | |
AU2023274083A1 (en) | Compositions and methods for treating non-age-associated hearing impairment in a human subject | |
AU2023204606A1 (en) | Genetically modified cells, tissues, and organs for treating disease | |
CN107941681B (zh) | 鉴定生物样品中定量细胞组成的方法 | |
KR102531749B1 (ko) | Cho 세포 내 통합 부위 | |
AU2018204332A1 (en) | Expression cassette | |
KR20200103765A (ko) | 핵산의 표적화된 통합 | |
EP3880826A1 (en) | Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear | |
KR101476010B1 (ko) | 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포 | |
RU2749715C2 (ru) | Грызуны, характеризующиеся гуманизированным геном tmprss | |
KR20200126997A (ko) | 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법 | |
KR20220002609A (ko) | 포유동물 세포의 특성을 변경하기 위한 인공 마이크로-rna 및 이들 생성물의 조성물을 사용한 포유동물 세포의 변형 | |
AU2023202878A1 (en) | Methods for targeted insertion of DNA in genes | |
KR20120099363A (ko) | 탯줄 혈액으로부터의 유도 만능 줄기 세포의 생성 | |
KR20210107057A (ko) | 핵산의 표적화 통합 | |
AU759689B2 (en) | Novel hemopoietin receptor proteins | |
AU2022200678A1 (en) | Nucleic acid molecules containing spacers and methods of use thereof | |
KR20220157944A (ko) | 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법 | |
CN115175559A (zh) | 包含人源化pnpla3基因座的非人动物及其使用方法 | |
CN113264996A (zh) | 一种人源化的非人动物及其制备方法和应用 | |
KR20230027043A (ko) | 핵산의 표적화 통합 | |
CN114853871B (zh) | Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用 | |
CN113817770B (zh) | Cd73基因人源化的非人动物的构建方法及应用 | |
KR20230101839A (ko) | 세이프 하버 유전자좌위 | |
KR20230042407A (ko) | 포유류 세포들에서 젖분비자극 활성의 조절 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
AMND | Amendment | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
E90F | Notification of reason for final refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |