KR102531749B1 - Cho 세포 내 통합 부위 - Google Patents
Cho 세포 내 통합 부위 Download PDFInfo
- Publication number
- KR102531749B1 KR102531749B1 KR1020207003299A KR20207003299A KR102531749B1 KR 102531749 B1 KR102531749 B1 KR 102531749B1 KR 1020207003299 A KR1020207003299 A KR 1020207003299A KR 20207003299 A KR20207003299 A KR 20207003299A KR 102531749 B1 KR102531749 B1 KR 102531749B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- cho
- nucleotides
- cell
- heterologous polynucleotide
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0681—Cells of the genital tract; Non-germinal cells from gonads
- C12N5/0682—Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/02—Cells for production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Reproductive Health (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 중국 햄스터 난소(CHO) 세포에서 이종 폴리뉴클레오티드에 대한 게놈 통합 부위를 동정하여, 다량의 RNA 및/또는 단백질 제조를 달성하는 것에 관한 것이다. 더욱 구체적으로 본 발명은 CHO 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 폴리뉴클레오티드 적어도 하나를 포함하는 CHO 세포와, 상기 CHO 세포를 제조하기 위한 방법에 관한 것이다. 또한 본 발명은 상기 CHO 세포를 사용하여 관심단백질을 제조하기 위한 방법과, 관심 단백질을 높은 수율로 제조함에 있어 상기 CHO 세포의 용도에 관한 것이다. 이러한 특정의 표적 영역 내에의 통합은 이종 폴리뉴클레오티드에 의해 암호화되는 관심 RNA 및/또는 단백질 제조를 믿을 수 있고, 안정적이며, 높은 수율로 달성한다.
Description
본 발명은 다량의 RNA 및/또는 단백질 제조를 달성하는 중국 햄스터 난소(Chinese Hamster Ovary; CHO) 세포 내 이종 폴리뉴클레오티드에 대한 게놈 통합 부위의 동정에 관한 것이다. 더욱 구체적으로 본 발명은 CHO 게놈의 S100A 유전자 클러스터(gene cluster)에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 CHO 세포와, 상기 CHO 세포를 제조하기 위한 방법에 관한 것이다. 또한 본 발명은 상기 CHO 세포를 사용하여 관심 단백질을 제조하기 위한 방법과, 관심 단백질을 높은 수율로 제조함에 있어 상기 CHO 세포의 용도에 관한 것이다. 이러한 특정 표적 영역 내부에의 통합은 이종 폴리뉴클레오티드에 의해 암호화되는 관심 RNA 및/또는 단백질의 신뢰할 수 있고, 안정적이며, 높은 수율의 제조를 달성한다.
중국 햄스터 난소(CHO) 세포는 치료 단백질의 재조합 제조용으로서 가장 잘 알려진 숙주 세포이다. 고전적인 세포주 개발 절차는 발현 벡터의 무작위 통합(Random Integration; RI) 후, 최적의 생산성 거동(productivity behavior)을 보이는 아클론의 선택 및 스크리닝(screening)의 순서로 이루어진다. 무작위 통합은 얻어진 세포 집단의 예측 불가능한 염색체내 위치선정 효과(positioning effect), 가변적인 복사체수 및 안정성의 문제로 말미암은 큰 이종성과 연관되어 있다. 고 생산자 세포(high producer cell)는 오로지 무작위적으로 형질감염된 세포중 단지 적은 비율만을 차지하고 있으며, 저 생산자 세포(low producer cell)에 의거하여 과성장되는 경향이 있다. 그러므로 지속적인 생물약제 단백질의 제조와 발효 공정 개발에 적합한 독립된 클론 하나를 동정 및 단리하기 위해서는 다수의 클론이 스크리닝되어야 한다.
이종 유전자 발현에 대한 위치선정 효과는, 예컨대 크로마틴 구조, 게놈 각인 또는 전사 조절인자 요소, 예컨대 게놈 인핸서 요소, 침묵인자 요소 또는 촉진인자 요소가 통합 부위 근처에 존재하는 것으로부터 기인할 수 있다(C. Wilson et al. Annu. Rev. Cell Biol. 1990, 6, 679-714). 게놈 내 이러한 요소 다수는 공지되어 있지 않거나 특성규명되어있지 않으므로, 세포주 개발 과정에서 게놈 좌위의 잠재성은 예측하기 어렵다.
고전적 무작위 통합을, 하나 이상의 소정 게놈 좌위/좌위들로의 단백질 발현 벡터의 표적화 통합(TI)으로 대체하여 수행함으로써 이러한 단점이 해결될 수 있다. 아클론 모두는 광대한 스크리닝 절차에 대한 필요를 없애주는 동일한 게놈 환경을 가질 것이므로, 표적화 통합은 세포주 개발 방법을 더욱더 잘 예측할 수 있도록 만든다.
표적화 통합에 의존하는 세포주 개발 방법의 난관은, 적합한 게놈 좌위(종종 "핫 스팟(hot spot)"이라 칭하여짐)를 동정하는 것에 있다. 이상적인 부위(들)는, 단일 또는 저 복사체 수임에도 불구, 충분한 수준의 단백질이 발현되도록 지원할 것이고, 과도한 하향 조절 없이도 장기간 안정적인 발현 수준을 보일 것이며, 예컨대 MTX 또는 MSX와 함께 대사 선택 마커 DHFR 또는 GS를 사용하여 증폭될 수 있을 것이며, 이식유전자(transgene)의 통합이 세포 성장 또는 단백질 제조 프로필에 부정적인 영향을 미치지 않도록 위치할 것이다.
S100A6 유전자는 공지의 칼슘 결합 단백질, 예컨대 S100A1, S100A13, S100A14, S100A16, S100A3, S100A2, S100A4, S100A5 및 S100A6의 군을 암호화하는 S100A 유전자 클러스터의 일부이다. 클러스터는 S100A1, S100A13, S100A14 및 S100A16 유전자를 포함하는 "부 클러스터(side cluster)"와, S100A3, S100A4, S100A5 및 S100A6 유전자를 포함하는 "주 클러스터(main cluster)"를 포함한다.
본 발명에 있어서, 이종 폴리뉴클레오티드의 CHO 세포 게놈 내 S100A 유전자 클러스터로의 안정적 통합은 이종 유전자 생성물의 제조를 증가시키는 것으로 보인다. 특히 S100A3/A4/A5/A6 주 유전자 클러스터에 측접하는 상류 및 하류 영역들 내부로의 안정적 통합은 이종 유전자 생성물, 예컨대 재조합 단백질, 예컨대 항체 및 융합 단백질, 또는 조절 RNA, 예컨대 shRNA 또는 miRNA의 예측 가능하고, 높은 수준이며, 안정적인 제조를 가능하게 한다.
본 발명에서, 중국 햄스터 난소(CHO) 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 CHO 세포가 제공되는데, 단 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류이다. 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응한다.
더욱 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응한다. 더욱더 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응한다.
일 구현예에서, 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나는 RNA 및/또는 단백질을 암호화할 수 있다. RNA는 mRNA, miRNA 또는 shRNA일 수 있다. 단백질은 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질일 수 있다.
이종 폴리뉴클레오티드 적어도 하나는 또한 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자일 수 있다. 바람직하게 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소, 예컨대 부위 특이적 뉴클레아제에 대한 인지 부위가 측접한다.
본 발명에 따른 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)-결핍 세포 또는 이들 세포 중 임의의 것의 유도체(derivative)일 수 있다.
일 구현예에서, 게놈 표적 영역은 상기 서열 번호 1 및/또는 서열 번호 2의 한정된 서열들 중 임의의 하나 또는 이에 대해 적어도 80%의 서열 동일성을 보이는 서열로 이루어진다.
이종 폴리뉴클레오티드 적어도 하나는 CHO 세포 게놈의 S100A 유전자 클러스터 대립형질 하나 또는 두 개에 안정적으로 통합될 수 있다.
다른 양태에서, 본 발명은 (a) CHO 세포를 제공하는 단계; (b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고, 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자의 하류임]를 포함하는, CHO 세포를 제조하기 위한 방법을 제공한다.
바람직하게 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응한다. 더욱 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응한다. 더욱더 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응한다.
일 구현예에서, 게놈 표적 영역은 상기 서열 번호 1 및/또는 서열 번호 2의 한정된 서열들중 임의의 하나 또는 이에 대해 적어도 80%의 서열 동일성을 보이는 서열 중 임의의 하나로 이루어진다.
바람직한 구현예에서, 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되고, 이 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접할 수 있다.
일 구현예에서, 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나는 RNA 및/또는 단백질을 암호화할 수 있다. RNA는 mRNA, miRNA 또는 shRNA일 수 있다. 단백질은 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질일 수 있다.
이종 폴리뉴클레오티드 적어도 하나는 또한 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자일 수 있다. 바람직하게 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하고 있다.
이종 폴리뉴클레오티드 적어도 하나는 CHO 세포 게놈의 S100A 유전자 클러스터의 대립형질 하나 또는 두 개에 안정적으로 통합될 수 있다.
일 구현예에서, 이종 폴리뉴클레오티드는 (a) 서열 특이적 DNA 편집 효소, 바람직하게 부위 특이적 뉴클레아제, 더욱 바람직하게 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제로부터 선택되는 서열 특이적 DNA 편집 효소; 또는 (b) 부위 특이적 리컴비나아제, 바람직하게 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제가 사용되어 CHO 세포 게놈에 통합된다.
다른 구현예에서, 본 방법은 (a) CHO 세포를 제공하는 단계; (aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고, (i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계를 추가로 포함할 수 있다.
또 다른 양태에서, 본 발명은 (a) 본 발명의 CHO 세포를 제공하는 단계; (b) 단계 (a)의 CHO 세포를, 관심 단백질의 제조가 허용되는 조건하에 세포 배양 배지에서 배양하는 단계; (c) 관심 단백질을 수집하는 단계; 그리고 (d) 선택적으로 관심 단백질을 정제하는 단계를 포함하는, CHO 세포에서 관심 단백질을 제조하기 위한 방법을 제공한다.
본 발명에 따른 방법에 사용된 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS) 결핍 세포 또는 이들 세포 중 임의의 것의 유도체일 수 있다.
본 발명의 또 다른 양태에서, 관심 단백질을 높은 수율로 제조하는데 있어 본 발명의 CHO 세포의 용도가 제공된다.
도 1: CHO 세포에서의 무작위 통합 대 ZFN(풀 데이터)을 통한 표적화 통합. (A)는 유가식 배양 3일 ~ 7일 후, 무작위 통합이 일어난 CHO-DG44 세포 풀 유래 IgG1 항체 농도(검정 막대) 대 표적화 통합이 일어난 CHO-DG44 세포 풀 유래 IgG1 항체 농도(흰색 막대)를 보여준다. (B)는 유가식 배양 8일 ~ 10일 후, 무작위 통합이 일어난 CHOZN GS 세포 풀 유래 IgG1 항체 농도(검정 막대) 대 표적화 통합이 일어난 CHOZN GS 세포 풀 유래 IgG1 항체 농도(흰색 막대)를 보여준다. TI 풀은 FACS 세포 분취법, 대사 선택 및 FACS의 제2 라운드가 사용되어 증량되었다. 표적화 통합은 S100A3/A4/A5/A6 주 유전자 클러스터의 하류를 통합하도록 디자인된 아연 핑거 뉴클레아제 쌍(ZFN) 13이 사용되어 아연 핑거 뉴클레아제(ZFN)에 의해 매개되었다.
도 2: (A) ZFN을 통한 표적화 통합 또는 (B) 무작위 통합 이후, 독립된 단일 CHOZN GS 클론의 항체 제조 균질성에 대한 생산성 평가 결과. 각각의 형질감염 프로토콜(각각 TI 또는 RI) 이후 제한 희석을 통해 수득된 독립 클론 20개 ~ 24개를 보여준다. 세포는 TTP 튜브 내에서 60일에 걸쳐 계대배양되었다. 막대는 계대배양 당일(n = 2) 및 60일차(n = 2) 이후 8일 경과시 유가식 배양중인 개별 클론의 IgG 역가(μg/ml)로부터 풀링(pooling)된 데이터를 나타낸다. 오차 막대는, 계대배양 당일 및 60일차에서의 클론 안정성을 나타낸다. ZNF 13이 사용되는 S100A3/A4/A5/A6 주 유전자 클러스터 하류의 표적화 통합은, 60일 동안 단일 클론 배양액 중에서 더욱 균질한 클론 IgG 발현 수준과 더욱 안정적인 발현을 달성하였다.
도 3: TI 이후 항체 풀 역가에 대한 통합 부위의 영향력. (A)는 S100A 유전자 클러스터 내 개별 ZFN및 핫 스팟 좌위의 위치를 도시한 것이다. 번호는, NCBI 참조 서열: NW_003613854.1을 가지는, CHOZN GS 세포의 크리세튤러스 그리세우스(Cricetulus griseus) 스캐폴드를 기반으로 한 경계를 나타낸다. 화살표는, ZNF 7 ~ 14의 통합 부위를 나타내는 것으로서, "비 파괴적 및 생산적(non disruptive and productive)" 부위(검정 막대), "비 파괴적 및 저/비 생산적" 부위(흰색 막대), 그리고 "파괴적 및 저/비 생산적" 부위(빗금친 막대)로 분류된다. (B)는 X-축에 보인 상이한 좌위로의 ZNF 7 ~ 14 매개 통합이 사용되어 달성된, CHO 풀에 대한 IgG 역가(mg/l)를 보인다.
도 4: CHO-K1 GS 세포 내 랜딩 패드(landing pad)를 통한 표적화 통합의 결과. (A) 상동성 팔(arm)(서열 번호 13 및 서열 번호 14), 플립파아제 인지 표적(FRT) 부위 FRT 및 FRT5, 그리고 IRES 서열에 의해 격리된 선택 마커 2개를 포함하고, ZFN 좌위 13번(서열 번호 11)에 대한 랜딩 패드의 부위 특이적 통합을 위해 ZFN을 통하여 CHO 게놈에 통합된 DNA 구조체의 모식도. (B)는 표적화 통합이 이루어진 CHOZN GS 세포 풀 중 IgG1 항체의 농도를 보여준다.
도 5: 독립적 CHO-K1 GS 단일 클론의, 랜딩 패드를 통한 표적화 통합 이후 항체 제조에 대한 생산성 평가 결과. 10개의 독립된 단일 클론의 IgG 항체 농도(검정 막대)와, 세포 풀의 IgG 항체 농도(빗금친 막대)를 보여준다.
도 2: (A) ZFN을 통한 표적화 통합 또는 (B) 무작위 통합 이후, 독립된 단일 CHOZN GS 클론의 항체 제조 균질성에 대한 생산성 평가 결과. 각각의 형질감염 프로토콜(각각 TI 또는 RI) 이후 제한 희석을 통해 수득된 독립 클론 20개 ~ 24개를 보여준다. 세포는 TTP 튜브 내에서 60일에 걸쳐 계대배양되었다. 막대는 계대배양 당일(n = 2) 및 60일차(n = 2) 이후 8일 경과시 유가식 배양중인 개별 클론의 IgG 역가(μg/ml)로부터 풀링(pooling)된 데이터를 나타낸다. 오차 막대는, 계대배양 당일 및 60일차에서의 클론 안정성을 나타낸다. ZNF 13이 사용되는 S100A3/A4/A5/A6 주 유전자 클러스터 하류의 표적화 통합은, 60일 동안 단일 클론 배양액 중에서 더욱 균질한 클론 IgG 발현 수준과 더욱 안정적인 발현을 달성하였다.
도 3: TI 이후 항체 풀 역가에 대한 통합 부위의 영향력. (A)는 S100A 유전자 클러스터 내 개별 ZFN및 핫 스팟 좌위의 위치를 도시한 것이다. 번호는, NCBI 참조 서열: NW_003613854.1을 가지는, CHOZN GS 세포의 크리세튤러스 그리세우스(Cricetulus griseus) 스캐폴드를 기반으로 한 경계를 나타낸다. 화살표는, ZNF 7 ~ 14의 통합 부위를 나타내는 것으로서, "비 파괴적 및 생산적(non disruptive and productive)" 부위(검정 막대), "비 파괴적 및 저/비 생산적" 부위(흰색 막대), 그리고 "파괴적 및 저/비 생산적" 부위(빗금친 막대)로 분류된다. (B)는 X-축에 보인 상이한 좌위로의 ZNF 7 ~ 14 매개 통합이 사용되어 달성된, CHO 풀에 대한 IgG 역가(mg/l)를 보인다.
도 4: CHO-K1 GS 세포 내 랜딩 패드(landing pad)를 통한 표적화 통합의 결과. (A) 상동성 팔(arm)(서열 번호 13 및 서열 번호 14), 플립파아제 인지 표적(FRT) 부위 FRT 및 FRT5, 그리고 IRES 서열에 의해 격리된 선택 마커 2개를 포함하고, ZFN 좌위 13번(서열 번호 11)에 대한 랜딩 패드의 부위 특이적 통합을 위해 ZFN을 통하여 CHO 게놈에 통합된 DNA 구조체의 모식도. (B)는 표적화 통합이 이루어진 CHOZN GS 세포 풀 중 IgG1 항체의 농도를 보여준다.
도 5: 독립적 CHO-K1 GS 단일 클론의, 랜딩 패드를 통한 표적화 통합 이후 항체 제조에 대한 생산성 평가 결과. 10개의 독립된 단일 클론의 IgG 항체 농도(검정 막대)와, 세포 풀의 IgG 항체 농도(빗금친 막대)를 보여준다.
"~를 포함하는"일반적인 구현예 또는 "~에 포함된" 일반적인 구현예는 "~으로 이루어진" 더욱 구체적인 구현예를 포함한다. 더욱이 단수 및 복수 형태는 제한적 방식으로 사용되지 않는다. 본원에 사용된 바와 같은 단수를 나타내는 용어 "하나의", "한" 및 "본"은 단수만을 지칭하는 것이라고 명백하게 진술되지 않는 한 단수의 것과 복수의 것 둘다를 지칭한다.
본 발명에 사용된 바와 같은 "상동체" 또는 "상동성"이란 용어는, 서열에 있어서 원래의 서열 또는 이의 상보성 서열과 적어도 80% 동일한 폴리펩티드 분자 또는 핵산 분자, 또는 이러한 폴리펩티드 분자 또는 핵산 분자가 이와 같은 상태일 때를 의미한다. 바람직하게 폴리펩티드 분자 또는 핵산 분자는 서열에 있어서 기준 서열 또는 이의 상보성 서열과 적어도 90% 동일하다. 더욱 바람직하게, 폴리펩티드 분자 또는 핵산 분자는 서열에 있어서 기준 서열 또는 이의 상보성 서열과 적어도 95% 동일하다. 더욱 바람직하게 폴리펩티드 분자 또는 핵산 분자는 서열에 있어서 기준 서열 또는 이의 상보성 서열과 적어도 98% 동일하다. 상동성 단백질은 또한 원래 서열의 단백질 활성과 동일하거나 유사한 단백질 활성을 보인다.
본원에 사용된 바와 같은 "서열에 대응하는" 또는 "서열에 대응하다"란 용어는, 서열 번호 1 또는 서열 번호 2의 뉴클레오티드 서열, 또는 서열 번호 1 또는 서열 번호 2의 한정된 뉴클레오티드 간 서열뿐 아니라, 이의 천연 변이를 가지는 크리세튤러스 그리세우스 CHO-K1의 한정된 서열을 포함한다. 당 업자는, CHO 세포주의 게놈 서열은 가변적이므로, 예컨대 대립형질 변이로 말미암아 서열 번호 1과 2에 보인 바와 같이, NCBI 데이터베이스로부터 구하여진 NCBI 참조 서열: NW_003613854.1의 서열과 동일할 수 없음을 이해할 것이다. 그러나 당업자는 서열 번호 1 또는 2에 한정된 바와 같은 서열, 즉 상동성 영역에 대응하는 CHO 세포주의 특정 서열을, 서열 정렬을 이용하여 어떻게 동정하는지 알 것이다. 이러한 대응 서열은 서열 번호 1에 한정된 서열, 또는 서열 번호 2에 한정된 서열과 적어도 80%의 동일성을 보일 것이고, 바람직하게는 서열 번호 1에 한정된 서열, 또는 서열 번호 2에 한정된 서열과 적어도 90%의 동일성을 보일 것이거나, 또는 서열 번호 1 또는 서열 번호 2와 동일하다. 대응 서열은 또한 대응 서열을 확정하는데 고려되지 않을 재조합 삽입부, 예컨대 이종 폴리뉴클레오티드를 함유할 수 있다.
"단백질"이란 용어는 "아미노산 잔기 서열" 또는 "폴리펩티드"와 호환되어 사용되고, 임의의 길이를 가지는 아미노산 중합체를 지칭한다. 이 용어는 또한 글리코실화, 아세틸화, 인산화, 당화 또는 단백질 가공을 포함하되, 이에 한정되는 것은 아닌 반응을 통하여 번역후 변형된 단백질을 포함한다. 변형 및 변이, 예컨대 다른 단백질에의 융합, 아미노산 서열의 치환, 결실 또는 삽입은, 이와 같은 분자 자체의 생물학적 기능 활성이 유지되면서 폴리펩티드 구조에 일어날 수 있다. 예를 들어 임의의 아미노산 서열 치환은 폴리펩티드 또는 이의 기반을 이루는 핵산 암호화 서열에서 일어날 수 있으며, 동일한 특성을 가지는 단백질이 수득될 수 있다. "폴리펩티드"란 용어는, 통상 아미노산을 10개 초과하여 가지는 서열을 지칭하고, "펩티드"란 용어는, 길이가 10개 이하 아미노산인 서열을 지칭한다. 그러나 이 용어들은 호환되어 사용될 수 있다. 본 발명에 따르는 관심 단백질은, 바람직하게 치료 단백질이다.
"관심 단백질"이란 용어는 넓게는 산업상의 단백질 제조 방법에 특별히 관련된 임의의 단백질을 지칭한다. 관심 단백질로서는, 예컨대 단백질 분비, 번역후 단백질 변형, 번역, 전사, 세포 주기 조절 또는 영양분 대사에 있어 기능을 가지는 숙주 세포의 단백질, 마커 단백질 또는 이종의 치료 단백질을 포함하나, 이에 한정되는 것은 아니다.
"치료 단백질"이란 용어는, 인간 및/또는 동물의 의료 처치에 사용될 수 있는 단백질을 지칭한다. 이로서는 항체, 성장 인자, 혈액 응고 인자, 백신, 인터페론, 호르몬 및 융합 단백질을 포함하나, 이에 한정되는 것은 아니다.
"게놈 DNA" 또는 "게놈"이란 용어는 호환되어 사용되는 것으로서, 숙주 유기체의 유전 가능한 유전 정보를 지칭한다. 게놈 DNA는 핵의 DNA(염색체 DNA라고도 지칭됨)뿐 아니라 기타 세포내 소기관(예컨대 미토콘드리아)의 DNA도 포함한다.
본원에 사용된 바와 같은 "유전자"란 용어는, 기능성 생성물로서 발현되거나 유전자 발현을 조절함으로써 유기체의 형질에 영향을 미치는, 유전 가능한 게놈 서열의 DNA 또는 RNA 좌위를 지칭한다. 유전자 및 폴리뉴클레오티드는 게놈 서열 내에서와 같은 인트론과 엑손, 또는 단지 cDNA 내에서와 같은 암호화 서열, 예컨대 개시 코돈(메티오닌 코돈) 및 번역 종결 코돈을 포함하는 개방 해독틀(ORF)을 포함할 수 있다. 유전자 및 폴리뉴클레오티드는 또한 자체의 발현을 조절하는 영역, 예컨대 전사 개시, 번역 및 전사 종결을 포함할 수 있다. 그러므로 조절 요소, 예컨대 촉진인자도 또한 포함된다.
본원에 사용된 바와 같은 "핵산", "뉴클레오티드" 및 "폴리뉴클레오티드"란 용어는 호환되어 사용되는 것으로서, 5' 말단으로부터 3' 말단으로 해독된 데옥시리보뉴클레오티드 염기 또는 리보뉴클레오티드 염기의 단일 가닥 또는 이중 가닥 중합체를 지칭하고, 이중 가닥 DNA(dsDNA), 단일 가닥 DNA(ssDNA), 단일 가닥 RNA(ssRNA), 이중 가닥 RNA(dsRNA), 게놈 DNA, cDNA, cRNA, 재조합 DNA 또는 재조합 RNA와, 이것들의 유도체, 예컨대 변형된 백본(backbone)을 함유하는 것들을 포함한다. 바람직하게, 특히 CHO 게놈에 안정적으로 통합되는 폴리뉴클레오티드는 DNA 또는 cDNA이다. 본 발명에 따른 폴리뉴클레오티드는 상이한 방법(예컨대 화학적 합성법, 유전자 클로닝 등)으로 제조될 수 있으며, 다양한 형태(예컨대 선형 또는 분지형, 단일 가닥 또는 이중 가닥, 또는 이의 하이브리드, 프라이머, 프로브 등)를 취할 수 있다. "뉴클레오티드 서열" 또는 "핵산 서열"이란 용어는, 개별 단일 가닥 또는 이중체중 어느 하나인 핵산의 센스 가닥 및 안티센스 가닥 둘다를 지칭한다.
본원에 사용된 바와 같은 "이종 폴리뉴클레오티드"란 용어는, 상이한 유기체 또는 상이한 수용개체 종, 즉 상이한 CHO 세포로부터 유래한 폴리뉴클레오티드를 지칭한다. 본 발명의 내용에 있어 당 업자는 "이종 폴리뉴클레오티드"가 DNA 또는 cDNA를 지칭함을 이해할 것이다. 이종 폴리뉴클레오티드는 또한 이식유전자라 지칭될 수 있다. 그러므로 "이종 폴리뉴클레오티드"는 이종 단백질을 암호화하는 유전자 또는 개방 해독틀(ORF)일 수 있다. CHO 세포에 관한 내용에 있어 "이종 폴리뉴클레오티드"란 상이한 세포주, 바람직하게는 크리세튤러스 그리세우스로부터 유래하지 않는 세포주로부터 유래하는 폴리뉴클레오티드를 지칭한다. "이종"이란 용어가 핵산의 일부분과 관련하여 사용될 때, 이 용어는 또한 핵산이 자연에서 서로 간에 동일한 관계에 있는 것으로서 발견되지 않는 서열을 2개 이상 포함함을 나타낼 수 있다. 그러므로 "이종"은 또한 CHO 유래 폴리뉴클레오티드 서열, 예컨대 유전자 또는 이식유전자, 또는 이의 일부분이, 이것이 통상 발견되지 않는 CHO 게놈의 위치에 삽입되었을 때, 또는 유전자가, 이것이 통상 발견되지 않는 어떤 유기체의 세포에 도입되었을 때를 지칭할 수도 있다.
"이종 폴리뉴클레오티드", "이종 유전자" 또는 "이종 서열"은 표적 세포에 직접적으로 도입될 수 있거나, 또는 바람직하게 "발현 벡터", 바람직하게 포유류 발현 벡터를 사용하여 도입될 수 있다. 벡터를 구성하는데 사용되는 방법은 당 업자에게 잘 공지되어 있으며, 다수의 간행물에 기술되어 있다. 예컨대 기능성 구성요소, 예컨대 촉진인자, 인핸서, 종결 및 폴리아데닐화 신호, 선택 마커, 복제 기원 및 스플라이싱 신호(splicing signal)에 관한 기술을 포함하여 구체적으로 적합한 벡터를 구성하기 위한 기법은 문헌[Sambrook J, et al., 1989. Molecular Cloning: A Laboratory Manual. Cold Spring Harbor: Cold Spring Harbor Laboratory Press]과, 이 문헌에 인용된 문헌들에 상당히 상세하게 검토되어 있다. 벡터로서는 플라스미드 벡터, 파지미드, 코스미드, 인공/미니 염색체(예컨대 ACE), 또는 바이러스 벡터, 예컨대 배큘로바이러스, 레트로바이러스, 아데노바이러스, 아데노 연관 바이러스, 단순포진바이러스, 레트로바이러스 및 박테리오파아지를 포함할 수 있으나, 이에 한정되는 것은 아니다. 진핵생물 발현 벡터는 또한, 통상적으로 벡터의 박테리아내 증식을 촉진하는 원핵생물 서열, 예컨대 복제 기원과, 박테리아내 선택을 위한 항생제 내성 유전자를 함유하기도 할 것이다. 폴리뉴클레오티드가 작동 가능하도록 결합될 수 있는 클로닝 부위를 함유하는 다양한 진핵생물 발현 벡터는 당 분야에 널리 공지되어 있으며, 이것들 중 몇몇은 Stratagene(La Jolla, CA; Invitrogen, Carlsbad, CA); Promega(Madison, WI); 또는 BD Biosciences Clonetech(Palo Alto, CA)와 같은 회사로부터 시판되고 있다. 일반적으로 발현 벡터는 또한 상기 발현 마커를 운반하는 숙주 세포의 선택을 허용하는, 선택 가능 마커를 암호화하는 발현 카세트를 포함하기도 한다.
본원에 사용된 바와 같은 "제조하는" 또는 "다량 제조", "제조", "제조 및/또는 분비", "제조하는 것", "제조용 세포" 또는 "높은 수율로 제조하는 것"이란 용어는, 이종 폴리뉴클레오티드에 의해 암호화되는 RNA 및/또는 단백질의 제조에 관한 것이다. "증가한 제조 및/또는 분비" 또는 "높은 수율의 제조"는, 이종 RNA 및/또는 단백질의 발현과 관련된 것으로서, 세포 배양액의 구체적 생산성 증가. 증가한 역가, 증가한 전체 생산성 또는 이의 조합을 의미한다. 바람직하게 역가 또는 전체 생산성, 그리고 역가는 증가한다. 본원에 사용된 바와 같은 "증가한 역가"는 동일 부피일 때 증가한 농도, 즉 총 수율의 증가에 관한 것이다. 제조된 이종 RNA, 이종 단백질 또는 치료 단백질은, 예를 들어 소형 조절 RNA 또는 항체, 바람직하게는 마이크로 RNA, 소형의 헤어핀 RNA, 모노클로날 항체, 이중 특이적 항체 또는 이의 단편, 또는 융합 단백질일 수 있다.
본원에 사용된 바와 같은 "향상", "향상된", "향상된", "증가하다" 또는 "증가한"이란 용어는, 일반적으로 대조군 세포에서에 비하여 적어도 약 10%만큼 증가한 것을 의미하는데, 예를 들어 대조군 세포에서에 비하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 75%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 100%, 또는 적어도 약 200%, 또는 적어도 약 300%만큼 증가한 경우, 또는 10%와 300% 사이 임의의 정수%만큼 감소한 경우를 의미한다. 본원에 사용된 바와 같은 "대조군 세포" 또는 "대조군 포유류 세포"는 동일한 이종 폴리뉴클레오티드가 무작위로 도입된 CHO 세포와 동일한 CHO 세포이다. 이는 세포 클론에서 확정될 수 있거나, 바람직하게는 클론 선택이 이루어지지 않은 세포 풀에서 확정될 수 있다.
본원에 사용된 바와 같은 "발현 카세트"란 용어는, RNA(이종 RNA) 또는 단백질(이종 단백질)을 암호화하는 유전자 하나 이상과, 이의 발현을 제어하는 서열을 포함하는, 벡터의 일부를 지칭한다. 그러므로 발현 카세트는 촉진인자 서열 및 개방 해독틀과, 통상적으로 폴리아데닐화 부위를 함유하는 3' 미번역 영역을 포함한다. 바람직하게 벡터는 재조합 분비 치료 단백질을 암호화하는 유전자 하나 이상을 포함하는 발현 벡터이다. 발현 카세트는 벡터, 통상적으로 발현 벡터, 예컨대 플라스미드 또는 바이러스 벡터의 일부일 수 있다. 발현 카세트는 또한 무작위 또는 표적화 통합, 예컨대 상동성 재조합에 의해 염색체에 통합될 수도 있다. 발현 카세트는 클로닝 기법을 사용하여 제조되므로, 자연 발생 유전자 구조를 지칭하지 않는다.
"촉진인자" 또는 "촉진인자 서열"은 세포 내 RNA 중합효소의 결합과, 하류(3' 방향) 암호화 서열 전사의 개시를 가능하게 하는 DNA 조절 영역이다. 촉진인자 서열 자체의 3' 말단에는 전사 개시 부위가 측접하며, 상류(5' 방향)로 확장되어, 1.5 kb 이하만큼을 포함하게 된다. 통상적으로 촉진인자는 그 길이가 약 100개 내지 약 1000개 염기쌍이다. 촉진인자 서열은 전사 개시 부위뿐 아니라, RNA 중합효소 결합에 가담하는 단백질 결합 도메인(공통 서열)을 포함한다. 진핵생물 촉진인자는 항상은 아니고 종종 "TATA" 박스와 "CAT" 박스를 함유한다. 촉진인자 서열은 종종 각각의 유전자 발현을 조절하는데 수반되는 단백질에 의해 인지되는 추가의 공통 서열을 함유하기도 한다. 촉진인자에 의한 유전자 발현의 조절은 조절 단백질의 결합을 향상시키거나 억제함으로써 진행될 수 있다. 조절 단백질 결합의 향상 또는 억제는 다수의 상이한 방법, 예컨대 염기 변형(즉 메틸화) 및 단백질 변형(즉 인산화)(이에 한정되는 것은 아님)에 의해 이루어질 수 있다.
"상류" 및 "하류"란 용어는, DNA 또는 RNA 내 상대적인 위치를 지칭한다. DNA 또는 RNA의 각각의 가닥은 데옥시리보스 또는 리보스 단위의 말단 탄소 위치와 관련된 5' 말단과 3' 말단을 보유한다. 관례상 "상류"란, 폴리뉴클레오티드의 5' 말단을 향하는 쪽을 의미하는 반면에, "하류"란, 폴리뉴클레오티드의 3' 말단을 향하는 쪽을 의미한다. 이중 가닥 DNA, 예컨대 게놈 DNA의 경우, "상류"란 용어는, 암호화 가닥의 5' 말단을 향하는 쪽을 의미하는 반면에, "하류"란, 암호화 가닥의 3' 말단을 향하는 쪽을 의미한다.
"암호화 가닥", "센스 가닥" 또는 "비 주형 가닥"이란 용어는, 유전자 자체의 염기 서열이 RNA 염기 서열, 즉 이 유전자로부터 전사된 RNA의 염기 서열에 대응하는, 이중 가닥 DNA의 가닥을 지칭한다.
"소형 조절 RNA"란 용어는, 보통 표적 유전자 각각의 mRNA와 결합함으로써 이 표적 유전자의 발현에 영향을 미치는 소형 비 암호화 RNA 폴리뉴클레오티드를 지칭한다. 이러한 소형 조절 RNA로서는 소형 간섭 RNA(siRNA), 마이크로 RNA(miRNA) 및 짧은 헤어핀 RNA(shRNA)를 포함하나, 이에 한정되는 것은 아니다.
본원에 사용된 바와 같은 "리보핵산", "RNA" 또는 "RNA 올리고뉴클레오티드"란 용어는, 핵염기, 리보스 당 및 인산염 기로 구성된 뉴클레오티드들의 서열로 이루어진 분자를 기술한다. RNA는, 보통 단일 가닥의 분자로서, 다양한 기능을 발휘할 수 있다. "리보핵산"이라는 용어는, 특히 메신저 RNA(mRNA), 운반 RNA(tRNA), 리보좀 RNA(rRNA), 짧은 간섭 RNA(siRNA), 소형 헤어핀 RNA(shRNA) 및 마이크로RNA(miRNA)를 포함하는데, 이것들 각각은 생물 세포 내에서 특정의 역할을 한다. 이는 소형 비 암호화 RNA, 예컨대 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA), 소형 헤어핀 RNA(shRNA) 그리고 Piwi 상호작용 RNA(piRNA)를 포함한다. "비 암호화"란 용어는, RNA 분자가 아미노산 서열로 번역되지 않음을 의미한다.
"RNA 간섭"(RNAi)이란 용어는, 단백질 합성의 일반화된 억제를 제외한, 유전자 발현(단백질 합성)의 서열 특이적이거나 유전자 특이적인 억제를 지칭한다. RNAi는, 전사된 mRNA의 번역을 막아주는 RNA 유도성 침묵 복합체(RISC)에 의한 메신저 RNA(mRNA)의 분해를 수반할 수 있다. RNAi에 의해 유발되는 유전자 발현의 억제는 일시적일 수 있거나, 또는 더욱 안정적이거나 심지어 영구적일 수 있다. RNAi는 miRNA, siRNA 또는 shRNA에 의해 매개될 수 있다. 바람직하게 본 발명에 따른 RNAi는 유전자 특이적이다(오로지 하나의 유전자만이 표적화된다). 유전자 특이적 RNAi는 siRNA 또는 shRNA에 의해 매개될 수 있다.
"마이크로RNA" 또는 "miRNA"란 용어는, 본원에서 호환되어 사용된다. 마이크로RNA는 길이가 약 22개 뉴클레오티드(길이가 통상 19개 내지 25개 뉴클레오티드)인 소형 비 암호화 단일 가닥 RNA이다. miRNA는, 통상 하나를 초과하는 유전자를 표적화한다. 마이크로RNA는 진핵생물 세포의 게놈에서 암호화되며, 통상 RNA 중합효소 III에 의해 길이가 긴 1차 전사체로서 전사되는데, 이 전사체는 추후 몇 단계를 거쳐 처음에는 길이 약 70 nt인 헤어핀-루프 구조로, 그 다음에는 약 22 nt의 RNA 이중체로 가공된다. 그 다음, 활성을 가지는 성숙한 가닥은 RNA 유도성 침묵 복합체(RISC)에 부하되어, 표적 단백질의 번역 또는 이 표적 단백질의 각각의 mRNA의 분해를 막아준다. miRNA에 의한 표적화는 미스매칭을 허용하고, mRNA 번역 억제는 불완전한 상보성(즉, 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥과 표적 mRNA 간의 완벽하지 못한 염기 쌍형성)에 의해 매개되는 반면에, siRNA 및 shRNA는 완전한 서열 상보성(즉 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥과 표적 mRNA 간의 완벽한 염기 쌍형성)으로 말미암아 이것들의 표적에 특이적이다. 통상적으로 miRNA는 3'미번역 영역(3'UTR)에 결합하고, 유전자 특이적이 아니지만, 다수의 mRNA를 표적화한다. 본원에 사용된 바와 같은 "마이크로RNA"란 용어는, 포유류의 내인성 게놈 miRNA, 예컨대 인간 miRNA에 관한 것이다. 접두사 "hsa"는, 예컨대 마이크로RNA가 인간 기원의 것임을 나타낸다. "마이크로RNA"는 포유류 숙주 세포 내 miRNA의 일시적이거나 안정적인 발현을 위한 게놈 마이크로RNA 서열(들)을 포함하는 발현 벡터를 사용하여 포유류 숙주 세포에 도입될 수 있다. 게놈 마이크로RNA를 발현 벡터에 클로닝하기 위한 방법은 당 분야에 공지되어 있다. 이러한 방법으로서는 게놈 miRNA 서열을 대략 300 bp의 측접 영역과 함께 포유류 발현 벡터, 예컨대 pBIP-1에 클로닝하되, 촉진인자와 작동 가능하도록 결합되게 클로닝하는 방법을 포함한다. 대안적으로 하나 이상의 마이크로RNA는 조작된 프리-miRNA 서열(즉 짧은 헤어핀)을 암호화하는 폴리뉴클레오티드로서 포유류 발현 벡터에 클로닝될 수 있다. 예를 들어 성숙한 miRNA 서열은 최적화된 헤어핀 루프 서열과, 예컨대 마우스 miRNA mir-155 유래 3' 및 5' 측접 영역을 암호화하는 소정의 서열에 클로닝될 수 있다 (Lagos-Quintana et al., 2002. Curr. Biol. 30;12(9):735-9). DNA 올리고뉴클레오티드는 헤어핀 줄기의 내부 루프가 생성되도록 2개의 뉴클레오티드가 결실된 성숙 miRNA 각각의 안티센스 서열, 언급된 루프, 그리고 miRNA 서열을 암호화하도록 디자인된다. 뿐 아니라, 양 말단에서 DNA 올리고뉴클레오티드를 3' 및 5' 측접 영역에 융합하는 클로닝을 실시하기 위해 돌출가닥(overhang)이 부가된다. 본원에 사용된 바와 같은 miRNA는 비표준 miRNA를 추가로 포함한다. 이러한 RNA는 리보좀 RNA(rRNA) 또는 운반 RNA(tRNA)를 비롯한 "항존(housekeeping)" 비 암호화 RNA(ncRNA)로부터 유래하여, miRNA가 작용하는 것과 유사한 방식으로 작용한다. 이 RNA는 또한 포유류 미토콘드리아 ncRNA로부터 기원할 수 있으므로, 미토콘드리아 게놈 암호화 소형 RNA(미토sRNA)라 칭하여진다.
본원에 사용된 바와 같이, "소형 간섭성" 또는 "짧은 간섭 RNA" 또는 "siRNA"란 용어는, 원하는 유전자에 표적화되고, 상동성을 공유하는 유전자의 발현을 억제할 수 있는, 뉴클레오티드의 RNA 이중체를 지칭한다. 이는 길이가 긴 이중 가닥 RNA(dsRNA) 또는 shRNA로부터 생성된다. RNA 이중체는, 통상 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개 또는 27개 염기쌍을 형성하고, 뉴클레오티드 2개의 3'돌출가닥을 보유하는 뉴클레오티드 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개 또는 29개로 이루어진 상보성 단일 가닥 RNA를 2개 포함하고, 바람직하게 RNA 이중체는 17개 ~ 25개 염기쌍을 형성하고, 뉴클레오티드 2개의 3' 돌출가닥을 보유하는 뉴클레오티드 19개 ~ 27개의 상보성 단일 가닥 RNA 2개를 포함한다. siRNA는 유전자에 "표적화"되는데, 단 siRNA의 이중체 부분의 뉴클레오티드 서열은 표적 유전자의 mRNA의 뉴클레오티드 서열에 상보성이다. siRNA 또는 이의 전구체는 항상 외부로부터, 예컨대 직접적으로 세포내에 도입되거나, 또는 상기 siRNA를 암호화하는 서열을 가지는 벡터의 형질감염에 의해 세포내에 도입되며, 내인성 miRNA 경로는 siRNA의 올바른 가공과, 표적 mRNA의 절단 및 분해를 위해 동력화된다. 이중체 RNA는 세포 내에서 단일 구조체로부터 발현될 수 있다.
본원에 사용된 바와 같이, "shRNA"(소형 헤어핀 RNA)란 용어는, siRNA의 일부분이 헤어핀 구조(shRNA)의 일부인 RNA 이중체를 지칭한다. shRNA는 세포 내에서 기능성 siRNA로 가공될 수 있다. 헤어핀 구조는 이중체부에 더하여, 이중체를 형성하는 서열 2개 사이에 위치하는 루프부를 함유할 수 있다. 루프는 그 길이가 가변적일 수 있다. 몇몇 구현예들에서, 루프는 그 길이가 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개 또는 14개 뉴클레오티드이다. 헤어핀 구조는 또한 3'또는 5' 돌출가닥부를 함유할 수 있다. 몇몇 양태들에서, 돌출가닥은 그 길이가 0개, 1개, 2개, 3개, 4개 또는 5개 뉴클레오티드인 3'또는 5'돌출가닥이다. 본 발명의 일 양태에서, 벡터에 포함된 뉴클레오티드 서열은 센스 영역, 루프 영역 및 안티센스 영역을 포함하는 소형 헤어핀 RNA의 발현에 대한 주형으로서의 역할을 한다. 발현 후 센스 영역 및 안티센스 영역은 이중체를 형성한다. shRNA는 항상, 예컨대 상기 shRNA를 암호화하는 서열을 가지는 벡터의 형질감염에 의해 외부로부터 도입되고, 내인성 miRNA 경로는 siRNA의 올바른 가공과, 표적 mRNA의 절단 또는 분해를 위해 동력화된다. 표적 유전자의 억제는 통상 장기간에 걸쳐 안정적으로 이루어진다는 점에서, shRNA를 암호화하는 서열을 가지는 벡터의 용도는 화학 합성된 siRNA의 용도에 비하여 이점을 가진다.
통상적으로 siRNA 및 shRNA는 완전한 서열 상보성(즉 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥과 표적 mRNA 사이의 완벽한 염기 쌍형성)에 의해 mRNA 억제를 매개하므로, 자체의 표적에 특이적이다. RNA 이중체의 안티센스 가닥은 또한 RNA 이중체의 활성 가닥이라 지칭될 수 있다. 본원에서 이용되는 바와 같은, 완벽한 염기 쌍형성의 완전한 서열 상보성이란, 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥이, 적어도 15개 연속 뉴클레오티드, 적어도 16개 연속 뉴클레오티드, 적어도 17개 연속 뉴클레오티드, 적어도 18개 연속 뉴클레오티드, 그리고 바람직하게 적어도 19개 연속 뉴클레오티드에 대해, 표적 mRNA와의 서열 동일성 적어도 80%를 보임을, 또는 바람직하게 적어도 15개 연속 뉴클레오티드, 적어도 16개 연속 뉴클레오티드, 적어도 17개 연속 뉴클레오티드, 적어도 18개 연속 뉴클레오티드, 그리고 바람직하게 적어도 19개 연속 뉴클레오티드에 대해 표적 mRNA와의 서열 동일성 적어도 93%를 보임을 의미한다. 더욱 바람직하게 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥은, 적어도 15개 연속 뉴클레오티드, 적어도 16개 연속 뉴클레오티드, 적어도 17개 연속 뉴클레오티드, 적어도 18개 연속 뉴클레오티드, 그리고 바람직하게 적어도 19개 연속 뉴클레오티드에 대해 표적 mRNA와의 서열 동일성 100%를 보인다.
"벡터"는 이종 폴리뉴클레오티드를 세포에 도입하는데 사용될 수 있는 핵산이다. 벡터의 한 가지 유형으로서는 내부에 추가의 핵산 분절이 결찰될 수 있는 선형 또는 원형 이중 가닥 DNA 분자라 지칭되는 "플라스미드"가 있다. 벡터의 또 다른 유형으로서는, 추가의 DNA 또는 RNA 분절이 바이러스 게놈에 도입될 수 있는 바이러스 벡터(예컨대 복제 결함 레트로바이러스, 아데노바이러스 및 아데노 연관 바이러스)가 있다. 바람직하게 벡터는 숙주 세포에 도입되어 선택압 적용 하에서 배양될 때 숙주 세포의 게놈에 통합되어, 숙주 게놈과 함께 복제되는 비 에피좀 포유류 벡터이다. 벡터는 선택된 폴리뉴클레오티드의 세포 내 발현을 유도하는데 사용될 수 있다.
"~을 암호화하다" 및 "~을 암호화한다"란 용어는, 넓게 중합체 거대분자 내 정보가, 제1 분자와는 상이한 제2 분자의 생성을 유도하는데 사용되는 임의의 과정을 지칭한다. 제2 분자는 그 화학 성질이 제1 분자의 화학 성질과 상이한 화학 구조를 가질 수 있다. 예를 들어 몇몇 양태들에서, "~를 암호화하다"란 용어는, 이중 가닥 DNA 분자의 한 가닥이 DNA 의존적 DNA 중합효소에 의해 새로 합성되는 상보성 자매 가닥을 암호화하는 주형으로 사용되는, 반 보존적 DNA 복제 과정을 기술한다. 다른 양태들에서, DNA 분자는 (예컨대 DNA 의존적 RNA 중합효소를 사용하는 전사 과정에 의해) RNA 분자를 암호화할 수 있다. 또한 RNA 분자는 번역 과정에서와 같이 폴리펩티드를 암호화할 수 있다. "~를 암호화하다"라는 용어가 번역 과정을 기술하는데 사용될 때, 이는 또한 아미노산을 암호화하는 3원 1조 코돈(triplet codon)에까지 확대된다. 몇몇 양태들에서, RNA 분자는, 예컨대 RNA 의존적 DNA 중합효소가 통합되는 역전사 과정에 의해 DNA 분자를 암호화할 수 있다. 다른 양태에서, DNA 분자는 폴리펩티드를 암호화할 수 있는데, 단 이 경우에 사용된"~를 암호화하다"는 전사 과정 및 번역 과정 둘 다에서의 암호화를 통틀어 일컫는 것임이 이해된다.
본원에 사용된 바와 같은 "유전자 클러스터"란 용어는, 관련되었거나 유사한 단백질들의 군을 암호화하고, 보통은 함께 무리지어 동일한 염색체상에 존재하는, 밀접하게 관련된 유전자들의 세트 또는 과를 포함하는 게놈 DNA의 분절을 지칭한다. 유전자 클러스터는 게놈 DNA 분절을 포함하는데, 여기에는 암호화 서열에 선행하는 영역(리더; leader)과 후행하는 영역(트레일러; trailer)뿐 아니라 개별 암호화 서열 단편(엑손)들 사이에 개입하는 서열(인트론)들, 그리고 최 광의로서의 추가 유전 요소들, 예컨대 전사 조절인자 요소, 촉진인자 요소, 인핸서 요소 및 억제인자 요소(이에 한정되는 것은 아님)를 비롯하여 단백질 군에 대한 모든 암호화 서열이 위치하고 있다. 일반적으로 유전자 클러스터는 유전자 클러스터의 첫 번째(5') 단백질 암호화 유전자와, 유전자 클러스터의 마지막(3') 단백질 암호화 유전자에 의해 한정되는 전체 게놈 분절을 포함한다.
"S100A 유전자 클러스터"란, 칼슘 결합 단백질인 S100A1, S100A3, S100A4, S100A5, S100A6, S100A13, S100A14 및 S100A16의 군을 암호화하는 중국 햄스터 게놈 DNA 분절을 지칭한다. 이 분절은 가장 상류에 있는 S100A1 단백질 암호화 유전자와, 가장 하류에 있는 S100A6 단백질 암호화 유전자를 포함한다. "S100A3/A4/A5/A6 주 유전자 클러스터"란 용어는, S100A 유전자 클러스터에 의해 포함되고, S100A3 단백질을 암호화하는 유전자로부터 S100A6 단백질을 암호화하는 유전자에 이르기까지에 걸쳐있는 게놈 DNA의 분절(서열 번호 4)을 지칭한다. "S100A1"이란, 크리세튤러스 그리세우스 유래 단백질 S100A1과, 이를 암호화하는 유전자(S100A1 유전자; NCBI 유전자 ID: 100769478)를 지칭한다. "S100A3"이란, 크리세튤러스 그리세우스 유래 단백질 S100A3과, 이를 암호화하는 유전자(S100A3 유전자, NCBI 유전자 ID: 100770814)를 지칭한다. "S100A4"란, 크리세튤러스 그리세우스 유래 단백질 S100A4와, 이를 암호화하는 유전자(S100A4 유전자, NCBI 유전자 ID: 100770532)를 지칭한다. "S100A5"란, 크리세튤러스 그리세우스 유래 단백질 S100A5와, 이를 암호화하는 유전자(S100A5 유전자, NCBI 유전자 ID: 100771097)를 지칭한다. "S100A6"이란, 크리세튤러스 그세우스 유래 단백질 S100A6과, 이를 암호화하는 유전자(S100A6 유전자; NCBI 유전자 ID: 100771384)를 지칭한다. "S100A13"이란, 크리세튤러스 그세우스 유래 단백질 S100A13과, 이를 암호화하는 유전자(S100A13 유전자; NCBI 유전자 ID: 100769763)를 지칭한다. "S100A14"란, 크리세튤러스 그세우스 유래 단백질 S100A14와, 이를 암호화하는 유전자(S100A14 유전자; NCBI 유전자 ID: 100770053)를 지칭한다. "S100A16"이란, 크리세튤러스 그세우스 유래 단백질 S100A16과, 이를 암호화하는 유전자(S100A16 유전자; NCBI 유전자 ID: 100753026)를 지칭한다.
"대립형질"이란 용어는, 유전자, 유전자 표적 영역 또는, 일반적으로 단일 좌위, 즉 염색체상 위치에 있는 DNA 서열의 상이한 형태들 중 임의의 하나를 지칭한다. 이는 암호화 서열, 비 암호화 서열 및 조절 서열을 포함한다. 게놈 내 상이한 대립형질은 뉴클레오티드 서열에 있어 반드시 동일할 필요는 없다.
"항체"란 용어는, 실질적으로 면역글로불린 유전자에 의해 암호화되는 폴리펩티드 하나 이상으로 이루어진 단백질을 지칭한다. 인지된 면역글로불린 유전자는 카파, 람다, 알파, 감마, 델타, 엡실론 및 뮤 불변 영역 유전자뿐 아니라, 다수의 면역글로불린 가변 영역 유전자를 포함한다. "항체" 및 "면역글로불린"이란 용어들은 호환되어 사용되며, 상기 면역글로불린에 대해 명시된 구조적 특징을 가지는 당단백질(이에 한정되는 것은 아님)을 나타내는데 사용된다.
"항체"란 용어는 본원에서 최 광의로 사용되며, 모노클로날 항체(전장 모노클로날 항체 포함), 폴리클로날 항체, 키메라 항체, 인간화 항체, 인간 항체, 다중 특이적 항체(예컨대 이중 특이적 항체), 단일 도메인 항체, 그리고 항체 단편(예컨대 Fv, Fab, Fab´, F(ab)2 또는 항체의 기타 항원 결합 종속서열)을 포함한다. "항체"란 용어는 또한 항체 접합체 및 융합 항체를 포함한다. 전장 "항체" 또는 "면역글로불린"은, 일반적으로 약 150 kDa의 헤테로 4량체 당단백질로서, 동일한 경쇄 2개와 동일한 중쇄 2개로 구성되어 있다. 각각의 경쇄는 하나의 공유 이황화 결합에 의해 중쇄와 결합하는 반면, 이황화 결합의 수는 상이한 면역글로불린 이소타입의 중쇄 간에 상이하다. 각각의 중쇄와 경쇄는 또한 규칙적으로 이격된 사슬내 이황화 결합을 가진다. 각각의 중쇄는 카복시 말단 불변 도메인(CH) 3개가 뒤따르는 아미노 말단 가변 도메인(VH)을 가진다. 각각의 경쇄는 가변 N 말단 도메인(VL)과 단일 C 말단 불변 도메인(CL)을 가진다. "항체"란 용어는 또한 동일한 특이성을 가지고(가변 도메인) 동일한 불변 도메인을 가지는 독립된 항체 다수를 포함하는 항체류를 지칭한다.
"융합 단백질"은 전체 서열, 원래부터 별도로 존재하던 천연 또는 변형 이종 단백질 2개 이상의 서열의 임의의 부분, 또는 전체 서열이나 원래부터 별도로 존재하던 천연 또는 변형 이종 단백질 2개 이상의 서열의 임의의 부분의 조합을 함유하는 단백질로서 정의된다. 융합 단백질은 원래부터 별도로 존재하던 천연 또는 이종 단백질 2개 이상, 또는 이의 일부를 원래 암호화하던 유전자 2개 이상 또는 이의 일부들을 융합함에 의한 유전자 조작 접근법에 의해 구성될 수 있다. 이는, 원래 단백질 각각으로부터 유래하는 기능상의 특성들을 가지는 융합 단백질을 만들어낸다. 융합 단백질은 Fc 융합 단백질을 포함하나, 이에 한정되는 것은 아니다.
"시토카인"이란 용어는, 세포에 의해 방출되어 세포내 조정인자로서 작용하는(예를 들어 분비 세포 주변에 있는 세포의 행동에 영향을 미치는) 소형의 단백질을 지칭한다. 시토카인은 면역 세포 또는 기타 세포, 예컨대 T 세포, B 세포, NK 세포 및 대식세포에 의해 분비될 수 있다. 시토카인은 세포내 신호전달 과정, 예컨대 자가분비 신호전달, 측분비 신호전달 및 내분비 신호전달에 수반될 수 있다. 시토카인은 면역성, 염증 및 조혈을 비롯한(이에 한정되는 것은 아님) 다양한 생물 과정을 매개할 수 있다. 시토카인은 케모카인, 인터페론, 인터루킨, 림포카인 또는 종양 괴사 인자일 수 있다.
본원에 사용된 바와 같은 "성장 인자"란, 세포 성장을 자극할 수 있는 단백질 또는 폴리펩티드를 지칭한다. 성장 인자로서는 인슐린, 표피 성장 인자(EGF), 에프린(Eph), 에리스로포이에틴, 신경교세포 자극 인자(GSF); 콜로니 자극 인자(CSF), 예컨대 대식세포 콜로니 자극 인자(M-CSF), 과립구 대식세포 콜로니 자극 인자(GM-CSF) 및 과립구 콜로니 자극 인자(G-CSF); 줄기 세포 성장 인자(SCGF)(스틸 인자(Steel Factor)라고도 칭하여짐); 기질 세포 유래 인자(SDF), 이의 유효 단편 및 이의 조합; 그리고 혈관 내피 성장 인자(VEGF)를 포함하나, 이에 한정되는 것은 아니다. 기타 성장 인자로서는 간세포 성장 인자(HGF), 안지오포이에틴-1, 안지오포이에틴-2, b-FGF 및 FLT-3 리간드와, 이의 유효 단편을 포함할 수 있다.
본원에 사용된 바와 같은 "발현"이란 용어는, 이종 핵산 서열의 숙주 세포 내 전사 및/또는 번역을 지칭한다. 숙주 세포 내 관심 유전자 생성물의 발현 수준은, 세포 내에 존재하는 대응 RNA의 양, 또는 선택된 서열에 의해 암호화된 폴리펩티드의 양을 기반으로 확정될 수 있다. 예를 들어 선택된 서열로부터 전사된 RNA는 노던 블럿 잡종화, 리보뉴클레아제 RNA 보호, 세포내 RNA에의 현장 잡종화 또는 PCR, 예컨대 qPCR에 의해 정량될 수 있다. 선택된 서열에 의해 암호화된 단백질은 다양한 방법, 예컨대 ELISA, 웨스턴 블럿팅, 방사성면역검정, 면역침전, 단백질의 생물 활성에 대한 검정, 단백질 면역염색 후의 FACS 분석, 또는 동종 시간 해상 형광도(HTRF) 검정에 의해 정량될 수 있다. 비 암호화 RNA, 예컨대 miRNA 또는 shRNA의 발현 수준은 PCR, 예컨대 qPCR에 의해 정량될 수 있다.
"유전자 생성물"이란 용어는, RNA 폴리뉴클레오티드와, 유전자나 DNA 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드 둘 다를 지칭한다.
본원에 사용된 바와 같은 "마커 유전자"란, 세포 내에서 발현될 때 선택 가능하거나 구별 가능한 표현형(예컨대 항생제 내성, 형광 단백질 또는 리포터 유전자의 발현, 변형된 대사)을 세포에 제공하는 폴리뉴클레오티드를 의미한다.
본원에 사용된 바와 같은 "리포터 유전자"는 숙주에 의한 발현이 검출 및 정량될 수 있는 단백질을 암호화하는 폴리뉴클레오티드이다. 그러므로 리포터 발현 수준의 측정치는 통상 숙주 세포 게놈 내 리포터를 암호화하는 유전자(리포터 유전자)의 발현을 유도하는 촉진인자 요소의 활성화 수준을 말해준다. 예를 들어 리포터 유전자는 단백질, 예컨대 활성이 정량될 수 있는 효소, 예컨대 알칼리성 포스파타아제(AP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 레닐라 루시퍼라아제 또는 반딧불이 루시퍼라아제 단백질(들)을 암호화할 수 있다. 리포터는 또한 형광 단백질, 예컨대 녹색 형광 단백질(GFP) 또는 GFP의 재조합 변이체들 중 임의의 것, 예컨대 향상된 GFP(EGFP), 청색 형광 단백질(BFP 및 기타 유도체), 시안색 형광 단백질(CFP 및 기타 유도체), 황색 형광 단백질(YFP 및 기타 유도체), 그리고 적색 형광 단백질(RFP 및 기타 유도체)을 포함한다.
"선택 가능 마커 유전자" 또는 "선택 마커 유전자"는 선택 가능한 마커를 암호화하고, 통상적으로는 배양 배지에 대응 "선택 제제"를 첨가함으로써 이 유전자를 함유하는 세포의 특이적 선택을 허용하는 유전자이다. 예시된 바와 같이, 항생제 내성 유전자가 양성 선택 가능 마커로서 사용될 수 있다. 오로지 이 유전자로 형질전환된 세포만이 대응 항생제의 존재하에 성장할 수 있어서 선택된다. 다른 한편, 형질전환되지 않은 세포는 이러한 선택 조건하에서 성장 또는 생존할 수 없다. 양성, 음성 및 2기능성 선택 가능 마커가 존재한다. 양성 선택 가능 마커는, 선택 제제에 대한 내성을 제공함으로써, 또는 숙주 세포에서의 대사 결함 또는 이화 결함을 보상함으로써, 형질전환된 세포의 선택과 이로 인한 증량을 허용한다. 이와는 반대로, 선택 가능 마커의 유전자를 받은 세포는 음성 선택 가능 마커에 의해 선택적으로 제거될 수 있다. 이의 일례로서는, 세포 내에서 발현될 때 아시클로버 또는 간시클로버가 동시에 첨가되면 사멸하는 단순 포진 바이러스의 티미딘 키나아제 유전자가 있다. 본 발명에 유용한 선택 가능 마커 유전자는 또한 증폭 가능한 선택 가능 마커를 포함한다. 문헌은, 다수의 선택 가능 마커 유전자, 예컨대 2기능성 (양성/음성) 마커(예를 들어 WO 92/08796 및 WO 94/28143 참조)를 기술하고 있다. 본 발명에 유용한 선택 가능 마커의 예들로서는 아미노글리코시드 포스포트랜스퍼라아제(APH), 하이그로마이신 포스포트랜스퍼라아제(HYG), 디하이드로폴레이트 리덕타아제(DHFR), 티미딘 키나아제(TK), 글루타민 신타아제, 아스파라긴 신타아제, 그리고 네오마이신(G418/제네티신), 퓨로마이신, 히스티디놀 D, 블레오마이신, 플레오마이신, 블라스티시딘 및 제오신에 대한 내성을 제공하는 유전자를 포함하나, 이에 한정되는 것은 아니다. 유전자 변형된 돌연변이체 및 변이체, 단편, 기능성 균등물, 유도체, 상동체 및 다른 단백질이나 펩티드와의 융합체도 또한 포함되되, 단 선택 가능 마커는 자체의 선택적 자질을 보유한다. 이러한 유도체는 선택성이 될 운명인 영역 또는 도메인 내 아미노산 서열에 있어 상당 수준의 상동성을 보인다.
선택은 또한, 예를 들어 세포 표면 마커, 세균 β-갈락토시다아제 또는 형광 단백질(예컨대 아에쿠오레아 빅토리아(Aequorea Victoria) 및 레닐라 레니포르미스(Renilla reniformis) 또는 기타 종 유래 녹색 형광 단백질(GFP) 및 이의 변이체; 비 생물발광 종(예컨대 디스코소마(Discosoma) 종, 아네모니아(Anemonia) 종, 클라뷸라리아(Clavularia) 종, 조안투스(Zoanthus) 종) 유래 적색 형광 단백질, 형광 단백질 및 이의 변이체)이 사용되는 형광 활성화 세포 분취(FACS)에 의해 이루어질 수 있다.
"선택 제제" 또는 "선택적 제제"란 용어는, 선택 제제의 효능을 경감시키는 임의의 선택 가능 마커 유전자의 생성물이 세포 내에 존재하지 않을 때, 세포의 성장 또는 생존을 방해하는 성분을 지칭한다. 예를 들어 형질감염된 세포 내에서 APH(아미노글리코시드 포스포트랜스퍼라아제)와 같은 항생제 내성 유전자의 존재에 대한 선택이 이루어지기 위해서 항생제 제네티신(G418)이 사용된다.
"증폭 가능한 선택 가능 마커 유전자"는, 보통 임의의 배양 조건 하에서의 진핵생물 세포 성장에 필요한 효소를 암호화한다. 예를 들어 증폭 가능한 선택 가능 마커 유전자는 디하이드로폴레이트 리덕타아제(DHFR) 또는 글루타민 신타아제(GS)를 암호화할 수 있다. 이러한 경우, 만일 마커 유전자가 형질감염으로 도입된 숙주 세포가 선택 제제 메토트렉세이트(MTX) 또는 메티오닌 설폭시민(MSX) 각각의 존재하에 배양되면, 마커 유전자는 증폭된다. 증폭 가능한 선택 가능 마커 유전자에 결합된 서열(즉 물리적으로 선택 가능 마커 유전자와 가까이에 있는 서열)은 증폭 가능한 선택 가능 마커 유전자와 함께 공동 증폭된다. 상기 공동 증폭된 서열은 동일한 발현 벡터 또는 별도의 벡터에 도입될 수 있다.
하기 표 1은 본 발명에 따라서 사용될 수 있는, 증폭 가능한 선택 가능 마커 유전자와, 이와 연관된 선택 제제의 비제한적 예를 제공한다. 증폭 가능한 선택 가능 마커 유전자로서 적합한 것도 또한 Kaufman에 의하여 개괄적으로 기술되었다[Kaufman RJ, 1990, Methods Enzymol. 185:537-566].
본 발명에 따르면, 증폭 가능한 선택 가능 마커 유전자로서 바람직한 것은, GS 또는 DHFR의 기능을 가지는 폴리펩티드를 암호화하는 유전자이다.
"부위 특이적 리컴비나아제"란 용어는, 특이적인 뉴클레오티드 서열(인지 부위)을 인지하고 나서, 이 부위에서 DNA 백본을 절단하여, 절단된 뉴클레오티드 서열들의 재배열을 수행한 다음, 이 서열들을 재결찰시키는 단백질을 지칭한다. 상기 리컴비나아제는, 예를 들어 인지 부위 쌍과, 이에 뒤 따르는 (절개된 DNA 단편 대신인) 관심 폴리뉴클레오티드 통합 부위 사이의 DNA의 절개를 허용하여, 유전 정보의 정확한 부위 특이적 교환을 제공한다. 몇몇 부위 특이적 리컴비나아제가 당 분야에 공지되어 있다. 예를 들어 Cre 리컴비나아제는 loxP 재조합 부위 또는 헤테로 특이적인 lox511 재조합 부위 중 어느 하나를 인지하는데, 이는 곧 loxP 및 lox511은 서로 재조합되지 않음을 의미한다. Cre/lox 시스템은, 예를 들어 문헌[Odell et al., Plant Physiol. 1994, 106(2), 447-58]에 기술되어 있다. Flp 리컴비나아제는, 예컨대 문헌[Lyznik et al., Nucleic Acids Res. 1996, 24(19), 3784-9]에 기술된 바와 같이 frt 재조합 부위를 인지한다. phiC31 인테그라아제는, 예컨대 문헌[Groth et al., Proc. Natl. Acad. Sci. U. S. A. 2000, 97(11), 5995-6000]에 기술된 바와 같이 부착 부위(att), 예컨대 attB(공여부위) 및 attP(수용부위)를 인지한다. Dre 리컴비나아제는, 예컨대 미국 특허 제7,422,889호에 기술된 바와 같이 rox 부위를 인지한다. 박테리오파아지 람다 유래 Int 리컴비나아제(람다 인테그라아제) 및 이의 재조합 부위는 문헌[Landy, Annu. Rev. Biochem. 1989, 58, 913-49]에 기술되어 있다.
본 발명에 따르면, "서열 특이적 DNA 편집 효소" 또는 "부위 특이적 뉴클레아제"는 한정된 뉴클레오티드 서열(인지 부위)에서 DNA의 절단을 가능하게 하는 단백질이다. 상기 절단은 상보성 DNA 가닥 2개 중 어느 하나 또는 둘다에서 일어날 수 있으므로, 예를 들어 표적화된 돌연변이발생, 특이적 게놈 DNA 서열의 표적화된 결실이 허용되거나, 또는 절단된 표적 DNA와 이종 폴리뉴클레오티의 부위 유도성 재조합이 초래된다. 상기 편집 효소의 서열 특이성은 편집 효소 내 서열 특이적 DNA 결합 단백질 도메인 하나 이상으로부터 기인될 수 있거나, 또는 편집 효소를, 안내 폴리뉴클레오티드에 대해 적어도 부분적 상보성을 보이는 DNA 서열로 안내하는 효소 결합 안내 폴리뉴클레오티드(예컨대 안내 RNA)로부터 기인될 수 있다. 따라서 상기 편집 효소의 인지 부위는 DNA 결합 단백질 도메인을 조작하거나, 대안적 안내 폴리뉴클레오티드를 사용함으로써 변경될 수 있다. 다수의 서열 특이적 DNA 편집 효소는 당 분야에 공지되어 있으며, 이의 비제한적 예들로서는 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제가 있다.
본 특허에서 사용된 바와 같은 "안정적인 통합" 또는 "안정적으로 통합된"이란 용어는, 폴리뉴클레오티드가 숙주 세포의 게놈 DNA로부터 분리된 채 유지되는 일시적 도입과는 반대로, 이종 폴리뉴클레오티드가 숙주 세포 게놈에 도입되는 것을 지칭한다. 적합한 통합은 상동성 재조합 또는 기타 유형의 재조합에 의해 일어날 수 있다. 안정적인 통합은 이종 폴리뉴클레오티드를 숙주 세포에 일시적으로 도입하는 단계를 포함할 수 있다.
적어도 하나의 이종 폴리뉴클레오티드의,
S100A
유전자 클러스터로의 안정적 통합
본 발명은 이종 폴리뉴클레오티드 적어도 하나가 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되어 포함된, CHO 세포에 관한 것인데, 단 (a) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류(상류 게놈 표적 영역이라 지칭됨)이고/이거나; (b) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류(하류 게놈 표적 영역이라 지칭됨)이다.
S100A3/A4/A5/A6 주 유전자 클러스터란, S100 칼슘 결합 단백질 A3(S100A3), S100 칼슘 결합 단백질 A4(S100A4), S100 칼슘 결합 단백질 A5(S100A5) 및 S100 칼슘 결합 단백질 A6(S100A6)을 암호화하는 중국 햄스터 유전자들을 이 순서대로 포함하는 게놈 영역, 즉 (서열 번호 4의 서열 또는 이의 상동체에 대응하는 CHO-K1 세포주의 전체 게놈 샷건 서열(NCBI 참조 서열: NW_003613854.1,)인 크리세튤러스 그리세우스 열외 게놈 스캐폴드, CriGri_1.0 스캐폴드682의 1,782,882번 내지 1,810,338번에 대응하는) S100A3에서 시작되어 S100A6으로 끝나는 영역을 지칭한다. S100A3/A4/A5/A6 주 유전자 클러스터의 게놈 표적 영역 상류란, 서열 번호 1의 서열에 대응하는 게놈 영역을 지칭한다. S100A3/A4/A5/A6 주 유전자 클러스터의 게놈 표적 영역 하류는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 영역을 지칭한다.
일 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 바람직하게는 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 더욱 바람직하게 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하는 상류 게놈 표적 영역 에 안정적으로 통합된다.
또 다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 바람직하게 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 더욱 바람직하게는 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는 하류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 상기 개시된 바와 같이 상류 게놈 표적 영역과, 하류 게놈 표적 영역에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나가 상류 게놈 표적 영역에 통합되고, 이종 폴리뉴클레오티드 적어도 하나가 하류 게놈 표적 영역에 안정적으로 통합된 경우, 게놈 표적 영역은 동일하거나 상이할 수 있다.
당업자는, 하나의 이종 폴리뉴클레오티드 또는 2개 이상의 상이한 이종 폴리뉴클레오티드의 복사체 하나, 복사체 다수 개가 상류 게놈 표적 영역, 하류 게놈 표적 영역, 또는 상류 게놈 표적 영역과 하류 게놈 표적 영역에 안정적으로 통합될 수 있음을 이해할 것이다.
적어도 하나의 이종 폴리뉴클레오티드는 게놈 표적 영역(들)의 대립형질 중 하나 또는 두 개에 안정적으로 통합될 수 있다.
다른 양태에서, 본 발명은 (a) CHO 세포를 제공하는 단계; (b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고, (i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]를 포함하는, CHO 세포를 제조하기 위한 방법에 관한 것이다.
일 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 바람직하게는 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 더욱 바람직하게 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하는 상류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 바람직하게 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 더욱 바람직하게는 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는 하류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드는 서열 번호 1의 서열 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류이다.
일 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 상류 게놈 표적 영역; 바람직하게는 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 상류 게놈 표적 영역; 더욱 바람직하게 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 상류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 하류 게놈 표적 영역; 바람직하게 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 하류 게놈 표적 영역; 더욱 바람직하게는 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 하류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드는 상기 개시된 바와 같은 상류 게놈 표적 영역과 하류 게놈 표적 영역에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나가 상류 게놈 표적 영역에 통합되고, 이종 폴리뉴클레오티드 적어도 하나가 하류 게놈 표적 영역에 안정적으로 통합된 경우, 게놈 표적 영역은 동일하거나 상이할 수 있다.
당 업자는, 하나의 이종 폴리뉴클레오티드 또는 2개 이상의 상이한 이종 폴리뉴클레오티드의 복사체 하나, 복사체 다수 개가 상류 게놈 표적 영역, 하류 게놈 표적 영역, 또는 상류 게놈 표적 영역과 하류 게놈 표적 영역에 안정적으로 통합될 수 있음을 이해할 것이다.
적어도 하나의 이종 폴리뉴클레오티드는 게놈 표적 영역(들)의 대립형질 중 하나 또는 두 개에 안정적으로 통합될 수 있다.
안정적 통합을 위한 방법은 당 분야에 널리 공지되어 있다, 요약하면, 안정적 통합은 보통 적어도 하나의 이종 폴리뉴클레오티드, 또는 적어도 하나의 이종 폴리뉴클레오티드를 함유하는 벡터, 즉 상기 이종 폴리뉴클레오티드(들)가 CHO 세포 게놈에 안정적으로 통합되는 것을 촉진하는 벡터를 CHO 숙주 세포에 일시적으로 도입함으로써 달성된다. 통상적으로 이종 폴리뉴클레오티드에는 상동성 팔, 즉 통합 부위에 대해 상류 및 하류인 영역에 상동성인 서열이 측접하고 있다. 이종 폴리뉴클레오티드를 본 발명의 CHO 세포에 도입하기 위한 벡터는 매우 다양한 벡터 시스템으로서 적합한 것, 예컨대 플라스미드, 레트로바이러스, 코스미드 및 EBV 유래 에피좀 등으로부터 선택될 수 있다. 다양한 셔틀 벡터, 예컨대 이.콜라이(E. coli)와 슈도모나스(Pseudomonas) 종과 같은 숙주 미생물 다수에서 자가복제할 수 있는 벡터가 사용될 수 있다. 원형 벡터가 CHO 숙주 세포에 도입되기 전, 이 벡터는 선형화되는 관계로 CHO 세포 게놈에의 통합이 촉진될 수 있다. 벡터를 CHO 세포에 도입하기 위한 방법은 당 분야에 널리 공지되어 있으며, 생물학적 방법에 의한 형질감염, 예컨대 바이러스 전달; 화학적 방법, 예컨대 양이온 중합체, 인산칼슘, 양이온 지질 또는 양이온 아미노산을 이용하는 방법; 물리적 방법, 예컨대 전기천공 또는 미세주입; 또는 혼합 접근법, 예컨대 원형질체 융합을 포함한다.
재조합 세포의 동정 또는 선택을 가능하게 하기 위해, 적어도 하나의 이종 폴리뉴클레오티드는, 바람직하게 동일 벡터상에 존재하는 선택 마커 유전자 또는 리포터 유전자와 함께 통합될 수 있다. 뿐 아니라 벡터는 종종 상동성 팔의 바깥쪽에 무작위 통합의 동정을 허용하는 마커를 포함한다.
일 구현예에서, 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드는 발현 카세트의 일부이다. 발현 카세트에는 유전자 생성물, 예컨대 RNA 및/또는 단백질을 암호화하는 이종 폴리뉴클레오티드 적어도 하나가 촉진인자에 작동 가능하도록 결합된 채 포함되어 있으며, 선택적으로 유전자 생성물(들)의 발현을 제어하는 추가의 수단을 포함한다. 이러한 수단으로서는 인핸서, 종결 신호, 폴리아데닐화 신호 및 3' 미번역 영역(통상적으로 폴리아데닐화 부위 함유)을 포함하나, 이에 한정되는 것은 아니다. 촉진인자는 약한 촉진인자이거나, 또는 관심 유전자 생성물의 높은 수준의 발현을 지원하는 강한 촉진인자일 수 있다. 상기 촉진인자로서는 CMV(거대세포바이러스) 촉진인자, SV40(유인원 액포형성 바이러스 40) 촉진인자, RSV(루 육종 바이러스) 촉진인자, 아데노바이러스 촉진인자(예컨대 아데노바이러스 주 후기 촉진인자(Adenovirus major late promoter; AdMLP), CHEF-1(CHO 유래 연장 인자-1) 촉진인자, 폴리오마 및 강한 포유류 촉진인자, 예컨대 원산 면역글로불린 및 액틴 촉진인자, 또는 이종 폴리뉴클레오티드 적어도 하나의 천연 촉진인자를 포함하나, 이에 한정되는 것은 아니다. 촉진인자는, 바람직하게 CMV 촉진인자 또는 SV40 촉진인자이고, 가장 바람직하게는 CMV 촉진인자이다. 폴리아데닐화 신호에 대한 예들로서는 BGH 폴리A, SV40 후기 또는 초기 폴리A가 있으며; 대안적으로, 면역글로불린 유전자의 3'UTR 등이 사용될 수 있다. 당 업자는 또한 3' 미번역 영역은, 예컨대 불안정 요소, 예컨대 ARE(아데닐레이트-우리딜레이트 풍부 요소; Adenylate-uridylate Rich Element)를 제거함으로써 높은 수준의 발현을 지원하도록 조작될 수 있음을 이해할 것이다.
몇몇 구현예들에서, 유전자 생성물은 증폭 가능한 유전자 선택 마커, 예컨대 디하이드로폴레이트 리덕타아제(DHFR), 글루타민 신타아제(GS)의 제어하에 놓일 수 있다. 증폭 가능한 선택 마커 유전자는 분비형 치료 단백질 발현 카세트로서 동일한 발현 벡터상에 존재할 수 있다. 대안적으로 증폭 가능한 선택 마커 유전자와 분비형 치료 단백질 발현 카세트는 상이한 발현 벡터상에 존재할 수 있되, 다만 이 경우에는 숙주 세포 게놈의 매우 가까이에 통합될 수 있다. 예를 들어 동시에 공동 형질감염되는 벡터 2개 이상은 종종 숙주 세포 게놈의 매우 가까이에 통합된다. 그 다음, 분비형 치료 단백질 발현 카세트를 함유하는 유전자 영역의 증폭은 증폭 제제(예컨대 DHFR에 대해서는 MTX, 또는 GS에 대해서는 MSX)를 배양 배지에 첨가함으로써 매개된다.
숙주 세포 또는 생산자 세포 내 유전자 생성물의 충분히 안정적으로 높은 수준은, 예컨대 이종 폴리뉴클레오티드 복사체 다수 개를 발현 벡터에 클로닝함으로써 달성될 수 있다. 전술된 바와 같이, 이종 폴리뉴클레오티드 복사체 다수 개를 발현 벡터에 클로닝하는 것과, 분비형 치료 단백질 발현 카세트를 증폭하는 것도 또한 조합될 수 있다.
관심 유전자 생성물을 암호화하는 이종 폴리뉴클레오티드 적어도 하나는 전장 또는 절단형 유전자, 융합 또는 태깅(tagging)된 유전자를 포함할 수 있고, cDNA, 게놈 DNA 또는 DNA 단편일 수 있으며, 바람직하게는 cDNA이다. 이는, 원산 서열, 즉 자연 발생 형태(들)를 포함할 수 있거나, 또는 원하는 바대로 돌연변이 또는 변형될 수 있다. 이러한 변형으로서는, 선택된 숙주 세포내 코돈 선호도를 최적화하는 코돈 최적화, 인간화, 융합 또는 태깅을 포함한다. 당업자는, 만일 하나를 초과하는 이종 폴리뉴클레오티드가 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합되면, 이 이종 폴리뉴클레오티드는 하나를 초과하는 발현 카세트에 의해 암호화될 수 있거나, 또는 예컨대 IRES(내부 리보좀 도입 부위) 서열로 격리된, 동일한 발현 카세트의 일부가 될 수 있음을 이해할 것이다.
다른 구현예에서, 이종 폴리뉴클레오티드는 관심 단백질 적어도 하나 및/또는 관심 RNA 적어도 하나를 암호화한다. 관심 RNA로서는 메신저 RNA(mRNA) 및 소형 조절 RNA, 예컨대 마이크로RNA(miRNA) 또는 소형 헤어핀 RNA(shRNA)를 포함하나, 이에 한정되는 것은 아니다. 바람직하게 관심 RNA는 mRNA, miRNA 또는 shRNA로 이루어진 군으로부터 선택되며, 더욱 바람직하게는 mRNA 또는 shRNA이다. 소형 조절 RNA는, (a) 숙주 세포 단백질(들)을 암호화하는 mRNA 내 표적 영역(들)에 결합함으로써 상기 숙주 세포 단백질(들) 하나 이상의 발현을 방해할 수 있다.
당업자는, 이종 폴리뉴클레오티드에 의해 암호화된 소형 조절 RNA는 숙주 세포 내에서 유관 과정, 예컨대 영양소 대사, 영양소 흡수, 전사, 번역, 단백질 폴딩(folding), 폴딩되지 않은 단백질 반응, 세포자살, 세포간 또는 세포내 신호전달, 세포 주기 제어, 세포 성장 또는 단백질 분비를 방해하는데 사용될 수 있음을 이해할 것이다. 따라서 본 발명은 CHO 숙주 세포를 조작함으로써, 세포 배양 또는 단백질 제조에 있어 이 CHO 숙주 세포의 특징을 개선하는데 유리하게 사용될 수 있다.
관심 RNA 및/또는 관심 단백질은 구성적으로 발현될 수 있거나 조건부로 발현될 수 있다. 예를 들어 관심 RNA 또는 관심 단백질의 발현은 성장 단계 동안 침묵되어 있다가, 단백질 제조 단계 동안 가동될 수 있다.
본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조 또는 사용되는 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나에 의해 암호화되는 관심 단백질은, 항체, 융합 단백질, 시토카인 또는 성장 인자, 림포카인, 부착 분자, 수용체, 그리고 이것들의 유도체나 단편, 그리고 효현제 또는 길항제로서 사용될 수 있으며/있거나 치료의 용도 또는 진단의 용도를 가지는 임의의 기타 폴리펩티드로 이루어진 군으로부터 선택되는 치료 단백질일 수 있다. 바람직하게 치료 단백질은 분비형 치료 단백질이다. 이종 폴리뉴클레오티드에 의해 암호화된 치료 단백질은 재조합 단백질, 바람직하게 분비형 재조합 단백질일 수 있다. 바람직하게 치료 단백질은 항체, 융합 단백질, 시토카인 또는 성장 인자로 이루어진 군으로부터 선택되고, 바람직하게는 항체 또는 융합 단백질이며, 가장 바람직하게는 항체이다. 다량체 단백질, 예컨대 항체는 하나 이상의 이종 폴리뉴클레오티드에 의해 하나 이상의 발현 카세트(들)의 일부로서 암호화될 수 있다.
당업자는, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조되는 CHO 세포의 게놈에 안정적으로 통합된 폴리뉴클레오티드 적어도 하나가 관심 RNA 적어도 하나와 관심 단백질 적어도 하나 두 가지를 암호화하여, 유리하게 CHO 세포 내 유관 과정들의 상기와 같은 변형과, 관심 이종 단백질의 발현을 조합함으로써 높은 수준 및/또는 안정적인 단백질 발현, 높은 수준 및/또는 안정적인 단백질 분비, 및/또는 특정의 양과 품질을 보이는 번역후 단백질 변형(들)을 촉진할 수 있음을 이해할 것이다.
다른 구현예에서, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조되는 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나는 마커 유전자이다. 이러한 마커 유전자는 재조합 세포와 비 재조합 세포의 구별 및/또는 관심 유전자 생성물의 발현 수준 정량을 가능하게 하는 임의의 유전자일 수 있다. 마커 유전자는 리포터 유전자 또는 선택 마커 유전자일 수 있다. 선택 마커는 이용된 CHO 숙주 세포의 대사 결함, 예컨대 글루타민 신타아제(GS) 결핍을 보상할 수 있다. 리포터 유전자는 알칼리성 포스파타아제(AP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 레닐라 루시퍼라아제 또는 반딧불이 루시퍼라아제 단백질(들)일 수 있다. 리포터 유전자는 또한 형광 단백질, 예컨대 녹색 형광 단백질(GFP) 또는 GFP의 재조합 변이체들 중 임의의 것, 예컨대 향상된 GFP(EGFP), 청색 형광 단백질(BFP 및 기타 유도체), 시안색 형광 단백질(CFP 및 기타 유도체), 황색 형광 단백질(YFP 및 기타 유도체), 그리고 적색 형광 단백질(RFP 및 기타 유도체)을 암호화하는 유전자를 포함한다. 바람직한 구현예에서, 리포터 유전자는 형광 단백질, 예컨대 GFP 또는 EGFP일 수 있다. 선택 마커는 또한 항생제 내성 유전자 또는 대사 마커 유전자, 예컨대 아미노글리코시드 포스포트랜스퍼라아제(APH), 하이그로마이신 포스포트랜스퍼라아제(HYG), 디하이드로폴레이트 리덕타아제(DHFR), 티미딘 키나아제(TK), 글루타민 신타아제, 아스파라긴 신타아제, 그리고 네오마이신(G418/제네티신), 퓨로마이신, 히스티디놀 D, 블레오마이신, 플레오마이신, 블라스티시딘 및 제오신에 대한 내성을 제공하는 유전자일 수 있다. 바람직한 구현예에서, 선택 마커 유전자는 디하이드로폴레이트 리덕타아제(DHFR) 또는 글루타민 신타아제(GS)이다.
몇몇 구현예에서, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조 또는 사용되는 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부이다. 바람직하게 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소, 예컨대 특이적 뉴클레아제에 대한 인지 부위(인지 서열)가 측접하고 있다. 더욱 바람직하게 발현 카세트에는 부위 특이적 리컴비나아제에 대한 인지 부위가 측접하고 있다. 부위 특이적 리컴비나아제는 당 분야에 널리 공지되어 있으며, 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp 또는 이것들의 임의의 유도체를 포함하나, 이에 한정되는 것은 아니다. 그러므로 발현 카세트에는 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp 또는 이것들의 임의의 유도체에 대한 인지 부위가 측접할 수 있다. 부위 특이적 뉴클레아제는 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제를 포함하나, 이에 한정되는 것은 아니다. 부위 특이적 뉴클레아제는 CHO 세포 게놈 내 표적 서열에 특이적으로 결합하도록 조작될 수 있음은 당 분야에 널리 공지되어 있다. 이는, 상기 인지 부위에 의해 막혀있는 발현 카세트 내 DNA 분절들의 표적화 교환을 촉진한다. 이종 폴리뉴클레오티드의 숙주 세포 게놈으로의 표적화된 통합을 도모함에 있어 부위 특이적 리컴비나아제 또는 부위 특이적 뉴클레아제의 사용은 일상적으로 수행되고 있으며, 각각의 방법은 당 분야에 널리 공지되어 있다. 몇몇 구현예에서, 부위 특이적 리컴비나아제 또는 부위 특이적 뉴클레아제에 대한 인지 부위를 포함하는 발현 카세트는 한정된 게놈 표적 영역의 재표적화를 허용할 수 있으며, 그 결과 다수의 유전자 생성물, 예컨대 관심 RNA 또는 관심 단백질에 대한 제조용 CHO 세포 다수가 생성될 수 있다.
특정의 구현예에서, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나는 마커 유전자이고, 마커 유전자는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되며, 발현 카세트에는 전술된 바와 같이 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제), 바람직하게 부위 특이적 리컴비나아제에 대한 인지 부위가 측접하고 있다. 이는, 마커 유전자를 포함하는 발현 카세트가, 관심 RNA 또는 치료 단백질을 암호화하는 이종 폴리뉴클레오티드를 포함하는 발현 카세트에 대항하여 용이하게 교환되도록 허용한다. 이처럼 관심 단백질을 암호화하는 이종 폴리뉴클레오티드를 포함하는 발현 카세트에 대항하여 용이하게 교환될 수 있는 마커 유전자를 암호화하는 치환 DNA는 또한 본원에서 "랜딩 패드"라 지칭된다.
일 구현예에서, 본 발명에 따른 CHO 세포의 제조를 위한 방법은 (a) CHO 세포를 제공하는 단계; (aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고, (i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및 (b) 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계를 포함한다. 바람직하게 제2 이종 폴리뉴클레오티드는 RNA 또는 치료 단백질, 바람직하게는 치료 단백질, 더욱 바람직하게는 분비형 관심 단백질을 암호화한다.
상기 제1 이종 폴리뉴클레오티드는, 바람직하게 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자를 암호화한다. 특정의 구현예에서, 리포터 유전자는 형광 단백질, 예컨대 GFP일 수 있다. 선택 마커는 디하이드로폴레이트 리덕타아제(DHFR) 또는 글루타민 신타아제(GS)일 수 있다. 리포터 유전자 및 선택 마커 유전자도 또한 조합될 수 있다.
바람직하게 상기 제1 이종 폴리뉴클레오티드는 부위 특이적 뉴클레아제, 더욱 바람직하게 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제의 군으로부터 선택되는 부위 특이적 뉴클레아제, 더욱더 바람직하게는 아연 핑거 뉴클레아제(ZFN), 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 또는 CRISPR 연관 뉴클레아제가 사용되는 표적화 통합에 의해 통합된다.
상기 제1 이종 폴리뉴클레오티드는 또한 부위 특이적 리컴비나아제의 인지 부위가 측접하고 있는 발현 카세트의 일부일 수 있다. 바람직하게 이는 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제에 대한 인지 부위를 포함한다.
또한 제2의 이종 폴리뉴클레오티드를 포함하는 발현 카세트는, 상기 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 치환함으로써 CHO 세포에 도입될 수 있다. 바람직하게 상기 제2의 이종 폴리뉴클레오티드는 적어도 하나의 RNA 및/또는 적어도 하나의 단백질을 암호화한다. 더욱 바람직하게 제2의 이종 폴리뉴클레오티드는 mRNA, miRNA 또는 shRNA 및/또는 치료 단백질을 암호화한다. 제2 이종 폴리뉴클레오티드를 포함하는 상기 발현 카세트는 표적화된 통합, 바람직하게 부위 특이적 뉴클레아제 또는 부위 특이적 리컴비나아제의 사용, 더욱 바람직하게 부위 특이적 리컴비나아제의 사용, 가장 바람직하게 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제의 사용을 통해 CHO 세포 게놈에 안정적으로 도입될 수 있다.
바람직한 구현예에서, CHO 세포의 제조를 위한 방법은, 부위 특이적 리컴비나아제에 대한 인지 부위와 마커 유전자를 포함하는 제1 이종 폴리뉴클레오티를 포함하는 발현 카세트를 도입하는 단계[단 상기 제1 폴리뉴클레오티드는 부위 특이적 뉴클레아제가 사용되는 표적화 통합에 의해 CHO 세포 게놈에 안정적으로 통합됨]를 포함한다. 또한 제1 이종 폴리뉴클레오티드를 포함하는 상기 발현 카세트는, 부위 특이적 리컴비나아제가 사용되는 표적화 통합을 통하여 관심 RNA 및/또는 관심 단백질을 암호화하는 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트에 의해 치환된다. 바람직한 구현예에서, 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트와, 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트에는 부위 특이적 리컴비나아제에 대한 동일 인지 부위가 측접하고 있다.
당업자는 이러한 방법이, 용이하게 적용 가능한 DNA 제조합 방법에 의해 관심 유전자 생성물의 안정적이고 높은 수준의 발현을 지원하는 게놈 좌위 내에 임의의 이종 폴리뉴클레오티드를 도입하기 위하여 재차 표적화될 수 있는 게놈 표적 부위를 포함하는 CHO 세포를 제공함을 이해할 것이다. 이는, 세포주 개발 과정에서 제조용 CHO 세포 클론을 생성 및 동정하는 것과 관련하여 시간과 비용을 엄청나게 줄여줄 수 있다.
CHO 세포
본 발명의 CHO 세포 또는 본 발명의 방법에 의해 제조된 CHO 세포는 배양액중에서 성장할 수 있고, 관심 RNA 또는 관심 단백질을 발현할 수 있는 임의의 중국 햄스터 난소 세포일 수 있다. 대규모의 산업적 제조에 보통 사용되는 CHO 세포는 종종 제조 과정에서 자체의 특징을 개선하거나, 또는 재조합 세포의 선택을 촉진하도록 조작된다. 이러한 조작으로서는 세포자살 내성 증가, 자가포식 감소, 세포 증식 증가, 세포주기 조절 단백질 발현의 변경, 샤페론 조작, 폴딩되지 않은 단백질 반응(UPR)의 조작, 분비 경로의 조작 및 대사 조작을 포함하나, 이에 한정되는 것은 아니다.
바람직하게 효율적인 세포주 개발 방법의 실현을 허용하는 CHO 세포는, 예컨대 메티오닌 설폭시민(MSX) 또는 메토트렉세이트 각각에 의한 선택이 촉진되도록 글루타민 신타아제(GS) 녹아웃 및/또는 디하이드로폴레이트 리덕타아제(DHFR) 녹아웃을 통해 대사 조작된다.
바람직하게 본 발명의 CHO 세포 또는 본 발명의 방법에 이해 제조된 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS) 결핍 세포 또는 이 세포들 중 임의의 것의 유도체이다.
CHO 세포는, 이것이 무혈청 조건하에서, 그리고 선택적으로는 동물 기원의 임의의 단백질/펩티드가 존재하지 않는 배지 중에서 확립, 적응 및 완전 배양될 때가 가장 바람직하다. Ham F12 배지(Sigma, Deisenhofen, Germany), RPMI-1640 배지(Sigma), Dulbecco 개질 Eagle 배지(DMEM; Sigma), 최소 필수 배지(MEM; Sigma), Iscove 개질 Dulbecco 배지(IMDM; Sigma), CD-CHO 배지(Invitrogen, Carlsbad, CA), 무혈청 CHO 배지(Sigma), 그리고 무 단백질 CHO 배지(Sigma)와 같은 시판중인 배지는 적당한 영양 용액의 예들이다. 배지 중 임의의 것은 필요에 따라 다양한 화합물이 보충될 수 있는데, 이러한 화합물의 비제한적 예로서는 재조합 호르몬 및/또는 기타 재조합 성장 인자(예컨대 인슐린, 트랜스페린, 표피 성장 인자, 인슐린 유사 성장 인자), 염(예컨대 염화나트륨, 인산칼슘, 인산마그네슘), 완충제(예컨대 HEPES), 뉴클레오시드(예컨대 아데노신, 티미딘), 글루타민, 글루코스 또는 기타 동등한 에너지원, 항생제 및 미량 원소가 있다. 기타 임의의 필요 보충물이 또한 당 업자에게 공지된 적당한 농도만큼 포함될 수 있다. 유전적으로 변형된 세포로서, 선택 가능한 유전자를 발현하는 세포의 성장과 선택을 위해, 적합한 선택 제제가 배양 배지에 첨가된다.
단백질 제조
일 구현예에서, 본 발명의 CHO 세포 또는 본 발명의 방법에 의해 제조된 CHO 세포는 관심 단백질의 제조를 위해 사용될 것이다. 관심 단백질은, 숙주 세포 내에서 항체 분자의 발현이 허용되기에 충분한 기간 동안 본 발명의 CHO 세포를 배양함으로써 제조된다. 관심 단백질은 발현 후 수집되고, 정제될 수 있다. 바람직하게 관심 단백질은 당 분야에 널리 공지된 기법이 사용되어 배양 배지로부터 분비형 단백질로서 회수되어 정제된다.
예를 들자면, 최신 기술의 정제 방법으로서, 본 발명의 분비형 재조합 치료 단백질의 수득에 유용한 정제 방법은, 제1 단계로서 배양 배지 또는 용해물로부터 세포 및/또는 미립자형 세포 파편을 분리하는 단계를 포함한다. 그 다음, 분비형 치료 단백질은, 예를 들어 면역친화성 또는 이온교환 컬럼상에서의 분획화, 에탄올 침전, 역상 HPLC, Sephadex 크로마토그래피, 실리카 또는 양이온 교환 수지상 크로마토그래피에 의해 가용성 오염 단백질, 폴리펩티드 및 핵산으로부터 정제된다. 항체 또는 Fc 융합 단백질은, 예컨대 단백질 A 스핀 컬럼(GE Healthcare)이 사용되는, 예컨대 표준 단백질 A 크로마토그래피에 의해 정제될 수 있다. 단백질의 순도는 환원성 SDS PAGE에 의해 확증될 수 있으며, 단백질 농도는 280 nm에서의 흡광도 측정과, 단백질의 비 흡광 계수(specific extinction coefficient)를 이용함으로써 확정될 수 있다. 마지막으로, 정제된 분비형 재조합 치료 단백질은 건조, 예컨대 동결건조될 수 있다.
일 구현예에서, 본 발명의 CHO 세포는 관심 단백질을 높은 수율로 제조하는데 사용된다. 이러한 높은 수율의 제조는 높은 세포 밀도 또는 높은 세포 생존률을 통해 달성될 수 있다. 높은 수율의 제조는 또한 높은 비 세포 생산성을 통해 달성될 수 있다. 그러나 당업자는, 비 세포 생산성이 실질적으로 영향을 받지 않거나 심지어 개선되지 않는 경우, 높은 세포 밀도 또는 세포 생존률 달성은 오로지 관심 단백질의 높은 총 수율을 지원할 뿐임을 이해할 것이다. 유사하게, 세포 밀도 또는 세포 생존률이 실질적으로 영향을 받지 않거나 심지어 개선되지 않는 경우, 높은 비 세포 생산성 달성은 오로지 분비형 재조합 치료 단백질의 높은 총 수율을 지원할 뿐임을 이해할 것이다. 그러므로 높은 수율의 제조란, 통상 농도(역가)(예컨대 mg/mL)로서 측정되는, 세포 배양액의 전체 생산성을 높은 정도로 달성하는 것을 지칭한다. 본 발명에 따른 관심 단백질의 제조는, 만일 대조군 CHO 세포, 즉 게놈에 무작위로 통합된 동일 이종 폴리뉴클레오티드들을 포함하는 CHO 세포, 바람직하게는 클론 선택이 이루어지지 않은 CHO 세포 풀의 단백질 제조에 비하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 75%, 적어도 100% 또는 적어도 200%까지 향상되면, 증가한 것이다.
실시예
통합 좌위는 유전자 발현 데이터를 평가하여 동정하였다. 칼슘 결합 단백질을 암호화하는 유전자 S100A6은 모든 실험 조건을 통틀어서 높은 수준으로 발현되는 것이 파악되었으므로, 높은 이종 단백질 발현을 지원하는 게놈 좌위에 대한 마커로서 사용할 수 있다. S100A6은 S100 유전자 클러스터의 일부이므로; 전체 클러스터를 평가하였다.
세포 선택 및 유지
활성 DHFR 카세트에 의한 보완에 앞서서 CHO-DG44 세포의 일상적인 계대배양을 위해 상표가 등록된 배지를 사용하였다. 선택 배지를 포함하는 MTX는, DHFR 발현 카세트 통합이 이루어진 세포를 증량시키기 위해 형질감염 이후에 사용하였다. CHOZN GS 세포주의 경우, 850 mg/l의 L-Gln(6 mM)이 보충된 시판 배지 CD Fusion(Sigma Aldrich)을 사용하였다. TPP 진탕용 튜브에서 세포주를 계대배양하였다[1주일마다 2-2-3(CHO-DG44) 계대배양 계획에서는 0.3e6개 세포/ml만큼, 또는 1주일마다 2-2(CHOZN GS-/-) 계대배양 계획에서는 0.6e6개 세포/ml만큼]. 배양액을 대상으로 자동화 Vicell 기기로 계수하였다.
풀 모두를 대상으로, 하이포잔틴 티미딘(HT) 보충물을 CHO-DG44 세포주(DHFR-/-)로부터 제거하거나, 또는 L-Gln을 CHOZN GS 세포주(GS-/-)로부터 제거하여 대사 선택을 수행하였다. 형질감염 과정 이후, DHFR 또는 GS 공여체를 수용하지 않았던 부모 세포에 대항하여 선택하기 위한 선택을 실시하였다. 선택 과정을 거친 풀을 선택 배지에 영구적으로 유지시켰다. 선택을 수행할 때, 세포를 T75 고정형 플라스크에 1 ml당 0.4e6개 세포만큼 접종하였다(총 부피: 10 ml ~ 12 ml). 전체 플라스크 내용물을 스핀 다운(spin-down)시키고, 동일 부피의 새로운 배지 중에 세포를 재현탁함으로써, 선택 배지를 보통 7일 후에 바꾸어주었다. 선택된 세포가 "회수"되어 성장을 재개하게 되면, 적당히 이 세포의 규모를 키워 TPP 튜브에 옮겼다. 성능 평가를 진행하기에 앞서 세포를 유가식으로 선택 배지 중에 영구적으로 유지시켰다.
표적화
통합을 위한
ZFN
기법
SAFC로부터 시판되고 있는 CompoZr 아연 핑거 뉴클레아제(ZFN)를 검정 지침에 따라 표적화 통합을 위해 사용하였다. 각각의 ZFN을, 제공된 표적 서열(예컨대 서열 번호 11의 서열)(ZFN 13) 각각의 정보를 바탕으로 SAFC에 주문 제작을 의뢰하여 제조하였다.
ZFN 뉴클레오티드 서열은 각각의 ZFN 팔에 고유하였고, FokI 도메인에 결합하였다. ZNF 팔을 암호화하는 DNA를 pVAX 플라스미드 백본에 클로닝하였다. 이 플라스미드는 번역이 이루어지는 동안 분리를 위한 2A 펩티드가 결합된, ZFN 서열의 GFP 또는 RFP 리포터 카세트 상류를 함유하였다. ZFN 팔은 mRNA로서 형질감염시켰다. ZFN을 암호화하였던 DNA의, RNA로의 시험관 내 전사를 위해, 제조자의 지침에 따라 mMessage mMachine T7 Ultra 키트(Ambion)를 사용하였다. 즉 형질감염을 위해 사용된 mRNA 2개 중, 하나는 서열(예컨대 ZNF13)에 특이적인 ZNF 팔을 암호화하였고, GFP와 또 다른 하나는 상보성 서열을 표적화하는 ZNF 팔을 암호화하였으며, ZFN 팔의 형질감염과 함께 RFP. GFP 또는 RFP를 발현시켜, 형질감염시킨 풀의 신속하고 용이한 증량을 유세포 분석법에 의해 허용하였다. ZFN 팔 둘 다를 수용하였던 세포는 GFP와 RFP에 양성이었다. 이러한 이중 양성 세포를 수집하여 ZFN 활성에 대해 증량된 풀을 구축하였다.
형질감염 프로토콜
형질감염을 위해, Bio-Rad Gene Pulser를 사용하여 전기천공을 실시하였다. 2 mm 큐벳 내 1e6개 세포를, 총 DNA 및/또는 mRNA 약 20 ug을 사용하여 형질감염시켰다(설정조건: 115V, 950uF, 저항 무한대). ZFN은 항상 mRNA로서 형질감염되었으며, 관심 단백질을 함유하는 공여 플라스미드는 DNA로서 형질감염되었다. 동일한 배지 중에서 세포를 형질감염시킨 후 배양하였다. 형질감염 후 세포를 2주 ~ 3주 동안 배양하여, 그 어떤 일시적 플라스미드도 남지 않도록 씻어낼 수 있었다.
세포 검정 -
ZFN
활성
세포 내 ZFN의 절단 효율을 측정하기 위해, CEL-I 또는 SURVEYOR 뉴클레아제 검정을 실시하였다. 요약하면, 형질감염시킨 풀로부터 정제한 게놈 DNA를 주형으로 사용하여 표적 영역을 PCR 증폭하였다. 활성 ZFN 존재하에 게놈 DNA를 야생형 및 NHEJ 생성물(표적 부위에서의 삽입 또는 결실)의 혼합물로 전환하였다. PCR 생성물을 고온에서 변성시키고 나서, 이 온도를 점진적으로 낮추어 잡종화를 허용하였다. 몇몇 야생형 및 NHEJ 생성물은 잡종화되어 절단 부위의 주변에 미스매칭부를 가지는 이중 가닥 DNA를 형성하였는데, 이 DNA는 CEL-I 또는 SURVEYOR이라 칭하여지는 효소에 의해 절단됨으로 말미암아, 전기영동에 의해 분리 및 시각화될 수 있는 절단 생성물을 생성할 수 있었다.
접합
PCR
(
jPCR
)
jPCR은 서열의 게놈으로의 통합을 동정하는데 사용하였다. 프라이머를, 측접 게놈 DNA 서열의 경계에서 공여 분자의 5' 말단 또는 3' 말단을 증폭시키도록 디자인하였다. 프라이머 하나는 ZFN 절단 부위에 가까운 게놈 서열에 특이적이었고, 제2 프라이머는 공여 서열에 특이적이었다. 공여 DNA가 지정딘 좌위에서 올바른 배향으로 통합된 경우, PCR 생성물이 수득된다. jPCR은, 특히 TI 현상 및 RI 현상의 조합이 일어난 풀에 비특이적 밴드를 생성할 수 있었다. 게다가 TI 공여체는 게놈 좌위에 상대적인 배향들 중 어느 하나의 배향으로 통합될 수 있다. 달리 명시되지 않는 한, 정 배향으로 깔끔하게 통합된 공여체를 스크리닝하는 프라이머를 사용하여 jPCR을 수행하였다. 이로부터 얻어진 TI jPCR 밴드는 통상 서열결정에 의해 확인하였다. 부모 세포주 gDNA 및/또는 공여 DNA는 음성 대조군으로 사용하였다.
IgG
발현 세포의
FACS
증량
FACS Aria III 기기를 사용하여 유세포 분석법 또는 형광 활성화 세포 분취법(FACS)을 통해 세포의 임의의 아집단을 증량시켰다. 통상적으로, 세포를 IgG 발현 및 GFP 음성 세포, 제거 비발현 세포 및 GFP 발현 세포로 분취하였다. FACS를 위해 세포를 스핀다운하여 PBS에 재헌탁함으로써 세포를 준비하였다. IgG 검출을 위해, 분취에 앞서 세포를 형광 표지화 항 IgG 항체와 함께 30분 동안 항온처리하였다. 표면 결합 IgG와 임의의 세포를 결합시키기 위해 R-피코에리트린 표지화 항체를 사용하였다.
생산성/
역가
FACS 증량한 풀을 7일 또는 13일간의 유가 방식으로 CHO DG44 세포 또는 CHOZN GS 세포 각각에 대해 평가하였다. CHO DG44 유래 풀에 대한 생산성 발현 및 역가 평가를 그 상표가 등록된 기저 배지 및 공급물을 이용하여 수행하였다. CHOZN GS 생산성 발현을, Ex-Cell® CHOZN® Platform Feed를 보충한 CD Fusion 중에서 수행하였다. 생성물 농도를 ForteBio Oct를 통해 분석하였다.
실시예
1:
통상적으로 CHO 세포의 숙주 세포 게놈에 이종 폴리뉴클레오티드를 무작위로 통합하여(즉 무작위 통합(RI)에 의하여) 제조용 CHO 세포 클론을 수득하였다. 위치선정 효과는 주로 저 생산자 세포와, 고 생산자 세포의 단지 작은 아집단으로 이루어진 고도로 이종성인 세포 집단을 형성하였다. 게다가 고 생산자 세포는 저 생산자 세포에 의거하여 과성장하는 경향이 있다. 이종 단백질의 믿을 수 있고, 높은 수준을 보이는 제조를 위한 부위(즉 "핫 스팟")로서 중국 햄스터 S100A 유전자 클러스터의 잠재성을 평가하기 위해, 전술한 바와 같이 서열 번호 11의 DNA 서열에 특이적이 되도록 조작된 아연 핑거 뉴클레아제 쌍(ZFN 13)을 사용하여, IgG 항체를 암호화하는 폴리뉴클레오티드를 CHO-DG44 및 CHOZN GS 세포의 게놈에 안정적으로 통합하였다.
ZFN 활성을 확인하고, 공여 플라스미드를 준비한 후, 전기천공을 통해 IgG 항체와 표적 특이적 ZFN 13 쌍을 암호화하는 발현 카세트를 함유하는 비 선형화 플라스미드로 세포를 공동형질감염시켰다. 그러므로 관심 IgG 단백질을 암호화하는 공여 플라스미드는 상동성 재조합을 통해, 또는 무작위로 선형화되었다. 세포에 48시간 동안 냉각 충격(30℃)을 가하여, ZFN mRNA의 잠복성과 절단 효율을 개선하였다. 전기천공후 4일차 또는 5일차에, 게놈 DNA를 수집하여 미스매치 특이적 뉴클레아제 검정, 즉 Cel I 검정을 수행함으로써, ZFN 활성을 확인하였다.
형질감염 후, 10일 내지 12일 동안 세포를 배양한 후 분취하여 일시적으로 형질감염한 공여 플라스미드 그 어떤 것도 남아있지 않도록 완전히 씻어냈다. CHO 세포를 원심분리에 의해 수집하여 대사 선택을 위해 배지 중에 재접종하였는데, 즉 CHOZN GS 세포의 경우에는 L-글루타민이 결핍된 배지에, CHO-DG44 세포의 경우에는 하이포잔틴 및 티미딘 보충(HT 보충)이 이루어지지 않은 배지에 재접종하였다. 이로부터 5일 ~ 10일 이내에 배양액을 회수하기 시작하였다. 대조군인 가 배양액은 플라스미드를 형질감염시키지 않은 채로 배양하였다. 대조군 배양액은 그 어떤 실험에서도 성장을 보이지 않았다.
대사 선택 과정 이후, GFP 및 IgG 발현 여부를 바탕으로 형광 활성화 세포 분취법(FACS)을 이용하여 FACS Aria III 기기(BD Biosciences)에서 세포를 분취하였다. IgG 검출을 위해, 분취에 앞서 세포를 형광 표지화 항 IgG 항체와 항온처리하였다. 표면 결합 IgG와 임의의 세포를 결합시키기 위해 R-피코에리트린 표지화 항체를 사용하였다. CHO 세포를 GFP 발현 집단(GFP+)과 GFP 비발현 집단(GFP-)으로 분취하였다. 표적화 통합을 위한 상동성 팔이 측접하고 있는, 항체를 발현하는 공여 플라스미드는 상동성 팔 외부에 위치하는 GFP 암호화 발현 카세트를 추가로 함유하였다. 따라서 GFP 발현은 무작위 통합 현상과 연관되었으며, GFP 음성 집단을, 표적화 통합이 일어난 세포에 대해 증량시켰다. GFP+ 세포 대 GFP- 세포의 분포 및 백분율은 표적화 통합 효율에 대한 좋은 지표였을 뿐 아니라, 표적화 통합 부위에서의 임의의 양성 또는 유해 표현형에 대한 좋은 지표이기도 하였다. 대사 선택을 위해, GFP 음성 세포 풀과 GFP 양성 세포 풀을 각각 30 mL들이 TPP 튜브에서 배양하였다(기본 먹이 공급 및 글루코스 전략 이용). 배양액을 대상으로, 생존 세포 밀도(VCD), 생존율 및 배지중 글루코스 수준에 대해 모니터링하였다. 희석한 상청액 중 IgG 역가를, ForteBio Octet 시스템(Pall Biosciences)을 이용하여 항체의 상호작용을 직접 측정하고, 앞서 확립한 표준 곡선을 사용하여 확정하였다.
IgG 항체를 암호화하는 동일 폴리뉴클레오티드를 사용하여 표적화 통합(TI) 또는 무작위 통합을 통해 얻어진 CHO 풀의 통합에 대한 역가를, CHO-DG44 세포의 회분식 배양 3일 내지 7일 후(도 1의 A)에, 그리고 CHOZN GS 세포의 회분식 배양 8일 내지 10일 후(도 1의 B)에 측정하였다. 표적화 통합에 의해 수득된 CHO-DG44 풀의 역가는 무작위 통합에 의해 수득된 CHO 풀의 역가보다 적어도 7배 더 높았는데(도 1의 A). 이는 S100A3/A4/A5/A6 유전자 클러스터의 상류 영역이 이종 폴리뉴클레오티드 통합에 대해 핫 스팟임을 암시하는 것이다. 무작위 통합에 의해 수득된 세포의 IgG 역가에 비해 적어도 8배 더 높은 IgG 역가를 표적화 통합에서 보였던 CHOZN GS 세포에 대해서도 유사한 결과가 얻어졌다.
실시예 2
무작위 통합은 이종 단백질 발현에서 고도로 이종인 세포 풀을 형성하였다. 중국 햄스터 S100A 유전자 클러스터 내 표적화된 통합이 더욱 균질한 발현 수준을 달성하고, 생산성의 관점에서 더 높은 예측가능 정도를 달성하였는지 여부를 평가하기 위해, 실시예 1의 TI 세포 풀과 RI 세포 풀로부터 개별 클론을 선택하였다.
실시예 1에서 얻어진, CHOZN GS 세포의 표적화 통합 풀과 무작위 통합 풀을 사용하여 단일 세포 클론(SCC)을 수득하였다. 조정 배지를 사용하여 증량한 TI 및 RI 풀의 희석을 제한함으로써 단일 클로닝 과정을 진행하였다. 세포를 TPP 튜브에서 48시간 동안 0.3e6개 세포/ml가 되도록 배양하여 조정 배지를 제조하였다. 세포를 침전시키고 나서, 조정 배지를 멸균 여과하였다. 하기 단계에 따라 클로닝 배지(SAFC 융합 플랫폼) 및 조정 배지의 80:20 혼합물중에 접종을 수행하였다. 단계 1: 웰당 1개 미만의 세포가 될 때까지 희석한 연속 희석액을 96웰 평판에 넣었다(웰당 200 μl). 단계 2: 보통의 조건하에서 세포를 항온처리한 다음, 6일 ~ 7일 동안 과성장하도록 허용하였다. 단계 3: 과성장한 단일 콜로니에 대해 평판을 스크리닝하였다. 이때, 웰을 새 선택 배지 20 μl로 채웠다. 단계 4: 세포를 약 14일 동안 배양하여, 96웰 평판에서 합류상태가 되도록 만들었다. 세포의 규모를 키워서 필요에 따라 24웰 평판으로 옮기거나 수집하였다. 단계 5: 원할 경우 96웰 단에서 클론 스크리닝을 위한 gDNA를 수득하였다. 세포 임의의 부피만큼을 96웰로부터 분리한 다음, 후속 PCR 및 스크리닝을 위해 Quick Extract를 사용하여 수집하였다. 나머지 세포는 계속해서 과성장하였으며, 선택적으로는 단계 4에 기술한 바와 같이 그 규모를 키웠다. 단계 6: 원하던 클론 집단의 규모를 키워 TPP 튜브에 옮겼으며, 성능 평가를 위해 사용하였다.
무작위 통합 또는 표적화 통합으로부터 얻은 CHOZN GS 단일 세포 클론을, 60회차 계대배양 전후에 유가 방식으로 8일 동안 배양한 후 단백질 제조에 대해 평가하였다. Ex-Cell® CHOZN® Platform Feed를 보충한 CD Fusion에서 제조 발현을 진행시켰다. ForteBio Octet를 통해 생성물 농도를 분석하였으며, 60회차 계대배양 전후에 동일 클론으로부터 데이터를 수집하였다(n = 각각 2, 총 n = 4).
분석은, 표적화 통합이 이루어진 집단에서 유래한 단일 클론(도 2의 A)은, 무작위 통합이 이루어진 집단에서 유래한 단일 클론(도 2의 B)에 비해, 매우 균질한 역가를 보였음을 보여주는데, 이는 S100A 유전자 클러스터 내 표적화된 통합이 예측 가능한 단백질 생산성을 달성하였음을 나타낸다. 60회차 계대배양 전후에 동일 클론으로부터 수집한 데이터의 오차 막대가 더 작음에 의해 반영되는 바에 따르면, 표적화 통합된 클론은 또한 더욱 안정적이었다.
실시에 3:
S100A 유전자 클러스터 내 핫 스팟 좌위를 확증하기 위해, TI를 위한 다수의 추가 아연 핑거 뉴클레아제를 표 3에 보인 바와 같이 디자인 및 제조하여, 실시예 1에 기술된 바와 같은 생산성 풀을 형성하였다. 도 3의 A는, NCBI 참조 서열: NW_003613854.1을 가지는 S100A 유전자 클러스터 내 핫 스팟 좌위와 개별 ZFN들의 위치를 보여주는 것이다. "비 파괴적 및 생산적" 부위, "비 파괴적 및 저/비 생산적" 부위, 그리고 "파괴적 및 저/비 생산적" 부위로 분류되는 ZNF 7 ~ 14의 통합 부위들을 도시하였다.
실시예 1에 기술된 바와 같이, CHO-ZN GS 세포를 사용하여 데이터를 구하였다. 상이한 게놈 좌위 8개를 시험하여, S100A3/A4/A5/A6 주 유전자 클러스터에 상대적인 그 어떤 영역이 이종 유전자 생성물 제조에 유리한지 여부에 대해 평가하였다. S100A3/A4/A5/A6 주 유전자 클러스터에의 통합이 예측되는 바와 같이 감소한 생산성을 초래하는지 여부도 또한 시험하였다(도 3의 B).
(서열 번호 3의 뉴클레오티드 서열을 포함하는) 부 클러스터 S100A1/A13/A14/A16에 통합되는, 표적을 벗어난(off-target) ZFN(7)은, 임의의 유전자가 사이에 끼어들지 않았음에도 불구, 핫 스팟 외부에 존재하는 관계로 더 낮은 발현 수준을 보일 것으로 예측되었다. (서열 번호 4의 뉴클레오티드 서열을 포함하는) S100A3/A4/A5/A6 주 유전자 클러스터에 통합되는, 파괴적 ZFN(10, 11)은 내인성 유전자를 손상시킬 수 있으므로, 달성 가능한 전체 역가의 감소 또는 생존률 감소 중 어느 하나를 달성할 것으로 예측되었다. 서열 번호 1의 뉴클레오티드 서열을 가지는 상류 영역에 통합되는 상류 ZFN(8 및 9)과, 서열 번호 2의 뉴클레오티드 서열을 가지는 하류 영역에 통합되는 하류 ZFN(12, 13, 14)은 최상의 역가를 보일 것으로 예측되었지만, 단백질 발현을 지원하기 위해서는 주 클러스터로부터 최적의 거리만큼 떨어져 있을 수 있는 것으로 에측되었다.
개별 세포 집단을 수득하기 위해, CHO 세포를 공여 플라스미드로 형질감염한 다음, 표 3에 개시된 바와 같은 ZFN을 사용하여 실시예 1에 기술된 바와 같이 선택하였다. 생성된 항체는 실시예 1의 항체와 동일하였다. CHO 풀의 역가는 전술된 바와 같이 8일 동안 배양한 후 상청액을 대상으로 측정하였다.
각각의 좌위로의 표적화 통합으로 말미암는 실제 역가를 도 3의 A에 보였다. 표적을 벗어난 TI와, 파괴적 TI(ZFN 7, 10, 11)는 단백질 발현을 지원하지 않았다. 상류 TI 풀과 하류 TI 풀 둘다는 항체 역가를 보였지만, 이 역가에는 차이가 관찰되었는데, 이는 S100A3/A4/A5/A6 주 유전자 클러스터와 관련된 최적의 통합 거리가 얼마만큼인지를 나타낸다. ZFN 쌍(8)은 우수한 단백질 생산성을 지원하였으나, 상류 통합 영역에 있는 ZFN 쌍(9) 부위는 거의 0.5 g/l에 달하는 가장 높은 풀 역가를 달성하였다. 하류 ZFN 쌍(13) 및 하류 ZFN 쌍(12)은 둘다 우수한 단백질 생산성을 보였지만, S100A3/A4/A5/A6 주 유전자 클러스터를 기준으로 더욱 멀리 떨어져 있는 쌍(13)이 더 높은 역가를 보였다. 또한 ZFN 쌍(14)은 너무 멀리 떨어져 있어서 적당한 생산성을 지원하지 못하는 것으로 보였다. 결국 역가는, S100A3/A4/A5/A6 주 유전자 클러스터 내 유전자를 파괴하는 표적화 통합 또는 S100A3/A4/A5/A6 주 유전자 클러스터 외부이되 바로 근접한 곳에서 일어난 표적화 통합은 얻어진 세포 집단의 적은 IgG 제조를 초래하였던 반면에, S100A3/A4/A5/A6 주 유전자 클러스터의 상류 및 하류에 있는 영역으로의 통합은 얻어진 세포 집단의 많은 IgG 제조를 달성하였다. 이 점은, S100A3/A4/A5/A6 주 유전자 클러스터가, S100A3/A4/A5/A6 단백질 암호화 유전자의 상류 또는 하류로부터 가까운 거리에 있는 게놈 표적 영역 내 통합 위치들에 대해 높은 수준이면서 믿을 수 있는 단백질 제조를 지원하는, 적합한 게놈 표적 영역임을 확인시켜준다.
실시예 4:
표적 서열의 더 우수한 적용가능성과 더 용이한 통합을 위해, 마커 유전자와 같은 대체수단으로서, 예컨대 부위 유도성 재조합 기법, 예컨대 Flp-FRT 재조합 또는 Cre-lox 재조합을 이용하여 표적 서열에 대항해 간단히 교환될 수 있는 "랜딩 패드"를 원하는 위치에 포함하는 세포가 제공될 수 있다.
상표가 등록된 CHO-K1 GS 세포주를 13번 좌위 ZFN(서열 번호 11)의 FRT 매개 재표적화에 사용하였다(랜딩 패드 접근법). 각각의 FRT 측접 구조체(도 4의 A 참조)를 실시예 1에 기술된 방법과 유사한 ZFN 기법을 통해 삽입하였다. CHO-K1 GS 요구를 충족시키기 위한 약간의 수정이 프로토콜에 가하여졌다. FRT-랜딩 패드 구조체는, 네오마이신 내성 유전자, IRES 서열 및 시토신 디아미나아제 유전자를 함유하는 카세트에 측접하는, FRT 부위들을 함유하였다(도 4의 A). 랜딩 패드에는 상류 및 하류 상동성 팔(각각 서열 번호 13 및 서열 번호 14)가 추가로 측접하고 있으며, 선형화된 구조체를 13번 좌위에 특이적인 ZFN 쌍(서열 번호 11)과 함께 공동 형질감염으로 도입하였다. 통합이 올바르게 이루어졌는지를 전술된 바와 같이 확인하였으며, 하기에 기술된 바와 같이 관심 유전자 함유 벡터에 의한 리컴비나아제 매개 카세트 교환(RMCE)을 통해 랜딩 패드를 재차 표적화(치환)하였다. 일상적인 세포 배양을 위해, 상표가 등록된 배지로서, 850 mg/l의 L-Gln(6 mM)이 보충된 배지를 사용하였다. 랜딩 패드 세포를 유지시키기 위해, 100 μg/mL의 G418을 추가로 사용하였다.
예비 통합 랜딩 패드와의 교환을 위한 공여 서열은, IgG 항체를 암호화하는 발현 카세트와, 하이그로마이신을 암호화하는 발현 카세트를 함유하였다. 형질감염 24시간 전에 랜딩 패드 구조체가 안정적으로 형질감염된 세포를 0.5x106개 세포/ml로 접종하였다. 형질감염 당일에는, 새 배지 중 세포 배양액의 밀도를 6x105개 세포/ml가 되도록 조정하였다. 총 DNA(표적 벡터 및 FLP-리컴비나아제 발현 플라스미드) 8 μg을, L-Gln을 보충한 CHO-S-SFMII 배지(Thermo Fisher)에 희석하였다. 제조자의 매뉴얼에 따라 PEIpro(Polyplus)를 형질감염 제제로서 사용하였다. 형질감염 후 배양액을 24시간 동안 30℃ 및 5% CO2에 유지시켰다. 24시간 후 온도를 36.5℃로 상승시킨 다음, 48시간 더 배양하였다. 형질감염 및 하이그로마이신에 의한 선택 후, 오로지 RMCE 현상만이 일어났다. 접합 PCR(jPCR)에 의해 풀을 스크리닝하여, IgG 공여체가 전술된 바와 같은 랜딩 패드에 통합된 현상을 확인하였다.
상표가 등록된 배지를 사용하여 CHO-K1 GS FRT 재표적화 풀을 13일 동안 배양하였다(유가식 배양). 전술된 바와 같이 ForteBio Octet(Bio-Layer 간섭측정법; BLI)를 통해 생성물 농도를 분석하였다. 도 4의 B에 보인 바와 같이, IgG 농도는 시간이 경과함에 따라서 점점 증가하였고, 그 수준도 매우 높았다.
실시예 5:
실시예 4에서 제조한 IgG 발현 FRT 표적화 세포는, 단일 클론 수준에 있어서 높은 균질성을 보였다(도 5). 실시예 4에 기술된 바와 같이CHO-K1 GS FRT 재표적화 풀을 형성하였다. CHO-K1 GS 세포주에 약간의 수정을 가하여 실시예 2에 따라 희석을 제한함으로써 단일 세포 클로닝 과정을 수행하였다.
CHO-K1 GS FRT 재표적화 풀 유래 단일 세포 클론(실시예 4)을, 상표가 등록된 배지를 사용하여 11일 동안 유가식으로 배양하였다. CHO-K1 GS 세포를 진탕 플라스크 중에서 성장시켰다(110 rpm, 36.5℃ 및 5% CO2). TPP 진탕기용 튜브에서 세포주를 계대배양하였다(0.3x106개 세포/ml). 자동화 Vi-Cell(Beckman Coulter) 또는 Cedex Hi-Res(Roche Innovatis) 기기에서 배양액을 계수하였다. 대조군으로서 각각의 풀을 공동 배양하였다. ForteBio Octet(Bio-Layer 간섭측정법; BLI)를 통해 생성물 농도를 분석하였다.
본 발명은 하기 항목들을 포함한다:
1. a) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나;
b) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류인,
CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 중국 햄스터 난소(CHO) 세포.
2. a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는,
항목 1의 CHO 세포.
3. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는,
항목 1 또는 항목 2의 CHO 세포.
4. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는,
항목 1 내지 항목 3 중 어느 한 항목의 CHO 세포.
5. 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되는, 항목 1 내지 항목 4 중 어느 한 항목의 CHO 세포.
6. 적어도 하나의 이종 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하는, 항목 1 내지 항목 5 중 어느 한 항목의 CHO 세포.
7. RNA는 mRNA, miRNA 또는 shRNA인, 항목 6의 CHO 세포.
8. 적어도 하나의 이종 폴리뉴클레오티드는 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는, 항목 6의 CHO 세포.
9. 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자인, 항목 6의 CHO 세포.
10. 마커 유전자는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하고 있는, 항목 9의 CHO 세포.
11. CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS) 결핍 세포 또는 이들 세포 중 임의의 것의 유도체인, 항목 1 내지 항목 10 중 어느 한 항목의 CHO 세포.
12. 게놈 표적 영역은 청구항 1 내지 11에 따른 서열들 중 임의의 하나 또는 이에 대해 적어도 80%의 서열 동일성을 보이는 서열로 이루어진, 항목 1 내지 항목 11 중 어느 한 항목의 CHO 세포.
13. 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터의 대립형질 하나 또는 두 개에 안정적으로 통합되는, 항목 1 내지 항목 12 중 어느 한 항목의 CHO 세포.
14. a) CHO 세포를 제공하는 단계;
b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고,
i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]
를 포함하는, CHO 세포를 제조하기 위한 방법.
15. a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는,
항목 14의 방법.
16. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는,
항목 14 또는 항목 15의 방법.
17. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는,
항목 14 내지 항목 16 중 어느 한 항목의 방법
18. 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합된, 항목 14 내지 항목 17 중 어느 한 항목의 방법.
19. 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하고 있는, 항목 18의 방법.
20. 적어도 하나의 이종 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하는, 항목 14 내지 항목 19 중 어느 한 항목의 방법.
21. RNA는 mRNA, miRNA 또는 shRNA인, 항목 20의 방법.
22. 적어도 하나의 이종 폴리뉴클레오티드는 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는, 항목 20의 방법.
23. 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자인, 항목 20의 방법.
24. 마커 유전자는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하고 있는, 항목 23의 방법.
25. 이종 폴리뉴클레오티드는
a) 서열 특이적 DNA 편집 효소; 또는
b) 부위 특이적 리컴비나아제
가 사용되어 CHO 세포 게놈에 도입되는, 항목 14 내지 항목 24 중 어느 한 항목의 방법.
26. a) 서열 특이적 DNA 편집 효소는, 바람직하게 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제로 이루어진 군으로부터 선택되는 부위 특이적 뉴클레아제이고/뉴클레아제이거나;
b) 부위 특이적 리컴비나아제는 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는, 항목 25의 방법.
27. a) CHO 세포를 제공하는 단계;
aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고,
i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및
b) 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계
를 포함하는, 항목 14의 방법.
28. CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)-결핍 세포 또는 이들 세포 중 임의의 것의 유도체 인, 항목 14 내지 항목 27 중 어느 한 항목의 방법.
29. a) 청구항 1 내지 13 중 어느 한 항의 CHO 세포를 제공하는 단계;
b) 단계 a)의 CHO 세포를, 관심 단백질의 제조가 허용되는 조건하에 세포 배양 배지 중에서 배양하는 단계;
c) 관심 단백질을 수집하는 단계; 및
d) 선택적으로 관심 단백질을 정제하는 단계
를 포함하는, CHO 세포 내에서 관심 단백질을 제조하기 위한 방법.
30. 관심 단백질을 높은 수율로 제조함에 있어서 항목 1 내지 항목 13 중 어느 한 항목의 CHO 세포의 용도.
서열 표
서열 번호 1_상류 통합 좌위
서열 번호 2_하류 통합 좌위
서열 번호 3_상류 부 클러스터
서열 번호 4_주 클러스터 암호화 구역
서열 번호 5_ZFN 7에 대한 인지 부위
서열 번호 6_ZFN 8에 대한 인지 부위
서열 번호 7_ZFN 9에 대한 인지 부위
서열 번호 8_ZFN 10에 대한 인지 부위
서열 번호 9_ZFN 11에 대한 인지 부위
서열 번호 10_ZFN 12에 대한 인지 부위
서열 번호 11_ZFN 13에 대한 인지 부위
서열 번호 12_ZFN 14에 대한 인지 부위
서열 번호 13_상류 상동성 팔 랜딩 패드
서열 번호 14_하류 상동성 팔 랜딩 패드
SEQUENCE LISTING
<110> Boehringer Ingelheim International GmbH
<120> Integration sites in CHO cells
<130> 113628P1140PC
<150> EP17185988.7
<151> 2017-08-11
<160> 14
<170> BiSSAP 1.3.6
<210> 1
<211> 19987
<212> DNA
<213> Cricetulus griseus
<220>
<223> Upstream integration locus
<400> 1
acagagaaac aagcaagaga gagatgagga ggggaccgat gttagcttta ccagttggtc 60
tggtaagaag agaaaccagg aagtggctgg tgaaggaact ttgggcaaag ctgcagagcc 120
agtgtgactg aagagtggtg ctctgcagcc tggccaacct gagttcaaat ccagctctac 180
tcttaatcta cccggcctct gtttccagat ccactcatca caggaatggc ccacattgtt 240
agagggtgtg agaggtcagg gcttcttacg ctttctcctc tcttagccac tttttgcctg 300
agaaagttat gaaaggccct gtacaggtag atattaaaat agatatatgt taaatgttca 360
cttataataa agattaattt taaaatgata ttttttgtta aaaatgaaac aatttgaata 420
ctaatgagct ggatgtgctt gtttagtttt tattcaatat cttgtttatt tatgagactg 480
taatttagtt acaatgtttc ttccttccct tttctccctt caaactctcc cttgtaccct 540
tccccactgc ttcaaatcct tggcctcttt tttgttaatt gttattgcac acacatatgt 600
atttgtatat acacatatat tcctaagcat aacttgctgg ggctgtataa tgttatttgt 660
atatatgttt tcagggctga ccatttggca ctgaacaacc agttggtgta ctcttcccca 720
ggaagggcca cttctctgct cccagcttta ctcagttgcc tgtcattctt tgtgtagggt 780
tgaggcctca tgggattaac cccatccagt ttggcatgtc aattggtgtc aaacttgttc 840
agcgcttgtt tgggcagtca tgttggtgag acgttacagg tgtagcttct gatgttacta 900
ggagacacag tctcacaaca aactctctga ttctctggct cttacaattt ccagttccct 960
cttctgcaat attctctagc tttagatgca gaagtgtttt gtagatttat ccattgggac 1020
tggattccac agctctgcat tttgactggt tgtggttttc tgtagtggtc tctgttgcaa 1080
agagaaattt ccttgatgaa aggtgaagaa tatatctgtg gttatatgaa caaatattta 1140
tagattgttg ttagggatta tgctggttta ataaattagt ggttatagat ttctcttcca 1200
ataaccacag ttttcctagc attgagtagt taggtaggat tccagtatca agcatgtttc 1260
ccctcttgtt gaatgggtct taagtccaat tacagagctg ttggttacca ccaaggtatg 1320
tgtgctgcta ctgcaccgtg gggttatcat ggcatgctgg ttgttgccgt ggttcatagg 1380
tggcatagct ggataggatt gttggttgcc tccctctttt ggaagctttc atggtgcctt 1440
ctggtaccat taaagctagt tctcagggag ggagcattta ggatatttcc agatcaaggg 1500
tctctgggac ctgtgtctga aatgtttggt gtcttaagca atagggattt accttttata 1560
tcttgaggat agccaagggc aatatgctta cataaatgat tgaatcttgt ctaatatttt 1620
ttctttttga gacagggtct cactgcatgt tcctggttgg cctggaacac actactttta 1680
gatcaggctg gcctcgaact agcagagatt cacttgtctc tgcatctcaa gttgactggg 1740
attaatggtg tgtgctatca tgcccagcca atcttggctg agtatttgat actttcagga 1800
tcaagtcagc aatgcaaaca gcaatattac atttttaagt gttttattta tctttatcca 1860
atcttcattt aattagttca tatattcata tattgtattt tgatcatctc caacccaaat 1920
cacctatccc attcccttta gaccctccca tattttcccc tcctctctca tatcctcttt 1980
atttttaata acccactgag tccacttagt gctgcttgtg tgctcatggg tgaggggtgc 2040
tctgtgatag catgggcagc ctaccagcaa ccacccgccc tcaagagaaa agactctccc 2100
tcttccagca gccatcaact gccaaaagat cgcctgctgg gttgaagcct ctgagttcct 2160
cttgcatcca cgctgggatg ttgacgggct tgatctcctg cagataatca tagctgtgag 2220
ttcaggagtg caacagctgt gtggtgtcca gaagatagca tttcaagcat ttcctgttgt 2280
cttcctgctc ttacagtcta catccctctc ctttatgctt tctgagcctt ggtgaggaga 2340
agggaaggaa gtagtgactt gacagaaatg tcacattcat ggctgaacac tgaaaagtca 2400
tttattatca gctcttacac aagttatgag tctgctgccc agtgaaaaac gaggtttctc 2460
tgagcaaggc tgagagcagc actaatatat agggttgtga atataaatat tttgaaggca 2520
gtttgacacg tcagtttagc aaaaacagta atagttccct ccacctctac cccagggcct 2580
ataagtttcc tagacatagg cttttgatga ggtacacagt accagacata aattacctgc 2640
tgtggaccgg gcttcaaacc caatcaagtg actggttact cccataactg tcatgccact 2700
attgtatcag gagttacttc ttgctaggca gttaattgtc atagcatgca tgatccacag 2760
gtgggtaaga ccattgatag cttttcttct ctagtagcct gaatagtacc ttctgtcact 2820
ctgaaaacta gctagtaggg aggaaacttc tagatcagtt ccatttcaat ttctccatgt 2880
ttgaaccaag tgtgtgatgt ctttagaaat agcatcttac catctagttg aggtgggcaa 2940
acaagagcaa tgacaatagt ctgtgttgtt ttagggggct ctaaagcttc ccagaccaat 3000
aacgataggg acatagccta tactttacat tgggattttc agttagtaac ttatgtcttc 3060
taggaacgca ctagccacct acgtaaggta cctgtgttca aactcctttt aaagttaaaa 3120
aaaagtagct tacaaagttg cgtagtccat aggcttgtgt gtgtgtgtgt gtgtgtgtgt 3180
gtgtgtgtgt gtgtgtgtgt gtttgatata gggttttact atgtatccct gactaacctg 3240
gaactcacta tgtagacctt gaagtcacag agatccaact gccttacagg tatgtgccac 3300
cacttccata gttgccataa gtttttttaa aaaatatttt tttttcatac aactgcaaga 3360
accttaacat ggtgagccgg ctcctttacc tctccctgac ctccactatt ttgtgacagg 3420
ttctcatata taccaggctg gccttgaact tacagtgtag ctgagggtga ccttgaactg 3480
agtctcctgc gtgtgctgcc acaccagttt atacagtgcc aggaactaaa accaagactg 3540
tgcacgggaa gcaagcactt tgtcaactaa actacatttc caaggccctc aaaccatgat 3600
tctttttatt gaattttatt tattattatt tttttatttg agacaggatt cctctatgta 3660
gccctgactg tcctggtact caatctgtag accaggctgg ccttgaactc agagattagc 3720
ctgcctctgc cttctgagta atggtattaa aggggcacac catcacacct ggcctcaagc 3780
agcgattctt aaaattaaat atccaaacat aacacattcc aaaaatgtac taatttgtta 3840
ctaatttgcc aaagaatgat gacaggaaaa tattaatagt ctttgttttc taggctggag 3900
agatggcttg gtaattaaaa gagcattagc tgctcttcta gaggaatgag gtccggttct 3960
cagtacccat atggcagccc atgcccacct gtaaatccag ttccagggaa tccaattttc 4020
ctctggtttc tgagggccct tgcacacacc cttccccata tatatataat taaaaataaa 4080
aacaaatctt aaaaaaatta tgtttctact agagcagaaa actttgtgta tacagtgaaa 4140
acgttgcagt tcttaacaca aaacagcctt gggcctgagg agggttttag ccagcattca 4200
ttggcgcttg gagggataat ggctcggata gtgcaaagag cttgtctgtg cccagaaccc 4260
ccaaggctgc agggaagttg tgtgacccca caccctgact cattgtgtgt tagcctttga 4320
attaatcttt ggttgtttgt tctgaaatct cttactattg ccaaagtttt gtgacactac 4380
cctccccgcc aatccagtta caaccccaca tagggttgta acacagtttg aaaaaccagg 4440
aattaggtac catgtgaaca atattcaata catttaattt cttcttgcct gcttgctggc 4500
tgcctttttt ccttctcaga aggaattatg tgtctgtttt aaagctgggc aggtccagat 4560
cattcttcat cacttcattc aggggtggtc ctgtcctgag agactgattg gctccctgat 4620
ccagcattcc aggaatcgat ttcatgtctt ccccaaagga aagtccctct gtgagtctag 4680
agctggtgac aaataactgg atgtgaatga tggttccccc cttatttctg agacaggacc 4740
tcattcccat attacccagg cctcgaattg accctctgat cctcctacct catgtcctgg 4800
gattacaggt ctgcaccaat agactcagag acatgagtga tcttaaaggg ccatatgagt 4860
aagcctgaca aaggcgtgtg tctctcctgg taaggaatag aattggtata tttttcttct 4920
ttctttcttt ctttctttct ttctttcttt ctttctttct ttctttcttc ctttctctct 4980
cttttttttt tgtaaagatc tatttatttt ttttaaacct ttatgtgcag gagtgctttt 5040
cgttccctgt atgtatccgt gtgcctggtg cagtacagcc cttagatcta gagacagcca 5100
attgtgagcc accatgtggg tgctggaaat taacacaggc cctttgcaag aacagccagt 5160
gctcttaacc acagagccat ctctgcagcc ctggtttctt ctttccagtg ctgcttctaa 5220
taacatgtat tggattcttg tgtatgtggc atgtgttgtc tcatttgatc tgtgggttgg 5280
gatagtattc tgctacagat gagtagagtg gtgattaccc tggtgtaaga gcacatagtg 5340
aatgtggcta ctgtgacgct tgctttcttt ctttggtaag ggacccagag tctggcctta 5400
ccacgctggg ccaatcagag tactttgtct ctctggctac ggggaggggc gggatgttgg 5460
ccaatagcag aatagctgaa ccaagcaggg ccaaccagag ttttcccctg cattagtaag 5520
cagatcctag gtttatatgg ctggatgaac acatttccta tgtatgtatg tatgtatgta 5580
tgtatgtatg tatgtatgta tgtatgtatg tgcgtatgta tgcttaattc cttgtggcct 5640
ctgaagctag atcactgatt gtgtgaatta ctgcaacact ttgtaaagac aagtttgttc 5700
atttattttg agaaatgtgc ttatgtaccc cagactggca gaggcttatc tccatgtctg 5760
gatcctgcct ccatttcccc tgggtaagga gtataccact gcatttatgg gatgctggag 5820
attaaaccca ggatttcttt tcttttcttt ctttcttttc tttttttagc agatttttta 5880
aatttgaatt agaaacaaga ttgttttaca taacaatccc agttcccttc tccctcccgt 5940
cctcccttaa cccccttacc cccctccccg tcctccaact aaaaccctat ctatcacata 6000
tccttaaacc ctggatttct tgaatgctgg gcaagcaggc tagcaaacta gctttgttga 6060
cacacctttc tgtgatcctg tgagtttgtc tcttagctga agtgctgaat ataaccagca 6120
gcggtaaaaa gcctgaaaga tggattcttt tggatttgca acttgatgat tggtttccca 6180
gccaatcatc ctgggagagc gggaggcagc agcactaggt cagcagacta cttatactct 6240
gtcagtaagc ccagaagcag acaggagaat gaatgggtgc tgcacccggc tctcatcctc 6300
caggcctgcc tacttccccc agctgggccc cacatcctaa aagttatata gtttccccaa 6360
acagggcaac cagatagggt caatggggac atttcctacc atcacactga ggattaaacc 6420
agggcttgtg ctcactgggc atgtactcaa ccatagcgca agatccttag actttttttt 6480
ttttcttttt cttttctctt tctttctttc tttctttctt tctttctttt ttaggattca 6540
tttatttatt atatatacag tattctgctt gcatgtatac ctgcaggtca gagagggcac 6600
cagatcacat tatagatagt tgtgagctac catgtggttg ctgggaattg aattcaggac 6660
ttctggaaga cctctgaacc atctctccag ttctcttagc tttttttttt tttttaaact 6720
ttctttattt tgaagcaggg tcttgttaaa tagatttatt tatttattta tttatttatt 6780
tatttattta tttatttagg tttctctgta gctttggaag ctgtccagga actagctctg 6840
tagacctagt taaagagcgt actccaccac ccgcctgttg ctaaattgtt cttgaatctg 6900
tggccttccc acctcagcct cctgagttgc tagatcagat tttaaaaaag attagttgta 6960
gccgggcatt ggtgtcgcac gcctttaatc ccagcacacg ggaggcagag gcaggcggat 7020
ctctgtgagt tcgagaccag cctggtctac aagagctagt tccaggacag cctccaaagc 7080
cacagagaaa ccctgtctcg aaaaacaaaa acaaaacaaa acaaaacaaa aacaaaacaa 7140
aaaaaagatt agttgtattt tgaattatgt atgtgtgtgt atttgagtgg ttatatgcag 7200
gtgtatgtat gtatgtgtgt atatgcagga gtgtttgtgt atgcaggtga tgccggtgtg 7260
tgtgtgtgtg tgtgaatgta gatatgtagg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 7320
tgtgtgtgta tgtgtaaata cacatgcaca cttgtggtgg tcagaatcag gaagcatgga 7380
atccccctgg aactggtggt tgtaagatgt ctagcatggg ggctgggaac ggaactctgg 7440
ttttctccaa gtatgggttc ttaattggct atctctgcag cccctgaaag attaaaaaca 7500
ttatggctgg gtttgtagtg tgcaccttta accagcactt atgaggcaga ggcagataga 7560
cagatttctg tgtttaaagc caggttggca actggtcagc caaggctaca cggtgagact 7620
ttgtctcaat aaacaaacaa acaaacaaga atgagaataa taagataaag taagaatata 7680
ataaatgttt ttatttctgt gtgtttgagt gtgcacatgc atgtgagcac ctgccagaag 7740
aggcttctga tgtccaggag ctggagtttt aagcaatggt gagctacctg gtgcaggtgc 7800
tgggacctga actccagtcc tctgcaagag caccacaagc tctcaaccat tgagccatct 7860
cttcagcccc tgaaaggtct taattaataa aattaatgct aattattggg tcaagagtta 7920
agtccagatc caagtcttgg ctctttcact gtaactgatc tttgaaacca cttccttatg 7980
agtaacgtct taggttttaa gaacactgct cccactgagt cacctgtgtc actcctgaaa 8040
ctggctgagg tccctttctg gaatgaggaa cttcctgggt tcatggaaca caccaggaca 8100
tggctctcag gtgaccgctt ctgagaggac tgctaatcac tcatttatgt ggattcctct 8160
cagtgccagt gtcaccaagt aacagtgtcc tgagttccac tgttgttggc cctctctttt 8220
ggcaacttgg ggagcctggc ttcagcctca agcctaccta acactgaggc tttcgtactt 8280
gctaggacag cagccagcct ctggctaggg gaggccatga ggaattgaca gccagggcac 8340
agatactctg agctcttgat tcagacagca ggggtcggag ctctgaacat gagtgaggag 8400
ctgtgggatg tgggagcctg cctctagtcc tgacatctat gatgtggagg gacggtgggc 8460
cagatagtag ctctgctcct ttcctgttct caggcaggga gtttaaaagg acagaggata 8520
aagaagtctg actggtttcg gtttaaagta taaaatgttc ccctttgtga caccagaatg 8580
taataaacca tcgtcctttt gtgtgtacac aggctgactc tgatatatga catggaaaac 8640
cacgttttat gggcacattg aaagaacatt cattagctca tgatgcggca ccatgatcct 8700
agctgaaagg aagtatattt tagatgctcc acccagatta atactggagt ctgtcctgcc 8760
attgcaaact gaaaaatgag aacactccga ggttttcgca tagctatgga tcatgtgtgg 8820
tgacaagtgg atgagtaatc acaaatatta ctcaagaaca aaaagattct aagagaaaat 8880
aaagcaggaa ggagacaaac tagcattctt ggagaaagaa ttgaaaaata tgcatagttg 8940
tagaatccca tagatgtgag tagggagact aatgcagcta atatactaag acagcaattt 9000
aattcttaaa tggaaataca ggctggtgtg tagctcagtg gtagagcgct tatccagcat 9060
gtgtgagact ctggcttcca tgccccaaac cacaaaagca aacatataca ggaagaaagc 9120
aggcacatct tagatgttcc acccagatta acattgcagt ctctcttgcc attacacatg 9180
gaactgagga cgagcagagg tttaggcata gttgtggagg aagcagcctc ttctagcatt 9240
ttaatggtaa ctgctataaa attatcatgt agattatttg atttgctatg tataattaaa 9300
atgcattgta attttaagac tctgacattt aaacacattt atactacttg gcaatgatgt 9360
agatcagttg ttattggact ttggatctcc agcccccaaa taatgataca gagacttatt 9420
actaattatg aaagcttggc cttagcttag ccttgtcccc aaagagctct tatagttgaa 9480
attaacctgt ttatattaat ctacattctg ccatgtagct cattacctct gctcagtacc 9540
gtatgtctga ctccatggtt aatgccacct ctcttattcc cagagttcct ctctccctgg 9600
aatccccacc tattctctcc tgcctaccta ttgaccactc agctctttgt taaatcaact 9660
agaaagtgcc ctgacagaga cacatcgtgt ccaaaaagat tatcccacag tagtcagcgg 9720
tgtttgtagg taagttgtag gtcagtggta gagtgcttgc ctagaatgta caaggtcctg 9780
ggttcaagtt ctagcactgg agggaaagag aggacaatgt ttgaataatg tctcatgcta 9840
tgaaagcatt tgctaatttg tattatttga agattctaat gagacagcta tttaatatat 9900
atattgtatt gattcattag tattagaaaa taagtctgct tttctttatg gggcaccttt 9960
tagagaaagt gcattgaata tgctatttcc caattagtat taggaagttc acttaaaaat 10020
cttctcactg ggagagatcg attagtattt caagcaagag cgcagtgact ctgacatccc 10080
ctctccctaa tctggtttgt atactgacat cactcacaat caccatttct ctgcaaattt 10140
ccagttagcc cataaaaaaa tccagtgctt cgaaagttct ttggatggtt cagcaggagt 10200
ttgaatccct caaatgtcac agcggtcttt aagcctattt ccttacaggc tgtcttcctt 10260
agcaatttaa ggaaacaaag agctgttgcc aaggaaaagt gagttggttt tgtttgtttt 10320
gttttgtgtt agatatgtgg tgttttctga tgaagtctct gacacggatg acagtgacat 10380
tggaatatgg aagtcctgta ctctgagaaa gatcacattt ctagatgatg cttttgccac 10440
tgattaactg gatctgcatg tgagtgatgg tttctaagct gtttagtgac agctgcatgt 10500
ggtgacacag ccggcaatcc tgtcacttgg gagtctgagg cagaaggatc ttgtgttgga 10560
agctgcttta ggttgcatgg tgaggtcctg ttcacaaggg agggggcggg aacaaaaatc 10620
cagaacagaa caaaacaatc aaccaaattg tatagtaaga cagcaacatt tctcaacttc 10680
agaaacagtt ttctgagtgg cattgtgacc ctgactagga aaggctgcat ccctggagct 10740
tccttctccc cttactgtta ctctgtaacc tcgtggctaa ggcagtcttt cttcatttta 10800
tttgttcaca cttacctatc aatatgtaca cacacacaca cacacacaca cacacacaca 10860
cacacacaaa gttgggtgtc agaggacaat tgtgggaatc gcttctctcc tcccccacgt 10920
ggggccctca ggttggcagc aagctctttg acctgctgag ccttctcact agccccactt 10980
tcccatcatt ttatgtcttt aatctgcctg attctgctgt acagtgaaag gcaagcattt 11040
gacaccagcc ttctgagctt cttcaaaaaa gtgtttgttc attaagtatt cagaatttgt 11100
ttactgatta ccaagagggt gttggttatg ggagcccatt tcacaatgcc tttctctcct 11160
tttgggaatg gaacctaggt ctttttctct ccaggaaaat gctctaccac tcaactacag 11220
ctaccttatt cttttatatt ttcaaggcta tttgcgtctt tagttatctt tgtcttagtt 11280
tgttgcaaag gttgctgagg aagagatgca tagggttaaa tgcagggaaa gggggtcaga 11340
gtcccatact ctagggactt ccacgtggtc atttcattgt gttctttcta atcagttttc 11400
actaggatgc aatggtggtt ttggtggtta gaggttgggg aaacaaggag tgtttttctt 11460
ttccttacct catccccctg aagaatgact caagtgaatg gttataaatg gcaacagaga 11520
gacagagaag gcaaagatct gagttttggg gtttggaggg tgctaattat tctcaccttc 11580
ttccctttga agttctgaga agaactcaag caggactccc aatcacagcc atggactaga 11640
tgatgtaatt tggagctgag gctatgttgt ggtttgaatg ttaattctct cctacaggct 11700
catttgtttg aagagttggt tcccagatgg tggcactatc ttgggagact gagagacctt 11760
ttggacttgg ggcctattta cagacttgag gatacagaag ttggcctcat agcccatcct 11820
caggtacatc atgaactctc tgcttcctgg atggtaccct atacctcatg ctcccactgc 11880
caggaaacca cccacagtca caccttcctc tatgatggat taaatccacc ccaatcgtga 11940
aaccaaatag atccttcctc cttgaagttg tcaagggttg gttagagtga tgaggacata 12000
aagaatagag taatctgttt ctgttataga actgaccaca gcactcagga ggcagagaca 12060
gcttggtcta cagagccagt tccaggatag ccagggcagt tacacagaga aaccctgtct 12120
caacaaacaa aagcaaaaca aaaggaaacc aaaaccaaaa ccaaaccaaa ccacaacaaa 12180
aacaaactga ccatattgtt tttcggtctt tggaggtggt ttttgggagg aatgtggaga 12240
aatttagaat tgtgggctag aagctgggcg ttggtggtgc atgcctttaa tcccagcact 12300
cgggaggcag aggcagttgc atctctgtga gttcgagacc agcctggtct acaagagcta 12360
gttccaggac agcctccaaa gtcacagaga aaccctgtct cgaaaaacca aaaaaaaaaa 12420
aaaaaaaaaa aaaaaaaatg tgggctagaa aggccctaac attctgtagt cagagcttac 12480
tgggccattc tgatgagtgt tcaggagacc atactattga tagaaaaatg gacactgttc 12540
agattcatga ggatttagag tggcagtgca tgcctatgat ccaaattctt ggaaagtgga 12600
ggcaccagga ttgggagttc aaggtcatcc ttggctacac agcaagtttg aggccagctt 12660
gaactacaca atgaagtgtc tcaaaaaaga acaatgaaaa tcaaggaaaa acaaacaaaa 12720
ccaaatacac ctaaaaacaa aacaggaact gtagcagaca ctgggttaga caccatttat 12780
gttacgttca gataaagaaa ttggttatgt gttatttcct aaaactttga gtgaagttga 12840
attcagaagc aatagagtaa tttgttctgt agagaacatt gccagatggc acagcattca 12900
ggttgtcaca tgactgttga catgtgacaa ccgttagcta tgtttacagt gaaaattctg 12960
atcagatagt ggcttgaaaa aatgtggaag atgaggccgg gtgttggtgg cgcacacctt 13020
taatcccagc actcgggagg cacacagaga aaccctgtct cgaaaaacca aaaaagaaaa 13080
aaaaaagtgg aaaatgcaca gtttaatgtg cacaggacca tgagtcaagg taaagttgca 13140
gaaagagccg ataaggtttt tttgccgaca aagtagctac aattacaaag acaggaacac 13200
aattaaggat taactatgta tgcagcttgc tttggggcag taggaatggc acattaaagg 13260
caagatctac tccctgaagg cttcagggaa taaagctgta tacctgtctg ggagcattca 13320
tttgaaagga gagggtttgc aaaggagagt gcctccactt gggggtttct tgcttgaaaa 13380
tggctgtccc tgattaagtc acacaggcac ttggatacca cagccttagt ccaagtgggt 13440
caggctacat ttcaagttgg cagtaaaaac ttggtgttat tttccgtgtg gtactggttt 13500
ggcagtcaaa caaaactcca ttcatgcaga ggccgatgga agtttgcacc aaggttatac 13560
aaagctgctg aggtcaggca atatgtaaca atgttacact ctccgcatgg agtcctggag 13620
tttgagccga ctgaatgaag ttgagcccag tttcagtggc catcccaggg gttatgagat 13680
gccagaaatt tggacttttg cagggactga aaagacccag gccatgaaag agcacacatg 13740
ctacagattg cagggctgga gggatgggag tgtataaacc tgttggagcc cagaagatgc 13800
tgtcatgatc tccagatgct ggtcatggcg tgttgcagag tttggtgtct atctgtttga 13860
atttagtctt tctttagtgt ggtattcttt tgatattttc ccattccttc attttagagt 13920
gggtatgttt gtatcattgt acattgaaag tatgttactt ggtttttggt tttccagggg 13980
ctcttagcta aggatttatt ttgagtctca gaagagactt tggacttctg aactatgtta 14040
gaattttaag agtacaggaa ttttttggtc tttatttact tttcactttt ttgtgatata 14100
tatatatata tgtgtgtgtg tgtgtgtatt atataaattt atataataat acacacacac 14160
acacatattt gtatgaatac acgtggaaac cagaggcaag gttgcaatgt tttcctgaat 14220
cactgtctaa cttattatct gaggcagagt ctctcactga acctagagct catccattga 14280
ctagactaac tggcaatccc taacaatcct cctgtcccct gccccccagc actaggctta 14340
catgcatgtg ttgccatacc caactatttg tatgagttct gacaattcag actcaggttc 14400
tcaggtttga gcagcaatca ctttatgaac tgagtcatcc ccccagaaac tccagtgact 14460
tttaaaattg ttctgaatag tgaacggatc ctgcatttag ggatggctat gagaccgtcc 14520
agctaggtta tggttatggt ttgggtggga actgtcttcc acaagctcat gtgtttacaa 14580
acttggtcca cagaaggtag tgctatttca gaaaactaag aaatctttag aagatgggac 14640
ctagctaaag gaagtgggtc actgggagga gttacagcat tgccccgctt ctggttgact 14700
tctttgcttt ctggctgatg acatgatgta atcagtgccc aagagtcctt ctatcccaac 14760
atggagttgc tcctgttttc aggctttcct catcaccatg aactgtacta tcttgaataa 14820
tgagtcaaaa caaattcttc tctcttaatt ttcttctttt aggtattttt atcacagtca 14880
tggggaaagt aacttgtgaa ggtcaataag atctttgcag tgctttatgg gtacgcatgt 14940
ttcacctgta tgtttgtctc tgctctgtgt gtatgcagtg ctcaaggagg ccagaagagg 15000
gcactggatc tcctggaagt ggaattacag gttctggaaa cttgggtcct ctggaacaac 15060
agctagtgct gtcaactgca gaaccaccta ccatgtttca agctccaaga gctatcagtc 15120
agtcagtcag tctgtctgtc tgtctgtctg tctgagtgtc tgtctgtctg tctaaatcat 15180
ggacagttgt gtagccattt cctcagaatt taaacatccc tctaaagccc aggcagtaaa 15240
caaaaagtta catatctcag gaagctccta aaacaagatt cgcagtggtg tctccctgca 15300
ggtaaagaag cagcaaggac ttctgtggag aggagacttg ttgatttgct gagctgcctg 15360
caagcagtgc agggtgtcca atggtgctgt tccaccagtt gttaagcatg ctagggtggg 15420
cttttccata gtgcagcttt gtctgagcca tccatgctcc tgtgagtgag ttcaatacag 15480
acatttgctc accttgcccc aggaaaagtc acacctcccc acagacagaa gctgcccaac 15540
cacaggctcc agggggttgg tagaggaagg gaacagagaa gggtgccctt ctcgtgaggc 15600
tatgttggat gagaaggagc agcatctgtg ggaggggaga acagagtttt ctcatggagg 15660
tggagagggc acacgtggaa tgaattgttc cctcagaaga actcttctga ggaaggggtc 15720
atcaagctgc tccctttcca tcaaaagaag ggagtctctg gtggcactgg agagagctga 15780
tcccatggaa tggtaacaag tcagttttca gaaggttcag gggttgggta gaggactggg 15840
tgtatctgga ggtaggatag tccagggagg agagaaggat ttggctgtga gggacagcac 15900
ttgagcctac agccaccatc tagcagacac ttattttgtg ctaggcacta gggaatggag 15960
ggtttcatga agcttagcat ttatttctag tgggagagat atttaaagtc agaattaata 16020
aaaatgatgc tatagagcca tgagcaacag gctgagggac tggctgggga gcgcctaagt 16080
gtgagcatgg gcctgctcaa gcatgcaggg gacctgggaa atggatttgg ggctgaaccc 16140
agaggaaatg acctttgagg tgagctggaa gggtgattaa ggagcttgtg ctggagctgg 16200
agagatggcc taggggttaa gagcacctgg ctacttttcc agaggaccca ggttcgaaga 16260
ctcacaacag tctataaccc agtccctggg gtctgacacc attttctggt ttccttgggc 16320
actgtatgaa tgtggcacac agacatgcat acattcagat aaacactcat gcatataaca 16380
taaaataata aataaaatct tcaaaaaaaa aaaaagaaag aaaggaaatc aaagaggctg 16440
atgggtggct ccactgagga aggctttcca tgagagtaca tggcatgggc agaagttcag 16500
ggtcaggaaa aagtatgacc tataccacag caaagttagt gtgtcaagaa tgggatgcca 16560
tgcctgggtc tcctaaaagt taggagaatt cactgaatgc tgtaatctga agaaatttga 16620
acttttagag ctgaggaggg gttagtgtga ggcccaggag cagggctgga ggagaatgca 16680
gctgggacag atgatttgaa agaggcctaa agcagtgtgg acagagacca gtcatgctta 16740
gaaacaagca ggctgaccag acatctggtt agcagccagg ggaagcagga ggctgggagg 16800
aagccaagcg tctggtttgg gtcacgggta gatggcaatg ttctttgtgg cacaggggaa 16860
gcctggttct tccatctgtc tgcctcctga ctccatcctt gctctctgga gactttgctc 16920
agctcctttt cttggtcccc atggcaggat gtttcctgtg gtcgttcctt ggggattagt 16980
agctctccta ggttctgttt tccaactctg tctcattgcc actcctggga ctcagaggag 17040
aagttattat ttgctagtgt aatcactggt gtgctttcag gcaaggaaaa aaagggagtg 17100
ctccctgacc ctctggctcc tacccccctc ccattgtcat tcagcagcta tagacaatgg 17160
taggcgtctg atgtgggcga gatctggtgc ttgtgcagaa atgaatgaga tccagtcttt 17220
actgggagat ggggagctga caaagctttc tgtttagtat atttcaaatc caggctatgg 17280
tacatttgaa gtcaacagga aaaggtgcca ggagtggagg tgccgagaag acaggctcct 17340
ggaccccagt gtggccgaca cttgagacta ctttgctgga cagatggagg ttggtctgag 17400
cagcaactat ccttaaggcc ttctggcatc actggtggct ggagcatgca gatgtttaac 17460
actgctaagt cacctgtctt taaatttttt ctcctccctt attggttggg tgggaacatg 17520
tcctggagcc ccaattttca tttctgtcaa gaagggtgag attgtccacc ttcctgggac 17580
tgcctcatga actatgtggg gccatctatg gaagcccttg acacatagta ggtactccga 17640
agccacagga atgcacacac ccttaggagc agcaatcaag aatgtaaggc atgggttctt 17700
acaagaatgt aacgaccatg ctacaagggg agactcatgg gtatgattta tagagcggat 17760
catgaatgaa ttaatgcaat ttgataagaa aaagaacttc aaagcttatt ttggggtgca 17820
tgggatatta aaagtgatcc tcgtggcgaa aaggcttagg ctctgaggtg tggtaccact 17880
tacccaacat tgcagggtga gccagggaca gcacccagac ttacacctgg ggcgctgcta 17940
gtgaggccat ttctcttttc attgaactgc tccccaaggg gtgagtgagc caacttgggc 18000
agtgtccagg ctcccatttc tgacacctcc tgctgcccct aatcctaccc caggcataga 18060
aacgggttcc tgatatcagg tttccagttc agtccaccta ggcttttcag cagggactgt 18120
ccaggaaacc ccttctatgc gaagcaggtg tgggcgtggg aaggctcctt ggagatgaat 18180
caccgctgcc tcctccttgg tgaatcatgt tgaggcttgg gaacagctag ctggtggacc 18240
tggtggggga agagcggaga actacattgc tatgacacat ctccaccacc agaaggcaga 18300
agagggatag gcaaaacgaa ccagcaactg ctgtcgctca gagcttggga gggggtggat 18360
ggaccgggag gactcagctg gggctggatg tgggcagtca gagcctggga tgcctccact 18420
gcctgcctct gtccctgctt ctttgctgga gtatgtcaga acagattggg gcttgggggg 18480
gtgctgtgag gggggtgggc tcatctaccc gatgttgtct gtcctgtgat gtccaagtgc 18540
agatgtccaa ggtcacacag agagtcagag aggcaagtca gtctgctttt cgaagtttca 18600
gaagcgttgc cactggatgg ggcacagatc tggcctccat gtctgagatg aaacacccgt 18660
ctgaggtgtc ctgctgcctc tgtacagccc cctctctcat cttgtccctc ccttcctgct 18720
ttctctgtca ctatcgtgct ctctttgatc cattccctaa atttcttctt ttttgcccga 18780
tttccacctg actttttctc tgacctcttt gtcagcctcc agtctccatc cctgccctct 18840
ggggactttg cttctccatc ccttttctgg gtccccatgg caggatgttt cctgtggcca 18900
ctcctcaggg atttgtagct ctctgaggct ctgttttcca actctgtctc attgccactc 18960
ctgggactca gagaagttat tatttactag tgtgatcact ggtgtgcttt caggcaggga 19020
gaaaagagac tccccttccc ccactccctg ctcctaccta cccaccagtc ccagtgaccc 19080
ctgttgccag ttagcagtca taaaggctgg gcggcacctg gcgtgggcaa gatcctgtgc 19140
tcatgcagaa atgaataaga gccagcattc atcagtgagc tcaccacatg gctagggtga 19200
ggaaagtgga gtacacaagt gaatctgcct aaataggaag acgctaaaga gggggggatg 19260
gtgggggggc acaaggagtg ctttgtatgt gccagagcag gtagaaatgc aatccagttg 19320
ggtgagagaa gccttttaag tggccttcaa agggtagatg ggatctcagc aggagacacc 19380
tgtgtgggag tgtgggtaca ttgtgagcag cagggtcatc agcgaagcca agggtcttgg 19440
cttcaccatg tgcttgtacc cttgttcact cagcgaggag tggcagggag gctggaaggc 19500
aggtgttagc gtgtggagtg tttcactgtg caccttatgg aagtgacaca atgttgtttc 19560
tgagcagaga ggggcctgcc gatggagggg cccctttgtt ccctgttggc ccctcctcgg 19620
ggtggagagt ttttattgcg ctctatctaa agaaggttgt gacaggaagg gaagcatcat 19680
gaggagggga ggaggggtac tcatgtgctt tgggaagtgg gcggcggggg gggggggggg 19740
caccgagcag agaggggcct gccgatggag gggccccttt gttccctgtt ggcccctcct 19800
cggggtggag agtttttatt gcgctctatc taaagaaggt tgtgacagga agggaagcat 19860
catgaggagg ggaggagggg tactcatgtg ctttgggaag tgggcggcgg ggggggggac 19920
gacaccctgg gtggcttggc aaaggcatag aagaggatac tggaggaccc aagacacact 19980
taatctg 19987
<210> 2
<211> 19001
<212> DNA
<213> Cricetulus griseus
<220>
<223> Downstream integration locus
<220>
<221> misc_feature
<222> 13163..13223
<223> /note="n = unknown"
<400> 2
gagtttcttg aaaaccttcc ttctctggta gcttcctggt ctcactgcag tgagagggtc 60
cccgagccga cctccgtggc tctggaaaag tacgcttagg tcctcgtcca cacccagttg 120
ttgattcttt gggatgatcg ccctcttgtg gacagaggca ggttgcctat ggggaagcgg 180
gggtgtgggt gtgggtgtgg ggttgggagg tgggggccca ggaaggggaa aaggagcttg 240
gtggagagag ggaggaaagt ctagttggct ttctgtgccc ctgaggaggg ggcaacaaag 300
atgaagctgg ggatgggagt caaagcttag gaagtctggg ctgttctagg ggagacacaa 360
ttcacttatt cagggaatgt cacatggggg catggtttag tttccagcaa acaattggat 420
ttcatctgag gcacatttgt tacaagcaac tcaagggagg gcaggtttct gttaaaagag 480
gggaatctga gcctttccct ccagatacct ttccagggtt agaagaccaa gacagtcagc 540
ggggctcttg gaggggaggg ggagttgatt ggggtgcaga ggctggtggt ggaaagagat 600
gtctggtctc tcaggaggct gacaggctct gctgtgtgtg tgtggcccaa tgaagagagg 660
agcagaaggt gaagagtcca tctgcaaaat aaaacttcat ctttctgggt gtggtggtgc 720
accttttttt ctattttaaa gatttgattt atttattatg tatacaacat tctgcttcca 780
tgtatatctg cacaccagaa gagggcagca gatctcataa cggatggttg tgagccacca 840
tgtggttgct gggaattgaa ctcaggacct ctggaagagc tcttaacctc tgagccatct 900
ctccagcctt gtggtgcccc tttttaatgc cagcactcag gaggcagaga cagatgaatc 960
tctattgagt tctgggctag cctggtctac acatcgaatt gcaggccagt cagggctgca 1020
tagtgagaca cagtcttaat ggagaaaaag gggtgcggct taaaaaaaaa aacagaacaa 1080
aacaaagtga aataaaataa gtaacaaaac ttttgtctgg tttggggata tagtttaaaa 1140
ctgagaagtg aagaggcatt tacacgggaa attttggtgg gtgcagcagg cagggggtag 1200
aattgggtgt ggtcaggtgc acactgactg tttcatttat ccacaagatt tcaagttggc 1260
tcttgagcat ggcctaggtt ccagggaagg ggtagagctg gggacttggc agtagattcc 1320
ttcctctccc aaggggcatc cgccaccttt tcaggcttgt cagagcgagt ggctatgttg 1380
gtcagaggga gaggccctgc tacccctttt cccgtagtag aggttctgtt cttccctccc 1440
actgcatact tggcagtaat cccatagtct agtcaccctt acacccatga tgctggaaca 1500
gcagcatctg tttccataaa gtggtcaggc cccaggtggg gggttggggt gagactggct 1560
caggatgcgt tactggtcct ctgtcaagca catctgaaac tgtcaagaac gaagcaccac 1620
ttcccacagt gtcagtgtcc cacagctctt gcatttgtac aaggagtcac tgtacctact 1680
gtggcctcat ctccgaagaa ttatgtctac tgtgtgttac taaccgcatt caagtgacag 1740
gacagagttg caggacctcc accaaggtgg gggaatagga gatctgggag ggactgcgcc 1800
ctcctgaccc aggccagctc ctcctccagt ttctctgctg tttccagatt taatgtcact 1860
attccttctt tgtatcattc tcttaaatgt tttaattaaa tatcgagaat atacaaacag 1920
cttatatatg acacctaaag tatacaaatt gcaacatgaa acacccactt taagaaacaa 1980
acatttggtt gagatggctc agtgggtaaa ggcatttgct tccagcctgc tgacctgcat 2040
ttaattccta ggatccgcat ggtaaaagga gagtgcacac atgcatgtgc acacataaat 2100
aaatgcatgt aatataataa ataaataaac aggcttggag agatagctca gcagaggcct 2160
ggaactgggt tcccagcacc caagtgggca gctcacaaca gcctcaacgt cagatcagat 2220
gccctcttct ggccacagca tgcatgtgca ctcaattgca cattttcccc ctccaacatg 2280
tatacacgtc taattaaaaa ctaaacttaa atctttaaaa gagagaaaca ctgtagaaga 2340
tatagagcga gtggctcaaa gggccagaga cacaccattt gtgcactggt tcattaggga 2400
tataataaag gaaggagaac aagagcagga tggaaaatat gcccgaggcc aggcatgtga 2460
ggtggagtga agcccactct tgccctcttt gggagctcta ctctcaagga acctctatca 2520
tccagctatc tgagccctct tatttgtttg gttttattca gggtctcatg cactcccaga 2580
agcccttgac cttgctattc cgttaaggct ggctctgctt tgaattcccc attctcttct 2640
ctctcccttc caagtgctga gattacaggt gcatgtcact atacctggct taagcctgat 2700
ccctgtaggt tatttataga aacttcatta ggaagcatga ttgattacat tcctagtcat 2760
tgaccaagtt tgccttcagt cctggagggt ggcaggtggg gatgaaagtg tcaatcatct 2820
aacatctggg tctagttagg gttactattg ttatgatgaa acaccatgaa caaaagcaag 2880
gtggggagga aaaggtttat ttgtcttaca cttccatgta gtagtccatt actgaagcca 2940
gggcaggaac gcaaacaggg caggaacctg gagtcaggag ctgatgcaga ggccacagag 3000
gggtgctgct tactggcttg taccttatag cttgctcagt cttatagaac ccaagaccac 3060
cagctcaggg atggcaccat ccacaatgaa ctgggccctc ccccattgat cactaattaa 3120
gaaaacacgt tgcaggcttg actatagctc cttttattta ttttatatat tttatttttg 3180
agacaggatt tctctatgta accaccgtag ctatcctgga actacctctg tagaccaggc 3240
tggccttgaa ctcatagaga tctgactgcc tctgcctcct gagtgctggt attaaaggca 3300
agtgccacca ccatctggtt atagctcaac attatatttt ctcaattggg gttcccttct 3360
ctcagatgac tctagcttgt gtcaagtttg acataaaact gtctagtaca catataaaac 3420
actttcttat ctctctgtag atcccaaggg ttccagaaac ctttgggtgt ctgaaatggg 3480
aggaagacca taagtccact ttagaatgtc acagtacgtc tgtttctggc tttcttttcc 3540
ttttccccag ctgatctatt tcaatgccga tacaaggcat cccggtatat cttacaataa 3600
tgtttgagat ctcccacttg ttcttcattt gcaggatatt ttatctatta ttggcttctg 3660
ctttaagata tacactttag gggactggag agatggttaa gagcgcttgc ccttcccata 3720
gtggacttgg gttatggtag ttcacaaagg cctgaaactc cagttcctgg aggagctcat 3780
gccatcttct ggcatccgtg ggaactgcat gcatgtggta cacttacatg ccaacaagac 3840
accaatacac ataatacaaa aaatgaataa gccaggcacg gtagcacagg cctttcatct 3900
agcactcagc aggcagatct ctatgagttc caggctaact gaggctatgc agagagaccc 3960
tgtctcaaaa caaaataaaa caaaacccac acaacaaccc tccctaagta aataaatacg 4020
atatatatat ttcagtgtga gatgttcaaa tccacaatgc aacattttag aattttgttt 4080
ggcattgcat tgattctgta gagcaaattt tggagaatat tgactcttca aacctatgaa 4140
catgattgat ctcttttctg tttgtttttt gagacagggt ttctctgtgt agccttggct 4200
gtcctggaac tagttctgta gatcacgctg gcctcaaact cagagatgtg tctgcctctg 4260
cctcccaagt gctgggatta aagatgtgtg catgccacca tgcctacatc tcttcatttt 4320
ttaagggtat tttcaatatc tttgaatgac atgttatcat ttctaatgtt taagaacttg 4380
tattagcttt ctggtgctgt aaaaaaagac atgagacata tctattttag ttcagttttg 4440
aagacttaaa tccacggtag gttggccctg ttgcttttgg gtctttggca aggcagtgcg 4500
ctgtattggg agcccgtggt ggaacccttt gccccatggc ctcgatgtga aagagaagag 4560
gaaggggcca gacccccaat atccccttta aggctatgcc tccattgatg agaagaacgc 4620
tcactagttt ctacattttc accttgtgtg gtatgtgcta ggcaagcaaa agcacaaatc 4680
ttgtggttta aaatacttat tcatttgctc ccaccaagat tgtccctttg tgcaacctgt 4740
actaggtccc tagaaaaaaa cctaaggtca aaggacactg gtgtcatggc cactgctagt 4800
gctctgtcat cccaggagcc aagctccaca agccccacca ttctagcctc cagtcaagac 4860
tccaccctct tggcctgtgt ttagcaaagc ctctatgtac agctttgaat gtgtgtctgc 4920
ccttctcctg cccccctccc ttgaagtcca cccaggttat gtagagtctc accagcagtt 4980
ggcagaactt gtctctcagt ctaccctgct caggctccag acgttcttgc tgccgtggcc 5040
ttcaaggtcc catcttttga aagtcctccc agctcttcct catccccagc ctggaaatga 5100
gactttcaaa ccccattatc gcctatgagt gttacgagtg tcaagctttt taaaggaagc 5160
tgctttgtag agatgtcaga gatgccagga aaggctgctc tcattgactg ctaatggaag 5220
tgtgaactgt tattactgtt tgagaaagta atatagcaag agccacttaa attaaatatg 5280
catgtgcccg gcacccagca gtatcacact ggggttcata ttattgaaat aaaagcatca 5340
tccctcaaag atgcaaatat ataaacactt gggtgaaaat attaattgct ttcagtaggg 5400
ggagaaaaat gaagcgagga agggctctgc atctagggag ttagcaaaag gctagaggaa 5460
ttgtggcgct tctcagaaca acatacgcta accttaaaaa gcaccagagt ctgctgtggt 5520
ggcacatgcc cctagtctca gcactcaaga tgtagaggca gggggaatcc tacaagtgtg 5580
aggccattct ggattttact gtgtccccat ctcagaagcc aggtggtccc aaccctcata 5640
ggtagagctg tgggaagggc agaactccgg gaagggtggg aaggagctag ctgtgctctt 5700
tttggaggtg tggtaggtga actgggagca aggaggaacc tgggagtcac tggctgttgc 5760
agaggtatgt ccaaagagtt cccctagtgc ccacacccta gcagtgccct ttcagagctt 5820
agggagggca actcatttat gtccagaaga agagaggagt ggggaagccg tgggcttctg 5880
cttccatcct tctctcacag gacgactaga accaccaatc ggtaggacct tctgcctgca 5940
gggtcactta gagctttcag atggggaggg tctcacatgg tgcttcctct cagtgacacc 6000
cctcctccct cttcaaacct aaagctctgc gagctcacat tcatccccat ctcactcctt 6060
acagaaggat attcccactg tagtccctgg ggtgttagaa tgaagccgca tggcttttcc 6120
catgatgctt tgcctggacc cagcatggag gatgacagca cactgatccc cagtcttctt 6180
ttctgcatga aggctgttcc tgatttcctc atgagctatt tagaagaagg tccactatga 6240
cttccacctg ctccatgctc ttgcccctct gggttatttc ctccagagaa aagaattagt 6300
aagccaagat gtcacacacc cactagtata gcttcttttt ctatcacata tttatttatt 6360
ttgtgtgtgt gagagagaga gagagagagg gagggggagg gaagagagag agagggagag 6420
ggggagggag ggagagagag agagggagag ggaaagggag aggagagagg gggagagaga 6480
ggaggagaca gagggaggga gagagaggga tggagggaga gagagaagga ggaagagaga 6540
ggtggcgggg agacactttt ttcggtgtaa tttatttatt tatttattta tttatttatt 6600
tatttatttt ttatatattt gagttacaaa caagattgaa ttacatgaca atcccagttc 6660
ccttctccct cccttcctcc cacccccccc aactaaaatc ctacctgtca tatgtccttt 6720
cttctaatct acacctgact caaaatttct gcttcctcat gacctctgca tccttccttt 6780
tcttcccttc tcactctcat agcttcctcc cccctcttcc catgttctca atttgctcag 6840
gggatggtga ccctctcccc ttctccaggg gacaaagttt atctctttta gggtctactt 6900
tgtttactag tatctctggc agtgtggatt gtaggctggt aatcccttac tctgtgtcta 6960
aaatccgcat atgagtgagt acatatcatg tttgtctttt tgtgactggg ttacctctct 7020
cagaatggtt tctttgagtt ccatccattt tcctgcaaat ttcaagattc cattgttttt 7080
tttttttttc ctgctgagta gtactccatt gtgtaaatgt accacatttt ctctatccat 7140
tcttcggttg aggggcatct aggctgcttc cagtttctgg ctattacaaa taatgctgct 7200
atgaacattg ttgaacatat gtccttgttg tatgaatgtg cttcttttgg gtatatgcct 7260
aggagtggaa ttgctggatc ttgtgggggg ggagacactt ttgagagctg tttccttctg 7320
ccatgtggtc ccagggattg aactctgatc atcaagtttg cctgcaggcc cctttaccca 7380
caggaccatc tccctgaccc atttcttcgt ttaacaaagc taaaatgcct tacagtgtgc 7440
acccagtggt gagtgagtat cttccccatt ttctttttaa gagaaaaaca gcctagtttt 7500
cctcttctgt ttttgtaaaa acagccttat tcaggtataa ttcacacgcc acaaactgac 7560
cctatgaaag tgttcagtaa ttcagtgccg agtatgatgt atcacacctg tgaccctggc 7620
actcgagagg cagaagcggg aggcccacca cacattagag gccagcctag gctacacagt 7680
gaatgtcagg ccagacaggg gcatataatg agattctgcc tcaaaaagca ctcccgaacc 7740
cagacaccct caaaatgttc agtgttgtaa atttttaaga atacgttttg gtgttttact 7800
tgtatgtata tctgtgagct actgtgcggt gctgggaaaa atcaggggcc tctactctga 7860
actgctgagc cacctctcca ggtccgatgg agaggtgttt aataagcttg gcattctgta 7920
agcttcacca cgatttgatt tcaggtattt taatcccttt agcaacctga tgcccattgg 7980
cagtccttcc ctctggcctc tgacagccac caactttccg tctctatgca tttgtctact 8040
cggggaattg catataaatg aaccactcag tagcctttca cgactacttc acttgttttc 8100
agttcatttc tgctgcagca cacatcagca cttagttctt tttatgagta gcatcccata 8160
tgtacatgct acaatgtgtt catatatgta caatggctga tgaacatctg tgttatttct 8220
acatttaaaa aaaatgctgt tctaaacatg agtgttcaca tagggtttgt gcagatacat 8280
ttccaattca tctgctgagg gacatatgca ggcatggatg agctccttct tgtgcacaga 8340
aagcaaatta catggatttt cacatcgctc accctctttg tgaggtagaa acaagggcat 8400
taccgtggcc cttggtttcc tgtgagcttc ttatcagggt caacctcatt agtgctgtac 8460
aattctacct ccactattgg ggtgtttggc tcagtctcca aacacacttt ccagtccaca 8520
tatcttctga gcagagcaga gaagacctat ttgtctacaa cctgggagaa tccagctgtc 8580
tgatctgtgg gtggtgctga gaagtacagc tcaccagaaa taggggtcct caggccatgc 8640
tgccacagtg gttcttgcca ggcttagcag aagtgttatg taggtgcctc aatgcccttc 8700
ccagagcttt ctgaagctgg gagggcaaag gagcctcaga ggccctgctg tgttagtaca 8760
gtcacagtag ctgcataaag aaacaaaaag ccccaagaaa caaaaatcac ctgctgagtg 8820
aaatccccta atgaacccag cagctgggag gcaggaggca ggctgccaag gtcaccatag 8880
caaccagaaa cagagccttt catacagtct ccctgactct tcagagagaa agacctgtgg 8940
acctctttgt gaccttttgg cttctcttgg ctgctcaggt tgtttcccct ctcatcccag 9000
gtttgacaac tcttctctga ttggtgatac ttttcccacc ttatttgcat acccatatgc 9060
agctagctag ctcccctacc cccgcccctg cacatctatg aatcttggca gagctagagg 9120
tgctccagga gcccaccaag gaggaagaga aggaagactt caaagcctgc cccctgggtg 9180
gccagcagcc tgattccaga tgttcctgct tgctccagag atccttcctg aagacttcag 9240
ggtctggctc ctccctggct tgctcattgg agaaggaaga atgccttcca gaatcaccag 9300
ggacaaagag tagaaggtcc ttgggtccaa ggcttctgcc ctggtcagga agcttgctgg 9360
attccaggat ttgatgagca ggtgcagtgc aggtgcaggt gagggacttg tgtttgtctc 9420
agcctccaag attcttctca cttggtgacc tacagatggg aatttccctc tgcagcagct 9480
tttaccctct gagactagtc ttctgagctc agcagctcca aactttcaga cccgctttgg 9540
agacttgaga ttccagcttt ggagatccaa tgctccagag atctgtgact tcagccttct 9600
cggaggcctg ctggagacag aaggcctgct tctgttattc ccattgctgc cctgcaggct 9660
tgctccacaa ggcagcagtg ttggcacaag aaggcctcca gcctttgaag ttttaacaat 9720
tcccagaatt ctaacacttc tcagagctag taccccagtg ctagcttaaa cctttgccat 9780
ttaaatcctg catggaccac ctgtttaaat ttttatccta tttaaaggga actaacaatg 9840
aagtaccccc cccccctgca atttgtactc gtcactgccc actccatcgt ggaggaagac 9900
ggaacaaaaa cctggttgga gacagatggt ggtctctgct gattgttcca gaagggctgt 9960
ctgtggtaaa aagttaggtt ttggaatatg cagaattaag ctgaagcctc attgtgagct 10020
tggtgtggtg ctcatgcctg acttcgggaa cttagaagtc aaggtgggag aattaccagg 10080
agttccaggc caggatggcc tacacagtgg gcaagacagg gctacagtga gaccgtctca 10140
accaaactaa accaaaccta ccatgccaca tgaaaacaaa acaaagcaga tcaagcccac 10200
aaaacaaaat aaccccagat tggaaccaaa ccatatcaaa tcttcccttt gccttagatg 10260
tgggcatagc tgtgtggagg ctgaaaaaat tctcaaggct cagtttggtc atcttcaaat 10320
ggagataaac atggcttcct gttagggatg ctttgtggtt gaaaggaaag aaagcattta 10380
catcccttag catcaaatag agttaatgat aactattgct ggtgtagtaa aaatgttact 10440
agttagtata gtaaatactt atgaggtagt ggttagagta ggttgaaagg caatagcagt 10500
accattccac aattagatcc ctcaaaactc gaggtgggtg agggtggggt gggagccgag 10560
aggccatcac ttctttttat atttatttat ttatttattt atttatttat ttatttattt 10620
ggtttttcga gacagggttt ctctgtgtag ctttggggcc tatcctggca ctcgctctgg 10680
agaccaggct ggcctcaaac tcacagagat ccgcctgcct ctgcctcctg agtgctggga 10740
ttaaaggcgt gcgccaccaa cgcccagccg aggccatcac ttctatggag gagaaagcct 10800
catgttggtg gctggtcgag gaggtaccag ggttctggtg agcatcaggc tgaagggacc 10860
aggcctgggg ctgagaccag aagtagtgag caaaagtgtg agcaaacagt gactgaagtg 10920
ggacatgggg gcagggtcct tttaagggac acggggatcc ttctttcaaa ccttgttaac 10980
acgacaccag cacccgaaag ctgatggatg ggatagtata ggaataaaca tgatacctgt 11040
gcaaatagaa gttgtcccca gaagaatgcc attttgtaac cgttcaaaaa agtcagccac 11100
agggccacag ggcccagctg tcaccagctg ttgctatctt ttttttttgc tgtaaacagt 11160
aagaacaaaa ctcaacaaaa gatggaagcc agctggggca gagtgaggcg gaggtgtgag 11220
cccactgtat caggaggtcc tgcagagggg agcgcttggg gagggagtgg gctgtgggag 11280
gctgttgaga cgcttccagg aggagatgcg tgtggatgcg ggcatccaga agaagcagtg 11340
tggccagtca gaggaggagg ctggcatgaa tgacactgta atgccatcta caggggcgag 11400
ggactggtga ccaaggtggc aacagtcata gacagtggat atgggctgtg gtggacagtc 11460
aggcctgcac ttcctgaggg ataagggcag ggccagcaac cttcacaaga aaattgaaaa 11520
gccactcagt attccagata aaaaactcaa actgaaaatt ccaggctctt ccgccccagc 11580
aatgatgggt tttcatattg tcttccaagg ctcttatgtc atcatatggt gactcacacg 11640
gctgggcatt ttatattttc tacttgacct gtggcatata ttgcccccac cacatgcata 11700
aagtattccg ggtacagtag aaggggtcct ctccactaca ccaagaatcc gggggtgccc 11760
attgctgtat agttgtctta ggggtctcag ggaagctgtc ctgctggtgt gtgtgtctgg 11820
ctgtgcaggt ctggctttcc ctgggcagag cagcaagagg gatttgaaca gagaccaaag 11880
ggttgaagaa tgaagggtca gccagaagag ctgtaggtgt accctacctc caggggtaca 11940
gtttctcttg ccctgaatcc cagcatcccc agagggtgac tgtggtctct ttgatattct 12000
tccaaccctg caagttccaa gtctccagac ctcaccccct tgtggacacc ctggtccttt 12060
tctgtttttt ttcctgacaa cccccaaatc tctttatcct ccactataga aacccagtgt 12120
taactgaggt ttaaacgtag agcaatggga aaaccggttg agcctgggag gcctcattct 12180
tagtgattgt tacagggggc aaaaggtcaa tacttgtact tatatgtttc acacggcagt 12240
aaaatatgga tggatacttt gtattttatg tagaagtttc cagaacctgt taagtgactg 12300
gaacaacata cttaatatat tttgaaaaaa attagaaaga tactataaaa aatcacataa 12360
aaggggaaaa aataactccc ctacccccaa tcttcaacta agcaagaagt tccttgtgcc 12420
ttctcttagc tcaggtgaga gatgctcagt ctgctccagg gggctgctct tttattgcag 12480
tcctccctcc ccaccctgag gacagcactc gtgtttcctc atcaagtctt cccaggaaag 12540
catgattacc attttaatgt tagaaagagc tatttgctgc tgccatgcag tggttgctaa 12600
tgtcccttcc tcctggacac ttgaggctgt ttctggttgc acttctctga attaccgagg 12660
gcttgtggag actctactaa caaaagcagc ttcaccagca ctgactttcc acagcaggag 12720
gcttcatcag atccctcact tctgtgactt gtgctgagtc ctgcctagtt tgtcattttg 12780
ttttgacaag ccattcattt ctgcagccca gagccacagt gttagtttag gaacactcac 12840
atctaactgt ttgaaacttg actgtttgct gatttacaaa tttggtagta aaaactactc 12900
caaggtggag ccaggggata gctcagatgg ggtcccctta aaaagctgtg tgtggtggtg 12960
agtgcttaga atcccagaac tggggaggtg accagtctta gagattccct aggactccct 13020
gaccagtcat cttagcctac ttagcaagcc ccaggccaat gagaaacccc atcttaaaaa 13080
aaaagggggg gggtggtttc tcagttttaa cagataacat ctataacaca gctctcaccc 13140
tgaggtttag ggatcatttt ggnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13200
nnnnnnnnnn nnnnnnnnnn nnnagtggaa agattgtaag agccagaggg acaggaagtt 13260
tgctatgaga ttggtgggga catcgggtga gttgcagcaa atctcctgtg gccttcagat 13320
gctatttgac agtttgctta gctttgggtt ggtaggaact agtggtctgt cactacactt 13380
caggagggtt tacaagacag tcataggaag ttaagtgaga cacagggcca gaaatgaatg 13440
gttattaagg gaactaacga tagtctgaga tagtttggct ctaggtctgc acggttctga 13500
tgcttaatca caaagctctg agcagtccgt ccagcttgtg gatctgtaac aggtgtggct 13560
tcttttctgg aaacttcagt tcatactccc tattccaaat gtaggagtgt aagacgctcc 13620
ctttctcctt tgtgtccccg tctgagctca gagcctgagg gcaggaatga tggagcccac 13680
aggatctgca caggtgagga gactgtcttc ctcttctcca tcagacagga ggaagctgat 13740
cagcccgagg tgtctcattc cccatccttt agcacctcct gctggccact ctatccccat 13800
tcatgtggtc ctgccaggtg gtgctaaggg atctctgggg gagcccagtg gtcagctagt 13860
ttggacatta gctggttgga gcagaagtca gaccggtttg ttcctctcag ggttaagtta 13920
ttgggctaca gcagagcata ggctcccgta gggaagagct gagctaagct tttctgtgcc 13980
agaaagctat gcttttctgt atctgccgtg ttgcagttga atgtgctttt gttctctcag 14040
gccaaactga tcctgtaatt caaaccctcc atgggcttca gccacaggcc aggtcctaac 14100
tctaagtttg cacagtaagc cctccgcagt tgggtctctg gttctttcag ttcattttct 14160
gcagtttgta ctttttctct gggccaaagt ttacagctgg gcagaaagat tcctggacac 14220
acacataaac caaaccaaaa cattcccaaa cacccccaac ccaataaaaa cacatcccct 14280
cccaataaac ccccccaaat ctttcctgtc agttatcttg agaaacctgg gtcttgatgg 14340
gatgtgtggg caaggtgcca tttgcctgac ggtgcaggca gaggcatcac agtcctctga 14400
gagactagct attgaaaaca agcaaaaaat gcacctggac ataacaaagc cagtgctaac 14460
acgttacaaa gaggatgcta agggcagata aatgggggag aatgtgtatc tttcatgcag 14520
aaaattttgt tgcaatgtag caattttgtt tgctaacagg tattttagga gaaaatgatc 14580
taacagcact aaactggaga caaggcatct actaacctca ctcggtagag cccagcctgt 14640
actgcactgc tgctggcaaa ggagcctggt ccatgccaca ctcgggactg ccctcttctg 14700
atcctgcacc cttcccacct ccctgtcatg ttccaaccct cccgaccttc tataaccagc 14760
tgaatgttgt ccactcagtg acatctcagg tcctgggctc tccactgtcc tgatgtgttc 14820
agttcctctc caacagtcct tgcttcaaga ggatgactct ggtttgcaag actgtccttc 14880
cttcactccc cccttcttcc tatctctccc ttgaatatga actgagatac ttgtgaaagg 14940
gccacatcac gctcctcttc atttagcgta agtcctgcca catagtgggt gctcagtaaa 15000
tcttggctca cacgaaggag ggttgtgggg aaaagggctg ggggtggggt tgtggaggga 15060
aggtgctttt aggtaggagt ctgatccatg aacgtcttgg agaatgagcc agaaagatga 15120
agcatgtgag attaggcctc atgggtgtgc ctgtgagact tcagtcacgg ggcaggggtg 15180
cctgtgagtc atcgtctcag ggatacctgg agggatcagt tctgaatgct gcattcattg 15240
ttgcgttcct gagtcaggta gagcaggtgc ctatgagtca cgatcactga cttcctgaag 15300
tgcaaatgca cacgagacct tgttctcttc aaacaacaca ctcccagcca ccatgctcta 15360
ccatggataa aatcatggct ggccccatag ccttcttagt gtctctgagc tcatgacttc 15420
caggggtaga gtctatctga aggtctctat accagttcca gtcaaagggc ttctactgct 15480
ccagctgagc ctgccctgca gtggggaggg gacatgtggg aagccttttc attcttttag 15540
tcacctgtcc ccacactatg tgtctgcttg cttttctaag tagggggaat agagacacaa 15600
gtctccatcc acactgttgt cctgtaggta ggccctattt ttcagggatc tttatctgac 15660
cttgggtctc caacaattac cctccacccc catcagatag cagcacagtt gagccatttt 15720
tcctcattgg ctttggggca ggcagctttt catttttaga atgtctcaca caccagtcag 15780
gatctgtttt ctttattttc cattcacgac ccagctcaag tcaattgaga ggttctctta 15840
gcgagcctct cgcttggtct gtggacacag tgcctgctct cctcctctat gggagtgagg 15900
tgggaacaaa tggcatcctc ctaacaccca gctctctctc tgaataatcc cagactgtct 15960
ttttcttgag gcgaggagag gtttattgtt tgctttgggg ttaacctcct atctaattcc 16020
catagaggac caagagcttc tctagaaagc tttgaaacat attcccttta cctgctattc 16080
ggggccactg taatcaaagc agtgccaata tttagcttcc tgtgtcattg gggtctgggg 16140
aatgagtgaa tgaatggaat tatagttggg aggtctcagg gtagtttcct ccaggagtga 16200
gaaatgaggc taataggagg agagaaggct ggcaaggagg cagcaaaagg ggctcagctc 16260
tgggttcccc tggggcagac ttggaggctt gggcttgaac ccgccatctt gccagctgtg 16320
tgctcttggt aaatgtactt gttttctgtg caagttgcct catcttgaaa actcagacaa 16380
tcatagaagc tgccacacag cgctagtcca tttgcaatta tgtcttcttc aggagatgct 16440
ttatgtcagg tgtcagcatt gttggaatga ttgatcctta aaggccaggg ctagcgtgcc 16500
agcaggtcag agagtggttg ggaggtgaga gtcctggggt gaggaatttg gtgtagaaga 16560
gaagttggtg tctggctcct ggtggagtgg ctcctggaga agaaagctga agctgagcac 16620
tgttcaggct atgctgcata tgggtctcag cctgtcctgg aggatggagc tcagcctgtc 16680
ctggaagatg gaccacatcc tgcatgccag tgtctccacc gctgtctgtg agggccttcc 16740
attcagcctc aggcctggag agggccccag tggccagggt cttgtgcact ctaagtctgt 16800
ttttttccca ccccatcttc agggccagct cttacctcag gcccacagtc acaggggcct 16860
ggcctgggct catgggaact gattcatggc tctggcttct cctttgcctg gcttggagat 16920
ggaaatgctt gttcatggag ctagtgaagg agaccagctg cacagctgca tgaagctggt 16980
gagtccaatg ggactgggtg gtagttacaa aggacccagt aagttctgaa tacccagagg 17040
agggttggaa ggctaggtgg tccttgctgt catccttgca ctcatgttca tctgtccagc 17100
cactaccctc ttacctttct gatgctttgc ccctcatttc tagggcaaca atctttctga 17160
tttccatgca ctcctggcca tgctttaaaa tctaatactg agttaccaca gtgtggctgt 17220
gtgactacag acctggatgg tcctggtccc ttcatgccag gaggcctgga taagcctctt 17280
gtgtgtactt ccccaaagtt ctgacatgca ggaggcaccg tacagcagcc catgattgca 17340
gtgtggttta gcacacatag ctgatgaaac aagatgacac ttgtagctga ccctggggtt 17400
agagtgagag ggtgtggtta cttgagggtg agtttggaac cccattagag ttccagtaag 17460
acaaggctga ggatgtgagg ggaaaggggt gctgacccgt agctgacacc ctctgaaatg 17520
ttctgaggaa gtggaatcct ctggttattt tacacaccac caactcctca caaacgaagc 17580
atcagagggt gtccctttct ccaagccttt aatctagctt ttgtggatgc tgtcaccctg 17640
accacagtga ctgttcaaag aggtggacat gtgacctgaa tcagaccaat cagagctgta 17700
aattaacctg gtcttttatt cctaaggtta taaaatcaca atatgaaaaa tattcctagt 17760
gtgacagagg aagaagaaat taacacacat aataaccact gactatagaa aaagaaggag 17820
cattcagagg acaaatattg catcttcaga gaggcagggg cagtggggca tgtgggggca 17880
tgtgttcagg aaatgatttt ggtggagatg attgcacaga gagctgggtt atatagtggt 17940
atgagcacct ttgcattgca aattagcata tatagctttc catcgagtag cggtgtaaac 18000
tccataggcc ttttgtttag caagagaaac tccacaaggc aattggaaac caaatgatac 18060
agaaactgtg caagccatgg tctaggaaga aagcacattg aaaacatgct attggacaaa 18120
tgatattgaa cgtcttaatg gttttagttt accagatggt gacaacaaag tactttagac 18180
ttggtgactt ccccgtgctg gaagctggca agtttcaaag gaccagaaga ttcattgttt 18240
ggtgaggcct atttcttggt gcatagtagt ttttagttgt tttcatccct agtcccctct 18300
ctcatctccc tccctctctt attgaaccct tcttccagca aaaccccctc ctattttcat 18360
gtctttgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgacccact gggcttaatt 18420
agagttcttg ccagagagtg agtgggatgt tattttctgg aggatgggga acttactggc 18480
tctacgatga agaaaatgga caccgtctac cataatagct gctaacttct catagtccct 18540
cagggaggtg gtcattggat ccctccccta tccatgttga aatgttgaag agtacagtca 18600
tgtgcacgtc ttgttcaggt gaacacagct gtgttgaggt catgtctgga agaggtcttt 18660
ttggatgcgt ccttatatag cagaaggatg aaggaacact ggggttcact aattcagtca 18720
tagggtctgt acctgcacag cctaattgcc cagtaatact gggggctaag ctttgacata 18780
tggaattggg ggctgtgggt ggcatagaca gcggtctata gcgaaatgaa gggaaaaagc 18840
gtttactttg cttaaaccat gaaagtccaa ggttgagatc atagatcact agacaaggag 18900
tgaagagtta actgtgcaat ttctgcctgt gtggcaagtg gtaatgatgc tgcaatttgt 18960
agctctacca tcccatacat ggtgtgtttg gcttccagtt g 19001
<210> 3
<211> 7318
<212> DNA
<213> Cricetulus griseus
<220>
<223> Upstream side cluster
<220>
<221> misc_feature
<222> 1303..1359
<223> /note="n = unknown"
<400> 3
ggatcccaac actgccactt atgactgaac tctgggcact cgcttatagt gtgtttcctc 60
atggggatgt gaatagtcct ctcataggag gaggacggga cacacgaagt tcttactgga 120
aagcctgaca ccgtgtgtac ctagtaagtg gaagttgaat gaaaatgagg acattgatat 180
ggtggaagag aaggttttta ttgtagatat gagggagaga gcagccagag gcatctggaa 240
gagtccagac tgaacagggc cagcagaata gacccagcca tgagagaaga gagagggaca 300
agagagggga ccaggaaagg cgaggaccaa gaggacaaag aagaaccaag agagcatgtg 360
gcaaaaatgg cgggttatat aggaaccata gctggggaaa gggaagcaaa gctcaagggc 420
tggagaggtt tagggtggga gtgggggtaa gaagtgctga gaggagccag gactttgtat 480
caggtacttg caatggagag agcctggctt tggtaggcta aataggcacc acagttagcc 540
atgtgtctgg gggtttcttt gggatctgac attccagtct ttttgttgat gataacgagt 600
gatgtaatct cttctgtaac tgcttcttag ttaaaattgg ggcattgttg ttgggggcct 660
aagaaggctg gaagtttggt caaaggctgg gaagagaaga gtgcaggctg gaggacatct 720
gttttgctta ctgcccaggt tctgagggac cacctggggc tagtgaagtg caggctgctt 780
tggagtagtc taggatttcc aagaaacacc tggagctgga gcgttgcagg cagttttgga 840
gcggtctcca ctccagctga taagaaatct gctggggcag gtgtagacta gggacagaag 900
gtaaagttaa ggagcttagg ggaaattttt atcttgggtg tacatttgaa acttccaggc 960
ccatggtcct ggtagttgca gtgacagtac agggagaggt ggggagttgg gggcggggga 1020
gtaggtatca agaccagggg agagagagaa atcttaccct taggaatagg caggtaggga 1080
aactttgttt gacctgtgag aagtggaccc aagtctcaca actccctgaa gcttacaaga 1140
acattttaag tttatagata aaaattttat atatattagc attatcagtc tttgtaatct 1200
gtactgaaat ccacattgta gaaaaagcag ctggctcaca ccttcaagtc acaataaaag 1260
cttggaaacc gcccgccccc ccgccccccc accatgatga ggnnnnnnnn nnnnnnnnnn 1320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna tgatgagtta aaagcacgaa 1380
catgctttcc tctatccaga agactgggtg tataaaaaca cttttaaggc catacttaga 1440
aaacaaccag acaggtggta gtggtacatg cctttaattc cagcacttgg gaggtagagg 1500
caggcagaat tctgtgagtc tgaggccagc ctggtctaca aagggagttc caggacagcc 1560
aggactgtta tctagagaaa cctccctgtc ttgaaaaacc aaaacccaag ccaaacagaa 1620
tcaaaacaaa acaccttttt agaccctcac aactaactta agctttcaca tcctttacat 1680
cttgcacgca tataaacttc actttttcag acccttagaa cttatacaag cttcaaacct 1740
ttctttctac ccaaacattt actatgagac acacgtggtt ggttcctgag agcagtcatt 1800
gcaaagcaag ttcctttaaa taaaggaata gtaaaaagtt acactgaaac ctgttttggg 1860
agtttatctt tttcagtgtg aagtcttcca ggaagataaa gtctgtctac ctttctcagc 1920
gggataccta gtagctcata tcatatgaaa tggactgacc aagcagctgc agccttggag 1980
aaggaactga tttgcttgct gctgttaaca taaagctaca gttagtcatc aacagtatcg 2040
gagactcgag agggataaat tatagcagaa agttaatcca aatggcccct gtaccagtta 2100
aagtgacaga tttattggct acctagatgg ttagcctaag tgttccatgg tggtcttgat 2160
ggctttgttg ggggcagaag tatttggtct ttggctgtca cacaggatag cattaaatct 2220
tcagctacca cacaggacaa cattggtctt tggctgctag acccagagat atgagagatt 2280
ttcctgtgga ggaagacctt ggaaaactgg cataccttga tgaggaagag taggatagtc 2340
aacccaacaa tgtccacagc ttgggcagaa acattgtggt tgaggcatgg gtcagttctt 2400
tgcccagtgg ttagtgttac cacaatctag gtggagtagt ctgtgcccca ttatcttctt 2460
tggagacttt agggtcattg ctaggggtgg cagttctgtt tatcacagga agtttttttt 2520
ctattaaaca tttaaagtgc catattcagc agatctctga ggagtttgag gaccatcatc 2580
tattaagtat acttgagtta aggaagcttt acctggtttc agttacttgc tttaggctta 2640
accttgaaaa acatatagag agcccagtgg tggcgcatgt tgggaggcag aggcaggtgg 2700
atctctgaga gttcgagacc agcctggtct acaataacta gttccaggac agcctctaaa 2760
gccacggaga aacccagtct caaaaaacca aaacaacaac aacaacaaaa caaaaaccca 2820
aaaacccaaa ccaaataaaa ccatatgcag aaggctaaat aaaacttgtc cctgtaaaca 2880
aattgcattt gtacttagta tggcttatga gcatagtttt gagtaaagaa tttgatcatt 2940
tataaggtgt ctggctgttg acttgcatgt cttaattatc tttaacagta tacaacaagt 3000
tagtacttat ttttaaaaaa taagatcagg attttatgat tttagccctg ttaagtttga 3060
gcattaaaaa ttgaagttta agaaacttta gcatcaaaat gaaactttaa accataaata 3120
aattctgcag agagaccggg gacttaacaa aaccataaat acagtccaag ggggattggc 3180
aaccttattt cttgatcctt tttttttttt tctttttgag atggggtttc tctgtatagt 3240
tttggctgga actcactcta tagacaaggc tgtccttgaa ctcacagaga tctgccacct 3300
gcctgcctct gcctcctgag agctttaaac ctgacatctt gatcctttta tagtaaaaga 3360
ctacagaatc agtttcttgc atgattcagt ttattccaga agacagagct tagaaaagtt 3420
agcaaagaag aagaggtgag acttacatct gcaagtcagc tactgttaac ctgagtggat 3480
cttaggaatt tataaacctt atttatcaaa tacacattat ttatcaaact tgttgtttag 3540
tatttaaaat gttccagaag cctggtattg aacagttagt aaagacaaaa gcagttagac 3600
ttatgtctca atgaaggggc cagctcccct ttcggcagtc ataacggccg aacacgtgct 3660
ctatgacctt gtcctagaca ctagaaagtc agatgcctgc ctcttgacaa ggaaccaatc 3720
agaagttagc tggtggcgct atgctttacg accctgggtg tactttcgga caagcacaca 3780
gcaatgatgc agagcatagc aaccacccta tgggccataa caaccagttg gccaatcaac 3840
acagggcaag ccctccaagc ctggaggtta caccaatagt gaccctttgc gtacccctag 3900
acactcccct tacgctgccc tataagatct cggtcctgtg gcttctcaga gtcttttgcg 3960
agccctccgc catggagggt gggtgaaaga cccaagctaa catggggtta gctcgttaaa 4020
ttacaataaa gcctcatgca gtttgcagcc agctctcaaa tctgcctggt gatttgggtg 4080
actgtggtcg tggcctggga ccccggatac ctgagttttc cgggggggtc taacaaatcc 4140
aagttacata tatagtattg tctaaacaag aatagaatca ttgctggtct gtggtggtcc 4200
atgcttttaa tctcagcatt tgggaggcag aggcagtctg atttctgtga gttcaaggct 4260
agtctggtct acagaacgag ttccaggaca ggctccaaag ctacacagag aaaccctgtc 4320
ttgaaaaaca aacagacaaa caaaaaaccc aaatacacac acacacacac acacacatac 4380
acacacttat atatgttgca gcaaattaaa attacctatg tatagatttg taaatataaa 4440
ccttttgtta taagttttaa gttaaatttt gttacagatt ttaaaaacat acccaatgaa 4500
tttacaaatt ttgaggttaa caacatagtc ttaagatatt ttttgagaac agaaagcaaa 4560
gaaacagtaa agataatttt tttccagaca gggtttctct atgtagccct gaaactcact 4620
ctgcagacca ggctggcctc aaactcagag attctcctgt ttctgctggc ctagtgctgg 4680
gattaaaggc atgtgtcctc actggctgag ataaaagatt tttaagagtg gaaaatagaa 4740
aaaccttaag agttgagact tttttggaag tgtaggggag agaaagttta gatatgagat 4800
ttggggaatc atttgtttgt gcagtggcag aggttgttac catatgagag tatttgaaac 4860
cccgtaatat tgtcaagttt tggctgttga ttgagctgta ctgagaccaa gccgtttgca 4920
gtaagacacg aggctttaat gaagtctcta agtctgagga agaagagaga aaagggtcat 4980
ataaggccca ggagaatgta aggaagcagt ggggcttcca ggtggaagct gagagacaga 5040
aggaacaagg gtcacagaca gggactccgc ctgagggagg attccaatat tgtagaggcc 5100
cagaaggatg aaaggaagcc atgggactgc aattcctagg gagaggggaa gaagttccag 5160
gaacagtgga gaacaaagga agcagaggag gtgtcatgat gataaggatt tcaacctggg 5220
gcatccccaa tggaactgag agacttgtca gagagaaatg tcctagatca tagaggagag 5280
gcatcatttt ccatgtgata ggggctcggt aggatgagag gagctttctg gcataccagt 5340
gtggcttttg tagtaataat agacaaatta ggcaactcca gggtgacact tactcagtag 5400
aggagaagag acaagtggtt agatcagcta gaggagaaaa cagctggagt ggactaggag 5460
aggcttttgt gagaagggaa ggttccagta gaacagtggt tcccaaactt cccaatgctg 5520
caacccttta atacagttcc tcatgttgtg gtgaccctca atcataaaat tattttcatt 5580
gatacttcat aactgtaatt ttgctattgt tatgaatcat aatgtaaatg tctgtgtttt 5640
ctgatggtct taggcaaccc tgtgaaaggg ttatttgacc cccagagggg ttgtgaccca 5700
caggttgaga accactgcaa tagagggaga ggagtaagta gcagagagat gcccaagtgg 5760
ttgttgccct caagggcaca gcaggcacca ggagccacac agacgctttc tgagtagatg 5820
agaagagatg gatagttaga acaggtggag gggagaaaag aatgaagagg caggctgtag 5880
aatttgtagt caaatttgat gggtggcaga agccaacaga aacaaatgat ctgtacatac 5940
ttcagtagag tcaaatcagc aggttggttc tgttaagaga gaggctgatc caataaaaaa 6000
atggagtaca gatctaaaca gagaattctc aacagaaaat ctcatatggt ggaaagacac 6060
ttaaggaaat gctcaatatc cttagtcatt agggaaatgc aaattgaaac aactctgaga 6120
taccatctta cactgatcag aatggctaag atcaaaaaca ccaaagacag cttatgctgg 6180
agaggatgtg gagtaagggg aacactcttg cattgctggt gggagtgcaa acttgtcaat 6240
ttctcagaaa attagcaatc aacctacctc aagaccctgc gatacatact tttgggcata 6300
tacccatgta ctcatattac aaggatattt gctcaactat gttcacagca acattattca 6360
taatagccag atcttagaaa caacctagat gcccctcaac caaagaatgg ataaagaaaa 6420
tgtggcacat ttacacaatg gactactact cagcagtaaa caacaatgac atcctaaaat 6480
ttgcaggcaa atggacagaa ctagaaaaaa aaaaaacaca aatgagtgag gtaacccaga 6540
aagacaaata tagtatgtac tcacttataa gtggatgcca gacataaagc aaaagatacc 6600
cagcctataa tccacaaccc tagagaagct agaactctct tccagaaaca gatagaagca 6660
gatgcagaaa tccacaacta accattgggc tgagttcctg gagtacaatc aaagtgaagg 6720
aggagtgaaa atatgaacaa aggagtcaag accatggtga ggaaacccac agaatcagtg 6780
gaccggagct agtgagagat cactgactca ggtctgacaa atggggaacc tgcataagac 6840
tgacctgact cccttaatat agatgacagt ggtgtggttg gggtaatata tgaggccact 6900
gacaatgggt ccaagttcta actctaatgc gcaaactgac ttagtggagc ccattctata 6960
ccttgctcag tctagacaca ggggtggggt ggggtggaga ggtaccttgg tcctgcctca 7020
aggagatgat gggacagact tagacttcct agggaaggcc ttcccttctc tgaggagcag 7080
atgggaggtg gggggggcag tggggggagc agaaggagag gaggaggaag ggggaactgg 7140
gattggaatg caaaaaatta attaaattga gaaagagaga gagagagaga gaggctgagc 7200
cctttggaag gaaggaggat catatgtgcc ctcctgggtt tcgaacatca gatgaatgaa 7260
aacgaaggtg aggacattga ctgctcctag gtcaggctga ggagagggtt ttattgta 7318
<210> 4
<211> 27456
<212> DNA
<213> Cricetulus griseus
<220>
<223> Main cluster coding area
<220>
<221> misc_feature
<222> 25795..26498
<223> /note="n = unknown"
<400> 4
tgctgtgcag gctggtcccc atggtgaccc tggcagagta ctgggggtcc cattctgcta 60
gctctcagat ttcagtgggg tcaccatcct catctccctc gtgccgcctg gtgaggggct 120
tcacactggt gcttgtgggg tggtgtttct ggctgcagct ctggccctgg ggagcagggt 180
gtgccgctga ctcaccacct gggcatctgg gcctggaacc atgggtgagt cacccagcac 240
tgggggagca gagagaggct gcttgaagtc tggagaggga agagaactgg gcccacagga 300
agggtggtgc ctactgggga tgggataaag agcagaaggg ggcagtgtgg agtctgaagt 360
cttgaggtca gctcttccct gaggcccagt tgaaggacac agtgtttgtt tttctccatg 420
aagaagacac tggggacagg tgagggcctg agggatagcc atggttgggt tcaggctcct 480
gttttcagct cggggttggg gagccattcc cacccactca cctttctgtg aaagaaagaa 540
gacgaggttc atgtctcctt ttcttcctct tttgcattct atacagactg ctgctcactg 600
cgtctgtgcc tggtgcggaa caattgccgt tgctcatttt gcagtagttt taagcacacc 660
cactcacttt gctaccctct ttaagaggga ttctggtgcc ggacattcaa aacaaaataa 720
acaccaaaag atttcttaga cctcctgaca tcgtcctcta gatgcctcca gctgctcttt 780
tggacccggc tttctaaggg tggcctggac tgattctctc catctctttc tgtctctctc 840
actcacacgc acatgcaccc atgagcacag gctgtgaagt ttcctcccac cctgtgtccc 900
tgcaccctct gacacaggac ggagctgtga ctcacaggca tactatgaga accaggcttg 960
gaatgattct ctaggcccca gaaaaaaagc tgtcccccca cccccacccc cagtccctga 1020
ctaggctccc ctttcccaca atgcctctgt ctccttgctg aggcctgggt gagctcaggg 1080
atgcccttgg ctgggcctgg aggatcctcc agttggtgct gaggccagta ctgtctgaga 1140
gggagtggac aagagggagt gagcccagta gaaggatgtc agattttatc aagatcaggt 1200
tgggacaggt tctgtttccc aaaaatgaca aactggaggc cagtctggca tataattccc 1260
tgcccttgga gtcttggcta ctttgctccc tcctgggcat ctctgcaacc tggttgtgag 1320
tgtctctgtc ctacagagga cctgggtttc gatctttgtt ccgatatctt gatccttgtc 1380
catgtagttt tctctgcctt ccaagtggga tctcccattt gaaggactct ctgtgaagtt 1440
ttgaatggga gggccttacc cagattcctc tgccagggct tagtggttaa tctgtggtct 1500
gttctcctat ctctgggaga ggtctctgtg tttctcactt tagatatgtc catctacagc 1560
cccatttttg gggtttaggc ctaggactag gtcatggtta tgtaaggagg gcttttataa 1620
gaatccctag tttgagccag atgcaactgc aaaggagtgt atttgtaatc ccgcactcag 1680
gagactgagg taggaaagtc atgaagtcaa ggtctgactg ggctgcacag caagatgttg 1740
tcacaaaaac aatcaacact aagtttgttt tgcttttgct tttgcaaagt cctggattct 1800
gttaggacta agaagccaaa gatagacttt cagtgcttag ccctgactgg ttcctgggcc 1860
ctgtgtggtg gcagagcctt gcccaaggct gcttccggtg cttttcaaag tgggtgaggg 1920
tggggctggc agggcagggc aggcctggca gggaacaccc aaggctcctc tggccttacc 1980
ctggaaccca cccaatattt ttagaggaat ttggaaaaag tgacttctga actctgacct 2040
catctcttca gcatctagcc tgatcccaag atactagcca tttacatttt ttagttctaa 2100
ccccaacaga atccttcctg atggggaggg tgttcagtct cctccatcct gccatctgtc 2160
tgcaaagagc ctgcctgtca cccagaggga gtccctggtc taaaggagga agcattcctg 2220
cctaagggag cttcccttta gatggcagag actctgattt tagtagatta gagtttgggc 2280
aaaggttctg cctcttcagg gagcctcata cttctggact gttcccatgg ctactgccaa 2340
gctctacatt cctggcacag ataggagtca aattgagact ctagtcatcc tgcaacctcc 2400
tcctgtcccc tctctgcctc ctaaagacac tcaagtaggg aggcctaccc tcagaagtgt 2460
gtccttagga cacaaggttc tgctttatgt gactcccaga ccacaggaga ggtttaacat 2520
ctgattacag tgtgaagcag cagtgtggac ccgaatcctt ggggaggcac agttccaggg 2580
caggatgcag gcactgactt gccattccta gaggggctta gtggagcaga agcaggcctt 2640
gtagactggc cttgtagact gttcttttgt gtctcaagat ccaagatgtc cagtcccctg 2700
gaagaggcca tggatgtgac ggtctccacc ttccacaagt actccagtca agagggtgac 2760
aagttcaaac tcagcaaggg aaagatgaag gaacttttga ataaggaact gcctagtgtt 2820
gtaggggtaa gtgaggcagg cccaaaggga agagtcccgg agagtggggg tgggggcagg 2880
acacaggaca caggacacag agtaaatctt ttccagcttt cattctcaag gtgccagtgc 2940
cagggtgggg ctcaggatct ctctatcagc tttcatttca cctgttcttg gggtggctgt 3000
taggtctaca tgtgaatggg cttattgatg gctgttgcct tctgtattcc tgagcacatt 3060
gctgttgggg acttcagagt ccatcagtct aatcctgtta tttgctagtt gaacagtcac 3120
aaactcacag aagggtagca gctggcccag ggtcacagga ggacataact agggcattaa 3180
tttctccttt tattttacac atgtatatgg caagccaaga aagtgttcag agagaatgaa 3240
ttctagctaa gacatgcacc ctgggacttt tgcaaatgag atacagctag ctctcatttg 3300
cttcctgccc tagagtcagg tctcaggccg taatatatga agcaggtttt tttttttttt 3360
gcttcatttg gggttagctc tctcattgtt gtggctggat taaaaagttt gtcttttctg 3420
aattcatcct gctgatgcag ggggcagaaa gctttgattt ttctcatcgt caggatgaag 3480
ctgggctcta gtggaggttg gagttacagt ctgaggaaca cccagcatcc ttcactccag 3540
caggagtgct ggagactctt atatcacaca tctgtctgtc tgtcctcact ggccttcttg 3600
gtacctcact ggggtcgaac ctgactgtcc agtgaggaga ggacactgga ggctgctgta 3660
aaggggaggt tttggtggtg ggtagggcag ggaccagctt ggtgatagct cccctgcctg 3720
tcatcttcag gagaaggagg atgaggaggg gctagagaag ctgatgggcg accttgatga 3780
gaacagtgac tggcactgtt tctggcactc attgctatga tgtgcaatga cttcttcctg 3840
gggtccccag cctggccctg gagtagagag ctccactctc tgtcacatgt cttcttggct 3900
aacggggctc tctatctttc tgaatcttgt actaaataaa cttttgtttg tttgttcatt 3960
tgtggatgat attgcaatgg ctagcgatgc tttgtgcttc tgctagatca gtcaaagggc 4020
tggaaacaga aattgctatg atttccaaaa ccttctgctc tccaactctc ctgaggccaa 4080
aggctctgct cttttggatt tcacataaac atcaagaaag tgggcttctc tctttttatt 4140
accatgaaca aaggccattt gccccagagg tcctgcctgg ccttgtctcc cagccctaca 4200
tatgtagaga ggtcagagca ctgagagcaa gtggctgtcc catggtttgt cactgggctc 4260
catcctcctc ttcagagctc tgtctgctct actctgcaag tggcccacac acatcagagt 4320
ttcccaggga aaagagaaaa cagtcagaaa agcactgcct ttacttgtgt ttttatggtt 4380
attatccatc tcctctttta ttaaaaaaac aacagctttt ttccccttct cttaagatgt 4440
caacatcccc agctagaagt agccatatta ctttgctaag ccccaaaaga tgtaggtgaa 4500
gccctgcaca gagaggtcat ttctgccata ttaacaaggc aaaggctctt gaggacaaag 4560
tttttcagct ctcatcatca ctctgtcttc cacctagagc atggacaatg agacttggag 4620
gtatagcagc cgtgttgtga tcaggaatca acaaacacgg tatagcggaa cgtgtgttgt 4680
aggtttaaag aacaaaacaa tgaaaggaca ctagatttca catgtgtccc tgggccctct 4740
acccaacccc aactacctac agcagactta ttatgtaaaa tgattaaaga cactgtcagc 4800
caagttttct acaatttacc gctgaaaata aaactccaaa ttagtaaaga atttgacatt 4860
gtggatatat atttgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgatgag ggtgttgtgt 4920
atgctgtggt gtacatgtga agattagatg acaactcctt tatgtgggtt cctcctgaat 4980
ctgatttgtg caaatctcaa tgatttgtgc aatgaataaa ctacagcaga agtgatacag 5040
ctccctaagg tatgtcagaa gctaagggcc atgctctgag aagcccacac tatgtgagga 5100
gacaagttgg acctttcttc cctgggactg tcctccgtgt gtgagccact tggagagtag 5160
atcacacaga gttctgaaga ggaggcaggg gcccggtgag aggccttgtg acagcaactt 5220
agtctcagtg ccctgtcctc cctacacatc tagggctggg agacaaggcc aggcaggccc 5280
tctgggacaa atggtttctt tccatggtaa taaaaagaga gaagcccacc ttcttgacac 5340
ctgttggaga gggatcggta agtatgagag tcatgatgcc agtaattagc atcctggggc 5400
agttctcaaa gctcctgtga gcacactgtc atttcagccc catggtaagt ccaaaggggc 5460
tatcattaaa gcttttttac agatgggaaa gcagagaggg gcagcttcag ccatttgtgg 5520
agtgctgctt ctgactaggt acttggccta ctcatgcagc agccatttaa tcctcaccat 5580
acctgtggat gaaacagagg ctgcaagaca ttaaggacta gtgtctggac ttgacctaaa 5640
tctataagaa aactcctcat ccctgtggga cactgggctg gcagactggg cctctttcta 5700
ctttctgaag ctatctccag aactttgggc tttgtgtgac ctggagggga cctggctgaa 5760
tatggttcag atgtacccgg tacattaacc cggagtcaca gggagatggg acctccttgc 5820
aggtggtttg ctctgtgaac tctaattttt cttttagtgt tgcatgggtg caggctcctc 5880
ggttttggat ttggacagtc agttgggcta gcaagaccag acttaccttg ctgcctccaa 5940
ggtttcacac acttggagag gttccaaagt ggctaaacat tccttttggt atttgacaaa 6000
ctgacatcag actgttgaat ccagactaac aagcctctct cttccttgtg ctgaggcaga 6060
ggagggtctg gacatcactc tgcttgtcag ggatctgtgg ccagatctcc cccactcctc 6120
ctggaattgt gctgggatga gaaatgtagc aagctcacct cctgttatac caccatttta 6180
ttgtgtggct caaccacaga aaggtctcta atgctctgtg gaaaggaaga ttgaaggcca 6240
aggtgagtta attgccacat ccaagctgat tgcttgctca gccactcaga ctggagccca 6300
gggaacaaga caagtaaaaa gtaaaaagat ctagtccaga aaaacagaag gatggtcgga 6360
tagacatcac cttaatccag cagtcaaggc ccttctatcg ttaaacaaga gggaaagatg 6420
ttcgccatag ataggggtgg ctcccgattc cctgtaccct cctcgtgatc tggagtagga 6480
cattgtgcag tcacaaggca gtgatgtgtc tgtgaatctt gaaaacatct tagttactct 6540
tatcttggtg tctttagtct tggaccggga ggaaagaggt tagggtaagt tgctcttgtc 6600
ctgggagtcc aggcaaatat tcaccaaatg actaatgtgt ctatgtgcat agttcagcag 6660
aatctgaccc aaaggttaag gcagcacagg agacaagcac aaatagtgga agcccctggc 6720
attttcaccc ttatttattt atttatttga gacaagacat tgctatgaaa cctaggttgt 6780
gctcaaactt tcagcgatca tcctgcctta gccttcccag ttctaagagt agagcatgca 6840
gtgccaacct tgattgtatc ttgtggtagt catccattag acactcccga ggaccagagg 6900
ggcagtgtgt acagtgaagt ggcttcccta ggtgactttt gttttgtttt tttgagacag 6960
ggtttctctg tgtagccctg actgtcctgg aacttgttct gtagatcagg ctggcctcaa 7020
actcacaggg atccgcctgc ctctgcctcc tgagtgctgg gattaaaggt atatgtcact 7080
ggtgcccagc acctaggtga ctttgtagtt aattaaatcc gtgtgtcttt tacatcatga 7140
atcttgatcc cattcattcc ctgtcccttc acatcagccc tctgccccta cacgcccctt 7200
gaaataaaac aaaatttaag agaaaaaaga aaaaaattaa gggaaaaatt taaaatatct 7260
cattatggaa gctgcagtgt gacccagtga gccacacagt aaacacatat agctttactt 7320
gcaagtgttc attgcagagt cattggtctg gttcaaggcc tctgatttct actacactgt 7380
caacactggg ccccactagc gctcttcttc catgccctgt tgtcgccctg tgttgtggag 7440
gtcctgcagc attgggtctg tgggtctggt cccttcgtgt gctccagcag atcacagggc 7500
agaccaaatc ataaccctgg gtctgggcct gagcaactgt gtagttggtc cgctagatga 7560
gaactaggga aagctctccc atgtttacaa ctttagggct ggctcgtcca cacctgggct 7620
aacagggttg gttctctgct cttataccac agggggcagc tctccctcct gtccctggca 7680
ttgaagggca ggggtggagg gtggggggga gggtaatagg gacagttctc ccatgcttac 7740
aattctaggg ctggctcacc tatgcctgtg ccaggtgtga tgggccaggt gtgtggtggg 7800
ggctaggtga cttttataat tttaagccag aaatgtcagt tgaattagga gacttgctta 7860
gctcatcgcc tccaaagcta ctgattttca aagtcaacta agagcaagca aagcttgaat 7920
ttttagatgg ctccaccctt aagaacaccc acataccacc gagttatggg ttctgggaca 7980
atgggatgaa ctggtaccct actccacagc tcccacgtgg gtcacttgat tgctctacca 8040
actcgctgtt ctcatctgtg cagtggacac aaccagccac tggcttgatt ttcagagcaa 8100
gcagtagatc taatctctgc aggctcttct tggtcctagc ttagattctc ttcccttttt 8160
ctagctccaa ttctgtagct tcagctccgg ttccaaattc ctccctggcc ccagtgctgg 8220
tcccggtaat cagatactcc tttccatatg ttctccatcc ttggcccaga agatcagaaa 8280
ggaggttgat tgtttcagtc aagttaactt aacctcatgg ggccattaga tttgggtggt 8340
cactttggct ttagggctcg ggcccctttg ccagaaataa attgagtgtc cagattcttg 8400
ggacactcta tcttattttt ccctgaggtg caggatcaga cactgccctt tagaggggtg 8460
atgtgttttc cagggatctt aggcgatggt ggtgatagtg aggagccaga ggggagccaa 8520
gggagagtca gggtttcggc ttgtaagaag tcctgccaga tcggctagca tctgctttcg 8580
cctttgcaca ctctcttgct gatcttttga ggtgatgctc ctagccgcat ttctcagcgg 8640
tcagctcacc tgtcctcggg gagctatgca aggtgagggc tcagcctaag ggtggagatg 8700
gagcatgtgt gtgggagaga gtgggaagga aggaggatga ctctagtcca ggccctggaa 8760
ctggtgtcca cttctgcgca ttggggtcac ccgcaagaaa gggcttctgg gtagatgctg 8820
gaaaacttcc aggatgacag gaagatacca ggtactttaa gaaggttttt tgggaacaag 8880
ggaagagaat ttagagtcct gacctccatc tttgtggagg cagaagctga gaaagatgac 8940
ccggtgagga aggtctggtt ccactgttcc catgtaggga attcagtgtg ttctgttgag 9000
ttagacttgg gggccagagc cctcacattg cctcagtaac aactagtaac aaaaagtact 9060
ttgaaaaaaa tttttgagac aagatctcac tatgtacttc tgactggctt gaaacttgct 9120
atgtagacta ggctgggctt gaactcacca agatcaactt gtccctgcca ttcaagtgct 9180
gggatgaaag acctgctcta tcatacaagg caatactttg gattcttagg gtaagaatct 9240
tccaaaccct cttcagagat aaggaaatta tatttctaac aaggaaattc aatctctaac 9300
aaatcttcaa acatgttgaa gtcaggtggt gagcagggat ggaattttga gtgaaggcca 9360
attaagtgtt ctttccatgt gcattaagtg ttttttccat gtgcatcctc caaccccaca 9420
tctctaccaa gacaagtctc ttagcctctc ccagctttct ccccatggac aaagatgcag 9480
tgttcctagg agctgtggct gtgcccagga gcaggaaggg ctgttggata agaaagtggg 9540
ctcaggagct aggctatgga actctccagc ttattaaaca ttagtttgtt attgtctgtt 9600
tctcccacta gattgtcatt tcccttgaga gggtctgcgt ctgttttgtt tatgctatac 9660
cccggatgcc tagtatcagt gcctctaatt acttgtatga atagtgaata tcgagtctgc 9720
cactcactag ttacatgacc ctgggtaagt cactacctcc ctgggttagc atttaccaag 9780
tccttactat attttagcaa catttgttcc atgagcctgg cttgtgataa actccacaat 9840
aaccctatga gatggctact acttttattt ccatcaatca ggaaaatcag gtcccaagag 9900
tggagatgac ttgcttaagg tgactggtgg ctggtgggaa taagtcattg acctagaagc 9960
aaattaattg ctggtcatct ctggtacctc cttttgctgc tgtgtgacca tctctgtcct 10020
gtgtcccaaa ctgctcataa ctccttgcca ataaaacagg gctaatcaca gctcttcctt 10080
ccttttgcct ccattgctca ctcccctcac ccacatggct ggcaacctcc aggaggagat 10140
ggtggcctgg gcaaagctgg gtgctgggtc cagggtgagg tcaagggctc tcagactgcc 10200
catacaggca tgagggtttt gtcactggcc aggaactcag gctgctcttc tccttctggt 10260
gctcttctgg gtgttttttc ccctttcttt tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 10320
tgtgtgtgtg tgtgtgtgtg tgtgtgtgca cactcatgtg acatggaagc ttaggggttg 10380
ggagtgaaca gagaggaggc agcaggagag gaggattttc acatctggtg aatggtggtc 10440
tgacctttgc cagctaagaa tggcagggaa tgctggacag aattaaaatg atctttttca 10500
aaacatcaaa gaataacaag gtattaagag aaagccagaa cagacatggt gtcacacacc 10560
tttgatccca acagaggcag aggcaggtgg atctctgtga atttgagtca gcctggtcta 10620
catagtgagc tctaggatag ccggggctat gtagagagac tctgtctcat aaaacaaaac 10680
aaaacaagcc ccttgtgtct agagagatgg ctcagaggtt aggagtactt gctgtttttt 10740
gccgaggact cagctttggt tcccagcacc cacatcgtgg ctcacaaccc cctattactc 10800
tagttttagg gcatccaaca ccctcttctg accttcctgg gagaaggcat gtgtaggcac 10860
tcattcacac atgtaaaata aaaataaatg catctaaaaa aacagtttca gaagaagaaa 10920
ggaagaaatg aggaaagtaa aagaaagaaa gaagaaaaga aagaaagaaa gaaaggaaga 10980
aagagagact ctaccagaat ctctggagag attgtttagc tgttaaagcg tgtactgctt 11040
ttgcagagga ccagagtttg gctcctagca cccacattag gtgactcaca accacctgta 11100
accccatctc catgggggac tcaacgtctg tgacctctgt gggtgcctgc actaatgtgc 11160
acatcactga tgcacataca caaaagtaaa aataagtaaa aacaacaaaa aacaaaacaa 11220
acacctcata aaaaaactta ggtgatggca aaatctggga agttgagtag ggaacctgag 11280
ggctcttggc aagcctaaac ttgaatttgg gtttgatgat ctggggagtg aggaagacaa 11340
agttggagcc cagggctcac acaggagggg acaaaagtag acagacgatg ccgaaccccc 11400
atggggcaac tctcttaagc taaaaggcaa atgaatgctc taccccctgg actgcttgga 11460
aagttgacct agtgctaagc agagcagcag gctatgaaac cagtttcctc aggagctggg 11520
gacatgccag ctctcacctg aatctgtggc ccaaattcat ccacatcact gggagtagag 11580
aggcaagaaa gttcaagccc tgacagctgg aggctcccca ggaggaactc ccttcctcta 11640
ggtctcgaaa atacctcacc acgatttcct ccagtgaaat aagcaattca cagccaaagg 11700
ccaccaaaca ctctgtgatc tggaggctgg gcacagaggg tgtcctatgg cctcagactt 11760
ctcacctgta aataggggcc ttagccaggt gttcccaagg tctgccctgt acagggactc 11820
tggaggtaca acttaagaga atccaaggta tgttcccatt ttgtattctg ggtatcttta 11880
tgacaaagag ctcaggagag ggatgtatgt ggctggaagt ggctaccaga aagctgttgc 11940
ctgttctccg ctttagggaa gggcagtggg aatgagttgg gagtggtgtc tgagactcag 12000
actgggtctt tgatctgtgc gttgctaggt gggtggtggg cctgtaatag aagctactga 12060
gggaagaagg caggggaccc tgggggcagc ctcagtgttg acctacttgg gtccttataa 12120
ttgctccctt catctcttga gaggctacaa atagggacac ccagttgtta ggctcctaca 12180
gctgagacac cagcagcagt ggtgagtgtg gctgtttggg aacagctttg ggctaggtgt 12240
tggggcagct caggtaccta tccacagcta gcctgctcct ggatacaggg cccgggtatg 12300
gaagcagaaa ggttaagtta ggaggtgatg ggtgaggaaa atcagatgtg gtgaactcag 12360
aggttccctt gaacactaag ggtctgtagg agtttggcct ggggagtgtg cccaggcaaa 12420
atgcccactg atgtggggac agtggcctag ctatggttct gatgcagacc ttaagtgagc 12480
tccttgtctc tttgcttcat tcttggggat gagttgggac aggccagggc ttctgaaata 12540
gcaacagaag tggtgccatg caggctggga ggtgctcaga agggctctga ggtgctgagc 12600
tcttgggatc atggcccttc cctctattcg gatatggatc cttgttccgg cctgggctgt 12660
catgaagaag tagaccccag caatgcttgc cacttctgcc catccccata cttccttgct 12720
gcccatttgc tcccagcaga ggaaactcac caagtcttgg ctctggctgc cctgtgctgc 12780
aggactccag tccctgaggg agtgaagagt gagtcattgg actcacatgg aaacaactct 12840
attgcctctc ggcctgccca gggtttgccc aggctggatg ggcaatggaa gggaacaaca 12900
gaaagggggc gagggaaggg attctaggaa gtgcttccct cccatcagag tgggggactt 12960
ttctcaaagc cttctttctg tgttaagact acccccaccc cctcagttcc aggggaaggg 13020
aggatggctg taagattggg caggtcataa acgagtagat ctgtgagctg atgaacttct 13080
cagagaccgt ctggtccaca tttctgacta ggcctgtgag gccgcattaa cccactttac 13140
agaaaagaca attgagaccc agagagaaac agttcaccca gggctgcaga gtgagcaaga 13200
ggatgagggt ccccaactgc agggaagaag gccaagtgag gtggcagggg atcccctcaa 13260
gctaccatcc ctactgacat tagcctcgct agggcaaagc agcactgggc agggcttcct 13320
gagcaaggct tacaggatgg agcttcaggt gcccatgggg cagaggtatt taggaccagg 13380
gactgcatcg tgcccaatgg ggagacagag ttcccaggag ttggggtgag aaaggacttg 13440
agggaatcag agctcagtga gggtgaaggt gacagagtgt gatattctgt tcctgaggaa 13500
tttatggaaa tgttggggaa atgaaacgtc tgtccagaaa aatcacaaca ggcacaatgg 13560
ggaggtgaat cagtgtgggt atgtgtggta tgtgtgtatg tggtgtgtgt gtgtatgggt 13620
gtgtgtgtgt gtgtgagtgt gtgtatgtgc ggtgtgtgtg tatgtggtgt gtgtgtgtgt 13680
gtgagtatga atgtgtgtat aagtcatgtg tgtgttgagt gtgtgtatgt gtggtatgtg 13740
tgtatgtggt gggtttgtat gtgtgtatgt gtttgagtgt gtgatgtgtg tatgtgtggt 13800
gtgtgtgtat gtgtgtgagt atatgtgtgt gtgtgagtgt gtgtatatgt gatgtatgtg 13860
tgagtgtgta tgtgtggtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtaa 13920
gcagttgtca aggagggttg ctcagaggaa gggaaacttc agcatggtgg aagttgacag 13980
gtttggaatt agctcctggg aaacactgac ttggctttcc ttgtgagtca catccctttt 14040
ttgtgacagt gaggatgacc cggcccctgg agcaggcagt agctgccatc gtgtgcacct 14100
tccaggagta tgctgggcgc tgtggggaca agtacaagat ctgtcagtcg gagctcaagg 14160
agctgctgca gaaggagctg cccacttgga ccccggtgag caccttcata ccccttcccc 14220
ctagtggaag gtaccacttg gactctgcaa agaatggcct gggaccaaac accagcatag 14280
ggcagcaaga gggagaggct ggactgtgga gaggggacac gaggaagtga gctgacatgg 14340
ctgcatgagc ctcagcaaaa tggaatgtaa agtagggtga cagggccaga tgttggtggc 14400
gcacgccttt aatcccagca ctcagaagac agaggcaggg ggatatctgt gcgtttgagg 14460
ccagcctggt ctatagagca agttccagga caggctccaa aacaatccag agaaaccctg 14520
tctcgaaaaa ccaaaaaaac tgaaaaacca aaaaaccaaa aagaaacaaa acaaaaccaa 14580
aaaacaaaaa aggagggtga cagtcactct tactgtcctg tggataatac ctatctcata 14640
gcaaactctc catggcaagg agtcggtgct cagcaagtga gccgagaagc agggctggga 14700
gatgggtgtc ttatcaggat gggtaggatg aggttggccc ccaggagggt gtggttggga 14760
atggggcagg cccaccctcg gaggggagtg gcgtggaaag ctgcttaggc tcctcatccc 14820
aggtttcctg accttccctt ctcatccctt ccacagagtg agttccggga gtgtgactac 14880
aataaattca tgagtgttct ggataccaac aaggactgcg aggtggactt tggggagtac 14940
gtgcgcgcgc ttgccagcct ctgtctctac tgccacgagt acttcaaaga ctgcccccct 15000
gagccccctt gcccccagta gcctctgatc cagaagggta tgccattctg gaaggtcagg 15060
gtctgctcta gtgctccgtc tttgtccctg aggtgatcct gagtgtgtag ccacaccctt 15120
cctaccctct ctgtggtatc ctttcagtcg gggcttgcca ggtccctgat gtgctaaccc 15180
tggctactca tgcacagtag aagctttcct agggatgtca aagtagtgag gggtggaaca 15240
gtagcttctc ttcttggaag ggagaacatt tgctctctca ctttggaggc tcagccatgt 15300
gcacactgtg gcaggggcct gctcaactcc taataaagaa atgtcagctt ggcttggttt 15360
ggttcttctg atgggacaca ctggattttg ggactgagtc cttgggagtc tttacccctc 15420
tatgttccat atcgctggag gaaggcagct gaaggcaggg gccctaaagg cagttccaga 15480
ccccatagga atgcataagt ctcagtattc agtaggaagg tggggccatt acaagtcccc 15540
atcaggtgag gctgggggtc tttgtctcca tctctctgtc ccctgtcttg aggtggaagc 15600
ccttgttttg ggctttctag gagggcaaga ggctccttgg gagaaactca gtacttgtga 15660
ttagagcatc gaggtatgtg ggtatgggtg tggcatagct gtgggaaacc agagagcagt 15720
agcaatagga ttggggcctc tgaggtattt gctgccagcc agggagggag cctctgtatt 15780
tactgcaagg ggaaagggat actttgagtc agtcctcatc tctgaaacca cagcccctga 15840
gggtcccaag ttcccatttc tgaccattgc tcaatccccg tatttgtacc ccatccttag 15900
agattaatcc tgactcccca ttttacctgt ttctcctgta actctcttct ccaagctgag 15960
tgttcaaacc tgaatgctcc catcagcccc aataccctcc ctggaccttc tacccattca 16020
tgaacctcga ggcctcatta ctgccctaac tccatcacgc cctcttaggc gtttcccact 16080
taatacctag ggtggtacca aggcccctcc cgacttgcca gtcttcactc tgggtcttac 16140
tgagcgtgac agagagctgt ttaggctgga gagaagggct gactgtccca ctggccgggg 16200
tcacctcccc aattcctggg ccatacattt ccatattccc ctcttgccca tcacctcccc 16260
atcttctttc ctgtggccca catcccatgc ccatgttgcc ccttctcaaa gcttccttaa 16320
aagttggctg agctgtggct actgggtggt atccacacca ttcaggtctc tcgtgtccac 16380
tggggcttac tcaatgctcg cctgtgcctg ctgggtagta ggaagcttgg ttctcaggtt 16440
gggctggtgg aggggcctgt gacatttact acatcagcca acagtaggaa catagtatcc 16500
aagctccccc catcccctgc atgggcaggg cccagcagag tataaatagg gcagacattt 16560
gagctttccc caaacctctc tgttcagcac ttcctctctc tgggtctggt gagttgtgtt 16620
ggcttcatag cagtattagt ggtgtcagag gctgaggctg ggacaggaga aagggaggct 16680
tctggggaga cagatgtttt tactagatcc agatgagaga ttctgatgtg gaggctttgt 16740
gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtctgtgtgt 16800
ctgtgtgtct gtgtgtgtct gtgtgtgttg cacaagaatg aaaacagcaa caaaaaggtg 16860
tatagatgcc atttgagctc tcaagatttc taagatgctg aggcttacac gtgttgttgc 16920
tacagtgtac atctgtgttt gggagccatg gataggtacc ctgatgggtg tttgctgggt 16980
cattcaagcc agtgtgtgcg ggaaagcagg tgcaggaagc aaagtgaggg aacatgtagg 17040
ctttcttctt aacgtttaaa cttcagttat ttatttgtgt gcatgcatgc gtgggttggg 17100
gatggggggc tcatgccaag gtgcacttgt ggaggtaaga gggcaacttg tgggagggag 17160
tcagtctgct ccttctacca tgggctctgg ggatcaaact caggccatca agcttagtgg 17220
caggcacctc tacttacagg ctaccactcc agcactcacc tgtagacttc tgtgttcata 17280
ttagtgcctt atggacatcc agcaccccag gtcaagagag cctggcttcc ccaccctccc 17340
cttgtgcccc tacctctgcc acctcatctc actcctcact aagctggtca ataggcagct 17400
gggttttttc cgctgtgggc ccatgggcag gcagccagca gccgcgccca atgctgggag 17460
ggggaagaac gggccagagc ctggtgcttg tggttgagct gagcaaggac ggaaaactgc 17520
tgttgttgag gccaggcccg aggacagtca gcccaaaagc tgctggcacg aatctccaga 17580
gattgtatgg taggctctgc atgtttcaga gcccaaagca tacacgacca tcttgccatt 17640
agtgggtccc actcctctga tctctctggg aatgaggaca gtctcctgaa gtgttcctag 17700
agggtaggtt ggaatggagc atttaaaatg ggggcagaat gagtctatga cttgggtgat 17760
gagcagtgcc acatagccag ttcttgatac actgttggtg tgggttgggt aaggctacct 17820
ttgtgtctcc tgcccctagc tctcaactgt caccatggaa taccccttag aagaggccct 17880
ggatatgatg gtgtctacct tccacaaata ctcaggcaaa gagggtgata agttcaagct 17940
caacaagtct gagctgaagg agctgctgac cagggagctg cctagctttt tgggggtgag 18000
tgggtcctgc ctgtgtattt catgtgtggt gcatccccag gaggaggttg ggactctggt 18060
aggtagtgcc tagctacagt tggcgtatat ctctaaggtg gggaaatgga ggttggagag 18120
cttgctccgg gtgcttggtg tggaaccaca gtgaaccatc tatccctcat tagccctcag 18180
ctgagagaag gcttagaatg aacacaaccg aagagacaga gaaaaagcaa aacaactgcc 18240
taacatagtc agtgtctgaa ctgcaggcta gatcaggact gttggcaaga gaaattgagt 18300
ttctgtttgt gaagacacga tggtggaggc acacaaacac ctgcagagtc tctcctcaat 18360
aacaccttgc attagttaat ttaatgcatc actgccatgg ctgctaccta atgagataat 18420
taaagcaaac aaggagaaga tgtggtcctc cccgttccca gctacctcaa gtgcccgcat 18480
ctagggcaca tcctcctcta catagcttag tcccaaggct tcctgagtgc ccagaggcac 18540
tcaggtgttc ctgaacacct ggctggaggc agagatctag cttgggtctg gcttctaact 18600
gttcttcttc tactcccaga aaaagagaga tgaagcagga ttccagaagc tgatgagcaa 18660
cctggacagc aacagggata acgaagtaga cttccaggag tactgcgtct tcctgtcctg 18720
cattgccatg atgtgcaatg aattctttga aggctgccca gataaacagc cccggaagaa 18780
gtgaagactc tgcagatgaa gtgtgggggc gtggtcttcg ggaggagggg gctcttccct 18840
tttggctctg agcatagtgc cttactctgg cttcttcata catatgcaca atgctgagcg 18900
agttcaataa agagtcttga aactatgtgc tgttgcctaa gagactggag attgtgggtt 18960
gggtgttgag ggagggtata tcacagggta gtggtgggga ctgcggggag ttgagctggg 19020
agttgagcct tgagggaaca aaactagaaa gggttgggta ggggttgagt ggctgattta 19080
actagcatgc aagtgtgtgt gtgtgtgtgt gtgtgtgtgt gcgcgcacat acgtgcaaca 19140
aagaaaactt tgggaatact taaggcagaa gccaccagag gcttggcttg aaaggctcca 19200
gatgtgggaa gttagccagt ccaccaccct cctttctctc tccagatctg cctctgggct 19260
caaactgaag ttgggatggg attgaaggtc acatctgttg ctggttggag tctggaggga 19320
agacaacggg cctgagtcac aaggaaggag tccagaagga tggggaggtg gactggcacc 19380
catccctgac atttatagtc caggtcctgc cctgctaccc attctagctc actagctcca 19440
aacagtggat taatcctttc ctgtccatgg ctggatgaag aagggcagta tagagagatc 19500
atttgtgaga acataaatct ctctctctct ctctctctct ctctctctct ctctctctct 19560
ctcagagaag acgtctcact cttgtagcca aagctagctt tgaacttctg atcctcctag 19620
ccagcttccc aagttctggg attacagacg tatgctacca tggctgactg aaatagccat 19680
tctcttaaca tactgtcccc atactcagag ggctctggga caggatctac tatttcttag 19740
aatcatgttg cttagaggag gacaagggac ctcaggaaaa taggtggggg tgggtaatgg 19800
cagtgaagca gatgatgggg agatgaccat agttttagac agagttttgg ccatatgatc 19860
tgacaaagaa aatcgagatc cccatatcct cactctctca cccctagaac atgaggcaaa 19920
tgttgcttct ccttagggta ggcttacggt cagtggttcc agagtgccaa gaatgggact 19980
gagattagat gtaaagccct tgcctctgtg atacagggat gcttaaggaa aggtacccac 20040
aagctgtctc aaggcaggtg agtttgctct ccaagcttcc cttctcatca tatctgcttt 20100
tcgctccagc ctcaggggag tggggtaggt gactcagttg ttcccttgga gtttgactat 20160
agagacttag gtccaggcta agcaagccca tcttctcttt ttttgcactc ccagtcaatc 20220
tgcccatctt tcatgggagt gtgctccccg gagcctcctc ctgcatcact ctctactttc 20280
ggaaactcct gttgcttaga gacaagtctc tgctgtatca ctcgtgtaat agctgtggtg 20340
gagtgacaaa gggggcagtg gagaggaact aggcaggcta gggtggaact ttagccaaga 20400
ttaggggtta tgcccctaac caaattctgt tcttagagtc atcgtgttcc cagaatgcag 20460
gaaactcacc ttgagccctg tgccacccat gcgtgactgt acctgaaact ggagcctctt 20520
ccacagtctc aacctagtcc tgaacctttc tttgaccctc ttccccaacc ctgaattctt 20580
agtcctctaa cccaggggtc ggtctctgac aactacttcc catcttttgc tttgtgttag 20640
ctagtgactt cagatgactg tccttggcag gaaatatctt ccttcactga tcccatccca 20700
agaatgggtc cttgtgcact tggaagggat gccaggatgg agggtctcaa tgtggagagg 20760
tatggggaga tttaccctgt gtttggactt tctactgttt cttttctgga gagcccaact 20820
tgcctttttc aacctattac ttcaccggat gtgaggttta gtaggaaaac gtggttcctg 20880
gtattgaaag tgtgtctgtc atggtggact ccatgtgcta cctccagccc tgttggtaaa 20940
cagcaagtca aactttccag agagggttcc cttccacctt ttctggattc ctcatatctc 21000
ggatcccttc tcattggtcc cacccctcct gattctcctg ggctttgggg atgagggaat 21060
aaaagcagag agcattggta gggaggctgt ggctgcagcc tagattctcc tctgggttta 21120
cgtcttcctt ggtgagtcct tccttcggat gacctccttc atttctgctg ggccagcctg 21180
ggtgaggaag aatgtgacaa gacgtggaaa cctccacaaa gaaggcctga ccttgcaagt 21240
gggagcatgc ttagggagga gagggcagag tatttgtgat tgtgactaag gatttcctga 21300
gaagccaact ctaggagcaa gaaagctgag gcaggaggat catgagtttg agagtagtca 21360
taggatttat tgtgagatac tgtctcaggg agagagagaa gggaagagga gggaggaagt 21420
cggggggagc agagcctgct agcagaatca gcaagatgtt tctacagatg cttagagtcc 21480
ctttcttgcc ttgaactgtg gtccagctga gcctccatga ggtgggagaa gctgatggtg 21540
tgggtggcag gagatgaatg atgggctcag tccagctcaa gaacttcttg ggttggaggt 21600
aagagtcagc aatttctccc caccctccta cctagcccag ggttctccac cagatctaca 21660
gaaacctcca gttctgtggc cattgtttcc ttccccttta agaggaagtg gtttttaaac 21720
ccgaaccaca caagcttcag ctgtctgctc ttttggtggc gtgcctatgc tgacagaact 21780
gaagccatta ctcaaaccca acctctagag ccatatctca taagatcctg gccatgtcga 21840
tacccaccct tccccgcccc tgtcaggctg tgggtgaagt tctctgggca tcagactgga 21900
ggtcattagg caagtccagt cacctctctc ctgcttcctg ccgagatctt atctcccagt 21960
ttcagctcca accccctctg acccctggac tccttttttg ccccctcccc ctcagtgaga 22020
cactctttca tttccagtga ctcagaggct ggagaaagga aggtgactag gtgagaactg 22080
tggctggaaa gccagagcct aaacttcatg gggaagagaa aaatcctgcc ccctcatctg 22140
ttgtagcagt tctttgggag aggctgtcct ataccctctt tgttcctgga cctctctgtc 22200
agcacctctt gatcagggaa gcctgcagcc tcctttgggg gctggacatt ctcactgctt 22260
tggctgggcc agtatatttg tcatggctct cattacaacc tgtctgtata tacgggatat 22320
tctcattggt gggatttggc ctcactatgg gctcctggca atggcggttt ggaatggctg 22380
gtgaggagca ggcctagttt ctctagtgct cattgtctcc tctcccactc cagagttcac 22440
gtcgtgatgg agactcctct tgagaaggcc ttgaccacca tggtcaccac tttccataaa 22500
tattcaggga gagagggtag caagctgacc ctgagtagga aagaactgaa ggagttgatc 22560
acgacagaat tgagtcttgc agaggtaggt gactgttctc tcatatacca cactacacat 22620
tctgagtacc ccttctggga gatgcccacc tacttgcagg gaactctagc ctaggcaaag 22680
ggcaggatgg ctgaagggcc agaggcagag gaagtggtgg acatctctgg ctaccaaggc 22740
tctagacctc tgtgctgggg gatgaatccg tctcactgga aaggaggcaa ggctggggtg 22800
tgctactgcc tatgggaagc tatgggatca cataaaggag actttggtga tgggttgcat 22860
agcctatgtt agggatcttg agggtttggg ggatgtgggg taccgggttt ggctgtgtac 22920
aactcaagga tcaggattct tcttgattct tctctgtgcc tggcacagct aaggtgctaa 22980
gtgatactgt caagtaaact aacaggctaa tttatgaaca tggggtagga aggagacagc 23040
actgattcct attagatgga catgatggga gttgtggctg gctaacttga aggtctatga 23100
gatagagtaa ttgagcctta aatacatcag agaacttgtc ccttgaggct gagctgaaat 23160
tccaggctag tctctgcacc aacctcctat ctatctttac agtgaagttc caaattccac 23220
tgttccccca gggagagggt tccgggaaca tgtccatggg aaggggtgaa acaggtgcca 23280
ctgttctcag gtctctctgc ggcttcccca aggcatatgg agttcaccat gccttatata 23340
ttattctttc tttccttttt gagacaaagt ttctctgttg tagccttggt tgttctggaa 23400
cttgctctgt agttcctgac caggctggct tccaactcac agagatccac ctgcctccat 23460
ttcctgagtg ccactgtgcc tggcctggca tatacatatt caataccaga aaccactctg 23520
ccatcctgga actaatgaag gtagagggac ctttggtcca tcaggtgcta attactcagg 23580
gacagagccc caggggagga gtctagtctg gggaccagga tcatgttaca gagaggcagt 23640
ttccagcatc ctgggtatca acatcctgta tccaagggag acctggaact gaactgattt 23700
cgacagaggg agagcagggt ctacctgctt gtattttctt gctccaccct aaggctctgt 23760
cttcaacttc ctagaggagc cagggtacag ggaccaaact gagaggacat ctggtgccag 23820
gctggagctg agggcatgct ggcttctcag ctccagtgta ctgatcttac agagaagtat 23880
atagtgatgc ctgggtcctt ttccagcttg gccttacaat acggacaggt taagttggag 23940
acttggatga tgctcagggc tacagagcca ggactcaagc tgtttttagt agatatctgt 24000
ataaattgta gattataatt tctttggatg ggaagatgtc ccaggagcaa aggctaggct 24060
agccttcctc ttgtaattca tttaaaatca gcactcaggt catggacccc atttggtgtc 24120
aggtcccgtg taaaggtgtg ggttggggct gagctgctga gcagtctcct ccccctgggc 24180
ccttgcagaa gatgaaggag agcagcattg acaacttgat gaagagcctg gacaagaaca 24240
gcgaccagga gatcgacttc aaggagtact ctgtgttcct gaccacactg tgcatggcct 24300
acaatgactt cttcctagag gacaacaaat aagcacggtc ctctctaccc acacctgcag 24360
ctccttgtct ttccctctgc agcctcttaa actgctcctc ttacgcccct ggcccttctc 24420
tttctcatgg gtggattctt ccagtagaga aataaagccc tttccccctt tccatgtgtt 24480
ggttttgagg tggtttgtct ccgttggctg agtcagggga gaacagacag acattttgag 24540
ccattcagcc tcaggtcaca cacaggtggc ctgtgggtgc agggggtgga ctttcacccc 24600
actccactgt ccgtcctttg ttgtggacac tgttgaatgt gtcctggctt tgttctgcac 24660
tgtaaaacaa caaagctggc ccaggcattt gcatgctttc ccaggcagta aagacacaga 24720
gaaaacaatg agaaaaagcg tgttgggagt gaggagacca gggtgattgc agtgatgccc 24780
agtgggtctc agttggggca cagcccacag gaggccactc tggcagccct agtaaaaagg 24840
aaagacacga acttagcacc cttccaactg agtgactcca ggaggctaat tccccctccc 24900
tcaacttcct cttctgaaga cttttcttca ggaggaaacg ttcaaaactt ttcacttaag 24960
atgataagta agcatgctgg ctgggctggg ctccattgtg tgcacattaa tttgtaagct 25020
gctctaaaga tgaacttcca ggcagtgagc tggaagaagc gagttagaca gaaatttatt 25080
gttggtgggg gatggtgtct gaaatccttt agactgtgtc cctccccctt ttttgagaca 25140
gggttttata tagcccaggt tggctcagaa ttctgcctcg tgggatcaac ctactgagct 25200
atatccccaa gtcttaaact agtgaggtca aaccacccta tcagaggggt tgcctaagat 25260
catcggaaaa cacaagtatt tacactgaga ttcataacag tagcaaaatt acggtgtgaa 25320
gcagcagtga aaataatttt atgattgggg gacaccacaa catgagaatc tgtgtccaag 25380
ggtcatagaa ttaggaaggt tgagaactat tagccaatct agtagaccac taggggcttc 25440
ccctccttcc ctggagctga ccttgccacc agagggcgac agcatcagtg aggttcccac 25500
tccccctcac attgatgctg actttaggga cacattgtgc tctgtctggc agatggccca 25560
gcacacatgc cggagtcacg agtcacgtgc cataagggca aactgaagta tggaaattag 25620
ggaaaactcg atgtctctgg tttgtgctgg tctcccagac cagggtcact aggctccctc 25680
atgccactcc caatccggga cagtcctggc agcagaggcg tggaaaactg agggggttgt 25740
tggggtgtgt tttgctagcc tcaggcgccg ggtggggctc ggggcggggc ggccnnnnnn 25800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25920
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25980
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26040
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26100
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26160
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnga gtctgctttt ctggggtgca 26520
ggagggttcg ccctgggtgt gtcattgtcg tcgcagtgtg tggtcctgtc aggaagtgcc 26580
ctggagcagc ctccatctct tcctctgctc agtcatattc cccagctctc ttggaatccc 26640
tggagatcag tgttcagaca ccccaaagcc gcttccgttc ttacatccct gaccctagtt 26700
gccctgggct gcctgcacct gtgttggcta aggctagctg gttcagacag gcagcactga 26760
ctagcccctc tctgtcaaac agcttcttct agcccagtgg tcaattatgg catgccccct 26820
ggatcaggcc atcggccttc ttgtggccat cttccacaag tactctggta aagagggtga 26880
caagcacacc ttgagcaaga aggagctgaa ggagctgatc cagaaggagc tcaccattgg 26940
ctctgtaagt agcccctgcc caggttcccc ctcccacctc tgtccatcgg agcgctttta 27000
ctggcattta ctcttagttc ctgatcttac ttcccttgga gcttgtatgc tcccagcctg 27060
ctgagggagg agcaggggct gagaagtaaa tcaaggtaaa tccaagctga aggcccatcc 27120
ttggtgacaa tgagcagaga cacttacatg aacaaggact tccagggaag gggtaaggaa 27180
tccagggcgc tggccaccac tgaacgtgga cgtctccttc taatgtatta gaaactgcag 27240
gatgctgaga ttgcaaggct gatggacgac ctggaccgca acaaggacca ggaagtaaac 27300
ttccaggagt atgtcgcctt cctgggggcc ttggctttga tctacaatga agctctcaaa 27360
taaaatggga aggtagagat gccctttgga ggcctatctc agccaaatcc agtggtgggt 27420
aattgtacaa taaatacttt gtttttgtta catcta 27456
<210> 5
<211> 41
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 7
<400> 5
tttgcttact gcccaggttc tgagggacca cctggggcta g 41
<210> 6
<211> 42
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 8
<400> 6
cagttccctc ttctgcaata ttctctagct ttagatgcag aa 42
<210> 7
<211> 42
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 9
<400> 7
agcaactgct gtcgctcaga gcttgggagg gggtggatgg ac 42
<210> 8
<211> 42
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 10
<400> 8
ccgcgcccaa tgctgggagg gggaagaacg ggccagagcc tg 42
<210> 9
<211> 43
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 11
<400> 9
ctgggctgcc tgcacctgtg ttggctaagg ctagctggtt cag 43
<210> 10
<211> 42
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 12
<400> 10
agcagcatct gtttccataa agtggtcagg ccccaggtgg gg 42
<210> 11
<211> 43
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 13
<400> 11
cacaaactga ccctatgaaa gtgttcagta attcagtgcc gag 43
<210> 12
<211> 42
<212> DNA
<213> Cricetulus griseus
<220>
<223> Targeted integration site ZFN 14
<400> 12
ggcttctact gctccagctg agcctgccct gcagtgggga gg 42
<210> 13
<211> 57
<212> DNA
<213> Cricetulus griseus
<220>
<223> landing pad_upstream
<400> 13
aacagcctta ttcaggtata attcacacgc cacaaactga ccctatgaaa gtgttca 57
<210> 14
<211> 58
<212> DNA
<213> Cricetulus griseus
<220>
<223> landing_pad downstream
<400> 14
tgaaagtgtt cagtaattca gtgccgagta tgatgtatca cacctgtgac cctggcac 58
Claims (17)
- a) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나;
b) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류인,
CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 중국 햄스터 난소(CHO) 세포. - 제1항에 있어서,
a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 CHO 세포. - 제1항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되는 CHO 세포.
- 제3항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자이고, 상기 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되며, 상기 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 CHO 세포.
- 제1항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터 대립형질 하나 또는 두 개에 안정적으로 통합되는 CHO 세포.
- a) CHO 세포를 제공하는 단계;
b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고,
i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]
를 포함하는, CHO 세포를 제조하기 위한 방법. - 제6항에 있어서,
a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 방법. - 제6항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되며, 상기 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 방법.
- 제6항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자이고, 상기 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되며, 상기 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 방법.
- 제6항에 있어서, 상기 이종 폴리뉴클레오티드는
a) 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제로 이루어진 군으로부터 선택되는 서열 특이적 DNA 편집 효소; 또는
b) 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제
가 사용되어 CHO 세포 게놈에 도입되는 방법. - 제1항 내지 제3항 중 어느 한 항에 의한 CHO 세포로서,
(a) 적어도 하나의 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하고/하거나;
(b) 상기 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)- 결핍 세포 또는 이들 세포 중 임의의 것의 유도체인 CHO 세포. - 제11항에 있어서,
a) 상기 RNA는 mRNA, miRNA 또는 shRNA이고/이거나;
b) 상기 적어도 하나의 이종 폴리뉴클레오티드는 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는 것인 CHO 세포. - 제6항 내지 제10항 중 어느 한 항에 있어서,
(a) 적어도 하나의 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하고/하거나;
(b) 상기 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)-결핍 세포 또는 이들 세포 중 임의의 것의 유도체인 방법. - 제6항에 있어서,
a) CHO 세포를 제공하는 단계;
aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고,
i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및
b) 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계
를 포함하는 방법. - a) 제1항 내지 제5항 중 어느 한 항에 의한 CHO 세포를 제공하는 단계;
b) 단계 a)의 CHO 세포를, 관심 단백질의 제조가 허용되는 조건하에 세포 배양 배지 중에서 배양하는 단계;
c) 관심 단백질을 수집하는 단계; 및
d) 선택적으로 관심 단백질을 정제하는 단계
를 포함하는, CHO 세포 내에서 관심 단백질을 제조하기 위한 방법. - 삭제
- 제 13 항에 있어서,
a) 상기 RNA는 mRNA, miRNA 또는 shRNA이고/이거나;
b) 상기 적어도 하나의 이종 폴리뉴클레오티드는 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는 것인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17185988 | 2017-08-11 | ||
EP17185988.7 | 2017-08-11 | ||
PCT/EP2018/071733 WO2019030373A1 (en) | 2017-08-11 | 2018-08-10 | INTEGRATION SITES IN CHO CELLS |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200038462A KR20200038462A (ko) | 2020-04-13 |
KR102531749B1 true KR102531749B1 (ko) | 2023-05-10 |
Family
ID=59686752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207003299A KR102531749B1 (ko) | 2017-08-11 | 2018-08-10 | Cho 세포 내 통합 부위 |
Country Status (9)
Country | Link |
---|---|
US (2) | US11560549B2 (ko) |
EP (1) | EP3665291B1 (ko) |
JP (1) | JP7087061B2 (ko) |
KR (1) | KR102531749B1 (ko) |
CN (1) | CN110997925A (ko) |
AU (1) | AU2018315428A1 (ko) |
CA (1) | CA3068779A1 (ko) |
SG (1) | SG11202000966XA (ko) |
WO (1) | WO2019030373A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3134705A1 (en) * | 2019-04-02 | 2020-10-08 | Chugai Seiyaku Kabushiki Kaisha | Method of introducing target-specific foreign gene |
CN114026241A (zh) * | 2019-04-18 | 2022-02-08 | 西格马-奥尔德里奇有限责任公司 | 稳定的靶向整合 |
EP3901266A1 (en) * | 2020-04-22 | 2021-10-27 | LEK Pharmaceuticals d.d. | Super-enhancers for recombinant gene expression in cho cells |
BR112023023386A2 (pt) * | 2021-05-10 | 2024-01-23 | Nikhil Goel | Células engenheiradas para produção aumentada de proteínas de difícil expressão |
CN113355360A (zh) * | 2021-05-28 | 2021-09-07 | 上海碧博生物医药科技有限公司 | 一种gs基因敲除cho-k1细胞株的构建方法及悬浮细胞单克隆化 |
CN114085841B (zh) * | 2021-11-23 | 2022-07-15 | 江南大学 | 一种cho细胞基因nw_003614092.1内稳定表达蛋白质的位点及其应用 |
CN114058625B (zh) * | 2021-11-25 | 2022-07-15 | 江南大学 | 一种cho细胞基因nw_003613781.1内稳定表达蛋白质的位点及其应用 |
CN117305334A (zh) * | 2022-06-21 | 2023-12-29 | 深圳太力生物技术有限责任公司 | 靶向整合细胞及其制备方法、生产目标基因表达产物的方法 |
CN118726475A (zh) * | 2023-03-28 | 2024-10-01 | 深圳太力生物技术有限责任公司 | 核酸、重组载体、靶向整合细胞、基因表达方法和应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014205192A2 (en) | 2013-06-19 | 2014-12-24 | Sigma-Aldrich Co. Llc | Targeted integration |
WO2016064999A1 (en) | 2014-10-23 | 2016-04-28 | Regeneron Pharmaceuticals, Inc. | Novel cho integration sites and uses thereof |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69128037T2 (de) | 1990-11-13 | 1998-05-07 | Immunex Corp., Seattle, Wash. | Bifunktionelle wählbare fusionsgene |
CA2163427A1 (en) | 1993-05-21 | 1994-12-08 | Stephen D. Lupton | Bifunctional selectable fusion genes based on the cytosine deaminase (cd) gene |
US6521419B1 (en) * | 1998-09-22 | 2003-02-18 | Kanakaraju Koduri | Expression vectors containing hot spot for increased recombinant protein expression in transfected cells |
US7422889B2 (en) | 2004-10-29 | 2008-09-09 | Stowers Institute For Medical Research | Dre recombinase and recombinase systems employing Dre recombinase |
US8404486B2 (en) * | 2007-11-30 | 2013-03-26 | Boehringer Ingelheim International Gmbh | Recombination sequences |
-
2018
- 2018-08-10 CN CN201880051636.5A patent/CN110997925A/zh active Pending
- 2018-08-10 WO PCT/EP2018/071733 patent/WO2019030373A1/en unknown
- 2018-08-10 US US16/637,914 patent/US11560549B2/en active Active
- 2018-08-10 JP JP2020506795A patent/JP7087061B2/ja active Active
- 2018-08-10 EP EP18749820.9A patent/EP3665291B1/en active Active
- 2018-08-10 KR KR1020207003299A patent/KR102531749B1/ko active IP Right Grant
- 2018-08-10 CA CA3068779A patent/CA3068779A1/en active Pending
- 2018-08-10 SG SG11202000966XA patent/SG11202000966XA/en unknown
- 2018-08-10 AU AU2018315428A patent/AU2018315428A1/en active Pending
-
2022
- 2022-12-06 US US18/062,198 patent/US12018285B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014205192A2 (en) | 2013-06-19 | 2014-12-24 | Sigma-Aldrich Co. Llc | Targeted integration |
WO2016064999A1 (en) | 2014-10-23 | 2016-04-28 | Regeneron Pharmaceuticals, Inc. | Novel cho integration sites and uses thereof |
Non-Patent Citations (2)
Title |
---|
Cytotechnology.,51(3):171-182(2006.7.) |
Sci Rep.,5:8572.doi: 10.1038/srep08572(2015.2.25.) |
Also Published As
Publication number | Publication date |
---|---|
JP2020530998A (ja) | 2020-11-05 |
US20230131164A1 (en) | 2023-04-27 |
EP3665291A1 (en) | 2020-06-17 |
CN110997925A (zh) | 2020-04-10 |
KR20200038462A (ko) | 2020-04-13 |
SG11202000966XA (en) | 2020-02-27 |
US20200216815A1 (en) | 2020-07-09 |
JP7087061B2 (ja) | 2022-06-20 |
CA3068779A1 (en) | 2019-02-14 |
EP3665291B1 (en) | 2021-10-06 |
US12018285B2 (en) | 2024-06-25 |
US11560549B2 (en) | 2023-01-24 |
WO2019030373A1 (en) | 2019-02-14 |
AU2018315428A1 (en) | 2020-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102531749B1 (ko) | Cho 세포 내 통합 부위 | |
AU2019250224B2 (en) | Enhanced transgene expression and processing | |
AU2023204606A1 (en) | Genetically modified cells, tissues, and organs for treating disease | |
KR101476010B1 (ko) | 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포 | |
RU2749715C2 (ru) | Грызуны, характеризующиеся гуманизированным геном tmprss | |
CN111057721A (zh) | 人源化IL-4和/或IL-4Rα改造动物模型的制备方法及应用 | |
AU2018204332A1 (en) | Expression cassette | |
KR101920187B1 (ko) | 외래 유전자 발현 증강 활성을 갖는 dna 요소 | |
KR102553990B1 (ko) | Hspa5 유전자의 프로모터 | |
KR101608225B1 (ko) | 신규한 재조합 서열 | |
TW200932907A (en) | SM-protein based secretion engineering | |
CN115698301A (zh) | 活性dna转座子系统及其使用方法 | |
JP6025745B2 (ja) | ヒト遺伝子由来プロモーター | |
KR20050085203A (ko) | 발현 벡터, 이종성 유전자 생성물의 제조 방법 및 고생산성재조합 세포의 선별 방법 | |
CN115175559A (zh) | 包含人源化pnpla3基因座的非人动物及其使用方法 | |
CN114853871B (zh) | Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用 | |
CN113817770B (zh) | Cd73基因人源化的非人动物的构建方法及应用 | |
US20230287460A1 (en) | Mammalian cells comprising integrated cas9 genes to produce stable integration sites, and mammalian cells comprising stable integration sites and other sites | |
CN114276433A (zh) | Cd38基因人源化的非人动物及其构建方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |