KR102531749B1 - Cho 세포 내 통합 부위 - Google Patents

Cho 세포 내 통합 부위 Download PDF

Info

Publication number
KR102531749B1
KR102531749B1 KR1020207003299A KR20207003299A KR102531749B1 KR 102531749 B1 KR102531749 B1 KR 102531749B1 KR 1020207003299 A KR1020207003299 A KR 1020207003299A KR 20207003299 A KR20207003299 A KR 20207003299A KR 102531749 B1 KR102531749 B1 KR 102531749B1
Authority
KR
South Korea
Prior art keywords
seq
cho
nucleotides
cell
heterologous polynucleotide
Prior art date
Application number
KR1020207003299A
Other languages
English (en)
Other versions
KR20200038462A (ko
Inventor
마르쿠스 뮐러
요한 샵
크리스티안 베른로엘
제니퍼 코헤니처
Original Assignee
베링거 인겔하임 인터내셔날 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베링거 인겔하임 인터내셔날 게엠베하 filed Critical 베링거 인겔하임 인터내셔날 게엠베하
Publication of KR20200038462A publication Critical patent/KR20200038462A/ko
Application granted granted Critical
Publication of KR102531749B1 publication Critical patent/KR102531749B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Reproductive Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 중국 햄스터 난소(CHO) 세포에서 이종 폴리뉴클레오티드에 대한 게놈 통합 부위를 동정하여, 다량의 RNA 및/또는 단백질 제조를 달성하는 것에 관한 것이다. 더욱 구체적으로 본 발명은 CHO 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 폴리뉴클레오티드 적어도 하나를 포함하는 CHO 세포와, 상기 CHO 세포를 제조하기 위한 방법에 관한 것이다. 또한 본 발명은 상기 CHO 세포를 사용하여 관심단백질을 제조하기 위한 방법과, 관심 단백질을 높은 수율로 제조함에 있어 상기 CHO 세포의 용도에 관한 것이다. 이러한 특정의 표적 영역 내에의 통합은 이종 폴리뉴클레오티드에 의해 암호화되는 관심 RNA 및/또는 단백질 제조를 믿을 수 있고, 안정적이며, 높은 수율로 달성한다.

Description

CHO 세포 내 통합 부위
본 발명은 다량의 RNA 및/또는 단백질 제조를 달성하는 중국 햄스터 난소(Chinese Hamster Ovary; CHO) 세포 내 이종 폴리뉴클레오티드에 대한 게놈 통합 부위의 동정에 관한 것이다. 더욱 구체적으로 본 발명은 CHO 게놈의 S100A 유전자 클러스터(gene cluster)에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 CHO 세포와, 상기 CHO 세포를 제조하기 위한 방법에 관한 것이다. 또한 본 발명은 상기 CHO 세포를 사용하여 관심 단백질을 제조하기 위한 방법과, 관심 단백질을 높은 수율로 제조함에 있어 상기 CHO 세포의 용도에 관한 것이다. 이러한 특정 표적 영역 내부에의 통합은 이종 폴리뉴클레오티드에 의해 암호화되는 관심 RNA 및/또는 단백질의 신뢰할 수 있고, 안정적이며, 높은 수율의 제조를 달성한다.
중국 햄스터 난소(CHO) 세포는 치료 단백질의 재조합 제조용으로서 가장 잘 알려진 숙주 세포이다. 고전적인 세포주 개발 절차는 발현 벡터의 무작위 통합(Random Integration; RI) 후, 최적의 생산성 거동(productivity behavior)을 보이는 아클론의 선택 및 스크리닝(screening)의 순서로 이루어진다. 무작위 통합은 얻어진 세포 집단의 예측 불가능한 염색체내 위치선정 효과(positioning effect), 가변적인 복사체수 및 안정성의 문제로 말미암은 큰 이종성과 연관되어 있다. 고 생산자 세포(high producer cell)는 오로지 무작위적으로 형질감염된 세포중 단지 적은 비율만을 차지하고 있으며, 저 생산자 세포(low producer cell)에 의거하여 과성장되는 경향이 있다. 그러므로 지속적인 생물약제 단백질의 제조와 발효 공정 개발에 적합한 독립된 클론 하나를 동정 및 단리하기 위해서는 다수의 클론이 스크리닝되어야 한다.
이종 유전자 발현에 대한 위치선정 효과는, 예컨대 크로마틴 구조, 게놈 각인 또는 전사 조절인자 요소, 예컨대 게놈 인핸서 요소, 침묵인자 요소 또는 촉진인자 요소가 통합 부위 근처에 존재하는 것으로부터 기인할 수 있다(C. Wilson et al. Annu. Rev. Cell Biol. 1990, 6, 679-714). 게놈 내 이러한 요소 다수는 공지되어 있지 않거나 특성규명되어있지 않으므로, 세포주 개발 과정에서 게놈 좌위의 잠재성은 예측하기 어렵다.
고전적 무작위 통합을, 하나 이상의 소정 게놈 좌위/좌위들로의 단백질 발현 벡터의 표적화 통합(TI)으로 대체하여 수행함으로써 이러한 단점이 해결될 수 있다. 아클론 모두는 광대한 스크리닝 절차에 대한 필요를 없애주는 동일한 게놈 환경을 가질 것이므로, 표적화 통합은 세포주 개발 방법을 더욱더 잘 예측할 수 있도록 만든다.
표적화 통합에 의존하는 세포주 개발 방법의 난관은, 적합한 게놈 좌위(종종 "핫 스팟(hot spot)"이라 칭하여짐)를 동정하는 것에 있다. 이상적인 부위(들)는, 단일 또는 저 복사체 수임에도 불구, 충분한 수준의 단백질이 발현되도록 지원할 것이고, 과도한 하향 조절 없이도 장기간 안정적인 발현 수준을 보일 것이며, 예컨대 MTX 또는 MSX와 함께 대사 선택 마커 DHFR 또는 GS를 사용하여 증폭될 수 있을 것이며, 이식유전자(transgene)의 통합이 세포 성장 또는 단백질 제조 프로필에 부정적인 영향을 미치지 않도록 위치할 것이다.
S100A6 유전자는 공지의 칼슘 결합 단백질, 예컨대 S100A1, S100A13, S100A14, S100A16, S100A3, S100A2, S100A4, S100A5 및 S100A6의 군을 암호화하는 S100A 유전자 클러스터의 일부이다. 클러스터는 S100A1, S100A13, S100A14 및 S100A16 유전자를 포함하는 "부 클러스터(side cluster)"와, S100A3, S100A4, S100A5 및 S100A6 유전자를 포함하는 "주 클러스터(main cluster)"를 포함한다.
본 발명에 있어서, 이종 폴리뉴클레오티드의 CHO 세포 게놈 내 S100A 유전자 클러스터로의 안정적 통합은 이종 유전자 생성물의 제조를 증가시키는 것으로 보인다. 특히 S100A3/A4/A5/A6 주 유전자 클러스터에 측접하는 상류 및 하류 영역들 내부로의 안정적 통합은 이종 유전자 생성물, 예컨대 재조합 단백질, 예컨대 항체 및 융합 단백질, 또는 조절 RNA, 예컨대 shRNA 또는 miRNA의 예측 가능하고, 높은 수준이며, 안정적인 제조를 가능하게 한다.
본 발명에서, 중국 햄스터 난소(CHO) 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 CHO 세포가 제공되는데, 단 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류이다. 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응한다.
더욱 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응한다. 더욱더 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응한다.
일 구현예에서, 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나는 RNA 및/또는 단백질을 암호화할 수 있다. RNA는 mRNA, miRNA 또는 shRNA일 수 있다. 단백질은 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질일 수 있다.
이종 폴리뉴클레오티드 적어도 하나는 또한 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자일 수 있다. 바람직하게 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소, 예컨대 부위 특이적 뉴클레아제에 대한 인지 부위가 측접한다.
본 발명에 따른 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)-결핍 세포 또는 이들 세포 중 임의의 것의 유도체(derivative)일 수 있다.
일 구현예에서, 게놈 표적 영역은 상기 서열 번호 1 및/또는 서열 번호 2의 한정된 서열들 중 임의의 하나 또는 이에 대해 적어도 80%의 서열 동일성을 보이는 서열로 이루어진다.
이종 폴리뉴클레오티드 적어도 하나는 CHO 세포 게놈의 S100A 유전자 클러스터 대립형질 하나 또는 두 개에 안정적으로 통합될 수 있다.
다른 양태에서, 본 발명은 (a) CHO 세포를 제공하는 단계; (b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고, 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자의 하류임]를 포함하는, CHO 세포를 제조하기 위한 방법을 제공한다.
바람직하게 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응한다. 더욱 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응한다. 더욱더 바람직하게 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나; 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응한다.
일 구현예에서, 게놈 표적 영역은 상기 서열 번호 1 및/또는 서열 번호 2의 한정된 서열들중 임의의 하나 또는 이에 대해 적어도 80%의 서열 동일성을 보이는 서열 중 임의의 하나로 이루어진다.
바람직한 구현예에서, 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되고, 이 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접할 수 있다.
일 구현예에서, 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나는 RNA 및/또는 단백질을 암호화할 수 있다. RNA는 mRNA, miRNA 또는 shRNA일 수 있다. 단백질은 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질일 수 있다.
이종 폴리뉴클레오티드 적어도 하나는 또한 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자일 수 있다. 바람직하게 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하고 있다.
이종 폴리뉴클레오티드 적어도 하나는 CHO 세포 게놈의 S100A 유전자 클러스터의 대립형질 하나 또는 두 개에 안정적으로 통합될 수 있다.
일 구현예에서, 이종 폴리뉴클레오티드는 (a) 서열 특이적 DNA 편집 효소, 바람직하게 부위 특이적 뉴클레아제, 더욱 바람직하게 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제로부터 선택되는 서열 특이적 DNA 편집 효소; 또는 (b) 부위 특이적 리컴비나아제, 바람직하게 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제가 사용되어 CHO 세포 게놈에 통합된다.
다른 구현예에서, 본 방법은 (a) CHO 세포를 제공하는 단계; (aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고, (i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계를 추가로 포함할 수 있다.
또 다른 양태에서, 본 발명은 (a) 본 발명의 CHO 세포를 제공하는 단계; (b) 단계 (a)의 CHO 세포를, 관심 단백질의 제조가 허용되는 조건하에 세포 배양 배지에서 배양하는 단계; (c) 관심 단백질을 수집하는 단계; 그리고 (d) 선택적으로 관심 단백질을 정제하는 단계를 포함하는, CHO 세포에서 관심 단백질을 제조하기 위한 방법을 제공한다.
본 발명에 따른 방법에 사용된 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS) 결핍 세포 또는 이들 세포 중 임의의 것의 유도체일 수 있다.
본 발명의 또 다른 양태에서, 관심 단백질을 높은 수율로 제조하는데 있어 본 발명의 CHO 세포의 용도가 제공된다.
도 1: CHO 세포에서의 무작위 통합 대 ZFN(풀 데이터)을 통한 표적화 통합. (A)는 유가식 배양 3일 ~ 7일 후, 무작위 통합이 일어난 CHO-DG44 세포 풀 유래 IgG1 항체 농도(검정 막대) 대 표적화 통합이 일어난 CHO-DG44 세포 풀 유래 IgG1 항체 농도(흰색 막대)를 보여준다. (B)는 유가식 배양 8일 ~ 10일 후, 무작위 통합이 일어난 CHOZN GS 세포 풀 유래 IgG1 항체 농도(검정 막대) 대 표적화 통합이 일어난 CHOZN GS 세포 풀 유래 IgG1 항체 농도(흰색 막대)를 보여준다. TI 풀은 FACS 세포 분취법, 대사 선택 및 FACS의 제2 라운드가 사용되어 증량되었다. 표적화 통합은 S100A3/A4/A5/A6 주 유전자 클러스터의 하류를 통합하도록 디자인된 아연 핑거 뉴클레아제 쌍(ZFN) 13이 사용되어 아연 핑거 뉴클레아제(ZFN)에 의해 매개되었다.
도 2: (A) ZFN을 통한 표적화 통합 또는 (B) 무작위 통합 이후, 독립된 단일 CHOZN GS 클론의 항체 제조 균질성에 대한 생산성 평가 결과. 각각의 형질감염 프로토콜(각각 TI 또는 RI) 이후 제한 희석을 통해 수득된 독립 클론 20개 ~ 24개를 보여준다. 세포는 TTP 튜브 내에서 60일에 걸쳐 계대배양되었다. 막대는 계대배양 당일(n = 2) 및 60일차(n = 2) 이후 8일 경과시 유가식 배양중인 개별 클론의 IgG 역가(μg/ml)로부터 풀링(pooling)된 데이터를 나타낸다. 오차 막대는, 계대배양 당일 및 60일차에서의 클론 안정성을 나타낸다. ZNF 13이 사용되는 S100A3/A4/A5/A6 주 유전자 클러스터 하류의 표적화 통합은, 60일 동안 단일 클론 배양액 중에서 더욱 균질한 클론 IgG 발현 수준과 더욱 안정적인 발현을 달성하였다.
도 3: TI 이후 항체 풀 역가에 대한 통합 부위의 영향력. (A)는 S100A 유전자 클러스터 내 개별 ZFN및 핫 스팟 좌위의 위치를 도시한 것이다. 번호는, NCBI 참조 서열: NW_003613854.1을 가지는, CHOZN GS 세포의 크리세튤러스 그리세우스(Cricetulus griseus) 스캐폴드를 기반으로 한 경계를 나타낸다. 화살표는, ZNF 7 ~ 14의 통합 부위를 나타내는 것으로서, "비 파괴적 및 생산적(non disruptive and productive)" 부위(검정 막대), "비 파괴적 및 저/비 생산적" 부위(흰색 막대), 그리고 "파괴적 및 저/비 생산적" 부위(빗금친 막대)로 분류된다. (B)는 X-축에 보인 상이한 좌위로의 ZNF 7 ~ 14 매개 통합이 사용되어 달성된, CHO 풀에 대한 IgG 역가(mg/l)를 보인다.
도 4: CHO-K1 GS 세포 내 랜딩 패드(landing pad)를 통한 표적화 통합의 결과. (A) 상동성 팔(arm)(서열 번호 13 및 서열 번호 14), 플립파아제 인지 표적(FRT) 부위 FRT 및 FRT5, 그리고 IRES 서열에 의해 격리된 선택 마커 2개를 포함하고, ZFN 좌위 13번(서열 번호 11)에 대한 랜딩 패드의 부위 특이적 통합을 위해 ZFN을 통하여 CHO 게놈에 통합된 DNA 구조체의 모식도. (B)는 표적화 통합이 이루어진 CHOZN GS 세포 풀 중 IgG1 항체의 농도를 보여준다.
도 5: 독립적 CHO-K1 GS 단일 클론의, 랜딩 패드를 통한 표적화 통합 이후 항체 제조에 대한 생산성 평가 결과. 10개의 독립된 단일 클론의 IgG 항체 농도(검정 막대)와, 세포 풀의 IgG 항체 농도(빗금친 막대)를 보여준다.
"~를 포함하는"일반적인 구현예 또는 "~에 포함된" 일반적인 구현예는 "~으로 이루어진" 더욱 구체적인 구현예를 포함한다. 더욱이 단수 및 복수 형태는 제한적 방식으로 사용되지 않는다. 본원에 사용된 바와 같은 단수를 나타내는 용어 "하나의", "한" 및 "본"은 단수만을 지칭하는 것이라고 명백하게 진술되지 않는 한 단수의 것과 복수의 것 둘다를 지칭한다.
본 발명에 사용된 바와 같은 "상동체" 또는 "상동성"이란 용어는, 서열에 있어서 원래의 서열 또는 이의 상보성 서열과 적어도 80% 동일한 폴리펩티드 분자 또는 핵산 분자, 또는 이러한 폴리펩티드 분자 또는 핵산 분자가 이와 같은 상태일 때를 의미한다. 바람직하게 폴리펩티드 분자 또는 핵산 분자는 서열에 있어서 기준 서열 또는 이의 상보성 서열과 적어도 90% 동일하다. 더욱 바람직하게, 폴리펩티드 분자 또는 핵산 분자는 서열에 있어서 기준 서열 또는 이의 상보성 서열과 적어도 95% 동일하다. 더욱 바람직하게 폴리펩티드 분자 또는 핵산 분자는 서열에 있어서 기준 서열 또는 이의 상보성 서열과 적어도 98% 동일하다. 상동성 단백질은 또한 원래 서열의 단백질 활성과 동일하거나 유사한 단백질 활성을 보인다.
본원에 사용된 바와 같은 "서열에 대응하는" 또는 "서열에 대응하다"란 용어는, 서열 번호 1 또는 서열 번호 2의 뉴클레오티드 서열, 또는 서열 번호 1 또는 서열 번호 2의 한정된 뉴클레오티드 간 서열뿐 아니라, 이의 천연 변이를 가지는 크리세튤러스 그리세우스 CHO-K1의 한정된 서열을 포함한다. 당 업자는, CHO 세포주의 게놈 서열은 가변적이므로, 예컨대 대립형질 변이로 말미암아 서열 번호 1과 2에 보인 바와 같이, NCBI 데이터베이스로부터 구하여진 NCBI 참조 서열: NW_003613854.1의 서열과 동일할 수 없음을 이해할 것이다. 그러나 당업자는 서열 번호 1 또는 2에 한정된 바와 같은 서열, 즉 상동성 영역에 대응하는 CHO 세포주의 특정 서열을, 서열 정렬을 이용하여 어떻게 동정하는지 알 것이다. 이러한 대응 서열은 서열 번호 1에 한정된 서열, 또는 서열 번호 2에 한정된 서열과 적어도 80%의 동일성을 보일 것이고, 바람직하게는 서열 번호 1에 한정된 서열, 또는 서열 번호 2에 한정된 서열과 적어도 90%의 동일성을 보일 것이거나, 또는 서열 번호 1 또는 서열 번호 2와 동일하다. 대응 서열은 또한 대응 서열을 확정하는데 고려되지 않을 재조합 삽입부, 예컨대 이종 폴리뉴클레오티드를 함유할 수 있다.
"단백질"이란 용어는 "아미노산 잔기 서열" 또는 "폴리펩티드"와 호환되어 사용되고, 임의의 길이를 가지는 아미노산 중합체를 지칭한다. 이 용어는 또한 글리코실화, 아세틸화, 인산화, 당화 또는 단백질 가공을 포함하되, 이에 한정되는 것은 아닌 반응을 통하여 번역후 변형된 단백질을 포함한다. 변형 및 변이, 예컨대 다른 단백질에의 융합, 아미노산 서열의 치환, 결실 또는 삽입은, 이와 같은 분자 자체의 생물학적 기능 활성이 유지되면서 폴리펩티드 구조에 일어날 수 있다. 예를 들어 임의의 아미노산 서열 치환은 폴리펩티드 또는 이의 기반을 이루는 핵산 암호화 서열에서 일어날 수 있으며, 동일한 특성을 가지는 단백질이 수득될 수 있다. "폴리펩티드"란 용어는, 통상 아미노산을 10개 초과하여 가지는 서열을 지칭하고, "펩티드"란 용어는, 길이가 10개 이하 아미노산인 서열을 지칭한다. 그러나 이 용어들은 호환되어 사용될 수 있다. 본 발명에 따르는 관심 단백질은, 바람직하게 치료 단백질이다.
"관심 단백질"이란 용어는 넓게는 산업상의 단백질 제조 방법에 특별히 관련된 임의의 단백질을 지칭한다. 관심 단백질로서는, 예컨대 단백질 분비, 번역후 단백질 변형, 번역, 전사, 세포 주기 조절 또는 영양분 대사에 있어 기능을 가지는 숙주 세포의 단백질, 마커 단백질 또는 이종의 치료 단백질을 포함하나, 이에 한정되는 것은 아니다.
"치료 단백질"이란 용어는, 인간 및/또는 동물의 의료 처치에 사용될 수 있는 단백질을 지칭한다. 이로서는 항체, 성장 인자, 혈액 응고 인자, 백신, 인터페론, 호르몬 및 융합 단백질을 포함하나, 이에 한정되는 것은 아니다.
"게놈 DNA" 또는 "게놈"이란 용어는 호환되어 사용되는 것으로서, 숙주 유기체의 유전 가능한 유전 정보를 지칭한다. 게놈 DNA는 핵의 DNA(염색체 DNA라고도 지칭됨)뿐 아니라 기타 세포내 소기관(예컨대 미토콘드리아)의 DNA도 포함한다.
본원에 사용된 바와 같은 "유전자"란 용어는, 기능성 생성물로서 발현되거나 유전자 발현을 조절함으로써 유기체의 형질에 영향을 미치는, 유전 가능한 게놈 서열의 DNA 또는 RNA 좌위를 지칭한다. 유전자 및 폴리뉴클레오티드는 게놈 서열 내에서와 같은 인트론과 엑손, 또는 단지 cDNA 내에서와 같은 암호화 서열, 예컨대 개시 코돈(메티오닌 코돈) 및 번역 종결 코돈을 포함하는 개방 해독틀(ORF)을 포함할 수 있다. 유전자 및 폴리뉴클레오티드는 또한 자체의 발현을 조절하는 영역, 예컨대 전사 개시, 번역 및 전사 종결을 포함할 수 있다. 그러므로 조절 요소, 예컨대 촉진인자도 또한 포함된다.
본원에 사용된 바와 같은 "핵산", "뉴클레오티드" 및 "폴리뉴클레오티드"란 용어는 호환되어 사용되는 것으로서, 5' 말단으로부터 3' 말단으로 해독된 데옥시리보뉴클레오티드 염기 또는 리보뉴클레오티드 염기의 단일 가닥 또는 이중 가닥 중합체를 지칭하고, 이중 가닥 DNA(dsDNA), 단일 가닥 DNA(ssDNA), 단일 가닥 RNA(ssRNA), 이중 가닥 RNA(dsRNA), 게놈 DNA, cDNA, cRNA, 재조합 DNA 또는 재조합 RNA와, 이것들의 유도체, 예컨대 변형된 백본(backbone)을 함유하는 것들을 포함한다. 바람직하게, 특히 CHO 게놈에 안정적으로 통합되는 폴리뉴클레오티드는 DNA 또는 cDNA이다. 본 발명에 따른 폴리뉴클레오티드는 상이한 방법(예컨대 화학적 합성법, 유전자 클로닝 등)으로 제조될 수 있으며, 다양한 형태(예컨대 선형 또는 분지형, 단일 가닥 또는 이중 가닥, 또는 이의 하이브리드, 프라이머, 프로브 등)를 취할 수 있다. "뉴클레오티드 서열" 또는 "핵산 서열"이란 용어는, 개별 단일 가닥 또는 이중체중 어느 하나인 핵산의 센스 가닥 및 안티센스 가닥 둘다를 지칭한다.
본원에 사용된 바와 같은 "이종 폴리뉴클레오티드"란 용어는, 상이한 유기체 또는 상이한 수용개체 종, 즉 상이한 CHO 세포로부터 유래한 폴리뉴클레오티드를 지칭한다. 본 발명의 내용에 있어 당 업자는 "이종 폴리뉴클레오티드"가 DNA 또는 cDNA를 지칭함을 이해할 것이다. 이종 폴리뉴클레오티드는 또한 이식유전자라 지칭될 수 있다. 그러므로 "이종 폴리뉴클레오티드"는 이종 단백질을 암호화하는 유전자 또는 개방 해독틀(ORF)일 수 있다. CHO 세포에 관한 내용에 있어 "이종 폴리뉴클레오티드"란 상이한 세포주, 바람직하게는 크리세튤러스 그리세우스로부터 유래하지 않는 세포주로부터 유래하는 폴리뉴클레오티드를 지칭한다. "이종"이란 용어가 핵산의 일부분과 관련하여 사용될 때, 이 용어는 또한 핵산이 자연에서 서로 간에 동일한 관계에 있는 것으로서 발견되지 않는 서열을 2개 이상 포함함을 나타낼 수 있다. 그러므로 "이종"은 또한 CHO 유래 폴리뉴클레오티드 서열, 예컨대 유전자 또는 이식유전자, 또는 이의 일부분이, 이것이 통상 발견되지 않는 CHO 게놈의 위치에 삽입되었을 때, 또는 유전자가, 이것이 통상 발견되지 않는 어떤 유기체의 세포에 도입되었을 때를 지칭할 수도 있다.
"이종 폴리뉴클레오티드", "이종 유전자" 또는 "이종 서열"은 표적 세포에 직접적으로 도입될 수 있거나, 또는 바람직하게 "발현 벡터", 바람직하게 포유류 발현 벡터를 사용하여 도입될 수 있다. 벡터를 구성하는데 사용되는 방법은 당 업자에게 잘 공지되어 있으며, 다수의 간행물에 기술되어 있다. 예컨대 기능성 구성요소, 예컨대 촉진인자, 인핸서, 종결 및 폴리아데닐화 신호, 선택 마커, 복제 기원 및 스플라이싱 신호(splicing signal)에 관한 기술을 포함하여 구체적으로 적합한 벡터를 구성하기 위한 기법은 문헌[Sambrook J, et al., 1989. Molecular Cloning: A Laboratory Manual. Cold Spring Harbor: Cold Spring Harbor Laboratory Press]과, 이 문헌에 인용된 문헌들에 상당히 상세하게 검토되어 있다. 벡터로서는 플라스미드 벡터, 파지미드, 코스미드, 인공/미니 염색체(예컨대 ACE), 또는 바이러스 벡터, 예컨대 배큘로바이러스, 레트로바이러스, 아데노바이러스, 아데노 연관 바이러스, 단순포진바이러스, 레트로바이러스 및 박테리오파아지를 포함할 수 있으나, 이에 한정되는 것은 아니다. 진핵생물 발현 벡터는 또한, 통상적으로 벡터의 박테리아내 증식을 촉진하는 원핵생물 서열, 예컨대 복제 기원과, 박테리아내 선택을 위한 항생제 내성 유전자를 함유하기도 할 것이다. 폴리뉴클레오티드가 작동 가능하도록 결합될 수 있는 클로닝 부위를 함유하는 다양한 진핵생물 발현 벡터는 당 분야에 널리 공지되어 있으며, 이것들 중 몇몇은 Stratagene(La Jolla, CA; Invitrogen, Carlsbad, CA); Promega(Madison, WI); 또는 BD Biosciences Clonetech(Palo Alto, CA)와 같은 회사로부터 시판되고 있다. 일반적으로 발현 벡터는 또한 상기 발현 마커를 운반하는 숙주 세포의 선택을 허용하는, 선택 가능 마커를 암호화하는 발현 카세트를 포함하기도 한다.
본원에 사용된 바와 같은 "제조하는" 또는 "다량 제조", "제조", "제조 및/또는 분비", "제조하는 것", "제조용 세포" 또는 "높은 수율로 제조하는 것"이란 용어는, 이종 폴리뉴클레오티드에 의해 암호화되는 RNA 및/또는 단백질의 제조에 관한 것이다. "증가한 제조 및/또는 분비" 또는 "높은 수율의 제조"는, 이종 RNA 및/또는 단백질의 발현과 관련된 것으로서, 세포 배양액의 구체적 생산성 증가. 증가한 역가, 증가한 전체 생산성 또는 이의 조합을 의미한다. 바람직하게 역가 또는 전체 생산성, 그리고 역가는 증가한다. 본원에 사용된 바와 같은 "증가한 역가"는 동일 부피일 때 증가한 농도, 즉 총 수율의 증가에 관한 것이다. 제조된 이종 RNA, 이종 단백질 또는 치료 단백질은, 예를 들어 소형 조절 RNA 또는 항체, 바람직하게는 마이크로 RNA, 소형의 헤어핀 RNA, 모노클로날 항체, 이중 특이적 항체 또는 이의 단편, 또는 융합 단백질일 수 있다.
본원에 사용된 바와 같은 "향상", "향상된", "향상된", "증가하다" 또는 "증가한"이란 용어는, 일반적으로 대조군 세포에서에 비하여 적어도 약 10%만큼 증가한 것을 의미하는데, 예를 들어 대조군 세포에서에 비하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 75%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 100%, 또는 적어도 약 200%, 또는 적어도 약 300%만큼 증가한 경우, 또는 10%와 300% 사이 임의의 정수%만큼 감소한 경우를 의미한다. 본원에 사용된 바와 같은 "대조군 세포" 또는 "대조군 포유류 세포"는 동일한 이종 폴리뉴클레오티드가 무작위로 도입된 CHO 세포와 동일한 CHO 세포이다. 이는 세포 클론에서 확정될 수 있거나, 바람직하게는 클론 선택이 이루어지지 않은 세포 풀에서 확정될 수 있다.
본원에 사용된 바와 같은 "발현 카세트"란 용어는, RNA(이종 RNA) 또는 단백질(이종 단백질)을 암호화하는 유전자 하나 이상과, 이의 발현을 제어하는 서열을 포함하는, 벡터의 일부를 지칭한다. 그러므로 발현 카세트는 촉진인자 서열 및 개방 해독틀과, 통상적으로 폴리아데닐화 부위를 함유하는 3' 미번역 영역을 포함한다. 바람직하게 벡터는 재조합 분비 치료 단백질을 암호화하는 유전자 하나 이상을 포함하는 발현 벡터이다. 발현 카세트는 벡터, 통상적으로 발현 벡터, 예컨대 플라스미드 또는 바이러스 벡터의 일부일 수 있다. 발현 카세트는 또한 무작위 또는 표적화 통합, 예컨대 상동성 재조합에 의해 염색체에 통합될 수도 있다. 발현 카세트는 클로닝 기법을 사용하여 제조되므로, 자연 발생 유전자 구조를 지칭하지 않는다.
"촉진인자" 또는 "촉진인자 서열"은 세포 내 RNA 중합효소의 결합과, 하류(3' 방향) 암호화 서열 전사의 개시를 가능하게 하는 DNA 조절 영역이다. 촉진인자 서열 자체의 3' 말단에는 전사 개시 부위가 측접하며, 상류(5' 방향)로 확장되어, 1.5 kb 이하만큼을 포함하게 된다. 통상적으로 촉진인자는 그 길이가 약 100개 내지 약 1000개 염기쌍이다. 촉진인자 서열은 전사 개시 부위뿐 아니라, RNA 중합효소 결합에 가담하는 단백질 결합 도메인(공통 서열)을 포함한다. 진핵생물 촉진인자는 항상은 아니고 종종 "TATA" 박스와 "CAT" 박스를 함유한다. 촉진인자 서열은 종종 각각의 유전자 발현을 조절하는데 수반되는 단백질에 의해 인지되는 추가의 공통 서열을 함유하기도 한다. 촉진인자에 의한 유전자 발현의 조절은 조절 단백질의 결합을 향상시키거나 억제함으로써 진행될 수 있다. 조절 단백질 결합의 향상 또는 억제는 다수의 상이한 방법, 예컨대 염기 변형(즉 메틸화) 및 단백질 변형(즉 인산화)(이에 한정되는 것은 아님)에 의해 이루어질 수 있다.
"상류" 및 "하류"란 용어는, DNA 또는 RNA 내 상대적인 위치를 지칭한다. DNA 또는 RNA의 각각의 가닥은 데옥시리보스 또는 리보스 단위의 말단 탄소 위치와 관련된 5' 말단과 3' 말단을 보유한다. 관례상 "상류"란, 폴리뉴클레오티드의 5' 말단을 향하는 쪽을 의미하는 반면에, "하류"란, 폴리뉴클레오티드의 3' 말단을 향하는 쪽을 의미한다. 이중 가닥 DNA, 예컨대 게놈 DNA의 경우, "상류"란 용어는, 암호화 가닥의 5' 말단을 향하는 쪽을 의미하는 반면에, "하류"란, 암호화 가닥의 3' 말단을 향하는 쪽을 의미한다.
"암호화 가닥", "센스 가닥" 또는 "비 주형 가닥"이란 용어는, 유전자 자체의 염기 서열이 RNA 염기 서열, 즉 이 유전자로부터 전사된 RNA의 염기 서열에 대응하는, 이중 가닥 DNA의 가닥을 지칭한다.
"소형 조절 RNA"란 용어는, 보통 표적 유전자 각각의 mRNA와 결합함으로써 이 표적 유전자의 발현에 영향을 미치는 소형 비 암호화 RNA 폴리뉴클레오티드를 지칭한다. 이러한 소형 조절 RNA로서는 소형 간섭 RNA(siRNA), 마이크로 RNA(miRNA) 및 짧은 헤어핀 RNA(shRNA)를 포함하나, 이에 한정되는 것은 아니다.
본원에 사용된 바와 같은 "리보핵산", "RNA" 또는 "RNA 올리고뉴클레오티드"란 용어는, 핵염기, 리보스 당 및 인산염 기로 구성된 뉴클레오티드들의 서열로 이루어진 분자를 기술한다. RNA는, 보통 단일 가닥의 분자로서, 다양한 기능을 발휘할 수 있다. "리보핵산"이라는 용어는, 특히 메신저 RNA(mRNA), 운반 RNA(tRNA), 리보좀 RNA(rRNA), 짧은 간섭 RNA(siRNA), 소형 헤어핀 RNA(shRNA) 및 마이크로RNA(miRNA)를 포함하는데, 이것들 각각은 생물 세포 내에서 특정의 역할을 한다. 이는 소형 비 암호화 RNA, 예컨대 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA), 소형 헤어핀 RNA(shRNA) 그리고 Piwi 상호작용 RNA(piRNA)를 포함한다. "비 암호화"란 용어는, RNA 분자가 아미노산 서열로 번역되지 않음을 의미한다.
"RNA 간섭"(RNAi)이란 용어는, 단백질 합성의 일반화된 억제를 제외한, 유전자 발현(단백질 합성)의 서열 특이적이거나 유전자 특이적인 억제를 지칭한다. RNAi는, 전사된 mRNA의 번역을 막아주는 RNA 유도성 침묵 복합체(RISC)에 의한 메신저 RNA(mRNA)의 분해를 수반할 수 있다. RNAi에 의해 유발되는 유전자 발현의 억제는 일시적일 수 있거나, 또는 더욱 안정적이거나 심지어 영구적일 수 있다. RNAi는 miRNA, siRNA 또는 shRNA에 의해 매개될 수 있다. 바람직하게 본 발명에 따른 RNAi는 유전자 특이적이다(오로지 하나의 유전자만이 표적화된다). 유전자 특이적 RNAi는 siRNA 또는 shRNA에 의해 매개될 수 있다.
"마이크로RNA" 또는 "miRNA"란 용어는, 본원에서 호환되어 사용된다. 마이크로RNA는 길이가 약 22개 뉴클레오티드(길이가 통상 19개 내지 25개 뉴클레오티드)인 소형 비 암호화 단일 가닥 RNA이다. miRNA는, 통상 하나를 초과하는 유전자를 표적화한다. 마이크로RNA는 진핵생물 세포의 게놈에서 암호화되며, 통상 RNA 중합효소 III에 의해 길이가 긴 1차 전사체로서 전사되는데, 이 전사체는 추후 몇 단계를 거쳐 처음에는 길이 약 70 nt인 헤어핀-루프 구조로, 그 다음에는 약 22 nt의 RNA 이중체로 가공된다. 그 다음, 활성을 가지는 성숙한 가닥은 RNA 유도성 침묵 복합체(RISC)에 부하되어, 표적 단백질의 번역 또는 이 표적 단백질의 각각의 mRNA의 분해를 막아준다. miRNA에 의한 표적화는 미스매칭을 허용하고, mRNA 번역 억제는 불완전한 상보성(즉, 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥과 표적 mRNA 간의 완벽하지 못한 염기 쌍형성)에 의해 매개되는 반면에, siRNA 및 shRNA는 완전한 서열 상보성(즉 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥과 표적 mRNA 간의 완벽한 염기 쌍형성)으로 말미암아 이것들의 표적에 특이적이다. 통상적으로 miRNA는 3'미번역 영역(3'UTR)에 결합하고, 유전자 특이적이 아니지만, 다수의 mRNA를 표적화한다. 본원에 사용된 바와 같은 "마이크로RNA"란 용어는, 포유류의 내인성 게놈 miRNA, 예컨대 인간 miRNA에 관한 것이다. 접두사 "hsa"는, 예컨대 마이크로RNA가 인간 기원의 것임을 나타낸다. "마이크로RNA"는 포유류 숙주 세포 내 miRNA의 일시적이거나 안정적인 발현을 위한 게놈 마이크로RNA 서열(들)을 포함하는 발현 벡터를 사용하여 포유류 숙주 세포에 도입될 수 있다. 게놈 마이크로RNA를 발현 벡터에 클로닝하기 위한 방법은 당 분야에 공지되어 있다. 이러한 방법으로서는 게놈 miRNA 서열을 대략 300 bp의 측접 영역과 함께 포유류 발현 벡터, 예컨대 pBIP-1에 클로닝하되, 촉진인자와 작동 가능하도록 결합되게 클로닝하는 방법을 포함한다. 대안적으로 하나 이상의 마이크로RNA는 조작된 프리-miRNA 서열(즉 짧은 헤어핀)을 암호화하는 폴리뉴클레오티드로서 포유류 발현 벡터에 클로닝될 수 있다. 예를 들어 성숙한 miRNA 서열은 최적화된 헤어핀 루프 서열과, 예컨대 마우스 miRNA mir-155 유래 3' 및 5' 측접 영역을 암호화하는 소정의 서열에 클로닝될 수 있다 (Lagos-Quintana et al., 2002. Curr. Biol. 30;12(9):735-9). DNA 올리고뉴클레오티드는 헤어핀 줄기의 내부 루프가 생성되도록 2개의 뉴클레오티드가 결실된 성숙 miRNA 각각의 안티센스 서열, 언급된 루프, 그리고 miRNA 서열을 암호화하도록 디자인된다. 뿐 아니라, 양 말단에서 DNA 올리고뉴클레오티드를 3' 및 5' 측접 영역에 융합하는 클로닝을 실시하기 위해 돌출가닥(overhang)이 부가된다. 본원에 사용된 바와 같은 miRNA는 비표준 miRNA를 추가로 포함한다. 이러한 RNA는 리보좀 RNA(rRNA) 또는 운반 RNA(tRNA)를 비롯한 "항존(housekeeping)" 비 암호화 RNA(ncRNA)로부터 유래하여, miRNA가 작용하는 것과 유사한 방식으로 작용한다. 이 RNA는 또한 포유류 미토콘드리아 ncRNA로부터 기원할 수 있으므로, 미토콘드리아 게놈 암호화 소형 RNA(미토sRNA)라 칭하여진다.
본원에 사용된 바와 같이, "소형 간섭성" 또는 "짧은 간섭 RNA" 또는 "siRNA"란 용어는, 원하는 유전자에 표적화되고, 상동성을 공유하는 유전자의 발현을 억제할 수 있는, 뉴클레오티드의 RNA 이중체를 지칭한다. 이는 길이가 긴 이중 가닥 RNA(dsRNA) 또는 shRNA로부터 생성된다. RNA 이중체는, 통상 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개 또는 27개 염기쌍을 형성하고, 뉴클레오티드 2개의 3'돌출가닥을 보유하는 뉴클레오티드 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개 또는 29개로 이루어진 상보성 단일 가닥 RNA를 2개 포함하고, 바람직하게 RNA 이중체는 17개 ~ 25개 염기쌍을 형성하고, 뉴클레오티드 2개의 3' 돌출가닥을 보유하는 뉴클레오티드 19개 ~ 27개의 상보성 단일 가닥 RNA 2개를 포함한다. siRNA는 유전자에 "표적화"되는데, 단 siRNA의 이중체 부분의 뉴클레오티드 서열은 표적 유전자의 mRNA의 뉴클레오티드 서열에 상보성이다. siRNA 또는 이의 전구체는 항상 외부로부터, 예컨대 직접적으로 세포내에 도입되거나, 또는 상기 siRNA를 암호화하는 서열을 가지는 벡터의 형질감염에 의해 세포내에 도입되며, 내인성 miRNA 경로는 siRNA의 올바른 가공과, 표적 mRNA의 절단 및 분해를 위해 동력화된다. 이중체 RNA는 세포 내에서 단일 구조체로부터 발현될 수 있다.
본원에 사용된 바와 같이, "shRNA"(소형 헤어핀 RNA)란 용어는, siRNA의 일부분이 헤어핀 구조(shRNA)의 일부인 RNA 이중체를 지칭한다. shRNA는 세포 내에서 기능성 siRNA로 가공될 수 있다. 헤어핀 구조는 이중체부에 더하여, 이중체를 형성하는 서열 2개 사이에 위치하는 루프부를 함유할 수 있다. 루프는 그 길이가 가변적일 수 있다. 몇몇 구현예들에서, 루프는 그 길이가 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개 또는 14개 뉴클레오티드이다. 헤어핀 구조는 또한 3'또는 5' 돌출가닥부를 함유할 수 있다. 몇몇 양태들에서, 돌출가닥은 그 길이가 0개, 1개, 2개, 3개, 4개 또는 5개 뉴클레오티드인 3'또는 5'돌출가닥이다. 본 발명의 일 양태에서, 벡터에 포함된 뉴클레오티드 서열은 센스 영역, 루프 영역 및 안티센스 영역을 포함하는 소형 헤어핀 RNA의 발현에 대한 주형으로서의 역할을 한다. 발현 후 센스 영역 및 안티센스 영역은 이중체를 형성한다. shRNA는 항상, 예컨대 상기 shRNA를 암호화하는 서열을 가지는 벡터의 형질감염에 의해 외부로부터 도입되고, 내인성 miRNA 경로는 siRNA의 올바른 가공과, 표적 mRNA의 절단 또는 분해를 위해 동력화된다. 표적 유전자의 억제는 통상 장기간에 걸쳐 안정적으로 이루어진다는 점에서, shRNA를 암호화하는 서열을 가지는 벡터의 용도는 화학 합성된 siRNA의 용도에 비하여 이점을 가진다.
통상적으로 siRNA 및 shRNA는 완전한 서열 상보성(즉 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥과 표적 mRNA 사이의 완벽한 염기 쌍형성)에 의해 mRNA 억제를 매개하므로, 자체의 표적에 특이적이다. RNA 이중체의 안티센스 가닥은 또한 RNA 이중체의 활성 가닥이라 지칭될 수 있다. 본원에서 이용되는 바와 같은, 완벽한 염기 쌍형성의 완전한 서열 상보성이란, 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥이, 적어도 15개 연속 뉴클레오티드, 적어도 16개 연속 뉴클레오티드, 적어도 17개 연속 뉴클레오티드, 적어도 18개 연속 뉴클레오티드, 그리고 바람직하게 적어도 19개 연속 뉴클레오티드에 대해, 표적 mRNA와의 서열 동일성 적어도 80%를 보임을, 또는 바람직하게 적어도 15개 연속 뉴클레오티드, 적어도 16개 연속 뉴클레오티드, 적어도 17개 연속 뉴클레오티드, 적어도 18개 연속 뉴클레오티드, 그리고 바람직하게 적어도 19개 연속 뉴클레오티드에 대해 표적 mRNA와의 서열 동일성 적어도 93%를 보임을 의미한다. 더욱 바람직하게 소형 간섭 RNA의 RNA 이중체 중 안티센스 가닥은, 적어도 15개 연속 뉴클레오티드, 적어도 16개 연속 뉴클레오티드, 적어도 17개 연속 뉴클레오티드, 적어도 18개 연속 뉴클레오티드, 그리고 바람직하게 적어도 19개 연속 뉴클레오티드에 대해 표적 mRNA와의 서열 동일성 100%를 보인다.
"벡터"는 이종 폴리뉴클레오티드를 세포에 도입하는데 사용될 수 있는 핵산이다. 벡터의 한 가지 유형으로서는 내부에 추가의 핵산 분절이 결찰될 수 있는 선형 또는 원형 이중 가닥 DNA 분자라 지칭되는 "플라스미드"가 있다. 벡터의 또 다른 유형으로서는, 추가의 DNA 또는 RNA 분절이 바이러스 게놈에 도입될 수 있는 바이러스 벡터(예컨대 복제 결함 레트로바이러스, 아데노바이러스 및 아데노 연관 바이러스)가 있다. 바람직하게 벡터는 숙주 세포에 도입되어 선택압 적용 하에서 배양될 때 숙주 세포의 게놈에 통합되어, 숙주 게놈과 함께 복제되는 비 에피좀 포유류 벡터이다. 벡터는 선택된 폴리뉴클레오티드의 세포 내 발현을 유도하는데 사용될 수 있다.
"~을 암호화하다" 및 "~을 암호화한다"란 용어는, 넓게 중합체 거대분자 내 정보가, 제1 분자와는 상이한 제2 분자의 생성을 유도하는데 사용되는 임의의 과정을 지칭한다. 제2 분자는 그 화학 성질이 제1 분자의 화학 성질과 상이한 화학 구조를 가질 수 있다. 예를 들어 몇몇 양태들에서, "~를 암호화하다"란 용어는, 이중 가닥 DNA 분자의 한 가닥이 DNA 의존적 DNA 중합효소에 의해 새로 합성되는 상보성 자매 가닥을 암호화하는 주형으로 사용되는, 반 보존적 DNA 복제 과정을 기술한다. 다른 양태들에서, DNA 분자는 (예컨대 DNA 의존적 RNA 중합효소를 사용하는 전사 과정에 의해) RNA 분자를 암호화할 수 있다. 또한 RNA 분자는 번역 과정에서와 같이 폴리펩티드를 암호화할 수 있다. "~를 암호화하다"라는 용어가 번역 과정을 기술하는데 사용될 때, 이는 또한 아미노산을 암호화하는 3원 1조 코돈(triplet codon)에까지 확대된다. 몇몇 양태들에서, RNA 분자는, 예컨대 RNA 의존적 DNA 중합효소가 통합되는 역전사 과정에 의해 DNA 분자를 암호화할 수 있다. 다른 양태에서, DNA 분자는 폴리펩티드를 암호화할 수 있는데, 단 이 경우에 사용된"~를 암호화하다"는 전사 과정 및 번역 과정 둘 다에서의 암호화를 통틀어 일컫는 것임이 이해된다.
본원에 사용된 바와 같은 "유전자 클러스터"란 용어는, 관련되었거나 유사한 단백질들의 군을 암호화하고, 보통은 함께 무리지어 동일한 염색체상에 존재하는, 밀접하게 관련된 유전자들의 세트 또는 과를 포함하는 게놈 DNA의 분절을 지칭한다. 유전자 클러스터는 게놈 DNA 분절을 포함하는데, 여기에는 암호화 서열에 선행하는 영역(리더; leader)과 후행하는 영역(트레일러; trailer)뿐 아니라 개별 암호화 서열 단편(엑손)들 사이에 개입하는 서열(인트론)들, 그리고 최 광의로서의 추가 유전 요소들, 예컨대 전사 조절인자 요소, 촉진인자 요소, 인핸서 요소 및 억제인자 요소(이에 한정되는 것은 아님)를 비롯하여 단백질 군에 대한 모든 암호화 서열이 위치하고 있다. 일반적으로 유전자 클러스터는 유전자 클러스터의 첫 번째(5') 단백질 암호화 유전자와, 유전자 클러스터의 마지막(3') 단백질 암호화 유전자에 의해 한정되는 전체 게놈 분절을 포함한다.
"S100A 유전자 클러스터"란, 칼슘 결합 단백질인 S100A1, S100A3, S100A4, S100A5, S100A6, S100A13, S100A14 및 S100A16의 군을 암호화하는 중국 햄스터 게놈 DNA 분절을 지칭한다. 이 분절은 가장 상류에 있는 S100A1 단백질 암호화 유전자와, 가장 하류에 있는 S100A6 단백질 암호화 유전자를 포함한다. "S100A3/A4/A5/A6 주 유전자 클러스터"란 용어는, S100A 유전자 클러스터에 의해 포함되고, S100A3 단백질을 암호화하는 유전자로부터 S100A6 단백질을 암호화하는 유전자에 이르기까지에 걸쳐있는 게놈 DNA의 분절(서열 번호 4)을 지칭한다. "S100A1"이란, 크리세튤러스 그리세우스 유래 단백질 S100A1과, 이를 암호화하는 유전자(S100A1 유전자; NCBI 유전자 ID: 100769478)를 지칭한다. "S100A3"이란, 크리세튤러스 그리세우스 유래 단백질 S100A3과, 이를 암호화하는 유전자(S100A3 유전자, NCBI 유전자 ID: 100770814)를 지칭한다. "S100A4"란, 크리세튤러스 그리세우스 유래 단백질 S100A4와, 이를 암호화하는 유전자(S100A4 유전자, NCBI 유전자 ID: 100770532)를 지칭한다. "S100A5"란, 크리세튤러스 그리세우스 유래 단백질 S100A5와, 이를 암호화하는 유전자(S100A5 유전자, NCBI 유전자 ID: 100771097)를 지칭한다. "S100A6"이란, 크리세튤러스 그세우스 유래 단백질 S100A6과, 이를 암호화하는 유전자(S100A6 유전자; NCBI 유전자 ID: 100771384)를 지칭한다. "S100A13"이란, 크리세튤러스 그세우스 유래 단백질 S100A13과, 이를 암호화하는 유전자(S100A13 유전자; NCBI 유전자 ID: 100769763)를 지칭한다. "S100A14"란, 크리세튤러스 그세우스 유래 단백질 S100A14와, 이를 암호화하는 유전자(S100A14 유전자; NCBI 유전자 ID: 100770053)를 지칭한다. "S100A16"이란, 크리세튤러스 그세우스 유래 단백질 S100A16과, 이를 암호화하는 유전자(S100A16 유전자; NCBI 유전자 ID: 100753026)를 지칭한다.
"대립형질"이란 용어는, 유전자, 유전자 표적 영역 또는, 일반적으로 단일 좌위, 즉 염색체상 위치에 있는 DNA 서열의 상이한 형태들 중 임의의 하나를 지칭한다. 이는 암호화 서열, 비 암호화 서열 및 조절 서열을 포함한다. 게놈 내 상이한 대립형질은 뉴클레오티드 서열에 있어 반드시 동일할 필요는 없다.
"항체"란 용어는, 실질적으로 면역글로불린 유전자에 의해 암호화되는 폴리펩티드 하나 이상으로 이루어진 단백질을 지칭한다. 인지된 면역글로불린 유전자는 카파, 람다, 알파, 감마, 델타, 엡실론 및 뮤 불변 영역 유전자뿐 아니라, 다수의 면역글로불린 가변 영역 유전자를 포함한다. "항체" 및 "면역글로불린"이란 용어들은 호환되어 사용되며, 상기 면역글로불린에 대해 명시된 구조적 특징을 가지는 당단백질(이에 한정되는 것은 아님)을 나타내는데 사용된다.
"항체"란 용어는 본원에서 최 광의로 사용되며, 모노클로날 항체(전장 모노클로날 항체 포함), 폴리클로날 항체, 키메라 항체, 인간화 항체, 인간 항체, 다중 특이적 항체(예컨대 이중 특이적 항체), 단일 도메인 항체, 그리고 항체 단편(예컨대 Fv, Fab, Fab´, F(ab)2 또는 항체의 기타 항원 결합 종속서열)을 포함한다. "항체"란 용어는 또한 항체 접합체 및 융합 항체를 포함한다. 전장 "항체" 또는 "면역글로불린"은, 일반적으로 약 150 kDa의 헤테로 4량체 당단백질로서, 동일한 경쇄 2개와 동일한 중쇄 2개로 구성되어 있다. 각각의 경쇄는 하나의 공유 이황화 결합에 의해 중쇄와 결합하는 반면, 이황화 결합의 수는 상이한 면역글로불린 이소타입의 중쇄 간에 상이하다. 각각의 중쇄와 경쇄는 또한 규칙적으로 이격된 사슬내 이황화 결합을 가진다. 각각의 중쇄는 카복시 말단 불변 도메인(CH) 3개가 뒤따르는 아미노 말단 가변 도메인(VH)을 가진다. 각각의 경쇄는 가변 N 말단 도메인(VL)과 단일 C 말단 불변 도메인(CL)을 가진다. "항체"란 용어는 또한 동일한 특이성을 가지고(가변 도메인) 동일한 불변 도메인을 가지는 독립된 항체 다수를 포함하는 항체류를 지칭한다.
"융합 단백질"은 전체 서열, 원래부터 별도로 존재하던 천연 또는 변형 이종 단백질 2개 이상의 서열의 임의의 부분, 또는 전체 서열이나 원래부터 별도로 존재하던 천연 또는 변형 이종 단백질 2개 이상의 서열의 임의의 부분의 조합을 함유하는 단백질로서 정의된다. 융합 단백질은 원래부터 별도로 존재하던 천연 또는 이종 단백질 2개 이상, 또는 이의 일부를 원래 암호화하던 유전자 2개 이상 또는 이의 일부들을 융합함에 의한 유전자 조작 접근법에 의해 구성될 수 있다. 이는, 원래 단백질 각각으로부터 유래하는 기능상의 특성들을 가지는 융합 단백질을 만들어낸다. 융합 단백질은 Fc 융합 단백질을 포함하나, 이에 한정되는 것은 아니다.
"시토카인"이란 용어는, 세포에 의해 방출되어 세포내 조정인자로서 작용하는(예를 들어 분비 세포 주변에 있는 세포의 행동에 영향을 미치는) 소형의 단백질을 지칭한다. 시토카인은 면역 세포 또는 기타 세포, 예컨대 T 세포, B 세포, NK 세포 및 대식세포에 의해 분비될 수 있다. 시토카인은 세포내 신호전달 과정, 예컨대 자가분비 신호전달, 측분비 신호전달 및 내분비 신호전달에 수반될 수 있다. 시토카인은 면역성, 염증 및 조혈을 비롯한(이에 한정되는 것은 아님) 다양한 생물 과정을 매개할 수 있다. 시토카인은 케모카인, 인터페론, 인터루킨, 림포카인 또는 종양 괴사 인자일 수 있다.
본원에 사용된 바와 같은 "성장 인자"란, 세포 성장을 자극할 수 있는 단백질 또는 폴리펩티드를 지칭한다. 성장 인자로서는 인슐린, 표피 성장 인자(EGF), 에프린(Eph), 에리스로포이에틴, 신경교세포 자극 인자(GSF); 콜로니 자극 인자(CSF), 예컨대 대식세포 콜로니 자극 인자(M-CSF), 과립구 대식세포 콜로니 자극 인자(GM-CSF) 및 과립구 콜로니 자극 인자(G-CSF); 줄기 세포 성장 인자(SCGF)(스틸 인자(Steel Factor)라고도 칭하여짐); 기질 세포 유래 인자(SDF), 이의 유효 단편 및 이의 조합; 그리고 혈관 내피 성장 인자(VEGF)를 포함하나, 이에 한정되는 것은 아니다. 기타 성장 인자로서는 간세포 성장 인자(HGF), 안지오포이에틴-1, 안지오포이에틴-2, b-FGF 및 FLT-3 리간드와, 이의 유효 단편을 포함할 수 있다.
본원에 사용된 바와 같은 "발현"이란 용어는, 이종 핵산 서열의 숙주 세포 내 전사 및/또는 번역을 지칭한다. 숙주 세포 내 관심 유전자 생성물의 발현 수준은, 세포 내에 존재하는 대응 RNA의 양, 또는 선택된 서열에 의해 암호화된 폴리펩티드의 양을 기반으로 확정될 수 있다. 예를 들어 선택된 서열로부터 전사된 RNA는 노던 블럿 잡종화, 리보뉴클레아제 RNA 보호, 세포내 RNA에의 현장 잡종화 또는 PCR, 예컨대 qPCR에 의해 정량될 수 있다. 선택된 서열에 의해 암호화된 단백질은 다양한 방법, 예컨대 ELISA, 웨스턴 블럿팅, 방사성면역검정, 면역침전, 단백질의 생물 활성에 대한 검정, 단백질 면역염색 후의 FACS 분석, 또는 동종 시간 해상 형광도(HTRF) 검정에 의해 정량될 수 있다. 비 암호화 RNA, 예컨대 miRNA 또는 shRNA의 발현 수준은 PCR, 예컨대 qPCR에 의해 정량될 수 있다.
"유전자 생성물"이란 용어는, RNA 폴리뉴클레오티드와, 유전자나 DNA 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드 둘 다를 지칭한다.
본원에 사용된 바와 같은 "마커 유전자"란, 세포 내에서 발현될 때 선택 가능하거나 구별 가능한 표현형(예컨대 항생제 내성, 형광 단백질 또는 리포터 유전자의 발현, 변형된 대사)을 세포에 제공하는 폴리뉴클레오티드를 의미한다.
본원에 사용된 바와 같은 "리포터 유전자"는 숙주에 의한 발현이 검출 및 정량될 수 있는 단백질을 암호화하는 폴리뉴클레오티드이다. 그러므로 리포터 발현 수준의 측정치는 통상 숙주 세포 게놈 내 리포터를 암호화하는 유전자(리포터 유전자)의 발현을 유도하는 촉진인자 요소의 활성화 수준을 말해준다. 예를 들어 리포터 유전자는 단백질, 예컨대 활성이 정량될 수 있는 효소, 예컨대 알칼리성 포스파타아제(AP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 레닐라 루시퍼라아제 또는 반딧불이 루시퍼라아제 단백질(들)을 암호화할 수 있다. 리포터는 또한 형광 단백질, 예컨대 녹색 형광 단백질(GFP) 또는 GFP의 재조합 변이체들 중 임의의 것, 예컨대 향상된 GFP(EGFP), 청색 형광 단백질(BFP 및 기타 유도체), 시안색 형광 단백질(CFP 및 기타 유도체), 황색 형광 단백질(YFP 및 기타 유도체), 그리고 적색 형광 단백질(RFP 및 기타 유도체)을 포함한다.
"선택 가능 마커 유전자" 또는 "선택 마커 유전자"는 선택 가능한 마커를 암호화하고, 통상적으로는 배양 배지에 대응 "선택 제제"를 첨가함으로써 이 유전자를 함유하는 세포의 특이적 선택을 허용하는 유전자이다. 예시된 바와 같이, 항생제 내성 유전자가 양성 선택 가능 마커로서 사용될 수 있다. 오로지 이 유전자로 형질전환된 세포만이 대응 항생제의 존재하에 성장할 수 있어서 선택된다. 다른 한편, 형질전환되지 않은 세포는 이러한 선택 조건하에서 성장 또는 생존할 수 없다. 양성, 음성 및 2기능성 선택 가능 마커가 존재한다. 양성 선택 가능 마커는, 선택 제제에 대한 내성을 제공함으로써, 또는 숙주 세포에서의 대사 결함 또는 이화 결함을 보상함으로써, 형질전환된 세포의 선택과 이로 인한 증량을 허용한다. 이와는 반대로, 선택 가능 마커의 유전자를 받은 세포는 음성 선택 가능 마커에 의해 선택적으로 제거될 수 있다. 이의 일례로서는, 세포 내에서 발현될 때 아시클로버 또는 간시클로버가 동시에 첨가되면 사멸하는 단순 포진 바이러스의 티미딘 키나아제 유전자가 있다. 본 발명에 유용한 선택 가능 마커 유전자는 또한 증폭 가능한 선택 가능 마커를 포함한다. 문헌은, 다수의 선택 가능 마커 유전자, 예컨대 2기능성 (양성/음성) 마커(예를 들어 WO 92/08796 및 WO 94/28143 참조)를 기술하고 있다. 본 발명에 유용한 선택 가능 마커의 예들로서는 아미노글리코시드 포스포트랜스퍼라아제(APH), 하이그로마이신 포스포트랜스퍼라아제(HYG), 디하이드로폴레이트 리덕타아제(DHFR), 티미딘 키나아제(TK), 글루타민 신타아제, 아스파라긴 신타아제, 그리고 네오마이신(G418/제네티신), 퓨로마이신, 히스티디놀 D, 블레오마이신, 플레오마이신, 블라스티시딘 및 제오신에 대한 내성을 제공하는 유전자를 포함하나, 이에 한정되는 것은 아니다. 유전자 변형된 돌연변이체 및 변이체, 단편, 기능성 균등물, 유도체, 상동체 및 다른 단백질이나 펩티드와의 융합체도 또한 포함되되, 단 선택 가능 마커는 자체의 선택적 자질을 보유한다. 이러한 유도체는 선택성이 될 운명인 영역 또는 도메인 내 아미노산 서열에 있어 상당 수준의 상동성을 보인다.
선택은 또한, 예를 들어 세포 표면 마커, 세균 β-갈락토시다아제 또는 형광 단백질(예컨대 아에쿠오레아 빅토리아(Aequorea Victoria) 및 레닐라 레니포르미스(Renilla reniformis) 또는 기타 종 유래 녹색 형광 단백질(GFP) 및 이의 변이체; 비 생물발광 종(예컨대 디스코소마(Discosoma) 종, 아네모니아(Anemonia) 종, 클라뷸라리아(Clavularia) 종, 조안투스(Zoanthus) 종) 유래 적색 형광 단백질, 형광 단백질 및 이의 변이체)이 사용되는 형광 활성화 세포 분취(FACS)에 의해 이루어질 수 있다.
"선택 제제" 또는 "선택적 제제"란 용어는, 선택 제제의 효능을 경감시키는 임의의 선택 가능 마커 유전자의 생성물이 세포 내에 존재하지 않을 때, 세포의 성장 또는 생존을 방해하는 성분을 지칭한다. 예를 들어 형질감염된 세포 내에서 APH(아미노글리코시드 포스포트랜스퍼라아제)와 같은 항생제 내성 유전자의 존재에 대한 선택이 이루어지기 위해서 항생제 제네티신(G418)이 사용된다.
"증폭 가능한 선택 가능 마커 유전자"는, 보통 임의의 배양 조건 하에서의 진핵생물 세포 성장에 필요한 효소를 암호화한다. 예를 들어 증폭 가능한 선택 가능 마커 유전자는 디하이드로폴레이트 리덕타아제(DHFR) 또는 글루타민 신타아제(GS)를 암호화할 수 있다. 이러한 경우, 만일 마커 유전자가 형질감염으로 도입된 숙주 세포가 선택 제제 메토트렉세이트(MTX) 또는 메티오닌 설폭시민(MSX) 각각의 존재하에 배양되면, 마커 유전자는 증폭된다. 증폭 가능한 선택 가능 마커 유전자에 결합된 서열(즉 물리적으로 선택 가능 마커 유전자와 가까이에 있는 서열)은 증폭 가능한 선택 가능 마커 유전자와 함께 공동 증폭된다. 상기 공동 증폭된 서열은 동일한 발현 벡터 또는 별도의 벡터에 도입될 수 있다.
하기 표 1은 본 발명에 따라서 사용될 수 있는, 증폭 가능한 선택 가능 마커 유전자와, 이와 연관된 선택 제제의 비제한적 예를 제공한다. 증폭 가능한 선택 가능 마커 유전자로서 적합한 것도 또한 Kaufman에 의하여 개괄적으로 기술되었다[Kaufman RJ, 1990, Methods Enzymol. 185:537-566].
Figure 112020011536631-pct00001
Figure 112020011536631-pct00002
본 발명에 따르면, 증폭 가능한 선택 가능 마커 유전자로서 바람직한 것은, GS 또는 DHFR의 기능을 가지는 폴리펩티드를 암호화하는 유전자이다.
"부위 특이적 리컴비나아제"란 용어는, 특이적인 뉴클레오티드 서열(인지 부위)을 인지하고 나서, 이 부위에서 DNA 백본을 절단하여, 절단된 뉴클레오티드 서열들의 재배열을 수행한 다음, 이 서열들을 재결찰시키는 단백질을 지칭한다. 상기 리컴비나아제는, 예를 들어 인지 부위 쌍과, 이에 뒤 따르는 (절개된 DNA 단편 대신인) 관심 폴리뉴클레오티드 통합 부위 사이의 DNA의 절개를 허용하여, 유전 정보의 정확한 부위 특이적 교환을 제공한다. 몇몇 부위 특이적 리컴비나아제가 당 분야에 공지되어 있다. 예를 들어 Cre 리컴비나아제는 loxP 재조합 부위 또는 헤테로 특이적인 lox511 재조합 부위 중 어느 하나를 인지하는데, 이는 곧 loxP 및 lox511은 서로 재조합되지 않음을 의미한다. Cre/lox 시스템은, 예를 들어 문헌[Odell et al., Plant Physiol. 1994, 106(2), 447-58]에 기술되어 있다. Flp 리컴비나아제는, 예컨대 문헌[Lyznik et al., Nucleic Acids Res. 1996, 24(19), 3784-9]에 기술된 바와 같이 frt 재조합 부위를 인지한다. phiC31 인테그라아제는, 예컨대 문헌[Groth et al., Proc. Natl. Acad. Sci. U. S. A. 2000, 97(11), 5995-6000]에 기술된 바와 같이 부착 부위(att), 예컨대 attB(공여부위) 및 attP(수용부위)를 인지한다. Dre 리컴비나아제는, 예컨대 미국 특허 제7,422,889호에 기술된 바와 같이 rox 부위를 인지한다. 박테리오파아지 람다 유래 Int 리컴비나아제(람다 인테그라아제) 및 이의 재조합 부위는 문헌[Landy, Annu. Rev. Biochem. 1989, 58, 913-49]에 기술되어 있다.
본 발명에 따르면, "서열 특이적 DNA 편집 효소" 또는 "부위 특이적 뉴클레아제"는 한정된 뉴클레오티드 서열(인지 부위)에서 DNA의 절단을 가능하게 하는 단백질이다. 상기 절단은 상보성 DNA 가닥 2개 중 어느 하나 또는 둘다에서 일어날 수 있으므로, 예를 들어 표적화된 돌연변이발생, 특이적 게놈 DNA 서열의 표적화된 결실이 허용되거나, 또는 절단된 표적 DNA와 이종 폴리뉴클레오티의 부위 유도성 재조합이 초래된다. 상기 편집 효소의 서열 특이성은 편집 효소 내 서열 특이적 DNA 결합 단백질 도메인 하나 이상으로부터 기인될 수 있거나, 또는 편집 효소를, 안내 폴리뉴클레오티드에 대해 적어도 부분적 상보성을 보이는 DNA 서열로 안내하는 효소 결합 안내 폴리뉴클레오티드(예컨대 안내 RNA)로부터 기인될 수 있다. 따라서 상기 편집 효소의 인지 부위는 DNA 결합 단백질 도메인을 조작하거나, 대안적 안내 폴리뉴클레오티드를 사용함으로써 변경될 수 있다. 다수의 서열 특이적 DNA 편집 효소는 당 분야에 공지되어 있으며, 이의 비제한적 예들로서는 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제가 있다.
본 특허에서 사용된 바와 같은 "안정적인 통합" 또는 "안정적으로 통합된"이란 용어는, 폴리뉴클레오티드가 숙주 세포의 게놈 DNA로부터 분리된 채 유지되는 일시적 도입과는 반대로, 이종 폴리뉴클레오티드가 숙주 세포 게놈에 도입되는 것을 지칭한다. 적합한 통합은 상동성 재조합 또는 기타 유형의 재조합에 의해 일어날 수 있다. 안정적인 통합은 이종 폴리뉴클레오티드를 숙주 세포에 일시적으로 도입하는 단계를 포함할 수 있다.
적어도 하나의 이종 폴리뉴클레오티드의, S100A 유전자 클러스터로의 안정적 통합
본 발명은 이종 폴리뉴클레오티드 적어도 하나가 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되어 포함된, CHO 세포에 관한 것인데, 단 (a) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류(상류 게놈 표적 영역이라 지칭됨)이고/이거나; (b) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류(하류 게놈 표적 영역이라 지칭됨)이다.
S100A3/A4/A5/A6 주 유전자 클러스터란, S100 칼슘 결합 단백질 A3(S100A3), S100 칼슘 결합 단백질 A4(S100A4), S100 칼슘 결합 단백질 A5(S100A5) 및 S100 칼슘 결합 단백질 A6(S100A6)을 암호화하는 중국 햄스터 유전자들을 이 순서대로 포함하는 게놈 영역, 즉 (서열 번호 4의 서열 또는 이의 상동체에 대응하는 CHO-K1 세포주의 전체 게놈 샷건 서열(NCBI 참조 서열: NW_003613854.1,)인 크리세튤러스 그리세우스 열외 게놈 스캐폴드, CriGri_1.0 스캐폴드682의 1,782,882번 내지 1,810,338번에 대응하는) S100A3에서 시작되어 S100A6으로 끝나는 영역을 지칭한다. S100A3/A4/A5/A6 주 유전자 클러스터의 게놈 표적 영역 상류란, 서열 번호 1의 서열에 대응하는 게놈 영역을 지칭한다. S100A3/A4/A5/A6 주 유전자 클러스터의 게놈 표적 영역 하류는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 영역을 지칭한다.
일 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 바람직하게는 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 더욱 바람직하게 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하는 상류 게놈 표적 영역 에 안정적으로 통합된다.
또 다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 바람직하게 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 더욱 바람직하게는 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는 하류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 상기 개시된 바와 같이 상류 게놈 표적 영역과, 하류 게놈 표적 영역에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나가 상류 게놈 표적 영역에 통합되고, 이종 폴리뉴클레오티드 적어도 하나가 하류 게놈 표적 영역에 안정적으로 통합된 경우, 게놈 표적 영역은 동일하거나 상이할 수 있다.
당업자는, 하나의 이종 폴리뉴클레오티드 또는 2개 이상의 상이한 이종 폴리뉴클레오티드의 복사체 하나, 복사체 다수 개가 상류 게놈 표적 영역, 하류 게놈 표적 영역, 또는 상류 게놈 표적 영역과 하류 게놈 표적 영역에 안정적으로 통합될 수 있음을 이해할 것이다.
적어도 하나의 이종 폴리뉴클레오티드는 게놈 표적 영역(들)의 대립형질 중 하나 또는 두 개에 안정적으로 통합될 수 있다.
다른 양태에서, 본 발명은 (a) CHO 세포를 제공하는 단계; (b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고, (i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]를 포함하는, CHO 세포를 제조하기 위한 방법에 관한 것이다.
일 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 바람직하게는 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하는 상류 게놈 표적 영역, 더욱 바람직하게 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하는 상류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 바람직하게 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는 하류 게놈 표적 영역, 더욱 바람직하게는 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는 하류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드는 서열 번호 1의 서열 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류이다.
일 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 상류 게놈 표적 영역; 바람직하게는 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 상류 게놈 표적 영역; 더욱 바람직하게 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 상류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 적어도 하나의 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12.000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 하류 게놈 표적 영역; 바람직하게 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 하류 게놈 표적 영역; 더욱 바람직하게는 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드 서열, 또는 이에 대해 적어도 80%의 상동성을 보이는 서열을 가지는 하류 게놈 표적 영역에 안정적으로 통합된다.
다른 구현예에서, 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드는 상기 개시된 바와 같은 상류 게놈 표적 영역과 하류 게놈 표적 영역에 안정적으로 통합된다. 이종 폴리뉴클레오티드 적어도 하나가 상류 게놈 표적 영역에 통합되고, 이종 폴리뉴클레오티드 적어도 하나가 하류 게놈 표적 영역에 안정적으로 통합된 경우, 게놈 표적 영역은 동일하거나 상이할 수 있다.
당 업자는, 하나의 이종 폴리뉴클레오티드 또는 2개 이상의 상이한 이종 폴리뉴클레오티드의 복사체 하나, 복사체 다수 개가 상류 게놈 표적 영역, 하류 게놈 표적 영역, 또는 상류 게놈 표적 영역과 하류 게놈 표적 영역에 안정적으로 통합될 수 있음을 이해할 것이다.
적어도 하나의 이종 폴리뉴클레오티드는 게놈 표적 영역(들)의 대립형질 중 하나 또는 두 개에 안정적으로 통합될 수 있다.
안정적 통합을 위한 방법은 당 분야에 널리 공지되어 있다, 요약하면, 안정적 통합은 보통 적어도 하나의 이종 폴리뉴클레오티드, 또는 적어도 하나의 이종 폴리뉴클레오티드를 함유하는 벡터, 즉 상기 이종 폴리뉴클레오티드(들)가 CHO 세포 게놈에 안정적으로 통합되는 것을 촉진하는 벡터를 CHO 숙주 세포에 일시적으로 도입함으로써 달성된다. 통상적으로 이종 폴리뉴클레오티드에는 상동성 팔, 즉 통합 부위에 대해 상류 및 하류인 영역에 상동성인 서열이 측접하고 있다. 이종 폴리뉴클레오티드를 본 발명의 CHO 세포에 도입하기 위한 벡터는 매우 다양한 벡터 시스템으로서 적합한 것, 예컨대 플라스미드, 레트로바이러스, 코스미드 및 EBV 유래 에피좀 등으로부터 선택될 수 있다. 다양한 셔틀 벡터, 예컨대 이.콜라이(E. coli)와 슈도모나스(Pseudomonas) 종과 같은 숙주 미생물 다수에서 자가복제할 수 있는 벡터가 사용될 수 있다. 원형 벡터가 CHO 숙주 세포에 도입되기 전, 이 벡터는 선형화되는 관계로 CHO 세포 게놈에의 통합이 촉진될 수 있다. 벡터를 CHO 세포에 도입하기 위한 방법은 당 분야에 널리 공지되어 있으며, 생물학적 방법에 의한 형질감염, 예컨대 바이러스 전달; 화학적 방법, 예컨대 양이온 중합체, 인산칼슘, 양이온 지질 또는 양이온 아미노산을 이용하는 방법; 물리적 방법, 예컨대 전기천공 또는 미세주입; 또는 혼합 접근법, 예컨대 원형질체 융합을 포함한다.
재조합 세포의 동정 또는 선택을 가능하게 하기 위해, 적어도 하나의 이종 폴리뉴클레오티드는, 바람직하게 동일 벡터상에 존재하는 선택 마커 유전자 또는 리포터 유전자와 함께 통합될 수 있다. 뿐 아니라 벡터는 종종 상동성 팔의 바깥쪽에 무작위 통합의 동정을 허용하는 마커를 포함한다.
일 구현예에서, 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드는 발현 카세트의 일부이다. 발현 카세트에는 유전자 생성물, 예컨대 RNA 및/또는 단백질을 암호화하는 이종 폴리뉴클레오티드 적어도 하나가 촉진인자에 작동 가능하도록 결합된 채 포함되어 있으며, 선택적으로 유전자 생성물(들)의 발현을 제어하는 추가의 수단을 포함한다. 이러한 수단으로서는 인핸서, 종결 신호, 폴리아데닐화 신호 및 3' 미번역 영역(통상적으로 폴리아데닐화 부위 함유)을 포함하나, 이에 한정되는 것은 아니다. 촉진인자는 약한 촉진인자이거나, 또는 관심 유전자 생성물의 높은 수준의 발현을 지원하는 강한 촉진인자일 수 있다. 상기 촉진인자로서는 CMV(거대세포바이러스) 촉진인자, SV40(유인원 액포형성 바이러스 40) 촉진인자, RSV(루 육종 바이러스) 촉진인자, 아데노바이러스 촉진인자(예컨대 아데노바이러스 주 후기 촉진인자(Adenovirus major late promoter; AdMLP), CHEF-1(CHO 유래 연장 인자-1) 촉진인자, 폴리오마 및 강한 포유류 촉진인자, 예컨대 원산 면역글로불린 및 액틴 촉진인자, 또는 이종 폴리뉴클레오티드 적어도 하나의 천연 촉진인자를 포함하나, 이에 한정되는 것은 아니다. 촉진인자는, 바람직하게 CMV 촉진인자 또는 SV40 촉진인자이고, 가장 바람직하게는 CMV 촉진인자이다. 폴리아데닐화 신호에 대한 예들로서는 BGH 폴리A, SV40 후기 또는 초기 폴리A가 있으며; 대안적으로, 면역글로불린 유전자의 3'UTR 등이 사용될 수 있다. 당 업자는 또한 3' 미번역 영역은, 예컨대 불안정 요소, 예컨대 ARE(아데닐레이트-우리딜레이트 풍부 요소; Adenylate-uridylate Rich Element)를 제거함으로써 높은 수준의 발현을 지원하도록 조작될 수 있음을 이해할 것이다.
몇몇 구현예들에서, 유전자 생성물은 증폭 가능한 유전자 선택 마커, 예컨대 디하이드로폴레이트 리덕타아제(DHFR), 글루타민 신타아제(GS)의 제어하에 놓일 수 있다. 증폭 가능한 선택 마커 유전자는 분비형 치료 단백질 발현 카세트로서 동일한 발현 벡터상에 존재할 수 있다. 대안적으로 증폭 가능한 선택 마커 유전자와 분비형 치료 단백질 발현 카세트는 상이한 발현 벡터상에 존재할 수 있되, 다만 이 경우에는 숙주 세포 게놈의 매우 가까이에 통합될 수 있다. 예를 들어 동시에 공동 형질감염되는 벡터 2개 이상은 종종 숙주 세포 게놈의 매우 가까이에 통합된다. 그 다음, 분비형 치료 단백질 발현 카세트를 함유하는 유전자 영역의 증폭은 증폭 제제(예컨대 DHFR에 대해서는 MTX, 또는 GS에 대해서는 MSX)를 배양 배지에 첨가함으로써 매개된다.
숙주 세포 또는 생산자 세포 내 유전자 생성물의 충분히 안정적으로 높은 수준은, 예컨대 이종 폴리뉴클레오티드 복사체 다수 개를 발현 벡터에 클로닝함으로써 달성될 수 있다. 전술된 바와 같이, 이종 폴리뉴클레오티드 복사체 다수 개를 발현 벡터에 클로닝하는 것과, 분비형 치료 단백질 발현 카세트를 증폭하는 것도 또한 조합될 수 있다.
관심 유전자 생성물을 암호화하는 이종 폴리뉴클레오티드 적어도 하나는 전장 또는 절단형 유전자, 융합 또는 태깅(tagging)된 유전자를 포함할 수 있고, cDNA, 게놈 DNA 또는 DNA 단편일 수 있으며, 바람직하게는 cDNA이다. 이는, 원산 서열, 즉 자연 발생 형태(들)를 포함할 수 있거나, 또는 원하는 바대로 돌연변이 또는 변형될 수 있다. 이러한 변형으로서는, 선택된 숙주 세포내 코돈 선호도를 최적화하는 코돈 최적화, 인간화, 융합 또는 태깅을 포함한다. 당업자는, 만일 하나를 초과하는 이종 폴리뉴클레오티드가 본 발명의 CHO 세포의 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합되면, 이 이종 폴리뉴클레오티드는 하나를 초과하는 발현 카세트에 의해 암호화될 수 있거나, 또는 예컨대 IRES(내부 리보좀 도입 부위) 서열로 격리된, 동일한 발현 카세트의 일부가 될 수 있음을 이해할 것이다.
다른 구현예에서, 이종 폴리뉴클레오티드는 관심 단백질 적어도 하나 및/또는 관심 RNA 적어도 하나를 암호화한다. 관심 RNA로서는 메신저 RNA(mRNA) 및 소형 조절 RNA, 예컨대 마이크로RNA(miRNA) 또는 소형 헤어핀 RNA(shRNA)를 포함하나, 이에 한정되는 것은 아니다. 바람직하게 관심 RNA는 mRNA, miRNA 또는 shRNA로 이루어진 군으로부터 선택되며, 더욱 바람직하게는 mRNA 또는 shRNA이다. 소형 조절 RNA는, (a) 숙주 세포 단백질(들)을 암호화하는 mRNA 내 표적 영역(들)에 결합함으로써 상기 숙주 세포 단백질(들) 하나 이상의 발현을 방해할 수 있다.
당업자는, 이종 폴리뉴클레오티드에 의해 암호화된 소형 조절 RNA는 숙주 세포 내에서 유관 과정, 예컨대 영양소 대사, 영양소 흡수, 전사, 번역, 단백질 폴딩(folding), 폴딩되지 않은 단백질 반응, 세포자살, 세포간 또는 세포내 신호전달, 세포 주기 제어, 세포 성장 또는 단백질 분비를 방해하는데 사용될 수 있음을 이해할 것이다. 따라서 본 발명은 CHO 숙주 세포를 조작함으로써, 세포 배양 또는 단백질 제조에 있어 이 CHO 숙주 세포의 특징을 개선하는데 유리하게 사용될 수 있다.
관심 RNA 및/또는 관심 단백질은 구성적으로 발현될 수 있거나 조건부로 발현될 수 있다. 예를 들어 관심 RNA 또는 관심 단백질의 발현은 성장 단계 동안 침묵되어 있다가, 단백질 제조 단계 동안 가동될 수 있다.
본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조 또는 사용되는 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나에 의해 암호화되는 관심 단백질은, 항체, 융합 단백질, 시토카인 또는 성장 인자, 림포카인, 부착 분자, 수용체, 그리고 이것들의 유도체나 단편, 그리고 효현제 또는 길항제로서 사용될 수 있으며/있거나 치료의 용도 또는 진단의 용도를 가지는 임의의 기타 폴리펩티드로 이루어진 군으로부터 선택되는 치료 단백질일 수 있다. 바람직하게 치료 단백질은 분비형 치료 단백질이다. 이종 폴리뉴클레오티드에 의해 암호화된 치료 단백질은 재조합 단백질, 바람직하게 분비형 재조합 단백질일 수 있다. 바람직하게 치료 단백질은 항체, 융합 단백질, 시토카인 또는 성장 인자로 이루어진 군으로부터 선택되고, 바람직하게는 항체 또는 융합 단백질이며, 가장 바람직하게는 항체이다. 다량체 단백질, 예컨대 항체는 하나 이상의 이종 폴리뉴클레오티드에 의해 하나 이상의 발현 카세트(들)의 일부로서 암호화될 수 있다.
당업자는, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조되는 CHO 세포의 게놈에 안정적으로 통합된 폴리뉴클레오티드 적어도 하나가 관심 RNA 적어도 하나와 관심 단백질 적어도 하나 두 가지를 암호화하여, 유리하게 CHO 세포 내 유관 과정들의 상기와 같은 변형과, 관심 이종 단백질의 발현을 조합함으로써 높은 수준 및/또는 안정적인 단백질 발현, 높은 수준 및/또는 안정적인 단백질 분비, 및/또는 특정의 양과 품질을 보이는 번역후 단백질 변형(들)을 촉진할 수 있음을 이해할 것이다.
다른 구현예에서, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조되는 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나는 마커 유전자이다. 이러한 마커 유전자는 재조합 세포와 비 재조합 세포의 구별 및/또는 관심 유전자 생성물의 발현 수준 정량을 가능하게 하는 임의의 유전자일 수 있다. 마커 유전자는 리포터 유전자 또는 선택 마커 유전자일 수 있다. 선택 마커는 이용된 CHO 숙주 세포의 대사 결함, 예컨대 글루타민 신타아제(GS) 결핍을 보상할 수 있다. 리포터 유전자는 알칼리성 포스파타아제(AP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 레닐라 루시퍼라아제 또는 반딧불이 루시퍼라아제 단백질(들)일 수 있다. 리포터 유전자는 또한 형광 단백질, 예컨대 녹색 형광 단백질(GFP) 또는 GFP의 재조합 변이체들 중 임의의 것, 예컨대 향상된 GFP(EGFP), 청색 형광 단백질(BFP 및 기타 유도체), 시안색 형광 단백질(CFP 및 기타 유도체), 황색 형광 단백질(YFP 및 기타 유도체), 그리고 적색 형광 단백질(RFP 및 기타 유도체)을 암호화하는 유전자를 포함한다. 바람직한 구현예에서, 리포터 유전자는 형광 단백질, 예컨대 GFP 또는 EGFP일 수 있다. 선택 마커는 또한 항생제 내성 유전자 또는 대사 마커 유전자, 예컨대 아미노글리코시드 포스포트랜스퍼라아제(APH), 하이그로마이신 포스포트랜스퍼라아제(HYG), 디하이드로폴레이트 리덕타아제(DHFR), 티미딘 키나아제(TK), 글루타민 신타아제, 아스파라긴 신타아제, 그리고 네오마이신(G418/제네티신), 퓨로마이신, 히스티디놀 D, 블레오마이신, 플레오마이신, 블라스티시딘 및 제오신에 대한 내성을 제공하는 유전자일 수 있다. 바람직한 구현예에서, 선택 마커 유전자는 디하이드로폴레이트 리덕타아제(DHFR) 또는 글루타민 신타아제(GS)이다.
몇몇 구현예에서, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조 또는 사용되는 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나는 발현 카세트의 일부이다. 바람직하게 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소, 예컨대 특이적 뉴클레아제에 대한 인지 부위(인지 서열)가 측접하고 있다. 더욱 바람직하게 발현 카세트에는 부위 특이적 리컴비나아제에 대한 인지 부위가 측접하고 있다. 부위 특이적 리컴비나아제는 당 분야에 널리 공지되어 있으며, 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp 또는 이것들의 임의의 유도체를 포함하나, 이에 한정되는 것은 아니다. 그러므로 발현 카세트에는 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp 또는 이것들의 임의의 유도체에 대한 인지 부위가 측접할 수 있다. 부위 특이적 뉴클레아제는 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제를 포함하나, 이에 한정되는 것은 아니다. 부위 특이적 뉴클레아제는 CHO 세포 게놈 내 표적 서열에 특이적으로 결합하도록 조작될 수 있음은 당 분야에 널리 공지되어 있다. 이는, 상기 인지 부위에 의해 막혀있는 발현 카세트 내 DNA 분절들의 표적화 교환을 촉진한다. 이종 폴리뉴클레오티드의 숙주 세포 게놈으로의 표적화된 통합을 도모함에 있어 부위 특이적 리컴비나아제 또는 부위 특이적 뉴클레아제의 사용은 일상적으로 수행되고 있으며, 각각의 방법은 당 분야에 널리 공지되어 있다. 몇몇 구현예에서, 부위 특이적 리컴비나아제 또는 부위 특이적 뉴클레아제에 대한 인지 부위를 포함하는 발현 카세트는 한정된 게놈 표적 영역의 재표적화를 허용할 수 있으며, 그 결과 다수의 유전자 생성물, 예컨대 관심 RNA 또는 관심 단백질에 대한 제조용 CHO 세포 다수가 생성될 수 있다.
특정의 구현예에서, 본 발명의 CHO 세포 게놈 또는 본 발명의 방법에 의해 제조된 CHO 세포의 게놈에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나는 마커 유전자이고, 마커 유전자는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되며, 발현 카세트에는 전술된 바와 같이 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제), 바람직하게 부위 특이적 리컴비나아제에 대한 인지 부위가 측접하고 있다. 이는, 마커 유전자를 포함하는 발현 카세트가, 관심 RNA 또는 치료 단백질을 암호화하는 이종 폴리뉴클레오티드를 포함하는 발현 카세트에 대항하여 용이하게 교환되도록 허용한다. 이처럼 관심 단백질을 암호화하는 이종 폴리뉴클레오티드를 포함하는 발현 카세트에 대항하여 용이하게 교환될 수 있는 마커 유전자를 암호화하는 치환 DNA는 또한 본원에서 "랜딩 패드"라 지칭된다.
일 구현예에서, 본 발명에 따른 CHO 세포의 제조를 위한 방법은 (a) CHO 세포를 제공하는 단계; (aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고, (i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나; (ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및 (b) 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계를 포함한다. 바람직하게 제2 이종 폴리뉴클레오티드는 RNA 또는 치료 단백질, 바람직하게는 치료 단백질, 더욱 바람직하게는 분비형 관심 단백질을 암호화한다.
상기 제1 이종 폴리뉴클레오티드는, 바람직하게 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자를 암호화한다. 특정의 구현예에서, 리포터 유전자는 형광 단백질, 예컨대 GFP일 수 있다. 선택 마커는 디하이드로폴레이트 리덕타아제(DHFR) 또는 글루타민 신타아제(GS)일 수 있다. 리포터 유전자 및 선택 마커 유전자도 또한 조합될 수 있다.
바람직하게 상기 제1 이종 폴리뉴클레오티드는 부위 특이적 뉴클레아제, 더욱 바람직하게 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제의 군으로부터 선택되는 부위 특이적 뉴클레아제, 더욱더 바람직하게는 아연 핑거 뉴클레아제(ZFN), 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 또는 CRISPR 연관 뉴클레아제가 사용되는 표적화 통합에 의해 통합된다.
상기 제1 이종 폴리뉴클레오티드는 또한 부위 특이적 리컴비나아제의 인지 부위가 측접하고 있는 발현 카세트의 일부일 수 있다. 바람직하게 이는 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제에 대한 인지 부위를 포함한다.
또한 제2의 이종 폴리뉴클레오티드를 포함하는 발현 카세트는, 상기 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 치환함으로써 CHO 세포에 도입될 수 있다. 바람직하게 상기 제2의 이종 폴리뉴클레오티드는 적어도 하나의 RNA 및/또는 적어도 하나의 단백질을 암호화한다. 더욱 바람직하게 제2의 이종 폴리뉴클레오티드는 mRNA, miRNA 또는 shRNA 및/또는 치료 단백질을 암호화한다. 제2 이종 폴리뉴클레오티드를 포함하는 상기 발현 카세트는 표적화된 통합, 바람직하게 부위 특이적 뉴클레아제 또는 부위 특이적 리컴비나아제의 사용, 더욱 바람직하게 부위 특이적 리컴비나아제의 사용, 가장 바람직하게 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제의 사용을 통해 CHO 세포 게놈에 안정적으로 도입될 수 있다.
바람직한 구현예에서, CHO 세포의 제조를 위한 방법은, 부위 특이적 리컴비나아제에 대한 인지 부위와 마커 유전자를 포함하는 제1 이종 폴리뉴클레오티를 포함하는 발현 카세트를 도입하는 단계[단 상기 제1 폴리뉴클레오티드는 부위 특이적 뉴클레아제가 사용되는 표적화 통합에 의해 CHO 세포 게놈에 안정적으로 통합됨]를 포함한다. 또한 제1 이종 폴리뉴클레오티드를 포함하는 상기 발현 카세트는, 부위 특이적 리컴비나아제가 사용되는 표적화 통합을 통하여 관심 RNA 및/또는 관심 단백질을 암호화하는 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트에 의해 치환된다. 바람직한 구현예에서, 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트와, 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트에는 부위 특이적 리컴비나아제에 대한 동일 인지 부위가 측접하고 있다.
당업자는 이러한 방법이, 용이하게 적용 가능한 DNA 제조합 방법에 의해 관심 유전자 생성물의 안정적이고 높은 수준의 발현을 지원하는 게놈 좌위 내에 임의의 이종 폴리뉴클레오티드를 도입하기 위하여 재차 표적화될 수 있는 게놈 표적 부위를 포함하는 CHO 세포를 제공함을 이해할 것이다. 이는, 세포주 개발 과정에서 제조용 CHO 세포 클론을 생성 및 동정하는 것과 관련하여 시간과 비용을 엄청나게 줄여줄 수 있다.
CHO 세포
본 발명의 CHO 세포 또는 본 발명의 방법에 의해 제조된 CHO 세포는 배양액중에서 성장할 수 있고, 관심 RNA 또는 관심 단백질을 발현할 수 있는 임의의 중국 햄스터 난소 세포일 수 있다. 대규모의 산업적 제조에 보통 사용되는 CHO 세포는 종종 제조 과정에서 자체의 특징을 개선하거나, 또는 재조합 세포의 선택을 촉진하도록 조작된다. 이러한 조작으로서는 세포자살 내성 증가, 자가포식 감소, 세포 증식 증가, 세포주기 조절 단백질 발현의 변경, 샤페론 조작, 폴딩되지 않은 단백질 반응(UPR)의 조작, 분비 경로의 조작 및 대사 조작을 포함하나, 이에 한정되는 것은 아니다.
바람직하게 효율적인 세포주 개발 방법의 실현을 허용하는 CHO 세포는, 예컨대 메티오닌 설폭시민(MSX) 또는 메토트렉세이트 각각에 의한 선택이 촉진되도록 글루타민 신타아제(GS) 녹아웃 및/또는 디하이드로폴레이트 리덕타아제(DHFR) 녹아웃을 통해 대사 조작된다.
바람직하게 본 발명의 CHO 세포 또는 본 발명의 방법에 이해 제조된 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS) 결핍 세포 또는 이 세포들 중 임의의 것의 유도체이다.
Figure 112020011536631-pct00003
CHO 세포는, 이것이 무혈청 조건하에서, 그리고 선택적으로는 동물 기원의 임의의 단백질/펩티드가 존재하지 않는 배지 중에서 확립, 적응 및 완전 배양될 때가 가장 바람직하다. Ham F12 배지(Sigma, Deisenhofen, Germany), RPMI-1640 배지(Sigma), Dulbecco 개질 Eagle 배지(DMEM; Sigma), 최소 필수 배지(MEM; Sigma), Iscove 개질 Dulbecco 배지(IMDM; Sigma), CD-CHO 배지(Invitrogen, Carlsbad, CA), 무혈청 CHO 배지(Sigma), 그리고 무 단백질 CHO 배지(Sigma)와 같은 시판중인 배지는 적당한 영양 용액의 예들이다. 배지 중 임의의 것은 필요에 따라 다양한 화합물이 보충될 수 있는데, 이러한 화합물의 비제한적 예로서는 재조합 호르몬 및/또는 기타 재조합 성장 인자(예컨대 인슐린, 트랜스페린, 표피 성장 인자, 인슐린 유사 성장 인자), 염(예컨대 염화나트륨, 인산칼슘, 인산마그네슘), 완충제(예컨대 HEPES), 뉴클레오시드(예컨대 아데노신, 티미딘), 글루타민, 글루코스 또는 기타 동등한 에너지원, 항생제 및 미량 원소가 있다. 기타 임의의 필요 보충물이 또한 당 업자에게 공지된 적당한 농도만큼 포함될 수 있다. 유전적으로 변형된 세포로서, 선택 가능한 유전자를 발현하는 세포의 성장과 선택을 위해, 적합한 선택 제제가 배양 배지에 첨가된다.
단백질 제조
일 구현예에서, 본 발명의 CHO 세포 또는 본 발명의 방법에 의해 제조된 CHO 세포는 관심 단백질의 제조를 위해 사용될 것이다. 관심 단백질은, 숙주 세포 내에서 항체 분자의 발현이 허용되기에 충분한 기간 동안 본 발명의 CHO 세포를 배양함으로써 제조된다. 관심 단백질은 발현 후 수집되고, 정제될 수 있다. 바람직하게 관심 단백질은 당 분야에 널리 공지된 기법이 사용되어 배양 배지로부터 분비형 단백질로서 회수되어 정제된다.
예를 들자면, 최신 기술의 정제 방법으로서, 본 발명의 분비형 재조합 치료 단백질의 수득에 유용한 정제 방법은, 제1 단계로서 배양 배지 또는 용해물로부터 세포 및/또는 미립자형 세포 파편을 분리하는 단계를 포함한다. 그 다음, 분비형 치료 단백질은, 예를 들어 면역친화성 또는 이온교환 컬럼상에서의 분획화, 에탄올 침전, 역상 HPLC, Sephadex 크로마토그래피, 실리카 또는 양이온 교환 수지상 크로마토그래피에 의해 가용성 오염 단백질, 폴리펩티드 및 핵산으로부터 정제된다. 항체 또는 Fc 융합 단백질은, 예컨대 단백질 A 스핀 컬럼(GE Healthcare)이 사용되는, 예컨대 표준 단백질 A 크로마토그래피에 의해 정제될 수 있다. 단백질의 순도는 환원성 SDS PAGE에 의해 확증될 수 있으며, 단백질 농도는 280 nm에서의 흡광도 측정과, 단백질의 비 흡광 계수(specific extinction coefficient)를 이용함으로써 확정될 수 있다. 마지막으로, 정제된 분비형 재조합 치료 단백질은 건조, 예컨대 동결건조될 수 있다.
일 구현예에서, 본 발명의 CHO 세포는 관심 단백질을 높은 수율로 제조하는데 사용된다. 이러한 높은 수율의 제조는 높은 세포 밀도 또는 높은 세포 생존률을 통해 달성될 수 있다. 높은 수율의 제조는 또한 높은 비 세포 생산성을 통해 달성될 수 있다. 그러나 당업자는, 비 세포 생산성이 실질적으로 영향을 받지 않거나 심지어 개선되지 않는 경우, 높은 세포 밀도 또는 세포 생존률 달성은 오로지 관심 단백질의 높은 총 수율을 지원할 뿐임을 이해할 것이다. 유사하게, 세포 밀도 또는 세포 생존률이 실질적으로 영향을 받지 않거나 심지어 개선되지 않는 경우, 높은 비 세포 생산성 달성은 오로지 분비형 재조합 치료 단백질의 높은 총 수율을 지원할 뿐임을 이해할 것이다. 그러므로 높은 수율의 제조란, 통상 농도(역가)(예컨대 mg/mL)로서 측정되는, 세포 배양액의 전체 생산성을 높은 정도로 달성하는 것을 지칭한다. 본 발명에 따른 관심 단백질의 제조는, 만일 대조군 CHO 세포, 즉 게놈에 무작위로 통합된 동일 이종 폴리뉴클레오티드들을 포함하는 CHO 세포, 바람직하게는 클론 선택이 이루어지지 않은 CHO 세포 풀의 단백질 제조에 비하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 75%, 적어도 100% 또는 적어도 200%까지 향상되면, 증가한 것이다.
실시예
통합 좌위는 유전자 발현 데이터를 평가하여 동정하였다. 칼슘 결합 단백질을 암호화하는 유전자 S100A6은 모든 실험 조건을 통틀어서 높은 수준으로 발현되는 것이 파악되었으므로, 높은 이종 단백질 발현을 지원하는 게놈 좌위에 대한 마커로서 사용할 수 있다. S100A6은 S100 유전자 클러스터의 일부이므로; 전체 클러스터를 평가하였다.
세포 선택 및 유지
활성 DHFR 카세트에 의한 보완에 앞서서 CHO-DG44 세포의 일상적인 계대배양을 위해 상표가 등록된 배지를 사용하였다. 선택 배지를 포함하는 MTX는, DHFR 발현 카세트 통합이 이루어진 세포를 증량시키기 위해 형질감염 이후에 사용하였다. CHOZN GS 세포주의 경우, 850 mg/l의 L-Gln(6 mM)이 보충된 시판 배지 CD Fusion(Sigma Aldrich)을 사용하였다. TPP 진탕용 튜브에서 세포주를 계대배양하였다[1주일마다 2-2-3(CHO-DG44) 계대배양 계획에서는 0.3e6개 세포/ml만큼, 또는 1주일마다 2-2(CHOZN GS-/-) 계대배양 계획에서는 0.6e6개 세포/ml만큼]. 배양액을 대상으로 자동화 Vicell 기기로 계수하였다.
풀 모두를 대상으로, 하이포잔틴 티미딘(HT) 보충물을 CHO-DG44 세포주(DHFR-/-)로부터 제거하거나, 또는 L-Gln을 CHOZN GS 세포주(GS-/-)로부터 제거하여 대사 선택을 수행하였다. 형질감염 과정 이후, DHFR 또는 GS 공여체를 수용하지 않았던 부모 세포에 대항하여 선택하기 위한 선택을 실시하였다. 선택 과정을 거친 풀을 선택 배지에 영구적으로 유지시켰다. 선택을 수행할 때, 세포를 T75 고정형 플라스크에 1 ml당 0.4e6개 세포만큼 접종하였다(총 부피: 10 ml ~ 12 ml). 전체 플라스크 내용물을 스핀 다운(spin-down)시키고, 동일 부피의 새로운 배지 중에 세포를 재현탁함으로써, 선택 배지를 보통 7일 후에 바꾸어주었다. 선택된 세포가 "회수"되어 성장을 재개하게 되면, 적당히 이 세포의 규모를 키워 TPP 튜브에 옮겼다. 성능 평가를 진행하기에 앞서 세포를 유가식으로 선택 배지 중에 영구적으로 유지시켰다.
표적화 통합을 위한 ZFN 기법
SAFC로부터 시판되고 있는 CompoZr 아연 핑거 뉴클레아제(ZFN)를 검정 지침에 따라 표적화 통합을 위해 사용하였다. 각각의 ZFN을, 제공된 표적 서열(예컨대 서열 번호 11의 서열)(ZFN 13) 각각의 정보를 바탕으로 SAFC에 주문 제작을 의뢰하여 제조하였다.
ZFN 뉴클레오티드 서열은 각각의 ZFN 팔에 고유하였고, FokI 도메인에 결합하였다. ZNF 팔을 암호화하는 DNA를 pVAX 플라스미드 백본에 클로닝하였다. 이 플라스미드는 번역이 이루어지는 동안 분리를 위한 2A 펩티드가 결합된, ZFN 서열의 GFP 또는 RFP 리포터 카세트 상류를 함유하였다. ZFN 팔은 mRNA로서 형질감염시켰다. ZFN을 암호화하였던 DNA의, RNA로의 시험관 내 전사를 위해, 제조자의 지침에 따라 mMessage mMachine T7 Ultra 키트(Ambion)를 사용하였다. 즉 형질감염을 위해 사용된 mRNA 2개 중, 하나는 서열(예컨대 ZNF13)에 특이적인 ZNF 팔을 암호화하였고, GFP와 또 다른 하나는 상보성 서열을 표적화하는 ZNF 팔을 암호화하였으며, ZFN 팔의 형질감염과 함께 RFP. GFP 또는 RFP를 발현시켜, 형질감염시킨 풀의 신속하고 용이한 증량을 유세포 분석법에 의해 허용하였다. ZFN 팔 둘 다를 수용하였던 세포는 GFP와 RFP에 양성이었다. 이러한 이중 양성 세포를 수집하여 ZFN 활성에 대해 증량된 풀을 구축하였다.
형질감염 프로토콜
형질감염을 위해, Bio-Rad Gene Pulser를 사용하여 전기천공을 실시하였다. 2 mm 큐벳 내 1e6개 세포를, 총 DNA 및/또는 mRNA 약 20 ug을 사용하여 형질감염시켰다(설정조건: 115V, 950uF, 저항 무한대). ZFN은 항상 mRNA로서 형질감염되었으며, 관심 단백질을 함유하는 공여 플라스미드는 DNA로서 형질감염되었다. 동일한 배지 중에서 세포를 형질감염시킨 후 배양하였다. 형질감염 후 세포를 2주 ~ 3주 동안 배양하여, 그 어떤 일시적 플라스미드도 남지 않도록 씻어낼 수 있었다.
세포 검정 - ZFN 활성
세포 내 ZFN의 절단 효율을 측정하기 위해, CEL-I 또는 SURVEYOR 뉴클레아제 검정을 실시하였다. 요약하면, 형질감염시킨 풀로부터 정제한 게놈 DNA를 주형으로 사용하여 표적 영역을 PCR 증폭하였다. 활성 ZFN 존재하에 게놈 DNA를 야생형 및 NHEJ 생성물(표적 부위에서의 삽입 또는 결실)의 혼합물로 전환하였다. PCR 생성물을 고온에서 변성시키고 나서, 이 온도를 점진적으로 낮추어 잡종화를 허용하였다. 몇몇 야생형 및 NHEJ 생성물은 잡종화되어 절단 부위의 주변에 미스매칭부를 가지는 이중 가닥 DNA를 형성하였는데, 이 DNA는 CEL-I 또는 SURVEYOR이라 칭하여지는 효소에 의해 절단됨으로 말미암아, 전기영동에 의해 분리 및 시각화될 수 있는 절단 생성물을 생성할 수 있었다.
접합 PCR ( jPCR )
jPCR은 서열의 게놈으로의 통합을 동정하는데 사용하였다. 프라이머를, 측접 게놈 DNA 서열의 경계에서 공여 분자의 5' 말단 또는 3' 말단을 증폭시키도록 디자인하였다. 프라이머 하나는 ZFN 절단 부위에 가까운 게놈 서열에 특이적이었고, 제2 프라이머는 공여 서열에 특이적이었다. 공여 DNA가 지정딘 좌위에서 올바른 배향으로 통합된 경우, PCR 생성물이 수득된다. jPCR은, 특히 TI 현상 및 RI 현상의 조합이 일어난 풀에 비특이적 밴드를 생성할 수 있었다. 게다가 TI 공여체는 게놈 좌위에 상대적인 배향들 중 어느 하나의 배향으로 통합될 수 있다. 달리 명시되지 않는 한, 정 배향으로 깔끔하게 통합된 공여체를 스크리닝하는 프라이머를 사용하여 jPCR을 수행하였다. 이로부터 얻어진 TI jPCR 밴드는 통상 서열결정에 의해 확인하였다. 부모 세포주 gDNA 및/또는 공여 DNA는 음성 대조군으로 사용하였다.
IgG 발현 세포의 FACS 증량
FACS Aria III 기기를 사용하여 유세포 분석법 또는 형광 활성화 세포 분취법(FACS)을 통해 세포의 임의의 아집단을 증량시켰다. 통상적으로, 세포를 IgG 발현 및 GFP 음성 세포, 제거 비발현 세포 및 GFP 발현 세포로 분취하였다. FACS를 위해 세포를 스핀다운하여 PBS에 재헌탁함으로써 세포를 준비하였다. IgG 검출을 위해, 분취에 앞서 세포를 형광 표지화 항 IgG 항체와 함께 30분 동안 항온처리하였다. 표면 결합 IgG와 임의의 세포를 결합시키기 위해 R-피코에리트린 표지화 항체를 사용하였다.
생산성/ 역가
FACS 증량한 풀을 7일 또는 13일간의 유가 방식으로 CHO DG44 세포 또는 CHOZN GS 세포 각각에 대해 평가하였다. CHO DG44 유래 풀에 대한 생산성 발현 및 역가 평가를 그 상표가 등록된 기저 배지 및 공급물을 이용하여 수행하였다. CHOZN GS 생산성 발현을, Ex-Cell® CHOZN® Platform Feed를 보충한 CD Fusion 중에서 수행하였다. 생성물 농도를 ForteBio Oct를 통해 분석하였다.
실시예 1:
통상적으로 CHO 세포의 숙주 세포 게놈에 이종 폴리뉴클레오티드를 무작위로 통합하여(즉 무작위 통합(RI)에 의하여) 제조용 CHO 세포 클론을 수득하였다. 위치선정 효과는 주로 저 생산자 세포와, 고 생산자 세포의 단지 작은 아집단으로 이루어진 고도로 이종성인 세포 집단을 형성하였다. 게다가 고 생산자 세포는 저 생산자 세포에 의거하여 과성장하는 경향이 있다. 이종 단백질의 믿을 수 있고, 높은 수준을 보이는 제조를 위한 부위(즉 "핫 스팟")로서 중국 햄스터 S100A 유전자 클러스터의 잠재성을 평가하기 위해, 전술한 바와 같이 서열 번호 11의 DNA 서열에 특이적이 되도록 조작된 아연 핑거 뉴클레아제 쌍(ZFN 13)을 사용하여, IgG 항체를 암호화하는 폴리뉴클레오티드를 CHO-DG44 및 CHOZN GS 세포의 게놈에 안정적으로 통합하였다.
ZFN 활성을 확인하고, 공여 플라스미드를 준비한 후, 전기천공을 통해 IgG 항체와 표적 특이적 ZFN 13 쌍을 암호화하는 발현 카세트를 함유하는 비 선형화 플라스미드로 세포를 공동형질감염시켰다. 그러므로 관심 IgG 단백질을 암호화하는 공여 플라스미드는 상동성 재조합을 통해, 또는 무작위로 선형화되었다. 세포에 48시간 동안 냉각 충격(30℃)을 가하여, ZFN mRNA의 잠복성과 절단 효율을 개선하였다. 전기천공후 4일차 또는 5일차에, 게놈 DNA를 수집하여 미스매치 특이적 뉴클레아제 검정, 즉 Cel I 검정을 수행함으로써, ZFN 활성을 확인하였다.
형질감염 후, 10일 내지 12일 동안 세포를 배양한 후 분취하여 일시적으로 형질감염한 공여 플라스미드 그 어떤 것도 남아있지 않도록 완전히 씻어냈다. CHO 세포를 원심분리에 의해 수집하여 대사 선택을 위해 배지 중에 재접종하였는데, 즉 CHOZN GS 세포의 경우에는 L-글루타민이 결핍된 배지에, CHO-DG44 세포의 경우에는 하이포잔틴 및 티미딘 보충(HT 보충)이 이루어지지 않은 배지에 재접종하였다. 이로부터 5일 ~ 10일 이내에 배양액을 회수하기 시작하였다. 대조군인 가 배양액은 플라스미드를 형질감염시키지 않은 채로 배양하였다. 대조군 배양액은 그 어떤 실험에서도 성장을 보이지 않았다.
대사 선택 과정 이후, GFP 및 IgG 발현 여부를 바탕으로 형광 활성화 세포 분취법(FACS)을 이용하여 FACS Aria III 기기(BD Biosciences)에서 세포를 분취하였다. IgG 검출을 위해, 분취에 앞서 세포를 형광 표지화 항 IgG 항체와 항온처리하였다. 표면 결합 IgG와 임의의 세포를 결합시키기 위해 R-피코에리트린 표지화 항체를 사용하였다. CHO 세포를 GFP 발현 집단(GFP+)과 GFP 비발현 집단(GFP-)으로 분취하였다. 표적화 통합을 위한 상동성 팔이 측접하고 있는, 항체를 발현하는 공여 플라스미드는 상동성 팔 외부에 위치하는 GFP 암호화 발현 카세트를 추가로 함유하였다. 따라서 GFP 발현은 무작위 통합 현상과 연관되었으며, GFP 음성 집단을, 표적화 통합이 일어난 세포에 대해 증량시켰다. GFP+ 세포 대 GFP- 세포의 분포 및 백분율은 표적화 통합 효율에 대한 좋은 지표였을 뿐 아니라, 표적화 통합 부위에서의 임의의 양성 또는 유해 표현형에 대한 좋은 지표이기도 하였다. 대사 선택을 위해, GFP 음성 세포 풀과 GFP 양성 세포 풀을 각각 30 mL들이 TPP 튜브에서 배양하였다(기본 먹이 공급 및 글루코스 전략 이용). 배양액을 대상으로, 생존 세포 밀도(VCD), 생존율 및 배지중 글루코스 수준에 대해 모니터링하였다. 희석한 상청액 중 IgG 역가를, ForteBio Octet 시스템(Pall Biosciences)을 이용하여 항체의 상호작용을 직접 측정하고, 앞서 확립한 표준 곡선을 사용하여 확정하였다.
IgG 항체를 암호화하는 동일 폴리뉴클레오티드를 사용하여 표적화 통합(TI) 또는 무작위 통합을 통해 얻어진 CHO 풀의 통합에 대한 역가를, CHO-DG44 세포의 회분식 배양 3일 내지 7일 후(도 1의 A)에, 그리고 CHOZN GS 세포의 회분식 배양 8일 내지 10일 후(도 1의 B)에 측정하였다. 표적화 통합에 의해 수득된 CHO-DG44 풀의 역가는 무작위 통합에 의해 수득된 CHO 풀의 역가보다 적어도 7배 더 높았는데(도 1의 A). 이는 S100A3/A4/A5/A6 유전자 클러스터의 상류 영역이 이종 폴리뉴클레오티드 통합에 대해 핫 스팟임을 암시하는 것이다. 무작위 통합에 의해 수득된 세포의 IgG 역가에 비해 적어도 8배 더 높은 IgG 역가를 표적화 통합에서 보였던 CHOZN GS 세포에 대해서도 유사한 결과가 얻어졌다.
실시예 2
무작위 통합은 이종 단백질 발현에서 고도로 이종인 세포 풀을 형성하였다. 중국 햄스터 S100A 유전자 클러스터 내 표적화된 통합이 더욱 균질한 발현 수준을 달성하고, 생산성의 관점에서 더 높은 예측가능 정도를 달성하였는지 여부를 평가하기 위해, 실시예 1의 TI 세포 풀과 RI 세포 풀로부터 개별 클론을 선택하였다.
실시예 1에서 얻어진, CHOZN GS 세포의 표적화 통합 풀과 무작위 통합 풀을 사용하여 단일 세포 클론(SCC)을 수득하였다. 조정 배지를 사용하여 증량한 TI 및 RI 풀의 희석을 제한함으로써 단일 클로닝 과정을 진행하였다. 세포를 TPP 튜브에서 48시간 동안 0.3e6개 세포/ml가 되도록 배양하여 조정 배지를 제조하였다. 세포를 침전시키고 나서, 조정 배지를 멸균 여과하였다. 하기 단계에 따라 클로닝 배지(SAFC 융합 플랫폼) 및 조정 배지의 80:20 혼합물중에 접종을 수행하였다. 단계 1: 웰당 1개 미만의 세포가 될 때까지 희석한 연속 희석액을 96웰 평판에 넣었다(웰당 200 μl). 단계 2: 보통의 조건하에서 세포를 항온처리한 다음, 6일 ~ 7일 동안 과성장하도록 허용하였다. 단계 3: 과성장한 단일 콜로니에 대해 평판을 스크리닝하였다. 이때, 웰을 새 선택 배지 20 μl로 채웠다. 단계 4: 세포를 약 14일 동안 배양하여, 96웰 평판에서 합류상태가 되도록 만들었다. 세포의 규모를 키워서 필요에 따라 24웰 평판으로 옮기거나 수집하였다. 단계 5: 원할 경우 96웰 단에서 클론 스크리닝을 위한 gDNA를 수득하였다. 세포 임의의 부피만큼을 96웰로부터 분리한 다음, 후속 PCR 및 스크리닝을 위해 Quick Extract를 사용하여 수집하였다. 나머지 세포는 계속해서 과성장하였으며, 선택적으로는 단계 4에 기술한 바와 같이 그 규모를 키웠다. 단계 6: 원하던 클론 집단의 규모를 키워 TPP 튜브에 옮겼으며, 성능 평가를 위해 사용하였다.
무작위 통합 또는 표적화 통합으로부터 얻은 CHOZN GS 단일 세포 클론을, 60회차 계대배양 전후에 유가 방식으로 8일 동안 배양한 후 단백질 제조에 대해 평가하였다. Ex-Cell® CHOZN® Platform Feed를 보충한 CD Fusion에서 제조 발현을 진행시켰다. ForteBio Octet를 통해 생성물 농도를 분석하였으며, 60회차 계대배양 전후에 동일 클론으로부터 데이터를 수집하였다(n = 각각 2, 총 n = 4).
분석은, 표적화 통합이 이루어진 집단에서 유래한 단일 클론(도 2의 A)은, 무작위 통합이 이루어진 집단에서 유래한 단일 클론(도 2의 B)에 비해, 매우 균질한 역가를 보였음을 보여주는데, 이는 S100A 유전자 클러스터 내 표적화된 통합이 예측 가능한 단백질 생산성을 달성하였음을 나타낸다. 60회차 계대배양 전후에 동일 클론으로부터 수집한 데이터의 오차 막대가 더 작음에 의해 반영되는 바에 따르면, 표적화 통합된 클론은 또한 더욱 안정적이었다.
실시에 3:
S100A 유전자 클러스터 내 핫 스팟 좌위를 확증하기 위해, TI를 위한 다수의 추가 아연 핑거 뉴클레아제를 표 3에 보인 바와 같이 디자인 및 제조하여, 실시예 1에 기술된 바와 같은 생산성 풀을 형성하였다. 도 3의 A는, NCBI 참조 서열: NW_003613854.1을 가지는 S100A 유전자 클러스터 내 핫 스팟 좌위와 개별 ZFN들의 위치를 보여주는 것이다. "비 파괴적 및 생산적" 부위, "비 파괴적 및 저/비 생산적" 부위, 그리고 "파괴적 및 저/비 생산적" 부위로 분류되는 ZNF 7 ~ 14의 통합 부위들을 도시하였다.
실시예 1에 기술된 바와 같이, CHO-ZN GS 세포를 사용하여 데이터를 구하였다. 상이한 게놈 좌위 8개를 시험하여, S100A3/A4/A5/A6 주 유전자 클러스터에 상대적인 그 어떤 영역이 이종 유전자 생성물 제조에 유리한지 여부에 대해 평가하였다. S100A3/A4/A5/A6 주 유전자 클러스터에의 통합이 예측되는 바와 같이 감소한 생산성을 초래하는지 여부도 또한 시험하였다(도 3의 B).
Figure 112020011536631-pct00004
(서열 번호 3의 뉴클레오티드 서열을 포함하는) 부 클러스터 S100A1/A13/A14/A16에 통합되는, 표적을 벗어난(off-target) ZFN(7)은, 임의의 유전자가 사이에 끼어들지 않았음에도 불구, 핫 스팟 외부에 존재하는 관계로 더 낮은 발현 수준을 보일 것으로 예측되었다. (서열 번호 4의 뉴클레오티드 서열을 포함하는) S100A3/A4/A5/A6 주 유전자 클러스터에 통합되는, 파괴적 ZFN(10, 11)은 내인성 유전자를 손상시킬 수 있으므로, 달성 가능한 전체 역가의 감소 또는 생존률 감소 중 어느 하나를 달성할 것으로 예측되었다. 서열 번호 1의 뉴클레오티드 서열을 가지는 상류 영역에 통합되는 상류 ZFN(8 및 9)과, 서열 번호 2의 뉴클레오티드 서열을 가지는 하류 영역에 통합되는 하류 ZFN(12, 13, 14)은 최상의 역가를 보일 것으로 예측되었지만, 단백질 발현을 지원하기 위해서는 주 클러스터로부터 최적의 거리만큼 떨어져 있을 수 있는 것으로 에측되었다.
개별 세포 집단을 수득하기 위해, CHO 세포를 공여 플라스미드로 형질감염한 다음, 표 3에 개시된 바와 같은 ZFN을 사용하여 실시예 1에 기술된 바와 같이 선택하였다. 생성된 항체는 실시예 1의 항체와 동일하였다. CHO 풀의 역가는 전술된 바와 같이 8일 동안 배양한 후 상청액을 대상으로 측정하였다.
각각의 좌위로의 표적화 통합으로 말미암는 실제 역가를 도 3의 A에 보였다. 표적을 벗어난 TI와, 파괴적 TI(ZFN 7, 10, 11)는 단백질 발현을 지원하지 않았다. 상류 TI 풀과 하류 TI 풀 둘다는 항체 역가를 보였지만, 이 역가에는 차이가 관찰되었는데, 이는 S100A3/A4/A5/A6 주 유전자 클러스터와 관련된 최적의 통합 거리가 얼마만큼인지를 나타낸다. ZFN 쌍(8)은 우수한 단백질 생산성을 지원하였으나, 상류 통합 영역에 있는 ZFN 쌍(9) 부위는 거의 0.5 g/l에 달하는 가장 높은 풀 역가를 달성하였다. 하류 ZFN 쌍(13) 및 하류 ZFN 쌍(12)은 둘다 우수한 단백질 생산성을 보였지만, S100A3/A4/A5/A6 주 유전자 클러스터를 기준으로 더욱 멀리 떨어져 있는 쌍(13)이 더 높은 역가를 보였다. 또한 ZFN 쌍(14)은 너무 멀리 떨어져 있어서 적당한 생산성을 지원하지 못하는 것으로 보였다. 결국 역가는, S100A3/A4/A5/A6 주 유전자 클러스터 내 유전자를 파괴하는 표적화 통합 또는 S100A3/A4/A5/A6 주 유전자 클러스터 외부이되 바로 근접한 곳에서 일어난 표적화 통합은 얻어진 세포 집단의 적은 IgG 제조를 초래하였던 반면에, S100A3/A4/A5/A6 주 유전자 클러스터의 상류 및 하류에 있는 영역으로의 통합은 얻어진 세포 집단의 많은 IgG 제조를 달성하였다. 이 점은, S100A3/A4/A5/A6 주 유전자 클러스터가, S100A3/A4/A5/A6 단백질 암호화 유전자의 상류 또는 하류로부터 가까운 거리에 있는 게놈 표적 영역 내 통합 위치들에 대해 높은 수준이면서 믿을 수 있는 단백질 제조를 지원하는, 적합한 게놈 표적 영역임을 확인시켜준다.
실시예 4:
표적 서열의 더 우수한 적용가능성과 더 용이한 통합을 위해, 마커 유전자와 같은 대체수단으로서, 예컨대 부위 유도성 재조합 기법, 예컨대 Flp-FRT 재조합 또는 Cre-lox 재조합을 이용하여 표적 서열에 대항해 간단히 교환될 수 있는 "랜딩 패드"를 원하는 위치에 포함하는 세포가 제공될 수 있다.
상표가 등록된 CHO-K1 GS 세포주를 13번 좌위 ZFN(서열 번호 11)의 FRT 매개 재표적화에 사용하였다(랜딩 패드 접근법). 각각의 FRT 측접 구조체(도 4의 A 참조)를 실시예 1에 기술된 방법과 유사한 ZFN 기법을 통해 삽입하였다. CHO-K1 GS 요구를 충족시키기 위한 약간의 수정이 프로토콜에 가하여졌다. FRT-랜딩 패드 구조체는, 네오마이신 내성 유전자, IRES 서열 및 시토신 디아미나아제 유전자를 함유하는 카세트에 측접하는, FRT 부위들을 함유하였다(도 4의 A). 랜딩 패드에는 상류 및 하류 상동성 팔(각각 서열 번호 13 및 서열 번호 14)가 추가로 측접하고 있으며, 선형화된 구조체를 13번 좌위에 특이적인 ZFN 쌍(서열 번호 11)과 함께 공동 형질감염으로 도입하였다. 통합이 올바르게 이루어졌는지를 전술된 바와 같이 확인하였으며, 하기에 기술된 바와 같이 관심 유전자 함유 벡터에 의한 리컴비나아제 매개 카세트 교환(RMCE)을 통해 랜딩 패드를 재차 표적화(치환)하였다. 일상적인 세포 배양을 위해, 상표가 등록된 배지로서, 850 mg/l의 L-Gln(6 mM)이 보충된 배지를 사용하였다. 랜딩 패드 세포를 유지시키기 위해, 100 μg/mL의 G418을 추가로 사용하였다.
예비 통합 랜딩 패드와의 교환을 위한 공여 서열은, IgG 항체를 암호화하는 발현 카세트와, 하이그로마이신을 암호화하는 발현 카세트를 함유하였다. 형질감염 24시간 전에 랜딩 패드 구조체가 안정적으로 형질감염된 세포를 0.5x106개 세포/ml로 접종하였다. 형질감염 당일에는, 새 배지 중 세포 배양액의 밀도를 6x105개 세포/ml가 되도록 조정하였다. 총 DNA(표적 벡터 및 FLP-리컴비나아제 발현 플라스미드) 8 μg을, L-Gln을 보충한 CHO-S-SFMII 배지(Thermo Fisher)에 희석하였다. 제조자의 매뉴얼에 따라 PEIpro(Polyplus)를 형질감염 제제로서 사용하였다. 형질감염 후 배양액을 24시간 동안 30℃ 및 5% CO2에 유지시켰다. 24시간 후 온도를 36.5℃로 상승시킨 다음, 48시간 더 배양하였다. 형질감염 및 하이그로마이신에 의한 선택 후, 오로지 RMCE 현상만이 일어났다. 접합 PCR(jPCR)에 의해 풀을 스크리닝하여, IgG 공여체가 전술된 바와 같은 랜딩 패드에 통합된 현상을 확인하였다.
상표가 등록된 배지를 사용하여 CHO-K1 GS FRT 재표적화 풀을 13일 동안 배양하였다(유가식 배양). 전술된 바와 같이 ForteBio Octet(Bio-Layer 간섭측정법; BLI)를 통해 생성물 농도를 분석하였다. 도 4의 B에 보인 바와 같이, IgG 농도는 시간이 경과함에 따라서 점점 증가하였고, 그 수준도 매우 높았다.
실시예 5:
실시예 4에서 제조한 IgG 발현 FRT 표적화 세포는, 단일 클론 수준에 있어서 높은 균질성을 보였다(도 5). 실시예 4에 기술된 바와 같이CHO-K1 GS FRT 재표적화 풀을 형성하였다. CHO-K1 GS 세포주에 약간의 수정을 가하여 실시예 2에 따라 희석을 제한함으로써 단일 세포 클로닝 과정을 수행하였다.
CHO-K1 GS FRT 재표적화 풀 유래 단일 세포 클론(실시예 4)을, 상표가 등록된 배지를 사용하여 11일 동안 유가식으로 배양하였다. CHO-K1 GS 세포를 진탕 플라스크 중에서 성장시켰다(110 rpm, 36.5℃ 및 5% CO2). TPP 진탕기용 튜브에서 세포주를 계대배양하였다(0.3x106개 세포/ml). 자동화 Vi-Cell(Beckman Coulter) 또는 Cedex Hi-Res(Roche Innovatis) 기기에서 배양액을 계수하였다. 대조군으로서 각각의 풀을 공동 배양하였다. ForteBio Octet(Bio-Layer 간섭측정법; BLI)를 통해 생성물 농도를 분석하였다.
본 발명은 하기 항목들을 포함한다:
1. a) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나;
b) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류인,
CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 중국 햄스터 난소(CHO) 세포.
2. a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는,
항목 1의 CHO 세포.
3. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는,
항목 1 또는 항목 2의 CHO 세포.
4. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 또는 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는,
항목 1 내지 항목 3 중 어느 한 항목의 CHO 세포.
5. 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되는, 항목 1 내지 항목 4 중 어느 한 항목의 CHO 세포.
6. 적어도 하나의 이종 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하는, 항목 1 내지 항목 5 중 어느 한 항목의 CHO 세포.
7. RNA는 mRNA, miRNA 또는 shRNA인, 항목 6의 CHO 세포.
8. 적어도 하나의 이종 폴리뉴클레오티드는 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는, 항목 6의 CHO 세포.
9. 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자인, 항목 6의 CHO 세포.
10. 마커 유전자는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하고 있는, 항목 9의 CHO 세포.
11. CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS) 결핍 세포 또는 이들 세포 중 임의의 것의 유도체인, 항목 1 내지 항목 10 중 어느 한 항목의 CHO 세포.
12. 게놈 표적 영역은 청구항 1 내지 11에 따른 서열들 중 임의의 하나 또는 이에 대해 적어도 80%의 서열 동일성을 보이는 서열로 이루어진, 항목 1 내지 항목 11 중 어느 한 항목의 CHO 세포.
13. 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터의 대립형질 하나 또는 두 개에 안정적으로 통합되는, 항목 1 내지 항목 12 중 어느 한 항목의 CHO 세포.
14. a) CHO 세포를 제공하는 단계;
b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
[단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고,
i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]
를 포함하는, CHO 세포를 제조하기 위한 방법.
15. a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는,
항목 14의 방법.
16. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,720번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,720번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,720번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,720번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 660번 내지 10,260번 뉴클레오티드, 서열 번호 2의 1,320번 내지 10,260번 뉴클레오티드, 또는 서열 번호 2의 1,480번 내지 10,260번 뉴클레오티드에 대응하는,
항목 14 또는 항목 15의 방법.
17. a) 상류 게놈 표적 영역은 서열 번호 1의 11,820번 내지 18,380번 뉴클레오티드, 서열 번호 1의 13,560번 내지 18,380번 뉴클레오티드, 서열 번호 1의 15,360번 내지 18,380번 뉴클레오티드, 서열 번호 1의 17,100번 내지 18,380번 뉴클레오티드에 대응하고/대응하거나;
b) 하류 게놈 표적 영역은 서열 번호 2의 3,180번 내지 10,260번 뉴클레오티드, 서열 번호 2의 4,920번 내지 9,000번 뉴클레오티드, 또는 서열 번호 2의 6,720번 내지 8,460번 뉴클레오티드에 대응하는,
항목 14 내지 항목 16 중 어느 한 항목의 방법
18. 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합된, 항목 14 내지 항목 17 중 어느 한 항목의 방법.
19. 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하고 있는, 항목 18의 방법.
20. 적어도 하나의 이종 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하는, 항목 14 내지 항목 19 중 어느 한 항목의 방법.
21. RNA는 mRNA, miRNA 또는 shRNA인, 항목 20의 방법.
22. 적어도 하나의 이종 폴리뉴클레오티드는 치료 단백질, 바람직하게 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는, 항목 20의 방법.
23. 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자인, 항목 20의 방법.
24. 마커 유전자는 CHO 세포 게놈에 발현 카세트의 일부로서 안정적으로 통합되고, 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하고 있는, 항목 23의 방법.
25. 이종 폴리뉴클레오티드는
a) 서열 특이적 DNA 편집 효소; 또는
b) 부위 특이적 리컴비나아제
가 사용되어 CHO 세포 게놈에 도입되는, 항목 14 내지 항목 24 중 어느 한 항목의 방법.
26. a) 서열 특이적 DNA 편집 효소는, 바람직하게 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제로 이루어진 군으로부터 선택되는 부위 특이적 뉴클레아제이고/뉴클레아제이거나;
b) 부위 특이적 리컴비나아제는 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는, 항목 25의 방법.
27. a) CHO 세포를 제공하는 단계;
aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
[단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소(예컨대 부위 특이적 뉴클레아제)에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고,
i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및
b) 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계
를 포함하는, 항목 14의 방법.
28. CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)-결핍 세포 또는 이들 세포 중 임의의 것의 유도체 인, 항목 14 내지 항목 27 중 어느 한 항목의 방법.
29. a) 청구항 1 내지 13 중 어느 한 항의 CHO 세포를 제공하는 단계;
b) 단계 a)의 CHO 세포를, 관심 단백질의 제조가 허용되는 조건하에 세포 배양 배지 중에서 배양하는 단계;
c) 관심 단백질을 수집하는 단계; 및
d) 선택적으로 관심 단백질을 정제하는 단계
를 포함하는, CHO 세포 내에서 관심 단백질을 제조하기 위한 방법.
30. 관심 단백질을 높은 수율로 제조함에 있어서 항목 1 내지 항목 13 중 어느 한 항목의 CHO 세포의 용도.
서열 표
서열 번호 1_상류 통합 좌위
서열 번호 2_하류 통합 좌위
서열 번호 3_상류 부 클러스터
서열 번호 4_주 클러스터 암호화 구역
서열 번호 5_ZFN 7에 대한 인지 부위
서열 번호 6_ZFN 8에 대한 인지 부위
서열 번호 7_ZFN 9에 대한 인지 부위
서열 번호 8_ZFN 10에 대한 인지 부위
서열 번호 9_ZFN 11에 대한 인지 부위
서열 번호 10_ZFN 12에 대한 인지 부위
서열 번호 11_ZFN 13에 대한 인지 부위
서열 번호 12_ZFN 14에 대한 인지 부위
서열 번호 13_상류 상동성 팔 랜딩 패드
서열 번호 14_하류 상동성 팔 랜딩 패드
SEQUENCE LISTING <110> Boehringer Ingelheim International GmbH <120> Integration sites in CHO cells <130> 113628P1140PC <150> EP17185988.7 <151> 2017-08-11 <160> 14 <170> BiSSAP 1.3.6 <210> 1 <211> 19987 <212> DNA <213> Cricetulus griseus <220> <223> Upstream integration locus <400> 1 acagagaaac aagcaagaga gagatgagga ggggaccgat gttagcttta ccagttggtc 60 tggtaagaag agaaaccagg aagtggctgg tgaaggaact ttgggcaaag ctgcagagcc 120 agtgtgactg aagagtggtg ctctgcagcc tggccaacct gagttcaaat ccagctctac 180 tcttaatcta cccggcctct gtttccagat ccactcatca caggaatggc ccacattgtt 240 agagggtgtg agaggtcagg gcttcttacg ctttctcctc tcttagccac tttttgcctg 300 agaaagttat gaaaggccct gtacaggtag atattaaaat agatatatgt taaatgttca 360 cttataataa agattaattt taaaatgata ttttttgtta aaaatgaaac aatttgaata 420 ctaatgagct ggatgtgctt gtttagtttt tattcaatat cttgtttatt tatgagactg 480 taatttagtt acaatgtttc ttccttccct tttctccctt caaactctcc cttgtaccct 540 tccccactgc ttcaaatcct tggcctcttt tttgttaatt gttattgcac acacatatgt 600 atttgtatat acacatatat tcctaagcat aacttgctgg ggctgtataa tgttatttgt 660 atatatgttt tcagggctga ccatttggca ctgaacaacc agttggtgta ctcttcccca 720 ggaagggcca cttctctgct cccagcttta ctcagttgcc tgtcattctt tgtgtagggt 780 tgaggcctca tgggattaac cccatccagt ttggcatgtc aattggtgtc aaacttgttc 840 agcgcttgtt tgggcagtca tgttggtgag acgttacagg tgtagcttct gatgttacta 900 ggagacacag tctcacaaca aactctctga ttctctggct cttacaattt ccagttccct 960 cttctgcaat attctctagc tttagatgca gaagtgtttt gtagatttat ccattgggac 1020 tggattccac agctctgcat tttgactggt tgtggttttc tgtagtggtc tctgttgcaa 1080 agagaaattt ccttgatgaa aggtgaagaa tatatctgtg gttatatgaa caaatattta 1140 tagattgttg ttagggatta tgctggttta ataaattagt ggttatagat ttctcttcca 1200 ataaccacag ttttcctagc attgagtagt taggtaggat tccagtatca agcatgtttc 1260 ccctcttgtt gaatgggtct taagtccaat tacagagctg ttggttacca ccaaggtatg 1320 tgtgctgcta ctgcaccgtg gggttatcat ggcatgctgg ttgttgccgt ggttcatagg 1380 tggcatagct ggataggatt gttggttgcc tccctctttt ggaagctttc atggtgcctt 1440 ctggtaccat taaagctagt tctcagggag ggagcattta ggatatttcc agatcaaggg 1500 tctctgggac ctgtgtctga aatgtttggt gtcttaagca atagggattt accttttata 1560 tcttgaggat agccaagggc aatatgctta cataaatgat tgaatcttgt ctaatatttt 1620 ttctttttga gacagggtct cactgcatgt tcctggttgg cctggaacac actactttta 1680 gatcaggctg gcctcgaact agcagagatt cacttgtctc tgcatctcaa gttgactggg 1740 attaatggtg tgtgctatca tgcccagcca atcttggctg agtatttgat actttcagga 1800 tcaagtcagc aatgcaaaca gcaatattac atttttaagt gttttattta tctttatcca 1860 atcttcattt aattagttca tatattcata tattgtattt tgatcatctc caacccaaat 1920 cacctatccc attcccttta gaccctccca tattttcccc tcctctctca tatcctcttt 1980 atttttaata acccactgag tccacttagt gctgcttgtg tgctcatggg tgaggggtgc 2040 tctgtgatag catgggcagc ctaccagcaa ccacccgccc tcaagagaaa agactctccc 2100 tcttccagca gccatcaact gccaaaagat cgcctgctgg gttgaagcct ctgagttcct 2160 cttgcatcca cgctgggatg ttgacgggct tgatctcctg cagataatca tagctgtgag 2220 ttcaggagtg caacagctgt gtggtgtcca gaagatagca tttcaagcat ttcctgttgt 2280 cttcctgctc ttacagtcta catccctctc ctttatgctt tctgagcctt ggtgaggaga 2340 agggaaggaa gtagtgactt gacagaaatg tcacattcat ggctgaacac tgaaaagtca 2400 tttattatca gctcttacac aagttatgag tctgctgccc agtgaaaaac gaggtttctc 2460 tgagcaaggc tgagagcagc actaatatat agggttgtga atataaatat tttgaaggca 2520 gtttgacacg tcagtttagc aaaaacagta atagttccct ccacctctac cccagggcct 2580 ataagtttcc tagacatagg cttttgatga ggtacacagt accagacata aattacctgc 2640 tgtggaccgg gcttcaaacc caatcaagtg actggttact cccataactg tcatgccact 2700 attgtatcag gagttacttc ttgctaggca gttaattgtc atagcatgca tgatccacag 2760 gtgggtaaga ccattgatag cttttcttct ctagtagcct gaatagtacc ttctgtcact 2820 ctgaaaacta gctagtaggg aggaaacttc tagatcagtt ccatttcaat ttctccatgt 2880 ttgaaccaag tgtgtgatgt ctttagaaat agcatcttac catctagttg aggtgggcaa 2940 acaagagcaa tgacaatagt ctgtgttgtt ttagggggct ctaaagcttc ccagaccaat 3000 aacgataggg acatagccta tactttacat tgggattttc agttagtaac ttatgtcttc 3060 taggaacgca ctagccacct acgtaaggta cctgtgttca aactcctttt aaagttaaaa 3120 aaaagtagct tacaaagttg cgtagtccat aggcttgtgt gtgtgtgtgt gtgtgtgtgt 3180 gtgtgtgtgt gtgtgtgtgt gtttgatata gggttttact atgtatccct gactaacctg 3240 gaactcacta tgtagacctt gaagtcacag agatccaact gccttacagg tatgtgccac 3300 cacttccata gttgccataa gtttttttaa aaaatatttt tttttcatac aactgcaaga 3360 accttaacat ggtgagccgg ctcctttacc tctccctgac ctccactatt ttgtgacagg 3420 ttctcatata taccaggctg gccttgaact tacagtgtag ctgagggtga ccttgaactg 3480 agtctcctgc gtgtgctgcc acaccagttt atacagtgcc aggaactaaa accaagactg 3540 tgcacgggaa gcaagcactt tgtcaactaa actacatttc caaggccctc aaaccatgat 3600 tctttttatt gaattttatt tattattatt tttttatttg agacaggatt cctctatgta 3660 gccctgactg tcctggtact caatctgtag accaggctgg ccttgaactc agagattagc 3720 ctgcctctgc cttctgagta atggtattaa aggggcacac catcacacct ggcctcaagc 3780 agcgattctt aaaattaaat atccaaacat aacacattcc aaaaatgtac taatttgtta 3840 ctaatttgcc aaagaatgat gacaggaaaa tattaatagt ctttgttttc taggctggag 3900 agatggcttg gtaattaaaa gagcattagc tgctcttcta gaggaatgag gtccggttct 3960 cagtacccat atggcagccc atgcccacct gtaaatccag ttccagggaa tccaattttc 4020 ctctggtttc tgagggccct tgcacacacc cttccccata tatatataat taaaaataaa 4080 aacaaatctt aaaaaaatta tgtttctact agagcagaaa actttgtgta tacagtgaaa 4140 acgttgcagt tcttaacaca aaacagcctt gggcctgagg agggttttag ccagcattca 4200 ttggcgcttg gagggataat ggctcggata gtgcaaagag cttgtctgtg cccagaaccc 4260 ccaaggctgc agggaagttg tgtgacccca caccctgact cattgtgtgt tagcctttga 4320 attaatcttt ggttgtttgt tctgaaatct cttactattg ccaaagtttt gtgacactac 4380 cctccccgcc aatccagtta caaccccaca tagggttgta acacagtttg aaaaaccagg 4440 aattaggtac catgtgaaca atattcaata catttaattt cttcttgcct gcttgctggc 4500 tgcctttttt ccttctcaga aggaattatg tgtctgtttt aaagctgggc aggtccagat 4560 cattcttcat cacttcattc aggggtggtc ctgtcctgag agactgattg gctccctgat 4620 ccagcattcc aggaatcgat ttcatgtctt ccccaaagga aagtccctct gtgagtctag 4680 agctggtgac aaataactgg atgtgaatga tggttccccc cttatttctg agacaggacc 4740 tcattcccat attacccagg cctcgaattg accctctgat cctcctacct catgtcctgg 4800 gattacaggt ctgcaccaat agactcagag acatgagtga tcttaaaggg ccatatgagt 4860 aagcctgaca aaggcgtgtg tctctcctgg taaggaatag aattggtata tttttcttct 4920 ttctttcttt ctttctttct ttctttcttt ctttctttct ttctttcttc ctttctctct 4980 cttttttttt tgtaaagatc tatttatttt ttttaaacct ttatgtgcag gagtgctttt 5040 cgttccctgt atgtatccgt gtgcctggtg cagtacagcc cttagatcta gagacagcca 5100 attgtgagcc accatgtggg tgctggaaat taacacaggc cctttgcaag aacagccagt 5160 gctcttaacc acagagccat ctctgcagcc ctggtttctt ctttccagtg ctgcttctaa 5220 taacatgtat tggattcttg tgtatgtggc atgtgttgtc tcatttgatc tgtgggttgg 5280 gatagtattc tgctacagat gagtagagtg gtgattaccc tggtgtaaga gcacatagtg 5340 aatgtggcta ctgtgacgct tgctttcttt ctttggtaag ggacccagag tctggcctta 5400 ccacgctggg ccaatcagag tactttgtct ctctggctac ggggaggggc gggatgttgg 5460 ccaatagcag aatagctgaa ccaagcaggg ccaaccagag ttttcccctg cattagtaag 5520 cagatcctag gtttatatgg ctggatgaac acatttccta tgtatgtatg tatgtatgta 5580 tgtatgtatg tatgtatgta tgtatgtatg tgcgtatgta tgcttaattc cttgtggcct 5640 ctgaagctag atcactgatt gtgtgaatta ctgcaacact ttgtaaagac aagtttgttc 5700 atttattttg agaaatgtgc ttatgtaccc cagactggca gaggcttatc tccatgtctg 5760 gatcctgcct ccatttcccc tgggtaagga gtataccact gcatttatgg gatgctggag 5820 attaaaccca ggatttcttt tcttttcttt ctttcttttc tttttttagc agatttttta 5880 aatttgaatt agaaacaaga ttgttttaca taacaatccc agttcccttc tccctcccgt 5940 cctcccttaa cccccttacc cccctccccg tcctccaact aaaaccctat ctatcacata 6000 tccttaaacc ctggatttct tgaatgctgg gcaagcaggc tagcaaacta gctttgttga 6060 cacacctttc tgtgatcctg tgagtttgtc tcttagctga agtgctgaat ataaccagca 6120 gcggtaaaaa gcctgaaaga tggattcttt tggatttgca acttgatgat tggtttccca 6180 gccaatcatc ctgggagagc gggaggcagc agcactaggt cagcagacta cttatactct 6240 gtcagtaagc ccagaagcag acaggagaat gaatgggtgc tgcacccggc tctcatcctc 6300 caggcctgcc tacttccccc agctgggccc cacatcctaa aagttatata gtttccccaa 6360 acagggcaac cagatagggt caatggggac atttcctacc atcacactga ggattaaacc 6420 agggcttgtg ctcactgggc atgtactcaa ccatagcgca agatccttag actttttttt 6480 ttttcttttt cttttctctt tctttctttc tttctttctt tctttctttt ttaggattca 6540 tttatttatt atatatacag tattctgctt gcatgtatac ctgcaggtca gagagggcac 6600 cagatcacat tatagatagt tgtgagctac catgtggttg ctgggaattg aattcaggac 6660 ttctggaaga cctctgaacc atctctccag ttctcttagc tttttttttt tttttaaact 6720 ttctttattt tgaagcaggg tcttgttaaa tagatttatt tatttattta tttatttatt 6780 tatttattta tttatttagg tttctctgta gctttggaag ctgtccagga actagctctg 6840 tagacctagt taaagagcgt actccaccac ccgcctgttg ctaaattgtt cttgaatctg 6900 tggccttccc acctcagcct cctgagttgc tagatcagat tttaaaaaag attagttgta 6960 gccgggcatt ggtgtcgcac gcctttaatc ccagcacacg ggaggcagag gcaggcggat 7020 ctctgtgagt tcgagaccag cctggtctac aagagctagt tccaggacag cctccaaagc 7080 cacagagaaa ccctgtctcg aaaaacaaaa acaaaacaaa acaaaacaaa aacaaaacaa 7140 aaaaaagatt agttgtattt tgaattatgt atgtgtgtgt atttgagtgg ttatatgcag 7200 gtgtatgtat gtatgtgtgt atatgcagga gtgtttgtgt atgcaggtga tgccggtgtg 7260 tgtgtgtgtg tgtgaatgta gatatgtagg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 7320 tgtgtgtgta tgtgtaaata cacatgcaca cttgtggtgg tcagaatcag gaagcatgga 7380 atccccctgg aactggtggt tgtaagatgt ctagcatggg ggctgggaac ggaactctgg 7440 ttttctccaa gtatgggttc ttaattggct atctctgcag cccctgaaag attaaaaaca 7500 ttatggctgg gtttgtagtg tgcaccttta accagcactt atgaggcaga ggcagataga 7560 cagatttctg tgtttaaagc caggttggca actggtcagc caaggctaca cggtgagact 7620 ttgtctcaat aaacaaacaa acaaacaaga atgagaataa taagataaag taagaatata 7680 ataaatgttt ttatttctgt gtgtttgagt gtgcacatgc atgtgagcac ctgccagaag 7740 aggcttctga tgtccaggag ctggagtttt aagcaatggt gagctacctg gtgcaggtgc 7800 tgggacctga actccagtcc tctgcaagag caccacaagc tctcaaccat tgagccatct 7860 cttcagcccc tgaaaggtct taattaataa aattaatgct aattattggg tcaagagtta 7920 agtccagatc caagtcttgg ctctttcact gtaactgatc tttgaaacca cttccttatg 7980 agtaacgtct taggttttaa gaacactgct cccactgagt cacctgtgtc actcctgaaa 8040 ctggctgagg tccctttctg gaatgaggaa cttcctgggt tcatggaaca caccaggaca 8100 tggctctcag gtgaccgctt ctgagaggac tgctaatcac tcatttatgt ggattcctct 8160 cagtgccagt gtcaccaagt aacagtgtcc tgagttccac tgttgttggc cctctctttt 8220 ggcaacttgg ggagcctggc ttcagcctca agcctaccta acactgaggc tttcgtactt 8280 gctaggacag cagccagcct ctggctaggg gaggccatga ggaattgaca gccagggcac 8340 agatactctg agctcttgat tcagacagca ggggtcggag ctctgaacat gagtgaggag 8400 ctgtgggatg tgggagcctg cctctagtcc tgacatctat gatgtggagg gacggtgggc 8460 cagatagtag ctctgctcct ttcctgttct caggcaggga gtttaaaagg acagaggata 8520 aagaagtctg actggtttcg gtttaaagta taaaatgttc ccctttgtga caccagaatg 8580 taataaacca tcgtcctttt gtgtgtacac aggctgactc tgatatatga catggaaaac 8640 cacgttttat gggcacattg aaagaacatt cattagctca tgatgcggca ccatgatcct 8700 agctgaaagg aagtatattt tagatgctcc acccagatta atactggagt ctgtcctgcc 8760 attgcaaact gaaaaatgag aacactccga ggttttcgca tagctatgga tcatgtgtgg 8820 tgacaagtgg atgagtaatc acaaatatta ctcaagaaca aaaagattct aagagaaaat 8880 aaagcaggaa ggagacaaac tagcattctt ggagaaagaa ttgaaaaata tgcatagttg 8940 tagaatccca tagatgtgag tagggagact aatgcagcta atatactaag acagcaattt 9000 aattcttaaa tggaaataca ggctggtgtg tagctcagtg gtagagcgct tatccagcat 9060 gtgtgagact ctggcttcca tgccccaaac cacaaaagca aacatataca ggaagaaagc 9120 aggcacatct tagatgttcc acccagatta acattgcagt ctctcttgcc attacacatg 9180 gaactgagga cgagcagagg tttaggcata gttgtggagg aagcagcctc ttctagcatt 9240 ttaatggtaa ctgctataaa attatcatgt agattatttg atttgctatg tataattaaa 9300 atgcattgta attttaagac tctgacattt aaacacattt atactacttg gcaatgatgt 9360 agatcagttg ttattggact ttggatctcc agcccccaaa taatgataca gagacttatt 9420 actaattatg aaagcttggc cttagcttag ccttgtcccc aaagagctct tatagttgaa 9480 attaacctgt ttatattaat ctacattctg ccatgtagct cattacctct gctcagtacc 9540 gtatgtctga ctccatggtt aatgccacct ctcttattcc cagagttcct ctctccctgg 9600 aatccccacc tattctctcc tgcctaccta ttgaccactc agctctttgt taaatcaact 9660 agaaagtgcc ctgacagaga cacatcgtgt ccaaaaagat tatcccacag tagtcagcgg 9720 tgtttgtagg taagttgtag gtcagtggta gagtgcttgc ctagaatgta caaggtcctg 9780 ggttcaagtt ctagcactgg agggaaagag aggacaatgt ttgaataatg tctcatgcta 9840 tgaaagcatt tgctaatttg tattatttga agattctaat gagacagcta tttaatatat 9900 atattgtatt gattcattag tattagaaaa taagtctgct tttctttatg gggcaccttt 9960 tagagaaagt gcattgaata tgctatttcc caattagtat taggaagttc acttaaaaat 10020 cttctcactg ggagagatcg attagtattt caagcaagag cgcagtgact ctgacatccc 10080 ctctccctaa tctggtttgt atactgacat cactcacaat caccatttct ctgcaaattt 10140 ccagttagcc cataaaaaaa tccagtgctt cgaaagttct ttggatggtt cagcaggagt 10200 ttgaatccct caaatgtcac agcggtcttt aagcctattt ccttacaggc tgtcttcctt 10260 agcaatttaa ggaaacaaag agctgttgcc aaggaaaagt gagttggttt tgtttgtttt 10320 gttttgtgtt agatatgtgg tgttttctga tgaagtctct gacacggatg acagtgacat 10380 tggaatatgg aagtcctgta ctctgagaaa gatcacattt ctagatgatg cttttgccac 10440 tgattaactg gatctgcatg tgagtgatgg tttctaagct gtttagtgac agctgcatgt 10500 ggtgacacag ccggcaatcc tgtcacttgg gagtctgagg cagaaggatc ttgtgttgga 10560 agctgcttta ggttgcatgg tgaggtcctg ttcacaaggg agggggcggg aacaaaaatc 10620 cagaacagaa caaaacaatc aaccaaattg tatagtaaga cagcaacatt tctcaacttc 10680 agaaacagtt ttctgagtgg cattgtgacc ctgactagga aaggctgcat ccctggagct 10740 tccttctccc cttactgtta ctctgtaacc tcgtggctaa ggcagtcttt cttcatttta 10800 tttgttcaca cttacctatc aatatgtaca cacacacaca cacacacaca cacacacaca 10860 cacacacaaa gttgggtgtc agaggacaat tgtgggaatc gcttctctcc tcccccacgt 10920 ggggccctca ggttggcagc aagctctttg acctgctgag ccttctcact agccccactt 10980 tcccatcatt ttatgtcttt aatctgcctg attctgctgt acagtgaaag gcaagcattt 11040 gacaccagcc ttctgagctt cttcaaaaaa gtgtttgttc attaagtatt cagaatttgt 11100 ttactgatta ccaagagggt gttggttatg ggagcccatt tcacaatgcc tttctctcct 11160 tttgggaatg gaacctaggt ctttttctct ccaggaaaat gctctaccac tcaactacag 11220 ctaccttatt cttttatatt ttcaaggcta tttgcgtctt tagttatctt tgtcttagtt 11280 tgttgcaaag gttgctgagg aagagatgca tagggttaaa tgcagggaaa gggggtcaga 11340 gtcccatact ctagggactt ccacgtggtc atttcattgt gttctttcta atcagttttc 11400 actaggatgc aatggtggtt ttggtggtta gaggttgggg aaacaaggag tgtttttctt 11460 ttccttacct catccccctg aagaatgact caagtgaatg gttataaatg gcaacagaga 11520 gacagagaag gcaaagatct gagttttggg gtttggaggg tgctaattat tctcaccttc 11580 ttccctttga agttctgaga agaactcaag caggactccc aatcacagcc atggactaga 11640 tgatgtaatt tggagctgag gctatgttgt ggtttgaatg ttaattctct cctacaggct 11700 catttgtttg aagagttggt tcccagatgg tggcactatc ttgggagact gagagacctt 11760 ttggacttgg ggcctattta cagacttgag gatacagaag ttggcctcat agcccatcct 11820 caggtacatc atgaactctc tgcttcctgg atggtaccct atacctcatg ctcccactgc 11880 caggaaacca cccacagtca caccttcctc tatgatggat taaatccacc ccaatcgtga 11940 aaccaaatag atccttcctc cttgaagttg tcaagggttg gttagagtga tgaggacata 12000 aagaatagag taatctgttt ctgttataga actgaccaca gcactcagga ggcagagaca 12060 gcttggtcta cagagccagt tccaggatag ccagggcagt tacacagaga aaccctgtct 12120 caacaaacaa aagcaaaaca aaaggaaacc aaaaccaaaa ccaaaccaaa ccacaacaaa 12180 aacaaactga ccatattgtt tttcggtctt tggaggtggt ttttgggagg aatgtggaga 12240 aatttagaat tgtgggctag aagctgggcg ttggtggtgc atgcctttaa tcccagcact 12300 cgggaggcag aggcagttgc atctctgtga gttcgagacc agcctggtct acaagagcta 12360 gttccaggac agcctccaaa gtcacagaga aaccctgtct cgaaaaacca aaaaaaaaaa 12420 aaaaaaaaaa aaaaaaaatg tgggctagaa aggccctaac attctgtagt cagagcttac 12480 tgggccattc tgatgagtgt tcaggagacc atactattga tagaaaaatg gacactgttc 12540 agattcatga ggatttagag tggcagtgca tgcctatgat ccaaattctt ggaaagtgga 12600 ggcaccagga ttgggagttc aaggtcatcc ttggctacac agcaagtttg aggccagctt 12660 gaactacaca atgaagtgtc tcaaaaaaga acaatgaaaa tcaaggaaaa acaaacaaaa 12720 ccaaatacac ctaaaaacaa aacaggaact gtagcagaca ctgggttaga caccatttat 12780 gttacgttca gataaagaaa ttggttatgt gttatttcct aaaactttga gtgaagttga 12840 attcagaagc aatagagtaa tttgttctgt agagaacatt gccagatggc acagcattca 12900 ggttgtcaca tgactgttga catgtgacaa ccgttagcta tgtttacagt gaaaattctg 12960 atcagatagt ggcttgaaaa aatgtggaag atgaggccgg gtgttggtgg cgcacacctt 13020 taatcccagc actcgggagg cacacagaga aaccctgtct cgaaaaacca aaaaagaaaa 13080 aaaaaagtgg aaaatgcaca gtttaatgtg cacaggacca tgagtcaagg taaagttgca 13140 gaaagagccg ataaggtttt tttgccgaca aagtagctac aattacaaag acaggaacac 13200 aattaaggat taactatgta tgcagcttgc tttggggcag taggaatggc acattaaagg 13260 caagatctac tccctgaagg cttcagggaa taaagctgta tacctgtctg ggagcattca 13320 tttgaaagga gagggtttgc aaaggagagt gcctccactt gggggtttct tgcttgaaaa 13380 tggctgtccc tgattaagtc acacaggcac ttggatacca cagccttagt ccaagtgggt 13440 caggctacat ttcaagttgg cagtaaaaac ttggtgttat tttccgtgtg gtactggttt 13500 ggcagtcaaa caaaactcca ttcatgcaga ggccgatgga agtttgcacc aaggttatac 13560 aaagctgctg aggtcaggca atatgtaaca atgttacact ctccgcatgg agtcctggag 13620 tttgagccga ctgaatgaag ttgagcccag tttcagtggc catcccaggg gttatgagat 13680 gccagaaatt tggacttttg cagggactga aaagacccag gccatgaaag agcacacatg 13740 ctacagattg cagggctgga gggatgggag tgtataaacc tgttggagcc cagaagatgc 13800 tgtcatgatc tccagatgct ggtcatggcg tgttgcagag tttggtgtct atctgtttga 13860 atttagtctt tctttagtgt ggtattcttt tgatattttc ccattccttc attttagagt 13920 gggtatgttt gtatcattgt acattgaaag tatgttactt ggtttttggt tttccagggg 13980 ctcttagcta aggatttatt ttgagtctca gaagagactt tggacttctg aactatgtta 14040 gaattttaag agtacaggaa ttttttggtc tttatttact tttcactttt ttgtgatata 14100 tatatatata tgtgtgtgtg tgtgtgtatt atataaattt atataataat acacacacac 14160 acacatattt gtatgaatac acgtggaaac cagaggcaag gttgcaatgt tttcctgaat 14220 cactgtctaa cttattatct gaggcagagt ctctcactga acctagagct catccattga 14280 ctagactaac tggcaatccc taacaatcct cctgtcccct gccccccagc actaggctta 14340 catgcatgtg ttgccatacc caactatttg tatgagttct gacaattcag actcaggttc 14400 tcaggtttga gcagcaatca ctttatgaac tgagtcatcc ccccagaaac tccagtgact 14460 tttaaaattg ttctgaatag tgaacggatc ctgcatttag ggatggctat gagaccgtcc 14520 agctaggtta tggttatggt ttgggtggga actgtcttcc acaagctcat gtgtttacaa 14580 acttggtcca cagaaggtag tgctatttca gaaaactaag aaatctttag aagatgggac 14640 ctagctaaag gaagtgggtc actgggagga gttacagcat tgccccgctt ctggttgact 14700 tctttgcttt ctggctgatg acatgatgta atcagtgccc aagagtcctt ctatcccaac 14760 atggagttgc tcctgttttc aggctttcct catcaccatg aactgtacta tcttgaataa 14820 tgagtcaaaa caaattcttc tctcttaatt ttcttctttt aggtattttt atcacagtca 14880 tggggaaagt aacttgtgaa ggtcaataag atctttgcag tgctttatgg gtacgcatgt 14940 ttcacctgta tgtttgtctc tgctctgtgt gtatgcagtg ctcaaggagg ccagaagagg 15000 gcactggatc tcctggaagt ggaattacag gttctggaaa cttgggtcct ctggaacaac 15060 agctagtgct gtcaactgca gaaccaccta ccatgtttca agctccaaga gctatcagtc 15120 agtcagtcag tctgtctgtc tgtctgtctg tctgagtgtc tgtctgtctg tctaaatcat 15180 ggacagttgt gtagccattt cctcagaatt taaacatccc tctaaagccc aggcagtaaa 15240 caaaaagtta catatctcag gaagctccta aaacaagatt cgcagtggtg tctccctgca 15300 ggtaaagaag cagcaaggac ttctgtggag aggagacttg ttgatttgct gagctgcctg 15360 caagcagtgc agggtgtcca atggtgctgt tccaccagtt gttaagcatg ctagggtggg 15420 cttttccata gtgcagcttt gtctgagcca tccatgctcc tgtgagtgag ttcaatacag 15480 acatttgctc accttgcccc aggaaaagtc acacctcccc acagacagaa gctgcccaac 15540 cacaggctcc agggggttgg tagaggaagg gaacagagaa gggtgccctt ctcgtgaggc 15600 tatgttggat gagaaggagc agcatctgtg ggaggggaga acagagtttt ctcatggagg 15660 tggagagggc acacgtggaa tgaattgttc cctcagaaga actcttctga ggaaggggtc 15720 atcaagctgc tccctttcca tcaaaagaag ggagtctctg gtggcactgg agagagctga 15780 tcccatggaa tggtaacaag tcagttttca gaaggttcag gggttgggta gaggactggg 15840 tgtatctgga ggtaggatag tccagggagg agagaaggat ttggctgtga gggacagcac 15900 ttgagcctac agccaccatc tagcagacac ttattttgtg ctaggcacta gggaatggag 15960 ggtttcatga agcttagcat ttatttctag tgggagagat atttaaagtc agaattaata 16020 aaaatgatgc tatagagcca tgagcaacag gctgagggac tggctgggga gcgcctaagt 16080 gtgagcatgg gcctgctcaa gcatgcaggg gacctgggaa atggatttgg ggctgaaccc 16140 agaggaaatg acctttgagg tgagctggaa gggtgattaa ggagcttgtg ctggagctgg 16200 agagatggcc taggggttaa gagcacctgg ctacttttcc agaggaccca ggttcgaaga 16260 ctcacaacag tctataaccc agtccctggg gtctgacacc attttctggt ttccttgggc 16320 actgtatgaa tgtggcacac agacatgcat acattcagat aaacactcat gcatataaca 16380 taaaataata aataaaatct tcaaaaaaaa aaaaagaaag aaaggaaatc aaagaggctg 16440 atgggtggct ccactgagga aggctttcca tgagagtaca tggcatgggc agaagttcag 16500 ggtcaggaaa aagtatgacc tataccacag caaagttagt gtgtcaagaa tgggatgcca 16560 tgcctgggtc tcctaaaagt taggagaatt cactgaatgc tgtaatctga agaaatttga 16620 acttttagag ctgaggaggg gttagtgtga ggcccaggag cagggctgga ggagaatgca 16680 gctgggacag atgatttgaa agaggcctaa agcagtgtgg acagagacca gtcatgctta 16740 gaaacaagca ggctgaccag acatctggtt agcagccagg ggaagcagga ggctgggagg 16800 aagccaagcg tctggtttgg gtcacgggta gatggcaatg ttctttgtgg cacaggggaa 16860 gcctggttct tccatctgtc tgcctcctga ctccatcctt gctctctgga gactttgctc 16920 agctcctttt cttggtcccc atggcaggat gtttcctgtg gtcgttcctt ggggattagt 16980 agctctccta ggttctgttt tccaactctg tctcattgcc actcctggga ctcagaggag 17040 aagttattat ttgctagtgt aatcactggt gtgctttcag gcaaggaaaa aaagggagtg 17100 ctccctgacc ctctggctcc tacccccctc ccattgtcat tcagcagcta tagacaatgg 17160 taggcgtctg atgtgggcga gatctggtgc ttgtgcagaa atgaatgaga tccagtcttt 17220 actgggagat ggggagctga caaagctttc tgtttagtat atttcaaatc caggctatgg 17280 tacatttgaa gtcaacagga aaaggtgcca ggagtggagg tgccgagaag acaggctcct 17340 ggaccccagt gtggccgaca cttgagacta ctttgctgga cagatggagg ttggtctgag 17400 cagcaactat ccttaaggcc ttctggcatc actggtggct ggagcatgca gatgtttaac 17460 actgctaagt cacctgtctt taaatttttt ctcctccctt attggttggg tgggaacatg 17520 tcctggagcc ccaattttca tttctgtcaa gaagggtgag attgtccacc ttcctgggac 17580 tgcctcatga actatgtggg gccatctatg gaagcccttg acacatagta ggtactccga 17640 agccacagga atgcacacac ccttaggagc agcaatcaag aatgtaaggc atgggttctt 17700 acaagaatgt aacgaccatg ctacaagggg agactcatgg gtatgattta tagagcggat 17760 catgaatgaa ttaatgcaat ttgataagaa aaagaacttc aaagcttatt ttggggtgca 17820 tgggatatta aaagtgatcc tcgtggcgaa aaggcttagg ctctgaggtg tggtaccact 17880 tacccaacat tgcagggtga gccagggaca gcacccagac ttacacctgg ggcgctgcta 17940 gtgaggccat ttctcttttc attgaactgc tccccaaggg gtgagtgagc caacttgggc 18000 agtgtccagg ctcccatttc tgacacctcc tgctgcccct aatcctaccc caggcataga 18060 aacgggttcc tgatatcagg tttccagttc agtccaccta ggcttttcag cagggactgt 18120 ccaggaaacc ccttctatgc gaagcaggtg tgggcgtggg aaggctcctt ggagatgaat 18180 caccgctgcc tcctccttgg tgaatcatgt tgaggcttgg gaacagctag ctggtggacc 18240 tggtggggga agagcggaga actacattgc tatgacacat ctccaccacc agaaggcaga 18300 agagggatag gcaaaacgaa ccagcaactg ctgtcgctca gagcttggga gggggtggat 18360 ggaccgggag gactcagctg gggctggatg tgggcagtca gagcctggga tgcctccact 18420 gcctgcctct gtccctgctt ctttgctgga gtatgtcaga acagattggg gcttgggggg 18480 gtgctgtgag gggggtgggc tcatctaccc gatgttgtct gtcctgtgat gtccaagtgc 18540 agatgtccaa ggtcacacag agagtcagag aggcaagtca gtctgctttt cgaagtttca 18600 gaagcgttgc cactggatgg ggcacagatc tggcctccat gtctgagatg aaacacccgt 18660 ctgaggtgtc ctgctgcctc tgtacagccc cctctctcat cttgtccctc ccttcctgct 18720 ttctctgtca ctatcgtgct ctctttgatc cattccctaa atttcttctt ttttgcccga 18780 tttccacctg actttttctc tgacctcttt gtcagcctcc agtctccatc cctgccctct 18840 ggggactttg cttctccatc ccttttctgg gtccccatgg caggatgttt cctgtggcca 18900 ctcctcaggg atttgtagct ctctgaggct ctgttttcca actctgtctc attgccactc 18960 ctgggactca gagaagttat tatttactag tgtgatcact ggtgtgcttt caggcaggga 19020 gaaaagagac tccccttccc ccactccctg ctcctaccta cccaccagtc ccagtgaccc 19080 ctgttgccag ttagcagtca taaaggctgg gcggcacctg gcgtgggcaa gatcctgtgc 19140 tcatgcagaa atgaataaga gccagcattc atcagtgagc tcaccacatg gctagggtga 19200 ggaaagtgga gtacacaagt gaatctgcct aaataggaag acgctaaaga gggggggatg 19260 gtgggggggc acaaggagtg ctttgtatgt gccagagcag gtagaaatgc aatccagttg 19320 ggtgagagaa gccttttaag tggccttcaa agggtagatg ggatctcagc aggagacacc 19380 tgtgtgggag tgtgggtaca ttgtgagcag cagggtcatc agcgaagcca agggtcttgg 19440 cttcaccatg tgcttgtacc cttgttcact cagcgaggag tggcagggag gctggaaggc 19500 aggtgttagc gtgtggagtg tttcactgtg caccttatgg aagtgacaca atgttgtttc 19560 tgagcagaga ggggcctgcc gatggagggg cccctttgtt ccctgttggc ccctcctcgg 19620 ggtggagagt ttttattgcg ctctatctaa agaaggttgt gacaggaagg gaagcatcat 19680 gaggagggga ggaggggtac tcatgtgctt tgggaagtgg gcggcggggg gggggggggg 19740 caccgagcag agaggggcct gccgatggag gggccccttt gttccctgtt ggcccctcct 19800 cggggtggag agtttttatt gcgctctatc taaagaaggt tgtgacagga agggaagcat 19860 catgaggagg ggaggagggg tactcatgtg ctttgggaag tgggcggcgg ggggggggac 19920 gacaccctgg gtggcttggc aaaggcatag aagaggatac tggaggaccc aagacacact 19980 taatctg 19987 <210> 2 <211> 19001 <212> DNA <213> Cricetulus griseus <220> <223> Downstream integration locus <220> <221> misc_feature <222> 13163..13223 <223> /note="n = unknown" <400> 2 gagtttcttg aaaaccttcc ttctctggta gcttcctggt ctcactgcag tgagagggtc 60 cccgagccga cctccgtggc tctggaaaag tacgcttagg tcctcgtcca cacccagttg 120 ttgattcttt gggatgatcg ccctcttgtg gacagaggca ggttgcctat ggggaagcgg 180 gggtgtgggt gtgggtgtgg ggttgggagg tgggggccca ggaaggggaa aaggagcttg 240 gtggagagag ggaggaaagt ctagttggct ttctgtgccc ctgaggaggg ggcaacaaag 300 atgaagctgg ggatgggagt caaagcttag gaagtctggg ctgttctagg ggagacacaa 360 ttcacttatt cagggaatgt cacatggggg catggtttag tttccagcaa acaattggat 420 ttcatctgag gcacatttgt tacaagcaac tcaagggagg gcaggtttct gttaaaagag 480 gggaatctga gcctttccct ccagatacct ttccagggtt agaagaccaa gacagtcagc 540 ggggctcttg gaggggaggg ggagttgatt ggggtgcaga ggctggtggt ggaaagagat 600 gtctggtctc tcaggaggct gacaggctct gctgtgtgtg tgtggcccaa tgaagagagg 660 agcagaaggt gaagagtcca tctgcaaaat aaaacttcat ctttctgggt gtggtggtgc 720 accttttttt ctattttaaa gatttgattt atttattatg tatacaacat tctgcttcca 780 tgtatatctg cacaccagaa gagggcagca gatctcataa cggatggttg tgagccacca 840 tgtggttgct gggaattgaa ctcaggacct ctggaagagc tcttaacctc tgagccatct 900 ctccagcctt gtggtgcccc tttttaatgc cagcactcag gaggcagaga cagatgaatc 960 tctattgagt tctgggctag cctggtctac acatcgaatt gcaggccagt cagggctgca 1020 tagtgagaca cagtcttaat ggagaaaaag gggtgcggct taaaaaaaaa aacagaacaa 1080 aacaaagtga aataaaataa gtaacaaaac ttttgtctgg tttggggata tagtttaaaa 1140 ctgagaagtg aagaggcatt tacacgggaa attttggtgg gtgcagcagg cagggggtag 1200 aattgggtgt ggtcaggtgc acactgactg tttcatttat ccacaagatt tcaagttggc 1260 tcttgagcat ggcctaggtt ccagggaagg ggtagagctg gggacttggc agtagattcc 1320 ttcctctccc aaggggcatc cgccaccttt tcaggcttgt cagagcgagt ggctatgttg 1380 gtcagaggga gaggccctgc tacccctttt cccgtagtag aggttctgtt cttccctccc 1440 actgcatact tggcagtaat cccatagtct agtcaccctt acacccatga tgctggaaca 1500 gcagcatctg tttccataaa gtggtcaggc cccaggtggg gggttggggt gagactggct 1560 caggatgcgt tactggtcct ctgtcaagca catctgaaac tgtcaagaac gaagcaccac 1620 ttcccacagt gtcagtgtcc cacagctctt gcatttgtac aaggagtcac tgtacctact 1680 gtggcctcat ctccgaagaa ttatgtctac tgtgtgttac taaccgcatt caagtgacag 1740 gacagagttg caggacctcc accaaggtgg gggaatagga gatctgggag ggactgcgcc 1800 ctcctgaccc aggccagctc ctcctccagt ttctctgctg tttccagatt taatgtcact 1860 attccttctt tgtatcattc tcttaaatgt tttaattaaa tatcgagaat atacaaacag 1920 cttatatatg acacctaaag tatacaaatt gcaacatgaa acacccactt taagaaacaa 1980 acatttggtt gagatggctc agtgggtaaa ggcatttgct tccagcctgc tgacctgcat 2040 ttaattccta ggatccgcat ggtaaaagga gagtgcacac atgcatgtgc acacataaat 2100 aaatgcatgt aatataataa ataaataaac aggcttggag agatagctca gcagaggcct 2160 ggaactgggt tcccagcacc caagtgggca gctcacaaca gcctcaacgt cagatcagat 2220 gccctcttct ggccacagca tgcatgtgca ctcaattgca cattttcccc ctccaacatg 2280 tatacacgtc taattaaaaa ctaaacttaa atctttaaaa gagagaaaca ctgtagaaga 2340 tatagagcga gtggctcaaa gggccagaga cacaccattt gtgcactggt tcattaggga 2400 tataataaag gaaggagaac aagagcagga tggaaaatat gcccgaggcc aggcatgtga 2460 ggtggagtga agcccactct tgccctcttt gggagctcta ctctcaagga acctctatca 2520 tccagctatc tgagccctct tatttgtttg gttttattca gggtctcatg cactcccaga 2580 agcccttgac cttgctattc cgttaaggct ggctctgctt tgaattcccc attctcttct 2640 ctctcccttc caagtgctga gattacaggt gcatgtcact atacctggct taagcctgat 2700 ccctgtaggt tatttataga aacttcatta ggaagcatga ttgattacat tcctagtcat 2760 tgaccaagtt tgccttcagt cctggagggt ggcaggtggg gatgaaagtg tcaatcatct 2820 aacatctggg tctagttagg gttactattg ttatgatgaa acaccatgaa caaaagcaag 2880 gtggggagga aaaggtttat ttgtcttaca cttccatgta gtagtccatt actgaagcca 2940 gggcaggaac gcaaacaggg caggaacctg gagtcaggag ctgatgcaga ggccacagag 3000 gggtgctgct tactggcttg taccttatag cttgctcagt cttatagaac ccaagaccac 3060 cagctcaggg atggcaccat ccacaatgaa ctgggccctc ccccattgat cactaattaa 3120 gaaaacacgt tgcaggcttg actatagctc cttttattta ttttatatat tttatttttg 3180 agacaggatt tctctatgta accaccgtag ctatcctgga actacctctg tagaccaggc 3240 tggccttgaa ctcatagaga tctgactgcc tctgcctcct gagtgctggt attaaaggca 3300 agtgccacca ccatctggtt atagctcaac attatatttt ctcaattggg gttcccttct 3360 ctcagatgac tctagcttgt gtcaagtttg acataaaact gtctagtaca catataaaac 3420 actttcttat ctctctgtag atcccaaggg ttccagaaac ctttgggtgt ctgaaatggg 3480 aggaagacca taagtccact ttagaatgtc acagtacgtc tgtttctggc tttcttttcc 3540 ttttccccag ctgatctatt tcaatgccga tacaaggcat cccggtatat cttacaataa 3600 tgtttgagat ctcccacttg ttcttcattt gcaggatatt ttatctatta ttggcttctg 3660 ctttaagata tacactttag gggactggag agatggttaa gagcgcttgc ccttcccata 3720 gtggacttgg gttatggtag ttcacaaagg cctgaaactc cagttcctgg aggagctcat 3780 gccatcttct ggcatccgtg ggaactgcat gcatgtggta cacttacatg ccaacaagac 3840 accaatacac ataatacaaa aaatgaataa gccaggcacg gtagcacagg cctttcatct 3900 agcactcagc aggcagatct ctatgagttc caggctaact gaggctatgc agagagaccc 3960 tgtctcaaaa caaaataaaa caaaacccac acaacaaccc tccctaagta aataaatacg 4020 atatatatat ttcagtgtga gatgttcaaa tccacaatgc aacattttag aattttgttt 4080 ggcattgcat tgattctgta gagcaaattt tggagaatat tgactcttca aacctatgaa 4140 catgattgat ctcttttctg tttgtttttt gagacagggt ttctctgtgt agccttggct 4200 gtcctggaac tagttctgta gatcacgctg gcctcaaact cagagatgtg tctgcctctg 4260 cctcccaagt gctgggatta aagatgtgtg catgccacca tgcctacatc tcttcatttt 4320 ttaagggtat tttcaatatc tttgaatgac atgttatcat ttctaatgtt taagaacttg 4380 tattagcttt ctggtgctgt aaaaaaagac atgagacata tctattttag ttcagttttg 4440 aagacttaaa tccacggtag gttggccctg ttgcttttgg gtctttggca aggcagtgcg 4500 ctgtattggg agcccgtggt ggaacccttt gccccatggc ctcgatgtga aagagaagag 4560 gaaggggcca gacccccaat atccccttta aggctatgcc tccattgatg agaagaacgc 4620 tcactagttt ctacattttc accttgtgtg gtatgtgcta ggcaagcaaa agcacaaatc 4680 ttgtggttta aaatacttat tcatttgctc ccaccaagat tgtccctttg tgcaacctgt 4740 actaggtccc tagaaaaaaa cctaaggtca aaggacactg gtgtcatggc cactgctagt 4800 gctctgtcat cccaggagcc aagctccaca agccccacca ttctagcctc cagtcaagac 4860 tccaccctct tggcctgtgt ttagcaaagc ctctatgtac agctttgaat gtgtgtctgc 4920 ccttctcctg cccccctccc ttgaagtcca cccaggttat gtagagtctc accagcagtt 4980 ggcagaactt gtctctcagt ctaccctgct caggctccag acgttcttgc tgccgtggcc 5040 ttcaaggtcc catcttttga aagtcctccc agctcttcct catccccagc ctggaaatga 5100 gactttcaaa ccccattatc gcctatgagt gttacgagtg tcaagctttt taaaggaagc 5160 tgctttgtag agatgtcaga gatgccagga aaggctgctc tcattgactg ctaatggaag 5220 tgtgaactgt tattactgtt tgagaaagta atatagcaag agccacttaa attaaatatg 5280 catgtgcccg gcacccagca gtatcacact ggggttcata ttattgaaat aaaagcatca 5340 tccctcaaag atgcaaatat ataaacactt gggtgaaaat attaattgct ttcagtaggg 5400 ggagaaaaat gaagcgagga agggctctgc atctagggag ttagcaaaag gctagaggaa 5460 ttgtggcgct tctcagaaca acatacgcta accttaaaaa gcaccagagt ctgctgtggt 5520 ggcacatgcc cctagtctca gcactcaaga tgtagaggca gggggaatcc tacaagtgtg 5580 aggccattct ggattttact gtgtccccat ctcagaagcc aggtggtccc aaccctcata 5640 ggtagagctg tgggaagggc agaactccgg gaagggtggg aaggagctag ctgtgctctt 5700 tttggaggtg tggtaggtga actgggagca aggaggaacc tgggagtcac tggctgttgc 5760 agaggtatgt ccaaagagtt cccctagtgc ccacacccta gcagtgccct ttcagagctt 5820 agggagggca actcatttat gtccagaaga agagaggagt ggggaagccg tgggcttctg 5880 cttccatcct tctctcacag gacgactaga accaccaatc ggtaggacct tctgcctgca 5940 gggtcactta gagctttcag atggggaggg tctcacatgg tgcttcctct cagtgacacc 6000 cctcctccct cttcaaacct aaagctctgc gagctcacat tcatccccat ctcactcctt 6060 acagaaggat attcccactg tagtccctgg ggtgttagaa tgaagccgca tggcttttcc 6120 catgatgctt tgcctggacc cagcatggag gatgacagca cactgatccc cagtcttctt 6180 ttctgcatga aggctgttcc tgatttcctc atgagctatt tagaagaagg tccactatga 6240 cttccacctg ctccatgctc ttgcccctct gggttatttc ctccagagaa aagaattagt 6300 aagccaagat gtcacacacc cactagtata gcttcttttt ctatcacata tttatttatt 6360 ttgtgtgtgt gagagagaga gagagagagg gagggggagg gaagagagag agagggagag 6420 ggggagggag ggagagagag agagggagag ggaaagggag aggagagagg gggagagaga 6480 ggaggagaca gagggaggga gagagaggga tggagggaga gagagaagga ggaagagaga 6540 ggtggcgggg agacactttt ttcggtgtaa tttatttatt tatttattta tttatttatt 6600 tatttatttt ttatatattt gagttacaaa caagattgaa ttacatgaca atcccagttc 6660 ccttctccct cccttcctcc cacccccccc aactaaaatc ctacctgtca tatgtccttt 6720 cttctaatct acacctgact caaaatttct gcttcctcat gacctctgca tccttccttt 6780 tcttcccttc tcactctcat agcttcctcc cccctcttcc catgttctca atttgctcag 6840 gggatggtga ccctctcccc ttctccaggg gacaaagttt atctctttta gggtctactt 6900 tgtttactag tatctctggc agtgtggatt gtaggctggt aatcccttac tctgtgtcta 6960 aaatccgcat atgagtgagt acatatcatg tttgtctttt tgtgactggg ttacctctct 7020 cagaatggtt tctttgagtt ccatccattt tcctgcaaat ttcaagattc cattgttttt 7080 tttttttttc ctgctgagta gtactccatt gtgtaaatgt accacatttt ctctatccat 7140 tcttcggttg aggggcatct aggctgcttc cagtttctgg ctattacaaa taatgctgct 7200 atgaacattg ttgaacatat gtccttgttg tatgaatgtg cttcttttgg gtatatgcct 7260 aggagtggaa ttgctggatc ttgtgggggg ggagacactt ttgagagctg tttccttctg 7320 ccatgtggtc ccagggattg aactctgatc atcaagtttg cctgcaggcc cctttaccca 7380 caggaccatc tccctgaccc atttcttcgt ttaacaaagc taaaatgcct tacagtgtgc 7440 acccagtggt gagtgagtat cttccccatt ttctttttaa gagaaaaaca gcctagtttt 7500 cctcttctgt ttttgtaaaa acagccttat tcaggtataa ttcacacgcc acaaactgac 7560 cctatgaaag tgttcagtaa ttcagtgccg agtatgatgt atcacacctg tgaccctggc 7620 actcgagagg cagaagcggg aggcccacca cacattagag gccagcctag gctacacagt 7680 gaatgtcagg ccagacaggg gcatataatg agattctgcc tcaaaaagca ctcccgaacc 7740 cagacaccct caaaatgttc agtgttgtaa atttttaaga atacgttttg gtgttttact 7800 tgtatgtata tctgtgagct actgtgcggt gctgggaaaa atcaggggcc tctactctga 7860 actgctgagc cacctctcca ggtccgatgg agaggtgttt aataagcttg gcattctgta 7920 agcttcacca cgatttgatt tcaggtattt taatcccttt agcaacctga tgcccattgg 7980 cagtccttcc ctctggcctc tgacagccac caactttccg tctctatgca tttgtctact 8040 cggggaattg catataaatg aaccactcag tagcctttca cgactacttc acttgttttc 8100 agttcatttc tgctgcagca cacatcagca cttagttctt tttatgagta gcatcccata 8160 tgtacatgct acaatgtgtt catatatgta caatggctga tgaacatctg tgttatttct 8220 acatttaaaa aaaatgctgt tctaaacatg agtgttcaca tagggtttgt gcagatacat 8280 ttccaattca tctgctgagg gacatatgca ggcatggatg agctccttct tgtgcacaga 8340 aagcaaatta catggatttt cacatcgctc accctctttg tgaggtagaa acaagggcat 8400 taccgtggcc cttggtttcc tgtgagcttc ttatcagggt caacctcatt agtgctgtac 8460 aattctacct ccactattgg ggtgtttggc tcagtctcca aacacacttt ccagtccaca 8520 tatcttctga gcagagcaga gaagacctat ttgtctacaa cctgggagaa tccagctgtc 8580 tgatctgtgg gtggtgctga gaagtacagc tcaccagaaa taggggtcct caggccatgc 8640 tgccacagtg gttcttgcca ggcttagcag aagtgttatg taggtgcctc aatgcccttc 8700 ccagagcttt ctgaagctgg gagggcaaag gagcctcaga ggccctgctg tgttagtaca 8760 gtcacagtag ctgcataaag aaacaaaaag ccccaagaaa caaaaatcac ctgctgagtg 8820 aaatccccta atgaacccag cagctgggag gcaggaggca ggctgccaag gtcaccatag 8880 caaccagaaa cagagccttt catacagtct ccctgactct tcagagagaa agacctgtgg 8940 acctctttgt gaccttttgg cttctcttgg ctgctcaggt tgtttcccct ctcatcccag 9000 gtttgacaac tcttctctga ttggtgatac ttttcccacc ttatttgcat acccatatgc 9060 agctagctag ctcccctacc cccgcccctg cacatctatg aatcttggca gagctagagg 9120 tgctccagga gcccaccaag gaggaagaga aggaagactt caaagcctgc cccctgggtg 9180 gccagcagcc tgattccaga tgttcctgct tgctccagag atccttcctg aagacttcag 9240 ggtctggctc ctccctggct tgctcattgg agaaggaaga atgccttcca gaatcaccag 9300 ggacaaagag tagaaggtcc ttgggtccaa ggcttctgcc ctggtcagga agcttgctgg 9360 attccaggat ttgatgagca ggtgcagtgc aggtgcaggt gagggacttg tgtttgtctc 9420 agcctccaag attcttctca cttggtgacc tacagatggg aatttccctc tgcagcagct 9480 tttaccctct gagactagtc ttctgagctc agcagctcca aactttcaga cccgctttgg 9540 agacttgaga ttccagcttt ggagatccaa tgctccagag atctgtgact tcagccttct 9600 cggaggcctg ctggagacag aaggcctgct tctgttattc ccattgctgc cctgcaggct 9660 tgctccacaa ggcagcagtg ttggcacaag aaggcctcca gcctttgaag ttttaacaat 9720 tcccagaatt ctaacacttc tcagagctag taccccagtg ctagcttaaa cctttgccat 9780 ttaaatcctg catggaccac ctgtttaaat ttttatccta tttaaaggga actaacaatg 9840 aagtaccccc cccccctgca atttgtactc gtcactgccc actccatcgt ggaggaagac 9900 ggaacaaaaa cctggttgga gacagatggt ggtctctgct gattgttcca gaagggctgt 9960 ctgtggtaaa aagttaggtt ttggaatatg cagaattaag ctgaagcctc attgtgagct 10020 tggtgtggtg ctcatgcctg acttcgggaa cttagaagtc aaggtgggag aattaccagg 10080 agttccaggc caggatggcc tacacagtgg gcaagacagg gctacagtga gaccgtctca 10140 accaaactaa accaaaccta ccatgccaca tgaaaacaaa acaaagcaga tcaagcccac 10200 aaaacaaaat aaccccagat tggaaccaaa ccatatcaaa tcttcccttt gccttagatg 10260 tgggcatagc tgtgtggagg ctgaaaaaat tctcaaggct cagtttggtc atcttcaaat 10320 ggagataaac atggcttcct gttagggatg ctttgtggtt gaaaggaaag aaagcattta 10380 catcccttag catcaaatag agttaatgat aactattgct ggtgtagtaa aaatgttact 10440 agttagtata gtaaatactt atgaggtagt ggttagagta ggttgaaagg caatagcagt 10500 accattccac aattagatcc ctcaaaactc gaggtgggtg agggtggggt gggagccgag 10560 aggccatcac ttctttttat atttatttat ttatttattt atttatttat ttatttattt 10620 ggtttttcga gacagggttt ctctgtgtag ctttggggcc tatcctggca ctcgctctgg 10680 agaccaggct ggcctcaaac tcacagagat ccgcctgcct ctgcctcctg agtgctggga 10740 ttaaaggcgt gcgccaccaa cgcccagccg aggccatcac ttctatggag gagaaagcct 10800 catgttggtg gctggtcgag gaggtaccag ggttctggtg agcatcaggc tgaagggacc 10860 aggcctgggg ctgagaccag aagtagtgag caaaagtgtg agcaaacagt gactgaagtg 10920 ggacatgggg gcagggtcct tttaagggac acggggatcc ttctttcaaa ccttgttaac 10980 acgacaccag cacccgaaag ctgatggatg ggatagtata ggaataaaca tgatacctgt 11040 gcaaatagaa gttgtcccca gaagaatgcc attttgtaac cgttcaaaaa agtcagccac 11100 agggccacag ggcccagctg tcaccagctg ttgctatctt ttttttttgc tgtaaacagt 11160 aagaacaaaa ctcaacaaaa gatggaagcc agctggggca gagtgaggcg gaggtgtgag 11220 cccactgtat caggaggtcc tgcagagggg agcgcttggg gagggagtgg gctgtgggag 11280 gctgttgaga cgcttccagg aggagatgcg tgtggatgcg ggcatccaga agaagcagtg 11340 tggccagtca gaggaggagg ctggcatgaa tgacactgta atgccatcta caggggcgag 11400 ggactggtga ccaaggtggc aacagtcata gacagtggat atgggctgtg gtggacagtc 11460 aggcctgcac ttcctgaggg ataagggcag ggccagcaac cttcacaaga aaattgaaaa 11520 gccactcagt attccagata aaaaactcaa actgaaaatt ccaggctctt ccgccccagc 11580 aatgatgggt tttcatattg tcttccaagg ctcttatgtc atcatatggt gactcacacg 11640 gctgggcatt ttatattttc tacttgacct gtggcatata ttgcccccac cacatgcata 11700 aagtattccg ggtacagtag aaggggtcct ctccactaca ccaagaatcc gggggtgccc 11760 attgctgtat agttgtctta ggggtctcag ggaagctgtc ctgctggtgt gtgtgtctgg 11820 ctgtgcaggt ctggctttcc ctgggcagag cagcaagagg gatttgaaca gagaccaaag 11880 ggttgaagaa tgaagggtca gccagaagag ctgtaggtgt accctacctc caggggtaca 11940 gtttctcttg ccctgaatcc cagcatcccc agagggtgac tgtggtctct ttgatattct 12000 tccaaccctg caagttccaa gtctccagac ctcaccccct tgtggacacc ctggtccttt 12060 tctgtttttt ttcctgacaa cccccaaatc tctttatcct ccactataga aacccagtgt 12120 taactgaggt ttaaacgtag agcaatggga aaaccggttg agcctgggag gcctcattct 12180 tagtgattgt tacagggggc aaaaggtcaa tacttgtact tatatgtttc acacggcagt 12240 aaaatatgga tggatacttt gtattttatg tagaagtttc cagaacctgt taagtgactg 12300 gaacaacata cttaatatat tttgaaaaaa attagaaaga tactataaaa aatcacataa 12360 aaggggaaaa aataactccc ctacccccaa tcttcaacta agcaagaagt tccttgtgcc 12420 ttctcttagc tcaggtgaga gatgctcagt ctgctccagg gggctgctct tttattgcag 12480 tcctccctcc ccaccctgag gacagcactc gtgtttcctc atcaagtctt cccaggaaag 12540 catgattacc attttaatgt tagaaagagc tatttgctgc tgccatgcag tggttgctaa 12600 tgtcccttcc tcctggacac ttgaggctgt ttctggttgc acttctctga attaccgagg 12660 gcttgtggag actctactaa caaaagcagc ttcaccagca ctgactttcc acagcaggag 12720 gcttcatcag atccctcact tctgtgactt gtgctgagtc ctgcctagtt tgtcattttg 12780 ttttgacaag ccattcattt ctgcagccca gagccacagt gttagtttag gaacactcac 12840 atctaactgt ttgaaacttg actgtttgct gatttacaaa tttggtagta aaaactactc 12900 caaggtggag ccaggggata gctcagatgg ggtcccctta aaaagctgtg tgtggtggtg 12960 agtgcttaga atcccagaac tggggaggtg accagtctta gagattccct aggactccct 13020 gaccagtcat cttagcctac ttagcaagcc ccaggccaat gagaaacccc atcttaaaaa 13080 aaaagggggg gggtggtttc tcagttttaa cagataacat ctataacaca gctctcaccc 13140 tgaggtttag ggatcatttt ggnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 13200 nnnnnnnnnn nnnnnnnnnn nnnagtggaa agattgtaag agccagaggg acaggaagtt 13260 tgctatgaga ttggtgggga catcgggtga gttgcagcaa atctcctgtg gccttcagat 13320 gctatttgac agtttgctta gctttgggtt ggtaggaact agtggtctgt cactacactt 13380 caggagggtt tacaagacag tcataggaag ttaagtgaga cacagggcca gaaatgaatg 13440 gttattaagg gaactaacga tagtctgaga tagtttggct ctaggtctgc acggttctga 13500 tgcttaatca caaagctctg agcagtccgt ccagcttgtg gatctgtaac aggtgtggct 13560 tcttttctgg aaacttcagt tcatactccc tattccaaat gtaggagtgt aagacgctcc 13620 ctttctcctt tgtgtccccg tctgagctca gagcctgagg gcaggaatga tggagcccac 13680 aggatctgca caggtgagga gactgtcttc ctcttctcca tcagacagga ggaagctgat 13740 cagcccgagg tgtctcattc cccatccttt agcacctcct gctggccact ctatccccat 13800 tcatgtggtc ctgccaggtg gtgctaaggg atctctgggg gagcccagtg gtcagctagt 13860 ttggacatta gctggttgga gcagaagtca gaccggtttg ttcctctcag ggttaagtta 13920 ttgggctaca gcagagcata ggctcccgta gggaagagct gagctaagct tttctgtgcc 13980 agaaagctat gcttttctgt atctgccgtg ttgcagttga atgtgctttt gttctctcag 14040 gccaaactga tcctgtaatt caaaccctcc atgggcttca gccacaggcc aggtcctaac 14100 tctaagtttg cacagtaagc cctccgcagt tgggtctctg gttctttcag ttcattttct 14160 gcagtttgta ctttttctct gggccaaagt ttacagctgg gcagaaagat tcctggacac 14220 acacataaac caaaccaaaa cattcccaaa cacccccaac ccaataaaaa cacatcccct 14280 cccaataaac ccccccaaat ctttcctgtc agttatcttg agaaacctgg gtcttgatgg 14340 gatgtgtggg caaggtgcca tttgcctgac ggtgcaggca gaggcatcac agtcctctga 14400 gagactagct attgaaaaca agcaaaaaat gcacctggac ataacaaagc cagtgctaac 14460 acgttacaaa gaggatgcta agggcagata aatgggggag aatgtgtatc tttcatgcag 14520 aaaattttgt tgcaatgtag caattttgtt tgctaacagg tattttagga gaaaatgatc 14580 taacagcact aaactggaga caaggcatct actaacctca ctcggtagag cccagcctgt 14640 actgcactgc tgctggcaaa ggagcctggt ccatgccaca ctcgggactg ccctcttctg 14700 atcctgcacc cttcccacct ccctgtcatg ttccaaccct cccgaccttc tataaccagc 14760 tgaatgttgt ccactcagtg acatctcagg tcctgggctc tccactgtcc tgatgtgttc 14820 agttcctctc caacagtcct tgcttcaaga ggatgactct ggtttgcaag actgtccttc 14880 cttcactccc cccttcttcc tatctctccc ttgaatatga actgagatac ttgtgaaagg 14940 gccacatcac gctcctcttc atttagcgta agtcctgcca catagtgggt gctcagtaaa 15000 tcttggctca cacgaaggag ggttgtgggg aaaagggctg ggggtggggt tgtggaggga 15060 aggtgctttt aggtaggagt ctgatccatg aacgtcttgg agaatgagcc agaaagatga 15120 agcatgtgag attaggcctc atgggtgtgc ctgtgagact tcagtcacgg ggcaggggtg 15180 cctgtgagtc atcgtctcag ggatacctgg agggatcagt tctgaatgct gcattcattg 15240 ttgcgttcct gagtcaggta gagcaggtgc ctatgagtca cgatcactga cttcctgaag 15300 tgcaaatgca cacgagacct tgttctcttc aaacaacaca ctcccagcca ccatgctcta 15360 ccatggataa aatcatggct ggccccatag ccttcttagt gtctctgagc tcatgacttc 15420 caggggtaga gtctatctga aggtctctat accagttcca gtcaaagggc ttctactgct 15480 ccagctgagc ctgccctgca gtggggaggg gacatgtggg aagccttttc attcttttag 15540 tcacctgtcc ccacactatg tgtctgcttg cttttctaag tagggggaat agagacacaa 15600 gtctccatcc acactgttgt cctgtaggta ggccctattt ttcagggatc tttatctgac 15660 cttgggtctc caacaattac cctccacccc catcagatag cagcacagtt gagccatttt 15720 tcctcattgg ctttggggca ggcagctttt catttttaga atgtctcaca caccagtcag 15780 gatctgtttt ctttattttc cattcacgac ccagctcaag tcaattgaga ggttctctta 15840 gcgagcctct cgcttggtct gtggacacag tgcctgctct cctcctctat gggagtgagg 15900 tgggaacaaa tggcatcctc ctaacaccca gctctctctc tgaataatcc cagactgtct 15960 ttttcttgag gcgaggagag gtttattgtt tgctttgggg ttaacctcct atctaattcc 16020 catagaggac caagagcttc tctagaaagc tttgaaacat attcccttta cctgctattc 16080 ggggccactg taatcaaagc agtgccaata tttagcttcc tgtgtcattg gggtctgggg 16140 aatgagtgaa tgaatggaat tatagttggg aggtctcagg gtagtttcct ccaggagtga 16200 gaaatgaggc taataggagg agagaaggct ggcaaggagg cagcaaaagg ggctcagctc 16260 tgggttcccc tggggcagac ttggaggctt gggcttgaac ccgccatctt gccagctgtg 16320 tgctcttggt aaatgtactt gttttctgtg caagttgcct catcttgaaa actcagacaa 16380 tcatagaagc tgccacacag cgctagtcca tttgcaatta tgtcttcttc aggagatgct 16440 ttatgtcagg tgtcagcatt gttggaatga ttgatcctta aaggccaggg ctagcgtgcc 16500 agcaggtcag agagtggttg ggaggtgaga gtcctggggt gaggaatttg gtgtagaaga 16560 gaagttggtg tctggctcct ggtggagtgg ctcctggaga agaaagctga agctgagcac 16620 tgttcaggct atgctgcata tgggtctcag cctgtcctgg aggatggagc tcagcctgtc 16680 ctggaagatg gaccacatcc tgcatgccag tgtctccacc gctgtctgtg agggccttcc 16740 attcagcctc aggcctggag agggccccag tggccagggt cttgtgcact ctaagtctgt 16800 ttttttccca ccccatcttc agggccagct cttacctcag gcccacagtc acaggggcct 16860 ggcctgggct catgggaact gattcatggc tctggcttct cctttgcctg gcttggagat 16920 ggaaatgctt gttcatggag ctagtgaagg agaccagctg cacagctgca tgaagctggt 16980 gagtccaatg ggactgggtg gtagttacaa aggacccagt aagttctgaa tacccagagg 17040 agggttggaa ggctaggtgg tccttgctgt catccttgca ctcatgttca tctgtccagc 17100 cactaccctc ttacctttct gatgctttgc ccctcatttc tagggcaaca atctttctga 17160 tttccatgca ctcctggcca tgctttaaaa tctaatactg agttaccaca gtgtggctgt 17220 gtgactacag acctggatgg tcctggtccc ttcatgccag gaggcctgga taagcctctt 17280 gtgtgtactt ccccaaagtt ctgacatgca ggaggcaccg tacagcagcc catgattgca 17340 gtgtggttta gcacacatag ctgatgaaac aagatgacac ttgtagctga ccctggggtt 17400 agagtgagag ggtgtggtta cttgagggtg agtttggaac cccattagag ttccagtaag 17460 acaaggctga ggatgtgagg ggaaaggggt gctgacccgt agctgacacc ctctgaaatg 17520 ttctgaggaa gtggaatcct ctggttattt tacacaccac caactcctca caaacgaagc 17580 atcagagggt gtccctttct ccaagccttt aatctagctt ttgtggatgc tgtcaccctg 17640 accacagtga ctgttcaaag aggtggacat gtgacctgaa tcagaccaat cagagctgta 17700 aattaacctg gtcttttatt cctaaggtta taaaatcaca atatgaaaaa tattcctagt 17760 gtgacagagg aagaagaaat taacacacat aataaccact gactatagaa aaagaaggag 17820 cattcagagg acaaatattg catcttcaga gaggcagggg cagtggggca tgtgggggca 17880 tgtgttcagg aaatgatttt ggtggagatg attgcacaga gagctgggtt atatagtggt 17940 atgagcacct ttgcattgca aattagcata tatagctttc catcgagtag cggtgtaaac 18000 tccataggcc ttttgtttag caagagaaac tccacaaggc aattggaaac caaatgatac 18060 agaaactgtg caagccatgg tctaggaaga aagcacattg aaaacatgct attggacaaa 18120 tgatattgaa cgtcttaatg gttttagttt accagatggt gacaacaaag tactttagac 18180 ttggtgactt ccccgtgctg gaagctggca agtttcaaag gaccagaaga ttcattgttt 18240 ggtgaggcct atttcttggt gcatagtagt ttttagttgt tttcatccct agtcccctct 18300 ctcatctccc tccctctctt attgaaccct tcttccagca aaaccccctc ctattttcat 18360 gtctttgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgacccact gggcttaatt 18420 agagttcttg ccagagagtg agtgggatgt tattttctgg aggatgggga acttactggc 18480 tctacgatga agaaaatgga caccgtctac cataatagct gctaacttct catagtccct 18540 cagggaggtg gtcattggat ccctccccta tccatgttga aatgttgaag agtacagtca 18600 tgtgcacgtc ttgttcaggt gaacacagct gtgttgaggt catgtctgga agaggtcttt 18660 ttggatgcgt ccttatatag cagaaggatg aaggaacact ggggttcact aattcagtca 18720 tagggtctgt acctgcacag cctaattgcc cagtaatact gggggctaag ctttgacata 18780 tggaattggg ggctgtgggt ggcatagaca gcggtctata gcgaaatgaa gggaaaaagc 18840 gtttactttg cttaaaccat gaaagtccaa ggttgagatc atagatcact agacaaggag 18900 tgaagagtta actgtgcaat ttctgcctgt gtggcaagtg gtaatgatgc tgcaatttgt 18960 agctctacca tcccatacat ggtgtgtttg gcttccagtt g 19001 <210> 3 <211> 7318 <212> DNA <213> Cricetulus griseus <220> <223> Upstream side cluster <220> <221> misc_feature <222> 1303..1359 <223> /note="n = unknown" <400> 3 ggatcccaac actgccactt atgactgaac tctgggcact cgcttatagt gtgtttcctc 60 atggggatgt gaatagtcct ctcataggag gaggacggga cacacgaagt tcttactgga 120 aagcctgaca ccgtgtgtac ctagtaagtg gaagttgaat gaaaatgagg acattgatat 180 ggtggaagag aaggttttta ttgtagatat gagggagaga gcagccagag gcatctggaa 240 gagtccagac tgaacagggc cagcagaata gacccagcca tgagagaaga gagagggaca 300 agagagggga ccaggaaagg cgaggaccaa gaggacaaag aagaaccaag agagcatgtg 360 gcaaaaatgg cgggttatat aggaaccata gctggggaaa gggaagcaaa gctcaagggc 420 tggagaggtt tagggtggga gtgggggtaa gaagtgctga gaggagccag gactttgtat 480 caggtacttg caatggagag agcctggctt tggtaggcta aataggcacc acagttagcc 540 atgtgtctgg gggtttcttt gggatctgac attccagtct ttttgttgat gataacgagt 600 gatgtaatct cttctgtaac tgcttcttag ttaaaattgg ggcattgttg ttgggggcct 660 aagaaggctg gaagtttggt caaaggctgg gaagagaaga gtgcaggctg gaggacatct 720 gttttgctta ctgcccaggt tctgagggac cacctggggc tagtgaagtg caggctgctt 780 tggagtagtc taggatttcc aagaaacacc tggagctgga gcgttgcagg cagttttgga 840 gcggtctcca ctccagctga taagaaatct gctggggcag gtgtagacta gggacagaag 900 gtaaagttaa ggagcttagg ggaaattttt atcttgggtg tacatttgaa acttccaggc 960 ccatggtcct ggtagttgca gtgacagtac agggagaggt ggggagttgg gggcggggga 1020 gtaggtatca agaccagggg agagagagaa atcttaccct taggaatagg caggtaggga 1080 aactttgttt gacctgtgag aagtggaccc aagtctcaca actccctgaa gcttacaaga 1140 acattttaag tttatagata aaaattttat atatattagc attatcagtc tttgtaatct 1200 gtactgaaat ccacattgta gaaaaagcag ctggctcaca ccttcaagtc acaataaaag 1260 cttggaaacc gcccgccccc ccgccccccc accatgatga ggnnnnnnnn nnnnnnnnnn 1320 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna tgatgagtta aaagcacgaa 1380 catgctttcc tctatccaga agactgggtg tataaaaaca cttttaaggc catacttaga 1440 aaacaaccag acaggtggta gtggtacatg cctttaattc cagcacttgg gaggtagagg 1500 caggcagaat tctgtgagtc tgaggccagc ctggtctaca aagggagttc caggacagcc 1560 aggactgtta tctagagaaa cctccctgtc ttgaaaaacc aaaacccaag ccaaacagaa 1620 tcaaaacaaa acaccttttt agaccctcac aactaactta agctttcaca tcctttacat 1680 cttgcacgca tataaacttc actttttcag acccttagaa cttatacaag cttcaaacct 1740 ttctttctac ccaaacattt actatgagac acacgtggtt ggttcctgag agcagtcatt 1800 gcaaagcaag ttcctttaaa taaaggaata gtaaaaagtt acactgaaac ctgttttggg 1860 agtttatctt tttcagtgtg aagtcttcca ggaagataaa gtctgtctac ctttctcagc 1920 gggataccta gtagctcata tcatatgaaa tggactgacc aagcagctgc agccttggag 1980 aaggaactga tttgcttgct gctgttaaca taaagctaca gttagtcatc aacagtatcg 2040 gagactcgag agggataaat tatagcagaa agttaatcca aatggcccct gtaccagtta 2100 aagtgacaga tttattggct acctagatgg ttagcctaag tgttccatgg tggtcttgat 2160 ggctttgttg ggggcagaag tatttggtct ttggctgtca cacaggatag cattaaatct 2220 tcagctacca cacaggacaa cattggtctt tggctgctag acccagagat atgagagatt 2280 ttcctgtgga ggaagacctt ggaaaactgg cataccttga tgaggaagag taggatagtc 2340 aacccaacaa tgtccacagc ttgggcagaa acattgtggt tgaggcatgg gtcagttctt 2400 tgcccagtgg ttagtgttac cacaatctag gtggagtagt ctgtgcccca ttatcttctt 2460 tggagacttt agggtcattg ctaggggtgg cagttctgtt tatcacagga agtttttttt 2520 ctattaaaca tttaaagtgc catattcagc agatctctga ggagtttgag gaccatcatc 2580 tattaagtat acttgagtta aggaagcttt acctggtttc agttacttgc tttaggctta 2640 accttgaaaa acatatagag agcccagtgg tggcgcatgt tgggaggcag aggcaggtgg 2700 atctctgaga gttcgagacc agcctggtct acaataacta gttccaggac agcctctaaa 2760 gccacggaga aacccagtct caaaaaacca aaacaacaac aacaacaaaa caaaaaccca 2820 aaaacccaaa ccaaataaaa ccatatgcag aaggctaaat aaaacttgtc cctgtaaaca 2880 aattgcattt gtacttagta tggcttatga gcatagtttt gagtaaagaa tttgatcatt 2940 tataaggtgt ctggctgttg acttgcatgt cttaattatc tttaacagta tacaacaagt 3000 tagtacttat ttttaaaaaa taagatcagg attttatgat tttagccctg ttaagtttga 3060 gcattaaaaa ttgaagttta agaaacttta gcatcaaaat gaaactttaa accataaata 3120 aattctgcag agagaccggg gacttaacaa aaccataaat acagtccaag ggggattggc 3180 aaccttattt cttgatcctt tttttttttt tctttttgag atggggtttc tctgtatagt 3240 tttggctgga actcactcta tagacaaggc tgtccttgaa ctcacagaga tctgccacct 3300 gcctgcctct gcctcctgag agctttaaac ctgacatctt gatcctttta tagtaaaaga 3360 ctacagaatc agtttcttgc atgattcagt ttattccaga agacagagct tagaaaagtt 3420 agcaaagaag aagaggtgag acttacatct gcaagtcagc tactgttaac ctgagtggat 3480 cttaggaatt tataaacctt atttatcaaa tacacattat ttatcaaact tgttgtttag 3540 tatttaaaat gttccagaag cctggtattg aacagttagt aaagacaaaa gcagttagac 3600 ttatgtctca atgaaggggc cagctcccct ttcggcagtc ataacggccg aacacgtgct 3660 ctatgacctt gtcctagaca ctagaaagtc agatgcctgc ctcttgacaa ggaaccaatc 3720 agaagttagc tggtggcgct atgctttacg accctgggtg tactttcgga caagcacaca 3780 gcaatgatgc agagcatagc aaccacccta tgggccataa caaccagttg gccaatcaac 3840 acagggcaag ccctccaagc ctggaggtta caccaatagt gaccctttgc gtacccctag 3900 acactcccct tacgctgccc tataagatct cggtcctgtg gcttctcaga gtcttttgcg 3960 agccctccgc catggagggt gggtgaaaga cccaagctaa catggggtta gctcgttaaa 4020 ttacaataaa gcctcatgca gtttgcagcc agctctcaaa tctgcctggt gatttgggtg 4080 actgtggtcg tggcctggga ccccggatac ctgagttttc cgggggggtc taacaaatcc 4140 aagttacata tatagtattg tctaaacaag aatagaatca ttgctggtct gtggtggtcc 4200 atgcttttaa tctcagcatt tgggaggcag aggcagtctg atttctgtga gttcaaggct 4260 agtctggtct acagaacgag ttccaggaca ggctccaaag ctacacagag aaaccctgtc 4320 ttgaaaaaca aacagacaaa caaaaaaccc aaatacacac acacacacac acacacatac 4380 acacacttat atatgttgca gcaaattaaa attacctatg tatagatttg taaatataaa 4440 ccttttgtta taagttttaa gttaaatttt gttacagatt ttaaaaacat acccaatgaa 4500 tttacaaatt ttgaggttaa caacatagtc ttaagatatt ttttgagaac agaaagcaaa 4560 gaaacagtaa agataatttt tttccagaca gggtttctct atgtagccct gaaactcact 4620 ctgcagacca ggctggcctc aaactcagag attctcctgt ttctgctggc ctagtgctgg 4680 gattaaaggc atgtgtcctc actggctgag ataaaagatt tttaagagtg gaaaatagaa 4740 aaaccttaag agttgagact tttttggaag tgtaggggag agaaagttta gatatgagat 4800 ttggggaatc atttgtttgt gcagtggcag aggttgttac catatgagag tatttgaaac 4860 cccgtaatat tgtcaagttt tggctgttga ttgagctgta ctgagaccaa gccgtttgca 4920 gtaagacacg aggctttaat gaagtctcta agtctgagga agaagagaga aaagggtcat 4980 ataaggccca ggagaatgta aggaagcagt ggggcttcca ggtggaagct gagagacaga 5040 aggaacaagg gtcacagaca gggactccgc ctgagggagg attccaatat tgtagaggcc 5100 cagaaggatg aaaggaagcc atgggactgc aattcctagg gagaggggaa gaagttccag 5160 gaacagtgga gaacaaagga agcagaggag gtgtcatgat gataaggatt tcaacctggg 5220 gcatccccaa tggaactgag agacttgtca gagagaaatg tcctagatca tagaggagag 5280 gcatcatttt ccatgtgata ggggctcggt aggatgagag gagctttctg gcataccagt 5340 gtggcttttg tagtaataat agacaaatta ggcaactcca gggtgacact tactcagtag 5400 aggagaagag acaagtggtt agatcagcta gaggagaaaa cagctggagt ggactaggag 5460 aggcttttgt gagaagggaa ggttccagta gaacagtggt tcccaaactt cccaatgctg 5520 caacccttta atacagttcc tcatgttgtg gtgaccctca atcataaaat tattttcatt 5580 gatacttcat aactgtaatt ttgctattgt tatgaatcat aatgtaaatg tctgtgtttt 5640 ctgatggtct taggcaaccc tgtgaaaggg ttatttgacc cccagagggg ttgtgaccca 5700 caggttgaga accactgcaa tagagggaga ggagtaagta gcagagagat gcccaagtgg 5760 ttgttgccct caagggcaca gcaggcacca ggagccacac agacgctttc tgagtagatg 5820 agaagagatg gatagttaga acaggtggag gggagaaaag aatgaagagg caggctgtag 5880 aatttgtagt caaatttgat gggtggcaga agccaacaga aacaaatgat ctgtacatac 5940 ttcagtagag tcaaatcagc aggttggttc tgttaagaga gaggctgatc caataaaaaa 6000 atggagtaca gatctaaaca gagaattctc aacagaaaat ctcatatggt ggaaagacac 6060 ttaaggaaat gctcaatatc cttagtcatt agggaaatgc aaattgaaac aactctgaga 6120 taccatctta cactgatcag aatggctaag atcaaaaaca ccaaagacag cttatgctgg 6180 agaggatgtg gagtaagggg aacactcttg cattgctggt gggagtgcaa acttgtcaat 6240 ttctcagaaa attagcaatc aacctacctc aagaccctgc gatacatact tttgggcata 6300 tacccatgta ctcatattac aaggatattt gctcaactat gttcacagca acattattca 6360 taatagccag atcttagaaa caacctagat gcccctcaac caaagaatgg ataaagaaaa 6420 tgtggcacat ttacacaatg gactactact cagcagtaaa caacaatgac atcctaaaat 6480 ttgcaggcaa atggacagaa ctagaaaaaa aaaaaacaca aatgagtgag gtaacccaga 6540 aagacaaata tagtatgtac tcacttataa gtggatgcca gacataaagc aaaagatacc 6600 cagcctataa tccacaaccc tagagaagct agaactctct tccagaaaca gatagaagca 6660 gatgcagaaa tccacaacta accattgggc tgagttcctg gagtacaatc aaagtgaagg 6720 aggagtgaaa atatgaacaa aggagtcaag accatggtga ggaaacccac agaatcagtg 6780 gaccggagct agtgagagat cactgactca ggtctgacaa atggggaacc tgcataagac 6840 tgacctgact cccttaatat agatgacagt ggtgtggttg gggtaatata tgaggccact 6900 gacaatgggt ccaagttcta actctaatgc gcaaactgac ttagtggagc ccattctata 6960 ccttgctcag tctagacaca ggggtggggt ggggtggaga ggtaccttgg tcctgcctca 7020 aggagatgat gggacagact tagacttcct agggaaggcc ttcccttctc tgaggagcag 7080 atgggaggtg gggggggcag tggggggagc agaaggagag gaggaggaag ggggaactgg 7140 gattggaatg caaaaaatta attaaattga gaaagagaga gagagagaga gaggctgagc 7200 cctttggaag gaaggaggat catatgtgcc ctcctgggtt tcgaacatca gatgaatgaa 7260 aacgaaggtg aggacattga ctgctcctag gtcaggctga ggagagggtt ttattgta 7318 <210> 4 <211> 27456 <212> DNA <213> Cricetulus griseus <220> <223> Main cluster coding area <220> <221> misc_feature <222> 25795..26498 <223> /note="n = unknown" <400> 4 tgctgtgcag gctggtcccc atggtgaccc tggcagagta ctgggggtcc cattctgcta 60 gctctcagat ttcagtgggg tcaccatcct catctccctc gtgccgcctg gtgaggggct 120 tcacactggt gcttgtgggg tggtgtttct ggctgcagct ctggccctgg ggagcagggt 180 gtgccgctga ctcaccacct gggcatctgg gcctggaacc atgggtgagt cacccagcac 240 tgggggagca gagagaggct gcttgaagtc tggagaggga agagaactgg gcccacagga 300 agggtggtgc ctactgggga tgggataaag agcagaaggg ggcagtgtgg agtctgaagt 360 cttgaggtca gctcttccct gaggcccagt tgaaggacac agtgtttgtt tttctccatg 420 aagaagacac tggggacagg tgagggcctg agggatagcc atggttgggt tcaggctcct 480 gttttcagct cggggttggg gagccattcc cacccactca cctttctgtg aaagaaagaa 540 gacgaggttc atgtctcctt ttcttcctct tttgcattct atacagactg ctgctcactg 600 cgtctgtgcc tggtgcggaa caattgccgt tgctcatttt gcagtagttt taagcacacc 660 cactcacttt gctaccctct ttaagaggga ttctggtgcc ggacattcaa aacaaaataa 720 acaccaaaag atttcttaga cctcctgaca tcgtcctcta gatgcctcca gctgctcttt 780 tggacccggc tttctaaggg tggcctggac tgattctctc catctctttc tgtctctctc 840 actcacacgc acatgcaccc atgagcacag gctgtgaagt ttcctcccac cctgtgtccc 900 tgcaccctct gacacaggac ggagctgtga ctcacaggca tactatgaga accaggcttg 960 gaatgattct ctaggcccca gaaaaaaagc tgtcccccca cccccacccc cagtccctga 1020 ctaggctccc ctttcccaca atgcctctgt ctccttgctg aggcctgggt gagctcaggg 1080 atgcccttgg ctgggcctgg aggatcctcc agttggtgct gaggccagta ctgtctgaga 1140 gggagtggac aagagggagt gagcccagta gaaggatgtc agattttatc aagatcaggt 1200 tgggacaggt tctgtttccc aaaaatgaca aactggaggc cagtctggca tataattccc 1260 tgcccttgga gtcttggcta ctttgctccc tcctgggcat ctctgcaacc tggttgtgag 1320 tgtctctgtc ctacagagga cctgggtttc gatctttgtt ccgatatctt gatccttgtc 1380 catgtagttt tctctgcctt ccaagtggga tctcccattt gaaggactct ctgtgaagtt 1440 ttgaatggga gggccttacc cagattcctc tgccagggct tagtggttaa tctgtggtct 1500 gttctcctat ctctgggaga ggtctctgtg tttctcactt tagatatgtc catctacagc 1560 cccatttttg gggtttaggc ctaggactag gtcatggtta tgtaaggagg gcttttataa 1620 gaatccctag tttgagccag atgcaactgc aaaggagtgt atttgtaatc ccgcactcag 1680 gagactgagg taggaaagtc atgaagtcaa ggtctgactg ggctgcacag caagatgttg 1740 tcacaaaaac aatcaacact aagtttgttt tgcttttgct tttgcaaagt cctggattct 1800 gttaggacta agaagccaaa gatagacttt cagtgcttag ccctgactgg ttcctgggcc 1860 ctgtgtggtg gcagagcctt gcccaaggct gcttccggtg cttttcaaag tgggtgaggg 1920 tggggctggc agggcagggc aggcctggca gggaacaccc aaggctcctc tggccttacc 1980 ctggaaccca cccaatattt ttagaggaat ttggaaaaag tgacttctga actctgacct 2040 catctcttca gcatctagcc tgatcccaag atactagcca tttacatttt ttagttctaa 2100 ccccaacaga atccttcctg atggggaggg tgttcagtct cctccatcct gccatctgtc 2160 tgcaaagagc ctgcctgtca cccagaggga gtccctggtc taaaggagga agcattcctg 2220 cctaagggag cttcccttta gatggcagag actctgattt tagtagatta gagtttgggc 2280 aaaggttctg cctcttcagg gagcctcata cttctggact gttcccatgg ctactgccaa 2340 gctctacatt cctggcacag ataggagtca aattgagact ctagtcatcc tgcaacctcc 2400 tcctgtcccc tctctgcctc ctaaagacac tcaagtaggg aggcctaccc tcagaagtgt 2460 gtccttagga cacaaggttc tgctttatgt gactcccaga ccacaggaga ggtttaacat 2520 ctgattacag tgtgaagcag cagtgtggac ccgaatcctt ggggaggcac agttccaggg 2580 caggatgcag gcactgactt gccattccta gaggggctta gtggagcaga agcaggcctt 2640 gtagactggc cttgtagact gttcttttgt gtctcaagat ccaagatgtc cagtcccctg 2700 gaagaggcca tggatgtgac ggtctccacc ttccacaagt actccagtca agagggtgac 2760 aagttcaaac tcagcaaggg aaagatgaag gaacttttga ataaggaact gcctagtgtt 2820 gtaggggtaa gtgaggcagg cccaaaggga agagtcccgg agagtggggg tgggggcagg 2880 acacaggaca caggacacag agtaaatctt ttccagcttt cattctcaag gtgccagtgc 2940 cagggtgggg ctcaggatct ctctatcagc tttcatttca cctgttcttg gggtggctgt 3000 taggtctaca tgtgaatggg cttattgatg gctgttgcct tctgtattcc tgagcacatt 3060 gctgttgggg acttcagagt ccatcagtct aatcctgtta tttgctagtt gaacagtcac 3120 aaactcacag aagggtagca gctggcccag ggtcacagga ggacataact agggcattaa 3180 tttctccttt tattttacac atgtatatgg caagccaaga aagtgttcag agagaatgaa 3240 ttctagctaa gacatgcacc ctgggacttt tgcaaatgag atacagctag ctctcatttg 3300 cttcctgccc tagagtcagg tctcaggccg taatatatga agcaggtttt tttttttttt 3360 gcttcatttg gggttagctc tctcattgtt gtggctggat taaaaagttt gtcttttctg 3420 aattcatcct gctgatgcag ggggcagaaa gctttgattt ttctcatcgt caggatgaag 3480 ctgggctcta gtggaggttg gagttacagt ctgaggaaca cccagcatcc ttcactccag 3540 caggagtgct ggagactctt atatcacaca tctgtctgtc tgtcctcact ggccttcttg 3600 gtacctcact ggggtcgaac ctgactgtcc agtgaggaga ggacactgga ggctgctgta 3660 aaggggaggt tttggtggtg ggtagggcag ggaccagctt ggtgatagct cccctgcctg 3720 tcatcttcag gagaaggagg atgaggaggg gctagagaag ctgatgggcg accttgatga 3780 gaacagtgac tggcactgtt tctggcactc attgctatga tgtgcaatga cttcttcctg 3840 gggtccccag cctggccctg gagtagagag ctccactctc tgtcacatgt cttcttggct 3900 aacggggctc tctatctttc tgaatcttgt actaaataaa cttttgtttg tttgttcatt 3960 tgtggatgat attgcaatgg ctagcgatgc tttgtgcttc tgctagatca gtcaaagggc 4020 tggaaacaga aattgctatg atttccaaaa ccttctgctc tccaactctc ctgaggccaa 4080 aggctctgct cttttggatt tcacataaac atcaagaaag tgggcttctc tctttttatt 4140 accatgaaca aaggccattt gccccagagg tcctgcctgg ccttgtctcc cagccctaca 4200 tatgtagaga ggtcagagca ctgagagcaa gtggctgtcc catggtttgt cactgggctc 4260 catcctcctc ttcagagctc tgtctgctct actctgcaag tggcccacac acatcagagt 4320 ttcccaggga aaagagaaaa cagtcagaaa agcactgcct ttacttgtgt ttttatggtt 4380 attatccatc tcctctttta ttaaaaaaac aacagctttt ttccccttct cttaagatgt 4440 caacatcccc agctagaagt agccatatta ctttgctaag ccccaaaaga tgtaggtgaa 4500 gccctgcaca gagaggtcat ttctgccata ttaacaaggc aaaggctctt gaggacaaag 4560 tttttcagct ctcatcatca ctctgtcttc cacctagagc atggacaatg agacttggag 4620 gtatagcagc cgtgttgtga tcaggaatca acaaacacgg tatagcggaa cgtgtgttgt 4680 aggtttaaag aacaaaacaa tgaaaggaca ctagatttca catgtgtccc tgggccctct 4740 acccaacccc aactacctac agcagactta ttatgtaaaa tgattaaaga cactgtcagc 4800 caagttttct acaatttacc gctgaaaata aaactccaaa ttagtaaaga atttgacatt 4860 gtggatatat atttgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgatgag ggtgttgtgt 4920 atgctgtggt gtacatgtga agattagatg acaactcctt tatgtgggtt cctcctgaat 4980 ctgatttgtg caaatctcaa tgatttgtgc aatgaataaa ctacagcaga agtgatacag 5040 ctccctaagg tatgtcagaa gctaagggcc atgctctgag aagcccacac tatgtgagga 5100 gacaagttgg acctttcttc cctgggactg tcctccgtgt gtgagccact tggagagtag 5160 atcacacaga gttctgaaga ggaggcaggg gcccggtgag aggccttgtg acagcaactt 5220 agtctcagtg ccctgtcctc cctacacatc tagggctggg agacaaggcc aggcaggccc 5280 tctgggacaa atggtttctt tccatggtaa taaaaagaga gaagcccacc ttcttgacac 5340 ctgttggaga gggatcggta agtatgagag tcatgatgcc agtaattagc atcctggggc 5400 agttctcaaa gctcctgtga gcacactgtc atttcagccc catggtaagt ccaaaggggc 5460 tatcattaaa gcttttttac agatgggaaa gcagagaggg gcagcttcag ccatttgtgg 5520 agtgctgctt ctgactaggt acttggccta ctcatgcagc agccatttaa tcctcaccat 5580 acctgtggat gaaacagagg ctgcaagaca ttaaggacta gtgtctggac ttgacctaaa 5640 tctataagaa aactcctcat ccctgtggga cactgggctg gcagactggg cctctttcta 5700 ctttctgaag ctatctccag aactttgggc tttgtgtgac ctggagggga cctggctgaa 5760 tatggttcag atgtacccgg tacattaacc cggagtcaca gggagatggg acctccttgc 5820 aggtggtttg ctctgtgaac tctaattttt cttttagtgt tgcatgggtg caggctcctc 5880 ggttttggat ttggacagtc agttgggcta gcaagaccag acttaccttg ctgcctccaa 5940 ggtttcacac acttggagag gttccaaagt ggctaaacat tccttttggt atttgacaaa 6000 ctgacatcag actgttgaat ccagactaac aagcctctct cttccttgtg ctgaggcaga 6060 ggagggtctg gacatcactc tgcttgtcag ggatctgtgg ccagatctcc cccactcctc 6120 ctggaattgt gctgggatga gaaatgtagc aagctcacct cctgttatac caccatttta 6180 ttgtgtggct caaccacaga aaggtctcta atgctctgtg gaaaggaaga ttgaaggcca 6240 aggtgagtta attgccacat ccaagctgat tgcttgctca gccactcaga ctggagccca 6300 gggaacaaga caagtaaaaa gtaaaaagat ctagtccaga aaaacagaag gatggtcgga 6360 tagacatcac cttaatccag cagtcaaggc ccttctatcg ttaaacaaga gggaaagatg 6420 ttcgccatag ataggggtgg ctcccgattc cctgtaccct cctcgtgatc tggagtagga 6480 cattgtgcag tcacaaggca gtgatgtgtc tgtgaatctt gaaaacatct tagttactct 6540 tatcttggtg tctttagtct tggaccggga ggaaagaggt tagggtaagt tgctcttgtc 6600 ctgggagtcc aggcaaatat tcaccaaatg actaatgtgt ctatgtgcat agttcagcag 6660 aatctgaccc aaaggttaag gcagcacagg agacaagcac aaatagtgga agcccctggc 6720 attttcaccc ttatttattt atttatttga gacaagacat tgctatgaaa cctaggttgt 6780 gctcaaactt tcagcgatca tcctgcctta gccttcccag ttctaagagt agagcatgca 6840 gtgccaacct tgattgtatc ttgtggtagt catccattag acactcccga ggaccagagg 6900 ggcagtgtgt acagtgaagt ggcttcccta ggtgactttt gttttgtttt tttgagacag 6960 ggtttctctg tgtagccctg actgtcctgg aacttgttct gtagatcagg ctggcctcaa 7020 actcacaggg atccgcctgc ctctgcctcc tgagtgctgg gattaaaggt atatgtcact 7080 ggtgcccagc acctaggtga ctttgtagtt aattaaatcc gtgtgtcttt tacatcatga 7140 atcttgatcc cattcattcc ctgtcccttc acatcagccc tctgccccta cacgcccctt 7200 gaaataaaac aaaatttaag agaaaaaaga aaaaaattaa gggaaaaatt taaaatatct 7260 cattatggaa gctgcagtgt gacccagtga gccacacagt aaacacatat agctttactt 7320 gcaagtgttc attgcagagt cattggtctg gttcaaggcc tctgatttct actacactgt 7380 caacactggg ccccactagc gctcttcttc catgccctgt tgtcgccctg tgttgtggag 7440 gtcctgcagc attgggtctg tgggtctggt cccttcgtgt gctccagcag atcacagggc 7500 agaccaaatc ataaccctgg gtctgggcct gagcaactgt gtagttggtc cgctagatga 7560 gaactaggga aagctctccc atgtttacaa ctttagggct ggctcgtcca cacctgggct 7620 aacagggttg gttctctgct cttataccac agggggcagc tctccctcct gtccctggca 7680 ttgaagggca ggggtggagg gtggggggga gggtaatagg gacagttctc ccatgcttac 7740 aattctaggg ctggctcacc tatgcctgtg ccaggtgtga tgggccaggt gtgtggtggg 7800 ggctaggtga cttttataat tttaagccag aaatgtcagt tgaattagga gacttgctta 7860 gctcatcgcc tccaaagcta ctgattttca aagtcaacta agagcaagca aagcttgaat 7920 ttttagatgg ctccaccctt aagaacaccc acataccacc gagttatggg ttctgggaca 7980 atgggatgaa ctggtaccct actccacagc tcccacgtgg gtcacttgat tgctctacca 8040 actcgctgtt ctcatctgtg cagtggacac aaccagccac tggcttgatt ttcagagcaa 8100 gcagtagatc taatctctgc aggctcttct tggtcctagc ttagattctc ttcccttttt 8160 ctagctccaa ttctgtagct tcagctccgg ttccaaattc ctccctggcc ccagtgctgg 8220 tcccggtaat cagatactcc tttccatatg ttctccatcc ttggcccaga agatcagaaa 8280 ggaggttgat tgtttcagtc aagttaactt aacctcatgg ggccattaga tttgggtggt 8340 cactttggct ttagggctcg ggcccctttg ccagaaataa attgagtgtc cagattcttg 8400 ggacactcta tcttattttt ccctgaggtg caggatcaga cactgccctt tagaggggtg 8460 atgtgttttc cagggatctt aggcgatggt ggtgatagtg aggagccaga ggggagccaa 8520 gggagagtca gggtttcggc ttgtaagaag tcctgccaga tcggctagca tctgctttcg 8580 cctttgcaca ctctcttgct gatcttttga ggtgatgctc ctagccgcat ttctcagcgg 8640 tcagctcacc tgtcctcggg gagctatgca aggtgagggc tcagcctaag ggtggagatg 8700 gagcatgtgt gtgggagaga gtgggaagga aggaggatga ctctagtcca ggccctggaa 8760 ctggtgtcca cttctgcgca ttggggtcac ccgcaagaaa gggcttctgg gtagatgctg 8820 gaaaacttcc aggatgacag gaagatacca ggtactttaa gaaggttttt tgggaacaag 8880 ggaagagaat ttagagtcct gacctccatc tttgtggagg cagaagctga gaaagatgac 8940 ccggtgagga aggtctggtt ccactgttcc catgtaggga attcagtgtg ttctgttgag 9000 ttagacttgg gggccagagc cctcacattg cctcagtaac aactagtaac aaaaagtact 9060 ttgaaaaaaa tttttgagac aagatctcac tatgtacttc tgactggctt gaaacttgct 9120 atgtagacta ggctgggctt gaactcacca agatcaactt gtccctgcca ttcaagtgct 9180 gggatgaaag acctgctcta tcatacaagg caatactttg gattcttagg gtaagaatct 9240 tccaaaccct cttcagagat aaggaaatta tatttctaac aaggaaattc aatctctaac 9300 aaatcttcaa acatgttgaa gtcaggtggt gagcagggat ggaattttga gtgaaggcca 9360 attaagtgtt ctttccatgt gcattaagtg ttttttccat gtgcatcctc caaccccaca 9420 tctctaccaa gacaagtctc ttagcctctc ccagctttct ccccatggac aaagatgcag 9480 tgttcctagg agctgtggct gtgcccagga gcaggaaggg ctgttggata agaaagtggg 9540 ctcaggagct aggctatgga actctccagc ttattaaaca ttagtttgtt attgtctgtt 9600 tctcccacta gattgtcatt tcccttgaga gggtctgcgt ctgttttgtt tatgctatac 9660 cccggatgcc tagtatcagt gcctctaatt acttgtatga atagtgaata tcgagtctgc 9720 cactcactag ttacatgacc ctgggtaagt cactacctcc ctgggttagc atttaccaag 9780 tccttactat attttagcaa catttgttcc atgagcctgg cttgtgataa actccacaat 9840 aaccctatga gatggctact acttttattt ccatcaatca ggaaaatcag gtcccaagag 9900 tggagatgac ttgcttaagg tgactggtgg ctggtgggaa taagtcattg acctagaagc 9960 aaattaattg ctggtcatct ctggtacctc cttttgctgc tgtgtgacca tctctgtcct 10020 gtgtcccaaa ctgctcataa ctccttgcca ataaaacagg gctaatcaca gctcttcctt 10080 ccttttgcct ccattgctca ctcccctcac ccacatggct ggcaacctcc aggaggagat 10140 ggtggcctgg gcaaagctgg gtgctgggtc cagggtgagg tcaagggctc tcagactgcc 10200 catacaggca tgagggtttt gtcactggcc aggaactcag gctgctcttc tccttctggt 10260 gctcttctgg gtgttttttc ccctttcttt tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 10320 tgtgtgtgtg tgtgtgtgtg tgtgtgtgca cactcatgtg acatggaagc ttaggggttg 10380 ggagtgaaca gagaggaggc agcaggagag gaggattttc acatctggtg aatggtggtc 10440 tgacctttgc cagctaagaa tggcagggaa tgctggacag aattaaaatg atctttttca 10500 aaacatcaaa gaataacaag gtattaagag aaagccagaa cagacatggt gtcacacacc 10560 tttgatccca acagaggcag aggcaggtgg atctctgtga atttgagtca gcctggtcta 10620 catagtgagc tctaggatag ccggggctat gtagagagac tctgtctcat aaaacaaaac 10680 aaaacaagcc ccttgtgtct agagagatgg ctcagaggtt aggagtactt gctgtttttt 10740 gccgaggact cagctttggt tcccagcacc cacatcgtgg ctcacaaccc cctattactc 10800 tagttttagg gcatccaaca ccctcttctg accttcctgg gagaaggcat gtgtaggcac 10860 tcattcacac atgtaaaata aaaataaatg catctaaaaa aacagtttca gaagaagaaa 10920 ggaagaaatg aggaaagtaa aagaaagaaa gaagaaaaga aagaaagaaa gaaaggaaga 10980 aagagagact ctaccagaat ctctggagag attgtttagc tgttaaagcg tgtactgctt 11040 ttgcagagga ccagagtttg gctcctagca cccacattag gtgactcaca accacctgta 11100 accccatctc catgggggac tcaacgtctg tgacctctgt gggtgcctgc actaatgtgc 11160 acatcactga tgcacataca caaaagtaaa aataagtaaa aacaacaaaa aacaaaacaa 11220 acacctcata aaaaaactta ggtgatggca aaatctggga agttgagtag ggaacctgag 11280 ggctcttggc aagcctaaac ttgaatttgg gtttgatgat ctggggagtg aggaagacaa 11340 agttggagcc cagggctcac acaggagggg acaaaagtag acagacgatg ccgaaccccc 11400 atggggcaac tctcttaagc taaaaggcaa atgaatgctc taccccctgg actgcttgga 11460 aagttgacct agtgctaagc agagcagcag gctatgaaac cagtttcctc aggagctggg 11520 gacatgccag ctctcacctg aatctgtggc ccaaattcat ccacatcact gggagtagag 11580 aggcaagaaa gttcaagccc tgacagctgg aggctcccca ggaggaactc ccttcctcta 11640 ggtctcgaaa atacctcacc acgatttcct ccagtgaaat aagcaattca cagccaaagg 11700 ccaccaaaca ctctgtgatc tggaggctgg gcacagaggg tgtcctatgg cctcagactt 11760 ctcacctgta aataggggcc ttagccaggt gttcccaagg tctgccctgt acagggactc 11820 tggaggtaca acttaagaga atccaaggta tgttcccatt ttgtattctg ggtatcttta 11880 tgacaaagag ctcaggagag ggatgtatgt ggctggaagt ggctaccaga aagctgttgc 11940 ctgttctccg ctttagggaa gggcagtggg aatgagttgg gagtggtgtc tgagactcag 12000 actgggtctt tgatctgtgc gttgctaggt gggtggtggg cctgtaatag aagctactga 12060 gggaagaagg caggggaccc tgggggcagc ctcagtgttg acctacttgg gtccttataa 12120 ttgctccctt catctcttga gaggctacaa atagggacac ccagttgtta ggctcctaca 12180 gctgagacac cagcagcagt ggtgagtgtg gctgtttggg aacagctttg ggctaggtgt 12240 tggggcagct caggtaccta tccacagcta gcctgctcct ggatacaggg cccgggtatg 12300 gaagcagaaa ggttaagtta ggaggtgatg ggtgaggaaa atcagatgtg gtgaactcag 12360 aggttccctt gaacactaag ggtctgtagg agtttggcct ggggagtgtg cccaggcaaa 12420 atgcccactg atgtggggac agtggcctag ctatggttct gatgcagacc ttaagtgagc 12480 tccttgtctc tttgcttcat tcttggggat gagttgggac aggccagggc ttctgaaata 12540 gcaacagaag tggtgccatg caggctggga ggtgctcaga agggctctga ggtgctgagc 12600 tcttgggatc atggcccttc cctctattcg gatatggatc cttgttccgg cctgggctgt 12660 catgaagaag tagaccccag caatgcttgc cacttctgcc catccccata cttccttgct 12720 gcccatttgc tcccagcaga ggaaactcac caagtcttgg ctctggctgc cctgtgctgc 12780 aggactccag tccctgaggg agtgaagagt gagtcattgg actcacatgg aaacaactct 12840 attgcctctc ggcctgccca gggtttgccc aggctggatg ggcaatggaa gggaacaaca 12900 gaaagggggc gagggaaggg attctaggaa gtgcttccct cccatcagag tgggggactt 12960 ttctcaaagc cttctttctg tgttaagact acccccaccc cctcagttcc aggggaaggg 13020 aggatggctg taagattggg caggtcataa acgagtagat ctgtgagctg atgaacttct 13080 cagagaccgt ctggtccaca tttctgacta ggcctgtgag gccgcattaa cccactttac 13140 agaaaagaca attgagaccc agagagaaac agttcaccca gggctgcaga gtgagcaaga 13200 ggatgagggt ccccaactgc agggaagaag gccaagtgag gtggcagggg atcccctcaa 13260 gctaccatcc ctactgacat tagcctcgct agggcaaagc agcactgggc agggcttcct 13320 gagcaaggct tacaggatgg agcttcaggt gcccatgggg cagaggtatt taggaccagg 13380 gactgcatcg tgcccaatgg ggagacagag ttcccaggag ttggggtgag aaaggacttg 13440 agggaatcag agctcagtga gggtgaaggt gacagagtgt gatattctgt tcctgaggaa 13500 tttatggaaa tgttggggaa atgaaacgtc tgtccagaaa aatcacaaca ggcacaatgg 13560 ggaggtgaat cagtgtgggt atgtgtggta tgtgtgtatg tggtgtgtgt gtgtatgggt 13620 gtgtgtgtgt gtgtgagtgt gtgtatgtgc ggtgtgtgtg tatgtggtgt gtgtgtgtgt 13680 gtgagtatga atgtgtgtat aagtcatgtg tgtgttgagt gtgtgtatgt gtggtatgtg 13740 tgtatgtggt gggtttgtat gtgtgtatgt gtttgagtgt gtgatgtgtg tatgtgtggt 13800 gtgtgtgtat gtgtgtgagt atatgtgtgt gtgtgagtgt gtgtatatgt gatgtatgtg 13860 tgagtgtgta tgtgtggtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtaa 13920 gcagttgtca aggagggttg ctcagaggaa gggaaacttc agcatggtgg aagttgacag 13980 gtttggaatt agctcctggg aaacactgac ttggctttcc ttgtgagtca catccctttt 14040 ttgtgacagt gaggatgacc cggcccctgg agcaggcagt agctgccatc gtgtgcacct 14100 tccaggagta tgctgggcgc tgtggggaca agtacaagat ctgtcagtcg gagctcaagg 14160 agctgctgca gaaggagctg cccacttgga ccccggtgag caccttcata ccccttcccc 14220 ctagtggaag gtaccacttg gactctgcaa agaatggcct gggaccaaac accagcatag 14280 ggcagcaaga gggagaggct ggactgtgga gaggggacac gaggaagtga gctgacatgg 14340 ctgcatgagc ctcagcaaaa tggaatgtaa agtagggtga cagggccaga tgttggtggc 14400 gcacgccttt aatcccagca ctcagaagac agaggcaggg ggatatctgt gcgtttgagg 14460 ccagcctggt ctatagagca agttccagga caggctccaa aacaatccag agaaaccctg 14520 tctcgaaaaa ccaaaaaaac tgaaaaacca aaaaaccaaa aagaaacaaa acaaaaccaa 14580 aaaacaaaaa aggagggtga cagtcactct tactgtcctg tggataatac ctatctcata 14640 gcaaactctc catggcaagg agtcggtgct cagcaagtga gccgagaagc agggctggga 14700 gatgggtgtc ttatcaggat gggtaggatg aggttggccc ccaggagggt gtggttggga 14760 atggggcagg cccaccctcg gaggggagtg gcgtggaaag ctgcttaggc tcctcatccc 14820 aggtttcctg accttccctt ctcatccctt ccacagagtg agttccggga gtgtgactac 14880 aataaattca tgagtgttct ggataccaac aaggactgcg aggtggactt tggggagtac 14940 gtgcgcgcgc ttgccagcct ctgtctctac tgccacgagt acttcaaaga ctgcccccct 15000 gagccccctt gcccccagta gcctctgatc cagaagggta tgccattctg gaaggtcagg 15060 gtctgctcta gtgctccgtc tttgtccctg aggtgatcct gagtgtgtag ccacaccctt 15120 cctaccctct ctgtggtatc ctttcagtcg gggcttgcca ggtccctgat gtgctaaccc 15180 tggctactca tgcacagtag aagctttcct agggatgtca aagtagtgag gggtggaaca 15240 gtagcttctc ttcttggaag ggagaacatt tgctctctca ctttggaggc tcagccatgt 15300 gcacactgtg gcaggggcct gctcaactcc taataaagaa atgtcagctt ggcttggttt 15360 ggttcttctg atgggacaca ctggattttg ggactgagtc cttgggagtc tttacccctc 15420 tatgttccat atcgctggag gaaggcagct gaaggcaggg gccctaaagg cagttccaga 15480 ccccatagga atgcataagt ctcagtattc agtaggaagg tggggccatt acaagtcccc 15540 atcaggtgag gctgggggtc tttgtctcca tctctctgtc ccctgtcttg aggtggaagc 15600 ccttgttttg ggctttctag gagggcaaga ggctccttgg gagaaactca gtacttgtga 15660 ttagagcatc gaggtatgtg ggtatgggtg tggcatagct gtgggaaacc agagagcagt 15720 agcaatagga ttggggcctc tgaggtattt gctgccagcc agggagggag cctctgtatt 15780 tactgcaagg ggaaagggat actttgagtc agtcctcatc tctgaaacca cagcccctga 15840 gggtcccaag ttcccatttc tgaccattgc tcaatccccg tatttgtacc ccatccttag 15900 agattaatcc tgactcccca ttttacctgt ttctcctgta actctcttct ccaagctgag 15960 tgttcaaacc tgaatgctcc catcagcccc aataccctcc ctggaccttc tacccattca 16020 tgaacctcga ggcctcatta ctgccctaac tccatcacgc cctcttaggc gtttcccact 16080 taatacctag ggtggtacca aggcccctcc cgacttgcca gtcttcactc tgggtcttac 16140 tgagcgtgac agagagctgt ttaggctgga gagaagggct gactgtccca ctggccgggg 16200 tcacctcccc aattcctggg ccatacattt ccatattccc ctcttgccca tcacctcccc 16260 atcttctttc ctgtggccca catcccatgc ccatgttgcc ccttctcaaa gcttccttaa 16320 aagttggctg agctgtggct actgggtggt atccacacca ttcaggtctc tcgtgtccac 16380 tggggcttac tcaatgctcg cctgtgcctg ctgggtagta ggaagcttgg ttctcaggtt 16440 gggctggtgg aggggcctgt gacatttact acatcagcca acagtaggaa catagtatcc 16500 aagctccccc catcccctgc atgggcaggg cccagcagag tataaatagg gcagacattt 16560 gagctttccc caaacctctc tgttcagcac ttcctctctc tgggtctggt gagttgtgtt 16620 ggcttcatag cagtattagt ggtgtcagag gctgaggctg ggacaggaga aagggaggct 16680 tctggggaga cagatgtttt tactagatcc agatgagaga ttctgatgtg gaggctttgt 16740 gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtctgtgtgt 16800 ctgtgtgtct gtgtgtgtct gtgtgtgttg cacaagaatg aaaacagcaa caaaaaggtg 16860 tatagatgcc atttgagctc tcaagatttc taagatgctg aggcttacac gtgttgttgc 16920 tacagtgtac atctgtgttt gggagccatg gataggtacc ctgatgggtg tttgctgggt 16980 cattcaagcc agtgtgtgcg ggaaagcagg tgcaggaagc aaagtgaggg aacatgtagg 17040 ctttcttctt aacgtttaaa cttcagttat ttatttgtgt gcatgcatgc gtgggttggg 17100 gatggggggc tcatgccaag gtgcacttgt ggaggtaaga gggcaacttg tgggagggag 17160 tcagtctgct ccttctacca tgggctctgg ggatcaaact caggccatca agcttagtgg 17220 caggcacctc tacttacagg ctaccactcc agcactcacc tgtagacttc tgtgttcata 17280 ttagtgcctt atggacatcc agcaccccag gtcaagagag cctggcttcc ccaccctccc 17340 cttgtgcccc tacctctgcc acctcatctc actcctcact aagctggtca ataggcagct 17400 gggttttttc cgctgtgggc ccatgggcag gcagccagca gccgcgccca atgctgggag 17460 ggggaagaac gggccagagc ctggtgcttg tggttgagct gagcaaggac ggaaaactgc 17520 tgttgttgag gccaggcccg aggacagtca gcccaaaagc tgctggcacg aatctccaga 17580 gattgtatgg taggctctgc atgtttcaga gcccaaagca tacacgacca tcttgccatt 17640 agtgggtccc actcctctga tctctctggg aatgaggaca gtctcctgaa gtgttcctag 17700 agggtaggtt ggaatggagc atttaaaatg ggggcagaat gagtctatga cttgggtgat 17760 gagcagtgcc acatagccag ttcttgatac actgttggtg tgggttgggt aaggctacct 17820 ttgtgtctcc tgcccctagc tctcaactgt caccatggaa taccccttag aagaggccct 17880 ggatatgatg gtgtctacct tccacaaata ctcaggcaaa gagggtgata agttcaagct 17940 caacaagtct gagctgaagg agctgctgac cagggagctg cctagctttt tgggggtgag 18000 tgggtcctgc ctgtgtattt catgtgtggt gcatccccag gaggaggttg ggactctggt 18060 aggtagtgcc tagctacagt tggcgtatat ctctaaggtg gggaaatgga ggttggagag 18120 cttgctccgg gtgcttggtg tggaaccaca gtgaaccatc tatccctcat tagccctcag 18180 ctgagagaag gcttagaatg aacacaaccg aagagacaga gaaaaagcaa aacaactgcc 18240 taacatagtc agtgtctgaa ctgcaggcta gatcaggact gttggcaaga gaaattgagt 18300 ttctgtttgt gaagacacga tggtggaggc acacaaacac ctgcagagtc tctcctcaat 18360 aacaccttgc attagttaat ttaatgcatc actgccatgg ctgctaccta atgagataat 18420 taaagcaaac aaggagaaga tgtggtcctc cccgttccca gctacctcaa gtgcccgcat 18480 ctagggcaca tcctcctcta catagcttag tcccaaggct tcctgagtgc ccagaggcac 18540 tcaggtgttc ctgaacacct ggctggaggc agagatctag cttgggtctg gcttctaact 18600 gttcttcttc tactcccaga aaaagagaga tgaagcagga ttccagaagc tgatgagcaa 18660 cctggacagc aacagggata acgaagtaga cttccaggag tactgcgtct tcctgtcctg 18720 cattgccatg atgtgcaatg aattctttga aggctgccca gataaacagc cccggaagaa 18780 gtgaagactc tgcagatgaa gtgtgggggc gtggtcttcg ggaggagggg gctcttccct 18840 tttggctctg agcatagtgc cttactctgg cttcttcata catatgcaca atgctgagcg 18900 agttcaataa agagtcttga aactatgtgc tgttgcctaa gagactggag attgtgggtt 18960 gggtgttgag ggagggtata tcacagggta gtggtgggga ctgcggggag ttgagctggg 19020 agttgagcct tgagggaaca aaactagaaa gggttgggta ggggttgagt ggctgattta 19080 actagcatgc aagtgtgtgt gtgtgtgtgt gtgtgtgtgt gcgcgcacat acgtgcaaca 19140 aagaaaactt tgggaatact taaggcagaa gccaccagag gcttggcttg aaaggctcca 19200 gatgtgggaa gttagccagt ccaccaccct cctttctctc tccagatctg cctctgggct 19260 caaactgaag ttgggatggg attgaaggtc acatctgttg ctggttggag tctggaggga 19320 agacaacggg cctgagtcac aaggaaggag tccagaagga tggggaggtg gactggcacc 19380 catccctgac atttatagtc caggtcctgc cctgctaccc attctagctc actagctcca 19440 aacagtggat taatcctttc ctgtccatgg ctggatgaag aagggcagta tagagagatc 19500 atttgtgaga acataaatct ctctctctct ctctctctct ctctctctct ctctctctct 19560 ctcagagaag acgtctcact cttgtagcca aagctagctt tgaacttctg atcctcctag 19620 ccagcttccc aagttctggg attacagacg tatgctacca tggctgactg aaatagccat 19680 tctcttaaca tactgtcccc atactcagag ggctctggga caggatctac tatttcttag 19740 aatcatgttg cttagaggag gacaagggac ctcaggaaaa taggtggggg tgggtaatgg 19800 cagtgaagca gatgatgggg agatgaccat agttttagac agagttttgg ccatatgatc 19860 tgacaaagaa aatcgagatc cccatatcct cactctctca cccctagaac atgaggcaaa 19920 tgttgcttct ccttagggta ggcttacggt cagtggttcc agagtgccaa gaatgggact 19980 gagattagat gtaaagccct tgcctctgtg atacagggat gcttaaggaa aggtacccac 20040 aagctgtctc aaggcaggtg agtttgctct ccaagcttcc cttctcatca tatctgcttt 20100 tcgctccagc ctcaggggag tggggtaggt gactcagttg ttcccttgga gtttgactat 20160 agagacttag gtccaggcta agcaagccca tcttctcttt ttttgcactc ccagtcaatc 20220 tgcccatctt tcatgggagt gtgctccccg gagcctcctc ctgcatcact ctctactttc 20280 ggaaactcct gttgcttaga gacaagtctc tgctgtatca ctcgtgtaat agctgtggtg 20340 gagtgacaaa gggggcagtg gagaggaact aggcaggcta gggtggaact ttagccaaga 20400 ttaggggtta tgcccctaac caaattctgt tcttagagtc atcgtgttcc cagaatgcag 20460 gaaactcacc ttgagccctg tgccacccat gcgtgactgt acctgaaact ggagcctctt 20520 ccacagtctc aacctagtcc tgaacctttc tttgaccctc ttccccaacc ctgaattctt 20580 agtcctctaa cccaggggtc ggtctctgac aactacttcc catcttttgc tttgtgttag 20640 ctagtgactt cagatgactg tccttggcag gaaatatctt ccttcactga tcccatccca 20700 agaatgggtc cttgtgcact tggaagggat gccaggatgg agggtctcaa tgtggagagg 20760 tatggggaga tttaccctgt gtttggactt tctactgttt cttttctgga gagcccaact 20820 tgcctttttc aacctattac ttcaccggat gtgaggttta gtaggaaaac gtggttcctg 20880 gtattgaaag tgtgtctgtc atggtggact ccatgtgcta cctccagccc tgttggtaaa 20940 cagcaagtca aactttccag agagggttcc cttccacctt ttctggattc ctcatatctc 21000 ggatcccttc tcattggtcc cacccctcct gattctcctg ggctttgggg atgagggaat 21060 aaaagcagag agcattggta gggaggctgt ggctgcagcc tagattctcc tctgggttta 21120 cgtcttcctt ggtgagtcct tccttcggat gacctccttc atttctgctg ggccagcctg 21180 ggtgaggaag aatgtgacaa gacgtggaaa cctccacaaa gaaggcctga ccttgcaagt 21240 gggagcatgc ttagggagga gagggcagag tatttgtgat tgtgactaag gatttcctga 21300 gaagccaact ctaggagcaa gaaagctgag gcaggaggat catgagtttg agagtagtca 21360 taggatttat tgtgagatac tgtctcaggg agagagagaa gggaagagga gggaggaagt 21420 cggggggagc agagcctgct agcagaatca gcaagatgtt tctacagatg cttagagtcc 21480 ctttcttgcc ttgaactgtg gtccagctga gcctccatga ggtgggagaa gctgatggtg 21540 tgggtggcag gagatgaatg atgggctcag tccagctcaa gaacttcttg ggttggaggt 21600 aagagtcagc aatttctccc caccctccta cctagcccag ggttctccac cagatctaca 21660 gaaacctcca gttctgtggc cattgtttcc ttccccttta agaggaagtg gtttttaaac 21720 ccgaaccaca caagcttcag ctgtctgctc ttttggtggc gtgcctatgc tgacagaact 21780 gaagccatta ctcaaaccca acctctagag ccatatctca taagatcctg gccatgtcga 21840 tacccaccct tccccgcccc tgtcaggctg tgggtgaagt tctctgggca tcagactgga 21900 ggtcattagg caagtccagt cacctctctc ctgcttcctg ccgagatctt atctcccagt 21960 ttcagctcca accccctctg acccctggac tccttttttg ccccctcccc ctcagtgaga 22020 cactctttca tttccagtga ctcagaggct ggagaaagga aggtgactag gtgagaactg 22080 tggctggaaa gccagagcct aaacttcatg gggaagagaa aaatcctgcc ccctcatctg 22140 ttgtagcagt tctttgggag aggctgtcct ataccctctt tgttcctgga cctctctgtc 22200 agcacctctt gatcagggaa gcctgcagcc tcctttgggg gctggacatt ctcactgctt 22260 tggctgggcc agtatatttg tcatggctct cattacaacc tgtctgtata tacgggatat 22320 tctcattggt gggatttggc ctcactatgg gctcctggca atggcggttt ggaatggctg 22380 gtgaggagca ggcctagttt ctctagtgct cattgtctcc tctcccactc cagagttcac 22440 gtcgtgatgg agactcctct tgagaaggcc ttgaccacca tggtcaccac tttccataaa 22500 tattcaggga gagagggtag caagctgacc ctgagtagga aagaactgaa ggagttgatc 22560 acgacagaat tgagtcttgc agaggtaggt gactgttctc tcatatacca cactacacat 22620 tctgagtacc ccttctggga gatgcccacc tacttgcagg gaactctagc ctaggcaaag 22680 ggcaggatgg ctgaagggcc agaggcagag gaagtggtgg acatctctgg ctaccaaggc 22740 tctagacctc tgtgctgggg gatgaatccg tctcactgga aaggaggcaa ggctggggtg 22800 tgctactgcc tatgggaagc tatgggatca cataaaggag actttggtga tgggttgcat 22860 agcctatgtt agggatcttg agggtttggg ggatgtgggg taccgggttt ggctgtgtac 22920 aactcaagga tcaggattct tcttgattct tctctgtgcc tggcacagct aaggtgctaa 22980 gtgatactgt caagtaaact aacaggctaa tttatgaaca tggggtagga aggagacagc 23040 actgattcct attagatgga catgatggga gttgtggctg gctaacttga aggtctatga 23100 gatagagtaa ttgagcctta aatacatcag agaacttgtc ccttgaggct gagctgaaat 23160 tccaggctag tctctgcacc aacctcctat ctatctttac agtgaagttc caaattccac 23220 tgttccccca gggagagggt tccgggaaca tgtccatggg aaggggtgaa acaggtgcca 23280 ctgttctcag gtctctctgc ggcttcccca aggcatatgg agttcaccat gccttatata 23340 ttattctttc tttccttttt gagacaaagt ttctctgttg tagccttggt tgttctggaa 23400 cttgctctgt agttcctgac caggctggct tccaactcac agagatccac ctgcctccat 23460 ttcctgagtg ccactgtgcc tggcctggca tatacatatt caataccaga aaccactctg 23520 ccatcctgga actaatgaag gtagagggac ctttggtcca tcaggtgcta attactcagg 23580 gacagagccc caggggagga gtctagtctg gggaccagga tcatgttaca gagaggcagt 23640 ttccagcatc ctgggtatca acatcctgta tccaagggag acctggaact gaactgattt 23700 cgacagaggg agagcagggt ctacctgctt gtattttctt gctccaccct aaggctctgt 23760 cttcaacttc ctagaggagc cagggtacag ggaccaaact gagaggacat ctggtgccag 23820 gctggagctg agggcatgct ggcttctcag ctccagtgta ctgatcttac agagaagtat 23880 atagtgatgc ctgggtcctt ttccagcttg gccttacaat acggacaggt taagttggag 23940 acttggatga tgctcagggc tacagagcca ggactcaagc tgtttttagt agatatctgt 24000 ataaattgta gattataatt tctttggatg ggaagatgtc ccaggagcaa aggctaggct 24060 agccttcctc ttgtaattca tttaaaatca gcactcaggt catggacccc atttggtgtc 24120 aggtcccgtg taaaggtgtg ggttggggct gagctgctga gcagtctcct ccccctgggc 24180 ccttgcagaa gatgaaggag agcagcattg acaacttgat gaagagcctg gacaagaaca 24240 gcgaccagga gatcgacttc aaggagtact ctgtgttcct gaccacactg tgcatggcct 24300 acaatgactt cttcctagag gacaacaaat aagcacggtc ctctctaccc acacctgcag 24360 ctccttgtct ttccctctgc agcctcttaa actgctcctc ttacgcccct ggcccttctc 24420 tttctcatgg gtggattctt ccagtagaga aataaagccc tttccccctt tccatgtgtt 24480 ggttttgagg tggtttgtct ccgttggctg agtcagggga gaacagacag acattttgag 24540 ccattcagcc tcaggtcaca cacaggtggc ctgtgggtgc agggggtgga ctttcacccc 24600 actccactgt ccgtcctttg ttgtggacac tgttgaatgt gtcctggctt tgttctgcac 24660 tgtaaaacaa caaagctggc ccaggcattt gcatgctttc ccaggcagta aagacacaga 24720 gaaaacaatg agaaaaagcg tgttgggagt gaggagacca gggtgattgc agtgatgccc 24780 agtgggtctc agttggggca cagcccacag gaggccactc tggcagccct agtaaaaagg 24840 aaagacacga acttagcacc cttccaactg agtgactcca ggaggctaat tccccctccc 24900 tcaacttcct cttctgaaga cttttcttca ggaggaaacg ttcaaaactt ttcacttaag 24960 atgataagta agcatgctgg ctgggctggg ctccattgtg tgcacattaa tttgtaagct 25020 gctctaaaga tgaacttcca ggcagtgagc tggaagaagc gagttagaca gaaatttatt 25080 gttggtgggg gatggtgtct gaaatccttt agactgtgtc cctccccctt ttttgagaca 25140 gggttttata tagcccaggt tggctcagaa ttctgcctcg tgggatcaac ctactgagct 25200 atatccccaa gtcttaaact agtgaggtca aaccacccta tcagaggggt tgcctaagat 25260 catcggaaaa cacaagtatt tacactgaga ttcataacag tagcaaaatt acggtgtgaa 25320 gcagcagtga aaataatttt atgattgggg gacaccacaa catgagaatc tgtgtccaag 25380 ggtcatagaa ttaggaaggt tgagaactat tagccaatct agtagaccac taggggcttc 25440 ccctccttcc ctggagctga ccttgccacc agagggcgac agcatcagtg aggttcccac 25500 tccccctcac attgatgctg actttaggga cacattgtgc tctgtctggc agatggccca 25560 gcacacatgc cggagtcacg agtcacgtgc cataagggca aactgaagta tggaaattag 25620 ggaaaactcg atgtctctgg tttgtgctgg tctcccagac cagggtcact aggctccctc 25680 atgccactcc caatccggga cagtcctggc agcagaggcg tggaaaactg agggggttgt 25740 tggggtgtgt tttgctagcc tcaggcgccg ggtggggctc ggggcggggc ggccnnnnnn 25800 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25860 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25920 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25980 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26040 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26100 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26160 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26220 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26280 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26340 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26400 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26460 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnga gtctgctttt ctggggtgca 26520 ggagggttcg ccctgggtgt gtcattgtcg tcgcagtgtg tggtcctgtc aggaagtgcc 26580 ctggagcagc ctccatctct tcctctgctc agtcatattc cccagctctc ttggaatccc 26640 tggagatcag tgttcagaca ccccaaagcc gcttccgttc ttacatccct gaccctagtt 26700 gccctgggct gcctgcacct gtgttggcta aggctagctg gttcagacag gcagcactga 26760 ctagcccctc tctgtcaaac agcttcttct agcccagtgg tcaattatgg catgccccct 26820 ggatcaggcc atcggccttc ttgtggccat cttccacaag tactctggta aagagggtga 26880 caagcacacc ttgagcaaga aggagctgaa ggagctgatc cagaaggagc tcaccattgg 26940 ctctgtaagt agcccctgcc caggttcccc ctcccacctc tgtccatcgg agcgctttta 27000 ctggcattta ctcttagttc ctgatcttac ttcccttgga gcttgtatgc tcccagcctg 27060 ctgagggagg agcaggggct gagaagtaaa tcaaggtaaa tccaagctga aggcccatcc 27120 ttggtgacaa tgagcagaga cacttacatg aacaaggact tccagggaag gggtaaggaa 27180 tccagggcgc tggccaccac tgaacgtgga cgtctccttc taatgtatta gaaactgcag 27240 gatgctgaga ttgcaaggct gatggacgac ctggaccgca acaaggacca ggaagtaaac 27300 ttccaggagt atgtcgcctt cctgggggcc ttggctttga tctacaatga agctctcaaa 27360 taaaatggga aggtagagat gccctttgga ggcctatctc agccaaatcc agtggtgggt 27420 aattgtacaa taaatacttt gtttttgtta catcta 27456 <210> 5 <211> 41 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 7 <400> 5 tttgcttact gcccaggttc tgagggacca cctggggcta g 41 <210> 6 <211> 42 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 8 <400> 6 cagttccctc ttctgcaata ttctctagct ttagatgcag aa 42 <210> 7 <211> 42 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 9 <400> 7 agcaactgct gtcgctcaga gcttgggagg gggtggatgg ac 42 <210> 8 <211> 42 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 10 <400> 8 ccgcgcccaa tgctgggagg gggaagaacg ggccagagcc tg 42 <210> 9 <211> 43 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 11 <400> 9 ctgggctgcc tgcacctgtg ttggctaagg ctagctggtt cag 43 <210> 10 <211> 42 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 12 <400> 10 agcagcatct gtttccataa agtggtcagg ccccaggtgg gg 42 <210> 11 <211> 43 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 13 <400> 11 cacaaactga ccctatgaaa gtgttcagta attcagtgcc gag 43 <210> 12 <211> 42 <212> DNA <213> Cricetulus griseus <220> <223> Targeted integration site ZFN 14 <400> 12 ggcttctact gctccagctg agcctgccct gcagtgggga gg 42 <210> 13 <211> 57 <212> DNA <213> Cricetulus griseus <220> <223> landing pad_upstream <400> 13 aacagcctta ttcaggtata attcacacgc cacaaactga ccctatgaaa gtgttca 57 <210> 14 <211> 58 <212> DNA <213> Cricetulus griseus <220> <223> landing_pad downstream <400> 14 tgaaagtgtt cagtaattca gtgccgagta tgatgtatca cacctgtgac cctggcac 58

Claims (17)

  1. a) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이고/상류이거나;
    b) 이종 폴리뉴클레오티드 적어도 하나는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류인,
    CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합된 이종 폴리뉴클레오티드 적어도 하나를 포함하는 중국 햄스터 난소(CHO) 세포.
  2. 제1항에 있어서,
    a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
    b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 CHO 세포.
  3. 제1항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되는 CHO 세포.
  4. 제3항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자이고, 상기 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되며, 상기 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 CHO 세포.
  5. 제1항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터 대립형질 하나 또는 두 개에 안정적으로 통합되는 CHO 세포.
  6. a) CHO 세포를 제공하는 단계;
    b) 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
    [단 이종 폴리뉴클레오티드는 CHO 세포 게놈의 S100A 유전자 클러스터에 안정적으로 통합되고,
    i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
    ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]
    를 포함하는, CHO 세포를 제조하기 위한 방법.
  7. 제6항에 있어서,
    a) 상류 게놈 표적 영역은 서열 번호 1의 30번 내지 19,000번 뉴클레오티드, 서열 번호 1의 2,940번 내지 19,000번 뉴클레오티드, 서열 번호 1의 4,740번 내지 19,000번 뉴클레오티드, 서열 번호 1의 6,480번 내지 19,000번 뉴클레오티드, 서열 번호 1의 8,280번 내지 19,000번 뉴클레오티드, 서열 번호 1의 10,020번 내지 19,000번 뉴클레오티드, 또는 서열 번호 1의 11,820번 내지 19,000번 뉴클레오티드에 대응하고/대응하거나;
    b) 하류 게놈 표적 영역은 서열 번호 2의 1번 내지 13,160번 뉴클레오티드, 서열 번호 2의 1번 내지 12,000번 뉴클레오티드, 또는 서열 번호 2의 1번 내지 10,260번 뉴클레오티드에 대응하는 방법.
  8. 제6항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되며, 상기 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 방법.
  9. 제6항에 있어서, 상기 적어도 하나의 이종 폴리뉴클레오티드는 리포터 유전자 및 선택 마커 유전자로 이루어진 군으로부터 선택되는 마커 유전자이고, 상기 마커 유전자는 발현 카세트의 일부로서 CHO 세포 게놈에 안정적으로 통합되며, 상기 발현 카세트에는 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 방법.
  10. 제6항에 있어서, 상기 이종 폴리뉴클레오티드는
    a) 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성인자 유사 효과기 뉴클레아제(TALEN) 및 CRISPR 연관 뉴클레아제로 이루어진 군으로부터 선택되는 서열 특이적 DNA 편집 효소; 또는
    b) 람다 인테그라아제, PhiC31 인테그라아제, Cre, Dre 및 Flp로 이루어진 군으로부터 선택되는 부위 특이적 리컴비나아제
    가 사용되어 CHO 세포 게놈에 도입되는 방법.
  11. 제1항 내지 제3항 중 어느 한 항에 의한 CHO 세포로서,
    (a) 적어도 하나의 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하고/하거나;
    (b) 상기 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)- 결핍 세포 또는 이들 세포 중 임의의 것의 유도체인 CHO 세포.
  12. 제11항에 있어서,
    a) 상기 RNA는 mRNA, miRNA 또는 shRNA이고/이거나;
    b) 상기 적어도 하나의 이종 폴리뉴클레오티드는 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는 것인 CHO 세포.
  13. 제6항 내지 제10항 중 어느 한 항에 있어서,
    (a) 적어도 하나의 폴리뉴클레오티드는 RNA 및/또는 단백질을 암호화하고/하거나;
    (b) 상기 CHO 세포는 CHO-DG44 세포, CHO-K1 세포, CHO-DXB11 세포, CHO-S 세포, CHO 글루타민 신타아제(GS)-결핍 세포 또는 이들 세포 중 임의의 것의 유도체인 방법.
  14. 제6항에 있어서,
    a) CHO 세포를 제공하는 단계;
    aa) 제1 이종 폴리뉴클레오티드를 상기 CHO 세포에 도입하는 단계
    [단 제1 이종 폴리뉴클레오티드는 마커 유전자로서, CHO 세포 게놈의 S100A 유전자 클러스터에 발현 카세트, 즉 부위 특이적 리컴비나아제 또는 서열 특이적 DNA 편집 효소에 대한 인지 부위가 측접하는 발현 카세트의 일부로서 안정적으로 통합되고,
    i) 상기 이종 폴리뉴클레오티드는 서열 번호 1의 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 상류이며/상류이거나;
    ii) 상기 이종 폴리뉴클레오티드는 서열 번호 2의 1번 내지 15,120번 뉴클레오티드 서열에 대응하는 게놈 표적 영역에 통합된, S100A3/A4/A5/A6 주 유전자 클러스터의 하류임]; 및
    b) 단계 aa)의 제1 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트로 치환함으로써 상기 CHO 세포에 제2 이종 폴리뉴클레오티드를 포함하는 발현 카세트를 도입하는 단계
    를 포함하는 방법.
  15. a) 제1항 내지 제5항 중 어느 한 항에 의한 CHO 세포를 제공하는 단계;
    b) 단계 a)의 CHO 세포를, 관심 단백질의 제조가 허용되는 조건하에 세포 배양 배지 중에서 배양하는 단계;
    c) 관심 단백질을 수집하는 단계; 및
    d) 선택적으로 관심 단백질을 정제하는 단계
    를 포함하는, CHO 세포 내에서 관심 단백질을 제조하기 위한 방법.
  16. 삭제
  17. 제 13 항에 있어서,
    a) 상기 RNA는 mRNA, miRNA 또는 shRNA이고/이거나;
    b) 상기 적어도 하나의 이종 폴리뉴클레오티드는 항체, 융합 단백질, 시토카인 및 성장 인자로 이루어진 군으로부터 선택되는 치료 단백질을 암호화하는 것인 방법.
KR1020207003299A 2017-08-11 2018-08-10 Cho 세포 내 통합 부위 KR102531749B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17185988 2017-08-11
EP17185988.7 2017-08-11
PCT/EP2018/071733 WO2019030373A1 (en) 2017-08-11 2018-08-10 INTEGRATION SITES IN CHO CELLS

Publications (2)

Publication Number Publication Date
KR20200038462A KR20200038462A (ko) 2020-04-13
KR102531749B1 true KR102531749B1 (ko) 2023-05-10

Family

ID=59686752

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207003299A KR102531749B1 (ko) 2017-08-11 2018-08-10 Cho 세포 내 통합 부위

Country Status (9)

Country Link
US (2) US11560549B2 (ko)
EP (1) EP3665291B1 (ko)
JP (1) JP7087061B2 (ko)
KR (1) KR102531749B1 (ko)
CN (1) CN110997925A (ko)
AU (1) AU2018315428A1 (ko)
CA (1) CA3068779A1 (ko)
SG (1) SG11202000966XA (ko)
WO (1) WO2019030373A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3134705A1 (en) * 2019-04-02 2020-10-08 Chugai Seiyaku Kabushiki Kaisha Method of introducing target-specific foreign gene
CN114026241A (zh) * 2019-04-18 2022-02-08 西格马-奥尔德里奇有限责任公司 稳定的靶向整合
EP3901266A1 (en) * 2020-04-22 2021-10-27 LEK Pharmaceuticals d.d. Super-enhancers for recombinant gene expression in cho cells
BR112023023386A2 (pt) * 2021-05-10 2024-01-23 Nikhil Goel Células engenheiradas para produção aumentada de proteínas de difícil expressão
CN113355360A (zh) * 2021-05-28 2021-09-07 上海碧博生物医药科技有限公司 一种gs基因敲除cho-k1细胞株的构建方法及悬浮细胞单克隆化
CN114085841B (zh) * 2021-11-23 2022-07-15 江南大学 一种cho细胞基因nw_003614092.1内稳定表达蛋白质的位点及其应用
CN114058625B (zh) * 2021-11-25 2022-07-15 江南大学 一种cho细胞基因nw_003613781.1内稳定表达蛋白质的位点及其应用
CN117305334A (zh) * 2022-06-21 2023-12-29 深圳太力生物技术有限责任公司 靶向整合细胞及其制备方法、生产目标基因表达产物的方法
CN118726475A (zh) * 2023-03-28 2024-10-01 深圳太力生物技术有限责任公司 核酸、重组载体、靶向整合细胞、基因表达方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014205192A2 (en) 2013-06-19 2014-12-24 Sigma-Aldrich Co. Llc Targeted integration
WO2016064999A1 (en) 2014-10-23 2016-04-28 Regeneron Pharmaceuticals, Inc. Novel cho integration sites and uses thereof

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69128037T2 (de) 1990-11-13 1998-05-07 Immunex Corp., Seattle, Wash. Bifunktionelle wählbare fusionsgene
CA2163427A1 (en) 1993-05-21 1994-12-08 Stephen D. Lupton Bifunctional selectable fusion genes based on the cytosine deaminase (cd) gene
US6521419B1 (en) * 1998-09-22 2003-02-18 Kanakaraju Koduri Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
US7422889B2 (en) 2004-10-29 2008-09-09 Stowers Institute For Medical Research Dre recombinase and recombinase systems employing Dre recombinase
US8404486B2 (en) * 2007-11-30 2013-03-26 Boehringer Ingelheim International Gmbh Recombination sequences

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014205192A2 (en) 2013-06-19 2014-12-24 Sigma-Aldrich Co. Llc Targeted integration
WO2016064999A1 (en) 2014-10-23 2016-04-28 Regeneron Pharmaceuticals, Inc. Novel cho integration sites and uses thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cytotechnology.,51(3):171-182(2006.7.)
Sci Rep.,5:8572.doi: 10.1038/srep08572(2015.2.25.)

Also Published As

Publication number Publication date
JP2020530998A (ja) 2020-11-05
US20230131164A1 (en) 2023-04-27
EP3665291A1 (en) 2020-06-17
CN110997925A (zh) 2020-04-10
KR20200038462A (ko) 2020-04-13
SG11202000966XA (en) 2020-02-27
US20200216815A1 (en) 2020-07-09
JP7087061B2 (ja) 2022-06-20
CA3068779A1 (en) 2019-02-14
EP3665291B1 (en) 2021-10-06
US12018285B2 (en) 2024-06-25
US11560549B2 (en) 2023-01-24
WO2019030373A1 (en) 2019-02-14
AU2018315428A1 (en) 2020-01-16

Similar Documents

Publication Publication Date Title
KR102531749B1 (ko) Cho 세포 내 통합 부위
AU2019250224B2 (en) Enhanced transgene expression and processing
AU2023204606A1 (en) Genetically modified cells, tissues, and organs for treating disease
KR101476010B1 (ko) 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포
RU2749715C2 (ru) Грызуны, характеризующиеся гуманизированным геном tmprss
CN111057721A (zh) 人源化IL-4和/或IL-4Rα改造动物模型的制备方法及应用
AU2018204332A1 (en) Expression cassette
KR101920187B1 (ko) 외래 유전자 발현 증강 활성을 갖는 dna 요소
KR102553990B1 (ko) Hspa5 유전자의 프로모터
KR101608225B1 (ko) 신규한 재조합 서열
TW200932907A (en) SM-protein based secretion engineering
CN115698301A (zh) 活性dna转座子系统及其使用方法
JP6025745B2 (ja) ヒト遺伝子由来プロモーター
KR20050085203A (ko) 발현 벡터, 이종성 유전자 생성물의 제조 방법 및 고생산성재조합 세포의 선별 방법
CN115175559A (zh) 包含人源化pnpla3基因座的非人动物及其使用方法
CN114853871B (zh) Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用
CN113817770B (zh) Cd73基因人源化的非人动物的构建方法及应用
US20230287460A1 (en) Mammalian cells comprising integrated cas9 genes to produce stable integration sites, and mammalian cells comprising stable integration sites and other sites
CN114276433A (zh) Cd38基因人源化的非人动物及其构建方法和应用

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant