KR20090053893A - 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도 - Google Patents

전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도 Download PDF

Info

Publication number
KR20090053893A
KR20090053893A KR1020097001885A KR20097001885A KR20090053893A KR 20090053893 A KR20090053893 A KR 20090053893A KR 1020097001885 A KR1020097001885 A KR 1020097001885A KR 20097001885 A KR20097001885 A KR 20097001885A KR 20090053893 A KR20090053893 A KR 20090053893A
Authority
KR
South Korea
Prior art keywords
mar
sequence
human
identified
expression
Prior art date
Application number
KR1020097001885A
Other languages
English (en)
Inventor
니콜라스 메르모드
삐에르 알랭 기로드
다비드 칼라브레세
알렉산드레 레가미
살린 도니넬리-아로페
Original Assignee
셀렉시스 에스. 에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 셀렉시스 에스. 에이. filed Critical 셀렉시스 에스. 에이.
Publication of KR20090053893A publication Critical patent/KR20090053893A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

인간 및 인간을 제외한 동물의 MAR에 대응되거나 기초한 서열로서, 인간 및 인간을 제외한 동물 기원의 분리되고 및 동정된 MAR 서열이 개시되었다. 특히, 높은 전사 및/또는 활성을 향상시키는 단백질 생산을 갖는 MARs 및 MAR 구조가 개시되었으며, 따라서 이는, 단백질의 높은 생산 수율을 위하여 이러한 MAR 구조를 고안하고 사용하는, 이러한 MARs을 동정하기 위한 방법이다.

Description

전사를 증가시키기 위한 기질부착부위(MARS) 및 그의 용도{Matrix attachment regions(MARS) for increasing transcription and uses thereof}
본 출원은 2006년 8월 23일에 출원된 미합중국 가출원번호 제 60/823,319 호 및 2007년 8월 3일에 출원된 미합중국 가출원번호 제 60/953,910 호의 우선권의 이익을 주장하는 것이며, 전체로서 여기에 참조로 포함되었다.
본 발명은 인간 및 비-인간 동물 기원에서 분리되고 정제된 MAR 서열에 관련된 또는 비롯된, 뉴클레오타이드 서열을 포함하는 핵산에 관한 것이다. 이들 핵산은 일반적으로 전사 및/또는 단백질 생산에 대한 활성증가를 가진다. 본 발명은 또한 이러한 서열을 동정하는 방법 및 이들 서열을 사용하는 시스템 즉, 단백질의 높은 생산수율을 위한 방법에 관한 것이다.
본 발명을 설명하기 위하여, 그리고, 특히 예시로서 추가적인 세부사항을 제공하기 위하여 여기에 사용된 특허를 포함한 공보 및 기타 재료들은, 참조로서 포함된다. 편의상, 명세서 내에 전체로서 논술되지 않는 것에 관한 공보들은 첨부된 서지에 알파벳 순으로 나열하였다. EMBL 도서번호 AC102666 및 EMBL 도서번호 BH101870 및 BH101901을 비롯한 EMBL 도서번호 (동의어) 126658, 23119391, 22981746에 프랭크되어 있는(flanked) 서열 또한 전체로서 여기에 참조로 포함된다.
오늘날, 약 50-100kb의 염색질의 루프 도메인 내의 진핵 염색체의 조직화 모델은 널리 받아들여지고 있다[Bodnar JW, Breyene P, Van Montagu M and Gheyseu G, Razin SV]. 이들 루프의 외부 말단은 핵의 기질, RNPs(리보핵단백질)로 구성된 단백질성 네트워크 및 기타 비히스톤 단백질에 부착된 특이적인 DNA 서열에 관련되어 있다고 믿어졌다 [Bode J, Benham C, Knopp A and Mielke C]. 핵 기질에 부착된 염색체의 DNA 서열은 각각 스캐폴드(scaffold (중기 동안)) 부착부위 또는 기질(간기) 부착부위의 SAR 또는 MAR로 불린다. S/MARs, MAR 요소들(elements) 이나 MAR 서열 또는 짧은 MARs 은 전형적으로 300-bp 길이의 다변형 영역이었다. 포유동물 핵에 약 100 000 MARs이 있는 것으로 추정된다 [Bode J, Stengert-Iber M, Kay V, Schlake T and Dietz-Pfeilstetter A].
루프 도메인에 염색질이 구조적 및 기능적으로 분리되어 있어, MAR 요소들은 포유동물 핵의 전사 위치들(foci)의 연속적인 조립 및 분해를 용이하게 하기 위한 것과 같은 유전자 발현의 복제와 조절에서 중요한 역학을 할 것으로 생각된다. 이 개념을 지지하기 위하여 한 무리의 간접적인 증거가 형성되어왔는데, 예를 들어, 다양한 진핵생물의 게놈에서, DNA 복제 기원은 MAR 요소들 내에 지도화(mapped ) 된다[Amati B and Gasser SM (1988), Amati B and Gasser SM (1990)]. MARs는 또한 코딩(coding)되지 않는 유전자간(intergenic) 영역, 인트론 내[Girod PA, Zahn-Zabal M and Mermod N] 또는 전사단위의 가장자리[Gasser SM and Laemmli UK; National Center for Biotechnology Information]에서 거의 항상 발견되며, 그들은 편재성(ubiqutous)이며 및/또는 조직-특이적인 전사 요소가 결합할 수 있다. 결국, 식물 및 동물 세포주의 유전자 변형(transgenic) 실험에서, MAR 요소들은 변형유전자(transgene) 발현 및 안정성을 증가하는데 성공적으로 사용되어 왔다 [Allen GC, Spiker S, Thompson WF, Bode J, Schlake T, Rios-Ramirez M, Mielke C, Stengart M, Kay V and Klehr-Wirth D, Girod PA, Zahn-Zabal M and Mermod N]. 예를 들어, MARs는 CHO (중국 햄스터 난소) 세포와 같은 생물공학 및 치료 응용에 관련된 세포에서 다양한 재조합 단백질의 생산을 증가시키기 위하여 사용되어왔다 [Girod PA, Zahn-Zabal M and Mermod N, Kim JM, Kim JS, Park DH, Kang HS, Yoon J, Baek K and Yoon Y, Zahn-Zabal M, Kobr M, Girod PA, Imhof M, Chatellard P, de Jesus M, Wurm F and Mermod N] (Mermod et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions," WO 02074969, also U.S. Patent publication 20030087342).
MARs의 기능적 활성은 그들의 1차 DNA 서열보다는 그들의 구조적 성질에 연관되어 왔다. 실제로, MARs는 높은 A 및 T 함량을 가지며[Boulikas T (1993)], 분자의 타고난 만곡(natural curvature), 좁고 작은 그루브( minor groove), 높은 풀 림(unwinding)/비짝지음 포텐셜(potential) 또는 변성에 대한 민감성과 같은 일부 독특한 형태적, 물리화학적 성질들이 관찰되었다 [Bode J, Schlake T, Rios-Ramirez M, Mielke C, Stengart M, Kay V and Klehr-Wirth D, Boulikas T (1993), Boulikas T (1995)]. 사실상 이들의 정확한 성질들은 소위 SMAR Scan 방법을 통하여 MARs을 동정하는데 사용되어왔다. 게다가, MAR 활성은 또한 염색질 재-모델링 효소 및/또는, 단일나선 DNA 및/또는 단일 구부러진 DNA와 같은 MAR 요소들의 특이적인 구조적 특징을 인식할 수 있는 전사 인자에 의해 매개될 수 있다[Bode J, Stengert-Iber M, Kay V, Schlake T and Dietz-Pfeilstetter A]. 어떤 명백한(clear-cut) 단백질-결합 자리 또는 MAR 일치(consensus) 서열도 발견되지 않았으며 [Boulikas T (1993)], 이것이 게놈 서열로부터 MARs의 예측을 어렵게 만든다.
일부 MARs 기능적 및 구조적 성질이 설명되어 왔을지라도 그들의 동정은 어려우며, 이는 1차 구조의 관점에서 작게 나누어지기 때문이다. 동물의 MARs이 식물 핵 스캐폴드에 결합할 수 있고 그 반대의 경우도 가능하기 때문에[Breyne P, Van Montagu M, Depicker A and Gheysen G, Mielke C, Kohwi Y, Kohwi-Shigematsu T and Bode J], MAR 서열, 예를 들어, 잠재된 단백질 생산 서열을 설명하는 어떤 특징에 대하여, MAR 요소들이 진핵 생물의 게놈에 기능적으로 보존되어 있는 것으로 추측되고 지지된다. 또한, 다양한 결과들이 관련 검사에 의존하여 획득될 수 있다 [Razin SV, Boulikas T (1995), Kay V and Bode J]. 진핵 생물 유기체에서 어마어마한 수로 예상되는 MARs과 게놈 프로젝트에 의해 이슈된 서열의 함량을 고 려하면, 도구(tools)/프로그램은 MAR DNA 서열의 구조적 특징(SMAR Scan I), 또는 조절 단백질 또는 전사 인자로 작용하는 특이적인 단백질의 결합 자리(SMAR Scan II)와 같은 기능적 서열을 검출하기 위해 개발되었다[U..S. provisional patent application 60/953,910, filed August 3, 2007, U.S. Patent Publication 20070178469 to Mermod et al.]. 이러한 프로그램들은 DNA 굴곡, 큰 그루브 높이와 작은 그루브 너비 잠재성을 비롯하여 특이적인 전사 조절 단백질의 결합자리에 관련된 DNA 서열 클러스터(clusters) 특징을 검출하여 신규의 잠재성 MAR 서열을 동정하기 위하여 고안되었다. 이들 프로그램들은 CHO 세포에 형질감염된 발현 플라스미드에 도입되었을 때 변형유전자의 발현이 증가되는 다수의, 추정 MAR DNA 서열을 동정하기 위한 인간 게놈의 검색에 사용되었다 [Girod et al., "Identification of S/MAR from genomic sequences with bioinformatics and use to increase protein production in industrial and therapeutic processes," U.S. Patent Publication 20070178469 to Mermod et al.]. 이것은 이 SMAR Scan 프로그램이 동시에 단백질 합성을 향상시키기 위해 이용할 수 있는 인간 유전자 요소들(elements)을 효율적으로 동정할 수 있다는 것을 설명한다. 대규모(large-scale)의 생산에서, 지금까지 수행된 기능적 검색이 인간 게놈에 한정되었지만, 일부 흥미있는 단백질은 종종 인간을 제외한 포유동물 세포에서 발현된다.
약 1천 6백 MARs이 SMAR Scan에 의해 인간 게놈에서 동정되었으며, CHO세포에서 인핸서(enhancer)/프로모터(promoter)의 상위(upstream)에 위치할 때, 8개 중 6개는 유전자의 향상된 발현 (녹색 형광성 단백질(GFP), 항체 및 수용기)이 유발되는 것이 입증되었다. DNA 길이는 2.5 kb 내지 6 kb의 정규장소 밖의 MAR 활성범위를 가지는 것으로 보였다. 그러나, 지금으로선, MARs의 구조적 특성의 결핍은 "고안자" MARs의 생산을 한정하였다. 따라서, MAR의 공학 및 고안이 가능하도록 MARs의 특징화, 특히 MARs의 기능적 및/또는 구조적 영역의 특징화가 필요하다.
지금까지 수행된 구조적 스크린은 인간 게놈에 한정되었다. 대규모의 생산에서 흥미있는 단백질이 종종 포유동물 세포에서 발현되었기 때문에, 인간 및/또는 인간을 제외한 포유동물 세포에서 전사 및/또는 유전자-발현 및/또는 강력한 단백질 생산자 세포들을 향상시키는 더 강력한 자연적으로 발생하는 MARs의 동정하는 것이 필요하다.
결국, 발명의 필요성은 예를 들어, 자연적으로 발생하는 MARs를 더 동정하고, 동정된 MARs을 엔지니어링하고 및/또는 합성된 MARs를 생산하여 유리한 성질을 가지는 MARs를 동정하고 및/또는 생산하기 위한 것이다. 유리한 성질들은 그들 자신을 명백히 하며, 전사 및/또는 단백질 생산/ 유전자-발현 성질을 향상시키고 예를 들어, 유전공학에서 더 다재 다능하게 이용되도록 허용하는, 자연적으로 발생하는 MAR에 상대적인 길이를 감소시키고 조직, 세포 또는 기관에 특이적이며 및/또는 약물과 같은 부가적인 외부자극에 유도되도록 하나, 이에 한정되지 않는다.
하기에 공개되는 것으로부터 명백하게 될 하나 또는 그 이상의 필요성 및 기타 필요성을 제기하기 위하여, 추정되는 MAR DNA 서열을 동정하기 위한 생쥐 게놈의 대규모 생물정보 분석을 포함한 몇몇 접근들이 이용되었다. 생쥐 게놈은 MAR 예측 소프트웨어 SMAR Scan I을 이용하여 분석되었다. 새롭게 동정된 설치류 서열을 이용하여 배양 세포에서 약학적으로 흥미있는 재조합 단백질의 증가된 생산을 매개하도록 하는 그들의 능력을 평가하였다. 이 때문에, 새롭게 동정된 MARs의 전사 활성을 변형유전자 형질감염 분석에서 평가하였다.
게다가, 인간 1_68 MAR 및 생쥐 MAR S4 와 같은 MARs이 연구되었다. 모듈(modules), 특히, 어떤 구조적/ 서열-특이적인 MARs 모듈을 포함하는 모듈을 동정하였으며, 이 모듈을 유리한 성질을 가진 MARs 공학에, 예를 들어, 서열의 개편(reshuffling), 삭제(deletion) 및/또는 중복(duplication)에 활용하였다. 또한, 모듈을 다른 요소, 예를 들어, 어떤 결합 자리, 특히 독특한 전사 인자 결합자리(TFBS)를 포함하는 합성 뉴클레오타이드 서열과 조합하였다.
<발명의 요약>
일 실시예에서, 본 발명은 하나의 실시예로 하기를 포함하는, 적어도 하나의 유전자의 높은 발현 수준의 발현 시스템에 관한 것이다:
흥미있는 유전자를 인코딩하는 뉴클레오타이드 서열을 작동가능하게 연결하는 프로모터, 및
상기 발현 시스템에 형질 전환된 세포에 상기 유전자의 발현을 향상시키기 위한 적어도 하나의 인간을 제외한 포유동물의 MAR 뉴클레오타이드 서열,
여기에서 상기 인간을 제외한 포유동물의 MAR 뉴클레오타이드 서열은 상기 구조를 갖는 상기 세포의 형질전환된 상기 유전자의 발현을 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10배 또는 그 이상 증가시킴.
상기 인간을 제외한 포유동물의 MAR 뉴클레오타이드 서열은 다음으로 이루어지는 필수적인 구성을 포함할 수 있다:
(i) SEQ ID No. 3, SEQ ID No. 10 또는 그의 기능적 단편 또는
(ii) (i)의 서열 중 어느 서열과 약 80%, 약 90%, 약 95% 또는 약 98% 서열 동일성을 가지는 뉴클레오타이드 서열.
또한 본 발명은 하기를 포함하는, 필수적으로 하기로 이루어지는 또는 하기로 이루어지는, 분리 및 정제된 핵산분자에 지배된다:
(a) SEQ ID No. 3 or SEQ ID No. 10의 뉴클레오타이드 서열 또는 그의 기능적인 단편, 또는
(b) (a)의 서열과 적어도 약 80%, 약 90%, 약 95% 또는 약 98%의 서열 동일성 및 MAR 활성을 가지는 뉴클레오타이드 서열.
게다가, 본 발명은 하기를 포함하는, 인간을 제외한 포유동물의 MAR 서열을 동정하기 위한 방법에 지배된다:
- 적어도 하나의 인간을 제외한 포유동물의 핵산분자, 바람직하게는 인간을 제외한 포유동물의 게놈 또는 그의 일부를 제공하는 방법,
- 하기 단계를 포함하는, 상기 핵산분자를 대상으로 하여 MAR 서열을 검색하는 방법:
- 핵산분자를 평가하기 위하여 윈도우 크기를 세팅(setting)하는 단계,
- 적어도 1 또는 적어도 2, 바람직하게는 3, 더욱 바람직하게는 4 또는 그 이상의 MAR 관련 특징으로 선별하는 단계,
- 이/ 이들 특징(들)을 나타내는 서열의 역치값을 세팅하는 단계, - 이 역치값을 초과하는 MAR 후보 뉴클레오타이드 서열을 선별하는 단계, 및
- 상기 인간을 제외한 포유동물 MAR 뉴클레오타이드 서열을 포함하는 발현 시스템을 통하여 인간 및/또는 인간을 제외한 포유동물 세포의 형질전환된 상기 인간을 제외한 포유동물 MAR 핵산서열의 유전자 발현이 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 또는 10 배 또는 그 이상 증가되는지 확인하는 단계.
이 특징은 DNA 굴곡각(bending angle)의 값과 윈도우 값이 곱해져서 이 결과, 약 420과 약 1220, 약 520과 약 1120, 약 620과 약 1020, 약 720과 약 920과 같이, 약 320 내지 1320 사이의 증가 값을 얻을 수 있고 이 특징은 큰 그루브 높이 값과 윈도우 값이 곱해져서 이 결과, 약 1200과 약 3700, 약 1500과 약 3400, 약 1800과 약 3100, 약 2100과 약 2800 과 같이 약 900내지 약 4000 사이의 증가 값을 얻을 수 있고 및/또는 이 특징은 작은 그루브 높이 값과 윈도우 값이 곱해져서 이 결과, 약 750과 약 2250, 약 1000과 약 2000, 약 1250과 약 1750과 같이 약 500 내지 약 2500 사이의 증가 값을 얻을 수 있다.
또한 본 발명은 하기를 포함하는 MAR 구조에 지배된다:
(a) (i) 동정된 MAR의 말단 영역의 적어도 일부를 포함하는 분리된 뉴클레오타이드 서열, 및
(ii) 상기 동정된 MAR 또는 또 하나의 동정된 MAR의 약 10%, 약 15%, 약 20%, 약 25%, 약 30% 또는 그 이상을 포함하는 더 분리된 뉴클레오타이드 서열 또는
(b) (i) (a)(i)의 뉴클레오타이드 서열과 약 90%, 약 95%, 약 96%, 약 97% 약 98%, 또는 약 99%의 서열 동일성을 갖는 뉴클레오타이드 서열, 및
(ii) (b)(i)의 뉴클레오타이드 서열과 약70%, 또는 약80%, 바람직하게는 약 90%, 약 95%, 약 96%, 약 97%, 약 98%, 또는 약99% 의 서열 동일성을 갖는 뉴클레오타이드 서열.
본 발명에 따르는 다른 MAR 구조들은 하기를 포함한다:
연속적인 배열상의 동정된MAR 서열의 영역 또는 그의 일부,
여기에서 순서(order) 및/또는 방향(orientation)은 동정된 MAR 서열의 그것과는 다름.
게다가, 본 발명에 따르는 다른 MAR 구조들은 하기를 포함한다:
(a) 하기를 포함하는 중심(core) 뉴클레오타이드 서열,
(i) 동정된 MAR 서열의 적어도 하나의 분리된 또는 합성된 AT- 풍부 영역; 또는
(ii) (a) (i)의 AT- 풍부 영역과 적어도 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 갖는 적어도 하나의 AT 풍부 영역,
(b) 하기를 포함하는 뉴클레오타이드 서열,
상기 (a)의 뉴클레오타이드 서열에 인접한 적어도 하나의 DNA 단백질 결합자리, 여기에서 상기 결합자리는,
(i) 더 동정된 MAR 서열의 DNA 단백질 결합자리
(ii) (a)의 동정된 MAR 서열의 DNA 단백질 결합자리, 여기에서 상기 동정된 MAR 서열의 DNA 단백질 결합자리는 (a)의 중심(core) 뉴클레오타이드 서열 밖에 위치한 것임, 또는
(iii) 첫 번째 DNA 단백질 결합자리는 (a)의 중심에 존재하지만, 적어도 하나의 더 동정된 DNA 단백질 결합자리에 인접되며, 여기에서 상기 첫 번째 및 적어도 하나의 더 동정된 DNA 단백질 결합자리는 (a)의 중심에 인접하지 않는 것임, 또는
(iv) MAR 서열이 없는 DNA 단백질 결합자리.
본 발명은 또한 특이적인 MAR 구조 중 어느 하나를 포함하는 시스템, 특이적인 발현 시스템 중 어느 하나를 포함하는 키트(kit) 및 MAR 구조, 발현 시스템, 세포, 인간을 제외한 유전자변형 동물, 키트 및/또는 (1) 인간 병원체 단백질이나 인간 세포 표면 단백질을 인식하는 항체와 같은 단백질 및 에리트로포이에틴, 인터페론 또는 다른 치료상이나 진단상의 단백질과 같은 단백질을 생산하는 방법 및/또는 (2) 인 비트로(in vitro), 인 비보(in vivo) 유전자 치료, 세포 치료 또는 조직 재형성 치료에 여기에서 언급된 방법을 포함하는 발현 시스템에 지배된다.
본 발명은 인간을 제외한 동물로부터 분리하고 정제한 MAR 서열, 이들 서열의 동정 방법 및 인간 세포를 비롯한 설치류 세포와 같은 인간을 제외한 세포에서 단백질의 높은 생산 수율을 위하여 이들 서열을 적용한 시스템에 관한 것이다.
본 발명은 또한 MAR 구조, 특히 향상된 MAR 구조, 발현 시스템 및 이들 MAR 구조를 적용한 키트 및 생산, 특히 대규모의 단백질 생산 및 치료상의 이들의 용도에 지배된다.
게다가, 본 발명은 MARs/MAR 구조를 통하여 인간세포를 비롯한 인간을 제외한 포유동물에서 단백질의 높은 생산 수율에 대한 방법에 지배된다.
만약 정의하지 않으면, 여기에서 사용된 모든 기술적이고 과학적인 용어는 이 발명이 속하는 당업계에 숙련된 사람에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 비록 여기에서 묘사한 이들의 다양한 방법과 재료들은 본 발명의 실시에서 사용될 수 있을지라도, 실시에 적당한 방법과 재료들을 하기에 설명하였다.
본 발명에서 발현 카세트(expression cassette)는 이 유전자의 전사에 필요한 요소뿐만 아니라, 적어도 하나의 유전자를 포함하는 핵산이다.
본 발명에서 프로모터(promoter)는 유전자의 상위(upstream)에 위치하며, 유전자의 더 나은 전사를 이끄는 DNA의 조절 영역이다.
본 발명의 문맥에서 세포에서 발현, 예를 들어, 인간을 제외한 포유동물에서의 발현은, 인 비트로(in vitro) 및 인 비보(in vivo)에서의 발현을 말한다. 인 비트로 발현은, 예를 들어, HeLa 세포주 또는 CHO 세포주와 같은 세포주 및 인 비트로 유전자 치료에 사용되는 세포에서의 발현을 포함한다. 인 비보 발현은 인간을 제외한 유전자 변형동물에서의 발현 및 인간 유전자 치료 수여자에게 세포의 재도입 후, 인 비보 유전자 치료 또는 인 비트로 유전자 치료에서 사용된 인간세포에서의 발현을 포함한다.
본 발명에서 인간을 제외한 포유동물 세포와 같은 포유동물 세포는, 세포 배양 조건하에 유지될 수 있는 것이다. 이 세포 타입의 비-제한적인 시료는 중국 햄스터 난소(CHOs) 세포이다.
본 발명에서 MAR 구조 (MAR construct), MAR 요소, MAR 서열, S/MAR 또는 단지 MAR은, 자연적으로 발생되는(naturally occurring) "SAR" 또는 "MAR" 과 하나 또는 그 이상 의 (둘, 셋 또는 넷과 같은) 특징을 나눠가지며, 상기 MAR에 의해 영향받는 어떤 유전자의 단백질 발현을 용이하게 하는 적어도 하나의 성질을 갖는 뉴클레오타이드 서열이다. 또한 MAR 구조는 예를 들어 "향상된 MAR 구조" 하에 설명된 발현 안정화 활성 및/또는 다른 활성을 제외한, MAR 활성, 특히 전사 모듈화, 바람직하게는 향상된 활성을 갖는 분리 및/또는 정제된 핵산이 되는 특징을 가진다. MAR 구조는 초기에 다음을 기초로 하는 동정된 MAR에 기초하여 정의될 수 있다: 따라서, MAR S4 구조, 즉 뉴클레오타이드의 주요 부분(50% 이상)이 MAR S4에 기초한 MAR 구조. 잘 수용된 모델에 따른, 자연적으로 발생된 SARs 또는 MARs은, 이형 염색질 중심에서 바깥쪽으로 확장된 염색질 루프 도메인을 생산하는, 핵 기질에 특이적인 DNA 서열의 고정을 매개한다. SARs 또는 MARs는 어떤 분명한 일치 또는 인식가능한 서열을 포함하지 않으며, 그들의 대부분의 한결같은 특징은 한 나선에 절대적으로 높은 A와 T 함량 및 우세한 C 염기로 나타난다. MARs은 대개 나선 분리의 경향이 있을 지도 모르는 굽은 2차 구조를 형성하는 경향성을 갖는다. A 와 T 함량이 높은 몇몇 단순 서열 모티프들(motifs)이 종종 SARs 및/또는MARs 내에서 발견되어 왔지만, 대부분의 경우에, 그들의 기능적인 중요성과 활성 잠재 모드(mode)는 풀리지 않았다. 이들은 A-box, T-box, DNA 풀림 모티프, SATB1 결합 자리(H-box, A/T/C25) 및 척추동물 또는 초파리에 대한 동일 토포아이소머라아제 II (topoisomerase II) 결합 자리를 포함한다.
본 발명에서, MAR 후보 또는 MAR 후보 서열은 둘, 셋 또는 넷의 자연적으로 발생하는 SARs 또는 MARs과 같이, 하나 또는 그 이상의 특징을 나누어 갖는 서열이다.
본 발명에서, 동정된 MAR 또는 동정된 MAR 서열은 분리 및 정제된 뉴클레오타이드 서열이며, 이것의 자연적인 다른 한쪽의 단백질/유전자 발현이 전부 향상되도록 하는 모든 영역("모듈(modules)" 또는 "요소(elements)")을 포함하는, 자연적으로 발생하는 MAR 서열에 해당한다.
동정된 MAR의 모듈(modules) (또한 여기에서, "영역(regions)," "DNA 영역", "일부분(portions)", "도메인(domains)"으로 언급되기도 함)은 자연적으로 발생하는 MAR의 능력에 대하여 단백질/유전자의 발현을 향상시키는데 모두 필요하다. 어떤 모듈도 일반적으로 그 자체로서 MAR의 전체 활성을 수행하도록 할 수는 없다. 그들 영역의 일부는 AT-디뉴클레오타이드 풍부 굽은 영역 및 아래에 설명한 전사 인자 결합 자리(TFBS) 영역과 같은 특이적인 서열이었다. 다른 "영역"은 그들의 위치, 예를 들어, 동정된 MAR 서열의 5' 및 3' 말단 영역에 의해 특징화되었다.
AT/TA-디뉴클레오타이드 풍부 굽은 DNA 영역 (이하, "AT-풍부 영역")은 많은 수의 A 와 T, 특히 디뉴클레오타이드 AT 및 TA의 형태로 포함된 굽은 DNA 영역이다. 바람직한 실시예에서, 이것은 펼쳐진 100개의 연속적인 염기쌍 상에 적어도 10% 의 디뉴클레오타이드 AT, 및/또는 적어도 12%의 디뉴클레오타이드 TA, 바람직하게는 펼쳐진 100 개의 연속적인 염기쌍 상에 (또는 AT-풍부 영역이 짧은 길이의 것일 때 각각 짧게 펼쳐진 상에서) 적어도 33% 의 디뉴클레오타이드 AT, 및/또는 적어도 33%의 디뉴클레오타이드 TA를 포함하며, 동시에 굽은 2차 구조를 갖는다. 그러나, "AT-풍부 영역"은 약30 또는 미만의 뉴클레오타이드 정도로 짧을 수도 있으나, 바람직하게는 약50 뉴클레오타이드, 약 75 뉴클레오타이드, 약 100 뉴클레오타이드, 약 150, 약 200, 약 250, 약 300, 약 350 또는 약 400 뉴클레오타이드 만큼 길거나 또는 더 길다.
아래에 논의될 것으로, AT-풍부 영역은 예를 들어, 이것의 상대적인 높은 굴곡각에 의해 결합 자리와 같은 이웃 영역과 구별될 수 있다. 또한 일부 결합 자리는SATB1 결합 자리(H-box, A/T/C25) 및 척추동물 또는 초파리에 대하여 동일한 Topoisomerase II 자리와 같은 종종 상대적으로 높은 A와 T 함량을 가진다. 그러나, 결합 자리군을 포함하는 결합 자리 영역(binding site region (모듈)), 특히, TFBS 영역은, 영역의 굽은 패턴을 비교하여, AT 및 TA 디뉴클레오타이드 풍부 영역("AT-rich regions")과 쉽게 구별될 수 있다. 예를 들어, 후자인 인간 MAR 1_68은, 평균 약 3.8 또는 약 4.0 의 과도한 만곡 정도를 가지지만, TFBS 영역은 평균 만곡정도가 약 3.5 또는 약 3.3보다 낮은 값을 가진다. 동정된 MAR는 또한 그 밖에 여기에서 설명한 바와 같이, 상대 용해 온도(relative melting temperatures)와 같은 다른 값으로 확인 될 수 있으나, 이에 한정되지 않는다. 그러나, 이러한 값은 종-특이적이며, 따라서 종마다 다양할 수 있으며, 예를 들어 낮아진다. 따라서, 각각 AT 및 TA 디뉴클레오타이드 풍부 영역은 약 3.2 에서 약 3.4 또는 3.4 에서 약 3.6 또는 3.6 에서 약 3.8과 같이 낮은 만곡 정도를 가지며, TFBS 영역은 약 2.7 미만, 약 2.9 미만, 약 3.1 미만, 약 3.3 미만과 같이 비율적으로 낮은 만곡 정도를 가질 수 있다. SMAR Scan II에서, 각각의 낮은 윈도우 크기는 숙련된 당업자에 의해 선택될 것이다.
본 발명에서, 동정된 MAR/MAR 서열의 말단 영역은 동정된 MAR의 적어도 약 5%, 약 6%, 약 7%, 약 8%, 약 9% 또는 약 10%을 포함한다.
결합 자리 또는 DNA 단백질 결합 자리는 DNA 결합 단백질에 결합될 수 있는 뉴클레오타이드 서열이다. DNA 결합 단백질의 결합 자리는 전형적으로 TFBS이다. 이 TFBS는 전사 인자가 결합할 수 있는 어느 서열이다. 이 TFBS는 인간이나 생쥐와 같은 기원으로부터 유래될 수 있으며, 이에 한정되지 않는다. 또한 TFBS는 재조합되거나 합성될 수 도 있다. 그러나, 일부 예시에서, TFBS는 동일한 생물체, 동일한 종 또는 동일한 속의 MAR 서열과 같이, MAR 서열의 상대 서열(counterpart)을 가진다. 그러나, TFBS는 다른 종 또는 다른 속의 MAR 서열과 구별될 수 있다. 또한 본 발명에서, MAR 서열에서 현재 알려지지 않은 상대 서열을 가지는 TFBS를 조명한다. 이러한 TFBS들로는 USF1 (상위 자극인자1; upstream stimulatory factor 1) 또는 징크-핑거 단백질(zink-finger protein) CTCF의 결합자리가 있으나, 이에 한정되지 않는다. TFBS는 1, 2, 3, 4, 5 또는 그 이상의 치환, 추가 및/또는 삭제 에 의해 변형될 지도 모르며, 전체 또는 일부에서 합성될 수 있다. 또한 본 발명에서, 각각의 DNA 결합 단백질에 대한 결합 친화성을 갖는 TFBS들 및 종종 알려지지 않은 자연의 상대 서열을 갖는 최적의 TFBS들을 조명한다. 이들 최적화 TFBS는 자연적으로 발생하는 TFBSs 또는 합성적으로, 특히 화학합성으로, 상기 변형을 만들 수 있다. 본 발명의 일 실시예에서, 결합자리(들) 또는 TFBS(s)는 MAR에 대한 조직 특이성을 부여하는데, 예를 들어, 조직-특이적으로 자연의, 공학의 또는 합성의 조절 단백질이 결합되거나 또는 다른-특이적인 약물이나 분자에 반응할 수 있는 자연의, 공학의 또는 합성의 단백질이 결합될 수 있다. 유전자 및/또는 세포 치료는 조직-특이성을 비롯하여 어떤 약물에 특이적으로 반응하는 즉, 약물에 의해 유도될 수 있는 MAR의 능력으로부터 혜택을 보는 전형적인 경우이다. 예를 들어, 전자의 경우에, 흥미있는 유전자는 특이적인 기관이나 조직에서만 발현되지만, 후자의 경우에는 오직 어떠한 약물에 반응하여 작동될 수 있다. 기타의 제한되지 않은 예시에서 TFBSs가 포함될 수도 있는 전사 인자는 예를 들어SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alpha, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3 beta, MRF2, Oct1, POU6F1, SRF, V$MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Brn2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6 및/또는TFIIA 이었다.
TFBS와 같은 결합자리는, 만약 중심 뉴클레오타이드 서열과 결합자리가 약 200, 바람직하게는 약 100 뉴클레오타이드, 더욱 바람직하게는 약 50 뉴클레오타이드, 더 더욱 바람직하게는 약 25 뉴클레오타이드, 약 15 뉴클레오타이드, 약 5 뉴클레오타이드 또는 0 뉴클레오타이드 보다 많지 않게 떨어져 있다면, 중심 뉴클레오타이드 서열 인접되어있다고 말한다. 바람직한 예시에서, 결합자리 특히, TFBSs는 스스로 TFBs의 양쪽 면에 25 뉴클레오타이드까지의 짧은 링커 또는 어뎁터를 포함한다. 더욱 바람직한 예시에서, TFBS는 약 50 뉴클레오타이드, 약 40 뉴클레오타이드 또는 약 30뉴클레오타이드까지의 올리고머의 부분이다. 본 발명에 따르는 TFBSs와 같은 결합 자리 시리즈는, 서로 다음 서열에 배열된 TFBSs 열(row)이다. 만약 중심 근처에 있는 TFBS 시리즈가 상기의 특이적인 거리에 있다면, 중심 뉴클레오타이드서열에 인접되어 있다고 말한다. 만약 상기 결합자리가 중심 뉴클레오타이드 서열의 일부분이고, 자연적으로 발생되는 MAR의 동일한 위치에 상대 서열을 갖는 결합 자리라면 "AT-풍부 영역"을 프랭크한다 말한다.
결합 자리는 1, 2, 3, 4, 5 또는 그 이상의 치환, 추가 및/또는 삭제에 의해 변형될 수 있다. 바람직하게는 이들 치환, 추가 및/또는 삭제는 결합 자리가 각각의 결합자리의 동일한 서열과 맞기 때문에 도입되었다.
향상된 MAR 구조 다양성은 본 발명의 일부이며, 자연적으로 발생한 및/또는 본 발명에 따르는 MAR 구조에 기초한, 특히 중심 핵산 서열이 기초로 하는 자연 발생 MAR인, 동정된 MAR를 초과하여 향상되는 특징을 갖는다. 이러한 특징은 자연적으로 발생한 및/또는 동정된 MAR의 전체 길이에 대하여 상대적으로 감소된 길이, 유전자 발현/전사 향상, 발현의 향상 안정성, 조직 특이성, 유도성 또는 그의 혼합을 포함하나, 이에 한정되지 않는다. 따라서, 향상된 MAR 구조 예를 들어, 동정된 MAR 서열의 뉴클레오타이드 수의 약 90% 미만, 바람직하게는 약 80% 미만, 더욱 바람직하게는 약 70% 미만, 약 60% 미만, 또는 약 50% 미만을 포함한다. MAR 구조는 상기 구조를 가진 알맞은 세포의 형질전환상의 유전자 발현 및/또는 유전자의 전사를 향상할 수 있다. 본 발명의 내용에서, 만약 참조가 MAR 구조/MAR (뉴클레오타이드) 서열이 "활성을 향상시키는 유전자 발현"을 가지는 "발현을 향상시키다", "단백질 발현을 향상시키다" 또는 이와 유사어로 MAR 구조/MAR (뉴클레오타이드) 서열이 만들어진다면, 이러한 서열이 없는, 이와 다른 등가의 조건하에서 발현되는, 예를 들어 유전자의 발현과 관련이 있다. 예를 들어, 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10 배 또는 약 15 배, 약 20 배 또는 약 25 배 또는 그 이상일 수 있다.
또한, MAR 구조 매우 높은 생산 세포의 평균 백분위수를 약 5 배, 약 10 배, 약 15 배 또는 그 이상으로 증가시킬 수 있다. 따라서, 유전자의 높은 평균 발현을 제외하고는, 매우 높게 발현하는 세포의 백분위수의 증가를 비롯한, 안정한("저항적인") 콜로니의 발생(약 100%, 약 200%, 약 300% 또는 약 400% 또는 그 이상의 증가, 및/또는 낮은 발현의 다양성(약 30%, 약 40%, 약 50% 또는 그 이상의 cv (변동계수)의 감소))은 본 발명의 범위 내에 있다.
MAR 구조 또는 유사 구조 "발현 안정성이 향상될 수 있다". 이 "향상"은 이러한 MAR 구조/MAR 서열이 부재되어 있지만, 이와 다른 등가의 조건하에 발현되는, 예를 들어 유전자의 발현과 관련이 있다. 안정성 향상은, 예를 들면 약 5, 10, 20, 25, 30, 35, 40, 45, 또는 50 주까지 도달한 후에 100% 향상을 유지시킬 수 있다. MAR 구조는 예를 들어, 근육, 간, 중추 신경계 또는 기타 조직에 대하여 특이적이며, 및/또는 항체, 호르몬 및/또는 대사 중간체와 같은 물질의 조절로 유도될 수도 있다.
MAR 구조/MAR 서열은 바람직하게는 흥미있는 유전자가 있는 또는 작동 가능하게 연결되어 있는 프로모터 영역의 상위에 삽입될 수 있다. 그러나, 일 실시예에서, MAR 구조는 흥미있는 유전자/뉴클레오타이드 서열의 하위 또는 바로 하위뿐만 아니라 상위에 위치되는 것이 유리하다. 또한, 시스 및/또는 트란스(trans)상의 다른 다중성 MAR 배열도 본 발명의 범위 내에 있다.
MAR 구조 또는 MAR 영역은, 만약 그것이 자연적으로 발생하는 "SARs" 또는 "MARs" 또는 그의 각각의 영역을 갖는 하나 또는 그 이상(둘, 셋 또는 넷)의 특징을 공유하고, 상기 MAR에 의해 영향받는 어떤 유전자의 단백질 발현을 용이하게 하는 적어도 하나의 특징을 가진다면, 예를 들어, 동정된 MAR 또는 동정된 MAR 영역에 기초로 한다고 말한다. 이들 MAR 구조 또는 MAR의 영역은 대개 여기에서 제공된 단어의 정의에 따라, 동정된 MAR과 "실질적 동일성"을 갖는다. 이들 및/또는 그의 뉴클레오타이드 서열의 변형에도 불구하고, 그들은 적어도 하나의 동정된 MAR의 기능성/근원적인 특징을 유지할 것이다.
또한 본 발명은 향상된 MAR 구조를 포함하는 MAR 구조의 용도를 제시한다. 이들 용도에서, MAR 구조는 또한, 히스톤 디아세틸라아제(HDAC), 히스톤 변형자, 좌위 조절 영역(locus control regionsLCRs)과 같은 다른 DNA 요소, cHS4 또는 항억제자 요소(antirepressor elements) (예를 들어, 안정제 및 항억제자 요소 (STAR 또는 UCOE 요소) 와 같은 절연체 또는 핫 스팟(hot spots) (Kwaks THJ and Otte AP)과 같은 하나 또는 그 이상의 비-MAR 에피제닉(epigenic) 유전자 조절 도구 과 조합될 수 있으나, 이에 한정되지 않는다.
MAR/MAR 구조의 문맥에서 사용된 '합성'은 동정된 MARs 또는 여기에 기초한 MARs의 MAR을 언급하는 것으로, MAR의 고안은 서열/영역 또는 부분 영역의 단순한 개편, 중복 및 또는 삭제 이상을 포함한다. 특히, 합성 MARs/MAR 구조는 대개 동정된 MAR의 하나 또는 그 이상, 바람직하게는 하나의 영역으로 이루어지나, 이는 일부 실시예에서 합성 또는 변형을 비롯하여, TFBSs 의 하나 또는 시리즈와 같이 잘 특성화된 요소로 특이적으로 고안되며, 바람직한 예시에서는, 합성적으로 생산된다. 이들 고안자 요소는 많은 예시들에서 비교적 짧으며, 특히, 그들은 대개 약 100, 약 50, 약 40, 약 30, 약 20 또한 약 10 bps의 길이를 넘지 않는다. 일부 예시에서, 이들 요소들은 다중결합화 된다.
본 발명에서, 인간을 제외한 포유동물의 MAR(non-human mammalian MAR)는, 적어도 일부분에서 인간을 제외한 포유동물 생물체의 게놈 또는 게놈의 일부를 통하여 확인된 MAR/ MAR 서열이다. 예를 들어, 이것은 생쥐 게놈과 같은 설치류 게놈의 분석을 통하여 동정된 MAR/ MAR 서열을 포함하며, 이에 한정되지 않는다.
본 발명에서, 벡터(vector)는 연결된 다른 핵산을 수송하는 능력이 있는 핵산 분자이다. 예를 들어, 플라스미드는 벡터의 한 타입이며, 레트로바이러스 또는 렌티바이러스는 벡터의 다른 타입이다.
본 발명에서, 형질감염(Transfection)은 전자천공(electroporation), 리포좀 형질감염(lipofection) 과 같은 방법으로, 바이러스성 벡터 또는 화학적 방법을 통하여 진핵생물 세포 수여자(recipient) 내에 핵산을 도입하는 것이나, 이에 한정되지 않는다.
여기에서 사용된, 형질전환(Transformation)은 핵산 추가에 의해 진핵생물 세포가 변형되는 것을 의미한다. 예를 들어, 세포를 형질전환시키는 것은 전자천공법으로 DNA 벡터를 도입하는 것과 같이, 핵산을 세포에 형질감염시키는 것을 포함할 수 있다. 그러나, 많은 예시들에서, 본 발명의 향상된 MARs를 세포 내로 도입시키는 방법은 어떤 특별한 방법에 한정되지 않는다.
전사(Transcription) DNA 주형으로부터 RNA의 합성을 의미한다.
시스(Cis) 이에 한정되지는 않으나, 동일한 벡터 또는 염색체와 같은 동일한 핵산 분자 상의 둘 또는 그 이상의 요소(염색질 요소와 같은)의 배치를 말한다.
트란스(Trans) 이에 한정되지는 않으나, 둘 또는 그 이상의 벡터 또는 염색체와 같은 둘 또는 그 이상의 핵산 분자 상의 둘 또는 그 이상의 요소(염색질 요소와 같은)의 배치를 말한다.
서열은, 이것이 시스/트란스 위치에서 그의 활성이 작용될 때, 예를 들어, 유전자의 시스 및/또는 트란스에서 활동한다고 말한다.
본 발명에서, 윈도우(window)는, 예를 들어, SMAR Scan 과정 동안, 평가된 MARs의 다수의 염기쌍을 설명한다. 상기 염기쌍 수는 대개 약 50 bps, 약 100 bps, 약 200 bps, 약 또는 300 bps이다. 그러나, 400, 500, 600 또는 그 이상의 bps 윈도우 또한 본 발명의 범위 내에 있다.
뉴클레오타이드 서열 또는 그의 단편은, 뉴클레오타이드 서열 (또는 이것의 상보적인 나선)과 (적당한 뉴클레오타이드 추가 또는 삭제로) 최상으로 나열되었을 때, 뉴클레오타이드 서열 동일성이 뉴클레오타이드 염기의 약 70%, 더욱 일반적으로 적어도 약 80%, 바람직하게 적어도 약 90%, 및 더욱 바람직하게 적어도 약 95-98%라면, 다른 서열과 실질적 동일성(substantial identity)을 갖는다.
동일성은, 전체 서열 및 완전한 서열과 같이, 어떤 두 서열의 선 사이에 매칭되는 동일성으로 결정되는 두 뉴클레오타이드 서열 사이의 서열 관계성 정도를 의미한다. 동일성은 쉽게 산출될 수 있다. 두 뉴클레오타이드 서열 사이의 동일성을 측정하기 위한 수많은 방법이 존재하는 만큼, 용어 "동일성"은 숙련된 당업자에게 잘 알려져 있다(Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991). 방법들은 일반적으로 "Guide to Huge Computers"(Martin J. Bishop, ed., Academic Press, San Diego, 1994, and Carillo, H., and Lipman, D., SIAM J Applied Math. 48: 1073 .1988)에 개시된 방법을 포함하는 두 서열 사이의 동일성을 결정하는 방법을 사용하나, 이에 한정되지 않는다. 동일성을 결정하기 위한 바람직한 방법은, 테스트된 두 서열 사이에 가장 잘 매치(match)되도록 고안하는 것이다. 이러한 방법들은 컴퓨터 프로그램으로 체계적으로 정리된다. 두 서열 사이의 동일성을 결정하기 위한 바람직한 컴퓨터 프로그램 방법은, GCG (Genetics Computer Group, Madison Wis.) 프로그램 패키지(Devereux, J., et al., Nucleic Acids Research 12(1). 387 (1984)), BLASTP, BLASTN, FASTA (Altschul et al. (1990); Altschul et al. (1997))를 포함하나, 이에 한정되지 않는다. 잘 알려진 스미스 워터만 알고리즘(Smith Waterman algorithm) 또한 동일성을 결정하는데 사용될 수 있다. 도해로서, 예를 들어, 참조 뉴클레오타이드 서열과 적어도95% "동일성"을 가지는 뉴클레오타이드 서열을 포함하는 핵산은, 뉴클레오타이드 서열의 뉴클레오타이드 100개 당 5개의 점 돌연변이까지 포함할 수 있는 뉴클레오타이드 서열을 제외하고는 핵산의 뉴클레오타이드 서열이 참조 서열과 동일하다는 것을 의미한다. 다른 말로, 참조 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 가지는 뉴클레오타이드를 획득하기 위해서는, 참조 뉴클레오타이드 서열의 뉴클레오타이드 5% 까지를 삭제하거나 다른 뉴클레오타이드로 치환될 수 있으며, 또는 참조 서열의 총 뉴클레오타이드의 5% 까지의 뉴클레오타이드 수를 참조서열 내로 삽입시킬 수 있다. 이들 참조 서열의 돌연변이는 참조 뉴클레오타이드 서열의 5' 또는 3' 말단 자리 또는 이들의 말단 자리 사이의 어느 곳에서, 참조 서열의 뉴클레오타이드 사이에 개별적으로 흩어져서 또는 참조 서열 내에 하나 또는 그 이상의 연속적인 그룹으로 일어날 수 있다.
뉴클레오타이드 서열의 기능적 단편들은 또한 본 발명의 일부이다. 단편은 자연적으로 발생하는 상대 서열의 바람직한 기능, 특히 그들에 의해 영향받는 유전자의 발현 증대를 유지시키는 기능적인 부분이 고려된다. MAR 또는MAR 영역의 단편을 삭제하여 MAR/영역의 전사 향상 활성이 감소된다면, 이것을 버리는 수 이외에는 여전히 기능적인 단편이 고려된다. 단편이 다른 MAR 서열 없이 사용될 때, 만약 완전히 기능적인 단편이 전혀 관찰되지 않는다면, "완전히 기능적인 단편"의 어떤 활성상의 감소는 통계적으로 확신될 수 없다. 여기에서 제공된 정의에 따라, 예를 들어, 자연적으로 발생하는 MAR, 동정된 MAR, MAR영역 또는 이들 중의 어느 하나의 단편에 대하여, 실질적인 동일성을 가지는 기능적인 단편 또한 본 발명의 범위 내에 있다.
일 실시예에서, 여기에서 설명될 수 있는 바와 같이, 모듈 또는 그의 일부분은 대상이 개편, 중복 및/또는 삭제되었다. 당업계의 숙련된 사람이라면, 그러한 영역의 개편 및/또는 중복이 예컨대, 새로운 제한 자리(restrictions sites)를 만들 수 있으며, 이러한 제한 자리는 차례로, 구조의 새로운 제한 패턴을 도출하고, 서열 길이의 조정을 도출할 수 있다는 것을 알 수 있다. 이들의 조정은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10-15, 15-20, 20- 25, 25-30, 30-35, 35-40 뉴클레오타이드에 영향을 미치며, 이에 한정되지는 않는다. 이들 조정을 비롯하여 다른 변형들도 본 발명의 범위 내에 있다. 각각 요소(들) (또는 영역(들)/모듈(들) 및/또는 그의 단편(들))으로 여기에서 제공된 정의에 따라 실질적인 동일성을 가지는 재배열된 MARs의 서열들, 특히 개편 및/또는 중복된 MARs은 본 발명의 범위 내에 있다.
MAR 서열은 식물에서 포유동물 세포 또는 그 반대의 경우로 전달될 수 있으며, 이형 기원의 호스트(host) 세포에서 핵 기질 부착 활성을 유지할 것이다 [Breyne P, Van Montagu M, Depicker A and Gheysen G, Mielke C, Kohwi Y, Kohwi-Shigematsu T and Bode J]. 모든 고등 진핵생물에서 MAR 기능이 보존적이라고 가정한다면, 다른 속에서부터 유래된 MAR 서열이 어떤 속에서도 잘 작동될 수 있음을 기대할 수 있을 것이다.
그럼에도 불구하고, 설치류 기원의 MAR 서열이 동일한 방법으로 재조합 단백질 생산에 유리할 수 있을 지도 모른다고 추론되기 때문에, 하기에서 설명하고 있듯이, DNA 서열의 구조적인 특징(예를 들어, DNA 굴곡)을 검색하는 컴퓨터 프로그램인, SMAR Scan I을 이용하여 MAR 후보 서열을 동정하기 위하여 전체 생쥐 게놈을 검색하였다.
하기에서 논의되겠지만, 인간을 제외한, 특히 설치류(여기에서는 생쥐)의 MAR 서열은 예컨대, CHO 세포를 비롯한 HeLa 세포와 같은 사람세포에서의 발현 향상의 관점에서 더욱 강력해지는 놀라운 발견을 하였다. 심지어 더욱 놀랍게도, 일부 인간을 제외한 MAR 서열은, 인간 MAR 서열보다 인간을 제외한 세포, 예컨대 CHO 세포를 비롯하여 인간 세포에 까지 실질적으로 일을 잘한다.
생쥐 기원의 동정된 다수의 신규한 S/MAR DNA 서열은, 유전자 변형 발현을 증가시키는 것으로 보여질 수 있으며, 따라서 인간 MAR 서열에 대하여 고안되고 검사된 프로그램인 SMAR Scan I은, 게놈의 기원, 예컨대 생쥐 및 이에 추가하여 인간의 군으로부터 S/MAR 요소를 동정하기 위한 효과적인 도구이다. 그러나, 중요하게도, 더 잠재적인 MAR 요소는 인간 게놈을 검색하는 것보다 설치류(예를 들어, 생쥐) 게놈을 검색함으로써 동정될 수 있다는 것을 확인하였다. 특히, 본 발명은 생쥐 게놈의 높은 활성 S/MAR 요소가 다양한 세포, 예를 들어, 생쥐 및 인간 세포에서 약학적인 용도를 가지는 재조합 단백질과 같은 재조합 단백질의 생산을 증가시키는데 사용될 수 있음을 확립한다. 생쥐 S/MAR S4는 새롭게 분리된 생쥐 MARs 및 앞서 클론된 인간 MARs의 대부분의 잠재성을 보여주었다. 따라서, 본 발명은 향상된 단백질 생산성을 갖는 인간을 제외한 MARs 및/또는 장기간 단백질 발현의 안정성을 증가시키는 MARs에 지배된다.
SMAR Scan I은 MAR 후보 서열을 그들의 구조적 및 물리 화학적인 특징에 기초하여 동정하는 소프트웨어 도구이다. 그 밖에 방법상의 면밀한 논의가 제공되어왔다(U.S. Patent Publication 20070178469 to Mermod et al). 필수적으로, "SMAR Scan"은, 디뉴클레오타이드 중량-기질에 기초하여, DNA의 형태적 및 물리 화학적인 성질의 이론적인 값을 계산하여 프로파일을 인식하는 알고리즘을 포함하는 생물정보학적 도구를 기술한다. 바람직하게, SMAR Scan은, 다양한 크기의 검색 윈도우를 이용하여 매우 다양한 조합으로, DNA 굴곡, 큰 그루브 높이 및 작은 그루브 너비 잠재성, 녹는점에 상응하는 DNA 서열 특징을 평가한다. 각각의 특징에 대하여, 컷-오프(cut-off) 또는 역치 값이 정해진다. 프로그램은 상기 설정된 컷-오프/역치값인 해당 영역의 계산 점수를 매 시간 체크한다.
두 개의 데이터 산출 모드는 타격(hits)을 처리하는데 이용 가능하며, 첫 번째 모드("프로파일 유사"으로 칭함)는 단순히 문의 서열 및 선택된 다른 기준에 대한 대응 값의 모든 타격 위치를 회복한다. 두 번째 모드("연속 타격"으로 칭함) 는 수개의 연속적인 타격 위치와 그의 대응서열만 회복한다. 이 모드에 대하여, 최소 연속 타격 수는 회복가능한 윈도우 크기로 다시 세팅할 수 있는 다른 컷-오프/역치 값이다. 컷오프/역치 디폴트 값, 예를 들어 4개의 이론학적 구조 기준을 맞추기 위해서, 실험적으로 확인된 MARs, 예를 들어, SMARt DB로부터의 값이 이용될 수 있다. 예를 들면, 이 방법에서, 데이터베이스로부터의 모든 인간 MAR 서열에 대하여 "프로파일 유사" 모드를 이용하여 4개의 기준 및 세팅되지 않은 컷-오프/역치값으로 SMAR Scan을 실시하고 분석하였다. 이것은 서열의 각 위치에 대한 각 구조 세팅을 하게 하였다. 그런 다음, 각 기준에 대한 분포를 이들 데이터에 따라 계산하였다(U.S. Patent Publication 20070178469 to Mermod et al. 도 1 및 도 3 참조.).
SMAR Scan 기술의 용도가 MAR 서열의 동정을 위한 바람직한 것이기는 하지만, 당업계의 숙련된 사람은 유사하거나 심지어 다소 낮은 선택성의 S/MAR 모티브의 동정에 이용되는 다른 생물정보학적 도구가 본 발명에 사용될 수 있다는 것을 알 수 있을 것이다. 바람직하게는, 이러한 도구는, 세팅된 역치 값 또는 컷-오프 값에 따라 특징이 나타나는 MAR 관련 특징만이 좋은 타격을 산출하거나 또는 좋은 타격을 산출하도록 세팅될 수 있기 때문에, 그렇게 세팅될 수 있다. 그러나, MARs 동정에 사용된 많은 생물정보학적 도구들은, 기질-결합 활성을 동정하는데 고안되었다. 이 활성은 유전자 발현 증가에 대한 능력에 필수적으로 상호 관련되어 있지 않다 [Phi-Van, L. & Stratling, W.H.].
SMAR Scan I은 인간 MARs의 동정을 위해 개발되었다. 따라서, 알려진 인간 MARs에서 수집된 구조적인 데이터를 이용하여 개발되었다. 인간 "맞춤(tuned)" SMAR Scan I 프로그램은 생쥐 게놈의 MAR 서열을 평가하기 위해 본 발명에서 사용되었다. 그러나, 생쥐와 인간 게놈의 염기 구성상의 차이점은, 인간 게놈을 검색하기 위해 사전에 확인-세팅된 SMAR Scan 프로그램을 사용하는 것을 방해하였다(U.S. Patent Publication 20070178469 to Mermod et al). 그러므로 윈도우 크기와 구조적 파라메터 역치 값의 차이점은, 그 프로그램이 후보 생쥐의 MAR 서열을 처리하기 쉽도록 수집하여 동정될 때까지 시행착오(trial and error )에 의해 확인되었다. 테스트 시, 이들의 몇몇은, 예시로서, 각각의 단백질을 코딩하는 유전자를 갖는 벡터에 위치시키고, 이를 설치류 세포주에 도입하였을 때, 단백질 생산을 실질적으로 증가시킬 MAR 서열인 "수퍼 MAR 서열"이 되도록 맞춰진다.
생쥐 MAR S4 및 생쥐 MAR S46는 설치류 MAR 서열의 예시이며, 본 발명의 범위 내에 있다. 이들 MAR 서열은 SEQ ID No. 3 및 SEQ ID No. 10에 나열된 첨부 서열에서 확인된다. 그러나, 당업계의 기술자라면, 염기쌍 삽입, 삭제, 치환, 특히 이들의 단편 및 염기쌍 삽입, 삭제 또는 치환을 포함하는 다른 인간을 제외한 MARs은 야생형 서열의 바람직할 만한 기능을 유지시키는 한, 특히, 삽입, 삭제, 치환에 의해 유전자의 발현이 증가되는 한, 본 발명의 범위 내에 있다는 것을 알 수 있다. 예를 들어, MAR 서열의 전사/ 유전자 발현증가 활성이 감소되는 삽입은, 그것을 버리는 수 외에는, MAR의 바람직한 기능-여기에서는 유전자 발현 향상-에 대하여 실질적으로 간섭하지 않는 것으로 생각된다. 유사하게, 예시로서 동정된 MAR의 단편은 만약 동정된 MAR에 대하여 다소 감소된 전사 향상 활성을 가지지만, 전사 향상 활성이 완전이 소실되지 않는다면, 여전히 기능적인 단편으로 생각된다. "완전히 기능적인 단편"은, 만약 관찰되지 않는다면, 활성상의 감소가 통계학적으로 증명될 수 없는 단편이다. 그 밖에 여기에서 설명된 것으로, 자연적으로 발생하는 MAR의 뉴클레오타이드 서열 또는 그의 단편을 가지는 서열 또한 본 발명의 범위 내에 포함된다.
MARs의 모듈성
동정된 MARs을 분석하여 어디에 포함된 모듈(또는 영역)인지, 특히, 동정된 MARs을 공학에 이용될 수 있거나 또는 합성영역을 함유하는 MARs를 포함하여, 합성 MARs 생산에 이용될 수 있는 서열-특이적인 모듈인지를 결정하였다. 사실상, 동정된 MARs의 몇몇 서열-특이적인 모듈은 확인될 수 있다. 놀랍게도, 섞임 및/또는 전체 또는 부분적인 중복 및 심지어 일부 모듈의 또는 그의 부분적인 삭제 가 상기 기술한 바와 같이 향상된 MARs에 기인하여 발견되었다.
인간 1_68 MAR 및 생쥐의 S4 MAR는 영역의 섞임, 삭제 및/또는 중복에 의해 MAR 구조를 만들기 위한 모델로서 제공될 것이다. 그러나, 당업계의 숙련된 기술자라면 쉽게 이해할 수 있듯이, 본 발명은 어떤 동정된 MAR의 조절 및 거기서 기인된 MAR 구조에 의해 지배된다. 다른 기원의 MARs를 포함하는, 다른 MARs를 수용하기 위하여 필수적일 수 있는 적당한 조정은, 당업자의 기술의 범위 내에 있다. 실시예들은 진핵 생물체, 바람직하게는 포유동물, 특히 생쥐와 같은 모델 생물체, 및 소, 돼지, 양을 비롯한 인간과 같은 경제적으로 중요한 종을 포함하나, 이에 한정되지 않는다.
인간 MARs의 모듈성
인간1_68 MAR은 영역의 섞임 및/또는 중복의 방법으로 MAR 구조를 만들기 위한 모델로 제시되었다. 아래에 기술된 바와 같이 확인된 모듈 또는 그의 일부를 이용하여, 인간 1_68 MAR와 같은 동정된 MARs에 기초하여 MAR 구조를 만들었다. MAR 구조는 특히 영역(모듈) 또는 그의 일부의 섞임 및/또는 중복에 의해 만들어졌다.
1_68 MAR 예시는 동정된 MAR의 모듈(또는 여기에서 영역 또는 요소라 언급됨)은 자연적으로 발생하는 MAR의 능력에 대한 유전자 발현을 향상하도록 하기 위하여 전적으로 요구되었다. 동정된 모듈 중 어떤 것도 그 자체로서 MAR의 전체 활성을 성취할 수 없었다. 놀랍게도, 어떤 모듈의 섞임 및 전체적인 또는 부분적인 중복은 유전자 발현의 추가적인 향상에 기인하는 것으로 밝혀졌다.
몇몇의 비여재성(non-redundant) 서열 특이적인 모듈(영역)이 동정되었다. 이들 모듈은 협동하여 로컬 염색질 구조에 영향을 미친다. 이 MAR의 기관화는 후생동물 전사의 조절과 다소 유사하다: 개시 점에서 수 킬로 염기까지 떨어진 다양한 모듈의 수집은 전사가 시작될 지점을 공동적으로 지시한다.
동정된 서열-특이적인 모듈은 특히, 대칭적인 A-T 풍부 영역(A 와 T가 번갈아)과 같이, A와 T 함량이 풍부한 (1) 영역 및 특히, A-T 풍부 영역으로 분리된 TFBSs인, 결합자리가 풍부한 (2) 영역이지만, 이에 한정되지 않는다.
A 와 T 함량이 높은 굽은 DNA은 주로 프로모터 영역, MARs 및 복제자(replicators)에서 발견되었다[Aladjem and Fanning 2004]). 이전에, A 와 T 함량이 높은 서열(상기 기술된 바와 같이 "대칭적인" 것과 "비대칭적인" 것으로, 한 나선에는 주로 A이고 다른 한 서열에는 주로 T인 서열)은 이중 열림을 우선적으로 용이하게 하기 위한 것으로 생각되었다. 그러나, 이들 영역은 넓은 기능 범위를 가질 수 있다. 예를 들어, 라민 B2 복제자에서 A와 T 함량이 높은 서열은 기원-인식 복합체(origin-recognition complex (ORC))와 결합하고[Abdurashidova, Danailov et al. 2003; Stefanovic, Stanojcic et al. 2003] 및 인 비트로에서 Mcm4/6/7 헬리케이스의 로딩(loading) 및 이중 DNA의 풀림을 용이하게 할수 있다 [You, Ishimi et al. 2003]. A와 T 함량이 높은, 본질적으로 굽은 DNAs에 대한 건축학적인 역할도 고려되었다. 높은 이동성 군 단백질 HMG-I/Y의 이들을 닮은, 분열 효모 ORC4의 "AT-후크 DNA-결합 모티프"는 이러한 건축학적인 역할을 가질 수 있다[Strick and Laemmli 1995; Bell 2002]. V(D)J 재조합을 용이하게 하는 HMG-I/Y-관련 DNA 굴곡(bending)에 유사한, 단백질 관련 굴곡 및 진핵생물에서 인핸서(enhancers)와 프로모터의 전사 복합체의 조립과 안정화가 또한 발생될 수 있다[Levine and Tjian 2003]. 높은 A와 T를 갖는 어떤 영역도 굴곡 DNA에 대응되지 않는다. 그러나, 이들의 DNAs는, 복제 전/전사 단백질을 위한 랜딩(landing) 패드로서 작용하는 자유 인접 영역을 제외한, 굴곡 DNA 상의 뉴클레오좀을 형성하기 위해 히스톤을 끌어당기는 '히스톤 자석(histone magnet)'으로 활동할 수 있는 굴곡이다.
상기에서 기술한 바와 같이, MARs은 또한 다른 단백질의 결합자리, 특히, "결합자리가 풍부한 영역" 또는 단지 "결합자리 영역" 만을 포함한다(상기 (2) 참조). 이들 다른 단백질은 DNA 풀림 요소-결합자리 단백질(DUE-B) 및 1_68 MAR에서 발견되는 Hox 단백질, SATBI, CEBP 등과 같은 전사인자를 포함하나, 이에 한정되지 않는다. 돌연변이 분석은 이들 결합자리가 MAR 구조에 공헌함을 나타낸다.
인간 1_68 MAR은 이것의 방향성(orientation)의 역위 및 프로모터 영역의 상위의 전사인자의 결합자리 영역의 크기를 증가시키기 위해 굴곡 DNA에서 떨어진 이동에 의해 향상될 수 있다. 도 9에서 알 수 있는 바와 같이, 이들 재배열된 다수의 MARs (예를 들어, 구조 6)는 MAR이 없는 구조에 대한 전사(10 배) 및 심지어 자연적으로 발생하는 MAR를 포함하는 구조에 대한 전사 MAR (구조 1 및 16; 약 2 배)을 상당히 증가시킨다. 또한 보여지는 데이터는, 말단의 전사 조절 요소가 염색질 하위방향의 전사 개시를 스스로 제한함을 강하게 시사한다. 자연적으로 발생하는 MAR에서 앞쪽으로 해치된 박스에서 보여지는 이 영역의 3' 말단에 위치된 223 bp 단편은, 구조 11에 비해 구조 7에서 이 영역의 모든 활성을 유지한다. 이 경우에서, 이는 중요한 부분이 굽은 영역과 구조 6 요소의 나머지(뉴클레오타이드1-1425) 5' 말단과 함께 작동해야 한다는 것을 주장한다. 두 HMG-I/Y 자리가 이 말단 근처에 위치하고 있는 것이 밝혀졌다. 구조 2는 동정된 2개의 MAR 서열이 함께 발현을 증가시킨다는 것을 보여준다.
생쥐 MARs의 모듈성 및 크기 감소
몇몇의 MARs은 S4 MAR (표 3)을 기초로 구성되고 특징화(도 10) 되었다. 도 10에서 알 수 있는 바와 같이, 1600 bps 길이 이상의 단편에서의 내부 삭제는 MAR 활성에서 상당한 손실을 이끌어 내지 않았다 (S4-1-703_2328-5457). 그러나, 프로모터에 가장 인접한 795-bp 단편, 또는 유사한 길이(S4_1-4661; S4_1-4661-Luc5489)의 루시페라아제 유전자 단편에 의해 이 서열의 교체는 이 활성을 완전히 손실시켰다.
서열 특이적인 것을 제외한 모듈: Activity of the MAR 서열의 3' 말단의 활성
인간 1_68 MAR (도 9)을 이용한 실험은 이미 인간 1-68 MAR의 3' HoxF 및 SATBI의 결합자리의 중요성을 보여주었다. 이 영역의 중요성은 도 10에서 보여지는 생쥐 MAR을 이용한 실험에 의해 더 명백해졌다. 도 11에서 알 수 있듯이, MAR S4 서열의 3' 말단의 활성을 더 분석하기 위해, MAR의 이 부분을 일부의 제거 또는 중복하여 더 세분화 하였다. 도 11은 또한, 다양한 MAR S4의 효과가 유전자 발현에서 유도됨을 보여주었다. 흥미롭게도, 뭉뚝한(truncated) 3' 말단 (오리지날 MAR S4의 4658-5054 vs. 4658-5457)을 갖는, 이러한 유도체 중 하나는, 평균적으로, 오리지날 MAR S4 서열과 비교하여 조금 높은 유전자변형 발현을 나타내었다 (104% vs 100%). 이것은 높은 잠재뿐만 아니라 MAR 요소의 짧은 유도체가 얻어질 수 있다는 나타낸다.
따라서, 본 발명은 그들의 자연적인 상대 서열 (counterparts) 보다 길이가 상당히 짧고, 따라서 예를 들어, 벡터 고안과 이동에 그들을 더 편리한 크기로 만들어진, 높은 활성의 MAR 구조를 포함한다.
특히, 동정된 MAR 서열에 대하여, 약 90% 미만, 바람직하게는 적어도 약 80% 미만, 심지어 더욱 바람직하게는 약 70% 미만, 약 60% 미만 또는 약 50% 미만의 뉴클레오타이드 수를 포함하는 MAR 구조는 본 발명의 범위 내에 있다. 이들 구조는 바람직하게는 동정된 MAR의 3' 말단 영역을 포함하며, 더욱 바람직하게는 동정된 MAR의 3' 말단 영역의 적어도 약 5%, 약 6%, 약 7%, 약 8%, 약 9% 또는 약 10%를 포함한다. 그러나 동정된 MAR의 5' 말단을 포함하는 MAR 구조도 본 발명의 범위 내에 있다.
합성 MARs
재배열된 인간 1_68 MAR는, Hox-풍부 영역의 223bp 단편은 일부 실시예에서, 전체 길이의 활성을 유지하는 분리된 MAR의 해치된 일부 앞쪽의 3'에 위치함을 보여주었다. 이것은, 발명의 일부 실시예에서, 이 부분이 다른 요소와 같이 작용하여 중요화될 수 있음을 제시한다. 도 12 는 소프트웨어에 의해 예견되는 바와 같이,MAR 1_68의 잠재적인 전사 인자 결합 자리 배열을 보여준다. C/EBP, NMP4, FAST1, SATB1, 및 HoxF 결합자리 위치는, 실시예에서 5' ( 해치된 앞쪽에) 측면 서열에 그들이 풍부하게 있는 것을 설명하여 보여주었다.
AT-풍부 굽은 DNA 영역과 인간 MAR 1_68 의 전사 인자 결합 자리 간의 있음직한 협력의 발견은, 하나 또는 몇 명의 전사 인자 결합 자리에 인접한 MAR 1-68의 AT-풍부 영역을 포함하는 MARs/MAR 구조들 의 구성을 자극하였다. 도 13은 녹색 형광 단백질(GFP)에 대한 프로모터의 상위에 위치한 전사인자에 대하여, AT-풍부 영역의 각각의 말단과 화학적으로 합성된 DNA 결합 자리에서, AT-풍부 영역뿐만 아니라 동정된 MAR의 TFBS을 포함하는 중심(MAR 1429-2880)의 조립으로 구성된, 합성 MARs 합성용으로 테스트에 사용된 플라스미드 지도를 묘사한다. 도 13 특히, 결합자리를 포함하는 MAR 부분이 가장 유리한 세팅(구조 6)에서 프로모터와 굽은 DNA 영역 사이에 삽입되어 있는, 도 9에서 발견된 상황을 모방하는, AT-풍부 도메인과 GFP 변형유전자의 발현을 유도하는 SV40 프로모터 사이에 삽입되어 있는 전사 인자 결합 자리를 보여준다. 표 4는 사용된, 화학적으로 합성된 올리고뉴클레오타이드의 DNA 서열을 보여준다.
C/EBP, NMP4, FAST1, SATB1, 및 HoxF (Gsh라고 불리기도 함) 전사 인자에 대한 결합자리는 MAR 1-68 서열(도 12)에서 동정되었다. MAR 1-68에서 발생된 이들 결합자리는, 변화 없이 사용되거나(FAST1, C/EBP, HOXF/Gsh), 또는 일치(즉, 완벽한) 서열(HoxF, SatB1, NMP4)에 비해 하나 또는 둘의 불일치성(mismatches)를 가지는 경우에 정정되었다.
도 14 에서 알 수 있듯이, 여기에서 합성 결합 자리의 추가는, 일부 경우에서, AT-풍부 영역을 포함하는 중심 MAR에 비해 거의 모든 경우의 일부 중요한 전사 향상을 제공하였다. 하나의 NMP4 자리가 검색 가능한 효과가 없는 것에 비해, SatB1 및 Fast1에 뒤이은 C/EBP 및 Hox 또는 Gsh2는, 가장 활성적이었다.
도 14는 AT-풍부 영역을 기초로 하는 동정된 MAR의 결합자리에 의해 프랭크된 MAR 1_68에 기초한 MAR 1429-2880인, 중심 서열의 삽입, 그러나 특히 하나 또는 그 이상의 결합자리를 더 포함하는 MAR 구조의 AT-풍부 중심의 하위에 삽입될 때, 발현에서 상당한 향상을 가져오지 못하나, 프로모터의 상위에 삽입되면 프로모터(M3 세포의 백분율(%)에 의해 동정됨)의 조절하의 유전자에 의해 단백질 발현/생산에서 상당한 향상을 가져오는 놀라운 결과를 보여준다.
바람직한 예시에서, 추가적인 결합자리가 AT-풍부 중심의 하위에 있으나, 프로모터의 상위에 있는 반면, AT-풍부 영역 내에 유전자의 중심이나 하위의 AT-풍부 영역에 인접하여 AT-풍부 영역의 상위에 존재하는 다른 상대적인 배치 또한 본 발명의 범위 내에 있으나, 이에 한정되지 않는다.
바람직한 예시에서, 합성이나 분리의 단백질 결합자리의 어떤 조합은, 두 개의 다른 단백질 결합 자리의 조합과 같이, 3개의 단백질 결합 자리의 조합, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 단백질 결합자리의 조합을 생각해 볼 수 있다. 이들 조합은 전체적으로 또는 부분적으로, 다중화될 수 있다. 바람직한 일 실시예에서, 조합은 Hox/Gsh 및 SATB1을 포함한다. 예를 들어, 중심과 적당한 프로모터간의 이들 조합의 삽입 또는 다중화된 조합은, MAR 구조/MAR 서열을 포함하지 않는 벡터가 반대의 등가의 조건 하에서 사용되었을 때의 높은 발현 클론의 발생에 대하여, 약 3배, 4배, 5배, 6배, 7배, 8배, 9배, 또는 그 이상, 바람직하게는 약 10배 또는 그 이상, 심지어 더욱 바람직하게는 약 11, 12, 13, 14, 15, 16, 17, 18, 19 배 또는 그 이상, 또는 약 20 또는 심지어 약 25 또는 약 30 배 또는 그 이상과 같이, 약 두 배 또는 그 이상의 높은 발현 클론의 발생을 증가시킬 수 있다.
요컨대, MAR 구조는 빌딩 블록(building blocks)으로 재조합 될 수 있다. 이들 빌딩 블록은 서열 특이적인 영역과 같이, 동정된 MARs 또는 그의 부분의 영역, 화학적으로 합성된 전사 인자 결합 자리(TFBS)와 같이 합성된 빌딩 블록(그들의 기능성을 최적화하기 위한 변형을 포함)의 빌딩 블록이나 비-MAR 서열에 기초한 빌딩 블록, 또는 다른 종 또는 다른 속의 MAR 서열에 기초한 빌딩 블록을 포함하거나 또는 기초할 수 있다. 바람직한 실시예에서, 이러한 MARs은, 표 5에서 보여지는 TFBS 영역 또는 특이적인 전사인자 DNA-결합 자리 조합과 짝지어진 AT-풍부 영역을 포함한다.
당업계의 숙련된 사람은 이들 이론들이 여기에서 개시된 특이적인 서열이나 결합 자리에 한정되지 않으며, 다른 유도체, 유사체 또는 서열의 조합 또한 본 발명의 범위 내에 있다는 것을 알 것이다.
상기에서 언급하고 있듯이, 본 발명의 발현 시스템 및/또는 키트인MAR 구조는, 단백질 생산을 위해 생산될 수 있다. 여기의 MAR 구조는 흥미있는 단백질(예를 들어, 인슐린)에 대한 유전자를 프로모터의 조절 하에 함유하는 벡터를 포함할 수 있다. 벡터는 세포 내로 도입된 후 세포를 키웠다. 그런 다음, 이 과정은 대규모의 인슐린의 생산 배치로 규모를 키운다. 예를 들어, MAR 구조가 없는 경우 보다3 내지 5배 높은 인슐린 생산이 3주 이상 유지 될 수 있다.
상기에서 언급하고 있듯이, 본 발명의 발현 시스템 및/또는 키트인 MAR 구조는, 인 비트로 및/또는 인 비보 유전자 치료 및 세포와 조직의 재형성 치료에 사용될 수 있다. 예를 들어, 인 비트로 유전자 치료에서, MAR 구조는 프로모터의 조절 하에서 인 비트로 유전자 치료가 필요한 환자의 결함이 있는 유전자를 함유하는 벡터에 포함될 수 있다. 그 다음으로, MAR 구조는 환자의 골수 세포와 같은 세포에 도입된다. MAR을 이용한 형질전환 후에, 골수 세포는 환자에 도입되고 흥미있는 유전자의 발현이 MAR 구조가 없는 경우에 비해 5배 수준으로 증가될 것이다. 따라서, 단백질의 효과적인 양이 발현 될 수 있다.
인 비보 유전자 치료에서, MAR 구조를 포함하는 벡터를, 이를 필요로 하는 환자의 세포에 직접적으로 도입(예를 들어 주입(injection))할 수 있다.
유사하게, 본 발명의 발현 시스템을 조직 재생을 위한 인그래프트용 줄기 세포, 예를 들어, 신경퇴행성 질환용 신경 세포 치료용 줄기세포 내로 도입할 수 있다. 본 발명의 실시예로 사용될 수 있는 줄기 세포는, 골수 조직 또는 갓 태어난 개체의 재대혈로부터 얻은 조혈모 세포(hematopoietic stem cells (HSCs)) 및 간엽 줄기 세포(mesenchymal stem cells (MSCs)) 가 있으나, 이에 한정되지 않는다. 줄기 세포는 본 발명에 따르는 발현 시스템으로 형질 감염시켰으며, 성공적인 형질 전환체는 유전자 치료 또는 조직 재생 치료가 필요한 환자에게 이식하거나 다시 도입하였다. 몇몇 방법은 예를 들어, 형질전환 줄기세포를 얻기 위해 뉴클레오펙션 Nucleofection® (Cell Line Solution V (VCA-1003), amaxa GmbH, Germany)을 활용하였다.
인간 항원에 결합하는 항체를 포함하는 폭넓게 다양한 단백질을 생산할 수 있는 유전자변형 동물을 잘 알려진 방법으로 생산하였다(e.g., but not limited to, U.S. Pat. Nos. 5,770,428, 5,569,825, 5,545,806, 5,625,126, 5,625,825, 5,633,425, 5,661,016 and 5,789,650 issued to Lonberg et al.). 발현 시스템과 MAR 구조를, 예를 들어 유전자 변형 소, 양, 염소 또는 돼지로부터 일반적으로 생물학적인 유체(예를 들어 우유)내로의 단백질 분비를 통하여 단백질 생산에 사용할 수 있다(See, e.g., U.S. Pat. No. 5,750,172 to Meade et al). 유전자 변형 동물의 생산에 대해서는 예시로서, 미합중국 특허 제 6,518,482호를 참조하라( U.S. Patent 6,518,482 to Lubon et al).
도 1은 다양한 MARs의 효과를 재조합 녹색 형광 단백질(GFP)의 생산으로 나타낸 것이다.
도 2는 CHO세포에서 재조합 녹색 형광 단백질(GFP)의 매우 높은 생산자의 백분율(% M3)상에서 다양한 인간 및 생쥐 MAR 요소에 대한 효과를 나타낸 것이다.
도 3은 인간 1_68 및 생쥐 S4 MAR 요소의 효과를 재조합 녹색 형광성 단백질(GFP)의 발현으로 나타낸 것이다.
도 4는 생쥐 MAR 요소의 효과를 재조합 단일클론의 항체 생산으로 나타낸 것이다.
도 5는 MAR이 없거나(no MAR), 또는 시스(cis) 상에 추가된 MAR S4를 가진 IgG 중쇄(heavy chains) 및 경쇄(light chains)의 발현을 조절하는 벡터(vectors)로 형질 감염시킨 CHO 세포군으로부터 안정한 다중클론군을 생산할 수 있다는 것을 나타낸 것이다.
도 6 (A) (B)는 MAR이 없거나(no MAR)(B), 또는 시스(cis) 상에 추가된 MAR S4 및 MAR 1_68 를 가진 IgG 중쇄 및 경쇄의 발현을 조절하는 벡터로 형질감염시킨 CHO 세포군을 제한 희석시켜 안정한 개체의 클론을 생산할 수 있다는 것을 나타낸 것이다.
도 7 (A)(B)는 장시간 동안(2 주 및 26 주) MAR이 없거나(no MAR)(A), 및 MAR을 가진(B) 유전자(GFP)의 발현을 나타낸 것이다.
도 8 (A) (B) 인간 1_68 MAR의 굴곡(bending) 특징(A) 및 서열 특징(B) 을 묘사한 것이다.
도 9 (A) 내지 (C)에서: (A)는 동정된 영역의 섞음(shuffling)으로 획득된 다른 MAR 구조(construct) 및 성취된 전사 증대율을 나타낸 것이고 (B)는 MAR 구조 6의 굴곡 패턴을 나타낸 것이고 (C)는 MAR 구조 6의 결합자리와 같은 세부 구조적 파라메터(parameters)를 제공하는 것이다.
도 10은 전체 개체군에 대한 평균 형광성(기하평균값 M0)을 분석하여 재조합 녹색 형광 단백질(GFP)의 발현에서의 다양한 MAR S4 구조의 효과를 나타낸 것이다.
도 11은 전체 개체군에 대한 평균 형광성(기하평균값 M0)을 분석에 의하여 재조합 녹색 형광 단백질(GFP)의 발현 시에 유래된 다양한 MAR S4 구조를 나타낸 것이다.
도 12는 MATInspector 소프트웨어로 예측되는, 인간 1_68 MAR 의 잠재 전사 인자 결합 자리의 지도(map)을 나타낸 것이다.
도 13 AT-풍부 중심(core) (MAR 1429-2880)과 프로모터의 상위(upstream) 에 위치하는 화학적으로 합성된 DNA 결합 자리 및 녹색 형광 단백질(GFP)의 조립으로 구성된 합성 MARs 활성을 시험하는데 이용된 플라스미드 맵이다.
도 14는 도 13에 묘사된 합성MARs 구조의 전사 향상율을 도시한 것이다.
도 15는 표 5에 세부화된 DNA-결합자리를 포함하는 합성 MARs의 전사 향상율을 도시한 것이다.
본 발명은 하기의 예시로서 구체적으로 설명될 것이나, 본 발명의 특허청구범위, 요약 또는 그 밖의 부분으로 하여 본 발명의 범위를 한정하지 않는다. 재료, 방법 및 실시예들은 다만 묘사할 뿐이지 이것으로 한정되지 않는다. 여기에서 제공된 가이드라인으로, 당업계의 숙련된 사람은 본 발명의 범위 내에 있는 모두를 변형, 추가 및 향상시킬 수 있다.
생쥐 게놈의 S/MARs 예후: SMAR Scan I
NCBA m34에 대응하는 모든 생쥐 염색체는 SMAR Scan I 으로 수집하고 분석하였다. 낮은 및 높은 스트렌시(stringency) 검색을 각각, DNA 굴곡 기준 3.6 정도의 역치 및 최소 윈도우 크기 300 bp, 또는 4.2 정도의 역치 및 최소 윈도우 크기 100 bp 중의 어느 하나를 이용하여 수행하였다.
전체 생쥐 게놈의 SMAR Scan I 을 통한 낮은 스트렌시 분석은, 총 622,410 bp (전체 생쥐 게놈의 0.024%)을 나타내는, 1496 추정 S/MARs (후보 MARs)을 산출하였다. 표 1은 각각의 염색체를 나타낸다: 염색체의 크기, 염색체의 유전자의 수, 염색체의 예측 MARs(후보 MARs)의 수, 염색체의 유전자 당 MARs 밀도 및 S/MARs간의 평균거리(kb). 이 표는, (MARs 당 유전자의 밀도 실측값의 약 50%를 나타내는 표준편차를 가진) 다른 염색체 상의 예측 S/MAR (후보 MAR) 당 다양한 유전자 밀도가 있음을 나타낸다. MAR당 유전자의 더 높은 밀도와 더 낮은 밀도간의 차이점은, Y 염색체와는 상관없이 6이며, 이는 이들 MARs의 분배에서 강하고 기대되지 않은 편견을 나타내는, 염색체의 크기와 염색체의 유전자의 수와 관련되는 예 측 MAR (후보 MARs)에서 극히 풍부하다. 표 1은 또한, S/MARs (S/MAR당 kb)간의 평균거리가 다양하다(표준편차는 S/MAR당 kb의 실측값의 38%를 나타내며, S/MAR당 kb의 높은 밀도와 낮은 밀도간의 차이점은 8.3배임)는 것을 보여준다. 염색체 10, 11, X 및 Y 는 이들 밀도의 높은 표준편차에 대하여 유의하게 공헌한다.
SMAR Scan I은 원래 인간 서열용으로 맞춰져 왔으며, 따라서 가장 엄격한 파라메터를 사용하였을 때 생쥐 게놈의 서열을 가진 소수의 MARs를 산출한다: 그러므로, 디폴트 컷 오프 값을 300bp 대신에 윈도우 100 bp를 사용하여, MAR로 생각되는 연속적인 히트의 최소 크기에 대하여, 높은 스트렌시 검색(DNA 굴곡 기준에 대하여 4.2 정도의 역치)으로 맞추었다. SMAR Scan I에 의한 생쥐 게놈의 분석은 DNA 굴곡 기준 >4.2 정도의 값을 가진 49 "수퍼" MARs를 예측하였다.
Figure 112009005732189-PCT00001
재조합 단백질의 생산을 증가시키기 위한 새롭게 동정된 생쥐 MARs의 용도
5개의 MAR 요소들을 SMAR Scan을 이용하여 완전한 생쥐의 게놈을 높은 스트렌시 검색으로 획득한 가상의 MARs (후보 MARs)로부터 선별하였다. 그들을 오클랜드 연구기관의 어린이 병동(Children's Hospital Oakland Research Institute (CHORI, http://bacpac.chori.org/))으로부터 획득한 생쥐 게놈 DNA 박테리아 인공 염색체의 플라스미드 벡터에 클론하였다.
이들 새롭게 동정된 생쥐 MARs는 S4, S8, S15, S32 및 S46 (SMAR Scan I에 의한 동정 지시에 따르는, "수퍼" MARs S1 내지 S49)으로 명명하였다. 인간 MARs 1_3, 1_6, 1_9, 1_42, 1_68, 3_S5 및 X_S29는 이미 동정되었으며, MARs 1_68 및 X_S29가 가장 잠재적인 인간 요소이다(Mermod et al.. "High efficiency gene transfer and expression in mammalian cells by a multiple transfection procedure of MAR sequences," WO2005/040377, see also U.S. Patent Publication 20070178469 to Mermod et al). 이들 MARs을 조절 벡터 pGEGFP의, 녹색 형광 단백질의 발현을 조절하는 SV40 프로모터 및 인핸서의 상위에 삽입하였으며, 이들 플라스미드는 이미 설명한 바와 같이, 배양된 CHO 세포에 형질 감염시켰다[Girod PA, Zahn-Zabel M and Mermod N]. 그런 다음, 변형유전자의 발현을 형광 세포 계수기(fluorescent cell sorter (FACS) ) 기계를 이용하여 안정하게 형질 감염된 세포의 전체 개체수에서 분석하였다. 도 1은 재조합 녹색 형광단백질(GFP)의 생산에서 다양한 S/MAR의 효과를 나타낸다. CHO 세포 개체는, 형광 세포 계수기(FACS) 에 의해 나타나는 바와 같이, MARs를 포함하거나 또는 포함하지 않은 GFP 발현 벡터 pGEGFP으로 형질감염하였으며, 전형적인 프로파일을 보였다. 다만 가장 잠재적인 인간 MARs 1_68 및 X_S29는 이 도에서 보여진다. 프로파일은 GFP 형광 수준의 기능으로서 세포 수를 계수하여 나타낸다. 상대 빛 단위 2(M1)보다 작은 형광 값 또는 102 (M2) 또는 103 (M3) 보다 큰 값을 가진 세포 아개체군 M1, M2 및 M3을 가로막대로 표시하였다.
도 1에서 알 수 있듯이, 모든 MARs의 가장 잠재적인 "수퍼" 생쥐 MAR S4등의 새롭게 동정된 생쥐 MARs 모두는, MAR 없이 GFP 단독으로 조절되는 상기 발현에 비해 변형유전자의 발현을 의미있게 증가시켰다.
Figure 112009005732189-PCT00002
가장 잠재적인 인간 MARs 1_68 및 X_S29의 전사 활성은 새롭게 동정된 생쥐 MARs을 이용하여 얻은 것과 비교하였다. 5개의 생쥐 MARs는 GFP 발현 분석으로 초기에 테스트되었으며, 그들은 모두 다른 수준으로 GFP 발현을 증가시키는 것으로 발견되었다. 생쥐 MARs S15 및 S32 는 상대적으로 적은 전사 활성 MARs (GFP 단독에 비해 ~2 배 증가)이며, S8 및 S46는 중간 활성도(3-4 배 증가)를 보였으며, MAR S4는 매우 놓은 전사 활성 (7 배 증가)를 보였다. 게다가, 생쥐 MAR S4는 본 연구에서 테스트된 모든 MARs 중 가장 잠재적이다. 인간 MAR 1-68과 생쥐 MAR S4 전사 활성 간의 비교에서 전체 개체(Gmean M0) 의 및 높은 GFP-생산 세포(M2) 에 대한 실측 형광 값이 50% 증가한 반면, 매우 높은 GFP-생산 세포(M3) 에 대한 백분율은 생쥐 MAR S4에 대하여 175% 더 높았다. GFP 형광성 (CV M0)의 관점에서 전체 개체군의 동질성은 생쥐 MAR S4에 대하여 항상 1-2% 낮았으며, 이것이 세포 생산성에서 더 큰 안정성을 나타내는 것이기 때문에 더 이롭다.
클로닝의 첫 번째 라운드(round) 후에, 매우 활동적인 MAR 요소가 생쥐 게놈에서 일관적으로 얻어질 수 있는지 결정되어야 한다. 따라서, 두 개의 추가적인 생쥐 MARs (S6 및 S10)이 클론되고 특징되었다. 이들 새로운 생쥐 MARs을 pGEGFP 대조(control) 벡터에 삽입하고, 상기와 같이 FACS로 분석하였다. 생쥐 MAR S10은 FACS에 의해 분석된 다른 파라메터 모두에서 최상의 인간 MARs보다 더 잠재적인 것으로 나타났으며, MAR S4가 전체 발현을 증가시키기 때문에 전사적으로 활동적인 것에 가깝게 있다.
매우 높은 생산자를 평가하기 위하여, M3 세포의 백분율을 인간 MAR 1_68에서 얻은 것으로 표준화하였다. 그 결과는 도 2에 나타내었다. 도 2는 재조합 녹색 형광단백질(GFP)의 매우 높은 생산자의 백분율(% M3) 에서 다양한 인간과 생쥐 S/MAR 요소의 효과를 보여준다. 지시한 바와 같이 MAR 요소를 포함하거나 또는 포함하지 않는 GFP 발현 벡터로 형질감염시킨 CHO 세포의 개체군을 형광-활성화 세포 계수기(FACS)로 분석 하였다. 매우 높은 생산자의 백분율을 이 기준에 대하여 최상의 인간 MAR로 얻은 MAR 1_68 로 표준화하였으며, 이 값을 100으로 맞추었다.
생쥐 MARs S10과 S4는 각각 인간 MAR 1_68보다 평균 80% 및 180% 이 더 높은 생산자 세포를 가졌다. 결국, 7 개의 생쥐 MARs 과 7개의 인간 MARs를 비교하여, 설치류 MARs를 이용한 CHO 세포로 높은 발현을 성취할 수 있다고 결론지었다.
다른 세포 형태에서 새롭게 동정된 생쥐 MARs의 잠재 평가
S4 MAR의 잠재성은 CHO 세포에서 평가되었다. 게다가, 인간 MAR 1-68 또는 생쥐 MAR S4 를 포함하거나 또는 MAR를 포함하지 않는 EGFP 발현 벡터를 인간 HeLa 세포에 안정하게 형질감염시켰으며, EGFP 형광성을 분석하였다. 도 3은 다양한 인간 1_68 및 생쥐 S4 MAR 요소의 효과를 재조합 녹색 형광성 단백질((GFP)의 발현으로 보여준다.HeLa 세포의 개체군을 형질감염시키고, 표 2에 기재한 바와 같이 분석하였다. HeLa 세포에서 S4 및 1-68 MAR의 잠재성 비교 시, S4는 몇 가지 점에서 1_68 를 수행하는 것이 밝혀졌다: S4는 배지에서 높은 평균 GFP 형광성(평균 Gmean M0)뿐만 아니라, 많은 세포와 높은 발현범위(각각 M1 및 M2), 및 낮은 발현 다양성(평균 CV M0)를 산출하였다. 어떤 세포도 HeLa 세포를 이용하여 매우 높은 발현 범위(M3)에서 발견되지 않았다.
생쥐 MARs를 이용한 단일 클론 항체의 발현 향상
생쥐 MARs, 특히, 가장 잠재적인 MAR이 약학적 응용을 위한 단백질 생산을 증가시키기 위해 사용될 수 있는지를 결정하기 위하여, 레서스-D-인식 면역글루블린(Rhesus-D-recognizing immunoglobulin) 중쇄 및 경쇄를 인코딩하는 pMZ37 및 pMZ59 벡터에 삽입하였다 [Miescher S, Zahn-Zabal M, De Jesus, M, Moudry, R, Fisch, I, Vogel, M,Kobr, M, Imboden, MA, Kragten, E, Bichler, J, Mermod, N, Stadler, BC, Amstutz, H., Wurm, F]. 이 플라스미드들을, 이전에 설명한 것과 같이, CHO 세포에 형질감염시키고, 선별하고, 면역글로블린 검사를 수행하였다[Girod PA, Zahn-Zabal M and Mermod N]. 도 4는 재조합 모노 클론 항체의 생산에서 S/MAR 요소의 효과를 보여준다. 여기에서, CHO 세포를 MAR이 없거나(no MAR), 시스상에 MAR S4를 갖는 IgG 중쇄 및 경쇄 발현을 유도하는, 상기 언급된 벡터로 형질감염시켰다. IgG 타이터는 24, 48 및 72 시간 후에 상층액에서 측정하였다. 이에 추가하여, 도 5에서 묘사하는 바와 같이, MAR이 없거나(no MAR), 시스상에 MAR S4를 갖는 IgG 중쇄 및 경쇄 발현을 유도하는, 상기 언급된 벡터로 형질감염시킨 CHO 세포의 개체군에서 안정한 클론을 생산하였다. 선별 후에, 선별된 IgG 타이터를 배지에서 측정하고, 특이적인 생산성은 세포 계수로 검사하였다. 도 6 (A)은 MAR이 없거나(no MAR), 시스상에 MAR S4를 갖는 IgG 중쇄 및 경쇄 발현을 유도하는 벡터로 형질감염시킨 CHO 세포를 제한 희석하여 안정한 개체 클론을 생산한 다음에 얻은 결과를 보여준다. 선별 후에, 선별된 IgG 타이터를 배지에서 측정하고, 특이적인 생산성은 세포 계수로 검사하였다. 또한, MAR 1_68 로 얻은 비교 결과뿐만 아니라, MAR을 포함하지 않은 클론으로 얻은 결과(B)도 포함된다. 도 3 내지 6에서 획득 및 묘사한 결과들은, 새롭게 동정된 생쥐 MARs, 특히, MAR S4는, 일시적인 형질 감염체(도 4) 및 안정한 형질 감염체 (도 5 및 6)에서, 모노 클론 항체와 같은 약학적 단백질의 생산을 증산시키기 위해 생산될 수 있음을 나타낸다. 약 5 pg/cell/day (pcd) 또는 그 이상의 특이적인 생산성을 가진 안정한 클론은 MAR S4 (도 6(A))을 사용했을 때 몇몇 후보 클론의 분석으로 쉽게 동정될 수 있다. 실제로, MAR S4을 포함하거나 또는 포함하지 않은 21개의 최상의 클론의 평균 생산성은 각각 7.28 ± 0.78 pcd (도 6(A)) 와 2.61 ± 1.09 pcd 였다. 이 결과들은 잘 알려진 닭 라소자임 MAR (1.5 mg/L 미만)을 포함하거나 또는 MAR (0.5 mg/L 미만)을 포함하지 않고 얻어진 타이터 수준과 대조적으로 나타난다. 특히, 이 결과들은 새롭게 동정된 생쥐 MARs가 단일 클론 항체 와 같은 약학적 용도, MAR S4과 같은 생쥐 MARs의 표현형, 특히 재조합 단백질 생산에 흥미있는 단백질 생산을 증산시키기 위해 사용될 수 있다는 것을 나타낸다.
인간 MAR 1_68의 발현 안정성
MAR 1_68은, 클론에 의해 생산된, MARs를 포함하지 않는 유전자의 발현이 점차 침묵하며, MARs를 포함하는 등가의 클론은 높은 발현 수준을 유지할 뿐만 아니라, 침묵 세포도 발현을 회복한다는 것을 설명하기 위해 사용되었다.
도 7 은 CHO 세포에 MAR 1-68 을 포함하는 pEGFP 발현 플라스미드와 G418 항체 저항 유전자를 함께 형질감염시키고, Girod 등(2005)이 설명한 방법에 따라 3주 동안 G418이 존재하는 배지에서 선별한 안정하게 발현된 세포를 보여준다. 세포 클론을 제한 희석으로 얻은 후에, 9개의 클론 개체를 GFP 형광성으로 분석하였다. 더 구체적인 분석으로 두 개체 각각으로부터 GFP를 발현하는 전형적인 클론을 선별하였으며, 항생제 선별이 존재하거나 부재하는 조건에서 26주까지 더 배양하였다. 왼쪽의 프로파일은 2 주 후에 GFP 형광 수준 (x 축)과 y 축에 계수한 세포수를 나타내었고, 오른쪽의 파일은 26주 동안 배양한 세포를 나타내었다. 보이는 바와 같이, MAR 결핍 클론은 항생제가 없는 조건에서 26 주 후의 GFP 형광성 수준이 2주 후의 수준에 비해 감소하였으며, 반면 MAR를 포함하는 클론은 흥미있는 유전자의 안정한 발명을 위해 유용한 발현시스템을 포함하는 MAR을 만드는, 항생제 선별이 있든 없든 간에, GFP 형광성이 유지될 수 있었다.
MARs 의 모듈성 및 유전자 발현 향상에 대한 관련성
MARs의 구조적 분석은 향상된 유전자 발현에 각각 공헌하는 DNA 서열 영역/ 모듈을 나타낸다. 도 8은 1_68 MAR의 구조적 분석을 통하여 획득된 결과를 도시한다. 도 8(A)은 중심의 AT-풍부 영역이 MAR 1_68 좌위에서 굽은 DNA를 나타냄을 보여준다. 도 8(B)는 이 AT-풍부 영역이 MatInspector (Cartharius, Frech et al. 2005)에 의해 동정된 것과 같은 전사인자 결합 자리의 풍부한 영역으로 둘러싸여 있다는 것을 보여준다. 정확히, 729개의 잠재적인 TFBS가 MAR 서열과 함께 MatInspector에 의해 검출되었다. 도 8(B)의 아래 부분은 동정된 영역에 대한 부호화(coding)를 나타낸다.
도 9 (A)는 1_68 MAR 및 왼쪽에, 1_68 MAR의 영역 또는 일부분이 연결되어있고, 그의 영역 또는 일부의 순서 및/또는 방향성이 변화되고, 및/또는 그의 영역 또는 일부분이 중복된, 다른 MAR을 보여준다. 오른쪽에, 구조 1 내지 16에 의해 얻어진 전사 증대화 정도 를 비롯하여 MAR 1_68 를 포함하거나 MAR를 포함하지 않고 수행된 전사 증대도 보여준다. 모든 MAR 서열은 eGFP 유전자 마커(marker)를 조절하는 프로모터의 상위에 삽입되었다. 화살표는 도 8에 도시된 야생형 MAR 서열과 비교하여 그의 영역 또는 단편의 방향성을 도시한다. AT- 풍부 영역 주변의 서열들은 화살표로 해치된 박스 뒤쪽(왼쪽에)과 화살표로 해치된 박스 앞쪽(비례적이지 않음 오른쪽)에 표기하였다. 굽은 영역은 교차-해치된 박스로 표시된다. 도 9 (B) 는 도 9A의 구조 6에 대한 MAR 굴곡 패턴을 보여준다. 이 굴곡 패턴은 SMAR Scan I으로 결정되었다.
도 9 (C) 는 [Cartharius, Frech et al. 2005] 분석의 결과를 보여준다. 잠재적인 전사 인자 결합 자리 (TFBSs)는 MatInspector [Cartharius, Frech et al. 2005]로 결정되었다. 731의 잠재적인 자리가 MAR 서열과 함께 MatInspector에 의해 검출되었다. 도 9(C)의 바닥쪽에, 도 8(B) 및 도 9(A)에 상응하는 부호화를 사용하여 구조 6을 나타내었다. 이것에 대한 이 도의 바닥 부분에 부호화는 도 9(A)에 나타내고, 논의되었다.
도 9에 도시된 실험은 어떤 영역도 홀로 MAR 전체 활성을 나타내지 않는 것을 보여준다. 예를 들어, 전체범위에 대하여, 자연적으로 발생하는 인간 1_68 MAR로부터 얻어진 DNA 전사 향상은, 세 개의 다른 서열을 필요로 한다(도 8): 다중 전사 인자 (즉, CEBP)의 결합 자리를 함유하는 1189 bp 부분(도 9A 위쪽, 화살표가 뒤쪽으로 해치된 박스로 보임), an 763 bp의 대칭적인 AT-풍부 영역(A와 T가 번갈아)으로 도시된 본질적으로 굽은 DNA (도 9A 위쪽, 교차-해치된 박스), 및 HoxF와 SATBI 결합 자리를 포함하는 추가적인 1648 bp 부분(도 9A 위쪽, 화살표가 앞쪽으로 해치된 박스로 보임).
도 9는 프로모터 영역의 상위에 전사 인자 결합 자리영역의 크기를 증대시키기 위해서 굽은 DNA를 멀리 이동시킨 인간 1_68 MAR의 증가를 보여준다. 이 증대화를 위해서, AT-풍부 (SEQ ID. No. 18) 영역에 인접한 전사 인자 결합자리(TFBS)영역-여기서는 Hox-풍부 영역(SEQ ID No. 19) (아래, 화살표가 앞쪽으로 해치된 영역)-은 CEBP-풍부 영역(SEQ ID No. 17) (아래, 뒤쪽으로 해치된 영역 (Fig.9))에 연결되어 있다. 도 9A의 오른 쪽에 도시된 바와 같이, MAR 구조가 다른 전사 활성 향상을 비교하면, 화살표의 앞쪽 방향성으로 해치된 영역은 전사 증대화에 중요하다는 것을 나타낸다(구조 5와 구조 6을 비교). 이 데이터는 또한 떨어진 전사 조절 요소 스스로 염색질 하위의 전사 개시를 제한한다는 것을 나타낸다. 화살표가 앞쪽으로 해치된 영역의 3' 말단에 위치한 223 bp 단편(SEQ ID No. 20)이 구조 7의 영역의 전체 활성을 유지한다고 가정한다면, 이 경우에서, 이 중요한 부분이 구조 6의 요소의 굽은 영역과 남은(뉴클레오타이드 1-1425)부분의 5'말단에 함께 작동되어야 한다. 두 개의 HMG-I/Y 자리는 이 말단 근처에 위치된 것으로 밝혀졌다.
생쥐 MARs의 모듈성 및 크기 감소
인간 1_68 MAR의 발견에 기초하여, S4 MAR를 모듈, 특히 이것의 전사 활성을 위한 활실성에 대해서도 분석하였다. 이 분석은 또한 상대적으로 긴 S4 MAR 크기를 감소시킬 목적으로 수행되었다. 따라서, 몇몇 MARs은 S4 MAR (표 3)으로 구성되고, 특성화되었다(도 10). 도 10에서, 특이적인 MAR S4 구조는 왼쪽에 나타내고, 오른쪽에는, 전체 개체군의 평균 형광성(Avg Gmean M0)의 분석으로 밝혀진 재조합 녹색 형광 단백질(GFP) 의 발현상의 다양한 MAR S4 구조의 효과를 나타내었다. 표시된 바와 같이 MAR 구조를 포함하거나, 포함하지 않은 GFP 발현 벡터로 형질감염시킨 CHO 세포의 개체군은, FACS calibur 계수기(Becton Dickinson)를 이용하여 유체 세포 계수하여 분석하였다. 전체 개체군의 평균 형광값은, MAR 없이 발현되어 GFP 값을 나타낸는 인간 MAR 1_68을 100으로 세팅하여, 이로부터 얻어진 값으로 표준화시켰다. 다른 MAR 구조는 S4 MAR 1547bp의 전체 길이와 비교하여 그들의 염기 함량에 따라 명명하였다(참조 표3). 점으로 표시된 박스는 MAR S4의 AT-풍부 굽은 영역을 나타낸다. S_41-4662-Luc5489는 말단(3') 795 염기쌍이 루시퍼라아제 유전자의 일부가 제거되고 교체된 구조(검은 박스)를 표시한다. 나타낸다. 흥미롭게, 도 10에서 보여지는 바와 같이, 1624-bp EcoRI 단편이, 그것의 MAR 활성의 심각한 손실없이, S4 MAR (S4-1-703_2328-5457)으로 부터 삭제될 수 있음을 보여준다. 그러나, 프로모터에 근접한 795-bp 단편, 또는 유사한 길이의 루시퍼라아제 유전자 단편(S4_1-4661; S4_1-4661-Luc5489),에 의한 이 서열의 교체는 MAR의 활성을 완전히 잃게 하였다. 이는 길이가 짧아진 생쥐 S4 MAR 의 어떤 변종이 높은 활성을 나타낼 수 있으며, 따라서, 더욱 편리한 크기, 예를 들어 벡터 디자인 및 전달을 위한 크기로 만들 수 있다.
Figure 112009005732189-PCT00003
3' 말단의 MAR 서열의 활성
MAR S4의 3' 말단의 활성을 더 분석하기 위하여, MAR의 이 일부분을 이동 또는 중복하여 더 세분화하였다. 도 11은 전체 개체군의 평균 형광성(Avg Gmean M0) 분석으로 나타난 바와 같이, 재조합 녹색 형광 단백질(GFP)이 발현상에서 다양한 MAR S4 유도체의 효과를 보여준다. 상기에서 설명한 바와 같이, CHO 세포의 개체군을 생산하고 검사하였다. 흥미롭게도, 뭉뚝한 3' 말단(4658-5054 vs. 오리지날 MAR S4의 4658-5457) 을 가지는 이러한 유도체의 하나는, 평균적으로 보다 긴 오리지날 MAR S4 서열과 비교하여 약간 높은 변형유전자 발현을 나타내었다(104% vs 100%). 이는 더 잠재적일 뿐만 아니라 더 짧은 MAR 요소의 유도체가 얻어질 수 있음을 나타낸다.
합성 MARs
도 12는 소프트웨어에 의해 예측된 바와 같이, [1_68 MAR의] 잠재적인 전사 인지 결합 자리의 지도를 보여준다. C/EBP, NMP4, FAST1, SATB1, 및 HoxF (Gsh로 불리기도 함) 결합 자리의 위치는, 해치된 프랭킹 서열의 5' 앞쪽에 풍부하게 도시된 예시로 나타내었다. 이 결합자리들은 변화 없이 사용된(FAST1, C/EBP, HOXF/Gsh) MAR 1-68에서 발생하거나, 또는 일치하는(즉, 완벽한) 서열과 비교하여 하나 또는 두 개의 미스매치를 가지는 (HoxF, SatB1, NMP4) 경우에 정정되었다.
AT-풍부 굽은 DNA 영역과 인간 MAR 1_68의 전사 인자 결합 자리 간의 가능한 합동 작용의 발견은, 하나 또는 몇 개의 전사 인자 결합 자리에 인접한 MAR 1-68의 AT-풍부한 부분을 포함하는 합성 MARs구성을 자극하였다. 도 13 은AT-풍부 영역 (MAR 1429-2880)과 프로모터와 녹색 형광 단백질(GFP)의 상위에 위치한 화학적으로 합성된DNA 결합 자리를 포함하는 중심의 조립으로부터 구성된 합성 MARs 의 활성을 위한 테스트로 사용된 플라스미드의 지도를 도시한다. 도 13 은 도 9에서 보여지는 상황을 모의하는, 전사인자 결합 자리가 AT-풍부 중심과 GFP 변형유전자의 발현을 조절하는SV40 프로모터 사이에 삽입되었음을 보여준다. 표 4는 사용된 화학적으로 합성된 올리고뉴클레오타이드의 DNA 서열을 보여준다.
Figure 112009005732189-PCT00004
도 14 는 도 13에 설명한 바와 같이 구성된, 합성 MARs 에 의한 전사 향상을 보여준다. 삽입된 요소는 표시된바 와 같이, 중심에 추가된 1 또는 몇몇의 단백질 DNA-결합 자리를 포함한다. AT-풍부 영역을 포함하는 중심 서열(AT-풍부 중심)에 추가하여, 하나 또는 수개의 결합 자리를 포함하는 플라스미드의 형질감염은, 결합 자리의 포함이 AT- 풍부 중심 단독과 비교하여 전사 향상을 증가시키고, 및 SatB1 와 Fast1 를 뒤따르는, C/EBP 및 Hox 또는 Gsh2가 가장 활성적인 반면, NMP4는 검출가능한 효과가 없다는 것을 나타내었다.
활성적인 결합 자리의 다른 혼합물 또한, 서너지 효과가 관찰되는지 결정하기 위하여 테스트되었다. 그렇게 하기 위해서, 다른 전사 인자에 대한 결합 자리를 포함하는 너무 다양한 올리고뉴클레오타이드를 DNA 결합(ligation) 반응에 혼합하였으며, 결합자리의 정확한 순서와 배열을 DNA 서열화(sequencing)로 결정하였다. 획득된 조합은 표 5에 나타내었다.
Figure 112009005732189-PCT00005
얻어진 플라스미드를 이전과 같이 형질감염방법으로 테스트하였다. 도 15 는 합성 MARs에 의한 전사 향상은 표 5에 표시한 DNA 결합 자리 조합으로 구성되었다. 가장 활성적인 조합은 별 모양으로 표시하였고, HoxF/Gsh2 또는 SatB1 자리의 발생도 표시하였다. 도 15에 나타난 결과는, 합성 MARs의 활성이 이 예시에서 삽입된 결합 자리의 수에 의존하지 않지만, 다른 활성이 부족하거나 심지어 유전자 발현 억제하는 반면, 결합자리의 독특한 조합은 높은 향상 활성을 보인다는 것을 나타낸다. 높은 활성을 가진 구조는 이 경우에 Hox/Gsh2 및SATB1 단백질의 조합을 포함하였다. 이 합성 MAR의 삽입은 MAR 서열이 결핍된 pEGFP 조절 벡터와 비교하여 높은 발현자(expressor) 클론의 발생을 약 10배로 증가시켰다.
<참고문헌>
Abdurashidova G, Danailov B, et al., "Localization of proteins bound to a replication origin of humanDNA along the cell cycle." EMBO J. 22: 42944303, 2003.
Aladjem, MI and Fanning E.,"The replicon revisited: an old model learns new tricks in metazoan chromosomes." EMBO Rep 5(7): 686-91, 2004.
Allen GC, Spiker S, Thompson WF, Use of matrix attachment regions (MARs) to minimize transgene silencing, Plant Mol Biol., 43(22000.
Amati B and Gasser SM, Chromosomal ARS and CEN elements bind speci?cally to the yeast nuclear scaffold, Cell, 54:967-1988.
Amati B and Gasser SM, Drosophilia scaffold-regions bind nuclear scaffolds and can function as ARS elements in both budding and ?ssion yeasts, Mol. Cell. Biol., 10:54421990.
Bell SP, "The origin recognition complex: from simple origins to complex functions." Genes Dev 16: 659672, 2002.
Bode J, Schlake T, RiosM, Mielke C, Stengart M, Kay V and Klehrth D, Scaffold/matrix-attached regions: structural properties creating transcriptionally active loci, Structural and Functional Organization of the Nuclear Matrix: International Review of Cytology, 162A:389-1995.
Bode J, Benham C, Knopp A and Mielke C, Transcriptional augmentation: modulation of gene expression by scaffold/matrix-attached regions (S/MAR elements), Crit Rev Eukaryot Gene Expr, 10(1):73-2000.
Bode J, StengertM, Kay V, Schlake T and Dietz-A, Scaffold/matrix-attached regions: topological switches with multiple regulatory functions, Crit. Rev. Euk. Gene Exp., 6:115-1996.
Bodnar JW, A domain model for eukaryotic DNA organization: a molecular basis for cell differentiation and chromosome evolution, J. Ther. Biol., Vol. 132:479-1988.
Boulikas T, Nature of DNA sequences at the attachment regions of genes to the nuclear matrix, J. Cell Biochem., 52:141993.
Boulikas T, Chromatin domains and prediction of MAR sequences. In Structural and Functional Organization of the Nuclear Matrix: International Review of Cytology, Academic Press, Orlando, 162A:279-388, 1995.
Breyene P, Van Montagu M and Gheyseu G, The role of scaffold attachment regions in the structural and functional organization of plant chromatin, Transgenic Res., Transgenic Res., 3:1951994.
Breyne P, Van Montagu M, Depicker A and Gheysen G, Characterization of a plant scaffold attachment region in a DNA fragment that normalizes transgene expression in tobacco, Plant Cell, 4:463-1992.
Cartharius, K., K. Frech, et al., MatInspector and beyond: promoter analysis based on transcription factor binding sites, Bioinformatics 21: 2933-42, 2005.
Gasser SM and Laemmli UK, Cohabitation of scaffold binding regions with upream/enhancer elements of three developmentally regulated genes of D. Melanogaster, Cell, 46:521-1986.
Girod PA, Zahn-Zabal M and Mermod N, Use of the chicken lysozyme 5' matrix attachment region to generate high producer CHO cell lines, Biotechnol. Bioeng., 91(1):1-11, 2005.
Kas E and Chaslin LA, Anchorage of the Chinese hamster dihydrofolate reductase gene to the nuclear scaffold occurs in an intragenic region, J. Mol. Biol., 198:6771987.
Kay V and Bode J, Detection of scaffold -attached regions (SARs) by in vitro techniques; activities of these elements in vivo. In Methods in Molecular and Cellular Biology: Methfor studying DNA protein interactions: an overview, WileyNew5:186-1995.
Kim JM, Kim JS, Park DH, Kang HS, Yoon J, Baek K and Yoon Y, Improved recombinant gene expression in CHO cells using matrix attachment regions, J. Biotechnol., 107(2):95-105, 2004.
Kwaks TH, Otte AP,Employing epigenetics to augment the expression of therapeutic proteins in mammalian cells. Trends Biotechnol. 24:13742, 2006.
Labrador, M. and V. G. Corces, Setting the boundaries of chromatin domains and nuclear organization, Cell 111: 151-54, 2002.
Levine, M. and R. Tjian, Transcriptional regulation and animal diversity, Nature 424: 147151, 2003.
Mielke C, Kohwi Y, KohwiT and Bode J, Hierarchical binding of DNA fragderived from scaffold-attached regions: correlation of properties in vitro and function in vivo, Biochemistry, 29:7475-1990.
Miescher S, Zahn-Zabal M, De Jesus M, Moudry R, Fisch I, Vogel M, Kobr M, Imboden MA, Kragten E, Bichler J, Mermod N, Stadler BC, Amstutz H, Wurm F, CHO, Expression of a Novel human Recombinant IgG1 anti-Rh D Antibody Isolated by Phage Display, Brit. J. Haematol., 111, 157-166, 2000.
National Center for Biotechnology Information (http://www.ncbi.nih.gov).
PhiL and Stratling WH, Dissection of the ability of the chicken lysozyme gene 5' matrix attachment region to stimulate transgene expression and to dampen position effects, Biochemistry, 35:10735-1996.
Razin SV, Functional architecture of chromosomal DNA domains, Crit Rev Eukaryot Gene Expr, 6:2471996.
Stefanovic D, Stanojcic S et al., In vitro proteinDNA interactions at the human lamin B2 replication origin, J Biol Chem 278: 4273742743, 2003.
Strick R and Laemmli UK, SARs are cis DNA elements of chromosome dynamics: synthesis of a SAR repressor protein, Cell 83(7): 1137-48, 2005.
Vogelstein B, Pardoll D and Coffey D, Supercoiled loops and eukaryotic DNA replication, Cell, 22:791980.
You Z, Ishimi Y, et al., Thymine-rich single-stranded DNA activates Mcm4/6/7 helicase on Y-fork and bubble-like substrates, EMBO J 22: 61486160 (2003).
Zahn-Zabal M, Kobr M, Girod PA, Imhof M, Chatellard P, de Jesus M, Wurm F and Mermod N, Development of stable cell lines for production or regulated expression using matrix attachment regions. J Biotechnol, 87(1): 29-42, 2001.
SEQUENCE LISTING <110> Selexis S.A. <120> Matrix attachment regions(MARs) for increasing transcription and uses thereof <130> ip-2008-0164 <150> 60823319 <151> 2006-08-23 <150> 60953910 <151> 2007-08-03 <160> 20 <170> PatentIn version 3.3 <210> 1 <211> 3606 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> MAR 1_68 sequence <220> <221> misc_feature <222> (1)..(5) <223> first part of XbaI fragment <220> <221> misc_feature <222> (3606)..(3606) <223> second part of XbaI fragment <400> 1 ctagattata ccaacctcat aaaataagag catatataaa agcaaatgct cttatcttgc 60 agatccctga actgaggagg caagatcagt ttggcagttg aagcagctgg aatctgcaat 120 tcagagaatc taagaaaaga caaccctgaa gagagagacc cagaaaccta gcaggagttt 180 ctccaaacat tcaaggctga gggataaatg ttacatgcac agggtgagcc tccagaggct 240 tgtccattag caactgctac agtttcatta tctcagggat cacagattgt gctacctatt 300 gcctaccatc tgaaaacagt tgcttcctat atttcatcca gtttaatatt tatttaaacc 360 aagaaggtta atctggcacc agctattccg ttgtgagtgg atgtgaaagt accaattcca 420 ttctgtttta ctattaacta tcctttgcct taatatgtat cagtaggtgg cttgttgcta 480 ggaaatatta aatgaatggc atgtttcata ggttgtgttt aaagttgttt tttgagttaa 540 atctttcttt aataatactt tctgatgtca aaaacactta gaagtcatgg tgttgaacat 600 ctatataggg ttggatctaa aatagcttct taacctttcc taaccactgt ttttgtttgt 660 ttgtttttaa ctaagcatcc agtttgggaa attctgaatt aggggaatca taaaaggttt 720 cattttagct gggccacata aggaaagtaa gatatcaaat tgtaaaaatc gttaagaact 780 tctatcccat ctgaagtgtg ggttaggtgc ctcttctctg tgctccctta acatcctatt 840 ttatctgtat atatatatat tcttccaaat atccatgcat gggaaaaaaa atctgatcat 900 aaaaatattt taggctggga gtggtggctc acgcctgtaa tcccagcact ttgggaggct 960 gaggtgggcg gatcatgagg tcaagagatc gagaccatcc tgaccaatat ggtgaaaccc 1020 catctctact aaagatacaa aactattagc tggacgtggt ggcacgtgcc tgtagtccca 1080 gctactcggg aggctgaggc aggagaacgg cttgaaccca ggaggtggag gttgcagtga 1140 gctgagatcg cgccactgca ctccagcctg ggcgacagag cgagactctg tctcaaaaaa 1200 aaaatatata tatatatata tatacacata tatatataaa atatatatat atacacacat 1260 atatatataa aatatatata tatacacaca tatatataaa atatatatat atacacacat 1320 atatataaaa tatatatata cacacatata tataaaatat atatatacac acatatatat 1380 aaaatatata tatacacaca tatatataaa atatatatat acacacatat atataaaata 1440 tatatataca cacatatata taaaatatat atatacacac atatatataa aatatatata 1500 tacacacata tatataaaat atatatatac acacatatat ataaaatata tatatacaca 1560 catatatata aaatatatat atacacacat atataaaata tatatataca cacatatata 1620 aaatatatat atacacatat atataaaata tatatataca catatatata aaatatatat 1680 acacacatat atataaaata tatatataca cacatatata taaaatatat atatacacat 1740 atatataaaa tatatatata cacatatata taaaatatat atatatacac atatatataa 1800 aatatatata cacacatata tataaagtat atatatacac acatatatat aaaatatata 1860 tatacacata tatataaaat atatatatac acatatatat aaaatatata tatacacata 1920 tatataaaaa tatatatata tattttttaa aatattccaa ttgtctcact ttgtggatga 1980 gaaaaagaag tagttagagg tcaagtaact tggcctacat cttttctcaa gattgtaaac 2040 tcctagtgag caataaccac atcttcattt tctttgtata aaacaagaaa gtttagcatg 2100 aaaaaggtac tcaattacaa atgtgttgga ttgaattgaa gacccttgga aggggatttt 2160 gtacctgagg atctctttct tttggccata ttgttcaatg gacaaaattt agccttcgaa 2220 ggcaggccga tttgaggtta atactacctt taccacttga tagctatgtg accttggcca 2280 tgtggtttca acagtctgaa cctcattttc tctgtgtatg tgtggtcctc cttacaagtt 2340 tgtgaaaaat gtgaagtcct tagccatgat agcccaatat aacaggctaa atgataatag 2400 gtttatgttc ttttccttta tattctcaga taagcactgt ccaagtttga ggtgttttga 2460 ggtctcgcct gatttggatt gtttgagttt atgctattct ttgaattctt tgagctgttc 2520 tgaagcagtg tatcatgaac aaaaacatcc ccagttcagt ccaaacccct ggttacatat 2580 cattcttatg ccatgttata accagtttga gagtgttccc tctgttattg catttaagtt 2640 tcagcctcac acagaaattc agcagccaat ttctaagccc taagcataaa atctggggtg 2700 gggggggggg atggcctgaa gagcagcatt atgaatagca ccattataat taatgatctc 2760 tcaggaagat ttacaatcac aggtagcaga taaaacaaat agtactgctt ctgcacttcc 2820 cctcctttta ttcgctatga aattttatgg gaaatcagtc cagtgaaaaa tgtaagctct 2880 taatctttcc cagaaatcct acctcatttg atgaatactt tgagggaatg aattagagca 2940 tttttttctt ttatagtcta cttcgcattt acgaagtgag gacggtagct taggctgcct 3000 ggccaactga tgagaaggtc agaggcattt ttagagacct ctgttgtctt tcattcatgt 3060 tcattttcca caaggcaagt aatttccaac aaatcagtgt cttcattagt aataagatta 3120 ttaacaacaa taatagtcat agtaactatt cagtgagagt ccattatata tcaggcattc 3180 tacaaggtac tttatataca tctgagtaaa cctcacacaa ttctacaggg aggtatttct 3240 atccccattt aacaaataag gaaacgaagt ccaagtaaat taacttgccc aaggtcacac 3300 agatagtacc tggcagaaca ggaatttaaa cctaaatttg tccaactcca aaagcagcct 3360 tctatttgtt ataaatgctg cctctcatta tcacatattt tattattaac aacaacaaac 3420 ataccaatta gcttaagata caatacaacc agataatcat gatgacaaca gtaattgtta 3480 tactattata ataaaataga tgttttgtat gttactataa tcttgaattt gaatagaaat 3540 ttgcatttct gaaagcatgt tcctgtcatc taatatgatt ctgtatctat taaaatagta 3600 ctacat 3606 <210> 2 <211> 3638 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> MAR 1_68 construct <220> <221> misc_feature <222> (1)..(5) <223> first part of Asp718-SmaI fragment <220> <221> misc_feature <222> (6)..(11) <223> added nucleotides <220> <221> misc_feature <222> (3631)..(3635) <223> added nucleotides <220> <221> misc_feature <222> (3636)..(3638) <223> second part of Asp718-SmaI fragment <400> 2 gtacccccaa aagaaagaga tcctcaggta caaaatcccc ttccaagggt cttcaattca 60 atccaacaca tttgtaattg agtacctttt tcatgctaaa ctttcttgtt ttatacaaag 120 aaaatgaaga tgtggttatt gctcactagg agtttacaat cttgagaaaa gatgtaggcc 180 aagttacttg acctctaact acttcttttt ctcatccaca aagtgagaca attggaatat 240 tttaaaaaat atatatatat atttttatat atatgtgtat atatatattt tatatatatg 300 tgtatatata tattttatat atatgtgtat atatatattt tatatatatg tgtgtatata 360 tatactttat atatatgtgt gtatatatat tttatatata tgtgtatata tatatatttt 420 atatatatgt gtatatatat attttatata tatgtgtata tatatatttt atatatatgt 480 gtgtatatat atattttata tatatgtgtg tatatatatt ttatatatat gtgtatatat 540 atattttata tatatgtgta tatatatatt ttatatatgt gtgtatatat atattttata 600 tatgtgtgta tatatatatt ttatatatat gtgtgtatat atatatttta tatatatgtg 660 tgtatatata tattttatat atatgtgtgt atatatatat tttatatata tgtgtgtata 720 tatatatttt atatatatgt gtgtatatat atattttata tatatgtgtg tatatatata 780 ttttatatat atgtgtgtat atatatattt tatatatatg tgtgtatata tatattttat 840 atatatgtgt gtatatatat attttatata tatgtgtgta tatatatata ttttatatat 900 atgtgtgtat atatatatat tttatatata tatgtgtgta tatatatata ttttatatat 960 atatgtgtat atatatatat atatatattt tttttttgag acagagtctc gctctgtcgc 1020 ccaggctgga gtgcagtggc gcgatctcag ctcactgcaa cctccacctc ctgggttcaa 1080 gccgttctcc tgcctcagcc tcccgagtag ctgggactac aggcacgtgc caccacgtcc 1140 agctaatagt tttgtatctt tagtagagat ggggtttcac catattggtc aggatggtct 1200 cgatctcttg acctcatgat ccgcccacct cagcctccca aagtgctggg attacaggcg 1260 tgagccacca ctcccagcct aaaatatttt tatgatcaga ttttttttcc catgcatgga 1320 tatttggaag aatatatata tatacagata aaataggatg ttaagggagc acagagaaga 1380 ggcacctaac ccacacttca gatgggatag aagttcttaa cgatttttac aatttgatat 1440 cttactttcc ttatgtggcc cagctaaaat gaaacctttt atgattcccc taattcagaa 1500 tttcccaaac tggatgctta gttaaaaaca aacaaacaaa aacagtggtt aggaaaggtt 1560 aagaagctat tttagatcca accctatata gatgttcaac accatgactt ctaagtgttt 1620 ttgacatcag aaagtattat taaagaaaga tttaactcaa aaaacaactt taaacacaac 1680 ctatgaaaca tgccattcat ttaatatttc ctagcaacaa gccacctact gatacatatt 1740 aaggcaaagg atagttaata gtaaaacaga atggaattgg tactttcaca tccactcaca 1800 acggaatagc tggtgccaga ttaaccttct tggtttaaat aaatattaaa ctggatgaaa 1860 tataggaagc aactgttttc agatggtagg caataggtag cacaatctgt gatccctgag 1920 ataatgaaac tgtagcagtt gctaatggac aagcctctgg aggctcaccc tgtgcatgta 1980 acatttatcc ctcagccttg aatgtttgga gaaactcctg ctaggtttct gggtctctct 2040 cttcagggtt gtcttttctt agattctctg aattgcagat tccagctgct tcaactgcca 2100 aactgatctt gcctcctcag ttcagggatc tgcaagataa gagcatttgc ttttatatat 2160 gctcttattt tatgaggttg gtataatcta gctagagtcg agatctttgg ccatattgtt 2220 caatggacaa aatttagcct tcgaaggcag gccgatttga ggttaatact acctttacca 2280 cttgatagct atgtgacctt ggccatgtgg tttcaacagt ctgaacctca ttttctctgt 2340 gtatgtgtgg tcctccttac aagtttgtga aaaatgtgaa gtccttagcc atgatagccc 2400 aatataacag gctaaatgat aataggttta tgttcttttc ctttatattc tcagataagc 2460 actgtccaag tttgaggtgt tttgaggtct cgcctgattt ggattgtttg agtttatgct 2520 attctttgaa ttctttgagc tgttctgaag cagtgtatca tgaacaaaaa catccccagt 2580 tcagtccaaa cccctggtta catatcattc ttatgccatg ttataaccag tttgagagtg 2640 ttccctctgt tattgcattt aagtttcagc ctcacacaga aattcagcag ccaatttcta 2700 agccctaagc ataaaatctg gggtgggggg gggggatggc ctgaagagca gcattatgaa 2760 tagcaccatt ataattaatg atctctcagg aagatttaca atcacaggta gcagataaaa 2820 caaatagtac tgcttctgca cttcccctcc ttttattcgc tatgaaattt tatgggaaat 2880 cagtccagtg aaaaatgtaa gctcttaatc tttcccagaa atcctacctc atttgatgaa 2940 tactttgagg gaatgaatta gagcattttt ttcttttata gtctacttcg catttacgaa 3000 gtgaggacgg tagcttaggc tgcctggcca actgatgaga aggtcagagg catttttaga 3060 gacctctgtt gtctttcatt catgttcatt ttccacaagg caagtaattt ccaacaaatc 3120 agtgtcttca ttagtaataa gattattaac aacaataata gtcatagtaa ctattcagtg 3180 agagtccatt atatatcagg cattctacaa ggtactttat atacatctga gtaaacctca 3240 cacaattcta cagggaggta tttctatccc catttaacaa ataaggaaac gaagtccaag 3300 taaattaact tgcccaaggt cacacagata gtacctggca gaacaggaat ttaaacctaa 3360 atttgtccaa ctccaaaagc agccttctat ttgttataaa tgctgcctct cattatcaca 3420 tattttatta ttaacaacaa caaacatacc aattagctta agatacaata caaccagata 3480 atcatgatga caacagtaat tgttatacta ttataataaa atagatgttt tgtatgttac 3540 tataatcttg aatttgaata gaaatttgca tttctgaaag catgttcctg tcatctaata 3600 tgattctgta tctattaaaa tagtactaca tctagccc 3638 <210> 3 <211> 5463 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> MAR S4 sequence with full AvaI sites <400> 3 ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60 agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120 tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180 aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240 cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300 cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360 ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420 tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480 agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540 gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600 ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660 ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720 ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780 agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840 tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900 ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960 ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020 ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080 tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140 ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200 aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260 ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320 agctctttcc tttagttaag cttatgaaat agtgtttctc tcatgtttcc tctatattct 1380 ctcttttgcc ttcctgtttc ttcctgttga ttccatccca ttggagtgaa atcttatgat 1440 cttttggcat caacaaagtg atctgcatcc aaataattcc acatctcatt ccatgttgac 1500 tgtggatcta tatatatata tatgtatata tgtatatatg tatatatgta tatatgtata 1560 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1620 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 1680 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1740 tatatatgta tatatgtata tatgtatata tgtatatatg tatatacgta tatatgcata 1800 tacgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1860 tatatatgta tatatgtatg tatgtatgta tgtatgtata tatgtatata tgtatgtatg 1920 tatgtatgta tgtatgtatg tatatatgta tatatatatg tatgtatgta tgtatgtatg 1980 tatgtatatg tgtatatgtg tatatgtgta tatgtgtata tgtgtatata tgtatatatg 2040 tatatatgta tatatgtata tgtgtatatg tgtatatgtg tatatatgta tatatgtata 2100 tatgtatata tgtatatata taacatagta ttaaattata tatacatata taagtgaaat 2160 gtcacaatct tctagaactt gctctgtatg tccacttaac atggtagagt gagctatgtc 2220 agcattttct atttcctgtg aatcattctg tgtgttgcca agaagaaata tgatatattc 2280 tgaggttatg aaatgatatt ttggtcatca tgtttctcat cctattttca tattacctaa 2340 atacttttgc ttttaaaatt attattatta ataataatat aattatttat acaataatat 2400 ttaaataata tatttattta atataattat tatatttcac ataaaagcaa tagttccagt 2460 gttacaaatt gtaggcaact gggctgttct gattatctaa gttgggccca ggatatgtgc 2520 tgaatagtta aagcacatgc ccagcatgta tgagggtaaa aggatgggtg gatgtagtga 2580 cccatttgta atttaagcct tagcaggcag aggtgtgacc catagtgcaa agtacatagt 2640 cattataagg tcatctatat cacaatctct ggattagatt gattgaacct gctcagtgac 2700 caatgtgtta gcaatataca ggaggatgat aacatcaacg tcagaagaca cattgaaggg 2760 cttacaaata gtgcccattt actttaatac agaaaaattc aatgtaccct ctaggcaatt 2820 tcaactttta gtctcttggt aggatagtct acatttagaa tggctaattc ataaattaga 2880 aagcttcttc accccctact tttctggtta tttctctatg aatgtggtag gcatgagtta 2940 gtacacatgt ttccatgtac atgtgtttct atgtgtctgc atgcatatgg tagaatgtac 3000 tcatattcta tgtacagtta gaacaatatt tatattgtca aagaaatcaa aaggagtatt 3060 ataagcttca gaaataagga taagtttgaa atattcattg ttttattttt tacagtattt 3120 tttcctttga gaattctatg taaagtactt tgaacatatt tgccttcaac tcctccctca 3180 ctttcaccct ctcttcattc ctccctttcc tttccactca aagttgagat tcctttattt 3240 atttatttat ccttcaaata tcactggtac tatccacatg atctcaggat tgaggtctgc 3300 tctgacgtgt catcctgctt tcatgcaatg gccttatagg tggaacaaca ttatgaacta 3360 accagtaccc cggagctctt gactctagct gcatatatat caaaagatgg cctagtcggc 3420 catcactgga aagagaggct cattggactt gcaaacttta tatgccccag tacaggggaa 3480 caccagggcc aaaaaggggg agtgggtggg caggggagtg ggggtgggtg gatatggggg 3540 acttttggta tagcattgga aatgtaaatg agttaaatac ctaataaaaa atggaaaaaa 3600 aaagtttcta atgtgtgttt ctagaaactt cctctcttaa agcaacaaca tgtccatgag 3660 caatatagaa ttgaagatca ccatcaaatc ctctttattc ctcattgttt ccatcatgta 3720 ctaccagacc tctttaaagt gtagtacagt gtgttaggaa atgagcagat tatcctgggt 3780 atgtgctaaa ttagctactg agtcaaaata cattttttgc tgaacattaa gtgtttggtc 3840 atttctgggc aaaagaaaga aagaaagaaa gaaaagaaag aaagaaagga aggaaggaag 3900 gaaggaagga aggaaggaag gaaagaagga aggaaagaaa aaatggatgt aaattgttct 3960 gacagcatct gtctgagtca ggcagtggaa tgaaggagga atcctagaga atgcacagga 4020 aagcagccca aggagagtgt gggctgaaag gcatcatgtt agaaacatgc actcgatgac 4080 agaaccttga gaaaaaggaa ctcaagcaaa agcacttatt taaaattgta aaacgcactt 4140 tattcatagc catgggggat gtcaatattc caagcataag aatgatcagt ttccaatcac 4200 tgtgaacccc caaaacacaa agtgaaaacc cactacttta tttgatgaga tttggggttg 4260 ctctattaat ttataaaatc agagtaagac acgatataaa tgaaacgatt gtagttctaa 4320 agcagcggca cttccctgaa cagtgtcatt ttgacaagta actgctaaca tcttcaggtc 4380 acagcgactg aagaaaaagt agggaaagaa ggctggctgt gctgtttgac attttctttt 4440 cttatctggt gacatgaaga gaagctctgg gtccccctac tcttgttcat atatctgttg 4500 cttttatgct gcatcctgag gtttgaagaa atgcatttgg cactgagaaa agatgaggag 4560 agaatgcctt ggacatggtc ctaacatgct ttggtactga gaaaagagag cagaggagat 4620 gacatagaat aggagagata atttggccta ttttggcctt catctgagtg atagatttta 4680 cttaacaaat agaaacaaag ttttacttat aaacagaacc aatgacctgt gtcatctctg 4740 atatattgag ctttgaattc agtgaaatta tgaactaaat atatcactcc ataattttct 4800 aagagggcta tttgtatagt ttcagtgata gtgtgacaaa gtgtaatcta aatttctaaa 4860 aagtaaaata agtagataaa atagtaggta gaatagtata ataatagaat aagtataggt 4920 atggactaga ataaatagac aaaatagtag ataaaatgct aatgattttg ttgacagggt 4980 aatcatgaat atttttatta tttagctaaa gaaccaatgt tcatgtactc aagaagtgta 5040 ttgaggaact taggaaatta gtctgaacag gtgagagggt gcgccagaga acctgacagc 5100 ttctggaaca ggcggaagca cagaggcact gaggcagcac cctgtgtggg ccggggacag 5160 ccggccacct tccggaccgg aggacaggtg cccgcccggc tggggaggcg acctaagcca 5220 cagcagcagc ggtcgccatc ttggtccggg acccgccgaa cttaggaaat tagtctgaac 5280 aggtgagagg gtgcgccaga gaacctgaca gcttctggaa caggcagaag cacagaggcg 5340 ctgaggcagc accctgtgtg ggccggggac agccggccac cttccggacc ggaggacagg 5400 tgcccacccg gctggggagg cggcctaagc cacagcagca gcggtcgcca tcttggtccc 5460 ggg 5463 <210> 4 <211> 3839 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> S4_1-703_2328-5457 construct with full AvaI sites <400> 4 ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60 agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120 tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180 aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240 cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300 cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360 ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420 tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480 agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540 gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600 ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660 ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720 ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780 agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840 tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900 ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960 ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020 ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080 tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140 ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200 aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260 ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320 agctctttcc tttagttaag cttatgaaat agtgtttctc tcatgtttcc tctatattct 1380 ctcttttgcc ttcctgtttc ttcctgttga ttccatccca ttggagtgaa atcttatgat 1440 cttttggcat caacaaagtg atctgcatcc aaataattcc acatctcatt ccatgttgac 1500 tgtggatcta tatatatata tatgtatata tgtatatatg tatatatgta tatatgtata 1560 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1620 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 1680 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1740 tatatatgta tatatgtata tatgtatata tgtatatatg tatatacgta tatatgcata 1800 tacgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1860 tatatatgta tatatgtatg tatgtatgta tgtatgtata tatgtatata tgtatgtatg 1920 tatgtatgta tgtatgtatg tatatatgta tatatatatg tatgtatgta tgtatgtatg 1980 tatgtatatg tgtatatgtg tatatgtgta tatgtgtata tgtgtatata tgtatatatg 2040 tatatatgta tatatgtata tgtgtatatg tgtatatgtg tatatatgta tatatgtata 2100 tatgtatata tgtatatata taacatagta ttaaattata tatacatata taagtgaaat 2160 gtcacaatct tctagaactt gctctgtatg tccacttaac atggtagagt gagctatgtc 2220 agcattttct atttcctgtg aatcattctg tgtgttgcca agaagaaata tgatatattc 2280 tgaggttatg aaatgatatt ttggtcatca tgtttctcat cctattttca tattacctaa 2340 atacttttgc ttttaaaatt attattatta ataataatat aattatttat acaataatat 2400 ttaaataata tatttattta atataattat tatatttcac ataaaagcaa tagttccagt 2460 gttacaaatt gtaggcaact gggctgttct gattatctaa gttgggccca ggatatgtgc 2520 tgaatagtta aagcacatgc ccagcatgta tgagggtaaa aggatgggtg gatgtagtga 2580 cccatttgta atttaagcct tagcaggcag aggtgtgacc catagtgcaa agtacatagt 2640 cattataagg tcatctatat cacaatctct ggattagatt gattgaacct gctcagtgac 2700 caatgtgtta gcaatataca ggaggatgat aacatcaacg tcagaagaca cattgaaggg 2760 cttacaaata gtgcccattt actttaatac agaaaaattc aatgtaccct ctaggcaatt 2820 tcaactttta gtctcttggt aggatagtct acatttagaa tggctaattc ataaattaga 2880 aagcttcttc accccctact tttctggtta tttctctatg aatgtggtag gcatgagtta 2940 gtacacatgt ttccatgtac atgtgtttct atgtgtctgc atgcatatgg tagaatgtac 3000 tcatattcta tgtacagtta gaacaatatt tatattgtca aagaaatcaa aaggagtatt 3060 ataagcttca gaaataagga taagtttgaa atattcattg ttttattttt tacagtattt 3120 tttcctttga gaattcagtg aaattatgaa ctaaatatat cactccataa ttttctaaga 3180 gggctatttg tatagtttca gtgatagtgt gacaaagtgt aatctaaatt tctaaaaagt 3240 aaaataagta gataaaatag taggtagaat agtataataa tagaataagt ataggtatgg 3300 actagaataa atagacaaaa tagtagataa aatgctaatg attttgttga cagggtaatc 3360 atgaatattt ttattattta gctaaagaac caatgttcat gtactcaaga agtgtattga 3420 ggaacttagg aaattagtct gaacaggtga gagggtgcgc cagagaacct gacagcttct 3480 ggaacaggcg gaagcacaga ggcactgagg cagcaccctg tgtgggccgg ggacagccgg 3540 ccaccttccg gaccggagga caggtgcccg cccggctggg gaggcgacct aagccacagc 3600 agcagcggtc gccatcttgg tccgggaccc gccgaactta ggaaattagt ctgaacaggt 3660 gagagggtgc gccagagaac ctgacagctt ctggaacagg cagaagcaca gaggcgctga 3720 ggcagcaccc tgtgtgggcc ggggacagcc ggccaccttc cggaccggag gacaggtgcc 3780 cacccggctg gggaggcggc ctaagccaca gcagcagcgg tcgccatctt ggtcccggg 3839 <210> 5 <211> 3738 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> S4_1-2395_4121-5457 construct with full AvaI sites <400> 5 ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60 agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120 tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180 aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240 cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300 cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360 ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420 tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480 agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540 gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600 ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660 ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720 ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780 agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840 tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900 ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960 ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020 ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080 tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140 ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200 aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260 ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320 agctctttcc tttagttaag cttcagaaat aaggataagt ttgaaatatt cattgtttta 1380 ttttttacag tattttttcc tttgagaatt ctatgtaaag tactttgaac atatttgcct 1440 tcaactcctc cctcactttc accctctctt cattcctccc tttcctttcc actcaaagtt 1500 gagattcctt tatttattta tttatccttc aaatatcact ggtactatcc acatgatctc 1560 aggattgagg tctgctctga cgtgtcatcc tgctttcatg caatggcctt ataggtggaa 1620 caacattatg aactaaccag taccccggag ctcttgactc tagctgcata tatatcaaaa 1680 gatggcctag tcggccatca ctggaaagag aggctcattg gacttgcaaa ctttatatgc 1740 cccagtacag gggaacacca gggccaaaaa gggggagtgg gtgggcaggg gagtgggggt 1800 gggtggatat gggggacttt tggtatagca ttggaaatgt aaatgagtta aatacctaat 1860 aaaaaatgga aaaaaaaagt ttctaatgtg tgtttctaga aacttcctct cttaaagcaa 1920 caacatgtcc atgagcaata tagaattgaa gatcaccatc aaatcctctt tattcctcat 1980 tgtttccatc atgtactacc agacctcttt aaagtgtagt acagtgtgtt aggaaatgag 2040 cagattatcc tgggtatgtg ctaaattagc tactgagtca aaatacattt tttgctgaac 2100 attaagtgtt tggtcatttc tgggcaaaag aaagaaagaa agaaagaaaa gaaagaaaga 2160 aaggaaggaa ggaaggaagg aaggaaggaa ggaaggaaag aaggaaggaa agaaaaaatg 2220 gatgtaaatt gttctgacag catctgtctg agtcaggcag tggaatgaag gaggaatcct 2280 agagaatgca caggaaagca gcccaaggag agtgtgggct gaaaggcatc atgttagaaa 2340 catgcactcg atgacagaac cttgagaaaa aggaactcaa gcaaaagcac ttatttaaaa 2400 ttgtaaaacg cactttattc atagccatgg gggatgtcaa tattccaagc ataagaatga 2460 tcagtttcca atcactgtga acccccaaaa cacaaagtga aaacccacta ctttatttga 2520 tgagatttgg ggttgctcta ttaatttata aaatcagagt aagacacgat ataaatgaaa 2580 cgattgtagt tctaaagcag cggcacttcc ctgaacagtg tcattttgac aagtaactgc 2640 taacatcttc aggtcacagc gactgaagaa aaagtaggga aagaaggctg gctgtgctgt 2700 ttgacatttt cttttcttat ctggtgacat gaagagaagc tctgggtccc cctactcttg 2760 ttcatatatc tgttgctttt atgctgcatc ctgaggtttg aagaaatgca tttggcactg 2820 agaaaagatg aggagagaat gccttggaca tggtcctaac atgctttggt actgagaaaa 2880 gagagcagag gagatgacat agaataggag agataatttg gcctattttg gccttcatct 2940 gagtgataga ttttacttaa caaatagaaa caaagtttta cttataaaca gaaccaatga 3000 cctgtgtcat ctctgatata ttgagctttg aattcagtga aattatgaac taaatatatc 3060 actccataat tttctaagag ggctatttgt atagtttcag tgatagtgtg acaaagtgta 3120 atctaaattt ctaaaaagta aaataagtag ataaaatagt aggtagaata gtataataat 3180 agaataagta taggtatgga ctagaataaa tagacaaaat agtagataaa atgctaatga 3240 ttttgttgac agggtaatca tgaatatttt tattatttag ctaaagaacc aatgttcatg 3300 tactcaagaa gtgtattgag gaacttagga aattagtctg aacaggtgag agggtgcgcc 3360 agagaacctg acagcttctg gaacaggcgg aagcacagag gcactgaggc agcaccctgt 3420 gtgggccggg gacagccggc caccttccgg accggaggac aggtgcccgc ccggctgggg 3480 aggcgaccta agccacagca gcagcggtcg ccatcttggt ccgggacccg ccgaacttag 3540 gaaattagtc tgaacaggtg agagggtgcg ccagagaacc tgacagcttc tggaacaggc 3600 agaagcacag aggcgctgag gcagcaccct gtgtgggccg gggacagccg gccaccttcc 3660 ggaccggagg acaggtgccc acccggctgg ggaggcggcc taagccacag cagcagcggt 3720 cgccatcttg gtcccggg 3738 <210> 6 <211> 3136 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> S4_2328-5457 construct with full AvaI and EcoRI sites <400> 6 ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60 agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120 tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180 aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240 cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300 cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360 ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420 tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480 agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540 gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600 ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660 ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720 ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780 agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840 tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900 ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960 ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020 ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080 tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140 ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200 aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260 ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320 agctctttcc tttagttaag cttatgaaat agtgtttctc tcatgtttcc tctatattct 1380 ctcttttgcc ttcctgtttc ttcctgttga ttccatccca ttggagtgaa atcttatgat 1440 cttttggcat caacaaagtg atctgcatcc aaataattcc acatctcatt ccatgttgac 1500 tgtggatcta tatatatata tatgtatata tgtatatatg tatatatgta tatatgtata 1560 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1620 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 1680 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1740 tatatatgta tatatgtata tatgtatata tgtatatatg tatatacgta tatatgcata 1800 tacgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1860 tatatatgta tatatgtatg tatgtatgta tgtatgtata tatgtatata tgtatgtatg 1920 tatgtatgta tgtatgtatg tatatatgta tatatatatg tatgtatgta tgtatgtatg 1980 tatgtatatg tgtatatgtg tatatgtgta tatgtgtata tgtgtatata tgtatatatg 2040 tatatatgta tatatgtata tgtgtatatg tgtatatgtg tatatatgta tatatgtata 2100 tatgtatata tgtatatata taacatagta ttaaattata tatacatata taagtgaaat 2160 gtcacaatct tctagaactt gctctgtatg tccacttaac atggtagagt gagctatgtc 2220 agcattttct atttcctgtg aatcattctg tgtgttgcca agaagaaata tgatatattc 2280 tgaggttatg aaatgatatt ttggtcatca tgtttctcat cctattttca tattacctaa 2340 atacttttgc ttttaaaatt attattatta ataataatat aattatttat acaataatat 2400 ttaaataata tatttattta atataattat tatatttcac ataaaagcaa tagttccagt 2460 gttacaaatt gtaggcaact gggctgttct gattatctaa gttgggccca ggatatgtgc 2520 tgaatagtta aagcacatgc ccagcatgta tgagggtaaa aggatgggtg gatgtagtga 2580 cccatttgta atttaagcct tagcaggcag aggtgtgacc catagtgcaa agtacatagt 2640 cattataagg tcatctatat cacaatctct ggattagatt gattgaacct gctcagtgac 2700 caatgtgtta gcaatataca ggaggatgat aacatcaacg tcagaagaca cattgaaggg 2760 cttacaaata gtgcccattt actttaatac agaaaaattc aatgtaccct ctaggcaatt 2820 tcaactttta gtctcttggt aggatagtct acatttagaa tggctaattc ataaattaga 2880 aagcttcttc accccctact tttctggtta tttctctatg aatgtggtag gcatgagtta 2940 gtacacatgt ttccatgtac atgtgtttct atgtgtctgc atgcatatgg tagaatgtac 3000 tcatattcta tgtacagtta gaacaatatt tatattgtca aagaaatcaa aaggagtatt 3060 ataagcttca gaaataagga taagtttgaa atattcattg ttttattttt tacagtattt 3120 tttcctttga gaattc 3136 <210> 7 <211> 2340 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> S4_2328-4661 construct with full AvaI and BglII sites <400> 7 agatctttgt tgttatctgt tgcaaacact ccatttttct gttgtagcaa aaaaaaaaaa 60 aaagacatcc atagttgtca atgagaatgc aagatacata cattctgcac ctgtgtgcta 120 acataagtgg ctgccctgtg actcagagat tgcttgtcct tctcctaagc ctatcctttt 180 ttgttacttt ggatactttt gttcaatgaa tccagaaaaa gtgtttttca gattcaccat 240 gtgaccctca tttaaaacct gtaatccccc tatggttaag ttcctgcttt tgtttctgtt 300 ttctttcttt cagtaaaagg aattgaaccc agtccttcca cttactatct gagcatatgg 360 ctcttttaga ttatgatgtt ggtggtgttc attggtctca ccaaaatgct aaagaagcct 420 tcatcttcta cttgtgggta gtctttacat tcattactgc aagtttagtt tatgtggtag 480 taccagatcc tttgcttctt ttgacttcat gcctacctaa cagcagctct ttcctttagt 540 taagcttatg aaatagtgtt tctctcatgt ttcctctata ttctctcttt tgccttcctg 600 tttcttcctg ttgattccat cccattggag tgaaatctta tgatcttttg gcatcaacaa 660 agtgatctgc atccaaataa ttccacatct cattccatgt tgactgtgga tctatatata 720 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 780 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 840 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 900 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 960 tatatatgta tatatgtata tatgtatata cgtatatatg catatacgta tatatgtata 1020 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1080 tatgtatgta tgtatgtatg tatatatgta tatatgtatg tatgtatgta tgtatgtatg 1140 tatgtatata tgtatatata tatgtatgta tgtatgtatg tatgtatgta tatgtgtata 1200 tgtgtatatg tgtatatgtg tatatgtgta tatatgtata tatgtatata tgtatatatg 1260 tatatgtgta tatgtgtata tgtgtatata tgtatatatg tatatatgta tatatgtata 1320 tatataacat agtattaaat tatatataca tatataagtg aaatgtcaca atcttctaga 1380 acttgctctg tatgtccact taacatggta gagtgagcta tgtcagcatt ttctatttcc 1440 tgtgaatcat tctgtgtgtt gccaagaaga aatatgatat attctgaggt tatgaaatga 1500 tattttggtc atcatgtttc tcatcctatt ttcatattac ctaaatactt ttgcttttaa 1560 aattattatt attaataata atataattat ttatacaata atatttaaat aatatattta 1620 tttaatataa ttattatatt tcacataaaa gcaatagttc cagtgttaca aattgtaggc 1680 aactgggctg ttctgattat ctaagttggg cccaggatat gtgctgaata gttaaagcac 1740 atgcccagca tgtatgaggg taaaaggatg ggtggatgta gtgacccatt tgtaatttaa 1800 gccttagcag gcagaggtgt gacccatagt gcaaagtaca tagtcattat aaggtcatct 1860 atatcacaat ctctggatta gattgattga acctgctcag tgaccaatgt gttagcaata 1920 tacaggagga tgataacatc aacgtcagaa gacacattga agggcttaca aatagtgccc 1980 atttacttta atacagaaaa attcaatgta ccctctaggc aatttcaact tttagtctct 2040 tggtaggata gtctacattt agaatggcta attcataaat tagaaagctt cttcaccccc 2100 tacttttctg gttatttctc tatgaatgtg gtaggcatga gttagtacac atgtttccat 2160 gtacatgtgt ttctatgtgt ctgcatgcat atggtagaat gtactcatat tctatgtaca 2220 gttagaacaa tatttatatt gtcaaagaaa tcaaaaggag tattataagc ttcagaaata 2280 aggataagtt tgaaatattc attgttttat tttttacagt attttttcct ttgagaattc 2340 <210> 8 <211> 4667 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> S4_1-4661 construct with full AvaI and BglII sites <400> 8 agatctttgt tgttatctgt tgcaaacact ccatttttct gttgtagcaa aaaaaaaaaa 60 aaagacatcc atagttgtca atgagaatgc aagatacata cattctgcac ctgtgtgcta 120 acataagtgg ctgccctgtg actcagagat tgcttgtcct tctcctaagc ctatcctttt 180 ttgttacttt ggatactttt gttcaatgaa tccagaaaaa gtgtttttca gattcaccat 240 gtgaccctca tttaaaacct gtaatccccc tatggttaag ttcctgcttt tgtttctgtt 300 ttctttcttt cagtaaaagg aattgaaccc agtccttcca cttactatct gagcatatgg 360 ctcttttaga ttatgatgtt ggtggtgttc attggtctca ccaaaatgct aaagaagcct 420 tcatcttcta cttgtgggta gtctttacat tcattactgc aagtttagtt tatgtggtag 480 taccagatcc tttgcttctt ttgacttcat gcctacctaa cagcagctct ttcctttagt 540 taagcttatg aaatagtgtt tctctcatgt ttcctctata ttctctcttt tgccttcctg 600 tttcttcctg ttgattccat cccattggag tgaaatctta tgatcttttg gcatcaacaa 660 agtgatctgc atccaaataa ttccacatct cattccatgt tgactgtgga tctatatata 720 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 780 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 840 tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 900 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 960 tatatatgta tatatgtata tatgtatata cgtatatatg catatacgta tatatgtata 1020 tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1080 tatgtatgta tgtatgtatg tatatatgta tatatgtatg tatgtatgta tgtatgtatg 1140 tatgtatata tgtatatata tatgtatgta tgtatgtatg tatgtatgta tatgtgtata 1200 tgtgtatatg tgtatatgtg tatatgtgta tatatgtata tatgtatata tgtatatatg 1260 tatatgtgta tatgtgtata tgtgtatata tgtatatatg tatatatgta tatatgtata 1320 tatataacat agtattaaat tatatataca tatataagtg aaatgtcaca atcttctaga 1380 acttgctctg tatgtccact taacatggta gagtgagcta tgtcagcatt ttctatttcc 1440 tgtgaatcat tctgtgtgtt gccaagaaga aatatgatat attctgaggt tatgaaatga 1500 tattttggtc atcatgtttc tcatcctatt ttcatattac ctaaatactt ttgcttttaa 1560 aattattatt attaataata atataattat ttatacaata atatttaaat aatatattta 1620 tttaatataa ttattatatt tcacataaaa gcaatagttc cagtgttaca aattgtaggc 1680 aactgggctg ttctgattat ctaagttggg cccaggatat gtgctgaata gttaaagcac 1740 atgcccagca tgtatgaggg taaaaggatg ggtggatgta gtgacccatt tgtaatttaa 1800 gccttagcag gcagaggtgt gacccatagt gcaaagtaca tagtcattat aaggtcatct 1860 atatcacaat ctctggatta gattgattga acctgctcag tgaccaatgt gttagcaata 1920 tacaggagga tgataacatc aacgtcagaa gacacattga agggcttaca aatagtgccc 1980 atttacttta atacagaaaa attcaatgta ccctctaggc aatttcaact tttagtctct 2040 tggtaggata gtctacattt agaatggcta attcataaat tagaaagctt cttcaccccc 2100 tacttttctg gttatttctc tatgaatgtg gtaggcatga gttagtacac atgtttccat 2160 gtacatgtgt ttctatgtgt ctgcatgcat atggtagaat gtactcatat tctatgtaca 2220 gttagaacaa tatttatatt gtcaaagaaa tcaaaaggag tattataagc ttcagaaata 2280 aggataagtt tgaaatattc attgttttat tttttacagt attttttcct ttgagaattc 2340 tatgtaaagt actttgaaca tatttgcctt caactcctcc ctcactttca ccctctcttc 2400 attcctccct ttcctttcca ctcaaagttg agattccttt atttatttat ttatccttca 2460 aatatcactg gtactatcca catgatctca ggattgaggt ctgctctgac gtgtcatcct 2520 gctttcatgc aatggcctta taggtggaac aacattatga actaaccagt accccggagc 2580 tcttgactct agctgcatat atatcaaaag atggcctagt cggccatcac tggaaagaga 2640 ggctcattgg acttgcaaac tttatatgcc ccagtacagg ggaacaccag ggccaaaaag 2700 ggggagtggg tgggcagggg agtgggggtg ggtggatatg ggggactttt ggtatagcat 2760 tggaaatgta aatgagttaa atacctaata aaaaatggaa aaaaaaagtt tctaatgtgt 2820 gtttctagaa acttcctctc ttaaagcaac aacatgtcca tgagcaatat agaattgaag 2880 atcaccatca aatcctcttt attcctcatt gtttccatca tgtactacca gacctcttta 2940 aagtgtagta cagtgtgtta ggaaatgagc agattatcct gggtatgtgc taaattagct 3000 actgagtcaa aatacatttt ttgctgaaca ttaagtgttt ggtcatttct gggcaaaaga 3060 aagaaagaaa gaaagaaaag aaagaaagaa aggaaggaag gaaggaagga aggaaggaag 3120 gaaggaaaga aggaaggaaa gaaaaaatgg atgtaaattg ttctgacagc atctgtctga 3180 gtcaggcagt ggaatgaagg aggaatccta gagaatgcac aggaaagcag cccaaggaga 3240 gtgtgggctg aaaggcatca tgttagaaac atgcactcga tgacagaacc ttgagaaaaa 3300 ggaactcaag caaaagcact tatttaaaat tgtaaaacgc actttattca tagccatggg 3360 ggatgtcaat attccaagca taagaatgat cagtttccaa tcactgtgaa cccccaaaac 3420 acaaagtgaa aacccactac tttatttgat gagatttggg gttgctctat taatttataa 3480 aatcagagta agacacgata taaatgaaac gattgtagtt ctaaagcagc ggcacttccc 3540 tgaacagtgt cattttgaca agtaactgct aacatcttca ggtcacagcg actgaagaaa 3600 aagtagggaa agaaggctgg ctgtgctgtt tgacattttc ttttcttatc tggtgacatg 3660 aagagaagct ctgggtcccc ctactcttgt tcatatatct gttgctttta tgctgcatcc 3720 tgaggtttga agaaatgcat ttggcactga gaaaagatga ggagagaatg ccttggacat 3780 ggtcctaaca tgctttggta ctgagaaaag agagcagagg agatgacata gaataggaga 3840 gataatttgg cctattttgg ccttcatctg agtgatagat tttacttaac aaatagaaac 3900 aaagttttac ttataaacag aaccaatgac ctgtgtcatc tctgatatat tgagctttga 3960 attcagtgaa attatgaact aaatatatca ctccataatt ttctaagagg gctatttgta 4020 tagtttcagt gatagtgtga caaagtgtaa tctaaatttc taaaaagtaa aataagtaga 4080 taaaatagta ggtagaatag tataataata gaataagtat aggtatggac tagaataaat 4140 agacaaaata gtagataaaa tgctaatgat tttgttgaca gggtaatcat gaatattttt 4200 attatttagc taaagaacca atgttcatgt actcaagaag tgtattgagg aacttaggaa 4260 attagtctga acaggtgaga gggtgcgcca gagaacctga cagcttctgg aacaggcgga 4320 agcacagagg cactgaggca gcaccctgtg tgggccgggg acagccggcc accttccgga 4380 ccggaggaca ggtgcccgcc cggctgggga ggcgacctaa gccacagcag cagcggtcgc 4440 catcttggtc cgggacccgc cgaacttagg aaattagtct gaacaggtga gagggtgcgc 4500 cagagaacct gacagcttct ggaacaggca gaagcacaga ggcgctgagg cagcaccctg 4560 tgtgggccgg ggacagccgg ccaccttccg gaccggagga caggtgccca cccggctggg 4620 gaggcggcct aagccacagc agcagcggtc gccatcttgg tcccggg 4667 <210> 9 <211> 802 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> S4_4662-5457 construct with full AvaI and BglII sites <400> 9 ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60 agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120 tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180 aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240 cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300 cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360 ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420 tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480 agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540 gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600 ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660 ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720 ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780 agcttgaaag aacttcagat ct 802 <210> 10 <211> 3970 <212> DNA <213> Mus musculus <220> <221> misc_feature <223> MAR S46 sequence with full BamHI sites <400> 10 ggatccagag cagatgacac atacatattt ctcttagatg atattatctg agtgttaagt 60 actaaaatgt tgtgtgttgc cttatttaca ttaaacacat ttcccttttc actttttttt 120 tttcaaactc acttaaaaat gagaggataa taaaacggaa actcttcaaa gcattttctg 180 gtagagatgc agaggaaaaa aaatggtatt tcatcaactg atgaaattac ttagatctaa 240 gtgcatcacc atctaaaact acctacctct ttaaagcttc agtatagaaa tatttcaaac 300 tattttttga ggtatgcttt taaaatgggt ttatttacta gtatatatac atgcatttaa 360 gagtgtttgt ggagattagc tagaggttga attgggacac tctgttctca ccttctacca 420 catgagtccc agaggttgct taggttgaga agttctgcag caaacacatt tacacacgga 480 gcaatcccag tagccctcac actttgcaat gagcttgaga gttagagccc agcgtgagct 540 gactcatgcc tttccattat gtctaaattc caatggcgtt ttaaaacatt tttttatata 600 gcaaaaccac atatgattgg gattaaaact gtcaagcaga aatatgaata acttttttca 660 cttaaatttc gtattttatc tgaaattttg accttagaaa tacttgacat tatatctcaa 720 taaaactggc aatgaggaaa aatgaattat tggtttagag gttggtctta ttattgcttg 780 atacattaac aggagacact tactagggct tatcactgaa gtcacccggt acaaatgtac 840 ctaagtgacc gagtctagaa aacaggcact cagatactgg aggttgaaga agcagcttgc 900 ccaatcaatg ctctaattcc aattttatat tcttcctgcc tatattagtt ttccttaagc 960 atagcgagct gaaaaaatga ctgtggcctt atacatatcc tacaggtcaa catgatgaat 1020 ggctgagttg gagttttgaa aaggtgtgaa tcacaagact gcgtctggct ggatgttgat 1080 acctccccaa tcccatgact ttgtggggac gtggcattca tctctcacag agtaatgtgc 1140 agttctcagt tcatgggtgg ctacgaactg aactcccaca gtttatcaca tacattcttg 1200 tgatgtcttg caatttgttt tcgttgtttg ttgagtgtgg gtatttgagg gacaccatgt 1260 gtgtagtcag cacatgcatg tgcttctatc tggagttggt attcattgtg tgtcctctct 1320 ctctctttct ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 1380 ctctctcttt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt cttacctgcc actggcctca 1440 ataatagtag cttagttggg tagtgtgacc cagacatcag tctgttttgt ctctggtgat 1500 ggaatcatgc tattttgcac tgtcaagtga ttagtcattt ctgagggtca gactcaggtc 1560 cccatacttc caatataaat tgctccccaa tggcaaattt ctacataaca tgaggtcctt 1620 tctgtagaac tgcacaggaa atgacaccca ttctttctgg caattagtaa tgcaagatgg 1680 aatatgcaaa agcagggaac aagcccagaa gtcaatacta cttttaagga ttttgaaaga 1740 aaattgtcat taacgtgcct tctcttttat aaaagtaaga aaactaaggc ccattcttag 1800 ggacaaggat taattgtcca ttatcttaag aggagaatta taatcatata tgaatttgtg 1860 attttattat cacgaagaaa ctacacacaa atacttctgt ttttcattga ttccttattg 1920 aaccaatatt gagttgtgtt tctttggact ctgtacatac acttacagaa gaaatagaat 1980 agaagtgaca ctgaaaattt actgtgcatg tttttcattg gaaagcatta caatcattta 2040 agggaacaat gcatttgata gaaacttcag atatcataca catgttctga tacagaggaa 2100 ttaagtatgc atttcattaa aatagtgttc cttgcatata atcattcatt aggtcttaaa 2160 taagatattg ttattaacat ttaacaaaca ataaggttac ctaatccaga actgcatgat 2220 gataatgacc tgaggacaca acaaagtaga tggttgaagg ttcacaagcc caacccctag 2280 atggctaggg agagaaggag aatcttgttc tccagggatg cggtgcctga taggttgtcc 2340 agatttagcc tgaataaaac atatataata ataactctaa atgcattcag taagttctca 2400 atatgtatat atgtatatat gtatatatat acatatatac atatatacat atatacatat 2460 atacatatat acatatatac atatatacat atatacatat atacatatat acatatatac 2520 atatatacat atatacatat atacatatat acatatatac atatatacat atatacatat 2580 atacatatat acatatatac atatatacat atatacatat atacatatat acatatatac 2640 atatatacat atatacatat atacatatat acatatatac atatatacat atatacatat 2700 atacatatat acatatatac atatatacat atatacatat atacatatat acatatatac 2760 atatatacat atatacatat atacatatat acatatatac atatatacat atatacatat 2820 atacatatat acatatatac atatatacat atatacatat atacatatat acatatatac 2880 atatatacat atatacatat atacatatat acatatatac atatatacat atatacatat 2940 atacatatat atatgcactt atatgtgata atagcaatta taagaaaaga tatctgactt 3000 taaaagagat tttatgagag gagttggagg gataatagga agatggaaat actgaaacta 3060 tagtgtgaag tatatgtata aatatatata tatgttatac atgtaaatat atatgatatg 3120 atatatagat caagatcata tcagattata atattgtgtc ttttaaattt ccatgagatg 3180 aggatttcaa ggctgagtaa actctttttt ttaatatttt ttattataac gtattttcct 3240 caattacatt tagaatgcta tcccaaaagt cccccatacc ctccccccaa cttccctacc 3300 cacccattcc cattttttgg ccctggcatt cccctgtact gggacatata aagtttgcgt 3360 gtccaatggg tctctgtttc cagcaatggc cgactaggcc atcttttgat acatatgcag 3420 ctagagtcaa gagctccggg gtactggtta gttcataatg ttgttgcacc tacagggttg 3480 cagatctctt aagtccttgg atactttctc tagctcctcc gttgggggca ctatgcacca 3540 tccaatagct gactgtgagc atctacttat gtgtttgcta ggcctggcct agtctcacaa 3600 gagacagcta tatcagggtc ctttcagcaa aatcttgcta gtgtatgcaa tggtttcatc 3660 gtttggaggc taattatggg atggatctct ggatatggca gtctctagat ggtccatcct 3720 tttgtctcgg ctccaaactt tgctcagcat ccttattcat cagagaaatg caaatcaaaa 3780 ccctgagata ccatctcaca ccagtcagaa tagctaagat caaaaattca ggtgacagca 3840 gatgttggcg aggatgtgga gaaagaggaa cactcctcca ttgttggtgg gattgcaagc 3900 ttgtacaacc actctggaaa tcagtctggc ggttcctcag aaaattggac atagtactac 3960 tggaggatcc 3970 <210> 11 <211> 30 <212> DNA <213> Artificial <220> <223> synthesized optimized transcription factor binding site <400> 11 gatccagtac tcatgttcat tttctctaga 30 <210> 12 <211> 30 <212> DNA <213> Artificial <220> <223> synthesized optimized transcription factor binding site <400> 12 gatccagtac tgtttgggaa attccatgga 30 <210> 13 <211> 30 <212> DNA <213> Artificial <220> <223> synthesized optimized transcription factor binding site <400> 13 gatccagtac tcccctaatt cagacatgca 30 <210> 14 <211> 30 <212> DNA <213> Artificial <220> <223> synthesized optimized transcription factor binding site <400> 14 gatccagtac taataataaa atacccggga 30 <210> 15 <211> 30 <212> DNA <213> Artificial <220> <223> synthesized optimized transcription factor binding site <400> 15 gatccagtac tttattataa tatgttaaca 30 <210> 16 <211> 30 <212> DNA <213> Artificial <220> <223> synthesized optimized transcription factor binding site <400> 16 gatccagtac tgggaaaaaa atcgtcgaca 30 <210> 17 <211> 1189 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> CEBP rich transcription factor binding site region of MAR 1_68 <400> 17 ttataccaac ctcataaaat aagagcatat ataaaagcaa atgctcttat cttgcagatc 60 cctgaactga ggaggcaaga tcagtttggc agttgaagca gctggaatct gcaattcaga 120 gaatctaaga aaagacaacc ctgaagagag agacccagaa acctagcagg agtttctcca 180 aacattcaag gctgagggat aaatgttaca tgcacagggt gagcctccag aggcttgtcc 240 attagcaact gctacagttt cattatctca gggatcacag attgtgctac ctattgccta 300 ccatctgaaa acagttgctt cctatatttc atccagttta atatttattt aaaccaagaa 360 ggttaatctg gcaccagcta ttccgttgtg agtggatgtg aaagtaccaa ttccattctg 420 ttttactatt aactatcctt tgccttaata tgtatcagta ggtggcttgt tgctaggaaa 480 tattaaatga atggcatgtt tcataggttg tgtttaaagt tgttttttga gttaaatctt 540 tctttaataa tactttctga tgtcaaaaac acttagaagt catggtgttg aacatctata 600 tagggttgga tctaaaatag cttcttaacc tttcctaacc actgtttttg tttgtttgtt 660 tttaactaag catccagttt gggaaattct gaattagggg aatcataaaa ggtttcattt 720 tagctgggcc acataaggaa agtaagatat caaattgtaa aaatcgttaa gaacttctat 780 cccatctgaa gtgtgggtta ggtgcctctt ctctgtgctc ccttaacatc ctattttatc 840 tgtatatata tatattcttc caaatatcca tgcatgggaa aaaaaatctg atcataaaaa 900 tattttaggc tgggagtggt ggctcacgcc tgtaatccca gcactttggg aggctgaggt 960 gggcggatca tgaggtcaag agatcgagac catcctgacc aatatggtga aaccccatct 1020 ctactaaaga tacaaaacta ttagctggac gtggtggcac gtgcctgtag tcccagctac 1080 tcgggaggct gaggcaggag aacggcttga acccaggagg tggaggttgc agtgagctga 1140 gatcgcgcca ctgcactcca gcctgggcga cagagcgaga ctctgtctc 1189 <210> 18 <211> 763 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> bent AT/TA dinucleotide rich region of MAR 1_68 <400> 18 aaaaaaaaaa tatatatata tatatatata cacatatata tataaaatat atatatatac 60 acacatatat atataaaata tatatatata cacacatata tataaaatat atatatatac 120 acacatatat ataaaatata tatatacaca catatatata aaatatatat atacacacat 180 atatataaaa tatatatata cacacatata tataaaatat atatatacac acatatatat 240 aaaatatata tatacacaca tatatataaa atatatatat acacacatat atataaaata 300 tatatataca cacatatata taaaatatat atatacacac atatatataa aatatatata 360 tacacacata tatataaaat atatatatac acacatatat aaaatatata tatacacaca 420 tatataaaat atatatatac acatatatat aaaatatata tatacacata tatataaaat 480 atatatacac acatatatat aaaatatata tatacacaca tatatataaa atatatatat 540 acacatatat ataaaatata tatatacaca tatatataaa atatatatat atacacatat 600 atataaaata tatatacaca catatatata aagtatatat atacacacat atatataaaa 660 tatatatata cacatatata taaaatatat atatacacat atatataaaa tatatatata 720 cacatatata taaaaatata tatatatatt ttttaaaata ttc 763 <210> 19 <211> 1648 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Hox-rich transcription factor binding site region of MAR 1_68 <400> 19 caattgtctc actttgtgga tgagaaaaag aagtagttag aggtcaagta acttggccta 60 catcttttct caagattgta aactcctagt gagcaataac cacatcttca ttttctttgt 120 ataaaacaag aaagtttagc atgaaaaagg tactcaatta caaatgtgtt ggattgaatt 180 gaagaccctt ggaaggggat tttgtacctg aggatctctt tcttttggcc atattgttca 240 atggacaaaa tttagccttc gaaggcaggc cgatttgagg ttaatactac ctttaccact 300 tgatagctat gtgaccttgg ccatgtggtt tcaacagtct gaacctcatt ttctctgtgt 360 atgtgtggtc ctccttacaa gtttgtgaaa aatgtgaagt ccttagccat gatagcccaa 420 tataacaggc taaatgataa taggtttatg ttcttttcct ttatattctc agataagcac 480 tgtccaagtt tgaggtgttt tgaggtctcg cctgatttgg attgtttgag tttatgctat 540 tctttgaatt ctttgagctg ttctgaagca gtgtatcatg aacaaaaaca tccccagttc 600 agtccaaacc cctggttaca tatcattctt atgccatgtt ataaccagtt tgagagtgtt 660 ccctctgtta ttgcatttaa gtttcagcct cacacagaaa ttcagcagcc aatttctaag 720 ccctaagcat aaaatctggg gtgggggggg gggatggcct gaagagcagc attatgaata 780 gcaccattat aattaatgat ctctcaggaa gatttacaat cacaggtagc agataaaaca 840 aatagtactg cttctgcact tcccctcctt ttattcgcta tgaaatttta tgggaaatca 900 gtccagtgaa aaatgtaagc tcttaatctt tcccagaaat cctacctcat ttgatgaata 960 ctttgaggga atgaattaga gcattttttt cttttatagt ctacttcgca tttacgaagt 1020 gaggacggta gcttaggctg cctggccaac tgatgagaag gtcagaggca tttttagaga 1080 cctctgttgt ctttcattca tgttcatttt ccacaaggca agtaatttcc aacaaatcag 1140 tgtcttcatt agtaataaga ttattaacaa caataatagt catagtaact attcagtgag 1200 agtccattat atatcaggca ttctacaagg tactttatat acatctgagt aaacctcaca 1260 caattctaca gggaggtatt tctatcccca tttaacaaat aaggaaacga agtccaagta 1320 aattaacttg cccaaggtca cacagatagt acctggcaga acaggaattt aaacctaaat 1380 ttgtccaact ccaaaagcag ccttctattt gttataaatg ctgcctctca ttatcacata 1440 ttttattatt aacaacaaca aacataccaa ttagcttaag atacaataca accagataat 1500 catgatgaca acagtaattg ttatactatt ataataaaat agatgttttg tatgttacta 1560 taatcttgaa tttgaataga aatttgcatt tctgaaagca tgttcctgtc atctaatatg 1620 attctgtatc tattaaaata gtactaca 1648 <210> 20 <211> 223 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> 3' end of Hox-rich transcription factor binding site region of MAR 1_68 <400> 20 agaaagagat cctcaggtac aaaatcccct tccaagggtc ttcaattcaa tccaacacat 60 ttgtaattga gtaccttttt catgctaaac tttcttgttt tatacaaaga aaatgaagat 120 gtggttattg ctcactagga gtttacaatc ttgagaaaag atgtaggcca agttacttga 180 cctctaacta cttctttttc tcatccacaa agtgagacaa ttg 223

Claims (46)

  1. 하기를 포함하는, 적어도 하나의 유전자의 높은 수준의 발현을 위한 발현 시스템:
    흥미있는 유전자를 인코딩하는 뉴클레오타이드 서열을 작동가능하게 연결하는 프로모터, 및
    상기 발현 시스템에 형질 전환된 세포에서 상기 유전자의 발현을 향상시키기 위한 적어도 하나의 인간을 제외한 포유동물의 MAR 뉴클레오타이드 서열,
    여기에서 상기 인간을 제외한 포유동물의 MAR 뉴클레오타이드 서열은 상기 구조를 갖는 상기 세포의 형질전환된 상기 유전자의 발현을 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10배 또는 그 이상 증가시킴.
  2. 제 1 항에 있어서, 흥미있는 유전자를 인코딩하는 상기 프로모터 및 상기 뉴클레오타이드 서열을 포함하는 발현 카세트는 프로모터에 작동가능하게 연결되어 있는 발현 시스템.
  3. 제 1 항 또는 제 2 항에 있어서, 상기 적어도 하나의 인간을 제외한 포유동물MAR 뉴클레오타이드 서열은 생쥐 또는 햄스터 뉴클레오타이드와 같은 설치류 MAR 뉴클레오타이드 서열인 것인 발현시스템.
  4. 제 1 항 내지 제 3 항에 있어서, 상기 인간을 제외한 포유동물MAR 뉴클레오타이드 서열은 하기를 포함하는 것인 발현 시스템:
    (i) SEQ ID No. 3, SEQ ID No. 10 또는 그의 기능적인 단편; 또는
    (ii) (i)의 서열 중 의 어느 하나의 서열과 약 80%, 약 90%, 약 95% 또는 약 98%의 서열 동일성을 갖는 뉴클레오타이드 서열.
  5. 제 1 항 내지 제 4 항에 있어서, 상기 유전자는 설치류 세포 특히, 생쥐나 햄스터 세포와 같은 인간을 제외한 세포, 또는 HeLa 세포와 같은 인간세포에서 발현되는 것인 발현 시스템.
  6. 제 1 항 내지 제 5 항에 있어서, 상기 적어도 하나의 인간을 제외한 포유동물MAR 뉴클레오타이드는 상기 유전자에 시스 또는 트란스상에서 작용하는 것인 발현 시스템.
  7. 하기를 포함하는 세포에서 단백질 생산을 향상시키는 방법:
    - 인간 또는 인간을 제외한 포유동물세포를 제공하는 단계,
    - 상기 세포에 제 1항 내지 제 6 항 중 어느 한 항의 발현시스템을 도입하여 유전자 발현을 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10 배 또는 그 이상 향상시키는 단계.
  8. 하기를 포함하는 분리 및 정제한 핵산:
    (a) SEQ ID No. 3 또는 SEQ ID No. 10의 뉴클레오타이드 서열 또는 그의 기능적인 단편, 또는
    (b) (a) 서열과 적어도 약 80%, 약 90%, 약 95% 또는 약 98% 서열 동일성 및 MAR 활성을 가지는 뉴클레오타이드 서열.
  9. 하기를 포함하는 인간을 제외하는 포유동물을 동정하는 방법:
    - 적어도 하나의 인간을 제외한 포유동물의 핵산분자, 바람직하게는 인간을 제외한 포유동물의 게놈 또는 그의 일부를 제공하는 방법,
    - 하기 단계를 포함하는, 상기 핵산분자를 대상으로 하여 MAR 서열을 검색하는 방법:
    - 핵산분자를 평가하기 위하여 윈도우 크기를 세팅(setting)하는 단계,
    - 적어도 1 또는 적어도 2, 바람직하게는 3, 더욱 바람직하게는 4 또는 그 이상의 MAR 관련 특징으로 선별하는 단계,
    - 이/ 이들 특징(들)을 나타내는 서열의 역치값을 세팅하는 단계,
    - 이 역치값을 초과하는 MAR 후보 뉴클레오타이드 서열을 선별하는 단계, 및
    - 상기 인간을 제외한 포유동물 MAR 뉴클레오타이드 서열을 포함하는 발현 시스템을 통하여 인간 및/또는 인간을 제외한 포유동물 세포의 형질전환된 상기 인간을 제외한 포유동물 MAR 핵산서열의 유전자 발현이 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 또는 10 배 또는 그 이상 증가되는지 확인하는 단계.
  10. 제 9 항에 있어서, 상기 적어도 하나의 특징은 DNA 굴곡각, 큰 그루브 높이, 작은 그루브 넓이, 녹는점 또는 그의 조합인 것인 방법.
  11. 제 10 항에 있어서, 상기 DNA 굴곡각의 값은 약 3 내지 약 5˚(라디칼 정도)을 포함하며, 바람직하게는 약 3.9, 약 4.0, 약 4.1, 약 4.2 및 약 4.3˚을 포함하는, 약 3.8 내지 약 4.4˚인 방법.
  12. 제 10 항 또는 제 11 항에 있어서, 상기 큰 그루브 높이값은 약 8.9 내지 약 9.3 Å이고, 작은 그루브 넓이값은 약 5.2 내지 약 5.8 Å이며, 바람직하게는, 큰 그루브 높이는 약 9.1 Å을 포함하는 약 9.0 내지 약 9.2 Å이고, 작은 그루브 넓이는 약 5.5 Å 및 약 5.6 Å을 포함하는 약 5.4 내지 약 5.7 Å인 것인 방법.
  13. 제 10 내지 제 12 항에 있어서, 상기 녹는점은 약 55 내지 약 75℃이며, 특히 약 56, 약 57, 약 58, 약 59, 약 60 및 약 61℃를 포함하는 약 55 내지 약 62℃인 것인 방법.
  14. 제 10 항에 있어서, 상기 DNA 결합각의 값은 약 4.1, 약 4.2, 약 4.3, 약 4.4, 약 4.5, 약 4.6, 약 4.7, 약 4.8 및 약 4.9˚를 포함하는 약 4.0 내지 약 5.0˚인 것인 방법.
  15. 제 14 항에 있어서, 상기 DNA 결합각의 값은 예를 들어, 약 80bps, 약 100bps 및 약 120bps을 포함하는 약 50 bps 내지 약 150 bps 범위의 윈도우 값을 조합하는 것인 방법.
  16. 제 10 항에 있어서, 상기 DNA 결합각의 값은, 약 420 및 약 1220, 약 520 및 약 1120, 약 620 및 약 1020, 약 720 및 약 920 과 같이 약 320 내지 1320이며, 상기 큰 그루브 높이 값 곱하기 윈도우 값은, 약 1200 및 3700, 약 1500 및 약 3400, 약 1800 및 약 3100, 약 2100 및 약 2800과 같이, 약 900 내지 약 4000이며, 및/또는 작은 그루브 곱하기 윈도우 크기는 약 750 및 약 2250, 약 1000 및 약 2000, 약 1250 및 1750과 같이 약 500 내지 약 2500인 것인 방법.
  17. 제 9 항 내지 제 16 항에 있어서, 하기를 더 포함하는 것인 방법:
    - 인간 또는 인간을 제외한 기원의 실험적으로 확인된 MARs을 제공하는 단계;
    - 상기 인간 또는 인간을 제외한 기원의 실험적으로 확인된 MARs을 이용하여 상기 역치값을 결정하는 단계.
  18. 하기를 포함하는 MAR 구조:
    (a) (i) 동정된 MAR의 최소한의 말단영역을 포함하는 분리된 뉴클레오타이드 서열, 및
    (ii) 약 10%, 약 15%, 약 20%, 약 25%, 약 30% 또는 그 이상의 상기 동정된 MAR 또는 동정된 다른 MAR을 포함하는 더 분리된 뉴클레오타이드 서열 또는
    (b) (i) (a)(i)의 뉴클레오타이드 서열과 약 90%, 약 95%, 약 96%, 약 97% 약 98%, 약 99%의 서열 동일성을 갖는 뉴클레오타이드 서열, 및
    (ii) (b)(i) 의 뉴클레오타이드 서열과 약 70%, 약 80%, 바람직하게는 약 90%, 약 95%, 약 96%, 약 97% 약 98%, 약 99%의 서열 동일성을 갖는 뉴클레오타이드 서열.
  19. 제 18 항에 있어서, 상기 (a)(ii)의 뉴클레오타이드 서열은 AT-풍부 영역을 포함하는 것인 MAR 구조.
  20. 제 18 항 또는 제 19 항에 있어서, 상기 MAR 구조는 동정된 MAR 서열의 뉴클레오타이드 수의 약 90% 미만, 바람직하게는 약 80% 미만, 더욱 바람직하게는 약 70% 미만, 약 60% 미만 또는 약 50% 미만을 포함하는 것인 MAR 구조.
  21. 제 18 항 내지 제 20 항 중 어느 한 항에 있어서, 상기 MAR 구조는 동정된 MAR 서열의 뉴클레오타이드 수의 동일하거나 또는 적어도 약 110%를 포함하는 것인 MAR 구조.
  22. 연속적인 배열의 동정된 MAR 서열의 영역을 포함하며, 상기 순서 및/또는 방향성은 동정된 MAR 서열과는 다른 것인 MAR 구조.
  23. 제 22 항에 있어서, 상기 영역은 적어도 하나의 AT-풍부 영역 및 적어도 하나의 결합 자리 영역을 포함하는 것인 MAR 구조.
  24. 제 22 항 또는 제 23 항에 있어서, 상기 MAR 구조는 적어도 하나의 결합 자리 영역의 최소한의 부분을 더 포함하며, 상기 적어도 하나의 결합 자리 영역의 최소한의 부분은 선택적으로 상기 동정된 MAR 서열로부터 얻어지는 것인 MAR 구조.
  25. 제 22 항 내지 제 24 항에 있어서, 상기 동정된 MAR 서열은 인간 또는 생쥐 MAR인 것인 MAR 구조.
  26. 제 22 항 내지 제 25 항에 있어서, 상기 동정된 MAR 서열의 영역 또는 그의 일부는, 자연적으로 발생하는 인간 1_68 MAR 또는 생쥐 MAR S4 또는 그의 일부의 영역에 대하여, 약 70% 서열 동일성, 약 80% 서열 동일성, 약 90% 서열 동일성, 약 95% 서열 동일성 또는 약 98% 서열 동일성을 가지는 것인 MAR 구조.
  27. 제 22 항 내지 제 26 항에 있어서, 상기 영역은 자연적으로 발생하는 인간 1_68 MAR 에 각각 1 내지 1189, 1190 내지 1952 및 1953 내지 3600 bps로 대응되는 것인 MAR 구조.
  28. 제 22 항 내지 제 27 항에 있어서, 상기 영역은 서열 특이적인 영역인 것인 MAR 구조.
  29. 하기를 포함하는 MAR 구조:
    (a) 하기를 포함하는 중심 뉴클레오타이드 서열
    (i) 동정된 MAR 서열의 적어도 하나의 분리 또는 합성 AT- 풍부 영역 또는
    (ii) (a) (i)의 AT-풍부 영역에 대하여 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 최소 하나의 AT 풍부 영역
    (b) 상기 (a)의 뉴클레오타이드 서열에 인접한 최소 하나의 DNA 결합 자리를 포함하는 뉴클레오타이드 서열, 여기에서 상기 결합 자리는,
    (i) 더 동정된 MAR 서열의 DNA 단백질 결합자리,
    (ii) (a)의 동정된 MAR 서열의 DNA 단백질 결합 자리, 여기에서 상기 동정된 MAR 서열의 DNA 단백질 결합 자리는 상기 (a)의 중심 뉴클레오타이드 서열의 바깥쪽에 위치한 것임, 또는
    (iii) (a)의 중심에 존재하지만, 최소 하나의 추가적인 DNA 단백질 결합 자리에 인접한 첫 번째 DNA 결합 자리, 여기에서 추가적인 DNA 단백질 결합 자리의 상기 첫 번째 및 최소 하나는 상기 (a)의 중심에 인접하지 않는 것임, 또는
    (iv) MAR 서열이 아닌 DNA 단백질 결합자리
  30. 제 29 항에 있어서, 상기 구조는 세포에 상기 MAR 구조를 도입한 프로모터에 작동가능하게 연결된 유전자의 발현을 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10 배 또는 그 이상까지 증가시키는 것인 MAR 구조.
  31. 제 29 항 또는 제 30 항에 있어서, 상기 MAR구조는 500 뉴클레오타이드 미만, 바람직하게는 250 뉴클레오타이드, 더욱 바람직하게는 약 200, 약 150 또는 약 100 뉴클레오타이드 길이인 것인 MAR 구조.
  32. 제 29 항 내지 제 31 항에 있어서, 상기 (a)의 상기 중심 핵산 서열은 상기 동정된 MAR의 최소 하나의 TFBS를 포함하며, 상기에서 최소 하나의 TFBS는 동정된 MAR의 한쪽에 또는 양쪽에 상기 AT-풍부 영역이 프랭크(위치)된 것인 MAR 구조.
  33. 제 29 항 내지 제 32 항에 있어서, 상기 (b)의 상기 적어도 하나의 DNA 단백질 결합 자리는 TFBS이며, 및 1, 2, 3, 4, 5 또는 그 이상의 치환, 추가 및/또는 삭제 및/또는 전체 또는 일부분이 합성되어 변형된 것인 MAR 구조.
  34. 제 29 항 내지 제 33 항에 있어서, 상기 AT-풍부 영역이 프랭크된 TFBS는 1, 2, 3, 4, 5 또는 그 이상의 치환, 추가 및/또는 삭제에 의해 변형된 것인 MAR 구조.
  35. 제 33 항 또는 제 34 항에 있어서, 상기 TFBS는 알려지지 않은 자연적인 상대 서열(counterpart)을 가진 TFBS로 최적화 된 것인 MAR 구조.
  36. 제 29 항 내지 제 35항에 있어서, 상기 결합 자리는 SATB1, NMP4, HOX, HOXF, Gsh, CEBP, Fast1 및 SATB1 또는 이 전사 인자의 둘 또는 그 이상으로 이루어진 군으로부터 선택되는 것인 MAR 구조.
  37. 제 29 항 내지 제 36항에 있어서, 상기 (b)의 DNA 단백질 결합 자리의 시리즈는 상기 (a)의 핵산 서열에 인접한 것인 MAR 구조.
  38. 제 29 항 내지 제 37 항에 있어서, 상기 MAR 구조는 향상된 MAR 구조인 것인 MAR 구조.
  39. 하기를 포함하는 발현 시스템:
    상기 청구범위 중 어느 한 항의 최소 하나의 MAR 구조, 및, 선택적으로,
    프로모터 및 상기 프로모터의 조절 하에 흥미있는 뉴클레오타이드 서열을 도입하기 위한 최소 하나의 제한 효소 결합자리.
  40. 상기 청구범위 중 어느 한 항의 발현 시스템을 포함하는 세포.
  41. 상기 청구범위 중 어느 한 항의 발현시스템을 포함하는 인간을 제외한 유전자 변형 동물.
  42. 하기를 포함하는 키트:
    상기 청구범위 중 어느 한 항의 발현시스템, 및
    상기 발현시스템을 사용하는 방법의 사용설명서.
  43. 하기를 포함하는 유전자 발현을 향상시키는 방법:
    상기 청구범위 중 어느 하나의 프로모터 및 MAR 구조의 조절 하의 상기 유전자를 포함하는 발현 시스템을 제공하는 단계.
  44. 제 43 항에 있어서, 상기 발현 시스템은 상기 유전자의 발현의 안정성을 더 향상시키는 것인 방법.
  45. 인간 병원체 단백질 또는 인간 세포 표면 단백질과 같은 단백질 및 에리트로 포이에틴, 인터페론 또는 다른 치료학적 또는 진단학적 단백질 과 같은 단백질의 생산에서, MAR 구조, 발현 시스템, 인간을 제외한 유전자 변형 동물, 키트 및/또는 상기 청구범위 중 어느 한 항의 방법의 용도.
  46. 인 비보 및/또는 인 비트로의 유전자 치료 및/또는 세포 또는 조직의 재형성 치료에서, MAR 구조, 발현 시스템, 인간을 제외한 유전자 변형 동물, 키트 및/또는 상기 청구범위 중 어느 한 항의 방법의 용도.
KR1020097001885A 2006-08-23 2007-08-22 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도 KR20090053893A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US82331906P 2006-08-23 2006-08-23
US60/823,319 2006-08-23
US95391007P 2007-08-03 2007-08-03
US60/953,910 2007-08-03

Publications (1)

Publication Number Publication Date
KR20090053893A true KR20090053893A (ko) 2009-05-28

Family

ID=38925516

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097001885A KR20090053893A (ko) 2006-08-23 2007-08-22 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도

Country Status (10)

Country Link
US (1) US20110061117A1 (ko)
EP (1) EP2061883A2 (ko)
JP (1) JP2010501170A (ko)
KR (1) KR20090053893A (ko)
AU (1) AU2007287327B2 (ko)
CA (1) CA2658775A1 (ko)
IL (1) IL197145A0 (ko)
RU (1) RU2469089C2 (ko)
SG (1) SG176501A1 (ko)
WO (1) WO2008023247A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014017851A2 (en) * 2012-07-27 2014-01-30 Hanwha Chemical Corporation Novel mars and method for producing target protein using the same

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2292754T3 (pl) 2003-10-24 2013-06-28 Selexis Sa Wysokowydajny transfer genu i ekspresja w komórkach ssaczych przez procedurę wielokrotnej transfekcji sekwencji regionu przylegania do macierzy
US20110190482A1 (en) * 2008-06-10 2011-08-04 Avesthagen Limited Polymer encapsulated aluminum particulates
AP2011005739A0 (en) * 2008-10-28 2011-06-30 Avesthagen Ltd An expression vector and processes thereof.
DK2697375T3 (en) 2011-04-13 2018-01-15 Nat Res Council Canada EXPRESSION SYSTEM WITH A SAR (SCAFFOLD ATTACHMENT REGION) ELEMENT OF INTERFERON 2
WO2013134015A2 (en) 2012-03-05 2013-09-12 Wake Forest University Health Sciences Non-viral episomal suicide construct
SG11201503326PA (en) * 2012-11-20 2015-06-29 Novartis Ag Optimized expression cassette for expressing a polypeptide with high yield
WO2015060935A1 (en) 2013-10-22 2015-04-30 Lubris, Llc Control of rheological properties of mixed hyaluronate/lubricin solutions
WO2015059701A1 (en) * 2013-10-24 2015-04-30 Medgenics Medical Israel Ltd. Micro-organs providing sustained delivery of a therapeutic polypeptide and methods of use thereof
KR101591823B1 (ko) * 2013-12-27 2016-02-04 재단법인 목암생명공학연구소 증가된 유전자 발현능을 갖는 발현벡터
CN110343718A (zh) * 2018-04-03 2019-10-18 新乡医学院 一种高效稳定的细胞表达载体、表达系统及其制备方法、应用
BR112022016481A2 (pt) 2020-02-24 2022-10-25 Novartis Ag Purificação de polipeptídeos recombinantemente produzidos
CN114891829B (zh) * 2022-05-24 2023-09-26 新乡医学院 一种肝特异性游离型表达载体和基因治疗载体及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046687A1 (en) * 1996-06-06 1997-12-11 Novartis Ag Vectors comprising sar elements
DE19848017A1 (de) * 1998-10-17 2000-04-20 Multigene Biotech Gmbh Episomal replizierender Vektor zur Expression eines Transgens in Säugerzellen
DE69921180T2 (de) * 1998-12-01 2005-02-17 Dow Agrosciences Llc, Indianapolis Künstliche matrix-anheftungsregion zur erhöhung der expression von in pflanzen eingeführten genen
AU2002255995A1 (en) * 2001-03-30 2002-10-15 Avigenics, Inc. Avian lysozyme promoter
PL2292754T3 (pl) * 2003-10-24 2013-06-28 Selexis Sa Wysokowydajny transfer genu i ekspresja w komórkach ssaczych przez procedurę wielokrotnej transfekcji sekwencji regionu przylegania do macierzy

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014017851A2 (en) * 2012-07-27 2014-01-30 Hanwha Chemical Corporation Novel mars and method for producing target protein using the same
WO2014017851A3 (en) * 2012-07-27 2014-05-08 Hanwha Chemical Corporation Novel mars and method for producing target protein using the same

Also Published As

Publication number Publication date
AU2007287327B2 (en) 2012-11-22
RU2469089C2 (ru) 2012-12-10
WO2008023247A2 (en) 2008-02-28
RU2009105699A (ru) 2010-09-27
WO2008023247A3 (en) 2008-05-08
JP2010501170A (ja) 2010-01-21
IL197145A0 (en) 2011-08-01
CA2658775A1 (en) 2008-02-28
US20110061117A1 (en) 2011-03-10
SG176501A1 (en) 2011-12-29
AU2007287327A1 (en) 2008-02-28
EP2061883A2 (en) 2009-05-27

Similar Documents

Publication Publication Date Title
KR20090053893A (ko) 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도
AU2019250224B2 (en) Enhanced transgene expression and processing
JP5396653B2 (ja) Mar配列の多トランスフェクション手順による高効率の遺伝子導入および哺乳動物細胞における発現
KR20120099376A (ko) 강화된 전이 유전자 발현과 공정 방법 및 그 산물
KR20120034715A (ko) 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포
KR20200132870A (ko) 중국 햄스터 난소 세포의 유전자 조작을 위한 htp 플랫폼
KR102553990B1 (ko) Hspa5 유전자의 프로모터
CN101541959A (zh) 用于增加转录的基质附着区(mar)及其应用
CN112899238A (zh) 基于RNA-m6A修饰水平的化合物筛选细胞模型及其构建与应用
CN115698301A (zh) 活性dna转座子系统及其使用方法
CN111676273B (zh) 一种检测牛成肌细胞hmga2基因增强子的方法
KR101599138B1 (ko) 재조합 단백질 발현 증진을 위한 유전자 절편을 포함하는 벡터 및 이의 용도
SG195562A1 (en) High efficiency gene transfer and expression in mammalian cells by a multiple transfection procedure of matrix attachment region sequences

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application