KR20210030414A - 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 - Google Patents

조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 Download PDF

Info

Publication number
KR20210030414A
KR20210030414A KR1020217003789A KR20217003789A KR20210030414A KR 20210030414 A KR20210030414 A KR 20210030414A KR 1020217003789 A KR1020217003789 A KR 1020217003789A KR 20217003789 A KR20217003789 A KR 20217003789A KR 20210030414 A KR20210030414 A KR 20210030414A
Authority
KR
South Korea
Prior art keywords
cst
tedv
encoded
ters
rmce
Prior art date
Application number
KR1020217003789A
Other languages
English (en)
Inventor
레이건 마이클 자비스
루크 벤자민 파세
라이언 에드워드 힐
Original Assignee
제노비에 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제노비에 에이비 filed Critical 제노비에 에이비
Publication of KR20210030414A publication Critical patent/KR20210030414A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

2가지 별도의 구성요소를 포함하는 조합 시스템으로서, 여기서 제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(TEDV)이고, 제2 구성요소는 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이며, 쌍을 이루는 재조합효소 매개 카세트 교환(RMCE) 요소는 TEDV 및 TERS에 포함되어 TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현한다.

Description

조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(CSTE) 시스템
본 발명은 세포 조작(engineering) 및 재조합 DNA 기술의 분야에 관한 것이다. 특히 본 발명은 관심 유전자의 재조합효소 매개 카세트 교환(recombinase mediated cassette exchange: RMCE) 기반 통합 동안 조작된 세포를 생성, 정제, 추적 및 조작(manipulating)하기 위한 시스템 및 방법에 관한 것이다.
유전자 조작 및 면역학 분야에서, 재조합효소-매개 카세트 교환(RMCE)은 표적 유전자 변형을 위한 유용한 도구가 되었다(예를 들어, 문헌[Turan et al. Gene (2013):515:1-27] 참조). 일반적으로, 관심 유전자(gene of interest: GOI)가 올바른 위치에서 통합되었는지를 확인하기 위한 RMCE 후 방법은 세포 파괴 및 샘플 처리를 필요로 한다. 최근 기재된 접근법은 이와 같은 세포 파괴에 대한 필요성을 극복하고, 형광 마커 단백질의 발현에 따라 재조합 사건을 모니터링하고 단리할 수 있음을 보여준다(Phan et al. Sci Rep. (2017):7(1):17771). 판(Phan)외 다수에 의한 상기 접근법이 세포 파괴에 대한 필요성을 피하지만, 이는 세포내 단백질 형광에 의존하기 때문에, 형광 단백질에 의해 제공되는 고유한 스펙트럼 특성의 제한된 세트로 인해 통합 구조체의 고함량 스크리닝에 적합하지 않고; 결과적으로 제한된 수의 유전자만이 기재된 전략을 사용하여 동시에 표지되고 검출될 수 있다. 또한, 세포내 형광 단백질은, 세포 조작 작업 흐름(cell engineering workflow) 동안 고속대량(high-throughput) 및 병행화(parallelisation)에 대한 가능성, 또는 고함량 세포 라이브러리 조작의 효율을 증가시키기 위한 가능성을 제공하는, 기질 친화성 방법, 예컨대 자기 활성화 세포 분류(magnetic activated cell sorting: MACS)를 통해 세포를 분할하기 위한 물리적 조작에 적합하지 않다.
현재, 가까운 장래에 RMCE 기법을 이용하여, 특히 세포가 관심이 있는 개별 유전자의 풀을 포함하는 벡터 풀로 동시에 형질감염된 경우, 또는 기질 친화성 방법에 의한 세포의 선택이 바람직한 경우, 고속대량 및 고함량 적용 모두에서, 신속하고 강력한 세포 조작을 위한 도구에 대한 필요성이 존재한다. 따라서 효과적이고 개선된 방법을 제공할 분명한 필요성이 존재한다.
본 발명은 관심 유전자(GOI)의 재조합효소 매개 카세트 교환(RMCE) 기반 통합 동안 조작된 세포의 추적 및 조작을 위한 2-구성요소 세포 표면 태그 교환(cell surface tag exchange: CSTE) 시스템의 제공에 관한 것이다. CSTE 시스템의 첫 번째 부분은 스플라이스 수용체 부위를 포함하는 인트론 서열의 3' 단편이 측접하는 제1 세포 표면 태그(cell surface tag: CST)와 함께, 통합을 위해 GOI를 인코딩하는 태그-교환 공여체 벡터(tag-exchange donor vector: TEDV)를 나타낸다. TEDV 구조체에는 RMCE 요소가 측접한다. CSTE의 두 번째 부분은 선택 유전자를 인코딩하는 조작된 표적 세포의 게놈 내에 포함된 태그-교환 수용체 부위(tag-exchange receiver site: TERS), 및 또한 RMCE 요소, 및 GOI 코딩 서열에 측접하는 제2 RMCE 요소를 인코딩하는 완전한 인트론 서열이 인접하는 프레임내 막관통 도메인이 있는 제2 CST를 나타낸다. TERS에 의해 인코딩되는 CST는 본질적으로 단일 인트론이 인접한 2개의 엑손으로서 인코딩된다. TEDV 및 TERS 둘 다에 포함되는 쌍을 이루는 RMCE 요소는 2가지 구조체 사이의 RMCE의 실행이 TEDV에서 TERS로 CST 및 GOI의 교환을 초래하고, TERS CST 및 TERS에 의해 인코딩된 선택 유전자에서 상호 손실이 있도록 설계된다. TEDV에 의해 전달되는 CST는 TERS에 의해 인코딩된 막관통 도메인을 이용하며, 여기서 RMCE의 실행은 고유한 CST 엑손 서열의 교환을 초래한다. TERS로부터 CST 및 선택 유전자/GOI 발현을 구동시키는 프로모터 요소는 RMCE 교환된 구조체에 대해 외인성이므로, 따라서 TEDV에 의해 전달되는 서열은 일반적으로 RMCE의 충실한 실행 시에만 발현될 것이다. 이러한 CSTE 시스템은 CST에 의한 세포 표면에 제시된 친화성 에피토프의 검출에 의해 조건부로 보고되고, 또한 기질-고정화 친화성 방법으로 세포의 물리적 분할을 가능하게 하는 신속하고 강력한 RMCE를 가능하게 한다. 이러한 CSTE 시스템은 또한 CST 요소로서 다가 친화성 에피토프의 사용을 통해 GOI 통합의 다중화 및 계통 추적을 가능하게 한다. CSTE 시스템은 고속대량 및 고함량 적용 둘 다에서 신속하고 강력한 세포 조작을 위한 강력한 도구를 나타낸다.
제1 양태에서 본 발명은 2가지 별도의 구성요소를 포함하는 조합 시스템(combined system)을 제공하며, 여기서 제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향의 인코딩하는 태그-교환 공여체 벡터(TEDV)이고, 제2 구성요소는 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이며, 여기서 쌍을 이루는 재조합효소 매개 카세트 교환(RMCE) 요소는 TEDV 및 TERS에 포함되어, TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현한다.
일 실시형태에서, 제1 구성요소는,
a. 제1 RMCE 요소 - 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5'RMCE 요소
b. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편
c. 5'에서 3' 방향으로 TEDV-인코딩된 CST를 포함하는 엑손
d. 5'에서 3' 방향으로 인코딩된 CST에 대한 제1 전사 종결자 서열
e. 3'에서 5'으로 인코딩된 GOI에 대한 제2 전사 종결자
f. 3'에서 5' 방향으로 GOI를 인코딩하는 서열
g. 코작 서열(Kozak sequence)
h. 5' RMCE 요소
를 포함하는 TEDV이며,
여기서 CST 엑손 및 제1 전사 종결자는 GOI, 및 연관된 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩된다.
또 다른 실시형태에서 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 유형 2 막 단백질 막관통 도메인 엑손
d. 5' 인트론 스플라이스 공여체 부위
e. TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소
f. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열
g. 5'에서 3' 방향으로 TERS-인코딩된 CST를 포함하는 엑손(TEDV-인코딩된 CST와 상이함)
h. 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열
i. 3'에서 5' 방향에 대한 전사 종결자 서열
j. 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열
k. 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열
l. 3' RMCE 요소
m. CST 전사체의 발현의 조절 및 추적을 담당하는 3' 게놈 요소
를 포함하는 TERS이며,
여기서 막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시킨다.
제2 양태에서, 본 발명은 TERS 유전자좌로부터 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 방법을 제공하며, 상기 방법은
a. GOI를 인코딩하는 TEDV를 생성하는 단계
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 상기 TEDV를 전달하는 단계
c. TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
d. 통합된 GOI를 가지는 세포의 선택을 위한 프록시로서, 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 TEDV-인코딩된 CST의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함한다.
제3 양태에서, 본 발명은 3' 인트론 단편이 측접하는 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(TEDV)를 제공한다.
제4 양태에서, 본 발명은 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 세포 표면 태그(CST) 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포를 제공하며, 여기서 재조합효소 매개 카세트 교환(RMCE) 요소는 TERS에 포함되어 TERS와 태그-교환 공여체 벡터(TEDV) 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 관심 유전자(GOI)에 대한 리포터 요소의 교환을 초래한다.
본 발명은 RMCE에 의해 조작된 세포주로 GOI를 통합하는 시스템을 제공하며, 여기서 상기 통합의 보고는 공동-통합 세포 표면 태그(CST)의 분석에 의해 조건부로 검출된다. 더욱이, GOI의 통합시, 조작 세포주로부터 별개의 CST의 수반되는 손실은 GOI-발현 파생 조작된 세포의 이중 양성/음성 선택을 가능하게 한다. 이러한 '태그-교환'은 매우 강력하며 CSTE 시스템에 의해 가능하게 된 엄격한 양성/음성 선택을 위한 기반이다. 제2 선택 유전자는 또한 TERS 부위로부터 손실되어, GOI를 발현하는 파생 조작된 세포의 생성 동안 매우 강력한 이중 음성 선택 및 단일 양성 선택을 가능하게 한다. 중요하게도, CST 시스템의 특성은 검출을 위해 동족 친화성 시약의 선택적인 추가를 필요로 하는 조건부의 이들 마커뿐만 아니라, 또한 기질-고정화 친화성 시약 방법론의 사용에 의해 표적 세포 집단을 물리적으로 분할하는 데 활용될 수도 있게 함을 의미한다. 이는 형광-활성화 세포 분류(FACS)와 같은 방법론을 비교하기 어렵고 시간이 더 많이 소모되는 방법과 달리, 자기 활성화 세포 분류(MACS)와 같은 방법을 사용하는 세포의 분할을 통해 파생 조작된 세포 생성을 위한 효율적인 고속대량 방법을 가능하게 한다. 마지막으로, 통합 마커로서 형광 단백질 및 항생제 내성 유전자의 세포내 발현을 대체함에 있어서 CSTE 시스템은 훨씬 더 큰 선택가능한 마커 공간을 제공한다. 구체적으로, 광범위하게 중첩되는 형광 단백질 또는 고도로 제한된 항생제 내성 유전자 세트와 달리, 조건부 선택을 위한 다수의 고유한 CST 에피토프의 생성은 용이하게 달성된다. 선택가능한 마커에 대한 이러한 광범위한 접근은 효율성을 증가시키면서 다양한 형태의 고속대량 파생 세포 생성을 가능하게 하고, 세포 조작, 경로 조작 및 실험 작업 흐름에서 세포 라이브러리 형성 및 세포 계통 추적 둘 다를 위한 고함량 방법을 추가로 가능하게 한다.
CSTE 시스템의 전반적인 아키텍처 및 작동은 도 1에 도시되어 있다. CSTE 시스템은 공여체/수신기 쌍으로서 작동하며, 여기서 태그-교환 공여체 벡터(TEDV)는 GOI 서열, 및 세포-표면 태그(CST) 엑손을, 일반적으로 조작된 세포주의 게놈 내에 포함되어 있는 쌍을 이루는 태그-교환 수용체 부위(TERS)로 전달하는 역할을 한다. TERS는 별개의 CST 엑손 및 선택 유전자를 인코딩하며, 이들은 각각 TEDV-인코딩된 CST 및 GOI로 교환된다.
TEDV-인코딩된 CST 엑손은 센스(5'에서 3') 방향으로, 그리고 스플라이스 수용체 부위, 폴리피리미딘 관 및 분지점 서열을 포함하는 3' 인트론 단편이 있는 프레임에서 인코딩된다. '비-기능성' 인트론 서열 내 이러한 기능성 인트론 서열의 5'에 대하여 제1 RMCE 요소가 인코딩된다. GOI는 안티센스(3'에서 5') 방향으로 인코딩된다. GOI 전사 시작 부위에 인접한 구조체의 3' 말단에 대하여 제2 RMCE 요소가 인코딩된다.
조작된 세포주에 의해 운반된 쌍을 이루는 TERS 구조체는, TEDV의 제1 RMCE 요소와 쌍을 이루고 동등한 맥락에 있는 '비-기능성' 인트론 서열 내 제1 RMCE 요소를 이용하여, 완전한 인트론 서열을 가지는 프레임에서 CST 엑손을 인코딩한다. 이러한 제1 RMCE 부위가 인코딩되는 완전한 인트론 서열은, 그 자체가 막관통 도메인(TD) 엑손과 프레임 내에서 인코딩되는 5' 스플라이스 공여체 부위를 포함한다. 이러한 TD는 전사 시작 부위 및 프로모터 서열을 포함하여 TERS 구조체의 5'으로 전사를 구동시킨다. 따라서, TERS-인코딩된 CST는 일단 스플라이싱된 전사체로부터 번역되면 세포 표면에서 발현된다. 유사하게, 일단 TEDV와 TERS 사이에서 RMCE가 실행되면, CST 엑손에서 인코딩된 TEDV는 TERS-인코딩된 CST 엑손과 교환된다. 이는 '태그-교환'의 실행을 초래하며, 여기서 파생 조작된 세포주는 이제 세포 표면에서 TEDV-인코딩된 CST를 발현하고, TERS-인코딩된 CST를 발현하지 않는다. 이러한 과정에서, TEDV-인코딩된 CST 엑손은 TERS 구조체로부터 5' 스플라이스 공여체 부위, TD 도메인, 전사 시작 부위 및 프로모터 서열을 '획득'하여 TEDV-인코딩된 CST의 발현을 가능하게 하여, TEDV-인코딩된 서열의 통합보다 엄격한 부위-특이적 제어를 제공한다.
상기 언급한 바와 같이, TERS는 안티센스(3'에서 5') 방향으로 선택 유전자를 인코딩하며, 이 때 프로모터 서열은 TERS 구조체의 3' 말단으로 이 선택 유전자의 전사를 구동시킬 수 있다. 선택 유전자의 전사 시작 부위와 TERS의 3' 프로모터 서열 사이에서, 제2 RMCE 요소가 인코딩되고, TEDV에서 인코딩된 제2 5' RMCE 요소와 쌍을 이룬다. 따라서, RMCE가 TEDV와 TERS 사이에서 실행될 때, TEDV-인코딩된 GOI는 TERS-인코딩된 선택 유전자와 교환된다.
TEDV에는 프로모터 서열이 포함되어 있지 않으므로, 따라서 TEDV-인코딩된 CST 엑손과 GOI는 둘 다 이들의 전사를 가능하게 하는 프로모터 서열로 보완되어야 한다는 점에 유의하는 것이 중요하다. 중요한 점은, 상기 개괄한 바와 같이, CST 엑손에 대한 인트론 및 TD 엑손 보완의 포함은 TEDV-인코딩된 서열의 통합을 위한 훨씬 더 엄격한 부위 선택성을 제공한다는 것이다. CSTE에서 인트론 요소의 사용은 구조체의 무작위 통합이 세포 표면 상에서 발현가능한 TEDV-인코딩된 CST를 제공하지 않을 것이라는 추가적인 보장 수준을 제공한다. TD를 포함하여 전체 CST ORF를 전달할 공여체 벡터와 대조적으로, CSTE 세스템은 단지 CST 에피토프 엑손과 스플라이스 수용체 부위만 제공한다. 따라서, 공여체 구조체의 무작위 비정상적인 통합은 활성 프로모터에 인접하게 통합될 필요가 있을 뿐만 아니라, 적절한 5' 스플라이스 공여체 서열과 함께 유형 II 막관통 도메인, 또는 등가물의 획득을 필요로 할 것이다. 이는 TEDV-인코딩된 CST를 발현하는 무작위로 통합된 구조체의 발생 가능성을 극히 낮게 하여, 전달된 GOI를 발현하는 파생 조작된 세포의 생성 동안 이와 같은 무작위 및 원치않는 사건의 선택을 최소화한다.
TEDV 및 TERS를 포함하여 CSTE 시스템 구성요소의 구체적인 아키텍처는 하기 상술되어 있다.
TERS 아키텍처
조작된 세포주 내에 포함된 TERS는 TERS-인코딩된 CST 및 선택 유전자를 구성적으로 발현하며, 이들은 쌍을 이루는 TEDV와 함께 RMCE의 실행 시 각각 TEDV-인코딩된 CST 및 GOI로 교환된다. TERS의 일반적 아키텍처는 포함하지만, 이들로 제한에 도시되어 있다.
TERS는 전형적으로 하기를 포함한다:
a) 코작 서열
b) 유형 2 막 단백질 막관통 도메인을 인코딩하는 엑손.
c) 5' 인트론 스플라이스 공여체 부위.
d) TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소.
e) 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열.
f) 5'에서 3' 방향으로 TERS-인코딩된 CST를 포함하는 엑손.
g) 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열.
h) 3'에서 5'으로 인코딩된 선택 유전자에 대한 전사 종결자 서열.
i) 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열
j) 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열
k) 3' RMCE 요소
x) CST 전사체의 발현 및 추적의 조절을 담당하는 5' 게놈 요소. 이 게놈 요소는 최소한 CST 전사를 구동시키는 프로모터 서열을 포함함.
y) 선택 유전자 전사체의 발현 및 추적의 조절을 담당하는 3' 게놈 요소. 이 게놈 요소는 최소한 선택 유전자 전사를 구동시키는 프로모터 서열을 포함함;
여기서, a)는 RMCE에 대한 실행 이전에 TERS-인코딩된 CST, 및 RMCE의 실행이후 TEDV-인코딩된 CST 둘 다에 대해, TERS로부터 구동된 인접한 TD/CST 전사체로부터 효율적인 번역 개시를 보장하도록 제공되고; b)는 전사체 스플라이싱에 의해 CST 엑손에 인접한 TD를 나타내고, 세포 원형질막에서 번역된 단백질 구조체의 삽입물을 매개하며, CST를 세포외 공간에 제시하고; c)는 TERS 구조체의 인트론 서열 내에 위치한 RMCE 요소이며, TEDV의 5' RMCE 요소와 동등하여, CSTE 시스템 내에서 RMCE의 실행 시 CST 엑손 교환을 매개하고; e)는 스플라이스 수용체 부위 및 인트론의 연관된 기능성 서열로서, TERS로부터 구동되는 TD/CST 전사체로부터, RMCE 요소를 포함하는 인트론의 스플라이싱을 가능하게 하고; f)는 TERS 부위 내의 CST 에피토프(들)를 인코딩하여 발현된 TD/CST 단백질이 상기 에피토프를 세포외 공간에 제시하고, 조건부로 동족 친화성 시약으로 검출될 수 있는 엑손이고; g)는 5'에서 3' 방향으로 인코딩된 TD/CST 오픈 리딩 프레임에 대한 전사 종결자를 나타내고; h)는 TERS 내에서 3'에서 5' 방향으로 인코딩된 선택 유전자 오픈 리딩 프레임에 대한 전사 종결자를 나타내고; i)는 조작된 세포주에서 TERS로부터 발현된 선택 유전자를 인코딩하는 오픈 리딩 프레임을 나타내고; j)는 RMCE의 실행 이전에 TERS로부터 구동된 선택 유전자 전사체로부터 효율적인 번역 개시를 보장하도록 제공되는 코작 서열이고; k)는 선택 유전자의 전사 시작 부위와 이러한 오픈 리딩 프레임의 전사를 구동시키는 프로모터 서열 사이에 위치하는 RMCE 요소로서, TEDV의 3' RMCE 요소와 동등하여, CSTE 시스템 내에서 RMCE에 의해 실행 시 TEDV-인코딩된 GOI와 선택 유전자의 교환을 매개하고; x)는 RMCE 이전에 TERS에 의해 인코딩된 TD/CST 오픈 리딩 프레임, 및 RMCE의 실행 이후 TEDV-인코딩된 TD/CST의 전사를 구동시키는 프로모터 서열을 최소한으로 나타내고; y)는 RMCE 이전에 TERS에 의해 인코딩된 선택 유전자 오픈 리딩 프레임, 및 RMCE의 실행 이후 TEDV-인코딩된 GOI의 전사를 구동시키는 프로모터 서열을 최소한으로 나타낸다.
TERS 클로닝 단편의 개략도는 포함하지만, 이들로 제한에 제시되어 있다.
TERS는 본질적으로 5' RMCE 부위를 포함하는 완전한 기능성의 인트론 서열을 인코딩한다. 이와 같은 서열은 숙주 조작된 세포의 맥락에서 TD/CST 전사체의 효율적인 스플라이싱을 가능하게 하는 임의의 인트론을 나타낼 수 있다. TEDV의 스플라이스 수용체 부위는 TERS의 스플라이스 공여체 부위와 함께 기능성일 것이 요구된다. 따라서, TEDV 및 TERS 인코딩된 스플라이스 수용체 서열은 동일하거나 동등해야 한다.
RMCE 부위가 인코딩되는 비-코딩 및 '비-기능성' 인트론 서열은 또한 유전 요소, 예컨대 전사 인핸서, 전사 절연체, 조작된 세포 내에서 TERS 구조체의 기능 또는 보고를 위한 별도의 바람직한 구성요소를 인코딩하는 별개의 오픈 리딩 프레임, 또는 전사체 및/또는 구조체 추적 및 정량화에 사용되는 다른 고유한 서열을 추가로 인코딩할 수 있다.
TERS의 맥락에서, 인코딩된 TD/CST 및 선택 유전자 둘 다 5' 및 3' 비번역 영역(UTR)을 포함할 수 있으며, UTR은 예를 들어 전사체 및/또는 구조체 추적 및 정량화에 사용되는 고유한 서열을 인코딩하거나, 전사체 안정성의 조절을 부여한다.
선택 유전자는
a. 항생제 내성 유전자,
b. 리포터 유전자
c. 영양요구성 보완 유전자,
d. 유도성 자살 유전자
로부터 선택될 수 있으며, 여기서 이와 같은 양성 선택 마커의 선택, 형식 설정(formatting) 및 적용은 당업자에게 잘 알려져 있다. 유도성 자살 유전자의 사용은 GOI를 발현하는 파생 조작된 세포의 생성에서 RMCE의 실행 후 모 조작된 세포를 제거하는 데 사용될 수 있다. 리포터 유전자는 세포 표면에서 조건부 또는 구성 보고를 위한 고유한 TD/CST 구조체를 나타낼 수 있다. 조작된 세포주 생성 동안 양성 선택, 및 파생 조작된 세포주 생성 동안 음성 선택을 가능하게 하기 위해, 다중 선택 유전자가 TERS의 이 부분에 포함될 수 있다.
5' 및 3' 게놈 요소는 TD/CST 및 선택 유전자의 전사를 매개하는 프로모터 서열을 최소한으로 인코딩한다. 이와 같은 프로모터는 유도성 프로모터의 구성을 나타낼 수 있다. 이러한 게놈 요소는 또한 유전 요소, 예컨대 전사 인핸서, 전사 절연체, 조작된 세포 내에서 TERS 구조체의 기능 또는 보고를 위한 별도의 바람직한 성분을 인코딩하는 별개의 오픈 리딩 프레임, 또는 구조체 추적 및 정량화에 사용되는 다른 고유한 서열을 추가로 인코딩할 수 있다.
본 설명에서, TD/CST는 (도 3에 나타낸 바와 같이) 센스(5'에서 3') 방향으로 인코딩되고, 선택 유전자는 안티센스(3'에서 5') 방향으로 인코딩된다는 점에 유의하는 것이 중요하다(포함하지만, 이들로 제한에 도시한 바와 같음). 이는 설명의 명확성을 위한 것이다. TD/CST 구조체가 또한 TEDV의 3' 인트론 단편 내에서 동등한 RMCE 부위와 쌍을 이루는 RMCE 부위를 인코딩하는 기능성 인트론 서열을 통합할 수 있다면, 이러한 방향이 TERS/TEDV 맥락에서 반전될 수 없는 실질적인 이유가 없다.
선택 유전자의 포함은 CSTE 시스템의 작동에 절대적으로 필요한 것은 아니지만, RMCE의 실행 시 GOI 관심의 발현을 위한 삼중 선택을 돕기 위해 바람직하다. 또한, 센스 및 안티센스 방향 둘 다에서 리포터의 사용에 의한 조작된 세포주의 생성 및 유지는 5' 및 3' 게놈 요소 내에 포함된 프로모터 서열이 RMCE의 실행 이전에 완전히 기능성이어서 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 것을 보장한다.
세포 표면 태그(CST) 아키텍처
CSTE 시스템의 주요 기능성 특성 중 하나는 여러 고유한 CST 구조체를 사용하여 초기 TERS 구조체, 및 RMCE의 실행 시 TEDV-인코딩된 서열을 통합하는 교환된 구조체의 존재를 조건부로 보고하는 것이다.
CSTE 시스템 내에서 TD 보완 배열을 달성하기 위해, 특정 유형의 TD 엑손만 적합하다. 즉, 3'에 위치한 CST 엑손과 함께 스플라이싱될 수 있으면서, 또한 CST 단백질 단편이 세포외로 노출되는 것을 허용한다.
발현된 CST 에피토프-제시 단백질 산물을 단순화하고, TD 엑손의 크기 및 복잡성을 최소화하기 위해, 유형 II 막 단백질 유래의 TD가 가장 적합하다. 유형 II TD는 단일 통과이고, 막의 세포질 측면을 향하는 단백질의 N-말단에 위치하여, C-말단 CST 에피토프가 세포외로 노출될 수 있게 한다. 스플라이싱된 CST 전사체가 CST 에피토프를 세포외 공간에 노출시킨다면, 다중-통과 TD를 포함하여 다른 TD가 사용될 수 있다.
스플라이싱된 전사체에서 TD에 인접한 CST 엑손은 동족 친화성 시약의 사용에 의해 조건부로 검출될 수 있는 고유한 에피토프를 단순히 세포외로 제시하는 기능을 가진다. 일반적으로, 이와 같은 에피토프는 합성 서열, 숙주 조작된 세포의 것 유래의 별개의 유기체에 의해 인코딩된 서열, 또는 숙주 조작된 세포와 동일한 유기체 유래의 서열이지만 세포외로 발현되지 않는 서열을 포함한다.
일반적으로 TD와 CST 에피토프 사이에 링커 도메인을 포함하는 것이 바람직하다. CST 에피토프는 몇 개 정도의 아미노산으로 구성될 수 있지만, 이와 같은 링커 영역은 친화성 시약 결합을 위해 세포 표면에서 CST의 이용가능성을 보장한다. 이와 같은 링커 영역은 가요성 '비구조화' 영역, 또는 구조적으로 완전히 접힌 단백질 도메인을 포함할 수 있다.
CST 엑손에 의해 인코딩된 에피토프의 특성은 단지 TERS를 포함하는 조작된 세포의 세포 표면에서 다르게 발현되는 에피토프의 맥락에서만 고유성을 반영하므로, 따라서 특정 친화성 시약이 생성될 수 있는 임의의 단백질 서열을 나타낼 수 있다.
일반적으로, CST 구조체는 전체적으로 세포 기능과 관련하여 기능적으로 중립적이어야 한다. 종종 링커 서열을 통해, 외인성 기능성 도메인이 없는 불활성 에피토프 구조에 단순히 융합된 막관통 도메인이 바람직하다.
본 맥락에서, 친화성 시약은 CST 에피토프의 활성을 확인, 추적, 포획, 또는 달리 이에 영향을 미치기 위해 더 큰 표적 분자에 특이적으로 결합하는 임의의 항체, 펩타이드, 핵산, 또는 다른 소분자로 정의된다. 종종 이와 같은 친화성 시약은 동족 CST를 발현하는 세포의 추적을 위해 형광, 비색, 방사성 또는 다른 검출가능한 표지로 표지될 것이다. 대안적으로, 이와 같은 친화성 시약은 기질 친화성 강화 방법이 CST-발현 조작된 세포를 분할시킬 수 있도록 기질에 대해 작용화될 수 있다.
TERS를 포함하는 조작된 세포주
합성 TERS 구조체가 삽입되어 있으므로, TERS를 포함하는 세포주는 조작되어야 한다. 일반적으로, 이는 TERS 구조체의 조작된 세포의 게놈으로의 통합을 의미할 것이지만, 또한 TERS 구조체의 핵 유지를 위한 다른 방법, 예컨대 유전자 구조체의 에피솜 유지를 위한 방법을 포함할 수 있다.
표적 포유동물 세포의 게놈에 구조체를 통합하는 방법은 당업자에게 잘 알려져 있고, 상동성 유도 재조합(HDR) 및/또는 무작위 통합 방법을 통해 달성될 수 있으며, 여기서 HDR은 HDR이 일어나는 유전자좌의 표적화된 돌연변이에 의해 촉진될 수 있고,
i. 징크-핑거 뉴클레아제
ii. CRISPR/Cas9 매개 표적화
iii. 합성 전사 활성화-유사 이펙터 뉴클레아제(TALEN)
를 통한 부위 지정 돌연변이유발을 포함하지만, 이들로 제한되는 것은 아닌 다양한 수단을 통해 달성될 수 있으며,
여기서 상기 부위-지정 뉴클레아제는 표적 유전자좌에서 HDR에 의한 부위-특이적 DNA-수선을 유도한다. 이와 같은 사건 후, 세포의 비율은 HDR 벡터를 포함할 것이고,
iv. 비파괴적 표현형 발현 분석
v. 파괴적 표현형 발현 분석
vi. 유전 분석
의 임의의 조합을 통해 선택되고/거나 결정될 수 있으며,
여기서 iv 및 vi은 성공적인 게놈 통합 사건의 선택 및 결정을 위한 바람직한 방법이다.
대안적으로, 바이러스 벡터가 부위-지정 또는 비지정 방식으로 필요한 구성요소를 전달하는 데 사용될 수 있다.
세포 표면에서 검출가능한 TERS-인코딩된 CST가 있고, 발현된 선택 유전자가 존재한다면, TERS 구조체 통합의 방법론은 TERS 작동의 중심이 아니며, 이는 구조체가 포함된 코딩 서열의 전사와 관련하여 기능성임을 나타낸다. 실제로, TERS-인코딩된 CST 및 선택 유전자는 둘 다 TERS를 포함하는 조작된 세포주의 생성을 위한 편리한 선택가능한 마커이다.
주목해야할 한 가지 중요한 양태는 일부 응용분야, 특히 TEDV 구조체의 라이브러리로부터 단일 GOI를 발현하는 파생 조작된 세포주의 세포-기반 어레이를 생성하는 능력을 활용하는 경우 통합된 TERS 구조체의 복제수 제어에 대한 요구사항, 및 유사한 '다중' 방법이 필요하다는 것이다. 이를 주목하면, TERS 구조체의 에피솜 유지는 파생 조작된 세포주 생성을 위한 이와 같은 다중 방법과 대체로 양립할 수 없을 것이다. 조작된 세포주의 게놈 내에서 구조체 복제수의 규명 방법은 당업자에게 잘 알려져 있다.
TEDV 아키텍처
TEDV는 각각 RMCE의 실행 시 TERS에 의해 인코딩되는 CST 엑손 및 선택 유전자와 교환될 CST 엑손 및 GOI를 인코딩하며, 여기서 TERS는 조작된 세포주 내에 포함된다. TEDV의 일반적인 아키텍처는 도 2에 도시되어 있다.
TEDV는 전형적으로
1) 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소.
2) 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편.
3) 5'에서 3' 방향으로 TEDV-인코딩된 CST를 포함하는 엑손.
4) 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열.
5) 3'에서 5'으로 인코딩된 GOI에 대한 전사 종결자 서열.
6) 3'에서 5' 방향으로 GOI를 인코딩하는 서열.
7) 코작 서열.
8) 3' RMCE 요소
를 포함하며,
여기서, 1)은 TEDV 구조체의 3' 인트론 단편의 인트론 비-코딩 및 비-기능성 서열 내에 위치한 RMCE 요소를 나타내고, TERS의 5' RMCE 요소와 동등하여, CSTE 시스템 내에서 RMCE의 실행 시 CST 엑손 교환을 매개하고; 2)는 TEDV와 TERS 사이에서 RMCE의 실행 후 통합된 TEDV-인코딩된 CST 엑손의 TD/CST 전사체의 효율적인 스플라이싱의 실행을 위해 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 제공하여 GOI를 발현하는 파생 조작된 세포를 생성하는 3' 인트론 단편이고; 3)은 TEDV와 TERS 사이에서 RMCE의 실행 이후 보완된 발현된 TD/CST 단백질이 CST 에피토프를 세포외 공간에 제시하도록 하고, 동족 친화성 시약으로 조건부로 검출될 수 있는 TEDV 구조체 내 CST 에피토프(들)를 인코딩하는 엑손이고; 4)는 5'에서 3' 방향으로 인코딩된 CST 엑손에 대한 전사 종결자를 나타내어, RMCE의 실행 시 TEDV-인코딩된 CST로 보완된 TD/CST의 전사 종결자의 역할을 하고; 5)는 TEDV 내에서 5'에서 3' 방향으로 인코딩된 GOI 오픈 리딩 프레임에 대한 전사 종결자를 나타내어, RMCE의 실행 시 TERS 부위로 통합되면 인코딩된 GOI의 전사 종결 역할을 하고; 6)은 조작된 세포로 통합된 GOI를 인코딩하여 GOI를 발현하는 파생 조작된 세포를 생성하는 오픈 리딩 프레임을 나타내고; 7)은 RMCE의 실행 이후 TERS로부터 구동되는 GOI 전사체로부터 효율적인 번역 개시를 보장하도록 제공되고; 8)은 TEDV 구조체의 3' 말단의 RMCE 부위이고, 선택 유전자의 전사 개시 부위와 이러한 오픈 리딩 프레임의 전사를 구동시키는 프로모터 서열 사이에 위치하는 TERS의 3' RMCE 부위와 동등하다.
TEDV 클로닝 단편의 개략도는 도 2에 제시되어 있다.
TEDV는 합성된 DNA 구조체, 또는 당업자에게 잘 알려진 방법에 의해 생성된 클로닝된 구조체를 나타낼 수 있다. 클로닝 방법론을 돕기 위해, TEDV는 다양한 CST 엑손 및/또는 GOI 서열을 구조체에 삽입하기 위한 제한 엔도뉴클레아제 서열을 포함할 수 있다. 이와 같은 클로닝 부위의 포함 및 사용은 당업자에게 잘 알려져 있다.
본 맥락에서, TEDV는 일반적으로 박테리아에서 번식된 플라스미드 구조체일 것이며, 따라서 또한 복제 기점 및 선택 유전자를 포함할 수 있다.
TEDV는 또한 상기 구조체를 특정 전달 벡터, 예컨대 당업자에게 잘 알려진 바이러스 벡터 내로 패키징할 수 있는 서열 모티프를 가지는 구조체를 나타낼 수 있다. TERS를 포함하는 조작된 세포의 바이러스 벡터 형질도입의 사용은 그렇지 않으면 형질감염이 어려운 세포에서 CSTE 시스템의 사용에 유익할 것이다.
TEDV는 RNA 구조체를 나타낼 수 있으며, 이는 적절한 역전사효소의 제공으로 역전사될 수 있다.
본 맥락에서, GOI는 임의의 핵산 코딩 또는 비-코딩 관심 서열에 의해 정의된다. 이는 임의의 단백질- 또는 폴리펩타이드-오픈 리딩 프레임, 비-단백질-코딩 RNA, 예컨대 마이크로RNA, 짧은 헤어핀 RNA, tRNA 또는 rRNA를 포함할 수 있다.
중요한 점은, GOI는 단일 오픈 리딩 프레임의 변이체의 라이브러리를 나타낼 수 있고, 이와 같은 GOI를 인코딩하는 TEDV는 TEDV의 풀링된 라이브러리로 따를 수 있다는 것이다. CSTE 시스템에 의해 활성화된 복제수에 대한 정확한 제어, 및 GOI 통합에 대한 신뢰할 수 있는 다중 인자 및 조건부 보고로 인해, 고함량의 파생 조작된 세포의 라이브러리가 생성되어 표적 세포의 풀에서 각각의 파생 조작된 세포의 단일 GOI만을 발현할 수 있다. 이는 실행가능한 세포 상황에서 다양한 세포, 경로, 단백질 및 특정 GOI 조작에 활용될 수 있다(하기 참조).
RMCE 요소 및 효소
부위-특이적 재조합효소(SSR)의 사용은 세포의 게놈을 변형하기 위한 예측가능한 도구인 것으로 입증되었다. SSR에는 2가지 주요 부류, 즉 ΦC31, γδ-res, ParA, Tn3, Gin, ΦBT1, R4, Bxb1, TP901-1을 포함하지만, 이들로 제한되는 것은 아닌 Ser 인테그라제, 및 Flp, Cre, R을 포함하지만, 이들로 제한되는 것은 아닌 Tyr 재조합효소가 있다. 두 부류 모두 RMCE를 수행할 수 있지만, Ser 인테그라제는 초기 크로스오버에 따라 제한이 있으므로 원하는 TEDV-인코딩된 CST 및 GOI 또는 TEDV 벡터 백본의 도입일 일어날 것이다. 모든 Tyr 재조합효소가 포괄적 실험적으로 평가된 것은 아니지만, Cre 및 Flp는 RMCE를 수행하는 데 광범위하게 사용되었다. TEDV-인코딩된 CST 및 GOI 유전 요소의 단일 복사체를 통합할 목적으로, 특성 규명이 잘 된 이종특이적 FRT 부위와 함께 Flp를 사용하는 것은 인간 게놈에서 인코딩된 유사 FRT 부위의 결여로 인해 가장 적합하다. 이는 LoxP 게놈 유사부위에 대한 난잡한 활성을 나타내는 Cre의 경우에서는 아니다.
파생 조작된 세포 생성 방법
포유동물 세포에서 RMCE의 사용은 당업자에게 잘 알려져 있으며, 여기서 공여체 구조체는 화학적 형질감염, 전기천공 또는 바이러스 벡터 전달을 포함하지만, 이들로 제한되는 것은 아닌 다양한 방법론에 의해 표적 세포로 전달될 수 있다. 공여체 구조체의 제공에 추가적으로, 특정 재조합 효소(들)도 또한 제공되어야 한다. 이는 일반적으로 공여체 구조체와 함께 표적 세포로 공동-전달되는 별도의 발현 구조체로서 제공될 것이다. 일부 예에서, TERS를 발현하는 조작된 세포를 변형하여 전반적인 공정의 효율성을 증가시키기 위해 필요한 재조합 효소를 조건부로 발현하는 것이 바람직할 수 있다.
CSTE 시스템의 맥락에서, TERS를 포함하는 조작된 세포로 TEDV의 전달에 의해 RMCE가 실행된 다음, 파생 기간이 뒤따르면, TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 생성을 위해 표적 세포 집단이 분석되거나 선택될 수 있다. 이는 CSTE 시스템에 고유하고, GOI 발현의 검출에 무관한 3가지 방법으로 수행될 수 있다.
파생 조작된 세포주는 성공적인 태그-교환의 반영으로서 TERS-인코딩된 CST의 음성 선택, 및/또는 TEDV-인코딩된 CST의 양성 선택을 기초로 선택될 수 있다. 이들은 조건부로 기록되며, 각각의 CST에 대해 동족 친화성 시약의 추가를 필요로 한다. 이와 같은 선택 방법론은 형광으로 표지된 친화성 시약의 추가 및 원하는 CST 발현 프로파일의 선택을 통해 FACS를 활용할 수 있다. CST 에피토프의 세포외 제시로 인해, 세포 분할은 또한 기질-기반 풍부화 접근법, 예컨대 MACS를 통해 달성될 수 있다.
TERS-인코딩된 선택 유전자를 기초로 추가의 음성 선택이 달성될 수 있으며, 여기서 상기 선택 유전자는 리포터 유저자 또는 유도성 자살 유전자를 나타낸다. 리포터 유전자는, 예를 들어 형광 리포터 유전자의 경우에 FACS, 또는 리포터 유전자 자체가 고유한 CST를 나타내는 경우 FACS 및/또는 MACS를 이용할 수 있다. 유도성 자살 유전자를 사용하여 배양물로부터 모 조작된 세포를 음성으로 선택할 수 있으며; 예를 들어 GOI를 발현하는 파생 조작된 세포를 풍부하게 할 수 있다.
전반적으로 이중 양성 선택 및 단일 음성 선택은 파생 조작된 세포의 매우 강력한 선택을 제공하며, 이는 조건부로 기록될 수 있고, 기질-고정화 친화성 시약을 이용하여 세포를 분할하는 데 사용될 수 있다. 이러한 선택은 상기 TEDV-인코딩된 GOI의 특성이 파생 조작된 세포 내에서 비-파괴적인 검출로 수정될 수 있는 경우, TEDV-인코딩된 GOI에 대한 양성 선택을 추가적으로 포함할 수 있다. 상기 언급된 선택은 고속대량 또는 정확한 고함량 파생 조작된 세포 집단을 달성하는 데 연속하여 또는 동시에 사용될 수 있다.
이러한 상기 표현형 분석은 일반적으로 당업자에게 잘 알려진 방법을 이용하여 파생 조작된 세포의 TEDV 서열의 복제수의 유전형 확인에 의해 뒷받침될 것이다. 이는 또한 CST 발현의 매우 표준화된 맥락을 고려할 때 어느 정도 표현형으로 달성될 수 있으며, 여기서 TEDV 구조체의 비정상적인 통합이 세포 표면에서 TEDV-인코딩된 CST의 발현을 초래하는 매우 드문 경우가, 특히 FACS 선택 방법론을 이용할 때 높은 TEDV-인코딩된 CST 발현으로 세포를 배제함으로써 부정적으로 선택될 수 있다. 다중 TERS 부위를 발현하는 조작된 세포의 경우(하기 참조), 복제수 제어는 세포 표면에서 발현된 TEDV-인코딩된 CST의 정도를 기반으로 유사하게 달성될 수 있다.
세포의 기질-고정화 친화성 시약 분할 방법
CSTE 시스템의 주요 장점은 CST 에피토프의 세포 표면 노출, 및 이에 따른 기질 고정화 친화성 방법을 기초로 세포를 분할하는 능력이다. 이는 고속대량 방법, 또는 고함량 파생 조작 세포 라이브러리 생성에서 단계적 선택에 특히 유용하다. 당업자에게 잘 알려진 방법론은 표면 에피토프의 특이적 발현을 기반으로 한 세포의 포획 및 물리적 분할을 위한 다양한 다른 친화성 시약-작용화 기질 중에서 강자성 비드-기반 MACS 접근법이다. 세포 표면 CST 발현을 기반으로 한 이와 같은 신속한 조건부 양성 및/또는 음성 선택은, 항생제 내성 선택을 제공하는 훨씬 더 빠른 속도 및 정확성, 및 세포내 형광 단백질로 제한되는 FACS 선택과 비교하여 훨씬 더 빠른 속도 및 비용 감소로, 매우 병렬적이고 따라서 고속대량 방법론에 적합하다. 더욱이, 모 조작된 세포 및 파생 조작된 세포를 둘 다 양성 및 음성 선택하는 능력은 하나 이상의 GOI를 발현하는 파생 조작된 세포의 정확한 고함량 라이브러리 생성을 야기한다.
다중 및 다가 CST를 이용하는 세포 표면 ' 바코딩 ' 방법
CSTE 시스템의 장점은 이용가능한 선택 마커 공간의 양이 증가한다는 것이다. 단지 소수의 병렬화가능한 마커로 제한되는 표준 형광 단백질 리포터 및 항생제 내성 유전자 시스템과 대조적으로, 동족 친화성 시약을 이용한 단순한 에피토프를 사용함으로써 다수의 고유한 마커가 신속하게 생성될 수 있다. 다중-에피토프 CST 도메인은 이용가능한 CST 에피토프 및 동족 검출 시약의 고유한 모든 조합에 대해 용이하게 구성될 수 있으므로, 이용가능한 CST 에피토프 및 동족 시약의 수에 의해서만 제한되지 않는다. 확장되고 병렬화가능한 조건부 리포터 공간은 다양한 고속대량 및 고함량 방법론을 가능하게 한다.
각각 상이한 GOI, 또는 GOI 변이체 서열과 연관된 다중 TEDV-인코딩된 에피토프의 사용은, 고속대량 세포 조작에서 효율성을 증가시키는 데 사용될 수 있다. 예를 들어, 이와 같은 고유한 벡터의 풀은 TERS를 발현하는 조작된 세포의 풀로 통합될 수 있다. 이는 상기 개괄한 바와 같이 음성 선택을 통해 대량 처리될 수 있으며, 고유한 TEDV-인코딩된 CST 발현을 기초로 이후에 분할될 수 있다.
유사하게, 다중-TEDV-인코딩된 CST 에피토프의 사용은 실행가능한 세포 계통 추적 및 선택을 위한 중간함량 라이브러리의 생성을 가능하게 한다. 예를 들어, 고유한 CST와 연관된 GOI의 라이브러리는 파생 조작된 세포의 풀로 통합될 수 있고, 특이적 GOI를 발현하는 세포 계통의 지속성 또는 기능을 시간에 따라 추적할 수 있다. 이는 단백질, 경로 또는 세포 공학 또는 분석을 위한 배양 시스템의 선택에 적용될 수 있거나, 세포가 생존가능한 동물에 이식되고, 이후에 분석을 위해 생존가능한 세포로서 회수되는 경우에 유사하게 사용될 수 있다.
고함량 라이브러리 및 다중- TERS 조작된 세포
GOI를 발현하는 파생 조작된 세포의 강력한 양성 및 음성 선택으로, 단백질, 경로 및 세포 공학 작업 흐름을 지원하기 위해 다양한 방식으로 정확한 고함량 라이브러리가 생성될 수 있다.
가장 간단한 개념으로, 단일 CST 에피토프를 인코딩하지만 다중 GOI를 인코딩하지 않는 TEDV의 라이브러리가 세포의 풀 내로 통합될 수 있다. 예를 들어 TERS- 및 TEDV-인코딩된 CST 에피토프를 이용한 표준 양성/음성 CST 선택의 적용은, 선택된 집단의 각각의 세포에서 단일 GOI 변이체를 발현하는 파생 조작된 세포의 집단을 유도할 것이다. 그 다음 이러한 고함량 세포 라이브러리에 통합된 변이체 GOI를 기반으로 단백질, 세포 경로 또는 보다 일반적으로 세포 기능을 조작하기 위해 작업 흐름에서 기능성 선택이 적용될 수 있다.
단일 조작된 세포에 대한 고유한 CST 에피토프가 있는 다중 TERS, 및 고유한 CST 에피토프가 있는 다중 TEDV 라이브러리를 첨가하여, 변이체 GOI의 여러 패밀리가 이와 같은 조작 작업 흐름 내로 통합되어, 예를 들어 조합 변이체 GOI로서 생합성 경로에서 효소를 처리할 수 있다. 조작된 세포가 다중 TERS를 포함하는 이와 같은 맥락은, 단일 GOI의 전반적인 발현을 향상시키는 데 사용될 수 있다. 다중-TERS 조작된 세포는 일반적으로 GOI 통합 및 선택의 효율성 및 안정성을 보장하기 위해 각각의 TERS/TEDV 쌍에 대한 고유한 이종특이적 재조합효소 부위의 사용을 필요로 할 것이다.
도면 범례
도 1. 세포 표면 태그 교환( CSTE ) 시스템의 조성 및 작동
CSTE 시스템의 개략도. 상단 패널은, 우측에 태그 교환 공여체 벡터(TEDV), 좌측에 태그-교환 수용체 부위(TERS)를 포함하는 조작된 세포가 있는 시스템 구성요소를 도시한다.
TEDV는 구조체의 양쪽 말단(개방형 및 폐쇄형 삼각형)에서 RMCE 요소를 인코딩하며, 상기 요소는 TERS 내에 포함된 RMCE 부위와 쌍을 이룬다. TEDV 구조체(폐쇄형 삼각형)의 5' 말단에서 RMCE 요소는 3' 인트론 단편을 나타내는 서열 내에서 인코딩되며, 여기서 RMCE 요소의 3' 바로 옆에 분지점 서열, 폴리피리미딘 관 및 스플라이스 수용체 부위를 포함하는 인트론의 3' 요소(개방형 원)가 있다. 따라서, RMCE는 '비-기능성' 및 비-코딩 인트론 서열 내에 포함되고, TEDV 내에 포함된 3' 인트론 단편에는 5' 스플라이스 공여체 부위가 없다. 스플라이스 수용체 부위의 3' 바로 옆에서, TEDV는 세포 표면 태그(CST)의 3' 엑손을 인코딩하며, 이는 엑손이 고유한 분자 결합 모티프를 포함하는 CST의 부분(회색 직사각형)을 인코딩한다는 것을 의미한다. CST 서열은 5'에서 3' 방향으로 인코딩되며, 여기서 TEDV는 또한 3'에서 5' 방향으로 인코딩된 TERS에 통합될 관심 유전자(GOI)(망상선이 표시된 직사각형)를 인코딩한다.
조작된 세포 내에 포함된 TERS의 중심 부분은, 동일한 아키텍처를 가지지만, TEDV의 것과 구별되는 요소를 인코딩한다. 즉, TEDV(개방형 및 폐쇄형 삼각형)의 것과 쌍을 이루는 RMCE 요소 사이에서, TERS는 이러한 CST(개방형 원)의 5' 바로 옆의 스플라이스 수용체 부위 및 연관된 3' 인트론성 서열을 이용하여 TEDV-인코딩된 CST(체크무늬의 직사각형)의 것과 구별되는 CST 엑손을 인코딩한다. 유사하게, 선택 유전자(폐쇄형 직사각형)는 TEDV의 GOI와 같이, TERS 내에서 안티센스 방향으로 인코딩된다. 구조체의 5' 말단에서, 프로모터 서열이 포함되어(우측 화살표), CST의 전사를 구동시킨다. 이 프로모터 서열의 3'에 대하여, 3' 바로 옆의 5' 인트론 서열(폐쇄형 원)을 이용하여 막관통 도메인(TD) 엑손(개방형 직사각형)이 인코딩된다. 이는 인트론을 포함하는 RMCE 요소와 프레임 내에서 인코딩되는 TD 엑손 및 CST 엑손이 단일 코딩 mRNA로 엑손을 인접시키도록 스플라이싱되는 연속 전사체로서 생성된다는 것을 의미한다. TERS-인코딩된 TD-CST 산물(개방형/체크무늬 덤벨)은 세포 표면 상에서 발현된다. TERS 구조체의 3' 말단에 3'에서 5' 방향으로 선택 유전자(폐쇄형 직사각형)의 전사를 구동시키는 별도의 프로모터 요소가 있으며, 이는 선택 유전자(폐쇄형 정사각형)의 발현을 초래한다.
TEDV/TERS에서 쌍을 이루는 RMCE 요소에 특이적인 재조합효소에 대한 적절한 발현 구조체와 함께 TERS를 포함하는 조작된 세포로 TEDV를 도입하면, RMCE가 실행되고, GOI를 발현하는 파생 조작된 세포의 생성이 초래된다(하단 패널). TERS-인코딩된 요소는 TEDV-인코딩된 요소로 교환되었다. 따라서 파생 세포주는, 원래 TERS-인코딩된 TD(개방형/회색 덤벨), 및 GOI(망상선이 표시된 정사각형)와 함께 TD-CST 산물로서 세포 표면에서 TEDV-인코딩된 CST를 발현한다.
전반적으로, TEDV와 TERS 사이의 RMCE의 실행은 선택 유전자와 TERS-인코딩된 CST의 발현을 상실하고, TEDV-인코딩된 CST 및 GOI의 발현을 얻은 파생 조작된 세포의 생성을 초래한다.
도 2. 태그-교환 전달 벡터( TEDV ) 아키텍처
구조체 아키텍처의 핵심 요소를 나타내는 각각의 번호가 표시된 박스가 있는 선형 구조체로서 도시된, TEDV의 개략도. 이 구조체는 TEDV-인코딩된 CST, 및 관심 유전자(GOI)를 둘 다 포함한다.
1)은 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소를 나타낸다.
2)는 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열을 나타낸다.
3)은 5'에서 3' 방향으로 TEDV-인코딩된 CST를 인코딩하는 엑손을 나타낸다.
4)는 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열을 나타낸다.
5)는 3'에서 5'으로 인코딩된 GOI에 대한 전사 종결자 서열을 나타낸다.
6)은 3'에서 5' 방향으로 GOI를 인코딩하는 서열을 나타낸다.
7)은 GOI 전사체의 효율적인 번역 개시를 위한 코작 서열을 나타낸다.
8)은 3' RMCE 요소를 나타낸다.
도 3. 태그-교환 수용체 부위( TERS ) 개방형 아키텍처 - 태그 교환 전
구조체 아키텍처의 핵심 요소를 나타내는 각각의 문자가 표시된 박스가 있는 선형 구조체로서 도시된, TERS의 개략도. 이 구조체는 TERS-인코딩된 CST, 및 관심 유전자(GOI)를 둘 다 포함한다.
a) 인접한 막관통 도메인(TD)/CST 전사체의 효율적인 번역 개시를 위한 코작 서열을 나타낸다.
b) 유형 2 막 스캐폴드 단백질 도메인을 인코딩하는 엑손을 나타낸다.
c) 5' 인트론 스플라이스 공여체 부위를 나타낸다.
d) TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소를 나타낸다.
e) 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열을 나타낸다.
f) 5'에서 3' 방향으로 TERS-인코딩된 CST를 인코딩하는 엑손을 나타낸다.
g) 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열을 나타낸다.
h) 3'에서 5'으로 인코딩된 선택 유전자에 대한 전사 종결자 서열을 나타낸다.
i) 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열을 나타낸다.
j) 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열을 나타낸다.
k) 3' RMCE 요소를 나타낸다.
x) CST 전사체의 발현 및 추적의 조절을 담당하는 5' 게놈 요소를 나타낸다. 이 게놈 요소는 최소한 CST 발현을 구동시키는 프로모터 서열을 포함한다.
y) CST 전사체의 발현 및 추적의 조절을 담당하는 5' 게놈 요소를 나타낸다. 이 게놈 요소는 최소한 CST 발현을 구동시키는 프로모터 서열을 포함한다.
도 4. 파생 조작된 세포의 TERS 교환
TEDV-인코딩된 요소와 RMCE-매개 교환 후 TERS 유전자좌의 개략도. 도 1에 도시한 바와 같이, TEDV의 측접한 RMCE 부위 사이에서 인코딩되는 요소는 TERS의 측접한 RMCE 부위 사이에서 인코딩되는 동등한 아키텍처의 서열과 교환된다. 이는 파생 조작된 세포주 내에서 TERS 교환을 초래한다. 문자 및 번호가 표시된 박스는 각각 도 2 및 도 3에 상술된 바와 같은 핵심 유전 요소를 나타낸다.
도 5. 교환된 TEDV 부산물
TERS-인코딩된 요소와의 RMCE-매개 교환 후 TEDV 부산물의 개략도. 도 1에 도시한 바와 같이, TEDV의 측접한 RMCE 부위 사이에서 인코딩되는 요소는 TERS의 측접한 RMCE 부위 사이에서 인코딩되는 동등한 아키텍처의 서열과 교환된다. 이는 파생 조작된 세포주의 생성 동안 불안정한 교환된 TEDV 부산물을 생성한다. 문자 및 번호가 표시된 박스는 각각 도 2 및 도 3에 상술된 바와 같은 핵심 유전 요소를 나타낸다.
도 6. TERS의 조작된 세포로의 통합
a) Myc 에피토프 CST 및 RFP 선택 유전자를 인코딩하는 TERS 카세트를 상동성 유도 재조합에 의해 모 세포주 ACL-128에 통합함으로써 조작된 세포주 집단인 ACL-1163을 형성하였다. 전기천공 10일 후, 세포를 항-Myc 항체로 염색하고 TERS, Myc 에피토프 CST 및 RFP에 의해 인코딩된 선택 마커에 대해 유세포분석법에 의해 분석하였다. 플롯은 RFP 대 Myc로서 살아있는 단일 세포를 표시하며, 이는 형질감염된 세포 중에 모 세포(Q2 우측 패널)와 비교하여 RFP 및 Myc 둘 다(Q2 좌측 패널)에 대해 높은 신호를 보이는 형질감염체 집단이 있음을 나타낸다. b) 높은 RFP 및 Myc 신호를 가지는 세포를 선택하여 더 크게 성장시켰고 대표적인 조작된 ACL-1163을 유세포분석법에 의해 분석하였다. 플롯은 게이팅된 살아있는 단일 세포의 RFP 대 Myc 매개변수를 표시한다. 단일클론 ACL-1163은 예상된 바와 같이 높은 RFP 및 Myc 신호를 가진다(Q2).
도 7. 파생 조작된 세포를 생성하기 위해 GOI의 태그-교환 및 전달이 있는 TEDV를 이용한 RMCE의 실행
Flp 재조합효소 매개 태그-교환을 ACL-1163 조작된 세포에서 수행하였다. RFP 선택 유전자 및 Myc 에피토프 CST를 인코딩하는 TERS를 보유하는 ACL-1163 세포를, flp 재조합효소를 인코딩하는 구조체와 함께, SBP 에피토프 CST 및 GOI를 인코딩하는 TEDV와 함께 형질감염시켰다. 전기천공 7일 후 세포를 항-Myc 및 항-SBP 항체로 염색하고 RFP, Myc 및 SBP 신호에 대해 유세포분석법에 의해 분석하였다. 감소된 RFP 및 Myc 신호를 표시하지만 SBP 표면 발현에 대해 높은 신호를 표시하는 세포를 분류하고 단일클론으로 확장시켰다. a 및 b) 모 세포(우측)와 비교하여 대표적인 파생 조작된 세포 단일클론 ACL-3426(좌측)을 나타내는 윤곽 플롯. 파생 세포는, 모 세포(Q4 상단 우측 패널)와 비교하여 RFP 및 Myc 신호(Q4 상단 좌측 패널)의 상실을 나타낸다. 파생 조작된 세포 단일클론 ACL-3426은 항-SBP 항체(Q5 하단 우측 패널)로 염색할 때 신호 증가로 나타낸 바와 같이 TEDV-인코딩된 SBP 에피토프 CST를 성공적으로 발현한다. 이러한 결과는 TERS와 TEDV 사이의 CST의 태그-교환으로 인해 예상된 바와 같이, ACL-3426 세포로서 성공적으로 수행된 Flp 재조합효소 매개 태그-교환이 RFP 및 Myc 마커에 대한 신호를 상실하고 SBP 표면 발현을 얻었다는 것을 시사한다. c) C-말단 FLAG-태그를 가지는 통합된 GOI의 발현의 3가지 예를 나타내는 면역블롯. Flag-태그에 대한 항체를 사용하여 면역블롯팅함으로써 GOI(RSV-1 ORF) 발현의 검출을 달성하였다. 모 단일클론주 ACL-1163이 대조군으로 포함되어 있다. CSTE를 3가지 독립적인 실험에서 수행하였고, 이에 의해 세포를 flp 재조합효소를 인코딩하는 구조체; 및 SBP 에피토프 CST 및 RSV-1 P 유전자(생성된 세포주 단일클론은 ACL-3374임)를 인코딩하는 TEDV; 또는 SBP 에피토프 CST 및 RSV-1 N 유전자(생성된 세포주 단일클론은 ACL-3386임)를 인코딩하는 TEDV; 또는 SBP 에피토프 CST 및 RSV-1 M2 긴 유전자(생성된 세포주 단일클론은 ACL- 3433임)를 인코딩하는 TEDV로 형질감염시켰다. 단일클론으로부터 단백질을 추출하고, 마우스 항-Flag 항체를 사용하여 면역블롯팅을 수행하였다. 웨스턴 블롯 결과는, 각각의 GOI의 예상 분자량에 해당하는 각각의 해당 세포에서 단일 밴드의 존재, 및 모 세포주에서 신호의 부재에 의해 입증된 바와 같이 각각의 RSV-1 ORF가 발현되었음을 입증한다.
도 8. 성공적인 태그 교환 사건 후 혼합 세포 집단으로부터 태그2(SBP)의 자기 친화성 세포 분류(MACS) 풍부화 또는 태그1(Myc)의 고갈
이 도면은 표면 태그 기술이 세포의 혼합 집단으로부터 성공적인 태그 교환 사건 후 태그2를 운반하는 세포의 MACS 풍부화 또는 태그1을 운반하는 세포의 고갈에 사용될 수 있음을 나타낸다. 2가지 조작된 단일클론 세포주, 즉 APL-4535 및 APL-3015의 출발 혼합 집단을, MACS를 사용하여 성공적인 태그 교환 사건 후 태그2(SBP)를 발현하는 세포를 풍부화시키거나 태그1(Myc)을 고갈시키는 데 사용하였다. APL-4535 세포 내의 TERS는 SBP 에피토프 CST 및 세포내 단백질을 인코딩하는 전장 FLAG 태그 GOI를 인코딩하는 한편; APL-3015 세포 내의 TERS는 Myc 에피토프 CST 및 RFP 선택 유전자를 인코딩하였다. 2가지 세포 집단을 90%(APL-3015) 대 10%(APL-4535)의 비율로 함께 혼합하고 MACS를 사용하여 SBP 양성 세포를 풍부화시키거나(a) 또는 별도의 실험으로 Myc 양성 세포를 고갈시켰다(b). a) 모든 세포를 항-SBP-알렉사(Alexa) 488 형광단으로 표지하고 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. 샘플을 MACS를 통과시키고 3개의 실험 시점, 즉 풍부화전, 통과(flow through) 및 결합시에 분획을 획득하였다. 3가지 모든 분획을 항-c-Myc-알렉사 405로 대조염색하고 BD 인플럭스(Influx) 기기에서 데이터를 수집하였다. 그래프는 3가지 모든 실험 분획에서 SBP 및 Myc 양성 세포의 백분율을 나타낸다. 사전-MACS 분획은 세포의 시작 집단이 90% Myc 양성 세포 및 10% SBP 양성 세포로 이루어짐을 나타낸다. SBP 양성 세포의 성공적인 풍부화는 통과 분획에서 SBP 신호의 결여에 의해 입증되는 한편(0.01% 초과의 SBP 양성 세포), SBP 표적화된 풍부화 후 결합된 세포의 95%는 SBP 양성이었다. b) 별도의 실험에서, 모든 세포를 항-c-Myc-알렉사 405 형광단으로 표지하고 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. MACS를 사용하여 표지된 세포를 고갈시키고 상기 나타낸 바와 같은 3가지 실험 시점에서 분획을 수집하였다. 3가지 모든 분획을 항-SBP-알렉사 488로 대조염색하고 BD 인플럭스 기기에서 데이터를 획득하였다. 그래프는 3가지 모든 실험 분획에서 Myc 표적화된 고갈 후 SBP 및 Myc 양성 세포의 백분율을 나타낸다. 사전-MACS 분획은 세포의 시작 집단이 90% Myc 양성 세포 및 10% SBP 양성 세포로 이루어짐을 다시 나타내었다. Myc 양성 세포의 성공적인 고갈은 통과 분획에서 Myc 양성 세포의 수(25%) 감소 및 SBP 양성 세포의 수(75%) 증가에 의해 입증되었다. 또한, 결합된 분획은 90% 초과의 Myc 양성 세포 및 5% 미만의 SBP 양성 세포를 포함하였다. c) 총 546개 양성 염색 개별 단일클론을 이들이 SBP-연결 GOI를 인코딩하는지 여부에 대해 평가하였다. 차트는 SBP 양성 세포의 96.52%가 GOI를 통합한 반면, SBP 양성 세포의 3.48%가 GOI를 인코딩하지 않았음을 나타낸다.
결과는 MACS를 사용하여 세포의 혼합 집단으로부터 태그2(SBP) 양성 세포를 풍부화시키거나 태그1(Myc) 양성 세포를 고갈시킬 수 있음을 입증한다. 또한, 태그2(SBP)의 존재는 성공적인 태그 교환 및 GOI 게놈 통합의 지표로서 사용될 수 있다.
도 9. 바코드를 사용하는 세포 표면 태그 교환( CSTE ) 시스템의 구성 및 작동
바코드를 사용한 CSTE 시스템의 개략도. a)는 태그 교환 공여체 벡터(TEDV)의 구성요소를 도시한다. 각각의 TEDV는 구조체의 양쪽 말단에서 RMCE(개방형 및 폐쇄형 삼각형)를 인코딩하고, 이는 TERS 내에 포함되는 RMCE 부위와 쌍을 이룬다. TEDV 구조체의 5' 말단에서 RMCE 요소(폐쇄된 삼각형)는 3' 인트론 단편을 나타내는 서열 내에서 인코딩되며, 여기서 RMCE 요소의 3' 바로 옆에 분지점 서열, 폴리피리미딘 관 및 스플라이스 수용체 부위를 포함하는 인트론의 3' 요소(개방형 원)가 있다. 스플라이스 수용체 부위의 3' 바로 옆에서, TEDV는 세포 표면 태그(CST)의 3' 엑손을 인코딩하며, 이는 엑손이 고유한 분자 결합 모티프를 포함하는 CST의 부분(회색 직사각형)을 인코딩한다는 것을 의미한다. CST 서열은 5'에서 3' 방향으로 인코딩되며, 여기서 TEDV는 또한 3'에서 5' 방향으로 인코딩된 TERS에 통합될 관심 유전자(GOI)(망상선이 표시된 직사각형)를 인코딩한다.
이 실시예에서 각각의 CST는 3가지 잠재적인 고유한 에피토프(A, B, C)의 선택으로부터 2가지 상이한 에피토프로 구성되며, 이는 6가지의 가능한 고유한 조합으로 조합될 수 있다. AB는 BA와 실질적으로 동등하다. 이 실시예에서, AX 조합은 3가지 변이체(GOI a-i, a-ii 및 a-iii)가 있는 GOI 패밀리로 할당되었으며, BX 조합은 3가지 변이체(GOI b-i, b-ii, b-iii)가 있는 제2 GOI 패밀리로 할당되었다. 이 실시예에서 개별 TEDV는 풀링된다. b)는 태그-교환 수용체 부위(TERS)의 구성요소를 도시한다. TERS RMCE 요소는 TEDV의 요소(개방형 및 폐쇄형 삼각형)와 쌍을 이룬다. TERS는 이러한 CST의 5' 바로 옆의 스플라이스 수용체 부위 및 연관된 3' 인트론성 서열(개방형 원)을 이용하여 TEDV-인코딩된 CST(체크무늬의 직사각형)의 것과 구별되는 CST 엑손을 인코딩한다. 유사하게, 선택 유전자(폐쇄형 직사각형)는 TEDV의 GOI와 같이, TERS 내에서 안티센스 방향으로 인코딩된다. 구조체의 5' 말단에서, 프로모터 서열이 포함되어(우측 화살표), CST의 전사를 구동시킨다. 이 프로모터 서열의 3'에 대하여, 3' 바로 옆의 5' 인트론 서열(폐쇄형 원)을 이용하여 막관통 도메인(TD) 엑손이 인코딩된다(개방형 직사각형). TERS-인코딩된 TD-CST 산물(개방형/체크무늬 덤벨)은 세포 표면 상에서 발현된다. TERS 구조체의 3' 말단에 3'에서 5' 방향으로 선택 유전자(폐쇄형 직사각형)의 전사를 구동시키는 별도의 프로모터 요소가 있으며, 이는 선택 유전자(폐쇄형 정사각형)의 발현을 초래한다. c)는 TEDV/TERS에서 쌍을 이루는 RMCE 요소에 특이적인 재조합효소에 대한 적절한 발현 구조체와 함께 TERS를 포함하는 조작된 세포 집단으로 TEDV 풀을 도입하면, RMCE가 실행되고, 다양한 GOI를 발현하는 파생 조작된 세포 집단의 생성이 초래된다는 것을 도시한다. RMCE 동안, TERS-인코딩된 요소는 TEDV-인코딩된 요소로 교환된다. 따라서 파생 세포 집단은 원래 TERS-인코딩된 TD(개방형/회색 덤벨), 및 GOI(망상선이 표시된 정사각형)와 함께 TD-CST 산물로서 세포 표면에서 TEDV-인코딩된 CST를 발현한다. d) RMCE 이후, GOI를 발현하는 조작된 세포의 풀은 고유한 CST 바코드의 발현을 기반으로 FACS를 통해 개별 구성원으로 추가로 단리될 수 있다. 이는 원하는 바코드의 대량 집단, 또는 단일 세포 분류 방법을 통한 개별 세포 단리로서 달성될 수 있다. 대안적으로, 풀의 분석은 디지털 데이터세트 내에서 관심 집단을 확인하기 위한 수단으로서 바코드를 사용하는 분류 없이 FAC를 통해 수행될 수 있다. e) 조작된 세포를 바코딩하는 CSTE 시스템의 사용에 대한 원칙의 증명으로서, CST를 인코딩하는 플라스미드 또는 CST가 없는 대조군 플라스미드를 이용하여, 당업자에게 알려진 표준 방법을 사용하여 화학적 형질감염(ACL-5) 또는 전기천공(ACL-1)을 사용하여 ACL-5 및 ACL-1 세포를 형질감염시켰다. CST는 3가지 고유한 에피토프, 즉 FLAG, MYC 및 HA(서열번호 20으로 표시됨)를 포함하였다. 형질감염 48시간 후, 세포를 수확하고 형광단과 접합된 동족 항체, 즉 항-FLAG-PE, 항-MYC-AF647 및 항-HA-AF488로 염색하였다. 유세포분석법에 의해 세포를 분석하고; 살아있는 세포를 전방 산란(FSC) 및 측면 산란(SSC)에 의해 게이팅하였다. 살아있는 세포의 평균 형광 강도(MFI)를 3가지 에피토프 각각에 대해 결정하고, 각각의 에피토프를 발현하는 살아있는 세포의 백분율을 결정하였다. 빈 벡터와 비교하여 바코딩된 CST를 인코딩하는 플라스미드로 형질감염된 세포에서 높은 비율 및 강도로 3가지 모든 에피토프를 검출하였으며, 이에 의해 다중 에피토프로 구성된 CST의 능력을 입증하였다.
비-제한적인 실시형태의 하기 목록은 본 발명을 추가로 예시한다:
1. 2가지 별도의 구성요소를 포함하는 조합 시스템으로서, 제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(TEDV)이고, 제2 구성요소는 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이며, 쌍을 이루는 재조합효소 매개 카세트 교환(RMCE) 요소는 TEDV 및 TERS에 포함되어 TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현하는, 조합 시스템.
2. 실시형태 1에 있어서, 상기 제1 세포 표면 태그(CST) 엑손은 상기 제2 CST와 상이한 것인 조합 시스템.
3. 실시형태 1 또는 2에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하는 TEDV이되,
CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
4. 실시형태 1 내지 3 중 어느 하나에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소 - 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5'RMCE 요소
b. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편
c. 5'에서 3' 방향으로 TEDV-인코딩된 CST를 포함하는 엑손
d. 5'에서 3' 방향으로 인코딩된 CST에 대한 제1 전사 종결자 서열
e. 3'에서 5'으로 인코딩된 GOI에 대한 제2 전사 종결자
f. 3'에서 5' 방향으로 GOI를 인코딩하는 서열
g. 코작 서열
h. 5' RMCE 요소
를 포함하는 TEDV이고,
여기서, CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
5. 실시형태 1 내지 3 중 어느 하나에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하는 TEDV이고,
여기서, CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
6. 실시형태 1 내지 5 중 어느 하나에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하는 TERS이되,
막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는, 조합 시스템.
7. 실시형태 1 내지 6 중 어느 하나에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 유형 2 막 단백질 막관통 도메인 엑손
d. 5' 인트론 스플라이스 공여체 부위
e. TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소
f. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열
g. 5'에서 3' 방향으로 TERS-인코딩된 CST를 포함하는 엑손(TEDV-인코딩된 CST와 상이함)
h. 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열
i. 3'에서 5' 방향에 대한 전사 종결자 서열
j. 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열
k. 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열
l. 3' RMCE 요소
m. CST 전사체의 발현의 조절 및 추적을 담당하는 3' 게놈 요소
를 포함하는 TERS이고,
여기서, 막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는, 조합 시스템.
8. 실시형태 1 내지 6 중 어느 하나에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하는 TERS이고,
여기서, 막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는, 조합 시스템.
9. 실시형태 1 내지 8 중 어느 하나에 있어서, 상기 TEDV의 제1 RMCE 요소는 TERS의 제1 RMCE 요소와 쌍을 이루고, TEDV의 제2 RMCE 요소는 TERS의 제2 RMCE 요소와 쌍을 이루는, 조합 시스템.
10. 실시형태 1 내지 9 중 어느 하나에 있어서, 각각의 CST 엑손은 하나 이상의 분자 친화성 태그를 인코딩하는 서열을 포함하고 TEDV 및 TERS에 의해 인코딩되는 CST는 상이한, 조합 시스템.
11. 실시형태 1 내지 10 중 어느 하나에 있어서, 상기 조작된 세포는 게놈에 단일 TERS를 포함하는, 조합 시스템.
12. TERS 유전자좌로부터 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 방법으로서,
a. GOI를 인코딩하는 TEDV를 생성하는 단계
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 상기 TEDV를 전달하는 단계
c. TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
d. 통합된 GOI를 가지는 세포의 선택을 위한 프록시로서, 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 TEDV-인코딩된 CST의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함하는, 방법.
13. 실시형태 12에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 TERS-인코딩된 CST의 발현 감소 및 TEDV-인코딩된 CST의 발현 증가를 검출하기 위해 형광 표지되어, 형광 활성화 세포 분류에 의해 상기 발현을 기반으로 세포 분할 및 선택을 가능하게 하는, 방법.
14. 실시형태 12에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 기질에 고정되어, 기질 친화성 방법, 예컨대 자기 활성화 세포 분류를 사용하여 표적 세포 집단에서 TERS-인코딩된 CST를 발현하는 세포를 고갈시킬 수 있거나 TEDV-인코딩된 CST를 발현하는 세포를 풍부화시킬 수 있는, 방법.
15. TEDV의 풀로부터 다양한 TEDV-인코딩된 GOI를 발현하는 다중 파생 조작된 세포를 생성하는 방법으로서,
a. 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계
c. 다중 TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 3가지 이상의 친화성 시약과 세포를 접촉시키는 단계
d. 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 고유한 TEDV-인코딩된 CST 각각의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함하는, 방법.
16. 실시형태 15의 단계 a. 및 b.에 의해 생성된 세포의 풀 내에서 다양한 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 세포 계통 추적 방법으로서,
a. 다수의 TEDV-인코딩된 CST에 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
b. 고유한 TEDV-인코딩된 CST 각각의 발현을 기초로 파생 조작된 세포의 함량을 분석하는 단계
를 포함하는, 방법.
17. - 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계
- 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계
에 의해 생성된 세포의 풀 내에서 다양한 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 세포 계통 추적 방법으로서,
상기 방법은
a. 다수의 TEDV-인코딩된 CST에 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
b. 고유한 TEDV-인코딩된 CST 각각의 발현을 기초로 파생 조작된 세포의 함량을 분석하는 단계
를 포함하는, 방법.
18. 3' 인트론 단편이 측접하는 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는, 태그-교환 공여체 벡터(TEDV).
19. 실시형태 18에 있어서,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하되,
CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 태그-교환 공여체 벡터(TEDV).
20. 조작된 세포로서, 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 세포 표면 태그(CST) 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이되, 재조합효소 매개 카세트 교환(RMCE) 요소는 TERS에 포함되어 TERS와 태그-교환 공여체 벡터(TEDV) 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 관심 유전자(GOI)에 대한 리포터 요소의 교환을 초래하는, 조작된 세포.
21. 실시형태 20에 있어서, 상기 TERS는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하되,
막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는 것인 조작된 세포.
재료 및 방법
조작된 세포주로 TERS의 통합
전기천공을 사용하여 상동성 유도 재조합에 의해 AAVS1 부위로 통합된 단일 TERS 부위를 이용하여 조작된 세포를 생성하기 위해 필요한 DNA 구조체를 전달하였다.
반응 당, 다음 설정의 스퀘어 웨이브(Square Wave) 285 V, 펄스 길이 12.5 ms 및 1 s 간격의 2 펄스를 이용하는 진 펄서 엑스셀(Gene Pulser Xcell)(상표)(바이오-래드(Bio-Rad))을 사용하여 글루타맥스-I(Glutamax-I)(라이프 테크놀로지스(Life Technologies))가 있는 500㎕ RPMI 1640에서 4×106개 세포를 전기천공하였다. 사용된 DNA 농도는 TERS 통합 벡터(V9.F.5)의 경우 15 ㎍/㎕, Cas9-P2A-GFP 인코딩 플라스미드(V1.A.8)의 경우 10 ㎍/㎖, 그리고 통합 부위 AAVS1 부위를 표적으로 하는 gRNA를 인코딩하는 벡터(V2.J.6)의 경우 7.5 ㎍/㎖이었다(표 3).
전기천공 후, 분석 전에 글루타맥스-I + 10% FBS(37℃, 5% CO2)가 있는 배양 배지 RPMI 1640에서 2일 동안 세포를 인큐베이션시켰다.
다클론성 GFP -발현 형질감염 세포의 분류
FACS재즈(FACSJAzz)(상표) 세포 분류기(BD 바이오사이언스(BD Biosciences))를 사용하여, 일시적인 GFP 발현에 대해 Cas9-P2A-GFP(V1.A.8) 또는 GFP 선택 마커를 인코딩하는 플라스미드(V1.A.4)로 전기천공된 세포를 분류하였다. 세포를 세척하고 적절한 부피의 DPBS에 재현탁시킨 후 20% HI-FBS 및 항-항 100X(라이프 테크놀로지스(Life Technologies))와 함께 글루타맥스-I가 있는 RPMI 1640에서 분류하였다.
TERS의 안정적인 발현을 이용한 단일클론성 세포의 분류
FACS를 사용하여 TERS 수용 카세트로부터 발현된 Myc 에피토프 CST 및 RFP 선택 유전자를 구성적으로 발현하는 단일 세포를 수득하였다. Myc CST를 검출하기 위해, 분류 전에 항-Myc 항체(항-c-Myc-알렉사 647, 산타크루즈(SantaCruz))로 세포를 염색하였다. 세포를 DPBS에서 세척한 후 20% HI-FBS 및 항-항 100X(라이프 테크놀로지스)와 함께 글루타맥스-I가 있는 RPMI 1640에서 분류하였다.
벡터
ID 명칭
V1.A.8 SpCas9-2A-GFP
V9.F.5 AAVS-EF1aL-TxnCS-S-STv5a_G-in:FRT:MYC-RFP:F3-EF1a
V2.J.6 AAVSI_sg-sp-opti_3
V12.A.8 M2-진(gene)-롱(Long)_RSV1-FLAG_Tx
V4.I.8 CMVpro_FLPo-sv40pA-V2
표 4에 열거된 필터 세트에 대해 인플럭스(상표)(BD 바이오사이언스) FACS에서 GFP 및 RFP 형광을 검출하였다. Myc 및 RFP를 발현하는 단일 세포를 200㎕의 성장 배지를 포함하는 96-웰 플레이트로 분류하여 단일클론의 집합을 성장시켰다.
FACS 재즈 인플럭스 필터
단백질 형광색소 여기 레이저 검출 필터
Cas9/GFP GFP 488 530/40
RFP RFP 561 585/29
Myc 알렉사647 640 670/30
Myc PE 561 585/29
SBP 알렉사647 640 670/30
SBP 알렉사488 488 530/40
Myc 알렉사405 405 460/50
Flag PE 561 585/29
HA 알렉사488 488 530/40
단일클론성 집단의 표현형 스크리닝
20,000개 세포의 과성장한 단일클론 집단의 샘플을 분석을 위해 마이크로타이터 플레이터로 옮기고, 세포를 250㎕의 DPBS 1×(라이프 테크놀로지스)에 재현탁한 다음 LRS포르테사(LRSFortessa)(상표)(BD 바이오사이언스)에서 분석하였다. 단일클론성 집단(ACL-1163)을 Myc 에피토프 CST 및 RFP의 존재에 대해 스크리닝하였다. 알렉사 플루오르(Alexa Fluor) 647 형광단으로 표지한 항-Myc 항체를 사용하여 Myc 발현을 검출하였다. 100㎕의 염색 완충액(DPBS +2% FBS)에 희석한 권장 항체 부피를 사용하여 염색 용액을 제조하였다. 1시간 동안 4℃에서 세포를 인큐베이션시킨 다음, 분석 전에 500㎕의 염색 완충액으로 2회 세척하였다.
단일클론의 유전형 스크리닝 - 정확한 게놈 위치에서의 통합 확인
글루타맥스-I + 10% HI-FBS와 함께 RPMI 1640의 정상 성장 배지에서 ACL-1163 세포를 유지시켰다. 세포 컨플루언스가 10 내지 12×106에 도달할 때까지 매일 세포 컨플루언스를 모니터링하였다. 퀴아앰프 DNA 미니키트(QIAamp DNA Minikit)(퀴아젠(Qiagen))를 사용하여 5×106개 세포에서 DNA를 추출하였다. 나머지 세포를 추가로 확장시키고 70% 성장 배지 + 20% HI-FBS + 10% DMSO 중에 3×106개 세포/㎖의 밀도로 동결보존하였다.
ACL-1163 모노클론을 스크리닝하고 분자 수준에서 평가하였으며, 이는 표 5 및 6에 각각 열거된 구성요소 및 반응 조건을 사용하여, 20㎕ 반응물 중, Q5(등록상표) 핫 스타트 고-정확도 DNA 중합효소(Hot Start High-Fidelity DNA Polymerase)(NEB)를 사용하는 PCR에 의해 수행하였다. TERS 통합 카세트가 AACS1 유전자좌에 통합되었는지 여부를 결정하기 위해, 각각 좌측 상동성 암의 앞 영역 및 막관통 도메인을 표적화하는, 프라이머 15.F.9 및 19.E.7을 사용하였다(표 7). 2.1 kb 앰플리콘으로 정확한 좌측 상동성 암 재조합을 표시하였다. 처음에, 모든 구성요소(Q5(등록상표) 반응 완충액, dNTP, 핫-스타트 Q5(등록상표) DNA 중합효소, 정방향 및 역방향 프라이머, 100 ng의 DNA 주형 및 H20)로 PCR 마스터 믹스(Master Mix)를 제조하였다. C1000 터치(C1000 Touch)(상표) 온도 순환기(바이오-래드)를 사용하여 PCR 반응을 실행하였다. 파워팩 베이직(PowerPac Basic)(바이오-래드)을 사용하여 1×TAE 완충액 중 1% 아가로스 겔에서 PCR 산물을 실행하고, 사이버세이프(sybersafe)의 10,000배 희석물로 염색한 다음 퓨전 SL(Fusion SL)(빌버 루맷(Vilber Lourmat))으로 분석하였다.
TERS의 통합을 평가하기 위한 PCR 시약
반응 구성요소 반응 당 부피
5x퓨전 완충액(Phusion buffer) 4㎕
DNTP 0.2㎕
퓨전 DNA 중합효소 0.15㎕
15.F.9 0.5㎕
19.E.7 0.5㎕
H20 최대 20㎕
DNA(100 ng) 1㎕(100 ng/㎕)
DMSO 3% 0.6㎕
PCR 주기 조건
단계 온도 시간
초기 변성 98℃ 30초
30 주기 98℃
62℃
72℃
10초
1:10분
15초
최종 연장 72℃ 10분
프라이머
ID 명칭 서열
1.I.7 turboRFP_GT_F1 GAGAGGCCATTCTCAGATGG
1.I.8 turboRFP_GT_R1 CGGGCATCTTCAGGTTCTTG
1.I.9 turboRFP_프로브_FAM CTACCTGCACTGCTCCTTCAAGACC
10.A.10 TRAC_TCRA-프로모터_F1 CTGATCCTCTTGTCCCACAGATA
10.B.6 TRAC_프로브(HEX) ATCCAGAACCCTGACCCTGCCG
15.F.9 AAVS1_GT_F5 ACTCTGCCCTCTAACGCTG
19.E.7 AMPN-TMD_GT_R1 GCTGATGTAGAAGCCCTTGG
21.G.5 ORF-AM_GT_F2 TTCTGTAGCTCCATTGGCAG
21.G.8 ORF-AM_GT_R1 ATCCGTATGGTGACAAGACG
유전자 복제 번호 확인
세포 게놈 내에 통합된 다수의 TERS 카세트에 대하여 선택된 단일클론의 DNA를 평가하였다. 이를 달성하기 위해, TERS 카세트 및 참조 유전자(TRAC)에 특이적인 프라이머 및 프로브를 사용하여 드롭렛 디지털 PCR(Droplet Digital PCR; ddPCR)을 수행하였다(표 8). TERS 특이적 프로브를 FAM과 접합시키고, 참조 유전자 특이적 프로브를 HEX와 접합시켰다. 통합 복제 수는 ACL-1163 세포가 참조 유전자(TRAC)에 대하여 이배체인 것을 고려하였다. ddPCR 전에, MfeI(NEB)를 이용하여 DNA를 분해하여 직렬(tandem) 통합체를 분리하였다. 반응 설정 및 사이클링 조건은 QX200(상표) 드롭렛 판독기 및 드롭렛 생성기 및 C1000 터치(상표) 딥-웰 온도 순환기(바이오-래드)를 사용하여, 프로브용 ddPCR(상표) 슈퍼믹스(Supermix)(dUTP가 없음)(바이오-래드)에 대한 프로토콜에 따랐다. 퀀타소프트(QuantaSoft)(상표) 소프트웨어를 사용하여 데이터를 획득하고, Ch1을 사용하여 FAM를 검출하고 HEX에 대하여 Ch2를 사용하였다.
ddPCR 프라이머 / 프로브
ID 명칭 서열
1.I.7 터보(turbo)RFP_GT_F1
GAGAGGCCATTCTCAGATGG
1.I.8 터보RFP_GT_R1 CGGGCATCTTCAGGTTCTTG
1.I.9 터보RFP_프로브_FAM CTACCTGCACTGCTCCTTCAAGACC
10.A.9 TRAC-TCRA-ex1-F1
CTGATCCTCTTGTCCCACAGATA
10.A.10 TRAC-TCRA-ex1-F1
GACTTGTCACTGGATTTAGAGTCTCT
10.B.6 TRAC-프로브(HEX) ATCCAGAACCCTGACCCTGCCG
파생 조작된 세포주에서 GOI 서열의 Flp -매개 통합
전기천공을 사용하여 Flp 재조합효소 매개 태그 교환을 촉진시키는 데 필요한 DNA 구조체를 전달하였다. 반응 당, 다음 설정을 이용하는 진 펄서 엑스셀(상표)(바이오-래드)을 사용하여 글루타맥스-I(라이프 테크놀로지스)가 있는 500㎕ RPMI 1640에서 4×106개 세포를 전기천공하였다: 스퀘어 웨이브 285 V, 펄스 길이 12.5 ms 및 1 s 간격의 2 펄스. 사용된 DNA 농도는 TEDV 벡터(V9.F.5)의 경우 7.5 ㎍/㎕, FLPO 인코딩 플라스미드(V12.A.8)의 경우 10 ㎍/㎖, 그리고 DNA 전달의 추적을 위한 GFP를 인코딩하는 벡터(V1.A.4)의 경우 7.5 ㎍/㎖이었다(표 3).
전기천공 후, 분석 및 GFP 양성 세포의 세포 분류 전에 글루타맥스-I + 10% FBS(37℃, 5% CO2)가 있는 배양 배지 RPMI 1640에서 2일 동안 세포를 인큐베이션시켰다.
태그 교환을 위한 표현형
Flp 재조합효소 매개 태그 교환이 일어났는지 여부를 결정하기 위해, Myc 및 SBP의 표면 발현에 대해 세포를 염색하고 RFP 형광 강도에 대해 측정하였다.
전기천공 7 내지 10일 후, 세포를 수확하고, 다음 항체(항-SBP-알렉사647 및 항-c-Myc-알렉사PE, 산타크루즈)를 사용하여 SBP 및 Myc에 대해 표면 염색하였다. 표 4에 열거된 필터 세트에 대해 인플럭스(상표)(BD 바이오사이언스) FACS에서 GFP 및 RFP 형광을 검출하였다.
SBP를 발현하지만 Myc 및 RFP를 발현하지 않는 단일 세포를 200㎕의 성장 배지를 포함하는 96-웰 플레이트 내로 분류하여 단일클론 집합을 성장시켰다.
단일 세포를 분류하고 20 내지 24일 후에 단일클론의 표현형을 수행하였다. 유세포 분석을 위해, 웰에서 세포를 옮기고 튜브 당 300㎕의 RPMI를 첨가하였다. 세포를 400 g로 4℃에서 3분 동안 원심분리하였다. 상청액을 흡인하고 세포 펠릿을 25㎕ 염색 혼합물 또는 RPMI(비염색 대조군)에 재현탁시킨 다음(염색 혼합물: 항-SBP-알렉사647 및 항-c-Myc-알렉사PE), 4℃에서 30분 동안 인큐베이션시켰다. 염색 완충액(SB)(DBPS + 2% FBS)으로 세포를 2회 세척하고 400 g에서 3분 동안 원심분리하였다. 세포를 200㎕의 SB에 재현탁시키고 LSR포르테사(LSRFortessa)에서의 데이터 획득을 위해 96-웰 플레이트로 옮겼다. 플로우조(FlowJo)를 사용하여 분석을 수행하였다.
GOI 발현 확인
세포를 성장시키고 수확한 다음 세포를 150 mM NaCl, 50 mM 트리스(Tris) pH 8, 1% CHAPS, 5 mM 이미다졸, 1 mM PMSF, 1× 프로테아제 및 포스파타제 억제제(써모(Thermo))를 이용하여 20분 동안 4℃의 로터 상에서 세포를 용해시켰다. 용해물을 4℃에서 10분 동안 17000 g에서 원심분리에 의해 제거하고 10% 아크릴아마이드 프리-캐스트 겔(바이오래드(Biorad)) 상에서 140 V에서 1시간 동안 소듐 도데실 설페이트(SDS) 겔 전기영동을 실시하였다. 셀을 PVDF 막(바이오래드) 상에 터보 블롯팅한 다음, 트리스 완충 식염수/트윈 20(TBST) 1× 중 시 블록(Sea block) 1×(써모)에서 15분 동안 차단시키고 실온에서 2시간 동안 마우스 항-플래그 항체(시그마(Sigma))와 함께 인큐베이션시켰다. TBST 1×에서 5분 동안 결합하지 않은 1차 항체 3×로부터 막을 세척하고 항-마우스 호스래디쉬 퍼옥시다제(HRP)-접합 염소 항체와 함께 실온에서 1시간 동안 인큐베이션시켰다. TBST 1× 중에서 5분 동안 결합하지 않은 2차 항체 3×로부터 막을 마지막으로 세척하고 마지막으로 HRP 신호를 ECL 기질(바이오래드)로 발색시키고 퓨전 SL 빌버 시스템(Fusion SL Vilber system)을 이용하여 획득하였다.
GOI 게놈 통합 확인
GOI 코딩 서열의 공동통합을 위해 분자 수준에서 세포 표면 태그 2(SBP)를 발현하는 단일클론 세포주를 분자 수준에서 평가하였다. 이는 각각 표 9 및 10에 열거된 구성요소 및 반응 조건을 사용하여 30㎕ 반응물에서 Q5(등록상표) 핫 스타트 고-정확도 DNA 중합효소(NEB)를 사용하는 PCR에 의해 수행하였다. GOI가 게놈 내에 통합되었는지 여부를 결정하기 위해, GOI의 3' UTR 영역을 표적으로 하는 프라이머 12.G.5 및 21.G.8을 사용하였다(표 7). 처음에, 모든 구성요소(Q5(등록상표) 반응 완충액, dNTP, 핫-스타트 Q5(등록상표) DNA 중합효소, 정방향 및 역방향 프라이머, 100 ng의 DNA 주형 및 H2O)로 PCR 마스터 믹스를 제조하였다. C1000 터치(상표) 온도 순환기(바이오-래드)를 사용하여 PCR 반응을 실행하였다. 파워팩 베이직(바이오-래드)을 사용하여 1×TAE 완충액 중 1% 아가로스 겔에서 PCR 산물을 실행하고, 사이버세이프의 10,000배 희석물로 염색한 다음 퓨전 SL(빌버 루맷)으로 분석하였다. 생어(sanger) 서열에 의해 GOI 3' UTR의 서열을 인코딩하는 것으로 정확한 크기의 밴드를 확인하였다.
PCR 믹스
시약 Per/반응(㎕) 96개 샘플에 대한 마스터 믹스
5X퓨전 HF 완충액 6 660
DNTP 0.3 33
퓨전 핫 스타 폴(Phusion Hot Star pol) 0.3 33
21.G.5 ORF-AM_GT_F2(100μM) 스톡 0.15 55
21.G.8 ORF-AM_GT-R1(100μM) 스톡 0.15 55
H20 20.4 2244
세포 샘플 2 NA
PCR 조건
단계 온도 시간 사이클 수
초기 변성 98℃ 30초 1
변성 98℃ 10초 35
어닐링 62℃ 20초
연장 72℃ 10초
최종 연장 72℃ 5분 1
유지 12℃ 유지 1
표면 태그를 발현하는 세포의 MACS 풍부화 /고갈
일반적으로 풍부화/고갈을 위한 제조업체의 MACS 프로토콜을 따랐다(밀테니 바이오테크(Miltenyi Biotec), #130-047-101,IM0001377.PDF).
샘플 준비
세포를 수확하고 염색 완충액-M(SB-M - 차가운 둘베코(Dulbecco) 포스페이트 완충 식염수(DPBS), 2% FBS, 2mM EDTA)에서 원심분리(4℃에서 3분 동안 300×g)에 의해 1회 세척하였다. 40-㎛ 세포 스트레이터를 통해 SB-M 재현탁된 세포를 여과하여 단일 세포 현탁액을 수득하였다. 3 ㎖ 차가운 SB-M으로 세포를 세척하고 세포 펠릿을 수집하였다. 1000만개의 세포 당 적절한 항체 또는 죽은 세포 제거 시약을 포함하는 80㎕ 염색 용액을 사용하고 4℃에서 30분 동안 샘플을 인큐베이션시켰다. 3 ㎖ SB-M 완충액으로 세포를 2회 세척하고 펠릿화하였다.
자기 비드 표지화
160㎕ SB-M에서 세포를 재현탁시키고 항-마우스 IgG1 MACS 마이크로비드(밀테니)의 첨가에 의해 펠릿화한 세포를 자기 비드로 표지하였다(1000만개 세포 당 40㎕ MACS 마이크로비드를 첨가함). 4℃에서 20분 동안 인큐베이션시킨 후, 세포를 3 ㎖ SB-M으로 세척하고, 마지막으로 500㎕ SB-M 중에 재현탁시켰다.
자기 분리
적합한 MACS 분리기(밀테니)의 자기장에 LS 컬럼(밀테니)을 놓고 3 ㎖ SB-M으로 헹구었다. 또한 사전 MACS 분획을 수집하였다. 세포 현탁액을 컬럼에 추가하고 표지되지 않은 세포를 포함하는 통과 분획을 15 ㎖ 원뿔형 튜브 내로 수집하였다(이를 통과 분획이라고 지칭함). 컬럼을 분리기에서 제거하고 적합한 수집 튜브에 넣었다. 5 ㎖ SB-M을 자기로 표지한 세포를 포함하는 컬럼에 첨가하였다. 제공된 플런저를 사용하여, 플런저가 컬럼의 바닥에 도달할 때까지 압력을 가하였다. 자기로 표지한 세포를 컬럼으로부터 용출시키고(이를 결합 분획이라고 지칭함) 분획을 하류 적용에 사용하였다.
실시예 1 - 조작된 세포주에 TERS의 통합
이 실시예는 게놈에 단일 TERS를 포함하는 조작된 세포주 단일클론 ACL-1163을 생성하기 위해 세포주로 TERS를 안정적으로 통합시키는 것을 기재한다.
이 실시예에서, 서열번호 1로 제시된 TERS는 2가지 유전자를 인코딩하는 다음의 선택된 유전 요소로 구성되었다. 센스 방향으로 인코딩된 제1 유전자는 2개의 엑손에 걸쳐 인코딩된 ORF의 상류에 있는 EF1a 프로모터로 구성된다. 제1 엑손은 막관통 유형 II 단백질 도메인(TD)을 인코딩하고 제2 엑손은 Myc 에피토프 태그를 인코딩한다. 2개의 엑손 사이의 인트론은 인간 GAPDH 유전자에서 유래되었으며, 5' 인트론 스플라이스 공여체 부위와 인트론 분지점 서열 사이의 제1 이종특이적 FRT 부위(FRT)를 인코딩하도록 변형된다. OFR의 3' 말단은 SV40 폴리아데닐화 신호 종결자를 인코딩한다. 안티센스 방향으로 인코딩된 제2 유전자는 형광 리포터인 RFP를 인코딩하는 ORF의 상류에 있는 EF1a 프로모터로 구성된다. 코작 서열과 프로모터 사이의 영역은 제2 이종특이적 FRT 부위(F3)를 인코딩한다. RFP ORF의 3' 말단은 bGHpA 폴리아데닐화 신호 종결자를 인코딩한다.
게놈 세이프 하버 유전자좌(genomic safe harbor locus)인 AAVS1로 TERS의 안정적인 게놈 통합을 촉진시키기 위해, 플라스미드를 구축하였으며, 여기서 TERS의 DNA 요소는 AAVS1 좌측 및 우측 상동성 암으로 측접되었다. 각각의 암은 AAVS1 게놈 유전자좌에 상동성인 500 bp 초과의 서열로 구성되었다. TERS의 안정적인 통합은 게놈 세이프 하버 유전자좌인 AAVS1에서 상동성 유도 재조합(HDR)의 과정을 통해 달성되었다.
AAVS1 좌측 및 우측 상동성 암이 측접한 TERS 유전 요소를 인코딩하는 플라스미드, AAVS1 유전자좌를 표적으로 하는 최적의 gRNA를 인코딩하는 플라스미드, 및 Cas9-P2A-GFP를 인코딩하는 플라스미드로 ACL-128 세포주를 형질감염시켰다. Cas9-P2A-GFP 플라스미드 흡수에 양성인 세포를 2일 후 GFP 형광을 기준으로 FACS 분류하였다. GFP 분류된 세포를 7일 초과 동안 추가로 확장시켰다. 항-Myc 항체로 TERS-형질감염된 세포를 염색하고 RFP 및 Myc 에피토프 CST의 존재에 대하여 유세포분석으로 분석하였다(도 6a). 게놈에 TERS를 통합한 세포는 RFP 및 Myc 신호의 증가를 나타내었다. 단일클론의 집합을 나타내도록 이들 세포를 분류하고 확장시켰다. 도 6b에 나타낸 대표적인 단일클론인 ACL-1163은 RFP 및 Myc 표면 발현의 일정하고 강력한 발현을 보였다. 표적화된 AAVS1 부위에 게놈 수신기 카세트가 통합되었는지 결정하기 위해, 선택된 ACL-1163 세포주로부터 게놈 DNA를 추출하고 TERS 수신 카세트에 대한 내부 프라이머 및 AAVS1 유전자좌에 특이적인 프라이머(15.F.9 및 19.E.7, 표 7 참조)를 이용하여 PCR 반응을 수행하였다. 예상된 크기의 PCR 앰플리콘이 검출되었다(데이터는 나타내지 않음). 또한, 프라이머 및 프로브(정방향 프라이머 1.I.7, 역방향 프라이머 1.I.8, 프로브 1.I.9, 표 8 참조)를 이용한 ddPCR로 TERS 수신 카세트의 오직 단일 복사체만이 통합되었음을 확인하였다(데이터는 나타내지 않음).
생성된 조작된 세포주인 ACL-1163은 적합하게 쌍을 이루는 TEDV를 이용하는 RMCE용으로 설계된 TERS의 단일 복사체를 포함하였다.
실시예 2 - 파생 조작된 세포를 생성하기 위한 GOI의 태그-교환 및 전달과 함께 TEDV를 이용한 RMCE의 실행
이 실시예는 TEDV-인코딩된 서열과 TERS 사이의 RMCE 구동 반응인 CSTE 시스템의 실행이 세포 표면에서 CST의 전환을 초래하여, TEDV-인코딩된 서열 및 카고(cargo) GOI를 통합하는 교환된 구조체를 보고한다는 것을 보여준다. 본 실시예에서, 표적 조작된 세포주로서 상기 기재된 ACL-1163을 사용하였다.
현재 실시예에서 TEDV는 센스 방향으로 제1 이종특이적 FRT 부위(FRT); 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편; 스트렙트아비딘 결합 펩타이드(SBP)를 인코딩하는 엑손 및 SV40 폴리아데닐화 신호 종결자를 인코딩한다. 호흡기 세포융합 바이러스(RSV)로부터 유래된 3가지 개별 GOI는 개별 TEDV에서 안티센스 방향으로 인코딩되며, 각각의 GOI ORF는 제2 이종특이적 FRT 부위(F3)와 3' bGHpA 폴리아데닐화 신호 종결자 사이에 위치한다. 서열번호 3 내지 서열번호 5의 서열은 3가지 독립적인 SBP 에피토프 CST 및 사용된 TEDV 구조체를 인코딩하는 GOI를 나타낸다.
본 실시예에서, TEDV(서열번호 3 내지 서열번호 5의 서열로부터 선택됨) 및 RMCE 재조합 효소의 발현을 인코딩하는 벡터(FLPO, V4.1.8, 표 3, 서열번호 2)로 실시예 1에서 작제된 조작된 세포주인 ACL-1163을 전기천공하였다. 7 내지 10일 동안 세포를 인큐베이션시켜 통합 커플이 발생할 수 있도록 한 다음, 항-Myc 및 항-SBP 항체로 염색하고 RFP, Myc 및 SBP 리포터 신호에 대해 유세포분석법으로 분석하였다. RFP 및 Myc 신호는 감소했지만 SBP 신호는 증가하여 '태그 교환'을 나타내는 세포를 분류하고 확장시켜 단일클론의 집합을 나타내었다. 대표적인 단일클론인 ACL-3426의 특징은 도 7a 및 7b에 도시되어 있다. 성공적인 표면 태그 교환을 확인하기 위해, 단일클론 ACL-3426을 Myc에 대한 항체 및 SBP에 대한 항체로 염색하고 RFP 및 표면 Myc 발현의 손실(도 7a) 및 SBP 신호의 획득(도 7b)에 대해 유세포분석법에 의해 분석하였다. 실제로, CSTE를 수행한 세포는 SBP를 표시하지만 Myc 또는 RFP 신호를 표시하지 않음으로써 성공적인 태그-교환을 나타내었다. 모 세포를 동시에 분석하였고 RFP 및 Myc(도 7a 우측 패널) 둘 다에 대해 지속적으로 높은 신호 및 낮은 SBP 신호(도 7b 우측 패널)를 나타내었다.
CSTE 다음에, GOI ORF가 통합되고 발현되고 있음을 입증하기 위해, 별개의 RSV-1 GOI를 인코딩하는 상기 기재한 각각의 TEDV를 사용하여 독립적인 실험으로부터의 3가지 단일클론을 면역블롯에 의해 평가하였다(도 7c). TEDV가 제공한 각각 Flag-태그를 인코딩하는 GOI ORF에는 RSV-1 유래의 3가지 유전자, 즉 P, N 유전자 및 M2 유전자(롱)가 있었다. CSTE를 수행하고, 이에 의해 flp 재조합효소를 인코딩하는 구조체 및 TEDV; SBP 에피토프 CST 및 RSV-1 P 유전자(생성된 세포주 단일클론은 ACL-3374임); 또는 SBP 에피토프 CST 및 RSV-1 N 유전자를 인코딩하는 TEDV(생성된 세포주 단일클론은 ACL-3386임); 또는 SBP 에피토프 CST 및 RSV-1 M2 롱 유전자를 인코딩하는 TEDV(생성된 세포주 단일클론은 ACL- 3433임)로 세포를 형질감염시켰다. 단일클론으로부터 단백질을 추출하고, 마우스 항-Flag 1차 항체를 사용하여 샘플을 면역블롯팅한 다음, 항-마우스 호스래디쉬 퍼옥시다제(HRP)-접합 염소 항체와 함께 인큐베이션시켰다. HRP 신호를 ECL 기질로 발색시켰다. 각각의 GOI에 대한 예상 분자량의 플래그에 대해 양성인 단일 밴드의 존재에 의해 성공적인 CSTE를 입증하였다(도 7c의 레인 2 내지 4). 모 세포를 동시에 분석하였고 Flag-태그 신호의 부재를 나타내었다(도 7c의 레인 5).
요약하면, 이 실시예는 세포 표면 태그-교환이 초기 TERS 구조체의 존재, 및 RMCE의 실행 시 TEDV-인코딩된 서열을 포함하는 교환된 구조체를 조건부로 기록하고, GOI 자체의 검출과는 독립적으로 GOI 통합 및 발현을 보고하는 데 사용될 수 있음을 입증한다.
실시예 3 - 성공적인 태그 교환 사건 후 혼합 조작된 세포 집단으로부터 태그2(SBP)의 풍부화 또는 태그1(Myc)의 고갈의 자기 친화성 세포 분류(MACS)
이 실시예는 표면 태그 기술이 태그 2(SBP)의 MACS 풍부화 또는 태그1(Myc)의 고갈에 사용될 수 있음을 입증한다. 추가적으로, 태그2(SBP)의 존재는 성공적인 태그 교환 사건 후 관심 유전자(GOI)의 포함을 모니터링하는 데 사용될 수 있다. 2가지 조작된 단일클론 세포주인 APL-3015 및 APL-4535의 출발 혼합 집단을 사용하였다. 세포 집단을 90% Myc 양성 APL-3015 세포 및 10% SBP 양성 APL-4535 세포로 혼합하였다. APL-4535 세포 내의 태그-교환 수용체 부위(TERS)는 SBP 에피토프 CST 및 세포내 단백질을 인코딩하는 전장 FLAG 태그 GOI를 인코딩하는 반면, APL-3015 세포 내의 TERS는 Myc 에피토프 CST 및 RFP 선택 유전자를 인코딩하였다. 자기 친화성 세포 분류(MACS)를 사용하여 혼합 집단으로부터 SBP 양성 APL-4535 세포를 풍부화시켰다. 별도의 실험에서, MACS를 사용하여 혼합 집단으로부터 Myc 양성 APL-3015 세포를 고갈시켰다.
첫 번째 경우에서, 혼합 세포 집단을 항-SBP-알렉사 488 형광단으로 표지한 다음 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. SBP 표지화 세포를 MACS를 사용하여 풍부화시키고 항-c-Myc-알렉사 405 형광단으로 대조염색하였다. 도 8a는 3가지 실험 단계, 즉 1) 혼합 세포 집단에서 SBP 및 Myc 양성 세포의 출발 비율을 보장하기 위한 사전-MACS 단계, 2) 컬럼이 자기장에 있을 때 MACS 컬럼에 의해 포획되지 않은 SBP 및 Myc 양성 세포의 백분율을 평가하기 위한 통과 단계, 3) MACS 컬럼에 의해 포획된 SBP 및 Myc 양성 세포의 백분율을 평가하는 데 사용되는 결합 분획 단계에서 SBP 및 Myc 양성 세포의 백분율을 도시한다. 3가지 모든 분획을 항-c-Myc 알렉사 405 형광단으로 대조염색하고 BD 인플럭스 기기에서 데이터를 획득하였다. 도 8b는 통과 분획에서 SBP 양성 세포의 결여에 의한 SBP 양성 세포의 성공적인 풍부화를 입증한 반면(<0.01), SBP 표적화된 농축화 후 결합된 세포의 95%는 SBP 양성이었다.
혼합 세포 집단으로부터 태그1(Myc)을 발현하는 기본 세포주를 MACS-고갈시키는 표면 태그 기술의 사용을 입증하기 위해 모든 세포를 항-c-Myc-알렉사 405 형광단으로 표지하고 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. 표지된 세포를 MACS를 사용하여 고갈시키고 분획은 나타낸 바와 같이 수집하였다. 3가지 모든 분획을 항-SBP-알렉사 488로 대조염색하고 BD 인플럭스 기기에서 데이터를 획득하였다. Myc 양성 세포의 성공적인 고갈은 통과 분획에서 Myc 양성 세포 수(25%)의 감소 및 SBP 양성 세포 수(75%)의 증가에 의해 입증되었다.
추가적으로, 태그2(SBP)의 존재가 성공적인 태그 교환 사건 후 GOI의 포함을 모니터링하는 리포터로서 사용될 수 있음을 입증하기 위해, 총 546개 SBP 양성 개별 단일클론이 SBP-연결 GOI를 인코딩하는지 여부를 평가하였다. 도 8c의 차트는 SBP 양성 세포의 96.52%가 GOI를 인코딩한 반면, SBP 양성 세포의 3.48%는 GOI를 발현하지 않았음을 나타낸다.
결과는 표면 태그 기술이 성공적인 태그 교환 후 혼합 세포 집단으로부터 태그2(SBP)를 발현하는 단일클론의 풍부화 또는 비변형 기본 주(태그1(Myc)을 발현하는 단일클론)의 고갈에 적합하다는 것을 입증한다. 또한, 태그2(SBP)의 존재는 성공적인 태그 교환 사건 후 GOI의 포함과 상관관계가 있으며, 따라서 세포 표면의 태그2(SBP)의 존재는 조작된 세포주 내에서 GOI가 TERS 내로 성공적으로 전달되었음을 나타내는 지표로서 사용될 수 있다.
실시예 4 - 바코드를 사용하는 세포 표면 태그 교환(CSTE) 시스템의 구성 및 작동.
이 실시예는 GOI를 발현하는 조작된 세포를 바코딩하기 위해 CSTE 시스템을 사용하는 개념의 개략도를 설명한다.
도 9는 GOI를 발현하는 세포를 바코딩하기 위해 CSTE 시스템을 사용하는 개략도이다. 패널 a 및 b는 각각 태그 교환 공여체 벡터(TEDV)의 풀, 및 태그-교환 수신가 부위(TERS)를 포함하는 조작된 세포와 함께 시스템 구성요소를 도시한다.
각각의 TEDV는 구조체의 5' 및 3' 말단에서 RMCE 요소를 인코딩하며, 상기 RMCE 요소는 TERS 내에 포함된 RMCE 부위와 쌍을 이룬다. TEDV 구조체의 5' 말단에 있는 RMCE 요소는 3' 인트론 단편을 나타내는 서열 내에서 인코딩되며, 여기서 RMCE 요소의 3' 바로 옆에 분지점 서열, 폴리피리미딘 관 및 스플라이스 수용체 부위를 포함하는 인트론의 3' 요소가 있다. 따라서, RMCE는 '비-기능성' 및 비-코딩 인트론 서열 내에 포함되고, TEDV 내에 포함된 3' 인트론 단편에는 5' 스플라이스 공여체 부위가 없다. 스플라이스 수용체 부위의 3' 바로 옆에서, TEDV는 세포 표면 태그(CST)의 3' 엑손을 인코딩하며, 이는 엑손이 고유한 분자 결합 모티프를 포함하는 CST의 부분을 인코딩한다는 것을 의미한다. CST 서열은 5'에서 3' 방향으로 인코딩되며, 여기서 TEDV는 또한 3'에서 5' 방향으로 인코딩된 TERS에 통합될 관심 유전자(GOI)를 인코딩한다.
이 실시예에서 각각의 CST는 3가지 잠재적인 고유한 에피토프(A, B, C)의 선택으로부터 2가지 상이한 에피토프로 구성되며, 이는 6가지의 가능한 고유한 조합으로 조합될 수 있다. 각각의 에피토프의 배열은 현재 기법을 통해 구별하기 어렵기 때문에, AB는 BA와 실질적으로 동등하다. 이 실시예에서, AX 조합은 3가지 변이체(GOI a-i, a-ii 및 a-iii)가 있는 GOI 패밀리로 할당되었으며, BX 조합은 3가지 변이체(GOI b-i, b-ii, b-iii)가 있는 제2 GOI 패밀리로 할당되었다. 이 실시예에서 개별 TEDV는 풀링된다(도 9a).
조작된 세포 내에 포함된 TERS의 중심 부분은, 동일한 아키텍처를 가지지만, TEDV의 것과 구별되는 요소를 인코딩한다. 즉, TEDV의 것과 쌍을 이루는 RMCE 요소 사이에서, TERS는 TEDV-인코딩된 CST의 5' 바로 옆의 스플라이스 수용체 부위 및 연관된 3' 인트론성 서열을 이용하여 TEDV-인코딩된 CST의 것과 구별되는 CST 엑손을 인코딩한다. 유사하게, 선택 유전자는 TEDV의 GOI와 같이, TERS 내에서 안티센스 방향으로 인코딩된다. 구조체의 5' 말단에서, 프로모터 서열이 포함되어, CST의 전사를 구동시킨다. 이 프로모터 서열의 3'에 대하여, 3' 바로 옆의 5' 인트론 서열을 이용하여 막관통 도메인(TD) 엑손이 인코딩된다. 이는 인트론을 포함하는 RMCE 요소와 프레임 내에서 인코딩되는 TD 엑손 및 CST 엑손이 단일 코딩 mRNA로 엑손을 인접시키도록 스플라이싱되는 연속 전사체로서 생성된다는 것을 의미한다. TERS-인코딩된 TD-CST 생성물은 세포 표면 상에서 발현된다. TERS 구조체의 3' 말단에 3'에서 5' 방향으로 선택 유전자의 전사를 구동시키는 별도의 프로모터 요소가 있으며, 이는 선택 유전자의 발현을 초래한다(도 9b).
TEDV/TERS에서 쌍을 이루는 RMCE 요소에 특이적인 재조합효소에 대한 적절한 발현 구조체와 함께 TERS를 포함하는 조작된 세포 집단으로 TEDV 풀을 도입하면, RMCE가 실행되고, GOI를 발현하는 파생 조작된 세포의 풀의 생성이 초래된다(도 9c). TERS-인코딩된 요소는 TEDV-인코딩된 요소로 교환되었다. 따라서 파생 조작된 세포는, 원래 TERS-인코딩된 TD, 및 GOI와 함께 TD-CST 산물로서 세포 표면에서 TEDV-인코딩된 CST를 발현한다.
전반적으로, TEDV의 풀과 TERS 사이의 RMCE의 실행은 선택 유전자와 원래 TERS-인코딩된 CST의 발현을 상실한 조작된 세포의 파생 풀의 생성을 초래하고, 상기 풀의 각각의 세포는 TEDV 풀로부터 TEDV-인코딩된 CST 및 GOI의 구성원 중 하나의 발현을 얻었다. GOI를 발현하는 조작된 세포의 풀은, 예를 들어 고유한 CST 바코드의 발현을 기반으로 FACS를 통해 단리되어 개별 구성원으로 추가로 분석/단리될 수 있다(도 9d). 이는 원하는 바코드의 대량 집단, 또는 예를 들어 단일 세포 분류 방법을 통해 개별 세포 단리로서 달성될 수 있다. 대안적으로, 풀의 분석은, 예를 들어 변이 GOI 발현 또는 세포 기능을 상호관련시키기 위한 세포 기능의 2차 분석과 함께 디지털 데이터세트 내에서 관심 집단을 확인하기 위한 수단으로서 바코드를 사용하여 분류 없이 FAC를 통해 수행될 수 있다.
CST가 다중 에피토프로 구성될 수 있다는 개념을 입증하기 위해, ACL-1 및 ACL-5 세포를 CST를 인코딩하는 플라스미드 또는 CST가 없는 대조군 플라스미드로 형질감염시켰다(도 9e). CST는 3가지 고유한 에피토프, 즉 FLAG, MYC 및 HA로 구성되었으며, 서열번호 20의 서열로 표현된다. 당업자에게 알려진 표준 방법을 사용하여 화학적 형질감염(ACL-5) 또는 전기천공(ACL-1)을 사용하여 세포를 형질감염시켰다. 48시간 후에 세포를 수확하고 형광단과 접합된 동족 항체, 즉 항-FLAG-PE, 항-MYC-AF647 및 항-HA-AF488로 염색하였다. 유세포분석법에 의해 세포를 분석하고, 살아있는 세포를 전방 산란(FSC) 및 측면 산란(SSC)에 의해 게이팅하였다. 살아있는 세포의 평균 형광 강도(MFI)를 3가지 에피토프 각각에 대해 결정하고, 각각의 에피토프를 발현하는 살아있는 세포의 백분율을 결정하였다. 빈 벡터와 비교하여 바코딩된 CST를 인코딩하는 플라스미드로 형질감염된 샘플에서 세포에 대하여 높은 비율 및 강도로 3가지 모든 에피토프를 검출하였으며, 이에 의해 다중 에피토프로 구성된 CST의 능력을 입증하였다.
결과는 CST가 다중 에피토프로 구성될 수 있기 때문에 표면 태그 기술이 세포주의 바코딩에 적합하다는 것을 입증한다.
약어 목록
AAVS1 아데노-연관 바이러스 통합 부위 1
APC 항원-제시 세포
Cas9 CRISPR-연관 유전자 9
CMV 거대세포 바이러스
cre Cre 재조합효소
CRISPR 뭉쳐있고 규칙적으로 반복되는 짧은 회문 구조 반복 서열
CST 세포 표면 태그
CSTE 세포 표면 태그 교환
DMSO 다이메틸 설폭사이드
DNA 데옥시리보핵산
DPBS 둘베코 포스페이트 완충 식염수
DSB 이중-가닥 손상
dUTP 데옥시우리딘 트라이포스페이트
EDTA 에틸렌다이아민테트라아세트산
EF1 알파 신장 인자 알파(진핵세포 번역용)
FACS 형광-활성화 세포 분류
FAM 플루오레세인 아미다이트
FBS 소태아혈청
FLP 플립파제
FRT 플립파제 인식 표적
GFP 녹색 형광 단백질
GOi. 관심 유전자
gRNA 가이드 리보핵산
HDR 상동성 유도 재조합
HLA 인간 백혈구 항원
IRES 내부 리보솜 진입 부위
MACS 자기-활성화 세포 분류
NEB 뉴잉글랜드 바이오랩스(New England biolabs)
NHEJ 비-상동성 말단 봉합
ORF 오픈 리딩 프레임
PCR 중합효소 연쇄 반응
RFP 적색 형광 단백질
RMCE 재조합효소 매개 카세트 교환
RPMi. 로즈웰 파크 메모리얼 연구소(Roswell Park Memorial Institute)
RSV 호흡기 세포융합 바이러스
RT 역전사
RNA 리보핵산
SBP 스트렙트아비딘 결합 펩타이드
SSR 부위-특이적 재조합효소
SV40 유인원 바이러스 40
SV40pA 유인원 바이러스 40 폴리 (A)
TAA 종양-연관-항원
TALEN 전사-유사 이펙터 뉴클레아제
TAE 트리스-아세테이트-EDTA
T-세포 T 림프구
TCR T-세포 수용체
TCS 표적 코딩 서열
TD 막관통 도메인
TEDV 태그-교환 공여체 벡터
TERS 태그-교환 수용체 부위
rRNA 리보솜 RNA
tRNA 전달 RNA
UTR 비번역 영역
ZNF 징크 핑거 뉴클레아제(Zinc finger nuclease)
정의 목록
앰플리콘: PCR을 포함한 다양한 방법을 사용하여 인공 증폭의 공급원 및/또는 산물인 DNA 또는 RNA의 조각.
항체: B-세포라 불리는 면역계의 특수 세포에 의해 발현되고 2개의 사슬을 포함하는 친화성 분자. B-세포는 일반적으로 자기 단백질에 결합하지 않지만 숙주를 위협하는 병원체 또는 독소에 결합하고 이를 중화시킬 수 있는 매우 크고 매우 다양한 레퍼토리의 항체를 발현한다. 자연 또는 인공적으로 조작된 항체는 종종 친화성 시약으로 사용된다.
영양요구체: 정상적인 균주는 필요로 하지 않는 특정 추가적인 영양소를 필요로 하는 돌연변이 유기체(특히 박테리아 또는 진균).
시스 -작용 요소: 근처 ORF의 전사를 조절하는 비-코딩 DNA의 영역.
CST: 통합된 관심 유전자를 보고할 수 있는 공동-통합된 세포 표면 태그
CSTE 시스템: 공여체/수신기 쌍으로서 작동하는 시스템으로서, 태그-교환 공여체 벡터가 조작된 세포주의 게놈 내에 포함된 쌍을 이루는 태그-교환 수용체 부위로 관심 유전자 서열, 및 세포-표면 태그 엑손을 전달하는 역할을 한다.
파생 조작된 세포: CST를 교환하고 GOI를 통합하도록 추가로 유전적으로 변형된 조작된 세포
DNA: 데옥시리보핵산. 유전자 및 단백질을 인코딩하는 유전 물질을 형성하는 분자의 화학적 명칭.
조작된 세포: 게놈이 유전자 변형을 통해 조작된 것인 세포.
에피토프: 항체 또는 다른 친화성 시약에 의해 결합된 항체 표적 상의 영역.
진핵생물 조건부 조절 요소: 프로모터의 활성에 영향을 미칠 수 있고, 한정된 조건 하에서 유도되거나 억제될 수 있는 DNA 서열
진핵생물 프로모터: RNA 중합효소 결합 부위 및 반응 효소를 인코딩하는 DNA 서열. 프로모터 영역의 서열은 RNA 중합효소 및 전사 요소의 결합을 제어하므로, 따라서 프로모터는 관심 유전자가 언제 어디서 발현될지를 결정하는 데 큰 역할을 한다.
진핵생물 종결자/신호 종결자: RNA 중합효소 II와 연관된 단백질 인자에 의해 인식되고 전사의 종결 과정을 촉발하는 DNA 서열. 이는 또한 폴리-A 신호를 인코딩한다
FACS / 유세포분석법: 형광-활성화 세포 분류. 유세포분석법은 특정 세포 표면 및 세포내 마커의 발현에 대해 개별 세포를 한꺼번에 분석할 수 있는 기법이다. 이 기법의 변형인 세포 분류는 한정된 마커 세트를 가지는 세포를 추가 분석을 위해 검색이 가능하게 한다.
플립파제: 빵 효모 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 2 ㎛ 플라스미드로부터 유래된 재조합효소(플립파제, Flp).
형광 (단백질) 마커 : 특정 소멸 및 방출 특징이 있고 현미경, FACS 및 관련 기법에 의해 검출될 수 있는 분자.
유전자 시스 작용 요소: 이는 이 요소가 조절하는 유전자와 동일한 DNA 분자에 존재하는 반면, 트랜스-조절 요소는 이것이 전사된 유전자에서 멀리 떨어진 유전자를 조절할 수 있다. 시스-조절 요소는 종종 하나 이상의 트랜스-작용 인자에 대한 결합 부위이다.
유전자 바코딩 : DNA 바코딩은 유기체의 DNA에서 짧은 유전자 마커를 사용하여 상기 DNA가 특정 종에 속하는 것으로 확인하는 분류학적 방법이다.
GOI : 관심이 있는 임의의 핵산 코딩 또는 비-코딩 서열로서 정의된 관심 유전자.
이종특이적 재조합효소 부위: 재조합 효소에 의해 인식되어 2개의 DNA 분자의 교차를 촉진시키는 DNA 서열
상동성 : 보체 상동성 암과 거의 동일한 서열 동일성을 가지고 따라서 세포 과정인 상동성 유도 수선에 의해 2개의 DNA 분자의 교환을 촉진하는 DNA 구간.
절연체: 근처 유전자의 활성화 또는 억제에 의해 유전자가 영향을 받는 것을 방지하는 DNA 서열. 절연체는 또한 침묵 유전자에서 활성적으로 전사되는 유전자로 이질염색질이 확산하는 것을 방지한다.
통합: 세포의 염색체 내로 DNA 서열의 물리적 결찰
내부 리보솜 진입 부위(IRES): 일단 전사되면 캡-독립적 방식으로 번역의 개시를 가능하게 하는 RNA 요소를 인코딩하는 DNA 서열
인트론: RNA 분자가 단백질로 번역되기 전에 스플라이싱으로 제거되는 RNA 전사체 또는 이를 인코딩하는 DNA의 비코딩 영역
인트론 분지점 서열: 5' 공여체 스플라이스 부위에서 친핵성 공격을 개시하는 분지점 뉴클레오타이드. 그 다음 상류 인트론의 자유 말단은 3' 수용체 스플라이스 부위에서 제2 친핵성 공격을 개시하여, 인트론을 투승형 RNA(RNA lariat)로 방출하고 2개의 엑손을 공유 결합한다.
K는 케토(Keto)를 나타내는 뉴클레오타이드 코드이다(K = G 또는 T임)
코작 서열: 효율적인 번역 개시에 필요한 짧은 서열
M은 아미노(aMino)를 나타내는 뉴클레오타이드 코드이다(M = A 또는 C임)
MACS: 자기 활성화 세포 분류: 자기장을 사용하여 분리하기 위해 자기 입자를 포함하는 친화성 분자로 세포를 표지하는 세포 단리 기법.
일치: 2개의 구성요소가 보완 구성요소 간의 상호작용을 유도하고 제한하는 유전 요소를 인코딩하는 경우
단일클론 세포주: 반복된 세포 복제에 의해 단일 조상 세포로부터 생성된 세포의 한정된 그룹. N은 aNy 뉴클레오타이드를 나타내는 뉴클레오타이드 코드이다(N = A, T, C 또는 G임).
네이티브: 세포에 대하여 자연적으로 발생하는 개체
음성 선택 마커 : 벡터 및/또는 상기 마커-보유 벡터를 가지는 숙주 유기체의 음성 선택을 부여하는 선택가능한 마커
비-코딩 유전자: 기능성 비-코딩 RNA 분자로 전사되는 비-단백질 코딩 DNA 서열
복제 기점: 복제가 개시되는 벡터, 플라스미드 또는 게놈의 특정 서열.
ORF: 오픈 리딩 프레임. 리보솜에 의한 단백질(폴리펩타이드)의 합성을 위한 번역 프레임을 인코딩하는 유전 물질의 구간
오버행(overhang): 이중 가닥 핵산 분자의 말단에 있는 단일 가닥 서열. 종종 점착성(sticky) 또는 화합성(cohesive) 말단으로 지칭된다.
PCR: 특정 표적 DNA 분자가 기하급수적으로 증폭되는 중합효소 연쇄 반응
펩타이드: 전형적으로 길이가 6 내지 30개 아미노산인 짧은 아미노산 줄
표현형 분석: 세포의 관찰가능한 특징의 분석.
플라스미드: 유전 구조체는 염색체와 독립적으로 복제할 수 있으며, 전형적으로 박테리아 또는 원생동물의 세포질에 있는 작은 원형의 DNA 가닥.
폴리펩타이드: 3차원 구조를 형성하는 일련의 펩타이드로 이루어진 단백질.
폴리피리미딘 모티프: 피리미딘이 많고 CAG 인트론 3' 말단의 상류에 존재하는 (CnTn) 모티프.
양성 선택 마커 : 벡터 및/또는 상기 마커-보유 벡터를 가지는 숙주 유기체의 양성 선택을 부여하는 선택가능한 마커
프라이머: 예를 들어 PCR 동안 표적 DNA 서열의 특정 인식을 가능하게 하는 짧은 DNA 서열.
프로모터: 유전자 발현의 개시 제어를 위한 조절 DNA 요소
재조합효소: 유전자 재조합을 매개하고, RMCE를 촉진시키는 효소.
리포터 요소: 해당 요소를 보유하는 유기체 또는 벡터에서 보고된 신호를 매개하는 유전 요소. 양성 또는 음성 선택 마커로서 사용될 수 있다.
제한 효소 절단 서열: 제한 효소에 의해 절단되는 유전자 서열로서, 상기 제한 효소의 인식 서열에 대해 내인성이거나 내인성일 수 있다.
제한 효소 인식 서열: 제한 효소에 의해 인식되고 연결되는 유전자 서열
RMCE : 재조합효소-매개 카세트 교환. 재조합효소에 의해 촉진되는 게놈 수신기 부위에서 유전 물질의 교환.
스플라이스 수용체 부위: 표면 상의 TCRsp, 또는 TCRsp 기반 시약과 세포와의 상호작용을 위한 인트론 AM, APX CM 또는 친화성 시약의 3' 말단에 있는 DNA 서열
스플라이스 공여체 부위: 인트론의 5' 말단에 있는 DNA 서열
자살 유전자: 해당 유전자를 가지는 숙주 유기체 내에서 세포 사멸을 매개할 유전자. 양성 또는 음성 선택 마커로서 사용될 수 있다.
합성: 인공적으로 생성된 개체
TEDV: 조작된 세포의 게놈 내에 포함된 태그-교환 수용체 부위와 쌍을 이루는 태그-교환 공여체 벡터. 이는 관심 유전자 및 세포-표면 태그 엑손을 전달하는 데 사용된다.
TERS: 조작된 세포주의 게놈 내에 포함된 쌍을 이루는 태그-교환 수용체 부위
유형 II 막관통 도메인: 막의 내부에 N 말단 부분이 있고 세포 외부에 노출된 또는 ER 내강에 C 말단 부분이 있는, 결합된 신호/앵커 서열의 역할을 하는 N 말단에 가까운 소수성 잔기의 단일 비-절단성 막관통 구간.
벡터: 벡터는 유전 정보를 가지는 유전자 구조체이다. 본 문맥에서 벡터는 보통 플라스미드 DNA 벡터를 설명한다. 벡터는 숙주 유기체에서 증식 및 선택될 수 있는 이와 같은 임의의 구조체를 나타낼 수 있다.
W는 약함을 나타내는 뉴클레오타이드 코드이다(W = A 또는 T임)
SEQUENCE LISTING <110> Genovie AB <120> A cell surface tag exchange (CSTE) system for tracing and manipulation of cells during recombinase mediated cassette exchange integration of nucleic acid sequences to engineered receiver cells <130> WO2020/011757 <150> PCT/EP2019/068343 <151> 2019-07-09 <150> EP 18182353.5 <151> 2018-07-09 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 5837 <212> DNA <213> Artificial sequence <220> <223> Tag-exchange receiver site encoding Myc CST and RFP selection gene <400> 1 gagctctact ggcttctgcg ccgcctctgg cccactgttt ccccttccca ggcaggtcct 60 gctttctctg acctgcattc tctcccctgg gcctgtgccg ctttctgtct gcagcttgtg 120 gcctgggtca cctctacggc tggcccagat ccttccctgc cgcctccttc aggttccgtc 180 ttcctccact ccctcttccc cttgctctct gctgtgttgc tgcccaagga tgctctttcc 240 ggagcacttc cttctcggcg ctgcaccacg tgatgtcctc tgagcggatc ctccccgtgt 300 ctgggtcctc tccgggcatc tctcctccct cacccaaccc catgccgtct tcactcgctg 360 ggttcccttt tccttctcct tctggggcct gtgccatctc tcgtttctta ggatggcctt 420 ctccgacgga tgtctccctt gcgtcccgcc tccccttctt gtaggcctgc atcatcaccg 480 tttttctgga caaccccaaa gtaccccgtc tccctggctt tagccacctc tccatcctct 540 tgctttcttt gcctggacac cccgttctcc tgtggattcg ggtcacctct cactcctttc 600 atttgggcag ctcccctacc ccccttacct ctctagtctg tgctagctct tccagccccc 660 tgtcatggca tcttccaggg gtccgagagc tcagctagtc ttcttcctcc aacccgggcc 720 cctatgtcca cttcaggaca gcatgtttgc tgcctccagg gatcctgtgt ccccgagctg 780 ggaccacctt atattcccag ggccggttaa tgtggctctg gttctgggta cttttatctg 840 tcccctccac cgggtggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 900 cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 960 gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 1020 ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 1080 acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 1140 tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 1200 ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 1260 gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 1320 cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 1380 cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 1440 cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 1500 ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 1560 ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 1620 cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 1680 gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 1740 aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1800 ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1860 ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1920 ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1980 tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgactgctta 2040 agcttggtac cgccaccatg gccaagggct tctacatcag caagagcctg ggcatcctgg 2100 gaatcctgct gggagtggct gctgtgtgca ccatcatcgc tctgagcgtg gtgtacagcc 2160 aggagggagg tcctggatcc ggaacaggtg gctctggcac tggaggatca ggtccaggtg 2220 gatctatggt gaagcagatc gagagcaaga ctgctttcca ggaagccttg gacgctgcag 2280 gtgataagct tgtagtagtt gacttctcag caacgtggtc tggaccttcc aagatgatca 2340 agcctttctt ccattccctc tctgagaagt attccaacgt gatattcctt gaagtagatg 2400 tggatgactc tcaggatgtt gcttcagagt gtgaagtcaa atccatgcca acattccagt 2460 tcttcaagaa gggacagaag gtgggtgaat tttctggagc caataaggag aagcttgaag 2520 ccaccattaa cgagttggta ggtaagtggc tggggccaga gactggctct tgaagttcct 2580 attccgaagt tcctattctc tagaaagtat aggaacttcc tggctcagaa aaagggccct 2640 gacaactctt ttcatcttct aggcggttcc tctacatccg gtggatctgg atctggagaa 2700 caaaagctca tctctgagga ggaccttggg gagcagaagc taatcagtga agaagacctc 2760 ggagagcaga aattgattag cgaggaggat ctttaaagac gctagcacct gatcctgatc 2820 ataatcaagc catatcacat ctgtagaggt ttacttgctt taaaaaacct ccacacctcc 2880 ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt 2940 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 3000 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgct 3060 gaagagcgct gatcagctct tcaccataga gcccaccgca tccccagcat gcctgctatt 3120 gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 3180 cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 3240 accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 3300 aggcacagtc gggtgctagc tcatctgtgg cccagcttgc taggcaggtc gcagtacttg 3360 gccacggcca tctcgtgctg ttccacgtag gtttctttgt cggcctcttt gatccgttcc 3420 agccggtggt ccacgaagtg gaagccgggc atcttcaggt tcttggcggg cttcttgctt 3480 ctgtaggtgg tcttgaagga gcagtgcagg tagcctccgc ccacgagttt cagggccatc 3540 tgagaatggc ctctcaggcc gccatcggca gggtacagca tctcggtgtt ggcctcccag 3600 cctctggttt tcttctgcat cacggggccg ttgctgggga agttcacgcc gttaatcttc 3660 acgttgtaga tgatgcagcc gttctggaag ctggtatcct gggtggcggt cagcactccg 3720 ccgtcctcgt atgtggtgat ccgctcccag gtgaagccct cggggaagct ctgcttgaag 3780 aaatcgggga tgccctgggt gtggttgatg aaggccttgc tgccgtacat aaagctggtg 3840 gccaggatat caaaggcgaa gggcagaggg ccgccttcca ccaccttgat cttcatggtc 3900 tgggtgccct cgtaaggctt gccctcgccc tcgctggtgc acttgaagtg gtggttgttc 3960 acggtgcctt ccatgtacag cttcatgtgc atgttttctt tgatcagctc gctcatggtg 4020 gctacggaag ttcctattcc gaagttccta ttcttcaaat agtataggaa cttccggtac 4080 cagtcacgac acctgaaatg gaagaaaaaa actttgaacc actgtctgag gcttgagaat 4140 gaaccaagat ccaaactcaa aaagggcaaa ttccaaggag aattacatca agtgccaagc 4200 tggcctaact tcagtctcca cccactcagt gtggggaaac tccatcgcat aaaacccctc 4260 cccccaacct aaagacgacg tactccaaaa gctcgagaac taatcgaggt gcctggacgg 4320 cgcccggtac tccgtggagt cacatgaagc gacggctgag gacggaaagg cccttttcct 4380 ttgtgtgggt gactcacccg cccgctctcc cgagcgccgc gtcctccatt ttgagctccc 4440 tgcagcaggg ccgggaagcg gccatctttc cgctcacgca actggtgccg accgggccag 4500 ccttgccgcc cagggcgggg cgatacacgg cggcgcgagg ccaggcacca gagcaggccg 4560 gccagcttga gactaccccc gtccgattct cggtggccgc gctcgcaggc cccgcctcgc 4620 cgaacatgtg cgctgggacg cacgggcccc gtcgccgccc gcggccccaa aaaccgaaat 4680 accagtgtgc agatcttggc ccgcatttac aagactatct tgccagaaaa aaagcgtcgc 4740 agcaggtcat caaaaatttt aaatggctag agacttatcg aaagcagcga gacaggcgcg 4800 aaggtgccac cagattcgca cgcggcggcc ccagcgccca ggccaggcct caactcaagc 4860 acgaggcgaa ggggctcctt aagcgcaagg cctcgaactc tcccacccac ttccaacccg 4920 aagctcggga tcaagaatca cgtactgcag ccagtggaag taattcaagg cacgcaaggg 4980 ccataacccg taaagaggcc aggcccgcgg gaaccacaca cggcacttac ctgtgttctg 5040 gcggcaaacc cgttgcgaaa aagaacgttc acggcgacta ctgcacttat atacggttct 5100 cccccaccct cgggaaaaag gcggagccag tacacgacat cactttccca gtttaccccg 5160 cgccaccttc tctaggcacc ggttcaattg ccgacccctc cccccaactt ctcggggact 5220 gtgggcgatg tgcgctctgc ccactgacgg gcaccggagc caccggatca ggatcaggat 5280 tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga tattgggtct 5340 aacccccacc tcctgttagg cagattcctt atctggtgac acacccccat ttcctggagc 5400 catctctctc cttgccagaa cctctaaggt ttgcttacga tggagccaga gaggatcctg 5460 ggagggagag cttggcaggg ggtgggaggg aaggggggga tgcgtgacct gcccggttct 5520 cagtggccac cctgcgctac cctctcccag aacctgagct gctctgacgc ggctgtctgg 5580 tgcgtttcac tgatcctggt gctgcagctt ccttacactt cccaagagga gaagcagttt 5640 ggaaaaacaa aatcagaata agttggtcct gagttctaac tttggctctt cacctttcta 5700 gtccccaatt tatattgttc ctccgtgcgt cagttttacc tgtgagataa ggccagtagc 5760 cagccccgtc ctggcagggc tgtggtgagg aggggggtgt ccgtgtggaa aactcccttt 5820 gtgagaatgg tgcgtcc 5837 <210> 2 <211> 1332 <212> DNA <213> Artificial sequence <220> <223> Flippase <400> 2 atggccccca agaaaaagcg gaaagtgggc atccacggcg tgccagctgc aggcggctct 60 atgagccagt tcgacatcct gtgcaagacc ccacctaagg tgctcgtgcg gcagttcgtg 120 gaaagattcg agaggcctag cggcgagaag atcgcctctt gtgctgccga gctgacctac 180 ctgtgctgga tgatcaccca caacggcacc gccatcaagc gggccacctt catgagctac 240 aataccatca tcagcaacag cctgagcttc gacatcgtga acaagagcct gcagttcaag 300 tacaagaccc agaaggccac catcctggaa gccagcctga agaaactgat ccccgcctgg 360 gagtttacca tcatcccata caatggccag aaacatcaga gcgacattac cgatatcgtg 420 tccagcctcc agctgcagtt cgagagtagc gaagaagccg acaagggcaa cagccacagc 480 aagaagatgc tgaaggccct gctgagcgag ggcgagagca tctgggagat cacagagaag 540 atcctgaaca gcttcgagta caccagccgg ttcaccaaga ccaagaccct gtaccagttc 600 ctgttcctgg ccacctttat caactgcggc cggttctccg acatcaagaa cgtggacccc 660 aagagcttca agctggtgca gaacaagtac ctgggcgtga tcattcagtg cctcgtgacc 720 gagacaaaga ccagcgtgtc ccggcacatc tactttttca gcgccagagg ccggatcgac 780 cccctggtgt acctggacga gttcctgaga aacagcgagc ccgtgctgaa gagagtgaac 840 cggaccggca acagcagctc caacaagcag gaataccagc tgctgaagga caacctcgtg 900 cggtcctaca acaaggccct gaagaaaaac gccccctacc ccatcttcgc cattaagaac 960 ggccccaagt cccacatcgg ccggcacctg atgaccagct ttctgagcat gaagggcctg 1020 acagagctga ccaacgtcgt gggcaattgg agcgacaaga gggcctctgc cgtggccaga 1080 accacctaca cccaccagat cacagccatc cccgaccact acttcgccct ggtgtctcgg 1140 tactacgcct acgaccccat cagcaaagag atgatcgccc tgaaggacga gacaaacccc 1200 atcgaggaat ggcagcacat cgagcagctg aagggcagcg ccgagggcag catcagatac 1260 cctgcctgga acggcatcat ctcccaggaa gtgctggact acctgagcag ctacatcaac 1320 cggcggatct ga 1332 <210> 3 <211> 1791 <212> DNA <213> Artificial sequence <220> <223> TEDV encoding SBP CST and P-gene_RSV1 GOI <400> 3 gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60 aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120 tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180 caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240 cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300 ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420 gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480 gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540 ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600 cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660 ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720 ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgactaga 780 aagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840 ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900 ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960 taatctccat catgatcctt gtaatccccg gggaaatctt ccaggctcag gtcgttgtcg 1020 ctgtcgttgc cttccagcag gttgttcagc ttctcagagg tagggttcag agacacttcg 1080 tcggaggtgt ccttggccat cttctcggat tcctcgtttc tcagccgggc catagcttcc 1140 agccgatcgt tggtcatcag ggcctctgtc cggatcttct cgatcatctc ttcccgcagt 1200 ccgaccatgg catctctgat gccatctctg gcagatgtag gtccggcaga tgccaccacc 1260 agtgtgtgca gcatgcccag gatctcagac agcttctcgt cgatccggtc cagtctggcg 1320 gtgatgttgt cgttggtctg gtcgttgatt tcctcgtagc tgtagctgct ctcttcctcg 1380 ttgttgtcga atgtctcgat tgtctctttg tacagcttgc tgaaggggtt gtcgctaggt 1440 gtggggtcct ctttgaagga caccaggggc tttctctggt agttgggctt gttgccggcg 1500 gtgtcgtctg tctcgttggt ggggttgatg atggtgctgt tgctggtgat ggggctctct 1560 ttggtcactt cgatgtcgat gctgttcacg ctgatgatgc tgtccttctt cttggggtcc 1620 ttggggctcg tgaacttgcc cttgatggat tccagaaact tggtggcccg attgttggcg 1680 tcctcgccgt ggaactcagg ggcgaacttt tccatggtgg cggtattgtc ttcggtaccg 1740 cacgaagttc ctattcggaa gttcctattc ttcaaatagt ataggaactt c 1791 <210> 4 <211> 2241 <212> DNA <213> Artificial sequence <220> <223> TEDV encoding SBP CST and N-gene_RSV1 GOI <400> 4 gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60 aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120 tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180 caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240 cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300 ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420 gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480 gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540 ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600 cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660 ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720 ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgactagg 780 gagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840 ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900 ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960 taatctccat catgatcctt gtaatccccg ggcagttcca cgtcgttgtc cttagggttc 1020 agctggtgct tgatggcttc cagttcctcg gcggtcagat ccagcacgct gtagttgatc 1080 acgccgtttt ctttcagctg ctcggcatag gccttggcgg catcgtacag gtcctggttt 1140 ctaggggtgc ctctgtactc gcccatgatt cccagtccgg cggcatttcc cagcaccaca 1200 gagctgaagt gtgggaactg tgtcaggctc agcagagagg ccttggggtt gttcaggatg 1260 tggtaaaagc cggcctctcc gccaagcttc tgggcgtact cgtacacttc caccacctgt 1320 tccatttcgg cctgcacaga ggcgtggccc agcatgatgt tcttcacgct cttggccagc 1380 actccccatc tcagcatcac ttgtccggcg ccataggcat tcatgaacag gccggcgaag 1440 atgccttcca cccgagagcc gcctcttgtg ctgctctggg cgattccgaa gtgcacgaac 1500 acgtcgatga agtgagggta cttctcgaac acctcgtaga agctgttggc aatatcctta 1560 ggcagcaggc ccttgtaccg cttcatctcg ttcttcagca cgttgttggc tctccgaatc 1620 acagcggtca ggccagaccg atcgccagcg gccagtttgg tgatgaccag agcggcgata 1680 cacaggatga tcatgccgca atcagggctg tcgtgtctgt actcaggggc gacttcgccc 1740 atctctttca gcattttctt gtaggacttc cggctctcga tctcgatgtt gatctggatc 1800 tctgtggtca ggctggccag ggtcagcacc tcgaacttca tttctttgcc gttgatgtcc 1860 tgccggtgtg tggtcacgtc cacgccattg gccttcacgt ggtagccggc atctctcagg 1920 atcttgatgg tgtcctctct gcccagtctg ctcatggcgt acagcattcc gatcacgcct 1980 gtgaacttgt ggttggcgtc ctcggtgatc agcagcatgc cgcacagctt gttgatgtgc 2040 ttctgcacgt cgtagttagg ggtgtcgatg ctgtcgccgg tgcttctctg gatggtgtac 2100 ttgctgctgc tcagcagctg gtccttgttc agggtgtcgt tcagcttcac tttgctcagg 2160 gccatggtgg cggtattgtc ttcggtaccg cacgaagttc ctattcggaa gttcctattc 2220 ttcaaatagt ataggaactt c 2241 <210> 5 <211> 1649 <212> DNA <213> Artificial sequence <220> <223> M2-long-gene_RSV1 <400> 5 gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60 aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120 tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180 caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240 cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300 ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420 gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480 gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540 ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600 cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660 ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720 ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgacctgt 780 tagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840 ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900 ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960 taatctccat catgatcctt gtaatccccg ggggtggtat cgttgttctt ggcgtggtcg 1020 ttggtgtcgt tgacggtgct ctctttggga ttgttgatgg tgatgctctt gtggatgtcc 1080 agggtgttct tgatggtttt cttcagcacg tcggcaggca gccgcttcag cagatggatg 1140 gtctgcttgt tgttcttccg gttgctctcg atgtagctga tcacggtgtt gtacacccgg 1200 atcttggggc tgttaggttc ctcgttgtcc cgcagcttct tgatgtcgtc gctgttcagc 1260 tctgtcagca gcttgctcat ggccacgcag gcgctctgct tggtgatgtt gttgatgctg 1320 ccgatatagc tttccagcac gcccacaacg cccagggcat attcctcggt tctatccagt 1380 tcggcggctc cgctgatctc gctcagggtg tcgatgctct tatccatgga cttcaggatt 1440 ctgttcagca tgaagttctg ccgcacgagc agagcgtgag gaggccactc gaagtagttg 1500 tggctgaagt ggcatctctt gccgttcagg cagtggcctc tgatctcgaa cttgcagggg 1560 ttccgtctgc tcatggtggc ggtattgtct tcggtaccgc acgaagttcc tattcggaag 1620 ttcctattct tcaaatagta taggaactt 1649 <210> 6 <211> 4542 <212> DNA <213> Artificial sequence <220> <223> CMVpro-Flp-sv40pA-V2 vector V4.I.8 <400> 6 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcatg aattcgctac cggtatagta atcaattacg gggtcattag ttcatagccc 420 atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 480 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 540 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 600 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 660 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 720 agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 780 gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 840 gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 900 gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag tgaaccgtca 960 gatcaggtac catggccccc aagaaaaagc ggaaagtggg catccacggc gtgccagctg 1020 caggcggctc tatgagccag ttcgacatcc tgtgcaagac cccacctaag gtgctcgtgc 1080 ggcagttcgt ggaaagattc gagaggccta gcggcgagaa gatcgcctct tgtgctgccg 1140 agctgaccta cctgtgctgg atgatcaccc acaacggcac cgccatcaag cgggccacct 1200 tcatgagcta caataccatc atcagcaaca gcctgagctt cgacatcgtg aacaagagcc 1260 tgcagttcaa gtacaagacc cagaaggcca ccatcctgga agccagcctg aagaaactga 1320 tccccgcctg ggagtttacc atcatcccat acaatggcca gaaacatcag agcgacatta 1380 ccgatatcgt gtccagcctc cagctgcagt tcgagagtag cgaagaagcc gacaagggca 1440 acagccacag caagaagatg ctgaaggccc tgctgagcga gggcgagagc atctgggaga 1500 tcacagagaa gatcctgaac agcttcgagt acaccagccg gttcaccaag accaagaccc 1560 tgtaccagtt cctgttcctg gccaccttta tcaactgcgg ccggttctcc gacatcaaga 1620 acgtggaccc caagagcttc aagctggtgc agaacaagta cctgggcgtg atcattcagt 1680 gcctcgtgac cgagacaaag accagcgtgt cccggcacat ctactttttc agcgccagag 1740 gccggatcga ccccctggtg tacctggacg agttcctgag aaacagcgag cccgtgctga 1800 agagagtgaa ccggaccggc aacagcagct ccaacaagca ggaataccag ctgctgaagg 1860 acaacctcgt gcggtcctac aacaaggccc tgaagaaaaa cgccccctac cccatcttcg 1920 ccattaagaa cggccccaag tcccacatcg gccggcacct gatgaccagc tttctgagca 1980 tgaagggcct gacagagctg accaacgtcg tgggcaattg gagcgacaag agggcctctg 2040 ccgtggccag aaccacctac acccaccaga tcacagccat ccccgaccac tacttcgccc 2100 tggtgtctcg gtactacgcc tacgacccca tcagcaaaga gatgatcgcc ctgaaggacg 2160 agacaaaccc catcgaggaa tggcagcaca tcgagcagct gaagggcagc gccgagggca 2220 gcatcagata ccctgcctgg aacggcatca tctcccagga agtgctggac tacctgagca 2280 gctacatcaa ccggcggatc tgatctagac ctgatcataa tcaagccata tcacatctgt 2340 agaggtttac ttgctttaaa aaacctccac acctccccct gaacctgaaa cataaaatga 2400 atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2460 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2520 aactcatcaa tgtatcttat catgtctgga tctgcggatc caatctcgag ctgggcctca 2580 tgggccttcc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 2640 catggtcata gctgtttcct tgcgtattgg gcgctctccg cttcctcgct cactgactcg 2700 ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg agcaaaaggc cagcaaaagg 2760 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 2820 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2880 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 2940 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 3000 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 3060 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 3120 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 3180 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 3240 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3300 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3360 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3420 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3480 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3540 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3600 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3660 taccatctgg ccccagtgct gcaatgatac cgcgagaacc acgctcaccg gctccagatt 3720 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3780 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3840 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3900 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 3960 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 4020 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 4080 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 4140 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 4200 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 4260 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4320 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4380 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4440 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4500 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc ac 4542 <210> 7 <211> 10428 <212> DNA <213> Artificial sequence <220> <223> SpCas9-2A-GFP vector V1.A.8 <400> 7 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900 gtttaaactt aagcttggta ccgccaccat ggactataag gaccacgacg gagactacaa 960 ggatcatgat attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa 1020 ggtcggtatc cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg 1080 caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt 1140 caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct 1200 gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata 1260 caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa 1320 ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa 1380 gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta 1440 ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg 1500 gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg 1560 cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta 1620 caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct 1680 gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga 1740 gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt 1800 caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga 1860 cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc 1920 cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat 1980 caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct 2040 gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt 2100 cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt 2160 ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa 2220 gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca 2280 ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt 2340 cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt 2400 gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac 2460 catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat 2520 cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag 2580 cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga 2640 gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct 2700 gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat 2760 cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg 2820 cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa 2880 cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat 2940 cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa 3000 gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga 3060 caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 3120 cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca 3180 ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc 3240 cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg 3300 ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa 3360 gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg 3420 cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta 3480 cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg 3540 gctgtccgac tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat 3600 cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc 3660 cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat 3720 tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga 3780 taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc 3840 acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga 3900 agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt 3960 ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt 4020 cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga 4080 ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 4140 taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4200 ggccaacggc gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat 4260 cgtgtgggat aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt 4320 gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc 4380 caagaggaac agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg 4440 cggcttcgac agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg 4500 caagtccaag aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag 4560 cagcttcgag aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa 4620 ggacctgatc atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag 4680 aatgctggcc tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata 4740 tgtgaacttc ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa 4800 tgagcagaaa cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca 4860 gatcagcgag ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc 4920 cgcctacaac aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct 4980 gtttaccctg accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga 5040 ccggaagagg tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat 5100 caccggcctg tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc 5160 ggccacgaaa aaggccggcc aggcaaaaaa gaaaaaggaa ttcggcagtg gagagggcag 5220 aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggcccagtga gcaagggcga 5280 ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 5340 caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 5400 gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 5460 ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 5520 gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 5580 ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 5640 gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 5700 caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 5760 caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 5820 cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 5880 cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 5940 cgccgccggg atcactctcg gcatggacga gctgtacaag gaattctaac gctagagggc 6000 ccgtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt 6060 gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 6120 aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 6180 tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 6240 tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg tatccccacg 6300 cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 6360 cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 6420 tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 6480 ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 6540 cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 6600 tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 6660 ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 6720 cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc 6780 aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc 6840 aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt 6900 cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc 6960 ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct 7020 attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agctcccggg 7080 agcttgtata tccattttcg gatctgatca agagacagga tgaggatcgt ttcgcatgat 7140 tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta 7200 tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca 7260 ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcagga 7320 cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga 7380 cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct 7440 cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg 7500 gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga 7560 gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca 7620 tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc ccgacggcga 7680 ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg 7740 cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc 7800 gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt 7860 gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga 7920 gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc caacctgcca 7980 tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 8040 cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 8100 cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 8160 acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 8220 tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc atggtcatag 8280 ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 8340 ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 8400 tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 8460 cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 8520 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 8580 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 8640 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 8700 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 8760 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 8820 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 8880 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 8940 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 9000 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 9060 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 9120 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 9180 tgatccggca aacaaaccac cgctggtagc ggtttttttg tttgcaagca gcagattacg 9240 cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 9300 tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 9360 tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 9420 tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 9480 cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 9540 ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 9600 tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 9660 gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 9720 agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 9780 atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 9840 tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 9900 gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 9960 agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 10020 cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 10080 ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 10140 ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 10200 actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 10260 ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 10320 atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 10380 caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtc 10428 <210> 8 <211> 6071 <212> DNA <213> Artificial sequence <220> <223> pcDNA3.1_GFP vector V1.A.4 <400> 8 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900 gtttaaactt aagcttggta ccgccaccat ggaatccgat gagtctggcc tgcccgccat 960 ggaaatcgag tgcagaatca ccggcaccct gaacggcgtg gaatttgagc tcgtgggcgg 1020 aggcgagggc acacctgaac agggcagaat gaccaacaag atgaagtcca ccaagggggc 1080 cctgaccttc agcccctacc tgctgtctca cgtgatgggc tacggcttct accacttcgg 1140 cacctacccc agcggctacg agaacccttt cctgcacgcc atcaacaacg gcggctacac 1200 caacacccgg atcgagaagt acgaggacgg cggcgtgctg cacgtgtcct tcagctacag 1260 atacgaggcc ggcagagtga tcggcgactt caaagtgatg ggcaccggat tccccgagga 1320 cagcgtgatc ttcaccgaca agatcatccg gtccaacgcc accgtggaac atctgcaccc 1380 catgggcgac aacgacctgg acggcagctt caccagaacc ttctccctgc gggatggcgg 1440 ctactacagc agcgtggtgg acagccacat gcacttcaag agcgccatcc accccagcat 1500 cctccagaac ggcggaccca tgttcgcctt cagacgggtg gaagaggacc acagcaacac 1560 cgagctgggc atcgtggaat accagcacgc cttcaagacc cccgatgccg atgccggcga 1620 ggaatgagtc gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc 1680 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 1740 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 1800 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 1860 tagcaggcat gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg 1920 gggctctagg gggtatcccc acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 1980 ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 2040 cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 2100 ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 2160 tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 2220 gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 2280 ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 2340 gctgatttaa caaaaattta acgcgaatta attctgtgga atgtgtgtca gttagggtgt 2400 ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca 2460 gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 2520 ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 2580 cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 2640 gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 2700 ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 2760 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 2820 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 2880 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 2940 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 3000 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 3060 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 3120 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 3180 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 3240 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 3300 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 3360 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 3420 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 3480 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 3540 gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 3600 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 3660 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 3720 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 3780 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 3840 gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 3900 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 3960 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 4020 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 4080 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 4140 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 4200 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 4260 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 4320 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 4380 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 4440 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 4500 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 4560 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 4620 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 4680 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 4740 actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 4800 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggttttt 4860 ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 4920 tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 4980 gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 5040 tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 5100 ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 5160 taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 5220 cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 5280 gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 5340 gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 5400 tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 5460 gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 5520 ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 5580 ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 5640 cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 5700 ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 5760 gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 5820 ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 5880 ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 5940 tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 6000 ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 6060 cacctgacgt c 6071 <210> 9 <211> 2762 <212> DNA <213> Artificial sequence <220> <223> AAVSI_sg-sp-opti_3 vector V2.J.6 <400> 9 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcatg gatccaaggt cgggcaggaa gagggcctat ttcccatgat tccttcatat 420 ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac tgtaaacaca 480 aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt 540 ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat 600 ttcttggctt tatatatctt gtggaaagga cgaaacaccg tcaccaatcc tgtccctagg 660 tttaagagct atgctggaaa cagcatagca agtttaaata aggctagtcc gttatcaact 720 tgaaaaagtg gcaccgagtc ggtgcttttt ttcagacatc catagatcta gctcgagttt 780 tttttctaga ctgggcctca tgggccttcc gctcactgcc cgctttccag tcgggaaacc 840 tgtcgtgcca gctgcattaa catggtcata gctgtttcct tgcgtattgg gcgctctccg 900 cttcctcgct cactgactcg ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg 960 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 1020 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 1080 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 1140 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 1200 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 1260 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 1320 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 1380 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 1440 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1500 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1560 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1620 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1680 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 1740 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 1800 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 1860 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaacc 1920 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 1980 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 2040 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 2100 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 2160 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 2220 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 2280 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 2340 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 2400 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 2460 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 2520 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 2580 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 2640 cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 2700 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 2760 ac 2762 <210> 10 <211> 8188 <212> DNA <213> ?Artificial sequence <400> 10 gagctctact ggcttctgcg ccgcctctgg cccactgttt ccccttccca ggcaggtcct 60 gctttctctg acctgcattc tctcccctgg gcctgtgccg ctttctgtct gcagcttgtg 120 gcctgggtca cctctacggc tggcccagat ccttccctgc cgcctccttc aggttccgtc 180 ttcctccact ccctcttccc cttgctctct gctgtgttgc tgcccaagga tgctctttcc 240 ggagcacttc cttctcggcg ctgcaccacg tgatgtcctc tgagcggatc ctccccgtgt 300 ctgggtcctc tccgggcatc tctcctccct cacccaaccc catgccgtct tcactcgctg 360 ggttcccttt tccttctcct tctggggcct gtgccatctc tcgtttctta ggatggcctt 420 ctccgacgga tgtctccctt gcgtcccgcc tccccttctt gtaggcctgc atcatcaccg 480 tttttctgga caaccccaaa gtaccccgtc tccctggctt tagccacctc tccatcctct 540 tgctttcttt gcctggacac cccgttctcc tgtggattcg ggtcacctct cactcctttc 600 atttgggcag ctcccctacc ccccttacct ctctagtctg tgctagctct tccagccccc 660 tgtcatggca tcttccaggg gtccgagagc tcagctagtc ttcttcctcc aacccgggcc 720 cctatgtcca cttcaggaca gcatgtttgc tgcctccagg gatcctgtgt ccccgagctg 780 ggaccacctt atattcccag ggccggttaa tgtggctctg gttctgggta cttttatctg 840 tcccctccac cgggtggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 900 cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 960 gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 1020 ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 1080 acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 1140 tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 1200 ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 1260 gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 1320 cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 1380 cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 1440 cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 1500 ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 1560 ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 1620 cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 1680 gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 1740 aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1800 ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1860 ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1920 ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1980 tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgactgctta 2040 agcttggtac cgccaccatg gccaagggct tctacatcag caagagcctg ggcatcctgg 2100 gaatcctgct gggagtggct gctgtgtgca ccatcatcgc tctgagcgtg gtgtacagcc 2160 aggagggagg tcctggatcc ggaacaggtg gctctggcac tggaggatca ggtccaggtg 2220 gatctatggt gaagcagatc gagagcaaga ctgctttcca ggaagccttg gacgctgcag 2280 gtgataagct tgtagtagtt gacttctcag caacgtggtc tggaccttcc aagatgatca 2340 agcctttctt ccattccctc tctgagaagt attccaacgt gatattcctt gaagtagatg 2400 tggatgactc tcaggatgtt gcttcagagt gtgaagtcaa atccatgcca acattccagt 2460 tcttcaagaa gggacagaag gtgggtgaat tttctggagc caataaggag aagcttgaag 2520 ccaccattaa cgagttggta ggtaagtggc tggggccaga gactggctct tgaagttcct 2580 attccgaagt tcctattctc tagaaagtat aggaacttcc tggctcagaa aaagggccct 2640 gacaactctt ttcatcttct aggcggttcc tctacatccg gtggatctgg atctggagaa 2700 caaaagctca tctctgagga ggaccttggg gagcagaagc taatcagtga agaagacctc 2760 ggagagcaga aattgattag cgaggaggat ctttaaagac gctagcacct gatcctgatc 2820 ataatcaagc catatcacat ctgtagaggt ttacttgctt taaaaaacct ccacacctcc 2880 ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt 2940 ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 3000 tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgct 3060 gaagagcgct gatcagctct tcaccataga gcccaccgca tccccagcat gcctgctatt 3120 gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 3180 cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 3240 accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 3300 aggcacagtc gggtgctagc tcatctgtgg cccagcttgc taggcaggtc gcagtacttg 3360 gccacggcca tctcgtgctg ttccacgtag gtttctttgt cggcctcttt gatccgttcc 3420 agccggtggt ccacgaagtg gaagccgggc atcttcaggt tcttggcggg cttcttgctt 3480 ctgtaggtgg tcttgaagga gcagtgcagg tagcctccgc ccacgagttt cagggccatc 3540 tgagaatggc ctctcaggcc gccatcggca gggtacagca tctcggtgtt ggcctcccag 3600 cctctggttt tcttctgcat cacggggccg ttgctgggga agttcacgcc gttaatcttc 3660 acgttgtaga tgatgcagcc gttctggaag ctggtatcct gggtggcggt cagcactccg 3720 ccgtcctcgt atgtggtgat ccgctcccag gtgaagccct cggggaagct ctgcttgaag 3780 aaatcgggga tgccctgggt gtggttgatg aaggccttgc tgccgtacat aaagctggtg 3840 gccaggatat caaaggcgaa gggcagaggg ccgccttcca ccaccttgat cttcatggtc 3900 tgggtgccct cgtaaggctt gccctcgccc tcgctggtgc acttgaagtg gtggttgttc 3960 acggtgcctt ccatgtacag cttcatgtgc atgttttctt tgatcagctc gctcatggtg 4020 gctacggaag ttcctattcc gaagttccta ttcttcaaat agtataggaa cttccggtac 4080 cagtcacgac acctgaaatg gaagaaaaaa actttgaacc actgtctgag gcttgagaat 4140 gaaccaagat ccaaactcaa aaagggcaaa ttccaaggag aattacatca agtgccaagc 4200 tggcctaact tcagtctcca cccactcagt gtggggaaac tccatcgcat aaaacccctc 4260 cccccaacct aaagacgacg tactccaaaa gctcgagaac taatcgaggt gcctggacgg 4320 cgcccggtac tccgtggagt cacatgaagc gacggctgag gacggaaagg cccttttcct 4380 ttgtgtgggt gactcacccg cccgctctcc cgagcgccgc gtcctccatt ttgagctccc 4440 tgcagcaggg ccgggaagcg gccatctttc cgctcacgca actggtgccg accgggccag 4500 ccttgccgcc cagggcgggg cgatacacgg cggcgcgagg ccaggcacca gagcaggccg 4560 gccagcttga gactaccccc gtccgattct cggtggccgc gctcgcaggc cccgcctcgc 4620 cgaacatgtg cgctgggacg cacgggcccc gtcgccgccc gcggccccaa aaaccgaaat 4680 accagtgtgc agatcttggc ccgcatttac aagactatct tgccagaaaa aaagcgtcgc 4740 agcaggtcat caaaaatttt aaatggctag agacttatcg aaagcagcga gacaggcgcg 4800 aaggtgccac cagattcgca cgcggcggcc ccagcgccca ggccaggcct caactcaagc 4860 acgaggcgaa ggggctcctt aagcgcaagg cctcgaactc tcccacccac ttccaacccg 4920 aagctcggga tcaagaatca cgtactgcag ccagtggaag taattcaagg cacgcaaggg 4980 ccataacccg taaagaggcc aggcccgcgg gaaccacaca cggcacttac ctgtgttctg 5040 gcggcaaacc cgttgcgaaa aagaacgttc acggcgacta ctgcacttat atacggttct 5100 cccccaccct cgggaaaaag gcggagccag tacacgacat cactttccca gtttaccccg 5160 cgccaccttc tctaggcacc ggttcaattg ccgacccctc cccccaactt ctcggggact 5220 gtgggcgatg tgcgctctgc ccactgacgg gcaccggagc caccggatca ggatcaggat 5280 tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga tattgggtct 5340 aacccccacc tcctgttagg cagattcctt atctggtgac acacccccat ttcctggagc 5400 catctctctc cttgccagaa cctctaaggt ttgcttacga tggagccaga gaggatcctg 5460 ggagggagag cttggcaggg ggtgggaggg aaggggggga tgcgtgacct gcccggttct 5520 cagtggccac cctgcgctac cctctcccag aacctgagct gctctgacgc ggctgtctgg 5580 tgcgtttcac tgatcctggt gctgcagctt ccttacactt cccaagagga gaagcagttt 5640 ggaaaaacaa aatcagaata agttggtcct gagttctaac tttggctctt cacctttcta 5700 gtccccaatt tatattgttc ctccgtgcgt cagttttacc tgtgagataa ggccagtagc 5760 cagccccgtc ctggcagggc tgtggtgagg aggggggtgt ccgtgtggaa aactcccttt 5820 gtgagaatgg tgcgtcctcg agctgggcct catgggcctt ccgctcactg cccgctttcc 5880 agtcgggaaa cctgtcgtgc cagctgcatt aacatggtca tagctgtttc cttgcgtatt 5940 gggcgctctc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg gtaaagcctg 6000 gggtgcctaa tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 6060 ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 6120 gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 6180 cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 6240 gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 6300 tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 6360 cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 6420 cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 6480 gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc 6540 agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 6600 cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 6660 tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 6720 tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 6780 ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 6840 cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 6900 cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 6960 accgcgagaa ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 7020 ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 7080 ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 7140 tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 7200 acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 7260 tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 7320 actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 7380 ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 7440 aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 7500 ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 7560 cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 7620 aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 7680 actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 7740 cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 7800 ccgaaaagtg ccacctaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt 7860 tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca 7920 aaagaataga ccgagatagg gttgagtggc cgctacaggg cgctcccatt cgccattcag 7980 gctgcgcaac tgttgggaag ggcgtttcgg tgcgggcctc ttcgctatta cgccagctgg 8040 cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 8100 gacgttgtaa aacgacggcc agtgagcgcg acgtaatacg actcactata gggcgaattg 8160 gcggaaggcc gtcaaggccg catgaatt 8188 <210> 11 <211> 3996 <212> DNA <213> Artificial sequence <220> <223> M2-gene-Long_RSV1-FLAG_Tx?V12.A.8 <400> 11 gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60 aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120 tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180 caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240 cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300 ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420 gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480 gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540 ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600 cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660 ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720 ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgacctgt 780 tagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840 ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900 ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960 taatctccat catgatcctt gtaatccccg ggggtggtat cgttgttctt ggcgtggtcg 1020 ttggtgtcgt tgacggtgct ctctttggga ttgttgatgg tgatgctctt gtggatgtcc 1080 agggtgttct tgatggtttt cttcagcacg tcggcaggca gccgcttcag cagatggatg 1140 gtctgcttgt tgttcttccg gttgctctcg atgtagctga tcacggtgtt gtacacccgg 1200 atcttggggc tgttaggttc ctcgttgtcc cgcagcttct tgatgtcgtc gctgttcagc 1260 tctgtcagca gcttgctcat ggccacgcag gcgctctgct tggtgatgtt gttgatgctg 1320 ccgatatagc tttccagcac gcccacaacg cccagggcat attcctcggt tctatccagt 1380 tcggcggctc cgctgatctc gctcagggtg tcgatgctct tatccatgga cttcaggatt 1440 ctgttcagca tgaagttctg ccgcacgagc agagcgtgag gaggccactc gaagtagttg 1500 tggctgaagt ggcatctctt gccgttcagg cagtggcctc tgatctcgaa cttgcagggg 1560 ttccgtctgc tcatggtggc ggtattgtct tcggtaccgc acgaagttcc tattcggaag 1620 ttcctattct tcaaatagta taggaacttc cgctctgacc agctgcatta acatggtcat 1680 agctgtttcc ttgcgtattg ggcgctctcc gcttcctcgc tcactgactc gctgcgctcg 1740 gtcgttcggg taaagcctgg ggtgcctaat gagcaaaagg ccagcaaaag gccaggaacc 1800 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1860 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1920 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1980 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 2040 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 2100 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 2160 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 2220 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 2280 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 2340 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 2400 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 2460 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2520 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2580 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 2640 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 2700 gccccagtgc tgcaatgata ccgcgagaac cacgctcacc ggctccagat ttatcagcaa 2760 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 2820 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 2880 gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 2940 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 3000 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 3060 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 3120 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 3180 gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 3240 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 3300 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 3360 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 3420 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 3480 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 3540 gggttccgcg cacatttccc cgaaaagtgc cacctaaatt gtaagcgtta atattttgtt 3600 aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 3660 caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtggcc gctacagggc 3720 gctcccattc gccattcagg ctgcgcaact gttgggaagg gcgtttcggt gcgggcctct 3780 tcgctattac gccagctggc gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg 3840 ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgagcgcga cgtaatacga 3900 ctcactatag ggcgaattgg cggaaggccg tcaaggccgc atgaattcgc taccgggagt 3960 tggtaggtaa gtggctgggg ccagagactg gctctt 3996 <210> 12 <211> 20 <212> DNA <213> Artificial sequence <220> <223> turboRFP_GT_F1 1.I.7 <400> 12 gagaggccat tctcagatgg 20 <210> 13 <211> 20 <212> DNA <213> Artificial sequence <220> <223> turboRFP_GT_R1 1.I.8 <400> 13 cgggcatctt caggttcttg 20 <210> 14 <211> 25 <212> DNA <213> Artificial sequence <220> <223> turboRFP_probe_FAM 1.I.9 <400> 14 ctacctgcac tgctccttca agacc 25 <210> 15 <211> 26 <212> DNA <213> Artificial sequence <220> <223> TRAC_TCRA-promoter_F1 10.A.10 <400> 15 gacttgtcac tggatttaga gtctct 26 <210> 16 <211> 22 <212> DNA <213> Artificial sequence <220> <223> TRAC_probe (HEX) 10.B.6 <400> 16 atccagaacc ctgaccctgc cg 22 <210> 17 <211> 23 <212> DNA <213> Artificial sequence <220> <223> TRAC-TCRA-ex1-F1 10.A.9 <400> 17 ctgatcctct tgtcccacag ata 23 <210> 18 <211> 19 <212> DNA <213> Artificial sequence <220> <223> AAVS1_GT_F5 15.F.9 <400> 18 actctgccct ctaacgctg 19 <210> 19 <211> 20 <212> DNA <213> Artificial sequence <220> <223> AMPN-TMD_GT_R1 19.E.7 <400> 19 gctgatgtag aagcccttgg 20 <210> 20 <211> 876 <212> DNA <213> Artificial sequence <220> <223> SurfaceTag with Barcode FLAG-MYC-HA <400> 20 atggaggagg gacagtacag cgagatcgag gagctgccca ggagaaggtg ctgcaggaga 60 ggcacccaga tcgtgctgct gggactggtg accgctgctc tgtgggcagg actgctgaca 120 ttgctgttgc tgtggcactg ggacaccacc cagagcctga agcagctgga ggagggaggt 180 cctggatccg gaacaggtgg ctctggcact ggaggatcag gtccaggtgg atctatggtg 240 aagcagatcg agagcaagac tgctttccag gaagccttgg acgctgcagg tgataagctt 300 gtagtagttg acttctcagc aacgtggtct ggaccttcca agatgatcaa gcctttcttc 360 cattccctct ctgagaagta ttccaacgtg atattccttg aagtagatgt ggatgactct 420 caggatgttg cttcagagtg tgaagtcaaa tccatgccaa cattccagtt cttcaagaag 480 ggacagaagg tgggtgaatt ttctggagcc aataaggaga agcttgaagc caccattaac 540 gagttggtcg gtggttcctc tacatccggt ggatctggat ctggtgatta caaggatcat 600 gatggagatt ataaagacca cgatattgat tataaggacg atgacgataa gggaggatat 660 ccgtatgatg taccagacta cgctggatac ccttacgatg tacctgatta tgccggatac 720 ccctatgacg taccggacta tgcgggagga gaacaaaagc tcatctctga ggaggacctt 780 ggggagcaga agctaatcag tgaagaggac ctcggagagc agaaattgat tagcgaagag 840 gatcttggcg ggcaccatca tcatcaccac cactaa 876 <210> 21 <211> 20 <212> DNA <213> Artificial sequence <220> <223> ORF-AM_GT_F2 <400> 21 ttctgtagct ccattggcag 20 <210> 22 <211> 20 <212> DNA <213> Artificial sequence <220> <223> ORF-AM_GT_R1 <400> 22 atccgtatgg tgacaagacg 20 <210> 23 <211> 26 <212> DNA <213> Artificial sequence <220> <223> TRAC-TCRA-ex1-F1 <400> 23 gacttgtcac tggatttaga gtctct 26

Claims (15)

  1. 2가지 별도의 구성요소를 포함하는 조합 시스템(combined system)으로서,
    제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(cell surface tag: CST) 엑손, 및 관심 유전자(gene of interest: GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(tag-exchange donor vector: TEDV)이고, 제2 구성요소는 제1 CST와는 상이하며, 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(tag-exchange receiver site: TERS)를 게놈 내에 포함하는 조작된 세포(engineered cell)이며, 쌍을 이루는 재조합효소 매개 카세트 교환(recombinase mediated cassette exchange: RMCE) 요소는 TEDV 및 TERS에 포함되어 TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현하는, 조합 시스템.
  2. 제1항에 있어서, 상기 제1 구성요소는,
    a. 제1 RMCE 요소
    b. 3' 인트론 단편
    c. CST 엑손
    d. 제1 전사 종결자
    e. 제2 전사 종결자
    f. GOI
    g. 코작 서열(Kozak sequence)
    h. 제2 RMCE 요소
    를 포함하는 TEDV이되,
    상기 CST 엑손 및 상기 제1 전사 종결자는 상기 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
  3. 제1항 또는 제2항에 있어서, 상기 제2 구성요소는,
    a. 전사 프로모터 요소
    b. 코작 서열
    c. 막관통 도메인 엑손
    d. 인트론
    e. 인트론 서열 d. 내에 인코딩된 제1 RMCE 요소
    f. CST 엑손
    g. 제1 전사 종결자
    h. 제2 전사 종결자
    i. 리포터 유전자
    j. 코작 서열
    k. 제2 RMCE 요소
    l. 제2 전사 프로모터 요소
    를 포함하는 TERS이되,
    상기 막관통 도메인 엑손 및 상기 CST 엑손은 상기 리포터 유전자로부터 안티센스 방향으로 인코딩되어서, 상기 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 상기 제2 전사 프로모터 요소는 상기 리포터 유전자의 전사를 구동시키는, 조합 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 TEDV의 제1 RMCE 요소는 상기 TERS의 제1 RMCE 요소와 쌍을 이루고, 상기 TEDV의 제2 RMCE 요소는 상기 TERS의 제2 RMCE 요소와 쌍을 이루는, 조합 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 각각의 CST 엑손은 하나 이상의 분자 친화성 태그를 인코딩하는 서열을 포함하고 상기 TEDV 및 상기 TERS에 의해 인코딩되는 CST는 상이한, 조합 시스템.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 조작된 세포는 게놈에 단일 TERS를 포함하는, 조합 시스템.
  7. TERS 유전자좌로부터 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 방법으로서,
    a. GOI를 인코딩하는 TEDV를 생성하는 단계;
    b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 상기 TEDV를 전달하는 단계;
    c. TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계;
    d. 통합된 GOI를 가지는 세포의 선택을 위한 프록시로서, 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 TEDV-인코딩된 CST의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
    를 포함하는, 파생 조작된 세포를 생성하는 방법.
  8. 제7항에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 TERS-인코딩된 CST의 발현 감소 및 TEDV-인코딩된 CST의 발현 증가를 검출하기 위해 형광 표지되어, 형광 활성화 세포 분류에 의해 상기 발현을 기반으로 세포 분할 및 선택을 가능하게 하는, 파생 조작된 세포를 생성하는 방법.
  9. 제7항에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 기질에 고정되어, 기질 친화성 방법, 예컨대 자기 활성화 세포 분류를 사용하여 표적 세포 집단에서 TERS-인코딩된 CST를 발현하는 세포를 고갈시킬 수 있거나 TEDV-인코딩된 CST를 발현하는 세포를 풍부화시킬 수 있는, 파생 조작된 세포를 생성하는 방법.
  10. TEDV의 풀로부터 다양한 TEDV-인코딩된 GOI를 발현하는 다중 파생 조작된 세포를 생성하는 방법으로서,
    a. 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계;
    b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계;
    c. 다중 TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 3가지 이상의 친화성 시약과 세포를 접촉시키는 단계;
    d. 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 고유한 TEDV-인코딩된 CST 각각의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
    를 포함하는, 다중 파생 조작된 세포를 생성하는 방법.
  11. - 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계;
    - 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계;
    에 의해 생성된 세포의 풀 내에서 다양한 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 세포 계통 추적 방법으로서,
    a. 다수의 TEDV-인코딩된 CST에 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계;
    b. 고유한 TEDV-인코딩된 CST 각각의 발현을 기초로 파생 조작된 세포의 함량을 분석하는 단계
    를 포함하는, 세포 계통 추적 방법.
  12. 3' 인트론 단편이 측접하는 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는, 태그-교환 공여체 벡터(TEDV).
  13. 제12항에 있어서,
    a. 제1 RMCE 요소
    b. 3' 인트론 단편
    c. CST 엑손
    d. 제1 전사 종결자
    e. 제2 전사 종결자
    f. GOI
    g. 코작 서열
    h. 제2 RMCE 요소
    를 포함하되,
    상기 CST 엑손 및 상기 제1 전사 종결자는 상기 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 태그-교환 공여체 벡터(TEDV).
  14. 조작된 세포로서,
    막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 세포 표면 태그(CST) 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이되, 재조합효소 매개 카세트 교환(RMCE) 요소는 TERS에 포함되어 TERS와 태그-교환 공여체 벡터(TEDV) 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 관심 유전자(GOI)의 리포터 요소의 교환을 초래하는, 조작된 세포.
  15. 제14항에 있어서, 상기 TERS는,
    a. 전사 프로모터 요소
    b. 코작 서열
    c. 막관통 도메인 엑손
    d. 인트론
    e. 제1 RMCE 요소
    f. CST 엑손
    g. 제1 전사 종결자
    h. 제2 전사 종결자
    i. 리포터 유전자
    j. 코작 서열
    k. 제2 RMCE 요소
    l. 제2 전사 프로모터 요소
    를 포함하되,
    상기 막관통 도메인 엑손 및 상기 CST 엑손은 상기 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 상기 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 상기 제2 전사 프로모터 요소는 상기 리포터 유전자의 전사를 구동시키는, 조작된 세포.
KR1020217003789A 2018-07-09 2019-07-09 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 KR20210030414A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18182353.5 2018-07-09
EP18182353 2018-07-09
PCT/EP2019/068343 WO2020011757A1 (en) 2018-07-09 2019-07-09 A cell surface tag exchange (cste) system for tracing and manipulation of cells during recombinase mediated cassette exchange integration of nucleic acid sequences to engineered receiver cells

Publications (1)

Publication Number Publication Date
KR20210030414A true KR20210030414A (ko) 2021-03-17

Family

ID=62909382

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217003789A KR20210030414A (ko) 2018-07-09 2019-07-09 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템

Country Status (10)

Country Link
US (1) US20210371875A1 (ko)
EP (2) EP3821017B1 (ko)
JP (1) JP2021524274A (ko)
KR (1) KR20210030414A (ko)
CN (1) CN112513279A (ko)
AU (1) AU2019301865A1 (ko)
CA (1) CA3105890A1 (ko)
ES (1) ES2965835T3 (ko)
SG (1) SG11202012381QA (ko)
WO (1) WO2020011757A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2925867B1 (en) * 2012-11-30 2018-06-27 Larix Biosciences LLC A novel cell line screening method
WO2017186718A1 (en) * 2016-04-25 2017-11-02 Universität Basel Allele editing and applications thereof
KR102625785B1 (ko) * 2016-11-07 2024-01-16 제노비에 에이비 T-세포 수용체 및 t-세포 항원의 식별 및 특징규명을 위한 조작된 다성분 시스템
NZ753794A (en) * 2016-11-07 2023-05-26 Genovie Ab An engineered multi-component system for identification and characterisation of t-cell receptors, t-cell antigens and their functional interaction

Also Published As

Publication number Publication date
EP4296363A3 (en) 2024-03-20
CN112513279A (zh) 2021-03-16
US20210371875A1 (en) 2021-12-02
EP3821017B1 (en) 2023-10-25
EP3821017C0 (en) 2023-10-25
CA3105890A1 (en) 2020-01-16
SG11202012381QA (en) 2021-01-28
JP2021524274A (ja) 2021-09-13
WO2020011757A1 (en) 2020-01-16
EP4296363A2 (en) 2023-12-27
EP3821017A1 (en) 2021-05-19
AU2019301865A1 (en) 2021-03-04
ES2965835T3 (es) 2024-04-17

Similar Documents

Publication Publication Date Title
KR102606929B1 (ko) 동족 항원과 t-세포 수용체 상호작용의 발견 및 특징규명을 위한 조작된 2-부분 세포 디바이스
CN110656090B (zh) 一种表达质粒、用于包装容量增加的二代腺病毒的细胞株及其应用
KR102274445B1 (ko) 게놈 삽입을 위한 방법
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
KR102584628B1 (ko) T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템
KR102614328B1 (ko) T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
US11820998B2 (en) Porcine Thy1 gene promoter specifically expressed in neurons
EP3635103A1 (en) Enhanced modified viral capsid proteins
CN1867669B (zh) 生产伽马-羧化的蛋白的方法
CN113186167B (zh) 用于测定抗cd20单克隆抗体药物adcp生物学活性的方法
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
KR20220024053A (ko) 타우병증의 모델
US20040255345A1 (en) Production of transgenic avians
KR20070114761A (ko) Siv­pedf 벡터를 사용한 안조직 세포에 있어서의아포토시스 변성을 동반하는 질환의 치료제
CN101160139A (zh) 含有pedf以及fgf2的伴随眼组织细胞凋亡变性的疾患的治疗药物
WO2022241455A1 (en) A synthetic circuit for buffering gene dosage variation between individual mammalian cells
KR20210030414A (ko) 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템
TW202228728A (zh) 用於同時調節基因表現之組合物及方法
CN102698291A (zh) 一种可提高细胞免疫应答的布鲁菌抗原基因组合rob
CN115029347B (zh) 识别和调控肝肾细胞纤维化的分子监测序列、重组质粒、抑制病毒
CN115704016A (zh) 一种利用dCas9-p450系统进行定点突变的方法