KR20210030414A - 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 - Google Patents
조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 Download PDFInfo
- Publication number
- KR20210030414A KR20210030414A KR1020217003789A KR20217003789A KR20210030414A KR 20210030414 A KR20210030414 A KR 20210030414A KR 1020217003789 A KR1020217003789 A KR 1020217003789A KR 20217003789 A KR20217003789 A KR 20217003789A KR 20210030414 A KR20210030414 A KR 20210030414A
- Authority
- KR
- South Korea
- Prior art keywords
- cst
- tedv
- encoded
- ters
- rmce
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1086—Preparation or screening of expression libraries, e.g. reporter assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
2가지 별도의 구성요소를 포함하는 조합 시스템으로서, 여기서 제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(TEDV)이고, 제2 구성요소는 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이며, 쌍을 이루는 재조합효소 매개 카세트 교환(RMCE) 요소는 TEDV 및 TERS에 포함되어 TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현한다.
Description
본 발명은 세포 조작(engineering) 및 재조합 DNA 기술의 분야에 관한 것이다. 특히 본 발명은 관심 유전자의 재조합효소 매개 카세트 교환(recombinase mediated cassette exchange: RMCE) 기반 통합 동안 조작된 세포를 생성, 정제, 추적 및 조작(manipulating)하기 위한 시스템 및 방법에 관한 것이다.
유전자 조작 및 면역학 분야에서, 재조합효소-매개 카세트 교환(RMCE)은 표적 유전자 변형을 위한 유용한 도구가 되었다(예를 들어, 문헌[Turan et al. Gene (2013):515:1-27] 참조). 일반적으로, 관심 유전자(gene of interest: GOI)가 올바른 위치에서 통합되었는지를 확인하기 위한 RMCE 후 방법은 세포 파괴 및 샘플 처리를 필요로 한다. 최근 기재된 접근법은 이와 같은 세포 파괴에 대한 필요성을 극복하고, 형광 마커 단백질의 발현에 따라 재조합 사건을 모니터링하고 단리할 수 있음을 보여준다(Phan et al. Sci Rep. (2017):7(1):17771). 판(Phan)외 다수에 의한 상기 접근법이 세포 파괴에 대한 필요성을 피하지만, 이는 세포내 단백질 형광에 의존하기 때문에, 형광 단백질에 의해 제공되는 고유한 스펙트럼 특성의 제한된 세트로 인해 통합 구조체의 고함량 스크리닝에 적합하지 않고; 결과적으로 제한된 수의 유전자만이 기재된 전략을 사용하여 동시에 표지되고 검출될 수 있다. 또한, 세포내 형광 단백질은, 세포 조작 작업 흐름(cell engineering workflow) 동안 고속대량(high-throughput) 및 병행화(parallelisation)에 대한 가능성, 또는 고함량 세포 라이브러리 조작의 효율을 증가시키기 위한 가능성을 제공하는, 기질 친화성 방법, 예컨대 자기 활성화 세포 분류(magnetic activated cell sorting: MACS)를 통해 세포를 분할하기 위한 물리적 조작에 적합하지 않다.
현재, 가까운 장래에 RMCE 기법을 이용하여, 특히 세포가 관심이 있는 개별 유전자의 풀을 포함하는 벡터 풀로 동시에 형질감염된 경우, 또는 기질 친화성 방법에 의한 세포의 선택이 바람직한 경우, 고속대량 및 고함량 적용 모두에서, 신속하고 강력한 세포 조작을 위한 도구에 대한 필요성이 존재한다. 따라서 효과적이고 개선된 방법을 제공할 분명한 필요성이 존재한다.
본 발명은 관심 유전자(GOI)의 재조합효소 매개 카세트 교환(RMCE) 기반 통합 동안 조작된 세포의 추적 및 조작을 위한 2-구성요소 세포 표면 태그 교환(cell surface tag exchange: CSTE) 시스템의 제공에 관한 것이다. CSTE 시스템의 첫 번째 부분은 스플라이스 수용체 부위를 포함하는 인트론 서열의 3' 단편이 측접하는 제1 세포 표면 태그(cell surface tag: CST)와 함께, 통합을 위해 GOI를 인코딩하는 태그-교환 공여체 벡터(tag-exchange donor vector: TEDV)를 나타낸다. TEDV 구조체에는 RMCE 요소가 측접한다. CSTE의 두 번째 부분은 선택 유전자를 인코딩하는 조작된 표적 세포의 게놈 내에 포함된 태그-교환 수용체 부위(tag-exchange receiver site: TERS), 및 또한 RMCE 요소, 및 GOI 코딩 서열에 측접하는 제2 RMCE 요소를 인코딩하는 완전한 인트론 서열이 인접하는 프레임내 막관통 도메인이 있는 제2 CST를 나타낸다. TERS에 의해 인코딩되는 CST는 본질적으로 단일 인트론이 인접한 2개의 엑손으로서 인코딩된다. TEDV 및 TERS 둘 다에 포함되는 쌍을 이루는 RMCE 요소는 2가지 구조체 사이의 RMCE의 실행이 TEDV에서 TERS로 CST 및 GOI의 교환을 초래하고, TERS CST 및 TERS에 의해 인코딩된 선택 유전자에서 상호 손실이 있도록 설계된다. TEDV에 의해 전달되는 CST는 TERS에 의해 인코딩된 막관통 도메인을 이용하며, 여기서 RMCE의 실행은 고유한 CST 엑손 서열의 교환을 초래한다. TERS로부터 CST 및 선택 유전자/GOI 발현을 구동시키는 프로모터 요소는 RMCE 교환된 구조체에 대해 외인성이므로, 따라서 TEDV에 의해 전달되는 서열은 일반적으로 RMCE의 충실한 실행 시에만 발현될 것이다. 이러한 CSTE 시스템은 CST에 의한 세포 표면에 제시된 친화성 에피토프의 검출에 의해 조건부로 보고되고, 또한 기질-고정화 친화성 방법으로 세포의 물리적 분할을 가능하게 하는 신속하고 강력한 RMCE를 가능하게 한다. 이러한 CSTE 시스템은 또한 CST 요소로서 다가 친화성 에피토프의 사용을 통해 GOI 통합의 다중화 및 계통 추적을 가능하게 한다. CSTE 시스템은 고속대량 및 고함량 적용 둘 다에서 신속하고 강력한 세포 조작을 위한 강력한 도구를 나타낸다.
제1 양태에서 본 발명은 2가지 별도의 구성요소를 포함하는 조합 시스템(combined system)을 제공하며, 여기서 제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향의 인코딩하는 태그-교환 공여체 벡터(TEDV)이고, 제2 구성요소는 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이며, 여기서 쌍을 이루는 재조합효소 매개 카세트 교환(RMCE) 요소는 TEDV 및 TERS에 포함되어, TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현한다.
일 실시형태에서, 제1 구성요소는,
a. 제1 RMCE 요소 - 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5'RMCE 요소
b. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편
c. 5'에서 3' 방향으로 TEDV-인코딩된 CST를 포함하는 엑손
d. 5'에서 3' 방향으로 인코딩된 CST에 대한 제1 전사 종결자 서열
e. 3'에서 5'으로 인코딩된 GOI에 대한 제2 전사 종결자
f. 3'에서 5' 방향으로 GOI를 인코딩하는 서열
g. 코작 서열(Kozak sequence)
h. 5' RMCE 요소
를 포함하는 TEDV이며,
여기서 CST 엑손 및 제1 전사 종결자는 GOI, 및 연관된 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩된다.
또 다른 실시형태에서 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 유형 2 막 단백질 막관통 도메인 엑손
d. 5' 인트론 스플라이스 공여체 부위
e. TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소
f. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열
g. 5'에서 3' 방향으로 TERS-인코딩된 CST를 포함하는 엑손(TEDV-인코딩된 CST와 상이함)
h. 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열
i. 3'에서 5' 방향에 대한 전사 종결자 서열
j. 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열
k. 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열
l. 3' RMCE 요소
m. CST 전사체의 발현의 조절 및 추적을 담당하는 3' 게놈 요소
를 포함하는 TERS이며,
여기서 막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시킨다.
제2 양태에서, 본 발명은 TERS 유전자좌로부터 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 방법을 제공하며, 상기 방법은
a. GOI를 인코딩하는 TEDV를 생성하는 단계
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 상기 TEDV를 전달하는 단계
c. TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
d. 통합된 GOI를 가지는 세포의 선택을 위한 프록시로서, 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 TEDV-인코딩된 CST의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함한다.
제3 양태에서, 본 발명은 3' 인트론 단편이 측접하는 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(TEDV)를 제공한다.
제4 양태에서, 본 발명은 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 세포 표면 태그(CST) 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포를 제공하며, 여기서 재조합효소 매개 카세트 교환(RMCE) 요소는 TERS에 포함되어 TERS와 태그-교환 공여체 벡터(TEDV) 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 관심 유전자(GOI)에 대한 리포터 요소의 교환을 초래한다.
본 발명은 RMCE에 의해 조작된 세포주로 GOI를 통합하는 시스템을 제공하며, 여기서 상기 통합의 보고는 공동-통합 세포 표면 태그(CST)의 분석에 의해 조건부로 검출된다. 더욱이, GOI의 통합시, 조작 세포주로부터 별개의 CST의 수반되는 손실은 GOI-발현 파생 조작된 세포의 이중 양성/음성 선택을 가능하게 한다. 이러한 '태그-교환'은 매우 강력하며 CSTE 시스템에 의해 가능하게 된 엄격한 양성/음성 선택을 위한 기반이다. 제2 선택 유전자는 또한 TERS 부위로부터 손실되어, GOI를 발현하는 파생 조작된 세포의 생성 동안 매우 강력한 이중 음성 선택 및 단일 양성 선택을 가능하게 한다. 중요하게도, CST 시스템의 특성은 검출을 위해 동족 친화성 시약의 선택적인 추가를 필요로 하는 조건부의 이들 마커뿐만 아니라, 또한 기질-고정화 친화성 시약 방법론의 사용에 의해 표적 세포 집단을 물리적으로 분할하는 데 활용될 수도 있게 함을 의미한다. 이는 형광-활성화 세포 분류(FACS)와 같은 방법론을 비교하기 어렵고 시간이 더 많이 소모되는 방법과 달리, 자기 활성화 세포 분류(MACS)와 같은 방법을 사용하는 세포의 분할을 통해 파생 조작된 세포 생성을 위한 효율적인 고속대량 방법을 가능하게 한다. 마지막으로, 통합 마커로서 형광 단백질 및 항생제 내성 유전자의 세포내 발현을 대체함에 있어서 CSTE 시스템은 훨씬 더 큰 선택가능한 마커 공간을 제공한다. 구체적으로, 광범위하게 중첩되는 형광 단백질 또는 고도로 제한된 항생제 내성 유전자 세트와 달리, 조건부 선택을 위한 다수의 고유한 CST 에피토프의 생성은 용이하게 달성된다. 선택가능한 마커에 대한 이러한 광범위한 접근은 효율성을 증가시키면서 다양한 형태의 고속대량 파생 세포 생성을 가능하게 하고, 세포 조작, 경로 조작 및 실험 작업 흐름에서 세포 라이브러리 형성 및 세포 계통 추적 둘 다를 위한 고함량 방법을 추가로 가능하게 한다.
CSTE 시스템의 전반적인 아키텍처 및 작동은 도 1에 도시되어 있다. CSTE 시스템은 공여체/수신기 쌍으로서 작동하며, 여기서 태그-교환 공여체 벡터(TEDV)는 GOI 서열, 및 세포-표면 태그(CST) 엑손을, 일반적으로 조작된 세포주의 게놈 내에 포함되어 있는 쌍을 이루는 태그-교환 수용체 부위(TERS)로 전달하는 역할을 한다. TERS는 별개의 CST 엑손 및 선택 유전자를 인코딩하며, 이들은 각각 TEDV-인코딩된 CST 및 GOI로 교환된다.
TEDV-인코딩된 CST 엑손은 센스(5'에서 3') 방향으로, 그리고 스플라이스 수용체 부위, 폴리피리미딘 관 및 분지점 서열을 포함하는 3' 인트론 단편이 있는 프레임에서 인코딩된다. '비-기능성' 인트론 서열 내 이러한 기능성 인트론 서열의 5'에 대하여 제1 RMCE 요소가 인코딩된다. GOI는 안티센스(3'에서 5') 방향으로 인코딩된다. GOI 전사 시작 부위에 인접한 구조체의 3' 말단에 대하여 제2 RMCE 요소가 인코딩된다.
조작된 세포주에 의해 운반된 쌍을 이루는 TERS 구조체는, TEDV의 제1 RMCE 요소와 쌍을 이루고 동등한 맥락에 있는 '비-기능성' 인트론 서열 내 제1 RMCE 요소를 이용하여, 완전한 인트론 서열을 가지는 프레임에서 CST 엑손을 인코딩한다. 이러한 제1 RMCE 부위가 인코딩되는 완전한 인트론 서열은, 그 자체가 막관통 도메인(TD) 엑손과 프레임 내에서 인코딩되는 5' 스플라이스 공여체 부위를 포함한다. 이러한 TD는 전사 시작 부위 및 프로모터 서열을 포함하여 TERS 구조체의 5'으로 전사를 구동시킨다. 따라서, TERS-인코딩된 CST는 일단 스플라이싱된 전사체로부터 번역되면 세포 표면에서 발현된다. 유사하게, 일단 TEDV와 TERS 사이에서 RMCE가 실행되면, CST 엑손에서 인코딩된 TEDV는 TERS-인코딩된 CST 엑손과 교환된다. 이는 '태그-교환'의 실행을 초래하며, 여기서 파생 조작된 세포주는 이제 세포 표면에서 TEDV-인코딩된 CST를 발현하고, TERS-인코딩된 CST를 발현하지 않는다. 이러한 과정에서, TEDV-인코딩된 CST 엑손은 TERS 구조체로부터 5' 스플라이스 공여체 부위, TD 도메인, 전사 시작 부위 및 프로모터 서열을 '획득'하여 TEDV-인코딩된 CST의 발현을 가능하게 하여, TEDV-인코딩된 서열의 통합보다 엄격한 부위-특이적 제어를 제공한다.
상기 언급한 바와 같이, TERS는 안티센스(3'에서 5') 방향으로 선택 유전자를 인코딩하며, 이 때 프로모터 서열은 TERS 구조체의 3' 말단으로 이 선택 유전자의 전사를 구동시킬 수 있다. 선택 유전자의 전사 시작 부위와 TERS의 3' 프로모터 서열 사이에서, 제2 RMCE 요소가 인코딩되고, TEDV에서 인코딩된 제2 5' RMCE 요소와 쌍을 이룬다. 따라서, RMCE가 TEDV와 TERS 사이에서 실행될 때, TEDV-인코딩된 GOI는 TERS-인코딩된 선택 유전자와 교환된다.
TEDV에는 프로모터 서열이 포함되어 있지 않으므로, 따라서 TEDV-인코딩된 CST 엑손과 GOI는 둘 다 이들의 전사를 가능하게 하는 프로모터 서열로 보완되어야 한다는 점에 유의하는 것이 중요하다. 중요한 점은, 상기 개괄한 바와 같이, CST 엑손에 대한 인트론 및 TD 엑손 보완의 포함은 TEDV-인코딩된 서열의 통합을 위한 훨씬 더 엄격한 부위 선택성을 제공한다는 것이다. CSTE에서 인트론 요소의 사용은 구조체의 무작위 통합이 세포 표면 상에서 발현가능한 TEDV-인코딩된 CST를 제공하지 않을 것이라는 추가적인 보장 수준을 제공한다. TD를 포함하여 전체 CST ORF를 전달할 공여체 벡터와 대조적으로, CSTE 세스템은 단지 CST 에피토프 엑손과 스플라이스 수용체 부위만 제공한다. 따라서, 공여체 구조체의 무작위 비정상적인 통합은 활성 프로모터에 인접하게 통합될 필요가 있을 뿐만 아니라, 적절한 5' 스플라이스 공여체 서열과 함께 유형 II 막관통 도메인, 또는 등가물의 획득을 필요로 할 것이다. 이는 TEDV-인코딩된 CST를 발현하는 무작위로 통합된 구조체의 발생 가능성을 극히 낮게 하여, 전달된 GOI를 발현하는 파생 조작된 세포의 생성 동안 이와 같은 무작위 및 원치않는 사건의 선택을 최소화한다.
TEDV 및 TERS를 포함하여 CSTE 시스템 구성요소의 구체적인 아키텍처는 하기 상술되어 있다.
TERS
아키텍처
조작된 세포주 내에 포함된 TERS는 TERS-인코딩된 CST 및 선택 유전자를 구성적으로 발현하며, 이들은 쌍을 이루는 TEDV와 함께 RMCE의 실행 시 각각 TEDV-인코딩된 CST 및 GOI로 교환된다. TERS의 일반적 아키텍처는 포함하지만, 이들로 제한에 도시되어 있다.
TERS는 전형적으로 하기를 포함한다:
a) 코작 서열
b) 유형 2 막 단백질 막관통 도메인을 인코딩하는 엑손.
c) 5' 인트론 스플라이스 공여체 부위.
d) TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소.
e) 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열.
f) 5'에서 3' 방향으로 TERS-인코딩된 CST를 포함하는 엑손.
g) 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열.
h) 3'에서 5'으로 인코딩된 선택 유전자에 대한 전사 종결자 서열.
i) 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열
j) 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열
k) 3' RMCE 요소
x) CST 전사체의 발현 및 추적의 조절을 담당하는 5' 게놈 요소. 이 게놈 요소는 최소한 CST 전사를 구동시키는 프로모터 서열을 포함함.
y) 선택 유전자 전사체의 발현 및 추적의 조절을 담당하는 3' 게놈 요소. 이 게놈 요소는 최소한 선택 유전자 전사를 구동시키는 프로모터 서열을 포함함;
여기서, a)는 RMCE에 대한 실행 이전에 TERS-인코딩된 CST, 및 RMCE의 실행이후 TEDV-인코딩된 CST 둘 다에 대해, TERS로부터 구동된 인접한 TD/CST 전사체로부터 효율적인 번역 개시를 보장하도록 제공되고; b)는 전사체 스플라이싱에 의해 CST 엑손에 인접한 TD를 나타내고, 세포 원형질막에서 번역된 단백질 구조체의 삽입물을 매개하며, CST를 세포외 공간에 제시하고; c)는 TERS 구조체의 인트론 서열 내에 위치한 RMCE 요소이며, TEDV의 5' RMCE 요소와 동등하여, CSTE 시스템 내에서 RMCE의 실행 시 CST 엑손 교환을 매개하고; e)는 스플라이스 수용체 부위 및 인트론의 연관된 기능성 서열로서, TERS로부터 구동되는 TD/CST 전사체로부터, RMCE 요소를 포함하는 인트론의 스플라이싱을 가능하게 하고; f)는 TERS 부위 내의 CST 에피토프(들)를 인코딩하여 발현된 TD/CST 단백질이 상기 에피토프를 세포외 공간에 제시하고, 조건부로 동족 친화성 시약으로 검출될 수 있는 엑손이고; g)는 5'에서 3' 방향으로 인코딩된 TD/CST 오픈 리딩 프레임에 대한 전사 종결자를 나타내고; h)는 TERS 내에서 3'에서 5' 방향으로 인코딩된 선택 유전자 오픈 리딩 프레임에 대한 전사 종결자를 나타내고; i)는 조작된 세포주에서 TERS로부터 발현된 선택 유전자를 인코딩하는 오픈 리딩 프레임을 나타내고; j)는 RMCE의 실행 이전에 TERS로부터 구동된 선택 유전자 전사체로부터 효율적인 번역 개시를 보장하도록 제공되는 코작 서열이고; k)는 선택 유전자의 전사 시작 부위와 이러한 오픈 리딩 프레임의 전사를 구동시키는 프로모터 서열 사이에 위치하는 RMCE 요소로서, TEDV의 3' RMCE 요소와 동등하여, CSTE 시스템 내에서 RMCE에 의해 실행 시 TEDV-인코딩된 GOI와 선택 유전자의 교환을 매개하고; x)는 RMCE 이전에 TERS에 의해 인코딩된 TD/CST 오픈 리딩 프레임, 및 RMCE의 실행 이후 TEDV-인코딩된 TD/CST의 전사를 구동시키는 프로모터 서열을 최소한으로 나타내고; y)는 RMCE 이전에 TERS에 의해 인코딩된 선택 유전자 오픈 리딩 프레임, 및 RMCE의 실행 이후 TEDV-인코딩된 GOI의 전사를 구동시키는 프로모터 서열을 최소한으로 나타낸다.
TERS 클로닝 단편의 개략도는 포함하지만, 이들로 제한에 제시되어 있다.
TERS는 본질적으로 5' RMCE 부위를 포함하는 완전한 기능성의 인트론 서열을 인코딩한다. 이와 같은 서열은 숙주 조작된 세포의 맥락에서 TD/CST 전사체의 효율적인 스플라이싱을 가능하게 하는 임의의 인트론을 나타낼 수 있다. TEDV의 스플라이스 수용체 부위는 TERS의 스플라이스 공여체 부위와 함께 기능성일 것이 요구된다. 따라서, TEDV 및 TERS 인코딩된 스플라이스 수용체 서열은 동일하거나 동등해야 한다.
RMCE 부위가 인코딩되는 비-코딩 및 '비-기능성' 인트론 서열은 또한 유전 요소, 예컨대 전사 인핸서, 전사 절연체, 조작된 세포 내에서 TERS 구조체의 기능 또는 보고를 위한 별도의 바람직한 구성요소를 인코딩하는 별개의 오픈 리딩 프레임, 또는 전사체 및/또는 구조체 추적 및 정량화에 사용되는 다른 고유한 서열을 추가로 인코딩할 수 있다.
TERS의 맥락에서, 인코딩된 TD/CST 및 선택 유전자 둘 다 5' 및 3' 비번역 영역(UTR)을 포함할 수 있으며, UTR은 예를 들어 전사체 및/또는 구조체 추적 및 정량화에 사용되는 고유한 서열을 인코딩하거나, 전사체 안정성의 조절을 부여한다.
선택 유전자는
a. 항생제 내성 유전자,
b. 리포터 유전자
c. 영양요구성 보완 유전자,
d. 유도성 자살 유전자
로부터 선택될 수 있으며, 여기서 이와 같은 양성 선택 마커의 선택, 형식 설정(formatting) 및 적용은 당업자에게 잘 알려져 있다. 유도성 자살 유전자의 사용은 GOI를 발현하는 파생 조작된 세포의 생성에서 RMCE의 실행 후 모 조작된 세포를 제거하는 데 사용될 수 있다. 리포터 유전자는 세포 표면에서 조건부 또는 구성 보고를 위한 고유한 TD/CST 구조체를 나타낼 수 있다. 조작된 세포주 생성 동안 양성 선택, 및 파생 조작된 세포주 생성 동안 음성 선택을 가능하게 하기 위해, 다중 선택 유전자가 TERS의 이 부분에 포함될 수 있다.
5' 및 3' 게놈 요소는 TD/CST 및 선택 유전자의 전사를 매개하는 프로모터 서열을 최소한으로 인코딩한다. 이와 같은 프로모터는 유도성 프로모터의 구성을 나타낼 수 있다. 이러한 게놈 요소는 또한 유전 요소, 예컨대 전사 인핸서, 전사 절연체, 조작된 세포 내에서 TERS 구조체의 기능 또는 보고를 위한 별도의 바람직한 성분을 인코딩하는 별개의 오픈 리딩 프레임, 또는 구조체 추적 및 정량화에 사용되는 다른 고유한 서열을 추가로 인코딩할 수 있다.
본 설명에서, TD/CST는 (도 3에 나타낸 바와 같이) 센스(5'에서 3') 방향으로 인코딩되고, 선택 유전자는 안티센스(3'에서 5') 방향으로 인코딩된다는 점에 유의하는 것이 중요하다(포함하지만, 이들로 제한에 도시한 바와 같음). 이는 설명의 명확성을 위한 것이다. TD/CST 구조체가 또한 TEDV의 3' 인트론 단편 내에서 동등한 RMCE 부위와 쌍을 이루는 RMCE 부위를 인코딩하는 기능성 인트론 서열을 통합할 수 있다면, 이러한 방향이 TERS/TEDV 맥락에서 반전될 수 없는 실질적인 이유가 없다.
선택 유전자의 포함은 CSTE 시스템의 작동에 절대적으로 필요한 것은 아니지만, RMCE의 실행 시 GOI 관심의 발현을 위한 삼중 선택을 돕기 위해 바람직하다. 또한, 센스 및 안티센스 방향 둘 다에서 리포터의 사용에 의한 조작된 세포주의 생성 및 유지는 5' 및 3' 게놈 요소 내에 포함된 프로모터 서열이 RMCE의 실행 이전에 완전히 기능성이어서 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 것을 보장한다.
세포 표면 태그(CST) 아키텍처
CSTE 시스템의 주요 기능성 특성 중 하나는 여러 고유한 CST 구조체를 사용하여 초기 TERS 구조체, 및 RMCE의 실행 시 TEDV-인코딩된 서열을 통합하는 교환된 구조체의 존재를 조건부로 보고하는 것이다.
CSTE 시스템 내에서 TD 보완 배열을 달성하기 위해, 특정 유형의 TD 엑손만 적합하다. 즉, 3'에 위치한 CST 엑손과 함께 스플라이싱될 수 있으면서, 또한 CST 단백질 단편이 세포외로 노출되는 것을 허용한다.
발현된 CST 에피토프-제시 단백질 산물을 단순화하고, TD 엑손의 크기 및 복잡성을 최소화하기 위해, 유형 II 막 단백질 유래의 TD가 가장 적합하다. 유형 II TD는 단일 통과이고, 막의 세포질 측면을 향하는 단백질의 N-말단에 위치하여, C-말단 CST 에피토프가 세포외로 노출될 수 있게 한다. 스플라이싱된 CST 전사체가 CST 에피토프를 세포외 공간에 노출시킨다면, 다중-통과 TD를 포함하여 다른 TD가 사용될 수 있다.
스플라이싱된 전사체에서 TD에 인접한 CST 엑손은 동족 친화성 시약의 사용에 의해 조건부로 검출될 수 있는 고유한 에피토프를 단순히 세포외로 제시하는 기능을 가진다. 일반적으로, 이와 같은 에피토프는 합성 서열, 숙주 조작된 세포의 것 유래의 별개의 유기체에 의해 인코딩된 서열, 또는 숙주 조작된 세포와 동일한 유기체 유래의 서열이지만 세포외로 발현되지 않는 서열을 포함한다.
일반적으로 TD와 CST 에피토프 사이에 링커 도메인을 포함하는 것이 바람직하다. CST 에피토프는 몇 개 정도의 아미노산으로 구성될 수 있지만, 이와 같은 링커 영역은 친화성 시약 결합을 위해 세포 표면에서 CST의 이용가능성을 보장한다. 이와 같은 링커 영역은 가요성 '비구조화' 영역, 또는 구조적으로 완전히 접힌 단백질 도메인을 포함할 수 있다.
CST 엑손에 의해 인코딩된 에피토프의 특성은 단지 TERS를 포함하는 조작된 세포의 세포 표면에서 다르게 발현되는 에피토프의 맥락에서만 고유성을 반영하므로, 따라서 특정 친화성 시약이 생성될 수 있는 임의의 단백질 서열을 나타낼 수 있다.
일반적으로, CST 구조체는 전체적으로 세포 기능과 관련하여 기능적으로 중립적이어야 한다. 종종 링커 서열을 통해, 외인성 기능성 도메인이 없는 불활성 에피토프 구조에 단순히 융합된 막관통 도메인이 바람직하다.
본 맥락에서, 친화성 시약은 CST 에피토프의 활성을 확인, 추적, 포획, 또는 달리 이에 영향을 미치기 위해 더 큰 표적 분자에 특이적으로 결합하는 임의의 항체, 펩타이드, 핵산, 또는 다른 소분자로 정의된다. 종종 이와 같은 친화성 시약은 동족 CST를 발현하는 세포의 추적을 위해 형광, 비색, 방사성 또는 다른 검출가능한 표지로 표지될 것이다. 대안적으로, 이와 같은 친화성 시약은 기질 친화성 강화 방법이 CST-발현 조작된 세포를 분할시킬 수 있도록 기질에 대해 작용화될 수 있다.
TERS를
포함하는 조작된 세포주
합성 TERS 구조체가 삽입되어 있으므로, TERS를 포함하는 세포주는 조작되어야 한다. 일반적으로, 이는 TERS 구조체의 조작된 세포의 게놈으로의 통합을 의미할 것이지만, 또한 TERS 구조체의 핵 유지를 위한 다른 방법, 예컨대 유전자 구조체의 에피솜 유지를 위한 방법을 포함할 수 있다.
표적 포유동물 세포의 게놈에 구조체를 통합하는 방법은 당업자에게 잘 알려져 있고, 상동성 유도 재조합(HDR) 및/또는 무작위 통합 방법을 통해 달성될 수 있으며, 여기서 HDR은 HDR이 일어나는 유전자좌의 표적화된 돌연변이에 의해 촉진될 수 있고,
i. 징크-핑거 뉴클레아제
ii. CRISPR/Cas9 매개 표적화
iii. 합성 전사 활성화-유사 이펙터 뉴클레아제(TALEN)
를 통한 부위 지정 돌연변이유발을 포함하지만, 이들로 제한되는 것은 아닌 다양한 수단을 통해 달성될 수 있으며,
여기서 상기 부위-지정 뉴클레아제는 표적 유전자좌에서 HDR에 의한 부위-특이적 DNA-수선을 유도한다. 이와 같은 사건 후, 세포의 비율은 HDR 벡터를 포함할 것이고,
iv. 비파괴적 표현형 발현 분석
v. 파괴적 표현형 발현 분석
vi. 유전 분석
의 임의의 조합을 통해 선택되고/거나 결정될 수 있으며,
여기서 iv 및 vi은 성공적인 게놈 통합 사건의 선택 및 결정을 위한 바람직한 방법이다.
대안적으로, 바이러스 벡터가 부위-지정 또는 비지정 방식으로 필요한 구성요소를 전달하는 데 사용될 수 있다.
세포 표면에서 검출가능한 TERS-인코딩된 CST가 있고, 발현된 선택 유전자가 존재한다면, TERS 구조체 통합의 방법론은 TERS 작동의 중심이 아니며, 이는 구조체가 포함된 코딩 서열의 전사와 관련하여 기능성임을 나타낸다. 실제로, TERS-인코딩된 CST 및 선택 유전자는 둘 다 TERS를 포함하는 조작된 세포주의 생성을 위한 편리한 선택가능한 마커이다.
주목해야할 한 가지 중요한 양태는 일부 응용분야, 특히 TEDV 구조체의 라이브러리로부터 단일 GOI를 발현하는 파생 조작된 세포주의 세포-기반 어레이를 생성하는 능력을 활용하는 경우 통합된 TERS 구조체의 복제수 제어에 대한 요구사항, 및 유사한 '다중' 방법이 필요하다는 것이다. 이를 주목하면, TERS 구조체의 에피솜 유지는 파생 조작된 세포주 생성을 위한 이와 같은 다중 방법과 대체로 양립할 수 없을 것이다. 조작된 세포주의 게놈 내에서 구조체 복제수의 규명 방법은 당업자에게 잘 알려져 있다.
TEDV
아키텍처
TEDV는 각각 RMCE의 실행 시 TERS에 의해 인코딩되는 CST 엑손 및 선택 유전자와 교환될 CST 엑손 및 GOI를 인코딩하며, 여기서 TERS는 조작된 세포주 내에 포함된다. TEDV의 일반적인 아키텍처는 도 2에 도시되어 있다.
TEDV는 전형적으로
1) 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소.
2) 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편.
3) 5'에서 3' 방향으로 TEDV-인코딩된 CST를 포함하는 엑손.
4) 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열.
5) 3'에서 5'으로 인코딩된 GOI에 대한 전사 종결자 서열.
6) 3'에서 5' 방향으로 GOI를 인코딩하는 서열.
7) 코작 서열.
8) 3' RMCE 요소
를 포함하며,
여기서, 1)은 TEDV 구조체의 3' 인트론 단편의 인트론 비-코딩 및 비-기능성 서열 내에 위치한 RMCE 요소를 나타내고, TERS의 5' RMCE 요소와 동등하여, CSTE 시스템 내에서 RMCE의 실행 시 CST 엑손 교환을 매개하고; 2)는 TEDV와 TERS 사이에서 RMCE의 실행 후 통합된 TEDV-인코딩된 CST 엑손의 TD/CST 전사체의 효율적인 스플라이싱의 실행을 위해 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 제공하여 GOI를 발현하는 파생 조작된 세포를 생성하는 3' 인트론 단편이고; 3)은 TEDV와 TERS 사이에서 RMCE의 실행 이후 보완된 발현된 TD/CST 단백질이 CST 에피토프를 세포외 공간에 제시하도록 하고, 동족 친화성 시약으로 조건부로 검출될 수 있는 TEDV 구조체 내 CST 에피토프(들)를 인코딩하는 엑손이고; 4)는 5'에서 3' 방향으로 인코딩된 CST 엑손에 대한 전사 종결자를 나타내어, RMCE의 실행 시 TEDV-인코딩된 CST로 보완된 TD/CST의 전사 종결자의 역할을 하고; 5)는 TEDV 내에서 5'에서 3' 방향으로 인코딩된 GOI 오픈 리딩 프레임에 대한 전사 종결자를 나타내어, RMCE의 실행 시 TERS 부위로 통합되면 인코딩된 GOI의 전사 종결 역할을 하고; 6)은 조작된 세포로 통합된 GOI를 인코딩하여 GOI를 발현하는 파생 조작된 세포를 생성하는 오픈 리딩 프레임을 나타내고; 7)은 RMCE의 실행 이후 TERS로부터 구동되는 GOI 전사체로부터 효율적인 번역 개시를 보장하도록 제공되고; 8)은 TEDV 구조체의 3' 말단의 RMCE 부위이고, 선택 유전자의 전사 개시 부위와 이러한 오픈 리딩 프레임의 전사를 구동시키는 프로모터 서열 사이에 위치하는 TERS의 3' RMCE 부위와 동등하다.
TEDV 클로닝 단편의 개략도는 도 2에 제시되어 있다.
TEDV는 합성된 DNA 구조체, 또는 당업자에게 잘 알려진 방법에 의해 생성된 클로닝된 구조체를 나타낼 수 있다. 클로닝 방법론을 돕기 위해, TEDV는 다양한 CST 엑손 및/또는 GOI 서열을 구조체에 삽입하기 위한 제한 엔도뉴클레아제 서열을 포함할 수 있다. 이와 같은 클로닝 부위의 포함 및 사용은 당업자에게 잘 알려져 있다.
본 맥락에서, TEDV는 일반적으로 박테리아에서 번식된 플라스미드 구조체일 것이며, 따라서 또한 복제 기점 및 선택 유전자를 포함할 수 있다.
TEDV는 또한 상기 구조체를 특정 전달 벡터, 예컨대 당업자에게 잘 알려진 바이러스 벡터 내로 패키징할 수 있는 서열 모티프를 가지는 구조체를 나타낼 수 있다. TERS를 포함하는 조작된 세포의 바이러스 벡터 형질도입의 사용은 그렇지 않으면 형질감염이 어려운 세포에서 CSTE 시스템의 사용에 유익할 것이다.
TEDV는 RNA 구조체를 나타낼 수 있으며, 이는 적절한 역전사효소의 제공으로 역전사될 수 있다.
본 맥락에서, GOI는 임의의 핵산 코딩 또는 비-코딩 관심 서열에 의해 정의된다. 이는 임의의 단백질- 또는 폴리펩타이드-오픈 리딩 프레임, 비-단백질-코딩 RNA, 예컨대 마이크로RNA, 짧은 헤어핀 RNA, tRNA 또는 rRNA를 포함할 수 있다.
중요한 점은, GOI는 단일 오픈 리딩 프레임의 변이체의 라이브러리를 나타낼 수 있고, 이와 같은 GOI를 인코딩하는 TEDV는 TEDV의 풀링된 라이브러리로 따를 수 있다는 것이다. CSTE 시스템에 의해 활성화된 복제수에 대한 정확한 제어, 및 GOI 통합에 대한 신뢰할 수 있는 다중 인자 및 조건부 보고로 인해, 고함량의 파생 조작된 세포의 라이브러리가 생성되어 표적 세포의 풀에서 각각의 파생 조작된 세포의 단일 GOI만을 발현할 수 있다. 이는 실행가능한 세포 상황에서 다양한 세포, 경로, 단백질 및 특정 GOI 조작에 활용될 수 있다(하기 참조).
RMCE 요소 및 효소
부위-특이적 재조합효소(SSR)의 사용은 세포의 게놈을 변형하기 위한 예측가능한 도구인 것으로 입증되었다. SSR에는 2가지 주요 부류, 즉 ΦC31, γδ-res, ParA, Tn3, Gin, ΦBT1, R4, Bxb1, TP901-1을 포함하지만, 이들로 제한되는 것은 아닌 Ser 인테그라제, 및 Flp, Cre, R을 포함하지만, 이들로 제한되는 것은 아닌 Tyr 재조합효소가 있다. 두 부류 모두 RMCE를 수행할 수 있지만, Ser 인테그라제는 초기 크로스오버에 따라 제한이 있으므로 원하는 TEDV-인코딩된 CST 및 GOI 또는 TEDV 벡터 백본의 도입일 일어날 것이다. 모든 Tyr 재조합효소가 포괄적 실험적으로 평가된 것은 아니지만, Cre 및 Flp는 RMCE를 수행하는 데 광범위하게 사용되었다. TEDV-인코딩된 CST 및 GOI 유전 요소의 단일 복사체를 통합할 목적으로, 특성 규명이 잘 된 이종특이적 FRT 부위와 함께 Flp를 사용하는 것은 인간 게놈에서 인코딩된 유사 FRT 부위의 결여로 인해 가장 적합하다. 이는 LoxP 게놈 유사부위에 대한 난잡한 활성을 나타내는 Cre의 경우에서는 아니다.
파생 조작된 세포 생성 방법
포유동물 세포에서 RMCE의 사용은 당업자에게 잘 알려져 있으며, 여기서 공여체 구조체는 화학적 형질감염, 전기천공 또는 바이러스 벡터 전달을 포함하지만, 이들로 제한되는 것은 아닌 다양한 방법론에 의해 표적 세포로 전달될 수 있다. 공여체 구조체의 제공에 추가적으로, 특정 재조합 효소(들)도 또한 제공되어야 한다. 이는 일반적으로 공여체 구조체와 함께 표적 세포로 공동-전달되는 별도의 발현 구조체로서 제공될 것이다. 일부 예에서, TERS를 발현하는 조작된 세포를 변형하여 전반적인 공정의 효율성을 증가시키기 위해 필요한 재조합 효소를 조건부로 발현하는 것이 바람직할 수 있다.
CSTE 시스템의 맥락에서, TERS를 포함하는 조작된 세포로 TEDV의 전달에 의해 RMCE가 실행된 다음, 파생 기간이 뒤따르면, TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 생성을 위해 표적 세포 집단이 분석되거나 선택될 수 있다. 이는 CSTE 시스템에 고유하고, GOI 발현의 검출에 무관한 3가지 방법으로 수행될 수 있다.
파생 조작된 세포주는 성공적인 태그-교환의 반영으로서 TERS-인코딩된 CST의 음성 선택, 및/또는 TEDV-인코딩된 CST의 양성 선택을 기초로 선택될 수 있다. 이들은 조건부로 기록되며, 각각의 CST에 대해 동족 친화성 시약의 추가를 필요로 한다. 이와 같은 선택 방법론은 형광으로 표지된 친화성 시약의 추가 및 원하는 CST 발현 프로파일의 선택을 통해 FACS를 활용할 수 있다. CST 에피토프의 세포외 제시로 인해, 세포 분할은 또한 기질-기반 풍부화 접근법, 예컨대 MACS를 통해 달성될 수 있다.
TERS-인코딩된 선택 유전자를 기초로 추가의 음성 선택이 달성될 수 있으며, 여기서 상기 선택 유전자는 리포터 유저자 또는 유도성 자살 유전자를 나타낸다. 리포터 유전자는, 예를 들어 형광 리포터 유전자의 경우에 FACS, 또는 리포터 유전자 자체가 고유한 CST를 나타내는 경우 FACS 및/또는 MACS를 이용할 수 있다. 유도성 자살 유전자를 사용하여 배양물로부터 모 조작된 세포를 음성으로 선택할 수 있으며; 예를 들어 GOI를 발현하는 파생 조작된 세포를 풍부하게 할 수 있다.
전반적으로 이중 양성 선택 및 단일 음성 선택은 파생 조작된 세포의 매우 강력한 선택을 제공하며, 이는 조건부로 기록될 수 있고, 기질-고정화 친화성 시약을 이용하여 세포를 분할하는 데 사용될 수 있다. 이러한 선택은 상기 TEDV-인코딩된 GOI의 특성이 파생 조작된 세포 내에서 비-파괴적인 검출로 수정될 수 있는 경우, TEDV-인코딩된 GOI에 대한 양성 선택을 추가적으로 포함할 수 있다. 상기 언급된 선택은 고속대량 또는 정확한 고함량 파생 조작된 세포 집단을 달성하는 데 연속하여 또는 동시에 사용될 수 있다.
이러한 상기 표현형 분석은 일반적으로 당업자에게 잘 알려진 방법을 이용하여 파생 조작된 세포의 TEDV 서열의 복제수의 유전형 확인에 의해 뒷받침될 것이다. 이는 또한 CST 발현의 매우 표준화된 맥락을 고려할 때 어느 정도 표현형으로 달성될 수 있으며, 여기서 TEDV 구조체의 비정상적인 통합이 세포 표면에서 TEDV-인코딩된 CST의 발현을 초래하는 매우 드문 경우가, 특히 FACS 선택 방법론을 이용할 때 높은 TEDV-인코딩된 CST 발현으로 세포를 배제함으로써 부정적으로 선택될 수 있다. 다중 TERS 부위를 발현하는 조작된 세포의 경우(하기 참조), 복제수 제어는 세포 표면에서 발현된 TEDV-인코딩된 CST의 정도를 기반으로 유사하게 달성될 수 있다.
세포의 기질-고정화 친화성 시약 분할 방법
CSTE 시스템의 주요 장점은 CST 에피토프의 세포 표면 노출, 및 이에 따른 기질 고정화 친화성 방법을 기초로 세포를 분할하는 능력이다. 이는 고속대량 방법, 또는 고함량 파생 조작 세포 라이브러리 생성에서 단계적 선택에 특히 유용하다. 당업자에게 잘 알려진 방법론은 표면 에피토프의 특이적 발현을 기반으로 한 세포의 포획 및 물리적 분할을 위한 다양한 다른 친화성 시약-작용화 기질 중에서 강자성 비드-기반 MACS 접근법이다. 세포 표면 CST 발현을 기반으로 한 이와 같은 신속한 조건부 양성 및/또는 음성 선택은, 항생제 내성 선택을 제공하는 훨씬 더 빠른 속도 및 정확성, 및 세포내 형광 단백질로 제한되는 FACS 선택과 비교하여 훨씬 더 빠른 속도 및 비용 감소로, 매우 병렬적이고 따라서 고속대량 방법론에 적합하다. 더욱이, 모 조작된 세포 및 파생 조작된 세포를 둘 다 양성 및 음성 선택하는 능력은 하나 이상의 GOI를 발현하는 파생 조작된 세포의 정확한 고함량 라이브러리 생성을 야기한다.
다중 및 다가 CST를 이용하는 세포 표면 '
바코딩
' 방법
CSTE 시스템의 장점은 이용가능한 선택 마커 공간의 양이 증가한다는 것이다. 단지 소수의 병렬화가능한 마커로 제한되는 표준 형광 단백질 리포터 및 항생제 내성 유전자 시스템과 대조적으로, 동족 친화성 시약을 이용한 단순한 에피토프를 사용함으로써 다수의 고유한 마커가 신속하게 생성될 수 있다. 다중-에피토프 CST 도메인은 이용가능한 CST 에피토프 및 동족 검출 시약의 고유한 모든 조합에 대해 용이하게 구성될 수 있으므로, 이용가능한 CST 에피토프 및 동족 시약의 수에 의해서만 제한되지 않는다. 확장되고 병렬화가능한 조건부 리포터 공간은 다양한 고속대량 및 고함량 방법론을 가능하게 한다.
각각 상이한 GOI, 또는 GOI 변이체 서열과 연관된 다중 TEDV-인코딩된 에피토프의 사용은, 고속대량 세포 조작에서 효율성을 증가시키는 데 사용될 수 있다. 예를 들어, 이와 같은 고유한 벡터의 풀은 TERS를 발현하는 조작된 세포의 풀로 통합될 수 있다. 이는 상기 개괄한 바와 같이 음성 선택을 통해 대량 처리될 수 있으며, 고유한 TEDV-인코딩된 CST 발현을 기초로 이후에 분할될 수 있다.
유사하게, 다중-TEDV-인코딩된 CST 에피토프의 사용은 실행가능한 세포 계통 추적 및 선택을 위한 중간함량 라이브러리의 생성을 가능하게 한다. 예를 들어, 고유한 CST와 연관된 GOI의 라이브러리는 파생 조작된 세포의 풀로 통합될 수 있고, 특이적 GOI를 발현하는 세포 계통의 지속성 또는 기능을 시간에 따라 추적할 수 있다. 이는 단백질, 경로 또는 세포 공학 또는 분석을 위한 배양 시스템의 선택에 적용될 수 있거나, 세포가 생존가능한 동물에 이식되고, 이후에 분석을 위해 생존가능한 세포로서 회수되는 경우에 유사하게 사용될 수 있다.
고함량
라이브러리 및 다중-
TERS
조작된 세포
GOI를 발현하는 파생 조작된 세포의 강력한 양성 및 음성 선택으로, 단백질, 경로 및 세포 공학 작업 흐름을 지원하기 위해 다양한 방식으로 정확한 고함량 라이브러리가 생성될 수 있다.
가장 간단한 개념으로, 단일 CST 에피토프를 인코딩하지만 다중 GOI를 인코딩하지 않는 TEDV의 라이브러리가 세포의 풀 내로 통합될 수 있다. 예를 들어 TERS- 및 TEDV-인코딩된 CST 에피토프를 이용한 표준 양성/음성 CST 선택의 적용은, 선택된 집단의 각각의 세포에서 단일 GOI 변이체를 발현하는 파생 조작된 세포의 집단을 유도할 것이다. 그 다음 이러한 고함량 세포 라이브러리에 통합된 변이체 GOI를 기반으로 단백질, 세포 경로 또는 보다 일반적으로 세포 기능을 조작하기 위해 작업 흐름에서 기능성 선택이 적용될 수 있다.
단일 조작된 세포에 대한 고유한 CST 에피토프가 있는 다중 TERS, 및 고유한 CST 에피토프가 있는 다중 TEDV 라이브러리를 첨가하여, 변이체 GOI의 여러 패밀리가 이와 같은 조작 작업 흐름 내로 통합되어, 예를 들어 조합 변이체 GOI로서 생합성 경로에서 효소를 처리할 수 있다. 조작된 세포가 다중 TERS를 포함하는 이와 같은 맥락은, 단일 GOI의 전반적인 발현을 향상시키는 데 사용될 수 있다. 다중-TERS 조작된 세포는 일반적으로 GOI 통합 및 선택의 효율성 및 안정성을 보장하기 위해 각각의 TERS/TEDV 쌍에 대한 고유한 이종특이적 재조합효소 부위의 사용을 필요로 할 것이다.
도면 범례
도 1. 세포 표면 태그 교환(
CSTE
) 시스템의 조성 및 작동
CSTE 시스템의 개략도. 상단 패널은, 우측에 태그 교환 공여체 벡터(TEDV), 좌측에 태그-교환 수용체 부위(TERS)를 포함하는 조작된 세포가 있는 시스템 구성요소를 도시한다.
TEDV는 구조체의 양쪽 말단(개방형 및 폐쇄형 삼각형)에서 RMCE 요소를 인코딩하며, 상기 요소는 TERS 내에 포함된 RMCE 부위와 쌍을 이룬다. TEDV 구조체(폐쇄형 삼각형)의 5' 말단에서 RMCE 요소는 3' 인트론 단편을 나타내는 서열 내에서 인코딩되며, 여기서 RMCE 요소의 3' 바로 옆에 분지점 서열, 폴리피리미딘 관 및 스플라이스 수용체 부위를 포함하는 인트론의 3' 요소(개방형 원)가 있다. 따라서, RMCE는 '비-기능성' 및 비-코딩 인트론 서열 내에 포함되고, TEDV 내에 포함된 3' 인트론 단편에는 5' 스플라이스 공여체 부위가 없다. 스플라이스 수용체 부위의 3' 바로 옆에서, TEDV는 세포 표면 태그(CST)의 3' 엑손을 인코딩하며, 이는 엑손이 고유한 분자 결합 모티프를 포함하는 CST의 부분(회색 직사각형)을 인코딩한다는 것을 의미한다. CST 서열은 5'에서 3' 방향으로 인코딩되며, 여기서 TEDV는 또한 3'에서 5' 방향으로 인코딩된 TERS에 통합될 관심 유전자(GOI)(망상선이 표시된 직사각형)를 인코딩한다.
조작된 세포 내에 포함된 TERS의 중심 부분은, 동일한 아키텍처를 가지지만, TEDV의 것과 구별되는 요소를 인코딩한다. 즉, TEDV(개방형 및 폐쇄형 삼각형)의 것과 쌍을 이루는 RMCE 요소 사이에서, TERS는 이러한 CST(개방형 원)의 5' 바로 옆의 스플라이스 수용체 부위 및 연관된 3' 인트론성 서열을 이용하여 TEDV-인코딩된 CST(체크무늬의 직사각형)의 것과 구별되는 CST 엑손을 인코딩한다. 유사하게, 선택 유전자(폐쇄형 직사각형)는 TEDV의 GOI와 같이, TERS 내에서 안티센스 방향으로 인코딩된다. 구조체의 5' 말단에서, 프로모터 서열이 포함되어(우측 화살표), CST의 전사를 구동시킨다. 이 프로모터 서열의 3'에 대하여, 3' 바로 옆의 5' 인트론 서열(폐쇄형 원)을 이용하여 막관통 도메인(TD) 엑손(개방형 직사각형)이 인코딩된다. 이는 인트론을 포함하는 RMCE 요소와 프레임 내에서 인코딩되는 TD 엑손 및 CST 엑손이 단일 코딩 mRNA로 엑손을 인접시키도록 스플라이싱되는 연속 전사체로서 생성된다는 것을 의미한다. TERS-인코딩된 TD-CST 산물(개방형/체크무늬 덤벨)은 세포 표면 상에서 발현된다. TERS 구조체의 3' 말단에 3'에서 5' 방향으로 선택 유전자(폐쇄형 직사각형)의 전사를 구동시키는 별도의 프로모터 요소가 있으며, 이는 선택 유전자(폐쇄형 정사각형)의 발현을 초래한다.
TEDV/TERS에서 쌍을 이루는 RMCE 요소에 특이적인 재조합효소에 대한 적절한 발현 구조체와 함께 TERS를 포함하는 조작된 세포로 TEDV를 도입하면, RMCE가 실행되고, GOI를 발현하는 파생 조작된 세포의 생성이 초래된다(하단 패널). TERS-인코딩된 요소는 TEDV-인코딩된 요소로 교환되었다. 따라서 파생 세포주는, 원래 TERS-인코딩된 TD(개방형/회색 덤벨), 및 GOI(망상선이 표시된 정사각형)와 함께 TD-CST 산물로서 세포 표면에서 TEDV-인코딩된 CST를 발현한다.
전반적으로, TEDV와 TERS 사이의 RMCE의 실행은 선택 유전자와 TERS-인코딩된 CST의 발현을 상실하고, TEDV-인코딩된 CST 및 GOI의 발현을 얻은 파생 조작된 세포의 생성을 초래한다.
도 2. 태그-교환 전달 벡터(
TEDV
) 아키텍처
구조체 아키텍처의 핵심 요소를 나타내는 각각의 번호가 표시된 박스가 있는 선형 구조체로서 도시된, TEDV의 개략도. 이 구조체는 TEDV-인코딩된 CST, 및 관심 유전자(GOI)를 둘 다 포함한다.
1)은 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소를 나타낸다.
2)는 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열을 나타낸다.
3)은 5'에서 3' 방향으로 TEDV-인코딩된 CST를 인코딩하는 엑손을 나타낸다.
4)는 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열을 나타낸다.
5)는 3'에서 5'으로 인코딩된 GOI에 대한 전사 종결자 서열을 나타낸다.
6)은 3'에서 5' 방향으로 GOI를 인코딩하는 서열을 나타낸다.
7)은 GOI 전사체의 효율적인 번역 개시를 위한 코작 서열을 나타낸다.
8)은 3' RMCE 요소를 나타낸다.
도 3. 태그-교환 수용체 부위(
TERS
) 개방형 아키텍처 - 태그 교환 전
구조체 아키텍처의 핵심 요소를 나타내는 각각의 문자가 표시된 박스가 있는 선형 구조체로서 도시된, TERS의 개략도. 이 구조체는 TERS-인코딩된 CST, 및 관심 유전자(GOI)를 둘 다 포함한다.
a) 인접한 막관통 도메인(TD)/CST 전사체의 효율적인 번역 개시를 위한 코작 서열을 나타낸다.
b) 유형 2 막 스캐폴드 단백질 도메인을 인코딩하는 엑손을 나타낸다.
c) 5' 인트론 스플라이스 공여체 부위를 나타낸다.
d) TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소를 나타낸다.
e) 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열을 나타낸다.
f) 5'에서 3' 방향으로 TERS-인코딩된 CST를 인코딩하는 엑손을 나타낸다.
g) 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열을 나타낸다.
h) 3'에서 5'으로 인코딩된 선택 유전자에 대한 전사 종결자 서열을 나타낸다.
i) 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열을 나타낸다.
j) 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열을 나타낸다.
k) 3' RMCE 요소를 나타낸다.
x) CST 전사체의 발현 및 추적의 조절을 담당하는 5' 게놈 요소를 나타낸다. 이 게놈 요소는 최소한 CST 발현을 구동시키는 프로모터 서열을 포함한다.
y) CST 전사체의 발현 및 추적의 조절을 담당하는 5' 게놈 요소를 나타낸다. 이 게놈 요소는 최소한 CST 발현을 구동시키는 프로모터 서열을 포함한다.
도 4. 파생 조작된 세포의
TERS
교환
TEDV-인코딩된 요소와 RMCE-매개 교환 후 TERS 유전자좌의 개략도. 도 1에 도시한 바와 같이, TEDV의 측접한 RMCE 부위 사이에서 인코딩되는 요소는 TERS의 측접한 RMCE 부위 사이에서 인코딩되는 동등한 아키텍처의 서열과 교환된다. 이는 파생 조작된 세포주 내에서 TERS 교환을 초래한다. 문자 및 번호가 표시된 박스는 각각 도 2 및 도 3에 상술된 바와 같은 핵심 유전 요소를 나타낸다.
도 5. 교환된
TEDV
부산물
TERS-인코딩된 요소와의 RMCE-매개 교환 후 TEDV 부산물의 개략도. 도 1에 도시한 바와 같이, TEDV의 측접한 RMCE 부위 사이에서 인코딩되는 요소는 TERS의 측접한 RMCE 부위 사이에서 인코딩되는 동등한 아키텍처의 서열과 교환된다. 이는 파생 조작된 세포주의 생성 동안 불안정한 교환된 TEDV 부산물을 생성한다. 문자 및 번호가 표시된 박스는 각각 도 2 및 도 3에 상술된 바와 같은 핵심 유전 요소를 나타낸다.
도 6.
TERS의
조작된 세포로의 통합
a) Myc 에피토프 CST 및 RFP 선택 유전자를 인코딩하는 TERS 카세트를 상동성 유도 재조합에 의해 모 세포주 ACL-128에 통합함으로써 조작된 세포주 집단인 ACL-1163을 형성하였다. 전기천공 10일 후, 세포를 항-Myc 항체로 염색하고 TERS, Myc 에피토프 CST 및 RFP에 의해 인코딩된 선택 마커에 대해 유세포분석법에 의해 분석하였다. 플롯은 RFP 대 Myc로서 살아있는 단일 세포를 표시하며, 이는 형질감염된 세포 중에 모 세포(Q2 우측 패널)와 비교하여 RFP 및 Myc 둘 다(Q2 좌측 패널)에 대해 높은 신호를 보이는 형질감염체 집단이 있음을 나타낸다. b) 높은 RFP 및 Myc 신호를 가지는 세포를 선택하여 더 크게 성장시켰고 대표적인 조작된 ACL-1163을 유세포분석법에 의해 분석하였다. 플롯은 게이팅된 살아있는 단일 세포의 RFP 대 Myc 매개변수를 표시한다. 단일클론 ACL-1163은 예상된 바와 같이 높은 RFP 및 Myc 신호를 가진다(Q2).
도 7. 파생 조작된 세포를 생성하기 위해
GOI의
태그-교환 및 전달이 있는
TEDV를
이용한
RMCE의
실행
Flp 재조합효소 매개 태그-교환을 ACL-1163 조작된 세포에서 수행하였다. RFP 선택 유전자 및 Myc 에피토프 CST를 인코딩하는 TERS를 보유하는 ACL-1163 세포를, flp 재조합효소를 인코딩하는 구조체와 함께, SBP 에피토프 CST 및 GOI를 인코딩하는 TEDV와 함께 형질감염시켰다. 전기천공 7일 후 세포를 항-Myc 및 항-SBP 항체로 염색하고 RFP, Myc 및 SBP 신호에 대해 유세포분석법에 의해 분석하였다. 감소된 RFP 및 Myc 신호를 표시하지만 SBP 표면 발현에 대해 높은 신호를 표시하는 세포를 분류하고 단일클론으로 확장시켰다. a 및 b) 모 세포(우측)와 비교하여 대표적인 파생 조작된 세포 단일클론 ACL-3426(좌측)을 나타내는 윤곽 플롯. 파생 세포는, 모 세포(Q4 상단 우측 패널)와 비교하여 RFP 및 Myc 신호(Q4 상단 좌측 패널)의 상실을 나타낸다. 파생 조작된 세포 단일클론 ACL-3426은 항-SBP 항체(Q5 하단 우측 패널)로 염색할 때 신호 증가로 나타낸 바와 같이 TEDV-인코딩된 SBP 에피토프 CST를 성공적으로 발현한다. 이러한 결과는 TERS와 TEDV 사이의 CST의 태그-교환으로 인해 예상된 바와 같이, ACL-3426 세포로서 성공적으로 수행된 Flp 재조합효소 매개 태그-교환이 RFP 및 Myc 마커에 대한 신호를 상실하고 SBP 표면 발현을 얻었다는 것을 시사한다. c) C-말단 FLAG-태그를 가지는 통합된 GOI의 발현의 3가지 예를 나타내는 면역블롯. Flag-태그에 대한 항체를 사용하여 면역블롯팅함으로써 GOI(RSV-1 ORF) 발현의 검출을 달성하였다. 모 단일클론주 ACL-1163이 대조군으로 포함되어 있다. CSTE를 3가지 독립적인 실험에서 수행하였고, 이에 의해 세포를 flp 재조합효소를 인코딩하는 구조체; 및 SBP 에피토프 CST 및 RSV-1 P 유전자(생성된 세포주 단일클론은 ACL-3374임)를 인코딩하는 TEDV; 또는 SBP 에피토프 CST 및 RSV-1 N 유전자(생성된 세포주 단일클론은 ACL-3386임)를 인코딩하는 TEDV; 또는 SBP 에피토프 CST 및 RSV-1 M2 긴 유전자(생성된 세포주 단일클론은 ACL- 3433임)를 인코딩하는 TEDV로 형질감염시켰다. 단일클론으로부터 단백질을 추출하고, 마우스 항-Flag 항체를 사용하여 면역블롯팅을 수행하였다. 웨스턴 블롯 결과는, 각각의 GOI의 예상 분자량에 해당하는 각각의 해당 세포에서 단일 밴드의 존재, 및 모 세포주에서 신호의 부재에 의해 입증된 바와 같이 각각의 RSV-1 ORF가 발현되었음을 입증한다.
도 8. 성공적인 태그 교환 사건 후 혼합 세포 집단으로부터
태그2(SBP)의
자기 친화성 세포 분류(MACS)
풍부화
또는
태그1(Myc)의
고갈
이 도면은 표면 태그 기술이 세포의 혼합 집단으로부터 성공적인 태그 교환 사건 후 태그2를 운반하는 세포의 MACS 풍부화 또는 태그1을 운반하는 세포의 고갈에 사용될 수 있음을 나타낸다. 2가지 조작된 단일클론 세포주, 즉 APL-4535 및 APL-3015의 출발 혼합 집단을, MACS를 사용하여 성공적인 태그 교환 사건 후 태그2(SBP)를 발현하는 세포를 풍부화시키거나 태그1(Myc)을 고갈시키는 데 사용하였다. APL-4535 세포 내의 TERS는 SBP 에피토프 CST 및 세포내 단백질을 인코딩하는 전장 FLAG 태그 GOI를 인코딩하는 한편; APL-3015 세포 내의 TERS는 Myc 에피토프 CST 및 RFP 선택 유전자를 인코딩하였다. 2가지 세포 집단을 90%(APL-3015) 대 10%(APL-4535)의 비율로 함께 혼합하고 MACS를 사용하여 SBP 양성 세포를 풍부화시키거나(a) 또는 별도의 실험으로 Myc 양성 세포를 고갈시켰다(b). a) 모든 세포를 항-SBP-알렉사(Alexa) 488 형광단으로 표지하고 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. 샘플을 MACS를 통과시키고 3개의 실험 시점, 즉 풍부화전, 통과(flow through) 및 결합시에 분획을 획득하였다. 3가지 모든 분획을 항-c-Myc-알렉사 405로 대조염색하고 BD 인플럭스(Influx) 기기에서 데이터를 수집하였다. 그래프는 3가지 모든 실험 분획에서 SBP 및 Myc 양성 세포의 백분율을 나타낸다. 사전-MACS 분획은 세포의 시작 집단이 90% Myc 양성 세포 및 10% SBP 양성 세포로 이루어짐을 나타낸다. SBP 양성 세포의 성공적인 풍부화는 통과 분획에서 SBP 신호의 결여에 의해 입증되는 한편(0.01% 초과의 SBP 양성 세포), SBP 표적화된 풍부화 후 결합된 세포의 95%는 SBP 양성이었다. b) 별도의 실험에서, 모든 세포를 항-c-Myc-알렉사 405 형광단으로 표지하고 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. MACS를 사용하여 표지된 세포를 고갈시키고 상기 나타낸 바와 같은 3가지 실험 시점에서 분획을 수집하였다. 3가지 모든 분획을 항-SBP-알렉사 488로 대조염색하고 BD 인플럭스 기기에서 데이터를 획득하였다. 그래프는 3가지 모든 실험 분획에서 Myc 표적화된 고갈 후 SBP 및 Myc 양성 세포의 백분율을 나타낸다. 사전-MACS 분획은 세포의 시작 집단이 90% Myc 양성 세포 및 10% SBP 양성 세포로 이루어짐을 다시 나타내었다. Myc 양성 세포의 성공적인 고갈은 통과 분획에서 Myc 양성 세포의 수(25%) 감소 및 SBP 양성 세포의 수(75%) 증가에 의해 입증되었다. 또한, 결합된 분획은 90% 초과의 Myc 양성 세포 및 5% 미만의 SBP 양성 세포를 포함하였다. c) 총 546개 양성 염색 개별 단일클론을 이들이 SBP-연결 GOI를 인코딩하는지 여부에 대해 평가하였다. 차트는 SBP 양성 세포의 96.52%가 GOI를 통합한 반면, SBP 양성 세포의 3.48%가 GOI를 인코딩하지 않았음을 나타낸다.
결과는 MACS를 사용하여 세포의 혼합 집단으로부터 태그2(SBP) 양성 세포를 풍부화시키거나 태그1(Myc) 양성 세포를 고갈시킬 수 있음을 입증한다. 또한, 태그2(SBP)의 존재는 성공적인 태그 교환 및 GOI 게놈 통합의 지표로서 사용될 수 있다.
도 9. 바코드를 사용하는 세포 표면 태그 교환(
CSTE
) 시스템의 구성 및 작동
바코드를 사용한 CSTE 시스템의 개략도. a)는 태그 교환 공여체 벡터(TEDV)의 구성요소를 도시한다. 각각의 TEDV는 구조체의 양쪽 말단에서 RMCE(개방형 및 폐쇄형 삼각형)를 인코딩하고, 이는 TERS 내에 포함되는 RMCE 부위와 쌍을 이룬다. TEDV 구조체의 5' 말단에서 RMCE 요소(폐쇄된 삼각형)는 3' 인트론 단편을 나타내는 서열 내에서 인코딩되며, 여기서 RMCE 요소의 3' 바로 옆에 분지점 서열, 폴리피리미딘 관 및 스플라이스 수용체 부위를 포함하는 인트론의 3' 요소(개방형 원)가 있다. 스플라이스 수용체 부위의 3' 바로 옆에서, TEDV는 세포 표면 태그(CST)의 3' 엑손을 인코딩하며, 이는 엑손이 고유한 분자 결합 모티프를 포함하는 CST의 부분(회색 직사각형)을 인코딩한다는 것을 의미한다. CST 서열은 5'에서 3' 방향으로 인코딩되며, 여기서 TEDV는 또한 3'에서 5' 방향으로 인코딩된 TERS에 통합될 관심 유전자(GOI)(망상선이 표시된 직사각형)를 인코딩한다.
이 실시예에서 각각의 CST는 3가지 잠재적인 고유한 에피토프(A, B, C)의 선택으로부터 2가지 상이한 에피토프로 구성되며, 이는 6가지의 가능한 고유한 조합으로 조합될 수 있다. AB는 BA와 실질적으로 동등하다. 이 실시예에서, AX 조합은 3가지 변이체(GOI a-i, a-ii 및 a-iii)가 있는 GOI 패밀리로 할당되었으며, BX 조합은 3가지 변이체(GOI b-i, b-ii, b-iii)가 있는 제2 GOI 패밀리로 할당되었다. 이 실시예에서 개별 TEDV는 풀링된다. b)는 태그-교환 수용체 부위(TERS)의 구성요소를 도시한다. TERS RMCE 요소는 TEDV의 요소(개방형 및 폐쇄형 삼각형)와 쌍을 이룬다. TERS는 이러한 CST의 5' 바로 옆의 스플라이스 수용체 부위 및 연관된 3' 인트론성 서열(개방형 원)을 이용하여 TEDV-인코딩된 CST(체크무늬의 직사각형)의 것과 구별되는 CST 엑손을 인코딩한다. 유사하게, 선택 유전자(폐쇄형 직사각형)는 TEDV의 GOI와 같이, TERS 내에서 안티센스 방향으로 인코딩된다. 구조체의 5' 말단에서, 프로모터 서열이 포함되어(우측 화살표), CST의 전사를 구동시킨다. 이 프로모터 서열의 3'에 대하여, 3' 바로 옆의 5' 인트론 서열(폐쇄형 원)을 이용하여 막관통 도메인(TD) 엑손이 인코딩된다(개방형 직사각형). TERS-인코딩된 TD-CST 산물(개방형/체크무늬 덤벨)은 세포 표면 상에서 발현된다. TERS 구조체의 3' 말단에 3'에서 5' 방향으로 선택 유전자(폐쇄형 직사각형)의 전사를 구동시키는 별도의 프로모터 요소가 있으며, 이는 선택 유전자(폐쇄형 정사각형)의 발현을 초래한다. c)는 TEDV/TERS에서 쌍을 이루는 RMCE 요소에 특이적인 재조합효소에 대한 적절한 발현 구조체와 함께 TERS를 포함하는 조작된 세포 집단으로 TEDV 풀을 도입하면, RMCE가 실행되고, 다양한 GOI를 발현하는 파생 조작된 세포 집단의 생성이 초래된다는 것을 도시한다. RMCE 동안, TERS-인코딩된 요소는 TEDV-인코딩된 요소로 교환된다. 따라서 파생 세포 집단은 원래 TERS-인코딩된 TD(개방형/회색 덤벨), 및 GOI(망상선이 표시된 정사각형)와 함께 TD-CST 산물로서 세포 표면에서 TEDV-인코딩된 CST를 발현한다. d) RMCE 이후, GOI를 발현하는 조작된 세포의 풀은 고유한 CST 바코드의 발현을 기반으로 FACS를 통해 개별 구성원으로 추가로 단리될 수 있다. 이는 원하는 바코드의 대량 집단, 또는 단일 세포 분류 방법을 통한 개별 세포 단리로서 달성될 수 있다. 대안적으로, 풀의 분석은 디지털 데이터세트 내에서 관심 집단을 확인하기 위한 수단으로서 바코드를 사용하는 분류 없이 FAC를 통해 수행될 수 있다. e) 조작된 세포를 바코딩하는 CSTE 시스템의 사용에 대한 원칙의 증명으로서, CST를 인코딩하는 플라스미드 또는 CST가 없는 대조군 플라스미드를 이용하여, 당업자에게 알려진 표준 방법을 사용하여 화학적 형질감염(ACL-5) 또는 전기천공(ACL-1)을 사용하여 ACL-5 및 ACL-1 세포를 형질감염시켰다. CST는 3가지 고유한 에피토프, 즉 FLAG, MYC 및 HA(서열번호 20으로 표시됨)를 포함하였다. 형질감염 48시간 후, 세포를 수확하고 형광단과 접합된 동족 항체, 즉 항-FLAG-PE, 항-MYC-AF647 및 항-HA-AF488로 염색하였다. 유세포분석법에 의해 세포를 분석하고; 살아있는 세포를 전방 산란(FSC) 및 측면 산란(SSC)에 의해 게이팅하였다. 살아있는 세포의 평균 형광 강도(MFI)를 3가지 에피토프 각각에 대해 결정하고, 각각의 에피토프를 발현하는 살아있는 세포의 백분율을 결정하였다. 빈 벡터와 비교하여 바코딩된 CST를 인코딩하는 플라스미드로 형질감염된 세포에서 높은 비율 및 강도로 3가지 모든 에피토프를 검출하였으며, 이에 의해 다중 에피토프로 구성된 CST의 능력을 입증하였다.
비-제한적인 실시형태의 하기 목록은 본 발명을 추가로 예시한다:
1. 2가지 별도의 구성요소를 포함하는 조합 시스템으로서, 제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(TEDV)이고, 제2 구성요소는 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이며, 쌍을 이루는 재조합효소 매개 카세트 교환(RMCE) 요소는 TEDV 및 TERS에 포함되어 TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현하는, 조합 시스템.
2. 실시형태 1에 있어서, 상기 제1 세포 표면 태그(CST) 엑손은 상기 제2 CST와 상이한 것인 조합 시스템.
3. 실시형태 1 또는 2에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하는 TEDV이되,
CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
4. 실시형태 1 내지 3 중 어느 하나에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소 - 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5'RMCE 요소
b. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편
c. 5'에서 3' 방향으로 TEDV-인코딩된 CST를 포함하는 엑손
d. 5'에서 3' 방향으로 인코딩된 CST에 대한 제1 전사 종결자 서열
e. 3'에서 5'으로 인코딩된 GOI에 대한 제2 전사 종결자
f. 3'에서 5' 방향으로 GOI를 인코딩하는 서열
g. 코작 서열
h. 5' RMCE 요소
를 포함하는 TEDV이고,
여기서, CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
5. 실시형태 1 내지 3 중 어느 하나에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하는 TEDV이고,
여기서, CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템.
6. 실시형태 1 내지 5 중 어느 하나에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하는 TERS이되,
막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는, 조합 시스템.
7. 실시형태 1 내지 6 중 어느 하나에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 유형 2 막 단백질 막관통 도메인 엑손
d. 5' 인트론 스플라이스 공여체 부위
e. TEDV의 5' RMCE 요소와 동등하고 이와 쌍을 이루는 비-코딩 및 '비-기능성' 3' 인트론 단편에서 인코딩되는 5' RMCE 요소
f. 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편의 기능성 서열
g. 5'에서 3' 방향으로 TERS-인코딩된 CST를 포함하는 엑손(TEDV-인코딩된 CST와 상이함)
h. 5'에서 3' 방향으로 인코딩된 CST에 대한 전사 종결자 서열
i. 3'에서 5' 방향에 대한 전사 종결자 서열
j. 3'에서 5' 방향으로 선택 유전자를 인코딩하는 서열
k. 선택 유전자 전사체의 효율적인 번역 개시를 위한 코작 서열
l. 3' RMCE 요소
m. CST 전사체의 발현의 조절 및 추적을 담당하는 3' 게놈 요소
를 포함하는 TERS이고,
여기서, 막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는, 조합 시스템.
8. 실시형태 1 내지 6 중 어느 하나에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하는 TERS이고,
여기서, 막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는, 조합 시스템.
9. 실시형태 1 내지 8 중 어느 하나에 있어서, 상기 TEDV의 제1 RMCE 요소는 TERS의 제1 RMCE 요소와 쌍을 이루고, TEDV의 제2 RMCE 요소는 TERS의 제2 RMCE 요소와 쌍을 이루는, 조합 시스템.
10. 실시형태 1 내지 9 중 어느 하나에 있어서, 각각의 CST 엑손은 하나 이상의 분자 친화성 태그를 인코딩하는 서열을 포함하고 TEDV 및 TERS에 의해 인코딩되는 CST는 상이한, 조합 시스템.
11. 실시형태 1 내지 10 중 어느 하나에 있어서, 상기 조작된 세포는 게놈에 단일 TERS를 포함하는, 조합 시스템.
12. TERS 유전자좌로부터 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 방법으로서,
a. GOI를 인코딩하는 TEDV를 생성하는 단계
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 상기 TEDV를 전달하는 단계
c. TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
d. 통합된 GOI를 가지는 세포의 선택을 위한 프록시로서, 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 TEDV-인코딩된 CST의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함하는, 방법.
13. 실시형태 12에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 TERS-인코딩된 CST의 발현 감소 및 TEDV-인코딩된 CST의 발현 증가를 검출하기 위해 형광 표지되어, 형광 활성화 세포 분류에 의해 상기 발현을 기반으로 세포 분할 및 선택을 가능하게 하는, 방법.
14. 실시형태 12에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 기질에 고정되어, 기질 친화성 방법, 예컨대 자기 활성화 세포 분류를 사용하여 표적 세포 집단에서 TERS-인코딩된 CST를 발현하는 세포를 고갈시킬 수 있거나 TEDV-인코딩된 CST를 발현하는 세포를 풍부화시킬 수 있는, 방법.
15. TEDV의 풀로부터 다양한 TEDV-인코딩된 GOI를 발현하는 다중 파생 조작된 세포를 생성하는 방법으로서,
a. 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계
c. 다중 TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 3가지 이상의 친화성 시약과 세포를 접촉시키는 단계
d. 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 고유한 TEDV-인코딩된 CST 각각의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함하는, 방법.
16. 실시형태 15의 단계 a. 및 b.에 의해 생성된 세포의 풀 내에서 다양한 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 세포 계통 추적 방법으로서,
a. 다수의 TEDV-인코딩된 CST에 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
b. 고유한 TEDV-인코딩된 CST 각각의 발현을 기초로 파생 조작된 세포의 함량을 분석하는 단계
를 포함하는, 방법.
17. - 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계
- 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계
에 의해 생성된 세포의 풀 내에서 다양한 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 세포 계통 추적 방법으로서,
상기 방법은
a. 다수의 TEDV-인코딩된 CST에 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계
b. 고유한 TEDV-인코딩된 CST 각각의 발현을 기초로 파생 조작된 세포의 함량을 분석하는 단계
를 포함하는, 방법.
18. 3' 인트론 단편이 측접하는 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는, 태그-교환 공여체 벡터(TEDV).
19. 실시형태 18에 있어서,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하되,
CST 엑손 및 제1 전사 종결자는 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 태그-교환 공여체 벡터(TEDV).
20. 조작된 세포로서, 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 세포 표면 태그(CST) 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이되, 재조합효소 매개 카세트 교환(RMCE) 요소는 TERS에 포함되어 TERS와 태그-교환 공여체 벡터(TEDV) 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 관심 유전자(GOI)에 대한 리포터 요소의 교환을 초래하는, 조작된 세포.
21. 실시형태 20에 있어서, 상기 TERS는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하되,
막관통 도메인 엑손 및 CST 엑손은 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 제2 전사 프로모터 요소는 리포터 유전자의 전사를 구동시키는 것인 조작된 세포.
재료 및 방법
조작된 세포주로 TERS의 통합
전기천공을 사용하여 상동성 유도 재조합에 의해 AAVS1 부위로 통합된 단일 TERS 부위를 이용하여 조작된 세포를 생성하기 위해 필요한 DNA 구조체를 전달하였다.
반응 당, 다음 설정의 스퀘어 웨이브(Square Wave) 285 V, 펄스 길이 12.5 ms 및 1 s 간격의 2 펄스를 이용하는 진 펄서 엑스셀(Gene Pulser Xcell)(상표)(바이오-래드(Bio-Rad))을 사용하여 글루타맥스-I(Glutamax-I)(라이프 테크놀로지스(Life Technologies))가 있는 500㎕ RPMI 1640에서 4×106개 세포를 전기천공하였다. 사용된 DNA 농도는 TERS 통합 벡터(V9.F.5)의 경우 15 ㎍/㎕, Cas9-P2A-GFP 인코딩 플라스미드(V1.A.8)의 경우 10 ㎍/㎖, 그리고 통합 부위 AAVS1 부위를 표적으로 하는 gRNA를 인코딩하는 벡터(V2.J.6)의 경우 7.5 ㎍/㎖이었다(표 3).
전기천공 후, 분석 전에 글루타맥스-I + 10% FBS(37℃, 5% CO2)가 있는 배양 배지 RPMI 1640에서 2일 동안 세포를 인큐베이션시켰다.
다클론성
GFP
-발현 형질감염 세포의 분류
FACS재즈(FACSJAzz)(상표) 세포 분류기(BD 바이오사이언스(BD Biosciences))를 사용하여, 일시적인 GFP 발현에 대해 Cas9-P2A-GFP(V1.A.8) 또는 GFP 선택 마커를 인코딩하는 플라스미드(V1.A.4)로 전기천공된 세포를 분류하였다. 세포를 세척하고 적절한 부피의 DPBS에 재현탁시킨 후 20% HI-FBS 및 항-항 100X(라이프 테크놀로지스(Life Technologies))와 함께 글루타맥스-I가 있는 RPMI 1640에서 분류하였다.
TERS의
안정적인 발현을 이용한 단일클론성 세포의 분류
FACS를 사용하여 TERS 수용 카세트로부터 발현된 Myc 에피토프 CST 및 RFP 선택 유전자를 구성적으로 발현하는 단일 세포를 수득하였다. Myc CST를 검출하기 위해, 분류 전에 항-Myc 항체(항-c-Myc-알렉사 647, 산타크루즈(SantaCruz))로 세포를 염색하였다. 세포를 DPBS에서 세척한 후 20% HI-FBS 및 항-항 100X(라이프 테크놀로지스)와 함께 글루타맥스-I가 있는 RPMI 1640에서 분류하였다.
벡터 | |
ID | 명칭 |
V1.A.8 | SpCas9-2A-GFP |
V9.F.5 | AAVS-EF1aL-TxnCS-S-STv5a_G-in:FRT:MYC-RFP:F3-EF1a |
V2.J.6 | AAVSI_sg-sp-opti_3 |
V12.A.8 | M2-진(gene)-롱(Long)_RSV1-FLAG_Tx |
V4.I.8 | CMVpro_FLPo-sv40pA-V2 |
표 4에 열거된 필터 세트에 대해 인플럭스(상표)(BD 바이오사이언스) FACS에서 GFP 및 RFP 형광을 검출하였다. Myc 및 RFP를 발현하는 단일 세포를 200㎕의 성장 배지를 포함하는 96-웰 플레이트로 분류하여 단일클론의 집합을 성장시켰다.
FACS 재즈 및 인플럭스 필터 | |||
단백질 | 형광색소 | 여기 레이저 | 검출 필터 |
Cas9/GFP | GFP | 488 | 530/40 |
RFP | RFP | 561 | 585/29 |
Myc | 알렉사647 | 640 | 670/30 |
Myc | PE | 561 | 585/29 |
SBP | 알렉사647 | 640 | 670/30 |
SBP | 알렉사488 | 488 | 530/40 |
Myc | 알렉사405 | 405 | 460/50 |
Flag | PE | 561 | 585/29 |
HA | 알렉사488 | 488 | 530/40 |
단일클론성 집단의 표현형 스크리닝
20,000개 세포의 과성장한 단일클론 집단의 샘플을 분석을 위해 마이크로타이터 플레이터로 옮기고, 세포를 250㎕의 DPBS 1×(라이프 테크놀로지스)에 재현탁한 다음 LRS포르테사(LRSFortessa)(상표)(BD 바이오사이언스)에서 분석하였다. 단일클론성 집단(ACL-1163)을 Myc 에피토프 CST 및 RFP의 존재에 대해 스크리닝하였다. 알렉사 플루오르(Alexa Fluor) 647 형광단으로 표지한 항-Myc 항체를 사용하여 Myc 발현을 검출하였다. 100㎕의 염색 완충액(DPBS +2% FBS)에 희석한 권장 항체 부피를 사용하여 염색 용액을 제조하였다. 1시간 동안 4℃에서 세포를 인큐베이션시킨 다음, 분석 전에 500㎕의 염색 완충액으로 2회 세척하였다.
단일클론의 유전형 스크리닝 - 정확한 게놈 위치에서의 통합 확인
글루타맥스-I + 10% HI-FBS와 함께 RPMI 1640의 정상 성장 배지에서 ACL-1163 세포를 유지시켰다. 세포 컨플루언스가 10 내지 12×106에 도달할 때까지 매일 세포 컨플루언스를 모니터링하였다. 퀴아앰프 DNA 미니키트(QIAamp DNA Minikit)(퀴아젠(Qiagen))를 사용하여 5×106개 세포에서 DNA를 추출하였다. 나머지 세포를 추가로 확장시키고 70% 성장 배지 + 20% HI-FBS + 10% DMSO 중에 3×106개 세포/㎖의 밀도로 동결보존하였다.
ACL-1163 모노클론을 스크리닝하고 분자 수준에서 평가하였으며, 이는 표 5 및 6에 각각 열거된 구성요소 및 반응 조건을 사용하여, 20㎕ 반응물 중, Q5(등록상표) 핫 스타트 고-정확도 DNA 중합효소(Hot Start High-Fidelity DNA Polymerase)(NEB)를 사용하는 PCR에 의해 수행하였다. TERS 통합 카세트가 AACS1 유전자좌에 통합되었는지 여부를 결정하기 위해, 각각 좌측 상동성 암의 앞 영역 및 막관통 도메인을 표적화하는, 프라이머 15.F.9 및 19.E.7을 사용하였다(표 7). 2.1 kb 앰플리콘으로 정확한 좌측 상동성 암 재조합을 표시하였다. 처음에, 모든 구성요소(Q5(등록상표) 반응 완충액, dNTP, 핫-스타트 Q5(등록상표) DNA 중합효소, 정방향 및 역방향 프라이머, 100 ng의 DNA 주형 및 H20)로 PCR 마스터 믹스(Master Mix)를 제조하였다. C1000 터치(C1000 Touch)(상표) 온도 순환기(바이오-래드)를 사용하여 PCR 반응을 실행하였다. 파워팩 베이직(PowerPac Basic)(바이오-래드)을 사용하여 1×TAE 완충액 중 1% 아가로스 겔에서 PCR 산물을 실행하고, 사이버세이프(sybersafe)의 10,000배 희석물로 염색한 다음 퓨전 SL(Fusion SL)(빌버 루맷(Vilber Lourmat))으로 분석하였다.
TERS의 통합을 평가하기 위한 PCR 시약 | |
반응 구성요소 | 반응 당 부피 |
5x퓨전 완충액(Phusion buffer) | 4㎕ |
DNTP | 0.2㎕ |
퓨전 DNA 중합효소 | 0.15㎕ |
15.F.9 | 0.5㎕ |
19.E.7 | 0.5㎕ |
H20 | 최대 20㎕ |
DNA(100 ng) | 1㎕(100 ng/㎕) |
DMSO 3% | 0.6㎕ |
PCR 주기 조건 | ||
단계 | 온도 | 시간 |
초기 변성 | 98℃ | 30초 |
30 주기 | 98℃ 62℃ 72℃ |
10초 1:10분 15초 |
최종 연장 | 72℃ | 10분 |
ID | 명칭 | 서열 |
1.I.7 | turboRFP_GT_F1 | GAGAGGCCATTCTCAGATGG |
1.I.8 | turboRFP_GT_R1 | CGGGCATCTTCAGGTTCTTG |
1.I.9 | turboRFP_프로브_FAM | CTACCTGCACTGCTCCTTCAAGACC |
10.A.10 | TRAC_TCRA-프로모터_F1 | CTGATCCTCTTGTCCCACAGATA |
10.B.6 | TRAC_프로브(HEX) | ATCCAGAACCCTGACCCTGCCG |
15.F.9 | AAVS1_GT_F5 | ACTCTGCCCTCTAACGCTG |
19.E.7 | AMPN-TMD_GT_R1 | GCTGATGTAGAAGCCCTTGG |
21.G.5 | ORF-AM_GT_F2 | TTCTGTAGCTCCATTGGCAG |
21.G.8 | ORF-AM_GT_R1 | ATCCGTATGGTGACAAGACG |
유전자 복제 번호 확인
세포 게놈 내에 통합된 다수의 TERS 카세트에 대하여 선택된 단일클론의 DNA를 평가하였다. 이를 달성하기 위해, TERS 카세트 및 참조 유전자(TRAC)에 특이적인 프라이머 및 프로브를 사용하여 드롭렛 디지털 PCR(Droplet Digital PCR; ddPCR)을 수행하였다(표 8). TERS 특이적 프로브를 FAM과 접합시키고, 참조 유전자 특이적 프로브를 HEX와 접합시켰다. 통합 복제 수는 ACL-1163 세포가 참조 유전자(TRAC)에 대하여 이배체인 것을 고려하였다. ddPCR 전에, MfeI(NEB)를 이용하여 DNA를 분해하여 직렬(tandem) 통합체를 분리하였다. 반응 설정 및 사이클링 조건은 QX200(상표) 드롭렛 판독기 및 드롭렛 생성기 및 C1000 터치(상표) 딥-웰 온도 순환기(바이오-래드)를 사용하여, 프로브용 ddPCR(상표) 슈퍼믹스(Supermix)(dUTP가 없음)(바이오-래드)에 대한 프로토콜에 따랐다. 퀀타소프트(QuantaSoft)(상표) 소프트웨어를 사용하여 데이터를 획득하고, Ch1을 사용하여 FAM를 검출하고 HEX에 대하여 Ch2를 사용하였다.
ddPCR 프라이머 / 프로브 | ||
ID | 명칭 | 서열 |
1.I.7 | 터보(turbo)RFP_GT_F1 | GAGAGGCCATTCTCAGATGG |
1.I.8 | 터보RFP_GT_R1 | CGGGCATCTTCAGGTTCTTG |
1.I.9 | 터보RFP_프로브_FAM | CTACCTGCACTGCTCCTTCAAGACC |
10.A.9 | TRAC-TCRA-ex1-F1 |
CTGATCCTCTTGTCCCACAGATA |
10.A.10 | TRAC-TCRA-ex1-F1 |
GACTTGTCACTGGATTTAGAGTCTCT |
10.B.6 | TRAC-프로브(HEX) | ATCCAGAACCCTGACCCTGCCG |
파생 조작된 세포주에서
GOI
서열의
Flp
-매개 통합
전기천공을 사용하여 Flp 재조합효소 매개 태그 교환을 촉진시키는 데 필요한 DNA 구조체를 전달하였다. 반응 당, 다음 설정을 이용하는 진 펄서 엑스셀(상표)(바이오-래드)을 사용하여 글루타맥스-I(라이프 테크놀로지스)가 있는 500㎕ RPMI 1640에서 4×106개 세포를 전기천공하였다: 스퀘어 웨이브 285 V, 펄스 길이 12.5 ms 및 1 s 간격의 2 펄스. 사용된 DNA 농도는 TEDV 벡터(V9.F.5)의 경우 7.5 ㎍/㎕, FLPO 인코딩 플라스미드(V12.A.8)의 경우 10 ㎍/㎖, 그리고 DNA 전달의 추적을 위한 GFP를 인코딩하는 벡터(V1.A.4)의 경우 7.5 ㎍/㎖이었다(표 3).
전기천공 후, 분석 및 GFP 양성 세포의 세포 분류 전에 글루타맥스-I + 10% FBS(37℃, 5% CO2)가 있는 배양 배지 RPMI 1640에서 2일 동안 세포를 인큐베이션시켰다.
태그 교환을 위한 표현형
Flp 재조합효소 매개 태그 교환이 일어났는지 여부를 결정하기 위해, Myc 및 SBP의 표면 발현에 대해 세포를 염색하고 RFP 형광 강도에 대해 측정하였다.
전기천공 7 내지 10일 후, 세포를 수확하고, 다음 항체(항-SBP-알렉사647 및 항-c-Myc-알렉사PE, 산타크루즈)를 사용하여 SBP 및 Myc에 대해 표면 염색하였다. 표 4에 열거된 필터 세트에 대해 인플럭스(상표)(BD 바이오사이언스) FACS에서 GFP 및 RFP 형광을 검출하였다.
SBP를 발현하지만 Myc 및 RFP를 발현하지 않는 단일 세포를 200㎕의 성장 배지를 포함하는 96-웰 플레이트 내로 분류하여 단일클론 집합을 성장시켰다.
단일 세포를 분류하고 20 내지 24일 후에 단일클론의 표현형을 수행하였다. 유세포 분석을 위해, 웰에서 세포를 옮기고 튜브 당 300㎕의 RPMI를 첨가하였다. 세포를 400 g로 4℃에서 3분 동안 원심분리하였다. 상청액을 흡인하고 세포 펠릿을 25㎕ 염색 혼합물 또는 RPMI(비염색 대조군)에 재현탁시킨 다음(염색 혼합물: 항-SBP-알렉사647 및 항-c-Myc-알렉사PE), 4℃에서 30분 동안 인큐베이션시켰다. 염색 완충액(SB)(DBPS + 2% FBS)으로 세포를 2회 세척하고 400 g에서 3분 동안 원심분리하였다. 세포를 200㎕의 SB에 재현탁시키고 LSR포르테사(LSRFortessa)에서의 데이터 획득을 위해 96-웰 플레이트로 옮겼다. 플로우조(FlowJo)를 사용하여 분석을 수행하였다.
GOI 발현 확인
세포를 성장시키고 수확한 다음 세포를 150 mM NaCl, 50 mM 트리스(Tris) pH 8, 1% CHAPS, 5 mM 이미다졸, 1 mM PMSF, 1× 프로테아제 및 포스파타제 억제제(써모(Thermo))를 이용하여 20분 동안 4℃의 로터 상에서 세포를 용해시켰다. 용해물을 4℃에서 10분 동안 17000 g에서 원심분리에 의해 제거하고 10% 아크릴아마이드 프리-캐스트 겔(바이오래드(Biorad)) 상에서 140 V에서 1시간 동안 소듐 도데실 설페이트(SDS) 겔 전기영동을 실시하였다. 셀을 PVDF 막(바이오래드) 상에 터보 블롯팅한 다음, 트리스 완충 식염수/트윈 20(TBST) 1× 중 시 블록(Sea block) 1×(써모)에서 15분 동안 차단시키고 실온에서 2시간 동안 마우스 항-플래그 항체(시그마(Sigma))와 함께 인큐베이션시켰다. TBST 1×에서 5분 동안 결합하지 않은 1차 항체 3×로부터 막을 세척하고 항-마우스 호스래디쉬 퍼옥시다제(HRP)-접합 염소 항체와 함께 실온에서 1시간 동안 인큐베이션시켰다. TBST 1× 중에서 5분 동안 결합하지 않은 2차 항체 3×로부터 막을 마지막으로 세척하고 마지막으로 HRP 신호를 ECL 기질(바이오래드)로 발색시키고 퓨전 SL 빌버 시스템(Fusion SL Vilber system)을 이용하여 획득하였다.
GOI 게놈 통합 확인
GOI 코딩 서열의 공동통합을 위해 분자 수준에서 세포 표면 태그 2(SBP)를 발현하는 단일클론 세포주를 분자 수준에서 평가하였다. 이는 각각 표 9 및 10에 열거된 구성요소 및 반응 조건을 사용하여 30㎕ 반응물에서 Q5(등록상표) 핫 스타트 고-정확도 DNA 중합효소(NEB)를 사용하는 PCR에 의해 수행하였다. GOI가 게놈 내에 통합되었는지 여부를 결정하기 위해, GOI의 3' UTR 영역을 표적으로 하는 프라이머 12.G.5 및 21.G.8을 사용하였다(표 7). 처음에, 모든 구성요소(Q5(등록상표) 반응 완충액, dNTP, 핫-스타트 Q5(등록상표) DNA 중합효소, 정방향 및 역방향 프라이머, 100 ng의 DNA 주형 및 H2O)로 PCR 마스터 믹스를 제조하였다. C1000 터치(상표) 온도 순환기(바이오-래드)를 사용하여 PCR 반응을 실행하였다. 파워팩 베이직(바이오-래드)을 사용하여 1×TAE 완충액 중 1% 아가로스 겔에서 PCR 산물을 실행하고, 사이버세이프의 10,000배 희석물로 염색한 다음 퓨전 SL(빌버 루맷)으로 분석하였다. 생어(sanger) 서열에 의해 GOI 3' UTR의 서열을 인코딩하는 것으로 정확한 크기의 밴드를 확인하였다.
시약 | Per/반응(㎕) | 96개 샘플에 대한 마스터 믹스 |
5X퓨전 HF 완충액 | 6 | 660 |
DNTP | 0.3 | 33 |
퓨전 핫 스타 폴(Phusion Hot Star pol) | 0.3 | 33 |
21.G.5 ORF-AM_GT_F2(100μM) 스톡 | 0.15 | 55 |
21.G.8 ORF-AM_GT-R1(100μM) 스톡 | 0.15 | 55 |
H20 | 20.4 | 2244 |
세포 샘플 | 2 | NA |
단계 | 온도 | 시간 | 사이클 수 |
초기 변성 | 98℃ | 30초 | 1 |
변성 | 98℃ | 10초 | 35 |
어닐링 | 62℃ | 20초 | |
연장 | 72℃ | 10초 | |
최종 연장 | 72℃ | 5분 | 1 |
유지 | 12℃ | 유지 | 1 |
표면 태그를 발현하는 세포의 MACS
풍부화
/고갈
일반적으로 풍부화/고갈을 위한 제조업체의 MACS 프로토콜을 따랐다(밀테니 바이오테크(Miltenyi Biotec), #130-047-101,IM0001377.PDF).
샘플 준비
세포를 수확하고 염색 완충액-M(SB-M - 차가운 둘베코(Dulbecco) 포스페이트 완충 식염수(DPBS), 2% FBS, 2mM EDTA)에서 원심분리(4℃에서 3분 동안 300×g)에 의해 1회 세척하였다. 40-㎛ 세포 스트레이터를 통해 SB-M 재현탁된 세포를 여과하여 단일 세포 현탁액을 수득하였다. 3 ㎖ 차가운 SB-M으로 세포를 세척하고 세포 펠릿을 수집하였다. 1000만개의 세포 당 적절한 항체 또는 죽은 세포 제거 시약을 포함하는 80㎕ 염색 용액을 사용하고 4℃에서 30분 동안 샘플을 인큐베이션시켰다. 3 ㎖ SB-M 완충액으로 세포를 2회 세척하고 펠릿화하였다.
자기
비드
표지화
160㎕ SB-M에서 세포를 재현탁시키고 항-마우스 IgG1 MACS 마이크로비드(밀테니)의 첨가에 의해 펠릿화한 세포를 자기 비드로 표지하였다(1000만개 세포 당 40㎕ MACS 마이크로비드를 첨가함). 4℃에서 20분 동안 인큐베이션시킨 후, 세포를 3 ㎖ SB-M으로 세척하고, 마지막으로 500㎕ SB-M 중에 재현탁시켰다.
자기 분리
적합한 MACS 분리기(밀테니)의 자기장에 LS 컬럼(밀테니)을 놓고 3 ㎖ SB-M으로 헹구었다. 또한 사전 MACS 분획을 수집하였다. 세포 현탁액을 컬럼에 추가하고 표지되지 않은 세포를 포함하는 통과 분획을 15 ㎖ 원뿔형 튜브 내로 수집하였다(이를 통과 분획이라고 지칭함). 컬럼을 분리기에서 제거하고 적합한 수집 튜브에 넣었다. 5 ㎖ SB-M을 자기로 표지한 세포를 포함하는 컬럼에 첨가하였다. 제공된 플런저를 사용하여, 플런저가 컬럼의 바닥에 도달할 때까지 압력을 가하였다. 자기로 표지한 세포를 컬럼으로부터 용출시키고(이를 결합 분획이라고 지칭함) 분획을 하류 적용에 사용하였다.
실시예 1 - 조작된 세포주에 TERS의 통합
이 실시예는 게놈에 단일 TERS를 포함하는 조작된 세포주 단일클론 ACL-1163을 생성하기 위해 세포주로 TERS를 안정적으로 통합시키는 것을 기재한다.
이 실시예에서, 서열번호 1로 제시된 TERS는 2가지 유전자를 인코딩하는 다음의 선택된 유전 요소로 구성되었다. 센스 방향으로 인코딩된 제1 유전자는 2개의 엑손에 걸쳐 인코딩된 ORF의 상류에 있는 EF1a 프로모터로 구성된다. 제1 엑손은 막관통 유형 II 단백질 도메인(TD)을 인코딩하고 제2 엑손은 Myc 에피토프 태그를 인코딩한다. 2개의 엑손 사이의 인트론은 인간 GAPDH 유전자에서 유래되었으며, 5' 인트론 스플라이스 공여체 부위와 인트론 분지점 서열 사이의 제1 이종특이적 FRT 부위(FRT)를 인코딩하도록 변형된다. OFR의 3' 말단은 SV40 폴리아데닐화 신호 종결자를 인코딩한다. 안티센스 방향으로 인코딩된 제2 유전자는 형광 리포터인 RFP를 인코딩하는 ORF의 상류에 있는 EF1a 프로모터로 구성된다. 코작 서열과 프로모터 사이의 영역은 제2 이종특이적 FRT 부위(F3)를 인코딩한다. RFP ORF의 3' 말단은 bGHpA 폴리아데닐화 신호 종결자를 인코딩한다.
게놈 세이프 하버 유전자좌(genomic safe harbor locus)인 AAVS1로 TERS의 안정적인 게놈 통합을 촉진시키기 위해, 플라스미드를 구축하였으며, 여기서 TERS의 DNA 요소는 AAVS1 좌측 및 우측 상동성 암으로 측접되었다. 각각의 암은 AAVS1 게놈 유전자좌에 상동성인 500 bp 초과의 서열로 구성되었다. TERS의 안정적인 통합은 게놈 세이프 하버 유전자좌인 AAVS1에서 상동성 유도 재조합(HDR)의 과정을 통해 달성되었다.
AAVS1 좌측 및 우측 상동성 암이 측접한 TERS 유전 요소를 인코딩하는 플라스미드, AAVS1 유전자좌를 표적으로 하는 최적의 gRNA를 인코딩하는 플라스미드, 및 Cas9-P2A-GFP를 인코딩하는 플라스미드로 ACL-128 세포주를 형질감염시켰다. Cas9-P2A-GFP 플라스미드 흡수에 양성인 세포를 2일 후 GFP 형광을 기준으로 FACS 분류하였다. GFP 분류된 세포를 7일 초과 동안 추가로 확장시켰다. 항-Myc 항체로 TERS-형질감염된 세포를 염색하고 RFP 및 Myc 에피토프 CST의 존재에 대하여 유세포분석으로 분석하였다(도 6a). 게놈에 TERS를 통합한 세포는 RFP 및 Myc 신호의 증가를 나타내었다. 단일클론의 집합을 나타내도록 이들 세포를 분류하고 확장시켰다. 도 6b에 나타낸 대표적인 단일클론인 ACL-1163은 RFP 및 Myc 표면 발현의 일정하고 강력한 발현을 보였다. 표적화된 AAVS1 부위에 게놈 수신기 카세트가 통합되었는지 결정하기 위해, 선택된 ACL-1163 세포주로부터 게놈 DNA를 추출하고 TERS 수신 카세트에 대한 내부 프라이머 및 AAVS1 유전자좌에 특이적인 프라이머(15.F.9 및 19.E.7, 표 7 참조)를 이용하여 PCR 반응을 수행하였다. 예상된 크기의 PCR 앰플리콘이 검출되었다(데이터는 나타내지 않음). 또한, 프라이머 및 프로브(정방향 프라이머 1.I.7, 역방향 프라이머 1.I.8, 프로브 1.I.9, 표 8 참조)를 이용한 ddPCR로 TERS 수신 카세트의 오직 단일 복사체만이 통합되었음을 확인하였다(데이터는 나타내지 않음).
생성된 조작된 세포주인 ACL-1163은 적합하게 쌍을 이루는 TEDV를 이용하는 RMCE용으로 설계된 TERS의 단일 복사체를 포함하였다.
실시예 2 - 파생 조작된 세포를 생성하기 위한 GOI의 태그-교환 및 전달과 함께 TEDV를 이용한 RMCE의 실행
이 실시예는 TEDV-인코딩된 서열과 TERS 사이의 RMCE 구동 반응인 CSTE 시스템의 실행이 세포 표면에서 CST의 전환을 초래하여, TEDV-인코딩된 서열 및 카고(cargo) GOI를 통합하는 교환된 구조체를 보고한다는 것을 보여준다. 본 실시예에서, 표적 조작된 세포주로서 상기 기재된 ACL-1163을 사용하였다.
현재 실시예에서 TEDV는 센스 방향으로 제1 이종특이적 FRT 부위(FRT); 분지점 서열, 폴리피리미딘 관 및 3' 수용체 스플라이스 부위를 포함하는 3' 인트론 단편; 스트렙트아비딘 결합 펩타이드(SBP)를 인코딩하는 엑손 및 SV40 폴리아데닐화 신호 종결자를 인코딩한다. 호흡기 세포융합 바이러스(RSV)로부터 유래된 3가지 개별 GOI는 개별 TEDV에서 안티센스 방향으로 인코딩되며, 각각의 GOI ORF는 제2 이종특이적 FRT 부위(F3)와 3' bGHpA 폴리아데닐화 신호 종결자 사이에 위치한다. 서열번호 3 내지 서열번호 5의 서열은 3가지 독립적인 SBP 에피토프 CST 및 사용된 TEDV 구조체를 인코딩하는 GOI를 나타낸다.
본 실시예에서, TEDV(서열번호 3 내지 서열번호 5의 서열로부터 선택됨) 및 RMCE 재조합 효소의 발현을 인코딩하는 벡터(FLPO, V4.1.8, 표 3, 서열번호 2)로 실시예 1에서 작제된 조작된 세포주인 ACL-1163을 전기천공하였다. 7 내지 10일 동안 세포를 인큐베이션시켜 통합 커플이 발생할 수 있도록 한 다음, 항-Myc 및 항-SBP 항체로 염색하고 RFP, Myc 및 SBP 리포터 신호에 대해 유세포분석법으로 분석하였다. RFP 및 Myc 신호는 감소했지만 SBP 신호는 증가하여 '태그 교환'을 나타내는 세포를 분류하고 확장시켜 단일클론의 집합을 나타내었다. 대표적인 단일클론인 ACL-3426의 특징은 도 7a 및 7b에 도시되어 있다. 성공적인 표면 태그 교환을 확인하기 위해, 단일클론 ACL-3426을 Myc에 대한 항체 및 SBP에 대한 항체로 염색하고 RFP 및 표면 Myc 발현의 손실(도 7a) 및 SBP 신호의 획득(도 7b)에 대해 유세포분석법에 의해 분석하였다. 실제로, CSTE를 수행한 세포는 SBP를 표시하지만 Myc 또는 RFP 신호를 표시하지 않음으로써 성공적인 태그-교환을 나타내었다. 모 세포를 동시에 분석하였고 RFP 및 Myc(도 7a 우측 패널) 둘 다에 대해 지속적으로 높은 신호 및 낮은 SBP 신호(도 7b 우측 패널)를 나타내었다.
CSTE 다음에, GOI ORF가 통합되고 발현되고 있음을 입증하기 위해, 별개의 RSV-1 GOI를 인코딩하는 상기 기재한 각각의 TEDV를 사용하여 독립적인 실험으로부터의 3가지 단일클론을 면역블롯에 의해 평가하였다(도 7c). TEDV가 제공한 각각 Flag-태그를 인코딩하는 GOI ORF에는 RSV-1 유래의 3가지 유전자, 즉 P, N 유전자 및 M2 유전자(롱)가 있었다. CSTE를 수행하고, 이에 의해 flp 재조합효소를 인코딩하는 구조체 및 TEDV; SBP 에피토프 CST 및 RSV-1 P 유전자(생성된 세포주 단일클론은 ACL-3374임); 또는 SBP 에피토프 CST 및 RSV-1 N 유전자를 인코딩하는 TEDV(생성된 세포주 단일클론은 ACL-3386임); 또는 SBP 에피토프 CST 및 RSV-1 M2 롱 유전자를 인코딩하는 TEDV(생성된 세포주 단일클론은 ACL- 3433임)로 세포를 형질감염시켰다. 단일클론으로부터 단백질을 추출하고, 마우스 항-Flag 1차 항체를 사용하여 샘플을 면역블롯팅한 다음, 항-마우스 호스래디쉬 퍼옥시다제(HRP)-접합 염소 항체와 함께 인큐베이션시켰다. HRP 신호를 ECL 기질로 발색시켰다. 각각의 GOI에 대한 예상 분자량의 플래그에 대해 양성인 단일 밴드의 존재에 의해 성공적인 CSTE를 입증하였다(도 7c의 레인 2 내지 4). 모 세포를 동시에 분석하였고 Flag-태그 신호의 부재를 나타내었다(도 7c의 레인 5).
요약하면, 이 실시예는 세포 표면 태그-교환이 초기 TERS 구조체의 존재, 및 RMCE의 실행 시 TEDV-인코딩된 서열을 포함하는 교환된 구조체를 조건부로 기록하고, GOI 자체의 검출과는 독립적으로 GOI 통합 및 발현을 보고하는 데 사용될 수 있음을 입증한다.
실시예 3 - 성공적인 태그 교환 사건 후 혼합 조작된 세포 집단으로부터 태그2(SBP)의 풍부화 또는 태그1(Myc)의 고갈의 자기 친화성 세포 분류(MACS)
이 실시예는 표면 태그 기술이 태그 2(SBP)의 MACS 풍부화 또는 태그1(Myc)의 고갈에 사용될 수 있음을 입증한다. 추가적으로, 태그2(SBP)의 존재는 성공적인 태그 교환 사건 후 관심 유전자(GOI)의 포함을 모니터링하는 데 사용될 수 있다. 2가지 조작된 단일클론 세포주인 APL-3015 및 APL-4535의 출발 혼합 집단을 사용하였다. 세포 집단을 90% Myc 양성 APL-3015 세포 및 10% SBP 양성 APL-4535 세포로 혼합하였다. APL-4535 세포 내의 태그-교환 수용체 부위(TERS)는 SBP 에피토프 CST 및 세포내 단백질을 인코딩하는 전장 FLAG 태그 GOI를 인코딩하는 반면, APL-3015 세포 내의 TERS는 Myc 에피토프 CST 및 RFP 선택 유전자를 인코딩하였다. 자기 친화성 세포 분류(MACS)를 사용하여 혼합 집단으로부터 SBP 양성 APL-4535 세포를 풍부화시켰다. 별도의 실험에서, MACS를 사용하여 혼합 집단으로부터 Myc 양성 APL-3015 세포를 고갈시켰다.
첫 번째 경우에서, 혼합 세포 집단을 항-SBP-알렉사 488 형광단으로 표지한 다음 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. SBP 표지화 세포를 MACS를 사용하여 풍부화시키고 항-c-Myc-알렉사 405 형광단으로 대조염색하였다. 도 8a는 3가지 실험 단계, 즉 1) 혼합 세포 집단에서 SBP 및 Myc 양성 세포의 출발 비율을 보장하기 위한 사전-MACS 단계, 2) 컬럼이 자기장에 있을 때 MACS 컬럼에 의해 포획되지 않은 SBP 및 Myc 양성 세포의 백분율을 평가하기 위한 통과 단계, 3) MACS 컬럼에 의해 포획된 SBP 및 Myc 양성 세포의 백분율을 평가하는 데 사용되는 결합 분획 단계에서 SBP 및 Myc 양성 세포의 백분율을 도시한다. 3가지 모든 분획을 항-c-Myc 알렉사 405 형광단으로 대조염색하고 BD 인플럭스 기기에서 데이터를 획득하였다. 도 8b는 통과 분획에서 SBP 양성 세포의 결여에 의한 SBP 양성 세포의 성공적인 풍부화를 입증한 반면(<0.01), SBP 표적화된 농축화 후 결합된 세포의 95%는 SBP 양성이었다.
혼합 세포 집단으로부터 태그1(Myc)을 발현하는 기본 세포주를 MACS-고갈시키는 표면 태그 기술의 사용을 입증하기 위해 모든 세포를 항-c-Myc-알렉사 405 형광단으로 표지하고 항-마우스 IgG 철 비드와 함께 인큐베이션시켰다. 표지된 세포를 MACS를 사용하여 고갈시키고 분획은 나타낸 바와 같이 수집하였다. 3가지 모든 분획을 항-SBP-알렉사 488로 대조염색하고 BD 인플럭스 기기에서 데이터를 획득하였다. Myc 양성 세포의 성공적인 고갈은 통과 분획에서 Myc 양성 세포 수(25%)의 감소 및 SBP 양성 세포 수(75%)의 증가에 의해 입증되었다.
추가적으로, 태그2(SBP)의 존재가 성공적인 태그 교환 사건 후 GOI의 포함을 모니터링하는 리포터로서 사용될 수 있음을 입증하기 위해, 총 546개 SBP 양성 개별 단일클론이 SBP-연결 GOI를 인코딩하는지 여부를 평가하였다. 도 8c의 차트는 SBP 양성 세포의 96.52%가 GOI를 인코딩한 반면, SBP 양성 세포의 3.48%는 GOI를 발현하지 않았음을 나타낸다.
결과는 표면 태그 기술이 성공적인 태그 교환 후 혼합 세포 집단으로부터 태그2(SBP)를 발현하는 단일클론의 풍부화 또는 비변형 기본 주(태그1(Myc)을 발현하는 단일클론)의 고갈에 적합하다는 것을 입증한다. 또한, 태그2(SBP)의 존재는 성공적인 태그 교환 사건 후 GOI의 포함과 상관관계가 있으며, 따라서 세포 표면의 태그2(SBP)의 존재는 조작된 세포주 내에서 GOI가 TERS 내로 성공적으로 전달되었음을 나타내는 지표로서 사용될 수 있다.
실시예 4 - 바코드를 사용하는 세포 표면 태그 교환(CSTE) 시스템의 구성 및 작동.
이 실시예는 GOI를 발현하는 조작된 세포를 바코딩하기 위해 CSTE 시스템을 사용하는 개념의 개략도를 설명한다.
도 9는 GOI를 발현하는 세포를 바코딩하기 위해 CSTE 시스템을 사용하는 개략도이다. 패널 a 및 b는 각각 태그 교환 공여체 벡터(TEDV)의 풀, 및 태그-교환 수신가 부위(TERS)를 포함하는 조작된 세포와 함께 시스템 구성요소를 도시한다.
각각의 TEDV는 구조체의 5' 및 3' 말단에서 RMCE 요소를 인코딩하며, 상기 RMCE 요소는 TERS 내에 포함된 RMCE 부위와 쌍을 이룬다. TEDV 구조체의 5' 말단에 있는 RMCE 요소는 3' 인트론 단편을 나타내는 서열 내에서 인코딩되며, 여기서 RMCE 요소의 3' 바로 옆에 분지점 서열, 폴리피리미딘 관 및 스플라이스 수용체 부위를 포함하는 인트론의 3' 요소가 있다. 따라서, RMCE는 '비-기능성' 및 비-코딩 인트론 서열 내에 포함되고, TEDV 내에 포함된 3' 인트론 단편에는 5' 스플라이스 공여체 부위가 없다. 스플라이스 수용체 부위의 3' 바로 옆에서, TEDV는 세포 표면 태그(CST)의 3' 엑손을 인코딩하며, 이는 엑손이 고유한 분자 결합 모티프를 포함하는 CST의 부분을 인코딩한다는 것을 의미한다. CST 서열은 5'에서 3' 방향으로 인코딩되며, 여기서 TEDV는 또한 3'에서 5' 방향으로 인코딩된 TERS에 통합될 관심 유전자(GOI)를 인코딩한다.
이 실시예에서 각각의 CST는 3가지 잠재적인 고유한 에피토프(A, B, C)의 선택으로부터 2가지 상이한 에피토프로 구성되며, 이는 6가지의 가능한 고유한 조합으로 조합될 수 있다. 각각의 에피토프의 배열은 현재 기법을 통해 구별하기 어렵기 때문에, AB는 BA와 실질적으로 동등하다. 이 실시예에서, AX 조합은 3가지 변이체(GOI a-i, a-ii 및 a-iii)가 있는 GOI 패밀리로 할당되었으며, BX 조합은 3가지 변이체(GOI b-i, b-ii, b-iii)가 있는 제2 GOI 패밀리로 할당되었다. 이 실시예에서 개별 TEDV는 풀링된다(도 9a).
조작된 세포 내에 포함된 TERS의 중심 부분은, 동일한 아키텍처를 가지지만, TEDV의 것과 구별되는 요소를 인코딩한다. 즉, TEDV의 것과 쌍을 이루는 RMCE 요소 사이에서, TERS는 TEDV-인코딩된 CST의 5' 바로 옆의 스플라이스 수용체 부위 및 연관된 3' 인트론성 서열을 이용하여 TEDV-인코딩된 CST의 것과 구별되는 CST 엑손을 인코딩한다. 유사하게, 선택 유전자는 TEDV의 GOI와 같이, TERS 내에서 안티센스 방향으로 인코딩된다. 구조체의 5' 말단에서, 프로모터 서열이 포함되어, CST의 전사를 구동시킨다. 이 프로모터 서열의 3'에 대하여, 3' 바로 옆의 5' 인트론 서열을 이용하여 막관통 도메인(TD) 엑손이 인코딩된다. 이는 인트론을 포함하는 RMCE 요소와 프레임 내에서 인코딩되는 TD 엑손 및 CST 엑손이 단일 코딩 mRNA로 엑손을 인접시키도록 스플라이싱되는 연속 전사체로서 생성된다는 것을 의미한다. TERS-인코딩된 TD-CST 생성물은 세포 표면 상에서 발현된다. TERS 구조체의 3' 말단에 3'에서 5' 방향으로 선택 유전자의 전사를 구동시키는 별도의 프로모터 요소가 있으며, 이는 선택 유전자의 발현을 초래한다(도 9b).
TEDV/TERS에서 쌍을 이루는 RMCE 요소에 특이적인 재조합효소에 대한 적절한 발현 구조체와 함께 TERS를 포함하는 조작된 세포 집단으로 TEDV 풀을 도입하면, RMCE가 실행되고, GOI를 발현하는 파생 조작된 세포의 풀의 생성이 초래된다(도 9c). TERS-인코딩된 요소는 TEDV-인코딩된 요소로 교환되었다. 따라서 파생 조작된 세포는, 원래 TERS-인코딩된 TD, 및 GOI와 함께 TD-CST 산물로서 세포 표면에서 TEDV-인코딩된 CST를 발현한다.
전반적으로, TEDV의 풀과 TERS 사이의 RMCE의 실행은 선택 유전자와 원래 TERS-인코딩된 CST의 발현을 상실한 조작된 세포의 파생 풀의 생성을 초래하고, 상기 풀의 각각의 세포는 TEDV 풀로부터 TEDV-인코딩된 CST 및 GOI의 구성원 중 하나의 발현을 얻었다. GOI를 발현하는 조작된 세포의 풀은, 예를 들어 고유한 CST 바코드의 발현을 기반으로 FACS를 통해 단리되어 개별 구성원으로 추가로 분석/단리될 수 있다(도 9d). 이는 원하는 바코드의 대량 집단, 또는 예를 들어 단일 세포 분류 방법을 통해 개별 세포 단리로서 달성될 수 있다. 대안적으로, 풀의 분석은, 예를 들어 변이 GOI 발현 또는 세포 기능을 상호관련시키기 위한 세포 기능의 2차 분석과 함께 디지털 데이터세트 내에서 관심 집단을 확인하기 위한 수단으로서 바코드를 사용하여 분류 없이 FAC를 통해 수행될 수 있다.
CST가 다중 에피토프로 구성될 수 있다는 개념을 입증하기 위해, ACL-1 및 ACL-5 세포를 CST를 인코딩하는 플라스미드 또는 CST가 없는 대조군 플라스미드로 형질감염시켰다(도 9e). CST는 3가지 고유한 에피토프, 즉 FLAG, MYC 및 HA로 구성되었으며, 서열번호 20의 서열로 표현된다. 당업자에게 알려진 표준 방법을 사용하여 화학적 형질감염(ACL-5) 또는 전기천공(ACL-1)을 사용하여 세포를 형질감염시켰다. 48시간 후에 세포를 수확하고 형광단과 접합된 동족 항체, 즉 항-FLAG-PE, 항-MYC-AF647 및 항-HA-AF488로 염색하였다. 유세포분석법에 의해 세포를 분석하고, 살아있는 세포를 전방 산란(FSC) 및 측면 산란(SSC)에 의해 게이팅하였다. 살아있는 세포의 평균 형광 강도(MFI)를 3가지 에피토프 각각에 대해 결정하고, 각각의 에피토프를 발현하는 살아있는 세포의 백분율을 결정하였다. 빈 벡터와 비교하여 바코딩된 CST를 인코딩하는 플라스미드로 형질감염된 샘플에서 세포에 대하여 높은 비율 및 강도로 3가지 모든 에피토프를 검출하였으며, 이에 의해 다중 에피토프로 구성된 CST의 능력을 입증하였다.
결과는 CST가 다중 에피토프로 구성될 수 있기 때문에 표면 태그 기술이 세포주의 바코딩에 적합하다는 것을 입증한다.
약어 목록
AAVS1
아데노-연관 바이러스 통합 부위 1
APC
항원-제시 세포
Cas9
CRISPR-연관 유전자 9
CMV
거대세포 바이러스
cre
Cre 재조합효소
CRISPR
뭉쳐있고 규칙적으로 반복되는 짧은 회문 구조 반복 서열
CST
세포 표면 태그
CSTE
세포 표면 태그 교환
DMSO
다이메틸 설폭사이드
DNA
데옥시리보핵산
DPBS
둘베코 포스페이트 완충 식염수
DSB
이중-가닥 손상
dUTP
데옥시우리딘 트라이포스페이트
EDTA
에틸렌다이아민테트라아세트산
EF1 알파
신장 인자 알파(진핵세포 번역용)
FACS
형광-활성화 세포 분류
FAM
플루오레세인 아미다이트
FBS
소태아혈청
FLP
플립파제
FRT
플립파제 인식 표적
GFP
녹색 형광 단백질
GOi.
관심 유전자
gRNA
가이드 리보핵산
HDR
상동성 유도 재조합
HLA
인간 백혈구 항원
IRES
내부 리보솜 진입 부위
MACS
자기-활성화 세포 분류
NEB
뉴잉글랜드 바이오랩스(New England biolabs)
NHEJ
비-상동성 말단 봉합
ORF
오픈 리딩 프레임
PCR
중합효소 연쇄 반응
RFP
적색 형광 단백질
RMCE
재조합효소 매개 카세트 교환
RPMi.
로즈웰 파크 메모리얼 연구소(Roswell Park Memorial Institute)
RSV
호흡기 세포융합 바이러스
RT
역전사
RNA
리보핵산
SBP
스트렙트아비딘 결합 펩타이드
SSR
부위-특이적 재조합효소
SV40
유인원 바이러스 40
SV40pA
유인원 바이러스 40 폴리 (A)
TAA
종양-연관-항원
TALEN
전사-유사 이펙터 뉴클레아제
TAE
트리스-아세테이트-EDTA
T-세포
T 림프구
TCR
T-세포 수용체
TCS
표적 코딩 서열
TD
막관통 도메인
TEDV
태그-교환 공여체 벡터
TERS
태그-교환 수용체 부위
rRNA
리보솜 RNA
tRNA
전달 RNA
UTR
비번역 영역
ZNF
징크 핑거 뉴클레아제(Zinc finger nuclease)
정의 목록
앰플리콘: PCR을 포함한 다양한 방법을 사용하여 인공 증폭의 공급원 및/또는 산물인 DNA 또는 RNA의 조각.
항체: B-세포라 불리는 면역계의 특수 세포에 의해 발현되고 2개의 사슬을 포함하는 친화성 분자. B-세포는 일반적으로 자기 단백질에 결합하지 않지만 숙주를 위협하는 병원체 또는 독소에 결합하고 이를 중화시킬 수 있는 매우 크고 매우 다양한 레퍼토리의 항체를 발현한다. 자연 또는 인공적으로 조작된 항체는 종종 친화성 시약으로 사용된다.
영양요구체: 정상적인 균주는 필요로 하지 않는 특정 추가적인 영양소를 필요로 하는 돌연변이 유기체(특히 박테리아 또는 진균).
시스 -작용 요소: 근처 ORF의 전사를 조절하는 비-코딩 DNA의 영역.
CST: 통합된 관심 유전자를 보고할 수 있는 공동-통합된 세포 표면 태그
CSTE 시스템: 공여체/수신기 쌍으로서 작동하는 시스템으로서, 태그-교환 공여체 벡터가 조작된 세포주의 게놈 내에 포함된 쌍을 이루는 태그-교환 수용체 부위로 관심 유전자 서열, 및 세포-표면 태그 엑손을 전달하는 역할을 한다.
파생 조작된 세포: CST를 교환하고 GOI를 통합하도록 추가로 유전적으로 변형된 조작된 세포
DNA: 데옥시리보핵산. 유전자 및 단백질을 인코딩하는 유전 물질을 형성하는 분자의 화학적 명칭.
조작된 세포: 게놈이 유전자 변형을 통해 조작된 것인 세포.
에피토프: 항체 또는 다른 친화성 시약에 의해 결합된 항체 표적 상의 영역.
진핵생물 조건부 조절 요소: 프로모터의 활성에 영향을 미칠 수 있고, 한정된 조건 하에서 유도되거나 억제될 수 있는 DNA 서열
진핵생물 프로모터: RNA 중합효소 결합 부위 및 반응 효소를 인코딩하는 DNA 서열. 프로모터 영역의 서열은 RNA 중합효소 및 전사 요소의 결합을 제어하므로, 따라서 프로모터는 관심 유전자가 언제 어디서 발현될지를 결정하는 데 큰 역할을 한다.
진핵생물 종결자/신호 종결자: RNA 중합효소 II와 연관된 단백질 인자에 의해 인식되고 전사의 종결 과정을 촉발하는 DNA 서열. 이는 또한 폴리-A 신호를 인코딩한다
FACS / 유세포분석법: 형광-활성화 세포 분류. 유세포분석법은 특정 세포 표면 및 세포내 마커의 발현에 대해 개별 세포를 한꺼번에 분석할 수 있는 기법이다. 이 기법의 변형인 세포 분류는 한정된 마커 세트를 가지는 세포를 추가 분석을 위해 검색이 가능하게 한다.
플립파제: 빵 효모 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 2 ㎛ 플라스미드로부터 유래된 재조합효소(플립파제, Flp).
형광 (단백질) 마커 : 특정 소멸 및 방출 특징이 있고 현미경, FACS 및 관련 기법에 의해 검출될 수 있는 분자.
유전자 시스 작용 요소: 이는 이 요소가 조절하는 유전자와 동일한 DNA 분자에 존재하는 반면, 트랜스-조절 요소는 이것이 전사된 유전자에서 멀리 떨어진 유전자를 조절할 수 있다. 시스-조절 요소는 종종 하나 이상의 트랜스-작용 인자에 대한 결합 부위이다.
유전자 바코딩 : DNA 바코딩은 유기체의 DNA에서 짧은 유전자 마커를 사용하여 상기 DNA가 특정 종에 속하는 것으로 확인하는 분류학적 방법이다.
GOI : 관심이 있는 임의의 핵산 코딩 또는 비-코딩 서열로서 정의된 관심 유전자.
이종특이적 재조합효소 부위: 재조합 효소에 의해 인식되어 2개의 DNA 분자의 교차를 촉진시키는 DNA 서열
상동성 암: 보체 상동성 암과 거의 동일한 서열 동일성을 가지고 따라서 세포 과정인 상동성 유도 수선에 의해 2개의 DNA 분자의 교환을 촉진하는 DNA 구간.
절연체: 근처 유전자의 활성화 또는 억제에 의해 유전자가 영향을 받는 것을 방지하는 DNA 서열. 절연체는 또한 침묵 유전자에서 활성적으로 전사되는 유전자로 이질염색질이 확산하는 것을 방지한다.
통합: 세포의 염색체 내로 DNA 서열의 물리적 결찰
내부 리보솜 진입 부위(IRES): 일단 전사되면 캡-독립적 방식으로 번역의 개시를 가능하게 하는 RNA 요소를 인코딩하는 DNA 서열
인트론: RNA 분자가 단백질로 번역되기 전에 스플라이싱으로 제거되는 RNA 전사체 또는 이를 인코딩하는 DNA의 비코딩 영역
인트론 분지점 서열: 5' 공여체 스플라이스 부위에서 친핵성 공격을 개시하는 분지점 뉴클레오타이드. 그 다음 상류 인트론의 자유 말단은 3' 수용체 스플라이스 부위에서 제2 친핵성 공격을 개시하여, 인트론을 투승형 RNA(RNA lariat)로 방출하고 2개의 엑손을 공유 결합한다.
K는 케토(Keto)를 나타내는 뉴클레오타이드 코드이다(K = G 또는 T임)
코작 서열: 효율적인 번역 개시에 필요한 짧은 서열
M은 아미노(aMino)를 나타내는 뉴클레오타이드 코드이다(M = A 또는 C임)
MACS: 자기 활성화 세포 분류: 자기장을 사용하여 분리하기 위해 자기 입자를 포함하는 친화성 분자로 세포를 표지하는 세포 단리 기법.
일치: 2개의 구성요소가 보완 구성요소 간의 상호작용을 유도하고 제한하는 유전 요소를 인코딩하는 경우
단일클론 세포주: 반복된 세포 복제에 의해 단일 조상 세포로부터 생성된 세포의 한정된 그룹. N은 aNy 뉴클레오타이드를 나타내는 뉴클레오타이드 코드이다(N = A, T, C 또는 G임).
네이티브: 세포에 대하여 자연적으로 발생하는 개체
음성 선택 마커 : 벡터 및/또는 상기 마커-보유 벡터를 가지는 숙주 유기체의 음성 선택을 부여하는 선택가능한 마커
비-코딩 유전자: 기능성 비-코딩 RNA 분자로 전사되는 비-단백질 코딩 DNA 서열
복제 기점: 복제가 개시되는 벡터, 플라스미드 또는 게놈의 특정 서열.
ORF: 오픈 리딩 프레임. 리보솜에 의한 단백질(폴리펩타이드)의 합성을 위한 번역 프레임을 인코딩하는 유전 물질의 구간
오버행(overhang): 이중 가닥 핵산 분자의 말단에 있는 단일 가닥 서열. 종종 점착성(sticky) 또는 화합성(cohesive) 말단으로 지칭된다.
PCR: 특정 표적 DNA 분자가 기하급수적으로 증폭되는 중합효소 연쇄 반응
펩타이드: 전형적으로 길이가 6 내지 30개 아미노산인 짧은 아미노산 줄
표현형 분석: 세포의 관찰가능한 특징의 분석.
플라스미드: 유전 구조체는 염색체와 독립적으로 복제할 수 있으며, 전형적으로 박테리아 또는 원생동물의 세포질에 있는 작은 원형의 DNA 가닥.
폴리펩타이드: 3차원 구조를 형성하는 일련의 펩타이드로 이루어진 단백질.
폴리피리미딘 모티프: 피리미딘이 많고 CAG 인트론 3' 말단의 상류에 존재하는 (CnTn) 모티프.
양성 선택 마커 : 벡터 및/또는 상기 마커-보유 벡터를 가지는 숙주 유기체의 양성 선택을 부여하는 선택가능한 마커
프라이머: 예를 들어 PCR 동안 표적 DNA 서열의 특정 인식을 가능하게 하는 짧은 DNA 서열.
프로모터: 유전자 발현의 개시 제어를 위한 조절 DNA 요소
재조합효소: 유전자 재조합을 매개하고, RMCE를 촉진시키는 효소.
리포터 요소: 해당 요소를 보유하는 유기체 또는 벡터에서 보고된 신호를 매개하는 유전 요소. 양성 또는 음성 선택 마커로서 사용될 수 있다.
제한 효소 절단 서열: 제한 효소에 의해 절단되는 유전자 서열로서, 상기 제한 효소의 인식 서열에 대해 내인성이거나 내인성일 수 있다.
제한 효소 인식 서열: 제한 효소에 의해 인식되고 연결되는 유전자 서열
RMCE : 재조합효소-매개 카세트 교환. 재조합효소에 의해 촉진되는 게놈 수신기 부위에서 유전 물질의 교환.
스플라이스 수용체 부위: 표면 상의 TCRsp, 또는 TCRsp 기반 시약과 세포와의 상호작용을 위한 인트론 AM, APX CM 또는 친화성 시약의 3' 말단에 있는 DNA 서열
스플라이스 공여체 부위: 인트론의 5' 말단에 있는 DNA 서열
자살 유전자: 해당 유전자를 가지는 숙주 유기체 내에서 세포 사멸을 매개할 유전자. 양성 또는 음성 선택 마커로서 사용될 수 있다.
합성: 인공적으로 생성된 개체
TEDV: 조작된 세포의 게놈 내에 포함된 태그-교환 수용체 부위와 쌍을 이루는 태그-교환 공여체 벡터. 이는 관심 유전자 및 세포-표면 태그 엑손을 전달하는 데 사용된다.
TERS: 조작된 세포주의 게놈 내에 포함된 쌍을 이루는 태그-교환 수용체 부위
유형 II 막관통 도메인: 막의 내부에 N 말단 부분이 있고 세포 외부에 노출된 또는 ER 내강에 C 말단 부분이 있는, 결합된 신호/앵커 서열의 역할을 하는 N 말단에 가까운 소수성 잔기의 단일 비-절단성 막관통 구간.
벡터: 벡터는 유전 정보를 가지는 유전자 구조체이다. 본 문맥에서 벡터는 보통 플라스미드 DNA 벡터를 설명한다. 벡터는 숙주 유기체에서 증식 및 선택될 수 있는 이와 같은 임의의 구조체를 나타낼 수 있다.
W는 약함을 나타내는 뉴클레오타이드 코드이다(W = A 또는 T임)
SEQUENCE LISTING
<110> Genovie AB
<120> A cell surface tag exchange (CSTE) system for tracing and
manipulation of cells during recombinase mediated cassette
exchange integration of nucleic acid sequences to engineered
receiver cells
<130> WO2020/011757
<150> PCT/EP2019/068343
<151> 2019-07-09
<150> EP 18182353.5
<151> 2018-07-09
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 5837
<212> DNA
<213> Artificial sequence
<220>
<223> Tag-exchange receiver site encoding Myc CST and RFP selection
gene
<400> 1
gagctctact ggcttctgcg ccgcctctgg cccactgttt ccccttccca ggcaggtcct 60
gctttctctg acctgcattc tctcccctgg gcctgtgccg ctttctgtct gcagcttgtg 120
gcctgggtca cctctacggc tggcccagat ccttccctgc cgcctccttc aggttccgtc 180
ttcctccact ccctcttccc cttgctctct gctgtgttgc tgcccaagga tgctctttcc 240
ggagcacttc cttctcggcg ctgcaccacg tgatgtcctc tgagcggatc ctccccgtgt 300
ctgggtcctc tccgggcatc tctcctccct cacccaaccc catgccgtct tcactcgctg 360
ggttcccttt tccttctcct tctggggcct gtgccatctc tcgtttctta ggatggcctt 420
ctccgacgga tgtctccctt gcgtcccgcc tccccttctt gtaggcctgc atcatcaccg 480
tttttctgga caaccccaaa gtaccccgtc tccctggctt tagccacctc tccatcctct 540
tgctttcttt gcctggacac cccgttctcc tgtggattcg ggtcacctct cactcctttc 600
atttgggcag ctcccctacc ccccttacct ctctagtctg tgctagctct tccagccccc 660
tgtcatggca tcttccaggg gtccgagagc tcagctagtc ttcttcctcc aacccgggcc 720
cctatgtcca cttcaggaca gcatgtttgc tgcctccagg gatcctgtgt ccccgagctg 780
ggaccacctt atattcccag ggccggttaa tgtggctctg gttctgggta cttttatctg 840
tcccctccac cgggtggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 900
cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 960
gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 1020
ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 1080
acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 1140
tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 1200
ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 1260
gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 1320
cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 1380
cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 1440
cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 1500
ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 1560
ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 1620
cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 1680
gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 1740
aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1800
ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1860
ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1920
ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1980
tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgactgctta 2040
agcttggtac cgccaccatg gccaagggct tctacatcag caagagcctg ggcatcctgg 2100
gaatcctgct gggagtggct gctgtgtgca ccatcatcgc tctgagcgtg gtgtacagcc 2160
aggagggagg tcctggatcc ggaacaggtg gctctggcac tggaggatca ggtccaggtg 2220
gatctatggt gaagcagatc gagagcaaga ctgctttcca ggaagccttg gacgctgcag 2280
gtgataagct tgtagtagtt gacttctcag caacgtggtc tggaccttcc aagatgatca 2340
agcctttctt ccattccctc tctgagaagt attccaacgt gatattcctt gaagtagatg 2400
tggatgactc tcaggatgtt gcttcagagt gtgaagtcaa atccatgcca acattccagt 2460
tcttcaagaa gggacagaag gtgggtgaat tttctggagc caataaggag aagcttgaag 2520
ccaccattaa cgagttggta ggtaagtggc tggggccaga gactggctct tgaagttcct 2580
attccgaagt tcctattctc tagaaagtat aggaacttcc tggctcagaa aaagggccct 2640
gacaactctt ttcatcttct aggcggttcc tctacatccg gtggatctgg atctggagaa 2700
caaaagctca tctctgagga ggaccttggg gagcagaagc taatcagtga agaagacctc 2760
ggagagcaga aattgattag cgaggaggat ctttaaagac gctagcacct gatcctgatc 2820
ataatcaagc catatcacat ctgtagaggt ttacttgctt taaaaaacct ccacacctcc 2880
ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt 2940
ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 3000
tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgct 3060
gaagagcgct gatcagctct tcaccataga gcccaccgca tccccagcat gcctgctatt 3120
gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 3180
cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 3240
accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 3300
aggcacagtc gggtgctagc tcatctgtgg cccagcttgc taggcaggtc gcagtacttg 3360
gccacggcca tctcgtgctg ttccacgtag gtttctttgt cggcctcttt gatccgttcc 3420
agccggtggt ccacgaagtg gaagccgggc atcttcaggt tcttggcggg cttcttgctt 3480
ctgtaggtgg tcttgaagga gcagtgcagg tagcctccgc ccacgagttt cagggccatc 3540
tgagaatggc ctctcaggcc gccatcggca gggtacagca tctcggtgtt ggcctcccag 3600
cctctggttt tcttctgcat cacggggccg ttgctgggga agttcacgcc gttaatcttc 3660
acgttgtaga tgatgcagcc gttctggaag ctggtatcct gggtggcggt cagcactccg 3720
ccgtcctcgt atgtggtgat ccgctcccag gtgaagccct cggggaagct ctgcttgaag 3780
aaatcgggga tgccctgggt gtggttgatg aaggccttgc tgccgtacat aaagctggtg 3840
gccaggatat caaaggcgaa gggcagaggg ccgccttcca ccaccttgat cttcatggtc 3900
tgggtgccct cgtaaggctt gccctcgccc tcgctggtgc acttgaagtg gtggttgttc 3960
acggtgcctt ccatgtacag cttcatgtgc atgttttctt tgatcagctc gctcatggtg 4020
gctacggaag ttcctattcc gaagttccta ttcttcaaat agtataggaa cttccggtac 4080
cagtcacgac acctgaaatg gaagaaaaaa actttgaacc actgtctgag gcttgagaat 4140
gaaccaagat ccaaactcaa aaagggcaaa ttccaaggag aattacatca agtgccaagc 4200
tggcctaact tcagtctcca cccactcagt gtggggaaac tccatcgcat aaaacccctc 4260
cccccaacct aaagacgacg tactccaaaa gctcgagaac taatcgaggt gcctggacgg 4320
cgcccggtac tccgtggagt cacatgaagc gacggctgag gacggaaagg cccttttcct 4380
ttgtgtgggt gactcacccg cccgctctcc cgagcgccgc gtcctccatt ttgagctccc 4440
tgcagcaggg ccgggaagcg gccatctttc cgctcacgca actggtgccg accgggccag 4500
ccttgccgcc cagggcgggg cgatacacgg cggcgcgagg ccaggcacca gagcaggccg 4560
gccagcttga gactaccccc gtccgattct cggtggccgc gctcgcaggc cccgcctcgc 4620
cgaacatgtg cgctgggacg cacgggcccc gtcgccgccc gcggccccaa aaaccgaaat 4680
accagtgtgc agatcttggc ccgcatttac aagactatct tgccagaaaa aaagcgtcgc 4740
agcaggtcat caaaaatttt aaatggctag agacttatcg aaagcagcga gacaggcgcg 4800
aaggtgccac cagattcgca cgcggcggcc ccagcgccca ggccaggcct caactcaagc 4860
acgaggcgaa ggggctcctt aagcgcaagg cctcgaactc tcccacccac ttccaacccg 4920
aagctcggga tcaagaatca cgtactgcag ccagtggaag taattcaagg cacgcaaggg 4980
ccataacccg taaagaggcc aggcccgcgg gaaccacaca cggcacttac ctgtgttctg 5040
gcggcaaacc cgttgcgaaa aagaacgttc acggcgacta ctgcacttat atacggttct 5100
cccccaccct cgggaaaaag gcggagccag tacacgacat cactttccca gtttaccccg 5160
cgccaccttc tctaggcacc ggttcaattg ccgacccctc cccccaactt ctcggggact 5220
gtgggcgatg tgcgctctgc ccactgacgg gcaccggagc caccggatca ggatcaggat 5280
tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga tattgggtct 5340
aacccccacc tcctgttagg cagattcctt atctggtgac acacccccat ttcctggagc 5400
catctctctc cttgccagaa cctctaaggt ttgcttacga tggagccaga gaggatcctg 5460
ggagggagag cttggcaggg ggtgggaggg aaggggggga tgcgtgacct gcccggttct 5520
cagtggccac cctgcgctac cctctcccag aacctgagct gctctgacgc ggctgtctgg 5580
tgcgtttcac tgatcctggt gctgcagctt ccttacactt cccaagagga gaagcagttt 5640
ggaaaaacaa aatcagaata agttggtcct gagttctaac tttggctctt cacctttcta 5700
gtccccaatt tatattgttc ctccgtgcgt cagttttacc tgtgagataa ggccagtagc 5760
cagccccgtc ctggcagggc tgtggtgagg aggggggtgt ccgtgtggaa aactcccttt 5820
gtgagaatgg tgcgtcc 5837
<210> 2
<211> 1332
<212> DNA
<213> Artificial sequence
<220>
<223> Flippase
<400> 2
atggccccca agaaaaagcg gaaagtgggc atccacggcg tgccagctgc aggcggctct 60
atgagccagt tcgacatcct gtgcaagacc ccacctaagg tgctcgtgcg gcagttcgtg 120
gaaagattcg agaggcctag cggcgagaag atcgcctctt gtgctgccga gctgacctac 180
ctgtgctgga tgatcaccca caacggcacc gccatcaagc gggccacctt catgagctac 240
aataccatca tcagcaacag cctgagcttc gacatcgtga acaagagcct gcagttcaag 300
tacaagaccc agaaggccac catcctggaa gccagcctga agaaactgat ccccgcctgg 360
gagtttacca tcatcccata caatggccag aaacatcaga gcgacattac cgatatcgtg 420
tccagcctcc agctgcagtt cgagagtagc gaagaagccg acaagggcaa cagccacagc 480
aagaagatgc tgaaggccct gctgagcgag ggcgagagca tctgggagat cacagagaag 540
atcctgaaca gcttcgagta caccagccgg ttcaccaaga ccaagaccct gtaccagttc 600
ctgttcctgg ccacctttat caactgcggc cggttctccg acatcaagaa cgtggacccc 660
aagagcttca agctggtgca gaacaagtac ctgggcgtga tcattcagtg cctcgtgacc 720
gagacaaaga ccagcgtgtc ccggcacatc tactttttca gcgccagagg ccggatcgac 780
cccctggtgt acctggacga gttcctgaga aacagcgagc ccgtgctgaa gagagtgaac 840
cggaccggca acagcagctc caacaagcag gaataccagc tgctgaagga caacctcgtg 900
cggtcctaca acaaggccct gaagaaaaac gccccctacc ccatcttcgc cattaagaac 960
ggccccaagt cccacatcgg ccggcacctg atgaccagct ttctgagcat gaagggcctg 1020
acagagctga ccaacgtcgt gggcaattgg agcgacaaga gggcctctgc cgtggccaga 1080
accacctaca cccaccagat cacagccatc cccgaccact acttcgccct ggtgtctcgg 1140
tactacgcct acgaccccat cagcaaagag atgatcgccc tgaaggacga gacaaacccc 1200
atcgaggaat ggcagcacat cgagcagctg aagggcagcg ccgagggcag catcagatac 1260
cctgcctgga acggcatcat ctcccaggaa gtgctggact acctgagcag ctacatcaac 1320
cggcggatct ga 1332
<210> 3
<211> 1791
<212> DNA
<213> Artificial sequence
<220>
<223> TEDV encoding SBP CST and P-gene_RSV1 GOI
<400> 3
gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60
aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120
tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180
caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240
cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300
ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420
gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480
gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540
ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600
cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660
ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720
ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgactaga 780
aagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840
ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900
ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960
taatctccat catgatcctt gtaatccccg gggaaatctt ccaggctcag gtcgttgtcg 1020
ctgtcgttgc cttccagcag gttgttcagc ttctcagagg tagggttcag agacacttcg 1080
tcggaggtgt ccttggccat cttctcggat tcctcgtttc tcagccgggc catagcttcc 1140
agccgatcgt tggtcatcag ggcctctgtc cggatcttct cgatcatctc ttcccgcagt 1200
ccgaccatgg catctctgat gccatctctg gcagatgtag gtccggcaga tgccaccacc 1260
agtgtgtgca gcatgcccag gatctcagac agcttctcgt cgatccggtc cagtctggcg 1320
gtgatgttgt cgttggtctg gtcgttgatt tcctcgtagc tgtagctgct ctcttcctcg 1380
ttgttgtcga atgtctcgat tgtctctttg tacagcttgc tgaaggggtt gtcgctaggt 1440
gtggggtcct ctttgaagga caccaggggc tttctctggt agttgggctt gttgccggcg 1500
gtgtcgtctg tctcgttggt ggggttgatg atggtgctgt tgctggtgat ggggctctct 1560
ttggtcactt cgatgtcgat gctgttcacg ctgatgatgc tgtccttctt cttggggtcc 1620
ttggggctcg tgaacttgcc cttgatggat tccagaaact tggtggcccg attgttggcg 1680
tcctcgccgt ggaactcagg ggcgaacttt tccatggtgg cggtattgtc ttcggtaccg 1740
cacgaagttc ctattcggaa gttcctattc ttcaaatagt ataggaactt c 1791
<210> 4
<211> 2241
<212> DNA
<213> Artificial sequence
<220>
<223> TEDV encoding SBP CST and N-gene_RSV1 GOI
<400> 4
gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60
aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120
tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180
caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240
cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300
ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420
gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480
gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540
ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600
cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660
ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720
ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgactagg 780
gagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840
ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900
ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960
taatctccat catgatcctt gtaatccccg ggcagttcca cgtcgttgtc cttagggttc 1020
agctggtgct tgatggcttc cagttcctcg gcggtcagat ccagcacgct gtagttgatc 1080
acgccgtttt ctttcagctg ctcggcatag gccttggcgg catcgtacag gtcctggttt 1140
ctaggggtgc ctctgtactc gcccatgatt cccagtccgg cggcatttcc cagcaccaca 1200
gagctgaagt gtgggaactg tgtcaggctc agcagagagg ccttggggtt gttcaggatg 1260
tggtaaaagc cggcctctcc gccaagcttc tgggcgtact cgtacacttc caccacctgt 1320
tccatttcgg cctgcacaga ggcgtggccc agcatgatgt tcttcacgct cttggccagc 1380
actccccatc tcagcatcac ttgtccggcg ccataggcat tcatgaacag gccggcgaag 1440
atgccttcca cccgagagcc gcctcttgtg ctgctctggg cgattccgaa gtgcacgaac 1500
acgtcgatga agtgagggta cttctcgaac acctcgtaga agctgttggc aatatcctta 1560
ggcagcaggc ccttgtaccg cttcatctcg ttcttcagca cgttgttggc tctccgaatc 1620
acagcggtca ggccagaccg atcgccagcg gccagtttgg tgatgaccag agcggcgata 1680
cacaggatga tcatgccgca atcagggctg tcgtgtctgt actcaggggc gacttcgccc 1740
atctctttca gcattttctt gtaggacttc cggctctcga tctcgatgtt gatctggatc 1800
tctgtggtca ggctggccag ggtcagcacc tcgaacttca tttctttgcc gttgatgtcc 1860
tgccggtgtg tggtcacgtc cacgccattg gccttcacgt ggtagccggc atctctcagg 1920
atcttgatgg tgtcctctct gcccagtctg ctcatggcgt acagcattcc gatcacgcct 1980
gtgaacttgt ggttggcgtc ctcggtgatc agcagcatgc cgcacagctt gttgatgtgc 2040
ttctgcacgt cgtagttagg ggtgtcgatg ctgtcgccgg tgcttctctg gatggtgtac 2100
ttgctgctgc tcagcagctg gtccttgttc agggtgtcgt tcagcttcac tttgctcagg 2160
gccatggtgg cggtattgtc ttcggtaccg cacgaagttc ctattcggaa gttcctattc 2220
ttcaaatagt ataggaactt c 2241
<210> 5
<211> 1649
<212> DNA
<213> Artificial sequence
<220>
<223> M2-long-gene_RSV1
<400> 5
gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60
aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120
tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180
caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240
cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300
ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420
gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480
gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540
ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600
cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660
ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720
ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgacctgt 780
tagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840
ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900
ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960
taatctccat catgatcctt gtaatccccg ggggtggtat cgttgttctt ggcgtggtcg 1020
ttggtgtcgt tgacggtgct ctctttggga ttgttgatgg tgatgctctt gtggatgtcc 1080
agggtgttct tgatggtttt cttcagcacg tcggcaggca gccgcttcag cagatggatg 1140
gtctgcttgt tgttcttccg gttgctctcg atgtagctga tcacggtgtt gtacacccgg 1200
atcttggggc tgttaggttc ctcgttgtcc cgcagcttct tgatgtcgtc gctgttcagc 1260
tctgtcagca gcttgctcat ggccacgcag gcgctctgct tggtgatgtt gttgatgctg 1320
ccgatatagc tttccagcac gcccacaacg cccagggcat attcctcggt tctatccagt 1380
tcggcggctc cgctgatctc gctcagggtg tcgatgctct tatccatgga cttcaggatt 1440
ctgttcagca tgaagttctg ccgcacgagc agagcgtgag gaggccactc gaagtagttg 1500
tggctgaagt ggcatctctt gccgttcagg cagtggcctc tgatctcgaa cttgcagggg 1560
ttccgtctgc tcatggtggc ggtattgtct tcggtaccgc acgaagttcc tattcggaag 1620
ttcctattct tcaaatagta taggaactt 1649
<210> 6
<211> 4542
<212> DNA
<213> Artificial sequence
<220>
<223> CMVpro-Flp-sv40pA-V2 vector V4.I.8
<400> 6
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatg aattcgctac cggtatagta atcaattacg gggtcattag ttcatagccc 420
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 480
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 540
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 600
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 660
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 720
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 780
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 840
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 900
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag tgaaccgtca 960
gatcaggtac catggccccc aagaaaaagc ggaaagtggg catccacggc gtgccagctg 1020
caggcggctc tatgagccag ttcgacatcc tgtgcaagac cccacctaag gtgctcgtgc 1080
ggcagttcgt ggaaagattc gagaggccta gcggcgagaa gatcgcctct tgtgctgccg 1140
agctgaccta cctgtgctgg atgatcaccc acaacggcac cgccatcaag cgggccacct 1200
tcatgagcta caataccatc atcagcaaca gcctgagctt cgacatcgtg aacaagagcc 1260
tgcagttcaa gtacaagacc cagaaggcca ccatcctgga agccagcctg aagaaactga 1320
tccccgcctg ggagtttacc atcatcccat acaatggcca gaaacatcag agcgacatta 1380
ccgatatcgt gtccagcctc cagctgcagt tcgagagtag cgaagaagcc gacaagggca 1440
acagccacag caagaagatg ctgaaggccc tgctgagcga gggcgagagc atctgggaga 1500
tcacagagaa gatcctgaac agcttcgagt acaccagccg gttcaccaag accaagaccc 1560
tgtaccagtt cctgttcctg gccaccttta tcaactgcgg ccggttctcc gacatcaaga 1620
acgtggaccc caagagcttc aagctggtgc agaacaagta cctgggcgtg atcattcagt 1680
gcctcgtgac cgagacaaag accagcgtgt cccggcacat ctactttttc agcgccagag 1740
gccggatcga ccccctggtg tacctggacg agttcctgag aaacagcgag cccgtgctga 1800
agagagtgaa ccggaccggc aacagcagct ccaacaagca ggaataccag ctgctgaagg 1860
acaacctcgt gcggtcctac aacaaggccc tgaagaaaaa cgccccctac cccatcttcg 1920
ccattaagaa cggccccaag tcccacatcg gccggcacct gatgaccagc tttctgagca 1980
tgaagggcct gacagagctg accaacgtcg tgggcaattg gagcgacaag agggcctctg 2040
ccgtggccag aaccacctac acccaccaga tcacagccat ccccgaccac tacttcgccc 2100
tggtgtctcg gtactacgcc tacgacccca tcagcaaaga gatgatcgcc ctgaaggacg 2160
agacaaaccc catcgaggaa tggcagcaca tcgagcagct gaagggcagc gccgagggca 2220
gcatcagata ccctgcctgg aacggcatca tctcccagga agtgctggac tacctgagca 2280
gctacatcaa ccggcggatc tgatctagac ctgatcataa tcaagccata tcacatctgt 2340
agaggtttac ttgctttaaa aaacctccac acctccccct gaacctgaaa cataaaatga 2400
atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2460
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2520
aactcatcaa tgtatcttat catgtctgga tctgcggatc caatctcgag ctgggcctca 2580
tgggccttcc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 2640
catggtcata gctgtttcct tgcgtattgg gcgctctccg cttcctcgct cactgactcg 2700
ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg agcaaaaggc cagcaaaagg 2760
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 2820
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2880
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 2940
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 3000
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 3060
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 3120
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 3180
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 3240
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3300
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3360
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3420
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3480
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3540
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3600
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3660
taccatctgg ccccagtgct gcaatgatac cgcgagaacc acgctcaccg gctccagatt 3720
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3780
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3840
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3900
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 3960
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 4020
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 4080
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 4140
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 4200
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 4260
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4320
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4380
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4440
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4500
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc ac 4542
<210> 7
<211> 10428
<212> DNA
<213> Artificial sequence
<220>
<223> SpCas9-2A-GFP vector V1.A.8
<400> 7
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
gtttaaactt aagcttggta ccgccaccat ggactataag gaccacgacg gagactacaa 960
ggatcatgat attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa 1020
ggtcggtatc cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg 1080
caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt 1140
caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct 1200
gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata 1260
caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa 1320
ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa 1380
gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta 1440
ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg 1500
gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg 1560
cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta 1620
caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct 1680
gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga 1740
gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt 1800
caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga 1860
cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc 1920
cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat 1980
caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct 2040
gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt 2100
cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt 2160
ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa 2220
gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca 2280
ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt 2340
cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt 2400
gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac 2460
catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat 2520
cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag 2580
cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga 2640
gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct 2700
gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat 2760
cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg 2820
cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa 2880
cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat 2940
cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa 3000
gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga 3060
caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 3120
cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca 3180
ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc 3240
cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg 3300
ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa 3360
gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg 3420
cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta 3480
cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg 3540
gctgtccgac tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat 3600
cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc 3660
cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat 3720
tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga 3780
taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc 3840
acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga 3900
agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt 3960
ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt 4020
cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga 4080
ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 4140
taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4200
ggccaacggc gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat 4260
cgtgtgggat aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt 4320
gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc 4380
caagaggaac agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg 4440
cggcttcgac agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg 4500
caagtccaag aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag 4560
cagcttcgag aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa 4620
ggacctgatc atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag 4680
aatgctggcc tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata 4740
tgtgaacttc ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa 4800
tgagcagaaa cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca 4860
gatcagcgag ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc 4920
cgcctacaac aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct 4980
gtttaccctg accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga 5040
ccggaagagg tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat 5100
caccggcctg tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc 5160
ggccacgaaa aaggccggcc aggcaaaaaa gaaaaaggaa ttcggcagtg gagagggcag 5220
aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggcccagtga gcaagggcga 5280
ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 5340
caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 5400
gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 5460
ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 5520
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 5580
ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 5640
gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 5700
caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 5760
caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 5820
cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 5880
cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 5940
cgccgccggg atcactctcg gcatggacga gctgtacaag gaattctaac gctagagggc 6000
ccgtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt 6060
gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 6120
aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 6180
tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 6240
tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg tatccccacg 6300
cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 6360
cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 6420
tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 6480
ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 6540
cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 6600
tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 6660
ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 6720
cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc 6780
aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc 6840
aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt 6900
cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc 6960
ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct 7020
attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agctcccggg 7080
agcttgtata tccattttcg gatctgatca agagacagga tgaggatcgt ttcgcatgat 7140
tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta 7200
tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca 7260
ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcagga 7320
cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga 7380
cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct 7440
cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg 7500
gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga 7560
gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca 7620
tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc ccgacggcga 7680
ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg 7740
cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc 7800
gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt 7860
gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga 7920
gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc caacctgcca 7980
tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 8040
cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 8100
cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 8160
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 8220
tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc atggtcatag 8280
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 8340
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 8400
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 8460
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 8520
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 8580
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 8640
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 8700
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 8760
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 8820
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 8880
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 8940
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 9000
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 9060
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 9120
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 9180
tgatccggca aacaaaccac cgctggtagc ggtttttttg tttgcaagca gcagattacg 9240
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 9300
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 9360
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 9420
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 9480
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 9540
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 9600
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 9660
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 9720
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 9780
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 9840
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 9900
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 9960
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 10020
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 10080
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 10140
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 10200
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 10260
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 10320
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 10380
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtc 10428
<210> 8
<211> 6071
<212> DNA
<213> Artificial sequence
<220>
<223> pcDNA3.1_GFP vector V1.A.4
<400> 8
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
gtttaaactt aagcttggta ccgccaccat ggaatccgat gagtctggcc tgcccgccat 960
ggaaatcgag tgcagaatca ccggcaccct gaacggcgtg gaatttgagc tcgtgggcgg 1020
aggcgagggc acacctgaac agggcagaat gaccaacaag atgaagtcca ccaagggggc 1080
cctgaccttc agcccctacc tgctgtctca cgtgatgggc tacggcttct accacttcgg 1140
cacctacccc agcggctacg agaacccttt cctgcacgcc atcaacaacg gcggctacac 1200
caacacccgg atcgagaagt acgaggacgg cggcgtgctg cacgtgtcct tcagctacag 1260
atacgaggcc ggcagagtga tcggcgactt caaagtgatg ggcaccggat tccccgagga 1320
cagcgtgatc ttcaccgaca agatcatccg gtccaacgcc accgtggaac atctgcaccc 1380
catgggcgac aacgacctgg acggcagctt caccagaacc ttctccctgc gggatggcgg 1440
ctactacagc agcgtggtgg acagccacat gcacttcaag agcgccatcc accccagcat 1500
cctccagaac ggcggaccca tgttcgcctt cagacgggtg gaagaggacc acagcaacac 1560
cgagctgggc atcgtggaat accagcacgc cttcaagacc cccgatgccg atgccggcga 1620
ggaatgagtc gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc 1680
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 1740
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 1800
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 1860
tagcaggcat gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg 1920
gggctctagg gggtatcccc acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 1980
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 2040
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 2100
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 2160
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 2220
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 2280
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 2340
gctgatttaa caaaaattta acgcgaatta attctgtgga atgtgtgtca gttagggtgt 2400
ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca 2460
gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 2520
ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 2580
cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 2640
gaggccgcct ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 2700
ggcttttgca aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca 2760
ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 2820
tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 2880
gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 2940
ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 3000
gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 3060
ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 3120
atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 3180
caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 3240
caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 3300
aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 3360
aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 3420
gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 3480
gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 3540
gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg 3600
accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 3660
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 3720
tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 3780
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 3840
gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga 3900
gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 3960
cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 4020
aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 4080
agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 4140
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 4200
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 4260
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 4320
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 4380
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 4440
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 4500
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 4560
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 4620
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 4680
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 4740
actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 4800
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggttttt 4860
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 4920
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 4980
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 5040
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 5100
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 5160
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 5220
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 5280
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 5340
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 5400
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 5460
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 5520
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 5580
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 5640
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 5700
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 5760
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 5820
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 5880
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 5940
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 6000
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 6060
cacctgacgt c 6071
<210> 9
<211> 2762
<212> DNA
<213> Artificial sequence
<220>
<223> AAVSI_sg-sp-opti_3 vector V2.J.6
<400> 9
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatg gatccaaggt cgggcaggaa gagggcctat ttcccatgat tccttcatat 420
ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac tgtaaacaca 480
aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt 540
ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat 600
ttcttggctt tatatatctt gtggaaagga cgaaacaccg tcaccaatcc tgtccctagg 660
tttaagagct atgctggaaa cagcatagca agtttaaata aggctagtcc gttatcaact 720
tgaaaaagtg gcaccgagtc ggtgcttttt ttcagacatc catagatcta gctcgagttt 780
tttttctaga ctgggcctca tgggccttcc gctcactgcc cgctttccag tcgggaaacc 840
tgtcgtgcca gctgcattaa catggtcata gctgtttcct tgcgtattgg gcgctctccg 900
cttcctcgct cactgactcg ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg 960
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 1020
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 1080
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 1140
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 1200
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 1260
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 1320
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 1380
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 1440
cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1500
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1560
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1620
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1680
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 1740
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 1800
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 1860
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaacc 1920
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 1980
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 2040
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 2100
ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 2160
agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 2220
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 2280
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 2340
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 2400
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 2460
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 2520
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 2580
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 2640
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 2700
tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 2760
ac 2762
<210> 10
<211> 8188
<212> DNA
<213> ?Artificial sequence
<400> 10
gagctctact ggcttctgcg ccgcctctgg cccactgttt ccccttccca ggcaggtcct 60
gctttctctg acctgcattc tctcccctgg gcctgtgccg ctttctgtct gcagcttgtg 120
gcctgggtca cctctacggc tggcccagat ccttccctgc cgcctccttc aggttccgtc 180
ttcctccact ccctcttccc cttgctctct gctgtgttgc tgcccaagga tgctctttcc 240
ggagcacttc cttctcggcg ctgcaccacg tgatgtcctc tgagcggatc ctccccgtgt 300
ctgggtcctc tccgggcatc tctcctccct cacccaaccc catgccgtct tcactcgctg 360
ggttcccttt tccttctcct tctggggcct gtgccatctc tcgtttctta ggatggcctt 420
ctccgacgga tgtctccctt gcgtcccgcc tccccttctt gtaggcctgc atcatcaccg 480
tttttctgga caaccccaaa gtaccccgtc tccctggctt tagccacctc tccatcctct 540
tgctttcttt gcctggacac cccgttctcc tgtggattcg ggtcacctct cactcctttc 600
atttgggcag ctcccctacc ccccttacct ctctagtctg tgctagctct tccagccccc 660
tgtcatggca tcttccaggg gtccgagagc tcagctagtc ttcttcctcc aacccgggcc 720
cctatgtcca cttcaggaca gcatgtttgc tgcctccagg gatcctgtgt ccccgagctg 780
ggaccacctt atattcccag ggccggttaa tgtggctctg gttctgggta cttttatctg 840
tcccctccac cgggtggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 900
cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 960
gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 1020
ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 1080
acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 1140
tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 1200
ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 1260
gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 1320
cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 1380
cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 1440
cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 1500
ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 1560
ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 1620
cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 1680
gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 1740
aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1800
ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1860
ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1920
ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1980
tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgactgctta 2040
agcttggtac cgccaccatg gccaagggct tctacatcag caagagcctg ggcatcctgg 2100
gaatcctgct gggagtggct gctgtgtgca ccatcatcgc tctgagcgtg gtgtacagcc 2160
aggagggagg tcctggatcc ggaacaggtg gctctggcac tggaggatca ggtccaggtg 2220
gatctatggt gaagcagatc gagagcaaga ctgctttcca ggaagccttg gacgctgcag 2280
gtgataagct tgtagtagtt gacttctcag caacgtggtc tggaccttcc aagatgatca 2340
agcctttctt ccattccctc tctgagaagt attccaacgt gatattcctt gaagtagatg 2400
tggatgactc tcaggatgtt gcttcagagt gtgaagtcaa atccatgcca acattccagt 2460
tcttcaagaa gggacagaag gtgggtgaat tttctggagc caataaggag aagcttgaag 2520
ccaccattaa cgagttggta ggtaagtggc tggggccaga gactggctct tgaagttcct 2580
attccgaagt tcctattctc tagaaagtat aggaacttcc tggctcagaa aaagggccct 2640
gacaactctt ttcatcttct aggcggttcc tctacatccg gtggatctgg atctggagaa 2700
caaaagctca tctctgagga ggaccttggg gagcagaagc taatcagtga agaagacctc 2760
ggagagcaga aattgattag cgaggaggat ctttaaagac gctagcacct gatcctgatc 2820
ataatcaagc catatcacat ctgtagaggt ttacttgctt taaaaaacct ccacacctcc 2880
ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt 2940
ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 3000
tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgct 3060
gaagagcgct gatcagctct tcaccataga gcccaccgca tccccagcat gcctgctatt 3120
gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 3180
cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 3240
accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 3300
aggcacagtc gggtgctagc tcatctgtgg cccagcttgc taggcaggtc gcagtacttg 3360
gccacggcca tctcgtgctg ttccacgtag gtttctttgt cggcctcttt gatccgttcc 3420
agccggtggt ccacgaagtg gaagccgggc atcttcaggt tcttggcggg cttcttgctt 3480
ctgtaggtgg tcttgaagga gcagtgcagg tagcctccgc ccacgagttt cagggccatc 3540
tgagaatggc ctctcaggcc gccatcggca gggtacagca tctcggtgtt ggcctcccag 3600
cctctggttt tcttctgcat cacggggccg ttgctgggga agttcacgcc gttaatcttc 3660
acgttgtaga tgatgcagcc gttctggaag ctggtatcct gggtggcggt cagcactccg 3720
ccgtcctcgt atgtggtgat ccgctcccag gtgaagccct cggggaagct ctgcttgaag 3780
aaatcgggga tgccctgggt gtggttgatg aaggccttgc tgccgtacat aaagctggtg 3840
gccaggatat caaaggcgaa gggcagaggg ccgccttcca ccaccttgat cttcatggtc 3900
tgggtgccct cgtaaggctt gccctcgccc tcgctggtgc acttgaagtg gtggttgttc 3960
acggtgcctt ccatgtacag cttcatgtgc atgttttctt tgatcagctc gctcatggtg 4020
gctacggaag ttcctattcc gaagttccta ttcttcaaat agtataggaa cttccggtac 4080
cagtcacgac acctgaaatg gaagaaaaaa actttgaacc actgtctgag gcttgagaat 4140
gaaccaagat ccaaactcaa aaagggcaaa ttccaaggag aattacatca agtgccaagc 4200
tggcctaact tcagtctcca cccactcagt gtggggaaac tccatcgcat aaaacccctc 4260
cccccaacct aaagacgacg tactccaaaa gctcgagaac taatcgaggt gcctggacgg 4320
cgcccggtac tccgtggagt cacatgaagc gacggctgag gacggaaagg cccttttcct 4380
ttgtgtgggt gactcacccg cccgctctcc cgagcgccgc gtcctccatt ttgagctccc 4440
tgcagcaggg ccgggaagcg gccatctttc cgctcacgca actggtgccg accgggccag 4500
ccttgccgcc cagggcgggg cgatacacgg cggcgcgagg ccaggcacca gagcaggccg 4560
gccagcttga gactaccccc gtccgattct cggtggccgc gctcgcaggc cccgcctcgc 4620
cgaacatgtg cgctgggacg cacgggcccc gtcgccgccc gcggccccaa aaaccgaaat 4680
accagtgtgc agatcttggc ccgcatttac aagactatct tgccagaaaa aaagcgtcgc 4740
agcaggtcat caaaaatttt aaatggctag agacttatcg aaagcagcga gacaggcgcg 4800
aaggtgccac cagattcgca cgcggcggcc ccagcgccca ggccaggcct caactcaagc 4860
acgaggcgaa ggggctcctt aagcgcaagg cctcgaactc tcccacccac ttccaacccg 4920
aagctcggga tcaagaatca cgtactgcag ccagtggaag taattcaagg cacgcaaggg 4980
ccataacccg taaagaggcc aggcccgcgg gaaccacaca cggcacttac ctgtgttctg 5040
gcggcaaacc cgttgcgaaa aagaacgttc acggcgacta ctgcacttat atacggttct 5100
cccccaccct cgggaaaaag gcggagccag tacacgacat cactttccca gtttaccccg 5160
cgccaccttc tctaggcacc ggttcaattg ccgacccctc cccccaactt ctcggggact 5220
gtgggcgatg tgcgctctgc ccactgacgg gcaccggagc caccggatca ggatcaggat 5280
tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga tattgggtct 5340
aacccccacc tcctgttagg cagattcctt atctggtgac acacccccat ttcctggagc 5400
catctctctc cttgccagaa cctctaaggt ttgcttacga tggagccaga gaggatcctg 5460
ggagggagag cttggcaggg ggtgggaggg aaggggggga tgcgtgacct gcccggttct 5520
cagtggccac cctgcgctac cctctcccag aacctgagct gctctgacgc ggctgtctgg 5580
tgcgtttcac tgatcctggt gctgcagctt ccttacactt cccaagagga gaagcagttt 5640
ggaaaaacaa aatcagaata agttggtcct gagttctaac tttggctctt cacctttcta 5700
gtccccaatt tatattgttc ctccgtgcgt cagttttacc tgtgagataa ggccagtagc 5760
cagccccgtc ctggcagggc tgtggtgagg aggggggtgt ccgtgtggaa aactcccttt 5820
gtgagaatgg tgcgtcctcg agctgggcct catgggcctt ccgctcactg cccgctttcc 5880
agtcgggaaa cctgtcgtgc cagctgcatt aacatggtca tagctgtttc cttgcgtatt 5940
gggcgctctc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg gtaaagcctg 6000
gggtgcctaa tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 6060
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 6120
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 6180
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 6240
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 6300
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 6360
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 6420
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 6480
gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc 6540
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 6600
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 6660
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 6720
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 6780
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 6840
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 6900
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 6960
accgcgagaa ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 7020
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 7080
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 7140
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 7200
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 7260
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 7320
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 7380
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 7440
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 7500
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 7560
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 7620
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 7680
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 7740
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 7800
ccgaaaagtg ccacctaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt 7860
tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca 7920
aaagaataga ccgagatagg gttgagtggc cgctacaggg cgctcccatt cgccattcag 7980
gctgcgcaac tgttgggaag ggcgtttcgg tgcgggcctc ttcgctatta cgccagctgg 8040
cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 8100
gacgttgtaa aacgacggcc agtgagcgcg acgtaatacg actcactata gggcgaattg 8160
gcggaaggcc gtcaaggccg catgaatt 8188
<210> 11
<211> 3996
<212> DNA
<213> Artificial sequence
<220>
<223> M2-gene-Long_RSV1-FLAG_Tx?V12.A.8
<400> 11
gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcct ggctcagaaa 60
aagggccctg acaactcttt tcatcttcta ggcggttcct ctacatccgg tggatctgga 120
tctgggcatg tggttgaggg gcttgctggc gaactagagc aattgcgagc ccgcctcgaa 180
caccatcctc aaggtcaata aagactcgag cacctgatcc tgatcataat caagccatat 240
cacatctgta gaggtttact tgctttaaaa aacctccaca cctccccctg aacctgaaac 300
ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat 360
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 420
gtttgtccaa actcatcaat gtatcttatc atgtctggat ctgctgaaga gcgctgatca 480
gctcttcacc atagagccca ccgcatcccc agcatgcctg ctattgtctt cccaatcctc 540
ccccttgctg tcctgcccca ccccaccccc cagaatagaa tgacacctac tcagacaatg 600
cgatgcaatt tcctcatttt attaggaaag gacagtggga gtggcacctt ccagggtcaa 660
ggaaggcacg ggggaggggc aaacaacaga tggctggcaa ctagaaggca cagtcgggtg 720
ctagcgaaga ccgagcggtg gatccgtatg gtgacaagac gactagtgtg aacgacctgt 780
tagagaaccc ggcacatctg tcgagaggta cgaccgtgca ctaagcttcg caaggtcagt 840
ggagctatcg agtgtaggat ggttcaagtc tgccaatgga gctacagaag tcgaagccgt 900
ccagatctgg actatagtca cttatcgtca tcgtccttat aatcaatatc gtggtcttta 960
taatctccat catgatcctt gtaatccccg ggggtggtat cgttgttctt ggcgtggtcg 1020
ttggtgtcgt tgacggtgct ctctttggga ttgttgatgg tgatgctctt gtggatgtcc 1080
agggtgttct tgatggtttt cttcagcacg tcggcaggca gccgcttcag cagatggatg 1140
gtctgcttgt tgttcttccg gttgctctcg atgtagctga tcacggtgtt gtacacccgg 1200
atcttggggc tgttaggttc ctcgttgtcc cgcagcttct tgatgtcgtc gctgttcagc 1260
tctgtcagca gcttgctcat ggccacgcag gcgctctgct tggtgatgtt gttgatgctg 1320
ccgatatagc tttccagcac gcccacaacg cccagggcat attcctcggt tctatccagt 1380
tcggcggctc cgctgatctc gctcagggtg tcgatgctct tatccatgga cttcaggatt 1440
ctgttcagca tgaagttctg ccgcacgagc agagcgtgag gaggccactc gaagtagttg 1500
tggctgaagt ggcatctctt gccgttcagg cagtggcctc tgatctcgaa cttgcagggg 1560
ttccgtctgc tcatggtggc ggtattgtct tcggtaccgc acgaagttcc tattcggaag 1620
ttcctattct tcaaatagta taggaacttc cgctctgacc agctgcatta acatggtcat 1680
agctgtttcc ttgcgtattg ggcgctctcc gcttcctcgc tcactgactc gctgcgctcg 1740
gtcgttcggg taaagcctgg ggtgcctaat gagcaaaagg ccagcaaaag gccaggaacc 1800
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1860
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1920
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1980
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 2040
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 2100
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 2160
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 2220
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 2280
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 2340
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 2400
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 2460
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2520
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2580
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 2640
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 2700
gccccagtgc tgcaatgata ccgcgagaac cacgctcacc ggctccagat ttatcagcaa 2760
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 2820
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 2880
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 2940
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 3000
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 3060
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 3120
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 3180
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 3240
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 3300
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 3360
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 3420
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 3480
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 3540
gggttccgcg cacatttccc cgaaaagtgc cacctaaatt gtaagcgtta atattttgtt 3600
aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 3660
caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtggcc gctacagggc 3720
gctcccattc gccattcagg ctgcgcaact gttgggaagg gcgtttcggt gcgggcctct 3780
tcgctattac gccagctggc gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg 3840
ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgagcgcga cgtaatacga 3900
ctcactatag ggcgaattgg cggaaggccg tcaaggccgc atgaattcgc taccgggagt 3960
tggtaggtaa gtggctgggg ccagagactg gctctt 3996
<210> 12
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> turboRFP_GT_F1 1.I.7
<400> 12
gagaggccat tctcagatgg 20
<210> 13
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> turboRFP_GT_R1 1.I.8
<400> 13
cgggcatctt caggttcttg 20
<210> 14
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> turboRFP_probe_FAM 1.I.9
<400> 14
ctacctgcac tgctccttca agacc 25
<210> 15
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> TRAC_TCRA-promoter_F1 10.A.10
<400> 15
gacttgtcac tggatttaga gtctct 26
<210> 16
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> TRAC_probe (HEX) 10.B.6
<400> 16
atccagaacc ctgaccctgc cg 22
<210> 17
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> TRAC-TCRA-ex1-F1 10.A.9
<400> 17
ctgatcctct tgtcccacag ata 23
<210> 18
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> AAVS1_GT_F5 15.F.9
<400> 18
actctgccct ctaacgctg 19
<210> 19
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> AMPN-TMD_GT_R1 19.E.7
<400> 19
gctgatgtag aagcccttgg 20
<210> 20
<211> 876
<212> DNA
<213> Artificial sequence
<220>
<223> SurfaceTag with Barcode FLAG-MYC-HA
<400> 20
atggaggagg gacagtacag cgagatcgag gagctgccca ggagaaggtg ctgcaggaga 60
ggcacccaga tcgtgctgct gggactggtg accgctgctc tgtgggcagg actgctgaca 120
ttgctgttgc tgtggcactg ggacaccacc cagagcctga agcagctgga ggagggaggt 180
cctggatccg gaacaggtgg ctctggcact ggaggatcag gtccaggtgg atctatggtg 240
aagcagatcg agagcaagac tgctttccag gaagccttgg acgctgcagg tgataagctt 300
gtagtagttg acttctcagc aacgtggtct ggaccttcca agatgatcaa gcctttcttc 360
cattccctct ctgagaagta ttccaacgtg atattccttg aagtagatgt ggatgactct 420
caggatgttg cttcagagtg tgaagtcaaa tccatgccaa cattccagtt cttcaagaag 480
ggacagaagg tgggtgaatt ttctggagcc aataaggaga agcttgaagc caccattaac 540
gagttggtcg gtggttcctc tacatccggt ggatctggat ctggtgatta caaggatcat 600
gatggagatt ataaagacca cgatattgat tataaggacg atgacgataa gggaggatat 660
ccgtatgatg taccagacta cgctggatac ccttacgatg tacctgatta tgccggatac 720
ccctatgacg taccggacta tgcgggagga gaacaaaagc tcatctctga ggaggacctt 780
ggggagcaga agctaatcag tgaagaggac ctcggagagc agaaattgat tagcgaagag 840
gatcttggcg ggcaccatca tcatcaccac cactaa 876
<210> 21
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> ORF-AM_GT_F2
<400> 21
ttctgtagct ccattggcag 20
<210> 22
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> ORF-AM_GT_R1
<400> 22
atccgtatgg tgacaagacg 20
<210> 23
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> TRAC-TCRA-ex1-F1
<400> 23
gacttgtcac tggatttaga gtctct 26
Claims (15)
- 2가지 별도의 구성요소를 포함하는 조합 시스템(combined system)으로서,
제1 구성요소는 3' 인트론 단편이 측접하는 제1 세포 표면 태그(cell surface tag: CST) 엑손, 및 관심 유전자(gene of interest: GOI)를 안티센스 방향으로 인코딩하는 태그-교환 공여체 벡터(tag-exchange donor vector: TEDV)이고, 제2 구성요소는 제1 CST와는 상이하며, 막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 제2 CST 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(tag-exchange receiver site: TERS)를 게놈 내에 포함하는 조작된 세포(engineered cell)이며, 쌍을 이루는 재조합효소 매개 카세트 교환(recombinase mediated cassette exchange: RMCE) 요소는 TEDV 및 TERS에 포함되어 TEDV와 TERS 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 GOI에 대한 리포터 요소의 교환, 및 제2 CST 엑손에 대한 제1 CST 엑손의 교환을 초래하여, 이제 파생 조작된 세포는 제2 CST 및 리포터 유전자 대신에 제1 CST 및 GOI를 발현하는, 조합 시스템. - 제1항에 있어서, 상기 제1 구성요소는,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열(Kozak sequence)
h. 제2 RMCE 요소
를 포함하는 TEDV이되,
상기 CST 엑손 및 상기 제1 전사 종결자는 상기 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 조합 시스템. - 제1항 또는 제2항에 있어서, 상기 제2 구성요소는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 인트론 서열 d. 내에 인코딩된 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하는 TERS이되,
상기 막관통 도메인 엑손 및 상기 CST 엑손은 상기 리포터 유전자로부터 안티센스 방향으로 인코딩되어서, 상기 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 상기 제2 전사 프로모터 요소는 상기 리포터 유전자의 전사를 구동시키는, 조합 시스템. - 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 TEDV의 제1 RMCE 요소는 상기 TERS의 제1 RMCE 요소와 쌍을 이루고, 상기 TEDV의 제2 RMCE 요소는 상기 TERS의 제2 RMCE 요소와 쌍을 이루는, 조합 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 각각의 CST 엑손은 하나 이상의 분자 친화성 태그를 인코딩하는 서열을 포함하고 상기 TEDV 및 상기 TERS에 의해 인코딩되는 CST는 상이한, 조합 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 조작된 세포는 게놈에 단일 TERS를 포함하는, 조합 시스템.
- TERS 유전자좌로부터 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포를 생성하는 방법으로서,
a. GOI를 인코딩하는 TEDV를 생성하는 단계;
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 상기 TEDV를 전달하는 단계;
c. TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계;
d. 통합된 GOI를 가지는 세포의 선택을 위한 프록시로서, 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 TEDV-인코딩된 CST의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함하는, 파생 조작된 세포를 생성하는 방법. - 제7항에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 TERS-인코딩된 CST의 발현 감소 및 TEDV-인코딩된 CST의 발현 증가를 검출하기 위해 형광 표지되어, 형광 활성화 세포 분류에 의해 상기 발현을 기반으로 세포 분할 및 선택을 가능하게 하는, 파생 조작된 세포를 생성하는 방법.
- 제7항에 있어서, 상기 단계 c.에서 사용되는 친화성 시약은 기질에 고정되어, 기질 친화성 방법, 예컨대 자기 활성화 세포 분류를 사용하여 표적 세포 집단에서 TERS-인코딩된 CST를 발현하는 세포를 고갈시킬 수 있거나 TEDV-인코딩된 CST를 발현하는 세포를 풍부화시킬 수 있는, 파생 조작된 세포를 생성하는 방법.
- TEDV의 풀로부터 다양한 TEDV-인코딩된 GOI를 발현하는 다중 파생 조작된 세포를 생성하는 방법으로서,
a. 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계;
b. 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계;
c. 다중 TEDV-인코딩된 CST 및 TERS-인코딩된 CST 둘 다에 대하여 특이적인 3가지 이상의 친화성 시약과 세포를 접촉시키는 단계;
d. 리포터 유전자 및 TERS-인코딩된 CST의 발현 감소, 및 고유한 TEDV-인코딩된 CST 각각의 발현 증가에 기초하여 파생 조작된 세포를 선택하는 단계
를 포함하는, 다중 파생 조작된 세포를 생성하는 방법. - - 각각 고유한 GOI 서열을 인코딩하고, 각각 고유한 TEDV-인코딩된 CST를 가지는 2가지 이상의 TEDV의 라이브러리를 생성하는 단계;
- 내부에서 인코딩된 RMCE 요소와 일치하는 재조합 효소와 함께, 쌍을 이루는 TERS를 포함하는 조작된 세포주에 풀로서 TEDV의 상기 라이브러리를 전달하는 단계;
에 의해 생성된 세포의 풀 내에서 다양한 TEDV-인코딩된 GOI를 발현하는 파생 조작된 세포의 세포 계통 추적 방법으로서,
a. 다수의 TEDV-인코딩된 CST에 특이적인 2가지 이상의 친화성 시약과 세포를 접촉시키는 단계;
b. 고유한 TEDV-인코딩된 CST 각각의 발현을 기초로 파생 조작된 세포의 함량을 분석하는 단계
를 포함하는, 세포 계통 추적 방법. - 3' 인트론 단편이 측접하는 세포 표면 태그(CST) 엑손, 및 관심 유전자(GOI)를 안티센스 방향으로 인코딩하는, 태그-교환 공여체 벡터(TEDV).
- 제12항에 있어서,
a. 제1 RMCE 요소
b. 3' 인트론 단편
c. CST 엑손
d. 제1 전사 종결자
e. 제2 전사 종결자
f. GOI
g. 코작 서열
h. 제2 RMCE 요소
를 포함하되,
상기 CST 엑손 및 상기 제1 전사 종결자는 상기 GOI 및 연관 전사 종결자 및 코작 서열로부터 안티센스 방향으로 인코딩되는, 태그-교환 공여체 벡터(TEDV). - 조작된 세포로서,
막관통 도메인을 인코딩하는 엑손에 대해 전체 인트론 서열이 인접한 세포 표면 태그(CST) 엑손을 인코딩하고, 또한 리포터 유전자를 안티센스 방향으로 인코딩하는 태그-교환 수용체 부위(TERS)를 게놈 내에 포함하는 조작된 세포이되, 재조합효소 매개 카세트 교환(RMCE) 요소는 TERS에 포함되어 TERS와 태그-교환 공여체 벡터(TEDV) 사이에서 RMCE를 실행하면 TEDV에 의해 인코딩되는 관심 유전자(GOI)의 리포터 요소의 교환을 초래하는, 조작된 세포. - 제14항에 있어서, 상기 TERS는,
a. 전사 프로모터 요소
b. 코작 서열
c. 막관통 도메인 엑손
d. 인트론
e. 제1 RMCE 요소
f. CST 엑손
g. 제1 전사 종결자
h. 제2 전사 종결자
i. 리포터 유전자
j. 코작 서열
k. 제2 RMCE 요소
l. 제2 전사 프로모터 요소
를 포함하되,
상기 막관통 도메인 엑손 및 상기 CST 엑손은 상기 리포터 유전자로부터 안티센스 방향으로 인코딩되어, 상기 제1 전사 프로모터 요소는 결합된 막관통 도메인 및 CST의 전사를 구동시키고, 상기 제2 전사 프로모터 요소는 상기 리포터 유전자의 전사를 구동시키는, 조작된 세포.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18182353.5 | 2018-07-09 | ||
EP18182353 | 2018-07-09 | ||
PCT/EP2019/068343 WO2020011757A1 (en) | 2018-07-09 | 2019-07-09 | A cell surface tag exchange (cste) system for tracing and manipulation of cells during recombinase mediated cassette exchange integration of nucleic acid sequences to engineered receiver cells |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210030414A true KR20210030414A (ko) | 2021-03-17 |
Family
ID=62909382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217003789A KR20210030414A (ko) | 2018-07-09 | 2019-07-09 | 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20210371875A1 (ko) |
EP (2) | EP3821017B1 (ko) |
JP (1) | JP2021524274A (ko) |
KR (1) | KR20210030414A (ko) |
CN (1) | CN112513279A (ko) |
AU (1) | AU2019301865A1 (ko) |
CA (1) | CA3105890A1 (ko) |
ES (1) | ES2965835T3 (ko) |
SG (1) | SG11202012381QA (ko) |
WO (1) | WO2020011757A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2925867B1 (en) * | 2012-11-30 | 2018-06-27 | Larix Biosciences LLC | A novel cell line screening method |
WO2017186718A1 (en) * | 2016-04-25 | 2017-11-02 | Universität Basel | Allele editing and applications thereof |
KR102625785B1 (ko) * | 2016-11-07 | 2024-01-16 | 제노비에 에이비 | T-세포 수용체 및 t-세포 항원의 식별 및 특징규명을 위한 조작된 다성분 시스템 |
NZ753794A (en) * | 2016-11-07 | 2023-05-26 | Genovie Ab | An engineered multi-component system for identification and characterisation of t-cell receptors, t-cell antigens and their functional interaction |
-
2019
- 2019-07-09 US US17/259,003 patent/US20210371875A1/en active Pending
- 2019-07-09 JP JP2021500636A patent/JP2021524274A/ja active Pending
- 2019-07-09 KR KR1020217003789A patent/KR20210030414A/ko unknown
- 2019-07-09 ES ES19736385T patent/ES2965835T3/es active Active
- 2019-07-09 AU AU2019301865A patent/AU2019301865A1/en active Pending
- 2019-07-09 EP EP19736385.6A patent/EP3821017B1/en active Active
- 2019-07-09 CA CA3105890A patent/CA3105890A1/en active Pending
- 2019-07-09 EP EP23205633.3A patent/EP4296363A3/en active Pending
- 2019-07-09 CN CN201980046307.6A patent/CN112513279A/zh active Pending
- 2019-07-09 WO PCT/EP2019/068343 patent/WO2020011757A1/en active Search and Examination
- 2019-07-09 SG SG11202012381QA patent/SG11202012381QA/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP4296363A3 (en) | 2024-03-20 |
CN112513279A (zh) | 2021-03-16 |
US20210371875A1 (en) | 2021-12-02 |
EP3821017B1 (en) | 2023-10-25 |
EP3821017C0 (en) | 2023-10-25 |
CA3105890A1 (en) | 2020-01-16 |
SG11202012381QA (en) | 2021-01-28 |
JP2021524274A (ja) | 2021-09-13 |
WO2020011757A1 (en) | 2020-01-16 |
EP4296363A2 (en) | 2023-12-27 |
EP3821017A1 (en) | 2021-05-19 |
AU2019301865A1 (en) | 2021-03-04 |
ES2965835T3 (es) | 2024-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102606929B1 (ko) | 동족 항원과 t-세포 수용체 상호작용의 발견 및 특징규명을 위한 조작된 2-부분 세포 디바이스 | |
CN110656090B (zh) | 一种表达质粒、用于包装容量增加的二代腺病毒的细胞株及其应用 | |
KR102274445B1 (ko) | 게놈 삽입을 위한 방법 | |
KR20210143230A (ko) | 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물 | |
KR20230019843A (ko) | 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물 | |
KR102584628B1 (ko) | T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템 | |
KR102614328B1 (ko) | T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스 | |
JP2023025182A (ja) | T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム | |
US11820998B2 (en) | Porcine Thy1 gene promoter specifically expressed in neurons | |
EP3635103A1 (en) | Enhanced modified viral capsid proteins | |
CN1867669B (zh) | 生产伽马-羧化的蛋白的方法 | |
CN113186167B (zh) | 用于测定抗cd20单克隆抗体药物adcp生物学活性的方法 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
KR20220024053A (ko) | 타우병증의 모델 | |
US20040255345A1 (en) | Production of transgenic avians | |
KR20070114761A (ko) | Sivpedf 벡터를 사용한 안조직 세포에 있어서의아포토시스 변성을 동반하는 질환의 치료제 | |
CN101160139A (zh) | 含有pedf以及fgf2的伴随眼组织细胞凋亡变性的疾患的治疗药物 | |
WO2022241455A1 (en) | A synthetic circuit for buffering gene dosage variation between individual mammalian cells | |
KR20210030414A (ko) | 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 | |
TW202228728A (zh) | 用於同時調節基因表現之組合物及方法 | |
CN102698291A (zh) | 一种可提高细胞免疫应答的布鲁菌抗原基因组合rob | |
CN115029347B (zh) | 识别和调控肝肾细胞纤维化的分子监测序列、重组质粒、抑制病毒 | |
CN115704016A (zh) | 一种利用dCas9-p450系统进行定点突变的方法 |