KR20220165753A - 핵산 서열의 선택을 위한 방법 - Google Patents

핵산 서열의 선택을 위한 방법 Download PDF

Info

Publication number
KR20220165753A
KR20220165753A KR1020227038602A KR20227038602A KR20220165753A KR 20220165753 A KR20220165753 A KR 20220165753A KR 1020227038602 A KR1020227038602 A KR 1020227038602A KR 20227038602 A KR20227038602 A KR 20227038602A KR 20220165753 A KR20220165753 A KR 20220165753A
Authority
KR
South Korea
Prior art keywords
nucleic acid
acid sequence
cells
protein
cell
Prior art date
Application number
KR1020227038602A
Other languages
English (en)
Inventor
안드레아스 존슨
대니얼 이반슨
Original Assignee
씨티바 스웨덴 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨티바 스웨덴 에이비 filed Critical 씨티바 스웨덴 에이비
Publication of KR20220165753A publication Critical patent/KR20220165753A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 개시내용은 단리된 진핵생물 숙주 세포의 특이적 사전-정의된 게놈 위치 내로의 공여자 벡터의 표적화된 통합을 위한 방법에 관한 것이다. 벡터 및 숙주 세포는 함께 숙주 세포의 사전-정의된 게놈 위치 내로 공여자 벡터를 통합한 세포의 선택을 허용하는 핵산 구성요소를 포함한다. 보다 구체적으로, 본 방법은 서열 최적화된 핵산 서열 변이체의 선택을 제공한다. 이러한 최적화된 핵산 서열 변이체는 재조합 단백질 생산에서의 후속 사용을 위한 서열 최적화된 발현 벡터 구성요소를 포함할 수 있다.

Description

핵산 서열의 선택을 위한 방법
본 발명은 진핵생물 숙주 세포 게놈의 특이적 사전-정의된 게놈 위치 내로의 공여자 벡터의 표적화된 통합을 이용하는 세포-기반 방법의 분야에 관한 것이며, 여기서 상기 벡터 및 숙주 세포는 숙주 세포 게놈의 사전-정의된 게놈 위치 내로 공여자 벡터를 통합한 세포를 선택적으로 선택하는 것 및 임의적으로 게놈의 다른 부분 내로의 임의의 추가적 무작위 통합 사건을 겪은 세포를 검출하고 제거하는 것을 가능하게 하는 핵산 구성요소를 포함한다. 본 발명은 특히 그로부터 최적화된 핵산 서열 변이체를 확인하는 것을 목표로 하는 핵산 서열 변이체의 라이브러리를 평가하기 위한 이러한 표적화된 통합 시스템의 용도에 관한 것이다. 이러한 최적화된 핵산 서열 변이체는 후속적으로 재조합 단백질 생산을 위한 발현 시스템에 또는 다른 생명공학 적용에 사용될 수 있다.
단백질의 상업적 생산을 위한 발현 카세트의 최적화
지난 30년 동안 재조합 단백질 치료제는 새로운 것에서 시장화된 약물 중에서의 지배적인 위치까지 진화하였다. 치료 단백질의 재조합 생산은 연간 1000억 $의 시장 규모를 능가하였으며, 전세계 경제에 있어서 뿐만 아니라 선진 의료에 있어서 중요한 역할을 한다. 치료 단백질 부류는 대체 단백질 (인슐린, 성장 인자, 시토카인 및 혈액 인자), 백신 (항원, VLP) 및 모노클로날 항체를 포함한다. 지금까지 지배적인 형식은 모노클로날 항체이다 [1, 2]. 단백질 조작 및 합성 생물학의 계속된 진보를 통해, 치료 단백질 부류는 조작된 단백질 형식, 예컨대 이중- 및 다중-특이적 항체의 개발에 있어서 급속한 성장으로 매우 다양화되게 되었다 [3, 4]. 재조합 단백질의 일부는 단순한 미생물 세포, 예컨대 이. 콜라이(E. coli)에서 생산될 수 있지만, 전통적인 모노클로날 항체 부류 및 최근의 조작된 항체 부류 둘 다를 포함하는 보다 복잡한 단백질에 대해, 중국 햄스터 난소 (CHO) 세포는 생산을 위한 지배적인 숙주이다 [2].
오늘날 산업 내에서 고성능 치료 단백질 생산 세포주를 생성하는 지배적인 접근법은 재조합 단백질 유전자를 무작위 통합 접근법을 통해 숙주 CHO 세포주의 게놈 내로 도입하고, 충분히 높은 전사를 산출하는 카피 수에서 활성 게놈 부위에서 유전자를 통합한 동시에 높은 단백질 번역 및 분비를 지지할 수 있는 표현형을 갖는 개별적 세포에 대해 선택하는/스크리닝하는 것이다. 이는 큰 고유의 불확실성 및 생물학적 변이를 갖는 고도로 노동 집약적이고 시간-소비적인 프로세스이다. 전형적인 프로세스 지속기간은 숙주 세포의 성장, 실행된 자동화의 수준 및 종점 (예를 들어 장기 클론 안정성의 평가가 포함되는 경우)에 따라 3-12개월에 걸친다.
무작위 통합 접근법과 연관된 한 가지 근본적인 제한은 세포의 형질감염된 풀에서의 세포적 다양성의 낮은 샘플링이다. 형질감염된 세포의 단지 약 0.1-1%가 재조합 DNA를 통합한다. 추가로, 이 하위-집단은 통합 위치, 카피 수 및 통합된 DNA의 통합성의 관점에서 고도로 이질적이다. 높은 게놈 및 에피-게놈 가소성으로 인해 CHO 세포에 대해 고유한 CHO 세포의 고유한 세계적 표현형적 변이를 첨가하는 것은 높은 생산 클론을 발견하는 것을 건초더미에서 바늘을 찾는 것과 같이 만든다. 이는 또한 비-클론성 안정한 풀로부터의 단백질 생산의 높은 변이가 일반적으로 관찰되는 이유 (표현형적 다양성의 추계적 샘플링)를 설명한다.
이 언더-샘플링 및 높은 생물학적 노이즈는 또한 발현의 최적화를 위한 치료 단백질 후보의 상이한 유전자 카세트 디자인의 비교를 곤란하게 만든다. 안정한 풀의 평행 생성을 통한 다수의 변이체의 비교는 고도로 노동 집약적이고, 높은 생물학적 노이즈는 결과를 신뢰하지 못하게 만들 것이다. 변이체 라이브러리의 동시 형질감염의 사용은 무작위 통합이 전형적으로 발현 벡터의 다수의 카피의 통합을 발생시키고, 따라서 이러한 작업흐름을 통해 생성된 임의의 세포는 전형적으로 1개 초과의 유전자 카세트 디자인으로부터의 통합된 카피를 함유할 것이라는 사실에 의해 방해된다. 이펙터 유전자의 무작위 통합에 기반한 세포주 조작 전략에 의해 단백질 발현을 개선시키는 것은 동일한 이유에 의해 방해된다.
모든 상기 제한에 대한 한 가지 잠재적으로 주요한 개선은 관심의 유전자 (GOI)의 표적화된 통합 (부위-지정 통합; SDI)을 이용하는 것이다. 이러한 시나리오에서 높고 안정한 전사를 지지하는 것으로 공지된 사전-확인된 게놈 위치는 GOI에 대한 표적 목적지로서 사용된다. 공동-형질감염된 핵산 효소, 예컨대 뉴클레아제 또는 리콤비나제의 사용을 포함하는 사전-도입된 서열 및 벡터 디자인의 지적 조합을 사용하는 것은 표적화된 삽입을 용이하게 하고, 배양물에서의 모든 세포가 정확하게 삽입된 GOI를 함유하고 따라서 높은 전사율을 가질 것임을 보장할 것이다. 이는 세포주 개발 (CLD)을 위한 스크리닝 작전에 필요한 클론의 수를 유의하게 감소시키고, 유전자 카세트 디자인의 비교 또는 세포주 조작 노력에 있어서의 생물학적 노이즈를 감소시킬 것이다. 표적화된 통합을 위한 다수의 기술적 해결책은 관련 기술분야에 기재되어 있다 [5-8]. 그러나, 그럼에도 불구하고, 과제는 남아 있다.
표적화된 통합을 위한 Flp-In™ 시스템 (또한 플립파제 리콤비나제로 지칭되는 Flp 리콤비나제에 기반함) [9]은 단일 리콤비나제 인식 서열을 그의 리콤비나제와 조합으로 이용하여 사전-정의된 게놈 위치에서 표적화된 통합을 가능하게 하는 해결책의 예이다. 리콤비나제의 작용 후, 완전한 발현 벡터는 리콤비나제 인식 서열에서 통합된다. 정확한 통합 사건을 갖는 세포가 선택될 수 있는데, 이는 리콤비나제 인식 부위에서의 통합이 하나의 선택 마커를 불활성화시키고, 제2 선택 마커를 활성화시키기 때문이다. 이 해결책으로의 주요한 결점은 (i) 무작위 통합 사건에 의한 발현 벡터의 추가적 카피를 통합한 세포를 검출하거나 제거하는 메커니즘이 없고, (ii) GOI의 발현에 대해 음성일 수 있는 서열 영역, 예컨대 플라스미드 백본 서열 및 활성 선택 마커 유전자를 제거하는 메커니즘이 없고, (iii) 통합 동안 선택 마커의 활성화가 그의 기능성에 영향을 미칠 수 있는 N-말단에서의 가외의 아미노산의 융합을 발생시키기 때문에 방법이 선택 마커의 선택에 있어서 의문스러운 유연성을 가지며, (iv) 선택이 연장된 시간을 요구하는 항생제 저항성에 기반하고, 양성 통합을 갖는 세포 중에서의 차등적 성장 속도에 기반하여 잠재적 편향을 도입한다는 것이다.
표적화된 통합 후 GOI 발현에 대한 잠재적인 부정적 영향을 갖는 서열의 존재를 회피하기 위해, 사전-정의된 게놈 위치에서의 카세트 교환 반응을 위한 상이한 해결책이 관련 기술분야에 기재되었다 [5-8]. 이러한 해결책의 예는 렌트슐러(Rentschler)에 의해 개시되었다 [10]. 사전-정의된 게놈 위치는 둘 다 동일한 리콤비나제에 대해 표적화하는 2개의 직교 리콤비나제 인식 서열에 의해 플랭킹된 활성 선택 마커 유전자 (GFP)를 이용한다. 발현 벡터에서의 GOI는 이번에는 게놈에 존재하는 2개를 매칭시키는 2개의 리콤비나제 인식 서열에 의해 플랭킹된다. 리콤비나제의 작용 시, 선택 마커 카세트 및 GOI 카세트 사이의 카세트 교환이 일어날 수 있다. 카세트 교환을 겪은 세포는 GFP 발현의 부재에 의해 선택될 수 있다. 이 종류의 해결책의 결점은 (i) 무작위 통합 사건에 의한 발현 벡터의 추가적 카피를 통합한 세포를 검출하거나 제거하는 메커니즘이 없고, (ii) 카세트 교환을 겪은 세포의 선택이 초기 활성 유전자 생성물의 부재에 기반하기 때문에, 선택을 위한 시점은 GFP의 분해/희석을 허용하도록 지연되어야 한다는 것이다. 작업흐름을 연장시키는 것 외에도 이는 또한 상기 언급된 바와 같이, 양성 통합을 갖는 세포 중에서의 차등적 성장 속도에 기반하여 잠재적 편향을 도입한다.
하기가트-카 알이(Haghighat-Khah RE) 등은 곤충, 즉, 아에데스 아에깁티(Aedes aegypti) 모기 및 플루텔라 크실로스텔라(Plutella xylostella) 나방에서의 2-단계 부위-특이적 카세트 교환 시스템을 개시한다 [11]. 교환 시스템은 사전-정의된 게놈 위치에서의 발현 벡터의 통합을 위해 phiC31 리콤비나제를 이용하고, 이어서 플라스미드 백본 서열의 삭제를 위해 제2 리콤비나제 (Cre 또는 Flp)를 사용한다. 그러나, 하기가트 카 알이 등의 교환 시스템은 표적화된 통합 및 무작위 통합 사건 사이를 구별하기 위한 수단을 제공하지 않는다. 또한, 선택 마커 유전자를 제거하기 위한 수단이 제공되지 않는다.
위안, 와이(Yuan, Y) 등은 표적화된 세포의 게놈에 자연적으로 존재하는 슈도-attP 서열 내로의 PhiC31-매개 유전자 전달을 이용하는 선택 마커- 및 벡터-백본-무함유 트랜스제닉 세포를 생산하는 리콤비나제-기반 방법을 개시한다 [12]. 통합이 일어난 세포의 선택은 발현 벡터에서의 활성 eGFP 발현 카세트의 존재를 통해 달성되고, 표적화된 통합 시 활성화되게 되는 att-B-TK 융합 유전자는 제2 선택 단계에서 무작위 통합 사건을 제거하기 위한 음성 선택 마커로서 사용되었다. 선택 시스템 및 플라스미드 박테리아 백본은 이어서 2개의 다른 리콤비나제 Cre 및 Dre를 사용함으로써 삭제되었다. 1개의 사전-정의된 게놈 위치 내로의 통합에 기반한 재조합 단백질 생산 적용에 대한 채택을 위한 위안, 와이 등에 의해 개시된 방법에서의 중요한 결점은 (i) 불활성 TK 유전자가 둘 다의 시나리오로부터 초래될 것이기 때문에 방법이 사전-정의된 위치에서 통합을 겪은 세포를 무작위 슈도-attP 부위에서 통합을 겪은 세포로부터 구별하는 수단을 제공하지 않고, (ii) 제1 선택 단계가 선택 마커의 일시적 발현이 사라질 때까지 수행될 수 없어, 시간이 추가되고, 양성 통합을 갖는 세포 중에서의 차등적 성장 속도에 기반하여 잠재적 편향을 도입하고, (iii) 제1 선택 단계가 목적하는 통합, 슈도-attP 부위에서의 통합 또는 무작위 통합 사건 사이를 구별하지 않는다는 것이다.
파티반, 케이(Parthiban, K) 등은 세포 당 1개의 항체 유전자를 포함하는 세포에 대해 풍부화된 세포의 거대한 레퍼토리를 생성하기 위한 포유동물 세포 내로의 전장 IgG-형식화된 항체 유전자의 뉴클레아제-지정 통합에 기반한 카세트-교환 방법을 개시한다 [13]. 통합이 목적하는 게놈 위치에서 일어난 세포의 선택은 선택된 게놈 위치에 자연적으로 존재하는 내인성 프로모터에 의한 블라스티시딘 저항성 유전자의 활성화에 기반한다. 이 해결책의 결점은 (i) 무작위 통합 사건에 의한 발현 벡터의 추가적 카피를 통합한 세포를 검출하거나 제거하는 메커니즘이 없고, (ii) GOI의 발현에 부정적 영향을 가질 수 있는 선택 마커 카세트를 제거하는 메커니즘이 없다는 것을 포함한다.
특히 핵산 서열 라이브러리의 통합에 기반한 적용을 위해, 또한 보다 높은 통합 효율을 달성할 수 있는 방법을 개발할 중요한 필요가 있는데, 이는 이것이 효율적으로 평가될 수 있는 라이브러리의 상부 다양성을 좌우하기 때문이다.
따라서, 재조합 단백질의 생산을 위한 개선된 발현 시스템을 확인하기 위한 필요가 관련 기술분야에 여전히 있다. 특히, 치료 단백질 후보의 발현 카세트를 최적화하는 개선된 수단을 가능하게 하기 위해, 공여자 벡터를 효율적으로 통합하고, 숙주 세포 게놈의 정확한 위치 내로 삽입물을 통합한 세포의 신속하고 정확한 선택을 가능하게 하며, 동시에 무작위 게놈 위치에서 추가적 카피를 통합한 세포의 제거를 가능하게 할 수 있는 신규한 방법에 대한 긴급한 필요가 있다.
핵산 서열 최적화
모든 단백질은 그의 아미노산 서열에 의해 궁극적으로 좌우되는 상부 발현 잠재성을 가지며, 상이한 서열은 발현 잠재성의 큰 차이를 발생시킬 수 있다. 따라서, 그의 표적 상호작용 표면의 외부의 치료 단백질 후보의 아미노산 서열의 사소한 변화는 발현 수준을 개선시키는데 중요할 수 있다. 아미노산 변화가 임상적 합병증의 위험 경감으로 인해 도입될 수 없는 경우, 상이한 강도를 갖는 프로모터는 세포 기구의 압도를 회피하는데 필요할 수 있다. 또한, 지난 10-20년 동안 수행된 많은 연구 (소수에 대해서는 [14-19] 참조)는 주어진 단백질 (고정된 아미노산 서열)에 대한 발현 수준이 벡터에서의 상이한 서열 구성요소 (5'-UTR 서열, 신호 펩티드 서열, 동의어적 코딩 뉴클레오티드 서열 및 3'-UTR 서열)의 사용에 기반하여 크게 다양할 수 있고, 잘 수행하는 조합은 적어도 부분적으로 단백질 의존적임을 제시하였다.
전통적으로, 서열 구성요소는 자연으로부터 클로닝되었다. 그러나, 자연적 서열 요소가 생물반응 조건 동안 단일 정의된 단백질의 최대 발현을 위해 최적이 아니라고 믿을 합당한 이유가 있다. 결국, 이들은 이것이 암시하는 모든 제약을 갖는 전체 유기체의 맥락에서 진화되었다. 탐구되는 치료 단백질 형식의 증가하는 다양성 및 합성 생물학의 급속한 성숙 (자연에 존재하지 않고 bp 정확성을 갖는 새로운 서열 변이체의 구축 및 평가를 가능하게 함)으로, 단백질 발현을 위한 서열-기반 디자인 공간은 위압적이다.
이로 인해, 관심의 단백질을 코딩하거나 그에 영향을 미치는 핵산 서열의 최적화된 서열 변이체를 확인하는 신규한 조치가 또한 계속적으로 추구되며, 이러한 조치는 재조합 세포 시스템에서의 관심의 단백질의 전체적 발현 잠재성에 있어서 상당한 역할을 한다.
따라서, 생산을 위한 최종 서열 조합을 선택하기 전에 벡터 구성요소 및 관심의 단백질을 코딩하는 핵산 서열 둘 다의 최종 생산 시스템에서의 서열 변이체의 보다 폭넓은 다양성의 평가를 가능하게 함으로써 상업적 단백질 생산 또는 재조합 단백질의 기능을 개선시키기 위한 큰 미개발된 잠재성이 여전히 존재한다.
상기 언급된 문제는 본원에서 추가로 제시된 방법 및 수단의 제공에 의해 이제 해결되었거나 적어도 완화되었다.
본 개시내용은 단리된 진핵생물 숙주 세포의 사전-정의된 게놈 위치 내로의 공여자 벡터의 단일 카피의 부위 지정 통합 (SDI)을 이용하는 재조합 단백질 생산을 위한 신규한 해결책을 제공한다. 본 개시내용의 SDI-기반 시스템은 숙주 세포의 전용 표적 부위 내로의 공여자 벡터의 효율적인 통합을 위한 널리 확립된 핵산 구성요소의 고유하고 발명적인 조합에 기반한다. 방법은 전용 사전-정의된 게놈 위치 내로 공여자 벡터를 통합한 숙주 세포의 특이적 양성 선택을 제공한다. 방법은 또한, 음성 선택에 의해, 숙주 세포 게놈의 다른 위치에서 비목적하는 통합 사건이 일어난 임의의 세포를 검출하고 임의적으로 제거하는 것을 제공한다. 이 2-단계 선택 방법은 고유하며, 재조합 단백질 생산의 분야에서 매우 유용하고, 특히 재조합 단백질 생산 또는 기능에 대한 영향을 갖는 핵산 서열 변이체의 효율적인 비-편향된 평가를 가능하게 하기 위해 그러할 것이다.
본원에서 이전에 언급된 바와 같이, 개선된 세포주 개발, 유연한 세포주 조작 및 진보된 적용, 예컨대 유전자 구축물 라이브러리의 동시 탐색을 가능하게 하는 것을 위한 중요한 구성요소는 숙주 세포주 내로의 재조합 유전자 통합의 증가된 제어 및 그들의 카피 수에 비해 더 양호한 제어이다. 이는 이제 본 개시내용에 의해 제공된다. 처음에, 추정 핫 스폿 위치가 확인되었기 때문에 중국 햄스터 난소 (CHO) 세포를 사용하여 본원에서 제시된 방법을 설정하였지만, SDI 시스템은 포유동물 세포, 예컨대 인간 세포를 포함하는 임의의 진핵생물 세포 시스템에 적용가능할 것이다.
보다 구체적으로, 본 개시내용은 단리된 진핵생물 숙주 세포의 사전-정의된 게놈 위치 내로의 공여자 벡터의 단일 카피를 통합할 수 있는 상기 부위 지정 통합 (SDI) 시스템을 이용하는 재조합 단백질 생산에 사용하기 위한 핵산 서열의 최적화를 위한 신규한 해결책을 제공한다. 서열 최적화 방법은 공여자 벡터 구성요소, 예컨대 프로모터, IRES 또는 인핸서 서열의 핵산 서열 변이체의, 또는 관심의 단백질을 코딩하는 핵산 서열의 라이브러리의 생성, 이어서 그로부터 최적화된 핵산 서열 변이체를 확인하기 위한 복수의 숙주 세포 내로의 상기 핵산 변이체의 표적화된 통합을 포함한다.
따라서, 제1 측면에서, 본 발명은 복수의 핵산 서열 변이체로부터의 서열 최적화된 핵산 서열의 선택을 위한 방법으로서, 여기서 상기 서열 최적화된 핵산 서열은 정의된 표현형을 갖는 진핵생물 세포에 상응하며, 하기 단계를 포함하는 방법에 관한 것이다:
i) 진핵생물 세포의 집단을 제공하는 단계로서, 각각의 세포는 사전-정의된 게놈 위치를 포함하며, 여기서 사전-정의된 게놈 위치는 하기를 포함하는 것인 단계:
a. 제1 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 I1;
b. 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E1; 및
c. 프로모터 핵산 서열;
ii) 복수의 공여자 벡터를 제공하는 단계로서, 각각의 공여자 벡터는 하기를 포함하는 것인 단계:
a. 핵산 서열 I2;
b. 상기 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E2;
c. 제1 선택 마커를 코딩하는 핵산 서열; 및
d. 핵산 서열 변이체를 포함하는 핵산 서열 영역,
iii) 복수의 공여자 벡터를 제1 DNA 효소의 존재 하에서 세포의 집단과 접촉시키는 단계로서, 여기서 제1 DNA 효소의 존재는 공여자 벡터의 핵산 서열 I2 및 세포의 사전-정의된 게놈 위치에 존재하는 핵산 서열 I1 사이의 재조합을 가능하게 하는 것인 단계;
iv) 세포에서 제1 선택 마커의 발현을 검출함으로써 사전-정의된 게놈 위치에서 통합된 공여자 벡터를 갖는 세포를 선택하고 단리하는 단계로서, 여기서 제1 선택 마커의 발현은 사전-정의된 게놈 위치에서의 프로모터 핵산 서열에 의해 활성화되는 것인 단계; 및
v) 단계 iv)의 세포로부터 정의된 표현형을 갖는 세포를 선택하고 단리하며, 그에 의해 상기 핵산 서열 변이체로부터 서열 최적화된 핵산 서열을 선택하고 단리하는 단계로서, 상기 서열 최적화된 핵산 서열은 상기 정의된 표현형에 상응하는 것인 단계.
또 다른 측면에서, 본원에 개시된 바와 같은 방법에 의해 선택된 서열 최적화된 핵산 서열이 본원에서 제공된다.
또한 또 다른 측면에서, 재조합 단백질을 생산하기 위한 서열 최적화된 핵산 서열의 용도가 제공된다.
또한 또 다른 측면에서, 본원에 개시된 바와 같은 방법에 의해 수득가능한 서열 최적화된 핵산 서열에 상응하는 정의된 표현형을 갖는 단리된 진핵생물 세포가 제공된다.
도 1은 직교 특이성을 갖는 적어도 2개의 DNA 효소의 사용을 통한 복수의 진핵생물 숙주 세포의 사전-정의된 게놈 위치 내로의 복수의 공여자 벡터의 표적화된 통합을 위한 방법의 일반적 개념의 개략적 예시를 제시한다. 복수의 세포의 사전-정의된 위치 내로의 복수의 공여자 벡터의 표적화된 통합에 이어서 정의된 표현형의 단리/풍부화 및 그의 후속 사용이 이어진다. SOI = 관심의 서열.
도 2는 직교 특이성을 갖는 적어도 2개의 DNA 효소의 사용을 통한 숙주 세포의 사전-정의된 게놈 위치 내로의 공여자 벡터의 표적화된 통합을 위한 방법의 일반적 개념의 개략적 예시를 제시한다.
도 3은 랜딩 패드(Landing Pad) 디자인 (숙주 세포 게놈의 사전-정의된 게놈 위치에 존재하는 핵산 서열) 및 하이클론(HyClone) LP1P1 및 하이클론 LP2P2 세포주에 대한 매칭 공여자 벡터의 개략적 예시를 제시한다.
도 4는 비-형질감염된 대조군 (NC)과 비교하여 형질감염 후 제7일에서의 유동 세포계측법 플롯의 예를 예시한다. 농축된 주요 집단을 갖는 플롯에서의 세포의 밀도는 교대하는 흑색 및 백색 영역에 의해 시각화된다 (각각의 영역에서 총 세포의 20%). 상부 열은 하이클론 CHO 세포의 비-형질감염 대조군 (NC) 배양에 대한 FACS 데이터를 제시한다. 중간 열은 공여자 벡터 B 단독 (PhiC31 없음)으로 형질감염된 하이클론 CHO 세포 (LP를 결여함)에 기반한 무작위 통합 대조군 (RI)으로부터의 FACS 데이터를 제시한다. 하부 열은 PhiC31 및 공여자 벡터 B (SDI)로 형질감염된 하이클론 CHO LP2P2 세포주에 대한 FACS 데이터를 제시한다. 각각의 열의 중간 플롯에서의 게이트 (B, D, F)는 비-형질감염된 대조군에 기반하여 설정되며, 배경 초과의 선택 마커를 활성화시킨 세포의 백분율을 보고한다.
도 5는 사용된 랜딩 패드 세포주 및 공여자 벡터 뿐만 아니라 PhiC31 (1) 및 Cre (2)의 활성을 통해 일어날 것으로 예상되는 랜딩 패드에서의 변경의 개략적 예시를 제시한다.
도 6은 음성 모의 형질감염 대조군과 비교하여 Cre 리콤비나제 변이체의 형질감염 후 제7일에서의 SDI 집단의 유동 세포계측법 플롯을 제시한다. 농축된 주요 집단을 갖는 플롯에서의 세포의 밀도는 교대하는 흑색 및 백색 영역에 의해 시각화된다 (각각의 영역에서 총 세포의 20%). 상부 패널은 Cre 리콤비나제 코딩 핵산 분자를 결여한 모의 형질감염에 대한 플롯을 제시하고, 중간 패널은 Cre 리콤비나제 발현 플라스미드로 형질감염된 집단의 플롯을 제시하고, 하부 패널은 합성 Cre 리콤비나제 mRNA로 형질감염된 집단의 플롯을 제시한다.
도 7은 사용된 랜딩 패드 세포주 및 공여자 벡터 뿐만 아니라 PhiC31 리콤비나제 (1) 및 Cre 리콤비나제 (2)의 활성을 통해 일어날 것으로 예상되는 랜딩 패드에서의 변경의 개략적 예시를 제시한다.
도 8은 도 7에 따라 수행된 단계로부터의 유동 세포계측법 플롯을 제시한다. 농축된 주요 집단을 갖는 플롯에서의 세포의 밀도는 교대하는 흑색 및 백색 영역에 의해 시각화된다 (각각의 영역에서 총 세포의 20%). 상부 패널에서의 좌측 플롯은 제2 eGFP (녹색 형광 단백질) 양성 분류 후의 집단을 제시한다. 상부 패널에서의 중간 플롯은 Cre 리콤비나제 형질감염 후 7일에서의 집단을 제시한다. 상부 패널에서의 우측 플롯은 Cre 리콤비나제 형질감염 후 게이트 E에 따라 수행된 eGFP 음성 분류 후의 집단을 제시한다. 하부 패널은 DNA 공여자 벡터 B로의 단계 2 분류 세포의 형질감염 후 7일에서의 집단의 플롯을 제시한다.
도 9는 사용된 랜딩 패드 세포주 및 공여자 벡터의 개략적 예시를 제시한다. GSx = 글루타민 신테타제 유전자 변이체.
도 10은 공여자 벡터의 SDI를 사용한 세포 집단의 생성으로부터의 유동 세포계측법 플롯을 제시한다. 농축된 주요 집단을 갖는 플롯에서의 세포의 밀도는 교대하는 흑색 및 백색 영역에 의해 시각화된다 (각각의 영역에서 총 세포의 20%). 상부 패널은 G418 선택, RFP (적색 형광 단백질) 양성 FACS 분류 및 합성 Cre 리콤비나제 mRNA로의 형질감염을 겪은 집단의 플롯을 제시한다. eGFP 히스토그램은 RFP 음성 하위-집단 (TagRFP-T의 Cre 리콤비나제 매개 삭제를 갖는 랜딩 패드에서의 통합에 상응함) 및 RFP 양성 하위-집단 (랜딩 패드에서의 오프-타겟 통합 또는 말단절단된 통합에 의해 유발될 수 있는 TagRFP-T의 실패한 Cre 리콤비나제 매개 삭제에 상응함) 둘 다에 대해 제시된다. 하부 패널은 상부 패널로부터의 RFP 음성/GFP 양성 세포의 FACS 분류를 사용하여 생성된 최종 SDI 풀의 플롯을 제시한다.
도 11은 IRES 요소를 통한 상기 제2 DNA 효소를 코딩하는 유전자에 연결된 상기 공여자 벡터의 제1 선택 마커를 제시한다. 제1 선택 마커 및 제2 DNA 효소 둘 다는 사전-정의된 게놈 위치에서의 통합 시 활성화된다.
도 12는 사전-정의된 게놈 영역이 또한 상기 제1 DNA 효소에 대한 발현 카세트를 포함하는 경우, 사전-정의된 게놈 위치에서의 공여자 벡터의 통합 시 그것이 상기 제2 DNA 효소에 대한 인식 부위에 의해 플랭킹되게 되고, 따라서 상기 제2 DNA 효소의 존재 하에서 제거될 수 있도록 위치됨을 제시한다.
도 13은 유전자 편집 효소가 숙주 세포 게놈의 사전-정의된 게놈 위치 내로의 공여자 벡터의 통합을 촉매하는데 사용되는 표적화된 통합을 위한 변이체를 예시한다.
도 14는 리콤비나제 매개 카세트 교환 (RMCE)이 숙주 세포 게놈의 사전-정의된 게놈 위치에서의 통합을 촉매하는데 사용되는 표적화된 통합을 위한 변이체를 제시한다.
도 15는 단일 리콤비나제 인식 부위 쌍이 숙주 세포의 사전-정의된 게놈 위치에서의 공여자 벡터의 통합을 촉매하는데 사용되는 표적화된 통합을 위한 변이체를 제시한다.
도 16은 사전-정의된 게놈 위치에서의 통합을 촉매하는 단일 리콤비나제 인식 부위 쌍의 사용 및 사전-정의된 게놈 위치에 존재하는 프로모터 P1이 스플릿 인트론의 5'-부분에 기능적으로 융합됨을 제시한다.
도 17a-c는 a) 9개의 상이한 구축물의 일시적 발현. 플롯은 eGFP 및 mTagBFP2의 양호한 일시적 발현을 위한 게이트에서의 % 세포를 제시함; b) B1, B3 및 C1이 배제된 구축물의 로그-상에서의 배양물의 eGFP 발현에 대한 평균 형광 강도 (MFI); 및 c) B1, B3 및 C1이 배제된 구축물의 배치 배양 후의 CEDEX로의 Fc-융합 단백질의 역가 측정을 제시한다.
도 18은 Fc-eGFP의 평균 단일 세포 형광 및 벌크 역가 측정 사이의 상관관계 플롯을 제시한다.
도 19는 사용된 랜딩 패드 세포주 및 공여자 벡터의 개략적 예시이다. FC-eGFPx = FC-eGFP 유전자 카세트 변이체.
도 20은 4개의 상이한 DNA 공여자 벡터를 사용하여 생성된 세포 집단의 유동 세포계측법 데이터를 제시한다. 농축된 주요 집단을 갖는 플롯에서의 세포의 밀도는 교대하는 흑색 및 백색 영역에 의해 시각화된다 (각각의 영역에서 총 세포의 20%).
도 21은 사용된 랜딩 패드 세포주 및 공여자 벡터의 개략적 예시이다. FC-eGFPx = 상이한 3'-UTR을 갖는 신호 펩티드 운반 FC-eGFP 유전자 카세트 변이체. TagBFP2 카세트는 신호 펩티드를 운반하고, 모든 변이체에서 일정하게 유지된다.
도 22는 비아코어(Biacore) 8K+ 역가 측정으로부터 계산된 Qp 및 각각의 개별적 배치 배양의 로그 상으로부터의 세포 샘플을 사용하여 생성된 유동 세포계측법 데이터로부터의 평균 eGFP 신호의 비교이다. 패널 (a)는 벡터 변이체 524에 대해 정규화된 값을 갖는 각각의 벡터 변이체에 대한 직접적 비교를 제시한다. 패널 (b)는 Qp 및 eGFP 유동 세포계측법 데이터 사이의 상관관계 그래프를 제시한다.
도 23은 대조군 DNA 공여자 벡터 (pGE0506-pGE0508) 및 18개의 상이한 아미노산을 코딩하는 29개의 상이한 코돈 및 글루타민 신테타제 유전자의 aa 299의 위치에서의 정지 코돈을 운반하는 DNA 공여자 벡터의 작은 라이브러리의 디자인을 제시한다.
GSx = 글루타민 신테타제 유전자 변이체.
PGK = 프로모터.
도 24는 MSX의 부재 하에서의 (0 MM MSX) 또는 10 μM MSX를 사용한 (10 MM MSX) 글루타민 무함유 배지에서의 단일 카피 통합 세포 풀 (PhiC31 및 공여자 벡터 506-509의 형질감염, 이어서 2개의 선택 단계를 사용하여 생성됨)의 성장을 제시한다.
도 25는 SDI GS 변이체 (벡터 506, 507 및 509를 사용하여 생성됨)의 10 μM MSX 사전-선택된 풀로부터 클로닝된 단일 세포의 과-성장의 그래프를 제시한다. 개별적 클론은 세포 전면생장률이 단일-세포 클로닝 후 제14일에 (96-웰 배양 플레이트에서의 웰의) 30% 이상에 도달하는 경우에 성장하는 것으로서 카테고리화된다.
도 26은 단일 유전자에 의해 코딩되는 관심의 단백질에의 형광 단백질의 융합에 의한 단일 세포 신호 생성을 제시한다. FP1 = 형광 단백질 1, FP2 = 형광 단백질 2.
도 27은 1개 초과의 유전자에 의해 코딩된 관심의 단백질에의 형광 단백질(들)의 융합에 의한 단일 세포 신호 생성을 제시한다. AAV = 아데노-연관된-바이러스, VP = 바이러스 단백질.
도 28은 표면 제시된 관심의 단백질 및 형광 표지된 표적 실체의 상호작용에 의한 단일 세포 신호 생성을 제시한다. F1 = 형광 모이어티 1, F2 = 형광 모이어티 2.
본 개시내용은 이제 첨부된 도면 및 일부 비-제한적 실시예와 함께 보다 자세하게 기재될 것이다.
정의
본 개시내용의 상세사항은 하기에 제시된다. 본원에 기재된 것들과 유사하거나 등가의 임의의 물질 및 방법이 본 발명의 실시 또는 시험에 사용될 수 있지만, 바람직한 물질 및 방법이 이제 기재된다. 본원에 사용된 모든 단어 및 용어는 또 다른 의미가 맥락으로부터 명백하지 않는 한, 관련 기술분야의 통상의 기술자에 의해 그들에게 통상적으로 주어지는 동일한 의미를 갖는 것으로 간주될 것이다.
하나 이상의 나열된 요소를 "포함하는" 조성물은 또한 구체적으로 나열되지 않은 다른 요소를 포함할 수 있다.
단수형은 또한 복수형을 포함하는 것으로 해석될 것이다.
"발현"은 유전자로부터의 단백질의 생산을 의미하기 위해 사용되며, 본원에서 "중심 원리"의 단계, 즉, 단백질의 활성 상태에 도달하기 위한 전사, 번역 및 단백질 폴딩의 연속적인 작용을 지칭하고 포함한다.
본원에 정의된 "발현 벡터"는 숙주 세포에 존재하는 경우에 벡터로부터 단백질 발현을 달성하기 위한 핵산 서열을 포함하는 벡터이다. 본원에서 발현 벡터는 예를 들어 관심의 특이적 유전자를 세포 내로 도입하고, 그 후 단백질 합성을 위한 세포 기구를 지정하여 관심의 유전자에 의해 코딩되는 관심의 단백질을 생산하는데 사용된다. 발현 벡터는 "발현 카세트"를 함유할 수 있으며, 상기 발현 카세트는 단백질 발현을 용이하게 하는 핵산 서열을 함유한다. 또한, 벡터는 다른 핵산 서열 요소 또는 구성요소를 함유할 수 있다.
본원에서 지칭된 "공여자 벡터"는 단리된 진핵생물 숙주 세포의 사전-정의된 게놈 위치 내로의 벡터의 통합을 용이하게 하기 위한 핵산 요소 또는 구성요소를 포함하는 벡터, 바람직하게는 DNA 벡터이다. 공여자 벡터는 숙주 세포의 사전-정의된 게놈 위치에 존재하는 핵산 서열과의 재조합 사건을 용이하게 하는 핵산 서열, 임의적으로 관심의 단백질을 코딩하는 관심의 핵산 서열, 제2 DNA 효소에 대한 인식 부위 및 제1 선택 마커를 코딩하는 핵산 서열을 운반한다. 임의적으로, 이는 또한 제2 선택 마커에 대한 발현 카세트를 함유할 수 있다. "공여자 벡터"는 때때로 본원에서 또한 간단히 "벡터"로 지칭될 수 있다. "공여자 벡터"는 예컨대 공여자 벡터가 제2 선택 마커를 코딩하는 발현 카세트를 포함하는 경우에 때때로 발현 벡터의 형태일 수 있다. 보다 구체적으로, 본원에 기재된 공여자 벡터는 진핵생물 세포의 사전-정의된 게놈 위치에 존재하는 I1과의 재조합을 위한 적어도 핵산 서열 I2를 함유한다. 또한, 이는 상기 관심의 핵산이 관심의 단백질을 코딩하는 경우에 본원에서 또한 관심의 유전자 ("GOI")로 지칭되는 관심의 핵산 서열을 포함한다. 이는 또한 공여자 벡터의 안정한 통합이 숙주 세포의 사전-정의된 게놈 위치에서 일어났으면 벡터 백본의 일부를 삭제하는 것을 가능하게 하는 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E2를 포함한다. 이는 또한 제1 선택 마커 (SM1)를 코딩하는 핵산 서열을 함유하며, 발현은 단지 공여자 벡터가 숙주 세포의 사전-정의된 게놈 위치에서의 정확한 위치 내로 통합된 경우에 활성화될 것이다. 마지막으로, 공여자 벡터는 임의적으로 제2 선택 마커 (SM2)를 코딩하는 발현 카세트를 포함한다. 제2 DNA 효소의 작용 후, 제2 선택 마커는 단지 벡터의 무작위 통합 사건이 일어난 경우에 세포에서 발현되고 검출하는 것이 가능할 것이며, 본 방법의 선택의 제2 라운드에 사용된다. 공여자 벡터는 바람직하게는 DNA 공여자 벡터이지만, 이에 제한되지는 않는다. DNA 공여자 벡터는 때때로 "DDV"로 약칭된다.
"발현 카세트"는 관심의 단백질의 전사 및 번역의 개시에 필요한 모든 요소를 함유하는 발현 벡터의 부분을 형성하는 핵산 구성요소이다. 관심의 단백질을 코딩하는 관심의 유전자는 또한 발현 카세트의 부분을 형성한다. 발현 카세트는 예를 들어 전사의 개시에 필수적인 프로모터, 및 전사를 용이하게 하는 다른 서열, 예컨대 인핸서 서열을 함유한다. 때때로 제2 DNA 효소의 작용 후에 사전-정의된 게놈 위치에 잔류하는 공여자 벡터로부터의 핵산 서열에 상응하는 용어 "통합 카세트"가 본원에서 사용된다. "통합 카세트"는 "발현 카세트"를 포함할 수 있다.
본원에서 "관심의 유전자"는 관심의 단백질을 생산하는데 필요한 핵산 구성요소를 지칭하며, 관심의 단백질이 다수의 폴리펩티드 쇄를 포함할 수 있기 때문에 또한 동일한 발현 카세트에 존재하는 "다수의 관심의 유전자"를 지칭할 수 있다. 다수의 관심의 유전자를 함유하는 발현 카세트는 개별적 프로모터를 이용하여 개별적 유전자의 전사를 달성할 수 있거나, 2개 이상의 유전자는 즉, IRES 요소에 의해 분리된 개별적 유전자를 갖는 통상적인 mRNA로서 전사될 수 있다. 이는 본원에서 단수형이 사용될 때마다, 이는 또한 복수형을 지칭할 수 있다는 것과 일치한다. 발현 카세트가 1개 초과의 관심의 유전자를 포함하는 경우의 예는 항체가 관심의 유전자로부터 발현되는 경우이고, 예를 들어 여기서 경쇄 및 중쇄 항체 구성요소는 발현 카세트에서 별개의 유전자로서 존재한다.
"인트론"은 전사되면 및 최종 RNA 생성물의 생산 동안 RNA 스플라이싱에 의해 제거되는 유전자의 핵산 서열이다. 인트론은 RNA 전사체, 또는 이를 코딩하는 DNA의 비-코딩 영역이며, 이는 번역 전에 스플라이싱에 의해 제거된다.
본원에서, 스플릿 인트론의 5'-부분에 기능적으로 융합된 프로모터는 스플릿 인트론의 5'-부분의 전사가 상기 프로모터에 의해 유도됨을 의미한다. 본원에서, 스플릿 인트론의 5'-부분은 스플라이스 공여자 부위 서열 (예컨대 GT)을 포함하는 것으로 정의된다. 본원에서, 스플릿 인트론의 3'-부분은 (i) 스플라이스 분지 부위 서열, (ii) Py-풍부 서열 영역 및 (iii) 스플라이스 수용자 부위 서열 (예컨대 AG)을 포함하는 것으로 정의될 수 있다.
전사는 세포 기구에 의한 DNA의 RNA로의 전환을 포함한다. "전사 조절 서열"은 특이적 유전자의 최종 발현을 증가시키거나 감소시킬 수 있는 핵산 서열의 절편이며, 즉, 상기 서열에 의해 상기 유전자의 전사를 조절할 수 있다. 전사 조절 서열의 예는 프로모터, 인핸서 등이다.
비번역된 영역 ("UTR")은 mRNA의 가닥 상의 코딩 서열의 각각의 단부에서의 2개의 섹션 중 어느 하나를 지칭한다. 5' 단부는 5' UTR로 명명되고, 3' 측은 3' UTR로 명명된다.
본원에서 지칭된 상류 오픈 리딩 프레임 (uORF)은 mRNA 분자의 5' 비번역된 영역 (5'UTR) 내의 오픈 리딩 프레임 (ORF)이다. uORF는 일반적으로 진핵생물 유전자 발현의 조절에 관여한다. uORF의 번역은 전형적으로 1차 ORF (오픈 리딩 프레임)의 하류 발현을 억제하며, 따라서 존재하는 경우에 이들은 단백질 발현의 감소를 유발한다. 인간 유전자의 대략 절반은 이들 영역을 함유한다.
내부 리보솜 진입 부위 ("IRES")는 캡-독립적 방식으로 번역 개시를 허용하는 RNA 요소이다. IRES 요소는 종종 진핵생물 리보솜을 mRNA에 동원할 수 있는 RNA 분자의 별개의 영역으로 지칭된다. IRES 요소에 대한 위치는 종종 5' UTR 영역에 있지만, 이는 또한 mRNA에서의 어디에서나 발생할 수 있다.
"플라스미드"는 세포에 독립적으로 복제할 수 있고 박테리아에서 발견되는 작은 원형 염색체외 DNA 분자이다. 플라스미드는 종종 분자 클로닝을 위한, 즉, 선택된 DNA를 숙주 세포에 전달하고 도입하기 위한 벡터로서 사용된다. 플라스미드는 특이적 및 필수적 요소로부터 제조되며, 박테리아 숙주 세포에 대해 동종- 또는 이종일 수 있는 유전자를 함유할 수 있다. 플라스미드는 예를 들어 항상 박테리아 복제 원점 및 가장 종종 특이적 항생제 저항성에 대한 유전자를 함유한다.
본원에서 지칭된 "관심의 핵산 서열"은 세포 내로 통합시켜 상기 세포의 기능성에 영향을 미치는 것을 원하는 핵산 서열로 정의될 수 있다. 이는 관심의 단백질을 코딩하는 관심의 유전자 ("GOI")를 포함할 수 있다.
본원에서 언급된 "재조합" 단백질이란 발현 벡터에 의해 세포 내로 도입된 발현 카세트로부터 제조된 단백질을 의미한다. 재조합 단백질을 생산하는 기술은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다.
"프로모터"는 그에의 RNA 폴리머라제의 결합 시 유전자의 전사를 개시시키는 DNA의 영역이다. 프로모터는 유전자의 전사 시작 부위 부근에 위치한다.
본원에서 지칭된 "숙주 세포"는 본원에 개시된 바와 같은 공여자 벡터에 의해 형질전환되는 것으로 의도되거나 형질전환된 진핵생물 세포에 관한 것이다.
"단리된 세포", "단리된 숙주 세포" 또는 "단리된 진핵생물 숙주 세포"는 그의 자연 환경으로부터 단리된 세포를 지칭하며, 이는 그것이 자연에서 발생할 수 있는 임의의 추가적 구성요소가 없고, 그것이 더 이상 그의 자연 환경의 일부가 아닌 것을 의미한다.
본원에서 언급된 세포 "표현형"은 세포의 관찰가능한 (물리적) 특징 또는 소질을 지칭한다. 상기 용어는 세포 형태학, 물리적 형태 및/또는 구조를 포함한다. 이는 또한 그의 발달 프로세스, 그의 생화학적 및/또는 생리학적 특성, 그의 거동, 및/또는 거동의 임의의 생성물, 예컨대 단백질의 생산 또는 그의 측정가능한 양을 포함할 수 있다.
본원에서, 또한 때때로 "랜딩 패드" ("LP"로 약칭됨), 또는 오히려 랜딩 패드 서열을 포함하는 사전-정의된 게놈 위치로 지칭되는 "사전-정의된 게놈 위치"는 숙주 세포 게놈에서 특정 핵산 서열을 특징으로 하는 위치, 또는 핵산 위치를 지칭하는 것으로 의도된다. 사전-정의된 게놈 위치는 또한 본원에서 "안전한 항구 부위" 및/또는 "재조합 부위"로 지칭될 수 있다. 숙주 세포의 사전-정의된 게놈 위치에서, 제1 DNA 효소의 존재에 의해 용이하게 되는 핵산 서열 I1 및 I2 사이의 재조합 사건이 일어나, 제1 선택 마커의 발현을 개시시키고, 성공적인 통합 사건을 지시할 것이다. 기본적으로, 사전-정의된 게놈 위치는 제1 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열, 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 및 프로모터 핵산 서열을 포함한다.
본원에서, "표적화된 통합"이 지칭되는 경우, 이는 이러한 서열 사이의 재조합 사건을 용이하게 하며, 그에 의해 원래 서열로부터 하이브리드 서열을 생성하는 핵산 서열 요소 또는 구성요소의 또 다른 핵산 요소 또는 구성요소 내로의 통합 또는 도입을 의미하는 것으로 의도된다. 이러한 통합 사건은 재조합을 위한 기초를 형성하는 핵산 서열 요소 또는 구성요소 중 어느 1개 또는 여러 개에서 효소 인식 핵산 서열의 존재에 의해 촉발된다.
"효소에 대한 인식 부위"는 핵산 서열에서 뉴클레오티드의 특이적 조합을 지칭하며, 조합은 그에의 효소의 결합을 용이하게 하는 특정 효소에 의해 인식되며, 여기서 효소는 그 후 인식 부위에서의 작용, 예컨대 2개의 서열 사이의 재조합 사건을 개시시킬 것이다.
본원에서 지칭된 용어 "DNA 효소"는 DNA에 대해 작용하는, 예컨대 DNA의 조각을 커팅하거나 DNA를 커팅하고 또 다른 DNA 서열 내로 통합하는 효소로 정의된다. 상기 용어는 효소, 예컨대 Crispr/Cas9, 리콤비나제, 인테그라제, 뉴클레아제 등을 포함하지만, 본 개시내용은 이에 제한되지는 않는다.
본원에서 지칭된 "제1 DNA 효소"는 본원에 개시된 방법에서, 숙주 세포의 사전-정의된 게놈 위치에서의 공여자 벡터의 통합을 담당하는 효소로 기능적으로 정의될 수 있다. 제1 DNA 효소의 기능은 핵산 서열을 사전-정의된 게놈 영역 내로 도입하는 것이며, 제거하는 것이 아니다. 본원에 개시된 방법에 사용되는 경우, 제1 DNA 효소는 하나의 특이적 효소일 수 있거나, 이는 상이한 효소일 수 있다. 이는 예를 들어 공여자 벡터의 통합이 순차적이며, 그에 의해 다수회 반복되어, 숙주 세포의 사전-정의된 게놈 위치 내로의 관심의 핵산 서열/공여자 벡터의 다수의 카피/변이체를 도입하는 경우, 또는 관심의 핵산 서열의 가역적 통합이 수행되는 경우이다. 본 방법의 맥락에서 사용하기 위한 "제1 DNA 효소"의 예는 본원의 다른 곳에서 제공된다.
본원에서 지칭된 "제2 DNA 효소"는 본원에 개시된 방법에서, 공여자 벡터를 통합한 사전-정의된 게놈 위치로부터의 핵산 서열 영역의 삭제를 담당하는 효소로 기능적으로 정의될 수 있으며, 여기서 상기 핵산 서열 영역은 제2 DNA 효소에 의해 인식되는 특이적 서열에 의해 플랭킹된다. 제2 DNA 효소가 서열을 인식하는 경우, 이는 이들 서열 사이에서의 핵산 서열 구성요소를 커팅할 것이다. 본 방법의 맥락에서 사용하기 위한 "제2 DNA 효소"의 예는 본원의 다른 곳에서 제공된다.
"제1 DNA 효소의 존재 하에서" 및/또는 "제2 DNA 효소의 존재 하에서"는 제1 및/또는 제2 DNA 효소가 본원에 기재된 바와 같은 임의의 형태로, 예를 들어 공여자 벡터, 별개의 발현 벡터, 세포의 게놈에 존재하는 발현 카세트, 합성 mRNA 등으로부터 발현된 단백질로서 제공됨을 의미한다. "존재 하에서"는 제1 DNA 효소 및/또는 제2 DNA 효소의 기능이 본원에 개시된 임의의 적합한 방식으로 제공됨을 지칭하는 것으로 의도된다.
본원에서 지칭된 "선택 마커"는 특이적 사건이 일어났음, 예컨대 예를 들어 본 맥락에서, 공여자 벡터의 통합이 숙주 세포의 사전-정의된 게놈 위치에서 일어났음을 지시할 수 있는 마커 (제1 선택 마커)이다. 선택 마커는 종종 공여자 벡터가 숙주 세포 게놈의 정확한 부위에서 통합되었으면 숙주 세포에 의해 발현될 형광 단백질이다. 형광 단백질의 발현은 예를 들어 FACS (형광-활성화 세포 분류)에 의해 검출될 수 있다. 다른 가능한 선택 마커는 본원의 다른 곳에 언급되어 있다.
본원에서 또한 "SM1"로 약칭되는 "제1 선택 마커"는 공여자 벡터에 존재하는 경우에 침묵, 비-활성 또는 프로모터-없는 선택 마커로 정의될 수 있다. 제1 선택 마커는 사전-정의된 게놈 위치에 존재하는 프로모터와 혼화성인 비-코딩 스트레치를 함유한다. 공여자 벡터가 사전-정의된 게놈 위치에서의 정확한 위치 내로 통합되었으면, 제1 선택 마커는 발현될 수 있는데, 이는 이것이 이제 전사를 개시하는 프로모터를 갖기 때문이다. 선택 마커가 발현되면, 제1 선택 마커를 발현하는 세포 집단은 사전-정의된 게놈 위치에서 공여자 벡터의 안정한 통합에 대해 양성으로서 선택될 수 있다. 제1 선택 마커는 또한 본원에서 "리포터"로 지칭될 수 있다. 적합한 제1 선택 마커의 예는 본원의 다른 곳에서 제공된다.
본원에 개시된 공여자 벡터의 임의적 특색인 본원에서 또한 "SM2"로 약칭되는 "제2 선택 마커"는 공여자 벡터에 존재하는 경우에 비-침묵, 활성 및/또는 기능적 선택 마커로 정의될 수 있다. 선택 마커는 발현 카세트의 일부로서 코딩되며, 즉, 선택 마커는 세포 내로의 진입 시 일시적으로 발현되고 나중에 게놈에서 그것이 도입되는 경우와 독립적으로 안정한 발현을 촉진시킬 것이다. 제2 선택 마커는 본원에서 제시된 방법의 대부분의 측면에서 음성 선택 마커이며, 이는 이 마커를 발현하는 세포가 바람직하게는 재조합 단백질 생산에 사용되지 않음을 의미하는데, 이는 이들 세포가 (또한) 사전-정의된 게놈 위치에서보다 다른 곳에서 공여자 벡터를 통합하였기 때문이다.
상세한 설명
단리된 진핵생물 세포의 사전-정의된 게놈 위치 내로의 공여자 벡터의 표적화된 및 검출가능한 통합을 위한 특이적 부위-지정 통합 (SDI) 시스템을 이용하는 방법이 본원에서 제공된다. 또한, 방법은 사전-정의된 위치 내로와는 다른 숙주 세포의 진핵생물 숙주 세포 게놈의 부분 내로의 공여자 벡터의 무작위 통합 사건의 확인을 허용한다.
이는 조합으로 바람직하게는 숙주 세포 게놈의 다른 위치에서의 공여자 벡터의 추가적 무작위 통합의 부재 하에서, 숙주 세포 게놈의 표적 부위 (사전-정의된 게놈 위치)에서 공여자 벡터를 양성으로 통합한 세포의 집단의 임의적 "이중" 선택을 제공하며, 그에 의해 재조합 단백질 발현 또는 재조합 단백질 기능에 영향을 미치는 핵산 변이체의 후속 평가를 위한 최적화된 시스템을 제공한다 (도 2 참조). 방법은 이러한 측면에서 단지 사전-정의된 게놈 위치에서 공여자 벡터로부터의 삽입물 카세트의 단일 카피를 통합한 세포에 대해 유의하게 풍부화하는 세포의 집단의 양성 (사전-정의된 게놈 위치에서의 통합) 및 후속 음성 (무작위 통합 사건의 부재) 선택에 기반한 조합된 선택 전략을 사용한다. 이 특색은 핵산 변이체를 포함하는 공여자 벡터의 라이브러리가 숙주 세포의 집단 내로 통합되는 적용에 중요한데, 이는 그것이 세포 표현형 및 특이적 핵산 서열 변이체 사이의 "일대일" 상관관계를 보장하고, 다양한 게놈 위치에서의 통합으로부터 기원한 생물학적 노이즈를 제거하기 때문이다.
전체적 해결책은 이의 높은 전사 및 장기 안정성을 지지하는 그들의 능력에 대해 선택된 숙주 세포의 사전-정의된 게놈 위치에서의 소위 "랜딩 패드" (LP) 서열의 통합에 기반한다. 랜딩 패드는 사전-정의된 부위 내로의 제어된 통합 및 단지 목적하는 통합이 일어난 세포의 간단한 선택을 가능하게 하는 매칭 공여자 벡터와 함께 디자인된다. 본원에서, 사전-정의된 게놈 위치 및 랜딩 패드/랜딩 패드 서열은 상호교환가능하게 사용될 수 있다.
그러나, 보다 구체적으로, SDI 시스템은 본원에서 표적화된 통합에 의해 복수의 공여자 벡터로부터의 복수의 숙주 세포 내로 핵산 서열의 핵산 서열 변이체의 라이브러리를 도입하는데 사용된다 (도 1 참조). 시스템은 2개의 상이한 DNA 효소, 예를 들어 하기를 가능하게 하는 특이적 리콤비나제와 함께 DNA 효소 인식 서열의 2개의 부류의 조합을 사용한다:
(i) 복수의 진핵생물 숙주 세포의 사전-정의된 게놈 위치에서의 핵산 서열의 변이체를 포함하는 복수의 공여자 벡터의 통합,
(ii) 적어도 1개, 또는 가능하게는 2개의 직교 선택 단계를 사용한 사전-정의된 게놈 위치에서 공여자 벡터의 단일 카피를 통합한 복수의 세포의 선택 및
(iii) 임의적으로 사전-정의된 게놈 위치에서의 공여자 벡터로부터의 비바람직한 서열의 제거, 및
(iv) 사전-정의된 게놈 위치에서 핵산 서열 변이체를 통합한 진핵생물 세포의 정의된 표현형에 기반한 제2 선택 단계.
전체 핵산 서열 변이체 최적화 방법의 일부를 형성하는 SDI 방법은 모두 동일한 일반적 핵심적 특색을 포함하는 상이한 방식으로 수행될 수 있다.
이 SDI 방법의 일반적 실행은 도 2에 개요된다. 방법은 여기서 단일 공여자 벡터 및 단일 단리된 진핵생물 숙주 세포의 사용에 기반하여 예시되지만, 단리된 진핵생물 숙주 세포의 집단 내로의 표적화된 통합을 위한 다수의 공여자 벡터 (집합적으로 다수의 핵산 서열 변이체를 운반함)의 사용에 대한 적용 (다수의 핵산 서열 변이체가 상이한 세포에서 통합되게 되도록)에 대해서도 동일한 원리가 적용된다.
상기 단리된 진핵생물 세포의 사전-정의된 게놈 위치는 하기를 포함한다:
(i) 제1 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 I1,
(ii) 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E1 및
(iii) 시작 전사 부위를 포함하는 프로모터 핵산 서열 P1.
I1, E2 및 P1은 2가지 대칭적 5'-3' 서열 배향 O1 = [I1, 3'-5' 방향성을 갖는 P1, E1] 또는 O2 = [E1, 5'-3' 방향성을 갖는 P1, I1] 중 어느 하나로 구성된다. 공여자 벡터는 하기를 포함한다:
(i) 상기 제1 DNA 효소의 존재 하에서 I1과의 재조합을 촉진시키는 핵산 서열 I2,
(ii) 프로모터를 결여한 제1 선택 마커 유전자 (SM1),
(iii) 상기 제2 DNA 효소에 대한 인식 부위 E2,
(iv) 통합 카세트 IC 및 임의적으로 (v) 제2 선택 마커 유전자 (SM2)에 대한 활성 발현 카세트.
SM1, SM2 (존재하는 경우), E2 및 IC는 2가지 대칭적 시계방향 배향 O3 = [I2, IC, E2, SM2, 반시계방향 방향성을 갖는 SM1] 또는 O4 = [I2, 시계방향 방향성을 갖는 SM1, SM2, E2, IC] 중 어느 하나로 구성된다. 사전-정의된 게놈 위치 및 공여자 벡터에 존재하는 핵산 서열 요소는 항상 2가지 매칭 배향 (a) O1/O3 또는 (b) O2/O4 중 어느 하나로 구성된다.
상기 단리된 진핵생물 세포의 사전-정의된 게놈 위치 내로의 전체 공여자 벡터 또는 공여자 벡터의 일부의 통합은 공여자 벡터를 제1 DNA 효소의 존재 하에서 세포 내로 도입함으로써 달성되며, 여기서 제1 DNA 효소의 존재는 공여자 벡터의 핵산 서열 I2 및 세포의 사전-정의된 게놈 위치에 존재하는 핵산 서열 I1 사이의 재조합을 가능하게 한다.
사전-정의된 게놈 위치에서의 통합은 P1이 SM1 유전자의 전사 및 따라서 SM1 유전자 생성물의 발현을 달성할 수 있도록 SM1 유전자를 위치시킨다. 따라서, 사전-정의된 게놈 위치에서 전체 공여자 벡터 또는 공여자 벡터의 일부를 통합한 세포는 양성 선택을 위한 기준으로서 SM1의 발현을 사용함으로써 선택되고 단리될 수 있다.
임의적으로, 단리된 세포의 의도된 기능성에 잠재적으로 부정적으로 영향을 미칠 수 있는 비바람직한 서열은 I1, I2, E1 및 E2로부터 단지 통합 카세트 (IC) 및 잔류 서열을 남기는 보완 단계에서 사전-정의된 게놈 위치로부터 특이적으로 제거될 수 있다.
사전-정의된 게놈 위치에서의 전체 공여자 벡터 또는 공여자 벡터의 일부의 통합 시, 플라스미드 백본 서열 (즉, 박테리아에서 플라스미드 증식을 위한 서열) 뿐만 아니라 SM1 및 SM2 (존재하는 경우)에 대한 발현 카세트는 2개의 핵산 서열 E1 및 E2에 의해 플랭킹되게 된다 (도 2 참조). 상기 제2 DNA 효소의 존재 하에서 E1 및 E2에 의해 플랭킹된 이 서열 영역은 E1 및 E2 상에서 작용하는 제2 DNA 효소를 통해 사전-정의된 게놈 위치로부터 삭제된다. E1 및 E2에 의해 플랭킹된 영역을 삭제한 세포는 SM1 발현의 부재 (SM2가 원래 공여자 벡터에 존재하지 않는 경우) 및/또는 SM2 발현의 부재 (SM2가 원래 공여자 벡터에 존재하는 경우)에 기반하여 음성 선택 단계에서 선택되고 단리될 수 있다. 비목적하는 서열의 제거를 달성하는 것 외에도, 이 보완 선택 단계는 항상 사전-정의된 게놈 위치에서 전체 공여자 벡터 또는 공여자 벡터의 일부를 통합한 세포의 단리에 있어서의 특이성을 증가시키는데, 이는 사전-정의된 게놈 위치의 외부에서의 통합 후 (비-특이적 메커니즘을 통해) SM1의 활성화를 달성한 임의의 세포가 E1 및 E2에 의해 플랭킹된 SM1을 갖지 않을 것이고, 따라서 SM1 발현에 기반하여 음성 선택 단계에서 선택되지 않을 것이기 때문이다.
공여자 벡터에 존재하는 SM2로, 개선된 기능성을 갖는 선택 단계는 상기 제2 DNA 효소의 작용 후에 수행될 수 있다. SM2는 활성 발현 카세트로서 제공되기 때문에, 비목적하는 게놈 위치에서 통합된 공여자 벡터의 임의의 카피는 SM2의 발현을 발생시킬 것이다. 그러나, 중요하게는, 이러한 통합 사건은 E1 및 E2에 의해 플랭킹된 SM2 발현 카세트를 초래하지 않을 것인데, 이는 E1이 단지 사전-정의된 게놈 위치에 존재하기 때문이다. 따라서, E1 및 E2에 의해 플랭킹된 서열 영역의 삭제를 초래하는 상기 제2 DNA 효소의 작용 후, 사전-정의된 게놈 위치에서 및 단지 사전-정의된 게놈 위치에서 통합 카세트 (IC)의 단일 카피를 통합한 세포는 SM2 발현의 부재에 기반하여 음성 선택 단계에서 선택되고 단리될 수 있다.
통합 카세트 (IC)는 전형적으로 관심의 유전자 (GOI)에 대한 발현 카세트를 포함하지만, 본 방법의 적용은 이에 제한되지는 않는다.
일반적 SDI 방법의 구체적 실행 및 추가의 예는 단일 공여자 벡터 및 단일 단리된 진핵생물 세포를 사용하고, 사전-정의된 게놈 위치에 및 공여자 벡터에 존재하는 핵심적 서열 요소의 2가지 가능한 대칭적 배향 중 단지 하나를 제시하여 예시될 것이지만, 이에 제한되는 것으로 의도되지는 않는다.
디자인 개념의 한 구체적 실행은 랜딩 패드 (LP1P1) 및 DNA 공여자 벡터를 특색으로 하는 도 5에 개요된다. 실행에 기반하여 수행된 실험의 결과는 또한 실시예 2에서의 실험 섹션에 추가로 예시되고 논의된다. 이 실행은 단지 본 발명의 SDI 부분을 수행하는 한 방식의 예이지만, 이는 이에 제한되는 것으로 의도되지 않는다. 명확하게 하기 위해, 핵산 서열 변이체 최적화에 대한 적용을 위해 다수의 공여자 벡터는 단리된 진핵생물 숙주 세포의 집단 내로 특이적으로 통합될 것이다.
따라서, 도 5에 예시된 바와 같은 한 실행에서, 진핵생물 숙주 세포주는 사전-정의된 게놈 위치에 리콤비나제 PhiC31 리콤비나제에 대한 제1 리콤비나제 인식 서열 (attP1), 3' 내지 5' 배향으로의 프로모터 및 리콤비나제 Cre 리콤비나제에 대한 제2 리콤비나제 인식 서열 (loxP)을 함유한다.
PhiC31 리콤비나제는 스트렙토미세스(Streptomyces) 파지 φC31로부터 유래된 DNA 리콤비나제이다. 이 효소는 2개의 핵산 서열 attBattP 사이의 재조합을 매개할 수 있다. Cre 리콤비나제는 또한 이어서 선택 시스템 및 플라스미드 박테리아 백본을 삭제하기 위해 본 시스템에서 사용되는 부위-특이적 리콤비나제이다. 따라서, Cre 리콤비나제는 초기 선택이 이루어졌으면 비-유용한 서열로부터 벡터 백본을 "청소하는" 것으로 기재될 수 있다. PhiC31 리콤비나제 및 Cre 리콤비나제 둘 다는 부위 특이적 재조합에 사용되는 널리 공지된 효소이다 [5, 6].
매칭 DNA 공여자 벡터는 반시계방향 배향으로 코딩되는 프로모터를 결여한 제1 선택 마커 (여기서 RFP, 적색 형광 단백질에 의해 예시됨), 매칭 PhiC31 리콤비나제 인식 서열 (attB1), 관심의 단백질을 코딩하는 핵산 서열을 포함하는 발현 카세트(들), Cre 리콤비나제에 대한 보완 리콤비나제 인식 서열 (loxP), 제2 선택 마커 (임의적, 여기서 FC-eGFP에 의해 예시됨)에 대한 완전히 기능적인 발현 카세트 및 플라스미드 백본 (박테리아 증식을 위한 서열 등을 함유함)을 포함한다.
DNA 공여자 벡터 및 PhiC31의 발현을 위한 벡터를 랜딩 패드 (LP) 서열의 사전-정의된 게놈 위치를 포함하는 진핵생물 숙주 세포 내로 공동-형질감염시키는 것은 형질감염된 세포의 분획에 대한 attP1attB2의 PhiC31 매개 재조합을 통한 LP에서의 공여자 벡터의 통합을 초래할 것이다. 사전-정의된 게놈 위치에서의 통합 시, 프로모터-없는 선택 마커는 그것이 사전-정의된 게놈 위치에서 프로모터에 의해 활성화되도록 위치될 것이다. 이어서 제1 선택 마커의 활성은 LP에서 통합을 겪은 세포에 대해 선택하는데 사용될 수 있다 (RFP의 경우에 FACS를 사용하여). 적절한 선택은 대부분의 세포가 LP에서 통합된 단일 카피를 갖는 세포의 풀을 생성할 것이다. 그러나, 세포의 분획은 오프-타겟 통합 메커니즘, 예컨대 DNA 복구 매개 무작위 통합 및 게놈 슈도-attP 서열에서의 PhiC31 매개 통합을 통해 통합된 추가적 카피를 가질 것으로 예상된다. 이러한 사건에 대해 선택하고 동시에 사전-정의된 게놈 위치에서 선택 마커 카세트 및 플라스미드 백본의 제거 (즉, "청소")를 가능하게 하기 위해, 제2 리콤비나제 매개 단계가 디자인되었다.
사전-정의된 게놈 위치는 loxP 서열을 함유하고 DNA 공여자 벡터는 또한 전략적으로 정치된 loxP 서열을 함유하기 때문에, 사전-정의된 게놈 위치에서의 통합 사건은 2개의 loxP 서열에 의해 플랭킹된 둘 다의 선택 마커 (뿐만 아니라 다른 원하지 않는 서열 요소, 예컨대 플라스미드 백본)를 함유할 것이다. 대조적으로, 대부분의 오프-타겟 사건은 loxP 플랭킹된 선택 마커를 초래하지 않을 것이다 (연쇄체화된 공여자 벡터의 일부 무작위 통합 사건은 플랭킹된 제2 선택 마커 유전자를 초래할 수 있지만, 이는 극도로 드물 것임). Cre 리콤비나제를 코딩하는 벡터의 제2 형질감염을 사용함으로써, loxP 서열에 의해 플랭킹된 영역은 상응하는 세포의 게놈으로부터 삭제될 수 있다. 따라서, 사전-정의된 게놈 위치에서 통합된 단일 카피를 갖는 (오프-타겟 통합을 결여함), 뿐만 아니라 원하지 않는 서열 요소가 제거된 세포는 선택 마커 활성의 부재 (FACS를 사용한 eGFP 활성의 부재)를 통해 선택될 수 있다. 이는 또한 음성 선택에 의한 선택으로 지칭된다.
본원에 정의된 바와 같은 방법에 사용하기 위한 제1 DNA 효소의 비-제한적 예는 DNA 리콤비나제, 예컨대 PhiC31 또는 Bxb1 리콤비나제이고, 본원의 다른 곳에 기재된 바와 같다. 제1 DNA 효소로서 사용되는 경우에 리콤비나제의 특징적인 특색은 그것이 핵산 서열 영역을 사전-정의된 게놈 영역 내로 도입하고, 제거하지 않을 것이라는 것이다.
본원에 정의된 바와 같은 방법에 사용하기 위한 제2 DNA 효소의 비-제한적 예는 DNA 리콤비나제, 예컨대 PhiC31 리콤비나제, Bxb1 리콤비나제, Cre 리콤비나제 및 Dre 리콤비나제이고, 본원의 다른 곳에 기재된 바와 같다. 제2 DNA 효소로서 사용되는 경우에 리콤비나제의 특징적인 특색은 그것이 핵산 서열 영역을 사전-정의된 게놈 영역으로부터 제거하고, 도입하지 않을 것이라는 것이다.
제1 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 I1은 상기 사전-정의된 게놈 위치에 존재하는 PhiC31 또는 Bxb1 리콤비나제에 대한 attP 또는 attB 부위이거나, 다르게는 어느 제1 DNA 효소가 본 맥락에서 사용되고 있는지에 따라 본원에서 예시된 바와 같을 수 있다. 예로서, 이는 또한 Cre 리콤비나제에 대한 loxP 부위이거나, 다르게는 본원에 예시된 바와 같을 수 있다.
핵산 서열 I2는 상기 공여자 벡터에 존재하는 PhiC31 또는 Bxb1 리콤비나제에 대한 attB 부위 또는 attP 부위 (인식 부위)이거나, 다르게는 어느 제1 DNA 효소가 본 맥락에서 사용되는지에 따라 본원에 예시된 바와 같을 수 있다. 예로서, 이는 또한 Cre 리콤비나제에 대한 loxP 부위이거나, 다르게는 본원에 예시된 바와 같을 수 있다.
핵산 서열 E1은 Cre 리콤비나제에 대한 loxP 부위 또는 Dre 리콤비나제에 대한 roxP 부위일 수 있다. 이는 또한 PhiC31 또는 Bxb1 리콤비나제에 대한 attP 또는 attB 부위이거나, 다르게는 본원에 예시된 바와 같을 수 있다.
핵산 서열 E2는 Cre 리콤비나제에 대한 loxP 부위 또는 Dre 리콤비나제에 대한 roxP 부위일 수 있다. 이는 또한 PhiC31 또는 Bxb1 리콤비나제에 대한 attP 또는 attB 부위이거나, 다르게는 본원에 예시된 바와 같을 수 있다.
제1 DNA 효소가 PhiC31 리콤비나제인 경우, 제2 DNA 효소는 PhiC31 리콤비나제가 아니다. 동일한 것이 임의의 다른 제1 및 제2 DNA 효소에 적용되며, 즉, 제1 및 제2 DNA 효소는 동일한 SDI 시스템에서 결코 동일하지 않다.
본원에서, 상기 공여자 벡터의 제1 선택 마커 (SM1)는 제1 선택 마커 및 제2 DNA 효소 둘 다가 사전-정의된 게놈 위치에서의 통합 시 활성화되도록 IRES 요소 또는 SM1의 아미노산 서열 및 자기-절단 펩티드에 의해 융합된 상기 제2 DNA 효소를 통해 상기 제2 DNA 효소를 코딩하는 유전자에 연결될 수 있다. 이는 도 11에 예시된다. 이는 공여자 벡터가 사전-정의된 게놈 위치 내로 통합되었으면 제2 DNA 효소의 존재를 보장하며, 핵산 벡터의 추가의 도입은 방법의 단계로 진행하는데 필요하지 않다. SM1의 발현은 제2 DNA 효소의 세포내 농도가 핵 국재화 및 E1 및 E2에 의해 플랭킹된 서열 영역의 삭제를 촉진시키는 충분히 높은 값에 도달할 때까지 진행할 수 있다. 양성 선택 단계의 적절한 시기에 의해, 사전-정의된 게놈 위치에서 통합을 겪은 세포는 양성 선택을 허용하는 SM1의 수준을 함유할 것이다.
본원에서, 사전-정의된 게놈 위치는 또한 사전-정의된 게놈 위치에서의 공여자 벡터의 통합 시 그것이 상기 제2 DNA 효소에 대한 인식 부위에 의해 플랭킹되고, 상기 제2 DNA 효소의 작용을 통해 사전-정의된 게놈 영역으로부터 삭제되게 되도록 위치된 상기 제1 DNA 효소에 대한 발현 카세트를 포함할 수 있다. 이는 도 12에 예시된다. 이는 방법을 추가로 단순화하며, 높은 통합 효율의 가능성을 개선시킬 것이다. 발현 카세트는 방법의 나중의 단계 동안 제거되기 때문에, 최종 단리된 세포에서의 제1 DNA 효소의 발현 시 세포 자원은 낭비되지 않으며, 제1 DNA 효소의 장기 존재의 임의의 부정적 결과가 회피된다.
따라서, 제1 DNA 효소는 사전-정의된 게놈 위치로부터의 발현에 의해 또는 상기 세포에서 상기 제1 DNA 효소의 일시적 존재를 생성하는 임의의 형태의 세포 내로의 도입에 의해 제공될 수 있다. 이는 단리된 단백질 그 자체의 도입, 상기 제1 DNA 효소에 대한 발현 카세트를 포함하는 별개의 발현 플라스미드의 도입, 상기 공여자 벡터에서의 상기 제1 DNA 효소에 대한 활성 발현 카세트의 존재 또는 상기 제1 DNA 효소를 코딩하는 합성 mRNA의 도입을 포함한다.
제2 DNA 효소는 단리된 단백질 그 자체로서 제공될 수 있거나, 이는 별개의 발현 벡터 또는 플라스미드 상의 발현 카세트로부터 발현될 수 있거나, 상기 제2 DNA 효소를 코딩하는 합성 mRNA로부터 발현될 수 있다. 이는 또한 이전에 기재된 바와 같이 사전-정의된 게놈 위치 내로 통합되면 공여자 벡터로부터 발현될 수 있다.
본원에서 이전에 언급된 바와 같이, 본 개시내용의 모든 측면은 사전-정의된 게놈 위치에 대한 임의의 변화를 만들 필요 없이 선택 마커의 선택에 있어서의 유연성을 허용한다. SM1은 (i) 항생제 저항성 유전자, (ii) 대사 효소 유전자, 예컨대 GS 또는 DHFR, (iii) 형광 단백질 유전자 또는 (iv) 세포 표면 마커, 예컨대 CD4 또는 CD10의 군으로부터 선택될 수 있다. SM2는 (i) 독성 생성물 생성 효소, 예컨대 TK, (ii) 형광 단백질 유전자 또는 (iii) 세포 표면 마커, 예컨대 CD4 또는 CD10의 군으로부터 선택될 수 있다.
바람직하게는 둘 다의 선택 마커는 FACS 또는 MACS와 같은 방법을 통한 신속한 선택 단계를 허용하는 (i) 형광 단백질 유전자 또는 (ii) 세포 표면 마커의 군으로부터 선택된다.
제1 또는 제2 선택 마커의 발현은 선택 마커가 형광 단백질인 경우, 예를 들어 FACS를 사용함으로써 검출될 수 있다. 선택 마커가 항생제 저항성 유전자인 경우, 통합은 세포를 상응하는 항생제의 존재 하에서 배양함으로써 검출될 수 있다. 세포가 항생제가 첨가된 배지에서 생존하는 경우, 공여자 벡터는 성공적으로 통합되었다.
본원에서 언급된 바와 같이, 리콤비나제는 숙주 세포 게놈에서 적절한 핵산 영역 (E1 및 E2)에 의해 플랭킹된 핵산 서열을 삭제하는데 유용하다. 이는 주로 숙주 세포 게놈에서 "정돈하는" 단계인데, 이는 통합 및 선택이 이루어졌으면 사전-정의된 게놈 위치 내로 도입된 핵산 서열의 일부 부분이 남아돌 것이기 때문이다. 그들의 존재는 또한 세포 에너지를 소비할 수 있다. 핵산 서열의 삭제는 뉴클레오티드의 특이적 조합, 즉, E1 및 E2에 결합함으로써 제2 DNA 효소가 핵산 서열 부분을 숙주 세포 게놈으로부터 커팅하고 제거할 수 있음을 의미한다. 사전-정의된 게놈 위치에서의 핵산 서열 E1 및 E2의 존재는 원칙적으로 공여자 벡터의 안정한 통합이 거기에서 일어났다는 증거이다.
제2 선택 마커 (존재하는 경우)를 코딩하는 발현 카세트는 사전-정의된 게놈 위치에서의 통합 시 그것이 E1 및 E2에 의해 플랭킹되게 되도록 상기 공여자 벡터에서 위치된다. 그러나, 공여자 벡터가 사전-정의된 게놈 위치의 외부에서 통합되는 경우, 제2 선택 마커를 코딩하는 상기 발현 카세트는 E1 및 E2에 의해 플랭킹되지 않을 것이다.
따라서, 예를 들어 FACS에 의해 제2 DNA 효소의 작용 후 세포 집단에서의 세포 중에서 제2 선택 마커 (SM2)의 발현을 검출하는 것이 가능한 경우, 이는 공여자 벡터의 비목적하는 통합 사건이 세포에서의 또 다른 위치에서 일어났음을 의미한다. 이러한 세포는 (음성 선택에 의해) 공여자 벡터의 통합이 단지 사전-정의된 게놈 위치에서 일어난 세포에 대해 선택하도록 제거될 수 있다
도 9에서 및 실시예 4에서 2개의 연속적 선택 단계를 사용한 SDI 세포 풀의 생성, 즉, 제2 DNA 효소가 통합 후에 첨가되어 세포에서 목적을 더 이상 실현시키지 않는 핵산 서열을 제거하는 경우가 예시된다. 이 예에서, 항생제 저항성 유전자를 제1 선택 마커 (SM1)로서 사용하였다. 선택의 제2 라운드를 Cre 리콤비나제를 사용하여 수행하여 각각의 단부에서 loxP 핵산 영역에 의해 플랭킹된 핵산 서열을 삭제하였다. 무작위 통합 사건의 존재를 FACS를 사용하여 GFP/RFP (녹색/적색 형광 단백질)의 이중 양성 신호에 의해 검출하였다. 세포를 양성/음성 GFP/RFP 신호에 기반하여 분류하였다. 이 추가적 단계는 사전-결정된 게놈 위치에서 1개의 공여자 벡터를 통합하였을 수 있지만, 또한 숙주 세포 게놈에서의 무작위 비-표적 위치(들)에서 제2 또는 추가의 공여자 벡터(들)를 무작위로 통합하였을 수 있는 세포의 제거를 제공한다.
본원에서 이전에 언급된 바와 같이, 상기 제1 DNA 효소는 리콤비나제일 수 있다. 제1 DNA 효소는 제1 DNA 효소의 임의의 DNA 효소가 제2 DNA 효소와 동일하지 않는 한, 상이한 DNA 효소, 예컨대 리콤비나제의 믹스일 수 있다.
본원에서, 공여자 벡터에 존재하는 상기 제1 DNA 효소에 대한 1개 초과의 인식 부위, 예컨대 2개 이상의 인식 부위가 있을 수 있다. 이는 또한 사전-정의된 게놈 위치에 존재하는 상기 제1 DNA 효소에 대한 1개 초과의 인식 부위, 예컨대 2개 이상의 인식 부위가 있을 것임을 의미한다. 리콤비나제를 이용하는 이러한 시스템의 예는 도 14에 제시된다. 도 14는 사전-정의된 게놈 위치에서 통합을 촉매하는 리콤비나제 매개 카세트 교환 (RMCE)을 제시한다. 도 2, 도 11-12 및 도 16에 따라 변형된 그의 변이체는 또한 본 개시내용에 의해 포함된다.
따라서, 도 14에서의 예에서, 사전-정의된 게놈 위치는 5'-3' 서열 순서로 (i) 제1 리콤비나제 효소에 대한 제1 인식 부위 (I1A); (ii) 상기 제1 리콤비나제 효소에 대한 제2 인식 부위 (I1B), (iii) 3'-5' 방향성을 갖는 프로모터 P1 및 (v) 제2 리콤비나제 효소에 대한 인식 부위 E1을 포함한다.
이 예에서, 공여자 벡터는 5'-3' 서열 순서로 (i) 상기 제1 리콤비나제 효소에 대한 제3 인식 부위 (I2A), (ii) 여기서 관심의 유전자 (GOI)에 대한 발현 카세트에 의해 예시되는 통합 카세트 (IC), (iii) 상기 제2 리콤비나제 효소에 대한 인식 부위 E2, (iv) 제2 선택 마커 (SM2)에 대한 발현 카세트, (v) 3'-5' 방향성으로 코딩되는 제1 선택 마커 (SM1)에 대한 유전자 및 (vi) 상기 제1 리콤비나제 효소에 대한 제4 인식 부위 (I2B)를 포함한다.
세포의 집단 내로의 공여자 벡터 및 제1 리콤비나제의 도입은 (a) 공여자 벡터에서의 통합 카세트, 즉, 세포의 분획에 대한 사전-정의된 게놈 위치에서의 상기 제3 및 제4 리콤비나제 인식 부위에 의해 플랭킹된 서열 영역의 통합 (도 14b, 패널 (ii) 참조) 및 (b) 세포의 분획에 대한 공여자 벡터의 오프-타겟 게놈 통합 (사전-정의된 게놈 위치의 외부에서) (도 14b, 패널 (iii) 참조)을 발생시킨다.
사전-정의된 게놈 위치에서의 통합은 SM1에 대한 활성 발현 카세트의 형성을 발생시킨다 (도 14b, 패널 (ii) 참조). 추가로, 사전-정의된 게놈 위치에서의 통합 후, SM1 및 SM2 둘 다는 상기 제2 리콤비나제 효소에 대한 2개의 인식 부위에 의해 플랭킹된다.
오프-타겟 사건에 의한 통합 (도 14b, 패널 (iii) 참조)은 전형적으로 SM1의 활성화를 초래하지 않지만, 상기 제2 리콤비나제 효소에 대한 2개의 인식 부위에 의해 플랭킹되지 않은 활성 SM2를 통합한다.
사전-정의된 게놈 위치에서 통합을 겪은 세포는 통합 사건을 갖지 않는 세포 (도 14b, 패널 (i) 참조) 및 단지 SM1의 활성을 통해 오프-타겟 통합 사건을 겪은 세포와는 상이하다. 따라서, SM1의 활성은 LP에서의 통합을 겪은 세포에 대해 선택하는데 사용될 수 있다.
사전-정의된 게놈 위치에서의 통합에 추가로 오프-타겟 통합 사건을 겪은 세포를 제거하기 위해, 상기 제2 리콤비나제의 리콤비나제 활성은 SM1 활성에 대해 선택된 세포 내에 도입된다. LP에서의 통합을 위해, 이는 SM1 및 SM2 둘 다 및 따라서 그들의 상응하는 활성의 삭제를 발생시킨다. 오프-타겟 통합 사건에 대해 이 반응은 일어날 수 없고, SM2 활성은 잔류한다. 그 결과, 단지 사전-정의된 게놈 위치에서 목적하는 표적화된 통합 사건을 겪은 세포는 SM2 활성의 부재를 통해 다수의 통합 사건을 겪은 세포로부터 선택될 수 있다.
최종적으로 선택된 세포에 대한 사전-정의된 게놈 위치 (도 14c 참조)는 SM2에 대한 발현 카세트도, SM1에 대한 활성화된 발현 카세트, 또는 E1 및 E2 (E)의 재조합을 통해 생성된 서열을 제외하고는 공여자 벡터로부터의 임의의 잔류 서열도 함유하지 않는다.
상기 제1 리콤비나제 효소는 (i) 세린 리콤비나제 또는 (ii) 티로신 리콤비나제의 군으로부터 선택될 수 있다.
상기 제1 내지 제4 리콤비나제 인식 부위는 하기에 따라 선택될 수 있다:
(a) 세린 리콤비나제, 예컨대 PhiC31 [I1a=I1b=attP 또는 attB 및 I2a=I2b=attB 또는 attP] 또는 Bxb1 [I1a=I1b= Bxb1 attP 또는 Bxb1 attB 및 I2a=I2b= Bxb1 attB 또는 Bxb1 attP]에 대한 1개의 매칭 인식 부위 쌍을 사용한 I1a=I1b 및 I2a=I2b,
(b) 세린 리콤비나제, 예컨대 PhiC31 (I1a 및 I1b = 상이한 attP 변이체 또는 attB 변이체; I2a 및 I2b = 상이한 attB 변이체 또는 attP 변이체)에 대한 돌연변이된 인식 쌍을 사용한 2개의 상이한 매칭 인식 부위 쌍을 선택하는 것 및
(c) 티로신 리콤비나제에 대한 I1a=I2a 및 I1b=I2b, 돌연변이된 인식 부위 변이체 쌍이 존재하는 경우, 예컨대 Cre (이용가능한 돌연변이된 loxP 쌍으로부터 선택되는 LoxP1 및 LoxP2), Dre (이용가능한 돌연변이된 rox 쌍으로부터 선택되는 rox1 rox2) 또는 FLP (이용가능한 돌연변이된 FRT 쌍으로부터 선택되는 FRT1 및 FRT2).
상기 제2 리콤비나제 효소는 상기 제1 리콤비나제 효소와는 상이하고, (i) 세린 리콤비나제 또는 (ii) 티로신 리콤비나제의 군으로부터 선택될 수 있다.
상기 제2 리콤비나제 효소에 대한 인식 부위 E1 및 E2는 (i) Cre 리콤비나제와 함께 사용하기 위해 E1=E2= loxP 또는 그의 돌연변이된 변이체, (ii) Dre 리콤비나제와 함께 사용하기 위해 E1=E2= rox 또는 그의 돌연변이된 변이체 또는 (iii) FLP (플립파제) 리콤비나제와 함께 사용하기 위해 E1=E2= FRT 또는 그의 돌연변이된 변이체에 의해 예시된 바와 같이 서열에 있어서 동일할 수 있다.
상기 제2 리콤비나제 효소에 대한 인식 부위 E1 및 E2는 (i) PhiC31 리콤비나제와 함께 사용하기 위해 E1=attP 및 E2=attB 또는 그의 돌연변이된 변이체 또는 (ii) Bxb1 리콤비나제와 함께 사용하기 위해 E1=Bxb1 attP 및 E2=Bxb1 attB 또는 그의 돌연변이된 변이체에 의해 예시된 바와 같이 상이한 서열을 가질 수 있다.
제1 DNA 효소에 대한 추가의 인식 부위는 본원에서 I1의 변이체, 즉, I1a 및 I1b, 및 I2의 변이체, 즉, I2a 및 I2b 등으로 지칭될 수 있다.
따라서, 또한
(a) I1이 2개의 리콤비나제 인식 부위 변이체 I1a 및 I1b를 포함하고;
(b) I2가 2개의 리콤비나제 인식 부위 변이체 I2a 및 I2b를 포함하고;
(c) 상기 제1 DNA 효소의 존재 하에서 I1a가 I2a와 재조합이 가능하고, I1b가 I2b와 재조합이 가능한 것인
본원의 방법이 본원에서 제공된다.
때때로, I1a는 I2a와 동일하고, I1b는 I2b와 동일하다. I1a, I1b, I2a 및 I2b는 각각 loxP, rox 또는 FRT 또는 그의 변이체로부터 선택될 수 있고, 제1 DNA 효소는 각각 Cre 리콤비나제, Dre 리콤비나제 및 FLP 리콤비나제 [5]로 이루어진 군으로부터 선택될 수 있다.
본원에서, 또한
(a) I1이 단일 리콤비나제 인식 부위를 포함하고;
(b) I2가 단일 리콤비나제 인식 부위를 포함하고;
(c) I1 및 I2가 상기 제1 DNA 효소의 존재 하에서 재조합이 가능한 것인
방법이 제공된다.
I1에 의해 포함되는 리콤비나제 인식 부위는 또한 I2에 의해 포함되는 리콤비나제 인식 부위와는 서열에 있어서 상이할 수 있다. 본원에서 제공된 리콤비나제 인식 부위는 attB, attP, Bxb1 attP, Bxb1 attB 또는 그의 변이체로부터 선택될 수 있다. 상기 리콤비나제는 PhiC31 또는 Bxb1 리콤비나제 또는 그의 돌연변이체일 수 있다.
인식 부위/DNA 효소의 임의의 변이체 또는 돌연변이체는 그의 기능적으로 등가의 변이체 또는 돌연변이체일 것이다. 통상의 기술자는 이러한 기능적으로 등가의 변이체 또는 돌연변이체를 구축하고 생산할 것이다.
사전-정의된 게놈 위치에서 통합을 촉매하는 단일 리콤비나제 인식 부위 쌍을 사용하는 예는 도 15에 제시된다. 도 2, 도 11-12 및 도 16에 따라 변형된 변이체는 또한 본 개시내용에 의해 포함된다.
이 예에서, 사전-정의된 게놈 위치는 5'-3' 서열 순서로 (i) 제1 리콤비나제 효소에 대한 제1 인식 부위 (I1); (ii) 3'-5' 방향성을 갖는 프로모터 P1 및 (iii) 제2 리콤비나제 효소에 대한 제1 인식 부위 E1을 포함한다.
이 예에서, 공여자 벡터는 5'-3' 서열 순서로 (i) 상기 제1 리콤비나제 효소에 대한 제2 인식 부위 (I2), (ii) 여기서 관심의 유전자 (GOI)에 대한 발현 카세트에 의해 예시되는 통합 카세트 (IC), (iii) 상기 제2 리콤비나제 효소에 대한 제2 인식 부위 E2, (iv) 제2 선택 마커 (SM2)에 대한 발현 카세트 및 (v) 3'-5' 방향성으로 코딩되는 제1 선택 마커 (SM1)에 대한 유전자를 포함한다.
LP 세포의 집단 내로의 공여자 벡터 및 제1 리콤비나제의 도입은 (a) LP 세포의 분획에 대한 LP에서의 공여자 벡터의 통합 (도 15b, 패널 (ii) 참조) 및 (b) 세포의 분획에 대한 공여자 벡터의 오프-타겟 게놈 통합 (사전-정의된 게놈 위치의 외부에서) (도 15b, 패널 (iii) 참조)을 발생시킨다.
사전-정의된 게놈 위치에서의 통합은 SM1에 대한 활성 발현 카세트의 형성을 발생시킨다 (도 15b, 패널 (ii) 참조). 추가로, 사전-정의된 게놈 위치에서의 통합 후, SM1 및 SM2 둘 다는 상기 제2 리콤비나제 효소에 대한 2개의 인식 부위 E1 및 E2에 의해 플랭킹된다.
오프-타겟 사건에 의한 통합 (도 15b, 패널 (iii) 참조)은 전형적으로 SM1의 활성화를 초래하지 않지만, 상기 제2 리콤비나제 효소에 대한 인식 부위에 의해 플랭킹되지 않은 활성 SM2를 통합한다.
사전-정의된 게놈 위치에서 통합을 겪은 세포는 통합 사건을 갖지 않는 세포 (도 15b, 패널 (i) 참조) 및 단지 SM1의 활성을 통한 오프-타겟 통합 사건을 겪은 세포와는 상이하다. 따라서, SM1의 활성은 사전-정의된 게놈 위치에서 통합을 겪은 세포에 대해 선택하는데 사용될 수 있다.
사전-정의된 게놈 위치에서의 통합에 추가로 오프-타겟 통합 사건을 겪은 세포를 제거하기 위해, 상기 제2 리콤비나제의 리콤비나제 활성은 SM1 활성에 대해 선택된 세포 내에 도입된다. 사전-정의된 게놈 위치에서의 통합을 위해, 이는 SM1 및 SM2 둘 다 및 따라서 그들의 상응하는 활성의 삭제를 발생시킨다. 오프-타겟 통합 사건에 대해 이 반응은 일어날 수 없고, SM2 활성은 잔류한다. 그 결과, 단지 LP에서 목적하는 표적화된 통합 사건을 겪은 세포는 SM2 활성의 부재를 통해 다수의 통합 사건을 겪은 LP 세포로부터 선택될 수 있다.
최종적으로 선택된 세포에 대한 사전-정의된 게놈 위치 (도 15c 참조)는 SM2에 대한 발현 카세트도, SM1에 대한 활성화된 발현 카세트, 또는 I1 및 I2 (I12) 및 E1 및 E2 (E)의 재조합을 통해 생성된 서열을 제외하고는 공여자 벡터로부터의 임의의 잔류 서열도 함유하지 않는다.
상기 제1 리콤비나제 효소는 세린 리콤비나제, 예컨대 PhiC31 및 Bxb1의 군으로부터 선택될 수 있다. 상기 제1 및 제2 리콤비나제 인식 부위 (I1 및 I2)는 (a) I1= attP 변이체 및 I2= attB 변이체 또는 (b) I1= attB 변이체 및 I2= attP 변이체에 따라 선택된 리콤비나제에 매칭하는 인식 부위와 함께 선택될 수 있다.
상기 제2 리콤비나제 효소는 상기 제1 리콤비나제 효소와는 상이하고, (i) 세린 리콤비나제 또는 (ii) 티로신 리콤비나제의 군으로부터 선택될 수 있다.
상기 제2 리콤비나제 효소에 대한 인식 부위 E1 및 E2는 (i) Cre 리콤비나제와 함께 사용하기 위해 E1=E2= loxP 또는 그의 돌연변이된 변이체, (ii) Dre 리콤비나제와 함께 사용하기 위해 E1=E2= rox 또는 그의 돌연변이된 변이체 또는 (iii) FLP 리콤비나제와 함께 사용하기 위해 E1=E2= FRT 또는 그의 돌연변이된 변이체에 의해 예시된 바와 같이 서열에 있어서 동일할 수 있다.
상기 제2 리콤비나제 효소에 대한 인식 부위 E1 및 E2는 (i) PhiC31 리콤비나제와 함께 사용하기 위해 E1=attP 및 E2=attB 또는 그의 돌연변이된 변이체 또는 (ii) E1=Bxb1 attP 및 E2=Bxb1 attB에 의해 예시된 바와 같이 상이한 서열을 가질 수 있다.
또한, 사전-정의된 게놈 위치에서 통합을 촉매하는 단일 리콤비나제 인식 부위 쌍을 사용하는 것을 예시하며, 여기서 사전-정의된 게놈 위치에 존재하는 프로모터 P1은 스플릿 인트론의 5'-부분에 기능적으로 융합된 것인 도 16에 예시된 바와 같은 방법이 제공된다. 보다 앞에 기재되어 있지만 도 16에 따라 변형된 방법 (즉, 스플릿 인트론 디자인을 사용함)은 또한 본 개시내용에 의해 포함된다.
이 예에서 사전-정의된 게놈 위치는 3'-5' 방향성을 갖는 인트론의 5'-부분 및 상기 제1 리콤비나제 효소에 대한 상기 제1 인식 부위 및 3'-5' 방향성을 갖는 상기 프로모터 P1 사이의 3'-5' 방향성을 갖는 기능적 서열 영역 F1을 추가로 포함한다.
이 예에서 공여자 벡터는 3'-5' 방향성을 갖는 상기 제1 선택 마커 SM1 및 상기 제1 리콤비나제 효소에 대한 상기 제2 인식 부위 사이에 위치한 서열 영역을 추가로 포함한다. 상기 서열 영역은 5'-3' 서열 순서로 (a) 3'-5' 방향성을 갖는 기능적 서열 영역 F3 및 (b) 스플라이스 수용자 부위 서열의 하류에 기능적 서열 영역 F2를 추가로 포함하는 3'-5' 방향성을 갖는 인트론의 3'-부분을 포함한다.
사전-정의된 게놈 위치에서의 통합 시 (도 16b, 상부 패널 참조), 상기 제1 선택 마커 SM1에 대한 기능적 인트론을 포함하는 완전한 발현 카세트가 형성된다. 따라서 SM1의 발현은 활성화된다.
오프-타겟 통합 사건 후 (도 16b, 하부 패널 참조), SM1 발현 카세트의 말단절단된 버전이 통합된다.
기회 사건에 의해 말단절단된 SM1 카세트의 전사가 일어날 수 있다. 이는 (a) 말단절단된 SM1 카세트가 세포 게놈에 존재하는 천연 프로모터와 프레임 내에서 위치하게 되도록 하는 방식으로 공여자 벡터가 통합된 프로모터 구제 또는 (b) 공여자 벡터에 존재하는 프로모터가 말단절단된 SM1 카세트와 프레임 내에서 재-배향되게 되도록 공여자 벡터의 절단 및 연쇄체화, 이어서 생성된 연쇄체의 통합에 기인할 수 있다.
이러한 기회 사건은 사전-정의된 게놈 위치에서 공여자 벡터를 통합한 세포의 선택에 기반하여 SM1에 있어서의 특이성을 감소시킬 수 있다. 기능적 서열 영역 F1-F3의 특이적 조합의 사용에 의해, 개선된 특이성이 달성될 수 있다 (도 16b 참조).
F1-F3의 제1 디자인에서; (a) SM1 (공여자 벡터에 존재하는 경우)은 ATG 시작 코돈을 결여하고, 3'-인트론에 직접적으로 융합되고, (b) F1은 (3'-5'로) 시작 전사 부위 (TSS), 제1 5'-UTR 영역, 코작(Kozak)/번역 개시 부위 및 ATG 시작 코돈 (모두 3'-5' 방향성을 가짐)으로 구성된다. 오프-타겟 통합 사건 후, 이는 통합된 임의의 SM1 유전자가 시작 코돈을 결여할 것이고, 따라서 기능적 SM1 단백질의 발현을 생성하지 않을 것임을 의미한다. 그러나, 사전-정의된 게놈 위치에서의 통합 시, 기능적 발현 카세트가 형성될 것이다. 인트론의 스플라이싱 시, ATG 시작 코돈은 SM1에 직접적으로 융합되어, SM1 단백질의 적절한 발현을 초래할 것이다.
F1-F3의 제2 디자인에서; (a) SM1은 ATG 시작 코돈을 함유하고, (b) F3은 (3'-5'로) 제2 5'-UTR 영역 및 코작/번역 개시 부위 (모두 3'-5' 방향성을 가짐)로 구성되고, (c) F2는 3'-5 방향성을 갖는 적어도 1개의 짧은 상류 오픈 리딩 프레임 (uORF)을 포함하고, (d) F1은 시작 전사 부위 (TSS) 및 제1 5'-UTR 영역으로 구성된다. 오프-타겟 통합 사건 후, 말단절단된 SM1 카세트는 전형적으로 1개 이상의 uORF를 보유할 것이다. 이들 uORF는 의도된 SM1 시작 코돈에서 개시를 감소시키며, 그에 의해 SM1 활성화에 기반한 오프-타겟 통합 및 사전-정의된 게놈 위치에서의 통합에 기반한 SM1 활성화 사이의 식별을 개선시킬 것이다. 바람직하게는, 일련의 다수의 uORF가 사용되고, SM1 시작 코돈에 대해 최소 거리로 정치된다 (인트론 스플라이스 분지 부위의 바로 하류).
스플릿 인트론 디자인의 사용은 또한 활성화된 SM1의 발현을 개선시키는데, 이는 최적 5'-UTR 서열이 SM1을 위해 사용될 수 있기 때문이다. 스플릿 인트론을 결여하는 디자인에서, I1 및 I2의 재조합을 통해 생성된 서열 (도 15 참조)은 SM1 5'-UTR에 의해 포함될 것이다. 이는 SM1의 수득가능한 발현 수준 (SM1에 기반한 양성 선택 단계에 있어서의 특이성에 영향을 미침)을 감소시킬 수 있는 잠재적으로 비-최적 서열 조성물을 갖는 연장된 5'-UTR을 초래한다. 본원에 기재된 바와 같은 스플릿 인트론의 사용을 통해, I1/I2 재조합 생성물은 사전-정의된 게놈 위치에서의 통합 시 완전히 형성된 인트론에 혼입되게 된다 (도 16 참조). 세포에 의한 성숙 SM1 mRNA의 생성 시, 인트론은 스플라이싱되고, 상응하는 SM1 5'-UTR은 F1 및 F2에 의해 완전히 정의된다. 따라서, SM1 5'-UTR은 의도된 목적을 위한 SM1 발현을 최적화하기 위한 완전한 제어를 갖는 디자인일 수 있다. F2-F3의 디자인의 변이는 LP에서의 통합 시 SM1의 발현 수준에 있어서의 유연성을 추가로 제공한다. F3의 5'-UTR 영역의 길이를 증가시키는 것은 SM1의 발현을 감소시키고, F2에서의 전사 인핸서 요소의 첨가는 SM1의 발현을 단지 최적 5'-UTR로 달성될 수 있는 것 초과로 증가시킬 수 있다.
마지막으로, 스플릿 인트론 디자인의 사용은 실험 섹션, 실시예 1에 제시된 바와 같이 사전-정의된 게놈 위치에서의 I1 및 I2 사이의 재조합의 효율을 개선시킬 수 있다. 관찰되는 개선된 통합 효율에 대한 한 가지 잠재적인 설명은 사전-정의된 게놈 위치에서의 스플릿 인트론의 5'-부분이 시작 전사 부위 주위에 결합하는 RNA 폴리머라제 개시 복합체 및 I1의 결합 및 조작에 의해 그의 기능을 수행하는 제1 DNA 효소 (예를 들어 PhiC31)의 카피 사이의 입체 간섭을 회피할/감소시킬 수 있는 중요한 스페이서로서 기능한다는 것이다. 통합 효율을 증가시키기 위해, 스플릿 인트론의 상기 5'-부분은 적어도 50 bp, 적어도 100 bp 또는 적어도 300 bp의 길이를 갖도록 디자인될 수 있다.
도 13은 유전자 편집 효소가 사전-정의된 게놈 위치에서의 공여자 벡터의 통합을 촉매하는데 사용되는 방법을 예시한다 (제1 DNA 효소는 유전자 편집 효소임). 도 2 및 도 11-12에 따른 그의 변형은 또한 본 개시내용에 의해 포함된다.
이 예에서 사전-정의된 게놈 위치는 5'-3' 서열 순서로 (i) 좌측 상동성 아암 (LHA), (ii) 유전자 편집 효소에 대한 인식 부위/커팅 부위 (CS), (iii) 또한 3'-5' 방향성을 갖는 인트론의 5'-부분으로서 기능하는 (즉, 프로모터에 가장 가까운 단부에서 스플라이스 공여자 부위를 갖는) 우측 상동성 아암 (RHA), (iv) 3'-5' 방향성을 갖는 프로모터 P1 및 (v) 제2 DNA 효소에 대한 인식 부위 E1을 포함한다.
이 예에서, 공여자 벡터는 5'-3' 서열 순서로 (i) 상기 좌측 상동성 아암 (LHA), (ii) 여기서 관심의 유전자 (GOI)에 대한 발현 카세트에 의해 예시되는 통합 카세트 (IC), (iii) 상기 제2 DNA 효소에 대한 인식 부위 E2, (iv) 제2 선택 마커 (SM2)에 대한 발현 카세트, (v) 3'-5' 방향성으로 코딩되는 제1 선택 마커 (SM1)에 대한 유전자, (vi) 3'-5' 방향성을 갖는 (즉, SM1에 가장 가까운 단부에서 스플라이스 분지 부위 및 스플라이스 수용자 부위를 갖는) 인트론의 3'-부분 및 (vii) 또한 3'-5' 방향성을 갖는 인트론의 5'-부분으로서 기능하는 상기 우측 상동성 아암 (RHA)을 포함한다.
진핵생물 세포의 집단 내로의 공여자 벡터 및 CS에 대한 커팅 특이성을 갖는 유전자 편집 효소의 도입은 (a) 진핵생물 세포의 분획에 대한 사전-정의된 게놈 위치에서의 CS에서의 이중 가닥 파단, (b) CS에 이중 가닥 파단을 갖는 진핵생물 세포의 분획에 대한 상동성 지정 DNA 복구에 의한 LHA 및 RHA에 의해 플랭킹된 공여자 벡터 영역의 통합, (c) LP 세포의 분획에 대한 공여자 벡터의 오프-타겟 게놈 통합 (사전-정의된 게놈 영역의 외부에서)을 발생시킨다.
사전-정의된 게놈 위치에서의 통합은 SM1에 대한 활성 발현 카세트의 형성을 발생시킨다 (도 13b, 패널 (ii) 참조). 통합 사건은 프로모터 P1 및 SM1 사이에 완전히 기능적 인트론을 추가로 생성하기 때문에, SM1에 대한 성숙 mRNA는 RHA를 포함하지 않는다. 추가로, LP에서의 통합 후, SM1 및 SM2 둘 다는 상기 제2 DNA 효소에 대한 2개의 인식 부위에 의해 플랭킹된다.
오프-타겟 사건에 의한 통합 (도 13b, 패널 (iii) 참조)은 전형적으로 SM1의 활성화를 초래하지 않지만, 상기 제2 DNA 효소에 대한 2개의 인식 부위에 의해 플랭킹되지 않은 활성 SM2를 통합한다.
사전-정의된 게놈 위치에서 통합을 겪은 진핵생물 세포는 통합 사건을 갖지 않는 세포 (도 13b, 패널 (i) 참조) 및 단지 SM1의 활성을 통한 오프-타겟 통합 사건을 겪은 세포와는 상이하다. 따라서, SM1의 활성은 사전-정의된 게놈 위치에서 통합을 겪은 세포에 대해 선택하는데 사용될 수 있다.
사전-정의된 게놈 위치에서의 통합에 추가로 오프-타겟 통합 사건을 겪은 세포를 제거하기 위해, E1 및 E2를 재조합할 수 있는 리콤비나제 활성 (제2 DNA 효소)은 SM1 활성에 대해 선택된 세포 내에 도입된다. LP에서의 통합에 대해, 이는 SM1 및 SM2 둘 다 및 따라서 그들의 상응하는 활성의 삭제를 발생시킨다. 오프-타겟 통합 사건에 대해 이 반응은 일어날 수 없고, SM2 활성은 잔류한다. 그 결과, 단지 사전-정의된 게놈 위치에서 목적하는 표적화된 통합 사건을 겪은 세포는 SM2 활성의 부재를 통해 다수의 통합 사건을 겪은 세포로부터 선택될 수 있다.
최종적으로 선택된 세포에 대한 사전-정의된 게놈 위치 (도 13c 참조)는 SM2에 대한 발현 카세트도, SM1에 대한 활성화된 발현 카세트, 또는 E1 및 E2 (E)의 재조합을 통해 생성된 서열을 제외하고는 공여자 벡터로부터의 임의의 잔류 서열도 함유하지 않는다.
유전자 편집 효소는 (i) 아연 핑거 뉴클레아제 (ZFN); 호밍 엔도 뉴클레아제, 예컨대 메가뉴클레아제; (iii) TALEN 또는 (iv) DNA 또는 RNA 가이드된 뉴클레아제, 예컨대 CRISPR/Cas9의 군으로부터 선택될 수 있지만, 이는 이에 제한되지는 않는다.
상기 제2 DNA 효소는 리콤비나제 활성을 가지며, (i) 세린 리콤비나제 또는 (ii) 티로신 리콤비나제의 군으로부터 선택될 수 있다.
E1 및 E2는 (i) Cre 리콤비나제와 함께 사용하기 위해 E1=E2= loxP 또는 그의 돌연변이된 변이체, (ii) Dre 리콤비나제와 함께 사용하기 위해 E1=E2= rox 또는 그의 돌연변이된 변이체 또는 (iii) FLP 리콤비나제와 함께 사용하기 위해 E1=E2= FRT 또는 그의 돌연변이된 변이체에 의해 예시된 바와 같이 서열에 있어서 동일할 수 있다.
E1 및 E2는 (i) PhiC31 리콤비나제와 함께 사용하기 위해 E1=attP 및 E2=attB 또는 (ii) E1=Bxb1 attP 및 E2=Bxb1 attB에 의해 예시된 바와 같이 상이한 서열을 가질 수 있다.
따라서, 상기 제1 DNA 효소가 유전자 편집 효소, 예컨대 유전자 편집 뉴클레아제인 방법이 본원에서 제공된다. 그에 의해 (a) I1이 상기 유전자 편집 뉴클레아제에 대한 커팅 부위 및 2개의 서열 영역 LHA1 및 RHA1을 포함하고; (b) I2가 LHA1 및 LHA2에 대해 상동인 2개의 서열 영역 LHA2 및 RHA2를 포함하고; (c) I1 및 I2가 상기 제1 DNA 효소의 존재 하에서 재조합이 가능한 것인 방법이 본원에서 제공된다.
이전에 언급된 바와 같이, 상기 유전자 편집 효소가 (i) 아연 핑거 뉴클레아제 (ZFN); (ii) 호밍 엔도 뉴클레아제, 예컨대 메가뉴클레아제; (iii) TALEN 및 (iv) DNA 또는 RNA 가이드된 뉴클레아제, 예컨대 CRISPR/Cas 9로 이루어진 군으로부터 선택되는 것인 방법이 제공되지만, 본 개시내용은 이에 제한되지는 않는다.
핵산 서열 E1 및 E2는 동일한 리콤비나제 인식 부위, 예컨대 각각 loxP, rox 또는 FRT 또는 그의 변이체일 수 있으며, 단, E1 및 E2는 I1 및 I2와는 상이하다.
상기 제2 DNA 효소는 Cre 리콤비나제, Dre 리콤비나제 및 FLP 리콤비나제로 이루어진 군으로부터 선택될 수 있으며, 단, 제1 DNA 효소는 Cre 리콤비나제, Dre 리콤비나제 또는 FLP 리콤비나제가 아니다.
본원에서 제공된 방법에서, 프로모터 핵산 서열 P1은 상기 사전-정의된 게놈 위치에서 통합되는 경우에 스플릿 인트론의 5'-부분에 기능적으로 융합될 수 있다. 이는 본원에서 이전에 논의된 도 16에 예시된다. 사전-정의된 게놈 위치에서의 프로모터 P1 및 I1 (또는 그의 변이체) 사이의 스플릿 인트론의 도입은 폴리머라제로부터 프로모터로의 차단으로 인해 일어날 수 있는 입체 장해를 최소화하는 "스페이서"를 제공한다. 이 스페이서의 존재는 실험 섹션, 실시예 1에 제시된 바와 같이 제1 선택 마커 (SM1)의 개선된 발현을 제공한다.
따라서, 사전-정의된 게놈 위치가 상기 제1 리콤비나제 효소에 대한 상기 제1 인식 부위 및 3'-5' 방향성을 갖는 상기 프로모터 P1 사이에 3'-5' 방향성을 갖는 인트론의 5'-부분 및 3'-5' 방향성을 갖는 기능적 서열 영역 F1을 추가로 포함하며, 공여자 벡터가 3'-5' 방향성을 갖는 상기 제1 선택 마커 SM1 및 상기 제1 리콤비나제 효소에 대한 상기 제2 인식 부위 사이에 위치한 서열 영역을 추가로 포함하는 것인 방법이 본원에서 제공된다. 상기 서열 영역은 5'-3' 서열 순서로 (a) 3'-5' 방향성을 갖는 기능적 서열 영역 F3 및 (b) 스플라이스 수용자 부위의 하류에 기능적 서열 영역 F2를 추가로 포함하는 3'-5' 방향성을 갖는 인트론의 3'-부분을 포함한다.
또한, 본원에 이전에 개시된 바와 같이 상기 삭제된 핵산 서열이 하기를 포함하는 것인 본원의 방법이 제공된다:
(a) 제1 선택 마커를 코딩하는 핵산 서열;
(b) 프로모터 핵산 서열 P1; 및/또는
(c) 제2 선택 마커를 코딩하는 발현 카세트.
삭제된 핵산 서열의 상기 언급된 디자인은 제2 선택 마커 (SM2)의 발현에 기반한 사전-정의된 게놈 위치와는 다른 위치에서 공여자 벡터를 무작위로 통합하지 않은 세포의 선택을 허용한다. 이는 이러한 디자인을 사용하여, SM2의 발현이 단지 사전-정의된 게놈 위치의 외부에서 공여자 벡터를 통합한 세포에 대한 상기 제2 DNA 효소의 작용 후 양성일 것임을 의미한다. 따라서, 선택의 제2 라운드는 사전-정의된 게놈 위치의 외부에서 공여자 벡터를 통합한 세포를 제거하는 SM2의 발현에 기반한 음성 선택 단계를 사용할 수 있다. 제2 선택 마커를 코딩하는 발현 카세트의 제거는 또한 방법에 대한 개선인데, 이는 그것이 대신 관심의 단백질을 생산하는데 사용될 수 있는 세포에 대한 에너지를 절약할 것이기 때문이다.
제1 선택 마커는 본원의 다른 곳에 언급된 것에 추가로, (i) 형광 단백질 및 (ii) 이종 세포 표면 마커의 군으로부터 선택될 수 있다. 선택 마커로서 형광 단백질 또는 세포 표면 마커의 사용은 특정 이점을 제공하는데, 이는 선택이 제1 선택 마커의 농도가 특정 한계 초과로 증가하자 마자 신속하고 직접적인 단리 방법을 사용하여 (즉, FACS 또는 MACS에 기반하여) 수행될 수 있기 때문이다 (FACS에서 배경 초과의 형광의 검출을 허용하고, MACS에서 자기 비드에의 효율적인 결합을 허용함). 이는 활성 선택 마커를 결여한 세포를 서서히 과-성장시키는 활성화된 선택 마커를 갖는 세포에 기반한 연장되고 간접적인 단리 전략을 필요로 하는 대사 효소 또는 항생제 저항성 유전자에 기반한 선택 마커와 대조적이다.
제1 DNA 효소는 플라스미드, mRNA 또는 정제된 단백질의 형태로 제공될 수 있으며, 임의적으로 여기서 상기 제1 DNA 효소는 상기 공여자 벡터에 의해 코딩되고 그로부터 발현될 수 있다. 제1 DNA 효소는 또한 본원에 개시된 방법의 단계 i)의 세포의 사전-정의된 게놈 위치에 존재하는 상기 제1 DNA 효소를 코딩하는 발현 카세트로부터 발현될 수 있다.
본원에서 이전에 언급된 바와 같이, 단계 ii)의 공여자 벡터는 제2 DNA 효소를 코딩하는 발현 카세트를 추가로 포함할 수 있으며, 상기 제2 DNA 효소의 발현은 상기 공여자 벡터가 본원에 개시된 방법에서 단계 i)의 세포의 사전-정의된 게놈 위치 내로 통합된 경우에 활성화된다.
제2 DNA 효소는 또한 플라스미드, mRNA 또는 정제된 단백질의 형태로 제공될 수 있다.
본원에서 제시된 방법에 사용하기 위한 진핵생물 세포는 효모 세포, 필라멘트성 진균 세포, 식물 세포, 곤충 세포 또는 포유동물 세포로 이루어진 군으로부터 선택될 수 있다. 포유동물 세포는 인간, 원숭이, 설치류 또는 마우스 세포일 수 있지만, 이에 제한되지는 않는다. 진핵생물 세포는 본원에서 이전에 언급된 바와 같은 단리된 진핵생물 세포이다. 단리된 세포는 그의 자연 환경으로부터 단리되거나 제거된 세포이다.
본원에서 제시된 방법에 사용하기 위한 진핵생물 세포는 구체적으로 생물반응기에서의 재조합 단백질의 생산에 대한 적합성에 기반하여 선택될 수 있다. 적합한 세포는 CHO 또는 HEK 세포주의 군으로부터 선택될 수 있다.
본원에서 제시된 방법에 사용하기 위한 진핵생물 세포는 구체적으로 포유동물 종, 예컨대 인간에 존재하는 세포 유형과의 유사성에 기반하여 선택될 수 있다.
본원에서 제시된 방법에 사용하기 위한 진핵생물 세포는 현탁 배양에서 성장할 수 있는 세포주의 군으로부터 선택될 수 있다.
본원에 개시된 본 발명의 일부를 형성하는 일반적 SDI 시스템의 일부 핵심적인 통상적인 이론적 이익은 하기와 같다:
(1) 단리된 세포가 사전-정의된 게놈 위치에서 및 단지 사전-정의된 게놈 위치에서 통합된 통합 카세트 (핵산 서열 변이체를 포함함)의 단일 카피를 갖는 것의 목적하는 결과와는 상이할 가능성을 최소화하는 선택 단계를 가능하게 하는 것. 핵산 서열 변이체의 최적화, 예컨대 발현 카세트 디자인의 라이브러리를 포함하는 공여자 벡터 혼합물의 형질감염에 기반한 발현 카세트 디자인을 위해 이는 중요한 특색인데, 이는 목적하는 특징을 갖는 핵산 서열 변이체의 적절한 선택을 보장하기 위해 세포 표현형 및 단일 상응하는 유전자 카세트 디자인 사이에 일대일 상관관계가 있을 필요가 있기 때문이다.
(2) 단지 세포주의 생산성에 기여하는 서열이 보유되는 선택안을 가능하게 하는 것. 세포 자원은 선택 마커 단백질의 발현 시 낭비되지 않고, 조사 하의 핵산 서열 변이체 및 선택 마커 카세트 사이의 예상치 않은 간섭의 위험이 회피된다. 즉, GOI의 장기 발현 안정성에 대한 잠재적인 부정적 영향을 갖는 박테리아 기원의 서열의 존재가 회피되어, 방법의 신뢰성을 증가시킬 수 있다.
(3) 선택 마커가 사전-정의된 게놈 위치 서열의 일부가 아니기 때문에, 선택 마커의 선택에 있어서의 유연성이 있다. 최적 선택 마커는 적용에 기반하여 선택될 수 있다.
(4) 목적하는 통합 사건은 높은 특이성으로 사전-정의된 게놈 위치에서의 통합을 갖는 세포의 양성 선택을 허용하는 제1 선택 마커의 발현을 활성화시킨다. 선택 마커, 예컨대 형광 단백질 또는 세포 표면 마커를 사용하여, 이는 형질감염 및 양성 구성요소의 선택 (예를 들어 FACS 또는 MACS를 사용하여) 사이의 매우 짧은 기간을 가능하게 한다. 결과를 얻는데 2 내지 3일이면 가능할 것이다. 이는 방법을 수행하는데 필요한 시간을 단축시킨다. 또한, 비목적하는 통합 사건을 겪은 또는 통합이 없는 세포로부터의 목적하는 위치에서 통합을 겪은 세포의 조기 단리는 이것이 목적하는 세포가 비목적하는 세포에 의해 과성장할 (및 가능하게는 평가로부터 소실될) 위험을 최소화하기 때문에 추가의 이익을 가질 수 있다. 따라서 방법의 효율 및 성능은 이 특색을 결여한 방법에 비해 개선될 수 있다.
단일 매칭 리콤비나제 인식 서열 쌍 (즉, attP/attB)과 조합으로 제1 DNA 효소로서 세린 리콤비나제, 예컨대 PhiC31 또는 Bxb1을 이용하는 방법의 바람직한 실행은 우수한 통합 효율을 위한 잠재성을 추가로 갖는다. 구체적으로 스플릿 인트론의 5'-부분에 기능적으로 융합된 상기 프로모터 P1과 조합으로 그러하다. 그들의 상응하는 attP/attB 쌍의 PhiC31 또는 Bxb1 매개 재조합은 비가역적 반응이고, 따라서 이론적으로 통합은 단지 형질감염 효율 및 플라스미드 안정성에 의해 제한될 것이다. 이는 경쟁하는 비-생산적 반응 경로가 존재할 수 있고, 카세트 교환 반응에 대해, 효율이 통합 카세트의 크기와 음성으로 상관될 것인 Cre 기반 통합 또는 CRISPR/Cas9 기반 통합과 대조적이다. 통합 효율은 중요한 성능 파라미터인데, 이는 그것이 방법에 의해 동시에 평가될 수 있는 핵산 서열 변이체의 수에 직접적으로 영향을 미치기 때문이다. 방법의 한 바람직한 실행에 대한 통합 효율은 실험 섹션, 실시예 1에서 예시된다.
따라서, 본 개시내용은 단리된 진핵생물 숙주 세포의 집단 내로의 다수의 핵산 서열 변이체 (예를 들어 관심의 단백질을 코딩함)의 효율적이고 선택적인 표적화된 통합의 신규하고 개선된 방식을 제공한다. 핵산 서열 변이체를 포함하는 공여자 벡터의 단일 카피를 각각 선택적으로 통합한 단리된 숙주 세포의 집단은 재조합 단백질 생산 또는 단백질 기능에 대한 영향을 갖는 핵산 서열 변이체의 최적화를 위한 우수한 시스템을 제시할 것이고, 많은 상이한 적용 영역에서 용도를 발견할 것이다.
다음으로, 사전-정의된 게놈 위치에서 핵산 서열 변이체를 통합한 단리된 진핵생물 세포의 "정의된 표현형"에 기반한 선택 단계를 수행하는 방식이 연관된 적용과 함께 개요될 것이다. 따라서, 다음으로 본원에서 용어 "정의된 표현형"으로 의도되는 것이 기재된다. 이들 기재는 단지 예로서 의도되며, 본 발명은 이에 제한되지는 않는다.
일반적으로 표현형적 선택 단계는 (현재의 또는 장래의 분석적 기술을 사용하여) 측정될 수 있는 세포의 임의의 특징 및 선택을 위한 세포를 특이적으로 표적화하는데 사용되는 상응하는 측정 결과에 기반할 수 있다. 선택을 위해 표적화된 세포의 측정 및 후속 단리는 (i) 단일 세포 수준에서 측정 및 조작이 가능한 기술, 예컨대 FACS를 사용하여 또는 (ii) 비목적하는 구획을 버림으로써 벌크한 분석적 기술 및 후속 선택을 사용한 측정을 허용하는 별개의 구획에서의 단일 세포를 먼저 단리함으로써 수행될 수 있다.
대안적으로 표현형적 선택 단계는 (i) 정의된 성장 조건 하에서의 차등적 성장 또는 (ii) 즉, MACS를 사용하여 결합된 또는 비-결합된 세포의 후속 단리를 갖는 고체 상, 예컨대 자기 비드에의 세포의 차등적 결합 중 어느 하나에 기반하여 표현형에 대해 간접적으로 선택하거나 풍부화하는데 이용될 수 있는 세포의 임의의 특징에 기반할 수 있다.
각각의 개별적 세포는 단일 핵산 서열 변이체를 갖도록 주의 깊게 선택되었기 때문에, 1개 또는 여러 개의 표현형적 특징에 기반한 선택은 특이적 서열 변이체가 상기 특징(들)에 대한 음성, 중성 또는 양성 영향을 갖는지 여부를 탐색할 것이다. 어느 경우에도, 특이적 핵산 서열 변이체는 상기 특이적 변이체를 갖는 세포의 측정된 세포적 특징이 정의된 통계적 분포를 나타닐 것이라는 의미에서 정의된 표현형에 상응한다. 정의된 값 초과의 측정된 특징을 갖는 세포를 선택하는 것은 상기 특징에 대한 영향을 갖는 핵산 서열 변이체의 선택 또는 풍부화를 발생시킨다. 핵산 서열 변이체는 정의된 표현형적 특징의 임의의 정의된 측정 간격을 사용하기 위해 선택될/풍부화될 수 있다.
따라서, 본 발명에 따른 서열 최적화된 핵산 서열은 선택된 표현형적 특징의 정의된 측정 간격에 상응하는 서열로서 이해될 것이다. 정의된 세포 표현형의 단리를 통해 선택되고 단리된 최적화된 핵산 서열은 사전-정의된 게놈 위치에서 게놈 DNA를 시퀀싱함으로써 확인될 수 있다. 게놈 DNA가 클로닝된 세포 (단일 세포로부터 기원한 집단)로부터 추출되는 경우, 표준 생거(Sanger) 시퀀싱이 사용될 수 있다. 게놈 DNA가 세포의 다양한 집단으로부터 추출되는 경우, 평행 시퀀싱 방법 [20]이 사용될 수 있다.
방법의 한 가지 적용은 정의된 아미노산 서열을 갖는 재조합 단백질의 발현에 대한 그들의 영향에 대해 공여자 벡터에서의 핵산 서열 변이체를 탐색하는 것이다. 이는 재조합 단백질, 예컨대 치료 단백질, 진단 시험에서 표준물 또는 시약으로서 사용되는 단백질 또는 연구 적용에서 시약으로서 사용되는 단백질의 상업적 생산을 위한 가치를 갖는다. 이전에 용리된 바와 같이, 많은 상이한 기능적 서열 구성요소는 발현의 상이한 단계에서 수득가능한 단백질 수준에 영향을 미치는 것으로 제시되었다 [14-19].
관심의 유전자 (GOI)의 전사에 영향을 미치는 서열은 프로모터 (다른 프로모터 구성요소에 대한 그들의 간격을 포함하는 시작 전사 부위 서열, 근위 프로모터 서열 및 전사 인핸서 서열을 포함하는 코어 프로모터 서열)의 선택 및 게놈에서 국소적 DNA 구조에 영향을 미치는 서열 (염색질 변형 요소, 염색질 절연제, 매트릭스/스캐폴드 부착 영역 등)의 존재 (또는 부재)를 포함한다. 전사의 수준에 의해 영향을 받는 것 외에도, 시토졸 mRNA 수준은 또한 핵 수송의 효율 (인트론 서열의 존재, 위치 및 선택에 의해 영향을 받음) 및 그들의 시토졸 분해 속도 (3'-UTR의 선택에 의해 영향을 받음)에 의해 영향을 받는다. 번역 개시는 5'-UTR 및 3'-UTR 서열의 선택 및 신호 펩티드 아미노산 서열의 선택에 의한 분비에 의해 영향을 받는다. 이들 비-코딩 서열 요소 외에도, 관심의 단백질 (POI)을 코딩하는데 사용되는 핵산 서열 (동의어적 코딩 서열 선택)은 공동-번역 폴딩으로 지칭되는 프로세스를 통한 폴리펩티드 쇄의 폴딩을 포함하는 발현의 많은 단계에 대한 유의한 영향을 갖는 것으로 제시되었다 [19].
다중쇄 단백질, 예컨대 항체에 대해, 상이한 쇄의 비는 기능적 단백질의 관찰된 분비에 중요하다. 염기 쌍 수준으로 하향하는 핵산 서열의 제어를 허용하는 핵산 합성 기술의 진보로 핵산 서열 디자인 공간은 광대하다. 따라서, 개선된 발현, 및 따라서 개선된 제조 경제학을 위한 큰 기회는 주어진 재조합 단백질에 대한 공여자 벡터에 존재하는 핵산 서열 변이체의 최적화에 의해 얻어질 수 있다.
이 적용에서, 상기 정의된 표현형은 예를 들어 특정된 범위 내에 해당하는 관심의 단백질 (즉, 재조합 단백질)의 발현의 측정에 의해 정의될 수 있다. 표현형적 선택 단계를 수행하는 한 가지 방식은 개시된 방법의 SDI 부분에 의해 생성된 세포의 집단으로부터 (예를 들어 FACS 또는 제한된 희석을 사용하여) 단일 세포 클로닝을 수행하고, 정의된 배양의 기간 후에 벌크 역가를 측정하는 것이다. 특정된 범위 내의 역가를 제공하는 클론이 선택되며, 그에 의해 상응하는 최적화된 핵산 서열 변이체를 선택하고 단리한다. 이 실행에서 조사될 수 있는 핵산 서열 변이체의 다양성은 평행하여 배양되고 평가될 수 있는 클론의 수에 의해 제한된다. 전통적인 평행 배양 형식, 예컨대 미세 역가 플레이트에서의 정적 배양을 사용하여, 클론의 수는 실제적으로 대략 10 000 (100개의 96-웰 플레이트)에 제한된다. 생물학적 및 기술적 변이가 커버되는 것을 보장하기 위해, 이는 수백의 다양성을 갖는 핵산 서열 변이체 라이브러리가 효율적으로 조사될 수 있음을 의미한다. 라이브러리 다양성은 신규한 평행 배양 및 평가 기술, 예컨대 점적 조작 기술 [21] 또는 다른 마이크로시스템-기반 기술 [22, 23]을 사용함으로써 약간 상승될 수 있다.
그러나, 접근가능한 라이브러리 다양성을 유의하게 증가시키기 위해, 단일 세포 측정이 가능한 기술 (예컨대 FACS)이 바람직하다. FACS에 의한 관심의 단백질의 발현의 평가를 가능하게 하기 위해, 관심의 단백질은 그의 폴리펩티드 쇄 중 하나 상의 c- 또는 n-말단에서 형광 단백질에 유전적으로 융합될 수 있으며, 도 26 및 도 27a를 참조한다. 기술적 및 생물학적 노이즈에 대해 정규화하기 위해, 제2 형광 단백질을 코딩하는 추가적 유전자 (상기 복수의 공여자 벡터에서의 모든 공여자 벡터 변이체에 대해 일정하게 유지되는 상응하는 유전자 카세트를 가짐) 및 2개의 형광 단백질 방출의 비에 기반한 선택이 이용될 수 있으며, 도 26b를 참조한다. 다수의 폴리펩티드를 포함하는 관심의 단백질, 예컨대 바이러스 입자 또는 이중-특이적 항체에 대해, 2개의 상이한 폴리펩티드 쇄에의 2개의 상이한 형광 단백질의 유전적 융합은 가까이 근접하여 어셈블리되는 경우에 2개의 융합된 폴리펩티드 사이의 FRET 활성화에 기반한 어셈블리 특이적 발현 신호를 가능하게 하도록 실행될 수 있다 (도 27b 참조). FACS 분석으로 처리될 수 있는 POI 발현의 측정을 생성하기 위한 다른 수단은 세포 표면에서의 POI의 결박, 이어서 FACS 분류를 실행하기 전에 형광 검출 시약에의 POI의 결합을 보장하는 것이며, 도 28을 참조한다. 이는 막 앵커 도메인을 갖는 POI의 융합을 통해 달성될 수 있다 [13, 30]. 임의적으로, POI 상의 막 앵커 도메인의 존재는 즉, 누출성 번역 정지 코돈의 사용을 통해 제어될 수 있다 [24]. 정의된 범위 내의 형광 신호를 제공하는 세포는 하나 또는 임의적으로 다수의 연속적 FACS 분류 단계에서 (임의적으로 상이한 형광 범위를 사용하여) 단리될 수 있다. 수득가능한 다양성을 증가시키는 것 외에도, FACS와 같은 방법은 또한 세포가 평가 및 분류 전에 대규모 생산에 관한 배양 형식 및 조건을 사용하여 배양되는 것을 가능하게 한다.
정의된 표현형은 또한 다른 세포적 특징, 예컨대 프리-아폽토시스 스트레스 신호화 또는 특이적 스트레스 신호화 상태, 예컨대 ER 스트레스, 아미노산 고갈 또는 저산소증의 측정에 결합될 수 있다.
상이한 세포적 특징의 단일-세포 판독은 잠재적으로 본 개시내용에 사용된 단리된 진핵생물 숙주 세포 내로의 조작된 및 유전자 코딩된 센싱 및 리포팅 회로의 도입을 통해 가능하게 될 수 있다. 예를 들어 [25]를 참조한다.
정의된 표현형에 상응하는 서열 변이체를 확인하는 개시된 방법을 사용하여, 핵산 서열 변이체는 주어진 관심의 재조합 단백질의 발현을 개선시키기 위해 직접적으로 최적화될 수 있다. 방법에 의해 수득되는 상이한 핵산 서열 변이체의 성능에 대한 데이터는 또한 다른 관련된 또는 비-관련된 재조합 단백질에 대한 공여자 벡터 디자인을 선택하는데 사용될 수 있는 디자인 규칙을 추론하는데 사용될 수 있다. 이러한 디자인 규칙은 예를 들어 기계 학습 또는 다른 인공 지능 기술에 기반할 수 있다. 도 1에 개요된 바와 같이, 방법은 또한 하류 적용, 예컨대 관심의 단백질의 생산을 위한 세포를 직접적으로 단리하는데 사용될 수 있다. 마지막으로, 방법은 직접적 하류 적용, 예컨대 세포주 개발 (CLD)을 위한 공여자 벡터에서의 혼입을 위한 최적화된 핵산 서열 변이체를 단리하는데 이용될 수 있다.
방법의 또 다른 적용은 상이한 재조합 단백질 (즉, 아미노산 서열의 차이)을 주어진 유형의 진핵생물 세포에서의 그들의 발현에 대해 평가하는 것이다. 이 적용을 위한 방법의 실행은 공여자 벡터 서열의 최적화를 위한 이전에 기재된 임의의 예시 디자인을 이용할 수 있다. 상이한 아미노산 서열의 평가는 초기 치료 단백질 후보를 최종 의도된 생산 숙주에서 그들의 제조성에 대해 스크리닝하거나, 그의 기능적 표면의 외부의 위치에서 아미노산 서열 다양성의 도입을 통해 특이적 치료 단백질 후보의 발현, 제조성 또는 개발성을 개선시키기 위해 수행될 수 있다 [27]. 방법은 또한 표적 결합에 기반한 새로운 치료 단백질 후보의 발견 (즉, 나이브 항체 라이브러리를 사용한 항체 발견)을 위한 나이브 라이브러리의 기능성을 개선시키는데 사용될 수 있다. 상이한 스캐폴드 디자인의 다양성은 새로운 라이브러리 디자인에 사용하기 위한 스캐폴드를 선택하고, 주어진 스캐폴드에 대한 라이브러리 디자인 및 구축을 위한 디자인 규칙을 추론하는 둘 다를 위해 발현에 대한 그들의 영향에 대해 스크리닝될 수 있다.
POI의 아미노산 서열 (잠재적 신호 펩티드를 포함함), POI를 코딩하는데 사용되는 핵산 서열 (즉, GOI) 및 공여자 벡터에 사용되는 비-코딩 서열 외에도, 발현은 또한 단리된 진핵생물 세포에 존재하는 세포 기구에 의해 영향을 받는다. 개별적 세포 사이의 세포 기구의 자연적 다양성은 전형적으로 존재하며, 주어진 공여자 벡터를 사용하여 도입된 주어진 단백질에 대한 가장 양호한 가능한 생산 숙주를 발견하는 클론 스크리닝 작전에 의해 이용된다.
그러나, 자연적 다양성을 넘어서기 위해, 세포주 조작 접근법이 이용될 수 있다 [26]. 과제는 세포의 복잡성 및 현재의 지식이 특이적 조작 전략의 효과가 종종 단백질 및 심지어 클론 특이적일 수 있음을 암시하는 것에 있다.
따라서, 본원에 개시된 방법의 또한 또 다른 적용은 단백질 및 클론 특이적 세포 조작을 수행하는 개선된 수단을 가능하게 한다. 세포 조작은 예를 들어 상이한 이펙터 유전자, 예컨대 (i) 천연 발생 단백질을 코딩하는 발현 카세트 (과발현을 위해) 또는 사용된 세포에 존재하지 않는 단백질 (새로운 기능성의 도입)의 도입, (2) 내인성 유전자 발현의 제어를 위한 천연 또는 조작된 전사 인자를 코딩하는 유전자의 도입 또는 (3) 전반적 또는 국소적 수준에서 세포 경로의 조작을 위한 천연 또는 조작된 조절 RNA, 예컨대 miRNA 또는 lncRNA를 코딩하는 유전자의 도입에 기반할 수 있다.
생산된 클론 및 단백질에 관련된 장애물의 지식에 기반하여, 상이한 핵산 구축물 변이체 (각각 1개 또는 여러 개의 이펙터 유전자를 함유함)의 라이브러리는 공여자 벡터의 라이브러리로서 디자인되고 구축될 수 있다. 주어진 관심의 재조합 단백질을 이미 안정하게 발현하고 본 발명에 따른 사전-정의된 게놈 위치를 포함하는 단리된 진핵생물 세포 (실험 섹션에서 실시예 3 참조)는 세포의 집단을 단리하는데 사용되며, 여기서 각각의 세포는 사전-정의된 게놈 위치에서 이펙터 유전자(들)의 하나의 정의된 세트를 포함하는 하나의 핵산 구축물 변이체를 운반한다. 표현형적 선택 단계 및 서열 확인은 이전에 기재된 바와 같이 동일한 기본적 기술을 사용하여 수행될 수 있다.
상이한 적용에서 방법은 목적하는 기능성을 갖는 재조합 단백질 서열을 선택하는데 사용될 수 있다. 전형적인 예는 특이적 표적 분자 또는 구조 (즉, 예컨대 항체 발견에서)에 대한 그들의 결합 특징 (즉, 기능)에 대한 아미노산 서열 변이체 (핵산 서열 변이체에 의해 코딩됨)의 라이브러리의 스크리닝이다.
전형적인 라이브러리는 종종 단백질 스캐폴드로 지칭되는 다르게는 보존된 단백질 서열의 핵심적 위치에서의 서열 다양성의 도입에 기반하여 구축된다. 단백질 스캐폴드의 예는 IgG1 스캐폴드, 나노바디 스캐폴드 및 Z-도메인 스캐폴드를 포함한다 [27-29]. 단일 세포로부터 발현된 변이체의 스크리닝을 가능하게 하기 위해, 단백질 스캐폴드 변이체는 막 앵커 도메인에 유전적으로 융합되어 포유동물 제시로 언급되는 방법에 의한 그들의 표면 상의 제시 및 스크리닝을 가능하게 한다 [13, 30].
본 발명은 이전에 논의된 개시된 SDI 방법의 특색에 기반하여 포유동물 제시를 수행하는 개선된 수단을 제공한다. 방법의 제1 부분에서, 본 개시내용의 복수의 공여자 벡터에 의해 포함된 아미노산 서열 변이체 (모두 막 앵커 도메인에 융합됨)의 라이브러리는 상기 사전-정의된 게놈 위치에서 및 단지 상기 사전-정의된 게놈 위치에서 상기 라이브러리로부터의 단일 아미노산 서열 변이체 (및 따라서 표면 상에 제시된 단일 아미노산 변이체)를 운반하는 세포에 대해 고도로 풍부화된 단리된 진핵생물 세포의 집단을 생성하는데 사용된다.
이 적용에서, 상기 정의된 표현형은 예를 들어 특정된 범위 내에 해당하는 표면 제시된 아미노산 변이체에의 상기 표적 구조의 결합의 측정에 의해 정의될 수 있다. 바람직한 실행에서 표적 구조 (예를 들어 단백질)는 형광단으로 표지되고, 그들의 표면 상에 아미노산 서열 변이체를 운반하는 단리된 진핵생물 세포의 집단과 함께 인큐베이션되며, 도 28을 참조한다. 세포의 인큐베이션 및 세척 후, FACS를 사용하여 형광에 의한 표적 결합에 대해 아미노산 서열 변이체를 기록한다. 특정된 범위 내의 형광 판독을 제공하는 세포가 단리된다. 전형적으로, 표지된 표적의 감소된 농도를 갖는 인큐베이션 후의 반복적 FACS 단리 단계는 높은 친화성 결합제에 대해 풍부화하는데 사용된다. 임의적으로, 표적 결합 신호는 세포 상에 제시된 아미노산 서열 변이체의 양에 의해 정규화될 수 있다. 이는 모든 제시된 아미노산 서열 변이체에 존재하는 보존된 에피토프 (즉, IgG1 스캐폴드의 FC 부분)에 결합하는 형광 표지된 시약 (표적 형광과 비-중첩하는 형광을 가짐)과의 인큐베이션에 의해 달성될 수 있으며, 도 28을 참조한다. 또 다른 바람직한 실행에서, 표적 (즉, 단백질)은 시토졸에서 형광 단백질을 발현하는 진핵생물 세포의 표면 상에 제시된다.
목적하는 기능성을 갖는 재조합 단백질 서열을 선택하는 방법의 적용의 또 다른 예는 치료 단백질의 생성물 품질의 최적화이다. 여기서, 선택은 재조합 단백질의 글리코실화 프로파일 및 형태 (단백질 폴드)와 같은 특징에 기반한다. 세포의 표면 상의 재조합 단백질 변이체의 제시에 의해, 글리코실화 및 형태는 형광 표지된 시약, 예컨대 글리코형 특이적 친화성 결합제 및/또는 형태 민감성 친화성 결합제 (예컨대 항체에 대한 표적)와의 인큐베이션, 이어서 FACS에 의한 측정 및 단리에 의해 평가될 수 있다. 임의적으로, 시약 결합 신호는 세포 상에 제시된 재조합 단백질 변이체의 양에 의해 정규화될 수 있다. 도 28을 참조한다.
목적하는 기능을 갖는 재조합 단백질을 선택하는 방법의 적용의 다른 예는 (i) FACS에 의한 목적하는 변이체의 직접적 단리를 사용한 형광 단백질의 발견 또는 최적화, (ii) 효소 활성이 표현형의 검출가능한 차이를 암시하는 효소, 예컨대 항생제 저항성을 제공하는 효소의 발견 또는 최적화, (iii) 본 발명에 따른 상기 사전-정의된 게놈 위치 및 제2 사전-정의된 게놈 위치에서 및 단지 상기 사전-정의된 게놈 위치 및 제2 사전-정의된 게놈 위치에서 리콤비나제 변이체를 운반하는 단리된 진핵생물 세포의 집단을 공여자 벡터와 접촉시키고, 활성화된 상기 제1 선택 마커를 갖는 세포의 양성 FACS 분류를 통해 양성 구성요소를 단리하는 것을 통한 사전-정의된 게놈 위치 내로의 공여자 벡터의 통합을 위한 리콤비나제의 발견 또는 최적화 또는 (iv) 측정가능한 세포 산출물을 생성하는 다수의 후보 회로 디자인의 통합, 이어서 목적하는 성능을 갖는 변이체의 선택에 의한 유전적으로 코딩된 신호화 및/또는 논리 회로의 개발 및 최적화 [25]를 포함한다.
따라서, 제1 측면에서, 본 발명은 복수의 핵산 서열 변이체로부터의 서열 최적화된 핵산 서열의 선택을 위한 방법으로서, 여기서 상기 서열 최적화된 핵산 서열은 정의된 표현형을 갖는 단리된 진핵생물 세포에 상응하며, 하기 단계를 포함하는 방법에 관한 것이다:
i) 단리된 진핵생물 세포의 집단을 제공하는 단계로서, 각각의 세포는 사전-정의된 게놈 위치를 포함하며, 여기서 사전-정의된 게놈 위치는 하기를 포함하는 것인 단계:
a. 제1 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 I1;
b. 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E1; 및
c. 프로모터 핵산 서열;
ii) 복수의 공여자 벡터를 제공하는 단계로서, 각각의 공여자 벡터는 하기를 포함하는 것인 단계:
a. 핵산 서열 I2;
b. 상기 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E2;
c. 제1 선택 마커를 코딩하는 핵산 서열; 및
d. 핵산 서열 변이체를 포함하는 핵산 서열 영역,
iii) 복수의 공여자 벡터를 제1 DNA 효소의 존재 하에서 세포의 집단과 접촉시키는 단계로서, 여기서 제1 DNA 효소의 존재는 공여자 벡터의 핵산 서열 I2 및 세포의 사전-정의된 게놈 위치에 존재하는 핵산 서열 I1 사이의 재조합을 가능하게 하는 것인 단계;
iv) 세포에서 제1 선택 마커의 발현을 검출함으로써 사전-정의된 게놈 위치에서 통합된 공여자 벡터를 갖는 세포를 선택하고 단리하는 단계로서, 여기서 제1 선택 마커의 발현은 사전-정의된 게놈 위치에서의 프로모터 핵산 서열에 의해 활성화되는 것인 단계; 및
v) 단계 iv)의 세포로부터 정의된 표현형을 갖는 세포를 선택하고 단리하며, 그에 의해 상기 핵산 서열 변이체로부터 서열 최적화된 핵산 서열을 선택하고 단리하는 단계로서, 상기 서열 최적화된 핵산 서열은 상기 정의된 표현형에 상응하는 것인 단계.
제1 선택 마커는 또한 본원에서 "SM1"로 약칭되고 지칭될 수 있다.
제2 선택 마커는 또한 본원에서 "SM2"로 약칭되고 지칭될 수 있다.
본원에서, 상기 서열 최적화된 핵산 서열은 "정의된 표현형"을 갖는 진핵생물 세포에 상응하며, "정의된 표현형"은 상기 최적화된 서열 변이체의 분석 및 선택 목적을 위해, 본원에서 이전에 정의되고 논의된 바와 같은 특정 물리적 특징 또는 거동을 갖는 세포가 선택될 것임을 의미한다. 또한 본원에서 이전에 정의된 바와 같이, 표현형적 선택 단계는 일반적으로 (현재의 또는 장래의 분석적 기술을 사용하여) 측정될 수 있는 세포의 임의의 특징 및 선택을 위한 세포를 특이적으로 표적화하는데 사용되는 상응하는 측정 결과에 기반할 수 있다.
상이한 핵산 변이체를 포함하는 복수의 공여자 벡터 및 숙주 세포의 집단의 사용은 1개 초과의 핵산 서열을 동일한 실행에서 평가하는 것이 가능함을 의미한다. 자연적으로, 모든 단일 세포가 상이한 핵산 서열 변이체를 통합하지는 않을 것이지만, 방법은 유의한 수의 핵산 서열 변이체를 동시에 평가하는 것을 가능하게 하는 폭넓은 다중화 접근법을 허용한다.
또한, 단계 ii)의 복수의 공여자 벡터의 각각이 하기를 추가로 포함하며:
e. 제2 선택 마커를 코딩하는 발현 카세트;
하기 단계를 추가로 포함하는 본원의 방법이 제공된다:
vi) 핵산 서열 E1 및 E2에 의해 플랭킹된 핵산 서열을 제2 DNA 효소의 존재 하에서 단계 iii)의 세포 또는 단계 iv) 또는 단계 v)에서 선택되고 단리된 세포로부터 삭제하는 단계로서, 여기서 제2 DNA 효소의 존재는 핵산 서열 E1 및 E2 사이의 재조합을 가능하게 하고, 여기서 세포에서의 핵산 서열 E1 및 E2에 의해 플랭킹되지 않은 제2 선택 마커를 코딩하는 발현 카세트의 존재는 상기 세포의 사전-정의된 게놈 위치의 외부의 게놈 위치에서의 공여자 벡터의 안정한 통합을 지시하는 것인 단계; 및
vii) 제2 선택 마커를 코딩하는 발현 카세트를 결여하는 단계 vi)으로부터의 세포를 선택하고 단리하는 단계.
또한, 단리된 세포의 사전-정의된 게놈 위치에 존재하는 서열 최적화된 핵산 서열의 시퀀싱에 의해 단계 iv), v) 또는 vii)의 단리된 세포로부터 핵산 서열 정보를 수득하는 것을 추가로 포함하는 본원의 방법이 제공된다. 사전-정의된 게놈 위치에 존재하는 최적화된 핵산 서열의 시퀀싱은 관련 기술분야의 통상의 기술자에게 널리 공지된 시퀀싱 방법에 의해 수행될 수 있다 [20]. 시퀀싱은 효율적으로 작동하지 않을 수 있는 그의 변이체와 비교하여 본 개시내용에 따른 SDI 시스템에서 가장 효율적으로 기능한 서열 변이체를 확인하기 위해 수행된다.
본원에서 이전에 언급된 바와 같이, 복수의 공여자 벡터의 핵산 서열 변이체는 프로모터의 변이체, 인트론의 변이체, 전사 조절 서열의 변이체, DNA 구조 조절 서열의 변이체, 5' 비번역된 영역의 변이체, 3' 비번역된 영역의 변이체, 내부 리보솜 진입 부위의 변이체, 관심의 유전자의 변이체, 신호 펩티드를 코딩하는 핵산 서열의 변이체 및/또는 이러한 변이체의 임의의 조합을 구성할 수 있다. 또한 특정 서열 카테고리의 복수의 핵산 서열 변이체 중에서 최적화된 서열 변이체를 확인하기 위해 본 개시내용의 맥락에서 평가될 수 있는 핵산 서열 변이체 카테고리의 다른 예를 상정할 수 있다.
또한, 단계 v)에서의 정의된 표현형을 갖는 세포의 선택에 의한 서열 최적화된 핵산 서열의 선택이 상기 세포의 하기 표현형적 특징 중 하나 이상에 기반한 선택을 포함하는 것인 방법이 제공된다:
(i) 상기 세포에서의 내인성 생체분자의 존재 또는 발현 수준;
(ii) 상기 세포에 의한 관심의 재조합 단백질의 발현 수준;
(iii) 상기 세포의 성장 속도; 및/또는
(iv) 상기 세포에서의 상기 핵산 서열 영역에 의해 코딩되는 관심의 재조합 단백질의 기능성.
상기 관심의 재조합 단백질은 재조합 융합 단백질, 예컨대 상기 세포 표면에서의 국재화를 위한 막 앵커 도메인에 융합된 단백질이고/거나, 형광 단백질 또는 형광 단백질 도메인에 융합된 단백질이다. 본원에서, 상기 내인성 생체분자는 단백질, mRNA, miRNA (마이크로 RNA), lncRNA (긴 비-코딩 RNA) 또는 대사물을 구성할 수 있으나, 이에 제한되지는 않는다.
본원에서 이전에 언급된 바와 같이, 본원에서 제시된 방법의 단계 v)에서의 정의된 표현형을 갖는 세포의 선택에 의한 서열 최적화된 핵산 서열의 선택은 관심의 재조합 단백질의 기능성에 기반한 선택을 포함할 수 있다. 관심의 재조합 단백질의 상기 기능성은, 상기 세포의 세포 표면에서 국재화되고 발현되는 경우에 상기 관심의 재조합 단백질, 및 표적 구조, 예컨대 소분자, DNA 분자, RNA 분자, 단백질, 단백질 복합체, 예컨대 바이러스 입자, 엑소좀 또는 세포 사이의 상호작용에 기반하여 측정되고 결정될 수 있으며, 임의적으로 여기서 상기 표적 구조는 형광 모이어티로 태그부착된다. 본 발명에 따른 방법의 맥락에서 어느 형광 모이어티를 사용하는지는 관련 기술분야의 통상의 기술자에게 명백할 것이다.
보다 구체적으로, 상기 관심의 재조합 단백질은 또한 친화성 단백질 후보일 수 있으며, 여기서 발현의 수준은 상기 세포의 세포 표면 상의 상기 친화성 단백질 후보의 제시에 의해 결정된다. 상기 친화성 단백질 후보는 막 앵커 도메인에 융합된 단일 쇄 폴리펩티드일 수 있으며, 임의적으로 여기서 상기 단일 쇄 폴리펩티드는 Z-스캐폴드 단백질, 나노바디 스캐폴드 단백질, 단일 쇄 단편 가변 (scfv) 스캐폴드 단백질, 피노머(Fynomer) 스캐폴드 단백질, DARPin 스캐폴드 단백질 및/또는 애드넥틴 스캐폴드 단백질로 이루어진 군으로부터 선택될 수 있다 [28, 29].
상기 친화성 단백질 후보는 또한 2개 이상의 폴리펩티드 쇄, 예컨대 항체를 포함할 수 있으며, 여기서 상기 친화성 단백질 후보에 상응하는 핵산 서열 변이체는 친화성 단백질 후보 변이체, 예컨대 항체 변이체를 코딩하고, 여기서 예를 들어 상기 항체 변이체의 상기 2개 이상의 폴리펩티드 중 하나는 막 앵커 도메인에 융합된다 [13, 30].
또한, 친화성 단백질 후보가 노출되는 형광 마커로 임의적으로 표지된 특이적 표적 구성요소를 상기 친화성 단백질 후보에 제공하고, 그 후 상기 특이적 표적 구성요소에의 상기 친화성 단백질 후보의 결합을 검출함으로써 상기 친화성 단백질 후보의 결합 특이성, 선택성, 친화성 및/또는 기능성을 결정하는 것을 추가로 포함하는 방법이 제공된다.
상기 표적 구성요소는 소분자, DNA 분자, RNA 분자, 단백질, 단백질 복합체, 예컨대 바이러스 입자, 엑소좀 또는 세포로부터 선택될 수 있으며, 임의적으로 여기서 상기 표적 구조는 형광 모이어티로 태그부착된다.
상기 친화성 단백질 후보는 상기 표적 구성요소에 결합하거나 그에 대한 친화성을 가질 수 있는 임의의 단백질일 수 있다.
본원에서 이전에 언급된 바와 같이, 본원에서 제시된 방법의 단계 v)에서의 정의된 표현형을 갖는 세포의 선택에 의한 서열 최적화된 핵산 서열의 선택은 관심의 재조합 단백질의 발현 수준 또는 기능성 및/또는 내인성 생체분자의 상기 존재 또는 수준에 기반한 선택을 포함할 수 있다. 이러한 존재 또는 수준은 단일 세포의 수준에서, 예컨대 유동 세포계측법을 사용함으로써 측정될 수 있다.
또한, 공여자 벡터의 상기 핵산 서열 영역이 상기 공여자 벡터로부터의 1개 또는 여러 개의 관심의 재조합 단백질의 발현을 위한 핵산 서열 변이체를 포함하며, 여기서 상기 복수의 공여자 벡터는 상기 1개 또는 여러 개의 관심의 재조합 단백질의 상이한 아미노산 서열 변이체를 코딩하는 상이한 핵산 서열 변이체를 포함하는 것인 방법이 제공된다.
또한, 공여자 벡터의 상기 핵산 서열 영역이 상기 공여자 벡터로부터의 관심의 재조합 단백질의 발현을 위한 핵산 서열 변이체를 포함하며, 여기서 복수의 공여자 벡터에 존재하는 핵산 서열 변이체는 상기 관심의 재조합 단백질의 본질적으로 동일한 아미노산 서열 변이체를 코딩하는 핵산 서열 변이체를 포함하는 것인 방법이 제공된다. 이러한 방법은 관심의 단백질을 코딩하는 관심의 최적 핵산 서열을 확인하기 위해 상정된다.
또한, 본질적으로 동일한 관심의 재조합 단백질을 코딩하는 본질적으로 동일한 핵산 서열을 포함하는 핵산 서열 영역을 포함하는 복수의 공여자 벡터를 포함하지만, 여기서 상기 핵산 서열 영역은 공여자 벡터 구성요소의 상이한 핵산 서열 변이체, 예컨대 상기 공여자 벡터의 프로모터 또는 인핸서 핵산 서열의 핵산 서열 변이체를 포함하는 것인 방법이 제공된다. 이러한 방법은 상기 관심의 재조합 단백질의 발현 및 분비를 유도하는 최적 핵산 서열 변이체를 확인하기 위해 상정된다.
따라서, 이러한 방법은 진핵생물 세포 시스템에 기반한 재조합 단백질 발현 시스템에 사용하기 위한 서열 최적화된 핵산 공여자 벡터 구성요소를 확인한다. 따라서, 이와 관련하여 또한 본원에 개시된 바와 같은 방법에 의해 선택된 서열 최적화된 핵산 서열이 제공된다.
또한, 재조합 단백질을 생산하기 위한 이러한 서열 최적화된 핵산 서열의 용도가 제공된다.
또한, 서열 최적화된 핵산 서열을 추가로 디자인하기 위한 본원에 개시된 바와 같은 방법에 의해 선택된 서열 최적화된 핵산 서열의 용도가 제공된다. 이는 본원에 개시된 바와 같은 방법에 의해 선택된 서열 최적화된 핵산 서열의 서열 동일성의 정보가 추가적 최적화된 핵산 서열 변이체를 생산하는데 사용됨을 의미한다. 따라서, 이 정보는 선택된 핵산 서열의 추가적 변이체의 디자인을 위한 디자인 목적에 사용된다.
본 개시내용의 추가의 측면에서, 본원에 개시된 바와 같은 방법에 의해 수득가능한 서열 최적화된 핵산 서열에 상응하는 정의된 표현형을 갖는 단리된 진핵생물 세포가 제공된다.
본 개시내용은 이제 그에 제한되는 것으로 의도되지 않으면서 하기 실험 섹션에 의해 예시되는데, 이는 그것이 단지 본 발명을 수행하는 상이한 방식을 예시하기 때문이다.
실험 섹션
약어
LP = 랜딩 패드
LP1P1 = attP1을 포함하는 랜딩 패드 1
LP2P2 = attP2 및 스플릿 인트론을 포함하는 랜딩 패드 2
CHO = 중국 햄스터 난소
FC-eGFP = IgG1로부터의 FC에 융합된 증진된 녹색 형광 단백질
TagBFP2 = 청색 형광 단백질 변이체
TagRFP-T = 적색 형광 단백질 변이체
G418 = 일명 제네티신, 네오마이신 저항성 유전자 (NeoR)를 발현하는 포유동물 세포를 선택할 광폭-스펙트럼 항생제.
서열 목록
하기 서열은 실험 섹션에 사용되지만, 본 개시내용은 이들 서열에 제한되지는 않는다. 따라서, 그의 변이체가 또한 상정되며, 여기서 상기 서열 변이체의 기능은 원래 서열과 본질적으로 동일하게 남아 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
실시예 1: phiC31 리콤비나제-매개 통합 및 선택 마커 활성화의 효율
통합의 효율을 조사하기 위해, 하이클론 CHO LP 세포 및 비-LP 하이클론 CHO 대조군 세포를 PhiC31 리콤비나제 발현 플라스미드 및 공여자 벡터 A 또는 B 중 어느 하나의 조합으로 형질감염시켰다 (도 3). 공여자 벡터는 FC-eGFP 및 FC-TagBFP2에 대한 발현 카세트 및 그것이 LP 세포에서의 LP에서의 통합 시 활성화하도록 위치된 프로모터-없는 TagRFP-T 유전자를 함유한다.
2개의 하이클론-CHO LP 변이체 및 매칭 공여자 벡터를 조사하였으며, 도 3을 참조한다. 하이클론-CHO LP1P1에서, LP에서의 프로모터는 attP1의 바로 하류에 위치된다. 공여자 벡터 A에서, TagRFP-T 유전자는 attB1의 바로 상류에 위치된다. 하이클론-CHO LP2P2에서, 스플릿 인트론의 5'-부분은 attP2 및 LP에서의 하류 프로모터 사이에 위치된다. 공여자 벡터 B에서, 스플릿 인트론의 3'-부분은 attB2 및 상류 TagRFP-T 유전자 사이에 위치된다. 통합의 효율을 배경 초과의 RFP 신호를 나타내는 세포의 백분율을 측정함으로써 형질감염 후 7일에 유동 세포계측법에 의해 평가하였다 (비-형질감염된 대조군과 비교하여 정의됨, 도 4 참조).
도 4에서, 생성된 유동 세포계측법 데이터의 예는 대조군과 비교하여 하이클론 CHO LP2P2에 대해 예시된다. 결과의 완전한 세트는 표 1에 요약된다. LP1P1에 대해 단지 비-형질감염된 대조군을 사용한 반면, LP2P2에 대해 무작위 통합 대조군 (RI 대조군, 공여자 벡터 단독) 및 슈도-att 통합 대조군 (공여자 벡터 + LP를 결여한 CHO 세포주에서의 PhiC31) 둘 다를 수행하였다. 데이터에 따르면 둘 다의 LP 변이체는 기능적이지만, 스플릿 인트론 디자인을 이용하는 LP2P2 변이체는 우수한 통합 효율을 제공한다.
Figure pct00006
표 1. 하이클론 CHO LP1P1 및 하이클론 CHO LP2P2 둘 다에 대한 대조군 실험 및 SDI 통합 효율 평가로부터 수득된 결과의 요약.
실시예 2: 통합 부위에서의 벡터 백본의 Cre 리콤비나제-매개 삭제의 효율
하이클론 CHO LP1P1 세포를 PhiC31 발현 플라스미드, 및 FC-eGFP 및 FC-TagBFP2에 대한 발현 카세트 및 그것이 LP 세포에서의 LP에서의 통합 시 활성화하도록 위치된 프로모터-없는 TagRFP-T 유전자를 함유하는 공여자 벡터를 사용하여 형질감염시켰다 (도 5). 랜딩 패드 (LP)에서 공여자 벡터를 통합한 세포를 배경 초과의 Tag-RFP-T 신호에 대해 게이팅하는 여러 FACS 분류 단계 및 FC-eGFP 및 FC-TagBFP2 둘 다의 균형된 발현에 의해 풍부화하였다. 이어서 세포의 생성된 분류되고 확장된 풀을 (a) Cre 리콤비나제 발현 플라스미드, (b) Cre를 코딩하는 합성 mRNA 또는 (c) 임의의 Cre 리콤비나제 코딩 핵산 분자를 결여한 모의 형질감염 용액 중 어느 하나를 사용하여 두번째로 형질감염시켰다. 제2 형질감염 후 7일에 모든 세포 집단을 유동 세포계측법에 의해 분석하여 2개의 loxP 부위에 의해 플랭킹된 영역의 삭제의 효율을 평가하였다.
Cre 리콤비나제 형질감염 후의 유동 세포계측법 분석으로부터의 플롯은 도 6에서 볼 수 있다. 데이터는 모의 대조군과 비교하여 2개의 Cre 리콤비나제 처리된 풀에 대한 FC-TagBFP2를 발현하지 않는 세포의 증가를 제시한다. 이는 이번에는 FC-TagBFP2가 Cre 리콤비나제 효소가 작용할 수 있는 2개의 loxP 부위에 의해 플랭킹되도록 LP에서의 공여자 벡터의 정확한 통합을 명백하게 지시한다. 데이터에 따르면, Cre 리콤비나제에 의해 촉매된 삭제 반응은 최대 적어도 80%의 수율로 매우 효과적이다.
실시예 3: 직교 attP/attB 쌍의 사용에 의한 동일한 게놈 위치에서의 반복된 통합
하이클론 CHO LP1P1 세포를 PhiC31 발현 플라스미드, 및 attB1 서열, 이어서 attP2 서열, 스플릿 인트론의 5'-부분, 프로모터, loxP 서열 및 eGFP에 대한 발현 카세트를 함유하는 공여자 벡터 (도 7, 공여자 벡터 A)를 사용하여 형질감염시켰다. 형질감염 후 제7일에, eGFP 양성 세포를 FACS에 의해 분류하고, 이어서 세포를 확장시켰다. 이어서 eGFP 양성 세포의 제2의 보다 엄격한 분류를 수행하였다. 제2 eGFP 양성 분류 (도 8, 단계 1 분류) 후에 확장된 세포를 Cre 리콤비나제를 코딩하는 합성 mRNA를 사용하여 형질감염시켰다. Cre 리콤비나제 형질감염 후 7일에, eGFP 음성 세포를 FACS를 사용하여 분류하였다. 확장 후, eGFP 음성 세포 풀을 유동 세포계측법에 의해 분석하였다 (도 8, 단계 2 분류). 분류 및 분석 단계로부터의 데이터는 도 8, 상부 패널에 제시된다. 이들 단계 동안 CHO 게놈에서의 랜딩 패드는 도 7에서의 단계 (1) 및 (2)에 의해 지시된 바와 같이 변경된 것으로 가정된다.
변경된 랜딩 패드의 기능성을 확인하기 위해, 최종 분류 (도 8, 단계 2 분류) 후에 수득된 eGFP 음성 풀을 DNA 공여자 벡터 B를 사용하여 형질감염시키고 (도 7, 단계 3), 형질감염 후 7일에 유동 세포계측법에 의해 분석하였다 (도 8, 하부 패널). 데이터는 새로운 랜딩 패드의 기능성을 지시한다. 마지막으로, eGFP 음성 풀로부터의 세포를 FACS에 의해 단일 세포 분류를 사용하여 클로닝하고, 그들의 게놈의 랜딩 패드 영역을 PCR에 의해 증폭시키고, 시퀀싱하였다. 랜딩 패드의 정확한 변경을 시퀀싱에 의해 다수의 클론에 대해 확인하였으며 (새로운 랜딩 패드 영역의 전체 커버리지), 이는 도 7에 개요된 변경이 성공적으로 달성되었음을 제시한다.
실시예 4: 2개의 연속적 선택 단계를 사용한 SDI 세포 풀의 생성
하이클론 CHO LP2P2 세포 (실시예 3에 따라 생성된 클론)를 PhiC31 리콤비나제 발현 플라스미드 및 도 9에 따라 구축된 공여자 벡터를 사용하여 형질감염시켰다.
형질감염 후 2일에 시작하여, 세포를 G418의 존재 하에서 배양하여 랜딩 패드에서 공여자 벡터를 통합하며, 그에 의해 네오마이신 저항성 유전자 (NeoR)를 활성화시킨 세포에 대해 선택하였다. G418 선택 후 높은 생존율 (>98%)로의 복귀 후, 세포를 GFP/RFP 이중 양성 신호에 기반하여 FACS에 의해 분류하였다. 확장 후, 분류된 세포를 Cre 리콤비나제를 코딩하는 합성 mRNA를 사용하여 형질감염시켰다. Cre 리콤비나제 형질감염 후 제7일에, 세포를 GFP-양성/RFP-음성 신호에 의해 FACS 분류하였다 (도 10, 게이트 E). 최종 SDI 풀을 확장 후 유동 세포계측법에 의해 분석하였다.
FACS/유동 세포계측법으로부터의 데이터는 도 10에서 볼 수 있다. Cre 리콤비나제 형질감염 후 추가적 선택 단계는 TagRFP-T 양성 (부정확한 통합) 및 TagRFP-T 음성 (정확한 통합) 세포에 대한 eGFP 신호의 평균 값 및 CV에 의해 지시된 바와 같이 풀에서의 이질성을 감소시킨다.
실시예 5: 높은 발현을 위한 상이한 5'-UTR 및 신호 펩티드의 조합의 평가
9개의 상이한 구축물을 Fc-eGFP의 발현을 위한 3개의 상이한 5'-UTR (A, B, C) 및 3개의 상이한 신호 펩티드 (1, 2, 3)를 조합함으로써 제조하였으며, 여기서 보다 조기의 실험으로부터의 공지된 양호한 발현을 갖는 바람직한 조합 A1, B2 및 C3은 볼드체이며, 표 2를 참조한다. 각각의 구축된 공여자 플라스미드를 부위 지정 통합을 위한 하이클론 CHO LP2P2 세포주에 대한 PhiC31 플라스미드와 함께 형질감염시켰다. 2일 후, eGFP 및 mTagBFP2의 일시적 발현을 유동 세포계측법으로 분석하였다. eGFP 및 mTagBFP2의 양호한 발현을 갖는 세포의 수 (%)는 도 17a에서 볼 수 있고, 바람직한 변이체 A1, B2 및 C3에 대해 양호한 값을 제시한다. 네오마이신 선택 마커는 공여자 벡터가 랜딩 패드 (LP)에서 삽입되고 따라서 G418이 선택 압력으로서 제2일 후에 첨가된 경우에 활성화되었다. 모든 배양물이 >98% 생존 세포에 다시 도달한 경우, Cre 효소의 mRNA를 세포에 대해 형질감염시켜 RFP 및 네오마이신 발현 카세트를 제거하였다. 1주 후, 단일 세포를 각각의 샘플에 대해 각각 eGPF 및 mTagBFP2 양성 및 RFP 음성 신호에 대해 분류하였다. G418 선택 동안, 구축물 B1, B3 및 C1을 갖는 배양물은 소실되었다. 각각의 나머지 샘플에 대한 배치 배양을 수행하고, 형광 (eGFP 및 mTagBFP2)을 로그-상에서 배양물에 대해 측정하고 (도 17b, eGFP 형광), FC 역가를 배양 후 CEDEX로 측정하였다 (도 17c, mg/L). 구축물의 순위화는 표 3에서 볼 수 있다. 형광 신호로부터의 결과 및 FC 기반 역가 측정 사이에 양호한 상관관계가 있으며, 도 18을 참조한다. 결과는 UTR C 및 신호 펩티드 2가 보다 양호한 발현을 제공하였으며, 이들의 조합이 또한 가장 높은 발현을 생성하였음을 제시한다.
Figure pct00007
표 2: 9개의 상이한 구축물에 대한 UTR 및 신호 펩티드 (SP)의 개관. 이전의 데이터에 기반한 공지된 고성능을 갖는 조합은 볼드체로 지시된다.
Figure pct00008
표 3: 유동 세포계측법 (MFI) 및 CEDEX (역가)에 의한 Fc-eGFP의 발현의 순위화
실시예 6: 단일 세포 Qp 프로브로서 Fc-eGFP를 사용한 유동 세포계측법에 의 5'-UTR 변이체의 평가
단일 세포 수준에서 관련 표적 유전자의 상이한 발현 수준을 구별하는 능력을 평가하기 위해, 신호 펩티드 함유 Fc-eGFP에 대한 다양한 유전자 구축물을 갖는 4개의 상이한 DNA 공여자 벡터를 구축하였다 (공여자 벡터의 일반적 디자인에 대해서는 도 19 및 변이체의 설명에 대해서는 표 4 참조). 변이체 중 3개는 단지 그들의 5'-UTR 서열에 있어서 상이한 반면, 음성 대조군 벡터는 결실된 프로모터를 포함하는 전체 Fc-eGFP 카세트를 가졌다. 모든 4개의 벡터에 대해 동일한 신호 펩티드 함유 Fc-TagBFP2 유전자 카세트는 내부 대조군으로서 존재한다.
Figure pct00009
표 4. DNA 공여자 벡터 변이체의 설명.
하이클론 CHO LP2P2 세포를 PhiC31 발현 플라스미드, 및 4개의 DNA 공여자 벡터 중 어느 하나를 사용하여 형질감염시켰다. 개별적 형질감염 및 선택을 모든 DNA 공여자 벡터에 대해 수행하였다. 형질감염 후 2일에 시작하여, 세포를 G418의 존재 하에서 배양하여 랜딩 패드에서 공여자 벡터를 통합하며, 그에 의해 네오마이신 저항성 유전자 (NeoR)를 활성화시킨 세포에 대해 선택하였다. G418 선택 후 높은 생존율 (>98%)로의 복귀 후, 세포를 유동 세포계측법에 의해 분석하였다. 상이한 변이체의 비교를 위해, 세포 집단을 도 20에서의 상부 패널에 따라 인-실리코 게이팅하였다. 총 살아 있는 세포 집단으로부터, RFP 양성 세포의 주요 클러스터를 선택하고, 그들의 TagBFP2/eGFP 값의 플롯을 제시하였다. TagBFP2/eGFP 양성 세포의 주요 클러스터를 게이팅하고, 상이한 변이체의 비교에 사용하였다. 이들 게이팅된 집단의 오버레이 플롯은 도 20의 하부 패널에서 발견될 수 있다.
상이한 변이체를 사용하여 생성된 발현을 비교하는 데이터는 Fc-eGFP 반응의 폭넓은 동적 범위를 제시한다. 추가로, Fc-eGFP 반응에 기반한 순위화는 상이한 구축물의 예상된 성능과 상관되며, 높은 효율 양성 대조군은 가장 높은 반응을 나타내고, 음성 대조군 (Fc-eGFP 발현 카세트의 부재)은 배경 초과의 eGFP 반응을 생성하지 않는다. 과학 문헌 [31]에서의 공개된 데이터에 기반하여 462 삼중 uORF 감쇠 서열은 464 단일 uORF 감쇠 서열에 비해 하류 유전자의 더 강한 음성 감쇠를 생성할 것이다. 무손상 Fc-eGFP 카세트를 갖는 3개의 변이체에 대해 TagBFP2에 대한 신호 반응은 유사하며, eGFP 순위화에 대한 신뢰성을 추가한다. 음성 대조군에 대해 TagBFP2 반응은 상승된다. 이는 잠재적으로 Fc-eGFP 프로모터의 부재에 기인할 수 있다.
실시예 7: 단일 세포 Qp 프로브로서 Fc-eGFP를 사용한 유동 세포계측법 및 역가 평가에 의한 3'-UTR 변이체의 비교
Fc-eGFP 카세트에서 상이한 3'-UTR 서열을 운반하는 8개의 상이한 DNA 공여자 벡터 (벡터의 일반적 디자인에 대해서는 도 21 참조)를 구축하였다.
하이클론 CHO LP2P2 세포를 PhiC31 리콤비나제 발현 플라스미드, 및 8개의 DNA 공여자 벡터 중 어느 하나를 사용하여 형질감염시켰다. 개별적 형질감염 및 선택을 모든 DNA 공여자 벡터에 대해 수행하였다. 형질감염 후 7일에, 초기 세포 집단을 mRasberry 양성 신호 (랜딩 패드에서 프로모터-없는 유전자의 활성화에 상응함)에 기반하여 FACS 분류하였다. 확장 후, 제2의 보다 엄격한 mRasberry 양성 FACS 분류를 수행하여 각각의 DNA 공여자 벡터 변이체에 대한 SDI 세포의 풀을 생성하였다. 확장 후, 진탕 플라스크 배치 배양을 0.25x106개의 세포/ml의 시작 세포 밀도로 개시하였다. 생존 세포 밀도를 바이셀(ViCell) 기기를 사용하여 매일 측정하였다. 각각의 배양으로부터의 샘플을 배양의 3일에서 유동 세포계측법에 의해 분석하였다. 성장 배지에서의 역가를 보정 곡선의 생성을 위한 IgG1 표준물을 갖는 비아코어 8K+ 기기를 사용하여 배양의 5일에서 측정하였다.
각각의 배양에 대한 Qp (제0일 내지 제5일)를 계산하고, 상응하는 유동 세포계측법 데이터로부터의 평균 eGFP 신호와 비교하였다 (제3일에서의 Qp의 대용물을 제공함). 데이터는 도 22에서 발견될 수 있다.
볼 수 있는 바와 같이, 역가 및 VCD 측정으로부터 계산된 Qp는 유동 세포계측법 데이터와 상관된다. 연장에 의해, 이는 관심의 단백질에의 형광 단백질의 융합이 핵산 변이체 (예컨대 3'-UTR 변이체)의 라이브러리를 집합적으로 운반하는 세포의 풀로부터 높은 발현을 갖는 세포를 선택하고/풍부화하며, 그에 의해 고성능 핵산 변이체에 대해 선택하는데/풍부화하는데 사용될 수 있음을 지시한다.
실시예 8: 선택 마커로서 그들의 효율에 대한 글루타민 신테타제 변이체의 작은 라이브러리의 평가
3개의 대조군 DNA 공여자 벡터 및 실시예 4에 따른 일반적 디자인을 갖는 1개의 DNA 공여자 벡터 라이브러리를 구축하였다. 벡터는 단지 글루타민 신테타제에 대한 코딩 서열의 코돈 299에서의 서열에 있어서 상이하다 (상세사항에 대해서는 도 23 참조). 양성 대조군, 즉, 코돈 CGA를 갖는 Arg는 고기능 효소를 코딩하는 것으로 공지되어 있다 (데이터는 제시되지 않음). 음성 대조군, 즉, 코돈 GGA를 갖는 Gly는 이 GS 변이체를 운반하는 벡터의 무작위 통합 후 MSX 선택을 위해 작동하는 것으로 제시되었다 (그러나 감소된 세포 성장을 가짐, 효소의 감소된 효율을 지시함. 데이터는 제시되지 않음). 위치 299에서의 다른 아미노산/코돈이 음성 대조군에 비해 더 높은 효율로 글루타민 신테타제 효소를 생성할 수 있는지를 평가하기 위해, met 돌연변이체 및 18개의 상이한 아미노산을 나타내는 29개의 기능적 코돈을 함유하는 라이브러리를 하이클론 CHO LP2P2를 사용하여 부위 지정 통합 작업흐름에서 시험하였다.
하이클론 CHO LP2P2를 별개의 형질감염에서 3개의 대조군 플라스미드 및 플라스미드 라이브러리의 각각으로 형질감염시켰다. 랜딩 패드에서의 단일 DNA 공여자 벡터 카피의 통합을 위해 선택된 세포 풀을 실시예 4에 기재된 작업흐름에 따라 생성하였다. GS 기능성의 초기 시험으로서 및 라이브러리에서의 기능적 변이체의 풍부화 단계로서, 세포의 각각의 최종 풀을 MSX의 부재 하에서 또는 10 μM MSX의 존재 하에서 L-글루타민을 결여한 배지에서 배양하였다. 성장 곡선은 도 24에서 볼 수 있다. 볼 수 있는 바와 같이, 모든 변이체는 MSX의 부재 하에서 그러나 다양한 성장 속도로 성장할 수 있다. 양성 대조군은 가장 빠르게 성장하고, 이어서 라이브러리가 이어진다. 음성 대조군 및 met 돌연변이체는 가장 느린 성장 속도를 가졌다. 10 μM MSX의 존재 하에서 단지 양성 대조군 및 라이브러리가 성장하며, 양성 대조군은 보다 높은 속도로 성장한다.
기능적 GS 활성을 위한 선택으로서 10 μM MSX로의 성장 후, 단일 세포를 FACS를 사용하여 라이브러리 배양물, 양성 대조군 배양물 및 음성 대조군 배양물로부터의 96-웰 정적 배양 플레이트 내로 클로닝하였다. 단일 세포를 글루타민 무함유 배지에서 MSX의 부재 하에서 또는 5 μM MSX의 존재 하에서 성장시켰다. 웰을 솔렌팀(Solentim) 플레이트 화상화 시스템을 사용하여 성장에 대해 모니터링하였다. 대조군과 비교하여 라이브러리에 대한 과성장을 예시하는 그래프는 도 25에서 발견될 수 있다.
볼 수 있는 바와 같이, 클론은 MSX의 부재 하에서 모든 변이체에 대해 과성장한다. 5 μM MSX를 사용한 배양에 대해, 클론은 음성 대조군에 대해 과성장하지 않지만, 양성 대조군 및 라이브러리로부터의 클론에 대해서는 성장한다.
5 μM MSX의 존재 하에서 과성장을 나타내는 GS 변이체를 확인하기 위해, 게놈 DNA를 상응하는 웰로부터 추출하고, GS 영역을 PCR에 의해 증폭시켰다. 96개의 클론으로부터의 총 96개의 PCR 생성물을 생거 시퀀싱을 위해 보내고, 고-품질 시퀀싱 결과를 79개의 클론에 대해 수득하였다. 생거 시퀀싱으로부터의 서열을 지니어스 프라임(Geneious Prime) 소프트웨어를 사용하여 GS 변이체에 대해 정렬하였다. 확인된 GS 변이체의 요약은 표 5에서 발견될 수 있다.
Figure pct00010
표 5. 5 μM MSX의 존재 하에서 과성장하고 생거 시퀀싱에 의해 확인된 클론으로부터의 GS 변이체의 요약.
볼 수 있는 바와 같이, 확인된 클론의 99%는 위치 299에 Arg를 갖고, 단지 1개의 변이체는 Gly를 갖는다. 확인된 변이체의 99%가 양성 대조군에서와 동일한 아미노산에 상응한다는 (그러나 다른 코돈을 가짐) 사실은 평행 작업흐름에서 서열 변이체의 라이브러리를 평가하기 위한 SDI 시스템의 유용성 및 정확성을 예시한다. 또한, 라이브러리에 존재하는 3개의 상이한 Arg 코돈은 모두 과성장한 클론으로부터 확인되지만, 명백하게 상이한 빈도를 가지며, 이는 단일 동의어적 코돈 변화의 효과가 방법론에 의해 픽업될 수 있음을 지시함이 주목되어야 한다.
Figure pct00011
Figure pct00012
Figure pct00013
SEQUENCE LISTING <110> GE HEALTHCARE BIO-SCIENCES AB <120> METHODS FOR THE SELECTION OF NUCLEIC ACID SEQUENCES <130> 327740-GB-1 <160> 16 <170> PatentIn version 3.5 <210> 1 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Partly modified native attP sequence <400> 1 gtgccccaac tggggtaacc tttgagttct ctcagttggg ggcgtag 47 <210> 2 <211> 70 <212> DNA <213> Artificial sequence <220> <223> Partly modified native attB sequence <400> 2 ctcgaagccg cggtgcgggt gccagggcgt gcccttgggc tccccgggcg cgtactccac 60 ctcacccatc 70 <210> 3 <211> 47 <212> DNA <213> Artificial sequence <220> <223> Partly modified native attP sequence <400> 3 gtgccccaac tggggtaacc taagagttct ctcagttggg ggcgtag 47 <210> 4 <211> 70 <212> DNA <213> Artificial sequence <220> <223> Partly modified native attB sequence <400> 4 ctcgaagccg cggtgcgggt gccagggcgt gcccaagggc tccccgggcg cgtactccac 60 ctcacccatc 70 <210> 5 <211> 1941 <212> DNA <213> Artificial sequence <220> <223> Partly modified native PhiC31 gene <400> 5 atgaccatga ttaccccatc tgcccagctg accctgacaa agggcaataa gagctggtct 60 agcctggtga cagctgcttc tgtgctggag tttgccacca tgatccaagg ggtcgctggg 120 gaagtgactt atgccggggc gtacgaccgt cagtctcggg agcgcgagaa ctctagcgcg 180 gcgtctccgg ccactcagcg tagcgctaac gaggccaaag ccgccgctct ccagcgcgag 240 atcgagcgcg ccgggggccg gtttcgtttc gtcggtcact tcagcgaggc ccccggcaca 300 tctgccttcg gtacagccga gcgccctgag ttcgaacgca ttctgaacga atgccgcgcc 360 ggtcggctga acatgattat cgtgtatgac gtgtctcgct tctctcgcct gaaggttatg 420 gacgccatcc ctatcgtgtc agaattactg gccctgggcg tgacaatcgt ctctacgcag 480 gaaggcgtgt tcagacaagg gaacgttatg gacctgatcc acctgatcat gcggctggac 540 gcctctcaca aagaaagctc tctgaagtct gccaagatcc tggacacaaa gaacctccag 600 cgcgaacttg gcggttacgt gggcgggaag gccccctacg gcttcgagct tgtcagcgag 660 acaaaggaga ttacacgcaa cggacgtatg gtcaatgtgg ttatcaacaa gctcgcccac 720 tctaccacgc ctctcaccgg acctttcgag ttcgagccag acgtaattcg gtggtggtgg 780 cgtgagatca agacacacaa acacctccct ttcaagcctg gcagtcaagc cgccatccac 840 cctggctcta ttaccggact ctgtaagcgc atggacgcgg acgccgtgcc taccagaggc 900 gagacaatcg ggaagaagac cgcgtcgtct gcctgggacc ctgcgaccgt catgcgtatt 960 ctcagagacc ctcgtatcgc cgggttcgct gcggaggtga tttacaagaa gaagccagac 1020 ggcacaccta ccacaaagat cgagggatac cgcatccagc gcgaccctat tactctgcgg 1080 cctgtggagc ttgattgcgg tcctattatc gagcctgcgg agtggtatga gcttcaggcc 1140 tggttggacg gacgtggtcg cggcaagggt ctctctcggg gtcaagccat cctgtctgct 1200 atggacaagc tgtactgcga gtgtggcgcc gttatgacga gcaagcgcgg ggaagaatct 1260 atcaaggaca gttaccgctg ccgtcgcaga aaggtggtgg acccttctgc gcccggtcag 1320 cacgaaggca cttgcaacgt ctctatggcc gcgctggaca agttcgtcgc cgaacgcatt 1380 ttcaacaaga tccgtcacgc cgaaggcgac gaagagacac ttgccctcct gtgggaagcc 1440 gcccgtcgct tcggcaagct cacggaggcc cccgagaagt ctggcgaaag agccaacctc 1500 gtcgccgagc gcgccgacgc cctgaacgcc ctcgaagagc tgtacgaaga ccgcgctgcg 1560 ggcgcctacg acggtcctgt cggacgaaag cacttcagaa agcaacaggc ggccctgact 1620 ctgcgccagc aaggtgccga agagagactc gccgaactcg aagccgccga agccccaaag 1680 ctccctctcg accaatggtt cccagaagac gccgacgcgg accctaccgg ccccaagtct 1740 tggtggggtc gcgcctcggt agacgacaag cgcgtgttcg tgggtctgtt cgtagacaag 1800 attgtcgtta caaagtctac gacaggccgt gggcagggga cacctatcga gaagcgcgcg 1860 tctattactt gggccaagcc tcctaccgac gacgacgaag acgacgccca ggacggcaca 1920 gaagacgtag ctgcttgata a 1941 <210> 6 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Partly modified native lox gene <400> 6 ataacttcgt ataggatact ttatacgaag ttat 34 <210> 7 <211> 1031 <212> DNA <213> Artificial sequence <220> <223> Partly modified native Cre gene <400> 7 atgtcaaacc ttctcaccgt ccaccaaaac ctccccgcac tccccgttga cgccacctcc 60 gacgaggtca gaaaaaacct catggacatg ttccgggacc gccaggcctt ttccgaacac 120 acttggaaaa tgcttctcag cgtttgccgt agttgggccg cttggtgtaa actcaacaac 180 cgcaagtggt tccccgccga acccgaggac gtccgcgatt accttctgta tttgcaagcg 240 cgaggactgg ccgtgaaaac catccagcaa catctgggtc agcttaacat gttgcaccgg 300 aggagcggcc tgccacggcc tagcgactcc aacgcggtgt ccctcgtgat gaggagaatc 360 cgcaaggaga atgtggacgc cggagaaaga gcaaagcagg ccctggcctt cgagaggact 420 gacttcgacc aagtccggtc gctgatggag aactcggacc gatgtcagga catcaggaac 480 ctcgcattct cggcattgcc tacaacaccc tgctgagaat tgcagagatc gcccgcatcc 540 gcgtcaagga catttcgaga accgacggag ggcggatgct gattcacatc ggcaggacta 600 agaccctcgt gtcaaccgcc ggagtggaaa aggccctcag cctgggagtg acaaagctcg 660 tggagcgctg gatctccgtg tcgggggtgg ccgacgatcc gaacaattac ctgttctgcc 720 gggtccgcaa aaatggggtg gccgccccgt ctgctacaag ccagttgtcc actcgcgccc 780 tggaaggaat cttcgaggcc acgcaccgcc tgatctatgg ggcaaaggac gattccggcc 840 agaggtatct cgcgtggtcc ggtcactccg cgcgcgtggg cgcggcccgg gacatggccc 900 gggctggagt gtccatccct gaaatcatgc aggccggtgg atggaccaac gtgaacatcg 960 tgatgaacta cattcggaac ctggacagcg aaactggtgc tatggtccgc ctgctggagg 1020 acggagattg a 1031 <210> 8 <211> 1428 <212> DNA <213> Artificial sequence <220> <223> Enhanced Green Fluorescent Protein fused to an FC from IgG1 (FC-eGFP gene) <400> 8 gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 60 ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 120 tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 180 ggcgtggagg tgcataatgc caagacaaag ccacgggagg agcagtacaa cagcacgtac 240 cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 300 tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 360 gggcagcccc gagaaccaca ggtctacacc ctgcccccat cccgggagga gatgaccaag 420 aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 480 tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 540 gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 600 aacgtcttct catgctccgt gatgcacgag gctctgcaca accactacac gcagaagagc 660 ctctccctgt ctccgggtaa aggttcctcc agttccggca gctccagttc cggtatgagt 720 aaaggagagg aactcttcac cggagtcgtc ccgatactcg tcgagctaga cggagacgtc 780 aacggccaca aattctccgt ctccggcgag ggggaggggg acgccaccta cggaaaactc 840 acccttaagt ttatttgcac taccggaaaa ctccccgtcc cttggccaac cctagtcacc 900 acgctgacat acggagtcca atgtttctcg cggtatcccg accacatgaa gcagcatgac 960 tttttcaaat ccgcgatgcc tgagggctac gtgcaggaac gcaccatctt cttcaaggac 1020 gacgggaatt acaagactag agccgaggtc aagtttgaag gagacaccct cgtgaatcgc 1080 atcgagctta agggcattga cttcaaggag gacggcaaca tcctgggtca caagctggag 1140 tacaactaca actcgcataa cgtctacatc atggccgaca agcaaaagaa cggtatcaag 1200 gtcaacttca agattaggca caacattgag gatgggtccg tccaactggc cgaccactac 1260 cagcagaaca cccccatcgg cgacggacct gtgctcctgc ctgataacca ctatctcagc 1320 actcagagcg cactgtccaa ggaccctaac gaaaaacggg accacatggt cttgctggag 1380 ttcgtgacag ccgctggtat taccctgggc atggatgaac tgtataag 1428 <210> 9 <211> 1431 <212> DNA <213> Artificial sequence <220> <223> Blue Fluorescent Protein variant fused to an FC from IgG1 (FC-TagBFP2 gene) <400> 9 gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 60 ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 120 tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 180 ggcgtggagg tgcataatgc caagacaaag ccacgggagg agcagtacaa cagcacgtac 240 cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 300 tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 360 gggcagcccc gagaaccaca ggtctacacc ctgcccccat cccgggagga gatgaccaag 420 aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 480 tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 540 gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 600 aacgtcttct catgctccgt gatgcacgag gctctgcaca accactacac gcagaagagc 660 ctctccctgt ctccgggtaa aggttcctcc agttccggca gctccagttc cggtatggtg 720 tcgaagggag aggagctgat taaggagaac atgcacatga agctgtatat ggaagggacg 780 gtggacaacc accacttcaa gtgcaccagc gaaggagaag gaaagcctta cgaaggcact 840 caaactatgc ggatcaaagt ggtggaaggc ggtcctcttc cgttcgcctt cgacatcttg 900 gccacctcct tcctctacgg ctccaagacc tttatcaacc acacccaggg aatcccggac 960 ttctttaagc agagcttccc tgagggcttc acctgggaaa gagtgacaac ctacgaggac 1020 ggtggcgtcc tgaccgcgac ccaggacacc tccctgcaag acggctgcct gatctacaac 1080 gtcaagattc gcggcgtgaa cttcacctcc aatggtccag tgatgcagaa gaaaactctg 1140 ggatgggagg ccttcactga aactctgtac cccgccgatg gaggactgga ggggaggaac 1200 gatatggctt tgaagctcgt ggggggatcg cacctgattg cgaatgccaa gaccacctac 1260 agatccaaga aacccgccaa gaacctcaag atgcccggag tctactacgt ggactataga 1320 ctggaacgga tcaaggaagc caacaacgag acttacgtgg aacagcacga ggtcgctgtg 1380 gcacgctact gtgatctgcc gtcaaagctc gggcataagc tcaactgata a 1431 <210> 10 <211> 738 <212> DNA <213> Artificial sequence <220> <223> Red Fluorescent Protein Variant (TagRFP-T gene) <400> 10 atggtgtcaa agggagagga actgattaag gagaatatgc acatgaaact ctacatggag 60 gggaccgtga acaaccacca cttcaagtgc acctccgagg gcgaagggaa gccgtacgag 120 ggaactcaga ccatgcggat taaggtcgtc gaagggggtc ctctgccatt cgccttcgac 180 atcctcgcca catcctttat gtacggatcg cggaccttca tcaaccacac tcagggtatc 240 cccgacttct tcaagcaatc gttcccggaa ggctttactt gggagcgcgt gaccacctac 300 gaggatggag gggtgctgac ggccactcag gacaccagcc tgcaagacgg ctgtcttatc 360 tacaacgtga agattcgcgg cgtgaacttc cctagcaacg gtccggtcat gcagaaaaag 420 accctgggtt gggaggctaa caccgaaatg ctctatcctg cggacggagg attggaaggc 480 cggactgaca tggccctgaa acttgtgggc ggcggacatc tgatctgcaa tttcaagacc 540 acttaccgct ccaagaagcc cgccaagaac ctgaagatgc ctggagtgta ctacgtggac 600 cacagactcg aaaggatcaa ggaggcggat aaggaaacct acgtggaaca gcatgaagtg 660 gcagtggcca gatactgcga tctgccgtcc aagctcggcc acaagctgaa cggaatggac 720 gagctgtata agtgataa 738 <210> 11 <211> 714 <212> DNA <213> Artificial sequence <220> <223> Enhanced Green Fluorescent Protein (eGFP gene) <400> 11 atgagtaaag gagaggaact cttcaccgga gtcgtcccga tactcgtcga gctagacgga 60 gacgtcaacg gccacaaatt ctccgtctcc ggcgaggggg agggggacgc cacctacgga 120 aaactcaccc ttaagtttat ttgcactacc ggaaaactcc ccgtcccttg gccaacccta 180 gtcaccacgc tgacatacgg agtccaatgt ttctcgcggt atcccgacca catgaagcag 240 catgactttt tcaaatccgc gatgcctgag ggctacgtgc aggaacgcac catcttcttc 300 aaggacgacg ggaattacaa gactagagcc gaggtcaagt ttgaaggaga caccctcgtg 360 aatcgcatcg agcttaaggg cattgacttc aaggaggacg gcaacatcct gggtcacaag 420 ctggagtaca actacaactc gcataacgtc tacatcatgg ccgacaagca aaagaacggt 480 atcaaggtca acttcaagat taggcacaac attgaggatg ggtccgtcca actggccgac 540 cactaccagc agaacacccc catcggcgac ggacctgtgc tcctgcctga taaccactat 600 ctcagcactc agagcgcact gtccaaggac cctaacgaaa aacgggacca catggtcttg 660 ctggagttcg tgacagccgc tggtattacc ctgggcatgg atgaactgta taag 714 <210> 12 <211> 717 <212> DNA <213> Artificial sequence <220> <223> Blue Fluorescent Protein variant (TagBFP2 gene) <400> 12 atggtgtcga agggagagga gctgattaag gagaacatgc acatgaagct gtatatggaa 60 gggacggtgg acaaccacca cttcaagtgc accagcgaag gagaaggaaa gccttacgaa 120 ggcactcaaa ctatgcggat caaagtggtg gaaggcggtc ctcttccgtt cgccttcgac 180 atcttggcca cctccttcct ctacggctcc aagaccttta tcaaccacac ccagggaatc 240 ccggacttct ttaagcagag cttccctgag ggcttcacct gggaaagagt gacaacctac 300 gaggacggtg gcgtcctgac cgcgacccag gacacctccc tgcaagacgg ctgcctgatc 360 tacaacgtca agattcgcgg cgtgaacttc acctccaatg gtccagtgat gcagaagaaa 420 actctgggat gggaggcctt cactgaaact ctgtaccccg ccgatggagg actggagggg 480 aggaacgata tggctttgaa gctcgtgggg ggatcgcacc tgattgcgaa tgccaagacc 540 acctacagat ccaagaaacc cgccaagaac ctcaagatgc ccggagtcta ctacgtggac 600 tatagactgg aacggatcaa ggaagccaac aacgagactt acgtggaaca gcacgaggtc 660 gctgtggcac gctactgtga tctgccgtca aagctcgggc ataagctcaa ctgataa 717 <210> 13 <211> 792 <212> DNA <213> Artificial sequence <220> <223> Neomycin resistance gene (NeoR gene) <400> 13 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tc 792 <210> 14 <211> 1122 <212> DNA <213> Artificial sequence <220> <223> Partially modified native Glutamine Synthetase gene (GS gene) <400> 14 atggccacct cagcaagttc ccacttgaac aaaaacatca agcaaatgta cttgtgcctg 60 ccccagggtg agaaagtcca agccatgtat atctgggttg atggtactgg agaaggactg 120 cgctgcaaaa cccgcaccct ggactgtgag cccaagtgtg tagaagagtt acctgagtgg 180 aattttgatg gctctagtac ctttcagtct gagggctcca acagtgacat gtatctcagc 240 cctgttgcca tgtttcggga ccccttccgc agagatccca acaagctggt gttctgtgaa 300 gttttcaagt acaaccggaa gcctgcagag accaatttaa ggcactcgtg taaacggata 360 atggacatgg tgagcaacca gcacccctgg tttggaatgg aacaggagta tactctgatg 420 ggaacagatg ggcacccttt tggttggcct tccaatggct ttcctgggcc ccaaggtccg 480 tattactgtg gtgtgggcgc agacaaagcc tatggcaggg atatcgtgga ggctcactac 540 cgcgcctgct tgtatgctgg ggtcaagatt acaggaacaa atgctgaggt catgcctgcc 600 cagtgggagt tccaaatagg accctgtgaa ggaatccgca tgggagatca tctctgggtg 660 gcccgtttca tcttgcatcg agtatgtgaa gactttgggg taatagcaac ctttgacccc 720 aagcccattc ctgggaactg gaatggtgca ggctgccata ccaactttag caccaaggcc 780 atgcgggagg agaatggtct gaagcacatc gaggaggcca tcgagaaact aagcaagcgg 840 caccgctacc acattcgagc ctacgatccc aaggggggcc tggacaatgc ccgtcgtctg 900 actgggttcc acgaaacgtc caacatcaac gacttttctg ctggtgtcgc caatcgcagt 960 gccagcatcc gcattccccg gactgtcggc caggagaaga aaggttactt tgaagaccgc 1020 cgcccctctg ccaactgtga cccctttgca gtgacagaag ccatcgtccg cacatgcctt 1080 ctcaatgaga ctggcgacga gcccttccaa tacaaaaact aa 1122 <210> 15 <211> 39 <212> DNA <213> Artificial sequence <220> <223> 462 5' part of 5'UTR <400> 15 accatgggtt gaaccatggg ttgaaccatg ggttgaacc 39 <210> 16 <211> 15 <212> DNA <213> Artificial sequence <220> <223> 464 5' part of 5'UTR <400> 16 caaatgggtt gaacc 15

Claims (22)

  1. 복수의 핵산 서열 변이체로부터의 서열 최적화된 핵산 서열의 선택을 위한 방법으로서, 여기서 상기 서열 최적화된 핵산 서열은 정의된 표현형을 갖는 진핵생물 세포에 상응하며, 하기 단계를 포함하는 방법:
    i) 단리된 진핵생물 세포의 집단을 제공하는 단계로서, 각각의 세포는 사전-정의된 게놈 위치를 포함하며, 여기서 사전-정의된 게놈 위치는 하기를 포함하는 것인 단계:
    a. 제1 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 I1;
    b. 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E1; 및
    c. 프로모터 핵산 서열;
    ii) 복수의 공여자 벡터를 제공하는 단계로서, 각각의 공여자 벡터는 하기를 포함하는 것인 단계:
    a. 핵산 서열 I2;
    b. 상기 제2 DNA 효소에 대한 인식 부위를 포함하는 핵산 서열 E2;
    c. 제1 선택 마커를 코딩하는 핵산 서열; 및
    d. 핵산 서열 변이체를 포함하는 핵산 서열 영역,
    iii) 복수의 공여자 벡터를 제1 DNA 효소의 존재 하에서 세포의 집단과 접촉시키는 단계로서, 여기서 제1 DNA 효소의 존재는 공여자 벡터의 핵산 서열 I2 및 세포의 사전-정의된 게놈 위치에 존재하는 핵산 서열 I1 사이의 재조합을 가능하게 하는 것인 단계;
    iv) 세포에서 제1 선택 마커의 발현을 검출함으로써 사전-정의된 게놈 위치에서 통합된 공여자 벡터를 갖는 세포를 선택하고 단리하는 단계로서, 여기서 제1 선택 마커의 발현은 사전-정의된 게놈 위치에서의 프로모터 핵산 서열에 의해 활성화되는 것인 단계; 및
    v) 단계 iv)의 세포로부터 정의된 표현형을 갖는 세포를 선택하고 단리하며, 그에 의해 상기 핵산 서열 변이체로부터 서열 최적화된 핵산 서열을 선택하고 단리하는 단계로서, 상기 서열 최적화된 핵산 서열은 상기 정의된 표현형에 상응하는 것인 단계.
  2. 제1항에 있어서, 단계 ii)의 복수의 공여자 벡터의 각각이 하기를 추가로 포함하며:
    e. 제2 선택 마커를 코딩하는 발현 카세트;
    하기 단계를 추가로 포함하는 방법:
    vi) 핵산 서열 E1 및 E2에 의해 플랭킹된 핵산 서열을 제2 DNA 효소의 존재 하에서 단계 iii)의 세포 또는 단계 iv) 또는 단계 v)에서 선택되고 단리된 세포로부터 삭제하는 단계로서, 여기서 제2 DNA 효소의 존재는 핵산 서열 E1 및 E2 사이의 재조합을 가능하게 하고, 여기서 세포에서의 핵산 서열 E1 및 E2에 의해 플랭킹되지 않은 제2 선택 마커를 코딩하는 발현 카세트의 존재는 상기 세포의 사전-정의된 게놈 위치의 외부의 게놈 위치에서의 공여자 벡터의 안정한 통합을 지시하는 것인 단계; 및
    vii) 제2 선택 마커를 코딩하는 발현 카세트를 결여하는 단계 vi)으로부터의 세포를 선택하고 단리하는 단계.
  3. 제1항 또는 제2항에 있어서, 단리된 세포의 사전-정의된 게놈 위치에 존재하는 서열 최적화된 핵산 서열의 시퀀싱에 의해 단계 iv), v) 또는 vii)의 단리된 세포로부터 핵산 서열 정보를 수득하는 것을 추가로 포함하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 복수의 공여자 벡터의 핵산 서열 변이체가 프로모터의 변이체, 인트론의 변이체, 전사 조절 서열의 변이체, DNA 구조 조절 서열의 변이체, 5' 비번역된 영역의 변이체, 3' 비번역된 영역의 변이체, 내부 리보솜 진입 부위의 변이체, 관심의 유전자의 변이체, 신호 펩티드를 코딩하는 핵산 서열의 변이체 및/또는 이러한 변이체의 임의의 조합을 구성하는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 제1항의 단계 v)에서의 정의된 표현형을 갖는 세포의 선택에 의한 서열 최적화된 핵산 서열의 선택이 상기 세포의 하기 표현형적 특징 중 하나 이상에 기반한 선택을 포함하는 것인 방법:
    (i) 상기 세포에서의 내인성 생체분자의 존재 또는 발현 수준;
    (ii) 상기 세포에 의한 관심의 재조합 단백질의 발현 수준;
    (iii) 상기 세포의 성장 속도; 및/또는
    (iv) 상기 세포에서의 상기 핵산 서열 영역에 의해 코딩되는 관심의 재조합 단백질의 기능성.
  6. 제5항에 있어서, 상기 관심의 재조합 단백질이 재조합 융합 단백질, 예컨대 상기 세포 표면에서의 국재화를 위한 막 앵커 도메인에 융합된 단백질이고/거나, 형광 단백질 또는 형광 단백질 도메인에 융합된 단백질인 방법.
  7. 제5항에 있어서, 상기 내인성 생체분자가 단백질, mRNA, miRNA, lncRNA 또는 대사물을 구성하는 것인 방법.
  8. 제5항 또는 제6항에 있어서, 관심의 재조합 단백질의 상기 기능성이, 상기 세포의 세포 표면에서 국재화되고 발현되는 경우에 상기 관심의 재조합 단백질, 및 표적 구조, 예컨대 소분자, DNA 분자, RNA 분자, 단백질, 단백질 복합체, 예컨대 바이러스 입자, 엑소좀 또는 세포 사이의 상호작용에 기반하여 측정되고 결정되며, 임의적으로 여기서 상기 표적 구조는 형광 모이어티로 태그부착된 것인 방법.
  9. 제5항 내지 제8항 중 어느 한 항에 있어서, 상기 관심의 재조합 단백질이 친화성 단백질 후보이고, 발현의 수준이 상기 세포의 세포 표면 상의 상기 친화성 단백질 후보의 제시에 의해 결정되는 것인 방법.
  10. 제9항에 있어서, 상기 친화성 단백질 후보가 막 앵커 도메인에 융합된 단일 쇄 폴리펩티드이며, 임의적으로 여기서 상기 단일 쇄 폴리펩티드는 Z-스캐폴드 단백질, 나노바디 스캐폴드 단백질, 단일 쇄 단편 가변 (scfv) 스캐폴드 단백질, 피노머 스캐폴드 단백질, DARPin 스캐폴드 단백질 및/또는 애드넥틴 스캐폴드 단백질로 이루어진 군으로부터 선택되는 것인 방법.
  11. 제9항에 있어서, 상기 친화성 단백질 후보가 2개 이상의 폴리펩티드 쇄, 예컨대 항체 변이체를 포함하고, 상기 친화성 단백질 후보에 상응하는 핵산 서열 변이체가 친화성 단백질 후보 변이체, 예컨대 항체 변이체를 코딩하고, 상기 2개 이상의 폴리펩티드 중 하나가 막 앵커 도메인에 융합된 것인 방법.
  12. 제9항 내지 제11항 중 어느 한 항에 있어서, 친화성 단백질 후보가 노출되는 형광 마커로 임의적으로 표지된 특이적 표적 구성요소를 상기 친화성 단백질 후보에 제공하고, 그 후 상기 특이적 표적 구성요소에의 상기 친화성 단백질 후보의 결합을 검출함으로써 상기 친화성 단백질 후보의 결합 특이성, 선택성, 친화성 및/또는 기능성을 결정하는 것을 추가로 포함하는 방법.
  13. 제12항에 있어서, 상기 표적 구성요소가 소분자, DNA 분자, RNA 분자, 단백질, 단백질 복합체, 예컨대 바이러스 입자, 엑소좀 또는 세포로부터 선택되며, 임의적으로 여기서 상기 표적 구조는 형광 모이어티로 태그부착된 것인 방법.
  14. 제5항 내지 제13항 중 어느 한 항에 있어서, 관심의 재조합 단백질의 상기 발현 수준 또는 기능성 및/또는 내인성 생체분자의 상기 존재 또는 수준이 단일 세포의 수준에서, 예컨대 유동 세포계측법을 사용함으로써 측정되는 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 공여자 벡터의 상기 핵산 서열 영역이 상기 공여자 벡터로부터의 1개 또는 여러 개의 관심의 재조합 단백질의 발현을 위한 핵산 서열 변이체를 포함하며, 여기서 상기 복수의 공여자 벡터는 상기 1개 또는 여러 개의 관심의 재조합 단백질의 상이한 아미노산 서열 변이체를 코딩하는 상이한 핵산 서열 변이체를 포함하는 것인 방법.
  16. 제1항 내지 제14항 중 어느 한 항에 있어서, 공여자 벡터의 상기 핵산 서열 영역이 상기 공여자 벡터로부터의 관심의 재조합 단백질의 발현을 위한 핵산 서열 변이체를 포함하며, 여기서 복수의 공여자 벡터에 존재하는 핵산 서열 변이체는 상기 관심의 재조합 단백질의 본질적으로 동일한 아미노산 서열 변이체를 코딩하는 핵산 서열 변이체를 포함하는 것인 방법.
  17. 제1항 내지 제14항 중 어느 한 항에 있어서, 본질적으로 동일한 관심의 재조합 단백질을 코딩하는 본질적으로 동일한 핵산 서열을 포함하는 핵산 서열 영역을 포함하는 복수의 공여자 벡터를 포함하지만, 여기서 상기 핵산 서열 영역은 공여자 벡터 구성요소의 상이한 핵산 서열 변이체, 예컨대 상기 공여자 벡터의 프로모터 또는 인핸서 핵산 서열의 핵산 서열 변이체를 포함하는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 방법이 진핵생물 세포 시스템에 기반한 재조합 단백질 발현 시스템에 사용하기 위한 서열 최적화된 핵산 공여자 벡터 구성요소를 확인하는 것인 방법.
  19. 제1항 내지 제18항 중 어느 한 항의 방법에 의해 선택된 서열 최적화된 핵산 서열.
  20. 재조합 단백질을 생산하기 위한 제19항의 서열 최적화된 핵산 서열의 용도.
  21. 추가의 서열 최적화된 핵산 서열을 디자인하기 위한 제19항의 서열 최적화된 핵산 서열의 용도.
  22. 제1항 내지 제18항 중 어느 한 항의 방법에 의해 수득가능한 서열 최적화된 핵산 서열에 상응하는 정의된 표현형을 갖는 단리된 진핵생물 세포.
KR1020227038602A 2020-04-08 2021-04-06 핵산 서열의 선택을 위한 방법 KR20220165753A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2005179.3 2020-04-08
GBGB2005179.3A GB202005179D0 (en) 2020-04-08 2020-04-08 Methods for the selection of nucleic acid sequences
PCT/EP2021/058918 WO2021204787A1 (en) 2020-04-08 2021-04-06 Methods for the selection of nucleic acid sequences

Publications (1)

Publication Number Publication Date
KR20220165753A true KR20220165753A (ko) 2022-12-15

Family

ID=70768868

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227038602A KR20220165753A (ko) 2020-04-08 2021-04-06 핵산 서열의 선택을 위한 방법

Country Status (7)

Country Link
EP (1) EP4133088A1 (ko)
JP (1) JP2023520948A (ko)
KR (1) KR20220165753A (ko)
CN (1) CN115667526A (ko)
AU (1) AU2021252110A1 (ko)
GB (1) GB202005179D0 (ko)
WO (1) WO2021204787A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023159045A1 (en) * 2022-02-15 2023-08-24 Epicypher, Inc. Engineered recombinant protein-binding domains as detection reagents
WO2024081756A2 (en) * 2022-10-12 2024-04-18 Asimov Inc. Compositions and methods for adeno-associated viral production

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2528858C2 (ru) 2008-08-28 2014-09-20 Новартис Аг Дисплей на поверхности клеток полипептидных изоформ на основе прочитывания терминирующего кодона
KR102117225B1 (ko) * 2011-02-02 2020-06-02 테라비아 홀딩스 인코포레이티드 재조합 유지성 미생물로부터 생산된 맞춤 오일
US9708589B2 (en) * 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases

Also Published As

Publication number Publication date
JP2023520948A (ja) 2023-05-22
EP4133088A1 (en) 2023-02-15
CN115667526A (zh) 2023-01-31
GB202005179D0 (en) 2020-05-20
WO2021204787A1 (en) 2021-10-14
AU2021252110A1 (en) 2022-10-27

Similar Documents

Publication Publication Date Title
JP4489424B2 (ja) 染色体に基くプラットホーム
RU2233334C2 (ru) Способ встраивания нужной днк в геном клетки млекопитающего и векторная система для его осуществления
JP5797192B2 (ja) 細胞クローンのための阻害に基づくハイスループットスクリーニング方法
AU2002310275A1 (en) Chromosome-based platforms
KR20220165753A (ko) 핵산 서열의 선택을 위한 방법
JP7096790B2 (ja) 発現カセット
WO2002040685A9 (en) Vectors for conditional gene inactivation
CN106255749A (zh) 用于重组表达感兴趣多肽的新型脊椎动物细胞和方法
JP7002454B2 (ja) 遺伝子修飾アッセイ
JP2009538144A (ja) 真核細胞株を用いたタンパク質産生
KR20220164765A (ko) 표적화된 통합을 위한 방법
CN109868286B (zh) 一种慢病毒载体、慢病毒及其制备方法和应用
KR102256749B1 (ko) 고발현 세포주 확립방법
KR20180031875A (ko) 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법
JP2016514477A (ja) 哺乳動物細胞内で生物活性タンパク質を発現させるための方法および構築物
Gadgil et al. Cell Line Development for Biomanufacturing Processes
TWI475109B (zh) 通過抑制報告基因表現量的手段進行高產量細胞株選殖之策略
Shaw-White Analysis of chromosomal position-effects on gene expression in embryonic stem cells and their derivatives
Kim et al. Enzymatic production and expression of shRNAmir30 from cDNAs
Angrand et al. Application of Ligand-Dependent Site-Specific Recombination in ES Cells
CA2295475A1 (en) Complementation trap