KR20230137399A

KR20230137399A - 기능성 핵산 분자 및 방법

Info

Publication number: KR20230137399A
Application number: KR1020237029045A
Authority: KR
Inventors: 스티븐 폴라드; 유트 코버; 맨타스 마츄사이티스
Original assignee: 더 유니버시티 코트 오브 더 유니버시티 오브 에딘버그
Priority date: 2021-01-27
Filing date: 2022-01-26
Publication date: 2023-10-04
Also published as: WO2022162361A1; CN116867901A; AU2022212766A1; AU2022212766A9; JP2024504412A; CA3206298A1; EP4284935A1; US20240092847A1; BR112023014906A2; EP4036238A1

Abstract

본원 개시내용은 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서에 관한 것이다. 특히, 본원 개시내용은 표적 세포에서 발현되는 하나 이상의 전사 인자에 의해 활성화되고 전사 인자(들)에 의한 합성 슈퍼-인핸서의 활성화 시 불리한 페이로드와 같은 전이유전자를 발현하는데 사용되는 합성 슈퍼-인핸서를 기재한다.

Description

기능성 핵산 분자 및 방법

본원 개시내용은 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서에 관한 것이다. 특히, 본원 개시내용은 표적 세포에서 발현되는 전사 인자에 의해 활성화되고 활성화 시 표적 세포를 사멸시키기 위해 불리한 페이로드에 결합되는 합성 슈퍼-인핸서에 관한 것이다. 본원 개시내용은 SOX 계열의 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서에 관한 것이다.

유전자 치료요법, 특히 치료학적 단백질 카고가 고도의 세포 선택적 방식으로 발현되어 최대 용량을 보장하고 표적 외 효과를 감소시킬 필요가 있는 경우에 배치될 수 있는 세포 유형 특이적 인핸서 및 프로모터의 동정이 큰 관심대상이다. 그러나 현재 전략은 성공이 제한적이고 종종 크기, 선택성 또는 강도에서 타협해야 한다.

2개의 별개이지만 보완적인 전략을 사용하여 세포 유형 특이적 인핸서를 동정할 수 있다. 첫째, 관심 대상의 세포 유형에 대한 강력하고 선택적인 천연 인핸서는 관심 대상의 세포 유형 또는 계통에 대한 조절 네트워크의 체계적인 기능성 유전학적 해부로부터 나타날 수 있다. 둘째, 공지된 주요 전사 인자(TF)의 인공적으로 합성된 DNA 결합 모티프를 기반으로 완전 합성 인핸서를 구성할 수 있다. 이러한 모티프의 데이터베이스-일반적으로 약 5-10개 염기쌍 길이-는 JASPAR(참조: Jolma et al. 2013)과 같은 가장 강한 결합에 대한 생화학적 분석을 기반으로 정의되었다. 이들 전사 인자 결합 모티프는 풀링된 라이브러리를 사용하여 고속처리량으로 합성 및 스크리닝할 수 있다(참조: Jolma et al. 2013). 그러나 각각의 접근법에는 단점이 있다. 개별 천연 인핸서는 전형적으로 표현형 검정에 유용할 만큼 강하지 않거나 크기 제한 또는 부적절한 선택성에 의해 제한된다. 전사 인자 결합 모티프의 컨카터머(concatermer) 상에 만들어진 인공 프로모터는 발현을 유도할 수 있지만 천연 인핸서 서열에 존재하고 협력하는 Tf와 조인자들의 동원에 요구되는 적절한 '문법'-간격, 순서 및 적절한 친화성-을 갖지 않는다(참조: Farley et al. 2015). 따라서 이들은 선택성과 견고성이 없다.

프로모터 서열, 인핸서 서열 및 이러한 서열을 동정하는 방법은 당업계에 기재되어 있지만, 이들은 위에서 논의된 결점을 갖는다. WO2014066848 및 US2014/0296218은 세포 유형 특이적 유전자의 발현을 조절하는 데 유용하다고 주장되는 천연 슈퍼-인핸서 및 상기 슈퍼-인핸서를 동정하는 방법을 기재한다. WO2017155973은 재조합 파보바이러스에 사용하기 위한 합성 인핸서, 특히 큰 유전학적 페이로드를 전달할 수 있도록 크기가 감소된 인핸서를 기재한다. WO2012101191은 이들 모티프를 기반으로 최소화된 프로모터를 생성하기 위해 전사 인자 결합 부위 모티프 예측을 사용함에 의해 유전자의 선택적 발현을 위한 프로모터를 디자인하는 것을 기재한다.

따라서, 유전자 치료요법과 같은 치료학적 방법에 사용하기에 적합한 선택성 및 활성을 갖는 인핸서를 제공할 필요가 당업계에서 여전히 요구된다.

본 발명의 개요

제1 양상에 따르면, 하나 이상의 전사 인자에 의해 활성화되는 슈퍼-인핸서가 제공되고, 여기서 상기 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열은 전사 인자에 대한 결합 부위를 포함한다. 다른 교시에서, 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서가 제공되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열은 전사 인자를 위한 결합 부위 및 이의 게놈 유전자좌에 존재하는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드를 포함한다.

용어 "합성"은 일반적으로 상이한 게놈 유전자좌에 위치하는 2개 이상의 인핸서 서열이 단리되고 새로운 작제물 내에서 조합되는 슈퍼-인핸서 작제물을 포함할 수 있다. 따라서 합성 슈퍼 인핸서는 천연에 존재하지 않을 수 있고 인공 또는 '제조된'으로 기재될 수 있다. 따라서, 하나 이상의 전사 인자에 의해 활성화되는 작제물이 본원에 기재되고, 여기서 상기 작제물은 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열은 전사 인자에 대한 결합 부위를 포함한다. 편의를 위해, '합성 슈퍼-인핸서'라는 용어는 본원에 기재된 임의의 슈퍼-인핸서/작제물을 포괄하는 데 사용될 것이다.

추가 양상에 따르면, 전이유전자에 작동가능하게 연결된, 본원에 기재된 합성 슈퍼-인핸서를 포함하는 기능성 핵산 분자가 제공된다. 하나의 교시에서 기능성 핵산 분자는 전이유전자에 작동가능하게 연결된, 본원에 기재된 바와 같은 슈퍼-인핸서 작제물을 포함한다.

추가 양상에 따르면, 표적 비정상 세포에서 발현되는 하나 이상의 전사 인자에 의해 활성화된 합성 슈퍼-인핸서 및 불리한 페이로드를 포함하는 기능성 핵산 분자가 제공되고, 여기서 상기 페이로드는 전사 인자에 의해 합성 슈퍼-인핸서의 활성화 시 발현된다. 추가 교시에서, 표적 비정상 세포에서 발현되는 하나 이상의 전사 인자에 의해 활성화된 슈퍼-인핸서 작제물 및 불리한 페이로드를 포함하는 기능성 핵산 분자가 제공되고, 여기서 상기 페이로드는 전사 인자(들)에 의해 합성 슈퍼-인핸서 작제물의 활성화 시 발현된다.

추가 양상에 따르면, SOX 계열의 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서가 제공되고, 여기서 합성 슈퍼-인핸서는 2개 이상의 인핸서 서열 및 적어도 하나의 SOX 모티프 및/또는 SOX 이량체 모티프를 포함한다. 하나의 교시에서, SOX 계열의 하나 이상의 전사 인자에 의해 활성화되는 슈퍼-인핸서 작제물이 제공되고, 여기서 슈퍼-인핸서 작제물은 2개 이상의 인핸서 서열 및 적어도 하나의 SOX 모티프 및/또는 SOX 이량체 모티프를 포함한다.

추가 양상에 따르면, SOX2에 의해 활성화되는 합성 슈퍼-인핸서가 제공되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열은 적어도 하나의 SOX 이량체 모티프를 포함한다. 하나의 교시에서, SOX2에 의해 활성화되는 슈퍼-인핸서 작제물이 제공되고, 여기서 슈퍼-인핸서 작제물은 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열은 적어도 하나의 SOX 이량체 모티프를 포함한다.

추가 양상에 따르면, 본원에 기재된 바와 같은 합성 슈퍼-인핸서, 슈퍼 인해서 작제물, 또는 기능성 핵산 분자를 포함하는 벡터가 제공된다.

추가 양상에 따르면, 본원에 기재된 바와 같은 합성 슈퍼-인핸서, 슈퍼-인핸서 작제물, 기능성 핵산 분자 또는 벡터, 및 허용되는 담체를 포함하는 조성물이 제공된다.

추가 양상에 따르면, 치료요법에 사용하기 위한, 본원에 기재된 기능성 핵산 분자를 포함하는 조성물이 제공된다.

추가 양상에 따르면, 암의 치료에 사용하기 위한, 본원에 기재된 기능성 핵산 분자를 포함하는 조성물이 제공된다.

추가 양상에 따르면, 본원에 기재된 바와 같은 불리한 페이로드를 포함하는 기능성 핵산 분자를 포함하는 키트가 제공되고, 여기서 불리한 페이로드는 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자이고, 키트는 기능성 핵산 분자, 벡터 또는 조성물과 함께 투여하기 위한 상기 불활성 전구약물을 추가로 포함한다.

추가 양상에 따르면, 본원에 기재된 바와 같은 기능성 핵산 분자 또는 조성물을 환자에게 투여하는 것을 포함하는 암을 치료하기 위한 방법이 제공된다.

추가 양상에 따르면, 기능성 핵산 분자 및 불활성 전구약물을 환자에게 투여하는 것을 포함하는 교모세포종을 치료하기 위한 방법이 제공되고,

여기서 기능성 핵산은 SOX 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서 및 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자를 포함하고,

여기서 자살 유전자는 교모세포종 세포에서 SOX 전사 인자에 의한 합성 슈퍼-인핸서의 활성화 시 발현된다.

하나의 교시에서, 기능성 핵산 분자 및 불활성 전구약물을 환자에게 투여하는 것을 포함하는 교모세포종을 치료하기 위한 방법이 제공되고,

여기서 기능성 핵산은 SOX 전사 인자에 의해 활성화되는 슈퍼-인핸서 작제물 및 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자를 포함하고,

여기서 자살 유전자는 교모세포종 세포에서 SOX 전사 인자에 의한 슈퍼-인핸서 작제물의 활성화 시 발현된다.

도 1: SOX2 ChIP-Seq 피크에서 동정된 후보 전체 길이 인핸서는 상승작용적으로 작용할 수 있고 선택적으로 활성이다. (A) 후보 인핸서 270에 의해 예시된 mCMV 및 후보 인핸서에 의해 구동되는 작제물의 도식. mCMV의 업스트림일 때 GSC7(B) 또는 G328(C)에서 14개의 후보 인핸서는 활성이고; 전장 CMV 프로모터는 양성 참조 대조군으로서 제공된다. (D) HEK293 세포에서 후보 인핸서의 활성. (E) 인핸서 270 클러스터링의 도식. (F) 인핸서 활성은 4 x 270 인핸서가 함께 클러스터링될때 최고이다. (G) HEK293 세포에서 클러스터링된 인핸서 작제물의 활성. (H) GSC 차등화에서 선택성의 개요. (I) SSE-T4의 활성의 유동 세포측정(패널 K에서 '4x Top4'로서 지칭됨). (J) 패널 (I)에서 스코어링된 세포에서 SSE-T4(본원에서 SSE-4라고도 함)에서 활성의 생존 세포 이미지. (K) 조합된 다수의 인핸서의 시험을 위한 작제물 디자인의 도식. (L) GSC7의 루시퍼라제 검정에서 패널 K로부터의 작제물의 상대적 활성(스케일화되지 않음). 쌍을 이룬 이원 Anova, * = p-값 ≤0.05, ** = p-값e ≤0.01. 모든 도트는 생물학적 복제물을 나타낸다.
도 2: 플레이트 기반 루시퍼라제 리포터 검정을 사용한 배열된 플라스미드 라이브러리(~4000개 플라스미드)의 기능성 인핸서 스크리닝. (A) 인핸서 스크리닝의 실험 개요. (B) 인핸서 스크리닝에 대한 결과 (C) Nanoluc DLR 검정에서 초기 스크리닝의 135개 히트의 확증 (D) 히트의 대부분(mCMV 보다 >10 큼)은 인트론 영역에 있다. (E) GSC7, (F) GSC328, (G) HEK293, (H) huFb710에서 상부 17개 히트에 대한 mNGreen+세포의 % (I) GSC7, (J) GSC328, (K) HEK293 및 (L) huFb170에서 mNGreen+ 세포의 MFI.
도 3: 제한 효소 어댑터 클로닝 부위가 제거된 합성 슈퍼-인핸서의 비교. (A) 2개 복제 생산물 합성 슈퍼-인핸서 디자인의 개요 - C1은 2a 복제 생산물(974bp)를 나타내고 Gb1은 2b 복제 생산물(640 bp)를 나타내고; A = 20 bp 어댑터, 인접한 흰색 박스 = 90 bp 스페이서; n = 3개의 생물학적 복제물. 주지사항: 크기의 겉보기 불일치는 단순화를 위한 계획에서 설명되지 않은 6 x 4 bp 클로닝 부위로 인한 것이다. (B) 2a 복제 생산물 및 2b 복제 생산물 합성 슈퍼-인핸서를 비교하기 위한 Nanoglo DLR 검정(각각 클로닝 부위/어댑터가 제거된 경우와 제거되지 않은 경우). (C) 2a 복제 생산물 및 2b 복제 생산물 합성 슈퍼-인핸서의 mNGreen+ 세포의 퍼센트. (D) 2a 복제 생산물 및 2b 복제 생산물 합성 슈퍼-인핸서에서 mNGreen+ 세포의 MFI. (E) 2a 복제 생산물 및 2b 복제 생산물 합성 슈퍼-인핸서에 대한 대표적인 생존 세포 이미지; 배율 20배, 스케일바 = 50 μm.
도 4: SSE-7은 GSC 및 전뇌 신경 줄기 세포(NSC)에 대한 선택성을 갖고 있다. (A) SSE(SSE-1에서 SSE-7까지; 좌측 숫자)를 포함하는 4개- 부분 조합에 대한 디자인의 도식. (B) 유동 세포측정은 이들 모두가 CMV와 유사한 수준으로 활성을 가짐을 확인시켜 준다. (C) HEK293 세포에서, 모든 SSE는 불활성이다. (D) 사람 섬유아세포(huFb170)에서, 모든 SSE는 불활성이다. (E) 5% FCS를 사용하여 성상 세포 분화 동안 SSE-7 및 대조군에 대한 생존 세포 이미지. (F) 5% FCS에서 SSE-7 및 대조군의 mNGreen+ 세포의 %. (G) 0일에 CMV 발현으로 정규화된 SSE-7에 대한 mNGreen+ 세포의 MFI. (H) 제브라피시 배아 및 애벌레에서 SSE-7의 평가를 위한 실험적 개요. (J) 주사 제어(I) 상기 실험에 사용된 작제물의 도식. (K) 수정 후 24시간 및 48시간 (hpf)에 2a 복제 생산물 플라스미드 C1, C3, C5 및 C7의 활성(주지사항: 이들은 후자의 유도체인 각각 SSE-1, 3, 5 및 7에 상응하고, 어댑터 서열을 포함함).
도 5: 여러 단백질의 발현을 유도하는 SSE-7에 대한 유동 세포측정 및 웨스턴 면역블롯 결과 (a) 폴리시스트론 전사체(P2A 자가-절단 펩타이드 서열 포함)에서 SSE-7로부터의 mCherry 및 HSV-TKv5 발현 둘 다를 설명하는 발현 카세트의 도식. (b) 바이러스 전달(AAV)로 상기 핵산을 전달한 후 mCherry 발현 수준을 보여주는 유동 세포측정 데이터. (c) 양성 mCherry 발현 세포 및 (d, e 및 f)의 %를 스코어링하기 위한 유동 세포측정 결과의 정량화는 게이팅 전략을 보여준다. (g) HSV-TK 단백질 발현을 확인하는 웨스턴 블롯(검출을 위해 융합된 v5 C-말단 에피토프 태그 사용). (h) (g)에서 웨스턴 블롯 결과의 정량화.
도 6: MTT 검정 및 생존 Incucyte 이미지화로부터의 세포독성 결과. (a) 200 μM GCV, 0.2% DMSO(비히클 대조군) 또는 20% DMSO(양성 대조군)의 존재 하에 CMV 또는 SSE-7 구동 TKv5-P2A-mCherry로 형질도입되거나 형질도입되지 않은 사람 GSC7 세포의 시간 경과에 따른 컨플루언스 변화. (b) 기재된 조건에서 GSC7 세포의 MTT 검정 데이터 요약. 각각의 도트는 생물학적 복제물을 나타낸다. MTT 값은 비히클 대조군으로 정규화하였다. 오차 막대는 SD (N=3)를 나타낸다. (c) 200 μM GCV의 존재 하에서 작제물로 형질도입된 세포에서 세포 수 및 형태학적 변화를 입증하는 3일 및 8일째 GSC7 세포의 생존 이미지. (d) 200 μM GCV의 존재 하에서 작제물로 형질도입된 세포에서 세포 수 및 형태학적 변화를 입증하는 17일째 huFB170 세포의 생존 이미지. (e) 기재된 조건에서 huFB170 세포의 MTT 검정 데이터 요약. 각각의 도트는 생물학적 복제물을 나타낸다. MTT 값은 비히클 대조군으로 정규화하였다(N=1).
도 7: GSC의 범위에서 SSE-7의 활성. (A) 발현 카세트의 도식. (B) 실험 개요, (C) 시험된 다양한 세포주에 걸쳐 개별 세포에 대한 mCherry 발현 %의 결과. GSC7은 시험된 양성 대조군 세포주(이로부터의 단편이 초기에 스크리닝됨)였다. E17, E28(이전에는 G328로 호칭됨), E21, E31, E34는 5개의 추가 환자 유래 교모세포종 세포주를 지칭한다.
도 8: SOX 이량체 모티프는 활성에 대한 주요 기여자이고 SOX2 및 SOX9 둘 다에 결합된다. (A) 본 발명의 데이터 세트에서 MEME에 의해 동정된바와 같은 SOX 이량체 모티프는 상위 32개의 활성 단편에서 풍부함. (B) TRANSFAC 데이터베이스로부터의 이량체 SOXE 모티프(참조: Huang et al. 2015). (C) HOMER에 의해 알려진 모티프에서 발견된 가장 강한 모티프. (D) 전사 활동이 결여된 추정 인핸서에서 데이터 세트에서 발견된 SOX 이량체 모티프의 맵핑. (E) (A)로부터 제1 복제 생산물 스크리닝의 Top51 양성 히트로의 SOX 이량체 모티프 맵핑은 상기 모티프가 보다 높은 빈도로 발견됨을 확인시켜 준다. 단편의 활성은 좌측면 상에 나타낸다. (F) DNA는 비오티닐화된 프라이머를 사용하여 PCR 증폭되었고 핵 추출물과 함께 항온처리하였다. 하강된 용출물을 질량 분광측정기로 분석하여 결합된 단백질을 동정하였다. (G) ID1101에 의해 하강된 단백질의 요약(상부 원형은 모든 사람 전사 인자를 나타낸다). SOX2는 ID1101과 상호작용하는 2개의 세포주 간의 공유된 표적이다. GSC7 및 GSC328에 걸친 11개의 공유된 히트 내에는 3개의 관심 대상의 단백질(히스톤 아세틸트랜스퍼라제 복합체의 성분 둘 다인 NOC2L 및 DMAP1, 기본 전사 기계의 주요 성분인 TFIID); 여러 SOX 계열 구성원 단백질도 단리되었다. SOX2는 (H) GSC7 및 (I) GSC328에서 ID1101과 선택적으로 상호작용한다. (J) 활성을 조사하기 위해 사용된 야생형(WT) 서열의 SOX 이량체 모티프 변이체(S9D1-10). 서열번호 83으로 포함된 WT 서열, S9D1-S9D2는 서열번호 84-85로 포함되고, S9D6-S9D9는 서열번호 86-89로 포함된다. (K) GSC7 및 (L) GSC328에서 SOX 이량체 모티프 돌연변이체의 활성. (M) SOX9는 ID1101 및 ID2904와 선택적으로 상호작용한다. 서열 599는 무작위 DNA 음성 대조군이다.
도 9: 뇌 또는 신경교종 관련 발현을 갖는 추정 표적 유전자를 갖는 SOX 이량체 모티프가 풍부한 인핸서의 제2 복제 생산물 스크리닝이 수행되었다. (A) 제2 복제 생산물의 스크리닝을 위한 후보 인핸서의 선택. (B) SOX 이량체 모티프. (C) SOX 이량체 모티프 및 후보 표적 유전자를 기반으로 하는 활성 인핸서를 동정하기 위한 제1 및 (D) 제2 스크리닝. (E) 제2 복제 생산물 SSE 어셈블리의 도식 및 리포터 유전자 검정을 사용한 후속 측정. (F) (F) GSC7 및 (G) huFb170에서 209개의 제2 복제 생산물 SSE에 걸친 스크리닝.
도 10: 이중 페이로드를 갖는 예시적인 SSE-7에서 관찰된 상당한 생존 및 종양 제거. 세포 독성 및 면역 조절 페이로드의 GBM 줄기 세포 선택적 발현은 생체 내에서 종양 세포의 선택적 제거에 대한 개념 증명을 입증한다. (A) SSE-7이 면역자극성 사이토킨 IL-12와 함께 세포독성 효소/전구약물 페이로드(HSV-TK)의 이중 발현을 구동시키는 AAV 디자인의 도식. 이들은 SSE-7에 의해 제어되는 단일 시스트론(P2A를 통해)에서 생성되어 조합된 표현을 보장한다. (B) 캐플란-마이어(Kaplan-Meier) 생존 곡선은 SSE-7을 사용한 유전자 치료요법의 상당한 생존 이점과 처리된 마우스의 장기 생존력 및 독성 부재를 입증한다. (C 및 D) 생존 마우스의 생물발광 이미지화는 종양 성장을 추적할 수 있게 한다. (C) GBM의 면역적격 마우스 모델에서 종양은 신속하게 성장하고 3-4주 내에 마우스를 죽인다. (D) 종양이 SSE 구동되는 페이로드와 함께 AAV의 직접 주사에 의해 처리되는 경우, 종양은 (C)에 나타낸 모든 대조군 미처리된 마우스가 큰 종양 매쓰로 죽은 후 >5주 동안 검출가능한 종양 세포 없이 몇 주 동안 완전하다.
도 11: mCMV 프로모터는 SSE 활성을 위해 요구되지 않는다. (A) 무작위 DNA 서열에 의해 대체된 mCMV와 함께 SSE에 테더링된 mCMV 프로모터에 대한 요구 사항을 탐색하는 데 사용되는 벡터 디자인의 도식. (B) mCMV 유무에 관계없이 SSE의 유동 세포측정 분석은 SSE가 기능을 유지하고 매우 활성임을 확인시켜 준다. (C) 전사 시작 부위의 업스트림에 SSE를 위치시키기 위한 스페이서로서 작용하는 무작위 DNA 서열에 대한 요구 사항을 탐색하는 데 사용되는 벡터 디자인의 도식. (D) 활성의 유동 세포측정 분석은 SSE가 위치 지정을 위한 추가 무작위 서열 없이 여전히 기능할 수 있지만 활성 수준이 감소되었음을 확인시켜 준다.
도 12: 환자 GSC 사이의 SSE-7 활성의 가변성은 NEUROG2와 같은 신경 분화 마커의 수준과 상관관계가 있다. 본원에 기재된 SSE 작제물은 미성숙 GBM 줄기 세포 유사 세포에 매우 특이적이다. SSE의 활성은 세포가 NEUROG2 구동된 신경 분화 또는 SOX10 구동된 희소돌기아교세포 분화와 같은 대체 분화 경로에 진입하기 시작함에 따라 감소한다. (A) SSE-7-mCherry 리포터가 높고 낮은 세포의 RNA-seq 프로파일링에 의해 동정된 차등적으로 발현된 유전자를 보여주는 화산 플롯. 보다 낮은 발현 세포는 줄기 세포 상태에서 분화로의 출구를 표시하는 주요 전사 인자의 발현을 풍부하게 하였다. 대조적으로 최고 발현은 SOX2와 가장 밀접한 관련이 있는 SOX1의 수준을 증가시켰다. (B) (A)로부터 차등적으로 발현된 상위 50개 유전자에 대한 RNA-seq 유전자 발현 패턴의 히트맵. 화살촉은 NEUROG2를 나타낸다.
도 13: 다양한 제2 복제 생산물 SSE는 모두 마우스 GSC에서 활성을 입증한다. SOX 모티프 및 SOX 이량체 모티프가 풍부한 인핸서 단편을 포함하는 SSE의 활성을 평가하기 위한 유동 세포측정은 이들이 모두 GSC에서 전장 CMV에 필적하는 높은 수준의 발현을 구동시킬 수 있음을 확인시켜 준다.
도 14: 예시적인 SSE-7은 또한 렌티바이러스와 함께 배치되는 경우 양호한 활성을 갖는다. SSE-7-mCherry 리포터를 포함하는 렌티바이러스로 형질도입된 GSC에서 mCherry 리포터 수준의 유동 세포측정 정량화. 높은 수준의 발현은 SSE-7이 있는 렌티바이러스에 대해 달성되며, 이는 각각 (A)와 (B)에서 두 개의 서로 다른 GSC 환자 라인인 E31과 E55를 사용하여 광범위한 바이러스 벡터를 사용하여 전이유전자가 전달될 수 있음을 입증한다.

본원 개시내용은 신규 (합성) 슈퍼-인핸서(S)SE)에 관한 것이고, 치료 및 불리한 페이로드와 같은 전이유전자를 전달하는 혁신적인 방법을 제공한다. 세포 유형 특이적 유전자 조절에 대한 지식의 진보를 바탕으로, 본원 발명자들은 전장 인핸서 내에 주요 기능성 요소 및 전사 인자 모티프를 유지하는 인핸서를 인위적으로(또는 합성적으로) 어셈블리함으로써 SSE를 생성하는 것이 가능할 것이라고 추론하였다. 이것은 이들 인핸서에서 직접 전사 인자 모티프를 둘러싸는 천연 및 기능성 플랭킹 서열을 활용하는 것을 포함할 수 있다. 상기 전략은 주요 세포 유형 특이적 TF(적절한 간격으로 낮은 친화성)에 대한 천연 국소 전사 인자(TF) 결합 맥락을 유지하는 것을 목표로 하지만, 강력한 전사를 유발하기 위해 고농도의 TF 결합을 촉진하고, 즉, 세포 유형 특이적 인핸서 내에서 TF 모티프의 적당한 문법(공동 결합 단백질의 간격, 친화성 및 배향)이지만 다중 부분 배열로 조합함에 의해 전사 활성을 부스팅한다. 본원에 기재된 바와 같이, 기능적으로 주석이 달린 인핸서의 조합 어셈블리를 사용하는 SSE의 작제가 특히 유전자 치료요법에서 많은 응용을 가질 강력하면서도 높은 세포 유형 선택적 조절 요소를 생성한다는 것이 밝혀졌다.

합성 슈퍼-인핸서

제1 양상에 따르면, 하나 이상의 전사 인자에 의해 활성화되는 슈퍼-인핸서가 제공되고, 여기서 상기 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열은 전사 인자에 대한 결합 부위를 포함한다. 또 다른 교시에서, 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서가 제공되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열은 전사 인자를 위한 결합 부위 및 이의 게놈 유전자좌에 존재하는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드를 포함한다. 추가의 교시에서, 하나 이상의 전사 인자에 의해 활성화되는 슈퍼-인핸서 작제물이 제공되고, 여기서 상기 슈퍼-인핸서 작제물은 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열은 전사 인자에 대한 결합 부위를 포함한다.

본원에서 사용되는 바와 같이, "인핸서"는 유전자의 전사를 증진시키기 위해 단백질(예를 들어, 전사 인자)에 의해 결합되는 DNA 서열(예를 들어, "인핸서 서열")을 지칭한다. 용어 "인핸서"는, 예를 들어, 전사 인자에 의해 결합되는 DNA의 특정 짧은 영역(통상적으로 50-1500 bp)을 포함할 수 있다. 그럼에도 불구하고, 인핸서 서열은 직접 전사 인자 모티프를 플랭킹하거나 둘러싸는 서열의 일부를 추가로 포함할 수 있다. 인핸서는 전형적으로 시스 조절 요소로 작용하지만 트랜스에서도 작용할 수 있으며 하나 이상의 표적 유전자를 활성화시킬 수 있다. DNA 폴딩 및 형태로 인해 또는 다중 분자 구획(상 분리에 의해 형성될 수 있는 전사 허브 또는 응축물로 지칭됨)의 촉진을 통해 이들은 조절되는 유전자의 전사 시작 부위(TSS)에서 원거리에 위치할 수 있다. 대조적으로, 프로모터는 전사 개시 부위에 근접한 동일한 DNA 서열 상의 TSS의 업스트림에 있다. 프로모터는 전사를 개시하기 위해 RNA 폴리머라제 II에 의해 결합된다.

H3K27Ac는 인핸서에서 통상적으로 발견되는 히스톤 변형이고 인핸서 활성 영역을 예측하는 데 사용될 수 있다. 서열이 유전자 전사를 증진시키는지(따라서 "인핸서"로 지칭될 수 있음)의 결정은 당업계에 공지된 방법, 가장 통상적으로 플라스미드 기반 리포터 검정을 사용하여 결정될 수 있다.

슈퍼-인핸서는 또한 전사의 활성화 또는 조절에 관여한다. 본질적으로 "슈퍼-인핸서"라는 용어는 일반적으로 5-15 kb 영역에 걸쳐 있는 여러 인핸서 클러스터를 포함하는 서열을 지칭한다. 이들 "슈퍼-인핸서"는 평균 인핸서에 비해 매개자 복합체와 같은 전사 보조활성화 인자가 많이 차지한다. 이들은 평균 인핸서보다 더 큰 활성을 나타내고, 세포 정체성 또는 질환 상태를 유지하는 것에 관여하는 세포 유형 특이적 유전자의 발현을 구동시키는 데 자주 관여한다(예를 들어, US2014/0296218 및 US2014/0287932 참조하고, 이들은 전문이 본원에 참조로 인용됨). 본원에서 "슈퍼-인핸서", "합성 슈퍼-인핸서"(또는 "SSE") 또는 슈퍼-인핸서 작제물에 대한 언급은 천연에서 발견되지 않는 슈퍼-인핸서를 지칭하고, 즉 본원에 기재된 목적을 위해 디자인된 인공적으로 작제된 슈퍼-인핸서이고, 이는 천연 슈퍼-인핸서와 관련된 특성을 나타낼 수 있는 것으로 이해될 것이다. 특히, SSE는 2개 이상의 인핸서 서열(서로 다른 게놈 유전자좌로부터 유래될 수 있음)을 포함하는 인공 작제물이다. 다시, 그리고 의심의 여지를 피하기 위해, "SSE"라는 용어는 본원에 기재된 임의의 슈퍼-인핸서, 합성 슈퍼-인핸서 및/또는 슈퍼-인핸서 작제물을 포함하기 위해 사용될 것이다. SSE는 전사 활성화를 자극하기 위해 전사 인자 모티프가 매우 풍부할 수 있다. 이것은 SSE에 결합하는 전사 인자의 고농도가 전사 활성을 촉진하기 때문에 SSE 서열이 천연 슈퍼-인핸서보다 짧을 수 있게 한다.

하나의 구현예에서, 본원 개시내용은 표적 세포에서 발현되는 전사 인자 - 또는 전사 인자의 독특한 조합-에 의해 활성화되는 SSE에 전이유전자를 커플링함으로써 전이유전자를 전달하는 혁신적인 방법을 제공한다. 따라서, 표적 세포에서 전사 인자(들)의 내인성 발현은 매우 선택적인 방식으로 외인성 전이유전자의 발현을 개시하기 위해 사용된다. 바람직하게는, 전사 인자는 세포 유형 또는 계통 특이적 발현 패턴을 가지므로 표적 세포 이외의 세포에서 최소로 발현되고, 즉 편재적으로 발현되지 않는다. 이는 SSE의 세포 유형 또는 세포 상태 선택적인 활성화 및 전이유전자의 발현을 가능하게 하여 표적 외 독성을 최소화한다. 하나의 구현예에서, 전사 인자는 표적 세포에서, 즉, 다른 세포 유형과 비교하여 차등적으로 발현된다. SSE의 사용은 또한 전이유전자의 높은 발현, 바람직하게는 전장 사이토메갈로바이러스(CMV) 프로모터와 같은 강력한 프로모터를 사용할 때 전이유전자의 발현에 근접하거나 이에 상응하는 발현을 제공한다. SSE는 매우 선택적이고 강력하며 크기가 작을 수 있다(바람직하게는 500 염기쌍 미만). 이들은 세포 유형 정체성 또는 상태에 따라 최소 발현에서 매우 강한 발현까지 관련 개방 판독 프레임/전이유전자에 대한 유전자 발현의 '스위치'를 제공한다.

인핸서 및 슈퍼-인핸서 기능은 최소 프로모터(예를 들어, 최소 CMV)와 같은 프로모터의 존재를 수반할 수 있고, 이는 전사 기구의 동원을 용이하게 하는 주요 영역을 포함하고 전형적으로 TSS를 포함한다. 대안적인 구현예에서, 본원 개시내용의 SSE는 프로모터 및/또는 최소 CMV 프로모터를 포함하지 않을 수 있다.

본원에서 사용되는 바와 같이, "전사 인자"라는 용어는 표적 유전자의 조절 요소에 결합하여 표적 유전자의 발현을 조절하는, 예를 들어 증가시키거나 감소시키는, 단백질을 지칭한다. 전사 인자(TF)는 흔히 TF에 존재하는 DNA 결합 도메인의 유형에 따라 분류된다. 진핵생물에서 가장 통상적인 DNA 결합 도메인은 아연 핑거, 호메오도메인, 기본 류신 지퍼 및 기본 나선-루프-나선 도메인이다. 동일한 DNA 결합 도메인을 갖는 TF 파라로그는 종종 유사한 DNA 서열을 인지한다. 본원에 기재된 합성 슈퍼-인핸서는 하나 이상의 전사 인자에 의해 결합될 수 있는데, 즉 하나 이상의 전사 인자는 활성화를 초래하는 SSE에 결합한다. 활성화는 RNA 폴리머라제 II의 동원을 통해 일어나고, 그에 따라 연관된 유전자(즉, 전이유전자)의 발현을 활성화하여 프로모터 단독에 의한 발현 수준 이상으로 전사를 증진시킨다. SSE에 대한 전사 인자의 결합은 연관된 전사 및 염색질 조절 기구를 포함할 수 있다.

하나의 구현예에서, 전사 인자는 발생 또는 줄기 세포 관련 전사 인자이다. 이들 유형의 전사 인자는 줄기 세포에서 또는 세포 발달 동안 높은 수준의 활성화와 연관되어 있다.

하나의 구현예에서, 전사 인자는 SOX 계열의 전사 인자이다. 전사 인자의 SOX(SRY-관련된 HMG 박스) 유전자 계열은 사람 및 마우스 게놈에서 20개 구성원을 포함하고 모두는 높은-이동성-그룹(HMG) 박스 도메인을 공유한다. 높은 상동성을 갖는 SOX 계열 구성원은 그룹으로 분류된다: (SoxA, SoxB1, SoxB2, SoxC, SoxD, SoxE, SoxF, SoxG 및 SoxH). 하나의 구현예에서, 전사 인자는 SoxB1(즉, SOX1, SOX2, SOX3) 또는 SoxE(즉, SOX8, SOX9, SOX10) 전사 인자이다.

SOX2는 암 줄기 세포의 중요한 조절인자로 출현하였다(참조: Bulstrode et al. 2017, Gangemi et al. 2009, Guerra-Rebollo et al. 2019, Lujan et al. 2012, D. K. Singh et al. 2017, S. K. Singh et al. 2004, and Boumahdi et al. 2014). 교모세포종 줄기 세포(GSC) 및 이들의 분화된 자손에 대한 ChIP-seq 데이터세트는 히스톤 H3 인핸서 마크(H3K27ac)와 GSC에 고유한 SOX2 결합을 카테고리화한 슈바 등( et al. 2014)에 의해 보고되었다. 특히, 본원 발명자들은 다양한 환자-유래 라인에 걸쳐 GSC에서 작용하는 후보 SOX2 조절 인핸서 세트를 동정하였다. 따라서, 하나의 구현예에서, 전사 인자는 SOX2이다.

전사 인자는 표적 인핸서에서 특정 모티프(즉, 전사 인자 결합 부위)에 결합하는 전사 인자의 DNA 결합 도메인을 이용하여 결합한다. 전형적으로, 전사 인자 결합 부위 서열은 5-15 bp 길이이다.

하나의 구현예에서, 합성 슈퍼-인핸서(SSE)는 적어도 하나의 SOX 이량체 모티프를 포함한다. 이러한 모티프는 표적 세포에서 SSE의 기능에 중요할 수 있고, 예를 들어 본원에 기재된 많은 인핸서 서열은 교모세포종 줄기 세포에서 활성을 유지하는 데 필요한 SOX 이량체 부위를 포함하는 것으로 나타났다. 인핸서 요소는 SOX 전사 인자가 동종이량체 또는 이종이량체일 수 있는 SOX 결합 부위(때로는 팔린드롬 서열)를 포함할 수 있다. 전형적으로 각 개별 단량체 결합 모티프 사이의 간격은 약 8-12bp이다.

하나의 구현예에서, SOX 이량체 모티프는 서열번호 1을 포함한다:

ACAAAGRGSVBYTKK

여기서:

R은 A 또는 G를 나타내고; S는 C 또는 G를 나타내고; V는 A, C 또는 G를 나타내고; B는 C, G 또는 T를 나타내고; Y는 C 또는 T를 나타내고; K는 G 또는 T를 나타낸다.

추가의 구현예에서, SOX 이량체 모티프는 서열번호 2를 포함한다:

RRRRASARAGRRRBBHDDBWH

여기서:

R은 A 또는 G를 나타내고; S는 C 또는 G를 나타내고; B는 C, G 또는 T를 나타내고; H는 A, C 또는 T를 나타내고; D는 A, G 또는 T를 나타내고; W는 A 또는 T를 나타낸다.

하나의 구현예에서, 합성 슈퍼-인핸서는 적어도 하나의 SOX 모티프를 포함한다. 추가의 구현예에서, SOX 모티프는 SOX2 모티프이다.

하나의 구현예에서, SOX2 모티프는 서열번호 3을 포함한다:

WSARAGRSMYMHTBB

여기서:

W는 A 또는 T를 나타내고; S는 C 또는 G를 나타내고; R은 A 또는 G를 나타내고; M은 A 또는 C를 나타내고; Y는 C 또는 T를 나타내고; H는 A, C 또는 T를 나타내고; B는 C, G 또는 T를 나타낸다.

하나의 구현예에서, 합성 슈퍼-인핸서는 SOX 모티프 및/또는 SOX 이량체 모티프로부터 선택된 서열을 포함한다.

본원에 설명된 바와 같이, 슈퍼-인핸서는 인핸서 서열의 클러스터를 지칭한다. 따라서, 하나의 구현예에서, 합성 슈퍼-인핸서는 2개 이상의 인핸서 서열을 포함한다. 추가 구현예에서, 합성 슈퍼-인핸서는 2개 내지 8개의 인핸서 서열을 포함한다. 여전히 추가 구현예에서, 합성 슈퍼-인핸서는 4개의 인핸서 서열을 포함한다.

인핸서 요소는 당업계에 공지된 기술을 사용하여 동정될 수 있다. 예를 들어, 본원에 기재된 방법은 특정 세포 유형에 대한 ChIP-seq 데이터세트를 사용하여 관심 대상의 전사 인자 또는 염색질 접근성 검정(예를 들어, ATAC-seq 또는 MNase 프로파일링)의 사용에 의해 결합된 인핸서를 동정하였다. ENCODE 또는 암 게놈 아틀라스(The Cancer Genome Atlas)(TCGA) 데이터세트와 같은 다양한 유기체 및 세포 유형에서 활성 인핸서의 게놈 와이드 동정을 지원하기 위해 공개적인 재원이 가용하다.

바람직하게는, SSE에 존재하는 인핸서 서열은 모두 동일한 서열을 갖지 않는다(즉, SSE는 동일한 인핸서 요소의 컨카테머가 아니다). 따라서, 하나의 구현예에서, SSE는 적어도 2개의 상이한 인핸서 서열을 포함한다. 하나의 구현예에서, 각각의 인핸서 서열은 상이한 서열을 갖는다. 하나의 구현예에서, 각각의 인핸서 서열은 동일한 전사 인자(들)에 의해 활성화된다.

본원에 제공된 데이터는 상이한 게놈 유전자좌로부터 유래된 인핸서의 4-파트 배열(~640 bp)로의 어셈블리가 놀랍게도 선택성을 손상시키지 않으면서 이들의 활성을 수십 배 증가시켰다는 것을 보여준다. 따라서 SSE에 사용되는 각 인핸서 서열은 서로 다른 유전자로부터 유래할 수 있다. 추가 구현예에서, 각각의 인핸서 서열은 상이한 게놈 유전자좌로부터 유래된다. 이들 인핸서 서열은 모두 공통 전사 인자 또는 일련의 세포 유형 관련 전사 인자(들)에 의해 여전히 바람직하게 활성화된다. 하나의 구현예에서, 각각의 인핸서 서열은 전사 인자(들)에 의해 활성화되고 상이한 게놈 유전자좌로부터 유래된다. 하나의 구현예에서, 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 2개 이상, 예를 들어, 4개의 인핸서 서열을 포함한다.

하나의 구현예에서, 각각의 인핸서 서열은 전사 인자에 대한 결합 부위 및 이의 게놈 유전자좌에 존재하는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드를 포함한다. 이것은 인핸서 서열에 포함되는 전사 인자 결합 부위를 둘러싸는(즉, 직접 업스트림 및/또는 다운스트림) 컨텍스트를 허용하고 따라서 인핸서 기능을 유지한다. 간격, 순서, 배향 및/또는 친화성을 유지하는 천연 인핸서 서열에 전형적으로 존재하는 업스트림 및/또는 다운스트림 서열은 협력하는 전사 인자 및 보조 인자의 동원에 유용할 수 있다. 추가로, 전사 인자 결합 모티프를 둘러싸는 서열 컨텍스트는 결합을 촉진시키고 전사 효율을 증진시키기 위해 협력적으로 작용할 가능성이 있다. 당업자는 공개적으로 가용한 게놈 데이터베이스로부터 관심 대상의 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드 사이의 서열을 동정/획득할 수 있을 것이다. 동일한 당업자는 본원에 기재된 바와 같은 리포터 검정 또는 당업계에서 널리 채택되는 다른 방법과 같은 기능적 분석을 통해 전사 인자 활성을 결정할 수 있다. 하나의 구현예에서, 각각의 인핸서 서열은 전사 인자에 대한 결합 부위 및 이의 게놈 유전자좌에 존재하는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드를 포함하고, 상기 업스트림 및/또는 다운스트림 서열은 인핸서가 그 기능을 유지하는 것을 보장하기에 충분하다. 추가 구현예에서, 인핸서 서열은 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드, 예를 들어 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 300개 뉴클레오타이드 또는 바람직하게는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 200개 뉴클레오타이드를 포함한다. 추가 구현예에서, 인핸서 서열은 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 50 내지 400개 뉴클레오타이드, 예를 들어 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 50 내지 300개 뉴클레오타이드 또는 바람직하게는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 50 내지 200개 뉴클레오타이드를 포함한다. 추가 구현예에서, 인핸서 서열은 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 80 내지 400개 뉴클레오타이드, 예를 들어 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 80 내지 300개 뉴클레오타이드 또는 바람직하게는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 80 내지 200개 뉴클레오타이드를 포함한다.

하나의 구현예에서, 합성 슈퍼-인핸서 내의 각각의 인핸서 서열은 길이가 500개 뉴클레오타이드 미만, 예를 들어, 450, 400, 350, 300, 250 또는 200개 미만의 뉴클레오타이드 길이이다. 추가 구현예에서, SSE 내의 각각의 인핸서 서열은 300개 미만의 뉴클레오타이드 길이이다. 하나의 구현예에서, 합성 슈퍼-인핸서 내의 각각의 인핸서 서열은 20 내지 500개의 뉴클레오타이드 길이, 예를 들어 50 내지 250개의 뉴클레오타이드 길이 또는 100 내지 200개의 뉴클레오타이드 길이이다.

이것은 이들 구현예가 조합될 수 있는 것으로 이해된다. 따라서, 추가의 구현예에서, 인핸서 서열은 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개의 뉴클레오타이드를 포함하고, 여기서 인핸서 서열은 길이가 500개 미만의 뉴클레오타이드이다. 여전히 추가의 구현예에서, 인핸서 서열은 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 200개의 뉴클레오타이드를 포함하고, 여기서 인핸서 서열은 길이가 300개 미만의 뉴클레오타이드이다.

추가 구현예에서, SSE 내의 각각의 인핸서 서열은 약 160개 미만의 뉴클레오타이드 길이이다. 특히, 뉴클레오좀 결합을 위한 충분한 크기를 제공하고 기능적 인핸서 내 문법의 진화에서 중요한 속성으로 간주되기 때문에 160 염기쌍(bp)이 선택되었다. 또한, 160 bp는 배열된 플라스미드 라이브러리의 후속 구성을 위해 20 bp 말단이 혼입된 풀링된 올리고뉴클레오타이드 라이브러리의 합성에 편리한 크기이다.

하나의 구현예에서, 합성 슈퍼-인핸서는 2000개 미만의 뉴클레오타이드 길이이다. 추가의 구현예에서, 합성 슈퍼-인핸서는 1500개 미만의 뉴클레오타이드 길이, 예를 들어, 1400, 1300, 1200, 1100, 1000, 950, 900, 850, 800, 750 또는 700개 미만의 뉴클레오타이드 길이이다. 하나의 구현예에서, 합성 슈퍼-인핸서는 1200개 미만의 뉴클레오타이드 길이이다. 추가의 구현예에서, 합성 슈퍼-인핸서는 700개 미만의 뉴클레오타이드 길이이다. 바람직하게는, 합성 슈퍼-인핸서는 길이가 640개 뉴클레오타이드와 같이 650개 미만의 뉴클레오타이드 길이이다.

본원에 기재된 모티프는 SSE의 인핸서 중 하나 이상에 존재할 수 있다(예를 들어, 도 8e 참조). 따라서, 하나의 구현예에서, 하나 이상의 인핸서는 SOX 모티프 및/또는 SOX 이량체 모티프로부터 선택된 서열을 포함한다.

하나의 구현예에서, 합성 슈퍼-인핸서 내의 각각의 인핸서 서열은 SOX2 모티프와 같은 SOX 모티프를 포함한다. 하나의 구현예에서, 합성 슈퍼-인핸서 내의 각각의 인핸서 서열은 SOX 이량체 모티프를 포함한다.

하나의 구현예에서, 합성 슈퍼-인핸서는 SOX2에 의해 활성화되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열은 적어도 하나의 SOX 이량체 모티프 및/또는 적어도 하나의 SOX 이량체 모티프를 포함한다. 하나의 구현예에서, 합성 슈퍼-인핸서는 SOX2에 의해 활성화되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열은 적어도 하나의 SOX2 모티프를 포함한다. 하나의 구현예에서, 합성 슈퍼-인핸서는 SOX2에 의해 활성화되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열은 적어도 하나의 SOX 이량체 모티프를 포함한다.

하나의 구현예에서, 하나 이상의 인핸서 서열은 서열번호 4-63(표 1)으로 이루어진 그룹으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 추가의 구현예에서, 하나 이상의 인핸서 서열은 서열번호 4-13 및 56-63으로 이루어진 그룹으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 또 다른 추가의 구현예에서, 하나 이상의 인핸서 서열은 서열번호 4-63(예를 들어, 서열번호 4-13 및 56-63)으로 이루어진 그룹으로부터 선택된 서열과 적어도 85%, 90%, 95%, 97%, 99% 서열 동일성을 갖거나 100% 동일하다. 본원에 기재된 인핸서 서열(즉, 표 1)은 적어도 하나(예를 들어, 20개 미만, 10개 미만, 5개 미만)의 뉴클레오타이드 치환, 결실 또는 첨가에 의해 변형될 수 있고, 여기서 변이 인핸서 서열은 서열의 기능적 특징을 실질적으로 유지한다. 본원에 제공된 인핸서 서열의 변이체는 여전히 기재된 인핸서 서열의 기능적 활성을 유지하도록 의도된다는 것이 이해될 것이다. 예를 들어, 실시예 4는 기재된 인핸서 서열이 Nanoglo DLR 검정을 사용하여 시험했을 때 mCMV보다 10배 이상 증가했음을 보여준다. 따라서 이 범위에 포함된 변이 인핸서 서열은 출발 서열 활성의 75% 미만인 활성을 가져서는 안 된다.

하나의 구현예에서, 합성 슈퍼-인핸서는 표 1에 제공되는 하나 이상의 인핸서 서열을 포함한다. 따라서, SSE는 서열번호 4-63으로 이루어진 그룹으로부터 선택된 하나 이상의 인핸서 서열을 포함할 수 있다. 본원에 제공된 데이터는 다중-부분 배열에서 이들 인핸서 서열의 배열이 세포 특이성을 손상시키지 않으면서 전사 활성을 증가시킬 수 있음을 보여준다. 추가 구현예에서, 합성 슈퍼-인핸서는 표 1에 제공된 서열로부터 선택된 1개 내지 8개, 2개 내지 6개, 또는 3개 내지 5개의 인핸서 서열을 포함한다. 여전히 추가 구현예에서, 합성 슈퍼-인핸서는 표 1에 제공된 서열로부터 선택된 4개의 인핸서 서열을 포함한다.

하나의 구현예에서, SSE는 서열번호 4-36으로 이루어진 그룹으로부터 선택된 하나 이상의 인핸서 서열을 포함한다. 대안적 구현예에서, SSE는 서열번호 37-63, 보다 바람직하게 서열번호 54-63으로 이루어진 그룹으로부터 선택된 하나 이상의 인핸서 서열을 포함한다.

하나의 구현예에서, SSE는 서열번호 4-13 및 54-63으로 이루어진 그룹으로부터 선택된 하나 이상의 인핸서 서열을 포함한다.

추가의 구현예에서, SSE는 서열번호 4-36, 예를 들어, 4-13, 특히 4-8로 이루어진 그룹으로부터 선택된 4개의 인핸서 서열을 포함한다. 대안적 구현예에서, SSE는 서열번호 37-63으로 이루어진 그룹으로부터 선택된 4개의 인핸서 서열, 바람직하게는 서열번호 54-63으로 이루어진 그룹으로부터 선택된 4개의 인핸서 서열, 보다 바람직하게는 서열번호 56-63으로 이루어진 그룹으로부터 선택된 4개의 인핸서 서열을 포함한다.

SSE는 표 2에 기재된 바와 같은 서열을 포함할 수 있다. 하나의 구현예에서, 합성 슈퍼-인핸서는 서열번호 64-80으로 이루어진 그룹으로부터 선택된 서열과 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 추가의 구현예에서, 서열은 서열번호 64-80으로 이루어진 그룹으로부터 선택된 서열과 적어도 85%, 90%, 95%, 97%, 99% 서열 동일성을 갖거나 100% 동일하다. 여전히 추가의 구현예에서, SSE는 서열번호 70을 포함한다. 본원에 제공된 서열의 변이체는 기재된 SSE의 기능적 활성, 즉 전사 인자에 의한 SSE의 활성화 시 전이유전자 발현을 여전히 유지하도록 의도된다.

2개의 밀접하게 관련된 폴리뉴클레오타이드 서열을 비교하기 위해, 뉴클레오타이드 서열에 대한 표준 설정(BLASTN)을 사용하는 NCBI BLAST v2.0을 사용하여 제1 뉴클레오타이드 서열과 제2 뉴클레오타이드 서열 사이의 "% 서열 동일성"을 계산할 수 있다. 2개의 밀접하게 관련된 폴리펩타이드 서열을 비교하기 위해, 폴리펩타이드 서열에 대한 표준 설정(BLASTP)을 사용하는 NCBI BLAST v2.0을 사용하여 제1 폴리펩타이드 서열과 제2 폴리펩타이드 서열 사이의 "% 서열 동일성"을 계산할 수 있다.

폴리펩타이드 또는 폴리뉴클레오타이드 서열은 전체 길이에 걸쳐 100% 서열 동일성을 공유하는 경우 다른 폴리펩타이드 또는 폴리뉴클레오타이드 서열과 "동일(identical)"하거나 "동일(same)"하다고 일컬어진다. 서열 내 잔기는 좌측에서 우측으로, 즉 폴리펩타이드의 경우 N-말단에서 C-말단으로; 폴리뉴클레오타이드의 경우 5'에서 3' 말단으로 넘버링된다.

서열 간의 "차이"는 제1 서열과 비교하여 제2 서열의 위치에서 단일 아미노산 잔기 또는 뉴클레오타이드의 삽입, 결실 또는 치환을 지칭한다. 2개의 폴리뉴클레오타이드 서열은 이러한 뉴클레오타이드 차이를 하나, 둘 또는 그 이상 포함할 수 있다. 2개의 폴리펩타이드 서열은 이러한 아미노산 차이를 1개, 2개 또는 그 이상 포함할 수 있다. 그렇지 않으면 제1 서열과 동일한(100% 서열 동일성) 제2 서열에서의 삽입, 결실 또는 치환은 감소된 % 서열 동일성을 초래한다.

대안적으로, 제1 참조 서열을 제2 비교 서열과 비교하기 위해, 제2 서열을 생성하기 위해 제1 서열에 가해진 첨가, 치환 및/또는 결실의 수를 확인할 수 있다. "첨가"는 하나의 아미노산 잔기/뉴클레오타이드를 제1 서열에 첨가하는 것이다(제1 서열의 어느 한쪽 말단에서의 첨가를 포함). "치환"은 제1 서열에서 하나의 아미노산 잔기/뉴클레오타이드가 하나의 상이한 아미노산 잔기/뉴클레오타이드로 치환되는 것이다. 폴리펩타이드 서열과 관련하여 치환은 보존적이거나 비보존적일 수 있다. 폴리뉴클레오타이드 서열의 맥락에서, 치환은 동의어이거나 동의어가 아닐 수 있다. "결실"은 하나의 아미노산 잔기/뉴클레오타이드를 제1 서열로부터 결실시키는 것이다(제1 서열의 어느 한쪽 말단에서의 결실을 포함).

하나의 구현예에서, 합성 슈퍼-인핸서는 전사 조절인자, 즉 유전자 발현을 제어하는 서열(또는 단백질을 암호화하는 서열)을 추가로 포함한다.

또 다른 양상에 따르면, SOX 계열의 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서가 제공되고, 여기서 합성 슈퍼-인핸서는 2개 이상의 인핸서 서열 및 적어도 하나의 SOX 모티프 및/또는 SOX 이량체 모티프를 포함한다. 기능적 핵산 분자의 합성 슈퍼-인핸서에 적용되는 본원에 기재된 구현예가 상기 양상에도 적용된다는 것이 이해될 것이다.

추가 양상에 따르면, SOX2에 의해 활성화되는 합성 슈퍼-인핸서가 제공되고, 여기서 합성 슈퍼-인핸서는 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열은 적어도 하나의 SOX 모티프 및/또는 SOX 이량체 모티프를 포함한다.

기능적 핵산 분자

SSE는 기능적 핵산 분자를 형성하는 추가 요소를 포함하는 작제물에 존재할 수 있다. 따라서, 추가 양상에 따르면, 전이유전자에 작동가능하게 연결된, 본원에 기재된 바와 같은 합성 슈퍼-인핸서를 포함하는 기능성 핵산 분자가 제공된다.

추가 양상에 따르면, 표적 비정상 세포에서 발현되는 하나 이상의 전사 인자에 의해 활성화된 합성 슈퍼-인핸서 및 불리한 페이로드를 포함하는 기능성 핵산 분자가 제공되고, 여기서 상기 페이로드는 전사 인자(들)에 의해 합성 슈퍼-인핸서의 활성화 시 발현된다.

기능성 핵산 분자는 SSE 및 전이유전자에 대한 추가 성분을 포함할 수 있다. 예를 들어, 합성 슈퍼-인핸서는 프로모터에 작동 가능하게 연결될 수 있다. 적합한 프로모터는 당업계에 공지되어 있다. 하나의 구현예에서, 프로모터는 최소 CMV 프로모터이다. 하나의 교시에서, SSE는 프로모터에 작동가능하게 연결될 수 없다. 대안적 구현예에서, 슈퍼-인핸서에 작동가능하게 연결된 프로모터는 최소 CMV 프로모터가 아니다.

전이유전자

본원에 기재된 바와 같이, SSE는 전이유전자의 발현을 증진시키기 위해 사용될 수 있다. 하나의 구현예에서, 전이유전자는 세포에서의 발현을 위한 외인성 서열일 수 있다. 하나의 교시에서, 전이유전자는 예방적 또는 치료학적 전이유전자와 같은 생물학 및 의학에서 유용한 생성물을 암호화하는 서열, 예를 들어, 단백질 또는 비단백질 암호화 올리고뉴클레오타이드이다. 따라서, 전이유전자는 치료학적 페이로드를 암호화할 수 있다. 예를 들어, 치료학적 페이로드는 다음을 포함할 수 있다: 항원, 항체, 사이토킨(예를 들어, 면역원성 반응을 유도하기 위해), 종양-서프레서 단백질(예를 들어, 천연/비돌연변이 p53), 분화 인자(즉, 세포 운명 또는 정체성을 조절하거나 재프로그래밍하기 위해) 또는 핵산 편집 또는 유전자 활성 조절 기능(예를 들어, DNA 또는 RNA 편집 또는 전사 조절)이 있는 단백질 또는 달리 세포 표현형(예를 들어, 운동성, ECM 생산, 세포 노화 또는 정지)을 변경하기 위한 단백질과 같은 치료학적 단백질. 대안적인 구현예에서, 전이유전자는 RNA(mRNA 이외), 예를 들어 miRNA, siRNA, shRNA 또는 IncRNA와 같은 올리고뉴클레오타이드를 암호화하는 비단백질을 암호화한다. 비암호화 RNA를 암호화하는 전이유전자는 유전자 사일런싱 방법에 사용될 수 있음을 이해할 것이다.

하나의 구현예에서, 기능성 핵산 분자는 하나 이상의 전이유전자를 포함한다. 따라서, 전이유전자의 상이한 조합이 포함될 수 있음을 당업자는 이해할 것이다.

추가 양상에 따르면, 본원에 기재된 바와 같은 합성 슈퍼-인핸서에 작동가능하게 연결된 전이유전자를 발현시키는 것을 포함하는, 표적 세포에서 전이유전자를 발현시키는 방법이 제공되고, 여기서 상기 전사 인자 중 하나 이상이 표적 세포에서 발현된다.

불리한 페이로드

본원에 기재된 바와 같이, SSE에 작동가능하게 연결된 전이유전자는 불리한 페이로드를 암호화할 수 있다. 본원에서 사용되는 "불리한 페이로드"라는 용어는 표적 세포에 부정적인 영향을 미치는 페이로드를 지칭한다. 부정적인 영향은 예를 들어 세포의 건강 또는 생존 능력 및/또는 세포 분열 능력에 대한 부정적인 영향일 수 있다. 불리한 효과는 직접적으로(예를 들어, 전이유전자는 아폽토시스 촉진 유전자 또는 자살 유전자와 같은 세포에 유해한 물질을 암호화함) 또는 간접적으로(예를 들어, 전이유전자는 세포에 유해한 효과를 유발하는 외부 인자를 동원하는 물질을 암호화함) 달성될 수 있다.

불리한 페이로드는 표적 세포에 부정적인 영향을 미치는 면역 반응을 자극하는 데 사용될 수 있다. 이러한 반응은 예를 들어 국소 면역 미세환경을 변경할 수 있다. 하나의 구현예에서, 불리한 페이로드는 세포독성 면역 세포의 활성화를 유도하는 면역 반응을 자극하는 단백질을 암호화한다. 하나의 구현예에서, 불리한 페이로드는 케모킨, 사이토킨, 항체 또는 다른 면역 조절 단백질로부터 선택된다. 추가의 구현예에서, 불리한 페이로드는 염증 촉진 사이토킨, 예를 들어, 하기로부터 선택되는 사이토킨이다: IL-12, IL-10, IL-2, IFN-α 및 GM-CSF. 예를 들어, 불리한 페이로드는 항암 활성을 갖는 것으로 나타난 IL-12와 같은 사이토킨일 수 있다. IL-12는 휴지기 및 활성화된 CD4+ T 세포, CD8+ T 세포 및 천연 킬러(NK) 세포에 의해 IFN-γ 생성을 유도할 뿐만 아니라 활성화된 T 및 NK 세포의 증식을 증진시키고, NK/림포킨 활성화 킬러 세포의 용해 활성을 증가시키고, 특이적 세포독성 T 림프구(CTL) 반응을 촉진시킨다. 그러나, IL-12는 과도한 독성으로 인해 전신 치료로 투여할 수 없으므로 표적 세포 내에서만 발현되는 표적화된 치료요법을 통해 상기 페이로드를 전달할 수 있다.

"면역 반응"은 면역계의 적어도 하나의 세포, 하나의 세포 유형, 하나의 내분비 경로 또는 하나의 외분비 경로(세포 매개 반응, 체액성 반응, 사이토킨 반응, 케모킨 반응을 포함하나 이에 제한되지 않음)에서 측정 가능한 변화이다.

"면역 세포"는 CD34+ 세포, B 세포, CD45+(림프구 공통 항원) 세포, 알파-베타 T 세포, 세포독성 T 세포, 헬퍼 T 세포, 형질 세포, 호중구, 단핵구, 대식세포, 수지상 세포, 식세포, 과립구, 선천 림프구 세포, 천연 킬러(NK) 세포 및 감마 델타 T-세포를 포함하지만 이에 제한되지 않는 면역계의 세포로서 정의된다. 전형적으로, 면역 세포는 조합 세포 표면 분자 분석(예를 들어, 유동 세포측정법을 통해)의 도움으로 분류되어 면역 세포를 서브 집단으로 분화시키기 위해 동정하거나 그룹화하거나 클러스터링한다. 페이로드가 불리한 페이로드인 본원 개시내용의 분자 및 방법에서, 자극된 면역 반응은 표적 세포에 불리한 영향을 미치도록 의도된다. "세포독성 면역 세포"에 대한 언급은 세포 사멸을 초래하는 면역 세포, 특히 세포독성 T 세포(킬러 T 세포로도 알려져 있음)를 지칭한다.

하나의 구현예에서, 불리한 페이로드는 세포독성 물질(즉, 세포독성 페이로드)을 암호화한다.

하나의 구현예에서, 불리한 페이로드는 자살 유전자이다. 자살 유전자는 세포 사멸을 유발하는 단백질을 발현하는 유전자이다. 대안적으로, 자살 유전자가 작동하려면 외부에서 공급되는 보조 인자 또는 보조 약물(예를 들어, 전구약물)이 필요할 수 있다. 이어서, 보조-인자 또는 보조-약물은 자살 유전자의 생성물에 의해 세포독성 물질로 전환될 수 있다. 하나의 구현예에서, 자살 유전자는 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화한다. 불활성 전구약물은 기능적 핵산 분자와 동시에 또는 순차적으로 투여될 수 있다.

하나의 구현예에서, 자살 유전자는 헤르페스 심플렉스 바이러스 티미딘 키나제(HSV-TK)이다. 특히, HSV-TK 유전자는 전구약물인 간시클로비르(GCV) 또는 아시클로비르 및 발라시클로비르와 같은 이의 유사체와 함께 사용된다. 대안적 구현예에서, 자살 유전자는 사이토신 데아미나제(CD)이다. 특히, CD 유전자는 전구약물 5-플루오르시토신(5FC)과 함께 사용된다.

표적 세포

본원에 기재된 기능적 핵산 분자는 다양한 세포 유형을 표적화하는데 사용될 수 있다. 특히, 세포는 포유동물 세포, 예를 들면, 사람 세포이다. 본원 개시내용은 불리한 페이로드의 존재를 포함할 수 있고, 따라서 비정상 세포(즉, 건강하지 않은 세포와 같은 비정상 세포)를 표적화하는 데 적합하다.

비정상 세포는 과증식성 세포, 즉 과도하고 비정상적인 증식을 갖는 세포일 수 있다. 하나의 구현예에서, 비정상 세포는 암 세포 또는 신생물 세포이다. 상기 구현예에서, 불리한 페이로드는 항암 페이로드일 수 있다.

SOX2는 종양유전자로 동정되었기 때문에 다른 비정상 세포, 특히 암세포에서도 증폭될 수 있다. 본원 개시내용의 방법을 사용하여 표적화될 수 있는 다른 비정상 세포의 예는 폐 및 식도의 편평 세포 암종 뿐만 아니라 많은 다른 것을 포함한다.

하나의 구현예에서, 비정상 세포는 교모세포종 줄기 세포, 신경교종 세포, 폐암 세포(특히 편평 폐암 세포), 식도암 세포, 난소암 세포, 유방암 세포, 구강암 세포(예를 들어, 입, 혀, 인두), 위암 세포, 소장암 세포, 결장직장암 세포, 직장암 세포, 간암 세포, 담관암 세포, 담낭암 세포, 췌장암 세포, 골암 세포(예를 들어, 골육종), 피부암 세포, 자궁암 세포, 전립선암 세포, 고환암 세포, 방광암 세포, 콩팥 암 세포, 망막암 세포, 갑상선암 세포, 림프종 세포, 골수종 세포 또는 백혈병 세포로부터 선택된 암 세포이다.

특정 구현예에서, 비정상 세포는 교모세포종 줄기 세포이다. 교모세포종은 마스터 조절 신경 줄기 세포 연관된 전사 인자의 상승된 수준/활성에 의해 구동되는 공격적인 형태의 신경교종이다. 교모세포종 줄기 세포(GSC)는 종종 SOX2를 포함한 주요 신경 발달 전사 인자의 발현 또는 활성이 증가하는데, 이는 신경 줄기 세포 정체성에 필요한 핵심 마스터 조절인자 및 재프로그래밍 인자이다(참조: Bulstrode et al. 2017, Gangemi et al. 2009, Guerra-Rebollo et al. 2019, Lopez-Bertoni et al. 2015, and MacLeod et al. 2019). GSC에서 SOX2의 녹다운은 종양 형성을 감소시키는 반면(참조: Gangemi et al. 2009), 이의 엑토픽 발현은 POU3F2, OLIG2 및 SALL2와 함께 GSC 상태를 강요한다(참조: et al. 2014). 본원에 제공된 실시예는 GSC-선택적 SSE가 아데노 관련 바이러스(AAV)에서 활성을 유지하고 GSC의 표적 사멸을 위한 세포독성 페이로드의 발현을 구동시키는 데 사용되었음을 보여준다. 추가로, SSE의 활성은 GSC의 분화 동안 소멸되었고 HEK 또는 섬유아세포 세포에는 존재하지 않았다. 따라서 프로모터의 강도를 대폭 증가시켰음에도 불구하고 GSC 선택적 발현이 유지되었다.

벡터

추가 양상에 따르면, 본원에 기재된 바와 같은 합성 슈퍼-인핸서 또는 기능성 핵산 분자를 포함하는 벡터가 제공된다.

본원에서 사용되는 용어 "벡터"는 기능적 핵산 분자를 수송할 수 있는 분자를 지칭하는 것으로 의도된다. 벡터의 한 유형은 추가 DNA 절편이 연결될 수 있는 환형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 또 다른 유형의 벡터는 바이러스 벡터이고 추가 DNA 절편은 바이러스 게놈에 연결될 수 있다. 특정 벡터는 이들이 도입되는 숙주 세포 내에서 자체적으로 복제할 수 있다(예를 들어, 세균 복제 오리진을 갖는 세균 벡터 및 에피좀 포유동물 및 효모 벡터). 다른 벡터들(예를 들어, 비에피좀 포유동물 벡터)은 숙주 세포로 도입시 숙주 세포의 게놈으로 통합되어, 상기 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 이들이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본원에서 "재조합 발현 벡터" (또는 단순히 "발현 벡터")로서 지칭된다. 일반적으로 재조합 DNA 기술에서 활용되는 발현 벡터는 흔히 플라스미드 형태로 있다.

예시적인 발현 벡터는 당업계에 공지되어 있고 예를 들어 플라스미드 벡터, 바이러스 벡터(예를 들어 아데노바이러스, 아데노 관련 바이러스, 레트로바이러스 또는 렌티바이러스 벡터), 파아지 벡터, 코스미드 벡터 등을 포함할 수 있다. 발현 벡터의 선택은 사용될 숙주 세포의 유형 및 사용 목적에 따라 달라질 수 있다.

하나의 구현예에서, 벡터는 바이러스 벡터이다. 바이러스 벡터, 특히 유전자 치료요법 적용에 사용되는 바이러스 벡터는 당업계에 잘 알려져 있다. 이러한 바이러스는 단일 가닥(ss) 또는 이중 가닥(ds) 게놈을 가진 RNA 및 DNA 바이러스일 수 있다. 예를 들어, 바이러스 벡터는 아데노바이러스, 아데노 관련 바이러스(AAV), 알파바이러스, 플라비바이러스, 헤르페스 심플렉스 바이러스(HSV), 홍역 바이러스, 랍도바이러스, 레트로바이러스, 렌티바이러스, 뉴캐슬 질환 바이러스(NDV), 폭스바이러스 및 피코르나바이러스를 포함하지만 이에 제한되지 않는다. 삽입 용량과 향성은 다양할 수 있으므로 바이러스 벡터는 의도된 적용에 따라 선택될 수 있다.

AAV 벡터는 이들이 개선된 안전성을 갖기 때문에 최적의 유전자 치료요법 바이러스 벡터로 점차 선호되고 있다. 그러나, 한계는 이들의 보다 작은 카고 크기이다. 본원에 기재된 SSE 4개-부분 어셈블리는 이상적으로 AAV에 적합하다. 따라서, 하나의 구현예에서, 벡터는 AAV이다. 상이한 AAV 혈청형은 이들의 향성이 상이함으로 사용되는 AAV 벡터의 유형은 표적 조직의 유형에 따라 선택될 수 있다. AAV 벡터는 당업계에서 공지된 다수의 혈청형으로부터 선택될 수 있고, 예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 중 어느 하나일 수 있거나, 비-천연 변이체일 수 있다. 하나의 구현예에서, AAV는 하기로부터 선택된다: AAV1, AAV2 또는 AAV5.

추가 양상에 따르면, 본원에 기재된 바와 같은 합성 슈퍼-인핸서 및 전이유전자(즉, 치료학적 페이로드와 같은 페이로드)를 포함하는 벡터가 제공된다. 본원에 기재된 바와 같은 합성 슈퍼-인핸서는 임의로 다른 발현 요소들, 예를 들어, 프로모터에 작동가능하게 연결될 수 있다.

조성물 및 키트

본원 개시내용은 또한 본원에 기재된 기능적 핵산 분자 또는 벡터를 포함하는 조성물에 관한 것이다. 조성물은 바이러스 벡터(AAV, 렌티바이러스 등) 및 비-바이러스 벡터(나노입자, 지질 입자 등)에 의해 상기 기능성 핵산 분자의 전달을 가능하게 하는 성분을 포함할 수 있다.

추가 양상에 따르면, 본원에 기재된 바와 같은 합성 슈퍼-인핸서, 기능성 핵산 분자 또는 벡터, 및 허용되는 담체를 포함하는 조성물이 제공된다. 적합한 담체는 당업계에 공지되어 있고, 특정 구현예에서, 담체는 하나 이상의 기능성 핵산 분자로 표적 세포의 형질감염을 용이하게 하는 능력에 기초하여 선택된다.

추가 양상에 따르면, 치료요법에 사용하기 위한, 본원에 기재된 기능성 핵산 분자 또는 벡터를 포함하는 조성물이 제공된다.

추가 양상에 따르면, 암의 치료에 사용하기 위한, 본원에 기재된 기능성 핵산 분자 또는 벡터를 포함하는 조성물이 제공된다.

추가 양상에 따르면, 약물의 제조를 위한, 특히, 암의 치료를 위한, 본원에 기재된 기능성 핵산 분자(또는 벡터 또는 조성물)의 용도가 제공된다.

추가 양상에 따르면, 본원에 기재된 바와 같은 기능성 핵산 분자를 포함하는 키트가 제공되고, 여기서 불리한 페이로드는 비활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자이다. 따라서, 상기 양상에서 키트는 불활성 전구약물(즉, 기능성 핵산 분자와 함께 투여하기 위한)을 추가로 포함한다.

치료 방법

추가 양상에 따르면, 본원에 기재된 바와 같은 기능성 핵산 분자, 벡터 또는 조성물을 환자에게 투여하는 것을 포함하는 질환을 치료하기 위한 방법이 제공된다.

"대상체", "환자" 또는 "개체"에 대한 언급은 치료될 대상체, 특히 포유동물 대상체를 지칭한다. 포유동물 대상체는 사람, 비사람 영장류, 농장 동물(예를 들어, 소), 스포츠 동물, 또는 개, 고양이, 기니피그, 토끼, 래트 또는 마우스와 같은 애완 동물을 포함한다. 일부 구현예에서, 대상체는 사람이다. 대안적 구현예에서, 대상체는 마우스와 같은 비-사람 포유류이다.

본원에 사용된 바와 같이, 질환 또는 장애를 "치료하는 것"은 대상체가 경험하는 질환 또는 장애의 적어도 하나의 징후 또는 증상의 빈도 및/또는 중증도를 감소시키는 것을 의미한다.

하나의 구현예에서, 질환은 암이다. 본원에 사용된 바와 같은 "암"은 세포의 비정상적 성장 또는 분열을 지칭한다. 일반적으로 암세포의 성장 및/또는 수명은 주변의 정상 세포 및 조직의 성장 및/또는 수명을 초과하고 이들과 조화되지 않는다. 암은 양성, 전암성 또는 악성일 수 있다. 암은 또한 1차 암 또는 2차 암일 수 있다. 1차 암은 암이 시작된 본래의 기관이나 조직인 반면, 2차 암은 1차 암이 신체의 다른 부위로 확산(또는 전이)된 결과이다.

암은 구강(예를 들어, 입, 혀, 인두), 소화계(예를 들어, 식도, 위, 소장, 결장, 직장, 간, 담관, 담낭, 췌장), 호흡계(예를 들어, 후두, 폐, 기관지), 뼈, 관절, 피부(예를 들어, 기저 세포, 편평 세포, 수막종), 유방, 생식기 시스템(예를 들어, 자궁, 난소, 전립선, 고환), 비뇨계(예를 들어, 방광, 콩팥, 요관)), 눈, 신경계(예를 들어, 뇌), 내분비계(예를 들어, 갑상선) 및 조혈계(예를 들어, 림프종, 골수종, 백혈병, 급성 림프구성 백혈병, 만성 림프구성 백혈병, 급성 골수성 백혈병, 만성 골수성 백혈병)을 포함하는 다양한 세포 및 조직에서 발생한다.

추가의 구현예에서, 암은 중추신경계에 위치한 1차 또는 2차 암과 같은 뇌 또는 척수(즉, 중추신경계)에 위치한 암이다. 본원 개시내용은 교모세포종의 치료에서 특정 용도를 모색한다.

기능성 핵산 분자(또는 벡터 또는 조성물)는 정맥내, 동맥내, 심장내, 피내, 피하, 복강내, 근육내 또는 경구와 같은 의도된 치료를 위한 임의의 적합한 전달 방식에 의해 투여될 수 있다. 하나의 구현예에서, 기능성 핵산 분자, 벡터 또는 조성물은 전신 투여된다. 투여는 또한 질환 부위에 직접적일 수 있다. 따라서, 하나의 구현예에서, 기능성 핵산 분자, 벡터 또는 조성물은 국소로, 예를 들어, 종양 내와 같이 기관 또는 조직에 직접 투여된다.

하나의 구현예에서, 불활성 전구약물은 기능성 핵산 분자와 동시에 또는 순차적으로 투여된다.

치료 방법은 치료학적 유효량의 투여를 포함할 것임을 이해할 것이다. 용어 "치료학적 유효량"은 질환 또는 장애의 증상을 개선하거나 치료하는데 효과적인 양이다. 치료학적 유효량은 예방이 치료요법으로 간주될 수 있기 때문에 "예방적 유효량"일 수 있다.

본원에 기재된 구현예는 본원 개시내용의 모든 양상에 적용될 수 있음을 이해할 것이고, 즉, 용도에 대해 기재된 구현예는 청구된 방법 등에 동일하게 적용될 수 있다.

항목

개시 내용 및 이의 바람직한 양상을 정의하는 항목 세트는 다음과 같다:

1. 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서로서, 여기서 상기 합성 슈퍼-인핸서가 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열이 전사 인자를 위한 결합 부위 및 이의 게놈 유전자좌에 존재하는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드를 포함하는, 합성 슈퍼-인핸서.

2. 항목 1에 있어서, 상기 합성 슈퍼-인핸서 내 2개 이상의 인핸서 서열 각각이 300개 미만의 뉴클레오타이드 길이, 특히 160개 뉴클레오타이드 길이인, 합성 슈퍼-인핸서.

3. 항목 1 또는 2에 있어서, 상기 합성 슈퍼-인핸서가 1200개 미만의 뉴클레오타이드 길이, 특히 700개 미만의 뉴클레오타이드 길이인, 합성 슈퍼-인핸서.

4. 항목 1 내지 3 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 4개의 인핸서 서열을 포함하는, 합성 슈퍼-인핸서.

5. 항목 1 내지 4 중 어느 한 항목에 있어서, 상기 전사 인자가 SOX 계열의 전사 인자인, 합성 슈퍼-인핸서.

6. 항목 1 내지 5 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 적어도 하나의 SOX 이량체 모티프를 포함하는, 합성 슈퍼-인핸서.

7. 항목 6에 있어서, 상기 SOX 이량체 모티프가 서열번호 1을 포함하는, 합성 슈퍼-인핸서.

8. 항목 1 내지 5 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 적어도 하나의 SOX 모티프를 포함하는, 합성 슈퍼-인핸서.

9. 항목 8에 있어서, 상기 SOX 모티프가 SOX2 모티프인, 합성 슈퍼-인핸서.

10. 항목 8 또는 9에 있어서, 상기 SOX 모티프가 서열번호 3을 포함하는, 합성 슈퍼-인핸서.

11. 항목 1 내지 10 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 표 1에 제공된 하나 이상의 인핸서 서열을 포함하는, 합성 슈퍼-인핸서.

12. 항목 1 내지 11 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 서열번호 64-80으로 이루어진 그룹으로부터 선택된 서열과 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 합성 슈퍼-인핸서.

13. 항목 1 내지 12 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 전사 조절인자를 추가로 포함하는, 합성 슈퍼-인핸서.

14. 전이유전자에 작동가능하게 연결된 항목 1 내지 13 중 어느 한 항목에 따른 합성 슈퍼-인핸서를 포함하는 기능성 핵산 분자.

15. 항목 14에 있어서, 상기 전이유전자가 치료학적 페이로드를 암호화하는, 기능성 핵산 분자.

16. 항목 14에 있어서, 상기 전이유전자가 불리한 페이로드를 암호화하는, 기능성 핵산 분자.

17. 항목 16에 있어서, 상기 불리한 페이로드가 세포독성 면역 세포의 동원을 유도하는 면역 반응을 자극하는 단백질을 암호화하는, 기능성 핵산 분자.

18. 항목 16에 있어서, 상기 불리한 페이로드가 세포독성 물질을 암호화하는, 기능성 핵산 분자.

19. 항목 1 내지 18 중 어느 한 항목에 따른 기능성 핵산 분자로서, 상기 불리한 페이로드가 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자인, 기능성 핵산 분자.

20. 항목 14 내지 19 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 프로모터에 작동적으로 연결된, 기능성 핵산 분자.

21. 표적 비정상 세포에서 발현되는 하나 이상의 전사 인자에 의해 활성화된 합성 슈퍼-인핸서 및 불리한 페이로드를 포함하는 기능성 핵산 분자로서, 여기서 상기 페이로드가 전사 인자(들)에 의해 합성 슈퍼-인핸서의 활성화 시 발현되는, 기능성 핵산 분자.

22. 항목 21에 있어서, 상기 전사 인자가 표적 비정상 세포에서 차등적으로 발현되는, 기능성 핵산 분자.

23. 항목 21 또는 22에 있어서, 상기 전사 인자가 발육 또는 줄기 세포 관련 전사 인자인, 기능성 핵산 분자.

24. 항목 21 내지 23 중 어느 한 항목에 있어서, 상기 전사 인자가 SOX 계열의 전사 인자인, 기능성 핵산 분자.

25. 항목 21 내지 24 중 어느 한 항목에 있어서, SOX2에 의해 활성화되는, 기능성 핵산 분자.

26. 항목 21 내지 25 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 적어도 하나의 SOX 이량체 모티프를 포함하는, 기능성 핵산 분자.

27. 항목 26에 있어서, 상기 SOX 이량체 모티프가 서열번호 1을 포함하는, 기능성 핵산 분자.

28. 항목 21 내지 25 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 적어도 하나의 SOX 모티프를 포함하는, 기능성 핵산 분자.

29. 항목 28에 있어서, 상기 SOX 모티프가 SOX2 모티프인, 기능성 핵산 분자.

30. 항목 28 또는 29에 있어서, 상기 SOX2 모티프가 서열번호 3을 포함하는, 기능성 핵산 분자.

31. 항목 21 내지 30 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 2개 이상의 인핸서 서열을 포함하는, 기능성 핵산 분자.

32. 항목 21 내지 31 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 4개의 인핸서 서열을 포함하는, 기능성 핵산 분자.

33. 항목 31 또는 32에 있어서, 상기 2개 이상의 인핸서 서열 각각이 상이한 서열을 갖는, 기능성 핵산 분자.

34. 항목 31 내지 33 중 어느 한 항목에 있어서, 상기 2개 이상의 인핸서 서열 각각이 상이한 게놈 유전자좌로부터 유래되는, 기능성 핵산 분자.

35. 항목 31 내지 34 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서 내 2개 이상의 인핸서 서열 각각이 300개 미만의 뉴클레오타이드 길이, 특히 약 160개의 뉴클레오타이드 길이인, 기능성 핵산 분자.

36. 항목 31 내지 35 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서 내 2개 이상의 인핸서 서열 각각이 SOX 모티프 및/또는 SOX 이량체 모티프로부터 선택된 서열을 포함하는, 기능성 핵산 분자.

37. 항목 21 내지 36 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 표 1에 제공된 하나 이상의 인핸서 서열을 포함하는, 기능성 핵산 분자.

38. 항목 21 내지 37 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 서열번호 64-80으로 이루어진 그룹으로부터 선택된 서열과 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 기능성 핵산 분자.

39. 항목 21 내지 38 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 프로모터에 작동적으로 연결된, 기능성 핵산 분자.

40. 항목 21 내지 39 중 어느 한 항목에 있어서, 상기 불리한 페이로드가 세포독성 면역 세포의 동원을 유도하는 면역 반응을 자극하는 단백질을 암호화하는, 기능성 핵산 분자.

41. 항목 21 내지 39 중 어느 한 항목에 있어서, 상기 불리한 페이로드가 세포독성 물질을 암호화하는, 기능성 핵산 분자.

42. 항목 1 내지 41 중 어느 한 항목에 있어서, 상기 불리한 페이로드가 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자인, 기능성 핵산 분자.

43. 항목 42에 있어서, 상기 자살 유전자가 헤르페스 심플렉스 바이러스 티미딘 키나제(HSV-TK) 유전자이고, 전구약물이 간시클로비르, 어사이클로비르 또는 발라사이클로비르인, 기능성 핵산 분자.

44. 항목 21 내지 43 중 어느 한 항목에 있어서, 상기 비정상 세포가 암세포 또는 신생물 세포이고 불리한 페이로드가 항암 페이로드인, 기능성 핵산 분자.

45. 항목 21 내지 44 중 어느 한 항목에 있어서, 상기 비정상 세포가 교모세포종 줄기 세포인, 기능성 핵산 분자.

46. SOX 계열의 하나 이상의 전사 인자에 의해 활성화되는 합성 슈퍼-인핸서로서, 여기서 합성 슈퍼-인핸서가 2개 이상의 인핸서 서열 및 적어도 하나의 SOX 모티프 및/또는 SOX 이량체 모티프를 포함하는, 합성 슈퍼-인핸서.

47. 항목 46에 있어서, 상기 2개 이상의 인핸서 서열 각각이 상이한 서열을 갖는, 합성 슈퍼-인핸서.

48. 항목 46 또는 47에 있어서, 상기 2개 이상의 인핸서 서열 각각이 상이한 게놈 유전자좌로부터 유래되는, 합성 슈퍼-인핸서.

49. 항목 46 내지 48 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 4개의 인핸서 서열을 포함하는, 합성 슈퍼-인핸서.

50. 항목 46 내지 49 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서 내 2개 이상의 인핸서 서열 각각이 300개 미만의 뉴클레오타이드 길이, 특히 160개 뉴클레오타이드 길이인, 합성 슈퍼-인핸서.

51. 항목 46 내지 50 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서 내 2개 이상의 인핸서 서열 각각이 SOX 모티프 및/또는 SOX 이량체 모티프로부터 선택된 서열을 포함하는, 합성 슈퍼-인핸서.

52. 항목 46 내지 51 중 어느 한 항목에 있어서, SOX2에 의해 활성화되는, 합성 슈퍼-인핸서.

53. 항목 52에 있어서, 상기 SOX 이량체 모티프가 서열번호 1을 포함하는, 합성 슈퍼-인핸서.

54. 항목 46 내지 51 중 어느 한 항목에 있어서, 상기 SOX 모티프가 SOX2 모티프인, 합성 슈퍼-인핸서.

55. 항목 54에 있어서, 상기 SOX2 모티프가 서열번호 3을 포함하는, 합성 슈퍼-인핸서.

56. 항목 46 내지 55 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 표 1에 제공된 하나 이상의 인핸서 서열을 포함하는, 합성 슈퍼-인핸서.

57. 항목 46 내지 56 중 어느 한 항목에 있어서, 상기 합성 슈퍼-인핸서가 서열번호 64-80으로 이루어진 그룹으로부터 선택된 서열과 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 합성 슈퍼-인핸서.

58. SOX2에 의해 활성화된 합성 슈퍼-인핸서로서, 여기서 상기 합성 슈퍼-인핸서가 상이한 게놈 유전자좌로부터 유래된 4개의 인핸서 서열을 포함하고, 각각의 인핸서 서열이 적어도 하나의 SOX 이량체 모티프를 포함하는, 합성 슈퍼-인핸서.

59. 항목 1 내지 13 또는 46 내지 58 중 어느 한 항목에 따른 합성 슈퍼-인핸서 또는 항목 14 내지 45 중 어느 한 항목에 따른 기능성 핵산 분자를 포함하는 벡터.

60. 항목 59에 있어서, 상기 벡터가 바이러스 벡터인, 벡터.

61. 항목 59 또는 60에 있어서, 상기 벡터가 아데노 관련 바이러스 (AAV)인, 벡터.

62. 항목 1 내지 13 또는 46 내지 58 중 어느 한 항목에 따른 합성 슈퍼-인핸서 또는 항목 14 내지 45 중 어느 한 항목에 따른 기능성 핵산 분자 또는 항목 59 내지 61 중 어느 한 항목에 따른 벡터 및 허용되는 담체를 포함하는 조성물.

63. 치료요법에 사용하기 위한, 항목 14 내지 45 중 어느 한 항목에 따른 기능성 핵산 분자를 포함하는 조성물.

64. 암의 치료에 사용하기 위한, 항목 14 내지 45 중 어느 한 항목에 따른 기능성 핵산 분자를 포함하는 조성물.

65. 항목 21 내지 45 중 어느 한 항목에 따른 기능성 핵산 분자를 포함하는 키트로서, 여기서 불리한 페이로드가 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자이고, 키트가 기능성 핵산 분자와 함께 투여하기 위한 상기 불활성 전구약물을 추가로 포함하는, 키트.

66. 항목 14 내지 45 중 어느 한 항목에 따른 기능성 핵산 분자 또는 항목 63 또는 64에 따른 조성물을 환자에게 투여함을 포함하는, 암을 치료하기 위한 방법.

67. 항목 66에 있어서, 상기 암이 뇌암, 예를 들어, 교모세포종인, 방법.

68. 항목 66 또는 67에 있어서, 상기 기능성 핵산 분자 또는 조성물이 전신으로 투여되는, 방법.

69. 항목 66 또는 67에 있어서, 상기 기능성 핵산 분자 또는 조성물이 국소로 투여되는, 방법.

70. 기능성 핵산 분자 및 불활성 전구약물을 환자에게 투여하는 것을 포함하는 교모세포종을 치료하기 위한 방법.

71. 항목 70에 있어서, 상기 불활성 전구약물이 기능성 핵산 분자와 동시에 또는 순차적으로 투여되는, 방법.

본원 개시내용은 지금부터 하기의 비제한적인 실시예만을 참조로 하여 설명할 것이다.

실시예

재료 및 방법

지정 벡터 클로닝

인핸서 클로닝과 슈퍼 인핸서 어셈블리 둘 다에 대해 높은 클로닝 효율성을 보장하기 위해, 본원 발명자들은 효율적인 골든 게이트 클로닝을 가능하게 하는 새로운 맞춤형 지정 벡터를 구축하였다. 이것은 또한 반응 셋업 시간/비용을 감소시켰다. 상기 지정 벡터 디자인은 다음을 포함하였다: 리포터 유전자 카세트 Nanoluc-Ires-mNGreen-pA 및 최소 CMV 프로모터(mCMV). 세균 자살 ccdB 카세트는 선택 및 효율적인 클로닝을 위해 사용하였다. CDV2는 최대 4개의 인핸서 및 스페이서의 어셈블리를 가능하게 하는 위치에 걸쳐있는 ccdB 카세트를 함유하였다. CDV1와는 대조적으로, CDV2는 또한 전체 카세트를 플랭킹하는 PiggyBac 트랜스포사제 인지 부위를 함유한다. 흉터가 없는 맞춤형 지정 벡터를 생성하기 위해 Gibson 어셈블리를 사용하였다(참조: Gibson et al. 2009).

SOX2 인핸서 올리고뉴클레오타이드 풀의 디자인을 위한 생물정보학

슈바()와 동료들은 GSC(MGG8 세포주의 SOX2r1 및 SOX2r2, 전구-신경성 서브타입)에서 SOX2 결합에 대한 하나의 세포주 및 3개의 세포주 MGG4(전구-신경성 서브타입), MGG6(고전적 서브타입) 및 MGG8에서 H3K27ac에 대한 기술적 복사를 발표하였다(참조: et al. 2014).

이들은 또한 분화된 MGG8 세포 (본원에서는 분화된 신경교종 세포(DGC)로서 지칭됨)에 대한 데이터를 포함한다. 명확히 하기 위해, 종양 형성 성질로 인해 GSC 세포주는 또한 DGC(성상 세포 분화를 자극하는 혈청의 추가를 통해 여기에서 GSC에서 유래됨)와 달리 종양 증식 세포라고도 지칭된다.

GSC 특이적 SOX2 피크를 결정하기 위해 GSC SOX2r1 및 SOX2r2를 DGC SOX2_H3K27ac(SOX2 과발현 DGC에서 H3K27ac Chip-Seq)와 중첩시켰다. 추가로 추정되는 인핸서 서열을 정의하기 위해 GSC 세포주 간에 공유된 H3K27ac 피크도 동정되었다. 이들 공유된 피크는 GSC 특이적 SOX2r1 및 GSC 특이적 SOX2r2와 개별적으로 중첩시켰다. 이는 잠재적으로 중요한 영역의 손실을 방지하였다. 생성된 공유된 피크를 하나의 파일로 조합하고 100개 염기쌍(bp)보다 가까운 피크를 병합하여 중복도 제거하였다. 피크의 길이는 15-5300 bp 범위였고 평균 길이는 411 bp였다. 이어서 풀을 수동으로 큐레이팅하여 동원체와 같은 반복 서열 및 비-인핸서 서열을 제거하였다. 그 결과 15-3366 bp 범위의 1721개 피크와 평균 길이 402 bp로 구성된 큐레이팅된 예비 풀이 생성되었다.

작은 단편에 대한 PCR 편향(bias)을 회피하기 위해, 본원 발명자들은 또한 100 bp보다 작은 모든 영역을 폐기하여 115-3366 bp 범위의 1710개 피크와 404 bp의 평균 길이를 생성하였다. 이들 피크는 이어서 160 bp 단편으로 분할하였다. PCR 편향을 피하기 위해 100 bp보다 작은 단편을 다시 제거하였다. 20 bp 어댑터는 각각의 측면 상에 부착시켰다.

세포주

GSC는 문헌(참조: Pollard et al.)에 의해 이전에 보고된 NSC 배양 조건을 사용하여 유래하였다. 간략하게, 세포는 N2 및 B27 보충물이 있는 신경 기저 배지에서 무혈청 및 피더가 없는 조건에서 확장시켰다. 배양 배지에 라미닌-1을 보충함으로써 세포를 부착시켜 성장시켰다. GSC7은 문헌(참조: Stricker et al.)에 의해 특징 분석되었다. HEK293 세포는 ATCC 세포 뱅크로부터 수득하였다. 모든 다른 GSC 세포주 및 huFb170은 연구실 Pollard lab(공개되지 않음)에서 유래하였고 신경교종 세포 유전학 재원(Glioma Cellular Genetics Resource) (www.gcgr.org.uk)의 일부로서 특징 분석되고 있다.

인핸서의 배열된 플라스미드 라이브러리 구축

본원 발명자들은 160 bp 인핸서 단편이 별도의 플라스미드에 개별적으로 클로닝되고 96 웰 플레이트에 배열된 배열 라이브러리 포맷을 선택하였다. 이들 160 bp는 올리고(oligo)의 단일 풀로 합성된 다음 플라스미드에 무작위로 클로닝하고 단리되었다. 풀의 PCR 증폭을 위해 20 bp x 2가 필요했기 때문에 200 bp 단편의 라이브러리를 합성하였다(Twist Biosciences). 본원 발명의 올리고 합성 전략을 충족시키기 위해 GSC에 의해 표현된 ChIP-seq 피크가 단일 올리고로 병합되었다. 상기 올리고뉴클레오타이드 풀은 PCR 증폭되었고(편향을 줄이기 위해 제한된 주기를 사용하고 증폭하기 더 쉬운 생성물을 의미하는 '잭팟(jackpot)' 생성물은 올리고뉴클레오타이드 풀을 능가한다) 효율적인 골든 게이트 반응에 의해 발현 벡터로 클로닝하였다. 이어서 4579개의 개별 플라스미드를 무작위로 선택하고 단리하여 96웰 플레이트(x48)에 배열된 플라스미드 DNA 라이브러리로서 분주하였다. 플라스미드 미니프렙의 세균 콜로니 선택 및 생성은 기관(the Edinburgh Genome Foundry (S. Rosser))에 의해 지원되었다. 이어서, 상기 라이브러리를 최적화된 Nanoglo DLR 검정(Nano-Glo Dual-Luciferase Reporter Assay, Promega)을 사용하여 384웰 포맷으로 스크리닝하였다. 각 플레이트를 1:10 비율로 PGK-FFLuc와 함께 GSC7 세포에 일시적으로 형질감염시켰다. 2일 후, Nanoglo DLR 검정을 수행하고 플레이트 판독기 상에서 검정하였다.

라이브러리 생산을 위한 PCR 증폭 및 세정

본원 발명자들은 공(empty) 벡터에 대한 골든 게이트 클로닝 및 선택을 사용하여 라이브러리의 부적절한 생성물, 공 서열 및 중복성을 피하기 위해 라이브러리 증폭 및 플라스미드 클로닝의 매우 높은 효율을 개발하였다. PCR 조건은 제한된 백그라운드/백그라운드 없이 그리고 증폭 편향 없이 올리고뉴클레오타이드 풀을 증폭하도록 최적화하였다.

본원 발명자들은 68℃ 어닐링 온도와 72℃에서 5초 연장 시간으로 GC 완충제(Roche, KK2501)와 함께 KAPA HiFi Hotstart 폴리머라제를 사용하였다. 올리고뉴클레오타이드 풀은 먼저 0.25 μl(2.5ng 인풋)로 10회 사이클 동안 증폭되었고 상기 0.5 μl의 반응물은 PCR 편향을 줄이기 위해 다음 15회 사이클 증폭을 위해 사용하였다.

자기 비드 기반 고체상 가역적 고정화(SPRI) 정제를 사용하여 골든 게이트 클로닝 전에 DNA 손실을 최소화하고 세정하였다. 모든 삽입체의 생거(Sanger) 서열분석은 이들이 다양하고 모든 서열이 풀의 단편으로 다시 매핑될 수 있고 어댑터를 포함할 수 있음을 확인하였다.

384 웰 플레이트에 대한 스크리닝 플랫폼

세포를 멀티드롭(multidrop)을 사용하여 384웰 플레이트에 씨딩하고 다음날 CyBio Felix를 사용하여 형질감염시켰다. 2일 후 실험은 Nanoglo DLR 검정으로 종료되었고 10보다 큰 mCMV로의 배수 변화가 있는 모든 히트는 생거 서열분석하였고 다시 게놈에 맵핑하였다.

검증된 인핸서의 게놈 성질

온라인 도구인 GREAT는 전사 시작 부위(TSS)의 1kb 다운스트림 및 5 kb 업스트림으로 각 유전자에 대한 기본 조절 도메인을 정의하고, 즉, 가까운 유전자가 동일한 조절 도메인의 일부임을 의미한다. 원위 조절 이벤트를 설명하기 위해 기저 유전자 조절 도메인은 1000 kb 내에서 가장 근접한 기저 업스트림 및 다운스트림 조절 도메인을 향해 연장된다. 이어서, GREAT는 표적 유전자를 예측하기 위해 유전자 온톨로지의 농축을 시험하기 위해 이항(binomial) 시험과 함께 유전자 주석 및 탐색 서열의 온톨로지를 사용한다(참조: Mclean et al. 2010). 본원 발명자들은 예측된 표적 유전자의 사람 성인 조직에서 발현 패턴을 연구하였다(https://gtexportal.org/home/).

올리고뉴클레오타이드 풀다운 및 질량분광측정

올리고는 비오티닐화된 프라이머를 사용하여 PCR-증폭시켰다. 이어서 PCR 생성물을 SPRI 정제하여 비오티닐화된 프라이머 이량체를 제거하였다. 이들 dsDNA 단편은 GSC7 및 GSC328의 핵 추출물로 항온처리하였다. 그런 다음 이들은 스트렙타비딘 자기 비드에 결합하고 3회 세척한 다음 동결된 비드를 질량 분광측정 분석을 위해 보냈다.

세포 배양 절차

세포주는 37℃에서 5% CO₂에서 배양하였다. 코팅되지 않은 세포 배양 플라스틱 디쉬에서 세포를 성장시켰다. 교모세포종 줄기 세포주는 이전에 보고된 조건을 사용하여 무혈청 조건에서 성장시켰다(참조: Pollard et al., 2009). 계대를 위해 세포주를 PBS로 세정하고 GSC용 아쿠타제 또는 huFb170 및 HEK293용 0.5% 트립신/EDTA를 사용하여 탈착하였다. 세포를 세척 배지에 넣고 300 xg에서 3분 동안 회전시켰다. 이들을 각각의 성장 배지에 재현탁하고 재분주하였다. 냉동 보존을 위해 세포를 10% DMSO가 보충된 성장 배지에 재현탁하고 단기 저장을 위해 -80℃에서 저장하였다. 장기 보존을 위해 바이알을 액체 질소 컨테이너에 전달하였다.

GSC, huFb170 및 HEK293 세포의 형질감염

요구되는 밀도로 세포를 씨딩하였다. 다음 날 형질감염을 수행하였다. 이를 위해 Plus 시약과 Lipofectamine LTX(Life Technologies, 15338030)를 각각 Opti-MEM I 환원된-혈청 배지(Optimem이라고도 함)(Life Technologies, 31985062) 용적의 절반으로 희석하였다. 상기 단계 후에 Plus 시약/Optimem 프리믹스를 모든 DNA 샘플에 첨가한 다음, Lipofectamine LTX/Optimem 프리믹스를 첨가하였다. 형질감염 혼합물을 실온에서 5분 동안 항온처리한 다음 조심스럽게 세포에 적가하였다. 일반적으로, 어떠한 배지 변화는 수행하지 않았다. 세포는 형질감염 2일 후에 분석하였다.

HEK293 세포는 각각의 플레이트 포맷으로 특정 밀도로 씨딩하였다. 다음 날, GMEM, DNA 및 PEI(homemade)를 혼합하고 실온에서 15분 동안 항온처리하여 복합체가 형성되도록 한다. 이어서, 형질감염 혼합물을 세포에 적가하고 2일 후에 분석을 수행하였다.

나노-글로 이중-루시퍼라제 리포터 검정 시스템(Promega)

상기 검정은 2개의 단계로 이루어진다. 형질감염은 관심 대상의 플라스미드와 1/10 비율로 형질감염된 정규화 플라스미드 PGK-반딧불이-루시퍼라제(Promega, E5011)를 사용하여 수행하였다. 첫번째로, 반딧불이 루시퍼라제 활성을 측정하여 형질감염 효율에 정규화되도록 하였다. 제2 단계에서는 관심대상의 플라스미드의 판독값인 Nanoluc의 활성을 결정한다. 세포를 PBS로 3회 세척하고 최종 세척 후 96웰 플레이트에 20 μl를 잔류시켰다(384웰에 25 μl). Oneglo 완충액을 첨가하고 플레이트를 5분 동안 480 rpm에서 진탕시켜 세포가 용해되도록 하였다. 96웰 포맷의 20 μl 세포 용해물 또는 384웰 포맷의 25μl 세포 용해물을 상응하는 불투명 흰색 플레이트로 옮기고 발광을 Ensight Multimode 플레이트 판독기를 사용하여 웰당 0.1초 동안 측정하였다. 다음 Nanoluc 반응을 위해 96웰 포맷에서 2 μl 세포 용해물을 40 μl PBS를 함유하는 불투명 흰색 플레이트로 옮겼고, 기질이 보충된 20 μl Stopglo 완충액을 각 웰에 첨가하였다. 384웰 포맷에서 기질을 함유하는 20 μl Stopglo 완충액을 희석되지 않은 세포 용해물 위에 첨가하였다. 플레이트를 480 rpm에서 5분 동안 다시 흔들어 반딧불이 루시퍼라제 반응을 켄칭하고 잘 혼합되도록 하였다. Nanoluc 활성은 다시 Engisht Multimode 플레이트 판독기를 사용하여 웰 당 0.1초 동안 측정하였다.

Nanoluc 반응에 의해 수득된 데이터는 형질감염 효율의 웰 간 가변성을 설명하기 위해 반딧불이 반응으로 정규화하였다. 정규화된 데이터를 사용하여 공 벡터 대조군 mCMV에 대한 배수 변화를 계산하였다.

면역세포화학

세포는 PBS로 2회 세척하고 10분 동안 4% PFA에서 고정화시켰다. 세포에 PBS 중 0.1% Triton-100(PBST라고도 지칭됨)를 투과하였다. 이들을 차단 용액(3% 염소 혈청을 함유한 PBST에서 1% BSA)으로 차단시키고 4℃에서 밤새 1차 항체로 항온처리하였다(표 3). 다음날 세포를 PBST로 3회 세척하고 각각의 2차 항체를 차단 용액에 적용하고 실온에서 45-60분 동안 항온처리하였다. 세포를 PBS로 세척하고 1 μg/ml 최종 농도에서 DAPI 핵 대조염색으로 5분 동안 항온처리하였다. 이미지는 Nikon TiE 현미경 및 NIS 요소 소프트웨어(Nikon)를 사용하여 획득하였다.

표 3: 면역조직화학 실험에 사용되는 항체의 목록

유동 세포측정법

유동 세포측정을 위해, 세포를 탈착시키고, 펠렛화하고, 적절한 용적의 유동 세포측정 완충액(PBS 중 1% BSA, v/v)에 재현탁시켰다. 세포를 생/사 염색으로 Draq7(Abcam, ab109202, f.c. 0.1 μM)로 염색하고 BD LSRFortessa 세포 분석기(레이저 4개, BD Bioscience)를 사용하여 분석하였다. 유동 세포측정 데이터의 분석은 FlowJo 분석 소프트웨어(FlowJo, 버전 10.6.2)에서 수행하였다.

정량적 실시간 폴리머라제 연쇄 반응 (qRT-PCR)

qRT-PCR의 경우 TaqMan 범용 PCR 마스터 믹스(Universal PCR Master Mix)(Applied Biosystems) 및 TaqMan 유전자 발현 검정(Life Technologies)을 Quant Studio7 Flex 실시간 qPCR 기계에서 사용하였다. DNA 오염 및 물 조절을 평가하기 위해 역전사를 진행하지 않은 RNA 샘플은 모든 플레이트 상에 사용하였다. 또한 qRT-PCR은 기술적 중복으로 수행하였다. 데이터 분석은 100% PCR 효율성을 가정하고 TaqMan 검정으로 보장되는 ddCt 방법을 사용하여 수행하였다. 간략하게, 기술적 복제에 대한 평균을 계산하고 ddCt 값을 생성하는 하우스키핑 유전자 GAPDH로 정규화하였다. 이들 값은 ddCt를 제공하기 위해 교정기 샘플(GSC7)로 추가로 정규화하였다.

연장 가능한 모듈러 포유동물 어셈블리(EMMA) 툴킷을 사용한 진입 및 최종 벡터 생산

벡터는 문헌(참조: Martella et al. 2017)에 따라 디자인하고 생산하였다. 간략하게, 새로운 부분의 길들이기를 위해 BsaI 및 BsmBI 부위를 제거하였다. 융합 부위 및 BsaI 부위에 대한 오버행을 생성하는 프라이머를 사용하여 새로운 부분을 PCR 증폭시켰다. 이것은 부분 진입 벡터에 단순하고 효율적인 클로닝을 보장하였다. 모든 부분의 진입 벡터에는 클로닝된 부분과 재조합되는 적색 형광성 단백질(RFP)가 포함되어 있어 흰색 콜로니만 부분을 포함할 수 있으므로 클로닝 효율성을 증가시킨다. 발현 벡터를 어셈블리하기 위해, 모든 부분은 동일한 몰비로 수용체 벡터와 혼합한다. 클로닝 효율을 증가시키기 위해 수용체 벡터는 발현 벡터의 부분과 재조합되는 세균 자살 카세트 ccdB를 포함한다. 따라서, 비변형된 수용체를 수용한 세균은 콜로니를 생성할 수 없다.

웨스턴 블롯팅

세포를 PBS에서 긁어내고 0.3 g에서 2회 회전시켜 모든 액체를 제거하였다. 세포 펠렛을 70 μl의 RIPA 완충액(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP-40, 0.5% 데옥시콜레이트, 0.1% SDS 및 프로테아제 억제제(Complete, Roche, 11697498001))에 재현탁시키고 5분 동안 빙상에서 항온처리하였다. 용해물을 4℃에서 10분 동안 13000 rpm으로 원심분리하였다(원심분리기 5415D, 에펜도르프). 그리고 상등액을 새로운 튜브에 수거하였다. 제조업체의 지침에 따라 Pierce BCA 단백질 검정 키트(Thermo Scientific, Cat: 23225)를 사용하여 단백질 추출물을 정량화하였다.

50 mM DTT를 함유하는 4x 리튬 도데실 설페이트(LDS) 완충액 총 용적의 5%를 세포 추출물에 첨가하고 샘플을 95℃에서 10분 동안 변성시켰다. 스펙트라 멀티컬러 브로드 레인지 단백질 래더(Spectra Multicolour Broad Range Protein Ladder)(Thermo Scientific, Cat: 26634) 또는 바이오래드 프레시전 플러스 단백질 이중 컬러(BioRad Precision Plus Protein Dual Color) 표준(Cat: 1610377)을 사용하여 칼라 블린(Carla Blin) 박사가 제조한 4-12% 폴리아크릴아미드 겔에 샘플을 부하하였다. 임모빌론(Immobilon) PVDF 막(Millipore, IPVH00010)으로의 단백질 밴드 이동은 제조업체 지침에 따라 바이오래드 트랜스-블롯 (Biorad Trans-blot) 터보 시스템을 사용하여 습식 전기 블롯팅 또는 반건식 블롯팅에 의해 수행하였다. TBS-T (TBS + 0.1% Tween-20) 중의 5% 밀크는 실온에서 1시간 동안 막 차단을 위해 사용하고 이어서 밤새 진탕시키면서 TBS-T 중의 5% 밀크 중에서 1차 항체 항온처리를 수행하였다(표 4). 다음날 아침, 막을 TBS-T에서 실온에서 5분 동안 3회 세척하고 실온에서 1시간 동안 TBS-T에서 5% 밀크 중의 서양고추냉이 퍼옥시다제에 커플링된 2차 항체로 항온처리하였다(표 4). 다시, 막을 TBS-T에서 5분 동안 3회 세척하고 자가제의 증진된 화학발광(ECL) 용액 또는 Clarity ECL 웨스턴 블롯팅 기질(Bio-Rad, Cat: 170-5061)을 사용하여 현상하고 X선 필름 또는 바이오-래드 ChemiDocTM 이미저를 사용하여 이미지화하였다.

표 4: 웨스턴 블롯팅 실험에 사용된 항체의 목록

핵 추출물

모든 완충액은 전날 제조하여 22 μm 필터(투석 완충액 제외)에 통과시키고 4℃에서 밤새 방치하였다. DTT 및 프로테아제 억제제는 사용 직전에 첨가하였다. 세포를 배지 상에서 긁어내고 4℃에서 5분 동안 1350rcf에서 회전시킨 50 ml 팔콘에 수거하였다. 펠렛을 50 ml의 빙냉 PBS에 재현탁시키고, 세포 계수를 위해 분취량을 취하고, 다시 4℃에서 1350rcf에서 5분 동안 회전시켰다. 이어서 펠렛을 빙냉 완충액 A(10 mM HEPES pH 7.9, 1.5 mM MgCl₂, 10 mM KCl, 0.5 mM DTT, 프로테아제 억제제(Complete, Roche, 11697498001))의 4천만 세포당 5ml에 재현탁하고 빙상에서 10분 동안 항온처리하였다. 세포 현탁액을 유리 다운스 균질화기로 옮기고 빙상에 40회 다운싱하였다. 세포 현탁액을 팔콘으로 옮기고 4℃에서 10분 동안 1350rcf에서 원심분리하였다. 상등액을 버리고(시토졸 추출물) 펠렛을 빙냉 완충액 B(20 mM HEPES pH 7.9, 5% 글리세롤, 1M NaCl, 1.5mM MgCl₂, 0.2mM EDTA pH 8.0, 0.5mM DTT, 프로테아제 억제제(Complete, Roche, 11697498001)) 중에서 1000만개 세포 당 100 μl로 재현탁하였다. 현탁액을 4℃에서 30분 동안 회전시키고 투석막(SnakeSkin, Thermo Scientific, Cat 68100)으로 옮겼다. 투석은 500 ml의 투석 완충액(20 mM HEPES pH 7.9, 5% 글리세롤, 100 mM KCl, 0.83 mM EDTA pH 8.0, 1.66 mM DTT, 프로테아제 억제제(Complete, Roche, 11697498001))에서 4℃에서 회전시키면서 2시간 동안 수행하였다. 투석 완충액을 갈아주고(500 ml), 투석은 밤새 4℃에서 계속하였다. 추출물을 1.5 ml 튜브에 수거하고 4℃에서 15분 동안 최대 속도로 회전시켰다(원심분리기 5415D 에펜도르프). 상등액을 새로운 1.5ml 튜브에 수거하고 정량화하였다(Pierce BCA Protein Assay Kit, Thermo Scientific, Cat 23225). 100 μg의 분취액을 액체 질소 중에 순간 동결시키고 -80℃에서 저장하였다.

비오티닐화된 프라이머 및 정제를 사용한 PCR 증폭

인핸서는 제조업체의 지침에 따라 PrimeStar Max(Takara)를 사용하여 5' 비오티닐화된 프라이머(표 5)로 증폭시켰다.

표 5: 전사 인자 풀다운을 위한 5' 비오티닐화된 프라이머

제조업체의 지침에 따라 Agencourt AMPure XP 자기 비드(Beckman Coulter)를 사용한 PCR 정제를 수행하였다. 테이프스테이션(Tapestation) 및 시약을 사용한 PCR 생성물 정량화는 제조업체의 지침에 따라 수행하였다.

상호작용 단백질의 침전

스트렙타비딘 자기 비드(NEB, S1420S)를 제조업체의 지침에 따라 사용하였다. 간략하게, 10 μl의 비드를 LoBind 튜브에 분취하여 첨가하고 자기 스탠드에서 결합 완충액(20 mM Tris-HCl pH 7.5, 0.5M NaCl, 1mM EDTA)으로 3회 세척하였다. 20 μl의 비오티닐화된 DNA(~ 20 pmol)은 200 μl의 결합 완충액과 혼합하고 비드에 첨가하였다. 현탁액은 2시간 동안 실온에서 회전시켰다. 비드를 결합 완충액으로 다시 3회 세척하고 핵 추출물 50 μg을 첨가하였다(총 용적 50㎕). 투석 완충액(20 mM HEPES pH 7.9, 5% 글리세롤, 100 mM KCl, 0.83 mM EDTA pH 8.0, 1.66 mM DTT, 프로테아제 억제제(Complete, Roche, 11697498001))이 첨가된 비드, DNA 및 핵 추출물을 4℃에서 밤새 회전시켰다. 다음날 아침, 비드를 세척 완충액(20 mM HEPES pH 7.9, 5% 글리세롤, 250 mM NaCl, 0.83 mM EDTA pH 8.0, 1.66 mM DTT)으로 3회 세척하였다. 웨스턴 블로팅을 위해 단백질을 20 μl 부하 완충액(50 mM DTT를 함유하는 리튬 도데실 설페이트(LDS) 완충액)에 용출시키고 5분 동안 끓여서 단백질을 변성시켰다. 질량 분광측정을 위해 비드를 건조 상태로 시설로 보냈다.

제브라피시 실험

모든 배아는 자연 산란에 의해 수득하였고 0.00001% 메틸렌 블루로 컨디셔닝된 수족관 물에서 수거한다. 배아는 색소 침착을 억제하기 위해 실험 기간 동안 수정 후 6시간(hpf)부터 200 μM N-페닐티오우레아(PTU)(Sigma)로 처리하였다(참조: Karlsson, Von Hofsten, and Olsson 2001).

접합자는 발육의 단일 세포 단계에서 주입되었다. 미세 주사를 위해 문헌(참조: Nusslein-Volhard and Dahm 2002)에 기재된 바와 같이 계란을 1.5% 아가로스(Sigma) 금형에 유지하였다. 미세주사 바늘은 P-97 Flaming/Brown 마이크로피펫 풀러(Puller)(Sutter Instruments, USA)를 사용하여 유리 모세관(Harvard Apparatus, USA)에서 뽑았다. 바늘 풀(pull) 파라미터는 다음과 같다: 열: 550; 풀: 200; 속도: 55; 시간: 150. 미세 주사는 PV820 공압식 피코펌프(Pneumatic PicoPump)(World Precision Instruments[WPI], USA) 시스템에서 수행하였다. DNA 작제물은 Tol2Kit 시스템을 사용하여 생성하였다(참조: Kawakami 2007, Kwan et al. 2007). 주사된 용적의 시각화를 용이하게 하기 위해 0.2% w/v 페놀 레드(Sigma)가 보충된 Tol2 캡핑된 mRNA(20 ng/μL)를 함유하는 대략 2 nL의 플라스미드 DNA(30 ng/μL)를 주사하였다. 배아는 트리카인(Tricaine)으로 마취 후 라이브 광시야 형광 현미경에서 24-48 hpf로 이미지화하였다.

아데노 관련 바이러스 (AAV) 형질도입 검정

HEK293 세포는 형질감염 당일 컨플루언스가 60-70%가 되도록 형질감염 하루 전에 6개의 웰 플레이트에 씨딩한다. HEK293 세포가 PEI로 형질감염되기 전에 이 배지가 2일 동안 바이러스로 컨디셔닝될 것이므로 배지 변화를 수행한다. 다음 날 HEK293 또는 GSC7 세포는 동일하거나 보다 작은 플레이트 포맷(6 또는 12웰 플레이트)에 저밀도(10-20%)로 씨딩한다. AAV 컨디셔닝된 배지를 1300 rpm에서 4분 동안 회전 하강시켜 오염 세포를 제거하고 상등액을 저밀도로 씨딩된 HEK293 세포로 옮긴다. 세포는 현미경 또는 유동 세포 측정법으로 분석한다.

사멸 검정을 위한 세포 씨딩 및 형질도입

세포 파종 당일, 상기 기재된 방법을 사용하여 세포를 탈착하였다. 세포를 혈구세포측정기를 사용하여 계수하고 96-(50 μl에서 웰당 1,000개 세포), 24-(500 μl에서 웰당 30,000개 세포) 또는 6-웰(2 mL에서 웰당 60,000개 세포) 코닝 플레이트에 씨딩하고 37℃/5% CO₂에서 항온처리기에 넣었다. 다음날 AAV 바이러스 스톡을 실온에서 해동하고 필요한 양의 배양 배지에 적절한 양의 바이러스 스톡을 첨가하여 최종 감염 다중도(MOI) 5 x 10⁵를 달성하였다. 바이러스 입자를 함유하는 배양 배지를 기존 배지를 대체하지 않고 세포에 첨가하였다. 세포를 37℃/5% CO₂로 복귀시켰다.

약물 처리

동결건조된 GCV를 DMSO 중에 희석하여 100 mM 스톡 농도를 달성하였다. GCV 스톡을 분취하고 -20℃에서 1개월 이하 동안 저장하였다. 작업 스톡 농도를 만들기 위해 GCV를 적절한 배양 배지에서 1:100으로 희석한 다음 이러한 작업 스톡 20 μL를 이미 80 μL의 배양 배지를 함유하는 웰에 첨가하였다(또 다른 1:5 희석 달성). 세포 상의 GCV의 최종 농도는 200 μM이었다.

음성 대조군으로서 DMSO를 적절한 배양 배지에 1:100으로 희석하여 작업 스톡을 성취하였다. 20 μL의 작업 스톡을 이미 80 μL 배양 배지를 함유하는 웰에 첨가하였다. 양성 대조군으로서 20 μl의 DMSO를 80 μl의 배양 배지가 있는 웰에 첨가하여 20% DMSO의 최종 농도를 달성하였다.

Incucyte 생존-세포 이미지화

처리 동안에 세포 증식 및 형태학적 변화를 추적하기 위해 Incucyte 생존 세포 이미지화 시스템을 사용하여 세포를 모니터링하였다. 4시간마다 코닝 96웰 플레이트의 전체 웰 이미지화. 컨플루언스를 추정하기 위해 기본 컨플루언스 스코어링 분석 소프트웨어(Incucyte)를 사용하였다. 특정 시점의 이미지를 추출하여 세포 컨플루언스 및 형태를 확인하였다.

MTT 검정

검정 당일 배양 배지를 0.3mg/mL MTT 용액(세포주에 적합한 배양 배지에 희석)으로 대체하였다. 세포를 3시간 동안 37℃/5% CO₂에서 항온처리기에 위치시켰다. 항온처리 후, 배지를 제거하고 70 μL의 DMSO를 각각의 웰에 첨가한다. 각각의 플레이트는 20분 동안 37℃에서 암실에 유지시키고, 이를 가끔씩 흔들어준다. 플레이트를 판독하기 전에 각각의 웰을 시각적으로 검사하여 모든 (포르마잔) 결정이 용해되었는지 확인하였다. 플레이트는 560 nm 흡광도로 플레이트 판독기를 사용하여 판독하였다.

데이터 분석

대부분의 데이터 분석은 Mac용 Microsoft Excel 버전 16.23 및 GraphPad Prism 7을 사용하여 수행하였다. 오차 막대는 평균의 표준 편차로서 나타낸다. 일부 데이터 분석은 RStudio 버전 1.1.456(RStudio Team 2015)을 사용하여 수행하였다. 일러스트레이션 생성에는 biorender.com 및 Adobe Illustrator 22.0.1이 사용되었다. 추가로 다양한 분석을 위해 bedtools(Quinlan and Hall 2010), GREAT(Mclean et al. 2010), fastasplitter(Stothard 2000) 및 MEME(Bailey et al. 2009)와 같은 개방 소스 프로그램을 사용하였다.

실시예 1 - 기능성 SOX2 인핸서의 동정

먼저 개별 활성 인핸서를 클러스터링된 다중 부분 배열로 조합할 때 상승작용 활성을 달성할 수 있는지 여부에 대한 개념 증명을 확립하기 위해 본원 발명자들은 먼저 작은 후보 인핸서 세트를 동정하였다. 이들은 신경 줄기 세포(NSC) 자가 재생(POU3F2, POU3F3, CHD7, ASCL1, SOX6, ETV1)에서 알려진 역할을 갖는 근위 유전자에 기초한 것뿐만 아니라 NSC 대 1차 사람 섬유아세포에 대한 이용 가능한 차등 발현 데이터를 사용하여 선택되었다. 5개의 SOX2 후보 자동 조절 인핸서도 포함되었다. 이들 인핸서(전형적으로 ~500-800 bp)는 mNeonGreen 및 루시퍼라제 리포터 카세트를 함유한 플라스미드 발현 벡터에 클로닝하고 2개의 독립적인 환자 유래 교모세포종 줄기 세포(GSC) 세포주(G7 및 G328)를 사용하여 개별 인핸서 활성을 시험하였다(도 1). 이들 인핸서 중 6개는 mCMV에 비해(254, 270, 282, 292, 312 및 316; 10-300배 범위) NanoLuc 발현이 10배 이상 증가된 기능성이었다. 이들 중 어떠한 것도 HEK293 세포 (음성 대조군)에서 활성이 아니었다.

표 6: 예측된 표적 유전자, 및 인핸서 단편으로부터 전사 시작 부위(TSS)까지의 거리

실시예 2 - 4개의 상이한 인핸서의 어셈블리는 전사 활성에서 상승작용적 증가를 초래한다

다수의 인핸서 조합이 활성을 증가시킬 수 있는지 여부를 조사하기 위해 본원 발명자들은 먼저 2개 인핸서(2x), 4개 인핸서(4x) 또는 8개의 인핸서(8x)(컨카터머)(즉, 동일한 인핸서의 여러 카피물)의 버전 컨카터머를 구축하였다. 본원 발명자들은 다양한 강도를 갖는 3개의 상이한 개별 인핸서를 선택하였다: 270(약 100배), 254(약 20배), 및 312(약 10배). 270에 대해, 2-부 및 4-부 인핸서 둘 다에서, 본원 발명자들은 개별 인핸서 활성과 비교하여 단지 약간의 상승작용적 효과를 주지하였다. 4-부 인핸서는 개별 인핸서의 약 100배 활성과 비교하여 약 500배 활성을 초래하였다(도 1f). 놀랍게도 본원 발명자들은 8-부 컨카터머에 대한 카피물을 증가시켜도 추가 이득이 관찰되지 않았다. 독립적인 환자 라인인 GSC328에 대해서도 유사한 경향이 관찰되었다. mCMV 음성 대조군에 필적하는 루시퍼라제 활성화의 백그라운드 수준만이 모든 작제물에 대해 HEK293 세포에서 나타났다.

다음으로 본원 발명자들은 서로 다른 유전자로부터 서로 다른 인핸서를 함께 혼합하면 상승작용 효과를 초래할 것인지 여부를 시험하였다(도 1k). 따라서 본원 발명자들은 G7(270, 282, 292 및 316)에서 확인된 상위 4개의 개별 인핸서를 새로운 합성 인핸서(T4라고 호칭됨)로 조합하였다. 실제로 본원 발명자들은 Nanoluc 리포터 검정(Nano-Glo 루시퍼라제 검정 및 Nano-Glo 이중-루시퍼라제 리포터 검정, 둘 다 Promega)을 사용하여 mCMV(도 1l)에 비해 T4에 대한 발현이 5000배 이상 증가한 놀라운 증가를 주지하였다. 이것은 T4의 지적된 수준이 G7 세포에서 전장 CMV에 대해 관찰된 것의 대략 50-60%인 G7 세포(도 1l)에서 mNGreen을 스코어링하기 위해 유동 세포측정법을 사용하여 추가로 검증되었다. 따라서 서로 다른 유전자로부터의 인핸서를 조합하면 상승작용 효과를 초래하고 GSC에서 인핸서 활성이 크게 증가하지만 HEK293 세포에서는 백그라운드 발현이 증가하지 않는다. 인핸서의 이들 세포 특이적 합성 클러스터는 이후 '합성 슈퍼-인핸서'(SSE)로 지칭된다.

실시예 3 - 성상세포 분화 후 GSC에서 T4 합성 슈퍼-인핸서의 활성이 감소된다

본원 발명자들은 이어서 SSE-T4 합성 슈퍼-인핸서가 GSC 상태에 특이적인지 여부와 SOX2가 하향 조절되는 성상 세포로의 분화시 손실되는지 여부를 시험하였다. G7 세포는 10-15일 기간 동안 태아 송아지 혈청(FCS)에 노출된 후 성상세포 유사 세포로 효율적으로 분화될 수 있다. 따라서, GSC(G7)는 SSE-T4 발현 카세트(PiggyBac 트랜스포사제 시스템 사용) 및 형광 활성화 세포 분류(FAC)를 사용하여 분류된 mNGreen+ 세포로 안정적으로 형질감염시켰다. 이들은 다음날 5% FCS에 분주하였고 mNGreen 발현은 15일 시간 과정(도 1h-1j)에 걸쳐 유동 세포측정법을 사용하여 5일마다 측정하였다. mNGreen의 발현은 생존 세포 형광 이미지화를 기반으로 5일까지 상당히 감소하였다. 이것은 세포의 대략 50%가 5일째에 mNGreen이 손실되고 15일째에는 대략 80%가 손실된 것을 보여주는 유동 세포측정법에 의해 확인되었다. 이들 데이터는 SSE-T4가 GSC에서 높은 활성을 갖지만 이들의 분화된 성상세포 유사 자손에서는 그렇지 않음을 나타내므로 SSE는 세포 유형에 특이적임을 지적한다.

실시예 4 - SOX2 인핸서의 배열된 플라스미드 라이브러리의 체계적인 스크리닝

상기 데이터는 인핸서를 4-부 배열로 조합하면 비-GSC 세포에서 백그라운드 발현을 손상시키지 않으면서 전사 활성을 증가시킬 수 있다는 원리 증명을 제공하였다. 본원 발명자들은 인핸서 단편(160 bp)의 기능성 스크리닝이 SSE에서 사용되는 경우 최적의 수행능과 보다 작은 크기의 기능성 인핸서를 체계적으로 동정하기 위해 고처리량 384웰 플레이트 기반 루시퍼라제 검정에서 후보 게놈 전체 SOX2 인핸서의 전체 세트를 사용하여 수행할 수 있다고 추론하였다. 환자 유래 GSC에서 이러한 스크리닝을 수행함으로써 본원 발명자들은 적절한 정체성 및 관련 인핸서를 갖지 않는 기존 혈청 성장 암 세포주의 한계를 극복할 수 있다.

뉴클레오좀 결합을 위한 충분한 크기를 제공하고 기능성 인핸서 내 문법의 진화에서 중요한 속성으로 간주될 가능성이 있기 때문에 160 bp가 선택되었다(Soufi et al. 2015). 또한, 160 bp는 배열된 플라스미드 라이브러리의 후속 구성을 위해 20 bp 말단이 혼입된 풀링된 올리고뉴클레오타이드 라이브러리의 합성에 편리한 크기이다. 본원 발명자들은 STARR-seq(참조: Muerdter et al. 2018, Arnold et al. 2013)와 같은 다른 풀링된 라이브러리 스크리닝 전략보다 합성 올리고뉴클레오타이드로 부터 작제된 배열된 플라스미드 라이브러리를 선호하였는데, 이는 개선된 신호 대 노이즈, 및 히트의 간단한 검증을 보장하기 때문이다.

따라서 본원 발명자들은 풀로서 합성될 수 있는 올리고뉴클레오타이드 세트를 디자인하였다. 본원 발명자들은 문헌(참조; Suva et al. 2014)의 데이터 세트를 재분석하였고, H3K27ac와 중첩되는 GSC 특이적 SOX2 결합 피크 세트를 한정하였고, 이는 1710개의 서로 다른 인핸서를 동정하였다. 이들 인핸서는 평균 약 400 bp(범위: 115-3366 bp)였다. 본원 발명자들은 이들 서열을 인 실리코(in silico)에서 100 bp 중첩되는 160 bp 요소로 분할하였다. 이어서 9523개의 상이한 올리고뉴클레오타이드 서열을 풀로서 합성하고, PCR 증폭하고, 48 x 96 웰 플레이트의 배열된 플라스미드 라이브러리로 클로닝하였다(총 4579개의 개별 플라스미드). 생성된 플라스미드의 서브세트에 대한 생거(Sanger) 서열분석으로 이러한 플라스미드의 대부분(~70%)이 적절한 인핸서를 포함하고 있음을 확인하였다.

SOX2 인핸서 라이브러리는 최적화된 루시퍼라제 검정을 사용하여 384-웰 포맷으로 스크리닝되었다. 135개 플라스미드는 mCMV 보다 10배 이상의 증가와 함께 기능성인 것으로서 동정되었다. 이어서 135개의 초기 히트 중 52개를 독립적인 Nanoglo DLR 검정을 사용하여 3중으로 검증하였다(도 2). 이들 52개 중 16개는 1회 초과인 것으로 밝혀졌다. 히트는 생거 서열분석되었고, 인핸서를 포함하는 것으로 확인되었으며 본래의 디자인된 세트의 예상 단편을 사용하여 사람 게놈에 다시 맵핑하였다.

본원 발명자들은 이어서 여러 세포주에 걸쳐 독립적인 유동 세포측정 검정을 사용하여 상위 17개 단편(mCMV보다 30배 이상 증가)을 검증하였다(도 2). 이들은 독립적인 환자 유래 GSC 세포주(GSC328)에서 활성이었지만 시험된 비신경 세포(HEK293 세포 및 사람 1차 섬유아세포, huFb170)에서는 불활성이었다. 본원 발명자들은 대부분의 상위 히트가 척추동물에 걸쳐 진화적으로 보존된 서열이라는 것을 발견하였다. 상위 5개의 인핸서는 NanoLuc 기반 mCMV(범위: 100-260배)에 비해 각각 100배 이상이었다. 이들은 유동 세포측정에 의해 검증되었다.

ID1101은 PRCP의 인트론에 위치하고; ID2904는 MYO18 유전자의 인트론 영역에 있고 SEZ6L에 근접해 있으며; ID0109는 TPK1과 CNTNAP2 사이의 유전자가 풍부한 영역에 위치하고; ID4328은 아연 핑거 전사 인자 ZNF438의 인트론 영역에 있다. ID0876은 NWD2의 인트론 영역에 위치한다.

표 7: 예측된 표적 유전자, 및 인핸서 단편으로부터 전사 시작 부위(TSS)까지의 거리

따라서, 본 발명의 기능성 스크리닝은 크기가 4~5배 작음에도 불구하고 전장 인핸서(상기 기재된)와 비교하여 활성이 크게 개선된 많은 160 bp 인핸서 단편의 동정을 초래하였다.

실시예 5 - 새롭게 동정된 SOX2 인핸서를 사용한 강력하고 선택적인 합성 슈퍼 인핸서의 생성

본원 발명자들은 세포 유형 선택성을 유지하면서 강도가 상승작용적으로 증가하는지 여부를 동정하기 위해 스크린에서 개별적으로 가장 활성인 단편을 4-부 배열로 클러스터링하여 합성 슈퍼-인핸서를 작제하였다.

최강의 가능한 합성 슈퍼-인핸서를 생성하기 위해, 본원 발명자들은 Top17 인핸서로부터의 서열를 사용하여 4개의 새로운 4-부 배열 세트를 디자인하였다. 이들은 mCMV의 업스트림에서 어셈블리되었다. 단편은 mCMV에 대한 이들의 메디안 배수 변화에 따라 순위가 매겨졌다. 가장 활성의 4개의 인핸서(ID1101, ID2904, ID0109, ID4328, '1'로 표시)는 합성 슈퍼-인핸서의 4-부 배열로 클러스터링되었다. 제2 그룹('2'로 표시)을 포함하는 인핸서는 합성 슈퍼-인핸서 등으로 클러스터링되었다. 본원 발명자들은 4개의 최강 인핸서가 가장 높은 수준의 발현을 보일 것이고, 다음 그룹이 두 번째로 높을 것이라는 가설을 세웠다. 추가로, 상이한 세포 유형(GSC7, GSC328, HEK293 및 huFb170)에서 합성 슈퍼-인핸서를 시험함에 의해, 본원 발명자들은 이들의 세포 유형 선택성도 조사하였다.

시험된 4개의 작제물 모두(C1, C3, C5 및 C7)는 GSC7 및 GSC328에서 유의적이고 선택적인 발현을 유도하였고 HEK293에서는 백그라운드 발현만을 유도하였다. huFb170에서 어떠한 발현도 검출되지 않았다. 이들 각각의 합성 슈퍼-인핸서(C1, C3, C5 및 C7)는 GSC7 및 GSC328에서 후보 인핸서를 사용하는 가장 활성이 높은 합성 슈퍼-인핸서인 SSE-T4(위에서 논의한 1개 복제 생산물 SSE)보다 더 높은 형광성 강도와 더 높은 mNGreen+ 세포 퍼센트를 나타냈다. 놀랍게도, C1과 C7은 그 자체로 최강의 바이러스 프로모터 중 하나인 양성 대조군 CMV보다 더 높은 발현 수준을 유도하였다. 따라서 본원 발명자들은 4-부 인핸서 배열 구축의 명확한 상승작용 효과를 관찰하여 매우 강력하고 세포 유형 선택적 합성 슈퍼 인핸서를 생성하였다.

본원 발명자들은 어댑터와 스페이서를 제거하여 합성 슈퍼-인핸서의 크기를 추가로 감소시켰다(예를 들어, C1의 경우 974 bp에서 640 bp로). 이들 합성 슈퍼-인핸서는 SSE 1-7로 호칭되고, 이는 이들이 7개의 작제물이고 이들의 디자인이 C1, C3, C5, C7과 동일한 이론적 근거를 따르기 때문이다. 모든 작제물은 유사한 수준의 활성을 보여주었다. 이것은 전체 CMV와 유사한 수준이었고, 일부 경우에는 CMV 보다 높았다(GSC7에서 Nanoglo DLR 검정에 의한 SSE1, 2, 3, 5 및 유동 세포측정법에 의한 SSE-1, 2, 3, 5, 7). SSE-1, 2, 5 및 7은 또한 GSC7에서 CMV 보다 높은 강도를 나타냈다. GSC328, HEK293 및 huFb170에 대해서도 유동 세포측정법에 의한 mNGreen 발현 분석을 수행하였다. 이러한 추세는 GSC328에서 유사하였다. 평균 형광 강도(MFI)는 CMV 부근이었고 SSE-6은 분명히 CMV보다 강도가 낮았다. HEK293 세포에서, 모든 합성 슈퍼-인핸서는 mCMV와 유사한 수준으로 전사를 유도하였다. mCMV는 형질감염되지 않은 세포와 비교하여 32.5% mNGreen+ 세포를 나타냈다. SSE는 mCMV에 비해 HEK293에서 약간의 발현 증가를 입증하였다. huFb170에서 SSE1-7의 활성은 검출될 수 없었다(1% 초과). 2개 리포터 유전자 검정(Nanoglo DLR 검정 및 유동 세포측정)에서 보다 작은 합성 슈퍼-인핸서를 사용하여 보다 높은 활성을 향하는 경향이 각 작제물 C1 대 SSE-1; C3 대 SSE-3 등에 대해 관찰되었다(도 3b, c, d). 이것은 생존 세포 이미지에 의해 확인되었다(도 3e). 시험된 각각의 합성 슈퍼-인핸서 SSE-1, 3, 5 및 7은 CMV와 활성이 유사하였다.

실시예 6 - 합성 슈퍼-인핸서는 분화된 GSC에서 덜 활성이었다

분화 조건 하에서 SSE-2-SSE-7의 활성을 조사하기 위해, Piggybac 트랜스포사제 시스템을 사용하여 GSC7 세포를 안정적으로 형질감염시키고 mNGreen+ 세포에 대해 분류하였다. 유사한 수의 생존 세포를 mCMV 및 형질감염되지 않은 대조군에 대해 분류하였다. 그런 다음 세포를 성상 세포 분화를 유도하기 위해 성장 인자는 없지만 5% FCS를 포함하는 배지에 넣었다.

mNGreen 발현은 분화 동안 0, 1, 5, 10 및 15일에 측정되었다(도 4e 및 도 4g). 본원 발명자들은 시간 경과에 따라 신호 강하를 관찰했고, 이는 합성 슈퍼-인핸서가 GSC에서 가장 높게 발현되고 분화 시 활성이 감소함을 시사한다.

실시예 7 - 제브라피시 배아는 전뇌에서 고도로 선택적인 영역 특이적 발현을 나타낸다

제브라피시는 인핸서의 조직 특이성을 탐색하기 위한 실험 모델로 매우 적합하다. 본원 발명자들은 복부 척수 발현, 귀판(optic placode), 중뇌/후뇌 및 전방 전뇌와 같은 모든 작제물 간에 공유되는 조직을 동정하였다. 일부 단편은 전방/후방 장과 같은 추가 활성을 가졌다. 본원 발명자들은 일반적으로 48 hpf에서 가장 최근에 측정된 시점까지 계속 증가하는 24 hpf에서 낮은 발현을 관찰하였다. 대조군에 관하여, 본원 발명자들은 CMV 대조군에서 EGFP의 광범위하고 비특이적인 발현을 관찰하였고, 동일한 검정을 사용하여 mCMV에서는 발현하지 않았다(도 4). mCMV 대조군은 녹색 형광 눈을 나타냈는데 이는 아마도 결정 눈 프로모터의 비논리적 전사 때문일 것이다(도 4k).

실시예 8 - SSE는 GSC의 선택적 사멸을 유도하기 위해 아데노 관련 바이러스에서 사용될 수 있다.

SSE가 세포 독성 페이로드를 구동시키고 GSC를 선택적으로 사멸시키는 데 적합한지 시험하기 위해, 본원 발명자들은 p2A에 의해 결합된 리포터 유전자 mCherry를 갖는 폴리시스트론 mRNA에서 헤르페스 심플렉스 바이러스(HSV)로부터 유래된 자살 유전자 티미딘 키나제(TK)를 포함하는 아데노 관련 바이러스 2(AAV2)로 GSC7 및 huFB170 세포주를 형질도입하였다. 카세트는 양성 대조군(CMV_HSV-TK-v5_P2A_mCherry)으로서 항상성 활성 CMV 프로모터 또는 관심 대상의 프로모터인 SSE-7(SSE-7-HSV-TK-v5-P2A-mCherry) 중 어느 하나에 의해 구동되었다. HSV-TK는 비세포독성 전구약물 간시클로비르(GCV)를 인산화에 의해 세포독성 생성물로 대사시키는 잘 확립된 전구약물이다. 인산화된 GCV는 폴리머라제의 기질로서 dGTP와 경쟁하여 DNA 합성을 방해하여 조기 종결 및 세포독성을 유발한다.

유동 세포측정 및 웨스턴 블롯팅은 SSE-7이 GSC7에서 mCherry 및 HSV-TKv5 발현 둘 다를 구동시키지만 섬유아세포(huFb170)에서는 그렇지 않음을 확인하였다(도 5). 세포 컨플루언스는 세포 독성 실험 전반에 걸쳐 기록되었다. CMV 또는 SSE-7 구동된 TKv5-P2A-mCherry로 형질도입되고 200 μM GCV를 받은 세포에서 세포 증식 및 컨플루언스의 감소가 구체적으로 관찰되었다(도 6a). 단독의 바이러스 또는 간시클로비르를 받은 세포에서는 세포 컨플루언스에 대한 유의적인 음성 효과가 관찰되지 않았다. MTT 검정 데이터는 CMV 또는 SSE-7 구동된 TKv5-P2A-mCherry 및 GCV로 처리된 GSC7 세포에서 세포 생존능에 대한 대략적인 판독값으로서 작용하는 대사 활성의 손실(또는 부재)을 입증한다(도 6b). CMV와 SSE-7 사이에는 통계학적 차이가 없었다(13% 대 12% 생존율)(p-값 = 0.7792). GSC7 세포 생존율(생존율 89%)에 대한 간시클로비르 단독의 작은 효과가 있었다. 생존 세포 이미지화는 치료 후 세포 스트레스, 손상 또는 사멸(둥근 세포)과 관련된 보다 낮은 세포 밀도 및 형태학적 변화를 보여주는 이들 결과를 확인하였다(도 6c). 요약하면, CMV 및 SSE-7 둘 다는 GSC7 세포에서 간시클로비르의 존재 하에 세포 사멸을 유도하기에 충분한 수준으로 HSV-TK-v5-P2A-mCherry 작제물의 발현을 구동시킬 수 있다.

실험 종료 시(17일) 생존 세포 이미지화 데이터를 기반으로, SSE-7 구동 바이러스가 아닌 CMV 구동 바이러스로 형질도입된 대부분의 huFB170 세포가 사멸되었다(도 6d). 이것은 MTT 데이터로 확인되었고, SSE-7 구동된 TKv5-P2A-mCherry로 형질도입된 세포에서 완전한 생존율에 비해 CMV 구동 바이러스로 형질도입된 세포의 6.3% 생존율을 입증하였다(도 6e, n=1).

실시예 9 - SSE는 일정 범위의 GSC에서 활성을 보여준다.

제안된 유전자 치료요법의 SSE는 다양한 환자 유래 교모세포종 세포주에서 높게 발현되지만 다른 세포 유형에서는 비활성화인 것이 바람직하다. 실시예 8에 기재된 실험을 5개의 환자 유래 교모세포종 세포주(E17, E21, E28, E31, E34)에서 반복하였다. 이들 세포주는 유전학적 및 전사 GBM 서브타입의 스펙트럼을 포함하고 마우스 뇌에서 종양을 유발하는 것으로 나타났기 때문에 이 실험을 위해 선택되었다. 전체적으로 SSE7은 모든 세포주에서 활성화되지만 정도는 상이하다. 이는 양성 대조군 세포주 GSC7(도 7c); 및 둘 다 고전적 서브타입에 속하지만 E21, E31 및 E34(도 7c)에서 보다 낮은 발현 빈도를 갖는 E17 및 E28(도 7c)에서 고도로 발현되고 전장 CMV와 유사하다(도 7c).

실시예 10 - 드 노보 모티프의 분석은 상위 32개 히트에서 풍부한 SOX 이량체 모티프를 동정한다.

본원 발명자들은 드 노보 모티프를 동정할 수 있는 MEME 도구를 사용하였다(참조: Bailey et al. 2009). 본원 발명자들은 인풋으로서 상위 32개 히트를 사용하였다. 예상치 않게 등장한 유의적인 모티프는 부분 팔린드롬 SOX 모티프였다(도 8a). SOX2는 다른 SOX 인자와 동종 또는 이종이량체를 형성하지 않지만; SOXE 그룹의 구성원은 이량체(SOX8, SOX9, SOX10)화하는 것으로 잘 확립되어 있다. 흥미롭게도 SOX9는 NSC 및 GSC의 널리 공지된 조절인자이지만 SOX2만큼 깊이 연구되지는 않았다(참조: Bulstrode et al. 2017, Huang et al. 2015, Mateo et al. 2015 및 D. K. Singh et al. 2017). 상기 모티프는 SOX2와 SOX9가 공유 인핸서에서 작동할 수 있음을 즉시 시사하였다(도 8c).

본원 발명자들은 이어서 상기 이량체 모티프가 서열의 올리고뉴클레오타이드 풀의 일반적인 특성인지 여부를 조사하고, 확인되지 않은 검증 히트와 비교하여 그리고 초기 올리고뉴클레오타이드 풀의 10개 무작위 서열에서 이를 상위 52개 히트에 맵핑하였다(mCMV 보다 10x 배수 변화를 갖는 모든 서열). 모티프는 상위 32개 히트에서 높은 빈도로 존재하고 나머지 상위 33-상위 52에서는 낮은 빈도로 나타난다.

실시예 11 - SOX 이량체 모티프는 GSC에서 ID2904의 활성에 필수적이고 주요 GSC 기능성 인핸서에서 SOX2 및 SOX9의 협력을 시사한다

이어서 본원 발명자들은 SOX 이량체가 인핸서 기능에 필수적인지 조사하였다. 본원 발명자들은 ID2904에 대한 모티프의 일련의 변이체를 생성하였다. 합성된 변이체는 다음을 가졌다: 1) 절반 부위 사이의 감소된 간격(-2n); 2) 모티프 절반 부위 사이의 증가된 간격; 3) 및 4) 하나의 절반 부위의 결실; 5) 플랭킹 서열의 무작위 서열로의 대체; 6) 모티프의 역위; 7) 코어 뉴클레오타이드의 돌연변이; 8) 문헌(참조: Jolma et al. 2013)에 의해 보고된 바와 같은 고친화성 모티프에 의한 대체; 9) 음성 대조군으로서 무작위 서열; 및 10) 모티프의 4회 컨카테머화. 이들 상이한 변형은 본원 발명자들이 이량체 모티프 내에서 주요 서열을 기능적으로 해부할 수 있게 하였다(도 8).

본원 발명자들은 ID2904에서 SOX 이량체 모티프의 거의 모든 변형에서 거의 완전한 활성 손실을 관찰하였고, 이는 인핸서의 기능에 대한 상기 이량체 모티프의 중요성을 확인하였다. 예외는 활성 증가로 이어진 2개의 절반 부위 간의 변경된 거리였다. 이것은 간격이 '준최적화'될 수 있고 2bp 감소가 SOX9 이량체의 보다 강한 결합을 구동시킬 수 있다는 개념과 일치하기 때문에 흥미롭다(참조: Farley et al. 2015). 본원 발명자들은 SOX 이량체 모티프가 ID2904의 인핸서 활성에 필수적이라고 결론지었다. 간격의 감소는 또한 SOXE 인자 모티프에 대한 최적의 간격을 정의한 후앙 등(참조: Huang et al. 2015)에 따른다.

이어서, 본원 발명자들은 실제로 SOX2와 SOX9가 인핸서와 SOX 이량체 모티프에 결합하고 있는지 확인하는 것을 목표로 하였다. 이를 위해 본원 발명자들은 ID1101(스크린의 상위 히트) 및 ID2901이 비오티닐화되고 핵 추출물로 항온처리된 풀다운 검정을 수행하였다. 단편과 상호 작용하는 주요 전사 인자를 동정하기 위해 웨스턴 블롯팅 및 질량 분광측정을 수행하였다(도 8). 데이터 분석을 위해 ID1101은 무작위 서열 599(각 세포주에서)의 평균값으로 정규화하였다. 컷-오프는 세포주 둘 다에서 599 이상의 2배 농축으로 설정하였다. 전사 인자를 필터링하기 위해 UniProt에서 모든 전사 인자 목록을 얻었고 세포주 둘 다에서 검출된 단백질과 중첩되었다.

공동면역침전 실험에서, SOX2는 GSC7 및 GSC328에서 ID1101과 특이적으로 풀다운되어 SOX2가 인핸서에 결합하는 것을 입증한다(도 8). 이것은 SOX2가 GSC328에서 23배 풍부하고, G7에서 4.4배 풍부하여 상기 전사 인자의 결합을 확인함으로써 질량 분광측정법에서 확인되었다.

추가로, 상기 기재되고 도 8j에 나타낸 데이터는 모티프를 둘러싸는 서열 맥락(문법)이 야생형(WT) 서열 20 bp 업스트림 및 다운스트림의 대체가 활성의 완전한 손실을 초래했기 때문에 기능적으로 중요하다는 것을 입증한다.

실시예 12 - SOX 이량체 모티프는 인 실리코에서 활성 인핸서를 필터링하는 것을 도와준다

본원 발명자들은 모티프의 존재가 어떤 인핸서가 활성인지에 대한 본 발명의 예측력을 증가시키는 능력을 가질 수 있다고 가정하였다. 상기 가설을 시험하기 위해 본래의 SOX2 ChIP-seq 데이터 세트의 모든 전장 인핸서에 모티프를 맵핑하였다. GBM 또는 신경 줄기 세포에서 기능이 알려진 예측된 표적 유전자와 동일한 예측 표적 유전자의 조절을 의미하는 게놈 내 클러스터링을 기반으로 70개의 영역이 초기 스크리닝을 위해 선택되었다. 이들은 Nanoglo DLR 검정에서 시험하였다. 이들은 '클러스터링된 SOX 이량체 모티프 인핸서'(CSE)로 호칭된다. 따라서 본원 발명자들은 SOX 이량체 모티프 빈도와 합리적인 디자인을 사용하여 양성 인핸서를 동정하는 성공률을 약 11배; 본래의 스크리닝(52/2610)의 ~2%에서 본원 발명의 합리적 선택(16/70)의 ~22.8%까지 증가시켰다. GSC7, GSC328, HEK293 및 huFb170(도 9)에서 유동 세포측정법으로 양성 히트를 추가로 검증하였다.

추가 활성 인핸서를 동정하기 위해 209개의 인핸서가 있는 추가 스크리닝을 수행하였다. 인핸서는 예측된 모티프(minCSE라고 호칭됨 - 표 1 참조)에 기반하여 160 bp로 감소되었다. 사람 단백질 아틀라스의 데이터를 기반으로 증식, 줄기 또는 뇌 풍부/뇌 특이적 또는 신경교종 풍부/신경교종 특정 예측 표적 유전자와 같은 경로를 커버하기 위해 다른 표적 유전자로부터의 160 bp 인핸서 단편을 혼합하여(https://www.proteinatlas.org/) 스크리닝을 위해 추가의 SSE를 생성하였다.

표 8: 게놈 배위, 예측된 표적 유전자 및 인핸서 단편에서 TSS까지의 거리로 검증된 CSE 히트

결론

전사 인자 결합 부위의 맵핑, 염색질 접근성 또는 인핸서 관련 히스톤 마크는 중요한 전사 인자(TF) 및 관련 인핸서를 검색하는 데 광범위하게 사용된다. 그러나 주요 한계는 TF가 다소 난잡하게 결합하고 기능성 인핸서가 단지 소수의 서브세트만을 나타낸다는 것이다. 본원 발명자들은 여기에서 기능성 인핸서 서열의 배열을 조합하면 합성 슈퍼 인핸서의 형성을 유도할 수 있음을 입증한다. 내인성 기능성 인핸서 서열의 천연 '문법'을 활용하지만 최적의 크기와 클러스터로 조합함으로써 본원 발명자들은 세포 유형 선택성을 희생하지 않고 전사 활성화의 상승작용적 증가로 SSE를 수득할 수 있었다. 따라서 본원 발명의 데이터는 개별 인핸서를 조합하여 선택성을 유지하면서도 전사를 유도하는 데 매우 강력한 합성 슈퍼-인핸서를 생성할 수 있음을 지지한다.

참조문헌

표 1 - 인핸서의 서열 (어댑터 없이)

표 2 - 완전한 SSE의 서열

SEQUENCE LISTING <110> The University Court of the University of Edinburgh <120> FUNCTIONAL NUCLEIC ACID MOLECULE AND METHOD <130> PE961716WO <160> 89 <170> PatentIn version 3.5 <210> 1 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic <220> <221> misc_feature <222> (7)..(7) <223> R represents A or G <220> <221> misc_feature <222> (9)..(9) <223> S represents C or G <220> <221> misc_feature <222> (10)..(10) <223> V represents A, C or G <220> <221> misc_feature <222> (11)..(11) <223> B represents C, G or T <220> <221> misc_feature <222> (12)..(12) <223> Y represents C or T <220> <221> misc_feature <222> (14)..(15) <223> K represents G or T <400> 1 acaaagrgsv bytkk 15 <210> 2 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic <220> <221> misc_feature <222> (1)..(4) <223> R represents A or G <220> <221> misc_feature <222> (6)..(6) <223> S represents C or G <220> <221> misc_feature <222> (8)..(8) <223> R represents A or G <220> <221> misc_feature <222> (11)..(13) <223> R represents A or G <220> <221> misc_feature <222> (14)..(15) <223> B represents C, G or T <220> <221> misc_feature <222> (16)..(16) <223> H represents A <220> <221> misc_feature <222> (17)..(18) <223> D represents A, G or T <220> <221> misc_feature <222> (19)..(19) <223> B represents C, G or T <220> <221> misc_feature <222> (20)..(20) <223> W represents A or T <220> <221> misc_feature <222> (21)..(21) <223> H represents A, C or T <400> 2 rrrrasarag rrrbbhddbw h 21 <210> 3 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic <220> <221> misc_feature <222> (1)..(1) <223> W represents A or T <220> <221> misc_feature <222> (2)..(2) <223> S represents C or G <220> <221> misc_feature <222> (4)..(4) <223> R represents A or G <220> <221> misc_feature <222> (7)..(7) <223> R represents A or G <220> <221> misc_feature <222> (8)..(8) <223> S represents C or G <220> <221> misc_feature <222> (9)..(9) <223> M represents A or C <220> <221> misc_feature <222> (10)..(10) <223> Y represents C or T <220> <221> misc_feature <222> (11)..(11) <223> M represents A or C <220> <221> misc_feature <222> (12)..(12) <223> H represents A, C or T <220> <221> misc_feature <222> (14)..(15) <223> B represents C, G or T <400> 3 wsaragrsmy mhtbb 15 <210> 4 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 4 gtgagtgtga ctcacatgct ggcatcagag cccctcttag agcttagaac actgggcctc 60 tgtcaggcaa agaaaaggag tccctatgaa tagccatctc cacaaatagc agttactgtc 120 acttcttaaa agacacaagc atggctggag accggcactg 160 <210> 5 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 5 tgcatgttct tgggaaaaag tggtatttaa tgaaggcgct ttgagctgaa tcaaagagcc 60 tcattcttct gaaagtcctt cttcctagtc tctgcatccg gctcctatca aaggaaatcc 120 acagctttgg cttttcgttg ctgttgtcat ggaaatcgtt 160 <210> 6 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 6 gaaattggat cctgaggaga atgtcaccac ctctttgaca ataactagct ttcagagctg 60 aacacagtga atctggatac tgtgtatatg tttaaatgag ttaggaaatg acatcacatt 120 atttatttct tcttttgtga cttagtaaat tgacttggcc 160 <210> 7 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 7 tacaatctat tctccatagt catcagagtt tctttaaagg cacggttcag acaatggcac 60 cctctgttcc aaaccctcca gggcttccta tttcacttag cataaaaacc aaagtcctca 120 caatgaccga caagtcttca cacaatgtgc cccttcattg 160 <210> 8 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 8 gagcaggcag tcatttggtt cccttctctg aatgcattgg ctctgatcca cggcgcctca 60 ggaagtgaaa gggagcaggc agtgaggcca agccatgaat gttgggccct tttcttagaa 120 aacaaagggt tcactttagg ctaggaggaa acatccgggg 160 <210> 9 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 9 gtcggcggaa ctgagtctcc tttgtggagc ccctcatttg catgataaac cccggggaca 60 aagtgtgttc ttgttacttg gactgtttct tggaaactgc tgctacctgg agcgagtgaa 120 cacagggcaa gtattctcgc ccacagcaac gtgtcattga 160 <210> 10 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 10 caacgttttt ggcagatgca gctctttctg aacagtaagt cattgttgag tgacatgaat 60 aggacgagag ctacagaaaa tgaaggtttc aaaagattgt ctaaaacaaa agtcctttca 120 gtcccgtatt cagagtt 137 <210> 11 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 11 ataaattccg attagccaag gaagctctga gtctaaatac cagcaaagct cagcccctgc 60 aagtggggac gaattatttg aaaggtcatc ctagagacac tgaacaaagg gcctctagca 120 gct 123 <210> 12 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 12 ccaatgccaa agcagtttac attttacaga tgccatggca accgtcagga agttaccctg 60 tatggtctaa gagggggagg aaccctcagt tccgggaatt gcccgcccct ttcccggaaa 120 ctcatgaata atccaccc 138 <210> 13 <211> 161 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 13 cgttccccct taacaaaagc cacctcctcc ctcctgaaag gcaccattgg tcaccaaaac 60 aagtcccctt tgtcctccac cgcagctgga gcctgggcct tccatctcct gggggccaat 120 aaaaccccag atcagccaat cctccctccc tggctctgtc a 161 <210> 14 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 14 cagcaaaggc tgcacgcaat gggggagggg gaaggaggga aggatatttc ctccttttta 60 gatcagtttc ttttctgagc acaagtgctt tctgtgtcat cctaacaatg taagagccca 120 ctaagtttag gacgcataat accggccttt gttctactcc 160 <210> 15 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 15 tccaaacact cccctgcaac agatgtacac acagagccca ttgttttctc tagaaatgta 60 aactgcacgt cacagttact ccatacacac cacaaacaga ctccctttgt tctcaggata 120 tgtgttgaca caagaatatg tcatcctctc agctccagac 160 <210> 16 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 16 tgaaagagat gggtgtgtgg gagtggggga agctgagctc caggcagaca gcacagagcc 60 gccttgtcca acccagccag gtgccatggc aaccaacaaa ggccccattg tcccgtgtct 120 gctgggcctt cctgaggctc tggggtcaga gtcccggtt 159 <210> 17 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 17 ttgtcctgcc tttgagaaca ctggaagggc actgaaggct gaccagcatg cacctcaccc 60 cacctcctct ctgtctcatc ctcagccatc taagcgggag actcatcagg cttaaattct 120 cattcttatc caagattctt ctgcttcaaa tgag 154 <210> 18 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 18 tctaaatgga gatcctccca taaagggagt tctgtttggg cttcccttgg aagtccattg 60 aaagcgtttc acatttcaat gcttctttac attctcctct agaatgaatc tggaagggcc 120 atttcattcc agccctatca gatttactac ttcctcctgt 160 <210> 19 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 19 aagaatgaac tgggcccagc tgggcatttg catcaaagtg cctcaccaga gttcccagct 60 gctctggcag agtgcccagg cttgccccag agcccaaaca gaatgctctt tgagatgcct 120 ctggttttca 130 <210> 20 <211> 156 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 20 tacccttcca ggggagcagt ttcctggctg tgtcgtcaga tactgtggtt tacgctgttc 60 cggagtctgg aggtctgtgt gcctttgatc tctttcccaa ctaatttgca cagctgctgt 120 ggaggccctc atgaatgacc tctttctttc ctttct 156 <210> 21 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 21 ttgtcctgcc tttgagaaca ctggaagggc actgaaggct gaccagcatg cacctcaccc 60 cacctcctct ctgtctcatc ctcagccatc taagcgggag actcatcagg cttaaattct 120 cattcttatc caagattctt ctgcttcaaa tgag 154 <210> 22 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 22 acaaactaaa cacagacatt ttctcaatta gtcattttca ggtttattgc ctaagatgct 60 aattgaaatt cagggcaggc aaaaatacat cattggcctt tgtatatctt tgaaaggcct 120 tctgatggga ccttgctccg tataaaggct tctcttctct 160 <210> 23 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 23 gaccttgcct ctttctggcc tgtggccttt ctcctccccc agctgctgtc tggccgcccc 60 acccccaagt ctctgccaca accaaagctc ctttgttgcc tccccctgcc ccgggcctct 120 ccacctgctg ctagctcaat cccctctttg tgtggttggt 160 <210> 24 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 24 cattctttgc agataggaaa cagtttgcta tctgagagac tggccaaaaa ccttactttc 60 aagtaaaata gggctctatt cataagctcc tacatgtaca caagttactc tttatactcc 120 tttcagacaa tgataagaat agaaactatt taattcagga 160 <210> 25 <211> 125 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 25 acagcagcca gaggaagtgg ctgtgtacag agagcttttg tgagagaaga gggggagggg 60 gaaagagcaa agaaaaagaa ggaaagaaga gagggaagag gccagagaca gagaaggcca 120 gagca 125 <210> 26 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 26 atcacaaagt ggttagcatg caggggagtg cgccggtccc ccgcctgtat ttgcatgaca 60 aaagcgcctg cccaacggct ctcggtggct ttgttgagag ctgcagcctc gctcaggctg 120 agccttggga attgttcccc gacattggtt gttcctgggc 160 <210> 27 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 27 gggcaacaaa ggatgccatg caaagcagct cagaacttga gttgtttcaa cagatgctgt 60 tttatgtttt gccaaagaat ggcccctttt atttctgtca tgaatgcagt ctttctttca 120 gtttctaaat gtttgccagt attaacccta atccttatct 160 <210> 28 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 28 acagaagccg ttgctgcagt aaccactgcc gcaagagcaa ctttggcagc aggcaggtgc 60 caggcagcaa gctgagagaa cactgacaga ttcaaagtgt cttcagatac aaggctttgt 120 ttgtgcacag tgaacaaagg gcatattggg aaggcctcc 159 <210> 29 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 29 cccagactgc catctccacg gcccccacac cagcacacag atgcctcatt cacgtggtgc 60 tcccagggcc tggcaccagt tctgaggctt aaaataggca cacaacgggc ctttgtcgga 120 tagaggaagg aaggaaggag cgtttcagac aaaggagaca 160 <210> 30 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 30 accctttgca gagaggaaag agaaaggagg tctcctgttg gggagatctg ctttagaggt 60 taggaagaat ggtggagttg taagacattg gaatcactgt ctaggaagga cagtggcctt 120 ttatccaggg ctatttaaaa acagacagag cttcatctat 160 <210> 31 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 31 ttcctgcatc tggccctctt tgagagcccc ttgtgtgcca atgacaaacc cttctttatt 60 taagctcctc tgaagtgcct tcctggtctt ggcagctgga cagggccctg aataagacag 120 cgagcctcaa tggcaggcta ccccagggct gggtgacgta 160 <210> 32 <211> 159 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 32 tgcctctctt ccattggcat tggagtggct ataggccttt ggaggacctg gcaaagggga 60 agttgattta ggggttcatt gaattgaggg gaagtatgta agtggtttgc agtcacttcc 120 ttgtgtggta ctcttgtata gtaatgattt cctggaata 159 <210> 33 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 33 atgttaaaca gtgaaatcat cagcaaaaag cacaaaactg cagaaaacat ggcactaaat 60 agaacacaaa aaggacactt gtttacagta tgagagcaga aacaaggaaa cagtgtttcc 120 ttgttcagcc acagctggga ccttgtgtgt 150 <210> 34 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 34 gcattcattt tacagctggg gtaagctttc tctgaaatgc agctggaata ggcatttcaa 60 aggcccacag tgttatgcaa atgcttctat tctccatgtg ggcgg 105 <210> 35 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 35 aaatggtgat tatcatcatt tgttcaggga cattagcatg aaggccgaat gttctggcac 60 aaagacacgt ctgtgggaca ggcac 85 <210> 36 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 36 aagaatgaac tgggcccagc tgggcatttg catcaaagtg cctcaccaga gttcccagct 60 gctctggcag agtgcccagg cttgccccag agcccaaaca gaatgctctt tgagatgcct 120 ctggttttca 130 <210> 37 <211> 890 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 37 atctcatata tgtgtatatg tatttatgat ttacatatat acagacgtat cacacactcc 60 gaatagaata cagatttcct tcaatgacag caacaactca atgacccgcc cactagcatg 120 gctaaaatac taaaccacta gatagcttta tgtgaacttg agcttgattg tttcttagct 180 ctgcttcaga acctcatgat catgtgcatg caatttctac agaagcggaa acgtagatgc 240 tgtgggtcag tgagcattcc tttccagggt gcttctgaga tgaagcccca cgattaacac 300 agggccctta atgatgggcg ggggactaag cattccaaga ttggcctgga ttcctgccag 360 aagggagaga aaggggtctt tgtatgtgga catctgaagg gcgggcataa acatgttagt 420 tgatacttaa cacccaaaac cagtgccaaa accgttagct cccctcaata gcctactctg 480 gtttcaactg tccgcgacaa tggagcagcc acctcaatat acaaaacttg ctctttaaac 540 atcctcagag gaattcccaa aatagcagct gttagaagca aacagactct aattcattga 600 catatgcaga ccttttaatg tttttctggt gacgtttaca tttttttttg tacctacgcc 660 atctatgcat ttttaataat taccttgtag attacgtatg caatccctcc aggcacttga 720 agaaggagcc ccgggattca tcatcagatg aaattgttag tttttacggc aagaggccca 780 gctaatttat gcggggaatt tttcagacgt ttttcctctg ggctcccttc cctgctgtcc 840 tcgcgccttt cttcctcagt acattaagag attctgatgt gcctgcagca 890 <210> 38 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 38 agataaagcc agaaataaaa gggaaagaaa cagttatatg attttggtgg gaatttgcag 60 aaatacaggc tgaagctgaa gtcttccatc aggtgaggtt ttttccattg atctcatctc 120 tcgggctcag ctcttttatc tccagcgcat tttggatgtg gcttctcttt ccacctgctg 180 ggcctttaga tagagtactt ccttttgttt caaggtagca tttaactgag tctggaaaaa 240 ccatcattaa gggaaaataa agctgaaaga tgaattgaaa actatgtaaa agggcccttt 300 caggctgccg gagagattgc ctttccagcc taatgagcct gtgctgcctc tgattcagat 360 ggtgcaagga caggagaaaa gaatggagtt ttgtgcactg cgattttcca aagcacataa 420 tgcttagtca tttggggtgt taggaaagag agaaagtcgg agcggagtgt gtggtgaagt 480 gagagaaaga aagaaggctg aattttcgtt aagctgctca aatgcctgct ttaacaaaag 540 tctgccaggg ctagaggtga ttagccatca gtgctgctgc tgtttttgct gtcg 594 <210> 39 <211> 524 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 39 ctctttgggt ctaggtatca ttttgggatc acatcatgat aactctatgt gtgtgtgctg 60 ggagggcaaa gttgcaaagc aattactcag caatgctgaa gaaagaagca attactggaa 120 cacattttag ccccgcttgt cagagtgact ttcactgggg cacaagggaa gcattcactt 180 aggcagtatc cctttcagag gcttaattta gttttttctt ccctttaatt gtgtgattcc 240 agtattttag ctacaatccc taggctgtag gaacctttaa acacttcttt ttataaaaga 300 aatgcatggg cttttgaaga ataaacaggg ggctgcataa tttataggaa aatggcacca 360 tggacttttc cttcacaaag aacattgggg ttacattgga acaagccaaa tatgttttta 420 atgaatagtc agtaatcagc agcagctaca gtaagtgctt gaaatttttc ttttatgtgc 480 tatgagtcca caaactaagc atctgattct gattgcagcc atga 524 <210> 40 <211> 391 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 40 gtagagaata gattctgtag ggcttttaac ctccactgtt attccaagga tggggctcag 60 cttccttctt ttcctttctg actctgtcta tatcaagggt cccgtgggtt gttcctttcc 120 attgtggtct cactgcccag ctttaaggca ccatcctggc acagtgatag gtttaccttt 180 gtctaaaagt gtccatttgc atctctgtgg ccttcttgcc tgggtgacac ccacttgatt 240 aggcatttgc ccagtgtgag atcagagtcc ctcatttaca tttccccaca atagtgaatg 300 gcttacaggc tgttcaaata cagtttctaa acagtgaata attcagccag aaagccagcc 360 ttttaaggtt tggatttggg gcatttctga g 391 <210> 41 <211> 276 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 41 tcccttggaa agtgttcaaa tcaaagctac ctttatacca cactcctttg tgtcctgatg 60 tcctgaatag tgagattatc gggtacaccc acctgttcct gcacttcctt cctgctcaat 120 ttaaataaac aatgagctgt ttttcttctt gacaaagagc cagtctatac aacagcagca 180 ggaagattac tttctatctg tatgcaaaca gatacatagc tgagttctct ccaatccccg 240 ggaaaagacc cttttaacta aatgacttat gcttct 276 <210> 42 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 42 gccataattt gaacctcgga gtgccccact gacagccaac gacaccagag ggtccctttg 60 tatgtaagga ttgcatgact ccagttgaat gacccaagcc ggggacaaac aggaaagaac 120 ccagcagctc tggaggccac ttgagctgac tgtcaaatgc tctgggctga ttaacgacta 180 cgaacttcag ggaagacaag tgtgctttga tgccacagag ctatcctggg cctgtacagg 240 cccgtttctg ctctgaatga ggaagctgta ctttgcaggc acccggcaga acaagaatag 300 ggcctaagat acctgaatga agggcacaga ggaagtacaa aatacagtca ttgttggagc 360 tagaagctgg tgccaggcta cgagggggcc cagtggccaa gcattatg 408 <210> 43 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 43 tgtcgggcag ccaagacctg tcagggacaa gagtgctgtg agctgcgggc tggtgggtgg 60 aaggagagag gcccctggtg ctcctgccaa gccaaggaat gtgtcattgc tgtgctgtgc 120 cttcagcctg gcatttggga acaaagaggt actttgtatg gataacatag accaggttgt 180 tggggaaggg atcagagatg ggggtagacc catttttaaa aatctgctca tgtcccaggc 240 aagttttttt ggcagggatt gcagttgggc tattacaaag agctgctgta cacgaggggt 300 atgtctacta ctgtcaaatt acagcagcaa ttatcttggg cactg 345 <210> 44 <211> 677 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 44 ctcgataccc acattcctaa ccttttaatg ccaagcagcc tataagcatg tcaaatttta 60 ctcatgttcc tgctctttcc actcaagttg gctttgtggg ttgctggttt tatcaaaatt 120 gagtgagagt gtgttcaata caatgttgga ttcattaggg agaaaaaagc caaataaaaa 180 ccttgcttct tcaatgccag gagcttacaa agacatataa accatgagga attccaagga 240 cttgctcaga agccgttctg caaatgcatt tcttgaacaa agggccaatg ttcctttcag 300 ggaagagcgc gggactggtt tccggcattt ttctttaaat cattaggacc atgccagcaa 360 acaaacatat acagcccctg ggagaaagaa tctcattcaa cacagcttac aagagtttga 420 ttattaggga ggggtgcttc atggcacgtg cctcaccagc cggcccccaa atgtacagat 480 ctgtttaaag ggctttattg atggtggccg cagacagata gagcttgtga ggagaactga 540 catcccatgg atactaacat atcagcatca tcctgaccag cacacaatcc agtcagagag 600 agctgaaaag tctgcctcat tcccttgaaa atgtgcttct taagacaaat aaaatataga 660 aataagaaat tcacctc 677 <210> 45 <211> 663 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 45 atggacaatg gcagcctgaa agaatatgag ggagggtcac cagtgatgga catggtttgg 60 ggagagccca agaattgaag gggacttggg attgttgaca gaccttccac atctcagaat 120 gggggaagtg gtttcttttt tcctcattct ccaaggcttc tcagtctcag agaccccaag 180 agatgccatt aatacagatt cctcctctgg ctcctttgag acatttgctt ttgaaggacc 240 tggaagagaa agctctttgt atgtggccag aataaactca ttgtacaccc aaacaattaa 300 ctcctcaatg gacttgccag ccccttgaaa ggcctggccc tgcgtccctg gacctcttgg 360 gctctattca gtcccttaag cacaccaatg tttttgggtt tttgttttgt tttgtttgtt 420 attctgaaaa gtctttccct gagaatagtc tgagcggatc aacattgtcc tcagcctggc 480 atttatctct cctcgccagc gaatgtcaat caggaatcaa aaagccaaac agaggaggct 540 ttgaacggtg tcatcggggg tcgaagtgac ttccagctgt ctgtgcgtgg gccaggcctt 600 ctcgcagggc aaggaattgt gctgtcacac aaacccactg tctgtatagg ctcacagagc 660 cca 663 <210> 46 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 46 ctggggaaca aaacttagat cttgatcatc cagcatagct ctggcatgct gagcgtgtga 60 tacacctgtc tctaccgtca ggcaaacgag tgggttcaca ggcagaggcc tgccctgcca 120 aacaatgctc ccctttgtcc ccgcccaggg ctcaggagcc gcaaggaagc caaatccatc 180 agcacttgtc agggcccttg atgcacacaa tgcaagttat gatccacagt ccccggcaaa 240 gccccaggct tccagcaggc agcattaact gacacgcaat gtgtcagtca gccttctaaa 300 agccaggggt ggggatccgt gccagggggc cactgagctc tcattcccag aagccaacca 360 gagcc 365 <210> 47 <211> 673 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 47 gccttttagc tgattaacaa atacagtgaa tttaactttg tagattctta acatttaaag 60 acaacagtct aaggcaattt aaagtatatt ctgccaatca gttgttgagt tagaccaccc 120 atagcctttt tttattcttc attgtttgaa taatatggga ggaaatttag tgtatactct 180 cttcttcctg tattttccag ttagattaag ctgttgtctt cacaattgcc tcccagctgc 240 tgtgacttgt gaaaacaaca gaccctgctc tgttgtctgg agaaagccgg gattgttatg 300 agtaacttta ttgcaggcac atgagtgtgt taagacttta aaacacgctc aaatgtcatg 360 tgcacaccca atgacgggca agaataatta tgaaaaaaca agaaatctat gtctatgaaa 420 ccgtgttgga caaaatgggc cattcattgt gttcccctgg gaatgcctgg actctgcagt 480 cagaaaacaa aaaaggcact tttttcctgc cgtaggctga atgcttagct ttgccatctg 540 agccctaaga aaacatgggc ccctctactg ctggcgcacc cacgcacact aaaaaatatt 600 aatgcctctc tctccttact tttttccagg cattccctcg tgtaggctgt agccaatata 660 atgtcaacac aaa 673 <210> 48 <211> 306 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 48 gaacagcact taaatattaa tagcatcact gggaaaacac gacagctatt tccctgtttt 60 ctgcagctca atgaagagtt gttcagtgca gaccccagtg ctcttgcctc atgaatggac 120 gtgattgtgg ggacatcatc tcctactaag gcaaaacgtg acactgagaa caaaggctgg 180 tttttagcct gatgtgatga gctcacccca gtgcccatgt ggggactttg aagctcgtcc 240 aggtgccagt tttctgtgta tatgacattc ttggttgggg agggtgtgga ctgggcagca 300 ggcttt 306 <210> 49 <211> 379 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 49 ataagccctt taaattaaat ctttatgcag attctatttt atactccaaa cttttcatgg 60 agccttgtgt aattctgatg tgtaaaccaa caaacagaga ggctctgtgt atggagtagc 120 tggtttggat accagctggc ttggctgtgc gcctttctaa tggtaatgaa gtcacacagc 180 tgctaggaca atcagctgga gttcagattg tcactagcta aatggatatc cattgactag 240 cttcttatcc ggactcatta aagtttagta ttgacaaata gtggctggag gtttacaact 300 aagaggcatg tagaaatgaa cttgttgact attttttccc tatagctttt gctttgtgat 360 tcacagaatg tcattcatc 379 <210> 50 <211> 398 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 50 gccaacaact catatagtgg aggcttgagc acaccatgct tattcccaga gttccaatgc 60 tctgcttttg aaccattacc atgcctttca gcagcactgt caacagagct cagagaaggt 120 cttgaactcc agagaatgaa tgagatatgc caaatgaagc ataattactt tattgacgtc 180 attcagcttt caactcacat ttaatgagaa agcttctact gcttgaaaca gtgggccatt 240 tgtagcacat tatgcaaatg ataagactaa tcttttgcat tatacataag agctgcttat 300 tgtgcattaa ctaatttatc tgactaggaa ggggctatga atgctgattt ttattaagct 360 cttcattaag tgaaaatgta ggcatggcaa gtgcatat 398 <210> 51 <211> 490 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 51 atacatttta gcaccaaaca caatttaata acagggcaca gaggccgcaa agcctcctga 60 ttctgttcca ttactaattt atcaggggct gaaagcaacc aaacttagga tcccaggcag 120 acaatggagc ctttgagggg caagggaagc atcatttaaa aggaaagcat taccattcta 180 aaataatggc aaagcacatg aactgagtgc tctgaaagag agcactacaa aaaaggtatt 240 ctcagcttaa atgccccaaa cacaaaagct tttagttggg acttagacgg gaaaaagaaa 300 atagctccca ataaattggt tttaccagta tccttttgtg tgtgctggtg ccaagggggc 360 gagggtacag gcaaagcgtg attttccaaa acctagctga attatgtttc ttctttagaa 420 caaaacccaa cattttgcta atgaggataa agacagtaaa actgatattc ctgtgctatt 480 actaacttgg 490 <210> 52 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 52 cagaggagag aggaggtcat ttgggaccat ttactcatgc gagagtcact gccccatgct 60 aagatttccc ctaaaaataa aatgataaga taataactca taatgctctc cccaaatcag 120 taccacacag acccccctct tctgtttgct cagacccccg ctctccagca caaagtcttt 180 attggtctcc ctgcaggggt gaaaataaag ggggttttgt tcttctcctc cccctccccc 240 ctcgaagggc tgagtgagtt tatctgacac tgcagcagtc tttgtaaact gagtgtccca 300 ggataaacgc tcccttaaga gtcgcttggc ctgggacaga gggaccctct ccagaggaga 360 atggggagct tgttccaatg gtcttttaat atggggggcg gggtgtcacc aaggacaggc 420 ctccagcaca ctctcacaga agggtctctg tcctgaggct acagtggagg gaattcttaa 480 agacacagat gctgaaaagg gggaaggaat ttttttttcc cctaagggga ggggagggag 540 gttagggcgg gaaggagaag ggggagtggc gaggactcct cattccccag aacaattcca 600 gttacaacaa ggcgtctcta t 621 <210> 53 <211> 534 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 53 aggaagaagc atgctgggtc atttttgcct tgtttctagc tgcatgaatt gaaaagccag 60 gcccaggttc aatgcatcat tcttgaagca gtgaacaaaa tccctctttg ttccccagtg 120 aaacttatct ctgaagagct gcactacttc ctgtgagata tagccctgca gatgtgtcgt 180 gggagacccg cccggctgca ctgccttcca taaaagtgca agaatgggca ctttgtactg 240 ctggactgaa aatgacactc actcttctga tccccactgg ggttaccaag tgggcaaaac 300 ttcctgctta gaggaggggt catagacagc agggggagtg tgtgattttg ttttgttcct 360 ttgtgaattt gtttagctat ttatagagct aaaggagaaa gcaaacgggc acaatgtagc 420 acagtgtttt tcaaagtgta ttccatggaa ccctttcgtg ggttgcagac cccaggggtg 480 gaggcagagg atggggtggt gacagcagca ggtgctgtcc agggccttct gtct 534 <210> 54 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 54 ggacaggcct ccagcacact ctcacagaag ggtctctgtc ctgaggctac agtggaggga 60 attcttaaag acacagatgc tgaaaagggg gaaggaattt ttttttcccc taaggggagg 120 ggagggaggt tagggcggga aggagaaggg ggagtggcga 160 <210> 55 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 55 ggcaaacgag tgggttcaca ggcagaggcc tgccctgcca aacaatgctc ccctttgtcc 60 ccgcccaggg ctcaggagcc gcaaggaagc caaatccatc agcacttgtc agggcccttg 120 atgcacacaa tgcaagttat gatccacagt ccccggcaaa 160 <210> 56 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 56 gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60 gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120 tacctgaatg aagggcacag aggaagtaca aaatacagtc 160 <210> 57 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 57 aatggacgtg attgtgggga catcatctcc tactaaggca aaacgtgaca ctgagaacaa 60 aggctggttt ttagcctgat gtgatgagct caccccagtg cccatgtggg gactttgaag 120 ctcgtccagg tgccagtttt ctgtgtatat gacattcttg 160 <210> 58 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 58 caaacacaat ttaataacag ggcacagagg ccgcaaagcc tcctgattct gttccattac 60 taatttatca ggggctgaaa gcaaccaaac ttaggatccc aggcagacaa tggagccttt 120 gaggggcaag ggaagcatca tttaaaagga aagcattacc 160 <210> 59 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 59 ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc 60 tctgtgtatg gagtagctgg tttggatacc agctggcttg gctgtgcgcc tttctaatgg 120 taatgaagtc acacagctgc taggacaatc agctggagtt 160 <210> 60 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 60 ggtcagtgag cattcctttc cagggtgctt ctgagatgaa gccccacgat taacacaggg 60 cccttaatga tgggcggggg actaagcatt ccaagattgg cctggattcc tgccagaagg 120 gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 160 <210> 61 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 61 gatgtggctt ctctttccac ctgctgggcc tttagataga gtacttcctt ttgtttcaag 60 gtagcattta actgagtctg gaaaaaccat cattaaggga aaataaagct gaaagatgaa 120 ttgaaaacta tgtaaaaggg ccctttcagg ctgccggaga 160 <210> 62 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 62 caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 60 tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 120 ggcttaattt agttttttct tccctttaat tgtgtgattc 160 <210> 63 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 63 ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 60 gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 120 aaaaccccac ataatacttc cctttgtctc caaaaaaatt 160 <210> 64 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 64 gtgagtgtga ctcacatgct ggcatcagag cccctcttag agcttagaac actgggcctc 60 tgtcaggcaa agaaaaggag tccctatgaa tagccatctc cacaaatagc agttactgtc 120 acttcttaaa agacacaagc atggctggag accggcactg tgcatgttct tgggaaaaag 180 tggtatttaa tgaaggcgct ttgagctgaa tcaaagagcc tcattcttct gaaagtcctt 240 cttcctagtc tctgcatccg gctcctatca aaggaaatcc acagctttgg cttttcgttg 300 ctgttgtcat ggaaatcgtt gaaattggat cctgaggaga atgtcaccac ctctttgaca 360 ataactagct ttcagagctg aacacagtga atctggatac tgtgtatatg tttaaatgag 420 ttaggaaatg acatcacatt atttatttct tcttttgtga cttagtaaat tgacttggcc 480 tacaatctat tctccatagt catcagagtt tctttaaagg cacggttcag acaatggcac 540 cctctgttcc aaaccctcca gggcttccta tttcacttag cataaaaacc aaagtcctca 600 caatgaccga caagtcttca cacaatgtgc cccttcattg 640 <210> 65 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 65 gaaattggat cctgaggaga atgtcaccac ctctttgaca ataactagct ttcagagctg 60 aacacagtga atctggatac tgtgtatatg tttaaatgag ttaggaaatg acatcacatt 120 atttatttct tcttttgtga cttagtaaat tgacttggcc tacaatctat tctccatagt 180 catcagagtt tctttaaagg cacggttcag acaatggcac cctctgttcc aaaccctcca 240 gggcttccta tttcacttag cataaaaacc aaagtcctca caatgaccga caagtcttca 300 cacaatgtgc cccttcattg gagcaggcag tcatttggtt cccttctctg aatgcattgg 360 ctctgatcca cggcgcctca ggaagtgaaa gggagcaggc agtgaggcca agccatgaat 420 gttgggccct tttcttagaa aacaaagggt tcactttagg ctaggaggaa acatccgggg 480 gtcggcggaa ctgagtctcc tttgtggagc ccctcatttg catgataaac cccggggaca 540 aagtgtgttc ttgttacttg gactgtttct tggaaactgc tgctacctgg agcgagtgaa 600 cacagggcaa gtattctcgc ccacagcaac gtgtcattga 640 <210> 66 <211> 580 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 66 gagcaggcag tcatttggtt cccttctctg aatgcattgg ctctgatcca cggcgcctca 60 ggaagtgaaa gggagcaggc agtgaggcca agccatgaat gttgggccct tttcttagaa 120 aacaaagggt tcactttagg ctaggaggaa acatccgggg gtcggcggaa ctgagtctcc 180 tttgtggagc ccctcatttg catgataaac cccggggaca aagtgtgttc ttgttacttg 240 gactgtttct tggaaactgc tgctacctgg agcgagtgaa cacagggcaa gtattctcgc 300 ccacagcaac gtgtcattga caacgttttt ggcagatgca gctctttctg aacagtaagt 360 cattgttgag tgacatgaat aggacgagag ctacagaaaa tgaaggtttc aaaagattgt 420 ctaaaacaaa agtcctttca gtcccgtatt cagagttata aattccgatt agccaaggaa 480 gctctgagtc taaataccag caaagctcag cccctgcaag tggggacgaa ttatttgaaa 540 ggtcatccta gagacactga acaaagggcc tctagcagct 580 <210> 67 <211> 559 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 67 caacgttttt ggcagatgca gctctttctg aacagtaagt cattgttgag tgacatgaat 60 aggacgagag ctacagaaaa tgaaggtttc aaaagattgt ctaaaacaaa agtcctttca 120 gtcccgtatt cagagttata aattccgatt agccaaggaa gctctgagtc taaataccag 180 caaagctcag cccctgcaag tggggacgaa ttatttgaaa ggtcatccta gagacactga 240 acaaagggcc tctagcagct ccaatgccaa agcagtttac attttacaga tgccatggca 300 accgtcagga agttaccctg tatggtctaa gagggggagg aaccctcagt tccgggaatt 360 gcccgcccct ttcccggaaa ctcatgaata atccaccccg ttccccctta acaaaagcca 420 cctcctccct cctgaaaggc accattggtc accaaaacaa gtcccctttg tcctccaccg 480 cagctggagc ctgggccttc catctcctgg gggccaataa aaccccagat cagccaatcc 540 tccctccctg gctctgtca 559 <210> 68 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 68 ccaatgccaa agcagtttac attttacaga tgccatggca accgtcagga agttaccctg 60 tatggtctaa gagggggagg aaccctcagt tccgggaatt gcccgcccct ttcccggaaa 120 ctcatgaata atccaccccg ttccccctta acaaaagcca cctcctccct cctgaaaggc 180 accattggtc accaaaacaa gtcccctttg tcctccaccg cagctggagc ctgggccttc 240 catctcctgg gggccaataa aaccccagat cagccaatcc tccctccctg gctctgtcat 300 ccaaacactc ccctgcaaca gatgtacaca cagagcccat tgttttctct agaaatgtaa 360 actgcacgtc acagttactc catacacacc acaaacagac tccctttgtt ctcaggatat 420 gtgttgacac aagaatatgt catcctctca gctccagact gaaagagatg ggtgtgtggg 480 agtgggggaa gctgagctcc aggcagacag cacagagccg ccttgtccaa cccagccagg 540 tgccatggca accaacaaag gccccattgt cccgtgtctg ctgggccttc ctgaggctct 600 ggggtcagag tcccggtt 618 <210> 69 <211> 633 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 69 tccaaacact cccctgcaac agatgtacac acagagccca ttgttttctc tagaaatgta 60 aactgcacgt cacagttact ccatacacac cacaaacaga ctccctttgt tctcaggata 120 tgtgttgaca caagaatatg tcatcctctc agctccagac tgaaagagat gggtgtgtgg 180 gagtggggga agctgagctc caggcagaca gcacagagcc gccttgtcca acccagccag 240 gtgccatggc aaccaacaaa ggccccattg tcccgtgtct gctgggcctt cctgaggctc 300 tggggtcaga gtcccggttt tgtcctgcct ttgagaacac tggaagggca ctgaaggctg 360 accagcatgc acctcacccc acctcctctc tgtctcatcc tcagccatct aagcgggaga 420 ctcatcaggc ttaaattctc attcttatcc aagattcttc tgcttcaaat gagtctaaat 480 ggagatcctc ccataaaggg agttctgttt gggcttccct tggaagtcca ttgaaagcgt 540 ttcacatttc aatgcttctt tacattctcc tctagaatga atctggaagg gccatttcat 600 tccagcccta tcagatttac tacttcctcc tgt 633 <210> 70 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 70 ttgtcctgcc tttgagaaca ctggaagggc actgaaggct gaccagcatg cacctcaccc 60 cacctcctct ctgtctcatc ctcagccatc taagcgggag actcatcagg cttaaattct 120 cattcttatc caagattctt ctgcttcaaa tgagtctaaa tggagatcct cccataaagg 180 gagttctgtt tgggcttccc ttggaagtcc attgaaagcg tttcacattt caatgcttct 240 ttacattctc ctctagaatg aatctggaag ggccatttca ttccagccct atcagattta 300 ctacttcctc ctgtaagaat gaactgggcc cagctgggca tttgcatcaa agtgcctcac 360 cagagttccc agctgctctg gcagagtgcc caggcttgcc ccagagccca aacagaatgc 420 tctttgagat gcctctggtt ttcataccct tccaggggag cagtttcctg gctgtgtcgt 480 cagatactgt ggtttacgct gttccggagt ctggaggtct gtgtgccttt gatctctttc 540 ccaactaatt tgcacagctg ctgtggaggc cctcatgaat gacctctttc tttcctttct 600 <210> 71 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 71 gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60 gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120 tacctgaatg aagggcacag aggaagtaca aaatacagtc aatggacgtg attgtgggga 180 catcatctcc tactaaggca aaacgtgaca ctgagaacaa aggctggttt ttagcctgat 240 gtgatgagct caccccagtg cccatgtggg gactttgaag ctcgtccagg tgccagtttt 300 ctgtgtatat gacattcttg ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt 360 aaaccaacaa acagagaggc tctgtgtatg gagtagctgg tttggatacc agctggcttg 420 gctgtgcgcc tttctaatgg taatgaagtc acacagctgc taggacaatc agctggagtt 480 caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540 tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600 ggcttaattt agttttttct tccctttaat tgtgtgattc 640 <210> 72 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 72 gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60 gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120 tacctgaatg aagggcacag aggaagtaca aaatacagtc caaacacaat ttaataacag 180 ggcacagagg ccgcaaagcc tcctgattct gttccattac taatttatca ggggctgaaa 240 gcaaccaaac ttaggatccc aggcagacaa tggagccttt gaggggcaag ggaagcatca 300 tttaaaagga aagcattacc ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt 360 aaaccaacaa acagagaggc tctgtgtatg gagtagctgg tttggatacc agctggcttg 420 gctgtgcgcc tttctaatgg taatgaagtc acacagctgc taggacaatc agctggagtt 480 caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540 tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600 ggcttaattt agttttttct tccctttaat tgtgtgattc 640 <210> 73 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 73 aatggacgtg attgtgggga catcatctcc tactaaggca aaacgtgaca ctgagaacaa 60 aggctggttt ttagcctgat gtgatgagct caccccagtg cccatgtggg gactttgaag 120 ctcgtccagg tgccagtttt ctgtgtatat gacattcttg caaacacaat ttaataacag 180 ggcacagagg ccgcaaagcc tcctgattct gttccattac taatttatca ggggctgaaa 240 gcaaccaaac ttaggatccc aggcagacaa tggagccttt gaggggcaag ggaagcatca 300 tttaaaagga aagcattacc ggtcagtgag cattcctttc cagggtgctt ctgagatgaa 360 gccccacgat taacacaggg cccttaatga tgggcggggg actaagcatt ccaagattgg 420 cctggattcc tgccagaagg gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 480 caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540 tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600 ggcttaattt agttttttct tccctttaat tgtgtgattc 640 <210> 74 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 74 ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc 60 tctgtgtatg gagtagctgg tttggatacc agctggcttg gctgtgcgcc tttctaatgg 120 taatgaagtc acacagctgc taggacaatc agctggagtt ggtcagtgag cattcctttc 180 cagggtgctt ctgagatgaa gccccacgat taacacaggg cccttaatga tgggcggggg 240 actaagcatt ccaagattgg cctggattcc tgccagaagg gagagaaagg ggtctttgta 300 tgtggacatc tgaagggcgg caattactca gcaatgctga agaaagaagc aattactgga 360 acacatttta gccccgcttg tcagagtgac tttcactggg gcacaaggga agcattcact 420 taggcagtat ccctttcaga ggcttaattt agttttttct tccctttaat tgtgtgattc 480 ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540 gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600 aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640 <210> 75 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 75 gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60 gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120 tacctgaatg aagggcacag aggaagtaca aaatacagtc ctccaaactt ttcatggagc 180 cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc tctgtgtatg gagtagctgg 240 tttggatacc agctggcttg gctgtgcgcc tttctaatgg taatgaagtc acacagctgc 300 taggacaatc agctggagtt ggtcagtgag cattcctttc cagggtgctt ctgagatgaa 360 gccccacgat taacacaggg cccttaatga tgggcggggg actaagcatt ccaagattgg 420 cctggattcc tgccagaagg gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 480 caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540 tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600 ggcttaattt agttttttct tccctttaat tgtgtgattc 640 <210> 76 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 76 caaacacaat ttaataacag ggcacagagg ccgcaaagcc tcctgattct gttccattac 60 taatttatca ggggctgaaa gcaaccaaac ttaggatccc aggcagacaa tggagccttt 120 gaggggcaag ggaagcatca tttaaaagga aagcattacc ctccaaactt ttcatggagc 180 cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc tctgtgtatg gagtagctgg 240 tttggatacc agctggcttg gctgtgcgcc tttctaatgg taatgaagtc acacagctgc 300 taggacaatc agctggagtt ggtcagtgag cattcctttc cagggtgctt ctgagatgaa 360 gccccacgat taacacaggg cccttaatga tgggcggggg actaagcatt ccaagattgg 420 cctggattcc tgccagaagg gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 480 ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540 gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600 aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640 <210> 77 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 77 gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60 gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120 tacctgaatg aagggcacag aggaagtaca aaatacagtc aatggacgtg attgtgggga 180 catcatctcc tactaaggca aaacgtgaca ctgagaacaa aggctggttt ttagcctgat 240 gtgatgagct caccccagtg cccatgtggg gactttgaag ctcgtccagg tgccagtttt 300 ctgtgtatat gacattcttg caattactca gcaatgctga agaaagaagc aattactgga 360 acacatttta gccccgcttg tcagagtgac tttcactggg gcacaaggga agcattcact 420 taggcagtat ccctttcaga ggcttaattt agttttttct tccctttaat tgtgtgattc 480 ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540 gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600 aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640 <210> 78 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 78 gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60 gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120 tacctgaatg aagggcacag aggaagtaca aaatacagtc aatggacgtg attgtgggga 180 catcatctcc tactaaggca aaacgtgaca ctgagaacaa aggctggttt ttagcctgat 240 gtgatgagct caccccagtg cccatgtggg gactttgaag ctcgtccagg tgccagtttt 300 ctgtgtatat gacattcttg ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt 360 aaaccaacaa acagagaggc tctgtgtatg gagtagctgg tttggatacc agctggcttg 420 gctgtgcgcc tttctaatgg taatgaagtc acacagctgc taggacaatc agctggagtt 480 ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540 gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600 aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640 <210> 79 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 79 ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc 60 tctgtgtatg gagtagctgg tttggatacc agctggcttg gctgtgcgcc tttctaatgg 120 taatgaagtc acacagctgc taggacaatc agctggagtt ggtcagtgag cattcctttc 180 cagggtgctt ctgagatgaa gccccacgat taacacaggg cccttaatga tgggcggggg 240 actaagcatt ccaagattgg cctggattcc tgccagaagg gagagaaagg ggtctttgta 300 tgtggacatc tgaagggcgg gatgtggctt ctctttccac ctgctgggcc tttagataga 360 gtacttcctt ttgtttcaag gtagcattta actgagtctg gaaaaaccat cattaaggga 420 aaataaagct gaaagatgaa ttgaaaacta tgtaaaaggg ccctttcagg ctgccggaga 480 caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540 tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600 ggcttaattt agttttttct tccctttaat tgtgtgattc 640 <210> 80 <211> 640 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 80 caaacacaat ttaataacag ggcacagagg ccgcaaagcc tcctgattct gttccattac 60 taatttatca ggggctgaaa gcaaccaaac ttagggcaga caatggagcc tttgaggggc 120 aagggaagca tcatttaaaa ggaaagcatt accggtcagt gagcattcct ttccagggtg 180 cttctgagat gaagccccac gattaacaca gggcccttaa tgatgggcgg gggactaagc 240 attccaagat tggcctggat tcctgccaga agggagagaa aggggtcttt gtatgtggac 300 atctgaaggg cggcaattac tcagcaatgc tgaagaaaga agcaattact ggaacacatt 360 ttagccccgc ttgtcagagt gactttcact ggggcacaag ggaagcattc acttaggcag 420 tatccctttc agaggcttaa tttagttttt tcttcccttt aattgtgtga ttcttctttt 480 caaggatgcc caaagcgtgt gactcttaca gagagccaat ggggaaaggc agtgtcggga 540 ctaagcaatg aatggctctt caatggccag ctgcccgccc aataggataa aagaaaaccc 600 cacataatac ttccctttgt ctccaaaaaa attatcccag 640 <210> 81 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 81 tgatccgtct cgccctacta ggttactggt gcatgc 36 <210> 82 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 82 actaacgtct cggagcaccc aaactattgg agcgag 36 <210> 83 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 83 tcaaagagcc tcatt 15 <210> 84 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 84 tcaaagagcc att 13 <210> 85 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 85 tcaaagagat cctcatt 17 <210> 86 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 86 ttactccgag aaact 15 <210> 87 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 87 tctaagagcc tcaat 15 <210> 88 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 88 aacaatatgc agtgtt 16 <210> 89 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 89 ggcgatatcg tacgc 15

Claims

하나 이상의 전사 인자에 의해 활성화되는 슈퍼-인핸서로서, 여기서 상기 슈퍼-인핸서가 상이한 게놈 유전자좌로부터 유래된 2개 이상의 인핸서 서열을 포함하고, 여기서 각각의 인핸서 서열이 전사 인자에 대한 결합 부위를 포함하는, 슈퍼-인핸서.
제1항에 있어서, 상기 슈퍼-인핸서 내의 2개 이상의 인핸서 서열 각각이 300개 미만의 뉴클레오타이드 길이, 특히 약 160개 뉴클레오타이드 길이이고, 상기 슈퍼인핸서의 길이가 1200개 미만의 뉴클레오타이드 길이이고, 특히 700개 미만의 뉴클레오타이드 길이인, 슈퍼-인핸서.
제1항 또는 제2항에 있어서, 상기 슈퍼-인핸서가 4개의 인핸서 서열을 포함하는, 슈퍼-인핸서.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 슈퍼-인핸서가 적어도 하나의 SOX 이량체 모티프 및/또는 적어도 하나의 SOX 모티프를 포함하는, 슈퍼-인핸서.
제4항에 있어서, 상기 SOX 이량체 모티프가 서열번호 1을 포함하는, 슈퍼-인핸서.
제4항에 있어서, 상기 SOX 모티프가 서열번호 3을 포함하는, 슈퍼-인핸서.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 슈퍼-인핸서가 표 1에 제공된 하나 이상의 인핸서 서열을 포함하는, 슈퍼-인핸서.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 슈퍼-인핸서가 서열번호 64-80으로 이루어진 그룹으로부터 선택된 서열과 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 슈퍼-인핸서.
제1항 내지 제8항 중 어느 한 항에 있어서, 각각의 인핸서 서열이 이의 게놈 유전자좌에 존재하는 전사 인자에 대한 결합 부위의 업스트림 및/또는 다운스트림에 20 내지 400개 뉴클레오타이드를 추가로 포함하는, 슈퍼-인핸서.
전이유전자에 작동가능하게 연결된 제1항 내지 제9항 중 어느 한 항에 따른 슈퍼-인핸서를 포함하는 기능성 핵산 분자.
제10항에 있어서, 상기 전이유전자가 세포에서 발현을 위한 유전자, 치료학적 페이로드 또는 재프로그래밍 인자를 암호화하는, 기능성 핵산 분자.
표적 비정상 세포에서 발현되는 하나 이상의 전사 인자에 의해 활성화된 슈퍼-인핸서 및 불리한 페이로드를 포함하는 기능성 핵산 분자로서, 여기서 상기 페이로드가 전사 인자(들)에 의해 슈퍼-인핸서의 활성화 시 발현되는, 기능성 핵산 분자.
제12항에 있어서, 상기 전사 인자가 표적 비정상 세포에서 차등적으로 발현되고, 임의로 상기 전사 인자가 발육 또는 줄기 세포 관련 전사 인자인, 기능성 핵산 분자.
제12항 또는 제13항에 있어서, 상기 불리한 페이로드가 세포독성 면역 세포의 동원을 유도하는 면역 반응을 자극하는 단백질을 암호화하는, 기능성 핵산 분자.
제12항 또는 제13항에 있어서, 상기 불리한 페이로드가 불활성 전구약물을 세포독성 약물로 전환시킬 수 있는 단백질을 암호화하는 자살 유전자인, 기능성 핵산 분자.
교모세포종과 같은 암의 치료에 사용하기 위한, 제11항 내지 제15항 중 어느 한 항에 따른 기능성 핵산 분자를 포함하는 조성물.
SOX 계열의 하나 이상의 전사 인자에 의해 활성화되는 슈퍼-인핸서로서, 여기서 상기 슈퍼-인핸서가 2개 이상의 인핸서 서열 및 적어도 하나의 SOX 모티프 및/또는 SOX 이량체 모티프를 포함하는, 슈퍼-인핸서.
제17항에 있어서, 상기 2개 이상의 인핸서 서열 각각이 상이한 서열을 갖는, 슈퍼-인핸서.
제17항 또는 제18항에 있어서, 상기 슈퍼-인핸서 내 2개 이상의 인핸서 서열 각각이 300개 미만의 뉴클레오타이드 길이, 특히 약 160개 뉴클레오타이드 길이인, 슈퍼-인핸서.