KR20210109649A

KR20210109649A - C9orf72 유전자좌에서 헥사뉴클레오티드 반복 확장을 갖는 비인간 동물

Info

Publication number: KR20210109649A
Application number: KR1020217026697A
Authority: KR
Inventors: 데이비드 헤슬린; 록산느 앨리; 치아-젠 시아오; 카-만 비너스 라이; 데이비드 엠. 발렌주엘라; 춘광 궈; 미셸 라크루아-프랄리쉬; 린 맥도날드; 아르티 샤르마-칸닝; 다이스케 카지무라; 구스타보 드로겟; 데이비드 프렌듀이
Original assignee: 리제너론 파마슈티칼스 인코포레이티드
Priority date: 2016-09-30
Filing date: 2017-09-29
Publication date: 2021-09-06
Also published as: CA3038548A1; JP2019530453A; MX2021003996A; EP3518667A1; KR20190057104A; WO2018064600A1; US10781453B2; RU2019108888A; AU2017336100A1; MX2019003745A; IL285014A; RU2760877C2; IL265669B; CN109862785B; JP2020198894A; RU2019108888A3; US20180094267A1; KR102527979B1; IL265669A; KR102294755B1

Abstract

C9ORF72 이종 헥사뉴클레오티드 반복 확장 서열과 관련된 질환을 위한 비인간 동물(예: 설치류)이 제공되며, 상기 비인간 동물은 내인성 C9ORF72 유전자좌에서 이종 헥사뉴클레오티드 반복(GGGGCC)을 포함한다. 헥사뉴클레오티드(GGGGCC) 서열의 적어도 하나의 사례, 예를 들어, 반복을 포함하는 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는, 본원에 개시된 비인간 동물은 하나 이상의 신경퇴행성 장애(예를 들어, 근위축성 측색 경화증(ALS) 및/또는 전두측두엽 치매(FTD) 등)와 관련된 특성 및/또는 표현형을 추가로 나타낼 수 있다. 하나 이상의 신경퇴행성 질환(예: 근위축성 측색 경화증(루게릭 병으로도 지칭되는 ALS) 및 전두측두엽 치매(FTD))을 예방, 지연 또는 치료하는 데 사용될 수 있는 치료 후보 물질을 식별하는 방법이 또한 제공된다.

Description

C9ORF72 유전자좌에서 헥사뉴클레오티드 반복 확장을 갖는 비인간 동물{NON-HUMAN ANIMALS HAVING A HEXANUCLEOTIDE REPEAT EXPANSION IN A C9ORF72 LOCUS}

관련 출원에 대한 교차 참조

본 출원은 2016년 9월 30일에 출원된 미국 가출원 제62/402,613호 및 2017년 1월 31일에 출원된 미국 가출원 제62/452,795호의 이익을 주장하며, 이들 각각은 그 전체가 참조로서 본원에 통합된다.

참조로서 서열 목록 포함

서열 목록의 공식 사본은, 2017년 9월 29일자로 생성된 "2017-09-29-10267WO01-SEQ-LIST_ST25"의 파일명을 가진 약 94KB의 크기의 ASCII 형식의 서열 목록으로서, 미국 특허 상표청을 수신 사무국으로 하여 EFS-Web을 통해 전자 방식으로 명세서와 함께 동시에 제출된다. 본 ASCII 형식의 문헌에 포함된 서열 목록은 본 명세서의 일부이며 그 전체가 참조로서 본원에 통합된다.

신경퇴행성 질환은 장애 및 질병에 많은 원인을 제공한다. 특히, 근위축성 측색 경화증(ALS, 루게릭 병으로도 지칭됨) 및 전두측두엽 치매(FTD)는 진행성 신경 소실 및/또는 사망을 특징으로 하는 희귀한 신경계 장애이다.

노화가 신경퇴행성 질환에 대한 가장 큰 위험 요인으로 보이지만, 몇몇 유전자 성분이 발견되었다. 예를 들어, 구리-아연 과산화물 디스무타제(copper-zinc superoxide dismutase; SOD1) 유전자에서의 돌연변이는 ALS와 오랜 연관성이 있다. 또한, C9ORF72 유전자의 비암호화 영역 내에서 GGGGCC의 확장된 헥사뉴클레오티드 반복은 ALS 및 FTD 모두와 연결되어 있다. 현재, 일부 치료는 3~5개월 정도 수명을 연장시킬 수 있지만, 어느 질병에 대해서도 치료 방법은 없다.

대부분의 치료제 개발에 다양한 실험실 동물 모델이 광범위하게 사용되고 있지만, 식별된 유전자 성분이 질병을 일으키는 정확한 분자 메커니즘을 밝히고, 밝혀진 분자 메커니즘을 통해 ALS뿐만 아니라 유사한 임상 증상을 나타내는 다른 신경퇴행성 질환에 대한 잠재적인 치료 양상을 차례로 밝히는 방식으로 신경퇴행성 및 염증성 질환을 다루는 모델은, 있다 하더라도 극히 드물다. 따라서, 유전자 돌연변이가 신경퇴행성 질환을 일으키는 방식은 대부분 밝혀지지 않고 있다. 이상적인 동물 모델이라면 동일한 유전자 성분을 함유하고, 인간 질환의 유사한 특성을 나타내는 동물 모델일 것이다. 종들 간의 유전적 차이를 감안하면, 인간 신경퇴행성 및/또는 염증성 질환을 유사하게 재현하는 개선된 동물 모델의 개발에 대한 충족되지 않은 높은 요구가 있다. 물론, 이러한 개선된 동물 모델은 효과적인 치료제 및/또는 예방제의 개발에 유의한 가치를 제공한다.

본 발명은 신경퇴행성 질환, 장애 및 병태의 치료에 사용될 수 있는 새로운 치료제 및, 일부 구현예에서는, 치료 방법을 식별하고 개발하기 위한 개선된 생체 내 또는 시험관 내 시스템을 가능하게 하기 위해서는 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래 운동 뉴런, 뇌 세포, 신경세포, 근육 세포, 심장 세포)를 조작하는 것이 바람직하다는 인식을 포함한다. 일부 구현예에서, 본원에 기술된 생체 내 또는 시험관 내 시스템은 C9ORF72 유전자좌, 구체적으로는 상기 유전자좌에서의 이종 헥사뉴클레오티드 반복 확장 서열과 연관된, 신경퇴행성 장애와 같은 질환, 장애, 및/또는 병태를 치료하기 위한 새로운 치료제의 식별 및 개발에 사용될 수 있다. 또한, C9ORF72 유전자좌에서 헥사뉴클레오티드 반복 확장 서열의 삽입을 포함하는, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)가, 예를 들어, GGGGCC 헥산뉴클레오티드 반복(서열번호 1), 및 이로부터 유래된 산물(예: 이로부터 전사된 센스 RNA 또는 안티센스 RNA, RNA 번역 산물 및/또는 헥사뉴클레오티드 반복에 의해 암호화된 디펩티드 반복 단백질 등)을 표적화하는 치료제의 식별 및 개발에 바람직하다. 일부 구현예에서, 본원에 기술된 바와 같은 비인간 동물 및 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기세포 유래 운동 뉴런, 뇌 세포, 신경세포, 근육 세포, 심장 세포)는 신경퇴행성 질환, 장애 및 병태(예: ALS 및/또는 FTD)에 대한 생체 내 및 시험관 내 시스템(또는 모델)을 각각 제공한다.

본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열 반복의 적어도 하나의 반복을 포함한다. 　 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 생식선 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열 반복의 적어도 하나의 반복을 포함한다. 　 일부 구현예에서, 이종 헥사뉴클레오티드 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 사례(예: 반복)를 포함하는 비-설치류(예를 들어, 비-랫트 또는 비-마우스, 예컨대, 인간) 헥사뉴클레오티드 확장 서열이다. 일부 구현예에서, (인간) 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 둘 이상의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, (인간) 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 3개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 5개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 10개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 15개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 20개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 30개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 40개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 50개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 60개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 70개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 80개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 90개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 이종 (인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 약 100개의, 바람직하게는 연속되는 반복을 포함한다. 일부 구현예에서, 비인간 동물은 그의 생식선 게놈에서 이종 (인간) 헥사뉴클레오티드 반복 확장 서열을 포함한다.

일부 구현예에서, 이종 (예를 들어, 비-설치류, 비-랫트, 비-마우스 및/또는 인간) 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나, 예를 들어, 적어도 약 3개, 적어도 약 5개, 적어도 약 10개, 적어도 약 15개, 적어도 약 20개, 적어도 약 30개, 적어도 약 40개, 적어도 약 50개, 적어도 약 60개, 적어도 약 70개, 적어도 약 80개, 적어도 약 90개, 또는 적어도 약 100개의, 바람직하게는 연속되는 반복이 측면에 위치하는 이종 (예: 비-설치류, 비-랫트, 비-마우스, 및/또는 인간) 서열을 포함한다. 따라서, 이종 (예를 들어, 비-설치류, 비-랫트, 비-마우스, 및/또는 인간) 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 제1 이종 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 같은 헥사뉴클레오티드의 하나 이상의 (바람직하게는 연속되는) 사례, 및 제2 이종 헥사뉴클레오티드 측면 서열을 포함할 수 있다. 일부 구현예에서, 이종 헥사뉴클레오티드 반복 확장 서열은 제1 이종 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 하나 이상의 사례, 및 제2 이종 헥사뉴클레오티드 측면 서열을 포함하는 자연 발생 게놈 서열과 동일하거나 실질적으로 동일하다. 자연 발생 제1 및/또는 제2 이종 헥사뉴클레오티드 측면 서열은 각각 독립적으로, 예를 들어 적어도 4 염기쌍 길이, 예를 들어 적어도 10 염기쌍 길이, 예를 들어 적어도 20 염기쌍 길이일 수 있다.

일부 구현예에서, 이종 인간 헥사뉴클레오티드 확장 서열은 인간 C9orf72 유전자의 엑손 1a 및/또는 엑손 1b의 전부 또는 일부에 걸친다 (선택적으로는, 이를 포함한다). 일부 구현예에서, 제1 이종 헥사뉴클레오티드 측면 서열은 인간 C9orf72 유전자(서열번호 34로서 제시됨)의 엑손 1a의 서열의 전부 또는 일부를 포함하고/하거나 제2 이종 헥사뉴클레오티드 측면 서열은 인간 C9orf72 유전자 (서열번호 35로서 제시됨)의 엑손 1b의 전부 또는 일부를 포함한다. 일부 구현예에서, 제1 이종 헥사뉴클레오티드 측면 서열은 서열번호 36으로서 제시된 서열, 또는 이의 일부를 포함하고/하거나 제2 이종 헥사뉴클레오티드 측면 서열은 서열번호 37로서 제시된 서열, 또는 이의 일부를 포함한다.

예시적인 인간 헥사뉴클레오티드 반복 확장 서열은 서열번호 2로서 제시된다 (5'에서 3'까지, 서열번호 36으로서 제시된 서열을 포함하는 제1 이종 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3 반복, 및 서열번호 37로서 제시된 서열을 포함하는 제2 이종 헥사뉴클레오티드 측면 서열을 포함함). 또 다른 예시적인 인간 헥사뉴클레오티드 반복 확장 서열은 서열번호 3으로서 제시된다 (5'에서 3'까지, 서열번호 36으로서 제시된 서열을 포함하는 제1 이종 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 100 반복, 및 서열번호 37로서 제시된 서열을 포함하는 제2 이종 헥사뉴클레오티드 측면 서열을 포함함). 따라서, 서열번호 2로서 제시된 서열, 서열번호 2의 변이체, 서열번호 3으로서 제시된 서열, 또는 서열번호 3의 변이체를 내인성 C9orf72 유전자좌에 포함하는 게놈을 갖는 비인간 동물, 예를 들어, 랫트 또는 마우스와 같은 설치류가 본원에 개시된다.

일부 구현예에서, 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 2 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어, 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로 제시된 헥사뉴클레오티드 서열의 1개 또는 2개의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는, 그의 일부, 예를 들어, 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다. 일부 구현예에서, 본원에 기술된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 3 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어, 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 2개 이상 및 100개 미만의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는 그의 일부, 예를 들어 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다. 일부 구현예에서, 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 3 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 36개의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는, 그의 일부, 예를 들어, 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다. 일부 구현예에서, 본원에 기술된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 3 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어, 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 92개의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는, 그의 일부, 예를 들어, 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다.

일부 구현예에서, 본원에 기술된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 2 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열에 대해 동형접합체이거나 이형접합체인데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어, 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 1개 또는 2개의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는, 그의 일부, 예를 들어, 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다. 일부 구현예에서, 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 3 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 2개 이상 및 100개 미만의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는 그의 일부, 예를 들어 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다. 일부 구현예에서, 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 3 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 36개의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는, 그의 일부, 예를 들어, 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다. 일부 구현예에서, 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 서열번호 3 변이체인 서열을 포함하는 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하는데, 상기 헥사뉴클레오티드 반복 확장 서열은 5'에서 3'까지, 서열번호 36으로서 제시된 서열(또는 그의 일부, 예를 들어 서열번호 34로서 제시된 서열)을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 92개의 연속되는 반복, 및 서열번호 37로서 제시된 서열(또는, 그의 일부, 예를 들어, 서열번호 35로서 제시된 서열)을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함한다.

일부 구현예에서, 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 그의 (생식선) 게놈에서 이종 (인간) 헥사뉴클레오티드 반복 확장 서열과 C9orf72 유전자좌의 미번역 서열 및/또는 비암호화 내인성 비인간 서열의 대체를 포함한다. 일부 구현예에서, 내인성 비인간 C9orf72 유전자좌의 내인성 엑손 1(예: 엑손 1a 및/또는 1b)과 ATG 시작 코돈 사이에 걸쳐 있는 (그리고, 선택적으로 이들을 일부를 포함하는) 미번역 서열 및/또는 비암호화 서열, 또는 그의 일부가 이종 헥사뉴클레오티드 반복 확장 서열과 대체된다. 이종 (인간) 헥사뉴클레오티드 확장 서열에 연결된 추가의 서열(예를 들어, 재조합 효소 인식 서열, 약물 내성 카세트, 리포터 유전자 등)도 C9orf72 유전자좌의 내인성 엑손 1(예: 엑손 1a 및/또는 엑손 1b)과 ATG 시작 코돈 사이에 걸쳐 있는 미번역 서열 및/또는 비암호화 서열, 또는 그의 일부를 대체할 수 있다.

따라서, 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 이종 헥사뉴클레오티드 반복 확장 서열, 예를 들어, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 반복을 포함하는 헥사뉴클레오티드 반복 확장 서열과, (1) 내인성 엑손 1의 5' 단부에서, 내인성 엑손 1 내에서, 또는 이의 3' 단부에서 시작하고, (2) 내인성 ATG 시작 코돈의 5'에서 끝나는 내인성 서열 또는 그의 일부의 이형접합성 또는 동형접합성 대체를 포함할 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는, 5'에서 3'까지, 서열번호 34로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 사례; 및 서열번호 35로서 제시된 서열을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함하는 이종 헥사뉴클레오티드 반복 확장과, (i) 내인성 엑손 1의 5' 단부에서, 내인성 엑손 1 내에서, 또는 이의 3' 단부에서 시작하고, (ii) 내인성 ATG 시작 코돈의 5'에서 끝나는 내인성 서열 또는 그의 일부의 이형접합성 또는 동형접합성 대체를 포함할 수 있다. 　 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기 세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는, 5'에서 3'까지, 서열번호 36으로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 사례; 및 서열번호 37로서 제시된 서열을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열을 포함하는 이종 헥사뉴클레오티드 반복 확장 서열과, (ii) 내인성 엑손 1의 5' 단부에서, 내인성 엑손 1 내에서, 또는 이의 3' 단부에서 시작하고, (2) 내인성 ATG 시작 코돈의 5'에서 끝나는 내인성 서열 또는 그의 일부의 이형접합성 또는 동형접합성 대체를 포함할 수 있다. 　 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기 세포, 배아 줄기세포 유래-운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는, 서열번호 2로서 제시된 서열, 이의 변이체, 서열번호 3으로서 제시된 서열, 또는 이의 변이체를 포함하는 이종 헥사뉴클레오티드 반복 확장 서열과, (ii) 내인성 엑소 1의 5' 단부에서, 내인성 엑손 1 내에서, 또는 이의 3' 단부에서 시작하고, (ii) 내인성 ATG 시작 코돈의 5'에서 끝나는 내인성 서열 또는 그의 일부의 이형접합성 또는 동형접합성 대체를 포함할 수 있다.

일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나 이상의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 특성 중 하나 이상을 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가; 또는 (iv) (i) 내지 (iii)의 임의의 조합. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개 이상의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 특성 중 하나 이상을 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가; 또는 (iv) (i) 내지 (iii)의 임의의 조합. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 30개의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 특성 중 하나 이상을 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가; 또는 (iv) (i) 내지 (iii)의 임의의 조합. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 90개 이상의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 특성 중 하나 이상을 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가; 또는 (iv) (i) 내지 (iii)의 임의의 조합. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 92개의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 세 가지 특성 모두를 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; 및 (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 91개 이상의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 세 가지 특성 모두를 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; 및 (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 92개의 반복을 포함하고, 상기 비인간 동물 또는 세포는 다음 세 가지 특성 모두를 나타낸다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 발현 증가; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 C9orf72 RNS 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소 수의 증가; 및 (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같이, 야생형 C9orf72 유전자좌를 포함하는 대조군 동물 또는 세포와 비교해 디펩티드 반복 단백질 수준의 증가.

일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 (생식선) 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 반복을 포함하고, 비인간 동물 또는 세포의 다음 특징 중 하나 이상은 야생형 C9orf72 유전자좌를 포함하는 대조군 비인간 동물 또는 세포와 비교해 유의하게 상이하지 않다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같은, C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 양; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와, C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소의 수; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같은, 디펩티드 반복 단백질의 수준; 또는 (iv) (i) 내지 (iii)의 임의의 조합. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 반복을 포함하고, 비인간 동물 또는 세포의 다음 특징 중 하나 이상은 야생형 C9orf72 유전자좌를 포함하는 대조군 비인간 동물 또는 세포와 비교해 유의하게 상이하지 않다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같은, C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 양; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같은, C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소의 수; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같은, 디펩티드 반복 단백질의 수준; 또는 (iv) (i) 내지 (iii)의 임의의 조합. 일부 구현예에서, 본원에 기술된 비인간 동물 또는 비인간 동물 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 신경 세포, 근육 세포, 심장 세포)는 내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하되, 상기 이종 헥산뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 30개의 반복을 포함하고, 비인간 동물 또는 세포의 다음 특징 중 하나 이상은 야생형 C9orf72 유전자좌를 포함하는 대조군 비인간 동물 또는 세포와 비교해 유의하게 상이하지 않다: (i) 예를 들어, 정량적 PCR에 의해 평가된 바와 같은, C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체의 양; (ii) 예를 들어, 형광 활성화 인시츄 혼성화에 의해 평가된 바와 같은, C9orf72 RNA 센스 전사체 및/또는 안티센스 전사체를 포함하는 RNA 병소의 수; (iii) 예를 들어, 면역형광검사에 의해 평가된 바와 같은, 디펩티드 반복 단백질의 수준; 또는 (iv) (i) 내지 (iii)의 임의의 조합.

일부 구현예에서, 본원에 기술된 바와 같은 핵산 작제물(또는 표적화 작제물, 또는 표적화 벡터)이 제공된다.

일부 구현예에서, 본원에 기술된 바와 같은 핵산 작제물은, 5'에서 3'까지, 비인간(예를 들어, 마우스 또는 랫트와 같은 설치류) C9ORF72 유전자좌의 5' 부분과 상동인 폴리뉴클레오티드를 포함하는 5' 비인간 표적화 아암; 서열번호 1로서 제시된 적어도 하나의 헥사뉴클레오티드 서열을 포함하는 이종 헥산뉴클레오티드 반복 확장 서열; 제1 재조합 인식 부위; 선별 마커에 작동 가능하게 연결된 제1 프로모터; 제2 재조합 인식 부위; 및 비인간(예를 들어, 마우스 또는 랫트와 같은 설치류) C9ORF72 유전자좌의 3' 부분과 상동인 폴리뉴클레오티드를 포함하는 3' 비인간 표적화 아암을 포함한다. 일부 구현예에서, 비인간(예를 들어, 마우스 또는 랫트와 같은 설치류) C9ORF72 유전자좌의 5' 부분은 비인간(예를 들어, 마우스 또는 랫트와 같은 설치류) C9ORF72 유전자좌의 엑손 1의 상류에 있는 게놈 서열을 포함한다.

일부 구현예에서, 재조합 효소 인식 부위는 loxP, lox511, lox2272, lox2372, lox66, lox71, loxM2, lox5171, FRT, FRT11, FRT71, attp, att, FRT, rox, 또는 이들의 조합을 포함한다. 일부 구현예에서, 재조합 효소 유전자는, 예를 들어, 유도성 프로모터의 조절 하에 작제물에 포함된다. 재조합 효소 유전자는 Cre, Flp(예: Flpe, Flpo), 및 Dre로 이루어진 군으로부터 선택될 수 있다. 일부 특정 구현예에서, 제1 및 제2 재조합 효소 인식 부위는 lox (예: loxP) 부위이며, 및 재조합 효소 유전자는 Cre 재조합 효소를 암호화한다.

일부 구현예에서, 제1 프로모터는 프로타민(Prot, 예를 들어, Prot1 또는 Prot5), Blimp1, Blimp1(1 kb 단편), Blimp1(2 kb 단편), Gata6, Gata4, Igf2, Lhx2, Lhx5, hUB1, Em7 및 Pax3으로 이루어진 군으로부터 선택된다. 일부 특정 구현예에서, 제1 프로모터는 Em7 프로모터와 조합된 hUB1 프로모터이다.

일부 구현예에서, 선별 마커는 네오마이신 포스포트랜스퍼라아제(neo^r), 히그로마이신 B 포스포트랜스퍼라아제(hyg^r), 퓨로마이신-N-아세틸트랜스퍼라아제(puro^r), 블라스티딘 S 디아미나아제(bsr^r), 크산틴/구아닌 포스포리보실 트랜스퍼라아제(gpt), 및 단순 포진 바이러스 티미딘키나아제(HSV-tk)를 포함한다. 일부 특정 구현예에서, 선별 마커는 neo^r이다.

일부 구현예에서, 핵산 작제물은 서열번호 8로서 제시된 서열을 포함하는데, 상기 서열은 5'에서 3'까지, 5' 비인간 (마우스) 표적화 아암; 서열번호 36으로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개의 반복; 서열번호 37로서 제시된 서열을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열; 플록싱된(floxed) 약물 내성 (neo^r) 카세트; 및 3' 비인간 (마우스) 표적화 아암을 포함한다. 일부 구현예에서, 핵산 작제물은 서열번호 9로서 제시된 서열을 포함하는데, 상기 서열은 5'에서 3'까지, 5' 비인간 (마우스) 표적화 아암; 서열번호 36으로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 100개의 반복; 서열번호 37로서 제시된 서열을 포함하는 제2 인간 헥사뉴클레오티드 측면 서열; 플록싱된(floxed) 약물 내성 (neo^r) 카세트; 및 3' 비인간 (마우스) 표적화 아암을 포함한다.

일부 구현예에서, 내인성 C9orf72 유전자좌 내에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 게놈을 갖는 비인간 동물 또는 비인간 동물 세포를 제조하는 방법이 제공되는데, 상기 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의, 예를 들어, 적어도 3개의 반복, 예를 들어, 적어도 30개의 반복, 예를 들어, 적어도 90개의 반복을 포함하고, 상기 방법은: (a) 이종 헥사뉴클레오티드 반복 확장 서열이 내인성 C9ORF72 유전자좌 내에 삽입되도록, 핵산 서열, 예를 들어, 본원에 기술된 바와 같은 핵산 작제물(예: 서열번호 8로서 제시된 서열을 포함하는 핵산 작제물, 또는 서열번호 9로서 제시된 서열을 포함하는 핵산 작제물)을 비인간 배아 줄기 세포 내로 도입하는 단계(핵산은 C9ORF72 유전자에 대해 상동성인 폴리뉴클레오티드드를 포함함); (b) 유전자 조작된 비인간 배아 줄기 세포를 (a) 단계로부터 수득하는 단계; 및 선택적으로, (c) (b) 단계의 유전자 조작된 비인간 배우 줄기 세포를 사용해 비인간 동물을 생성하는 단계를 포함한다. 일부 구현예에서, 본원에 기술된 비인간 동물을 제조하는 방법은, 삽입체에 대해 동형접합체인 비인간 동물이 생성되도록, (c) 단계에서 생성된 비인간 동물을 번식시키는 단계를 더 포함한다.

일부 구현예에서, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 반복을 포함하는 이종 헥사뉴클레오티드 반복 확장 서열을 내인성 C9ORF72 유전자좌에서 포함하는 게놈을 갖는 비인간 동물의 제조 방법이 제공되며, 상기 방법은 비인간 동물의 게놈이 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 C9ORF72 유전자좌에서 포함하도록 이를 변형시킴으로써 상기 비인간 동물을 만드는 단계를 포함한다.

일부 구현예에서, 본원에서 기술된 바와 같은 방법에 의해 수득될 수 있거나, 생성되거나, 생산되는 비인간 동물이 제공된다. 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물은 서열번호 8로서 제시된 서열을 포함하는 핵산 작제물을 사용하여 생산된다. 이러한 비인간 동물은 내인성 엑손 1의 내부에서 시작하는 내인성 C9orf72 유전자좌의 약 853 bp와, 5'에서 3'까지, 서열번호 36으로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 하나 내지 3개의 반복; 서열번호 37로서 제시된 서열을 포함하는 인간 헥사뉴클레오티드 측면 서열; 및 플록싱된 약물 내성(neo^r) 카세트, 또는 neo 유전자의 절제 시에는 lox 재조합 인식 서열을 포함하는 이종 뉴클레오티드 서열과의 이형접합성 또는 동형접합성 대체를 포함한다. 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물은 서열번호 9로서 제시된 서열을 포함하는 핵산 작제물을 사용하여 생산된다. 이러한 비인간 동물은 내인성 엑손 1 내에서 시작하는 내인성 C9orf72 유전자좌의 약 853 bp와, 5'에서 3'까지, 서열번호 36으로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 하나 내지 100개(예: 36개 또는 92개)의 반복; 서열번호 37로서 제시된 서열을 포함하는 인간 헥사뉴클레오티드 측면 서열; 및 플록싱된 약물 내성(neo^r) 카세트, 또는 neo 유전자의 절제 시에는 lox 재조합 인식 서열을 포함하는 이종 뉴클레오티드 서열과의 이형접합성 또는 동형접합성 대체를 포함한다. 일부 구현예에서, 비인간 동물은 서열번호 4(8026)로서 제시된 이종 뉴클레오티드 서열, 서열번호 5(8027)로서 제시된 이종 뉴클레오티드 서열, 서열번호 6(8028)으로서 제시된 이종 뉴클레오티드 서열, 또는 서열번호 7(8029)로서 제시된 이종 뉴클레오티드 서열을 포함하되, 상기 이종 뉴클레오티드 서열은 내인성 엑손 1 내에서 시작하는 내인성 C9orf72 유전자좌의 853 bp의 미번역 및/또는 비암호화 서열을 선택적으로 대체한다. 일부 구현예에서, 본원에 개시된 바와 같은 비인간 동물은, 예를 들어, 서열번호 9로서 제시된 서열을 포함하는 핵산 작제물을 사용하여 생성된 동물과 서열번호 8로서 제시된 서열을 포함하는 핵산 작제물을 사용하여 생성된 동물을 번식시킴으로써 생산된다. 이러한 동물은, (1) 내인성 엑손 1 내에서 시작하는 내인성 C9orf72 유전자좌의 약 853 bp와, 5'에서 3'까지, 서열번호 36으로서 제시된 서열을 포함하는 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 하나 내지 3개의 반복; 서열번호 37로서 제시된 서열을 포함하는 인간 헥사뉴클레오티드 측면 서열; 및 플록싱된 약물 내성(neo^r) 카세트, 또는 neo 유전자의 절제 시에는 lox 재조합 인식 서열을 포함하는 이종 뉴클레오티드 서열과의 이종접합성 대체, 및 (2) 내인성 엑손 1 내에서 시작하는 내인성 C9orf72 유전자좌의 약 853 bp와, 5'에서 3'까지, 서열번호 36으로서 제시된 제1 인간 헥사뉴클레오티드 측면 서열; 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 하나 내지 100개(예: 36개 또는 92개)의 반복; 서열번호 37로서 제시된 서열을 포함하는 인간 헥사뉴클레오티드 측면 서열; 및 플록싱된 약물 내성(neo^r) 카세트, 또는 neo 유전자의 절제 시에는 lox 재조합 인식 서열을 포함하는 이종 뉴클레오티드 서열과의 이형접합성 대체 둘 다를 포함한다.

일부 구현예에서, 본원에 기술된 바와 같은, 또는 본원에 기술된 방법에 의해 제조된 바와 같은 비인간 동물의 단리된 비인간 세포 또는 조직이 제공된다. 일부 구현예에서, 단리된 세포 또는 조직은 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함한다. 일부 구현예에서, 세포는 뉴런 세포 또는 뉴런 계통의 세포이다. 일부 구현예에서, 본원에 기술된 바와 같은 단리된 비인간 동물의 단리된 세포로부터 만들어진 불멸화 세포주(immortalized cell line)가 제공된다.

일부 구현예에서, 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 게놈을 갖는 비인간 배아 줄기 세포가 제공된다. 일부 구현예에서, 비인간 배아 줄기 세포는 설치류 배아 줄기 세포이다. 일부 구현예에서, 설치류 배아 줄기 세포는 마우스 배아 줄기 세포이고, 129 계통, C57BL 계통 또는 이의 혼합체로부터 유래한다. 일부 특정 구현예에서, 설치류 배아 줄기 세포는 마우스 배아 줄기 세포이고, 129 계통 및 C57BL 계통의 혼합체이다.

또한, 세포(예: 배아 줄기 세포)로부터, 이종 헥사뉴클레오티드 반복 확장 서열(또는 그의 일부)이 삽입된 내인성 C9ORF72 유전자좌를 결실시키는 데 사용할 수 있는 크리스퍼(Clustered Regularly Interspersed Short Palindromic Repeats; CRISPR)/CRISPR-관련 (Cas) 시스템, 또는 CRISPR/Cas 시스템의 하나 이상의 구성 요소가 본원에 기술된다. 이러한 구성 요소는, 예를 들어 Cas 단백질 및/또는 가이드 RNA(GrNA)를 포함하며, GrNA는 2개의 분리된 RNA 분자, 예를 들어, 표적화 RNA(예: CRISPR RNA(crRNA) 및 활성인자 RNA(예: tracrRNA))를 포함하거나 단일-가이드 RNA(예: 단일-분자 GrNA (sGrNA))를 포함한다.

CRISPR/Cas 시스템은 Cas 유전자의 발현에 관여하거나, 이의 활성을 유도하는 데 관여하는 전사체 및 다른 요소를 포함한다. CRISPR/Cas 시스템은, 예를 들어, I형, II형, 또는 III형 시스템일 수 있다. 대안적으로, CRISPR/Cas 시스템은 V 형 시스템(예를 들어, 아형 V-A 또는 아형 V-B)일 수 있다. 본원에 기술된 바와 같은 내인성 C9ORF72 유전자좌에 삽입된 내인성 헥사뉴클레오티드 반복 확장 서열(또는 그의 부분)은 핵산의 부위-유도 절단을 위해 CRISPR 복합체(Cas 단백질과 복합된 가이드 RNA(GrNA)를 포함함)를 사용함으로써 결실시킬 수 있다.

본원에 기술된 바와 같은 CRISPR/Cas 시스템은 Cas 단백질(예: Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1 , Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 or Csx12), Cas10, Casl0d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1 , Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, Cu1966, 및 이들의 동족체 또는 변형 버전) 및/또는 gRNA 인식 서열을 표적화하는 하나 이상의 가이드 RNA(gRNA)를 포함할 수 있다. 본원에 기술된 바와 같은 CRISPR/Cas 시스템은, Cas 단백질을 암호화하는 (예컨대, 프로모터에 작동 가능하게 연결될 수 있는) 핵산 및/또는 본원에 기술된 바와 같은 gRNA를 암호화하는 DNA를 포함하는, 적어도 하나의 발현 작제물을 더 포함할 수 있다.

일부 구현예에서, gRNA 인식 서열, 예를 들어, 결합에 충분한 조건이 존재하는 경우 gRNA의 DNA 표적화 세그먼트가 결합하게 될 표적 핵산 서열은 서열번호 45 또는 그의 일부에서 발견된다. Cas 단백질에 의한 서열번호 45의 부위 특이적 결합 및 절단은, (i) gRNA와 표적 DNA 사이의 염기-쌍 상보성, 및 (ii) 표적 DNA에서, 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif)라고 불리는 짧은 모티프 둘 모두에 의해 결정된 위치에서 발생할 수 있다. PAM은 가이드 RNA 인식 서열의 측면에 위치할 수 있다. 선택적으로, PAM은 가이드 RNA 인식 서열의 3' 단부에서 그 측면에 위치할 수 있다. 대안적으로, PAM은 가이드 RNA 인식 서열의 5' 단부에서 그 측면에 위치할 수 있다. 예를 들어, Cas 단백질의 절단 부위는 PAM 서열의 상류 또는 하류의 약 1 내지 약 10 또는 약 2 내지 약 5 염기쌍(예를 들어, 3개의 염기 쌍)일 수 있다. 일부 경우에(예: 화농연쇄구균(S. pyogenes) 유래의 Cas9 또는 이와 밀접하게 관련된 Cas9가 사용되는 경우), 비-상보성 가닥의 PAM 서열은 5'-N₁GG-3'일 수 있다(여기서, N₁은 임의의 DNA 뉴클레오티드이며, 표적 DNA의 비-상보성 가닥의 가이드 RNA 인식 서열의 3' 바로 옆에 위치함). 마찬가지로, 상보적 가닥의 PAM 서열은 5'-CCN₂-3'일 것이다(여기서, N₂는 임의의 DNA 뉴클레오티드이며, 표적 DNA의 상보적 가닥의 가이드 RNA 인식 서열의 5' 바로 옆에 위치함). 일부 이러한 경우에, N₁과 N₂는 상보성일 수 있고, N₁- N₂ 염기쌍은 임의의 염기쌍일 수 있다(예를 들어, N₁=C와 N₂=G; N₁=G와 N₂=C; N₁=A와 N₂=T; 또는 N₁=T와 N₂=A). 황색포도상구균(S. aureus) 유래의 Cas9의 경우, PAM은 NNGRRT 또는 NNGRR일 수 있다(여기서, N은 A, G, C, 또는 T일 수 있고, R은 G 또는 A일 수 있음). 일부 경우에(예를 들어, FnCpf1의 경우), PAM 서열은 5' 말단의 상류에 있고, 서열 5'-TTN-3'을 가질 수 있다. 일부 구현예에서, gRNA 인식 서열은 서열번호 45의 위치 190, 196, 274, 899, 905, 1006, 또는 1068에서 시작한다.

본원에 개시된 바와 같이, 가이드 RNA는 임의의 형태로 제공될 수 있다. 일부 구현예에서, gRNA는 2개의 분자(별도의 crRNA 및 tracrRNA) 또는 하나의 분자(sgRNA)로서 RNA 형태로 제공되거나, 선택적으로는 Cas 단백질과의 복합체의 형태로 제공될 수 있다. gRNA는 gRNA를 암호화하는 DNA의 형태로 제공될 수도 있다. 일부 구현예에서, gRNA를 암호화하는 DNA는 단일 RNA 분자 (sgRNA) 또는 별도의 RNA 분자(예를 들어, 별도의 crRNA 및 tracrRNA)를 암호화할 수 있다(여기서, 별도의 RNA 분자는 하나의 DNA 분자로서 제공되거나, 각각 crRNA 및 tracrRNA를 암호화하는 별도의 DNA 분자로서 제공될 수 있음).

일 구현예에서, 본원에 기술된 바와 같은 CRISPR/Cas 시스템은 Cas9 단백질 또는 II형 CRISPR/Cas 시스템 및/또는 적어도 하나의 gRNA로부터의 Cas9로부터 유래된 단백질을 포함하되, 적어도 하나의 gRNA는 crRNA 및/또는 tracrRNA를 암호화하는 DNA에 의해 암호화된다. 일부 구현예에서, crRNA를 암호화하는 DNA는 AGTACTGTGAGAGCAAGTAG (R) (서열번호 38), GCTCTCACAGTACTCGCTGA (서열번호 39), CCGCAGCCTGTAGCAAGCTC (서열번호 40), CGGCCGCTAGCGCGATCGCG (서열번호 41), ACGCCCCGCGATCGCGCTAG (R) (서열번호 42), TGGCGAGTGGGTGAGTGAGG (서열번호 43), GGAAGAGGCGCGGGTAGAAG (서열번호 44), GAGTACTGTGAGAGCAAGTAG (R) (서열번호 46), GCCGCAGCCTGTAGCAAGCTC (서열번호 47), GCGGCCGCTAGCGCGATCGCG (서열번호 48), GACGCCCCGCGATCGCGCTAG (R) (서열번호 49), 및 GTGGCGAGTGGGTGAGTGAGG (서열번호 50)로 이루어진 군으로부터 선택된 서열을 포함한다. 일 구현예에서, 본원에 기술된 CRISPR/Cas 시스템은 적어도 7개의 crRNA 암호화 서열의 조합을 포함하되, 상기 7개의 crRNA 암호화 서열 각각은 서열번호 38, 39, 40, 41, 42, 43 또는 44로서 제시된 서열을 포함한다. 일 구현예에서, 본원에 기술된 CRISPR/Cas 9 시스템은 적어도 7개의 구별되는 crRNA 암호화 서열의 조합을 포함하되, 상기 7개의 crRNA 암호화 서열 각각은 서열번호 46, 39, 47, 48, 49, 50, 또는 44로서 제시된 서열을 포함한다. 일 구현예에서, 본원에 기술된 CRISPR/Cas 9 시스템은 적어도 3개의 구별되는 crRNA 암호화 서열의 조합을 포함하되, 이들 각각은 서열번호 40, 43, 또는 44로서 제시된 서열을 포함한다. 일 구현예에서, 본원에 기술된 CRISPR/Cas 9 시스템은 적어도 3개의 구별되는 crRNA 암호화 서열의 조합을 포함하되, 이들 각각은 서열번호 47, 50, 또는 44로서 제시된 서열을 포함한다. 일 구현예에서, 본원에 기술된 CRISPR/Cas 9 시스템은 적어도 4개의 구별되는 crRNA 암호화 서열의 조합을 포함하되, 이들 각각은 서열번호 38, 39, 41 또는 42로서 제시된 서열을 포함한다. 일 구현예에서, 본원에 기술된 CRISPR/Cas 9 시스템은 적어도 4개의 구별되는 crRNA 암호화 서열의 조합을 포함하되, 이들 각각은 서열번호 46, 39, 48, 또는 49로서 제시된 서열을 포함한다.

일부 구현예에서, 본원에 개시된 gRNA는 tracrRNA를 암호화하는 DNA에 의해 암호화된다. 일부 구현예에서, tracrRNA 암호화 서열은 서열번호 63, 64 또는 65로서 제시된 서열을 포함한다. 일부 구현예에서, 본원에 기술된 gRNA는 crRNA 및 tracrRNA를 포함한다. 일부 구현예에서, 본원에 개시된 gRNA는 (예를 들어, 서열번호 38, 39, 40, 41, 42, 43, 44, 46, 47, 48, 49 또는 50으로서 제시된 서열을 포함하는 DNA에 의해 암호화된) 하나 이상의 crRNA 및, tracrRNA(예를 들어, 서열번호 63, 64 또는 65로서 제시된 서열을 포함하는 DNA)를 포함한다. 일부 구현예에서, gRNA를 암호화하는 DNA는 단일 RNA 분자(sgRNA) 또는 별도의 RNA 분자(예를 들어, 별도의 crRNA 및 tracrRNA)를 암호화할 수 있다(여기서, 상기 별도의 RNA 분자는 하나의 DNA 분자로서 제공되거나, 각각 crRNA 및 tracrRNA를 암호화하는 별도의 DNA 분자로서 제공될 수 있음).

표적화된 유전자 조작은 표적 게놈 유전자좌 내에서 하나 이상의 가이드 RNA 인식 서열에 혼성화하는 Cas 단백질 및 하나 이상의 가이드 RNA와 세포를 접촉시킴으로써 생성될 수 있다. 하나 이상의 가이드 RNA 중 적어도 하나는 Cas 단백질과 복합체를 형성할 수 있고, 하나 이상의 가이드 RNA 인식 서열 중 적어도 하나에 Cas 단백질을 안내할 수 있고, Cas 단백질은 하나 이상의 가이드 RNA 인식 서열 중 적어도 하나 내에서 표적 게놈 유전자좌를 절단할 수 있다. Cas 단백질에 의한 절단은 이중 가닥 파단 또는 단일 가닥 파단을 생성할 수 있다(예를 들어, Cas 단백질이 틈내기 효소(nickase)인 경우). 이어서, 이중 가닥 파단 또는 단일 가닥 파단에 의해 생성된 말단 서열은 재조합될 수 있다.

일부 구현예에서, 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 게놈을 갖는 비인간 생식 세포가 제공된다. 일부 구현예에서, 비인간 생식 세포는 설치류 생식 세포이다. 일부 특정 구현예에서, 설치류 생식 세포는 마우스 생식 세포이고, 129 계통, C57BL 계통 또는 이의 혼합체로부터 유래한다. 일부 특정 구현예에서, 설치류 생식 세포는 마우스 생식 세포이고, 129 계통 및 C57BL 계통의 혼합체이다.

일부 구현예에서, 유전자 조작 비인간 동물을 제조하기 위한, 본원에 기술된 바와 같은 비인간 배아 줄기 세포 또는 생식 세포의 용도가 제공된다. 일부 특정 구현예에서, 비인간 배아 줄기 세포 또는 생식 세포는 마우스 배아 줄기 세포 또는 생식 세포이며, 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 마우스를 만드는 데 사용된다. 일부 특정 구현예에서, 비인간 배아 줄기 세포 또는 생식 세포는 랫트 배아 줄기 세포 또는 생식 세포이며, 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 랫트를 만드는 데 사용된다.

일부 구현예에서, 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 비인간 배아 줄기 세포를 포함하거나, 이로부터 만들어지거나, 이로부터 수득되거나, 이로부터 생성된 비인간 배아가 제공된다. 일부 특정 구현예에서, 비인간 배아는 설치류 배아이고; 일부 구현예에서는, 마우스 배아이며; 일부 구현예에서는, 랫트 배아이다.

일부 구현예에서, 유전자 조작 비인간 동물을 제조하기 위한, 본원에 기술된 바와 같은 비인간 배아의 용도가 제공된다. 일부 특정 구현예에서, 비인간 배아는 마우스 배아이며, 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 마우스를 만드는 데 사용된다. 일부 특정 구현예에서, 비인간 배아는 랫트 배아이며 본원에 기술된 바와 같은 C9ORF72 유전자좌를 포함하는 랫트를 만드는 데 사용된다.

일부 구현예에서, 근위축성 측방향 경화증(ALS) 또는 전두관측성 치매(FTD)의 비인간 동물 모델이 제공되며, 비인간 동물은 C9ORF72 본원에 개시된 바와 같은 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 유전자좌.

일부 구현예에서, 근위축성 측색 경화증(ALS) 또는 전두측두엽 치매(FTD)의 비인간 동물 모델이 제공되는데, 이는 내인성 C9ORF72 유전자좌 내에 이종 헥사뉴클레오티드 반복 확장 서열을 삽입함으로써 수득된다.

일부 구현예에서, 신경퇴행성 질환, 장애 또는 병태의 치료를 위한 치료 후보물질을 식별하기 위한 방법이 제공되며, 상기 방법은 (a) 본원에서 기술된 바와 같이 변형된 내인성 C9ORF72 유전자좌를 포함하는 게놈을 갖는 비인간 동물 또는 비인간 동물 세포(예를 들어, 배아 줄기세포, 배아 줄기세포 유래 운동 뉴런, 뇌 세포, 피질 세포, 신경 세포, 근육 세포, 심장 세포)에 후보 제제를 투여하는 단계; (b) 후보 제제가 질환, 장애 또는 병태와 관련된 하나 이상의 징후, 증상 및/또는 상태에 대한 약독화 효과를 갖는지 여부를 결정하기 위한 하나 이상의 분석을 수행하는 단계(예를 들어, C9orf72 유전자좌로부터 센스 또는 안티센스 C9orf72 RNA의 전사 증가, 센스 또는 안티센스 C9orf72 RNA를 포함하는 핵 및/또는 세포질 RNA 병소의 증가, RAN 번역 산물(예: 디펩티드 반복 단백질)의 증가); 및 (c) 질환, 장애 또는 병태와 관련된 하나 이상의 징후, 증상 및/또는 상태에 대한 약독화 효과를 갖는 후보 제제를 치료 후보물질로서 식별하는 단계를 포함한다. 일부 구현예에서, 질환 또는 병태는 신경퇴행성 질환 또는 병태로 이루어진 군으로부터 선택된다. 일부 구현예에서, 후보 제제는 본원에 기술된 바와 같은 비인간 동물에게 생체 내(in vivo) 투여되며, 투여 후 비인간 동물로부터 단리된 뇌 세포, 피질 세포, 신경 세포, 근육 세포, 심장 세포, 또는 생식 세포를 포함하는 조직 상에서 하나 이상의 검정이 수행된다. 일부 구현예에서, 후보 제제는 본원에 기술된 바와 같은 C9orf72 유전자좌에서 헥사뉴클레오티드 반복 확장 서열을 포함하는 세포(예: 배아 줄기 세포, 배아 줄기 세포 유래의 운동 뉴런, 뇌 세포, 피질 세포, 신경 세포, 근육 세포, 심장 세포)에 투여되고, 검정은 시험관 내에서 수행된다. 일부 구현예에서, 검정은 C9orf72 유전자 산물, 예를 들어 센스 및 안티센스 C9orf72 RNA를 검출하기 위한 정량적 중합 효소 연쇄 반응(qPCR)이다. 일부 구현예에서, qPCR은 서열번호 66, 서열번호 67, 서열번호 68, 서열번호 69, 서열번호 70, 서열번호 71, 서열번호 72, 서열번호 73, 서열번호 74, 서열번호 75, 서열번호:76, 서열번호 77, 서열번호 78, 서열번호 79, 서열번호 80, 또는 이들의 임의의 조합에 제시된 뉴클레오티드 서열을 갖는 프라이머 및/또는 프로브로 수행될 수 있다. 일부 구현예에서, 검정은 C9orf72 센스 또는 안티센스 RNA 전사물, 예를 들어, 헥사뉴클레오티드 반복 확장 서열의 RNA 전사물을 포함하는 RNA 병소를 측정하는 것이다. 일부 구현예에서, C9orf72 센스 또는 안티센스 RNA 전사물, 예를 들어, 헥사뉴클레오티드 반복 확장 서열의 RNA 전사물을 포함하는 RNA 병소를 측정하는 검정에는, 서열번호 81, 서열번호 82, 서열번호 83, 및/또는 서열번호 84 중 임의의 하나로서 제시된 뉴클레오티드 서열을 갖는 하나 이상의 프로브가 사용된다. 일부 구현예에서, 검정은 RAN 번역 산물을 측정하는 것으로서, 예를 들어, 상기 검정은 면역형광법이고, RAN 번역 산물(예: 디펩티드 반복 단백질, 예: 폴리GA 디펩티드 반복 단백질)은 항-폴리GA 항체로 측정된다. 일부 구현예에서, 검정은 C9orf72 단백질 수준을 측정하는 것이다.

일부 구현예에서, 신경퇴행성 질환, 장애 또는 병태의 치료를 위한 약제의 제조에 있어서 본원에 기술된 바와 같은 비인간 동물의 용도가 제공된다.

일부 구현예에서, 신경퇴행성 질환, 장애 또는 병태는 근위축성 측색 경화증(ALS)이다. 일부 구현예에서, 신경퇴행성 질환, 장애 또는 병태는 전두측두엽 치매(FTD)이다.

다양한 구현예에서, 본원에 기술된 바와 같은 하나 이상의 표현형은 기준 또는 대조군과 비교되어 기술된다. 다양한 구현예에서, 기준 또는 대조군은 본원에 기술된 바와 같은 변형 또는 본원에 기술된 바와 상이한 변형을 가지거나 변형을 가지지 않는 비인간 동물(즉, 야생형 비인간 동물)을 포함한다. 서열번호 2로서 제시된 서열된 서열 또는 그 변이체, 서열 번호 4로서 제시된 서열, 또는 그 변이체, 또는 서열번호 5로서 제시된 서열, 또는 그 변이체를 포함하는 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 비인간 동물은 야생형 표현형을 나타낼 수 있으며, 예를 들어, 기준, 또는 대조군 비인간 동물로서 본원에 기술된 방법에서 사용될 수 있다.

다양한 구현예에서, 비인간 동물은 본원에 기술된 C9orf72 유전자좌에 대해 동형접합체이다. 다양한 구현예에서, 비인간 동물은 본원에 기술된 C9orf72 유전자좌에 대해 이형접합체이다.

다양한 구현예에서, 본원에 기술된 비인간 동물은 설치류이고; 일부 구현예에서는, 마우스이며; 일부 구현예에서는, 랫트이다.

본 출원에서 사용된 바와 같이, 용어 "약(about)" 및 "대략(approximately)"은 동등하게 사용된다. 본 출원에서 사용된 임의의 수치는 약/대략을 사용하거나 사용하지 않더라도 당업자에 의해 이해되는 임의의 정상적인 변동을 포함하는 것을 의미한다.

본원에 제공된 비인간 동물, 세포 및 방법의 다른 특징, 목적 및 이점은 하기 특정 구현예들의 상세한 설명에서 명백하다. 그러나, 본 발명의 특정한 구현예를 나타내지만, 상세한 설명은 단지 예시로서 제공될 뿐 제한하고자 함이 아닌 것으로 이해해야 한다. 본 발명의 범주 내 다양한 변형예들 및 수정예들이 상세한 설명으로부터 당업자에게 명백해질 것이다.

도 1a는 3개의 보고된 마우스 C9orf72 전사 아이소폼(V1, V2 및 V3)의 개략도(축적에 비례하지 않음)를 상단 박스내에 도시하고, 인간 C9orf72 유전자의 엑손 1a 및 1b에 걸쳐 있고 내인성 마우스 C9orf72 유전자좌 내로 3개 또는 100개의 반복을 포함하는 2개의 인간 이종 헥사뉴클레오티드 반복 확장 서열 중 하나를 삽입하기 위한 표적화 전략의 개략도를 도시한다. 도 1a에서, 흰색의 박스는 마우스 엑손을 나타내며, 흰색의 사선 줄무늬 박스는 마우스 C9orf72 유전자좌의 비암호화 마우스 엑손을 나타낸다. 가로 줄무늬 박스는 인간 C9orf72 유전자좌의 의 비암호화 엑손이며, 다이아몬드 박스는 뉴클레오티드 반복을 나타낸다. 서열번호 2로서 제시된 서열을 포함하는 제1 표적화 벡터 및 서열번호 4로서 제시된 서열을 포함하는 제2 표적화 벡터가 생성되었다. 제1 표적화 벡터는 5'에서 3'까지 다음을 포함한다: 3110043021Rik 유전자인 마우스의 RP23-434N2로부터 89 Kb 상류에 있고, 서열번호 6을 포함하는 마우스 상동 아암; 서열번호 8로서 제시된 인간 서열로서, 헥사뉴클레오티드 서열 GGGGCC의 3개의 반복을 함유하는 개재 인트론(intervening intron)을 포함하고 인간 C9orf72의 비암호화 엑손 1a 및 1b에 걸쳐 있는, 인간 서열; 인간 유비퀴틴 1 유전자(hUb1) 및 네오마이신 포스포트랜스페라제(phosphotransferase) 내성 유전자(neo-r)에 작동 가능하게 연결되고 loxP 부위가 측면에 위치하는 박테리아 Em7 유전자 유래의 프로모터를 포함하는 약물 선택 카세트; 및 3110043021Rik 유전자인 마우스의 RP23-434N2로부터 86 Kb 상류에 있고, 서열번호 7을 포함하는 마우스 상동 아암. 제2 표적화 벡터는 5'에서 3'까지 다음을 포함한다: 3110043021Rik 유전자인 마우스의 RP23-434N2로부터 89 Kb 상류에 있고, 서열번호 6을 포함하는 마우스 상동 아암; 서열번호 9로서 제시된 인간 서열로서, 헥사뉴클레오티드 서열 GGGGCC의 100개의 반복을 함유하는 개재 인트론을 포함하고 인간 C9orf72의 비암호화 엑손 1a 및 1b에 걸쳐 있는, 인간 서열; 인간 유비퀴틴 1 유전자(hUb1) 및 네오마이신 포스포트랜스페라제 내성 유전자(neo-r)에 작동 가능하게 연결되고 loxP 부위가 측면에 위치하는 박테리아 Em7 유전자 유래의 프로모터를 포함하는 약물 선택 카세트; 및 3110043021Rik 유전자인 마우스의 RP23-434N2로부터 86 Kb 상류에 있고, 서열번호 7을 포함하는 마우스 상동 아암. 제1 또는 제2 표적화 벡터와의 상동성 재조합 시, 마우스 3110043021Rik의 엑손 1의 일부 및 인트론 1의 일부를 포함하는 약 853 bp의 마우스 게놈 영역은, 인간 C9orf72 비-암호화 서열의 엑손 1a~1b에 걸친 게놈 서열을 포함하는 서열과 대체된다. 약물 내성 카세트의 절제 전후의, 생성된 변형된 마우스 C9orf72 - HRE ₃ 유전자좌가 도 1b에 도시되어 있다. 약물 내성 카세트의 절제 전후의, 생성된 변형된 마우스 C9orf72 - HRE ₁₀₀ 유전자좌가 도 1c에 도시되어 있다. 도 1b 및 1c에서, 쥣과 비암호화 영역은 사선 줄무늬 박스로 표시되고, 인간 비암호화 엑손은 가로 줄무늬 박스로 표시되며, 마우스 코딩 엑손은 흰색 박스로 표시된다. 또한, 도 1b 및 도 1c의 상부 패널에는 서던 블롯(Southern blot) 분석에 사용된 프로브의 대략적인 위치(수직 백색 사각형)가 도시되어 있다(서열번호 29).
도 2a에는, 대조군 ES 세포 클론으로부터 단리되었거나; 헥사뉴클레오티드 서열(8026)의 3개의 반복을 포함하는 이종 반복 확장 서열을 포함하는 표적화 벡터로 표적화된, 약물 카세트 절제 후의 ES 세포 클론(8027 A~C4)으로부터 단리되었거나; 헥사뉴클레오티드 서열(8028)의 100개의 반복을 포함하는 이종 반복 확장 서열을 포함하는 표적화 벡터로 표적화된, 약물 카세트 절제 후의 ES 세포 클론(8029 A-A3, 8029 A-A6, 8029 B-A4, 8029 B-A10)으로부터 단리된 게놈 DNA의 서던 블롯 분석의 결과가 도시되어 있다. 도 2b는 3개의 헥사뉴클레오티드 반복 확장 서열을 함유하는 인간 샘플로부터 수득한 대조군 ES 세포 클론, 8027 A-C4 클론, 8029 A-A3 클론, 8029 A-A6 클론, 8029 B-A4 클론, 8029 B-A10 클론, 및 대조군(n=7)을 포함하는 샘플(n=6)의 유전자형 분석의 결과를 도시한다.
도 3은 인간화된 C9orf72 - HRex (x = 1임), 인간화된 영역, 및 야생형(WT) C9orf72 마우스 유전자좌의 개략도(축척에 비례하지는 않음)를 도시한다. 또한, 도 3에는, 변형된 C9orf72 - HRE 유전자좌(A, B, G, H) 또는 변형된 및 야생형 C9orf72 유전자좌(D) 모두로부터의 유전자 발현 산물?k 정량화하기 위해, 표 1에 기술된 TAQMAN® 정성 PCR 분석 A, B, G, H, 및 D에 사용된 5'- 및 3'- 프라이머(흰색 화살표) 및 프로브(단색 직사각형)의 대략적인 위치가 도시되어 있다. 도 3에서, 쥣과 비암호화 영역은 사선 줄무늬 박스로 표시되고, 인간 비암호화 엑손은 가로 줄무늬 박스로 표시되며, 마우스 코딩 엑손은 흰색 박스로 표시된다. 도 3에 도시되고 표 1에 기술된, 프라이머 및 프로브에 대한 서열이 표 5에 제공된다.

도 4는 (도 3에 도시된 TAQMAN® 정성 PCR 검정 A, B, G 및 H에 의해 결정된 바와 같은) C9ofr72 유전자좌의 발현 수준을 야생형 C9orf72 유전자좌(대조군)에 대해 이형접합체(Het)이거나 동형접합체(Homo)인 배아 줄기 세포 유래의 운동 뉴런(ESMN), 총 뇌조직, 또는 모체 배아 줄기(ES) 세포별로 나타내거나, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개의 반복을 포함하는 변형된 C9orf72 유전자좌에 대해 이형접합체인 ESMN, 뇌, 또는 부모 ESC 각각에 비해, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(3x), 30개(30x), 또는 92개(92x)의 반복을 포함하는 변형된 C9orf72 유전자좌별로 나타내는 막대 그래프를 제공한다. 모든 ESMN 및 부모 ES 세포는 변형된 C9orf72 유전자좌에 대해 이형접합체였고, 모든 대조군은 야생형 C9orf72 유전자좌에 대해 동형접합체였다. 도 5a~5c는 (도 3에 도시된 바와 같이, TAQMAN® 정성 PCR 검정 A(도 5a), 검정 B(도 5b), 또는 검정 D(도 5c)에 의해 검출된) C9orf72 유전자 산물의 계수 값 차이(△ct; y축)를, 야생형 C9orf72 유전자좌(대조군)에 대해 이형접합체(het)이거나 동형접합체(homo)인 배아 줄기 세포 유래 운동 뉴런(ESMN), 총 마우스 뇌, 또는 부모 배아 줄기(ES) 세포별로 나타내거나, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(3x), 30개(30x) 또는 92개(92x)의 반복을 포함하는 변형된 C9orf72 유전자좌별로 나타내며, GAPDH 유전자 산물의 계수 값을 나타내는 막대 그래프를 제공한다. 모든 ESMN 및 부모 ES 세포는 변형된 C9orf72 유전자좌에 대해 이형접합체였고, 모든 대조군은 야생형 C9orf72 유전자좌에 대해 동형접합체였다.
도 6은 야생형 C9orf72 유전자좌, 또는 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(3x) 또는 92개(92x)의 반복을 포함하는 변형된 c9orf72 유전자좌에 대해 이형접합체(het)이거나 동형접합체(homo)인 마우스의 피질, 뇌간, 잔여(rem) 뇌, 척수, 근육, 간, 심장, 또는 신장으로부터 단리한 조직에서 (도 3에 도시된 바와 같이 TAQMAN® 정성 PCR 검정 B에 의해 검출된) C9orf72 유전자 산물의 계수 값 차이(△ct; y축), 및 β2-마이크로글로불린(B2M) 유전자 산물의 계수 값을 나타내는 막대 그래프를 제공한다.
도 7은 야생형 C9orf72 유전자좌(CTRL)에 대해 동형접합체이거나, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(G₄C₂3x), 30개(G₄C₂30x) 또는 92개(G₄C₂92x)의 반복을 포함하는 변형된 C9orf72 유전자좌에 대해 이형접합체인 배아 줄기 세포 유래의 운동 뉴런(ESMN)의 용해물을 환원 SDS-PAGE 분석한 웨스턴 블롯 이미지(상단), 항-C9orf72 항체로 블롯팅한 이미지(상단) 또는 항-GAPDH 항체로 블롯팅한 이미지(하단)을 나타낸다. 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개의 반복을 포함하는 변형된 C9orf72 유전자좌에 대해 이형접합체인 C9orf72 또는 ESMN의 단백질 수준까지 정규화된 이들 샘플의 C9orf72의 단백질 수준에 대한 막대 그래프(하단 패널)도 분자량 마커로서 제공된다.
도 8은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(G₄C₂3x) 또는 92개(G₄C₂92x)의 반복을 포함하는 변형된 C9orf72 유전자좌에 대해 이형접합체인 배아 줄기 세포 유래의 운동 뉴런(ESMN)의 용해물을 환원 SDS-PAGE 분석한 웨스턴 블롯 이미지(상단)을 나타낸다. 0 μg, 1.25 μg, 2.5 μg, 5 μg, 또는 10 μg의 총 단백질을 함유하는 용해물을 항-C9orf72 항체로 블롯팅하거나(도시) 항-GAPDH 항체로 블롯팅한다(데이터 미도시). GAPDH의 단백질 수준까지 정규화된 이들 샘플의 C9orf72의 단백질 수준을 이들 샘플별로 나타낸 막대 그래프(하단)도 분자량 마커로서 제공된다.
도 9a 및 도 9b는 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(C9orf72 G₄C₂ 3x), 30개(C9orf72 G₄C₂ 30x) 또는 92개(C9orf72 G₄C₂ 92x)의 반복을 포함하도록 변형되고, DNA 프로브(도 9a) 또는 LNA 프로브(도 9b)로 염색된 C9orf72 유전자좌에 대해 이형접합체인 배아 줄기 세포 유래의 운동 뉴런(ESMN)의 형광 인시츄 혼성화(FISH)로부터 수득된 이미지이며, 이들 이미지는 서열번호 1로서 제시된 헥사뉴클레오티드 반복 서열의 센스 전사물(도 9a) 또는 안티센스 전사물(도 9b)의 핵 및 세포질의 ESMN 내 위치를 보여준다. 화살표는 예시적인 염색된 RNA 병소를 가리킨다.
도 10은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개(C9orf72 G₄C₂ 3x) 또는 92개(C9orf72 G₄C₂ 92x)의 반복을 포함하도록 변형된 C9orf72 유전자좌에 대해 이형접합체인 배아 줄기 세포 유래의 운동 뉴런(ESMN)의 면역형광분석으로부터 수득된 이미지를 제공하며, 상기 이미지는 서열번호 1로서 제시된 헥사뉴클레오티드 반복 서열의 전사물로부터 (RAN 전사, 비-AUG-메커니즘에을 통해) 번역된 디펩티드 반복 단백질(폴리GA)의 핵의 ESMN 내 위치를 보여준다. 화살표는 예시적인 염색된 폴리GA 디펩티드 반복 단백질을 가리킨다.
도 11은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 약 92개의 반복을 포함하는 이종 (인간) 헥사뉴클레오티드 반복 확장을 포함하는 마우스 C9ORF72 유전자좌의 약 1300 bp에 대한 개략도를 도시하는데(축적에 비례하지 않음), 이는 확장 서열의 결실시키기 위한 CRISPR/Cas 시스템을 생성하기 위한 기준 서열로서 사용될 수 있다. 또한, 도 11에는 (1) 하향 화살표로 도시된 헥사뉴클레오티드 서열의 92개의 반복의 대략적인 위치, (2) 서열번호 38, 서열번호 39, 및 서열번호 40으로서 제시된 서열을 각각 포함하는 gRNA에 의해 표적화될 수 있는 헥사뉴클레오티드 반복 확장 서열 상류의 3개 부위의 시작 위치(190, 196 및 274), (3) 서열번호 41, 서열번호 42, 서열번호 43 및 서열번호 44로서 제시된 서열을 각각 포함하는 gRNA에 의해 표적화될 수 있는 헥사뉴클레오티드 반복 확장 서열 하류의 4개 부위의 시작 위치(899, 905 1006 및 1068), 및 (4) 선택된 세포 클론에서 결실을 확인하는 데 사용될 수 있는 순방향 (F-) 프라이머 및 역방향 (R-) 프라이머에 대한 대략적인 위치가 도시되어 있다. 도 11에 도시된 기준 서열의 핵산 서열은 서열번호 45로서 제시된다.
도 12는 CRISP/Cas 시스템에서 사용될 수 있는 예시적인 10,718 bp 발현 작제물을 도시한다. 발현 작제물은 N-말단 핵 국재화 신호(NLS) 및 C-말단 핵 국재화 신호와 융합된 마우스 Cas9 단백질인 "마우스 opt Cas9"를 암호화하는 핵산을 포함하며, 융합 단백질의 발현은 CAGG 프로모터에 의해 조절된다. 핵산의 상류에는 코작 서열이 있고, 핵산의 하류에는 소 성장 호르몬 폴리아데닐화(bGHPa) 꼬리가 있다. 또한, SV40 폴리아데닐화(SV40 폴리A) 꼬리에 작동 가능하게 연결된 퓨로마이신 내성 유전자와 융합된 녹색 형광 단백질(GFP)을 암호화하는 뉴클레오티드 서열을 발현시키는 EF1 프로모터, 복제 기원 부위(pMB1), 및 암피실린(Amp) 내성을 제공하는 β 락타마아제 유전자가 발현 작제물의 일부분으로서 도시되어 있다. 발현 작제물은 U6 프로모터와 종결 신호 사이에서 gRNA, 예를 들어 crRNA를 암호화하는 DNA의 삽입을 허용한다. 도 4에 도시된 발현 작제물은, U6 프로모터의 하류 및 종결 신호의 상류에, tracrRNA 암호화 서열을 추가로 포함할 수 있다. 이러한 tracrRNA 암호화 서열은, 삽입 시, 예를 들어 crRNA에 작동 가능하게 연결될 수 있도록 배치된다. 일부 구현예에서, tracrRNA 암호화 서열은
GTTGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC (서열번호 63); GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC (서열번호 64);
GTTTAAGAGCTATGCTGGAAACAGCATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC (서열번호 65), 또는 이들의 일부를 포함한다.

정의

본 발명은 본원에 기술된 특정한 방법 및 실험 조건으로 제한되지 않는데, 이러한 방법 및 조건이 다양할 수 있기 때문이다. 또한 본 발명의 범주는 청구범위에 의해 정의되기 때문에 본원에서 사용된 용어는 단지 특정한 구현예를 설명하기 위한 것으로 제한하고자 하는 의도가 아닌 것으로 이해된다.

다르게 정의되지 않는 한, 본원에 사용된 모든 용어 및 어구는 용어 및 어구가 사용된 문맥으로부터 반대인 것이 명확하거나 확실하게 지시되지 않는 한 그러한 용어 및 어구가 당업계에서 달성하는 의미를 포함한다. 본원에 기술된 것과 동등하거나 유사한 임의의 방법 및 물질이 본 발명을 실행하거나 시험하기 위해 사용될 수 있지만, 특정한 방법 및 물질이 지금부터 기술된다. 본원에 언급된 모든 간행물은 참조로서 본원에 포함된다.

"투여(administration )"는 조성물을 대상물 또는 시스템(예: 세포, 기관, 조직, 유기체, 또는 이들의 관련 구성 요소나 구성 요소의 집합)에 투여하는 것을 포함한다. 당업자라면 투여 경로가 예를 들어, 조성물이 투여되고 있는 대상 또는 시스템, 조성물의 성질, 투여 목적 등에 따라 달라질 수 있음을 이해해야 할 것이다. 예를 들어, 특정 구현예들에서, 동물 대상 (예를 들어, 사람 또는 설치류)에 대한 투여는 기관지 (기관지 점적을 포함함), 협측, 장내, 진피간, 동맥내, 진피내, 위내, 골수내, 근육내, 비강내, 복강내, 척수강내, 정맥내, 뇌실내, 점막, 비강, 경구, 직장, 피하, 설하, 국소, 기관 (기관내 점적을 포함함), 경피, 질 및/또는 유리체강내일 수도 있다. 일부 구현예에서, 투여는 간헐적 투약을 포함할 수 있다. 일부 구현예에서, 투여는 적어도 선택된 기간 동안 연속 투약 (예, 관류)을 포함할 수 있다.

"완화(amelioration )"는 상태의 예방, 경감 또는 일시적 완화, 또는 대상물의 상태의 개선을 포함한다. 완화는 질환, 장애 또는 병태(예: 방사선 장해)의 완전한 회복 또는 완전한 예방을 요구하는 것은 아니다.

"대략(approximately )"은, 하나 이상의 관심 값에 대해 적용된 바와 같이, 명시된 기준 값과 유사한 값까지를 포함한다. 특정한 구현예에서, "대략" 또는 "약" 이라는 용어는 다르게 진술되거나 문맥으로부터 명백하지 않는 한 진술된 참조 값의 양 방향(초과 또는 미만)으로 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%,6%, 5%, 4%, 3%, 2%, 1%, 이하 이내의 다양한 값을 지칭한다(이러한 수치가 가능한 값의 100%를 초과할 수 있는 경우는 제외).

"생물학적 활성(biological active )"은 생물학적 시스템 내, 시험관 내(in vitro) 또는 생체 내(in vivo; 예를 들어, 유기체 내)에서 활성을 가지는 임의의 제제의 특성을 포함한다. 예를 들어, 유기체 내에 존재할 때, 유기체 내에서 생물학적 효과를 갖는 제제는 생물학적으로 활성인 것으로 간주된다. 단백질 또는 폴리펩티드가 생물학적으로 활성인 특정한 구현예에서, 단백질 또는 폴리펩티드의 적어도 하나의 생물학적 활성을 공유하는 단백질 또는 폴리펩티드의 부분은 통상적으로 "생물학적 활성" 부위로서 지칭된다.

"필적할 만한(comparable )"은 서로 동일하지 않을 수 있지만, 이들 사이의 비교가 가능할 만큼 충분히 유사하여, 관찰된 차이점 또는 유사점에 기초하여 합리적으로 결론을 도출할 수 있는 둘 이상의 제제, 개체, 상황, 조건의 집합 등을 포함한다. 당업자는, 문맥 내에서 둘 이상의 이러한 제제, 개체, 상황, 조건의 집합 등에 대하여 임의의 주어진 상황에서 필적할 만한 것으로 간주되는데 어떠한 정도의 동일성이 필요한지를 이해할 것이다.

"보존적(conservative )"은, 보존적 아미노산 치원을 기술하는 경우에, 유사한 화학적 성질(예: 전하 또는 소수성)을 갖는 측쇄 R기를 갖는 다른 아미노산 잔기에 의한 아미노산 잔기의 치환을 포함한다. 일반적으로, 보존적 아미노산 치환은 관심 단백질의 기능적 성질, 예를 들어, 리간드에 결합하는 수용체의 능력을 실질적으로 변화시키지 않을 것이다. 유사한 화학적 성질을 갖는 측쇄를 갖는 아미노산의 군의 예는 다음을 포함한다: 지방족 측쇄, 예를 들어, 글리신, 알라닌, 발린, 류신, 및 이소류신; 지방족-하이드록실 측쇄, 예를 들어 세린 및 트레오닌; 아미드 함유 측쇄, 예를 들어, 아스파라긴 및 글루타민; 방향족 측쇄, 예를 들어, 페닐알라닌, 티로신, 및 트립토판; 염기성 측쇄, 예를 들어, 라이신, 아르기닌, 및 히스티딘; 산성 측쇄, 예를 들어, 아스파르트산 및 글루탐산; 및, 황 함유 측쇄, 예를 들어, 시스테인 및 메티오닌. 보존적 아미노산 치환기는, 예를 들어, 발린/류신/이소류신, 페닐알라닌/티로신, 라이신/아르기닌, 알라닌/발린, 글루타메이트/아스파르테이트, 및 아스파라긴/글루타민을 포함한다. 일부 구현예에서, 보존적 아미노산 치환은, 예를 들어, 알라닌 스캐닝 돌연변이 유발에서 사용된 바와 같은 알라닌을 갖는 단백질 내 임의의 원래의 잔기의 치환일수 있다. 일부 구현예에서, Gonnet, G.H. 외의 1992, Science 256:1443-1445에 개시된 PAM250 로그 우도 매트릭스(log-likelihood matrix)에서 양의 값을 갖는 보존적 치환이 이루어진다. 일부 구현예에서, 치환은 적당한 보존적 치환인데, 이러한 치환은 PAM250 로그 우도 매트릭스에서 음이 아닌 값을 가진다.

"대조군(control )"은 결과를 비교하는 표준이 되는 "대조군"으로서 당업계에서 이해되는 의미를 포함한다. 통상적으로, 대조군은 변수들에 대한 결론을 내리기 위해 변수들을 분리하여 실험의 완전성을 높이기 위해 사용된다. 일부 구현예에서, 대조군은 비교자를 제공하기 위해 시험 반응 또는 검정과 동시에 수행되는 반응 또는 검정이다. "대조군"에는 "대조군 동물"도 포함된다. "대조군 동물"은 본원에 설명된 변형, 본원에 설명된 것과는 다른 변형을 가지거나 변형을 가지지 않을 수 있다(즉, 야생형 동물). 하나의 실험에서, "시험"(즉, 시험 중인 변수)이 적용된다. 제2 실험에서, "대조군," 시험 중인 변수가 적용되지 않는다. 일부 구현예에서, 대조군은 과거의 대조군(즉, 이전에 수행된 시험 또는 분석의 대조군, 또는 이전에 알려진 양 또는 결과)이다. 일부 구현예에서, 대조군은 인쇄되거나 달리 저장된 기록이거나 이를 포함한다. 대조군은 양성 대조군 또는 음성 대조군일 수 있다.

"파괴(disruption )"는 DNA 분자(예를 들어, 유전자 또는 유전자 유전좌위와 같은 내인성 상동성 서열)를 이용한 상동성 재조합 사건의 결과를 포함한다. 일부 구현예에서, 파괴는 DNA 서열(들)의 삽입, 결실, 치환, 대체, 과오 돌연변이 또는 틀 이동 또는 이들의 임의의 조합을 달성하거나 나타낼 수 있다. 삽입은 전체 유전자 또는 유전자의 단편, 예를 들어, 내인성 서열(예: 이종 서열) 이외의 기원일 수 있는 엑손의 삽입을 포함할 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물(예를 들어, 유전자에 의해 암호화된 단백질)의 발현 및/또는 활성을 증가시킬수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 발현 및/또는 활성을 감소시킬 수 있다. 일부 구현예에서, 파괴는 유전자의 서열 또는 암호화된 유전자 산물(예를 들어, 암호화된 단백질)을 바꿀 수 있다. 일부 구현예에서, 파괴는 유전자 또는 암호화된 유전자 산물(예를 들어, 암호화된 단백질)을 절단하거나 단편화할 수 있다. 일부 구현예에서, 파괴는 유전자 또는 암호화된 유전자 산물을 확장할 수 있다. 일부 이러한 구현예에서, 파괴는 융합 단백질의 조립을 달성할 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 수준에 영향을 미칠 수 있지만 활성에는 영향을 미치지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 활성에는 영향을 미칠 수 있지만 수준에는 영향을 미치지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 수준에 유의한 효과를 가지지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 활성에 유의한 효과를 가지지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 수준 또는 활성 유의한 효과를 가지지 않을 수 있다.

"결정(determination)" , "측정(measuring)" , "확인(evaluating)" , "평가(assessing)" , "검정(assaying)" 및 "분석(analyzing)" 은 임의의 형태의 측정을 포함하며, 요소의 존재 여부를 알아내는 것을 포함한다. 이들 용어는 정량적 및/또는 정성적 결정을 포함한다. 검증은 상대적이거나 절대적일 수 있다. "존재에 대한 검정(assaying for the presence of)"은 존재하는 어떤 것의 양을 결정하는 것 및/또는 존재 여부를 결정하는 것일 수 있다.

"내인성 유전자좌 (endogenous locus)" 또는 내인성 유전자("endogenous gene") 는 본원에 기술된 바와 같은 손상, 결실, 대체, 변경, 또는 변형의 도입 전에 부모 유기체 또는 기준 유기체에서 발견된 유전자좌를 지칭한다. 일부 구현예에서, 내인성 유전자좌는 자연계에서 발견되는 서열을 가진다. 일부 구현예에서, 내인성 유전자좌는 야생형 유전자좌이다. 일부 구현예에서, 기준 유기체는 야생형 유기체이다. 일부 구현예에서, 기준 유기체는 조작된 유기체이다. 일부 구현예에서, 기준 유기체는 (야생형이거나 조작된 것인지를 불문하고) 실험실에서 배양된 유기체이다.

"내인성 프로모터(endogenous promoter)" 는, 예를 들어, 야생형 유기체에서, 내인성 유전자와 자연적으로 연관되는 프로모터를 포함한다.

"유전자(gene)" 는 산물(예: RNA 산물 및/또는 폴리펩티드 산물)에 대해 코딩하는 염색체 내의 DNA 서열을 포함한다. 일부 구현예에서, 유전자는 암호화 서열(즉, 특정 생성물을 암호화하는 서열)을 포함한다. 일부 구현예에서, 유전자는 비암호화 서열을 포함한다. 일부 특정 구현예에서, 유전자는 암호화(예: 엑손) 서열과 비암호화(인토론) 서열 모두를 포함할 수 있다. 일부 구현예에서, 유전자는 하나 이상의 조절 서열(예를 들어, 프로모터, 증강자 등) 및/또는, 예를 들어, 유전자 발현의 하나 이상의 측면(예: 세포 유형 특이적 발현, 유도 발현 등)를 조절하거나 영향을 줄 수 있는 인트론 서열을 포함할 수 있다. 명료성을 위해, 본원에 사용되는 바와 같이, 용어 "유전자"는 일반적으로 폴리펩티드를 암호화하는 핵산의 일부를 지칭하고; 문맥으로부터 당업자에게 명백해지는 바와 같이, 조절 서열을 선택적으로 포함할 수 있음을 주목한다. 이러한 정의는 비단백질 코딩 발현 단위에 대한 용어 "유전자"의 적용을 배제하고자 하는 것이 아니며, 오히려, 대부분의 경우에, 본 문서에서 사용된 바와 같이 상기 용어가 폴리펩티드 코딩 핵산을 지칭한다는 것을 명확히 하고자 하는 것이다.

"이종( heterologous )" 은 상이한 근원으로부터의 제제 또는 엔티티를 포함한다. 예를 들어, 특정 세포 또는 유기체 내에 존재하는 폴리펩티드, 핵산 서열, 유전자, 또는 유전자 산물과 관련하여 사용될 때, 상기 용어는 관련된 폴리펩티드, 핵산 서열, 유전자, 또는 유전자 산물이: 1) 사람의 손에 의해 조작되었고; 2) 사람의 손에 의해(예를 들어, 유전자 조작에 의해) 세포 또는 유기체(또는 이의 전구체)에 도입되었고/도입되었거나; 3) 관련 세포 또는 유기체(예를 들어, 관련 세포 유형 또는 유기체 유형) 내에 존재하거나 이에 의해 자연적으로 생산되지 않는다는 것을 명확하게 한다. 또한, "이종"은 특정 천연 세포나 유기체에 정상적으로 존재하지만, 예를 들어, 비자연적으로 결합된 요소 및, 일부 구현예에서는, 비내인성 조절 요소(예: 프로모터)의 조절 하에 돌연변이나 삽입에 의해 변형된 폴리펩티드, 핵산 서열, 유전자 또는 유전자 산물을 포함한다.

"숙주 세포(host cell)" 는 핵산 또는 단백질이 도입된 세포를 지칭한다. 본 개시를 읽는 당업자는 이러한 용어가 특정한 대상 세포를 언급하는것 뿐 아니라 이러한 세포의 자손을 언급하기 위해 사용된다는 것을 이해할 것이다. 돌연변이 또는 환경적 영향에 의해 다음 세대에서 특정 변형이 발생할 수 있기 때문에, 이러한 자손은 모세포와 사실 상 동일하지 않을 수 있지만, "숙주 세포"라는 용어의 범주 내에 여전히 포함된다. 일부 구현예에서, 숙주 세포는 원핵 또는 진핵 세포이거나 이를 포함한다. 일반적으로, 숙주 세포는 세포가 지정된 계(Kingdom of life)에 관계없이 이종 핵산 또는 단백질을 수여받고/받거나 생산하기에 적합한 임의의 세포이다. 예시적인 세포는 원핵세포 및 진핵세포(단세포 또는 다세포), 박테리아 세포(예를 들어, 에스케리치아 콜리(Escherichia coli), 바실러스(Bacillus) 종, 스트렙토미세스(Streptomyces) 종 등), 마이코박테리아 세포, 진균 세포, 효모 세포(예를 들어, 사카로미세스 세레비시애(Saccharomyces cerevisiae), 쉬조사카로미세스 폼베(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris), 피치아 메타놀리카(Pichia methanolica) 등), 식물 세포, 곤충 세포(예를 들어, SF-9, SF-21, 배큘로바이러스에 감염된 곤충 세포, Trichoplusia ni 등), 비인간 동물 세포, 인간 세포, 또는 세포 융합물, 예를 들어, 하이브리도마 또는 쿼드로마(quadroma)를 포함한다. 일부 구현예에서, 세포는 인간, 원숭이, 유인원, 햄스터, 랫트, 또는 마우스 세포이다. 일부 구현예에서, 세포는 진핵세포이고, 다음의 세포로부터 선택된다: CHO(예를 들어, CHOK1, DXB-11 CHO, Veggie-CHO), COS(예를 들어, COS-7), 망막 세포, Vero, CV1, 신장(예를 들어, HEK293, 293 EBNA, MSR 293, MDCK, HaK, BHK), HeLa, HepG2, WI38, MRC 5, Colo205, HB 8065, HL-60(예를 들어, BHK21), Jurkat, Daudi, A431(상피), CV-1, U937, 3T3, L 세포, C127세포, SP2/0, NS-0, MMT 060562, Sertoli 세포, BRL 3A 세포, HT1080 세포, 골수종 세포, 종양 세포, 및 전술된 세포로부터 유래한 세포주. 일부 구현예에서, 세포는 하나 이상의 바이러스 유전자, 예를 들어, 바이러스 유전자를 발현하는 망막 세포(예를 들어, PER.C6® 세포)를 포함한다. 일부 구현예에서, 숙주 세포는 단리된 세포이거나 이를 포함한다. 일부 구현예에서, 숙주 세포는 조직의 일부이다. 일부 구현예에서, 숙주 세포는 유기체의 일부이다.

"동일성(identity)" 은, 서열의 비교와 관련하여 사용될 때, 뉴클레오티드 및/또는 아미노산 서열 동일성을 측정하기 위해 사용될 수 있는 당업계에 알려진 다수의 상이한 알고리즘에 의해 결정되는 동일성을 포함한다. 일부 구현예에서, 본원에 설명된 동일성은 10.0의 오픈 갭 패널티, 0.1의 연장갭 패널티를 채용한 ClustalW v. 1.83 (slow) 정렬 및 Gonnet 유사성 매트릭스(MACVECTOR?? 10.0.2, MacVECTOR Inc., 2008)를 사용하여 결정된다.

"개선(improvement)" , "증가(increase)" , "제거(eliminate)" , 또는 " 감소(reduce)" 는 본원에 기술된 치료 개시 전의 동일한 개체(또는 동물)에서의 측정 값, 또는 본원에 기술된 처리의 부재 시 대조 개체(또는 동물) 또는 다중 대조 개체(또는 동물)에서의 측정 값과 같은, 베이스라인 측정 값에 상대적인 표시 값을 포함한다.

" 단리된 (isolated)" 은, (1) 초기에 (자연에서 및/또는 실험실 환경에서) 생산될 때 연관되었던 성분의 적어도 일부로부터 분리되었고/되었거나, (2) 사람의 손에 의해 설계되었고/되었거나, 생산되었고/되었거나, 제작되었고/되었거나, 제조된 물질 및/또는 엔티티를 포함한다. 단리된 물질 및/또는 개체는 초기에 연관되었던 다른 성분의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99%보다 더 많은 부분으로부터 분리될 수 있다. 일부 구현예에서, 단리된 제제는 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99%보다 더 많이 순수하다. 일부 구현예에서, 실질적으로 다른 성분이 없는 경우에 물질은 순수("pure")하다. 일부 구현예에서, 당업자에게 이해되는 바와 같이, 물질은, 예를 들어, 하나 이상의 담체 또는 부형제(예를 들어, 완충액, 용매, 물 등)와 같은 어떤 다른 성분과 조합된 후에도 여전히 "단리"되거나 심지어"순수"한 것으로 간주될 수 있는데; 이러한 구현예에서, 물질의 단리 또는 순도 백분율은 이러한 담체 또는 부형제를 포함하지 않고 계산된다. 하나의 예를 들자면, 일부 구현예에서, 자연에서 발생하는 폴리펩티드 또는 폴리뉴클레오티드와 같은 생물학적 폴리머는: a) 파생의 기원 또는 근원으로 인해 자연계에서의 원래의 상태에서 동반되는 일부 또는 전체 성분과 연관되어 있는 경우; b) 자연에서 이를 생산하는 종과 동일한 종의 다른 폴리펩티드 또는 핵산이 실질적으로 없는 경우; 또는 c) 자연에서 이를 생산하는 종의 것이 아닌 세포 또는 다른 발현 시스템의 성분에 의해 발현되거나 아니면 이와 연관되어 있는 경우에 "단리된" 것으로 간주된다. 따라서, 예를 들어, 일부 구현예에서, 화학적으로 합성되거나 자연에서 폴리펩티드를 생산하는 세포 시스템과 상이한 세포 시스템에서 합성된 폴리펩티드는 "단리된" 폴리펩티드로 간주된다. 대안적으로 또는 추가적으로, 일부 구현예에서, 하나 이상의 정제 기술을 거친 폴리펩티드는, a) 상기 폴리펩티드가 자연에서 연관되어 있는 성분; 및/또는 b) 상기 폴리펩티드가 초기에 생산될때 연관되었던 다른 성분으로부터 분리된 정도까지 "단리된" 폴리펩티드로 간주될 수 있다.

" 유전자좌 (locus 또는 loci )"는, 유전자(또는 유의 서열), DNA 서열, 폴리펩티드 암호화 서열의 특정한 위치(들), 또는 유기체 게놈의 염색체 상의 위치를 포함한다. 예를 들어, "C9ORF72 유전자좌"는 C9ORF72 유전자, C9ORF72 DNA 서열, C9ORF72 암호화 서열의 특정한 위치, 또는 이러한 서열이 상주하는 것으로 확인된, 유기체 게놈의 염색체 상에서 C9ORF72 위치를 지칭하는 것일 수 있다. "C9ORF72 유전자좌"는 증강자, 프로모터, 5' 및/또는 3' UTR, 또는 이들의 조합을 포함하되 이들로 한정되지 않는 C9ORF72 유전자의 조절 요소를 포함할 수 있다. 당업자는 일부 구현예에서 염색체가 수백 또는 수천 개의 유전자를 포함할 수 있고, 상이한 종 간을 비교할 때 유사한 유전자좌가 물리적으로 동일 위치에 존재함을 입증할 수 있다는 것을 이해할 것이다. 이러한 유전자좌는 공유 신터니(synteny)를 갖는 것으로 기술될 수 있다.

"비인간 동물(non-human animal)" 은 인간이 아닌 임의의 척추 동물 유기체를 포함한다. 일부 구현예에서, 비인간 동물은 원구류, 경골어, 연골 어류(예를 들어, 상어 또는 가오리), 양서류, 파충류, 포유동물, 및 새이다. 일부 구현예에서, 비인간 포유류는 영장류, 염소, 양, 돼지, 개, 소, 또는 설치류이다. 일부 구현예에서, 비인간 동물은 랫트 또는 마우스와 같은 설치류이다.

"핵산(nucleic acid)" 은 올리고뉴클레오티드 사슬이거나 이에 통합될 수 있는 임의의 화합물 및/또는 물질을 포함한다. 일부 구현예에서, "핵산"은 인산디에스테르 결합을 통해 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 화합물 및/또는 물질이다. 문맥으로부터 명백해지는 바와 같이, 일부 구현예에서, "핵산"은 개별적인 핵산 잔기(예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 의미하고; 일부 구현예에서, "핵산"은 개별적인 핵산 잔기를 포함하는 올리고뉴클레오티드 사슬을 의미한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, "핵산"은 하나 이상의 자연적인 핵산 잔기이거나, 이를 포함하거나, 이로 이루어진다. 일부 구현예에서, "핵산"은 하나 이상의 핵산 유사체이거나 이를 포함하거나 이로 구성된다. 일부 구현예에서, 핵산 유사체는 인산디에스테르 백본(backbone)을 활용하지 않는다는 점에서 "핵산"과 다르다. 예를 들어, 일부 구현예에서, "핵산"은 당업계에 알려져 있고, 백본에서 인산디에스테르 결합(phosphodiester bonds) 대신 펩티드 결합을 가지며, 본 발명의 범주 내에 있는 것으로 간주되는 하나 이상의 "펩티드 핵산(peptide nucleic acid)"이거나, 이를 포함하거나 이로 구성된다. 대안적으로 또는 추가적으로, 일부 구현예에서, "핵산"은 인산디에스테르 결합보다는 하나 이상의 포스포로티오에이트(phosphorothioate) 및/또는 5'-N-포스포라미디트(5'-N-phosphoramidite) 결합을 갖는다. 일부 구현예에서, "핵산"은 하나 이상의 자연적인 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, "핵산"은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데자아데노신, 7-데자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입 염기, 및 이의 조합)이거나, 이를 포함하거나 이로 구성된다. 일부 구현예에서, "핵산"은 천연 핵산의 당에 비해 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, "핵산"은 RNA 또는 단백질과 같은 기능적 유전자 산물을 암호화하는 뉴클레오티드 서열을 가진다. 일부 구현예에서, "핵산"은 하나 이상의 인트론을 포함한다. 일부 구현예에서, "핵산"은 하나 이상의 엑손을 포함한다. 일부 구현예에서, "핵산"은, 천연 공급원으로부터의 단리, 상보성 템플릿에 기초한 중합화에 의한 효소적 합성(생체 내 또는 시험관 내), 재조합 세포 또는 시스템에서의 재현, 및 화학적 합성 중 하나 이상에 의해 제조된다. 일부 구현예에서, "핵산"은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 이상의 잔기 길이이다. 일부 구현예에서, "핵산"은 단일 가닥이고; 일부 구현예에서, "핵산"은 이중 가닥이다. 일부 구현예에서, "핵산"은, 폴리펩티드를 암호화하는 적어도 하나의 요소를 포함하는 뉴클레오티드 서열을 갖거나, 폴리펩티드를 암호화하는 서열의 보체이다. 일부 구현예에서, "핵산"은 효소 활성을 가진다.

"작동 가능하게 연결된(operably linked )"은, 기술된 구성 요소가 의도된 방식으로 기능하는 것을 허용하는 관계에 있는 병치를 포함한다. 코딩 서열에 "작동 가능하게 연결된" 조절 서열은 코딩 서열의 발현이 조절 서열과 호환가능한 조건 하에 달성되도록 연결된다. "작동 가능하게 연결된" 서열은 관심 유전자에 인접한 발현 조절 서열 및 관심 유전자를 조절하기 위해 일정한 거리에서 또는 가로 질러(in trans) 작용하는 발현 조절 서열 둘 다를 포함한다. 용어 "발현 조절 서열(expression control sequence)"은 폴리뉴클레오티드 서열을 포함하는데, 상기 폴리뉴클레오티드 서열은 이들이 연결되는 암호화 서열의 발현 및 가공에 영향을 미치기 위해 필요하다. "발현 조절 서열"은 다음을 포함한다: 적절한 전사 개시, 종결, 프로모터 및 증강자 서열; 스플라이싱 및 폴리아데닌화 신호와 같은 효율적인 RNA 가공 신호; 세포질 mRNA를 안정화하는 서열; 번역 효율을 증진하는 서열; 단백질 안정성을 증진하는 서열(즉, 코작 공통(Kozak consensus) 서열); 및 원하는 경우, 단백질 분비를 증진하는 서열. 이러한 조절 서열의 성질은 숙주 유기체에 따라 다르다. 예를 들어, 원핵생물에서, 이러한 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위, 및 전사 종결 서열을 포함하는 반면, 진핵생물에서, 통상적으로, 이러한 조절 서열은 프로모터 및 전사 종결 서열을 포함한다. "조절 서열(control sequence)"이라는 용어는 존재하는 것이 발현 및 가공에 필수적인 성분을 포함하는 것으로 의도되고, 존재하는 것이 유리한 추가적인 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 포함할 수도 있다.

"표현형(phenotype )"은 세포 또는 유기체에 의해 표시되는 형질, 또는 형질의 분류나 집합까지를 포함한다. 일부 구현예에서, 특정 표현형은 특정 대립유전자 또는 유전자형과 상관될 수 있다. 일부 구현예에서, 표현형은 이산적일 수 있고; 일부 구현예에서, 표현형은 연속적일 수 있다.

"생리학적 조건(physiological conditions )"은 세포 또는 유기체가 생존하고/하거나 재현하는 조건을 지칭하는 당업계에서 이해되는 의미를 포함한다. 일부 구현예에서, 상기 용어는 유기체 또는 세포계에 대해 본질적으로 발생할 수 있는 외부 또는 내부 환경 조건을 포함한다. 일부 구현예에서, 생리학적 조건은 인간 또는 비인간 동물의 체내에 존재하는 이러한 조건, 특히 수술 부위 지점 및/또는 내부에 존재하는 조건이다. 생리학적 조건은 통상적으로, 예를 들어, 20~40℃의 온도 범위, 1의 대기압, pH 6~8, 1~20 mM의 포도당 농도, 대기 수준의 산소 농도, 및 지상에서 마주치게 되는 중력을 포함한다. 일부 구현예에서, 실험실에서의 조건은 생리학적 조건으로 조작되고/되거나 유지된다. 일부 구현예에서, 생리학적 조건은 유기체 상에서 발생한다.

"폴리펩티드(polypeptide )"는 아미노산의 임의의 중합체 사슬을 포함한다. 일부 구현예에서, 폴리펩티드는 자연에서 발생하는 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는 자연에서 발생하지 않는 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는 서로 별개로 자연에서 발생하는 부분(즉, 2종 이상의 상이한 유기체로부터, 예를 들어, 인간 및 비인간 부위)을 함유하는 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는 사람의 손의 작용을 통해 설계되고/되거나 생산된 조작된 아미노산 서열을 가진다.

질환, 장애 및/또는 병태의 발생과 관련된 "방지(prevent )" 또는 "예방(prevention )"은, 질환, 장애 및/또는 병태의 발생 위험을 감소시키는 것 및/또는 질환, 장애 또는 병태의 하나 이상의 특징 또는 증상의 발생을 지연시키는 것까지를 포함한다. 예방은 질병, 장애 또는 병태가 미리 정의된 기간 동안 지연되었을 때 완료된 것으로 간주될 수 있다.

"기준(reference )"은, 관심 제제, 동물, 코호트, 개체, 개체군, 샘플, 서열 또는 값이 비교되는 표준 또는 대조 제제, 동물, 코호트, 개체, 개체군, 샘플, 서열 또는 값을 포함한다. 일부 구현예에서, 기준 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값은 관심있는 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값의 시험 또는 결정과 실질적으로 동시에 시험 및/또는 결정된다. 일부 구현예에서, 기준 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값은, 선택적으로 유형 매체로 구현된, 역사적 기준이다. 일부 구현예에서, 기준은 대조군을 지칭할 수 있다. "기준"은 "기준 동물"도 포함한다. "기준 동물"은 본원에 기술된 변형, 본원에 본원에 기술된 바와 상이한 변형을 가지거나, 변형을 가지지 않을 수 있다(즉, 야생형 동물). 통상적으로, 당업자에 의해 이해될 수 있는 바와 같이, 기준 제제, 동물, 코호트, 개체, 개체군, 샘플, 서열 또는 값은 관심있는 제제, 동물(예를 들어, 포유동물), 코호트, 개체, 개체군, 샘플, 서열 또는 값을 결정하거나 특성화하는 데 사용된 것에 필적할 만한 조건 하에 결정되거나 특성화된다.

"응답(response )"은 치료의 결과로서 또는 치료와 상관되어 일어나는, 대상물의 병태에 있어서 임의의 유익한 변화를 포함한다. 이러한 변화(예를 들어, 치료가 없었다면 일어날 수 있었던 악화를 예방하는 것)는 병태의 안정화, 병태의 증상 완화, 및/또는 병태의 완치에 대한 전망의 개선 등을 포함할 수 있다. 이는 대상물의 반응이나 뉴런의 반응을 지칭하는 것일 수 있다. 뉴런 또는 대상물의 반응은 임상 기준 및 객관적 기준을 포함하는 매우 다양한 기준에 따라 측정될 수 있다. 대상물의 운동계의 검사는 강도(strength), 힘줄 반사(tendon reflexes), 표재 반사(superficial reflexes), 근육량(muscle bulk), 조정력(coordination), 근 긴장(muscle tone), 이상 운동(abnormal movements), 기립(station) 및 보행(gait) 중 하나 이상의 검사를 포함할 수 있다. 반응을 평가하기 위한 기술은 임상 검사, 연신 반사(stretch flex)(근신전 반사(myotatic reflex)), 호프만 반사 및/또는 압력 검사를 포함하되 이들로 한정되지 않는다. 치료에 대한 반응을 평가하기 위한 방법 및 지침은 Brodal, A.: Neurological Anatomy in Relation to Clinical Medicine, ed. 2, New York, Oxford University Press, 1969; Medical Council of the U.K.: Aids to the Examination of the Peripheral Nervous System, Palo Alto, Calif., Pendragon House, 1978; Monrad-Krohn, G.H., Refsum, S.: The Clinical Examination of the Nervous System, ed. 12, London, H.K. Lewis & Co., 1964; 및 Wolf, J.K.: Segmental Neurology, A Guide to the Examination and Interpretation of Sensory and Motor Function, Baltimore, University Park Press, 1981에서 논의된다. 뉴런 및/또는 환자의 군을 비교할 때, 반응 속도를 결정하기 위한 동일하거나 유사한 기준에 기초하여 비교 대상 군이 평가된다는 전제 하에서, 정확한 반응 기준은 임의의 적절한 방식으로 선택될 수 있다. 당업자는 적절한 기준을 선택할 수 있을 것이다.

문맥으로부터 이해될 수 있는 바와 같이, 질환, 장애 및/또는 병태의 "위험(risk )"은 특정 개체가 질병, 장애 및/또는 병태(예를 들어, 방사선 손상)에 걸릴 가능성을 포함한다. 일부 구현예에서, 위험은 백분율로 표현된다. 일부 구현예에서, 위험은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 및 100%까지이다. 일부 구현예에서, 위험은 기준 샘플 또는 기준 샘플의 군과 관련된 위험에 대한 상대적인 위험으로서 표현된다. 일부 구현예에서, 기준 샘플 또는 기준 샘플의 군은 질환, 장애, 병태 및/또는 사건(예: 방사선 손상)의 알려진 위험을 갖는다. 일부 구현예에서, 기준 샘플 또는 기준 샘플의 군은 특정 개체와 비슷한 개체로부터 유래한다. 일부 구현예에서, 상대적 위험은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 이상이다.

"실질적으로(substantially )"는 관심 특성 또는 성질의 전체 또는 거의 전체의 범위 또는 정도를 나타내는 정성적인 조건을 포함한다. 생물학 분야의 당업자는 생물학적 및 화학적 현상이 완료되고/되거나 완료에 이르거나, 절대적인 결과를 달성하거나 피하는 경우는 거의 없다는 것을 이해할 것이다. 따라서, "실질적으로"라는 용어는 많은 생물학적 및 화학적 현상에 내재된 완전성의 잠재적인 결여를 포착하도록 본원에서 사용된다.

"실질적 상동성 (substantial homology )"은 아미노산 또는 핵산 서열간의 비교를 포함한다. 당업자에 의해 이해되는 바와 같이, 2개의 서열이 상응하는 위치에 상동성 잔기를 함유하는 경우, 이들은 "실질적 상동성"인 것으로 일반적으로 간주된다. 상동성 잔기는 동일한 잔기일 수 있다. 대안적으로, 상동성 잔기는 적절하게 유사한 구조적 및/또는 기능적 특성을 갖는 동일하지 않은 잔기일 수 있다. 예를 들어, 당업자에게 잘 알려진 바와 같이, 특정 아미노산은 일반적으로 "소수성(hydrophobic)" 또는 "hydrophilic(친수성)" 아미노산으로서 분류되고/되거나 "극성(polar)" 또는 "비극성(non-polar)" 측쇄를 갖는 것으로서 분류된다. 하나의 아미노산이 동일한 유형의 다른 것으로 치환되는 것은 흔히 "상동성(homologous)" 치환으로 간주될 수 있다. 일반적인 아미노산 분류가 아래에 요약되어 있다.

당업계에서 주지된 바와 같이, 아미노산 또는 핵산 서열은, 뉴클레오티드 서열에 대한 BLASTN 및 아미노산 서열에 대한 BLASTP, 갭 BLAST 및 PSI-BLAST와 같이 상업적 컴퓨터 프로그램에서 사용할 수 있는 것들을 포함하여, 임의의 다양한 알고리즘을 사용하여 비교될 수 있다. 예시적인 이러한 프로그램은 Altschul, S. F. 외, 1990, J. Mol. Biol., 215(3): 403-410; Altschul, S. F. 외, 1997, Methods in Enzymology; Altschul, S. F. 외, 1997, Nucleic Acids Res., 25:3389-3402; Baxevanis, A.D., 및 B. F. F. Ouellette (eds.) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 및 Misener 등의 (eds.) Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1998에 기술되어 있다. 상동성 서열을 확인하는 것 외에도, 전술된 프로그램은 일반적으로 상동성의 정도에 대한 지표를 제공한다. 일부 구현예에서, 2개의 서열의 상응하는 잔기의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상이 잔기의 관련 구간에 걸쳐 상동성인 경우 이들은 실질적으로 상동성인 것으로 간주된다. 일부 구현예에서, 관련 구간은 완전한 서열이다. 일부 구현예에서, 관련 구간은 적어도 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상의 잔기이다. 일부 구현예에서, 관련 구간은 완전한 서열을 따라 인접 잔기를 포함한다. 일부 구현예에서, 관련 구간은 전체 서열을 따라 불연속 잔기, 예를 들면, 폴리펩티드 또는 이의 부분의 접힌 형태에 의해 한데 모인 인접하지 않은 잔기를 포함한다. 일부 구현예에서, 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50개 이상의 잔기이다.

"실질적 동일성(substantial identity )"은 아미노산 또는 핵산 서열간의 비교를 포함한다. 당업자에 의해 이해되는 바와 같이, 2개의 서열이 상응하는 위치에 동일한 잔기를 함유하는 경우, 이들은 "실질적으로 동일한(substantially identical)" 것으로 일반적으로 간주된다. 당업계에서 공지된 바와 같이, 아미노산 또는 핵산 서열은, 뉴클레오티드 서열에 대한 BLASTN 및 아미노산 서열에 대한 BLASTP, 갭 BLAST 및 PSI-BLAST와 같이 상업적 컴퓨터 프로그램에서 사용할 수 있는 것들을 포함하여, 임의의 다양한 알고리즘을 사용하여 비교될 수 있다. 예시적인 이러한 프로그램은 Altschul, S. F. 등의, 1990, J. Mol. Biol., 215(3): 403-410; Altschul, S. F. 등의, 1997, Methods in Enzymology; Altschul, S. F. 등의, 1997, Nucleic Acids Res., 25:3389-3402; Baxevanis, A.D., 및 B. F. F. Ouellette (eds.) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 및 Misener 등의 (eds.) Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1998에 기술되어 있다. 동일한 서열을 확인하는 것 외에도, 전술된 프로그램은 일반적으로 동일성의 정도에 대한 지표를 제공한다. 일부 구현예에서, 2개의 서열의 상응하는 잔기의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상이 잔기의 관련 구간에 걸쳐 동일한 경우 이들은 실질적으로 동일한 것으로 간주된다. 일부 구현예에서, 관련 구간은 완전한 서열이다. 일부 구현예에서, 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50개 이상의 잔기이다.

" 표적화 벡터(targeting vector", " 표적화 작제물 (targeting construct )", 또는 "핵산 작제물 (nucleic acid construct )"은 표적화 영역을 포함하는 폴리뉴클레오티드 분자를 포함한다. 표적화 영역은, 표적 세포, 조직 또는 동물 내 서열과 동일하거나 실질적으로 동일하고 상동성 재조합을 통해 세포, 조직 또는 동물의 게놈 내 위치에 표적화 구조체의 통합을 제공하는 서열을 포함한다. 부위 특이적 재조합효소 인식 부위(예를 들어, loxP 또는 Frt 부위)를 이용하여 표적화하는 표적화 영역도 포함된다. 일부 구현예에서, 본원에 기술된 바와 같은 표적화 작제물은 특정 관심 핵산 서열이나 유전자(예: 리포터 유전자나 상동 유전자 또는 이종 유전자), 선별 마커, 대조군 및/또는 조절 서열, 및 재조합 효소나 재조합유전성 단백질을 암호화하는 다른 핵산 서열을 포함한다. 일부 구현예에서, 표적화 작제물은 관심 유전자를 전체적으로 또는 부분적으로 포함할 수 있으며, 관심 유전자는 내인성 서열에 의해 암호화된 단백질과 유사한 기능을 갖는 폴리펩티드를 전체적으로 또는 부분적으로 암호화한다. 일부 구현예에서, 표적화 구조체는 관심 인간화 유전자를 전체적 또는 부분적으로 포함할 수 있으며, 관심 인간화 유전자는 내인성 서열에 의해 암호화된 단백질과 유사한 기능을 갖는 폴리펩티드를 전체적으로 또는 부분적으로 암호화한다. 일부 구현예에서, 표적화 작제물은 리포터 유전자를 전체적으로 또는 부분적으로 포함할 수 있으며, 리포터 유전자는 당업계에 공지된 기술을 사용해 용이하게 식별되고/되거나 측정되는 폴리펩티드를 암호화한다.

"유전자 이식 동물( transgenic animal )", 유전자 이식 비인간 동물 ( transgenic non-human animal )" 또는 " Tg ⁺ " 는 비인간 동물의 세포 중 하나 이상이 관심 폴리펩티드를 암호화하는 이종 핵산 및/또는 유전자를 전체적으로 또는 부분적으로 함유하는 임의의 비-자연 발생 비인간 동물을 포함한다. 일부 구현예에서, 이종 핵산 및/또는 유전자는 미세주입이나 재조합 바이러스 감염에 의한 것과 같은, 고의적인 유전자 조작에 의해, 전구체 세포에 도입됨으로써 세포 내에 직접 및/또는 간접적으로 도입된다. 용어 유전자 조작은 고전적인 교배 기술을 포함하지 않고, 오히려 재조합 DNA 분자(들)의 도입에 관한 것이다. 이러한 분자는 염색체 내에 통합되거나, 염색체 외에서 DNA를 복제할 수 있다. 용어 "Tg ⁺ "는 이종 핵산 및/또는 유전자에 대해 이형접합성 또는 동형접합성인 동물, 및/또는 이종 핵산 및/또는 유전자의 단일 또는 다중-카피를 갖는 동물을 포함한다.

"치료(treatment , treat 또는 treating )"는, 특정 질환, 장애, 및/또는 병태의 하나 이상의 증상, 특징, 및/또는 원인을 부분적으로 또는 완전히 완화하고/하거나, 개선하고/하거나, 해소하고/하거나, 억제하고/하거나, 발병을 지연시키고/시키거나, 중증도를 감소시키고/시키거나, 유발을 감소시키는 물질(예를 들어, 후보 치료제)의 임의의 투여를 포함한다. 일부 구현예에서, 이러한 치료는 관련 질환, 장애 및/또는 병태의 징후를나타내지 않는 대상체에게 투여될 수 있고/있거나 질환, 장애, 및/또는 병태의 초기 징후만을 나타내는 대상체에게 도움이 될 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, 치료는 관련 질환, 장애 및/또는 병태의 하나 이상의 확립된 징후를 나타내는 대상체에게 투여될 수 있다. 일부 구현예에서, 치료는 관련 질환, 장애, 및/또는 병태로 고통받는 것으로 진단된 대상체에게 도움이 될 수 있다. 일부 구현예에서, 치료는 관련 질환, 장애, 및/또는 병태의 발달의 위험의 증가와 통계적으로 상호관련된 하나 이상의 감수성 인자를 가지는 것으로 알려진 대상체에게 도움이 될 수 있다.

" 변이체 (variant )"는 기준 엔티티와 유의한 구조적 동일성을 보이지만, 기준 엔티티와 비교하여 하나 이상의 화학적 모이어티의 존재 또는 수준에서 기준 엔티티와 구조적으로 상이한 엔티티를 포함한다. 많은 구현예에서, "변이체"는 기준 엔티티와 기능적으로도 상이하다. 일반적으로, 특정 엔티티가 기준 엔티티의 "변이체"로 간주되는 것이 적절한지는 기준 개체와의 구조적 동일성의 정도에 기초한다. 당업자에 의해 이해되는 바와 같이, 임의의 생물학적 또는 화학적 기준 개체는 특정 특징적인 구조적 요소를 가진다. 정의에 의하면, "변이체"는 하나 이상의 이러한 특징적인 구조적 요소를 공유하는 구분되는 화학적 개체이다. 몇 가지 예로서, 소분자는 특징적인 코어 구조적 요소(예를 들어, 거대고리 코어) 및/또는 하나 이상의 특징적인 팬던트 모이어티를 가질 수 있어서 소분자의 변이체는 코어 구조적 요소 및 특징적인 팬던트 모이어티를 공유하지만 다른 팬던트 모이어티 및/또는 코어 내 존재하는 결합의 유형(단일 대 이중, E 대 Z 등)이 다른 것이고, 폴리펩티드는 선형 또는 3차원 공간에서 서로에 대해 지정된 위치를 가지고/가지거나 특정한 생물학적 기능에 기여하는 복수의 아미노산으로 이루어진 특징적인 서열 요소를 가질 수 있고, 핵산은 선형 또는 3차원 공간에서 서로에 대해 지정된 위치를 갖는 복수의 뉴클레오티드 잔기로 이루어진 특징적인 서열 요소를 가질 수 있다. 예를 들어, "변이체 폴리펩티드(variant polypeptide)"는 아미노산 서열에서의 하나 이상의 차이 및/또는 폴리펩티드 골격에 공유 결합된 화학적 모이어티(예를 들어, 탄수화물, 지질 등)에서의 하나 이상의 차이의 결과로서 기준 폴리펩티드와 상이할 수 있다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 또는 99%의 전체 서열 동일성을 보인다. 대안적으로 또는 추가적으로, 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드와 적어도 하나의 특징적인 서열 요소를 공유하지 않는다. 일부 구현예에서, 기준 폴리펩티드는 하나 이상의 생물학적 활성을 가진다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드의 하나 이상의 생물학적 활성을 공유한다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드의 하나 이상의 생물학적 활성이 결여되어 있다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드와 비교하여 하나 이상의 생물학적 활성의 수준의 감소를 나타낸다. 많은 구현예에서, 관심있는 폴리펩티드는 관심있는 폴리펩티드가 특정한 위치에서의 소수의 서열 변경을 제외하고 모체의 아미노산 서열과 동일한 아미노산 서열을 갖는 경우 모 폴리펩티드 또는 기준 폴리펩티드의 "변이체"인 것으로 간주된다. 통상적으로, 모체에 비해 변이체 내 잔기의 20%, 15%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 또는 2% 미만이 치환된다. 일부 구현예에서, "변이체"는 모체에 비해 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 치환된 잔기(들)를 가진다. 흔히, "변이체"는 매우 적은(예를 들어, 5, 4, 3, 2, 또는 1 미만)의 수의 치환된 기능적 잔기(즉, 특정 생물학적 활성에 참여하는 잔기)를 가진다. 또한, "변이체"는 부모에 비해 통상적으로 5, 4, 3, 2, 또는 1개 이하의 첨가 또는 결실을 가지며, 흔히 첨가 또는 결실을 갖지 않는다. 또한, 임의의 첨가 또는 결실은, 통상적으로 약 25, 약 20, 약 19, 약 18, 약 17, 약 16, 약 15, 약 14, 약 13, 약 10, 약 9, 약 8, 약 7, 약 6개 미만, 일반적으로는 약 5, 약 4, 약 3, 또는 약 2개 미만의 잔기이다. 일부 구현예에서, 부모 폴리펩티드 또는 기준 폴리펩티드는 자연에서 발견되는 것이다. 당업자에 의해 이해되는 바와 같이, 특히 관심 폴리펩티드가 감염원 폴리펩티드인 경우, 관심 특정 폴리펩티드의 복수의 변이체는 자연에서 흔히 발견될 수 있다. 일부 구현예에서, 비인간 동물은 이종 헥사뉴클레오티드 확장 서열의 표적화된 삽입에 사용되는 핵산 작제물의 변이체를 포함할 것이다. 비제한적인 예로서, 이러한 핵산 작제물은 5' 제1 이종 헥사뉴클레오티드 측면 서열, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 n개의 반복, 3' 제2 이종 헥사뉴클레오티드 측면 서열을 포함할 수 있고, 바람직하게는 재조합효소 인식 서열이 측면에 위치하는 약물 내성 리포터 유전자를 선택적으로 포함할 수 있다. 실시예 1에 나타난 바와 같이, 표적화된 삽입으로 생성된 동물은 핵산 작제물의 변이체를 내인성 유전자좌에 포함할 수 있으며, 예를 들어, 변이체는 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 n개 미만의 반복을 포함하고/하거나 약물 내성 유전자를 가지지 않는다.(예를 들어, 도 1b 및 도 1c 참조). 따라서, 본원에 포함된 서열의 변이체는 기준 부모 서열과 본질적으로 동일한 서열을 포함하지만, 하나 이상의 반복 및/또는 약물 내성 유전자(들)가 결여되어 있다.

"벡터(vector )"는 결합된 다른 핵산을 운반할 수 있는 핵산 분자를 포함한다. 일부 구현예에서, 벡터는, 진핵 세포 및/또는 원핵 세포와 같은 숙주 세포에서 벡터가 연결된 핵산의 염색체외 복제 및/또는 발현을 할 수 있다. 작동 가능하게 연결된 유전자의 발현을 유도할 수 있는 벡터는 "발현 벡터(expression vectors)"로서 본원에서 지칭한다.

"야생형(wild type )"은 (돌연변이, 질환, 변형 상태 등과 대비되는) "정상(normal)" 상태 또는 맥락으로 자연계에서 발견된 것과 같은 구조 및/또는 활성을 가지는 엔티티를 포함한다. 당업자는 야생형 유전자 및 폴리펩티드가 흔히 다수의 상이한 형태(예: 대립 유전자)로 존재한다는 것을 이해할 것이다.

특정 구현예의 상세한 설명

내인성 C9ORF72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열의 삽입을 갖는 비인간 동물이 제공된다. 일부 구현예에서, 본원에 기술된 비인간 동물은 본원에 기술된 바와 같은 변형된 C9ORF72 유전자위에 대한 이형접합체이다. 일부 구현예에서, 본원에 기술된 바와 같은 비인간 동물은 제1 변형된 C9orf72 유전자좌 및 제2 변형된 C9orf72 유전자좌를 포함하되, 제1 및 제2 유전자좌는 상이하다. 일부 구현예에서, 본원에 기술된 비인간 동물은 변형된 C9ORF72 유전자좌에 대한 동형접합체이다. 일부 구현예에서, 본원에 기술된 비인간 동물은 이종 헥사뉴클레오티드 반복 확장 서열의 존재로 인해 ALS-유사 질환 및/또는 FTD-유사 질환에 걸린다.

본 발명의 다양한 양태는 다음의 섹션에서 상세히 설명된다. 섹션의 용도는 본 발명을 제한하고자 하는 것이 아니다. 각각의 섹션은 본 발명의 임의의 양태에 적용될 수 있다. 본 출원에서, "또는(or)"의 사용은 달리 명시하지 않는 한 "및/또는(and/or)"을 의미한다.

C9ORF72

루게릭병(Lou Gehrig's disease)으로도 지칭되는 근위축성 측색 경화증(Amyotrophic lateral sclerosis; ALS)은 상부 및/또는 하부 운동 뉴런의 상실을 특징으로 하는, 성인에서 가장 흔하게 발병하는 마비 장애이다. ALS는 미국에서 많게는 약 20,000명에서 발생하며, 매년 약 5,000건의 새로운 사례가 발생한다. 의사였던 아놀드 픽(Arnold Pick)의 이름을 따라 피크병(Pick's disease)으로 처음에 불렸던 전두 측두엽 치매(FTD)는 뇌의 정면 또는 측두엽에서의 진행성 세포 퇴화로 인한 일 군의 장애이다. FTD는 모든 치매 사례의 10~15%를 차지하는 것으로 보고된다. 인간 C9ORF72 유전자의 2개의 비-암호화 엑손인 엑손 1a와 1b 사이에 있는 (선택적으로는, 이들에 걸쳐 있는) 헥사뉴클레오티드 반복 확장 서열은 ALS 및 FTD 모두와 연결되어 있었다(DeJesus-Hernandez, M. 등의, 2011, Neuron 72:245-256; Renton, A.E. 등의, 2011, Neuron 72:257-268; Majounie, E. 등의, 2012, Lancet Neurol. 11:323-330; Waite, A.J. 등의, 2014, Neurobiol. Aging 35:1779.e5-1779.e13 참조). GGGGCC (서열번호 1) 헥사뉴클레오티드 반복 확장은 가족력 및 다수의 비-가족력 ALS 사례의 약 50%를 차지하는 것으로 추정된다. 이는 가족력 FTD 사례의 약 25% 및 산발성 사례의 약 8%에서 존재한다.

예를 들어, RNA 병소의 반복 길이 의존성 형성, 특정 RNA-결합 단백질의 격리, 및 디펩티드 반복 단백질의 뭉침과 같은, C9ORF72에서의 헥사뉴클레오티드 반복 확장 서열과 관련된 많은 병리학적 양태들이 보고되었다(예를 들어, Stepto, A. 등의 2014, Acta Neuropathol. 127:377-389에서 검토되었으며; 또한 Almeida, S. 등의, 2013, Acta Neuropathol. 126:385-399; Bieniek, K.F. 등의, 2014, JAMA Neurol. 71(6): 775-781; van Blitterswijk, M. 등의, 2014, Mol. Neurodegen. 9:38, 10 페이지를 참조한다). 헥사뉴클레오티드 서열(GGGGCC; 서열번호 1)의 66개의 반복을 포함하는 이종 헥사뉴클레오티드 반복 확장 서열을 함유하도록 생성된 녹인(knock-in) 마우스는 그의 뉴런에서 RNA 병소 및 디펩티드 단백질 뭉침을 나타낸다. 이들 마우스는 6개월 령에서 피질 뉴런 상실을 보였고 행동 및 운동 결핍을 나타냈다(Chew, J. 등의, 2015, Science May 14. Pii:aaa9344 참조). 그러나, 이러한 반복 확장이 질환을 유발하는 메커니즘은, 독성의 기능 상실 또는 기능 획득을 통하는지와 무관하게, 여전히 불분명하다. 또한, 반복 뉴클레오티드 반복 확장 서열에서 더 낮은 수의 반복이 ALS/FTD에 미치는 영향도 알려져 있지 않다.

C9ORF72는 엔도솜 트래피킹(trafficking)을 조절하는 것으로 보고되어 있지만 (Farg, M.A. 등, 2014, Human Mol. Gen. 23(13):3579-3595), C9ORF72의 세포 기능의 많은 부분은 여전히 알려져 있지 않다. 실제로, C9ORF72는 알려져 있지 않은 기능으로 비특성화 단백질을 암호화하는 유전자이다. C9ORF72를 둘러싼 이해의 부족에도 불구하고, 조작된 세포주를 포함하여, ALS 및/또는 FTD를 위한 여러 동물 동물 모델이 개발되었다(Roberson, E.D., 2012, Ann. Neurol. 72(6):837-849; Panda, S.K. 등의, 2013, Genetics 195:703-715; Suzuki, N. 등의, 2013, Nature Neurosci. 16(12):1725-1728; Xu, Z. 등의, 2013, Proc. Nat. Acad. Sci. U.S.A. 110(19):7778-7783; Hukema, R.K. 등의, 2014, Acta Neuropathol. Comm. 2:166, 4 페이지). 형광 리포터와 작동 가능하게 연결된 80개의 GGGGCC 반복을 포함하고, 임의의 C9orf72 주변 서열이 없는 테트라시클린 반응 요소에 의해 조절되는 이종 헥사뉴클레오티드 반복 확장 서열을 함유하는 유전자 이식 마우스 계통을 사용하는 다른 보고서는, ALS-FTD 환자에서 관찰된 것과 유사한 뉴런 세포질 봉입체를 입증하였는데, 이는 헥사뉴클레오티드 GGGGCC 서열 자체의 확장된 반복이 질환의 원인일 수 있음을 시사한다(Hukema, R.K. 등의, 2014, Acta Neuropathol. Comm. 2:166, 4 페이지). 이들 마우스는 CNS의 세포에서 초기 C9orf72 발현 프로파일을 확립하고, 반복 확장과 관련된 작용 메커니즘에 대한 약간의 이해를 제공하는데 유용하였지만; 작제물의 설계는 생성되는 유전자 이식 동물의 표현형에 영향을 미칠 수 있다(예를 들어, Muller, U., 1999, Mech. Develop. 81:3-21 참조). 예를 들어, 유도성 GGGGCC 반복을 함유하는 유전자 이식 마우스 계통(전술한 Hukema, 2014)은 인간 측면 서열 없이 설계되었는데, 이는 아마도 이러한 주변 서열이 반복 서열의 번역에 영향을 미치는 것으로 여겨졌기 때문일 것이다. 따라서, 치료제의 적용을 위한 C9ORF72 매개 생물학을 활용하는 이러한 생체 내 시스템은 불완전하다.

C9ORF72 및 헥사뉴클레오티드 반복 확장 서열

마우스 C9ORF72 전사 변이체가 당업계에 보고되었고(예: Koppers 등의, Ann Neurol (2015); 78: 426-438; Atkinson 등의, Acta Neuropathologica Communication (2015) 3: 59), 도 1a에도 도시되어 있다. 보고된 3개의 마우스 C9ORF72 전자 변이체에 대한 게놈 정보는 Ensembl 웹사이트에서도 ENSMUST00000108127 (V1), ENSMUST00000108126 (V2), 및 ENSMUST00000084724 (V3)의 명칭으로 이용할 수 있다. 예시적인 비인간(예, 설치류) C9ORF72 mRNA 및 아미노산 서열은 표 2에 제시되어 있다. mRNA 서열의 경우, 괄호 안의 굵은 글씨체는 암호화 서열을 나타내며, 후속 엑손이 표시된 경우, 이들은 교번하는 대문자와 소문자로 구분된다. 아미노산 서열의 경우, 성숙한 폴리펩티드 서열이 표시되는 경우, 이들은 굵은 글씨체로 표시된다.

인간 C9ORF72 전사 변이체는 당업계에 공지되어 있다. 하나의 인간 C9ORF72 전사 변이체는 중앙 및 3' 코딩 영역에서 다수의 엑손이 결여되고, 이의 3' 말단 엑손은 변이체 3(하기 참조)에 사용되는 스플라이싱 부위를 넘어 연장되는데, 이는 변이체 3과 비교해 신규한 3' 미번역 영역(UTR)을 생성한다. 이러한 변이체는 유의하게 짧은 폴리펩티드를 암호화하며, 이의 C-말단 아미노산은 2개의 다른 변이체에 의해 암호화되는 것과 비교할 때 구분된다. 이러한 변이체의 mRNA 및 아미노산 서열은 각각 GenBank 수탁 번호 NM_145005.6 및 NP_659442.2에서 확인할 수 있으며, 참조로서 본원에 통합된다. NM_145005.6 및 NP_659442.2의 서열은 각각 서열번호 10 및 서열번호 11로서 제시된다. 제2 인간 C9ORF72 전사 변이체(2)는 변이체 3과 비교하여 5' 미번역 영역(UTR)에서 상이하다. 이러한 변이체의 mRNA 및 아미노산 서열은 각각 GenBank 수탁 번호 NM_018325.4 및 NP_060795.1에서 확인할 수 있으며, 참조로서 본원에 통합된다. NM_018325.4 및 NP_060795.1의 서열은 각각 서열번호 12 및 서열번호 13으로서 제시된다. 제3 인간 C9ORF72 전사 변이체(3)는 3개의 보고된 변이체들 중 가장 긴 서열을 함유하고, 더 긴 아이소폼을 암호화한다. 이러한 변이체의 mRNA 및 아미노산 서열은 각각 GenBank 수탁 번호 NM_001256054.2 및 NP_001242983.1에서 확인할 수 있으며, 참조로서 본원에 통합된다. NM_001256054.2 및 NP_001242983.1의 서열은 각각 서열번호 14 및 서열번호 15로서 제시된다. 변이체 2 및 3은 동일한 단백질을 암호화한다.

헥사뉴클레오티드 반복 확장 서열은 일반적으로 서열번호 1로서 제시된 헥사뉴클레오티드 서열 GGGGCC의 적어도 하나의 사례, 예를 들어, 하나의 반복을 포함하는 뉴클레오티드 서열이다. 내인성 비인간 C9orf72 유전자좌 내로의 삽입을 위해, 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시되는 헥사뉴클레오티드 서열의 적어도 하나의 사례(반복) 및 바람직하게는 2개 이상의 사례(반복)를 포함하며, 인간 '염색체 9 개방 해독틀 72'(C9orf72)의 비암호화 엑손 1a 및 1b에 걸쳐 있는 (그리고 선택적으로 이들을 포함하는) 게놈 핵산 서열 또는 그의 일부과 동일하거나 실질적으로 동일할 수 있다. 이종 헥사뉴클레오티드 확장 서열의 비제한적인 예는 서열번호 1, 서열번호 2(GGGGCC 헥사뉴클레오티드 서열의 3개의 반복을 포함함) 및 서열번호 3(GGGGCC 헥사뉴클레오티드 서열의 100개의 반복을 포함함)으로서 제시된 서열을 포함한다.

생쥐 C9orf72 mRNA (NM_001081343; 서열번호 16)

gtgtccggggcggggcggtcccggggcggggcccggagcgggctgcggttgcggtccctgcgccggcggtgaaggcgcagcagcggcgagtggCTATTGCAAGCGTTCGGATAATGTGAGACCTGGAATGCAGTGAGACCTGGGATGCAGGG(ATGTCGACTATCTGCCCCCCACCATCTCCTGCTGTTGCCAAGACAGAGATTGCTTTAAGTGGTGAATCACCCTTGTTGGCGGCTACCTTTGCTTACTGGGATAATATTCTTGGTCCTAGAGTAAGGCATATTTGGGCTCCAAAGACAGACCAAGTGCTTCTCAGTGATGGAGAAATAACTTTTCTTGCCAACCACACTCTAAATGGAGAAATTCTTCGAAATGCAGAGAGTGGGGCTATAGATGTAAAATTTTTTGTCTTATCTGAAAAAGGGGTAATTATTGTTTCATTAATCTTCGACGGAAACTGGAATGGAGATCGGAGCACTTATGGACTATCAATTATACTGCCGCAGACAGAGCTGAGCTTCTACCTCCCACTTCACAGAGTGTGTGTTGACAGGCTAACACACATTATTCGAAAAGGAAGAATATGGATGCATAAGgaaagacaagaaaatgtccagaaaattgtcttggaaggcacagagaggatggaagatcagGGTCAGAGTATCATTCCCATGCTTACTGGGGAAGTCATTCCTGTAATGGAGCTGCTTGCATCTATGAAATCCCACAGTGTTCCTGAAGACATTGATatagctgatacagtgctcaatgatgatgacattggtgacagctgtcacgaaggctttcttctcaaTGCCATCAGCTCACACCTGCAGACCTGTGGCTGTTCCGTTGTAGTTGGCAGCAGTGCAGAGAAAGTAAATAAGatagtaagaacgctgtgcctttttctgacaccagcagagaggaaatgctccaggctgtgtgaagcagaatcgtcctttaagtacgaatcgggactctttgtgcaaggcttgctaaagGATGCAACAGGCAGTTTTGTCCTACCCTTCCGGCAAGTTATGTATGCCCCGTACCCCACCACGCACATTGATGTGGATGTCAACACTGTCAAGCAGATGCCACCGTGTCATGAACATATTTATAATCAACGCAGATACATGAGGTCAGAGCTGACAGCCTTCTGGAGGGCAACTTCAGAAGAGGACATGGCGCAGGACACCATCATCTACACAGATGAGAGCTTCACTCCTGATTTgaatattttccaagatgtcttacacagagacactctagtgaaagccttcctggatcagGTCTTCCATTTGAAGCCTGGCCTGTCTCTCAGGAGTACTTTCCTTGCACAGTTCCTCCTCATTCTTCACAGAAAAGCCTTGACACTAATCAAGTACATCGAGGATGATACgcagaaggggaaaaagccctttaagtctcttcggaacctgaagatagatcttgatttaacagcagagggcgatcttaacataataatggctctagctgagaaaattaagccaggcctacactctttcatctttgggagacctttctacactagtgtacaagaacgtgatgttctaatgaccttttga)ccgtgtggtttgctgtgtctgtctcttcacagtcacacctgctgttacagtgtctcagcagtgtgtgggcacatccttcctcccgagtcctgctgcaggacagggtacactacacttgtcagtagaagtctgtacctgatgtcaggtgcatcgttacagtgaatgactcttcctagaatagatgtactcttttagggccttatgtttacaattatcctaagtactattgctgtcttttaaagatatgaatgatggaatatacacttgaccataactgctgattggttttttgttttgttttgtttgttttcttggaaacttatgattcctggtttacatgtaccacactgaaaccctcgttagctttacagataaagtgtgagttgacttcctgcccctctgtgttctgtggtatgtccgattacttctgccacagctaaacattagagcatttaaagtttgcagttcctcagaaaggaacttagtctgactacagattagttcttgagagaagacactgatagggcagagctgtaggtgaaatcagttgttagcccttcctttatagacgtagtccttcagattcggtctgtacagaaatgccgaggggtcatgcatgggccctgagtatcgtgacctgtgacaagttttttgttggtttattgtagttctgtcaaagaaagtggcatttgtttttataattgttgccaacttttaaggttaattttcattatttttgagccgaattaaaatgcgcacctcctgtgcctttcccaatcttggaaaatataatttcttggcagagggtcagatttcagggcccagtcactttcatctgaccaccctttgcacggctgccgtgtgcctggcttagattagaagtccttgttaagtatgtcagagtacattcgctgataagatctttgaagagcagggaagcgtcttgcctctttcctttggtttctgcctgtactctggtgtttcccgtgtcacctgcatcataggaacagcagagaaatctgacccagtgctatttttctaggtgctactatggcaaactcaagtggtctgtttctgttcctgtaacgttcgactatctcgctagctgtgaagtactgattagtggagttctgtgcaacagcagtgtaggagtatacacaaacacaaatatgtgtttctatttaaaactgtggacttagcataaaaagggagaatatatttattttttacaaaagggataaaaatgggccccgttcctcacccaccagatttagcgagaaaaagctttctattctgaaaggtcacggtggctttggcattacaaatcagaacaacacacactgaccatgatggcttgtgaactaactgcaaggcactccgtcatggtaagcgagtaggtcccacctcctagtgtgccgctcattgctttacacagtagaatcttatttgagtgctaattgttgtctttgctgctttactgtgttgttatagaaaatgtaagctgtacagtgaataagttattgaagcatgtgtaaacactgttatatatcttttctcctagatggggaattttgaataaaatacctttgaaattctgtgt

생쥐 C9orf72 아미노산 (NP_001074812; 서열번호 17)

MSTICPPPSPAVAKTEIALSGESPLLAATFAYWDNILGPRVRHIWAPKTDQVLLSDGEITFLANHTLNGEILRNAESGAIDVKFFVLSEKGVIIVSLIFDGNWNGDRSTYGLSIILPQTELSFYLPLHRVCVDRLTHIIRKGRIWMHKERQENVQKIVLEGTERMEDQGQSIIPMLTGEVIPVMELLASMKSHSVPEDIDIADTVLNDDDIGDSCHEGFLLNAISSHLQTCGCSVVVGSSAEKVNKIVRTLCLFLTPAERKCSRLCEAESSFKYESGLFVQGLLKDATGSFVLPFRQVMYAPYPTTHIDVDVNTVKQMPPCHEHIYNQRRYMRSELTAFWRATSEEDMAQDTIIYTDESFTPDLNIFQDVLHRDTLVKAFLDQVFHLKPGLSLRSTFLAQFLLILHRKALTLIKYIEDDTQKGKKPFKSLRNLKIDLDLTAEGDLNIIMALAEKIKPGLHSFIFGRPFYTSVQERDVLMTF

시궁쥐 C9orf72 mRNA (NM_001007702); 서열번호 18)

CGTTTGTAGTGTCAGCCATCCCAATTGCCTGTTCCTTCTCTGTGGGAGTGGTGTCTAGACAGTCCAGGCAGGGTATGCTAGGCAGGTGCGTTTTGGTTGCCTCAGATCGCAACTTGACTCCATAACGGTGACCAAAGACAAAAGAAGGAAACCAGATTAAAAAGAACCGGACACAGACCCCTGCAGAATCTGGAGCGGCCGTGGTTGGGGGCGGGGCTACGACGGGGCGGACTCGGGGGCGTGGGAGGGCGGGGCCGGGGCGGGGCCCGGAGCCGGCTGCGGTTGCGGTCCCTGCGCCGGCGGTGAAGGCGCAGCGGCGGCGAGTGGCTATTGCAAGCGTTTGGATAATGTGAGACCTGGGATGCAGGG(ATGTCGACTATCTGCCCCCCACCATCTCCTGCTGTTGCCAAGACAGAGATTGCTTTAAGTGGTGAATCACCCTTGTTGGCGGCTACCTTTGCTTACTGGGATAATATTCTTGGTCCTAGAGTAAGGCACATTTGGGCTCCAAAGACAGACCAAGTACTCCTCAGTGATGGAGAAATCACTTTTCTTGCCAACCACACTCTGAATGGAGAAATTCTTCGGAATGCGGAGAGTGGGGCAATAGATGTAAAGTTTTTTGTCTTATCTGAAAAGGGCGTCATTATTGTTTCATTAATCTTCGACGGGAACTGGAACGGAGATCGGAGCACTTACGGACTATCAATTATACTGCCGCAGACGGAGCTGAGTTTCTACCTCCCACTGCACAGAGTGTGTGTTGACAGGCTAACGCACATCATTCGAAAAGGAAGGATATGGATGCACAAGGAAAGACAAGAAAATGTCCAGAAAATTGTCTTGGAAGGCACCGAGAGGATGGAAGATCAGGGTCAGAGTATCATCCCTATGCTTACTGGGGAGGTCATCCCTGTGATGGAGCTGCTTGCGTCTATGAGATCACACAGTGTTCCTGAAGACCTCGATATAGCTGATACAGTACTCAATGATGATGACATTGGTGACAGCTGTCATGAAGGCTTTCTTCTCAATGCCATCAGCTCACATCTGCAGACCTGCGGCTGTTCTGTGGTGGTAGGCAGCAGTGCAGAGAAAGTAAATAAGATAGTAAGAACACTGTGCCTTTTTCTGACACCAGCAGAGAGGAAGTGCTCCAGGCTGTGTGAAGCCGAATCGTCCTTTAAATACGAATCTGGACTCTTTGTACAAGGCTTGCTAAAGGATGCGACTGGCAGTTTTGTACTACCTTTCCGGCAAGTTATGTATGCCCCTTATCCCACCACACACATCGATGTGGATGTCAACACTGTCAAGCAGATGCCACCGTGTCATGAACATATTTATAATCAACGCAGATACATGAGGTCAGAGCTGACAGCCTTCTGGAGGGCAACTTCAGAAGAGGACATGGCTCAGGACACCATCATCTACACAGATGAGAGCTTCACTCCTGATTTGAATATTTTCCAAGATGTCTTACACAGAGACACTCTAGTGAAAGCCTTTCTGGATCAGGTCTTCCATTTGAAGCCTGGCCTGTCTCTCAGGAGTACTTTCCTTGCACAGTTCCTCCTCATTCTTCACAGAAAAGCCTTGACACTAATCAAGTACATAGAGGATGACACGCAGAAGGGGAAAAAGCCCTTTAAGTCTCTTCGGAACCTGAAGATAGATCTTGATTTAACAGCAGAGGGCGACCTTAACATAATAATGGCTCTAGCTGAGAAAATTAAGCCAGGCCTACACTCTTTCATCTTCGGGAGACCTTTCTACACTAGTGTCCAAGAACGTGATGTTCTAATGACTTTTTAA)ACATGTGGTTTGCTCCGTGTGTCTCATGACAGTCACACTTGCTGTTACAGTGTCTCAGCGCTTTGGACACATCCTTCCTCCAGGGTCCTGCCGCAGGACACGTTACACTACACTTGTCAGTAGAGGTCTGTACCAGATGTCAGGTACATCGTTGTAGTGAATGTCTCTTTTCCTAGACTAGATGTACCCTCGTAGGGACTTATGTTTACAACCCTCCTAAGTACTAGTGCTGTCTTGTAAGGATACGAATGAAGGGATGTAAACTTCACCACAACTGCTGGTTGGTTTTGTTGTTTTTGTTTTTTGAAACTTATAATTCATGGTTTACATGCATCACACTGAAACCCTAGTTAGCTTTTTACAGGTAAGCTGTGAGTTGACTGCCTGTCCCTGTGTTCTCTGGCCTGTACGATCTGTGGCGTGTAGGATCACTTTTGCAACAACTAAAAACTAAAGCACTTTGTTTGCAGTTCTACAGAAAGCAACTTAGTCTGTCTGCAGATTCGTTTTTGAAAGAAGACATGAGAAAGCGGAGTTTTAGGTGAAGTCAGTTGTTGGATCTTCCTTTATAGACTTAGTCCTTTAGATGTGGTCTGTATAGACATGCCCAACCATCATGCATGGGCACTGAATATCGTGAACTGTGGTATGCTTTTTGTTGGTTTATTGTACTTCTGTCAAAGAAAGTGGCATTGGTTTTTATAATTGTTGCCAAGTTTTAAGGTTAATTTTCATTATTTTTGAGCCAAATTAAAATGTGCACCTCCTGTGCCTTTCCCAATCTTGGAAAATATAATTTCTTGGCAGAAGGTCAGATTTCAGGGCCCAGTCACTTTCGTCTGACTTCCCTTTGCACAGTCCGCCATGGGCCTGGCTTAGAAGTTCTTGTAAACTATGCCAGAGAGTACATTCGCTGATAAAATCTTCTTTGCAGAGCAGGAGAGCTTCTTGCCTCTTTCCTTTCATTTCTGCCTGGACTTTGGTGTTCTCCACGTTCCCTGCATCCTAAGGACAGCAGGAGAACTCTGACCCCAGTGCTATTTCTCTAGGTGCTATTGTGGCAAACTCAAGCGGTCCGTCTCTGTCCCTGTAACGTTCGTACCTTGCTGGCTGTGAAGTACTGACTGGTAAAGCTCCGTGCTACAGCAGTGTAGGGTATACACAAACACAAGTAAGTGTTTTATTTAAAACTGTGGACTTAGCATAAAAAGGGAGACTATATTTATTTTTTACAAAAGGGATAAAAATGGAACCCTTTCCTCACCCACCAGATTTAGTCAGAAAAAAACATTCTATTCTGAAAGGTCACAGTGGTTTTGACATGACACATCAGAACAACGCACACTGTCCATGATGGCTTATGAACTCCAAGTCACTCCATCATGGTAAATGGGTAGATCCCTCCTTCTAGTGTGCCACACCATTGCTTCCCACAGTAGAATCTTATTTAAGTGCTAAGTGTTGTCTCTGCTGGTTTACTCTGTTGTTTTAGAGAATGTAAGTTGTATAGTGAATAAGTTATTGAAGCATGTGTAAACACTGTTATACATCTTTTCTCCTAGATGGGGAATTTGGAATAAAATACCTTTAAAATTCAAAAAAAAAAAAAAAAAAAAAAAA

시궁쥐 C9orf72 아미노산 (NP_001007703; 서열번호 19)

MSTICPPPSPAVAKTEIALSGESPLLAATFAYWDNILGPRVRHIWAPKTDQVLLSDGEITFLANHTLNGEILRNAESGAIDVKFFVLSEKGVIIVSLIFDGNWNGDRSTYGLSIILPQTELSFYLPLHRVCVDRLTHIIRKGRIWMHKERQENVQKIVLEGTERMEDQGQSIIPMLTGEVIPVMELLASMRSHSVPEDLDIADTVLNDDDIGDSCHEGFLLNAISSHLQTCGCSVVVGSSAEKVNKIVRTLCLFLTPAERKCSRLCEAESSFKYESGLFVQGLLKDATGSFVLPFRQVMYAPYPTTHIDVDVNTVKQMPPCHEHIYNQRRYMRSELTAFWRATSEEDMAQDTIIYTDESFTPDLNIFQDVLHRDTLVKAFLDQVFHLKPGLSLRSTFLAQFLLILHRKALTLIKYIEDDTQKGKKPFKSLRNLKIDLDLTAEGDLNIIMALAEKIKPGLHSFIFGRPFYTSVQERDVLMTF

C9ORF72 표적화 벡터, 및 C9ORF72 유전자좌에 삽입된 이종 헥사뉴클레오티 드 반복 확장 서열을 갖는 비인간 동물의 생산

본원에 기술된 바와 같은 내인성 C9ORF72 유전자좌에 삽입된 이종 헥사뉴클레오티드 확장 서열을 갖는 비인간 동물의 생산을 위한 표적화 벡터 또는 표적화 작제물이 본원에 제공된다.

A. 큰 표적화 벡터

단세포 단계의 배아가 아닌 세포에서, "큰 표적화 벡터" 또는 "LTVEC"인 표적화 벡터가 사용될 수 있는데, 상기 표적화 벡터는, 세포에서 상동성 재조합을 수행하도록 의도된 다른 접근법에 의해 일반적으로 사용되는 것들보다 더 큰 핵산 서열과 상응하고 이로부터 유래되는 상동 아암을 포함한다. 또한, LTVEC는, 세포에서 상동성 재조합을 수행하도록 의도된 다른 접근법에 의해 일반적으로 사용되는 것들보다 더 큰 핵산 서열을 갖는 핵산 삽입체를 포함하는 표적화 벡터를 포함한다. 예를 들어, LTVEC는 크기 제한 때문에 전통적인 플라스미드 기반 표적화 벡터에 수용될 수 없는 큰 유전자좌의 변형을 가능하게 한다. 예를 들어, 표적화된 유전자좌는 (5' 및 3' 상동 아암이, 종래의 방법을 사용해 표적화할 수 없거나, 뉴클레아제 제제(예: Cas 단백질)에 의해 유도되는 닉(nick) 또는 이중 가닥 파단의 부재 시 부정확하게만, 또는 유의하게 낮은 효율성으로만 표적화할 수 있는 세포의 유전자좌에 대응하는) 것일 수 있다.

표적화 벡터는 상동 아암을 포함한다. 표적화 벡터가 핵산 삽입체도 포함하는 경우, 상동 아암은 핵산 삽입체의 측면에 위치할 수 있다. 용이한 참조를 위해, 상동 아암은 본원에서 5' 및 3'(즉, 상류 및 하류) 상동 아암으로서 지칭된다. 이러한 용어는 외인성 복구 템플릿 내에서 핵산 삽입체에 대한 상동 아암들의 상대 위치에 관한 것이다. 5' 및 3' 상동 아암은 관심 게놈 영역 내의 영역에 대응하는데, 상기 영역은 본원에서 "5' 표적 서열" 및 "3' 표적 서열"로서 각각 지칭된다.

상동 아암 및 표적 서열은 상동성 재조합 반응을 위한 기질로서 작용하기 위해 2개의 영역이 서로에 대해 충분한 서열 동일성을 공유할 때 서로 "상응하거나(correspond)" "상응하는 것(corresponding)"이다. 용어 "상동성"은 대응 서열과 동일하거나 서열 동일성을 공유하는 DNA 서열을 포함한다. 주어진 표적 서열과 외인성 복구 템플릿에서 발견되는 상응하는 상동 아암간의 서열 동일성은 상동성 재조합이 발생할 수 있게 하는 임의의 정도의 서열 동일성일 수 있다. 예를 들어, 외인성 복구 템플릿(또는 이의 단편)의 상동 아암 및 표적 서열(또는 이의 단편)에 의해 공유되는 서열 동일성의 양은, 서열이 상동성 재조합을 거치도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성일 수 있다. 상동성 아암과 대응 표적 서열간의 상응하는 상동성 영역은 상동성 재조합을 촉진하기에 충분한 임의의 길이일 수 있다. 상동 아암은 대칭일 수 있거나(각각이 대략 동일한 길이임), 비대칭일 수 있다(하나가 다른 하나보다 더 김).

상동 아암은 세포(예를 들어, 표적화된 유전자좌)에 대해 천연인 유전자좌에 상응하는 것일 수 있다. 대안적으로, 예를 들어, 이들은 세포의 게놈 내에 통합된 DNA의 이종 또는 외인성 세그먼트의 영역(예를 들어, 이식 유전자, 발현 카세트, 또는 DNA의 이종 또는 외인성 영역을 포함함)에 상응할 수 있다. 대안적으로, 표적화 벡터의 상동 아암은 효모 인공 염색체(YAC)의 영역, 박테리아 인공 염색체(BAC)의 영역, 인간 인공 염색체의 영역, 또는 적절한 숙주 세포에 함유된 임의의 다른 조작된 영역에 상응할 수 있다. 또한, 표적화 벡터의 상동 아암은 BAC 라이브러리, 코스미드 라이브러리, 또는 P1 파지 라이브러리의 영역에 상응하거나 이로부터 유래될 수 있거나, 합성 DNA로부터 유래될 수 있다.

LTVEC의 예는 박테리아 인공 염색체(BAC), 인간 인공 염색체, 또는 효모 인공 염색체(YAC)로부터 유래된 벡터를 포함한다. LTVEC 및 이의 제조 방법에 대한 비제한적인 예는, 예를 들어, 미국 특허 제6,586,251호; 제6,596,541호; 및 제7,105,348호; 및 제WO 2002/036789호에 기술되어 있으며, 이들 각각은 모든 목적을 위해 그 전체가 참조로서 본원에 포함된다. LTVEC는 선형 형태 또는 원형 형태일 수 있다.

LTVEC는 임의의 길이일 수 있고, 통상적으로 길이가 적어도 10 kb이다. 예를 들어, LTVEC은 약 50 kb 내지 약 500 kb, 약 50 kb 내지 약 75 kb, 약 75 kb 내지 약 100 kb, 약 100 kb 내지 약 125 kb, 약 125 kb 내지 약 150 kb, 약 150 kb 내지 약 175 kb, 약 175 kb 내지 약 200 kb, 약 200 kb 내지 약 225 kb, 약 225 kb 내지 약 250 kb, 약 250 kb 내지 약 275 kb, 약 275 kb 내지 약 300 kb, 약 300 kb 내지 약 325 kb, 약 325 kb 내지 약 350 kb, 약 350 kb 내지 약 375 kb, 약 375 kb 내지 약 400 kb, 약 400 kb 내지 약 425 kb, 약 425 kb 내지 약 450 kb, 약 450 kb 내지 약 475 kb, 또는 약 475 kb 내지 약 500 kb일 수 있다. 대안적으로, LTVEC는 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 적어도 30 kb, 적어도 40 kb, 적어도 50 kb, 적어도 60 kb, 적어도 70 kb, 적어도 80 kb, 적어도 90 kb, 적어도 100 kb, 적어도 150 kb, 적어도 200 kb, 적어도 250 kb, 적어도 300 kb, 적어도 350 kb, 적어도 400 kb, 적어도 450 kb, 또는 적어도 500 kb 이상일 수 있다. LTVEC의 크기는 너무 커서 웨스턴 블롯팅 및 긴 범위(예: 1 kb 내지 5 kb) PCR과 같은 종래의 검정에 의한 표적화 이벤트의 스크리닝을 수행하는 것이 가능하지 않을 수 있다.

LTVEC 내의 5' 상동 아암 및 3' 상동성 아암의 총 합은 일반적으로 적어도 10 kb이다. 예로서, 5' 상동 아암은 약 5 kb 내지 약 150 kb 범위일 수 있고/있거나 3' 상동 아암은 약 5 kb 내지 약 150 kb의 범위일 수 있다. 각각의 상동 아암은, 예를 들어, 약 5 kb 내지 약 10 kb, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 30 kb, 약 30 kb 내지 약 40 kb, 약 40 kb 내지 약 50 kb, 약 50 kb 내지 약 60 kb, 약 60 kb 내지 약 70 kb, 약 70 kb 내지 약 80 kb, 약 80 kb 내지 약 90 kb, 약 90 kb 내지 약 100 kb, 약 100 kb 내지 약 110 kb, 약 110 kb 내지 약 120 kb, 약 120 kb 내지 약 130 kb, 약 130 kb 내지 약 140 kb, 약 140 kb 내지 약 150 kb, 약 150 kb 내지 약 160 kb, 약 160 kb 내지 약 170 kb, 약 170 kb 내지 약 180 kb, 약 180 kb 내지 약 190 kb, 또는 약 190 내지 약 200 kb일 수 있다. 5' 및 3' 상동 아암의 총 합은, 예를 들어, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 30 kb, 약 30 kb 내지 약 40 kb, 약 40 kb 내지 약 50 kb, 약 50 kb 내지 약 60 kb, 약 60 kb 내지 약 70 kb, 약 70 kb 내지 약 80 kb, 약 80 kb 내지 약 90 kb, 약 90 kb 내지 약 100 kb, 약 100 kb 내지 약 110 kb, 약 110 kb 내지 약 120 kb, 약 120 kb 내지 약 130 kb, 약 130 kb 내지 약 140 kb, 약 140 kb 내지 약 150 kb, 약 150 kb 내지 약 160 kb, 약 160 kb 내지 약 170 kb, 약 170 kb 내지 약 180 kb, 약 180 kb 내지 약 190 kb, 약 190 kb 내지 약 200 kb, 약 200 kb 내지 약 250 kb, 약 250 kb 내지 약 300 kb, 약 300 kb 내지 약 350 kb, 또는 약 350 kb 내지 약 400 kb일 수 있다. 대안적으로, 각각의 상동 아암은 적어도 5kb, 적어도 10kb, 적어도 15kb, 적어도 20kb, 적어도 30kb, 적어도 40kb, 적어도 50kb, 적어도 60kb, 적어도 70kb, 적어도 80kb, 적어도 90kb, 적어도 100kb, 적어도 110kb, 적어도 120kb, 적어도 130kb, 적어도 140kb, 적어도 150kb, 적어도 160kb, 적어도 170kb, 적어도 180kb, 적어도 190kb, 또는 적어도 200kb일 수 있다. 마찬가지로, 5' 및 3' 상동 아암의 총 합은 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 적어도 30 kb, 적어도 40 kb, 적어도 50 kb, 적어도 60 kb, 적어도 70 kb, 적어도 80 kb, 적어도 90 kb, 적어도 100 kb, 적어도 110 kb, 적어도 120 kb, 적어도 130 kb, 적어도 140 kb, 적어도 150 kb, 적어도 160 kb, 적어도 170 kb, 적어도 180 kb, 적어도 190 kb, 적어도 200 kb, 적어도 250 kb, 적어도 300 kb, 적어도 350 kb, 또는 적어도 400 kb일 수 있다.

LTVEC는, 세포에서 상동성 재조합을 수행하도록 의도된 다른 접근법에 의해 일반적으로 사용되는 것들보다 더 큰 핵산 서열을 갖는 핵산 삽입체를 포함할 수 있다. 예를 들어, LTVEC는 약 1 kb 내지 약 5 kb, 약 5 kb 내지 약 10 kb, 약 10 kb 내지 약 20 kb, 약 20 kb 내지 약 40 kb, 약 40 kb 내지 약 60 kb, 약 60 kb 내지 약 80 kb, 약 80 kb 내지 약 100 kb, 약 100 kb 내지 약 150 kb, 약 150 kb 내지 약 200 kb, 약 200 kb 내지 약 250 kb, 약 250 kb 내지 약 300 kb, 약 300 kb 내지 약 350 kb, 약 350 kb 내지 약 400 kb, 약 400 kb 내지 약 450 kb, 약 450 kb 내지 약 500 kb 이상의 범위인 핵산 삽입체를 포함할 수 있다. 대안적으로, 핵산 삽입체는 적어도 1 kb, 적어도 5 kb, 적어도 10 kb, 적어도 20 kb, 적어도 30 kb, 적어도 40 kb, 적어도 60 kb, 적어도 80 kb, 적어도 100 kb, 적어도 150 kb, 적어도 200 kb, 적어도 250 kb, 적어도 300 kb, 적어도 350 kb, 적어도 400 kb, 적어도 450 kb, 또는 적어도 500 kb일 수 있다.

B. 큰 표적화 벡터의 제작

본원에 기술된 표적화 벡터를 제작하는 데 사용된 기술 중 많은 것은 당업자에게 잘 알려진 표준 분자 생물학 기술이다(예를 들어, Sambrook, J., E. F. Fritsch 및 T. Maniatis. Molecular Cloning: A Laboratory Manual, Second Edition, Vols. 1, 2, 및 3, 1989; Current Protocols in, Molecular Biology, Eds. Ausubel 등의, Greene Publ. Assoc., Wiley Interscience, NY 참조). 큰 표적화 벡터를 구축하기 위한 당업계에 공지된 임의의 방법이 사용될 수 있다.

일 실시예에서, 큰 표적화 벡터(LTVEC)를 구축하는 방법은: (a) 관심 유전자/유전자들 또는 염색체 유전자좌/유전자좌들을 함유하는 큰 게놈 DNA 클론을 수득하는 단계; 및 (b) 변형 카세트에 상동 박스 1 및 2를 첨부하여 LTVEC를 생성하는 단계를 포함한다. 선택적으로, 이러한 방법은 각 LTVEC가 정확하게 조작되었음을 검증하는 단계를 더 포함할 수 있다. 선택적으로, 이러한 방법은 진핵 세포 내로 도입하기 위해 LTVEC DNA를 정제, 제작 및 선형화하는 단계를 추가로 포함할 수 있다. 이러한 방법은 US 2004/0018626, US 2013/0309670, 및 WO 2013/163394에 추가로 기술되어 있으며, 이들 각각은 모든 목적을 위해 그 전체가 참조로서 본원에 통합된다.

관심 유전자 또는 유전자좌는 상세한 구조적 또는 기능적 데이터와 같은 특정 기준에 기초하여 선택될 수 있거나, 이들은, 잠재적 유전자 또는 유전자 단편이 다양한 게놈 시퀀싱 프로젝트의 노력을 통해 예측될 수 있게 됨에 따라 이러한 상세한 정보 없이 선택될 수 있다. LTVEC를 생성하기 위해, 관심 유전자 또는 유전자좌의 완전한 서열 및 유전자 구조를 알아야 할 필요는 없다. 필요한 유일한 서열 정보는, 관심 게놈 클론을 수득하는 것뿐만 아니라, LTVEC 제조에 사용된 상동 박스를 생성하고, 정량적 대립유전자 변형(modification-of-allele; MOA) 검정에 사용하기 위한 프로브를 만들기 위한 약 80~100개의 뉴클레오티드이다.

관심 유전자 또는 유전자좌가 선택되면, 이러한 유전자 또는 유전자좌를 함유하는 큰 게놈 클론이 수득될 수 있다. 이러한 클론은, 표준 혼성화 또는 PCR 기술에 의해 적절한 DNA 라이브러리(예를 들어, BAC, PAC, YAC, 또는 코스미드)를 스크리닝하는 것을 포함하되 이에 한정되지 않는 여러 방법 중 임의의 하나에 의해 수득될 수 있거나, 당업자에게 익숙한 임의의 다른 방법에 의해 수득될 수 있다.

상동 박스는 클로닝된 큰 게놈 단편으로부터 LTVEC를 생성하는 데 사용되는 박테리아 상동성 재조합 부위를 마크한다. 상동 박스는, 변형 대상 영역의 측면에 위치하는 클로닝된 큰 게놈 단편 내의 영역과 상동이고, 일반적으로 이중가닥이며 길이가 적어도 40 뉴클레오티드인, DNA의 짧은 세그먼트들이다. 상동 박스는, 박테리아에서의 상동성 재조합에 이어서 변형 카세트가 변형 대상 영역을 대체하도록, 변형 카세트에 첨부된다. 박테리아 상동성 재조합을 사용하는 표적화 벡터의 생성 기술은 다양한 시스템에서 수행될 수 있다(예를 들어, Yang 등 (1997) Nat. Biotechnol 15:859-865, Muyrers 등 (1999) Nucleic Acids Res27:1555-1557; Angrand 등 (1999) Nucleic Acids Res 27:e16; Narayanan 등 (1999) Gene Ther 6:442-447; Yu, 등 (2000) Proc . Natl . Acad . Sci . U.S.A . 97:5978-5983을 참조하며, 이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 통합됨). 이러한 기술의 일례는 ET 클로닝(예를 들어, Zhang 등 (1998) Nat. Genet. 20:123-128; Narayanan 등 (1999) Gene Ther. 6:442-447을 참조하며, 이들 각각은 그 전체가 참조로서 본원에 통합됨) 및 이러한 기술의 변형예들이다(예를 들어, Yu 등 (2000) Proc. Natl . Acad . Sci . U.S.A . 97:5978-5983을 참조하며, 그 전체가 모든 목적을 위해 참조로서 본원에 통합됨). ET는 상동성 재조합 반응을 수행하는 recE 및 recT 단백질을 지칭한다. RecE는 선형 이중-가닥 DNA 5'의 한 가닥을 3'까지 잘라 내, 3' 단일-가닥 오버행(overhang)을 갖는 선형 이중-가닥 단편을 남기는 엑소뉴클레아제이다. 이러한 단일-가닥 돌출부는, 단일-가닥 DNA (ssDNA) 결합 활성을 갖는 recT 단백질에 의해 코팅된다. ET 클로닝은 recE와 recT의 대장균(E. coli) 유전자 산물 및 박테리오파지 람다(λ) 단백질 λgam을 일시적으로 발현하는 대장균(E. coli )을 사용해 수행된다. λgam 단백질은 상기 공여자 DNA 단편이 recBC 엑소뉴클레아제 시스템에 의해 분해되지 않도록 보호하는데, 이는 자주 사용하는 대장균 균주인 DH10b와 같은 recBC⁺ 숙주에서의 효율적인 ET 클로닝을 위해 바람직하다.

LTVEC는 DNA 조립법, 예컨대, Gibson DNA 조립 또는 Gibson DNA 조립의 변형예를 포함하는 시험관 내 DNA 조립법에 의해서도 생성될 수 있다. 예를 들어, US 2015/0376628, US 2016/0115486, WO 2015/200334, 및 US 2010/0035768을 참조하며, 이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 통합된다.

핵산을 조립하는 전통적인 방법은, 제한 효소로 종래의 효소를 소화하는 단계, 핵산을 클로닝하는 단계, 및 핵산을 함께 결합시키는 단계로 이루어지는, 시간이 소요되는 단계를 사용한다. 이들 방법은 큰 단편이나 벡터가 함께 조립될 때 더 어렵다. 그러나, 뉴클레아제(예를 들어, 가이드 RNA 및 Cas9 뉴클레아제)의 가단성(malleable) 표적 특이성이, 핵산을 신속한 조립 반응에 사용하기에 적합한 형태로 변환시키는 데 이점으로서 활용될 수 있다. 예를 들어, US 2015/0376628, US 2016/0115486, 및 WO 2015/200334를 참조하며, 이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 통합된다.

자연 발생 DNA, 클로닝된 DNA 분자, 합성에 의해 생성된 DNA 등을 포함하여, 중첩 서열을 갖는 임의의 관심 DNA 분자는 이러한 방법에 의해 조립될 수 있다. 2개의 핵산을 조립하는 것은 2개의 핵산의 가닥을 결합시키는 임의의 방법을 포함한다. 예를 들어, 조립체는 각 핵산의 가닥들이 다른 가닥 및 확장에 대해 어닐링되도록 소화된 핵산을 결합시키는 단계를 포함한다(여기서, 각각의 가닥은 다른 가닥의 확장을 위한 템플릿의 역할을 함).

임의의 시험관 내 또는 생체 내 DNA 조립법 또는 신속한 결합 방법이 핵산을 조립하는데 사용될 수 있다. 예를 들어, 중첩 말단을 갖는 제1 및 제2 핵산은 리가아제, 엑소뉴클레아제, DNA 중합 효소, 및 뉴클레오티드와 조합되어 일정한 온도, 예컨대 50℃에서 인큐베이션될 수 있다. 구체적으로, T5 엑소뉴클레아제는 상보성 오버행을 생산하는 dSdNA의 5' 말단으로부터 뉴클레오티드를 제거하는 데 사용될 수 있다. 그런 다음, 상보적 단일-가닥 DNA 오버행을 어닐링되는데, DNA 중합효소가 갭을 채우는 데 사용되고, Taq DNA 리가아제는 생성된 닉(nicks)을 50℃에서 시일(seal)하는데 사용된다. 따라서, 중첩 말단 서열을 공유하는 2개의 핵산은 1-단계 등온 반응에서 공유 시일된(covalently sealed) 분자로 결합될 수 있다. 예를 들어,, Gibson 등의 (2009) 자연 방법 6(5): 343-345를 참조하고, 그 전체는 모든 목적을 위해 참조로서 본원에 통합된다.

부위-지시 뉴클레아제 제제(예를 들어, 가이드 RNA-지시 Cas 단백질)는 그들의 엔도뉴클레아제 활성에 의해 생성된 말단 서열을 선택하고 조작함으로써 핵산의 신속하고 효율적인 조합을 가능하게 한다. 예를 들어, DNA 조립 방법은 제1 폴리뉴클레오티드를 원하는 표적 부위 및 엑소뉴클레아제에 대해 특이적인 뉴클레아제 제제(예를 들어, gRNA-Cas 복합체)와 조합할 수 있다. 표적 부위는, 뉴클레아제가 핵산을 절단할 때, 절단에 의해 생성된 단부가 제1 핵산(예를 들어, 중첩 단부)과 조립될 제2 핵산의 단부에 상보적인 영역을 갖도록 선택될 수 있다. 그런 다음, 이들 상보성 단부들을 조립하여 조립된 단일 핵산을 수득할 수 있다. 뉴클레아제 제제(예, gRNA-Cas 복합체)는 개별적인 표적 부위에 대해 특이적이기 때문에, 상기 방법은 정밀한 부위-지시 방식으로 핵산이 변형되도록 한다. 절단 시, 제2 핵산의 서열에 대해 상보성 단부 서열이 생산되도록 표적 부위 특이적인 뉴클레아제 제제(예를 들어, gRNA-Cas 복합체)를 선별함으로써, 생성된 소화 핵산을 등온 조립체를 사용해 조립할 수 있다. 따라서, 중첩 단부 서열을 형성하는 핵산 및 뉴클레아제 제제(예: gRNA-Cas 복합체)를 선별함으로써, 신속한 결합 방법에 의해 핵산이 조립되어, 신속하고 효율적인 방식으로 최종 조립 핵산이 생산될 수 있다. 대안적으로, 상보성 단부를 갖지 않는 핵산은 각각의 핵산에 대한 상보성 단부를 가지도록 설계된 조이너 올리고(joiner oligos)와 조립될 수 있다. 조이너 올리고를 사용함으로써, 2개 이상의 핵산이 균일하게 조립되어, 생성된 조립 핵산에서 불필요한 서열을 감소시킬 수 있다.

그런 다음, LTVEC가 정확히 조작되었는지 여부를 확인할 수 있다. 예를 들어, 관심 유전자 또는 염색체 유전자좌 내에 공여자 단편을 도입하여 생성된 신규한 접합부를 확인하는데 진단 PCR이 사용될 수 있다. 대안적으로 또는 추가적으로, 박테리아 상동성 재조합 프로세스 동안 원하는 변형만이 LTVEC 내로 도입되었음을 확인하기 위해 진단 제한 효소의 소화가 이뤄질 수 있다. 대안적으로 또는 추가적으로, LTVEC의 직접 시퀀싱이, 특히 변형의 부위에 걸쳐 있는 영역들에서 수행되어 관심 유전자 또는 염색체 유전자좌에 공여자 단편을 도입하여 생성된 신규한 연결부를 확인할 수 있다.

진핵 세포 내로 도입하기 위한 LTVEC DNA의 임의의 정제 및 추가 제조 후, LTVEC는 바람직하게는, 변형된 내인성 유전자 또는 긴 상동 아암이 측면에 위치하는 염색체 유전자좌 DNA를 남기는 방식으로 선형화된다. 이는 바람직하게는 벡터 백본에서, 잘 소화되지 않은 임의의 적절한 제한 효소를 사용해 LTVEC을 선형화함으로써 달성될 수 있다. 적절한 제한 효소의 예는 NotI, Pad, SfiI, SrfI, Swal, FseI, 등을 포함한다. 제한 효소의 선택은 실험적으로 (즉, 여러 상이한 후보 희귀 절단기를 시험하여) 결정되거나, LTVEC의 서열이 알려져 있는 경우, 서열을 분석하고 분석에 기초하여 적절한 제한 효소를 선택함으로써 결정될 수 있다.

C. C9orf72-HRE 핵산 작제물

DNA 서열은 녹인(knock-in) 동물용 LTVEC(예: C9ORF72-HRE)를 제조하는 데 사용될 수 있다. 전형적으로, 적절한 숙주 세포에서 폴리뉴클레오티드 분자를 복제하기 위해, 헥사뉴클레오티드 확장 서열 및/또는 선별 마커를 포함하는 폴리뉴클레오티드 분자(예를 들어, 삽입 핵산)가 벡터 내에, 바람직하게는 DNA 벡터 내에 삽입된다.

폴리뉴클레오티드 분자(또는 삽입 핵산)는 표적 유전자좌에 통합하고자 하는 DNA의 세그먼트를 포함한다. 일부 구현예에서, 삽입 핵산은 하나 이상의 관심 폴리뉴클레오티드를 포함한다. 일부 구현예에서, 삽입 핵산은 하나 이상의 발현 카세트를 포함한다. 일부 특정 구현예에서, 발현 카세트는 관심 뉴클레오티드, 선별 마커를 암호화하는 폴리뉴클레오티드 및/또는 리포터 유전자를 포함하고, 일부 특정 구현예에서는 발현에 영향을 미치는 다양한 조절 성분과 함께 포함한다. 사실상, 임의의 관심 폴리뉴클레오티드가 삽입 핵산 내에 함유되어 표적 게놈 유전자좌에서 통합될 수 있다. 본원에 개시된 방법은 표적화된 C9ORF72 게놈 유전자좌 내에 통합될 적어도 1, 2, 3, 4, 5, 또는 6개 이상의 관심 폴리뉴클레오티드를 제공한다.

일부 구현예에서, 삽입 핵산에 함유된 관심 폴리뉴클레오티드는 리포터를 암호화한다. 일부 구현예에서, 관심 폴리뉴클레오티드는 선별 마커를 암호화한다.

일부 구현예에서, 관심 폴리뉴클레오티드는 부위 특이적 재조합 부위(예: loxP, Frt 등)가 측면에 위치하거나 이를 포함한다. 일부 구현예에서, 부위 특이적 재조합 부위는 리포터를 암호화하는 DNA 세그먼트 및/또는 선별 마커를 암호화하는 DNA 세그먼트의 측면에 위치한다. 삽입 핵산 내에 포함될 수 있는 선별 마커 및 리포터 유전자를 포함하는 예시적인 관심 폴리뉴클레오티드가 본원에 기술된다.

플라스미드, DNA 작제물 및/또는 표적화 벡터의 제작 및 숙주 기관의 형질변환에 사용된 다양한 방법이 당업계에 공지되어 있다. 원핵 세포 및 진핵 세포 모두에 적합한 다른 발현 시스템 및 일반적인 재조합 절차에 관해서는, Molecular Cloning: A Laboratory Manual, 제2 판, 편집자 Sambrook, J. 외, Cold Spring Harbor Laboratory Press: 1989를 참조한다.

전술한 바와 같이, 녹인(knock-in) 동물용 표적화 벡터의 제작에 사용하기 위한 예시적인 비인간(예: 설치류) C9ORF72 핵산 및 아미노산 서열은 표 2에 제공되어 있다. 다른 비인간 C9ORF72 서열 또한 GenBank 데이터베이스에서 확인할 수 있다. 본원에 개시된 바와 같은 C9ORF72 표적화 벡터는 유전자 이식 비인간 동물의 게놈 내에 삽입하기 위한 표적 영역("상동 아암"으로도 지칭됨)의 측면 서열과 동일하거나 실질적으로 상동성인 서열이 측면에 위치하는, 이종 헥사뉴클레오티드 반복 확장 서열을 포함하고 및 리포터 유전자 및/또는 선별 마커를 암호화하는 하나 이상의 서열을 선택적으로 포함한다.

하나의 예를 들자면, 삽입 시작 지점은 제1 엑손(예: 제1 비암호화 엑손)의 상류(5'), 제1 엑손 내, 또는 제1 엑손의 하류(3')에 설정되어, 삽입 핵산이 내인성 조절 서열(예를 들어, 프로모터)에 작동 가능하게 연결되게 할 수 있다. 이종 헥사뉴클레오티드 반복 확장 서열의 표적화된 삽입을 만들기 위한 표적화 전략이 도 1b 및 도 1c에 제공된다. 약물 선택 카세트는, 약물 선택 카세트의 Cre-매개 절단을 가능하게 하는 loxP (LP) 재조합 효소 인식 부위가 측면에 위치한다. 이는 무엇보다도 선택 카세트의 절단을 가능하게 한다. 따라서, 약물 선택 카세트는 이종 헥사뉴클레오티드 반복 확장 서열만 남기고, 일부 구현예에서는 재조합 효소 인식 부위의 한 카피를 남기고, 표현형 분석 전에 제거될 수 있다.

도 1b 및 1c에 도시된, 변형된 마우스 C9orf72 대립유전자에 유용한 핵산 작제물이 본원에 개시되며, 상기 핵산 작제물은 서열번호 8 및 서열번호 9에 제시된 서열을 포함한다. 서열번호 8은 5'에서 3'까지 다음을 포함한다: 5' 상동 아암(서열번호 20); 인간 C9orf72 유전자의 엑손 1a의 일부 및 엑손 1b의 전부에 걸쳐 있고, 이를 포함하는 962 인간 bp 서열(서열번호 2); 인간 유비퀴틴 1 및/또는 Em7 프로모터에 의해 조절되는 네오마이신 내성 유전자를 함유하는 플록싱된(floxed) 네오마이신 내성 카세트(서열번호 21); 및 3' 상동 아암(서열번호 22)을 포함한다. 서열번호 9는 5'에서 3'까지 다음을 포함한다: 5' 상동 아암(서열번호 23); 인간 C9orf72 유전자의 엑손 1a의 일부 및 엑손 1b의 전부에 걸쳐 있고, 이를 포함하는 1261 인간 bp 서열(서열번호 3); 인간 유비퀴틴 1 및/또는 Em7 프로모터에 의해 조절되는 네오마이신 내성 유전자를 함유하는 플록싱된(floxed) 네오마이신 내성 카세트(서열번호 24); 및 3' 상동 아암(서열번호 25)을 포함한다.

본원에서 기술된 바와 같이, 이종 헥사뉴클레오티드 반복 확장 서열을 내인성 C9orf72 유전자좌에 삽입하는 것은, C9orf72 유전자좌 또는 그 일부를 삽입 핵산과 대체하거나, 상기 유전자좌에 상기 삽입 핵산을 삽입/추가하는 것을 포함할 수 있다. 일부 구현예에서, 삽입 핵산은 리포터 유전자를 포함한다. 일부 특정 구현예에서, 리포터 유전자는 내인성 C9orf72 프로모터와 작동 가능하게 연결되어 위치된다. 이러한 변형은 내인성 C9orf72 프로모터에 의해 유도되는 리포터 세포의 발현을 가능하게 한다. 대안적으로, 리포터 유전자는 내인성 C9orf72 프로모터와 작동 가능하게 연결되어 위치되지 않는다.

다양한 리포터 유전자(또는 검출 가능한 모이어티)가 본원에 기술된 표적화 벡터에 사용될 수 있다. 예시적인 리포터 유전자는, 예를 들어, b-갈락토시다아제(암호화된 lacZ 유전자), 녹색 형광 단백질(Green Fluorescent Protein; GFP), 강화된 녹색 형광 단백질(eGFP), MmGFP, 청색 형광 단백질(BFP), 강화된 청색 형광 단백질(eBFP), mPlum, mCherry, tdTomato, mStrawberry, J-Red, DsRed, mOrange, mKO, mCitrine, Venus, YPet, 황색 형광 단백질(YFP), 강화된 황색 형광 단백질(eYFP), 에머랄드(Emerald), CyPet, 홍색 형광 단백질(CFP), 진청색(Cerulean), T-Sapphire, 루시퍼라제(luciferase), 알칼리 포스파타아제(alkaline phosphatase), 또는 이들의 조합을 포함한다. 본원에 기술된 방법은, b-갈락토시다아제를 암호화하는 lacZ 리포터 유전자의 용도를 이용하는 표적화 벡터의 제작을 입증하지만, 본 개시를 읽음으로써 당업자는 본원에 기술된 비인간 동물이 리포터 유전자 없이 또는 당업계에 알려진 임의의 리포터 유전자로 생성될 수 있다는 것을 이해할 것이다.

적절한 경우, 리포터 폴리펩티드를 전체적으로 또는 부분적으로 암호화하는 유전 물질 또는 폴리뉴클레오티드 서열(들)의 코딩 영역은, 비인간 동물에서의 발현에 최적화된 코돈을 포함하도록 변형될 수 있다(예를 들어, 미국 특허 제5,670,356호 및 제5,874,304호를 참조함). 코돈 최적화된 서열은 합성 서열이고, 바람직하게는 코돈 최적화되지 않은 모 폴리뉴클레오티드에 의해 암호화되는 동일한 폴리펩티드(또는 전장 폴리펩티드와 실질적으로 동일한 활성을 갖는 전장 폴리펩티드의 생물학적으로 활성인 단편)를 암호화한다. 일부 구현예에서, 리포터 폴리펩티드(예: lacZ)를 전체적 또는 부분적으로 암호화하는 유전 물질의 코딩 영역은, 코돈의 용도를 특정한 세포 유형(예를 들어, 설치류 세포)에 맞게 최적화시키도록 변경된 서열을 포함할 수 있다. 예를 들어, 비인간 동물(예: 설치류)의 게놈에 삽입될 리포터 유전자의 코돈은 비인간 동물의 세포에서의 발현에 대해 최적화될 수 있다. 이러한 서열은 코돈 최적화 서열로 기술될 수 있다.

본원에 기술된 바와 같은 내인성 C9ORF72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열 파괴의 삽입을 포함하는 비인간 동물을 만들기 위한 조성물 및 방법이 제공되며, 이에는, 예를 들어, 내인성 마우스 프로모터와 같은 C9ORF72 프로모터로부터 이종 헥사뉴클레오티드 서열을 발현하고 , 예를 들어, 엑손 1a 및 1b에서 발견되는 인간 조절 서열과 같은 C9ORF72 조절 서열을 발현하는 비인간 동물을 만들기 위한 조성물 및 방법이 포함된다. 일부 구현예에서, 내인성 프로모터 및 내인성 조절 서열로부터 이종 헥사뉴클레오티드 반복 확장 서열을 발현하는 비인간 동물을 만들기 위한 조성물 및 방법이 또한 제공된다. 상기 방법은 C9ORF72 유전자좌의 비암호화 서열이 전체적으로 또는 부분적으로 결실되도록, 본원에 기술된 바와 같이, 이종 헥사뉴클레오티드 반복 확장 서열을 암호화하는 표적화 벡터를 비인간 동물의 게놈 내로 도입하는 것을 포함한다. 일부 구현예에서, 본원에 기술된 비인간 동물은 본원에 기술된 바와 같은 표적화 벡터를 포함하는 내인성 C9ORF72 유전자좌를 포함한다.

본원에 기술된 표적화 벡터는 ES 세포에 도입되어, Frendewey, D., 등의, 2010, Methods Enzymol. 476:295-307에 기술된 바와 같은 C9orf72 유전자좌에 파괴를 보유하는 ES 클론에 대해 스크리닝될 수 있다. 다양한 숙주 배아가 본원에 기술된 방법 및 조성물에 사용될 수 있다. 예를 들어, 표적화된 유전자 변형을 갖는 다능성(pluripotent) 및/또는 재생성(totipotent) 세포가 상응하는 기관으로부터 전 상실배기(pre-morula stage) 배아(예: 8세포 단계 배아)에 도입될 수 있다. 예를 들어, US 7,576,259, US 7,659,442, US 7,294,754, 및 US 2008/0078000 A1을 참조하며, 이들 모두는 그 전체가 참조로서 본원에 통합된다. 다른 경우에, 공여자 ES 세포는 2세포 단계, 4세포 단계, 8세포 단계, 16세포 단계, 32세포 단계, 또는 64세포 단계의 숙주 배아에 이식될 수 있다. 숙주 배아는 배반포(blastocyst)일 수도 있고, 배반포 전 배아(pre-blastocyst embryo), 상실배기 전 배아(pre-morula stage embryo), 상실배기 배아(morula stage embryo), 전기 상실배기 배아(uncompacted morula stage embryo), 또는 후기 상실배기 배아(compacted morula stage embryo)일 수 있다.

일부 구현예에서, VELOCIMOUSE® 법(Poueymirou, W.T. 외, 2007, Nat. Biotechnol. 25:91-99)이 적용되어 양성 ES 세포를 8세포 배아에 주입하여 lacZ 발현 프로파일링 또는 동형 접합성 교배가 즉시 가능한 완전한 ES 세포 유래 F0 생성 이형접합체 마우스를 생성할 수 있다. C9orf72 유전자좌에서 파괴를 갖는 비인간 동물을 생성하는 예시적인 방법은 실시예 1에서 제공된다.

유전자이식 비인간 동물을 생성하는 방법으로서, 넉아웃(knockouts)과 넉인(knock-ins)을 포함하는 방법은 당업계에 잘 알려져 있다(예를 들어, Gene Targeting: A Practical Approach, Joyner, ed., Oxford University Press, Inc. (2000) 참조). 예를 들어, 유전자이식 설치류를 생성하는 것은, 내인성 설치류 유전자의 유전자좌를 파괴하는 것 및 리포터 유전자를 설치류 게놈 내로 도입하되, 일부 구현예에서는, 내인성 설치류 유전자와 동일한 위치에 도입하는 것을 선택적으로 포함할 수 있다.

마우스 C9orf72의 게놈 조직의 개략도(척도에 비례하지 않음)가 도 1a에 제공된다(상단 박스). 이종 헥사뉴클레오티드 반복 확장 서열을 갖는 내인성 쥣과 C9orf72 유전자좌의 비암호화 서열을 대체하기 위한 예시적인 표적화 전략이 또한 도 1a(하단 박스)에 제공된다. 도시된 바와 같이, 엑손 1 및 ATG 시작 코돈 사이에 걸쳐 있는 게놈 DNA 또는 그 일부는 부위 특이적 재조합효소 인식 부위가 측면에 위치한 약물 선택 카세트 및 이종 헥사뉴클레오티드 반복 확장 서열과 대체된다. 이러한 전략에 사용된 표적화 벡터는, 재조합 효소가 미분화 세포(undifferentiated cells)에서 발현되도록 발달적으로 조절되는 프로모터에 작동 가능하게 연결되는 재조합 효소 암호화 서열을 선택적으로 포함할 수 있다. 본원에 기술된 표적화 벡터에 포함될 수 있는 예시적인 발달적으로 조절되는 프로모터는 표 3에 제공된다. 본원에 기술된 표적화 벡터에 사용될 수 있는 추가적인 적합한 프로모터는 미국 특허 번호 제8,697,851호, 제8,518,392호 및 제8,354,389호에 기술된 것들을 포함하며, 이들 모두는 참조로서 본원에 통합된다. 상동성 재조합 시, 비암호화 서열, 예를 들어, 내인성 쥣과 C9orf72 유전자좌의 엑손 1 내지 엑손 2에 (또는 엑손 1 내에) 걸쳐 있는 대략 800~1000 bp는 표적화 벡터에 함유된 서열로 대체된다. 약물 선택 카세트는 제거될 수 있으며, 선택적으로는, 예를 들어, 전술한 C9orf72 유전자좌에 파괴를 함유하는 생식계열 세포를 가진 마우스 유래의 자손이 발달 도중에 분화된 세포로부터 선별 마커를 제거하게 되도록, 발달 의존적 방식으로 제거될 수 있다(참조: 미국 특허 번호 제8,697,851호, 제8,518,392호 및 제8,354,389호; 이들 모두는 본원에 참조로서 통합됨).

[표 3]

D. 세포 내로 LTVEC 도입

LTVEC DNA는 임의의 표준 방법을 사용하여 진핵 세포 내에 도입될 수 있다. "도입(introducing)"은 서열이 세포의 내부에 접근하는 방식으로 핵산을 세포에게 제시하는 것을 포함한다. 도입은 임의의 수단에 의해 달성될 수 있다.

본원에 제공된 방법은, 핵산이 적어도 하나의 세포 내부에 접근하는 한, 핵산을 세포 내로 도입하기 위한 특정 방법에 의존하지 않는다. 다양한 세포 유형 내에 핵산을 도입하는 방법은 당업계에 공지되어 있으며, 예를 들어, 안정한 형질감염 방법, 일시적인 형질감염 방법, 및 바이러스-매개 방법을 포함한다.

형질감염 프로토콜을 비롯해 핵산을 세포 내로 도입하는 프로토콜은 다양할 수 있다. 비제한적인 형질감염 방법은, 리포좀; 나노입자; 칼슘 포스페이트(예를 들어, Graham 등 (1973). Virology 52 (2): 456-67, Bacchetti 등 (1977) Proc Natl Acad Sci USA 74 (4): 1590-4 및, Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company. pp. 96-97 참조); 덴드리머; 또는 DEAE-덱스트란이나 폴리에틸렌이민과 같은 양이온 중합체를 사용하는 화학-기반 형질감염 방법을 포함한다. 비화학적인 방법은 전기천공법(electroporation), 초음파천공법(Sono-poration), 및 광학 형질감염(optical transfection)을 포함한다. 입자-기반 형질감염은 유전자 총의 사용, 또는 자석-활용식 형질감염(magnet-assisted transfection)을 포함한다(예를 들어, Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-285를 참조하며, 그 전체는 참조로서 본원에 통합됨). 바이러스성 방법도 형질감염에 사용될 수 있다.

세포 내로의 핵산 도입은 전기천공법에 의해, 세포질 내 주사에 의해, 바이러스 감염에 의해, 아데노바이러스에 의해, 아데노-연관 바이러스에 의해, 렌티바이러스에 의해, 레트로바이러스에 의해, 형질감염에 의해, 지질-매개 형질감염에 의해, 또는 뉴클레오펙션(nucleofection)에 의해 매개될 수 있다. 뉴클레오펙션은 핵산 기재가 세포질에 전달될 수 있게할 뿐만 아니라 핵막(nuclear membrane)을 통해 핵 내로 전달될 수 있게 하는 개선된 전기천공 기술이다. 또한, 본원에 개시된 방법에서 뉴클레오펙션을 사용하는 것은 정상적인 전기천공법보다 훨씬 적은 수의 세포를 필요로 한다(예를 들어, 정상적인 전기 천공법에는 7백만개가 필요한 것에 비해 약 2백만개만 필요함). 일 실시예에서, 뉴클레오펙션은 LONZA^® NUCLEOFECTOR?? 시스템을 사용해 수행된다.

세포(예를 들어, 단세포 단계 배아) 내로 핵산을 도입하는 것은 미세주입에 의해서도 이루어질 수 있다. 단세포 단계 배아에서의 미세주입은 모계 전핵 및/또는 부모 전핵 내로, 또는 세포질 내로 주입되는 것일 수 있다. 미세주입이 단 하나의 전핵에만 주입되는 경우, 크기가 더 큰 부계 전핵이 바람직하다. mRNA의 미세 주입은 바람직하게는 (예를 들어, mRNA를 번역 기관에 직접 전달하기 위해) 세포질 내로의 주입이 바람직하지만, 단백질 또는 Cas 단백질을 암호화하는 DNA를 암호화하는 DNA의 미세주입은 핵/전핵 내로의 주입인 것이 바람직하다. 대안적으로, 미세주입은 핵/전핵 및 세포질 모두의 내로 주입하는 것에 의해 수행될 수 있는데: 바늘이 먼저 핵/전핵에 도입될 수 있고, 제1 양이 주입할 수 있으며, 단세포 단계 배아로부터 바늘을 제거하면서 제2 양이 세포질 내로 주입될 수 있다. 뉴클레아제 제제 단백질이 세포질 내로 주입되는 경우, 단백질은 핵/전핵으로의 전달을 보장하기 위한 핵 국재화 신호를 포함하는 것이 바람직하다. 미세주입을 수행하는 방법은 잘 알려져 있다. 예를 들어, Nagy 등의, 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Meyer 등의 (2010) Proc . Natl . Acad . Sci . 미국 107:15022-15026, 및 Meyer 등의 (2012) Proc. Natl . Acad . Sci . USA 109:9354-9359를 참조하며, 이들 각각은 그 전체가 참조로서 본문에 통합된다.

핵산 또는 단백질을 세포 내로 도입하기 위한 다른 방법은, 예를 들어, 벡터 전달, 입자-매개 전달, 엑소좀-매개 전달, 지질-나노입자-매개 전달, 세포-관통-펩티드-매개 전달, 또는 이식형-장치-매개 전달을 포함할 수 있다.

핵산을 세포 내로 도입하는 것은 한 번 수행되거나 일정 시간에 걸쳐 여러 번 수행될 수 있다. 예를 들어, 도입은 일정 기간에 걸쳐서 적어도 2회, 일정 기간에 걸쳐서 적어도 3회, 일정 기간에 걸쳐서 적어도 4회, 일정 기간에 걸쳐서 적어도 5회, 일정 기간에 걸쳐서 적어도 6회, 일정 기간에 걸쳐서 적어도 7회, 일정 기간에 걸쳐서 적어도 8회, 일정 기간에 걸쳐서 적어도 9회, 일정 기간에 걸쳐서 적어도 10회, 일정 기간에 걸쳐서 적어도 11회, 일정 기간에 걸쳐서 적어도 12회, 일정 기간에 걸쳐서 적어도 13회, 일정 기간에 걸쳐서 적어도 14회, 일정 기간에 걸쳐서 적어도 15회, 일정 기간에 걸쳐서 적어도 16회, 일정 기간에 걸쳐서 적어도 17회, 일정 기간에 걸쳐서 적어도 18회, 일정 기간에 걸쳐서 적어도 19회, 또는 일정 기간에 걸쳐서 적어도 20회 수행될 수 있다.

E. 표적화된 유전적 변형을 갖는 세포에 대한 스크리닝 및 동정

LTVEC이 도입된 세포는, 조작된 선별 마커가 LTVEC 내에 있는지 여부에 따라, 선별 제제에 노출시킴으로써 성공적으로 선별될 수 있다. 비제한적인 예로서, 선별 마커가 네오마이신 포스포트랜스페라아제 (neo) 유전자인 경우(예를 들어, Beck 등 (1982) Gene 19:327-336을 참조하며, 그 전체는 모든 목적을 위해 참조로서 본문에 통합됨), 상기 LTVEC을 가진 세포는 G418 함유 배지에서 선별될 수 있는데; LTVEC이 없는 세포는 사멸되는 반면, LTVEC을 가진 세포는 생존한다(예를 들어, Santerre, 등 (1984) Gene 30:147-156을 참조하며, 그 전체는 모든 목적을 위해 참조로서 본원에 통합됨). 이러한 선별 마커는, 예를 들어, G418, 하이그로마이신, 블라스미딘, 네오마이신 또는 퓨로마이신과 같은 항생제에 대한 저항성을 부여할 수 있다. 이러한 선별 마커는 네오마이신 포스포트랜스페라아제(neo^r), 하이그로마이신 B 포스포트랜스페라아제(hyg^r), 퓨로마이신-N-아세틸트랜스페라아제(puro^r), 및 블라스티딘 S 탈아미나제(bsr^r)를 포함한다. 또 다른 실시예에서, 선별 마커는 유도성 프로모터에 작동 가능하게 연결되고, 선별 마커의 발현은 세포에 대해 독성이다. 이러한 선별 마커의 비제한적인 예는 크산틴/구아닌 포스포리보실 트랜스페라아제(gpt), 하이폭틴-구아닌 포스포리보실트랜스퍼라아제(HGPRT) 또는 단순 헤르페스 바이러스 티미딘 키나제(HSV-TK)를 포함한다.

본원에 개시된 방법은 변형된 게놈을 갖는 세포를 동정하는 단계를 더 포함할 수 있다. 결실 또는 삽입과 같은 표적화된 유전적 변형을 갖는 세포를 동정하기 위해 다양한 방법이 사용될 수 있다. 이러한 방법은 표적 유전자좌에서 표적화된 유전적 변형을 갖는 하나의 세포를 동정하는 단계를 포함할 수 있다.

긴 범위의 PCR, 생거 시퀀싱 또는 서던 블롯팅과 같은, 표적화된 변형에 대한 스크리닝하기 위한 종래의 검정은 삽입된 표적화 벡터를 표적화된 유전자좌에 연결시킨다. 예를 들어, 장기 PCR 검정의 경우, 하나의 프라이머는 삽입된 DNA 내의 서열을 인식할 수 있는 반면, 다른 하나는 표적화 벡터의 상동 아암의 단부들 너머에 있는 관심 게놈 영역을 인식한다. 그러나, 상동 아암이 크기 때문에, LTVEC은 이러한 종래의 검정에 의한 스크리닝을 허용하지 않는다. LTVEC 표적화를 스크리닝하기 위해, 대립유전자 상실(LOA) 검정 및 대립유전자 획득(GOA) 검정을 포함하는 대립유전자 변형(MOA) 검정이 사용될 수 있다(예를 들어,US 2014/0178879 및 Frendewey 등의 (2010) Methods Enzymol . 476:295-307을 참조하며,이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 포함됨). 대립유전자 상실(LOA) 검정은 종래의 스크리닝 로직을 반전(invert)시키며, 돌연변이가 유도된 천연 유전자좌의 카피 수를 정량화한다. 정확하게 표적화된 세포 클론에서, LOA 검정은 (X 또는 Y 염색체에 없는 유전자에 대해) 2개의 천연 대립유전자 중 하나를 검출하고, 다른 대립유전자는 표적화된 변형에 의해 파괴된다. 동일한 원리는 삽입된 표적화 벡터의 카피 수를 정량화하기 위한 대립유전자 획득(GOA) 검정으로서 역으로 적용될 수 있다. 예를 들어, GOA 및 LOA 검정을 결합하여 사용하면, 정확하게 표적화된 이형접합체 클론이 천연 표적 유전자의 하나의 카피를 상실하고 약물 내성 유전자 또는 다른 삽입된 마커의 하나의 카피를 획득한 것으로 드러나게 될 것이다.

하나의 예로서, 정량적 중합효소 연쇄 반응(qPCR)은 대립유전자 정량화의 방법으로서 사용될 수 있지만, 표적 유전자의 0개, 1개 및 2개의 카피 사이의 차이, 핵산 삽입체의 0개, 1개 및 2개의 카피 사이의 차이를 신뢰성 있게 구분할 수 있는 임의의 방법이 MOA 분석을 개발하는데 사용될 수 있다. 예를 들어, TAQMAN^®은 게놈 DNA 샘플에서 DNA 템플릿의 카피 수를, 특히 기준 유전자와 비교함으로써, 정량화하는 데 사용될 수 있다(예를 들어, 미국 특허 제6,596,541호를 참조하며, 그 전체가 모든 목적을 위해 참조로서 본원에 통합됨). 기준 유전자는 표적 유전자(들) 또는 유전자좌(들)와 동일한 게놈 DNA에서 정량화된다. 따라서, 2번의 TAQMAN^® 증폭이 (매번 각각의 프로브를 사용해) 수행된다. 하나의 TAQMAN^® 프로브는 기준 유전자의 "Ct"(임계 사이클)를 결정하고, 다른 프로브는 성공적인 표적화(즉, LOA 검정)로 대체되는 표적화된 유전자(들) 또는 유전자좌(들)의 영역에 대한 Ct를 결정한다. Ct는 TAQMAN^® 프로브 각각에 대한 시작 DNA의 양을 반영하는 수량인데, 덜 풍부한 서열은 임계 사이클에 도달하기 위해 더 많은 사이클의 PCR을 필요로 한다. TAQMAN^® 반응에 대한 템플릿 서열의 카피 수를 절반으로 감소시키면 약 하나의 Ct 단위가 증가될 것이다. 표적 유전자(들) 또는 유전자좌(들)의 하나의 대립유전자가 상동성 재조합에 의해 대체된 세포에서의 TAQMAN^® 반응은, 비표적화 세포 유래의 DNA와 비교해 기준 유전자에 대한 Ct를 증가시키지 않고, 표적 TAQMAN^® 반응에 대한 하나의 Ct를 증가시킬 것이다. GOA 검정의 경우, 성공적인 표적화에 의해 표적화된 유전자(들) 또는 유전자좌(들)를 대체하는 핵산 삽입체의 Ct를 결정하기 위해 또 다른 TAQMAN^® 프로브가 사용될 수 있다.

상기 스크리닝 단계는 또한 아암-특이적 검정을 포함할 수 있는데, 이는 표적 게놈 유전자좌 외부의 게놈 위치 내에 무작위하게 유전자 이식 삽입된 핵산 삽입체로부터 표적 게놈 유전자좌 내에 정확하게 표적화 삽입된 핵산 삽입체를 구별하기 위해 사용되는 분석이다. 아암-특이적 검정은 LTVEC 상동 아암에서 DNA 템플릿의 카피 수를 결정한다. 예를 들어, US 2016/0177339, WO 2016/100819, US 2016/0145646, 및 WO 2016/081923을 참조하며, 이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 통합된다. LTVEC에 의한 정확한 표적화를 검증하기 위해 표준 LOA 및 GOA 검정을 확대하는 것이 유용할 수 있다. 예를 들어, LOA 및 GOA 검정만으로는, 표적 게놈 유전자좌의 결실이 게놈 내 다른 곳에서의 LTVEC의 무작위 통합과 동시에 일어나는 클론으로부터, 정확하게 표적화된 세포 클론을 구별하지 못할 수 있다. 표적화된 세포 내의 선택 압력은 선택 카세트를 기반으로 하기 때문에, 게놈 내 다른 곳에서 유전자 이식에 의한 LTVEC의 무작위 통합은 일반적으로 선택 카세트 및 LTVEC 인접 영역을 포함하게 되지만, LTVEC의 더 원위에 있는 영역은 포함하지 않을 수 있다. 예를 들어, LTVEC의 일부가 게놈 내로 무작위 통합되고, 선택 카세트가 3' 상동 아암에 인접한 상태에서 LTVEC이 길이가 5 kb 이상인 핵산 삽입체를 포함하는 경우, 일부 경우에 3' 상동 아암은 선택 카세트와 유전자 이식에 의해 통합되지만 5' 상동 아암은 통합되지 않을 것이다. 대안적으로, 선택 카세트가 5' 상동 아암에 인접해 있으면, 일부 경우에, 3' 상동 아암이 아니라 5' 상동 아암이 선택 카세트와 유전자 이식에 의해 통합될 것이다. 일 예로서, LOA 및 GOA 검정이 LTVEC의 표적화된 통합을 평가하는 데 사용되고, GOA 검정이 LTVEC의 선택 카세트 또는 임의의 다른 고유한(비-아암) 영역에 대한 프로브를 사용하는 경우, 유전자 이식에 의한 LTVEC의 무작위 통합과 결합된 표적 게놈 유전자좌에서의 이형접합성 결실은 표적 게놈 유전자좌에서 LTVEC의 이형접합성 표적화 통합과 동일한 판독 결과를 제공할 것이다. LTVEC에 의한 정확한 표적화를 검증하기 위해, 아암 특이적 검정은 LOA 및/또는 GOA 검정과 함께 사용될 수 있다.

적절한 정량적 검정의 다른 예에는, 형광-매개 인시츄 혼성화(fluorescence-mediated in situ hybridization; FISH), 비교 게놈 혼성화(comparative genomic hybridization), 등온 DNA 증폭(isothermic DNA amplification), 고정 프로브(immobilized probe(s)), INVADER^® 프로브, TAQMAN^® 분자 비콘 프로브, 또는 ECLIPSE?? 프로브 기술이 포함된다(예를 들어, US 2005/0144655를 참조하며, 그 전체는 모든 목적을 위해 참조로서 본원에 통합됨).

차세대 시퀀싱(NGS)도 스크리닝에 사용될 수 있는데, 특히 변형된 단세포 단계 배아의 스크리닝에 사용될 수 있다. 차세대 시퀀싱은 "NGS" 또는 "대량 병렬 시퀀싱" 또는 "고 처리량 시퀀싱"으로도 지칭될 수도 있다. 이러한 NGS는 표적화된 유전적 변형의 정확한 특성을 정의하고 모자이크 현상을 검출하기 위한 MOA 검정 및 보유 검정(retention assays)에 추가하여 스크리닝 도구로서 사용될 수 있다. 모자이크 현상(mosaicism)은 단일 수정란(즉, 접합자)에서 성장한 하나의 개체 내에 상이한 유전자형을 갖는 둘 이상의 세포 집단이 존재함을 지칭한다. 본원에 개시된 방법에서는, 선별 마커를 사용해 표적화된 클론을 스크리닝할 필요가 없다. 예를 들어, 본원에 기술된 MOA 및 NGS 검정은 선택 카세트를 사용하지 않고도 신뢰할 수 있다.

F. 유전적으로 변형된 비인간 동물을 제조하는 방법

유전적으로 변형된 비인간 동물은 본원에 개시된 다양한 방법을 사용하여 생성될 수 있다. 이러한 유전적으로 변형된 비인간 동물을 생산하는데는, 본원에 기술된 방법을 포함하여, 유전적으로 변형된 유기체를 생산하기 위한 임의의 편리한 방법 또는 프로토콜이 적합하다. 배아 줄기(ES) 세포와 같은 다능성 세포를 유전적으로 변형시키는 것으로 시작하는 이러한 방법은 일반적으로 다음을 포함한다: (1) 본원에 기술된 방법을 사용하여, 단세포 단계 배아가 아닌 다능성 세포의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 다능성 세포를 동정 또는 선별하는 단계; (3) 유전적으로 변형된 다능성 세포를 숙주 배아 내로 도입하는 단계; 및 (4) 유전적으로 변형된 다능성 세포를 포함하는 숙주 배아를 대리모에 이식하여 임신시키는 단계. 그런 다음, 대리모는, 표적화된 유전적 변형을 포함하고 생식선을 통해 표적화된 유전적 변형을 전달할 수 있는 F0 세대 비인간 동물을 생산할 수 있다. 유전적으로 변형된 게놈 유전자좌를 갖는 동물은 본원에 기술된 바와 같은 대립유전자(MOA) 검정을 변형시켜 동정할 수 있다. 공여자 세포는 배반포 단계 또는 상실배 전단계(즉, 4세포 단계 또는 8세포 단계)와 같은 임의 단계의 숙주 배아에 도입될 수 있다. 생식선을 통해 유전적 변형을 전달할 수 있는 자손이 생성된다. 다능성 세포는, 예를 들어, 본원의 어느 부분에서 논의된 바와 같은 ES 세포(예: 설치류 ES 세포, 마우스 ES 세포, 또는 랫트 ES 세포)일 수 있다. 예를 들어, 미국 특허 제7,294,754호를 참조하며, 그 전체는 모든 목적을 위해 참조로서 본원에 통합된다.

대안적으로, 단세포 단계 배아를 유전적으로 변형시키는 것으로 시작하는 이러한 방법은 일반적으로: (1) 본원에 기술된 방법을 사용하여 단세포 단계 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 동정 또는 선별하는 단계; (3) 유전적으로 변형된 배아를 대리모에 이식하여 임신시키는 단계를 포함한다. 그런 다음, 대리모는, 표적화된 유전적 변형을 포함하고 생식선을 통해 표적화된 유전적 변형을 전달할 수 있는 F0 세대 비인간 동물을 생산할 수 있다. 유전적으로 변형된 게놈 유전자좌를 갖는 동물은 본원에 기술된 바와 같은 대립유전자(MOA) 검정을 변형시켜 동정할 수 있다.

핵 전달 기술도 비인간 포유류 동물을 생성하는 데 사용될 수 있다. 간단히 설명하자면, 핵전사를 위한 방법은: (1) 난모 세포를 탈핵시키거나 탈핵된 난모 세포를 제공하는 단계; (2) 탈핵된 난모 세포와 결합될 공여자 세포 또는 핵을 단리하거나 제공하는 단계; (3) 공여자 세포 또는 핵을 탈핵된 난모 세포에 삽입하여 재구성 세포를 형성시키는 단계; (4) 재구성 세포를 비인간동물의 자궁에 이식하여 배아를 형성시키는 단계; 및 (5) 배아를 성장시키는 단계를 포함할 수 있다. 이러한 방법에서, 난모 세포를 살아있는 동물의 난관(oviducts) 및/또는 난소(ovaries)에서 단리할 수도 있지만, 일반적으로는 죽은 동물로부터 수거한다. 탈핵에 앞서, 당업자에게 알려진 다양한 배지에서 난모 세포를 성숙시킬 수 있다. 난모세포의 탈핵은 당업자에게 잘 알려진 다수의 방식으로 수행될 수 있다. 탈핵된 난모 세포 내에 공여자 세포 또는 핵을 삽입하여 재구성 세포를 형성시키는 것은, 융합 이전에 투명대(zona pellucida) 아래에 공여자 세포를 미세주입하는 것에 의한 것일 수 있다. 융합은, 접촉/융합면에 걸쳐 DC 전기 펄스를 적용(전기 융합)시키거나, 폴리에틸렌 글리콜과 같은 융합 촉진 화학물질에 세포를 노출시키거나, 센다이 바이러스(Sendai virus)와 같은 비활성화 바이러스를 통해 유도될 수 있다. 재구성 세포는 핵 공여자와 수여자 난모 세포의 융합 이전, 도중 및/또는 이후에 전기적 및/또는 비전기적 수단에 의해 활성화될 수 있다. 활성화 방법에는 전기 펄스, 화학적으로 유도된 충격, 정자에 의한 침투, 난모 세포에서 2가 양이온 레벨의 증가, 및 (키나아제 억제제를 통한) 난모 세포에서 세포 단백질의 인산화 감소가 포함된다. 활성화된 재구성 세포 또는 배아는 당업자에게 잘 알려진 배지에서 배양된 후, 동물의 자궁에 옮겨질 수 있다. 예를 들어, US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234, 및 미국 특허 제7,612,250호를 참조하며, 이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 통합된다.

본원에 제공된 다양한 방법을 사용해 유전적으로 변형된 비인간 F0 동물을 생성할 수 있으며, 상기 유전적으로 변형된 F0 동물의 세포는 표적화된 유전적 변형을 포함한다. 표적화된 유전적 변형을 갖는 F0 동물 내의 세포의 수는 F0 동물을 생성하는 데 사용되는 방법에 따라 달라질 것임을 알 수 있을 것이다. 예를 들어, VELOCIMOUSE^® 방법을 통해 상응 유기체(예: 8세포 단계 마우스 배아)의 상실 전단계 배아 내에 공여자 ES 세포를 도입하면, F0 동물의 세포 집단 중 더 많은 백분율이 표적화된 유전적 변형을 갖는 세포를 포함할 수 있다. 예를 들어, US 2014/0331340, US 2008/0078001, US 2008/0028479, US 2006/0085866, 및 WO 2006/044962를 참조하며, 이들 각각은 그 전체가 모든 목적을 위해 참조로서 본원에 통합된다. 예를 들어, 비인간 F0 동물에 기여한 세포의 적어도 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%는 표적화된 유전적 변형을 갖는 세포 집단을 포함할 수 있다. 또한, F0 동물의 생식 세포 중 적어도 하나 이상은 표적화된 유전적 변형을 가질 수 있다.

유전적으로 변형된 파운더 비인간 동물은, 그의 게놈 내에, 이종 헥사뉴클레오티드 반복 확장 서열과 대체되는 내인성 게놈 C9ORF72 서열이 부재하는 것 및/또는 비인간 동물의 조직 또는 세포 내에, 이종 헥사 뉴클레오티드 반복 확장 서열, 약물 내성 유전자 및/또는 리포터가 존재하는 것(및/또는 발현하는 것)에 기초하여 식별될 수 있다. 그런 다음, 유전자이식 파운더 비인간 동물은 이종 헥사뉴클레오티드 반복 확장 서열을 갖는 추가 비인간 동물을 교배시켜, 각각 본원에 기술된 바와 같은 C9ORF72 유전자좌의 하나 이상의 카피를 갖는 일련의 비인간 동물을 생성하는 데 사용될 수 있다.

유전자이식 비인간 동물은 이식유전자의 발현을 조절하거나 유도할 수 있는 선택된 시스템을 함유하도록 생산될 수도 있다. 예시적인 시스템은 박테리오파지 P1의 Cre/loxP 재조합 효소 시스템(예를 들어, Lakso, M. 외, 1992, Proc. Natl. Acad. Sci. USA 89:6232-6236 참조) 및 S. 세레비시아(S. cerevisiae)의 FLP/Frt 재조합 효소 시스템(O'Gorman, S. 외, 1991, Science 251:1351-1355)을 포함한다. 이러한 동물은 "이중(double)" 유전자 이식 동물의 제작을 통해, 예를 들어, 2마리의 유전자 이식 동물, 즉 이종 헥사뉴클레오티드 반복 확장 서열을 암호화하는 이식 유전자를 함유하는 한 마리와, 재조합 효소(예: Cre 재조합 효소)를 암호화하는 이식 유전자를 함유하는 다른 한마리의 교배시킴으로써 제공될 수 있다.

본원에서는, 마우스의 내인성 C9ORF72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열의 삽입체를 이용하는 구현예가 집중적으로 논의되지만, C9ORF72 유전자좌에서 파괴를 포함하는 다른 비인간 동물도 제공된다. 이러한 비인간 동물은, 예를 들어 포유류, 예를 들어 마우스, 랫트, 토끼, 돼지, 소(예: 젖소, 황소, 버팔로), 사슴, 양, 염소, 닭, 고양이, 개, 흰담비, 영장류(예: 마모셋, 붉은털 원숭이) 등을 포함하여, 본원에 개시된 바와 같은 C9ORF72 유전자좌의 비암호화 서열을 대체하도록 유전자 변형될 수 있는 임의의 것들을 포함한다. 예를 들어, 적합하게 유전자 변형가능한 ES 세포를 쉽게 구할 수 없는 비인간 동물의 경우, 유전자 변형을 포함하여 비인간 동물을 제조하기 위한 다른 방법이 채용된다. 이러한 방법은, 예를 들어, 비ES 세포 게놈(예를 들어, 섬유아세포 또는 유도 다능성 세포)을 변형하는 단계 및 적합한 세포, 예를 들어, 핵이 없는 난모세포에 유전자 변형된 게놈을 전달하기 위해 체세포 핵 전달(SCNT)을 채용하는 단계, 및 변형된 세포(예를 들어, 변형된 난모세포)를 배아를 형성하기에 적합한 조건 하에 비인간 동물에 잉태시키는 단계를 포함한다.

간단히 설명하자면, 핵전사를 위한 방법은: (1) 난모 세포를 탈핵하는 단계; (2) 탈핵된 난모 세포와 결합될 공여자 세포 또는 핵을 단리하는 단계; (3) 공여자 세포 또는 핵을 탈핵된 난모 세포에 삽입하여 재구성 세포를 형성시키는 단계; (4) 재구성 세포를 동물의 자궁에 이식하여 배아를 형성시키는 단계; 및 (5) 배아를 발달시키는 단계를 포함한다. 이러한 방법에서, 난모 세포를 살아있는 동물의 난관(oviducts) 및/또는 난소(ovaries)에서 단리할 수도 있지만, 일반적으로는 죽은 동물로부터 수거한다. 탈핵에 앞서, 난모 세포는 당업자에게 공지된 다양한 배지에서 성숙될 수 있다. 난모 세포의 탈핵은 당업자에게 공지된 다양한 방식으로 수행될 수 있다. 탈핵된 난모 세포에 공여자 세포 또는 핵을 삽입하여 재구성 세포를 형성시키는 것은 융합 이전에 투명대(zona pellucida) 밑에 공여자 세포를 미세 주입함으로써 일반적으로 달성된다. 융합은, 접촉/융합면에 걸쳐 DC 전기 펄스를 적용(전기 융합)시키거나, 폴리에틸렌 글리콜과 같은 융합 촉진 화학물질에 세포를 노출시키거나, 센다이 바이러스(Sendai virus)와 같은 비활성화 바이러스를 통해 유도될 수 있다. 재구성 세포는 핵 공여자와 수여자 난모 세포의 융합 이전, 도중 및/또는 이후에 전기적 및/또는 비전기적 수단에 의해 일반적으로 활성화된다. 활성화 방법에는 전기 펄스, 화학적으로 유도된 충격, 정자에 의한 침투, 난모 세포에서 2가 양이온 레벨의 증가, 및 (키나아제 억제제를 통한) 난모 세포에서 세포 단백질의 인산화 감소가 포함된다. 활성화된 재구성 세포 또는 배아는 일반적으로 당업자에게 공지된 배지에서 배양된 후 동물의 자궁에 옮겨진다. 예를 들어, 미국 특허 출원 공개 제2008-0092249 A1호, WO 1999/005266 A2, 미국 특허 출원 공개 제2004-0177390 A1호, WO 2008/017234 Al, 및 미국 특허 제7,612,250호를 참조하며, 이들 각각은 본원에 참조로서 통합된다.

비인간 동물(예: 돼지, 젖소, 설치류, 닭 등) 게놈을 변형하기 위한 방법은, 예를 들어, 징크 핑거 뉴클레아제(ZFN) 또는 전사 활성인자-유사 작동자 뉴클레아제(TALEN)를 채용하여, 게놈이 이종 헥사뉴클레오티드 반복 확장 서열의 삽입체를 본원에 기술된 바와 같은 C9ORF72 유전자좌에 포함하도록 변형시키는 단계를 포함한다.

일부 구현예에서, 본원에서 설명된 비인간 동물은 포유동물이다. 일부 구현예에서, 본원에 설명된 비인간 동물은, 예를 들어, 뛰는 쥐상과(Dipodoidea) 또는 쥐상과(Muroidea) 아목의 작은 포유동물이다. 일부 구현예에서, 본원에 설명된 바와 같은 유전적으로 변형된 동물은 설치류이다. 일부 구현예에서, 본원에 설명된 바와 같은 설치류는 마우스, 랫트 및 햄스터로부터 선택된다. 일부 구현예에서, 본원에 설명된 바와 같은 설치류는 쥐상과 아목으로부터 선택된다. 일부 구현예에서, 본원에 설명된 바와 같은 유전적으로 변형된 동물은 칼로미스쿠스과(Calomyscidae)(예를 들어, 마우스 유사 햄스터), 비단털쥐과(Cricetidae)(예: 햄스터, 뉴월드 랫트 및 마우스, 들쥐), 쥐과(Muridae)(진짜 마우스 및 랫트, 사막쥐, 가시쥐, 갈기쥐), 네소미스과(Nesomyidae)(클라이밍 마우스, 락 마우스(rock mice), 흰꼬리 랫트, 말라가시 랫트 및 마우스), 가시겨울잠쥐과(Platacanthomyidae)(예: 가시겨울잠쥐), 및 소경쥐과(Spalacidae)(예: 두더쥐, 대나무쥐, 및 동북)로부터 선택된 과(family)로부터 유래한다. 일부 특정 구현예에서, 본원에서 설명된 바와 같은 유전적으로 변형된 설치류는 진짜 마우스 또는 랫트(쥐상과), 사막쥐(gerbil), 가시쥐(spiny 마우스), 갈기쥐(crested rat)로부터 선택된다. 일부 특정 구현예에서, 본원에서 설명된 바와 같은 유전적으로 변형된 마우스는 쥐상과의 구성원으로부터 선택된다. 일부 구현예에서, 본원에서 설명된 비인간 동물은 설치류이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 설치류는 마우스와 랫트로부터 선택된다. 일부 구현예에서, 본원에서 설명된 비인간 동물은 마우스이다.

일부 구현예에서, 본원에서 설명된 비인간 동물은 C57BL/A, C57BL/An, C57BL/GrFa, C57BL/KaLwN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, 및 C57BL/Ola로부터 선택된 C57BL 계통의 마우스인 설치류이다. 일부 특정 구현예에서, 본원에서 설명된 바와 같은 마우스는 129P1, 129P2, 129P3, 129X1, 129S1 (예를 들어, 129S1/SV, 129S1/SvIm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129/SvJae, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1, 129T2인 계통으로 이루어지는 군으로부터 선택된 129 계통이다(예: Festing 외, 1999, Mammalian Genome 10:836; Auerbach, W. 외, 2000, Biotechniques 29(5):1024-1028, 1030, 1032 참조). 일부 특정 구현예에서, 본원에 설명된 바와 같은 유전적으로 변형된 마우스는 전술한 129 계통 및 전술한 C57BL/6 계통의 혼합체이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 마우스는 전술한 129 계통의 혼합체, 또는 전술한 BL/6 계통의 혼합체이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 혼합체의 129 계통은 129S6(129/SvEvTac) 계통이다. 일부 구현예에서, 본원에 설명된 바와 같은 마우스는 BALB 계통, 예를 들어 BALB/c 계통이다. 일부 구현예에서, 본원에 설명된 바와 같은 마우스는 BALB 계통 및 전술한 다른 계통의 혼합체이다.

일부 구현예에서, 본원에서 설명된 비인간 동물은 랫트이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 랫트는 위스타 랫트(Wistar rat), LEA 계통, 스프래그 다울리(Sprague Dawley) 계통, 피셔(Fischer) 계통, F344, F6, 및 다크 아구티(Dark Agouti)로부터 선택된다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 랫트 계통은 위스타, LEA, 스프래그 다울리, 피셔, F344, F6, 및 아크 아구티로 이루어지는 군으로부터 선택된 2가지 이상 계통의 혼합체이다.

랫트 다능성 및/또는 재생성 세포는, 예를 들어, ACI 랫트 계통, 검은 아구티(Dark Agouti, DA) 랫트 계통, 위스타 랫트 계통, LEA 랫트 계통, 스프래그 다울리(SD) 랫트 계통, 또는 피셔 F344나 피셔 F6과 같은 피셔 랫트 계통을 포함하는 임의의 랫트 계통으로부터 유래될 수 있다. 랫트 다능성 및/또는 재생성 세포는 위에 인용된 하나 이상의 계통의 혼합체로부터 유래된 계통으로부터 수득될 수도 있다. 예를 들어, 랫트 다능성 및/또는 재생성 세포는 DA 계통 또는 ACI 계통 유래일 수 있다. ACI 랫트 계통은 흰 배와 다리 및 RT1 ^av1 일배체형을 가진 검은 아구티를 가지는 것을 특징으로 한다. 이러한 계통은 Harlan Laboratories를 포함하는 다양한 공급원으로부터 이용이 가능한다. ACI 랫트 유래의 랫트 ES 세포주의 예는 ACI.G1 랫트 ES 세포이다. 검은 아구티(DA) 랫트 계통은 아구티 코트(coat) 및 RT1 ^av1 일배체형을 가지는 것을 특징으로 한다. 이러한 계통은 Charles River 및 Harlan Laboratories를 포함하는 다양한 공급원으로부터 이용이 가능한다. DA 랫트 유래의 랫트 ES 세포주의 실시예는 DA.2B 랫트 ES 세포주 및 DA.2C 랫트 ES 세포주이다. 일부 경우에, 랫트 다능성 및/또는 재생성 세포는 동종 번식된 랫트 계통으로부터 유래된다. 예를 들어, 2014년 2월 20일에 출원된 미국 특허 제2014/0235933 A1호를 참조하며, 그 전체는 참조로서 본원에 통합된다.

내인성 C9ORF72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열의 삽입체를 포함하는 비인간 동물이 제공된다. 일부 구현예에서, 이종 헥사뉴클레오티드 반복 확장 서열의 삽입은 병원성(pathogenic)이 아니다. 일부 구현예에서, 이종 헥사뉴클레오티드 반복 확장 서열의 삽입은 본원에 기술된 바와 같은 하나 이상의 표현형, 예를 들어 ALS 및/또는 FTD와 관련된 표현형을 생성한다. 이종 헥사뉴클레오티드 반복 확장 서열의 삽입은, 예를 들어, 서던 블롯 또는 중합 효소 연쇄 반응 유전자형 분석 반응에 의해, 이종 헥사뉴클레오티드 반복 확장 서열에서 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 대략적인 사례(예: 반복)의 수를 결정함으로써, 직접 측정될 수 있다.

[표 4]

도 2b를 통해, 마우스 ES 세포 클론 8027 A-C4의 내인성 C9orf72 유전자좌 내에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열 내에서 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개의 반복이 존재하고; 마우스 ES 세포 클론 8029 B-A9 및 8029 B-A10의 내인성 C9orf72 유전자좌 내에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열 내에서 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 약 30개의 반복이 존재하며; 마우스 ES 세포 클론 8029 A-A3 및 8029 A-A6의 내인성 C9orf72 유전자좌에서의 이종 헥사뉴클레오티드 반복 확장 서열 내에서 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 약 92개의 반복이 존재하는 것을 확인할 수 있다.

실시예 2: 배아 줄기 세포 유래의 운동 뉴런, 및 내인성 마우스 C9ORF72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 비인간 동물의 생성

배아 줄기 세포 유래의 운동 뉴런

야생형 C9orf72 유전자좌(대조군)에 대한 동형접합체이거나, 서열번호 1로서 제시된 헥산뉴클레오티드 서열의 약 3개의 반복(C9orf72HRE ₃ ^+/-)_,30개의 반복(C9orf72HRE ₃₀ ^+/-), 또는 92개의 반복(C9orf72HRE ₉₂ ^+/-)을 사용해 유전적으로 변형된 C9orf72 유전자좌에 대해 이형접합체인 부모 배아 줄기 세포(ESC)를 2일 동안 배아 줄기 세포 배지(ESM; DMEM + 15% 소태아혈청 + 페니실린/스트렙토마이신 + 글루타민 + 비필수 아미노산 + 뉴클레오시드 + β-메르캅토에탄올 + 피루브산나트륨 + LIF)에서 배양하였고, 그 동안 배지는 매일 교체하였다. 트립신 처리(trypsinization)하기 1시간 전에 ES 배지를 7ml의 ADFNK 배지(고급 DMEM/F12 + 신경기저 배지 + 10% 넉아웃 혈청 + 페니실린/스트렙토마이신 + 글루타민 + β-메르캅토에탄올)로 교체하였다. ADFNK 배지를 빨아내고, ESC를 0.05% 트립신-EDTA로 트립신 처리하였다. 펠릿 세포를 12ml의 ADFNK에서 재현탁하고, 현탁액 중에서 2일 동안 성장시켰다. 레티노산(RA)과 평활화된 작용제가 보충된 ADFNK에서 추가로 4일 동안 세포를 배양하여 운동 뉴런(ESMN)을 수득하였다. 해리된 운동 뉴런을 플레이팅하고 배아 줄기 세포 유래의 운동 뉴런 배지(ESMN; 신경기저 배지 + 2% 말 혈청 + B27 + 글루타민 + 페니실린/스트렙토마이신 + β-메르캅토에탄올 + 10ng/ml GDNF, BDNF, CNTF)에서 숙성시켰다.

비인간 동물

표적화된 ES 세포를 미압축된 8-세포 단계의 Swiss Webster 배아 내로 주입하는 VELOCIMOUSE® 방법(DeChiara, T.M. 등의, 2010, Methods Enzymol. 476:285-294; Dechiara, T.M., 2009, Methods Mol. Biol. 530:311-324; Poueymirou 등의, 2007, Nat. Biotechnol. 25:91-99)을 사용해, C9orf72-HRE (3x or 100x) 삽입에 대해 이형접합체인 건강하고 완전히 ES-세포 유래된 F0 세대의 마우스를 생산하였다. F0 세대 이형접합체 수컷을 C57Bl6/NTac 암컷과 교배시켜 F1 이형접합체를 생성하고, 이를 교배시켜 분자 및 표현형 분석을 위한 F2 세대 C9orf72 - HRE ^+/+ , C9orf72 -HRE ^+/- 및 야생형 마우스를 생산하였다.

실시예 3. 내인성 C9orf72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열을 갖는 운동 뉴런 또는 뇌 조직의 분석

최근에, Liu 등의 (2017) Cell Chem . Biol . 24:141-148에서는 정량적 중합 효소 연쇄 반응(qPCR) 및 디지털 액적 중합 효소 연쇄 반응(digital droplet polymerase chain reaction; ddPCR)를 사용해 인간 섬유아 세포주, 또는 인간 성상세포 및 ALS를 앓고 있는 환자로부터 단리한 유도된 다능성 중기 세포(iPSC) 유래의 운동 뉴런에 의해 발현된 C9orf72 유전자좌로부터 센스 및 안티센스 RNA 전사체의 카피 수를 정량화하였다. Liu 등은 전술한 (2017) 문헌에서, 건강한 환자로부터 유래된 섬유아세포와 비교하여 유의하게 더 높은 수의 센스 인트론, 안티센스, 및 센스 C9orf72 전사체를 환자 유래의 섬유아세포에 검출하였다. 평균적으로, 환자 유래 섬유아세포 당, C9orf72 인트론과 안티센스 전사체의 3 내지 4개의 카피, 및 C9orf72 센스 mRNA 전사체의 약 15 내지 20 카피를 검출하였다. (Liu 등의 전술한 (2017) 문헌 참조) Liu 등의 전술한 (2017) 문헌 등에서는, 비질환 섬유아세포 세포주에서,대조적으로, 하나 이하의 인트론 및 안티센스 전사체, 및 C9orf72 센스 mRNA 전사체의 5 내지 10개의 카피를 검출하였음을 보여준다. 섬유아세포와 마찬가지로, 인트론, 안티센스 및 센스 C9orf72 전사체의 발현은 건강한 대조군 유래의 성상세포 및 신경 세포에 비해 환자 유래의 성상세포 및 신경 세포에서 더 높았다. (Liu 등의 전술한 (2017) 문헌 참조) RNA 병소를 함유하는 세포의 백분율, 세포당 평균 병소 수, 세포들 간의 상이한 수의 병소 분포를 계산함으로써, 및 질환자 유래의 세포 또는 건강인 유래의 세포에서 C9orf72 전사체의 수를 결정함에 있어서, Liu 등의 전술한 (2017) 문헌은, 질환자 유래의 세포에서 보이는 각각의 병소는 단일 돌연변이체 C9orf72 인트론 또는 안티센스 전사체이고, 또한, 작은 수의 RNA 분자가 질병에 대한 상당한 영향을 미칠 수 있다는 것을 시사하였다.

본 실시예에서, 전술한 바와 같이, 육종 콜로니에서 헥사뉴클레오티드 반복의 크기의 안정성을 AmplidEx PCR/CE C9ORF72 키트(Asuragen)를 사용해 F2 동물에서 확인하였다(데이터 미도시). 또한, 마우스 배아 줄기 세포 유래의 운동 뉴런(ESMN), 뇌 조직, 및 야생형 C9orf72 유전자좌(대조군) 또는 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개, 30개, 또는 92개의 반복을 포함하는 유전적으로 변형된 C9orf72 유전자좌를 포함하는 부모 배아 줄기에서 RNA 전사체를 조사하였다. RNA 병소 및 디펩티드 반복 단백질 수준도 야생형 C9orf72 유전자좌(대조군) 또는 서열번호 1에 제시된 헥사뉴클레오티드 서열의 3개, 30개, 또는 92개의 반복을 포함하는 유전적으로 변형된 C9orf72 유전자좌를 포함하는 부모 배아 줄기 세포로부터 유래된 ESMN에서 검증하였다.

재료 및 방법

정량적 중합효소 연쇄 반응

각 샘플로부터의 총 RNA를 추출하고, 다양한 영역의 측면에 위치하는 프라이머 및 변형된 C9orf72 - HRE 유전자좌의 영역들을 검출하는 프로브를 사용해 역전사하였다. 검출 가능한 영역은 마우스 및 인간 서열에 걸쳐 있는 것, 인간 서열에만 걸쳐 있는 것, 또는 마우스 서열에만 걸쳐 있는 것들을 포함한다. 손쉽게 사용할 수 있는 키트의 프로브와 프라이므를 사용해 GAPDH 또는 β2-마이크로글로불린의 QPCR을 수행하였다.

구체적으로, 배아 줄기 세포 유래의 운동 뉴런(ESMN), 부모 배아 줄기(ES) 세포, 또는 야생형(WT) C9orf72 유전자좌(대조군) 또는 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 3개, 30개, 또는 92개의 반복을 포함하는 유전적으로 변형된 C9orf72 유전자좌를 포함하는 마우스로부터 단리된 전체 뇌로부터 RNA를 단리하였다.

제조자(Zymo Research)의 프로토콜에 따라 Direct-zol RNA Miniprep plus 키트를 사용해 총 RNA를 단리하였다. 약 1 μg의 총 RNA를 25℃에서 15분 동안 DNase I (ThermoFisher)로 처리하였다. EDTA를 첨가하고, 혼합물을 65℃에서 10분 동안 인큐베이션하였다. dSdNase가 포함된 Maxima H Minus First Strand cDNA Synthesis Kit(ThermoFisher)로 역전사(RT) 반응을 수행하였다. DNase I 처리 후, RT 완충액을 함유하는 10 μL의 RT 혼합물, 무작위 6량체 프라이머(random hexamer primers), dNTP, Maxima H Minus Enzyme Mix를 첨가해 최종 부피를 20 μL로 만들었다. RT 반응 혼합물을 25℃에서 10분 동안 인큐베이션하고, 50℃에서 15분 동안 인큐베이션한 다음, 85℃에서 5분 동안 인큐베이션하여 효소를 불활성화시켰다. cDNA 혼합물을 물로 희석하여 100 μL 최종 부피를 만들었다.

역전사 후, PCR 반응 용액을 3 μL cDNA 및 5 μL의 PCR 혼합물, 프로브 및 유전자 특이적 프라이머를 함유하는 8 μL의 최종 부피로 재구성하였다. 달리 언급되지 않는 한, 최종 프라이머 및 프로브 농도는 각각 0.5 μM 및 0.25 μM였다. ViIa?? 7 Real-Time PCR Detection System(ThermoFisher) 상에서 qPCR을 수행하였다. 광학 384-웰 플레이트에서 95℃에서 10분, 95℃ 3초, 60℃ 30초 동안 이뤄지는 45사이클의 PCR 반응을 4회 수행하였다. 각 분석(A, B, F, G, H)에서 사용된 프라이머와 프로브의 서열 및 서열번호는 표 5에 제공된다.

[표 5]

웨스턴 블롯 분석

분화된 배아 몸체(EB)를 수집하고 SDS 샘플 완충액(2% SDS, 10% 글리세롤, 5% β-메르캅포에탄올, 60 mM TrisHCl, pH 6.8, 브로모페놀 블루)에서 균질화시켰다. 단백질 추출물을 RC DC 단백질 검정(BiOrad)을 사용하여 정량화하였다. 추출물(10μg)을 4~20% SDS-PAGE 겔(ThermoFisher) 상에서 작동시키고 iBLOT 전달 유닛(ThermoFisher)을 사용하여 니트로셀룰로오스 막 상으로 옮겼다. 면역블롯을 C9orf72 및 GAPDH (Millipore)에 대한 일차 항체로 탐침하였다. 서양 고추냉이 과산화효소(horseradish peroxidase)(Abcam)에 접합된 이차 항체로 인큐베이션하고, 이어서 SuperSignal West Pico 화학발광 기질(Thermo Scientific)을 사용하는 화학발광에 의해 결합 항체를 검출되었다. Full Speed Blue 민감성 의료용 X-선 필름(Ewen Parker XRay Corporation)을 사용하는 방사선 촬영에 의해 신호를 검출하였다. 상대적 단백질 수준을 ImageJ를 사용해 계산하였다.

RNA 및 번역 산물의 검출을 위한 형광 인시츄 혼성화 (FISH) 및 면역형광검사 (immunofluorescence; IF)

형광 인시츄 혼성화(FISH) 및 면역형광검사를 각각 사용해, 실시예 3에 기술된 바와 같이 생성된 배아 줄기 세포 유래 운동 뉴런 (ESMN)에서, 서열번호 1로서 제시된 헥사뉴클레오티드 반복 서열뿐만 아니라 이로부터 번역된 디펩티드 반복 단백질로부터 전사된 RNA의 위치를 결정하였다. 요약하자면, ESMN을 4-웰 챔버 슬라이드(Lab-Tek II 챔버 슬라이드 시스템, ThermoFisher Scientific)에서 성장시키고 4% PFA(Electron Microscopy Sciences)로 PBS 내에 고정시켰다. 이어서, 세포를 디에틸 피로카보네이트(DEPC) PBS/0,2% Triton X-100(Fisher Scientific, 카탈로그 #BP151)로 투과시켜 DEPC-PBS로 세척하고, 블록화하여, 아래에 기술된 바와 같이, RNA 전사 산물의 검출을 위해 LNA 또는 DNA 올리고뉴클레오티드로 염색하거나, RAN 번역 산물의 검출을 위해 항-polyGA 항체로 염색하였다. 염색 후, 이어서 적절한 형광 염료로 슬라이드를 인큐베이션하고, Fluoromount G(Southern Biotech)로 고정하여, 공초점 현미경을 사용하여 가시화시켰다.

센스 또는 안티센스 RNA 전사 산물의 검출

슬라이드는 50% 포름아미드(IBI Scientific, 카탈로그 #IB72020), DEPC 2Х SSC [300 mM 염화나트륨, 30mM 구연산나트륨(pH 7.0)], 10% (w/v) 덱스트란 황산염(Sigma-Aldrich, 카탈로그 #D8960), 및 DEPC 50 mM 인산나트륨(pH 7.0)으로 이루어진 완충액으로 66℃에서(LNA 프로브용) 또는 55℃에서(DNA 프로브용) 30분 동안 사전 혼성화하였다. 그런 다음, 혼성화 완충액을 배출시키고, 혼성화 완충액 중의 400 μl의 40 nM LNA 프로브 혼합물 또는 200 ng/ml의 DNA 프로브 혼합물을 각각의 슬라이드에 첨가하고, 66℃(LNA 프로브용) 또는 55℃(DNA 프로브용)의 암소에서 3시간 동안 인큐베이션하였다. LNA 프로브로 인큐베이션한 슬라이드는 DEPC 2Х SSC/0,1% Tween 20(Fisher Scientific, 카탈로그 번호 BP337) 중에서 실온에서 한 번 헹구고, DEPC 0.1Х SSC 중에서 65℃에서 3번 헹구었다. DNA 프로브로 인큐베이션한 슬라이드는 2Х SSC 중의 40% 포름아미드로 3번 세척하고 PBS 중에서 한 번 간단히 세척하였다. 이어서, 슬라이드들을 1 μg/mL DAPI(Molecular Probes Inc.)로 인큐베이션하였다.

본 실시예에서 사용된 LNA 및 DNA 올리고뉴클레오티드 프로브의 서열 및 서열번호뿐만 아니라 프로브의 혼성화 조건도 아래 표 6에 제공된다.

프로브	서열 (서열번호)	혼성화 방법
LNA 센스 G₄C₂ RNA	TYE563-CCCCGGCCCCGGCCCC (서열번호 81)	0.1 X SSC에서 66℃ 혼성화 및 세척
LNA 안티센스 G₄C₂ RNA	TYE563-GGGGCCGGGGCCGGGGGGCCCC (서열번호 82)	0.1 X SSC에서 66℃ 혼성화 및 세척
DNA 센스 G₄C₂ RNA	CCCCGGCCCCGGCCCCGG―Cy3 (서열번호 83)	2 X SSC에서 55℃ 혼성화 및 세척
DNA 안티센스 G₄C₂ RNA	GGGGCCGGGGCCGGGGC-Cy3 (서열번호 84)	2 X SSC에서 55℃ 혼성화 및 세척

디펩티드 반복 단백질 산물의 검출

투과화 후, 0,2% Triton X100(TBS-T)로 트리스 완충된 식염수(pH 7.4)에서 희석한 5% 정상 당나귀 혈청으로 슬라이드를 블록화하였다. 슬라이드는, 5% 정상 당나귀 혈청을 사용해 TBS-T에서 희석된 poly-GA(Millipore)에 대한 1차 항체로 4℃에서 밤새 인큐베이션하였다. 슬라이드를 TBS-T로 3회 세척한 후, Alexa 488 또는 555(TBS-T 중 1:1000, ThermoFisher) 및 DAPI(1 μg/ml)(Molecular Probes Inc.)에 결합된 이차 항체들에 특이적인 종으로 실온에서 1시간 동안 인큐베이션하였다. TBS-T 3회 세척한 후, 슬라이드를 Fluoromount G(Southern Biotech)로 고정하고 공초점 현미경을 사용하여 가시화시켰다.

결과

도 4, 5 및 6에 도시된 바와 같이, C9orf72 유전자와에서 서열번호 1로서 제시된 헥사뉴클레오티드 반복 확장 서열을 포함하는 마우스 유래의 ESMN, 전체 뇌 및 뉴런 조직은 C9orf72 mRNA 전사체의 발현 증가를 나타냈다. 이러한 증가는 C9orf72 유전자좌의 엑손 1a 및 1b 사이에 존재하는 헥사뉴클레오티드 반복의 개수와 상관되는 것으로 보인다. 도 6 또한, 내인성 C9orf72 유전자좌 및 이를 포함하는 ESMN에서 서열번호 1로서 제시된 이종 헥사뉴클레오티드 서열의 3개 또는 92개의 반복을 포함하는 마우스로부터 단리된 뉴런 조직과 유사하게, 내인성 C9orf72 유전자좌에서 서열번호 1로서 제시된 이종 헥사뉴클레오티드 서열의 3개 또는 92개의 반복을 포함하는 마우스 내의 비신경성 조직(예: 근육 및 심장)에서도 C9orf72 발현이 강화되었다. 또한, 강화는 인간화 C9orf72 대립유전자에 대해 특이적이었는데; 반복 서열을 함유하지 않는 마우스 C9orf72 대립유전자의 발현 강화는 이형접합체 마우스에서 나타나지 않았다(데이터 미도시).

사전 계산에 의하면, 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 30개 또는 92개의 반복을 갖는 ESMN 또는 뇌 세포가, 세포당 C9orf72 mRNA의 약 17개의 카피를 갖는다는 것을 나타내며, 이는 Liu 등의 전술한 (2017) 문헌에서의 소견과 일치한다. 서열번호 1에 제시된 헥사뉴클레오티드 서열 반복의 수는 C9orf72 단백질 수준의 증가(도 7 및 도 8), 센스 및 안티센스 C9orf72 RNA 병소의 핵 및 세포질 축적(도 9a 및 도 9b), 및 디펩티드 반복 단백질(도 10)과도 직접 상관된다. 본원에 도시된 데이터는, C9orf72 유전자좌에서 서열번호 1에 제시된 헥사뉴클레오티드 서열 반복 수의 증가가 ALS로 진단된 환자로부터 단리한 인간 세포와 유사한 분자 표현형(예를 들어, 전사의 증가, RNA 병소의 축적, 및/또는 디펩티드 반복 단백질의 증가)을 나타내는 세포를 생성한다는 것을 나타내며, 이는 신경퇴행성 질환에 대한 질환 모델로서 본원에 개시된 비인간 동물의 용도를 뒷받침하는 것이다.

실시예 4. 내인성 C9orf72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열을 갖는 비인간 동물의 행동 분석

본 실시예는, 실시예 1에서 기술된 바와 같이, 내인성 설치류(예: 마우스) C9orf72 유전자좌에 이종 헥사뉴클레오티드 반복 확장 서열의 삽입에 기인하는, 예를 들어, 체중 감소 및/또는 유의한 운동 이상과 같은 ALS 유사 증상에 대해 본원에 기술된 비인간 동물(예: 설치류)의 행동 분석을 기술한다.

전술한 바와 같이 내인성 C9orf72 유전자좌 내에 삽입된 병원성 이종 헥사뉴클레오티드 반복 확장 서열을 갖는 마우스, 및/또는 대조군 마우스, 예를 들어, 야생형 마우스 또는 전술한 바와 같이 내인성 C9orf72 유전자좌 내에 삽입된 비병원성 이종 헥사뉴클레오티드 반복 확장 서열을 갖는 마우스에 대한 표현형 연구는 8, 18, 37주령(암컷) 및 57~60주령(수컷)을 대상으로 수행된다. 체중은 격주로 측정하고, 신체 조성은 mCT 스캔(Dynamic 60)에 의해 분석한다. 표준 24 스캔을 사용해 척추의 경부 영역 질량을 가시화한다. 모든 동물 절차는 리제너론 제약의 동물 보호 및 사용 위원회(Regeneron Pharmaceuticals Institutional Animal Care and Use Committee)가 승인한 프로토콜에 따라 수행하였다.

전체적인 운동 기능의 평가는 주관식 블라인드 스코어링 검정을 사용하여 수행한다. 운동 손상의 분석은 로타르드(rotarod), 오픈 필드 로코모터 및 캣워크 테스트를 사용하여 수행한다. 운동 손상 점수는 ALS Therapy Development Institute(ALSTDI, Gill A. 등, 2009, PloS One 4:e6489)에 의해 개발된 시스템을 사용하여 측정한다. 캣워크 테스트 동안, 대상물은 조명이 켜진 유리 플랫폼을 가로질러 걷게 되고, 비디오 카메라가 아래로부터 녹화를 한다. 걸음걸이 패턴, 각 발의 스윙 속도, 자세 유지 시간, 및 압력과 같은 걸음걸이와 관련된 파라미터가 각 동물에 대해 보고된다. 이러한 시험은 마우스의 표현형을 분석하고, 신규한 화학적 제제(eneities)가 운동 능력에 미치는 효과를 평가하는 데 사용된다. CatWalk XT는 랫트 및 마우스에서 발걸음과 걸음걸이에 대한 정량 평가를 위한 시스템이다. 이는 중추 신경계, 말초 신경계, 근육 또는 골격 이상에 관한 거의 모든 종류의 실험 모델에서 설치류의 운동 능력을 검증하는 데 사용된다.

CatWalk 걸음걸이 분석: Noldus CatWalk XT 10의 런웨이 시작점에 동물을 배치하고, 이들의 전방에 개방 단부를 배치한다. 마우스는 런웨이의 단부까지 자발적으로 달려 탈출을 시도한다. 카메라는 이를 기록하고 시스템의 소프트웨어는 발자국을 측정한다. 발을 내딛을 때의 이상성에 대해 발자국을 분석한다.

오픈 필드 테스트: 마우스를 Kinder Scientific의 오픈 필드 시스템에 배치하고, 60분 동안 검증한다. 장치는 적외선 빔 및 컴퓨터 소프트웨어를 사용하여 미세한 움직임, X+Y 이동, 이동 거리, 회귀한 회수, 회귀에 사용한 시간, 및 정지 시간을 계산한다.

로터로드 ( rotorod ): 로터로드 테스트(IITC Life Science, Woodland Hills, CA)는 마우스가 회전 빔으로부터 추락할 때 까지의 시간(latency)을 측정한다. 로터로드는 1 rpm에서 시작하여 180초 동안 15 rpm까지 가속되는 실험 방식으로 설정된다. 그런 다음, 증분 방식을 따라서, 동물이 추락할 때 까지의 시간이 기록된다. 동물이 추락하지 않고 빔 상에 머무는 가장 긴 3개의 지속 시간의 평균 및 이중 최대 지속 시간을 사용해 추락까지의 소요 시간을 검증한다. 180초보다 오 오래 빔에 머물 수 있는 동물은 무증상(asymptomatic)인 것으로 간주된다.

상부 운동 뉴런 손상은 경직성(뻣뻣함), 반사의 증가, 떨림, 운동 느림(bradykinesia) 및 바빈스키 징후(Babinski signs)로서 나타난다. 하부 운동 뉴런 손상은 근육 약화(muscle weakness), 체력 소모(wasting), 뒷다리 부여잡기(clasping), 발 구부림(curling)과 발 끌기(dragging), 및 근육 수축(fasciculations)으로서 나타난다. 안구 손상(bulbar impairment)은 삼키기 어려움, 발음 장애 및 혀 근육 수축으로 나타난다. 또한, 전체적인 운동 기능은, 32주령에서 시작하여 60주령까지를 대상으로 하여 주어진 주(week)에 생존하는 동물의 백분율로서 평가된다. 마우스를 매주 칭량하고, (전술한 바와 같이) 주관식 블라인드 스코어링 검정을 사용해 전체적인 운동 기능 평가를 수행한다. 마우스의 2개의 군에 대해 주별 또는 격월별로 임상적 신경 검사를 수행하여 그들의 뒷다리 근육의 운동 손상, 떨림 및 뻣뻣함을 관찰한다. 운동 손상의 경우, 도 7에 도시된 바와 같이, 0에서(무증상) 4까지의(마우스를 옆으로 눕힌 후 30초 이내에 스스로 자세를 바로잡지 못함) 블라인드 신경학적 스코어링 단계(blinded neurological scoring scale)가 사용된다.

ALS-TDI 신경학적 스코어링 시스템
0점:	마우스가 꼬리로 매달릴 때, 뒷다리가 측방향 중간 선에서 먼 쪽으로 완전히 펴지고, 마우스는 이 상태로 2초간 유지할 수 있으며, 2~3회 정지 상태를 유지함.
1점:	꼬리로 매달린 동안, 측방향 중간선을 향해 다리가 완전히 또는 부분적으로 무너지거나(취약함), 뒷다리 떨림.
2점:	12인치를 걷는 동안 적어도 발가락이 적어도 2번 구부리거나, 케이지 바닥/테이블을 따라 다리의 일부가 끌림.
3점:	경직성 마비 또는 관절 움직임 최소화, 전방 이동을 위한 발 사용 없음.
4점:	마우스를 옆으로 ?뗌? 후 30초 이내에 마우스가 스스로 자세를 바로 잡을 수 없음.

떨림 및 경직의 경우, 0부터(무증상) 3까지의(중증) 단계를 갖는 스코어링 시스템을 사용한다. 표 8은 시험 도중, 동물의 운동 손상, 떨림 및 경직과 관련된 스코어링 방법론을 제시한다.

	0	1	2	3
운동 손상	표현형 없음	뒷다리 움켜잡기	뒷다리 움켜잡기 및 끌기	마비
떨림	없음	경미	중간	중증
경직	없음	경미	중간	중증

또 다른 실험에서, 그립 강도 시험을 사용하여 마우스를 검사한다. 요약하자면, 그립 강도(grip strength)는 앞다리의 최대한 근육 강도로서 신경 근육 기능을 측정하는 것이며, 센서에 연결된 그리드에 마우스가 가한 파지력에 의해 평가된다. 수득된 모든 그립 강도 값은 마우스 체중에 대해 정규화된다.

또 다른 실험에서, 대조군 마우스 및 내인성 C9orf72 유전자좌 내에 삽입된 병원성 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 약 60주령 마우스 유래 척수의 요추 부분을 조직병리학적 분석을 위해 수집한다. 척수 내 운동 뉴런의 총 개수, 및 운동 뉴런의 평균 세포체 면적을 시험 코호트 및 대조군 코호트 모두에서 관찰한다.

48℃, 52℃ 또는 55°C로 유지된 금속 표면(IITC, Woodland Hills, CA) 상에 동물을 배치함으로써, 대조군 마우스 및 병원성 이종 헥사뉴클레오티드 반복 확정 서열의 삽입을 포함하는 20주령의 시험 마우스의 열 통각(thermal nociception)을 시험한다. 열 자극에 대해 동물이 뒷발을 핥거나 가볍게 털 때까지의 경과 시간으로 정의된, 반응까지의 소요 시간을 측정한다. 마우스는 두 가지 통각 반응 행동 중 하나를 수행할 때까지 플레이트 상에 남겨 둔다: 뒷발 핥기, 또는 뒷발 흔들기.

실시예 5. CRISPR / Cas9 시스템을 사용한, 비인간 배아 줄기 세포 내 내인성 비인간 C9ORF72 유전자좌로부터 이종 헥사뉴클레오티드 반복 확장 서열의 결실

기준 헥사뉴클레오티드 반복 확장 서열(서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 1개, 적어도 약 3개, 적어도 약 5개, 적어도 약 15개, 적어도 약 20개, 적어도 약 30개, 적어도 약 40개, 적어도 약 50개, 적어도 약 60개, 적어도 약 70개, 적어도 약 80개, 또는 적어도 약 90개의 바람직하게는 인접한 반복을 포함함)에 대한 잠재적인 가이드 RNA(gRNA) 서열을 분석되고 점수를 매긴다. 잠재적으로 효과적인 gRNA (예를 들어, crRNA 및/또는 tracRNA)를 암호화하는 DNA를 합성하고 발현 작제물에 삽입하는데, 이에는 Cas 단백질을 암호화하는 핵산도 포함될 수 있다. 예를 들어, 도 12를 참조한다. 기준 헥사뉴클레오티드 반복 확장 서열을 포함하는 ES 세포는 gRNA 및/또는 Cas 단백질을 암호화하는 DNA 및 약물 내성 유전자를 포함하는 발현 작제물(들)로 형질 감염된다. 약물-내성 클론을 연속 희석에 의해 수득하고, 분석을 위해 증식시키고 동결시킨다. 각각 약물 내성 ES 세포 클론 유래의 DNA를 단리하고, PCR에 의해 분석하고 아가로오스 겔 상에서 가시화시킨다. 정확한 크기의 PCR 산물을 추출하고 추가로 시퀀싱하여 표적화된 헥사뉴클레오티드 반복 확장 서열의 결실을 확인한다.

도 11은, 예를 들어, 서열번호 45로서 제시된 서열을 갖는, 예를 들어 실시예 1에서 생성된 8029 A-A6 ES 세포에서 발견된 바와 같은, 비제한적이고 예시적인 기준 헥사뉴클레오티드 반복 확장 서열, 및 gRNA에 의해 성공적으로 표적화될 가능성이 있었던 위치에 대한 도시(축척에 비례하지 않음)를 제공한다. 도 11에 도시된 위치를 표적화하는 crRNA를 암호화하는 DNA 서열, 서열번호 45로서 제공되는 예시적인 서열, 및 이들 각각의 서열번호가 표 9에 제공된다. 특히, 서열번호 46~50으로서 제시된 서열은 U6 프로모터를 사용한 최적의 발현을 위해, 서열번호 45로서 제시된 기준 헥사뉴클레오티드 반복 확장 서열에서 발견되지 않은 초기 구아닌을 함유한다.

표 9에서 제시된 바와 같이 crRNA를 암호화하는 DNA를 만들었고(Integrated DNA Technologies), tracrRNA를 암호화하는 DNA(예를 들어, 서열번호 63으로서 제시된 서열을 포함하는 DNA)와 작동 가능하게 연결된 발현 작제물에 삽입하였다. crRNA 암호화 서열의 성공적인 연결은 표 10에 제시된 벡터 스크리닝 프라이머와의 중합 효소 연쇄 반응에 의해 확인하였고, gRNA(crRNA 및 tracrRNA) 암호화 서열의 서열은 벡터 시퀀싱 프라이머를 사용하는 서열 분석으로 확인하였으며, 표 10에도 제시하였다. U6 프로모터에 의해 조절되는 정확한 gRNA 코딩 서열, cas9 단백질을 암호화하는 핵산, 및 퓨로마이신 내성 유전자를 포함하는 발현 작제물(도 12)을 증폭시키고 정제하였다.

벡터 스크리닝 순방향 프라이머 위치 190 gRNA	ACACCGCTCTCACAGTACTCGCTGAG (서열번호 51)
벡터 스크리닝 정방향 프라이머위치 196 gRNA	ACACCGCCGCAGCCTGTAGCAAGCTCG (서열번호 52)
벡터 스크리닝 정방향 프라이머 위치 274 gRNA	ACACCGAGTACTGTGAGAGCAAGTAGG (서열번호 53)
벡터 스크리닝 정방향 프라이머 위치 899 gRNA	ACACCGACGCCCCGCGATCGCGCTAGG (서열번호 54)
벡터 스크리닝 정방향 프라이머위치 905 gRNA	ACACCGCGGCCGCTAGCGCGATCGCGG (서열번호 55)
벡터 스크리닝 정방향 프라이머 위치 1006 GrNA	ACACCGTGGCGAGTGGGTGAGTGAGGG (서열번호 56)
벡터 스크리닝 정방향 프라이머위치 1068 gRNA	ACACCGGAAGAGGCGCGGGTAGAAGG (서열번호 57)
벡터 스크리닝 역방향 프라이머 모든 gRNA	GACGCGTTAATGCCAACTTT (서열번호 58)
벡터 시퀀싱 정방향 프라이머	GAGGGCCTATTTCCCATGAT(서열번호 59)
벡터 시퀀싱 역방향 프라이머	GACGCGTTAATGCCAACTTT(서열번호 60)
클론 스크리닝 정방향 프라이머	GAACTTACGGAGTCCCACGA(서열번호 61)
클론 스크리닝 역방향 프라이머	GGAGACAGCTCGGGTACTGA (서열번호 62)

실시예 1에서 수득된 바와 같고, 서열번호 1로서 제시된 헥사뉴클레오티드 서열(예를 들어, 서열번호:45로서 제시된 기준 서열)의 약 92개의 반복을 포함하는 헥사뉴클레오티드 반복 확장 서열을 포함하는 8029 A-A6 클론을, 표 9에 제시된 crRNA(및 tracrRNA 서열), 퓨로마이신 내성 유전자, 및 CRISPR/Cas9 엔도뉴클레아제 유전자의 상이한 조합들로 형질감염시켰다. 하나의 조합에서, ES 세포는 서열번호 45의 위치 190, 196, 274, 899, 905, 1006, 및 1068에서 시작하는 서열들을 표적화하는 CRISPR/Cas9 시스템으로 형질감염시켰다(예: cas9 단백질을 암호화하는 핵산 및/또는 서열번호 39, 44 및 46~50에서 제시된 서열을 갖는 gRNA 삽입체를 포함하는 발현 작제물(들)). 두 번째 조합에서, ES 세포는 서열번호 45의 위치 196, 1006 및 1067을 표적화하는 CRISPR/Cas9 시스템으로 형질감염시켰다 (예: cas9 단백질을 암호화하는 핵산 및/또는 각각 서열번호 39, 50 및 44로서 제시된 서열을 포함하는 gRNA 삽입체을 암호화하는 DNA를 포함하는 발현 작제물(들)). 세 번째 조합에서, ES 세포는 서열번호 45의 위치 196, 272 및 1005 및 1067을 표적화하는 gRNA 삽입체로 형질감염시켰다(예: cas9 단백질을 암호화하는 핵산 및/또는 각각 서열번호 39, 47, 50 및 44로서 제시된 서열을 포함하는 gRNA 삽입체를 포함하는 발현 작제물(들)).

퓨로마이신-내성 ES 클론을 연속 희석에 의해 수득하고, 배지(500 ml KO DMEM 배지, 95 ml 열 불활성화된 FBS, 12 mL L-글루타민, 6 mL Penn-Step, 6 mL 비필수 아미노산, 1.2 mL B-메르캅토에탄올)에서 배양하고, 분석을 위해 증식시키고, 동결시켰다. 각 클론으로부터의 DNA를 제조사(Qiagen)의 프로토콜에 따라 DNAase Blood and Tissue Kit를 사용해 분리하고, 표 10에 제시된 클론 스크리닝 순방향 및 역방향 스크리닝 프라이머를 사용해 PCR에 의해 분석하였다. PCR 산물을 아가로오스 겔 전기영동에 의해 가시화하고, 정확한 크기의 PCR 산물을 추출하고 추가로 시퀀싱하여 표적화된 헥사뉴클레오티드 반복 확장 서열의 결실을 확인하였다.

160개의 클론들 중에서 100개의 클론을 시험하였는데, 예를 들어 증폭된 PCR 산물인 300 내지 700개의 염기 쌍에 의해 입증된 바와 같이(데이터 미도시), 11개의 클론이 헥사뉴클레오티드 반복 확장 서열의 결실을 입증하였다. 서열 분석으로 헥사뉴클레오티드 반복 확장 서열의 결실을 확인되었다(데이터 미도시). 시험한 3개의 조합 중에서, 서열번호 45의 위치 196, 1005 및 1067의 조합을 표적화하는 CRISPR/Cas 시스템은 헥사뉴클레오티드 반복 확장 서열을 결실하는데 가장 효율적인 것으로 증명되었으며; 이러한 조합은 11개중 10개의 양성 클론을 생성하였다. 서열번호 45의 위치 196, 272, 1005 및 1067의 조합을 표적화하는 CRISPR/Cas 시스템은 하나의 클론을 제공하였다. 　　

균등물

본 발명의 적어도 하나의 구현예의 몇몇 측면이 설명되었는데, 다양한 변경, 변형 및 개선이 당업자에 의해 용이하게 이루어질 것임을 당업자는 이해할 것이다. 이러한 변경, 변형 및 개선은 본 개시의 일부가 되도록 의도되고, 본 발명의 사상 및 범주 내에 있도록 의도된다. 따라서, 전술된 설명 및 도면은 단지 예시이며, 본 발명은 이어지는 청구범위에 의해 상세히 기술된다.

청구범위 요소를 변형하기 위한 청구범위 내 "제1", "제2", "제3" 등과 같은 서수 용어의 사용은 그 자체가 하나의 청구범위 요소가 다른 것을 앞서는 어떠한 우선순위, 선행, 또는 순서 또는 방법의 작용이 수행되는 일시적인 순서를 나타내지 않으며, 단지 청구범위 요소들을 구분하기 위해 일정한 이름을 갖는 하나의 청구범위 요소를 (서수 용어의 사용이 없었다면) 동일한 이름을 가진 다른 요소로부터 구분하기 위한 표지로서 사용된다.

본 명세서 및 청구범위 내에서 관사("a" 및 "an")는 명확하게 달리 나타내지 않는 한 복수의 지시 대상물을 포함하는 것으로 이해되어야 한다. 하나의 군의 하나 이상의 구성원 사이에서 "또는"을 포함하는 청구범위 또는 상세한 설명은 반대로 지시되거나 그렇지 않으면 문맥으로부터 명백하지 않는 한 하나, 하나 초과 또는 전체의 군 구성원이 주어진 산물 또는 과정에 존재하거나 채용되거나 그렇지 않으면 관련되는 것을 만족하는 것으로 간주된다. 본 발명은 군의 정확히 하나의 구성원이 주어진 산물 또는 과정에 존재하거나 채용되거나 그렇지 않으면 관련된 구현예를 포함한다. 본 발명은 또한 하나 초과, 또는 전체 군의 구성원이 주어진 산물 또는 과정에 존재하거나 채용되거나 그렇지 않으면 관련된 구현예를 포함한다. 나아가, 본 발명은 그렇지 않은 것으로 지시되거나 반대 또는 불일치가 일어날 수 있다는 것이 당업자에게 명백하지 않는 한 하나 이상의 열거된 청구범위로부터 하나 이상의 제한, 요소, 항목, 서술 용어 등이 동일한 기반의 청구범위에 의존하는 다른 청구범위에 도입된 모든 변형, 조합, 치환을 포함하는 것으로 이해된다. 요소가 (예를 들어, 마커시 군 또는 유사한 형식 내) 목록으로서 제시된 경우, 이러한 요소의 각각의 하위군도 또한 개시되고, 임의의 요소(들)가 이러한 군으로부터 제거될 수 있는 것으로 이해된다. 일반적으로, 본 발명, 또는 본 발명의 측면이 특정 요소, 특징 등을 포함하는 것으로 지칭되는 경우, 본 발명의 특정 구현예 또는 본 발명의 측면은 이러한 요소, 특징으로 이루어지거나 필수적으로 이루어지는 것으로 이해되어야 한다. 간결성을 위해, 이러한 구현예들은 본원에서 글자 그대로 모든 경우에서 구체적으로 기재되지 않는다. 또한 본 발명의 임의의 구현예 또는 측면은 특정한 배제가 본 명세서 내에 언급되었는지에 관계없이 청구범위로부터 명백하게 제외될 수 있는 것으로 이해되어야 한다.

당업자는 본원에 설명된 검정 또는 다른 과정들에서 얻어진 값에서 기인할 수 있는 통상적인 오차 또는 표준 편차를 이해할 것이다.

간행물, 웹사이트 및 다른 참조 물질들은 본 발명의 배경기술을 설명하고, 그의 시행이 참조로서 본원에 포함되는 것을 고려하여 추가적인 상세한 설명을 제공하기 위해 언급되었다.

SEQUENCE LISTING <110> Regeneron Pharmaceuticals, Inc Heslin, David Ally, Roxanne Siao, Chia-Jen Lai, Ka-Man Venus Valenzuela, David M. Guo, Chunguang LaCroix-Fralish, Michael Macdonald, Lynn Sharma, Aarti Kajimura, Daisuke Droguett, Gustavo Frendewey, David <120> NON-HUMAN ANIMALS HAVING A HEXANUCLEOTIDE REPEAT EXPANSION IN A C9ORF72 LOCUS <130> 017283.1366/10267WO01 <150> 62402613 <151> 2016-09-30 <150> 62452795 <151> 2017-01-31 <160> 84 <170> PatentIn version 3.5 <210> 1 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Heterologous Hexanucleotide sequence <400> 1 ggggcc 6 <210> 2 <211> 964 <212> DNA <213> Homo sapiens <400> 2 gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60 ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120 attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180 ggagtcgcgc gctatgcgat cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc 240 ggggcgggcc cgggggcggg cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc 300 ggcggaggcg caggcggtgg cgagtgggtg agtgaggagg cggcatcctg gcgggtggct 360 gtttggggtt cggctgccgg gaagaggcgc gggtagaagc gggggctctc ctcagagctc 420 gacgcatttt tactttccct ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct 480 ctagcgactg gtggaattgc ctgcatccgg gccccgggct tcccggcggc ggcggcggcg 540 gcggcggcgc agggacaagg gatggggatc tggcctcttc cttgctttcc cgccctcagt 600 acccgagctg tctccttccc ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa 660 agggagcctc gggtactgag aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc 720 ggcttctgcg gaccaagtcg gggttcgcta ggaacccgag acggtccctg ccggcgagga 780 gatcatgcgg gatgagatgg gggtgtggag acgcctgcac aatttcagcc caagcttcta 840 gagagtggtg atgacttgca tatgagggca gcaatgcaag tcggtgtgct ccccattctg 900 tgggacatga cctggttgct tcacagctcc gagatgacac agacttgctt aaaggaagtg 960 actc 964 <210> 3 <211> 1528 <212> DNA <213> Homo sapiens <400> 3 gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60 ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120 attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180 ggagtcgcgc gctatgcgat cgccgtctcg gggccggggc cggggccggg gccggggccg 240 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 300 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 360 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 420 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 480 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 540 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 600 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 660 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 720 gggccggggc cggggccggg gccggggccg gggccggggc cgagaccctc gagggccggc 780 cgctagcgcg atcgcggggc gtggtcgggg cgggcccggg ggcgggcccg gggcggggct 840 gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag tgggtgagtg 900 aggaggcggc atcctggcgg gtggctgttt ggggttcggc tgccgggaag aggcgcgggt 960 agaagcgggg gctctcctca gagctcgacg catttttact ttccctctca tttctctgac 1020 cgaagctggg tgtcgggctt tcgcctctag cgactggtgg aattgcctgc atccgggccc 1080 cgggcttccc ggcggcggcg gcggcggcgg cggcgcaggg acaagggatg gggatctggc 1140 ctcttccttg ctttcccgcc ctcagtaccc gagctgtctc cttcccgggg acccgctggg 1200 agcgctgccg ctgcgggctc gagaaaaggg agcctcgggt actgagaggc ctcgcctggg 1260 ggaaggccgg agggtgggcg gcgcgcggct tctgcggacc aagtcggggt tcgctaggaa 1320 cccgagacgg tccctgccgg cgaggagatc atgcgggatg agatgggggt gtggagacgc 1380 ctgcacaatt tcagcccaag cttctagaga gtggtgatga cttgcatatg agggcagcaa 1440 tgcaagtcgg tgtgctcccc attctgtggg acatgacctg gttgcttcac agctccgaga 1500 tgacacagac ttgcttaaag gaagtgac 1528 <210> 4 <211> 3621 <212> DNA <213> Artificial Sequence <220> <223> 8026 insert nucleic acid without homology arms <400> 4 gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60 ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120 attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180 ggagtcgcgc gctatgcgat cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc 240 ggggcgggcc cgggggcggg cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc 300 ggcggaggcg caggcggtgg cgagtgggtg agtgaggagg cggcatcctg gcgggtggct 360 gtttggggtt cggctgccgg gaagaggcgc gggtagaagc gggggctctc ctcagagctc 420 gacgcatttt tactttccct ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct 480 ctagcgactg gtggaattgc ctgcatccgg gccccgggct tcccggcggc ggcggcggcg 540 gcggcggcgc agggacaagg gatggggatc tggcctcttc cttgctttcc cgccctcagt 600 acccgagctg tctccttccc ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa 660 agggagcctc gggtactgag aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc 720 ggcttctgcg gaccaagtcg gggttcgcta ggaacccgag acggtccctg ccggcgagga 780 gatcatgcgg gatgagatgg gggtgtggag acgcctgcac aatttcagcc caagcttcta 840 gagagtggtg atgacttgca tatgagggca gcaatgcaag tcggtgtgct ccccattctg 900 tgggacatga cctggttgct tcacagctcc gagatgacac agacttgctt aaaggaagtg 960 actcgagata acttcgtata atgtatgcta tacgaagtta tatgcatggc ctccgcgccg 1020 ggttttggcg cctcccgcgg gcgcccccct cctcacggcg agcgctgcca cgtcagacga 1080 agggcgcagc gagcgtcctg atccttccgc ccggacgctc aggacagcgg cccgctgctc 1140 ataagactcg gccttagaac cccagtatca gcagaaggac attttaggac gggacttggg 1200 tgactctagg gcactggttt tctttccaga gagcggaaca ggcgaggaaa agtagtccct 1260 tctcggcgat tctgcggagg gatctccgtg gggcggtgaa cgccgatgat tatataagga 1320 cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc ggttcttgtt 1380 tgtggatcgc tgtgatcgtc acttggtgag tagcgggctg ctgggctggc cggggctttc 1440 gtggccgccg ggccgctcgg tgggacggaa gcgtgtggag agaccgccaa gggctgtagt 1500 ctgggtccgc gagcaaggtt gccctgaact gggggttggg gggagcgcag caaaatggcg 1560 gctgttcccg agtcttgaat ggaagacgct tgtgaggcgg gctgtgaggt cgttgaaaca 1620 aggtgggggg catggtgggc ggcaagaacc caaggtcttg aggccttcgc taatgcggga 1680 aagctcttat tcgggtgaga tgggctgggg caccatctgg ggaccctgac gtgaagtttg 1740 tcactgactg gagaactcgg tttgtcgtct gttgcggggg cggcagttat ggcggtgccg 1800 ttgggcagtg cacccgtacc tttgggagcg cgcgccctcg tcgtgtcgtg acgtcacccg 1860 ttctgttggc ttataatgca gggtggggcc acctgccggt aggtgtgcgg taggcttttc 1920 tccgtcgcag gacgcagggt tcgggcctag ggtaggctct cctgaatcga caggcgccgg 1980 acctctggtg aggggaggga taagtgaggc gtcagtttct ttggtcggtt ttatgtacct 2040 atcttcttaa gtagctgaag ctccggtttt gaactatgcg ctcggggttg gcgagtgtgt 2100 tttgtgaagt tttttaggca ccttttgaaa tgtaatcatt tgggtcaata tgtaattttc 2160 agtgttagac tagtaaattg tccgctaaat tctggccgtt tttggctttt ttgttagacg 2220 tgttgacaat taatcatcgg catagtatat cggcatagta taatacgaca aggtgaggaa 2280 ctaaaccatg ggatcggcca ttgaacaaga tggattgcac gcaggttctc cggccgcttg 2340 ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc 2400 cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 2460 tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt 2520 tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 2580 cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 2640 catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 2700 ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca 2760 ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 2820 ggcgcgcatg cccgacggcg atgatctcgt cgtgacccat ggcgatgcct gcttgccgaa 2880 tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 2940 ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 3000 atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 3060 cttctatcgc cttcttgacg agttcttctg aggggatccg ctgtaagtct gcagaaattg 3120 atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt catactttgt 3180 taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc tacgggggtg 3240 ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta ctattgcttt 3300 atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa ttaagggcca 3360 gctcattcct cccactcatg atctatagat ctatagatct ctcgtgggat cattgttttt 3420 ctcttgattc ccactttgtg gttctaagta ctgtggtttc caaatgtgtc agtttcatag 3480 cctgaagaac gagatcagca gcctctgttc cacatacact tcattctcag tattgttttg 3540 ccaagttcta attccatcag acctcgacct gcagccccta gataacttcg tataatgtat 3600 gctatacgaa gttatgctag c 3621 <210> 5 <211> 1006 <212> DNA <213> Artificial Sequence <220> <223> 8026 insert nucleic acid without homology arms and after excision of neo <400> 5 gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60 ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120 attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180 ggagtcgcgc gctatgcgat cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc 240 ggggcgggcc cgggggcggg cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc 300 ggcggaggcg caggcggtgg cgagtgggtg agtgaggagg cggcatcctg gcgggtggct 360 gtttggggtt cggctgccgg gaagaggcgc gggtagaagc gggggctctc ctcagagctc 420 gacgcatttt tactttccct ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct 480 ctagcgactg gtggaattgc ctgcatccgg gccccgggct tcccggcggc ggcggcggcg 540 gcggcggcgc agggacaagg gatggggatc tggcctcttc cttgctttcc cgccctcagt 600 acccgagctg tctccttccc ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa 660 agggagcctc gggtactgag aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc 720 ggcttctgcg gaccaagtcg gggttcgcta ggaacccgag acggtccctg ccggcgagga 780 gatcatgcgg gatgagatgg gggtgtggag acgcctgcac aatttcagcc caagcttcta 840 gagagtggtg atgacttgca tatgagggca gcaatgcaag tcggtgtgct ccccattctg 900 tgggacatga cctggttgct tcacagctcc gagatgacac agacttgctt aaaggaagtg 960 actcgagata acttcgtata atgtatgcta tacgaagtta tgctag 1006 <210> 6 <211> 4180 <212> DNA <213> Artificial Sequence <220> <223> 8026 Insert Nucleic acid without homology arms plus neo cassette <400> 6 ggtctagcaa gagcaggtgt gggtttagga ggtgtgtgtt tttgtttttc ccaccctctc 60 tccccactac ttgctctcac agtactcgct gagggtgaac aagaaaagac ctgataaaga 120 ttaaccagaa gaaaacaagg agggaaacaa ccgcagcctg tagcaagctc tggaactcag 180 gagtcgcgcg ctatgcgatc gccgtctcgg ggccggggcc ggggccgggg ccggggccgg 240 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 300 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 360 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 420 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 480 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 540 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 600 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 660 ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 720 ggccggggcc ggggccgggg ccggggccgg ggccggggcc gagaccctcg agggccggcc 780 gctagcgcga tcgcggggcg tggtcggggc gggcccgggg gcgggcccgg ggcggggctg 840 cggttgcggt gcctgcgccc gcggcggcgg aggcgcaggc ggtggcgagt gggtgagtga 900 ggaggcggca tcctggcggg tggctgtttg gggttcggct gccgggaaga ggcgcgggta 960 gaagcggggg ctctcctcag agctcgacgc atttttactt tccctctcat ttctctgacc 1020 gaagctgggt gtcgggcttt cgcctctagc gactggtgga attgcctgca tccgggcccc 1080 gggcttcccg gcggcggcgg cggcggcggc ggcgcaggga caagggatgg ggatctggcc 1140 tcttccttgc tttcccgccc tcagtacccg agctgtctcc ttcccgggga cccgctggga 1200 gcgctgccgc tgcgggctcg agaaaaggga gcctcgggta ctgagaggcc tcgcctgggg 1260 gaaggccgga gggtgggcgg cgcgcggctt ctgcggacca agtcggggtt cgctaggaac 1320 ccgagacggt ccctgccggc gaggagatca tgcgggatga gatgggggtg tggagacgcc 1380 tgcacaattt cagcccaagc ttctagagag tggtgatgac ttgcatatga gggcagcaat 1440 gcaagtcggt gtgctcccca ttctgtggga catgacctgg ttgcttcaca gctccgagat 1500 gacacagact tgcttaaagg aagtgactcg agataacttc gtataatgta tgctatacga 1560 agttatatgc atggcctccg cgccgggttt tggcgcctcc cgcgggcgcc cccctcctca 1620 cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg tcctgatcct tccgcccgga 1680 cgctcaggac agcggcccgc tgctcataag actcggcctt agaaccccag tatcagcaga 1740 aggacatttt aggacgggac ttgggtgact ctagggcact ggttttcttt ccagagagcg 1800 gaacaggcga ggaaaagtag tcccttctcg gcgattctgc ggagggatct ccgtggggcg 1860 gtgaacgccg atgattatat aaggacgcgc cgggtgtggc acagctagtt ccgtcgcagc 1920 cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg gtgagtagcg 1980 ggctgctggg ctggccgggg ctttcgtggc cgccgggccg ctcggtggga cggaagcgtg 2040 tggagagacc gccaagggct gtagtctggg tccgcgagca aggttgccct gaactggggg 2100 ttggggggag cgcagcaaaa tggcggctgt tcccgagtct tgaatggaag acgcttgtga 2160 ggcgggctgt gaggtcgttg aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg 2220 tcttgaggcc ttcgctaatg cgggaaagct cttattcggg tgagatgggc tggggcacca 2280 tctggggacc ctgacgtgaa gtttgtcact gactggagaa ctcggtttgt cgtctgttgc 2340 gggggcggca gttatggcgg tgccgttggg cagtgcaccc gtacctttgg gagcgcgcgc 2400 cctcgtcgtg tcgtgacgtc acccgttctg ttggcttata atgcagggtg gggccacctg 2460 ccggtaggtg tgcggtaggc ttttctccgt cgcaggacgc agggttcggg cctagggtag 2520 gctctcctga atcgacaggc gccggacctc tggtgagggg agggataagt gaggcgtcag 2580 tttctttggt cggttttatg tacctatctt cttaagtagc tgaagctccg gttttgaact 2640 atgcgctcgg ggttggcgag tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa 2700 tcatttgggt caatatgtaa ttttcagtgt tagactagta aattgtccgc taaattctgg 2760 ccgtttttgg cttttttgtt agacgtgttg acaattaatc atcggcatag tatatcggca 2820 tagtataata cgacaaggtg aggaactaaa ccatgggatc ggccattgaa caagatggat 2880 tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 2940 agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 3000 tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc 3060 tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 3120 cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 3180 ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 3240 atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 3300 ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 3360 cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgatgat ctcgtcgtga 3420 cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 3480 tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 3540 atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 3600 ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagggg 3660 atccgctgta agtctgcaga aattgatgat ctattaaaca ataaagatgt ccactaaaat 3720 ggaagttttt cctgtcatac tttgttaaga agggtgagaa cagagtacct acattttgaa 3780 tggaaggatt ggagctacgg gggtgggggt ggggtgggat tagataaatg cctgctcttt 3840 actgaaggct ctttactatt gctttatgat aatgtttcat agttggatat cataatttaa 3900 acaagcaaaa ccaaattaag ggccagctca ttcctcccac tcatgatcta tagatctata 3960 gatctctcgt gggatcattg tttttctctt gattcccact ttgtggttct aagtactgtg 4020 gtttccaaat gtgtcagttt catagcctga agaacgagat cagcagcctc tgttccacat 4080 acacttcatt ctcagtattg ttttgccaag ttctaattcc atcagacctc gacctgcagc 4140 ccctagataa cttcgtataa tgtatgctat acgaagttat 4180 <210> 7 <211> 1566 <212> DNA <213> Artificial Sequence <220> <223> 8028 insert nucleic acid with lox site after excision of neo and without homology arms <400> 7 gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60 ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120 attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180 ggagtcgcgc gctatgcgat cgccgtctcg gggccggggc cggggccggg gccggggccg 240 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 300 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 360 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 420 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 480 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 540 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 600 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 660 gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 720 gggccggggc cggggccggg gccggggccg gggccggggc cgagaccctc gagggccggc 780 cgctagcgcg atcgcggggc gtggtcgggg cgggcccggg ggcgggcccg gggcggggct 840 gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag tgggtgagtg 900 aggaggcggc atcctggcgg gtggctgttt ggggttcggc tgccgggaag aggcgcgggt 960 agaagcgggg gctctcctca gagctcgacg catttttact ttccctctca tttctctgac 1020 cgaagctggg tgtcgggctt tcgcctctag cgactggtgg aattgcctgc atccgggccc 1080 cgggcttccc ggcggcggcg gcggcggcgg cggcgcaggg acaagggatg gggatctggc 1140 ctcttccttg ctttcccgcc ctcagtaccc gagctgtctc cttcccgggg acccgctggg 1200 agcgctgccg ctgcgggctc gagaaaaggg agcctcgggt actgagaggc ctcgcctggg 1260 ggaaggccgg agggtgggcg gcgcgcggct tctgcggacc aagtcggggt tcgctaggaa 1320 cccgagacgg tccctgccgg cgaggagatc atgcgggatg agatgggggt gtggagacgc 1380 ctgcacaatt tcagcccaag cttctagaga gtggtgatga cttgcatatg agggcagcaa 1440 tgcaagtcgg tgtgctcccc attctgtggg acatgacctg gttgcttcac agctccgaga 1500 tgacacagac ttgcttaaag gaagtgactc gagataactt cgtataatgt atgctatacg 1560 aagtta 1566 <210> 8 <211> 3821 <212> DNA <213> Artificial Sequence <220> <223> 8026 targeting nucleic acid with homology arms and neo cassette <400> 8 gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60 acagccatcc caattgccct ttccttctag gtggaaagtg gggtctagca agagcaggtg 120 tgggtttagg aggtgtgtgt ttttgttttt cccaccctct ctccccacta cttgctctca 180 cagtactcgc tgagggtgaa caagaaaaga cctgataaag attaaccaga agaaaacaag 240 gagggaaaca accgcagcct gtagcaagct ctggaactca ggagtcgcgc gctatgcgat 300 cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc ggggcgggcc cgggggcggg 360 cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc ggcggaggcg caggcggtgg 420 cgagtgggtg agtgaggagg cggcatcctg gcgggtggct gtttggggtt cggctgccgg 480 gaagaggcgc gggtagaagc gggggctctc ctcagagctc gacgcatttt tactttccct 540 ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct ctagcgactg gtggaattgc 600 ctgcatccgg gccccgggct tcccggcggc ggcggcggcg gcggcggcgc agggacaagg 660 gatggggatc tggcctcttc cttgctttcc cgccctcagt acccgagctg tctccttccc 720 ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa agggagcctc gggtactgag 780 aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc ggcttctgcg gaccaagtcg 840 gggttcgcta ggaacccgag acggtccctg ccggcgagga gatcatgcgg gatgagatgg 900 gggtgtggag acgcctgcac aatttcagcc caagcttcta gagagtggtg atgacttgca 960 tatgagggca gcaatgcaag tcggtgtgct ccccattctg tgggacatga cctggttgct 1020 tcacagctcc gagatgacac agacttgctt aaaggaagtg actcgagata acttcgtata 1080 atgtatgcta tacgaagtta tatgcatggc ctccgcgccg ggttttggcg cctcccgcgg 1140 gcgcccccct cctcacggcg agcgctgcca cgtcagacga agggcgcagc gagcgtcctg 1200 atccttccgc ccggacgctc aggacagcgg cccgctgctc ataagactcg gccttagaac 1260 cccagtatca gcagaaggac attttaggac gggacttggg tgactctagg gcactggttt 1320 tctttccaga gagcggaaca ggcgaggaaa agtagtccct tctcggcgat tctgcggagg 1380 gatctccgtg gggcggtgaa cgccgatgat tatataagga cgcgccgggt gtggcacagc 1440 tagttccgtc gcagccggga tttgggtcgc ggttcttgtt tgtggatcgc tgtgatcgtc 1500 acttggtgag tagcgggctg ctgggctggc cggggctttc gtggccgccg ggccgctcgg 1560 tgggacggaa gcgtgtggag agaccgccaa gggctgtagt ctgggtccgc gagcaaggtt 1620 gccctgaact gggggttggg gggagcgcag caaaatggcg gctgttcccg agtcttgaat 1680 ggaagacgct tgtgaggcgg gctgtgaggt cgttgaaaca aggtgggggg catggtgggc 1740 ggcaagaacc caaggtcttg aggccttcgc taatgcggga aagctcttat tcgggtgaga 1800 tgggctgggg caccatctgg ggaccctgac gtgaagtttg tcactgactg gagaactcgg 1860 tttgtcgtct gttgcggggg cggcagttat ggcggtgccg ttgggcagtg cacccgtacc 1920 tttgggagcg cgcgccctcg tcgtgtcgtg acgtcacccg ttctgttggc ttataatgca 1980 gggtggggcc acctgccggt aggtgtgcgg taggcttttc tccgtcgcag gacgcagggt 2040 tcgggcctag ggtaggctct cctgaatcga caggcgccgg acctctggtg aggggaggga 2100 taagtgaggc gtcagtttct ttggtcggtt ttatgtacct atcttcttaa gtagctgaag 2160 ctccggtttt gaactatgcg ctcggggttg gcgagtgtgt tttgtgaagt tttttaggca 2220 ccttttgaaa tgtaatcatt tgggtcaata tgtaattttc agtgttagac tagtaaattg 2280 tccgctaaat tctggccgtt tttggctttt ttgttagacg tgttgacaat taatcatcgg 2340 catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg ggatcggcca 2400 ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 2460 atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 2520 aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg 2580 acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 2640 acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 2700 tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 2760 ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 2820 agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 2880 atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg 2940 atgatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3000 gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3060 cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3120 tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3180 agttcttctg aggggatccg ctgtaagtct gcagaaattg atgatctatt aaacaataaa 3240 gatgtccact aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag 3300 tacctacatt ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat 3360 aaatgcctgc tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg 3420 gatatcataa tttaaacaag caaaaccaaa ttaagggcca gctcattcct cccactcatg 3480 atctatagat ctatagatct ctcgtgggat cattgttttt ctcttgattc ccactttgtg 3540 gttctaagta ctgtggtttc caaatgtgtc agtttcatag cctgaagaac gagatcagca 3600 gcctctgttc cacatacact tcattctcag tattgttttg ccaagttcta attccatcag 3660 acctcgacct gcagccccta gataacttcg tataatgtat gctatacgaa gttatgctag 3720 cattgtgact tgggcatcac ttgactgatg gtaatcagtt gcagagagag aagtgcactg 3780 attaagtctg tccacacagg gtctgtctgg ccaggagtgc a 3821 <210> 9 <211> 4387 <212> DNA <213> Artificial Sequence <220> <223> 8026 insert nucleic acid with homology arms, hexanucleotide repeat(s) and neo cassette <400> 9 gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60 acagccatcc caattgccct ttccttctag gtggaaagtg gggtctagca agagcaggtg 120 tgggtttagg aggtgtgtgt ttttgttttt cccaccctct ctccccacta cttgctctca 180 cagtactcgc tgagggtgaa caagaaaaga cctgataaag attaaccaga agaaaacaag 240 gagggaaaca accgcagcct gtagcaagct ctggaactca ggagtcgcgc gctatgcgat 300 cgccgtctcg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 360 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 420 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 480 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 540 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 600 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 660 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 720 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 780 gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 840 gccggggccg gggccggggc cgagaccctc gagggccggc cgctagcgcg atcgcggggc 900 gtggtcgggg cgggcccggg ggcgggcccg gggcggggct gcggttgcgg tgcctgcgcc 960 cgcggcggcg gaggcgcagg cggtggcgag tgggtgagtg aggaggcggc atcctggcgg 1020 gtggctgttt ggggttcggc tgccgggaag aggcgcgggt agaagcgggg gctctcctca 1080 gagctcgacg catttttact ttccctctca tttctctgac cgaagctggg tgtcgggctt 1140 tcgcctctag cgactggtgg aattgcctgc atccgggccc cgggcttccc ggcggcggcg 1200 gcggcggcgg cggcgcaggg acaagggatg gggatctggc ctcttccttg ctttcccgcc 1260 ctcagtaccc gagctgtctc cttcccgggg acccgctggg agcgctgccg ctgcgggctc 1320 gagaaaaggg agcctcgggt actgagaggc ctcgcctggg ggaaggccgg agggtgggcg 1380 gcgcgcggct tctgcggacc aagtcggggt tcgctaggaa cccgagacgg tccctgccgg 1440 cgaggagatc atgcgggatg agatgggggt gtggagacgc ctgcacaatt tcagcccaag 1500 cttctagaga gtggtgatga cttgcatatg agggcagcaa tgcaagtcgg tgtgctcccc 1560 attctgtggg acatgacctg gttgcttcac agctccgaga tgacacagac ttgcttaaag 1620 gaagtgactc gagataactt cgtataatgt atgctatacg aagttatatg catggcctcc 1680 gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 1740 agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga cagcggcccg 1800 ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 1860 cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 1920 gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 1980 taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 2040 cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg gctggccggg 2100 gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac cgccaagggc 2160 tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga gcgcagcaaa 2220 atggcggctg ttcccgagtc ttgaatggaa gacgcttgtg aggcgggctg tgaggtcgtt 2280 gaaacaaggt ggggggcatg gtgggcggca agaacccaag gtcttgaggc cttcgctaat 2340 gcgggaaagc tcttattcgg gtgagatggg ctggggcacc atctggggac cctgacgtga 2400 agtttgtcac tgactggaga actcggtttg tcgtctgttg cgggggcggc agttatggcg 2460 gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg ccctcgtcgt gtcgtgacgt 2520 cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt gtgcggtagg 2580 cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg aatcgacagg 2640 cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg tcggttttat 2700 gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg gggttggcga 2760 gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg tcaatatgta 2820 attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg gcttttttgt 2880 tagacgtgtt gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt 2940 gaggaactaa accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc 3000 cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 3060 tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 3120 gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 3180 gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 3240 attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 3300 atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 3360 cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 3420 cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 3480 gctcaaggcg cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt 3540 gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 3600 tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 3660 cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 3720 catcgccttc tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag 3780 aaattgatga tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata 3840 ctttgttaag aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg 3900 ggggtggggg tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat 3960 tgctttatga taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa 4020 gggccagctc attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt 4080 gtttttctct tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt 4140 tcatagcctg aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt 4200 gttttgccaa gttctaattc catcagacct cgacctgcag cccctagata acttcgtata 4260 atgtatgcta tacgaagtta tgctagcatt gtgacttggg catcacttga ctgatggtaa 4320 tcagttgcag agagagaagt gcactgatta agtctgtcca cacagggtct gtctggccag 4380 gagtgca 4387 <210> 10 <211> 1957 <212> DNA <213> Homo sapiens <400> 10 acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60 cacgtaaaag atgacgcttg atatctccgg agcatttgga taatgtgaca gttggaatgc 120 agtgatgtcg actctttgcc caccgccatc tccagctgtt gccaagacag agattgcttt 180 aagtggcaaa tcacctttat tagcagctac ttttgcttac tgggacaata ttcttggtcc 240 tagagtaagg cacatttggg ctccaaagac agaacaggta cttctcagtg atggagaaat 300 aacttttctt gccaaccaca ctctaaatgg agaaatcctt cgaaatgcag agagtggtgc 360 tatagatgta aagttttttg tcttgtctga aaagggagtg attattgttt cattaatctt 420 tgatggaaac tggaatgggg atcgcagcac atatggacta tcaattatac ttccacagac 480 agaacttagt ttctacctcc cacttcatag agtgtgtgtt gatagattaa cacatataat 540 ccggaaagga agaatatgga tgcataagga aagacaagaa aatgtccaga agattatctt 600 agaaggcaca gagagaatgg aagatcaggg tcagagtatt attccaatgc ttactggaga 660 agtgattcct gtaatggaac tgctttcatc tatgaaatca cacagtgttc ctgaagaaat 720 agatatagct gatacagtac tcaatgatga tgatattggt gacagctgtc atgaaggctt 780 tcttctcaag taagaatttt tcttttcata aaagctggat gaagcagata ccatcttatg 840 ctcacctatg acaagatttg gaagaaagaa aataacagac tgtctactta gattgttcta 900 gggacattac gtatttgaac tgttgcttaa atttgtgtta tttttcactc attatatttc 960 tatatatatt tggtgttatt ccatttgcta tttaaagaaa ccgagtttcc atcccagaca 1020 agaaatcatg gccccttgct tgattctggt ttcttgtttt acttctcatt aaagctaaca 1080 gaatcctttc atattaagtt gtactgtaga tgaacttaag ttatttaggc gtagaacaaa 1140 attattcata tttatactga tctttttcca tccagcagtg gagtttagta cttaagagtt 1200 tgtgccctta aaccagactc cctggattaa tgctgtgtac ccgtgggcaa ggtgcctgaa 1260 ttctctatac acctatttcc tcatctgtaa aatggcaata atagtaatag tacctaatgt 1320 gtagggttgt tataagcatt gagtaagata aataatataa agcacttaga acagtgcctg 1380 gaacataaaa acacttaata atagctcata gctaacattt cctatttaca tttcttctag 1440 aaatagccag tatttgttga gtgcctacat gttagttcct ttactagttg ctttacatgt 1500 attatcttat attctgtttt aaagtttctt cacagttaca gattttcatg aaattttact 1560 tttaataaaa gagaagtaaa agtataaagt attcactttt atgttcacag tcttttcctt 1620 taggctcatg atggagtatc agaggcatga gtgtgtttaa cctaagagcc ttaatggctt 1680 gaatcagaag cactttagtc ctgtatctgt tcagtgtcag cctttcatac atcattttaa 1740 atcccatttg actttaagta agtcacttaa tctctctaca tgtcaatttc ttcagctata 1800 aaatgatggt atttcaataa ataaatacat taattaaatg atattatact gactaattgg 1860 gctgttttaa ggctcaataa gaaaatttct gtgaaaggtc tctagaaaat gtaggttcct 1920 atacaaataa aagataacat tgtgcttata aaaaaaa 1957 <210> 11 <211> 222 <212> PRT <213> Homo sapiens <400> 11 Met Ser Thr Leu Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu 1 5 10 15 Ile Ala Leu Ser Gly Lys Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr 20 25 30 Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys 35 40 45 Thr Glu Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn 50 55 60 His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile 65 70 75 80 Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser 85 90 95 Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu 100 105 110 Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His 115 120 125 Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile 130 135 140 Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Ile Leu Glu 145 150 155 160 Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu 165 170 175 Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ser Ser Met Lys Ser 180 185 190 His Ser Val Pro Glu Glu Ile Asp Ile Ala Asp Thr Val Leu Asn Asp 195 200 205 Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Lys 210 215 220 <210> 12 <211> 3261 <212> DNA <213> Homo sapiens <400> 12 gggcggggct gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag 60 tggatatctc cggagcattt ggataatgtg acagttggaa tgcagtgatg tcgactcttt 120 gcccaccgcc atctccagct gttgccaaga cagagattgc tttaagtggc aaatcacctt 180 tattagcagc tacttttgct tactgggaca atattcttgg tcctagagta aggcacattt 240 gggctccaaa gacagaacag gtacttctca gtgatggaga aataactttt cttgccaacc 300 acactctaaa tggagaaatc cttcgaaatg cagagagtgg tgctatagat gtaaagtttt 360 ttgtcttgtc tgaaaaggga gtgattattg tttcattaat ctttgatgga aactggaatg 420 gggatcgcag cacatatgga ctatcaatta tacttccaca gacagaactt agtttctacc 480 tcccacttca tagagtgtgt gttgatagat taacacatat aatccggaaa ggaagaatat 540 ggatgcataa ggaaagacaa gaaaatgtcc agaagattat cttagaaggc acagagagaa 600 tggaagatca gggtcagagt attattccaa tgcttactgg agaagtgatt cctgtaatgg 660 aactgctttc atctatgaaa tcacacagtg ttcctgaaga aatagatata gctgatacag 720 tactcaatga tgatgatatt ggtgacagct gtcatgaagg ctttcttctc aatgccatca 780 gctcacactt gcaaacctgt ggctgttccg ttgtagtagg tagcagtgca gagaaagtaa 840 ataagatagt cagaacatta tgcctttttc tgactccagc agagagaaaa tgctccaggt 900 tatgtgaagc agaatcatca tttaaatatg agtcagggct ctttgtacaa ggcctgctaa 960 aggattcaac tggaagcttt gtgctgcctt tccggcaagt catgtatgct ccatatccca 1020 ccacacacat agatgtggat gtcaatactg tgaagcagat gccaccctgt catgaacata 1080 tttataatca gcgtagatac atgagatccg agctgacagc cttctggaga gccacttcag 1140 aagaagacat ggctcaggat acgatcatct acactgacga aagctttact cctgatttga 1200 atatttttca agatgtctta cacagagaca ctctagtgaa agccttcctg gatcaggtct 1260 ttcagctgaa acctggctta tctctcagaa gtactttcct tgcacagttt ctacttgtcc 1320 ttcacagaaa agccttgaca ctaataaaat atatagaaga cgatacgcag aagggaaaaa 1380 agccctttaa atctcttcgg aacctgaaga tagaccttga tttaacagca gagggcgatc 1440 ttaacataat aatggctctg gctgagaaaa ttaaaccagg cctacactct tttatctttg 1500 gaagaccttt ctacactagt gtgcaagaac gagatgttct aatgactttt taaatgtgta 1560 acttaataag cctattccat cacaatcatg atcgctggta aagtagctca gtggtgtggg 1620 gaaacgttcc cctggatcat actccagaat tctgctctca gcaattgcag ttaagtaagt 1680 tacactacag ttctcacaag agcctgtgag gggatgtcag gtgcatcatt acattgggtg 1740 tctcttttcc tagatttatg cttttgggat acagacctat gtttacaata taataaatat 1800 tattgctatc ttttaaagat ataataatag gatgtaaact tgaccacaac tactgttttt 1860 ttgaaataca tgattcatgg tttacatgtg tcaaggtgaa atctgagttg gcttttacag 1920 atagttgact ttctatcttt tggcattctt tggtgtgtag aattactgta atacttctgc 1980 aatcaactga aaactagagc ctttaaatga tttcaattcc acagaaagaa agtgagcttg 2040 aacataggat gagctttaga aagaaaattg atcaagcaga tgtttaattg gaattgatta 2100 ttagatccta ctttgtggat ttagtccctg ggattcagtc tgtagaaatg tctaatagtt 2160 ctctatagtc cttgttcctg gtgaaccaca gttagggtgt tttgtttatt ttattgttct 2220 tgctattgtt gatattctat gtagttgagc tctgtaaaag gaaattgtat tttatgtttt 2280 agtaattgtt gccaactttt taaattaatt ttcattattt ttgagccaaa ttgaaatgtg 2340 cacctcctgt gccttttttc tccttagaaa atctaattac ttggaacaag ttcagatttc 2400 actggtcagt cattttcatc ttgttttctt cttgctaagt cttaccatgt acctgctttg 2460 gcaatcattg caactctgag attataaaat gccttagaga atatactaac taataagatc 2520 tttttttcag aaacagaaaa tagttccttg agtacttcct tcttgcattt ctgcctatgt 2580 ttttgaagtt gttgctgttt gcctgcaata ggctataagg aatagcagga gaaattttac 2640 tgaagtgctg ttttcctagg tgctactttg gcagagctaa gttatctttt gttttcttaa 2700 tgcgtttgga ccattttgct ggctataaaa taactgatta atataattct aacacaatgt 2760 tgacattgta gttacacaaa cacaaataaa tattttattt aaaattctgg aagtaatata 2820 aaagggaaaa tatatttata agaaagggat aaaggtaata gagcccttct gccccccacc 2880 caccaaattt acacaacaaa atgacatgtt cgaatgtgaa aggtcataat agctttccca 2940 tcatgaatca gaaagatgtg gacagcttga tgttttagac aaccactgaa ctagatgact 3000 gttgtactgt agctcagtca tttaaaaaat atataaatac taccttgtag tgtcccatac 3060 tgtgtttttt acatggtaga ttcttattta agtgctaact ggttattttc tttggctggt 3120 ttattgtact gttatacaga atgtaagttg tacagtgaaa taagttatta aagcatgtgt 3180 aaacattgtt atatatcttt tctcctaaat ggagaatttt gaataaaata tatttgaaat 3240 tttaaaaaaa aaaaaaaaaa a 3261 <210> 13 <211> 481 <212> PRT <213> Homo sapiens <400> 13 Met Ser Thr Leu Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu 1 5 10 15 Ile Ala Leu Ser Gly Lys Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr 20 25 30 Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys 35 40 45 Thr Glu Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn 50 55 60 His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile 65 70 75 80 Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser 85 90 95 Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu 100 105 110 Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His 115 120 125 Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile 130 135 140 Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Ile Leu Glu 145 150 155 160 Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu 165 170 175 Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ser Ser Met Lys Ser 180 185 190 His Ser Val Pro Glu Glu Ile Asp Ile Ala Asp Thr Val Leu Asn Asp 195 200 205 Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile 210 215 220 Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser 225 230 235 240 Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr 245 250 255 Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe 260 265 270 Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ser Thr 275 280 285 Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro 290 295 300 Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro 305 310 315 320 Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu 325 330 335 Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr 340 345 350 Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln 355 360 365 Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val 370 375 380 Phe Gln Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln 385 390 395 400 Phe Leu Leu Val Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile 405 410 415 Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn 420 425 430 Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile 435 440 445 Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe 450 455 460 Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr 465 470 475 480 Phe <210> 14 <211> 3356 <212> DNA <213> Homo sapiens <400> 14 acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60 cacgtaaaag atgacgcttg gtgtgtcagc cgtccctgct gcccggttgc ttctcttttg 120 ggggcggggt ctagcaagag caggtgtggg tttaggagat atctccggag catttggata 180 atgtgacagt tggaatgcag tgatgtcgac tctttgccca ccgccatctc cagctgttgc 240 caagacagag attgctttaa gtggcaaatc acctttatta gcagctactt ttgcttactg 300 ggacaatatt cttggtccta gagtaaggca catttgggct ccaaagacag aacaggtact 360 tctcagtgat ggagaaataa cttttcttgc caaccacact ctaaatggag aaatccttcg 420 aaatgcagag agtggtgcta tagatgtaaa gttttttgtc ttgtctgaaa agggagtgat 480 tattgtttca ttaatctttg atggaaactg gaatggggat cgcagcacat atggactatc 540 aattatactt ccacagacag aacttagttt ctacctccca cttcatagag tgtgtgttga 600 tagattaaca catataatcc ggaaaggaag aatatggatg cataaggaaa gacaagaaaa 660 tgtccagaag attatcttag aaggcacaga gagaatggaa gatcagggtc agagtattat 720 tccaatgctt actggagaag tgattcctgt aatggaactg ctttcatcta tgaaatcaca 780 cagtgttcct gaagaaatag atatagctga tacagtactc aatgatgatg atattggtga 840 cagctgtcat gaaggctttc ttctcaatgc catcagctca cacttgcaaa cctgtggctg 900 ttccgttgta gtaggtagca gtgcagagaa agtaaataag atagtcagaa cattatgcct 960 ttttctgact ccagcagaga gaaaatgctc caggttatgt gaagcagaat catcatttaa 1020 atatgagtca gggctctttg tacaaggcct gctaaaggat tcaactggaa gctttgtgct 1080 gcctttccgg caagtcatgt atgctccata tcccaccaca cacatagatg tggatgtcaa 1140 tactgtgaag cagatgccac cctgtcatga acatatttat aatcagcgta gatacatgag 1200 atccgagctg acagccttct ggagagccac ttcagaagaa gacatggctc aggatacgat 1260 catctacact gacgaaagct ttactcctga tttgaatatt tttcaagatg tcttacacag 1320 agacactcta gtgaaagcct tcctggatca ggtctttcag ctgaaacctg gcttatctct 1380 cagaagtact ttccttgcac agtttctact tgtccttcac agaaaagcct tgacactaat 1440 aaaatatata gaagacgata cgcagaaggg aaaaaagccc tttaaatctc ttcggaacct 1500 gaagatagac cttgatttaa cagcagaggg cgatcttaac ataataatgg ctctggctga 1560 gaaaattaaa ccaggcctac actcttttat ctttggaaga cctttctaca ctagtgtgca 1620 agaacgagat gttctaatga ctttttaaat gtgtaactta ataagcctat tccatcacaa 1680 tcatgatcgc tggtaaagta gctcagtggt gtggggaaac gttcccctgg atcatactcc 1740 agaattctgc tctcagcaat tgcagttaag taagttacac tacagttctc acaagagcct 1800 gtgaggggat gtcaggtgca tcattacatt gggtgtctct tttcctagat ttatgctttt 1860 gggatacaga cctatgttta caatataata aatattattg ctatctttta aagatataat 1920 aataggatgt aaacttgacc acaactactg tttttttgaa atacatgatt catggtttac 1980 atgtgtcaag gtgaaatctg agttggcttt tacagatagt tgactttcta tcttttggca 2040 ttctttggtg tgtagaatta ctgtaatact tctgcaatca actgaaaact agagccttta 2100 aatgatttca attccacaga aagaaagtga gcttgaacat aggatgagct ttagaaagaa 2160 aattgatcaa gcagatgttt aattggaatt gattattaga tcctactttg tggatttagt 2220 ccctgggatt cagtctgtag aaatgtctaa tagttctcta tagtccttgt tcctggtgaa 2280 ccacagttag ggtgttttgt ttattttatt gttcttgcta ttgttgatat tctatgtagt 2340 tgagctctgt aaaaggaaat tgtattttat gttttagtaa ttgttgccaa ctttttaaat 2400 taattttcat tatttttgag ccaaattgaa atgtgcacct cctgtgcctt ttttctcctt 2460 agaaaatcta attacttgga acaagttcag atttcactgg tcagtcattt tcatcttgtt 2520 ttcttcttgc taagtcttac catgtacctg ctttggcaat cattgcaact ctgagattat 2580 aaaatgcctt agagaatata ctaactaata agatcttttt ttcagaaaca gaaaatagtt 2640 ccttgagtac ttccttcttg catttctgcc tatgtttttg aagttgttgc tgtttgcctg 2700 caataggcta taaggaatag caggagaaat tttactgaag tgctgttttc ctaggtgcta 2760 ctttggcaga gctaagttat cttttgtttt cttaatgcgt ttggaccatt ttgctggcta 2820 taaaataact gattaatata attctaacac aatgttgaca ttgtagttac acaaacacaa 2880 ataaatattt tatttaaaat tctggaagta atataaaagg gaaaatatat ttataagaaa 2940 gggataaagg taatagagcc cttctgcccc ccacccacca aatttacaca acaaaatgac 3000 atgttcgaat gtgaaaggtc ataatagctt tcccatcatg aatcagaaag atgtggacag 3060 cttgatgttt tagacaacca ctgaactaga tgactgttgt actgtagctc agtcatttaa 3120 aaaatatata aatactacct tgtagtgtcc catactgtgt tttttacatg gtagattctt 3180 atttaagtgc taactggtta ttttctttgg ctggtttatt gtactgttat acagaatgta 3240 agttgtacag tgaaataagt tattaaagca tgtgtaaaca ttgttatata tcttttctcc 3300 taaatggaga attttgaata aaatatattt gaaattttaa aaaaaaaaaa aaaaaa 3356 <210> 15 <211> 481 <212> PRT <213> Homo sapiens <400> 15 Met Ser Thr Leu Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu 1 5 10 15 Ile Ala Leu Ser Gly Lys Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr 20 25 30 Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys 35 40 45 Thr Glu Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn 50 55 60 His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile 65 70 75 80 Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser 85 90 95 Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu 100 105 110 Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His 115 120 125 Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile 130 135 140 Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Ile Leu Glu 145 150 155 160 Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu 165 170 175 Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ser Ser Met Lys Ser 180 185 190 His Ser Val Pro Glu Glu Ile Asp Ile Ala Asp Thr Val Leu Asn Asp 195 200 205 Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile 210 215 220 Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser 225 230 235 240 Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr 245 250 255 Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe 260 265 270 Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ser Thr 275 280 285 Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro 290 295 300 Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro 305 310 315 320 Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu 325 330 335 Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr 340 345 350 Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln 355 360 365 Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val 370 375 380 Phe Gln Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln 385 390 395 400 Phe Leu Leu Val Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile 405 410 415 Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn 420 425 430 Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile 435 440 445 Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe 450 455 460 Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr 465 470 475 480 Phe <210> 16 <211> 3198 <212> DNA <213> Mus musculus <400> 16 gtgtccgggg cggggcggtc ccggggcggg gcccggagcg ggctgcggtt gcggtccctg 60 cgccggcggt gaaggcgcag cagcggcgag tggctattgc aagcgttcgg ataatgtgag 120 acctggaatg cagtgagacc tgggatgcag ggatgtcgac tatctgcccc ccaccatctc 180 ctgctgttgc caagacagag attgctttaa gtggtgaatc acccttgttg gcggctacct 240 ttgcttactg ggataatatt cttggtccta gagtaaggca tatttgggct ccaaagacag 300 accaagtgct tctcagtgat ggagaaataa cttttcttgc caaccacact ctaaatggag 360 aaattcttcg aaatgcagag agtggggcta tagatgtaaa attttttgtc ttatctgaaa 420 aaggggtaat tattgtttca ttaatcttcg acggaaactg gaatggagat cggagcactt 480 atggactatc aattatactg ccgcagacag agctgagctt ctacctccca cttcacagag 540 tgtgtgttga caggctaaca cacattattc gaaaaggaag aatatggatg cataaggaaa 600 gacaagaaaa tgtccagaaa attgtcttgg aaggcacaga gaggatggaa gatcagggtc 660 agagtatcat tcccatgctt actggggaag tcattcctgt aatggagctg cttgcatcta 720 tgaaatccca cagtgttcct gaagacattg atatagctga tacagtgctc aatgatgatg 780 acattggtga cagctgtcac gaaggctttc ttctcaatgc catcagctca cacctgcaga 840 cctgtggctg ttccgttgta gttggcagca gtgcagagaa agtaaataag atagtaagaa 900 cgctgtgcct ttttctgaca ccagcagaga ggaaatgctc caggctgtgt gaagcagaat 960 cgtcctttaa gtacgaatcg ggactctttg tgcaaggctt gctaaaggat gcaacaggca 1020 gttttgtcct acccttccgg caagttatgt atgccccgta ccccaccacg cacattgatg 1080 tggatgtcaa cactgtcaag cagatgccac cgtgtcatga acatatttat aatcaacgca 1140 gatacatgag gtcagagctg acagccttct ggagggcaac ttcagaagag gacatggcgc 1200 aggacaccat catctacaca gatgagagct tcactcctga tttgaatatt ttccaagatg 1260 tcttacacag agacactcta gtgaaagcct tcctggatca ggtcttccat ttgaagcctg 1320 gcctgtctct caggagtact ttccttgcac agttcctcct cattcttcac agaaaagcct 1380 tgacactaat caagtacatc gaggatgata cgcagaaggg gaaaaagccc tttaagtctc 1440 ttcggaacct gaagatagat cttgatttaa cagcagaggg cgatcttaac ataataatgg 1500 ctctagctga gaaaattaag ccaggcctac actctttcat ctttgggaga cctttctaca 1560 ctagtgtaca agaacgtgat gttctaatga ccttttgacc gtgtggtttg ctgtgtctgt 1620 ctcttcacag tcacacctgc tgttacagtg tctcagcagt gtgtgggcac atccttcctc 1680 ccgagtcctg ctgcaggaca gggtacacta cacttgtcag tagaagtctg tacctgatgt 1740 caggtgcatc gttacagtga atgactcttc ctagaataga tgtactcttt tagggcctta 1800 tgtttacaat tatcctaagt actattgctg tcttttaaag atatgaatga tggaatatac 1860 acttgaccat aactgctgat tggttttttg ttttgttttg tttgttttct tggaaactta 1920 tgattcctgg tttacatgta ccacactgaa accctcgtta gctttacaga taaagtgtga 1980 gttgacttcc tgcccctctg tgttctgtgg tatgtccgat tacttctgcc acagctaaac 2040 attagagcat ttaaagtttg cagttcctca gaaaggaact tagtctgact acagattagt 2100 tcttgagaga agacactgat agggcagagc tgtaggtgaa atcagttgtt agcccttcct 2160 ttatagacgt agtccttcag attcggtctg tacagaaatg ccgaggggtc atgcatgggc 2220 cctgagtatc gtgacctgtg acaagttttt tgttggttta ttgtagttct gtcaaagaaa 2280 gtggcatttg tttttataat tgttgccaac ttttaaggtt aattttcatt atttttgagc 2340 cgaattaaaa tgcgcacctc ctgtgccttt cccaatcttg gaaaatataa tttcttggca 2400 gagggtcaga tttcagggcc cagtcacttt catctgacca ccctttgcac ggctgccgtg 2460 tgcctggctt agattagaag tccttgttaa gtatgtcaga gtacattcgc tgataagatc 2520 tttgaagagc agggaagcgt cttgcctctt tcctttggtt tctgcctgta ctctggtgtt 2580 tcccgtgtca cctgcatcat aggaacagca gagaaatctg acccagtgct atttttctag 2640 gtgctactat ggcaaactca agtggtctgt ttctgttcct gtaacgttcg actatctcgc 2700 tagctgtgaa gtactgatta gtggagttct gtgcaacagc agtgtaggag tatacacaaa 2760 cacaaatatg tgtttctatt taaaactgtg gacttagcat aaaaagggag aatatattta 2820 ttttttacaa aagggataaa aatgggcccc gttcctcacc caccagattt agcgagaaaa 2880 agctttctat tctgaaaggt cacggtggct ttggcattac aaatcagaac aacacacact 2940 gaccatgatg gcttgtgaac taactgcaag gcactccgtc atggtaagcg agtaggtccc 3000 acctcctagt gtgccgctca ttgctttaca cagtagaatc ttatttgagt gctaattgtt 3060 gtctttgctg ctttactgtg ttgttataga aaatgtaagc tgtacagtga ataagttatt 3120 gaagcatgtg taaacactgt tatatatctt ttctcctaga tggggaattt tgaataaaat 3180 acctttgaaa ttctgtgt 3198 <210> 17 <211> 481 <212> PRT <213> Mus musculus <400> 17 Met Ser Thr Ile Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu 1 5 10 15 Ile Ala Leu Ser Gly Glu Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr 20 25 30 Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys 35 40 45 Thr Asp Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn 50 55 60 His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile 65 70 75 80 Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser 85 90 95 Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu 100 105 110 Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His 115 120 125 Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile 130 135 140 Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Val Leu Glu 145 150 155 160 Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu 165 170 175 Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ala Ser Met Lys Ser 180 185 190 His Ser Val Pro Glu Asp Ile Asp Ile Ala Asp Thr Val Leu Asn Asp 195 200 205 Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile 210 215 220 Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser 225 230 235 240 Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr 245 250 255 Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe 260 265 270 Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ala Thr 275 280 285 Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro 290 295 300 Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro 305 310 315 320 Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu 325 330 335 Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr 340 345 350 Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln 355 360 365 Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val 370 375 380 Phe His Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln 385 390 395 400 Phe Leu Leu Ile Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile 405 410 415 Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn 420 425 430 Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile 435 440 445 Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe 450 455 460 Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr 465 470 475 480 Phe <210> 18 <211> 3435 <212> DNA <213> Rattus norvegicus <400> 18 cgtttgtagt gtcagccatc ccaattgcct gttccttctc tgtgggagtg gtgtctagac 60 agtccaggca gggtatgcta ggcaggtgcg ttttggttgc ctcagatcgc aacttgactc 120 cataacggtg accaaagaca aaagaaggaa accagattaa aaagaaccgg acacagaccc 180 ctgcagaatc tggagcggcc gtggttgggg gcggggctac gacggggcgg actcgggggc 240 gtgggagggc ggggccgggg cggggcccgg agccggctgc ggttgcggtc cctgcgccgg 300 cggtgaaggc gcagcggcgg cgagtggcta ttgcaagcgt ttggataatg tgagacctgg 360 gatgcaggga tgtcgactat ctgcccccca ccatctcctg ctgttgccaa gacagagatt 420 gctttaagtg gtgaatcacc cttgttggcg gctacctttg cttactggga taatattctt 480 ggtcctagag taaggcacat ttgggctcca aagacagacc aagtactcct cagtgatgga 540 gaaatcactt ttcttgccaa ccacactctg aatggagaaa ttcttcggaa tgcggagagt 600 ggggcaatag atgtaaagtt ttttgtctta tctgaaaagg gcgtcattat tgtttcatta 660 atcttcgacg ggaactggaa cggagatcgg agcacttacg gactatcaat tatactgccg 720 cagacggagc tgagtttcta cctcccactg cacagagtgt gtgttgacag gctaacgcac 780 atcattcgaa aaggaaggat atggatgcac aaggaaagac aagaaaatgt ccagaaaatt 840 gtcttggaag gcaccgagag gatggaagat cagggtcaga gtatcatccc tatgcttact 900 ggggaggtca tccctgtgat ggagctgctt gcgtctatga gatcacacag tgttcctgaa 960 gacctcgata tagctgatac agtactcaat gatgatgaca ttggtgacag ctgtcatgaa 1020 ggctttcttc tcaatgccat cagctcacat ctgcagacct gcggctgttc tgtggtggta 1080 ggcagcagtg cagagaaagt aaataagata gtaagaacac tgtgcctttt tctgacacca 1140 gcagagagga agtgctccag gctgtgtgaa gccgaatcgt cctttaaata cgaatctgga 1200 ctctttgtac aaggcttgct aaaggatgcg actggcagtt ttgtactacc tttccggcaa 1260 gttatgtatg ccccttatcc caccacacac atcgatgtgg atgtcaacac tgtcaagcag 1320 atgccaccgt gtcatgaaca tatttataat caacgcagat acatgaggtc agagctgaca 1380 gccttctgga gggcaacttc agaagaggac atggctcagg acaccatcat ctacacagat 1440 gagagcttca ctcctgattt gaatattttc caagatgtct tacacagaga cactctagtg 1500 aaagcctttc tggatcaggt cttccatttg aagcctggcc tgtctctcag gagtactttc 1560 cttgcacagt tcctcctcat tcttcacaga aaagccttga cactaatcaa gtacatagag 1620 gatgacacgc agaaggggaa aaagcccttt aagtctcttc ggaacctgaa gatagatctt 1680 gatttaacag cagagggcga ccttaacata ataatggctc tagctgagaa aattaagcca 1740 ggcctacact ctttcatctt cgggagacct ttctacacta gtgtccaaga acgtgatgtt 1800 ctaatgactt tttaaacatg tggtttgctc cgtgtgtctc atgacagtca cacttgctgt 1860 tacagtgtct cagcgctttg gacacatcct tcctccaggg tcctgccgca ggacacgtta 1920 cactacactt gtcagtagag gtctgtacca gatgtcaggt acatcgttgt agtgaatgtc 1980 tcttttccta gactagatgt accctcgtag ggacttatgt ttacaaccct cctaagtact 2040 agtgctgtct tgtaaggata cgaatgaagg gatgtaaact tcaccacaac tgctggttgg 2100 ttttgttgtt tttgtttttt gaaacttata attcatggtt tacatgcatc acactgaaac 2160 cctagttagc tttttacagg taagctgtga gttgactgcc tgtccctgtg ttctctggcc 2220 tgtacgatct gtggcgtgta ggatcacttt tgcaacaact aaaaactaaa gcactttgtt 2280 tgcagttcta cagaaagcaa cttagtctgt ctgcagattc gtttttgaaa gaagacatga 2340 gaaagcggag ttttaggtga agtcagttgt tggatcttcc tttatagact tagtccttta 2400 gatgtggtct gtatagacat gcccaaccat catgcatggg cactgaatat cgtgaactgt 2460 ggtatgcttt ttgttggttt attgtacttc tgtcaaagaa agtggcattg gtttttataa 2520 ttgttgccaa gttttaaggt taattttcat tatttttgag ccaaattaaa atgtgcacct 2580 cctgtgcctt tcccaatctt ggaaaatata atttcttggc agaaggtcag atttcagggc 2640 ccagtcactt tcgtctgact tccctttgca cagtccgcca tgggcctggc ttagaagttc 2700 ttgtaaacta tgccagagag tacattcgct gataaaatct tctttgcaga gcaggagagc 2760 ttcttgcctc tttcctttca tttctgcctg gactttggtg ttctccacgt tccctgcatc 2820 ctaaggacag caggagaact ctgaccccag tgctatttct ctaggtgcta ttgtggcaaa 2880 ctcaagcggt ccgtctctgt ccctgtaacg ttcgtacctt gctggctgtg aagtactgac 2940 tggtaaagct ccgtgctaca gcagtgtagg gtatacacaa acacaagtaa gtgttttatt 3000 taaaactgtg gacttagcat aaaaagggag actatattta ttttttacaa aagggataaa 3060 aatggaaccc tttcctcacc caccagattt agtcagaaaa aaacattcta ttctgaaagg 3120 tcacagtggt tttgacatga cacatcagaa caacgcacac tgtccatgat ggcttatgaa 3180 ctccaagtca ctccatcatg gtaaatgggt agatccctcc ttctagtgtg ccacaccatt 3240 gcttcccaca gtagaatctt atttaagtgc taagtgttgt ctctgctggt ttactctgtt 3300 gttttagaga atgtaagttg tatagtgaat aagttattga agcatgtgta aacactgtta 3360 tacatctttt ctcctagatg gggaatttgg aataaaatac ctttaaaatt caaaaaaaaa 3420 aaaaaaaaaa aaaaa 3435 <210> 19 <211> 481 <212> PRT <213> Rattus norvegicus <400> 19 Met Ser Thr Ile Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu 1 5 10 15 Ile Ala Leu Ser Gly Glu Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr 20 25 30 Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys 35 40 45 Thr Asp Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn 50 55 60 His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile 65 70 75 80 Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser 85 90 95 Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu 100 105 110 Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His 115 120 125 Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile 130 135 140 Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Val Leu Glu 145 150 155 160 Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu 165 170 175 Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ala Ser Met Arg Ser 180 185 190 His Ser Val Pro Glu Asp Leu Asp Ile Ala Asp Thr Val Leu Asn Asp 195 200 205 Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile 210 215 220 Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser 225 230 235 240 Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr 245 250 255 Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe 260 265 270 Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ala Thr 275 280 285 Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro 290 295 300 Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro 305 310 315 320 Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu 325 330 335 Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr 340 345 350 Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln 355 360 365 Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val 370 375 380 Phe His Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln 385 390 395 400 Phe Leu Leu Ile Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile 405 410 415 Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn 420 425 430 Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile 435 440 445 Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe 450 455 460 Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr 465 470 475 480 Phe <210> 20 <211> 100 <212> DNA <213> Mus musculus <400> 20 gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60 acagccatcc caattgccct ttccttctag gtggaaagtg 100 <210> 21 <211> 2648 <212> DNA <213> Artificial Sequence <220> <223> floxed neo cassette of 8026 plus lox sites <400> 21 ataacttcgt ataatgtatg ctatacgaag ttatatgcat ggcctccgcg ccgggttttg 60 gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg ccacgtcaga cgaagggcgc 120 agcgagcgtc ctgatccttc cgcccggacg ctcaggacag cggcccgctg ctcataagac 180 tcggccttag aaccccagta tcagcagaag gacattttag gacgggactt gggtgactct 240 agggcactgg ttttctttcc agagagcgga acaggcgagg aaaagtagtc ccttctcggc 300 gattctgcgg agggatctcc gtggggcggt gaacgccgat gattatataa ggacgcgccg 360 ggtgtggcac agctagttcc gtcgcagccg ggatttgggt cgcggttctt gtttgtggat 420 cgctgtgatc gtcacttggt gagtagcggg ctgctgggct ggccggggct ttcgtggccg 480 ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc caagggctgt agtctgggtc 540 cgcgagcaag gttgccctga actgggggtt ggggggagcg cagcaaaatg gcggctgttc 600 ccgagtcttg aatggaagac gcttgtgagg cgggctgtga ggtcgttgaa acaaggtggg 660 gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt cgctaatgcg ggaaagctct 720 tattcgggtg agatgggctg gggcaccatc tggggaccct gacgtgaagt ttgtcactga 780 ctggagaact cggtttgtcg tctgttgcgg gggcggcagt tatggcggtg ccgttgggca 840 gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc gtgacgtcac ccgttctgtt 900 ggcttataat gcagggtggg gccacctgcc ggtaggtgtg cggtaggctt ttctccgtcg 960 caggacgcag ggttcgggcc tagggtaggc tctcctgaat cgacaggcgc cggacctctg 1020 gtgaggggag ggataagtga ggcgtcagtt tctttggtcg gttttatgta cctatcttct 1080 taagtagctg aagctccggt tttgaactat gcgctcgggg ttggcgagtg tgttttgtga 1140 agttttttag gcaccttttg aaatgtaatc atttgggtca atatgtaatt ttcagtgtta 1200 gactagtaaa ttgtccgcta aattctggcc gtttttggct tttttgttag acgtgttgac 1260 aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc 1320 atgggatcgg ccattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1380 aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1440 cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 1500 aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 1560 gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 1620 ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 1680 gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 1740 aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 1800 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 1860 atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 1920 gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 1980 tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2040 gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2100 cgccttcttg acgagttctt ctgaggggat ccgctgtaag tctgcagaaa ttgatgatct 2160 attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt tgttaagaag 2220 ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg gtgggggtgg 2280 ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc tttatgataa 2340 tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg ccagctcatt 2400 cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt tttctcttga 2460 ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca tagcctgaag 2520 aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt ttgccaagtt 2580 ctaattccat cagacctcga cctgcagccc ctagataact tcgtataatg tatgctatac 2640 gaagttat 2648 <210> 22 <211> 100 <212> DNA <213> Mus musculus <400> 22 attgtgactt gggcatcact tgactgatgg taatcagttg cagagagaga agtgcactga 60 ttaagtctgt ccacacaggg tctgtctggc caggagtgca 100 <210> 23 <211> 100 <212> DNA <213> Mus musculus <400> 23 gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60 acagccatcc caattgccct ttccttctag gtggaaagtg 100 <210> 24 <211> 2648 <212> DNA <213> Artificial Sequence <220> <223> floxed cassette of 8028 plus lox sites <400> 24 ataacttcgt ataatgtatg ctatacgaag ttatatgcat ggcctccgcg ccgggttttg 60 gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg ccacgtcaga cgaagggcgc 120 agcgagcgtc ctgatccttc cgcccggacg ctcaggacag cggcccgctg ctcataagac 180 tcggccttag aaccccagta tcagcagaag gacattttag gacgggactt gggtgactct 240 agggcactgg ttttctttcc agagagcgga acaggcgagg aaaagtagtc ccttctcggc 300 gattctgcgg agggatctcc gtggggcggt gaacgccgat gattatataa ggacgcgccg 360 ggtgtggcac agctagttcc gtcgcagccg ggatttgggt cgcggttctt gtttgtggat 420 cgctgtgatc gtcacttggt gagtagcggg ctgctgggct ggccggggct ttcgtggccg 480 ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc caagggctgt agtctgggtc 540 cgcgagcaag gttgccctga actgggggtt ggggggagcg cagcaaaatg gcggctgttc 600 ccgagtcttg aatggaagac gcttgtgagg cgggctgtga ggtcgttgaa acaaggtggg 660 gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt cgctaatgcg ggaaagctct 720 tattcgggtg agatgggctg gggcaccatc tggggaccct gacgtgaagt ttgtcactga 780 ctggagaact cggtttgtcg tctgttgcgg gggcggcagt tatggcggtg ccgttgggca 840 gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc gtgacgtcac ccgttctgtt 900 ggcttataat gcagggtggg gccacctgcc ggtaggtgtg cggtaggctt ttctccgtcg 960 caggacgcag ggttcgggcc tagggtaggc tctcctgaat cgacaggcgc cggacctctg 1020 gtgaggggag ggataagtga ggcgtcagtt tctttggtcg gttttatgta cctatcttct 1080 taagtagctg aagctccggt tttgaactat gcgctcgggg ttggcgagtg tgttttgtga 1140 agttttttag gcaccttttg aaatgtaatc atttgggtca atatgtaatt ttcagtgtta 1200 gactagtaaa ttgtccgcta aattctggcc gtttttggct tttttgttag acgtgttgac 1260 aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc 1320 atgggatcgg ccattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1380 aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1440 cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 1500 aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 1560 gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 1620 ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 1680 gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 1740 aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 1800 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 1860 atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 1920 gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 1980 tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2040 gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2100 cgccttcttg acgagttctt ctgaggggat ccgctgtaag tctgcagaaa ttgatgatct 2160 attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt tgttaagaag 2220 ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg gtgggggtgg 2280 ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc tttatgataa 2340 tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg ccagctcatt 2400 cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt tttctcttga 2460 ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca tagcctgaag 2520 aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt ttgccaagtt 2580 ctaattccat cagacctcga cctgcagccc ctagataact tcgtataatg tatgctatac 2640 gaagttat 2648 <210> 25 <211> 100 <212> DNA <213> Mus musculus <400> 25 attgtgactt gggcatcact tgactgatgg taatcagttg cagagagaga agtgcactga 60 ttaagtctgt ccacacaggg tctgtctggc caggagtgca 100 <210> 26 <211> 680 <212> DNA <213> Mus musculus <400> 26 ccagtagcag cacccacgtc caccttctgt ctagtaatgt ccaacacctc cctcagtcca 60 aacactgctc tgcatccatg tggctcccat ttatacctga agcacttgat ggggcctcaa 120 tgttttacta gagcccaccc ccctgcaact ctgagaccct ctggatttgt ctgtcagtgc 180 ctcactgggg cgttggataa tttcttaaaa ggtcaagttc cctcagcagc attctctgag 240 cagtctgaag atgtgtgctt ttcacagttc aaatccatgt ggctgtttca cccacctgcc 300 tggccttggg ttatctatca ggacctagcc tagaagcagg tgtgtggcac ttaacaccta 360 agctgagtga ctaactgaac actcaagtgg atgccatctt tgtcacttct tgactgtgac 420 acaagcaact cctgatgcca aagccctgcc cacccctctc atgcccatat ttggacatgg 480 tacaggtcct cactggccat ggtctgtgag gtcctggtcc tctttgactt cataattcct 540 aggggccact agtatctata agaggaagag ggtgctggct cccaggccac agcccacaaa 600 attccacctg ctcacaggtt ggctggctcg acccaggtgg tgtcccctgc tctgagccag 660 ctcccggcca agccagcacc 680 <210> 27 <211> 1052 <212> DNA <213> Mus musculus <400> 27 tgccatcatc acaggatgtc cttccttctc cagaagacag actggggctg aaggaaaagc 60 cggccaggct cagaacgagc cccactaatt actgcctcca acagctttcc actcactgcc 120 cccagcccaa catccccttt ttaactggga agcattccta ctctccattg tacgcacacg 180 ctcggaagcc tggctgtggg tttgggcatg agaggcaggg acaacaaaac cagtatatat 240 gattataact ttttcctgtt tccctatttc caaatggtcg aaaggaggaa gttaggtcta 300 cctaagctga atgtattcag ttagcaggag aaatgaaatc ctatacgttt aatactagag 360 gagaaccgcc ttagaatatt tatttcattg gcaatgactc caggactaca cagcgaaatt 420 gtattgcatg tgctgccaaa atactttagc tctttccttc gaagtacgtc ggatcctgta 480 attgagacac cgagtttagg tgactagggt tttcttttga ggaggagtcc cccaccccgc 540 cccgctctgc cgcgacagga agctagcgat ccggaggact tagaatacaa tcgtagtgtg 600 ggtaaacatg gagggcaagc gcctgcaaag ggaagtaaga agattcccag tccttgttga 660 aatccatttg caaacagagg aagctgccgc gggtcgcagt cggtgggggg aagccctgaa 720 ccccacgctg cacggctggg ctggccaggt gcggccacgc ccccatcgcg gcggctggta 780 ggagtgaatc agaccgtcag tattggtaaa gaagtctgcg gcagggcagg gagggggaag 840 agtagtcagt cgctcgctca ctcgctcgct cgcacagaca ctgctgcagt gacactcggc 900 cctccagtgt cgcggagacg caagagcagc gcgcagcacc tgtccgcccg gagcgagccc 960 ggcccgcggc cgtagaaaag gagggaccgc cgaggtgcgc gtcagtactg ctcagcccgg 1020 cagggacgcg ggaggatgtg gactgggtgg ac 1052 <210> 28 <211> 2008 <212> DNA <213> Mus musculus <400> 28 gtggtgctga ctcagcatcg gttaataaac cctctgcagg aggctggatt tcttttgttt 60 aattatcact tggacctttc tgagaactct taagaattgt tcattcgggt ttttttgttt 120 tgttttggtt tggttttttt gggttttttt tttttttttt tttttggttt ttggagacag 180 ggtttctctg tatatagccc tggcacaaga gcaagctaac agcctgtttc ttcttggtgc 240 tagcgccccc tctggcagaa aatgaaataa caggtggacc tacaaccccc cccccccccc 300 ccagtgtatt ctactcttgt ccccggtata aatttgattg ttccgaacta cataaattgt 360 agaaggattt tttagatgca catatcattt tctgtgatac cttccacaca cccctccccc 420 ccaaaaaaat ttttctggga aagtttcttg aaaggaaaac agaagaacaa gcctgtcttt 480 atgattgagt tgggcttttg ttttgctgtg tttcatttct tcctgtaaac aaatactcaa 540 atgtccactt cattgtatga ctaagttggt atcattaggt tgggtctggg tgtgtgaatg 600 tgggtgtgga tctggatgtg ggtgggtgtg tatgccccgt gtgtttagaa tactagaaaa 660 gataccacat cgtaaacttt tgggagagat gatttttaaa aatgggggtg ggggtgaggg 720 gaacctgcga tgaggcaagc aagataaggg gaagacttga gtttctgtga tctaaaaagt 780 cgctgtgatg ggatgctggc tataaatggg cccttagcag cattgtttct gtgaattgga 840 ggatccctgc tgaaggcaaa agaccattga aggaagtacc gcatctggtt tgttttgtaa 900 tgagaagcag gaatgcaagg tccacgctct taataataaa caaacaggac attgtatgcc 960 atcatcacag gatgtccttc cttctccaga agacagactg gggctgaagg aaaagccggc 1020 caggctcaga acgagcccca ctaattactg cctccaacag ctttccactc actgccccca 1080 gcccaacatc ccctttttaa ctgggaagca ttcctactct ccattgtacg cacacgctcg 1140 gaagcctggc tgtgggtttg ggcatgagag gcagggacaa caaaaccagt atatatgatt 1200 ataacttttt cctgtttccc tatttccaaa tggtcgaaag gaggaagtta ggtctaccta 1260 agctgaatgt attcagttag caggagaaat gaaatcctat acgtttaata ctagaggaga 1320 accgccttag aatatttatt tcattggcaa tgactccagg actacacagc gaaattgtat 1380 tgcatgtgct gccaaaatac tttagctctt tccttcgaag tacgtcggat cctgtaattg 1440 agacaccgag tttaggtgac tagggttttc ttttgaggag gagtccccca ccccgccccg 1500 ctctgccgcg acaggaagct agcgatccgg aggacttaga atacaatcgt agtgtgggta 1560 aacatggagg gcaagcgcct gcaaagggaa gtaagaagat tcccagtcct tgttgaaatc 1620 catttgcaaa cagaggaagc tgccgcgggt cgcagtcggt ggggggaagc cctgaacccc 1680 acgctgcacg gctgggctgg ccaggtgcgg ccacgccccc atcgcggcgg ctggtaggag 1740 tgaatcagac cgtcagtatt ggtaaagaag tctgcggcag ggcagggagg gggaagagta 1800 gtcagtcgct cgctcactcg ctcgctcgca cagacactgc tgcagtgaca ctcggccctc 1860 cagtgtcgcg gagacgcaag agcagcgcgc agcacctgtc cgcccggagc gagcccggcc 1920 cgcggccgta gaaaaggagg gaccgccgag gtgcgcgtca gtactgctca gcccggcagg 1980 gacgcgggag gatgtggact gggtggac 2008 <210> 29 <211> 252 <212> DNA <213> Artificial Sequence <220> <223> Southern blot probe <400> 29 ccggggcggg gctgcggttg cggtgcctgc gcccgcggcg gcggaggcgc aggcggtggc 60 gagtgggtga gtgaggaggc ggcatcctgg cgggtggctg tttggggttc ggctgccggg 120 aagaggcgcg ggtagaagcg ggggctctcc tcagagctcg acgcattttt actttccctc 180 tcatttctct gaccgaagct gggtgtcggg ctttcgcctc tagcgactgg tggaattgcc 240 tgcatccggg cc 252 <210> 30 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Asuragen 2-Primer Fwd <400> 30 tgcgcctccg ccgccgcggg cgcaggcacc gcaaccgca 39 <210> 31 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Asuragen 2-Primer Rev <400> 31 cgcagcctgt agcaagctct ggaactcagg agtcg 35 <210> 32 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Asuragen 3-Primer Fwd <400> 32 atgcaggcaa ttccaccagt cgctagaggc gaaagc 36 <210> 33 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Asuragen 3-Primer Rev <400> 33 taaccagaag aaaacaagga gggaaacaac cgcagcctgt 40 <210> 34 <211> 158 <212> DNA <213> Homo sapiens <400> 34 acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60 cacgtaaaag atgacgcttg gtgtgtcagc cgtccctgct gcccggttgc ttctcttttg 120 ggggcggggt ctagcaagag caggtgtggg tttaggag 158 <210> 35 <211> 487 <212> DNA <213> Homo sapiens <400> 35 tatctccgga gcatttggat aatgtgacag ttggaatgca gtgatgtcga ctctttgccc 60 accgccatct ccagctgttg ccaagacaga gattgcttta agtggcaaat cacctttatt 120 agcagctact tttgcttact gggacaatat tcttggtcct agagtaaggc acatttgggc 180 tccaaagaca gaacaggtac ttctcagtga tggagaaata acttttcttg ccaaccacac 240 tctaaatgga gaaatccttc gaaatgcaga gagtggtgct atagatgtaa agttttttgt 300 cttgtctgaa aagggagtga ttattgtttc attaatcttt gatggaaact ggaatgggga 360 tcgcagcaca tatggactat caattatact tccacagaca gaacttagtt tctacctccc 420 acttcataga gtgtgtgttg atagattaac acatataatc cggaaaggaa gaatatggat 480 gcataag 487 <210> 36 <211> 198 <212> DNA <213> Homo sapiens <400> 36 gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60 ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120 attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180 ggagtcgcgc gctatgcg 198 <210> 37 <211> 118 <212> DNA <213> Homo sapiens <400> 37 gcgatcgcgg ggcgtggtcg gggcgggccc gggggcgggc ccggggcggg gctgcggttg 60 cggtgcctgc gcccgcggcg gcggaggcgc aggcggtggc gagtgggtga gtgaggag 118 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 agtactgtga gagcaagtag 20 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 gctctcacag tactcgctga 20 <210> 40 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 ccgcagcctg tagcaagctc 20 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 cggccgctag cgcgatcgcg 20 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 acgccccgcg atcgcgctag 20 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 tggcgagtgg gtgagtgagg 20 <210> 44 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 ggaagaggcg cgggtagaag 20 <210> 45 <211> 1302 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 gaacttacgg agtcccacga gggaaccgcg gcgcgtcaag cagagacgag ttccgcccac 60 gtgaaagatg gcgtttgtag tgacagccat cccaattgcc ctttccttct aggtggaaag 120 tggggtctag caagagcagg tgtgggttta ggaggtgtgt gtttttgttt ttcccaccct 180 ctctccccac tacttgctct cacagtactc gctgagggtg aacaagaaaa gacctgataa 240 agattaacca gaagaaaaca aggagggaaa caaccgcagc ctgtagcaag ctctggaact 300 caggagtcgc gcgctatgcg atcgccgtct cggggccggg gccggggccg gggccggggc 360 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 420 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 480 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 540 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 600 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 660 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 720 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 780 cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 840 cggggccggg gccggggccg gggccggggc cggggccggg gccgagaccc tcgagggccg 900 gccgctagcg cgatcgcggg gcgtggtcgg ggcgggcccg ggggcgggcc cggggcgggg 960 ctgcggttgc ggtgcctgcg cccgcggcgg cggaggcgca ggcggtgcga gtgggtgagt 1020 gaggaggcgg catcctggcg ggtggctgtt tggggttcgg ctgccgggaa gaggcgcggg 1080 tagaagcggg ggctctcctc agagctcgac gcatttttac tttccctctc atttctctga 1140 ccgaagctgg gtgtcgggct ttcgcctcta gcgactggtg gaattgcctg catccgggcc 1200 ccgggcttcc cggcggcggc ggcggcggcg gcggcgcagg gacaagggat ggggatctgg 1260 cctcttcctt gctttcccgc cctcagtacc cgagctgtct cc 1302 <210> 46 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 gagtactgtg agagcaagta g 21 <210> 47 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 gccgcagcct gtagcaagct c 21 <210> 48 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 gcggccgcta gcgcgatcgc g 21 <210> 49 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 gacgccccgc gatcgcgcta g 21 <210> 50 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 gtggcgagtg ggtgagtgag g 21 <210> 51 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 acaccgctct cacagtactc gctgag 26 <210> 52 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 acaccgccgc agcctgtagc aagctcg 27 <210> 53 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 acaccgagta ctgtgagagc aagtagg 27 <210> 54 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 acaccgacgc cccgcgatcg cgctagg 27 <210> 55 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 acaccgcggc cgctagcgcg atcgcgg 27 <210> 56 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 acaccgtggc gagtgggtga gtgaggg 27 <210> 57 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 acaccggaag aggcgcgggt agaagg 26 <210> 58 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 gacgcgttaa tgccaacttt 20 <210> 59 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 gagggcctat ttcccatgat 20 <210> 60 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 gacgcgttaa tgccaacttt 20 <210> 61 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 gaacttacgg agtcccacga 20 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 ggagacagct cgggtactga 20 <210> 63 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 gttggaacca ttcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga 60 aaaagtggca ccgagtcggt gc 82 <210> 64 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgc 76 <210> 65 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60 ttgaaaaagt ggcaccgagt cggtgc 86 <210> 66 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Forward Primer <400> 66 catcccaatt gccctttcc 19 <210> 67 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Reverse Primer <400> 67 cccacacctg ctcttgctag a 21 <210> 68 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Probe <400> 68 tctaggtgga aagtggg 17 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Forward Primer <400> 69 gagcaggtgt gggtttagga 20 <210> 70 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse Primer <400> 70 ccaggtctca ctgcattcca 20 <210> 71 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Probe <400> 71 attgcaagcg ttcggataat gtgaga 26 <210> 72 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Forward Primer <400> 72 gctgtcacga aggctttctt c 21 <210> 73 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse Primer <400> 73 gcactgctgc caactacaac 20 <210> 74 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Probe <400> 74 tcaatgccat cagctcacac ctgc 24 <210> 75 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Forward Primer <400> 75 aagaggcgcg ggtagaa 17 <210> 76 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Reverse Primer <400> 76 cagcttcggt cagagaaatg ag 22 <210> 77 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Probe <400> 77 ctctcctcag agctcgacgc attt 24 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Forward Primer <400> 78 ctgcacaatt tcagcccaag 20 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse Primer <400> 79 caggtcatgt cccacagaat 20 <210> 80 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Probe <400> 80 catatgaggg cagcaatgca agtc 24 <210> 81 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> LNA Probe for sense G4C2 RNA <220> <221> TYE563 <222> (1)..(1) <400> 81 ccccggcccc ggcccc 16 <210> 82 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> LNA Probe for antisense G4C2 RNA <220> <221> TYE563 <222> (1)..(1) <400> 82 ggggccgggg ccggggggcc cc 22 <210> 83 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DNA Probe for sense G4C2 RNA <220> <221> Cy3 <222> (18)..(18) <400> 83 ccccggcccc ggccccgg 18 <210> 84 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DNA Probe for antisense G4C2 RNA <220> <221> Cy3 <222> (17)..(17) <400> 84 ggggccgggg ccggggc 17

Claims

내인성 C9orf72 유전자좌에 삽입된 이종 헥사뉴클레오티드 반복 확장 서열을 그의 게놈에 포함하는 비인간 동물 또는 비인간 동물 세포로서, 상기 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 반복을 포함하는, 비인간 동물 또는 비인간 동물 세포.
제1항에 있어서, 상기 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 상기 헥사뉴클레오티드 서열의 적어도 30개의 반복을 포함하는, 비인간 동물 또는 비인간 동물 세포.
제1항 또는 제2항에 있어서, 상기 헥사뉴클레오티드 반복 확장은 서열번호 1로서 제시된 상기 헥사 뉴클레오티드 서열의 적어도 90개의 반복을 포함하는, 비인간 동물 또는 비인간 동물 세포.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 비인간 동물 또는 비인간 동물 세포는 (i) 야생형 C9orf72 유전자좌를 포함하는 대조군 동물과 비교하여 C9orf72 전사체 발현의 증가, (ii) 야생형 C9orf72 유전자좌를 포함하는 대조군 동물과 비교하여 RNA 병소 수의 증가, (iii) 야생형 C9orf72 유전자좌을 포함하는 대조군 동물과 비교하여 디펩티드 반복 단백질 수준의 증가, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 나타내는, 비인간 동물 또는 비인간 동물 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 이종 헥사뉴클레오티드 반복 확장 서열은 상기 내인성 C9orf72 유전자좌의 비암호화 내인성 엑손과 엑손 2 사이에 위치하는, 비인간 동물 또는 비인간 동물 세포.
제5항에 있어서, 상기 내인성 C9orf72 유전자좌는 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7로서 제시된 뉴클레오티드 서열 또는 그의 변이체를 포함하는, 비인간 동물 또는 비인간 동물 세포.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 비인간 동물은 설치류이거나, 상기 비인간 동물 세포는 설치류 세포인, 비인간 동물 또는 비인간 동물 세포.
제7항에 있어서, 상기 설치류는 랫트 또는 마우스이거나, 상기 비인간 동물 세포는 랫트 세포 또는 마우스 세포인, 비인간 동물 또는 비인간 동물 세포.
제8항에 있어서, 상기 비인간 동물이 마우스이거나 상기 비인간 동물 세포가 마우스 세포이고, 상기 이종 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로 제시된 상기 헥사뉴클레오티드 서열의 92회의 반복을 포함하며, 상기 마우스 또는 마우스 세포는 다음 3가지의 특징 모두를 나타내는 비인간 동물 또는 비인간 동물 세포: (i) 야생형 C9orf72 유전자위를 포함하는 대조군 동물과 비교해 C9orf72 전사체의 발현 증가, (ii) 야생형 C9orf72 유전자위를 포함하는 대조군 동물과 비교해 RNA 병소 수의 증가, 및 (iii) 야생형 C9orf72 유전자좌을 포함하는 대조군 동물과 비교해 디펩티드 반복 단백질 수준의 증가.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 비인간 동물은 상기 이종 헥사뉴클레오티드 반복 확장 서열에 대해 동형접합체인, 비인간 동물 또는 비인간 동물 세포.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 비인간 동물은 상기 이종 헥사뉴클레오티드 반복 확장 서열에 대해 이형접합체인, 비인간 동물 또는 비인간 동물 세포.
제11항에 있어서, 상기 이종 헥사뉴클레오티드 반복 확장 서열은 제1 이종 헥사뉴클레오티드 확장 서열이고, 상기 비인간 동물 또는 비인간 동물 세포도 제2 이종 헥사뉴클레오티드 반복 확장 서열에 대해 이형접합체이며, 상기 제1 확장 서열은 상기 제2 이종 헥사뉴클레오티드 반복 확장 서열과 상이한 수의 반복을 갖는, 비인간 동물 또는 비인간 동물 세포.
제12항에 있어서, 상기 제1 이종 반복 확장 서열은 서열번호 1로서 제시된 상기 헥사뉴클레오티드 서열의 하나 내지 3개의 반복을 포함하고, 상기 제2 이종 반복 확장 서열은 서열번호 14로서 제시된 상기 헥사뉴클레오티드 서열의 4 내지 100개의 반복을 포함하는, 상기 비인간 동물 또는 비인간 동물 세포.
제1항 내지 제13항 중 어느 한 항에 있어서, 상기 비인간 동물 세포는 배아 줄기 세포, 배아 줄기 세포 유래 운동 뉴런, 뇌 세포, 피질 세포, 신경 세포, 근육 세포, 심장 세포, 또는 생식 세포인 비인간 동물 또는 비인간 동물 세포.
제14항의 상기 배아 줄기 세포로부터 유래된 불멸화 세포주 또는 운동 뉴런.
내인성 C9orf72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 게놈을 갖는 비인간 동물 배아 줄기 세포로서, 상기 이종 헥사 뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 상기 헥사뉴클레오티드 서열의 적어도 하나의 반복을 포함하는, 비인간 동물 배아 줄기 세포.
제16항의 상기 배아 줄기 세포로부터 생성된 비인간 동물 배아.
헥사뉴클레오티드 서열을 포함하는 게놈을 갖는 비인간 동물을 만드는 방법으로서, 상기 방법은 상기 비인간 동물의 게놈이 내인성 C9orf72 유전자좌에서 이종 헥사뉴클레오티드 반복 확장 서열을 포함하도록 상기 게놈을 변형시키는 단계를 포함하되, 상기 내인성 헥사뉴클레오티드 반복 확장 서열은 서열번호 1로서 제시된 상기 헥사뉴클레오티드 서열의 적어도 하나의 반복을 포함하는, 방법.
제18항에 있어서, 상기 변형시키는 단계는
(a) 삽입 핵산을 포함하는 핵산 작제물을 비인간 배아 줄기 세포 내에 도입하는 단계로서, 상기 삽입 핵산은 5'에서 3'까지, (i) C9orf72 유전자좌의 5' 표적 서열에 대해 상동인 5' 상동 아암(arm), (ii) 이종 헥사뉴클레오티드 반복 확장 서열, 및 (iii) C9orf72 유전자좌의 5' 표적 서열에 대해 상동인 3' 상동 아암을 포함하는 것인, 단계;
(b) (a) 단계로부터, 유전자 조작된 설치류 배아 줄기 세포를 수득하는 단계; 및
(c) (b) 단계의 상기 유전자 조작된 설치류 배아 줄기 세포를 사용해 설치류를 생성하는 단계를 포함하는, 방법.
제19항에 있어서, 상기 삽입 핵산은 하나 이상의 선별 마커를 암호화하는 하나 이상의 유전자를 상기 5' 및 3' 상동 아암 사이에 추가로 포함하는, 방법.
제19항 또는 제20항에 있어서, 상기 삽입 핵산은 하나 이상의 부위 특이적 재조합 부위를 상기 5' 및 3' 상동 아암 사이에 추가로 포함하는, 방법.
제21항에 있어서, 상기 삽입 핵산은 재조합 효소 인식 부위가 측면에 위치한 재조합 효소 유전자 및 선별 마커 유전자를 상기 5' 및 3' 상동 아암 사이에 추가로 포함하되, 재조합 효소 인식 부위는 절제를 유도하도록 배향되는, 방법.
제19항 내지 제22항 중 어느 한 항에 있어서, 상기 5' 상동 아암은 상기 내인성 C9orf72 유전자좌의 엑손 1 또는 그의 일부분과 동일하거나 실질적으로 동일한, 방법.
제23항에 있어서, 상기 5' 상동 아암은 서열번호 20 또는 서열번호 23으로서 제시된 상기 뉴클레오티드 서열을 포함하는, 방법.
제19항 내지 제24항 중 어느 한 항에 있어서, 상기 3' 상동 아암은 상기 내인성 C9orf72 유전자좌의 인트론 1의 적어도 일부분과 동일하거나 실질적으로 동일한, 방법.
제25항에 있어서, 상기 3' 상동 아암은 서열번호 22 또는 서열번호 25로서 제시된 상기 뉴클레오티드 서열을 포함하는, 방법.
제18항 내지 제26항 중 어느 한 항에 있어서, 상기 삽입 핵산은 서열번호 2 또는 서열번호 4에 제시된 핵산 서열을 포함하는, 방법.
제18항 내지 제26항 중 어느 한 항에 있어서, 상기 삽입 핵산은 서열번호 3 또는 서열번호 6에 제시된 핵산 서열을 포함하는, 방법.
제18항 내지 제28항 중 어느 한 항에 있어서, 상기 삽입체에 대해 동형접합체인 설치류가 생성되도록, (c) 단계에서 생성된 상기 설치류를 번식시키는 단계를 더 포함하는, 방법.
제18항 내지 제29항 중 어느 한 항에 있어서, 상기 비인간 동물은 설치류인, 방법.
제30항에 있어서, 상기 설치류는 랫트 또는 마우스인, 방법.
제18항 내지 제31항 중 어느 한 항의 방법에 의해 수득될 수 있는 비인간 동물.
헥사뉴클레오티드 반복 확장 서열의 존재와 관련된 질환 또는 병태의 치료를 위한 치료 후보 물질을 식별하는 방법으로서, 상기 방법은
(a) 서열번호 1로서 제시된 헥사뉴클레오티드 서열의 적어도 하나의 반복을 포함하는 헥사뉴클레오티드 반복 확장 서열을 포함하도록 유전적으로 변형된 C9orf72 유전자좌를 포함하는 비인간 동물 또는 비인간 동물 세포에게 후보 제제를 투여하는 단계;
(b) 상기 후보 제제가 상기 질환 또는 병태와 관련된 하나 이상의 징후, 증상 및/또는 상태에 영향을 미치는지를 결정하기 위한 하나 이상의 검정을 수행하는 단계; 및
(c) 상기 질병 또는 병태와 관련된 상기 하나 이상의 징후, 증상 및/또는 상태에 영향을 미치는 상기 후보 제제를 치료 후보 물질로서 식별하는 단계를 포함하는, 방법.
제33항에 있어서, 상기 후보 제제는 비인간 동물에게 생체 내(in vivo) 투여되고, 선택적으로, 상기 후보 제제가 투여된 후 상기 비인간 동물로부터 단리된 조직에 대한 상기 검정이 시험관 내에서(in vitro) 수행되는, 방법.
제33항에 있어서, 상기 후보 제제는 비인간 동물 배아 줄기 세포 유래 운동 뉴런에 시험관 내에서 투여되는 방법.
제33항 내지 제35항 중 어느 한 항에 있어서, 상기 검정은 C9orf72 유전자 산물을 검출하기 위한 정량적 중합 효소 연쇄 반응(qPCR)인, 방법.
제36항에 있어서, qPCR은 서열번호 66, 서열번호 67, 서열번호 68, 서열번호 69, 서열번호 70, 서열번호 71, 서열번호 72, 서열번호 73, 서열번호 74, 서열번호 75, 서열번호:76, 서열번호 77, 서열번호 78, 서열번호 79, 서열번호 80, 또는 이들의 임의의 조합에 제시된 뉴클레오티드 서열을 갖는 프라이머 및/또는 프로브로 수행되는, 방법.
제33항 내지 제35항 중 어느 한 항에 있어서, 상기 검정은 C9orf72 센스 또는 안티센스 RNA 전사체를 포함하는 RNA 병소를 측정하는 것인, 방법.
제38항에 있어서, 상기 검정은 서열번호 81, 서열번호 82, 서열번호 83, 및/또는 서열번호 84 중 어느 하나에 제시된 뉴클레오티드 서열을 갖는 하나 이상의 프로브를 사용하는 형광 인시츄 혼성화(fluorescence in situ hybridization)인, 방법.
제33항 내지 제35항 중 어느 한 항에 있어서, 상기 검정은 폴리GA 디펩티드 반복 단백질을 측정하는 것인, 방법.
이종 헥사뉴클레오티드 반복 확장 서열을 포함하는 숙주 세포.
제41항에 있어서, 상기 숙주 세포는 세균 세포인, 숙주 세포.
Cas 단백질 및/또는 하나 이상의 gRNA를 포함하는 CRISPR/Cas 시스템으로서, 상기 하나 이상의 gRNA는 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45, 서열번호 46, 서열번호 47, 서열번호 48, 서열번호 49, 서열번호 50 및 이들의 조합으로 이루어진 군으로부터 선택된 서열을 포함하는 DNA에 의해 암호화되는, CRISPR/Cas 시스템.
제43항에 있어서, 상기 하나 이상의 gRNA는 제1, 제2 및 제3 gRNA를 포함하되, 상기 제1 gRNA는 서열번호 39로서 제시된 서열을 포함하는 DNA에 의해 암호화되고, 상기 제2 gRNA는 서열번호 44로서 제시된 서열을 포함하는 DNA에 의해 암호화되며, 상기 제3 gRNA는 서열번호 50으로서 제시된 서열을 포함하는 DNA에 의해 암호화되는, CRISPR/Cas 시스템.
제44항에 있어서, 서열번호 47로서 제시된 서열을 포함하는 DNA에 의해 암호화되는 제4 gRNA를 추가로 포함하는, CRISPR/Cas 시스템.
제45항에 있어서, 제5, 제6, 및 제7 gRNA를 추가로 포함하되, 상기 제5 gRNA는 서열번호 46으로서 제시된 서열을 포함하는 DNA에 의해 암호화되고, 상기 제6 gRNA는 서열번호 48로서 제시된 서열을 포함하는 DNA에 의해 암호화되며, 상기 제7 gRNA는 서열번호 49로서 제시된 서열을 포함하는 DNA에 의해 암호화되는, CRISPR/Cas 시스템.
제42항 내지 제46항 중 어느 한 항에 있어서, 상기 gRNA는 서열번호 63, 64 또는 65으로서 제시된 서열을 포함하는 DNA에 의한 tracrRNA 암호화를 포함하는, CRISPR/Cas 시스템.
제47항에 있어서, 상기 tracrRNA는 서열번호 63으로서 제시된 서열을 포함하는 DNA에 의해 암호화되는, CRISPR/Cas 시스템.
제47항에 있어서, 상기 tracrRNA는 서열번호 64로서 제시된 서열을 포함하는 DNA에 의해 암호화되는, CRISPR/Cas 시스템.
제47항에 있어서, 상기 tracrRNA는 서열번호 65로서 제시된 서열을 포함하는 DNA에 의해 암호화되는, CRISPR/Cas 시스템.
제43항 내지 제50항 중 어느 한 항에 있어서, 발현 작제물을 추가로 포함하되, 상기 발현 작제물은 상기 Cas 단백질을 암호화하는 핵산 및/또는 상기 적어도 하나의 gRNA를 암호화하는 DNA를 포함하고, 상기 발현 작제물은 선택적으로 약물 내성 유전자를 추가로 포함하는, CRISPR/Cas 시스템.