KR20220016869A - 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법 - Google Patents

베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법 Download PDF

Info

Publication number
KR20220016869A
KR20220016869A KR1020217040893A KR20217040893A KR20220016869A KR 20220016869 A KR20220016869 A KR 20220016869A KR 1020217040893 A KR1020217040893 A KR 1020217040893A KR 20217040893 A KR20217040893 A KR 20217040893A KR 20220016869 A KR20220016869 A KR 20220016869A
Authority
KR
South Korea
Prior art keywords
ttr
human
sequence
human animal
locus
Prior art date
Application number
KR1020217040893A
Other languages
English (en)
Inventor
제프리 헤인즈
키스 크로스비
사무엘슨 메간 드럼몬드
데이비드 프렌듀이
브라이언 잠브로비츠
앤드류 제이. 머피
Original Assignee
리제너론 파마슈티칼스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리제너론 파마슈티칼스 인코포레이티드 filed Critical 리제너론 파마슈티칼스 인코포레이티드
Publication of KR20220016869A publication Critical patent/KR20220016869A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Humanized animals, e.g. knockin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Abstract

베타-슬립 돌연변이(beta-slip mutation)를 포함하는 인간화(humanized) TTR 좌위(locus)를 포함하는 비-인간 동물 세포 및 비-인간 동물, 및 이러한 비-인간 동물 세포 및 비-인간 동물을 사용하는 방법이 제공된다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물 세포 또는 비-인간 동물은 인간 트랜스티레틴(transthyretin) 단백질, 또는 단편이 인간 트랜스티레틴으로부터의 것인 키메라 트랜스티레틴 단백질을 발현한다. 인간-TTR-표적화 시약, 예컨대 인간 TTR을 표적화하도록 설계된 뉴클레아제 제제의 생체내 효능을 평가하기 위해 인간화 TTR 좌위를 포함하는 이러한 비-인간 동물을 사용하는 방법이 제공된다.

Description

베타-슬립 돌연변이를 갖는 인간화 TTR 좌위를 포함하는 비-인간 동물 및 사용 방법
관련 출원의 교차 참조
본 출원은 2019년 6월 4일에 출원된 미국 출원 62/856,999호의 이익을 주장하며, 이는 그 전체가 모든 목적을 위해 본 명세서에 참조로서 포함된다.
EFS 웹을 통해 텍스트 파일로 제출된 서열 목록에 대한 참조
파일 547028SEQLIST.txt로 작성된 서열 목록은 124 킬로바이트 크기이고, 2020년 5월 25일에 생성되고, 본 명세서에 참조로서 포함된다.
트랜스티레틴(TTR: transthyretin)은 갑상선 호르몬 및 레티놀-결합 단백질을 레티놀로 운반하는, 혈청 및 뇌척수액에서 발견되는 단백질이다. 간은 TTR을 혈액 내로 분비하는 한편, 맥락총(choroid plexus)은 TTR을 뇌척수액 내로 분비한다. TTR은 또한 망막 색소 상피에서 생성되고 유리체(vitreous) 내로 분비된다. 미스폴딩된(misfolded) 그리고 응집된 TTR은 아밀로이드 질환 노인 전신성 아밀로이드증(SSA: senile systemic amyloidosis), 가족성 아밀로이드 다발신경병증(FAP: familial amyloid polyneuropathy), 및 가족성 아밀로이드 심근병증(FAC: familial amyloid cardiomyopathy)에서 다수의 조직 및 기관(organ)에 축적된다.
내인성 Ttr 좌위에서 인간-TTR-표적화 시약의 진(true) 인간 표적 또는 진 인간 표적의 밀접한 근사물(close approximation)을 제공하여, 살아 있는 동물에서 이러한 제제의 효능 및 작용 방식, 뿐만 아니라 인간화 단백질 및 인간화 유전자가 존재하는 TTR의 유일한 버전인 설정에서 약물동력학적(pharmacokinetic) 연구 및 약력학적(pharmacodynamics) 연구의 시험을 가능하게 하는 적합한 비-인간 동물에 대한 필요성이 존재한다.
베타-슬립 돌연변이(beta-slip mutation)를 포함하는 인간화(humanized) TTR 좌위(locus)를 포함하는 비-인간 동물, 뿐만 아니라 이러한 비-인간 동물을 사용하는 방법이 제공된다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈, 뿐만 아니라 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈을 사용하는 방법이 또한 제공된다. 베타-슬립 돌연변이를 포함하는 인간화 비-인간 동물 TTR 유전자, 비-인간 동물 TTR 유전자를 인간화하는 데 사용하기 위한 뉴클레아제 제제(nuclease agent) 및/또는 표적화 벡터, 및 이러한 인간화 TTR 유전자를 제조하는 방법 및 사용하는 방법이 또한 제공된다.
일 양태에서, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물이 제공된다. 또한, 베타-슬립 돌연변이를 게놈에 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈이 제공된다. 일부 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위를 포함할 수 있으며, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고, TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 이종상동성 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트(shift)를 야기하는 돌연변이를 포함한다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈은 유전적으로 변형된 내인성 Ttr 좌위를 포함할 수 있으며, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함한다. 선택적으로, 돌연변이는, 인코딩된 트랜스티레틴 단백질이 인간 트랜스티레틴 단백질과 최적으로 정렬될 때, 인간 트랜스티레틴 단백질 내 잔기 L58에 상응하는 잔기를 인간 트랜스티레틴 단백질 내 잔기 L55에 상응하는 잔기에 의해 통상적으로 점유되는 장소에 배치시키는 베타-가닥 D에서 3-잔기 시프트를 야기한다. 선택적으로, 돌연변이는, 인코딩된 트랜스티레틴 단백질이 인간 트랜스티레틴 단백질과 최적으로 정렬될 때, 인간 트랜스티레틴 단백질 내 G53S/E54D/L55S에 상응하는 삼중(triple) 돌연변이이다. 선택적으로, 삼중 돌연변이는 이종상동성(orthologous) 인간 TTR 서열에 존재한다. 선택적으로, 삼중 돌연변이는 상응하는 인간 TTR 서열에 존재한다.
일부 이러한 비-인간 동물에서, 유전적으로 변형된 내인성 Ttr 좌위는 내인성 Ttr 프로모터를 포함한다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 또는 비-인간 동물 게놈에서, 유전적으로 변형된 내인성 Ttr 좌위는 내인성 Ttr 프로모터를 포함하며, 인간 TTR 서열은 내인성 Ttr 프로모터에 작동적으로 연결된다. 선택적으로, 내인성 Ttr 좌위의 적어도 하나의 인트론 및 적어도 하나의 엑손은 결실되었고 이종상동성 인간 TTR 서열로 대체되었다. 선택적으로, 내인성 Ttr 좌위의 적어도 하나의 인트론 및 적어도 하나의 엑손은 결실되었고 상응하는 인간 TTR 서열로 대체되었다.
일부 이러한 비-인간 동물에서, 내인성 Ttr 좌위의 전체 Ttr 코딩 서열은 결실되었고 이종상동성 인간 TTR 서열로 대체되었다. 선택적으로, Ttr 개시 코돈으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 이종상동성 인간 TTR 서열로 대체되었다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 내인성 Ttr 좌위의 전체 Ttr 코딩 서열은 결실되었고 상응하는 인간 TTR 서열로 대체되었다. 선택적으로, Ttr 개시 코돈으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열로 대체되었다.
일부 이러한 비-인간 동물에서, 유전적으로 변형된 내인성 Ttr 좌위는 인간 TTR 3' 비번역 영역을 포함한다. 일부 이러한 비-인간 동물에서, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 유전적으로 변형된 내인성 Ttr 좌위는 인간 TTR 3' 비번역 영역을 포함한다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았다.
일부 이러한 비-인간 동물에서, Ttr 개시 코돈으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 이종상동성 인간 TTR 서열을 포함하는 인간 TTR 서열 및 인간 TTR 3' 비번역 영역으로 대체되었으며, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았고, 내인성 Ttr 프로모터는 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, Ttr 개시 코돈으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열을 포함하는 인간 TTR 서열 및 인간 TTR 3' 비번역 영역으로 대체되었으며, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았고, 내인성 Ttr 프로모터는 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위의 인간 TTR 서열은 SEQ ID NO: 14로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위의 인간 TTR 서열은 SEQ ID NO: 14로 표시된 서열과 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 9로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 9로 표시된 서열과 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 10으로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 코딩 서열을 포함한다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 10으로 표시된 서열과 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩 서열을 포함한다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 12 또는 13으로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 12 또는 13으로 표시된 서열과 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다.
일부 이러한 비-인간 동물에서, 유전적으로 변형된 내인성 Ttr 좌위는 신호 펩타이드를 포함하는 트랜스티레틴 전구체 단백질을 인코딩하고, 신호 펩타이드를 인코딩하는 내인성 Ttr 좌위의 영역은 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았다. 선택적으로, 내인성 Ttr 좌위의 제1 엑손은 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았다. 선택적으로, 내인성 Ttr 좌위의 제1 엑손 및 제1 인트론은 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았다. 선택적으로, 제2 Ttr 엑손의 개시로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 이종상동성 인간 TTR 서열로 대체되었다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 인간 TTR 3' 비번역 영역을 포함한다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 유전적으로 변형된 내인성 Ttr 좌위는 신호 펩타이드를 포함하는 트랜스티레틴 전구체 단백질을 인코딩하고, 신호 펩타이드를 인코딩하는 내인성 Ttr 좌위의 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았다. 선택적으로, 내인성 Ttr 좌위의 제1 엑손은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았다. 선택적으로, 내인성 Ttr 좌위의 제1 엑손 및 제1 인트론은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았다. 선택적으로, 제2 Ttr 엑손의 개시로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열로 대체되었다. 선택적으로, 유전적으로 변형된 내인성 Ttr 좌위는 인간 TTR 3' 비번역 영역을 포함한다.
일부 이러한 비-인간 동물에서, 제2 Ttr 엑손으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 이종상동성 인간 TTR 서열을 포함하는 인간 TTR 서열 및 인간 TTR 3' 비번역 영역으로 대체되었으며, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았고, 내인성 Ttr 프로모터는 결실되지 않았고 이종상동성 인간 TTR 서열로 대체되지 않았다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 제2 Ttr 엑손으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열을 포함하는 인간 TTR 서열 및 인간 TTR 3' 비번역 영역으로 대체되었으며, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았고, 내인성 Ttr 프로모터는 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았다.
일부 이러한 비-인간 동물에서, 유전적으로 변형된 내인성 Ttr 좌위는 선택 카세트 또는 리포터 유전자를 포함하지 않는다. 일부 이러한 비-인간 동물에서, 유전적으로 변형된 내인성 Ttr 좌위는 선택 카세트 또는 리포터 유전자를 포함한다. 일부 이러한 비-인간 동물에서, 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위에 대해 동형접합성(homozygous)이다. 일부 이러한 비-인간 동물에서, 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위에 대해 이형접합성(heterozygous)이다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 유전적으로 변형된 내인성 Ttr 좌위는 선택 카세트 또는 리포터 유전자를 포함하지 않는다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 유전적으로 변형된 내인성 Ttr 좌위는 선택 카세트 또는 리포터 유전자를 포함한다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위에 대해 동형접합성이다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위에 대해 이형접합성이다. 일부 이러한 비-인간 동물에서, 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위를 이의 생식세포계(germline)에 포함한다.
일부 이러한 비-인간 동물에서, 비-인간 동물은 포유류이다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 또는 비-인간 동물 게놈에서, 비-인간 동물은 포유류이다. 선택적으로, 포유류는 설치류이다. 선택적으로, 설치류는 래트 또는 마우스이다. 선택적으로, 비-인간 동물은 마우스이다.
일부 이러한 비-인간 동물에서, 비-인간 동물은 대조군 야생형 비-인간 동물 또는 돌연변이가 없는 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 비-인간 동물에 비해 과다활동적(hyperactive)이다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 및 비-인간 동물 게놈에서, 비-인간 동물은 대조군 야생형 비-인간 동물 또는 돌연변이가 없는 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 비-인간 동물에 비해 과다활동적이다. 선택적으로, 과다활동(hyperactivity)은 오픈 필드 시험(open field test)에서 총 거리, 총 활동, 또는 총 리어링(rearing) 중 하나 이상 또는 모두에 의해 측정되는 바와 같다. 일부 이러한 비-인간 동물에서, 비-인간 동물은 뒷다리 근긴장이상증(hindlimb dystonia)을 나타낸다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 또는 비-인간 동물 게놈에서, 비-인간 동물은 뒷다리 근긴장이상증을 나타낸다. 일부 이러한 비-인간 동물에서, 비-인간 동물은 아밀로이드 침착물(amyloid deposit)을 포함한다. 일부 이러한 비-인간 동물, 비-인간 동물 세포, 또는 비-인간 동물 게놈에서, 비-인간 동물은 아밀로이드 침착물을 포함한다. 선택적으로, 비-인간 동물은 좌골 신경(sciatic nerve)에 아밀로이드 침착물을 포함한다. 선택적으로, 비-인간 동물은 약 2개월령까지 아밀로이드증을 발증시킨다.
또 다른 양태에서, 유전적으로 변형된 내인성 Ttr 좌위를 생산하기 위한 표적화 벡터가 제공되며, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었으며, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함하고, 상기 표적화 벡터는 내인성 Ttr 좌위에서 5' 표적 서열을 표적화하는 5' 상동성 아암(homology arm) 및 내인성 Ttr 좌위에서 3' 표적 서열을 표적화하는 3' 상동성 아암에 의해 플랭킹된 상응하는 인간 TTR 서열을 포함하는 삽입물 핵산을 포함한다.
또 다른 양태에서, 유전적으로 변형된 비-인간 동물 Ttr 유전자가 제공되며, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 유전자의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 비-인간 동물 Ttr 유전자는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함한다.
또 다른 양태에서, 인간화 TTR 좌위를 포함하는 비-인간 동물을 사용하여 생체내에서 인간-TTR-표적화 시약의 활성을 평가하는 방법이 제공된다. 이러한 방법은 (a) 인간-TTR-표적화 시약을 상기 기재된 임의의 비-인간 동물에게 투여하는 단계; (b) 인간-TTR-표적화 시약의 활성을 상기 비-인간 동물에서 평가하는 단계를 포함할 수 있다.
일부 이러한 방법에서, 도입은 아데노-관련 바이러스(AAV)-매개 전달, 지질 나노입자(LNP)-매개 전달, 또는 유체역학적 전달(HDD: hydrodynamic delivery)을 포함한다. 선택적으로, 도입은 LNP-매개 전달을 포함한다. 선택적으로, 도입은 AAV8-매개 전달을 포함한다.
일부 이러한 방법에서, 단계 (b)는 비-인간 동물로부터 간을 단리하는 단계 및 상기 간에서 인간-TTR-표적화 시약의 활성을 평가하는 단계를 포함한다. 선택적으로, 단계 (b)는 간 이외의 기관 또는 조직에서 인간-TTR-표적화 시약의 활성을 평가하는 단계를 추가로 포함한다.
일부 이러한 방법에서, 상기 평가는 유전적으로 변형된 Ttr 좌위의 변형을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 상기 평가는 유전적으로 변형된 Ttr 좌위에 의해 인코딩되는 Ttr 메신저 RNA의 발현을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 상기 평가는 유전적으로 변형된 Ttr 좌위에 의해 인코딩되는 TTR 단백질의 발현을 평가하는 단계를 포함한다. 선택적으로, TTR 단백질의 발현을 평가하는 단계는 비-인간 동물에서 TTR 단백질의 혈청 수준을 측정하는 단계를 포함한다. 선택적으로, 활성은 비-인간 동물의 간에서 평가된다.
일부 이러한 방법에서, 상기 평가는 과다활동을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 상기 평가는 뒷다리 근긴장이상증을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 상기 평가는 아밀로이드 침착을 평가하는 단계를 포함한다. 선택적으로, 상기 평가는 좌골 신경에서 아밀로이드 침착을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 평가는 비치료된 대조군 비-인간 동물과의 비교에 있다.
일부 이러한 방법에서, 인간-TTR-표적화 시약은 인간 TTR 유전자의 영역을 표적화하도록 설계된 뉴클레아제 제제를 포함한다. 선택적으로, 뉴클레아제 제제는 Cas 단백질, 및 인간 TTR 유전자 내의 가이드 RNA 표적 서열을 표적화하도록 설계된 가이드 RNA를 포함한다. 선택적으로, Cas 단백질은 Cas9 단백질이다. 일부 이러한 방법에서, 인간-TTR-표적화 시약은 외인성 공여자 핵산을 포함하며, 상기 외인성 공여자 핵산은 인간 TTR 유전자와 재조합되도록 설계된다. 선택적으로, 외인성 공여자 핵산은 단일-가닥 올리고데옥시뉴클레오타이드(ssODN)이다. 일부 이러한 방법에서, 인간-TTR-표적화 시약 은 항원-결합 단백질을 포함한다. 일부 이러한 방법에서, 인간-TTR-표적화 시약은 RNAi 제제 또는 안티센스 올리고뉴클레오타이드를 포함한다.
일부 이러한 방법에서, 인간-TTR-표적화 시약의 활성을 비-인간 동물에서 평가하는 단계는 트랜스티레틴 활성을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 평가는 비치료된 대조군 비-인간 동물과의 비교에 있다.
또 다른 양태에서, 생체내에서 인간-TTR-표적화 시약의 활성을 최적화하는 방법이 제공된다. 이러한 방법은 (I) 첫 번째로 제1 비-인간 동물에서 생체내에서 인간-TTR-표적화 시약의 활성을 평가하는 임의의 상기 방법을 수행하는 단계; (II) 변수를 변화시키고, 두 번째로 제2 비-인간 동물에서 변화된 변수로 상기 단계 (I)의 방법을 수행하는 단계; 및 (III) 상기 단계 (I)에서의 인간-TTR-표적화 시약의 활성을 상기 단계 (II)에서의 인간-TTR-표적화 시약의 활성과 비교하고, 더 높은 효능, 더 높은 정밀도, 더 높은 일관성, 또는 더 높은 특이성을 초래하는 방법을 선택하는 단계를 포함할 수 있다. 이러한 방법은 (I) 첫 번째로 유전적으로 변형된 내인성 Ttr 좌위를 제1 비-인간 동물의 게놈에 포함하는 제1 비-인간 동물에서 생체내에서 인간-TTR-표적화 시약의 활성을 평가하는 임의의 상기 방법을 수행하는 단계; (II) 변수를 변화시키고, 두 번째로 유전적으로 변형된 내인성 Ttr 좌위를 제2 비-인간 동물의 게놈에 포함하는 제2 비-인간 동물에서 변화된 변수로 상기 단계 (I)의 방법을 수행하는 단계; 및 (III) 상기 단계 (I)에서의 인간-TTR-표적화 시약의 활성을 상기 단계 (II)에서의 인간-TTR-표적화 시약의 활성과 비교하고, 더 높은 효능, 더 높은 정밀도, 더 높은 일관성, 또는 더 높은 특이성을 초래하는 방법을 선택하는 단계를 포함할 수 있다.
선택적으로, 단계 (II)에서의 변화된 변수는 인간-TTR-표적화 시약을 비-인간 동물 내로 도입하는 전달 방법이다. 선택적으로, 단계 (II)에서의 변화된 변수는 인간-TTR-표적화 시약을 비-인간 동물 내로 도입하는 투여 경로이다. 선택적으로, 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-TTR-표적화 시약의 농도 또는 양이다. 선택적으로, 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-TTR-표적화 시약의 형태이다. 선택적으로, 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-TTR-표적화 시약이다.
또 다른 양태에서, 인간화 TTR 좌위를 포함하는 비-인간 동물을 제조하는 방법이 제공된다. 이러한 방법은 (a) 유전적으로 변형된 내인성 Ttr 좌위를 포함하도록 만능성(pluripotent) 비-인간 동물 세포의 게놈을 변형시키는 단계; (b) 상기 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 유전적으로 변형된 만능성 비-인간 동물 세포를 식별하거나 선택하는 단계; (c) 상기 유전적으로 변형된 만능성 비-인간 동물 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (d) 상기 비-인간 동물 숙주 배아를 대리모에 임신시키는 단계를 포함할 수 있다. 이러한 방법은 대안적으로 (a) 유전적으로 변형된 내인성 Ttr 좌위를 포함하도록 비-인간 동물 1-세포 단계(one-cell stage) 배아의 게놈을 변형시키는 단계; (b) 상기 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 유전적으로 변형된 비-인간 동물 1-세포 단계 배아를 선택하는 단계; 및 (c) 상기 유전적으로 변형된 비-인간 동물 1-세포 단계 배아 세포를 대리모에 임신시키는 단계를 포함할 수 있다.
도 1a는 마우스, 인간 야생형, 및 인간 베타-슬립 트랜스티레틴(TTR) 전구체 단백질(각각 SEQ ID NO: 5, 1, 및 9)의 정렬을 도시한다. 신호 펩타이드, T4 결합 도메인, 0상(phase 0) 엑손/인트론 경계, 및 1/2상(phase 1/2) 엑손/인트론 경계는 베타-슬립 돌연변이를 따라 표시되어 있다.
도 1b는 마우스, 인간 야생형, 및 인간 베타-슬립 트랜스티레틴(TTR) 코딩 서열(각각 SEQ ID NO: 8, 4, 및 10)의 정렬을 도시한다. 신호 펩타이드, T4 결합 도메인, 0상 엑손/인트론 경계, 및 1/2상 엑손/인트론 경계는 베타-슬립 돌연변이를 따라 표시되어 있다.
도 2는 야생형 뮤린(murine) Ttr 좌위, 야생형 인간화 마우스 Ttr 좌위(야생형 인간 TTR), 및 돌연변이체 인간화 마우스 Ttr 좌위(베타-슬립 인간 TTR)의 개략도(척도대로 도시되지 않음)를 도시한다. 엑손, 인트론, 5' 비번역 영역(UTR), 3' UTR, 개시 코돈(ATG), 정지 코돈(TGA), 및 선택 카세트로부터의 loxP 스카(scar)가 표시되어 있다. 백색 상자는 뮤린 서열을 나타내고, 검정색 상자는 인간 서열을 나타낸다.
도 3은 돌연변이체(베타-슬립) 인간화 마우스 Ttr 좌위를 생성하기 위한 표적화의 개략도(척도대로 도시되지 않음)를 도시한다. 야생형 마우스 Ttr 좌위, 자가-결실 네오마이신(SDC-퓨로) 선택 카세트(MAID 8530)를 갖는 돌연변이체 인간화 마우스 Ttr 좌위의 F0 대립유전자, 및 SDC-퓨로 선택 카세트(MAID 8531)의 제거로부터 loxP 스카를 갖는 돌연변이체 인간화 마우스 Ttr 좌위의 F1 대립유전자가 나타나 있다. 백색 상자는 뮤린 서열을 나타내고, 검정색 상자는 인간 서열을 나타낸다.
도 4는 대립유전자-소실(loss-of-allele) 검정(7576mTU, 4552mTU, 9212mTU, 7655mTU, 9090mTM, 7576mTD, 9212mTD, 및 7655mTD), 대립유전자 획득(gain of allele) 검정(7576hTU, 7655hTU, 7576hTD, 퓨로), 체류(retention) 검정(9204mretU, 9090retU, 9090retU2, 9090retU3, 9090retD, 9090retD2, 9090retD3, 9204mretD), 및 CRISPR 가이드에 의해 분열되는 영역을 망라하도록 설계된 CRISPR 검정(9090mTGU, mGU, 9090mTGD, 및 mGD)을 포함하여, 표적화된 마우스 Ttr 좌위의 스크리닝의 전략의 개략도(척도대로 도시되지 않음)를 도시한다. 백색 상자는 뮤린 서열을 나타내고, 검정색 상자는 인간 서열을 나타낸다.
도 5a 내지 도 5d는 2개월령의 인간화 TTR 야생형 마우스, 인간화 TTR 베타-슬립 마우스, 및 F1H4 대조군 마우스에서 혈장 hTTR 수준(도 5a), 혈청 총 T4 수준(도 5b), 무혈청(serum free) T4 수준(도 5c), 및 체온(도 5d)을 도시한다. 근긴장이상(dystonic) 마우스는 원으로 둘러싸인(encircled) 적색 삼각형에 의해 표시되어 있다. TTR 및 T4 수준은 ELISA에 의해 측정되었다.
도 6a는 2개월령의 인간화 TTR 베타-슬립 마우스로부터의 혈장 시료의 변성 PAGE 후의 웨스턴 블롯을 도시한다. F1H4 시료는 음성 대조군으로서 사용되었고, 재조합 WT 인간 TTR은 양성 대조군으로서 사용되었다. 트랜스페린은 로딩 대조군으로서 사용되었다.
도 6b는 2개월령의 인간화 TTR 베타-슬립 마우스로부터의 혈장 시료 및 2개월령의 인간화 TTR 야생형 마우스로부터의 시료의 네이티브(native) PAGE 후의 웨스턴 블롯을 도시한다. F1H4 시료는 음성 대조군으로서 사용되었고, 재조합 WT 인간 TTR은 양성 대조군으로서 사용되었다.
도 7a 내지 도 7b는 인간화 TTR 베타-슬립 마우스에서 근긴장이상 표현형을 도시한다. 도 7a는 스크러핑(scruffing) 후 2개월령의 인간화 TTR 베타-슬립 마우스, 인간화 TTR 야생형 마우스, 및 대조군 F1H4 마우스의 신체의 축(axis)에 비해 이의 뒷다리의 각도를 평가하기 위한 이들 마우스의 사진을 도시한다. 도 7b는 정상적인 마우스의 수 및 근긴장이상 표현형을 갖는 마우스의 수의 정량화를 도시한다. 근긴장이상 마우스는 원으로 둘러싸인 적색 점(dot)에 의해 표시되어 있다.
도 8a 내지 도 8c는 총 거리(도 8a), 총 활동(도 8b), 및 리어링(도 8c)을 포함하여 오픈 필드 행동 시험에서 2개월령의 인간화 TTR 베타-슬립 마우스, 인간화 TTR 야생형 마우스, 및 대조군 F1H4 마우스로부터의 다양한 판독물(readout)을 도시한다.
도 9a 내지 도 9b는 2개월령의 인간화 TTR 베타-슬립 마우스, 인간화 TTR 야생형 마우스, 및 대조군 F1H4 마우스에서 체중(도 9a) 및 악력(grip strength)(도 9b)을 도시한다. 근긴장이상 마우스는 원으로 둘러싸인 적색 삼각형 및 점에 의해 표시되어 있다.
도 10a 내지 도 10b는 2개월령의 인간화 TTR 베타-슬립 마우스, 인간화 TTR 야생형 마우스, 및 대조군 F1H4 마우스로부터 단리된 좌골 신경 시료(도 10a) 및 간 시료(도 10b)에서 콩고 레드 염색(Congo Red staining)을 도시한다. 각각의 상단은 백색광 하에서 이미지화된 염색된 조직을 나타낸다. 각각의 하단은 선형 편광(linear polarized light)을 사용하여 비춰진 염색된 조직을 나타낸다.
정의
본원에서 상호 교환적으로 사용되는 용어인 "단백질", "폴리펩타이드" 및 "펩타이드"는 암호화된 및 비-암호화된 아미노산 및 화학적으로 또는 생화학적으로 변형되거나 유도체화된 아미노산을 비롯한 임의의 길이의 아미노산의 중합체 형태를 포함한다. 상기 용어들은 또한 변형된 펩타이드 백본을 갖는 폴리펩타이드와 같은 변형된 중합체를 포함한다. 용어 "도메인"은 특정 기능 또는 구조를 갖는 단백질 또는 폴리펩타이드의 임의의 파트를 지칭한다.
단백질은 "N-말단"과 "C-말단"을 갖는 것으로 언급된다. 용어 "N-말단" 은 유리 아민기(-NH2)를 갖는 아미노산에 의해 종결된 단백질 또는 폴리펩타이드의 시작부에 관한 것이다. 용어 "C-말단"은, 유리 카르복실기(-COOH)에 의해 종결된 아미노산 사슬(단백질 또는 폴리펩타이드)의 말단에 관한 것이다.
본원에서 상호 교환적으로 사용되는 용어인 "핵산", 및 "폴리뉴클레오타이드"는, 리보뉴클레오타이드, 데옥시리보뉴클레오타이드, 또는 이의 유사체 또는 변형된 버전을 비롯한 임의의 길이의 뉴클레오타이드의 중합체 형태를 포함한다. 이들은, 단일 가닥, 이중 가닥 및 다중 가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 및 퓨린 염기, 피리미딘 염기 또는 기타 천연, 화학적으로 변형된, 생화학적으로 변형된, 비천연, 또는 유도체화된 뉴클레오타이드 염기를 포함하는 중합체를 포함한다.
핵산은 "5' 단부" 및 "3' 단부"를 갖는 것으로 언급되는데, 이는, 하나의 모노뉴클레오타이드 펜토스 고리의 5' 포스페이트가 포스포디에스테르 결합을 통해 일 방향으로 이의 이웃 3' 산소에 부착되는 방식으로 올리고뉴클레오타이드를 생성하도록 모노뉴클레오타이드가 반응되기 때문이다. 올리고뉴클레오타이드의 단부는, 이의 5' 포스페이트가 모노뉴클레오타이드 펜토스 고리의 3' 산소에 연결되지 않은 경우 "5' 단부"로 지칭된다. 올리고뉴클레오타이드의 단부는, 이의 3' 산소가 다른 모노뉴클레오타이드 펜토스 고리의 5' 포스페이트에 연결되지 않은 경우 "3' 단부"로 지칭된다. 핵산 서열은, 더 큰 올리고뉴클레오타이드에 내재하더라도, 또한 5' 및 3' 단부를 갖는 것으로 언급될 수 있다. 선형 또는 원형 DNA 분자에서, 불연속 요소는 "업스트림" 또는 "다운스트림"의 5' 또는 3' 요소로 지칭된다.
용어 "게놈적으로 통합된"은, 뉴클레오타이드 서열이 세포의 게놈 내로 통합되도록 세포 내로 도입된 핵산을 지칭한다. 임의의 프로토콜은 핵산을 세포의 게놈 내로 안정하게 혼입하는 데 사용될 수 있다.
용어 "발현 벡터" 또는 "발현 작제물" 또는 "발현 카세트"는 특정 숙주 세포 또는 유기체에서 작동적으로 연결된 코딩 서열의 발현에 필요한 적절한 핵산 서열에 작동적으로 연결된 요망되는 코딩 서열을 함유하는 재조합 핵산을 지칭한다. 원핵생물에서의 발현에 필요한 핵산 서열은 통상, 프로모터, 오퍼레이터(선택적임), 및 리보솜 결합 부위, 뿐만 아니라 다른 서열을 포함한다. 진핵생물 세포는 일반적으로, 프로모터, 인핸서, 종결 신호 및 폴리아데닐화 신호를 이용하는 것으로 알려져 있지만, 필요한 발현을 희생시키지 않으면서 일부 요소는 결실되고 다른 요소는 첨가될 수 있다.
용어 "표적화 벡터"는 세포의 게놈 내 표적 위치에 상동성 재조합(homologous recombination), 비-상동성-말단-접합-매개 리게이션(non-homologous-end-joining-mediated ligation), 또는 임의의 다른 재조합 수단에 의해 도입될 수 있는 재조합 핵산을 지칭한다.
용어 "바이러스 벡터"는, 바이러스 기원의 적어도 하나의 요소를 포함하고 바이러스 벡터 입자 내로의 포장(packaging)에 충분하거나 이를 허용하는 요소를 포함하는 재조합 핵산을 지칭한다. 벡터 및/또는 입자는 DNA, RNA, 또는 다른 핵산을 시험관내에서, 생체외에서, 또는 생체내에서 세포 내로 이전시키는 목적에 이용될 수 있다. 수많은 형태의 바이러스 벡터가 알려져 있다.
단백질, 핵산, 및 세포에 관하여 용어 "단리된"은, 상기 단백질, 핵산, 또는 세포의 실질적으로 순수한 조제물까지 그리고 이를 포함하여, 인 시추에서(in situ) 통상 존재할 수 있는 다른 세포 또는 유기체 성분에 관하여 상대적으로 정제된 단백질, 핵산, 및 세포를 포함한다. 용어 "단리된"은 또한, 어떠한 천연 발생 대응물(counterpart)이 없는 세포, 단백질, 및 핵산, 또는 화학적으로 합성되었고 따라서 다른 단백질 또는 핵산에 의해 실질적으로 오염되지 않는 단백질 또는 핵산을 포함한다. 용어 "단리된"은 또한, 이들이 천연적으로 수반하는 대부분의 다른 세포성 성분 또는 유기체 성분으로부터 분리 또는 정제되었던 단백질, 핵산, 또는 세포를 포함한다.
용어 "야생형"은 정상(돌연변이체, 질환에 걸린(diseased), 변경된 등과 대조적임) 상태 또는 맥락에서 확인된 바와 같은 구조 및/또는 활성을 갖는 실체(entity)를 포함한다. 야생형 유전자 및 폴리펩타이드는 종종 다수의 상이한 형태(예를 들어, 대립유전자)로 존재한다.
용어 "내인성 서열"은 세포 또는 비-인간 동물 내에서 천연적으로 발생하는 핵산 서열을 지칭한다. 예를 들어, 비-인간 동물의 내인성 Ttr 서열은 비-인간 동물 내 Ttr 좌위에서 천연적으로 발생하는 네이티브 Ttr 서열을 지칭한다.
"외인성" 분자 또는 서열은 통상 해당 형태로는 세포에 존재하지 않는 분자 또는 서열을 포함한다. 정상적인 존재는, 세포의 특정 발달 단계 및 환경 조건과 관련된 존재를 포함한다. 외인성 분자 또는 서열은 예를 들어, 세포 내의 상응하는 내인성 서열의 돌연변이화된 버전, 예컨대 내인성 서열의 인간화 버전을 포함할 수 있거나, 세포 내의 내인성 서열에 상응하지만 상이한 형태로(즉, 염색체 내에 있지 않음) 존재하는 서열을 포함할 수 있다. 대조적으로, 내인성 분자 또는 서열은, 특정 환경 조건 하에 특정 발단 단계에서 특정 세포에서 해당 형태로 통상 존재하는 분자 또는 서열을 포함한다.
용어 "이종성"은 핵산 또는 단백질의 맥락에서 사용될 때, 핵산 또는 단백질이 동일한 분자에서 함께 천연적으로 발생하지 않는 적어도 2개의 분절을 포함함을 나타낸다. 예를 들어, 용어 "이종성"은 핵산의 분절 또는 단백질의 분절과 관련하여 사용될 때, 핵산 또는 단백질이 자연상에서 서로(예를 들어, 함께 접합된) 동일한 관계에서 발견되지 않는 2개 이상의 하위-서열을 포함함을 나타낸다. 일례로, 핵산 벡터의 "이종성" 영역은, 자연상에서 다른 분자와 회합되어 발견되지 않는 또 다른 핵산 분자 내에 있거나 이에 부착된 핵산의 분절이다. 예를 들어, 핵산 벡터의 이종성 영역은, 자연상에서 코딩 서열과 회합되어 발견되지 않는 서열의 측면에 있는 코딩 서열을 포함할 수 있을 것이다. 마찬가지로, 단백질의 "이종성" 영역은, 자연상에서 다른 펩타이드 분자(예를 들어, 융합 단백질, 또는 태그를 가진 단백질)와 회합되어 발견되지 않는 또 다른 펩타이드 분자 내에 있거나 이에 부착된 아미노산의 분절이다. 유사하게는, 핵산 또는 단백질은 이종성 표지 또는 이종성 분비 또는 국재화 서열을 포함할 수 있다.
"코돈 최적화"는, 아미노산을 명시하는 3-염기쌍 코돈 조합의 다중도(multiplicity)에 의해 나타난 바와 같이 코돈의 축퇴성(degeneracy)을 이용하고, 일반적으로 네이티브 아미노산 서열을 유지하는 한편 네이티브 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에서 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써, 특정 숙주 세포에서 증강된 발현을 위해 핵산 서열을 변형시키는 과정을 포함한다. 예를 들어, Cas9 단백질을 인코딩하는 핵산은 천연 발생 핵산 서열과 비교하여, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 또는 임의의 다른 숙주 세포를 포함하여 주어진 원핵 또는 진핵 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. 코돈 사용빈도(codon usage) 표는 일반적으로 예를 들어, "코돈 사용빈도 데이터베이스"에서 입수 가능하다. 이들 표는 많은 방식으로 적응될 수 있다. 예를 들어, 문헌[Nakamura (2000) Nucleic Acids Research 28:292]를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 특정 숙주에서의 발현을 위한 특정 서열의 코돈 최적화에 대한 컴퓨터 알고리즘이 또한 입수 가능하다(예를 들어, Gene Forge 참조).
용어 "좌위"는 유기체의 게놈의 염색체 상의 유전자(또는 유의한 서열), DNA 서열, 폴리펩타이드-인코딩 서열, 또는 장소의 특정 위치를 지칭한다. 예를 들어, "Ttr 좌위"는, 이러한 서열이 체류하는 곳으로서 식별되었던 유기체의 게놈의 염색체 상의 Ttr 유전자, Ttr DNA 서열, 트랜스티레틴-인코딩 서열, 또는 Ttr 장소의 특정 위치를 지칭할 수 있다. "Ttr 좌위"는 예를 들어, 인핸서, 프로모터, 5' 및/또는 3' 비번역 영역(UTR), 또는 이들의 조합을 포함하여 Ttr 유전자의 조절 요소를 포함할 수 있다.
용어 "유전자"는 생성물(예를 들어, RNA 생성물 및/또는 폴리펩타이드 생성물)을 코딩하는 염색체 내의 DNA 서열을 지칭하며, 유전자가 전장 mRNA(5' 및 3' 비번역 서열을 포함함)에 상응하도록 5' 단부와 3' 단부 둘 다 상의 코딩 영역에 인접하게 위치한 비-코딩 인트론 및 서열이 개재되어 있는(interrupted) 코딩 영역을 포함한다. 용어 "유전자"는 또한, 조절 서열(예를 들어, 프로모터, 인핸서, 및 전사 인자 결합 부위), 폴리아데닐화 신호, 내부 리보솜 진입 부위(internal ribosome entry site), 사일런서(silencer), 인설레이션 서열(insulating sequence)을 포함한 다른 비-코딩 서열을 포함하고, 기질 부착 영역(matrix attachment region)은 유전자에 존재할 수 있다. 이들 서열은 유전자의 코딩 영역에 근접해(예를 들어, 10 kb 내에) 있거나 원거리 부위에 있을 수 있고, 이들은 유전자의 전사 및 번역의 수준 또는 속도에 영향을 미친다.
용어 "대립유전자"는 유전자의 변이체 형태를 지칭한다. 일부 유전자는 여러 가지 상이한 형태를 갖고, 이는 염색체 상의 동일한 위치 또는 유전자 좌위에 위치한다. 이배체(diploid) 유기체는 각각의 유전자 좌위에 2개의 대립유전자를 갖는다. 대립유전자의 각각의 쌍은 특정 유전자 좌위의 유전자형을 나타낸다. 유전자형은, 특정 좌위에 2개의 동일한 대립유전자가 존재한다면 동형접합성으로서 기재되고, 2개의 대립유전자가 상이하다면 이형접합성으로서 기재된다.
유전자의 "코딩 영역" 또는 "코딩 서열"은 단백질을 코딩하는 엑손으로 이루어진 유전자의 DNA 또는 RNA의 일부로 구성된다. 상기 영역은 5' 단부(end) 상의 개시 코돈에서 시작하고, 3' 단부 상의 정지 코돈에서 종료된다.
"프로모터"는 특정 폴리뉴클레오타이드 서열에 대해 적절한 전사 개시 부위에서 RNA 합성을 개시하도록 RNA 폴리머라제 II를 지시할 수 있는 TATA 박스를 통상적으로 포함하는 DNA의 조절 영역이다. 프로모터는, 전사 개시 속도에 영향을 미치는 다른 영역을 추가로 포함할 수 있다. 본원에 개시된 프로모터 서열은 작동적으로 연결된 폴리뉴클레오타이드의 전사를 조절한다. 프로모터는 본원에 개시된 하나 이상의 세포 유형(예를 들어, 진핵 세포, 비-인간 포유류 세포, 인간 세포, 설치류 세포, 만능성 세포, 1-세포 단계 배아, 분화된 세포, 또는 이들의 조합)에서 활성적일 수 있다. 프로모터는 예를 들어, 구성적 활성(constitutively active) 프로모터, 조건적 프로모터, 유도적 프로모터, 시간적 제약(temporally restricted) 프로모터(예를 들어, 발달적 조절(developmentally regulated) 프로모터), 또는 공간적 제약(spatially restricted 프로모터)(예를 들어, 세포-특이적 또는 조직-특이적 프로모터)일 수 있다. 프로모터의 예는 예를 들어, 국제공개 WO 2013/176772호에서 확인할 수 있으며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
"작동 가능한 연결" 또는 "작동 가능하게 연결된"은 성분 둘 다 정상적으로 작용하고 상기 성분 중 적어도 하나가 다른 성분 중 적어도 하나에 발휘되는 기능을 매개할 수 있는 가능성을 가능하게 하는 2개 이상의 성분(예를 들어, 프로모터 및 또 다른 서열 요소)의 병치를 포함한다. 예를 들어, 프로모터가 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 제어한다면, 상기 프로모터는 코딩 서열에 작동 가능하게 연결될 수 있다. 작동 가능한 연결부는 서로 인접하거나 트랜스로 작용하는 이러한 서열을 포함할 수 있다(예를 들어, 조절 서열은 코딩 서열의 전사를 제어하기 위해 거리를 두고 작용할 수 있음).
핵산의 "상보성"은, 핵산의 하나의 가닥의 뉴클레오타이드 서열이 이의 핵염기(nucleobase) 그룹의 배향으로 인해, 반대 핵산 가닥 상의 또 다른 서열과 수소 결합을 형성함을 의미한다. DNA 내 상보적 염기는 전형적으로 A와 T 그리고 C와 G이다. RNA에서, 이들은 전형적으로 C와 G 그리고 U와 A이다. 상보성은 완벽하거나 실질적/충분할 수 있다. 2개 핵산 사이의 완벽한 상보성은, 2개 핵산이 듀플렉스를 형성할 수 있고 상기 듀플렉스 내 모든 염기가 왓슨-크릭 쌍형성(pairing)에 의해 상보적 염기에 결합됨을 의미한다. "실질적인" 또는 "충분한" 상보성은, 하나의 가닥의 서열이 반대 가닥의 서열에 완전히 및/또는 완벽히 상보적이지 않지만, 2개 가닥 상의 염기 사이에서 충분한 결합이 발생하여 혼성화 조건의 세트(예를 들어, 염 농도 및 온도)에서 안정한 하이브리드 복합체를 형성함을 의미한다. 이러한 조건은, 혼성화된 가닥의 Tm(용융 온도)을 예측하기 위해 서열 및 표준 수학적 계산을 사용함으로써, 또는 일상적인 방법을 사용함으로써 Tm의 경험적 결정에 의해 예측될 수 있다. Tm은, 2개의 핵산 가닥 사이에서 형성된 혼성화 복합체의 집단이 50% 변성되는 온도를 포함한다(즉, 이중-가닥 핵산 분자의 집단은 절반이 단일 가닥으로 해리됨). Tm 미만의 온도에서, 혼성화 복합체의 형성이 선호되는 반면, Tm 초과의 온도에서, 혼성화 복합체의 가닥의 용융 또는 분리가 선호된다. Tm은 수성 1 M NaCl 용액에서 기지의 G+C 함량을 갖는 핵산에 대해 예를 들어, Tm=81.5+0.41(% G+C)을 사용함으로써 추정될 수 있지만, 다른 기지의 Tm 컴퓨터화(computation)는 핵산 구조적 특징을 고려한다.
"혼성화 조건"은, 하나의 핵산 가닥이 상보적 가닥 상호작용 및 수소 결합에 의해 제2 핵산 가닥에 결합하여 혼성화 복합체를 생성하는 누적(cumulative) 환경을 포함한다. 이러한 조건은 핵산을 함유하는 수성 또는 유기 용액의 화학적 성분 및 이의 농도(예를 들어, 염, 킬레이트제, 포름아미드), 및 혼합물의 온도를 포함한다. 다른 인자, 예컨대 인큐베이션 시간의 길이 또는 반응 챔버 치수는 환경에 기여할 수 있다. 예를 들어, 문헌[Sambrook 등, Molecular Cloning, A Laboratory Manual, 2.sup.nd ed., pp. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989)]를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
혼성화는 2개의 핵산이 상보적 서열을 함유하는 것으로 필요로 하지만, 염기 사이의 미스매치는 가능하다. 2개의 핵산 사이의 혼성화에 적절한 조건은 핵산의 길이 및 상보적 정도에 의존하고, 이에 대한 변수는 잘 알려져 있다. 2개의 뉴클레오타이드 서열 사이의 상보적 정도가 클수록, 이들 서열을 갖는 핵산의 하이브리드에 대한 용융 온도(Tm)의 값이 커진다. 상보성의 짧은 스트레치(stretch)(예를 들어, 35개 이하, 30개 이하, 25개 이하, 22개 이하, 20개 이하, 또는 18개 이하의 뉴클레오타이드에 걸친 상보성)를 갖는 핵산 사이의 혼성화에 대해, 미스매치의 장소가 중요해진다(상기 문헌[Sambrook , 11.7-11.8] 참조). 전형적으로, 혼성화 가능한 핵산에 대한 길이는 적어도 약 10개 뉴클레오타이드이다. 혼성화 가능한 핵산에 예시적인 최소 길이는 적어도 약 15개 뉴클레오타이드, 적어도 약 20개 뉴클레오타이드, 적어도 약 22개 뉴클레오타이드, 적어도 약 25개 뉴클레오타이드, 및 적어도 약 30개 뉴클레오타이드를 포함한다. 더욱이, 온도 및 세척액 염 농도는 상보성 영역 및 상보성 정도(degree)와 같은 인자에 따라 필요한 대로 조정될 수 있다.
폴리뉴클레오타이드의 서열은 특이적으로 혼성화 가능한 이의 표적 핵산과 100% 상보적일 필요는 없다. 더욱이, 폴리뉴클레오타이드는, 개입 또는 인접 분절이 혼성화 사건(예를 들어, 루프 구조 또는 헤어핀 구조)에 관여하지 않도록 하나 이상의 분절에 걸쳐 혼성화할 수 있다. 폴리뉴클레오타이드(예를 들어, gRNA)는, 이것이 표적화되는 표적 핵산 서열 내 표적 영역에 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100%의 서열 상보성을 포함할 수 있다. 예를 들어, 20개 뉴클레오타이드 중 18개가 표적 영역에 상보적이고 따라서 특이적으로 혼성화할 gRNA는 90% 상보성을 나타낼 것이다. 이 예에서, 잔여 비상보적 뉴클레오타이드는 상보적 뉴클레오타이드와 군집화되거나(clustered) 개재될(interspersed) 수 있으며, 서로에 또는 상보적 뉴클레오타이드에 인접할 필요는 없을 수 있다.
핵산 내의 핵산 서열의 특정 스트레치 사이의 상보성 백분율은, 그 전체가 모든 목적을 위해 본원에 참조로서 포함된 문헌[Smith 및 Waterman (1981) Adv. Appl. Math. 2:482-489]의 알고리즘을 사용하는 디폴트 설정(default setting)을 사용하는 BLAST 프로그램(베이직 로컬 정렬 검색 툴(basic local alignment search tools)) 및 PowerBLAST 프로그램(문헌[Altschul (1990) J. Mol. Biol. 215:403-410]; 문헌[Zhang 및 Madden (1997) Genome Res. 7:649-656], 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨)을 사용하거나 갭 프로그램(Gap program)(유닉스에 대한 위스콘신 서열 분석 패키지, 버전 8, Genetics Computer Group, University Research Park, Madison Wis.)을 사용함으로써 일상적으로 결정될 수 있다.
본원에 제공된 방법 및 조성물은 여러 가지 상이한 성분을 이용한다. 상세한 설명 전반에 걸쳐 일부 성분은 활성 변이체 및 단편을 가질 수 있다. 이러한 성분은 예를 들어, Cas 단백질, CRISPR RNA, tracrRNA, 및 가이드 RNA를 포함한다. 이들 성분 각각에 대한 생물학적 활성은 본원 어디에서나 기재되어 있다. 용어 "기능적"은, 생물학적 활성 또는 기능을 나타내는 단백질 또는 핵산(또는 이의 단편 또는 변이체)의 선천적인(innate) 능력을 지칭한다. 이러한 생물학적 활성 또는 기능은 예를 들어, 가이드 RNA 및 표적 DNA 서열에 결합하는 Cas 단백질의 능력을 포함할 수 있다. 기능적 단편 또는 변이체의 생물학적 기능은 원래의 분자와의 비교에서 동일할 수 있거나 사실상 분자의 기본적인 생물학적 기능의 보유에 대해서를 제외하고는 변할 수 있다(예를 들어, 이의 특이성 또는 선택성 또는 효능에 관하여).
용어 "변이체"는, 집단에 가장 우세한(prevalent) 서열과 상이한(예를 들어, 1개 뉴클레오타이드만큼) 뉴클레오타이드 서열 또는 집단에 가장 우세한 서열과 상이한(예를 들어, 1개 아미노산만큼) 단백질 서열을 지칭한다.
용어 "단편"은 단백질을 지칭할 때, 전장 단백질보다 더 짧거나 이보다 더 적은 수의 아미노산을 갖는 단백질을 의미한다. 용어 "단편"은 핵산을 지칭할 때, 전장 핵산보다 더 짧거나 이보다 더 적은 수의 뉴클레오타이드를 갖는 핵산을 의미한다. 단편은 예를 들어, 단백질 단편을 지칭할 때, N-말단 단편(즉, 단백질의 C-말단 단부 중 일부의 제거), C-말단 단편(즉, 단백질의 N-말단 단부 중 일부의 제거), 또는 내부 단편(즉, 단백질의 N-말단 단부 및 C-말단 단부 각각의 일부의 제거)일 수 있다. 단편은 예를 들어, 핵산 단편을 지칭할 때, 5' 단편(즉, 핵산의 3' 단부 중 일부의 제거), 3' 단편(즉, 핵산의 5' 단부 중 일부의 제거), 또는 내부 단편(즉, 핵산의 5' 단부 및 3' 단부 각각의 일부의 제거)일 수 있다.
2개의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 맥락에서, "서열 동일성" 또는 "동일성"은 명시된 비교 범위(comparison window)에 걸쳐 최대 상응도(correspondence)를 위해 정렬될 때 동일한 상기 2개의 서열의 잔기를 지칭한다. 서열 동일성의 백분율이 단백질과 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종, 아미노산 잔기가 유사한 화학적 특성(예를 들어, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되므로 분자의 기능적 특성을 변화시키지 않는 보존적 아미노산 치환에 의해 달라진다. 서열이 보존적 치환에 있어 달라질 때, 서열 동일성 백분율은 치환의 보존적 성질에 대해 보정하기 위해 상향 조정될 수 있다. 이러한 보존적 치환에 의해 달라지는 서열은 "서열 유사성" 또는 "유사성"을 갖는 것으로 언급된다. 이러한 조정을 수행하기 위한 수단은 널리 알려져 있다. 전형적으로, 이는 보존적 치환을 완전 미스매치(full mismatch)가 아닌 부분 미스매치로서 채점(scoring)하여, 서열 동일성 백분율을 증가시키는 것을 수반한다. 따라서, 예를 들어, 동일한 아미노산에 1의 점수가 주어지고 비-보존적 치환에 0의 점수가 주어지는 경우, 보존적 치환에는 0과 1 사이의 점수가 주어진다. 보존적 치환의 채점은, 예를 들어, 프로그램 PC/GENE(Intelligenetics, Mountain View, California)에서 구현된 바와 같이 계산된다.
"서열 동일성의 백분율"은 비교 범위에 걸쳐 2개의 최적으로 정렬된 서열(완벽하게 매칭된 잔기의 최대 수)을 비교함으로써 결정된 값을 포함하고, 상기 비교 범위에서의 폴리뉴클레오타이드 서열의 부분은 상기 2개의 서열의 최적 정렬에 대한 기준 서열(첨가 또는 결실(deletion)을 포함하지 않음)과 비교하여 첨가 또는 결실(즉, 갭)을 포함할 수 있다. 백분율은, 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에서 발생하는 위치의 수를 결정하여 매칭된 위치의 수를 산출하며, 상기 매칭된 위치의 수를 비교 범위 내의 위치의 총 수로 나누고, 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산된다. 달리 명시되지 않는 한(예를 들어, 더 짧은 서열은 연결된 이종성 서열을 포함함), 비교 범위는 비교되는 2개의 서열 중 더 짧은 서열의 전체 길이이다.
달리 언급되지 않는 한, 서열 동일성/유사성 값은 하기 매개변수를 사용하는 GAP 버전 10을 사용하여 수득된 값을 포함한다: 50의 GAP 중량 및 3의 길이 중량(Length Weight), 및 nwsgapdna.cmp 채점 매트릭스(scoring matrix)를 사용한 뉴클레오타이드 서열에 대한 동일성 % 및 유사성 %; 8의 GAP 중량 및 2의 길이 중량, 및 BLOSUM62 채점 매트릭스를 사용한 아미노산 서열에 대한 동일성 % 및 유사성 %; 또는 이와 동등한 임의의 프로그램. "동등한 프로그램"은, 대상이 되는 임의의 2개의 서열에 대하여, GAP 버전 10에 의해 발생된 상응하는 정렬과 비교할 때 동일한 뉴클레오타이드 또는 아미노산 잔기 매치 및 동일한 서열 동일성 백분율을 갖는 정렬을 생성하는 임의의 서열 비교 프로그램을 포함한다.
용어 "보존적 아미노산 치환"은 서열에 정상적으로 존재하는 아미노산을 유사한 크기, 전하, 또는 극성의 상이한 아미노산으로 치환하는 것을 지칭한다. 보존적 치환의 예는 비극성(소수성) 잔기, 예컨대 이소류신, 발린, 또는 류신을 또 다른 비극성 잔기로 치환하는 것을 포함한다. 마찬가지로, 보존적 치환의 예는, 아르기닌과 라이신 사이, 글루타민과 아스파라긴 사이, 또는 글리신과 세린 사이의 치환과 같이 하나의 극성(친수성) 잔기를 또 다른 잔기로 치환하는 것을 포함한다. 추가로, 염기성 잔기, 예컨대 라이신, 아르기닌, 또는 히스티딘을 또 다른 잔기로 치환하는 것, 또는 산성 잔기, 예컨대 아스파르트산 또는 글루탐산을 또 다른 산성 잔기로 치환하는 것은 보존적 치환의 추가 예이다. 비-보존적 치환의 예는, 극성(친수성) 잔기, 예컨대 시스테인, 글루타민, 글루탐산 또는 라이신을 비극성(소수성) 아미노산 잔기, 예컨대 이소류신, 발린, 류신, 알라닌, 또는 메티오닌으로 치환하는 것 및/또는 비극성 잔기를 극성 잔기로 치환하는 것을 포함한다. 전형적인 아미노산 분류는 하기 표 1에 요약되어 있다.
Figure pct00001
"상동성" 서열(예를 들어, 핵산 서열)은, 공지된 기준 서열과 동일하거나 실질적으로 유사하여, 상기 공지된 기준 서열과 예를 들어, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 상동성 서열은 예를 들어, 이종상동성(orthologous) 서열 및 동종상동성(paralogous) 서열을 포함할 수 있다. 상동성 유전자는 예를 들어 전형적으로, 종분화(speciation) 사건(이종상동성 유전자) 또는 유전적 중복(duplication) 사건(동종상동성 유전자)을 통해 공통의 조상(ancestral) DNA 서열로부터 계통이 이어진다(descend). "이종상동성" 유전자는 종분화에 의해 공통의 조상 유전자로부터 진화한 상이한 종의 유전자를 포함한다. 이종상동체(ortholog)는 전형적으로, 진화 과정에서 동일한 기능을 보유한다. "동종상동성" 유전자는 게놈 내에서 중복에 의해 관련된 유전자를 포함한다. 동종상동체(paralog)는 진화의 과정에서 새로운 기능을 진화시킬 수 있다.
용어 "시험관내"는 인공 환경, 및 인공 환경(예를 들어, 시험관 또는 단리된 세포 또는 세포주) 내에서 발생하는 과정 또는 반응을 포함한다. 용어 "생체내"는 천연 환경(예를 들어, 세포 또는 유기체 또는 신체), 및 천연 환경 내에서 발생하는 과정 또는 반응을 포함한다. 용어 "생체외"는 개체의 신체로부터 제거되었던 세포, 및 이러한 세포 내에서 발생하는 과정 또는 반응을 포함한다.
용어 "리포터 유전자"는, 내인성 또는 이종성 프로모터 및/또는 인핸서 요소에 작동적으로 연결된 리포터 유전자 서열을 포함하는 작제물이 상기 프로모터 및/또는 인핸서 요소의 활성화에 필요한 인자를 함유하는(또는 함유하도록 제조될 수 있음) 세포 내로 도입될 때, 쉽게 그리고 정량적으로 검정되는 유전자 생성물(전형적으로 효소)을 인코딩하는 서열을 갖는 핵산을 지칭한다. 리포터 유전자의 예는 베타-갈락토시다제(lacZ)를 인코딩하는 유전자, 박테리아 클로람페니콜 아세틸트랜스퍼라제(cat) 유전자, 반딧불이 루시퍼라제 유전자, 베타-글루쿠로니다제(GUS)를 인코딩하는 유전자, 및 형광 단백질을 인코딩하는 유전자를 포함하지만 이들로 제한되지는 않는다. "리포터 단백질"은 리포터 유전자에 의해 인코딩된 단백질을 지칭한다.
본원에 사용된 바와 같이 용어 "형광 리포터 단백질"은 형광에 기초하여 검출 가능한 리포터 단백질을 의미하며, 상기 형광은 직접적으로 리포터 단백질로부터, 형광원성(fluorogenic) 기질 상에서의 리포터 단백질의 활성으로부터, 또는 형광 태깅된 화합물에 대해 결합 친화도를 갖는 단백질로부터의 것일 수 있다. 형광 단백질의 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, tagGFP, turboGFP, eGFP, 에메랄드(Emerald), 아자미 그린(Azami Green), 단량체성 아자미 그린(Monomeric Azami Green), CopGFP, AceGFP, 및 ZsGreenl), 황색 형광 단백질(예를 들어, YFP, eYFP, 시트린(Citrine), 비너스(Venus), YPet, PhiYFP, 및 ZsYellowl), 청색 형광 단백질(예를 들어, BFP, eBFP, eBFP2, 아주라이트(Azurite), mKalamal, GFPuv, 사파이어(Sapphire) 및 T-사파이어), 시안색 형광 단백질(예를 들어, CFP, eCFP, 세룰린(Cerulean), CyPet, AmCyanl, 및 미도리이시(Midoriishi)-시안색), 적색 형광 단백질(예를 들어, RFP, mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-단량체, HcRed-탠덤, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, 및 Jred), 주황색 형광 단백질(예를 들어, mOrange, mKO, 쿠사비라-오렌지(Kusabira-Orange), 단량체성 쿠사비라-오렌지(Monomeric Kusabira-Orange), mTangerine, 및 tdTomato), 및 세포에서의 존재가 유세포분석 방법에 의해 검출될 수 있는 임의의 다른 적합한 형광 단백질을 포함한다.
이중-가닥 절단부(DSB: double-strand break)에 반응한 수선은 원칙적으로 2개의 보존된 DNA 수선 경로를 통해 발생한다: 상동성 재조합(HR) 및 비-상동성 말단 접합(NHEJ: non-homologous end joining). 문헌[Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 마찬가지로, 외인성 공여자 핵산에 의해 매개되는 표적 핵산의 수선은 2개의 폴리뉴클레오타이드 사이에서의 유전적 정보의 임의의 교환 과정을 포함할 수 있다.
용어 "재조합"은 2개의 폴리뉴클레오타이드 사이에서의 유전적 정보의 임의의 교환 과정을 포함하고, 임의의 기전에 의해 발생할 수 있다. 재조합은 상동성 지시 수선(HDR: homology directed repair) 또는 상동성 재조합(HR)을 통해 발생할 수 있다. HDR 또는 HR은 뉴클레오타이드 서열 상동성을 필요로 할 수 있는 핵산 수선 형태를 포함하며, "공여자" 분자를 "표적" 분자(즉, 이중-가닥 절단을 경험하였던 분자)의 수선을 위한 주형으로서 사용하고, 공여자로부터 표적으로의 유전적 정보의 이전을 유발한다. 임의의 특정 이론으로 결부시키고자 하는 것은 아니지만, 이러한 이전은, 절단된 표적과 공여자 사이에서 형성되는 헤테로듀플렉스 DNA의 미스매치 보정, 및/또는 표적의 일부가 되게 될 유전적 정보를 재합성하는 데에 공여자가 사용되는 합성-의존적 가닥 어닐링, 및/또는 관련 과정을 수반할 수 있다. 일부 경우, 공여자 폴리뉴클레오타이드, 공여자 폴리뉴클레오타이드의 부분, 공여자 폴리뉴클레오타이드의 복사체, 또는 공여자 폴리뉴클레오타이드의 복사체의 일부가 표적 DNA 내로 통합된다. 문헌[Wang 등 (2013) Cell 153:910-918]; 문헌[Mandalos 등 (2012) PLOS ONE 7:e45768:1-9]; 및 문헌[Wang 등 (2013) Nat Biotechnol. 31:530-532]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
비-상동성 말단 접합(NHEJ)은, 상동성 주형에 대한 필요성 없이 절단 단부를 서로 또는 외인성 서열에 직접 리게이션함으로써 핵산 내 이중-가닥 절단부를 수선하는 것을 포함한다. NHEJ에 의한 비-인접 서열의 리게이션은 종종, 이중-가닥 절단 부위 부근에서 결실, 삽입 또는 전좌를 초래할 수 있다. 예를 들어, NHEJ는 또한, 외인성 공여자 핵산의 단부와의 절단 단부의 직접 리게이션을 통한 외인성 공여자 핵산의 표적화된 통합(즉, NHEJ-기초 캡처(capture))을 초래할 수 있다. 이러한 NHEJ-매개 표적화된 통합은, 상동성 지시 수선(HDR) 경로가 쉽게 사용 가능하지 않을 때(예를 들어, 비-분열 세포, 1차 세포, 및 상동성-기초 DNA 수선을 불량하게 수행하는 세포에서) 외인성 공여자 핵산의 삽입에 바람직할 수 있다. 게다가, 상동성-지시 수선과는 대조적으로, 절단 부위의 측면에 있는 서열 동일성의 큰(large) 영역에 관한 지식이 필요하지 않으며, 이는 게놈 서열에 대해 제한된 지식이 존재하는 게놈을 갖는 유기체 내로의 표적화된 삽입을 시도할 때 유리할 수 있다. 통합은 외인성 공여자 핵산과 절단된 게놈 서열 사이에서 평활 단부의 리게이션을 통해, 또는 절단된 게놈 서열에서 뉴클레아제 제제에 의해 발생된 것과 융화성(compatible)인 오버행(overhang)의 측면에 있는 외인성 공여자 핵산을 사용하여 점착성(sticky) 단부(즉, 5' 또는 3' 오버행을 가짐)의 리게이션을 통해 진행될 수 있다. 예를 들어, 미국 특허출원공개 US 2011/020722호, 국제공개 WO 2014/033644호, WO 2014/089290호, 및 문헌[Maresca 등 (2013) Genome Res. 23(3):539-546]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 평활 단부가 리게이션된다면, 단편 접합에 필요한 미세상동성의 영역을 발생시키기 위해 표적 및/또는 공여자 절제가 필요할 수 있으며, 이는 표적 서열에서 원치 않는 변경을 생성시킬 수 있다.
용어 "항원-결합 단백질"은 항원에 결합하는 임의의 단백질을 포함한다. 항원-결합 단백질의 예는 항체, 항체의 항원-결합 단편, 다중-특이적 항체(예를 들어, 이중-특이적 항체), scFV, 비스-scFV, 디아바디, 트리아바디, 테트라바디, V-NAR, VHH, VL, F(ab), F(ab)2, DVD(이중 가변 도메인 항원-결합 단백질), SVD(단일 가변 도메인 항원-결합 단백질), 이중특이적 T-세포 인게이저(BiTE), 또는 다비스바디를 포함한다(미국 특허 제8,586,713호로서, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨).
용어 "항원"은, 전체 분자 또는 분자 내의 도메인이든지 간에 해당 성분에 결합 특이성을 갖는 항체의 생성을 유도할 수 있는 성분을 지칭한다. 용어 항원은 또한, 야생형 숙주 유기체에서 자가-인식으로 인한 항체 생성을 유도하지 않을 것이지만 면역학적 관용(immunological tolerance)을 깨기 위해 적절한 유전적 조작을 갖는 숙주 동물에서 이러한 반응을 유도할 수 있는 성분을 포함한다.
용어 "에피토프"는, 항원-결합 단백질(예를 들어, 항체)이 결합하는 항원 상의 부위를 지칭한다. 에피토프는 하나 이상의 단백질의 3차 폴딩(folding)에 의해 병치된 인접 아미노산 또는 비인접 아미노산으로부터 형성될 수 있다. 인접 아미노산으로부터 형성된 에피토프(선형 에피토프로도 알려져 있음)는 전형적으로, 변성 용매에 노출 시 보유되는 반면, 3차 폴딩에 의해 형성된 에피토프(입체배좌 에피토프로도 알려져 있음)는 전형적으로, 변성 용매로 처리 시 상실된다. 에피토프는 독특한 공간적 입체배좌에서 전형적으로, 적어도 3개, 더욱 통상 적어도 5개 또는 8 내지 10개의 아미노산을 포함한다. 에피토프의 공간적 입체배좌를 결정하는 방법은 예를 들어, x-선 결정학 및 2-차원 핵 자기 공명을 포함한다. 예를 들어, 문헌[Epitope Mapping Protocols, in Methods in Molecular Biology, Vol. 66, Glenn E. Morris, Ed. (1996)]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
본원에 기재된 바와 같은 항체 파라토프(paratope)는 일반적으로, 이종성 에피토프를 특이적으로 인식하는 상보성 결정 영역(CDR)(예를 들어, 중쇄 및/또는 경쇄 가변 도메인의 CDR3 영역)을 최소한 포함한다.
용어 "항체"는 2개의 중쇄(H) 및 2개의 경쇄(L)가 이황화 결합에 의해 상호-연결된 4개의 폴리펩타이드 사슬을 포함하는 면역글로불린 분자를 포함한다. 각각의 중쇄는 중쇄 가변 도메인 및 중쇄 불변 영역(CH)을 포함한다. 중쇄 불변 영역은 3개의 도메인을 포함한다: CH1, CH2 및 CH3. 각각의 경쇄는 경쇄 가변 도메인 및 경쇄 불변 영역(CL)을 포함한다. 중쇄 및 경쇄 가변 도메인은, 프레임워크 영역(FR)이라고 하는 더욱 보존된 영역으로 개재된 상보성 결정 영역(CDR)이라고 하는 초가변성의 영역으로 더 세분될 수 있다. 각각의 중쇄 및 경쇄 가변 도메인은 아미노-말단으로부터 카르복시-말단으로 하기 순서로 배열된 3개의 CDR 및 4개의 FR을 포함한다: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4(중쇄 CDR은 HCDR1, HCDR2 및 HCDR3으로 축약될 수 있으며; 경쇄 CDR은 LCDR1, LCDR2 및 LCDR3으로 축약될 수 있음). 용어 "고 친화도" 항체는 이의 표적 에피토프에 관해 약 10-9 M 이하(예를 들어, 약 1×10-9 M, 1×10-10 M, 1×10-11 M, 또는 약 1×10-12 M)의 KD를 갖는 항체를 지칭한다. 일 구현예에서, KD는 표면 플라즈몬 공명, 예를 들어, BIACORE™에 의해 측정되며; 또 다른 구현예에서, KD는 ELISA에 의해 측정된다.
항원-결합 단백질과 이의 표적 항원의 특이적인 결합은 적어도 106, 107, 108, 109, 또는 1010 M-1의 친화도를 갖는 결합을 포함한다. 특이적인 결합은 규모 면에서 검출 가능하게 더 높고, 적어도 하나의 무관한 표적에 대해 발생하는 비-특이적인 결합으로부터 구별 가능하다. 특이적인 결합은 특정 작용기 또는 특정 공간 적합부(spartial fit)(예를 들어, 자물쇠(lock) 및 열쇠(key) 유형) 사이에서 결합의 형성의 결과일 수 있는 반면, 비-특이적인 결합은 통상 반데르발스 힘의 결과이다. 그러나, 특이적인 결합은 본질적으로, 항원-결합 단백질이 하나의 그리고 유일하게 하나의 표적에 결합함을 내포하지는 않는다.
용어 "안티센스 RNA"는, 세포에서 전사되는 메신저 RNA 가닥에 상보적인 단일-가닥 RNA를 지칭한다.
용어 "작은 간섭 RNA(siRNA: small interfering RNA)"는, RNA 간섭(RNAi) 경로를 포함하는 전형적으로 이중-가닥 RNA 분자를 지칭한다. 이들 분자는 길이가 다양할 수 있고(일반적으로 18개 내지 30개 염기쌍), 안티센스 가닥에서 이의 표적 mRNA에 대해 다양한 정도(degree)의 상보성을 함유한다. 일부의 그러나 모두는 아닌 siRNA는 센스 가닥 및/또는 안티센스 가닥의 5' 또는 3' 단부 상에 쌍형성되지 않은(unpaired) 오버행(overhanging) 염기를 갖는다. 용어 "siRNA"는 2개의 개별 가닥의 듀플렉스, 뿐만 아니라 듀플렉스 영역을 포함하는 헤어핀 구조를 형성할 수 있는 단일 가닥을 포함한다. 이중-가닥 구조는 예를 들어, 20, 25, 30, 35, 40, 45, 또는 50개 미만의 뉴클레오타이드 길이일 수 있다. 예를 들어, 이중-가닥 구조는 약 21-23개 뉴클레오타이드 길이, 약 19-25개 뉴클레오타이드 길이, 또는 약 19-23개 뉴클레오타이드 길이일 수 있다.
용어 "짧은 헤어핀 RNA(shRNA)"는, 헤어핀 구조에서 자가-혼성화하고 가공 시 RNA 간섭(RNAi) 경로를 포함할 수 있는 단일 가닥의 RNA를 지칭한다. 이들 분자는 길이가 다양할 수 있다(일반적으로 약 50-90개 뉴클레오타이드 길이, 또는 일부 경우 250개 초과까지의 뉴클레오타이드 길이, 예를 들어, microRNA-개조(adapted) shRNA). shRNA 분자는 세포 내에서 가공되어 siRNA를 형성하며, 이는 다시 유전자 발현을 넉다운시킬 수 있다. shRNA는 벡터 내로 혼입될 수 있다. 용어 "shRNA"는 또한, 짧은, 헤어핀 RNA 분자가 전사될 수 있는 DNA 분자를 지칭한다.
하나 이상의 언급된 요소를 "포함하는(comprising)" 또는 "포함하는(including)" 조성물 또는 방법은 구체적으로 언급되지 않은 다른 요소를 포함할 수 있다. 예를 들어, 단백질을 "포함하는(comprise)" 또는 "포함하는(include)" 조성물은 상기 단백질을 단독으로 또는 다른 성분과 조합하여 함유할 수 있다. 과도기적 어구(transitional phrase) "본질적으로 ~로 구성되는"은, 청구항의 범위가 상기 청구항에서 언급된 명시된 요소, 및 청구 발명의 기본적인 그리고 신규 특징(들)에 실제적으로 영향을 미치지 않는 것을 포괄하는 것으로 해석되어야 한다. 그러므로, 용어 "본질적으로 ~로 구성되는"은 본 발명의 청구항에서 사용될 때, "포함하는"과 동등한 것으로 해석되고자 하는 것은 아니다.
"선택적인" 또는 "선택적으로"는, 후속적으로 기재된 사건 또는 상황이 발생할 수 있거나 발생할 수 없으며, 설명은 사건 또는 상황이 발생하는 경우 및 사건 또는 상황이 발생하지 않는 상황을 포함한다는 것을 의미한다.
값의 범위의 표기는 그 범위 내의 또는 그 범위를 정의하는 모든 정수, 및 그 범위 내의 정수에 의해 정의되는 모든 하위범위를 포함한다.
문맥으로부터 다르게 명확해지지 않는 한, 용어 "약"은 언급된 값의 측정의 표준 오차 경계(margin)(예를 들어, SEM) 이내의 값을 포괄한다.
용어 "및/또는"은 관련하여 나열된 항목 중 하나 이상의 임의의 그리고 모든 가능한 조합, 뿐만 아니라 대안적으로("또는") 해석될 때 조합의 결여를 지칭하고 포괄한다.
용어 "또는"은 특정 목록의 임의의 하나의 구성원을 지칭하고, 또한 해당 목록의 구성원들의 임의의 조합을 포함한다.
단수형 형태의 관사("a", "an" 및 "the")는 문맥상 명백하게 다르게 나타내지 않는 한, 복수형 지칭을 포함한다. 예를 들어, 용어 "일 단백질" 또는 "적어도 하나의 단백질"은 복수의 단백질을 이들의 혼합물을 포함하여 포함할 수 있다.
통계학적으로 유의하다는 것은 p ≤0.05를 의미한다.
상세한 설명
I. 개요
베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물 세포 및 비-인간 동물, 및 이러한 비-인간 동물 세포 및 비-인간 동물을 사용하는 방법이 본원에 개시된다. 이러한 비-인간 동물 세포 및 비-인간 동물을 제조하는 방법이 또한 본원에 개시된다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물 게놈 및 이러한 비-인간 동물 게놈을 사용하는 방법이 또한 본원에 개시된다. 베타-슬립 돌연변이를 포함하는 인간화 비-인간 동물 TTR 유전자, 및 비-인간 동물 TTR 유전자를 인간화하는 데 사용하기 위한 뉴클레아제 제제(nuclease agent) 및 표적화 벡터가 또한 개시된다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물 세포 또는 비-인간 동물은 인간 트랜스티레틴 단백질, 또는 인간 트랜스티레틴 단백질의 하나 이상의 단편을 포함하는 키메라 트랜스티레틴 단백질을 발현한다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 아밀로이드증을 매우 조기에 발증시킨다. 예를 들어, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 마우스는 아밀로이드증을 약 2개월령만큼 조기에 발증시킨다. 이는, 아밀로이드증을 매우 신속하게 발증시키는 TTR 아밀로이드증의 생체내 모델에서 최초로 보고된 것이다. 이러한 비-인간 동물 세포 및 비-인간 동물은 생체외에서 또는 생체내에서 인간-TTR-표적화 제제(예를 들어, CRISPR/Cas9 게놈 편집 제제)의 전달 또는 효능을 평가하는 데 사용될 수 있으며, 생체외에서 또는 생체내에서 이러한 제제의 효능의 전달을 최적화하는 방법에 사용될 수 있다.
본원에 개시된 비-인간 동물 세포 및 비-인간 동물 중 일부에서, 비-인간 동물 게놈 DNA 중 대부분 또는 모두는 이종상동성 인간 게놈 좌위와 1-대-1 대체된다. cDNA 삽입을 갖는 비-인간 동물과 비교하여, 인트론-엑손 구조 및 스플라이싱 머시너리가 유지될 때 발현 수준은 더 높아야 하는데, 왜냐하면 보존된 조절자 요소가 무손상으로 남아 있을 가능성이 더 크고, RNA 가공을 받는 스플라이싱된 전사물이 cDNA보다 더 안정하기 때문이다. 대조적으로, 비-인간 동물 Ttr 좌위 내로의 인간 TTR cDNA(예를 들어, 5' UTR에서 인공 베타-글로빈 인트론의 삽입과 더불어)의 삽입은 보존된 조절 요소, 예컨대 비-인간 동물 Ttr의 제1 엑손 및 인트론 내에 함유된 것을 무효화시킬 것이다. 비-인간 동물 게놈 서열을 이종상동성 인간 게놈 서열로 대체하는 것은 내인성 Ttr 좌위로부터의 이식유전자의 충실한(faithful) 발현을 초래할 가능성이 더 크다. 유사하게는, 내인성 비-인간-동물 Ttr 좌위보다 무작위 게놈 좌위에서 인간-TTR-코딩 서열의 유전자이식 삽입을 갖는 유전자이식 비-인간 동물은 또한, Ttr 발현의 내인성 조절을 정확하게 반영하지는 않을 것이다. 대부분의 또는 모든 비-인간 동물 게놈 DNA를 이종상동성 인간 게놈 DNA와 1-대-1 대체하는 것으로 인한 인간화 TTR 대립유전자는, 인간-TTR-표적화 시약(예를 들어, 인간 TTR을 표적화하도록 설계된 CRISPR/Cas9 시약)의 진(true) 인간 표적 또는 진 인간 표적의 밀접한 근사물을 제공하여, 살아 있는 동물에서 이러한 제제의 효능 및 작용 방식뿐만 아니라 인간화 단백질 및 인간화 유전자가 존재하는 TTR의 유일한 버전인 설정에서 약물동력학적 연구 및 약력학적 연구의 시험을 가능하게 할 것이다.
II. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물
본원에 개시된 세포 및 비-인간 동물은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함한다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 세포 또는 비-인간 동물은 인간 트랜스티레틴 단백질, 또는 네이티브 트랜스티레틴 단백질의 하나 이상의 단편이 인간 트랜스티레틴으로부터의 상응하는 단편으로 대체된 부분적으로 인간화, 키메라 트랜스티레틴 단백질을 발현한다.
A. 트랜스티레틴(TTR)
본원에 기재된 세포 및 비-인간 동물은 베타-슬립 돌연변이를 포함하는 인간화 트랜스티레틴(Ttr) 좌위를 포함한다. 트랜스티레틴(TTR)은 간에 의해 주로 합성될 뿐만 아니라 맥락총에 의해 생성되는 127-아미노산, 55 kDa 혈청 및 뇌척수액 수송 단백질이다. 이는 또한 프리알부민(prealbumin), 티록신 결합 프리알부민, ATTR, TBPA, CTS, CTS1, HEL111, HsT2651, 및 PALB로 지칭되었다. 이의 네이티브 상태에서, TTR은 사량체로서 존재한다. 동형접합체(homozygote)에서, 동종-사량체(homo-tetramer)는 동일한 127-아미노산 베타-시트-풍부 아단위를 포함한다. 이형접합체(heterozygote)에서, TTR 사량체는 전형적으로 통계학적 방식으로 조합되는 변이체 및/또는 야생형 아단위로 이루어질 수 있다. TTR은 혈청과 뇌척수액 둘 다에서 티록신(T4) 및 레티놀-결합 RBP(레티놀-결합 단백질)의 운반을 담당한다.
문맥으로부터 다르게 명확해지지 않는 한, 인간 트랜스티레틴(TTR) 또는 이의 단편 또는 도메인에 대한 지칭은 천연 야생형 인간 아미노산 서열을 이의 이소형(isoform) 및 대립유전자 변이체를 비롯하여 포함한다. 트랜스티레틴 전구체 단백질은 신호 서열(전형적으로 20개의 아미노산)을 포함하는 반면, 성숙(mature) 트랜스티레틴 단백질은 포함하지 않는다. 예시적인 TTR 폴리펩타이드 서열은 기탁 번호 NP_000362.1(NCBI) 및 P02766.1(UniProt)(동일하며, 각각 SEQ ID NO: 1로 표시됨)에 의해 지정된다. 잔기는 UniProt 기탁 번호 P02766.1에 따라 숫자매겨질 수 있으며, 성숙 단백질(즉, 20개 아미노산 신호 서열을 포함하지 않음)의 제1 아미노산은 잔기 1로 지정된다. 임의의 다른 TTR 단백질에서, 잔기는 최대 정렬 상에서 UniProt 기탁 번호 P02766.1에서 상응하는 잔기에 따라 숫자매겨진다.
인간 TTR 유전자는 염색체 18 상에 위치하고, 4개의 엑손 및 3개의 인트론을 포함한다. 예시적인 인간 TTR 유전자는 GenBank 기탁 번호 NG_009490.1(SEQ ID NO: 3)에 의해 지정된 서열 내 잔기 5001-12258로부터의 것이다. SEQ ID NO: 3에서 4개의 엑손은 잔기 1-205, 1130-1260, 3354-3489, 및 6802-7258을 각각 포함한다. SEQ ID NO: 3에서 TTR 코딩 서열은 잔기 137-205, 1130-1260, 3354-3489, 및 6802-6909를 포함한다. 예시적인 인간 TTR mRNA는 NCBI 기탁 번호 NM_000371.3(SEQ ID NO: 2)에 의해 지정된다. G53S/E54D/L55S 베타-슬립 돌연변이를 포함하는 TTR 단백질을 인코딩하는 예시적인 인간 TTR 코딩 서열은 SEQ ID NO: 10으로 표시된다. G53S/E54D/L55S 베타-슬립 돌연변이를 포함하는 트랜스티레틴 전구체 단백질은 SEQ ID NO: 9로 표시된다.
마우스 Ttr 유전자는 염색체 18 상에 위치하고, 4개의 엑손 및 3개의 인트론을 또한 포함한다. 예시적인 마우스 Ttr 유전자는 GenBank 기탁 번호 NC_000084.6(SEQ ID NO: 7)에 의해 지정된 서열 내 잔기 20665250 내지 20674326으로부터의 것이다. SEQ ID NO: 7에서 4개의 엑손은 잔기 1-258, 1207-1337, 4730-4865, 및 8382-9077을 각각 포함한다. SEQ ID NO: 7에서 Ttr 코딩 서열은 잔기 190-258, 1207-1337, 4730-4865, 및 8382-8489를 각각 포함한다. 예시적인 마우스 TTR 단백질은 UniProt 기탁 번호 P07309.1 또는 NCBI 기탁 번호 NP_038725.1(동일함, 각각 SEQ ID NO: 5로 표시됨)에 의해 지정된다. 예시적인 마우스 Ttr mRNA는 NCBI 기탁 번호 NM_013697.5(SEQ ID NO: 6)에 의해 지정된다.
예시적인 래트 TTR 단백질은 UniProt 기탁 번호 P02767에 의해 지정된다. 예시적인 돼지 TTR 단백질은 UniProt 기탁 번호 P50390에 의해 지정된다. 예시적인 닭 TTR 단백질은 UniProt 기탁 번호 P27731에 의해 지정된다. 예시적인 소 TTR 단백질은 UniProt 기탁 번호 O46375에 의해 지정된다. 예시적인 양 TTR 단백질은 UniProt 기탁 번호 P12303에 의해 지정된다. 예시적인 침팬지 TTR 단백질은 UniProt 기탁 번호 Q5U7I5에 의해 지정된다. 예시적인 오랑우탄 TTR 단백질은 UniProt 기탁 번호 Q5NVS2에 의해 지정된다. 예시적인 토끼 TTR 단백질은 UniProt 기탁 번호 P07489에 의해 지정된다. 예시적인 시노몰구스 원숭이(cynomolgus monkey)(마카크(macaque)) TTR 단백질은 UniProt 기탁 번호 Q8HXW1에 의해 지정된다.
트랜스티레틴(TTR) 아밀로이드증은 병원성, 미스폴딩된 TTR, 및 TTR로 이루어진 아밀로이드 원섬유의 세포외 침착을 특징으로 하는 전신 장애이다. TTR 아밀로이드증은 일반적으로, 네이티브 TTR 사량체 형태의 탈안정화(환경적 또는 유전적 조건으로 인해)에 의해 야기되어, 아밀로이드 원섬유 내로의 TTR의 해리, 미스폴딩, 및 응집을 유발하며, 이는 다양한 기관 및 조직에 축적되어 점진적인 기능 장애(dysfunction)를 야기한다. 해리된 단량체는 미스폴딩된 단백질 응집물 및 아밀로이드 원섬유를 형성하는 경향을 갖는다.
인간에서, 야생형 TTR 사량체와 돌연변이체 및 야생형 아단위로 이루어진 혼합형 사량체 둘 다는 해리되며, 미스폴딩되고, 응집될 수 있으며, 이때 아밀로이드생성(amyloidogenesis) 과정은 유사분열-후(post-mitotic) 조직의 변성을 유발한다. 그러므로, TTR 아밀로이드증은 TTR에서의 돌연변이로부터 비롯되거나 비-돌연변이화된, 미스폴딩된 TTR로부터 비롯되는 병원성 미스폴딩된 TTR에 의해 야기되는 질환을 포괄한다.
노인 전신성 아밀로이드증(SSA) 및 노인 심장성 아밀로이드증(SCA: senile cardiac amyloidosis)은 심장의 심근세포 외부에서의 그리고 내에서의 야생형 TTR 아밀로이드의 침착으로부터 비롯되는 연령-관련 유형의 아밀로이드증이다. TTR 아밀로이드증은 또한, TTR 단백질을 탈안정화시키는 돌연변이에 의해 야기되는 가장 보편적인 형태의 유전성(hereditary)(가족성(familial)) 아밀로이드증이다. TTR 유전자에서의 점 돌연변이와 관련된 TTR 아밀로이드증은 가족성 아밀로이드 다발신경병증(FAP), 가족성 아밀로이드 심근병증(FAC), 및 중추신경계 선택적 아밀로이드증(CNSA)을 포함한다.
B. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위
본원에 기재된 인간화 TTR 좌위는 베타-슬립 돌연변이를 포함한다. 베타-슬립 돌연변이의 일례는 인간 트랜스티레틴 삼중 돌연변이체 G53S/E54D/L55S에 의해 야기되는 입체배좌 변화를 기재하는 것이다. 본원 및 하기에서 잔기의 숫자매김은, 신호 펩타이드가 없는 성숙 인간 트랜스티레틴 단백질에서의 숫자매김을 지칭한다(예를 들어, 트랜스티레틴 전구체 단백질의 잔기 21에서 시작하므로, 트랜스티레틴 전구체 단백질에서 이들 잔기는 각각 잔기 73, 74, 및 75일 것임). 베타-가닥 D에서 3-잔기 시프트는 L55에 의해 통상적으로 점유되는 장소에서 L58을 배치시킨다. 이는, 잔기 S50―G63을 포함하는 DE 루프 영역, 베타 가닥 D, 및 CD 루프에서 이웃 잔기 상에 구조적 결과를 초래하지만, 베타 가닥 C의 장소를 무손상으로 남겨 둔다. 문헌[Eneqvist 등 (2000) Mol. Cell 6:1207-1218]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. G53S/E54D/L55S 변이체는 생리학적 조건에서 자발적으로 중합하고, 이들이 여전히 가용성인 점을 제외하고는 아밀로이드의 모든 특징을 나타내는 고분자량 응집물을 유발한다. G53S/E54D/L55S 변이체는 티오플라빈 T 및 콩고 레드에 결합하며, 트립신에 대해 상승된 민감성을 갖고, 원섬유 구조를 형성하며, 이는 크로스-베타 구조와 일관되는 섬유 회절 패턴을 생성한다. 문헌[Eneqvist 등 (2000) Mol. Cell 6:1207-1218]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
일반적으로, 본원에서 지칭되는 바와 같은 베타-슬립 돌연변이는 TTR 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함한다. 베타-가닥 D란, 인간 TTR 단백질 내의 베타-가닥 D, 또는 인간 TTR 단백질과 최적으로 정렬될 때 비-인간 TTR 단백질의 상응하는 영역을 의미한다. 예를 들어, 돌연변이는, 돌연변이화된 TTR이 인간 TTR 단백질과 최적으로 정렬될 때, 인간 TTR 내 잔기 L58에 상응하는 잔기를 인간 TTR 내 잔기 L55에 상응하는 잔기에 의해 통상적으로 점유되는 장소에 배치시키는 베타 가닥 D에서 3-잔기 시프트를 야기할 수 있다. 더 구체적으로, 베타-슬립 돌연변이는, 돌연변이화된 TTR 단백질이 인간 TTR 단백질과 최적으로 정렬될 때, 인간 TTR 단백질 내 G53S/E54D/L55S에 상응하는 삼중 돌연변이일 수 있다. 내인성 Ttr 유전자(또는 TTR 단백질) 내 잔기(예를 들어, 뉴클레오타이드 또는 아미노산)는, 명시된 비교 범위(예를 들어, TTR 코딩 서열)에 걸쳐 최대 상응관계(correspondence)를 위해 2개의 서열을 최적으로 정렬함으로써 인간 TTR 유전자(또는 TTR 단백질) 내 잔기에 상응하도록 결정될 수 있으며, 상기 비교 범위에서의 폴리뉴클레오타이드(또는 아미노산) 서열의 부분은 상기 2개의 서열의 최적 정렬에 대한 기준 서열(첨가 또는 결실(deletion)을 포함하지 않음)과 비교하여 첨가 또는 결실(즉, 갭)을 포함할 수 있다(예를 들어, 서열 동일성 및 상보성에 관해서는 본원 어디에서나 논의). 2개의 잔기는, 이들이 최적으로 정렬될 때 동일한 장소에 위치한다면 상응한다.
본원에 개시된 인간화 베타-슬립 TTR 좌위는, 전체 Ttr 유전자가 베타-슬립 돌연변이를 포함하는 상응하는 이종상동성 인간 TTR 서열로 대체되는 Ttr 좌위일 수 있거나, 인간화 베타-슬립 TTR 좌위는, Ttr 유전자 중 일부만 상응하는 이종상동성 인간 TTR 서열로 대체되는(즉, 인간화되는) Ttr 좌위일 수 있다. 대안적으로, 이는, Ttr 유전자의 일부가 결실되고 상응하는 이종상동성 인간 TTR 서열의 일부가 삽입되는 Ttr 좌위일 수 있다. Ttr 좌위의 일부만 인간화된다면, 베타-슬립 돌연변이는 잔여 내인성 Ttr 서열에 또는 삽입된 이종상동성 인간 TTR 서열에 존재할 수 있다. 일부 예에서, 삽입되는 이종상동성 인간 TTR 좌위 중 일부는 예를 들어, 내인성 Ttr 좌위로부터 결실되는 인간 TTR 좌위를 더 많이 포함한다. 내인성 Ttr 서열의 특정 분절에 상응하는 인간 TTR 서열은, 인간 TTR 및 내인성 Ttr 이 최적으로 정렬될 때(가장 많은 수의 완벽하게 매칭된 잔기) 내인성 Ttr 서열의 특정 분절과 정렬되는 인간 TTR의 영역을 지칭한다. 상응하는 이종상동성 인간 서열은 예를 들어, 상보적 DNA(cDNA) 또는 게놈 DNA를 포함할 수 있다. 선택적으로, 상응하는 이종상동성 인간 TTR 서열은 비-인간 동물에서 코돈 용법에 기초하여 코돈-최적화되도록 변형된다. 대체되거나 삽입되는(즉, 인간화되는) 영역은 코딩 영역, 예컨대 엑손, 비-코딩 영역, 예컨대 인트론, 비번역 영역, 또는 조절 영역(예를 들어, 프로모터, 인핸서, 또는 전사 억제자-결합 요소), 또는 임의의 이들의 조합을 포함할 수 있다. 인간화 TTR 좌위는 또한, 상응하는 이종상동성 내인성 서열을 대체하지 않으면서 내인성 Ttr 좌위 내로 삽입되는 인간 TTR 서열을 포함할 수 있다. 일례로, 인간 TTR 유전자의 1, 2, 3, 또는 모든 4개 엑손(또는 1, 2, 3, 또는 모든 4개 엑손의 모두 또는 부분)에 상응하는 엑손은 인간화될 수 있다. 구체적인 예에서, 엑손 2 및 3에 상응하는 엑손 및 엑손 1 및 4의 코딩 영역(즉, 5' UTR 및 3' UTR을 포함하지 않음)은 내인성 TTR 좌위로부터 결실될 수 있으며, 인간 TTR 유전자의 엑손 2 내지 4 및 엑손 1의 코딩 영역(즉, 5' UTR을 포함하지 않음)을 포함하는 인간 TTR 유전자의 영역이 삽입될 수 있다. 구체적인 예에서, 엑손 2 및 3에 상응하는 엑손 및 엑손 1 및 4의 코딩 영역(즉, 5' UTR 및 3' UTR을 포함하지 않음)은 내인성 TTR 좌위로부터 결실될 수 있으며, 인간 TTR 유전자의 엑손 2 및 3 및 엑손 1 및 4의 코딩 영역, 뿐만 아니라 3' UTR의 모두 또는 파트(즉, 5' UTR을 포함하지 않음)를 포함하는 인간 TTR 유전자의 영역이 삽입될 수 있다. 대안적으로, 항-인간-TTR 항원-결합 단백질에 의해 인식되는 에피토프를 인코딩하는 TTR의 영역 또는 인간-TTR-표적화 시약(즉, 저분자)에 의해 표적화되는 영역이 인간화될 수 있다. 마찬가지로, 인간 TTR 유전자의 1, 2, 또는 모든 3개 인트론에 상응하는 인트론은 인간화될 수 있거나 내인성으로 남아 있을 수 있다. 일례에서, 인간 TTR 유전자의 모든 3개 인트론에 상응하는 인트론은 인간화될 수 있다(예를 들어, 내인성 좌위로부터 결실되고 상응하는 인간 인트론으로 대체됨).
인간화 TTR 좌위는, 내인성 Ttr 좌위의 영역이 결실되었고 이종상동성 인간 TTR 서열(예를 들어, 이종상동성 야생형 인간 TTR 서열)로 대체된 것일 수 있다. 일례로서, 내인성 Ttr 좌위의 대체되는 영역은 코딩 서열(즉, 엑손의 모두 또는 파트)과 비-코딩 서열(즉, 인트론의 모두 또는 파트), 예컨대 적어도 하나의 엑손과 적어도 하나의 인트론 둘 다를 포함할 수 있다. 예를 들어, 대체되는 영역은 적어도 하나의 엑손 및 적어도 하나의 인트론을 포함할 수 있다. 코딩 서열과 비-코딩 서열 둘 다를 포함하는 대체되는 영역은 내인성 Ttr 좌위의 인접(contiguous) 영역일 수 있으며, 이는 대체되는 코딩 서열과 대체되는 비-코딩 서열 사이에 개입(intervening) 서열이 존재하지 않음을 의미한다. 예를 들어, 대체되는 영역은 적어도 하나의 엑손 및 적어도 하나의 인접 인트론을 포함할 수 있다. 대체되는 영역은 내인성 Ttr 좌위의 1개의 엑손, 2개의 엑손, 3개의 엑손, 4개의 엑손, 또는 모든 엑손을 포함할 수 있다. 삽입되는 인간 TTR 서열은 인간 TTR 유전자의 1개의 엑손, 2개의 엑손, 3개의 엑손, 4개의 엑손, 또는 모든 엑손을 포함할 수 있다. 마찬가지로, 대체되는 영역은 내인성 Ttr 좌위의 1개의 인트론, 2개의 인트론, 3개의 인트론, 또는 모든 인트론을 포함할 수 있다. 삽입되는 인간 TTR 서열은 인간 TTR 유전자의 1개의 인트론, 2개의 인트론, 3개의 인트론, 또는 모든 인트론을 포함할 수 있다. 선택적으로, 내인성 Ttr 좌위의 하나 이상의 인트론 및/또는 하나 이상의 엑손은 비변형된 채로 남아 있다(즉, 결실되지 않고 대체되지 않음). 예를 들어, 내인성Ttr 좌위의 제1 엑손은 비변형된 채로 남아 있을 수 있다. 유사하게는, 내인성Ttr 좌위의 제1 엑손 및 제1 인트론은 비변형된 채로 남아 있을 수 있다.
인간화 TTR 좌위에 의해 인코딩되는 트랜스티레틴 전구체 단백질은 네이티브 트랜스티레틴 전구체 단백질 및/또는 인간 트랜스티레틴 전구체 단백질의 활성을 보유할 수 있다. 예를 들어, 인간화 TTR 좌위에 의해 인코딩되는 트랜스티레틴 전구체 단백질은 베타-슬립 돌연변이를 포함하는 네이티브 트랜스티레틴 전구체 단백질 및/또는 베타-슬립 돌연변이를 포함하는 인간 트랜스티레틴 전구체 단백질의 활성을 보유할 수 있다.
하나의 구체적인 예에서, 트랜스티레틴 전구체 단백질의 전체 코딩 서열은 결실되고 이종상동성 인간 TTR 서열로 대체될 수 있다. 예를 들어, 개시 코돈에서 시작하고 정지 코돈에서 종료되는 내인성 Ttr 좌위의 영역은 결실되고 이종상동성 인간 TTR 서열로 대체될 수 있다.
조절 서열을 포함하는 플랭킹 비번역 영역 또한 인간화될 수 있다. 대안적으로, 조절 서열을 포함한 플랭킹 비번역 영역은 내인성으로 남아 있을 수 있다. Ttr 좌위의 제1 엑손은 전형적으로 개시 코돈의 업스트림에 5' 비번역 영역을 포함한다. 마찬가지로, Ttr 좌위의 마지막 엑손은 전형적으로 정지 코돈의 다운스트림에 3' 비번역 영역을 포함한다. Ttr 개시 코돈의 업스트림 영역 및 Ttr 정지 코돈의 다운스트림 영역은 비변형될 수 있거나, 결실되고 이종상동성 인간 TTR 서열로 대체될 수 있다. 예를 들어, 5' 비번역 영역(UTR), 3' UTR, 또는 5' UTR과 3' UTR 둘 다는 인간화될 수 있거나, 5' UTR, 3' UTR, 또는 5' UTR과 3' UTR 둘 다는 내인성으로 남아 있을 수 있다. 인간 5' UTR 및 3' UTR 중 하나 또는 둘 다는 삽입될 수 있고/거나 내인성 5' UTR 및 3' UTR 중 하나 또는 둘 다는 결실될 수 있다. 하나의 구체적인 예에서, 5' UTR은 내인성으로 남아 있다. 또 다른 구체적인 예에서, 3' UTR은 인간화되지만, 5' UTR은 내인성으로 남아 있다. 또 다른 구체적인 예에서, 5' UTR은 내인성으로 남아 있고, 인간 TTR 3' UTR은 내인성 Ttr 좌위 내로 삽입된다. 예를 들어, 인간 TTR 3' UTR은 내인성 3' UTR을 대체할 수 있거나 내인성 3' UTR을 대체하지 않으면서 삽입될 수 있다(예를 들어, 이는 내인성 3' UTR의 업스트림에 삽입될 수 있음). 예를 들어, 내인성 5' UTR(또는 이의 부분) 및 내인성 3' UTR(또는 이의 부분)은 인간화 TTR 좌위에 남아 있을 수 있고, 인간 3' UTR(또는 이의 부분)은 내인성 3' UTR의 업스트림에 삽입될 수 있다.
트랜스티레틴 전구체 단백질의 하나 이상의 도메인을 인코딩하는 내인성 Ttr 좌위의 하나 이상의 영역은 인간화될 수 있다. 마찬가지로, 트랜스티레틴 전구체 단백질의 하나 이상의 도메인을 인코딩하는 내인성 Ttr 좌위의 하나 이상의 영역은 비변형된 채로 남아 있을 수 있다(즉, 결실되지 않고 대체되지 않음). 예를 들어, 트랜스티레틴 전구체 단백질은 전형적으로 N-말단에 신호 펩타이드를 갖는다. 신호 펩타이드는 예를 들어, 약 20개 아미노산 길이일 수 있다. 신호 펩타이드를 인코딩하는 내인성 Ttr 좌위의 영역은 비변형된 채로 남아 있을 수 있거나(즉, 결실되지 않고 대체되지 않음), 결실되고 이종상동성 인간 TTR 서열로 대체될 수 있다. 유사하게는, 항-인간-TTR 항원-결합 단백질에 의해 인식되는 에피토프를 인코딩하는 내인성 Ttr 좌위의 영역은 인간화될 수 있다.
이종상동성 서열에 의한 대체의 규모에 따라, 조절 서열, 예컨대 프로모터는 내인성이거나, 대체형 인간 이종상동성 서열에 의해 공급될 수 있다. 예를 들어, 인간화 TTR 좌위는 내인성 비-인간 동물 Ttr 프로모터를 포함할 수 있다. 유전적으로 변형된 내인성 Ttr 좌위에서 트랜스티레틴 전구체 단백질에 대한 코딩 서열은 내인성 Ttr 프로모터에 작동적으로 연결될 수 있다.
구체적인 예로, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위는, 결실되고 이종상동성 인간 TTR 서열로 대체되는 내인성 Ttr 좌위의 영역이 Ttr 개시 코돈으로부터 정지 코돈까지의 영역을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 것일 수 있다. 삽입되는 인간 TTR 서열은 인간 TTR 3' UTR을 추가로 포함할 수 있다. 예를 들어, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에서의 인간 TTR 서열은, TTR 개시 코돈으로부터 3' UTR의 단부까지의 영역을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 선택적으로, 변형된 내인성 Ttr 좌위 내의 Ttr 코딩 서열은 내인성 Ttr 프로모터에 작동적으로 연결된다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에서의 인간 TTR 서열은 SEQ ID NO: 14와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에서의 인간 TTR 서열은 SEQ ID NO: 14와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위는 SEQ ID NO: 12 또는 13과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위는 SEQ ID NO: 12 또는 13과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에서의 코딩 서열(CDS)은 SEQ ID NO: 10(또는 동일한 단백질을 인코딩하는 이의 축퇴물(degenerate))과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에서의 코딩 서열(CDS)은 SEQ ID NO: 10(또는 동일한 단백질을 인코딩하는 이의 축퇴물)과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 의해 인코딩되는 생성된 인간 트랜스티레틴 전구체 단백질은 SEQ ID NO: 9와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 의해 인코딩되는 생성된 인간 트랜스티레틴 전구체 단백질은 SEQ ID NO: 9와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다.
인간화 TTR 야생형 좌위를 포함하는 대조군 비-인간 동물이 또한 생산될 수 있다. 인간화 TTR 좌위에서의 야생형 인간 TTR 서열은 SEQ ID NO: 17과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 좌위에서의 야생형 인간 TTR 서열은 SEQ ID NO: 17과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 야생형 좌위는 SEQ ID NO: 15 또는 16과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 야생형 좌위는 SEQ ID NO: 15 또는 16과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 야생형 좌위에서의 코딩 서열(CDS)은 SEQ ID NO: 4(또는 동일한 단백질을 인코딩하는 이의 축퇴물)와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 야생형 좌위에서의 코딩 서열(CDS)은 SEQ ID NO: 4(또는 동일한 단백질을 인코딩하는 이의 축퇴물)과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 야생형 좌위에 의해 인코딩되는 생성된 인간 트랜스티레틴 전구체 단백질은 SEQ ID NO: 1과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 인간화 TTR 야생형 좌위에 의해 인코딩되는 생성된 인간 트랜스티레틴 전구체 단백질은 SEQ ID NO: 1과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다.
또 다른 구체적인 예로, 인간화 TTR 좌위는, 결실되고 이종상동성 인간 TTR 서열로 대체되는 내인성 Ttr 좌위의 영역이 제2 Ttr 엑손의 개시로부터 정지 코돈까지의 영역을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 것일 수 있다. 삽입되는 인간 TTR 서열은 인간 TTR 3' UTR을 추가로 포함할 수 있다. 예를 들어, 인간화 TTR 좌위에서의 인간 TTR 서열은, 제2 인간 TTR 엑손의 개시로부터 3' UTR의 단부까지의 영역을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 선택적으로, 변형된 내인성 Ttr 좌위 내의 Ttr 코딩 서열은 내인성 Ttr 프로모터에 작동적으로 연결된다.
인간화 TTR 좌위로부터 발현되는 TTR 단백질은 전체적으로 인간 TTR 단백질 또는 키메라 내인성/인간 TTR 단백질(예를 들어, 비-인간 동물이 마우스라면, 키메라 마우스/인간 TTR 단백질)일 수 있다. 예를 들어, 트랜스티레틴 전구체 단백질의 신호 펩타이드는 내인성일 수 있고, 단백질의 나머지는 인간일 수 있다. 대안적으로, 트랜스티레틴 전구체 단백질의 N-말단은 내인성일 수 있고, 단백질의 나머지는 인간일 수 있다. 예를 들어, N-말단 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개의 아미노산은 내인성일 수 있고, 나머지는 인간일 수 있다. 구체적인 예에서, N-말단에서 23개의 아미노산은 내인성이고, 단백질의 나머지는 인간이다.
선택적으로, 인간화 TTR 좌위는 다른 요소를 포함할 수 있다. 이러한 요소의 예는 선택 카세트, 리포터 유전자, 재조합효소 인식 부위, 또는 다른 요소를 포함할 수 있다. 일례로서, 인간화 TTR 좌위는 재조합효소 인식 서열(예를 들어, loxP 부위)에 의해 플랭킹된 제거 가능한 선택 카세트(예를 들어, 자가-결실 선택 카세트)를 포함할 수 있다. 대안적으로, 인간화 TTR 좌위는 다른 요소가 결여될 수 있다(예를 들어, 선택 카세트가 결여될 수 있고/거나 리포터 유전자가 결여될 수 있음). 적합한 리포터 유전자 및 리포터 단백질의 예는 본원 어디에서나 개시되어 있다. 적합한 선택 마커의 예는 네오마이신 포스포트랜스퍼라제(neor), 하이그로마이신 B 포스포트랜스퍼라제(hygr), 퓨로마이신-N-아세틸트랜스퍼라제(puror), 블라스티시딘 S 데아미나제(bsrr), 크산틴/구아닌 포스포리보실 트랜스퍼라제(gpt), 및 단순 포진(herpes simplex) 바이러스 티미딘 키나제(HSV-k)를 포함한다. 리컴비나제의 예는 Cre, Flp, 및 Dre 리컴비나제를 포함한다. Cre 리컴비나제 유전자의 일례는 Crei이며, 여기서 Cre 리컴비나제를 인코딩하는 2개의 엑손은 원핵생물 세포에서 이의 발현을 방지하기 위해 인트론에 의해 분리된다. 이러한 리컴비나제는 핵으로의 위치화를 용이하게 하기 위해 핵 위치화 신호(예를 들어, NLS-Crei)를 추가로 포함할 수 있다. 리컴비나제 인식 부위는, 부위-특이적 리컴비나제에 의해 인식되고 재조합 사건에 대한 기질로서 역할을 할 수 있는 뉴클레오타이드 서열을 포함한다. 리컴비나제 인식 부위의 예는 FRT, FRT11, FRT71, attp, att, rox, 및 lox 부위, 예컨대 loxP, lox511, lox2272, lox66, lox71, loxM2, 및 lox5171을 포함한다.
다른 요소, 예컨대 리포터 유전자 또는 선택 카세트는 재조합효소 인식 부위의 측면에 존재하는 자가-결실 카세트일 수 있다. 예를 들어, 미국 특허출원공개 US 8,697,851호 및 US 2013/0312129호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 일례로, 자가-결실 카세트는 마우스 Prm1 프로모터에 작동적으로 연결된 Crei 유전자(인트론에 의해 분리된 Cre 리컴비나제를 인코딩하는 2개의 엑손을 포함함) 및 인간 유비퀴틴 프로모터에 작동적으로 연결된 네오마이신 내성 유전자를 포함할 수 있다. Prm1 프로모터를 이용함으로써, 자가-결실 카세트는 F0 동물의 수컷 생식 세포에서 특이적으로 결실될 수 있다. 선별 마커를 인코딩하는 폴리뉴클레오타이드는 표적화되는 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 프로모터의 예는 본원 어디에서나 기재되어 있다. 또 다른 구체적인 예로서, 자가-결실 선택 카세트는 하나 이상의 프로모터(예를 들어, 인간 유비퀴틴 프로모터와 EM7 프로모터 둘 다)에 작동적으로 연결된 하이그로마이신 내성 유전자 코딩 서열, 뒤이어 폴리아데닐화 신호, 뒤이어 하나 이상의 프로모터(예를 들어, mPrm1 프로모터)에 작동적으로 연결된 Crei 코딩 서열, 뒤이어 또 다른 폴리아데닐화 신호를 포함할 수 있으며, 전체 카세트는 loxP 부위의 측면에 존재한다.
인간화 TTR 좌위는 또한 조건적 대립유전자일 수 있다. 예를 들어, 조건적 대립유전자는 US 2011/0104799호에 기재된 바와 같은 다기능적 대립유전자일 수 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 예를 들어, 조건적 대립유전자는 (a) 표적 유전자의 전사에 관하여 센스 배향에서의 액추에이팅 서열(actuating sequence); (b) 센스 또는 안티센스 배향에서의 약물 선택 카세트(DSC); (c) 안티센스 배향에서의 관심 뉴클레오타이드 서열(NSI); 및 (d) 역배향에서 인버전 모듈에 의한 조건(COIN: conditional by inversion module, 이는 엑손-분할 인트론 및 역위 가능 유전자-트랩-유사 모듈을 이용함)을 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2011/0104799호를 참조한다. 조건적 대립유전자는 제1 재조합효소에 노출 시 재조합되어 (i) 액추에이팅 서열 및 DSC가 결여되고; (ii) 센스 배향에서 NSI 및 안티센스 배향에서 COIN을 함유하는 조건적인 대립유전자를 형성하는 재조합 가능한 단위를 추가로 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2011/0104799호를 참조한다.
C. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 세포 및 비-인간 동물
본원에 기재된 바와 같은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물 세포 및 비-인간 동물이 제공된다. 본원에 기재된 바와 같은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물 게놈이 또한 제공된다. 게놈, 세포, 또는 비-인간 동물은 수컷 또는 암컷일 수 있다. 세포 또는 비-인간 동물은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 대해 이형접합성 또는 동형접합성일 수 있다. 마찬가지로, 게놈은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 대해 이형접합성 또는 동형접합성일 수 있다. 이배체(diploid) 유기체는 각각의 유전자 좌위에 2개의 대립유전자를 갖는다. 대립유전자의 각각의 쌍은 특정 유전자 좌위의 유전자형을 나타낸다. 유전자형은, 특정 좌위에 2개의 동일한 대립유전자가 존재한다면 동형접합성으로서 기재되고, 2개의 대립유전자가 상이하다면 이형접합성으로서 기재된다. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 인간화 TTR 좌위를 이의 생식세포계에 포함할 수 있다.
본원에 제공되는 비-인간 동물 세포는 예를 들어, 인간 TTR 좌위에 상동성인 또는 이종상동성인 Ttr 좌위 또는 게놈 좌위를 포함하는 임의의 비-인간 세포일 수 있다. 마찬가지로, 본원에 제공되는 비-인간 동물 게놈은 예를 들어, 인간 TTR 좌위에 상동성인 또는 이종상동성인 Ttr 좌위 또는 게놈 좌위를 포함하는 임의의 비-인간 동물 게놈일 수 있다. 세포는 예를 들어, 동물 세포, 포유류 세포, 비-인간 포유류 세포, 및 인간 세포를 포함하는 진핵생물 세포일 수 있다. 용어 "동물"은 포유류, 어류, 및 조류를 포함한다. 마찬가지로, 게놈은 진핵생물 세포로부터의 것일 수 있다. 포유류 세포는 예를 들어, 비-인간 포유류 세포, 설치류 세포, 래트 세포, 마우스 세포, 또는 햄스터 세포일 수 있다. 다른 비-인간 포유류는 예를 들어, 비-인간 영장류, 원숭이, 유인원, 오랑우탄, 고양이, 개, 토끼, 말, 가축(예를 들어, 소 종, 예컨대 젖소 및 거세한 수소 등; 양 종, 예컨대 양 및 염소 등; 및 돼지 종, 예컨대 돼지 및 수퇘지)을 포함한다. 사육 동물(domesticated animal) 및 농장 동물 또한 포함된다. 용어 "비-인간"은 인간을 배제한다.
세포는 또한, 임의의 유형의 비분화된 또는 분화된 상태일 수 있다. 예를 들어, 세포는 전능성 세포, 만능성 세포(예를 들어, 인간 만능성 세포 또는 비-인간 만능성 세포, 예컨대 마우스 배아 줄기(ES) 세포 또는 래트 ES 세포), 또는 비-만능성 세포일 수 있다. 전능성 세포는 임의의 세포 유형을 발생시킬 수 있는 미분화된 세포를 포함하고, 만능성 세포는 1개 초과의 분화된 세포 유형으로 발달하는 능력을 소유하는 미분화된 세포를 포함한다. 이러한 만능성 및/또는 전능성 세포는 예를 들어, ES 세포 또는 ES-유사 세포, 예컨대 유도 만능 줄기(iPS: induced pluripotent stem)세포일 수 있다. ES 세포는, 배아 내로의 도입 시 발달중인 배아의 임의의 조직에 기여할 수 있는 배아-유래 전능성 또는 만능성 세포를 포함한다. ES 세포는 배반포의 내부 세포 덩어리로부터 유래될 수 있고, 임의의 3개의 척추동물 배엽층(germ layer)(내배엽, 외배엽 및 중배엽)의 세포로 분화할 수 있다.
본원에 제공된 세포는 또한, 생식 세포(예를 들어, 정자 또는 난모세포(oocyte))일 수 있다. 세포는 유사분열적으로(mitotically) 적격인(competent) 세포 또는 유사분열적으로-불활성 세포, 감수분열적으로(meiotically) 적격인 세포 또는 감수분열적으로-불활성 세포일 수 있다. 유사하게는, 세포는 또한 1차 체세포, 또는 1차 체세포가 아닌 세포일 수 있다. 체세포는 배우자(gamete), 생식 세포, 생식모세포(gametocyte), 또는 미분화된 줄기세포가 아닌 임의의 세포를 포함한다. 예를 들어, 세포는 간 세포, 예컨대 간아세포(hepatoblast) 또는 간세포(hepatocyte)일 수 있다.
본원에 제공된 적합한 세포는 또한 1차 세포를 포함한다. 1차 세포는 유기체, 기관 또는 조직으로부터 직접 단리되었던 세포 또는 세포의 배양물을 포함한다. 1차 세포는 형질전환되지 않거나 불멸이 아닌 세포를 포함한다. 이들은, 조직 배양물에서 이전에 계대배양되지 않았거나 조직 배양물에서 이전에 계대배양되었으나 조직 배양물에서 무한정으로 계대배양될 수 없는 유기체, 기관 또는 조직으로부터 수득된 임의의 세포를 포함한다. 이러한 세포는 종래의 기법에 의해 단리될 수 있으며, 예를 들어, 간세포를 포함할 수 있다.
본원에 제공된 다른 적합한 세포는 불멸화된 세포를 포함한다. 불멸화된 세포는, 통상적으로 무한정 증식하지 않을 것이지만 돌연변이 또는 변경으로 인해 정상적인 세포 노화를 벗어났고 대신에 받고 있는 분열(undergoing division)을 유지시킬 수 있는 다세포 유기체로부터의 세포를 포함한다. 이러한 돌연변이 또는 변경은 천연적으로 발생하거나 의도적으로 유도될 수 있다. 불멸화된 세포주의 구체적인 예는 HepG2 인간 간암 세포주이다. 수많은 유형의 불멸화된 세포는 널리 알려져 있다. 불멸화된 또는 1차 세포는, 재조합 유전자 또는 단백질을 배양하거나 발현시키는 데 전형적으로 사용되는 세포를 포함한다.
본원에 제공된 세포는 또한 1-세포 단계(one-cell stage) 배아(즉, 수정된 난모세포 또는 접합체)를 포함한다. 이러한 1-세포 단계 배아는 임의의 유전적 배경(예를 들어, BALB/c, C57BL/6, 129, 또는 마우스에 대해 이들의 조합)으로부터의 것일 수 있으며, 신선하거나 냉동된 것일 수 있고, 자연적 번식(natural breeding) 또는 시험관내 수정(fertilization)으로부터 유래될 수 있다.
본원에 제공된 세포는 정상적인 건강한 세포일 수 있거나, 유병(diseased) 또는 돌연변이체-보유 세포일 수 있다.
구체적인 예에서, 비-인간 동물 세포는 배아 줄기(ES) 세포 또는 간 세포, 예컨대 마우스 또는 래트 ES 세포 또는 간 세포이다.
본원에 기재된 바와 같은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 본원 어디에서나 기재된 방법에 의해 만들어질 수 있다. 용어 "동물"은 포유류, 어류, 및 조류를 포함한다. 비-인간 포유류는 예를 들어, 비-인간 영장류, 원숭이, 유인원. 오랑우탄, 고양이, 개, 말, 토끼, 설치류(예를 들어, 마우스, 래트, 햄스터, 및 기니피그), 및 가축(예를 들어, 소(bovine) 종, 예컨대 젖소 및 거세한 수소(steer); 양(ovine) 종, 예컨대 양(sheep) 및 염소; 및 돼지(porcine) 종, 예컨대 돼지 및 수퇘지)을 포함한다. 사육 동물(domesticated animal) 및 농장 동물 또한 포함된다. 용어 "비-인간 동물"은 인간을 배제한다. 바람직한 비-인간 동물은 예를 들어, 설치류, 예컨대 마우스 및 래트를 포함한다.
비-인간 동물은 임의의 유전적 배경으로부터의 것일 수 있다. 예를 들어, 적합한 마우스는 129 계통, C57BL/6 계통, 129와 C57BL/6의 혼합체, BALB/c 계통, 또는 스위스 웹스터(Swiss Webster) 계통으로부터의 것일 수 있다. 129 계통의 예는 129P1, 129P2, 129P3, 129X1, 129S1(예를 들어, 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6(129/SvEvTac), 129S7, 129S8, 129T1, 및 129T2를 포함한다. 예를 들어, 문헌[Festing (1999) Mammalian Genome 10:836]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. C57BL 계통의 예는 C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, 및 C57BL/Ola를 포함한다. 적합한 마우스는 또한, 상기 언급된 129 계통과 상기 언급된 C57BL/6 계통(예를 들어, 50% 129와 50% C57BL/6)의 혼합체로부터의 것일 수 있다. 마찬가지로, 적합한 마우스는 상기 언급된 129 계통의 혼합체 또는 상기 언급된 BL/6 계통의 혼합체(예를 들어, 129S6(129/SvEvTac) 계통)로부터의 것일 수 있다.
유사하게는, 래트는 예를 들어, ACI 래트 계통, 다크 아구티(DA: Dark Agouti) 래트 계통, 위스타(Wistar) 래트 계통, LEA 래트 계통, 스프라그 돌리(SD: Sprague Dawley) 래트 계통, 또는 피셔(Fischer) 래트계통, 예컨대 피셔 F344 또는 피셔 F6을 포함하여 임의의 래트 계통으로부터의 것일 수 있다. 래트는 또한, 상기 나열된 2개 이상의 계통의 혼합체로부터 유래된 계통으로부터 수득될 수 있다. 예를 들어, 적합한 래트는 DA 계통 또는 ACI 계통으로부터의 것일 수 있다. ACI 래트 계통은 백색의 배(belly)와 발(feet) 및 RT1 av1 반수체형(haplotype)과 함께 블랙 아구티(black agouti)를 갖는 것으로서 특징화된다. 이러한 계통은 Harlan Laboratories를 포함하여 여러 가지 공급원으로부터 입수 가능하다. 다크 아구티(DA) 래트 계통은 아구티 코트(agouti coat) 및 RT1 av1 반수체형을 갖는 것으로서 특징화된다. 이러한 래트는 Charles River 및 Harlan Laboratories를 포함하여 여러 가지 공급원으로부터 입수 가능하다. 일부 적합한 래트는 동종 교배된(inbred) 래트 계통으로부터의 것일 수 있다. 예를 들어, 미국 특허출원공개 US 2014/0235933호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 몇몇 표현형을 가질 수 있다. 일례로서, 이러한 비-인간 동물은 대조군 야생형 비-인간 동물 또는 베타-슬립 돌연변이를 갖지 않는 인간화 TTR 좌위를 포함하는 대조군 동물에 비해 과다활동적일 수 있다. 과다활동은 작업 실시예에서 더 상세히 기재되는 바와 같이 오픈 필드 시험에서 총 거리, 총 활동, 또는 총 리어링 중 하나 이상 또는 모두를 측정함으로써 평가될 수 있다.
비-인간 동물은 또한, 근긴장이상증 또는 근긴장이상(dystopic) 근육 표현형을 나타낼 수 있다. 예를 들어, 비-인간 동물은 작업 실시예에서 더 상세히 기재되는 바와 같이 뒷다리 근긴장이상증 또는 뒷다리 근긴장이상 표현형(예를 들어, 근긴장이상 뒷다리 수축(retraction))을 나타낼 수 있다.
비-인간 동물은 또한, 응집된 형태의 TTR 및/또는 아밀로이드 침착물(예를 들어, 구체적으로 TTR 아밀로이드 침착물)을 포함할 수 있다. 예를 들어, 아밀로이드 침착물은 작업 실시예에서 더 상세히 나타내는 바와 같이 좌골 신경에 있을 수 있다. 그러나, 아밀로이드 침착물은 마찬가지로 다른 기관 및 조직에 있을 수 있다.
일부 비-인간 동물에서, 임의의 이들 표현형(예를 들어, 아밀로이드 침착물)은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월령만큼 조기에 명확하다. 예를 들어, 표현형(예를 들어, 아밀로이드 침착물)은 약 2개월령까지 명확해질 수 있다.
베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 인간화 TTR 단백질을 임의의 수준으로 발현할 수 있다. 예를 들어, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 인간화 TTR 단백질을 혈청 중 적어도 약 0.1, 적어도 약 0.2, 또는 적어도 약 0.3 μg/mL의 수준으로 발현할 수 있다. 대안적으로, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물은 인간화 TTR 단백질을 혈청에서 적어도 약 0.5, 적어도 약 1, 적어도 약 2, 적어도 약 3, 적어도 약 4, 적어도 약 5, 적어도 약 6, 적어도 약 7, 적어도 약 8, 적어도 약 9, 적어도 약 10, 적어도 약 12, 적어도 약 14, 적어도 약 15, 적어도 약 16, 적어도 약 18, 적어도 약 20, 적어도 약 22, 적어도 약 24, 적어도 약 25, 적어도 약 26, 적어도 약 28, 또는 적어도 약 30 μg/mL의 수준으로 발현할 수 있다.
III. 생체내에서 또는 생체외에서 인간-TTR-표적화 시약의 효능을 평가하기 위해, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 사용하는 방법
생체내에서 또는 생체외에서 인간-TTR-표적화 시약(예를 들어, 치료적 분자 또는 복합체)의 전달 또는 효능을 평가하거나 최적화하기 위해 본원 어디에서나 기재된 바와 같은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 사용하기 위한 다양한 방법이 제공된다. 비-인간 동물은, 인간에서 아밀로이드 침착, 및 TTR 아밀로이드증의 표현형을 반영하는 표현형을 초래하는 베타-슬립 돌연변이를 포함하는 인간화 TTR 단백질을 생성한다. 이들 표현형 및 아밀로이드 침착은 매우 이른 연령에서 발생한다. 이것이 아밀로이드증을 매우 신속하게 발증시키는 TTR 아밀로이드증의 생체내 모델에서 최초로 보고된 것이기 때문에, 비-인간 동물은 TTR 아밀로이드증을 연구하기 위한 유용한 툴이다. 게다가, 비-인간 동물이 인간화 TTR 좌위를 포함하기 때문에, 상기 비-인간 동물은 인간-TTR-표적화 시약의 효능을 더욱 정확하게 반영할 것이다. 이러한 비-인간 동물은 인간 TTR 유전자를 표적화하도록 설계된 게놈-편집 시약을 시험하는 데 특히 유용한데, 왜냐하면 본원에 개시된 비-인간 동물은 무작위 게놈 좌위에서 인간 TTR 서열의 유전자이식 삽입보다는 인간화 내인성 Ttr 좌위를 포함하고, 인간화 내인성 Ttr 좌위는 인공 cDNA 서열보다는 코딩 영역과 비-코딩 영역 둘 다로부터의 이종상동성 인간 게놈 TTR 서열을 포함하기 때문이다.
A. 생체내에서 또는 생체외에서 인간-TTR-표적화 시약의 효능을 시험하는 방법
생체내에서 본원 어디에서나 기재된 바와 같은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 사용하여 인간-TTR-표적화 시약의 전달 또는 효능을 평가하기 위한 다양한 방법이 제공된다. 이러한 방법은 (a) 인간-TTR-표적화 시약을 비-인간 동물 내로 도입하는 단계; (b) 인간-TTR-표적화 시약의 활성을 평가하는 단계를 포함할 수 있다.
인간-TTR-표적화 시약은 인간 TTR 좌위(인간 TTR 유전자), 인간 TTR mRNA, 또는 인간 트랜스티레틴 단백질을 표적화하는 임의의 생물학적 또는 화학적 제제일 수 있다. 인간-TTR-표적화 시약의 예는 본원 어디에서나 개시되어 있다. 예를 들어, 인간-TTR-표적화 시약은 TTR-표적화 핵산(예를 들어, CRISPR/Cas 가이드 RNA, 짧은 헤어핀 RNA(shRNA), 또는 작은 간섭 RNA(siRNA)) 또는 TTR-표적화 단백질(예를 들어, Cas 단백질, 예컨대 Cas9, ZFN, 또는 TALEN)을 인코딩하는 핵산일 수 있다. 대안적으로, 인간-TTR-표적화 시약은 TTR-표적화 항체 또는 항원-결합 단백질, 또는 인간 TTR을 표적화하는 임의의 다른 고분자(large molecule) 또는 저분자일 수 있다.
이러한 인간-TTR-표적화 시약은 본원 어디에서나 더욱 상세히 개시된 바와 같은 임의의 전달 방법(예를 들어, AAV, LNP, 또는 HDD)에 의해 그리고 임의의 투여 경로에 의해 투여될 수 있다. 치료적 복합체 및 분자를 전달하는 수단 및 투여 경로는 본원 어디에서나 더욱 상세히 개시되어 있다. 특정 방법에서, 시약은 AAV-매개 전달을 통해 전달되었다. 예를 들어, AAV8은 간을 표적화하는 데 사용될 수 있다. 다른 특정 방법에서, 시약은 LNP-매개 전달에 의해 전달된다. 다른 특정 방법에서, 시약은 유체역학적 전달(HDD)에 의해 전달된다. 용량은 임의의 적합한 용량일 수 있다. 예를 들어, 시약(예를 들어, Cas9 mRNA 및 gRNA)이 LNP-매개 전달에 의해 전달되는 일부 방법에서, 용량은 약 0.01 내지 약 10 mg/kg, 약 0.01 내지 약 5 mg/kg, 약 0.01 내지 약 4 mg/kg, 약 0.01 내지 약 3 mg/kg, 약 0.01 내지 약 2 mg/kg, 약 0.01 내지 약 1 mg/kg, 약 0.1 내지 약 10 mg/kg, 약 0.1 내지 약 6 mg/kg; 약 0.1 내지 약 5 mg/kg, 약 0.1 내지 약 4 mg/kg, 약 0.1 내지 약 3 mg/kg, 약 0.1 내지 약 2 mg/kg, 약 0.1 내지 약 1 mg/kg, 약 0.3 내지 약 10 mg/kg, 약 0.3 내지 약 6 mg/kg; 약 0.3 내지 약 5 mg/kg, 약 0.3 내지 약 4 mg/kg, 약 0.3 내지 약 3 mg/kg, 약 0.3 내지 약 2 mg/kg, 약 0.3 내지 약 1 mg/kg, 약 0.1 mg/kg, 약 0.3 mg/kg, 약 1 mg/kg, 약 2 mg/kg, 또는 약 3 mg/kg일 수 있다. 구체적인 예에서, 용량은 약 0.1 내지 약 6 mg/kg; 약 0.1 내지 약 3 mg/kg, 또는 약 0.1 내지 약 2 mg/kg이다. 구체적인 예에서, 인간-TTR-표적화 시약은 게놈 편집 시약이며, LNP 용량은 약 1 mg/kg이고, 인간화 TTR 좌위에서의 게놈 편집 백분율은 약 70% 내지 약 80%이다. 또 다른 구체적인 예에서, 인간-TTR-표적화 시약은 게놈 편집 시약이며, LNP 용량은 약 0.3 mg/kg이고, 편집 백분율은 약 50% 내지 약 80%이다. 또 다른 구체적인 예에서, 인간-TTR-표적화 시약은 게놈 편집 시약이며, LNP 용량은 약 0.1 mg/kg이고, 편집 백분율은 약 20% 내지 약 80%이다. 또 다른 구체적인 예에서, LNP 용량은 약 1 mg/kg이고, 혈청 TTR 수준은 대조군 수준의 약 0% 내지 약 10%, 또는 약 0% 내지 약 35%까지 감소된다. 또 다른 구체적인 예에서, LNP 용량은 약 0.3 mg/kg이고, 혈청 TTR 수준은 대조군 수준의 약 0% 내지 약 20%, 또는 약 0% 내지 약 95%까지 감소된다. 또 다른 구체적인 예에서, LNP 용량은 약 0.1 mg/kg이고, 혈청 TTR 수준은 대조군 수준의 약 0% 내지 약 60%, 또는 약 0% 내지 약 99%까지 감소된다.
인간-TTR-표적화 시약의 활성을 평가하는 방법은 잘 알려져 있고 본원 어디에서나 제공된다. 활성의 평가는 본원 어디에서나 개시된 바와 같이 임의의 세포 유형, 임의의 조직 유형, 또는 임의의 기관 유형에서 이루어질 수 있다. 일부 방법에서, 활성의 평가는 간세포에서 이루어진다. 일례로, 평가는 인간화 TTR 좌위에서 비-상동성 말단 접합(NHEJ) 활성을 측정하는 단계를 포함할 수 있다. 이는 예를 들어, 인간화 TTR 좌위 내에서 삽입 또는 결실의 빈도를 측정하는 단계를 포함할 수 있다. TTR-표적화 시약이 게놈 편집 시약(예를 들어, 뉴클레아제 제제)이라면, 이러한 방법은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위의 변형을 평가하는 단계를 포함할 수 있다. 예를 들어, 평가는 비-인간 동물로부터 단리된 하나 이상의 세포에서 인간화 TTR 좌위를 시퀀싱(예를 들어, 차세대 시퀀싱)하는 단계를 포함할 수 있다. 평가는 비-인간 동물로부터 표적 기관(예를 들어, 간) 또는 조직을 단리하는 단계 및 상기 표적 기관 또는 조직에서 인간화 TTR 좌위의 변형을 평가하는 단계를 포함할 수 있다. 평가는 또한, 표적 기관 또는 조직 내의 2개 이상의 상이한 세포 유형에서 인간화 TTR 좌위의 변형을 평가하는 단계를 포함할 수 있다. 유사하게는, 평가는 비-인간 동물로부터 표적 기관 또는 조직(예를 들어, 2개 이상의 비-표적 기관 또는 조직)을 단리하는 단계 및 상기 비-표적 기관 또는 조직에서 인간화 TTR 좌위의 변형을 평가하는 단계를 포함할 수 있다.
이러한 방법은 또한, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 의해 생성된 mRNA의 발현 수준을 측정하는 단계를 포함할 수 있거나, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 의해 인코딩되는 단백질의 발현 수준을 측정함으로써 이루어질 수 있다. 예를 들어, 단백질 수준은 특정 세포, 조직, 또는 기관 유형(예를 들어, 간)에서 측정될 수 있거나, 분비된 수준은 혈청에서 측정될 수 있다. 인간화 TTR 좌위로부터 발현되는 Ttr mRNA 또는 단백질의 발현을 평가하는 방법은 본원 어디에서나 제공되고 잘 알려져 있다.
하나의 구체적인 예로서, 인간-TTR-표적화 시약이 게놈 편집 시약(예를 들어, 뉴클레아제 제제)이라면, 인간화 TTR 좌위에서의 편집 백분율(percent editing)(예를 들어, 용해된 세포의 풀(pool)로부터의 PCR 반응에서 서열 판독물의 총 수에 걸쳐 관찰된 삽입 또는 결실의 총 수)이 평가될 수 있다(예를 들어, 간 세포에서).
일례로서, 인간-TTR-표적화 시약이 게놈 편집 시약(예를 들어, 뉴클레아제 제제)이라면, 인간화 TTR 좌위에서의 편집 백분율이 평가될 수 있다(예를 들어, 간 세포에서). 예를 들어, 편집 백분율(예를 들어, 용해된 세포의 풀(pool)로부터 PCR 반응에서 서열 판독물의 총 수에 걸쳐 관찰된 삽입 또는 결실의 총 수)은 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 예를 들어, 약 1% 내지 약 99%, 약 10% 내지 약 99%, 약 20% 내지 약 99%, 약 30% 내지 약 99%, 약 40% 내지 약 99%, 약 50% 내지 약 99%, 약 60% 내지 약 99%, 약 1% 내지 약 90%, 약 10% 내지 약 90%, 약 20% 내지 약 90%, 약 30% 내지 약 90%, 약 40% 내지 약 90%, 약 50% 내지 약 90%, 약 60% 내지 약 90%, 약 1% 내지 약 80%, 약 10% 내지 약 80%, 약 20% 내지 약 80%, 약 30% 내지 약 80%, 약 40% 내지 약 80%, 약 50% 내지 약 80%, 또는 약 60% 내지 약 80%일 수 있다.
또 다른 예로서, 혈청 TTR 수준이 평가될 수 있다. 예를 들어, 혈청 TTR 수준은 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, or, 예를 들어, 약 1% 내지 약 99%, 약 10% 내지 약 99%, 약 20% 내지 약 99%, 약 30% 내지 약 99%, 약 40% 내지 약 99%, 약 50% 내지 약 99%, 약 60% 내지 약 99%, 약 70% 내지 약 99%, 약 80% 내지 약 99%, 약 1% 내지 약 90%, 약 10% 내지 약 90%, 약 20% 내지 약 90%, 약 30% 내지 약 90%, 약 40% 내지 약 90%, 약 50% 내지 약 90%, 약 60% 내지 약 90%, 약 70% 내지 약 90%, 또는 약 80% 내지 약 90%만큼 감소될 수 있다.
이러한 방법은 또한, 예컨대 본원 어디에서나 더 상세히 기재된 바와 같은 오픈 필드 시험에서 비-인간 동물의 활동/과다활동을 평가하는 단계를 포함할 수 있다. 이러한 방법은 또한, 본원 어디에서나 더 상세히 기재된 바와 같이 응집된 형태의 TTR의 존재를 평가하는 단계(예를 들어, 네이티브 PAGE 및 웨스턴 블롯에 의해) 또는 아밀로이드 침착물의 존재를 평가하는 단계를 포함할 수 있다. 이러한 방법은 또한, 예컨대 본원 어디에서나 더 상세히 기재된 바와 같이 비-인간 동물이 근긴장이상증 또는 근긴장이상 표현형을 나타내는지의 여부를 평가하는 단계를 포함할 수 있다.
생체내에서 활성을 평가하기 위해 상기 제공된 다양한 방법은 또한, 본원 어디에서나 기재된 바와 같이 생체외에서 인간-TTR-표적화 시약의 활성을 평가하는 데 사용될 수 있다.
일부 방법에서, 인간-TTR-표적화 시약은 인간 TTR 유전자를 표적화하는 뉴클레아제 제제, 예컨대 CRISPR/Cas 뉴클레아제 제제이다. 이러한 방법은 예를 들어, (a) 인간 TTR 유전자를 절단하도록 설계된 뉴클레아제 제제(예를 들어, 인간 TTR 유전자 내 가이드 RNA 표적 서열을 표적화하도록 설계된 Cas 단백질, 예컨대 Cas9 및 가이드 RNA)를 비-인간 동물 내로 도입하는 단계; 및 (b) 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위의 변형을 평가하는 단계를 포함할 수 있다.
CRISPR/Cas 뉴클레아제의 경우, 예를 들어, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위의 변형은, 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 TTR 좌위로 안내(direct)하고, Cas/가이드 RNA 복합체가 가이드 RNA 표적 서열을 절단하여 세포에 의한 수선(예를 들어, 공여자 서열이 존재하지 않는다면 비-상동성 말단 접합(NHEJ)을 통해)을 촉발할 때 유도될 것이다.
선택적으로, 2개 이상의 가이드 RNA가 도입될 수 있으며, 각각은 인간 TTR 유전자 내의 상이한 가이드 RNA 표적 서열을 표적화하도록 설계된다. 예를 들어, 2개의 가이드 RNA는 2개의 가이드 RNA 표적 서열 사이의 게놈 서열을 절제하도록 설계될 수 있다. 인간화 TTR 좌위의 변형은, 제1 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 TTR 좌위로 안내하고, 제2 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 TTR 좌위로 안내하며, 제1 Cas/가이드 RNA 복합체가 제1 가이드 RNA 표적 서열을 절단하고 제2 Cas/가이드 RNA 복합체가 제2 가이드 RNA 표적 서열을 절단하여 개입 서열의 절제를 초래할 때 유도될 것이다.
선택적으로, 인간 TTR과 재조합하고 이를 변형시킬 수 있는 외인성 공여자 핵산 또한 비-인간 동물 내로 도입된다. 선택적으로, 뉴클레아제 제제 또는 Cas 단백질은 본원 어디에서나 기재된 바와 같이 외인성 공여자 핵산에 테터링될 수 있다. 인간화 TTR 좌위의 변형은 예를 들어, 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 TTR 좌위로 안내하고, Cas/가이드 RNA 복합체가 가이드 RNA 표적 서열을 절단하며, 인간화 TTR 좌위가 내인성 공여자 핵산과 재조합되어 인간화 TTR 좌위를 변형할 때 유도될 것이다. 그 후에, 인간화 TTR 좌위는 예를 들어, 상동성-지시 수선(HDR)을 통해 또는 NHEJ-매개 삽입을 통해 외인성 공여자 핵산으로 수선될 수 있다. 임의의 유형의 외인성 공여자 핵산이 사용될 수 있으며, 이의 예는 본원 어디에서나 제공된다.
B. 생체내에서 또는 생체외에서 인간-TTR-표적화 시약의 전달 또는 효능을 최적화하는 방법
생체내에서 세포 또는 비-인간 동물로의 인간-TTR-표적화 시약의 전달을 최적화하거나 인간-TTR-표적화 시약의 활성 또는 효능을 최적화하기 위한 다양한 방법이 제공된다. 이러한 방법은 예를 들어, (a) 첫 번째로 제1 비-인간 동물 또는 제1 세포에서 상기 기재된 바와 같은 인간-TTR-표적화 시약의 효능을 시험하는 방법을 수행하는 단계; (b) 변수를 변화시키고, 두 번째로 제2 비-인간 동물(즉, 동일한 종의) 또는 제2 세포에서 변화된 변수로 상기 방법을 수행하는 단계; 및 (c) 상기 단계 (a)에서의 인간-TTR-표적화 시약의 활성을 상기 단계 (b)에서의 인간-TTR-표적화 시약의 활성과 비교하고, 더 높은 활성을 초래하는 방법을 선택하는 단계를 포함할 수 있다.
인간-TTR-표적화 시약의 전달, 효능, 또는 활성을 측정하는 방법은 본원 어디에서나 개시되어 있다. 예를 들어, 이러한 방법은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위의 변형을 측정하는 단계를 포함할 수 있다. 인간화 TTR 좌위의 더욱 효과적인 변형은 비-인간 동물 또는 세포 내에서의 요망되는 효과에 따라 상이한 것을 의미할 수 있다. 예를 들어, 인간화 TTR 좌위의 더욱 효과적인 변형은 더 높은 수준의 변형, 더 높은 정밀도(precision), 더 높은 일관성(consistency), 또는 더 높은 특이성 중 하나 이상을 의미할 수 있다. 인간화 TTR 좌위의 더 높은 수준의 변형(즉, 더 높은 효능)은, 더 높은 백분율의 세포가 특정 표적 세포 유형 내에서, 특정 표적 조직 내에서, 또는 특정 표적 기관(예를 들어, 간) 내에서 표적화됨을 지칭한다. 더 높은 정밀도는 인간화 TTR 좌위의 더 정밀한 변형(예를 들어, 잉여의 의도치 않은 삽입 및 결실(예를 들어, NHEJ 인델(indel)) 없이 동일한 변형을 갖거나 요망되는 변형을 갖는 표적화된 세포의 더 높은 백분율)을 지칭한다. 더 높은 일관성은, 하나 초과의 유형의 세포, 조직, 또는 기관이 표적화되고 있다면(예를 들어, 간 내에서 더 많은 수의 세포 유형의 변형), 상이한 유형의 표적화된 세포, 조직, 또는 기관 중에서 인간화 TTR 좌위의 더욱 일관된 변형을 지칭한다. 특정 기관이 표적화되고 있다면, 더 높은 일관성은 또한 기관(예를 들어, 간) 내의 모든 장소들 전반에 걸쳐 더욱 일관된 변형을 지칭할 수 있다. 더 높은 특이성은 표적화되는 게놈 좌위 또는 좌위들에 대한 더 높은 특이성, 표적화되는 세포 유형에 대한 더 높은 특이성, 표적화되는 조직 유형에 대한 더 높은 특이성, 또는 표적화되는 기관에 대한 더 높은 특이성을 지칭할 수 있다. 예를 들어, 증가된 게놈 좌위 특이성은 표적-외(off-target) 게놈 좌위의 더 적은 변형(예를 들어, 표적 게놈 좌위의 변형 대신에 또는 이러한 변형에 더하여 의도치 않은 표적-외 게놈 좌위에 변형을 갖는 표적화된 세포의 더 낮은 백분율)을 지칭한다. 마찬가지로, 증가된 세포 유형, 조직, 또는 기관 유형 특이성은, 특정 세포 유형, 조직 유형, 또는 기관 유형이 표적화되고 있다면 표적-외 세포 유형, 조직 유형, 또는 기관 유형의 더 적은 변형을 지칭한다(예를 들어, 특정 기관(예를 들어, 간)이 표적화될 때, 의도치 않은 표적인 기관 또는 조직에서 세포의 더 적은 변형이 존재함).
대안적으로, 이러한 방법은 TTR mRNA 또는 TTR 단백질의 발현을 측정하는 단계를 포함할 수 있다. 일례에서, 더욱 효과적인 인간-TTR-표적화 제제는 TTR mRNA 또는 TTR 단백질 발현의 더 큰 저하를 초래한다. 대안적으로, 이러한 방법은 TTR 활성을 측정하는 단계를 포함할 수 있다. 일례에서, 더욱 효과적인 인간-TTR-표적화 제제는 TTR 활성의 더 큰 저하를 초래한다.
변화되는 변수는 임의의 매개변수일 수 있다. 일례로, 변화되는 변수는, 인간-TTR-표적화 시약 또는 시약들이 세포 또는 비-인간 동물 내로 도입되는 패키징 또는 전달 방법일 수 있다. 전달 방법, 예컨대 LNP, HDD, 및 AAV의 예는 본원 어디에서나 개시되어 있다. 예를 들어, 변화되는 변수는 AAV 혈청형일 수 있다. 유사하게는, 투여는 LNP-매개 전달을 포함할 수 있고, 변화되는 변수는 LNP 제형일 수 있다. 또 다른 예로, 변화되는 변수는 세포 또는 비-인간 동물 내로의 인간-TTR-표적화 시약 또는 시약들의 도입을 위한 투여 경로일 수 있다. 투여 경로의 예, 예컨대 정맥내, 유리체내(intravitreal), 실질내(intraparenchymal,), 및 비내 점적(instillation)은 본원 어디에서나 개시된다.
또 다른 예로, 변화되는 변수는 도입되는 인간-TTR-표적화 시약 또는 시약들의 농도 또는 양일 수 있다. 또 다른 예로, 변화되는 변수는, 도입되는 또 다른 인간-TTR-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 농도 또는 양에 비해, 도입되는 하나의 인간-TTR-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 농도 또는 양일 수 있다.
또 다른 예로, 변화되는 변수는 시약의 활성 또는 효능을 평가하는 시기에 비해 인간-TTR-표적화 시약 또는 시약들을 도입하는 시기일 수 있다. 또 다른 예로, 변화되는 변수는 인간-TTR-표적화 시약 또는 시약들이 도입되는 횟수 또는 빈도일 수 있다. 또 다른 예로, 변화되는 변수는, 도입되는 또 다른 인간-TTR-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 도입 시기에 비해, 도입되는 하나의 인간-TTR-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 도입 시기일 수 있다.
또 다른 예로, 변화되는 변수는 인간-TTR-표적화 시약 또는 시약들이 도입되는 형태일 수 있다. 예를 들어, 가이드 RNA는 DNA의 형태 또는 RNA의 형태로 도입될 수 있다. Cas 단백질(예를 들어, Cas9)은 DNA의 형태, RNA의 형태, 또는 단백질(예를 들어, 가이드 RNA와 복합체화됨)의 형태로 도입될 수 있다. 외인성 공여자 핵산은 DNA, RNA, 단일-가닥, 이중-가닥, 선형, 환식 등일 수 있다. 유사하게는, 각각의 구성요소는 안정성을 위해, 표적-외 효과를 감소시키기 위해, 전달을 용이하게 하기 위해 등과 같이 변형의 다양한 조합을 포함할 수 있다. 마찬가지로, RNAi 제제 및 ASO는 예를 들어, 안정성을 위해, 표적-외 효과를 감소시키기 위해, 전달을 용이하게 하기 위해 등과 같이 변형의 다양한 조합을 포함할 수 있다. 또 다른 예로서, 변화된 변수는, 도입되는 인간-TTR-표적화 시약 또는 시약들일 수 있다(예를 들어, 상이한 서열을 갖는 상이한 가이드 RNA를 도입하거나, 상이한 Cas 단백질을 도입하거나(예를 들어, 상이한 서열을 갖는 상이한 Cas 단백질, 또는 상이한 서열을 갖지만 동일한 Cas 단백질 아미노산 서열을 인코딩하는 핵산을 도입하는 것), 또는 상이한 서열을 갖는 상이한 외인성(exogenous) 공여자 핵산을 도입하는 것).
구체적인 예에서, 인간-TTR-표적화 시약은 Cas 단백질, 및 인간 TTR 유전자 내의 가이드 RNA 표적 서열을 표적화하도록 설계된 가이드 RNA를 포함한다. 이러한 방법에서, 변화되는 변수는 가이드 RNA 서열 및/또는 가이드 RNA 표적 서열일 수 있다. 유사하게는, 인간-TTR-표적화 시약이 RNAi 제제 또는 ASO를 포함한다면, 변화된 변수는 상이한 서열을 갖는 상이한 RNAi 제제 또는 ASO를 도입하는 것일 수 있다. 일부 이러한 방법에서, Cas 단백질 및 가이드 RNA는 각각 RNA 형태로 투여될 수 있으며, 변화되는 변수는 가이드 RNA(예를 들어, LNP 제형 내)에 대한 Cas mRNA의 비(ratio)일 수 있다. 일부 이러한 방법에서, 변화되는 변수는 가이드 RNA 변형(예를 들어, 변형을 갖는 가이드 RNA는 변형을 갖지 않는 가이드 RNA와 비교됨)일 수 있다.
C. 인간-TTR-표적화 시약
인간-TTR-표적화 시약은 인간 TTR 유전자, 인간 TTR mRNA, 또는 인간 TTR 단백질을 표적화하는 임의의 시약일 수 있다. 인간-TTR-표적화 시약은 인간 TTR 유전자, 인간 TTR mRNA, 또는 인간 TTR 단백질의 임의의 영역(즉, 베타-슬립 돌연변이를 포함하는 영역뿐만 아니라 임의의 다른 영역)을 표적화할 수 있다. 예를 들어, 상기 시약은 인간 TTR 유전자 내의 표적 서열을 절단하는 게놈-편집 시약, 예컨대 뉴클레아제 제제일 수 있거나, 상기 시약은 인간 TTR mRNA를 표적화하는 안티센스 올리고뉴클레오타이드일 수 있거나, 상기 시약은 인간 TTR 단백질의 에피토프를 표적화하는 항원-결합 단백질일 수 있거나, 상기 시약은 인간 TTR을 표적화하는 저분자일 수 있다. 본원에 개시된 방법에서 인간-TTR-표적화 시약은 기지의 인간-TTR-표적화 시약일 수 있거나, 추정상(putative)-TTR-표적화 시약(예를 들어, 인간 TTR을 표적화하도록 설계된 후보 시약)일 수 있거나, 인간-TTR-표적화 활성에 대해 스크리닝되는 시약일 수 있다.
(1) 인간 TTR 유전자를 표적화하는 뉴클레아제 제제
인간-TTR-표적화 시약은 인간 TTR 유전자 내의 표적 서열을 절단하는 뉴클레아제 제제와 같은 게놈 편집 시약일 수 있다. 뉴클레아제 표적 서열은, 닉 또는 이중-가닥 절단부가 뉴클레아제 제제에 의해 유도되는 DNA 서열을 포함한다. 뉴클레아제 제제에 대한 표적 서열은 세포에 대해 내인성(또는 네이티브)일 수 있거나, 표적 서열은 세포에 대해 외인성일 수 있다. 세포에 대해 외인성인 표적 서열은 세포의 게놈에서 천연 발생하지 않는다. 표적 서열은 또한, 당업자가 표적 좌위에 위치되는 것을 요망하는 관심 폴리뉴클레오타이드에 대해 외인성일 수 있다. 일부 경우, 표적 서열은 숙주 세포의 게놈에서 단지 1회 존재한다.
표적 서열의 길이는 다양할 수 있으며, 예를 들어, 아연 핑거 뉴클레아제(ZFN) 쌍에 대해 약 30-36 bp(즉, 각각의 ZFN에 대해 약 15-18 bp), 전사 활성자-유사 이펙터 뉴클레아제(TALEN)에 대해 약 36 bp, 또는 CRISPR/Cas9 가이드 RNA에 대해 약 20 bp인 표적 서열을 포함한다.
요망되는 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는 임의의 뉴클레아제 제제는 본원에 개시된 방법 및 조성물에 사용될 수 있다. 천연 발생 또는 네이티브 뉴클레아제 제제는, 상기 뉴클레아제 제제가 요망되는 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는 한 이용될 수 있다. 대안적으로, 변형된 또는 조작된 뉴클레아제 제제가 이용될 수 있다. "조작된 뉴클레아제 제제"는, 요망되는 표적 서열에서 닉 또는 이중-가닥 절단부를 특이적으로 인식하고 유도하기 위해 이의 네이티브 형태로부터 조작되는(변형되는 또는 유래되는) 뉴클레아제를 포함한다. 그러므로, 조작된 뉴클레아제 제제는 네이티브, 천연 발생 뉴클레아제 제제로부터 유래될 수 있거나, 이는 인공적으로 생성되거나 합성될 수 있다. 조작된 뉴클레아제는 표적 서열에서 닉 또는 이중-가닥 절단부를 유도할 수 있으며, 예를 들어, 상기 표적 서열은 네이티브(비-조작된 또는 비-변형된) 뉴클레아제 제제에 의해 인식되었을 서열이 아니다. 뉴클레아제 제제의 변형은 단백질 절단 제제 내의 하나의 아미노산 또는 핵산 절단 제제 내의 하나의 뉴클레오타이드만큼 작을 수 있다. 표적 서열 또는 다른 DNA에서 닉 또는 이중-가닥 절단부를 생성하는 것은 본원에서 상기 표적 서열 또는 다른 DNA를 "자르는(cutting) 것" 또는 "절단하는(cleaving)" 것으로 지칭될 수 있다.
예시된 표적 서열의 활성 변이체 및 단편이 또한 제공된다. 이러한 활성 변이체는 주어진 표적 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있으며, 상기 활성 변이체는 생물학적 활성을 보유하므로, 뉴클레아제 제제에 의해 서열-특이적 방식으로 인식되고 절단될 수 있다. 뉴클레아제 제제에 의한 표적 서열의 이중-가닥 절단부를 측정하는 검정은 잘 알려져 있다. 예를 들어, 문헌[Frendewey 등 (2010) Methods in Enzymology 476:295-307]을 참조하며, 이는 그 전체가 모든 목적을 위해 참조로서 포함된다.
뉴클레아제 제제의 표적 서열은 Ttr 좌위에서 또는 그 부근에서 임의의 곳에 놓일 수 있다. 표적 서열은 Ttr 유전자의 코딩 영역 내에, 또는 유전자의 발현에 영향을 미치는 조절 영역 내에 위치할 수 있다. 뉴클레아제 제제의 표적 서열은 인트론, 엑손, 프로모터, 인핸서, 조절 영역, 또는 임의의 비-단백질 코딩 영역에 위치할 수 있다.
일 유형의 뉴클레아제 제제는 전사 활성자-유사 이펙터 뉴클레아제(TALEN)이다. TAL 이펙터 뉴클레아제는, 원핵 또는 진핵 유기체의 게놈 내 특정 표적 서열에서 이중-가닥 절단부를 만드는 데 사용될 수 있는 서열-특이적 뉴클레아제의 클래스이다. TAL 이펙터 뉴클레아제는 네이티브 또는 조작된 전사 활성자-유사(TAL) 이펙터, 또는 이의 기능적 파트를 뉴클레아제의 촉매적 도메인, 예컨대, 예를 들어, FokI에 융합함으로써 생성된다. 독특한 모듈형(modular) TAL 이펙터 DNA 결합 도메인은 잠재적으로 임의의 주어진 DNA 인식 특이성을 갖는 단백질의 설계를 가능하게 한다. 그러므로, TAL 이펙터 뉴클레아제의 DNA 결합 도메인은 특정 DNA 표적 부위를 인식하도록 조작되므로, 요망되는 표적 서열에서 이중-가닥 절단부를 만드는 데 사용될 수 있다. WO 2010/079430호; 문헌[Morbitzer 등 (2010) PNAS 10.1073/pnas.1013133107]; 문헌[Scholze & Boch (2010) Virulence 1:428-432]; 문헌[Christian 등 Genetics (2010) 186:757-761]; 문헌[Li (2010) Nuc. Acids Res. (2010) doi:10.1093/nar/gkq704]; 및 문헌[Miller 등 (2011) Nature Biotechnology 29:143―148]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
적합한 TAL 뉴클레아제, 및 적합한 TAL 뉴클레아제의 제조 방법의 예는 예를 들어, US 2011/0239315 A1호, US 2011/0269234 A1호, US 2011/0145940 A1호, US 2003/0232410 A1호, US 2005/0208489 A1호, US 2005/0026157 A1호, US 2005/0064474 A1호, US 2006/0188987 A1호, 및 US 2006/0063231 A1호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 다양한 구현예에서, TAL 이펙터 뉴클레아제는 예를 들어, 관심 좌위 또는 관심 게놈 좌위 내 표적 핵산 서열에서 또는 그 부근에서 자르도록 조작되며, 상기 표적 핵산 서열은 표적화 벡터에 의해 변형될 서열에서 또는 그 부근에 존재한다. 본원에 제공된 다양한 방법 및 조성물로 사용되기에 적합한 TAL 뉴클레아제는, 표적 핵산 서열에서 또는 그 부근에 결합하여 본원에 기재된 바와 같은 벡터를 표적화함으로써 변형되도록 특이적으로 설계된 것을 포함한다.
일부 TALEN에서, TALEN의 각각의 단량체는, 2개의 초가변 잔기를 통해 단일 염기쌍을 인식하는 33 내지 35개의 TAL 반복부를 포함한다. 일부 TALEN에서, 뉴클레아제 제제는, 독립적 뉴클레아제, 예컨대 FokI 엔도뉴클레아제에 작동적으로 연결된 TAL-반복부-기초 DNA 결합 도메인을 포함하는 키메라 단백질이다. 예를 들어, 뉴클레아제 제제는 제1 TAL-반복부-기초 DNA 결합 도메인 및 제2 TAL-반복부-기초 DNA 결합 도메인을 포함할 수 있으며, 상기 제1 TAL-반복부-기초 DNA 결합 도메인 및 제2 TAL-반복부-기초 DNA 결합 도메인은 각각 FokI 뉴클레아제에 작동적으로 연결되고, 상기 제1 TAL-반복부-기초 DNA 결합 도메인 및 제2 TAL-반복부-기초 DNA 결합 도메인은 다양한 길이(12-20 bp)의 스페이서 서열에 의해 분리된 표적 DNA 서열의 각각의 가닥에서 2개의 인접한 표적 DNA 서열을 인식하며, FokI 뉴클레아제 아단위는 이량체화되어, 표적 서열에서 이중 가닥 절단부를 만드는 활성 뉴클레아제를 생성한다.
본원에 개시된 다양한 방법 및 조성물에 이용되는 뉴클레아제 제제는 아연-핑거 뉴클레아제(ZFN)를 추가로 포함할 수 있다. 일부 ZFN에서, ZFN의 각각의 단량체는 3개 이상의 아연 핑거-기초 DNA 결합 도메인을 포함하며, 각각의 아연 핑거-기초 DNA 결합 도메인은 3 bp 하위부위에 결합한다. 다른 ZFN에서, ZFN은, 독립적 뉴클레아제, 예컨대 FokI 엔도뉴클레아제에 작동적으로 연결된 아연 핑거-기초 DNA 결합 도메인을 포함하는 키메라 단백질이다. 예를 들어, 뉴클레아제 제제는 제1 ZFN 및 제2 ZFN을 포함할 수 있으며, 상기 제1 ZFN 및 제2 ZFN은 각각 FokI 뉴클레아제 아단위에 작동적으로 연결되고, 상기 제1 ZFN 및 제2 ZFN은 약 5-7 bp 스페이서에 의해 분리된 표적 DNA 서열의 각각의 가닥에서 2개의 인접한 표적 DNA 서열을 인식하며, FokI 뉴클레아제 아단위는 이량체화되어, 이중 가닥 절단부를 만드는 활성 뉴클레아제를 생성한다. 예를 들어, US20060246567호; US20080182332호; US20020081614호; US20030021776호; WO/2002/057308A2호; US20130123484호; US20100291048호; WO/2011/017293A2호; 및 문헌[Gaj 등 (2013) Trends Biotechnology, 31(7):397-405]를 참조하며, 이들 각각은 본원에 참조로서 포함된다.
또 다른 유형의 뉴클레아제 제제는 메가뉴클레아제이다. 메가뉴클레아제는 보존된 서열 모티프에 기초하여 4개의 패밀리로 분류되었으며, 상기 패밀리는 LAGLIDADG, GIY-YIG, H-N-H, 및 His-Cys 상자 패밀리이다. 이들 모티프는 금속 이온의 배위 및 포스포디에스테르 결합의 가수분해에 참여한다. 메가뉴클레아제는 이의 긴 표적 서열에 있어서, 그리고 이의 DNA 기질에서의 일부 서열 다형성을 관용시키는 데 있어서 주목할만 하다. 메가뉴클레아제 도메인, 구조 및 기능은 알려져 있으며, 예를 들어, 문헌[Guhan 및 Muniyappa (2003) Crit Rev Biochem Mol Biol 38:199-248]; 문헌[Lucas 등, (2001) Nucleic Acids Res 29:960-9]; 문헌[Jurica 및 Stoddard, (1999) Cell Mol Life Sci 55:1304-26]; 문헌[Stoddard, (2006) Q Rev Biophys 38:49-95]; 및 문헌[Moure 등, (2002) Nat Struct Biol 9:764]를 참조한다. 일부 예에서, 천연 발생 변이체 및/또는 조작된 유도체 메가뉴클레아제가 사용된다. 동역학(kinectics), 보조인자 상호작용, 발현, 최적의 조건, 및/또는 표적 서열 특이성을 변형시키고, 활성을 스크리닝하는 방법은 알려져 있다. 예를 들어, 문헌[Epinat 등, (2003) Nucleic Acids Res 31:2952-62]; 문헌[Chevalier 등, (2002) Mol Cell 10:895-905]; 문헌[Gimble 등, (2003) Mol Biol 334:993-1008]; 문헌[Seligman 등, (2002) Nucleic Acids Res 30:3870-9]; 문헌[Sussman 등, (2004) J Mol Biol 342:31-41]; 문헌[Rosen 등, (2006) Nucleic Acids Res 34:4791-800]; 문헌[Chames 등, (2005) Nucleic Acids Res 33:e178]; 문헌[Smith 등, (2006) Nucleic Acids Res 34:e149]; 문헌[Gruen 등, (2002) Nucleic Acids Res 30:e29]; 문헌[Chen 및 Zhao, (2005) Nucleic Acids Res 33:e154]; WO2005105989호; WO2003078619호; WO2006097854호; WO2006097853호; WO2006097784호; 및 WO2004031346호를 참조하며, 이들 각각의 전체내용은 본원에 참조로서 포함된다.
예를 들어, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F-SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NcIIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, PI-TliII, 또는 이들의 임의의 활성 변이체 또는 단편을 포함하여 임의의 메가뉴클레아제가 사용될 수 있다.
메가뉴클레아제는 예를 들어, 12 내지 40개 염기쌍의 이중-가닥 DNA 서열을 인식할 수 있다. 일부 경우, 메가뉴클레아제는 게놈 내의 하나의 완벽하게 매칭되는 표적 서열을 인식한다.
일부 메가뉴클레아제는 호밍(homing) 뉴클레아제이다. 일 유형의 호밍 뉴클레아제는 예를 들어, I-SceI, I-CreI, 및 I-Dmol을 포함하여 호밍 뉴클레아제의 LAGLIDADG 패밀리이다.
뉴클레아제 제제는 하기에 더욱 상세히 기재된 바와 같은 CRISPR/Cas 시스템을 추가로 포함할 수 있다.
뉴클레아제 제제(즉, 조작된 뉴클레아제 제제)의 활성 변이체 및 단편이 또한 제공된다. 이러한 활성 변이체는 네이티브 뉴클레아제 제제와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있으며, 상기 활성 변이체는 요망되는 표적 서열에서 자르는 능력을 보유하므로, 닉 또는 이중-가닥-절단부-유도 활성을 보유한다. 예를 들어, 본원에 기재된 임의의 뉴클레아제 제제는 네이티브 엔도뉴클레아제 서열로부터 변형되고, 네이티브 뉴클레아제 제제에 의해 인식되지 않은 표적 서열에서 닉 또는 이중-가닥 절단부를 인식하고 유도하도록 설계될 수 있다. 그러므로, 일부 조작된 뉴클레아제는, 상응하는 네이티브 뉴클레아제 제제 표적 서열과 상이한 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는 특이성을 갖는다. 닉 또는 이중-가닥-절단부-유도 활성에 대한 검정은 알려져 있고, 일반적으로 표적 서열을 함유하는 DNA 기질 상에서의 엔도뉴클레아제의 전체 활성 및 특이성을 측정한다.
뉴클레아제 제제는 세포 또는 비-인간 동물 내로 임의의 기지의 수단에 의해 도입될 수 있다. 뉴클레아제 제제를 인코딩하는 폴리펩타이드는 세포 또는 비-인간 동물 내로 직접적으로 도입될 수 있다. 대안적으로, 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 세포 또는 비-인간 동물 내로 도입될 수 있다. 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드가 도입될 때, 상기 뉴클레아제 제제는 세포 내에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다. 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 발현 카세트에 함유될 수 있고, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터에 작동적으로 연결될 수 있다. 프로모터의 예는 본원 어디에서나 더 상세히 논의된다. 대안적으로, 뉴클레아제 제제는, 뉴클레아제 제제를 인코딩하는 mRNA로서 세포 내로 도입될 수 있다.
뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 세포의 게놈에서 안정하게 통합되고 상기 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 대안적으로, 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 표적화 벡터에 존재할 수 있다.
뉴클레아제 제제가 상기 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드의 도입을 통해 세포에 제공될 때, 이러한 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 상기 뉴클레아제 제제를 인코딩하는 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 관심 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. 예를 들어, 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 인간 세포, 비-인간 세포, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 또는 임의의 다른 관심 숙주 세포를 포함하여 주어진 관심 진핵 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다.
(2) 인간 TTR 유전자를 표적화하는 CRISPR/Cas 시스템
특정 유형의 인간-TTR-표적화 시약은, 인간 TTR 유전자를 표적화하는 CRISPR/Cas 시스템일 수 있다. CRISPR/Cas 시스템은 Cas 유전자의 발현에 관여하거나 이의 활성을 지시하는(directing) 전사물 및 다른 요소를 포함한다. CRISPR/Cas 시스템은 예를 들어, 유형 I, 유형 II, 유형 III, 또는 유형 V 시스템(예를 들어, 서브유형 V-A 또는 서브유형 V-B)일 수 있다. 본원에 개시된 조성물 및 방법에 사용되는 CRISPR/Cas 시스템은 비-천연 발생일 수 있다. "비-천연적으로 발생하는" 시스템은 인위적인 관여를 나타내는 임의의 것, 예컨대 이의 천연적으로 발생하는 상태로부터 변경되거나 돌연변이화되거나, 이것이 자연상에서 천연적으로 관련된 적어도 하나의 다른 성분이 적어도 실질적으로 없거나, 이것이 천연적으로 관련이 있지 않는 적어도 하나의 다른 성분과 관련이 있는 시스템의 하나 이상의 성분을 포함한다. 예를 들어, 일부 CRISPR/Cas 시스템은, 천연적으로 함께 발생하지 않는 gRNA 및 Cas 단백질을 포함하는 비-천연 발생 CRISPR 복합체를 이용하거나, 천연적으로 발생하지 않는 Cas 단백질을 이용하거나, 천연적으로 발생하지 않는 gRNA를 이용하지 않는다.
Cas 단백질, 및 Cas 단백질을 인코딩하는 폴리뉴클레오타이드. Cas 단백질은 일반적으로, 가이드 RNA(하기에서 더욱 상세히 기재된 gRNA)와 상호작용할 수 있는 적어도 하나의 RNA 인식 또는 결합 도메인을 포함한다. Cas 단백질은 또한, 뉴클레아제 도메인(예를 들어, DNase 도메인 또는 RNase 도메인), DNA-결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 이량체화 도메인, 및 다른 도메인을 포함할 수 있다. 일부 이러한 도메인(예를 들어, DNase 도메인)은 네이티브(native) Cas 단백질로부터의 것일 수 있다. 다른 이러한 도메인이 첨가되어, 변형된 Cas 단백질을 만들 수 있다. 뉴클레아제 도메인은 핵산 절단에 대해 촉매 활성을 소유하며, 이는 핵산 분자의 공유 결합의 절단을 포함한다. 절단은 평활 단부(blund end) 또는 엇갈린 단부(staggered end)를 생성할 수 있으며, 이는 단일-가닥 또는 이중-가닥일 수 있다. 예를 들어, 야생형 Cas9 단백질은 전형적으로, 평활 절단 생성물을 생성할 것이다. 대안적으로, 야생형 Cpf1 단백질(예를 들어, FnCpf1)은 5-뉴클레오타이드 5' 오버행을 갖는 절단 생성물을 초래할 수 있으며, 상기 절단은 비-표적화된 가닥 상의 PAM 서열로부터 18번째 염기쌍 다음에, 그리고 표적화된 가닥 상의 23번째 염기 다음에 발생한다. Cas 단백질은 표적 게놈 좌위에서 이중-가닥 절단부(예를 들어, 평활 단부를 갖는 이중-가닥 절단부)를 생성하기 위해 완전 절단 활성을 가질 수 있거나, Cas 단백질은 표적 게놈 좌위에서 단일-가닥 절단부를 생성하는 닉카제일 수 있다.
Cas 단백질의 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e(CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9(Csn1 또는 Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1(CasA), Cse2(CasB), Cse3(CasE), Cse4(CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cu1966, 및 이의 상동체 또는 변형된 버전을 포함한다.
예시적인 Cas 단백질은 Cas9 단백질, 또는 Cas9 단백질로부터 유래된 단백질이다. Cas9 단백질은 II형 CRISPR/Cas 시스템으로부터 것이며, 전형적으로 보존된 구조를 갖는 4개의 주요 모티프를 공유한다. 모티프 1, 2, 및 4는 RuvC-유사 모티프이고, 모티프 3은 HNH 모티프이다. 예시적인 Cas9 단백질은 스트렙토콕커스 피오게네스(Streptococcus pyogenes), 스트렙토콕커스 써모필루스(Streptococcus thermophilus), 스트렙토콕커스 종(Streptococcus sp.), 스타필로콕커스 아우레우스(Staphylococcus aureus), 노카르디옵시스 다쏜빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티내스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스, 스트렙토스포란기움 로세움(Streptosporangium roseum), 스트렙토스포란기움 로세움, 알리사이클로바실루스 악시도칼다리우스(Alicyclobacillus acidocaldarius), 바실루스 슈도마이코이데스(Bacillus pseudomycoides), 바실루스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실루스 델브루엑키이(Lactobacillus delbrueckii), 락토바실루스 살리바리우스(Lactobacillus salivarius), 미크로스실라 마리나(Microscilla marina), 부르콜데리알레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 종(Polaromonas sp.), 크로코스패라 와트소니이(Crocosphaera watsonii), 시아노테세 종(Cyanothece sp.), 미크로사이스티스 애루기노사(Microcystis aeruginosa), 사이네코콕커스 종(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시룹토르 벡스치이(Caldicelulosiruptor becscii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라내로비우스 써모필루스(Natranaerobius thermophilus), 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum), 악시디티오바실루스 칼두스(Acidithiobacillus caldus), 악시디티오바실루스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 종(Marinobacter sp.), 니트로소콕커스 할로필루스(Nitrosococcus halophilus), 니트로소콕커스 와트소니(Nitrosococcus watsoni), 슈도알테로모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박터 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나배나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 종(Nostoc sp.), 아르쓰로스피라 막시마(Arthrospira maxima), 아르쓰로스피라 플라텐시스(Arthrospira platensis), 아르쓰로스피라 종(Arthrospira sp.), 라인그바이아 종(Lyngbya sp.), 미크로콜레우스 크쏘노플라스테스(Microcoleus chthonoplastes), 오스칠라토리아 종(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus), 아카라이오클로리스 마리나(Acaryochloris marina), 네이쎄리아 메닌지티디스(Neisseria meningitidis), 또는 캄필로박터 예유니(Campylobacter jejuni)로부터의 것이다. Cas9 패밀리 구성원의 추가 예는 국제공개 WO 2014/131833에 기재되어 있으며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 에스. 피오게네스(S. pyogenes)로부터의 Cas9(SpCas9)(지정된 SwissProt 수탁 번호 Q99ZW2)는 예시적인 Cas9 단백질이다. 에스. 아우레우스(S. aureus)로부터의 Cas9(SaCas9)(지정된 UniProt 수탁 번호 J7RUA5)는 또 다른 예시적인 Cas9 단백질이다. 캄필로박터 예유니로부터의 Cas9(CjCas9)(지정된 UniProt 수탁 번호 Q0P897)는 또 다른 예시적인 Cas9 단백질이다. 예를 들어, 문헌[Kim 등 (2017) Nat. Comm. 8:14500]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. SaCas9는 SpCas9보다 더 작고, CjCas9는 SaCas9와 SpCas9 둘 다보다 작다.
Cas 단백질의 또 다른 예는 Cpf1(프레보텔라프란치셀라 1로부터의 CRISPR) 단백질이다. Cpf1은, Cas9의 특징적인 아르기닌-풍부 군집(cluster)에 대한 대응물(counterpart)과 함께 Cas9의 상응하는 도메인에 상동성인 RuvC-유사 뉴클레아제 도메인을 함유하는 큰 단백질(약 1300개 아미노산)이다. 그러나, Cpf1은, Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여되어 있고, RuvC-유사 도메인은, HNH 도메인을 포함하는 긴 삽입물(insert)을 함유하는 Cas9와 대조적으로 Cpf1 서열에서 인접해 있다. 예를 들어, 문헌[Zetsche 등 (2015) Cell 163(3):759-771]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 예시적인 Cpf1 단백질은 프란치셀라 툴라렌시스(Francisella tularensis) 1, 프란치셀라 툴라렌시스 아종 보디치다(Francisella tularensis subsp. novicida), 프레보텔라 알벤시스(Prevotella albensis), 라흐노스피라세애 박테리움(라흐노스피라세애 박테리움(Lachnospiraceae bacterium)) MC2017 1, 부타이리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium) GW2011_GWA2_33_10, 파르쿠박테리아 박테리움(Parcubacteria bacterium) GW2011_GWC2_44_17, 스미쎌라 종(Smithella sp.) SCADC, 악시다미노콕커스 종(Acidaminococcus sp.) BV3L6, 라흐노스피라세애 박테리움(Lachnospiraceae bacterium) MA2020, 칸디다투스 메타노플라스마 테르미툼(Candidatus Methanoplasma termitum), 유박테리움 엘리겐스(Eubacterium eligens), 모락셀라 보보쿨리(Moraxella bovoculi) 237, 렙토스피라 이나다이(Leptospira inadai), 라흐노스피라세애 박테리움(Lachnospiraceae bacterium) ND2006, 포르파이로모나스 크레비오리카니스(Porphyromonas crevioricanis) 3, 프레보텔라 디시엔스(Prevotella disiens), 및 포르파이로모나스 마카캐(Porphyromonas macacae)로부터의 것이다. 프란치셀라 보디치다 U112로부터의 Cpf1(FnCpf1; UniProt 수탁 번호 A0Q7Q2로 지정됨)은 예시적인 Cpf1 단백질이다.
Cas 단백질은 야생형 단백질(즉, 자연에서 발생하는 것), 변형된 Cas 단백질(즉, Cas 단백질 변이체), 또는 야생형 또는 변형된 Cas 단백질의 단편일 수 있다. Cas 단백질은 또한, 야생형 또는 변형된 Cas 단백질의 촉매적 활성에 관하여 활성(active) 변이체 또는 단편일 수 있다. 촉매적 활성에 관하여 활성 변이체 또는 단편은 야생형 또는 변형된 Cas 단백질 또는 이의 부분과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있으며, 상기 활성 변이체는 요망되는 절단 부위에서 절단하는 능력을 보유하므로, 닉-유도 또는 이중-가닥-절단부-유도 활성을 보유한다. 닉-유도 또는 이중-가닥-절단부-유도 활성에 대한 검정은 알려져 있고, 일반적으로 절단 부위를 함유하는 DNA 기질 상에서의 Cas 단백질의 전체 활성 및 특이성을 측정한다.
Cas 단백질은 핵산 결합 친화도, 핵산 결합 특이성, 및 효소적 활성 중 하나 이상을 증가시키거나 저하시키도록 변형될 수 있다. Cas 단백질은 또한, 단백질의 임의의 다른 활성 또는 특성, 예컨대 안정성을 변화시키도록 변형될 수 있다. 예를 들어, Cas 단백질의 하나 이상의 뉴클레아제 도메인은 변형, 결실 또는 불활성화될 수 있거나, Cas 단백질은 단백질의 기능에 본질적이지 않은 도메인을 제거하기 위해 또는 Cas 단백질의 활성 또는 특성을 최적화하기 위해(예를 들어, 증강시키거나 감소시키기 위해) 절단될 수 있다.
변형된 Cas 단백질의 일례는 변형된 SpCas9-HF1 단백질이며, 이는 비-특이적 DNA 접촉을 감소시키도록 설계된 변경을 보유하는 스트렙토콕커스 피오게네스 Cas9의 고-충실도(high-fidelity) 변이체이다(N497A/R661A/Q695A/Q926A). 예를 들어, 문헌[Kleinstiver 등 (2016) Nature 529(7587):490-495]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 변형된 Cas 단백질의 또 다른 예는 표적-외(off-target) 효과를 감소시키도록 설계된 변형된 eSpCas9 변이체(K848A/K1003A/R1060A)이다. 예를 들어, 문헌[Slaymaker 등 (2016) Science 351(6268):84-88]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 다른 SpCas9 변이체는 K855A 및 K810A/K1003A/R1060A를 포함한다.
Cas 단백질은 적어도 하나의 뉴클레아제 도메인, 예컨대 DNase 도메인을 포함할 수 있다. 예를 들어, 야생형 Cpf1 단백질은 일반적으로, 아마도 이량체 입체배치(configuration)에서 표적 DNA의 양쪽 가닥을 절단하는 RuvC-유사 도메인을 포함한다. Cas 단백질은 또한 적어도 2개의 뉴클레아제 도메인, 예컨대 DNase 도메인을 포함할 수 있다. 예를 들어, 야생형 Cas9 단백질은 일반적으로 RuvC-유사 뉴클레아제 도메인 및 HNH-유사 뉴클레아제 도메인을 포함한다. RuvC 도메인 및 HNH 도메인은 각각 이중-가닥 DNA의 상이한 가닥을 절단하여, DNA에서 이중-가닥 절단부를 만들 수 있다. 예를 들어, 문헌[Jinek 등 (2012) Science 337:816-821]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
뉴클레아제 도메인 중 하나 이상 또는 모두는 결실되거나 돌연변이화될 수 있어서, 이들은 더 이상 기능적이지 않거나 감소된 뉴클레아제 활성을 갖는다. 예를 들어, 뉴클레아제 도메인 중 하나가 Cas9 단백질에서 결실되거나 돌연변이화된다면, 생성된 Cas9 단백질은 닉카제로 지칭될 수 있고, 이중-가닥 절단부가 아니라 이중-가닥 표적 DNA 내에서 단일-가닥 절단부를 발생시킬 수 있다(즉, 이는 상보적 가닥과 비-상보적 가닥 둘 다가 아니라 둘 중 하나를 절단할 수 있음). 뉴클레아제 도메인 둘 다 결실되거나 돌연변이화된다면, 생성된 Cas 단백질(예를 들어, Cas9)은 이중-가닥 DNA(예를 들어, 뉴클레아제-무효(null) 또는 뉴클레아제-불활성 Cas 단백질, 또는 촉매적으로 사멸된(dead) Cas 단백질(dCas))의 양쪽 가닥을 절단하는 감소된 능력을 가질 것이다. Cas9를 닉카제로 전환시키는 돌연변이의 일례는 에스. 피오게네스로부터의 Cas9의 RuvC 도메인 내의 D10A(Cas9의 위치 10에서 아스파르테이트로부터 알라닌으로의) 돌연변이이다. 마찬가지로, 에스. 피오게네스로부터의 Cas9의 HNH 도메인 내 H939A(아미노산 위치 839에서 히스티딘으로부터 알라닌으로), H840A(아미노산 위치 840에서 히스티딘으로부터 알라닌으로), 또는 N863A(아미노산 위치 N863에서 아스파라긴으로부터 알라닌으로)는 Cas9를 닉카제로 전환시킬 수 있다. Cas9를 닉카제로 전환시키는 돌연변이의 다른 예는 에스. 써모필루스(S. thermophilus)로부터의 Cas9에 대한 상응하는 돌연변이를 포함한다. 예를 들어, 문헌[Sapranauskas 등 (2011) Nucleic Acids Research 39:9275-9282] 및 국제공개 WO 2013/141680호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 돌연변이는 부위-지향적(directed) 돌연변이유발(mutagenesis), PCR-매개 돌연변이유발, 또는 전체 유전자 합성과 같은 방법을 사용하여 발생될 수 있다. 닉카제를 생성하는 다른 돌연변이의 예는 예를 들어, 국제공개 WO 2013/176772호 및 WO 2013/142578호에서 찾을 수 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 모든 뉴클레아제가 Cas 단백질에서 결실되거나 돌연변이화된다면(예를 들어, 뉴클레아제 도메인 Cas9 단백질에서 둘 다 결실되거나 돌연변이화된다면), 생성된 Cas 단백질(예를 들어, Cas9)은 이중-가닥 DNA(예를 들어, 뉴클레아제-무효 또는 뉴클레아제-불활성 Cas 단백질)의 양쪽 가닥을 절단하는 감소된 능력을 가질 것이다. 하나의 구체적인 예는 D10A/H840A 에스. 피오게네스 Cas9 이중 돌연변이체 또는 에스. 피오게네스 Cas9와 최적으로 정렬될 때 또 다른 종으로부터의 Cas9 내의 상응하는 이중 돌연변이체이다. 또 다른 구체적인 예는 D10A/N863A 에스. 피오게네스 Cas9 이중 돌연변이체 또는 에스. 피오게네스 Cas9와 최적으로 정렬될 때 또 다른 종으로부터의 Cas9 내의 상응하는 이중 돌연변이체이다.
스타필로콕커스 아우레우스 Cas9 단백질의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다. 예를 들어, 스타필로콕커스 아우레우스 Cas9 효소(SaCas9)는 위치 N580에서 치환(예를 들어, N580A 치환) 및 위치 D10에서 치환(예를 들어, D10A 치환)을 포함하여, 뉴클레아제-불활성 Cas 단백질을 발생시킬 수 있다. 예를 들어, 국제공개 WO 2016/106236호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
Cpf1 단백질의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다. 프란치셀라 보디치다 U112(FnCpf1), 악시다미노콕커스 종 BV3L6(AsCpf1), 라흐노스피라세애 박테리움 ND2006(LbCpf1), 및 모락셀라 보보쿨리 237(MbCpf1 Cpf1)로부터의 Cpf1 단백질에 관하여, 이러한 돌연변이는 AsCpf1의 위치 908, 993, 또는 1263 또는 Cpf1 이종상동체 내 상응하는 위치, 또는 LbCpf1의 위치 832, 925, 947, 또는 1180 또는 Cpf1 이종상동체 내 상응하는 위치에서 돌연변이를 포함할 수 있다. 이러한 돌연변이는 예를 들어, AsCpf1의 돌연변이 D908A, E993A, 및 D1263A 또는 Cpf1 이종상동체 내 상응하는 돌연변이, 또는 LbCpf1의 D832A, E925A, D947A, 및 D1180A 또는 Cpf1 이종상동체 내 상응하는 돌연변이 중 하나 이상을 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0208243호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
Cas 단백질은 또한, 이종성 폴리펩타이드에 융합 단백질로서 작동적으로 연결될 수 있다. 예를 들어, Cas 단백질은 절단 도메인 또는 유전외적 변형 도메인에 융합될 수 있다. 국제공개 WO 2014/089290호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. Cas 단백질은 이종성 폴리펩타이드에 융합되어, 증가된 또는 저하된 안정성을 제공할 수 있다. 융합된 도메인 또는 이종성 폴리펩타이드는 Cas 단백질 내의 N-말단, C-말단, 또는 내부적으로 위치할 수 있다.
일례로서, Cas 단백질은 하위세포 국재화(subcellular localization)를 제공하는 하나 이상의 이종성 폴리펩타이드에 융합될 수 있다. 이러한 이종성 폴리펩타이드는 예를 들어, 핵으로의 표적화를 위한 하나 이상의 핵 국재화 신호(NLS), 예컨대 단립(monopartite) SV40 NLS 및/또는 이분(bipartite) 알파-임포틴(importin) NLS, 미토콘드리아로의 표적화를 위한 미토콘드리아 국재화 신호, ER 체류 신호 등을 포함할 수 있다. 예를 들어, 문헌[Lange 등 (2007) J. Biol. Chem. 282:5101-5105]를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 세포 내 국재화 신호는 Cas 단백질 내의 N-말단, C-말단, 또는 어디에서나 위치할 수 있다. NLS는 염기성 아미노산의 스트레치를 포함할 수 있고, 단립 서열 또는 이분 서열일 수 있다. 선택적으로, Cas 단백질은 N-말단에서의 NLS(예를 들어, 알파-임포틴 NLS 또는 단립 NLS) 및 C-말단에서의 NLS(예를 들어, SV40 NLS 또는 이분 NLS)를 포함하여 2개 이상의 NLS를 포함할 수 있다. Cas 단백질은 또한, N-말단에 2개 이상의 NLS 및/또는 C-말단에 2개 이상의 NLS를 포함할 수 있다.
Cas 단백질은 또한, 세포-투과 도메인 또는 단백질 형질도입 도메인에 작동적으로 연결될 수 있다. 예를 들어, 세포-투과 도메인은 HIV-1 TAT 단백질, 인간 B형 간염 바이러스로부터의 TLM 세포-투과 모티프, MPG, Pep-1, VP22, 단순 포진 바이러스로부터의 세포 투과 펩타이드, 또는 폴리아르기닌 펩타이드 신호로부터 유래될 수 있다. 예를 들어, 국제공개 WO 2014/089290호 및 WO 2013/176772호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 세포-투과 도메인은 Cas 단백질 내의 N-말단, C-말단, 또는 어디에서나 위치할 수 있다.
Cas 단백질은 또한, 추적(tracking) 또는 정제의 용이성을 위해 이종성 폴리펩타이드, 예컨대 형광 단백질, 정제 태그, 또는 에피토프 태그에 작동적으로 연결될 수 있다. 형광 단백질의 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, tagGFP, turboGFP, eGFP, 에메랄드, 아자미 그린, 단량체성 아자미 그린, CopGFP, AceGFP, ZsGreenl), 황색 형광 단백질(예를 들어, YFP, eYFP, 시트린, 비너스, YPet, PhiYFP, ZsYellowl), 청색 형광 단백질(예를 들어, eBFP, eBFP2, 아주라이트, mKalamal, GFPuv, 사파이어, T-사파이어), 시안색 형광 단백질(예를 들어, eCFP, 세룰린, CyPet, AmCyanl, 미도리이시-시안색), 적색 형광 단백질(예를 들어, mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-단량체, HcRed-탠덤, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), 주황색 형광 단백질(예를 들어, mOrange, mKO, 쿠사비라-오렌지, 단량체성 쿠사비라-오렌지, mTangerine, tdTomato), 및 임의의 다른 적합한 형광 단백질을 포함한다. 태그의 예는 글루타티온-S-트랜스퍼라제(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질, 티오레독신(TRX), 폴리(NANP), 탠덤 친화도 정제(TAP: tandem affinity purification) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, 헤마글루티닌(HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 히스티딘(His), 비오틴 카르복실 담체 단백질(BCCP), 및 칼모듈린(calmodulin)을 포함한다.
Cas 단백질은 또한, 외인성 공여자 핵산 또는 표지된 핵산에 테터링(tether)될 수 있다. 이러한 테더링(즉, 물리적 연결)은 공유 상호작용 또는 비공유 상호작용을 통해 달성될 수 있으며, 테더링은 직접적일 수 있거나(예를 들어, 단백질 상의 시스테인 또는 라이신 잔기의 변형 또는 인테인(intein) 변형에 의해 달성될 수 있는 직접적 융합 또는 화학적 접합을 통해), 하나 이상의 개입 링커 또는 어댑터 분자, 예컨대 스트렙타비딘 또는 앱타머를 통해 달성될 수 있다. 예를 들어, 문헌[Pierce 등 (2005) Mini Rev. Med. Chem. 5(1):41-55]; 문헌[Duckworth 등 (2007) Angew. Chem. Int. Ed. Engl. 46(46):8819-8822]; 문헌[Schaeffer 및 Dixon (2009) Australian J. Chem. 62(10):1328-1332]; 문헌[Goodman 등 (2009) Chembiochem. 10(9):1551-1557]; 및 문헌[Khatwani 등 (2012) Bioorg. Med. Chem. 20(14):4532-4539]를 참조하며, 이들은 각각 그 전체가 모든 목적을 위해 참조에 의해 본원에 포함된다. 단백질-핵산 접합체를 합성하기 위한 비공유 전략은 비오틴-스트렙타비딘 및 니켈-히스티딘 방법을 포함한다. 공유 단백질-핵산 접합체는, 적절하게 작용화된 핵산 및 단백질을 광범위하게 다양한 화학을 사용하여 연결함으로써 합성될 수 있다. 이들 화학 중 일부는 단백질 표면 상의 아미노산 잔기(예를 들어, 라이신 아민 또는 시스테인 티올)에의 올리고뉴클레오타이드의 직접적 부착을 수반하는 한편, 다른 더욱 복잡한 계획은 단백질의 번역-후 변형 또는 촉매적 또는 반응성 단백질 도메인의 수반을 필요로 한다. 핵산에의 단백질의 공유 부착 방법은 예를 들어, 단백질 라이신 또는 시스테인 잔기에의 올리고뉴클레오타이드의 화학적 가교, 발현된 단백질-리게이션, 화학효소적 방법, 및 포토앱타머(photoaptamer)의 사용을 포함할 수 있다. 외인성 공여자 핵산 또는 표지된 핵산은 Cas 단백질 내의 C-말단, N-말단에, 또는 내부 영역에 테터링될 수 있다. 일례에서, 외인성 공여자 핵산 또는 표지된 핵산은 Cas 단백질의 C-말단 또는 N-말단에 테터링된다. 마찬가지로, Cas 단백질은 외인성 공여자 핵산 또는 표지된 핵산 내의 5' 단부, 3' 단부에, 또는 내부 영역에 테터링될 수 있다. 다시 말해, 외인성 공여자 핵산 또는 표지된 핵산은 임의의 배향 및 극성으로 테터링될 수 있다. 예를 들어, Cas 단백질은 외인성 공여자 핵산 또는 표지된 핵산 내의 5' 단부 또는 3' 단부에 테터링될 수 있다.
Cas 단백질은 임의의 형태로 제공될 수 있다. 예를 들어, Cas 단백질은 단백질, 예컨대 gRNA와 복합체화된 Cas 단백질의 형태로 제공될 수 있다. 대안적으로, Cas 단백질은 Cas 단백질을 인코딩하는 핵산, 예컨대 RNA(예를 들어, 메신저 RNA(mRNA)) 또는 DNA의 형태로 제공될 수 있다. 선택적으로, Cas 단백질을 인코딩하는 핵산은 특정 세포 또는 유기체에서 단백질로의 효율적인 번역을 위해 코돈 최적화될 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 또는 임의의 다른 관심 숙주 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. Cas 단백질을 인코딩하는 핵산이 세포 내로 도입될 때, 상기 Cas 단백질은 세포에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다.
mRNA로서 제공된 Cas 단백질은 향상된 안정성 및/또는 면역원성 특성을 위해 변형될 수 있다. 변형은 mRNA 내의 하나 이상의 뉴클레오사이드에 이루어질 수 있다. mRNA 핵염기에 대한 화학적 변형의 예는 슈도우리딘, 1-메틸-슈도우리딘, 및 5-메틸-시티딘을 포함한다. 예를 들어, N1-메틸 슈도우리딘을 함유하는 캡핑(capped)되고 폴리아데닐화된 Cas mRNA가 사용될 수 있다. 마찬가지로, Cas mRNA는 동의 코돈을 사용한 우리딘의 결핍에 의해 변형될 수 있다.
Cas 단백질을 인코딩하는 핵산은 세포의 게놈에 안정하게 통합되고 상기 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 대안적으로, Cas 단백질을 인코딩하는 핵산은 발현 작제물에서 프로모터에 작동적으로 연결될 수 있다. 발현 작제물은 관심 유전자 또는 다른 핵산 서열(예를 들어, Cas 유전자)의 발현을 지시할 수 있는 임의의 핵산 작제물을 포함하고, 이는 이러한 관심 핵산 서열을 표적 세포로 이전시킬 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 gRNA를 인코딩하는 DNA를 포함하는 벡터에 존재할 수 있다. 대안적으로, 이는, gRNA를 인코딩하는 DNA를 포함하는 벡터로부터 별개인 벡터 또는 플라스미드에 존재할 수 있다. 발현 작제물에 사용될 수 있는 프로모터는 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유류 세포, 비-인간 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 만능성 세포, 배아 줄기(ES)세포, 성인 줄기세포, 발달 제약 전구 세포(progenitor cell), 유도 만능 줄기(iPS)세포, 또는 1-세포 단계 배아 중 하나 이상에서 활성인 프로모터를 포함한다. 이러한 프로모터는 예를 들어, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 선택적으로, 프로모터는 하나의 방향에서 Cas 단백질과 다른 방향에서 가이드 RNA 둘 다의 발현을 구동하는 양방향적(bidirectional) 프로모터일 수 있다. 이러한 양방향적 프로모터는 (1) 3개의 외부 제어 요소를 함유하는 완전한 종래의 일방향적 Pol III 프로모터: 원위부 서열 요소(DSE), 근위부 서열 요소(PSE), 및 TATA 박스; 및 (2) 역배향에서 DSE의 5' 말단에 융합된 TATA 박스 및 PSE를 포함하는 제2 기본(basic) Pol III 프로모터로 구성될 수 있다. 예를 들어, H1 프로모터에서, DSE는 PSE 및 TATA 박스에 인접하고, 프로모터는, U6 프로모터로부터 유래된 TATA 박스 및 PSE를 부착함으로써 역방향에서의 전사가 제어되는 하이브리드 프로모터를 생성함으로써 양방향적으로 될 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0074535호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas 단백질을 인코딩하는 유전자 및 가이드 RNA를 발현하기 위한 양방향적 프로모터의 사용은 동시에, 전달을 용이하게 하기 위해 컴팩트(compact) 발현 카세트의 발생을 가능하게 한다.
가이드 RNA. "가이드 RNA" 또는 "gRNA"는, Cas 단백질(예를 들어, Cas9 단백질)에 결합하고 상기 Cas 단백질을 표적 DNA 내의 특정 위치로 표적화하는 RNA 분자이다. 가이드 RNA는 2개의 분절을 포함할 수 있다: "DNA-표적화 분절" 및 "단백질-결합 분절". "분절"은 분자의 구획 또는 영역, 예컨대 RNA 내 뉴클레오타이드의 인접 스트레치를 포함한다. 일부 gRNA, 예컨대 Cas9에 대한 gRNA는 2개의 별개의 RNA 분자를 포함할 수 있다: "활성자-RNA"(예를 들어, tracrRNA) 및 "표적자(targeter)-RNA"(예를 들어, CRISPR RNA 또는 crRNA). 다른 gRNA는 단일 RNA 분자(단일 RNA 폴리뉴클레오타이드)이며, 이는 또한 "단일-분자 gRNA", "단일-가이드 RNA", 또는 "sgRNA"라고도 할 수 있다. 예를 들어, 국제공개 WO 2013/176772호, WO 2014/065596호, WO 2014/089290호, WO 2014/093622호, WO 2014/099750호, WO 2013/142578호, 및 WO 2014/131833호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. Cas9의 경우, 예를 들어, 단일-가이드 RNA는 tracrRNA에(예를 들어, 링커를 통해) 융합된 crRNA를 포함할 수 있다. Cpf1의 경우, 예를 들어, 표적 서열에의 결합을 달성하기 위해 단지 crRNA가 필요하다. 용어 "가이드 RNA" 및 "gRNA"는 이중-분자(즉, 모듈형(modular)) gRNA와 단일-분자 gRNA 둘 다 포함한다.
예시적인 2-분자 gRNA는 crRNA-유사("CRISPR RNA" 또는 "표적자-RNA" 또는 "crRNA" 또는 "crRNA 반복부") 분자 및 상응하는 tracrRNA-유사("trans-작용 CRISPR RNA" 또는 "활성자-RNA" 또는 "tracrRNA") 분자를 포함한다. crRNA는 gRNA의 DNA-표적화 분절(단일-가닥) 및 gRNA의 단백질-결합 분절의 dsRNA 듀플렉스 중 하나의 절반을 형성하는 뉴클레오타이드의 스트레치 둘 다 포함한다. DNA-표적화 분절의 다운스트림(3')에 위치한 crRNA 테일의 일례는 GUUUUAGAGCUAUGCU(SEQ ID NO: 84)를 포함하거나, 본질적으로 이로 구성되거나, 이로 구성된다. 본원에 개시된 임의의 DNA-표적화 분절은 SEQ ID NO: 84의 5' 단부에 접합되어, crRNA를 형성할 수 있다.
상응하는 tracrRNA(활성자-RNA)는, gRNA의 단백질-결합 분절의 dsRNA 듀플렉스 중 다른 절반을 형성하는 뉴클레오타이드의 스트레치를 포함한다. crRNA의 뉴클레오타이드의 스트레치는 tracrRNA의 뉴클레오타이드의 스트레치에 상보적이고 이와 혼성화하여, gRNA의 단백질-결합 도메인의 dsRNA 듀플렉스를 형성한다. 이와 같이, 각각의 crRNA는 상응하는 tracrRNA를 갖고 있다고 할 수 있다. tracrRNA 서열의 일례는 AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO: 85)를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다.
crRNA와 tracrRNA 둘 다 필요한 시스템에서, crRNA 및 상응하는 tracrRNA는 혼성화하여 gRNA를 형성한다. crRNA만 필요한 시스템에서, crRNA는 gRNA일 수 있다. crRNA는, 표적 DNA의 상보적 가닥에 혼성화하는 단일-가닥 DNA-표적화 분절을 추가로 제공한다. 세포 내에서의 변형에 사용된다면, 주어진 crRNA 또는 tracrRNA 분자의 정확한 서열은, RNA 분자가 사용될 종에 특이적이도록 설계될 수 있다. 예를 들어, 문헌[Mali 등 (2013) Science 339:823-826]; 문헌[Jinek 등 (2012) Science 337:816-821]; 문헌[Hwang 등 (2013) Nat. Biotechnol. 31:227-229]; 문헌[Jiang 등 (2013) Nat. Biotechnol. 31:233-239]; 및 문헌[Cong 등 (2013) Science 339:819-823]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
주어진 gRNA의 DNA-표적화 분절(crRNA)은, 하기에서 더욱 상세히 기재된 바와 같이 표적 DNA의 상보적 가닥 상의 서열에 상보적인 뉴클레오타이드 서열을 포함한다. gRNA의 DNA-표적화 분절은 혼성화(즉, 염기쌍 형성(base pairing))을 통해 서열-특이적 방식으로 표적 DNA와 상호작용한다. 이와 같이, DNA-표적화 분절의 뉴클레오타이드 서열은 다양할 수 있고, gRNA 및 표적 DNA가 상호작용할 상기 표적 DNA 내에서의 위치를 결정한다. 대상체 gRNA의 DNA-표적화 분절은 표적 DNA 내의 임의의 요망되는 서열에 혼성화하도록 변형될 수 있다. 천연 발생 crRNA는 CRISPR/Cas 시스템 및 유기체에 따라 상이하지만, 종종 21 내지 46개 뉴클레오타이드 길이의 2개의 직접 반복부(DR: direct repeat)의 측면에 있는 21 내지 72개 뉴클레오타이드 길이의 표적화 분절을 함유한다(예를 들어, 국제공개 WO 2014/131833호를 참조하며, 이는 그 전체가 모든 목적을 위해 참조로서 본원에 포함됨). 에스. 피오게네스의 경우, DR은 36개 뉴클레오타이드 길이이고, 표적화 분절은 30개 뉴클레오타이드 길이이다. 3' 위치한 DR은 상응하는 tracrRNA에 상보적이고 이와 혼성화하며, 이는 다시 Cas 단백질에 결합한다.
DNA-표적화 분절은 예를 들어, 적어도 약 12, 15, 17, 18, 19, 20, 25, 30, 35, 또는 40개 뉴클레오타이드 길이를 가질 수 있다. 이러한 DNA-표적화 분절은 예를 들어, 약 12 내지 약 100개, 약 12 내지 약 80개, 약 12 내지 약 50개, 약 12 내지 약 40개, 약 12 내지 약 30개, 약 12 내지 약 25개, 약 12 내지 약 20개 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, DNA 표적화 분절은 약 15 내지 약 25개 뉴클레오타이드(예를 들어, 약 17 내지 약 20개 뉴클레오타이드, 또는 약 17, 18, 19, 또는 20개 뉴클레오타이드)일 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0024523호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 에스. 피오게네스로부터의 Cas9의 경우, 전형적인 DNA-표적화 분절은 16 내지 20개 뉴클레오타이드 길이 또는 17 내지 20개 뉴클레오타이드 길이이다. 에스. 아우레우스로부터의 Cas9의 경우, 전형적인 DNA-표적화 분절은 21 내지 23개 뉴클레오타이드 길이이다. Cpf1의 경우, 전형적인 DNA-표적화 분절은 적어도 16개 뉴클레오타이드 길이 또는 적어도 18개 뉴클레오타이드 길이이다.
TracrRNA는 임의의 형태(예를 들어, 전장 tracrRNA 또는 활성 부분 tracrRNA) 및 다양한 길이일 수 있다. 이들은 1차 전사물 또는 가공된 형태를 포함할 수 있다. 예를 들어, tracrRNA(단일-가이드 RNA의 파트로서, 또는 2-분자 gRNA의 파트와 별개의 분자로서)는 야생형 tracrRNA 서열 중 모두 또는 부분(예를 들어, 야생형 tracrRNA 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85개 이상 또는 약 이를 초과하는 뉴클레오타이드)을 포함하거나, 본질적으로 이로 구성되거나, 이로 구성될 수 있다. 에스. 피오게네스로부터의 야생형 tracrRNA 서열은 171-뉴클레오타이드, 89-뉴클레오타이드, 75-뉴클레오타이드, 및 65-뉴클레오타이드 버전을 포함한다. 예를 들어, 문헌[Deltcheva 등 (2011) Nature 471:602-607]; 국제공개 WO 2014/093661호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 단일-가이드 RNA(sgRNA) 내의 tracrRNA의 예는 sgRNA의 +48, +54, +67, 및 +85 버전 내에서 발견되는 tracrRNA 분절을 포함하며, 여기서, "+n"은 야생형 tracrRNA의 +n개 이하의 뉴클레오타이드가 sgRNA에 포함됨을 나타낸다. 미국 특허 제8,697,359호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
가이드 RNA의 DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 적어도 60%(예를 들어, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)일 수 있다. DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 약 20개 인접 뉴클레오타이드에 걸쳐 적어도 60%일 수 있다. 일례로, DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 표적 DNA의 상보적 가닥의 5' 단부에서의 약 14개 인접 뉴클레오타이드에 걸쳐 적어도 100%일 수 있고 나머지에 걸쳐 0%만큼 낮을 수 있다. 이러한 경우, DNA-표적화 분절은 14개 뉴클레오타이드 길이인 것으로 여겨질 수 있다. 또 다른 예로, DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 표적 DNA의 상보적 가닥의 5' 단부에서의 7개 인접 뉴클레오타이드에 걸쳐 적어도 100%일 수 있고 나머지에 걸쳐 0%만큼 낮을 수 있다. 이러한 경우, DNA-표적화 분절은 7개 뉴클레오타이드 길이인 것으로 여겨질 수 있다. 일부 가이드 RNA에서, DNA-표적화 분절 내의 적어도 17개 뉴클레오타이드는 표적 DNA의 상보적 가닥에 상보적이다. 예를 들어, DNA-표적화 분절은 20개 뉴클레오타이드 길이일 수 있고, 표적 DNA의 상보적 가닥과 1, 2 또는 3개의 미스매치를 포함할 수 있다. 일례에서, 미스매치는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 서열에 상응하는 상보적 가닥의 영역에 인접해 있지 않다(즉, PAM 서열의 역보체(reverse complement))(예를 들어, 미스매치는 가이드 RNA의 DNA-표적화 분절의 5' 단부에 있거나, 미스매치는 PAM 서열에 상응하는 상보적 가닥의 영역으로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 염기쌍만큼 떨어져 있음).
gRNA의 단백질-결합 분절은, 서로 상보적인 뉴클레오타이드의 2개 스트레치(stretch)를 포함할 수 있다. 단백질-결합 분절의 상보적 뉴클레오타이드는 혼성화하여, 이중-가닥 RNA 듀플렉스(dsRNA)를 형성한다. 대상체 gRNA의 단백질-결합 분절은 Cas 단백질과 상호작용하고, gRNA는 결합된 Cas 단백질을, DNA-표적화 분절을 통해 표적 DNA 내의 특정 뉴클레오타이드 서열로 안내한다.
단일-가이드 RNA는 DNA-표적화 분절 및 스캐폴드 서열(즉, 가이드 RNA의 단백질-결합 또는 Cas-결합 서열)을 포함할 수 있다. 예를 들어, 이러한 가이드 RNA는 3' 스캐폴드 서열에 접합된 5' DNA-표적화 분절을 가질 수 있다. 예시적인 스캐폴드 서열은: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(버전 1; SEQ ID NO: 86); GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(버전 2; SEQ ID NO: 87); GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(버전 3; SEQ ID NO: 88); 및 GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(버전 4; SEQ ID NO: 89)를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 본원에 개시된 임의의 가이드 RNA 표적 서열을 표적화하는 가이드 RNA는 예를 들어, 가이드 RNA의 3' 단부 상의 임의의 예시적인 가이드 RNA 스캐폴드 서열에 융합된 가이드 RNA의 5' 단부 상에 DNA-표적화 분절을 포함할 수 있다. 즉, 본원에 개시된 임의의 DNA-표적화 분절은 임의의 하나의 상기 스캐폴드 서열의 5' 단부에 접합되어, 단일 가이드 RNA(키메라 가이드 RNA)를 형성할 수 있다.
가이드 RNA는 추가의 바람직한 특질(예를 들어, 변형된 또는 조절된 안정성; 세포 내 표적화; 형광 표지에 의한 추적; 단백질 또는 단백질 복합체에 대한 결합 부위 등)을 제공하는 변형 또는 서열을 포함할 수 있다. 이러한 변형의 예는 예를 들어, 5' 캡(cap)(예를 들어, 7-메틸구아닐레이트 캡(m7G)); 3' 폴리아데닐화된 테일(즉, 3' 폴리(A) 테일); 리보스위치(riboswitch) 서열(예를 들어, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 가능하게 하기 위해); 안정성 제어 서열; dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열; RNA를 하위세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 서열; 추적을 제공하는 변형 또는 서열(예를 들어, 형광 분자에의 직접 접합, 형광 검출을 용이하게 하는 모이어티에의 접합, 형광 검출을 가능하게 하는 서열 등); 단백질(예를 들어, DNA 메틸트랜스퍼라제, DNA 데메틸라제(demethylase), 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함하여 DNA 상에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 및 이들의 조합을 포함한다. 변형의 다른 예는 조작된 스템 루프 듀플렉스 구조, 조작된 벌지(bulge) 영역, 스템 루프 듀플렉스 구조의 조작된 헤어핀 3', 또는 이들의 임의의 조합을 포함한다. 예를 들어, 미국 특허출원공개 US 2015/0376586호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 벌지는 crRNA-유사 영역 및 최소 tracrRNA-유사 영역으로 이루어진 듀플렉스 내의 뉴클레오타이드의 홑(unpaired) 영역일 수 있다. 벌지는, 듀플렉스의 하나의 면(side) 상에, X가 임의의 퓨린이고 Y가 반대 가닥 상의 뉴클레오타이드와 워블 쌍(wobble pair)을 형성할 수 있는 뉴클레오타이드일 수 있는 홑 5'-XXXY-3', 및 듀플렉스의 다른 면 상에 홑 뉴클레오타이드 영역을 포함할 수 있다.
비변형된 핵산은 분해에 취약할 수 있다. 외인성 핵산은 또한 선천적 면역 반응을 유도할 수 있다. 변형은 안정성을 도입하고 면역원성을 감소시키는 것을 도울 수 있다. 가이드 RNA는 예를 들어, 하기 중 하나 이상을 포함한, 변형된 뉴클레오사이드 및 변형된 뉴클레오타이드를 포함할 수 있다: (1) 포스포디에스테르 백본 연결부에서 비-연결 포스페이트 산소 중 하나 또는 둘 다 및/또는 연결 포스페이트 산소 중 하나 이상의 변경 또는 대체; (2) 리보스 당(sugar)의 구성원의 변경 또는 대체, 예컨대 리보스 당 상의 2' 하이드록실의 변경 또는 대체; (3) 데포스포(dephospho) 링커에 의한 포스페이트 모이어티의 대체; (4) 천연 발생 핵염기의 변형 또는 대체; (5) 리보스-포스페이트 백본의 대체 또는 변형; (6) 올리고뉴클레오타이드의 3' 단부 또는 5' 단부의 변형(예를 들어, 말단 포스페이트기의 제거, 변형 또는 대체 또는 모이어티의 접합); 및 (7) 당의 변형. 다른 가능한 가이드 RNA 변형은 우라실 또는 폴리-우라실 트랙트(tract)의 변형 또는 대체를 포함한다. 예를 들어, 국제공개 WO 2015/048577호 및 미국 특허출원공개 US 2016/0237455호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 유사한 변형은 Cas-인코딩 핵산, 예컨대 Cas mRNA에 대해 이루어질 수 있다.
일례로서, 가이드 RNA의 5' 또는 3' 단부에서의 뉴클레오타이드는 포스포로티오에이트 연결부를 포함할 수 있다(예를 들어, 염기는, 포스포로티오에이트기인 변형된 포스페이트기를 가질 수 있음). 예를 들어, 가이드 RNA는 가이드 RNA의 5' 및/또는 3' 단부의 2, 3, 또는 4개 말단 뉴클레오타이드 사이에 포스포로티오에이트 연결부를 포함할 수 있다. 또 다른 예로, 가이드 RNA의 5' 및/또는 3' 단부에서의 뉴클레오타이드는 2'-O-메틸 변형을 가질 수 있다. 예를 들어, 가이드 RNA는 가이드 RNA의 5' 및/또는 3' 단부(예를 들어, 5' 단부)의 2, 3, 또는 4개 말단 뉴클레오타이드에서 2'-O-메틸 변형을 포함할 수 있다. 예를 들어, 국제공개 WO 2017/173054 A1호 및 문헌[Finn 등 (2018) Cell Reports 22:1-9]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 하나의 구체적인 예에서, 가이드 RNA는 처음 3개 5' 및 3' 말단 RNA 잔기에 2'-O-메틸 유사체 및 3' 포스포로티오에이트 뉴클레오타이드간 연결부를 포함한다. 또 다른 구체적인 예에서, 가이드 RNA는, Cas9 단백질과 상호작용하지 않는 모든 2'OH 기가 2'-O-메틸 유사체로 대체되도록 변형되며, Cas9와의 최소 상호작용을 갖는 가이드 RNA의 테일(tail) 영역은 5' 및 3' 포스포로티오에이트 뉴클레오타이드간 연결부로 변형된다. 예를 들어, 문헌[Yin 등 (2017) Nat. Biotech. 35(12):1179-1187]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 변형된 가이드 RNA의 다른 예는 예를 들어, WO 2018/107028 A1호에 제공되어 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
가이드 RNA는 임의의 형태로 제공될 수 있다. 예를 들어, gRNA는 2개의 분자(별개의 crRNA 및 tracrRNA)로서 또는 1개의 분자(sgRNA)로서 RNA의 형태로, 그리고 선택적으로 Cas 단백질과의 복합체의 형태로 제공될 수 있다. gRNA는 또한, 상기 gRNA를 인코딩하는 DNA의 형태로 제공될 수 있다. gRNA를 인코딩하는 DNA는 단일 RNA 분자(sgRNA) 또는 별개의 RNA 분자(예를 들어, 별개의 crRNA 및 tracrRNA)를 인코딩할 수 있다. 후자의 경우, gRNA를 인코딩하는 DNA는 1개의 DNA 분자로서 또는 crRNA 및 tracrRNA를 각각 인코딩하는 별개의 DNA 분자로서 제공될 수 있다.
gRNA가 DNA 형태로 제공될 때, 상기 gRNA는 세포에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다. gRNA를 인코딩하는 DNA는 세포의 게놈 내로 안정하게 통합되고 상기 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 대안적으로, gRNA를 인코딩하는 DNA는 발현 작제물에서 프로모터에 작동적으로 연결될 수 있다. 예를 들어, gRNA를 인코딩하는 DNA는 이종성 핵산, 예컨대 Cas 단백질을 인코딩하는 핵산을 포함하는 벡터에 존재할 수 있다. 대안적으로, 이는, Cas 단백질을 인코딩하는 핵산을 포함하는 벡터로부터 별개인 벡터 또는 플라스미드에 존재할 수 있다. 이러한 발현 작제물에 사용될 수 있는 프로모터는 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유류 세포, 비-인간 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 토끼 세포, 만능성 세포, 배아 줄기(ES) 세포, 성인 줄기세포, 발달 제약 전구 세포, 유도 만능 줄기(iPS) 세포, 또는 1-세포 단계 배아 중 하나 이상에서 활성인 프로모터를 포함한다. 이러한 프로모터는 예를 들어, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 이러한 프로모터는 또한 예를 들어, 양방향성(bidirectional) 프로모터일 수 있다. 적합한 프로모터의 구체적인 예는 RNA 폴리머라제 III 프로모터, 예컨대 인간 U6 프로모터, 래트 U6 폴리머라제 III 프로모터, 또는 마우스 U6 폴리머라제 III 프로모터를 포함한다.
대안적으로, gRNA는 다양한 다른 방법에 의해 제조될 수 있다. 예를 들어, gRNA는 예를 들어, T7 RNA 폴리머라제를 사용하여 시험관내 전사에 의해 제조될 수 있다(예를 들어, 국제공개 WO 2014/089290호 및 WO 2014/065596호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다). 가이드 RNA는 또한, 화학적 합성에 의해 제조된 합성적으로 생성된 분자일 수 있다.
가이드 RNA 표적 서열. 가이드 RNA에 대한 표적 DNA는, 결합에 대해 충분한 조건이 존재한다면 gRNA의 DNA-표적화 분절이 결합할 DNA에 존재하는 핵산 서열을 포함한다. 적합한 DNA/RNA 결합 조건은 세포에 정상적으로 존재하는 생리학적 조건을 포함한다. 다른 적합한 DNA/RNA 결합 조건(예를 들어, 세포-무함유 시스템에서의 조건)은 당업계에 알려져 있다(예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 3rd Ed.(Sambrook 등, Harbor Laboratory Press 2001)]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). gRNA에 상보적이고 이와 혼성화하는 표적 DNA의 가닥은 "상보적 가닥"이라고 할 수 있으며, "상보적 가닥"에 상보적인(따라서 Cas 단백질 또는 gRNA에 상보적이지 않은) 표적 DNA의 가닥은 "비상보적 가닥" 또는 "주형 가닥"이라고 할 수 있다.
표적 DNA는, 가이드 RNA가 혼성화하는 상보적 가닥 상의 서열과, 비-상보적 가닥 상의 상응하는 서열(예를 들어, 프로토스페이서 인접 모티프(PAM)에 인접함) 둘 다 포함한다. 본원에 사용된 바와 같이 용어 "가이드 RNA 표적 서열"은 구체적으로, 가이드 RNA가 상보적 가닥 상에서 혼성화하는 서열에 상응하는 비-상보적 가닥 상의 서열(즉, 이의 역보체)을 지칭한다. 다시 말해, 가이드 RNA 표적 서열은 PAM에 인접한 비-상보적 가닥 상의 서열을 지칭한다(예를 들어, Cas9의 경우 PAM의 업스트림 또는 5'). 가이드 RNA 표적 서열은 가이드 RNA의 DNA-표적화 분절에 동등하지만, 우라실 대신에 티민을 갖는다. 일례로서, SpCas9 효소에 대한 가이드 RNA 표적 서열은 비-상보적 가닥 상의 5'-NGG-3' PAM의 업스트림 서열을 지칭할 수 있다. 가이드 RNA는 표적 DNA의 상보적 가닥에 대해 상보성을 갖도록 설계되며, 여기서, 가이드 RNA의 DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 혼성화는 CRISPR 복합체의 형성을 촉진한다. 혼성화를 야기하고 CRISPR 복합체의 형성을 촉진하기에 충분한 상보성이 존재한다면, 완전 상보성이 본질적으로 필요한 것은 아니다. 가이드 RNA가 본원에서 가이드 RNA 표적 서열을 표적화하는 것으로 지칭된다면, 의미하는 것은, 상기 가이드 RNA가, 비-상보적 가닥 상의 가이드 RNA 표적 서열의 역보체인 표적 DNA의 상보적 가닥 서열에 혼성화한다는 것이다.
표적 DNA 또는 가이드 RNA 표적 서열은 임의의 폴리뉴클레오타이드를 포함할 수 있으며, 예를 들어, 세포의 핵 또는 세포질에 또는 세포의 세포소기관, 예컨대 미토콘드리아 또는 엽록체 내에 위치할 수 있다. 표적 DNA 또는 가이드 RNA 표적 서열은 세포에 대해 내인성 또는 외인성인 임의의 핵산 서열일 수 있다. 가이드 RNA 표적 서열은 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 서열)일 수 있거나, 둘 다 포함할 수 있다.
Cas 단백질에 의한 표적 DNA의 부위-안내 결합 및 절단은 (i) 가이드 RNA와 표적 DNA의 상보적 가닥 사이의 염기쌍-형성 상보성, 및 (ii) 표적 DNA의 비-상보적 가닥에서 프로토스페이서 인접 모티프(PAM)라고 하는 짧은 모티프 둘 다에 의해 결정된 위치에서 발생할 수 있다. PAM은 가이드 RNA 표적 서열의 측면에 있을 수 있다. 선택적으로, 가이드 RNA 표적 서열은 3' 단부에서 PAM의 측면에 있을 수 있다(예를 들어, Cas9의 경우). 대안적으로, 가이드 RNA 표적 서열은 5' 단부에서 PAM의 측면에 있을 수 있다(예를 들어, Cpf1의 경우). 예를 들어, Cas 단백질의 절단 부위는 PAM 서열(예를 들어, 가이드 RNA 표적 서열 내)의 약 1 내지 약 10개, 또는 약 2 내지 약 5개 염기쌍(예를 들어, 3개 염기쌍)일 수 있다. SpCas9의 경우, PAM 서열(즉, 비-상보적 가닥 상)은 5'-N1GG-3'일 수 있으며, 여기서, N1은 임의의 DNA 뉴클레오타이드이며, PAM은 표적 DNA의 비-상보적 가닥 상의 가이드 RNA 표적 서열의 즉시(immediately) 3'이다. 이와 같이, 상보적 가닥(즉, 역보체) 상의 PAM에 상응하는 서열은 5'-CCN2-3'일 것이며, 여기서, N2는 임의의 DNA 뉴클레오타이드이며 가이드 RNA의 DNA-표적화 분절이 표적 DNA의 상보적 가닥 상에서 혼성화하는 서열의 즉시 5'이다. 일부 이러한 경우, N1 및 N2는 상보적일 수 있고, N1- N2 염기쌍은 임의의 염기쌍일 수 있다(예를 들어, N1=C 및 N2=G; N1=G 및 N2=C; N1=A 및 N2=T; 또는 N1=T, 및 N2=A). 에스. 아우레우스로부터의 Cas9의 경우, PAM은 NNGRRT 또는 NNGRR일 수 있으며, 여기서, N은 A, G, C, 또는 T일 수 있고, R은 G 또는 A일 수 있다. 씨. 예유니(C. jejuni)로부터의 Cas9의 경우, PAM은 예를 들어, NNNNACAC 또는 NNNNRYAC일 수 있으며, 여기서, N은 A, G, C, 또는 T일 수 있고, R은 G 또는 A일 수 있다. 일부 경우(예를 들어, FnCpf1의 경우), PAM 서열은 5' 단부의 업스트림에 있을 수 있고 서열 5'-TTN-3'를 가질 수 있다.
가이드 RNA 표적 서열의 일례는, SpCas9 단백질에 의해 인식되는 NGG 모티프 바로 앞의 20-뉴클레오타이드 DNA 서열이다. 예를 들어, 가이드 RNA 표적 서열 + PAM의 2개 예는 GN19NGG(SEQ ID NO: 90) 또는 N20NGG(SEQ ID NO: 91)이다. 예를 들어, 국제공개 WO 2014/165825호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 5' 단부에서의 구아닌은 세포에서 RNA 폴리머라제에 의한 전사를 용이하게 할 수 있다. 가이드 RNA 표적 서열 + PAM의 다른 예는 시험관내에서 T7 폴리머라제에 의한 효율적인 전사를 용이하게 하기 위해 5' 단부에 2개의 구아닌 뉴클레오타이드(예를 들어, GGN20NGG; SEQ ID NO: 92)를 포함할 수 있다. 예를 들어, 국제공개 WO 2014/065596호를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 다른 가이드 RNA 표적 서열 + PAM은, 5' G 또는 GG 및 3' GG 또는 NGG를 포함하여 SEQ ID NO: 90-92의 4개 내지 22개 뉴클레오타이드 길이를 가질 수 있다. 더욱 다른 가이드 RNA 표적 서열 + PAM은 SEQ ID NO: 90-92의 14개 내지 20개 뉴클레오타이드 길이를 가질 수 있다.
표적 DNA에 혼성화된 CRISPR 복합체의 형성은 가이드 RNA 표적 서열에 상응하는 영역 내에서 또는 그 부근에서 표적 DNA의 하나의 가닥 또는 양쪽 가닥의 절단을 초래할 수 있다(즉, 표적 DNA의 비-상보적 가닥 상의 가이드 RNA 표적 서열, 및 가이드 RNA가 혼성화하는 상보적 가닥 상의 역보체). 예를 들어, 절단 부위는 가이드 RNA 표적 서열 내에 있을 수 있다(예를 들어, PAM 서열에 비해 정의된 위치에서). "절단 부위"는, Cas 단백질이 단일-가닥 절단부 또는 이중-가닥 절단부를 생성하는 표적 DNA의 위치를 포함한다. 절단 부위는 이중-가닥 DNA 중 단지 하나의 가닥 상에 존재할 수 있거나(예를 들어, 닉카제(nickase)가 사용될 때) 또는 2개 가닥 모두 상에 존재할 수 있다. 절단 부위는 양쪽 가닥 상의 동일한 위치에 있을 수 있거나(평활 단부를 생성함; 예를 들어, Cas9), 각각의 가닥 상의 상이한 위치에 있을 수 있다(엇갈린 단부(즉, 오버행)를 생성함; 예를 들어, Cpf1). 엇갈린 단부는 예를 들어, 각각이 상이한 가닥 상의 상이한 절단 부위에서 단일-가닥 절단부를 생성하여 이중-가닥 절단부를 생성하는 2개의 Cas 단백질을 사용함으로써 생성될 수 있다. 예를 들어, 제1 닉카제는 이중-가닥 DNA(dsDNA)의 제1 가닥 상에 단일-가닥 절단부를 생성할 수 있고, 제2 닉카제는 오버행 서열이 생성되도록 dsDNA의 제2 가닥 상에 단일-가닥 절단부를 생성할 수 있다. 일부 경우, 제1 가닥 상의 가이드 RNA 표적 서열 또는 닉카제의 절단 부위는 제2 가닥 상의 가이드 RNA 표적 서열 또는 닉카제의 절단 부위로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, 또는 1,000개 염기쌍만큼 분리된다.
(3) 인간 TTR 유전자를 표적화하는 외인성 공여자 핵산
본원에 개시된 방법 및 조성물은 뉴클레아제 제제를 이용한 인간화 TTR 좌위의 절단 후 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 변형시키기 위해 외인성 공여자 핵산을 이용할 수 있다. 이러한 방법에서, 뉴클레아제 제제 단백질은 인간화 TTR 좌위를 절단하여 단일-가닥 절단부(닉) 또는 이중-가닥 절단부를 생성하고, 외인성 공여자 핵산은 비-상동성 말단 접합(NHEJ)-매개 리게이션을 통해 또는 상동성-지시 수선 사건을 통해 인간화 TTR 좌위와 조합된다. 선택적으로, 외인성 공여자 핵산을 이용한 수선은 뉴클레아제 표적 서열을 제거하거나 교란시켜, 표적화되었던 대립유전자는 뉴클레아제 제제에 의해 재-표적화될 수 없다.
외인성 공여자 핵산은 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함할 수 있으며, 이들 핵산은 단일-가닥 또는 이중-가닥일 수 있고, 이들 핵산은 선형 또는 원형 형태일 수 있다. 예를 들어, 외인성 공여자 핵산은 단일-가닥 올리고데옥시뉴클레오타이드(ssODN)일 수 있다. 예를 들어, 문헌[Yoshimi (2016) Nat. Commun. 7:10431]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 예시적인 외인성 공여자 핵산은 약 50개 뉴클레오타이드 내지 약 5 kb 길이이거나, 약 50개 뉴클레오타이드 내지 약 3 kb 길이이거나, 약 50개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 길이이다. 다른 예시적인 외인성 공여자 핵산은 약 40 내지 약 200개 뉴클레오타이드 길이이다. 예를 들어, 외인성 공여자 핵산은 약 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190, 또는 190-200개 뉴클레오타이드 길이일 수 있다. 대안적으로, 외인성 공여자 핵산은 약 50-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 또는 900-1000개 뉴클레오타이드 길이일 수 있다. 대안적으로, 외인성 공여자 핵산은 약 1-1.5, 1.5-2, 2-2.5, 2.5-3, 3-3.5, 3.5-4, 4-4.5, 또는 4.5-5 kb 길이일 수 있다. 대안적으로, 외인성 공여자 핵산은 예를 들어, 5 kb, 4.5 kb, 4 kb, 3.5 kb, 3 kb, 2.5 kb, 2 kb, 1.5 kb, 1 kb, 900개 뉴클레오타이드, 800개 뉴클레오타이드, 700개 뉴클레오타이드, 600개 뉴클레오타이드, 500개 뉴클레오타이드, 400개 뉴클레오타이드, 300개 뉴클레오타이드, 200개 뉴클레오타이드, 100개 뉴클레오타이드, 또는 50개 뉴클레오타이드 이하의 길이일 수 있다. 외인성 공여자 핵산(예를 들어, 표적화 벡터)은 또한 더 길 수 있다.
일례에서, 외인성 공여자 핵산은 약 80개 뉴클레오타이드 내지 약 200개 뉴클레오타이드 길이인 ssODN이다. 또 다른 예에서, 외인성 공여자 핵산은 약 80개 뉴클레오타이드 내지 약 3 kb 길이인 ssODN이다. 이러한 ssODN은 예를 들어, 각각 약 40개 뉴클레오타이드 내지 약 60개 뉴클레오타이드 길이인 상동성 아암을 가질 수 있다. 이러한 ssODN은 또한, 예를 들어, 각각 약 30개 뉴클레오타이드 내지 100개 뉴클레오타이드 길이인 상동성 아암을 가질 수 있다. 상동성 아암은 대칭적일 수 있거나(예를 들어, 각각 40개 뉴클레오타이드 또는 각각 60개 뉴클레오타이드 길이), 이들은 비대칭적일 수 있다(예를 들어, 36개 뉴클레오타이드 길이인 하나의 상동성 아암 및 91개 뉴클레오타이드 길이인 하나의 상동성 아암).
외인성 공여자 핵산은 추가의 바람직한 특질(예를 들어, 변형된 또는 조절된 안정성; 형광 표지에 의한 추적 또는 검출; 단백질 또는 단백질 복합체에 대한 결합 부위 등)을 제공하는 변형 또는 서열을 포함할 수 있다. 외인성 공여자 핵산은 하나 이상의 형광 표지, 정제 태그, 에피토그 태그, 또는 이들의 조합을 포함할 수 있다. 예를 들어, 외인성 공여자 핵산은 하나 이상의 형광 표지(예를 들어, 형광 단백질 또는 다른 형광단 또는 염료), 예컨대 적어도 1, 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개의 형광 표지를 포함할 수 있다. 예시적인 형광 표지는 형광단, 예컨대 플루오레세인(fluorescein)(예를 들어, 6-카르복시플루오레세인(6-FAM)), 텍사스 레드(Texas Red), HEX, Cy3, Cy5, Cy5.5, 퍼시픽 블루(Pacific Blue), 5-(및-6)-카르복시테트라메틸로다민(TAMRA), 및 Cy7을 포함한다. 광범위한 범위의 형광 염료는 올리고뉴클레오타이드를 표지화하기 위해 상업적으로 입수 가능하다(예를 들어, Integrated DNA Technologies로부터). 이러한 형광 표지(예를 들어, 내부 형광 표지)는 예를 들어, 외인성 공여자 핵산의 단부와 상용성인 돌출(protruding) 단부를 갖는 절단된 표적 핵산 내로 직접적으로 통합되었던 외인성 공여자 핵산을 검출하는 데 사용될 수 있다. 표지 또는 태그는 외인성 공여자 핵산 내의 5' 단부, 3' 단부에, 또는 내부 영역에 있을 수 있다. 예를 들어, 외인성 공여자 핵산은 5 단부에서 Integrated DNA Technologies(5'IRDYE®700)로부터의 IR700 형광단과 접합될 수 있다.
외인성 공여자 핵산은 또한, 베타-슬립 돌연변이를 포함하는 인간화 TTR에 통합될 DNA의 분절을 포함하는 핵산 삽입물을 포함할 수 있다. 인간화 TTR 좌위에서 핵산 삽입물의 통합은 상기 인간화 TTR 좌위에의 관심 핵산 서열의 첨가, 상기 인간화 TTR 좌위에서 관심 핵산 서열의 결실, 또는 상기 인간화 TTR 좌위에서 관심 핵산 서열의 대체를 초래할 수 있다. 일부 외인성 공여자 핵산은 인간화 TTR 좌위에서 임의의 상응하는 결실 없이 상기 인간화 TTR 좌위에서의 핵산 삽입물의 삽입을 위해 설계된다. 다른 외인성 공여자 핵산은 핵산 삽입물의 임의의 상응하는 삽입 없이 인간화 TTR 좌위에서 관심 핵산 서열을 결실시키도록 설계된다. 더욱 다른 외인성 공여자 핵산은 인간화 TTR 좌위에서 관심 핵산 서열을 결실시키고 이를 핵산 삽입물로 대체하기 위해 설계된다.
결실되고/거나 대체되는 인간화 TTR 좌위에서 핵산 삽입물 또는 상응하는 핵산은 다양한 길이일 수 있다. 결실되고/거나 대체되는 인간화 TTR 좌위에서 예시적인 핵산 삽입물 또는 상응하는 핵산은 약 1개 뉴클레오타이드 내지 약 5 kb 길이이거나, 약 1개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 길이이다. 예를 들어, 결실되고/거나 대체되는 인간화 TTR 좌위에서 핵산 삽입물 또는 상응하는 핵산은 약 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190, 또는 190-120개 뉴클레오타이드 길이일 수 있다. 마찬가지로, 결실되고/거나 대체되는 인간화 TTR 좌위에서 핵산 삽입물 또는 상응하는 핵산은 1-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 또는 900-1000개 뉴클레오타이드 길이일 수 있다. 마찬가지로, 결실되고/거나 대체되는 인간화 TTR 좌위에서 핵산 삽입물 또는 상응하는 핵산은 약 1-1.5, 1.5-2, 2-2.5, 2.5-3, 3-3.5, 3.5-4, 4-4.5, 또는 4.5-5 kb 길이 이상일 수 있다.
핵산 삽입물은 대체를 위해 표적화된 서열 중 모두 또는 일부에 상동성이거나 이종상동성인 서열을 포함할 수 있다. 예를 들어, 핵산 삽입물은, 인간화 TTR 좌위에서 대체를 위해 표적화된 서열과 비교하여 하나 이상(예를 들어, 1, 2, 3, 4, 5개 이상)의 점 돌연변이를 포함하는 서열을 포함할 수 있다. 선택적으로, 이러한 점 돌연변이는 인코딩된 폴리펩타이드에서 보존적 아미노산 치환(예를 들어, 아스파르트산[Asp, D]을 글루탐산[Glu, E]으로 치환)을 초래할 수 있다.
비-상동성-말단-접합-매개 삽입을 위한 공여자 핵산. 일부 외인성 공여자 핵산은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에서 뉴클레아제-매개 절단에 의해 생성된 하나 이상의 오버행에 상보적인 짧은 단일-가닥 영역을 5' 단부 및/또는 3' 단부에서 가질 수 있다. 이들 오버행은 또한, 5' 및 3' 상동성 아암으로 지칭될 수 있다. 예를 들어, 일부 외인성 공여자 핵산은 인간화 TTR 좌위에서 5' 및/또는 3' 표적 서열에서 뉴클레아제-매개 절단에 의해 생성된 하나 이상의 오버행에 상보적인 짧은 단일-가닥 영역을 5' 단부 및/또는 3' 단부에서 가질 수 있다. 일부 이러한 외인성 공여자 핵산은 5' 단부에서만 또는 3' 단부에서만 상보적 영역을 갖는다. 예를 들어, 일부 이러한 외인성 공여자 핵산은 인간화 TTR 좌위에서 5' 표적 서열에서 생성된 오버행에 상보적인 5' 단부에서만 또는 인간화 TTR 좌위에서 3' 표적 서열에서 생성된 오버행에 상보적인 3' 단부에서만 상보적 영역을 갖는다. 다른 이러한 외인성 공여자 핵산은 5' 단부와 3' 단부 둘 다에서 상보적 영역을 갖는다. 예를 들어, 다른 이러한 외인성 공여자 핵산은 인간화 TTR 좌위에서 뉴클레아제-매개 절단에 의해 생산된, 예를 들어, 각각 제1 오버행 및 제2 오버행에 상보적인 5' 단부와 3' 단부 둘 다에서 상보적 영역을 갖는다. 예를 들어, 외인성 공여자 핵산이 이중-가닥이라면, 단일-가닥 상보적 영역은 공여자 핵산의 상단 가닥의 5' 단부 및 공여자 핵산의 하단 가닥의 5' 단부로부터 연장되어, 각각의 단부 상에서 5' 오버행을 생성할 수 있다. 대안적으로, 단일-가닥 상보적 영역은 공여자 핵산의 상단 가닥의 3' 단부로부터 그리고 주형의 하단 가닥의 3' 단부로부터 연장되어, 3' 오버행을 생성할 수 있다.
상보적 영역은 외인성 공여자 핵산과 표적 핵산 사이에서 리게이션을 촉진하기에 충분한 임의의 길이일 수 있다. 예시적인 상보적 영역은 약 1 내지 약 5개 뉴클레오타이드 길이, 약 1 내지 약 25개 뉴클레오타이드 길이, 또는 약 5 내지 약 150개 뉴클레오타이드 길이이다. 예를 들어, 상보적 영역은 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오타이드 길이일 수 있다. 대안적으로, 상보적 영역은 약 5-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 또는 140-150개 뉴클레오타이드 길이 이상일 수 있다.
이러한 상보적 영역은 닉카제의 2개 쌍에 의해 생성된 오버행에 상보적일 수 있다. 엇갈린 단부를 갖는 2개의 이중-가닥 절단부는, DNA의 반대 가닥을 절단하여 제1 이중-가닥 절단부를 생성하는 제1 및 제2 닉카제, 및 DNA의 반대 가닥을 절단하여 제2 이중-가닥 절단부를 생성하는 제3 및 제4 닉카제를 사용함으로써 생성될 수 있다. 예를 들어, Cas 단백질은 제1, 제2, 제3 및 제4 가이드 RNA와 상응하는 제1, 제2, 제3 및 제4 가이드 RNA 표적 서열을 닉킹하는 데 사용될 수 있다. 제1 및 제2 가이드 RNA 표적 서열은, DNA의 제1 및 제2 가닥 상의 제1 및 제2 닉카제에 의해 생성된 닉이 이중-가닥 절단부(즉, 제1 절단 부위는 제1 및 제2 가이드 RNA 표적 서열 내에 닉을 포함함)를 생성하도록 놓여서 제1 절단 부위를 생성할 수 있다. 마찬가지로, 제3 및 제4 가이드 RNA 표적 서열은, DNA의 제1 및 제2 가닥 상의 제3 및 제4 닉카제에 의해 생성된 닉이 이중-가닥 절단부(즉, 제2 절단 부위는 제3 및 제4 가이드 RNA 표적 서열 내에 닉을 포함함)를 생성하도록 놓여서 제2 절단 부위를 생성할 수 있다. 바람직하게는, 제1 및 제2 가이드 RNA 표적 서열 및/또는 제3 및 제4 가이드 RNA 표적 서열 내의 닉은, 오버행을 생성하는 닉을 오프셋(off-set)할 수 있다. 오프셋은 예를 들어, 적어도 약 5 bp, 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp, 100 bp 이상일 수 있다. 문헌[Ran 등 (2013) Cell 154:1380-1389]; 문헌[Mali 등 (2013) Nat. Biotech.31:833-838]; 및 문헌[Shen 등 (2014) Nat. Methods 11:399-404]를 참조하며, 이들은 각각 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 경우, 이중-가닥 외인성 공여자 핵산은, 제1 및 제2 가이드 RNA 표적 서열 내의 닉에 의해 그리고 제3 및 제4 가이드 RNA 표적 서열 내의 닉에 의해 생성되는 오버행에 상보적인 단일-가닥 상보적 영역과 함께 설계될 수 있다. 그 후에, 이러한 외인성 공여자 핵산은 비-상동성-말단-접합-매개 리게이션에 의해 삽입될 수 있다.
상동성-지시 수선에 의한 삽입을 위한 공여자 핵산. 일부 외인성 공여자 핵산은 상동성 아암을 포함한다. 외인성 공여자 핵산이 또한 핵산 삽입물을 포함한다면, 상동성 아암은 핵산 삽입물의 측면에 존재할 수 있다. 기준의 용이성을 위해, 상동성 아암은 본원에서 5' 및 3'(즉, 업스트림 및 다운스트림) 상동성 아암으로 지칭된다. 이 용어는 외인성 공여자 핵산 내의 핵산 삽입물에 대한 상동성 아암의 상대 위치에 관한 것이다. 5' 및 3' 상동성 아암은 인간화 TTR 좌위 내의 영역에 상응하며, 이는 본원에서 각각 "5' 표적 서열" 및 "3' 표적 서열"로 지칭된다.
상동성 아암 및 표적 서열은, 2개의 영역이 서로 충분한 수준의 서열 동일성을 공유하여 상동성 재조합 반응에 대한 기질로서 작용할 때 서로 "상응한다" 또는 "상응하고" 있다. 용어 "상동성"은 상응하는 서열에 대해 동일하거나 서열 동일성을 공유하는 DNA 서열을 포함한다. 주어진 표적 서열과 외인성 공여자 핵산에서 확인된 상응하는 상동성 아암 사이의 서열 동일성은 상동성 재조합이 발생하게 하는, 서열 동일성의 임의의 정도일 수 있다. 예를 들어, 외인성 공여자 핵산(또는 이의 단편)의 상동성 아암 및 표적 서열(또는 이의 단편)에 의해 공유되는 서열 동일성의 양은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있으며, 따라서 서열은 상동성 재조합을 수행한다. 더욱이, 상동성 아암과 상응하는 표적 서열 사이의 상동성의 상응하는 영역은 상동성 재조합을 촉진하기에 충분한 임의의 길이일 수 있다. 예시적인 상동성 아암은 약 25개 뉴클레오타이드 내지 약 2.5 kb 길이이거나, 약 25개 뉴클레오타이드 내지 약 1.5 kb 길이이거나, 약 25 내지 약 500개 뉴클레오타이드 길이이다. 예를 들어, 주어진 상동성 아암(또는 상동성 아암 각각) 및/또는 상응하는 표적 서열은 약 25-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 또는 450-500개 뉴클레오타이드 길이인 상동성의 상응하는 영역을 포함할 수 있으며, 따라서 상동성 아암은 표적 핵산 내의 상응하는 표적 서열과 상동성 재조합을 수행하기에 충분한 상동성을 갖는다. 대안적으로, 주어진 상동성 아암(또는 상동성 아암 각각) 및/또는 상응하는 표적 서열은 약 0.5 kb 내지 약 1 kb, 약 1 kb 내지 약 1.5 kb, 약 1.5 kb 내지 약 2 kb, 또는 약 2 kb 내지 약 2.5 kb 길이인 상동성의 상응하는 영역을 포함할 수 있다. 예를 들어, 상동성 아암은 각각 약 750개 뉴클레오타이드 길이일 수 있다. 상동성 아암은 대칭적일 수 있거나(각각 약 동일한 길이), 이들 상동성 아암은 비대칭적일 수 있다(다른 것보다 더 긴 하나).
뉴클레아제 제제가 외인성 공여자 핵산과 조합되어 사용될 때, 5' 및 3' 표적 서열은 바람직하게는 뉴클레아제 절단 부위에 충분히 근접하게(예를 들어, 뉴클레아제 표적 서열에 충분한 근접성 내에) 위치하여, 뉴클레아제 절단 부위에서 단일-가닥 절단부(닉) 또는 이중-가닥 절단부 시 표적 서열과 상동성 아암 사이의 상동성 재조합 사건의 발생을 촉진한다. 용어 "뉴클레아제 제제 절단 부위"는, 닉 또는 이중-가닥 절단부가 뉴클레아제 제제(예를 들어, 가이드 RNA와 복합체화된 Cas9 단백질)에 의해 생성되는 DNA 서열을 포함한다. 외인성 공여자 핵산의 5' 및 3' 상동성 아암에 상응하는 표적화된 좌위 내의 표적 서열은, 그 거리가 뉴클레아제 절단 부위에서 단일-가닥 절단부 또는 이중-가닥 절단부 시 5' 및 3' 표적 서열과 상동성 아암 사이의 상동성 재조합 사건의 발생을 촉진하는 정도라면, 뉴클레아제 절단 부위에 "충분한 근접성으로 위치한"다. 그러므로, 외인성 공여자 핵산의 5' 및/또는 3' 상동성 아암에 상응하는 표적 서열은 예를 들어, 주어진 뉴클레아제 절단 부위의 적어도 1개 뉴클레오타이드 내에 또는 주어진 뉴클레아제 절단 부위의 적어도 10개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 내에 존재할 수 있다. 일례로, 뉴클레아제 절단 부위는 표적 서열 중 적어도 하나 또는 둘 다에 바로 인접해 있을 수 있다.
외인성 공여자 핵산의 상동성 아암에 상응하는 표적 서열 및 뉴클레아제 절단 부위의 공간적 관계는 다양할 수 있다. 예를 들어, 표적 서열은 뉴클레아제 절단 부위에 대해 5'에 위치할 수 있거나, 표적 서열은 뉴클레아제 절단 부위에 대해 3'에 위치할 수 있거나, 표적 서열은 뉴클레아제 절단 부위의 측면에 있을 수 있다.
(4) 다른 인간-TTR-표적화 시약
임의의 다른 기지의 또는 추정상 인간-TTR-표적화 시약의 활성은 또한, 비-인간 동물을 사용하여 평가될 수 있다. 유사하게는, 임의의 다른 분자는 본원에 개시된 비-인간 동물을 사용하여 인간-TTR-표적화 활성에 대해 스크리닝될 수 있다.
다른 인간-TTR-표적화 시약은 RNAi 제제를 포함할 수 있다. "RNAi 제제"는, 표적 RNA, 예컨대 메신저 RNA(mRNA)의 분해 또는 이의 번역의 저해를 서열-특이적 방식으로 용이하게 할 수 있는 작은 이중-가닥 RNA 또는 RNA-유사(예를 들어, 화학적으로 변형된 RNA) 올리고뉴클레오타이드를 포함하는 조성물이다. RNAi 제제 내 올리고뉴클레오타이드는 연결된 뉴클레오사이드의 중합체이며, 이들은 각각 독립적으로 변형되거나 비변형될 수 있다. RNAi 제제는 RNA 간섭 기전을 통해(즉, 포유류 세포의 RNA 간섭 경로 머시너리(RNA-유도 사일런싱 복합체 또는 RISC)와의 상호작용을 통해 RNA 간섭을 유도하여) 작동한다. RNAi 제제는 해당 용어가 본원에 사용되는 바와 같이, 주로 RNA 간섭 기전을 통해 작동하는 것으로 여겨지는 한편, 개시된 RNAi 제제는 임의의 특정 작동 경로 또는 기전에 의해 결부되지 않거나 이로 제한되지 않는다. 본원에 개시된 RNAi 제제는 센스 가닥 및 안티센스 가닥을 포함하고, 짧은 간섭 RNA(siRNA), 이중-가닥 RNA(dsRNA), 마이크로 RNA(miRNA), 짧은 헤어핀 RNA(shRNA), 및 다이서 기질(dicer substrate)을 포함하지만 이들로 제한되지 않는다. 본원에 기재된 RNAi 제제의 안티센스 가닥은 표적 RNA 내의 서열에 적어도 부분적으로 상보적이다(즉, 표준 명명법을 사용하여 글자의 연속(succession)으로 기재된, 핵염기 또는 뉴클레오타이드의 연속 또는 순서).
다른 인간-TTR-표적화 시약은 안티센스 올리고뉴클레오타이드(ASO)를 포함할 수 있다. 단일-가닥 ASO 및 RNA 간섭(RNAi)은, 올리고뉴클레오타이드가 왓슨-크릭 염기쌍 형성을 통해 표적 RNA와 결합한다는 근본적인 원리를 공유한다. 이론으로 결부시키고자 하는 것은 아니지만, RNAi 동안, 작은 RNA 듀플렉스(RNAi 제제)는 RNA-유도 사일런싱 복합체(RISC)와 회합되며, 하나의 가닥(패신저 가닥(passenger strand))은 상실되고, 잔여 가닥은 RISC와 협력되어 상보적 RNA에 결합한다. 그 후에, RISC의 촉매적 구성요소인 아르고노트 2(Ago2: Argonaute 2)는 표적 RNA를 절단한다. 가이드 가닥은 상보적 센스 가닥 또는 단백질(RISC)과 항상 관련이 있다. 대조적으로, ASO는 생존하고 단일 가닥으로서 작용해야 한다. ASO는 표적 RNA에 결합하고, 리보솜 또는 다른 인자, 예컨대 스플라이싱 인자가 RNA에 결합하는 것을 차단하거나, 단백질, 예컨대 뉴클레아제를 동원한다. 상이한 변형 및 표적 영역은 요망되는 작동 기전에 기초하여 ASO에 대해 선택된다. 갭머(gapmer)는 DNA의 중심 8-10 염기 갭의 측면에 존재하는 각각의 말단 상에 2 내지 5개의 화학적으로 변형된 뉴클레오타이드(예를 들어, LNA 또는 2'-MOE)를 함유하는 ASO 올리고뉴클레오타이드이다. 표적 RNA에 결합한 후, DNA-RNA 하이브리드는 RNase H에 대한 기질로서 작용한다.
다른 인간-TTR-표적화 시약은 인간 TTR 에피토프에 특이적으로 결합하도록 설계된 항체 또는 항원-결합 단백질을 포함한다. 용어 "항원-결합 단백질"은 항원에 결합하는 임의의 단백질을 포함한다. 항원-결합 단백질의 예는 항체, 항체의 항원-결합 단편, 다중-특이적 항체(예를 들어, 이중-특이적 항체), scFV, 비스-scFV, 디아바디, 트리아바디, 테트라바디, V-NAR, VHH, VL, F(ab), F(ab)2, DVD(이중 가변 도메인 항원-결합 단백질), SVD(단일 가변 도메인 항원-결합 단백질), 이중특이적 T-세포 인게이저(BiTE), 또는 다비스바디를 포함한다(미국 특허 제8,586,713호로서, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨).
다른 인간-TTR-표적화 시약은 저분자 시약을 포함한다. 이러한 저분자 시약의 일례는 타파미디스(tafamidis)이며, 이는 트랜스티레틴(TTR) 단백질의 올바르게 폴딩된 사량체성 형태의 동역학적(kinetic) 안정화에 의해 작용된다. 예를 들어, 문헌[Hammarstrom 등 (2003) Science 299:713-716]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
D. 비-인간 동물 또는 세포에게 인간-TTR-표적화 시약의 투여
본원에 개시된 방법은 핵산, 단백질, 핵산-단백질 복합체, 단백질 복합체, 또는 저분자를 포함하여 다양한 분자(예를 들어, 인간-TTR-표적화 시약, 예컨대 치료적 분자 또는 복합체)를 비-인간 동물 또는 세포 내로 도입하는 단계를 포함할 수 있다. "도입한다는 것"은 비-인간 동물 분자(예를 들어, 핵산 또는 단백질)이 세포 내부로의 또는 비-인간 동물 내 세포의 내부로의 접근을 획득하는 방식으로 상기 비-인간 동물 분자(예를 들어, 핵산 또는 단백질)을 세포 또는 동물에 제시하는 것을 포함한다. 도입은 임의의 수단에 의해 달성될 수 있으며, 2개 이상의 성분(예를 들어, 성분 중 2개, 또는 모든 성분)은 임의의 조합으로 동시에 또는 순차적으로 세포 또는 비-인간 동물 내로 도입될 수 있다. 예를 들어, Cas 단백질은 가이드 RNA의 도입 전에 세포 또는 비-인간 동물 내로 도입될 수 있거나, Cas 단백질은 가이드 RNA의 도입 후에 도입될 수 있다. 또 다른 예로, 외인성 공여자 핵산은 Cas 단백질 및 가이드 RNA의 도입 전에 도입될 수 있거나, 외인성 공여자 핵산은 Cas 단백질 및 가이드 RNA의 도입 후에 도입될 수 있다(예를 들어, 외인성 공여자 핵산은 Cas 단백질 및 가이드 RNA의 도입 전 또는 도입 후 약 1, 2, 3, 4, 8, 12, 24, 36, 48, 또는 72시간째에 투여될 수 있음). 예를 들어, 미국 특허출원공개 US 2015/0240263호 및 미국 특허출원공개 US 2015/0110762호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 게다가, 2개 이상의 성분은 동일한 전달 방법 또는 상이한 전달 방법에 의해 세포 또는 비-인간 동물 내로 도입될 수 있다. 유사하게는, 2개 이상의 성분은 동일한 투여 경로 또는 상이한 투여 경로에 의해 비-인간 동물 내로 도입될 수 있다.
일부 방법에서, CRISPR/Cas 시스템의 구성요소는 비-인간 동물 또는 세포 내로 도입된다. 가이드 RNA는 RNA(예를 들어, 시험관내 전사된 RNA)의 형태로 또는 가이드 RNA를 인코딩하는 DNA의 형태로 비-인간 동물 또는 세포 내로 도입될 수 있다. DNA의 형태로 도입될 때, 가이드 RNA를 인코딩하는 DNA는 세포 또는 비-인간 동물에서 활성인 프로모터에 작동적으로 연결될 수 있다. 예를 들어, 가이드 RNA는 AAV를 통해 전달되고 U6 프로모터 하에 생체내에서 발현될 수 있다. 이러한 DNA는 하나 이상의 발현 작제물에 존재할 수 있다. 예를 들어, 이러한 발현 작제물은 단일 핵산 분자의 성분일 수 있다. 대안적으로, 이들은 2개 이상의 핵산 분자 중에서 임의의 조합으로 분리될 수 있다(즉, 하나 이상의 CRISPR RNA를 인코딩하는 DNA 및 하나 이상의 tracrRNA를 인코딩하는 DNA는 별개의 핵산 분자의 성분일 수 있음).
마찬가지로, Cas 단백질은 임의의 형태로 제공될 수 있다. 예를 들어, Cas 단백질은 단백질, 예컨대 gRNA와 복합체화된 Cas 단백질의 형태로 제공될 수 있다. 대안적으로, Cas 단백질은 Cas 단백질을 인코딩하는 핵산, 예컨대 RNA(예를 들어, 메신저 RNA(mRNA)) 또는 DNA의 형태로 제공될 수 있다. 선택적으로, Cas 단백질을 인코딩하는 핵산은 특정 세포 또는 유기체에서 단백질로의 효율적인 번역을 위해 코돈 최적화될 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 또는 임의의 다른 관심 숙주 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. Cas 단백질을 인코딩하는 핵산이 비-인간 동물 내로 도입될 때, 상기 Cas 단백질은 상기 비-인간 동물 내 세포에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다.
Cas 단백질 또는 가이드 RNA를 인코딩하는 핵산은 발현 작제물에서 프로모터에 작동적으로 연결될 수 있다. 발현 작제물은 관심 유전자 또는 다른 핵산 서열(예를 들어, Cas 유전자)의 발현을 지시할 수 있는 임의의 핵산 작제물을 포함하고, 이는 이러한 관심 핵산 서열을 표적 세포로 이전시킬 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 하나 이상의 gRNA를 인코딩하는 DNA를 포함하는 벡터에 존재할 수 있다. 대안적으로, 이는, 하나 이상의 gRNA를 인코딩하는 DNA를 포함하는 벡터로부터 별개인 벡터 또는 플라스미드에 존재할 수 있다. 발현 작제물에 사용될 수 있는 적합한 프로모터는 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유류 세포, 비-인간 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 토끼 세포, 만능성 세포, 배아 줄기(ES) 세포, 성인 줄기세포, 발달 제약 전구 세포, 유도 만능 줄기(iPS) 세포, 또는 1-세포 단계 배아 중 하나 이상에서 활성인 프로모터를 포함한다. 이러한 프로모터는 예를 들어, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 선택적으로, 프로모터는 하나의 방향에서 Cas 단백질과 다른 방향에서 가이드 RNA 둘 다의 발현을 구동하는 양방향적(bidirectional) 프로모터일 수 있다. 이러한 양방향적 프로모터는 (1) 3개의 외부 제어 요소를 함유하는 완전한 종래의 일방향적 Pol III 프로모터: 원위부 서열 요소(DSE), 근위부 서열 요소(PSE), 및 TATA 박스; 및 (2) 역배향에서 DSE의 5' 말단에 융합된 TATA 박스 및 PSE를 포함하는 제2 기본(basic) Pol III 프로모터로 구성될 수 있다. 예를 들어, H1 프로모터에서, DSE는 PSE 및 TATA 박스에 인접하고, 프로모터는, U6 프로모터로부터 유래된 TATA 박스 및 PSE를 부착함으로써 역방향에서의 전사가 제어되는 하이브리드 프로모터를 생성함으로써 양방향적으로 될 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0074535호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas 단백질을 인코딩하는 유전자 및 가이드 RNA를 발현하기 위한 양방향적 프로모터의 사용은 동시에, 전달을 용이하게 하기 위해 컴팩트 발현 카세트의 발생을 가능하게 한다.
비-인간 동물 또는 세포 내로 도입되는 분자(예를 들어, Cas 단백질 또는 가이드 RNA 또는 RNAi 제제 또는 ASO)는 도입되는 분자의 안정성을 증가시키는(예를 들어, 주어진 저장 조건(예를 들어, -20℃, 4℃ 또는 주위 온도) 하에서 분해 생성물이 역치 미만에, 예컨대 출발 핵산 또는 단백질의 0.5 중량% 미만에서 유지되는 기간을 연장시키거나; 생체내에서의 안정성을 증가시키는) 담체를 포함하는 조성물에 제공될 수 있다. 이러한 담체의 비제한적인 예는 폴리(락트산)(PLA) 미소구체, 폴리(D,L-락틱-코글리콜-산)(PLGA) 미소구체, 리포솜, 미쉘, 인버스 미쉘, 지질 코킬레에이트, 및 지질 미세소관을 포함한다.
다양한 방법 및 조성물은 세포 또는 비-인간 동물 내로의 분자(예를 들어, 핵산 또는 단백질)의 도입을 가능하게 하기 위해 본원에 제공된다. 분자를 다양한 세포 유형 내로 도입하는 방법은 알려져 있고, 예를 들어, 안정한 형질주입 방법, 일시적인 형질주입 방법, 및 바이러스-매개 방법을 포함한다.
형질주입 프로토콜, 뿐만 아니라 핵산 서열을 세포 내로 도입하는 프로토콜은 다양할 수 있다. 비제한적인 형질주입 방법은 리포솜; 나노입자; 칼슘 포스페이트(문헌[Graham 등 (1973) Virology 52 (2): 456―67], 문헌[Bacchetti 등 (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590―4], 및 문헌[Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company. pp. 96―97]); 덴드리머; 또는 양이온성 중합체, 예컨대 DEAE-덱스트란 또는 폴리에틸렌이민을 사용하는 화학적-기초 형질주입 방법을 포함한다. 비-화학적 방법은 전기천공, 초음파-천공(sonoporation), 및 광학 형질주입을 포함한다. 입자-기초 형질주입은 유전자 총(gene gun), 또는 자기-보조 형질주입(magnet-assisted transfection)의 사용을 포함한다(문헌[Bertram (2006) Current Pharmaceutical Biotechnology 7, 277―28]). 바이러스 방법이 또한 형질주입에 사용될 수 있다.
세포 내로의 분자(예를 들어, 핵산 또는 단백질)의 도입 또한, 전기천공에 의해, 세포질내 주사에 의해, 바이러스 감염에 의해, 아데노바이러스에 의해, 아데노-관련 바이러스에 의해, 렌티바이러스에 의해, 레트로바이러스에 의해, 형질주입에 의해, 지질-매개 형질주입에 의해, 또는 뉴클레오펙션(nucleofection)에 의해 매개될 수 있다. 뉴클레오펙션은, 핵산 기질이 세포질로 전달될 뿐만 아니라 핵막을 통해 핵 내로도 전달되게 할 수 있는 향상된 전기천공 기술이다. 게다가, 본원에 개시된 방법에서 뉴클레오펙션의 사용은 전형적으로, 정기적인 전기천공보다 훨씬 더 적은 세포를 필요로 한다(예를 들어, 정기적인 전기천공에 의해 7백만개와 비교하여 단지 약 2백만개). 일례에서, 뉴클레오펙션은 LONZA® NUCLEOFECTOR™ 시스템을 사용하여 수행된다.
세포(예를 들어, 접합체) 내로의 분자(예를 들어, 핵산 또는 단백질)의 도입은 또한 현미주사(microinjection)에 의해 달성될 수 있다. 접합체(즉, 1-세포 단계 배아)에서, 현미주사는 모체(maternal) 및/또는 부체(paternal) 전핵 내로 또는 세포질 내로 수행될 수 있다. 현미주사가 단지 하나의 전핵 내로 수행된다면, 부체 전핵이 이의 더 큰 크기로 인해 바람직하다. mRNA의 현미주사는 바람직하게는 세포질 내로 수행되며(예를 들어, mRNA를 번역 머시너리에 직접 전달하기 위해), 한편 Cas 단백질 또는 Cas 단백질을 인코딩하거나 RNA를 인코딩하는 폴리뉴클레오타이드의 현미주사는 바람직하게는 핵/전핵 내로 수행된다. 대안적으로, 현미주사는 핵/전핵(pronucleus)과 세포질 둘 다 내로 주사에 의해 수행될 수 있으며: 우선 바늘이 핵/전핵 내로 도입되고 제1 양이 주사될 수 있으며, 한편 상기 바늘을 1-세포 단계 배아로부터 제거하여 제2 양이 세포질 내로 주사될 수 있다. Cas 단백질이 세포질 내로 주사된다면, Cas 단백질은 바람직하게는 핵/전핵으로의 전달을 보장하기 위해 핵 국재화를 포함한다. 현미주사를 수행하는 방법은 잘 알려져 있다. 예를 들어, 문헌[Nagy 등 (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press)]를 참조하고; 또한 문헌[Meyer 등 (2010) Proc. Natl. Acad. Sci. USA 107:15022-15026] 및 문헌[Meyer 등 (2012) Proc. Natl. Acad. Sci. USA 109:9354-9359]를 참조한다.
분자(예를 들어, 핵산 또는 단백질)을 세포 또는 비-인간 동물 내로 도입하기 위한 다른 방법은 예를 들어, 벡터 전달, 입자-매개 전달, 엑소좀-매개 전달, 지질-나노입자-매개 전달, 세포-투과-펩타이드-매개 전달, 또는 이식 가능-장치-매개 전달을 포함할 수 있다. 구체적인 예로서, 핵산 또는 단백질은 담체, 예컨대 폴리(락트산)(PLA), 미소구체, 폴리(D,L-락틱-코글리콜-산)(PLGA) 미소구체, 리포좀, 미쉘, 인버스 미셸, 지질 코클레이트(cochelate), 또는 지질 미세소관과 같은 담체에서 세포 또는 비-인간 동물 내로 도입될 수 있다. 비-인간 동물로의 전달의 일부 구체적인 예는 유체역학적 전달, 바이러스-매개 전달(예를 들어, 아데노-관련 바이러스(AAV)-매개 전달), 및 지질-나노입자-매개 전달을 포함한다.
세포 또는 비-인간 동물 내로의 핵산 및 단백질의 도입은 유체역학적 전달(HDD)에 의해 달성될 수 있다. 실질 세포로의 유전자 전달을 위해, 필수적인 DNA 서열만 선택된 혈관을 통해 주사되어, 현재의 바이러스 및 합성 벡터와 관련된 안전성 염려를 해소할 필요가 있다. 혈류 내로 주사될 때, DNA는 혈액에 접근 가능한 상이한 조직 내의 세포에 도달할 수 있다. 유체역학적 전달은 큰 부피의 용액을 순환중인 비압축성(incompressible) 혈액 내로 신속하게 주사함으로써 발생되는 힘을 이용하여, 크고 막-불투과성인 화합물이 실질 세포에 진입하는 것을 방지하는 내피 및 세포막의 물리적 장벽을 극복한다. DNA의 전달 외에도, 이 방법은 생체내에서 RNA, 단백질, 및 다른 작은 화합물의 효율적인 세포내 전달에 유용하다. 예를 들어, 문헌[Bonamassa (2011) Pharm. Res. 28(4):694-701]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
핵산의 도입은 또한, 바이러스-매개 전달, 예컨대 AAV-매개 전달 또는 렌티바이러스-매개 전달에 의해 달성될 수 있다. 다른 예시적인 바이러스/바이러스 벡터는 레트로바이러스, 아데노바이러스, 백시니아 바이러스, 폭스바이러스, 및 단순 포진 바이러스를 포함한다. 바이러스는 분열 세포, 비-분열 세포, 또는 분열 세포와 비-분열 세포 둘 다 감염시킬 수 있다. 바이러스는 숙주 게놈 내로 통합할 수 있거나 대안적으로는 숙주 게놈 내로 통합하지 않는다. 이러한 바이러스는 또한, 감소된 면역력을 갖도록 조작될 수 있다. 바이러스는 복제-적격(competent)일 수 있거나 복제-결함(defective)(예를 들어, 추가 라운드의 비리온 복제 및/또는 패키징에 필요한 하나 이상의 유전자가 결함됨)일 수 있다. 바이러스는 일시적 발현, 장기-지속적 발현(예를 들어, 적어도 1주, 2주, 1개월, 2개월, 또는 3개월), 또는 영구적 발현(예를 들어, Cas9 및/또는 gRNA의)을 야기할 수 있다. 예시적인 바이러스 역가(예를 들어, AAV 역가)는 1012, 1013, 1014, 1015, 및 1016 벡터 게놈/mL를 포함한다.
ssDNA AAV 게놈은, 상보적 DNA 가닥의 합성을 가능하게 하는 2개의 역 말단 반복부(inverted terminal repeat)의 측면에 존재하는 2개의 개방형 리딩 프레임(open reading frame)인 Rep 및 Cap으로 구성된다. AAV 이전 플라스미드를 작제할 때, 이식유전자는 2개의 ITR 사이에 놓이고, Rep 및 Cap는 인트랜스로(in trans) 공급될 수 있다. Rep 및 Cap 외에도, AAV는 아데노바이러스로부터의 유전자를 함유하는 헬퍼 플라스미드를 필요로 할 수 있다. 이들 유전자(E4, E2a, 및 VA)는 AAV 복제를 매개한다. 예를 들어, 이전 플라스미드, Rep/Cap, 및 헬퍼 플라스미드는 아데노바이러스 유전자 E1+를 함유하는 HEK293 세포 내로 형질주입되어, 감염성 AAV 입자를 생성할 수 있다. 대안적으로, Rep, Cap, 및 아데노바이러스 헬퍼 유전자는 단일 플라스미드 내로 조합될 수 있다. 유사한 패키징 세포 및 방법은 다른 바이러스, 예컨대 레트로바이러스에 사용될 수 있다.
AAV의 다수의 혈청형이 식별되었다. 이들 혈청형은, 이들이 감염시키는 세포의 유형이 상이하여(즉, 이의 향성(tropism)), 특정 세포 유형의 선호적인 형질도입을 가능하게 한다. CNS 조직에 대한 혈청형은 AAV1, AAV2, AAV4, AAV5, AAV8, 및 AAV9를 포함한다. 심장 조직에 대한 혈청형은 AAV1, AAV8, 및 AAV9를 포함한다. 신장 조직에 대한 혈청형은 AAV2를 포함한다. 폐 조직에 대한 혈청형은 AAV4, AAV5, AAV6, 및 AAV9를 포함한다. 췌장 조직에 대한 혈청형은 AAV8를 포함한다. 광수용기 세포에 대한 혈청형은 AAV2, AAV5, 및 AAV8을 포함한다. 망막 색소 상피 조직에 대한 혈청형은 AAV1, AAV2, AAV4, AAV5, 및 AAV8을 포함한다. 골격근 조직에 대한 혈청형은 AAV1, AAV6, AAV7, AAV8, 및 AAV9를 포함한다. 간 조직에 대한 혈청형은 AAV7, AAV8, 및 AAV9, 특히 AAV8을 포함한다.
향성은 위형화(pseudotyping)을 통해 추가로 정제(refined)될 수 있으며, 이는 상이한 바이러스 혈청형으로부터의 캡시드 및 게놈의 혼합이다. 예를 들어 AAV2/5는 혈청형 5로부터의 캡시드에 패키징된 혈청형 2의 게놈을 함유하는 바이러스를 나타낸다. 위형화된 바이러스의 사용은 형질도입 효율을 향상시킬 뿐만 아니라, 향성을 변경시킬 수 있다. 상이한 혈청형으로부터 유래된 하이브리드 캡시드는 또한, 바이러스 향성을 변경시키는 데 사용될 수 있다. 예를 들어, AAV-DJ는 8개의 혈청형으로부터의 하이브리드 캡시드를 함유하고, 생체내에서 광범위한 세포 유형에 걸쳐 높은 감염성을 나타낸다. AAV-DJ8은 AAV-DJ의 특성을 나타내지만 증강된 뇌 흡수(uptake)를 갖는 또 다른 예이다. AAV 혈청형은 또한, 돌연변이를 통해 변형될 수 있다. AAV2의 돌연변이적 변형의 예는 Y444F, Y500F, Y730F, 및 S662V를 포함한다. AAV3의 돌연변이적 변형의 예는 Y705F, Y731F, 및 T492V를 포함한다. AAV6의 돌연변이적 변형의 예는 S663V 및 T492V를 포함한다. 다른 위형화된(pseudotyped)/변형된 AAV 변이체는 AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2, 및 AAV/SASTG를 포함한다.
이식유전자 발현을 가속화하기 위해, 자가-상보적 AAV(scAAV) 변이체가 사용될 수 있다. AAV는 AAV의 단일-가닥 DNA 게놈의 상보적 가닥을 합성하기 위해 세포의 DNA 복제 머시너리에 의존하기 때문에, 이식유전자 발현이 지연될 수 있다. 이러한 지연을 해결하기 위해, 감염 시 자발적으로 어닐링할 수 있는 상보적 서열을 함유하는 scAAV가 사용되어, 숙주 세포 DNA 합성을 위한 요건을 배제할 수 있다. 그러나, 단일-가닥 AAV(ssAAV) 벡터가 또한 사용될 수 있다.
패키징 용량(capacity)을 증가시키기 위해, 더 긴 이식전자는 2개의 AAV 이전 플라스미드 사이에서 분할될 수 있으며, 제1 AAV는 3' 스플라이스 공여자이고 제2 AAV는 5' 스플라이스 수용기이다. 세포의 공동-감염 시, 이들 바이러스는 콘카테머(concatemer)를 형성하며, 함께 스플라이싱되고, 전장 이식유전자는 발현될 수 있다. 이는 더 장기적인 이식유전자 발현을 가능하게 하지만, 발현은 덜 효율적이다. 용량(capacity)을 증가시키기 위한 유사한 방법은 상동성 재조합을 이용한다. 예를 들어, 이식유전자는, 공동-발현이 전장 이식유전자의 상동성 재조합 및 발현을 유도하도록 2개의 이전 플라스미드 사이에서 그러나 실질적인 서열 중첩을 갖고 나눠질 수 있다.
핵산 및 단백질의 도입은 또한, 지질 나노입자(LNP)-매개 전달에 의해 달성될 수 있다. 예를 들어, LNP-매개 전달은 Cas mRNA와 가이드 RNA의 조합 또는 Cas 단백질과 가이드 RNA의 조합을 전달하는 데 사용될 수 있다. 이러한 방법을 통한 전달은 일시적인 Cas 발현을 초래하며, 생분해성 지질은 청소율(clearance)을 향상시키며, 내약성(tolerability)을 향상시키고, 면역원성을 저하시킨다. 지질 제형은 생물학적 분자의 세포 흡수를 향상시키는 한편, 이들 분자를 분해로부터 보호할 수 있다. 지질 나노입자는 분자간 힘에 의해 서로 물리적으로 관련되어 있는 복수의 지질 분자를 포함하는 입자이다. 이들은 미소구체(microsphere)(유니라멜라(unilamellar) 및 멀티라멜라(multilamella) 소낭(vesicle), 예를 들어, 리포좀을 포함함), 에멀젼 중 분산상, 미쉘(micelle), 또는 현탁액 중 내부상(internal pahse)을 포함한다. 이러한 지질 나노입자는 전달을 위해 하나 이상의 핵산 또는 단백질을 캡슐화하는 데 사용될 수 있다. 양이온성 지질을 함유하는 제형은 다가음이온(polyanion), 예컨대 핵산을 전달하는 데 유용하다. 포함될 수 있는 다른 지질은 중성 지질(즉, 비하전된 또는 쌍성이온성(zwitterionic) 지질), 음이온성 지질, 형질주입을 증강시키는 헬퍼 지질, 및 나노입자가 생체내에서 존재할 수 있는 시간의 길이를 증가시키는 스텔스(stealth) 지질이다. 적합한 양이온성 지질, 중성 지질, 음이온성 지질, 헬퍼 지질, 및 스텔스 지질의 예는 예를 들어, WO 2016/010840 A1호 및 WO 2017/173054 A1호에서 찾을 수 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 예시적인 지질 나노입자는 양이온성 지질 및 하나 이상의 다른 성분을 포함할 수 있다. 일례에서, 다른 성분은 헬퍼 지질, 예컨대 콜레스테롤을 포함할 수 있다. 또 다른 예에서, 다른 성분은 헬퍼 지질, 예컨대 콜레스테롤 및 중성 지질, 예컨대 DSPC를 포함할 수 있다. 또 다른 예에서, 다른 성분은 헬퍼 지질, 예컨대 콜레스테롤, 선택적인 중성 지질, 예컨대 DSPC, 및 스텔스 지질, 예컨대 S010, S024, S027, S031, 또는 S033을 포함할 수 있다.
LNP는 하기 중 하나 이상 또는 모두를 함유할 수 있다: (i) 캡슐화를 위한 그리고 엔도솜 탈출(endosomal escape)을 위한 지질; (ii) 안정화를 위한 중성 지질; (iii) 안정화를 위한 헬퍼 지질; 및 (iv) 스텔스 지질. 예를 들어, 문헌[Finn 등 (2018) Cell Reports 22:1-9] 및 국제공개 WO 2017/173054 A1호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 소정의 LNP에서, 카고는 가이드 RNA, 또는 가이드 RNA를 인코딩하는 핵산을 포함할 수 있다. 소정의 LNP에서, 카고는 Cas 뉴클레아제, 예컨대 Cas9를 인코딩하는 mRNA, 및 가이드 RNA, 또는 가이드 RNA를 인코딩하는 핵산을 포함할 수 있다.
캡슐화 및 엔도솜 탈출을 위한 지질은 양이온성 지질일 수 있다. 지질은 또한, 생분해성 지질, 예컨대 생분해성 이온화 가능한 지질일 수 있다. 적합한 지질의 일례는 지질 A 또는 LP01이며, 이는 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트라고도 하는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 옥타데카-9,12-디에노에이트이다. 예를 들어, 문헌[Finn 등 (2018) Cell Reports 22:1-9] 및 국제공개 WO 2017/173054 A1호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 적합한 지질의 또 다른 예는 지질 B이며, 이는 ((5-((디메틸아미노)메틸)-1,3-페닐렌)비스(옥시))비스(옥탄-8,1-디일)비스(데카노에이트)라고도 하는 ((5-((디메틸아미노)메틸)-1,3-페닐렌)비스(옥시))비스(옥탄-8,1-디일)비스(데카노에이트)이다. 적합한 지질의 또 다른 예는 지질 C이며, 이는 2-((4-(((3-(디메틸아미노)프로폭시)카르보닐)옥시)헥사데카노일)옥시)프로판-1,3-디일(9Z,9'Z,12Z,12'Z)-비스(옥타데카-9,12-디에노에이트)이다. 적합한 지질의 또 다른 예는 지질 D이며, 이는 3-(((3-(디메틸아미노)프로폭시)카르보닐)옥시)-13-(옥타노일옥시)트리데실 3-옥틸운데카노에이트이다. 다른 적합한 지질은 헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트(Dlin-MC3-DMA(MC3)로도 알려져 있음)를 포함한다.
본원에 기재된 LNP에서 사용하기에 적합한 일부 이러한 지질은 생체내에서 생분해성이다. 예를 들어, 이러한 지질을 포함하는 LNP는 적어도 75%의 지질이 8, 10, 12, 24 또는 48시간, 또는 3, 4, 5, 6, 7 또는 10일 내에 혈장으로부터 청소되는 것을 포함한다. 또 다른 예로, 적어도 50%의 LNP는 8, 10, 12, 24 또는 48시간, 또는 3, 4, 5, 6, 7 또는 10일 내에 혈장으로부터 청소된다.
이러한 지질은 이것이 존재하는 배지의 pH에 따라 이온화 가능할 수 있다. 예를 들어, 약간의 산성 배지에서, 지질은 양성자화(protonate)되어서 양전하를 보유할 수 있다. 대조적으로, 예를 들어, pH가 대략 7.35인 혈액과 같은 약간의 염기성 배지에서, 지질은 양성화되지 않으므로 전하를 보유하지 않을 수 있다. 일부 구현예에서, 지질은 적어도 약 9, 9.5, 또는 10의 pH에서 양성자화될 수 있다. 전하를 보유하는 이러한 지질의 능력은 이의 내인성 pKa와 관련이 있다. 예를 들어, 지질은 독립적으로, 약 5.8 내지 약 6.2 범위의 pKa를 가질 수 있다.
중성 지질은 LNP의 가공을 안정화시키고 향상시키는 작용을 한다. 적합한 중성 지질의 예는 여러 가지 중성, 비하전된 또는 쌍성이온성(zwitterionic) 지질을 포함한다. 본 개시내용에 사용하기에 적합한 중성 인지질의 예는 5- 헵타데실벤젠-1,3-디올(레조르시놀), 디팔미토일포스파티딜콜린(DPPC), 디스테아로일포스파티딜콜린(DSPC), 포스포콜린(DOPC), 디미리스토일포스파티딜콜린(DMPC), 포스파티딜콜린(PLPC), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DAPC), 포스파티딜에탄올아민(PE), 달걀(egg) 포스파티딜콜린(EPC), 디라우릴로일포스파티딜콜린(DLPC), 디미리스토일포스파티딜콜린(DMPC), 1-미리스토일-2-팔미토일 포스파티딜콜린(MPPC), 1-팔미토일-2-미리스토일 포스파티딜콜린(PMPC), 1-팔미토일-2-스테아로일 포스파티딜콜린(PSPC), 1,2-디아라키도일-sn-글리세로-3-포스포콜린(DBPC), 1-스테아로일-2-팔미토일 포스파티딜콜린(SPPC), 1,2-디에이코세노일-sn-글리세로-3-포스포콜린(DEPC), 팔미토일올레오일 포스파티딜콜린(POPC), 리소포스파티딜 콜린, 디올레오일 포스파티딜에탄올아민(DOPE), 디리놀레오일포스파티딜콜린 디스테아로일포스파티딜에탄올아민(DSPE), 디미리스토일 포스파티딜에탄올아민(DMPE), 디팔미토일 포스파티딜에탄올아민(DPPE), 팔미토일올레오일 포스파티딜에탄올아민(POPE), 리소포스파티딜에탄올아민, 및 이들의 조합을 포함하지만 이들로 제한되지는 않는다. 예를 들어, 중성 인지질은 디스테아로일포스파티딜콜린(DSPC) 및 디미리스토일 포스파티딜 에탄올아민(DMPE)으로 이루어진 군으로부터 선택될 수 있다.
헬퍼 지질은 형질주입을 증강시키는 지질을 포함한다. 헬퍼 지질이 형질주입을 증강시키는 기전은 입자 안정성을 증강시키는 단계를 포함할 수 있다. 소정의 경우, 헬퍼 지질은 막 융합원성(fusogenicity)을 증강시킬 수 있다. 헬퍼 지질은 스테로이드, 스테롤, 및 알킬 레조르시놀을 포함한다. 적합한 헬퍼 지질의 예는 적합한 콜레스테롤, 5-헵타데실레조르시놀, 및 콜레스테롤 헤미숙시네이트를 포함한다. 일례에서, 헬퍼 지질은 콜레스테롤 또는 콜레스테롤 헤미숙시네이트일 수 있다.
스텔스 지질은, 나노입자가 생체내에서 존재할 수 있는 시간의 길이를 변경시키는 지질을 포함한다. 스텔스 지질은 예를 들어, 입자 응집을 감소시키고 입자 크기를 제어함으로써 제형 과정에 일조할 수 있다. 스텔스 지질은 LNP의 약물동력학적 특성을 조절할 수 있다. 적합한 스텔스 지질은 지질 모이어티에 연결된 친수성 헤드 기(head group)를 갖는 지질을 포함한다.
스텔스 지질의 친수성 헤드 기는 예를 들어, PEG(이따금 폴리(에틸렌 옥사이드)로 지칭됨), 폴리(옥사졸린), 폴리(비닐 알코올), 폴리(글리세롤), 폴리(N- 비닐피롤리돈), 폴리아미노산, 및 폴리 N-(2-하이드록시프로필)메타크릴아미드에 기초한 중합체로부터 선택되는 중합체 모이어티를 포함할 수 있다. 용어 PEG는 임의의 폴리에틸렌 글리콜 또는 다른 폴리알킬렌 에테르 중합체를 의미한다. 소정의 LNP 제형에서, PEG는 PEG 2000이라고도 하는 PEG-2K이며, 이는 약 2,000 달톤의 평균 분자량을 갖는다. 예를 들어, WO 2017/173054 A1호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
스텔스 지질의 지질 모이어티는 예를 들어, 독립적으로 약 C4 내지 약 C40 포화된 또는 불포화된 탄소 원자를 포함하는 알킬 사슬 길이를 갖는 디알킬글리세롤 또는 디알킬글리카미드 기를 포함하는 것을 포함하여 디아실글리세롤 또는 디아실글리카미드로부터 유래될 수 있으며, 상기 사슬은 예를 들어, 아미드 또는 에스테르와 같은 하나 이상의 작용기를 포함할 수 있다. 디알킬글리세롤 또는 디알킬글리카미드 기는 하나 이상의 치환된 알킬기를 추가로 포함할 수 있다.
일례로서, 스텔스 지질은 PEG-디라우로일글리세롤, PEG-디미리스토일글리세롤(PEG-DMG), PEG-디팔미토일글리세롤, PEG-디스테아로일글리세롤(PEG-DSPE), PEG-디라우일글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, 및 PEG-디스테아로일글리카미드, PEG-콜레스테롤(l-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복사미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB(3,4-디테트라데콕실벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르), 1,2-디미리스토일-sn- 글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000](PEG2k-DMG), 1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000](PEG2k-DSPE), 1,2-디스테아로일-sn-글리세롤, 메톡시폴리에틸렌 글리콜(PEG2k-DSG), 폴리(에틸렌 글리콜)-2000-디메타크릴레이트(PEG2k-DMA), 및 1,2-디스테아릴옥시프로필-3-아민-N-[메톡시(폴리에틸렌 글리콜)-2000](PEG2k-DSA)으로부터 선택될 수 있다. 하나의 특정 예에서, 스텔스 지질은 PEG2k-DMG일 수 있다.
LNP는 상이한 각각의 몰비의 성분 지질을 제형에 포함할 수 있다. CCD 지질의 몰%는 예를 들어, 약 30 몰% 내지 약 60 몰%, 약 35 몰% 내지 약 55 몰%, 약 40 몰% 내지 약 50 몰%, 약 42 몰% 내지 약 47 몰%, 또는 약 45%일 수 있다. 헬퍼 지질의 몰%는 예를 들어, 약 30 몰% 내지 약 60 몰%, 약 35 몰% 내지 약 55 몰%, 약 40 몰% 내지 약 50 몰%, 약 41 몰% 내지 약 46 몰%, 또는 약 44 몰%일 수 있다. 중성 지질의 몰%는 예를 들어, 약 1 몰% 내지 약 20 몰%, 약 5 몰% 내지 약 15 몰%, 약 7 몰% 내지 약 12 몰%, 또는 약 9 몰%일 수 있다. 스텔스 지질의 몰%는 예를 들어, 약 1 몰% 내지 약 10 몰%, 약 1 몰% 내지 약 5 몰%, 약 1 몰% 내지 약 3 몰%, 약 2 몰%, 또는 약 1 몰%일 수 있다.
LNP는, 캡슐화되는 생분해성 지질의 양으로 하전된 아민기(N)와 핵산의 음으로 하전된 포스페이트기(P) 사이에서 상이한 비를 가질 수 있다. 이는 방정식 N/P에 의해 수학적으로 표시될 수 있다. 예를 들어, N/P 비는 약 0.5 내지 약 100, 약 1 내지 약 50, 약 1 내지 약 25, 약 1 내지 약 10, 약 1 내지 약 7, 약 3 내지 약 5, 약 4 내지 약 5, 약 4, 약 4.5, 또는 약 5일 수 있다. N/P 비는 또한, 약 4 내지 약 7, 또는 약 4.5 내지 약 6일 수 있다. 구체적인 예에서, N/P 비는 4.5일 수 있거나 6일 수 있다.
일부 LNP에서, 카고는 Cas mRNA 및 gRNA를 포함할 수 있다. Cas mRNA 및 gRNA는 상이한 비로 존재할 수 있다. 예를 들어, LNP 제형은 약 25:1 내지 약 1:25 범위, 약 10:1 내지 약 1:10 범위, 약 5:1 내지 약 1:5 범위, 또는 약 1:1의 Cas mRNA 대 gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:1 내지 약 1:5, 또는 약 10:1의 Cas mRNA 대 gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:10, 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, 또는 1:25의 Cas mRNA 대 gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:1 내지 약 1:2의 Cas mRNA 대 gRNA 핵산의 비를 포함할 수 있다. 구체적인 예에서, Cas mRNA 대 gRNA의 비는 약 1:1 또는 약 1:2일 수 있다.
일부 LNP에서, 카고는 외인성 공여자 핵산 및 gRNA를 포함할 수 있다. 외인성 공여자 핵산 및 gRNA는 상이한 비로 존재할 수 있다. 예를 들어, LNP 제형은 약 25:1 내지 약 1:25 범위, 약 10:1 내지 약 1:10 범위, 약 5:1 내지 약 1:5 범위, 또는 약 1:1의 외인성 공여자 핵산 대 gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:1 내지 약 1:5, 약 5:1 내지 약 1:1, 약 10:1, 또는 약 1:10의 외인성 공여자 핵산 대 gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:10, 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, 또는 1:25의 외인성 공여자 핵산 대 gRNA 핵산의 비를 포함할 수 있다.
적합한 LNP의 구체적인 예는 4.5의 질소-대-포스페이트(N/P) 비를 가지며, 45:44:9:2 몰비의 생분해성 양이온성 지질, 콜레스테롤, DSPC, 및 PEG2k-DMG를 함유한다. 생분해성 양이온성 지질은 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트라고도 하는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 옥타데카-9,12-디에노에이트일 수 있다. 예를 들어, 문헌[Finn 등 (2018) Cell Reports 22:1-9]를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas9 mRNA는 가이드 RNA에 대해 1:1의 중량비로 존재할 수 있다. 적합한 LNP의 또 다른 구체적인 예는 Dlin-MC3-DMA(MC3), 콜레스테롤, DSPC, 및 PEG-DMG를 50:38.5:10:1.5 몰비로 함유한다.
적합한 LNP의 구체적인 또 다른 예는 6의 질소-대-포스페이트(N/P) 비를 가지며, 50:38:9:3 몰비의 생분해성 양이온성 지질, 콜레스테롤, DSPC, 및 PEG2k-DMG를 함유한다. 생분해성 양이온성 지질은 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트라고도 하는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 옥타데카-9,12-디에노에이트일 수 있다. Cas9 mRNA는 가이드 RNA에 대해 1:2의 중량비로 존재할 수 있다.
전달 모드는 면역원성을 저하시키도록 선택될 수 있다. 예를 들어, Cas 단백질 및 gRNA는 상이한 모드에 의해 전달될 수 있다(예를 들어, 쌍봉형(bi-modal) 전달). 이들 상이한 모드는 대상체에게 전달되는 분자(예를 들어, Cas 또는 핵산 인코딩, gRNA 또는 핵산 인코딩, 또는 외인성 공여자 핵산/수선 주형)에게 상이한 약물역학적(pharmacodynamic) 또는 약물동력학적 특성을 부여할 수 있다. 예를 들어, 상이한 모드는 상이한 조직 분포, 상이한 반감기, 또는 상이한 시간적(temporal) 분포를 초래할 수 있다. 일부 전달 모드(예를 들어, 세포에서 자율 복제(autonomous replication) 또는 게놈 통합에 의해 지속되는 핵산 벡터의 전달)는 분자의 더욱 지속적인 발현 및 존재를 초래하는 반면, 다른 모드의 전달은 일시적이고 덜 지속적이다(예를 들어, RNA 또는 단백질의 전달). 예를 들어, Cas 단백질의 더욱 일시적인 방식, mRNA 또는 단백질로서의 전달은, Cas/gRNA 복합체가 단지 단기간 동안 존재하고 활성임을 보장할 수 있고, MHC 분자에 의해 세포의 표면 상에 제시되는 박테리아-유래 Cas 효소로부터의 펩타이드에 의해 야기되는 면역원성을 감소시킬 수 있다. 이러한 일시적인 전달은 또한, 표적-외(off-target) 변형의 가능성을 감소시킬 수 있다.
생체내 투여는 예를 들어, 비경구, 정맥내, 경구, 피하, 동맥내, 두개내, 수막공간내, 복강내, 국소, 비내(intranasal), 또는 근육내를 포함하여 임의의 적합한 경로에 의한 것일 수 있다. 전신 투여 모드는 예를 들어, 경구 및 비경구 경로를 포함한다. 비경구 경로의 예는 정맥내, 동맥내, 골내(intraosseous), 근육내, 피내, 피하, 비내, 및 복강내 경로를 포함한다. 구체적인 예는 정맥내 주입이다. 비내 점적 및 유리체내 주사는 다른 구체적인 예이다. 국소 투여 모드는 예를 들어, 수막공간내, 뇌실내(intracerebroventricular), 실질내(예를 들어, 선조체(striatum)로의 실질내 전달(예를 들어, 미상핵(caudate) 내로 또는 조가비핵(putamen) 내로), 대뇌 피질(cerebral cortex), 중심전회(precentral gyrus), 해마(hippocampus)(예를 들어, 치상회(dentate gyrus) 또는 CA3 영역 내로), 측두 피질(temporal cortex), 편도체(amygdala), 전두 피질(frontal cortex), 시상(thalamus), 소뇌(cerebellum), 수질(medulla), 시상하부(hypothalamus), 덮개(tectum), 중뇌피개(tegmentum), 또는 흑색질), 안내(intraocular), 안와내(intraorbital), 결막하(subconjuctival), 유리체내(intravitreal), 망막하(subretinal), 및 경공막(transscleral) 경로를 포함한다. 유의하게 더 소량의 성분(전신 접근법과 비교하여)은 전신적으로(예를 들어, 정맥내로) 전달될 때와 비교하여 국소로(예를 들어, 실질내 또는 유리체내) 투여될 때 효과를 발휘할 수 있다. 국소 투여 모드는 또한, 치료적 유효량의 성분이 전신 투여될 때 발생할 수 있는 잠재적으로 독성 부작용의 발생을 감소시키거나 해소시킬 수 있다.
생체내 투여는 예를 들어, 비경구, 정맥내, 경구, 피하, 동맥내, 두개내, 수막공간내, 복강내, 국소, 비내(intranasal), 또는 근육내를 포함하여 임의의 적합한 경로에 의한 것일 수 있다. 구체적인 예는 정맥내 주입이다. 가이드 RNA 및/또는 Cas 단백질을 포함하는 조성물(또는 가이드 RNA 및/또는 Cas 단백질을 인코딩하는 핵산)은 하나 이상의 생리학적으로 그리고 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 보조제를 사용하여 제형화될 수 있다. 제형은 선택된 투여 경로에 의존할 수 있다. 용어 "약학적으로 허용 가능한"은, 담체, 희석제, 부형제, 또는 보조제가 제형의 다른 성분과 상용성이고 이의 수혜자에게 실질적으로 유해하지 않음을 의미한다.
투여 빈도 및 투약 수는 인성 공여자 핵산, 가이드 RNA, 또는 Cas 단백질(또는 가이드 RNA 또는 Cas 단백질을 인코딩하는 핵산)의 반감기 및 다른 인자 중에서도 투여 경로에 의존할 수 있다. 세포 또는 비-인간 동물 내로의 핵산 또는 단백질의 도입은 기간에 걸쳐 1회 또는 다수 회 수행될 수 있다. 예를 들어, 도입은 기간에 걸쳐 적어도 2회, 기간에 걸쳐 적어도 3회, 기간에 걸쳐 적어도 4회, 기간에 걸쳐 적어도 5회, 기간에 걸쳐 적어도 6회, 기간에 걸쳐 적어도 7회, 기간에 걸쳐 적어도 8회, 기간에 걸쳐 적어도 9회, 기간에 걸쳐 적어도 10회, 적어도 11회, 기간에 걸쳐 적어도 12회, 기간에 걸쳐 적어도 13회, 기간에 걸쳐 적어도 14회, 기간에 걸쳐 적어도 15회, 기간에 걸쳐 적어도 16회, 기간에 걸쳐 적어도 17회, 기간에 걸쳐 적어도 18회, 기간에 걸쳐 적어도 19회, 또는 기간에 걸쳐 적어도 20회 수행될 수 있다.
E. 생체내에서 또는 생체외에서 인간-TTR-표적화 시약의 전달, 활성, 또는 효능의 측정
본원에 개시된 방법은 인간-TTR-표적화 시약의 활성을 검출하거나 측정하는 단계를 추가로 포함할 수 있다. 일례로, 인간-TTR-표적화 시약이 게놈 편집 시약(예를 들어, 인간 TTR 좌위를 표적화하도록 설계된 CRISPR/Cas)이라면, 측정은 변형을 위해 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 평가하는 단계를 포함할 수 있다.
다양한 방법은 표적화된 유전적 변형을 갖는 세포를 식별하는 데 사용될 수 있다. 스크리닝은 부모 염색체의 대립유전자의 변형(MOA)을 평가하기 위한 정량적 검정을 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2004/0018626호; 미국 특허출원공개 US 2014/0178879호; 미국 특허출원공개 US 2016/0145646호; 국제공개 WO 2016/081923호; 및 문헌[Frendewey 등 (2010) Methods Enzymol. 476:295-307]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 예를 들어, 정량적 검정은 정량적 PCR, 예컨대 실시간 PCR(qPCR)을 통해 수행될 수 있다. 실시간 PCR은, 표적 좌위를 인식하는 제1 프라이머 세트 및 비-표적화된 기준 좌위를 인식하는 제2 프라이머 세트를 이용할 수 있다. 프라이머 세트는 증폭된 서열을 인식하는 형광 프로브를 포함할 수 있다. 적합한 정량적 검정의 다른 예는 형광-매개 인 시추 혼성화(FISH: ), 비교 게놈 혼성화(comparative genomic hybridization), 등온 DNA 증폭(isothermic DNA amplication), 고정된 프로브(들)에의 정량적 혼성화, INVADER® 프로브, TAQMAN® Molecular Beacon 프로브, 또는 ECLIPSE™ 프로브 기술(예를 들어, US 2005/0144655를 참조하며, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨)을 포함한다.
차세대 시퀀싱(NGS: next-generation sequencing)이 또한 스크리닝에 사용될 수 있다. 차세대 시퀀싱은 또한 "NGS" 또는 "대규모 병렬 시퀀싱(massively parallel sequencing)" 또는 "고 처리량 시퀀싱(high throughput sequencing)"으로 지칭될 수 있다. NGS는, 표적화된 유전적 변형의 정확한 성질, 그리고 이것이 세포 유형 또는 조직 유형 또는 기관 유형에 걸쳐 일관되는지의 여부를 정의하기 위해 MOA 검정 외에도 스크리닝 툴로서 사용될 수 있다.
비-인간 동물에서 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위의 변형을 평가하는 것은 임의의 조직 또는 기관으로부터의 임의의 세포 유형에 있을 수 있다. 예를 들어, 평가는 동일한 조직 또는 기관으로부터의 다수의 세포 유형에서 또는 조직 또는 기관 내의 다수의 위치로부터의 세포에서 수행될 수 있다. 이는, 표적 조직 또는 기관 내의 어떤 세포 유형이 표적화되고 있는지 또는 조직 또는 기관의 어떤 선택이 인간-TTR-표적화 시약에 의해 도달되고 있는지에 대한 정보를 제공할 수 있다. 또 다른 예로서, 평가는 다수의 유형의 조직에서 또는 다수의 기관에서 수행될 수 있다. 특정 조직, 기관, 또는 세포 유형이 표적화되는 방법에서, 이는 해당 조직 또는 기관이 얼마나 효과적으로 표적화되는지 그리고 다른 조직 또는 기관에서 표적-외 효과가 존재하는지의 여부에 대한 정보를 제공할 수 있다.
사용될 수 있는 검정의 일례는 RNASCOPE™ 및 BASESCOPE™ RNA 인시추 혼성화(ISH) 검정이며, 이는 무손상 고정된 조직의 맥락에서 단일 뉴클레오타이드 변화를 포함하여 세포-특이적 편집된 전사물을 정량화할 수 있는 방법이다. BASESCOPE™ RNA ISH 검정은 유전자 편집의 특징화에서 NGS 및 qPCR을 보완할 수 있다. NGS/qPCR이 야생형 서열 및 편집된 서열의 정량적 평균 값을 제공할 수 있는 반면, 이들은 조직 내의 편집된 세포의 이종성(heterogeneity) 또는 백분율에 대한 어떠한 정보도 제공하지 않는다. BASESCOPE™ ISH 검정은 전체 조직의 랜드스케이프 뷰(landscape view) 및 단일-세포 분해능(resolution)을 이용한 야생형 대(versus) 편집된 전사물의 정량화를 제공할 수 있으며, 여기서, 편집된 mRNA 전사물을 함유하는 표적 조직 내의 세포의 실제 수가 정량화될 수 있다. BASESCOPE™ 검정은, 쌍형성된(paired) 올리고("ZZ") 프로브를 사용한 단일-분자 RNA 검출을 달성하여, 비-특이적 배경 없이 신호를 증폭시킨다. 그러나, BASESCOPE™ 프로브 설계 및 신호 증폭 시스템은 ZZ 프로브를 이용한 단일-분자 RNA 검출을 가능하게 하고, 이는 무손상 고정된 조직에서 단일 뉴클레오타이드 편집 및 돌연변이를 차별적으로 검출할 수 있다.
시약이 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 불활성화시키거나, 인간화 TTR 좌위의 발현에 영향을 미치거나, 인간화 TTR mRNA의 번역을 방지하거나, 인간화 TTR 단백질을 청소(clear)하도록 설계된다면, 측정은 인간화 TTR mRNA 또는 단백질 발현을 평가하는 단계를 포함할 수 있다. 이러한 측정은 간 또는 간 내의 특정 세포 유형 또는 영역 내에서 수행될 수 있거나, 측정은 분비된 인간화 TTR 단백질의 혈청 수준을 측정하는 단계를 수반할 수 있다.
베타-슬립 돌연변이를 포함하는 인간화 TTR 단백질의 생성 및 분비는 임의의 기지의 수단에 의해 평가될 수 있다. 예를 들어, 발현은 인코딩된 mRNA의 수준을 비-인간 동물의 간에서 또는 인코딩된 단백질의 수준을 비-인간 동물의 간에서 기지의 방법을 사용하여 측정함으로써 평가될 수 있다. 인간화 TTR 단백질의 선택은 인코딩된 인간화 TTR 단백질의 혈장 수준 또는 혈청 수준을 비-인간 동물에서 기지의 검정을 사용하여 측정함으로써 평가될 수 있다. 예를 들어, 측정은, 인간-TTR-표적화 시약이 비-인간 동물에서 TTR 수준을 감소시키는지 결정할 수 있다.
측정은 또한, 인간화 TTR 단백질의 응집을 평가하는 단계를 포함할 수 있다. 예를 들어, 네이티브 PAGE 및 웨스턴 블롯은, 응집된 인간화 TTR 단백질(예를 들어, 더 높은 분자량 형태의 인간화 TTR 단백질)의 존재, 및 인간-TTR-표적화 시약이 인간화 TTR 단백질의 응집을 방지하거나, 응집을 감소시키거나, 응집을 분열시키거나, 응집된 형태의 청소를 증가시키는지의 여부를 평가하는 데 사용될 수 있다.
이러한 측정은 또한, 아밀로이드 침착 또는 아밀로이드 침착물의 존재(아밀로이드증)를 평가하는 단계를 포함할 수 있다. 예를 들어, 측정은, 인간-TTR-표적화 시약이 아밀로이드 침착물을 방지하거나, 감소시키거나, 분열시키거나, 청소하는지의 여부를 결정할 수 있다. 일례로, 콩고 레드는 아밀로이드증을 검출하기 위해 광범위하게 사용되는 착색제이다. 조직은, 전반적인 조직 구조 및 특징적인 적색 염색을 드러내는 백색광 하에서 이미지화될 수 있다. 콩고 레드 염색된 조직이 선형 편광을 사용하여 비춰질 때, 아밀로이드에 결합된 염료만 편광을 굴절시킬 것이며(예를 들어, 아밀로이드 결합된 콩고레드 염료가 복굴절(birefringent)되게 될 것임), 이는 밝은 녹색/백색 색상으로 보인다. 이들 녹색-백색 침착물의 존재는 아밀로이드 침착을 나타낸다. 이러한 검정은, 인간-TTR-표적화 시약이 아밀로이드 침착물을 방지하거나, 감소시키거나, 분열시키거나, 청소하는지의 여부를 평가하는 데 사용될 수 있다. 평가는, TTR 아밀로이드 침착이 발생하는 임의의 조직 또는 기관에서 수행될 수 있다. 하나의 비제한적인 예로서, 평가는 좌골 신경에서 수행될 수 있다.
측정은 또한, 비-인간 동물에서 활동 또는 과다활동 수준을 평가하는 단계를 포함할 수 있다. 예를 들어, 측정은, 인간-TTR-표적화 시약이 비-인간 동물에서 과다활동을 방지하거나 감소시키는지 결정할 수 있다. 과다활동은 오픈 필드 시험에서 총 거리, 총 활동, 또는 총 리어링 중 하나 이상 또는 모두를 측정함으로써 평가될 수 있다. 오픈 필드 시험은 마우스 운동(locomotion) 및 과다활동의 전반적인 측정치(measure)를 제공한다. 오픈 필드 시험으로부터의 판독물 중 3개는 이동한 총 거리, 총 활동, 및 리어링의 총 수이다. 오픈 필드는 60-분 기간 동안 마우스의 일반적인 운동력 건강(motor health) 및 활동을 측정하는 데 사용되는 행동 시험이다. 마우스는, 이것이 밀폐된 정사각형 기구 내부에서 60-분 기간 동안 이동한 총 거리에 대해 추적된다. 총 활동은, 기구 내에서 마우스가 X 평면 및 Y 평면에서 적외선 빔의 경로를 간섭하는 횟수에 의해 측정된다. 리어링은, 마우스가 기구의 벽을 탐험하기 위해 그 뒷다리로 몇번이나 서 있을 것인지의 측정치이다. 더 큰 리어링 값은 덜 불안하고 과다활동적인 마우스를 나타낸다. 리어링은 Z-평면에서 적외선 빔 절단부(사족(quadrupedal) 마우스의 빔보다 더 높은 높이에 배치되는 빔)에 의해 측정된다.
평가는 또한, 근긴장이상증 또는 근긴장이상 표현형의 존재를 평가하는 단계를 포함할 수 있다. 예를 들어, 평가는, 비-인간 동물이 작업 실시예에 기재되는 바와 같이 뒷다리 근긴장이상증 또는 뒷다리 근긴장이상 표현형(예를 들어, 근긴장이상 뒷다리 수축)을 나타내는지의 여부를 평가하는 단계를 포함할 수 있다. 예를 들어, 측정은, 인간-TTR-표적화 시약이 이러한 표현형을 개선하거나 방지하는지의 여부를 결정할 수 있다.
임의의 이들 표현형의 평가는 임의의 연령, 예컨대 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월령의 비-인간 동물에서 수행될 수 있다. 구체적인 예에서, 비-인간 동물은 적어도 약 2개월령일 수 있다.
임의의 이들 표현형의 평가는 대조군 비-인간 동물과의 비교에서 수행될 수 있다. 대조군 비-인간 동물의 일례는 상응하는 야생형 동물(예를 들어, 동일한 종(species)의 것)이다. 예를 들어, 대조군 비-인간 동물은 야생형 한배새끼(littermate)일 수 있다. 대조군 비-인간 동물의 또 다른 예는 베타-슬립 돌연변이가 없는 인간화 TTR 좌위를 포함하는 상응하는 비-인간 동물이다(예를 들어, 베타-슬립 돌연변이의 부재를 제외하고는 인간화 TTR 좌위가 동일함). 대조군 비-인간 동물은 예를 들어, 시험 비-인간 동물과 동일한 연령 및/또는 시험 비-인간 동물과 동일한 성별일 수 있다. 임의의 이들 표현형의 평가는 또한, 인간-TTR-표적화 시약으로 치료되지 않는 점을 제외하고는 시험 비-인간 동물과 동일한 대조군 비-인간 동물과의 비교에서 수행될 수 있다.
임의의 이들 표현형의 평가는 단일 비-인간 동물에서 그리고 해당되는 비-인간 동물에서 변화를 평가하는 것으로 수행될 수 있다. 대안적으로, 평가는 비-인간 동물의 집단에서 그리고 예를 들어, 특정 표현형을 갖는 비-인간 동물의 백분율을 비교하는 것으로 수행될 수 있다. 일례로서, 평가는 대조군 집단(인간-TTR-표적화 시약으로 치료되지 않음)과 비교하여, 시험 집단(인간-TTR-표적화 시약으로 치료됨)에서 아밀로이드 침착물을 갖거나 근긴장이상 표현형을 갖는 비-인간 동물의 백분율을 평가하는 단계를 포함할 수 있다.
IV. 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 제조하는 방법
본원 어디에서나 개시된 바와 같은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 제조하기 위한 다양한 방법이 제공된다. 유전적으로 변형된 유기체를 생성하기 위한 임의의 편리한 방법 또는 프로토콜은 이러한 유전적으로 변형된 비-인간 동물을 생성하는 데 적합하다. 예를 들어, 문헌[Cho (2009) Current Protocols in Cell Biology 42:19.11:19.11.1―19.11.22] 및 문헌[Gama Sosa (2010) Brain Struct. Funct. 214(2-3):91-109]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 유전적으로 변형된 비-인간 동물은 예를 들어, 표적화된 Ttr 좌위에서 유전자 넉인(gene knock-in)을 통해 생산될 수 있다.
예를 들어, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 생성하는 방법은 (1) 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하도록 만능성 세포의 게놈을 변형시키는 단계; (2) 상기 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 유전적으로 변형된 만능성 세포를 식별하거나 선택하는 단계; (3) 상기 유전적으로 변형된 만능성 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (4) 상기 숙주 배아를 대리모에 착상시키고 임신시키는 단계를 포함할 수 있다. 대안적으로, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 비-인간 동물을 생성하는 방법은 (1) 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하도록 만능성 세포의 게놈을 변형시키는 단계; (2) 상기 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 유전적으로 변형된 만능성 세포를 식별하거나 선택하는 단계; (3) 상기 유전적으로 변형된 만능성 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (4) 상기 숙주 배아를 대리모에 임신시키는 단계를 포함할 수 있다. 선택적으로, 변형된 만능성 세포(예를 들어, 비-인간 ES 세포)를 포함하는 숙주 배아는, F0 비-인간 동물을 생성하기 위해 대리모 내로 착상되고 임신되기 전에 배반포 단계까지 인큐베이션될 수 있다. 그 후에, 대리모는 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는 F0 세대 비-인간 동물을 생성할 수 있다.
상기 방법은 변형된 표적 게놈 좌위(즉, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위)를 갖는 세포 또는 동물을 식별하는 단계를 추가로 포함할 수 있다. 다양한 방법은 표적화된 유전적 변형을 갖는 세포 및 동물을 식별하는 데 사용될 수 있다.
스크리닝 단계는 예를 들어, 부모 염색체의 대립유전자의 변형(MOA)을 평가하기 위한 정량적 검정을 포함할 수 있다. 예를 들어, 정량적 검정은 정량적 PCR, 예컨대 실시간 PCR(qPCR)을 통해 수행될 수 있다. 실시간 PCR은, 표적 좌위를 인식하는 제1 프라이머 세트 및 비-표적화된 기준 좌위를 인식하는 제2 프라이머 세트를 이용할 수 있다. 프라이머 세트는 증폭된 서열을 인식하는 형광 프로브를 포함할 수 있다.
적합한 정량적 검정의 다른 예는 형광-매개 인 시추 혼성화(FISH), 비교 게놈 혼성화(comparative genomic hybridization), 등온 DNA 증폭(isothermic DNA amplication), 고정된 프로브(들)에의 정량적 혼성화, INVADER® 프로브, TAQMAN® Molecular Beacon 프로브, 또는 ECLIPSE™ 프로브 기술(예를 들어, US 2005/0144655를 참조하며, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨)을 포함한다.
적합한 만능성 세포의 일례는 배아 줄기(ES)세포(예를 들어, 마우스 ES 세포 또는 래트 ES 세포)이다. 변형된 만능성 세포는 예를 들어, (a) 5' 및 3' 표적 부위에 상응하는 5' 및 3' 상동성 아암의 측면에 존재하는 삽입물 핵산을 포함하는 하나 이상의 표적화 벡터를 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는, 단계; 및 (b) 내인성 Ttr 좌위에 통합된 삽입물 핵산을 세포의 게놈에 포함하는 적어도 하나의 세포를 식별하는 단계에 의한 재조합을 통해 생산될 수 있다. 대안적으로, 변형된 만능성 세포는 (a) (i) 뉴클레아제 제제로서, 상기 뉴클레아제 제제는 내인성 Ttr 좌위 내의 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는, 뉴클레아제 제제; 및 (ii) 뉴클레아제 표적 서열에 충분히 근접하게 놓이는 5' 및 3' 표적 부위에 상응하는 5' 및 3' 상동성 아암의 측면에 존재하는 삽입물 핵산을 포함하는 하나 이상의 표적화 벡터를 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하는, 단계; 및 (c) 내인성 Ttr 좌위에 변형(예를 들어, 삽입물 핵산의 통합)을 포함하는 적어도 하나의 세포를 식별하는 단계에 의해 생산될 수 있다. 닉 또는 이중-가닥 절단부를 요망되는 표적 서열 내로 유도하는 임의의 뉴클레아제 제제가 사용될 수 있다. 적합한 뉴클레아제의 예는 전사 활성자-유사 이펙터 뉴클레아제(TALEN), 아연-핑거 뉴클레아제(ZFN), 메가뉴클레아제, 및 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR)/CRISPR-관련(Cas) 시스템 또는 이러한 시스템의 구성요소(예를 들어, CRISPR/Cas9)를 포함한다. 예를 들어, 미국 특허출원공개 US 2013/0309670호 및 미국 특허출원공개 US 2015/0159175호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
공여자 세포는 임의의 단계, 예컨대 배반포 단계 또는 상실배-전 단계(즉, 4-세포 단계 또는 8-세포 단계)의 숙주 배아 내로 도입될 수 있다. 생식세포계를 통해 유전적 변형을 전할 수 있는 자손이 생산된다. 예를 들어, 미국 특허 제7,294,754호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
대안적으로, 본원 어디에서나 기재된 비-인간 동물을 생성하는 방법은 (1) 만능성 세포를 변형시키기 위해 상기 기재된 방법을 사용하여, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하도록 1-세포 단계 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 선택하는 단계; 및 (3) 상기 유전적으로 변형된 배아를 대리모 내로 착상시키고 임신시키는 단계를 포함할 수 있다. 대안적으로, 본원 어디에서나 기재된 비-인간 동물을 생성하는 방법은 (1) 만능성 세포를 변형시키기 위해 상기 기재된 방법을 사용하여, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함하도록 1-세포 단계 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 선택하는 단계; 및 (3) 상기 유전적으로 변형된 배아를 대리모 내로 임신시키는 단계를 포함할 수 있다. 생식세포계를 통해 유전적 변형을 전할 수 있는 자손이 생산된다.
핵 이전 기법은 또한 비-인간 포유류 동물을 생산하는 데 사용될 수 있다. 간략하게는, 핵 이전 방법은 (1) 난모세포를 제핵화시키거나 제핵된 난모세포를 제공하는 단계; (2) 제핵된 난모세포와 조합될 공여자 세포 또는 핵을 단리하거나 제공하는 단계; (3) 상기 세포 또는 핵을 제핵된 난모세포 내로 삽입하여, 재구성된 세포를 형성하는 단계; (4) 상기 재구성된 세포를 동물의 자궁 내로 착상시켜, 배아를 형성하는 단계; 및 (5) 상기 배아를 발달시키는 단계를 포함할 수 있다. 이러한 방법에서, 난모세포는 일반적으로 사망한 동물로부터 회수되지만, 이들 난모세포는 또한 살아 있는 동물의 난관 및/또는 난소로부터 단리될 수 있다. 난모세포는 제핵 전에 여러 가지 잘 알려진 배지에서 성숙화될 수 있다. 난모세포의 제핵은 많은 잘 알려진 방식으로 수행될 수 있다. 재구성된 세포를 형성하기 위한, 제핵된 난모세포 내로의 공여자 세포 또는 핵의 삽입은 융합 전 투명대 하에 공여자 세포의 현미주사에 의해 수행될 수 있다. 융합은 접촉/융합 평면에 걸친 DC 전기 펄스의 적용(전기융합)에 의해, 융합-촉진 화학물질, 예컨대 폴리에틸렌 글리콜에의 세포의 노출에 의해, 또는 불활성화된 바이러스, 예컨대 센다이 바이러스에 의해 유도될 수 있다. 재구성된 세포는 핵 공여자와 수혜자 난모세포의 융합 전에, 동안에, 및/또는 후에 전기적 수단 및/또는 비-전기적 수단에 의해 활성화될 수 있다. 활성화 방법은 전기적 펄스, 화학적으로 유도된 충격, 정자에 의한 침투, 난모세포에서 2가 양이온의 수준 증가, 및 난모세포에서 세포 단백질의 인산화의 감소(키나제 저해제에 의함)를 포함한다. 활성화된 재구성된 세포, 또는 배아는 잘 알려진 배지에서 배양된 다음, 동물의 자궁으로 이전될 수 있다. 예를 들어, 미국 특허출원공개 US 2008/0092249호, 국제공개 WO 1999/005266호, 미국 특허출원공개 US 2004/0177390호, 국제공개 WO 2008/017234호, 및 미국 특허 제7,612,250호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
본원에 제공된 다양한 방법은 유전적으로 변형된 비-인간 F0 동물의 생산을 가능하게 하며, 상기 유전적으로 변형된 F0 동물의 세포는 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 포함한다. F0 동물을 생산하기 위해 사용되는 방법에 따라, 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위를 갖는 F0 동물 내의 세포의 수는 다양할 것이다. VELOCIMOUSE® 방법을 통한 예를 들어, 상응하는 유기체로부터의 상실배-전 단계 배아(예를 들어, 8-세포 단계 마우스 배아) 내로의 공여자 ES 세포의 도입은 F0 동물의 더 큰 백분율의 세포 집단이 표적화된 유전적 변형을 포함하는 관심 뉴클레오타이드 서열을 갖는 세포를 포함하는 것을 가능하게 한다. 예를 들어, 적어도 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의, 비-인간 F0 동물의 세포적 기여(cellular contribution)는 표적화된 변형을 갖는 세포 집단을 포함할 수 있다.
유전적으로 변형된 F0 동물의 세포는 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 대해 이형접합성일 수 있거나 베타-슬립 돌연변이를 포함하는 인간화 TTR 좌위에 대해 동형접합성일 수 있다.
상기 또는 아래에 인용된 모든 특허출원, 웹사이트, 기타 간행물, 수탁 번호 등은 각 개별 항목이 구체적으로 및 개별적으로 참조로서 그렇게 포함되는 것으로 표시된 것과 동일한 정도로 모든 목적을 위해 그 전체내용이 참조로서 본원에 포함된다. 상이한 버전들의 서열이 다양한 시점에서 특정 수탁 번호와 연관되는 경우, 본원의 유효 출원일에서의 수탁 번호와 연관된 버전을 의미한다. 유효 출원일은, 해당되는 경우 수탁 번호를 언급하는 우선권 출원의 출원일 또는 실제 출원일 중 더 빠른 날짜를 의미한다. 마찬가지로 상이한 버전들의 간행물, 웹사이트 등이 다양한 시점에서 공개된 경우, 달리 지시되지 않는 한, 본원의 유효 출원일에서 가장 최근에 공개된 버전을 의미한다. 본 발명의 임의의 특징, 단계, 요소, 구현예, 또는 양태는 달리 구체적으로 표시되지 않는 한 임의의 다른 것과 조합하여 사용될 수 있다. 명확성과 이해의 목적을 위해 예시 및 실시예를 통해 상기 구현예는 어느 정도 상세하게 기재되었지만, 첨부된 청구범위의 범위 내에서 특정 변경 및 변형이 실시될 수 있다는 것이 당업자에게 명백할 것이다.
서열의 간단한 설명
첨부된 서열 목록에서 나열된 뉴클레오타이드 서열 및 아미노산 서열은 뉴클레오타이드 염기에 대해서는 표준 글자 약어, 및 아미노산에 대해서는 3-글자 코드를 사용하여 제시된다. 뉴클레오타이드 서열은 서열의 5' 단부에서 시작하여 3' 단부까지 포워드로(즉, 각각의 선(line)에서 좌측으로부터 우측으로) 진행되는 표준 관계를 따른다. 각각의 뉴클레오타이드 서열의 단지 1개 가닥만 제시되지만, 상보적 가닥은 표시된 가닥에 대한 임의의 참조에 의해 포함되어 있는 것으로 이해된다. 아미노산 서열을 인코딩하는 뉴클레오타이드 서열이 제공될 때, 동일한 아미노산 서열을 인코딩하는 이의 코돈 축퇴(codon degenerate) 변이체가 또한 제공되는 것으로 이해된다. 아미노산 서열은 서열의 아미노 말단에서 시작하여 카르복시 말단까지 포워드로(즉, 각각의 선에서 좌측으로부터 우측으로) 진행되는 표준 관계를 따른다.
Figure pct00002
Figure pct00003
Figure pct00004
실시예
실시예 1. 인간화 TTR 베타-슬립 좌위를 포함하는 마우스의 생산
만들어진 인간화 Ttr 대립유전자는 마우스 트랜스티레틴 코딩 서열의 완전한 결실 및 인간 TTR 유전자의 이종상동성 파트로의 이의 대체였다. 인간 TTR 유전자의 이종상동성 파트는, TTR 복합체의 분자간 상호작용에 관여하는 베타-시트의 장소를 시프트하고 TTR을 특히 응집-취약(prone)하게 만드는 3개의 점 돌연변이(총괄하여 TTR 베타-슬립으로 지칭되는 G53S, E54D, 및 L55S)를 인코딩하였다. 베타-슬립 돌연변이에 의해 형성되는 변경된 상호작용 TTR 복합체는 원시섬유(protofibril) 및 아밀로이드의 형성을 초래하며(예를 들어, 문헌[Eneqvist 등 (2000) Mol. Cell 6(5):1207-1218]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 이는 IMR-32 세포주에 독성인 것으로 보고되었다(예를 들어, 문헌[Andersson 등 (2013) PLoS One 8(2):e55766]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 그러나, 이들 돌연변이는 생체내에서 모델화된 적이 없었다.
마우스 Ttr 개시 코돈으로부터 업스트림의 33.7 kb의 서열 및 마우스 Ttr 정지 코돈으로부터 다운스트림의 34.5 kb의 서열을 포함하여 5' 상동성 아암을 포함하는 큰 표적화 벡터를 생산하여, 마우스 Ttr 개시 코돈으로부터 마우스 Ttr 정지 코돈까지의 대략 8.3 kb 영역을, 인간 TTR 개시 코돈으로부터 마지막 인간 TTR 엑손(인간 3' UTR을 포함하여 엑손 4)의 단부까지 대략 7.1 kb 이종상동성 인간 TTR 서열 및 loxP 부위에 의해 플랭킹된 자가-결실 퓨로마이신 선택 카세트(SDC Puro)로 대체하였다. 도 3을 참조한다. SDC 퓨로 카세트는 5'으로부터 3'까지 하기 성분을 포함한다: loxP 부위, 마우스 프로타민(Prm1) 프로모터, Crei(인트론을 포함하도록 최적화된 Cre 코딩 서열), polyA, 인간 유비퀴틴 프로모터, 퓨로마이신-N-아세틸트랜스퍼라제(puror) 코딩 서열, polyA, loxP. 인간화 대립유전자를 생산하기 위해, CRISPR/Cas9 성분을 큰 표적화 벡터와 함께 F1H4 마우스 배아 줄기세포 내로 도입하였다. 도 4 표 3에 제시된 프라이머 및 프로브를 사용하여 대립유전자-소실 검정, 대립유전자-획득 검정, 체류 검정, 및 CRISPR 검정을 수행하여, 마우스 Ttr 대립유전자의 인간화를 확인하였다. 대립유전자-소실, 대립유전자-획득 검정, 및 체류 검정은 예를 들어, 미국 특허출원공개 US 2014/0178879호; 미국 특허출원공개 US 2016/0145646호; 국제공개 WO 2016/081923호; 및 문헌[Frendewey 등 (2010) Methods Enzymol. 476:295-307]에 기재되어 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. CRISPR 검정은 CRISPR gRNA에 의해 분열되는 영역을 망라하도록 설계된 TAQMAN® 검정이다. CRISPR gRNA가 인델(indel)(삽입 또는 결실)을 절단하고 생성할 때, TAQMAN® 검정은 CRISPR 절단부(cleavage)를 증폭시켜 이를 보고하는 데 실패할 것이다. SDC 퓨로 카세트를 갖고 SDC 퓨로 카세트의 절제 후의 버전은 도 3에 도시되어 있다. 그 후에, VELOCIMOUSE® 방법을 사용하여, F0 마우스를 생산하였다. 예를 들어, 미국 특허 제7,576,259호; 미국 특허 제7,659,442호; 미국 특허 제7,294,754호; 미국 특허출원공개 US 2008/007800호; 및 문헌[Poueymirou 등 (2007) Nature Biotech. 25(1):91-99]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
F0 세대 마우스(50% C57BL/6NTac 및 50% 129S6/SvEvTac)를 다수의 인간화 ES 세포 클론으로부터 생산하였다. F0 세대 마우스에서 예상된 인간화 TTR 베타-슬립 좌위에 대한 서열은 SEQ ID NO: 12로 표시되어 있고, SDC 퓨로 카세트(MAID8530으로 지칭됨)를 포함한다. 그 후에, F1 및 F2 세대 마우스(75% C57BL/6NTac 및 25% 129S6/SvEvTac)를 번식(breeding)에 의해 생산하였다. F1 및 F2 세대 마우스에서 예상된 인간화 TTR 베타-슬립 좌위에 대한 서열은 SEQ ID NO: 13으로 표시되어 있고, SDC 퓨로 카세트(MAID8531로 지칭됨)를 포함하지 않는다. 하기 실험에서 특징화된 모든 인간화 TTR 베타-슬립 마우스는 TTR8531/8531(인간화 TTR 베타-슬립 대립유전자 둘 다에서 제거된 카세트)이었다.
SDC 네오(Neo) 카세트를 제외하고는 상응하는 인간화 TTR 야생형 마우스를 동일한 방식으로 만들었다. F0 세대 마우스에서 예상된 인간화 마우스 Ttr 야생형 좌위에 대한 서열은 SEQ ID NO: 15로 표시되어 있고, SDC 네오 카세트(7576으로 지칭됨)를 포함한다. 그 후에, F1 및 F2 세대 마우스(75% C57BL/6NTac 및 25% 129S6/SvEvTac)를 번식에 의해 생산하였다. F1 및 F2 세대 마우스에서 예상된 인간화 마우스 Ttr 야생형 좌위에 대한 서열은 SEQ ID NO: 16으로 표시되어 있고, SDC 네오 카세트(MAID7577로 지칭됨)를 포함하지 않는다. 하기 실험에서 특징화된 모든 인간화 TTR 야생형 마우스는 TTR7577/7577(인간화 TTR 야생형 대립유전자 둘 다에서 제거된 카세트)이었다.
마우스 트랜스티레틴 전구체 단백질, 인간 야생형 트랜스티레틴 전구체 단백질, 및 인간 베타-슬립 트랜스티레틴 전구체 단백질 서열의 비교는 도 1a에 도시되어 있다. 마우스 트랜스티레틴, 인간 야생형 트랜스티레틴, 및 인간 베타-슬립 트랜스티레틴 코딩 서열의 비교는 도 1b에 도시되어 있다. 야생형 마우스 Ttr 좌위, 최종 야생형 인간화 마우스 Ttr 좌위(SDC 네오 카세트가 결실됨) 및 최종 베타-슬립 인간화 마우스 Ttr 좌위(SDC 퓨로 카세트가 결실됨)를 보여주는 개략도는 도 2에 도시되어 있다. 개시 코돈으로부터 정지 코돈까지의 내인성 마우스 Ttr 좌위 서열은 SEQ ID NO: 11에 제공된다. 내인성 마우스 Ttr 좌위에 대한 코딩 서열은 SEQ ID NO: 8에 제공된다. 내인성 마우스 Ttr 좌위에 의해 인코딩되는 트랜스티레틴 전구체 단백질은 SEQ ID NO: 5에 제공된다. SDC 네오 카세트를 갖는 예상된 야생형 인간화 마우스 Ttr 좌위에 대한 서열 및 SDC 네오 카세트를 갖지 않는 예상된 야생형 인간화 마우스 Ttr 좌위에 대한 서열은 SEQ ID NO: 15 및 16으로 각각 표시되어 있다. 야생형 인간화 마우스 Ttr 좌위의 예상된 코딩 서열(CDS)은 SEQ ID NO: 4로 표시되어 있다. 야생형 인간화 마우스 Ttr 좌위에 의해 인코딩되는 예상된 트랜스티레틴 전구체 단백질은 SEQ ID NO: 1로 표시되어 있다. SDC 퓨로 카세트를 갖는 예상된 베타-슬립 인간화 마우스 Ttr 좌위에 대한 서열 및 SDC 퓨로 카세트를 갖지 않는 예상된 베타-슬립 인간화 마우스 Ttr 좌위에 대한 서열은 SEQ ID NO: 12 및 13으로 각각 표시되어 있다. 베타-슬립 인간화 마우스 Ttr 좌위의 예상된 코딩 서열(CDS)은 SEQ ID NO: 10으로 표시되어 있다. 베타-슬립 인간화 마우스 Ttr 좌위에 의해 인코딩되는 예상된 트랜스티레틴 전구체 단백질은 SEQ ID NO: 9로 표시되어 있다. 이들 대립유전자는 인간 TTR 치료제의 진 인간 표적을 제공하여, 살아 있는 동물에서 상기 치료제의 효능 및 작용 방식, 뿐만 아니라 돌연변이화된 인간 단백질이 존재하는 TTR의 유일한 버전인 설정에서 약물동력학적 연구 및 약력학적 연구의 시험을 가능하게 한다.
Figure pct00005
Figure pct00006
실시예 2. 인간화 TTR 베타-슬립 좌위를 포함하는 마우스의 특징화.
인간화 TTR 베타-슬립 마우스 콜로니를 확립하였고, F2 코호트를 2개월령에서 특징화하였다. 인간 TTR은 혈청에서 측정되었고 0.3 μg/mL에서 검출되었으며, 이는 대조군 야생형 마우스의 혈청에서 전형적으로 검출되는 수준(대략 1000 μg/mL의 마우스 TTR) 또는 인간에서 순환중인 수준(대략 200 μg/mL)보다 실질적으로 더 낮다. 이는 또한, 인간화 TTR 야생형 마우스에서 나타난 수준보다 더 낮다. 도 5a 표 4 참조한다.
Figure pct00007
인간화 TTR 베타-슬립 마우스의 혈액을 네이티브 PAGE 상에서, 뒤이어 항-인간-특이적 항체를 이용한 웨스턴 블롯으로 분석하였을 때, TTR은 예상된 바와 같이 관찰되었다. 도 6a참조한다. 인간 성숙 WT TTR(pI: 5.31; MW: 13.76 kDa) 및 인간 성숙 베타-슬립 TTR(pI: 5.30 / MW: 13.75 kDa)은 거의 동일한 분자량을 갖는다. 인간화 TTR 베타-슬립 마우스의 혈액을 네이티브 PAGE 상에서, 뒤이어 항-인간-특이적 항체를 이용한 웨스턴 블롯으로 분석하였을 때, 고분자량의 TTR 화학종은 상응하는 인간화 TTR 야생형 마우스가 아니라 인간화 TTR 베타-슬립 마우스의 혈청에서 관찰되었다. 도 6b참조한다.
낮은 수준의 순환중 TTR을 갖고 있음에도 불구하고, 인간화 TTR 베타-슬립 마우스는 행동 검정에서 시험되었을 때 표현형적 차이를 가졌다. 도 8a 내지 도 8c참조한다. 하나의 검정은 마우스 운동 및 과다활동의 전반적인 측정치를 제공하는 오픈 필드 시험이다. 오픈 필드 시험으로부터의 판독물 중 3개는 이동한 총 거리, 총 활동, 및 리어링의 총 수이며, 이러한 측정치는 각각 인간화 TTR WT 마우스 또는 한배새끼(F1H4) 대조군과 비교하였을 때 인간화 TTR 베타-슬립 마우스에서 유의하게 증가되었다. 도 8a, 도 8b 도 8c 각각 참조한다. 표 5, 6, 및 7 또한 각각 참조한다. 오픈 필드는 60-분 기간 동안 마우스의 일반적인 운동력 건강 및 활동을 측정하는 데 사용되는 행동 시험이다. 마우스를, 이것이 밀폐된 정사각형 기구 내부에서 60-분 기간 동안 이동한 총 거리에 대해 컴퓨터 소프트웨어(Kinder Scientific MotorMonitor 소프트웨어, Kinder Scientific, Poway, CA)를 사용하여 추적하였다. 총 활동을, 기구 내에서 마우스가 X 평면 및 Y 평면에서 적외선 빔의 경로를 간섭하는 횟수(즉, "빔 절단부")에 의해 측정하였다. 리어링은, 마우스가 기구의 벽을 탐험하기 위해 그 뒷다리로 몇번이나 서있었는지(즉, "리어")의 측정치였다. 더 큰 리어링 값은 덜 불안하고 더욱 활동적인 마우스를 나타낸다. 리어링을, Z-평면에서 적외선 빔 절단부(사족 마우스의 빔보다 더 높은 높이에 배치되는 빔)에 의해 측정하였다.
Figure pct00008
Figure pct00009
Figure pct00010
증가된 과다활동은 TTR-무효(null) 마우스에서 보고되었으며(예를 들어, 문헌[Sousa 등 (2004) J. Neurochem. 88(5):1052-1058]을 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 이는 TTR 베타-슬립이 혈청에서 검출 가능하더라도 기능-소실(loss-of-function) 돌연변이체로서 작용할 수 있음을 시사한다. 비-기능적인 발현되는 TTR 베타-슬립 단백질의 추가 상관관계는 혈청 전체 T4 및 유리(free) T4의 저하이며, 이는 저하된 체온과 관련이 있었으며, TTR 베타-슬립 마우스가 TTR의 기능 소실로 인한 갑상선 기능 저하증(hypothyroid)일 수 있음을 시사한다. 도 5b, 도 5c 도 5d 각각 참조한다.
적어도 2개의 가능한 설명은 인간화 TTR 베타-슬립 마우스에서 낮은 수준의 순환중 인간 TTR을 설명할 수 있다. 하나의 가능한 설명은 간의 간세포로부터 베타-슬립 TTR의 불량하거나 불충분한 분비이다. 두 번째의 가능한 설명은 순환중 인간 베타-슬립 TTR이 말초 기관/조직 내로 신속하게 침착될 수 있다는 것이다.
인간 베타-슬립 TTR의 조직 침착 가능성은, 좌골 신경에 의해 고도로 신경지배되는(innervated) 근육인 뒷다리에서 일부 마우스가 약한 근육 긴장(muscle tone)을 가졌다는 본 발명자들의 관찰에 의해 뒷받침된다. 도 7a 및 도 7b참조한다. 변경된 근육 긴장(즉, "근긴장이상")을 뒷다리에 갖는 인간화 TTR 베타-슬립 마우스의 이러한 관찰은, TTR 무효 마우스 또는 인간 형태의 TTR을 발현하는 유전자이식 마우스에 대한 문헌에서는 이전에 보고되지 않은 관찰이다. 이러한 표현형은, 마우스를 스크러핑하고 이의 뒷다리의 각도를 신체 축에 비해 평가함으로써 평가되었다. 통상적으로, 마우스는 신체 축과 뒷다리 각도 사이에서 넓은 각도를 갖는다(도 7a에서 F1H4 및 TTR WT 인간화 사진을 참조). 대조적으로, 베타-슬립 마우스는 이의 신체로부터 신전된(extended) 뒷다리를 갖지 않았다(도 7a에서 TTR β-슬립 인간화 사진을 참조). 이의 유의성은, 좌골 신경이 뒷다리 기능을 제어하기 때문에, 이것이 좌골 신경 기능 장애에 대한 프록시 측정치(proxy measure)일 수 있을 것이라는 점이다. 좌골 신경은 인간 TTR 질환(예를 들어, FAP)에서 아밀로이드 침착의 주요 부위 중 하나이다. 그러므로, 근긴장이상 표현형은 비정상적인 좌골 신경 기능에 대한 지표(indicator)일 수 있었다.
그 후에, 악력을 측정하였다. 마우스가 악력 미터에 연결된 막대를 잡게 한 다음, 마우스를 상기 막대로부터 멀어지도록 일정한 속도로 수동적으로 당김으로써 악력을 측정하였다. 기구는, 쥠(grip)을 소실하여 이를 해제시키기 전에 마우스가 막대를 잡아당긴 최대 힘을 측정한다. 앞다리 및 뒷다리를 별개로 시험하고, 마우스당 3개 시도로부터 힘의 평균 단위로서 그래프화하였다. 악력은 근긴장이상 표현형과 상관관계가 있지 않았고, 체중은 인간화 TTR 베타-슬립 마우스, 인간화 TTR 야생형 마우스, 및 대조군(F1H4) 마우스에서 유사하였다. 도 9b 표 8 참조한다. 마찬가지로, 체중은 인간화 TTR 베타-슬립 마우스, 인간화 TTR 야생형 마우스, 및 대조군(F1H4) 마우스에서 유사하였다. 도 9a 표 9 참조한다.
Figure pct00011
Figure pct00012
아밀로이드-특이적 염료인 콩고 레드를 이용한 사후(post-mortem) 조직병리학적 분석은, F1H4(한배새끼 대조군) 또는 인간화 TTR 야생형 마우스의 좌골 신경이 아니라 인간화 TTR 베타-슬립 마우스의 좌골 신경 상에서 복굴절-양성 아밀로이드 침착물을 보여주었다. 도 10a 도 10b 각각 참조한다. 2개월령의 베타-슬립 마우스를 CO2를 사용하여 안락사시키고, 포스페이트 완충제(20 mL)로 경심장(transcardially) 관류시키고, 뒤이어 20 mL의 4% 파라포름알데하이드(PFA)로 관류시켰다. 간 및 좌골 신경을 제거하고, 4℃에서 4% PFA에서 2일 동안 후-고정(post-fix)시키고, 뒤이어 포스페이트 완충제 중 30% (w/v) 수크로스에 조직을 밤새 담금으로써 동결보존 단계를 수행하였다. 이튿날, 조직을 OCT("최적 절단 온도")에서 침지시키고 냉동시켰다. 절편(section)을 크라이오스타트(cryostat) 상에서 10 미크론(micron)으로 절단하고, 급속 냉동된(frosted) 현미경 슬라이드 상에 마운팅(mount)하였다. 슬라이드를 콩고 레드 용액으로 제조업체의 프로토콜(Sigma, 카탈로그 번호: HT60-1KT)에 따라 염색하였다. 콩고 레드는 아밀로이드증을 검출하기 위해 광범위하게 사용되는 착색제이다. 슬라이드를, 전반적인 조직 구조 및 특징적인 적색 염색을 드러내는 백색광 하에서 이미지화하였다. 도 10a 도 10b에서 상단 패널을 참조한다. 콩고 레드 염색된 조직이 선형 편광을 사용하여 비춰졌을 때, 아밀로이드에 결합된 염료만 편광을 굴절시켰으며(예를 들어, 아밀로이드 결합된 콩고레드 염료가 복굴절되게 될 것임), 이는 밝은 녹색/백색 색상으로 보였다. 도 10a 도 10b에서 하단 패널을 참조한다. 이들 녹색-백색 침착물의 존재는 아밀로이드 침착을 나타내었다. 본 발명자들은 좌골 신경에서 복굴절(즉, 아밀로이드 침착물의 존재)을 관찰하였으며, 이는 마우스의 근긴장이상 표현형을 설명할 수 있을 것이다. 도 10a에서 하단 우측 패널(TTR β-슬립 인간화)을 참조한다. 예상된 바와 같이, 본 발명자들은 간에서 아밀로이드를 관찰하지 못했다. 도 10b에서 하단 우측 패널(TTR β-슬립 인간화)을 참조한다.
이는, 2개월령의 베타-슬립 마우스에서 관찰된 아밀로이드 침착물과 함께, 아밀로이드증을 매우 신속하게 발증시키는 생체내 모델에서 최초로 보고된 것이다. 그 후에, 항-TTR 항체로 공동-염색하여 복굴절 침착물을 공동-표지하기 위해 실험을 수행하고, 이들이 TTR 침착에 의해 야기됨을 확인한다. 추가 실험을 수행하여, 다른 기관 및 조직에 침착물이 존재하는지의 여부를 분석한다.
SEQUENCE LISTING <110> Regeneron Pharmaceuticals, Inc. <120> NON-HUMAN ANIMALS COMPRISING A HUMANIZED TTR LOCUS WITH A BETA-SLIP MUTATION AND METHODS OF USE <130> 057766/547028 <150> US 62/856,999 <151> 2019-06-04 <160> 92 <170> PatentIn version 3.5 <210> 1 <211> 147 <212> PRT <213> Homo sapiens <400> 1 Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe 1 5 10 15 Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu 20 25 30 Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val 35 40 45 Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe 50 55 60 Ala Ser Gly Lys Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr 65 70 75 80 Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys 85 90 95 Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu 100 105 110 Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala 115 120 125 Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn 130 135 140 Pro Lys Glu 145 <210> 2 <211> 938 <212> DNA <213> Homo sapiens <400> 2 gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 60 cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc acagaagtcc 120 actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg ctggactggt 180 atttgtgtct gaggctggcc ctacgggcac cggtgaatcc aagtgtcctc tgatggtcaa 240 agttctagat gctgtccgag gcagtcctgc catcaatgtg gccgtgcatg tgttcagaaa 300 ggctgctgat gacacctggg agccatttgc ctctgggaaa accagtgagt ctggagagct 360 gcatgggctc acaactgagg aggaatttgt agaagggata tacaaagtgg aaatagacac 420 caaatcttac tggaaggcac ttggcatctc cccattccat gagcatgcag aggtggtatt 480 cacagccaac gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc 540 ctattccacc acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga 600 cctgaaggac gagggatggg atttcatgta accaagagta ttccattttt actaaagcag 660 tgttttcacc tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga 720 aaggcacttt tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa 780 aaaaagagaa tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa 840 cgctaggaga gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct 900 gcagccatta aaaagacaca ttctgtaaaa aaaaaaaa 938 <210> 3 <211> 7258 <212> DNA <213> Homo sapiens <400> 3 gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 60 cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc acagaagtcc 120 actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg ctggactggt 180 atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt cctacattta 240 agattcacgc taaatgaagt agaagtgact ccttccagct ttgccaacca gcttttatta 300 ctagggcaag ggtacccagc atctattttt aatataatta attcaaactt caaaaagaat 360 gaagttccac tgagcttact gagctgggac ttgaactctg agcattctac ctcattgctt 420 tggtgcatta ggtttgtaat atctggtacc tctgtttcct cagatagatg atagaaataa 480 agatatgata ttaaggaagc tgttaatact gaattttcag aaaagtatcc ctccataaaa 540 tgtatttggg ggacaaactg caggagatta tattctggcc ctatagttat tcaaaacgta 600 tttattgatt aatctttaaa aggcttagtg aacaatattc tagtcagata tctaattctt 660 aaatcctcta gaagaattaa ctaatactat aaaatgggtc tggatgtagt tctgacatta 720 ttttataaca actggtaaga gggagtgact atagcaacaa ctaaaatgat ctcaggaaaa 780 cctgtttggc cctatgtatg gtacattaca tcttttcagt aattccactc aaatggagac 840 ttttaacaaa gcaactgttc tcaggggacc tattttctcc cttaaaattc attatacaca 900 tccctggttg atagcagtgt gtctggaggc agaaaccatt cttgctttgg aaacaattac 960 gtctgtgtta tactgagtag ggaagctcat taattgtcga cacttacgtt cctgataatg 1020 ggatcagtgt gtaattcttg tttcgctcca gatttctaat accacaaaga ataaatcctt 1080 tcactctgat caattttgtt aacttctcac gtgtcttctc tacacccagg gcaccggtga 1140 atccaagtgt cctctgatgg tcaaagttct agatgctgtc cgaggcagtc ctgccatcaa 1200 tgtggccgtg catgtgttca gaaaggctgc tgatgacacc tgggagccat ttgcctctgg 1260 gtaagttgcc aaagaaccct cccacaggac ttggttttat cttcccgttt gcccctcact 1320 tggtagagag aggctcacat catctgctaa agaatttaca agtagattga aaaacgtagg 1380 cagaggtcaa gtatgccctc tgaaggatgc cctctttttg ttttgcttag ctaggaagtg 1440 accaggaacc tgagcatcat ttaggggcag acagtagaga aaagaaggaa tcagaactcc 1500 tctcctctag ctgtggtttg caaccctttt gggtcacaga acactttatg taggtgatga 1560 aaagtaaaca ttctatgccc agaaaaaatg cacagataca cacacataca aaatcatata 1620 tgtgatttta ggagtttcac agattccctg gtgtccctgg gtaacaccaa agctaagtgt 1680 ccttgtctta gaattttagg aaaaggtata atgtgtatta acccattaac aaaaggaaag 1740 gaattcagaa atattattaa ccaggcatct gtctgtagtt aatatggatc acccaaaacc 1800 caaggctttt gcctaatgaa cactttgggg cacctactgt gtgcaaggct gggggctgtc 1860 aagctcagtt aaaaaaaaaa agatagaaga gatggatcca tgaggcaaag tacagcccca 1920 ggctaatccc acgatcaccc gacttcatgt ccaagagtgg cttctcacct tcattagcca 1980 gttcacaatt ttcatggagt ttttctacct gcactagcaa aaacttcaag gaaaatacat 2040 attaataaat ctaagcaaag tgaccagaag acagagcaat caggagaccc tttgcatcca 2100 gcagaagagg aactgctaag tatttacatc tccacagaga agaatttctg ttgggtttta 2160 attgaacccc aagaaccaca tgattcttca accattattg ggaagatcat tttcttaggt 2220 ctggttttaa ctggcttttt atttgggaat tcatttatgt ttatataaaa tgccaagcat 2280 aacatgaaaa gtggttacag gactattcta agggagagac agaatggaca ccaaaaatat 2340 tccaatgttc ttgtgaatct tttccttgca ccaggacaaa aaaaaaaaga agtgaaaaga 2400 agaaaggagg aggggcataa tcagagtcag taaagacaac tgctattttt atctatcgta 2460 gctgttgcag tcaaatggga agcaatttcc aacattcaac tatggagctg gtacttacat 2520 ggaaatagaa gttgcctagt gtttgttgct ggcaaagagt tatcagagag gttaaatata 2580 taaaagggaa aagagtcaga tacaggttct tcttcctact ttaggttttc cactgtgtgt 2640 gcaaatgata ctccctggtg gtgtgcagat gcctcaaagc tatcctcaca ccacaaggga 2700 gaggagcgag atcctgctgt cctggagaag tgcagagtta gaacagctgt ggccacttgc 2760 atccaatcat caatcttgaa tcacagggac tctttcttaa gtaaacatta tacctggccg 2820 ggcacggtgg ctcacgcctg taatcccagc actttgggat gccaaagtgg gcatatcatc 2880 tgaggtcagg agttcaagac cagcctggcc aacatggcaa aactccgtct ttatgaaaaa 2940 tacaaaaatt agccaggcat ggtggcaggc gcctgtaatc ccagctaatt gggaggctga 3000 ggctggagaa tcccttgaat ctaggaggca gaggttgcag tgagctgaga tcgtgccatt 3060 gcactccagc ctgggtgaca agagtaaaac tctgtctcaa aaaaaaaaaa ttatacctac 3120 attctcttct tatcagagaa aaaaatctac agtgagcttt tcaaaaagtt tttacaaact 3180 ttttgccatt taatttcagt taggagtttt ccctacttct gacttagttg aggggaaatg 3240 ttcataacat gtttataaca tgtttatgtg tgttagttgg tgggggtgta ttactttgcc 3300 atgccatttg tttcctccat gcgtaactta atccagactt tcacacctta taggaaaacc 3360 agtgagtctg gagagctgca tgggctcaca actgaggagg aatttgtaga agggatatac 3420 aaagtggaaa tagacaccaa atcttactgg aaggcacttg gcatctcccc attccatgag 3480 catgcagagg tgagtataca gaccttcgag ggttgttttg gttttggttt ttgcttttgg 3540 cattccagga aatgcacagt tttactcagt gtaccacaga aatgtcctaa ggaaggtgat 3600 gaatgaccaa aggttccctt tcctattata caagaaaaaa ttcacaacac tctgagaagc 3660 aaatttcttt ttgactttga tgaaaatcca cttagtaaca tgacttgaac ttacatgaaa 3720 ctactcatag tctattcatt ccactttata tgaatattga tgtatctgct gttgaaataa 3780 tagtttatga ggcagccctc cagaccccac gtagagtgta tgtaacaaga gatgcaccat 3840 tttatttctc gaaaacccgt aacattcttc attccaaaac acatctggct tctcggaggt 3900 ctggacaagt gattcttggc aacacatacc tatagagaca ataaaatcaa agtaataatg 3960 gcaacacaat agataacatt taccaagcat acaccatgtg gcagacacaa ttataagtgt 4020 tttccatatt taacctactt aatcctcagg aataagccac tgaggtcagt cctattatta 4080 tccccatctt atagatgaag aaaatgaggc accaggaagt caaataactt gtcaaaggtc 4140 acaagactag gaaatacaca agtagaaatg tttacaatta aggcccaggc tgggtttgcc 4200 ctcagttctg ctatgcctcg cattatgccc caggaaactt tttcccttgt gaaagccaag 4260 cttaaaaaaa gaaaagccac atttgtaacg tgctctgttc ccctgcctat ggtgaggatc 4320 ttcaaacagt tatacatgga cccagtcccc ctgccttctc cttaatttct taagtcattt 4380 gaaacagatg gctgtcatgg aaatagaatc cagacatgtt ggtcagagtt aaagatcaac 4440 taattccatc aaaaatagct cggcatgaaa gggaactatt ctctggctta gtcatggatg 4500 agactttcaa ttgctataaa gtggttcctt tattagacaa tgttaccagg gaaacaacag 4560 gggtttgttt gacttctggg gcccacaagt caacaagaga gccccatcta ccaaggagca 4620 tgtccctgac tacccctcag ccagcagcaa gacatggacc ccagtcaggg caggagcagg 4680 gtttcggcgg cgcccagcac aagacattgc ccctagagtc tcagccccta ccctcgagta 4740 atagatctgc ctacctgaga ctgttgtttg cccaagagct gggtctcagc ctgatgggaa 4800 ccatataaaa aggttcactg acatactgcc cacatgttgt tctctttcat tagatcttag 4860 cttccttgtc tgctcttcat tcttgcagta ttcattcaac aaacattaaa aaaaaaaaaa 4920 agcattctat gtgtggaaca ctctgctaga tgctgtggat ttagaaatga aaatacatcc 4980 cgacccttgg aatggaaggg aaaggactga agtaagacag attaagcagg accgtcagcc 5040 cagcttgaag cccagataaa tacggagaac aagagagagc gagtagtgag agatgagtcc 5100 caatgcctca ctttggtgac gggtgcgtgg tgggcttcat gcagcttctt ctgataaatg 5160 cctccttcag aactggtcaa ctctaccttg gccagtgacc caggtggtca tagtagattt 5220 accaagggaa aatggaaact tttattagga gctcttaggc ctcttcactt catggatttt 5280 tttttccttt ttttttgaga tggagttttg ccctgtcacc caggctggaa tgcagtggtg 5340 caatctcagc tcactgcaac ctccgcctcc caggttcaag caattctcct gcctcagcct 5400 cccgagtagc tgggactaca ggtgtgcgcc accacaccag gctaattttt gtattttttg 5460 taaagacagg ttttcaccac gttggccagg ctggtctgaa ctccagacct caggtgattc 5520 acctgtctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgtg cccggctact 5580 tcatggattt ttgattacag attatgcctc ttacaatttt taagaagaat caagtgggct 5640 gaaggtcaat gtcaccataa gacaaaagac atttttatta gttgattcta gggaattggc 5700 cttaagggga gccctttctt cctaagagat tcttaggtga ttctcacttc ctcttgcccc 5760 agtattattt ttgtttttgg tatggctcac tcagatcctt ttttcctcct atccctaagt 5820 aatccgggtt tctttttccc atatttagaa caaaatgtat ttatgcagag tgtgtccaaa 5880 cctcaaccca aggcctgtat acaaaataaa tcaaattaaa cacatcttta ctgtcttcta 5940 cctctttcct gacctcaata tatcccaact tgcctcactc tgagaaccaa ggctgtccca 6000 gcacctgagt cgcagatatt ctactgattt gacagaactg tgtgactatc tggaacagca 6060 ttttgatcca caatttgccc agttacaaag cttaaatgag ctctagtgca tgcatatata 6120 tttcaaaatt ccaccatgat cttccacact ctgtattgta aatagagccc tgtaatgctt 6180 ttacttcgta tttcattgct tgttatacat aaaaatatac ttttcttctt catgttagaa 6240 aatgcaaaga ataggagggt gggggaatct ctgggcttgg agacaggaga cttgccttcc 6300 tactatggtt ccatcagaat gtagactggg acaatacaat aattcaagtc tggtttgctc 6360 atctgtaaat tgggaagaat gtttccagct ccagaatgct aaatctctaa gtctgtggtt 6420 ggcagccact attgcagcag ctcttcaatg actcaatgca gttttgcatt ctccctacct 6480 tttttttcta aaaccaataa aatagataca gcctttaggc tttctgggat ttcccttagt 6540 caagctaggg tcatcctgac tttcggcgtg aatttgcaaa acaagacctg actctgtact 6600 cctgctctaa ggactgtgca tggttccaaa ggcttagctt gccagcatat ttgagctttt 6660 tccttctgtt caaactgttc caaaatataa aagaataaaa ttaattaagt tggcactgga 6720 cttccggtgg tcagtcatgt gtgtcatctg tcacgttttt cgggctctgg tggaaatgga 6780 tctgtctgtc ttctctcata ggtggtattc acagccaacg actccggccc ccgccgctac 6840 accattgccg ccctgctgag cccctactcc tattccacca cggctgtcgt caccaatccc 6900 aaggaatgag ggacttctcc tccagtggac ctgaaggacg agggatggga tttcatgtaa 6960 ccaagagtat tccattttta ctaaagcagt gttttcacct catatgctat gttagaagtc 7020 caggcagaga caataaaaca ttcctgtgaa aggcactttt cattccactt taacttgatt 7080 ttttaaattc ccttattgtc ccttccaaaa aaaagagaat caaaatttta caaagaatca 7140 aaggaattct agaaagtatc tgggcagaac gctaggagag atccaaattt ccattgtctt 7200 gcaagcaaag cacgtattaa atatgatctg cagccattaa aaagacacat tctgtaaa 7258 <210> 4 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60 ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120 cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180 tgggagccat ttgcctctgg gaaaaccagt gagtctggag agctgcatgg gctcacaact 240 gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300 gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360 ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420 gtcgtcacca atcccaagga atga 444 <210> 5 <211> 147 <212> PRT <213> Mus musculus <400> 5 Met Ala Ser Leu Arg Leu Phe Leu Leu Cys Leu Ala Gly Leu Val Phe 1 5 10 15 Val Ser Glu Ala Gly Pro Ala Gly Ala Gly Glu Ser Lys Cys Pro Leu 20 25 30 Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Val Asp Val 35 40 45 Ala Val Lys Val Phe Lys Lys Thr Ser Glu Gly Ser Trp Glu Pro Phe 50 55 60 Ala Ser Gly Lys Thr Ala Glu Ser Gly Glu Leu His Gly Leu Thr Thr 65 70 75 80 Asp Glu Lys Phe Val Glu Gly Val Tyr Arg Val Glu Leu Asp Thr Lys 85 90 95 Ser Tyr Trp Lys Thr Leu Gly Ile Ser Pro Phe His Glu Phe Ala Asp 100 105 110 Val Val Phe Thr Ala Asn Asp Ser Gly His Arg His Tyr Thr Ile Ala 115 120 125 Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Ser Asn 130 135 140 Pro Gln Asn 145 <210> 6 <211> 1237 <212> DNA <213> Mus musculus <400> 6 ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt ttgttgacta 60 agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc agcctgggtt 120 ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtcacacaga tccacaagct 180 cctgacagga tggcttccct tcgactcttc ctcctttgcc tcgctggact ggtatttgtg 240 tctgaagctg gccccgcggg tgctggagaa tccaaatgtc ctctgatggt caaagtcctg 300 gatgctgtcc gaggcagccc tgctgtagac gtggctgtaa aagtgttcaa aaagacctct 360 gagggatcct gggagccctt tgcctctggg aagaccgcgg agtctggaga gctgcacggg 420 ctcaccacag atgagaagtt tgtagaagga gtgtacagag tagaactgga caccaaatcg 480 tactggaaga cacttggcat ttccccgttc catgaattcg cggatgtggt tttcacagcc 540 aacgactctg gccatcgcca ctacaccatc gcagccctgc tcagcccata ctcctacagc 600 accacggctg tcgtcagcaa cccccagaat tgagagactc agcccaggag gaccaggatc 660 ttgccaaagc agtagcatcc catttgtacc aaaacagtgt tcttgctcta taaaccgtgt 720 tagcagctca ggaagatgcc gtgaagcatt cttattaaac cacctgctat ttcattcaaa 780 ctgtgtttct tttttatttc ctcatttttc tcccctgctc ctaaaaccca aaatcttcta 840 aagaattcta gaaggtatgc gatcaaactt tttaaagaaa gaaaatactt tttgactcat 900 ggtttaaagg catcctttcc atcttgggga ggtcatgggt gctcctggca acttgcttga 960 ggaagatagg tcagaaagca gagtggacca accgttcaat gttttacaag caaaacatac 1020 actaagcatg gtctgtagct attaaaagca cacaatctga agggctgtag atgcacagta 1080 gtgttttccc agagcatgtt caaaagccct gggttcaatc acaatactga aaagtaggcc 1140 aaaaaacatt ctgaaaatga aatatttggg ttttttttta taacctttag tgactaaata 1200 aagacaaatc taagagacta aaaaaaaaaa aaaaaaa 1237 <210> 7 <211> 9077 <212> DNA <213> Mus musculus <400> 7 ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt ttgttgacta 60 agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc agcctgggtt 120 ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtcacacaga tccacaagct 180 cctgacagga tggcttccct tcgactcttc ctcctttgcc tcgctggact ggtatttgtg 240 tctgaagctg gccccgcggt gagtgatcct gtgagcgatc cagacatggc agttagacct 300 tagataaaga agaagtgcct tcttccagat gtgagaacta gagtactcag actctatatt 360 taccattaga ctccaaagag aagagctgga gtgcctctgg ctcttccttc tattgcttta 420 gcgcattggg tctgtagtgc tcagtctctg gtgtccttag ataataaaga tatgagatta 480 acatagaaat aaagatataa aagggctgga tgtatagttt agtggtccag tgtatgccta 540 gtatgtgaaa agccttctgt tcaacctcta gcaatagaaa aacaagatat attctcggtg 600 gggctgttaa tattgaattc tcataaaatc tttaatatat ttagtatgcc tattatgttg 660 ttatatttta gttctttagc taatcaaaat gcattattga tctttctttg tctttttttg 720 gccaacactc tattccagtc tttgaaaaag tcctttaaaa gagttaatca gtataattaa 780 atgagtcagg aagtatgtga gggttatttt acaaccagag ggaattacta tagcaacagc 840 tgattagaat gatctcaaga aaaagcccat tctgtctttt tgcaccatgc acctttcagt 900 ggctccattc agatggagag gcaaacagag caatggctct cagagggcct attttccctt 960 tgaacattca ttatccatat ccctggtgca cagcagtgca tctgggggca gaaactgttc 1020 ttgctttgga aacaatgctg tctatgtcat actggataaa gaagctcatt aattgtcaac 1080 acttatgtta tcataatggg atcagcatgt acttttggtt ttgttccaga gtctatcacc 1140 ggaaagaaca agccggttta ctctgaccca tttcactgac atttctcttg tctcctctgt 1200 gcccagggtg ctggagaatc caaatgtcct ctgatggtca aagtcctgga tgctgtccga 1260 ggcagccctg ctgtagacgt ggctgtaaaa gtgttcaaaa agacctctga gggatcctgg 1320 gagccctttg cctctgggta agcttgtaga aagcccacca tgggaccggt tccaggttcc 1380 catttgctct tattcgtgtt agattcagac acacacaact taccagctag agggctcaga 1440 gagagggctc aggggcgaag ggcacgtatt gctcttgtaa gagacacagg tttaattcct 1500 agcaccagaa tggcagctca taaccatctg aaactcacag tcttaggaga tctgggtatc 1560 tgacattctc ttctacccac catgtgtgtg gtgcacaaat tcacatgcag gcatcaaatc 1620 ttataaacaa caacaaaaaa ccaacaaacc tggtagcaaa agaagattag aaggttaaac 1680 atatgagccg agagcttttg ttttgttttg ttttgttttg ttttgtttac atttcaaatg 1740 ttatcccctt tctcggtccc cctccccaaa ccctctaccc cattctctcc tccccttctt 1800 ctatgagggt gttccccacc aacccactcc caccttcctg ctctcgaatt cccctatact 1860 gggacatcaa gccttcacag aatcaagggc ctctcctccc attgatgccc gacaatgtca 1920 tcctctgcta cctatgtggc tggagccatg ggtcccttca tgtatcctcc ttggttggtg 1980 gtttagtctc tgggaggtct gggggatctg gttgattgat attattgttc ttcctatgag 2040 attgcaaacc ccttcagctc cttcggtcct ttaactcctc cactggggac cccgagctca 2100 gtccaatggt tggctgtgag catccaccag cagaggcctt tttttttttt tttaacaaag 2160 ctgctttatt atgttgctta gagcatgacc aggaaccaga gcacagtcca agactgaagg 2220 gaggaaaagg gggggagtca ataaccccac tgtttcatag tggtttgcaa cccttttata 2280 tcacagccca ctttaggcaa ataatgaaaa ttatagtctc cagggacaga gaagatggtg 2340 caggaagtga agtgcctgct cagaaaatgg gggcttgaat gtgagttccc agactctgtg 2400 taagatgccc agcatcgaag tgcatgctta taacaccagc ctggaggtag aagcttagaa 2460 acaggggtac cctgaagttg cttgttcacc agtgtccctg aatgggtagg tgcatgtttg 2520 gtgagagacc ctgtctcaaa aatcaaggtg taggataatt gaaaatacct agctttgagc 2580 ttagatcatg caaatgtgta cacacactca cacacaccac acacacaaaa aaatgcagag 2640 acagagagat acagagagac agagagatac agagacagag acagagagaa aaggagaaag 2700 taaaaaacaa ataatttaaa gacccatggc cacaaagagg ctcaaagaca agcacgtata 2760 aaaccataca catgtaattt taggagtttt cagattccct ggtacccgtg ggtgatgcac 2820 aagctttgaa tcccagtctt aaaatcttac gaagaacgtg ttcgtgtgtg ctaatttatt 2880 gatgagagga aaggaattga caaagtgccc ttccggagct tcctgcatta cccagactca 2940 gggttttttt aaatgtacac tcagaacaga gtagctctgt gcaagggtag caaccacgaa 3000 gcttaataag aaacatatcg tgagagatct gcaaggcaaa tctaggggct gaccaatctc 3060 acagtcaccc actagcatgt caacacaact tcccacctgt gctagccact tagcaatttt 3120 gtgttgttct gttttgtttt tgtttttaac aaagcaattt caaagagatt tctaattcat 3180 ctaaacaaac aaaccaaaag gaaaacagca aagacgccct gagcacttag cagagcagct 3240 atgcagttat gactcctggg tggagacttt atatcaggct tcaactgaat acctagaacc 3300 tactagtgct cttcatcaat ccttgggaag gtcattttct tttggtgctg ttttgagttt 3360 ctatttgtta atgtcttcat aattatacac gtgttgagca cagcatgcaa agtgattagg 3420 ggaatctagt tggagtggaa tggataccca aatattcaga ctttcttgtg actcttcttt 3480 cttgtaccca catcaaaaaa aaaaaaaatg gagatgagac atggtcagag tcactaaaac 3540 cagctgctac ttttaattac gtggggagca gtttctaaca ttgccattat tgaactgatg 3600 ctgcctgggt ggaaatggaa atcacttagt atttcttgtt ggcaaagaat tactgaatgg 3660 attaaatttc caaagggaga agtcagttac aagtcttttc tttgtttatt aggctttctg 3720 ctatgataaa ttacactact tccagaagtt acccttaggc catgggacac tggactatca 3780 ctctgctgtc acaagagatt acagagttag tcaaggcagc ttgtgacacc ttcagggact 3840 gtcataaact tccagcaagt cattaatcct gaatgcaata ctgtgtgtgt gtgtctatgt 3900 gtgtttgtat gtctgtgtgt gtcttatgtc tgtgtctctg tgtgtgtgtg tgtttgtgtg 3960 tgtgtgtgta tgtatgcctg tgtgtgtctt atgtctgtgt ttgtgtgtct gtgtgtgtct 4020 tatgtctgtg tttgtatgtc tgtgtgtgtc tgtgtgtgtc ttatgtctgt gtctctgtgt 4080 gtgtgtgtgt gtatgtatgt atgtatgtat gtatgtgtat gtgtttgcat ctctctgtgt 4140 gtctgcgctt atatatttgt gtatgtgttt atgtgttcgc ctttgtgcgt tgttggggat 4200 tgaatccagg ggaatacaaa tgttaagaaa gaacgttacc actaagcttc acctgtaggc 4260 cttaaagctt ttctttcttt taaaaattgt aattaattca ttttcagtca ggatctccac 4320 acctcgtccc tgctgctcta gaactcacta tttaaacaca atcgccctca aacctgcagc 4380 aaccctcccg cctctaccct gcgagcacta gaataataac aggtgacccc acacgcctag 4440 attaagacct ttaaggtaaa cattttacta tattttagtc tcataagaca agatgctaca 4500 ataaagctgt acataaagtt ccctcgaatt tcttgctatt ttaactcaaa cataaggatt 4560 tcctcctttt tgattcaggt aacagaaaaa atacacaggt acatacatgt acacacatga 4620 acacacacgc atcacaacca catatgcgca cgcttgtgtg atctatcatt taccatgcca 4680 ctgaactctt ctttccccat aaattcctct ggacttgtgt gccctccagg aagaccgcgg 4740 agtctggaga gctgcacggg ctcaccacag atgagaagtt tgtagaagga gtgtacagag 4800 tagaactgga caccaaatcg tactggaaga cacttggcat ttccccgttc catgaattcg 4860 cggatgtaag tggacacacc aagttgtttg gattttgttt ttagtctcag gaaattccct 4920 tcgctcttgc tgtacgatgg gcatgagtgg aaagtagatt ccacagccag aatccacagt 4980 gctgggaaag caagccttct gaatttttct aaaactcatt tagcaacatg gcctgaacct 5040 gttcacactg cttatggtca gctaactata tttatgtaaa tattcatttc tctgttgagg 5100 aaatgttagt atttgctttt gaggcaacct ccagatacca tggagggcat gtcatagtca 5160 aagagagggc tccctatggt atttctctaa attctggcat ttcctttatt ccaaagcaca 5220 tctagtgtcc ccagaagttt gggtagacaa ttcttggcaa cacagagaat tacaacatgt 5280 tcaaaaccca acagcttaat atctaaatca tcaagcaaac atcacatggc aaagggattt 5340 ctgaatcaaa actgtttcat ccttatgatc aacctatgga ggtctagcct cgacttacac 5400 ccattttacc aataagctaa gagaagctaa gttcctcatc aaggacacaa ggctagcatg 5460 tgtgagcaag tgacagagtt gccctctatg ttggttagtg tgccttagcc agtgtctcag 5520 taagaaatgg agctaaatca aaacccaagg ccaacagcca aaggcacatg agtaaccttt 5580 gcttggcact gggctcagtt tccctggctc ctctcagtcc tcagttcaca gaggcagctg 5640 tcatgcaaat agaatccaag cttgttggtc agacctggag ataacaaatt ccatcaaaaa 5700 tagctcctca tgtgacctag tttgctgtct gttgctatga tacacaccat gaccgaaaag 5760 caaccctggg gagagaaggg tttatttcat cttacagctt acagttcacc atggaggaaa 5820 gccaggtggg aacctggaag tggaaattga agcagagacc agaaaggaat gctgtttact 5880 ggctggctta gctccttttc ttatacagct taggtctatg tgcccagggg atggtactgc 5940 cgagcatagg ctgagcccgc ctacatcaac cattagtcaa aaaaaggtcc atagacttgc 6000 ctacaggcca atctcatgga ggcaataccc cagtggaggg tccctcttcg caggttactc 6060 tagtttgtgt caagttgaca aaacctaacc acaaagcaca aacagggtct gcccttgtgg 6120 cttagccatg gatgacactc tcagatgatg gtgttaccag acaaaccaga ggggctcacc 6180 aagagtctgc cacctaccaa ggtagtactc tactcctcac tgggcaccaa cacccatatt 6240 agctgggcca gtacaggacc cttgctgttt cctgcatgaa ttgtccatag accctgggtc 6300 tcagcctgcc gggagtacct gtaagtagtc gcctcaaaca cattattcct gttggaagac 6360 ttgtctgatt ctcttttaga actcaatcaa caaacgtttt tattttgttt tggctttttg 6420 gagacaagat ctctcatagg ccagcctgac ttgaatgtag ctgaggatga cctgtgctgc 6480 taatcttctc gcctcttcct cccaagtggt aggataatag gcataagaca ccacagcagt 6540 tttactccat accagggctc tgaacccaga ctttaaacac tctatcaact gattcacatt 6600 cccaccccat cattcaacaa acatttgaaa aataaaaccc ttctgccttg agcactctgc 6660 taaatacagc ctttgagtgc ggagtatttc ctcacaacca gggtccaaga tgaccccatc 6720 atacatacca cggaaaatta ggagatgttt ttaggtctct ttgcttgggg taatttttat 6780 gtgtgtgtgt acacagccct gtgcgtgtgt gtgtgtgtgt gtgtgtgtgt gtacaggcac 6840 acacgtgtat gcatgtagag gctacataaa aaccttaggt gtcattctca ggcactctgt 6900 tcaccccttc acacagcccg aacacacaaa atttgaggca ttagcctgga gctcaccagt 6960 taggctagac tgacttgcca gcagacccca ggctgtctcc atctccccag ctctgggatt 7020 acaaactcta tcataccaga catttttata catattctga gcataaaatt catgtcttca 7080 ggctaacaag tcaagagctt aaatgactga gctctcttac gtggtggatt ttttttaaaa 7140 ctacataata tctttttttt ttttttcact tctggggaag aaacaaatga gcctgagtga 7200 caatgcgaca gaaaagaaat tttgaggagt gtgtgtgtct gtgtgtgtgg tggcacatgc 7260 ctctcatcta atgctagagg ctacagtaga atgctcctga attagtggcc agccaaggcc 7320 aagggctagg gttgtaactc agtggcagag ggcttgccta gcattcgcag gatttgatcc 7380 atagcgctat aaataataat aaataaatac aacagtctaa gatgattctc cctttcattt 7440 atctggatgt tatttttgtg ttagttttac tctgtcatcc aatcattgtt tgccctatat 7500 ttggacattt aaaaaaaatc tttattccaa gtgtgttcaa agctgtatcc aaaacctgtc 7560 caccaaatga gtccaatgac atacatcttc tatattacca tctgttccag atttggctga 7620 ctcccggcac ctgggctgtt gctgcaccca tgtctcagat agtctagtga tttgagaagt 7680 gactagtaat tgcaaaatcc agactttgtc cagaaacttc tatgagctcc aaaactttca 7740 tttacatttc tgccagccac aaaccgcttg tgttgtggag agaaccctgt gatgtcttcc 7800 cacagcatct cagccttgtt tcttccctta aaatattcat cttttcacat tagaacatgc 7860 aaagggacag tgggagcgaa acccctggac tgggacgcac gaagccttcc tttctggtca 7920 ggctctcact gtagaaactt aggccggttt cagcatgcag tctgctggag aatggctcct 7980 gccaacattc caggtctgga agtttgtagt ggagttgttg ataaccactg ttcgccacag 8040 gtcttttgtt tgtgggtgtc agtgtttcta ctctcctgac ttttatctga acccaagaaa 8100 gggaacaata gccttcaagc tctctgtgac tctgatctga ccagggccac ccacactgca 8160 gaaggaaact tgcaaagaga gacctgcaat tctctaagag ctccacacag ctccaaagac 8220 ttaggcagca tattttaatc taattattcg tcccccaacc ccaccccaga ggacagttag 8280 acaataaaag gaagattacc agcttagcat cctgtgaaca ctttgtctgc agctcctacc 8340 tctgggctct gttagaacta gctgtctctc ctctctccta ggtggttttc acagccaacg 8400 actctggcca tcgccactac accatcgcag ccctgctcag cccatactcc tacagcacca 8460 cggctgtcgt cagcaacccc cagaattgag agactcagcc caggaggacc aggatcttgc 8520 caaagcagta gcatcccatt tgtaccaaaa cagtgttctt gctctataaa ccgtgttagc 8580 agctcaggaa gatgccgtga agcattctta ttaaaccacc tgctatttca ttcaaactgt 8640 gtttcttttt tatttcctca tttttctccc ctgctcctaa aacccaaaat cttctaaaga 8700 attctagaag gtatgcgatc aaacttttta aagaaagaaa atactttttg actcatggtt 8760 taaaggcatc ctttccatct tggggaggtc atgggtgctc ctggcaactt gcttgaggaa 8820 gataggtcag aaagcagagt ggaccaaccg ttcaatgttt tacaagcaaa acatacacta 8880 agcatggtct gtagctatta aaagcacaca atctgaaggg ctgtagatgc acagtagtgt 8940 tttcccagag catgttcaaa agccctgggt tcaatcacaa tactgaaaag taggccaaaa 9000 aacattctga aaatgaaata tttgggtttt tttttataac ctttagtgac taaataaaga 9060 caaatctaag agactaa 9077 <210> 8 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60 ggccccgcgg gtgctggaga atccaaatgt cctctgatgg tcaaagtcct ggatgctgtc 120 cgaggcagcc ctgctgtaga cgtggctgta aaagtgttca aaaagacctc tgagggatcc 180 tgggagccct ttgcctctgg gaagaccgcg gagtctggag agctgcacgg gctcaccaca 240 gatgagaagt ttgtagaagg agtgtacaga gtagaactgg acaccaaatc gtactggaag 300 acacttggca tttccccgtt ccatgaattc gcggatgtgg ttttcacagc caacgactct 360 ggccatcgcc actacaccat cgcagccctg ctcagcccat actcctacag caccacggct 420 gtcgtcagca acccccagaa ttga 444 <210> 9 <211> 147 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 9 Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe 1 5 10 15 Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu 20 25 30 Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val 35 40 45 Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe 50 55 60 Ala Ser Gly Lys Thr Ser Glu Ser Ser Asp Ser His Gly Leu Thr Thr 65 70 75 80 Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys 85 90 95 Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu 100 105 110 Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala 115 120 125 Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn 130 135 140 Pro Lys Glu 145 <210> 10 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60 ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120 cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180 tgggagccat ttgcctctgg gaaaaccagt gagtctagcg attcgcatgg gctcacaact 240 gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300 gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360 ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420 gtcgtcacca atcccaagga atga 444 <210> 11 <211> 8300 <212> DNA <213> Mus musculus <400> 11 atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60 ggccccgcgg tgagtgatcc tgtgagcgat ccagacatgg cagttagacc ttagataaag 120 aagaagtgcc ttcttccaga tgtgagaact agagtactca gactctatat ttaccattag 180 actccaaaga gaagagctgg agtgcctctg gctcttcctt ctattgcttt agcgcattgg 240 gtctgtagtg ctcagtctct ggtgtcctta gataataaag atatgagatt aacatagaaa 300 taaagatata aaagggctgg atgtatagtt tagtggtcca gtgtatgcct agtatgtgaa 360 aagccttctg ttcaacctct agcaatagaa aaacaagata tattctcggt ggggctgtta 420 atattgaatt ctcataaaat ctttaatata tttagtatgc ctattatgtt gttatatttt 480 agttctttag ctaatcaaaa tgcattattg atctttcttt gtcttttttt ggccaacact 540 ctattccagt ctttgaaaaa gtcctttaaa agagttaatc agtataatta aatgagtcag 600 gaagtatgtg agggttattt tacaaccaga gggaattact atagcaacag ctgattagaa 660 tgatctcaag aaaaagccca ttctgtcttt ttgcaccatg cacctttcag tggctccatt 720 cagatggaga ggcaaacaga gcaatggctc tcagagggcc tattttccct ttgaacattc 780 attatccata tccctggtgc acagcagtgc atctgggggc agaaactgtt cttgctttgg 840 aaacaatgct gtctatgtca tactggataa agaagctcat taattgtcaa cacttatgtt 900 atcataatgg gatcagcatg tacttttggt tttgttccag agtctatcac cggaaagaac 960 aagccggttt actctgaccc atttcactga catttctctt gtctcctctg tgcccagggt 1020 gctggagaat ccaaatgtcc tctgatggtc aaagtcctgg atgctgtccg aggcagccct 1080 gctgtagacg tggctgtaaa agtgttcaaa aagacctctg agggatcctg ggagcccttt 1140 gcctctgggt aagcttgtag aaagcccacc atgggaccgg ttccaggttc ccatttgctc 1200 ttattcgtgt tagattcaga cacacacaac ttaccagcta gagggctcag agagagggct 1260 caggggcgaa gggcacgtat tgctcttgta agagacacag gtttaattcc tagcaccaga 1320 atggcagctc ataaccatct gaaactcaca gtcttaggag atctgggtat ctgacattct 1380 cttctaccca ccatgtgtgt ggtgcacaaa ttcacatgca ggcatcaaat cttataaaca 1440 acaacaaaaa accaacaaac ctggtagcaa aagaagatta gaaggttaaa catatgagcc 1500 gagagctttt gttttgtttt gttttgtttt gttttgttta catttcaaat gttatcccct 1560 ttctcggtcc ccctccccaa accctctacc ccattctctc ctccccttct tctatgaggg 1620 tgttccccac caacccactc ccaccttcct gctctcgaat tcccctatac tgggacatca 1680 agccttcaca gaatcaaggg cctctcctcc cattgatgcc cgacaatgtc atcctctgct 1740 acctatgtgg ctggagccat gggtcccttc atgtatcctc cttggttggt ggtttagtct 1800 ctgggaggtc tgggggatct ggttgattga tattattgtt cttcctatga gattgcaaac 1860 cccttcagct ccttcggtcc tttaactcct ccactgggga ccccgagctc agtccaatgg 1920 ttggctgtga gcatccacca gcagaggcct tttttttttt ttttaacaaa gctgctttat 1980 tatgttgctt agagcatgac caggaaccag agcacagtcc aagactgaag ggaggaaaag 2040 ggggggagtc aataacccca ctgtttcata gtggtttgca acccttttat atcacagccc 2100 actttaggca aataatgaaa attatagtct ccagggacag agaagatggt gcaggaagtg 2160 aagtgcctgc tcagaaaatg ggggcttgaa tgtgagttcc cagactctgt gtaagatgcc 2220 cagcatcgaa gtgcatgctt ataacaccag cctggaggta gaagcttaga aacaggggta 2280 ccctgaagtt gcttgttcac cagtgtccct gaatgggtag gtgcatgttt ggtgagagac 2340 cctgtctcaa aaatcaaggt gtaggataat tgaaaatacc tagctttgag cttagatcat 2400 gcaaatgtgt acacacactc acacacacca cacacacaaa aaaatgcaga gacagagaga 2460 tacagagaga cagagagata cagagacaga gacagagaga aaaggagaaa gtaaaaaaca 2520 aataatttaa agacccatgg ccacaaagag gctcaaagac aagcacgtat aaaaccatac 2580 acatgtaatt ttaggagttt tcagattccc tggtacccgt gggtgatgca caagctttga 2640 atcccagtct taaaatctta cgaagaacgt gttcgtgtgt gctaatttat tgatgagagg 2700 aaaggaattg acaaagtgcc cttccggagc ttcctgcatt acccagactc agggtttttt 2760 taaatgtaca ctcagaacag agtagctctg tgcaagggta gcaaccacga agcttaataa 2820 gaaacatatc gtgagagatc tgcaaggcaa atctaggggc tgaccaatct cacagtcacc 2880 cactagcatg tcaacacaac ttcccacctg tgctagccac ttagcaattt tgtgttgttc 2940 tgttttgttt ttgtttttaa caaagcaatt tcaaagagat ttctaattca tctaaacaaa 3000 caaaccaaaa ggaaaacagc aaagacgccc tgagcactta gcagagcagc tatgcagtta 3060 tgactcctgg gtggagactt tatatcaggc ttcaactgaa tacctagaac ctactagtgc 3120 tcttcatcaa tccttgggaa ggtcattttc ttttggtgct gttttgagtt tctatttgtt 3180 aatgtcttca taattataca cgtgttgagc acagcatgca aagtgattag gggaatctag 3240 ttggagtgga atggataccc aaatattcag actttcttgt gactcttctt tcttgtaccc 3300 acatcaaaaa aaaaaaaaat ggagatgaga catggtcaga gtcactaaaa ccagctgcta 3360 cttttaatta cgtggggagc agtttctaac attgccatta ttgaactgat gctgcctggg 3420 tggaaatgga aatcacttag tatttcttgt tggcaaagaa ttactgaatg gattaaattt 3480 ccaaagggag aagtcagtta caagtctttt ctttgtttat taggctttct gctatgataa 3540 attacactac ttccagaagt tacccttagg ccatgggaca ctggactatc actctgctgt 3600 cacaagagat tacagagtta gtcaaggcag cttgtgacac cttcagggac tgtcataaac 3660 ttccagcaag tcattaatcc tgaatgcaat actgtgtgtg tgtgtctatg tgtgtttgta 3720 tgtctgtgtg tgtcttatgt ctgtgtctct gtgtgtgtgt gtgtttgtgt gtgtgtgtgt 3780 atgtatgcct gtgtgtgtct tatgtctgtg tttgtgtgtc tgtgtgtgtc ttatgtctgt 3840 gtttgtatgt ctgtgtgtgt ctgtgtgtgt cttatgtctg tgtctctgtg tgtgtgtgtg 3900 tgtatgtatg tatgtatgta tgtatgtgta tgtgtttgca tctctctgtg tgtctgcgct 3960 tatatatttg tgtatgtgtt tatgtgttcg cctttgtgcg ttgttgggga ttgaatccag 4020 gggaatacaa atgttaagaa agaacgttac cactaagctt cacctgtagg ccttaaagct 4080 tttctttctt ttaaaaattg taattaattc attttcagtc aggatctcca cacctcgtcc 4140 ctgctgctct agaactcact atttaaacac aatcgccctc aaacctgcag caaccctccc 4200 gcctctaccc tgcgagcact agaataataa caggtgaccc cacacgccta gattaagacc 4260 tttaaggtaa acattttact atattttagt ctcataagac aagatgctac aataaagctg 4320 tacataaagt tccctcgaat ttcttgctat tttaactcaa acataaggat ttcctccttt 4380 ttgattcagg taacagaaaa aatacacagg tacatacatg tacacacatg aacacacacg 4440 catcacaacc acatatgcgc acgcttgtgt gatctatcat ttaccatgcc actgaactct 4500 tctttcccca taaattcctc tggacttgtg tgccctccag gaagaccgcg gagtctggag 4560 agctgcacgg gctcaccaca gatgagaagt ttgtagaagg agtgtacaga gtagaactgg 4620 acaccaaatc gtactggaag acacttggca tttccccgtt ccatgaattc gcggatgtaa 4680 gtggacacac caagttgttt ggattttgtt tttagtctca ggaaattccc ttcgctcttg 4740 ctgtacgatg ggcatgagtg gaaagtagat tccacagcca gaatccacag tgctgggaaa 4800 gcaagccttc tgaatttttc taaaactcat ttagcaacat ggcctgaacc tgttcacact 4860 gcttatggtc agctaactat atttatgtaa atattcattt ctctgttgag gaaatgttag 4920 tatttgcttt tgaggcaacc tccagatacc atggagggca tgtcatagtc aaagagaggg 4980 ctccctatgg tatttctcta aattctggca tttcctttat tccaaagcac atctagtgtc 5040 cccagaagtt tgggtagaca attcttggca acacagagaa ttacaacatg ttcaaaaccc 5100 aacagcttaa tatctaaatc atcaagcaaa catcacatgg caaagggatt tctgaatcaa 5160 aactgtttca tccttatgat caacctatgg aggtctagcc tcgacttaca cccattttac 5220 caataagcta agagaagcta agttcctcat caaggacaca aggctagcat gtgtgagcaa 5280 gtgacagagt tgccctctat gttggttagt gtgccttagc cagtgtctca gtaagaaatg 5340 gagctaaatc aaaacccaag gccaacagcc aaaggcacat gagtaacctt tgcttggcac 5400 tgggctcagt ttccctggct cctctcagtc ctcagttcac agaggcagct gtcatgcaaa 5460 tagaatccaa gcttgttggt cagacctgga gataacaaat tccatcaaaa atagctcctc 5520 atgtgaccta gtttgctgtc tgttgctatg atacacacca tgaccgaaaa gcaaccctgg 5580 ggagagaagg gtttatttca tcttacagct tacagttcac catggaggaa agccaggtgg 5640 gaacctggaa gtggaaattg aagcagagac cagaaaggaa tgctgtttac tggctggctt 5700 agctcctttt cttatacagc ttaggtctat gtgcccaggg gatggtactg ccgagcatag 5760 gctgagcccg cctacatcaa ccattagtca aaaaaaggtc catagacttg cctacaggcc 5820 aatctcatgg aggcaatacc ccagtggagg gtccctcttc gcaggttact ctagtttgtg 5880 tcaagttgac aaaacctaac cacaaagcac aaacagggtc tgcccttgtg gcttagccat 5940 ggatgacact ctcagatgat ggtgttacca gacaaaccag aggggctcac caagagtctg 6000 ccacctacca aggtagtact ctactcctca ctgggcacca acacccatat tagctgggcc 6060 agtacaggac ccttgctgtt tcctgcatga attgtccata gaccctgggt ctcagcctgc 6120 cgggagtacc tgtaagtagt cgcctcaaac acattattcc tgttggaaga cttgtctgat 6180 tctcttttag aactcaatca acaaacgttt ttattttgtt ttggcttttt ggagacaaga 6240 tctctcatag gccagcctga cttgaatgta gctgaggatg acctgtgctg ctaatcttct 6300 cgcctcttcc tcccaagtgg taggataata ggcataagac accacagcag ttttactcca 6360 taccagggct ctgaacccag actttaaaca ctctatcaac tgattcacat tcccacccca 6420 tcattcaaca aacatttgaa aaataaaacc cttctgcctt gagcactctg ctaaatacag 6480 cctttgagtg cggagtattt cctcacaacc agggtccaag atgaccccat catacatacc 6540 acggaaaatt aggagatgtt tttaggtctc tttgcttggg gtaattttta tgtgtgtgtg 6600 tacacagccc tgtgcgtgtg tgtgtgtgtg tgtgtgtgtg tgtacaggca cacacgtgta 6660 tgcatgtaga ggctacataa aaaccttagg tgtcattctc aggcactctg ttcacccctt 6720 cacacagccc gaacacacaa aatttgaggc attagcctgg agctcaccag ttaggctaga 6780 ctgacttgcc agcagacccc aggctgtctc catctcccca gctctgggat tacaaactct 6840 atcataccag acatttttat acatattctg agcataaaat tcatgtcttc aggctaacaa 6900 gtcaagagct taaatgactg agctctctta cgtggtggat tttttttaaa actacataat 6960 atcttttttt tttttttcac ttctggggaa gaaacaaatg agcctgagtg acaatgcgac 7020 agaaaagaaa ttttgaggag tgtgtgtgtc tgtgtgtgtg gtggcacatg cctctcatct 7080 aatgctagag gctacagtag aatgctcctg aattagtggc cagccaaggc caagggctag 7140 ggttgtaact cagtggcaga gggcttgcct agcattcgca ggatttgatc catagcgcta 7200 taaataataa taaataaata caacagtcta agatgattct ccctttcatt tatctggatg 7260 ttatttttgt gttagtttta ctctgtcatc caatcattgt ttgccctata tttggacatt 7320 taaaaaaaat ctttattcca agtgtgttca aagctgtatc caaaacctgt ccaccaaatg 7380 agtccaatga catacatctt ctatattacc atctgttcca gatttggctg actcccggca 7440 cctgggctgt tgctgcaccc atgtctcaga tagtctagtg atttgagaag tgactagtaa 7500 ttgcaaaatc cagactttgt ccagaaactt ctatgagctc caaaactttc atttacattt 7560 ctgccagcca caaaccgctt gtgttgtgga gagaaccctg tgatgtcttc ccacagcatc 7620 tcagccttgt ttcttccctt aaaatattca tcttttcaca ttagaacatg caaagggaca 7680 gtgggagcga aacccctgga ctgggacgca cgaagccttc ctttctggtc aggctctcac 7740 tgtagaaact taggccggtt tcagcatgca gtctgctgga gaatggctcc tgccaacatt 7800 ccaggtctgg aagtttgtag tggagttgtt gataaccact gttcgccaca ggtcttttgt 7860 ttgtgggtgt cagtgtttct actctcctga cttttatctg aacccaagaa agggaacaat 7920 agccttcaag ctctctgtga ctctgatctg accagggcca cccacactgc agaaggaaac 7980 ttgcaaagag agacctgcaa ttctctaaga gctccacaca gctccaaaga cttaggcagc 8040 atattttaat ctaattattc gtcccccaac cccaccccag aggacagtta gacaataaaa 8100 ggaagattac cagcttagca tcctgtgaac actttgtctg cagctcctac ctctgggctc 8160 tgttagaact agctgtctct cctctctcct aggtggtttt cacagccaac gactctggcc 8220 atcgccacta caccatcgca gccctgctca gcccatactc ctacagcacc acggctgtcg 8280 tcagcaaccc ccagaattga 8300 <210> 12 <211> 11817 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(97) <223> Mouse Sequence <220> <221> misc_feature <222> (98)..(7298) <223> Human Sequence <220> <221> misc_feature <222> (7299)..(11717) <223> Cassette Sequence <220> <221> misc_feature <222> (11718)..(11817) <223> Mouse Sequence <400> 12 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60 gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120 cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180 gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240 tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300 aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360 gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420 tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480 gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540 cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600 ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660 ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720 actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780 taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840 ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900 tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960 acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020 taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080 ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140 ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200 ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260 tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320 aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380 gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440 aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500 aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560 acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620 ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680 aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740 taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800 tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860 atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920 gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980 aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040 tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100 aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160 gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220 tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280 cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340 aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400 ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460 ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520 ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580 tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640 ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700 agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760 agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820 tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880 aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940 cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000 gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060 aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120 ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180 tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240 gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300 ttcacacctt ataggaaaac cagtgagtct agcgattcgc atgggctcac aactgaggag 3360 gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420 ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480 ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540 aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600 attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660 atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720 atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780 atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840 cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900 aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960 ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020 ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080 tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140 aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200 ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260 cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320 ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380 tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440 tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500 atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560 agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620 cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680 ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740 tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800 ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860 caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920 tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980 gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040 cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100 tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160 ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220 cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280 ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340 gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400 ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460 actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520 gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580 ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640 agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700 attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760 tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820 tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880 acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940 ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000 gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060 gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120 aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180 cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240 gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300 taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360 taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420 agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480 ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540 aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600 tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660 attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720 tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780 gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840 acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900 gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960 tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020 tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080 tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140 gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200 aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260 aagacacatt ccaagggccc acttctttac tgtgggcaat gtatgctata cgaagttata 7320 tgcatgccag tagcagcacc cacgtccacc ttctgtctag taatgtccaa cacctccctc 7380 agtccaaaca ctgctctgca tccatgtggc tcccatttat acctgaagca cttgatgggg 7440 cctcaatgtt ttactagagc ccacccccct gcaactctga gaccctctgg atttgtctgt 7500 cagtgcctca ctggggcgtt ggataatttc ttaaaaggtc aagttccctc agcagcattc 7560 tctgagcagt ctgaagatgt gtgcttttca cagttcaaat ccatgtggct gtttcaccca 7620 cctgcctggc cttgggttat ctatcaggac ctagcctaga agcaggtgtg tggcacttaa 7680 cacctaagct gagtgactaa ctgaacactc aagtggatgc catctttgtc acttcttgac 7740 tgtgacacaa gcaactcctg atgccaaagc cctgcccacc cctctcatgc ccatatttgg 7800 acatggtaca ggtcctcact ggccatggtc tgtgaggtcc tggtcctctt tgacttcata 7860 attcctaggg gccactagta tctataagag gaagagggtg ctggctccca ggccacagcc 7920 cacaaaattc cacctgctca caggttggct ggctcgaccc aggtggtgtc ccctgctctg 7980 agccagctcc cggccaagcc agcaccatgg gaacccccaa gaagaagagg aaggtgcgta 8040 ccgatttaaa ttccaattta ctgaccgtac accaaaattt gcctgcatta ccggtcgatg 8100 caacgagtga tgaggttcgc aagaacctga tggacatgtt cagggatcgc caggcgtttt 8160 ctgagcatac ctggaaaatg cttctgtccg tttgccggtc gtgggcggca tggtgcaagt 8220 tgaataaccg gaaatggttt cccgcagaac ctgaagatgt tcgcgattat cttctatatc 8280 ttcaggcgcg cggtctggca gtaaaaacta tccagcaaca tttgggccag ctaaacatgc 8340 ttcatcgtcg gtccgggctg ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc 8400 ggcggatccg aaaagaaaac gttgatgccg gtgaacgtgc aaaacaggta aatataaaat 8460 ttttaagtgt ataatgatgt taaactactg attctaattg tttgtgtatt ttaggctcta 8520 gcgttcgaac gcactgattt cgaccaggtt cgttcactca tggaaaatag cgatcgctgc 8580 caggatatac gtaatctggc atttctgggg attgcttata acaccctgtt acgtatagcc 8640 gaaattgcca ggatcagggt taaagatatc tcacgtactg acggtgggag aatgttaatc 8700 catattggca gaacgaaaac gctggttagc accgcaggtg tagagaaggc acttagcctg 8760 ggggtaacta aactggtcga gcgatggatt tccgtctctg gtgtagctga tgatccgaat 8820 aactacctgt tttgccgggt cagaaaaaat ggtgttgccg cgccatctgc caccagccag 8880 ctatcaactc gcgccctgga agggattttt gaagcaactc atcgattgat ttacggcgct 8940 aaggatgact ctggtcagag atacctggcc tggtctggac acagtgcccg tgtcggagcc 9000 gcgcgagata tggcccgcgc tggagtttca ataccggaga tcatgcaagc tggtggctgg 9060 accaatgtaa atattgtcat gaactatatc cgtaacctgg atagtgaaac aggggcaatg 9120 gtgcgcctgc tggaagatgg cgattaggcg gccggccgct aatcagccat accacatttg 9180 tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa 9240 tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca 9300 atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 9360 ccaaactcat caatgtatct tatcatgtct ggatcccccg gctagagttt aaacactaga 9420 actagtggat cccccgggat catggcctcc gcgccgggtt ttggcgcctc ccgcgggcgc 9480 ccccctcctc acggcgagcg ctgccacgtc agacgaaggg cgcagcgagc gtcctgatcc 9540 ttccgcccgg acgctcagga cagcggcccg ctgctcataa gactcggcct tagaacccca 9600 gtatcagcag aaggacattt taggacggga cttgggtgac tctagggcac tggttttctt 9660 tccagagagc ggaacaggcg aggaaaagta gtcccttctc ggcgattctg cggagggatc 9720 tccgtggggc ggtgaacgcc gatgattata taaggacgcg ccgggtgtgg cacagctagt 9780 tccgtcgcag ccgggatttg ggtcgcggtt cttgtttgtg gatcgctgtg atcgtcactt 9840 ggtgagtagc gggctgctgg gctggccggg gctttcgtgg ccgccgggcc gctcggtggg 9900 acggaagcgt gtggagagac cgccaagggc tgtagtctgg gtccgcgagc aaggttgccc 9960 tgaactgggg gttgggggga gcgcagcaaa atggcggctg ttcccgagtc ttgaatggaa 10020 gacgcttgtg aggcgggctg tgaggtcgtt gaaacaaggt ggggggcatg gtgggcggca 10080 agaacccaag gtcttgaggc cttcgctaat gcgggaaagc tcttattcgg gtgagatggg 10140 ctggggcacc atctggggac cctgacgtga agtttgtcac tgactggaga actcggtttg 10200 tcgtctgttg cgggggcggc agttatggcg gtgccgttgg gcagtgcacc cgtacctttg 10260 ggagcgcgcg ccctcgtcgt gtcgtgacgt cacccgttct gttggcttat aatgcagggt 10320 ggggccacct gccggtaggt gtgcggtagg cttttctccg tcgcaggacg cagggttcgg 10380 gcctagggta ggctctcctg aatcgacagg cgccggacct ctggtgaggg gagggataag 10440 tgaggcgtca gtttctttgg tcggttttat gtacctatct tcttaagtag ctgaagctcc 10500 ggttttgaac tatgcgctcg gggttggcga gtgtgttttg tgaagttttt taggcacctt 10560 ttgaaatgta atcatttggg tcaatatgta attttcagtg ttagactagt aaattgtccg 10620 ctaaattctg gccgtttttg gcttttttgt tagacgtgtt gacaattaat catcggcata 10680 gtatatcggc atagtataat acgacaaggt gaggaactaa accatgaccg agtacaagcc 10740 cacggtgcgc ctcgccaccc gcgacgacgt ccccagggcc gtacgcaccc tcgccgccgc 10800 gttcgccgac taccccgcca cgcgccacac cgtcgatccg gaccgccaca tcgagcgggt 10860 caccgagctg caagaactct tcctcacgcg cgtcgggctc gacatcggca aggtgtgggt 10920 cgcggacgac ggcgccgcgg tggcggtctg gaccacgccg gagagcgtcg aagcgggggc 10980 ggtgttcgcc gagatcggcc cgcgcatggc cgagttgagc ggttcccggc tggccgcgca 11040 gcaacagatg gaaggcctcc tggcgccgca ccggcccaag gagcccgcgt ggttcctggc 11100 caccgtcggc gtctcgcccg accaccaggg caagggtctg ggcagcgccg tcgtgctccc 11160 cggagtggag gcggccgagc gcgccggggt gcccgccttc ctggagacct ccgcgccccg 11220 caacctcccc ttctacgagc ggctcggctt caccgtcacc gccgacgtcg aggtgcccga 11280 aggaccgcgc acctggtgca tgacccgcaa gcccggtgcc tgacgcccgc cccacgaccc 11340 gcagcgcccg accgaaagga gcgcacgacc ccatgcatcg atgatctaga gctcgctgat 11400 cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 11460 ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 11520 cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 11580 gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggcttctg 11640 aggcggccta gataacttcg tataatgtat gctatacgaa gttatgctag gtaactataa 11700 cggtcctaag gtagcgagag actcagccca ggaggaccag gatcttgcca aagcagtagc 11760 atcccatttg taccaaaaca gtgttcttgc tctataaacc gtgttagcag ctcagga 11817 <210> 13 <211> 7476 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(97) <223> Mouse Sequence <220> <221> misc_feature <222> (98)..(7298) <223> Human Sequence <220> <221> misc_feature <222> (7299)..(7376) <223> Cassette LoxP Scar <220> <221> misc_feature <222> (7377)..(7476) <223> Mouse Sequence <400> 13 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60 gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120 cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180 gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240 tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300 aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360 gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420 tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480 gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540 cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600 ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660 ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720 actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780 taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840 ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900 tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960 acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020 taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080 ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140 ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200 ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260 tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320 aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380 gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440 aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500 aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560 acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620 ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680 aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740 taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800 tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860 atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920 gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980 aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040 tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100 aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160 gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220 tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280 cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340 aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400 ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460 ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520 ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580 tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640 ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700 agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760 agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820 tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880 aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940 cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000 gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060 aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120 ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180 tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240 gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300 ttcacacctt ataggaaaac cagtgagtct agcgattcgc atgggctcac aactgaggag 3360 gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420 ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480 ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540 aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600 attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660 atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720 atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780 atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840 cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900 aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960 ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020 ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080 tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140 aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200 ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260 cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320 ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380 tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440 tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500 atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560 agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620 cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680 ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740 tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800 ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860 caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920 tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980 gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040 cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100 tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160 ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220 cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280 ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340 gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400 ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460 actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520 gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580 ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640 agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700 attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760 tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820 tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880 acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940 ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000 gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060 gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120 aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180 cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240 gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300 taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360 taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420 agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480 ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540 aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600 tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660 attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720 tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780 gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840 acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900 gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960 tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020 tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080 tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140 gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200 aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260 aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320 tatgctatac gaagttatgc taggtaacta taacggtcct aaggtagcga gctagcgaga 7380 ctcagcccag gaggaccagg atcttgccaa agcagtagca tcccatttgt accaaaacag 7440 tgttcttgct ctataaaccg tgttagcagc tcagga 7476 <210> 14 <211> 7201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60 ggccctacgg tgagtgtttc tgtgacatcc cattcctaca tttaagattc acgctaaatg 120 aagtagaagt gactccttcc agctttgcca accagctttt attactaggg caagggtacc 180 cagcatctat ttttaatata attaattcaa acttcaaaaa gaatgaagtt ccactgagct 240 tactgagctg ggacttgaac tctgagcatt ctacctcatt gctttggtgc attaggtttg 300 taatatctgg tacctctgtt tcctcagata gatgatagaa ataaagatat gatattaagg 360 aagctgttaa tactgaattt tcagaaaagt atccctccat aaaatgtatt tgggggacaa 420 actgcaggag attatattct ggccctatag ttattcaaaa cgtatttatt gattaatctt 480 taaaaggctt agtgaacaat attctagtca gatatctaat tcttaaatcc tctagaagaa 540 ttaactaata ctataaaatg ggtctggatg tagttctgac attattttat aacaactggt 600 aagagggagt gactatagca acaactaaaa tgatctcagg aaaacctgtt tggccctatg 660 tatggtacat tacatctttt cagtaattcc actcaaatgg agacttttaa caaagcaact 720 gttctcaggg gacctatttt ctcccttaaa attcattata cacatccctg gttgatagca 780 gtgtgtctgg aggcagaaac cattcttgct ttggaaacaa ttacgtctgt gttatactga 840 gtagggaagc tcattaattg tcgacactta cgttcctgat aatgggatca gtgtgtaatt 900 cttgtttcgc tccagatttc taataccaca aagaataaat cctttcactc tgatcaattt 960 tgttaacttc tcacgtgtct tctctacacc cagggcaccg gtgaatccaa gtgtcctctg 1020 atggtcaaag ttctagatgc tgtccgaggc agtcctgcca tcaatgtggc cgtgcatgtg 1080 ttcagaaagg ctgctgatga cacctgggag ccatttgcct ctgggtaagt tgccaaagaa 1140 ccctcccaca ggacttggtt ttatcttccc gtttgcccct cacttggtag agagaggctc 1200 acatcatctg ctaaagaatt tacaagtaga ttgaaaaacg taggcagagg tcaagtatgc 1260 cctctgaagg atgccctctt tttgttttgc ttagctagga agtgaccagg aacctgagca 1320 tcatttaggg gcagacagta gagaaaagaa ggaatcagaa ctcctctcct ctagctgtgg 1380 tttgcaaccc ttttgggtca cagaacactt tatgtaggtg atgaaaagta aacattctat 1440 gcccagaaaa aatgcacaga tacacacaca tacaaaatca tatatgtgat tttaggagtt 1500 tcacagattc cctggtgtcc ctgggtaaca ccaaagctaa gtgtccttgt cttagaattt 1560 taggaaaagg tataatgtgt attaacccat taacaaaagg aaaggaattc agaaatatta 1620 ttaaccaggc atctgtctgt agttaatatg gatcacccaa aacccaaggc ttttgcctaa 1680 tgaacacttt ggggcaccta ctgtgtgcaa ggctgggggc tgtcaagctc agttaaaaaa 1740 aaaaagatag aagagatgga tccatgaggc aaagtacagc cccaggctaa tcccacgatc 1800 acccgacttc atgtccaaga gtggcttctc accttcatta gccagttcac aattttcatg 1860 gagtttttct acctgcacta gcaaaaactt caaggaaaat acatattaat aaatctaagc 1920 aaagtgacca gaagacagag caatcaggag accctttgca tccagcagaa gaggaactgc 1980 taagtattta catctccaca gagaagaatt tctgttgggt tttaattgaa ccccaagaac 2040 cacatgattc ttcaaccatt attgggaaga tcattttctt aggtctggtt ttaactggct 2100 ttttatttgg gaattcattt atgtttatat aaaatgccaa gcataacatg aaaagtggtt 2160 acaggactat tctaagggag agacagaatg gacaccaaaa atattccaat gttcttgtga 2220 atcttttcct tgcaccagga caaaaaaaaa aagaagtgaa aagaagaaag gaggaggggc 2280 ataatcagag tcagtaaaga caactgctat ttttatctat cgtagctgtt gcagtcaaat 2340 gggaagcaat ttccaacatt caactatgga gctggtactt acatggaaat agaagttgcc 2400 tagtgtttgt tgctggcaaa gagttatcag agaggttaaa tatataaaag ggaaaagagt 2460 cagatacagg ttcttcttcc tactttaggt tttccactgt gtgtgcaaat gatactccct 2520 ggtggtgtgc agatgcctca aagctatcct cacaccacaa gggagaggag cgagatcctg 2580 ctgtcctgga gaagtgcaga gttagaacag ctgtggccac ttgcatccaa tcatcaatct 2640 tgaatcacag ggactctttc ttaagtaaac attatacctg gccgggcacg gtggctcacg 2700 cctgtaatcc cagcactttg ggatgccaaa gtgggcatat catctgaggt caggagttca 2760 agaccagcct ggccaacatg gcaaaactcc gtctttatga aaaatacaaa aattagccag 2820 gcatggtggc aggcgcctgt aatcccagct aattgggagg ctgaggctgg agaatccctt 2880 gaatctagga ggcagaggtt gcagtgagct gagatcgtgc cattgcactc cagcctgggt 2940 gacaagagta aaactctgtc tcaaaaaaaa aaaattatac ctacattctc ttcttatcag 3000 agaaaaaaat ctacagtgag cttttcaaaa agtttttaca aactttttgc catttaattt 3060 cagttaggag ttttccctac ttctgactta gttgagggga aatgttcata acatgtttat 3120 aacatgttta tgtgtgttag ttggtggggg tgtattactt tgccatgcca tttgtttcct 3180 ccatgcgtaa cttaatccag actttcacac cttataggaa aaccagtgag tctagcgatt 3240 cgcatgggct cacaactgag gaggaatttg tagaagggat atacaaagtg gaaatagaca 3300 ccaaatctta ctggaaggca cttggcatct ccccattcca tgagcatgca gaggtgagta 3360 tacagacctt cgagggttgt tttggttttg gtttttgctt ttggcattcc aggaaatgca 3420 cagttttact cagtgtacca cagaaatgtc ctaaggaagg tgatgaatga ccaaaggttc 3480 cctttcctat tatacaagaa aaaattcaca acactctgag aagcaaattt ctttttgact 3540 ttgatgaaaa tccacttagt aacatgactt gaacttacat gaaactactc atagtctatt 3600 cattccactt tatatgaata ttgatgtatc tgctgttgaa ataatagttt atgaggcagc 3660 cctccagacc ccacgtagag tgtatgtaac aagagatgca ccattttatt tctcgaaaac 3720 ccgtaacatt cttcattcca aaacacatct ggcttctcgg aggtctggac aagtgattct 3780 tggcaacaca tacctataga gacaataaaa tcaaagtaat aatggcaaca caatagataa 3840 catttaccaa gcatacacca tgtggcagac acaattataa gtgttttcca tatttaacct 3900 acttaatcct caggaataag ccactgaggt cagtcctatt attatcccca tcttatagat 3960 gaagaaaatg aggcaccagg aagtcaaata acttgtcaaa ggtcacaaga ctaggaaata 4020 cacaagtaga aatgtttaca attaaggccc aggctgggtt tgccctcagt tctgctatgc 4080 ctcgcattat gccccaggaa actttttccc ttgtgaaagc caagcttaaa aaaagaaaag 4140 ccacatttgt aacgtgctct gttcccctgc ctatggtgag gatcttcaaa cagttataca 4200 tggacccagt ccccctgcct tctccttaat ttcttaagtc atttgaaaca gatggctgtc 4260 atggaaatag aatccagaca tgttggtcag agttaaagat caactaattc catcaaaaat 4320 agctcggcat gaaagggaac tattctctgg cttagtcatg gatgagactt tcaattgcta 4380 taaagtggtt cctttattag acaatgttac cagggaaaca acaggggttt gtttgacttc 4440 tggggcccac aagtcaacaa gagagcccca tctaccaagg agcatgtccc tgactacccc 4500 tcagccagca gcaagacatg gaccccagtc agggcaggag cagggtttcg gcggcgccca 4560 gcacaagaca ttgcccctag agtctcagcc cctaccctcg agtaatagat ctgcctacct 4620 gagactgttg tttgcccaag agctgggtct cagcctgatg ggaaccatat aaaaaggttc 4680 actgacatac tgcccacatg ttgttctctt tcattagatc ttagcttcct tgtctgctct 4740 tcattcttgc agtattcatt caacaaacat taaaaaaaaa aaaaagcatt ctatgtgtgg 4800 aacactctgc tagatgctgt ggatttagaa atgaaaatac atcccgaccc ttggaatgga 4860 agggaaagga ctgaagtaag acagattaag caggaccgtc agcccagctt gaagcccaga 4920 taaatacgga gaacaagaga gagcgagtag tgagagatga gtcccaatgc ctcactttgg 4980 tgacgggtgc gtggtgggct tcatgcagct tcttctgata aatgcctcct tcagaactgg 5040 tcaactctac cttggccagt gacccaggtg gtcatagtag atttaccaag ggaaaatgga 5100 aacttttatt aggagctctt aggcctcttc acttcatgga tttttttttc cttttttttt 5160 gagatggagt tttgccctgt cacccaggct ggaatgcagt ggtgcaatct cagctcactg 5220 caacctccgc ctcccaggtt caagcaattc tcctgcctca gcctcccgag tagctgggac 5280 tacaggtgtg cgccaccaca ccaggctaat ttttgtattt tttgtaaaga caggttttca 5340 ccacgttggc caggctggtc tgaactccag acctcaggtg attcacctgt ctcagcctcc 5400 caaagtgctg ggattacagg tgtgagccac cgtgcccggc tacttcatgg atttttgatt 5460 acagattatg cctcttacaa tttttaagaa gaatcaagtg ggctgaaggt caatgtcacc 5520 ataagacaaa agacattttt attagttgat tctagggaat tggccttaag gggagccctt 5580 tcttcctaag agattcttag gtgattctca cttcctcttg ccccagtatt atttttgttt 5640 ttggtatggc tcactcagat ccttttttcc tcctatccct aagtaatccg ggtttctttt 5700 tcccatattt agaacaaaat gtatttatgc agagtgtgtc caaacctcaa cccaaggcct 5760 gtatacaaaa taaatcaaat taaacacatc tttactgtct tctacctctt tcctgacctc 5820 aatatatccc aacttgcctc actctgagaa ccaaggctgt cccagcacct gagtcgcaga 5880 tattctactg atttgacaga actgtgtgac tatctggaac agcattttga tccacaattt 5940 gcccagttac aaagcttaaa tgagctctag tgcatgcata tatatttcaa aattccacca 6000 tgatcttcca cactctgtat tgtaaataga gccctgtaat gcttttactt cgtatttcat 6060 tgcttgttat acataaaaat atacttttct tcttcatgtt agaaaatgca aagaatagga 6120 gggtggggga atctctgggc ttggagacag gagacttgcc ttcctactat ggttccatca 6180 gaatgtagac tgggacaata caataattca agtctggttt gctcatctgt aaattgggaa 6240 gaatgtttcc agctccagaa tgctaaatct ctaagtctgt ggttggcagc cactattgca 6300 gcagctcttc aatgactcaa tgcagttttg cattctccct accttttttt tctaaaacca 6360 ataaaataga tacagccttt aggctttctg ggatttccct tagtcaagct agggtcatcc 6420 tgactttcgg cgtgaatttg caaaacaaga cctgactctg tactcctgct ctaaggactg 6480 tgcatggttc caaaggctta gcttgccagc atatttgagc tttttccttc tgttcaaact 6540 gttccaaaat ataaaagaat aaaattaatt aagttggcac tggacttccg gtggtcagtc 6600 atgtgtgtca tctgtcacgt ttttcgggct ctggtggaaa tggatctgtc tgtcttctct 6660 cataggtggt attcacagcc aacgactccg gcccccgccg ctacaccatt gccgccctgc 6720 tgagccccta ctcctattcc accacggctg tcgtcaccaa tcccaaggaa tgagggactt 6780 ctcctccagt ggacctgaag gacgagggat gggatttcat gtaaccaaga gtattccatt 6840 tttactaaag cagtgttttc acctcatatg ctatgttaga agtccaggca gagacaataa 6900 aacattcctg tgaaaggcac ttttcattcc actttaactt gattttttaa attcccttat 6960 tgtcccttcc aaaaaaaaga gaatcaaaat tttacaaaga atcaaaggaa ttctagaaag 7020 tatctgggca gaacgctagg agagatccaa atttccattg tcttgcaagc aaagcacgta 7080 ttaaatatga tctgcagcca ttaaaaagac acattctgta aatgagagag ccttattttc 7140 ctgtaacctt cagcaaatag caaaagacac attccaaggg cccacttctt tactgtgggc 7200 a 7201 <210> 15 <211> 12208 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(97) <223> Mouse Sequence <220> <221> misc_feature <222> (98)..(7298) <223> Human Sequence <220> <221> misc_feature <222> (7299)..(12108) <223> Cassette Sequence <220> <221> misc_feature <222> (12109)..(12208) <223> Mouse Sequence <400> 15 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60 gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120 cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180 gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240 tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300 aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360 gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420 tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480 gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540 cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600 ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660 ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720 actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780 taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840 ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900 tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960 acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020 taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080 ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140 ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200 ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260 tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320 aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380 gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440 aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500 aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560 acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620 ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680 aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740 taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800 tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860 atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920 gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980 aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040 tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100 aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160 gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220 tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280 cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340 aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400 ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460 ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520 ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580 tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640 ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700 agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760 agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820 tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880 aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940 cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000 gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060 aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120 ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180 tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240 gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300 ttcacacctt ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag 3360 gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420 ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480 ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540 aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600 attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660 atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720 atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780 atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840 cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900 aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960 ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020 ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080 tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140 aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200 ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260 cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320 ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380 tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440 tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500 atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560 agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620 cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680 ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740 tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800 ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860 caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920 tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980 gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040 cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100 tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160 ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220 cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280 ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340 gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400 ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460 actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520 gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580 ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640 agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700 attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760 tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820 tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880 acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940 ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000 gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060 gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120 aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180 cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240 gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300 taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360 taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420 agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480 ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540 aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600 tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660 attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720 tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780 gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840 acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900 gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960 tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020 tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080 tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140 gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200 aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260 aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320 tatgctatac gaagttatat gcatgccagt agcagcaccc acgtccacct tctgtctagt 7380 aatgtccaac acctccctca gtccaaacac tgctctgcat ccatgtggct cccatttata 7440 cctgaagcac ttgatggggc ctcaatgttt tactagagcc cacccccctg caactctgag 7500 accctctgga tttgtctgtc agtgcctcac tggggcgttg gataatttct taaaaggtca 7560 agttccctca gcagcattct ctgagcagtc tgaagatgtg tgcttttcac agttcaaatc 7620 catgtggctg tttcacccac ctgcctggcc ttgggttatc tatcaggacc tagcctagaa 7680 gcaggtgtgt ggcacttaac acctaagctg agtgactaac tgaacactca agtggatgcc 7740 atctttgtca cttcttgact gtgacacaag caactcctga tgccaaagcc ctgcccaccc 7800 ctctcatgcc catatttgga catggtacag gtcctcactg gccatggtct gtgaggtcct 7860 ggtcctcttt gacttcataa ttcctagggg ccactagtat ctataagagg aagagggtgc 7920 tggctcccag gccacagccc acaaaattcc acctgctcac aggttggctg gctcgaccca 7980 ggtggtgtcc cctgctctga gccagctccc ggccaagcca gcaccatggg aacccccaag 8040 aagaagagga aggtgcgtac cgatttaaat tccaatttac tgaccgtaca ccaaaatttg 8100 cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat ggacatgttc 8160 agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt ttgccggtcg 8220 tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc tgaagatgtt 8280 cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat ccagcaacat 8340 ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag tgacagcaat 8400 gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg tgaacgtgca 8460 aaacaggtaa atataaaatt tttaagtgta taatgatgtt aaactactga ttctaattgt 8520 ttgtgtattt taggctctag cgttcgaacg cactgatttc gaccaggttc gttcactcat 8580 ggaaaatagc gatcgctgcc aggatatacg taatctggca tttctgggga ttgcttataa 8640 caccctgtta cgtatagccg aaattgccag gatcagggtt aaagatatct cacgtactga 8700 cggtgggaga atgttaatcc atattggcag aacgaaaacg ctggttagca ccgcaggtgt 8760 agagaaggca cttagcctgg gggtaactaa actggtcgag cgatggattt ccgtctctgg 8820 tgtagctgat gatccgaata actacctgtt ttgccgggtc agaaaaaatg gtgttgccgc 8880 gccatctgcc accagccagc tatcaactcg cgccctggaa gggatttttg aagcaactca 8940 tcgattgatt tacggcgcta aggatgactc tggtcagaga tacctggcct ggtctggaca 9000 cagtgcccgt gtcggagccg cgcgagatat ggcccgcgct ggagtttcaa taccggagat 9060 catgcaagct ggtggctgga ccaatgtaaa tattgtcatg aactatatcc gtaacctgga 9120 tagtgaaaca ggggcaatgg tgcgcctgct ggaagatggc gattaggcgg ccggccgcta 9180 atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 9240 ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 9300 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 9360 cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatcccccgg 9420 ctagagttta aacactagaa ctagtggatc ccccgggatc atggcctccg cgccgggttt 9480 tggcgcctcc cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca gacgaagggc 9540 gcagcgagcg tcctgatcct tccgcccgga cgctcaggac agcggcccgc tgctcataag 9600 actcggcctt agaaccccag tatcagcaga aggacatttt aggacgggac ttgggtgact 9660 ctagggcact ggttttcttt ccagagagcg gaacaggcga ggaaaagtag tcccttctcg 9720 gcgattctgc ggagggatct ccgtggggcg gtgaacgccg atgattatat aaggacgcgc 9780 cgggtgtggc acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg 9840 atcgctgtga tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg ctttcgtggc 9900 cgccgggccg ctcggtggga cggaagcgtg tggagagacc gccaagggct gtagtctggg 9960 tccgcgagca aggttgccct gaactggggg ttggggggag cgcagcaaaa tggcggctgt 10020 tcccgagtct tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg aaacaaggtg 10080 gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg cgggaaagct 10140 cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa gtttgtcact 10200 gactggagaa ctcggtttgt cgtctgttgc gggggcggca gttatggcgg tgccgttggg 10260 cagtgcaccc gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc acccgttctg 10320 ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc ttttctccgt 10380 cgcaggacgc agggttcggg cctagggtag gctctcctga atcgacaggc gccggacctc 10440 tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg tacctatctt 10500 cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag tgtgttttgt 10560 gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa ttttcagtgt 10620 tagactagta aattgtccgc taaattctgg ccgtttttgg cttttttgtt agacgtgttg 10680 acaattaatc atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa 10740 ccatgggatc ggccattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 10800 agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 10860 tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 10920 tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 10980 gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 11040 tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 11100 ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 11160 cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 11220 atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc 11280 gcatgcccga cggcgatgat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 11340 tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 11400 gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 11460 ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 11520 atcgccttct tgacgagttc ttctgagggg atccgctgta agtctgcaga aattgatgat 11580 ctattaaaca ataaagatgt ccactaaaat ggaagttttt cctgtcatac tttgttaaga 11640 agggtgagaa cagagtacct acattttgaa tggaaggatt ggagctacgg gggtgggggt 11700 ggggtgggat tagataaatg cctgctcttt actgaaggct ctttactatt gctttatgat 11760 aatgtttcat agttggatat cataatttaa acaagcaaaa ccaaattaag ggccagctca 11820 ttcctcccac tcatgatcta tagatctata gatctctcgt gggatcattg tttttctctt 11880 gattcccact ttgtggttct aagtactgtg gtttccaaat gtgtcagttt catagcctga 11940 agaacgagat cagcagcctc tgttccacat acacttcatt ctcagtattg ttttgccaag 12000 ttctaattcc atcagacctc gacctgcagc ccctagataa cttcgtataa tgtatgctat 12060 acgaagttat gctaggtaac tataacggtc ctaaggtagc gagctagcga gactcagccc 12120 aggaggacca ggatcttgcc aaagcagtag catcccattt gtaccaaaac agtgttcttg 12180 ctctataaac cgtgttagca gctcagga 12208 <210> 16 <211> 7476 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(97) <223> Mouse Sequence <220> <221> misc_feature <222> (98)..(7298) <223> Human Sequence <220> <221> misc_feature <222> (7299)..(7376) <223> Cassette LoxP Scar <220> <221> misc_feature <222> (7377)..(7476) <223> Mouse Sequence <400> 16 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60 gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120 cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180 gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240 tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300 aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360 gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420 tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480 gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540 cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600 ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660 ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720 actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780 taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840 ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900 tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960 acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020 taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080 ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140 ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200 ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260 tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320 aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380 gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440 aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500 aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560 acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620 ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680 aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740 taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800 tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860 atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920 gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980 aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040 tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100 aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160 gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220 tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280 cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340 aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400 ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460 ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520 ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580 tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640 ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700 agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760 agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820 tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880 aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940 cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000 gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060 aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120 ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180 tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240 gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300 ttcacacctt ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag 3360 gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420 ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480 ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540 aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600 attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660 atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720 atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780 atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840 cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900 aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960 ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020 ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080 tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140 aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200 ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260 cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320 ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380 tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440 tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500 atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560 agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620 cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680 ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740 tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800 ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860 caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920 tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980 gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040 cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100 tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160 ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220 cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280 ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340 gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400 ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460 actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520 gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580 ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640 agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700 attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760 tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820 tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880 acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940 ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000 gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060 gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120 aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180 cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240 gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300 taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360 taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420 agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480 ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540 aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600 tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660 attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720 tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780 gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840 acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900 gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960 tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020 tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080 tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140 gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200 aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260 aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320 tatgctatac gaagttatgc taggtaacta taacggtcct aaggtagcga gctagcgaga 7380 ctcagcccag gaggaccagg atcttgccaa agcagtagca tcccatttgt accaaaacag 7440 tgttcttgct ctataaaccg tgttagcagc tcagga 7476 <210> 17 <211> 7201 <212> DNA <213> Homo sapiens <400> 17 atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60 ggccctacgg tgagtgtttc tgtgacatcc cattcctaca tttaagattc acgctaaatg 120 aagtagaagt gactccttcc agctttgcca accagctttt attactaggg caagggtacc 180 cagcatctat ttttaatata attaattcaa acttcaaaaa gaatgaagtt ccactgagct 240 tactgagctg ggacttgaac tctgagcatt ctacctcatt gctttggtgc attaggtttg 300 taatatctgg tacctctgtt tcctcagata gatgatagaa ataaagatat gatattaagg 360 aagctgttaa tactgaattt tcagaaaagt atccctccat aaaatgtatt tgggggacaa 420 actgcaggag attatattct ggccctatag ttattcaaaa cgtatttatt gattaatctt 480 taaaaggctt agtgaacaat attctagtca gatatctaat tcttaaatcc tctagaagaa 540 ttaactaata ctataaaatg ggtctggatg tagttctgac attattttat aacaactggt 600 aagagggagt gactatagca acaactaaaa tgatctcagg aaaacctgtt tggccctatg 660 tatggtacat tacatctttt cagtaattcc actcaaatgg agacttttaa caaagcaact 720 gttctcaggg gacctatttt ctcccttaaa attcattata cacatccctg gttgatagca 780 gtgtgtctgg aggcagaaac cattcttgct ttggaaacaa ttacgtctgt gttatactga 840 gtagggaagc tcattaattg tcgacactta cgttcctgat aatgggatca gtgtgtaatt 900 cttgtttcgc tccagatttc taataccaca aagaataaat cctttcactc tgatcaattt 960 tgttaacttc tcacgtgtct tctctacacc cagggcaccg gtgaatccaa gtgtcctctg 1020 atggtcaaag ttctagatgc tgtccgaggc agtcctgcca tcaatgtggc cgtgcatgtg 1080 ttcagaaagg ctgctgatga cacctgggag ccatttgcct ctgggtaagt tgccaaagaa 1140 ccctcccaca ggacttggtt ttatcttccc gtttgcccct cacttggtag agagaggctc 1200 acatcatctg ctaaagaatt tacaagtaga ttgaaaaacg taggcagagg tcaagtatgc 1260 cctctgaagg atgccctctt tttgttttgc ttagctagga agtgaccagg aacctgagca 1320 tcatttaggg gcagacagta gagaaaagaa ggaatcagaa ctcctctcct ctagctgtgg 1380 tttgcaaccc ttttgggtca cagaacactt tatgtaggtg atgaaaagta aacattctat 1440 gcccagaaaa aatgcacaga tacacacaca tacaaaatca tatatgtgat tttaggagtt 1500 tcacagattc cctggtgtcc ctgggtaaca ccaaagctaa gtgtccttgt cttagaattt 1560 taggaaaagg tataatgtgt attaacccat taacaaaagg aaaggaattc agaaatatta 1620 ttaaccaggc atctgtctgt agttaatatg gatcacccaa aacccaaggc ttttgcctaa 1680 tgaacacttt ggggcaccta ctgtgtgcaa ggctgggggc tgtcaagctc agttaaaaaa 1740 aaaaagatag aagagatgga tccatgaggc aaagtacagc cccaggctaa tcccacgatc 1800 acccgacttc atgtccaaga gtggcttctc accttcatta gccagttcac aattttcatg 1860 gagtttttct acctgcacta gcaaaaactt caaggaaaat acatattaat aaatctaagc 1920 aaagtgacca gaagacagag caatcaggag accctttgca tccagcagaa gaggaactgc 1980 taagtattta catctccaca gagaagaatt tctgttgggt tttaattgaa ccccaagaac 2040 cacatgattc ttcaaccatt attgggaaga tcattttctt aggtctggtt ttaactggct 2100 ttttatttgg gaattcattt atgtttatat aaaatgccaa gcataacatg aaaagtggtt 2160 acaggactat tctaagggag agacagaatg gacaccaaaa atattccaat gttcttgtga 2220 atcttttcct tgcaccagga caaaaaaaaa aagaagtgaa aagaagaaag gaggaggggc 2280 ataatcagag tcagtaaaga caactgctat ttttatctat cgtagctgtt gcagtcaaat 2340 gggaagcaat ttccaacatt caactatgga gctggtactt acatggaaat agaagttgcc 2400 tagtgtttgt tgctggcaaa gagttatcag agaggttaaa tatataaaag ggaaaagagt 2460 cagatacagg ttcttcttcc tactttaggt tttccactgt gtgtgcaaat gatactccct 2520 ggtggtgtgc agatgcctca aagctatcct cacaccacaa gggagaggag cgagatcctg 2580 ctgtcctgga gaagtgcaga gttagaacag ctgtggccac ttgcatccaa tcatcaatct 2640 tgaatcacag ggactctttc ttaagtaaac attatacctg gccgggcacg gtggctcacg 2700 cctgtaatcc cagcactttg ggatgccaaa gtgggcatat catctgaggt caggagttca 2760 agaccagcct ggccaacatg gcaaaactcc gtctttatga aaaatacaaa aattagccag 2820 gcatggtggc aggcgcctgt aatcccagct aattgggagg ctgaggctgg agaatccctt 2880 gaatctagga ggcagaggtt gcagtgagct gagatcgtgc cattgcactc cagcctgggt 2940 gacaagagta aaactctgtc tcaaaaaaaa aaaattatac ctacattctc ttcttatcag 3000 agaaaaaaat ctacagtgag cttttcaaaa agtttttaca aactttttgc catttaattt 3060 cagttaggag ttttccctac ttctgactta gttgagggga aatgttcata acatgtttat 3120 aacatgttta tgtgtgttag ttggtggggg tgtattactt tgccatgcca tttgtttcct 3180 ccatgcgtaa cttaatccag actttcacac cttataggaa aaccagtgag tctggagagc 3240 tgcatgggct cacaactgag gaggaatttg tagaagggat atacaaagtg gaaatagaca 3300 ccaaatctta ctggaaggca cttggcatct ccccattcca tgagcatgca gaggtgagta 3360 tacagacctt cgagggttgt tttggttttg gtttttgctt ttggcattcc aggaaatgca 3420 cagttttact cagtgtacca cagaaatgtc ctaaggaagg tgatgaatga ccaaaggttc 3480 cctttcctat tatacaagaa aaaattcaca acactctgag aagcaaattt ctttttgact 3540 ttgatgaaaa tccacttagt aacatgactt gaacttacat gaaactactc atagtctatt 3600 cattccactt tatatgaata ttgatgtatc tgctgttgaa ataatagttt atgaggcagc 3660 cctccagacc ccacgtagag tgtatgtaac aagagatgca ccattttatt tctcgaaaac 3720 ccgtaacatt cttcattcca aaacacatct ggcttctcgg aggtctggac aagtgattct 3780 tggcaacaca tacctataga gacaataaaa tcaaagtaat aatggcaaca caatagataa 3840 catttaccaa gcatacacca tgtggcagac acaattataa gtgttttcca tatttaacct 3900 acttaatcct caggaataag ccactgaggt cagtcctatt attatcccca tcttatagat 3960 gaagaaaatg aggcaccagg aagtcaaata acttgtcaaa ggtcacaaga ctaggaaata 4020 cacaagtaga aatgtttaca attaaggccc aggctgggtt tgccctcagt tctgctatgc 4080 ctcgcattat gccccaggaa actttttccc ttgtgaaagc caagcttaaa aaaagaaaag 4140 ccacatttgt aacgtgctct gttcccctgc ctatggtgag gatcttcaaa cagttataca 4200 tggacccagt ccccctgcct tctccttaat ttcttaagtc atttgaaaca gatggctgtc 4260 atggaaatag aatccagaca tgttggtcag agttaaagat caactaattc catcaaaaat 4320 agctcggcat gaaagggaac tattctctgg cttagtcatg gatgagactt tcaattgcta 4380 taaagtggtt cctttattag acaatgttac cagggaaaca acaggggttt gtttgacttc 4440 tggggcccac aagtcaacaa gagagcccca tctaccaagg agcatgtccc tgactacccc 4500 tcagccagca gcaagacatg gaccccagtc agggcaggag cagggtttcg gcggcgccca 4560 gcacaagaca ttgcccctag agtctcagcc cctaccctcg agtaatagat ctgcctacct 4620 gagactgttg tttgcccaag agctgggtct cagcctgatg ggaaccatat aaaaaggttc 4680 actgacatac tgcccacatg ttgttctctt tcattagatc ttagcttcct tgtctgctct 4740 tcattcttgc agtattcatt caacaaacat taaaaaaaaa aaaaagcatt ctatgtgtgg 4800 aacactctgc tagatgctgt ggatttagaa atgaaaatac atcccgaccc ttggaatgga 4860 agggaaagga ctgaagtaag acagattaag caggaccgtc agcccagctt gaagcccaga 4920 taaatacgga gaacaagaga gagcgagtag tgagagatga gtcccaatgc ctcactttgg 4980 tgacgggtgc gtggtgggct tcatgcagct tcttctgata aatgcctcct tcagaactgg 5040 tcaactctac cttggccagt gacccaggtg gtcatagtag atttaccaag ggaaaatgga 5100 aacttttatt aggagctctt aggcctcttc acttcatgga tttttttttc cttttttttt 5160 gagatggagt tttgccctgt cacccaggct ggaatgcagt ggtgcaatct cagctcactg 5220 caacctccgc ctcccaggtt caagcaattc tcctgcctca gcctcccgag tagctgggac 5280 tacaggtgtg cgccaccaca ccaggctaat ttttgtattt tttgtaaaga caggttttca 5340 ccacgttggc caggctggtc tgaactccag acctcaggtg attcacctgt ctcagcctcc 5400 caaagtgctg ggattacagg tgtgagccac cgtgcccggc tacttcatgg atttttgatt 5460 acagattatg cctcttacaa tttttaagaa gaatcaagtg ggctgaaggt caatgtcacc 5520 ataagacaaa agacattttt attagttgat tctagggaat tggccttaag gggagccctt 5580 tcttcctaag agattcttag gtgattctca cttcctcttg ccccagtatt atttttgttt 5640 ttggtatggc tcactcagat ccttttttcc tcctatccct aagtaatccg ggtttctttt 5700 tcccatattt agaacaaaat gtatttatgc agagtgtgtc caaacctcaa cccaaggcct 5760 gtatacaaaa taaatcaaat taaacacatc tttactgtct tctacctctt tcctgacctc 5820 aatatatccc aacttgcctc actctgagaa ccaaggctgt cccagcacct gagtcgcaga 5880 tattctactg atttgacaga actgtgtgac tatctggaac agcattttga tccacaattt 5940 gcccagttac aaagcttaaa tgagctctag tgcatgcata tatatttcaa aattccacca 6000 tgatcttcca cactctgtat tgtaaataga gccctgtaat gcttttactt cgtatttcat 6060 tgcttgttat acataaaaat atacttttct tcttcatgtt agaaaatgca aagaatagga 6120 gggtggggga atctctgggc ttggagacag gagacttgcc ttcctactat ggttccatca 6180 gaatgtagac tgggacaata caataattca agtctggttt gctcatctgt aaattgggaa 6240 gaatgtttcc agctccagaa tgctaaatct ctaagtctgt ggttggcagc cactattgca 6300 gcagctcttc aatgactcaa tgcagttttg cattctccct accttttttt tctaaaacca 6360 ataaaataga tacagccttt aggctttctg ggatttccct tagtcaagct agggtcatcc 6420 tgactttcgg cgtgaatttg caaaacaaga cctgactctg tactcctgct ctaaggactg 6480 tgcatggttc caaaggctta gcttgccagc atatttgagc tttttccttc tgttcaaact 6540 gttccaaaat ataaaagaat aaaattaatt aagttggcac tggacttccg gtggtcagtc 6600 atgtgtgtca tctgtcacgt ttttcgggct ctggtggaaa tggatctgtc tgtcttctct 6660 cataggtggt attcacagcc aacgactccg gcccccgccg ctacaccatt gccgccctgc 6720 tgagccccta ctcctattcc accacggctg tcgtcaccaa tcccaaggaa tgagggactt 6780 ctcctccagt ggacctgaag gacgagggat gggatttcat gtaaccaaga gtattccatt 6840 tttactaaag cagtgttttc acctcatatg ctatgttaga agtccaggca gagacaataa 6900 aacattcctg tgaaaggcac ttttcattcc actttaactt gattttttaa attcccttat 6960 tgtcccttcc aaaaaaaaga gaatcaaaat tttacaaaga atcaaaggaa ttctagaaag 7020 tatctgggca gaacgctagg agagatccaa atttccattg tcttgcaagc aaagcacgta 7080 ttaaatatga tctgcagcca ttaaaaagac acattctgta aatgagagag ccttattttc 7140 ctgtaacctt cagcaaatag caaaagacac attccaaggg cccacttctt tactgtgggc 7200 a 7201 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 cacagacaat cagacgtacc agta 24 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 ccagctttgc cagtttacga 20 <210> 20 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 ttggacggtt gccctctt 18 <210> 21 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 gatggcttcc cttcgactct tc 22 <210> 22 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 cactgacatt tctcttgtct cctct 25 <210> 23 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 gggctcacca cagatgagaa g 21 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 cactgttcgc cacaggtctt 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 gctcagccca tactcctaca 20 <210> 26 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 gcccaggagg accaggat 18 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 ggcaacttgc ttgaggaaga 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 gcagcaaccc agcttcactt 20 <210> 29 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 actgagctgg gacttgaac 19 <210> 30 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 tgcctcactc tgagaacca 19 <210> 31 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 cgcaacctcc ccttctacg 19 <210> 32 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 ggccgtgcat gtgttcag 18 <210> 33 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 ggttcccatt tgctcttatt cgt 23 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 cccacactgc agaaggaaac ttg 23 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 ggttcccatt tgctcttatt cgt 23 <210> 36 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 ccagcttagc atcctgtgaa ca 22 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 ggcaacttgc ttgaggaaga 20 <210> 38 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 tgtggagttc agtagtgtgg ag 22 <210> 39 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 cactgacatt tctcttgtct cctct 25 <210> 40 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 gggacatctc ggtttcctga ctt 23 <210> 41 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 tccacactac tgaactccac aa 22 <210> 42 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 cggaacactc gctctacgaa a 21 <210> 43 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 gggccagctt cagacaca 18 <210> 44 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 cccagggtgc tggagaatcc aa 22 <210> 45 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 gccaagtgtc ttccagtacg at 22 <210> 46 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 gttccctttc ttgggttcag a 21 <210> 47 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 gatgctactg ctttggcaag atc 23 <210> 48 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 cctgagctgc taacacggtt 20 <210> 49 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 agctacagac catgcttagt gta 23 <210> 50 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 tgccagttta ggaggaatat gttc 24 <210> 51 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 ctgaggaaac agaggtacca gatat 25 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 agtcacacag ttctgtcaaa tcag 24 <210> 53 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 gtccttcggg cacctcg 17 <210> 54 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 tcctgtggga gggttctttg 20 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 ccctctctct gagccctcta 20 <210> 56 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 gctgcctaag tctttggagc t 21 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 ccctctctct gagccctcta 20 <210> 58 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 gagaggagag acagctagtt ctaac 25 <210> 59 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 agctacagac catgcttagt gta 23 <210> 60 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 gccctcttca tacaggaatc ac 22 <210> 61 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 cggacagcat ccaggactt 19 <210> 62 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 tcatgtaatc tggcttcaga gtggga 26 <210> 63 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 tgggaggcaa ttcttagttt caatgga 27 <210> 64 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 tcccaaaggt gtctgtctgc aca 23 <210> 65 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 ctcctttgcc tcgctggact gg 22 <210> 66 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 cggacagcat ccaggactt 19 <210> 67 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 agaaggagtg tacagagtag aactggaca 29 <210> 68 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 tgtttgtggg tgtcagtgtt tctactc 27 <210> 69 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 caccacggct gtcgtcagca a 21 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 cttgccaaag cagtagcatc cca 23 <210> 71 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 aggtcagaaa gcagagtgga cca 23 <210> 72 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 cccaggcaat tcctaccttc cca 23 <210> 73 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 tctgagcatt ctacctcatt gctttggt 28 <210> 74 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 aggctgtccc agcacctgag tcg 23 <210> 75 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 cggctcggct tcaccgtcac c 21 <210> 76 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 aaggctgctg atgacacctg gga 23 <210> 77 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 agattcagac acacacaact taccagc 27 <210> 78 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 agacctgcaa ttctctaaga gctccaca 28 <210> 79 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 agattcagac acacacaact taccagc 27 <210> 80 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 ttgtctgcag ctcctacctc tggg 24 <210> 81 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 aggtcagaaa gcagagtgga cca 23 <210> 82 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 ttgacatgtg tgggtgagag attttactg 29 <210> 83 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 cccagggtgc tggagaatcc aa 22 <210> 84 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 guuuuagagc uaugcu 16 <210> 85 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60 gugcuuu 67 <210> 86 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugcu 77 <210> 87 <211> 82 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60 aaaaguggca ccgagucggu gc 82 <210> 88 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 89 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 89 guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60 uugaaaaagu ggcaccgagu cggugc 86 <210> 90 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (2)..(21) <223> n = A, T, C, or G <400> 90 gnnnnnnnnn nnnnnnnnnn ngg 23 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(21) <223> n = A, T, C, or G <400> 91 nnnnnnnnnn nnnnnnnnnn ngg 23 <210> 92 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (3)..(23) <223> n = A, T, C, or G <400> 92 ggnnnnnnnn nnnnnnnnnn nnngg 25

Claims (64)

  1. 유전적으로 변형된 내인성 Ttr 좌위를 비-인간 동물의 게놈에 포함하는 비-인간 동물로서, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴(transthyretin) 단백질의 베타-가닥 D에서 시프트(shift)를 야기하는 돌연변이를 포함하는, 비-인간 동물.
  2. 제1항에 있어서, 상기 돌연변이는, 인코딩된 트랜스티레틴 단백질이 인간 트랜스티레틴 단백질과 최적으로 정렬될 때, 인간 트랜스티레틴 단백질 내 잔기 L58에 상응하는 잔기를 인간 트랜스티레틴 단백질 내 잔기 L55에 상응하는 잔기에 의해 통상적으로 점유되는 장소에 배치시키는 베타 가닥 D에서 3-잔기 시프트를 야기하는, 비-인간 동물.
  3. 제2항에 있어서, 상기 돌연변이는, 인코딩된 트랜스티레틴 단백질이 인간 트랜스티레틴 단백질과 최적으로 정렬될 때, 인간 트랜스티레틴 단백질 내 G53S/E54D/L55S에 상응하는 삼중(triple) 돌연변이인, 비-인간 동물.
  4. 제3항에 있어서, 상기 삼중 돌연변이는 상응하는 인간 TTR 서열에 존재하는, 비-인간 동물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 유전적으로 변형된 내인성 Ttr 좌위는 내인성 Ttr 프로모터를 포함하며, 인간 TTR 서열은 내인성 Ttr 프로모터에 작동적으로 연결되는, 비-인간 동물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 내인성 Ttr 좌위의 적어도 하나의 인트론 및 적어도 하나의 엑손은 결실되었고 상응하는 인간 TTR 서열로 대체된 것인, 비-인간 동물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 내인성 Ttr 좌위의 전체 Ttr 코딩 서열은 결실되었고 상응하는 인간 TTR 서열로 대체된 것인, 비-인간 동물.
  8. 제7항에 있어서, Ttr 개시 코돈으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열로 대체된 것인, 비-인간 동물.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인간 TTR 3' 비번역 영역을 포함하는, 비-인간 동물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않은 것인, 비-인간 동물.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, Ttr 개시 코돈으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열 및 인간 TTR 3' 비번역 영역을 포함하는 인간 TTR 서열로 대체되었으며,
    상기 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았고,
    상기 내인성 Ttr 프로모터는 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않은 것인, 비-인간 동물.
  12. 제11항에 있어서,
    (i) 상기 유전적으로 변형된 내인성 Ttr 좌위의 인간 TTR 서열은 SEQ ID NO: 14로 표시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함하거나;
    (ii) 상기 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 9로 표시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함하는 단백질을 인코딩하며;
    (iii) 상기 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 10으로 표시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함하는 코딩 서열을 포함하거나;
    (iv) 상기 유전적으로 변형된 내인성 Ttr 좌위는 SEQ ID NO: 12 또는 13으로 표시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함하는, 비-인간 동물.
  13. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 유전적으로 변형된 내인성 Ttr 좌위는 신호 펩타이드를 포함하는 트랜스티레틴 전구체 단백질을 인코딩하고, 신호 펩타이드를 인코딩하는 내인성 Ttr 좌위의 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않은 것인, 비-인간 동물.
  14. 제13항에 있어서, 상기 내인성 Ttr 좌위의 제1 엑손은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않은 것인, 비-인간 동물.
  15. 제14항에 있어서, 상기 내인성 Ttr 좌위의 제1 엑손 및 제1 인트론은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않은 것인, 비-인간 동물.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서, 제2 Ttr 엑손의 개시로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열로 대체된 것인, 비-인간 동물.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인간 TTR 3' 비번역 영역을 포함하는, 비-인간 동물.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, 제2 Ttr 엑손으로부터 Ttr 정지 코돈까지의 내인성 Ttr 좌위의 영역은 결실되었고 상응하는 인간 TTR 서열 및 인간 TTR 3' 비번역 영역을 포함하는 인간 TTR 서열로 대체되었으며,
    상기 내인성 Ttr 5' 비번역 영역은 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않았고,
    상기 내인성 Ttr 프로모터는 결실되지 않았고 상응하는 인간 TTR 서열로 대체되지 않은 것인, 비-인간 동물.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 유전적으로 변형된 내인성 Ttr 좌위는 선택 카세트 또는 리포터 유전자를 포함하지 않는, 비-인간 동물.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위에 대해 동형접합성(homozygous)인, 비-인간 동물.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 비-인간 동물은 포유류인, 비-인간 동물.
  22. 제21항에 있어서, 상기 비-인간 동물은 래트 또는 마우스인, 비-인간 동물.
  23. 제22항에 있어서, 상기 비-인간 동물은 마우스인, 비-인간 동물.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 비-인간 동물은 유전적으로 변형된 내인성 Ttr 좌위를 이의 생식세포계(germline)에 포함하는, 비-인간 동물.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 비-인간 동물은 대조군 야생형 비-인간 동물 또는 돌연변이가 없는 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 비-인간 동물에 비해 과다활동적(hyperactive)인, 비-인간 동물.
  26. 제25항에 있어서, 상기 과다활동(hyperactivity)은 오픈 필드 시험(open field test)에서 총 거리, 총 활동, 또는 총 리어링(rearing) 중 하나 이상 또는 모두에 의해 측정되는 바와 같은 것인, 비-인간 동물.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 비-인간 동물은 뒷다리 근긴장이상증(hindlimb dystonia)을 나타내는, 비-인간 동물.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 비-인간 동물은 아밀로이드 침착물(amyloid deposit)을 포함하는, 비-인간 동물.
  29. 제28항에 있어서, 상기 비-인간 동물은 좌골 신경(sciatic nerve)에 아밀로이드 침착물을 포함하는, 비-인간 동물.
  30. 제28항 또는 제29항에 있어서, 상기 비-인간 동물은 약 2개월령까지 아밀로이드증(amyloidosis)을 발증시키는, 비-인간 동물.
  31. 유전적으로 변형된 내인성 Ttr 좌위를 비-인간 동물의 게놈에 포함하는 비-인간 동물 세포로서, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함하는, 비-인간 동물 세포.
  32. 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 비-인간 동물 게놈으로서, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함하는, 비-인간 동물 게놈.
  33. 유전적으로 변형된 내인성 Ttr 좌위를 생산하기 위한 표적화 벡터로서, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 좌위의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었으며, 상기 유전적으로 변형된 내인성 Ttr 좌위는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함하고, 상기 표적화 벡터는 내인성 Ttr 좌위에서 5' 표적 서열을 표적화하는 5' 상동성 아암(homology arm) 및 내인성 Ttr 좌위에서 3' 표적 서열을 표적화하는 3' 상동성 아암에 의해 플랭킹된(flanked) 상응하는 인간 TTR 서열을 포함하는 삽입물(insert) 핵산을 포함하는, 표적화 벡터.
  34. 유전적으로 변형된 비-인간 동물 Ttr 유전자로서, 여기서, Ttr 코딩 서열과 비-코딩 서열을 둘 다 포함하는 내인성 Ttr 유전자의 영역은 결실되었고 TTR 코딩 서열과 비-코딩 서열을 둘 다 포함하는 상응하는 인간 TTR 서열로 대체되었고, 상기 유전적으로 변형된 비-인간 동물 Ttr 유전자는 인코딩된 트랜스티레틴 단백질의 베타-가닥 D에서 시프트를 야기하는 돌연변이를 포함하는, 유전적으로 변형된 비-인간 동물 Ttr 유전자.
  35. 생체내에서 인간-TTR-표적화 시약의 활성을 평가하는 방법으로서, 상기 방법은
    (a) 인간-TTR-표적화 시약을 제1항 내지 제30항 중 어느 한 항의 비-인간 동물에게 투여하는 단계; 및
    (b) 상기 인간-TTR-표적화 시약의 활성을 상기 비-인간 동물에서 평가하는 단계를 포함하는, 방법.
  36. 제35항에 있어서, 도입은 아데노-관련 바이러스(AAV: adeno-associated virus)-매개 전달, 지질 나노입자(LNP: lipid nanoparticle)-매개 전달, 또는 유체역학적 전달(HDD: hydrodynamic delivery)을 포함하는, 방법.
  37. 제36항에 있어서, 상기 도입은 LNP-매개 전달을 포함하는, 방법.
  38. 제36항에 있어서, 상기 도입은 AAV8-매개 전달을 포함하는, 방법.
  39. 제35항 내지 제38항 중 어느 한 항에 있어서, 상기 단계 (b)는 비-인간 동물로부터 간을 단리하는 단계 및 상기 간에서 인간-TTR-표적화 시약의 활성을 평가하는 단계를 포함하는, 방법.
  40. 제39항에 있어서, 상기 단계 (b)는 간 이외의 기관 또는 조직에서 인간-TTR-표적화 시약의 활성을 평가하는 단계를 추가로 포함하는, 방법.
  41. 제35항 내지 제40항 중 어느 한 항에 있어서, 상기 평가는 유전적으로 변형된 Ttr 좌위의 변형을 평가하는 단계를 포함하는, 방법.
  42. 제35항 내지 제41항 중 어느 한 항에 있어서, 상기 평가는 유전적으로 변형된 Ttr 좌위에 의해 인코딩되는 Ttr 메신저 RNA의 발현을 평가하는 단계를 포함하는, 방법.
  43. 제35항 내지 제42항 중 어느 한 항에 있어서, 상기 평가는 유전적으로 변형된 Ttr 좌위에 의해 인코딩되는 TTR 단백질의 발현을 평가하는 단계를 포함하는, 방법.
  44. 제43항에 있어서, 상기 TTR 단백질의 발현을 평가하는 단계는 비-인간 동물에서 TTR 단백질의 혈청 수준을 측정하는 단계를 포함하는, 방법.
  45. 제41항 내지 제43항 중 어느 한 항에 있어서, 상기 활성은 비-인간 동물의 간에서 평가되는, 방법.
  46. 제35항 내지 제45항 중 어느 한 항에 있어서, 상기 평가는 과다활동을 평가하는 단계를 포함하는, 방법.
  47. 제35항 내지 제46항 중 어느 한 항에 있어서, 상기 평가는 뒷다리 근긴장이상증을 평가하는 단계를 포함하는, 방법.
  48. 제35항 내지 제47항 중 어느 한 항에 있어서, 상기 평가는 아밀로이드 침착을 평가하는 단계를 포함하는, 방법.
  49. 제48항에 있어서, 상기 평가는 좌골 신경에서 아밀로이드 침착을 평가하는 단계를 포함하는, 방법.
  50. 제35항 내지 제49항 중 어느 한 항에 있어서, 상기 평가는 비치료된 대조군 비-인간 동물과의 비교에 있는 것인, 방법.
  51. 제35항 내지 제50항 중 어느 한 항에 있어서, 인간-TTR-표적화 시약은 인간 TTR 유전자의 영역을 표적화하도록 설계된 뉴클레아제 제제를 포함하는, 방법.
  52. 제51항에 있어서, 상기 뉴클레아제 제제는 Cas 단백질, 및 인간 TTR 유전자 내의 가이드 RNA 표적 서열을 표적화하도록 설계된 가이드 RNA를 포함하는, 방법.
  53. 제52항에 있어서, 상기 Cas 단백질은 Cas9 단백질인, 방법.
  54. 제35항 내지 제53항 중 어느 한 항에 있어서, 상기 인간-TTR-표적화 시약은 외인성 공여자 핵산을 포함하며, 상기 외인성 공여자 핵산은 인간 TTR 유전자와 재조합되도록 설계되는, 방법.
  55. 제54항에 있어서, 상기 외인성 공여자 핵산은 단일-가닥 올리고데옥시뉴클레오타이드(ssODN)인, 방법.
  56. 제35항 내지 제55항 중 어느 한 항에 있어서, 상기 인간-TTR-표적화 시약은 항원-결합 단백질을 포함하는, 방법.
  57. 제35항 내지 제56항 중 어느 한 항에 있어서, 상기 인간-TTR-표적화 시약은 RNAi 제제 또는 안티센스 올리고뉴클레오타이드를 포함하는, 방법.
  58. 생체내에서 인간-TTR-표적화 시약의 활성을 최적화하는 방법으로서, 상기 방법은
    (I) 첫째로, 유전적으로 변형된 내인성 Ttr 좌위를 제1 비-인간 동물의 게놈에 포함하는 제1 비-인간 동물에서 제35항 내지 제57항 중 어느 한 항의 방법을 수행하는 단계;
    (II) 변수(variable)를 변화시키고, 두 번째로, 유전적으로 변형된 내인성 Ttr 좌위를 제2 비-인간 동물의 게놈에 포함하는 제2 비-인간 동물에서 변화된 변수로 상기 단계 (I)의 방법을 수행하는 단계; 및
    (III) 상기 단계 (I)에서의 인간-TTR-표적화 시약의 활성을 상기 단계 (II)에서의 인간-TTR-표적화 시약의 활성과 비교하고, 더 높은 효능, 더 높은 정밀도(precision), 더 높은 일관성(consistency), 또는 더 높은 특이성을 초래하는 방법을 선택하는 단계를 포함하는, 방법.
  59. 제58항에 있어서, 상기 단계 (II)에서의 변화된 변수는 인간-TTR-표적화 시약을 비-인간 동물 내로 도입하는 전달 방법인, 방법.
  60. 제58항에 있어서, 상기 단계 (II)에서의 변화된 변수는 인간-TTR-표적화 시약을 비-인간 동물 내로 도입하는 투여 경로인, 방법.
  61. 제58항에 있어서, 상기 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-TTR-표적화 시약의 농도 또는 양인, 방법.
  62. 제58항에 있어서, 상기 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-TTR-표적화 시약의 형태인, 방법.
  63. 제58항에 있어서, 상기 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-TTR-표적화 시약인, 방법.
  64. 제1항 내지 제30항 중 어느 한 항의 비-인간 동물을 제조하는 방법으로서, 상기 방법은
    (I) (a) 유전적으로 변형된 내인성 Ttr 좌위를 포함하도록 만능성(pluripotent) 비-인간 동물 세포의 게놈을 변형시키는 단계;
    (b) 상기 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 유전적으로 변형된 만능성 비-인간 동물 세포를 식별하거나 선택하는 단계;
    (c) 상기 유전적으로 변형된 만능성 비-인간 동물 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및
    (d) 상기 비-인간 동물 숙주 배아를 대리모(surrogate mother)에 임신시키는 단계; 또는
    (II) (a) 유전적으로 변형된 내인성 Ttr 좌위를 포함하도록 비-인간 동물 1-세포 단계(one-cell stage) 배아의 게놈을 변형시키는 단계;
    (b) 상기 유전적으로 변형된 내인성 Ttr 좌위를 포함하는 유전적으로 변형된 비-인간 동물 1-세포 단계 배아를 선택하는 단계; 및
    (c) 상기 유전적으로 변형된 비-인간 동물 1-세포 단계 배아를 대리모(surrogate mother)에 임신시키는 단계를 포함하는, 방법.
KR1020217040893A 2019-06-04 2020-06-03 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법 KR20220016869A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962856999P 2019-06-04 2019-06-04
US62/856,999 2019-06-04
PCT/US2020/035859 WO2020247452A1 (en) 2019-06-04 2020-06-03 Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use

Publications (1)

Publication Number Publication Date
KR20220016869A true KR20220016869A (ko) 2022-02-10

Family

ID=71842799

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217040893A KR20220016869A (ko) 2019-06-04 2020-06-03 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법

Country Status (8)

Country Link
US (1) US11891618B2 (ko)
EP (1) EP3801011A1 (ko)
JP (1) JP2022534867A (ko)
KR (1) KR20220016869A (ko)
CN (1) CN113874510A (ko)
AU (1) AU2020286382A1 (ko)
CA (1) CA3137761A1 (ko)
WO (1) WO2020247452A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200058446A (ko) * 2017-09-29 2020-05-27 리제너론 파마슈티칼스 인코포레이티드 인간화된 ttr 유전자좌를 포함하는 비인간 동물 및 사용 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220004065A (ko) 2019-04-04 2022-01-11 리제너론 파마슈티칼스 인코포레이티드 인간화 응고 인자 12 좌위를 포함하는 비-인간 동물
JP2022534867A (ja) 2019-06-04 2022-08-04 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ベータスリップ変異を有するヒト化ttr遺伝子座を含む非ヒト動物と使用方法
EP3796776A1 (en) 2019-06-07 2021-03-31 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus

Family Cites Families (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5958883A (en) 1992-09-23 1999-09-28 Board Of Regents Of The University Of Washington Office Of Technology Animal models of human amyloidoses
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
AU3640297A (en) 1996-06-06 1998-01-05 University Of Washington Perlecan transgenic animals and methods of identifying compounds for the treatment of amyloidoses
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
AU2884102A (en) 2000-12-07 2002-06-18 Sangamo Biosciences Inc Regulation of angiogenesis with zinc finger proteins
US7273923B2 (en) 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
US7947469B2 (en) 2001-01-22 2011-05-24 Gendaq, Ltd. Modulation of HIV infection
US20020160394A1 (en) 2001-01-24 2002-10-31 Bayer Corporation Regulation of transthyretin to treat obesity
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
US8106255B2 (en) 2002-01-23 2012-01-31 Dana Carroll Targeted chromosomal mutagenasis using zinc finger nucleases
US8206965B2 (en) 2002-03-15 2012-06-26 Cellectis S.A. Hybrid and single chain meganucleases and use thereof
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
AU2003290518A1 (en) 2002-09-06 2004-04-23 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
US20080038227A1 (en) 2004-08-04 2008-02-14 Ignacio Torres Aleman Animal model of neurodegenerative diseases, the procedure for producing the model and applications thereof
KR20070060115A (ko) 2004-09-16 2007-06-12 상가모 바이오사이언스 인코포레이티드 단백질 생산을 위한 조성물 및 방법
JP5252922B2 (ja) 2004-10-19 2013-07-31 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 遺伝的改変についてホモ接合性の動物を生み出すための方法
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
DE602006014107D1 (de) 2005-03-15 2010-06-17 Cellectis I-crei-meganuklease-varianten mit modifizierter spezifität sowie verfahren zu ihrer herstellung und verwendung
WO2006105602A1 (en) 2005-04-06 2006-10-12 The Walter And Eliza Hall Institute Of Medical Research Animal models and cells with a modified gene encoding transthyretin-related protein and applications thereof
JP4692417B2 (ja) 2006-06-30 2011-06-01 富士ゼロックス株式会社 画像形成装置
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
AU2007334468B2 (en) 2006-12-14 2013-02-07 Corteva Agriscience Llc Optimized non-canonical zinc finger proteins
CN102037594A (zh) 2008-04-11 2011-04-27 Utc电力公司 燃料电池和具有歧管贮槽的双极板
EP2323667A4 (en) 2008-08-07 2012-07-25 Isis Pharmaceuticals Inc MODULATION OF TRANSTHYRETIN EXPRESSION BY TREATMENT OF CNS DISEASES
WO2010030203A1 (en) 2008-09-09 2010-03-18 Biocodex - Incubação De Empresas De Ciências Da Vida, S.A. Monoclonal antibody to human amyloidogenic and modified forms of transthyretin and its use in the detection and treatment of fap and pathologies presenting modified ttr
US8168775B2 (en) 2008-10-20 2012-05-01 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of transthyretin
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8871905B2 (en) 2009-03-20 2014-10-28 Sangamo Biosciences, Inc. Modification of CXCR4 using engineered zinc finger proteins
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
PT2975051T (pt) 2009-06-26 2021-05-04 Regeneron Pharma Anticorpos biespecíficos rapidamente isolados com formato de imunoglobulina nativa
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
WO2011020014A1 (en) 2009-08-14 2011-02-17 Regeneron Pharmaceuticals, Inc. Promoter-regulated differentiation-dependent self-deleting cassette
AU2010303737B2 (en) 2009-10-06 2014-05-29 Institute For Research In Biomedicine (Irb) Genetically modified mice and engraftment
CN106191126B (zh) 2009-10-29 2020-04-14 瑞泽恩制药公司 多功能等位基因
WO2011056883A1 (en) 2009-11-03 2011-05-12 Alnylam Pharmaceuticals, Inc. Lipid formulated compositions and methods for inhibiting expression of transthyretin (ttr)
BR112012014080A2 (pt) 2009-12-10 2015-10-27 Univ Iowa State Res Found método para modificação do material genético, método para geração de um ácido nucleico, monômero de endonuclease efetora tal, método para geração de um aninal, método para geração de uma planta, método para recombinação genética direcionada, ácido nucleico, cassete de expressão e célula hospedeira
RU2730643C2 (ru) 2011-02-15 2020-08-24 Ридженерон Фармасьютикалз, Инк. Гуманизированные m-csf мыши
RS55949B1 (sr) 2011-10-28 2017-09-29 Regeneron Pharmaeuticals Inc Humanizovani il-6 i il-6 receptor
DK3262932T3 (da) 2011-10-28 2019-08-05 Regeneron Pharma Genmodificerede mus med major histokompatibilitetskompleks
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
US9834786B2 (en) 2012-04-25 2017-12-05 Regeneron Pharmaceuticals, Inc. Nuclease-mediated targeting with large targeting vectors
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
US8962913B2 (en) 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
KR101706085B1 (ko) 2012-10-23 2017-02-14 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
CN114766432A (zh) 2012-11-05 2022-07-22 再生元制药公司 经遗传修饰的非人动物及其使用方法
KR102145760B1 (ko) 2012-12-06 2020-08-19 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP4299741A3 (en) 2012-12-12 2024-02-28 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
KR20150095861A (ko) 2012-12-17 2015-08-21 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 인간 게놈 조작
CA2900992C (en) 2013-02-20 2023-02-28 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
LT2958937T (lt) 2013-02-22 2018-11-26 Regeneron Pharmaceuticals, Inc. Pelė, ekspresuojanti humanizuotą audinių dermės kompleksą
US20150342163A1 (en) 2013-02-22 2015-12-03 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex mice
JP2016507244A (ja) 2013-02-27 2016-03-10 ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) Cas9ヌクレアーゼによる卵母細胞における遺伝子編集
EP3741868A1 (en) 2013-03-15 2020-11-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
JP2016522679A (ja) 2013-04-04 2016-08-04 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いたゲノム編集の治療的使用
SG11201508028QA (en) 2013-04-16 2015-10-29 Regeneron Pharma Targeted modification of rat genome
CN105378085B (zh) 2013-05-01 2019-02-15 Ionis制药公司 用于调节hbv和ttr表达的组合物和方法
EP3011031B1 (en) 2013-06-17 2020-09-30 The Broad Institute Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
MX2015017313A (es) 2013-06-17 2016-11-25 Broad Inst Inc Suministro, uso y aplicaciones terapéuticas de los sistemas y composiciones crispr-cas, para actuar sobre trastornos y enfermedades utilizando componentes víricos.
BR112015031611A2 (pt) 2013-06-17 2017-12-12 Massachusetts Inst Technology aplicação, manipulação e otimização de sistemas, métodos e composições para direcionamento e modelação de doenças e distúrbios de células pós-mitóticas
JP2016528890A (ja) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いるゲノム編集の治療用の使用
EP3022225B1 (en) 2013-07-19 2021-09-29 Board Of Regents Of the University Of Texas System Transthyretin amyloid-selective and polyreactive catabodies
ES2959333T3 (es) 2013-09-23 2024-02-23 Regeneron Pharma Animales no humanos que tienen un gen humanizado de la proteína reguladora de señales
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
US10035847B2 (en) 2013-10-02 2018-07-31 The Rockefeller University Amyloid protofibril antibodies and methods of use thereof
US9155290B2 (en) 2013-10-15 2015-10-13 Regeneron Pharmaceuticals, Inc. Humanized IL-15 animals
EP3058072B1 (en) 2013-10-17 2021-05-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
JP6174811B2 (ja) 2013-12-11 2017-08-02 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ゲノムの標的改変のための方法及び組成物
MX2016008250A (es) 2013-12-20 2016-10-14 Neurimmune Holding Ag Terapia basada en anticuerpos de amiloidosis por transtiretina (ttr) y anticuerpos derivados de humanos de la misma.
CN106574258B (zh) 2014-01-29 2021-03-30 Km生物医药股份公司 抗-运甲状腺素蛋白人源化抗体
WO2015127439A1 (en) 2014-02-24 2015-08-27 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration
EP3122365B1 (en) 2014-03-25 2023-05-03 Arcturus Therapeutics, Inc. Transthyretin allele selective una oligomers for gene silencing
MA51519A (fr) 2014-05-05 2020-11-11 Regeneron Pharma Animaux c5 et c3 humanisés
NO2785538T3 (ko) 2014-05-07 2018-08-04
CN106536546B (zh) 2014-05-19 2021-04-30 再生元制药公司 表达人epo的经遗传修饰的非人动物
EP3155116A4 (en) 2014-06-10 2017-12-27 Massachusetts Institute Of Technology Method for gene editing
BR112016029178A2 (pt) 2014-06-16 2017-10-17 Univ Johns Hopkins composições e métodos para a expressão de rnas guia de crispr usando o promotor h1
PL3155099T3 (pl) 2014-06-23 2018-08-31 Regeneron Pharmaceuticals, Inc. Łączenie dna mediowane nukleazą
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
PL3161128T3 (pl) 2014-06-26 2019-02-28 Regeneron Pharmaceuticals, Inc. Sposoby i kompozycje do celowanych modyfikacji genetycznych i sposoby zastosowania
CN106794141B (zh) 2014-07-16 2021-05-28 诺华股份有限公司 将核酸包封在脂质纳米粒主体中的方法
KR20170083534A (ko) 2014-09-19 2017-07-18 리제너론 파마슈티칼스 인코포레이티드 키메라 항원 수용체
RU2734770C2 (ru) 2014-11-21 2020-10-23 Регенерон Фармасьютикалз, Инк. Способы и композиции для нацеленной генетической модификации с использованием парных гидовых рнк
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
TWI781507B (zh) 2015-01-28 2022-10-21 愛爾蘭商普羅佘納生物科技有限公司 抗甲狀腺素運送蛋白抗體
BR112017021250A2 (pt) 2015-04-06 2018-06-26 Regeneron Pharma respostas imunes mediadas por células t humanizadas em animais não humanos
EP3288594B1 (en) 2015-04-27 2022-06-29 The Trustees of The University of Pennsylvania Dual aav vector system for crispr/cas9 mediated correction of human disease
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CN108350454B (zh) 2015-09-21 2022-05-10 阿克丘勒斯治疗公司 等位基因选择性基因编辑及其用途
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
JP6997708B2 (ja) 2015-11-20 2022-02-04 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ヒト化されたlymphocyte-activation gene 3遺伝子を有する非ヒト動物
WO2017136712A1 (en) 2016-02-04 2017-08-10 Regeneron Pharmaceuticals, Inc. Non-human animals having an engineered angptl8 gene
WO2017173054A1 (en) 2016-03-30 2017-10-05 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
WO2018049009A2 (en) 2016-09-07 2018-03-15 Sangamo Therapeutics, Inc. Modulation of liver genes
WO2018107028A1 (en) 2016-12-08 2018-06-14 Intellia Therapeutics, Inc. Modified guide rnas
US10765762B2 (en) 2017-02-27 2020-09-08 Regeneron Pharmaceuticals, Inc. Humanized model of kidney and liver disorders
BR112020005287A2 (pt) 2017-09-29 2020-09-24 Intellia Therapeutics, Inc. composições e métodos para edição de gene ttr e tratar amiloidose attr
JP7242650B2 (ja) 2017-09-29 2023-03-20 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ヒト化C1q複合体を発現する非ヒト動物
MX2020003589A (es) 2017-09-29 2020-07-22 Regeneron Pharma Animales no humanos que comprenden un locus ttr humanizado y metodos de uso.
CN111885915B (zh) 2018-03-19 2023-04-28 瑞泽恩制药公司 使用crispr/cas系统对动物进行转录调制
TWI829679B (zh) 2018-03-26 2024-01-21 美商再生元醫藥公司 用於測試治療藥劑之人類化囓齒動物
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
KR20210029772A (ko) 2018-06-08 2021-03-16 인텔리아 테라퓨틱스, 인크. 유전자 편집을 위한 변형된 가이드 rna
WO2019246203A1 (en) 2018-06-19 2019-12-26 The Board Of Regents Of The University Of Texas System Lipid nanoparticle compositions for delivery of mrna and long nucleic acids
KR20210031868A (ko) 2018-07-16 2021-03-23 리제너론 파마슈티칼스 인코포레이티드 Ditra 질환의 비인간 동물 모델 및 이의 용도
KR20220004065A (ko) 2019-04-04 2022-01-11 리제너론 파마슈티칼스 인코포레이티드 인간화 응고 인자 12 좌위를 포함하는 비-인간 동물
CN113853433A (zh) 2019-05-27 2021-12-28 转基因股份有限公司 外显子人源化小鼠
JP2022534867A (ja) 2019-06-04 2022-08-04 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ベータスリップ変異を有するヒト化ttr遺伝子座を含む非ヒト動物と使用方法
EP3796776A1 (en) 2019-06-07 2021-03-31 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
EP4125348A1 (en) 2020-03-23 2023-02-08 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200058446A (ko) * 2017-09-29 2020-05-27 리제너론 파마슈티칼스 인코포레이티드 인간화된 ttr 유전자좌를 포함하는 비인간 동물 및 사용 방법

Also Published As

Publication number Publication date
AU2020286382A1 (en) 2021-11-04
CA3137761A1 (en) 2020-12-10
US20200385760A1 (en) 2020-12-10
EP3801011A1 (en) 2021-04-14
US11891618B2 (en) 2024-02-06
JP2022534867A (ja) 2022-08-04
WO2020247452A1 (en) 2020-12-10
CN113874510A (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
KR102544051B1 (ko) 인간화된 ttr 유전자좌를 포함하는 비인간 동물 및 사용 방법
US20210261985A1 (en) Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
JP2020532952A (ja) Casトランスジェニックマウスの胚性幹細胞およびマウスならびにその使用
KR20220016869A (ko) 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
US20230232797A1 (en) Non-human animals comprising a humanized albumin locus
KR20220062079A (ko) 지질 나노입자에 의해 전달되는 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
JP2023511626A (ja) ヒト化pnpla3遺伝子座を含む非ヒト動物および使用方法
RU2784927C1 (ru) Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения
US20230081547A1 (en) Non-human animals comprising a humanized klkb1 locus and methods of use