KR20220004065A - 인간화 응고 인자 12 좌위를 포함하는 비-인간 동물 - Google Patents

인간화 응고 인자 12 좌위를 포함하는 비-인간 동물 Download PDF

Info

Publication number
KR20220004065A
KR20220004065A KR1020217035584A KR20217035584A KR20220004065A KR 20220004065 A KR20220004065 A KR 20220004065A KR 1020217035584 A KR1020217035584 A KR 1020217035584A KR 20217035584 A KR20217035584 A KR 20217035584A KR 20220004065 A KR20220004065 A KR 20220004065A
Authority
KR
South Korea
Prior art keywords
human
locus
sequence
human animal
endogenous
Prior art date
Application number
KR1020217035584A
Other languages
English (en)
Other versions
KR102661779B1 (ko
Inventor
야준 탕
단 찰로쏜
린던 미트놀
로리 모튼
다리아 자모로드치코프
니콜 알레산드리-하버
린 맥도날드
Original Assignee
리제너론 파마슈티칼스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리제너론 파마슈티칼스 인코포레이티드 filed Critical 리제너론 파마슈티칼스 인코포레이티드
Publication of KR20220004065A publication Critical patent/KR20220004065A/ko
Application granted granted Critical
Publication of KR102661779B1 publication Critical patent/KR102661779B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/20Animal model comprising regulated expression system
    • A01K2217/203Animal model comprising inducible/conditional expression system, e.g. hormones, tet
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Analytical Chemistry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Hematology (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

인간화 응고 인자 XII(humanized coagulation factor XII)(F12) 좌위를 포함하는 비-인간 동물 게놈, 비-인간 동물 세포, 및 비-인간 동물, 및 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 및 비-인간 동물을 제조하는 방법 및 사용하는 방법이 제공된다. 인간화 F12 좌위를 포함하는 비-인간 동물 세포 또는 비-인간 동물은 인간 응고 인자 XII 단백질 또는 키메라 응고 인자 XII 단백질을 발현하며, 이의 단편은 인간 응고 인자 XII로부터의 것이다. 인간-응고-인자-XII-표적화 시약, 예컨대 인간 F12를 표적화하도록 설계된 뉴클레아제 제제의 생체내 효능을 평가하기 위해 인간화 F12 좌위를 포함하는 이러한 비-인간 동물을 사용하는 방법이 제공된다. 뇌에서 국재적으로 생성되는 F12의 짧은 이소형, 및 이러한 짧은 이소형(isoform)을 사용하는 방법이 또한 제공된다.

Description

인간화된 응고 인자 12 유전자좌를 포함하는 비-인간 동물
관련 출원의 교차 참조
본 출원은 2019년 4월 4일에 출원된 미국 출원 62/829,321호의 이익을 주장하며, 이는 그 전체가 모든 목적을 위해 본 명세서에 참조로서 포함된다.
EFS 웹을 통해 텍스트 파일로 제출된 서열 목록에 대한 참조
파일 545986SEQLIST.txt로 작성된 서열 목록은 121 킬로바이트 크기이고, 2020년 3월 22일에 생성되고, 본 명세서에 참조로서 포함된다.
혈소판과 더불어 응고 인자는 혈관 손상 동안 지혈 과정에 관련된 혈액 구성요소이다. 이들 구성요소는 불균형이 조절(즉, 생성 및/또는 활성)에서 발생할 때 혈전증의 구동자(driver)일 수 있음이 잘 확립되어 있다. 혈전성 질환(thrombotic disease)은 외인성 경로(조직 인자를 통한)에서 비정상적인 활성화로부터 주로 발생하는 것으로 여겨졌으나, 보다 최근에, F12-결핍 마우스 및 활성화된 응고 인자 XII(인자 XIIa)를 표적화하는 분자를 이용한 전임상 연구는 응고의 내인성 경로(접촉 경로로도 알려져 있음)가 또한 관여함을 시사하였다. 인자 XIIa는 접촉 경로에 중심적이고, 인자 XI의 절단을 통해 응고를 구동할 수 있거나 혈장 프리칼리크레인(prekallikrein)의 절단을 통해 염증을 구동할 수 있다. 그러므로, 인자 XII 활성의 저해는 접촉 경로 활성화와 관련된 감소된 혈전성 응고 및 염증을 유발할 수 있다.
그러나, 인간-응고-인자-XII-표적화 시약의 진(true) 인간 표적 또는 진 인간 표적의 밀접한 근사물(close approximation)을 제공하여, 살아 있는 동물에서 이러한 제제의 효능 및 작용 방식뿐만 아니라 약물동력학 연구 및 약력학(pharmacodynamics) 연구의 시험을 가능하게 하는 적합한 비-인간 동물에 대한 필요성이 존재한다.
인간화 응고 인자 XII(humanized coagulation factor XII)(F12) 좌위(locus)를 포함하는 비-인간 동물, 뿐만 아니라 이러한 비-인간 동물을 제조하는 방법 및 사용하는 방법이 제공된다. 인간화 응고 인자 XII(F12) 좌위를 포함하는 비-인간 동물 게놈 또는 세포, 뿐만 아니라 이러한 비-인간 동물 게놈 또는 세포를 제조하는 방법 및 사용하는 방법이 또한 제공된다. 인간화 비-인간 동물 F12 유전자, 비-인간 동물 F12 유전자를 인간화하는 데 사용하기 위한 뉴클레아제 제제(nuclease agent) 및/또는 표적화 벡터, 및 이러한 인간화 F12 유전자를 제조하는 방법 및 사용하는 방법이 또한 제공된다.
일 양태에서, 인간화 응고 인자 XII(F12) 좌위를 포함하는 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물이 제공된다. 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물은, 내인성 F12 좌위의 분절이 결실되었고 상응하는 인간 F12 서열로 대체된 인간화 내인성 F12 좌위를 이의 게놈에 포함할 수 있다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 인간 응고 인자 XII 중쇄를 포함하는 단백질을 인코딩한다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 인간 응고 인자 XII 경쇄를 포함하는 단백질을 인코딩한다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 인간 응고 인자 XII 신호 펩타이드를 포함하는 단백질을 인코딩한다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 코딩 서열과 비-코딩 서열 둘 다 포함하는 내인성 F12 좌위의 영역은 결실되었고, 코딩 서열과 비-코딩 서열 둘 다 포함하는 상응하는 인간 F12 서열로 대체되었다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 내인성 F12 프로모터를 포함하며, 인간 F12 서열은 내인성 F12 프로모터에 작동적으로 연결된다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 내인성 F12 좌위의 적어도 하나의 인트론 및 적어도 하나의 엑손은 결실되었고 상응하는 인간 F12 서열로 대체되었다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 내인성 F12 좌위의 전체 F12 코딩 서열은 결실되었고 상응하는 인간 F12 서열로 대체되었다. 선택적으로, 개시 코돈으로부터 정지 코돈까지의 내인성 F12 좌위의 영역은 결실되었고 상응하는 인간 F12 서열로 대체되었다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 내인성 F12 3' 비번역 영역은 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않았다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 내인성 F12 5' 비번역 영역은 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않았다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 개시 코돈으로부터 정지 코돈까지의 내인성 F12 좌위의 영역은 결실되었고 상응하는 인간 F12 서열로 대체되었으며, 내인성 F12 프로모터는 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않았다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위의 인간 F12 서열은 SEQ ID NO: 31 또는 32로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함한다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 SEQ ID NO: 5 또는 46으로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하는 단백질을 인코딩한다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 SEQ ID NO: 13 또는 48로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하는 코딩 서열을 포함한다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 SEQ ID NO: 17 또는 18로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함한다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 선택 카세트 또는 리포터 유전자를 포함하지 않는다. 일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 인간화 내인성 F12 좌위는 상응하는 인간 F12 서열의 인트론 내에 선택 카세트 또는 리포터 유전자를 포함한다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 비-인간 동물은 인간화 내인성 F12 좌위에 대해 동형접합성이다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 비-인간 동물은 이의 생식세포계(germline)에서 인간화 내인성 F12 좌위를 포함한다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 비-인간 동물은 포유류이다. 선택적으로, 비-인간 동물은 래트 또는 마우스이다. 선택적으로, 비-인간 동물은 마우스이다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 비-인간 동물은 뇌에서 짧은 인간 응고 인자 XII 이소형(isoform)을 발현한다. 선택적으로, 짧은 인간 응고 인자 XII 이소형은 인간 F12의 엑손 1-6에 대한 프로브에 의해서가 아니라 인간 F12의 엑손 11-14에 대한 프로브에 의해 검출되는 F12 mRNA에 의해 인코딩된다. 선택적으로, 짧은 인간 응고 인자 XII 이소형은 FXII297-596이다. 선택적으로, 짧은 인간 응고 인자 XII 이소형은 뇌의 뉴런에서 발현된다. 선택적으로, 짧은 인간 응고 인자 XII 이소형은 혈장 칼리크레인에 의해 활성화될 수 있고, 전구(pro)-HGF를 활성 HGF로 전환시킨다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 비-인간 동물은 상응하는 야생형 비-인간 동물에서의 활성화된 부분 트롬보플라스틴 시간(aPTT: activated partial thromboplastin time)과 유의하게 상이하지 않은 aPTT를 갖고/갖거나 상기 비-인간 동물은 상응하는 야생형 비-인간 동물에서의 프로트롬빈 시간(PT: prothrombin time)과 유의하게 상이하지 않은 PT를 갖는다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 비-인간은 적어도 약 5 μg/mL의 인간 응고 인자 XII 혈장 수준을 갖는다.
일부 이러한 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물에서, 개시 코돈으로부터 정지 코돈까지의 내인성 F12 좌위의 영역은 결실되었고 상응하는 인간 F12 서열로 대체되었으며, 내인성 F12 프로모터는 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않았고, 비-인간 동물은 뇌에서 짧은 인간 응고 인자 XII 이소형을 발현하며, 선택적으로 (i) 짧은 인간 응고 인자 XII 이소형은 인간 F12의 엑손 1-6에 대한 프로브에 의해서가 아니라 인간 F12의 엑손 11-14에 대한 프로브에 의해 검출되는 F12 mRNA에 의해 인코딩되며; 그리고/또는 (ii) 짧은 인간 응고 인자 XII 이소형은 FXII297-596이며; 및/또는 (iii) 짧은 인간 응고 인자 XII 이소형은 뇌 내의 뉴런에서 발현되며; 그리고/또는 (iv) 짧은 인간 응고 인자 XII 이소형은 혈장 칼리크레인에 의해 활성화될 수 있고 전구-HGF를 활성 HGF로 전환시킨다.
또 다른 양태에서, 인간화 내인성 F12 좌위를 생산하기 위한 표적화 벡터가 제공되며, 상기 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체되었으며, 상기 표적화 벡터는 내인성 F12 좌위에서 5' 표적 서열을 표적화하는 5' 상동성 아암(arm)과 내인성 F12 좌위에서 3' 표적 서열을 표적화하는 3' 상동성 아암에 플랭킹(flank)되는 상응하는 인간 F12 서열을 포함하는 삽입물(insert) 핵산을 포함한다.
또 다른 양태에서, 인간화 비-인간 동물 F12 유전자가 제공되며, 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체되었다.
또 다른 양태에서, 생체내에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 방법이 제공된다. 일부 이러한 방법은 (a) 인간-응고-인자-XII-표적화 시약을 상기 기재된 임의의 비-인간 동물에게 투여하는 단계; (b)인간-응고-인자-XII-표적화 시약의 활성을 상기 비-인간 동물에서 평가하는 단계를 포함한다.
일부 이러한 방법에서, 투여는 아데노-관련 바이러스(AAV)-매개 전달, 지질 나노입자(LNP)-매개 전달, 유체역학적 전달(HDD: hydrodynamic delivery), 또는 주사를 포함한다.
일부 이러한 방법에서, 단계 (b)는 비-인간 동물로부터 혈장을 단리하는 단계 및 상기 혈장에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 단계 (b)는 상기 비-인간 동물의 간 또는 뇌에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 단계 (b)는 응고 또는 트롬빈 생산을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 단계 (b)는 HGF-Met 신호전달을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 단계 (b)는 인간화 내인성 F12 좌위에 의해 인코딩되는 F12 메신저 RNA의 발현을 측정하는 단계를 포함한다. 일부 이러한 방법에서, 단계 (b)는 인간화 내인성 응고 인자 XII 좌위에 의해 인코딩되는 응고 인자 XII 단백질의 발현을 측정하는 단계를 포함한다. 일부 이러한 방법에서, 인간-응고-인자-XII-표적화 시약은 게놈-편집 제제이고, 상기 단계 (b)는 인간화 내인성 F12 좌위의 변형을 평가하는 단계를 포함한다. 일부 이러한 방법에서, 단계 (b)는 인간화 내인성 F12 좌위 내에서 삽입 또는 결실의 빈도를 측정하는 단계를 포함한다.
일부 이러한 방법에서, 인간-응고-인자-XII-표적화 시약은 인간 F12 유전자의 영역을 표적화하도록 설계된 뉴클레아제 제제를 포함한다. 선택적으로, 뉴클레아제 제제는 Cas 단백질, 및 인간 F12 유전자 내의 가이드 RNA 표적 서열을 표적화하도록 설계된 가이드 RNA를 포함한다. 선택적으로, Cas 단백질은 Cas9 단백질이다.
일부 이러한 방법에서, 인간-응고-인자-XII-표적화 시약은 외인성 공여자 핵산을 포함하며, 상기 외인성 공여자 핵산은 인간 F12 유전자를 표적화하도록 설계되고, 선택적으로 상기 외인성 공여자 핵산은 AAV를 통해 전달된다. 일부 이러한 방법에서, 인간-응고-인자-XII-표적화 시약은 RNAi 제제 또는 안티센스 올리고뉴클레오타이드이다. 일부 이러한 방법에서, 인간-응고-인자-XII-표적화 시약 은 항원-결합 단백질이다. 일부 이러한 방법에서, 인간-응고-인자-XII-표적화 시약은 저분자이다.
또 다른 양태에서, 생체내에서 인간-응고-인자-XII-표적화 시약의 활성을 최적화하는 방법이 제공된다. 일부 이러한 방법은 (I) 첫번째로 인간화 내인성 F12 좌위를 게놈에 포함하는 제1 비-인간 동물에서 임의의 상기 방법을 수행하는 단계; (II) 변수를 변화시키고, 두번째로 인간화 내인성 F12 좌위를 게놈에 포함하는 제2 비-인간 동물에서 변화된 변수로 상기 단계 (I)의 방법을 수행하는 단계; 및 (III) 상기 단계 (I)에서의 인간-응고-인자-XII-표적화 시약의 활성을 상기 단계 (II)에서의 인간-응고-인자-XII-표적화 시약의 활성과 비교하고, 더 높은 활성을 초래하는 방법을 선택하는 단계를 포함한다.
일부 이러한 방법에서, 단계 (II)에서의 변화된 변수는 인간-응고-인자-XII-표적화 시약을 비-인간 동물 내로 도입하는 전달 방법이다. 일부 이러한 방법에서, 단계 (II)에서의 변화된 변수는 인간-응고-인자-XII-표적화 시약을 비-인간 동물 내로 도입하는 투여 경로이다. 일부 이러한 방법에서, 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-응고-인자-XII-표적화 시약의 농도 또는 양이다. 일부 이러한 방법에서, 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-응고-인자-XII-표적화 시약의 형태이다. 일부 이러한 방법에서, 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-응고-인자-XII-표적화 시약이다.
또 다른 양태에서, 임의의 상기 비-인간 동물을 제조하는 방법이 제공된다. 일부 이러한 방법은 (a) 비-인간 동물 배아 줄기(ES) 세포 내로 (i) 내인성 F12 좌위 내 표적 서열을 표적화하는 뉴클레아제 제제; 및 (ii) 내인성 F12 좌위 내 5' 표적 서열에 상응하는 5' 상동성 아암과 내인성 F12 좌위 내 3' 표적 서열에 상응하는 3' 상동성 아암에 플랭킹되는 인간 F12 서열을 포함하는 핵산 삽입물을 포함하는 표적화 벡터로서, 상기 표적화 벡터는 내인성 F12 좌위와 재조합되어, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 유전적으로 변형된 비-인간 ES 세포의 게놈에 포함하는 상기 유전적으로 변형된 비-인간 ES 세포를 생성하는, 표적화 벡터를 도입하는 단계; (b) 상기 유전적으로 변형된 비-인간 ES 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (c) 상기 비-인간 동물 숙주 배아를 대리모에 임신시키는 단계로서, 상기 대리모는 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 상기 F0 자손 유전적으로 변형된 비-인간 동물을 생성하는, 단계를 포함한다. 선택적으로, 표적화 벡터는, 적어도 10 kb 길이이거나 5' 상동성 아암과 3' 상동성 아암의 총 합계가 적어도 10 kb 길이인 큰 표적화 벡터이다.
일부 이러한 방법은 (a) 비-인간 동물 1-세포 단계(cell stage) 배아 내로 (i) 내인성 F12 좌위 내 표적 서열을 표적화하는 뉴클레아제 제제; 및 (ii) 내인성 F12 좌위 내 5' 표적 서열에 상응하는 5' 상동성 아암과 내인성 F12 좌위 내 3' 표적 서열에 상응하는 3' 상동성 아암에 플랭킹되는 인간 F12 서열을 포함하는 핵산 삽입물을 포함하는 표적화 벡터로서, 상기 표적화 벡터는 내인성 F12 좌위와 재조합되어, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 유전적으로 변형된 비-인간 1-세포 단계 배아의 게놈에 포함하는 상기 유전적으로 변형된 비-인간 1-세포 단계 배아를 생성하는, 표적화 벡터를 도입하는 단계; (b) 상기 유전적으로 변형된 비-인간 동물 1-세포 단계 배아를 대리모에 임신시켜, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 상기 유전적으로 변형된 F0 세대 비-인간 동물을 생성하는, 단계를 포함한다.
일부 이러한 방법에서, 뉴클레아제 제제는 Cas 단백질 및 가이드 RNA를 포함한다. 선택적으로, Cas 단백질은 Cas9 단백질이다. 일부 이러한 방법에서, 단계 (a)는 내인성 F12 좌위 내의 제2 표적 서열을 표적화하는 제2 가이드 RNA를 도입하는 단계를 추가로 포함한다.
일부 이러한 방법은 (a) 인간화 내인성 F12 좌위를 게놈에 포함하는 유전적으로 변형된 비-인간 동물 배아 줄기(ES) 세포를 비-인간 동물 숙주 내로 도입하는 단계로서, 상기 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 단계; 및 (b) 비-인간 동물 숙주 배아를 대리모에 임신시키는 단계로서, 상기 대리모는 인간화 내인성 F12 좌위를 포함하는 F0 자손 유전적으로 변형된 비-인간 동물을 생성하는 단계를 포함한다.
일부 이러한 방법은 (a) 비-인간 동물 배아 줄기(ES) 세포 내로 내인성 F12 좌위 내 5' 표적 서열에 상응하는 5' 상동성 아암과 내인성 F12 좌위 내 3' 표적 서열에 상응하는 3' 상동성 아암에 플랭킹되는 인간 F12 서열을 포함하는 핵산 삽입물을 포함하는 표적화 벡터로서, 상기 표적화 벡터는 내인성 F12 좌위와 재조합되어, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 유전적으로 변형된 비-인간 ES 세포의 게놈에 포함하는 상기 유전적으로 변형된 비-인간 ES 세포를 생성하는, 표적화 벡터를 도입하는 단계; (b) 상기 유전적으로 변형된 비-인간 ES 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (c) 상기 비-인간 동물 숙주 배아를 대리모에 임신시키는 단계로서, 상기 대리모는 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 상기 F0 자손 유전적으로 변형된 비-인간 동물을 생성하는, 단계를 포함한다. 선택적으로, 표적화 벡터는, 적어도 10 kb 길이이거나 5' 상동성 아암과 3' 상동성 아암의 총 합계가 적어도 10 kb 길이인 큰 표적화 벡터이다.
일부 이러한 방법은 (a) 비-인간 동물 1-세포 단계 배아 내로 내인성 F12 좌위 내 5' 표적 서열에 상응하는 5' 상동성 아암과 내인성 F12 좌위 내 3' 표적 서열에 상응하는 3' 상동성 아암에 플랭킹되는 인간 F12 서열을 포함하는 핵산 삽입물을 포함하는 표적화 벡터로서, 상기 표적화 벡터는 내인성 F12 좌위와 재조합되어, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 유전적으로 변형된 비-인간 1-세포 단계 배아의 게놈에 포함하는 상기 유전적으로 변형된 비-인간 1-세포 단계 배아를 생성하는, 표적화 벡터를 도입하는 단계; (b) 상기 유전적으로 변형된 비-인간 동물 1-세포 단계 배아를 대리모에 임신시켜, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 상기 유전적으로 변형된 F0 세대 비-인간 동물을 생성하는, 단계를 포함한다.
일부 이러한 방법에서, 단계 (a)는 뉴클레아제 제제 또는 상기 뉴클레아제 제제를 인코딩하는 핵산을 도입하는 단계를 추가로 포함하고, 상기 뉴클레아제 제제는 내인성 F12 좌위 내의 표적 서열을 표적화한다. 선택적으로, 뉴클레아제 제제는 Cas 단백질 및 가이드 RNA를 포함한다. 선택적으로, Cas 단백질은 Cas9 단백질이다. 선택적으로, 단계 (a)는 내인성 F12 좌위 내의 제2 표적 서열을 표적화하는 제2 가이드 RNA를 도입하는 단계를 추가로 포함한다.
일부 이러한 방법에서, 비-인간 동물은 마우스 또는 래트이다. 선택적으로, 비-인간 동물은 마우스이다.
또 다른 양태에서, 생물학적 시료에서 짧은 F12 mRNA 이소형의 발현을 평가하는 방법이 제공된다. 일부 이러한 방법은 (a) F12 유전자의 엑손 9-14 중 하나 이상에 대한 프라이머 및/또는 프로브를 사용하여 RNA 전사물을 검출하고 정량화하는 단계 및 (b) F12 유전자의 엑손 1-6 중 하나 이상에 대한 프라이머 및/또는 프로브를 사용하여 RNA 전사물을 검출하고 정량화하는 단계로서, 짧은 이소형은 엑손 1-6에 대한 프라이머 및/또는 프로브가 아니라 엑손9-14에 대한 프라이머 및/또는 프로브에 의해 검출되는, 단계를 포함한다.
도 1(척도대로 아님)은 마우스 응고 인자 XII(F12) 좌위의 인간화를 위한 표적화 계획의 개략도를 도시한다. 도면의 상단부는 내인성 마우스 F12 좌위 및 내인성 인간 F12 좌위를 도시하고, 도면의 하단부는 자가-결실적 선택 카세트가 있거나 없는 인간화 좌위를 도시한다.
도 2(척도대로 아님)는 마우스 F12 좌위의 인간화를 스크리닝하기 위한 TAQMAN® 검정의 개략도를 도시한다. 대립유전자-획득(GOA: gain-of-allele) 검정은 7374hU 및 7374hD를 포함한다. 대립유전자-소실(LOA: loss-of-allele) 검정은 7374mTU 및 7374mTD를 포함한다.
도 3은 인간 및 마우스 응고 인자 XII 단백질(각각 hF12 및 mF12)의 정렬을 도시한다. 신호 펩타이드는 상자 표시되어 있고, 중쇄 및 경쇄 영역은 주지되어 있다.
도 4는 인간화 F12 마우스 및 야생형(VG WT) 마우스로부터의 혈장 시료에서의 인간 응고 인자 XII 수준을 도시한다. 풀링된 정상 인간 혈장은 양성 대조군으로서 사용되었고, 인간 FXII-ID(FXII-면역결핍된) 혈장은 음성 대조군으로서 사용되었다. 스튜던츠 t-검정; *** p<0.001에 대해 vs. 시험된 인간 혈장에 대한 정상 인간 혈장 또는 vs. 마우스 혈장에 대한 야생형.
도 5는 야생형 마우스(FXII+/+), F12 넉아웃 마우스(FXII-/-), 및 인간화 F12 (FXIIhum/hum) 마우스로부터의 혈장 시료의 웨스턴 블롯 분석을 도시한다. 마우스 응고 인자 XII 및 인간 응고 인자 XII의 발현이 측정되었다. 알부민은 로딩 대조군으로서 사용되었다.
도 6은 야생형 및 인간화 F12 마우스에서의 활성화된 부분 트롬보플라스틴 시간(aPTT) 결과를 도시한다.
도 7a는 FXII 단백질 도메인에 비해 qPCR 프로브의 국재화를 도시하는 개략도이다. 각각의 프로브 아래의 선(line)은 증폭된 F12 mRNA의 영역을 나타낸다.
도 7b는 간에서 모든 F12 mRNA 영역의 발현, 및 그러나 전체 뇌, 해마, 및 측두엽에서 엑손 7-14의 발현만 실증하는 qPCR 분석의 결과를 도시한다. F12 발현은 GAPDH로 정규화되고, 간 수준의 백분율로서 플롯화된다.
도 7c는 GTEx 포털로부터의 RNAseq 데이터가 인간 간에서 엑손 1 내지 엑손 14로부터의 완전(full) F12 mRNA 커버리지(coverage)를 도시하지만 인간 해마 및 피질에서는 단지 엑손 7 내지 14로부터의 커버리지를 보여줌을 도시한다. F12 엑손은, 유전자가 마이너스(minus) 가닥 상에 놓임에 따라 우측으로부터 좌측까지 순서가 매겨진다. 데이터는 2018년 12월에 GTEx 포털로부터 수득되었다.
도 8a는 인간 및 마우스 F12 유전자 및 전사물을 보여주는 UCSC 게놈 브라우저 분석의 개략도이다. 인간 F12는, 마우스 F12가 결여되고 있는 엑손 8 내지 12를 경유하는(spanning) 1364개의 염기(CpG 디뉴클레오타이드 카운트 = 141; 68.9% GC 함량)로 구성된 큰 CpG 섬(island)을 가지며, 여기서 CpG 섬은 19의 훨씬 더 낮은 CpG 카운트를 갖고 231개 염기로 구성된다. GenBank는 엑손 9에서 출발하는 5개의 인간 F12 전사물을 보여주며, 이는 마우스 F12에 부재한다. 이들 5개의 전사물 중에서, 2개는 실험적 증거에 의해 뒷받침되는 한편, 3개는 합성이다. 엑손 9에서 출발하는 F12 전사물에 대한 기탁 번호는 BC012390, KJ901422, KR710723, KR710724, 및 BT007350이다. 데이터는 UCSC 게놈 브라우저(http://genome.ucsc.edu)로부터 수득되었다. 2013년 12월(GRCh38/hg38) 어셈블리는 인간 데이터에 사용되었고, 2011년 12월(GRCm38/mm10) 어셈블리는 마우스 데이터에 사용되었다.
도 8b는 3개의 개방형 리딩 프레임(ORF: open reading frame)에 대한 뇌 코드에서 발견되는 F12 mRNA를 도시하며, ORF 1 및 2는 βFXIIa(N335-S596)와 유사한 단백질을 코딩한다.
도 9a 내지 도 9d는 FXII297-596이 칼리크레인에 의한 활성화 시 촉매적 활성을 획득하고, 전구-HGF를 HGF로 전환시킬 수 있음을 도시한다.
도 9a에서, FXII297-596은 칼리크레인(15 nM)의 부재의 존재 하에 인큐베이션되었으며, 칼리크레인 활성은 FXIIa 발색성 기질 S-2302를 이용하여 FXII297-596의 활성을 측정하기 전에 아프로티닌으로 저해되었다. 칼리크레인과 함께 예비-인큐베이션된 FXII297-596으로부터의 신호는 잔여 칼리크레인 활성으로 인한 것이 아닌데, 왜냐하면 활성은 FXII297-596이 생략된 시료에서 나타나기 때문이다. 평균 ± SEM이 나타나 있다.
도 9b에서, FXII(1.25 μM)는 카텝신 K(Cath K(cathepsin K); 100 nM) 또는 비히클과 함께 인큐베이션되고, 반응 생성물은 비-환원적 SDS-PAGE에 의해 분석되었다. 약 40 kDa에서 FXII 절단 생성물은 L296과 M297 사이의 절단으로 인해, FXII297-596을 생산할 수 있을 것이다. 카텝신 K-절단된 FXII(375 nM FXII, 30 nM 카텝신 K)의 활성을 발색성 기질 검정에 의해 분석하였다. 무시할 만한 활성은 칼리크레인 활성화의 부재 하에 카텝신 K-절단된 FXII에 대해 관찰되었으며, 이는 카텝신 K 절단이 단독으로는 활성 FXII를 생산하지 않음을 나타낸다. 칼리크레인(15 nM)과 함께 인큐베이션된 카텝신-절단된 FXII는 칼리크레인과 함께 인큐베이션된 전장 FXII보다 훨씬 더 높은 활성을 가졌다. FXII, 칼리크레인, 및 카텝신 K 단독은 무시할 만한 활성을 가졌다. 평균 ± SEM이 나타나 있다.
도 9c에서, 전구-HGF 25 μg/mL는 tPA 또는 트롬빈(모두 50 nM에서)이 아니라 HGFA 및 βFXIIa에 의해 절단되었다.
도 9d에서, FXII297-596(225 nM) 및 FXII(50 nM)는 칼리크레인(15 nM)으로 활성화되었고 칼리크레인 활성이 전구-HGF(25 μg/mL)와 함께 인큐베이션되기 전에 아프로티닌으로 저해되었음을 도시한다. 전구-HGF는 불활성화된 칼리크레인 단독에 의해서가 아니라 칼리크레인-활성화된 FXII297-596 및 칼리크레인-활성화된 FXII(화살표)에 의해 절단되었다. tPA 및 HGFA(225 nM)는 양성 대조군 및 음성 대조군으로서 포함되었다.
도 10a 내지 도 10b는 인간 및 마우스 조직으로부터의 RNAseq 데이터를 도시한다. 도 10a는 2018년 12월에 GTEx 포털로부터 수득된 선택된 인간 조직에서의 F12 발현을 도시한다. 도 10b는 C57BL/6 마우스 조직의 RNAseq 분석으로부터 수득된 선택된 마우스 조직에서의 F12 발현을 도시한다. 그래프를 가로지르는 수직선은 1백만개의 맵핑된 판독물당 전사물의 킬로염기당 단편(FPKM: fragments per kilobase of transcript per million mapped reads) = 1임을 나타낸다.
도 11은, FXII297-596(225 nM)이 칼리크레인(15 nM)으로 활성화되었고 칼리크레인 활성이 프리칼리크레인(200 nM)과 함께 인큐베이션되기 전에 아프로티닌(aprotinin)으로 저해되었음을 도시한다. 프리칼리크레인은 불활성화된 칼리크레인 단독에 의해서가 아니라 칼리크레인-활성화된 FXII297-596에 의해 절단되었다. 칼리크레인 중쇄는 FXII297-596을 활성화시키는 데 사용되는 칼리크레인의 낮은 수준으로 인해 칼리크레인 대조군 레인(lane)에서는 관찰되지 않았다.
정의
본원에서 상호 교환적으로 사용되는 용어인 "단백질", "폴리펩타이드" 및 "펩타이드"는 암호화된 및 비-암호화된 아미노산 및 화학적으로 또는 생화학적으로 변형되거나 유도체화된 아미노산을 비롯한 임의의 길이의 아미노산의 중합체 형태를 포함한다. 상기 용어들은 또한 변형된 펩타이드 백본을 갖는 폴리펩타이드와 같은 변형된 중합체를 포함한다. 용어 "도메인"은 특정 기능 또는 구조를 갖는 단백질 또는 폴리펩타이드의 임의의 파트를 지칭한다.
본원에서 상호교환적으로 사용되는 용어인 "핵산", 및 "폴리뉴클레오타이드"는, 리보뉴클레오타이드, 데옥시리보뉴클레오타이드, 또는 이의 유사체 또는 변형된 버전을 비롯한 임의의 길이의 뉴클레오타이드의 중합체 형태를 포함한다. 이들은, 단일 가닥, 이중 가닥 및 다중 가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 및 퓨린(purine) 염기, 피리미딘 염기 또는 기타 천연, 화학적으로 변형된, 생화학적으로 변형된, 비천연, 또는 유도체화된 뉴클레오타이드 염기를 포함하는 중합체를 포함한다.
용어 "게놈적으로 통합된"은, 뉴클레오타이드 서열이 세포의 게놈 내로 통합되도록 세포 내로 도입된 핵산을 지칭한다. 임의의 프로토콜은 핵산을 세포의 게놈 내로 안정하게 혼입하는 데 사용될 수 있다.
용어 "표적화 벡터"는 세포의 게놈 내 표적 위치에 상동성 재조합(homologous recombination), 비-상동성-말단-접합-매개 리게이션(non-homologous-end-joining-mediated ligation), 또는 임의의 다른 재조합 수단에 의해 도입될 수 있는 재조합 핵산을 지칭한다.
용어 "바이러스 벡터"는, 바이러스 기원의 적어도 하나의 요소를 포함하고 바이러스 벡터 입자 내로의 패키징(packaging)에 충분하거나 이를 허용하는 요소를 포함하는 재조합 핵산을 지칭한다. 벡터 및/또는 입자는 DNA, RNA, 또는 다른 핵산을 시험관내에서, 생체외에서, 또는 생체내에서 세포 내로 이전시키는 목적에 이용될 수 있다. 수많은 형태의 바이러스 벡터가 알려져 있다.
세포, 조직, 단백질, 및 핵산에 관하여 용어 "단리된"은, 상기 세포, 조직, 단백질, 및 핵산의 실질적으로 순수한 조제물까지 그리고 이를 포함하여, 통상 인 시추(in situ) 존재할 수 있는 다른 박테리아, 바이러스, 세포, 또는 다른 성분에 관하여 상대적으로 정제된 세포, 조직, 단백질, 및 핵산을 포함한다. 용어 "단리된"은 또한, 어떠한 천연 발생 대응물(counterpart)도 없으며, 화학적으로 합성되었고 따라서 다른 세포, 조직, 단백질, 및 핵산에 의해 실질적으로 오염되지 않거나, 이들이 천연적으로 수반하는 대부분의 다른 성분(예를 들어, 세포성 성분)(예를 들어, 다른 세포성 단백질, 폴리뉴클레오타이드, 또는 세포성 성분)으로부터 분리 또는 정제되었던 세포, 조직, 단백질, 또는 핵산을 포함한다.
용어 "야생형"은 정상(돌연변이체, 질환에 걸린(diseased), 변경된 등과 대조적임) 상태 또는 맥락에서 확인된 바와 같은 구조 및/또는 활성을 갖는 실체(entity)를 포함한다. 야생형 유전자 및 폴리펩타이드는 종종 다수의 상이한 형태(예를 들어, 대립유전자)로 존재한다.
용어 "내인성 서열"은 세포 또는 비-인간 동물 내에서 천연적으로 발생하는 핵산 서열을 지칭한다. 예를 들어, 비-인간 동물의 내인성 F12 서열은 비-인간 동물 내 F12 좌위에서 천연적으로 발생하는 네이티브 F12 서열을 지칭한다.
"외인성" 분자 또는 서열은 통상 해당 형태 또는 위치(예를 들어, 게놈 좌위)로는 세포에 존재하지 않는 분자 또는 서열을 포함한다. 정상적인 존재는, 세포의 특정 발달 단계 및 환경 조건과 관련된 존재를 포함한다. 외인성 분자 또는 서열은 예를 들어, 세포 내의 상응하는 내인성 서열의 돌연변이화된 버전, 예컨대 내인성 서열의 인간화 버전을 포함할 수 있거나, 세포 내의 내인성 서열에 상응하지만 상이한 형태로(즉, 염색체 내에 있지 않음) 존재하는 서열을 포함할 수 있다. 대조적으로, 내인성 분자 또는 서열은, 특정 환경 조건 하에 특정 발단 단계에서 특정 세포에서 해당 형태 및 위치로 통상 존재하는 분자 또는 서열을 포함한다.
용어 "이종성"은 핵산 또는 단백질의 맥락에서 사용될 때, 핵산 또는 단백질이 동일한 분자에서 함께 천연적으로 발생하지 않는 적어도 2개의 분절을 포함함을 나타낸다. 예를 들어, 용어 "이종성"은 핵산의 분절 또는 단백질의 분절과 관련하여 사용될 때, 핵산 또는 단백질이 자연상에서 서로(예를 들어, 함께 접합된) 동일한 관계에서 발견되지 않는 2개 이상의 하위-서열을 포함함을 나타낸다. 일례로, 핵산 벡터의 "이종성" 영역은, 자연상에서 다른 분자와 회합되어 발견되지 않는 또 다른 핵산 분자 내에 있거나 이에 부착된 핵산의 분절이다. 예를 들어, 핵산 벡터의 이종성 영역은, 자연상에서 코딩 서열과 회합되어 발견되지 않는 서열에 플랭킹되는 코딩 서열을 포함할 수 있을 것이다. 마찬가지로, 단백질의 "이종성" 영역은, 자연상에서 다른 펩타이드 분자(예를 들어, 융합 단백질, 또는 태그를 가진 단백질)와 회합되어 발견되지 않는 또 다른 펩타이드 분자 내에 있거나 이에 부착된 아미노산의 분절이다. 유사하게는, 핵산 또는 단백질은 이종성 표지 또는 이종성 분비 또는 국재화 서열을 포함할 수 있다.
"코돈 최적화"는, 아미노산을 명시하는 3-염기 쌍 코돈 조합의 다중도(multiplicity)에 의해 나타난 바와 같이 코돈의 축퇴성(degeneracy)을 이용하고, 일반적으로 네이티브 아미노산 서열을 유지하는 한편 네이티브 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에서 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써, 특정 숙주 세포에서 증강된 발현을 위해 핵산 서열을 변형시키는 과정을 포함한다. 예를 들어, Cas9 단백질을 인코딩하는 핵산은 천연 발생 핵산 서열과 비교하여, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 또는 임의의 다른 숙주 세포를 포함하여 주어진 원핵 또는 진핵 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. 코돈 사용빈도(codon usage) 표는 일반적으로 예를 들어, "코돈 사용빈도 데이터베이스"에서 입수 가능하다. 이들 표는 많은 방식으로 적응될 수 있다. 예를 들어, 문헌[Nakamura (2000) Nucleic Acids Research 28:292]를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 특정 숙주에서의 발현을 위한 특정 서열의 코돈 최적화에 대한 컴퓨터 알고리즘이 또한 입수 가능하다(예를 들어, Gene Forge 참조).
용어 "좌위"는 유기체의 게놈의 염색체 상의 유전자(또는 유의한 서열), DNA 서열, 폴리펩타이드-인코딩 서열, 또는 장소의 특정 위치를 지칭한다. 예를 들어, "응고 인자 XII 좌위" 또는 "F12 좌위"는, 이러한 서열이 체류하는 곳으로서 식별되었던 유기체의 게놈의 염색체 상의 F12 유전자, F12 DNA 서열, 응고-인자-XII-인코딩 서열, 또는 F12 장소의 특정 위치를 지칭할 수 있다. "F12 좌위"는 예를 들어, 인핸서, 프로모터, 5' 및/또는 3' 비번역 영역(UTR), 또는 이들의 조합을 포함하여 F12 유전자의 조절 요소를 포함할 수 있다.
용어 "유전자"는, 천연적으로 존재한다면, 적어도 하나의 코딩 영역 및 적어도 하나의 비-코딩 영역을 함유할 수 있는 염색체 내의 DNA 서열을 지칭한다. 생성물(예를 들어, RNA 생성물 및/또는 폴리펩타이드 생성물이나 이로 제한되지 않음)을 코딩하는 염색체 내의 DNA 서열은, 유전자가 전장 mRNA(5' 및 3' 비번역 서열을 포함함)에 상응하도록 5' 단부와 3' 단부 둘 다 상의 코딩 영역에 인접하게 위치한 비-코딩 인트론 및 서열이 개재되어 있는(interrupted) 코딩 영역을 포함할 수 있다. 추가로, 조절 서열(예를 들어, 프로모터, 인핸서, 및 전사 인자 결합 부위이나 이로 제한되지 않음), 폴리아데닐화 신호, 내부 리보솜 진입 부위(internal ribosome entry site), 사일런서(silencer), 인설레이션 서열(insulating sequence), 및 기질 부착 영역(matrix attachment region)을 포함한 다른 비-코딩 서열이 유전자에 존재할 수 있다. 이들 서열은 유전자의 코딩 영역에 근접해(예를 들어, 10 kb 내에 있으나 이로 제한되지 않음) 있거나 원거리 부위에 있을 수 있고, 이들은 유전자의 전사 및 번역의 수준 또는 속도에 영향을 미친다.
용어 "대립유전자"는 유전자의 변이체 형태를 지칭한다. 일부 유전자는 여러 가지 상이한 형태를 갖고, 이는 염색체 상의 동일한 위치 또는 유전자 좌위에 위치한다. 이배체(diploid) 유기체는 각각의 유전자 좌위에 2개의 대립유전자를 갖는다. 대립유전자의 각각의 쌍은 특정 유전자 좌위의 유전자형을 나타낸다. 유전자형은, 특정 좌위에 2개의 동일한 대립유전자가 존재한다면 동형접합성으로서 기재되고, 2개의 대립유전자가 상이하다면 이형접합성(heterozygous)으로서 기재된다.
"프로모터"는 특정 폴리뉴클레오타이드 서열에 대해 적절한 전사 개시 부위에서 RNA 합성을 개시하도록 RNA 폴리머라제 II를 지시할 수 있는 TATA 박스를 통상적으로 포함하는 DNA의 조절 영역이다. 프로모터는, 전사 개시 속도에 영향을 미치는 다른 영역을 추가로 포함할 수 있다. 본원에 개시된 프로모터 서열은 작동적으로 연결된 폴리뉴클레오타이드의 전사를 조절한다. 프로모터는 본원에 개시된 하나 이상의 세포 유형(예를 들어, 진핵 세포, 비-인간 포유류 세포, 인간 세포, 설치류 세포, 만능성(pluripotent) 세포, 1-세포 단계 배아, 분화된 세포, 또는 이들의 조합)에서 활성적일 수 있다. 프로모터는 예를 들어, 구성적 활성(constitutively active) 프로모터, 조건적 프로모터, 유도적 프로모터, 시간적 제약(temporally restricted) 프로모터(예를 들어, 발달적 조절(developmentally regulated) 프로모터), 또는 공간적 제약(spatially restricted) 프로모터(예를 들어, 세포-특이적 또는 조직-특이적 프로모터)일 수 있다. 프로모터의 예는 예를 들어, 국제공개 WO 2013/176772호에서 확인할 수 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
유도적 프로모터의 예는 예를 들어, 화학적으로 조절된 프로모터 및 물리적으로-조절된 프로모터를 포함한다. 화학적으로 조절된 프로모터는 예를 들어, 알코올-조절된 프로모터(예를 들어, 알코올 데하이드로게나제(alcA) 유전자 프로모터), 테트라사이클린-조절된 프로모터(예를 들어, 테트라사이클린-반응적 프로모터, 테트라사이클린 오퍼레이터 서열(tetO), tet-On 프로모터, 또는 tet-Off 프로모터), 스테로이드 조절된 프로모터(예를 들어, 래트 글루코코르티코이드 수용체, 에스트로겐 수용체의 프로모터, 또는 엑디손 수용체의 프로모터), 또는 금속-조절된 프로모터(예를 들어, 메탈로단백질 프로모터)를 포함한다. 물리적으로 조절된 프로모터는 예를 들어 온도-조절된 프로모터(예를 들어, 열 충격 프로모터) 및 광(light)-조절된 프로모터(예를 들어, 광-유도적 프로모터 또는 광-억제적 프로모터)를 포함한다.
조직-특이적 프로모터는 예를 들어, 뉴런-특이적 프로모터, 신경교(glia)-특이적 프로모터, 근육 세포-특이적 프로모터, 심장 세포-특이적 프로모터, 신장 세포-특이적 프로모터, 골 세포(bone cell)-특이적 프로모터, 내피 세포-특이적 프로모터, 또는 면역 세포-특이적 프로모터(예를 들어, B 세포 프로모터 또는 T 세포 프로모터)일 수 있다.
발달적으로 조절된 프로모터는 예를 들어, 발달의 배아기 동안 또는 성체 세포에서만 활성인 프로모터를 포함한다.
"작동 가능한 연결부" 또는 "작동 가능하게 연결된"은 성분 둘 다 정상적으로 작용하고 상기 성분 중 적어도 하나가 다른 성분 중 적어도 하나에 발휘되는 기능을 매개할 수 있는 가능성을 가능하게 하는 2개 이상의 성분(예를 들어, 프로모터 및 또 다른 서열 요소)의 병치를 포함한다. 예를 들어, 프로모터가 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 제어한다면, 상기 프로모터는 코딩 서열에 작동 가능하게 연결될 수 있다. 작동 가능한 연결부는 서로 인접하거나 트랜스로 작용하는 이러한 서열을 포함할 수 있다(예를 들어, 조절 서열은 코딩 서열의 전사를 제어하기 위해 거리를 두고 작용할 수 있음).
핵산의 "상보성"은, 핵산의 하나의 가닥의 뉴클레오타이드 서열이 이의 핵염기(nucleobase) 그룹의 배향으로 인해, 반대 핵산 가닥 상의 또 다른 서열과 수소 결합을 형성함을 의미한다. DNA 내 상보적 염기는 전형적으로 A와 T 그리고 C와 G이다. RNA에서, 이들은 전형적으로 C와 G 그리고 U와 A이다. 상보성은 완벽하거나 실질적/충분할 수 있다. 2개 핵산 사이의 완벽한 상보성은, 2개 핵산이 듀플렉스를 형성할 수 있고 상기 듀플렉스 내 모든 염기가 왓슨-크릭 쌍형성(pairing)에 의해 상보적 염기에 결합됨을 의미한다. "실질적인" 또는 "충분한" 상보성은, 하나의 가닥의 서열이 반대 가닥의 서열에 완전히 그리고/또는 완벽히 상보적이지 않지만, 2개 가닥 상의 염기 사이에서 충분한 결합이 발생하여 혼성화 조건의 세트(예를 들어, 염 농도 및 온도)에서 안정한 하이브리드 복합체를 형성함을 의미한다. 이러한 조건은, 혼성화된 가닥의 Tm(용융 온도)을 예측하기 위해 서열 및 표준 수학적 계산을 사용함으로써, 또는 일상적인 방법을 사용함으로써 Tm의 경험적 결정에 의해 예측될 수 있다. Tm은, 2개의 핵산 가닥 사이에서 형성된 혼성화 복합체의 집단이 50% 변성되는 온도를 포함한다(즉, 이중-가닥 핵산 분자의 집단은 절반이 단일 가닥으로 해리됨). Tm 미만의 온도에서, 혼성화 복합체의 형성이 선호되는 반면, Tm 초과의 온도에서, 혼성화 복합체의 가닥의 용융 또는 분리가 선호된다. Tm은 수성 1 M NaCl 용액에서 기지의 G+C 함량을 갖는 핵산에 대해 예를 들어, Tm=81.5+0.41(% G+C)을 사용함으로써 추정될 수 있지만, 다른 기지의 Tm 컴퓨터화(computation)는 핵산 구조적 특징을 고려한다.
혼성화는 2개의 핵산이 상보적 서열을 함유하는 것으로 필요로 하지만, 염기 사이의 미스매치는 가능하다. 2개의 핵산 사이의 혼성화에 적절한 조건은 핵산의 길이 및 상보적 정도에 의존하고, 이에 대한 변수는 잘 알려져 있다. 2개의 뉴클레오타이드 서열 사이의 상보적 정도가 클수록, 이들 서열을 갖는 핵산의 하이브리드에 대한 용융 온도(Tm)의 값이 커진다. 상보성의 짧은 스트레치(stretch)(예를 들어, 35개 이하, 30개 이하, 25개 이하, 22개 이하, 20개 이하, 또는 18개 이하의 뉴클레오타이드에 걸친 상보성)를 갖는 핵산 사이의 혼성화에 대해, 미스매치의 장소가 중요해진다(상기 문헌[Sambrook , 11.7-11.8] 참조). 전형적으로, 혼성화 가능한 핵산에 대한 길이는 적어도 약 10개 뉴클레오타이드이다. 혼성화 가능한 핵산에 예시적인 최소 길이는 적어도 약 15개 뉴클레오타이드, 적어도 약 20개 뉴클레오타이드, 적어도 약 22개 뉴클레오타이드, 적어도 약 25개 뉴클레오타이드, 및 적어도 약 30개 뉴클레오타이드를 포함한다. 더욱이, 온도 및 세척액 염 농도는 상보성 영역 및 상보성 정도(degree)와 같은 인자에 따라 필요한 대로 조정될 수 있다.
폴리뉴클레오타이드의 서열은 특이적으로 혼성화 가능한 이의 표적 핵산과 100% 상보적일 필요는 없다. 더욱이, 폴리뉴클레오타이드는, 개입 또는 인접 분절이 혼성화 사건(예를 들어, 루프 구조 또는 헤어핀 구조)에 관여하지 않도록 하나 이상의 분절에 걸쳐 혼성화할 수 있다. 폴리뉴클레오타이드(예를 들어, gRNA)는, 이것이 표적화되는 표적 핵산 서열 내 표적 영역에 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100%의 서열 상보성을 포함할 수 있다. 예를 들어, 20개 뉴클레오타이드 중 18개가 표적 영역에 상보적이고 따라서 특이적으로 혼성화할 gRNA는 90% 상보성을 나타낼 것이다. 이 예에서, 잔여 비상보적 뉴클레오타이드는 상보적 뉴클레오타이드와 군집화되거나(clustered) 개재될(interspersed) 수 있으며, 서로에 또는 상보적 뉴클레오타이드에 인접할 필요는 없을 수 있다.
핵산 내의 핵산 서열의 특정 스트레치 사이의 상보성 백분율은, 그 전체가 모든 목적을 위해 본원에 참조로서 포함된 문헌[Smith 및 Waterman (1981) Adv. Appl. Math. 2:482-489]의 알고리즘을 사용하는 디폴트 설정(default setting)을 사용하는 BLAST 프로그램(베이직 로컬 정렬 검색 툴(basic local alignment search tools)) 및 PowerBLAST 프로그램(문헌[Altschul (1990) J. Mol. Biol. 215:403-410]; 문헌[Zhang 및 Madden (1997) Genome Res. 7:649-656], 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨)을 사용하거나 갭 프로그램(Gap program)(유닉스에 대한 위스콘신 서열 분석 패키지, 버전 8, Genetics Computer Group, University Research Park, Madison Wis.)을 사용함으로써 일상적으로 결정될 수 있다.
본원에 제공된 방법 및 조성물은 여러 가지 상이한 성분을 이용한다. 상세한 설명 전반에 걸쳐 일부 성분은 활성 변이체 및 단편을 가질 수 있다. 이러한 성분은 예를 들어, Cas 단백질, CRISPR RNA, tracrRNA, 및 가이드 RNA를 포함한다. 이들 성분 각각에 대한 생물학적 활성은 본원 어디에서나 기재되어 있다. 용어 "기능적"은, 생물학적 활성 또는 기능을 나타내는 단백질 또는 핵산(또는 이의 단편 또는 변이체)의 선천적인(innate) 능력을 지칭한다. 이러한 생물학적 활성 또는 기능은 예를 들어, 가이드 RNA 및 표적 DNA 서열에 결합하는 Cas 단백질의 능력을 포함할 수 있다. 기능적 단편 또는 변이체의 생물학적 기능은 원래의 분자와의 비교에서 동일할 수 있거나 사실상 분자의 기본적인 생물학적 기능의 보유에 대해서를 제외하고는 변할 수 있다(예를 들어, 이의 특이성 또는 선택성 또는 효능에 관하여).
용어 "변이체"는, 집단에 가장 우세한(prevalent) 서열과 상이한(예를 들어, 1개 뉴클레오타이드만큼) 뉴클레오타이드 서열 또는 집단에 가장 우세한 서열과 상이한(예를 들어, 1개 아미노산만큼) 단백질 서열을 지칭한다.
용어 "단편"은 단백질을 지칭할 때, 전장 단백질보다 더 짧거나 이보다 더 적은 수의 아미노산을 갖는 단백질을 의미한다. 용어 "단편"은 핵산을 지칭할 때, 전장 핵산보다 더 짧거나 이보다 더 적은 수의 뉴클레오타이드를 갖는 핵산을 의미한다. 단편은 예를 들어, 단백질 단편을 지칭할 때, N-말단 단편(즉, 단백질의 C-말단 단부 중 일부의 제거), C-말단 단편(즉, 단백질의 N-말단 단부 중 일부의 제거), 또는 내부 단편(즉, 단백질의 N-말단 단부 및 C-말단 단부 각각의 일부의 제거)일 수 있다. 단편은 예를 들어, 핵산 단편을 지칭할 때, 5' 단편(즉, 핵산의 3' 단부 중 일부의 제거), 3' 단편(즉, 핵산의 5' 단부 중 일부의 제거), 또는 내부 단편(즉, 핵산의 5' 단부 및 3' 단부 각각의 일부의 제거)일 수 있다.
2개의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 맥락에서, "서열 동일성" 또는 "동일성"은 명시된 비교 범위(comparison window)에 걸쳐 최대 상응도(correspondence)를 위해 정렬될 때 동일한 상기 2개의 서열의 잔기를 지칭한다. 서열 동일성의 백분율이 단백질과 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종, 아미노산 잔기가 유사한 화학적 특성(예를 들어, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되므로 분자의 기능적 특성을 변화시키지 않는 보존적 아미노산 치환에 의해 달라진다. 서열이 보존적 치환에 있어 달라질 때, 서열 동일성 백분율은 치환의 보존적 성질에 대해 보정하기 위해 상향 조정될 수 있다. 이러한 보존적 치환에 의해 달라지는 서열은 "서열 유사성" 또는 "유사성"을 갖는 것으로 언급된다. 이러한 조정을 수행하기 위한 수단은 널리 알려져 있다. 전형적으로, 이는 보존적 치환을 완전 미스매치(full mismatch)가 아닌 부분 미스매치로서 채점(scoring)하여, 서열 동일성 백분율을 증가시키는 것을 수반한다. 따라서, 예를 들어, 동일한 아미노산에 1의 점수가 주어지고 비-보존적 치환에 0의 점수가 주어지는 경우, 보존적 치환에는 0과 1 사이의 점수가 주어진다. 보존적 치환의 채점은, 예를 들어, 프로그램 PC/GENE(Intelligenetics, Mountain View, California)에서 구현된 바와 같이 계산된다.
"서열 동일성의 백분율"은 비교 범위에 걸쳐 2개의 최적으로 정렬된 서열(완벽하게 매칭된 잔기의 최대 수)을 비교함으로써 결정된 값을 포함하고, 상기 비교 범위에서의 폴리뉴클레오타이드 서열의 부분은 상기 2개의 서열의 최적 정렬에 대한 기준 서열(첨가 또는 결실(deletion)을 포함하지 않음)과 비교하여 첨가 또는 결실(즉, 갭)을 포함할 수 있다. 백분율은, 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에서 발생하는 위치의 수를 결정하여 매칭된 위치의 수를 산출하며, 상기 매칭된 위치의 수를 비교 범위 내의 위치의 총 수로 나누고, 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산된다. 달리 명시되지 않는 한(예를 들어, 더 짧은 서열은 연결된 이종성 서열을 포함함), 비교 범위는 비교되는 2개의 서열 중 더 짧은 서열의 전체 길이이다.
달리 언급되지 않는 한, 서열 동일성/유사성 값은 하기 매개변수를 사용하는 GAP 버전 10을 사용하여 수득된 값을 포함한다: 50의 GAP 중량 및 3의 길이 중량(Length Weight), 및 nwsgapdna.cmp 채점 매트릭스(scoring matrix)를 사용한 뉴클레오타이드 서열에 대한 동일성 % 및 유사성 %; 8의 GAP 중량 및 2의 길이 중량, 및 BLOSUM62 채점 매트릭스를 사용한 아미노산 서열에 대한 동일성 % 및 유사성 %; 또는 이와 동등한 임의의 프로그램. "동등한 프로그램"은, 대상이 되는 임의의 2개의 서열에 대하여, GAP 버전 10에 의해 발생된 상응하는 정렬과 비교할 때 동일한 뉴클레오타이드 또는 아미노산 잔기 매치 및 동일한 서열 동일성 백분율을 갖는 정렬을 발생시키는 임의의 서열 비교 프로그램을 포함한다.
용어 "보존적 아미노산 치환"은 서열에 정상적으로 존재하는 아미노산을 유사한 크기, 전하, 또는 극성의 상이한 아미노산으로 치환하는 것을 지칭한다. 보존적 치환의 예는 비극성(소수성) 잔기, 예컨대 이소류신, 발린, 또는 류신을 또 다른 비극성 잔기로 치환하는 것을 포함한다. 마찬가지로, 보존적 치환의 예는, 아르기닌과 라이신 사이, 글루타민과 아스파라긴 사이, 또는 글리신과 세린 사이의 치환과 같이 하나의 극성(친수성) 잔기를 또 다른 잔기로 치환하는 것을 포함한다. 추가로, 염기성 잔기, 예컨대 라이신, 아르기닌, 또는 히스티딘을 또 다른 잔기로 치환하는 것, 또는 산성 잔기, 예컨대 아스파르트산 또는 글루탐산을 또 다른 산성 잔기로 치환하는 것은 보존적 치환의 추가 예이다. 비-보존적 치환의 예는, 극성(친수성) 잔기, 예컨대 시스테인, 글루타민, 글루탐산 또는 라이신을 비극성(소수성) 아미노산 잔기, 예컨대 이소류신, 발린, 류신, 알라닌, 또는 메티오닌으로 치환하는 것 및/또는 비극성 잔기를 극성 잔기로 치환하는 것을 포함한다. 전형적인 아미노산 분류는 하기 표 1에 요약되어 있다.
Figure pct00001
"상동성" 서열(예를 들어, 핵산 서열)은, 공지된 기준 서열과 동일하거나 실질적으로 유사하여, 상기 공지된 기준 서열과 예를 들어, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 상동성 서열은 예를 들어, 이종상동성(orthologous) 서열 및 동종상동성(paralogous) 서열을 포함할 수 있다. 상동성 유전자는 예를 들어 전형적으로, 종분화(speciation) 사건(이종상동성 유전자) 또는 유전적 중복(duplication) 사건(동종상동성 유전자)을 통해 공통의 조상(ancestral) DNA 서열로부터 계통이 이어진다(descend). "이종상동성" 유전자는 종분화에 의해 공통의 조상 유전자로부터 진화한 상이한 종의 유전자를 포함한다. 이종상동체(ortholog)는 전형적으로, 진화 과정에서 동일한 기능을 보유한다. "동종상동성" 유전자는 게놈 내에서 중복에 의해 관련된 유전자를 포함한다. 동종상동체(paralog)는 진화의 과정에서 새로운 기능을 진화시킬 수 있다.
용어 "시험관내"는 인공 환경, 및 인공 환경(예를 들어, 시험관 또는 단리된 세포 또는 세포주) 내에서 발생하는 과정 또는 반응을 포함한다. 용어 "생체내"는 천연 환경(예를 들어, 세포 또는 유기체 또는 신체), 및 천연 환경 내에서 발생하는 과정 또는 반응을 포함한다. 용어 "생체외"는 개체의 신체로부터 제거되었던 세포, 및 이러한 세포 내에서 발생하는 과정 또는 반응을 포함한다.
용어 "리포터 유전자"는, 이종성 프로모터 및/또는 인핸서 요소에 작동적으로 연결된 리포터 유전자 서열을 포함하는 작제물이 상기 프로모터 및/또는 인핸서 요소의 활성화에 필요한 인자를 함유하는(또는 함유하도록 제조될 수 있음) 세포 내로 도입될 때, 쉽게 그리고 정량적으로 검정되는 유전자 생성물(전형적으로 효소)을 인코딩하는 서열을 갖는 핵산을 지칭한다. 리포터 유전자의 예는 베타-갈락토시다제(lacZ)를 인코딩하는 유전자, 박테리아 클로람페니콜 아세틸트랜스퍼라제(cat) 유전자, 반딧불이 루시퍼라제 유전자, 베타-글루쿠로니다제(GUS)를 인코딩하는 유전자, 및 형광 단백질을 인코딩하는 유전자를 포함하지만 이들로 제한되지는 않는다. "리포터 단백질"은 리포터 유전자에 의해 인코딩된 단백질을 지칭한다.
본원에 사용된 바와 같이 용어 "형광 리포터 단백질"은 형광에 기초하여 검출 가능한 리포터 단백질을 의미하며, 상기 형광은 직접적으로 리포터 단백질로부터, 형광원성(fluorogenic) 기질 상에서의 리포터 단백질의 활성으로부터, 또는 형광 태깅된 화합물에 대해 결합 친화도를 갖는 단백질로부터의 것일 수 있다. 형광 단백질의 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, tagGFP, turboGFP, eGFP, 에메랄드(Emerald), 아자미 그린(Azami Green), 단량체성 아자미 그린(Monomeric Azami Green), CopGFP, AceGFP, 및 ZsGreenl), 황색 형광 단백질(예를 들어, YFP, eYFP, 시트린(Citrine), 비너스(Venus), YPet, PhiYFP, 및 ZsYellowl), 청색 형광 단백질(예를 들어, BFP, eBFP, eBFP2, 아주라이트(Azurite), mKalamal, GFPuv, 사파이어(Sapphire) 및 T-사파이어), 시안색 형광 단백질(예를 들어, CFP, eCFP, 세룰린(Cerulean), CyPet, AmCyanl, 및 미도리이시(Midoriishi)-시안색), 적색 형광 단백질(예를 들어, RFP, mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-단량체, HcRed-탠덤, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, 및 Jred), 주황색 형광 단백질(예를 들어, mOrange, mKO, 쿠사비라-오렌지(Kusabira-Orange), 단량체성 쿠사비라-오렌지(Monomeric Kusabira-Orange), mTangerine, 및 tdTomato), 및 세포에서의 존재가 유세포분석 방법에 의해 검출될 수 있는 임의의 다른 적합한 형광 단백질을 포함한다.
이중-가닥 절단부(DSB: double-strand break)에 반응한 수선은 원칙적으로 2개의 보존된 DNA 수선 경로를 통해 발생한다: 상동성 재조합(HR) 및 비-상동성 말단 접합(NHEJ: non-homologous end joining). 문헌[Kasparek & Humphrey (2011) Semin. Cell Dev. Biol. 22(8):886-897]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 마찬가지로, 외인성 공여자 핵산에 의해 매개되는 표적 핵산의 수선은 2개의 폴리뉴클레오타이드 사이에서의 유전적 정보의 임의의 교환 과정을 포함할 수 있다.
용어 "재조합"은 2개의 폴리뉴클레오타이드 사이에서의 유전적 정보의 임의의 교환 과정을 포함하고, 임의의 기전에 의해 발생할 수 있다. 재조합은 상동성 지시 수선(HDR) 또는 상동성 재조합(HR)을 통해 발생할 수 있다. HDR 또는 HR은 뉴클레오타이드 서열 상동성을 필요로 할 수 있는 핵산 수선 형태를 포함하며, "공여자" 분자를 "표적" 분자(즉, 이중-가닥 절단을 경험하였던 분자)의 수선을 위한 주형으로서 사용하고, 공여자로부터 표적으로의 유전적 정보의 이전을 유발한다. 임의의 특정 이론으로 결부시키고자 하는 것은 아니지만, 이러한 이전은, 절단된 표적과 공여자 사이에서 형성되는 헤테로듀플렉스 DNA의 미스매치 보정, 및/또는 표적의 일부가 되게 될 유전적 정보를 재합성하는 데에 공여자가 사용되는 합성-의존적 가닥 어닐링, 및/또는 관련 과정을 수반할 수 있다. 일부 경우, 공여자 폴리뉴클레오타이드, 공여자 폴리뉴클레오타이드의 부분, 공여자 폴리뉴클레오타이드의 복사체, 또는 공여자 폴리뉴클레오타이드의 복사체의 일부가 표적 DNA 내로 통합된다. 문헌[Wang 등 (2013) Cell 153:910-918]; 문헌[Mandalos 등 (2012) PLoS ONE 7:e45768:1-9]; 및 문헌[Wang 등 (2013) Nat Biotechnol. 31:530-532]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
비-상동성 말단 접합(NHEJ)은, 상동성 주형에 대한 필요성 없이 절단 단부를 서로 또는 외인성 서열에 직접 리게이션함으로써 핵산 내 이중-가닥 절단부를 수선하는 것을 포함한다. NHEJ에 의한 비-인접 서열의 리게이션은 종종, 이중-가닥 절단 부위 부근에서 결실, 삽입 또는 전좌를 초래할 수 있다. 예를 들어, NHEJ는 또한, 외인성 공여자 핵산의 단부와의 절단 단부의 직접 리게이션을 통한 외인성 공여자 핵산의 표적화된 통합(즉, NHEJ-기초 캡처)을 초래할 수 있다. 이러한 NHEJ-매개 표적화된 통합은, 상동성 지시 수선(HDR) 경로가 쉽게 사용 가능하지 않을 때(예를 들어, 비-분열 세포, 1차 세포, 및 상동성-기초 DNA 수선을 불량하게 수행하는 세포에서) 외인성 공여자 핵산의 삽입에 바람직할 수 있다. 게다가, 상동성-지시 수선과는 대조적으로, 절단 부위를 플랭킹하는 서열 동일성의 큰 영역에 관한 지식이 필요하지 않으며, 이는 게놈 서열에 대해 제한된 지식이 존재하는 게놈을 갖는 유기체 내로의 표적화된 삽입을 시도할 때 유리할 수 있다. 통합은 외인성 공여자 핵산과 절단된 게놈 서열 사이에서 평활 단부의 리게이션을 통해, 또는 절단된 게놈 서열에서 뉴클레아제 제제에 의해 생산된 것과 상용성(compatible)인 오버행(overhang)들에 플랭킹되는 외인성 공여자 핵산을 사용하여 점착성(sticky) 단부(즉, 5' 또는 3' 오버행을 가짐)의 리게이션을 통해 진행될 수 있다. 예를 들어, 미국 특허출원공개 US 2011/020722호, 국제공개 WO 2014/033644호, WO 2014/089290호, 및 문헌[Maresca 등 (2013) Genome Res. 23(3):539-546]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 평활 단부가 리게이션된다면, 단편 접합에 필요한 미세상동성의 영역을 생산하기 위해 표적 및/또는 공여자 절제가 필요할 수 있으며, 이는 표적 서열에서 원치 않는 변경을 생성시킬 수 있다.
용어 "항원-결합 단백질"은 항원에 결합하는 임의의 단백질을 포함한다. 항원-결합 단백질의 예는 항체, 항체의 항원-결합 단편, 다중-특이적 항체(예를 들어, 이중-특이적 항체), scFV, 비스-scFV, 디아바디, 트리아바디, 테트라바디, V-NAR, VHH, VL, F(ab), F(ab)2, DVD(이중 가변 도메인 항원-결합 단백질), SVD(단일 가변 도메인 항원-결합 단백질), 이중특이적 T-세포 인게이저(BiTE), 또는 다비스바디(Davisbody)를 포함한다(미국 특허 제8,586,713호로서, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨).
하나 이상의 언급된 요소를 "포함하는(comprising)" 또는 "포함하는(including)" 조성물 또는 방법은 구체적으로 언급되지 않은 다른 요소를 포함할 수 있다. 예를 들어, 단백질을 "포함하는(comprise)" 또는 "포함하는(include)" 조성물은 상기 단백질을 단독으로 또는 다른 성분과 조합하여 함유할 수 있다. 이행구(transitional phrase) "본질적으로 ~로 구성되는"은, 청구항의 범위가 상기 청구항에서 언급된 명시된 요소, 및 청구 발명의 기본적인 그리고 신규 특징(들)에 실제적으로 영향을 미치지 않는 것을 포괄하는 것으로 해석되어야 한다. 그러므로, 용어 "본질적으로 ~로 구성되는"은 본 발명의 청구항에서 사용될 때, "포함하는"과 동등한 것으로 해석되고자 하는 것은 아니다.
"선택적인" 또는 "선택적으로"는, 후속적으로 기재된 사건 또는 상황이 발생할 수 있거나 발생할 수 없으며, 설명은 사건 또는 상황이 발생하는 경우 및 사건 또는 상황이 발생하지 않는 상황을 포함한다는 것을 의미한다.
값의 범위의 표기는 그 범위 내의 또는 그 범위를 정의하는 모든 정수, 및 그 범위 내의 정수에 의해 정의되는 모든 하위범위를 포함한다.
문맥으로부터 다르게 분명해지지 않는 한, 용어 "약"은 언급된 값 ± 5를 포괄한다.
용어 "및/또는"은 관련하여 나열된 항목 중 하나 이상의 임의의 그리고 모든 가능한 조합, 뿐만 아니라 대안적으로("또는") 해석될 때 조합의 결여를 지칭하고 포괄한다.
용어 "또는"은 특정 목록의 임의의 하나의 구성원을 지칭하고, 또한 해당 목록의 구성원들의 임의의 조합을 포함한다.
단수형 형태의 관사("a", "an" 및 "the")는 문맥상 명백하게 다르게 나타내지 않는 한, 복수형 지칭을 포함한다. 예를 들어, 용어 "일 단백질" 또는 "적어도 하나의 단백질"은 복수의 단백질을 이들의 혼합물을 포함하여 포함할 수 있다.
통계학적으로 유의하다는 것은 p ≤0.05를 의미한다.
발명의 상세한 설명
I. 개요
인간화 응고 인자 XII(F12) 좌위를 포함하는 비-인간 동물 게놈, 비-인간 동물 세포, 및 비-인간 동물, 및 이러한 비-인간 동물 세포 및 비-인간 동물을 사용하는 방법이 개시된다. 비-인간 동물 F12 유전자를 인간화하는 표적화된 유전적 변형을 포함하는 인간화 비-인간 동물 F12 유전자, 비-인간 동물 F12 유전자를 인간화하는 데 사용하기 위한 뉴클레아제 제제 및 표적화 벡터가 또한 본원에 개시된다. 인간화 F12 좌위를 포함하는 비-인간 동물 세포 또는 비-인간 동물은 인간 응고 인자 XII 단백질 또는 인간 응고 인자 XII 단백질의 하나 이상의 단편을 포함하는 키메라 응고 인자 XII 단백질을 발현한다. 이러한 비-인간 동물 세포 및 비-인간 동물은 시험관내에서, 생체외에서, 또는 생체내에서 인간-응고-인자-XII-표적화 제제(예를 들어, CRISPR/Cas9 게놈 편집 제제 또는 항원-결합 단백질)의 전달 또는 효능을 평가하는 데 사용될 수 있으며, 시험관내에서, 생체외에서, 또는 생체내에서 이러한 제제의 효능의 전달을 최적화하는 방법에 사용될 수 있다.
본원에 개시된 비-인간 동물 세포 및 비-인간 동물 중 일부에서, 인간 F12 게놈 DNA 중 대부분 또는 모두는 상응하는 이종상동성 비-인간 동물 F12 좌위 내로 삽입된다. 본원에 개시된 비-인간 동물 세포 및 비-인간 동물 중 일부에서, 비-인간 동물 F12 게놈 DNA 중 대부분 또는 모두는 상응하는 이종상동성 인간 F12 게놈 좌위와 1-대-1 교환된다. cDNA 삽입을 갖는 비-인간 동물과 비교하여, 인트론-엑손 구조 및 스플라이싱 기구(machinery)가 유지될 때 발현 수준은 더 높아야 하는데, 왜냐하면 보존된 조절자 요소가 무손상으로 남아 있을 가능성이 더 크고, RNA 가공을 받는 스플라이싱된 전사물이 cDNA보다 더 안정하기 때문이다. 대조적으로, 비-인간 동물 F12 좌위 내로의 인간 F12 cDNA의 삽입은 보존된 조절자 요소를 무효화(abolish)시킬 것이다. 비-인간 동물 게놈 서열을 상응하는 이종상동성 인간 게놈 서열로 대체하거나 인간 F12 게놈 서열을 상응하는 이종상동성 비-인간 F12 좌위에서 삽입하는 것은 내인성 F12 좌위로부터의 이식유전자의 충실한(faithful) 발현을 초래할 가능성이 더 크다. 예를 들어, 인간 F12 게놈 서열은, F12 인간화 마우스에서 반복되는(recapitulated) 표현형인 뉴런에서의 더 짧은 이소형의 발현을 구동하는 상이한 내부 조절 요소(internal regulatory element)를 가질 수 있다(마우스 F12 게놈 서열과 비교하여). 내인성 비-인간-동물 F12 좌위보다 무작위 게놈 좌위에서 인간-응고-인자-XII-코딩 서열의 유전자이식 삽입을 갖는 유전자이식 비-인간 동물은 또한, F12 발현의 내인성 조절을 정확하게 반영하지는 않을 것이다. 대부분의 또는 모든 비-인간 동물 게놈 DNA를 상응하는 이종상동성 인간 게놈 DNA와 1-대-1 대체하거나 인간 F12 게놈 서열을 상응하는 이종상동성 비-인간 F12 좌위에서 삽입하는 것으로 인한 인간화 F12 대립유전자는, 인간-응고-인자-XII-표적화 시약(예를 들어, 인간 F12를 표적화하도록 설계된 CRISPR/Cas9 시약, 또는 인간 응고 인자 XII를 표적화하도록 설계된 항체 또는 저분자)의 진 인간 표적 또는 진 인간 표적의 밀접한 근사물을 제공하여, 살아 있는 동물에서 이러한 제제의 효능 및 작용 방식뿐만 아니라 인간화 단백질 및 인간화 유전자가 존재하는 응고 인자 XII 및 F12의 유일한 버전인 설정에서 약물동력학적 연구 및 약력학적 연구의 시험을 가능하게 할 것이다.
II. 인간화 응고 인자 XII (F12) 좌위를 포함하는 비-인간 동물
본원에 개시된 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물은 인간화 응고 인자 XII(F12) 좌위를 포함한다. 인간화 F12 좌위를 포함하는 세포 또는 비-인간 동물은 인간 응고 인자 XII 단백질, 또는 네이티브 응고 인자 XII 단백질의 하나 이상의 단편이 인간 응고 인자 XII로부터의 상응하는 단편으로 대체되었던 부분적으로 인간화된, 키메라 응고 인자 XII 단백질을 발현한다.
A. 응고 인자 XII( F12 )
본원에 기재된 세포 및 비-인간 동물은 인간화 응고 인자 XII(F12) 좌위를 포함한다. 응고 인자 XII(인자 XII, FXII, 하게만(Hageman) 인자, 베타-인자 XIIa 파트 1, 베타-인자 XIIa 파트 2, 응고 인자 XIIa 중쇄, 또는 응고 인자 XIIa 경쇄로도 알려져 있음)는 F12 유전자(FXII, HAE3, HAEX, 또는 HAF로도 알려져 있음)에 의해 인코딩된다. 응고 인자 XII는 간에서 간세포에 의해 합성되고 순환 내로 분비되며, 여기서 응고 인자 XII는 접촉 활성화 시스템을 개시한다. 전형적으로 순환으로 제약되는 것으로 생각되지만, 인자 XII 단백질은 알츠하이머 질환 및 다발성 경화증 환자의 뇌에서 발견되어 왔으며, 접촉 시스템 활성화는 인간 뇌 및 뇌척수액에서 관찰되어 왔다. 응고 인자 XII는 접촉 활성화 시스템을 개시하는 순환형 세린 프로테아제이다. 음으로 하전된 표면 상에서의 또는 혈장 칼리크레인에 의한 인자 XII의 활성화는 활성화된 인자 XII(인자 XIIa)를 생성한다. 인자 XIIa는 내인성 응고 캐스케이드를 개시하며, 이는 트롬빈 생산 및 혈전 형성을 유발한다. 인자 XIIa는 또한 혈장 프리칼리크레인을 칼리크레인으로 전환시키며, 상기 칼리크레인은 칼리크레인-키닌 경로를 활성화시켜 혈관활성 및 전염증성 펩타이드 브래드키닌(bradykinin)의 방출을 초래한다. 이들 잘-연구된 기능에 더하여, 인자 XIIa는 또한 시험관내에서 간세포 성장 인자(HGF) 및 보체 시스템을 활성화시키는 것으로 나타났다. 인자 XII는 단일 사슬 자이모겐(zymogen)으로서 순환되며, 이는 활성화 동안 R353에서 절단 시 효소적으로 활성인 2-사슬 분자(αFXIIa)로 된다. αFXIIa는, 촉매적 도메인을 함유하는 경쇄, 및 경쇄의 단지 작은 부분으로 구성된 βFXIIa로 추가로 가공된다.
인간 F12는 염색체 5(NCBI RefSeq Gene ID 2161; 어셈블리 GRCh38.p12(GCF_000001405.38); 위치 NC_000005.10(177402138..177409576, 보체)) 상에서 5q35.3으로 맵핑된다. 유전자는 14개의 엑손을 갖는 것으로 보고되었다. 야생형 인간 응고 인자 XII 단백질은 UniProt 기탁 번호 P00748로 지정되었다. 하나의 이소형, P00748-1(NCBI 기탁 번호 NP_000496.2와 동일함)에 대한 서열은 SEQ ID NO: 46으로 표시되어 있다. 이러한 이소형을 인코딩하는 mRNA(cDNA)는 NCBI 기탁 번호 NM_000505.3으로 지정되고 SEQ ID NO: 34로 표시되어 있다. 이러한 이소형에 대한 예시적인 코딩 서열(CDS)은 CCDS ID CCDS34302.1로 지정되고 SEQ ID NO: 48로 표시되어 있다. 위치 619가 엑손 6(rs17876030;c.619G>C; p.Ala207Pro)에서 C인 또 다른 예시적인 CDS는 SEQ ID NO: 13으로 표시되고, SEQ ID NO: 5로 표시된 단백질을 인코딩한다. SEQ ID NO: 5로 표시된 전장 인간 응고 인자 XII 단백질은 신호 펩타이드(아미노산 1-19), 중쇄(아미노산 20-372), 및 경쇄(아미노산 373-615)를 포함하여 615개 아미노산을 갖는다. 유사하게는, SEQ ID NO: 46으로 표시된 전장 인간 응고 인자 XII 단백질은 신호 펩타이드(아미노산 1-19), 중쇄(아미노산 20-372), 및 경쇄(아미노산 373-615)를 포함하여 615개 아미노산을 갖는다. 이들 도메인 사이의 묘사는 UniProt에서 지정된 바와 같다. 인간 응고 인자 XII 또는 F12에 대한 지칭은 캐노니컬(canonical)(야생형) 형태뿐만 아니라 모든 대립유전자 형태 및 이소형을 포함한다. 임의의 다른 형태의 인간 응고 인자 XII는 야생형 형태(SEQ ID NO: 5 또는 46)와의 최대 정렬을 위해 숫자매겨진 아미노산을 가지며, 정렬된 아미노산은 동일한 숫자로 지정된다.
마우스 F12는 13으로 맵핑된다; 염색체 13 상의 13 B1(NCBI RefSeq Gene ID 58992; 어셈블리 GRCm38.p4(GCF_000001635.24); 위치 NC_000079.6(55417958..55426804, 보체)). 유전자는 14개의 엑손을 갖는 것으로 보고되었다. 야생형 마우스 응고 인자 XII 단백질은 UniProt 기탁 번호 Q80YC5로 지정되었다. 마우스 응고 인자 XII(NCBI 기탁 번호 NP_067464.2와 동일함)에 대한 서열은 SEQ ID NO: 1로 표시되어 있다. 이러한 이소형(SEQ ID NO: 1)을 인코딩하는 예시적인 mRNA(cDNA)는 NCBI 기탁 번호 NM_021489.3으로 지정되고 SEQ ID NO: 33으로 표시되어 있다. 예시적인 코딩 서열(CDS)(CCDS ID CCDS36675.1)은 SEQ ID NO: 9로 표시되어 있다. SEQ ID NO: 1로 표시된 캐노니컬 전장 마우스 응고 인자 XII 단백질은 신호 펩타이드(아미노산 1-19), 중쇄(아미노산 20-354), 및 경쇄(아미노산 355-597)를 포함하여 597개 아미노산을 갖는다. 이들 도메인 사이의 묘사는 UniProt에서 지정된 바와 같다. 마우스 응고 인자 XII 또는 F12에 대한 지칭은 캐노니컬(야생형) 형태뿐만 아니라 모든 대립유전자 형태 및 이소형을 포함한다. 임의의 다른 형태의 마우스 응고 인자 XII는 야생형 형태와의 최대 정렬을 위해 숫자매겨진 아미노산을 가지며, 정렬된 아미노산은 동일한 숫자로 지정된다.
많은 다른 비-인간 동물에 대한 응고 인자 XII 서열 또한 알려져 있다. 이들은 예를 들어, 래트(UniProt 기탁 번호 D3ZTE0; NCBI RefSeq Gene ID 306761), 소(bovine)(UniProt 기탁 번호 P98140; NCBI RefSeq Gene ID 280789), 기니피그(UniProt 기탁 번호 Q04962), 및 돼지(UniProt 기탁 번호 O97507; NCBI RefSeq Gene ID 397474)를 포함한다.
B. 인간화 F12 좌위
인간화 F12 좌위는, 내인성 F12 좌위의 분절이 결실되었고 이종상동성 인간 F12 서열로 대체된 F12 좌위이다. 인간화 F12 좌위는, 전체 F12 유전자가 상응하는 이종상동성 인간 F12 서열로 대체되는 F12 좌위일 수 있거나, 인간화 F12 좌위는, F12 유전자 중 일부만 상응하는 이종상동성 인간 F12 서열로 대체되는(즉, 인간화되는) F12 좌위일 수 있다. 대안적으로, 인간화 F12 좌위는, 이종상동성 인간 F12 좌위 중 일부가 삽입되는 F12 좌위일 수 있거나, 인간화 F12 좌위는, F12 유전자 중 일부가 결실되고 이종상동성 인간 F12 좌위 중 일부가 삽입되는 F12 좌위일 수 있다. 삽입되는 이종상동성 인간 F12 좌위 중 일부는 예를 들어, 내인성 F12 좌위로부터 결실되는 인간 F12 좌위를 더 많이 포함할 수 있다. 예를 들어, 내인성 F12 좌위에서의 전체 F12 코딩 서열은 결실되고, 상응하는 인간 F12 서열로 대체될 수 있다. 내인성 F12 서열의 특정 분절에 상응하는 인간 F12 서열은, 인간 F12 및 내인성 F12 가 최적으로 정렬될 때(가장 많은 수의 완벽하게 매칭된 잔기) 내인성 F12 서열의 특정 분절과 정렬되는 인간 F12의 영역을 지칭한다. 상응하는 이종상동성 인간 서열은 예를 들어, 상보적 DNA(cDNA) 또는 게놈 DNA를 포함할 수 있다. 선택적으로, 상응하는 이종상동성 인간 F12 서열은 비-인간 동물에서 코돈 용법에 기초하여 코돈-최적화되도록 변형된다. 대체되는(즉, 인간화되는) 영역은 코딩 영역, 예컨대 엑손, 비-코딩 영역, 예컨대 인트론, 비번역 영역, 또는 조절 영역(예를 들어, 프로모터, 인핸서, 또는 전사 억제자-결합 요소), 또는 임의의 이들의 조합을 포함할 수 있다. 일례로, 인간 F12 유전자의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 또는 모든 14개 엑손에 상응하는 엑손은 인간화될 수 있다. 예를 들어, 인간 F12 유전자의 모든 엑손(즉, 엑손 1 내지 14)에 상응하는 엑손은 인간화될 수 있다. 마찬가지로, 인간 F12 유전자의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 또는 모든 13개 엑손에 인트론은 인간화될 수 있거나 내인성으로 남아 있을 수 있다. 예를 들어, 인간 F12 유전자의 모든 엑손(즉, 엑손 1 내지 13)에 상응하는 인트론은 인간화될 수 있다. 조절 서열을 포함하는, 플랭킹하는 비번역 영역 또한 인간화되거나 내인성으로 남아 있을 수 있다. 예를 들어, 5' 비번역 영역(UTR), 3' UTR, 또는 5' UTR과 3' UTR 둘 다는 인간화될 수 있거나, 5' UTR, 3' UTR, 또는 5' UTR과 3' UTR 둘 다는 내인성으로 남아 있을 수 있다. 구체적인 예에서, 5' UTR과3' UTR 둘 다 내인성으로 남아 있다. 이종상동성 서열에 의한 대체의 규모에 따라, 조절 서열, 예컨대 프로모터는 내인성이거나, 대체형 인간 이종상동성 서열에 의해 공급될 수 있다. 예를 들어, 인간화 F12 좌위는 내인성 비-인간 동물 F12 프로모터를 포함할 수 있다(즉, 인간 F12 서열은 내인성 비-인간 동물 프로모터에 작동적으로 연결될 수 있음).
신호 펩타이드, 중쇄, 또는 경쇄를 인코딩하는 영역 중 하나 이상 또는 모두는 인간화될 수 있거나, 이러한 영역 중 하나 이상은 내인성으로 남아 있을 수 있다. 마우스 응고 인자 XII 신호 펩타이드, 중쇄, 및 경쇄에 대한 예시적인 코딩 서열은 SEQ ID NO: 10-12로 각각 표시되어 있다. 인간 응고 인자 XII 신호 펩타이드, 중쇄, 및 경쇄에 대한 예시적인 코딩 서열은 SEQ ID NO: 14-16으로 각각 표시되어 있다. 인간 응고 인자 XII 중쇄에 대한 또 다른 예시적인 코딩 서열은 SEQ ID NO: 49로 표시되어 있다.
예를 들어, 신호 펩타이드를 인코딩하는 F12 좌위의 영역 중 모두 또는 부분은 인간화될 수 있고/있거나 중쇄를 인코딩하는 F12 좌위의 영역 중 모두 또는 부분은 인간화될 수 있고/있거나 경쇄를 인코딩하는 F12 좌위의 영역 중 모두 또는 부분은 인간화될 수 있다. 대안적으로 또는 추가로, 신호 펩타이드를 인코딩하는 F12 좌위의 영역 중 모두 또는 부분은 내인성으로 남아 있을 수 있고/있거나 중쇄를 인코딩하는 F12 좌위의 영역 중 모두 또는 부분은 내인성으로 남아 있을 수 있고/있거나 경쇄를 인코딩하는 F12 좌위의 영역 중 모두 또는 부분은 내인성으로 남아 있을 수 있다. 일례에서, 신호 펩타이드, 중쇄, 및 경쇄를 인코딩하는 F12 좌위의 영역 중 모두 또는 일부는 인간화된다. 선택적으로, F12 좌위의 인간화 영역의 CDS는 SEQ ID NO: 13(또는 이의 축퇴물(degenerate))과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 선택적으로, F12 좌위의 인간화 영역의 CDS는 SEQ ID NO: 48(또는 이의 축퇴물)과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 선택적으로, F12 좌위의 인간화 영역은 SEQ ID NO: 31 및/또는 32와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함한다. 선택적으로, 인간화 F12 좌위는 SEQ ID NO: 5 또는 46과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 선택적으로, 인간화 F12 좌위는 SEQ ID NO: 17 또는 18과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 각각의 경우, 인간화 응고 인자 XII 단백질은 네이티브 응고 인자 XII 단백질 및/또는 인간 응고 인자 XII 단백질의 활성을 보유할 수 있다.
인간화 F12 좌위에 의해 인코딩되는 응고 인자 XII 단백질은, 인간 응고 인자 XII 단백질로부터의 것인 하나 이상의 도메인 및/또는 내인성(즉, 네이티브) 응고 인자 XII 단백질로부터의 것인 하나 이상의 도메인을 포함할 수 있다. 마우스 응고 인자 XII 신호 펩타이드, 중쇄, 및 경쇄에 대한 예시적인 아미노산 서열은 SEQ ID NO: 2-4로 각각 표시되어 있다. 인간 응고 인자 XII 신호 펩타이드, 중쇄, 및 경쇄에 대한 예시적인 아미노산 서열은 SEQ ID NO: 6-8로 각각 표시되어 있다. 인간 응고 인자 XII 중쇄에 대한 또 다른 예시적인 아미노산 서열은 SEQ ID NO: 47로 표시되어 있다.
응고 인자 XII 단백질은 인간 응고 인자 XII 신호 펩타이드, 인간 응고 인자 XII 중쇄, 및 인간 응고 인자 XII 경쇄 중 하나 이상 또는 모두를 포함할 수 있다. 대안적으로 또는 추가로, 응고 인자 XII 단백질은 내인성(즉, 네이티브) 비-인간 동물 응고 인자 XII 단백질로부터의 것인 하나 이상의 도메인을 포함할 수 있다. 예를 들어, 응고 인자 XII 단백질은 내인성(즉, 네이티브) 비-인간 동물 응고 인자 XII 단백질로부터의 신호 펩타이드 및/또는 내인성(즉, 네이티브) 비-인간 동물 응고 인자 XII 단백질로부터의 중쇄 및/또는 내인성(즉, 네이티브) 비-인간 동물 응고 인자 XII 단백질로부터의 경쇄를 포함할 수 있다. 일례로, 응고 인자 XII 단백질은 인간 신호 펩타이드, 중쇄, 및 경쇄를 포함할 수 있다.
인간 응고 인자 XII 단백질로부터의 것인 키메라 응고 인자 XII 단백질 내의 도메인은 완전히 인간화된 서열에 의해 인코딩될 수 있거나(즉, 해당 도메인을 인코딩하는 전체 서열은 이종상동성 인간 F12 서열로 대체됨), 부분적으로 인간화된 서열에 의해 인코딩될 수 있다(즉, 인코딩되는 도메인이 인간 응고 인자 XII 단백질 내의 해당 도메인과 동일하도록, 해당 도메인을 인코딩하는 서열 중 일부는 이종상동성 인간 F12 서열로 대체되고 해당 도메인을 인코딩하는 잔여 내인성(즉, 네이티브) 서열은 이종상동성 인간 F12 서열과 동일한 아미노산을 인코딩함). 마찬가지로, 내인성 응고 인자 XII 단백질로부터의 것인 키메라 단백질 내의 도메인은 완전히 내인성인 서열에 의해 인코딩될 수 있거나(즉, 해당 도메인을 인코딩하는 전체 서열은 내인성 F12 서열임), 부분적으로 인간화된 서열에 의해 인코딩될 수 있다(즉, 인코딩되는 도메인이 내인성 응고 인자 XII 단백질 내의 해당 도메인과 동일하도록, 해당 도메인을 인코딩하는 서열 중 일부는 이종상동성 인간 F12 서열로 대체되지만 이종상동성 인간 F12 서열은 대체되는 내인성 F12 서열과 동일한 아미노산을 인코딩함).
일례로, 인간화 F12 좌위에 의해 인코딩되는 응고 인자 XII 단백질은 인간 응고 인자 XII 신호 펩타이드를 포함할 수 있다. 선택적으로, 인간 응고 인자 XII 신호 펩타이드는 SEQ ID NO: 6과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 선택적으로, 인간 응고 인자 XII 신호 펩타이드에 대한 코딩 서열은 SEQ ID NO: 14와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 또 다른 예로, 인간화 F12 좌위에 의해 인코딩되는 응고 인자 XII 단백질은 인간 응고 인자 XII 중쇄를 포함할 수 있다. 선택적으로, 인간 응고 인자 XII 중쇄는 SEQ ID NO: 7 또는 47과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 선택적으로, 인간 응고 인자 XII 중쇄에 대한 코딩 서열은 SEQ ID NO: 15 또는 49와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 또 다른 예로, 인간화 F12 좌위에 의해 인코딩되는 응고 인자 XII 단백질은 인간 경쇄를 포함할 수 있다. 선택적으로, 인간 경쇄는 SEQ ID NO: 8과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 선택적으로, 인간 경쇄에 대한 코딩 서열은 SEQ ID NO: 16과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성되는 단백질을 인코딩한다. 예를 들어, 인간화 F12 좌위에 의해 인코딩되는 응고 인자 XII 단백질은 SEQ ID NO: 5 또는 46과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 선택적으로, 인간화 F12 좌위에 의해 인코딩되는 F12 CDS는 SEQ ID NO: 13 또는 48(또는 이의 축퇴물)과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. 각각의 경우, 인간화 응고 인자 XII 단백질은 네이티브 응고 인자 XII 단백질 및/또는 인간 응고 인자 XII 단백질의 활성을 보유할 수 있다.
선택적으로, 인간화 F12 좌위는 다른 요소를 포함할 수 있다. 이러한 요소의 예는 선택 카세트, 리포터 유전자, 재조합효소 인식 부위, 또는 다른 요소를 포함할 수 있다. 일례에서, 추가 요소(예를 들어, 선택 카세트)는 인간화 F12 좌위에서의 삽입된 인간 서열의 인트론에 위치한다. 또 다른 예에서, 추가 요소(예를 들어, 선택 카세트)는 인간화 F12 좌위에서의 삽입된 인간 서열의 3'에 위치한다. 대안적으로, 인간화 F12 좌위는 다른 요소가 결여될 수 있다(예를 들어, 선택 마커 또는 선택 카세트가 결여될 수 있음). 적합한 리포터 유전자 및 리포터 단백질의 예는 본원 어디에서나 개시되어 있다. 적합한 선택 마커의 예는 네오마이신 포스포트랜스퍼라제(neor), 하이그로마이신 B 포스포트랜스퍼라제(hygr), 퓨로마이신-N-아세틸트랜스퍼라제(puror), 블라스티시딘 S 데아미나제(bsrr), 크산틴/구아닌 포스포리보실 트랜스퍼라제(gpt), 및 단순 포진(herpes simplex) 바이러스 티미딘 키나제(HSV-k)를 포함한다. 재조합효소의 예는 Cre, Flp, 및 Dre 재조합효소를 포함한다. Cre 재조합효소 유전자의 일례는 Crei이며, 여기서 Cre 재조합효소를 인코딩하는 2개의 엑손은 원핵생물 세포에서 이의 발현을 방지하기 위해 인트론에 의해 분리된다. 이러한 재조합효소는 핵으로의 위치화를 용이하게 하기 위해 핵 국재화 신호(예를 들어, NLS-Crei)를 추가로 포함할 수 있다. 재조합효소 인식 부위는, 부위-특이적 재조합효소에 의해 인식되고 재조합 사건에 대한 기질로서 역할을 할 수 있는 뉴클레오타이드 서열을 포함한다. 재조합효소 인식 부위의 예는 FRT, FRT11, FRT71, attp, att, rox, 및 lox 부위, 예컨대 loxP, lox511, lox2272, lox66, lox71, loxM2, 및 lox5171을 포함한다.
다른 요소, 예컨대 리포터 유전자 또는 선택 카세트는 재조합효소 인식 부위에 플랭킹되는 자가-결실 카세트일 수 있다. 예를 들어, US 8,697,851호 및 US 2013/0312129호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 일례로, 자가-결실 카세트는 마우스 Prm1 프로모터에 작동적으로 연결된 Crei 유전자(인트론에 의해 분리된 Cre 재조합효소를 인코딩하는 2개의 엑손을 포함함) 및 인간 유비퀴틴 프로모터에 작동적으로 연결된 네오마이신 내성 유전자를 포함할 수 있다. Prm1 프로모터를 이용함으로써, 자가-결실 카세트는 F0 동물의 수컷 생식 세포에서 특이적으로 결실될 수 있다. 선택 마커를 인코딩하는 폴리뉴클레오타이드는 표적화되는 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 프로모터의 예는 본원 어디에서나 기재되어 있다. 또 다른 구체적인 예로서, 자가-결실 선택 카세트는 하나 이상의 프로모터(예를 들어, 인간 유비퀴틴 프로모터와 EM7 프로모터 둘 다)에 작동적으로 연결된 하이그로마이신 내성 유전자 코딩 서열, 뒤이어 폴리아데닐화 신호, 뒤이어 하나 이상의 프로모터(예를 들어, mPrm1 프로모터)에 작동적으로 연결된 Crei 코딩 서열, 뒤이어 또 다른 폴리아데닐화 신호를 포함할 수 있으며, 전체 카세트는 loxP 부위들에 플랭킹된다.
인간화 F12 좌위는 또한 조건적 대립유전자일 수 있다. 예를 들어, 조건적 대립유전자는 US 2011/0104799호에 기재된 바와 같은 다기능적 대립유전자일 수 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 예를 들어, 조건적 대립유전자는 (a) 표적 유전자의 전사에 관하여 센스 배향에서의 액추에이팅 서열(actuating sequence); (b) 센스 또는 안티센스 배향에서의 약물 선택 카세트(DSC); (c) 안티센스 배향에서의 관심 뉴클레오타이드 서열(NSI); 및 (d) 역배향에서 인버전 모듈에 의한 조건(COIN: conditional by inversion module, 이는 엑손-분할 인트론 및 역위 가능 유전자-트랩-유사 모듈을 이용함)을 포함할 수 있다. 예를 들어, US 2011/0104799호를 참조한다. 조건적 대립유전자는 제1 재조합효소(recombinase)에 노출 시 재조합되어 (i) 액추에이팅 서열 및 DSC가 결여되고; (ii) 센스 배향에서 NSI 및 안티센스 배향에서 COIN을 함유하는 조건적인 대립유전자를 형성하는 재조합 가능한 단위를 추가로 포함할 수 있다. 예를 들어, US 2011/0104799호를 참조한다.
하나의 예시적인 인간화 F12 좌위(예를 들어, 인간화 마우스 F12 좌위)는, 출발 코돈으로부터 정지 코돈까지의 영역이 상응하는 인간 서열로 대체되는 것이다. 도 1 및 SEQ ID NO: 17 및 SEQ ID NO: 18을 참조한다. 하나의 구체적인 예에서, 인간화 내인성 F12 좌위의 인간 F12 서열은 SEQ ID NO: 31 또는 32로 표시된 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함한다. 또 다른 구체적인 예에서, 인간화 내인성 F12 좌위는 SEQ ID NO: 5 또는 46으로 표시된 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하는 단백질을 인코딩한다. 또 다른 구체적인 예에서, 인간화 내인성 F12 좌위는 SEQ ID NO: 13 또는 48로 표시된 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함하는 코딩 서열을 포함한다. 또 다른 구체적인 예에서, 인간화 내인성 F12 좌위는 SEQ ID NO: 17 또는 18로 표시된 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 동일한 서열을 포함한다.
C. 인간화 응고 인자 XII( F12 ) 좌위를 포함하는 비-인간 동물 게놈, 비-인간 동물 세포, 및 비-인간 동물
본원 어디에서나 기재된 바와 같은 인간화 응고 인자 XII(F12) 좌위를 포함하는 비-인간 동물 게놈, 비-인간 동물 세포, 및 비-인간 동물이 제공된다. 게놈, 세포, 또는 비-인간 동물은 수컷 또는 암컷일 수 있다. 게놈, 세포, 또는 비-인간 동물은 인간화 F12 좌위에 대해 이형접합성 또는 동형접합성일 수 있다. 이배체 유기체는 각각의 유전자 좌위에 2개의 대립유전자를 갖는다. 대립유전자의 각각의 쌍은 특정 유전자 좌위의 유전자형을 나타낸다. 유전자형은, 특정 좌위에 2개의 동일한 대립유전자가 존재한다면 동형접합성으로서 기재되고, 2개의 대립유전자가 상이하다면 이형접합성으로서 기재된다. 인간화 F12 좌위를 포함하는 비-인간 동물은 인간화 내인성 F12 좌위를 이의 생식세포계에서 포함할 수 있다.
본원에 제공되는 비-인간 동물 게놈 또는 세포는 예를 들어, 인간 F12 좌위에 상동성인 또는 이종상동성인 F12 좌위 또는 게놈 좌위를 포함하는 임의의 비-인간 동물 게놈 또는 세포일 수 있다. 게놈은 예를 들어, 진균류 세포(예를 들어, 효모), 식물 세포, 동물 세포, 포유류 세포, 비-인간 포유류 세포, 및 인간 세포를 포함하는 진핵생물 세포로부터의 것일 수 있거나 세포는 이러한 진핵생물 세포일 수 있다. 용어 "동물"은 예를 들어, 포유류, 어류, 파충류, 양서류, 조류, 및 벌레를 포함하여 동물계의 임의의 구성원을 포함한다. 포유류 세포는 예를 들어, 비-인간 포유류 세포, 설치류 세포, 래트 세포, 마우스 세포, 또는 햄스터 세포일 수 있다. 다른 비-인간 포유류는 예를 들어, 비-인간 영장류, 원숭이, 유인원, 오랑우탄, 고양이, 개, 토끼, 말, 황소, 사슴, 들소, 가축(예를 들어, 소(bovine) 종, 예컨대 암소 및 거세우(steer) 등; 양(ovine) 종, 예컨대 양(sheep) 및 염소 등; 및 돼지(porcine) 종, 예컨대 돼지 및 수퇘지)을 포함한다. 조류는 예를 들어, 닭, 칠면조, 타조, 거위, 오리 등을 포함한다. 사육 동물 및 농장 동물 또한 포함된다. 용어 "비-인간"은 인간을 배제한다.
세포는 또한, 임의의 유형의 비분화된 또는 분화된 상태일 수 있다. 예를 들어, 세포는 전능성 세포, 만능성 세포(예를 들어, 인간 만능성 세포 또는 비-인간 만능성 세포, 예컨대 마우스 배아 줄기(ES) 세포 또는 래트 ES 세포), 또는 비-만능성 세포일 수 있다. 전능성 세포는 임의의 세포 유형을 발생시킬 수 있는 미분화된 세포를 포함하고, 만능성 세포는 1개 초과의 분화된 세포 유형으로 발달하는 능력을 소유하는 미분화된 세포를 포함한다. 이러한 만능성 및/또는 전능성 세포는 예를 들어, ES 세포 또는 ES-유사 세포, 예컨대 유도 만능 줄기(iPS: induced pluripotent stem)세포일 수 있다. ES 세포는, 배아 내로의 도입 시 발달중인 배아의 임의의 조직에 기여할 수 있는 배아-유래 전능성 또는 만능성 세포를 포함한다. ES 세포는 배반포의 내부 세포 덩어리로부터 유래될 수 있고, 임의의 3개의 척추동물 배엽층(germ layer)(내배엽, 외배엽 및 중배엽)의 세포로 분화할 수 있다.
본원에 제공된 세포는 또한, 생식 세포(예를 들어, 정자 또는 난모세포(oocyte))일 수 있다. 세포는 유사분열적으로(mitotically) 적격인(competent) 세포 또는 유사분열적으로-불활성 세포, 감수분열적으로(meiotically) 적격인 세포 또는 감수분열적으로-불활성 세포일 수 있다. 유사하게는, 세포는 또한 1차 체세포, 또는 1차 체세포가 아닌 세포일 수 있다. 체세포는 배우자(gamete), 생식 세포, 생식모세포(gametocyte), 또는 미분화된 줄기세포가 아닌 임의의 세포를 포함한다. 예를 들어, 세포는 간 세포, 예컨대 간아세포(hepatoblast) 또는 간세포(hepatocyte)일 수 있다. 대안적으로, 세포는 뉴런 세포, 예컨대 피라미드 뉴런(pyramidal neuronal) 세포 또는 피질 뉴런(cortical neuronal) 세포일 수 있다.
본원에 제공된 적합한 세포는 또한 1차 세포를 포함한다. 1차 세포는 유기체, 기관 또는 조직으로부터 직접 단리되었던 세포 또는 세포의 배양물을 포함한다. 1차 세포는 형질전환되지 않거나 불멸이 아닌 세포를 포함한다. 이들은, 조직 배양물에서 이전에 계대배양되지 않았거나 조직 배양물에서 이전에 계대배양되었으나 조직 배양물에서 무한정으로 계대배양될 수 없는 유기체, 기관 또는 조직으로부터 수득된 임의의 세포를 포함한다. 이러한 세포는 종래의 기법에 의해 단리될 수 있으며, 예를 들어, 간세포 또는 류너 세포를 포함할 수 있다.
본원에 제공된 다른 적합한 세포는 불멸화된 세포를 포함한다. 불멸화된 세포는, 통상적으로 무한정 증식하지 않을 것이지만 돌연변이 또는 변경으로 인해 정상적인 세포 노화를 벗어났고 대신에 분열을 지속할 수 있는 다세포 유기체로부터의 세포를 포함한다. 이러한 돌연변이 또는 변경은 천연적으로 발생하거나 의도적으로 유도될 수 있다. 불멸화된 세포주의 구체적인 예는 HepG2 인간 간암 세포주이다. 수많은 유형의 불멸화된 세포는 널리 알려져 있다. 불멸화된 또는 1차 세포는, 재조합 유전자 또는 단백질을 배양하거나 발현시키는 데 전형적으로 사용되는 세포를 포함한다.
본원에 제공된 세포는 또한 1-세포 단계(one-cell stage) 배아(즉, 수정된 난모세포 또는 접합체)를 포함한다. 이러한 1-세포 단계 배아는 임의의 유전적 배경(예를 들어, BALB/c, C57BL/6, 129, 또는 마우스에 대해 이들의 조합)으로부터의 것일 수 있으며, 신선하거나 냉동된 것일 수 있고, 자연적 번식(natural breeding) 또는 시험관내 수정(fertilization)으로부터 유래될 수 있다.
본원에 제공된 세포는 정상적인 건강한 세포일 수 있거나, 유병(diseased) 또는 돌연변이체-보유 세포일 수 있다.
본원에 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물은 본원 어디에서나 기재된 방법에 의해 만들어질 수 있다. 용어 "동물"은 예를 들어, 포유류, 어류, 파충류, 양서류, 조류, 및 벌레를 포함하여 동물계의 임의의 구성원을 포함한다. 구체적인 예에서, 비-인간 동물은 비-인간 포유류이다. 비-인간 포유류는 예를 들어, 비-인간 영장류, 원숭이, 유인원. 오랑우탄, 고양이, 개, 말, 황소, 사슴, 들소, 양, 토끼, 설치류(예를 들어, 마우스, 래트, 햄스터, 및 기니피그), 및 가축(예를 들어, 소 종, 예컨대 젖소 및 거세우; 양 종, 예컨대 양 및 염소; 및 돼지 종, 예컨대 돼지 및 수퇘지)을 포함한다. 조류는 예를 들어, 닭, 칠면조, 타조, 거위 및 오리를 포함한다. 사육 동물 및 농장 동물 또한 포함된다. 용어 "비-인간 동물"은 인간을 배제한다. 바람직한 비-인간 동물은 예를 들어, 설치류, 예컨대 마우스 및 래트를 포함한다.
비-인간 동물은 임의의 유전적 배경으로부터의 것일 수 있다. 예를 들어, 적합한 마우스는 129 계통, C57BL/6 계통, 129와 C57BL/6의 혼합체, BALB/c 계통, 또는 스위스 웹스터(Swiss Webster) 계통으로부터의 것일 수 있다. 129 계통의 예는 129P1, 129P2, 129P3, 129X1, 129S1(예를 들어, 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6(129/SvEvTac), 129S7, 129S8, 129T1, 및 129T2를 포함한다. 예를 들어, 문헌[Festing (1999) Mamm. Genome 10(8):836]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. C57BL 계통의 예는 C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, 및 C57BL/Ola를 포함한다. 적합한 마우스는 또한, 상기 언급된 129 계통과 상기 언급된 C57BL/6 계통(예를 들어, 50% 129와 50% C57BL/6)의 혼합체로부터의 것일 수 있다. 마찬가지로, 적합한 마우스는 상기 언급된 129 계통의 혼합체 또는 상기 언급된 BL/6 계통의 혼합체(예를 들어, 129S6(129/SvEvTac) 계통)로부터의 것일 수 있다.
유사하게는, 래트는 예를 들어, ACI 래트 계통, 다크 아구티(DA: Dark Agouti) 래트 계통, 위스타(Wistar) 래트 계통, LEA 래트 계통, 스프라그 돌리(SD: Sprague Dawley) 래트 계통, 또는 피셔(Fischer) 래트계통, 예컨대 피셔 F344 또는 피셔 F6을 포함하여 임의의 래트 계통으로부터의 것일 수 있다. 래트는 또한, 상기 나열된 2개 이상의 계통의 혼합체로부터 유래된 계통으로부터 수득될 수 있다. 예를 들어, 적합한 래트는 DA 계통 또는 ACI 계통으로부터의 것일 수 있다. ACI 래트 계통은 백색의 배(belly)와 발(feet) 및 RT1 av1 반수체형(haplotype)과 함께 블랙 아구티(black agouti)를 갖는 것으로서 특징화된다. 이러한 계통은 Harlan Laboratories를 포함하여 여러 가지 공급원으로부터 입수 가능하다. 다크 아구티(DA) 래트 계통은 아구티 코트(agouti coat) 및 RT1 av1 반수체형을 갖는 것으로서 특징화된다. 이러한 래트는 Charles River 및 Harlan Laboratories를 포함하여 여러 가지 공급원으로부터 입수 가능하다. 일부 적합한 래트는 동종 교배된(inbred) 래트 계통으로부터의 것일 수 있다. 예를 들어, 미US 2014/0235933호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
본원에 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물은 뇌에서, 예컨대 뇌 내의 뉴런에서 짧은 FXII 이소형을 발현할 수 있다. 예를 들어, 짧은 FXII 이소형은 엑손 1 내지 6에 대한 프로브에 의해서가 아니라 엑손 11 내지 14에 대한 프로브에 의해 검출되는 F12 mRNA에 의해 인코딩될 수 있다. 구체적인 예에서, 짧은 이소형은 FXII의 프롤린-풍부 및 촉매적 도메인을 함유하는 단백질인 FXII297-596(M297-S596; SEQ ID NO: 75에 의해 인코딩되는 SEQ ID NO: 74)일 수 있다. 짧은 FXII 이소형은 예를 들어, 혈장 칼리크레인에 의해 활성화될 수 있고, 전구(pro)-HGF를 활성 HGF로 전환시킬 수 있다. 짧은 FXII 이소형은 또한 예를 들어, 칼리크레인에 의해 절단 후 활성화될 수 있다. 활성화된 짧은 FXII 이소형은 예를 들어, 프리칼리크레인을 칼리크레인으로 상호(reciprocally) 활성화시킬 수 있다. 예를 들어, 짧은 FXII 이소형은 칼리크레인-키닌 경로를 착수시킬 수 있다. 예를 들어, 짧은 FXII 이소형 활성화는 브래디키닌의 생산을 유발할 수 있다.
본원에 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물은, 상응하는 야생형 비-인간 동물에서의 aPTT 응고 시간과 유의하게 상이하지 않은 활성화된 부분 트롬보플라스틴 시간(aPTT) 응고 시간을 가질 수 있다. 마찬가지로, 본원에 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물은, 상응하는 야생형 비-인간 동물에서의 트롬보플라스틴 시간(PT) 값과 유의하게 상이하지 않은 PT 값을 가질 수 있다.
본원에 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물은 약 1 내지 약 30, 약 1 내지 약 25, 약 1 내지 약 20, 약 2 내지 약 30, 약 2 내지 약 25, 약 2 내지 약 20, 약 3 내지 약 30, 약 3 내지 약 25, 약 3 내지 약 20, 약 4 내지 약 30, 약 4 내지 약 25, 약 4 내지 약 20, 약 5 내지 약 30, 약 5 내지 약 25, 또는 약 5 내지 약 20 μg/mL의, 혈장 내 인간 응고 인자 XII의 수준을 가질 수 있다. 예를 들어, 비-인간 동물 내의 인간 응고 인자 XII는 약 5 내지 약 18 μg/mL일 수 있다. 대안적으로, 본원에 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물은 적어도 약 1 μg/mL, 적어도 약 2 μg/mL, 적어도 약 3 μg/mL, 적어도 약 4 μg/mL, 적어도 약 5 μg/mL, 적어도 약 6 μg/mL, 적어도 약 7 μg/mL, 적어도 약 8 μg/mL, 적어도 약 9 μg/mL, 또는 적어도 약 10 μg/mL의, 혈장 내 인간 응고 인자 XII의 수준을 가질 수 있다.
III. 생체내에서 또는 생체외에서 인간-응고-인자-XII-표적화 시약의 효능을 평가하기 위해 인간화 응고 인자 XII( F12 ) 좌위를 포함하는 비-인간 동물을 사용하는 방법
생체내에서 또는 생체외에서 인간-응고-인자-XII-표적화 시약(예를 들어, 치료적 분자 또는 복합체)의 전달 또는 효능을 평가하거나 최적화하기 위해 본원 어디에서나 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물을 사용하기 위한 다양한 방법이 제공된다. 비-인간 동물이 인간화 F12 좌위를 포함하기 때문에, 상기 비-인간 동물은 인간-응고-인자-XII-표적화 시약의 효능을 더욱 정확하게 반영할 것이다. 이러한 비-인간 동물은 인간 F12 유전자를 표적화하도록 설계된 게놈-편집 시약을 시험하는 데 특히 유용한데, 왜냐하면 본원에 개시된 비-인간 동물은 무작위 게놈 좌위에서 인간 F12 서열의 유전자이식 삽입보다는 인간화 내인성 F12 좌위를 포함하고, 인간화 내인성 F12 좌위는 인공 cDNA 서열보다는 코딩 영역과 비-코딩 영역 둘 다로부터의 이종상동성 인간 게놈 F12 서열을 포함할 수 있기 때문이다.
A. 생체내에서 또는 생체외에서 인간-응고-인자-XII-표적화 시약의 효능을 시험하는 방법
생체내에서 본원 어디에서나 기재된 바와 같은 인간화 F12 좌위를 포함하는 비-인간 동물을 사용하여 인간-응고-인자-XII-표적화 시약의 전달 또는 효능을 평가하기 위한 다양한 방법이 제공된다. 이러한 방법은 (a) 인간-응고-인자-XII-표적화 시약을 비-인간 동물 내로 도입하는 단계(즉, 인간-응고-인자-XII-표적화 시약을 비-인간 동물에게 투여하는 단계); 및 (b) 상기 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 단계를 포함할 수 있다.
인간-응고-인자-XII-표적화 시약은 인간 F12 좌위(인간 F12 유전자), 인간 F12 mRNA, 또는 인간 응고 인자 XII 단백질을 표적화하는 임의의 생물학적 또는 화학적 제제일 수 있다. 인간-응고-인자-XII-표적화 시약의 예는 본원 어디에서나 개시되어 있으며, 예를 들어, 게놈-편집 제제 또는 항원-결합 단백질을 포함한다. 예를 들어, 인간-응고-인자-XII-표적화 시약은 F12-표적화 핵산(예를 들어, CRISPR/Cas 가이드 RNA, 짧은 헤어핀 RNA(shRNA), 또는 작은 간섭 RNA(siRNA)) 또는 F12-표적화 단백질(예를 들어, Cas 단백질, 예컨대 Cas9, ZFN, 또는 TALEN)을 인코딩하는 핵산일 수 있다. 대안적으로, 인간-F12-표적화 시약은 응고-인자-XII-표적화 항체 또는 항원-결합 단백질, 또는 인간 응고 인자 XII를 표적화하는 임의의 다른 고분자(large molecule) 또는 저분자일 수 있다. 일례에서, 인간-응고-인자-XII-표적화 시약은 게놈-편집 제제, 예컨대 뉴클레아제 제제 및/또는 외인성 공여자 핵산(예를 들어, 표적화 벡터)이다.
이러한 인간-응고-인자-XII-표적화 시약은 본원 어디에서나 더욱 상세히 개시된 바와 같은 임의의 전달 방법(예를 들어, AAV, LNP, HDD, 또는 주사)에 의해 그리고 임의의 투여 경로에 의해 투여될 수 있다. 치료적 복합체 및 분자를 전달하는 수단 및 투여 경로는 본원 어디에서나 더욱 상세히 개시되어 있다. 특정 방법에서, 시약은 AAV-매개 전달을 통해 전달되었다. 예를 들어, AAV8은 간을 표적화하는 데 사용될 수 있다. 다른 특정 방법에서, 시약은 LNP-매개 전달에 의해 전달된다. 다른 특정 방법에서, 시약은 유체역학적 전달(HDD)에 의해 전달된다. 용량은 임의의 적합한 용량일 수 있다. 예를 들어, 시약(예를 들어, Cas9 mRNA 및 gRNA)이 LNP-매개 전달에 의해 전달되는 일부 방법에서, 용량은 약 0.01 내지 약 10 mg/kg, 약 0.01 내지 약 5 mg/kg, 약 0.01 내지 약 4 mg/kg, 약 0.01 내지 약 3 mg/kg, 약 0.01 내지 약 2 mg/kg, 약 0.01 내지 약 1 mg/kg, 약 0.1 내지 약 10 mg/kg, 약 0.1 내지 약 6 mg/kg; 약 0.1 내지 약 5 mg/kg, 약 0.1 내지 약 4 mg/kg, 약 0.1 내지 약 3 mg/kg, 약 0.1 내지 약 2 mg/kg, 약 0.1 내지 약 1 mg/kg, 약 0.3 내지 약 10 mg/kg, 약 0.3 내지 약 6 mg/kg; 약 0.3 내지 약 5 mg/kg, 약 0.3 내지 약 4 mg/kg, 약 0.3 내지 약 3 mg/kg, 약 0.3 내지 약 2 mg/kg, 약 0.3 내지 약 1 mg/kg, 약 0.1 mg/kg, 약 0.3 mg/kg, 약 1 mg/kg, 약 2 mg/kg, 또는 약 3 mg/kg일 수 있다. 구체적인 예에서, 용량은 약 0.1 내지 약 6 mg/kg, 약 0.1 내지 약 3 mg/kg, 또는 약 0.1 내지 약 2 mg/kg이다.
인간-응고-인자-XII-표적화 시약의 활성을 평가하는 방법은 잘 알려져 있고 본원 어디에서나 제공된다. 활성의 평가는 본원 어디에서나 개시된 바와 같이 임의의 세포 유형, 임의의 조직 유형, 또는 임의의 기관 유형에서 이루어질 수 있다. 일부 방법에서, 활성의 평가는 혈장에서 이루어진다. 일부 방법에서, 활성의 평가는 간세포에서 이루어진다. 응고-인자-XII-표적화 시약이 게놈 편집 시약(예를 들어, 뉴클레아제 제제)이라면, 이러한 방법은 인간화 F12 좌위의 변형을 평가하는 단계를 포함할 수 있다. 일례로, 평가는 인간화 F12 좌위에서 비-상동성 말단 접합(NHEJ) 활성을 측정하는 단계를 포함할 수 있다. 이는 예를 들어, 인간화 F12 좌위 내에서 삽입 또는 결실의 빈도를 측정하는 단계를 포함할 수 있다. 예를 들어, 평가는 비-인간 동물로부터 단리된 하나 이상의 세포에서 인간화 F12 좌위를 시퀀싱(예를 들어, 차세대 시퀀싱)하는 단계를 포함할 수 있다. 평가는 비-인간 동물로부터 표적 기관(예를 들어, 간) 또는 조직을 단리하는 단계 및 상기 표적 기관 또는 조직에서 인간화 F12 좌위의 변형을 평가하는 단계를 포함할 수 있다. 평가는 또한, 표적 기관 또는 조직 내의 2개 이상의 상이한 세포 유형에서 인간화 F12 좌위의 변형을 평가하는 단계를 포함할 수 있다. 유사하게는, 평가는 비-인간 동물로부터 표적 기관 또는 조직(예를 들어, 2개 이상의 비-표적 기관 또는 조직)을 단리하는 단계 및 상기 비-표적 기관 또는 조직에서 인간화 F12 좌위의 변형을 평가하는 단계를 포함할 수 있다.
이러한 방법은 또한, 인간화 F12 좌위에 의해 생성된 mRNA의 발현 수준을 측정하는 단계를 포함할 수 있거나, 인간화 F12 좌위에 의해 인코딩되는 단백질의 발현 수준을 측정함으로써 이루어질 수 있다. 예를 들어, 단백질 수준은 특정 세포, 조직, 또는 기관 유형(예를 들어, 간)에서 측정될 수 있거나, 분비된 수준은 혈장 또는 혈청에서 측정될 수 있다. 인간화 F12 좌위로부터 발현되는 F12 mRNA 또는 단백질의 발현을 평가하는 방법은 본원 어디에서나 제공되고 잘 알려져 있다.
하나의 구체적인 예로서, 인간-응고-인자-XII-표적화 시약이 게놈 편집 시약(예를 들어, 뉴클레아제 제제)이라면, 인간화 F12 좌위에서의 편집 백분율(percent editing)(예를 들어, 용해된 세포의 풀(pool)로부터의 PCR 반응에서 서열 판독물의 총 수에 걸쳐 관찰된 삽입 또는 결실의 총 수)이 평가될 수 있다(예를 들어, 간 세포에서).
생체내에서 활성을 평가하기 위해 상기 제공된 다양한 방법은 또한, 본원 어디에서나 기재된 바와 같이 생체외에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 데 사용될 수 있다.
일부 방법에서, 인간-응고-인자-XII-표적화 시약은 인간 F12 유전자를 표적화하는 뉴클레아제 제제, 예컨대 CRISPR/Cas 뉴클레아제 제제이다. 이러한 방법은 예를 들어, (a) 인간 F12 유전자를 절단하도록 설계된 뉴클레아제 제제(예를 들어, 인간 F12 유전자 내 가이드 RNA 표적 서열을 표적화하도록 설계된 Cas 단백질, 예컨대 Cas9 및 가이드 RNA)를 비-인간 동물 내로 도입하는 단계; 및 (b) 인간화 F12 좌위의 변형을 평가하는 단계를 포함할 수 있다.
CRISPR/Cas 뉴클레아제의 경우, 예를 들어, 인간화 F12 좌위의 변형은, 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 F12 좌위로 안내(direct)하고, Cas/가이드 RNA 복합체가 가이드 RNA 표적 서열을 절단하여 세포에 의한 수선(예를 들어, 공여자 서열이 존재하지 않는다면 비-상동성 말단 접합(NHEJ)을 통해)을 촉발할 때 유도될 것이다.
선택적으로, 2개 이상의 가이드 RNA가 도입될 수 있으며, 각각은 인간 F12 유전자 내의 상이한 가이드 RNA 표적 서열을 표적화하도록 설계된다. 예를 들어, 2개의 가이드 RNA는 2개의 가이드 RNA 표적 서열 사이의 게놈 서열을 절제하도록 설계될 수 있다. 인간화 F12 좌위의 변형은, 제1 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 F12 좌위로 안내하고, 제2 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 F12 좌위로 안내하며, 제1 Cas/가이드 RNA 복합체가 제1 가이드 RNA 표적 서열을 절단하고 제2 Cas/가이드 RNA 복합체가 제2 가이드 RNA 표적 서열을 절단하여 개입 서열의 절제를 초래할 때 유도될 것이다.
추가로 또는 대안적으로, 인간 F12와 재조합하고 이를 변형시킬 수 있는 외인성 공여자 핵산(예를 들어, 표적화 벡터) 또한 비-인간 동물 내로 도입된다. 선택적으로, 뉴클레아제 제제 또는 Cas 단백질은 본원 어디에서나 기재된 바와 같이 외인성 공여자 핵산에 테터링될 수 있다. 인간화 F12 좌위의 변형은 예를 들어, 가이드 RNA가 Cas 단백질과 복합체를 형성하며 상기 Cas 단백질을 인간화 F12 좌위로 안내하고, Cas/가이드 RNA 복합체가 가이드 RNA 표적 서열을 절단하며, 인간화 F12 좌위가 내인성 공여자 핵산과 재조합되어 인간화 F12 좌위를 변형할 때 유도될 것이다. 외인성 공여자 핵산은 예를 들어, 상동성-지시 수선(HDR)을 통해 또는 NHEJ-매개 삽입을 통해 인간화 F12 좌위와 재조합될 수 있다. 임의의 유형의 외인성 공여자 핵산이 사용될 수 있으며, 이의 예는 본원 어디에서나 제공된다.
B. 생체내에서 또는 생체외에서 인간-응고-인자-XII-표적화 시약의 전달 효능을 최적화하는 방법
생체내에서 세포 또는 비-인간 동물로의 인간-응고-인자-XII-표적화 시약의 전달을 최적화하거나 인간-응고-인자-XII-표적화 시약의 활성 또는 효능을 최적화하기 위한 다양한 방법이 제공된다. 이러한 방법은 예를 들어, (a) 첫번째로 인간화 F12 좌위를 포함하는 제1 비-인간 동물 또는 제1 세포에서 상기 기재된 바와 같은 인간-응고-인자-XII-표적화 시약의 효능을 시험하는 방법을 수행하는 단계; (b) 변수를 변화시키고, 두번째로 인간화 F12 좌위를 포함하는 제2 비-인간 동물(즉, 동일한 종의) 또는 제2 세포에서 변화된 변수로 상기 방법을 수행하는 단계; 및 (c) 상기 단계 (a)에서의 인간-응고-인자-XII-표적화 시약의 활성을 상기 단계 (b)에서의 인간-응고-인자-XII-표적화 시약의 활성과 비교하고, 더 높은 활성을 초래하는 방법을 선택하는 단계를 포함할 수 있다.
인간-응고-인자-XII-표적화 시약의 전달, 효능, 또는 활성을 측정하는 방법은 본원 어디에서나 개시되어 있다. 예를 들어, 이러한 방법은 인간화 F12 좌위의 변형을 측정하는 단계를 포함할 수 있다. 인간화 F12 좌위의 더욱 효과적인 변형은 비-인간 동물 또는 세포 내에서의 요망되는 효과에 따라 상이한 것을 의미할 수 있다. 예를 들어, 인간화 F12 좌위의 더욱 효과적인 변형은 더 높은 수준의 변형, 더 높은 정밀도(precision), 더 높은 일관성(consistency), 또는 더 높은 특이성 중 하나 이상을 의미할 수 있다. 인간화 F12 좌위의 더 높은 수준의 변형(즉, 더 높은 효능)은, 더 높은 백분율의 세포가 특정 표적 세포 유형 내에서, 특정 표적 조직 내에서, 또는 특정 표적 기관(예를 들어, 간) 내에서 표적화됨을 지칭한다. 더 높은 정밀도는 인간화 F12 좌위의 더 정밀한 변형(예를 들어, 잉여의 의도치 않은 삽입 및 결실(예를 들어, NHEJ 인델(indel)) 없이 동일한 변형을 갖거나 요망되는 변형을 갖는 표적화된 세포의 더 높은 백분율)을 지칭한다. 더 높은 일관성은, 하나 초과의 유형의 세포, 조직, 또는 기관이 표적화되고 있다면(예를 들어, 간 내에서 더 많은 수의 세포 유형의 변형), 상이한 유형의 표적화된 세포, 조직, 또는 기관 중에서 인간화 F12 좌위의 더욱 일관된 변형을 지칭한다. 특정 기관이 표적화되고 있다면, 더 높은 일관성은 또한 기관(예를 들어, 간) 내의 모든 장소들 전반에 걸쳐 더욱 일관된 변형을 지칭할 수 있다. 더 높은 특이성은 표적화되는 게놈 좌위 또는 좌위들에 대한 더 높은 특이성, 표적화되는 세포 유형에 대한 더 높은 특이성, 표적화되는 조직 유형에 대한 더 높은 특이성, 또는 표적화되는 기관에 대한 더 높은 특이성을 지칭할 수 있다. 예를 들어, 증가된 게놈 좌위 특이성은 표적-외(off-target) 게놈 좌위의 더 적은 변형(예를 들어, 표적 게놈 좌위의 변형 대신에 또는 이러한 변형에 더하여 의도치 않은 표적-외 게놈 좌위에 변형을 갖는 표적화된 세포의 더 낮은 백분율)을 지칭한다. 마찬가지로, 증가된 세포 유형, 조직, 또는 기관 유형 특이성은, 특정 세포 유형, 조직 유형, 또는 기관 유형이 표적화되고 있다면 표적-외 세포 유형, 조직 유형, 또는 기관 유형의 더 적은 변형을 지칭한다(예를 들어, 특정 기관(예를 들어, 간)이 표적화될 때, 의도치 않은 표적인 기관 또는 조직에서 세포의 더 적은 변형이 존재함).
대안적으로, 이러한 방법은 F12 mRNA 또는 응고 인자 XII 단백질의 발현을 측정하는 단계를 포함할 수 있다. 일례에서, 더욱 효과적인 인간-응고-인자-XII-표적화 제제는 F12 mRNA 또는 응고 인자 XII 단백질 발현의 더 큰 저하를 초래한다. 대안적으로, 이러한 방법은 응고 인자 XII 활성을 측정하는 단계를 포함할 수 있다. 일례에서, 더욱 효과적인 인간-응고-인자-XII-표적화 제제는 응고-인자-XII 활성의 더 큰 저하를 초래한다.
변화되는 변수는 임의의 매개변수일 수 있다. 일례로, 변화되는 변수는, 인간-응고-인자-XII-표적화 시약 또는 시약들이 세포 또는 비-인간 동물 내로 도입되는 패키징 또는 전달 방법(예를 들어, 전달 비히클)일 수 있다. 전달 방법 또는 전달 비히클, 예컨대 LNP, HDD, 및 AAV의 예는 본원 어디에서나 개시되어 있다. 예를 들어, 변화되는 변수는 AAV 혈청형일 수 있다. 유사하게는, 투여는 LNP-매개 전달을 포함할 수 있고, 변화되는 변수는 LNP 제형일 수 있다. 또 다른 예로, 변화되는 변수는 세포 또는 비-인간 동물 내로의 인간-응고-인자-XII-표적화 시약 또는 시약들의 도입을 위한 투여 경로일 수 있다. 투여 경로의 예, 예컨대 정맥내, 유리체내(intravitreal), 실질내(intraparenchymal,), 및 비내 점적(instillation)은 본원 어디에서나 개시된다.
또 다른 예로, 변화되는 변수는 도입되는 인간-응고-인자-XII-표적화 시약 또는 시약들의 농도 또는 양일 수 있다. 또 다른 예로, 변화되는 변수는, 도입되는 또 다른 인간-응고-인자-XII-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 농도 또는 양에 비해, 도입되는 하나의 인간-응고-인자-XII-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 농도 또는 양일 수 있다.
또 다른 예로, 변화되는 변수는 시약의 활성 또는 효능을 평가하는 시기에 비해 인간-응고-인자-XII-표적화 시약 또는 시약들을 도입하는 시기일 수 있다. 또 다른 예로, 변화되는 변수는 인간-응고-인자-XII-표적화 시약 또는 시약들이 도입되는 횟수 또는 빈도일 수 있다. 또 다른 예로, 변화되는 변수는, 도입되는 또 다른 인간-응고-인자-XII-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 도입 시기에 비해, 도입되는 하나의 인간-응고-인자-XII-표적화 시약(예를 들어, 가이드 RNA, Cas 단백질, 외인성 공여자 핵산, RNAi 제제, 또는 ASO)의 도입 시기일 수 있다.
또 다른 예로, 변화되는 변수는 인간-응고-인자-XII-표적화 시약 또는 시약들이 도입되는 형태일 수 있다. 예를 들어, 가이드 RNA는 DNA의 형태 또는 RNA의 형태로 도입될 수 있다. Cas 단백질(예를 들어, Cas9)은 DNA의 형태, RNA의 형태, 또는 단백질(예를 들어, 가이드 RNA와 복합체화됨)의 형태로 도입될 수 있다. 외인성 공여자 핵산은 DNA, RNA, 단일-가닥, 이중-가닥, 선형, 환식 등일 수 있다. 유사하게는, 각각의 구성요소는 안정성을 위해, 표적-외 효과를 감소시키기 위해, 전달을 용이하게 하기 위해 등과 같이 변형의 다양한 조합을 포함할 수 있다. 마찬가지로, RNAi 제제 및 ASO는 예를 들어, 안정성을 위해, 표적-외 효과를 감소시키기 위해, 전달을 용이하게 하기 위해 등과 같이 변형의 다양한 조합을 포함할 수 있다.
또 다른 예로, 변화되는 변수는 인간-응고-인자-XII-표적화 시약 또는 시약들이 도입되는 것일 수 있다. 예를 들어, 인간-응고-인자-XII-표적화 시약이 가이드 RNA를 포함한다면, 변화된 변수는 상이한 서열을 갖는 상이한 가이드 RNA를 도입하는 것(예를 들어, 상이한 가이드 RNA 표적 서열을 표적화하는 것)일 수 있다. 유사하게는, 인간-응고-인자-XII-표적화 시약이 RNAi 제제 또는 ASO를 포함한다면, 변화된 변수는 상이한 서열을 갖는 상이한 RNAi 제제 또는 ASO를 도입하는 것일 수 있다. 마찬가지로, 인간-응고-인자-XII-표적화 시약이 Cas 단백질을 포함한다면, 변화된 변수는 상이한 Cas 단백질을 도입하는 것(예를 들어, 상이한 서열을 갖는 상이한 Cas 단백질, 또는 상이한 서열을 갖지만(예를 들어, 코돈-최적화됨) 동일한 Cas 단백질 아미노산 서열을 인코딩하는 핵산을 도입하는 것)일 수 있다. 마찬가지로, 인간-응고-인자-XII-표적화 시약이 외인성 공여자 핵산을 포함한다면, 변화되는 변수는 상이한 서열을 갖는 상이한 외인성 공여자 핵산(예를 들어, 상이한 삽입물 핵산 또는 상이한 상동성 아암(예를 들어, 더 길거나 더 짧은 상동성 아암 또는 인간 F12 유전자의 상이한 영역을 표적화하는 상동성 아암))을 도입하는 것일 수 있다.
구체적인 예에서, 인간-응고-인자-XII-표적화 시약은 Cas 단백질, 및 인간 F12 유전자 내의 가이드 RNA 표적 서열을 표적화하도록 설계된 가이드 RNA를 포함한다. 이러한 방법에서, 변화되는 변수는 가이드 RNA 서열 및/또는 가이드 RNA 표적 서열일 수 있다. 일부 이러한 방법에서, Cas 단백질 및 가이드 RNA는 각각 RNA 형태로 투여될 수 있으며, 변화되는 변수는 가이드 RNA(예를 들어, LNP 제형 내)에 대한 Cas mRNA의 비(ratio)일 수 있다. 일부 이러한 방법에서, 변화되는 변수는 가이드 RNA 변형(예를 들어, 변형을 갖는 가이드 RNA는 변형을 갖지 않는 가이드 RNA와 비교됨)일 수 있다.
C. 인간-응고-인자-XII-표적화 시약
인간-응고-인자-XII-표적화 시약은 인간 F12 유전자, 인간 F12 mRNA, 또는 인간 응고 인자 XII 단백질을 표적화하는 임의의 시약일 수 있다. 예를 들어, 상기 시약은 인간 F12 유전자 내의 표적 서열 및/또는 인간 F12 유전자와 재조합되는 외인성 공여자 서열을 절단하는 게놈-편집 시약, 예컨대 뉴클레아제 제제일 수 있거나, 상기 시약은 인간 F12 mRNA를 표적화하는 안티센스 올리고뉴클레오타이드일 수 있거나, 상기 시약은 인간 응고 인자 XII 단백질의 에피토프를 표적화하는 항원-결합 단백질일 수 있거나, 상기 시약은 인간 응고 인자 XII를 표적화하는 저분자일 수 있다. 본원에 개시된 방법에서 인간-응고-인자-XII-표적화 시약은 기지의 인간-응고-인자-XII-표적화 시약일 수 있거나, 추정상(putative) 인간-응고-인자-XII-표적화 시약(예를 들어, 인간 응고 인자 XII를 표적화하도록 설계된 후보 시약)일 수 있거나, 인간-응고-인자-XII-표적화 활성에 대해 스크리닝되는 시약일 수 있다.
(1) 인간 F12 유전자를 표적화하는 뉴클레아제 제제
A 인간-응고-인자-XII-표적화 시약은 인간 F12 유전자 내의 표적 서열을 절단하는 뉴클레아제 제제와 같은 게놈 편집 시약일 수 있다. 뉴클레아제 표적 서열은, 닉 또는 이중-가닥 절단부가 뉴클레아제 제제에 의해 유도되는 DNA 서열을 포함한다. 뉴클레아제 제제에 대한 표적 서열은 세포에 대해 내인성(또는 네이티브)일 수 있거나, 표적 서열은 세포에 대해 외인성일 수 있다. 세포에 대해 외인성인 표적 서열은 세포의 게놈에서 천연 발생하지 않는다. 표적 서열은 또한, 당업자가 표적 좌위에 위치되는 것을 요망하는 관심 폴리뉴클레오타이드에 대해 외인성일 수 있다. 일부 경우, 표적 서열은 숙주 세포의 게놈에서 단지 1회 존재한다.
표적 서열의 길이는 다양할 수 있으며, 예를 들어, 아연 핑거 뉴클레아제(ZFN) 쌍에 대해 약 30-36 bp(즉, 각각의 ZFN에 대해 약 15-18 bp), 전사 활성자-유사 이펙터 뉴클레아제(TALEN: Transcription Activator-Like Effector Nuclease)에 대해 약 36 bp, 또는 CRISPR/Cas9 가이드 RNA에 대해 약 20 bp인 표적 서열을 포함한다.
요망되는 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는 임의의 뉴클레아제 제제는 본원에 개시된 방법 및 조성물에 사용될 수 있다. 천연 발생 또는 네이티브 뉴클레아제 제제는, 상기 뉴클레아제 제제가 요망되는 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는 한 이용될 수 있다. 대안적으로, 변형된 또는 조작된 뉴클레아제 제제가 이용될 수 있다. "조작된 뉴클레아제 제제"는, 요망되는 표적 서열에서 닉 또는 이중-가닥 절단부를 특이적으로 인식하고 유도하기 위해 이의 네이티브 형태로부터 조작되는(변형되는 또는 유래되는) 뉴클레아제를 포함한다. 그러므로, 조작된 뉴클레아제 제제는 네이티브, 천연 발생 뉴클레아제 제제로부터 유래될 수 있거나, 이는 인공적으로 생성되거나 합성될 수 있다. 조작된 뉴클레아제는 표적 서열에서 닉 또는 이중-가닥 절단부를 유도할 수 있으며, 예를 들어, 상기 표적 서열은 네이티브(비-조작된 또는 비-변형된) 뉴클레아제 제제에 의해 인식되었을 서열이 아니다. 뉴클레아제 제제의 변형은 단백질 절단 제제 내의 하나의 아미노산 또는 핵산 절단 제제 내의 하나의 뉴클레오타이드만큼 작을 수 있다. 표적 서열 또는 다른 DNA에서 닉 또는 이중-가닥 절단부를 생성하는 것은 본원에서 상기 표적 서열 또는 다른 DNA를 "자르는(cutting) 것" 또는 "절단하는(cleaving)" 것으로 지칭될 수 있다.
예시된 표적 서열의 활성 변이체 및 단편이 또한 제공된다. 이러한 활성 변이체는 주어진 표적 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있으며, 상기 활성 변이체는 생물학적 활성을 보유하므로, 뉴클레아제 제제에 의해 서열-특이적 방식으로 인식되고 절단될 수 있다. 뉴클레아제 제제에 의한 표적 서열의 이중-가닥 절단부를 측정하는 검정은 잘 알려져 있다. 예를 들어, 문헌[Frendewey 등 (2010) Methods in Enzymology 476:295-307]을 참조하며, 이는 그 전체가 모든 목적을 위해 참조로서 포함된다.
뉴클레아제 제제의 표적 서열은 F12 좌위에서 또는 그 부근에서 임의의 곳에 놓일 수 있다. 표적 서열은 F12 유전자의 코딩 영역 내에, 또는 유전자의 발현에 영향을 미치는 조절 영역 내에 위치할 수 있다. 뉴클레아제 제제의 표적 서열은 인트론, 엑손, 프로모터, 인핸서, 조절 영역, 또는 임의의 비-단백질 코딩 영역에 위치할 수 있다.
일 유형의 뉴클레아제 제제는 전사 활성자-유사 이펙터 뉴클레아제(TALEN)이다. TAL 이펙터 뉴클레아제는, 원핵 또는 진핵 유기체의 게놈 내 특정 표적 서열에서 이중-가닥 절단부를 만드는 데 사용될 수 있는 서열-특이적 뉴클레아제의 클래스이다. TAL 이펙터 뉴클레아제는 네이티브 또는 조작된 전사 활성자-유사(TAL) 이펙터, 또는 이의 기능적 파트를 뉴클레아제의 촉매적 도메인, 예컨대, 예를 들어, FokI에 융합함으로써 생성된다. 독특한 모듈형(modular) TAL 이펙터 DNA 결합 도메인은 잠재적으로 임의의 주어진 DNA 인식 특이성을 갖는 단백질의 설계를 가능하게 한다. 그러므로, TAL 이펙터 뉴클레아제의 DNA 결합 도메인은 특정 DNA 표적 부위를 인식하도록 조작되므로, 요망되는 표적 서열에서 이중-가닥 절단부를 만드는 데 사용될 수 있다. WO 2010/079430호; 문헌[Morbitzer 등 (2010) Proc. Natl. Acad. Sci. U.S.A. 107(50):21617-21622]; 문헌[Scholze & Boch (2010) Virulence 1:428-432]; 문헌[Christian 등 Genetics (2010) 186:757-761]; 문헌[Li (2010) Nuc. Acids Res. (2010) 39(1):359-372]; 및 문헌[Miller 등 (2011) Nature Biotechnology 29:143-148]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
적합한 TAL 뉴클레아제, 및 적합한 TAL 뉴클레아제의 제조 방법의 예는 예를 들어, US 2011/0239315 A1호, US 2011/0269234 A1호, US 2011/0145940 A1호, US 2003/0232410 A1호, US 2005/0208489 A1호, US 2005/0026157 A1호, US 2005/0064474 A1호, US 2006/0188987 A1호, 및 US 2006/0063231 A1호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 다양한 구현예에서, TAL 이펙터 뉴클레아제는 예를 들어, 관심 좌위 또는 관심 게놈 좌위 내 표적 핵산 서열에서 또는 그 부근에서 자르도록 조작되며, 상기 표적 핵산 서열은 표적화 벡터에 의해 변형될 서열에서 또는 그 부근에 존재한다. 본원에 제공된 다양한 방법 및 조성물로 사용되기에 적합한 TAL 뉴클레아제는, 표적 핵산 서열에서 또는 그 부근에 결합하여 본원에 기재된 바와 같은 벡터를 표적화함으로써 변형되도록 특이적으로 설계된 것을 포함한다.
일부 TALEN에서, TALEN의 각각의 단량체는, 2개의 초가변 잔기를 통해 단일 염기쌍을 인식하는 33 내지 35개의 TAL 반복부를 포함한다. 일부 TALEN에서, 뉴클레아제 제제는, 독립적 뉴클레아제, 예컨대 FokI 엔도뉴클레아제에 작동적으로 연결된 TAL-반복부-기초 DNA 결합 도메인을 포함하는 키메라 단백질이다. 예를 들어, 뉴클레아제 제제는 제1 TAL-반복부-기초 DNA 결합 도메인 및 제2 TAL-반복부-기초 DNA 결합 도메인을 포함할 수 있으며, 상기 제1 TAL-반복부-기초 DNA 결합 도메인 및 제2 TAL-반복부-기초 DNA 결합 도메인은 각각 FokI 뉴클레아제에 작동적으로 연결되고, 상기 제1 TAL-반복부-기초 DNA 결합 도메인 및 제2 TAL-반복부-기초 DNA 결합 도메인은 다양한 길이(12-20 bp)의 스페이서 서열에 의해 분리된 표적 DNA 서열의 각각의 가닥에서 2개의 인접한 표적 DNA 서열을 인식하며, FokI 뉴클레아제 하위단위(subunit)는 이량체화되어, 표적 서열에서 이중 가닥 절단부를 만드는 활성 뉴클레아제를 생성한다.
본원에 개시된 다양한 방법 및 조성물에 이용되는 뉴클레아제 제제는 아연-핑거 뉴클레아제(ZFN)를 추가로 포함할 수 있다. 일부 ZFN에서, ZFN의 각각의 단량체는 3개 이상의 아연 핑거-기초 DNA 결합 도메인을 포함하며, 각각의 아연 핑거-기초 DNA 결합 도메인은 3 bp 하위부위에 결합한다. 다른 TALEN에서, ZFN은, 독립적 뉴클레아제, 예컨대 FokI 엔도뉴클레아제에 작동적으로 연결된 아연 핑거-기초 DNA 결합 도메인을 포함하는 키메라 단백질이다. 예를 들어, 뉴클레아제 제제는 제1 ZFN 및 제2 ZFN을 포함할 수 있으며, 상기 제1 ZFN 및 제2 ZFN은 각각 FokI 뉴클레아제 하위단위에 작동적으로 연결되고, 상기 제1 ZFN 및 제2 ZFN은 약 5-7 bp 스페이서에 의해 분리된 표적 DNA 서열의 각각의 가닥에서 2개의 인접한 표적 DNA 서열을 인식하며, FokI 뉴클레아제 하위단위는 이량체화되어, 이중 가닥 절단부를 만드는 활성 뉴클레아제를 생성한다. 예를 들어, US20060246567호; US20080182332호; US20020081614호; US20030021776호; WO/2002/057308A2호; US20130123484호; US20100291048호; WO/2011/017293A2호; 및 문헌[Gaj 등 (2013) Trends Biotechnology, 31(7):397-405]를 참조하며, 이들 각각은 본원에 참조로서 포함된다.
또 다른 유형의 뉴클레아제 제제는 조작된 메가뉴클레아제이다. 메가뉴클레아제는 보존된 서열 모티프에 기초하여 4개의 패밀리로 분류되었으며, 상기 패밀리는 LAGLIDADG, GIY-YIG, H-N-H, 및 His-Cys 상자 패밀리이다. 이들 모티프는 금속 이온의 배위 및 포스포디에스테르 결합의 가수분해에 참여한다. 메가뉴클레아제는 이의 긴 표적 서열에 있어서, 그리고 이의 DNA 기질에서의 일부 서열 다형성을 관용시키는 데 있어서 주목할만 하다. 메가뉴클레아제 도메인, 구조 및 기능은 알려져 있으며, 예를 들어, 문헌[Guhan 및 Muniyappa (2003) Crit Rev Biochem Mol Biol 38:199-248]; 문헌[Lucas 등, (2001) Nucleic Acids Res 29:960-9]; 문헌[Jurica 및 Stoddard, (1999) Cell Mol Life Sci 55:1304-26]; 문헌[Stoddard, (2006) Q Rev Biophys 38:49-95]; 및 문헌[Moure 등, (2002) Nat Struct Biol 9:764]를 참조한다. 일부 예에서, 천연 발생 변이체 및/또는 조작된 유도체 메가뉴클레아제가 사용된다. 동역학(kinectics), 보조인자 상호작용, 발현, 최적의 조건, 및/또는 표적 서열 특이성을 변형시키고, 활성을 스크리닝하는 방법은 알려져 있다. 예를 들어, 문헌[Epinat 등, (2003) Nucleic Acids Res 31:2952-62]; 문헌[Chevalier 등, (2002) Mol Cell 10:895-905]; 문헌[Gimble 등, (2003) Mol Biol 334:993-1008]; 문헌[Seligman 등, (2002) Nucleic Acids Res 30:3870-9]; 문헌[Sussman 등, (2004) J Mol Biol 342:31-41]; 문헌[Rosen 등, (2006) Nucleic Acids Res 34:4791-800]; 문헌[Chames 등, (2005) Nucleic Acids Res 33:e178]; 문헌[Smith 등, (2006) Nucleic Acids Res 34:e149]; 문헌[Gruen 등, (2002) Nucleic Acids Res 0:e29]; 문헌[Chen 및 Zhao, (2005) Nucleic Acids Res 33:e154]; WO2005105989호; WO2003078619호; WO2006097854호; WO2006097853호; WO2006097784호; 및 WO2004031346호를 참조하며, 이들 각각의 전체내용은 본원에 참조로서 포함된다.
예를 들어, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F-SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NcIIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, PI-TliII, 또는 이들의 임의의 활성 변이체 또는 단편을 포함하여 임의의 메가뉴클레아제가 사용될 수 있다.
메가뉴클레아제는 예를 들어, 12 내지 40개 염기쌍의 이중-가닥 DNA 서열을 인식할 수 있다. 일부 경우, 메가뉴클레아제는 게놈 내의 하나의 완벽하게 매칭되는 표적 서열을 인식한다.
일부 메가뉴클레아제는 호밍(homing) 뉴클레아제이다. 일 유형의 호밍 뉴클레아제는 예를 들어, I-SceI, I-CreI, 및 I-Dmol을 포함하여 호밍 뉴클레아제의 LAGLIDADG 패밀리이다.
뉴클레아제 제제는 하기에 더욱 상세히 기재된 바와 같은 CRISPR/Cas 시스템을 추가로 포함할 수 있다.
뉴클레아제 제제(즉, 조작된 뉴클레아제 제제)의 활성 변이체 및 단편이 또한 제공된다. 이러한 활성 변이체는 네이티브 뉴클레아제 제제와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있으며, 상기 활성 변이체는 요망되는 표적 서열에서 자르는 능력을 보유하므로, 닉 또는 이중-가닥-절단부-유도 활성을 보유한다. 예를 들어, 본원에 기재된 임의의 뉴클레아제 제제는 네이티브 엔도뉴클레아제 서열로부터 변형되고, 네이티브 뉴클레아제 제제에 의해 인식되지 않은 표적 서열에서 닉 또는 이중-가닥 절단부를 인식하고 유도하도록 설계될 수 있다. 그러므로, 일부 조작된 뉴클레아제는, 상응하는 네이티브 뉴클레아제 제제 표적 서열과 상이한 표적 서열에서 닉 또는 이중-가닥 절단부를 유도하는 특이성을 갖는다. 닉 또는 이중-가닥-절단부-유도 활성에 대한 검정은 알려져 있고, 일반적으로 표적 서열을 함유하는 DNA 기질 상에서의 엔도뉴클레아제의 전체 활성 및 특이성을 측정한다.
뉴클레아제 제제는 세포 또는 비-인간 동물 내로 임의의 기지의 수단에 의해 도입될 수 있다. 뉴클레아제 제제를 인코딩하는 폴리펩타이드는 세포 또는 비-인간 동물 내로 직접적으로 도입될 수 있다. 대안적으로, 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 세포 또는 비-인간 동물 내로 도입될 수 있다. 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드가 도입될 때, 상기 뉴클레아제 제제는 세포 내에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다. 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 발현 카세트에 함유될 수 있고, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터에 작동적으로 연결될 수 있다. 프로모터의 예는 본원 어디에서나 더 상세히 논의된다. 대안적으로, 뉴클레아제 제제는, 뉴클레아제 제제를 인코딩하는 mRNA로서 세포 내로 도입될 수 있다.
뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 세포의 게놈에서 안정하게 통합되고 상기 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 대안적으로, 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 표적화 벡터에 존재할 수 있다.
뉴클레아제 제제가 상기 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드의 도입을 통해 세포에 제공될 때, 이러한 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 상기 뉴클레아제 제제를 인코딩하는 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 관심 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. 예를 들어, 뉴클레아제 제제를 인코딩하는 폴리뉴클레오타이드는 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 인간 세포, 비-인간 세포, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 또는 임의의 다른 관심 숙주 세포를 포함하여 주어진 관심 진핵 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다.
(2) 인간 F12 유전자를 표적화하는 CRISPR/Cas 시스템
특정 유형의 인간-응고-인자-XII-표적화 시약은, 인간 F12 유전자를 표적화하는 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR: Clustered Regularly Interspersed Short Palindromic Repeats)/CRISPR-관련(Cas) 시스템일 수 있다. CRISPR/Cas 시스템은 Cas 유전자의 발현에 관여하거나 이의 활성을 지시하는(directing) 전사물 및 다른 요소를 포함한다. CRISPR/Cas 시스템은 예를 들어, 유형 I, 유형 II, 유형 III 시스템, 또는 유형 V 시스템(예를 들어, 서브유형 V-A 또는 서브유형 V-B)일 수 있다. 본원에 개시된 조성물 및 방법에 사용되는 CRISPR/Cas 시스템은 비-천연 발생일 수 있다. "비-천연적으로 발생하는" 시스템은 인위적인 관여를 나타내는 임의의 것, 예컨대 이의 천연적으로 발생하는 상태로부터 변경되거나 돌연변이화되거나, 이것이 자연상에서 천연적으로 관련된 적어도 하나의 다른 성분이 적어도 실질적으로 없거나, 이것이 천연적으로 관련이 있지 않는 적어도 하나의 다른 성분과 관련이 있는 시스템의 하나 이상의 성분을 포함한다. 예를 들어, 일부 CRISPR/Cas 시스템은, 천연적으로 함께 발생하지 않는 gRNA 및 Cas 단백질을 포함하는 비-천연 발생 CRISPR 복합체를 이용하거나, 천연적으로 발생하지 않는 Cas 단백질을 이용하거나, 천연적으로 발생하지 않는 gRNA를 이용하지 않는다.
Cas 단백질, 및 Cas 단백질을 인코딩하는 폴리뉴클레오타이드. Cas 단백질은 일반적으로, 가이드 RNA(gRNA)와 상호작용할 수 있는 적어도 하나의 RNA 인식 또는 결합 도메인을 포함한다. Cas 단백질은 또한, 뉴클레아제 도메인(예를 들어, DNase 도메인 또는 RNase 도메인), DNA-결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 이량체화 도메인, 및 다른 도메인을 포함할 수 있다. 일부 이러한 도메인(예를 들어, DNase 도메인)은 네이티브(native) Cas 단백질로부터의 것일 수 있다. 다른 이러한 도메인이 첨가되어, 변형된 Cas 단백질을 만들 수 있다. 뉴클레아제 도메인은 핵산 절단에 대해 촉매 활성을 소유하며, 이는 핵산 분자의 공유 결합의 절단을 포함한다. 절단은 평활 단부(blund end) 또는 엇갈린 단부(staggered end)를 생성할 수 있으며, 이는 단일-가닥 또는 이중-가닥일 수 있다. 예를 들어, 야생형 Cas9 단백질은 전형적으로, 평활 절단 생성물을 생성할 것이다. 대안적으로, 야생형 Cpf1 단백질(예를 들어, FnCpf1)은 5-뉴클레오타이드 5' 오버행을 갖는 절단 생성물을 초래할 수 있으며, 상기 절단은 비-표적화된 가닥 상의 PAM 서열로부터 18번째 염기쌍 다음에, 그리고 표적화된 가닥 상의 23번째 염기 다음에 발생한다. Cas 단백질은 표적 게놈 좌위에서 이중-가닥 절단부(예를 들어, 평활 단부를 갖는 이중-가닥 절단부)를 생성하기 위해 완전 절단 활성을 가질 수 있거나, Cas 단백질은 표적 게놈 좌위에서 단일-가닥 절단부를 생성하는 닉카제일 수 있다.
Cas 단백질의 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e(CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9(Csn1 또는 Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1(CasA), Cse2(CasB), Cse3(CasE), Cse4(CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cu1966, 및 이의 상동체 또는 변형된 버전을 포함한다.
예시적인 Cas 단백질은 Cas9 단백질, 또는 Cas9 단백질로부터 유래된 단백질이다. Cas9 단백질은 II형 CRISPR/Cas 시스템으로부터 것이며, 전형적으로 보존된 구조를 갖는 4개의 주요 모티프를 공유한다. 모티프 1, 2, 및 4는 RuvC-유사 모티프이고, 모티프 3은 HNH 모티프이다. 예시적인 Cas9 단백질은 스트렙토콕커스 피오게네스(Streptococcus pyogenes), 스트렙토콕커스 써모필루스(Streptococcus thermophilus), 스트렙토콕커스 종(Streptococcus sp.), 스타필로콕커스 아우레우스(Staphylococcus aureus), 노카르디옵시스 다쏜빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티내스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스, 스트렙토스포란기움 로세움(Streptosporangium roseum), 스트렙토스포란기움 로세움, 알리사이클로바실루스 악시도칼다리우스(Alicyclobacillus acidocaldarius), 바실루스 슈도마이코이데스(Bacillus pseudomycoides), 바실루스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실루스 델브루엑키이(Lactobacillus delbrueckii), 락토바실루스 살리바리우스(Lactobacillus salivarius), 미크로스실라 마리나(Microscilla marina), 부르콜데리알레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 종(Polaromonas sp.), 크로코스패라 와트소니이(Crocosphaera watsonii), 시아노테세 종(Cyanothece sp.), 미크로사이스티스 애루기노사(Microcystis aeruginosa), 사이네코콕커스 종(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시룹토르 벡스치이(Caldicelulosiruptor becscii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라내로비우스 써모필루스(Natranaerobius thermophilus), 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum), 악시디티오바실루스 칼두스(Acidithiobacillus caldus), 악시디티오바실루스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 종(Marinobacter sp.), 니트로소콕커스 할로필루스(Nitrosococcus halophilus), 니트로소콕커스 와트소니(Nitrosococcus watsoni), 슈도알테로모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박터 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나배나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 종(Nostoc sp.), 아르쓰로스피라 막시마(Arthrospira maxima), 아르쓰로스피라 플라텐시스(Arthrospira platensis), 아르쓰로스피라 종(Arthrospira sp.), 라인그바이아 종(Lyngbya sp.), 미크로콜레우스 크쏘노플라스테스(Microcoleus chthonoplastes), 오스칠라토리아 종(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus), 아카라이오클로리스 마리나(Acaryochloris marina), 네이쎄리아 메닌지티디스(Neisseria meningitidis), 또는 캄필로박터 예유니(Campylobacter jejuni)로부터의 것이다. Cas9 패밀리 구성원의 추가 예는 국제공개 WO 2014/131833호에 기재되어 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 에스. 피오게네스(S. pyogenes)로부터의 Cas9(SpCas9)(지정된 SwissProt 수탁 번호 Q99ZW2)는 예시적인 Cas9 단백질이다. 에스. 아우레우스(S. aureus)로부터의 Cas9(SaCas9)(지정된 UniProt 수탁 번호 J7RUA5)는 또 다른 예시적인 Cas9 단백질이다. 캄필로박터 예유니로부터의 Cas9(CjCas9)(지정된 UniProt 수탁 번호 Q0P897)는 또 다른 예시적인 Cas9 단백질이다. 예를 들어, 문헌[Kim 등 (2017) Nat. Comm. 8:14500]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. SaCas9는 SpCas9보다 더 작고, CjCas9는 SaCas9와 SpCas9 둘 다보다 작다. 네이쎄리아 메닌지티디스(Neisseria meningitidis)로부터의 Cas9(Nme2Cas9)는 또 다른 예시적인 Cas9 단백질이다. 예를 들어, 문헌[Edraki 등 (2019) Mol. Cell 73(4):714-726]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 스트렙토콕커스 써모필루스로부터의 Cas9 단백질(예를 들어, CRISPR1 좌위에 의해 인코딩되는 스트렙토콕커스 써모필루스 LMD-9 Cas9(St1Cas9) 또는 CRISPR3 좌위로부터의 스트렙토콕커스 써모필루스 Cas9(St3Cas9))는 다른 예시적인 Cas9 단백질이다. 프란치셀라 보디치다로부터의 Cas9(FnCas9), 또는 대안적인 PAM(E1369R/E1449H/R1556A 치환)을 인식하는 RHA 프란치셀라 보디치다 Cas9 변이체는 다른 예시적인 Cas9 단백질이다. 이들 및 다른 예시적인 Cas9 단백질은 예를 들어, 문헌[Cebrian-Serrano 및 Davies (2017) Mamm. Genome 28(7):247-261]에서 검토되어 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 예시적인 Cas9 단백질 서열은 SEQ ID NO: 35를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다. Cas9 단백질을 인코딩하는 예시적인 DNA는 SEQ ID NO: 36을 포함하거나, 이로 본질적으로 구성되거나, 이로 구성될 수 있다.
Cas 단백질의 또 다른 예는 Cpf1(프레보텔라프란치셀라 1로부터의 CRISPR) 단백질이다. Cpf1은, Cas9의 특징적인 아르기닌-풍부 군집(cluster)에 대한 대응물(counterpart)과 함께 Cas9의 상응하는 도메인에 상동성인 RuvC-유사 뉴클레아제 도메인을 함유하는 큰 단백질(약 1300개 아미노산)이다. 그러나, Cpf1은, Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여되어 있고, RuvC-유사 도메인은, HNH 도메인을 포함하는 긴 삽입물(insert)을 함유하는 Cas9와 대조적으로 Cpf1 서열에서 인접해 있다. 예를 들어, 문헌[Zetsche 등 (2015) Cell 163(3):759-771]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 예시적인 Cpf1 단백질은 프란치셀라 툴라렌시스(Francisella tularensis) 1, 프란치셀라 툴라렌시스 아종 보디치다(Francisella tularensis subsp. novicida), 프레보텔라 알벤시스(Prevotella albensis), 라흐노스피라세애 박테리움(라흐노스피라세애 박테리움(Lachnospiraceae bacterium)) MC2017 1, 부타이리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium) GW2011_GWA2_33_10, 파르쿠박테리아 박테리움(Parcubacteria bacterium) GW2011_GWC2_44_17, 스미쎌라 종(Smithella sp.) SCADC, 악시다미노콕커스 종(Acidaminococcus sp.) BV3L6, 라흐노스피라세애 박테리움(Lachnospiraceae bacterium) MA2020, 칸디다투스 메타노플라스마 테르미툼(Candidatus Methanoplasma termitum), 유박테리움 엘리겐스(Eubacterium eligens), 모락셀라 보보쿨리(Moraxella bovoculi) 237, 렙토스피라 이나다이(Leptospira inadai), 라흐노스피라세애 박테리움(Lachnospiraceae bacterium) ND2006, 포르파이로모나스 크레비오리카니스(Porphyromonas crevioricanis) 3, 프레보텔라 디시엔스(Prevotella disiens), 및 포르파이로모나스 마카캐(Porphyromonas macacae)로부터의 것이다. 프란치셀라 보디치다 U112로부터의 Cpf1(FnCpf1; UniProt 수탁 번호 A0Q7Q2로 지정됨)은 예시적인 Cpf1 단백질이다.
Cas 단백질은 야생형 단백질(즉, 자연에서 발생하는 것), 변형된 Cas 단백질(즉, Cas 단백질 변이체), 또는 야생형 또는 변형된 Cas 단백질의 단편일 수 있다. Cas 단백질은 또한, 야생형 또는 변형된 Cas 단백질의 촉매적 활성에 관하여 활성(active) 변이체 또는 단편일 수 있다. 촉매적 활성에 관하여 활성 변이체 또는 단편은 야생형 또는 변형된 Cas 단백질 또는 이의 부분과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있으며, 상기 활성 변이체는 요망되는 절단 부위에서 절단하는 능력을 보유하므로, 닉-유도 또는 이중-가닥-절단부-유도 활성을 보유한다. 닉-유도 또는 이중-가닥-절단부-유도 활성에 대한 검정은 알려져 있고, 일반적으로 절단 부위를 함유하는 DNA 기질 상에서의 Cas 단백질의 전체 활성 및 특이성을 측정한다.
Cas 단백질은 핵산 결합 친화도, 핵산 결합 특이성, 및 효소적 활성 중 하나 이상을 증가시키거나 저하시키도록 변형될 수 있다. Cas 단백질은 또한, 단백질의 임의의 다른 활성 또는 특성, 예컨대 안정성을 변화시키도록 변형될 수 있다. 예를 들어, Cas 단백질의 하나 이상의 뉴클레아제 도메인은 변형, 결실 또는 불활성화될 수 있거나, Cas 단백질은 단백질의 기능에 본질적이지 않은 도메인을 제거하기 위해 또는 Cas 단백질의 활성 또는 특성을 최적화하기 위해(예를 들어, 증강시키거나 감소시키기 위해) 절두(truncate)될 수 있다.
변형된 Cas 단백질의 일례는 변형된 SpCas9-HF1 단백질이며, 이는 비-특이적 DNA 접촉을 감소시키도록 설계된 변경을 보유하는 스트렙토콕커스 피오게네스 Cas9의 고-충실도(high-fidelity) 변이체이다(N497A/R661A/Q695A/Q926A). 예를 들어, 문헌[Kleinstiver 등 (2016) Nature 529(7587):490-495]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 변형된 Cas 단백질의 또 다른 예는 표적-외(off-target) 효과를 감소시키도록 설계된 변형된 eSpCas9 변이체(K848A/K1003A/R1060A)이다. 예를 들어, 문헌[Slaymaker 등 (2016) Science 351(6268):84-88]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 다른 SpCas9 변이체는 K855A 및 K810A/K1003A/R1060A를 포함한다. 이들 및 다른 변형된 Cas 단백질은 예를 들어, 문헌[Cebrian-Serrano 및 Davies (2017) Mamm. Genome 28(7):247-261]에서 검토되어 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 변형된 Cas9 단백질의 또 다른 예는 xCas9이며, 이는 확장된 범위의 PAM 서열을 인식할 수 있는 SpCas9 변이체이다. 예를 들어, 문헌[Hu 등 (2018) Nature 556:57-63]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
Cas 단백질은 적어도 하나의 뉴클레아제 도메인, 예컨대 DNase 도메인을 포함할 수 있다. 예를 들어, 야생형 Cpf1 단백질은 일반적으로, 아마도 이량체 입체배치(configuration)에서 표적 DNA의 양쪽 가닥을 절단하는 RuvC-유사 도메인을 포함한다. Cas 단백질은 또한 적어도 2개의 뉴클레아제 도메인, 예컨대 DNase 도메인을 포함할 수 있다. 예를 들어, 야생형 Cas9 단백질은 일반적으로 RuvC-유사 뉴클레아제 도메인 및 HNH-유사 뉴클레아제 도메인을 포함한다. RuvC 도메인 및 HNH 도메인은 각각 이중-가닥 DNA의 상이한 가닥을 절단하여, DNA에서 이중-가닥 절단부를 만들 수 있다. 예를 들어, 문헌[Jinek 등 (2012) Science 337(6096):816-821]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
뉴클레아제 도메인 중 하나 이상 또는 모두는 결실되거나 돌연변이화될 수 있어서, 이들은 더 이상 기능적이지 않거나 감소된 뉴클레아제 활성을 갖는다. 예를 들어, 뉴클레아제 도메인 중 하나가 Cas9 단백질에서 결실되거나 돌연변이화된다면, 생성된 Cas9 단백질은 닉카제로 지칭될 수 있고, 이중-가닥 절단부가 아니라 이중-가닥 표적 DNA 내에서 단일-가닥 절단부를 생산할 수 있다(즉, 이는 상보적 가닥과 비-상보적 가닥 둘 다가 아니라 둘 중 하나를 절단할 수 있음). 뉴클레아제 도메인 둘 다 결실되거나 돌연변이화된다면, 생성된 Cas 단백질(예를 들어, Cas9)은 이중-가닥 DNA(예를 들어, 뉴클레아제-무효(null) 또는 뉴클레아제-불활성 Cas 단백질, 또는 촉매적으로 사멸된(dead) Cas 단백질(dCas))의 양쪽 가닥을 절단하는 감소된 능력을 가질 것이다. Cas9를 닉카제로 전환시키는 돌연변이의 일례는 에스. 피오게네스로부터의 Cas9의 RuvC 도메인 내의 D10A(Cas9의 위치 10에서 아스파르테이트로부터 알라닌으로의) 돌연변이이다. 마찬가지로, 에스. 피오게네스로부터의 Cas9의 HNH 도메인 내 H939A(아미노산 위치 839에서 히스티딘으로부터 알라닌으로), H840A(아미노산 위치 840에서 히스티딘으로부터 알라닌으로), 또는 N863A(아미노산 위치 N863에서 아스파라긴으로부터 알라닌으로)는 Cas9를 닉카제로 전환시킬 수 있다. Cas9를 닉카제로 전환시키는 돌연변이의 다른 예는 에스. 써모필루스(S. thermophilus)로부터의 Cas9에 대한 상응하는 돌연변이를 포함한다. 예를 들어, 문헌[Sapranauskas 등 (2011) Nucleic Acids Res. 39(21):9275-9282] 및 국제공개 WO 2013/141680호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 돌연변이는 부위-지향적(directed) 돌연변이유발(mutagenesis), PCR-매개 돌연변이유발, 또는 전체 유전자 합성과 같은 방법을 사용하여 발생될 수 있다. 닉카제를 생성하는 다른 돌연변이의 예는 예를 들어, 국제공개 WO 2013/176772호 및 WO 2013/142578호에서 찾을 수 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 모든 뉴클레아제가 Cas 단백질에서 결실되거나 돌연변이화된다면(예를 들어, 뉴클레아제 도메인 Cas9 단백질에서 둘 다 결실되거나 돌연변이화된다면), 생성된 Cas 단백질(예를 들어, Cas9)은 이중-가닥 DNA(예를 들어, 뉴클레아제-무효 또는 뉴클레아제-불활성 Cas 단백질)의 양쪽 가닥을 절단하는 감소된 능력을 가질 것이다. 하나의 구체적인 예는 D10A/H840A 에스. 피오게네스 Cas9 이중 돌연변이체 또는 에스. 피오게네스 Cas9와 최적으로 정렬될 때 또 다른 종으로부터의 Cas9 내의 상응하는 이중 돌연변이체이다. 또 다른 구체적인 예는 D10A/N863A 에스. 피오게네스 Cas9 이중 돌연변이체 또는 에스. 피오게네스 Cas9와 최적으로 정렬될 때 또 다른 종으로부터의 Cas9 내의 상응하는 이중 돌연변이체이다.
xCas9의 촉매적 도메인에서의 불활성화 돌연변이의 예는 SpCas9에 대해 상기 기재된 것과 동일하다. 스타필로콕커스 아우레우스 Cas9 단백질의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다. 예를 들어, 스타필로콕커스 아우레우스 Cas9 효소(SaCas9)는 위치 N580에서 치환(예를 들어, N580A 치환) 및 위치 D10에서 치환(예를 들어, D10A 치환)을 포함하여, 뉴클레아제-불활성 Cas 단백질을 생산할 수 있다. 예를 들어, 국제공개 WO 2016/106236호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Nme2Cas9의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다(예를 들어, D16A 및 H588A의 조합). St1Cas9의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다(예를 들어, D9A, D598A, H599A, 및 N622A의 조합). St3Cas9의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다(예를 들어, D10A 및 N870A의 조합). CjCas9의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다(예를 들어, D8A 및 H559A의 조합). FnCas9 및 RHA FnCas9의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다(예를 들어, N995A).
Cpf1 단백질의 촉매적 도메인에서의 불활성화 돌연변이의 예가 또한 알려져 있다. 프란치셀라 보디치다 U112(FnCpf1), 악시다미노콕커스 종 BV3L6(AsCpf1), 라흐노스피라세애 박테리움 ND2006(LbCpf1), 및 모락셀라 보보쿨리 237(MbCpf1 Cpf1)로부터의 Cpf1 단백질에 관하여, 이러한 돌연변이는 AsCpf1의 위치 908, 993, 또는 1263 또는 Cpf1 이종상동체 내 상응하는 위치, 또는 LbCpf1의 위치 832, 925, 947, 또는 1180 또는 Cpf1 이종상동체 내 상응하는 위치에서 돌연변이를 포함할 수 있다. 이러한 돌연변이는 예를 들어, AsCpf1의 돌연변이 D908A, E993A, 및 D1263A 또는 Cpf1 이종상동체 내 상응하는 돌연변이, 또는 LbCpf1의 D832A, E925A, D947A, 및 D1180A 또는 Cpf1 이종상동체 내 상응하는 돌연변이 중 하나 이상을 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0208243호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
Cas 단백질(예를 들어, 뉴클레아제-활성 Cas 단백질 또는 뉴클레아제-불활성 Cas 단백질)은 또한, 이종성 폴리펩타이드에 융합 단백질로서 작동적으로 연결될 수 있다. 예를 들어, Cas 단백질은 절단 도메인 또는 유전외적 변형 도메인에 융합될 수 있다. 국제공개 WO 2014/089290호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas 단백질은 이종성 폴리펩타이드에 융합되어, 증가된 또는 저하된 안정성을 제공할 수 있다. 융합된 도메인 또는 이종성 폴리펩타이드는 Cas 단백질 내의 N-말단, C-말단, 또는 내부적으로 위치할 수 있다.
일례로서, Cas 단백질은 하위세포 국재화를 제공하는 하나 이상의 이종성 폴리펩타이드에 융합될 수 있다. 이러한 이종성 폴리펩타이드는 예를 들어, 핵으로의 표적화를 위한 하나 이상의 핵 국재화 신호(NLS), 예컨대 단립(monopartite) SV40 NLS 및/또는 이분(bipartite) 알파-임포틴(importin) NLS, 미토콘드리아로의 표적화를 위한 미토콘드리아 위치화 신호, ER 체류 신호 등을 포함할 수 있다. 예를 들어, 문헌[Lange 등 (2007) J. Biol. Chem. 282(8):5101-5105]를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 하위세포 국재화 신호는 Cas 단백질 내의 N-말단, C-말단, 또는 어디에서나 위치할 수 있다. NLS는 염기성 아미노산의 스트레치를 포함할 수 있고, 단립 서열 또는 이분 서열일 수 있다. 선택적으로, Cas 단백질은 N-말단에서의 NLS(예를 들어, 알파-임포틴 NLS 또는 단립 NLS) 및 C-말단에서의 NLS(예를 들어, SV40 NLS 또는 이분 NLS)를 포함하여 2개 이상의 NLS를 포함할 수 있다. Cas 단백질은 또한, N-말단에 2개 이상의 NLS 및/또는 C-말단에 2개 이상의 NLS를 포함할 수 있다.
Cas 단백질은 또한, 세포-투과 도메인 또는 단백질 형질도입 도메인에 작동적으로 연결될 수 있다. 예를 들어, 세포-투과 도메인은 HIV-1 TAT 단백질, 인간 B형 간염 바이러스로부터의 TLM 세포-투과 모티프, MPG, Pep-1, VP22, 단순 포진 바이러스로부터의 세포 투과 펩타이드, 또는 폴리아르기닌 펩타이드 신호로부터 유래될 수 있다. 예를 들어, 국제공개 WO 2014/089290호 및 WO 2013/176772호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 세포-투과 도메인은 Cas 단백질 내의 N-말단, C-말단, 또는 어디에서나 위치할 수 있다.
Cas 단백질은 또한, 추적(tracking) 또는 정제의 용이성을 위해 이종성 폴리펩타이드, 예컨대 형광 단백질, 정제 태그, 또는 에피토프 태그에 작동적으로 연결될 수 있다. 형광 단백질의 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, tagGFP, turboGFP, eGFP, 에메랄드, 아자미 그린, 단량체성 아자미 그린, CopGFP, AceGFP, ZsGreenl), 황색 형광 단백질(예를 들어, YFP, eYFP, 시트린, 비너스, YPet, PhiYFP, ZsYellowl), 청색 형광 단백질(예를 들어, eBFP, eBFP2, 아주라이트, mKalamal, GFPuv, 사파이어, T-사파이어), 시안색 형광 단백질(예를 들어, eCFP, 세룰린, CyPet, AmCyanl, 미도리이시-시안색), 적색 형광 단백질(예를 들어, mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-단량체, HcRed-탠덤, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), 주황색 형광 단백질(예를 들어, mOrange, mKO, 쿠사비라-오렌지, 단량체성 쿠사비라-오렌지, mTangerine, tdTomato), 및 임의의 다른 적합한 형광 단백질을 포함한다. 태그의 예는 글루타티온-S-트랜스퍼라제(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질, 티오레독신(TRX), 폴리(NANP), 탠덤 친화도 정제(TAP: tandem affinity purification) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, 헤마글루티닌(HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 히스티딘(His), 비오틴 카르복실 담체 단백질(BCCP), 및 칼모듈린(calmodulin)을 포함한다.
Cas 단백질은 또한, 외인성 공여자 핵산 또는 표지된 핵산에 테터링(tether)될 수 있다. 이러한 테터링(즉, 물리적 연결)은 공유 상호작용 또는 비공유 상호작용을 통해 달성될 수 있으며, 테터링은 직접적일 수 있거나(예를 들어, 단백질 상의 시스테인 또는 라이신 잔기의 변형 또는 인테인(intein) 변형에 의해 달성될 수 있는 직접적 융합 또는 화학적 접합을 통해), 하나 이상의 개입 링커 또는 어댑터 분자, 예컨대 스트렙타비딘 또는 앱타머를 통해 달성될 수 있다. 예를 들어, 문헌[Pierce 등 (2005) Mini Rev. Med. Chem. 5(1):41-55]; 문헌[Duckworth 등 (2007) Angew. Chem. Int. Ed. Engl. 46(46):8819-8822]; 문헌[Schaeffer 및 Dixon (2009) Australian J. Chem. 62(10):1328-1332]; 문헌[Goodman 등 (2009) Chembiochem. 10(9):1551-1557]; 및 문헌[Khatwani 등 (2012) Bioorg. Med. Chem. 20(14):4532-4539]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 단백질-핵산 접합체를 합성하기 위한 비공유 전략은 비오틴-스트렙타비딘 및 니켈-히스티딘 방법을 포함한다. 공유 단백질-핵산 접합체는, 적절하게 작용화된 핵산 및 단백질을 광범위하게 다양한 화학을 사용하여 연결함으로써 합성될 수 있다. 이들 화학 중 일부는 단백질 표면 상의 아미노산 잔기(예를 들어, 라이신 아민 또는 시스테인 티올)에의 올리고뉴클레오타이드의 직접적 부착을 수반하는 한편, 다른 더욱 복잡한 계획은 단백질의 번역-후 변형 또는 촉매적 또는 반응성 단백질 도메인의 수반을 필요로 한다. 핵산에의 단백질의 공유 부착 방법은 예를 들어, 단백질 라이신 또는 시스테인 잔기에의 올리고뉴클레오타이드의 화학적 가교, 발현된 단백질-리게이션, 화학효소적 방법, 및 포토앱타머(photoaptamer)의 사용을 포함할 수 있다. 외인성 공여자 핵산 또는 표지된 핵산은 Cas 단백질 내의 C-말단, N-말단에, 또는 내부 영역에 테터링될 수 있다. 일례에서, 외인성 공여자 핵산 또는 표지된 핵산은 Cas 단백질의 C-말단 또는 N-말단에 테터링된다. 마찬가지로, Cas 단백질은 외인성 공여자 핵산 또는 표지된 핵산 내의 5' 단부, 3' 단부에, 또는 내부 영역에 테터링될 수 있다. 다시 말해, 외인성 공여자 핵산 또는 표지된 핵산은 임의의 배향 및 극성으로 테터링될 수 있다. 예를 들어, Cas 단백질은 외인성 공여자 핵산 또는 표지된 핵산 내의 5' 단부 또는 3' 단부에 테터링될 수 있다.
Cas 단백질은 임의의 형태로 제공될 수 있다. 예를 들어, Cas 단백질은 단백질, 예컨대 gRNA와 복합체화된 Cas 단백질의 형태로 제공될 수 있다. 대안적으로, Cas 단백질은 Cas 단백질을 인코딩하는 핵산, 예컨대 RNA(예를 들어, 메신저 RNA(mRNA)) 또는 DNA의 형태로 제공될 수 있다. 선택적으로, Cas 단백질을 인코딩하는 핵산은 특정 세포 또는 유기체에서 단백질로의 효율적인 번역을 위해 코돈 최적화될 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 박테리아 세포, 효모 세포, 인간 세포, 비-인간 세포, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 또는 임의의 다른 관심 숙주 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. Cas 단백질을 인코딩하는 핵산이 세포 내로 도입될 때, 상기 Cas 단백질은 세포에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다.
mRNA로서 제공된 Cas 단백질은 향상된 안정성 및/또는 면역원성 특성을 위해 변형될 수 있다. 변형은 mRNA 내의 하나 이상의 뉴클레오사이드에 이루어질 수 있다. mRNA 핵염기(nucleobase)에 대한 화학적 변형의 예는 슈도우리딘, 1-메틸-슈도우리딘, 및 5-메틸-시티딘을 포함한다. 예를 들어, N1-메틸 슈도우리딘을 함유하는 캡핑(capped)되고 폴리아데닐화된 Cas mRNA가 사용될 수 있다. 마찬가지로, Cas mRNA는 동의 코돈을 사용한 우리딘의 결핍에 의해 변형될 수 있다.
Cas 단백질을 인코딩하는 핵산은 세포의 게놈에 안정하게 통합되고 상기 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 대안적으로, Cas 단백질을 인코딩하는 핵산은 발현 작제물에서 프로모터에 작동적으로 연결될 수 있다. 발현 작제물은 관심 유전자 또는 다른 핵산 서열(예를 들어, Cas 유전자)의 발현을 지시할 수 있는 임의의 핵산 작제물을 포함하고, 이는 이러한 관심 핵산 서열을 표적 세포로 이전시킬 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 핵산 삽입물을 포함하는 표적화 벡터 및/또는 gRNA를 인코딩하는 DNA를 포함하는 벡터에 존재할 수 있다. 대안적으로, 이는, 핵산 삽입물을 포함하는 표적화 벡터로부터 별개이고/이거나 gRNA를 인코딩하는 DNA를 포함하는 벡터로부터 별개이다. 발현 작제물에 사용될 수 있는 프로모터는 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유류 세포, 비-인간 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 토끼 세포, 만능성 세포, 배아 줄기(ES) 세포, 또는 접합체 중 하나 이상에서 활성인 프로모터를 포함한다. 이러한 프로모터는 예를 들어, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 선택적으로, 프로모터는 하나의 방향에서 Cas 단백질과 다른 방향에서 가이드 RNA 둘 다의 발현을 구동하는 양방향적(bidirectional) 프로모터일 수 있다. 이러한 양방향적 프로모터는 (1) 3개의 외부 제어 요소를 함유하는 완전한 종래의 일방향적 Pol III 프로모터: 원위부 서열 요소(DSE), 근위부 서열 요소(PSE), 및 TATA 박스; 및 (2) 역배향에서 DSE의 5' 말단에 융합된 TATA 박스 및 PSE를 포함하는 제2 기본(basic) Pol III 프로모터로 구성될 수 있다. 예를 들어, H1 프로모터에서, DSE는 PSE 및 TATA 박스에 인접하고, 프로모터는, U6 프로모터로부터 유래된 TATA 박스 및 PSE를 부착함으로써 역방향에서의 전사가 제어되는 하이브리드 프로모터를 생성함으로써 양방향적으로 될 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0074535호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas 단백질을 인코딩하는 유전자 및 가이드 RNA를 발현하기 위한 양방향적 프로모터의 사용은 동시에, 전달을 용이하게 하기 위해 컴팩트(compact) 발현 카세트의 생산을 가능하게 한다.
가이드 RNA. "가이드 RNA" 또는 "gRNA"는, Cas 단백질(예를 들어, Cas9 단백질)에 결합하고 상기 Cas 단백질을 표적 DNA 내의 특정 위치로 표적화하는 RNA 분자이다. 가이드 RNA는 2개의 분절을 포함할 수 있다: "DNA-표적화 분절" 및 "단백질-결합 분절". "분절"은 분자의 구획 또는 영역, 예컨대 RNA 내 뉴클레오타이드의 인접 스트레치를 포함한다. 일부 gRNA, 예컨대 Cas9에 대한 gRNA는 2개의 별개의 RNA 분자를 포함할 수 있다: "활성자-RNA"(예를 들어, tracrRNA) 및 "표적자(targeter)-RNA"(예를 들어, CRISPR RNA 또는 crRNA). 다른 gRNA는 단일 RNA 분자(단일 RNA 폴리뉴클레오타이드)이며, 이는 또한 "단일-분자 gRNA", "단일-가이드 RNA", 또는 "sgRNA"라고도 할 수 있다. 예를 들어, 국제공개 WO 2013/176772호, WO 2014/065596호, WO 2014/089290호, WO 2014/093622호, WO 2014/099750호, WO 2013/142578호, 및 WO 2014/131833호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. Cas9의 경우, 예를 들어, 단일-가이드 RNA는 tracrRNA에(예를 들어, 링커를 통해) 융합된 crRNA를 포함할 수 있다. Cpf1의 경우, 예를 들어, 표적 서열에의 결합 및/또는 이의 절단을 달성하기 위해 단지 crRNA가 필요하다. 용어 "가이드 RNA" 및 "gRNA"는 이중-분자(즉, 모듈형(modular)) gRNA와 단일-분자 gRNA 둘 다 포함한다.
예시적인 2-분자 gRNA는 crRNA-유사("CRISPR RNA" 또는 "표적자-RNA" 또는 "crRNA" 또는 "crRNA 반복부") 분자 및 상응하는 tracrRNA-유사("trans-작용 CRISPR RNA" 또는 "활성자-RNA" 또는 "tracrRNA") 분자를 포함한다. crRNA는 gRNA의 DNA-표적화 분절(단일-가닥) 및 gRNA의 단백질-결합 분절의 dsRNA 듀플렉스 중 하나의 절반을 형성하는 뉴클레오타이드(즉, crRNA 테일)의 스트레치 둘 다 포함한다. DNA-표적화 분절의 다운스트림(3')에 위치한 crRNA 테일의 일례는 GUUUUAGAGCUAUGCU(SEQ ID NO: 37)를 포함하거나, 본질적으로 이로 구성되거나, 이로 구성된다. 본원에 개시된 임의의 DNA-표적화 분절은 SEQ ID NO: 37의 5' 단부에 접합되어, crRNA를 형성할 수 있다.
상응하는 tracrRNA(활성자-RNA)는, gRNA의 단백질-결합 분절의 dsRNA 듀플렉스 중 다른 절반을 형성하는 뉴클레오타이드의 스트레치를 포함한다. crRNA의 뉴클레오타이드의 스트레치는 tracrRNA의 뉴클레오타이드의 스트레치에 상보적이고 이와 혼성화하여, gRNA의 단백질-결합 도메인의 dsRNA 듀플렉스를 형성한다. 이와 같이, 각각의 crRNA는 상응하는 tracrRNA를 갖고 있다고 할 수 있다. tracrRNA 서열의 일례는 AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO: 38)를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. tracrRNA 서열의 다른 예는 AAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO: 80), 또는 GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO: 81)를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다.
crRNA와 tracrRNA 둘 다 필요한 시스템에서, crRNA 및 상응하는 tracrRNA는 혼성화하여 gRNA를 형성한다. crRNA만 필요한 시스템에서, crRNA는 gRNA일 수 있다. crRNA는, 표적 DNA의 상보적 가닥에 혼성화하는 단일-가닥 DNA-표적화 분절을 추가로 제공한다. 세포 내에서의 변형에 사용된다면, 주어진 crRNA 또는 tracrRNA 분자의 정확한 서열은, RNA 분자가 사용될 종에 특이적이도록 설계될 수 있다. 예를 들어, 문헌[Mali 등 (2013) Science 339(6121):823-826]; 문헌[Jinek 등 (2012) Science 337(6096):816-821]; 문헌[Hwang 등 (2013) Nat. Biotechnol. 31(3):227-229]; 문헌[Jiang 등 (2013) Nat. Biotechnol. 31(3):233-239]; 및 문헌[Cong 등 (2013) Science 339(6121):819-823]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
주어진 gRNA의 DNA-표적화 분절(crRNA)은, 하기에서 더욱 상세히 기재된 바와 같이 표적 DNA의 상보적 가닥 상의 서열에 상보적인 뉴클레오타이드 서열을 포함한다. gRNA의 DNA-표적화 분절은 혼성화(즉, 염기쌍 형성(base pairing))을 통해 서열-특이적 방식으로 표적 DNA와 상호작용한다. 이와 같이, DNA-표적화 분절의 뉴클레오타이드 서열은 다양할 수 있고, gRNA 및 표적 DNA가 상호작용할 상기 표적 DNA 내에서의 위치를 결정한다. 대상체 gRNA의 DNA-표적화 분절은 표적 DNA 내의 임의의 요망되는 서열에 혼성화하도록 변형될 수 있다. 천연 발생 crRNA는 CRISPR/Cas 시스템 및 유기체에 따라 상이하지만, 종종 21 내지 46개 뉴클레오타이드 길이의 2개의 직접 반복부(DR: direct repeat)에 플랭킹되는 21 내지 72개 뉴클레오타이드 길이의 표적화 분절을 함유한다(예를 들어, 국제공개 WO 2014/131833호를 참조하며, 이는 그 전체가 모든 목적을 위해 참조로서 본원에 포함됨). 에스. 피오게네스의 경우, DR은 36개 뉴클레오타이드 길이이고, 표적화 분절은 30개 뉴클레오타이드 길이이다. 3' 위치한 DR은 상응하는 tracrRNA에 상보적이고 이와 혼성화하며, 이는 다시 Cas 단백질에 결합한다.
DNA-표적화 분절은 예를 들어, 적어도 약 12, 15, 17, 18, 19, 20, 25, 30, 35, 또는 40개 뉴클레오타이드 길이를 가질 수 있다. 이러한 DNA-표적화 분절은 예를 들어, 약 12 내지 약 100개, 약 12 내지 약 80개, 약 12 내지 약 50개, 약 12 내지 약 40개, 약 12 내지 약 30개, 약 12 내지 약 25개, 약 12 내지 약 20개 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, DNA 표적화 분절은 약 15 내지 약 25개 뉴클레오타이드(예를 들어, 약 17 내지 약 20개 뉴클레오타이드, 또는 약 17, 18, 19, 또는 20개 뉴클레오타이드)일 수 있다. 예를 들어, 2016/0024523을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 에스. 피오게네스로부터의 Cas9의 경우, 전형적인 DNA-표적화 분절은 16 내지 20개 뉴클레오타이드 길이 또는 17 내지 20개 뉴클레오타이드 길이이다. 에스. 아우레우스로부터의 Cas9의 경우, 전형적인 DNA-표적화 분절은 21 내지 23개 뉴클레오타이드 길이이다. Cpf1의 경우, 전형적인 DNA-표적화 분절은 적어도 16개 뉴클레오타이드 길이 또는 적어도 18개 뉴클레오타이드 길이이다.
TracrRNA는 임의의 형태(예를 들어, 전장 tracrRNA 또는 활성 부분 tracrRNA) 및 다양한 길이일 수 있다. 이들은 1차 전사물 또는 가공된 형태를 포함할 수 있다. 예를 들어, tracrRNA(단일-가이드 RNA의 파트로서, 또는 2-분자 gRNA의 파트와 별개의 분자로서)는 야생형 tracrRNA 서열 중 모두 또는 부분(예를 들어, 야생형 tracrRNA 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85개 이상 또는 약 이를 초과하는 뉴클레오타이드)을 포함하거나, 본질적으로 이로 구성되거나, 이로 구성될 수 있다. 에스. 피오게네스로부터의 야생형 tracrRNA 서열은 171-뉴클레오타이드, 89-뉴클레오타이드, 75-뉴클레오타이드, 및 65-뉴클레오타이드 버전을 포함한다. 예를 들어, 문헌[Deltcheva 등 (2011) Nature 471(7340):602-607]; 국제공개 WO 2014/093661호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 단일-가이드 RNA(sgRNA) 내의 tracrRNA의 예는 sgRNA의 +48, +54, +67, 및 +85 버전 내에서 발견되는 tracrRNA 분절을 포함하며, 여기서, "+n"은 야생형 tracrRNA의 +n개 이하의 뉴클레오타이드가 sgRNA에 포함됨을 나타낸다. 미국 특허 제8,697,359호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
가이드 RNA의 DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 적어도 60%(예를 들어, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)일 수 있다. DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 약 20개 인접 뉴클레오타이드에 걸쳐 적어도 60%일 수 있다. 일례로, DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 표적 DNA의 상보적 가닥의 5' 단부에서의 약 14개 인접 뉴클레오타이드에 걸쳐 적어도 100%일 수 있고 나머지에 걸쳐 0%만큼 낮을 수 있다. 이러한 경우, DNA-표적화 분절은 14개 뉴클레오타이드 길이인 것으로 여겨질 수 있다. 또 다른 예로, DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 상보성 백분율은 표적 DNA의 상보적 가닥의 5' 단부에서의 7개 인접 뉴클레오타이드에 걸쳐 적어도 100%일 수 있고 나머지에 걸쳐 0%만큼 낮을 수 있다. 이러한 경우, DNA-표적화 분절은 7개 뉴클레오타이드 길이인 것으로 여겨질 수 있다. 일부 가이드 RNA에서, DNA-표적화 분절 내의 적어도 17개 뉴클레오타이드는 표적 DNA의 상보적 가닥에 상보적이다. 예를 들어, DNA-표적화 분절은 20개 뉴클레오타이드 길이일 수 있고, 표적 DNA의 상보적 가닥과 1, 2 또는 3개의 미스매치를 포함할 수 있다. 일례에서, 미스매치는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 서열에 상응하는 상보적 가닥의 영역에 인접해 있지 않다(즉, PAM 서열의 역보체(reverse complement))(예를 들어, 미스매치는 가이드 RNA의 DNA-표적화 분절의 5' 단부에 있거나, 미스매치는 PAM 서열에 상응하는 상보적 가닥의 영역으로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 염기쌍만큼 떨어져 있음).
gRNA의 단백질-결합 분절은, 서로 상보적인 뉴클레오타이드의 2개 스트레치(stretch)를 포함할 수 있다. 단백질-결합 분절의 상보적 뉴클레오타이드는 혼성화하여, 이중-가닥 RNA 듀플렉스(dsRNA)를 형성한다. 대상체 gRNA의 단백질-결합 분절은 Cas 단백질과 상호작용하고, gRNA는 결합된 Cas 단백질을, DNA-표적화 분절을 통해 표적 DNA 내의 특정 뉴클레오타이드 서열로 안내한다.
단일-가이드 RNA는 스캐폴드 서열(즉, 가이드 RNA의 단백질-결합 또는 Cas-결합 서열)에 접합된 DNA-표적화 분절을 포함할 수 있다. 예를 들어, 이러한 가이드 RNA는 5' DNA-표적화 분절 및 3' 스캐폴드 서열을 가질 수 있다. 예시적인 스캐폴드 서열은: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(버전 1; SEQ ID NO: 39); GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(버전 2; SEQ ID NO: 40); GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(버전 3; SEQ ID NO: 41); 및 GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(버전 4; SEQ ID NO: 42)를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 다른 예시적인 스캐폴드 서열은: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(버전 5; SEQ ID NO: 82); GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(버전 6; SEQ ID NO: 83); 또는 GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(버전 7; SEQ ID NO: 84)를 포함하거나, 이로 본질적으로 구성되거나, 이로 구성된다. 임의의 가이드 RNA 표적 서열을 표적화하는 가이드 RNA는 예를 들어, 가이드 RNA의 3' 단부 상의 임의의 예시적인 가이드 RNA 스캐폴드 서열에 융합된 가이드 RNA의 5' 단부 상에 DNA-표적화 분절을 포함할 수 있다. 즉, 본원에 개시된 임의의 DNA-표적화 분절은 임의의 하나의 SEQ ID NO: 39-42의 5' 단부에 접합되어, 단일 가이드 RNA(키메라 가이드 RNA)를 형성할 수 있다. 본원 어디에서나 개시된 바와 같은 가이드 RNA 버전 1, 2, 3, 및 4는 스캐폴드 버전 1, 2, 3, 및 4 각각과 접합된 DNA-표적화 분절(즉, 가이드 서열 또는 가이드)을 지칭한다. 마찬가지로, 본원에 개시된 임의의 DNA-표적화 분절은 임의의 하나의 SEQ ID NO: 82-84의 5' 단부에 접합되어, 단일 가이드 RNA(키메라 가이드 RNA)를 형성할 수 있다. 본원 어디에서나 개시된 바와 같은 가이드 RNA 버전 5, 6, 및 7은 스캐폴드 버전 5, 6, 및 7 각각과 접합된 DNA-표적화 분절(즉, 가이드 서열 또는 가이드)을 지칭한다.
가이드 RNA는 추가의 바람직한 특질(예를 들어, 변형된 또는 조절된 안정성; 하위세포 표적화; 형광 표지에 의한 추적; 단백질 또는 단백질 복합체에 대한 결합 부위 등)을 제공하는 변형 또는 서열을 포함할 수 있다. 이러한 변형의 예는 예를 들어, 5' 캡(cap)(예를 들어, 7-메틸구아닐레이트 캡(m7G)); 3' 폴리아데닐화된 테일(즉, 3' 폴리(A) 테일); 리보스위치(riboswitch) 서열(예를 들어, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 가능하게 하기 위해); 안정성 제어 서열; dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열; RNA를 하위세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 서열; 추적을 제공하는 변형 또는 서열(예를 들어, 형광 분자에의 직접 접합, 형광 검출을 용이하게 하는 모이어티에의 접합, 형광 검출을 가능하게 하는 서열 등); 단백질(예를 들어, DNA 메틸트랜스퍼라제, DNA 데메틸라제(demethylase), 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함하여 DNA 상에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 및 이들의 조합을 포함한다. 변형의 다른 예는 조작된 스템 루프 듀플렉스 구조, 조작된 벌지(bulge) 영역, 스템 루프 듀플렉스 구조의 조작된 헤어핀 3', 또는 이들의 임의의 조합을 포함한다. 예를 들어, 미국 특허출원공개 US 2015/0376586호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 벌지는 crRNA-유사 영역 및 최소 tracrRNA-유사 영역으로 이루어진 듀플렉스 내의 뉴클레오타이드의 홑(unpaired) 영역일 수 있다. 벌지는, 듀플렉스의 하나의 면(side) 상에, X가 임의의 퓨린이고 Y가 반대 가닥 상의 뉴클레오타이드와 워블 쌍(wobble pair)을 형성할 수 있는 뉴클레오타이드일 수 있는 홑 5'-XXXY-3', 및 듀플렉스의 다른 면 상에 홑 뉴클레오타이드 영역을 포함할 수 있다.
비변형된 핵산은 분해에 취약할 수 있다. 외인성 핵산은 또한 선천적 면역 반응을 유도할 수 있다. 변형은 안정성을 도입하고 면역원성을 감소시키는 것을 도울 수 있다. 가이드 RNA는 예를 들어, 하기 중 하나 이상을 포함한, 변형된 뉴클레오사이드 및 변형된 뉴클레오타이드를 포함할 수 있다: (1) 포스포디에스테르 백본 연결부에서 비-연결 포스페이트 산소 중 하나 또는 둘 다 및/또는 연결 포스페이트 산소 중 하나 이상의 변경 또는 대체; (2) 리보스 당(sugar)의 구성원의 변경 또는 대체, 예컨대 리보스 당 상의 2' 하이드록실의 변경 또는 대체; (3) 데포스포(dephospho) 링커에 의한 포스페이트 모이어티의 대체; (4) 천연 발생 핵염기의 변형 또는 대체; (5) 리보스-포스페이트 백본의 대체 또는 변형; (6) 올리고뉴클레오타이드의 3' 단부 또는 5' 단부의 변형(예를 들어, 말단 포스페이트기의 제거, 변형 또는 대체 또는 모이어티의 접합); 및 (7) 당의 변형. 다른 가능한 가이드 RNA 변형은 우라실 또는 폴리-우라실 트랙트(tract)의 변형 또는 대체를 포함한다. 예를 들어, 국제공개 WO 2015/048577호 및 미국 특허출원공개 US 2016/0237455호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 유사한 변형은 Cas-인코딩 핵산, 예컨대 Cas mRNA에 대해 이루어질 수 있다. 예를 들어, Cas mRNA는 동의 코돈을 사용한 우리딘의 결핍에 의해 변형될 수 있다.
일례로서, 가이드 RNA의 5' 또는 3' 단부에서의 뉴클레오타이드는 포스포로티오에이트 연결부를 포함할 수 있다(예를 들어, 염기는, 포스포로티오에이트기인 변형된 포스페이트기를 가질 수 있음). 예를 들어, 가이드 RNA는 가이드 RNA의 5' 및/또는 3' 단부의 2, 3, 또는 4개 말단 뉴클레오타이드 사이에 포스포로티오에이트 연결부를 포함할 수 있다. 또 다른 예로, 가이드 RNA의 5' 및/또는 3' 단부에서의 뉴클레오타이드는 2'-O-메틸 변형을 가질 수 있다. 예를 들어, 가이드 RNA는 가이드 RNA의 5' 및/또는 3' 단부(예를 들어, 5' 단부)의 2, 3, 또는 4개 말단 뉴클레오타이드에서 2'-O-메틸 변형을 포함할 수 있다. 예를 들어, 국제공개 WO 2017/173054 A1호 및 문헌[Finn 등 (2018) Cell Rep. 22(9):2227-2235]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 하나의 구체적인 예에서, 가이드 RNA는 처음 3개 5' 및 3' 말단 RNA 잔기에 2'-O-메틸 유사체 및 3' 포스포로티오에이트 뉴클레오타이드간 연결부를 포함한다. 또 다른 구체적인 예에서, 가이드 RNA는, Cas9 단백질과 상호작용하지 않는 모든 2'OH 기가 2'-O-메틸 유사체로 대체되도록 변형되며, Cas9와의 최소 상호작용을 갖는 가이드 RNA의 테일(tail) 영역은 5' 및 3' 포스포로티오에이트 뉴클레오타이드간 연결부로 변형된다. 예를 들어, 문헌[Yin 등 (2017) Nat. Biotech. 35(12):1179-1187]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 변형된 가이드 RNA의 다른 예는 예를 들어, WO 2018/107028 A1호에 제공되어 있으며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 화학적 변형은 예를 들어, 엑소뉴클레아제로부터 가이드 RNA에 대한 더 큰 안정성 및 보호를 제공하여, 이들이 비변형된 가이드 RNA보다 더 오랫동안 세포 내에서 지속되게 할 수 있다. 이러한 화학적 변형은 또한 예를 들어, RNA를 적극적으로(actively) 분해할 수 있는 선천적 세포내 면역 반응으로부터 보호하거나, 세포 사멸을 유발하는 면역 캐스케이드를 촉발할 수 있다.
가이드 RNA는 임의의 형태로 제공될 수 있다. 예를 들어, gRNA는 2개의 분자(별개의 crRNA 및 tracrRNA)로서 또는 1개의 분자(sgRNA)로서 RNA의 형태로, 그리고 선택적으로 Cas 단백질과의 복합체의 형태로 제공될 수 있다. gRNA는 또한, 상기 gRNA를 인코딩하는 DNA의 형태로 제공될 수 있다. gRNA를 인코딩하는 DNA는 단일 RNA 분자(sgRNA) 또는 별개의 RNA 분자(예를 들어, 별개의 crRNA 및 tracrRNA)를 인코딩할 수 있다. 후자의 경우, gRNA를 인코딩하는 DNA는 1개의 DNA 분자로서 또는 crRNA 및 tracrRNA를 각각 인코딩하는 별개의 DNA 분자로서 제공될 수 있다.
gRNA가 DNA 형태로 제공될 때, 상기 gRNA는 세포에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다. gRNA를 인코딩하는 DNA는 세포의 게놈 내로 안정하게 통합되고 상기 세포에서 활성인 프로모터에 작동적으로 연결될 수 있다. 대안적으로, gRNA를 인코딩하는 DNA는 발현 작제물에서 프로모터에 작동적으로 연결될 수 있다. 예를 들어, gRNA를 인코딩하는 DNA는 이종성 핵산, 예컨대 Cas 단백질을 인코딩하는 핵산을 포함하는 벡터에 존재할 수 있다. 대안적으로, 이는, Cas 단백질을 인코딩하는 핵산을 포함하는 벡터로부터 별개인 벡터 또는 플라스미드에 존재할 수 있다. 이러한 발현 작제물에 사용될 수 있는 프로모터는 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유류 세포, 비-인간 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 토끼 세포, 만능성 세포, 배아 줄기(ES) 세포, 성인 줄기세포, 발달 제약 전구 세포, 유도 만능 줄기(iPS) 세포, 또는 1-세포 단계 배아 중 하나 이상에서 활성인 프로모터를 포함한다. 이러한 프로모터는 예를 들어, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 이러한 프로모터는 또한 예를 들어, 양방향적 프로모터일 수 있다. 적합한 프로모터의 구체적인 예는 RNA 폴리머라제 III 프로모터, 예컨대 인간 U6 프로모터, 래트 U6 폴리머라제 III 프로모터, 또는 마우스 U6 폴리머라제 III 프로모터를 포함한다.
대안적으로, gRNA는 다양한 다른 방법에 의해 제조될 수 있다. 예를 들어, gRNA는 예를 들어, T7 RNA 폴리머라제를 사용하여 시험관내 전사에 의해 제조될 수 있다(예를 들어, 국제공개 WO 2014/089290호 및 WO 2014/065596호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다). 가이드 RNA는 또한, 화학적 합성에 의해 제조된 합성적으로 생성된 분자일 수 있다. 예를 들어, 가이드 RNA는 처음 3개 5' 및 3' 말단 RNA 잔기에 2'-O-메틸 유사체 및 3' 포스포로티오에이트 뉴클레오타이드간 연결부를 포함하도록 화학적으로 합성될 수 있다.
가이드 RNA(또는 가이드 RNA를 인코딩하는 핵산)는 하나 이상의 가이드 RNA(예를 들어, 1, 2, 3, 4개 이상의 가이드 RNA) 및 상기 가이드 RNA의 안정성을 증가시키는(예를 들어, 주어진 저장 조건(예를 들어, -20℃, 4℃ 또는 주위 온도) 하에서 분해 생성물이 역치 미만에, 예컨대 출발 핵산 또는 단백질의 0.5 중량% 미만에서 유지되는 기간을 연장시키거나; 생체내에서의 안정성을 증가시키는) 담체를 포함하는 조성물에 존재할 수 있다. 이러한 담체의 비제한적인 예는 폴리(락트산)(PLA) 미소구체(microsphere), 폴리(D,L-락틱(lactic)-코글리콜(coglycolic)-산)(PLGA) 미소구체, 리포솜, 미쉘(micelle), 인버스 미쉘(inverse micelle), 지질 코킬레에이트(cochleate), 및 지질 미세소관을 포함한다. 이러한 조성물은 Cas 단백질, 예컨대 Cas9 단백질, 또는 Cas 단백질을 인코딩하는 핵산을 추가로 포함할 수 있다.
가이드 RNA 표적 서열. 가이드 RNA에 대한 표적 DNA는, 결합에 대해 충분한 조건이 존재한다면 gRNA의 DNA-표적화 분절이 결합할 DNA에 존재하는 핵산 서열을 포함한다. 적합한 DNA/RNA 결합 조건은 세포에 정상적으로 존재하는 생리학적 조건을 포함한다. 다른 적합한 DNA/RNA 결합 조건(예를 들어, 세포-무함유 시스템에서의 조건)은 당업계에 알려져 있다(예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook 등, Harbor Laboratory Press 2001)]을 참조하며, 이는 그 전체가 모든 목적을 위해 참조로서 본원에 포함됨). gRNA에 상보적이고 이와 혼성화하는 표적 DNA의 가닥은 "상보적 가닥"이라고 할 수 있으며, "상보적 가닥"에 상보적인(따라서 Cas 단백질 또는 gRNA에 상보적이지 않은) 표적 DNA의 가닥은 "비상보적 가닥" 또는 "주형 가닥"이라고 할 수 있다.
표적 DNA는, 가이드 RNA가 혼성화하는 상보적 가닥 상의 서열과, 비-상보적 가닥 상의 상응하는 서열(예를 들어, 프로토스페이서 인접 모티프(PAM)에 인접함) 둘 다 포함한다. 본원에 사용된 바와 같이 용어 "가이드 RNA 표적 서열"은 구체적으로, 가이드 RNA가 상보적 가닥 상에서 혼성화하는 서열에 상응하는 비-상보적 가닥 상의 서열(즉, 이의 역보체)을 지칭한다. 다시 말해, 가이드 RNA 표적 서열은 PAM에 인접한 비-상보적 가닥 상의 서열을 지칭한다(예를 들어, Cas9의 경우 PAM의 업스트림 또는 5'). 가이드 RNA 표적 서열은 가이드 RNA의 DNA-표적화 분절에 동등하지만, 우라실 대신에 티민을 갖는다. 일례로서, SpCas9 효소에 대한 가이드 RNA 표적 서열은 비-상보적 가닥 상의 5'-NGG-3' PAM의 업스트림 서열을 지칭할 수 있다. 가이드 RNA는 표적 DNA의 상보적 가닥에 대해 상보성을 갖도록 설계되며, 여기서, 가이드 RNA의 DNA-표적화 분절과 표적 DNA의 상보적 가닥 사이의 혼성화는 CRISPR 복합체의 형성을 촉진한다. 혼성화를 야기하고 CRISPR 복합체의 형성을 촉진하기에 충분한 상보성이 존재한다면, 완전 상보성이 본질적으로 필요한 것은 아니다. 가이드 RNA가 본원에서 가이드 RNA 표적 서열을 표적화하는 것으로 지칭된다면, 의미하는 것은, 상기 가이드 RNA가, 비-상보적 가닥 상의 가이드 RNA 표적 서열의 역보체인 표적 DNA의 상보적 가닥 서열에 혼성화한다는 것이다.
표적 DNA 또는 가이드 RNA 표적 서열은 임의의 폴리뉴클레오타이드를 포함할 수 있으며, 예를 들어, 세포의 핵 또는 세포질에 또는 세포의 세포소기관, 예컨대 미토콘드리아 또는 엽록체 내에 위치할 수 있다. 표적 DNA 또는 가이드 RNA 표적 서열은 세포에 대해 내인성 또는 외인성인 임의의 핵산 서열일 수 있다. 가이드 RNA 표적 서열은 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 서열)일 수 있거나, 둘 다 포함할 수 있다.
Cas 단백질에 의한 표적 DNA의 부위-안내 결합 및 절단은 (i) 가이드 RNA와 표적 DNA의 상보적 가닥 사이의 염기쌍-형성 상보성, 및 (ii) 표적 DNA의 비-상보적 가닥에서 프로토스페이서 인접 모티프(PAM)라고 하는 짧은 모티프 둘 다에 의해 결정된 위치에서 발생할 수 있다. PAM은 가이드 RNA 표적 서열을 플랭킹할 수 있다. 선택적으로, 가이드 RNA 표적 서열은 3' 단부에서 PAM에 플랭킹될 수 있다(예를 들어, Cas9의 경우). 대안적으로, 가이드 RNA 표적 서열은 5' 단부에서 PAM에 플랭킹될 수 있다(예를 들어, Cpf1의 경우). 예를 들어, Cas 단백질의 절단 부위는 PAM 서열(예를 들어, 가이드 RNA 표적 서열 내)의 약 1 내지 약 10개, 또는 약 2 내지 약 5개 염기쌍(예를 들어, 3개 염기쌍)일 수 있다. SpCas9의 경우, PAM 서열(즉, 비-상보적 가닥 상)은 5'-N1GG-3'일 수 있으며, 여기서, N1은 임의의 DNA 뉴클레오타이드이며, PAM은 표적 DNA의 비-상보적 가닥 상의 가이드 RNA 표적 서열의 바로 옆(immediately) 3'이다. 이와 같이, 상보적 가닥(즉, 역보체) 상의 PAM에 상응하는 서열은 5'-CCN2-3'일 것이며, 여기서, N2는 임의의 DNA 뉴클레오타이드이며 가이드 RNA의 DNA-표적화 분절이 표적 DNA의 상보적 가닥 상에서 혼성화하는 서열의 바로 옆 5'이다. 일부 이러한 경우, N1 및 N2는 상보적일 수 있고, N1- N2 염기쌍은 임의의 염기쌍일 수 있다(예를 들어, N1=C 및 N2=G; N1=G 및 N2=C; N1=A 및 N2=T; 또는 N1=T, 및 N2=A). 에스. 아우레우스로부터의 Cas9의 경우, PAM은 NNGRRT 또는 NNGRR일 수 있으며, 여기서, N은 A, G, C, 또는 T일 수 있고, R은 G 또는 A일 수 있다. 씨. 예유니(C. jejuni)로부터의 Cas9의 경우, PAM은 예를 들어, NNNNACAC 또는 NNNNRYAC일 수 있으며, 여기서, N은 A, G, C, 또는 T일 수 있고, R은 G 또는 A일 수 있다. 일부 경우(예를 들어, FnCpf1의 경우), PAM 서열은 5' 단부의 업스트림에 있을 수 있고 서열 5'-TTN-3'를 가질 수 있다.
가이드 RNA 표적 서열의 일례는, SpCas9 단백질에 의해 인식되는 NGG 모티프 바로 앞의 20-뉴클레오타이드 DNA 서열이다. 예를 들어, 가이드 RNA 표적 서열 + PAM의 2개 예는 GN19NGG(SEQ ID NO: 43) 또는 N20NGG(SEQ ID NO: 44)이다. 예를 들어, 국제공개 WO 2014/165825호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 5' 단부에서의 구아닌은 세포에서 RNA 폴리머라제에 의한 전사를 용이하게 할 수 있다. 가이드 RNA 표적 서열 + PAM의 다른 예는 시험관내에서 T7 폴리머라제에 의한 효율적인 전사를 용이하게 하기 위해 5' 단부에 2개의 구아닌 뉴클레오타이드(예를 들어, GGN20NGG; SEQ ID NO: 45)를 포함할 수 있다. 예를 들어, 국제공개 WO 2014/065596호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 다른 가이드 RNA 표적 서열 + PAM은, 5' G 또는 GG 및 3' GG 또는 NGG를 포함하여 SEQ ID NO: 43-45의 4개 내지 22개 뉴클레오타이드 길이를 가질 수 있다. 더욱 다른 가이드 RNA 표적 서열 PAM은 SEQ ID NO: 43-45의 14개 내지 20개 뉴클레오타이드 길이를 가질 수 있다.
표적 DNA에 혼성화된 CRISPR 복합체의 형성은 가이드 RNA 표적 서열에 상응하는 영역 내에서 또는 그 부근에서 표적 DNA의 하나의 가닥 또는 양쪽 가닥의 절단을 초래할 수 있다(즉, 표적 DNA의 비-상보적 가닥 상의 가이드 RNA 표적 서열, 및 가이드 RNA가 혼성화하는 상보적 가닥 상의 역보체). 예를 들어, 절단 부위는 가이드 RNA 표적 서열 내에 있을 수 있다(예를 들어, PAM 서열에 비해 정의된 위치에서). "절단 부위"는, Cas 단백질이 단일-가닥 절단부(break) 또는 이중-가닥 절단부를 생성하는 표적 DNA의 위치를 포함한다. 절단 부위는 이중-가닥 DNA 중 단지 하나의 가닥 상에 존재할 수 있거나(예를 들어, 닉카제(nickase)가 사용될 때) 또는 2개 가닥 모두 상에 존재할 수 있다. 절단 부위는 양쪽 가닥 상의 동일한 위치에 있을 수 있거나(평활 단부를 생성함; 예를 들어, Cas9), 각각의 가닥 상의 상이한 위치에 있을 수 있다(엇갈린 단부(즉, 오버행)를 생성함; 예를 들어, Cpf1). 엇갈린 단부는 예를 들어, 각각이 상이한 가닥 상의 상이한 절단 부위에서 단일-가닥 절단부를 생성하여 이중-가닥 절단부를 생성하는 2개의 Cas 단백질을 사용함으로써 생성될 수 있다. 예를 들어, 제1 닉카제는 이중-가닥 DNA(dsDNA)의 제1 가닥 상에 단일-가닥 절단부를 생성할 수 있고, 제2 닉카제는 오버행 서열이 생성되도록 dsDNA의 제2 가닥 상에 단일-가닥 절단부를 생성할 수 있다. 일부 경우, 제1 가닥 상의 가이드 RNA 표적 서열 또는 닉카제의 절단 부위는 제2 가닥 상의 가이드 RNA 표적 서열 또는 닉카제의 절단 부위로부터 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, 또는 1,000개 염기쌍만큼 분리된다.
(3) 인간 F12 유전자를 표적화하는 외인성 공여자 핵산
본원에 개시된 방법 및 조성물은 뉴클레아제 제제를 이용한 인간화 F12 좌위의 절단 후 또는 뉴클레아제 제제를 이용한 인간화 F12 좌위의 절단과 독립적으로 상기 인간화 F12 좌위를 변형시키기 위해 외인성 공여자 핵산을 이용할 수 있다. 뉴클레아제 제제를 사용하는 이러한 방법에서, 뉴클레아제 제제 단백질은 인간화 F12 좌위를 절단하여 단일-가닥 절단부(닉) 또는 이중-가닥 절단부를 생성하고, 외인성 공여자 핵산은 비-상동성 말단 접합(NHEJ)-매개 리게이션을 통해 또는 상동성-지시 수선 사건을 통해 인간화 F12 좌위와 조합된다. 선택적으로, 외인성 공여자 핵산을 이용한 수선은 뉴클레아제 표적 서열을 제거하거나 교란시켜, 표적화되었던 대립유전자는 뉴클레아제 제제에 의해 재-표적화될 수 없다.
외인성 공여자 핵산은 인간 F12 유전자 내 임의의 서열을 표적화할 수 있다. 일부 외인성 공여자 핵산은 상동성 아암을 포함한다. 다른 외인성 공여자 핵산은 상동성 아암을 포함하지 않는다. 외인성 공여자 핵산은 상동성-지시 수선에 의해 인간화 F12 좌위 내로 삽입될 수 있고/있거나 외인성 공여자 핵산은 비-상동성 말단 접합에 의해 인간화 F12 좌위 내로 삽입될 수 있다.
외인성 공여자 핵산은 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함할 수 있으며, 이들 핵산은 단일-가닥 또는 이중-가닥일 수 있고, 이들 핵산은 선형 또는 원형 형태일 수 있다. 예를 들어, 외인성 공여자 핵산은 단일-가닥 올리고데옥시뉴클레오타이드(ssODN)일 수 있다. 예를 들어, 문헌[Yoshimi (2016) Nat. Commun. 7:10431]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 외인성 공여자 핵산은 나상(naked) 핵산일 수 있거나, 바이러스, 예컨대 AAV에 의해 전달될 수 있다. 구체적인 예에서, 외인성 공여자 핵산은 AAV를 통해 전달되고, 비-상동성 말단 접합(예를 들어, 외인성 공여자 핵산은, 상동성 아암을 포함하지 않는 것일 수 있음)을 통해 인간화 F12 좌위 내로 삽입될 수 있다.
예시적인 외인성 공여자 핵산은 약 50개 뉴클레오타이드 내지 약 5 kb 길이이거나, 약 50개 뉴클레오타이드 내지 약 3 kb 길이이거나, 약 50개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 길이이다. 다른 예시적인 외인성 공여자 핵산은 약 40 내지 약 200개 뉴클레오타이드 길이이다. 예를 들어, 외인성 공여자 핵산은 약 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190, 또는 190-200개 뉴클레오타이드 길이일 수 있다. 대안적으로, 외인성 공여자 핵산은 약 50-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 또는 900-1000개 뉴클레오타이드 길이일 수 있다. 대안적으로, 외인성 공여자 핵산은 약 1-1.5, 1.5-2, 2-2.5, 2.5-3, 3-3.5, 3.5-4, 4-4.5, 또는 4.5-5 kb 길이일 수 있다. 대안적으로, 외인성 공여자 핵산은 예를 들어, 5 kb, 4.5 kb, 4 kb, 3.5 kb, 3 kb, 2.5 kb, 2 kb, 1.5 kb, 1 kb, 900개 뉴클레오타이드, 800개 뉴클레오타이드, 700개 뉴클레오타이드, 600개 뉴클레오타이드, 500개 뉴클레오타이드, 400개 뉴클레오타이드, 300개 뉴클레오타이드, 200개 뉴클레오타이드, 100개 뉴클레오타이드, 또는 50개 뉴클레오타이드 이하의 길이일 수 있다. 외인성 공여자 핵산(예를 들어, 표적화 벡터)은 또한 더 길 수 있다.
일례에서, 외인성 공여자 핵산은 약 80개 뉴클레오타이드 내지 약 200개 뉴클레오타이드 길이인 ssODN이다. 또 다른 예에서, 외인성 공여자 핵산은 약 80개 뉴클레오타이드 내지 약 3 kb 길이인 ssODN이다. 이러한 ssODN은 예를 들어, 각각 약 40개 뉴클레오타이드 내지 약 60개 뉴클레오타이드 길이인 상동성 아암을 가질 수 있다. 이러한 ssODN은 또한, 예를 들어, 각각 약 30개 뉴클레오타이드 내지 100개 뉴클레오타이드 길이인 상동성 아암을 가질 수 있다. 상동성 아암은 대칭적일 수 있거나(예를 들어, 각각 40개 뉴클레오타이드 또는 각각 60개 뉴클레오타이드 길이), 이들은 비대칭적일 수 있다(예를 들어, 36개 뉴클레오타이드 길이인 하나의 상동성 아암 및 91개 뉴클레오타이드 길이인 하나의 상동성 아암).
외인성 공여자 핵산은 추가의 바람직한 특질(예를 들어, 변형된 또는 조절된 안정성; 형광 표지에 의한 추적 또는 검출; 단백질 또는 단백질 복합체에 대한 결합 부위 등)을 제공하는 변형 또는 서열을 포함할 수 있다. 외인성 공여자 핵산은 하나 이상의 형광 표지, 정제 태그, 에피토그 태그, 또는 이들의 조합을 포함할 수 있다. 예를 들어, 외인성 공여자 핵산은 하나 이상의 형광 표지(예를 들어, 형광 단백질 또는 다른 형광단 또는 염료), 예컨대 적어도 1, 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개의 형광 표지를 포함할 수 있다. 예시적인 형광 표지는 형광단, 예컨대 플루오레세인(fluorescein)(예를 들어, 6-카르복시플루오레세인(6-FAM)), 텍사스 레드(Texas Red), HEX, Cy3, Cy5, Cy5.5, 퍼시픽 블루(Pacific Blue), 5-(및-6)-카르복시테트라메틸로다민(TAMRA), 및 Cy7을 포함한다. 광범위한 범위의 형광 염료는 올리고뉴클레오타이드를 표지화하기 위해 상업적으로 입수 가능하다(예를 들어, Integrated DNA Technologies로부터). 이러한 형광 표지(예를 들어, 내부 형광 표지)는 예를 들어, 외인성 공여자 핵산의 단부와 상용성인 돌출(protruding) 단부를 갖는 절단된 표적 핵산 내로 직접적으로 통합되었던 외인성 공여자 핵산을 검출하는 데 사용될 수 있다. 표지 또는 태그는 외인성 공여자 핵산 내의 5' 단부, 3' 단부에, 또는 내부 영역에 있을 수 있다. 예를 들어, 외인성 공여자 핵산은 5 단부에서 Integrated DNA Technologies(5'IRDYE®700)로부터의 IR700 형광단과 접합될 수 있다.
외인성 공여자 핵산은 또한, 인간화 F12 에 통합될 DNA의 분절을 포함하는 핵산 삽입물을 포함할 수 있다. 인간화 F12 좌위에서 핵산 삽입물의 통합은 상기 인간화 F12 좌위에의 관심 핵산 서열의 첨가, 상기 인간화 F12 좌위에서 관심 핵산 서열의 결실, 또는 상기 인간화 F12 좌위에서 관심 핵산 서열의 대체를 초래할 수 있다. 일부 외인성 공여자 핵산은 인간화 F12 좌위에서 임의의 상응하는 결실 없이 상기 인간화 F12 좌위에서의 핵산 삽입물의 삽입을 위해 설계된다. 다른 외인성 공여자 핵산은 핵산 삽입물의 임의의 상응하는 삽입 없이 인간화 F12 좌위에서 관심 핵산 서열을 결실시키도록 설계된다. 더욱 다른 외인성 공여자 핵산은 인간화 F12 좌위에서 관심 핵산 서열을 결실시키고 이를 핵산 삽입물로 대체하기 위해 설계된다.
결실되고/되거나 대체되는 인간화 F12 좌위에서 핵산 삽입물 또는 상응하는 핵산은 다양한 길이일 수 있다. 결실되고/되거나 대체되는 인간화 F12 좌위에서 예시적인 핵산 삽입물 또는 상응하는 핵산은 약 1개 뉴클레오타이드 내지 약 5 kb 길이이거나, 약 1개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 길이이다. 예를 들어, 결실되고/되거나 대체되는 인간화 F12 좌위에서 핵산 삽입물 또는 상응하는 핵산은 약 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190, 또는 190-120개 뉴클레오타이드 길이일 수 있다. 마찬가지로, 결실되고/되거나 대체되는 인간화 F12 좌위에서 핵산 삽입물 또는 상응하는 핵산은 1-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 또는 900-1000개 뉴클레오타이드 길이일 수 있다. 마찬가지로, 결실되고/되거나 대체되는 인간화 F12 좌위에서 핵산 삽입물 또는 상응하는 핵산은 약 1-1.5, 1.5-2, 2-2.5, 2.5-3, 3-3.5, 3.5-4, 4-4.5, 또는 4.5-5 kb 길이 이상일 수 있다.
핵산 삽입물은 대체를 위해 표적화된 서열 중 모두 또는 일부에 상동성이거나 이종상동성인 서열을 포함할 수 있다. 예를 들어, 핵산 삽입물은, 인간화 F12 좌위에서 대체를 위해 표적화된 서열과 비교하여 하나 이상(예를 들어, 1, 2, 3, 4, 5 이상)의 점 돌연변이를 포함하는 서열을 포함할 수 있다. 선택적으로, 이러한 점 돌연변이는 인코딩된 폴리펩타이드에서 보존적 아미노산 치환(예를 들어, 아스파르트산[Asp, D]을 글루탐산[Glu, E]으로 치환)을 초래할 수 있다.
일부 외인성 공여자 핵산은 야생형 내인성 F12 좌위에 의해 인코딩되지 않거나 발현되지 않는 외인성 단백질을 인코딩할 수 있다(예를 들어, 외인성 단백질을 인코딩하는 삽입물 핵산을 포함할 수 있음).
비-상동성-말단-접합-매개 삽입을 위한 공여자 핵산. 일부 외인성 공여자 핵산은 비-상동성 말단 접합에 의해 인간화 F12 좌위 내로 삽입될 수 있다. 일부 경우, 이러한 외인성 공여자 핵산은 상동성 아암을 포함하지 않는다. 예를 들어, 이러한 외인성 공여자 핵산은 뉴클레아제 제제를 이용한 절단 후 평활 단부 및 이중-가닥 절단부 내로 삽입될 수 있다. 구체적인 예에서, 외인성 공여자 핵산은 AAV를 통해 전달되고, 비-상동성 말단 접합(예를 들어, 외인성 공여자 핵산은, 상동성 아암을 포함하지 않는 것일 수 있음)을 통해 인간화 F12 좌위 내로 삽입될 수 있다.
다른 외인성 공여자 핵산은 인간화 F12 좌위에서 뉴클레아제-매개 절단에 의해 생성된 하나 이상의 오버행에 상보적인 짧은 단일-가닥 영역을 5' 단부 및/또는 3' 단부에서 가질 수 있다. 이들 오버행은 또한, 5' 및 3' 상동성 아암으로 지칭될 수 있다. 예를 들어, 일부 외인성 공여자 핵산은 인간화 F12 좌위에서 5' 및/또는 3' 표적 서열에서 뉴클레아제-매개 절단에 의해 생성된 하나 이상의 오버행에 상보적인 짧은 단일-가닥 영역을 5' 단부 및/또는 3' 단부에서 가질 수 있다. 일부 이러한 외인성 공여자 핵산은 5' 단부에서만 또는 3' 단부에서만 상보적 영역을 갖는다. 예를 들어, 일부 이러한 외인성 공여자 핵산은 인간화 F12 좌위에서 5' 표적 서열에서 생성된 오버행에 상보적인 5' 단부에서만 또는 인간화 F12 좌위에서 3' 표적 서열에서 생성된 오버행에 상보적인 3' 단부에서만 상보적 영역을 갖는다. 다른 이러한 외인성 공여자 핵산은 5' 단부와 3' 단부 둘 다에서 상보적 영역을 갖는다. 예를 들어, 다른 이러한 외인성 공여자 핵산은 인간화 F12 좌위에서 뉴클레아제-매개 절단에 의해 생산된, 예를 들어, 각각 제1 오버행 및 제2 오버행에 상보적인 5' 단부와 3' 단부 둘 다에서 상보적 영역을 갖는다. 예를 들어, 외인성 공여자 핵산이 이중-가닥이라면, 단일-가닥 상보적 영역은 공여자 핵산의 상단 가닥의 5' 단부 및 공여자 핵산의 하단 가닥의 5' 단부로부터 연장되어, 각각의 단부 상에서 5' 오버행을 생성할 수 있다. 대안적으로, 단일-가닥 상보적 영역은 공여자 핵산의 상단 가닥의 3' 단부로부터 그리고 주형의 하단 가닥의 3' 단부로부터 연장되어, 3' 오버행을 생성할 수 있다.
상보적 영역은 외인성 공여자 핵산과 표적 핵산 사이에서 리게이션을 촉진하기에 충분한 임의의 길이일 수 있다. 예시적인 상보적 영역은 약 1 내지 약 5개 뉴클레오타이드 길이, 약 1 내지 약 25개 뉴클레오타이드 길이, 또는 약 5 내지 약 150개 뉴클레오타이드 길이이다. 예를 들어, 상보적 영역은 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오타이드 길이일 수 있다. 대안적으로, 상보적 영역은 약 5-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 또는 140-150개 뉴클레오타이드 길이 이상일 수 있다.
이러한 상보적 영역은 닉카제의 2개 쌍에 의해 생성된 오버행에 상보적일 수 있다. 스태거드 단부(staggered end)를 갖는 2개의 이중-가닥 절단부는, DNA의 반대 가닥을 절단하여 제1 이중-가닥 절단부를 생성하는 제1 및 제2 닉카제, 및 DNA의 반대 가닥을 절단하여 제2 이중-가닥 절단부를 생성하는 제3 및 제4 닉카제를 사용함으로써 생성될 수 있다. 예를 들어, Cas 단백질은 제1, 제2, 제3 및 제4 가이드 RNA와 상응하는 제1, 제2, 제3 및 제4 가이드 RNA 표적 서열을 닉킹하는 데 사용될 수 있다. 제1 및 제2 가이드 RNA 표적 서열은, DNA의 제1 및 제2 가닥 상의 제1 및 제2 닉카제에 의해 생성된 닉이 이중-가닥 절단부(즉, 제1 절단 부위는 제1 및 제2 가이드 RNA 표적 서열 내에 닉을 포함함)를 생성하도록 놓여서 제1 절단 부위를 생성할 수 있다. 마찬가지로, 제3 및 제4 가이드 RNA 표적 서열은, DNA의 제1 및 제2 가닥 상의 제3 및 제4 닉카제에 의해 생성된 닉이 이중-가닥 절단부(즉, 제2 절단 부위는 제3 및 제4 가이드 RNA 표적 서열 내에 닉을 포함함)를 생성하도록 놓여서 제2 절단 부위를 생성할 수 있다. 바람직하게는, 제1 및 제2 가이드 RNA 표적 서열 및/또는 제3 및 제4 가이드 RNA 표적 서열 내의 닉은, 오버행을 생성하는 닉을 오프셋(off-set)할 수 있다. 오프셋은 예를 들어, 적어도 약 5 bp, 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp, 100 bp 이상일 수 있다. 문헌[Ran 등 (2013) Cell 154:1380-1389]; 문헌[Mali 등 (2013) Nat. Biotech. 31:833-838]; 및 문헌[Shen 등 (2014) Nat. Methods 11:399-404]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 경우, 이중-가닥 외인성 공여자 핵산은, 제1 및 제2 가이드 RNA 표적 서열 내의 닉에 의해 그리고 제3 및 제4 가이드 RNA 표적 서열 내의 닉에 의해 생성되는 오버행에 상보적인 단일-가닥 상보적 영역과 함께 설계될 수 있다. 그 후에, 이러한 외인성 공여자 핵산은 비-상동성-말단-접합-매개 리게이션에 의해 삽입될 수 있다.
상동성-지시 수선에 의한 삽입을 위한 공여자 핵산. 일부 외인성 공여자 핵산은 상동성 아암을 포함한다. 외인성 공여자 핵산이 또한 핵산 삽입물을 포함한다면, 상동성 아암들은 핵산 삽입물을 플랭킹할 수 있다. 기준의 용이성을 위해, 상동성 아암은 본원에서 5' 및 3'(즉, 업스트림 및 다운스트림) 상동성 아암으로 지칭된다. 이 용어는 외인성 공여자 핵산 내의 핵산 삽입물에 대한 상동성 아암의 상대 위치에 관한 것이다. 5' 및 3' 상동성 아암은 인간화 F12 좌위 내의 영역에 상응하며, 이는 본원에서 각각 "5' 표적 서열" 및 "3' 표적 서열"로 지칭된다.
상동성 아암 및 표적 서열은, 2개의 영역이 서로 충분한 수준의 서열 동일성을 공유하여 상동성 재조합 반응에 대한 기질로서 작용할 때 서로 "상응한다" 또는 "상응하고" 있다. 용어 "상동성"은 상응하는 서열에 대해 동일하거나 서열 동일성을 공유하는 DNA 서열을 포함한다. 주어진 표적 서열과 외인성 공여자 핵산에서 확인된 상응하는 상동성 아암 사이의 서열 동일성은 상동성 재조합이 발생하게 하는, 서열 동일성의 임의의 정도일 수 있다. 예를 들어, 외인성 공여자 핵산(또는 이의 단편)의 상동성 아암 및 표적 서열(또는 이의 단편)에 의해 공유되는 서열 동일성의 양은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있으며, 따라서 서열은 상동성 재조합을 수행한다. 더욱이, 상동성 아암과 상응하는 표적 서열 사이의 상동성의 상응하는 영역은 상동성 재조합을 촉진하기에 충분한 임의의 길이일 수 있다. 예시적인 상동성 아암은 약 25개 뉴클레오타이드 내지 약 2.5 kb 길이이거나, 약 25개 뉴클레오타이드 내지 약 1.5 kb 길이이거나, 약 25 내지 약 500개 뉴클레오타이드 길이이다. 예를 들어, 주어진 상동성 아암(또는 상동성 아암 각각) 및/또는 상응하는 표적 서열은 약 25-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 또는 450-500개 뉴클레오타이드 길이인 상동성의 상응하는 영역을 포함할 수 있으며, 따라서 상동성 아암은 표적 핵산 내의 상응하는 표적 서열과 상동성 재조합을 수행하기에 충분한 상동성을 갖는다. 대안적으로, 주어진 상동성 아암(또는 상동성 아암 각각) 및/또는 상응하는 표적 서열은 약 0.5 kb 내지 약 1 kb, 약 1 kb 내지 약 1.5 kb, 약 1.5 kb 내지 약 2 kb, 또는 약 2 kb 내지 약 2.5 kb 길이인 상동성의 상응하는 영역을 포함할 수 있다. 예를 들어, 상동성 아암은 각각 약 750개 뉴클레오타이드 길이일 수 있다. 상동성 아암은 대칭적일 수 있거나(각각 약 동일한 길이), 이들 상동성 아암은 비대칭적일 수 있다(다른 것보다 더 긴 하나).
뉴클레아제 제제가 외인성 공여자 핵산과 조합되어 사용될 때, 5' 및 3' 표적 서열은 바람직하게는 뉴클레아제 절단 부위에 충분히 근접하게(예를 들어, 뉴클레아제 표적 서열에 충분한 근접성 내에) 위치하여, 뉴클레아제 절단 부위에서 단일-가닥 절단부(닉) 또는 이중-가닥 절단부 시 표적 서열과 상동성 아암 사이의 상동성 재조합 사건의 발생을 촉진한다. 용어 "뉴클레아제 제제 절단 부위"는, 닉 또는 이중-가닥 절단부가 뉴클레아제 제제(예를 들어, 가이드 RNA와 복합체화된 Cas9 단백질)에 의해 생성되는 DNA 서열을 포함한다. 외인성 공여자 핵산의 5' 및 3' 상동성 아암에 상응하는 표적화된 좌위 내의 표적 서열은, 그 거리가 뉴클레아제 절단 부위에서 단일-가닥 절단부 또는 이중-가닥 절단부 시 5' 및 3' 표적 서열과 상동성 아암 사이의 상동성 재조합 사건의 발생을 촉진하는 정도라면, 뉴클레아제 절단 부위에 "충분한 근접성으로 위치한"다. 그러므로, 외인성 공여자 핵산의 5' 및/또는 3' 상동성 아암에 상응하는 표적 서열은 예를 들어, 주어진 뉴클레아제 절단 부위의 적어도 1개 뉴클레오타이드 내에 또는 주어진 뉴클레아제 절단 부위의 적어도 10개 뉴클레오타이드 내지 약 1,000개 뉴클레오타이드 내에 존재할 수 있다. 일례로, 뉴클레아제 절단 부위는 표적 서열 중 적어도 하나 또는 둘 다에 바로 인접해 있을 수 있다.
외인성 공여자 핵산의 상동성 아암에 상응하는 표적 서열 및 뉴클레아제 절단 부위의 공간적 관계는 다양할 수 있다. 예를 들어, 표적 서열은 뉴클레아제 절단 부위에 대해 5'에 위치할 수 있거나, 표적 서열은 뉴클레아제 절단 부위에 대해 3'에 위치할 수 있거나, 표적 서열은 뉴클레아제 절단 부위를 플랭킹할 수 있다.
(4) 다른 인간-응고-인자-XII-표적화 시약
임의의 다른 기지의 또는 추정상 인간-응고-인자-XII-표적화 시약의 활성은 또한, 비-인간 동물을 사용하여 평가될 수 있다. 유사하게는, 임의의 다른 분자는 본원에 개시된 비-인간 동물을 사용하여 인간-응고-인자-XII-표적화 활성에 대해 스크리닝될 수 있다.
일례로, 인간-응고-인자-XII-표적화 시약은 인간 응고 인자 XII 단백질의 에피토프를 표적화하는 항원-결합 단백질일 수 있다. 용어 "항원-결합 단백질"은 항원에 결합하는 임의의 단백질을 포함한다. 항원-결합 단백질의 예는 항체, 항체의 항원-결합 단편, 다중-특이적 항체(예를 들어, 이중-특이적 항체), scFV, 비스-scFV, 디아바디, 트리아바디, 테트라바디, V-NAR, VHH, VL, F(ab), F(ab)2, DVD(이중 가변 도메인 항원-결합 단백질), SVD(단일 가변 도메인 항원-결합 단백질), 이중특이적 T-세포 인게이저(BiTE), 또는 다비스바디를 포함한다(미국 특허 제8,586,713호로서, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨). 다른 인간-응고-인자-XII-표적화 시약은 인간 응고 인자 XII 단백질을 표적화하는 저분자를 포함한다.
다른 인간-응고-인자-XII-표적화 시약은 RNAi 제제를 포함할 수 있다. "RNAi 제제"는, 표적 RNA, 예컨대 메신저 RNA(mRNA)의 분해 또는 이의 번역의 저해를 서열-특이적 방식으로 용이하게 할 수 있는 작은 이중-가닥 RNA 또는 RNA-유사(예를 들어, 화학적으로 변형된 RNA) 올리고뉴클레오타이드를 포함하는 조성물이다. RNAi 제제 내 올리고뉴클레오타이드는 연결된 뉴클레오사이드의 중합체이며, 이들은 각각 독립적으로 변형되거나 비변형될 수 있다. RNAi 제제는 RNA 간섭 기전을 통해(즉, 포유류 세포의 RNA 간섭 경로 기구(RNA-유도 사일런싱 복합체 또는 RISC)와의 상호작용을 통해 RNA 간섭을 유도하여) 작동한다. RNAi 제제는 해당 용어가 본원에 사용되는 바와 같이, 주로 RNA 간섭 기전을 통해 작동하는 것으로 여겨지는 한편, 개시된 RNAi 제제는 임의의 특정 작동 경로 또는 기전에 의해 결부되지 않거나 이로 제한되지 않는다. 본원에 개시된 RNAi 제제는 센스 가닥 및 안티센스 가닥을 포함하고, 짧은 간섭 RNA(siRNA), 이중-가닥 RNA(dsRNA), 마이크로 RNA(miRNA), 짧은 헤어핀 RNA(shRNA), 및 다이서 기질(dicer substrate)을 포함하지만 이들로 제한되지 않는다. 본원에 기재된 RNAi 제제의 안티센스 가닥은 표적 RNA 내의 서열에 적어도 부분적으로 상보적이다(즉, 표준 명명법을 사용하여 글자의 연속(succession)으로 기재된, 핵염기 또는 뉴클레오타이드의 연속 또는 순서).
다른 인간-응고-인자-XII-표적화 시약은 안티센스 올리고뉴클레오타이드(ASO)를 포함할 수 있다. 단일-가닥 ASO 및 RNA 간섭(RNAi)은, 올리고뉴클레오타이드가 왓슨-크릭 염기쌍 형성을 통해 표적 RNA와 결합한다는 근본적인 원리를 공유한다. 이론으로 결부시키고자 하는 것은 아니지만, RNAi 동안, 작은 RNA 듀플렉스(RNAi 제제)는 RNA-유도 사일런싱 복합체(RISC)와 회합되며, 하나의 가닥(패신저 가닥(passenger strand))은 상실되고, 잔여 가닥은 RISC와 협력하여 상보적 RNA에 결합한다. 그 후에, RISC의 촉매적 구성요소인 아르고노트 2(Ago2: Argonaute 2)는 표적 RNA를 절단한다. 가이드 가닥은 상보적 센스 가닥 또는 단백질(RISC)과 항상 관련이 있다. 대조적으로, ASO는 생존하고 단일 가닥으로서 작용해야 한다. ASO는 표적 RNA에 결합하고, 리보솜 또는 다른 인자, 예컨대 스플라이싱 인자가 RNA에 결합하는 것을 차단하거나, 단백질, 예컨대 뉴클레아제를 동원한다. 상이한 변형 및 표적 영역은 요망되는 작동 기전에 기초하여 ASO에 대해 선택된다. 갭머(gapmer)는 DNA의 중심 8-10 염기 갭을 플랭킹하는 각각의 말단 상에 2 내지 5개의 화학적으로 변형된 뉴클레오타이드(예를 들어, LNA 또는 2'-MOE)를 함유하는 ASO 올리고뉴클레오타이드이다. 표적 RNA에 결합한 후, DNA-RNA 하이브리드는 RNase H에 대한 기질로서 작용한다.
D. 인간-응고-인자-XII-표적화 시약을 비-인간 동물 또는 세포에 투여
본원에 개시된 방법은 핵산, 단백질, 핵산-단백질 복합체, 단백질 복합체, 또는 저분자를 포함하여 다양한 분자(예를 들어, 인간-응고-인자-XII-표적화 시약, 예컨대 치료적 분자 또는 복합체)를 비-인간 동물 또는 세포 내로 도입하는 단계를 포함할 수 있다. "도입한다는 것"은 비-인간 동물 분자(예를 들어, 핵산 또는 단백질)이 세포 내부로의 또는 비-인간 동물 내 세포의 내부로의 접근을 획득하는 방식으로 상기 비-인간 동물 분자(예를 들어, 핵산 또는 단백질)을 세포 또는 동물에 제시하는 것을 포함한다. 도입은 임의의 수단에 의해 달성될 수 있으며, 2개 이상의 성분(예를 들어, 성분 중 2개, 또는 모든 성분)은 임의의 조합으로 동시에 또는 순차적으로 세포 또는 비-인간 동물 내로 도입될 수 있다. 예를 들어, Cas 단백질은 가이드 RNA의 도입 전에 세포 또는 비-인간 동물 내로 도입될 수 있거나, Cas 단백질은 가이드 RNA의 도입 후에 도입될 수 있다. 또 다른 예로, 외인성 공여자 핵산은 Cas 단백질 및 가이드 RNA의 도입 전에 도입될 수 있거나, 외인성 공여자 핵산은 Cas 단백질 및 가이드 RNA의 도입 후에 도입될 수 있다(예를 들어, 외인성 공여자 핵산은 Cas 단백질 및 가이드 RNA의 도입 전 또는 도입 후 약 1, 2, 3, 4, 8, 12, 24, 36, 48, 또는 72시간째에 투여될 수 있음). 예를 들어, 미국 특허출원공개 US 2015/0240263호 및 미국 특허출원공개 US 2015/0110762호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 게다가, 2개 이상의 성분은 동일한 전달 방법 또는 상이한 전달 방법에 의해 세포 또는 비-인간 동물 내로 도입될 수 있다. 유사하게는, 2개 이상의 성분은 동일한 투여 경로 또는 상이한 투여 경로에 의해 비-인간 동물 내로 도입될 수 있다.
일부 방법에서, CRISPR/Cas 시스템의 구성요소는 비-인간 동물 또는 세포 내로 도입된다. 가이드 RNA는 RNA(예를 들어, 시험관내 전사된 RNA)의 형태로 또는 가이드 RNA를 인코딩하는 DNA의 형태로 비-인간 동물 또는 세포 내로 도입될 수 있다. DNA의 형태로 도입될 때, 가이드 RNA를 인코딩하는 DNA는 세포 또는 비-인간 동물에서 활성인 프로모터에 작동적으로 연결될 수 있다. 예를 들어, 가이드 RNA는 AAV를 통해 전달되고 U6 프로모터 하에 생체내에서 발현될 수 있다. 이러한 DNA는 하나 이상의 발현 작제물에 존재할 수 있다. 예를 들어, 이러한 발현 작제물은 단일 핵산 분자의 성분일 수 있다. 대안적으로, 이들은 2개 이상의 핵산 분자 중에서 임의의 조합으로 분리될 수 있다(즉, 하나 이상의 CRISPR RNA를 인코딩하는 DNA 및 하나 이상의 tracrRNA를 인코딩하는 DNA는 별개의 핵산 분자의 성분일 수 있음).
마찬가지로, Cas 단백질은 임의의 형태로 제공될 수 있다. 예를 들어, Cas 단백질은 단백질, 예컨대 gRNA와 복합체화된 Cas 단백질의 형태로 제공될 수 있다. 대안적으로, Cas 단백질은 Cas 단백질을 인코딩하는 핵산, 예컨대 RNA(예를 들어, 메신저 RNA(mRNA)) 또는 DNA의 형태로 제공될 수 있다. 선택적으로, Cas 단백질을 인코딩하는 핵산은 특정 세포 또는 유기체에서 단백질로의 효율적인 번역을 위해 코돈 최적화될 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 천연 발생 폴리뉴클레오타이드 서열과 비교하여, 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 또는 임의의 다른 관심 숙주 세포에서 더 높은 사용 빈도를 갖는 코돈을 치환하도록 변형될 수 있다. Cas 단백질을 인코딩하는 핵산이 비-인간 동물 내로 도입될 때, 상기 Cas 단백질은 상기 비-인간 동물 내 세포에서 일시적으로, 조건적으로, 또는 구성적으로 발현될 수 있다.
Cas 단백질 또는 가이드 RNA를 인코딩하는 핵산은 발현 작제물에서 프로모터에 작동적으로 연결될 수 있다. 발현 작제물은 관심 유전자 또는 다른 핵산 서열(예를 들어, Cas 유전자)의 발현을 지시할 수 있는 임의의 핵산 작제물을 포함하고, 이는 이러한 관심 핵산 서열을 표적 세포로 이전시킬 수 있다. 예를 들어, Cas 단백질을 인코딩하는 핵산은 하나 이상의 gRNA를 인코딩하는 DNA를 포함하는 벡터에 존재할 수 있다. 대안적으로, 이는, 하나 이상의 gRNA를 인코딩하는 DNA를 포함하는 벡터로부터 별개인 벡터 또는 플라스미드에 존재할 수 있다. 발현 작제물에 사용될 수 있는 적합한 프로모터는 예를 들어, 진핵 세포, 인간 세포, 비-인간 세포, 포유류 세포, 비-인간 포유류 세포, 설치류 세포, 마우스 세포, 래트 세포, 햄스터 세포, 토끼 세포, 만능성 세포, 배아 줄기(ES) 세포, 성인 줄기세포, 발달 제약 전구 세포, 유도 만능 줄기(iPS) 세포, 또는 1-세포 단계 배아 중 하나 이상에서 활성인 프로모터를 포함한다. 이러한 프로모터는 예를 들어, 조건적 프로모터, 유도적 프로모터, 구성적 프로모터, 또는 조직-특이적 프로모터일 수 있다. 선택적으로, 프로모터는 하나의 방향에서 Cas 단백질과 다른 방향에서 가이드 RNA 둘 다의 발현을 구동하는 양방향적(bidirectional) 프로모터일 수 있다. 이러한 양방향적 프로모터는 (1) 3개의 외부 제어 요소를 함유하는 완전한 종래의 일방향적 Pol III 프로모터: 원위부 서열 요소(DSE), 근위부 서열 요소(PSE), 및 TATA 박스; 및 (2) 역배향에서 DSE의 5' 말단에 융합된 TATA 박스 및 PSE를 포함하는 제2 기본(basic) Pol III 프로모터로 구성될 수 있다. 예를 들어, H1 프로모터에서, DSE는 PSE 및 TATA 박스에 인접하고, 프로모터는, U6 프로모터로부터 유래된 TATA 박스 및 PSE를 부착함으로써 역방향에서의 전사가 제어되는 하이브리드 프로모터를 생성함으로써 양방향적으로 될 수 있다. 예를 들어, 미국 특허출원공개 US 2016/0074535호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas 단백질을 인코딩하는 유전자 및 가이드 RNA를 발현하기 위한 양방향적 프로모터의 사용은 동시에, 전달을 용이하게 하기 위해 컴팩트 발현 카세트의 생산을 가능하게 한다.
비-인간 동물 또는 세포 내로 도입되는 분자(예를 들어, Cas 단백질 또는 가이드 RNA 또는 RNAi 제제 또는 ASO)는 도입되는 분자의 안정성을 증가시키는(예를 들어, 주어진 저장 조건(예를 들어, -20℃, 4℃ 또는 주위 온도) 하에서 분해 생성물이 역치 미만에, 예컨대 출발 핵산 또는 단백질의 0.5 중량% 미만에서 유지되는 기간을 연장시키거나; 생체내에서의 안정성을 증가시키는) 담체를 포함하는 조성물에 제공될 수 있다. 이러한 담체의 비제한적인 예는 폴리(락트산)(PLA) 미소구체, 폴리(D,L-락틱-코글리콜-산)(PLGA) 미소구체, 리포솜, 미쉘, 인버스 미쉘, 지질 코킬레에이트, 및 지질 미세소관을 포함한다.
다양한 방법 및 조성물은 세포 또는 비-인간 동물 내로의 분자(예를 들어, 핵산 또는 단백질)의 도입을 가능하게 하기 위해 본원에 제공된다. 분자를 다양한 세포 유형 내로 도입하는 방법은 알려져 있고, 예를 들어, 안정한 형질주입 방법, 일시적인 형질주입 방법, 및 바이러스-매개 방법을 포함한다.
형질주입 프로토콜, 뿐만 아니라 분자를 세포 내로 도입하는 프로토콜은 다양할 수 있다. 비제한적인 형질주입 방법은 리포솜; 나노입자; 칼슘 포스페이트(문헌[Graham 등 (1973) Virology 52 (2): 456-67], 문헌[Bacchetti 등 (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590-4], 및 문헌[Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company. pp. 96-97]); 덴드리머; 또는 양이온성 중합체, 예컨대 DEAE-덱스트란 또는 폴리에틸렌이민을 사용하는 화학적-기초 형질주입 방법을 포함한다. 비-화학적 방법은 전기천공, 초음파-천공(sonoporation), 및 광학 형질주입을 포함한다. 입자-기초 형질주입은 유전자 총(gene gun), 또는 자기-보조 형질주입(magnet-assisted transfection)의 사용을 포함한다(문헌[Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28]). 바이러스 방법이 또한 형질주입에 사용될 수 있다.
세포 내로의 핵산 또는 단백질의 도입 또한, 전기천공에 의해, 세포질내 주사에 의해, 바이러스 감염에 의해, 아데노바이러스에 의해, 아데노-관련 바이러스에 의해, 렌티바이러스에 의해, 레트로바이러스에 의해, 형질주입에 의해, 지질-매개 형질주입에 의해, 또는 뉴클레오펙션(nucleofection)에 의해 매개될 수 있다. 뉴클레오펙션은, 핵산 기질이 세포질로 전달될 뿐만 아니라 핵막을 통해 핵 내로도 전달되게 할 수 있는 향상된 전기천공 기술이다. 게다가, 본원에 개시된 방법에서 뉴클레오펙션의 사용은 전형적으로, 정기적인 전기천공보다 훨씬 더 적은 세포를 필요로 한다(예를 들어, 정기적인 전기천공에 의해 7백만개와 비교하여 단지 약 2백만개). 일례에서, 뉴클레오펙션은 LONZA® NUCLEOFECTOR™ 시스템을 사용하여 수행된다.
세포(예를 들어, 접합체) 내로의 분자(예를 들어, 핵산 또는 단백질)의 도입은 또한 현미주사(microinjection)에 의해 달성될 수 있다. 접합체(즉, 1-세포 단계 배아)에서, 현미주사는 모체(maternal) 및/또는 부체(paternal) 전핵 내로 또는 세포질 내로 수행될 수 있다. 현미주사가 단지 하나의 전핵 내로 수행된다면, 부체 전핵이 이의 더 큰 크기로 인해 바람직하다. mRNA의 현미주사는 바람직하게는 세포질 내로 수행되며(예를 들어, mRNA를 번역 기구에 직접 전달하기 위해), 한편 Cas 단백질 또는 Cas 단백질을 인코딩하거나 RNA를 인코딩하는 폴리뉴클레오타이드의 현미주사는 바람직하게는 핵/전핵 내로 수행된다. 대안적으로, 현미주사는 핵/전핵(pronucleus)과 세포질 둘 다 내로 주사에 의해 수행될 수 있으며: 우선 바늘이 핵/전핵 내로 도입되고 제1 양이 주사될 수 있으며, 한편 상기 바늘을 1-세포 단계 배아로부터 제거하여 제2 양이 세포질 내로 주사될 수 있다. Cas 단백질이 세포질 내로 주사된다면, Cas 단백질은 바람직하게는 핵/전핵으로의 전달을 보장하기 위해 핵 국재화를 포함한다. 현미주사를 수행하는 방법은 잘 알려져 있다. 예를 들어, 문헌[Nagy 등 (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press)]를 참조하며; 문헌[Meyer 등 (2010) Proc. Natl. Acad. Sci. U.S.A 107:15022-15026] 및 문헌[Meyer 등 (2012) Proc. Natl. Acad. Sci. U.S.A 109:9354-9359]를 또한 참조한다.
분자(예를 들어, 핵산 또는 단백질)을 세포 또는 비-인간 동물 내로 도입하기 위한 다른 방법은 예를 들어, 벡터 전달, 입자-매개 전달, 엑소좀-매개 전달, 지질-나노입자-매개 전달, 세포-투과-펩타이드-매개 전달, 또는 이식 가능-장치-매개 전달을 포함할 수 있다. 구체적인 예로서, 핵산 또는 단백질은 담체, 예컨대 폴리(락트산)(PLA), 미소구체, 폴리(D,L-락틱-코글리콜-산)(PLGA) 미소구체, 리포좀, 미쉘, 인버스 미셸, 지질 코클레이트(cochelate), 또는 지질 미세소관과 같은 담체에서 세포 또는 비-인간 동물 내로 도입될 수 있다. 비-인간 동물로의 전달의 일부 구체적인 예는 유체역학적 전달, 바이러스-매개 전달(예를 들어, 아데노-관련 바이러스(AAV)-매개 전달), 및 지질-나노입자-매개 전달을 포함한다.
세포 또는 비-인간 동물 내로의 핵산 및 단백질의 도입은 유체역학적 전달(HDD)에 의해 달성될 수 있다. 유체역학적 전달은 생체내에서 세포내 DNA 전달 방법으로서 출현하였다. 실질 세포로의 유전자 전달을 위해, 필수적인 DNA 서열만 선택된 혈관을 통해 주사되어, 현재의 바이러스 및 합성 벡터와 관련된 안전성 염려를 해소할 필요가 있다. 혈류 내로 주사될 때, DNA는 혈액에 접근 가능한 상이한 조직 내의 세포에 도달할 수 있다. 유체역학적 전달은 큰 부피의 용액을 순환중인 비압축성(incompressible) 혈액 내로 신속하게 주사함으로써 발생되는 힘을 이용하여, 크고 막-불투과성인 화합물이 실질 세포에 진입하는 것을 방지하는 내피 및 세포막의 물리적 장벽을 극복한다. DNA의 전달 외에도, 이 방법은 생체내에서 RNA, 단백질, 및 다른 작은 화합물의 효율적인 세포내 전달에 유용하다. 예를 들어, 문헌[Bonamassa (2011) Pharm. Res. 28(4):694-701]을 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
핵산의 도입은 또한, 바이러스-매개 전달, 예컨대 AAV-매개 전달 또는 렌티바이러스-매개 전달에 의해 달성될 수 있다. 다른 예시적인 바이러스/바이러스 벡터는 레트로바이러스, 아데노바이러스, 백시니아 바이러스, 폭스바이러스, 및 단순 포진 바이러스를 포함한다. 바이러스는 분열 세포, 비-분열 세포, 또는 분열 세포와 비-분열 세포 둘 다 감염시킬 수 있다. 바이러스는 숙주 게놈 내로 통합할 수 있거나 대안적으로는 숙주 게놈 내로 통합하지 않는다. 이러한 바이러스는 또한, 감소된 면역력을 갖도록 조작될 수 있다. 바이러스는 복제-적격(competent)일 수 있거나 복제-결함(defective)(예를 들어, 추가 라운드의 비리온 복제 및/또는 패키징에 필요한 하나 이상의 유전자가 결함됨)일 수 있다. 바이러스는 일시적 발현, 장기-지속적 발현(예를 들어, 적어도 1주, 2주, 1개월, 2개월, 또는 3개월), 또는 영구적 발현(예를 들어, Cas9 및/또는 gRNA의)을 야기할 수 있다. 예시적인 바이러스 역가(예를 들어, AAV 역가)는 1012, 1013, 1014, 1015, 및 1016 벡터 게놈/mL를 포함한다.
ssDNA AAV 게놈은, 상보적 DNA 가닥의 합성을 가능하게 하는 2개의 역 말단 반복부(inverted terminal repeat)에 플랭킹되는 2개의 개방형 리딩 프레임인 Rep 및 Cap으로 구성된다. AAV 이전 플라스미드를 작제할 때, 이식유전자는 2개의 ITR 사이에 놓이고, Rep 및 Cap는 인트랜스로(in trans) 공급될 수 있다. Rep 및 Cap 외에도, AAV는 아데노바이러스로부터의 유전자를 함유하는 헬퍼 플라스미드를 필요로 할 수 있다. 이들 유전자(E4, E2a, 및 VA)는 AAV 복제를 매개한다. 예를 들어, 이전 플라스미드, Rep/Cap, 및 헬퍼 플라스미드는 아데노바이러스 유전자 E1+를 함유하는 HEK293 세포 내로 형질주입되어, 감염성 AAV 입자를 생성할 수 있다. 대안적으로, Rep, Cap, 및 아데노바이러스 헬퍼 유전자는 단일 플라스미드 내로 조합될 수 있다. 유사한 패키징 세포 및 방법은 다른 바이러스, 예컨대 레트로바이러스에 사용될 수 있다.
AAV의 다수의 혈청형이 식별되었다. 이들 혈청형은, 이들이 감염시키는 세포의 유형이 상이하여(즉, 이의 향성(tropism)), 특정 세포 유형의 선호적인 형질도입을 가능하게 한다. CNS 조직에 대한 혈청형은 AAV1, AAV2, AAV4, AAV5, AAV8, 및 AAV9를 포함한다. 심장 조직에 대한 혈청형은 AAV1, AAV8, 및 AAV9를 포함한다. 신장 조직에 대한 혈청형은 AAV2를 포함한다. 폐 조직에 대한 혈청형은 AAV4, AAV5, AAV6, 및 AAV9를 포함한다. 췌장 조직에 대한 혈청형은 AAV8를 포함한다. 광수용기 세포에 대한 혈청형은 AAV2, AAV5, 및 AAV8을 포함한다. 망막 색소 상피 조직에 대한 혈청형은 AAV1, AAV2, AAV4, AAV5, 및 AAV8을 포함한다. 골격근 조직에 대한 혈청형은 AAV1, AAV6, AAV7, AAV8, 및 AAV9를 포함한다. 간 조직에 대한 혈청형은 AAV7, AAV8, 및 AAV9, 특히 AAV8을 포함한다.
향성은 위형화(pseudotyping)을 통해 추가로 정제(refined)될 수 있으며, 이는 상이한 바이러스 혈청형으로부터의 캡시드 및 게놈의 혼합이다. 예를 들어 AAV2/5는 혈청형 5로부터의 캡시드에 패키징된 혈청형 2의 게놈을 함유하는 바이러스를 나타낸다. 위형화된 바이러스의 사용은 형질도입 효율을 향상시킬 뿐만 아니라, 향성을 변경시킬 수 있다. 상이한 혈청형으로부터 유래된 하이브리드 캡시드는 또한, 바이러스 향성을 변경시키는 데 사용될 수 있다. 예를 들어, AAV-DJ는 8개의 혈청형으로부터의 하이브리드 캡시드를 함유하고, 생체내에서 광범위한 세포 유형에 걸쳐 높은 감염성을 나타낸다. AAV-DJ8은 AAV-DJ의 특성을 나타내지만 증강된 뇌 흡수(uptake)를 갖는 또 다른 예이다. AAV 혈청형은 또한, 돌연변이를 통해 변형될 수 있다. AAV2의 돌연변이적 변형의 예는 Y444F, Y500F, Y730F, 및 S662V를 포함한다. AAV3의 돌연변이적 변형의 예는 Y705F, Y731F, 및 T492V를 포함한다. AAV6의 돌연변이적 변형의 예는 S663V 및 T492V를 포함한다. 다른 위형화된(pseudotyped)/변형된 AAV 변이체는 AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2, 및 AAV/SASTG를 포함한다.
이식유전자 발현을 가속화하기 위해, 자가-상보적 AAV(scAAV) 변이체가 사용될 수 있다. AAV는 AAV의 단일-가닥 DNA 게놈의 상보적 가닥을 합성하기 위해 세포의 DNA 복제 기구에 의존하기 때문에, 이식유전자 발현이 지연될 수 있다. 이러한 지연을 해결하기 위해, 감염 시 자발적으로 어닐링할 수 있는 상보적 서열을 함유하는 ssAAV가 사용되어, 숙주 세포 DNA 합성을 위한 요건을 배제할 수 있다. 그러나, 단일-가닥 AAV(ssAAV) 벡터가 또한 사용될 수 있다.
패키징 용량(capacity)을 증가시키기 위해, 더 긴 이식전자는 2개의 AAV 이전 플라스미드 사이에서 분할될 수 있으며, 제1 AAV는 3' 스플라이스 공여자이고 제2 AAV는 5' 스플라이스 수용기이다. 세포의 공동-감염 시, 이들 바이러스는 콘카테머(concatemer)를 형성하며, 함께 스플라이싱되고, 전장 이식유전자는 발현될 수 있다. 이는 더 장기적인 이식유전자 발현을 가능하게 하지만, 발현은 덜 효율적이다. 용량(capacity)을 증가시키기 위한 유사한 방법은 상동성 재조합을 이용한다. 예를 들어, 이식유전자는, 공동-발현이 전장 이식유전자의 상동성 재조합 및 발현을 유도하도록 2개의 이전 플라스미드 사이에서 그러나 실질적인 서열 중첩을 갖고 나눠질 수 있다.
핵산 및 단백질의 도입은 또한, 지질 나노입자(LNP)-매개 전달에 의해 달성될 수 있다. 예를 들어, LNP-매개 전달은 Cas mRNA와 가이드 RNA의 조합 또는 Cas 단백질과 가이드 RNA의 조합을 전달하는 데 사용될 수 있다. 이러한 방법을 통한 전달은 일시적인 Cas 발현을 초래하며, 생분해성 지질은 청소율(clearance)을 향상시키며, 내약성(tolerability)을 향상시키고, 면역원성을 저하시킨다. 지질 제형은 생물학적 분자의 세포 흡수를 향상시키는 한편, 이들 분자를 분해로부터 보호할 수 있다. 지질 나노입자는 분자간 힘에 의해 서로 물리적으로 관련되어 있는 복수의 지질 분자를 포함하는 입자이다. 이들은 미소구체(microsphere)(유니라멜라(unilamellar) 및 멀티라멜라(multilamella) 소낭(vesicle), 예를 들어, 리포좀을 포함함), 에멀젼 중 분산상, 미쉘(micelle), 또는 현탁액 중 내부상(internal pahse)을 포함한다. 이러한 지질 나노입자는 전달을 위해 하나 이상의 핵산 또는 단백질을 캡슐화하는 데 사용될 수 있다. 양이온성 지질을 함유하는 제형은 다가음이온(polyanion), 예컨대 핵산을 전달하는 데 유용하다. 포함될 수 있는 다른 지질은 중성 지질(즉, 비하전된 또는 쌍성이온성(zwitterionic) 지질), 음이온성 지질, 형질주입을 증강시키는 헬퍼 지질, 및 나노입자가 생체내에서 존재할 수 있는 시간의 길이를 증가시키는 스텔스(stealth) 지질이다. 적합한 양이온성 지질, 중성 지질, 음이온성 지질, 헬퍼 지질, 및 스텔스 지질의 예는 예를 들어, 국제공개 WO 2016/010840 A1호에서 찾을 수 있으며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 예시적인 지질 나노입자는 양이온성 지질 및 하나 이상의 다른 성분을 포함할 수 있다. 일례에서, 다른 성분은 헬퍼 지질, 예컨대 콜레스테롤을 포함할 수 있다. 또 다른 예에서, 다른 성분은 헬퍼 지질, 예컨대 콜레스테롤 및 중성 지질, 예컨대 DSPC를 포함할 수 있다. 또 다른 예에서, 다른 성분은 헬퍼 지질, 예컨대 콜레스테롤, 선택적인 중성 지질, 예컨대 DSPC, 및 스텔스 지질, 예컨대 S010, S024, S027, S031, 또는 S033을 포함할 수 있다.
LNP는 하기 중 하나 이상 또는 모두를 함유할 수 있다: (i) 캡슐화를 위한 그리고 엔도솜 탈출(endosomal escape)을 위한 지질; (ii) 안정화를 위한 중성 지질; (iii) 안정화를 위한 헬퍼 지질; 및 (iv) 스텔스 지질. 예를 들어, 문헌[Finn 등 (2018) Cell Reports 22:1-9] 및 국제공개 WO 2017/173054 A1호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 소정의 LNP에서, 카고는 가이드 RNA, 또는 가이드 RNA를 인코딩하는 핵산을 포함할 수 있다. 소정의 LNP에서, 카고는 Cas 뉴클레아제, 예컨대 Cas9를 인코딩하는 mRNA, 및 가이드 RNA, 또는 가이드 RNA를 인코딩하는 핵산을 포함할 수 있다.
캡슐화 및 엔도솜 탈출을 위한 지질은 양이온성 지질일 수 있다. 지질은 또한, 생분해성 지질, 예컨대 생분해성 이온화 가능한 지질일 수 있다. 적합한 지질의 일례는 지질 A 또는 LP01이며, 이는 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트라고도 하는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 옥타데카-9,12-디에노에이트이다. 예를 들어, 문헌[Finn 등 (2018) Cell Reports 22:1-9] 및 국제공개 WO 2017/173054 A1호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 적합한 지질의 또 다른 예는 지질 B이며, 이는 ((5-((디메틸아미노)메틸)-1,3-페닐렌)비스(옥시))비스(옥탄-8,1-디일)비스(데카노에이트)라고도 하는 ((5-((디메틸아미노)메틸)-1,3-페닐렌)비스(옥시))비스(옥탄-8,1-디일)비스(데카노에이트)이다. 적합한 지질의 또 다른 예는 지질 C이며, 이는 2-((4-(((3-(디메틸아미노)프로폭시)카르보닐)옥시)헥사데카노일)옥시)프로판-1,3-디일(9Z,9'Z,12Z,12'Z)-비스(옥타데카-9,12-디에노에이트)이다. 적합한 지질의 또 다른 예는 지질 D이며, 이는 3-(((3-(디메틸아미노)프로폭시)카르보닐)옥시)-13-(옥타노일옥시)트리데실 3-옥틸운데카노에이트이다. 다른 적합한 지질은 헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트(Dlin-MC3-DMA(MC3)로도 알려져 있음)를 포함한다.
본원에 기재된 LNP에서 사용하기에 적합한 일부 이러한 지질은 생체내에서 생분해성이다. 예를 들어, 이러한 지질을 포함하는 LNP는 적어도 75%의 지질이 8, 10, 12, 24 또는 48시간, 또는 3, 4, 5, 6, 7 또는 10일 내에 혈장으로부터 청소되는 것을 포함한다. 또 다른 예로, 적어도 50%의 LNP는 8, 10, 12, 24 또는 48시간, 또는 3, 4, 5, 6, 7 또는 10일 내에 혈장으로부터 청소된다.
이러한 지질은 이것이 존재하는 배지의 pH에 따라 이온화 가능할 수 있다. 예를 들어, 약간의 산성 배지에서, 지질은 양성자화(protonate)되어서 양전하를 보유할 수 있다. 대조적으로, 예를 들어, pH가 대략 7.35인 혈액과 같은 약간의 염기성 배지에서, 지질은 양성화되지 않으므로 전하를 보유하지 않을 수 있다. 일부 구현예에서, 지질은 적어도 약 9, 9.5, 또는 10의 pH에서 양성자화될 수 있다. 전하를 보유하는 이러한 지질의 능력은 이의 내인성 pKa와 관련이 있다. 예를 들어, 지질은 독립적으로, 약 5.8 내지 약 6.2 범위의 pKa를 가질 수 있다.
중성 지질은 LNP의 가공을 안정화시키고 향상시키는 작용을 한다. 적합한 중성 지질의 예는 여러 가지 중성, 비하전된 또는 쌍성이온성 지질을 포함한다. 본 개시내용에 사용하기에 적합한 중성 인지질의 예는 5- 헵타데실벤젠-1,3-디올(레조르시놀), 디팔미토일포스파티딜콜린(DPPC), 디스테아로일포스파티딜콜린(DSPC), 포스포콜린(DOPC), 디미리스토일포스파티딜콜린(DMPC), 포스파티딜콜린(PLPC), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DAPC), 포스파티딜에탄올아민(PE), 달걀(egg) 포스파티딜콜린(EPC), 디라우릴로일포스파티딜콜린(DLPC), 디미리스토일포스파티딜콜린(DMPC), 1-미리스토일-2-팔미토일 포스파티딜콜린(MPPC), 1-팔미토일-2-미리스토일 포스파티딜콜린(PMPC), 1-팔미토일-2-스테아로일 포스파티딜콜린(PSPC), 1,2-디아라키도일-sn-글리세로-3-포스포콜린(DBPC), 1-스테아로일-2-팔미토일 포스파티딜콜린(SPPC), 1,2-디에이코세노일-sn-글리세로-3-포스포콜린(DEPC), 팔미토일올레오일 포스파티딜콜린(POPC), 리소포스파티딜 콜린, 디올레오일 포스파티딜에탄올아민(DOPE), 디리놀레오일포스파티딜콜린 디스테아로일포스파티딜에탄올아민(DSPE), 디미리스토일 포스파티딜에탄올아민(DMPE), 디팔미토일 포스파티딜에탄올아민(DPPE), 팔미토일올레오일 포스파티딜에탄올아민(POPE), 리소포스파티딜에탄올아민, 및 이들의 조합을 포함하지만 이들로 제한되지는 않는다. 예를 들어, 중성 인지질은 디스테아로일포스파티딜콜린(DSPC) 및 디미리스토일 포스파티딜 에탄올아민(DMPE)으로 이루어진 군으로부터 선택될 수 있다.
헬퍼 지질은 형질주입을 증강시키는 지질을 포함한다. 헬퍼 지질이 형질주입을 증강시키는 기전은 입자 안정성을 증강시키는 단계를 포함할 수 있다. 소정의 경우, 헬퍼 지질은 막 융합원성(fusogenicity)을 증강시킬 수 있다. 헬퍼 지질은 스테로이드, 스테롤, 및 알킬 레조르시놀을 포함한다. 적합한 헬퍼 지질의 예는 적합한 콜레스테롤, 5-헵타데실레조르시놀, 및 콜레스테롤 헤미숙시네이트를 포함한다. 일례에서, 헬퍼 지질은 콜레스테롤 또는 콜레스테롤 헤미숙시네이트일 수 있다.
스텔스 지질은, 나노입자가 생체내에서 존재할 수 있는 시간의 길이를 변경시키는 지질을 포함한다. 스텔스 지질은 예를 들어, 입자 응집을 감소시키고 입자 크기를 제어함으로써 제형 과정에 일조할 수 있다. 스텔스 지질은 LNP의 약물동력학적 특성을 조절할 수 있다. 적합한 스텔스 지질은 지질 모이어티에 연결된 친수성 헤드 기(head group)를 갖는 지질을 포함한다.
스텔스 지질의 친수성 헤드 기는 예를 들어, PEG(이따금 폴리(에틸렌 옥사이드)로 지칭됨), 폴리(옥사졸린), 폴리(비닐 알코올), 폴리(글리세롤), 폴리(N- 비닐피롤리돈), 폴리아미노산, 및 폴리 N-(2-하이드록시프로필)메타크릴아미드에 기초한 중합체로부터 선택되는 중합체 모이어티를 포함할 수 있다. 용어 PEG는 임의의 폴리에틸렌 글리콜 또는 다른 폴리알킬렌 에테르 중합체를 의미한다. 소정의 LNP 제형에서, PEG는 PEG 2000이라고도 하는 PEG-2K이며, 이는 약 2,000 달톤의 평균 분자량을 갖는다. 예를 들어, 국제공개 WO 2017/173054 A1호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
스텔스 지질의 지질 모이어티는 예를 들어, 독립적으로 약 C4 내지 약 C40 포화된 또는 불포화된 탄소 원자를 포함하는 알킬 사슬 길이를 갖는 디알킬글리세롤 또는 디알킬글리카미드 기를 포함하는 것을 포함하여 디아실글리세롤 또는 디아실글리카미드로부터 유래될 수 있으며, 상기 사슬은 예를 들어, 아미드 또는 에스테르와 같은 하나 이상의 작용기를 포함할 수 있다. 디알킬글리세롤 또는 디알킬글리카미드 기는 하나 이상의 치환된 알킬기를 추가로 포함할 수 있다.
일례로서, 스텔스 지질은 PEG-디라우로일글리세롤, PEG-디미리스토일글리세롤(PEG-DMG), PEG-디팔미토일글리세롤, PEG-디스테아로일글리세롤(PEG-DSPE), PEG-디라우일글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, 및 PEG-디스테아로일글리카미드, PEG-콜레스테롤(l-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복사미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB(3,4-디테트라데콕실벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르), 1,2-디미리스토일-sn- 글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000](PEG2k-DMG), 1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000](PEG2k-DSPE), 1,2-디스테아로일-sn-글리세롤, 메톡시폴리에틸렌 글리콜(PEG2k-DSG), 폴리(에틸렌 글리콜)-2000-디메타크릴레이트(PEG2k-DMA), 및 1,2-디스테아릴옥시프로필-3-아민-N-[메톡시(폴리에틸렌 글리콜)-2000](PEG2k-DSA)으로부터 선택될 수 있다. 하나의 특정 예에서, 스텔스 지질은 PEG2k-DMG일 수 있다.
LNP는 상이한 각각의 몰비의 성분 지질을 제형에 포함할 수 있다. CCD 지질의 몰%는 예를 들어, 약 30 몰% 내지 약 60 몰%, 약 35 몰% 내지 약 55 몰%, 약 40 몰% 내지 약 50 몰%, 약 42 몰% 내지 약 47 몰%, 또는 약 45%일 수 있다. 헬퍼 지질의 몰%는 예를 들어, 약 30 몰% 내지 약 60 몰%, 약 35 몰% 내지 약 55 몰%, 약 40 몰% 내지 약 50 몰%, 약 41 몰% 내지 약 46 몰%, 또는 약 44 몰%일 수 있다. 중성 지질의 몰%는 예를 들어, 약 1 몰% 내지 약 20 몰%, 약 5 몰% 내지 약 15 몰%, 약 7 몰% 내지 약 12 몰%, 또는 약 9 몰%일 수 있다. 스텔스 지질의 몰%는 예를 들어, 약 1 몰% 내지 약 10 몰%, 약 1 몰% 내지 약 5 몰%, 약 1 몰% 내지 약 3 몰%, 약 2 몰%, 또는 약 1 몰%일 수 있다.
LNP는, 캡슐화되는 생분해성 지질의 양으로 하전된 아민기(N)와 핵산의 음으로 하전된 포스페이트기(P) 사이에서 상이한 비를 가질 수 있다. 이는 방정식 N/P에 의해 수학적으로 표시될 수 있다. 예를 들어, N/P 비는 약 0.5 내지 약 100, 약 1 내지 약 50, 약 1 내지 약 25, 약 1 내지 약 10, 약 1 내지 약 7, 약 3 내지 약 5, 약 4 내지 약 5, 약 4, 약 4.5, 또는 약 5일 수 있다. N/P 비는 또한, 약 4 내지 약 7, 또는 약 4.5 내지 약 6일 수 있다. 구체적인 예에서, N/P 비는 4.5일 수 있거나 6일 수 있다.
일부 LNP에서, 카고는 Cas mRNA 및 gRNA를 포함할 수 있다. Cas mRNA 및 gRNA는 상이한 비로 존재할 수 있다. 예를 들어, LNP 제형은 약 25:1 내지 약 1:25 범위, 약 10:1 내지 약 1:10 범위, 약 5:1 내지 약 1:5 범위, 또는 약 1:1의 Cas mRNA : gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:1 내지 약 1:5, 또는 약 10:1의 Cas mRNA : gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:10, 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, 또는 1:25의 Cas mRNA : gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:1 내지 약 1:2의 Cas mRNA : gRNA 핵산의 비를 포함할 수 있다. 구체적인 예에서, Cas mRNA : gRNA의 비는 약 1:1 또는 약 1:2일 수 있다.
일부 LNP에서, 카고는 외인성 공여자 핵산 및 gRNA를 포함할 수 있다. 외인성 공여자 핵산 및 gRNA는 상이한 비로 존재할 수 있다. 예를 들어, LNP 제형은 약 25:1 내지 약 1:25 범위, 약 10:1 내지 약 1:10 범위, 약 5:1 내지 약 1:5 범위, 또는 약 1:1의 외인성 공여자 핵산 : gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:1 내지 약 1:5, 약 5:1 내지 약 1:1, 약 10:1, 또는 약 1:10의 외인성 공여자 핵산 : gRNA 핵산의 비를 포함할 수 있다. 대안적으로, LNP 제형은 약 1:10, 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, 또는 1:25의 외인성 공여자 핵산 : gRNA 핵산의 비를 포함할 수 있다.
적합한 LNP의 구체적인 예는 4.5의 질소-대-포스페이트(N/P) 비를 가지며, 45:44:9:2 몰비의 생분해성 양이온성 지질, 콜레스테롤, DSPC, 및 PEG2k-DMG를 함유한다. 생분해성 양이온성 지질은 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트라고도 하는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 옥타데카-9,12-디에노에이트일 수 있다. 예를 들어, 문헌[Finn 등 (2018) Cell Reports 22:1-9]를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. Cas9 mRNA는 가이드 RNA에 대해 1:1의 중량비로 존재할 수 있다. 적합한 LNP의 또 다른 구체적인 예는 Dlin-MC3-DMA(MC3), 콜레스테롤, DSPC, 및 PEG-DMG를 50:38.5:10:1.5 몰비로 함유한다.
적합한 LNP의 구체적인 또 다른 예는 6의 질소-대-포스페이트(N/P) 비를 가지며, 50:38:9:3 몰비의 생분해성 양이온성 지질, 콜레스테롤, DSPC, 및 PEG2k-DMG를 함유한다. 생분해성 양이온성 지질은 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트라고도 하는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 옥타데카-9,12-디에노에이트일 수 있다. Cas9 mRNA는 가이드 RNA에 대해 1:2의 중량비로 존재할 수 있다.
전달 모드는 면역원성을 저하시키도록 선택될 수 있다. 예를 들어, Cas 단백질 및 gRNA는 상이한 모드에 의해 전달될 수 있다(예를 들어, 쌍봉형(bi-modal) 전달). 이들 상이한 모드는 대상체에게 전달되는 분자(예를 들어, Cas 또는 핵산 인코딩, gRNA 또는 핵산 인코딩, 또는 외인성 공여자 핵산/수선 주형)에게 상이한 약물역학적(pharmacodynamic) 또는 약물동력학적 특성을 부여할 수 있다. 예를 들어, 상이한 모드는 상이한 조직 분포, 상이한 반감기, 또는 상이한 시간적(temporal) 분포를 초래할 수 있다. 일부 전달 모드(예를 들어, 세포에서 자율 복제(autonomous replication) 또는 게놈 통합에 의해 지속되는 핵산 벡터의 전달)는 분자의 더욱 지속적인 발현 및 존재를 초래하는 반면, 다른 모드의 전달은 일시적이고 덜 지속적이다(예를 들어, RNA 또는 단백질의 전달). 예를 들어, Cas 단백질의 더욱 일시적인 방식, mRNA 또는 단백질로서의 전달은, Cas/gRNA 복합체가 단지 단기간 동안 존재하고 활성임을 보장할 수 있고, MHC 분자에 의해 세포의 표면 상에 제시되는 박테리아-유래 Cas 효소로부터의 펩타이드에 의해 야기되는 면역원성을 감소시킬 수 있다. 이러한 일시적인 전달은 또한, 표적-외(off-target) 변형의 가능성을 감소시킬 수 있다.
생체내 투여는 예를 들어, 비경구, 정맥내, 경구, 피하, 동맥내, 두개내, 수막공간내, 복강내, 국소, 비내(intranasal), 또는 근육내를 포함하여 임의의 적합한 경로에 의한 것일 수 있다. 전신 투여 모드는 예를 들어, 경구 및 비경구 경로를 포함한다. 비경구 경로의 예는 정맥내, 동맥내, 골내(intraosseous), 근육내, 피내, 피하, 비내, 및 복강내 경로를 포함한다. 구체적인 예는 정맥내 주입이다. 비내 점적 및 유리체내 주사는 다른 구체적인 예이다. 국소 투여 모드는 예를 들어, 수막공간내, 뇌실내(intracerebroventricular), 실질내(예를 들어, 선조체(striatum)로의 국재화된 실질내 전달(예를 들어, 미상핵(caudate) 내로 또는 조가비핵(putamen) 내로), 대뇌 피질(cerebral cortex), 중심전회(precentral gyrus), 해마(hippocampus)(예를 들어, 치상회(dentate gyrus) 또는 CA3 영역 내로), 측두 피질(temporal cortex), 편도체(amygdala), 전두 피질(frontal cortex), 시상(thalamus), 소뇌(cerebellum), 수질(medulla), 시상하부(hypothalamus), 덮개(tectum), 중뇌피개(tegmentum), 또는 흑색질), 안내(intraocular), 안와내(intraorbital), 결막하(subconjuctival), 유리체내(intravitreal), 망막하(subretinal), 및 경공막(transscleral) 경로를 포함한다. 유의하게 더 소량의 성분(전신 접근법과 비교하여)은 전신적으로(예를 들어, 정맥내로) 전달될 때와 비교하여 국소로(예를 들어, 실질내 또는 유리체내) 투여될 때 효과를 발휘할 수 있다. 국소 투여 모드는 또한, 치료적 유효량의 성분이 전신 투여될 때 발생할 수 있는 잠재적으로 독성 부작용의 발생을 감소시키거나 해소시킬 수 있다.
생체내 투여는 예를 들어, 비경구, 정맥내, 경구, 피하, 동맥내, 두개내, 수막공간내, 복강내, 국소, 비내(intranasal), 또는 근육내를 포함하여 임의의 적합한 경로에 의한 것일 수 있다. 구체적인 예는 정맥내 주입이다. 가이드 RNA 및/또는 Cas 단백질을 포함하는 조성물(또는 가이드 RNA 및/또는 Cas 단백질을 인코딩하는 핵산)은 하나 이상의 생리학적으로 그리고 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 보조제를 사용하여 제형화될 수 있다. 제형은 선택된 투여 경로에 의존할 수 있다. 용어 "약학적으로 허용 가능한"은, 담체, 희석제, 부형제, 또는 보조제가 제형의 다른 성분과 상용성이고 이의 수혜자에게 실질적으로 유해하지 않음을 의미한다.
투여 빈도 및 투약 수는 인성 공여자 핵산, 가이드 RNA, 또는 Cas 단백질(또는 가이드 RNA 또는 Cas 단백질을 인코딩하는 핵산)의 반감기 및 다른 인자 중에서도 투여 경로에 의존할 수 있다. 세포 또는 비-인간 동물 내로의 핵산 또는 단백질의 도입은 기간에 걸쳐 1회 또는 다수 회 수행될 수 있다. 예를 들어, 도입은 기간에 걸쳐 적어도 2회, 기간에 걸쳐 적어도 3회, 기간에 걸쳐 적어도 4회, 기간에 걸쳐 적어도 5회, 기간에 걸쳐 적어도 6회, 기간에 걸쳐 적어도 7회, 기간에 걸쳐 적어도 8회, 기간에 걸쳐 적어도 9회, 기간에 걸쳐 적어도 10회, 적어도 11회, 기간에 걸쳐 적어도 12회, 기간에 걸쳐 적어도 13회, 기간에 걸쳐 적어도 14회, 기간에 걸쳐 적어도 15회, 기간에 걸쳐 적어도 16회, 기간에 걸쳐 적어도 17회, 기간에 걸쳐 적어도 18회, 기간에 걸쳐 적어도 19회, 또는 기간에 걸쳐 적어도 20회 수행될 수 있다.
E. 생체내에서 또는 생체외에서 인간-응고-인자-XII-표적화 시약의 전달, 활성, 또는 효능의 측정
본원에 개시된 방법은 인간-응고-인자-XII-표적화 시약의 활성을 검출하거나 측정하는 단계를 추가로 포함할 수 있다. 이러한 시약의 활성을 측정하는 단계는 예를 들어, 응고 인자 XII 발현 또는 활성 또는 예측된 활성을 측정하는 단계를 포함할 수 있다. 예를 들어, 평가는 응고 또는 트롬빈 생산을 측정하는 단계를 포함할 수 있다. 대안적으로, 평가는 간세포 성장 인자(HGF)-티로신-단백질 키나제 Met(Met) 신호전달 활성(예를 들어, 뉴런에서)에 대한 잠재력을 측정하는 단계, 예컨대 활성 HGF로의 전구-HGF의 전환을 평가하는 단계를 포함할 수 있다.
일례로, 인간-응고-인자-XII-표적화 시약이 게놈 편집 시약(예를 들어, 인간 F12 좌위를 표적화하도록 설계된 CRISPR/Cas)이라면, 측정은 변형을 위해 인간화 F12 좌위를 평가하는 단계를 포함할 수 있다.
다양한 방법은 표적화된 유전적 변형을 갖는 세포를 식별하는 데 사용될 수 있다. 스크리닝은 부모(parental) 염색체의 대립유전자의 변형(MOA: modification-of-allele)을 평가하기 위한 정량적 검정을 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2004/0018626호; 미국 특허출원공개 US 2014/0178879호; 미국 특허출원공개 US 2016/0145646호; 국제공개 WO 2016/081923호; 및 문헌[Frendewey 등 (2010) Methods Enzymol. 476:295-307]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 예를 들어, 정량적 검정은 정량적 PCR, 예컨대 실시간 PCR(qPCR)을 통해 수행될 수 있다. 실시간 PCR은, 표적 좌위를 인식하는 제1 프라이머 세트 및 비-표적화된 기준 좌위를 인식하는 제2 프라이머 세트를 이용할 수 있다. 프라이머 세트는 증폭된 서열을 인식하는 형광 프로브를 포함할 수 있다. 적합한 정량적 검정의 다른 예는 형광-매개 인 시추 혼성화(FISH: fluorescence-mediated in situ hybridization), 비교 게놈 혼성화(comparative genomic hybridization), 등온 DNA 증폭(isothermic DNA amplication), 고정된 프로브(들)에의 정량적 혼성화, INVADER® 프로브, TAQMAN® Molecular Beacon 프로브, 또는 ECLIPSE™ 프로브 기술(예를 들어, US 2005/0144655호를 참조하며, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨)을 포함한다.
차세대 시퀀싱(NGS: next-generation sequencing)이 또한 스크리닝에 사용될 수 있다. 차세대 시퀀싱은 또한 "NGS" 또는 "대규모 병렬 시퀀싱(massively parallel sequencing)" 또는 "고 처리량 시퀀싱(high throughput sequencing)"으로 지칭될 수 있다. NGS는, 표적화된 유전적 변형의 정확한 성질, 그리고 이것이 세포 유형 또는 조직 유형 또는 기관 유형에 걸쳐 일관되는지의 여부를 정의하기 위해 MOA 검정 외에도 스크리닝 툴로서 사용될 수 있다.
비-인간 동물에서 인간화 F12 좌위의 변형을 평가하는 것은 임의의 조직 또는 기관으로부터의 임의의 세포 유형에 있을 수 있다. 예를 들어, 평가는 동일한 조직 또는 기관으로부터의 다수의 세포 유형에서 또는 조직 또는 기관 내의 다수의 위치로부터의 세포에서 수행될 수 있다. 이는, 표적 조직 또는 기관 내의 어떤 세포 유형이 표적화되고 있는지 또는 조직 또는 기관의 어떤 선택이 인간-응고-인자-XII-표적화 시약에 의해 도달되고 있는지에 대한 정보를 제공할 수 있다. 또 다른 예로서, 평가는 다수의 유형의 조직에서 또는 다수의 기관에서 수행될 수 있다. 특정 조직, 기관, 또는 세포 유형이 표적화되는 방법에서, 이는 해당 조직 또는 기관이 얼마나 효과적으로 표적화되는지 그리고 다른 조직 또는 기관에서 표적-외 효과가 존재하는지의 여부에 대한 정보를 제공할 수 있다.
시약이 인간화 F12 좌위를 불활성화시키거나, 인간화 F12 좌위의 발현에 영향을 미치거나, 인간화 F12 mRNA의 번역을 방지하거나, 인간화 응고 인자 XII 단백질을 청소(clear)하도록 설계된다면, 측정은 인간화 F12 mRNA 또는 단백질 발현을 평가하는 단계를 포함할 수 있다. 이러한 측정은 특정 세포 유형 또는 기관(예를 들어, 간 또는 간 내의 특정 세포 유형 또는 영역, 또는 뇌 또는 뇌 내의 특정 세포 유형 또는 영역, 예컨대 해마 피라미드 층(피라미드 뉴런) 및 피질 뉴런) 내에서 수행될 수 있거나, 이러한 측정은 인간화 응고 인자 XII 단백질의 혈청 또는 혈장 수준을 측정하는 단계를 수반할 수 있다.
사용될 수 있는 검정의 일례는 RNASCOPE™ 및 BASESCOPE™ RNA 인시추 혼성화(ISH) 검정이며, 이는 무손상 고정된 조직의 맥락에서 단일 뉴클레오타이드 변화를 포함하여 세포-특이적 편집된 전사물을 정량화할 수 있는 방법이다. BASESCOPE™ RNA ISH 검정은 유전자 편집의 특징화에서 NGS 및 qPCR을 보완할 수 있다. NGS/qPCR이 야생형 서열 및 편집된 서열의 정량적 평균 값을 제공할 수 있는 반면, 이들은 조직 내의 편집된 세포의 이종성(heterogeneity) 또는 백분율에 대한 어떠한 정보도 제공하지 않는다. BASESCOPE™ ISH 검정은 전체 조직의 랜드스케이프 뷰(landscape view) 및 단일-세포 분해능(resolution)을 이용한 야생형 대(versus) 편집된 전사물의 정량화를 제공할 수 있으며, 여기서, 편집된 mRNA 전사물을 함유하는 표적 조직 내의 세포의 실제 수가 정량화될 수 있다. BASESCOPE™ 검정은, 쌍형성된(paired) 올리고("ZZ") 프로브를 사용한 단일-분자 RNA 검출을 달성하여, 비-특이적 배경 없이 신호를 증폭시킨다. 그러나, BASESCOPE™ 프로브 설계 및 신호 증폭 시스템은 ZZ 프로브를 이용한 단일-분자 RNA 검출을 가능하게 하고, 이는 무손상 고정된 조직에서 단일 뉴클레오타이드 편집 및 돌연변이를 차별적으로 검출할 수 있다.
인간화 응고 인자 XII 단백질의 생성 및 분비는 임의의 기지의 수단에 의해 평가될 수 있다. 예를 들어, 발현은 인코딩된 mRNA 또는 인코딩된 단백질의 수준을 비-인간 동물에서 기지의 방법을 사용하여 측정함(예를 들어, 혈장 또는 혈청 수준을 측정함)으로써 평가될 수 있다.
인간화 응고 인자 XII 단백질의 활성은 임의의 기지의 수단에 의해 평가될 수 있다. 이러한 검정은 예를 들어, 칼리크레인으로의 프리칼리크레인의 활성화를 평가하는 단계, FXI의 활성화를 평가하는 단계, HGF로의 전구-HGF의 활성화를 평가하는 단계, 또는 전형적인 보체 경로의 활성화를 평가하는 단계를 포함할 수 있을 것이다.
IV. 인간화 F12 좌위를 포함하는 비-인간 동물의 제조 방법
다양한 방법은 본원 어디에서나 개시된 바와 같은 인간화 응고 인자 XII(F12) 좌위를 포함하는 비-인간 동물 게놈, 비-인간 동물 세포, 또는 비-인간 동물의 제조를 위해 제공된다. 마찬가지로, 다양한 방법은 본원 어디에서나 개시된 바와 같은 인간화 응고 인자 XII(F12) 유전자를 제조하기 위해 또는 인간화 응고 인자 XII(F12) 좌위를 포함하는 비-인간 동물 게놈 또는 비-인간 동물 세포를 제조하기 위해 제공된다. 유전적으로 변형된 유기체를 생성하기 위한 임의의 편리한 방법 또는 프로토콜은 이러한 유전적으로 변형된 비-인간 동물을 생성하는 데 적합하다. 예를 들어, 문헌[Poueymirou 등 (2007) Nat. Biotechnol. 25(1):91-99]; 미국 특허 제7,294,754호; 미국 특허 제7,576,259호; 미국 특허 제7,659,442호; 미국 특허 제8,816,150호; 미국 특허 제9,414,575호; 미국 특허 제9,730,434호; 및 미국 특허 제10,039,269호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다(마우스 ES 세포 및 유전적으로 변형된 마우스를 만들기 위한 VELOCIMOUSE® 방법을 기재함). 예를 들어, 미국 특허출원공개 US 2014/0235933 A1호, 미국 특허출원공개 US 2014/0310828 A1호, 미국 특허 제10,385,359호, 및 미국 특허 제10,329,582호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다(래트 ES 세포 및 유전적으로 변형된 래트를 만들기 위한 방법을 기재함). 또한, 문헌[Cho 등 (2009) Curr. Protoc. Cell. Biol. 42:19.11.1-19.11.22](doi: 10.1002/0471143030.cb1911s42) 및 문헌[Gama Sosa 등 (2010) Brain Struct. Funct. 214(2-3):91-109]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 이러한 유전적으로 변형된 비-인간 동물은 예를 들어, 표적화된 F12 좌위에서 유전자 넉인(gene knock-in)을 통해 생산될 수 있다.
예를 들어, 인간화 F12 좌위를 포함하는 비-인간 동물을 생성하는 방법은 (1) 인간화 F12 좌위를 포함하도록 만능성 세포의 게놈을 변형시키는 단계; (2) 상기 인간화 F12 좌위를 포함하는 유전적으로 변형된 만능성 세포를 식별하거나 선택하는 단계; (3) 상기 유전적으로 변형된 만능성 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (4) 상기 숙주 배아를 대리모에 착상시키고 임신시키는 단계를 포함할 수 있다. 예를 들어, 인간화 F12 좌위를 포함하는 비-인간 동물을 생성하는 방법은 (1) 인간화 F12 좌위를 포함하는 만능성 세포(예를 들어, 배아 줄기(ES) 세포, 예컨대 마우스 ES 세포 또는 래트 ES 세포)를 제공하는 단계; (2) 유전적으로 변형된 만능성 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (3) 상기 숙주 배아를 대리모에 임신시키는 단계를 포함할 수 있다.
또 다른 예로, 인간화 F12 좌위를 포함하는 비-인간 동물을 생성하는 방법은 (1) 인간화 F12 좌위를 포함하도록 만능성 세포(예를 들어, 배아 줄기(ES) 세포, 예컨대 마우스 ES 세포 또는 래트 ES 세포)의 게놈을 변형시키는 단계; (2) 인간화 F12 좌위를 포함하는 유전적으로 변형된 만능성 세포를 식별하거나 선택하는 단계; (3) 상기 유전적으로 변형된 만능성 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및 (4) 상기 숙주 배아를 대리모에 임신시키는 단계를 포함할 수 있다. 공여자 세포는 임의의 단계, 예컨대 배반포 단계 또는 상실배-전(pre-morula) 단계(즉, 4-세포 단계 또는 8-세포 단계)의 숙주 배아 내로 도입될 수 있다. 선택적으로, 변형된 만능성 세포(예를 들어, 비-인간 ES 세포)를 포함하는 숙주 배아는, F0 비-인간 동물을 생성하기 위해 대리모 내로 착상되고 임신되기 전에 배반포 단계까지 인큐베이션될 수 있다. 그 후에, 대리모는 인간화 F12 좌위를 포함하는(그리고 생식세포계를 통해 유전적 변형을 전할 수 있는) F0 세대 비-인간 동물을 생성할 수 있다.
상기 방법은 변형된 표적 게놈 좌위를 갖는 세포 또는 동물을 식별하는 단계를 추가로 포함할 수 있다. 다양한 방법은 표적화된 유전적 변형을 갖는 세포 및 동물을 식별하는 데 사용될 수 있다.
대안적으로, 본원 어디에서나 기재된 비-인간 동물을 생성하는 방법은 (1) 만능성 세포를 변형시키기 위해 상기 기재된 방법을 사용하여, 인간화 F12 좌위를 포함하도록 1-세포 단계 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 선택하는 단계; 및 (3) 상기 유전적으로 변형된 배아를 대리모에 임신시키는 단계를 포함할 수 있다. 생식세포계를 통해 유전적 변형을 전할 수 있는 자손이 생산된다.
핵 이전 기법은 또한 비-인간 포유류 동물을 생산하는 데 사용될 수 있다. 간략하게는, 핵 이전 방법은 (1) 난모세포를 제핵화(enucleating)시키거나 제핵된 난모세포를 제공하는 단계; (2) 제핵된 난모세포와 조합될 공여자 세포 또는 핵을 단리하거나 제공하는 단계; (3) 상기 세포 또는 핵을 제핵된 난모세포 내로 삽입하여, 재구성된 세포를 형성하는 단계; (4) 상기 재구성된 세포를 동물의 자궁(womb) 내로 착상시켜, 배아를 형성하는 단계; 및 (5) 상기 배아를 발달시키는 단계를 포함할 수 있다. 이러한 방법에서, 난모세포는 일반적으로 사망한 동물로부터 회수되지만, 이들 난모세포는 또한 살아 있는 동물의 난관(oviduct) 및/또는 난소로부터 단리될 수 있다. 난모세포는 제핵 전에 여러 가지 잘 알려진 배지에서 성숙화될 수 있다. 난모세포의 제핵은 많은 잘 알려진 방식으로 수행될 수 있다. 재구성된 세포를 형성하기 위한, 제핵된 난모세포 내로의 공여자 세포 또는 핵의 삽입은 융합 전 투명대(zona pellucida) 하에 공여자 세포의 현미주사에 의해 수행될 수 있다. 융합은 접촉/융합 평면에 걸친 DC 전기 펄스의 적용(전기융합(electrofusion))에 의해, 융합-촉진 화학물질, 예컨대 폴리에틸렌 글리콜에의 세포의 노출에 의해, 또는 불활성화된 바이러스, 예컨대 센다이 바이러스(Sendai virus)에 의해 유도될 수 있다. 재구성된 세포는 핵 공여자와 수혜자 난모세포의 융합 전에, 동안에, 그리고/또는 후에 전기적 수단 및/또는 비-전기적 수단에 의해 활성화될 수 있다. 활성화 방법은 전기적 펄스, 화학적으로 유도된 충격, 정자에 의한 침투, 난모세포에서 2가 양이온의 수준 증가, 및 난모세포에서 세포 단백질의 인산화의 감소(키나제 저해제에 의함)를 포함한다. 활성화된 재구성된 세포, 또는 배아는 잘 알려진 배지에서 배양된 다음, 동물의 자궁으로 이전될 수 있다. 예를 들어, 미국 특허출원공개 US 2008/0092249호, WO 1999/005266호, 미국 특허출원공개 US 2004/0177390호, WO 2008/017234호, 및 미국 특허 제7,612,250호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
변형된 세포 또는 1-세포 단계 배아는 예를 들어, (a) 예를 들어, 5' 및 3' 표적 부위(예를 들어, 결실 및 삽입물 핵산으로의 대체를 위해 의도된 내인성 서열을 플랭킹하는 표적 부위)에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산을 포함하는 하나 이상의 외인성 공여자 핵산(예를 들어, 표적화 벡터)을 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 인간 F12 서열을 포함하여 인간화 F12 좌위를 생성하는, 단계; 및 (b) 내인성 F12 좌위에 통합된 삽입물 핵산을 게놈에 포함하는 적어도 하나의 세포를 식별하는 단계(즉, 인간화 F12 좌위를 포함하는 적어도 하나의 세포를 식별하는 단계)에 의한 재조합을 통해 생산될 수 있다. 마찬가지로, 변형된 비-인간 동물 게놈 또는 인간화 비-인간 동물 F12 유전자는 예를 들어, (a) 예를 들어, 5' 및 3' 표적 부위(예를 들어, 결실 및 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산(예를 들어, 인간화 F12 좌위를 생성하기 위해 인간 F12 서열을 포함함)으로의 대체를 위해 의도된 내인성 서열을 플랭킹하는 표적 부위)에 상응하는 5' 및 3' 상동성 아암을 포함하는 하나 이상의 외인성 공여자 핵산(예를 들어, 표적화 벡터)를 게놈 또는 유전자와 접촉시키는 단계로서, 상기 외인성 공여자 핵산은 내인성 비-인간 동물 F12 좌위의 인간화를 위해 설계되는 단계에 의한 재조합을 통해 생산될 수 있다.
대안적으로, 변형된 만능성 세포 또는 1-세포 단계 배아는 (a) (i) 뉴클레아제 제제로서, 상기 뉴클레아제 제제는 내인성 F12 좌위 내의 표적 부위에서 닉 또는 이중-가닥 절단부를 유도하는, 뉴클레아제 제제; 및 (ii) 예를 들어, 5' 및 3' 표적 부위(예를 들어, 결실 및 삽입물 핵산으로의 대체를 위해 의도된 내인성 서열을 플랭킹하는 표적 부위)에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산을 포함하는 하나 이상의 외인성 공여자 핵산(예를 들어, 표적화 벡터)을 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 인간 F12 서열을 포함하여 인간화 F12 좌위를 생성하는, 단계; 및 (c) 내인성 F12 좌위에 통합된 삽입물 핵산을 게놈에 포함하는 적어도 하나의 세포를 식별하는 단계(즉, 인간화 F12 좌위를 포함하는 적어도 하나의 세포를 식별하는 단계)에 의해 생산될 수 있다. 마찬가지로, 변형된 비-인간 동물 게놈 또는 인간화 비-인간 동물 F12 유전자는 (i) 뉴클레아제 제제로서, 상기 뉴클레아제 제제는 내인성 F12 좌위 또는 유전자 내의 표적 부위에서 닉 또는 이중-가닥 절단부를 유도하는, 뉴클레아제 제제; 및 (ii) 예를 들어, 5' 및 3' 표적 부위(예를 들어, 결실 및 삽입물 핵산으로의 대체를 위해 의도된 내인성 서열을 플랭킹하는 표적 부위)에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산(예를 들어, 인간화 F12 좌위를 생성하기 위해 인간 F12 서열을 포함함)을 포함하는 하나 이상의 외인성 공여자 핵산(예를 들어, 표적화 벡터)을 게놈 또는 유전자와 접촉시킴으로써 생산될 수 있으며, 상기 외인성 공여자 핵산은 내인성 F12 좌위의 인간화를 위해 설계된다. 닉 또는 이중-가닥 절단부를 요망되는 인식 부위 내로 유도하는 임의의 뉴클레아제 제제가 사용될 수 있다. 적합한 뉴클레아제의 예는 전사 활성자-유사 이펙터 뉴클레아제(TALEN), 아연-핑거 뉴클레아제(ZFN), 메가뉴클레아제, 및 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR)/CRISPR-관련(Cas) 시스템(예를 들어, CRISPR/Cas9 시스템) 또는 이러한 시스템의 구성요소(예를 들어, CRISPR/Cas9)를 포함한다. 예를 들어, 미국 특허출원공개 US 2013/0309670호 및 미국 특허출원공개 US 2015/0159175호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 일례에서, 뉴클레아제는 Cas9 단백질 및 가이드 RNA를 포함한다. 또 다른 예에서, 뉴클레아제는 Cas9 단백질 및 2개 이상, 3개 이상, 또는 4개 이상의 가이드 RNA를 포함한다.
게놈을 변형시키는 단계는 예를 들어, 외인성 수선 주형 또는 공여자 핵산(예를 들어, 표적화 벡터)을 이용하여, 본원에 개시된 인간화 F12 좌위를 포함하도록 F12 좌위를 변형시킬 수 있다. 일례로서, 표적화 벡터는 내인성 F12 좌위(예를 들어, 내인성 비-인간 동물 F12 좌위)에서 인간화 F12 유전자를 생산하기 위한 것일 수 있으며, 상기 표적화 벡터는 내인성 F12 좌위에서 5' 표적 서열을 표적화하는 5' 상동성 아암과 내인성 F12 좌위에서 3' 표적 서열을 표적화하는 3' 상동성 아암에 플랭킹되는 F12 좌위에 통합될 인간 F12 서열을 포함하는 핵산 삽입물을 포함한다. F12 좌위에서 핵산 삽입물의 통합은 상기 F12 좌위에의 관심 핵산 서열의 첨가, 상기 F12 좌위에서 관심 핵산 서열의 결실, 또는 상기 F12 좌위에서 관심 핵산 서열의 대체를 초래할 수 있다. 상동성 아암은 인간 F12 서열을 포함하는 삽입물 핵산을 플랭킹하여 인간화 F12 좌위를 생산할 수 있다(예를 들어, 내인성 F12 좌위의 분절을 결실시키고 이종상동성 인간 F12 서열을 대체하기 위함).
외인성 수선 주형 또는 공여자 핵산은 비-상동성-말단-접합-매개 삽입 또는 상동성 재조합을 위한 것일 수 있다. 외인성 수선 주형 또는 공여자 핵산은 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함할 수 있으며, 이들 핵산은 단일-가닥 또는 이중-가닥일 수 있고, 이들 핵산은 선형 또는 원형 형태일 수 있다. 예를 들어, 수선 주형은 단일-가닥 올리고데옥시뉴클레오타이드(ssODN)일 수 있다.
외인성 공여자 핵산은 또한 비표적화된 내인성 F12 좌위에 존재하지 않는 이종성 서열을 포함할 수 있다. 예를 들어, 외인성 공여자 핵산은 선택 카세트, 예컨대 재조합효소 인식 부위들에 플랭킹되는 선택 카세트를 포함할 수 있다.
일부 외인성 공여자 핵산은 상동성 아암을 포함한다. 외인성 공여자 핵산이 또한 핵산 삽입물을 포함한다면, 상동성 아암은 핵산 삽입물을 플랭킹할 수 있다. 기준의 용이성을 위해, 상동성 아암은 본원에서 5' 및 3'(즉, 업스트림 및 다운스트림) 상동성 아암으로 지칭된다. 이 용어는 외인성 공여자 핵산 내의 핵산 삽입물에 대한 상동성 아암의 상대 위치에 관한 것이다. 5' 및 3' 상동성 아암은 F12 좌위 내의 영역에 상응하며, 이는 본원에서 각각 "5' 표적 서열" 및 "3' 표적 서열"로 지칭된다.
상동성 아암 및 표적 서열은, 2개의 영역이 서로 충분한 수준의 서열 동일성을 공유하여 상동성 재조합 반응에 대한 기질로서 작용할 때 서로 "상응한다" 또는 "상응하고" 있다. 용어 "상동성"은 상응하는 서열에 대해 동일하거나 서열 동일성을 공유하는 DNA 서열을 포함한다. 주어진 표적 서열과 외인성 공여자 핵산에서 확인된 상응하는 상동성 아암 사이의 서열 동일성은 상동성 재조합이 발생하게 하는, 서열 동일성의 임의의 정도일 수 있다. 예를 들어, 외인성 공여자 핵산(또는 이의 단편)의 상동성 아암 및 표적 서열(또는 이의 단편)에 의해 공유되는 서열 동일성의 양은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성일 수 있으며, 따라서 서열은 상동성 재조합을 수행한다. 더욱이, 상동성 아암과 상응하는 표적 서열 사이의 상동성의 상응하는 영역은 상동성 재조합을 촉진하기에 충분한 임의의 길이일 수 있다. 일부 표적화 벡터에서, 내인성 F12 좌위에서의 의도된 돌연변이는 상동성 아암들에 플랭킹되는 삽입물 핵산에 포함된다.
1-세포 단계 배아 이외의 세포에서, 외인성 공여자 핵산은 "큰 표적화 벡터" 또는 "LTVEC"일 수 있으며, 이러한 벡터는, 세포에서 상동성 재조합을 수행하도록 의도된 다른 접근법에 의해 전형적으로 사용되는 것보다 더 큰 핵산 서열에 상응하고 이로부터 유래되는 상동성 아암을 포함하는 표적화 벡터를 포함한다. 예를 들어, 미국 특허출원 공개 US 2004/0018626호; 국제공개 WO 2013/163394호; 미국 특허 제9,834,786호; 미국 특허 제10,301,646호; 국제공개 WO 2015/088643호; 미국 특허 제9,228,208호; 미국 특허 제9,546,384호; 미국 특허 제10,208,317호; 및 미국 특허출원 공개 US 2019-0112619호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. LTVEC는 또한, 세포에서 상동성 재조합을 수행하도록 의도된 다른 접근법에 의해 전형적으로 사용되는 것보다 더 큰 핵산 서열을 갖는 핵산 삽입물을 포함하는 표적화 벡터를 포함한다. 예를 들어, LTVEC는 이의 크기 제한때문에 전형적인 플라스미드-기초 표적화 벡터에 의해 수용될 수 없는 큰 좌위의 변형을 가능하게 한다. 예를 들어, 표적화된 좌위는, 종래의 방법을 사용하여 표적화 가능하지 않거나 뉴클레아제 제제(예를 들어, Cas 단백질)에 의해 유도되는 닉 또는 이중-가닥 절단부의 부재 하에 단지 올바르지 않게 또는 단지 유의하게 낮은 효율로 표적화될 수 있는 세포의 좌위일 수 있다(즉, 5' 상동성 아암 및 3' 상동성 아암은 이에 상응할 수 있음). LTVEC는 임의의 길이일 수 있고, 전형적으로 적어도 10 kb 길이이다. LTVEC 내 5' 상동성 아암 및 3' 상동성 아암의 총 합계는 전형적으로 적어도 10 kb이다. VELOCIGENE® 유전적 조작 기술을 사용하는 박테리아 상동성 재조합(BHR) 반응을 통해 박테리아 인공 염색체(BAC) DNA로부터 유래된 큰 표적화 벡터(LTVEC)의 생산 및 용도는 예를 들어, 미국 특허 제6,586,251호 및 문헌[Valenzuela 등 (2003) Nat. Biotechnol. 21(6):652-659]에 기재되어 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 시험관내 어셈블리 방법을 통한 LTVEC의 생산은 예를 들어, 미국 특허출원공개 US 2015/0376628호 및 국제공개 WO 2015/200334호에 기재되어 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
상기 방법은 변형된 표적 게놈 좌위를 갖는 세포 또는 동물을 식별하는 단계를 추가로 포함할 수 있다. 다양한 방법은 표적화된 유전적 변형을 갖는 세포 및 동물을 식별하는 데 사용될 수 있다. 스크리닝 단계는 예를 들어, 부모 염색체의 대립유전자의 변형(MOA)을 평가하기 위한 정량적 검정을 포함할 수 있다. 예를 들어, 미국 특허출원공개 US 2004/0018626호; 미국 특허출원공개 US 2014/0178879호; 미국 특허출원공개 US 2016/0145646호; 국제공개 WO 2016/081923호; 및 문헌[Frendewey 등 (2010) Methods Enzymol. 476:295-307]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 예를 들어, 정량적 검정은 정량적 PCR, 예컨대 실시간 PCR(qPCR)을 통해 수행될 수 있다. 실시간 PCR은, 표적 좌위를 인식하는 제1 프라이머 세트 및 비-표적화된 기준 좌위를 인식하는 제2 프라이머 세트를 이용할 수 있다. 프라이머 세트는 증폭된 서열을 인식하는 형광 프로브를 포함할 수 있다.
적합한 정량적 검정의 다른 예는 형광-매개 인 시추 혼성화(FISH), 비교 게놈 혼성화(comparative genomic hybridization), 등온 DNA 증폭(isothermic DNA amplication), 고정된 프로브(들)에의 정량적 혼성화, INVADER® 프로브, TAQMAN® Molecular Beacon 프로브, 또는 ECLIPSE™ 프로브 기술(예를 들어, US 2005/0144655호를 참조하며, 그 전체가 모든 목적을 위해 본원에 참조로서 포함됨)을 포함한다.
적합한 만능성 세포의 일례는 배아 줄기(ES)세포(예를 들어, 마우스 ES 세포 또는 래트 ES 세포)이다. 변형된 만능성 세포는 예를 들어, (a) 예를 들어, 5' 및 3' 표적 부위에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산을 포함하는 하나 이상의 외인성 공여자 핵산(예를 들어, 표적화 벡터)을 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 인간 F12 서열을 포함하여 인간화 F12 좌위를 생성하는, 단계; 및 (b) 내인성 F12 좌위에 통합된 삽입물 핵산을 게놈에 포함하는 적어도 하나의 세포를 식별하는 단계(즉, 인간화 F12 좌위를 포함하는 적어도 하나의 세포를 식별하는 단계)에 의한 재조합을 통해 생산될 수 있다. 변형된 만능성 세포는 예를 들어, (a) 5' 및 3' 표적 부위에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산을 포함하는 하나 이상의 표적화 벡터를 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 인간화 F12 좌위를 포함하는, 단계; 및 (b) 표적 게놈 좌위에 통합된 삽입물 핵산을 게놈에 포함하는 적어도 하나의 세포를 식별하는 단계에 의한 재조합을 통해 생산될 수 있다.
대안적으로, 변형된 만능성 세포는 (a) (i) 뉴클레아제 제제로서, 상기 뉴클레아제 제제는 내인성 F12 좌위 내의 표적 부위에서 닉 또는 이중-가닥 절단부를 유도하는, 뉴클레아제 제제; 및 (ii) 예를 들어, 뉴클레아제 표적 부위에 충분히 근접하게 놓이는 5' 및 3' 표적 부위에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산을 선택적으로 포함하는 하나 이상의 외인성 공여자 핵산(예를 들어, 표적화 벡터)을 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 인간 F12 서열을 포함하여 인간화 F12 좌위를 생성하는, 단계; 및 (c) 내인성 F12 좌위에 통합된 삽입물 핵산을 게놈에 포함하는 적어도 하나의 세포를 식별하는 단계(즉, 인간화 F12 좌위를 포함하는 적어도 하나의 세포를 식별하는 단계)에 의해 생산될 수 있다. 대안적으로, 변형된 만능성 세포는 (a) (i) 뉴클레아제 제제로서, 상기 뉴클레아제 제제는 표적 게놈 좌위 내의 인식 부위에서 닉 또는 이중-가닥 절단부를 유도하는, 뉴클레아제 제제; 및 (ii) 상기 인식 부위에 충분히 근접하게 놓이는 5' 및 3' 표적 부위에 상응하는 5' 및 3' 상동성 아암에 플랭킹되는 삽입물 핵산을 포함하는 하나 이상의 표적화 벡터를 세포 내로 도입하는 단계로서, 상기 삽입물 핵산은 인간화 F12 좌위를 포함하는, 단계; 및 (c) 표적 게놈 좌위에 변형(예를 들어, 삽입물 핵산의 통합)을 포함하는 적어도 하나의 세포를 식별하는 단계에 의해 생산될 수 있다. 닉 또는 이중-가닥 절단부를 요망되는 인식 부위 내로 유도하는 임의의 뉴클레아제 제제가 사용될 수 있다. 적합한 뉴클레아제의 예는 전사 활성자-유사 이펙터 뉴클레아제(TALEN), 아연-핑거 뉴클레아제(ZFN), 메가뉴클레아제, 및 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR)/CRISPR-관련(Cas) 시스템(예를 들어, CRISPR/Cas9 시스템) 또는 이러한 시스템의 구성요소(예를 들어, CRISPR/Cas9)를 포함한다. 예를 들어, 미국 특허출원공개 US 2013/0309670호 및 미국 특허출원공개 US 2015/0159175호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
공여자 세포는 임의의 단계, 예컨대 배반포 단계 또는 상실배-전 단계(즉, 4-세포 단계 또는 8-세포 단계)의 숙주 배아 내로 도입될 수 있다. 생식세포계를 통해 유전적 변형을 전할 수 있는 자손이 생산된다. 예를 들어, 미국 특허 제7,294,754호를 참조하며, 이는 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다.
대안적으로, 본원 어디에서나 기재된 비-인간 동물을 생성하는 방법은 (1) 만능성 세포를 변형시키기 위해 상기 기재된 방법을 사용하여, 인간화 F12 좌위를 포함하도록 1-세포 단계 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 선택하는 단계; 및 (3) 상기 유전적으로 변형된 배아를 대리모 내로 착상시키고 임신시키는 단계를 포함할 수 있다. 대안적으로, 본원 어디에서나 기재된 비-인간 동물을 생성하는 방법은 (1) 만능성 세포를 변형시키기 위해 상기 기재된 방법을 사용하여, 인간화 F12 좌위를 포함하도록 1-세포 단계 배아의 게놈을 변형시키는 단계; (2) 유전적으로 변형된 배아를 선택하는 단계; 및 (3) 상기 유전적으로 변형된 배아를 대리모에 임신시키는 단계를 포함할 수 있다. 생식세포계를 통해 유전적 변형을 전할 수 있는 자손이 생산된다.
핵 이전 기법은 또한 비-인간 포유류 동물을 생산하는 데 사용될 수 있다. 간략하게는, 핵 이전 방법은 (1) 난모세포를 제핵화시키거나 제핵된 난모세포를 제공하는 단계; (2) 제핵된 난모세포와 조합될 공여자 세포 또는 핵을 단리하거나 제공하는 단계; (3) 상기 세포 또는 핵을 제핵된 난모세포 내로 삽입하여, 재구성된 세포를 형성하는 단계; (4) 상기 재구성된 세포를 동물의 자궁 내로 착상시켜, 배아를 형성하는 단계; 및 (5) 상기 배아를 발달시키는 단계를 포함할 수 있다. 이러한 방법에서, 난모세포는 일반적으로 사망한 동물로부터 회수되지만, 이들 난모세포는 또한 살아 있는 동물의 난관 및/또는 난소로부터 단리될 수 있다. 난모세포는 제핵 전에 여러 가지 잘 알려진 배지에서 성숙화될 수 있다. 난모세포의 제핵은 많은 잘 알려진 방식으로 수행될 수 있다. 재구성된 세포를 형성하기 위한, 제핵된 난모세포 내로의 공여자 세포 또는 핵의 삽입은 융합 전 투명대 하에 공여자 세포의 현미주사에 의해 수행될 수 있다. 융합은 접촉/융합 평면에 걸친 DC 전기 펄스의 적용(전기융합)에 의해, 융합-촉진 화학물질, 예컨대 폴리에틸렌 글리콜에의 세포의 노출에 의해, 또는 불활성화된 바이러스, 예컨대 센다이 바이러스에 의해 유도될 수 있다. 재구성된 세포는 핵 공여자와 수혜자 난모세포의 융합 전에, 동안에, 그리고/또는 후에 전기적 수단 및/또는 비-전기적 수단에 의해 활성화될 수 있다. 활성화 방법은 전기적 펄스, 화학적으로 유도된 충격, 정자에 의한 침투, 난모세포에서 2가 양이온의 수준 증가, 및 난모세포에서 세포 단백질의 인산화의 감소(키나제 저해제에 의함)를 포함한다. 활성화된 재구성된 세포, 또는 배아는 잘 알려진 배지에서 배양된 다음, 동물의 자궁으로 이전될 수 있다. 예를 들어, 미국 특허출원공개 US 2008/0092249호, 국제공개 WO 1999/005266호, 미국 특허출원공개 US 2004/0177390호, 국제공개 WO 2008/017234호, 및 미국 특허 제7,612,250호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
본원에 제공된 다양한 방법은 유전적으로 변형된 비-인간 F0 동물의 생산을 가능하게 하며, 상기 유전적으로 변형된 F0 동물의 세포는 인간화 F12 좌위를 포함한다. F0 동물을 생산하기 위해 사용되는 방법에 따라, 인간화 F12 좌위를 갖는 F0 동물 내의 세포의 수는 다양할 것으로 인식된다. 마우스를 이용하여, 예를 들어, VELOCIMOUSE® 방법을 통한 예를 들어, 상응하는 유기체로부터의 상실배-전 단계 배아(예를 들어, 8-세포 단계 마우스 배아) 내로의 공여자 ES 세포의 도입은 F0 마우스의 더 큰 백분율의 세포 집단이 표적화된 유전적 변형을 포함하는 관심 뉴클레오타이드 서열을 갖는 세포를 포함하는 것을 가능하게 한다. 예를 들어, 적어도 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의, 비-인간 F0 동물의 세포적 기여(cellular contribution)는 표적화된 변형을 갖는 세포 집단을 포함할 수 있다.
유전적으로 변형된 F0 동물의 세포는 인간화 F12 좌위에 대해 이형접합성일 수 있거나 인간화 F12 좌위에 대해 동형접합성일 수 있다.
V. 짧은 F12 이소형을 평가하거나 사용하는 방법
인간 뉴런 세포에서 발현되는 짧은 응고 인자 XII 이소형을 평가하거나 사용하는 다양한 방법이 제공된다. 실시예 3에 기재된 바와 같이, 짧은 FXII 이소형은 엑손 1 내지 6에 대한 프로브에 의해서가 아니라 엑손 11 내지 14에 대한 프로브에 의해 검출되는 F12 mRNA에 의해 인코딩될 수 있다. 구체적인 예에서, 짧은 이소형은 FXII의 프롤린-풍부 및 촉매적 도메인을 함유하는 단백질인 FXII297-596(M297-S596; SEQ ID NO: 75에 의해 인코딩되는 SEQ ID NO: 74)일 수 있다.
평가는 예를 들어, 생물학적 시료에서 짧은 이소형의 발현을 측정하거나 짧은 이소형의 활성을 측정하는 단계를 포함할 수 있다. 짧은 이소형의 발현은 엑손 9, 10, 11, 12, 13, 또는 14에 대한 프라이머 및/또는 프로브(예를 들어, 정량적 PCR), 예컨대 엑손 11 내지 14에 대한 프로브를 사용함으로써 mRNA 수준에서 측정될 수 있다. 이는 엑손 1, 2, 3, 4, 5, 또는 6에 대한 프로브와 비교하여 수행될 수 있으며, 이는 짧은 이소형을 검출하지 않을 것이다. 대안적으로, 짧은 이소형의 발현은 엑손 7, 8, 9, 10, 11, 12, 13, 또는 14에 대한 프라이머 및/또는 프로브(예를 들어, 정량적 PCR), 예컨대 엑손 11 내지 14에 대한 프로브를 사용함으로써 mRNA 수준에서 측정될 수 있다. 이는 엑손 1, 2, 3, 4, 5, 또는 6에 대한 프로브와 비교하여 수행될 수 있으며, 이는 짧은 이소형을 검출하지 않을 것이다. 대안적으로, 짧은 이소형의 발현은 엑손 9, 10, 11, 12, 13, 또는 14에 대한 프라이머 및/또는 프로브(예를 들어, 정량적 PCR), 예컨대 엑손 11 내지 14에 대한 프로브를 사용함으로써 mRNA 수준에서 측정될 수 있다. 이는 엑손 1, 2, 3, 4, 5, 6, 7, 또는 8에 대한 프로브와 비교하여 수행될 수 있으며, 이는 짧은 이소형을 검출하지 않을 수 있다. 예를 들어, 이러한 방법은 상기 기재된 바와 같은 F12 유전자의 엑손에 대한 프라이머 및/또는 프로브를 사용하여 RNA 전사물을 검출하고 정량화하는 단계를 포함할 수 있다. 이는 예를 들어, 역전사 PCR(RT-PCR) 또는 정량적 PCR(예를 들어, RT-qPCR)을 포함할 수 있다. RT-qPCR에서, RNA 전사물은 우선 이러한 RNA 전사물을 cDNA로 역전사시킴으로써 정량화되며, 그런 다음 qPCR이 후속적으로 수행된다. 표준 PCR에서와 같이, DNA는 3개의 반복 단계: 변성, 어닐링 및 신장에 의해 증폭된다. 그러나, qPCR에서, 형광 표지는 PCR이 진행됨에 따라 데이터의 수집을 가능하게 한다.
짧은 이소형의 활성의 평가는 예를 들어, 간세포 성장 인자(HGF)-티로신-단백질 키나제 Met(Met) 신호전달 활성(예를 들어, 뉴런에서)에 대한 잠재력을 측정하는 단계, 예컨대 활성 HGF로의 전구-HGF의 전환을 평가하는 단계를 포함할 수 있다. 이러한 검정은 또한 예를 들어, 칼리크레인으로의 프리칼리크레인의 활성화를 평가하는 단계, FXI의 활성화를 평가하는 단계, HGF로의 전구-HGF의 활성화를 평가하는 단계, 또는 전형적인 보체 경로의 활성화를 평가하는 단계를 포함할 수 있을 것이다.
평가(예를 들어, 발현 또는 활성의 측정)는 임의의 생물학적 시료, 예컨대 임의의 기관, 조직 유형, 또는 세포 유형에서 수행될 수 있다. 예를 들어, 발현의 측정은 뇌, 예컨대 뉴런(예를 들어, 피라미드 뉴런 또는 피질 뉴런)에서 수행될 수 있다. 기관, 조직, 또는 세포는 인간으로부터의 것일 수 있거나, 이는 비-인간 동물(예를 들어, 본원 어디에서나 상세히 기재된 바와 같은 인간화 F12 좌위를 갖는 비-인간 동물)로부터의 것일 수 있다.
상기 또는 아래에 인용된 모든 특허출원, 웹사이트, 기타 간행물, 수탁 번호 등은 각 개별 항목이 구체적으로 및 개별적으로 참조로서 그렇게 포함되는 것으로 표시된 것과 동일한 정도로 모든 목적을 위해 그 전체내용이 참조로서 본원에 포함된다. 상이한 버전들의 서열이 다양한 시점에서 특정 수탁 번호와 연관되는 경우, 본원의 유효 출원일에서의 수탁 번호와 연관된 버전을 의미한다. 유효 출원일은, 해당되는 경우 수탁 번호를 언급하는 우선권 출원의 출원일 또는 실제 출원일 중 더 빠른 날짜를 의미한다. 마찬가지로 상이한 버전들의 간행물, 웹사이트 등이 다양한 시점에서 공개된 경우, 달리 지시되지 않는 한, 본원의 유효 출원일에서 가장 최근에 공개된 버전을 의미한다. 본 발명의 임의의 특징, 단계, 요소, 구현예, 또는 양태는 달리 구체적으로 표시되지 않는 한 임의의 다른 것과 조합하여 사용될 수 있다. 명확성과 이해의 목적을 위해 예시 및 실시예를 통해 상기 구현예는 어느 정도 상세하게 기재되었지만, 첨부된 청구범위의 범위 내에서 특정 변경 및 변형이 실시될 수 있다는 것이 당업자에게 명백할 것이다.
서열의 간단한 설명
첨부된 서열 목록에서 나열된 뉴클레오타이드 서열 및 아미노산 서열은 뉴클레오타이드 염기에 대해서는 표준 글자 약어, 및 아미노산에 대해서는 3-글자 코드를 사용하여 제시된다. 뉴클레오타이드 서열은 서열의 5' 단부에서 시작하여 3' 단부까지 포워드로(즉, 각각의 선(line)에서 좌측으로부터 우측으로) 진행되는 표준 관계를 따른다. 각각의 뉴클레오타이드 서열의 단지 1개 가닥만 제시되지만, 상보적 가닥은 표시된 가닥에 대한 임의의 참조에 의해 포함되어 있는 것으로 이해된다. 아미노산 서열을 인코딩하는 뉴클레오타이드 서열이 제공될 때, 동일한 아미노산 서열을 인코딩하는 이의 코돈 축퇴(codon degenerate) 변이체가 또한 제공되는 것으로 이해된다. 아미노산 서열은 서열의 아미노 말단에서 시작하여 카르복시 말단까지 포워드로(즉, 각각의 선에서 좌측으로부터 우측으로) 진행되는 표준 관계를 따른다.
Figure pct00002
Figure pct00003
실시예
실시예 1. 인간화 응고 인자 XII( F12 ) 좌위를 포함하는 마우스의 생산
마우스 F12 유전자로부터의 8.6 kb(8,670 bp)의 영역을 7.2 kb(7,236 bp)의 F12의 상응하는 인간 서열(게놈 빌드(build) GRCh38/hg38로부터)로 대체하기 위해 62.4 kb의 마우스 F12 좌위(게놈 빌드 GRCm38/mm10으로부터)를 포함하는 5' 상동성 아암 및 107.2 kb의 마우스 F12 좌위(게놈 빌드 GRCm38/mm10으로부터)를 포함하는 3' 상동성 아암을 포함하는 큰 표적화 벡터(LTVEC)를 생산하였다. 마우스 및 인간 F12에 대한 정보는 표 3에 제공된다. LTVEC에 대한 정보는 표 4에 제공된다. VELOCIGENE® 유전적 조작 기술을 사용하는 박테리아 상동성 재조합(BHR) 반응을 통해 박테리아 인공 염색체(BAC) DNA로부터 유래된 큰 표적화 벡터(LTVEC)의 생산 및 용도는 예를 들어, 미국 특허 제6,586,251호 및 문헌[Valenzuela 등 (2003) Nat. Biotechnol. 21(6):652-659]에 기재되어 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 시험관내 어셈블리 방법을 통한 LTVEC의 생산은 예를 들어, 미국 특허출원공개 US 2015/0376628호 및 국제공개 WO 2015/200334호에 기재되어 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
Figure pct00004
Figure pct00005
구체적으로, ATG 개시 코돈으로부터 정지 코돈을 통한 영역을 마우스 F12 좌위로부터 결실시켰다. 결실된 마우스 영역 대신에 ATG 개시 코돈으로부터 정지 코돈까지의 인간 F12의 상응하는 영역을 삽입하였다. loxP-mPrm1-Crei-pA-hUb1-em7-Neo-pA-loxP 카세트(4,766 bp)를 인간 인트론 4(엑손 4 이후의 81 bp 내지 엑손 5 전의 220 bp) 내에 포함시켰다. 자기-결실 카세트의 인간 F12 영역 업스트림은 3,874 bp(인간 ATG 내지 엑손 4, 및 81 bp의 인트론 4)를 포함하였고, 자기-결실 카세트의 인간 F12 영역 다운스트림은 3,362 bp(220 bp의 인간 인트론 4, 및 엑손 5 내지 정지 코돈)를 포함하였다. 이는 MAID 7374 대립유전자이다. 도 1의 하단을 참조한다. 카세트 결실 후, loxP 및 클로닝 부위는 인간 F12 인트론 4에 남아 있었다. 이는 MAID 7375 대립유전자이다.
마우스 응고 인자 XII 신호 펩타이드, 중쇄, 및 경쇄에 대한 서열은 SEQ ID NO: 2-4로 각각 표시되어 있으며, 상응하는 코딩 서열은 SEQ ID NO: 10-12로 각각 표시되어 있다. 인간 응고 인자 XII 신호 펩타이드, 중쇄, 및 경쇄에 대한 서열은 SEQ ID NO: 6-8로 각각 표시되어 있으며, 상응하는 코딩 서열은 SEQ ID NO: 14-16으로 각각 표시되어 있다. 예상되는 인코딩된 인간화 응고 인자 XII 단백질은 인간 응고 인자 XII 단백질과 동일하다. 도 1참조한다. 마우스 및 인간 응고 인자 XII 단백질의 정렬은 도 3에 제공된다. 마우스 및 인간 F12 코딩 서열은 SEQ ID NO: 9 및 13으로 각각 표시되어 있다. 마우스 및 인간 응고 인자 XII 단백질 서열은 SEQ ID NO: 1 및 5로 각각 표시되어 있다. 예상된 인간화 ALB 코딩 서열 및 예상된 인간화 응고 인자 XII 단백질에 대한 서열은 SEQ ID NO: 13 및 5로 각각 표시되어 있다.
돌연변이체 대립유전자를 생산하기 위해, 상기 기재된 큰 표적화 벡터를 F1H4 마우스 배아 줄기세포 내로 도입하였다. F1H4 마우스 ES 세포는 암컷 C57BL/6NTac 마우스를 수컷 12956/SvEvTac 마우스와 교배함으로써 생성된 하이브리드 배아로부터 유래되었다. 예를 들어, 미국 특허출원공개 US 2015-0376651호 및 국제공개 WO 2015/200805호를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 항생제 선택 후, 콜로니를 선별(pick)하며, 확장(expand)시키고, TAQMAN®에 의해 스크리닝하였다. 도 2참조한다. 표 5에 표시된 프라이머 및 프로브를 사용하여 대립유전자-소실 검정을 수행하여 내인성 마우스 대립유전자의 결실을 검출하였고, 대립유전자-획득 검정을 수행하여 인간화 대립유전자의 획득을 검출하였다.
Figure pct00006
대립유전자-소실(LOA) 검정 및 대립유전자-획득(GOA) 검정을 포함하는 대립유전자-변형(MOA: modification-of-allele) 검정은 예를 들어, 미국 특허출원공개 US 2014/0178879호; 미국 특허출원공개 US 2016/0145646호; 국제공개 WO 2016/081923호; 및 문헌[Frendewey 등 (2010) Methods Enzymol. 476:295-307]에 기재되어 있으며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 대립유전자-소실(LOA) 검정은 종래의 스크리닝 논리를 뒤집고, 돌연변이가 안내된(directed) 네이티브 좌위의 게놈 DNA 시료에서 복사체의 수를 정량화한다. 올바르게 표적화된 이형접합성 세포 클론에서, LOA 검정은 2개의 네이티브 대립유전자(X 또는 Y 염색체 상에 존재하지 않는 유전자에 대해) 중 하나를 검출하며, 다른 대립유전자는 표적화된 변형에 의해 교란된다. 동일한 원리를 대립유전자-획득(GOA) 검정과 역순으로(in reverse) 적용하여, 게놈 DNA 시료 내 삽입된 표적화 벡터의 복사체 수를 정량화할 수 있다.
VELOCIMOUSE® 방법을 사용하여, 변형된 ES 세포로부터 F0 마우스를 생산하였다. 구체적으로, VELOCIMOUSE® 방법을 사용하여, 상기 기재된 MOA 검정에 의해 선택된 마우스 ES 세포 클론을 8-세포 단계 배아 내로 주사하였다. 예를 들어, 미국 특허 제7,576,259호; 미국 특허 제7,659,442호; 미국 특허 제7,294,754호; 미국 특허출원공개 US 2008/0078000호; 및 문헌[Poueymirou 등 (2007) Nat. Biotechnol. 25(1):91-99]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. VELOCIMOUSE® 방법에서, 표적화된 마우스 배아 줄기(ES) 세포를 레이저-보조 주사를 통해 상실배-전 단계 배아, 예를 들어, 8-세포-단계 배아 내로 주사하며, 이는 완전히 ES-세포-유래되는 F0 세대 마우스를 효율적으로 산출한다.
실시예 2. 인간화 응고 인자 XII( F12 ) 좌위를 포함하는 마우스의 확증
인간화 F12 마우스를 확증하기 위해, 인간 응고 인자 XII ELISA 키트(hFXII 총 항원 ELISA 키트 Molecular Innovations Cat# HFXIIKT-TOT)를 사용하여, 카세트-결실된 인간화 F12 마우스로부터의 혈장 시료에서 인간 응고 인자 XII 수준을 측정하였다. 인간 응고 인자 XII를 정상 인간 혈장 중 23.6 μg/mL의 수준에서 그리고 인간화 F12 마우스로부터의 혈장 중 5-18 μg/mL에서 검출하였다. 소량은 아마도 마우스 응고 인자 XII와의 어느 정도의 최소 교차-반응성으로 인해 야생형 마우스 혈장에서 검출되었다. 도 4참조한다.
혈장 시료의 웨스턴 블롯 분석(실시예 3에 제공된 프로토콜)을 또한 수행하여, 야생형 마우스 및 인간화 F12 마우스에서 마우스 응고 인자 XII 및 인간 응고 인자 XII 발현을 측정하였다. 혈장의 웨스턴 블롯 분석은 야생형(FXII+/+) 마우스 혈장에서 마우스 인자 XII의 존재 및 인간 인자 XII의 결여, 및 인간화 F12(FXIIhum/hum) 마우스 혈장에서 인간 인자 XII의 존재 및 마우스 인자 XII의 결여를 보여준다. 인간 또는 마우스 인자 XII 중 어느 것도 F12 넉아웃 마우스 혈장에서 검출되지 않았다. 도 5참조한다.
인간화 F12 마우스를 추가로 확증하기 위해, 2개의 기능적 혈장 검정을 수행하였다: (1) 활성화된 부분 트롬보플라스틴 시간(aPTT) 및 (2) 프로트롬빈 시간(PT). aPTT 시험은 칼슘 및 엘라그산의 첨가 후 혈전이 형성되는 시간을 측정함으로써 응고 캐스케이드의 내인성 및 공통적인 경로의 모든 혈전형성(clotting) 인자를 평가하는 반면, PT 시험은 칼슘 및 조직 인자의 첨가 후 혈전이 형성되는 시간을 측정함으로써 응고 캐스케이드의 외인성 및 공통적인 경로의 모든 응고 인자를 평가한다.
야생형 마우스와 인간화 F12 마우스 사이에서 aPTT 응고 시간에서 어떠한 유의한 차이도 관찰되지 않았다. 도 6참조한다. 유사하게는, PT 값은 야생형 마우스와 인간화 F12 마우스 사이에서 유의하게 상이하지 않았으며, 각각은 9초 내지 11초의 값을 갖는다(데이터는 도시되지 않음).
응고 검정: PT - 프로트롬빈 시간
이 검정을 수술-전(pre-surgical) 스크린으로서 사용하여, 잠재적인 출혈 문제를 검출한다. 이는 외인성 응고 시스템의 결핍에 민감하다(인자 II, V, VII, 및 X; 정상 인간 혈장 PT는 약 10초 내지 13초임). 사용된 기기는 Start4 지혈 분석기(Diagnostica Stago)이다. 사용된 시약은 TriniCLOT PT Excel 6 mL(Stago T1106)이다. 예시적인 절차는 하기와 같다:
1. 분석기를 켠다. 기계는 자동적으로 "자기-체크"를 수행하고 가온될 것이다. 검정을 37℃에서만 수행할 것이다.
2. "시험 모드"를 위해 키보드 상에 "1" 키(key)를 누르며, 엔터 키로 확인하고, PT 시험을 위해 "1" 키를 누른 다음, 엔터 키로 확인한다.
3. 작업 스크린 상에 환자 ID# 또는 시료#를 입력하여 표시한다.
4. 37℃에서의 예열을 위해 큐벳-스트립을 인큐베이션 영역에 둔다.
5. 볼(ball)을 큐벳-스트립 내의 각각의 큐벳에 분배한다.
6. 50 μL의 혈장 시료(대조군, 환자 또는 약물 처리 시료)를 각각의 큐벳(버블을 발생시키지 않음)에 분배한다.
7. 선택적으로 5 μL의, 혈장 중 2X 일련의 희석된 저해제(약물 용량 반응을 시험할 때만)를 첨가하고, 37℃에서 5분 동안 인큐베이션한다.
8. 180초 동안의 인큐베이션을 위해 인큐베이션 컬럼에 상응하는 타이머를 시작한다(타이머 키를 누름). 기기가 삐소리를 낼 때, 큐벳-스트립을 시험-컬럼으로 신속하게 이전시킨다.
9. 핀피펫(Finnpipette)을 시작 시약(37℃에서 예열된 PT 시약)으로 프라임(prime)시킨다.
10. 시험-컬럼 상에서, 피펫 제어 키를 눌러서 핀피펫을 활성화시킨 다음(볼이 큐벳에서 뒤로 그리고 앞으로 움직이기 시작함), 예열된 100 μL의 PT 시약을 각각의 큐벳에 분배한다.
11. 혈전이 형성될 때, 볼은 움직임을 중단할 것이고, 혈전형성 시간이 기록될 것이다(동일한 큐벳-스트립 상에서 모든 4개의 혈전형성 시간이 수행된 후 결과가 프린팅될 것임).
변형된 aPTT: 활성화된 부분 트롬보플라스틴 시간
이 검정은 내인성 응고 시스템에서의 비정상을 검출하는 데 사용되고, 인자 VIII, IX, X, XI, 및 XII(정상 인간 혈장에서 28초 내지 34초에서 aPTT)의 결핍에 민감하다. 사용된 기기는 Start4 지혈 분석기(Diagnostica Stago, Manual Ref 0931079A)이다. 사용된 시약은 하기와 같다: APTT-XL 엘라그산 ACTCV 4 mL(Thermo Scientific, Cat#95059-804), CaCl2 0.02M 10 mL(Thermo Scientific, Cat#95059-808), 또는 TriniCLOT aPTT S 10 mL(Stago T1201). 예시적인 절차는 하기와 같다:
1. 분석기를 켠다. 기계는 자동적으로 "자기-체크"를 수행하고 가온될 것이다. 검정을 37℃에서만 수행할 것이다.
2. "시험 모드"를 위해 키보드 상에 "1" 키를 누르며, 엔터 키로 확인하고, APTT 시험을 위해 "2" 키를 누른 다음, 엔터 키로 확인한다.
3. 작업 스크린 상에 환자 ID# 또는 시료#를 입력하여 표시한다.
4. 37℃에서의 예열을 위해 큐벳-스트립을 인큐베이션 영역에 둔다.
5. 볼을 큐벳-스트립 내의 각각의 큐벳에 분배한다. 각각의 큐벳-스트립 상에서 연결된 4개의 큐벳이 존재한다.
6. 50 μL의 혈장 시료(대조군, 환자 또는 약물 처리 시료)를 각각의 큐벳(혈장을 서서히 피펫하며, 버블을 발생시키지 않음)에 분배하고, 37℃에서 1분 동안 가온한다.
7. 선택적으로 5 μL의, 혈장 중 2X 일련의 희석된 저해제(약물 용량 반응을 시험할 때만)를 첨가하고, 37℃에서 5분 동안 인큐베이션한다.
8. 50 μL의 촉발제(즉, 엘라그산 또는 카올린)를 각각의 큐벳에 첨가한다.
9. 300초 동안의 인큐베이션을 위해 인큐베이션 컬럼에 상응하는 타이머를 시작한 디음(타이머 키를 누름), 큐벳-스트립을 시험-컬럼으로 신속하게 이전시킨다.
10. 핀피펫을 시작 시약(37℃에서 예열된 0.02 M의 CaCl2)으로 프라임시킨다.
11. 시험-컬럼 상에서, 피펫 제어 키를 눌러서 핀피펫을 활성화시킨 다음(볼이 큐벳에서 뒤로 그리고 앞으로 움직이기 시작함), 예열된 50 μL의 CaCl2 시약을 각각의 큐벳에 분배한다.
12. 혈전이 형성될 때, 볼은 움직임을 중단할 것이고, 혈전형성 시간이 기록될 것이다. 모든 4개의 큐벳의 응고 시간(clotting time)을 기록한 후, 결과는 자동적으로 프린트될 것이다.
실시예 3. 인간 대 마우스 F12 게놈 서열의 차이는 인간화 F12 마우스에서 반복되는 표현형인 인간 짧은 이소형의 발현을 구동할 수 있다
응고 인자 XII(FXII)는 간에서 간세포에 의해 합성되고 순환 내로 분비되며, 여기서 응고 인자 XII는 접촉 활성화 시스템을 개시한다. 전형적으로 순환으로 제약되는 것으로 생각되지만, FXII 단백질은 알츠하이머 질환 및 다발성 경화증 환자의 뇌에서 발견되어 왔으며, 접촉 시스템 활성화는 인간 뇌 및 뇌척수액에서 관찰되어 왔다. 그러나, 뇌에서 FXII 단백질의 공급원은 명시되지 않았으며, 뇌에서 이의 잠재적인 역할은 알려져 있다. 인 시추 혼성화 및 RNAseq를 사용하여, 본 발명자들은, 더 짧은 FXII 이소형이 인간 및 FXII 인간화 마우스 뇌의 뉴런에 의해 발현됨을 보여주고, 최고 발현은 피라미드 뉴런에서 관찰된다. 이러한 더 짧은 F12 mRNA 전사물은 이의 프롤린-풍부 및 촉매적 도메인을 경유하는 FXII 중 일부를 코딩하는 개방형 리딩 프레임을 함유한다. 이러한 더 짧은 FXII 단백질의 재조합 버전은 혈장 칼리크레인에 의해 활성화되고, 간세포 성장 인자(HGF)를 활성 HGF로 전환시킨다. HGF-Met 신호전달은 뉴런 발달 및 생존에서 역할을 하며, 이의 조절곤란(dysregulation)은 신경발달 장애 및 신경퇴행에 관여되어 왔다. 본 발명자들은 본원에서 처음에, F12 mRNA의 짧은 이소형이 뇌에서 국재적으로 생성됨을 보여주고, 뇌-유래 FXII가 뉴런에서 HGF-Met 신호전달에 관여할 수 있는 가능성을 제기한다.
응고 인자 XII(FXII)는 접촉 활성화 시스템을 개시하는 순환형 세린 프로테아제이다. 음으로 하전된 표면 상에서의 또는 혈장 칼리크레인에 의한 FXII의 활성화는 활성화된 FXII(FXIIa)를 생성한다. FXIIa는 내인성 응고 캐스케이드를 개시하며, 이는 트롬빈 생산 및 혈전 형성을 유발한다. FXIIa는 또한 혈장 프리칼리크레인을 칼리크레인으로 전환시키며, 상기 칼리크레인은 칼리크레인-키닌 경로를 활성화시켜 혈관활성 및 전염증성 펩타이드 브래드키닌의 방출을 초래한다. 이들 잘-연구된 기능에 더하여, FXIIa는 또한 시험관내에서 간세포 성장 인자(HGF) 및 보체 시스템을 활성화시키는 것으로 나타났다. 예를 들어, 문헌[Shimomura 등 (1995) Eur. J. Biochem. 229:257-261], 문헌[Peek 등 (2002) J. Biol. Chem. 277:47804-47809], 및 문헌[Ghebrehiwet 등 (1981) J. Exp. Med. 153:665-676]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. FXII는 단일 사슬 자이모겐으로서 순환되며, 이는 활성화 동안 R353에서 절단 시 효소적으로 활성인 2-사슬 분자(αFXIIa)로 된다. αFXIIa는, 촉매적 도메인을 함유하는 경쇄, 및 경쇄의 단지 작은 부분으로 구성된 βFXIIa로 추가로 가공된다.
FXII는 간에서 간세포에 의해 합성되고 순환 내로 분비된다. 전형적으로 순환으로 제약되는 것으로 생각되지만, FXII 단백질은 알츠하이머 질환(AD) 환자의 뇌에서 그리고 다발성 경화증(MS) 환자의 뇌 병변에서 Aβ 플라크(plaque)와 공동국재화(colocalized)되는 것으로 밝혀졌다. 예를 들어, 문헌[Yasuhara 등 (1994) Brain Res. 654:234-240] 및 문헌[Gobel 등 (2016) Nat. Commun. 7:11626]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 혈관-뇌 장벽(BBB)이 전형적으로 뇌 실질(brain parenchyma) 내로의 순환형 단백질의 이동을 방지하기 때문에, FXII는 건강한 인가 뇌로 진입해서는 안 된다. 따라서, AD 및 MS 환자의 뇌에서 관찰된 FXII는 기능이상(dysfunctional) BBB를 통한 순환으로부터 나올 수 있을 것이거나, 국재적으로 합성될 수 있다. 뇌에서 이전에 발견된 FXII 단백질의 공급원이 말초이거나 국재적인지의 여부는 잘 특징화되지 않았다. 예를 들어, 문헌[Yasuhara 등 (1994) Brain Res. 654:234-240] 및 문헌[Gobel 등 (2016) Nat. Commun. 7:11626]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다.
뇌에서 FXII는 접촉 시스템의 국재적인 활성화를 촉발할 수 있으며, 상기 접촉 시스템은 인간 뇌 및 뇌척수액에서 관찰되어 왔다. 예를 들어, 문헌[Ashby 등 (2012) Neurobiol. Aging 33:1345-1355] 및 문헌[Bergamaschini 등 (2001) Mech. Ageing Dev. 122:1971-1983]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 뇌 FXII는 또한, HGF의 수용체 Met를 통해 뉴런 발달 및 생존에서 역할을 하는 HGF, 또는 시냅스 온전성(integrity) 및 가소성(plasticity)을 매개하는 보체계를 활성화시킬 수 있을 것이다. 예를 들어, 문헌[Kato (2017) Biomed. Rep. 7:495-503], 문헌[Wright 및 Harding (2015) J. Alzheimers Dis. 45:985-1000], 및 문헌[Hammond 등 (2018) Annu. Rev. Cell Dev. Biol. 34:523-544]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 말초로부터의 FXII의 누출(leakage)은 병리학적으로 발생하는 가능성이 있을 것인 한편, 뇌에서 국재 F12 mRNA 합성은 뇌에서 이들 시스템의 생리학적 활성화를 위한 기전일 수 있을 것이다. 본원에서, 본 발명자들은, βFXIIa-유사 단백질을 잠재적으로 코딩하는 신규 F12 mRNA 전사물이 인간 뇌에서 뉴런에 의해 발현되고, 이러한 추정상 뇌 FXII 단백질이 혈장 칼리크레인에 의해 활성화될 수 있고 전구-HGF를 활성 HGF로 전환시킴을 보여준다.
공개된 연구는 뇌에서 F12의 발현에 관해 상충하는 결과를 보여준다. 엑손 7-9를 경유하는 PCR 프라이머를 사용하는 본 발명자들의 연구는 뇌 F12 mRNA를 검출하였으며(문헌[Yasuhara 등 (1994) Brain Res. 654:234-240], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 한편 엑손 3-5 내의 프라이머를 사용하는 또 다른 연구는 어떠한 F12 신호도 사실상 보여주지 않았다(문헌[Neth 등 (2001) Thromb. Haemost. 85:1043-1047], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 이들 2개 연구 사이에서의 불일치가 검출을 위해 선택된 엑손(들)으로 인한 것일 수 있는지의 여부를 조사하기 위해, 본 발명자들은 F12 내의 7개 영역(엑손 1-2, 엑손 3-4, 엑손 5-6, 엑손 7, 엑손 9, 엑손 11, 및 엑손 14; 도 7a 표 6)에 대한 qPCR 프로브를 설계하였다. 본 발명자들은, 모든 프로브가 인간 간에서 F12를 검출한 한편, 엑손 7, 9, 11, 및 14에 대한 프로브만 인간 뇌에서 F12를 검출하였음을 밝혀내었다(도 7b).
Figure pct00007
본 발명자들의 결과는 유전자형-조직 발현(GTEx: Genotype-Tissue Expression) 프로젝트를 통해 입수 가능한 RNAseq 데이터에 의해 뒷받침된다(문헌[G.T. Consortium, The Genotype-Tissue Expression (GTEx) project, Nat. Genet., 45 (2013) 580-585], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 데이터는 간에서 높은 F12 mRNA 발현을 보여주며, 다른 조직에서는 훨씬 더 낮은 발현을 갖는다. 간 외부에서, 최고 수준의 F12 발현 중 일부는 뇌 영역에서 발견된다(도 10a). 예상된 바와 같이, 인간 간에서 F12 mRNA 판독물의 엑손-바이(by)-엑손 분석은 모든 14개 엑손에 대한 커버리지를 보여준다. 그러나, 인간 피질 및 해마에서의 F12 mRNA 판독물은 엑손 7과 엑손 14 사이에서의 커버리지만 갖는다(도 7c).
다음으로, 본 발명자들은 RNA 인 시추 혼성화를 사용하여 인간 해마에서 F12 mRNA의 분포를 조사하였다. 이러한 목적을 위해, F12에 대한 2개의 RNAscope 프로브를 설계하였다: 엑손 1-6에 대한 하나의 프로브 및 엑손 11-14에 대한 하나의 프로브. 본 발명자들의 qPCR 결과 및 공개 GTEx 데이터와 일치하여, F12 mRNA는 단지 인간 해마에서 엑손11-14에 대한 프로브에 의해서 검출되었다(데이터는 도시되지 않음). 가장 풍부한 F12 mRNA 신호를 갖는 영역은 해마 피라미드 층이었으며, 치상회(dentate gyrus)의 과립 세포에 일부 신호가 존재하였다(데이터는 도시되지 않음). 헤마톡실린-염색된 세포 핵의 외부에서의 RNAscope 신호는, 프로브가 성숙 mRNA보다는 프리(pre)-mRNA를 검출하고 있지 않음을 시사한다. RNAscope 분석에 적합한 일관되게 높은 RNA 품질을 갖는 인간 뇌 조직을 수득하는 데 있어서의 어려움으로 인해, 본 발명자들은 뇌에서 F12 발현을 추가로 연구하기 위해 마우스 조직으로 관심을 돌렸다.
마우스 뇌에서의 F12 mRNA의 분포를 조사하기 위해, 본 발명자들은, 인자 XII 단백질을 생성하지 않는 F12 넉아웃 마우스(FXII-/-)를 대조군으로서 사용하여 야생형 마우스(FXII+/+) 상에서 RNAscope 분석을 수행하였다. 예상된 바와 같이, 엑손 1-6 및 엑손 11-14 프로브는 야생형 마우스 간에서 F12를 검출하였다(데이터는 도시되지 않음). 인간 뇌와 유사하게, 엑손 11-14에 대한 프로브만 야생형 마우스 뇌에서 F12 mRNA를 검출하였으며(데이터는 도시되지 않음), 한편 FXII-/- 마우스로부터의 뇌 또는 간에서는 어떠한 신호도 검출되지 않았으며, 이는 F12에 대한 프로브의 특이성을 확인시켜 준다. 마우스 뇌에서 F12 엑손 11-14 프로브로부터의 신호의 양은, 인간 뇌에서 관찰된 양보다 덜 풍부한 것으로 나타났으며, 이는 본 발명자들이 마우스 대 인간 조직에서 간외(extra-heptic) F12 mRNA 발현 수준을 비교하는 것을 촉구하였다. 뇌를 포함한 몇몇 조직이 검출 가능한 F12 mRNA 수준을 갖는 인간에서 F12의 유의한 간외 발현과 비교하여(도 10a), 마우스에서 F12의 발현은 간 외부에서 검출되지 않았다(도 10b). 이들 데이터는 인간 뇌와 비교하여 야생형 마우스 뇌에서 RNAscope에 의해 검출된 F12 mRNA 수준을 뒷받침하고, RNAscope에 의해 마우스 뇌에서 발견된 F12 mRNA 수준은 RNAseq에 의해 벌크(bulk) 조직에서 검출되기에 충분하지 않음을 시사한다.
인간 대 마우스 뇌에서 짧은 F12 mRNA의 차별적인 발현이 인간 F12 유전자 내의 특이적인 요소로 인한 것이거나 더욱 일반적인 종간(inter-species) 차이로 인한 것인지의 여부를 조사하기 위해, 본 발명자들은 다음으로 F12 인간화 마우스(FXIIhum/hum)를 분석하였으며, 이는 단지 인간 인자 XII를 생성한다. 전장 인간 F12 mRNA는 FXIIhum/hum 마우스 간에서 프로브 둘 다에 의해 검출되었으며(데이터는 도시되지 않음), 한편, 인간 F12 엑손 11-14에 대한 프로브만 FXIIhum/hum 뇌에서 신호를 생성하였다. 야생형 마우스와 비교하여, FXIIhum/hum 마우스 뇌는 훨씬 더 높은 신호를 가졌으며, 인간 F12는 뇌에서 이의 발현을 선호하는 마우스 F12와 비교하여 별개의 조절 특질을 가질 수 있음을 시사한다. 인간 뇌에서 관찰된 패턴과 유사하게, FXIIhum/hum 마우스의 뇌에서 F12의 발현은 대체로 뉴런인 것으로 보였으며, 해마 피라미드 층 및 피질 뉴런에서 강한 신호가 존재하였다(데이터는 도시되지 않음). 대체로 신경교(glia)로 이루어진 뇌량(corpus callosum)에서, 그리고 측뇌실(lateral ventricle)의 내벽(lining)을 이루는 뇌실막 세포(ependymal cell)에서는 신호가 거의 관찰되지 않거나 전혀 관찰되지 않았다(데이터는 도시되지 않음).
F12의 잠재적인 뉴런 발현을 추가로 조사하기 위해, 본 발명자들은 RNAscope 기술을, FXIIhum/hum 마우스 뇌의 연속적인 절편에서 F12 엑손 11-14에 대한 프로브 및 뉴런 마커 NeuN을 사용하는 면역형광과 조합하였다. 본 발명자들은 연속적인 뇌 절편에서 NeuN 면역형광 및 F12 RNAscope 신호의 분포에서 중첩(overlap)을 관찰하였으며(데이터는 도시되지 않음), 이는 F12가 주로 뉴런에서 발현됨을 시사한다. F12의 가장 큰 발현은 해마의 CA2/CA3 영역의 피라미드 뉴런에서 검출되었다(데이터는 도시되지 않음).
F12의 발현이 주로 뉴런적(neuronal)인 것으로 보이기 때문에, 본 발명자들은 다음으로, F12 mRNA가 1차 뉴런 및 뉴런 세포주에서 검출될 수 있을 것인지의 여부를 RNAseq에 의해 조사하였다. 사실상, F12 mRNA는 iPS-유래 인간 뉴런에서 발현되었으나(5.82 [1.65-7.38] FPKM), 마우스 1차 피질 뉴런에서는 검출 불가능하였다(데이터는 도시되지 않음). 인간 뇌 조직과 유사하게, 엑손-바이-엑손 mRNA 판독물 분석은, 인간 iPS 뉴런이 F12 mRNA의 더 짧은 이소형을 발현하였음을 보여주었다(데이터는 도시되지 않음). 인간과 마우스 사이에서 뇌 F12 mRNA 발현의 이러한 흥미로운 차이는 본 발명자들이 종들 사이에서 F12 유전자의 차이를 알아보도록 촉구하였다.
본 발명자들의 결과는, 인간 F12 게놈 서열이 뉴런에서의 더 짧은 이소형의 발현을 구동하는 상이한 내부 조절 요소를 가질 수 있는 가능성을 제기한다. 사실 상, UCSC 브라우저를 통해 입수 가능한 데이터(문헌[Kent 등 (2002) Genome Res. 12:996-1006], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨)는, 다수의 조절 요소가 인간 F12 유전자와 마우스 F12 유전자 둘 다에서 엑손 7-10을 경유하는 영역에 놓임을 보여주며, 인간 F12의 독특한 특질은 엑손 8-12를 경유하는 큰 CpG 섬이다. CpG 섬은 전사 개시 부위와 종종 관련된 게놈의 영역이며, 상승된 G 및 C 염기 조성 및 더 높은 CpG 디뉴클레오타이드 빈도를 특징으로 한다. 많은 경우, 기지의 전사물과 관련이 없는 부위에서 CpG 섬의 존재는 신규 전사물의 발견을 유발하였다(문헌[Deaton 등 (2011) Genes Dev. 25:1010-1022], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 그러므로, 마우스 F12 서열이 아닌 인간에서 큰 CpG 섬의 존재는 인간 뇌에서 이의 증가된 전사의 기저를 이룰 수 있다.
본 발명자들은 다음으로, 번역될 추정 상 단백질(들)을 예측하기 위해 개방형 리딩 프레임(ORF)의 존재에 대해 인간 뇌에서 검출된 F12 mRNA 서열을 검사하였다. 본 발명자들은 인간 뉴런 F12 서열에서 전장 F12와 함께 프레임에 있는 개시 코돈 및 정지 코돈의 존재에 의해 정의된 3개의 ORF를 밝혀내었다(도 8b). 이들 3개의 ORF 중에서, 단지 ORF 2 및 ORF 3은 마우스에서 보존되고, ORF 1 영역에는 불량한 아미노산 서열 정렬이 있다. 흥미롭게도, GENBANK®(문헌[Benson 등 (2013) Nucleic Acids Res. 41:D36-42], 이의 전체내용은 모든 목적을 위해 참조로서 본원에 포함됨)는 ORF 1에 상응하는 엑손 9에서 시작되는 5개의 짧은 인간 F12 mRNA를 나열하는 한편, 엑손 10에서 시작되는 어떠한 인간 F12 mRNA(ORF 2에 상응함)도 식별되지 않았다. 엑손 9 또는 10에서 시작하는 마우스 F12 mRNA 중 어느 것도 기재되지 않았다(도 8a). 인간 엑손 9에서 발견된 ATG는 마우스에서 보존되지 않는다. 종합하자면, 이들 데이터는 인간에서 엑손 9에서 시작되고 ORF 1을 코딩하는 짧은 F12 이소형의 더 높은 전사를 뒷받침하며, 마우스 뇌에서 짧은 F12 mRNA의 더 낮은 발현을 설명하는 것을 도울 수 있는 인간 및 마우스 F12 유전자에서 서열 및 조절 요소의 차이를 식별한다.
본원에서, 본 발명자들은 qPCR, RNAscope, 및 RNAseq를 사용하여, F12 mRNA가 인간 및 FXIIhum/hum 마우스 뇌의 뉴런에서 발현됨을 보여준다. RNAscope를 사용하여, 본 발명자들은 뉴런을, 뇌에서 짧은 F12 mRNA를 발현하는 1차 세포 유형으로서 식별하였으며, iPS-유래 글루타메이트성(glutamatergic) 뉴런에서 이의 발현을 RNAseq에 의해 확인하였다. 흥미롭게도, 본 발명자들은 야생형 마우스 뇌와 비교하여 FXIIhum/hum 마우스 및 인간 뇌에서 F12 mRNA의 훨씬 더 높은 수준을 RNAscope에 의해 관찰하였다. 이러한 종간 차이는 인간 뇌와 비교하여 마우스 뇌에서 F12의 무시할 만한 발현을 보여주는 RNAseq 데이터에 의해 추가로 뒷받침되었다. 인간 및 마우스 F12 유전자에서 조절 요소의 분석은, 엑손 9에서 시작되는 인간 F12 전사물의 발현이 마우스 F12가 아니라 인간에서 발견되는 엑손 8-12를 경유하는 큰 CpG 섬으로 인한 것일 수 있음을 시사하였다.
짧은 뇌 FXII 이소형의 가능한 기능적인 역할을 결정하기 위해, 본 발명자들은 뇌 F12 전사물에서 3개의 예측된 ORF를 평가하였다(도 8b). ORF 1의 번역은 FXII의 프롤린-풍부 및 촉매적 도메인을 함유하는 단백질(M297-S596; SEQ ID NOS: 74(단백질) 및 75(DNA))을 초래할 것이다. ORF 2의 번역은 중쇄로부터의 촉매적 도메인 및 3개의 추가 잔기를 포함하는 단백질(M351-S596; SEQ ID NOS: 76(단백질) 및 77(DNA))을 초래할 것이다. ORF 3은 촉매적 트리아드(triad)를 함유하지 않는 촉매적 도메인의 일부를 포함하는 단백질(M527-S596; SEQ ID NOS: 78(단백질) 및 79(DNA))을 초래할 것이다. ORF 2로부터의 단백질이 홑(unpaired) 시스테인(C467)을 가져서 불안정성을 유발할 가능성이 있을 것이기 때문에, 그리고 ORF 3으로부터의 단백질에서 무손상 촉매적 도메인의 결여로 인해, 본 발명자들은 ORF 1(FXII297-596)로부터 생산될 단백질에 초점을 맞추기로 결정하였다. 이러한 선택은 ORF 2 및 ORF 3이 아니라 ORF 1에서 시작되는 GENBANK®에서 F12 전사물의 존재에 의해 추가로 뒷받침되었다(도 8a).
본 발명자들은, 추정상 뉴런 FXII 이소형(FXII297-596)이 전장 FXII에 의해 촉발되는 경로를 활성화시킬 수 있을 것인지의 여부를 평가하였다. 혈장 칼리크레인에 의한 R353에서의 절단은 전장 FXII의 활성화에 필요하고, 중쇄 및 경쇄의 분리를 초래한다. 본 발명자들은, 중쇄 중 큰 일부가 결여된 재조합 인간 FXII297-596이 효소적 활성을 위해 혈장 칼리크레인에 의한 절단을 필요로 하는지의 여부를 시험하였다. 도 8b에 도시된 바와 같이, FXII297-596이 칼리크레인의 부재 하에 FXIIa 기질 S-2302와 함께 인큐베이션되었을 때 어떠한 효소적 활성도 관찰되지 않은 한편, FXII297-596은 칼리크레인과 함께 예비-인큐베이션된 후 효소적 활성을 획득하였다(도 9a). 모든 반응을 발색성 기질의 첨가 전에 칼리크레인 저해제 아프로티닌으로 처리하여, 효소적 활성이 기질의 칼리크레인-매개 절단의 결과가 아니었음을 보장하였다. 이들 결과는, 전장 FXII와 유사하게, 추정 상 뇌 FXII 이소형이 칼리크레인에 의한 절단 후 활성화됨을 시사하였다. 본 발명자들은 다음으로, 활성화된 FXII297-596이 프리칼리크레인을 칼리크레인으로 반복적으로 활성화시킬 수 있는지의 여부를 검사하였다. 프리칼리크레인의 어떠한 절단도 비-활성화된 FXII297-596에서는 관찰되지 않은 한편, 활성화된 FXII297-596 은 칼리크레인 중쇄의 생성을 통해 나타나는 바와 같이 프리칼리크레인을 칼리크레인으로 전환시켰다(도 11). 그러므로, FXII297-596은 칼리크레인-키닌 경로를 착수시킬 수 있으며, 이는 FXII297-596 활성화가 브래드키닌의 생산을 유발할 수 있음을 시사한다.
최근, FXII의 프롤린-풍부 도메인 내에서 FXII의 절단은 중쇄의 일부를 방출시키며 R353에서 칼리크레인에 의한 활성화에 FXII의 감수성(susceptibility)을 증가시키는 것으로 나타났다. 예를 들어, 문헌[de Maat 등 (2019) J. Thromb. Haemost. 17:183-194]를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 본 발명자들은, 프롤린 풍부 도메인에 대한 중쇄 N-말단이 결측되는(missing) FXII297-596이 본질적으로 예비-절단될 것이고, 따라서 전장 FXII를 활성화시키지 않을 칼리크레인의 수준에 의한 활성화에 대해 감수적일 수 있을 것임을 가정하였다. 이 연구에 사용된 재조합 FXII297-596이. 콜라이(E.coli)에서 생성되었고 글리코실화가 결여되었기 때문에, 본 발명자들은 활성화에 대한 이의 감수성을 인간 혈장으로부터 정제된 전장 FXII의 것과 직접적으로 비교할 수 없었다. 따라서, 본 발명자들은 전장 FXII로부터의 FXII297-596과 유사한 단백질을 효소적으로 생산하기 위해 모색하였다. Prosper 소프트웨어를 사용한 FXII 아미노산 서열에서 추정상 절단 부위의 분석(문헌[Song 등 (2012) PLoS One 7:e50300], 이의 전체내용은 모든 목적을 위해 참조로서 본원에 포함됨)은, L296과 M297 사이의 카텝신 K 절단 부위를 드러내었으며, 이는 뇌에서 잠재적으로 발현되는 이소형과 동일한 절두된 FXII 단백질을 생산할 것이다(FXII297-596).
도 9b에 도시된 바와 같이, 카텝신 K와 함께 전장 FXII의 인큐베이션은, L296과 M297 사이의 절단을 뒷받침하는 크기를 갖는 안정한 FXII 단편을 생산하였으며, 이는 글리코실화로 인해 약 40 kDa에서 전개될 것으로 예상될 약 35 KDa의 2개 단편을 산출할 것이다. 본 발명자들은 다음으로, 전장 FXII, 및 카텝신 K 절단에 의해 생산된 절두된 FXII의 효소적 활성을 비교하였다. 예상된 바와 같이, 전장 FXII 및 카텝신 K-절단된 FXII는 그 자체로는 무시할 만한 활성을 가졌지만, 카텝신 K-절단된 FXII는 혈장 칼리크레인과 함께 인큐베이션되었을 때 전장 FXII와 비교하여 상당히 증가된 활성을 가졌다(도 9b). 본 발명자들의 결과는, 카텝신 K가 칼리크레인과 함께 상승작용적으로 작동하여 FXII를 활성화시킴을 보여주는 최근 연구와 일치하며(문헌[de Maat 등 (2019) J. Thromb. Haemost. 17:183-194], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 카텝신-K 절단된 FXII와 유사한 추정상 뇌 FXII297-596 이소형이 혈장 칼리크레인 및 가능하게는 다른 프로테아제에 의한 활성화에 대해 증가된 감수성을 가질 것임을 시사한다.
프리칼리크레인 및 내인성 응고 경로를 활성화시키는 것에 더하여, FXIIa는 전구-HGF를 활성 HGF로 전환시키는 것으로 나타났다. 예를 들어, 문헌[Shimomura 등 (1995) Eur. J. Biochem. 229:257-261] 및 문헌[Peek 등 (2002) J. Biol. Chem. 277:47804-47809]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 본 발명자들은, 전구-HGF를 절단하는 간세포 성장 인자 활성자(HGFA) 및 βFXIIa의 능력을 확인하였다(도 9c). 더욱이, 본 발명자들은, 칼리크레인-활성화된 FXII297-596이 전구-HGF를 활성 2-사슬 형태로 절단하였음을 밝혀내었으며(도 9d), 이는 뇌 FXII가 국재 HGF 활성화에 기여할 수 있을 것임을 시사한다. 전구-HGF를 활성화시키는 이러한 능력은 특이적인데, 왜냐하면 뇌에서 발견되는 다른 세린 프로테아제, 예컨대 트롬빈 및 조직 플라스미노겐 활성자는 전구-HGF를 HGF로 전환시키지 않았기 때문이다(도 9c도 9d).
누적되는 증거는, 응고 및 접촉 시스템 단백질의 발현이 특히 병리학적 조건 하에 간 외부에서 발생함을 시사한다. 예를 들어, 문헌[Ashby 등 (2012) Neurobiol. Aging 33:1345-1355], 문헌[Yin 등 (2010) Am. J. Pathol. 176:1600-1606], 및 문헌[Takano 등 (2003) Brain Res. 978:72-82]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 간외 FXII 발현에 대한 역할이 또한 출현하고 있으며: 최근의 연구는 FXII가 폐 섬유아세포에서 발현되고(문헌[Jablonska 등 (2010) J. Biol. Chem. 285:11638-11651], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 호중구-발현된 FXII는 호중구 활성화 및 염증 부위로의 이동에 기여함을 나타내었다(문헌[Stavrou 등 (2018) J. Clin. Invest. 128:944-959], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 본원에서, 본 발명자들은 처음에 qPCR, RNAscope, 및 RNAseq를 사용하여, F12 mRNA가 인간 및 FXIIhum/hum 마우스 뇌의 뉴런에서 발현됨을 보여준다. 이전의 연구는 인간 뇌에서 F12 발현에 관한 상충하는 결과를 생성하였다. 엑손 7 내지 9를 경유하는 프라이머를 사용하여, 본 발명자들의 그룹은 F12 mRNA를 검출하였으며(문헌[Yasuhara 등 (1994) Brain Res. 654:234-240], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 한편 엑손 3-5 내의 프라이머 및 프로브를 사용하여 수행된 qPCR은 어떠한 F12 신호도 사실상 보여주지 않았다(문헌[Neth 등 (2001) Thromb. Haemost. 85:1043-1047], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 이들 연구는 상이한 방법을 사용하였으며, 따라서 직접적으로 비슷하지는 않지만; Yasuhara 등은 F12 mRNA가 뇌에서 발견된다고 결론내린 반면, Neth 등은 F12 mRNA가 간에서 독점적으로 발견된다고 결론내렸다. 본 발명자들의 결과는 이러한 불일치를 해결하는 것을 돕는데, 왜냐하면 본 발명자들은, 엑손 1-6이 아니라 엑손 7-14에 상응하는 F12 mRNA가 뇌에서 발견되어(도 7c), 이들 보고 둘 다 뒷받침함을 밝혀내었기 때문이다.
RNAscope를 사용하여, 본 발명자들은 뉴런을, 뇌에서 짧은 F12 mRNA를 발현하는 1차 세포 유형으로서 식별하였으며, iPS-유래 글루타메이트성 뉴런에서 이의 발현을 RNAseq에 의해 확인하였다. 흥미롭게도, 본 발명자들은 WT 마우스 뇌와 비교하여 FXIIhum/hum 마우스 및 인간 뇌에서 F12 mRNA의 훨씬 더 높은 수준을 RNAscope에 의해 관찰하였다. 이러한 종간 차이는 인간 뇌와 비교하여 마우스 뇌에서 F12의 무시할 만한 발현을 보여주는 RNAseq 데이터에 의해 추가로 뒷받침되었다. 인간 및 마우스 F12 유전자에서 조절 요소의 분석은, 엑손 9에서 시작되는 인간 F12 전사물의 발현이 마우스 F12가 아니라 인간에서 발견되는 엑손 8-12를 경유하는 큰 CpG 섬으로 인한 것일 수 있음을 시사하였다. 인간 뉴런과 마우스 뉴런 사이에서 이러한 분기(divergence)의 기능적 유의성은 알려져 있지 않다.
최근의 연구는 FXII297-596을 경유하는 잠재적인 뇌 FXII 단백질에 대한 기능적인 관여를 시사하였다. FXII 활성화는, FXII가 우선 엘라스타제 또는 카텝신 K와 같은 다른 효소에 의해 가공될 때 혈장 칼리클레인의 아역치(sub-threshold) 수준에 의해 달성될 수 있다. 예를 들어, 문헌[de Maat 등 (2019) J. Thromb. Haemost. 17:183-194]를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. FXII 중쇄의 절단은 FXII 활성화 절단 부위(R353-V354)를 알아내어, 용액에서 이의 더욱 효율적인 활성화를 가능하게 하는 것으로 생각된다. 예를 들어, 문헌[de Maat 등 (2019) J. Thromb. Haemost. 17:183-194]를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 인 실리코 분석에 기초하여, 추정상 뉴런 FXII297-596은 카텝신 K를 이용한 전장 FXII의 절단에 의해 생산될 수 있다. FXII 상의 정확한 카텝신 K 절단 부위가 나타나는 것으로 남아 있는 한편, 카텝신 K-절단된 FXII를 이용한 본 발명자들의 결과는, 추정상 뉴런 FXII 이소형이 낮은 수준의 칼리크레인에 의해 활성화될 것임을 시사한다. 이러한 측면에서, 혈장 프리칼리크레인 mRNA 및 단백질은 다양한 뇌 영역에서(문헌[Ashby 등 (2012) Neurobiol. Aging 33:1345-1355] 및 문헌[Neth 등 (2001) Thromb. Haemost. 85:1043-1047], 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 그리고 본 발명자들이 이 연구에 사용한 것과 비슷한 수준에서 발견되었다(문헌[Cerf 및 Raidoo (2000) Metab. Brain Dis. 15:315-323], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함). 더욱이, 혈장 프리칼리크레인 발현은, 본 발명자들이 최고 수준의 짧은 F12 mRNA를 발견한 세포인 해마 뉴런으로 국재화되었으며(문헌[Cerf 및 Raidoo (2000) Metab. Brain Dis. 15:315-323], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함), 이는 뉴런 FXII의 활성화가 생체내에서 발생할 수 있음을 시사한다. 그 외에도, 본 발명자들의 결과는, 뉴런 FXII 이소형이, 전장 FXII를 활성화시키지 않을, 아마도 뉴런 또는 다른 뇌 세포에 의해 생성되는 다른 프로테아제에 의한 활성화에 대해 증가된 감수성을 가질 가능성을 제기한다.
HGF로의 전구-HGF의 활성화는 Met 수용체를 통한 이의 신호전달에 필요하다. 뉴런에서 HGF-Met 신호전달에 대한 역할이 확립되긴 하였지만(문헌[Kato (2017) Biomed. Rep. 7:495-503] 및 문헌[Tyndall 및 Walikonis (2006) Cell Cycle 5:1560-1568], 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 전구-HGF가 뇌에서 활성화되는 방법은 잘 특징화되지 않았다. HGFA는 순환에서의 주요 HGF 활성자이다. 예를 들어, 문헌[Itoh 등 (2004) Gastroenterology 127:1423-1435]를 참조하며, 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. HGFA 넉아웃 마우스가 어떠한 발달적 비정상도 갖지 않기 때문에(문헌[Itoh 등 (2004) Gastroenterology 127:1423-1435], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), HGF 넉아웃 마우스는 배아 치명적이며(문헌[Uehara 등 (1995) Nature 373:702-705], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 한편 다른 HGF 활성자는 조직에서 HGF 활성화에 참여하는 가능성이 있다. 흥미롭게는, FXII는 HGFA의 상동체이며(문헌[Ponczek 등 (2008) J. Thromb. Haemost. 6:1876-1883], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 시험관내에서 전구-HGF를 활성 HGF로 전환시키는 것으로 나타났다. 예를 들어, 문헌[Shimomura 등 (1995) Eur. J. Biochem. 229:257-261] 및 문헌[Peek 등 (2002) J. Biol. Chem. 277:47804-47809]를 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 본 발명자들은, 추정상 뉴런 FXII가 뇌에서 활성 HGF로의 전구-HGF의 전환에 참여하여 뉴런 HGF-Met 신호전달에 기여할 수 있음을 가정한다.
뉴런 Met 신호전달은 신경돌기 과성장(neurite outgrowth), 수상돌기 분지(dendritic arborization), 장기간 강화(potentiation), 및 기억을 포함하여 여러 가지 생리학적 과정에 관여해 왔다. 예를 들어, 문헌[Kato (2017) Biomed. Rep. 7:495-503], 문헌[Wright 및 Harding (2015) J. Alzheimers Dis. 45:985-1000], 및 문헌[Tyndall 및 Walikonis (2006) Cell Cycle 5:1560-1568]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 본 발명자들은 해마 및 신피질(neocortical) 피라미드 뉴런에서 F12 mRNA의 농화된(enriched) 발현을 관찰하였으며, 추정상 뉴런 FXII에 의한 HGF의 활성화가 이들 세포에서 발생할 수 있을 가능성을 제기하였다. 흥미롭게는, 등쪽 외투(dorsal pallium)로부터 생기는 뉴런(해마 및 신피질 뉴런을 포함함)에서 Met의 결실은 자발적인 변경의 결핍(deficit) 및 과소활성(hypoactivity)을 초래하며(문헌[Thompson 및 Levitt (2015) J. Neurodev. Disord. 7:35], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), F12 mRNA를 발현하도록 밝혀진 세포에서 HGF-Met 신호전달의 중요성을 뒷받침한다. 짧은 FXII 이소형의 기능에 대한 추가의 조사는 이들 세포 집단에서 이의 역할을 밝혀낼 수 있다.
시험관내 및 동물 연구로부터 유래된 뉴런 HGF-Met 신호전달의 역할에 대한 통찰에 더하여, 누적되는 증거는, HGF-Met 신호전달에서의 조절곤란이 인간에서 신경발달 장애 및 신경퇴행에 기여함을 시사한다. 예를 들어, 문헌[Eagleson 등 (2017) Biol. Psychiatry 81:424-433], 문헌[Peng 등 (2013) Int. Rev. Neurobiol. 113:135-165], 및 문헌[Wright 및 Harding (2015) J. Alzheimers Dis. 45:985-1000]을 참조하며, 이들 각각의 전체내용은 모든 목적을 위해 본원에 참조로서 포함된다. 특히, Met 단백질의 발현은 AD 환자의 해마 뉴런에서 저하되며(문헌[Hamasaki 등 (2014) Neuropathology 34:284-290], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨), 한편 HGF 단백질 수준은 AD 뇌에서 증가된다(문헌[Fenton 등 (1998) Brain Res. 779:262-270], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). 뉴런 FXII 수준이 AD 또는 다른 질환 상태에서 변경되는지의 여부 및 뉴런 FXII가 질환 과정에서 역할을 하는지의 여부는 미결 문제이다. 향후 연구는 뇌에서 HGF 및 접촉 경로의 생리학적 및 병리학적 활성화에서 뉴런 FXII 발현의 세부사항 및 뉴런 FXII 이소형의 역할을 밝혀낼 것이다.
재료 및 방법
qPCR. 인간 간, 인간 전체 뇌, 해마, 측두엽, 및 피질로부터의 총 RNA는 Clontech(Takara Bio USA; Mountain View, CA)로부터의 것이었다. SuperScript® VILO™ Master Mix(Invitrogen by Life Technologies; Waltham, MA)를 사용하여 mRNA를 cDNA 내로 역전사하였다. cDNA를 0.5-5 ng/μL로 희석시키고, ABI 7900HT 서열 검출 시스템(Applied Biosystems; Foster City, CA)을 사용하여 SensiFAST Hi-ROX MasterMix(Bioline; Taunton, MA)로 2.5-25 ng cDNA 투입물을 증폭시켰다. 사용된 인간 F12 및 GAPDH에 대한 프라이머 및 프로브를 표 5에 나타낸다. 데이터는 대조군 조직에서 나타난 표적 유전자 발현의 %로서 제시된다(2-(ΔΔCt)*100).
인간 뇌 조직. RNAscope 분석을 위해, 인간 뇌 조직의 2개 공급원을 사용하였다. 하바드 뇌 조직 리소스 센터(Belmont, MA)로부터의 신선-냉동 해마 뇌 조직을 10 μm로 슬라이스(slice)하고, VWR 슈퍼프로스트 슬라이드(superfrost slide) 상으로 마운팅하고, -80℃에 보관하였다. 예비-마운팅된 5 μm 포르말린 고정된, 파라핀-포매된 인간 해마 절편(section)을 Abcam(Cambridge, MA)으로부터 얻었다.
혈장 수집. 혈장 수집을 위해, 소듐 시트레이트 프라이밍된 바늘을 사용하여 대정맥으로부터 혈액을 채혈하였다. 혈액을 실온에서 1500xg에서 10분 동안 회전시키고, 혈소판-부족(poor) 혈장을 수집하고 -80℃에서 보관하였다. 조직 수집을 위해, 마우스를 0.9% 식염수로 경심(transcardially) 관류시켰다. 뇌 및 간을 제거하고, 최적 절단 온도(Optimal Cutting Temperature) 화합물에서 드라이 아이스 상에서 냉동시키고, -80℃에 보관하였다. 10 μm 절편을 Superfrost 플러스 슬라이드(VWR; Radnor, PA) 상으로 마운팅하고, -80℃에서 보관하였다.
인 시추 RNA 혼성화. 신선-냉동된 또는 포르말린-고정된, 파라핀-포매 조직에 대해 RNAscope 2.5 HD 시스템 RED(Advanced Cell Diagnostics; Newark, CA)를 제조업체의 프로토콜에 따라 사용하여 인 시추 RNA 혼성화를 수행하였다. 프로브(ACDbio 카탈로그 번호 313901(PPIB (인간)), 313911(PPIB(마우스)), 310043(DAPB), 493191(F12 엑손 1-6(인간)), 473781(F12 엑손 11-14(인간)), 493201(F12 엑손 1-6(마우스)), 및 483971(F12 엑손 11-14(마우스)))을 싱글-플렉스 매뉴얼 RNAscope 검정에 사용하고, Aperio 슬라이드 스캐너(Leica Microsystems; Buffalo Grove, IL)를 사용하여 40X 대물렌즈로 RNAscope 프로브로부터의 비색(colorimetric) 신호를 포착하였다. 조직이 RNA 분석에 적합한지 확인하기 위해, 유비쿼터스적으로 발현된 유전자(사이클로필린 B; PPIB)에 대한 프로브를 양성 대조군으로서 사용하고, 박테리아 유전자(4-하이드록시-테트라하이드로디피콜리네이트 환원효소; DapB)에 대한 프로브를 음성 대조군으로서 사용하였다. RNAscope 프로브의 높은 특이성으로 인해, 마우스 및 인간 F12에 대한 별개의 RNAscope 프로브를 설계하였다.
면역형광/RNAscope. 면역형광 및 RNAscope를 FXIIhum/hum 마우스 뇌의 연속적인 절편 상에서 수행하였다. 조직을 DAPI로 대조염색하고 Zeiss AxioScan Z.1 슬라이드 스캐너(Carl Zeiss Microscopy; Thornwood, NY) 상에서 RNAscope RED에 대해 590/617 및 DAPI에 대해 358/461의 Ex/Em으로 20X 대물렌즈를 사용하여 이미지를 획득한 점을 제외하고는, F12 엑손 11-14에 대한 프로브를 사용하여 RNAscope를 상기 기재된 바와 같이 전개하였다. Halo 소프트웨어(Indica Labs; Corrales, NM)를 사용하여 RNAscope 신호를 백색으로 의사착색(pseudocolor)시켰다. 면역형광을 위해, 조직을 포스페이트 완충제 중 4% 파라포름알데하이드(Electron Microscopy Sciences; Hatfield, PA)로 후-고정(post-fixed)하고, PBS 중 0.25% Triton-X(Sigma Aldrich; St. Louis, MO)를 함유하는 3% 당나귀 혈청(Jackson Laboratory; Bar Harbor, ME)으로 차단시켰다. 그 후에, 슬라이드를 차단 완충제에서 1:500으로 희석된 NeuN 항체(Abcam; Cat# Ab177487)와 함께 4℃에서 밤새 인큐베이션한 다음, 3% 당나귀 혈청에서 희석된 Alexa-488 접합 2차 항체(ThermoFisher) 및 DAPI(ThermoFisher)와 함께 실온에서 1시간 동안 인큐베이션하였다. PBS에서 세척 후, Aqua-Mount 마운팅 매질(ThermoFisher)을 사용하여 슬라이드를 커버슬립(coverslip)하였다. AxioScan Z.1 슬라이드 스캐너 상에서 Alexa-488에 대해 490/525 및 DAPI에 대해 358/461의 Ex/Em으로 20X 대물렌즈를 사용하여 이미지를 획득하였다.
FXIIa 활성 검정. 혈장 칼리크레인에 의해 FXII297-596 활성화를 측정하기 위해, 재조합 인간 FXII297-596(Proteintech; Rosemont, IL)을, 140 mM NaCl, pH 7.4(HEPES-완충 식염수; HBS)를 함유하는 20 mM HEPES에서 15 nM 혈장 칼리크레인(Molecular Innovations; Novi, MI)과 함께 37℃에서 18시간 동안 인큐베이션하였다. 그 후에, 100 KIU/mL 아프로티닌(Sigma-Aldrich; St. Louis, MO)을 사용하여 칼리크레인 활성을 저해하였으며, 0.8 mM의 농도에서 발색성 기질 S-2302(H-D-Pro-Phe-Arg-pNA-2HCl; Diapharma; West Chester, OH)를 사용하여 FXIIa 활성을 측정하였다. 검정을 37℃에서 편평-바닥 96-웰 폴리스티렌 MaxiSorp 플레이트(Thermo Fisher)에서 수행하였다. 효소 활성을, Spectramax i3X 마이크로플레이트 판독기(Molecular Devices; Downingtown, PA)를 사용하여 405 nm에서의 흡광도 변화로서 검출하였다.
HBS에서 FXII(1.25 uM; Molecular Innovations)를 카텝신 K(100 nM; Enzo Life Sciences)와 함께 인큐베이션함으로써 카텝신 K-절단된 FXII를 생산하였다. 비-환원적 시료 완충제를 첨가하고 100℃에서 5분 동안 가열함으로써 반응을 중단시켰다. FXII 단편을 SDS-PAGE에 의해 분리하고, 쿠마시 블루 염색에 의해 시각화하였다. FXII(375 nM)를 카텝신 K(30 nM)와 함께 또는 비히클을 혈장 칼리크레인(15 nM)과 함께 15분 동안 인큐베이션함으로써, 카텝신 K-절단된 FXII의 단백분해 활성을 분석하였다. 그 후에, 칼리크레인 활성을 아프로티닌으로 저해시키고, FXIIa 활성을 S-2302 발색성 기질로 측정하였다.
혈장 프리칼리크레인 절단을 분석하기 위해, FXII297-596(300 nM)을 우선, 혈장 칼리크레인(15 nM) 또는 비히클과 함께 37℃에서 18시간 동안 인큐베이션하였다. 그 후에, 아프로티닌(100 KIU/mL; Sigma)을 사용하여 칼리크레인 활성을 불활성화시켰다. 인간 혈장으로부터 정제된 프리칼리크레인(200 nM; Molecular Innovations)을 칼리크레인-활성화된 또는 비히클-활성화된 FXII297-596(225 nM) 또는 FXII(225 nM)와 함께 HBS에서 37℃에서 2시간 동안 인큐베이션하였다. 환원적 시료 완충제를 첨가함으로써 반응을 중단시켰다. SDS-PAGE를 상기 기재된 바와 같이 수행하고, 블롯을 인간 프리칼리크레인에 대한 항체(Abcam; Cat# ab1006)로 분석하였다.
웨스턴 블롯. FXII-/-, FXII+/+, 및 FXIIhum/hum 마우스로부터의 혈장을 환원적 조건 하에 웨스턴 블롯에 의해 분석하였다. 4-20% Tris-글리신 젤(Invitrogen)을 사용하여 SDS-PAGE를 수행하고, 상기 젤을 0.2 μm PVDF 막(BioRad; Hercules, CA) 상으로 이전시키고, 마우스 인자 XII(CloudClone Corp; Katy, TX; Cat# PAA677Mu01), 인간 인자 XII(Abcam; Cat# Ab196670), 및 알부민(Thermo Scientific Pierce; Waltham, MA; Cat# PA1-29335)에 대한 항체로 분석하였다.
HGF 활성화를 분석하기 위해, FXII297-596(300 nM)을 우선, 혈장 칼리크레인(15 nM) 또는 비히클과 함께 37℃에서 18시간 동안 인큐베이션하였다. 그 후에, 아프로티닌(100 KIU/mL; Sigma)을 사용하여 칼리크레인 활성을 불활성화시켰다. 재조합 인간 전구-HGF(25 μg/mL; R&D Systems; Minneapolis, MN)를 칼리크레인-활성화된 또는 비히클-활성화된 FXII297-596(225 nM), 재조합 인간 간세포 성장 인자 활성자(225 nM; Sino Biological; Wayne, PA), 2-사슬 조직 플라스미노겐 활성자(225 nM; Oxford Biomedical Research; Rochester Hills, MI), 또는 βFXIIa(50 nM; Molecular Innovations)와 함께 HBS에서 37℃에서 5시간 동안 인큐베이션하였다. 환원적 시료 완충제를 첨가함으로써 반응을 중단시켰다. SDS-PAGE를 상기 기재된 바와 같이 수행하고, 블롯을 인간 HGF에 대한 항체(R&D Systems; Cat# AF-294-SP)로 분석하였다.
세포 배양. 인간 iPS 글루타메이트성 뉴런(iCell® Glutaneurons; Cellular Dynamics; Madison, WI)을 제조업체의 설명서에 따라 배양하고, 차이를 RNAseq에 의해 확증하였다. 세포는 2개의 잘 알려진 뉴런 마커인 미세소관 관련 단백질 2(MAP2) 및 소낭성 글루타메이트 수송체 VGLUT2(SCL17A6)의 높은 발현 및 GFAP(성상세포 마커) 및 NES(뉴런 줄기세포 및 증식성 내피 세포의 마커)의 낮은 발현을 보여주었다(데이터는 도시되지 않음). American Type Tissue Collection(ATCC; Manassas, VA)으로부터의 SH-SY5Y 인간 신경아세포종 세포 및 Neuro-2a 마우스 신경아세포종 세포를, L-글루타메이트, 페니실린, 스트렙토마이신, 및 10% 우태 혈청(ThermoFisher)을 함유하는 EMEM(Irvine Scientific; Santa Ana, CA)에서 배양하였다. C57BL/6 마우스로부터의 1차 피질 뉴런(Lonza)을 제조업체의 설명서에 따라 배양하였다.
RNAseq. RNA 추출 및 시퀀싱 라이브러리 제조를 위한 프로토콜은 이전에 기재된 것과 유사하였다(문헌[Atanasio 등 (2016) Sci. Rep. 6:23204], 이의 전체내용은 모든 목적을 위해 본원에 참조로서 포함됨). KAPA 가닥 mRNA-Seq 키트(KAPA Biosystems)를 사용하여 500 ng RNA로부터 가닥-특이적 RNA-seq 라이브러리를 제조하였다. 라이브러리를 12-사이클 PCR에 의해 증폭시켰다. 시퀀싱을 Illumina HiSeq®2000(Illumina) 상에서 멀티플렉스드(multiplexed) 단일-판독물 전개(single-read run)(iPS 인간 뉴런, 마우스 1차 뉴런, 및 마우스 뉴런에 대해), 또는 쌍형성된-판독물 전개(paired-read run)(SH-SY5Y 및 Neuro-2A 세포주에 대해)에 의해 수행하였다. 생성된 FASTQ 파일을 FastQC를 통해 분석하여, 충분한 데이터 품질을 보장하였다. 판독물을, 허용된 2개의 미스매치와 함께 상업적인 소프트웨어 ArrayStudio(OmicSoft)를 사용하여 인간 게놈(hg19) 또는 마우스 게놈(mm10)으로 맵핑하였다. 본 발명자들의 시료에서, 83% 내지 90% 판독물을 독특하게 맵핑하였다. OmicSoft ArrayStudio RNASeq 분석 파이프라인(Qiagen Inc.)을 사용하여 유전자 발현을 원(raw) 시퀀싱 판독물로부터 유래하였다. 각각의 유전자에 대해, 상기 유전자의 엑손으로 독특하게 맵핑된 판독물을 식별하고 카운팅하였다. 생성된 판독 카운트(read count)를 유전자 수준에서 원(raw) 발현으로서 요약하였다.
SEQUENCE LISTING <110> Regeneron Pharmaceuticals, Inc. <120> NON-HUMAN ANIMALS COMPRISING A HUMANIZED COAGULATION FACTOR 12 LOCUS <130> 057766-545986 <150> US 62/829,321 <151> 2019-04-04 <160> 84 <170> PatentIn version 3.5 <210> 1 <211> 597 <212> PRT <213> Mus musculus <220> <221> MISC_FEATURE <222> (1)..(19) <223> Signal Peptide <220> <221> MISC_FEATURE <222> (20)..(354) <223> Heavy Chain <220> <221> MISC_FEATURE <222> (355)..(597) <223> Light Chain <400> 1 Met Thr Ala Leu Leu Phe Leu Gly Ser Leu Leu Met Ser Leu Asp Leu 1 5 10 15 Thr Leu Ser Ala Pro Pro Trp Lys Asp Ser Lys Lys Phe Lys Asp Ala 20 25 30 Pro Asp Gly Pro Thr Val Val Leu Thr Val Asp Gly Arg Leu Cys His 35 40 45 Phe Pro Phe Gln Tyr His Arg Gln Leu His His Lys Cys Ile His Lys 50 55 60 Arg Arg Pro Gly Ser Arg Pro Trp Cys Ala Thr Thr Pro Asn Phe Asp 65 70 75 80 Glu Asp Gln Gln Trp Gly Tyr Cys Leu Glu Pro Lys Lys Val Lys Asp 85 90 95 His Cys Ser Lys His Asn Pro Cys His Lys Gly Gly Thr Cys Ile Asn 100 105 110 Thr Pro Asn Gly Pro His Cys Leu Cys Pro Glu His Leu Thr Gly Lys 115 120 125 His Cys Gln Lys Glu Lys Cys Phe Glu Pro Gln Leu Leu Lys Phe Phe 130 135 140 His Glu Asn Glu Leu Trp Phe Arg Thr Gly Pro Gly Gly Val Ala Arg 145 150 155 160 Cys Glu Cys Lys Gly Ser Glu Ala His Cys Lys Pro Val Ala Ser Gln 165 170 175 Ala Cys Ser Ile Asn Pro Cys Leu Asn Gly Gly Ser Cys Leu Leu Val 180 185 190 Glu Asp His Pro Leu Cys Arg Cys Pro Thr Gly Tyr Thr Gly Tyr Phe 195 200 205 Cys Asp Leu Asp Leu Trp Ala Thr Cys Tyr Glu Gly Arg Gly Leu Ser 210 215 220 Tyr Arg Gly Gln Ala Gly Thr Thr Gln Ser Gly Ala Pro Cys Gln Arg 225 230 235 240 Trp Thr Val Glu Ala Thr Tyr Arg Asn Met Thr Glu Lys Gln Ala Leu 245 250 255 Ser Trp Gly Leu Gly His His Ala Phe Cys Arg Asn Pro Asp Asn Asp 260 265 270 Thr Arg Pro Trp Cys Phe Val Trp Ser Gly Asp Arg Leu Ser Trp Asp 275 280 285 Tyr Cys Gly Leu Glu Gln Cys Gln Thr Pro Thr Phe Ala Pro Leu Val 290 295 300 Val Pro Glu Ser Gln Glu Glu Ser Pro Ser Gln Ala Pro Ser Leu Ser 305 310 315 320 His Ala Pro Asn Asp Ser Thr Asp His Gln Thr Ser Leu Ser Lys Thr 325 330 335 Asn Thr Met Gly Cys Gly Gln Arg Phe Arg Lys Gly Leu Ser Ser Phe 340 345 350 Met Arg Val Val Gly Gly Leu Val Ala Leu Pro Gly Ser His Pro Tyr 355 360 365 Ile Ala Ala Leu Tyr Trp Gly Asn Asn Phe Cys Ala Gly Ser Leu Ile 370 375 380 Ala Pro Cys Trp Val Leu Thr Ala Ala His Cys Leu Gln Asn Arg Pro 385 390 395 400 Ala Pro Glu Glu Leu Thr Val Val Leu Gly Gln Asp Arg His Asn Gln 405 410 415 Ser Cys Glu Trp Cys Gln Thr Leu Ala Val Arg Ser Tyr Arg Leu His 420 425 430 Glu Gly Phe Ser Ser Ile Thr Tyr Gln His Asp Leu Ala Leu Leu Arg 435 440 445 Leu Gln Glu Ser Lys Thr Asn Ser Cys Ala Ile Leu Ser Pro His Val 450 455 460 Gln Pro Val Cys Leu Pro Ser Gly Ala Ala Pro Pro Ser Glu Thr Val 465 470 475 480 Leu Cys Glu Val Ala Gly Trp Gly His Gln Phe Glu Gly Ala Glu Glu 485 490 495 Tyr Ser Thr Phe Leu Gln Glu Ala Gln Val Pro Phe Ile Ala Leu Asp 500 505 510 Arg Cys Ser Asn Ser Asn Val His Gly Asp Ala Ile Leu Pro Gly Met 515 520 525 Leu Cys Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln Gly Asp 530 535 540 Ser Gly Gly Pro Leu Val Cys Glu Glu Gly Thr Ala Glu His Gln Leu 545 550 555 560 Thr Leu Arg Gly Val Ile Ser Trp Gly Ser Gly Cys Gly Asp Arg Asn 565 570 575 Lys Pro Gly Val Tyr Thr Asp Val Ala Asn Tyr Leu Ala Trp Ile Gln 580 585 590 Lys His Ile Ala Ser 595 <210> 2 <211> 19 <212> PRT <213> Mus musculus <400> 2 Met Thr Ala Leu Leu Phe Leu Gly Ser Leu Leu Met Ser Leu Asp Leu 1 5 10 15 Thr Leu Ser <210> 3 <211> 335 <212> PRT <213> Mus musculus <400> 3 Ala Pro Pro Trp Lys Asp Ser Lys Lys Phe Lys Asp Ala Pro Asp Gly 1 5 10 15 Pro Thr Val Val Leu Thr Val Asp Gly Arg Leu Cys His Phe Pro Phe 20 25 30 Gln Tyr His Arg Gln Leu His His Lys Cys Ile His Lys Arg Arg Pro 35 40 45 Gly Ser Arg Pro Trp Cys Ala Thr Thr Pro Asn Phe Asp Glu Asp Gln 50 55 60 Gln Trp Gly Tyr Cys Leu Glu Pro Lys Lys Val Lys Asp His Cys Ser 65 70 75 80 Lys His Asn Pro Cys His Lys Gly Gly Thr Cys Ile Asn Thr Pro Asn 85 90 95 Gly Pro His Cys Leu Cys Pro Glu His Leu Thr Gly Lys His Cys Gln 100 105 110 Lys Glu Lys Cys Phe Glu Pro Gln Leu Leu Lys Phe Phe His Glu Asn 115 120 125 Glu Leu Trp Phe Arg Thr Gly Pro Gly Gly Val Ala Arg Cys Glu Cys 130 135 140 Lys Gly Ser Glu Ala His Cys Lys Pro Val Ala Ser Gln Ala Cys Ser 145 150 155 160 Ile Asn Pro Cys Leu Asn Gly Gly Ser Cys Leu Leu Val Glu Asp His 165 170 175 Pro Leu Cys Arg Cys Pro Thr Gly Tyr Thr Gly Tyr Phe Cys Asp Leu 180 185 190 Asp Leu Trp Ala Thr Cys Tyr Glu Gly Arg Gly Leu Ser Tyr Arg Gly 195 200 205 Gln Ala Gly Thr Thr Gln Ser Gly Ala Pro Cys Gln Arg Trp Thr Val 210 215 220 Glu Ala Thr Tyr Arg Asn Met Thr Glu Lys Gln Ala Leu Ser Trp Gly 225 230 235 240 Leu Gly His His Ala Phe Cys Arg Asn Pro Asp Asn Asp Thr Arg Pro 245 250 255 Trp Cys Phe Val Trp Ser Gly Asp Arg Leu Ser Trp Asp Tyr Cys Gly 260 265 270 Leu Glu Gln Cys Gln Thr Pro Thr Phe Ala Pro Leu Val Val Pro Glu 275 280 285 Ser Gln Glu Glu Ser Pro Ser Gln Ala Pro Ser Leu Ser His Ala Pro 290 295 300 Asn Asp Ser Thr Asp His Gln Thr Ser Leu Ser Lys Thr Asn Thr Met 305 310 315 320 Gly Cys Gly Gln Arg Phe Arg Lys Gly Leu Ser Ser Phe Met Arg 325 330 335 <210> 4 <211> 243 <212> PRT <213> Mus musculus <400> 4 Val Val Gly Gly Leu Val Ala Leu Pro Gly Ser His Pro Tyr Ile Ala 1 5 10 15 Ala Leu Tyr Trp Gly Asn Asn Phe Cys Ala Gly Ser Leu Ile Ala Pro 20 25 30 Cys Trp Val Leu Thr Ala Ala His Cys Leu Gln Asn Arg Pro Ala Pro 35 40 45 Glu Glu Leu Thr Val Val Leu Gly Gln Asp Arg His Asn Gln Ser Cys 50 55 60 Glu Trp Cys Gln Thr Leu Ala Val Arg Ser Tyr Arg Leu His Glu Gly 65 70 75 80 Phe Ser Ser Ile Thr Tyr Gln His Asp Leu Ala Leu Leu Arg Leu Gln 85 90 95 Glu Ser Lys Thr Asn Ser Cys Ala Ile Leu Ser Pro His Val Gln Pro 100 105 110 Val Cys Leu Pro Ser Gly Ala Ala Pro Pro Ser Glu Thr Val Leu Cys 115 120 125 Glu Val Ala Gly Trp Gly His Gln Phe Glu Gly Ala Glu Glu Tyr Ser 130 135 140 Thr Phe Leu Gln Glu Ala Gln Val Pro Phe Ile Ala Leu Asp Arg Cys 145 150 155 160 Ser Asn Ser Asn Val His Gly Asp Ala Ile Leu Pro Gly Met Leu Cys 165 170 175 Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln Gly Asp Ser Gly 180 185 190 Gly Pro Leu Val Cys Glu Glu Gly Thr Ala Glu His Gln Leu Thr Leu 195 200 205 Arg Gly Val Ile Ser Trp Gly Ser Gly Cys Gly Asp Arg Asn Lys Pro 210 215 220 Gly Val Tyr Thr Asp Val Ala Asn Tyr Leu Ala Trp Ile Gln Lys His 225 230 235 240 Ile Ala Ser <210> 5 <211> 615 <212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <222> (1)..(19) <223> Signal Peptide <220> <221> MISC_FEATURE <222> (20)..(372) <223> Heavy Chain <220> <221> MISC_FEATURE <222> (373)..(615) <223> Light Chain <400> 5 Met Arg Ala Leu Leu Leu Leu Gly Phe Leu Leu Val Ser Leu Glu Ser 1 5 10 15 Thr Leu Ser Ile Pro Pro Trp Glu Ala Pro Lys Glu His Lys Tyr Lys 20 25 30 Ala Glu Glu His Thr Val Val Leu Thr Val Thr Gly Glu Pro Cys His 35 40 45 Phe Pro Phe Gln Tyr His Arg Gln Leu Tyr His Lys Cys Thr His Lys 50 55 60 Gly Arg Pro Gly Pro Gln Pro Trp Cys Ala Thr Thr Pro Asn Phe Asp 65 70 75 80 Gln Asp Gln Arg Trp Gly Tyr Cys Leu Glu Pro Lys Lys Val Lys Asp 85 90 95 His Cys Ser Lys His Ser Pro Cys Gln Lys Gly Gly Thr Cys Val Asn 100 105 110 Met Pro Ser Gly Pro His Cys Leu Cys Pro Gln His Leu Thr Gly Asn 115 120 125 His Cys Gln Lys Glu Lys Cys Phe Glu Pro Gln Leu Leu Arg Phe Phe 130 135 140 His Lys Asn Glu Ile Trp Tyr Arg Thr Glu Gln Ala Ala Val Ala Arg 145 150 155 160 Cys Gln Cys Lys Gly Pro Asp Ala His Cys Gln Arg Leu Ala Ser Gln 165 170 175 Ala Cys Arg Thr Asn Pro Cys Leu His Gly Gly Arg Cys Leu Glu Val 180 185 190 Glu Gly His Arg Leu Cys His Cys Pro Val Gly Tyr Thr Gly Pro Phe 195 200 205 Cys Asp Val Asp Thr Lys Ala Ser Cys Tyr Asp Gly Arg Gly Leu Ser 210 215 220 Tyr Arg Gly Leu Ala Arg Thr Thr Leu Ser Gly Ala Pro Cys Gln Pro 225 230 235 240 Trp Ala Ser Glu Ala Thr Tyr Arg Asn Val Thr Ala Glu Gln Ala Arg 245 250 255 Asn Trp Gly Leu Gly Gly His Ala Phe Cys Arg Asn Pro Asp Asn Asp 260 265 270 Ile Arg Pro Trp Cys Phe Val Leu Asn Arg Asp Arg Leu Ser Trp Glu 275 280 285 Tyr Cys Asp Leu Ala Gln Cys Gln Thr Pro Thr Gln Ala Ala Pro Pro 290 295 300 Thr Pro Val Ser Pro Arg Leu His Val Pro Leu Met Pro Ala Gln Pro 305 310 315 320 Ala Pro Pro Lys Pro Gln Pro Thr Thr Arg Thr Pro Pro Gln Ser Gln 325 330 335 Thr Pro Gly Ala Leu Pro Ala Lys Arg Glu Gln Pro Pro Ser Leu Thr 340 345 350 Arg Asn Gly Pro Leu Ser Cys Gly Gln Arg Leu Arg Lys Ser Leu Ser 355 360 365 Ser Met Thr Arg Val Val Gly Gly Leu Val Ala Leu Arg Gly Ala His 370 375 380 Pro Tyr Ile Ala Ala Leu Tyr Trp Gly His Ser Phe Cys Ala Gly Ser 385 390 395 400 Leu Ile Ala Pro Cys Trp Val Leu Thr Ala Ala His Cys Leu Gln Asp 405 410 415 Arg Pro Ala Pro Glu Asp Leu Thr Val Val Leu Gly Gln Glu Arg Arg 420 425 430 Asn His Ser Cys Glu Pro Cys Gln Thr Leu Ala Val Arg Ser Tyr Arg 435 440 445 Leu His Glu Ala Phe Ser Pro Val Ser Tyr Gln His Asp Leu Ala Leu 450 455 460 Leu Arg Leu Gln Glu Asp Ala Asp Gly Ser Cys Ala Leu Leu Ser Pro 465 470 475 480 Tyr Val Gln Pro Val Cys Leu Pro Ser Gly Ala Ala Arg Pro Ser Glu 485 490 495 Thr Thr Leu Cys Gln Val Ala Gly Trp Gly His Gln Phe Glu Gly Ala 500 505 510 Glu Glu Tyr Ala Ser Phe Leu Gln Glu Ala Gln Val Pro Phe Leu Ser 515 520 525 Leu Glu Arg Cys Ser Ala Pro Asp Val His Gly Ser Ser Ile Leu Pro 530 535 540 Gly Met Leu Cys Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln 545 550 555 560 Gly Asp Ser Gly Gly Pro Leu Val Cys Glu Asp Gln Ala Ala Glu Arg 565 570 575 Arg Leu Thr Leu Gln Gly Ile Ile Ser Trp Gly Ser Gly Cys Gly Asp 580 585 590 Arg Asn Lys Pro Gly Val Tyr Thr Asp Val Ala Tyr Tyr Leu Ala Trp 595 600 605 Ile Arg Glu His Thr Val Ser 610 615 <210> 6 <211> 19 <212> PRT <213> Homo sapiens <400> 6 Met Arg Ala Leu Leu Leu Leu Gly Phe Leu Leu Val Ser Leu Glu Ser 1 5 10 15 Thr Leu Ser <210> 7 <211> 353 <212> PRT <213> Homo sapiens <400> 7 Ile Pro Pro Trp Glu Ala Pro Lys Glu His Lys Tyr Lys Ala Glu Glu 1 5 10 15 His Thr Val Val Leu Thr Val Thr Gly Glu Pro Cys His Phe Pro Phe 20 25 30 Gln Tyr His Arg Gln Leu Tyr His Lys Cys Thr His Lys Gly Arg Pro 35 40 45 Gly Pro Gln Pro Trp Cys Ala Thr Thr Pro Asn Phe Asp Gln Asp Gln 50 55 60 Arg Trp Gly Tyr Cys Leu Glu Pro Lys Lys Val Lys Asp His Cys Ser 65 70 75 80 Lys His Ser Pro Cys Gln Lys Gly Gly Thr Cys Val Asn Met Pro Ser 85 90 95 Gly Pro His Cys Leu Cys Pro Gln His Leu Thr Gly Asn His Cys Gln 100 105 110 Lys Glu Lys Cys Phe Glu Pro Gln Leu Leu Arg Phe Phe His Lys Asn 115 120 125 Glu Ile Trp Tyr Arg Thr Glu Gln Ala Ala Val Ala Arg Cys Gln Cys 130 135 140 Lys Gly Pro Asp Ala His Cys Gln Arg Leu Ala Ser Gln Ala Cys Arg 145 150 155 160 Thr Asn Pro Cys Leu His Gly Gly Arg Cys Leu Glu Val Glu Gly His 165 170 175 Arg Leu Cys His Cys Pro Val Gly Tyr Thr Gly Pro Phe Cys Asp Val 180 185 190 Asp Thr Lys Ala Ser Cys Tyr Asp Gly Arg Gly Leu Ser Tyr Arg Gly 195 200 205 Leu Ala Arg Thr Thr Leu Ser Gly Ala Pro Cys Gln Pro Trp Ala Ser 210 215 220 Glu Ala Thr Tyr Arg Asn Val Thr Ala Glu Gln Ala Arg Asn Trp Gly 225 230 235 240 Leu Gly Gly His Ala Phe Cys Arg Asn Pro Asp Asn Asp Ile Arg Pro 245 250 255 Trp Cys Phe Val Leu Asn Arg Asp Arg Leu Ser Trp Glu Tyr Cys Asp 260 265 270 Leu Ala Gln Cys Gln Thr Pro Thr Gln Ala Ala Pro Pro Thr Pro Val 275 280 285 Ser Pro Arg Leu His Val Pro Leu Met Pro Ala Gln Pro Ala Pro Pro 290 295 300 Lys Pro Gln Pro Thr Thr Arg Thr Pro Pro Gln Ser Gln Thr Pro Gly 305 310 315 320 Ala Leu Pro Ala Lys Arg Glu Gln Pro Pro Ser Leu Thr Arg Asn Gly 325 330 335 Pro Leu Ser Cys Gly Gln Arg Leu Arg Lys Ser Leu Ser Ser Met Thr 340 345 350 Arg <210> 8 <211> 243 <212> PRT <213> Homo sapiens <400> 8 Val Val Gly Gly Leu Val Ala Leu Arg Gly Ala His Pro Tyr Ile Ala 1 5 10 15 Ala Leu Tyr Trp Gly His Ser Phe Cys Ala Gly Ser Leu Ile Ala Pro 20 25 30 Cys Trp Val Leu Thr Ala Ala His Cys Leu Gln Asp Arg Pro Ala Pro 35 40 45 Glu Asp Leu Thr Val Val Leu Gly Gln Glu Arg Arg Asn His Ser Cys 50 55 60 Glu Pro Cys Gln Thr Leu Ala Val Arg Ser Tyr Arg Leu His Glu Ala 65 70 75 80 Phe Ser Pro Val Ser Tyr Gln His Asp Leu Ala Leu Leu Arg Leu Gln 85 90 95 Glu Asp Ala Asp Gly Ser Cys Ala Leu Leu Ser Pro Tyr Val Gln Pro 100 105 110 Val Cys Leu Pro Ser Gly Ala Ala Arg Pro Ser Glu Thr Thr Leu Cys 115 120 125 Gln Val Ala Gly Trp Gly His Gln Phe Glu Gly Ala Glu Glu Tyr Ala 130 135 140 Ser Phe Leu Gln Glu Ala Gln Val Pro Phe Leu Ser Leu Glu Arg Cys 145 150 155 160 Ser Ala Pro Asp Val His Gly Ser Ser Ile Leu Pro Gly Met Leu Cys 165 170 175 Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln Gly Asp Ser Gly 180 185 190 Gly Pro Leu Val Cys Glu Asp Gln Ala Ala Glu Arg Arg Leu Thr Leu 195 200 205 Gln Gly Ile Ile Ser Trp Gly Ser Gly Cys Gly Asp Arg Asn Lys Pro 210 215 220 Gly Val Tyr Thr Asp Val Ala Tyr Tyr Leu Ala Trp Ile Arg Glu His 225 230 235 240 Thr Val Ser <210> 9 <211> 1794 <212> DNA <213> Mus musculus <220> <221> misc_feature <222> (1)..(57) <223> Signal Peptide <220> <221> misc_feature <222> (58)..(1062) <223> Heavy Chain <220> <221> misc_feature <222> (1063)..(1791) <223> Light Chain <400> 9 atgacggctc tgttgttcct ggggtctctg ctgatgagtc tggatctgac actttcggct 60 ccaccatgga aagactccaa gaaatttaag gacgcacctg atgggcccac agtggttctc 120 actgtggatg ggaggctctg ccattttccc tttcagtacc accgtcagct acaccacaaa 180 tgcatccaca aaaggcggcc aggctcccgc ccctggtgtg ctaccacccc caactttgat 240 gaagatcagc aatggggata ctgcttggag cccaagaaag tgaaagacca ttgcagcaaa 300 cacaacccgt gccacaaagg agggacatgt atcaacaccc ccaatgggcc acactgtctc 360 tgccctgaac acctcactgg gaaacattgc cagaaagaga aatgctttga gcctcagctt 420 ctcaagttct tccacgagaa tgagctatgg tttagaacgg ggccaggagg tgtggccagg 480 tgcgagtgca aaggttctga ggctcactgc aagccggtgg ccagccaggc ctgcagcatc 540 aatccgtgcc ttaatggggg cagctgcctc ctcgtggagg accacccact gtgccgttgc 600 cctacaggct acactggata tttttgcgac ttggaccttt gggcgacctg ctatgaaggc 660 agggggctca gctaccgggg ccaggctgga actacgcaat cgggtgcgcc atgtcagcgg 720 tggaccgtgg aggccaccta ccggaacatg actgagaagc aagcgctaag ctggggcctg 780 ggccaccacg cattttgccg gaacccagat aatgacacac gtccatggtg cttcgtctgg 840 agtggcgaca ggctgagctg ggactattgc ggcctggagc agtgccagac gccaacgttt 900 gcacctctag ttgtccctga gagtcaggag gagtccccgt cccaggcacc atctctgtcc 960 catgcaccaa atgactcgac cgatcatcag acttctctgt ccaagaccaa cacgatgggc 1020 tgcggacaga ggttccgcaa gggactgtcc tcgttcatgc gcgtggtggg cggactagtg 1080 gctctgcctg ggtcgcaccc ctacatcgct gcactgtact ggggtaacaa cttctgcgcg 1140 ggcagtctca tcgccccctg ttgggtgctg accgcggctc actgcctgca gaatcggcca 1200 gcgcccgagg aactgacagt ggtacttggt caagatcgcc acaaccagag ctgcgagtgg 1260 tgccagactc tggctgtgcg ctcctaccgc cttcacgagg gcttctcctc catcacctac 1320 cagcacgact tggctctgct gcgcctgcag gaaagcaaaa ccaacagttg cgcgatcctg 1380 tcacctcacg ttcagcctgt gtgtctaccc agcggcgcgg ccccaccctc tgagacagtg 1440 ctctgcgagg tggccggctg gggtcaccag ttcgaggggg ctgaagaata ctccaccttc 1500 ctgcaggagg cacaggttcc ctttatcgcc ctggatcgct gctccaactc taacgtgcac 1560 ggagacgcca ttctccctgg gatgctttgc gctggcttct tggagggagg caccgatgcc 1620 tgccagggtg actccggggg ccctctggtg tgtgaggaag gaactgcaga acatcagctc 1680 accctgcgcg gagtcatcag ctggggctcc ggctgtggtg accgcaacaa gcccggagtc 1740 tacacagacg tggccaacta cctggcttgg atccagaagc atattgcttc ataa 1794 <210> 10 <211> 57 <212> DNA <213> Mus musculus <400> 10 atgacggctc tgttgttcct ggggtctctg ctgatgagtc tggatctgac actttcg 57 <210> 11 <211> 1005 <212> DNA <213> Mus musculus <400> 11 gctccaccat ggaaagactc caagaaattt aaggacgcac ctgatgggcc cacagtggtt 60 ctcactgtgg atgggaggct ctgccatttt ccctttcagt accaccgtca gctacaccac 120 aaatgcatcc acaaaaggcg gccaggctcc cgcccctggt gtgctaccac ccccaacttt 180 gatgaagatc agcaatgggg atactgcttg gagcccaaga aagtgaaaga ccattgcagc 240 aaacacaacc cgtgccacaa aggagggaca tgtatcaaca cccccaatgg gccacactgt 300 ctctgccctg aacacctcac tgggaaacat tgccagaaag agaaatgctt tgagcctcag 360 cttctcaagt tcttccacga gaatgagcta tggtttagaa cggggccagg aggtgtggcc 420 aggtgcgagt gcaaaggttc tgaggctcac tgcaagccgg tggccagcca ggcctgcagc 480 atcaatccgt gccttaatgg gggcagctgc ctcctcgtgg aggaccaccc actgtgccgt 540 tgccctacag gctacactgg atatttttgc gacttggacc tttgggcgac ctgctatgaa 600 ggcagggggc tcagctaccg gggccaggct ggaactacgc aatcgggtgc gccatgtcag 660 cggtggaccg tggaggccac ctaccggaac atgactgaga agcaagcgct aagctggggc 720 ctgggccacc acgcattttg ccggaaccca gataatgaca cacgtccatg gtgcttcgtc 780 tggagtggcg acaggctgag ctgggactat tgcggcctgg agcagtgcca gacgccaacg 840 tttgcacctc tagttgtccc tgagagtcag gaggagtccc cgtcccaggc accatctctg 900 tcccatgcac caaatgactc gaccgatcat cagacttctc tgtccaagac caacacgatg 960 ggctgcggac agaggttccg caagggactg tcctcgttca tgcgc 1005 <210> 12 <211> 729 <212> DNA <213> Mus musculus <400> 12 gtggtgggcg gactagtggc tctgcctggg tcgcacccct acatcgctgc actgtactgg 60 ggtaacaact tctgcgcggg cagtctcatc gccccctgtt gggtgctgac cgcggctcac 120 tgcctgcaga atcggccagc gcccgaggaa ctgacagtgg tacttggtca agatcgccac 180 aaccagagct gcgagtggtg ccagactctg gctgtgcgct cctaccgcct tcacgagggc 240 ttctcctcca tcacctacca gcacgacttg gctctgctgc gcctgcagga aagcaaaacc 300 aacagttgcg cgatcctgtc acctcacgtt cagcctgtgt gtctacccag cggcgcggcc 360 ccaccctctg agacagtgct ctgcgaggtg gccggctggg gtcaccagtt cgagggggct 420 gaagaatact ccaccttcct gcaggaggca caggttccct ttatcgccct ggatcgctgc 480 tccaactcta acgtgcacgg agacgccatt ctccctggga tgctttgcgc tggcttcttg 540 gagggaggca ccgatgcctg ccagggtgac tccgggggcc ctctggtgtg tgaggaagga 600 actgcagaac atcagctcac cctgcgcgga gtcatcagct ggggctccgg ctgtggtgac 660 cgcaacaagc ccggagtcta cacagacgtg gccaactacc tggcttggat ccagaagcat 720 attgcttca 729 <210> 13 <211> 1848 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (1)..(57) <223> Signal Peptide <220> <221> misc_feature <222> (58)..(1116) <223> Heavy Chain <220> <221> misc_feature <222> (1117)..(1845) <223> Light Chain <400> 13 atgagggctc tgctgctcct ggggttcctg ctggtgagct tggagtcaac actttcgatt 60 ccaccttggg aagcccccaa ggagcataag tacaaagctg aagagcacac agtcgttctc 120 actgtcaccg gggagccctg ccacttcccc ttccagtacc accggcagct gtaccacaaa 180 tgtacccaca agggccggcc aggccctcag ccctggtgtg ctaccacccc caactttgat 240 caggaccagc gatggggata ctgtttggag cccaagaaag tgaaagacca ctgcagcaaa 300 cacagcccct gccagaaagg agggacctgt gtgaacatgc caagcggccc ccactgtctc 360 tgtccacaac acctcactgg aaaccactgc cagaaagaga agtgctttga gcctcagctt 420 ctccggtttt tccacaagaa tgagatatgg tatagaactg agcaagcagc tgtggccaga 480 tgccagtgca agggtcctga tgcccactgc cagcggctgg ccagccaggc ctgccgcacc 540 aacccgtgcc tccatggggg tcgctgccta gaggtggagg gccaccgcct gtgccactgc 600 ccggtgggct acaccggacc cttctgcgac gtggacacca aggcaagctg ctatgatggc 660 cgcgggctca gctaccgcgg cctggccagg accacgctct cgggtgcgcc ctgtcagccg 720 tgggcctcgg aggccaccta ccggaacgtg actgccgagc aagcgcggaa ctggggactg 780 ggcggccacg ccttctgccg gaacccggac aacgacatcc gcccgtggtg cttcgtgctg 840 aaccgcgacc ggctgagctg ggagtactgc gacctggcac agtgccagac cccaacccag 900 gcggcgcctc cgaccccggt gtcccctagg cttcatgtcc cactcatgcc cgcgcagccg 960 gcaccgccga agcctcagcc cacgacccgg accccgcctc agtcccagac cccgggagcc 1020 ttgccggcga agcgggagca gccgccttcc ctgaccagga acggcccact gagctgcggg 1080 cagcggctcc gcaagagtct gtcttcgatg acccgcgtcg ttggcgggct ggtggcgcta 1140 cgcggggcgc acccctacat cgccgcgctg tactggggcc acagtttctg cgccggcagc 1200 ctcatcgccc cctgctgggt gctgacggcc gctcactgcc tgcaggaccg gcccgcaccc 1260 gaggatctga cggtggtgct cggccaggaa cgccgtaacc acagctgtga gccgtgccag 1320 acgttggccg tgcgctccta ccgcttgcac gaggccttct cgcccgtcag ctaccagcac 1380 gacctggctc tgttgcgcct tcaggaggat gcggacggca gctgcgcgct cctgtcgcct 1440 tacgttcagc cggtgtgcct gccaagcggc gccgcgcgac cctccgagac cacgctctgc 1500 caggtggccg gctggggcca ccagttcgag ggggcggagg aatatgccag cttcctgcag 1560 gaggcgcagg taccgttcct ctccctggag cgctgctcag ccccggacgt gcacggatcc 1620 tccatcctcc ccggcatgct ctgcgcaggg ttcctcgagg gcggcaccga tgcgtgccag 1680 ggtgattccg gaggcccgct ggtgtgtgag gaccaagctg cagagcgccg gctcaccctg 1740 caaggcatca tcagctgggg atcgggctgt ggtgaccgca acaagccagg cgtctacacc 1800 gatgtggcct actacctggc ctggatccgg gagcacaccg tttcctga 1848 <210> 14 <211> 57 <212> DNA <213> Homo sapiens <400> 14 atgagggctc tgctgctcct ggggttcctg ctggtgagct tggagtcaac actttcg 57 <210> 15 <211> 1059 <212> DNA <213> Homo sapiens <400> 15 attccacctt gggaagcccc caaggagcat aagtacaaag ctgaagagca cacagtcgtt 60 ctcactgtca ccggggagcc ctgccacttc cccttccagt accaccggca gctgtaccac 120 aaatgtaccc acaagggccg gccaggccct cagccctggt gtgctaccac ccccaacttt 180 gatcaggacc agcgatgggg atactgtttg gagcccaaga aagtgaaaga ccactgcagc 240 aaacacagcc cctgccagaa aggagggacc tgtgtgaaca tgccaagcgg cccccactgt 300 ctctgtccac aacacctcac tggaaaccac tgccagaaag agaagtgctt tgagcctcag 360 cttctccggt ttttccacaa gaatgagata tggtatagaa ctgagcaagc agctgtggcc 420 agatgccagt gcaagggtcc tgatgcccac tgccagcggc tggccagcca ggcctgccgc 480 accaacccgt gcctccatgg gggtcgctgc ctagaggtgg agggccaccg cctgtgccac 540 tgcccggtgg gctacaccgg acccttctgc gacgtggaca ccaaggcaag ctgctatgat 600 ggccgcgggc tcagctaccg cggcctggcc aggaccacgc tctcgggtgc gccctgtcag 660 ccgtgggcct cggaggccac ctaccggaac gtgactgccg agcaagcgcg gaactgggga 720 ctgggcggcc acgccttctg ccggaacccg gacaacgaca tccgcccgtg gtgcttcgtg 780 ctgaaccgcg accggctgag ctgggagtac tgcgacctgg cacagtgcca gaccccaacc 840 caggcggcgc ctccgacccc ggtgtcccct aggcttcatg tcccactcat gcccgcgcag 900 ccggcaccgc cgaagcctca gcccacgacc cggaccccgc ctcagtccca gaccccggga 960 gccttgccgg cgaagcggga gcagccgcct tccctgacca ggaacggccc actgagctgc 1020 gggcagcggc tccgcaagag tctgtcttcg atgacccgc 1059 <210> 16 <211> 729 <212> DNA <213> Homo sapiens <400> 16 gtcgttggcg ggctggtggc gctacgcggg gcgcacccct acatcgccgc gctgtactgg 60 ggccacagtt tctgcgccgg cagcctcatc gccccctgct gggtgctgac ggccgctcac 120 tgcctgcagg accggcccgc acccgaggat ctgacggtgg tgctcggcca ggaacgccgt 180 aaccacagct gtgagccgtg ccagacgttg gccgtgcgct cctaccgctt gcacgaggcc 240 ttctcgcccg tcagctacca gcacgacctg gctctgttgc gccttcagga ggatgcggac 300 ggcagctgcg cgctcctgtc gccttacgtt cagccggtgt gcctgccaag cggcgccgcg 360 cgaccctccg agaccacgct ctgccaggtg gccggctggg gccaccagtt cgagggggcg 420 gaggaatatg ccagcttcct gcaggaggcg caggtaccgt tcctctccct ggagcgctgc 480 tcagccccgg acgtgcacgg atcctccatc ctccccggca tgctctgcgc agggttcctc 540 gagggcggca ccgatgcgtg ccagggtgat tccggaggcc cgctggtgtg tgaggaccaa 600 gctgcagagc gccggctcac cctgcaaggc atcatcagct ggggatcggg ctgtggtgac 660 cgcaacaagc caggcgtcta caccgatgtg gcctactacc tggcctggat ccgggagcac 720 accgtttcc 729 <210> 17 <211> 12176 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(19) <223> Mouse Sequence <220> <221> misc_feature <222> (20)..(3893) <223> Human Sequence <220> <221> misc_feature <222> (20)..(22) <223> Start Codon <220> <221> misc_feature <222> (3742)..(3812) <223> Exon 4 <220> <221> misc_feature <222> (3894)..(8703) <223> Neo Self-Deleting Cassette <220> <221> misc_feature <222> (3894)..(3899) <223> XhoI <220> <221> misc_feature <222> (3900)..(3933) <223> LoxP <220> <221> misc_feature <222> (8632)..(8665) <223> LoxP <220> <221> misc_feature <222> (8672)..(8697) <223> I_Ceu <220> <221> misc_feature <222> (8698)..(8703) <223> NheI <220> <221> misc_feature <222> (8704)..(12065) <223> Human Sequence <220> <221> misc_feature <222> (8924)..(9034) <223> Exon 5 <220> <221> misc_feature <222> (9172)..(9303) <223> Exon 6 <220> <221> misc_feature <222> (9443)..(9547) <223> Exon 7 <220> <221> misc_feature <222> (12063)..(12065) <223> Stop Codon <220> <221> misc_feature <222> (12066)..(12176) <223> Mouse Sequence <400> 17 ggggccatcg gcagacgcca tgagggctct gctgctcctg gggttcctgc tggtgagctt 60 ggagtcaaca ctttcggtga gtgctgtggg aaccaggatt gtcccaggat tgttctgggg 120 ggtcgctatc acagccatga gccatggcct ctgctcatga cctgtgggtc caggtgacta 180 ggaggcctat gtggaaaggt gaggccagcc cggaaggccc aggcagagga gacagacaac 240 cagactgggt ggatacaagg gcacagcctg catttctggg ggagatgggc cttaagaaga 300 caacgggggg aggtagaaag ggtttgggtc ttgggaagaa atctctgcat ttctgggctg 360 tgagaggaag ctgcagacta gcaacagatc ggtggcaggc tatgacttat agtcagttcc 420 ctgccttctt ctctcccttg tagattccac cttgggaagc ccccaaggag cataagtaca 480 aagctgaaga gcacacagtc ggtaagtggc ctggctcctc ctcccgggaa cccttgggtg 540 gggatgtgta tggtgcagtg tgtgcagtct cagggcagtc tagtctagtg cctacctggt 600 gctaggtctt atgcccatgg gcactagagt gatcgtgagc tgtgtgatcc ttgagggcag 660 ggtatgggct gtgtctaagt gcccacgagc ctggctcgga gcaggtgctt gagatatgtg 720 ctgctggcgc catcacacct gggctcctgc cagccttcct cagtttcccc agcttctccc 780 cttcttttcc tttccccagt acgtctcatg ggcatcattc atgccacaca gaggccaggg 840 ccttcaatgg gcaaggaagg atcaagagct tgtctctggc atctgaatgc ctctgaagcc 900 cagctttatc acttatgagc tgggtgactc tgggcgaggg atttgagttc tccaagcttc 960 aatttcccct tctgtgaaac caggttgata acagtaaacc tcttagggtt gttgagaagg 1020 gaaacccatg tgaggtattc agcccatcac ctggtgcatg gaaatgcttt acaaatatta 1080 gcttttatta tgaaactacc ttttagatga agggtacctg ccatttcccc cttcctcaag 1140 ctctgccata gctccccatt gctttcattc ttccagacac taaattacct acatgccagg 1200 catggtggct catgcctgta atcccagcac tttgggaggc caaggtcggt ggatcatgag 1260 gtcaggagtt cgagaccagc ctggccaaca tggtgaaatg ctgtctctac taaaagtaca 1320 aaaattagcc aggcatggtg gcatgcgcca gtagtcccag ctactcggga ggctgaggca 1380 gaagaattgc ttgaacctgg gaggtgaagg ttgcagtgaa cgaagatcac accattgcac 1440 tccagcttgg gcaacacagc aagactccgt ctcaaaaaaa aaaaaaaaat ttacctagag 1500 tgtggcacat agcagggcct gtgaaccaga tggaccttac cctggtgggc ctgacttggt 1560 ggggttgagt ctctaagcat ggcgttgagg cccagcacat tccaaccctg gactccctca 1620 gcctcctctc ttcaccccac acccaaaagt ttctcctctc tcttgcctta cccaaacttg 1680 gtgccctatc cttgcctaat cccctgccta aggtccccct cctctctgtc cgtccatccc 1740 atctgcatct tttttttttt ttgagatgga gtctcgctct gtcccctagg ctagagtgca 1800 atggcgcgat cttggctcat tgcaacctcc gcctcctggg ttcaagcgat tctctgcctc 1860 agcctcccga gttgctggga ttacaggcac acaacttcat gctcagctaa tttttgtatt 1920 ttttagtaga gacagggttt caccatgttg gccaggctgg tctcgaactc ctgccctcag 1980 gtggtccgcc caccttagcc tcccaaagtg ctgggattac aggcgtgagc caccgcgcct 2040 ggcccccatt tgcatcttaa aggtccatct cagatccatt tccatttact gtcctagttc 2100 tggtttggtc cttggcaagt gcactttgcc ttgaacaaaa tagtggcaaa agcttattga 2160 gcaggtactt tgtgccagac actgctcagc atttcatggc attatctcat gaagccccac 2220 gacaattcct ctgaagaaga cacaggcaat tctcattatt cgcgatggtt atgttctata 2280 aaatcacagt gaacattgaa ctagcaaaca gtattaggtt cctgtgagcc tctggtcaca 2340 acattttcat caaccaacag catataatct ggttttatgt atgattctgt ttaaagacat 2400 tttatttagt atatgtgttg ctgattcatc aatgctaagc tgatggcact atagcacaca 2460 cctgaatcaa gtgtctaaca cacgctttct ccctaaggta gccttcttgt gcttaggaac 2520 tacacagctc ttcagcagga ggctcagagg ccatttccaa aagccaaatc cccagcaaaa 2580 gcacaaagtg tgaaaaacgt tgcactaagt agactgagaa ggacactcat tcaataggag 2640 agctgaaaca agcagcagca gcgtgacgcc ttgttgaacc ttaactggga atgtgcaaat 2700 ttttcactgc tctgtgcatg cccacaaatg gccatgaaaa catttcaagt attgacttgg 2760 gagttacaaa taaaattcag caagtaggca cattctcaat gtagaaccag agaagaatga 2820 ggatcaactg tactattatt actgccgttt tacagataag gaaaccaagg ctcagatcag 2880 agtggttaac agtgacttca acattcaaca agtattatta agtgcctact ttgtggcaag 2940 tgctcttcct ggccttggga ctgaagactt acccaaggtc acacagctag caggttgtgg 3000 agtcaggagt ctactccagc tatctgactc ctgaacccaa gttttttttt ttttctttaa 3060 gatggagtct cactctgtca cccaggctgg agtgcagtgg cgcgatctcg gctcactgca 3120 agctccgcct cccgggttca caccattctc ctgcctcggc ctcccgagta gctgggacta 3180 caggcacctg ccaccacccc cagctaattt ttttgtattt ttagtagaga gggggtttca 3240 ctgtattagc caggatggtc ttgatctcct gacctcgtga tctgcccgcc ttggcctccc 3300 aaagtgctgg gattacaggc ttgagccacc gcgcccggcc ctgaacccaa cttttagagc 3360 agaaagtgtt ttcaatgcac agcgaccttt ttgagggtct gtccttttcc tgaccagacc 3420 ctgagggaca gtgcctgagc agttgagtac aggggaagtc ctcagagagt gtgttgtccc 3480 tgcagttctc actgtcaccg gggagccctg ccacttcccc ttccagtacc accggcagct 3540 gtaccacaaa tgtacccaca agggccggcc aggccctcag ccctggtaag actacgcaga 3600 ggagttggag caggggcctg ggagacatgt accctgcctg tccttctgtc caaggaactc 3660 tgcttggaga gaggggactg tgatagggca gggtgggcca ggcccctggg tagagcaggg 3720 aagccttgtc tctttctaca ggtgtgctac cacccccaac tttgatcagg accagcgatg 3780 gggatactgt ttggagccca agaaagtgaa aggtgctaca cacagcctct ggggtggcct 3840 ggggctctct cctcccgcct cattactctc ctggtatcac cagaccccac acactcgaga 3900 taacttcgta taatgtatgc tatacgaagt tatatgcatg ccagtagcag cacccacgtc 3960 caccttctgt ctagtaatgt ccaacacctc cctcagtcca aacactgctc tgcatccatg 4020 tggctcccat ttatacctga agcacttgat ggggcctcaa tgttttacta gagcccaccc 4080 ccctgcaact ctgagaccct ctggatttgt ctgtcagtgc ctcactgggg cgttggataa 4140 tttcttaaaa ggtcaagttc cctcagcagc attctctgag cagtctgaag atgtgtgctt 4200 ttcacagttc aaatccatgt ggctgtttca cccacctgcc tggccttggg ttatctatca 4260 ggacctagcc tagaagcagg tgtgtggcac ttaacaccta agctgagtga ctaactgaac 4320 actcaagtgg atgccatctt tgtcacttct tgactgtgac acaagcaact cctgatgcca 4380 aagccctgcc cacccctctc atgcccatat ttggacatgg tacaggtcct cactggccat 4440 ggtctgtgag gtcctggtcc tctttgactt cataattcct aggggccact agtatctata 4500 agaggaagag ggtgctggct cccaggccac agcccacaaa attccacctg ctcacaggtt 4560 ggctggctcg acccaggtgg tgtcccctgc tctgagccag ctcccggcca agccagcacc 4620 atgggaaccc ccaagaagaa gaggaaggtg cgtaccgatt taaattccaa tttactgacc 4680 gtacaccaaa atttgcctgc attaccggtc gatgcaacga gtgatgaggt tcgcaagaac 4740 ctgatggaca tgttcaggga tcgccaggcg ttttctgagc atacctggaa aatgcttctg 4800 tccgtttgcc ggtcgtgggc ggcatggtgc aagttgaata accggaaatg gtttcccgca 4860 gaacctgaag atgttcgcga ttatcttcta tatcttcagg cgcgcggtct ggcagtaaaa 4920 actatccagc aacatttggg ccagctaaac atgcttcatc gtcggtccgg gctgccacga 4980 ccaagtgaca gcaatgctgt ttcactggtt atgcggcgga tccgaaaaga aaacgttgat 5040 gccggtgaac gtgcaaaaca ggtaaatata aaatttttaa gtgtataatg atgttaaact 5100 actgattcta attgtttgtg tattttaggc tctagcgttc gaacgcactg atttcgacca 5160 ggttcgttca ctcatggaaa atagcgatcg ctgccaggat atacgtaatc tggcatttct 5220 ggggattgct tataacaccc tgttacgtat agccgaaatt gccaggatca gggttaaaga 5280 tatctcacgt actgacggtg ggagaatgtt aatccatatt ggcagaacga aaacgctggt 5340 tagcaccgca ggtgtagaga aggcacttag cctgggggta actaaactgg tcgagcgatg 5400 gatttccgtc tctggtgtag ctgatgatcc gaataactac ctgttttgcc gggtcagaaa 5460 aaatggtgtt gccgcgccat ctgccaccag ccagctatca actcgcgccc tggaagggat 5520 ttttgaagca actcatcgat tgatttacgg cgctaaggat gactctggtc agagatacct 5580 ggcctggtct ggacacagtg cccgtgtcgg agccgcgcga gatatggccc gcgctggagt 5640 ttcaataccg gagatcatgc aagctggtgg ctggaccaat gtaaatattg tcatgaacta 5700 tatccgtaac ctggatagtg aaacaggggc aatggtgcgc ctgctggaag atggcgatta 5760 ggcggccggc cgctaatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac 5820 ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg 5880 tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 5940 gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat 6000 gtctggatcc cccggctaga gtttaaacac tagaactagt ggatcccccg ggatcatggc 6060 ctccgcgccg ggttttggcg cctcccgcgg gcgcccccct cctcacggcg agcgctgcca 6120 cgtcagacga agggcgcagc gagcgtcctg atccttccgc ccggacgctc aggacagcgg 6180 cccgctgctc ataagactcg gccttagaac cccagtatca gcagaaggac attttaggac 6240 gggacttggg tgactctagg gcactggttt tctttccaga gagcggaaca ggcgaggaaa 6300 agtagtccct tctcggcgat tctgcggagg gatctccgtg gggcggtgaa cgccgatgat 6360 tatataagga cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc 6420 ggttcttgtt tgtggatcgc tgtgatcgtc acttggtgag tagcgggctg ctgggctggc 6480 cggggctttc gtggccgccg ggccgctcgg tgggacggaa gcgtgtggag agaccgccaa 6540 gggctgtagt ctgggtccgc gagcaaggtt gccctgaact gggggttggg gggagcgcag 6600 caaaatggcg gctgttcccg agtcttgaat ggaagacgct tgtgaggcgg gctgtgaggt 6660 cgttgaaaca aggtgggggg catggtgggc ggcaagaacc caaggtcttg aggccttcgc 6720 taatgcggga aagctcttat tcgggtgaga tgggctgggg caccatctgg ggaccctgac 6780 gtgaagtttg tcactgactg gagaactcgg tttgtcgtct gttgcggggg cggcagttat 6840 ggcggtgccg ttgggcagtg cacccgtacc tttgggagcg cgcgccctcg tcgtgtcgtg 6900 acgtcacccg ttctgttggc ttataatgca gggtggggcc acctgccggt aggtgtgcgg 6960 taggcttttc tccgtcgcag gacgcagggt tcgggcctag ggtaggctct cctgaatcga 7020 caggcgccgg acctctggtg aggggaggga taagtgaggc gtcagtttct ttggtcggtt 7080 ttatgtacct atcttcttaa gtagctgaag ctccggtttt gaactatgcg ctcggggttg 7140 gcgagtgtgt tttgtgaagt tttttaggca ccttttgaaa tgtaatcatt tgggtcaata 7200 tgtaattttc agtgttagac tagtaaattg tccgctaaat tctggccgtt tttggctttt 7260 ttgttagacg tgttgacaat taatcatcgg catagtatat cggcatagta taatacgaca 7320 aggtgaggaa ctaaaccatg ggatcggcca ttgaacaaga tggattgcac gcaggttctc 7380 cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 7440 ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg 7500 acctgtccgg tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca 7560 cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 7620 tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 7680 aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 7740 cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 7800 ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg 7860 ccaggctcaa ggcgcgcatg cccgacggcg atgatctcgt cgtgacccat ggcgatgcct 7920 gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 7980 tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc 8040 ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc 8100 agcgcatcgc cttctatcgc cttcttgacg agttcttctg aggggatccg ctgtaagtct 8160 gcagaaattg atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt 8220 catactttgt taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc 8280 tacgggggtg ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta 8340 ctattgcttt atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa 8400 ttaagggcca gctcattcct cccactcatg atctatagat ctatagatct ctcgtgggat 8460 cattgttttt ctcttgattc ccactttgtg gttctaagta ctgtggtttc caaatgtgtc 8520 agtttcatag cctgaagaac gagatcagca gcctctgttc cacatacact tcattctcag 8580 tattgttttg ccaagttcta attccatcag acctcgacct gcagccccta gataacttcg 8640 tataatgtat gctatacgaa gttatgctag gtaactataa cggtcctaag gtagcgagct 8700 agccctggga ttctggaccc agccccttct ctccctccac aatacccttt ggaagtccag 8760 agggagagtt ctgggaagga gtggtcccat tttgcaggtg ggtaaaccaa gcttggaaac 8820 ttggagtagc aaggtcacaa ggcaagtagg ttcaagaagg gccttggccc ccagctgtgt 8880 gactcagctc cctgctcttc cttccaccat gtccatctct cagaccactg cagcaaacac 8940 agcccctgcc agaaaggagg gacctgtgtg aacatgccaa gcggccccca ctgtctctgt 9000 ccacaacacc tcactggaaa ccactgccag aaaggtgagg agatgtggag gacctgggcg 9060 gggtgctggg ggacaggggc aaccctgggc ctacagaata ggttgctgga tactcggaga 9120 cttggcatgg tcctagactc tcctgagacc actatccctc tttgtcccca gagaagtgct 9180 ttgagcctca gcttctccgg tttttccaca agaatgagat atggtataga actgagcaag 9240 cagctgtggc cagatgccag tgcaagggtc ctgatgccca ctgccagcgg ctggccagcc 9300 agggtgagca gatggttggg aacgggccag ggaggagcgt caggaagaca ggctggcagg 9360 aggccgggtg gtgtgccagg aaggagagct ctctgggggg gtctttaggc ccaggggtgg 9420 ctcactgcgt tccctcccca agcctgccgc accaacccgt gcctccatgg gggtcgctgc 9480 ctagaggtgg agggccaccg cctgtgccac tgcccggtgg gctacaccgg acccttctgc 9540 gacgtgggtg agtgagggtc tggggcaagc agaaggccag cccccaggtg ggacgggctt 9600 gccaggaagg aggagggaga gtgcggaaag cagatgagag ggaggcagga gagcccagcc 9660 ttggctgccc agggagcccc ctttctcctc agacaccaag gcaagctgct atgatggccg 9720 cgggctcagc taccgcggcc tggccaggac cacgctctcg ggtgcgccct gtcagccgtg 9780 ggcctcggag gccacctacc ggaacgtgac tgccgagcaa gcgcggaact ggggactggg 9840 cggccacgcc ttctgccggt gcgccgcgtg gggctgggtg acccctccgc cccagggctc 9900 cgggctcccg gcgctctaac ggcgccccgt cgtgtggcta caggaacccg gacaacgaca 9960 tccgcccgtg gtgcttcgtg ctgaaccgcg accggctgag ctgggagtac tgcgacctgg 10020 cacagtgcca gaccccaacc caggcggcgc ctccgacccc ggtgtcccct aggcttcatg 10080 tcccactcat gcccgcgcag ccggcaccgc cgaagcctca gcccacgacc cggaccccgc 10140 ctcagtccca gaccccggga ggttaggaag tggggggggg aaggaggagc cgagagggcg 10200 ccgggcgagc tagattccgg ccagccggcc gcgggctctc cgtcctcagc ccctgctcct 10260 ccacagcctt gccggcgaag cgggagcagc cgccttccct gaccaggaac ggcccactga 10320 gctgcgggca gcggctccgc aagagtctgt cttcgatgac ccgcgtcgtt ggcgggctgg 10380 tggcgctacg cggggcgcac ccctacatcg ccgcgctgta ctggggccac agtttctgcg 10440 ccggcagcct catcgccccc tgctgggtgc tgacggccgc tcactgcctg caggaccggc 10500 gagtacccgc ccgcccagag ccgccccagg ggccgcggct cctccgtctc ccagcgcagc 10560 ttccacgctg cacccgaacc cgtgccctac cttctcccgc cccacccttc tttccacgcc 10620 cctccggagc tcccggggag gaagctggaa cacgggattg gggttcggga gcagggggct 10680 tccccagaac gcttgtggcc aggtctgaga gcgctgcctc tcccctaccc cccccgcagg 10740 cccgcacccg aggatctgac ggtggtgctc ggccaggaac gccgtaacca cagctgtgag 10800 ccgtgccaga cgttggccgt gcgctcctac cgcttgcacg aggccttctc gcccgtcagc 10860 taccagcacg acctgggtgc gtgggggcgc cccgcgggga cgggaagaga gcttggggcc 10920 ccggcgtccc cgcctcacgc tcctctccgc ccgggttagc tctgttgcgc cttcaggagg 10980 atgcggacgg cagctgcgcg ctcctgtcgc cttacgttca gccggtgtgc ctgccaagcg 11040 gcgccgcgcg accctccgag accacgctct gccaggtggc cggctggggc caccagttcg 11100 agggtaggca caactgctag gggcaggggt aggggaggag acctttgatc actgggttag 11160 gcggaagaag cccgcgactt tggtatcgtt ccgggtgcct acagaatggg tggcgctgac 11220 ctgatgggtt gtgagaatgt gtaggtgaat cccaggtaga atcccagggc ctgggattca 11280 ctgctgggat ccccaaatct cctggggata cagggagaat cgaacttgct cttggttccc 11340 tctgggcgcc gggctgcaaa ggccaactag gacgctggcc ccgcgctccg ggctagtgtg 11400 ggagccaggt tctgcgactc tggatgggtg gtgggggagg ggtttctgtt tccgctccgc 11460 ccattcaaat cctggctttt ctctggacct cagcctcctt gcctatgaaa ttgaattaat 11520 ggcacctcct ccccttcggg cttgctgcga gagaggaagg gcatgagtgg gtttacaagc 11580 gcctggagca gctttgtcca tcgtccgggc ggcaagcgtt gtcagatggg gtgtgaagaa 11640 ggcgctctgt gttcgcaggg gcggaggaat atgccagctt cctgcaggag gcgcaggtac 11700 cgttcctctc cctggagcgc tgctcagccc cggacgtgca cggatcctcc atcctccccg 11760 gcatgctctg cgcagggttc ctcgagggcg gcaccgatgc gtgccaggtg agctcttagc 11820 ccggttggcg cccttccccg aggccgtcag gcacaaatct caggtccaca gcgctgagct 11880 gcgtgtttcc gacccagggt gattccggag gcccgctggt gtgtgaggac caagctgcag 11940 agcgccggct caccctgcaa ggcatcatca gctggggatc gggctgtggt gaccgcaaca 12000 agccaggcgt ctacaccgat gtggcctact acctggcctg gatccgggag cacaccgttt 12060 cctgactaac caggctttat ccttccctcc ttgtgtgctc cttgggatgg gacgatgaat 12120 gtggcatgct gggtcacagt gaagctagtg ccccgacact gggggcacag aaactc 12176 <210> 18 <211> 7444 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(19) <223> Mouse Sequence <220> <221> misc_feature <222> (20)..(3893) <223> Human Sequence <220> <221> misc_feature <222> (20)..(22) <223> Start Codon <220> <221> misc_feature <222> (3742)..(3812) <223> Exon 4 <220> <221> misc_feature <222> (3894)..(3971) <223> Deleted Neo Self-Deleting Cassette <220> <221> misc_feature <222> (3894)..(3899) <223> XhoI <220> <221> misc_feature <222> (3900)..(3933) <223> LoxP <220> <221> misc_feature <222> (3940)..(3965) <223> I_Ceu <220> <221> misc_feature <222> (3966)..(3971) <223> NheI <220> <221> misc_feature <222> (3972)..(7333) <223> Human Sequence <220> <221> misc_feature <222> (4192)..(4302) <223> Exon 5 <220> <221> misc_feature <222> (4440)..(4571) <223> Exon 6 <220> <221> misc_feature <222> (4711)..(4815) <223> Exon 7 <220> <221> misc_feature <222> (7331)..(7333) <223> Stop Codon <220> <221> misc_feature <222> (7334)..(7444) <223> Mouse Sequence <400> 18 ggggccatcg gcagacgcca tgagggctct gctgctcctg gggttcctgc tggtgagctt 60 ggagtcaaca ctttcggtga gtgctgtggg aaccaggatt gtcccaggat tgttctgggg 120 ggtcgctatc acagccatga gccatggcct ctgctcatga cctgtgggtc caggtgacta 180 ggaggcctat gtggaaaggt gaggccagcc cggaaggccc aggcagagga gacagacaac 240 cagactgggt ggatacaagg gcacagcctg catttctggg ggagatgggc cttaagaaga 300 caacgggggg aggtagaaag ggtttgggtc ttgggaagaa atctctgcat ttctgggctg 360 tgagaggaag ctgcagacta gcaacagatc ggtggcaggc tatgacttat agtcagttcc 420 ctgccttctt ctctcccttg tagattccac cttgggaagc ccccaaggag cataagtaca 480 aagctgaaga gcacacagtc ggtaagtggc ctggctcctc ctcccgggaa cccttgggtg 540 gggatgtgta tggtgcagtg tgtgcagtct cagggcagtc tagtctagtg cctacctggt 600 gctaggtctt atgcccatgg gcactagagt gatcgtgagc tgtgtgatcc ttgagggcag 660 ggtatgggct gtgtctaagt gcccacgagc ctggctcgga gcaggtgctt gagatatgtg 720 ctgctggcgc catcacacct gggctcctgc cagccttcct cagtttcccc agcttctccc 780 cttcttttcc tttccccagt acgtctcatg ggcatcattc atgccacaca gaggccaggg 840 ccttcaatgg gcaaggaagg atcaagagct tgtctctggc atctgaatgc ctctgaagcc 900 cagctttatc acttatgagc tgggtgactc tgggcgaggg atttgagttc tccaagcttc 960 aatttcccct tctgtgaaac caggttgata acagtaaacc tcttagggtt gttgagaagg 1020 gaaacccatg tgaggtattc agcccatcac ctggtgcatg gaaatgcttt acaaatatta 1080 gcttttatta tgaaactacc ttttagatga agggtacctg ccatttcccc cttcctcaag 1140 ctctgccata gctccccatt gctttcattc ttccagacac taaattacct acatgccagg 1200 catggtggct catgcctgta atcccagcac tttgggaggc caaggtcggt ggatcatgag 1260 gtcaggagtt cgagaccagc ctggccaaca tggtgaaatg ctgtctctac taaaagtaca 1320 aaaattagcc aggcatggtg gcatgcgcca gtagtcccag ctactcggga ggctgaggca 1380 gaagaattgc ttgaacctgg gaggtgaagg ttgcagtgaa cgaagatcac accattgcac 1440 tccagcttgg gcaacacagc aagactccgt ctcaaaaaaa aaaaaaaaat ttacctagag 1500 tgtggcacat agcagggcct gtgaaccaga tggaccttac cctggtgggc ctgacttggt 1560 ggggttgagt ctctaagcat ggcgttgagg cccagcacat tccaaccctg gactccctca 1620 gcctcctctc ttcaccccac acccaaaagt ttctcctctc tcttgcctta cccaaacttg 1680 gtgccctatc cttgcctaat cccctgccta aggtccccct cctctctgtc cgtccatccc 1740 atctgcatct tttttttttt ttgagatgga gtctcgctct gtcccctagg ctagagtgca 1800 atggcgcgat cttggctcat tgcaacctcc gcctcctggg ttcaagcgat tctctgcctc 1860 agcctcccga gttgctggga ttacaggcac acaacttcat gctcagctaa tttttgtatt 1920 ttttagtaga gacagggttt caccatgttg gccaggctgg tctcgaactc ctgccctcag 1980 gtggtccgcc caccttagcc tcccaaagtg ctgggattac aggcgtgagc caccgcgcct 2040 ggcccccatt tgcatcttaa aggtccatct cagatccatt tccatttact gtcctagttc 2100 tggtttggtc cttggcaagt gcactttgcc ttgaacaaaa tagtggcaaa agcttattga 2160 gcaggtactt tgtgccagac actgctcagc atttcatggc attatctcat gaagccccac 2220 gacaattcct ctgaagaaga cacaggcaat tctcattatt cgcgatggtt atgttctata 2280 aaatcacagt gaacattgaa ctagcaaaca gtattaggtt cctgtgagcc tctggtcaca 2340 acattttcat caaccaacag catataatct ggttttatgt atgattctgt ttaaagacat 2400 tttatttagt atatgtgttg ctgattcatc aatgctaagc tgatggcact atagcacaca 2460 cctgaatcaa gtgtctaaca cacgctttct ccctaaggta gccttcttgt gcttaggaac 2520 tacacagctc ttcagcagga ggctcagagg ccatttccaa aagccaaatc cccagcaaaa 2580 gcacaaagtg tgaaaaacgt tgcactaagt agactgagaa ggacactcat tcaataggag 2640 agctgaaaca agcagcagca gcgtgacgcc ttgttgaacc ttaactggga atgtgcaaat 2700 ttttcactgc tctgtgcatg cccacaaatg gccatgaaaa catttcaagt attgacttgg 2760 gagttacaaa taaaattcag caagtaggca cattctcaat gtagaaccag agaagaatga 2820 ggatcaactg tactattatt actgccgttt tacagataag gaaaccaagg ctcagatcag 2880 agtggttaac agtgacttca acattcaaca agtattatta agtgcctact ttgtggcaag 2940 tgctcttcct ggccttggga ctgaagactt acccaaggtc acacagctag caggttgtgg 3000 agtcaggagt ctactccagc tatctgactc ctgaacccaa gttttttttt ttttctttaa 3060 gatggagtct cactctgtca cccaggctgg agtgcagtgg cgcgatctcg gctcactgca 3120 agctccgcct cccgggttca caccattctc ctgcctcggc ctcccgagta gctgggacta 3180 caggcacctg ccaccacccc cagctaattt ttttgtattt ttagtagaga gggggtttca 3240 ctgtattagc caggatggtc ttgatctcct gacctcgtga tctgcccgcc ttggcctccc 3300 aaagtgctgg gattacaggc ttgagccacc gcgcccggcc ctgaacccaa cttttagagc 3360 agaaagtgtt ttcaatgcac agcgaccttt ttgagggtct gtccttttcc tgaccagacc 3420 ctgagggaca gtgcctgagc agttgagtac aggggaagtc ctcagagagt gtgttgtccc 3480 tgcagttctc actgtcaccg gggagccctg ccacttcccc ttccagtacc accggcagct 3540 gtaccacaaa tgtacccaca agggccggcc aggccctcag ccctggtaag actacgcaga 3600 ggagttggag caggggcctg ggagacatgt accctgcctg tccttctgtc caaggaactc 3660 tgcttggaga gaggggactg tgatagggca gggtgggcca ggcccctggg tagagcaggg 3720 aagccttgtc tctttctaca ggtgtgctac cacccccaac tttgatcagg accagcgatg 3780 gggatactgt ttggagccca agaaagtgaa aggtgctaca cacagcctct ggggtggcct 3840 ggggctctct cctcccgcct cattactctc ctggtatcac cagaccccac acactcgaga 3900 taacttcgta taatgtatgc tatacgaagt tatgctaggt aactataacg gtcctaaggt 3960 agcgagctag ccctgggatt ctggacccag ccccttctct ccctccacaa taccctttgg 4020 aagtccagag ggagagttct gggaaggagt ggtcccattt tgcaggtggg taaaccaagc 4080 ttggaaactt ggagtagcaa ggtcacaagg caagtaggtt caagaagggc cttggccccc 4140 agctgtgtga ctcagctccc tgctcttcct tccaccatgt ccatctctca gaccactgca 4200 gcaaacacag cccctgccag aaaggaggga cctgtgtgaa catgccaagc ggcccccact 4260 gtctctgtcc acaacacctc actggaaacc actgccagaa aggtgaggag atgtggagga 4320 cctgggcggg gtgctggggg acaggggcaa ccctgggcct acagaatagg ttgctggata 4380 ctcggagact tggcatggtc ctagactctc ctgagaccac tatccctctt tgtccccaga 4440 gaagtgcttt gagcctcagc ttctccggtt tttccacaag aatgagatat ggtatagaac 4500 tgagcaagca gctgtggcca gatgccagtg caagggtcct gatgcccact gccagcggct 4560 ggccagccag ggtgagcaga tggttgggaa cgggccaggg aggagcgtca ggaagacagg 4620 ctggcaggag gccgggtggt gtgccaggaa ggagagctct ctgggggggt ctttaggccc 4680 aggggtggct cactgcgttc cctccccaag cctgccgcac caacccgtgc ctccatgggg 4740 gtcgctgcct agaggtggag ggccaccgcc tgtgccactg cccggtgggc tacaccggac 4800 ccttctgcga cgtgggtgag tgagggtctg gggcaagcag aaggccagcc cccaggtggg 4860 acgggcttgc caggaaggag gagggagagt gcggaaagca gatgagaggg aggcaggaga 4920 gcccagcctt ggctgcccag ggagccccct ttctcctcag acaccaaggc aagctgctat 4980 gatggccgcg ggctcagcta ccgcggcctg gccaggacca cgctctcggg tgcgccctgt 5040 cagccgtggg cctcggaggc cacctaccgg aacgtgactg ccgagcaagc gcggaactgg 5100 ggactgggcg gccacgcctt ctgccggtgc gccgcgtggg gctgggtgac ccctccgccc 5160 cagggctccg ggctcccggc gctctaacgg cgccccgtcg tgtggctaca ggaacccgga 5220 caacgacatc cgcccgtggt gcttcgtgct gaaccgcgac cggctgagct gggagtactg 5280 cgacctggca cagtgccaga ccccaaccca ggcggcgcct ccgaccccgg tgtcccctag 5340 gcttcatgtc ccactcatgc ccgcgcagcc ggcaccgccg aagcctcagc ccacgacccg 5400 gaccccgcct cagtcccaga ccccgggagg ttaggaagtg ggggggggaa ggaggagccg 5460 agagggcgcc gggcgagcta gattccggcc agccggccgc gggctctccg tcctcagccc 5520 ctgctcctcc acagccttgc cggcgaagcg ggagcagccg ccttccctga ccaggaacgg 5580 cccactgagc tgcgggcagc ggctccgcaa gagtctgtct tcgatgaccc gcgtcgttgg 5640 cgggctggtg gcgctacgcg gggcgcaccc ctacatcgcc gcgctgtact ggggccacag 5700 tttctgcgcc ggcagcctca tcgccccctg ctgggtgctg acggccgctc actgcctgca 5760 ggaccggcga gtacccgccc gcccagagcc gccccagggg ccgcggctcc tccgtctccc 5820 agcgcagctt ccacgctgca cccgaacccg tgccctacct tctcccgccc cacccttctt 5880 tccacgcccc tccggagctc ccggggagga agctggaaca cgggattggg gttcgggagc 5940 agggggcttc cccagaacgc ttgtggccag gtctgagagc gctgcctctc ccctaccccc 6000 cccgcaggcc cgcacccgag gatctgacgg tggtgctcgg ccaggaacgc cgtaaccaca 6060 gctgtgagcc gtgccagacg ttggccgtgc gctcctaccg cttgcacgag gccttctcgc 6120 ccgtcagcta ccagcacgac ctgggtgcgt gggggcgccc cgcggggacg ggaagagagc 6180 ttggggcccc ggcgtccccg cctcacgctc ctctccgccc gggttagctc tgttgcgcct 6240 tcaggaggat gcggacggca gctgcgcgct cctgtcgcct tacgttcagc cggtgtgcct 6300 gccaagcggc gccgcgcgac cctccgagac cacgctctgc caggtggccg gctggggcca 6360 ccagttcgag ggtaggcaca actgctaggg gcaggggtag gggaggagac ctttgatcac 6420 tgggttaggc ggaagaagcc cgcgactttg gtatcgttcc gggtgcctac agaatgggtg 6480 gcgctgacct gatgggttgt gagaatgtgt aggtgaatcc caggtagaat cccagggcct 6540 gggattcact gctgggatcc ccaaatctcc tggggataca gggagaatcg aacttgctct 6600 tggttccctc tgggcgccgg gctgcaaagg ccaactagga cgctggcccc gcgctccggg 6660 ctagtgtggg agccaggttc tgcgactctg gatgggtggt gggggagggg tttctgtttc 6720 cgctccgccc attcaaatcc tggcttttct ctggacctca gcctccttgc ctatgaaatt 6780 gaattaatgg cacctcctcc ccttcgggct tgctgcgaga gaggaagggc atgagtgggt 6840 ttacaagcgc ctggagcagc tttgtccatc gtccgggcgg caagcgttgt cagatggggt 6900 gtgaagaagg cgctctgtgt tcgcaggggc ggaggaatat gccagcttcc tgcaggaggc 6960 gcaggtaccg ttcctctccc tggagcgctg ctcagccccg gacgtgcacg gatcctccat 7020 cctccccggc atgctctgcg cagggttcct cgagggcggc accgatgcgt gccaggtgag 7080 ctcttagccc ggttggcgcc cttccccgag gccgtcaggc acaaatctca ggtccacagc 7140 gctgagctgc gtgtttccga cccagggtga ttccggaggc ccgctggtgt gtgaggacca 7200 agctgcagag cgccggctca ccctgcaagg catcatcagc tggggatcgg gctgtggtga 7260 ccgcaacaag ccaggcgtct acaccgatgt ggcctactac ctggcctgga tccgggagca 7320 caccgtttcc tgactaacca ggctttatcc ttccctcctt gtgtgctcct tgggatggga 7380 cgatgaatgt ggcatgctgg gtcacagtga agctagtgcc ccgacactgg gggcacagaa 7440 actc 7444 <210> 19 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 tcggtggcag gctatgactt atag 24 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 cagttccctg ccttcttctc tccc 24 <210> 21 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 ggcttcccaa ggtggaatct ac 22 <210> 22 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 aagggcatga gtgggtttac aag 23 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 cgcctggagc agctttgtcc atc 23 <210> 24 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 acacagagcg ccttcttcac a 21 <210> 25 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 gttcctgcct tctctctcct a 21 <210> 26 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 taggctccac catggaaaga ctcca 25 <210> 27 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 cccatcaggt gcgtcctta 19 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 tcgctgctcc aactctaacg 20 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 acgccattct ccctgggatg ctt 23 <210> 30 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 atcggtgcct ccctccaaga ag 22 <210> 31 <211> 3874 <212> DNA <213> Homo sapiens <400> 31 atgagggctc tgctgctcct ggggttcctg ctggtgagct tggagtcaac actttcggtg 60 agtgctgtgg gaaccaggat tgtcccagga ttgttctggg gggtcgctat cacagccatg 120 agccatggcc tctgctcatg acctgtgggt ccaggtgact aggaggccta tgtggaaagg 180 tgaggccagc ccggaaggcc caggcagagg agacagacaa ccagactggg tggatacaag 240 ggcacagcct gcatttctgg gggagatggg ccttaagaag acaacggggg gaggtagaaa 300 gggtttgggt cttgggaaga aatctctgca tttctgggct gtgagaggaa gctgcagact 360 agcaacagat cggtggcagg ctatgactta tagtcagttc cctgccttct tctctccctt 420 gtagattcca ccttgggaag cccccaagga gcataagtac aaagctgaag agcacacagt 480 cggtaagtgg cctggctcct cctcccggga acccttgggt ggggatgtgt atggtgcagt 540 gtgtgcagtc tcagggcagt ctagtctagt gcctacctgg tgctaggtct tatgcccatg 600 ggcactagag tgatcgtgag ctgtgtgatc cttgagggca gggtatgggc tgtgtctaag 660 tgcccacgag cctggctcgg agcaggtgct tgagatatgt gctgctggcg ccatcacacc 720 tgggctcctg ccagccttcc tcagtttccc cagcttctcc ccttcttttc ctttccccag 780 tacgtctcat gggcatcatt catgccacac agaggccagg gccttcaatg ggcaaggaag 840 gatcaagagc ttgtctctgg catctgaatg cctctgaagc ccagctttat cacttatgag 900 ctgggtgact ctgggcgagg gatttgagtt ctccaagctt caatttcccc ttctgtgaaa 960 ccaggttgat aacagtaaac ctcttagggt tgttgagaag ggaaacccat gtgaggtatt 1020 cagcccatca cctggtgcat ggaaatgctt tacaaatatt agcttttatt atgaaactac 1080 cttttagatg aagggtacct gccatttccc ccttcctcaa gctctgccat agctccccat 1140 tgctttcatt cttccagaca ctaaattacc tacatgccag gcatggtggc tcatgcctgt 1200 aatcccagca ctttgggagg ccaaggtcgg tggatcatga ggtcaggagt tcgagaccag 1260 cctggccaac atggtgaaat gctgtctcta ctaaaagtac aaaaattagc caggcatggt 1320 ggcatgcgcc agtagtccca gctactcggg aggctgaggc agaagaattg cttgaacctg 1380 ggaggtgaag gttgcagtga acgaagatca caccattgca ctccagcttg ggcaacacag 1440 caagactccg tctcaaaaaa aaaaaaaaaa tttacctaga gtgtggcaca tagcagggcc 1500 tgtgaaccag atggacctta ccctggtggg cctgacttgg tggggttgag tctctaagca 1560 tggcgttgag gcccagcaca ttccaaccct ggactccctc agcctcctct cttcacccca 1620 cacccaaaag tttctcctct ctcttgcctt acccaaactt ggtgccctat ccttgcctaa 1680 tcccctgcct aaggtccccc tcctctctgt ccgtccatcc catctgcatc tttttttttt 1740 tttgagatgg agtctcgctc tgtcccctag gctagagtgc aatggcgcga tcttggctca 1800 ttgcaacctc cgcctcctgg gttcaagcga ttctctgcct cagcctcccg agttgctggg 1860 attacaggca cacaacttca tgctcagcta atttttgtat tttttagtag agacagggtt 1920 tcaccatgtt ggccaggctg gtctcgaact cctgccctca ggtggtccgc ccaccttagc 1980 ctcccaaagt gctgggatta caggcgtgag ccaccgcgcc tggcccccat ttgcatctta 2040 aaggtccatc tcagatccat ttccatttac tgtcctagtt ctggtttggt ccttggcaag 2100 tgcactttgc cttgaacaaa atagtggcaa aagcttattg agcaggtact ttgtgccaga 2160 cactgctcag catttcatgg cattatctca tgaagcccca cgacaattcc tctgaagaag 2220 acacaggcaa ttctcattat tcgcgatggt tatgttctat aaaatcacag tgaacattga 2280 actagcaaac agtattaggt tcctgtgagc ctctggtcac aacattttca tcaaccaaca 2340 gcatataatc tggttttatg tatgattctg tttaaagaca ttttatttag tatatgtgtt 2400 gctgattcat caatgctaag ctgatggcac tatagcacac acctgaatca agtgtctaac 2460 acacgctttc tccctaaggt agccttcttg tgcttaggaa ctacacagct cttcagcagg 2520 aggctcagag gccatttcca aaagccaaat ccccagcaaa agcacaaagt gtgaaaaacg 2580 ttgcactaag tagactgaga aggacactca ttcaatagga gagctgaaac aagcagcagc 2640 agcgtgacgc cttgttgaac cttaactggg aatgtgcaaa tttttcactg ctctgtgcat 2700 gcccacaaat ggccatgaaa acatttcaag tattgacttg ggagttacaa ataaaattca 2760 gcaagtaggc acattctcaa tgtagaacca gagaagaatg aggatcaact gtactattat 2820 tactgccgtt ttacagataa ggaaaccaag gctcagatca gagtggttaa cagtgacttc 2880 aacattcaac aagtattatt aagtgcctac tttgtggcaa gtgctcttcc tggccttggg 2940 actgaagact tacccaaggt cacacagcta gcaggttgtg gagtcaggag tctactccag 3000 ctatctgact cctgaaccca agtttttttt tttttcttta agatggagtc tcactctgtc 3060 acccaggctg gagtgcagtg gcgcgatctc ggctcactgc aagctccgcc tcccgggttc 3120 acaccattct cctgcctcgg cctcccgagt agctgggact acaggcacct gccaccaccc 3180 ccagctaatt tttttgtatt tttagtagag agggggtttc actgtattag ccaggatggt 3240 cttgatctcc tgacctcgtg atctgcccgc cttggcctcc caaagtgctg ggattacagg 3300 cttgagccac cgcgcccggc cctgaaccca acttttagag cagaaagtgt tttcaatgca 3360 cagcgacctt tttgagggtc tgtccttttc ctgaccagac cctgagggac agtgcctgag 3420 cagttgagta caggggaagt cctcagagag tgtgttgtcc ctgcagttct cactgtcacc 3480 ggggagccct gccacttccc cttccagtac caccggcagc tgtaccacaa atgtacccac 3540 aagggccggc caggccctca gccctggtaa gactacgcag aggagttgga gcaggggcct 3600 gggagacatg taccctgcct gtccttctgt ccaaggaact ctgcttggag agaggggact 3660 gtgatagggc agggtgggcc aggcccctgg gtagagcagg gaagccttgt ctctttctac 3720 aggtgtgcta ccacccccaa ctttgatcag gaccagcgat ggggatactg tttggagccc 3780 aagaaagtga aaggtgctac acacagcctc tggggtggcc tggggctctc tcctcccgcc 3840 tcattactct cctggtatca ccagacccca caca 3874 <210> 32 <211> 3362 <212> DNA <213> Homo sapiens <400> 32 cctgggattc tggacccagc cccttctctc cctccacaat accctttgga agtccagagg 60 gagagttctg ggaaggagtg gtcccatttt gcaggtgggt aaaccaagct tggaaacttg 120 gagtagcaag gtcacaaggc aagtaggttc aagaagggcc ttggccccca gctgtgtgac 180 tcagctccct gctcttcctt ccaccatgtc catctctcag accactgcag caaacacagc 240 ccctgccaga aaggagggac ctgtgtgaac atgccaagcg gcccccactg tctctgtcca 300 caacacctca ctggaaacca ctgccagaaa ggtgaggaga tgtggaggac ctgggcgggg 360 tgctggggga caggggcaac cctgggccta cagaataggt tgctggatac tcggagactt 420 ggcatggtcc tagactctcc tgagaccact atccctcttt gtccccagag aagtgctttg 480 agcctcagct tctccggttt ttccacaaga atgagatatg gtatagaact gagcaagcag 540 ctgtggccag atgccagtgc aagggtcctg atgcccactg ccagcggctg gccagccagg 600 gtgagcagat ggttgggaac gggccaggga ggagcgtcag gaagacaggc tggcaggagg 660 ccgggtggtg tgccaggaag gagagctctc tgggggggtc tttaggccca ggggtggctc 720 actgcgttcc ctccccaagc ctgccgcacc aacccgtgcc tccatggggg tcgctgccta 780 gaggtggagg gccaccgcct gtgccactgc ccggtgggct acaccggacc cttctgcgac 840 gtgggtgagt gagggtctgg ggcaagcaga aggccagccc ccaggtggga cgggcttgcc 900 aggaaggagg agggagagtg cggaaagcag atgagaggga ggcaggagag cccagccttg 960 gctgcccagg gagccccctt tctcctcaga caccaaggca agctgctatg atggccgcgg 1020 gctcagctac cgcggcctgg ccaggaccac gctctcgggt gcgccctgtc agccgtgggc 1080 ctcggaggcc acctaccgga acgtgactgc cgagcaagcg cggaactggg gactgggcgg 1140 ccacgccttc tgccggtgcg ccgcgtgggg ctgggtgacc cctccgcccc agggctccgg 1200 gctcccggcg ctctaacggc gccccgtcgt gtggctacag gaacccggac aacgacatcc 1260 gcccgtggtg cttcgtgctg aaccgcgacc ggctgagctg ggagtactgc gacctggcac 1320 agtgccagac cccaacccag gcggcgcctc cgaccccggt gtcccctagg cttcatgtcc 1380 cactcatgcc cgcgcagccg gcaccgccga agcctcagcc cacgacccgg accccgcctc 1440 agtcccagac cccgggaggt taggaagtgg gggggggaag gaggagccga gagggcgccg 1500 ggcgagctag attccggcca gccggccgcg ggctctccgt cctcagcccc tgctcctcca 1560 cagccttgcc ggcgaagcgg gagcagccgc cttccctgac caggaacggc ccactgagct 1620 gcgggcagcg gctccgcaag agtctgtctt cgatgacccg cgtcgttggc gggctggtgg 1680 cgctacgcgg ggcgcacccc tacatcgccg cgctgtactg gggccacagt ttctgcgccg 1740 gcagcctcat cgccccctgc tgggtgctga cggccgctca ctgcctgcag gaccggcgag 1800 tacccgcccg cccagagccg ccccaggggc cgcggctcct ccgtctccca gcgcagcttc 1860 cacgctgcac ccgaacccgt gccctacctt ctcccgcccc acccttcttt ccacgcccct 1920 ccggagctcc cggggaggaa gctggaacac gggattgggg ttcgggagca gggggcttcc 1980 ccagaacgct tgtggccagg tctgagagcg ctgcctctcc cctacccccc ccgcaggccc 2040 gcacccgagg atctgacggt ggtgctcggc caggaacgcc gtaaccacag ctgtgagccg 2100 tgccagacgt tggccgtgcg ctcctaccgc ttgcacgagg ccttctcgcc cgtcagctac 2160 cagcacgacc tgggtgcgtg ggggcgcccc gcggggacgg gaagagagct tggggccccg 2220 gcgtccccgc ctcacgctcc tctccgcccg ggttagctct gttgcgcctt caggaggatg 2280 cggacggcag ctgcgcgctc ctgtcgcctt acgttcagcc ggtgtgcctg ccaagcggcg 2340 ccgcgcgacc ctccgagacc acgctctgcc aggtggccgg ctggggccac cagttcgagg 2400 gtaggcacaa ctgctagggg caggggtagg ggaggagacc tttgatcact gggttaggcg 2460 gaagaagccc gcgactttgg tatcgttccg ggtgcctaca gaatgggtgg cgctgacctg 2520 atgggttgtg agaatgtgta ggtgaatccc aggtagaatc ccagggcctg ggattcactg 2580 ctgggatccc caaatctcct ggggatacag ggagaatcga acttgctctt ggttccctct 2640 gggcgccggg ctgcaaaggc caactaggac gctggccccg cgctccgggc tagtgtggga 2700 gccaggttct gcgactctgg atgggtggtg ggggaggggt ttctgtttcc gctccgccca 2760 ttcaaatcct ggcttttctc tggacctcag cctccttgcc tatgaaattg aattaatggc 2820 acctcctccc cttcgggctt gctgcgagag aggaagggca tgagtgggtt tacaagcgcc 2880 tggagcagct ttgtccatcg tccgggcggc aagcgttgtc agatggggtg tgaagaaggc 2940 gctctgtgtt cgcaggggcg gaggaatatg ccagcttcct gcaggaggcg caggtaccgt 3000 tcctctccct ggagcgctgc tcagccccgg acgtgcacgg atcctccatc ctccccggca 3060 tgctctgcgc agggttcctc gagggcggca ccgatgcgtg ccaggtgagc tcttagcccg 3120 gttggcgccc ttccccgagg ccgtcaggca caaatctcag gtccacagcg ctgagctgcg 3180 tgtttccgac ccagggtgat tccggaggcc cgctggtgtg tgaggaccaa gctgcagagc 3240 gccggctcac cctgcaaggc atcatcagct ggggatcggg ctgtggtgac cgcaacaagc 3300 caggcgtcta caccgatgtg gcctactacc tggcctggat ccgggagcac accgtttcct 3360 ga 3362 <210> 33 <211> 1971 <212> DNA <213> Mus musculus <400> 33 actcctgggc aggcagcggg gccatcggca gacgccatga cggctctgtt gttcctgggg 60 tctctgctga tgagtctgga tctgacactt tcggctccac catggaaaga ctccaagaaa 120 tttaaggacg cacctgatgg gcccacagtg gttctcactg tggatgggag gctctgccat 180 tttccctttc agtaccaccg tcagctacac cacaaatgca tccacaaaag gcggccaggc 240 tcccgcccct ggtgtgctac cacccccaac tttgatgaag atcagcaatg gggatactgc 300 ttggagccca agaaagtgaa agaccattgc agcaaacaca acccgtgcca caaaggaggg 360 acatgtatca acacccccaa tgggccacac tgtctctgcc ctgaacacct cactgggaaa 420 cattgccaga aagagaaatg ctttgagcct cagcttctca agttcttcca cgagaatgag 480 ctatggttta gaacggggcc aggaggtgtg gccaggtgcg agtgcaaagg ttctgaggct 540 cactgcaagc cggtggccag ccaggcctgc agcatcaatc cgtgccttaa tgggggcagc 600 tgcctcctcg tggaggacca cccactgtgc cgttgcccta caggctacac tggatatttt 660 tgcgacttgg acctttgggc gacctgctat gaaggcaggg ggctcagcta ccggggccag 720 gctggaacta cgcaatcggg tgcgccatgt cagcggtgga ccgtggaggc cacctaccgg 780 aacatgactg agaagcaagc gctaagctgg ggcctgggcc accacgcatt ttgccggaac 840 ccagataatg acacacgtcc atggtgcttc gtctggagtg gcgacaggct gagctgggac 900 tattgcggcc tggagcagtg ccagacgcca acgtttgcac ctctagttgt ccctgagagt 960 caggaggagt ccccgtccca ggcaccatct ctgtcccatg caccaaatga ctcgaccgat 1020 catcagactt ctctgtccaa gaccaacacg atgggctgcg gacagaggtt ccgcaaggga 1080 ctgtcctcgt tcatgcgcgt ggtgggcgga ctagtggctc tgcctgggtc gcacccctac 1140 atcgctgcac tgtactgggg taacaacttc tgcgcgggca gtctcatcgc cccctgttgg 1200 gtgctgaccg cggctcactg cctgcagaat cggccagcgc ccgaggaact gacagtggta 1260 cttggtcaag atcgccacaa ccagagctgc gagtggtgcc agactctggc tgtgcgctcc 1320 taccgccttc acgagggctt ctcctccatc acctaccagc acgacttggc tctgctgcgc 1380 ctgcaggaaa gcaaaaccaa cagttgcgcg atcctgtcac ctcacgttca gcctgtgtgt 1440 ctacccagcg gcgcggcccc accctctgag acagtgctct gcgaggtggc cggctggggt 1500 caccagttcg agggggctga agaatactcc accttcctgc aggaggcaca ggttcccttt 1560 atcgccctgg atcgctgctc caactctaac gtgcacggag acgccattct ccctgggatg 1620 ctttgcgctg gcttcttgga gggaggcacc gatgcctgcc agggtgactc cgggggccct 1680 ctggtgtgtg aggaaggaac tgcagaacat cagctcaccc tgcgcggagt catcagctgg 1740 ggctccggct gtggtgaccg caacaagccc ggagtctaca cagacgtggc caactacctg 1800 gcttggatcc agaagcatat tgcttcataa ctaaccaggc tttatccttc cctccttgtg 1860 tgctccttgg gatgggacga tgaatgtggc atgctgggtc acagtgaagc tagtgccccg 1920 acactggggg cacagaaact caataaagtg ctttgaaaac gttcctcaga a 1971 <210> 34 <211> 2060 <212> DNA <213> Homo sapiens <400> 34 ctattgatct ggactcctgg ataggcagct ggaccaacgg acggatgcca tgagggctct 60 gctgctcctg gggttcctgc tggtgagctt ggagtcaaca ctttcgattc caccttggga 120 agcccccaag gagcataagt acaaagctga agagcacaca gtcgttctca ctgtcaccgg 180 ggagccctgc cacttcccct tccagtacca ccggcagctg taccacaaat gtacccacaa 240 gggccggcca ggccctcagc cctggtgtgc taccaccccc aactttgatc aggaccagcg 300 atggggatac tgtttggagc ccaagaaagt gaaagaccac tgcagcaaac acagcccctg 360 ccagaaagga gggacctgtg tgaacatgcc aagcggcccc cactgtctct gtccacaaca 420 cctcactgga aaccactgcc agaaagagaa gtgctttgag cctcagcttc tccggttttt 480 ccacaagaat gagatatggt atagaactga gcaagcagct gtggccagat gccagtgcaa 540 gggtcctgat gcccactgcc agcggctggc cagccaggcc tgccgcacca acccgtgcct 600 ccatgggggt cgctgcctag aggtggaggg ccaccgcctg tgccactgcc cggtgggcta 660 caccggagcc ttctgcgacg tggacaccaa ggcaagctgc tatgatggcc gcgggctcag 720 ctaccgcggc ctggccagga ccacgctctc gggtgcgccc tgtcagccgt gggcctcgga 780 ggccacctac cggaacgtga ctgccgagca agcgcggaac tggggactgg gcggccacgc 840 cttctgccgg aacccggaca acgacatccg cccgtggtgc ttcgtgctga accgcgaccg 900 gctgagctgg gagtactgcg acctggcaca gtgccagacc ccaacccagg cggcgcctcc 960 gaccccggtg tcccctaggc ttcatgtccc actcatgccc gcgcagccgg caccgccgaa 1020 gcctcagccc acgacccgga ccccgcctca gtcccagacc ccgggagcct tgccggcgaa 1080 gcgggagcag ccgccttccc tgaccaggaa cggcccactg agctgcgggc agcggctccg 1140 caagagtctg tcttcgatga cccgcgtcgt tggcgggctg gtggcgctac gcggggcgca 1200 cccctacatc gccgcgctgt actggggcca cagtttctgc gccggcagcc tcatcgcccc 1260 ctgctgggtg ctgacggccg ctcactgcct gcaggaccgg cccgcacccg aggatctgac 1320 ggtggtgctc ggccaggaac gccgtaacca cagctgtgag ccgtgccaga cgttggccgt 1380 gcgctcctac cgcttgcacg aggccttctc gcccgtcagc taccagcacg acctggctct 1440 gttgcgcctt caggaggatg cggacggcag ctgcgcgctc ctgtcgcctt acgttcagcc 1500 ggtgtgcctg ccaagcggcg ccgcgcgacc ctccgagacc acgctctgcc aggtggccgg 1560 ctggggccac cagttcgagg gggcggagga atatgccagc ttcctgcagg aggcgcaggt 1620 accgttcctc tccctggagc gctgctcagc cccggacgtg cacggatcct ccatcctccc 1680 cggcatgctc tgcgcagggt tcctcgaggg cggcaccgat gcgtgccagg gtgattccgg 1740 aggcccgctg gtgtgtgagg accaagctgc agagcgccgg ctcaccctgc aaggcatcat 1800 cagctgggga tcgggctgtg gtgaccgcaa caagccaggc gtctacaccg atgtggccta 1860 ctacctggcc tggatccggg agcacaccgt ttcctgattg ctcagggact catctttccc 1920 tccttggtga ttccgcagtg agagagtggc tggggcatgg aaggcaagat tgtgtcccat 1980 tcccccagtg cggccagctc cgcgccagga tggcgcagga actcaataaa gtgctttgaa 2040 aatgctgaga aaaaaaaaaa 2060 <210> 35 <211> 1391 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> MISC_FEATURE <222> (4)..(10) <223> 5' NLS <220> <221> MISC_FEATURE <222> (1376)..(1391) <223> 3' NLS <400> 35 Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu 1 5 10 15 Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr 20 25 30 Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His 35 40 45 Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu 50 55 60 Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr 65 70 75 80 Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu 85 90 95 Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe 100 105 110 Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn 115 120 125 Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His 130 135 140 Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu 145 150 155 160 Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu 165 170 175 Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe 180 185 190 Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile 195 200 205 Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser 210 215 220 Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys 225 230 235 240 Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr 245 250 255 Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln 260 265 270 Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln 275 280 285 Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser 290 295 300 Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr 305 310 315 320 Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His 325 330 335 Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu 340 345 350 Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly 355 360 365 Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys 370 375 380 Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu 385 390 395 400 Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser 405 410 415 Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg 420 425 430 Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu 435 440 445 Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg 450 455 460 Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile 465 470 475 480 Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln 485 490 495 Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu 500 505 510 Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr 515 520 525 Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro 530 535 540 Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe 545 550 555 560 Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe 565 570 575 Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp 580 585 590 Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile 595 600 605 Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu 610 615 620 Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu 625 630 635 640 Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys 645 650 655 Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 660 665 670 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp 675 680 685 Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile 690 695 700 His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val 705 710 715 720 Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly 725 730 735 Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp 740 745 750 Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile 755 760 765 Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 770 775 780 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser 785 790 795 800 Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu 805 810 815 Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp 820 825 830 Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 835 840 845 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu 850 855 860 Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu 865 870 875 880 Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala 885 890 895 Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 900 905 910 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu 915 920 925 Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser 930 935 940 Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val 945 950 955 960 Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp 965 970 975 Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His 980 985 990 Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr 995 1000 1005 Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr 1010 1015 1020 Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys 1025 1030 1035 Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe 1040 1045 1050 Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro 1055 1060 1065 Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys 1070 1075 1080 Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln 1085 1090 1095 Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser 1100 1105 1110 Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala 1115 1120 1125 Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1130 1135 1140 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys 1145 1150 1155 Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile 1160 1165 1170 Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe 1175 1180 1185 Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile 1190 1195 1200 Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys 1205 1210 1215 Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu 1220 1225 1230 Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His 1235 1240 1245 Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln 1250 1255 1260 Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu 1265 1270 1275 Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn 1280 1285 1290 Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro 1295 1300 1305 Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr 1310 1315 1320 Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile 1325 1330 1335 Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr 1340 1345 1350 Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp 1355 1360 1365 Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys 1370 1375 1380 Ala Gly Gln Ala Lys Lys Lys Lys 1385 1390 <210> 36 <211> 4176 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(3) <223> Start Codon <220> <221> misc_feature <222> (10)..(30) <223> 5' NLS <220> <221> misc_feature <222> (4126)..(4173) <223> 3' NLS <220> <221> misc_feature <222> (4174)..(4176) <223> Stop Codon <400> 36 atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60 aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120 gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180 gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240 aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300 gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360 gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420 accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480 atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540 ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600 cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660 gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720 aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780 agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840 gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900 aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960 aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020 ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080 cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140 aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200 aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260 atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320 aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380 cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440 accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500 agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560 ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620 atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680 aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740 tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800 taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860 gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920 gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980 aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040 cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100 atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160 tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220 aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280 cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340 cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400 cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460 tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520 tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580 aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640 gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700 cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760 gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820 atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880 aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940 aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000 ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060 aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120 gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180 aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240 tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300 atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360 aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420 ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480 tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540 tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600 ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660 ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720 aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780 cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840 agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900 tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960 accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020 aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080 ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140 actaagaagg ccggacaggc caaaaagaag aagtga 4176 <210> 37 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 guuuuagagc uaugcu 16 <210> 38 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60 gugcuuu 67 <210> 39 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugcu 77 <210> 40 <211> 82 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60 aaaaguggca ccgagucggu gc 82 <210> 41 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 42 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60 uugaaaaagu ggcaccgagu cggugc 86 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (2)..(21) <223> n is a, c, g, or t <400> 43 gnnnnnnnnn nnnnnnnnnn ngg 23 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(21) <223> n is a, c, g, or t <400> 44 nnnnnnnnnn nnnnnnnnnn ngg 23 <210> 45 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (3)..(23) <223> n is a, c, g, or t <400> 45 ggnnnnnnnn nnnnnnnnnn nnngg 25 <210> 46 <211> 615 <212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <222> (1)..(19) <223> Signal Peptide <220> <221> MISC_FEATURE <222> (20)..(372) <223> Heavy Chain <220> <221> MISC_FEATURE <222> (373)..(615) <223> Light Chain <400> 46 Met Arg Ala Leu Leu Leu Leu Gly Phe Leu Leu Val Ser Leu Glu Ser 1 5 10 15 Thr Leu Ser Ile Pro Pro Trp Glu Ala Pro Lys Glu His Lys Tyr Lys 20 25 30 Ala Glu Glu His Thr Val Val Leu Thr Val Thr Gly Glu Pro Cys His 35 40 45 Phe Pro Phe Gln Tyr His Arg Gln Leu Tyr His Lys Cys Thr His Lys 50 55 60 Gly Arg Pro Gly Pro Gln Pro Trp Cys Ala Thr Thr Pro Asn Phe Asp 65 70 75 80 Gln Asp Gln Arg Trp Gly Tyr Cys Leu Glu Pro Lys Lys Val Lys Asp 85 90 95 His Cys Ser Lys His Ser Pro Cys Gln Lys Gly Gly Thr Cys Val Asn 100 105 110 Met Pro Ser Gly Pro His Cys Leu Cys Pro Gln His Leu Thr Gly Asn 115 120 125 His Cys Gln Lys Glu Lys Cys Phe Glu Pro Gln Leu Leu Arg Phe Phe 130 135 140 His Lys Asn Glu Ile Trp Tyr Arg Thr Glu Gln Ala Ala Val Ala Arg 145 150 155 160 Cys Gln Cys Lys Gly Pro Asp Ala His Cys Gln Arg Leu Ala Ser Gln 165 170 175 Ala Cys Arg Thr Asn Pro Cys Leu His Gly Gly Arg Cys Leu Glu Val 180 185 190 Glu Gly His Arg Leu Cys His Cys Pro Val Gly Tyr Thr Gly Ala Phe 195 200 205 Cys Asp Val Asp Thr Lys Ala Ser Cys Tyr Asp Gly Arg Gly Leu Ser 210 215 220 Tyr Arg Gly Leu Ala Arg Thr Thr Leu Ser Gly Ala Pro Cys Gln Pro 225 230 235 240 Trp Ala Ser Glu Ala Thr Tyr Arg Asn Val Thr Ala Glu Gln Ala Arg 245 250 255 Asn Trp Gly Leu Gly Gly His Ala Phe Cys Arg Asn Pro Asp Asn Asp 260 265 270 Ile Arg Pro Trp Cys Phe Val Leu Asn Arg Asp Arg Leu Ser Trp Glu 275 280 285 Tyr Cys Asp Leu Ala Gln Cys Gln Thr Pro Thr Gln Ala Ala Pro Pro 290 295 300 Thr Pro Val Ser Pro Arg Leu His Val Pro Leu Met Pro Ala Gln Pro 305 310 315 320 Ala Pro Pro Lys Pro Gln Pro Thr Thr Arg Thr Pro Pro Gln Ser Gln 325 330 335 Thr Pro Gly Ala Leu Pro Ala Lys Arg Glu Gln Pro Pro Ser Leu Thr 340 345 350 Arg Asn Gly Pro Leu Ser Cys Gly Gln Arg Leu Arg Lys Ser Leu Ser 355 360 365 Ser Met Thr Arg Val Val Gly Gly Leu Val Ala Leu Arg Gly Ala His 370 375 380 Pro Tyr Ile Ala Ala Leu Tyr Trp Gly His Ser Phe Cys Ala Gly Ser 385 390 395 400 Leu Ile Ala Pro Cys Trp Val Leu Thr Ala Ala His Cys Leu Gln Asp 405 410 415 Arg Pro Ala Pro Glu Asp Leu Thr Val Val Leu Gly Gln Glu Arg Arg 420 425 430 Asn His Ser Cys Glu Pro Cys Gln Thr Leu Ala Val Arg Ser Tyr Arg 435 440 445 Leu His Glu Ala Phe Ser Pro Val Ser Tyr Gln His Asp Leu Ala Leu 450 455 460 Leu Arg Leu Gln Glu Asp Ala Asp Gly Ser Cys Ala Leu Leu Ser Pro 465 470 475 480 Tyr Val Gln Pro Val Cys Leu Pro Ser Gly Ala Ala Arg Pro Ser Glu 485 490 495 Thr Thr Leu Cys Gln Val Ala Gly Trp Gly His Gln Phe Glu Gly Ala 500 505 510 Glu Glu Tyr Ala Ser Phe Leu Gln Glu Ala Gln Val Pro Phe Leu Ser 515 520 525 Leu Glu Arg Cys Ser Ala Pro Asp Val His Gly Ser Ser Ile Leu Pro 530 535 540 Gly Met Leu Cys Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln 545 550 555 560 Gly Asp Ser Gly Gly Pro Leu Val Cys Glu Asp Gln Ala Ala Glu Arg 565 570 575 Arg Leu Thr Leu Gln Gly Ile Ile Ser Trp Gly Ser Gly Cys Gly Asp 580 585 590 Arg Asn Lys Pro Gly Val Tyr Thr Asp Val Ala Tyr Tyr Leu Ala Trp 595 600 605 Ile Arg Glu His Thr Val Ser 610 615 <210> 47 <211> 353 <212> PRT <213> Homo sapiens <400> 47 Ile Pro Pro Trp Glu Ala Pro Lys Glu His Lys Tyr Lys Ala Glu Glu 1 5 10 15 His Thr Val Val Leu Thr Val Thr Gly Glu Pro Cys His Phe Pro Phe 20 25 30 Gln Tyr His Arg Gln Leu Tyr His Lys Cys Thr His Lys Gly Arg Pro 35 40 45 Gly Pro Gln Pro Trp Cys Ala Thr Thr Pro Asn Phe Asp Gln Asp Gln 50 55 60 Arg Trp Gly Tyr Cys Leu Glu Pro Lys Lys Val Lys Asp His Cys Ser 65 70 75 80 Lys His Ser Pro Cys Gln Lys Gly Gly Thr Cys Val Asn Met Pro Ser 85 90 95 Gly Pro His Cys Leu Cys Pro Gln His Leu Thr Gly Asn His Cys Gln 100 105 110 Lys Glu Lys Cys Phe Glu Pro Gln Leu Leu Arg Phe Phe His Lys Asn 115 120 125 Glu Ile Trp Tyr Arg Thr Glu Gln Ala Ala Val Ala Arg Cys Gln Cys 130 135 140 Lys Gly Pro Asp Ala His Cys Gln Arg Leu Ala Ser Gln Ala Cys Arg 145 150 155 160 Thr Asn Pro Cys Leu His Gly Gly Arg Cys Leu Glu Val Glu Gly His 165 170 175 Arg Leu Cys His Cys Pro Val Gly Tyr Thr Gly Ala Phe Cys Asp Val 180 185 190 Asp Thr Lys Ala Ser Cys Tyr Asp Gly Arg Gly Leu Ser Tyr Arg Gly 195 200 205 Leu Ala Arg Thr Thr Leu Ser Gly Ala Pro Cys Gln Pro Trp Ala Ser 210 215 220 Glu Ala Thr Tyr Arg Asn Val Thr Ala Glu Gln Ala Arg Asn Trp Gly 225 230 235 240 Leu Gly Gly His Ala Phe Cys Arg Asn Pro Asp Asn Asp Ile Arg Pro 245 250 255 Trp Cys Phe Val Leu Asn Arg Asp Arg Leu Ser Trp Glu Tyr Cys Asp 260 265 270 Leu Ala Gln Cys Gln Thr Pro Thr Gln Ala Ala Pro Pro Thr Pro Val 275 280 285 Ser Pro Arg Leu His Val Pro Leu Met Pro Ala Gln Pro Ala Pro Pro 290 295 300 Lys Pro Gln Pro Thr Thr Arg Thr Pro Pro Gln Ser Gln Thr Pro Gly 305 310 315 320 Ala Leu Pro Ala Lys Arg Glu Gln Pro Pro Ser Leu Thr Arg Asn Gly 325 330 335 Pro Leu Ser Cys Gly Gln Arg Leu Arg Lys Ser Leu Ser Ser Met Thr 340 345 350 Arg <210> 48 <211> 1848 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (1)..(57) <223> Signal Peptide <220> <221> misc_feature <222> (58)..(1116) <223> Heavy Chain <220> <221> misc_feature <222> (1117)..(1845) <223> Light Chain <400> 48 atgagggctc tgctgctcct ggggttcctg ctggtgagct tggagtcaac actttcgatt 60 ccaccttggg aagcccccaa ggagcataag tacaaagctg aagagcacac agtcgttctc 120 actgtcaccg gggagccctg ccacttcccc ttccagtacc accggcagct gtaccacaaa 180 tgtacccaca agggccggcc aggccctcag ccctggtgtg ctaccacccc caactttgat 240 caggaccagc gatggggata ctgtttggag cccaagaaag tgaaagacca ctgcagcaaa 300 cacagcccct gccagaaagg agggacctgt gtgaacatgc caagcggccc ccactgtctc 360 tgtccacaac acctcactgg aaaccactgc cagaaagaga agtgctttga gcctcagctt 420 ctccggtttt tccacaagaa tgagatatgg tatagaactg agcaagcagc tgtggccaga 480 tgccagtgca agggtcctga tgcccactgc cagcggctgg ccagccaggc ctgccgcacc 540 aacccgtgcc tccatggggg tcgctgccta gaggtggagg gccaccgcct gtgccactgc 600 ccggtgggct acaccggagc cttctgcgac gtggacacca aggcaagctg ctatgatggc 660 cgcgggctca gctaccgcgg cctggccagg accacgctct cgggtgcgcc ctgtcagccg 720 tgggcctcgg aggccaccta ccggaacgtg actgccgagc aagcgcggaa ctggggactg 780 ggcggccacg ccttctgccg gaacccggac aacgacatcc gcccgtggtg cttcgtgctg 840 aaccgcgacc ggctgagctg ggagtactgc gacctggcac agtgccagac cccaacccag 900 gcggcgcctc cgaccccggt gtcccctagg cttcatgtcc cactcatgcc cgcgcagccg 960 gcaccgccga agcctcagcc cacgacccgg accccgcctc agtcccagac cccgggagcc 1020 ttgccggcga agcgggagca gccgccttcc ctgaccagga acggcccact gagctgcggg 1080 cagcggctcc gcaagagtct gtcttcgatg acccgcgtcg ttggcgggct ggtggcgcta 1140 cgcggggcgc acccctacat cgccgcgctg tactggggcc acagtttctg cgccggcagc 1200 ctcatcgccc cctgctgggt gctgacggcc gctcactgcc tgcaggaccg gcccgcaccc 1260 gaggatctga cggtggtgct cggccaggaa cgccgtaacc acagctgtga gccgtgccag 1320 acgttggccg tgcgctccta ccgcttgcac gaggccttct cgcccgtcag ctaccagcac 1380 gacctggctc tgttgcgcct tcaggaggat gcggacggca gctgcgcgct cctgtcgcct 1440 tacgttcagc cggtgtgcct gccaagcggc gccgcgcgac cctccgagac cacgctctgc 1500 caggtggccg gctggggcca ccagttcgag ggggcggagg aatatgccag cttcctgcag 1560 gaggcgcagg taccgttcct ctccctggag cgctgctcag ccccggacgt gcacggatcc 1620 tccatcctcc ccggcatgct ctgcgcaggg ttcctcgagg gcggcaccga tgcgtgccag 1680 ggtgattccg gaggcccgct ggtgtgtgag gaccaagctg cagagcgccg gctcaccctg 1740 caaggcatca tcagctgggg atcgggctgt ggtgaccgca acaagccagg cgtctacacc 1800 gatgtggcct actacctggc ctggatccgg gagcacaccg tttcctga 1848 <210> 49 <211> 1059 <212> DNA <213> Homo sapiens <400> 49 attccacctt gggaagcccc caaggagcat aagtacaaag ctgaagagca cacagtcgtt 60 ctcactgtca ccggggagcc ctgccacttc cccttccagt accaccggca gctgtaccac 120 aaatgtaccc acaagggccg gccaggccct cagccctggt gtgctaccac ccccaacttt 180 gatcaggacc agcgatgggg atactgtttg gagcccaaga aagtgaaaga ccactgcagc 240 aaacacagcc cctgccagaa aggagggacc tgtgtgaaca tgccaagcgg cccccactgt 300 ctctgtccac aacacctcac tggaaaccac tgccagaaag agaagtgctt tgagcctcag 360 cttctccggt ttttccacaa gaatgagata tggtatagaa ctgagcaagc agctgtggcc 420 agatgccagt gcaagggtcc tgatgcccac tgccagcggc tggccagcca ggcctgccgc 480 accaacccgt gcctccatgg gggtcgctgc ctagaggtgg agggccaccg cctgtgccac 540 tgcccggtgg gctacaccgg agccttctgc gacgtggaca ccaaggcaag ctgctatgat 600 ggccgcgggc tcagctaccg cggcctggcc aggaccacgc tctcgggtgc gccctgtcag 660 ccgtgggcct cggaggccac ctaccggaac gtgactgccg agcaagcgcg gaactgggga 720 ctgggcggcc acgccttctg ccggaacccg gacaacgaca tccgcccgtg gtgcttcgtg 780 ctgaaccgcg accggctgag ctgggagtac tgcgacctgg cacagtgcca gaccccaacc 840 caggcggcgc ctccgacccc ggtgtcccct aggcttcatg tcccactcat gcccgcgcag 900 ccggcaccgc cgaagcctca gcccacgacc cggaccccgc ctcagtccca gaccccggga 960 gccttgccgg cgaagcggga gcagccgcct tccctgacca ggaacggccc actgagctgc 1020 gggcagcggc tccgcaagag tctgtcttcg atgacccgc 1059 <210> 50 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 tggaccaacg gacggatg 18 <210> 51 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 tgccacttcc ccttccag 18 <210> 52 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 actgtctctg tccacaacac c 21 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 accaacccgt gcctccat 18 <210> 54 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 gtggtgcttc gtgctgaac 19 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 aggatctgac ggtggtgctc 20 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 acaccgatgt ggcctactac 20 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 ccaggtggtc tcctctgact 20 <210> 58 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 cccaaggtgg aatcgaaagt g 21 <210> 59 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 gtagcacacc agggctgag 19 <210> 60 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 cggagaagct gaggctcaaa g 21 <210> 61 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 gcagaaggct ccggtgtag 19 <210> 62 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 gttggggtct ggcactgtg 19 <210> 63 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 gtagctgacg ggcgagaag 19 <210> 64 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 actgcggaat caccaagga 19 <210> 65 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 gcttgacaaa gtggtcgttg a 21 <210> 66 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 catgagggct ctgctgctcc tgg 23 <210> 67 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 accaccggca gctgtaccac aaat 24 <210> 68 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 tcactggaaa ccactgccag aaagaga 27 <210> 69 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 ctgcctagag gtggagggcc acc 23 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 cgaccggctg agctgggagt act 23 <210> 71 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 ccaggaacgc cgtaaccaca gct 23 <210> 72 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 ctggatccgg gagcacaccg ttt 23 <210> 73 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 tcaacagcga cacccactcc tc 22 <210> 74 <211> 300 <212> PRT <213> Homo sapiens <400> 74 Met Pro Ala Gln Pro Ala Pro Pro Lys Pro Gln Pro Thr Thr Arg Thr 1 5 10 15 Pro Pro Gln Ser Gln Thr Pro Gly Ala Leu Pro Ala Lys Arg Glu Gln 20 25 30 Pro Pro Ser Leu Thr Arg Asn Gly Pro Leu Ser Cys Gly Gln Arg Leu 35 40 45 Arg Lys Ser Leu Ser Ser Met Thr Arg Val Val Gly Gly Leu Val Ala 50 55 60 Leu Arg Gly Ala His Pro Tyr Ile Ala Ala Leu Tyr Trp Gly His Ser 65 70 75 80 Phe Cys Ala Gly Ser Leu Ile Ala Pro Cys Trp Val Leu Thr Ala Ala 85 90 95 His Cys Leu Gln Asp Arg Pro Ala Pro Glu Asp Leu Thr Val Val Leu 100 105 110 Gly Gln Glu Arg Arg Asn His Ser Cys Glu Pro Cys Gln Thr Leu Ala 115 120 125 Val Arg Ser Tyr Arg Leu His Glu Ala Phe Ser Pro Val Ser Tyr Gln 130 135 140 His Asp Leu Ala Leu Leu Arg Leu Gln Glu Asp Ala Asp Gly Ser Cys 145 150 155 160 Ala Leu Leu Ser Pro Tyr Val Gln Pro Val Cys Leu Pro Ser Gly Ala 165 170 175 Ala Arg Pro Ser Glu Thr Thr Leu Cys Gln Val Ala Gly Trp Gly His 180 185 190 Gln Phe Glu Gly Ala Glu Glu Tyr Ala Ser Phe Leu Gln Glu Ala Gln 195 200 205 Val Pro Phe Leu Ser Leu Glu Arg Cys Ser Ala Pro Asp Val His Gly 210 215 220 Ser Ser Ile Leu Pro Gly Met Leu Cys Ala Gly Phe Leu Glu Gly Gly 225 230 235 240 Thr Asp Ala Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Glu Asp 245 250 255 Gln Ala Ala Glu Arg Arg Leu Thr Leu Gln Gly Ile Ile Ser Trp Gly 260 265 270 Ser Gly Cys Gly Asp Arg Asn Lys Pro Gly Val Tyr Thr Asp Val Ala 275 280 285 Tyr Tyr Leu Ala Trp Ile Arg Glu His Thr Val Ser 290 295 300 <210> 75 <211> 903 <212> DNA <213> Homo sapiens <400> 75 atgcccgcgc agccggcacc gccgaagcct cagcccacga cccggacccc gcctcagtcc 60 cagaccccgg gagccttgcc ggcgaagcgg gagcagccgc cttccctgac caggaacggc 120 ccactgagct gcgggcagcg gctccgcaag agtctgtctt cgatgacccg cgtcgttggc 180 gggctggtgg cgctacgcgg ggcgcacccc tacatcgccg cgctgtactg gggccacagt 240 ttctgcgccg gcagcctcat cgccccctgc tgggtgctga cggccgctca ctgcctgcag 300 gaccggcccg cacccgagga tctgacggtg gtgctcggcc aggaacgccg taaccacagc 360 tgtgagccgt gccagacgtt ggccgtgcgc tcctaccgct tgcacgaggc cttctcgccc 420 gtcagctacc agcacgacct ggctctgttg cgccttcagg aggatgcgga cggcagctgc 480 gcgctcctgt cgccttacgt tcagccggtg tgcctgccaa gcggcgccgc gcgaccctcc 540 gagaccacgc tctgccaggt ggccggctgg ggccaccagt tcgagggggc ggaggaatat 600 gccagcttcc tgcaggaggc gcaggtaccg ttcctctccc tggagcgctg ctcagccccg 660 gacgtgcacg gatcctccat cctccccggc atgctctgcg cagggttcct cgagggcggc 720 accgatgcgt gccagggtga ttccggaggc ccgctggtgt gtgaggacca agctgcagag 780 cgccggctca ccctgcaagg catcatcagc tggggatcgg gctgtggtga ccgcaacaag 840 ccaggcgtct acaccgatgt ggcctactac ctggcctgga tccgggagca caccgtttcc 900 tga 903 <210> 76 <211> 246 <212> PRT <213> Homo sapiens <400> 76 Met Thr Arg Val Val Gly Gly Leu Val Ala Leu Arg Gly Ala His Pro 1 5 10 15 Tyr Ile Ala Ala Leu Tyr Trp Gly His Ser Phe Cys Ala Gly Ser Leu 20 25 30 Ile Ala Pro Cys Trp Val Leu Thr Ala Ala His Cys Leu Gln Asp Arg 35 40 45 Pro Ala Pro Glu Asp Leu Thr Val Val Leu Gly Gln Glu Arg Arg Asn 50 55 60 His Ser Cys Glu Pro Cys Gln Thr Leu Ala Val Arg Ser Tyr Arg Leu 65 70 75 80 His Glu Ala Phe Ser Pro Val Ser Tyr Gln His Asp Leu Ala Leu Leu 85 90 95 Arg Leu Gln Glu Asp Ala Asp Gly Ser Cys Ala Leu Leu Ser Pro Tyr 100 105 110 Val Gln Pro Val Cys Leu Pro Ser Gly Ala Ala Arg Pro Ser Glu Thr 115 120 125 Thr Leu Cys Gln Val Ala Gly Trp Gly His Gln Phe Glu Gly Ala Glu 130 135 140 Glu Tyr Ala Ser Phe Leu Gln Glu Ala Gln Val Pro Phe Leu Ser Leu 145 150 155 160 Glu Arg Cys Ser Ala Pro Asp Val His Gly Ser Ser Ile Leu Pro Gly 165 170 175 Met Leu Cys Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln Gly 180 185 190 Asp Ser Gly Gly Pro Leu Val Cys Glu Asp Gln Ala Ala Glu Arg Arg 195 200 205 Leu Thr Leu Gln Gly Ile Ile Ser Trp Gly Ser Gly Cys Gly Asp Arg 210 215 220 Asn Lys Pro Gly Val Tyr Thr Asp Val Ala Tyr Tyr Leu Ala Trp Ile 225 230 235 240 Arg Glu His Thr Val Ser 245 <210> 77 <211> 741 <212> DNA <213> Homo sapiens <400> 77 atgacccgcg tcgttggcgg gctggtggcg ctacgcgggg cgcaccccta catcgccgcg 60 ctgtactggg gccacagttt ctgcgccggc agcctcatcg ccccctgctg ggtgctgacg 120 gccgctcact gcctgcagga ccggcccgca cccgaggatc tgacggtggt gctcggccag 180 gaacgccgta accacagctg tgagccgtgc cagacgttgg ccgtgcgctc ctaccgcttg 240 cacgaggcct tctcgcccgt cagctaccag cacgacctgg ctctgttgcg ccttcaggag 300 gatgcggacg gcagctgcgc gctcctgtcg ccttacgttc agccggtgtg cctgccaagc 360 ggcgccgcgc gaccctccga gaccacgctc tgccaggtgg ccggctgggg ccaccagttc 420 gagggggcgg aggaatatgc cagcttcctg caggaggcgc aggtaccgtt cctctccctg 480 gagcgctgct cagccccgga cgtgcacgga tcctccatcc tccccggcat gctctgcgca 540 gggttcctcg agggcggcac cgatgcgtgc cagggtgatt ccggaggccc gctggtgtgt 600 gaggaccaag ctgcagagcg ccggctcacc ctgcaaggca tcatcagctg gggatcgggc 660 tgtggtgacc gcaacaagcc aggcgtctac accgatgtgg cctactacct ggcctggatc 720 cgggagcaca ccgtttcctg a 741 <210> 78 <211> 70 <212> PRT <213> Homo sapiens <400> 78 Met Leu Cys Ala Gly Phe Leu Glu Gly Gly Thr Asp Ala Cys Gln Gly 1 5 10 15 Asp Ser Gly Gly Pro Leu Val Cys Glu Asp Gln Ala Ala Glu Arg Arg 20 25 30 Leu Thr Leu Gln Gly Ile Ile Ser Trp Gly Ser Gly Cys Gly Asp Arg 35 40 45 Asn Lys Pro Gly Val Tyr Thr Asp Val Ala Tyr Tyr Leu Ala Trp Ile 50 55 60 Arg Glu His Thr Val Ser 65 70 <210> 79 <211> 213 <212> DNA <213> Homo sapiens <400> 79 atgctctgcg cagggttcct cgagggcggc accgatgcgt gccagggtga ttccggaggc 60 ccgctggtgt gtgaggacca agctgcagag cgccggctca ccctgcaagg catcatcagc 120 tggggatcgg gctgtggtga ccgcaacaag ccaggcgtct acaccgatgt ggcctactac 180 ctggcctgga tccgggagca caccgtttcc tga 213 <210> 80 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa guggcaccga 60 gucggugcuu uu 72 <210> 81 <211> 82 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60 aaaaguggca ccgagucggu gc 82 <210> 82 <211> 83 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugcuuuu uuu 83 <210> 83 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugcuuuu 80 <210> 84 <211> 92 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60 uugaaaaagu ggcaccgagu cggugcuuuu uu 92

Claims (61)

  1. 인간화(humanized) 내인성(endogenous) F12 좌위(locus)를 게놈에 포함하는 비-인간 동물로서, 상기 내인성 F12 좌위의 분절(segment)은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물.
  2. 제1항에 있어서, 상기 인간화 내인성 F12 좌위는 인간 응고 인자 XII 중쇄를 포함하는 단백질을 인코딩하는, 비-인간 동물.
  3. 제1항 또는 제2항에 있어서, 상기 인간화 내인성 F12 좌위는 인간 응고 인자 XII 경쇄를 포함하는 단백질을 인코딩하는, 비-인간 동물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 인간화 내인성 F12 좌위는 인간 응고 인자 XII 신호 펩타이드를 포함하는 단백질을 인코딩하는, 비-인간 동물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 코딩 서열과 비-코딩 서열 둘 다를 포함하는 내인성 F12 좌위의 영역은 결실되었고, 코딩 서열과 비-코딩 서열 둘 다를 포함하는 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 인간화 내인성 F12 좌위는 내인성 F12 프로모터를 포함하고, 상기 인간 F12 서열은 내인성 F12 프로모터에 작동적으로 연결되는, 비-인간 동물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 내인성 F12 좌위의 적어도 하나의 인트론 및 적어도 하나의 엑손은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 내인성 F12 좌위의 전체 F12 코딩 서열은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물.
  9. 제8항에 있어서, 개시 코돈으로부터 정지 코돈까지의 내인성 F12 좌위의 영역은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 내인성 F12 3' 비번역 영역은 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않은 것인, 비-인간 동물.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 내인성 F12 5' 비번역 영역은 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않은 것인, 비-인간 동물.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 개시 코돈으로부터 정지 코돈까지의 내인성 F12 좌위의 영역은 결실되었고 상응하는 인간 F12 서열로 대체되었으며,
    상기 내인성 F12 프로모터는 결실되지 않았고 상응하는 인간 F12 서열로 대체되지 않은 것인, 비-인간 동물.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    (i) 인간화 내인성 F12 좌위의 인간 F12 서열은 SEQ ID NO: 31 또는 32로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하며; 그리고/또는
    (ii) 인간화 내인성 F12 좌위는 SEQ ID NO: 5 또는 46으로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하는 단백질을 인코딩하며; 그리고/또는
    (iii) 인간화 내인성 F12 좌위는 SEQ ID NO: 13 또는 48로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하는 코딩 서열을 포함하며; 그리고/또는
    (iv) 인간화 내인성 F12 좌위는 SEQ ID NO: 17 또는 18로 표시된 서열과 적어도 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하는, 비-인간 동물.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 인간화 내인성 F12 좌위는 상응하는 인간 F12 서열의 인트론 내에 선택 카세트 또는 리포터 유전자를 포함하거나, 상기 인간화 내인성 F12 좌위는 선택 카세트 또는 리포터 유전자를 포함하지 않는, 비-인간 동물.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 비-인간 동물은 인간화 내인성 F12 좌위에 대해 동형접합성인, 비-인간 동물.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 비-인간 동물은 이의 생식세포계(germline)에 인간화 내인성 F12 좌위를 포함하는, 비-인간 동물.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 비-인간 동물은 포유류인, 비-인간 동물.
  18. 제17항에 있어서, 상기 비-인간 동물은 래트 또는 마우스인, 비-인간 동물.
  19. 제18항에 있어서, 상기 비-인간 동물은 마우스인, 비-인간 동물.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 비-인간 동물은 뇌에서 짧은 인간 응고 인자 XII 이소형(isoform)을 발현하는, 비-인간 동물.
  21. 제20항에 있어서,
    (i) 상기 짧은 인간 응고 인자 XII 이소형은 인간 F12의 엑손 1-6에 대한 프로브에 의해서가 아니라 인간 F12의 엑손 11-14에 대한 프로브에 의해 검출되는 F12 mRNA에 의해 인코딩되며; 그리고/또는
    (ii) 상기 짧은 인간 응고 인자 XII 이소형은 FXII297-596이며; 그리고/또는
    (iii) 상기 짧은 인간 응고 인자 XII 이소형은 뇌의 뉴런에서 발현되며; 그리고/또는
    (iv) 상기 짧은 인간 응고 인자 XII 이소형은 혈장 칼리크레인(kallikrein)에 의해 활성화될 수 있고, 전구(pro)-HGF를 활성 HGF로 전환시키는, 비-인간 동물.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 비-인간 동물은 상응하는 야생형 비-인간 동물에서의 활성화된 부분 트롬보플라스틴 시간(aPTT: activated partial thromboplastin time)과 유의하게 상이하지 않은 aPTT를 갖고/갖거나 상기 비-인간 동물은 상응하는 야생형 비-인간 동물에서의 프로트롬빈 시간(PT: prothrombin time)과 유의하게 상이하지 않은 PT를 갖는, 비-인간 동물.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 비-인간은 적어도 약 5 μg/mL의 인간 응고 인자 XII 혈장 수준을 갖는, 비-인간 동물.
  24. 인간화 내인성 F12 좌위를 게놈에 포함하는 비-인간 동물 세포로서, 상기 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물 세포.
  25. 인간화 내인성 F12 좌위를 포함하는 비-인간 동물 게놈으로서, 상기 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 비-인간 동물 게놈.
  26. 인간화 내인성 F12 좌위를 생산하기 위한 표적화 벡터로서, 상기 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체되었으며, 상기 표적화 벡터는 내인성 F12 좌위에서 5' 표적 서열을 표적화하는 5' 상동성 아암(arm)과 내인성 F12 좌위에서 3' 표적 서열을 표적화하는 3' 상동성 아암에 플랭킹되는 상응하는 인간 F12 서열을 포함하는 삽입물(insert) 핵산을 포함하는, 표적화 벡터.
  27. 인간화 비-인간 동물 F12 유전자로서, 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 인간화 비-인간 동물 F12 유전자.
  28. 생체내에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 방법으로서, 상기 방법은
    (a) 상기 인간-응고-인자-XII-표적화 시약을 제1항 내지 제23항 중 어느 한 항의 비-인간 동물에게 투여하는 단계; 및
    (b) 상기 인간-응고-인자-XII-표적화 시약의 활성을 상기 비-인간 동물에서 평가하는 단계를 포함하는, 방법.
  29. 제28항에 있어서, 상기 투여는 아데노-관련 바이러스(AAV)-매개 전달, 지질 나노입자(LNP)-매개 전달, 유체역학적 전달(HDD: hydrodynamic delivery), 또는 주사를 포함하는, 방법.
  30. 제28항 또는 제29항에 있어서, 상기 단계 (b)는 비-인간 동물로부터 혈장을 단리하는 단계 및 상기 혈장에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 단계를 포함하는, 방법.
  31. 제28항 내지 제30항 중 어느 한 항에 있어서, 상기 단계 (b)는 상기 비-인간 동물의 간 또는 뇌에서 인간-응고-인자-XII-표적화 시약의 활성을 평가하는 단계를 포함하는, 방법.
  32. 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 단계 (b)는 응고 또는 트롬빈 생산을 평가하는 단계를 포함하는, 방법.
  33. 제28항 내지 제32항 중 어느 한 항에 있어서, 상기 단계 (b)는 HGF-Met 신호전달을 평가하는 단계를 포함하는, 방법.
  34. 제28항 내지 제33항 중 어느 한 항에 있어서, 상기 단계 (b)는 인간화 내인성 F12 좌위에 의해 인코딩되는 F12 메신저 RNA의 발현을 측정하는 단계를 포함하는, 방법.
  35. 제28항 내지 제34항 중 어느 한 항에 있어서, 상기 단계 (b)는 인간화 내인성 응고 인자 XII 좌위에 의해 인코딩되는 응고 인자 XII 단백질의 발현을 측정하는 단계를 포함하는, 방법.
  36. 제28항 내지 제35항 중 어느 한 항에 있어서, 상기 인간-응고-인자-XII-표적화 시약은 게놈-편집 제제이고, 상기 단계 (b)는 인간화 내인성 F12 좌위의 변형을 평가하는 단계를 포함하는, 방법.
  37. 제36항에 있어서, 상기 단계 (b)는 인간화 내인성 F12 좌위 내에서 삽입 또는 결실의 빈도를 측정하는 단계를 포함하는, 방법.
  38. 제28항 내지 제37항 중 어느 한 항에 있어서, 상기 인간-응고-인자-XII-표적화 시약은 인간 F12 유전자의 영역을 표적화하도록 설계된 뉴클레아제 제제를 포함하는, 방법.
  39. 제38항에 있어서, 상기 뉴클레아제 제제는 Cas 단백질, 및 인간 F12 유전자 내의 가이드 RNA 표적 서열을 표적화하도록 설계된 가이드 RNA를 포함하는, 방법.
  40. 제39항에 있어서, 상기 Cas 단백질은 Cas9 단백질인, 방법.
  41. 제28항 내지 제40항 중 어느 한 항에 있어서, 상기 인간-응고-인자-XII-표적화 시약은 외인성 공여자 핵산을 포함하며, 상기 외인성 공여자 핵산은 인간 F12 유전자를 표적화하도록 설계되고, 선택적으로 상기 외인성 공여자 핵산은 AAV를 통해 전달되는, 방법.
  42. 제28항 내지 제35항 중 어느 한 항에 있어서, 상기 인간-응고-인자-XII-표적화 시약은 RNAi 제제 또는 안티센스 올리고뉴클레오타이드인, 방법.
  43. 제28항 내지 제35항 중 어느 한 항에 있어서, 상기 인간-응고-인자-XII-표적화 시약은 항원-결합 단백질인, 방법.
  44. 제28항 내지 제35항 중 어느 한 항에 있어서, 상기 인간-응고-인자-XII-표적화 시약은 저분자인, 방법.
  45. 생체내에서 인간-응고-인자-XII-표적화 시약의 활성을 최적화하는 방법으로서, 상기 방법은
    (I) 첫째로, 인간화 내인성 F12 좌위를 게놈에 포함하는 제1 비-인간 동물에서 제28항 내지 제44항 중 어느 한 항의 방법을 수행하는 단계;
    (II) 변수(variable)를 변화시키고, 두번째로, 인간화 내인성 F12 좌위를 게놈에 포함하는 제2 비-인간 동물에서 변화된 변수로 상기 단계 (I)의 방법을 수행하는 단계; 및
    (III) 상기 단계 (I)에서의 인간-응고-인자-XII-표적화 시약의 활성을 상기 단계 (II)에서의 인간-응고-인자-XII-표적화 시약의 활성과 비교하고, 더 높은 활성을 초래하는 방법을 선택하는 단계를 포함하는, 방법.
  46. 제45항에 있어서, 상기 단계 (II)에서의 변화된 변수는 인간-응고-인자-XII-표적화 시약을 비-인간 동물 내로 도입하는 전달 방법인, 방법.
  47. 제45항에 있어서, 상기 단계 (II)에서의 변화된 변수는 인간-응고-인자-XII-표적화 시약을 비-인간 동물 내로 도입하는 투여 경로인, 방법.
  48. 제45항에 있어서, 상기 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-응고-인자-XII-표적화 시약의 농도 또는 양인, 방법.
  49. 제45항에 있어서, 상기 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-응고-인자-XII-표적화 시약의 형태인, 방법.
  50. 제45항에 있어서, 상기 단계 (II)에서의 변화된 변수는 비-인간 동물 내로 도입된 인간-응고-인자-XII-표적화 시약인, 방법.
  51. 제1항 내지 제23항 중 어느 한 항에 따른 비-인간 동물을 제조하는 방법으로서, 상기 방법은
    (a) 인간화 내인성 F12 좌위를 게놈에 포함하는 유전적으로 변형된 비-인간 동물 배아 줄기(ES) 세포를 비-인간 동물 숙주 내로 도입하는 단계로서, 상기 내인성 F12 좌위의 분절은 결실되었고 상응하는 인간 F12 서열로 대체된 것인, 단계; 및
    (b) 비-인간 동물 숙주 배아를 대리모(surrogate mother)에 임신시키는 단계로서, 상기 대리모는 인간화 내인성 F12 좌위를 포함하는 F0 자손 유전적으로 변형된 비-인간 동물을 생성하는 단계를 포함하는, 방법.
  52. 제1항 내지 제23항 중 어느 한 항의 비-인간 동물을 제조하는 방법으로서, 상기 방법은
    (a) 내인성 F12 좌위 내 5' 표적 서열에 상응하는 5' 상동성 아암과 내인성 F12 좌위 내 3' 표적 서열에 상응하는 3' 상동성 아암에 플랭킹되는 인간 F12 서열을 포함하는 핵산 삽입물을 포함하는 표적화 벡터를 비-인간 동물 배아 줄기(ES)세포 내로 도입하는 단계로서,
    상기 표적화 벡터는 내인성 F12 좌위와 재조합되어, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 유전적으로 변형된 비-인간 ES 세포를 생성하는, 단계;
    (b) 상기 유전적으로 변형된 비-인간 ES 세포를 비-인간 동물 숙주 배아 내로 도입하는 단계; 및
    (c) 상기 비-인간 동물 숙주 배아를 대리모에 임신시키는 단계로서, 상기 대리모는 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 F0 자손 유전적으로 변형된 비-인간 동물을 생성하는 단계를 포함하는, 방법.
  53. 제52항에 있어서, 상기 표적화 벡터는, 적어도 10 kb 길이이거나 5' 상동성 아암과 3' 상동성 아암의 총 합계가 적어도 10 kb 길이인 큰 표적화 벡터인, 방법.
  54. 제1항 내지 제23항 중 어느 한 항에 따른 비-인간 동물을 제조하는 방법으로서, 상기 방법은
    (a) 내인성 F12 좌위 내 5' 표적 서열에 상응하는 5' 상동성 아암과 내인성 F12 좌위 내 3' 표적 서열에 상응하는 3' 상동성 아암에 플랭킹되는 인간 F12 서열을 포함하는 핵산 삽입물을 포함하는 표적화 벡터를 비-인간 동물 1-세포 단계 배아 내로 도입하는 단계로서,
    상기 표적화 벡터는 내인성 F12 좌위와 재조합되어, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 유전적으로 변형된 비-인간 1-세포 단계 배아를 생성하는, 단계;
    (b) 상기 유전적으로 변형된 비-인간 동물 1-세포 단계 배아를 대리모에 임신시켜, 인간 F12 서열을 포함하는 인간화 내인성 F12 좌위를 게놈에 포함하는 유전적으로 변형된 F0 세대 비-인간 동물을 생성하는 단계를 포함하는, 방법.
  55. 제52항 내지 제54항 중 어느 한 항에 있어서, 상기 단계 (a)는 뉴클레아제 제제 또는 상기 뉴클레아제 제제를 인코딩하는 핵산을 도입하는 단계를 추가로 포함하고, 상기 뉴클레아제 제제는 내인성 F12 좌위 내의 표적 서열을 표적화하는, 방법.
  56. 제55항에 있어서, 상기 뉴클레아제 제제는 Cas 단백질 및 가이드 RNA를 포함하는, 방법.
  57. 제56항에 있어서, 상기 Cas 단백질은 Cas9 단백질인, 방법.
  58. 제56항 또는 제57항에 있어서, 상기 단계 (a)는 내인성 F12 좌위 내의 제2 표적 서열을 표적화하는 제2 가이드 RNA를 도입하는 단계를 추가로 포함하는, 방법.
  59. 제51항 내지 제58항 중 어느 한 항에 있어서, 상기 비-인간 동물은 마우스 또는 래트인, 방법.
  60. 제59항에 있어서, 상기 비-인간 동물은 마우스인, 방법.
  61. 생물학적 시료에서 짧은 F12 mRNA 이소형의 발현을 평가하는 방법으로서, 상기 방법은
    (a) F12 유전자의 엑손 9 내지 14 중 하나 이상에 대한 프라이머 및/또는 프로브를 사용하여 RNA 전사물을 검출하고 정량화하는 단계; 및
    (b) F12 유전자의 엑손 1 내지 6 중 하나 이상에 대한 프라이머 및/또는 프로브를 사용하여 RNA 전사물을 검출하고 정량화하는 단계
    를 포함하고, 상기 짧은 이소형은 엑손 1 내지 6에 대한 프라이머 및/또는 프로브가 아니라 엑손9 내지 14에 대한 프라이머 및/또는 프로브에 의해 검출되는, 방법.
KR1020217035584A 2019-04-04 2020-04-02 인간화 응고 인자 12 좌위를 포함하는 비-인간 동물 KR102661779B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962829321P 2019-04-04 2019-04-04
US62/829,321 2019-04-04
PCT/US2020/026413 WO2020206139A1 (en) 2019-04-04 2020-04-02 Non-human animals comprising a humanized coagulation factor 12 locus

Publications (2)

Publication Number Publication Date
KR20220004065A true KR20220004065A (ko) 2022-01-11
KR102661779B1 KR102661779B1 (ko) 2024-04-30

Family

ID=70476360

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217035584A KR102661779B1 (ko) 2019-04-04 2020-04-02 인간화 응고 인자 12 좌위를 포함하는 비-인간 동물

Country Status (11)

Country Link
US (2) US11737435B2 (ko)
EP (1) EP3772929B1 (ko)
JP (1) JP2022528414A (ko)
KR (1) KR102661779B1 (ko)
CN (2) CN114206108B (ko)
AU (1) AU2020253532A1 (ko)
CA (1) CA3133360A1 (ko)
ES (1) ES2966625T3 (ko)
IL (1) IL286905B1 (ko)
SG (1) SG11202108454RA (ko)
WO (1) WO2020206139A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL286905B1 (en) 2019-04-04 2024-02-01 Regeneron Pharma Non-human animals containing the human coagulation factor 12 locus
EP3801011A1 (en) 2019-06-04 2021-04-14 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use
KR20220017939A (ko) 2019-06-07 2022-02-14 리제너론 파마슈티칼스 인코포레이티드 인간화 알부민 좌위를 포함하는 비-인간 동물

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5942435A (en) * 1993-05-14 1999-08-24 The Board Of Trustees Of The University Of Illinois Transgenic swine compositions and methods
US6586251B2 (en) * 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7294754B2 (en) * 2004-10-19 2007-11-13 Regeneron Pharmaceuticals, Inc. Method for generating an animal homozygous for a genetic modification

Family Cites Families (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
ES2318880T3 (es) 1998-09-23 2009-05-01 Csl Behring Gmbh Un animal transgenico defectuoso para el factor xiii de la coagulacion y su uso para prbar la cicatrizacion de herida y la hemorragia.
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
AU5705101A (en) 2000-04-14 2001-10-30 Genaissance Pharmaceuticals Haplotypes of the f12 gene
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
AU2884102A (en) 2000-12-07 2002-06-18 Sangamo Biosciences Inc Regulation of angiogenesis with zinc finger proteins
AU2002225187A1 (en) 2001-01-22 2002-07-30 Sangamo Biosciences, Inc. Zinc finger polypeptides and their use
ES2409080T3 (es) 2001-01-22 2013-06-24 Sangamo Biosciences Inc. Proteínas de unión con dedos de zinc modificadas
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
WO2003087341A2 (en) 2002-01-23 2003-10-23 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
WO2003078619A1 (en) 2002-03-15 2003-09-25 Cellectis Hybrid and single chain meganucleases and use thereof
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
EP2806025B1 (en) 2002-09-05 2019-04-03 California Institute of Technology Use of zinc finger nucleases to stimulate gene targeting
AU2003290518A1 (en) 2002-09-06 2004-04-23 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
CA2579677A1 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
AU2006224248B2 (en) 2005-03-15 2011-01-06 Cellectis I-Crei meganuclease variants with modified specificity, method of preparation and uses thereof
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
CA2630838A1 (en) 2005-11-23 2007-05-31 Georg Dewald Detection and treatment of drug associated angioedema
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
MX2009006303A (es) 2006-12-14 2009-10-21 Dow Agrosciences Llc Proteinas de dedo de zinc no canonicas optimizadas.
WO2009053050A1 (en) * 2007-10-22 2009-04-30 Georg Dewald Disorders of vasoregulation and methods of diagnosing them
AR070089A1 (es) * 2007-12-31 2010-03-10 Baxter Int Animales no humanos transgenicos que expresan factores de la coagula-cion sanguinea humanos y usos de los mismos
WO2009126161A1 (en) 2008-04-11 2009-10-15 Utc Fuel Cells, Llc Fuel cell and bipolar plate having manifold sump
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
EP2408921B1 (en) 2009-03-20 2017-04-19 Sangamo BioSciences, Inc. Modification of cxcr4 using engineered zinc finger proteins
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
CN103833855A (zh) 2009-06-26 2014-06-04 瑞泽恩制药公司 容易地分离的具有天然免疫球蛋白形式的双特异性抗体
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
WO2011020005A1 (en) 2009-08-14 2011-02-17 Regeneron Pharmaceuticals, Inc. miRNA-REGULATED DIFFERENTIATION-DEPENDENT SELF-DELETING CASSETTE
ES2908587T3 (es) 2009-10-06 2022-05-03 Regeneron Pharma Ratones modificados genéticamente e injerto
WO2011059799A1 (en) 2009-10-29 2011-05-19 Regeneron Pharmaceuticals, Inc. Multifunctional alleles
AU2010327998B2 (en) 2009-12-10 2015-11-12 Iowa State University Research Foundation, Inc. TAL effector-mediated DNA modification
DK3375284T3 (da) 2011-02-15 2023-06-12 Univ Yale Humaniserede M-CSF-mus og anvendelser deraf
SI2770821T1 (en) 2011-10-28 2018-01-31 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex of mice
SG10201600965YA (en) 2011-10-28 2016-03-30 Regeneron Pharma Humanized il-6 and il-6 receptor
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
PL2847335T3 (pl) 2012-04-25 2019-01-31 Regeneron Pharmaceuticals, Inc. Celowanie dużymi wektorami do celowania wspomagane nukleazą
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
WO2013188358A1 (en) 2012-06-12 2013-12-19 The General Hospital Corporation Miniature swine transgenic for one or more coagulation factors
US8962913B2 (en) 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
EP3556206B1 (en) 2012-11-05 2021-06-02 Regeneron Pharmaceuticals, Inc. Genetically modified non-human animals and methods of use thereof
PL3138910T3 (pl) 2012-12-06 2018-01-31 Sigma Aldrich Co Llc Oparta na CRISPR modyfikacja i regulacja genomu
SG10201707569YA (en) 2012-12-12 2017-10-30 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014099744A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
EP2958990B1 (en) 2013-02-20 2019-10-16 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
US20150342163A1 (en) 2013-02-22 2015-12-03 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex mice
JP6444321B2 (ja) 2013-02-22 2018-12-26 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ヒト化主要組織適合性遺伝子複合体を発現するマウス
JP2016507244A (ja) 2013-02-27 2016-03-10 ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) Cas9ヌクレアーゼによる卵母細胞における遺伝子編集
KR102210319B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화
WO2014165825A2 (en) 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
HUE040575T2 (hu) 2013-04-16 2019-03-28 Regeneron Pharma A patkány genom célzott módosítása
BR112015031608A2 (pt) 2013-06-17 2017-08-22 Massachusetts Inst Technology Aplicação e uso dos sistemas crispr-cas, vetores e composições para direcionamento e terapia hepáticos
RS64573B1 (sr) 2013-09-23 2023-10-31 Regeneron Pharma Ne-humana životinja sa humanizovanim signalno-regulatornim proteinskim genom
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
SI3138397T1 (sl) 2013-10-15 2019-04-30 Regeneron Pharmaceuticals, Inc. Humanizirane živali IL-15
CN110713995B (zh) 2013-10-17 2023-08-01 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
MX2016007654A (es) 2013-12-11 2017-08-15 Regeneron Pharma Metodos y composiciones para la modificacion dirigida de un genoma.
US10370680B2 (en) 2014-02-24 2019-08-06 Sangamo Therapeutics, Inc. Method of treating factor IX deficiency using nuclease-mediated targeted integration
RU2020103811A (ru) 2014-05-05 2020-02-18 Регенерон Фармасьютикалз, Инк. Гуманизированные животные по с5 и с3
NO2785538T3 (ko) 2014-05-07 2018-08-04
DK3841877T3 (da) 2014-05-19 2023-11-27 Regeneron Pharma Genetisk modificeret mus, der eksprimerer human EPO
CN106852157B (zh) 2014-06-16 2022-04-12 约翰斯·霍普金斯大学 用于使用h1启动子表达crispr向导rna的组合物和方法
HUE049405T2 (hu) 2014-06-23 2020-09-28 Regeneron Pharma Nukleáz-közvetített DNS-összeállítás
US20150376586A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
HUE041584T2 (hu) 2014-06-26 2019-05-28 Regeneron Pharma Célzott genetikai módosítások és alkalmazási módszerek és készítmények
US10342761B2 (en) 2014-07-16 2019-07-09 Novartis Ag Method of encapsulating a nucleic acid in a lipid nanoparticle host
US20160060358A1 (en) 2014-08-28 2016-03-03 California Institute Of Technology Induction of antigen-specific tolerance
WO2016044745A1 (en) 2014-09-19 2016-03-24 Regeneron Pharmaceuticals, Inc. Chimeric antigen receptors
LT3221457T (lt) 2014-11-21 2019-06-10 Regeneron Pharmaceuticals, Inc. Nukreipiančios genetinės modifikacijos būdai ir kompozicijos, naudojant suporuotas kreipiančiąsias rnr sekas
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
HRP20231039T1 (hr) 2015-04-06 2023-12-22 Regeneron Pharmaceuticals, Inc. Imunosni odgovori posredovani humaniziranim t stanicama kod ne-humanih životinja
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
KR102454546B1 (ko) 2015-11-20 2022-10-14 리제너론 파마슈티칼스 인코포레이티드 인간화 림프구 활성화 유전자 3을 갖는 비인간 동물
KR102487839B1 (ko) 2016-02-04 2023-01-12 리제너론 파마슈티칼스 인코포레이티드 조작된 angptl8 유전자를 갖는 비인간 동물
US20190136231A1 (en) 2016-03-30 2019-05-09 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
BR112019011509A2 (pt) 2016-12-08 2020-01-28 Intellia Therapeutics Inc rnas guias modificados
MX2019010219A (es) 2017-02-27 2020-02-07 Regeneron Pharma Modelo humanizado de trastornos renales y hepáticos.
EP4276185A3 (en) 2017-09-29 2024-02-21 Regeneron Pharmaceuticals, Inc. Rodents comprising a humanized ttr locus and methods of use
CA3093850A1 (en) 2018-03-26 2019-10-03 Regeneron Pharmaceuticals, Inc. Humanized rodents for testing therapeutic agents
CN116200426A (zh) 2018-07-16 2023-06-02 瑞泽恩制药公司 Ditra疾病的非人动物模型及其用途
IL286905B1 (en) 2019-04-04 2024-02-01 Regeneron Pharma Non-human animals containing the human coagulation factor 12 locus
EP3801011A1 (en) 2019-06-04 2021-04-14 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use
KR20220017939A (ko) 2019-06-07 2022-02-14 리제너론 파마슈티칼스 인코포레이티드 인간화 알부민 좌위를 포함하는 비-인간 동물

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5942435A (en) * 1993-05-14 1999-08-24 The Board Of Trustees Of The University Of Illinois Transgenic swine compositions and methods
US6586251B2 (en) * 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7294754B2 (en) * 2004-10-19 2007-11-13 Regeneron Pharmaceuticals, Inc. Method for generating an animal homozygous for a genetic modification

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Haemophilia, 20(5):e372-e375, (2014). *
J. Exp. Med., 202(2):271-281, (2005). *
Nat. Commun. 10(1):1845, (Apr. 23, 2019). *
Nat. Rev. Genet., 13(1):14-20, (2011). *

Also Published As

Publication number Publication date
AU2020253532A1 (en) 2021-09-02
EP3772929A1 (en) 2021-02-17
IL286905B1 (en) 2024-02-01
KR102661779B1 (ko) 2024-04-30
ES2966625T3 (es) 2024-04-23
EP3772929B1 (en) 2023-11-15
WO2020206139A1 (en) 2020-10-08
SG11202108454RA (en) 2021-09-29
US11737435B2 (en) 2023-08-29
US20240016129A1 (en) 2024-01-18
CN117178959A (zh) 2023-12-08
CN114206108B (zh) 2023-09-29
CN114206108A (zh) 2022-03-18
CA3133360A1 (en) 2020-10-08
JP2022528414A (ja) 2022-06-10
WO2020206139A9 (en) 2020-10-29
EP3772929C0 (en) 2023-11-15
US20200315149A1 (en) 2020-10-08
IL286905A (en) 2021-10-31

Similar Documents

Publication Publication Date Title
US20230078551A1 (en) Non-human animals comprising a humanized ttr locus and methods of use
KR102661779B1 (ko) 인간화 응고 인자 12 좌위를 포함하는 비-인간 동물
CN113423831B (zh) 核酸酶介导的重复扩增
US11891618B2 (en) Mouse comprising a humanized TTR locus with a beta-slip mutation and methods of use
US20230232797A1 (en) Non-human animals comprising a humanized albumin locus
KR20220097414A (ko) X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant