KR20180099704A - 부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단 - Google Patents

부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단 Download PDF

Info

Publication number
KR20180099704A
KR20180099704A KR1020187018773A KR20187018773A KR20180099704A KR 20180099704 A KR20180099704 A KR 20180099704A KR 1020187018773 A KR1020187018773 A KR 1020187018773A KR 20187018773 A KR20187018773 A KR 20187018773A KR 20180099704 A KR20180099704 A KR 20180099704A
Authority
KR
South Korea
Prior art keywords
acid sequence
reporter gene
nucleic acid
seq
chromosome
Prior art date
Application number
KR1020187018773A
Other languages
English (en)
Inventor
다니엘 오펜
Original Assignee
이지지엑스와이티 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이지지엑스와이티 리미티드 filed Critical 이지지엑스와이티 리미티드
Publication of KR20180099704A publication Critical patent/KR20180099704A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/66Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving luciferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/30Bird
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0393Animal model comprising a reporter system for screening tests
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Environmental Sciences (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)

Abstract

본 발명은 조류 피험자에서 성별 결정 방법 및 감별 방법에 관한 것이다. 보다 구체적으로는, 본 발명은 적어도 하나의 성 염색체 Z 또는 W에 통합된 적어도 하나의 리포터 유전자를 포함하는 형질전환 조류 동물을 이용한 비-침습적 방법을 제공한다. 본 발명의 형질전환 조류 동물은 부화되지 않은 조류 알에서 배아의 성별 결정 및 선별에 사용된다.

Description

부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단
본 발명은 조류 피험자에서 성별 결정 방법 및 감별 방법에 관한 것이다. 보다 구체적으로는, 본 발명은 부화되지 않은 조류 알에서 배아의 성별 결정 및 선별을 위한 비-침습적 방법 및 형질전환 조류 동물을 제공한다.
식품 산업에서, 병아리는 질식 또는 분쇄를 통해 매일 수십억 마리가 도태된다. 수컷은 알을 낳거나 또는 고기 빵으로 유용하지 않기 때문에 폐기되고, 약하거나 건강하지 않은 암컷도 폐기된다. 따라서, 부화하기 전에 난자 내(in-ovo) 또는 배아의 성-결정 방법은 윤리적 및 경제적 고려 사항 모두로 인해 매우 바람직하다.
구체적으로는, 가금류 수정란(fertile eggs)을 육안으로 감별하는 것은 (무정란 (unfertile egg)의 부화를 방지하여) 부화 비용을 줄이기 위해 무정란을 제거하고, 수정란과 함께 이러한 오염되기 쉬운 무정란의 지속적인 부화와 관련된 생체-보안 위험(bio-security risks)을 낮추는 것이 중요하다.
배아의 초기 단계에서 알 수정을 육안으로 감별하는 것은, 부화되지 않은 알 내부에 외부의 광원 검란(candling)을 포함하며, 초기 배아 단계에서는 사실상 불가능할 수 있다. 더 큰 난제는 배아의 성을 감별하는 것이며, 현재 수정 능력이 확인된 부화되지 않은 알에서 암컷과 수컷을 구별할 수 있는 방법은 없다. 그러나, 초기 배아 단계에서의 수정의 감별 및 가금류의 성 결정은 조류 사육(aviculture), 과학 연구 및 보존을 위해 중요하다. 형태학적 특징에 의한 어린 새들의 성 결정은 대부분의 종들에게는 매우 어려운 과제이다. 성별은 병아리가 작은 "혹"을 가지고 있는지 볼 수 있도록, 병아리의 항문 구멍을 약간 열어, 병아리의 배설물을 밖으로 손으로 짜내는 것을 포함하는 개별적인 항문 감별(vent sexing)에 의해 결정될 수 있으며, 이는 병아리가 수컷임을 나타낸다. 그러나, 이 방법은 훈련받은 개인에 의해 손으로 수행하는 번거로운 작업과 함께, 조류의 높은 부상 위험과 성 결정의 실수를 나타낸다.
항문 감별 또는 병아리 감별은 보통 병아리 감별사 또는 닭 감별사라고 불리는 훈련받은 개인에 의해, 닭 및 기타 부화 유생(hatchlings)의 성을 구별하는 방법이다. 병아리 감별은 주로 병아리들을 성별 집단으로 분리하기 위해, 그리고 상업적 요구를 충족시키지 못하는 성 때문에 하나의 군의 성장과 다른 군의 도태를 포함할 수 있는 상이한 프로그램으로 병아리들을 넣기 위해 성별 차이를 알아야 하는 대규모 상업적 부화장들에 의해 수행된다. 예를 들어, 수컷은 시판 품종의 알층에서 유래된 알에서 부화된다. 그 수컷은 고기 생산량이 좋지 않을 것이고 알을 낳지 않을 것이다; 그러므로 이것은 감별 후에 도태될 것이다. 감별 후에, 관련된 성은 자신의 목적을 달성하는 과정을 계속할 것이고, 반면에 다른 성 또는 대부분은 알 생산과 무관하게 부화일 내에 도태될 것이다.
알을 낳는 농장에서는 수컷을 원치 않으며, 원치 않는 성의 병아리는 거의 즉시 살해되어 사육자에게 비용을 절감시킨다. 병아리는 컨베이어 벨트 아래로 이동하고, 거기서 병아리 감별사는 수컷을 분리하고 그들을 활송 장치(chute)로 던져서 보통 그들을 살아 있는 상태로 고기 분쇄기에서 갈아 부순다.
알의 부화 이전에 알에서 알의 수정 능력과 배아의 성 감별 및 결정은, 알에서 무정란 및 원치 않는 유형의 배아를 제거하는 것이 가능할 것이므로, 배양 비용 (대기 오염 및 에너지 소비와 함께 에너지 및 효율성 비용 포함)을 엄청나게 줄일 것이다. 또한, 병아리의 고통을 멈추고 도태로 인한 오염을 방지할 것이다. 자동화 감별 장치는 초기 단계에서 알의 50%가 공정에서 공제되어 감소될 것이기 때문에, 병아리 감별사의 필요성을 없애고 필요한 부화장의 크기를 줄임으로써 이들 알들을 부화시키는데 드는 비용 및 나중에 임의의 정교한 살해 과정의 필요성을 줄여, 알 생산 비용을 추가적으로 줄일 것이다.
사육, 산란 또는 고기 생산을 목적으로 하는 모든 상업용 새에서 수정 능력과 배아의 성을 결정할 필요가 있다. 에너지 절약, 생체 보안 위험 감소, 쓰레기 처리, 감별 인건비 및 감별 오류, 도태 비용 및 처리, 및 동물 복지에서 큰 경제적 수익이 있다.
WO 2010/103111은 배아의 성-특이적 항원과 일치하도록 특별히 설계된 표지된 항체를 알에 도입하는 일련의 단계를 포함하는 침습적 방법을 기재하고 있다.
WO 2014/0296707은 새의 알에 주사되는 백신 접종의 효율을 정량화하거나 또는 평가하기 위한 바이오마커로서 기능하도록 설계된 휘도(luminance) 조성을 기재하고 있다. 이 발명에는 성 결정이 기재되거나 또는 암시되지 않는다. 난자 내 주입 장치 및 검출 방법은 US 6244214에 개시되었다.
WO 06124456A2는 조류 알에서의 배아액 (예를 들어, 요막액(allantoic fluid) 또는 혈액)의 시료에서 에스트로겐성 스테로이드 화합물(estrogenic steroid compound)의 존재를 측정함으로써 조류 배아의 난자 내 성 결정의 침습적 방법을 개시하고 있다. 화합물의 존재를 결정하는 것은 형광 현미경을 이용한 경쟁적 면역 분석법에 의해 상기 조류 알로부터 얻은 시료에서 분석물(analyte)을 측정함으로써 수행된다.
또한, 분광법은 깃털 색에 근거하여, 조류 배아 깃털 색 (부화 전)의 스크리닝 및 조류 배아의 성 결정에 기초한 US2014069336A 또는 입사광 신호에 대한 껍질-특이적 스펙트럼을 얻는 장치를 개시하는 WO16005539에 기재되어 있다.
이 문제에 대한 추가적인 유전적 방법은, 새의 Z 및 W 염색체에 위치한 2개의 특정 유전자를 검출하기 위한 수정란으로부터 얻은 DNA 시료의 DNA 염기서열분석(sequencing) (WO 96/39505), 또는 암컷 W 염색체의 특정 서열에 혼성화하는 올리고뉴클레오티드 프로브의 사용 (WO 97/49806)을 포함한다. 이러한 방법은 침습적이므로 안전한 전략을 제공하지 않는다.
CRISPR (clustered regularly interspaced short palindromic repeats)/CRISPR-관련 (Cas) 시스템은 최첨단 유전자 편집 시스템으로, 높은 성공률로 간단한 구조체 설계가 가능하다 (J. Doudna, 2012).
Niu 등 (2014)은 원숭이 난모세포에 가이드 RNA (gRNA)와 Cas9 RNA를 주입하여 3개의 표적 유전자를 변형시켰으며, Hwang 등 (2013)은 제브라피시 배아에서 drd3 및 gsk3b 유전자를 변형하여 2개의 유전자좌 돌연변이체를 얻었다. Cong 및 Zhang (2015)은 CRISPR 시스템을 변형하여 살아있는 세포의 모든 유전자를 편집하였다.
Veron과 동료들 (2015)은, 닭 배아에서 체세포의 발현 수준이 PAX7 전사 인자 (Nadege et al., 2015)에 대한 CRISPR gRNA 플라스미드의 전기청공법에 의해 변형되었음을 입증하였고, Bai와 동료들은 PPAR-g, ATP 합성효소 엡실론 아단위(ATP synthase epsilon subunit; ATP5E)를 편집하였다.
Quansah, E. 등은, 피기백 트랜스포존(PiggyBac transposon) 시스템을 이용한 닭에서의 정자 매개 형질전환을 개시하였다. 특히, 이들은 GFP 플라스미드와 리포펙타민 LTXTM (LPX) 조합이 닭 정자의 생존력, 이동성 또는 수정 능력에 영향을 미치지 않는다는 것을 개시하고 있다.
따라서, 병아리를 부화하기 전에 알 단계에서 성 감별을 위한 효과적이고 비-침습적 방법은 현재 이용 가능하지 않다. 따라서, 부화되지 않은 알에서 배아의 정확하고 안전한 성 감별을 가능하게 하는 방법에 대해 오랜 염원이 있다.
현재 개시된 주제에 대한 배경 지식으로 간주되는 참고 문헌은 다음과 같다:
본 명세서에서 하기 참고 문헌의 확인은 이들이 현재 개시된 주제의 특허성에 어떤 식으로든 관련되어 있음을 의미하는 것으로 추론되어서는 안된다.
WO 2010/103111 WO 2014/0296707 US 6244214 06124456A2 US2014069336A WO16005539 WO 96/39505 WO 97/49806
Quansah, E., Long, J.A., Donovan, D.M., Becker, S.C., Telugu, B., Foster Frey, J.A., Urwin, N. 2014. Sperm-mediated transgenesis in chicken using a PiggyBac transposon system. Poultry Science Association Meeting Abstract. BARC Poster Day. Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J. A., & Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science, 337(6096), 816-821. Cong, L., & Zhang, F. (2015). Genome engineering using CRISPR-Cas9 system. Chromosomal Mutagenesis, 197-217.
본 발명의 제 1 측면은 부화되지 않은 알, 특히, 수정된 부화되지 않은 알에서 조류 또는 조류 배아의 성별 결정 방법에 관한 것이다. 일 특정 실시예에서, 상기 방법은 하기 단계를 포함할 수 있다:
첫번째, 단계 (a)에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본 명세서에서 유전자좌(locus)라고도 함)에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 형질전환 조류 피험자 또는 동물을 제공하거나 또는 얻는 단계. 두번째 단계 (b)에서, 형질전환 조류 피험자, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 얻는 단계.
다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 여부를 알에서 결정하는 단계를 포함한다. 보다 구체적인 실시예에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타냄으로써, 조류 배아에서의 W 염색체 또는 Z 염색체의 존재를 나타낸다.
제 2 측면에서, 본 발명은 조류의 형질전환 동물의 적어도 하나의 세포에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본 명세서에서 유전자좌라고도 함)에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는조류의 형질전환 동물에 관한 것이다.
또 다른 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포에 관한 것이다.
또 다른 측면에서, 본 발명은
(a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열;을 포함하는 키트를 제공한다.
매일, 수십억 마리의 수컷 병아리는 알을 낳거나 또는 고기 빵으로 유용하지 않기 때문에 질식 또는 분쇄를 통해 폐기되고 있다. 부화 전에 배아의 성을 결정하는 능력은 윤리적으로 및 재정적으로 모두 매우 중요하다. 닭에서 성 염색체의 유전자 구성(genetic make-up)은 수컷의 경우 ZZ이고 암컷의 경우 ZW이다. W 염색체가 암컷의 성별을 결정한다는 것을 의미한다. 이것은 수컷의 성별을 결정하는 것이 아버지로부터의 Y인, 인간과 다르다.
본 발명은 형질전환 조류 피험자의 성 특이적 염색체에 통합된 리포터 유전자를 이용한, 비-침습적이고 효율적인 성별 결정 방법을 제공한다. 부화되지 않은 알의 배아에서 이 리포터 유전자의 발현은 상기 배아의 성별을 명확하고 정확하게 감별한다.
따라서, 본 발명의 제 1 측면은 부화되지 않은 알, 특히, 수정된 부화되지 않은 알에서 조류 또는 조류 배아의 성별 결정 방법 및 임의로 선별 방법에 관한 것이다. 일 특정 실시예에서, 상기 방법은 하기 단계를 포함할 수 있다:
첫번째, 단계 (a)에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 형질전환 조류 피험자 또는 동물을 제공하거나 또는 얻는 단계. 두번째 단계 (b)에서, 형질전환 조류 피험자, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 얻는 단계.
다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 여부를 알에서 결정하는 단계를 포함한다. 보다 구체적인 실시예에서, 적어도 하나의 검출 가능한 신호의 검출은 적어도 하나의 리포터 유전자의 발현을 나타냄으로써, 조류 배아에서의 W 염색체 또는 Z 염색체의 존재를 나타낸다. 따라서, 리포터 유전자가 암컷 형질전환 조류의 Z 염색체에 통합된 경우, 검사된 알에서 검출 가능한 신호의 감별은 배아가 그 안에 통합된 리포터 유전자를 갖는 모계(maternal) Z 염색체를 가지고 있음을 나타내며, 이로써 배아는 수컷으로 감별된다. 대안적으로, 리포터 유전자가 암컷 형질전환 조류의 W 염색체에 통합된 경우, 검사된 알에서 검출 가능한 신호의 감별은 배아가 모계 W 염색체를 가지고 있으므로 암컷으로 결정되어, 이의 성별 결정을 제공함을 나타낸다.
이후에 본 명세서에서 더 상세히 기재되는 바와 같이, 본 발명에 의해 제공된 형질전환 조류는 암컷 또는 수컷일 수 있음을 이해하여야 한다. 보다 구체적인 실시예에서, 형질전환 조류 피험자가 암컷인 경우, 본 발명의 방법에 의해 감별된 알은 본 발명에 의해 제공된 형질전환 암컷 조류에 의해 낳는다. 보다 구체적인 실시예에서, 형질전환 암컷은 형질전환 수컷 또는 야생형 조류 수컷에 의해 수정될 수 있다. 또한, 수정은 형질전환 조류 암컷을 형질전환 또는 야생형 조류 수컷으로부터 얻은 정자와 교배 또는 수정에 의해 발생할 수 있다. 또 다른 실시예에서, 형질전환 조류가 수컷인 경우, 본 발명의 방법에 의해 감별된 알은 본 발명에 의해 제공된 형질전환 수컷과 교배된 야생형 또는 형질전환 암컷에 의해 낳거나, 또는 이의 임의의 세포, 특히 이의 성 염색체에 통합된 본 발명의 외인성 리포터 유전자를 포함하는 정자 세포에 의해 수정될 수 있다.
따라서, 본 발명은 부화되지 않은 수정란 내에서 조류 배아의 성별을 검출하는 방법을 제공한다. 본 발명의 방법은 조류 배아의 임의의 배아 단계의 부화되지 않은 알에 대해 적용될 수 있음을 이해하여야 한다.
본 명세서에서 사용된 "조류 배아의 배아 발생 단계(stage) 또는 단계 (step)"는 배반(germinal disc)이 배반엽 단계(blastodermal stage)에 있고 할강 (segmentation cavity)이 어두운 고리 모양을 띠는 제 1일의 단계; 제 1 홈(first groove)이 배반엽의 중심에 나타나고 난황막(vitelline membrane)이 나타나는 제 2일의 단계; 혈액 순환이 시작되고, 머리와 몸통이 구별될 수 있으며, 두뇌와 심근 구조가 뛰기 시작하는 제 3일의 단계; 양막강(amniotic cavity)이 배아를 둘러싸기 위해 발생 중이며 요막 소낭(allantoic vesicle)이 나타나는 제 4일의 단계; 배아가 C 모양을 띠고 팔다리가 확장되는 제 5일의 단계; 상지 및 하지(upper and lower limbs)의 손가락이 구별되는 제 6일의 단계; 목이 신체로부터 머리를 명확하게 분리되고, 부리(beak)가 형성되며, 뇌가 점진적으로 두부(cephalic region)로 들어가는 제 7일의 단계; 눈 착색이 쉽게 보일 수 있으며, 날개와 다리가 구별되고, 외이도(external auditory canal)가 열리는 제 8일의 단계; 발톱이 나타나고 첫 번째 우포(feather follicles)가 싹트기 시작하는 제 9일의 단계; 콧구멍이 있고, 눈꺼풀이 자라며, 난치(egg-tooth)가 나타나는 제 10일의 단계; 눈꺼풀 틈 (palpebral aperture)이 타원형이며 배아가 병아리의 측면에 있는 제 11일의 단계; 우포가 외이도(external auditory meatus)를 둘러싸고 윗 눈꺼풀(upper eyelid)을 덮는 반면, 아래 눈꺼풀(lower eyelid)이 각막의 대부분을 덮는 제 12일의 단계; 발톱 및 다리 비늘이 명백해지는 동안 요막(allantois)이 장요막 (chorioallantoic membrane)이 되는 제 13일의 단계; 전신(whole body)이 빠르게 자라며, 난황(vitellus) 수축이 가속화되고, 난백(egg white)이 점진적으로 사라지는 제 14일 내지 제 16일의 단계; 신장계가 요산염(urate)을 생산하고, 부리가 폐포(air cell)를 가리키며, 난백이 완전히 재흡수되는 제 17일의 단계; 난황이 내재화되고 양수(amniotic fluid)의 양이 감소되는 제 18일의 단계; 난환의 재흡수가 가속화되고, 부리가 내피막(inner shell membrane)을 관통할 준비가 된 제 19일의 단계; 난황이 완전히 재흡수되고, 배꼽(umbilicus)이 닫히며, 병아리가 내피막을 관통하고, 폐포로 호흡하며 부화할 준비가 된 제 20일의 단계; 병아리가 이의 난치에 의해 순환적으로 껍질을 관통하고, 12 내지 18시간 안에 껍질에서 빠져나와 건조하는 제 21일의 단계;를 나타낸다는 것을 유의해야 한다.
보다 구체적으로는, 본 발명의 방법은 배아 발생 과정의 모든 단계에서, 알 내부에서, 난자 내(in-ovo) 조류 배아의 성별을 결정하는데 적용될 수 있다. 보다 구체적으로는, 본 발명의 방법은 1일, 2일, 3일, 4일, 5일, 6일, 7일. 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일 및 21일에 적용될 수 있다. 보다 구체적으로는, 본 발명의 방법은 특히 1일부터 10일까지, 보다 구체적으로는 1일 내지 5일 사이에, 배아의 성별의 조기 검출에 적용될 수 있다.
상기 언급한 바와 같이, 본 발명의 방법은 수정된 부화되지 않은 알에 적용될 수 있다. 용어 "수정란"은 이하 암탉이 낳은 알을 나타내며, 암탉이 2주 이내에 수탉과 교배하여 수컷 정자를 암컷 누두(infundibulum)에 넣고 난소에서 난자가 방출될 때 수정이 발생할 수 있게 한다. 본 명세서에 사용된 "부화되지 않은 알"은 구조적으로 완전한 (깨지지 않은) 껍질 내에 배아를 함유하는 알 (본 명세서에서 수정란이라고도 함)에 관한 것이다.
본 발명의 방법은 검사된 알을 낳는 형질전환 조류 암컷 또는 수컷의 특정 유전자좌에 통합된 리포터 유전자에 의해 형성된 검출 가능한 신호의 측정에 기초한다.
본 명세서에서 사용된 "외래 또는 외인성 DNA/유전자를 염색체에 통합"은, 이하 유기체 염색체의 뉴클레오티드 서열의 영구 변형을 나타낸다. 이 변형은 세포 분열 동안 더 전이되고, 생식 세포주에서 발생하면 자손에게도 전달될 것이다. 이 경우, 통합된 리포터 유전자는 부화되지 않은 알 내의 배아에 전이될 수 있다. 본 명세서에서 사용된 용어 "외인성"은, 특이적으로 조작된 벡터, 바이러스 또는 다른 비히클로 형질전환 또는 형질감염에 의해 유기체에 도입된 유기체 외부로부터 유래된 것을 나타낸다. 특정 실시예에 따른 통합된 외인성 유전자는, 리포터 유전자일 수 있다. 용어 "리포터 유전자"는 폴리펩티드를 인코딩하는 유전자에 관한 것으로, 그 발현은 다양한 알려진 어세이로 검출될 수 있고, 검출된 신호의 수준은 상기 보고된 것의 존재를 나타낸다.
상기 언급한 바와 같이, 외인성 리포터 유전자는 조류의 성 염색체 Z 또는 W에 통합될 수 있다. 본 명세서에서 사용된 조류의 "성 염색체 Z 또는 W"는 수컷이 동형성(homogametic sex) (ZZ)이고 암컷이 이형성(heterogametic sex) (ZW)인 닭의 자손의 성을 결정하는 염색체 시스템을 나타낸다. 난자에서 W 염색체의 존재는 자손의 성을 결정하는 반면, Z 염색체는 더 크고 더 많은 유전자를 가지는 것으로 알려져 있다.
본 발명의 방법은 리포터 유전자의 존재 및 이에 따른 특정 성 염색체의 존재를 나타내고 반영하는 검출 가능한 신호의 검출에 기초한다. "검출 가능한 신호"는 이하에서 관찰 또는 기기에 의해 인지될 수 있는 변화를 나타낸다. 제한 없이, 신호는 직접 또는 시약이 있는 경우에만 검출될 수 있다. 일 실시예에서, 검출 가능한 반응은 화학발광 기를 포함하는 광학 신호이나, 이에 한정되지 않는다.
일 특정 실시예에서, 본 발명의 방법에 의해 제공된 적어도 하나의 형질전환 조류 피험자는, 적어도 2개의 상이한 리포터 유전자를 포함할 수 있고, 각각의 리포터 유전자는 성 염색체 Z 또는 W 중 하나에서 적어도 하나의 위치 또는 장소에 통합될 수 있음을 이해하여야 한다. 적어도 2개의 상이한 리포터 유전자의 경우, 성 염색체 각각은 다르게 표지될 수 있다. 형성된 검출 가능한 신호의 평가는, 검사된 배아의 성별을 나타낼 수 있다.
일 특정 실시예에서, 본 발명의 형질전환 조류 내에 포함된 리포터 유전자는 적어도 하나의 생체발광(bioluminescence) 리포터 유전자일 수 있다. 따라서, 일 실시예에서, 발현된 폴리펩티드는 생체발광 단백질이며, 따라서 어세이는 생체발광 반응으로부터 방출된 빛의 수준을 측정한다.
용어 "생체발광"은 단백질과 같은 생물학적 분자에 의한 빛의 방출을 나타낸다. 생체발광은 분자 산소, 옥시게나제, 및 기질인 루시페린에 작용하는 루시퍼라제를 포함하며, 이후에 보다 상세히 설명될 것이다.
보다 구체적인 실시예에서, 리포터 유전자는 루시퍼라제일 수 있다. 용어 "루시퍼라제"는 이하에서 생체발광 (광자 방출)을 생산하는 산화 효소의 부류를 나타낸다. 방출된 광자는 감광 장치(light sensitive apparatus), 예를 들어 발광광도계(luminometer) 또는 변형된 광학 현미경에 의해 검출될 수 있다. 루시퍼라제는 주로 리포터 유전자로 사용하기 위해, 다양한 유기체에서 유전 공학을 통해 생산될 수 있다. 루시퍼라제는 박테리아, 조류, 진균류, 해파리, 곤충, 새우, 및 오징어에서 자연적으로 발생한다. 박테리아에서, 발광 반응(light-emitting reaction)을 담당하는 유전자 (lux 오페론으로 인코딩된 lux 유전자)는 분리되어 490 nm에서 최대 강도의 청록색 빛을 방출하는 생체리포터의 구축에 광범위하게 사용되었다. 3개의 lux 변이체를 이용할 수 있다 (하나는 < 30℃에서 작용하고, 다른 하나는 < 37℃에서 작용하며, 세번째는 < 45℃에서 작용함). lux 유전자 시스템은 5개의 유전자인 luxA, luxB, luxC, luxD, 및 luxE로 이루어진다. 사용된 이들 유전자의 조합에 따라, 여러 가지 상이한 유형의 생체발광 생체리포터가 구축될 수 있다. 루시퍼라제 단백질은 luxAluxB 유전자 산물에 의해 형성된 이종이량체(heterodimer)이다. luxC, luxD, 및 luxE 유전자 산물은 각각 하나의 복합체에서 함께 작용하여 생체발광 반응을 위한 알데히드 기질을 생성하는, 환원 효소(reductase), 전이 효소 (transferase) 및 합성 효소(synthase)를 인코딩한다. luxAB 생체리포터는 빛 신호를 생성할 수 있는 luxAluxB 유전자만을 함유한다. 그러나, 발광 반응을 완전히 완료하기 위해서는, 기질 (장쇄 알데히드)이 세포에 공급되어야 한다.
반면에, luxCDABE 생체리포터는 lux 카세트의 5개 유전자를 모두 함유하고 있어, 기질의 외부로부터의 첨가 또는 외부 광원에 의한 임의의 여기를 필요로 하지 않는 완전히 독립적인 광 발생 시스템을 허용한다. 실시간 및 온-라인으로 반복적으로 생체분석을 수행하는 능력과 함께 이들의 신속성과 사용 용이성으로 인해, luxCDABE 생체리포터는 매우 매력적이다. 따라서, 특정 실시예에서, 본 발명의 방법은 리포터 유전자로서 luxCDABE 생체리포터를 사용할 수 있다.
또 다른 일 실시예에서, 본 발명의 방법은 리포터 유전자로서 luc 유전자를 사용할 수 있다. 반딧불이 루시퍼라제(Firefly luciferase) (luc 유전자)는 550-575 nm 범위에서 가시광선을 생성하는 반응을 촉진시킨다. 595 nm에 가까운 피크에서 빛을 생성하는 방아벌레(click-beetle) 루시퍼라제도 이용 가능하다. 두 루시퍼라제 모두 가벼운 반응이 일어나기 위해서는 외인성 기질 (루시페린)을 첨가해야 한다.
당해 기술분야에서 알려진 임의의 출처의 본 명세서에 기재된 루시퍼라제 중 임의의 것이 본 발명의 방법 및 키트에 적용될 수 있음을 이해하여야 한다.
일 특정 실시예에서, 본 발명의 방법에 의해 사용될 수 있는 루시퍼라제는 가우시아 프린셉스(Gaussia princeps) 루시퍼라제일 수 있다. 보다 구체적인 실시예에서, 본 발명에 의해 사용된 루시퍼라제는 GenBank: AAG54095.1에 의해 개시된 아미노산 서열을 갖는, GenBank: AY015993.1에 의해 개시된 핵산 서열에 의해 인코딩된 루시퍼라제일 수 있다. 또 다른 특정 실시예에서, 본 발명의 방법 및 키트에 의해 사용된 루시퍼라제는 서열번호 22로 표시되는 서열을 포함하는 핵산 서열에 의해 인코딩될 수 있다. 또 다른 일 실시예에서, 이러한 루시퍼라제는 서열번호 23으로 표시되는 아미노산 서열, 또는 이의 임의의 상동체, 돌연변이체 또는 유도체를 포함할 수 있다.
또 다른 일 실시예에서, 본 발명에 의해 사용된 루시퍼라제는 P. pyralis (반딧불이) 루시퍼라제일 수 있다. 일 특정 실시예에서, 이러한 루시퍼라제는 GenBank: AAA29795.1에 의해 개시된 아미노산 서열을 갖는, GenBank: M15077.1에 의해 개시된 핵산 서열에 의해 인코딩된 루시퍼라제일 수 있다. 또 다른 특정 실시예에서, 본 발명의 방법 및 키트에 의해 사용된 루시퍼라제는 서열번호 20으로 표시되는 서열을 포함하는 핵산 서열에 의해 인코딩될 수 있다. 또 다른 일 실시예에서, 이러한 루시퍼라제는 서열번호 21로 표시되는 아미노산 서열, 또는 이의 임의의 상동체, 돌연변이체 또는 유도체를 포함할 수 있다.
상기 언급한 바와 같이, 본 발명의 방법에 의해 사용된 루시퍼라제는 추가 시약, 특히, 기질을 보충할 것을 요구할 수 있다.
따라서, 또 다른 일 실시예에서, 방법은 단계 (b)의 상기 알에, 생체발광 리포터 유전자와 조화되는 기질 및 효소 중 적어도 하나를 제공하는 단계를 더 포함할 수 있다. 이러한 기질 또는 효소는 단계 (c)에서 검출된 검출 가능한 신호의 형성에 필요할 수 있음을 유의해야 한다. 보다 구체적으로는, 본 발명의 방법은 단계 (b)의 알에, 예를 들어 주사에 의해, 루시퍼라제에 대한 기질을 제공하는 단계를 포함할 수 있다. 일 특정 실시예에서, 이러한 기질은 루시페린일 수 있다. 본 명세서에서 사용된 루시페린은 생체발광을 생성하는 유기체에서 발견되는 발광 화합물에 대한 일반적인 용어이다. 루시페린은 일반적으로 효소-촉매 산화를 거치고, 결과의 여기 상태 중간체는 감쇠 시에(upon decaying) 이의 기저 상태로 빛을 방출한다. 또 다른 일 실시예에서, 상기 검출 가능한 신호의 형성에 필수적인 요소인 기질 루시페린은, 단계 (c)에서 수행되는 바와 같이, 특히, 상기 신호의 측정 및 결정 이전에 상기 알에 주입된다. 일 실시예에서, 기질은 상기 조류 피험자, 특히 동물의 배아 발생의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 21 일에 주입될 수 있다. 또 다른 일 실시예에서, 검출 가능한 신호의 형성에 필요한 기질 및/또는 추가 효소는, 상기 리포터 유전자에 작동가능하게 연결된 상기 기질 및/또는 효소를 인코딩하는 핵산 서열로서 수정란에게 제공될 수 있다. 이러한 특정 실시예는, 예를 들어 상기 기재된 바와 같은 luxCDABE 생체리포터의 용도를 나타낼 수 있다. luxCDABE 시스템은 lux 카세트의 5개 유전자를 함유하고 있어, 기질의 외부로부터의 첨가 또는 외부 광원에 의한 임의의 여기를 필요로 하지 않는 완전히 독립적인 광 발생 시스템을 허용한다.
일 실시예에서, 검출 가능한 신호, 특히, 생체발광 신호는 적당한 생체발광 수단을 이용하여 검출될 수 있음을 유의해야 한다. 일 실시예에서, 루시퍼라제 리포터 유전자에 의해 형성된 검출 가능한 신호는 감광 장치, 예를 들어 발광광도계 또는 변형된 광학 현미경 또는 고감도 광자 검출기인 전하 결합 소자 (Charge Coupled Device; CCD)에 의해 검출될 수 있다.
또 다른 실시예에서, 본 발명의 방법에 의해 제공된 적어도 하나의 형질전환 조류 피험자 또는 동물은 암컷 조류 피험자 또는 동물일 수 있다. 보다 구체적인 실시예에서, 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합되는 경우, 검출 가능한 신호의 검출은 부화되지 않은 알에서의 배아가 수컷임을 나타낸다.
또 다른 일 실시예에서, 본 발명의 방법에 의해 제공된 적어도 하나의 형질전환 조류 피험자 또는 동물은 암컷 조류 피험자 또는 동물일 수 있다. 일 특정 실시예에서, 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합되는 경우, 검출 가능한 신호의 검출은 부화되지 않은 알에서의 배아가 암컷임을 나타낸다.
또 다른 일 실시예에서, 본 발명의 방법에 의해 제공된 형질전환 동물은 그의 Z 염색체에 통합된 리포터 유전자를 갖는 수컷 피험자일 수 있다. 이러한 경우, 이러한 형질전환 수컷 또는 이의 임의의 정자에 의해 수정된 알에서 측정된 검출 가능한 신호는, 배아가 형질전환 리포터 유전자를 포함하는 부계(paternal) Z 염색체를 가지고 있으므로 수컷임을 나타낸다. 또 다른 실시예에서, 형질전환 수컷 조류에 의해 수정된 형질전환 암컷 조류가 낳은 알에서 검출 가능한 신호의 검출은, 둘 다 이들의 Z 염색체에 통합된 본 발명의 리포터 유전자를 가지고 있으며, 강한 신호의 경우, 배아는 암컷 및 수컷의 Z 염색체에 통합된 리포터 유전자의 2개의 복제(copies)를 가지고 있음을 나타낼 수 있다. 덜 강한 신호의 경우, 알은 암컷으로 결정될 수 있다.
전술한 바와 같이, 본 발명의 방법은 형질전환 조류 동물의 제공을 포함한다. 형질전환 조류 동물의 제조는, 특정 뉴클레아제를 이용할 수 있는 유전 공학 방법의 사용을 필요로 한다.
따라서, 보다 구체적인 실시예에서, 적어도 하나의 리포터 유전자는 적어도 하나의 PEN(programmable engineered nuclease)을 이용한 본 발명의 방법에 의해 제공된 형질전환 조류 피험자 또는 동물의 성 염색체에 통합될 수 있다. 본 명세서에서 사용된 용어 "PEN(programmable engineered nuclease)"은 이중 가닥 DNA 병변의 DNA 복구에 관여하고 직접적인 게놈 편집을 가능하게 하는 자연적으로 발생하는 뉴클레아제에서 유래된 특정 DNA 서열을 절단하는 합성 효소를 나타낸다.
CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 제 II 형 시스템은 게놈 공학을 위해 변형된 박테리아 면역 시스템이다. 그러나, 모든 게놈 표적의 특정 뉴클레아제-쌍의 설계 및 생성을 필요로 하는 맞춤형 (customizable) DNA-결합 단백질 뉴클레아제의 사용을 전달하는, ZFNs(zinc finger nucleases) 또는 TALENs(transcription-activator-like effector nucleases)와 같은 다른 게놈 공학 방법도 본 명세서에서 적용될 수 있음을 이해하여야 한다.
본 명세서에서 사용된 바와 같이, SPIDRs (Spacer Interspersed Direct Repeats)로도 알려진 CRISPR 어레이는 일반적으로 특정 박테리아 종에 특이적인 최근에 기재된 DNA 유전자좌의 과(family)를 구성한다. CRISPR 어레이는 E. coli에서 최초로 인식되는 산재된 SSRs(short sequence repeats)의 다른 종류이다. 이후 몇 년 동안, 결핵균(Mycobacterium tuberculosis), 할로페락스 메디테라네이 (Haloferax mediterranei), 메타노칼도코쿠스 자나스키(Methanocaldococcus jannaschii), 써모토가 마리티마(Thermotoga maritima) 및 기타 박테리아와 고세균 (archaea)에서 유사한 CRISPR 어레이가 발견되었다. 본 발명은 임의의 알려진 CRISPR 시스템, 특히 본 명세서에 개시된 CRISPR 시스템의 사용을 고려함을 이해하여야 한다. CRISPR-Cas 시스템은 외래 DNA 또는 RNA를 표적으로 하여 파지 공격 및 원하지 않는 플라스미드 복제를 방지하기 위해 원핵생물에서 진화하였다. CRISPR-Cas 시스템은, 반복 사이에 존재하는 스페이서라고 불리는, 짧은 상동성 DNA 서열을 기반으로 하여 DNA 분자를 표적한다. 이들 스페이서는 CRISPR-관련 (Cas) 단백질을 프로토-스페이서(proto-spacer)라고 불리는 외래 DNA 내에서 일치하는 (및/또는 상보적인) 서열로 유도하며, 이들은 이후에 절단된다. 스페이서는 임의의 DNA 서열을 표적하기 위해 합리적으로 설계될 수 있다. 또한, 이 인식 요소는 임의의 원하는 표적을 인식하고 표적하기 위해 별도로 설계될 수 있다. 당업자가 인식할 수 있는 바와 같이, CRISPR 시스템과 관련하여, 자연적으로 발생하는 CRISPR 유전자좌의 구조는 일반적으로 "반복"으로 불리는 다수의 짧은 반복 서열을 포함한다. 반복은 클러스터에서 발생하며, 일반적으로 "스페이서"라고 불리는 고유 개입 서열(unique intervening sequences)에 의해 규칙적으로 간격을 둔다. 일반적으로, CRISPR 반복은 약 24 내지 47 염기쌍 (bp)의 길이로 변하고, 부분적으로 회문성(palindromic)이다. 스페이서는 2개의 반복 사이에 위치하고, 일반적으로 각각의 스페이서는 약 20 이하 내지 72 이상의 bp의 길이의 독특한 서열을 가진다. 따라서, 특정 실시예에서, 본 발명의 방법 및 키트의 적어도 하나의 gRNA를 인코딩하는 서열에서 사용되는 CRISPR 스페이서는 각각 10 내지 75의 뉴클레오티드 (nt)를 포함할 수 있으며, 보다 구체적으로는, 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75 또는 그 이상을 포함할 수 있다. 일 특정 실시예에서, 스페이서는 약 20 내지 25의 뉴클레오티드, 보다 구체적으로는, 약 20의 핵염기(nucleobases)를 포함한다.
적어도 하나의 반복 및 적어도 하나의 스페이서 이외에, CRISPR 유전자좌는 리더 서열 및 임의로 적어도 하나의 tracrRNA를 인코딩하는 서열도 포함한다. 리더 서열은 일반적으로 제 1 반복의 5' 말단에 직접 인접한 550 bp까지의 AT-풍부 서열이다.
보다 구체적인 실시예에서, PEN은 CRISPR (clustered regularly interspaced short palindromic repeats) 제 II 형 시스템일 수 있다.
보다 구체적으로는, 3가지 주요 유형의 CRISPR-Cas 시스템이 기술된다: 제 I 형, 제 II 형 및 제 III 형.
제 II 형 CRISPR-Cas 시스템은 'HNH'-형 시스템 (스트렙토코쿠스-유사; Neisseria meningitidis serogroup A str. Z2491, 또는 CASS4에 대해 Nmeni 아형으로도 알려짐)을 포함하며, 단일의 매우 큰 단백질인 Cas9는 편재하는 Cas1 및 Cas2 이외에 crRNA를 생성하고 표적 DNA를 절단하는데 충분할 것으로 보인다. Cas9는 적어도 2개의 뉴클레아제 도메인, 아미노 말단 근처의 RuvC-유사 뉴클레아제 도메인 및 단백질 중간의 HNH (또는 McrA-유사) 뉴클레아제 도메인을 함유하나, 이들 도메인의 기능은 아직 밝혀지지 않았다. 그러나, HNH 뉴클레아제 도메인은 제한 효소에서 풍부하기 때문에, 표적 절단을 담당하는 엔도뉴클레아제 활성을 가진다.
제 II 형 시스템은 pre-crRNA에서 tracrRNA와 반복의 일부 사이의 이합체 (duplex) 형성을 포함하는 특이한 기전(unusual mechanism)을 통해 pre-crRNA를 절단한다; 이후에 pre-crRNA 처리 경로의 첫 번째 절단이 이 반복 영역에서 발생한다. 또한, 제 II 형 시스템은 cas9, cas1, cas2 csn2, cas4 유전자 중 적어도 하나를 포함함을 유의해야 한다. 임의의 제 II 형 CRISPR-Cas 시스템, 특히, 제 II-A 또는 B 형 중 어느 하나가 본 발명에 적용될 수 있음을 이해하여야 한다.
따라서, 또 다른 일부 및 대안적인 실시예에서, 본 발명의 방법 및 키트에 사용된 적어도 하나의 cas 유전자는 제 II 형 CRISPR 시스템 (제 II-A 형 또는 제 II-B 형) 중 적어도 하나의 cas 유전자일 수 있다. 더 특정한 실시예에서, 본 발명의 방법 및 키트에 의해 사용된 제 II 형 CRISPR 시스템의 적어도 하나의 cas 유전자는 cas9 유전자일 수 있다. 이러한 시스템은 cas1, cas2, csn2 cas4 유전자 중 적어도 하나를 더 포함할 수 있음을 이해하여야 한다.
Cas9에 의한 이중 가닥 DNA (dsDNA) 절단은 ' 제 II 형 CRISPR-Cas ' 면역계의 특징이다. CRISPR-관련 단백질 Cas9는 RNA:DNA 상보성을 이용하여 서열-특이적 이중 가닥 DNA (dsDNA) 절단을 위한 표적 부위를 동정하는 RNA-유도된 DNA 엔도뉴클레아제이며, 이는 리포터 유전자를 특정 표적 서열, 예를 들어, 조류의 성 염색체 W 및 Z 내의 특정 표적 서열에 통합시키는 HDR에 필요한 DSBs(double strand brakes)를 생성한다. 표적화된 DNA 서열은 짧은 회문성 반복(short palindromic repeats)에 의해 분리된 일련의 약 30 내지 40 bp 스페이서인 CRISPR 어레이에 의해 명시된다. 어레이는 pre-crRNA로 전사되고, 프로토-스페이서로 알려진 상보적 DNA 서열을 표적하기 위해 Cas 단백질 복합체와 결합하는 보다 짧은 crRNAs로 처리된다. 또한, 이들 프로토-스페이서 표적은 표적 인식에 필요한 PAM(proto-spacer adjacent motif)으로 알려진 추가 이웃 서열을 가져야 한다. 결합 후, Cas 단백질 복합체는 표적에서 두 가닥을 절단하기 위한 DNA 엔도뉴클레아제의 역할을 하며, 이후에 엑소뉴클레아제 활성을 통해 DNA 분해가 발생한다.
본 명세서에서 사용된 CRISPR 제 II 형 시스템은 2개의 필수 성분의 포함을 필요로 한다: "가이드" RNA (gRNA) 및 비-특이적인 CRISPR-관련 엔도뉴클레아제 (Cas9). gRNA는 Cas9-결합에 필요한 "스캐폴드" 서열 및 변형될 게놈 표적을 정의하는 약 20 뉴클레오티드 길이의 "스페이서" 또는 "표적화" 서열로 구성된 짧은 합성 RNA이다. 따라서, gRNA에 존재하는 표적화 서열을 단순히 변경함으로써 Cas9의 게놈 표적을 변경할 수 있다. 본 명세서에서 사용된 가이드 RNA (gRNA)는 내인성 박테리아 crRNA 및 tracrRNA의 합성 융합체를 나타내며, 이는 Cas9 뉴클레아제에 대한 표적화 특이성 및 스캐폴딩/결합 능력을 제공한다. "단일 가이드 RNA" 또는 "sgRNA"라고도 한다. CRISPR은 원래 다양한 세포 유형과 유기체에서 "녹-아웃 (knock-out)" 표적 유전자에 사용되었으나, Cas9 효소로의 변형은 "녹-인(knock-in)" 표적 유전자로 CRISPR의 적용을 확장시키고, 표적 유전자를 선택적으로 활성화하거나 또는 억제하며, DNA의 특정 영역을 정제하고, 형광 현미경을 이용하여 살아있는 세포에서 DNA를 영상화한다. 또한, gRNAs 생성의 용이성은 CRISPR을 가장 확장 가능한 게놈 편집 기술 중 하나로 만들며, 최근에는 게놈-와이드 스크리닝에 이용되었다.
편집될 게놈 내의 표적, 특히, 본 발명의 리포터 유전자가 통합될 성 염색체 Z 또는 W 내의 특정 표적 유전자좌는, PAM(Protospacer Adjacent Motif)의 바로 상류에 존재해야 한다.
PAM 서열은 표적 결합에 절대적으로 필요하고, 정확한 서열은 Cas9의 종 (스트렙토코쿠스 피오게네스(Streptococcus pyogenes) Cas9에 대해 5' NGG 3')에 의존한다. 특정 실시예에서, S. pyogenes로부터의 Cas9는 본 발명의 방법 및 키트에서 사용된다. 그럼에도 불구하고, 임의의 알려진 Cas9가 적용될 수 있음을 이해하여야 한다. 본 발명에서 유용한 Cas9의 비-제한적인 예는, SP(Streptococcus pyogenes) (본 명세서에서 SpCas9로도 나타냄), SA(Staphylococcus aureus) (본 명세서에서 SaCas9로도 나타냄), NM(Neisseria meningitidis) (본 명세서에서 NmCas9로도 나타냄), ST(Streptococcus thermophilus) (본 명세서에서 StCas9로도 나타냄) 및 TD (Treponema denticola) (본 명세서에서 TdCas9로도 나타냄)를 포함하나 이에 한정되지 않는다. 일 특정 실시예에서, 스트렙토코쿠스 피오게네스 M1 GAS의 Cas9, 특히, 단백질 id: AAK33936.1의 Cas9이 본 발명의 방법 및 키트에서 적용될 수 있다. 일 실시예에서, Cas9 단백질은 서열번호 24로 표시되는 핵산 서열에 의해 인코딩될 수 있다. 추가의 특정 실시예에서, Cas9 단백질은 서열번호 25로 표시되는 아미노산 서열, 또는 이의 임의의 유도체, 돌연변이체 또는 변이체를 포함할 수 있다. 일단 발현되면, Cas9 단백질 및 gRNA는, gRNA "스캐폴드" 도메인과 Cas9의 표면-노출된 양전하를 띤 홈 사이의 상호 작용을 통해 리보단백질 복합체를 형성한다. Cas9는 불활성, 비-DNA 결합 구조에서 활성 DNA-결합 구조로 분자를 이동시키는 gRNA 결합시 구조적 변화를 겪는다. 중요하게는, gRNA의 "스페이서" 서열은 표적 DNA와 자유롭게 상호 작용한다. Cas9-gRNA 복합체는 임의의 게놈 서열을 PAM과 결합하나, gRNA 스페이서가 표적 DNA와 일치하는 정도에 따라 Cas9가 절단되는지 여부가 결정된다. 일단 Cas9-gRNA 복합체가 추정 DNA 표적에 결합하면, gRNA 표적화 서열의 3' 말단에 있는 "종자(seed)" 서열이 표적 DNA에 어닐링되기 시작한다. 종자 및 표적 DNA 서열이 일치하면, gRNA는 3'에서 5' 방향으로 표적 DNA에 어닐링을 계속한다.
Cas9는 gRNA 스페이서 및 표적 서열간에 충분한 상동성이 존재하는 경우에만 표적을 절단할 것이다. 또한, Cas9 뉴클레아제는 2개의 기능적 엔도뉴클레아제 도메인을 가진다: RuvC 및 HNH. Cas9는 표적 DNA의 반대 가닥을 절단하기 위해 뉴클레아제 도메인을 위치시키는 표적 결합시 두 번째 구조적 변화를 겪는다. Cas9-매개 DNA 절단의 최종 결과는 PAM 서열의 약 3 내지 4 뉴클레오티드 상류에서 발생하는 표적 DNA 내의 이중 가닥 절단(double strand break, DSB)이다.
그 다음, 결과의 DSB는 2개의 일반적인 복구 경로인, 효율적이나 오류가 발생하기 쉬운(error-prone) NHEJ (Non-Homologous End Joining) 경로 및 덜 효율적이나 고성능(high-fidelity)의 HDR (Homology Directed Repair) 경로 중 하나에 의해 복구될 수 있다. 일 실시예에서, 성 염색체 W 또는 Z 내의 특정 표적 유전자좌에 본 발명의 리포터 유전자의 특정 통합을 야기하는 삽입은 Cas9에 기인한 DSBs의 복구 결과이다. 일 특정 실시예에서, 본 발명의 리포터 유전자는 HDR에 의해 표적 유전자좌에 통합되거나 또는 녹-인된다.
본 명세서에서 사용된 용어 "HDR (Homology directed repair)"은 이중 가닥 DNA 병변을 복구하는 세포에서의 기전을 나타낸다. 가장 일반적인 형태의 HDR은 상동 재조합(homologous recombination)이다. HDR 복구 기전은 주로 세포주기의 G2 및 S 단계에서 핵에 존재하는 DNA의 상동체 조각이 있을 때 세포에 의해서만 사용될 수 있다. 상동체 DNA 조각이 없는 경우, NHEJ (non-homologous end joining)라고 불리는 또 다른 과정이 대신 발생할 수 있다. 게놈 편집을 위한 PEN (Programmable engineered nucleases) 전략은 특정 이중 가닥 DNA 절단 후에 HDR 기전의 세포 활성화를 기반으로 한다.
앞서 논의한 바와 같이, Cas9는 2개의 뉴클레아제 도메인인 RuvC 및 HNH의 조합된 활성을 통해 이중 가닥 절단 (DSBs)을 생성한다. 엔도뉴클레아제 활성에 중요한 각각의 뉴클레아제 도메인 내의 정확한 아미노산 잔기가 알려져 있으며 (S. pyogenes Cas9에서 HNH에 대해 D10A, RuvC에 대해 H840A), 단 하나의 활성 촉매 도메인만을 함유하는 Cas9 효소의 변형된 버전 ("Cas9 닉카제(nickase)"라 함)이 생성되었다. Cas9 닉카제는 여전히 gRNA 특이성에 기반하여 DNA에 결합하나, 닉카제는 DSB 대신에 DNA 가닥 중 하나를 절단하여, "닉(nick)" 또는 단일 가닥 절단을 야기할 수 있다. DNA 닉은 온전한 상보적 DNA 가닥을 주형으로 이용하여 HDR (homology directed repair)에 의해 빠르게 복구된다. 따라서, 반대 가닥을 표적으로 하는 2개의 닉카제는 표적 DNA (종종 "이중 닉(double nick)"또는 "이중 닉카제 (dual nickase)" CRISPR 시스템이라고 함) 내에서 DSB를 생성하는데 필요하다. 이 요건은 DSB를 야기하기에 충분히 인접한 거리 내에서 2개의 오프-표적(off-target) 닉이 생성되지 않을 것이기 때문에, 표적 특이성을 현저히 증가시킨다. 따라서, 본 발명은 특이성을 증가시키고 오프-표적 효과를 감소시키기 위해 이중 닉-유발된 DSB를 생성시키는 이중 닉카제 방법의 사용을 더 포함함을 이해하여야 한다.
따라서, 특정 실시예에서, 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/CRISPR-관련 엔도뉴클레아제 9 (Cas9) 시스템에 의해 매개되는 HDR (homology directed repair)에 의해 형질전환 조류 피험자, 특히 동물의 성 염색체에 통합될 수 있다.
일 추가 실시예에서, 본 발명의 키트의 gRNA는 적어도 하나의 crRNA (CRISPR RNA) 및 적어도 하나의 tracrRNA (trans-activating crRNA)를 포함할 수 있다.
일 다른 실시예에서, 본 발명의 키트는 적어도 하나의 gRNA를 인코딩하는 핵산 서열을 포함할 수 있다. 이러한 핵산 서열은 표적 게놈 DNA 서열에서 적어도 하나의 프로토-스페이서를 표적하고 따라서 이와 동일한 적어도 하나의 스페이서 서열을 포함하는 CRISPR 어레이를 포함할 수 있다. 핵산 서열은 적어도 하나의 tracrRNA를 인코딩하는 서열을 더 포함함을 유의해야 한다.
일 실시예에서, 본 발명에 따른 CRISPR 어레이는 적어도 하나의 스페이서 및 적어도 하나의 반복을 포함한다. 또 다른 실시예에서, 본 발명은 동일하거나 또는 상이한 표적을 표적할 수 있는 몇몇 최종 gRNA 산물로 처리될 수있는 pre-crRNA를 제공하는 방안을 더 포함한다.
또 다른 일 특정 실시예에서, 본 발명의 gRNA 내에 포함된 crRNA는 표적 게놈 DNA 서열에 상보적인 단일-가닥 리보핵산 (ssRNA) 서열일 수 있다. 일 특정 실시예에서, 표적 게놈 DNA 서열은 PAM (protospacer adjacent motif) 서열의 바로 상류에 위치할 수 있고, 더 나아가서 더 멀리 위치할 수 있다.
본 명세서에 나타낸 바와 같이, 본 발명의 키트의 gRNA는 표적 게놈 DNA에 적어도 부분적으로 상보적일 수 있다. 특정 실시예에서, "상보성 (Complementarity)"은 자물쇠와 열쇠(lock-and-key) 원리를 각각 따르는 2개의 구조 사이의 관계를 나타낸다. 사실상 상보성은 2개의 DNA 또는 RNA 서열 사이에 공유되는 특성으로서 DNA 복제 및 전사의 기본 원리이며, 이들이 서로 반대 방향으로 정렬될 때, 서열 내의 각 위치의 뉴클레오티드 염기는 상보적일 것이다 (예를 들어, A 및 T 또는 U, C 및 G).
상기에 나타낸 바와 같이, 본 발명의 키트의 gRNA에 의해 표적화된 게놈 DNA 서열은 PAM 서열의 바로 상류에 위치한다. 일 실시예에서, 이러한 PAM 서열은 핵산 서열 NGG 일 수 있다.
특정 실시예에서, 본 발명에 언급된 PAM 서열은 임의의 뉴클레오티드, 구체적으로는, 아데닌 (A), 구아닌 (G), 시토신 (C) 또는 티민 (T) 중 어느 하나인 N을 포함할 수 있다. 또 다른 일 실시예에서, 본 발명에 따른 PAM 서열은 A, G, C, 또는 T 및 2개의 구아닌으로 구성된다.
일 실시예에 따르면, 본 발명의 gRNA를 인코딩하는 폴리뉴클레오티드는 적어도 하나의 스페이서 및 임의로 적어도 하나의 반복을 포함할 수 있다. 또 다른 일 실시예에서, 본 발명의 gRNA를 인코딩하는 DNA는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 그 이상, 특히, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 또는 그 이상의 스페이서를 포함할 수 있다. 일 실시예에서, 각 스페이서는 2개의 반복 사이에 위치한다. 또한, 본 발명의 gRNA를 인코딩하는 핵산 서열의 스페이서는 동일하거나 또는 상이한 스페이서일 수 있음을 더 이해하여야 한다. 더 많은 실시예에서, 이들 스페이서는 동일하거나 또는 상이한 표적 게놈 DNA를 표적화할 수 있다. 일 다른 실시예에서, 이러한 스페이서는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 그 이상의 표적 게놈 DNA 서열을 표적화할 수 있다. 이러한 표적 서열은 단일 유전자좌 또는 대안적으로 몇몇 표적 유전자좌로부터 유도될 수 있다.
본 명세서에서 사용된 바와 같이, 용어 "스페이서"는 특정 서열을 표적하도록 설계되고 CRISPR 어레이의 다수의 짧은 직접 반복 (즉, CRISPR 반복) 사이에 위치한 비-반복적인 스페이서 서열을 나타낸다. 일 특정 실시예에서, 스페이서는 약 15 내지 약 30의 뉴클레오티드, 구체적으로는, 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 그 이상의 뉴클레오티드, 보다 구체적으로는, 약 20-25의 뉴클레오티드를 포함할 수 있다.
본 발명의 CRISPR 시스테에 의해 인코딩된 가이드 또는 표적화 RNA는 crRNA (CRISPR RNA) 및 tracrRNA (trans activating crRNA)를 포함할 수 있다. CRISPR 스페이서에 의해 인코딩된 표적화 RNA의 서열은, 본 명세서에서 "프로토-스페이서"라고도 불리는 조류 게놈 DNA에서 표적 서열 (즉, 동일하거나 또는 상보성인 부분 (segment)을 갖는 표적 서열)에 대한 요건 이외에는 특별히 제한되지 않는다. 이러한 프로토-스페이서는 본 발명의 방법 및 키트의 gRNA를 인코딩하는 핵산 서열 내에 포함된 CRISPR 스페이서에 의해 인코딩된 표적화 RNA에 대해 충분한 상보성을 갖는 핵산 서열을 포함한다.
일 실시예에서, crRNA는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40 nt의 스페이서 (표적화) 서열 다음에 19-36 nt의 반복 서열을 포함하거나 또는 이루어진다. 구체적이고 비-제한적인 실시예에서, 표적화 스페이서는 대표적인 스페이서 서열이 본 명세서에 표시되어 있는 게놈 DNA 서열 중 어느 하나를 표적하는 부분(segment)을 포함하거나 또는 이루어질 수 있다.
일 특정 실시예에서, 본 발명의 CRISPR 시스템의 스페이서는 표적화 가이드 RNA (gRNA)를 인코딩할 수 있음을 유의해야 한다. "gRNA" 또는 "표적화 RNA"는 이것을 인코딩하는 CRISPR 시스템의 일부로부터 전사될 때, 표적 게놈 DNA 내의 DNA 서열과 동일하거나 (RNA의 경우, T를 U로 대체하는 것을 제외) 또는 상보적인 (따라서 "표적") RNA 서열의 적어도 하나의 부분(segment)을 포함하는 RNA이다. 본 발명의 CRISPR 시스템은 하나 이상의 표적화 RNA를 임의로 인코딩할 수 있으며, 표적화 RNAs는 게놈 DNA 내의 하나 이상의 표적 서열로 유도된다.
또한, 일 실시예에서, 적어도 하나의 리포터 유전자는, 조류 피험자, 특히 동물의 적어도 하나의 세포 또는 조류 피험자, 특히 동물에 도입된 적어도 하나의 세포를, (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및 (b) 적어도 하나의 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열과 함께, 공-형질감염시킴으로써 형질전환 조류 피험자, 특히 동물의 성 염색체에 통합될 수 있다.
따라서, 본 발명의 방법에 의해 사용된 형질전환 조류 동물의 제조를 위해서는, 적어도 2개의 핵산 분자가 제공되어야 한다.
본 명세서에서 사용된 바와 같이, "핵산 또는 핵산 분자"는 용어 "폴리뉴클레오티드(들)"과 혼용될 수 있으며, 이것은 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA 또는 이들의 임의의 조합일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리-데옥시리보뉴클레오티드를 나타낸다. "핵산"은 단일- 및 이중- 가닥 핵산을 제한없이 포함한다. 본 명세서에서 사용된 바와 같이, 용어 "핵산 (들)"은 하나 이상의 변형된 염기를 함유하는 상기 기재된 DNAs 또는 RNAs도 포함한다. 본 명세서에서 사용된 바와 같이, 용어 "올리고뉴클레오티드"는 2 이상, 바람직하게는 3 이상의 데옥시리보뉴클레오티드 및/또는 리보뉴클레오티드로 구성된 분자로 정의된다. 이것의 정확한 크기는 결국 올리고뉴클레오티드의 궁극적인 기능 및 사용에 의존하는 많은 인자에 의존할 것이다. 올리고뉴클레오티드는 약 8 내지 약 1,000의 뉴클레오티드 길이일 수 있다. 보다 구체적으로는, 본 발명의 키트에 의해 사용된 올리고뉴클레오티드 분자(들)은 길이가 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 그 이상의 염기 중 어느 하나를 포함할 수 있다.
핵산 분자는 자연적으로 발생하는 뉴클레오티드인 단량체 (예를 들어, DNA 및 RNA), 또는 자연적으로 발생하는 뉴클레오티드의 유사체 (예를 들어, 자연적으로 발생하는 뉴클레오티드의 알파-거울상이성질체 형태(alpha-enantiomeric forms)), 또는 변형된 뉴클레오티드 또는 이들의 임의의 조합으로 구성될 수 있다. 본 명세서에서 이 용어는 cDNA, 즉 역전사 효소 (RNA-의존성 DNA 폴리머라제)의 작용에 의해 RNA 주형으로부터 생성된 상보적 또는 복제 DNA도 포함한다.
이와 관련하여, "분리된 폴리뉴클레오티드"는 유기체의 게놈으로부터 분리된 핵산 분자이다. 예를 들어, 세포의 게놈 DNA로부터 분리된, 본 발명의 방법 및 키트에 의해 사용된 리포터 유전자를 인코딩하는 DNA 분자 또는 이의 임의의 유도체 또는 상동체, 및 본 발명의 방법 및 키트의 CRISPR/Cas9 및 gRNA를 인코딩하는 서열은 분리된 DNA 분자이다. 분리된 핵산 분자의 또 다른 예는, 유기체의 게놈에 통합되지 않은 화학적으로-합성된 핵산 분자이다. 특정 종으로부터 분리된 핵산 분자는 그 종의 염색체의 완전한 DNA 분자보다 작다. 일 실시예에서, 본 발명의 방법 및 키트에 의해 사용된 핵산 서열, 구체적으로는, Cas9 및 gRNA를 인코딩하는 서열, 또는 대안적으로 본 발명의 리포터 유전자를 포함하는 핵산 서열은, 벡터 내에 구축되어 제공될 수 있다. 따라서, 본 발명은 또한 본 발명의 폴리뉴클레오티드, 및 임의로, 본 발명의 핵산 서열에 작동가능하게 연결된 프로모터, 조절 및 조절 요소(regulatory and control elements), 번역, 발현 및 기타 신호와 같은 추가 요소를 포함하는 재조합 DNA 구조체에 관한 것이다.
본 명세서에서 사용된 바와 같이, "재조합 DNA", "재조합 핵산 서열" 또는 "재조합 유전자"는 조류 염색체 Z 및/또는 W 내의 특정 유전자좌로 Cas9를 표적하는 본 발명의 gRNA와 함께, 본 발명의 CRISPR 시스템 중 하나, 구체적으로는 CRISPR/Cas9 제 II 형을 인코딩하는 개방 판독 프레임(open reading frame)을 포함하는 핵산을 나타낸다. 또 다른 실시예에서, 본 명세서에서 사용된 재조합 DNA는 본 발명의 리포터 유전자, 구체적으로는, 트랜스유전자(transgene)를 인코딩하는 개방 판독 프레임을 포함하는 핵산을 더 나타낸다.
본 명세서에 나타낸 바와 같이, 용어 "유전자" 또는 "트랜스유전자"는 단백질 산물을 인코딩하는 자연적으로 발생하거나 또는 합성 핵산을 의미한다. 용어 "핵산"은 뉴클레오티드 및 뉴클레오시드, 예를 들어 cDNA, 게놈 DNA (gDNA), mRNA 및 RNA, 올리고뉴클레오티드, 올리고뉴클레오시드 및 이들의 유도체의 천연 및/또는 합성 선형, 원형 및 순차적 배열을 의미한다.
"작동가능하게 연결된"이라는 문구는 트랜스유전자의 전사를 허용하는 방식으로 부착된 것을 의미하는 것이다. 용어 "인코딩"은 대상 핵산이 적당한 벡터 (예를 들어, 발현 벡터)에서 프로모터 및 인핸서 요소와 같은 적당한 조절 서열에 연결될 때 및 벡터가 적당한 시스템 또는 세포 내로 도입될 때, 대상 핵산이 적당한 발현 시스템에서 원하는 폴리펩티드 또는 대상 단백질로 전사되고 번역될 수 있음을 의미하는 것이다.
일 실시예에서, 본 발명의 방법 및 키트에 의해 제공되고 사용되는 제 1 핵산 서열 및 제 2 핵산 서열 중 적어도 하나는 벡터 내에서 구축되고 포함될 수 있음을 이해하여야 한다. 본 명세서에서 사용된 바와 같이, "벡터" 또는 "비히클"은 숙주의 게놈에 DNA 단편의 통합을 가능하게 하거나, 또는 대안적으로, 통합되지 않은 유전적 요소의 발현을 가능하게 하는, 플라스미드, 파지미드(phagemides), 바이러스, 통합가능한 DNA 단편, 및 기타 비히클과 같은 벡터를 포함한다. 벡터는 일반적으로 원하는 핵산 서열, 및 적당한 숙주 세포에서 인식되고 원하는 스페이서의 번역에 영향을 주는 작동가능하게 연결된 유전적 조절 요소를 함유하는 자기-복제 DNA 또는 RNA 구조체이다. 일반적으로, 유전적 조절 요소는 원핵생물 프로모터 시스템 또는 진핵생물 프로모터 발현 조절 시스템을 포함할 수 있다. 이러한 시스템은 일반적으로 RNA 발현 수준을 상승시키기 위해 전사 프로모터, 전사 인핸서를 포함한다. 벡터는 일반적으로 벡터가 숙주 세포와 독립적으로 복제하는 것을 허용하는 복제 기점을 함유한다. 또 다른 일 실시예에서, 본 발명에 의해 사용된 발현 벡터는 본 발명의 바람직한 리포터 유전자를 조류의 성 특이적 염색체 W 및/또는 Z에 통합시키는데 필요한 요소를 포함할 수 있다.
따라서, 용어 "조절 및 조절 요소(control and regulatory elements)"는 프로모터, 터미네이터 및 기타 발현 조절 요소를 포함한다. 이러한 조절 요소는 Goeddel에 기재되어 있다; [Goeddel., et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)]. 예를 들어, DNA 서열이 작동가능하게 연결될 때, DNA 서열의 발현을 조절하는 다양한 발현 조절 서열 중 임의의 것은 본 발명의 방법을 이용하여 임의의 원하는 단백질을 인코딩하는 DNA 서열을 발현시키기 위해 이들 벡터에서 사용될 수 있다.
벡터는 추가로 적당한 제한 부위, 항생제 내성 또는 벡터-함유 세포의 선별을 위한 기타 마커를 포함할 수 있다. 플라스미드는 가장 일반적으로 사용되는 형태의 벡터이나, 동등한 기능을 제공하고 당해 기술분야에서 알려진 또는 알려지는 다른 형태의 벡터도 본 명세서에서 사용하기에 적합하다. 참조, 예를 들어, Pouwels et al., Cloning Vectors: a Laboratory Manual (1985 and supplements), Elsevier, N.Y.; and Rodriquez, et al. (eds.) Vectors: a Survey of Molecular Cloning Vectors and their Uses, Buttersworth, Boston, Mass (1988), 본 명세서에 참조로 포함된다.
본 발명의 방법에 의해 사용된 형질전환 조류 동물을 생성하기 위해, 이의 성 염색체 Z 또는 W 내의 특정 유전자좌에 통합된 리포터 유전자를 포함하는 조류 세포를 제조해야 한다. 이러한 세포는 본 발명의 방법 및 키트에 의해 제공된 제 1 핵산 서열 및 제 2 핵산 서열 또는 이를 포함하는 임의의 구조체와 함께 세포를 공-형질감염시켜 제조될 수 있다. 본 명세서에서 사용된 "형질감염"은 유전 물질, 예를 들어 DNA 및 이중 가닥 RNA를 포유동물 세포에 삽입하는 과정을 의미한다. DNA를 세포에 삽입하면 세포 자체의 기계를 이용하여 단백질을 발현 또는 생산할 수 있다. 따라서, 본 명세서에서 사용된 공-형질감염은 적어도 2개의 상이한 핵산 분자 또는 이를 포함하는 임의의 벡터를 각각의 단일 세포에 동시에 형질감염시키는 것을 의미한다. 또한, 형질감염되는 핵산 서열은 일시적으로 짧은 기간에 발현될 수 있거나, 또는 게놈 DNA에 포함될 수 있으며, 여기서 그 변화는 세포가 분열함에 따라 세포에서 세포로 전달된다.
따라서, 본 발명은 리포터 유전자, 구체적으로는, 루시퍼라제의 발현에 기초한 난자 내 조류 배아의 성별 결정 방법을 제공한다. "발현"은 일반적으로 유전자-인코딩된 정보가 세포에 존재하고 작동하는 구조로 변환되는 과정을 나타낸다. 따라서, 본 발명에 따른 리포터 유전자의 "발현"은 구체적으로 폴리뉴클레오티드로의 전사, 단백질로의 번역, 또는 단백질의 번역 후 변형을 나타낼 수 있다.
또 다른 일 특정 실시예에서, 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 상동 암(homologous arms)에 의해 이의 5' 및 3'의 측면에 위치할 수 있다. 일 실시예에서, 이들 암은 필수적이며, 따라서 통합 부위에서 리포터 유전자의 HDR을 용이하게 한다는 것을 이해하여야 한다.
보다 구체적인 실시예에서, 본 발명의 방법에 의해 사용된 제 2 핵산 서열의 리포터 유전자는 상동이거나 또는 HDR을 통해 특정 통합을 용이하게 하는 통합 부위로서의 역할을 하는 성 염색체 Z 또는 W 내의 표적 유전자좌 내에 포함된 적어도 하나의 핵산 서열에 대해 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상동성 또는 동일성을 나타내는 2개의 암과 함께 측면에 있을 수 있다. 특정 실시예에서, 표적 서열은 본 명세서에서 본 발명에 의해 사용된 gRNA의 일부인 "스페이서" 서열에 의해 인식되고 제 1 핵산 서열에 의해 제공되는 적어도 하나의 "프로토-스페이서"라고도 불린다.
본 명세서에서 사용된 용어 "상동 암(Homologous arms)"은 (어떤 PEN이 사용되는지에 따라) 변형될 표적 서열을 둘러싸는 일정량의 상동성을 갖는 특정 돌연변이 또는 새로운 요소의 유전자 내 삽입을 생성하는데 사용되는, 특정 벡터 또는 바이러스에 도입된 HDR 주형을 나타낸다. 또 다른 일 특정 실시예에서, CRISPR이 PEN으로 사용되는 경우, 암 서열 (좌, 상류 및 우, 하류)은 약 10 내지 5000 bp, 구체적으로는, 약 50 내지 1000 bp, 100 내지 500 bp, 특히, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000bp를 포함할 수 있다.
또 다른 일 실시예에서, 본 명세서에서 "스페이서" 서열로도 불리는, 본 발명의 방법 및 키트에 의해 제공되는 제 1 핵산 서열에 의해 인코딩된 gRNA 내의 표적화 서열은, 본 명세서에서 "프로토-스페이서"라고 불리는, 성 염색체 Z 또는 W 내의 표적 유전자좌 내에 포함된 적어도 하나의 핵산 서열에 대해 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상동성 또는 동일성을 나타낸다.
일 실시예에서, 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이적 프로모터, 배아 특이적 프로모터 (예를 들어, Mason et al. 1996에서 언급된 α-글로빈 프로모터) 및 유도성 프로모터 (예를 들어, US 5750385에 청구된 대두 SSU 유전자에서 유래된, 또는 Weisshaar et al. 1991에서 언급된 파슬리 칼콘 합성효소 (parsley chalcone synthase) CHS 프로모터에서 유래된 광-유도성 프로모터, 또는 Metta-Mena et al. 2014에서 인용된 청색광으로 조사될 때 발현을 활성화시키는 박테리아 빛-산소-전압 단백질(bacterial Light-Oxygen-Voltage protein)인 EL222의 조작된 버전) 중 어느 하나에 작동가능하게 연결될 수 있다. 더 구체적인 실시예에서, 리포터 유전자는 배아 프로모터의 조절 하에 있으며, 이로써 형질전환 리포터 유전자의 발현이 배아 단계로 제한되며, 성인 병아리에서는 발현되지 않는다. 이러한 실시예에서, 리포터 트랜스유전자는 진단 목적을 위해 배아 단계에서만 사용되고 발현된다.
보다 구체적으로는, 본 명세서에서 사용된 "프로모터"는 하류에 위치하는 유전자의 발현을 조절하는 능력을 가지는 특정 영역의 DNA를 나타낸다. 따라서, "병아리의 성에 특이적인 프로모터"는 이하 특정 병아리의 성 (즉, 수컷 또는 암컷)에서만 유전자의 발현을 활성화시키는 프로모터를 나타낸다. 또한, "병아리의 성장에 특이적인 프로모터"는 특정 단계의 병아리 성장에서만 유전자의 발현을 활성화시키는 프로모터를 나타낸다.
일 특정 실시예에서, 적어도 하나의 리포터 유전자가 삽입되어 표적 성 염색체의 적어도 하나의 비-코딩 영역에 통합될 수 있다. 이러한 방법은 부화되지 않은 배아의 발생과 성숙에 필요할 수 있는 유전자의 파괴를 피한다.
본 명세서에서 사용된 "비-코딩 영역"은 단백질 서열을 인코딩하지 않는 유기체의 DNA 성분을 나타낸다. 일부 비-코딩 DNA 영역은 기능적 비-코딩 RNA 분자로 전사되고, 비-코딩 DNA 영역의 다른 기능은 단백질-코딩 서열, 스캐폴드 부착 영역, DNA 복제의 기점, 센트로미어(centromeres) 및 텔로미어(telomeres)의 전사 및 번역 조절을 포함한다. 가정된 비-기능적 부분 (또는 기능이 알려지지 않은 DNA)은 종종 "정크 DNA(junk DNA)"라고 불렸다.
일 특정 실시예에서, 적어도 하나의 리포터 유전자는 성 W 염색체의 적어도 하나의 부위에 통합될 수 있다. 보다 구체적인 실시예에서, W 염색체 내의 특정 유전자좌는 위치 1022859-1024215일 수 있다. 일 특정 실시예에서, 표적 유전자좌는 서열번호 3으로 표시되는 핵산 서열을 포함할 수 있다.
보다 구체적인 실시예에서, 리포터 유전자를 W 염색체 내의 이러한 특정 위치로 표적화하는데 요구되는 적어도 하나의 gRNA는 서열번호 1 및 2 중 어느 하나로 표시되는 핵산 서열을 포함할 수 있으며, 이들 gRNAs는 각각 본 명세서에서 gRNA1 및 gRNA2로 나타낸다.
더욱 더 구체적인 실시예에서, 형질전환 조류 암컷을 제조하기 위해 본 발명의 방법에 의해 사용된 gRNA는 서열번호 1로 표시되는 핵산 서열 (gRNA1)을 포함할 수 있다. 이러한 경우, 상기 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 W 염색체 내의 상기 특정 유전자좌에 각각 이의 통합을 용이하게 하는 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다. 이들 암은 본 명세서에서 각각 좌암 및 우암(left and right arms)으로도 나타냄을 이해하여야 한다.
또 다른 대안적인 실시예에서, 본 발명의 형질전환 조류 암컷을 제조하기 위해 사용된 gRNA는 서열번호 2로 표시되는 핵산 서열 (gRNA2)을 포함할 수 있다. 이러한 경우, 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다. 이들 암은 본 명세서에서 각각 좌암 및 우암으로도 나타냄을 이해하여야 한다.
또 다른 대안적인 실시예에서, 형질전환 조류 동물을 제조하기 위해 본 발명의 방법에 의해 사용된 적어도 하나의 리포터 유전자는, 성 Z 염색체의 적어도 하나의 부위에 통합될 수 있다. 보다 구체적인 실시예에서, Z 염색체 내의 특정 유전자좌는 암탉의 염색체 Z의 서열번호 15로 표시되는 9156874-9161874, 서열번호 16으로 표시되는 27764943-27769943, 서열번호 17로 표시되는 42172748-42177748, 서열번호 18로 표시되는 63363656-63368656, 및 서열번호 19로 표시되는 78777477-78782477 영역들 중 어느 하나일 수 있다.
보다 구체적인 실시예에서, 리포터 유전자를 Z 염색체 내의 이러한 특정 위치로 표적화하는데 요구되는 적어도 하나의 gRNA는 서열번호 11로 표시되는 gRNA3: ACAGACCTATGATATGT; 서열번호 12로 표시되는 gRNA4: CGATTATCACTCACAAG; 서열번호 13으로 표시되는 gRNA5: CTGGTTAGCATGGGGAC; 서열번호 14로 표시되는 gRNA6: GTAAAGAGTCAGATACA 중 어느 하나로 표시되는 핵산 서열을 포함할 수 있다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 41로 표시되는 핵산 서열을 포함하는 좌암(left arm) 및 서열번호 42로 표시되는 핵산 서열을 포함하는 우암(right arm)을 사용하여 본 발명의 리포터 유전자를 서열번호 11의 gRNA3에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 43으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 44로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 12의 gRNA4에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 45로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 46으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 13의 gRNA5에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 47로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 48로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 14의 gRNA6에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비-제한적인 예는, 서열번호 26으로도 표시되는 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7, 서열번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있으나, 이에 한정되지 않는다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 31로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 32로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 26의 gRNA7에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 33으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 34로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 27의 gRNA8에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 35로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 36으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 28의 gRNA9에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 37로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 38로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 29의 gRNA10에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 39로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 40으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 30의 gRNA11에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
조류 숙주의 접합체(zygote) 세포의 유전자좌가 외인성 서열, 특히, 본 발명에 의해 사용된 리포터 유전자로 표적화 및/또는 형질감염된 경우, 형질전환 동물을 생성하기 위해 이러한 세포를 사용하는 것이 바람직할 수 있다. 이러한 방법의 경우, 배아 줄기 (ES) 세포에 표적화 구조체를 도입한 후에, 세포를 적당한 배지, 예를 들어, 성장 인자 및 사이토카인, 소태아 혈청 및 항생제로 보충된 DMEM에서 피더층(feeder layer) 상에 플레이팅할 수 있다. 배아 줄기 세포는 단일 표적화된 유전자좌 (이형접합(heterozygous)) 또는 표적화된 유전자좌 모두 (동형접합 (homozygotic))를 가질 수 있다. 구조체를 함유하는 세포는 선택 배지를 사용하여 검출될 수 있으며, 콜로니가 성장하기에 충분한 시간 후에, 콜로니를 선택하여 유전자 표적화의 발생에 대해 분석할 수 있다. 일 특정 실시예에서, PCR은 구조체 서열의 내부 및 외부의 프라이머를 이용하여 원하는 외인성 서열을 표적 유전자좌 내로 통합시키는 것을 검증하기 위해 적용될 수 있다. 그 다음, 유전자 표적화를 나타내는 콜로니는 조류 배아에 주입하는데 사용될 수 있다. ES 세포를 트립신화한 다음, 변형된 세포를 알의 측면에 있는 개구부를 통해 주입할 수 있다. 알을 밀봉한 후, 알이 부화할 때까지 적당한 조건 하에서 알을 배양할 수 있다. 새로 부화된 조류는 이의 생물학적 시료, 예를 들어 혈액 시료를 검사하여, 표적 구조체 서열의 존재에 대해 시험할 수 있다. 조류가 성숙한 후에, 그들을 사육하고, 외인성 통합 서열이 생식 계열 (germline)을 통해 전이되는지 여부를 결정하기 위해 그들의 자손을 검사할 수 있다.
생식 계열을 통해 유전적 변형을 전이시킬 수 있는 변형된 배아 줄기 세포 또는 접합체 세포로부터 부분적으로 유래된 키메라 조류가 생성된다. 외인성 서열, 구체적으로는, 본 발명에 의해 사용된 리포터 유전자, 또는 이의 일부를 함유하는 조류 균주와, 조류 야생형 유전자좌 또는 이의 일부가 회복된 균주의 교배는, 난자 내에서 검출가능한 성별을 나타내는 자손을 야기해야 한다.
또한, 형질전환 조류는 다른 방법으로도 생산될 수 있으며, 그 중 일부는 하기에서 논의된다. 형질전환 동물을 생성하기 위해 형질전환에 적합한 조류 세포 중에는 원시 생식 세포 (primordial germ cells, PGC), 정자 세포 및 접합체 세포 (배아 줄기 세포 포함)가 있다. 정자 세포는 전기천공법(electroporation), 미립자 충격법(microparticle bombardment), 리포펙션(lipofection) 등을 포함하는 임의의 적당한 방법에 의해 DNA 구조체로 형질전환될 수 있다. 정자는 조류의 인공 수정에 사용될 수 있다. 수정된 조류의 자손은 상기 기재된 바와 같이 외인성 서열을 검사할 수 있다.
대안적으로, 원시 생식 세포는 조류 알에서 분리되고, 임의의 적당한 방법에 의해 본 발명의 외인성 리포터 유전자로 형질감염되고, 발생하는 생식선(gonads)에 포함될 수 있는 새로운 배아로 전이되거나 또는 삽입될 수 있다. 부화된 조류 및 이들의 자손은 본 발명에 의해 기재된 바와 같이 외인성 리포터 유전자 서열을 검사할 수 있다.
또 다른 방법에서, 알에서 분리된 분산된 배반엽 세포는 외인성 리포터 유전자 서열 또는 이의 일부를 성 특이적 염색체 Z 또는 W에 통합시킨 다음, 온전한 알의 배하강(subgerminal cavity)에 주입함으로써 임의의 적당한 수단에 의해 형질감염될 수 있다. 부화된 조류 피험자 및 이들의 자손은 상기 기재된 바와 같이 외인성 리포터 유전자를 검사할 수 있다.
닭 원시 생식 세포 (PGCs)는 난자 및 정자의 전구체이다. 따라서, 본 발명의 일 측면에서, 본 발명은 리포터 유전자 구조체 및 성 특이적 염색체 W 및 Z에 리포터 유전자의 통합을 유도하는 CRISPR/Cas9 gRNA 구조체와 함께 공-형질감염된 PGCs를 이용한 생식 계열 전이 시스템을 통해 형질전환 닭의 생산을 제공한다. PGCs는 분류되고, 생식 계열 전이를 위해 2.5-일 수여자 배아의 혈류로 전달된다.
따라서, 일 특정 실시예에서, "형질전환 조류 동물의 제조"는 게놈 변형된 닭의 생산을 위한 유전 공학 기술을 포함하는 다-단계 방법을 나타낸다; (a) 원시 생식 세포 (PGCs)는 2일령 병아리 배아의 혈액으로부터 분리된다; (b) 트랜스유전자 구조체는 렌티바이러스 시스템, 피기백 트랜스포존 벡터, TALENS 또는 CRISPR/Cas9 기술을 이용하여 배양된 PGCs에 포함된다; (c) 형질전환 PGCs가 감별되고 배아의 순환계에 주입되어 발생하는 생식선으로 이동한다; (d) 수여자 배아를 부화할 때까지 37℃에서 배양한다. (d) 부화된 수컷은 성숙한 상태로 양육되고 야생형 암탉과 교배된다; (e) 자손은 형질전환 PGCs에서 유래된 것을 동정하기 위해 스크리닝된다.
따라서, 제 2 측면에서, 본 발명은 조류의 형질전환 동물의 적어도 하나의 세포에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본 명세서에서 유전자좌라고도 함)에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 조류의 형질전환 동물에 관한 것이다.
용어 "조류"는 깃털, 이가 없는 부리 모양의 턱(toothless beaked jaw), 단단한 껍질의 알의 산란, 높은 대사율, 4-심실 심장(four-chambered heart), 및 가벼우나 강한 골격을 특징으로 하는 새에서 유래된 모든 종과 관련이 있다. 조류 종은 닭, 메추라기, 칠면조, 오리, 갈리나세아 종(Gallinacea sp), 거위, 꿩 및 기타 가금류를 제한 없이 포함한다. 용어 "암탉"은 조류 종의 모든 암컷을 포함한다. "형질전환 조류"는 일반적으로 이종 DNA 서열, 또는 조류의 생식 세포에 염색체적으로 통합된 조류에 일반적으로 내인성인 하나 이상의 추가 DNA 서열 (총괄하여 본 명세서에서 "트랜스유전자"라고 함)을 갖는 조류를 나타낸다. 이러한 전달 및 통합의 결과로서, 전달된 서열은 생식 세포를 통해 형질전환 조류의 자손에게 전이될 수 있다. 형질전환 조류 (이의 자손 포함)도 체세포의 성 염색체에 통합된 트랜스유전자를 가진다.
일 특정 실시예에서, 본 발명의 적어도 하나의 형질전환 동물은 적어도 2개의 상이한 리포터 유전자를 포함할 수 있다. 이러한 경우, 각 리포터 유전자는 성 염색체 Z 또는 W 중 하나에서 적어도 하나의 위치 또는 장소에 통합될 수 있다.
또 다른 일 실시예에서, 본 발명의 형질전환 동물 내에 포함된 리포터 유전자는 적어도 하나의 생체발광 리포터 유전자일 수 있다.
보다 구체적인 실시예에서, 이러한 생체발광 리포터 유전자는 루시퍼라제를 포함하거나 또는 루시퍼라제일 수 있다.
특정 실시예에서, 본 발명에 의해 제공된 적어도 하나의 형질전환 조류 동물은 암컷일 수 있다. 보다 구체적인 실시예에서, 이러한 형질전환 조류 암컷에서 적어도 하나의 리포터 유전자는 암컷 염색체 Z의 적어도 하나의 위치에 통합될 수 있다.
또 다른 대안적인 실시예에서, 적어도 하나의 형질전환 조류 동물은 암컷 염색체 W의 적어도 하나의 위치에 통합된 적어도 하나의 리포터 유전자를 갖는, 암컷일 수 있다.
일 특정 실시예에서, 적어도 하나의 리포터 유전자는 적어도 하나의 PEN을 이용한 본 발명의 형질전환 동물의 성 염색체에 통합될 수 있다.
보다 구체적으로는, 특정 실시예에서, 이러한 PEN은 CRISPR 제 II 형 시스템일 수 있다.
또 다른 특정 실시예에서, 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/Cas9 시스템에 의해 매개되는 HDR에 의해 본 발명의 형질전환 조류 동물의 성 염색체에 통합될 수 있다.
보다 구체적인 실시예에서, 적어도 하나의 리포터 유전자는, 이 조류 동물의 적어도 하나의 세포 또는 상기 조류 동물에 도입된 적어도 하나의 세포를, 적어도 2개의 핵산 서열과 함께 공-형질감염시킴으로써 본 발명의 형질전환 조류 동물의 성 염색체에 통합될 수 있다. 더욱 구체적으로는, 이러한 세포는 (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 gRNA를 인코딩하는 적어도 하나의 핵산 서열을 포함하여, CRISPR 매개 통합을 제공하는 적어도 하나의 제 1 핵산 서열; 및 (b) 적어도 하나의 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열과 함께, 공-형질감염시킬 수 있다.
보다 구체적인 실시예에서, 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다. 이들 암은 표적 성 염색체 내에서 통합 표적 부위와 상동성을 나타내므로, 통합 부위에서 HDR을 용이하게 한다.
또 다른 특정 실시예에서, 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이적 프로모터, 배아 특이적 프로모터 및 유도성 프로모터 중 어느 하나에 작동가능하게 연결될 수 있다. 이러한 프로모터는 본 발명의 리포터 유전자의 발현을 특정 원하는 성 (성 특이적 프로모터의 경우), 특정 배아 단계 (배아 특이적 프로모터) 또는 특정 조건 (유도성 조건)으로 제한해야 한다.
또 다른 일 특정 실시예에서, 본 발명의 형질전환 조류 동물 내에 포함된 적어도 하나의 리포터 유전자는 이의 성 염색체 중 하나의 적어도 하나의 비-코딩 영역에 통합될 수 있다.
특정 실시예에서, 적어도 하나의 리포터 유전자는 성 W 염색체의 적어도 하나의 부위에 통합될 수 있다. 일 특정 실시예에서, 통합 부위는 W 염색체의 유전자좌 1022859-1024215, 구체적으로는, 염색체 W:1022859-1024215의 galGal5_dna 범위에 위치될 수 있다. 또 다른 일 특정 실시예에서, 이러한 유전자좌는 서열번호 3으로 표시되는 핵산 서열을 포함한다.
상기 기재된 유전자좌 내의 임의의 위치에서 본 발명의 리포터 유전자의 특정 통합을 위해서는, 특정 gRNAs가 요구될 수 있다. 따라서, 몇몇 특정의 비-제한적인 실시예에서, 본 발명의 형질전환 조류 동물의 제조에 사용된 적당한 gRNAs는 서열번호 1 및 2 중 어느 하나로 표시되는 핵산 서열을 포함할 수 있다. 일 특정 실시예에서, 이들 gRNAs는 각각 본 명세서에서 gRNA1 및 gRNA2로 나타낸다.
일 특정 실시예에서, 본 발명에 의해 제공된 형질전환 조류 동물은 서열번호 1로 표시되는 핵산 서열을 포함하는 gRNA1을 이용하여 제조되었다. 이러한 특정 위치에서 본 발명의 리포터 유전자의 통합을 가능하게 하기 위해, 특정 실시예에서, 통합되어야 하는 리포터 유전자는 사용된 gRNA에 의해 유도된 표적 통합 부위에서 이의 통합을 용이하게 하는 특정 암을 가지고 있어야 한다. 따라서, 일 특정 실시예에서, 적어도 하나의 리포터 유전자는 제 2 핵산 서열 내에 포함될 수 있으며, 여기서 이 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 대안적인 실시예에서, 본 발명에 의해 제공된 형질전환 조류 동물은 서열번호 2로 표시되는 핵산 서열을 포함하는 gRNA2를 이용하여 제조될 수 있다. 이러한 경우, 상기 gRNA2에 의해 인식된 특정 부위에서 본 발명의 리포터 유전자의 통합을 가능하게 하기 위해, 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 대안적인 실시예에서, 본 발명의 형질전환 조류 동물은 성 Z 염색체의 적어도 하나의 부위에 통합된 적어도 하나의 리포터 유전자를 포함할 수 있다. 몇몇 특정의 비-제한적인 실시예에서, 이러한 조류의 형질전환 동물은 Z 염색체에 통합된 형질전환 리포터 유전자를 가지고 있는 암컷일 수 있다. 보다 구체적인 실시예에서, Z 염색체 내의 특정 유전자좌는 암탉의 염색체 Z의 서열번호 15로 표시되는 9156874-9161874, 서열번호 16으로 표시되는 27764943-27769943, 서열번호 17로 표시되는 42172748-42177748, 서열번호 18로 표시되는 63363656-63368656, 및 서열번호 19로 표시되는 78777477-78782477 영역들 중 어느 하나일 수 있다.
보다 구체적인 실시예에서, 리포터 유전자를 Z 염색체 내의 이러한 특정 위치로 표적화하는데 요구되는 적어도 하나의 gRNA는 서열번호 11로 표시되는 gRNA3: ACAGACCTATGATATGT; 서열번호 12로 표시되는 gRNA4: CGATTATCACTCACAAG; 서열번호 13으로 표시되는 gRNA5: CTGGTTAGCATGGGGAC; 서열번호 14로 표시되는 gRNA6: GTAAAGAGTCAGATACA 중 어느 하나로 표시되는 핵산 서열을 포함할 수 있다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 41로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 42로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 11의 gRNA3에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 43으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 44로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 12의 gRNA4에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 45로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 46으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 13의 gRNA5에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 47로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 48로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 14의 gRNA6에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비-제한적인 예는, 서열번호 26으로도 표시되는 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7, 서열번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있으나, 이에 한정되지 않는다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 31로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 32로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 26의 gRNA7에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 33으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 34로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 27의 gRNA8에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 35로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 36으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 28의 gRNA9에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 37로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 38로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 29의 gRNA10에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 39로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 40으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 30의 gRNA11에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
또 다른 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포에 관한 것이다.
일 특정 실시예에서, 본 발명에 의해 제공된 세포는 조류 세포일 수 있다.
일 특정 실시예에서, 본 발명에 의해 제공된 조류 세포는 원시 생식 세포 (PGC)일 수 있다.
용어 "생식 세포"는 다른 생식 세포와 결합할 때 생식체(gamete)로 성장하는 배아 세포를 나타낸다. 본 명세서에서 사용된 "원시 생식 세포 (PGCs)"는, 생식체의 전구 세포(progenitor) 역할을 하며 만능 배아 줄기 세포(pluripotent embryonic stem cells)를 야기하는 생식 계열 줄기 세포에 관한 것이다. 배아발생 (embryogenesis) 동안 PGCs가 되기 위해 신호를 보내는 장배형성 배아 (gastrulating embryo)의 세포는, 생식선이 되는 생식 융기(genital ridges)로 이동하고 성숙한 생식체로 분화한다.
또 다른 일 실시예에서, 본 발명에 의해 제공된 세포는 세포의 성 염색체에 통합된 적어도 하나의 리포터 유전자를 포함할 수 있다. 보다 구체적인 실시예에서, 이러한 리포터 유전자의 특정 통합은 세포를, (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열과 함께, 공-형질감염시킴으로써 가능할 수 있다.
특정 실시예에서, 본 발명의 세포와 공-형질감염된 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 통합 부위에서 HDR의 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
일 특정 실시예에서, 본 발명에 의해 제공된 세포에서 염색체 W에 리포터 유전자의 통합을 표적하기 위해, 특정 gRNAs가 사용되어야 한다. 추가의 특정 실시예에서, gRNA는 본 명세서에서 gRNA1이라고 하는 서열번호 1로 표시되는 핵산 서열을 포함할 수 있다. 이러한 경우, 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 대안적인 실시예에서, 본 발명에 의해 제공된 세포는 gRNA2라고 하는 gRNA를 이용하여 제조될 수 있다. 특정 실시예에서, gRNA2는 서열번호 2로 표시되는 핵산 서열을 포함할 수 있다. 이러한 특정 실시예에서, 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 대안적인 실시예에서, 본 발명에 의해 제공된 세포는 세포의 Z 염색체에 본 발명의 적어도 하나의 리포터 유전자를 통합시킴으로써 제조될 수 있다. 특정 실시예에서, 본 발명의 세포를 제조하기 위해, 적어도 하나의 리포터 유전자는, 성 Z 염색체의 적어도 하나의 부위에 통합될 수 있다. 보다 구체적인 실시예에서, Z 염색체 내의 특정 유전자좌는 암탉의 염색체 Z의 서열번호 15로 표시되는 9156874-9161874, 서열번호 16으로 표시되는 27764943-27769943, 서열번호 17로 표시되는 42172748-42177748, 서열번호 18로 표시되는 63363656-63368656, 및 서열번호 19로 표시되는 78777477-78782477 영역들 중 어느 하나일 수 있다.
보다 구체적인 실시예에서, 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 이러한 특정 위치로 표적화하는데 요구되는 적어도 하나의 gRNA는 서열번호 11로 표시되는 gRNA3: ACAGACCTATGATATGT; 서열번호 12로 표시되는 gRNA4: CGATTATCACTCACAAG; 서열번호 13으로 표시되는 gRNA5: CTGGTTAGCATGGGGAC; 서열번호 14로 표시되는 gRNA6: GTAAAGAGTCAGATACA 중 어느 하나로 표시되는 핵산 서열을 포함할 수 있다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 41로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 42로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 11의 gRNA3에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 43으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 44로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 12의 gRNA4에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 45로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 46으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 13의 gRNA5에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 47로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 48로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 14의 gRNA6에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비-제한적인 예는, 서열번호 26으로도 표시되는 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7, 서열번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있으나, 이에 한정되지 않는다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 31로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 32로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 26의 gRNA7에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 33으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 34로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 27의 gRNA8에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 35로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 36으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 28의 gRNA9에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 37로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 38로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 29의 gRNA10에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 39로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 40으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 30의 gRNA11에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
또 다른 측면에서, 본 발명은
(a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열;을 포함하는 키트를 제공한다.
일 실시예에서, 본 발명의 키트 내에 포함된 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 통합 부위에서 HDR의 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 특정 실시예에서, 본 발명의 키트의 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이적 프로모터, 배아 특이적 프로모터 및 유도성 프로모터 중 어느 하나에 작동가능하게 연결될 수 있다.
특정 실시예에서, 적어도 하나의 리포터 유전자는 성 염색체, 구체적으로는, 염색체 W의 적어도 하나의 비-코딩 영역에 통합될 수 있다. 이러한 경우, 본 발명의 키트의 제 1 핵산 서열은 본 명세서에서 각각 gRNA1 및 gRNA2라고도 하는, 서열번호 1 및 2 중 어느 하나로 표시되는 핵산 서열을 포함하는 적어도 하나의 gRNA를 인코딩할 수 있다.
일 특정 실시예에서, 본 발명의 키트의 제 1 핵산 서열은 gRNA1인, gRNA를 포함할 수 있다. 일 실시예에서, 이러한 gRNA1은 서열번호 1로 표시되는 핵산 서열을 포함할 수 있다. 이러한 경우, 본 발명의 키트의 상기 제 2 핵산 서열 내에 포함된 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 대안적인 실시예에서, 본 발명의 키트는 gRNA2를 인코딩하는 서열인, 이의 제 1 핵산 서열을 포함할 수 있다. 일 특정 실시예에서, 이러한 서열은 서열번호 2로 표시되는 핵산 서열을 인코딩한다. 또 다른 일 실시예에서, 본 발명의 키트의 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는, 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다.
또 다른 대안적인 실시예에서, 적어도 하나의 리포터 유전자는 성 Z 염색체의 적어도 하나의 부위에 통합될 수 있다. 보다 구체적인 실시예에서, Z 염색체 내의 특정 유전자좌는 암탉의 염색체 Z의 서열번호 15로 표시되는 9156874-9161874, 서열번호 16으로 표시되는 27764943-27769943, 서열번호 17로 표시되는 42172748-42177748, 서열번호 18로 표시되는 63363656-63368656, 및 서열번호 19로 표시되는 78777477-78782477 영역들 중 어느 하나일 수 있다.
따라서, 보다 구체적인 실시예에서, 본 발명의 키트의 제 1 핵산 서열은 서열번호 11로 표시되는 gRNA3: ACAGACCTATGATATGT; 서열번호 12로 표시되는 gRNA4: CGATTATCACTCACAAG; 서열번호 13으로 표시되는 gRNA5: CTGGTTAGCATGGGGAC; 서열번호 14로 표시되는 gRNA6: GTAAAGAGTCAGATACA 인, gRNA를 포함할 수 있다.
다른 실시예에서, 본 발명의 키트의 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는, 서열번호 41-48 중 어느 하나로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다. 보다 구체적으로는, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 41로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 42로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 11의 gRNA3에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 43으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 44로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 12의 gRNA4에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 45로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 46으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 13의 gRNA5에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 47로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 48로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 14의 gRNA6에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
본 발명의 키트의 제 1 핵산 서열의 추가의 비-제한적인 예는, 서열번호 26으로도 표시되는 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7, 서열번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11 인, gRNA를 포함할 수 있다.
다른 실시예에서, 본 발명의 키트의 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는, 서열번호 31 내지 40 중 어느 하나로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치할 수 있다. 보다 구체적으로는, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 31로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 32로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 26의 gRNA7에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 33으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 34로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 27의 gRNA8에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 35로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 36으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 28의 gRNA9에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 37로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 38로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 29의 gRNA10에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 39로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 40으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 30의 gRNA11에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
일 실시예에서, 본 발명의 키트의 제 2 핵산 서열 내에 포함된 리포터 유전자는, 적어도 하나의 생체발광 리포터 유전자일 수 있다.
또 다른 일 실시예에서, 본 발명의 키트는 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 형질전환 조류 동물의 제조에 사용하기에 적합할 수 있다.
일 실시예에서, 본 발명의 방법은 본 명세서에 기재된 바와 같이 본 발명의 키트 중 임의의 것을 사용할 수 있다.
또한, 본 발명의 키트는 본 발명의 형질전환 조류 동물의 제조에 필요한 임의의 시약, 완충액, 배지 또는 물질을 더 포함할 수 있음을 이해하여야 한다. 본 발명의 키트는 이의 상이한 성분에 대한 설명서 및 용기를 더 포함할 수 있다.
특정 실시예에서, 본 발명의 키트(들) 및 방법(들)에 의해 사용된 올리고뉴클레오티드(들) 또는 폴리뉴클레오티드(들)은 분리된 및/또는 정제된 분자임을 이해하여야 한다. 본 명세서에서 사용된 바와 같이, 핵산과 관련하여 사용되는 경우 "분리된" 또는 "정제된"은 자연적으로 발생하는 서열이 이의 정상 세포 (예를 들어, 염색체) 환경으로부터 제거되거나 또는 비-자연 환경에서 합성됨 (예를 들어, 인공적으로 합성됨)을 의미한다. 따라서, "분리된" 또는 "정제된" 서열은 무 세포 (cell-free) 용액에 있거나 또는 상이한 세포 환경에 놓일 수 있다. 용어 "정제된"은 서열이 존재하는 유일한 뉴클레오티드임을 의미하지는 않으나, 그것과 관련된 비-뉴클레오티드 물질을 자연히 본질적으로 함유하지 않으므로 (약 90-95% 순수), 분리된 염색체와 구별된다.
본 명세서에서 사용된 모든 과학 기술 용어는, 달리 명시되지 않는 한 당해 기술분야에서 상용되는 의미를 가진다. 본 명세서에서 제공된 정의는 본 명세서에서 자주 사용되는 특정 용어의 이해를 용이하게 하기 위한 것이고, 본 발명의 범위를 제한하는 것을 의미하지 않는다.
본 발명의 구체적인 측면 및 실시예를 상세하게 기재하기 전에, 기재된 특정 방법 및 실험 조건이 다양할 수 있기 때문에, 본 발명은 기재된 특정 방법 및 실험 조건에 제한되지 않음을 이해하여야 한다. 또한, 본 명세서에서 사용된 용어는 특정 실시예만을 기재하기 위한 것이며, 본 발명의 범위는 첨부된 청구범위에 의해서만 제한되므로, 제한하려는 의도가 아니라는 것을 이해하여야 한다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 명확하게 달리 지시하지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, "방법"에 대한 언급은 하나 이상의 방법, 및/또는 본 명세서에서 기재된 및/또는 본 발명 등을 읽을 때 당업자에게 명백해질 유형의 단계를 포함한다.
달리 정의되지 않는 한, 본 명세서에서 사용된 모든 과학 기술 용어는 본 발명이 속하는 기술분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에서 기재된 것과 유사한 또는 동등한 임의의 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있을지라도, 바람직한 방법 및 물질은 이제 기재된다.
본 명세서 및 이하의 청구범위 전반에 걸쳐, 문맥상 달리 요구하지 않는 한, 단어 "포함하다(comprise)" 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변형은, 명시된 정수 또는 단계 또는 정수들 또는 단계들의 군을 포함하나, 다른 정수 또는 단계 또는 정수들 또는 단계들의 군을 제외하지 않는 것을 함축하는 것으로 이해될 것이다. 보다 구체적으로는, 용어 "포함하다(comprises)", "포함하는(comprising)", "포함하다(includes)", "포함하는(including)", "갖는 (having)" 및 이들의 결합은 "포함하나 이에 한정되지 않는다"를 의미한다. 이 용어는 용어 "이루어진(consisting of)" 및 "본질적으로 이루어진(consisting essentially of)"을 포함한다. 문구 "본질적으로 이루어진"은 조성물 또는 방법이 추가 성분 및/또는 단계를 포함할 수 있으나, 추가 성분 및/또는 단계가 청구된 조성물 또는 방법의 기본적이고 신규한 특성을 실질적으로 변경시키지 않는 경우에만 포함할 수 있음을 의미한다.
본 명세서에서 사용된 용어 "약"은 나타낸 값보다 최대 1%, 보다 구체적으로는 5%, 보다 구체적으로는 10%, 보다 구체적으로는 15%, 및 경우에 따라 최대 20% 높거나 낮게 벗어날 수 있는 값을 나타내며, 편차 범위는 정수 값을 포함하고, 적용 가능한 경우, 비-정수 값도 포함하여, 연속 범위를 구성한다. 본 명세서에서 사용된 용어 "약"은 ± 10%를 나타낸다.
본 발명의 다양한 실시예는 범위 형식으로 제시될 수 있음을 유의해야 한다. 범위 형식의 기재는 편의 및 간결성을 위한 것이며, 본 발명의 범위에 대한 융통성없는 제한으로 해석되어서는 안됨을 이해하여야 한다. 따라서, 범위의 기재는 가능한 모든 하위 범위와 그 범위 내의 개별 수치를 구체적으로 개시한 것으로 간주되어야 한다. 예를 들어, 1 내지 6과 같은 범위의 기재는 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 하위 범위, 및 해당 범위 내의 개별 숫자, 예를 들어, 1, 2, 3, 4, 5 및 6을 구체적으로 개시한 것으로 간주되어야 한다. 이는 범위의 폭에 관계없이 적용된다. 본 명세서에서 수치 범위가 표시될 때마다, 표시된 범위 내에서 임의의 인용된 숫자 (소수 또는 정수)를 포함하는 것을 의미한다. 제 1 표시 숫자와 제 2 표시 숫자 "에 이르는/사이에(ranging/ranges between)" 및 제 1 표시 숫자 "에서" 제 2 표시 숫자 "까지"는 본 명세서에서 혼용되며, 제 1 및 제 2 표시 숫자 및 그 사이의 모든 소수 및 정수 숫자를 포함하는 것을 의미한다.
하기 실시예는 본 발명의 방법 및 조성물을 제조하고 사용하는 방법에 대한 완전한 개시 및 설명을 당업자에게 제공하기 위해 제시된 것이며, 발명자가 그들의 발명으로 간주하는 것의 범위를 제한하려는 것은 아니다. 사용된 숫자 (예를 들어, 양, 온도 등)에 대한 정확성을 확보하기 위한 노력이 이루어졌으나, 몇 가지 실험 오류 및 편차가 설명되어야 한다. 달리 표시되지 않는 한, 부는 중량부이고, 분자량은 평균 분자량이며, 온도는 섭씨 온도이고, 압력은 대기압 또는 그 부근이다.
실시예는 본 발명의 측면을 수행할 때 발명자에 의해 사용된 기술을 대표한다. 이들 기술은 본 발명의 실시를 위한 바람직한 실시예의 예시이지만, 본 발명의 관점에서, 당업자는 본 발명의 정신 및 의도된 범위를 벗어나지 않으면서 많은 변형이 이루어질 수 있다는 것을 인식할 것임을 이해하여야 한다.
명확성을 위해, 별도의 실시예와 관련하여 기재된 본 발명의 특정 특징들은, 단일 실시예와 조합하여 제공될 수도 있음을 이해하여야 한다. 반대로, 간결성을 위해, 단일 실시예와 관련하여 기재된 본 발명의 다양한 특징은, 개별적으로 또는 임의의 적당한 하위 조합으로 또는 본 발명의 임의의 다른 기재된 실시예에 적합하게 제공될 수도 있다. 다양한 실시예와 관련하여 기재된 특정 특징들은, 실시예가 이들 요소 없이는 작동하지 않는 한, 이들 실시예의 본질적인 특징으로 간주되어서는 안된다.
상기 기재된 바와 같이 그리고 하기의 청구범위 부문에서 청구된 바와 같이, 본 발명의 다양한 실시예 및 측면은 하기 실시예에서 실험적 지지를 얻는다.
본 명세서에 개시되고 기재된 바와 같이, 본 발명은 본 명세서에 개시된 특정 실시예, 방법 단계 및 조성물에 한정되지 않으며, 이러한 방법 단계 및 조성물이 다소 변경될 수 있음을 이해하여야 한다. 또한, 본 명세서에서 사용된 용어는 특정 실시예를 기재하기 위한 목적으로만 사용되며, 본 발명의 범위가 첨부된 청구범위 및 그 균등물에 의해서만 한정될 것이기 때문에 제한하려는 것이 아님을 이해하여야 한다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 내용이 명확하게 달리 지시되지 않는 한 복수의 지시 대상을 포함한다는 것을 알아야 한다.
본 명세서에 개시된 주제를 더 잘 이해하고 그것이 실제로 수행될 수 있는 방법을 예시하기 위하여, 이제 첨부된 도면을 참조하여 비-제한적인 예로서만 실시예를 설명할 것이다.
도 1A-1B. 루시퍼라제 리포터 유전자 신호는 난각(egg shell)을 관통한다.
루시퍼라제 발현 형질전환 마우스에게 루시페린을 피하 주사하였다. 10분 후에 귀 (도. 1A) 및 꼬리 (도. 1B)를 절개하고 무정란에 포함시켰다. bio-space photon Imager (Bio space lab, USA)를 이용하여 알을 영상화하였다.
도 2A-2B. 루시퍼라제 리포터 유전자 신호는 수정란에서 형성되고 난각을 관통한다.
루시퍼라제 발현 형질전환 마우스로부터 절개한 귀 (도. 2A) 및 꼬리 (도. 2B)를 10일령 닭 배아를 가지고 있는 수정란에 포함시켰다. 이어서 루시페린을 주사하여 생체발광을 유도하였다. 10분 후에 bio-space photon Imager (Bio space lab, USA)를 이용하여 영상을 찍었다.
도 3A-3B. GFP 리포터 유전자 신호는 난각을 통해 검출할 수 없다.
GFP-발현 형질전환 마우스의 꼬리를 닭 배아 (10일)에 포함시키거나 또는 껍질의 외부에 놓았다. 난각의 외부 (도. 3A)에 놓인 꼬리만이 GFP 형광으로 관찰될 수 있는 반면, 알의 내부 (도. 3B)에 놓였을 때는 신호가 검출되지 않았다. 5분 후에 Maestro 2.2 Imager (Cambridge Research & Instrumentation, Inc. USA)를 이용하여 영상을 찍었다.
도 4. 암컷 조류 배아의 검출
루시퍼라제 리포터 유전자 (star)를 암컷 형질전환 닭 (암탉)의 W 염색체에 포함시켰다. W 및 Z 염색체를 가지고 있는 암컷 알만이 리포터 유전자, 특히, 루시퍼라제 신호를 제공한다.
도 5. 수컷 조류 배아의 검출
루시퍼라제 리포터 유전자 (star)를 암컷 형질전환 닭 (암탉)의 Z 염색체에 포함시켰다. 수컷 배아는 루시퍼라제 신호를 통해 검출되고, 암컷은 외래 DNA가 없다.
실시예
추가의 상세한 설명없이, 당업자는 전술한 설명을 이용하여 본 발명을 최대한 활용할 수 있다고 믿는다. 따라서, 하기의 바람직한 특정 실시예는 단지 예시적인 것으로 해석되어야 하며, 청구된 발명을 어떤 식으로든 제한하는 것으로 해석되어서는 안된다.
본 명세서에서 구체적으로 기재되지 않은 당해 기술분야에서 알려진 표준 분자생물학 프로토콜은 일반적으로 Sambrook et al. Molecular cloning: A laboratory manual, Cold Springs Harbor Laboratory, New-York (1989,1992), 및 in Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Maryland (1988)에 본질적으로 따른다.
시약
동물:
상업용 화이트 레그혼 닭(White Leghorn chickens)은 Hendrix ISA, 및 Minnesota에서 구입하였다.
마커 라인 닭(Marker Line chickens)은 Pacific Agri-Food Research Centre, Agassiz, British Columbia, Canada에서 구입하였다.
형질전환 마우스 CAG-luc-eGFP는 The Jackson Laboratory (카탈로그 번호 L2G85)에서 구입하였다.
형질전환 마우스 C57BL/6-Tg(CAG-EGFP)1Osb/J는 The Jackson Laboratory (카탈로그 번호 00329)에서 구입하였다.
동물 실험은 IACUC 승인된 프로토콜에 따라 엄격히 수행되었으며, Crystal Bioscience IACUC 위원회의 감독 하에 실험을 진행하는 동안 동물이 질병을 앓거나 사망하지 않도록 해야 한다.
벡터:
Cas9 SmartNucleaseTM 일체형(All-in-one) 태그 벡터는 System Bioscience Inc. (카달로그 번호 CAS8/9xx 시리즈)에서 주문한다.
pCMV-Gluc 2 벡터는 New England Biolabs Inc. (카달로그 번호 N8081S)에서 주문한다.
세포주:
암컷 세포는 갈루스 갈루스(Gallus gallus), 닭 T 림프구 세포이다.
수컷 세포는 ATCC® Number: CRL-2118™에서 주문한 갈루스 갈루스, 닭 간이다.
원시 생식 세포주 (PGC).
실험 과정
난각을 통한 리포터 유전자 생체발광 검출
D-루시페린 (Sigma-Aldrich Co. LLC, Israel, 카탈로그 번호 2591-17-5)을 DPBS에서 실온에서 15 mg/mL의 최종 농도로 용해시킨다.
형질전환 루시퍼라제-발현 마우스의 목과 어깨 주위의 느슨한 피부에 루시페린 또는 식염수 (음성 대조군) 0.1 ml를 피하 주사한다. 귀와 꼬리를 10분 후에 절개하고, 닭 배아 (10일)에 주입한다.
대안적으로, 형질전환 루시퍼라제-발현 형질전환 마우스의 절개한 귀와 꼬리를 닭 배아에 포함시킨 후, 0.1 ml의 루시페린 또는 식염수를 알에 직접 주입한다.
Bio-space photon Imager (Bio space lab, USA)를 이용하여 생체발광을 관찰한다.
RF 클로닝 (Restriction-free cloning)
Cas9-SmartNucleaseTM 벡터에 gRNAs의 삽입은 Restriction Free 방법을 적용하여 수행된다 (Peleg Y et al., 2010). 프라이머는 Sigma-Genosys (Rehovot, Israel)에서 주문하고, 이어서 푸션 폴리머라제(Phusion polymerase) (Thermo Scientific, Hudson, NH, USA)를 이용하여 RF 반응을 수행하였다. 플라스미드 정제는 각각 MEGAspin 키트 및 DNA-스핀 플라스미드 DNA 정제 키트를 이용하여 수행한다 (Intron Biotechnology Biotechnology, Daejoen, South Korea).
세포 배양
PGCs는 KO-DMEM (Life Technologies)에서 성장시키며, 그 중 40%는 버팔로 랫트 간세포 (BRL, ATCC)에서 전처리되고, 7.5% 소태아 혈청 (Hyclone), 2.5% 조사된 닭 혈청, 1X 비-필수 아미노산, 2mM 글루타민, 1mM 나트륨 피루브산염(sodium pyruvate), 0.1mM β-머캅토 에탄올 (모두 Life Technologies), 4ng/ml 재조합 인간 섬유아세포 성장 인자, 6ng/ml 재조합 마우스 줄기 세포 인자 (둘다 R&D Systems)로 보충되며, BRL 세포의 조사된 피더층에서 성장한다. 세포를 신선한 피더층 위에서 1주일에 3회 계대배양한다.
형질감염
상기한 염색체 W 또는 Z의 유전자좌의 안정적인 형질감염체(transfectant)의 표적화를 위해, 15 μg의 벡터-함유 gRNA 및 15 μg의 원형 루시퍼라제-함유 벡터를 5x106 세포에 가하고, V- 완충액 (lonza, Walkersville)으로 100μl의 부피에 이르게 하였다. 세포 현탁액을 2 mm 큐벳으로 옮기고 350 volts/100μsec의 8 구형파 펄스(square wave pulses) (BTX 830 전기천공기(electroporator))를 받는다. 그 다음, 세포를 네오마이신-내성 조사된 BRLs로 도금하고, 웰당 105 세포의 밀도로 48-웰 플레이트에 접종한다. 3일 후, 40μg/ml 네오마이신을 가하여 루시퍼라제 리포터 유전자와 안정적으로 통합된 세포를 선별한다.
형질전환 닭의 제조
(약 107 MOI의 역가에서 렌티바이러스이거나 또는 플라스미드 DNA일 수 있는) 농축된 비히클을 새로 낳은 알의 25개의 배아에 주사한다. 주사는 매주 3회 주사한다. 주사된 배아는 주사 후 3주에 부화한다. 이들은 G0 새이다. 부화 직후, 부화된 병아리의 CAM 시료로부터 DNA를 추출하고, 반-정량적 PCR에 의해 벡터 DNA의 존재/부재의 검출을 수행한다. 2-3 주령의 G0 병아리 혈액 시료 및 PCR 스크리닝 반복. G0 새는 성숙한 상태 (수컷의 경우 16-20주, 암컷의 경우 20-24주)로 성장한다. 어린 수탁(Cockerels)은 약 16주에 정액 생산을 위해 검사를 받는다.
암탉을 수정시키고, 수정란을 매일 모았다. G1 병아리는 3주 후에 부화하고, 각각의 병아리 날개는 줄무늬가 있고, 병아리 CAM(chorioallantoic membrane) 시료는 껍질에서 채취하였다. CAM 시료에서 DNA를 추출하고, 단일 사본 수준으로 예측되는 트랜스유전자의 존재에 대해 PCR 스크리닝을 수행한다. 2-3주 후에 혈액 시료에서 DNA를 확인하고 병아리의 암수를 감별하기 위해 스크리닝을 반복한다.
몇 주령의 G1 새로부터 혈액 시료를 채취하여 PCR 분석용 게놈 DNA를 제조한다. G2의 번식을 위해 G1 새를 사용한다.
실시예 1
가금류의 육안 성 감별을 위한 리포터 유전자의 선별
난자 내 가금류의 성별을 육안으로 감별할 수 있는 가능성을 입증하기 위하여, 형광 리포터 유전자와 비교하여 생체발광 리포터 유전자의 사용을 평가하였다. 따라서, 먼저 (서열번호 21로 표시되는 아미노산 서열을 인코딩하는 서열번호 20으로 표시되는 핵산 서열을 갖는) 반딧불이 루시퍼라제 및 녹색 형광 단백질(green fluorescent protein, eGFP)과 같은 형질전환 발현 리포터 유전자를 사용하였다.
루시퍼라제 활성의 관찰을 위해, 도 1에서 루시퍼라제-발현 형질전환 마우스에게 루시페린을 피하 주사하고, 꼬리 및 귀를 절개한 다음, 무정란의 난각에서 5mm 구멍을 통해 주입시켰다. 도면에 나타난 바와 같이, 루시퍼라제 검출 신호는 난각을 통해 꼬리 및 귀 시료 (도 1A, 1B)에서 명확하게 관찰된다. 따라서, 본 발명자들은 다음에 난자 내 루시퍼라제 반응의 유도 가능성을 조사하였다. 따라서, 루시퍼라제-발현 형질전환 마우스의 귀 및 꼬리를 절개하고, 구멍을 통해 10일령 닭 배아를 가지고 있는 수정란에 주입한 다음, 루시페린을 주사하였다. 도 2A 및 2B에서 명확히 나타난 바와 같이, 난자 내 루시퍼라제 반응은 난각을 관통할 수 있는 검출 가능한 신호를 성공적으로 야기하였다.
반면에, 리포터 유전자로 GFP를 사용하여 수행한 유사한 실험은, 도 3에 나타난 바와 같이, GFP-발현 형질전환 마우스의 꼬리와 귀를 닭 배아에 포함시킨 후 GFP 신호를 검출할 수 없음을 분명히 나타내었다.
따라서, 성 염색체 W 및 Z로의 통합을 위해, 루시퍼라제 리포터 유전자, 구체적으로는, (서열번호 20으로 표시되는 핵산 서열에 의해 인코딩되는 서열번호 21로 표시되는 아미노산 서열을 포함하는) 반딧불이 루시퍼라제를 더 선별하였다.
도 4는 난자 내 배아의 성별 감별을 위한 본 발명의 방법의 개략도를 나타낸다. 보다 구체적으로는, 루시퍼라제 리포터 유전자가 통합된 성 특이적 염색체 (W)를 함유하는 형질전환 조류 암탉이 제공된다. 상기 암탉이 낳은 알에서, 검출 가능한 신호에 의해 관찰된 리포터 유전자의 발현은 배아가 W 성 염색체를 가지므로 암컷임을 나타낸다. 이것은 리포터 유전자를 가지고 있는 암컷이 폐기되는 동안 수컷의 지속적인 배양을 위한 선별을 가능하게 한다. 이러한 선별은 아마도 가금류와 더 관련이 있다.
도 5는 난자 내 수컷 배아의 결정을 용이하게 하는 또 다른 대안을 개략적으로 나타낸다. 보다 구체적으로는, 리포터 유전자가 통합된 성 특이적 Z 염색체를 가지고 있는 형질전환 암탉의 제공은, 리포터 유전자 없이 (모계 야생형 W 염색체를 받은) 암컷 배아 또는 형질전환 루시퍼라제 유전자를 발현하는 (모계 표지된 Z 염색체를 받은) 수컷 배아를 야기한다.
실시예 2
가이드 RNAs 벡터의 설계
루시퍼라제 리포터 유전자를 성 염색체 W 또는 Z에 포함시키기 위해, CRISPR/Cas9 매개 HDR 방법을 선택한다. 그 다음, 양쪽 성 염색체에서 관련 gRNA 부위를 찾는다.
가이드 RNA 설계를 위해, 서열번호 3으로 표시되는 핵산 서열을 포함하는 암탉의 염색체 W의 영역 1022859-1024215를 분석한다. 2개의 가이드 RNAs를 선별하고 합성한 다음, RF(Restriction free) 클로닝 프로토콜에 의해 야생형 Cas9 뉴클레아제 (Horizon)를 함유하는 Cas9 SmartNuclease 벡터에 별도로 클로닝한다: 서열번호 1로 표시되는 gRNA1: GCACTAGGAACCAGCAGCAG 및 서열번호 2로 표시되는 gRNA2: GTAGCCCCAAGAGGGCTAGG.
이들 2개의 gRNAs의 예측된 매개변수는 표 1에 나타낸다:
gRNA 매개변수 gRNA1 gRNA2
sgRNA 설계자 0.506 0.63
sscore 0.8677 0.5323
sgRNA 득점자(scorer) 94.8 99.9
가이드 RNA 설계를 위해, 암탉의 염색체 Z의 서열번호 15로 표시되는 9156874-9161874, 서열번호 16으로 표시되는 27764943-27769943, 서열번호 17로 표시되는 42172748-42177748, 서열번호 18로 표시되는 63363656-63368656, 및 서열번호 19로 표시되는 78777477-78782477 영역들을 분석한다. 4개의 가이드 RNAs를 선별하고 합성한 다음, RF(Restriction free) 클로닝 프로토콜에 의해 야생형 Cas9 뉴클레아제 (Horizon)를 함유하는 Cas9 SmartNuclease 벡터에 별도로 클로닝한다: 서열번호 11로 표시되는 gRNA3: ACAGACCTATGATATGT; 서열번호 12로 표시되는 gRNA4: CGATTATCACTCACAAG; 서열번호 13으로 표시되는 gRNA5: CTGGTTAGCATGGGGAC; 서열번호 14로 표시되는 gRNA6: GTAAAGAGTCAGATACA.
Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비-제한적인 예는, 서열번호 26으로도 표시되는 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7, 서열번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있으나, 이에 한정되지 않는다.
이들 gRNAs는 예측된 오프-표적 부위(off-target sites)가 거의 없으며, 그 중 어느 것도 알려진 코딩 서열에 존재하지 않았다.
실시예 3
루시퍼라제 표적화 벡터의 설계
암컷 W 염색체 또는 암컷 Z 염색체 유전자좌의 상기 표시된 적당한 측면 서열(flanking sequences)의 상동성이 있는 측면 서열은, CMV-프로모터의 상류 및 네오마이신-내성의 하류 또는 대안적으로 폴리A 부위 (주문한 합성 DNA, Integrated DNA Technologies, Inc., USA)의 하류의 루시퍼라제-발현 벡터에 도입된다.
암컷 W 염색체의 경우, 리포터 유전자, 구체적으로 루시퍼라제는 서열번호 1로 표시되는 가이드 1 (gRNA1) 또는 서열번호 2로 표시되는 가이드 2 (gRNA2) 중 어느 하나를 이용하여 클로닝될 수 있다. gRNA1을 이용한 클로닝의 경우, 서열번호 4로 표시되는 핵산 서열을 포함하는 "좌암" 및 서열번호 5로 표시되는 핵산 서열을 포함하는 "우암"이 제공된다. gRNA2을 이용한 클로닝의 경우, 서열번호 6으로 표시되는 핵산 서열을 포함하는 "좌암" 및 서열번호 7로 표시되는 핵산 서열을 포함하는 "우암"이 제공된다.
또한, CMV-프로모터의 상류 영역에 대한 "좌암"은 서열번호 8로 표시되는 핵산 서열을 포함하고, 네오마이신-내성의 하류 영역에 대한 "우암"은 서열번호 9로 표시되는 핵산 서열을 포함하며, 또는 폴리A 부위의 하류 영역에 대해서는 서열번호 10으로 표시되는 핵산 서열을 포함할 수 있다.
암컷 Z 염색체의 경우, 루시퍼라제 리포터 유전자는 서열번호 11로 표시되는 gRNA3, 서열번호 12로 표시되는 gRNA4, 서열번호 13으로 표시되는 gRNA5, 서열번호 14로 표시되는 gRNA6 중 어느 하나를 이용하여 클로닝될 수 있다.
gRNA3을 이용한 클로닝의 경우, 서열번호 41로 표시되는 핵산 서열을 포함하는 "좌암" 및 서열번호 42로 표시되는 핵산 서열을 포함하는 "우암"이 제공된다. gRNA4를 이용한 클로닝의 경우, 서열번호 43으로 표시되는 핵산 서열을 포함하는 "좌암" 및 서열번호 44로 표시되는 핵산 서열을 포함하는 "우암"이 제공된다. gRNA5를 이용한 클로닝의 경우, 서열번호 45로 표시되는 핵산 서열을 포함하는 "좌암" 및 서열번호 46으로 표시되는 핵산 서열을 포함하는 "우암"이 제공된다. gRNA6을 이용한 클로닝의 경우, 서열번호 47로 표시되는 핵산 서열을 포함하는 "좌암" 및 서열번호 48로 표시되는 핵산 서열을 포함하는 "우암"이 제공된다.
또 다른 일 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 31로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 32로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 26의 gRNA7에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 33으로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 34로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 27의 gRNA8에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 35로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 36으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 28의 gRNA9에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 37로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 38로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 29의 gRNA10에 의해 유도된 특정 유전자좌에 통합시킬 수 있다. 또 다른 실시예에서, Z 염색체 내의 특정 유전자좌에 본 발명의 리포터 유전자를 통합시키기 위해서는, 서열번호 39로 표시되는 핵산 서열을 포함하는 좌암 및 서열번호 40으로 표시되는 핵산 서열을 포함하는 우암을 사용하여 본 발명의 리포터 유전자를 서열번호 30의 gRNA11에 의해 유도된 특정 유전자좌에 통합시킬 수 있다.
실시예 4
CRISPR-처리된 세포의 생식 계열 전이
2개의 상기 기재된 벡터, 구체적으로는, gRNA/Cas9 및 리포터-유전자 벡터를 실험 과정에서 상세히 설명된 바와 같이 PGCs에 공-형질감염시켰다. 안정한 클론을 동정한 후, 세포를 확장시키고 PCR에 의한 루시퍼라제 통합에 대해 확인한다. 확인된 클론을 단계 14-16 (H&H)에서 수여자 닭 배아에 주입한다. 주입한 배아를 대리 껍질(surrogate shells)로 옮기고 부화할 때까지 37℃에서 배양한다. 병아리의 성은 부화한 후에 W-염색체에 대해 PCR로 결정된다.
암컷 및 수컷 키메라는 성숙한 상태로 성장하고 야생형 수컷 및 암컷 닭으로 사육된다. 부화된 병아리는 루시퍼라제의 발현을 평가하고, 생식 계열 자손은 PCR에 의해 표적화된 루시퍼라제를 가지는 것으로 확인된다.
<110> EGGXYT LTD <120> METHODS FOR GENDER DETERMINATION OF AVIAN EMBRYOS IN UNHATCHED EGGS AND MEANS THEREOF <130> 2455179 <150> US 62/262,409 <151> 2015-12-03 <160> 48 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide 1 for W chromosome <400> 1 gcactaggaa ccagcagcag 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide 2 for W chromosome <400> 2 gtagccccaa gagggctagg 20 <210> 3 <211> 1460 <212> DNA <213> Artificial Sequence <220> <223> galGal5_dna range=chrW:1022859-1024215 5'pad=0 3'pad=0 strand=+ repeat Masking=none <400> 3 tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60 gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120 ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180 gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240 gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300 ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360 cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420 tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480 ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540 ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600 aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660 ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720 aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780 cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840 aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900 gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960 tagtagcccc aagagggcta gggggcctca aaatcatgga acccaactcc ctggagtaga 1020 agggtcaggt aatgagtcca aaagagggac tataggaacc atgccagtaa cagagaggac 1080 tcacagccag catagggtcg tgctgtaagc cctgttgagg cagttggaaa tgacagttcg 1140 gtagtagtta aggtaccctt ttaaattaca gatttaaaca tttggaaagc agctgctggc 1200 agctaccgtg atgatcctaa acgggtagct aatgcttttg aaatgatgat taaaactcag 1260 gaactggata ggaaagatat ggaatttatt atgcacatgt tgtttgatag tacagaaaaa 1320 taaatgattc actagaccac acggacccaa gtggaggatc aggtaatggc aggggttttg 1380 cttggatgta atgctggaaa ggacaagagt cctttcctgt cctggggagg atttagaggt 1440 ggttagacct tggggaggag 1460 <210> 4 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA1, W chromosome, "Left arm" <400> 4 tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60 gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120 ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180 gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240 gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300 ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360 cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420 tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480 ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540 ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc ag 592 <210> 5 <211> 848 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA1, W chromosome, "Right arm" <400> 5 tggcagattt gtgatcatgg aaagaattgg tgggagcata cggcaccagg actcagataa 60 gatagctagc taaggtgatg aattgtagat ggtgtcagat aacgaaagaa gaaaaacaaa 120 tgtaataaag tgttaaatgc caatatgttt tttataatga ggcaatatcc tgaatggcat 180 tagtgtggga tcaatttggc ccagatgacc ctctgatttt aatggtagaa aatgataaga 240 gagagaggga gaaaggaaga gagtgtaaaa cgtgttgttc agcatgtagt attggactga 300 gatgcttcaa gcgaaacaag aatgagcagg aggaggattt agagatgcta gtagccccaa 360 gagggctagg gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa 420 tgagtccaaa agagggacta taggaaccat gccagtaaca gagaggactc acagccagca 480 tagggtcgtg ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag 540 gtaccctttt aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat 600 gatcctaaac gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg 660 aaagatatgg aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac 720 tagaccacac ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat 780 gctggaaagg acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg 840 gggaggag 848 <210> 6 <211> 962 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA2, W chromosome, "Left arm" <400> 6 tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60 gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120 ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180 gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240 gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300 ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360 cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420 tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480 ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540 ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600 aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660 ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720 aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780 cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840 aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900 gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960 ta 962 <210> 7 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA2, W chromosome, "Right arm" <400> 7 gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa tgagtccaaa 60 agagggacta taggaaccat gccagtaaca gagaggactc acagccagca tagggtcgtg 120 ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag gtaccctttt 180 aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat gatcctaaac 240 gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg aaagatatgg 300 aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac tagaccacac 360 ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat gctggaaagg 420 acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg gggaggag 478 <210> 8 <211> 669 <212> DNA <213> Artificial Sequence <220> <223> A "left arm" for the region upstream to the CMV-promoter <400> 8 aggcaaggct tgaccgacaa ttgcatgaag tcgggctaac attagacccg ttgtgtctta 60 atcctgccgt cgggtataca tatactaaaa gaacctcctt tccctcctat aaatcggagc 120 gagacaaggc attctttttt tattattatt ttggttgcct gcccatcaga tgtaatgaaa 180 gttgcacagg gtagggctaa gaaggtaaag gagttaaatt cccccgggag gttagagatt 240 ccctgtattg tggttgcctg cccattagac gtaacaaaag ttgtgaaggg taggactaag 300 gatccaggta aagaggttag tcccccaggg ttagagtccc tcctcagaag taaatgtaaa 360 acataaccac ggtaattgtc gttgagtgcg cttgtttgat tgttaattgt ttgtgctgtt 420 attgtatgct gattgtttgt gttgttatta tacaaagagc tcacatgcat cgttaaaatg 480 ggcattggat cacctagggg tgagggaatt ttgaaaaagt cacttttggg ctgtgtttta 540 agtcattgga aagaaatagc tggatcccct ggtggggttg cacagaagga tgatttaagt 600 acgatggatg cctttgaggc aggcactagg aaccagcagc gatgtacggg ccagatatac 660 gcgttgaca 669 <210> 9 <211> 911 <212> DNA <213> Artificial Sequence <220> <223> A "right arm" for the region downstream the Neomycin-resistance <400> 9 ttctatcgcc ttcttgacga gttcttctga cagtggcaga tttgtgatca tggaaagaat 60 tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120 gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180 ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240 accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300 aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360 aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420 aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480 catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540 gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600 atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660 gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720 ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780 caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840 tcctggggag gatttagagg tggttagacc ttggggagga gggttcgaaa tgaccgacca 900 agcgacgccc a 911 <210> 10 <211> 911 <212> DNA <213> Artificial Sequence <220> <223> A "right arm" for the region downstream the polyA site <400> 10 atctgtgtgt tggttttttg tgtgtctaga cagtggcaga tttgtgatca tggaaagaat 60 tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120 gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180 ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240 accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300 aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360 aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420 aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480 catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540 gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600 atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660 gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720 ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780 caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840 tcctggggag gatttagagg tggttagacc ttggggagga gcaagtaaga tgcttttctg 900 tgctgcaata g 911 <210> 11 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 3 for Z chromosome <400> 11 acagacctat gatatgt 17 <210> 12 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 4 for Z chromosome <400> 12 cgattatcac tcacaag 17 <210> 13 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 5 for Z chromosome <400> 13 ctggttagca tggggac 17 <210> 14 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 6 for Z chromosome <400> 14 gtaaagagtc agataca 17 <210> 15 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> ENSGALG00000025945_ENSGALG00000023622|chrZ:9156874-9161874 <400> 15 cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60 gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120 ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180 caatgtgggc attgccgacc acagacctat gatatgtgag tggtgagtgg ggccaggaga 240 gcaggacagg agtgtggact cggaggcgcg ggcagaggag gtagctcaga gcatgagata 300 tattcgccag gtgtcagtgg acttctggca gtgcatactg cagagagctt tggttgctgg 360 ccatctggat gatgacaaaa tctcagccac agaccatgtg ggttggaaga gtcctcagga 420 gatcaccttt ccacctcctg ctaaagcaca ttccctacag tatgtttcac atgacaccgt 480 gctggcagat ttttaatatc atcagagaat gacactccat atcctctctg ggcagccttt 540 ttcagtgctc tgtcacccac aaagtaaagt atttgctcat gttctaatgg aacttcctat 600 gttctagttt gtgaccattg aaccttgttc tgtcactgga cagtgctgaa ggagcctggc 660 cctatccact tgactcccac actttacata tttacaagca tcgataagac ccccctcagt 720 cttctccaga ctagatagcc ccaggtctcc caaccattcc ttttatggga gatgcttcag 780 gcccctcatc acctctgtgg ccctctgctg gactgcctgc agtagttcca ggtttttttt 840 tttgaactgg ggagcccaga acttgacacg gtattccaga tgtggcctca ccagcgcaga 900 ggagagggga aggctcacct ccctcgacct ggtggccatg ttttttttaa cagacctcag 960 gataccactg gccttcttgg cccaagggca cactgctggc tcatggccca tgggttggct 1020 tccaggactc tcaggtcctt ctccgtagag ctcctctcaa gcaggacaac cctcagcctg 1080 tactgatgtg tgcggtgcgg ttattcctcc ccacgtgcaa gactctacat ctgccattgt 1140 taaatctcat aagcttcctc tctgcccaac tctccactgt gtacgggcct tagtgaatgg 1200 cagcacagac ttctggtgtg aggatagcat tcagaacaag ctgctgtacc ttcccagtca 1260 cagaggtgag ggtgactggc ttgtactttc ccagctttgc cttcttgccc ttttggaaga 1320 ctggagcgac attggccttc tggaggaaac ggtcctcagg cacccctcct gttctccatg 1380 acctttgaaa gatgatcgag agcaccttgg cagtcacttc tgccagctcc ttcagcacgc 1440 atgagtgcat cccgccagtg cccatggatt tgtgttcatt gaattagcct aggtgacctc 1500 tgatcagatc cttcttgacc aaggggaaga cttcctttcc ccaggttctt atctccaggg 1560 cctgggattc ccaaggggca atcttagcag gaaaggatga agtaaaggag gtgtgcagtt 1620 acagtgcttt catggtgtcc tccattactc caatgaggtc acccacctca ttcagcagca 1680 gacatacatt ctcccagtct tcctttttct actgccatac taaagtagtc cttcatgttg 1740 tccttgactg aaggtcaccc aacttgattt ccagtgagcc ttagcattcc ttgtagcatt 1800 catgcatgtc ctgacaacat tcctattttc ttcccaagtg gccagagacc ttttccacac 1860 tccagaggct ttgttcttcc attactgcct ttccatgagc ttcttgctca tctctgcagg 1920 tctcatgcca cctttgcccg atttcttagt cttagagatg caccgatctt gaatttggaa 1980 gaagtggtgc ttgaatgaca accagctctc ttggtccccc ttgctttcca aagctctaac 2040 ccatggaatg cctccatgta tgtctgtgaa gaggtcaaag tcagctctcc tgaagtcgtg 2100 gttgcaatcc tacaaactgc ctgatttctc ccatgggaga tcccgaactc cactatctca 2160 cagtcactgc actcaaggct tcccccagcc ttcacatccc cagctacagg aagagaagag 2220 gctcgaggct acttgcagct gtctgcggaa ggcttctcca gcttcctcct cttcatcagg 2280 cggcctgttg taaacaccca caacagcgtc acccatcata gcctgtccct tagtcctcac 2340 ccataaactt tctactcatt catcatgcat cccttggcag agctctgtac attccagctg 2400 ttccctcaca taaagagcaa ctccaccacc tcacaccgac gtctgtctgt cctaaaaagt 2460 acagagccat ccctgagagc attccagtca tgcgagctgc cccaccacgt ccctctgctg 2520 atcgcactga gatcgcggcc ctacgaccat ccatggatct atgactcttc ctgtttactc 2580 cccgcactgt gtgtgatgtt acacaggcac ttcagagaag aaaagagagc acaggatgcc 2640 gatttccctt ggcaggaccc caggggccgc acgcagcccc cacctctatc agcaggtctg 2700 agcaggactg gagctgcagg cagagcacag ctcagccctg agacacctcc atgctgcctc 2760 ctgcacagcc tcggccccac agcccccggg aaggagagca cgggtggggt gccgggagcc 2820 acgctgcgct ctgacacact gcgtgtcccc tgctcccagc gcgagctgca gggcccgtgc 2880 aggaacgagc tgggccccaa cgtgaccctc ggccccggtc actgctgaac gacagcgttc 2940 agctctccag gctgcaaaga gcgagccgtg aaatggagca acacgcggga ttcccgggtg 3000 tgaattccta aacggattcg aaggtgccca acaggcagcc actgcgtccg cagctgtgct 3060 tcggtacctg gagacccgcg agcccgtctg ttcccaccag cctccagcag ccggtgctcg 3120 cggatcaaaa gaccgccgtg aaggccgcag ggccgtccct gggacggagc gccgcccgct 3180 tccgccgcca gccgcggctc cgccctcccc gccgagctga cgctggcagc gcgcagagcg 3240 cggagcggag ccgcggcgct ttccggcggc agcgcccgca cggggctcgc cgagggccgc 3300 gcagagcgct gtgcccggcg ggccgcgtcg ccgctccggc ggcaccgcga ttccggcacg 3360 gagcgcaacg agcgcccgct gcccggctgc aggacgcggt cggggccaca ccgcggcggg 3420 gccgcagcct gccttccgcg ggaccgcacg tccggcctcc ccgaatttgg ccccgcagcc 3480 cccgggctgt caccgtgctg tcaccgtgcc gttcacggtt tacgggctgg ttcggcccgg 3540 ttcggcccgg ttccgtgact ggcgggacag agggattcgt ggatccgcgc ctccgggaag 3600 ggaaacggga ccccgaataa ttaaaaacag cggccacgat ctgaggggtt acaaatgtac 3660 taaaacgtac taaaaacaaa cagctgctta acacctccta ttccaaaggc ccatcgacac 3720 cccttggcac cctcaaagta tccccttctg aggtaatggg taccaagaat gcacggagcc 3780 cctgggccag tcacagcagg gtgcttttgc cagtctgtac cggtgaggcc tatttcggcc 3840 acaaacacag tcaattcttg ggaaccccca ttcaccccat gaatataagt tgattctgtc 3900 ccttggtgac tcgagggcgt gacagtgcac tgtgcaccag ggtccaccag ggcctcgtat 3960 tcctgaggtt ctgatgtgcc acaccacgaa cccacacggt tcaatacact ccatcatcct 4020 ttccccccat ggtgggggca gggtccctct atttgttacc tctgtcgttc ttagagcggt 4080 tgccatgtcc tgcagcaatg ggagcgatca cctctttggg gattaatctt ggtggttaat 4140 ctgccttgta attattttac ctgtgcttga aaatgcccct ccaggtgaaa gcaaactgca 4200 gcctgcattc tgtggccaaa ggaatggaaa agaaggcgtt agcaatgcca gtggtggcat 4260 accacttggc ttcttttgac tccagttcat actggagttc taacatgtcc agaacagcag 4320 cgctcagtgg gggtgtgact tcattctggc catggtagtc tactgtcagc ctccattctg 4380 cactggcttt atgcactgga gcacagggct tatggggagc ggcggaggga gctgggatgg 4440 ttcagtctgc agatgaggag gctcagggga gaccttattg ctctctgtaa ctccatgaag 4500 ggaggttgta gtgagctggg ggtcggtctc ttctctcatg tgactagtgg taggactaga 4560 gggaatggcc tccagttgca gcaggggaga ttcaggctgg atgttaggaa atgggctgga 4620 gtgggctgcc cggggaggtg gtggagtcac cgaccctgga ggtgctcaag gaatgtttag 4680 acaccgtgtt tagggacatg gtatagtgag aactgttggt gatgggtgga cagttgggct 4740 ggatgatctt gtaggtcttt ttaaagcttg gtgattcttt gattcgataa gtgcaaagtg 4800 ttgcatttgg gtcagagcaa tctcacgggt gtgcacaggc tgggagaaga actcctggga 4860 gaagaagaga gcagccctgc agagaaggac ttgacatgaa agacttaacg tcagccagac 4920 tccctctgct ctgccctcat gagcctctcc tactctgtaa aggtttgggc ccccagcaca 4980 4980 <210> 16 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> >ENSGALG00000015036_ENSGALG00000000438|chrZ:27764943-27769943 <400> 16 aggagtggct tctgaggctg gaaacaaggt gctcccctct tgtcaaacag ccaattccat 60 ctagctccaa cccatcctcc actggccaaa gctgagccca tcgctgatgg tgatagcatc 120 tgtaatagca tctcagaaag gctaaaagca ctgcgcagca gctgagagaa aagagtgagg 180 gaaaatggga cagaaacagc tctgcagccc tcagaggcaa tgcagaggag aggcaggagg 240 tgctccaggc atggagcatt agtttcttgc agtccaggag ttacaggtga tggtgcaggc 300 tctgtgcagc ccagtgatga ctgtttcagg atccatgctg cagcctgtgc cagagccagg 360 ggataggctt ggctgcttag tgcaggacgt ggagagccca tgctgagtgc aagctcccaa 420 aaggctagga cagaacaggt gtagtggagt agatcttgta ctgtggagca gtcttttcct 480 ggaggactaa cctgtgaaga ggaggactgc gctgaagcgg ttcatgaaga atgaaacctt 540 gtgggaggga ccccacactg aaaaaggaga aaaccacgat gaggaaggag cagcagagag 600 ctccccagcc ctgtgtgcac tgccaggaga gaaggaagta gaaaacgtgg gaatgtgcag 660 gtgtaaagct gagtctggga aaaaggtggg ggtggaataa aggtattttt agtcctatac 720 ctttctcatc aacctacttt aattgtagat tggccataaa ttaaatgttt tccccaggtc 780 aagtctgttt cttgcttgtg atggtggatg atctccctgt cctcatccca atcctgaagc 840 tatttcatca tatattctct ccctgccctg tttcaggaca gggagtgcaa gcagtttggc 900 agccagacga ggttaaccca gcaccagagg tttagtcaca tgcaagtgag agctattgcc 960 tcaacttaaa tgggagaaaa cattttagca ggttgagtct caccttgttt atccagatta 1020 tacagccatg ccagcacatg ggctgcatgc agcctggccc aacccatcct ctagccaccc 1080 cctgccccat actgaaaatg cagcggctct gccctgccaa gctgccaagc ctggctccag 1140 gcactcaccc attgcttaca aacaacaaaa cgtcagcgtg tgagcgcgcc ctgtgagctg 1200 caactggcat ggggagggca cagtcagcac aaatacatga cctgcaaatt ttcacatgga 1260 atgtatggag ttgcaatcag atactcagct caaaaaattt aatcatggct ccttacctgt 1320 ctttttttta acctttctct tagctcagag aggtatacct cacttcacaa tcatgccgta 1380 ttcatgtcat tgctttctgg cagtacgtac gtttgtgaac agctgttttc aagggtgatg 1440 cacaggaaga gtaaaatttc attaaaaaat ctccaaggag cacatggaga gctcactcag 1500 aagcctcacc gctgccactg aacaagactg atgcattagt ttcatgaaat caaggctatg 1560 tgtcccactg gtttcattat tttgttactc tttctttaaa acaaaaaaat tgttttattg 1620 cttatataca tcaactatgt tgttatatat tttccaaagg ccgctccaaa agtaatgcct 1680 cctgtttcat tctgttggcc caccgtgtca gaggcagatg gtggtacggc agtagagatg 1740 gaaccttccc accaatattc cattacatgt tgccatgtga tagacagcag cagatgggca 1800 ctctgacaga atggtatctg acatggaagc gtggatggag caaagttgtg tcactgaatt 1860 cctccataag gaaatgagca cccactaaca ttcactgatg cttgctgaac atttctggag 1920 accaaacagt ggatgtgagc acagtgaggt ggtgggtggt gcatttcagc agtggtgaca 1980 atgacgttgg gtcacctctg ctggtgcagg ttttgatgag tgcagcctgt gaggtcttgt 2040 tcatcaatgg agaaaatgca caactaatgg tggtgactgc tgaaaaatag tgttttgtag 2100 ctgagaattt tctctgtcaa acagtgctaa ttgtgctctt tgtatctgtt gtagtttcca 2160 tgggaataaa taggaggcat tacttgcaga ctgacctaca tatatgtggc cccaggcaag 2220 tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 2280 acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 2340 atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 2400 tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 2460 gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 2520 gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 2580 tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 2640 ccaccagact ggtccccgat tatcactcac aagctctcaa accgattgtg gctgtttctc 2700 agaggcaact ctttgcgctc tagcccctct ataacatggg gcaacttccc ctgccccacc 2760 ttcccttcct gtatcttctg aaaagcttgt agccctcaat tgtcacgctc cagccatatg 2820 aatcatccca ccacgtccct gtgttcacaa ttaccttcta gtcttctaat tgcaccatgg 2880 cttccaattc ctcctgttta tcacccacgt tgcatccatt gatgtagagg cacttcagtc 2940 gggctatcag caatgttacc acctgtgagg agccctcttg agatctttta ggacaattta 3000 gaggttttcc ccactgtttc ctaaaattac agcattccct gtcccttctt agtgatatag 3060 aactccatcc ccttccacca tcaaacctag cttaagctct ggtaaatgat ccagccagtc 3120 tgcttcccaa aactcttgct cagttgcatt ctatctgatg cctacatgcc caacaccttc 3180 aaggcctgtc caagatcata gaacacaaag gcttgatcat gacaacatcc atgcagccaa 3240 tcattcacat gacccattcc tctcctcctt tccaggtccc aacggccaac tgagagttgt 3300 gctctgagct cttcagtgtc cttccgaggg atgtaaagtc ccttttaatg ttctgcattt 3360 tctttgtcac agccttctga gacccaactt gaatgtggag gagtggagag taatcatccc 3420 gctctgatta tcagatacat tagcctcttc ttggcacctc tggcagacag aagacttccc 3480 tggagagatt acctggatga taactggggg cctcagtgcc tcacagcagc aagtccccag 3540 ttactaagac tctacacctc tttggtggcg ctagttctga tgtagttctt cagttgctta 3600 acatgcttgt tgtttcccaa gatttgactg ctatctgcac cctccctttc ttccagcccc 3660 agagccttat atcatgagct gagaacattc tgtgttcaaa atacaagaca catttatgca 3720 atttcgtatt ctctacccat atttttgtga tagaaattag ggctacttat ttcccatagt 3780 gatttccatg ctgcctacca ggttctaagt caggtcaccc tgccagcttc ttccaaacca 3840 tgctcaggag tgcatcaaat cacacgcaga cccaaggaaa aaatgtacca aacaatatta 3900 ccacgcatgc aaactcctca gtagctctgt cccatatgct acaattaggt ctgtataggc 3960 ttgttagatc ttgtctactt gattagtgtt ttccagcagg cctacaatcc aacctaaact 4020 gaacagacat taaagacatg tttcactaat acaaaacaac tccacctagt tcaacagtct 4080 gctcttttgt gtatggtacc tgaaactctt ctgttcactg aacttatccc aacatttttc 4140 ctcctaatgc atactttttc tagacgtgat gtgaaagtac agtgttatac cctggtgctg 4200 cattaatttg cataaccaca gcacacaaag cataatcata acacacaaag gcctcctatg 4260 aaaacatctg cttaaagtca taggtcactt atttattctc cctctagtta tgtaccagaa 4320 tgatgtatgt taataaataa tagattatta aatccatcaa aaattaggga agagctctag 4380 cacaaaggca aagcaaagaa gctttgaaga agtgcaagta aaatgaatta tttccaaaca 4440 actagcttct cactgtccca ctaagaacaa agactattct tatgcactgc tgtccttaaa 4500 attatcagct gctttgtgtt tatttcatgg agtaacacat gcaatatttt ttacaagaaa 4560 taagaaacca cagcagcaga agacgaatct gcttttattg aacgcagaaa tagatggaca 4620 ctgaaacaac agaagtttct accatgtttt gctgctgtga gagcaaatct gctgttgatc 4680 aactattagt tttgaaaagt atatgcaact ctgctatcaa ctccttcccc acatcacatc 4740 tcgtttcaag gagaaccttc ctgtccaggc aactagccag ggattttaat tttaacattt 4800 gctatctcag ataatctttt aatatttcta ggccgtgcac ataacccaca tagccctaac 4860 tccagatgtt cccagcatca cttagcagta gttccacttg aagcataaat acagcactgg 4920 cacaacaaat gaagacaatt caagcacgcc tttaacaagc atacagaaca tacagtttta 4980 4980 <210> 17 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> >ENSGALG00000012629_ENSGALG00000012628|chrZ:42172748-42177748 <400> 17 acaaattaaa tgtattttct cttgatacta ttttgattat aagctattaa cttgatttgt 60 aaaagcaccg atattatggt taatgtatgt atggtaactg ttgagtcaca gcctgaacct 120 ctgattgacc acctgcggaa aggtctgggt gagccctggg agcacaggca aaaacaattc 180 agttgtgcaa ctggaaggcc tctcttagac ctcatttaag ggctgactgt cactggggaa 240 ggatctgatt ctggagatcc cttattggtg aagctttccc ctgcaaacct agaatcttct 300 gatgcaagtg agcaatcttc ttcccttccc tagcagctct ctgttgcacc agtccttcca 360 tccttgcacc tttgttgtaa tgcttttccc atggcattga tctgtccagt tgctacagtg 420 tagaaacaag aaagtgtttt ctcaaaacat tatacatgct tactatcaga tcttacttaa 480 cattgataag aagtacacct ttcattacaa cagtgaacgg ataggcagca agcattcaga 540 acaatgaaaa agatctgcgt tctattgtaa agcaaacaaa ggtgatgacg gaacgtttat 600 ttgagataca ggcaccatag tacaagatat caaagaggaa ttaattcaac cctcccaaca 660 acagttggga aaaaaaaagg ataagctgag gaatgcagcc ttctccgatt tttactctgg 720 tgccggaagg aggaggagga gcgggggaaa acccagcgga ctcagactgc atacgcactc 780 tcggaagtac ctctgaggcg gggtgagagg aagggtggat ctaggctccc cccgctccac 840 acactcacgt gctcgtgtac tggttcaggc tgtgacttgg caactcctct acatctatcc 900 atctagttag actcaacaag accatcgtga ttcaggagtc tgaagatgct taactctctc 960 agaacgtcta gttctcctgg cctggtaaat gctatgtttc tcatactgcc tctctgaaga 1020 atgcttcgaa tgcttctagt gatgctctaa agttctaaac agaaaaatct ggagacagtt 1080 ctggtcttta gatagaaaaa atgccaacat gccaaaggat ggttacatcc ttcaagcaac 1140 cttgttgcat gctgtacaat agactcatgt aataacttag ccgtagtcat cgtatctctt 1200 atttacctgt tcgttattac attttcctgg tactgcttta tatttagtca gttgtccttt 1260 taagacaaat tttttggtgt gtgctaatag gcagttacca aatgttctag agggagggaa 1320 tataatcagt gagtatgtag atgtatatag atgtataacc agtaagtata cagagaagtt 1380 agggtggtct tttgagagca tatagctgga aagattatca catgggaaaa ggtaatcaga 1440 aataaatgga aaaatgctca ccagtgtcat aggctcacaa gaaaactccc caaggagcaa 1500 tctccagtaa cagacccttc ctcagtggca gtcagccctt aaatggcatc taggagaggt 1560 gtagccaggc accacccctt ctgtcacata ggtgaattgc cttcagctgt gctcctgcag 1620 ctgactcagt gttcacctca ggtgatcaat cagaggtcca gaccatgatt caacatttcc 1680 catgcggagg gagatgaaac aagactgtca tctcatcttc tgaagctgat aggagaatgg 1740 ttacaataag taggtcccct tccactggtt tagctctgta ttactcagtt taaaacttta 1800 tgtagttaat ggagttccat agaatcacat cgctggaaaa tgtatgtgat agctataccc 1860 aaaaagtgac acagcatcac agcctctacc aggtcctctg cctccagaca ggaccttgag 1920 ctgtgtgatc cctttgggat gtttctgttt aagacagggg acacttacac attaggaaac 1980 tggagtcatg tcggtggagg agaaagtggc tgtagaaaag gtaacggaca agaaatccct 2040 cactggctta gctgtaaagg tcagaggaaa atcatcttct gttctccata cacatctcct 2100 gtaattaggc acctgtgccc tttaaaaaag taaagtaatc aaagagtcat ttggtgaaaa 2160 tagaagccaa acagttacaa aatttagtta atattcaaag acaaaacaac tctggttcca 2220 aatataaaac cctttgtgta aacactgcgg gaaggtgcca aagagccacc tacacaaaga 2280 gatgccacag agtaatttgc gtaccccaac aataggatca tatatgggca aaccaaaaga 2340 ccaacaaaga ccccttgcaa taatcccttg attggcagaa gcaagtgcag cgttagattt 2400 agtatgtgtg acaattctga gaataggaag gaatttcact gaaactgtgt gaagatttgt 2460 atgttaaata catataatga gggttattta gctctggggt gtgcatgcta tgtggagaga 2520 tccccatgtg cccagcactg caatagacta atgtcagctt tttaaaccat catttggttt 2580 gaagagttta ttatgatttt cagaaacaga attatgtatt cagtgtctgt acattcttac 2640 aagcctgctg ttctgtacac atgaaaaagc tacttatggt gcaaatcagt atagagaagc 2700 agttttgaca tacagtggtc atgactgggt gatctgctgt cagaaggtaa gacactggta 2760 tacagaattg caaacgtgag atgaagacct caagtgcaac tctgtcatca taccacttct 2820 cttgctatta tctattcagt gtttgttcta aatattcagg cagaaggctt ggtttcacat 2880 caggtgttac atttaagtat tctttgccca ttttttgctg tttgtatgtg taacttcaga 2940 ttctcacatt gactgtgtag tgtaaatttg caaatagatg taacagcttc tctttaacat 3000 cccatgccaa acttttaatc actttcaatc aatgttggaa atctgcagta cataaatttt 3060 attttgattc attattcaga gaatcagaga aataaggact tttttagagg tttatgttta 3120 ttttagaaaa tataaataaa tcttgtatac atagatttcc aactagtaaa atttttagct 3180 atcgctgtag catttctatg aggagtttta ctttttactg tctcttatga aacttagtgg 3240 aaacaaagct aggtttcata aaacgtctaa tctcatattc atctctctcc aaaatatggt 3300 gaccttcaaa acaagaacag tttgcttatg taaacatttc ttacattgta ttctattaca 3360 ttatcatatt catgaagata ctttagaatt ttgttgctgt tagttctgtt gtgactggct 3420 gcttttctca gcttaagagc tctgcagaag tgatgataat atatattctc tttgctgagt 3480 tacaggaatt tcctgctttc ctctactgta cgttggagcc caggagatca gatccaacta 3540 ccagaatttt atatagctct ttgtgatcag tccttcctta gttgctgtta ttcctattga 3600 tgcaaaccta tttatggtgt attaaatgaa gaagatataa tgaggacagt ctaataatca 3660 aagttttttt ctgcagccag tagtacaggt agggtgacat gccttgcata aacagatcca 3720 gatgaaaggt gtgggtgagg caataagtct tcaggccctg ggctaaggca ggacctgttt 3780 tgtttcatga gatatgccta ggcctctcta tagacagggg gagatgtcag agaattctga 3840 agcatcagca gaggctatct tggttttcag gccctgtgct aagtatgaga ggaagttgag 3900 aacagataat gtgtgcaaca aagttagcaa catgcttttt caaaacagag gaaacgatcc 3960 ataaatactg gaacagaaca acctcacaga aatcactgac tgtccctttg ctggccatgg 4020 catcctgaag gttgtgctgg tagcactcat tgggttgctg tagctgataa ggcagtgcaa 4080 ggacattggg tctgcacctg ctatgaacag gcactggggc ctccaggagc tgctggtatt 4140 agtcatgggc atcagaggtg aagaaggcac ttgtagttct cacagctctg gcactgaccg 4200 atatttctgc tgtagttaat gggattattt gcatgtagtc aacagtttac aggctgattt 4260 ggctctgctc cgcaactagc aggacagagg gacccacaga tccatgtcct ggaaggggat 4320 aagggaaaag gatagagaga tgggcctaaa acaaaacaga agcaacgatc tgaggataaa 4380 caaagtaatt tactaaataa gatagtggaa tgcatgataa cacactatag tacaacataa 4440 tgcaatgtaa ttagaactgg agctaataaa tcaaatataa agagagtgtc tgaaagccaa 4500 aggccttact ctaatgctgt gatgagatgg cacccacaaa agagacgagc cagatgattg 4560 aaagggatgt atggtggtct accaaggcct gttatctgtt tgccctgagc agaaatgata 4620 gcagaacagc aaacagtcct ctggggaatg tagtagttct tctcttctgg gacaggtagc 4680 tggacctaga gcattaactc tttaaccccc agtacactac atgatgttat gatgtggaat 4740 accaataacc aaacatcata aaaccatgac atagtcttat gtcgctgtgt tgtaactgga 4800 agctgaggat ctccactcag tatttctgct gaatgaagca gatctttcag ttgaaggaga 4860 ccaacttaat catccacttc caacccctta ctatggacag gttcaccgtt cactagatca 4920 agctgcccag ggccccatcc aacctagcct tgaatgcctc cagggatgag gcatccacca 4980 4980 <210> 18 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> >ENSGALG00000015617_ENSGALG00000027714|chrZ:63363656-63368656 <400> 18 gaaaatctct gccactgatt gttttgcagc ttagttgtct agttattcgt gagatgttga 60 ttcaaacctt tgctcagatc aggcacagaa gcagtgctga actttgtttt tccgtagcct 120 tgctagtgtt gtaactgctg tcttagtgaa aacctgctta tttgcatccc cttcccaact 180 ttgggaaagt tgctgtctgt gattccagaa ttaggactcc ctcggttgca acatgactca 240 gattttcaga ccttggcttc agaggcacag tggtctttgg tgcagagaaa aatgaggctg 300 agaagaccag ggccatgatg agtgaggaag atgcaacaga acaagataga gaagagggaa 360 gagtttttta ggagctccac cagacatact gtagaagcag tgtagatgca cagtaccagt 420 aatgtactcc agccaaccac tcggtgaaga cccatgaaaa cctaatgagg ttcagtaagg 480 ccaagtgcag ggtgctgtac ttgggtcggg gcaatcccag gtatttatac aaactagggg 540 aagatctcct tgagagcagc cctgcagaga aggacttggg ggtcctggtg gatgagaagc 600 tggacgtgag ccagcagtgt gcacctgcag cccggaaggc caactgtgtt ctgggctgca 660 ttaaagaagg ggtgaccagc agggagaggg aggtgattgt ccccctctac tcagctcttg 720 tgaggcccca tctggagtac tgcatccagg cctggagccc ccagtacagg aaggacgtgg 780 agctcttgga gcgggtccag aggaagacca ctaagatgat cagagggctg gagcacctct 840 cctatgagga aaggttgagg gaactgtcct tgtttagctt agagaagaga aggcttcagg 900 gaaacctcag tgcagctttc cagtacttgg aaggagcaca taaacaggaa ggggaatggc 960 tgtttacgag ggtggatagt gacaggataa gggggaatgg ttttaaactg agacgggaga 1020 gttttaggtt agatattagg aggaagtttt tcacacagag ggtggtgacg cactggaaca 1080 ggttgcccaa ggaggttgtg gatgccccat ccctggaggc attcaaggcc aggctggatg 1140 tggctctggg cagcctgctc tggtggctgg caaccctcca catagcaggg gggttgaaac 1200 tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg aagactctgt 1260 aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca ccacattttt 1320 actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg ttaactgctg 1380 gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt cacccaaaat 1440 tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt acagcctcac 1500 atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg tatattatgc 1560 actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt aagcccagaa 1620 atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga cacagatgtg 1680 ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa tctctgaaat 1740 ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat agaattggtt 1800 gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag gtaaacaggt 1860 gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt gtttgttgtt 1920 tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca ttagcagacc 1980 agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt tctgtggaag 2040 aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac aaataatgtt 2100 atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag caaactgagt 2160 cttatcgttc ctactgtgct ttgcttttct tgcttagcaa aacatatcag aaaggttttc 2220 agttaaaaaa aaaaaaaaaa aaaaaggatt atactgcagc catcaaagag ttctgttaaa 2280 gaagttgtgg ttcatattct tttcaagttc tgaagacaat ctgacaatag aggagatgag 2340 ggtttagtgg aggtaaatgg agctgtttct gaaagtaggg caccgtcgtg aggtaatctc 2400 accactagat gttgctgtaa gcatgatgag gggagaagct ggagcacaaa aggtgtaaac 2460 ccaatggttg atcatgcgca ctcggacaga ggaaatcttc aaaatgggaa agttagcttt 2520 gaactgattt ggtgggttcc cattaaaaat gggggactta ctgccttatt gtctttatgt 2580 acccatttgg gggatagatg ccatacagaa acaccagagc ttacggtgtg aattcattgc 2640 acatcttatt agatcaacaa aatggaataa aagaatacag aagattacta ctccattggg 2700 catgtggacg ttttacaggc ctggataaat tagatcttaa aaacaaacaa acaaacaaac 2760 aaaaaaactc cttgcaaaga taatgttatg taatattagt tgcaagaagt aagcaaacac 2820 acagaactgg gagcagaagc aaagcactaa gttattaaag caagttgcac attttgagtt 2880 gcattttgcc actggtttta taaacatgtt tagcatgtct ggtcagaatt tgggcaccag 2940 gatgctttta agatgtctgt ctatggaacc tgtcagtgct caagaataac ttctgttatt 3000 tggatgctgc accaaagaat tcagaggaag acgagccaag ccagacgtta tcatagtcac 3060 tagtaaagtg gttctaagcc taattaagac atgtcagaac tatgtgttgt gcaaccaaat 3120 cctccaaaag agaaatcaga ggtgaacttg tgcaataaat atagaagaca cgtaaatcct 3180 gaggcagtta gctaaccata tgaagccaat catacctgac tgctggacgc aggagactga 3240 accttacaga ccctggagaa tcactgtttg gcctagttag gcctgaatgg aatttaccaa 3300 gattcatgac tttaacatgg atcaggtgca aagaaaagaa ggctcagtta gttcctacag 3360 gctaccagat ctttttccac ctctgctcag cctggagctg tgggctctac ctgcccctga 3420 agtgaagtgg catcaactgc aacacttttt gcagaggcaa aaatcatcaa gtcgtgcctc 3480 tgcattttaa ggtgatggat tccaagagat agattccaaa cccaacactg agattcctct 3540 ggtgatgcag atgactgctt actgggatcc ttctctctct atagcctaat cccatgcagc 3600 accaaaagtt gggcacctga atactatcta tcttcctcca tctgacctct gctgctggct 3660 catcacgcat ggctcctgag cctgacagag ccatggggaa agacatggcc tgaccttttc 3720 agacagcacg acttcctcca gtgtgctgca ctaacgacaa tattaaaaat aacactgcag 3780 gaaaacatgc tgttttctag caggctggag gaaaaaaaag gtgttcaagg tgagactcta 3840 taagatcact ctttccaaac acagcagtta actcttttct cacttgaagc tgaaattcat 3900 cttcagtagg tgacggttac aagcagctct ccaccggtaa gtgaaagttt gctgggtttt 3960 tttcaggcac ttcaagacac gaaggtaatt gctgcaacac cttcctagct cttcctgagt 4020 actcagccca aagctacact cttcagggct actctcctag cacggctctc tgtaattagc 4080 ctggctttct aacttatgaa ttaacgctgc agctactcaa cagggcagct ttgcagctat 4140 gaactttatg catacacttt ttattctggg tggtacaaat tcattgctaa gaaatcttat 4200 aaactctatg gaacactttt aaaagcctac atgtgattaa aaacaaaaaa acaaaaaaca 4260 ctgatatcac atgctatatt ctctagaaaa gagtattttg gaaacaattg taattcacag 4320 ctcaggagaa agagcaattg ttttcctttg tgctggagct ggaattctat gcagtataaa 4380 tacagatgtc caaacaaact cattaaatgg tagtcatagc aaatggagga aaaaaaaagg 4440 gggggggggg gggaactgaa gacactgaag aaattctgct gaaattcatg gagctgcaac 4500 aagaattgat attgattact tcaccatatt ccgctctaat taactagcac aacactgact 4560 gttgtgaaaa caagcatgtg atttgaccca ataagtgttt cttttagtaa ccaaaaccaa 4620 acaacaacaa accttctggc tgaccagatg gaggataaat tctaacctga tcattctgac 4680 acaaatgagg aattatgtag gttggaactg cattccaaag caaagcatgt ttttggctta 4740 gttgaacaca cagaattcat ttttcttgct gattcttgta actaagggca ggtatgaatt 4800 ggttccctta aaagaagtcc ccagaagcca tggtcctcaa caagtcttct cagattagca 4860 aggatgaacg actgagaaat caaaacccaa attcagatct aagagccttc aacagatttg 4920 ctaaatgaaa ctagcaaata ctgtagaagt taacttgatt ttgaaataaa acaggatttc 4980 4980 <210> 19 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> >ENSGALG00000008188_ENSGALG00000008197|chrZ:78777477-78782477 <400> 19 aaaggagttt cttgcctgaa accccttaag attttgtgta ttgttgttgc cctggtttca 60 gctgggacag gactgatatc cttcacagta tctggtatga tgctgtgttt tggttttagg 120 agaaaaccag tgctgatggc acaccgaggt tgtagttgcg actgagcagt gctgcacaga 180 gccaaggatg tttcagctgc ccacactggc cttcctctaa gggggtgtga gggcacatgg 240 agctggaggg aaccaaaggg gtattccaca ccatatgtca ctgagcaaag acattgctgc 300 ccaggcagag aatacagtgg tagaaatacg tcacataggt gcccatctac cccagaactg 360 ggccagcgaa gaacatcaga acaacaagca tgcgaatcag gctgctcaga ttgatgtggc 420 tcaggtagat ctcaactgtc aactgtcacc cataaaatgg atgagacagg agcaaggcct 480 gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 540 gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 600 aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 660 gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 720 acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 780 agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 840 atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 900 ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 960 ggcatggcat ggtcagtgac acccactggt tagcatgggg acaaactgcc agagcagagg 1020 gctgctgaaa cgccgagtgc caactgacac tgttcagctg acagcctcac gagagtgctg 1080 cgagggttaa gtgaggcaac aaaatacaag tactcaaaaa tagaatggaa tggaatggaa 1140 taacagaggg aatggggaac aggctgcagt gagaaggaaa cccccgtgca ccgaccaacc 1200 cgctcccagt agcctggtcc ctaccttgcc ccactccagc agctccacga ggtactcgaa 1260 gtgcccatgt ccggccatcc ccagcatggc acagctgtca cctgggagca gcgggggtcc 1320 ggcaggcatc gccggcaccc acagcctggg ctgggctgag gatgggcttg gtgggcagct 1380 gggtgctgcc gtggcagctg agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc 1440 acggctcggg acccgtggtg ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc 1500 cagagcaggg tgcatgatgt gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca 1560 ccacccggtc tgatgaaatt ccaggttttg tttaagatga aaatgcatgt gggcatacat 1620 ttgcacatga gaacacctgc taatgaaaca cacagagttg tatgtgcagt ctccctggct 1680 ggtggcatgt ctgtgggggc agttaggcag gaagaaaagc tccaccatct gtttctgtgt 1740 cccgggcttg gtgctgccac tagagatggg atgcacacag catgcctgcg tgctgccgag 1800 gcagctcagt acctgctgct gggggagagc agccctcagg gagctgctgc aaagaccccg 1860 tgggatggct ggtgaacagt gctggagaca tggcagatgt cgcacccctg ctccacacca 1920 ccctccgctg cagctgcctg cacgatgcca tttcagcgtg ccacggcttg tttcttcctc 1980 ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 2040 cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 2100 atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 2160 ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 2220 tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 2280 gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 2340 atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 2400 ttcccacact gcttttctgc aaatggatta ggagtaaaga gtcagataca caggggacca 2460 tcactcactt cctaggccat gcttcgtagt ttaactccat gcaaggtatt ttcttgctct 2520 gatctaactc tagatcacta aatggcactt gtgcaggaca cttttccact gtcattttgg 2580 ggggtagaag tgtggtcaga gccagggagg cttgcagggc ccacaccagc tgtggcccaa 2640 gcagctgctg tacaatggct gtatggcagt atcgatgtga acttcctgat aataaacaga 2700 actcagcagc aaataaaccc agattgttct gatcagtaac gagaggctgt gcaaaaagct 2760 gagaaatgta cagcccttcc tgctcaccac tacagccctt catgcagcgg cctgctgcac 2820 tagggcctgc ttggccagag gcagggctgc agcttgagat acgcagcacc cagtacccca 2880 gcaggctgcc atgtgcttct gtcaggccat gaattgcaca agttggtata gttttataca 2940 gtgtcatgca gaagcacaac tcttaccttg gcacactgat atggaaagca aagtgtaaag 3000 gaactgtatg tttcttggct tgtgagttcc attggttctc ccaggacagc agtgacagct 3060 ctagattttc tggttgatct cttccatcta agtttttact tctgaataca tctgtgcagc 3120 aaagcctgat gctttttttt ttccccctcc cctgggatcg tgaaatatta ttttcccatc 3180 tccataatac agatgatcca ctcaaacatg catcctcagt cgcagtcctc agaagggcct 3240 tttcccacca tacacctaca cgctacacca gactttattg gtcaccatgc cttgagggat 3300 tctgcctaac acaggcacac aggaagggct gataccagta attcattgct gaggagagaa 3360 ggggcacttc ttttatagta gagccacaga atcaccagga ttggaaaaca cctccaagat 3420 catccaatcc aaccacccac ctaccaccag tatttcccac taaaccatgc cccttggtac 3480 cacatctaaa agcatcttct gcaccttcac agcttcattg cctttctcag gacgtgctcc 3540 agggccttgg tgtctttctt gtattgagtg gcccaaaatt gaacacaata ctcgaggtgc 3600 agcttcacca aagctgagtg cagaggggtg atcacctcta ctaggccttg ttttacccct 3660 tccccctgca tacctagttt aaagcccttt cagcgagccc taccagctcc tgggctagga 3720 tccatttccc cctttaagag aggtgaaacc cacccgcagg catcaggcca ggcactgagt 3780 taaactgctc catcagctaa ccaccccaat gccctgatgt cccttctgat agtcctcagg 3840 cttctctcag cgacttcatc actgccagcc tgagctatcc gtaatggata acaaccagag 3900 ggctgaacca gactagggag tctcctggta atgtccctaa gtaatgaatt catgggggaa 3960 atggatctgt gcagatgcac tgccatctca cagggctcaa ctgtcacaga cagttgtcac 4020 aaaccagagc agcagagaga gcagcaaagg agatatcata aatagtggaa aagggtgcca 4080 gtgtttgtta ttgactgctt cactgtgtgt ttggaaatca caaagaaaac aacaaaaaaa 4140 ccccacagaa tacacatttc caagcatgca tgcttcaggt aaggactgcg gcccgcttta 4200 attcccctgg aagcgtccag aggcctacac acaaatcagg ccacaacaaa caggttccgt 4260 gcaagcagtt tgtgagttgt atgaaaatag ctttcttcca taaagcgtgg cattgatggg 4320 aactgttact agcagatgaa aatctgccat gcacgacacc cttaatggtt ggagtggttc 4380 gactgagttt tgcattcctc attctgatgg atgctggcaa aaccaagatc acccaacacg 4440 taacactgaa tatagctcac caacagcaac gagccacacc agatactgag gcatctccaa 4500 ggctacgtct ggtggaaaga agagacagtc tcaccctgca gtgcaaaagc atcagggctt 4560 ctgcgtaagg tttattgatc ccaaagatag gcaagttaat attcatcagt ttaatagaca 4620 ggtactcaca ttactggaga tggcatgcca ggagagcctc tgccaagtgc tcactgccag 4680 tggcagccgg ccagtgcaca gcttcttggt gctgtggcca tctatataac agaaggaagc 4740 aattaagcat cacctatcaa gataagcaag atcattcaaa gagaataagg gtacttggtt 4800 agagctgcag agcacttcct cacgaatgag tttcttccag ctacatgcag atgttacagg 4860 cagtttgctt gtgttctagg gataacacaa acccctcctc atgggctagc tgcctgctca 4920 ggctgtggtc tgtatttttg cacgtgcact gctagccttt acttcacatt tccctttact 4980 4980 <210> 20 <211> 1653 <212> DNA <213> P.pyralis (firefly) luciferase gene (cds) GenBank: M15077.1 <400> 20 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatcctct agaggatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgaacatt 360 tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa ttcctctgga 600 tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt cagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct tcaggattac 840 aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc acctctttcg 960 aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg acaaggatat 1020 gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080 gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140 acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat tatgtccggt 1200 tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260 ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg cttgaagtct 1320 ttaattaaat acaaaggata tcaggtggcc cccgctgaat tggaatcgat attgttacaa 1380 caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc cggtgaactt 1440 cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500 tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560 gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620 aaggccaaga agggcggaaa gtccaaattg taa 1653 <210> 21 <211> 550 <212> PRT <213> P. pyralis (firefly) luciferase protein GenBank: AAA29795.1 <400> 21 Met Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe Tyr Pro 1 5 10 15 Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met Lys Arg 20 25 30 Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His Ile Glu 35 40 45 Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg Leu Ala 50 55 60 Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile Val Val 65 70 75 80 Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly Ala Leu 85 90 95 Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn Glu Arg 100 105 110 Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val Val Phe Val 115 120 125 Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys Leu Pro 130 135 140 Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr Gln Gly 145 150 155 160 Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro Gly Phe 165 170 175 Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys Thr Ile 180 185 190 Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys Gly Val 195 200 205 Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala Arg Asp 210 215 220 Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu Ser Val 225 230 235 240 Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly Tyr Leu 245 250 255 Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu Glu Leu 260 265 270 Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu Leu Val 275 280 285 Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp Lys Tyr 290 295 300 Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser 305 310 315 320 Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile 325 330 335 Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr 340 345 350 Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe 355 360 365 Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val 370 375 380 Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly 385 390 395 400 Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp Gly 405 410 415 Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp Glu His Phe 420 425 430 Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys Gly Tyr Gln 435 440 445 Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn Ile 450 455 460 Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu Leu 465 470 475 480 Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu Lys 485 490 495 Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys Leu 500 505 510 Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr Gly 515 520 525 Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys Lys 530 535 540 Gly Gly Lys Ser Lys Leu 545 550 <210> 22 <211> 558 <212> DNA <213> Gaussia princeps luciferase GenBank: AY015993.1 <400> 22 atgggagtga aagttctttt tgcccttatt tgtattgctg tggccgaggc caaaccaact 60 gaaaacaatg aagatttcaa cattgtagct gtagctagca actttgctac aacggatctc 120 gatgctgacc gtggtaaatt gcccggaaaa aaattaccac ttgaggtact caaagaaatg 180 gaagccaatg ctaggaaagc tggctgcact aggggatgtc tgatatgcct gtcacacatc 240 aagtgtacac ccaaaatgaa gaagtttatc ccaggaagat gccacaccta tgaaggagac 300 aaagaaagtg cacagggagg aataggagag gctattgttg acattcctga aattcctggg 360 tttaaggatt tggaacccat ggaacaattc attgcacaag ttgacctatg tgtagactgc 420 acaactggat gcctcaaagg tcttgccaat gtgcaatgtt ctgatttact caagaaatgg 480 ctgccacaaa gatgtgcaac ttttgctagc aaaattcaag gccaagtgga caaaataaag 540 ggtgccggtg gtgattaa 558 <210> 23 <211> 185 <212> PRT <213> Gaussia princeps luciferase GenBank: AAG54095.1 <400> 23 Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu 1 5 10 15 Ala Lys Pro Thr Glu Asn Asn Glu Asp Phe Asn Ile Val Ala Val Ala 20 25 30 Ser Asn Phe Ala Thr Thr Asp Leu Asp Ala Asp Arg Gly Lys Leu Pro 35 40 45 Gly Lys Lys Leu Pro Leu Glu Val Leu Lys Glu Met Glu Ala Asn Ala 50 55 60 Arg Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser His Ile 65 70 75 80 Lys Cys Thr Pro Lys Met Lys Lys Phe Ile Pro Gly Arg Cys His Thr 85 90 95 Tyr Glu Gly Asp Lys Glu Ser Ala Gln Gly Gly Ile Gly Glu Ala Ile 100 105 110 Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu Glu Pro Met Glu 115 120 125 Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys Thr Thr Gly Cys 130 135 140 Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu Leu Lys Lys Trp 145 150 155 160 Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile Gln Gly Gln Val 165 170 175 Asp Lys Ile Lys Gly Ala Gly Gly Asp 180 185 <210> 24 <211> 4107 <212> DNA <213> Streptococcus pyogenes M1 GAS Cas9 protein id: AAK33936.1 <400> 24 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600 attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720 ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960 atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160 catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220 gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280 attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340 atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400 gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460 gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520 attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580 gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640 aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700 acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760 ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820 actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880 aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940 taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000 tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060 atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120 aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180 cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240 gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300 cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360 gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420 tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480 aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540 tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600 tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660 caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720 cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780 cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840 attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900 ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960 cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020 gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080 gatttgagtc agctaggagg tgactga 4107 <210> 25 <211> 1368 <212> PRT <213> Streptococcus pyogenes M1 GAS Cas9 protein id: AAK33936.1 <400> 25 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA7 for Z chromosome locus chrZ_42174515_-1 <400> 26 gtaatacaga gctaaaccag 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA8 for Z chromosome locus chrZ_9157091_1 <400> 27 acagacctat gatatgtgag 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA9 for Z chromosome locus chrZ_27767602_-1 <400> 28 gagcttgtga gtgataatcg 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA10 for Z chromosome locus chrZ_78779927_1 <400> 29 gtaaagagtc agatacacag 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA11 for Z chromosome locus chrZ_63364946_-1 <400> 30 cagtgggtac tgaagctgtg 20 <210> 31 <211> 1012 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA7 integration to Chromosome Z ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_ -1 <400> 31 gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60 caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120 aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180 atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240 ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300 gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360 tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420 caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480 tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540 ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600 caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660 taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720 ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780 agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840 gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900 gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960 gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct ca 1012 <210> 32 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA7 integration to Chromosome Z ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_ -1 <400> 32 gtcatgtcgg tggaggagaa agtggctgta gaaaaggtaa cggacaagaa atccctcact 60 ggcttagctg taaaggtcag aggaaaatca tcttctgttc tccatacaca tctcctgtaa 120 ttaggcacct gtgcccttta aaaaagtaaa gtaatcaaag agtcatttgg tgaaaataga 180 agccaaacag ttacaaaatt tagttaatat tcaaagacaa aacaactctg gttccaaata 240 taaaaccctt tgtgtaaaca ctgcgggaag gtgccaaaga gccacctaca caaagagatg 300 ccacagagta atttgcgtac cccaacaata ggatcatata tgggcaaacc aaaagaccaa 360 caaagacccc ttgcaataat cccttgattg gcagaagcaa gtgcagcgtt agatttagta 420 tgtgtgacaa ttctgagaat aggaaggaat ttcactgaaa ctgtgtgaag atttgtatgt 480 taaatacata taatgagggt tatttagctc tggggtgtgc atgctatgtg gagagatccc 540 catgtgccca gcactgcaat agactaatgt cagcttttta aaccatcatt tggtttgaag 600 agtttattat gattttcaga aacagaatta tgtattcagt gtctgtacat tcttacaagc 660 ctgctgttct gtacacatga aaaagctact tatggtgcaa atcagtatag agaagcagtt 720 ttgacataca gtggtcatga ctgggtgatc tgctgtcaga aggtaagaca ctggtataca 780 gaattgcaaa cgtgagatga agacctcaag tgcaactctg tcatcatacc acttctcttg 840 ctattatcta ttcagtgttt gttctaaata ttcaggcaga aggcttggtt tcacatcagg 900 tgttacattt aagtattctt tgcccatttt ttgctgtttg tatgtgtaac ttcagattct 960 cacattgact gtgtagtgta aatttgcaaa tagatgtaac agcttctctt taacatccca 1020 tgc 1023 <210> 33 <211> 1014 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA8 integration to Chromosome Z ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ _9157091_1 <400> 33 ctctgcatgg tcacaacggc cccaacagcc tcccatcccg atgtcaccaa tcagttcact 60 attactggtg agcaaccagt ccagcactgc atccccctgg tggggctgtc tgttacgtgg 120 ctcaggaagt tatcctcagt gcattccagg tgctcctgga tcgcctgtag ctcaccgtgc 180 tacttttcca gcaggtgtca gggtggtaga agtcccccag caggacgaga gcctgcgatt 240 gtgacagctt ctgtagctgg agggagaatg cttcatcaac aggctccgct tgatcagtgt 300 ccctgtactg ataccacaag gcttcttttg ctgctcccat cttaactctc accccatcgt 360 ggtgttatac gtgcataaca tcatgcagtg cactaagagt taaagagtta atgctccagt 420 tccgtcgatt gtcaataatt ccaggtgtac ctttctcaga agagaagaac tacaaatccc 480 ttaagatctt actgttccat tttcattctc cattcagaag gaaaggtaaa actgcagtgt 540 gtgctcccta gcattagagt aatttctccc ttagctcgtt gccaccattt tgtttttagg 600 cccacctcct taccttttcc ctacacccct cctgtgtctc tgagacgtgg gtccatgggt 660 ccctcaacca tagtagacac aaactcagat caaaccaagc cagagctttg acaaccccta 720 agctttcagc ttactcaggg ttgctctgca gggactgctc ttcacactct attccttcct 780 tgatatagag ggcaatgtct cctctcctcc ttccttacct gtccctcctc atctgcctgt 840 tgctgtcagt ggccacactt cagccatggg aatcatccca ccctgctttt gtgaaggaaa 900 ctacattatg gttctcaggt agcacagtgg cttccatcac ctcctgtttg cttcccaagc 960 tgtgtgtgtt ggtgtagagg cacttcagct gggcagctga agaactggac gcac 1014 <210> 34 <211> 1032 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA8 integration to Chromosome Z ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ _9157091_1 <400> 34 cacctttcca cctcctgcta aagcacattc cctacagtat gtttcacatg acaccgtgct 60 ggcagatttt taatatcatc agagaatgac actccatatc ctctctgggc agcctttttc 120 agtgctctgt cacccacaaa gtaaagtatt tgctcatgtt ctaatggaac ttcctatgtt 180 ctagtttgtg accattgaac cttgttctgt cactggacag tgctgaagga gcctggccct 240 atccacttga ctcccacact ttacatattt acaagcatcg ataagacccc cctcagtctt 300 ctccagacta gatagcccca ggtctcccaa ccattccttt tatgggagat gcttcaggcc 360 cctcatcacc tctgtggccc tctgctggac tgcctgcagt agttccaggt tttttttttt 420 gaactgggga gcccagaact tgacacggta ttccagatgt ggcctcacca gcgcagagga 480 gaggggaagg ctcacctccc tcgacctggt ggccatgttt tttttaacag acctcaggat 540 accactggcc ttcttggccc aagggcacac tgctggctca tggcccatgg gttggcttcc 600 aggactctca ggtccttctc cgtagagctc ctctcaagca ggacaaccct cagcctgtac 660 tgatgtgtgc ggtgcggtta ttcctcccca cgtgcaagac tctacatctg ccattgttaa 720 atctcataag cttcctctct gcccaactct ccactgtgta cgggccttag tgaatggcag 780 cacagacttc tggtgtgagg atagcattca gaacaagctg ctgtaccttc ccagtcacag 840 aggtgagggt gactggcttg tactttccca gctttgcctt cttgcccttt tggaagactg 900 gagcgacatt ggccttctgg aggaaacggt cctcaggcac ccctcctgtt ctccatgacc 960 tttgaaagat gatcgagagc accttggcag tcacttctgc cagctccttc agcacgcatg 1020 agtgcatccc gc 1032 <210> 35 <211> 1025 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA9 integration to Chromosome Z RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1 <400> 35 gcagtacgta cgtttgtgaa cagctgtttt caagggtgat gcacaggaag agtaaaattt 60 cattaaaaaa tctccaagga gcacatggag agctcactca gaagcctcac cgctgccact 120 gaacaagact gatgcattag tttcatgaaa tcaaggctat gtgtcccact ggtttcatta 180 ttttgttact ctttctttaa aacaaaaaaa ttgttttatt gcttatatac atcaactatg 240 ttgttatata ttttccaaag gccgctccaa aagtaatgcc tcctgtttca ttctgttggc 300 ccaccgtgtc agaggcagat ggtggtacgg cagtagagat ggaaccttcc caccaatatt 360 ccattacatg ttgccatgtg atagacagca gcagatgggc actctgacag aatggtatct 420 gacatggaag cgtggatgga gcaaagttgt gtcactgaat tcctccataa ggaaatgagc 480 acccactaac attcactgat gcttgctgaa catttctgga gaccaaacag tggatgtgag 540 cacagtgagg tggtgggtgg tgcatttcag cagtggtgac aatgacgttg ggtcacctct 600 gctggtgcag gttttgatga gtgcagcctg tgaggtcttg ttcatcaatg gagaaaatgc 660 acaactaatg gtggtgactg ctgaaaaata gtgttttgta gctgagaatt ttctctgtca 720 aacagtgcta attgtgctct ttgtatctgt tgtagtttcc atgggaataa ataggaggca 780 ttacttgcag actgacctac atatatgtgg ccccaggcaa gtcaacagct gtacgaaaag 840 tccatgcttc ctcattataa acggaggaaa aaaagttgtt tacagctgta atgggattat 900 aaaaggcaaa tggggatagt acagtggtga gaaccagatc tatgaaggaa aagccctaag 960 aaaaagagag tgcacagata ctcttaacca tctaataact gtttcctcca tcctacagct 1020 cagag 1025 <210> 36 <211> 1040 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA9 integration to Chromosome Z RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1 <400> 36 tggcttccaa ttcctcctgt ttatcaccca cgttgcatcc attgatgtag aggcacttca 60 gtcgggctat cagcaatgtt accacctgtg aggagccctc ttgagatctt ttaggacaat 120 ttagaggttt tccccactgt ttcctaaaat tacagcattc cctgtccctt cttagtgata 180 tagaactcca tccccttcca ccatcaaacc tagcttaagc tctggtaaat gatccagcca 240 gtctgcttcc caaaactctt gctcagttgc attctatctg atgcctacat gcccaacacc 300 ttcaaggcct gtccaagatc atagaacaca aaggcttgat catgacaaca tccatgcagc 360 caatcattca catgacccat tcctctcctc ctttccaggt cccaacggcc aactgagagt 420 tgtgctctga gctcttcagt gtccttccga gggatgtaaa gtccctttta atgttctgca 480 ttttctttgt cacagccttc tgagacccaa cttgaatgtg gaggagtgga gagtaatcat 540 cccgctctga ttatcagata cattagcctc ttcttggcac ctctggcaga cagaagactt 600 ccctggagag attacctgga tgataactgg gggcctcagt gcctcacagc agcaagtccc 660 cagttactaa gactctacac ctctttggtg gcgctagttc tgatgtagtt cttcagttgc 720 ttaacatgct tgttgtttcc caagatttga ctgctatctg caccctccct ttcttccagc 780 cccagagcct tatatcatga gctgagaaca ttctgtgttc aaaatacaag acacatttat 840 gcaatttcgt attctctacc catatttttg tgatagaaat tagggctact tatttcccat 900 agtgatttcc atgctgccta ccaggttcta agtcaggtca ccctgccagc ttcttccaaa 960 ccatgctcag gagtgcatca aatcacacgc agacccaagg aaaaaatgta ccaaacaata 1020 ttaccacgca tgcaaactcc 1040 <210> 37 <211> 1024 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA10 integration to Chromosome Z TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927 _1Chromosome Z <400> 37 ctaccttgcc ccactccagc agctccacga ggtactcgaa gtgcccatgt ccggccatcc 60 ccagcatggc acagctgtca cctgggagca gcgggggtcc ggcaggcatc gccggcaccc 120 acagcctggg ctgggctgag gatgggcttg gtgggcagct gggtgctgcc gtggcagctg 180 agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc acggctcggg acccgtggtg 240 ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc cagagcaggg tgcatgatgt 300 gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca ccacccggtc tgatgaaatt 360 ccaggttttg tttaagatga aaatgcatgt gggcatacat ttgcacatga gaacacctgc 420 taatgaaaca cacagagttg tatgtgcagt ctccctggct ggtggcatgt ctgtgggggc 480 agttaggcag gaagaaaagc tccaccatct gtttctgtgt cccgggcttg gtgctgccac 540 tagagatggg atgcacacag catgcctgcg tgctgccgag gcagctcagt acctgctgct 600 gggggagagc agccctcagg gagctgctgc aaagaccccg tgggatggct ggtgaacagt 660 gctggagaca tggcagatgt cgcacccctg ctccacacca ccctccgctg cagctgcctg 720 cacgatgcca tttcagcgtg ccacggcttg tttcttcctc ttgcagtctc aggttgccgc 780 agcagcagct gcctgaggtc tggtggcaaa gggcagagca cccagcccac tgctctccat 840 gagtgagcgg gtagggggca cgccgtgctt cgcttctggt atcgggtggc ctgtggagca 900 catcacccct ggacagtgaa aacatgtcaa agggtgtttt ataacagtat agcatatccc 960 tttgaggctg aatttcctga gcttatggat atggtagtaa tgctatacca ggctctctct 1020 gcag 1024 <210> 38 <211> 1022 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA10 integration to Chromosome Z TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927 _1Chromosome Z <400> 38 cagctgctgt acaatggctg tatggcagta tcgatgtgaa cttcctgata ataaacagaa 60 ctcagcagca aataaaccca gattgttctg atcagtaacg agaggctgtg caaaaagctg 120 agaaatgtac agcccttcct gctcaccact acagcccttc atgcagcggc ctgctgcact 180 agggcctgct tggccagagg cagggctgca gcttgagata cgcagcaccc agtaccccag 240 caggctgcca tgtgcttctg tcaggccatg aattgcacaa gttggtatag ttttatacag 300 tgtcatgcag aagcacaact cttaccttgg cacactgata tggaaagcaa agtgtaaagg 360 aactgtatgt ttcttggctt gtgagttcca ttggttctcc caggacagca gtgacagctc 420 tagattttct ggttgatctc ttccatctaa gtttttactt ctgaatacat ctgtgcagca 480 aagcctgatg cttttttttt tccccctccc ctgggatcgt gaaatattat tttcccatct 540 ccataataca gatgatccac tcaaacatgc atcctcagtc gcagtcctca gaagggcctt 600 ttcccaccat acacctacac gctacaccag actttattgg tcaccatgcc ttgagggatt 660 ctgcctaaca caggcacaca ggaagggctg ataccagtaa ttcattgctg aggagagaag 720 gggcacttct tttatagtag agccacagaa tcaccaggat tggaaaacac ctccaagatc 780 atccaatcca accacccacc taccaccagt atttcccact aaaccatgcc ccttggtacc 840 acatctaaaa gcatcttctg caccttcaca gcttcattgc ctttctcagg acgtgctcca 900 gggccttggt gtctttcttg tattgagtgg cccaaaattg aacacaatac tcgaggtgca 960 gcttcaccaa agctgagtgc agaggggtga tcacctctac taggccttgt tttacccctt 1020 cc 1022 <210> 39 <211> 1003 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA11 integration to Chromosome Z RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_- 1 <400> 39 gggttgaaac tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg 60 aagactctgt aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca 120 ccacattttt actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg 180 ttaactgctg gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt 240 cacccaaaat tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt 300 acagcctcac atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg 360 tatattatgc actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt 420 aagcccagaa atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga 480 cacagatgtg ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa 540 tctctgaaat ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat 600 agaattggtt gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag 660 gtaaacaggt gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt 720 gtttgttgtt tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca 780 ttagcagacc agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt 840 tctgtggaag aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac 900 aaataatgtt atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag 960 caaactgagt cttatcgttc ctactgtgct ttgcttttct tgc 1003 <210> 40 <211> 1003 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA11 integration to Chromosome Z RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_- 1 <400> 40 cagaaacacc agagcttacg gtgtgaattc attgcacatc ttattagatc aacaaaatgg 60 aataaaagaa tacagaagat tactactcca ttgggcatgt ggacgtttta caggcctgga 120 taaattagat cttaaaaaca aacaaacaaa caaacaaaaa aactccttgc aaagataatg 180 ttatgtaata ttagttgcaa gaagtaagca aacacacaga actgggagca gaagcaaagc 240 actaagttat taaagcaagt tgcacatttt gagttgcatt ttgccactgg ttttataaac 300 atgtttagca tgtctggtca gaatttgggc accaggatgc ttttaagatg tctgtctatg 360 gaacctgtca gtgctcaaga ataacttctg ttatttggat gctgcaccaa agaattcaga 420 ggaagacgag ccaagccaga cgttatcata gtcactagta aagtggttct aagcctaatt 480 aagacatgtc agaactatgt gttgtgcaac caaatcctcc aaaagagaaa tcagaggtga 540 acttgtgcaa taaatataga agacacgtaa atcctgaggc agttagctaa ccatatgaag 600 ccaatcatac ctgactgctg gacgcaggag actgaacctt acagaccctg gagaatcact 660 gtttggccta gttaggcctg aatggaattt accaagattc atgactttaa catggatcag 720 gtgcaaagaa aagaaggctc agttagttcc tacaggctac cagatctttt tccacctctg 780 ctcagcctgg agctgtgggc tctacctgcc cctgaagtga agtggcatca actgcaacac 840 tttttgcaga ggcaaaaatc atcaagtcgt gcctctgcat tttaaggtga tggattccaa 900 gagatagatt ccaaacccaa cactgagatt cctctggtga tgcagatgac tgcttactgg 960 gatccttctc tctctatagc ctaatcccat gcagcaccaa aag 1003 <210> 41 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA3, Z chromosome, "Left arm" <400> 41 cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60 gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120 ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180 caatgtgggc attgccgacc 200 <210> 42 <211> 258 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA3, Z chromosome, "Right arm" <400> 42 tggtgagtgg ggccaggaga gcaggacagg agtgtggact cggaggcgcg ggcagaggag 60 gtagctcaga gcatgagata tattcgccag gtgtcagtgg acttctggca gtgcatactg 120 cagagagctt tggttgctgg ccatctggat gatgacaaaa tctcagccac agaccatgtg 180 ggttggaaga gtcctcagga gatcaccttt ccacctcctg ctaaagcaca ttccctacag 240 tatgtttcac atgacacc 258 <210> 43 <211> 436 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA4, Z chromosome, "Left arm" <400> 43 tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 60 acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 120 atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 180 tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 240 gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 300 gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 360 tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 420 ccaccagact ggtccc 436 <210> 44 <211> 521 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA4, Z chromosome, "Right arm" <400> 44 tcaaaccgat tgtggctgtt tctcagaggc aactctttgc gctctagccc ctctataaca 60 tggggcaact tcccctgccc caccttccct tcctgtatct tctgaaaagc ttgtagccct 120 caattgtcac gctccagcca tatgaatcat cccaccacgt ccctgtgttc acaattacct 180 tctagtcttc taattgcacc atggcttcca attcctcctg tttatcaccc acgttgcatc 240 cattgatgta gaggcacttc agtcgggcta tcagcaatgt taccacctgt gaggagccct 300 cttgagatct tttaggacaa tttagaggtt ttccccactg tttcctaaaa ttacagcatt 360 ccctgtccct tcttagtgat atagaactcc atccccttcc accatcaaac ctagcttaag 420 ctctggtaaa tgatccagcc agtctgcttc ccaaaactct tgctcagttg cattctatct 480 gatgcctaca tgcccaacac cttcaaggcc tgtccaagat c 521 <210> 45 <211> 505 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA5, Z chromosome, "Left arm" <400> 45 gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 60 gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 120 aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 180 gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 240 acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 300 agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 360 atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 420 ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 480 ggcatggcat ggtcagtgac accca 505 <210> 46 <211> 599 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA5, Z chromosome, "Right arm" <400> 46 ctgccagagc agagggctgc tgaaacgccg agtgccaact gacactgttc agctgacagc 60 ctcacgagag tgctgcgagg gttaagtgag gcaacaaaat acaagtactc aaaaatagaa 120 tggaatggaa tggaataaca gagggaatgg ggaacaggct gcagtgagaa ggaaaccccc 180 gtgcaccgac caacccgctc ccagtagcct ggtccctacc ttgccccact ccagcagctc 240 cacgaggtac tcgaagtgcc catgtccggc catccccagc atggcacagc tgtcacctgg 300 gagcagcggg ggtccggcag gcatcgccgg cacccacagc ctgggctggg ctgaggatgg 360 gcttggtggg cagctgggtg ctgccgtggc agctgagtgc cgtcgtgcag gtgggctcgg 420 tgctctctgc agcccacggc tcgggacccg tggtgggcat actgctgggc aaggggacgg 480 ctcggatgtg catcccagag cagggtgcat gatgtgtgcg cagcggcaca cagcagcgca 540 cttgtccccg aggcaccacc cggtctgatg aaattccagg ttttgtttaa gatgaaaat 599 <210> 47 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA6, Z chromosome, "Left arm" <400> 47 ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 60 cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 120 atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 180 ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 240 tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 300 gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 360 atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 420 ttcccacact gcttttctgc aaatggatta gga 453 <210> 48 <211> 439 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA6, Z chromosome, "Right arm" <400> 48 gggaccatca ctcacttcct aggccatgct tcgtagttta actccatgca aggtattttc 60 ttgctctgat ctaactctag atcactaaat ggcacttgtg caggacactt ttccactgtc 120 attttggggg gtagaagtgt ggtcagagcc agggaggctt gcagggccca caccagctgt 180 ggcccaagca gctgctgtac aatggctgta tggcagtatc gatgtgaact tcctgataat 240 aaacagaact cagcagcaaa taaacccaga ttgttctgat cagtaacgag aggctgtgca 300 aaaagctgag aaatgtacag cccttcctgc tcaccactac agcccttcat gcagcggcct 360 gctgcactag ggcctgcttg gccagaggca gggctgcagc ttgagatacg cagcacccag 420 taccccagca ggctgccat 439

Claims (50)

  1. (a) 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 형질전환 조류 동물을 제공/얻는 단계;
    (b) 상기 형질전환 조류 피험자, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 얻는 단계;
    (c) 적어도 하나의 검출 가능한 신호가 검출되는지 여부를 상기 알에서 결정하는 단계로서, 상기 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타냄으로써, 조류 배아에서의 상기 W 염색체 또는 Z 염색체의 존재를 나타내는 것을 특징으로 하는, 단계;를 포함하는,
    조류의 수정된 부화되지 않은 알의 성별 결정 방법.
  2. 제 1항에 있어서, 상기 적어도 하나의 형질전환 조류 피험자는 적어도 2개의 상이한 리포터 유전자를 포함하고, 각각의 리포터 유전자는 성 염색체 Z 또는 W 중 하나에서 적어도 하나의 유전자좌에 통합되는 것을 특징으로 하는, 방법.
  3. 제 1항 및 제 2항 중 어느 한 항에 있어서, 상기 리포터 유전자는 적어도 하나의 생체발광 리포터 유전자인 것을 특징으로 하는, 방법.
  4. 제 3항에 있어서, 상기 리포터 유전자는 루시퍼라제인 것을 특징으로 하는, 방법.
  5. 제 1항, 제 3항 및 제 4항 중 어느 한 항에 있어서, 상기 방법은 단계 (c)에서 검출된 상기 검출 가능한 신호의 형성을 위해, 단계 (b)의 상기 알에, 상기 생체발광 리포터 유전자와 조화되는 기질 및 효소 중 적어도 하나를 제공하는 단계를 더 포함하는 것을 특징으로 하는, 방법.
  6. 제 1항에 있어서, 상기 적어도 하나의 형질전환 조류 피험자, 특히 동물은 암컷 조류 동물이고, 상기 적어도 하나의 리포터 유전자는 암컷 염색체 Z의 적어도 하나의 위치에 통합되어, 검출 가능한 신호의 검출이 상기 부화되지 않은 알에서의 상기 배아가 수컷임을 나타내는 것을 특징으로 하는, 방법.
  7. 제 1항에 있어서, 상기 적어도 하나의 형질전환 조류 피험자, 특히 동물은 암컷 조류 동물이고, 상기 적어도 하나의 리포터 유전자는 암컷 염색체 W의 적어도 하나의 위치에 통합되어, 검출 가능한 신호의 검출이 상기 부화되지 않은 알에서의 상기 배아가 암컷임을 나타내는 것을 특징으로 하는, 방법.
  8. 제 1항에 있어서, 상기 적어도 하나의 리포터 유전자는 적어도 하나의 PEN (programmable engineered nuclease)을 이용하여 상기 형질전환 조류 피험자, 특히 동물의 상기 성 염색체에 통합되는 것을 특징으로 하는, 방법.
  9. 제 8항에 있어서, 상기 PEN은 CRISPR (clustered regularly interspaced short palindromic repeats) 제 II 형 시스템인 것을 특징으로 하는, 방법.
  10. 제 9항에 있어서, 상기 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/CRISPR-관련 엔도뉴클레아제 9 (Cas9) 시스템에 의해 매개되는 HDR (homology directed repair)에 의해 상기 형질전환 조류 동물의 상기 성 염색체에 통합되는 것을 특징으로 하는, 방법.
  11. 제 10항에 있어서, 상기 적어도 하나의 리포터 유전자는 상기 조류 동물의 적어도 하나의 세포 또는 상기 조류 동물에 도입된 적어도 하나의 세포를, (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열과 함께, 공-형질감염시킴으로써 상기 형질전환 조류 동물의 성 염색체에 통합되는 것을 특징으로 하는, 방법.
  12. 제 11항에 있어서, 상기 제 2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 통합 부위에서 HDR에 대한 상동 암(homologous arms)에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 방법.
  13. 제 11항 및 제 12항 중 어느 한 항에 있어서, 상기 제 2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 성 특이적 프로모터, 배아 특이적 프로모터 및 유도성 프로모터 중 어느 하나에 작동가능하게 연결되는 것을 특징으로 하는, 방법.
  14. 제 11항 내지 제 13항 중 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자는 상기 성 염색체의 적어도 하나의 비-코딩 영역에 통합되는 것을 특징으로 하는, 방법.
  15. 제 14항에 있어서, 상기 적어도 하나의 리포터 유전자는 성 W 염색체 유전자좌 1022859-1024215의 적어도 하나의 부위에 통합되는 것을 특징으로 하는, 방법.
  16. 제 11항 및 제 15항 중 어느 한 항에 있어서, 상기 적어도 하나의 gRNA는 서열번호 1 및 2 중 어느 하나로 표시되는 핵산 서열을 포함하는 것을 특징으로 하는, 방법.
  17. 제 16항에 있어서, 상기 gRNA는 서열번호 1로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 방법.
  18. 제 16항에 있어서, 상기 gRNA는 서열번호 2로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 방법.
  19. 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 조류의 형질전환 동물.
  20. 제 19항에 있어서, 상기 적어도 하나의 형질전환 동물은 적어도 2개의 상이한 리포터 유전자를 포함하고, 각각의 리포터 유전자는 성 염색체 Z 또는 W 중 하나에서 적어도 하나의 유전자좌에 통합되는 것을 특징으로 하는, 형질전환 동물.
  21. 제 19항 및 제 20항 중 어느 한 항에 있어서, 상기 리포터 유전자는 적어도 하나의 생체발광 리포터 유전자인 것을 특징으로 하는, 형질전환 동물.
  22. 제 21항에 있어서, 상기 리포터 유전자는 루시퍼라제인 것을 특징으로 하는, 형질전환 동물.
  23. 제 19항에 있어서, 상기 적어도 하나의 형질전환 조류 동물은 암컷이고, 상기 적어도 하나의 리포터 유전자는 암컷 염색체 Z의 적어도 하나의 위치에 통합되는 것을 특징으로 하는, 형질전환 동물.
  24. 제 19항에 있어서, 상기 적어도 하나의 형질전환 조류 동물은 암컷이고, 상기 적어도 하나의 리포터 유전자는 암컷 염색체 W의 적어도 하나의 위치에 통합되는 것을 특징으로 하는, 형질전환 동물.
  25. 제 19항에 있어서, 상기 적어도 하나의 리포터 유전자는 적어도 하나의 PEN을 이용하여 상기 형질전환 동물의 상기 성 염색체에 통합되는 것을 특징으로 하는, 형질전환 동물.
  26. 제 25항에 있어서, 상기 PEN은 CRISPR 제 II 형 시스템인 것을 특징으로 하는, 형질전환 동물.
  27. 제 26항에 있어서, 상기 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/Cas9 시스템에 의해 매개되는 HDR에 의해 상기 형질전환 조류 동물의 상기 성 염색체에 통합되는 것을 특징으로 하는, 형질전환 동물.
  28. 제 27항에 있어서, 상기 적어도 하나의 리포터 유전자는 상기 조류 동물의 적어도 하나의 세포 또는 상기 조류 동물에 도입된 적어도 하나의 세포를, (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 gRNA를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열과 함께, 공-형질감염시킴으로써 상기 형질전환 조류 피험자, 특히 동물의 성 염색체에 통합되는 것을 특징으로 하는, 형질전환 동물.
  29. 제 28항에 있어서, 상기 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 통합 부위에서 HDR에 대한 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 형질전환 동물.
  30. 제 28항 및 제 29항 중 어느 한 항에 있어서, 상기 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이적 프로모터, 배아 특이적 프로모터 및 유도성 프로모터 중 어느 하나에 작동가능하게 연결되는 것을 특징으로 하는, 형질전환 동물.
  31. 제 28항 내지 제 30항 중 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자는 상기 성 염색체의 적어도 하나의 비-코딩 영역에 통합되는 것을 특징으로 하는, 형질전환 동물.
  32. 제 31항에 있어서, 상기 적어도 하나의 리포터 유전자는 성 W 염색체 유전자좌 1022859-1024215의 적어도 하나의 부위에 통합되는 것을 특징으로 하는, 형질전환 동물.
  33. 제 28항 및 제 32항 중 어느 한 항에 있어서, 상기 적어도 하나의 gRNA는 서열번호 1 및 2 중 어느 하나로 표시되는 핵산 서열을 포함하는 것을 특징으로 하는, 형질전환 동물.
  34. 제 33항에 있어서, 상기 gRNA는 서열번호 1로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 형질전환 동물.
  35. 제 33항에 있어서, 상기 gRNA는 서열번호 2로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 형질전환 동물.
  36. 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는, 세포.
  37. 제 36항에 있어서, 상기 세포는 조류 세포인 것을 특징으로 하는, 세포.
  38. 제 37항에 있어서, 상기 조류 세포는 원시 생식 세포 (PGC)인 것을 특징으로 하는, 세포.
  39. 제 36항 내지 제 38항 중 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자는 상기 세포를, (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열과 함께, 공-형질감염시킴으로써 상기 세포의 성 염색체에 통합되는 것을 특징으로 하는, 세포.
  40. 제 39항에 있어서, 상기 제 2 핵산 서열의 적어도 하나의 리포터 유전자는 통합 부위에서 HDR에 대한 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 세포.
  41. 제 39항 및 제 40항 중 어느 한 항에 있어서, 상기 gRNA는 서열번호 1로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 세포.
  42. 제 39항 및 제 40항 중 어느 한 항에 있어서, 상기 gRNA는 서열번호 2로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 세포.
  43. (a) 적어도 하나의 Cas9 단백질을 인코딩하는 적어도 하나의 핵산 서열 및 적어도 하나의 가이드 RNA (gRNA)를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제 1 핵산 서열; 및
    (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제 2 핵산 서열;을 포함하는, 키트.
  44. 제 43항에 있어서, 상기 제 2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 통합 부위에서 HDR에 대한 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 키트.
  45. 제 43항 및 제 44항 중 어느 한 항에 있어서, 상기 제 2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 성 특이적 프로모터, 배아 특이적 프로모터 및 유도성 프로모터 중 어느 하나에 작동가능하게 연결되는 것을 특징으로 하는, 키트.
  46. 제 43항 내지 제 45항 중 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자는 상기 성 염색체의 적어도 하나의 비-코딩 영역에 통합되고, 상기 적어도 하나의 gRNA는 서열번호 1 및 2 중 어느 하나로 표시되는 핵산 서열을 포함하는 것을 특징으로 하는, 키트.
  47. 제 46항에 있어서, 상기 gRNA는 서열번호 1로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 각각 서열번호 4 및 5로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 키트.
  48. 제 46항에 있어서, 상기 gRNA는 서열번호 2로 표시되는 핵산 서열을 포함하고, 상기 제 2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 각각 서열번호 6 및 7로 표시되는 아미노산 서열을 포함하는 상동 암에 의해 이의 5' 및 3'의 측면에 위치하는 것을 특징으로 하는, 키트.
  49. 제 43항 내지 제 48항 중 어느 한 항에 있어서, 상기 리포터 유전자는 적어도 하나의 생체발광 리포터 유전자인 것을 특징으로 하는, 키트.
  50. 제 43항 내지 제 49항 중 어느 한 항에 있어서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 형질전환 조류 동물의 제조에 사용하기 위한, 키트.
KR1020187018773A 2015-12-03 2016-12-01 부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단 KR20180099704A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562262409P 2015-12-03 2015-12-03
US62/262,409 2015-12-03
PCT/IL2016/051291 WO2017094015A1 (en) 2015-12-03 2016-12-01 Methods for gender determination of avian embryos in unhatched eggs and means thereof

Publications (1)

Publication Number Publication Date
KR20180099704A true KR20180099704A (ko) 2018-09-05

Family

ID=58796444

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187018773A KR20180099704A (ko) 2015-12-03 2016-12-01 부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단

Country Status (9)

Country Link
US (1) US20190029236A1 (ko)
EP (1) EP3384051A4 (ko)
JP (1) JP2019505175A (ko)
KR (1) KR20180099704A (ko)
CN (1) CN108474034A (ko)
CA (1) CA3007066A1 (ko)
HK (1) HK1257753A1 (ko)
IL (2) IL259721B (ko)
WO (1) WO2017094015A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018216022A1 (en) * 2017-05-25 2018-11-29 Eggxyt Ltd Methods for gender determination of avian embryos in unhatched eggs and means thereof
EP3630981A4 (en) * 2017-05-31 2021-03-03 Commonwealth Scientific and Industrial Research Organisation CHARACTERISTICS SELECTION IN BIRDS
EA202090585A1 (ru) * 2017-09-19 2020-07-08 Дзе Стэйт Оф Исраэль, Министри Оф Эгрикалчур Энд Рурал Девелопмент, Эгрикалчурал Ресерч Организэйшн (Аро) (Волкани Сентер) Птицы с отредактированным геномом
CN107760715B (zh) * 2017-10-17 2021-12-10 张业胜 一种转基因载体及其构建方法和应用
US20200329685A1 (en) * 2018-01-04 2020-10-22 Ramot At Tel-Aviv University Ltd. Transgenic eukaryotic organisms and methods for gender selection
DE102018105512A1 (de) 2018-03-09 2019-09-12 Technische Universitaet Dresden Verfahren zur in-ovo fertilisations- und geschlechtsbestimmung am geschlossenen ei
EP3599465A1 (en) * 2018-07-24 2020-01-29 Tronico Method for determining a specific characteristic of an embryo in an unhatched egg
CN109402244B (zh) * 2018-12-20 2022-05-03 广西大学 一种哺乳动物胚胎性别鉴定方法
CN111073963B (zh) * 2019-12-10 2023-04-14 南京农业大学 一种一日龄鉴别鸡受精蛋性别的方法
CN114793988B (zh) * 2022-04-19 2023-01-17 中国科学院海洋研究所 一种基于形态学鉴定孔鳐受精卵的方法
CN115960945A (zh) * 2022-12-05 2023-04-14 天津科技大学 蓝光诱导酿酒酵母定点dsb系统的构建

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124456A (ja) 1992-10-09 1994-05-06 Sony Corp 光学ピックアップ装置
WO1996039505A1 (en) 1995-06-06 1996-12-12 Isis Innovation Limited Avian ghd genes and their use in methods for sex identification in birds
WO1997049806A1 (en) 1996-06-21 1997-12-31 The University Of Melbourne Sexing gene
US6244214B1 (en) 1999-01-06 2001-06-12 Embrex, Inc. Concurrent in ovo injection and detection method and apparatus
WO2010103111A1 (en) 2009-03-13 2010-09-16 Van De Ven Beheer B.V. Method for avian sex determination
US20140069336A1 (en) 2012-08-31 2014-03-13 Mat Malta Advanced Technologies Limited Spectrophotometric analysis of embryonic chick feather color
US20140296707A1 (en) 2010-12-27 2014-10-02 Marc Massonneau Luminescent composition as biomarker in a bird's egg, correspondence device and method
WO2016005539A1 (fr) 2014-07-11 2016-01-14 Tronico Dispositif non invasif de détermination de la fertilité et/ou du sexe d'un oeuf, et procédé correspondant

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2264450A1 (en) * 1998-03-05 1999-09-05 Andras Nagy Methods for monitoring heterologous sex chromosomes
GB0218955D0 (en) * 2002-08-14 2002-09-25 Roslin Inst Edinburgh Avian sex determination method
US20120227119A1 (en) * 2008-12-17 2012-09-06 Australian Poultry Crc Pty Ltd Methods of Modulating the Sex of Avians
AU2010210315A1 (en) * 2009-02-08 2011-08-18 Murdoch Childrens Research Institute Sex-determination and methods of specifying same
UA118544C2 (uk) * 2012-07-30 2019-02-11 Ін Ово Б.В. Спосіб визначення статі, життєздатності та/або стадії розвитку пташиних ембріонів у яйці

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124456A (ja) 1992-10-09 1994-05-06 Sony Corp 光学ピックアップ装置
WO1996039505A1 (en) 1995-06-06 1996-12-12 Isis Innovation Limited Avian ghd genes and their use in methods for sex identification in birds
WO1997049806A1 (en) 1996-06-21 1997-12-31 The University Of Melbourne Sexing gene
US6244214B1 (en) 1999-01-06 2001-06-12 Embrex, Inc. Concurrent in ovo injection and detection method and apparatus
WO2010103111A1 (en) 2009-03-13 2010-09-16 Van De Ven Beheer B.V. Method for avian sex determination
US20140296707A1 (en) 2010-12-27 2014-10-02 Marc Massonneau Luminescent composition as biomarker in a bird's egg, correspondence device and method
US20140069336A1 (en) 2012-08-31 2014-03-13 Mat Malta Advanced Technologies Limited Spectrophotometric analysis of embryonic chick feather color
WO2016005539A1 (fr) 2014-07-11 2016-01-14 Tronico Dispositif non invasif de détermination de la fertilité et/ou du sexe d'un oeuf, et procédé correspondant

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Cong, L., & Zhang, F. (2015). Genome engineering using CRISPR-Cas9 system. Chromosomal Mutagenesis, 197-217.
Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J. A., & Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science, 337(6096), 816-821.
Quansah, E., Long, J.A., Donovan, D.M., Becker, S.C., Telugu, B., Foster Frey, J.A., Urwin, N. 2014. Sperm-mediated transgenesis in chicken using a PiggyBac transposon system. Poultry Science Association Meeting Abstract. BARC Poster Day.

Also Published As

Publication number Publication date
CA3007066A1 (en) 2017-06-08
IL259721B (en) 2021-12-01
CN108474034A (zh) 2018-08-31
US20190029236A1 (en) 2019-01-31
HK1257753A1 (zh) 2019-10-25
EP3384051A1 (en) 2018-10-10
IL288409A (en) 2022-01-01
JP2019505175A (ja) 2019-02-28
WO2017094015A1 (en) 2017-06-08
EP3384051A4 (en) 2019-04-24
IL259721A (en) 2018-07-31

Similar Documents

Publication Publication Date Title
KR20180099704A (ko) 부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단
CN110066775A (zh) 用于切割靶dna的组合物及其用途
JP6004290B2 (ja) 不活化された内因性遺伝子座を有するトランスジェニックニワトリ
CN110891418B (zh) 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具
JP6923232B2 (ja) 遺伝子改変家禽卵
CN111808887B (zh) 一种制备与自然突变比利时蓝牛类似的双肌臀肉牛的方法
JPWO2005003342A1 (ja) メチル化を利用したトランスジェニック生物を作製する方法およびシステム
Mukae et al. Production and characterization of eggs from hens with ovomucoid gene mutation
CN104334017B (zh) 尿激酶型纤溶酶原激活剂转基因小鼠
US20200149063A1 (en) Methods for gender determination and selection of avian embryos in unhatched eggs
CN110430899A (zh) 光感受灵敏度的抑制或减弱剂
KR20020057943A (ko) 트랩 벡터 및 이를 이용한 유전자 트랩법
WO2022101918A1 (en) Genetically edited albino-red germlines of tilapia fish
Miura et al. Transfer of spermatogenesis‐related cDNAs into eel testis germ‐somatic cell coculture pellets by electroporation: Methods for analysis of gene function
CN109735501A (zh) 敲除zDHHC17基因的N2a细胞系及其构建方法和试剂盒
KR101724805B1 (ko) 유전자 적중 물질을 이용한 조류 유전자 편집방법 및 유전자 편집 조류
WO2021171688A1 (ja) 遺伝子ノックイン方法、遺伝子ノックイン細胞作製方法、遺伝子ノックイン細胞、がん化リスク評価方法、がん細胞製造方法、及びこれらに用いるためのキット
US20240000051A1 (en) Influenza a-resistant animals having edited anp32 genes
TWI396742B (zh) 新穎啟動子片段及其應用
OA19682A (en) Methods for gender determination of avian embryos in unhatched eggs and means thereof.
US20060172297A1 (en) Enhancers specific to motor nerve cells/sensory nerve cells
JP2002291471A (ja) 酵母における相同的組換えを使用する遺伝子ターゲッティングベクターの迅速創出

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application