KR20200018486A

KR20200018486A - 부화되지 않은 알에서 조류 배아의 성 감별을 위한 방법 및 이의 수단

Info

Publication number: KR20200018486A
Application number: KR1020197038050A
Authority: KR
Inventors: 다니엘 오펜
Original assignee: 이지지엑스와이티 리미티드
Priority date: 2017-05-25
Filing date: 2018-05-24
Publication date: 2020-02-19
Also published as: CN114836475A; CN110891418B; MA48783A; AU2018274769B2; CU20190094A7; BR112019024642A2; AU2018274769A1; EP3629719C0; PL3629719T3; WO2018216022A1; CN110891418A; JP2020520669A; JP7179776B2; CA3064825A1; PH12019502663A1; SG11201911686YA; US20200283849A1; CL2019003414A1; CR20190569A; ECSP19087406A

Abstract

본 발명은 조류 대상체에서의 수정 및 성 감별 및 식별 방법에 관한 것이다. 보다 구체적으로, 본 발명은 적어도 하나의 성 염색체 Z 또는 W에 통합된 적어도 하나의 리포터 유전자, 구체적으로 RFP를 포함하는 유전자이식 조류 동물을 사용하는 비-침습적 방법을 제공한다. 본 발명의 유전자이식 조류 동물은 부화되지 않은 조류 알에서 배아의 성 감별 및 선택에 사용된다.

Description

부화되지 않은 알에서 조류 배아의 성 감별을 위한 방법 및 이의 수단

본 발명은 조류 대상체에서 성 감별 및 식별의 방법에 관한 것이다. 보다 구체적으로, 본 발명은 부화되지 않은 조류 알에서 배아의 성 감별 및 선택을 위한 비-침습적 방법 및 유전자이식 조류 동물을 제공한다.

본원에 개시된 주제에 대한 배경으로서 관련된 것으로 간주되는 참고 문헌이 아래에 열거되어 있다:

· WO 2010/103111

· WO 2014/0296707

· US 6244214

· 06124456A2

· US2014069336A

· WO16005539

· WO 96/39505

· WO 97/49806

· Quansah, E., Long, J.A., Donovan, D.M., Becker, S.C., Telugu, B., Foster Frey, J.A., Urwin, N. (2014). Sperm-mediated transgenesis in chicken using a PiggyBac transposon system. Poultry Science Association Meeting Abstract. BARC Poster Day.

· Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J. A., & Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.　Science,　337(6096), 816-821.

· Cong, L., & Zhang, F. (2015). Genome engineering using CRISPR-Cas9 system.　Chromosomal Mutagenesis, 197-217.

· US 특허 6, 244,214.

· WO 2014/0296707.

· WO 06124456A2;

· WO16005539.

· Veron N., Qu Z., Kipen PA., Hirst CE., Marcelle C. (2015). CRISPR mediated somatic cell genome engineering in the chicken. Dev. Biol. 407(1):68-74. doi: 10.1016/j.ydbio.2015.08.007. Epub 2015 Aug 13.

· CA2264450.

· Niu, Y., B. Shen, Y. Cui, Y. Chen, J. Wang et al., (2014). Generation of genemodified cynomolgus monkey via cas9/rna-mediated gene targeting in one-cell embryos. Cell, 156(4): 836-843.

· Hwang, W. Y., Y. Fu, D. Reyon, M. L. Maeder, S. Q. Tsai et al., (2013). Efficient genome editing in zebrafish using a CRISPR-Cas system. Nat. Biotechnol. 31(3): 227-229.

· Nadege, V., Q. Zhengdong, P. A. S. Kipen, C. E. Hirst, M. Christophe et al., (2015). CRISPR mediated somatic cell genome engineering in the chicken. Dev. Biol. 407(1): 68-74.

· Bai, Y., L. He, P. Li, K. Xu, S. Shao et al., (2016). Efficient genome editing in chicken DF-1 cells using the CRISPR/Cas9 system. G3 (Bethesda) pii: g3.116.027706.

· Doran T. et al., (2016). Sex selection in layer chickens. ASAP Animal Production, Adelaide.

· Tizard M. and Doran T. (2014). Precision genome engineering in the chicken: Th gap between science and market place. A presentation at IWRAB-II, in Brasilia.

본원에서 상기 참고문헌의 확인은 이들이 본원에 개시된 주제의 특허성과 어떠한 방식으로든 관련이 있음을 의미하는 것으로 해석되지 않아야 한다.

발명의 배경

식품 산업에서, 병아리는 질식 또는 분쇄를 통해 매일 수십억 마리가 도축된다. 수컷은 알을 낳거나 고기로 빵을 만드는데 유용하지 않기 때문에 폐기되고 약하거나 건강하지 못한 암컷도 폐기된다. 따라서 부화 전에 in-ovo, 또는 배아 성-감별을 위한 방법은 윤리적 및 경제적 고려사항 둘 다로 인해 매우 바람직하다.

구체적으로, 가금류 수정란을 육안으로 식별하는 것은 무정란을 제거하여 (무정란 부화를 방지함으로써) 부화 비용을 절약하고, 수정란과 함께 이러한 오염되기 쉬운 무정란의 배양의 지속에 관련된 생물보안 위험을 낮추는데 중요하다.

부화되지 않은 알 내부에 있는 동안 배아의 초기 단계에서 알 수정력을 육안으로 식별하는 것은 외부 광원 검란 (candling)을 수반하며 초기 배아 단계에서는 어렵고 사실상 불가능할 수 있다. 더 큰 도전은 배아의 성별을 식별하는 것이며, 수정이 된 부화되지 않은 알에서 수컷과 암컷을 구별하기 위한 이용 가능한 방법은 현재 없다. 그러나, 초기 배아 단계에서의 수정력의 확인 및 가금류의 성 감별은 조류사육, 과학적 연구, 및 보호를 위해 필수적이다. 형태학적 특징에 의한 어린 새에서의 성 감별은 대부분의 종에 대해 극히 어려운 일이다. 성별은 병아리에서 배설물을 손으로 짜냄을 포함하는 개별 항문 감별 (vent sexing)에 의해 감별될 수 있으며, 이것은 병아리의 항문을 약간 열어서, 병아리가 작은 "돌기(bump)"를 가지고 있는지 확인하며, 이 돌기는 병아리가 수컷임을 나타낸다. 그러나, 이 방법은 훈련된 개인에 의해 수동으로 수행하는 번거로운 작업과 함께 높은 조류 부상 위험 및 성 결정 실수를 나타낸다.

항문 감별 또는 병아리 감별은 통상적으로 병아리 감별사 또는 닭 감별사라고 불리는 숙련된 사람에 의해 닭 및 다른 부화유생의 성별을 구별하는 방법이다. 닭 감별은 주로 대형 상업적 부화장에 의해 실행되는데, 이들은 성별을 성별 그룹으로 분리하기 위해 및 원하는 그룹의 성장과 상업적 요구를 충족시키지 못하는 원치않는 그룹의 도축을 포함할 수 있는 다른 프로그램으로 이들을 가져오기 위해 성별의 차이를 알아야 한다. 예를 들어, 수컷은 에그 레이어 (egg layer) 상업 품종 라인에서 나온 알에서 부화하였다. 그 수컷은 육류 생산량이 많지 않고 알을 낳지 않으며, 따라서 암수감별 후에 도축될 것이다. 암수감별시, 관련 성별은 목적을 달성하는 과정을 계속하는 반면, 다른 성별 또는 이의 대부분은 산란과 관계없는 부화의 날짜 이내에 도축될 것이다.

알을 생산하는 농장에서, 수컷은 원치 않으며, 원치 않는 성별의 병아리는 사육자에 비용을 절감하기 위해 거의 즉시 죽는다. 병아리는 컨베이어 벨트 아래로 이동되며, 여기서 병아리 감별사가 수컷을 분리하여 이들을 활송장치(chute)로 던져 넣고, 여기서 이들은 통상적으로 산채로 고기 분쇄기에서 분쇄된다.

부화 전에 알의 수정력 및 알에서 배아의 성별을 확인하고 감별하면, 알에 있는 동안 무정란 및 원치 않는 유형의 배아를 제거할 수 있고, 따라서 (대기 오염 및 에너지 소비와 함께 에너지 및 효율 비용을 포함한) 부화 비용을 대단히 줄일 수 있을 것이다. 또한, 병아리의 고통은 멈추고 도축으로부터의 오염이 예방될 것이다. 자동 암수감별 장치는 병아리 감별사의 필요성을 제거함으로써 산란 비용을 절감할 뿐만 아니라 초기 단계에서 알의 50%가 공정에서 공제되어 감소되기 때문에 필요한 부화장의 크기를 줄이고, 따라서 이러한 알을 부화시키는 비용, 및 나중에 정교한 도살 절차에 대한 필요를 줄일 것이다.

육종, 산란, 또는 육 생산을 목적으로 한 모든 상업적 유형의 조류에서는, 수정력 및 배아의 성별을 감별해야 할 필요성이 있다. 에너지 절약, 생물보안 위험 감소, 쓰레기 처리, 감별 노동 비용 및 감별 오류, 도축 비용 및 처리, 및 동물 복지에 있어서 큰 경제적 수익이 있다.

제WO 2010/103111호는 그 중에서도 배아 상의 성별-특이 항원과 일치하도록 특별히 설계된 표지된 항체를 알에 도입하는 일련의 단계들을 포함하는 침습적 방법을 기술한다.

제WO 2014/0296707호는 새의 알에 주사되는 백신접종의 효율을 정량 또는 평가하기 위한 바이오마커로서 기능하도록 설계된 휘도 조성물을 기술한다. 본 개시내용에는 성 감별이 기술되거나 심지어 암시되지도 않는다. In-ovo 주사 장치 및 검출 방법은 미국 특허 제6,244,214호에 의해 개시되었다.

제WO 06124456A2호는 조류 알로부터의 배아 액 (예를 들어, 요막액 또는 혈액)의 샘플에서 에스트로겐 스테로이드 화합물의 존재를 결정함으로써 조류 배아의 in-ovo 성 감별의 침습적 방법을 개시한다. 화합물의 존재를 결정하는 것은 상기 조류 알로부터 수득된 샘플에서 분석물을 형광 현미경을 이용한 경쟁적 면역분석에 의해 측정함으로써 수행된다.

분광학적 접근법이 또한 기술되었으며, 이들 중에는 조류 배아 깃털 색을 스크리닝 (부하전)하고 깃털 색에 기초하여 조류 배아의 성별을 감별하는 것에 기반하는 제US2014069336A호, 또는 입사광 신호에 대한 껍질-특이 스펙트럼 반응을 수득하는 장치를 개시하는 제WO16005539호가 있다.

난내(in ovo) 암수감별을 해결하는 추가의 유전자 접근법은 새의 Z 및 W 염색체에 위치한 두 개의 특정 유전자를 검출하기 위한 수정란에서 얻은 DNA 샘플의 DNA 서열분석 (제WO 96/39505호), 또는 암컷 W 염색체의 특정 서열에 혼성화하는 올리고뉴클레오티드 프로브의 사용 (제WO 97/49806호)을 포함한다. 이러한 방법은 침습적이며 따라서 안전한 전략을 제공하지 않는다.

주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR)/CRISPR-연관된 (Cas) 시스템은 높은 성공률로 간단한 작제물 설계를 가능하게 하는 최신식 유전자 편집 시스템이다 (M. Jinek, 2012).

Niu 등 (2014)은 가이드 RNA (gRNA) 및 Cas9 RNA를 원숭이 난모세포에 주사하여 3개의 표적 유전자를 변형시켰고, Hwang 등 (2013)은 제브라피쉬 배아에서 drd3 및 gsk3b 유전자를 변형시켜 2-유전자좌(locus) 돌연변이체를 수득하였다. Cong 및 Zhang (2015)은 살아있는 세포에서 임의의 유전자를 편집하기 위해 CRISPR 시스템을 변형시켰다.

Veron 및 동료들 (2015)은 닭 배아에서 체세포의 발현 수준이 PAX7 전사 인자에 대해 지시된 CRISPR gRNA 플라스미드의 전기천공에 의해 변형되었음을 입증하였고 (Nadege et al. 2015), Bai 및 동료들은 PPAR-g, ATP 신타제 엡실론 서브유닛 (ATP5E)을 편집하였다.

Quansah, E. 등은 PiggyBac 트랜스포손 시스템을 사용하여 닭에서 정자 매개된 유전자이식을 개시하였다. 특히, 이들은 aGFP 플라스미드 및 리포펙타민 LTXTM 9LPX) 조합은 닭 정자의 생존성, 이동성 또는 수정력에 영향을 미치지 않았다고 개시한다.

제CA2264450호는 다능성 세포를 사용하여 생산된 세포 배아 및 유전자이식 동물에서 이종 성 염색체에 선택적으로 통합된 형광 단백질 마커를 암호화하는 핵산 서열을 포함하는 다능성 세포 및, 이러한 세포, 배아, 및 동물의 용도를 개시한다. 이 공보는 특히 포유동물 세포에서의 GFP에 관한 것이다.

Doran T. 등은 ASAP Animal Production 2016, Adelaide에서 생물학적 마커인 GFP 리포터 유전자(reporter gene)를 성 염색체에 부가함으로써 부화전 수컷과 암컷을 구별하는 전략을 일반적으로 기술한다. CRISPR 기술을 사용한 병아리의 성 염색체에의 GFP 리포터 유전자의 통합은 2014년 브라질리아의 IWRAB-II에서의 발표에서 기술되었다. 그러나, 이러한 일반 공보에서는 표지화된 염색체가 알을 UV 광선에 노출시킴으로써 난내 가시화된다고 개시하지만, 알의 자가-형광 (auto-fluorescence)으로 인해, 어떠한 검출 가능한 신호도 예상되지 않는다.

따라서, 병아리의 부화 이전에 알 단계 동안 성 식별을 위한 효과적이고 비침습적인 방법은 현재 이용 가능하지 않다. 따라서, 부화되지 않은 알에서 배아의 정확하고 안전한 성 식별을 가능하게 하는 방법이 오랫동안 필요한 것으로 느껴지고 있다.

본 발명의 제1 측면은 부화되지 않은 알, 특히 수정된 부화되지 않은 알에서 조류, 또는 조류 배아의 성 감별의 방법에 관한 것이다. 일부 특정 실시양태에서, 방법은 다음의 단계를 포함할 수 있다:

첫째, 단계 (a)에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본원에서는 유전자좌라고도 함)에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계. 두 번째 단계 (b)에서, 유전자이식 조류 대상체 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계.

다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 조류 배아에서 W 염색체 또는 Z 염색체의 존재를 나타낸다. 일부 특정 실시양태에서, 통합된 리포터 유전자는 적색 형광 단백질 (RFP)을 암호화할 수 있다.

제2 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를, 이의 적어도 하나의 세포에, 포함하는 조류 유전자이식 동물에 관한 것이다. 일부 특정 실시양태에서, 통합된 리포터 유전자는 RFP를 암호화할 수 있다.

또 다른 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포에 관한 것이다.

추가의 측면에서, 본 발명은 다음을 포함하는 키트(kit)를 제공한다:

(a) 적어도 하나의 Cas9 단백질 또는 이의 임의의 단편 또는 유도체, 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 성 염색체 Z 또는 W 내에 위치한 적어도 하나의 프로토스페이서(protospacer)를 표적화하는 적어도 하나의 가이드 RNA (gRNA)를 암호화하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열.

여전히 추가로, 본 발명은 부화되지 않은 알에서 수정을 감별 및 검출하는 방법을 제공한다. 보다 구체적으로, 이러한 방법은 다음의 단계를 포함한다:

첫째, 단계 (a)에서, 암컷 대상체의 경우에는 성 염색체 Z 및 W 둘 다에서 적어도 하나의 위치 또는 장소에 및 수컷에서는 성 염색체 Z 둘 다에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계. 제2 단계 (b)에서 유전자이식 조류 대상체 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계. 다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 (암컷의 경우에 표지된 모계 W 염색체 또는 Z 염색체 또는 조류 배아에서 표지된 부계 Z 염색체의 존재를 나타낸다.

본 발명의 이들 및 추가의 실시양태는 다음의 도면에 의해 자명해질 것이다.

본원에 개시된 주제를 더 잘 이해하고 이것을 실제로 어떻게 수행할 수 있는지를 예시하기 위해, 실시양태들이 이하에서 첨부 도면을 참조하여 단지 비제한적인 예로서 기술될 것이며, 여기서:
도 1a-1b. 알의 형광을 평가하기 위한 전체 설정
도 1a는 난내 성 감별을 위해 본 발명의 방법에 의해 사용되는 장치의 사진을 보여준다. 전체 설정은 레이저 소스 (h), 레이저 소스 홀더 (g), 알을 위한 스탠드 (e), 알 (f), 렌즈 (d), 필터 (c), 검출기를 위한 스탠드 (b) 및 검출기 (a)로 구성된다. 다른 부품들이 견고한 지지대 (i) 상에 배치된다.
도 1b는 도 1a에 도시된 본 발명의 장치의 개략도를 보여준다. 장치는 레이저 소스 (h), 레이저 소스 홀더 (g), 알을 위한 스탠드 (e), 알 (f), 렌즈 (d), 필터 (c), 검출기를 위한 스탠드 (b) 및 검출기 (a)를 포함한다. 다른 부품들이 견고한 지지대 (i) 상에 배치된다.
도 2. 플루오레세인을 갖거나 갖지 않는 청색 레이저 ( 473 nm )를 사용한 형광 강도
완전한 알을 10μM 또는 1mM 플루오레세인 (fl)을 갖거나 갖지 않는 청색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 3. 로다민을 갖거나 갖지 않는 녹색 레이저 ( 532 nm )를 사용한 형광 강도
완전한 알을 로다민을 갖거나 갖지 않는 녹색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 4. dir을 갖거나 갖지 않는 녹색 레이저 ( 532 nm )를 사용한 형광 강도
완전한 알을 dir을 갖거나 갖지 않는 녹색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 5. dir을 갖거나 갖지 않는 적색 레이저 (632.8 nm)를 사용한 형광 강도
완전한 알을 dir을 갖거나 갖지 않는 적색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 6. GFP를 발현하는 세포
GFP를 발현하는 GFP-벡터로 형질감염된 HEK 세포의 형광 신호를 제공하는 그림.
도 7. RFP를 발현하는 세포
RFP를 발현하는 RFP-벡터로 형질감염된 HEK 세포의 형광 신호를 제공하는 그림.
도 8. 대조군 측정
알의 다른 위치에서 녹색 레이저 및 적색 필터를 사용한 형광 강도. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 9. RFP 측정
녹색 레이저 및 적색 필터를 사용한 상이한 농도의 RFP-발현 세포가 주사된 알의 형광 강도의 측정. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 10. RFP 각도
녹색 레이저 및 적색 필터를 사용한 알의 결정된 최적 위치에서의 여기된 알의 RFP 형광 강도 측정. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 11a-11b. PBS 또는 글리세롤과 RFP-발현 세포
도면은 녹색 레이저를 사용하여 PBS 또는 글리세롤과 상이한 농도의 RFP-발현 세포가 주사된 알의 형광 강도를 보여준다.
도 11a는 PBS에서 함께 상이한 농도의 RFP-발현 세포를 함유하는 알의 형광 강도를 보여준다. 도 11b는 글리세롤에서 상이한 농도의 RFP-발현 세포를 함유하는 알의 형광 강도를 보여준다. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 12. PBS 또는 글리세롤과 GFP-발현 세포
도면은 청색 레이저를 사용하여 PBS 또는 글리세롤과 30,000 GFP-발현 세포가 주사된 알의 형광 강도를 보여준다. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 13. RFP vs. GFP
도면은 GFP-발현 세포 또는 RFP-발현 세포로부터의 형광 단백질 강도 및 자가 형광 강도 사이의 비율을 보여준다.
형광과 자가 형광 사이의 비율을 설명하는 파라미터 R은 광원 강도 [Pin]의 함수로 나타내어진다.
도 14. 암컷 Z 염색체에의 RFP의 통합
도면은 닭 ChZ 좌측 & 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pDsRed를 사용한 RFP 형질감염된 암탉 세포주를 보여준다.
도 15a-15b. 암탉 세포주의 염색체 Z에 통합된 서열의 개략도
볼드체 서열은 Z 염색체의 측면 좌측 및 우측 아암을 나타내고 각각 서열 번호 60 및 서열 번호 61로 표시되며; 이탤릭체로 표시된 서열 (1017bp)은 서열 번호 62로 표시된 바와 같은 좌측 아암을 나타내고; 밑줄친 서열 (629bp)은 서열 번호 63으로 표시된 바와 같은 CMV 인핸서, 프로모터 및 MCS를 나타내고; 굵은 이탤릭체 서열 (714bp)은 서열 번호 64로 표시된 바와 같은 dsRED2 리포터 유전자를 나타내고; 중간색-3332bp를 갖는 서열은 dsRED 플라스미드 함량을 나타내고; 밑줄친 이탤릭체 서열 (1026bp)은 서열 번호 65로 표시된 바와 같은 우측 아암을 나타낸다. 서열의 좌측 부분은 서열 번호 66 (모든 부분은 벡터 서열에 5', 도 15a에 나타냄)로 표시되고 서열의 우측 부분은 서열 번호 67로 표시된다 (모든 부분은 벡터 서열에 3', 도 15b에 나타냄).

매일, 수십억 마리의 수컷 병아리가 이들이 알을 낳거나 고기로 빵을 만드는데 유용하지 않기 때문에 질식 또는 분쇄를 통해 폐기되고 있다. 부화하기 전에 배아의 성별을 감별하는 능력은 윤리적으로나 재정적으로 매우 중요하다.

닭에서 성 염색체의 유전적 구성은 수컷의 경우 ZZ이고 암컷의 경우 ZW이다. 이는 W 염색체가 암컷의 성별을 결정한다는 것을 의미한다. 이것은 수컷 성별을 결정하는 것이 아버지로부터의 Y인 인간과는 다르다.

본 발명은 유전자이식 조류 대상체의 성 특이 염색체에 통합된 리포터 유전자를 사용하여 성을 감별하기 위한 비-침습적인 효율적 방법을 제공한다. 부화되지 않은 알의 배아에서의 이러한 리포터 유전자의 발현은 상기 배아의 성별을 명확하고 정확하게 식별한다.

따라서, 본 발명의 제1 측면은 부화되지 않은 알, 특히 수정된 부화되지 않은 알에서 조류, 또는 조류 배아의 성 감별 및 임의로 선택의 방법에 관한 것이다. 일부 특정 실시양태에서, 방법은 다음의 단계를 포함할 수 있다:

첫째, 단계 (a)에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계. 제2 단계 (b)에서 유전자이식 조류 대상체, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계.

다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 조류 배아에서 W 염색체 또는 Z 염색체의 존재를 나타낸다. 따라서, 리포터 유전자가 암컷 유전자이식 조류의 Z 염색체에 통합된 경우에, 검사된 알에서 검출 가능한 신호의 식별은 그 안에 포함된 배아가 그 안에 통합된 리포터 유전자를 갖는 모계 Z 염색체를 갖고, 이에 의해 배아가 수컷으로 식별됨을 나타낸다. 일부 또 다른 실시양태에서, 리포터 유전자가 암컷 유전자이식 조류의 W 염색체에 통합된 경우에, 검사된 알에서 검출 가능한 신호의 식별은 그 안에 포함된 배아가 모계 W 염색체를 지니며 따라서 암컷으로 감별되며, 이에 의해 배아의 성 감별을 제공함을 나타낸다.

본 발명에 의해 제공된 유전자이식 조류는 이후에 본원에 보다 상세하게 기술되는 바와 같이 암컷 또는 수컷일 수 있음을 인지해야 한다. 일부 추가의 특정한 실시양태에서, 유전자이식 동물은 두 가지 상이한 성 염색체를 갖는 성별, 특히 이형배우자 대상체일 수 있다. 일부 특정 실시양태에서 이형배우자 동물은 암컷일 수 있다. 보다 특정한 실시양태에서, 유전자이식 조류 대상체가 암컷인 경우, 본 발명의 방법에 의해 확인된 알을 본 발명에 의해 제공된 유전자이식 암컷 조류가 낳는다. 보다 특정한 실시양태에서, 유전자이식 암컷은 유전자이식 수컷에 의해 또는 일부 다른 실시양태에서, 야생형 조류 수컷에 의해 수정될 수 있다. 여전히 추가로, 수정은 교배에 의해 또는 유전자이식 조류 암컷에게 유전자이식 또는 야생형 조류 수컷으로부터 얻은 정자를 정액주입함으로써 일어날 수 있다. 일부 다른 실시양태에서, 유전자이식 조류가 수컷인 경우, 본 발명의 방법에 의해 확인된 알을 본 발명에 의해 제공된 유전자이식 수컷과 교배되거나 이의 임의의 세포, 특히 이의 성 염색체에 통합된 본 발명의 외인성 리포터 유전자를 포함하는 정자 세포에 의해 정액주입된 야생형 또는 유전자이식 암컷이 낳을 수 있다.

따라서 본 발명은 부화되지 않은 수정란 내에서 조류 배아의 성별을 검출하는 방법을 제공한다. 본 발명의 방법은 조류 배아의 임의의 배아 단계의 부화되지 않은 알에 적용될 수 있음을 인지해야 한다.

본원에 사용된 "배아 발달 단계 또는 조류 배아의 단계"는 배반이 배반엽 단계에 있고 할강이 다크 링의 형상을 취하는 1일째의 단계; 첫 번째 홈이 배반엽의 중심에 나타나고 난황 막이 나타나는 2일째의 단계; 혈액 순환이 시작되고, 머리와 몸통이 구별될 수 있을 뿐만 아니라 뇌와 심장 구조가 박동하기 시작하는 3일째의 단계; 양막강이 배아를 둘러싸도록 발달하고 요막소낭이 나타나는 4일째의 단계; 배아가 C 형상을 취하고 사지가 뻗어나오는 5일째의 단계; 상지와 하지의 손가락이 뚜렷해지는 6일째의 단계; 목이 몸에서 머리를 명확하게 분리하고 부리가 형성되고 뇌가 두부 영역으로 점진적으로 들어가는 7일째의 단계; 눈 색소 침착이 쉽게 보이고, 날개와 다리가 구별되며 외이도가 열리는 8일째의 단계; 발톱이 나타나고 첫 번째 우포가 싹트는 9일째의 단계; 콧구멍이 생기고, 눈꺼풀이 자라며 난치(egg-tooth)가 나타나는 10일째의 단계; 안검열(palpebral aperture)이 타원 형상을 갖고 배아가 병아리의 양상을 갖는 11일째의 단계; 우포가 외이도를 둘러싸고 상부 눈꺼풀을 덮는 반면, 하부 눈꺼풀이 각막의 대부분을 덮는 12일째의 단계; 발톱과 다리 비늘이 뚜렷해지면서 요막이 장요막으로 되는 13일째의 단계; 전신이 빠르게 자라며, 난황 수축이 가속화되고 난백이 점차 사라지는 14일째 내지 16일째의 단계; 신장계가 요산염을 생성하고 부리가 기낭을 가리키고 난백이 완전히 재흡수되는 17일째의 단계; 난황이 내재화하고 양수의 양이 감소되는 18일째의 단계; 난황 재흡수가 가속화되고 부리가 내부 껍질 막을 뚫을 준비가 된 19일째의 단계; 난황이 완전히 재흡수되고, 배꼽이 닫히고, 병아리가 내부 껍질 막을 관통하고, 기낭으로 호흡하며 부화할 준비가 된 20일째의 단계; 병아리가 난치를 사용하여 껍질을 둥글게 뚫고, 12 내지 18시간 안에 껍질로부터 빠져나와 건조되게 하는 21일째의 단계를 가리키는 것으로 주지되어야 한다.

보다 구체적으로, 본 발명의 방법은 배아 발달 과정의 모든 단계에서 알 내부에서 in-ovo 조류 배아의 성별을 감별하는데 적용될 수 있다. 보다 구체적으로, 1일째부터, 2일째부터, 3일째부터, 4일째부터, 5일째부터, 6일째부터, 7일째부터, 8일째부터, 9일째부터, 10일째부터, 11일째부터, 12일째부터, 13일째부터, 14일째부터, 15일째부터, 16일째부터, 17일째부터, 18일째부터, 19일째부터, 20일째부터 및 21일째부터. 보다 구체적으로, 본 발명의 방법은 배아의 성별의 조기 검출, 특히 1일째 내지 10일째의 조기 검출을 위해 적용될 수 있다. 일부 실시양태에서 본 발명의 방법은 배아 발생의 첫날 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 2일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 3일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 4일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 5일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 6일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 7일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 8일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 9일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 10일째에 배아의 성별을 감별할 수 있다. 몇몇 특정 실시양태에서, 본 발명의 방법은 배아 발생 1 내지 5일 사이에 배아의 성별을 감별할 수 있다.

상기 주지된 바와 같이, 본 발명의 방법은 부화되지 않은 수정란에 적용될 수 있다. 용어 "수정란"은 이하에서, 암탉이 2주 내에 수탉에 의해 교배되어 수컷 정자가 암컷 누두(infundibulum)에 침착하고 난소로부터 난자의 방출시 수정 이벤트가 발생하도록 하는 암탉에 의해 낳은 알을 가리킨다. 본원에서 사용되는 바와 같이 " 부화되지 않은 알"은 구조적으로 통합된 (깨지지 않은) 껍질 내에 배아를 함유하는 알 (본원에서는 수정란이라고도 함)과 관련된다.

본 발명의 방법은 검사된 알을 낳는 유전자이식 조류 암컷 또는 수컷의 특정 유전자좌에 통합된 리포터 유전자에 의해 형성된 검출 가능한 신호의 결정에 기초한다.

본원에서 사용되는 바와 같이 "외래 또는 외인성 DNA/유전자의 염색체로의 통합"은 이하에서, 유기체 염색체의 뉴클레오티드 서열의 영구 변형을 가리킨다. 이러한 변형은 세포 분열 동안 추가로 전달되며, 생식성 세포주에서 발생하는 경우 자손에게도 전달될 것이다. 이 경우, 통합된 리포터 유전자가 부화되지 않은 알 내에 배아로 전달될 수 있다. 본원에서 사용되는 용어 "외인성"은 예를 들면 특이적으로 조작된 벡터, 바이러스 또는 임의의 다른 비히클로의 형질전환 또는 형질감염에 의해 유기체로 도입된 유기체 외부로부터 유래하는 것을 가리킨다. 특정 실시양태에 따르는 통합된 외인성 유전자는 리포터 유전자일 수 있다. 용어 "리포터 유전자"는 발현이 다양한 공지된 검정에서 검출될 수 있고 검출된 신호의 수준이 상기 리포터의 존재를 나타내는 폴리펩타이드를 암호화하는 유전자와 관련된다.

상기 주지된 바와 같이, 외인성 리포터 유전자는 조류 성 염색체 Z 또는 W에 통합될 수 있다. 본원에서 사용되는 바와 같이 조류 " 성 염색체 Z 또는 W"는 닭에서 자손의 성별을 감별하는 염색체 시스템을 가리키며, 여기서 수컷은 동형배우자적 성 (ZZ)인 반면, 암컷은 이형배우자적 성 (ZW)이다. 난자에의 W 염색체의 존재는 자손의 성별을 결정하는 반면 Z 염색체는 더 크고 더 많은 유전자를 보유하는 것으로 알려져 있다.

본 발명의 방법은 리포터 유전자의 존재 및 이에 따른 특정 성 염색체의 존재를 나타내고 반영하는 검출 가능한 신호의 검출에 기초한다. "검출 가능한 신호"는 이하에서, 관찰에 의해 또는 방법을 써서 인식 가능한 변화를 가리킨다. 제한없이, 신호는 직접 검출될 수 있다. 일부 실시양태에서, 검출 가능한 응답은 광학 신호이다.

일부 특정 실시양태에서, 본 발명의 방법에 의해 제공된 적어도 하나의 유전자이식 조류 대상체는 적어도 두 개의 상이한 리포터 유전자를 포함할 수 있으며, 각 리포터 유전자는 성 염색체 Z 또는 W 중의 하나에서 적어도 하나의 위치 또는 장소에 통합될 수 있음을 인지해야 한다. 적어도 두 개의 상이한 리포터 유전자의 경우에, 일부 실시양태에서, 성 염색체 각각은 다르게 표지될 수 있다. 형성된 검출 가능한 신호의 평가는 검사된 배아의 성별을 나타낼 수 있다.

일부 특정 실시양태에서, 본 발명의 유전자이식 조류 내에 포함된 리포터 유전자는 적어도 하나의 형광 리포터 유전자일 수 있다. 따라서, 일부 실시양태에서, 발현된 폴리펩타이드는 형광 단백질이고 따라서 분석은 여기시, 특히 적절한 광원으로 여기시 방출된 광의 수준을 측정한다.

용어 "형광"은 흡수된 광 또는 다른 전자기 방사선이 조명된 물질에 의한 광 방출을 가리킨다. 이것은 발광의 한 형태, 즉 열에 의해 야기되지 않는 물질에 의한 광의 방출이다.

"형광 단백질"은 광에 노출될 때 밝은 형광을 나타내는 단백질을 가리킨다. 형광 단백질은 조명 여기 강도의 피크에 대한 특정 파장 및 형광 방출 강도의 피크에 대한 파장을 갖는다. 여기는 형광 단백질의 조명을 가리킨다. 일부 실시양태에서, 여기는 레이저에 의해 제공될 수 있다. 일부 실시양태에서, 신호는 적절한 광학 필터의 사용시 검출될 수 있다.

특정 실시양태에서, 형광 리포터 유전자는 적색 형광 단백질 (RFP), 청록색 형광 단백질 (CFP), 황색 형광 단백질 (YFP), 및 청색 형광 단백질 (BFP)을 포함한 자가-형광 단백질일 수 있다.

일부 추가의 특정 실시양태에서, 임의의 형광 단백질이 본 발명에서 적용 가능할 수 있음을 주지해야 한다. 보다 구체적으로, 원래의 에쿼리아 빅토리아 ( Aequorea victoria ) 해파리 녹색 형광 단백질에서의 돌연변이유발 노력이 청색에서 황색에 이르는 색상 범위의 새로운 형광 프로브를 초래하였으며, 이것이 본 발명에서 일부 실시양태에 따라 적용될 수 있다. 오렌지색 및 적색 스펙트럼 영역에서 방출되는 보다 긴 파장 형광 단백질은 해양 아네모네, 디스코소마 스트리아타 ( Discosoma striata ), 및 산호충 (Anthozoa) 부류에 속하는 암초 산호로부터 개발되었다. 청록색, 녹색, 황색, 오렌지색, 및 심홍색 형광 방출을 갖는 유사한 단백질을 생성하기 위해 여전히 또 다른 종이 채굴되었다.

일부 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 황색 형광 단백질일 수 있다. 보다 구체적으로, 녹색 형광 단백질의 결정 구조가 트레오닌 잔기 203 (Thr203)이 발색단 근처에 있음을 나타낸 후 황색 형광 단백질 계열이 개시되었다. 이 잔기의 티로신으로의 돌연변이를 도입하여 발색단의 여기 상태 쌍극자 모멘트를 안정화시키고 여기 및 방출 스펙트럼 둘 다에 대해 더 긴 파장으로 20-나노미터 이동을 야기하였다. 추가 개선으로 가장 밝고 가장 널리 사용되는 형광 단백질 중 하나인 강화된 황색 형광 단백질 (EYFP)이 개발되었다.

황색 형광 단백질의 시트린 (Citrine) 변이체는 EYFP에 비해 매우 밝으며 본 발명의 일부 실시양태에서 적용될 수 있다. 비너스 (Venus)라고 하는 또 다른 유도체가 가장 빨리 성숙하고 있으며 현재까지 개발된 가장 밝은 황색 변이체 중 하나이다. 인도양과 태평양에 고유한 조안투스( Zoanthus) 종으로부터 본래 복제된 산호초 단백질인 ZsYellow1은 진정한 황색 방출을 생성하며 본 발명에도 적용 가능하다.

일부 추가의 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 청색 형광 단백질일 수 있다. 녹색 형광 단백질의 청색 및 청록색 변이체는 천연 형광단의 위치 66 (Tyr66)에서 티로신 잔기의 직접 변형으로부터 야기되었다. 이 아미노산의 히스티딘으로의 전환은 450 나노미터에서 최대 파장을 갖는 청색 방출을 야기하는 반면, 트립타민으로의 전환은 약 500 나노미터에서 피크인 숄더와 함께 약 480 나노미터의 주요 형광 피크를 초래한다. 보다 구체적으로, 도입된 개선된 청록색 형광 단백질 중에서, AmCyan1, 및 Cerulean으로 명명된 강화된 청록색 변이체가 가장 큰 가능성을 보인다. 암초 산호, 아네모니아 마자노( Anemonia majano) 로부터 유래한 AmCyan1 형광 단백질 변이체가 또한 본 발명에 적용될 수 있다.

일부 특정 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 적색 형광 단백질일 수 있다. 광범위하게 이용되는 최초의 산호-유래 형광 단백질은 디스코소마 스트리아타로부터 유래되었으며 일반적으로 DsRed라고 한다. 일단 완전히 성숙되면, DsRed의 형광 방출 스펙트럼은 583 나노미터에서 피크를 특징으로 하는 반면 여기 스펙트럼은 558 나노미터에서 주요 피크를 가지며 약 500 나노미터에서 작은 피크를 갖는다. 여전히 추가로, 본 발명에 적용될 수 있는 또 다른 변이체는 DsRed2, DsRed -Express 및 RedStar를 포함하지만 이에 제한되지 않는다. 상당한 장래성을 보이는 몇몇 추가의 적색 형광 단백질이 암초 산호 유기체로부터 단리되었다. 본 발명에 적용될 수 있는 이러한 단백질 중 하나는 헤터랙티스 크리스파( Heteractis crispa) 로부터 단리되어 현재 상업적으로 이용 가능한 HcRed1일 수 있다. HcRed1은 돌연변이유발을 통해 적색 광을 흡수하여 588 나노미터에서 최대 흡수 및 618 나노미터의 최대 방출을 갖는 약한 형광 편성 이량체를 생성하는 비-형광 색소 단백질로부터 원래 유래되었다.

여전히 추가로, 일부 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 이러한 단백질은 GFP가 아니며, 일부 보다 특정한 실시양태에서, 야생형 GFP가 아니다. 그러나, 일부 실시양태에서, 555 및 585nm에서 여기 및 방출 최대값을 갖는 적색-방출 스펙트럼 종을 형성하는 GFP의 몇몇 돌연변이체 및 변이체가 또한 본 발명에 적용될 수 있다. 일부 추가의 특정 실시양태에서, 이러한 돌연변이체 또는 변이체는 세린 65 및/또는 아스파라긴 68 잔기를 포함할 수 있다. 일부 추가의 실시양태에서, GFP의 이러한 돌연변이체 또는 변이체는 F46L, V163A 및 I167V 중 적어도 하나의 돌연변이를 포함할 수 있다. 일부 추가의 실시양태에서 변이체는 Ser65, Asn68, F46L, V163A 및 I167V의 임의의 조합을 포함할 수 있다.

일부 추가의 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 아래 본원의 표 1에 개시된 형광 단백질 중의 어느 것일 수 있음을 주지해야 한다. 일부 추가의 실시양태에서 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 표 1에 개시된 형광 단백질 중의 어느 것일 수 있으며, 단 상기 형광 단백질은 야생형 GFP가 아니다. 일부 또 다른 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 표 1에 개시된 형광 단백질 중의 어느 것일 수 있으며, 단 이러한 리포터 유전자는 표 1에 개시된 녹색 형광 단백질 중의 어느 것, 보다 구체적으로, EGFP, Emerald, Superfolder GFP, Azami Green, mWasabi, TagGFP, TurboGFP, AcGFP, ZsGreen, T-Sapphire 중의 어느 하나가 아니다.

놀랍게도 실시예 1 및 2에 의해 나타낸 바와 같이, 본 발명에 의해 밝혀진 알의 자가 형광 특성은 RFP를 발현하는 세포를 보유하는 배아의 검출만을 가능하게 한다.

따라서, 보다 특정한 실시양태에서, 리포터 유전자는 적색 형광 단백질 (RFP)일 수 있다. 용어 "적색 형광 단백질(Red Fluorescent Protein)" 또는 "RFP"는 이하에서, 산호충류 (산호) 및 아네모네로부터 단리된 오렌지색, 적색, 및 원-적색 형광을 방출하는 형광 단백질 뿐만 아니라 이의 임의의 변이체를 가리킨다. RFP 단백질에는 DsRed와 Kaede의 두 가지 주요 유형이 있다. DsRed-유사 RFP는 디스코소마 스트리아타로부터 유래하며 mCherry, zFP538, mKO, mOrange, mRouge, E2-Crimson, mNeptune, TagRFP657, Keima, mKate, mStrawberry, mBanana, mHoneydew, niTangerine, mRaspberry, mPlum, mRFPmars 및 mRFPruby를 포함하지만 이에 제한되지 않는다.

다른 한편으로, Kaede는 돌산호 트라키필라 지오프료이(Trachyphyllia geoffroyi)에서 발견되는 천연 형광 단백질이며, 이것은 ~400 nm에서 조사시 방출 파장을 녹색 (518 nm)에서 적색 (582 nm)으로 비가역적으로 변화시킨다. Kaede 계열 구성원은 예를 들면 산호 로보필리아 헤프리치(Lobophyllia hemprichii) , 덴드로프타야( Dendronephthya) , 모나스트레아 카버노사( Monastrea cavernosa) , 및 리코데아 플로리다(Ricordea florida)에서 각각 발견되는 EosFP, dendFP, mcavRFP, 및 rfloRFP를 포함한다.

당업계에 공지된 임의의 공급원의 본원에 기술된 RFP 중의 어느 것이 본 발명의 방법, 유전자이식 동물, 세포, 키트 및 장치에 적용될 수 있음을 인지해야 한다.

일부 특정 실시양태에서, 본 발명의 방법에 의해 사용될 수 있는 RFP는 포유류 세포에서 높은 발현을 위해 최적화된 (여기 최대 = 558 nm; 방출 최대 = 583 nm) 신규한 적색 형광 단백질 [RFP; [RFP; Matz, M. V., et al. (1999) Nature Biotech. 17:969-973]을 암호화하는 pDsRed1-N1에서 사용되는 RFP일 수 있다. RFP는 인도 태평양 말미잘-관련, Discosoma sp로부터 단리되었으며; DsRed1의 암호화 서열은 144개의 침묵 염기 쌍 변화를 함유하며, 이것은 포유동물 세포에서 높은 발현을 위한 인간 코돈-사용 선호도에 상응한다.

일부 실시양태에서, 본 발명의 방법 및 키트에 의해 사용되는 RFP는 서열 번호 20으로 표시되는 서열을 포함하는 핵산 서열에 의해 암호화될 수 있다. 일부 추가의 실시양태에서, 이러한 RFP는 서열 번호 21로 표시되는 아미노산 서열, 또는 이의 임의의 동족체, 변이체, 돌연변이체 또는 유도체를 포함할 수 있다.

일부 대안적인 특정 실시양태에서, 본 발명에 의해 사용되는 RFP는 GenBank: AAG16224.1로 표시되는 아미노산 서열을 갖는 GenBank: AF272711.1로 개시된 핵산 서열에 의해 암호화된 RFP일 수 있다. 일부 추가의 특정 실시양태에서, 본 발명의 방법 및 키트에 의해 사용되는 RFP는 서열 번호 22로 표시되는 서열을 포함하는 핵산 서열에 의해 암호화될 수 있다. 일부 추가의 실시양태에서, 이러한 RFP는 서열 번호 23으로 표시되는 아미노산 서열, 또는 이의 임의의 상동체, 돌연변이체 또는 유도체를 포함할 수 있다.

일부 실시양태에서, 본 발명의 방법에 의해 사용되는 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아님을 주지해야 한다. 즉, 일부 특정 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며 단 상기 형광 단백질은 GFP가 아니다.

여전히 추가로, 일부 특수한 특정 실시양태에서, 리포터 유전자가 RFP인 경우, 일부 실시양태에서, RFP의 여기 파장은 약 500-650 nm인 반면 방출 파장은 약 550-650 nm일 수 있음을 주지해야 한다.

일부 또 다른 실시양태에서, 본 발명의 방법에 의해 검출 가능한 신호를 검출하는 단계는 상기 알을 적절한 광원에 적용하는 단계를 추가로 포함할 수 있다. 일부 추가의 실시양태에서, 약 400 내지 약 650의 파장을 포함하는 적절한 광원에 알을 노출시킴. 일부 추가의 실시양태에서, 임의의 파장의 광이 사용될 수 있으며, 단 상기 광원은 자외선 (UV) 광 (파장 10 내지 400 nm)이 아니다.

일부 특정 실시양태에서, 상기 알을 광원에 적용하는 단계는 형광 단백질의 여기이다. 일부 특별한 실시양태에서, 여기 파장은 약 500 nm 내지 약 650 nm이다. 일부 추가의 실시양태에서, 여기 파장은 약 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640 nm이다. 일부 보다 특정한 실시양태에서, 여기 파장은 약 515 내지 약 555 범위일 수 있다. 일부 추가의 실시양태에서, 파장은 532 nm일 수 있다. 일부 특정한 비제한적인 실시양태에서, 광원은 레이저에 의해 제공될 수 있다.

본원에서 사용되는 바와 같이, 용어 "레이저"는 방사선의 유도 방출 (stimulated emission)에 의해 증폭되는 임의의 주파수의 전자기 방사선을 가리킨다. 레이저는 또한 유도 방출이라고 불리는 과정을 통해 전자기 방사선을 방출하는 장치를 가리킨다. 레이저 광은 통상적으로 공간적으로 간섭성이며, 이것은 빛이 좁은 저-발산 빔으로 방출되거나 렌즈와 같은 광학 부품의 도움으로 빔으로 전환될 수 있음을 의미한다.

일부 또 다른 실시양태에서, 레이저는 청색 레이저, 또는 적색 레이저일 수 있다. 보다 특정한 실시양태에서, 광원은 녹색 레이저이다.

특정 실시양태에서, 레이저는 필터와 함께 사용될 수 있다.

본원에서 사용되는 용어 "필터"는 일반적으로 대량으로 염색되거나 간섭 코팅을 갖는 광로에서 평면 유리 또는 플라스틱 장치로서 구현되는, 상이한 파장의 광을 선택적으로 투과시키는 장치에 상응하는 "광학 필터"를 가리킨다.

일부 실시양태에서, 필터는 500 nm 이상을 투과하는 녹색 필터, 또는 540 nm 내지 580 nm를 투과하는 진녹색 필터, 또는 590 nm 내지 650 nm를 투과하는 적색 필터, 또는 650 nm 이상 또는 660 nm 이상을 투과하는 적색 필터일 수 있다.

일부 특별한 실시양태에서, 광원은 532 nm의 파장을 갖는 녹색 레이저일 수 있다. 일부 추가의 실시양태에서, 이러한 레이저는 650 nm 이상을 투과하는 적색 필터에 제공될 수 있다.

닭 생식선은 원시 생식 세포의 소집단으로부터 발달하여, 성선외 부위로부터 생식 융기로 이동하면서 능동 이동의 단계 뿐만 아니라 혈류에서의 수동 순환을 거치게 된다. PGC는 단계 X라고 하는 발달 단계인 갓 낳은 포란하지 않은 알의 중심에 위치한다. 포란(incubation) 동안 PGC는 전방으로 이동하고 혈관내 이물 주입 (intravasation)을 위한 주요 부위로 간주되는 10HH 배아 단계 (대략 33-38시간의 포란)의 생식 신월환(germinal crescent)에 축적된다. 나중에, PGC는 단계 12HH에서 17HH로의 순환 (대략 45-64시간의 포란)에서 발견될 수 있으며, 단계 14HH (약 50-53시간의 포란)에서 최고 농도에 도달할 수 있다. PGC는 중간 중배엽에서 생식선 원기 (gonad anlage)에 인접한 부위에서 순환을 떠나며, 여기서 이들은 단계 15HH (55-55시간의 포란)만큼 조기에 발견될 수 있다. PGC는 배측 장간막을 따라 능동 이동에 의해 생식 융기에 도달하고, 생식선 둘 다를 콜로니화하며, 여기서 이들은 나중에 정조세포 또는 난원세포로 분화된다.

배아는 난황 낭의 상부에 위치한다. 난황은 알에서 자유롭게 회전하며, 배아는 항상 난황의 윗면을 향하고 있다. 포란 동안, 알의 둔단 (기낭이 위치한 곳)이 위를 향하고 있고, 알은 때때로 90 ° 회전한다. 배아가 발달함에 따라, 배아외성 조직의 형성이 배아를 알껍질에서 멀어지게 하고, 배아는 덜 접근 가능해진다.

따라서, 일부 특정 실시양태에서, 알은 상기 광원에 노출된다. 일부 추가의 실시양태에서, 알은 광원에의 임의의 단계의 배아의 노출을 촉진시키는 위치에 배치된다. 일부 추가의 실시양태에서, 알의 단계 X에서 난황의 윗면을 함유하는 영역은 광원으로 여기된다.

일부 추가의 실시양태에서, 상기 알을 광원에 적용하는 상기 단계는 레이저 소스, 알을 위한 스탠드, 렌즈, 필터, 검출기용 스탠드 및 검출기를 포함할 수 있는 시스템, 장비 또는 장치에 의해 제공된다.

본원에서 사용되는 용어 "검출기"는 빛을 검출 및/또는 측정하는 임의 유형의 장치를 가리킨다. 일부 실시양태에서, 검출 가능한 신호, 특히, 형광 신호는 적합한 형광 수단을 사용하여 검출될 수 있음을 주지해야 한다. 일부 실시양태에서, RFP 리포터 유전자에 의해 형성된 검출 가능한 신호는 변형된 광학 현미경과 같은 감광성 장치 또는 고감도 광자 검출기인 전하 결합 소자 (CCD)에 의해 검출될 수 있다.

일부 추가의 실시양태에서, 본 발명의 방법은 적어도 하나의 광원, 적어도 하나의 검출기, 적어도 하나의 필터 및 상기 광원에의 본 발명의 리포터 유전자를 발현하는 세포의 노출을 촉진시키는 적절한 위치에 알을 배치하는 적어도 하나의 홀딩 아암 (holding arm)을 제공하는 임의의 장치, 장비 또는 시스템을 사용하여 수행될 수 있다. 일부 특별한 비제한적인 실시양태에서, 본 발명의 방법은 도 1에 예시된 바와 같은 장치를 사용할 수 있다. 일부 추가의 실시양태에서, 에그 홀더와 렌즈 및/또는 렌즈와 검출기 사이의 거리는 약 1 내지 100 cm의 범위, 특히, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 및 100 cm, 특히 약 5 내지 25 cm, 보다 특히, 약 20 cm일 수 있다.

따라서, 일부 실시양태에서, 본 발명의 방법은, 예를 들면, 검사된 알에서 검출 가능한 신호의 존재를 결정하는데 적합한, 본원에 기술된 바와 같은 시스템 또는 장치를 제공하는 단계를 추가로 포함할 수 있음을 인지해야 한다. 특히, 레이저 소스, 알을 위한 스탠드, 렌즈, 필터, 검출기용 스탠드 및 검출기를 포함하는 장비 또는 장치. 상기 나타낸 바와 같이, 이러한 장치에 대한 일부 실시양태에서, 약 532nm의 여기 파장을 표시하는 녹색 레이저 소스가 사용될 수 있다. 일부 추가의 실시양태에서, 650nm 이상을 투과하는 필터, 특히 적색 필터가 사용될 수 있다.

여전히 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 적어도 하나의 유전자이식 조류 대상체 또는 동물은 암컷 조류 대상체 또는 동물일 수 있다. 보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합되는 경우, 검출 가능한 신호의 검출은 부화되지 않은 알의 배아가 수컷임을 나타낸다. 보다 특히, 부계 비표지된 Z 성 염색체를 함유하고 모계 표지된 Z 염색체를 추가로 함유하는 배아는 두 개의 Z 염색체를 함유하고 따라서 수컷이다.

일부 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 적어도 하나의 유전자이식 조류 대상체 또는 동물은 암컷 조류 대상체 또는 동물일 수 있다. 일부 특정 실시양태에서, 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합되는 경우, 검출 가능한 신호의 검출은 부화되지 않은 알의 배아가 암컷임을 나타낸다. 보다 특히, 부계 비표지된 z 염색체 및 표지된 모계 W 염색체를 함유하는 배아는 암컷인 WZ 염색체를 함유하는 이형배우자적 배아이다.

일부 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물은 이의 Z 염색체에 통합된 리포터 유전자를 갖는 수컷 대상체일 수 있다. 이러한 경우에, 이러한 유전자이식 수컷 또는 이의 임의의 정자에 의해 수정된 알에서 결정된 검출 가능한 신호는 배아가 유전자이식 리포터 유전자를 포함하는 부계 Z 염색체를 지니며, 따라서 수컷임을 나타낸다. 여전히 추가의 실시양태에서, 유전자이식 수컷 조류에 의해 수정된 유전자이식 암컷 조류 (둘 다 이의 Z 염색체에 통합된 본 발명의 리포터 유전자를 보유한다)가 낳은 알에서의 검출 가능한 신호의 검출은, 강력한 신호의 경우, 배아가 이의 암컷 및 수컷 Z 염색체에 통합된 리포터 유전자의 두 카피를 지닌다는 것을 나타낼 수 있다. 덜 강한 신호, 예를 들면, 약 50%의 감소된 강도를 갖는 신호의 경우. 알은 암컷으로 감별될 수 있다.

이전에 본원에 나타낸 바와 같이, 본 발명의 방법은 유전자이식 조류 동물의 제공을 포함한다. 유전자이식 조류 동물의 제조는 특정 유전자 편집 화합물 또는 성분을 사용할 수 있는 유전 공학 접근법의 사용을 필요로 한다. 유전자 편집 성분에 대한 비-제한적인 예는 일부 실시양태에서, 뉴클레아제의 사용을 포함할 수 있다.

일부 특정 실시양태에서, 본 발명의 방법에 적용 가능한 뉴클레아제는 RNA 유도 DNA 결합 단백질 뉴클레아제일 수 있다.

본원에 사용된 바와 같이, RNA 유도 DNA 결합 단백질 뉴클레아제(RNA guided DNA binding protein nuclease)는 RNA 분자에 의해 이의 절단 부위 (또는 대안적으로, 임의의 다른 대안적 활성을 위한 부위)로 안내되는 뉴클레아제이다. 이 RNA 분자를 가이드 RNA라고 한다.

따라서, 보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 프로그램 가능한 조작된 뉴클레아제 (PEN)를 사용하여 본 발명의 방법에 의해 제공되는 유전자이식 조류 대상체 또는 동물의 성 염색체에 통합될 수 있다. 본원에서 사용되는 용어 "프로그램 가능한 조작된 뉴클레아제 (PEN)(programmable engineered nuclease)(PEN)"는 이중 가닥 DNA 병변의 DNA 복구에 관여하고 직접적인 게놈 편집을 가능하게 하는 자연 발생 뉴클레아제로부터 유래된 특정 DNA 서열을 절단하는 합성 효소를 가리킨다.

일부 보다 특정한 실시양태에서, 본 발명의 방법에 의해 사용되는 PEN은 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR) 클래스 2 또는 클래스 1 시스템 중 어느 하나일 수 있다.

보다 특히, CRISPR(the Clustered Regularly Interspaced Short Palindromic Repeats) 타입 II 시스템은 게놈 공학을 위해 변형된 박테리아 면역 시스템이다.

그러나 모든 게놈 표적에 대한 특정 뉴클레아제-쌍의 설계 및 생성을 필요로 하는 맞춤형 DNA-결합 단백질 뉴클레아제의 사용에 의존하는 징크 핑거 뉴클레아제 (ZFN) 또는 전사-활성화제-유사 이펙터 뉴클레아제 (TALEN)와 같은 다른 게놈 공학 접근법이 또한 본원에 적용될 수 있는 것임을 인지해야 한다.

CRISPR - Cas 시스템은 두 개의 클래스로 분류된다. 클래스 1 시스템은 외래 핵산을 분해하기 위해 다수의 Cas 단백질의 복합체를 사용한다. 클래스 2 시스템은 동일한 목적을 위해 단일 대형 Cas 단백질을 사용한다. 보다 특히, 클래스 1은 타입 I, III, 및 IV로 나뉠 수 있고 클래스 2는 타입 II, V, 및 VI로 나뉠 수 있다.

본원에서 사용되는 바와 같이, SPIDR (Spacer Interspersed Direct Repeats)로도 알려진 CRISPR 어레이는 통상적으로 특정 박테리아 종에 특이적인 최근에 기술된 DNA 유전자좌의 패밀리를 구성한다. CRISPR 어레이는 이. 콜라이 (E. coli)에서 처음 인식된 산재성 짧은 서열 반복체 (SSR)의 또 다른 클래스이다. 이후 몇 년 동안, 유사한 CRISPR 어레이가 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 할로페락스 메디테라네이(Haloferax mediterranei), 메타노칼도코커스 야나슈이(Methanocaldococcus jannaschii), 써모토가 마리티마(Thermotoga maritima) 및 기타 박테리아 및 고세균에서 발견되었다. 본 발명은 공지된 임의의 CRISPR 시스템, 특히 본원에 개시된 CRISPR 시스템의 사용을 고려하는 것으로 이해되어야 한다. CRISPR-Cas 시스템은 외래 DNA 또는 RNA를 표적으로 하여 파지 공격 및 바람직하지 않은 플라스미드 복제로부터 보호하기 위해 원핵생물에서 진화하였다. CRISPR-Cas 시스템은 반복체 사이에 존재하는 스페이서 (spacer)라고 불리는 짧은 상동 DNA 서열을 기반으로 하는 DNA 분자를 표적으로 한다. 이들 스페이서는 CRISPR-연관된 (Cas) 단백질을 후속적으로 절단되는 프로토-스페이서 (proto-spacers)라고 불리는 외래 DNA 내의 매칭 (및/또는 상보적) 서열로 안내한다. 스페이서는 임의의 DNA 서열을 표적으로 하도록 합리적으로 설계될 수 있다. 또한, 이러한 인식 요소는 임의의 원하는 표적을 인식하고 표적화하도록 별도로 설계될 수 있다. CRISPR 시스템과 관련하여, 당업계의 숙련가에 의해 인식되는 바와 같이, 자연 발생 CRISPR 유전자좌의 구조는 일반적으로 "반복체"라고 하는 다수의 짧은 반복 서열을 포함한다. 반복체는 클러스터로 발생하며 통상적으로 "스페이서"라고 하는 고유한 개재 서열에 의해 주기적으로 이격된다. 전형적으로, CRISPR 반복체는 길이가 약 24 내지 47개 염기 쌍 (bp)으로 다양하며 부분적으로 회문성 (palindromic)이다. 스페이서는 2개의 반복체 사이에 위치하며 전형적으로 각 스페이서는 길이가 약 20 bp 이하 내지 72 bp 이상의 고유한 서열을 갖는다. 따라서, 특정 실시양태에서 본 발명의 방법 및 키트의 적어도 하나의 gRNA를 암호화하는 서열에 사용된 CRISPR 스페이서는 각각 10 내지 75개의 뉴클레오티드 (nt)를 포함할 수 있다. 보다 특히, 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75개 또는 그 이상. 일부 특정 실시양태에서 스페이서는 약 20 내지 25개 뉴클레오티드, 보다 특히, 약 20개 핵염기를 포함한다.

적어도 하나의 반복체 및 적어도 하나의 스페이서 이외에, CRISPR 유전자좌는 또한 리더 서열 및 임의로, 적어도 하나의 tracrRNA를 암호화하는 서열을 포함한다. 리더 서열은 전형적으로 첫 번째 반복체의 5 '말단에 바로 인접한 최대 550 bp의 AT-풍부 서열이다.

일부 특정 실시양태에서, 본 발명의 방법에 의해 사용되는 PEN은 CRISPR 클래스 2 시스템일 수 있다. 일부 추가의 특정 실시양태에서, 이러한 클래스 2 시스템은 CRISPR 타입 II 시스템일 수 있다.

보다 특히, CRISPR-Cas 시스템의 세 가지 주요 타입이 기술된다: 타입 I, 타입 II 및 타입 III.

타입 II CRISPR - Cas 시스템은 'HNH'-타입 시스템 (스트렙토코커스-유사; 나이세리아 메닌지티디스 (Neisseria meningitidis) 혈청군 A str. Z2491, 또는 CASS4에 대해 Nmeni 서브타입으로도 알려짐)을 포함하며, 여기서 단일의 매우 큰 단백질인 Cas9는 유비쿼터스 Cas1 및 Cas2에 더하여 crRNA를 생성하고 표적 DNA를 절단하는데 충분한 것으로 보인다. Cas9는 적어도 2개의 뉴클레아제 도메인, 아미노 말단 근처의 RuvC-유사 뉴클레아제 도메인 및 단백질 중간에 있는 HNH (또는 McrA-유사) 뉴클레아제 도메인을 함유하지만, 이들 도메인의 기능은 여전히 규명되어야 한다. 그러나, HNH 뉴클레아제 도메인은 제한 효소가 풍부하고 표적 절단을 담당하는 엔도뉴클레아제 활성을 보유하기 때문이다.

타입 II 시스템은 tracrRNA와 pre-crRNA의 반복체의 일부 사이의 이중체(duplex) 형성을 포함하는 특이한 메커니즘을 통해 pre-crRNA를 절단한다; pre-crRNA 처리 경로에서의 첫 번째 절단이 이러한 반복 영역에서 후속적으로 일어난다. 여전히 추가로, 타입 II 시스템은 cas9 , cas1 , cas2 csn2 , 및 cas4 유전자 중의 적어도 하나를 포함한다는 것을 주지해야 한다. 임의의 타입 II CRISPR-Cas 시스템이 본 발명에 적용 가능할 수 있으며, 특히 타입 II-A 또는 B 중 어느 하나가 적용될 수 있음을 인지해야 한다.

따라서, 일부 추가의 대안적인 실시양태에서, 본 발명의 방법 및 키트에 사용되는 적어도 하나의 cas 유전자는 타입 II CRISPR 시스템 (타입II-A 또는 타입II-B)의 적어도 하나의 cas 유전자일 수 있다. 보다 특정한 실시양태에서, 본 발명의 방법 및 키트에 의해 사용되는 타입 II CRISPR 시스템의 적어도 하나의 cas 유전자는 cas9 유전자일 수 있다. 이러한 시스템은 cas1 , cas2 , csn2 및 cas4 유전자 중 적어도 하나를 추가로 포함할 수 있음을 인지해야 한다.

Cas9에 의한 이중-가닥 DNA (dsDNA) 절단은 " 타입 II CRISPR - Cas " 면역 시스템의 특징이다. CRISPR-연관된 단백질 Cas9는 RNA:DNA 상보성을 사용하여 서열-특이 이중 가닥 DNA (dsDNA) 절단을 위한 표적 부위를 식별하여 특정 표적 서열, 예를 들면, 조류 성 염색체 W 및 Z 내의 특정 표적으로 리포터 유전자를 통합시키는 HDR에 필요한 이중 가닥 브레이크 (DSB)를 생성하는 RNA 유도 DNA 엔도뉴클레아제이다. 표적화된 DNA 서열은 CRISPR 어레이에 의해 특정되며, 이것은 짧은 회문구조 반복체에 의해 분리된 일련의 약 30 내지 40 bp 스페이서이다. 어레이는 pre-crRNA로서 전사되고 프로토-스페이서로 알려진 상보적 DNA 서열을 표적화하기 위해 Cas 단백질 복합체와 연관되는 보다 짧은 crRNA로 가공된다. 이러한 프로토-스페이서 표적은 또한 표적 인식에 필요한 프로토-스페이서 인접 모티프 (PAM)로 알려진 추가의 이웃 서열을 가져야 한다. 결합 후, Cas 단백질 복합체는 표적에서 양쪽 가닥을 절단하기 위한 DNA 엔도뉴클레아제로서 작용하며 후속 DNA 분해는 엑소뉴클레아제 활성을 통해 일어난다.

본원에 사용된 바와 같은 CRISPR 타입 II 시스템은 2개의 필수 성분의 포함을 필요로 한다: "가이드" RNA (gRNA) 및 비-특이 CRISPR-연관 엔도뉴클레아제 (Cas9). gRNA는 Cas9-결합에 필요한 "스캐폴드" 서열 및 변형시키고자 하는 게놈 표적을 정의하는 약 20개 뉴클레오티드 길이의 "스페이서" 또는 "표적화" 서열로 구성된 짧은 합성 RNA이다. 따라서, gRNA에 존재하는 표적화 서열을 단순히 변화시킴으로써 Cas9의 게놈 표적을 변화시킬 수 있다. 본원에 사용되는 가이드 RNA (gRNA)는 Cas9 뉴클레아제에 대한 표적화 특이성 및 스캐폴딩/결합 능력 둘 다를 제공하는 내인성 박테리아 crRNA 및 tracrRNA의 합성 융합체를 가리킨다. "단일 가이드 RNA" 또는 "sgRNA"라고도 한다. CRISPR은 원래 다양한 세포 유형과 유기체에서 표적 유전자를 "녹아웃"하는데 사용되었지만, Cas9 효소의 변형이 표적 유전자를 "녹인"시키고, 표적 유전자를 선택적으로 활성화 또는 억제하며, DNA의 특정 영역을 정제하고, 심지어 형광 현미경을 사용하여 살아있는 세포에서 DNA를 이미지화하도록 CRISPR의 적용 범위를 넓혔다. 게다가, gRNA 생성의 용이성은 CRISPR을 가장 확장 가능한 게놈 편집 기술 중 하나로 만들며 최근에 게놈-와이드 스크린에 사용되어 왔다.

편집하고자 하는 게놈 내의 표적, 특히, 본 발명의 리포터 유전자가 통합될 성 염색체 Z 또는 W 내의 특정 표적 유전자좌는 프로토스페이서 인접 모티프 (PAM)의 바로 상류에 존재해야 한다.

PAM 서열은 표적 결합을 위해 절대적으로 필요하며 정확한 서열은 Cas9의 종 (스트렙토코커스 피오게네스 (Streptococcus pyogenes) Cas9의 경우 5 'NGG 3')에 의존한다. 특정 실시양태에서, S. 피오게네스로부터의 Cas9가 본 발명의 방법 및 키트에서 사용된다. 그럼에도 불구하고, 임의의 공지된 Cas9가 적용될 수 있음을 인지해야 한다. 본 개시내용에서 유용한 Cas9에 대한 비제한적인 예는 본원에서 SpCas9로도 나타내어진 스트렙토코커스 피오게네스 (Streptococcus pyogenes) (SP), 본원에서 SaCas9로도 나타내어진 스타필로코커스 아우레우스 (Staphylococcus aureus) (SA), 본원에서 NmCas9로도 나타내어진 나이세리아 메닌지티디스 (Neisseria meningitidis) (NM), 본원에서 StCas9로도 나타내어진 스트렙토코커스 써모필러스 (Streptococcus thermophilus) (ST), 및 본원에서 TdCas9로도 나타내어진 트레포네마 덴티콜라 (Treponema denticola) (TD)를 포함하지만 이에 제한되지 않는다. 일부 특정 실시양태에서, 스트렙토코커스 피오게네스 M1 GAS의 Cas9, 특히, 단백질 id: AAK33936.1의 Cas9가 본 발명의 방법 및 키트에서 적용될 수 있다. 일부 실시양태에서, Cas9 단백질은 서열 번호 24로 표시된 바와 같은 핵산 서열에 의해 암호화될 수 있다. 추가의 특정 비제한적인 실시양태에서, Cas9 단백질은 서열 번호 25로 표시된 바와 같은 아미노산 서열, 또는 이의 임의의 유도체, 돌연변이체 또는 변이체를 포함할 수 있다. 일단 발현되면, Cas9 단백질 및 gRNA는 gRNA "스캐폴드" 도메인과 Cas9 상의 표면-노출된 양으로 하전된 홈 사이의 상호작용을 통해 리보단백질 복합체를 형성한다. Cas9는 gRNA 결합시 분자를 비활성, 비-DNA 결합 형태에서 활성 DNA-결합 형태로 바꾸는 형태 변화를 겪는다. 중요하게는, gRNA의 "스페이서" 서열은 표적 DNA와 자유롭게 상호작용할 수 있다. Cas9-gRNA 복합체는 PAM과 임의의 게놈 서열에 결합하지만, gRNA 스페이서가 표적 DNA와 일치하는 정도가 Cas9가 절단될 것인지를 결정한다. 일단 Cas9-gRNA 복합체가 추정 DNA 표적에 결합하면, gRNA 표적화 서열의 3' 말단의 "시드" 서열이 표적 DNA에 어닐링되기 시작한다. 시드 및 표적 DNA 서열이 일치하는 경우, gRNA는 3'에서 5' 방향으로 표적 DNA에 계속 어닐링된다.

Cas9는 gRNA 스페이서와 표적 서열 사이에 충분한 상동성이 존재하는 경우에만 표적을 절단할 것이다. 여전히 추가로, Cas9 뉴클레아제는 두 개의 기능적 엔도뉴클레아제 도메인을 갖는다: RuvC 및 HNH. Cas9는 뉴클레아제 도메인을 표적 DNA의 반대 가닥을 절단하도록 위치시키는 표적 결합시 2차 형태 변화를 겪는다. Cas9-매개된 DNA 절단의 최종 결과는 PAM 서열의 상류에 약 3 내지 4개의 뉴클레오티드를 발생하는 표적 DNA 내의 이중 가닥 절단 (double strand break) (DSB)이다.

그후 생성된 DSB는 두 가지 일반적인 복구 경로, 효율적이지만 오류가 발생하기 쉬운 비상동성 말단 봉합 (NHEJ) 경로와 덜 효율적이지만 충실도가 높은 상동성 유도된 수선 (homology directed repair; HDR) 경로 중 하나에 의해 복구될 수 있다. 일부 실시양태에서, 성 염색체 W 또는 Z 내의 특정 표적 유전자좌에의 본 발명의 리포터 유전자의 특이적 통합을 초래하는 삽입은 Cas9에 의해 유발된 DSB의 복구의 결과이다. 일부 특정 실시양태에서, 본 발명의 리포터 유전자는 HDR에 의해 표적 유전자좌에 통합되거나 녹-인된다.

본원에서 사용되는 용어 "상동성 유도된 수선 ( HDR )"은 세포가 이중 가닥 DNA 병변을 복구하는 메카니즘을 가리킨다. HDR의 가장 일반적인 형태는 상동 재조합이다. HDR 복구 메커니즘은 주로 세포 주기의 G2 및 S 단계에서 핵에 존재하는 DNA의 상동체 조각이 있을 때만 세포에 의해 사용될 수 있다. 상동체 DNA 조각이 없는 경우, 비상동성 말단 봉합 (NHEJ)이라고 불리는 다른 과정이 대신 일어날 수 있다. 게놈 편집을 위한 프로그램 가능한 조작된 뉴클레아제 (PEN) 전략은 특정 이중 가닥 DNA 절단 후 HDR 메커니즘의 세포 활성화에 기반한다.

앞서 논의된 바와 같이, Cas9는 두 개의 뉴클레아제 도메인, RuvC 및 HNH의 결합된 활성을 통해 이중 가닥 절단 (DSB)을 생성한다. 엔도뉴클레아제 활성에 중요한 각각의 뉴클레아제 도메인 내의 정확한 아미노산 잔기가 공지되어 있으며 (S. 피오게네스 Cas9에서 HNH의 경우 D10A 및 RuvC의 경우 H840A) 단지 하나의 활성 촉매 도메인을 함유하는 Cas9 효소의 변형된 버전 ("Cas9 틈내기효소"라고 불림)이 생성되었다. Cas9 틈내기효소는 여전히 gRNA 특이성에 기초하여 DNA에 결합하지만, 틈내기효소는 DNA 가닥 중 하나만을 절단할 수 있어서 DSB 대신 "흠(nick)" 또는 단일 가닥 절단을 초래한다. DNA 흠은 손상되지 않은 상보적 DNA 가닥을 주형으로 사용하여 HDR (상동성 유도된 수선)에 의해 신속하게 복구된다. 따라서, 반대쪽 가닥을 표적화하는 두 개의 틈내기효소가 표적 DNA 내에서 DSB를 생성하는데 필요하다 (종종 "이중 흠" 또는 "이중 틈내기효소" CRISPR 시스템이라고 함). DSB를 유발할 수 있을 정도로 근접한 거리 내에 두 개의 부정확한 흠 (off-target nick)이 생성될 가능성이 낮기 때문에 이러한 요건은 표적 특이성을 크게 증가시킨다. 따라서, 본 발명은 특이성을 증가시키고 부정확한 효과를 감소시키기 위해 이중 흠-유도 DSB를 생성하기 위한 이중 틈내기효소 접근법의 사용을 추가로 포함하는 것으로 이해해야 한다.

따라서, 특정 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/CRISPR-연관된 엔도뉴클레아제 9 (Cas9) 시스템에 의해 매개된 상동성 유도된 수선 (HDR)에 의해 유전자이식 조류 대상체, 특히 동물의 성 염색체에 통합될 수 있다.

상기 나타낸 바와 같이, CRISPR 타입 II 시스템은 적어도 두 개의 요소, 뉴클레아제, 특히, Cas9 및 가이드 RNA를 포함한다. 따라서, Cas9 또는 Cas9를 암호화하는 임의의 핵산 서열 이외에, 본 발명에 의해 사용된 리포터 유전자를 유전자이식 조류 대상체의 성 염색체에 삽입 및 통합시키기 위해, 본 발명은 Cas9를 특정 성 염색체 내의 표적 부위로 표적화하는 가이드 RNA 또는 이러한 gRNA를 암호화하는 임의의 핵산 서열을 추가로 제공한다. 일부 추가의 실시양태에서, 본 발명의 키트의 gRNA는 적어도 하나의 CRISPR RNA (crRNA) 및 적어도 하나의 전사-촉진 crRNA (tracrRNA)를 포함할 수 있다.

일부 대안적인 실시양태에서 본 발명의 키트는 적어도 하나의 gRNA를 암호화하는 핵산 서열을 포함할 수 있다. 이러한 핵산 서열은 표적화하는 적어도 하나의 스페이서 서열을 포함하는 CRISPR 어레이를 포함할 수 있으며 따라서 표적 게놈 DNA 서열에서의 적어도 하나의 프로토스페이서와 동일하다. 핵산 서열은 적어도 하나의 tracrRNA를 암호화하는 서열을 추가로 포함한다는 것을 주지해야 한다.

여전히 추가로, 일부 실시양태에서, 조류 대상체, 또는 동물의 적어도 하나의 세포 또는 조류 대상체, 또는 동물에 도입된 적어도 하나의 세포를 (a) CRISPR Cas9 시스템의 요소들, 특히, 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 성 염색체 Z 또는 W 내에 프로토스페이서를 표적화하는 적어도 하나의 가이드 RNA (gRNA), 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 적어도 하나의 리포터 유전자가 유전자이식 조류 대상체, 특히 동물의 성 염색체에 통합될 수 있다. 일부 실시양태에서, (a)의 CRISPR Cas9 시스템의 요소가 핵산 서열의 형태로 제공되는 경우에, 이들은 상이한 요소를 포함하는 하나의 핵산 분자 (본원에서 "제1 핵산 서열"이라고 함) 또는 둘 이상의 핵산 분자로 제공될 수 있으며, 각각은 상기 나타낸 요소들 중 하나, 특히 gRNA 및 Cas9를 암호화하는 서열을 포함한다는 것을 주지해야 한다.

따라서, 본 발명의 방법에 의해 사용되는 유전자이식 조류 동물의 제조를 위해, 적어도 두 개의 핵산 분자가 제공되어야 한다.

여전히 추가로, "gRNA" 또는 "표적화 RNA"는, 이것을 암호화하는 CRISPR 시스템의 일부로부터 전사되는 경우, 본원에서 프로토스페이서라고 하는 표적 게놈 DNA의 DNA 서열과 동일하거나 (RNA의 경우에 T를 U로 대체하는 것을 제외함) 또는 상보적인 (따라서 "표적") RNA 서열의 적어도 하나의 세그먼트를 포함하하는 RNA이다. 본 개시내용의 CRISPR 시스템은 임의로 하나 이상의 표적화 RNA를 암호화할 수 있고, 표적화 RNA는 게놈 DNA에서 하나 이상의 표적 서열에 지시될 수 있다. "프로토 -스페이서"는, 본원에서 사용되는 바와 같이, 표적 염색체 내의 표적 서열을 가리킨다. 이러한 프로토-스페이서는 본 발명의 방법 및 키트의 gRNA를 암호화하는 핵산 서열 내에 포함된 CRISPR 스페이서에 의해 암호화된 표적화 RNA에 대해 충분한 상보성을 갖는 핵산 서열을 포함한다.

본 발명의 방법, 뿐만 아니라 이하 본원에 기술된 키트는 핵산 서열을 제공한다. 본원에서 사용되는 바와 같이, "핵산 또는 핵산 분자"는 용어 "폴리뉴클레오티드(들)"와 상호교환 가능하며 이것은 일반적으로 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA 또는 이들의 임의의 조합일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리-데옥시리보뉴클레오티드를 가리킨다. "핵산"은, 제한함이 없이, 단일- 및 이중-가닥 핵산을 포함한다. 본원에서 사용되는 용어 "핵산(들)"은 또한 하나 이상의 변형된 염기를 함유하는 상기한 바와 같은 DNA 또는 RNA를 포함한다. 본원에서 사용되는 용어 "올리고뉴클레오티드"는 2개 이상의 데옥시리보뉴클레오티드 및/또는 리보뉴클레오티드, 및 바람직하게는 3개 이상으로 이루어진 분자로서 정의된다. 이의 정확한 크기는 많은 요인에 따라 좌우되며, 이러한 요인들은 올리고뉴클레오티드의 궁극적인 기능 및 사용에 따라 좌우된다. 올리고뉴클레오티드는 약 8 내지 약 1,000개의 뉴클레오티드 길이일 수 있다. 보다 특히, 본 발명의 키트에 의해 사용되는 올리고뉴클레오티드/들은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000개 또는 그 이상의 염기의 길이 중의 하나를 포함할 수 있다.

핵산 분자는 자연 발생 뉴클레오티드인 단량체 (예를 들어 DNA 및 RNA), 또는 자연 발생 뉴클레오티드의 유사체 (예를 들어, 자연 발생 뉴클레오티드의 알파-거울상이성체 형태), 또는 변형된 뉴클레오티드 또는 이들의 임의의 조합으로 구성될 수 있다. 본원에서 이 용어는 또한 cDNA, 즉 역전사 효소 (RNA-의존적 DNA 폴리머라제)의 작용에 의해 RNA 주형으로부터 생성된 상보적 또는 카피 DNA를 포함한다.

이와 관련하여 "단리된 폴리뉴클레오티드"는 유기체의 게놈으로부터 분리된 핵산 분자이다. 예를 들면, 본 발명의 방법 및 키트에 의해 사용되는 리포터 유전자 또는 이의 임의의 유도체 또는 상동체, 뿐만 아니라 세포의 게놈 DNA로부터 분리된 본 발명의 방법 및 키트의 CRISPR/Cas9 및 gRNA를 암호화하는 서열을 암호화하는 DNA 분자는 단리된 DNA 분자이다. 단리된 핵산 분자의 또 다른 예는 유기체의 게놈에 통합되지 않은 화학적으로 합성된 핵산 분자이다. 특정 종으로부터 단리된 핵산 분자는 그 종으로부터의 염색체의 완전한 DNA 분자보다 작다.

일부 실시양태에서, 본 발명의 (본원에서 후술되는) 방법 및 키트에 의해 사용되는 핵산 서열, 특히, Cas9 및 gRNA, 또는 대안적으로 본 발명의 리포터 유전자를 암호화하는 서열을 포함하는 핵산 서열은 벡터, 카세트 또는 임의의 다른 비히클 내에서 작제되어 제공될 수 있다. 따라서 본 발명은 추가로, 본 발명의 폴리뉴클레오티드, 및 임의로, 본 발명의 핵산 서열에 작동 가능하게 연결된 프로모터, 조절 및 제어 요소, 번역, 발현 및 다른 신호와 같은 추가의 부가적인 요소를 포함하는 재조합 DNA 작제물에 관한 것이다. 본 발명에 의해 제공되는 벡터에 대한 비제한적인 예는 표적 성 염색체로의 리포터 유전자의 통합에 필요한 Cas9 및 특정 gRNA를 암호화하는 핵산 서열을 포함하는 임의의 벡터일 수 있다. 일부 특정 실시양태에서, 본 발명은 성 염색체 Z에 리포터 유전자를 표적화하는, 서열 번호 25로 표시되는 Cas9 및 서열 번호 26으로 표시되는 gRNA7를 암호화하는 핵산 서열을 포함하는 DNA 작제물 또는 벡터를 제공한다. 일부 추가의 실시양태에서 본 발명은 추가로, 본 발명의 리포터 유전자를 암호화하는 핵산 서열, 특히, 성 염색체, 특히, 성 염색체 Z 내의 표적 유전자좌 내로의 재조합 및 통합에 필요한 좌측 및 우측 아암이 측면에 배치되어있는 RFP를 포함하는 벡터 또는 임의의 DNA 작제물을 제공한다. 이러한 벡터에 대한 비제한적인 예는 도 15에 개시된 바와 같은 핵산 서열을 포함하는 벡터일 수 있다. 일부 추가의 실시양태에서, 서열 번호 66 및/또는 서열 번호 67 중의 적어도 하나로 표시되는 핵산 서열을 포함하는 핵산 서열.

여전히 추가로, 본 발명은 본 발명의 벡터 및 DNA 작제물, 특히 본 발명에 의해 기술된 벡터 중 어느 것을 포함하고/하거나 발현하는 임의의 숙주 세포를 추가로 포함한다.

본원에서 사용되는 용어 "재조합 DNA", "재조합 핵산 서열" 또는 "재조합 유전자"는 조류 염색체 Z 및/또는 W 내의 특정 유전자좌에서 상응하는 프로토스페이서에 Cas9를 표적화하는 본 발명의 gRNA와 함께 본 발명의 CRISPR 시스템 중 하나, 특히 CRISPR/Cas9 타입 II를 암호화하는 개방형 판독 프레임을 포함하는 핵산을 가리킨다. 일부 또 다른 실시양태에서, 본원에 사용된 바와 같은 재조합 DNA는 추가로, 본 발명의 리포터 유전자, 특히 이식유전자 (transgene)를 암호화하는 개방형 판독 프레임을 포함하는 핵산을 가리킨다.

본원에서 언급된 바와 같이, 용어 "유전자" 또는 "이식유전자"는 단백질 산물을 암호화하는 자연 발생 또는 합성 핵산을 의미한다. 용어 "핵산"은 뉴클레오티드 및 뉴클레오시드, 예를 들어, cDNA, 게놈 DNA (gDNA), mRNA 및 RNA, 올리고뉴클레오티드, 올리고뉴클레오시드, 및 이의 유도체의 천연 및/또는 합성 선형, 원형 및 순차적 어레이를 의미하는 것으로 의도된다.

어구 "작동 가능하게 연결된"은 이식유전자 전사를 허용하는 방식으로 부착됨을 의미하는 것으로 의도된다. 상기 주지된 바와 같이, 본 발명의 방법에 의해 사용되는 이식유전자는 성 염색체 Z 또는 W에 삽입하고자 하는 이식유전자, 특히, 리포터 유전자, 및 유전자 편집 시스템 (예를 들어, CRISP/Cas9 시스템)을 암호화하는 핵산 서열을 제공함으로써 제조된다. 용어 "암호화"는, 예를 들어, 대상체 핵산이 적합한 벡터 (예를 들어, 발현 벡터)에서 프로모터 및 인핸서 요소와 같은 적절한 제어 서열에 연결된 경우 및 벡터가 적절한 시스템 또는 세포에 도입된 경우 대상체 핵산이 적절한 발현 시스템에서 목적하는 폴리펩타이드 또는 대상체 단백질로 전사되고 번역될 수 있음을 의미하는 것으로 의도된다.

일부 실시양태에서, 본 발명의 방법 및 키트에 의해 제공되고 사용되는 제1 및 제2 핵산 서열 중의 적어도 하나는 벡터 내에 작제되고 포함될 수 있음을 인지해야 한다. "벡터" 또는 "비히클"은, 본원에서 사용되는 바와 같이, 플라스미드, 파지미드, 바이러스, 통합 가능한 DNA 단편, 및 기타 비히클과 같은 벡터를 포함하며, 이것은 숙주의 게놈으로의 DNA 단편의 통합을 가능하게 하거나, 또는 대안적으로, 통합되지 않은 유전자 요소의 발현을 가능하게 한다. 벡터는 전형적으로 목적하는 핵산 서열을 함유하는 자가-복제 DNA 또는 RNA 작제물, 및 적합한 숙주 세포에서 인식되고 원하는 스페이서의 번역을 수행하는 작동 가능하게 연결된 유전자 제어 요소이다. 일반적으로, 유전자 제어 요소는 원핵생물 프로모터 시스템 또는 진핵생물 프로모터 발현 제어 시스템을 포함할 수 있다. 이러한 시스템은 전형적으로 전사 프로모터, RNA 발현 수준을 높이기 위한 전사 인핸서를 포함한다. 벡터는 통상적으로 벡터가 숙주 세포와 무관하게 복제될 수 있게 하는 복제 기점을 함유한다. 일부 대안적인 실시양태에서, 본 발명에 의해 사용되는 발현 벡터는 본 발명의 원하는 리포터 유전자를 조류 성 특이 염색체 W 및/또는 Z로 통합하는데 필요한 요소를 포함할 수 있다.

따라서, 용어 "제어 및 조절 요소"는 프로모터, 종결자 및 다른 발현 제어 요소를 포함한다. 이러한 조절 요소는 문헌[Goeddel; [Goeddel., et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)]에 기술되어 있다. 예를 들어, DNA 서열에 작동 가능하게 연결된 경우 DNA 서열의 발현을 제어하는 임의의 광범위한 발현 제어 서열이 본 발명의 방법을 사용하여 임의의 원하는 단백질을 암호화하는 DNA 서열을 발현시키기 위해 이들 벡터에서 사용될 수 있다.

벡터는 적절한 제한 부위, 항생제 내성 또는 벡터-함유 세포의 선택을 위한 다른 마커를 추가로 포함할 수 있다. 플라스미드가 가장 일반적으로 사용되는 벡터의 형태이지만, 동등한 기능을 제공하고 당업계에 공지되어 있거나 공지되는 다른 형태의 벡터가 본원에서 사용하기에 적합하다. 예를 들면, 본원에 참고로 포함된 문헌[Pouwels et al., Cloning Vectors: a Laboratory Manual (1985 and supplements), Elsevier, N.Y.; and Rodriquez, et al. (eds.) Vectors: a Survey of Molecular Cloning Vectors and their Uses, Buttersworth, Boston, Mass (1988)]을 참조한다.

본 발명의 방법에 의해 사용되는 유전자이식 조류 동물을 생성하기 위해, 성 염색체 Z 또는 W 내의 특정 유전자좌에 통합된 리포터 유전자를 포함하는 조류 세포를 제조해야 한다. 이러한 세포는 일부 실시양태에서, 조류 대상체의 세포 또는 상기 대상체에 도입된 임의의 세포를 본 발명의 방법 및 키트에 의해 제공된 제1 및 제2 핵산 서열 또는 이를 포함하는 임의의 작제물, 벡터, 비히클과 접촉, 도입 또는 공동-형질감염시킴으로써 제조될 수 있다. 일부 실시양태에서, 유전자 편집 요소를 암호화하는 핵산 서열, 및 표적화된 리포터 유전자, 특히 RFP를 암호화하는 핵산 서열. 본원에서 사용되는 "형질감염"은 DNA 및 이중 가닥 RNA와 같은 유전 물질을 포유동물 세포에 삽입하는 과정을 의미한다. 세포 내로의 DNA의 삽입은 세포 자체의 기구를 사용하여 단백질의 발현 또는 생산을 가능하게 한다. 따라서, 본원에 사용된 바와 같은 공동-형질감염은 적어도 2개의 상이한 핵산 분자 또는 이를 포함하는 임의의 벡터를 각각의 단일 세포에 동시 형질감염시킴을 가리킨다. 여전히 추가로, 형질감염시키고자 하는 핵산 서열은 단기간 동안 일시적으로 발현되거나, 게놈 DNA에 통합될 수 있으며, 여기서 변화는 세포가 분열함에 따라 세포에서 세포로 전달된다.

따라서, 본 발명은 리포터 유전자, 특히, 이의 성 염색체 (특히, Z 및/또는 W)에 통합된 적색 형광 단백질 (RFP)의 발현에 기초한 in- ovo 조류 배아의 in- ovo 성 감별을 위한 방법을 제공한다. "발현"은 일반적으로 유전자-암호화된 정보가 세포에 존재하고 작동하는 구조로 변환되는 과정을 가리킨다. 따라서, 본 발명에 따르면 리포터 유전자의 "발현"은 특히 폴리뉴클레오티드로의 전사, 단백질로의 번역, 또는 심지어 단백질의 번역후 변형을 가리킬 수 있다.

유전자이식 조류 대상체의 성 염색체 내의 특정 표적 유전자좌로의 리포터 유전자의 삽입 및 특이적 통합은 일부 실시양태에서 특정 gRNA 및 통합되어야 하는 리포터의 핵산의 핵산 서열을 포함하는 CRISPR/Cas9 시스템의 제공을 포함할 수 있다. 통합을 촉진하고 가능하게 하기 위해, 리포터 유전자는, 일부 실시양태에서, 표적화된 통합 부위 측면에 있는 서열과 상동이하고 이에 의해 재조합을 가능하게 할 수 있는 서열이 측면에 있어야 한다. 따라서, 일부 추가의 특정 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 상동성 아암(homologous arm)이 측면에 있을 수 있다. 일부 실시양태에서, 이러한 아암이 필요하며 따라서 통합 부위에서 리포터 유전자의 HDR을 촉진시킨다는 것을 인지해야 한다.

보다 특정한 실시양태에서, 본 발명의 방법에 의해 사용된 제2 핵산 서열의 리포터 유전자는 HDR를 통한 특이 통합을 촉진시키기 위한 통합 부위로서 작용하는 성 염색체 Z 또는 W 내의 표적 유전자좌 내에 포함된 전부, 전체 또는 완전한 적어도 하나의 핵산 서열과 상동성이거나 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상동성 또는 동일성을 보이는 2개의 아암이 측면에 있을 수 있다. 특정 실시양태에서, 표적 서열을 본원에서는, 본 발명에 의해 사용되는 gRNA의 일부인 "스페이서" 서열에 의해 인식되고 제1 핵산 서열에 의해 제공되는 적어도 하나의 "프로토-스페이서"라고 한다.

본원에서 사용되는 용어 "상동성 아암 (Homologous arms)"은 (어떠한 PEN이 사용되는지에 따라) 변형하고자 하는 표적 서열을 둘러싸는 일정량의 상동성을 보유하는, 유전자에의 새로운 요소의 특정 돌연변이 또는 삽입을 생성하는데 사용되는, 특정 벡터 또는 바이러스에 도입되는 HDR 주형을 가리킨다. 일부 추가의 특정 실시양태에서, CRISPR이 PEN로서 사용되는 경우, 아암 서열 (좌측, 상류 및 우측, 하류)은 약 10 내지 5000 bp, 특히 약 50 내지 1000 bp, 100 내지 500, 특히 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000bp를 포함할 수 있다.

일부 추가의 실시양태에서, 본 발명의 방법 및 키트에 의해 제공된 제1 핵산 서열에 의해 암호화된 gRNA 내의 표적화 서열은 본워에서 "스페이서" 서열이라고도 하며, 본원에서 "프로토-스페이서"라고 하는 성 염색체 Z 또는 W 내의 표적 유전자좌 내에 포함된 전체, 완전 또는 전부의 적어도 하나의 핵산 서열과 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상동성 또는 동일성을 나타낸다.

일부 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이 프로모터, 배아 특이 프로모터 (예를 들면 α-글로빈 프로모터) 및 유도성 프로모터 (예를 들면 대두 SSU 유전자로부터 유래되거나 파슬리 칼콘 신타제 CHS 프로모터로부터 유래된 광-유도성 프로모터, 또는 청색 광으로 조명될 때 발현을 활성화시키는 박테리아성 광-산소-전압 단백질인 EL222의 조작된 버전) 중 어느 하나에 작동 가능하게 연결될 수 있다. 보다 특정한 실시양태에서, 리포터 유전자는 배아 프로모터의 제어하에 있을 수 있으며, 이에 의해 유전자이식 리포터 유전자의 발현을 배아 단계로 제한하고 성체 병아리에서는 발현되지 않게 한다. 이러한 실시양태에서, 리포터 이식유전자는 진단 목적으로 배아 단계에서만 사용되고 발현될 수 있다.

보다 구체적으로, 본원에서 사용되는 "프로모터"는 하류에 위치한 유전자의 발현을 제어하는 능력을 갖는 DNA의 특정 영역을 가리킨다. 따라서, "병아리에서 성에 특이적인 프로모터"는 이하에서 특정 병아리 성별 (즉, 수컷 또는 암컷)에서만 유전자의 발현을 활성화시키는 프로모터를 가리킨다. 여전히 추가로, "병아리에서 발달에 특이적인 프로모터"는 병아리 발달의 특정 단계에서만 유전자의 발현을 활성화시키는 프로모터를 가리킨다.

일부 특정 실시양태에서, 적어도 하나의 리포터 유전자가 삽입되고 이에 의해 표적 성 염색체의 적어도 하나의 비-암호화 영역(non-coding region)에 통합될 수 있다. 이러한 접근법은 부화되지 않은 배아의 발달 및 성숙에 필요할 수 있는 유전자의 파괴를 피한다.

본원에서 사용되는 "비-암호화 영역"은 단백질 서열을 암호화하지 않는 유기체의 DNA의 성분을 가리킨다. 일부 비암호화 DNA 영역은 기능적 비-암호화 RNA 분자로 전사되고, 비암호화 DNA 영역의 다른 기능은 단백질-암호화 서열, 스캐폴드 부착 영역, DNA 복제 기점, 동원체 및 텔로미어의 전사 및 번역 조절을 포함한다. 가정된 비-기능적 부분 (또는 기능이 알려지지 않은 DNA)은 종종 "정크 DNA (junk DNA)"라고 한다.

일부 특정 실시양태에서, 유전자이식 조류 동물을 제조하기 위해 본 발명의 방법에 의해 사용되는 적어도 하나의 리포터 유전자는 성 Z 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, Z 염색체의 특정 유전자좌는 암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.

일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 특히 서열 번호 17로 표시된 성 Z 염색체 유전자좌 42172748-42177748에서의 적어도 하나의 부위에 통합될 수 있다. 일부 추가의 특정 실시양태에서, Z 염색체 내의 특정 유전자좌에 통합시키기에 적합한 gRNA 서열은 Z 염색체 유전자좌 chrZ_42174515_-1 내에 위치한 프로토스페이서에 지시된 gRNA7을 포함할 수 있지만 이에 제한되지 않는다. 일부 특정 실시양태에서, gRNA는 gRNA7로 명명된 gRNA일 수 있다. 보다 특정한 실시양태에서, 이러한 gRNA7은 서열 번호 26으로 또한 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함할 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 본 발명에 의해 제공되는 리포터 유전자, 특히 RFP를 암호화하는 서열은 이의 5'에 좌측 아암이 측면에 있고 이의 3'에 우측 아암이 측면에 있을 수 있다. 일부 추가의 특정 실시양태에서, 좌측 아암은 서열 번호 31로 표시된 핵산 서열을 포함할 수 있고, 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

일부 추가의 특정 실시양태에서, 리포터 유전자를 Z 염색체 내의 이러한 특정 위치에 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 어느 하나로 표시된 바와 같은 핵산 서열을 포함할 수 있다.

일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

Z 염색체 내의 특정 유전자좌로의 통합을 위해 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.

추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

일부 대안적인 실시양태에서, 적어도 하나의 리포터 유전자는 성 W 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, W 염색체에서의 특정 유전자좌는 위치 1022859-1024215일 수 있다. 일부 특정 실시양태에서, 표적 유전자좌는 서열 번호 3으로 표시된 핵산 서열을 포함할 수 있다.

보다 특정한 실시양태에서, 리포터 유전자를 W 염색체 내의 이러한 특정 위치로 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 1 및 2 중의 어느 하나로 표시된 핵산 서열을 포함할 수 있으며, 이들 gRNA를 본원에서는 각각 gRNA1 및 gRNA2라고 명명한다.

일부 보다 특정한 실시양태에서, 유전자이식 조류 암컷을 제조하기 위해 본 발명의 방법에 의해 사용되는 gRNA는 서열 번호 1로 표시된 핵산 서열 (gRNA1)을 포함할 수 있다. 이러한 경우에, 상기 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 W 염색체에서의 상기 특정 유전자좌로의 이의 통합을 촉진시키는, 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 이러한 아암을 또한 본원에서는 각각 좌측 및 우측 아암이라고 한다는 것을 인지해야 한다.

일부 대안적인 실시양태에서, 본 발명의 유전자이식 조류 암컷을 제조하기 위해 사용되는 gRNA는 서열 번호 2로 표시된 핵산 서열 (gRNA2)을 포함할 수 있다. 이러한 경우에 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 이러한 아암을 또한 본원에서는 각각 좌측 및 우측 아암이라고 한다는 것을 인지해야 한다.

조류 숙주의 접합자 세포의 유전자좌가 외인성 서열, 특히, 본 발명에 의해 사용되는 리포터 유전자로 표적화 및/또는 형질감염된 경우, 이러한 세포를 사용하여 유전자이식 동물을 생성하는 것이 바람직할 수 있다. 이러한 절차를 위해, 표적화 작제물을 배아 줄기 (ES) 세포에 도입한 후, 세포를 적절한 배지, 예를 들면, 성장 인자 및 사이토킨, 태아 소 혈청 및 항생제가 보충된 DMEM에서 피더 층에 평판배양할 수 있다. 배아 줄기 세포는 단일 표적화된 유전자좌 (이형접합성) 또는 표적화된 유전자좌 둘 다 (동형접합성)를 가질 수 있다. 작제물을 함유하는 세포는 선택 배지를 사용함으로써 검출될 수 있고 콜로니가 성장하기에 충분한 시간 후에 콜로니를 선택하고 유전자 표적화의 발생에 대해 분석할 수 있다. 일부 특정 실시양태에서, 작제물 서열 내부 및 외부의 프라이머를 사용하여, 표적 유전자좌로의 원하는 외인성 서열의 통합을 확인하기 위해 PCR이 적용될 수 있다. 유전자 표적화를 보이는 콜로니가 그후 조류 배아에 주사하기 위해 사용될 수 있다. ES 세포를 그후 트립신화할 수 있고 변형된 세포를 알의 측면에서 만들어진 개구부를 통해 주입할 수 있다. 알을 밀봉한 후, 부화할 때까지 알을 적절한 조건에서 배양할 수 있다. 새로 부화한 조류는, 예를 들면 이의 생물학적 샘플, 예를 들어 혈액 샘플을 검사함으로써 표적 작제물 서열의 존재에 대해 시험할 수 있다. 조류가 성숙에 도달한 후, 이들은 새끼를 낳으며 이들의 자손을 외인성 통합 서열이 생식선을 통해 전달되는지 여부를 결정하기 위해 검사할 수 있다.

생식선을 통해 유전적 변형을 전달할 수 있는 변형된 배아 줄기 세포 또는 접합자 세포로부터 부분적으로 유래되는 키메라 조류가 생성된다. 외인성 서열, 특히 본 발명에 의해 사용되는 리포터 유전자, 또는 이의 일부를 함유하는 조류 품종을 조류 야생형 유전자좌, 또는 이의 일부가 회복된 품종과 교배하면 in- ovo 검출 가능한 성별을 나타내는 후대를 야기해야 한다.

여전히 추가로, 유전자이식 조류는 또한 다른 방법들에 의해 생산될 수 있으며, 이들 중 일부는 아래에 논의되어 있다. 유전자이식 동물을 생성하기 위한 형질전환에 적합한 조류 세포 중에는 원시 생식 세포 (PGC), 정자 세포 및 접합자 세포 (배아 줄기 세포 포함)가 있다. 정자 세포는 전기천공법, 미세입자 충격, 리포펙션 등을 포함하는 임의의 적합한 방법에 의해 DNA 작제물로 형질전환될 수 있다. 정자는 조류의 인공 수정에 사용될 수 있다. 수정된 조류의 후대를 상기 기술된 바와 같이 외인성 서열에 대해 검사할 수 있다.

대안적으로, 원시 생식 세포는 조류 알로부터 단리되고, 임의의 적절한 방법에 의해 본 발명의 외인성 리포터 유전자로 형질감염되고, 새로운 배아로 옮겨지거나 삽입될 수 있으며, 여기서 이들은 발달중인 생식선에 통합될 수 있다. 부화된 조류 및 이들의 후대를 본 발명에 의해 기술된 바와 같이 외인성 리포터 유전자 서열에 대해 검사할 수 있다.

또 다른 접근법에서, 알로부터 단리된 분산된 배반엽 세포는 외인성 리포터 유전자 서열 또는 이의 일부를 성 특이 염색체 Z 또는 W에 통합시킨 다음 무손상 알의 배하강에 주입하는 임의의 적절한 수단에 의해 형질감염시킬 수 있다. 부화된 조류 대상체 및 이들의 후대를 상기 기술된 바와 같이 외인성 리포터 유전자에 대해 검사할 수 있다.

닭 원시 생식 세포 (PGC)는 난자와 정자의 전구물질이다. 따라서, 이의 일부 실시양태에서, 본 발명은 리포터 유전자 작제물로 및 성 특이 염색체 및/또는 Z로의 리포터 유전자의 통합을 지시하는 CRISPR/Cas9 gRNA 작제물로 공동-형질감염된 PGC를 사용하는 생식선 전달 시스템을 통한 유전자이식 닭의 생산을 제공한다. PGC를 분류하고 생식선 전달을 위해 2.5일 수용자 배아의 혈류로 옮긴다.

PGC는 생식체 (gamete)의 전구물질이며 포유동물과 비교할 때 새에서 초기 배아발생 동안 독특한 이동 활성을 보인다. 조류 배아에서, PGC는 먼저 에피블라스트 (epiblast)에서 발생하고 배양 후 대략 18-19시간에 단계 4 (HH)에서 생식 신월환의 내배엽 (hypoblast)으로 이동한다. 단계 10 및 12 (HH) 사이에서, PGC는 생식 신월환에서 혈류로 이동하고, 이들이 생식 융기에 도달하고 발달하는 생식선을 콜로니화할 때까지 순환계를 통해 이동한다. 이것은 PGC가 배아 조직을 통해 이동하여 발달하는 생식선에 도달하는 포유동물과 대조된다. 혈류를 통한 조류 PGC 이동의 이러한 독특한 특징이 닭의 유전자 변형에서 주요한 진보를 촉진시켰다.

따라서, 일부 특정 실시양태에서, "유전자이식 조류 동물의 제조"는 게놈 변형으로 닭을 생산하기 위한 유전 공학 기술을 포함하는 다단계 방법을 가리키며 여기서 a) 원시 생식 세포 (PGC)를 2일령 병아리 배아의 혈액으로부터 단리하는 단계; b) 이식유전자 작제물을, 예를 들면, 렌티바이러스 시스템, Piggybac 트랜스포손 벡터, TALENS 또는 CRISPR/Cas9 기술을 사용함으로써 배양된 PGC에 삽입하는 단계; (c) 유전자이식 PGC를 확인하고 배아의 순환계로 주입하고 발달하는 생식선으로 이동시키는 단계; d) 수용자 배아를 부화할 때까지 37℃에서 배양하는 단계; (d) 부화된 수컷을 성적으로 성숙시켜 야생형 암탉과 교배하는 단계; (e) 자손을 선별하여 유전자이식 PGC로부터 유래된 것들을 식별하는 단계.

따라서, 제2 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본원에서는 또한 유전자좌라고 함)에 통합된 적어도 하나의 외인성 리포터 유전자를, 이의 적어도 하나의 세포에, 포함하는 조류 유전자이식 동물 또는 대상체에 관한 것이다.

용어 "조류"는 깃털, 이가 없는 부리 턱, 껍질이 딱딱한 알의 산란, 높은 대사율, 4실의 심장, 및 경량이지만 강한 골격을 특징으로 하는 새로부터 유래한 임의의 종과 관련이 있다. 조류 종은, 제한함이 없이, 닭, 메추라기, 칠면조, 오리, 갈리나세아 종 (Gallinacea sp), 거위, 꿩 및 기타 가금류를 포함한다. 용어 "암탉"은 조류 종의 모든 암컷을 포함한다. "유전자이식 조류"는 일반적으로 이종 DNA 서열, 또는 조류의 생식 세포에 염색체에 의해 통합된 조류에 통상적으로 내인성인 하나 이상의 추가 DNA 서열 (총괄하여, 본원에서는 "이식유전자"라고 함)을 갖는 조류를 가리킨다. 이러한 전달 및 통합의 결과로, 전달된 서열은 생식 세포를 통해 유전자이식 조류의 자손에게 전달될 수 있다. 유전자이식 조류 (이의 후대 포함)는 또한 체세포의 성 염색체에 통합된 이식유전자를 갖는다.

일부 특정 실시양태에서, 본 발명의 적어도 하나의 유전자이식 동물은 적어도 두 개의 상이한 리포터 유전자를 포함할 수 있다. 이러한 경우에, 각각의 리포터 유전자가 성 염색체 Z 및/또는 W 중의 하나에서 적어도 하나의 위치 또는 장소에 통합될 수 있다. 일부 추가의 실시양태에서 각각의 리포터 유전자는 성 염색체 Z 및/또는 W 중의 하나에서 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개 또는 그 이상의 위치 또는 장소에 통합될 수 있다.

일부 추가의 실시양태에서, 본 발명의 유전자이식 동물 내에 포함된 리포터 유전자는 적어도 하나의 형광 리포터 유전자일 수 있다. 임의의 리포터 유전자 및 특히, 본 발명에 의해 개시된 임의의 형광 리포터 유전자, 특히 본 발명의 또 다른 측면과 관련하여 상기 본원의 표 1에 개시된 것들이 또한 본 발명에 의해 제공된 유전자이식 조류 대상체와 관련하여 적용될 수 있음을 인지해야 한다.

보다 특정한 실시양태에서, 이러한 형광 리포터 유전자는 적어도 하나의 적색 형광 단백질 (RFP)을 포함할 수 있거나 적어도 하나의 적색 형광 단백질 (RFP)일 수 있다. 그러나, 일부 실시양태에서, 본 발명의 유전자이식 조류 대상체에 의해 이식유전자로서 발현된 리포터 유전자는 임의의 형광 단백질, 예를 들어, RFP, YFP, BFP 등일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아님을 주지해야 한다. 즉, 일부 특정 실시양태에서 본 발명에 의해 제공된 유전자이식 동물의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질 일 수 있으며 단 상기 형광 단백질은 GFP가 아니다.

특정 실시양태에서, 본 발명에 의해 제공된 적어도 하나의 유전자이식 조류 동물은 암컷일 수 있다. 보다 특정한 실시양태에서, 이러한 유전자이식 조류 암컷에서 적어도 하나의 리포터 유전자는 암컷 염색체 Z의 적어도 하나의 위치에 통합될 수 있다.

일부 대안적인 실시양태에서, 암컷 염색체 W의 적어도 하나의 위치에 통합된 적어도 하나의 리포터 유전자를 갖는 적어도 하나의 유전자이식 조류 동물은 암컷일 수 있다.

일부 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 유전자이식 동물은 이의 두 개의 성 Z 염색체 중의 적어도 하나에 통합된 이식유전자 리포터 유전자를 보유하는 유전자이식 수컷 대상체일 수 있다. 일부 추가의 실시양태에서, 본 발명에 의해 제공된 유전자이식 동물은 이의 두 개의 성 Z 대상체 중의 하나에 통합된 이식유전자 리포터 유전자를 보유하는 유전자이식 수컷 대상체일 수 있다. 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 유전자이식 동물은 이의 두 개의 성 Z 대상체 중의 두 개에 통합된 이식유전자 리포터 유전자를 보유하는 유전자이식 수컷 대상체일 수 있다.

일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 PEN을 사용하여 본 발명의 유전자이식 동물의 성 염색체에 통합될 수 있다. 본 발명의 방법과 관련하여 상기 주지된 바와 같이, 임의의 유전 공학 시스템 또는 임의의 PEN, 특히 임의의 RNA 유도 시스템, 예를 들면, CRISPR, TALEN, ZFN 등 중의 하나가 사용될 수 있다.

보다 특히, 이러한 PEN이 사용될 수 있고, 특정 실시양태에서, CRISPR 시스템이 사용될 수 있다. 보다 특정한 실시양태에서, CRISPR 클래스 2 시스템이 본 발명의 유전자이식 동물을 생성하는데 사용될 수 있다. 일부 추가의 특정 실시양태에서, CRISPR 타입 II 시스템이 사용될 수 있다.

보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/Cas9 시스템에 의해 매개된 HDR에 의해 본 발명의 유전자이식 조류 동물의 성 염색체에 통합될 수 있다.

보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 이러한 조류 동물/대상체의 적어도 하나의 세포, 또는 상기 조류 동물에 도입하고자 하는 적어도 하나의 세포를 적어도 두 개의 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 본 발명의 유전자이식 조류 동물의 성 염색체에 통합될 수 있다. 보다 구체적으로, 이러한 세포는 (a) 유전자 편집 시스템의 적어도 하나의 성분, 특히, 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체, Z 또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하여 CRISPR 매개된 통합을 제공하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열 또는 이의 임의의 단편과 접촉하거나 공동-형질감염될 수 있다.

보다 특정한 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 상동성 아암이 측면에 배치되어있을 수 있다. 이러한 아암은 표적 성 염색체 내의 통합 표적 부위와 상동성을 나타내어, 통합 부위에서 HDR을 촉진시킨다.

보다 특정한 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결될 수 있다. 이러한 프로모터는, 일부 실시양태에서, 본 발명의 리포터 유전자의 발현을 특정의 원하는 성 (성 특이 프로모터의 경우), 특정의 배아 단계 (배아 특이 프로모터) 또는 특정 조건 (유도성 조건)에 제한할 수 있다.

일부 추가의 특정한 실시양태에서, 본 발명의 유전자이식 조류 동물 내에 포함된 적어도 하나의 리포터 유전자는 이의 성 염색체 중의 하나의 적어도 하나의 비-암호화 영역에 통합될 수 있다.

일부 추가의 대안적인 실시양태에서, 본 발명의 유전자이식 조류 동물은 성 Z 염색체에서 적어도 하나의 부위에 통합된 적어도 하나의 리포터 유전자를 포함할 수 있다. 일부 특정의 비제한적인 실시양태에서, 이러한 조류 유전자이식 동물은 Z 염색체에 통합된 유전자이식 리포터 유전자를 보유하는 암컷일 수 있다. 보다 특정한 실시양태에서, Z 염색체의 특정 유전자좌는 암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.

일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 특히 서열 번호 17로 표시된 성 Z 염색체 유전자좌 42172748-42177748의 적어도 하나의 부위에 통합될 수 있다. 일부 추가의 특정 실시양태에서, Z 염색체 내의 특정 유전자좌에 통합시키기에 적합한 gRNA 서열은 Z 염색체 유전자좌 chrZ_42174515_-1 내에 위치한 프로토스페이서에 지시된 gRNA7을 포함할 수 있지만 이에 제한되지 않는다. 일부 특정 실시양태에서, gRNA는 gRNA7로 명명된 gRNA일 수 있다. 보다 특정한 실시양태에서, 이러한 gRNA7은 서열 번호 26으로 또한 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함할 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 본 발명에 의해 제공되는 리포터 유전자, 특히 RFP를 암호화하는 서열은 이의 5'에 좌측 아암이 측면에 있고 이의 3'에 우측 아암이 측면에 있을 수 있다. 일부 추가의 특정 실시양태에서, 좌측 아암은 서열 번호 31로 표시된 핵산 서열을 포함할 수 있고, 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

일부 보다 특정한 실시양태에서, 리포터 유전자를 유전자이식 조류 대상체에서 Z 염색체 내의 이러한 특정 위치에 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 어느 하나로 표시된 바와 같은 핵산 서열을 포함할 수 있다.

일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 유전자이식 조류 대상체의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 유전자이식 조류 대상체에서 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

본 발명의 유전자이식 조류 대상체의 Z 염색체 내의 특정 유전자좌로의 통합을 위해 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.

추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 유전자이식 조류 대상체의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

일부 추가의 대안적인 실시양태에서, 적어도 하나의 리포터 유전자는 본 발명의 유전자이식 조류 대상체의 성 W 염색체에서 적어도 하나의 부위에 통합될 수 있다. 일부 특별한 실시양태에서, 통합 부위는 W 염색체에서 유전자좌 1022859-1024215, 특히 염색체 W:1022859-1024215의 galGal5_dna 범위에 위치할 수 있다. 일부 추가의 특정 실시양태에서, 이러한 유전자좌는 서열 번호 3으로 표시된 핵산 서열을 포함한다.

상기한 유전자좌 내의 임의의 위치에서의 본 발명의 리포터 유전자의 특이적 통합을 위해, 특정 gRNA가 필요할 수 있다. 따라서, 일부 특정의 비제한적인 실시양태에서, 본 발명의 유전자이식 조류 동물의 제조에 사용되는 적합한 gRNA는 서열 번호 1 및 2 중의 어느 하나로 표시된 핵산 서열을 포함할 수 있다. 일부 특정 실시양태에서, 이러한 gRNA를 본원에서 각각 gRNA1 및 gRNA2라고 한다.

일부 특별한 실시양태에서, 본 발명에 의해 제공된 유전자이식 조류 동물은 서열 번호 1로 표시된 핵산 서열을 포함하는 gRNA1을 사용하여 제조되었다. 이러한 특정 위치에서의 본 발명의 리포터 유전자의 통합을 가능하게 하기 위해, 통합되어야 하는 리포터 유전자는, 특정 실시양태에서, 사용된 gRNA에 의해 지시된 표적 통합 부위에서의 이의 삽입을 촉진시키는 특정 아암을 보유해야 한다. 따라서, 일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 제2 핵산 서열 내에 포함될 수 있으며, 여기서 이러한 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있다.

일부 대안적인 실시양태에서, 본 발명에 의해 제공된 유전자이식 조류 동물은 서열 번호 2로 표시된 핵산 서열을 포함하는 gRNA2를 사용하여 제조될 수 있다. 이러한 경우에, 상기 gRNA2에 의해 인식된 특정 위치에서의 본 발명의 리포터 유전자의 통합을 가능하게 하기 위해, 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 특정 실시양태에 따르면 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.

본 발명은 본 발명의 방법 중 어느 것, 특히 본원에 논의된 바와 같은 난내 성 감별을 위한 방법에서 사용하기 위한 본원에 기술된 바와 같은 임의의 유전자이식 조류 대상체를 추가로 포함함을 추가로 인지해야 한다.

일부 부가적인 실시양태에서, 본 발명은 본 발명의 방법 중 어느 것에서 사용하기 위한, 본 발명에 의해 제공된,특히 상기 논의된 바와 같은 임의의 유전자이식 조류 대상체가 낳은 임의의 알의 용도를 추가로 포함한다. 또 다른 측면에서, 본 발명은 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포에 관한 것이다.

일부 특정 실시양태에서, 본 발명에 의해 제공된 세포는 조류 세포일 수 있다.

일부 특별한 실시양태에서, 본 발명에 의해 제공된 조류 세포는 원시 생식 세포 (PGC)일 수 있다.

용어 "생식 세포"는 다른 생식 세포와 연합시 생식체로 발달하는 배아 세포를 가리킨다. 본원에서 사용되는 "원시 생식 세포 ( PGC )"는 생식체의 전구물질로서 기능하고 다능성 배아 줄기 세포를 발생시키는 생식계열 줄기 세포와 관련된다. 배아발생 동안 PGC가 되도록 신호를 보내는 원장형성 배아(gastrulating embryo)의 세포는 생식 융기로 이동하여 생식선이 되고 성숙한 생식체로 분화된다.

일부 실시양태에서, 본 발명의 세포의 적어도 하나의 성 염색체에 통합된 리포터 유전자는 형광 단백질, 특히 RFP, YFP, BFP, 등 또는 표 1에 개시된 임의의 형광 단백질일 수 있다. 일부 추가의 실시양태에서 본 발명의 세포에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아니다. 즉, 일부 특정 실시양태에서 본 발명에 의해 제공된 유전자이식 세포의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며 단 상기 형광 단백질은 GFP가 아니다.

보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 프로그램 가능한 조작된 뉴클레아제 (PEN)를 사용하여 본 발명의 세포에 의해 제공된 유전자이식 조류 대상체 또는 동물의 성 염색체에 통합될 수 있다. 본원에서 사용되는 용어 "프로그램 가능한 조작된 뉴클레아제 (PEN)"는 이중 가닥 DNA 병변의 DNA 복구에 관여하고 직접적인 게놈 편집을 가능하게 하는 자연 발생 뉴클레아제로부터 유래된 특정 DNA 서열을 절단하는 합성 효소를 가리킨다. 보다 특정한 실시양태에서, PEN은 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR) 클래스 2, 특히 타입 II 시스템일 수 있다.

일부 추가의 실시양태에서, 본 발명에 의해 제공된 세포는 세포의 성 염색체에 통합된 적어도 하나의 리포터 유전자를 포함할 수 있다. 보다 특정한 실시양태에서, 리포터 유전자의 이러한 특이적 통합은 세포를 (a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 유전자 편집 시스템; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 가능해질 수 있다.

특정 실시양태에서, 본 발명의 세포에 공동-형질감염된 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어있을 수 있다.

일부 특정 실시양태에서, 본 발명에 의해 제공된 세포는 본 발명의 적어도 하나의 리포터 유전자를 세포의 Z 염색체에 통합시킴으로써 제조될 수 있다. 특정 실시양태에서, 본 발명의 세포를 제조하기 위해, 적어도 하나의 리포터 유전자는 성 Z 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, Z 염색체에서의 특정 유전자좌는 암탉의 암색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.

일부 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 세포는 성 Z 염색체 유전자좌 42172748-42177748, 특히 서열 번호 17에서 적어도 하나의 부위에의 통합을 촉진시키는 gRNA를 사용함으로써 제조될 수 있다. 일부 추가의 특정 실시양태에서, Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열은 서열 번호 26으로도 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7을 포함할 수 있지만 이에 제한되지 않는다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 31로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

보다 특정한 실시양태에서, 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 이러한 특정 위치에 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 어느 하나로 표시된 바와 같은 핵산 서열을 포함할 수 있다.

일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시된 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시된 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시된 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시된 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.

추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

일부 특별한 실시양태에서, 본 발명에 의해 제공된 세포의 염색체 W에의 리포터 유전자의 통합을 표적화하기 위해, 특정 gRNA가 사용되어야 한다. 추가의 특정 실시양태에서, gRNA는 본원에서 gRNA1이라고 하는 서열 번호 1로 표시된 핵산 서열을 포함할 수 있다. 이러한 경우에, 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.

일부 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 세포는 본원에서 gRNA2라고 하는 gRNA를 사용하여 제조될 수 있다. 특정 실시양태에서, gRNA2는 서열 번호 2로 표시된 핵산 서열을 포함할 수 있다. 이러한 특정 실시양태에서, 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.

여전히 추가로, 본 발명은 부화되지 않은 알의 수정을 검출하는 방법을 제공한다. 일부 특정 실시양태에서, 이러한 방법은 제공된 유전자이식 동물이 암컷 대상체인 경우에는 성 염색체 Z 및 W 둘 다에서 및 제공된 유전자이식 동물이 수컷인 경우에는 성 염색체 Z 둘 다에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계 (a)를 포함할 수 있다. 제2 단계 (b)에서 유전자이식 조류 대상체, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계. 다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 (암컷의 경우 표지된 모계 W 염색체 또는 Z 염색체 또는 조류 배아에서 표지된 부계 Z 염색체의 존재를 나타낸다.

일부 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물은 이의 Z 염색체 둘 다에 통합된 리포터 유전자를 갖는 수컷 대상체일 수 있다. 이러한 경우에, 이러한 유전자이식 수컷 또는 이의 임의의 정자에 의해 수정된 알에서 결정된 검출 가능한 신호는 배아가 유전자이식 리포터 유전자를 포함하는 부계 Z 염색체를 지님을 나타내며, 따라서 알은 수정된다. 여전히 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물은 이의 Z 및 W 염색체 둘 다에 통합된 리포터 유전자를 갖는 암컷 대상체일 수 있다. 이러한 경우에, 이러한 유전자이식 암컷이 지닌 알에서 결정된 검출 가능한 신호는 배아가 유전자이식 리포터 유전자를 포함하는 모계 Z 또는 W 염색체를 보유함을 나타내며, 따라서 알은 수정된다. 추가의 실시양태에서, 수정란을 검출하기 위해, 리포터 유전자, 특히 RFP 유전자를 임의의 염색체의 두 카피에 삽입하여 동형접합성 유전자이식 조류 대상체, 특히 수컷 대상체를 생성할 수 있음을 인지해야 한다. 수정란은 RFP 리포터 유전자를 지니는 것으로 검출될 것이다.

추가의 측면에서, 본 발명은 다음을 포함하는 키트를 제공한다:

(a) 적어도 하나의 유전자 편집 시스템의 적어도 하나의 성분, 특히, 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열을 포함할 수 있는 CRSPR/Cas9 시스템; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열.

일부 추가의 실시양태에서, (이하 본원에 기술된) 본 발명의 방법 및 키트에 의해 사용되는 gRNA는 적어도 하나의 CRISPR RNA (crRNA) 및 적어도 하나의 전사-촉진 crRNA (tracrRNA)를 포함할 수 있다.

일부 대안적인 실시양태에서 본 발명의 키트는 적어도 하나의 gRNA를 암호화하는 핵산 서열을 포함할 수 있다. 이러한 핵산 서열은 표적화하는 적어도 하나의 스페이서 서열을 포함하는 CRISPR 어레이를 포함할 수 있으며 따라서 표적 게놈 DNA 서열에서의 적어도 하나의 프로토스페이서와 상동성이거나 동일하다. 핵산 서열은 적어도 하나의 tracrRNA를 암호화하는 서열을 추가로 포함할 수 있음을 주지해야 한다.

일부 실시양태에서 본 발명의 개시내용에 따르는 CRISPR 어레이는 적어도 하나의 스페이서 및 적어도 하나의 반복체를 포함한다. 또 다른 실시양태에서, 본 발명은 동일하거나 상이한 표적을 표적으로 할 수 있는 수 개의 최종 gRNA 산물로 가공될 수 있는 pre-crRNA를 제공하는 옵션을 추가로 포함한다.

일부 보다 특정한 실시양태에서, 본 발명의 gRNA 내에 포함된 crRNA는 표적 게놈 DNA 서열에 상보적인 단일-가닥 리보핵산 (ssRNA) 서열일 수 있다. 일부 특정 실시양태에서, 표적 게놈 DNA 서열은 프로토스페이서 인접 모티프 (PSA) 서열의 바로 상류에 및 더 나아가 위치할 수 있다.

본원에 나타낸 바와 같이, 본 발명의 키트 및 방법의 gRNA는 표적 게놈 DNA, 이 경우, 본원에서 "프로토스페이서"라고 하는 성 염색체 Z 또는 W 내의 표적 유전자좌에, 적어도 부분적으로, 상보적일 수 있다. 특정 실시양태에서, "상보성"은 자물쇠-열쇠 원리 (lock-and-key principle)를 따르는 두 구조 사이의 관계를 가리킨다. 사실상 상보성은 DNA 복제 및 전사의 기본 원리이며, 이는 두 DNA 또는 RNA 서열 사이에 공유되는 특성이므로 이들이 서로 역평행하게 정렬될 때 서열의 각 위치에서 뉴클레오티드 염기는 상보적이다 (예를 들어, A 및 T 또는 U, C 및 G).

상기 나타낸 바와 같이, 본 발명의 키트의 gRNA에 의해 표적화된 게놈 DNA 서열은 PAM 서열의 바로 상류에 위치한다. 일부 실시양태에서, 이러한 PAM 서열은 핵산 서열 NGG일 수 있다.

특정 실시양태에서, 본 발명에 의해 언급된 PAM 서열은 N, 즉 임의의 뉴클레오티드, 특히 아데닌 (A), 구아닌 (G), 시토신 (C) 또는 티민 (T) 중 어느 하나를 포함할 수 있다. 일부 추가의 실시양태에서 본 발명에 따르는 PAM 서열은 A, G, C, 또는 T 및 두 개의 구아닌으로 구성된다.

하나의 실시양태에 따르면, 본 발명의 gRNA를 암호화하는 뉴클레오티드는 적어도 하나의 스페이서 및 임의로, 적어도 하나의 반복체를 포함할 수 있다. 일부 추가의 실시양태에서 본 발명의 gRNA를 암호화하는 DNA는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100개 또는 그 이상, 특히 110, 120, 130, 140, 150, 160, 170, 180, 190, 200개 또는 그 이상의 스페이서를 포함할 수 있다. 일부 실시양태에서, 각 스페이서는 두 개의 반복체 사이에 위치한다. 본 발명의 gRNA를 암호화하는 핵산 서열의 스페이서는 동일하거나 상이한 스페이서일 수 있음을 추가로 이해해야 한다. 더 많은 실시양태에서, 이들 스페이서는 동일하거나 상이한 표적 게놈 DNA를 표적화할 수 있다. 일부 또 다른 실시양태에서, 이러한 스페이서는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100개 또는 그 이상의 표적 게놈 DNA 서열을 표적화할 수 있다. 이들 표적서열은 단일 유전자좌 또는 대안적으로, 여러 표적 유전자좌로부터 유래될 수 있다.

본원에서 사용되는 용어 "스페이서"는 특정 서열을 표적으로 하도록 설계되고 CRISPR 어레이의 다수의 짧은 직접 반복체 (즉, CRISPR 반복체) 사이에 위치하는 비-반복 스페이서 서열을 가리킨다. 일부 특정 실시양태에서, 스페이서는 약 15 내지 약 30개 뉴클레오티드, 특히 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 뉴클레오티드. 보다 특히, 약 20-25개 뉴클레오티드를 포함할 수 있다.

본 발명의 CRISPR 시스템에 의해 암호화된 가이드 또는 표적화 RNA는 CRISPR RNA (crRNA) 및 전사 촉진 RNA (tracrRNA)를 포함할 수 있다. CRISPR 스페이서에 의해 암호화된 표적화 RNA의 서열은, 이것이 조류 게놈 DNA에서, 특히 본원에서 "프로토스페이서"라고도 하는 성 염색체 Z 또는 W 내의 표적 유전자좌에서 표적 서열에 대해 지시된다는 (즉, 이에 동일하거나 상보적인 세그먼트를 갖는) 요건을 제외하고는 특별히 제한되지 않는다. 이러한 프로토-스페이서는 본 발명의 방법 및 키트의 gRNA를 암호화하는 핵산 서열 내에 포함된 CRISPR 스페이서에 의해 암호화된 표적화 RNA에 대한 충분한 상보성을 갖는 핵산 서열을 포함한다.

일부 실시양태에서, crRNA는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40 nt의 스페이서 (표적화) 서열에 이은 19-36 nt의 반복 서열을 포함하거나 이들로 구성될 수 있다. 특정의 비제한적인 실시양태에서, 표적화 스페이서는 대표적인 스페이서 서열이 본원에 나타내어져 있는 게놈 DNA 서열 중 어느 하나를 표적화하는 세그먼트를 포함하거나 이들로 구성될 수 있다.

일부 특정 실시양태에서, 본 발명의 CRISPR 시스템의 스페이서는 표적화 가이드 RNA (gRNA)를 암호화할 수 있음을 주지해야 한다. "gRNA" 또는 "표적화 RNA"는, 이것을 암호화하는 CRISPR 시스템의 일부로부터 전사될 때, 표적 게놈 DNA의 DNA 서열과 동일하거나 (RNA의 경우 T를 U로 대체하는 것을 제외함) 또는 상보적인 (따라서 "표적") RNA 서열의 적어도 하나의 세그먼트를 포함하는 RNA이다. 본 개시내용의 CRISPR 시스템은 임의로 하나 이상의 표적화 RNA를 암호화할 수 있고, 표적화 RNA는 게놈 DNA에서 하나 이상의 표적 서열에 지시될 수 있다.

일부 실시양태에서, 본 발명의 키트에 의해 제공된 Cas9 단백질은 서열 번호 24로 표시된 핵산 서열에 의해 암호화될 수 있다. 추가의 특정한 비제한적인 실시양태에서, Cas9 단백질은 서열 번호 25로 표시된 아미노산 서열, 또는 이의 임의의 유도체, 돌연변이체 또는 변이체를 포함할 수 있다.

"아미노산 서열" 또는 "펩타이드 서열"은 펩타이드 결합에 의해 연결된 아미노산 잔기가 펩타이드 및 단백질의 사슬에 존재하는 순서임을 주지해야 한다. 서열은 일반적으로 유리 아미노 그룹을 함유하는 N-말단에서 아미드를 함유하는 C- 말단까지 기록된다. 아미노산 서열은 이것이 단백질의 1차 구조를 나타내는 경우 종종 펩타이드, 단백질 서열로 불리지만, 단백질이 특정 3 차원 구조로 접힌 아미노산 서열로 정의되고 전형적으로 인산화, 아세틸화, 글리코실화, 마노실화, 아미드화, 카복실화, 설프하이드릴 결합 형성, 절단 등과 같은 번역후 변형을 겪기 때문에 "아미노산 서열" 또는 "펩타이드 서열"과 "단백질"이라는 용어를 구별해야 한다.

"단편 또는 펩타이드"란, 상기 Cas9 또는 RFP (이하 본원에 기술됨) 분자의 분획을 의미한다. 본 발명의 임의의 아미노산 서열과 같은 분자의 "단편"은 Cas9 또는 RFP 분자의 임의의 아미노산 서브세트를 가리키는 것을 의미한다. 이것은 또한 이의 "변이체" 또는 "유도체"를 포함할 수 있다. "펩타이드"는 기능적 활성을 갖는 특정 아미노산 서브세트를 가리키는 것을 의미한다. "기능적"이란, 예를 들면, Cas9와 같은 유전자 편집을 수행하는 능력을 갖거나 RFP와 같은 검출 가능한 신호를 생성하는 것과 같은 동일한 생물학적 기능을 갖는 것을 의미한다.

본 발명은 본 발명의 RFP 또는 Cas9 분자의 임의의 변이체 또는 유도체 및 실질적으로 동일하거나 상동성인 임의의 폴리펩타이드를 포함함을 인지해야 한다. 용어 " 유도체 "는 원래의 폴리펩타이드의 활성을 변화시키지 않는 아미노산 서열 (폴리펩타이드)에 대한 임의의 삽입, 결실, 치환 및 변형을 갖는 아미노산 서열 (폴리펩타이드)을 정의하는데 사용된다. 이와 관련하여, 본 발명의 Cas9 또는 RFP 분자의 유도체 또는 단편은 Cas9 또는 RFP 분자의 활성을 감소 또는 변경시키지 않는 특히 서열 번호 25, 21, 23으로 표시된 Cas9 또는 RFP 분자의 임의의 유도체 또는 단편일 수 있다. 용어 "유도체"란 또한 이의 동족체, 변이체 및 유사체를 가리킨다. 본 발명에 따르는 관심 단백질에 대한 서열 상동성 또는 동일성을 갖는 단백질 오르소로그 또는 호모로그는 특히 본 발명에 따르는 관심 단백질, 예를 들면, 서열 번호 25, 21, 23으로 표시된 아미노산 서열을 포함하는 임의의 단백질의 전체 서열에 비해 적어도 50%, 적어도 60% 및 특히 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 그 이상을 공유할 수 있다. 특히, 서열 번호 21, 23, 25, 특히 서열 번호 21, 23, 25로 표시된 전체 서열과 적어도 50%, 적어도 60% 및 특히 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상으로 동일한 아미노산 서열을 포함하거나 이들로 구성된 호모로그.

일부 실시양태에서, 유도체는 아미노산 잔기의 삽입, 결실 또는 치환에 의해 본 발명에서 구체적으로 정의된 폴리펩타이드와는 상이한 폴리펩타이드를 가리킨다. 본원에서 사용되는 용어 "삽입/들", "결실/들" 또는 "치환/들"이란 본 발명에 의해 개시된 폴리펩타이드에의 아미노산 잔기, 1 내지 50개의 아미노산 잔기, 20 내지 1개의 아미노산 잔기, 특히 1 내지 10개의 아미노산 잔기의 임의의 첨가, 결실 또는 치환을 각각 의미한다는 것을 인지해야 한다. 보다 특히, 삽입/들, 결실/들 또는 치환/들은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 아미노산 중의 어느 하나의 것일 수 있다. 본 발명에 의해 포함되는 삽입/들, 결실/들 또는 치환/들은 변형된 펩타이드의 임의의 위치에서 및 이의 N '또는 C'말단 중의 어느 것에서 일어날 수 있음을 주지해야 한다.

아미노산 서열과 관련하여, 당업자는 암호화된 서열에서 단일 아미노산 또는 소량의 아미노산을 변경, 첨가 또는 결실시키는 핵산, 펩타이드, 폴리펩타이드, 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 첨가가 "보존적으로 변형된 변이체"이며, 여기서 변형은 화학적으로 유사한 아미노산으로의 아미노산의 치환을 야기한다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 당업계에 잘 알려져 있다. 이러한 보존적으로 변형된 변이체는 이에 더하여 본 발명의 다형성 변이체, 이종간 호모로그 및 대립유전자를 배제하지 않는다.

예를 들면, 지방족 아미노산 (G, A, I, L 또는 V)을 그룹의 다른 구성원으로 치환시키는 치환, 또는 하나의 극성 잔기를 다른 잔기로 치환시키는, 예를 들어 리신을 아르기닌으로, 아스파라긴산을 글루탐산으로, 또는 아스파라긴을 글루타민으로 치환시키는 치환이 이루어질 수 있다. 다음의 8개의 그룹 각각은 서로 보존적 치환인 다른 예시적인 아미노산을 함유한다:

1) 알라닌 (A), 글리신 (G);

2) 아스파르트산 (D), 글루탐산 (E);

3) 아스파라긴 (N), 글루타민 (Q);

4) 아르기닌 (R), 리신 (K);

5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);

6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);

7) 세린 (S), 트레오닌 (T); 및

8) 시스테인 (C), 메티오닌 (M).

따라서, 일부 실시양태에서, 본 발명은 Cas9 또는 RFP 분자 또는 이의 임의의 유도체, 특히 서열 번호 21, 23, 25 중의 어느 하나로 표시된 아미노산 서열에 대한 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상의 보존적 치환을 포함하는 유도체를 포함한다. 보다 특히, 아미노산 "치환"은 하나의 아미노산을 유사한 구조적 및/또는 화학적 특성을 갖는 다른 아미노산으로 대체, 즉 보존적 아미노산 대체의 결과이다. 아미노산 치환은 관련된 잔기의 극성, 전하, 용해도, 소수성, 친수성, 및/또는 양친매성의 유사성에 기초하여 이루어질 수 있다. 예를 들면, 비극성 " 소수성 " 아미노산은 발린 (V), 이소류신 (I), 류신 (L), 메티오닌 (M), 페닐알라닌 (F), 트립토판 (W), 시스테인 (C), 알라닌 (A), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 세린 (S), 프롤린 (P), 글리신 (G), 아르기닌 (R) 및 리신 (K)으로 이루어진 그룹으로부터 선택되고; " 극성 " 아미노산은 아르기닌 (R), 리신 (K), 아스파르트산 (D), 글루탐산 (E), 아스파라긴 (N), 글루타민 (Q)으로 이루어진 그룹으로부터 선택되며; " 양으로 하전된 " 아미노산은 아르기닌 (R), 리신 (K) 및 히스티딘 (H)으로 이루어진 그룹으로부터 선택되고 여기서 " 산성 " 아미노산은 아스파르트산 (D), 아스파라긴 (N), 글루탐산 (E) 및 글루타민 (Q)으로 이루어진 그룹으로부터 선택된다.

본 발명의 폴리펩타이드의 변이체는 본 발명의 다양한 폴리펩타이드와 같은 관심 단백질과 아미노산 수준에서 적어도 80% 서열 유사성 또는 동일성, 종종 적어도 85% 서열 유사성 또는 동일성, 90% 서열 유사성 또는 동일성, 또는 적어도 95%, 96%, 97%, 98%, 또는 99% 서열 유사성 또는 동일성을 가질 수 있다.

일부 실시양태에서, 본 발명의 키트 내에 포함된 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어있을 수 있다.

일부 추가의 특정 실시양태에서, 본 발명의 키트의 제2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결될 수 있다.

일부 추가의 대안적인 실시양태에서, 적어도 하나의 리포터 유전자는 성 Z 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, Z 염색체에서 특정 유전자좌는 암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.

일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 성 Z 염색체 유전자좌 42172748-42177748에서 적어도 하나의 부위에 통합될 수 있다. 본 발명의 키트의 제1 핵산 서열의 비제한적인 예는 서열 번호 26으로도 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7 중의 적어도 하나인 gRNA를 포함할 수 있다. 보다 특히, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 31로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

따라서, 보다 특정한 실시양태에서, 본 발명의 키트의 제1 핵산 서열은 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 적어도 하나인 gRNA를 포함할 수 있다.

추가의 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 서열 번호 41 내지 48 중의 어느 하나로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 보다 특히, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

본 발명의 키트의 제1 핵산 서열의 추가의 비제한적인 예는 서열 번호 27로도 표시된 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시된 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시된 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시된 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11 중의 적어도 하나인 gRNA를 포함할 수 있다.

추가의 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 서열 번호 31 내지 40 중의 적어도 하나로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 보다 특히, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

특정 실시양태에서, 본 발명의 키트에 의해 제공된 적어도 하나의 리포터 유전자는 성 염색체의 적어도 하나의 비-암호화 영역에, 특히 염색체 W에 통합될 수 있다. 이러한 경우에, 본 발명의 키트의 제1 핵산 서열은 본원에서 각각 gRNA1 및 gRNA2라고도 하는 서열 번호 1 및 2 중의 적어도 하나로 표시된 핵산 서열을 포함하는 적어도 하나의 gRNA를 암호화할 수 있다.

일부 특정 실시양태에서, 본 발명의 키트의 제1 핵산 서열은 gRNA1인 gRNA를 포함할 수 있다. 일부 실시양태에서, 이러한 gRNA1은 서열 번호 1로 표시된 핵산 서열을 포함할 수 있다. 이러한 경우에, 본 발명의 키트의 상기 제2 핵산 서열 내에 포함된 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.

일부 추가의 대안적인 실시양태에서, 본 발명의 키트는 이의 제1 핵산 서열에 gRNA2를 암호화하는 서열을 포함할 수 있다. 일부 특정 실시양태에서, 이러한 서열은 서열 번호 2로 표시된 핵산 서열을 암호화한다. 일부 추가의 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.

일부 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 리포터 유전자는 적어도 하나의 형광 리포터 유전자일 수 있다. 여전히 추가로, 일부 실시양태에서, 본 발명의 키트에 의해 제공된 리포터 유전자는 임의의 형광 단백질, 특히, RFP, YFP 및 본 발명에 의해 개시된 임의의 형광 단백질 또는 표 1에 개시된 임의의 형광 단백질일 수 있다. 일부 실시양태에서, 본 발명의 키트에 의해 사용된 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아니다. 즉, 일부 특정 실시양태에서 본 발명의 키트에 의해 제공된 유전자이식 동물의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며 단 상기 형광 단백질은 GFP가 아니다. 일부 추가의 실시양태에서, 리포터 유전자는 RFP일 수 있다. 보다 특정한 실시양태에서, 이러한 RFP는 서열 번호 21로 표시된 아미노산 서열, 또는 이의 임의의 상동체, 변이체, 돌연변이체 또는 유도체를 포함할 수 있다. 일부 대안적인 특정 실시양태에서, 본 발명에 의해 사용된 RFP는 서열 번호 23로 표시된 아미노산 서열, 또는 이의 임의의 상동체, 돌연변이체 또는 유도체를 포함할 수 있는 RFP일 수 있다.

일부 추가의 실시양태에서, 본 발명의 키트는 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 유전자이식 조류 동물의 제조에 사용하기에 적합할 수 있다.

일부 실시양태에서, 본 발명의 방법은 본원에 기술된 바와 같은 본 발명의 키트 중의 어느 것을 사용할 수 있다.

여전히 추가로, 본 발명의 키트는 본 발명의 유전자이식 조류 동물의 제조에 필요한 임의의 시약, 완충제, 배지 또는 물질을 추가로 포함할 수 있음을 인지해야 한다. 본 발명의 키트는 설명서 뿐만 아니라 이의 다른 성분을 위한 용기를 추가로 포함할 수 있다.

일부 실시양태에서, 본 발명의 키트는 본 발명에 따라 본 발명의 임의의 유전자이식 조류 대상체 또는 이의 임의의 세포의 제조에 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 키트를 사용하여 제조된 유전자이식 조류 대상체 및 세포는 본원에 개시된 바와 같은 시스템 및 장치 중의 어느 것을 사용하여 본 발명의 방법들 중의 어느 것에 의해 사용될 수 있다. 여전히 추가로, 일부 실시양태에서, 본 발명의 키트는 본 발명의 방법에 의해 검사된 난내 배아 내의 리포터 유전자의 존재를 결정하는데 적합한 임의의 장비, 시스템, 및/또는 장치를 추가로 포함할 수 있다. 일부 특정 실시양태에서, 이러한 장비 또는 장치는 특히 도 1에 나타낸 바와 같이 본 발명에 의해 개시된 임의의 장치일 수 있다.

이의 또 다른 측면에서, 본 발명은 난내 배아 내의 리포터 유전자를 검출하는데 특별히 적합한 시스템, 장비 또는 장치를 제공한다. 일부 실시양태에서, 본 발명의 장치는 레이저 소스, 알을 위한 스탠드, 렌즈, 필터, 검출기를 위한 스탠드 및 검출기를 포함할 수 있다. 본 발명의 장치는 임의로, 일부 실시양태에서, 예를 들면, 도 1에 나타낸 바와 같은 본 발명의 시스템의 모든 요소를 유지하는 견고한 지지대를 포함한다. 본원에서 사용되는 용어 "검출기"는 빛을 검출 및/또는 측정하는 임의 유형의 장치를 가리킨다.

일부 실시양태에서, 검출 가능한 신호, 특히 형광 신호가 적합한 형광 수단을 사용하여 본 발명의 장치에 의해 검출될 수 있음을 주지해야 한다. 일부 실시양태에서, RFP 리포터 유전자에 의해 형성된 검출 가능한 신호는 변형된 광학 현미경과 같은 감광성 장치 또는 고감도 광자 검출기인 전하 결합 장치 (CCD)에 의해 검출될 수 있다.

일부 추가의 실시양태에서, 본 발명의 장치, 장비 또는 시스템은 적어도 하나의 광원, 적어도 하나의 검출기, 적어도 하나의 필터 및 상기 광원에의 본 발명의 리포터 유전자를 발현하는 세포의 노출을 촉진시키는 적절한 위치에 알을 배치하는 적어도 하나의 홀딩 아암을 포함할 수 있다. 일부 실시양태에서, 이러한 알은 수정된 부화되지 않은 조류 알일 수 있다. 일부 추가의 실시양태에서, 이러한 알은 본 발명의 임의의 유전자이식 조류 대상체가 낳을 수 있다. 일부 특정한 비제한적인 실시양태에서, 본 발명의 이러한 장치는 도 1에 예시된 바와 같을 수 있다. 일부 추가의 실시양태에서, 에그 홀더와 렌즈 및/또는 렌즈와 검출기 사이의 거리는 약 1 내지 100 cm의 범위, 특히, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 및 100 cm, 특히 약 5 내지 25 cm, 보다 구체적으로, 약 20 cm일 수 있다.

따라서, 일부 실시양태에서, 본 발명의 시스템 또는 장치는 본 발명에 의해 개시된 방법 중의 어느 것을 수행하는데 적합할 수 있음을 인지해야 한다.

일부 특정 실시양태에서, 본 발명의 장치는 검사된 알에서 리포터 유전자의 검출을 가능하게 하는 적합한 광원을 포함할 수 있다. 일부 추가의 실시양태에서, 광원은 약 400 내지 약 650의 파장을 포함할 수 있다. 일부 추가의 실시양태에서, 임의의 파장의 광이 사용될 수 있으며 단 상기 광원은 자외선 (UV) 광 (파장 10-400 nm)이 아니다.

일부 특정 실시양태에서, 적합한 광원은 형광 단백질의 여기에 적합하다. 일부 특별한 실시양태에서, 여기 파장은 약 500 nm 내지 약 650 nm일 수 있다. 일부 추가의 실시양태에서, 여기 파장은 약 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640 nm이다.

일부 보다 특정한 실시양태에서, 여기 파장은 약 515 내지 약 555의 범위일 수 있다. 일부 추가의 실시양태에서, 파장은 532 nm일 수 있다. 일부 특정 비제한적인 실시양태에서, 광원은 레이저에 의해 제공될 수 있다. 일부 또 다른 실시양태에서, 본 발명의 장치의 레이저는 청색 레이저, 또는 적색 레이저일 수 있다. 보다 특정한 실시양태에서, 광원은 녹색 레이저이다.

특정 실시양태에서, 레이저는 필터와 함께 사용될 수 있다. 일부 실시양태에서, 필터는 500nm 이상을 투과하는 녹색 필터, 또는 540 nm 내지 580 nm 사이를 투과하는 진녹색 필터, 또는 590 nm 내지 650 nm 사이를 투과하는 적색 필터, 또는 650 nm 이상 또는 660 nm 이상을 투과하는 적색 필터일 수 있다.

일부 특별한 실시양태에서, 광원은 532 nm의 파장을 갖는 녹색 레이저일 수 있다. 일부 추가의 실시양태에서, 이러한 레이저에는 650 nm 이상을 투과하는 적색 필터가 제공될 수 있다.

따라서, 본 발명은 본 발명의 임의의 방법, 특히 본 발명의 유전자이식 조류 대상체 중의 어느 것을 사용하여 본원에 논의된 바와 같은 난내 성 감별을 위한 방법에 사용하기 위한 본원에 기술된 바와 같은 장치를 추가로 포함한다는 것을 추가로 인지해야 한다.

특정 실시양태에서, 본 발명의 키트/들 및 방법/들에 의해 사용된 올리고뉴클레오티드/들 또는 뉴클레오티드/들은 단리된 및/또는 정제된 분자임을 인지해야 한다다. 본원에서 사용되는 바와 같이, "단리된" 또는 "정제된"은, 핵산과 관련하여 사용될 경우, 자연 발생 서열이 이의 정상 세포 (예를 들어, 염색체) 환경으로부터 제거되었거나 비-천연 환경에서 합성됨 (예를 들어, 인공적으로 합성됨)을 의미한다. 따라서, "단리된" 또는 "정제된" 서열은 세포-비함유 용액에 있거나 상이한 세포 환경에 배치될 수 있다. 용어 "정제된"은 서열이 존재하는 유일한 뉴클레오티드임을 의미하는 것이 아니라 이와 자연적으로 관련된 비-뉴클레오티드 물질을 본질적으로 함유하지 않음 (약 90-95% 순수)을 의미하며, 따라서 단리된 염색체와는 구별된다.

본원에서 사용된 모든 과학 및 기술 용어는 달리 명시되지 않는 한 당업계에서 일반적으로 사용되는 의미를 갖는다. 본원에 제공된 정의는 본원에서 자주 사용되는 특정 용어의 이해를 용이하게 하기 위한 것이며, 본 개시내용의 범위를 제한하려는 것은 아니다.

본 발명의 특정 측면 및 실시양태가 상세하게 설명되기 전에, 본 발명은 특정 방법, 및 기술된 실험 조건에 제한되지 않으며, 이러한 방법 및 조건은 달라질 수 있음을 이해해야 한다. 또한, 본원에서 사용된 용어는 특정 실시양태들만을 설명하기 위한 목적을 위한 것이며, 본 발명의 범위가 첨부된 청구범위에 의해서만 제한될 것이기 때문에 제한하려는 것이 아님을 이해해야 한다.

본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 다르게 지시하지 않는 한 복수의 대상을 포함한다. 따라서, 예를 들면, "방법"에 대한 언급은 하나 이상의 방법, 및/또는 본원에 기술된 유형의 단계 및/또는 본 개시내용 등을 읽을 때 당업계의 숙련가들에게 자명해질 것을 포함한다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 숙련가에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 실시 또는 시험에 사용될 수 있지만, 바람직한 방법 및 재료가 이하에서 기술된다.

문맥이 달리 요구하지 않는 한, 본 명세서 및 하기 청구범위에 걸쳐, 단어 "포함하다(comprise)" 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변형은 언급된 정수 또는 단계 또는 정수 또는 단계의 그룹의 포함을 의미하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 그룹의 배제를 의미하지 않는 것으로 이해될 것이다. 보다 특히, 용어 "포함하다(comprises)", "포함하는(comprising)", "포함하다(includes)", "포함하는(including)", "갖는(having)" 및 이들의 활용형은 "포함하지만 이에 제한되지 않는"을 의미한다. 이 용어는 "구성되는" 및 "본질적으로 구성되는"이라는 용어를 포함한다. "본질적으로 구성되는"이라는 어구는 조성물 또는 방법이 추가 성분 및/또는 단계를 포함할 수 있지만, 추가 성분 및/또는 단계가 청구된 조성물 또는 방법의 기본 및 신규 특성을 실질적으로 변경시키지 않는 경우에만 포함한다.

본원에 사용된 용어 "약"은 언급된 값보다 최대 1%, 보다 특히 5%, 보다 특히 10%, 보다 특히 15%, 및 일부 경우 최대 20% 더 높거나 더 낮게 벗어나는 값, 정수 값을 포함하는 편차 범위, 및, 해당되는 경우, 연속 범위를 구성하는 비-정수 값을 나타낸다. 본원에서 사용되는 용어 "약"은 ±10%를 가리킨다.

본 발명의 다양한 실시양태는 범위 형식으로 제시될 수 있음을 주지해야 한다. 범위 형식의 설명은 단지 편의 및 간결성을 위한 것이며 본 발명의 범위에 대한 융통성있는 제한으로 해석되어서는 안된다는 것을 이해해야 한다. 따라서, 범위의 설명은 구체적으로 개시된 모든 가능한 하위 범위 뿐만 아니라 그 범위 내의 개별 수치를 갖는 것으로 간주되어야 한다. 예를 들면, 1 내지 6과 같은 범위의 설명은 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 구체적으로 개시된 하위 범위 뿐만 아니라 그 범위 내의 개별 숫자, 예를 들면, 1, 2, 3, 4, 5 및 6을 갖는 것으로 간주되어야 한다. 이것은 범위의 폭에 관계없이 적용된다. 수치 범위가 본원에 지시될 때마다, 지시된 범위 내에 임의의 인용된 숫자 (분수 또는 정수)를 포함하는 것으로 의도된다. 어구 제1 지시 숫자와 제2 지시 숫자 "사이의 범위에 있는/범위의(ranging/ranges between)" 및 제1 지시 숫자에서 제2 지시 숫자까지의 "범위에 있는/범위의(ranging/ranges from~to)"는 본원에서 상호 교환적으로 사용되며 제1 및 제2 지시 번호 및 그 사이의 모든 분수 및 정수를 포함하는 것을 의미한다.

하기 실시예는 당업계의 통상의 숙련가들에게 본 발명의 방법 및 조성물을 제조 및 사용하는 방법에 대한 완전한 개시 및 설명을 제공하기 위해 제공되며, 본 발명자들이 이들의 발명으로 간주하는 범위를 제한하려는 것은 아니다. 사용된 수 (예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력했지만 일부 실험 오류 및 편차를 고려해야 한다. 달리 나타내지 않는 한, 부는 중량부이고, 분자량은 평균 분자량이고, 온도는 섭씨 온도이고, 압력은 대기압 또는 대기압 부근이다.

실시예는 본 발명의 측면들을 수행하는데 본 발명자들에 의해 사용된 기술을 대표한다. 이들 기술은 본 발명의 실시를 위한 바람직한 실시양태의 예시이지만, 본 개시내용에 비추어 당업계의 숙련가들은 본 발명의 취지 및 의도된 범위를 벗어나지 않으면서 수많은 변형이 이루어질 수 있음을 인식할 것임을 인지해야 한다.

명확성을 위해, 별도의 실시양태들과 관련하여 기술된 본 발명의 특정 특징들은 또한 단일 실시양태에서 조합하여 제공될 수 있는 것으로 인지된다. 반대로, 간결성을 위해, 단일 실시양태와 관련하여 기술된 본 발명의 다양한 특징들은 또한 별도로 또는 임의의 적절한 하위 조합으로 또는 본 발명의 임의의 다른 기술된 실시양태에서 적합한 것으로 제공될 수 있다. 다양한 실시양태들과 관련하여 기술된 특정 특징들은, 실시양태들이 이러한 요소들없이 동작하지 않는 한, 이들 실시양태들의 필수 특징으로 간주되지 않아야 한다.

상기 기술되고 하기 청구범위에서 청구된 바와 같은 본 발명의 다양한 실시양태 및 측면은 하기 실시예에서 실험적으로 뒷받침된다.

개시되고 기술된 바와 같이, 본 발명은 이러한 방법 단계 및 조성물이 다소 변할 수 있으므로 본원에 개시된 특정 실시예, 방법 단계, 및 조성물로 제한되지 않는 것으로 이해되어아 한다. 또한, 본원에서 사용된 용어는 특정 실시양태만을 설명하기 위한 목적으로 사용되며 본 발명의 범위는 첨부된 청구범위 및 그 등가물에 의해서만 제한될 것이기 때문에 제한하려는 것이 아님을 이해해야 한다.

본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 그 내용이 명확하게 달리 지시하지 않는 한 복수의 대상을 포함함을 주지해야 한다.

실시예

추가의 상세 없이도, 당업계의 숙련가가 전술한 설명을 사용하여 본 발명을 최대한 활용할 수 있다고 여겨진다. 따라서, 다음의 바람직한 특정 실시양태는 단지 예시적이며 어떠한 방식으로든 청구된 발명을 제한하지 않는 것으로 해석되어야 한다.

본원에 구체적으로 기술되지 않은 당업계에 공지된 표준 분자 생물학 프로토콜을 본질적으로 문헌[Sambrook et al., Molecular cloning: A laboratory manual, Cold Springs Harbor Laboratory, New-York (1989,1992)] 및 문헌[Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Maryland (1988)]]에서와 같이 일반적으로 따른다.

시약

동물:

상업용 백색 레그혼 (White Leghorn) 닭은 헨드릭스 ISA 및 미네소타로부터 입수된다.

마커 라인 (Marker Line) 닭은 캐나다 브리티시 컬럼비아 애거시의 퍼시픽 어그리푸드 리서치 센터 (Pacific Agri-Food Research Centre) 출신이다.

동물 실험은 IACUC 승인 프로토콜에 따라 Crystal Bioscience IACUC 위원회의 감독하에 엄격히 수행되었으며 실험 과정에서 동물이 질병이나 사망으로 고통받지 않도록 보장하였다.

벡터:

PrecisionX™ Cas9 SmartNuclease 벡터 시스템은 System Bioscience Inc., 카탈로그 번호 CAS8/9xx 시리즈에서 주문한다.

Clontech#6921-1로부터의 pDsRed1-N1.

GFP 플라스미드-FUGW-H1-GFP-네오마이신 (Addgene), 카탈로그 번호 37632.

세포주: 암컷 세포는 ATCC® 번호: CRL-12135™로부터 주문된 Gallus gallus, 림프아세포 암컷 세포주 Con A-C1-VICK의 세포이다. 닭 세포 배양 실험을 위해 ATCC로부터의 닭 섬유아세포 암컷 세포주 UMNSAH /DF-1 ( ATCC ^® CRL -12203™)을 사용하였다. 수컷 세포는 ATCC® 번호: CRL-2118™로부터 주문된 Gallus gallus , 상피 수컷 세포주 LMH/2A의 세포이다.

원시 생식 세포주 (PGC).

인간 배아 신장 293 (HEK-293) 세포주 (ATTC).

조류 유전자이식 대상체를 제조하는데 필요한 시약 및 재료

PGC 단리

1. 미세전극 피펫 풀러 (Shutter Instrument Co.).

2. 미세 그라인더 (NARISHIGE).

3. 소직경 (25 μm) 유리 마이크로피펫.

4. 입구-조절 피펫 (Sigma-Aldrich).

5. CaCl2 또는 MgCl2 없는 1x 행크스 균형 염 용액 (HBSS) (Hyclone, Logan, UT).

6. Ca2 또는 Mg2 없는 1x 듈베코 인삼염-완충 염수 (PBS) (Hyclone).

7. 트립신/에틸렌디아민테트라아세트산 (EDTA) (Gibco).

8. 햄버거 및 해밀턴 (HH) 단계 14-17의 닭 배아.

9. 자기-활성화 세포 분류 (MACS) 완충액. 0.5% 소 혈청 알부민 (BSA) 및 2mM EDTA로 보충된 1x PBS.

10. MiniMACS 컬럼 (Miltenyi Biotec).

11. 단계-특이 배아 항원 1 (SSEA-1) 항체 (Santa Cruz Biotechnology, Santa Cruz, CA).

12. 항-마우스 IgM 마이크로비드 (Miltenyi Biotec).

PGC 배양

1. PBS (Hyclone).

2. HBSS (Hyclone).

3. PGC 배양 배지 (50 mL). 3.75 mL 태아 소 혈청 (FBS, Hyclone), 1.25 mL 닭 혈청 (Sigma-Aldrich, St. Louis, MO), 500 μL GlutaMAX-I 보충물 (100x, Invitrogen), 500 μL 뉴클레오시드 (100x,Millipore), 500 μL 항생제/항진균제 (ABAM; 100x, Invitrogen), 500 μL 인슐린-트랜스페린-셀레늄 보충물 (100x, Gibco), 500 μL 비필수 아미노산 (NEAA; 100x, Invitrogen), 50 μL β-머캅토에탄올 (1000x, Sigma-Aldrich), 10 μL의 50 ng/μL 인간 기본 섬유아세포 성장 인자 (bFGF, Sigma-Aldrich), 및 50 mL까지 녹아웃 듈베코 개질된 이글 배지 (DMEM; Invitrogen) 첨가. 4℃에서 저장

4. 아큐타제 (Millipore).

생식선 키메라 생산 및 유전자이식

닭 PGC로의 유전자 전달

1. 리포펙타민 2000 (Invitrogen).

2. Opti-MEM 배지 (Invitrogen).

3. 형질감염 배지 (ABAM이 없는 PGC 배양 배지; 50 mL): 3.75 mL FBS (Hyclone), 1.25 mL 닭 혈청 (Sigma-Aldrich), 500 μL GlutaMAX-I 보충물 (100x,Invitrogen), 500 μL 뉴클레오시드 (100x, Millipore), 500 μL 인슐린-트랜스페린-셀레늄 보충물 (100x, Gibco), 500 μL NEAA (100x, Invitrogen), 50 μL β-머캅토에탄올 (1000 x, Sigma-Aldrich), 및 10 μL의 50 ng/μL bFGF (Sigma-Aldrich), 및 50 mL까지 녹아웃 DMEM (Invitrogen) 첨가. 4℃에서 저장.

4. Ca2 또는 Mg2 없는 PBS.

5. Ca2 또는 Mg2 없는 HBSS.

6. 1 μg/μL에서 플라스미드 DNA 제조.

유전자이식 PGC의 시험관내 증식 및 선택

1. Ca2 또는 Mg2 없는 HBSS (Hyclone).

2. 혈구계.

3. 트리판 블루, 0.4% (Invitrogen).

4. 도립 형광 현미경 (Leica Microsystems).

5. 게네티신® 선택적 항생제 (Gibco).

수용자 알에의 PGC 이식

1. 소직경 (25 μm) 유리 마이크로피펫 (미세전극 피펫 풀러 (Shutter Instrument Co.) 및 미세 그라인더(NARISHIGE)로 만들어짐.

2. 입구-조절 피펫.

3. CaCl2 또는 MgCl2 없는 HBSS (Hyclone).

4. HH 단계 14-17의 수용자 닭 배아.

5. Ca2 또는 Mg2 없는 PBS (Hyclone).

6. 피펫 세척 용액. 오토클레이브 증류수 중의 0.1% 과산화수소 (Sigma-Aldrich).

7. 겸자.

8. 조명기가 달린 입체현미경.

9. 핫-멜트 접착제 스틱 및 글루건.

10. 파라필름.

11. HBSS에서 3_103 세포/μL로 제조된 기증자 PGC.

검정교배

1. 야생형 Korean Ogye (KO) 암탉.

2. 1 mL 시린지.

3. Ca2 또는 Mg2 없는 PBS (Hyclone).

기증자-유래 자손 및 유전자이식 닭 검증

1. DNeasy 혈액 & 조직 키트 (Qiagen).

2. 기증자 PGC-특이 프라이머 세트.

3. 이식유전자-특이 프라이머 세트.

4. PCR 기기.

5. PCR 시약: PCR 완충액, dNTP, Taq 폴리머라제.

6. 아가로스.

7. TAE 완충액.

8. 전기영동 기기.

실험 절차

형광 검정

실험의 전체 설정은 도 1에 예시된 바와 같이 레이저 소스, 상기 레이저 소스에 알 내의 리포트 유전자를 발현하는 세포를 노출시킬 수 있게 하는 적당한 위치에 알을 위치시킬 수 있는 홀더 또는 스탠드, 렌즈, 필터, 검출기를 위한 스탠드 및 검출기를 포함한다. 샘플과 렌즈 및 렌즈와 검출기 사이의 거리는 약 20cm이다. 렌즈의 초점면은 약 10cm이며 필터가 그곳에 놓여진다.

검출기 앞에 필터를 배치함으로써 및 산란광이 필터를 우회하지 않도록 보장하기 위해 검출기의 모든 주변 영역을 덮음으로써 최적 조건을 검출하였다.

세 가지 유형의 레이저가 사용되었으며, 초기 전력 I₀ 및 필터는 하기 표 2에 나타낸 바와 같다:

형질감염된 GFP 또는 RFP-발현 세포의 알에의 주사

HEK 세포를 1% L-글루타민, 10% 태아 소 혈청 (FBS), 및 1% PenStrep (페니실린 + 스트렙토마이신) (Biological industries, Israel)이 보충된 DMEM 배지에 유지시켰다. 세포를 37℃, 5% CO₂에서 가습된 배양기에서 성장시켰다. 배지는 일주일에 2-3회 재생시켰으며, 세포 수는 1 x 10⁵ 내지 3 x 10⁵개 세포/mL로 유지시켰다. 다음과 같이 세포를 계대배양하고 신선한 배지에 재현탁시켰다:

1. 세포가 플라스크 표면에 부착되도록 플라스크로부터 상청액을 제거하였다.

2. 제거된 세포를 5 mL의 새로운 배지에 재현탁시켰다.

2^nd 계대배양 후, 세포를 제조사 프로토콜에 따라 PolyJet^TM 시험관내 DNA 형질감염 시약 (SignaGen Laboratories, MD, USA)을 사용하여 2 μg DNA의 플라스미드로 형질감염시켰다. 두 개의 플라스미드를 별도로 세포 내로 형질감염시켰다; 상기 명시된 바와 같은 GFP 플라스미드 및 RFP 플라스미드.

그후, 형질감염된 세포 (RFP)를 10⁶개 세포/ml의 농도로 제조하였다. 그후, 표 3 및 4에 따라, 총 용적 100 μl의 세포를 중심에서 신선한 달걀에 주사하였다.

두 번째 실험에서 세포는 전술한 바와 같이 성장 및 형질감염시켰다. 그후, 세포를 PBS 또는 50% 글리세롤 (분산을 제어하기 위해)로 옮기고 중심에서 신선한 달걀에 주사하였다. 상이한 주사된 알들이 표 4에 개시되어 있다.

수탉 세포주

수컷 세포, 특히, Gallus gallus, 닭 (간; 화학적으로 유도됨; 닭 에스트로겐 수용체 유전자로 형질감염됨)을 1% L-글루타민, 10% 태아 소 혈청 (FBS), 및 1% PenStrep (페니실린 + 스트렙토마이신) (Biological industries, Israel)로 보충된 waymouth의 MB 752/1 배지에서 성장시켰다. 배양 플라스크 (T25)를 0.1% 젤라틴으로 코팅시켰다). 배지는 3일마다 재생시켰다. 세포를 37℃, 5% CO₂에서 가습된 배양기에서 성장시켰다.

암탉 세포주

ATCC로부터의 닭 섬유아세포 암컷 세포주 UMNSAH /DF-1 ( ATCC ^® CRL -12203™)를 사용하였다. 세포에 대한 상세한 설명한 표 5에 제시되어 있다:

암컷 세포를 1% L-글루타민, 10% 태아 소 혈청 (FBS), 및 1% PenStrep (페니실린 + 스트렙토마이신) (Biological industries, Israel)로 보충된 DMEM 배지에서 성장시켰다. 세포를 37℃, 5% CO₂에서 가습된 배양기에서 성장시켰다. 배지는 1주일에 2-3회 재생시켰다.

PGC 세포주

배아 생식선을 6.5일 배양의 백색 레그혼 (WL) 배아로부터 회수한 다음 회수된 생식선 세포를 총 배아 생식선 세포에서 PGC의 분리를 위해 자기 활성화 세포 분류기 (MACS)로 처리한다. PGC를 KO-DMEM (Life Technologies)에서 성장시키며, 이중 40%는 버팔로 래트 간 세포 (BRL, ATCC) 상에서 예비컨디셔닝시키고, 7.5% 태아 소 혈청 (Hyclone), 2.5% 조사된 닭 혈청, 1X 비필수 아미노산, 2mM 글루타민, 1mM 나트륨 피루베이트, 0.1mM β-머캅토에탄올 (모두 Life Technologies로부터 제조됨), 4ng/ml 재조합 인간 섬유아세포 성장 인자, 6ng/ml 재조합 마우스 줄기 세포 인자 (둘 다 R&D Systems로부터 제조됨)로 보충되며 BRL 세포의 조사된 피더 층에서 성장시킨다. 세포를 주당 3회 신선한 피더 층에 계대배양한다.

제한 없는 (Restriction-free; RF) 클로닝

Cas9-Smart뉴클레아제™ 벡터에의 gRNA의 삽입은 제한 없는 방법을 적용하여 수행한다 [Peleg Y et al., J. Struct. Biol. 172(1):34-44 (2010) 2010]. 프라이머는 Sigma-Genosys (Rehovot, Israel)로부터 주문하고, 후속적인 RF 반응은 Phusion 폴리머라제 (Thermo Scientific, NH, USA, USA)를 사용하여 수행하였다. 플라스미드 정제는 MEGAspin 키트 및 DNA-스핀 플라스미드 DNA 정제 키트 (Intron Biotechnology, Daejoen, South Korea)를 각각 사용하여 수행한다.

닭의 염색체 W 또는 Z에의 형질감염

세포는 제조사 프로토콜에 따라 PolyJet™ 시험관내 DNA 형질감염 시약 (SignaGen Laboratories, MD, USA)을 사용하여 각 플라스미드의 2 μg DNA로 공동-형질감염시킨다 (아래 세부사항 참조). 두 개의 플라스미드의 공동-형질감염은 다음과 같이 수행한다:

1. 닭 염색체 Z　좌측 우측 아암 또는 염색체 W 좌측 및 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pDsRed (검정용).

2. 닭 염색체 Z　좌측 & 우측 아암 또는 염색체 W 좌측 & 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pCMVGluc (대조용).

그후, 세포를 네오마이신-내성으로 평판배양하고 웰당 10⁵개 세포의 밀도로 48-웰 플레이트에 접종한다. 3일 후, 40μg/ml 네오마이신을 첨가하여 리포터 유전자의 안정적인 통합을 갖는 세포를 선별한다.

염색체 Z 또는 W에의 통합을 위한 DNA 분석

염색체 통합의 검증을 위해, 다음 전략을 사용하였다. 세포를 단리하고 이들 중 절반의 DNA를 추출하여 한천 겔 (1%) 상에서 수행하였다. 게놈 DNA (플라스미드 DNA를 겔 상에 남김)를 절단하고 세척하였다. 하기 프라이머로 PCR 분석을 수행하였다. 생성물을 겔 상에서 분리한 다음 서열분석하였다. 삽입물이 PCR 분석에 의해 검출하기에는 너무 길기 때문에, 초기 PCR 산물에 대해 착수한 슬라이딩 윈도우 PCR 분석을 설계하였다.

a. 삽입물을 갖는 세포주에 대한 검정 (좌측 아암의 일부, CMV 인핸서, 프로모터 및 MCS 및 dsRED2의 일부를 포함함):

서열 번호 49로 표시된 좌측 프라이머-TTGGTGTGTGCTAATAGGCAGT; 서열 번호 50으로 표시된 우측 프라이머-TAGTCCTCGTTGTGGGAGGT, 생성물 크기: 1489bp.

b. 삽입물을 갖는 세포주에 대한 검정 ((아암에 대해) 측면 Z 염색체의 일부, 좌측 아암, 및 CMV 인핸서, 프로모터의 일부를 포함함):

서열 번호 51로 표시된 좌측 프라이머-GCATTGATCTGTCCAGTTGC, 서열 번호 52로 표시된 우측 프라이머-TACTGCCAAAACCGCATCAC, 생성물 크기: 1462bp.

유전자이식 닭의 제조

농축된 비히클 (약 10⁷ MOI 역가의 렌티바이러스일 수 있음) 또는 플라스미드 DNA)을 새로 낳은 알의 25개 배아에 주사한다. 주사는 매주 3회 주사로 수행된다. 주사된 배아는 주사한지 3주 후에 부화시킨다. 이들은 G0 새이다. 부화 직후, 부화된 병아리의 CAM 샘플로부터 DNA를 추출하고 벡터 DNA의 존재/부재의 검출을 반-정량적 PCR에 의해 수행한다. 2-3주령의 G0 병아리에서 혈액을 샘플링하고 PCR 스크린을 반복한다. G0 새를 수컷의 경우 16-20주, 암컷의 경우 20-24주 동안 성적으로 성숙시킨다. 수 병아리를 대략 16주부터 정액 생산에 대해 시험한다.

암탉을 수정시키고, 수정란을 매일 수집한다. G1 병아리는 3주 후에 부화하고 각각의 개별 병아리에 날개 띠 (wing band)를 달고 병아리 장요막 (CAM) 샘플을 껍질로부터 채취한다. CAM 샘플로부터 DNA를 추출하고 단일 카피 수준인 것으로 예측되는 이식유전자의 존재에 대해 PCR 스크린을 수행한다. 2-3주 후에 혈액 샘플로부터 DNA를 확인하고 병아리 성별 감별을 위해 스크린을 반복한다.

몇 주령에 G1 새로부터 혈액 샘플을 채취하여 PCR 분석을 위한 게놈 DNA를 제조한다. G1 새를 G2 번식에 사용한다.

PGC 단리

1. 혈액 PGC 단리를 위해 신선한 달걀 (EGK 단계 X), 예를 들어 Korean Ogye (KO)를 37℃에서 50-54시간 동안 배양한다 (HH 단계 14-17). 배양된 알을 알 플레이트에 수평으로 놓고 70% 에탄올로 소독한 면을 사용하여 난각을 부드럽게 닦는다.

2. 날카로운 겸자를 사용하여, 전혈 세포의 단리를 위해 난각 (<1 cm 직경)을 조심스럽게 갈라준다.

3. 25 μm 얇게 분쇄된 유리 바늘과 마우스 피펫을 사용하여 배아 등 대동맥으로부터 약 2-3 μL 전혈 세포를 수집한다. 500 μL PBS와 혼합한다. PGC의 미세주사를 위해, 마우스 피펫 및 직경 20-25 μm의 유리 마이크로피펫을 사용할 수 있다. 유리 마이크로피펫은 미세전극 피펫 풀러 (Shutter Instrument Co.)로 만들어지며 미세 그라인더 (NARISHIGE)를 사용하여 25도에서 접지된다.

4. 전혈 세포를 1.5 mL 멸균 튜브로 옮기고, 원심분리하고 (250 x g, 5분), 상청액을 제거한다.

5. 생식선 PGC 단리를 위해, 신선한 달걀을 37℃에서 5.5일 동안 배양한다 (HH 20-26). 날카로운 겸자로 HH 단계 20-26의 배아로부터 배아 생식선을 추출하고, 37℃ 배양기에서 5분 동안 500 μL의 0.05% 트립신/EDTA와 함께 배양한다.

6. 불활성화를 위해 50 μL FBS를 첨가하고, 원심분리하고 (250 x g, 5분), 상청액을 제거한다.

7. 1mL PBS에 전혈 세포 또는 해리된 생식 세포를 재현탁시키고 1:200 희석으로 항-SSEA-1 항체 (Santa Cruz Biotechnology, SC-21702)를 적용한 다음 혼합물을 실온 (RT)에서 15분 동안 배양한다.

8. 107개의 총 세포 당 5 mL MACS 완충액 (PBS 중 0.5% BSA 및 2mM EDTA, pH 7.2)를 첨가함으로써 세포를 세척하여 비결합된 1차 항체를 제거하고 원심분리한다 (250 x g, 5분).

9. 상청액을 완전히 흡인하고 총 10⁷개 세포당 80 μL MACS 완충액에 세포 펠렛을 재현탁시킨다.

10. 총 10⁷개 세포당 20μL 쥐 항-마우스 IgM 마이크로비드 (Miltenyi Biotec. 130-047-301)를 첨가한다. 보다 많은 세포 수에 대해서는, 완충액 용적을 이에 따라 확장시킨다.

11. 2-8℃에서 20분 동안 세포를 항체와 함께 배양한다.

12. 총 10⁷개 세포당 2 mL MACS 완충액을 첨가하여 세포를 세척하고 원심분리한다 (250 x g, 5분).

13. 상청액을 완전히 흡인하고 500 μL MACS 완충액에 총 108개 이하의 세포를 재현탁시킨다.

14. 적합한 MACS 분리기의 자기장에 컬럼을 배치한다.

15. 500 μL MACS 완충액으로 헹구어 컬럼을 준비한다.

16. 컬럼에 세포 현탁액을 적용하고, 500 μL 완충액으로 컬럼을 3회 세척한다. 컬럼 저장소가 비어있을 때 새 완충액을 추가한다.

17. 분리기에서 컬럼을 제거하고 이를 적절한 수집 튜브에 놓는다.

18. 1 mL MACS 완충액을 컬럼에 추가하고 플런저를 컬럼에 단단히 밀어 넣어 자기적으로 표지된 세포를 즉시 제거한다.

19. PGC를 함유하는 단리된 세포를 예열된 PGC 배양 배지 (1 x 10⁵개 정제된 PGC 당 1 mL PGC 배지)로 옮긴다.

PGC 배양

1. PGC를 함유하는 단리된 세포를 예열된 PGC 배양 배지 (1 x 10⁵개 정제된 PGC 당 1 mL PGC 배지)로 옮기고 37℃에서 배양한다.

2. 7-14일의 성장 후, 대부분의 1차 배양된 PGC는 콜로니를 형성하고 세포 콜로니 집합체를 상실한다.

3. 부유된 PGC 콜로니를 부드러운 피펫팅 및 원심분리 (200 x g, 5분) 후 배지로 부드럽게 회수할 수 있다.

4. 세포 펠렛을 아큐타제 (~5 x10⁵ PGC개 PGC 당 1 mL 아큐타제 용액)로 분해한다.

5. 원심분리하고 (200 x g, 5분) 및 세포 펠렛을 PGC 배양 배지에 재현탁시킨다.

6. 12-웰 플레이트에 현탁된 PGC를 접종한다 (12-웰 플레이트의 웰당 1 mL PGC 배양 배지에서 1 x 10⁵개 배양된 PGC).

7. PGC는 3-4일마다 정기적으로 계대배양할 수 있다.

닭 PGC로의 유전자 전달, 생식계열 키메라 생산, 및 형질전환

닭 PGC로의 유전자 전달

1. CAGG-PBase (pCyL43B)를 함유한 4μg 헬퍼 플라스미드 및 리포터 유전자 (RFP)를 함유한 6μg piggyBac 트랜스포손 (pCyL50) 및 임의로, 선택 마커 (예를 들어, 네오마이신 내성 유전자)를 100μL Opti-MEM (Gibco)과 혼합하고 RT에서 5분 동안 배양한다. CRISPR/Cas 형질감염을 위해, 2.5 μgCMVRFP 발현 플라스미드 벡터, 2.5 μg Cas9 및 가이드 RNA 발현 플라스미드 벡터를 100 μL Opti-MEM (Gibco)과 혼합하고 RT에서 5분 동안 배양한다.

2. 10 μL 리포펙타민 2000 시약 (Thermo Fisher-Invitrogen)을 100 μL Opti-MEM과 혼합하고 RT에서 5분 동안 배양한다.

3. Opti-MEM 및 리포펙타민 2000 시약을 갖는 플라스미드를 Opti-MEM과 혼합하고 RT에서 20분 동안 배양한다.

4. 배양 동안, 배양된 PGC를 수확하고 원심분리한다 (200 x g, 5분). 상청액은 버린다.

5. 수확된 PGC에 1 mL 아큐타제 (Millipore)를 첨가하고 37℃에서 10분 동안 배양한다.

6. 혈구계 (Marienfeld)를 사용하여 PGC 수를 결정하고 항생제가 없는 1 mL PGC 배양 배지를 갖는 12-웰 플레이트에서 5 x 10⁵개 PGC를 접종한다.

7. DNA-리포펙타민 복합체를 PGC에 적용하고 CO2 배양기에서 37℃에서 1일 동안 배양한다.

8. 형질감염된 PGC를 수확하고 원심분리한다 (200 x g, 5분). 상청액을 제거한다.

9. 1 mL HBSS로 PGC를 3회 세척하고 이들을 항생제를 갖는 PGC 배양 배지로 현탁시킨다.

유전자이식 PGC의 시험관내 증식 및 선택

1. 형질감염한 다음날 100 μg/mL G418 (네오마이신 내성 유전자의 경우)을 함유하는 PGC 배양 배지에서 형질감염된 PGC를 선택한다.

2. 형광 현미경을 사용하여 리포터 유전자 발현을 모니터링한다.

3. 3-4 일마다 PGC를 계대배양한다. 전체 선택 기간은 최대 3주가 소요된다.

4. 형질감염된 플라스미드 벡터에 약물-선택 마커가 없는 경우, 형광 단백질을 발현하는 PGC를 FACS에 의해 분류할 수 있다.

수용자 알에의 PGC 이식

1. 60-70% 상대 습도의 공기 중에서 37℃에서 HH 단계 14-17까지 수용자 알을 배양한다.

2. 형질감염된 PGC를 수확하고 원심분리하고 (200 x g, 5분) 상청액을 제거한다.

3. 수확된 PGC에 1 mL 아큐타제 (Millipore)를 첨가하고 37℃에서 10분 동안 배양한다.

4. 원심분리한다 (200 x g, 5 min). 상청액은 버린다.

5. PGC를 HBSS (Hyclone)에 현탁시킨다.

6. 수용자 알의 뾰족한 끝에 작은 창을 만들고 마이크로피펫으로 3,000개 이상의 PGC를 함유하는 2 μL 분취액을 수용자 배아의 등 대동맥에 미세피펫팅한다.

7. 글루건을 사용하여 수용자 배아의 난창을 파라필름으로 밀봉하고, 상대 습도 60-70%의 공기 중에서 37℃에서 부화할 때까지 끝이 뾰족한 상태로 알을 배양한다.

배아 생식선에서의 유전자 변형된 PGC 모니터링

1. 60-70% 상대 습도의 공기 중에서 37℃에서 HH 단계 28-30까지 수용자 알을 배양한다.

2. 배아 6일째에 생식선을 절개한다.

3. 형광 현미경을 사용하여 배아 생식선에서 형광 단백질을 모니터링한다.

검정교배

1. 성적으로 성숙한 수용자 및 야생형 (WT) 닭으로부터 일주일에 두 번 정액을 수집한다.

2. 성숙한 수컷 수용자 및 WT 수탉으로부터의 50 μL 정액을 각각 WT 산란용 암탉 및 성숙한 암컷 수용자에게 도입한다.

3. 인공 수정한 다음날 WT 산란용 암탉 및 성숙한 암컷 수용자로부터 알을 수집하고, 60-70% 상대 습도의 공기에서 37℃에서 부화될 때까지 뾰족한 끝을 갖는 알을 배양한다.

실시예 1

가금류의 시각적 성 식별을 위한 상이한 컬러 레이저 및 필터를 사용한 형광 분석

광학 형광 시스템

In-ovo 가금류의 성별을 시각적으로 식별할 수 있는 가능성을 입증하기 위해, 청색 형광 또는 적색 형광 리포터 유전자에 비해 녹색 형광의 사용을 평가하였다.

완전한 알 또는 난백, 난황 및 껍질로 분리된 알의 자가형광은 청색 레이저, 녹색 레이저 또는 적색 레이저를 사용하여 결정하였다. 빈 알 (껍질)과 완전한 알의 비교는 자가형광 수준에 유의한 차이가 없음을 나타낸다 (데이터는 나타내지 않음).

상이한 성분 및 알의 일부에 의해 제공된 산란 및 자가형광 강도는 표 6에 기술되어 있다.

중요하게는, 배경 노이즈 (레이저 없음)는 약 4nW이지만, 레이저 (532nm)의 존재하에서는 필터 (660nm 이상을 통과하는 저주파 통과 필터)를 우회하는 광 산란으로 인해 약 12nW였음을 주지하였다.

완전한 알에 상이한 농도의 플루오레세인 (1μM, 10mM)을 첨가하거나 첨가하지 않고서 녹색 (+500 nm) 또는 적색 필터 (590-650 nm)와 함께 청색 레이저 (473nm)의 사용을 분석하였으며, 도 2에 요약되어 있다. 큰 녹색 자가형광이 있는 것으로 보이지만, 높은 플루오레세인 농도 사용시 형광 강도가 검출될 수 있다.

완전한 알에 로다민 B (10 μM)를 첨가하거나 첨가하지 않고서 진녹색 (540-580 nm) 또는 적색 필터 (+660 nm)와 함께 녹색 레이저 (532 nm)의 사용을 분석하였으며, 도 3에 요약되어 있다. 40mW 이상에서는, 염료의 형광 방출이 녹색 필터로 상당히 검출 가능한 것으로 보인다 (거의 2배 더 큼). 그러나, 적색 필터로는 차이를 관찰할 수 없었다.

완전한 알에 dir (10 μM)을 첨가하거나 첨가하지 않고서 적색 필터 A (590-650 nm) 또는 적색 필터 B (+660 nm)와 함께 녹색 레이저 (532 nm)의 사용을 분석하였으며, 도 4에 요약되어 있다. 80mW 이상에서는, 염료의 형광 방출이 적색 필터 A를 사용하여 검출 가능한 반면 적색 필터 B (+660nm)를 사용함으로써 약간의 차이만 관찰할 수 있는 것으로 보인다.

완전한 알에 dir (10 μM)을 첨가하거나 첨가하지 않고서 적색 필터 (+660 nm) 또는 녹색 필터 (540-580 nm)와 함께 적색 레이저 (632.8 nm)의 사용을 분석하였으며, 도 5에 요약되어 있다. 형광 염료의 유무에 따른 강도 차이는 거의 보이지 않았다.

알 껍질 만을 사용하여 모든 실험을 반복하였다. 유사한 결과가 관찰되었다 (데이터는 나타내지 않음).

이러한 관찰은 알 껍질을 통해 RFP를 검출할 수 있는 가능성을 입증한다.

실시예 2

알에의 RFP 또는 GFP 형질감염된 세포의 형광

배아에서 RFP 발현 세포의 in- ovo 검출의 가능성을 예시하기 위해, 본 발명자들은 다음으로 형광 단백질, 특히 RFP 또는 GFP로 형질감염된 세포가 완전한 알 내에 이의 주사시 검출될 수 있는지 검사하였다.

보다 특히, HEK 세포를 실험 절차에 기술된 바와 같이 GFP 또는 RFP 벡터로 형질감염시켰다. GFP 및 RFP 형질감염된 세포 둘 다의 형광을 여기 후 조사하였다. 도 6 (GFP) 및 도 7 (RFP)은 형질감염된 세포에 의해 GFP 및 RFP 둘 다가 발현되고 형광 신호가 관찰될 수 있음을 분명히 입증한다.

그 후, HEK 형질감염된 세포를 실험 절차에 기술된 바와 같이 신선한 알에 주사하고 알의 형광 강도를 분석하였다.

먼저, 적색 형광 단백질 RFP-발현 세포를 갖거나 갖지 않는 알의 형광 강도를 녹색 레이저 (532nm) 및 +650 nm의 적색 필터를 사용한 알의 여기에 의해 특성화하였다. 도 8은 알의 5가지 다른 위치로 측정된 RFP가 없는 알의 형광 강도가 매우 유사하다는 것을 보여준다. 도 9는 알이 중심에서 여기될 때 상이한 농도의 RFP-발현 세포를 사용하여 측정된 형광 강도를 보여준다. RFP 농도와 검출기에서의 강도 사이의 상관 관계가 명확하게 관찰되었다.

RFP 발현 세포의 존재하에서, 알의 위치, 즉 레이저에 의해 제공된 정확한 여기 장소가 형광 강도에 영향을 주는지 확인하기 위해 여러 시험을 수행하였다. 여기 동안 알의 위치에 따라 검출기에서의 강도가 크게 변한 것으로 보인다. 이것은 알에 RFP-발현 세포를 주사한 후 RFP가 균일하게 분포되지 않기 때문에 예상되었다. 도 10은 여기 동안의 알의 특정 위치에서 관찰된 최대 강도를 나타내며, 이것은 RFP-발현 세포의 농도가 가장 높은 위치에 해당한다. 이 도면은 최소량의 약 3000개의 세포가 검출될 수 있음을 입증한다.

배아에서, 성 세포, PGC는 알의 발달 단계 X에서 새로 낳은 알의 에피블라스트의 중심에 위치하는 것으로 당업계에 공지되어 있다. 배아는 항상 난황낭의 윗면을 향해 있음을 주지해야 한다.

상기 노출된 결과는 알에서 수 밀리미터 뒤에 및 난황 근처에 위치한 영역의 여기시 최대 RFP 방출이 검출될 수 있음을 시사한다.

RFP 발현 세포를 알에 주사한지 1주일 후에 실험을 반복하였다. 결과는 RFP 염료가 알 내부로 확산되지 않았다는 것을 유사하게 입증하였다.

RFP-발현 세포의 존재 또는 부재하에 녹색 레이저 (532 nm) 및 +650 nm의 적색 필터를 사용하여 알의 형광 강도에 대한 PBS 및 글리세롤의 영향을 조사하였다. 도 11A 및 11B에 예시된 바와 같이 글리세롤이나 PBS 어느 것도 알에의 RFP 발현 세포의 형광 강도 측정에 영향을 미치지 않는 것으로 보인다.

이어서, 청색 레이저 (483 nm) 및 +500 nm의 필터를 사용하여 알의 형광 강도에 대한 PBS 및 글리세롤의 영향을 GFP-발현 세포의 존재 또는 부재하에 조사하였다. 예를 들면 30,000개의 GFP 발현 세포를 갖는 도 12에 예시된 바와 같이, GFP-발현 세포는 임의의 주어진 농도 (1000, 3000 10,000 및 30,000개 세포)에서 검출될 수 없는 것으로 보인다. +500 nm, 530-550 nm 및 540-580 nm의 세 가지 상이한 필터를 사용하여 동일한 결과를 수득하였다.

RFP를 리포터 유전자로 사용하는 놀라운 이점을 추가로 평가하기 위해, GFP 및 RFP-발현 세포의 형광을 최종적으로 도 13에 예시된 바와 같이 비교하였다. 파라미터 R은 형광 단백질 (FP) 강도 (I_FP)와 자가형광 강도 (I_자가형광) 사이의 비를 나타내도록 정의되었다:

R 파라미터는 GFP 및 RFP 발현 세포 둘 다의 상이한 농도에 대해 계산되었다. 도면에 나타낸 바와 같이, GFP-발현 세포는 어떠한 주어진 농도 (도 13에 도시된 바와 같이 1000 및 30,000개 세포)에서도 검출할 수 없는 것으로 보인다.

다른 한편으로, RFP-발현 세포는 낮은 농도 (1000개 RFP-발현 세포)에서도 상당한 R 파라미터 값을 제공하였다. 고농도의 RFP-발현 세포 (30000개 RFP-발현 세포)에서, R 값은 3에 도달하며, 따라서 RFP 리포터 유전자가 여기된 알에서 쉽게 검출될 수 있음을 분명히 입증한다.

주요 조사결과가 아래에 요약되어 있다:

1. 청색에는 강한 자가형광이 있고 녹색 및 적색에서는 자가형광이 없다.

2. 주요 자가형광은 난각에서 비롯된다.

3. 시스템은 비교적 낮은 염료 농도 및 낮은 여기 전력으로 녹색 및 적색 형광 염료를 검출할 수 있다.

4. 자가형광으로 인해 청색 형광은 거의 검출되지 않는다 (mM 염료 농도에서만).

5. RFP는 알 내부에서 훨씬 쉽고 상당하게 검출될 수 있다.

6. 이 시스템에서 GFP 유형은 검출할 수 없다.

7. 알 내부의 RFP-발현 세포의 정확한 위치가 여기 영역을 정의하는데 중요하다.

8. RFP 염료는 주사 후 14일 동안 알로 확산되지 않았다.

9. PBS나 글리세롤 어느 것도 RFP 검출에 영향을 미치지 않는다.이러한 결과는 성 염색체에 통합된 RFP 유전자를 발현하는 배아가 약 1000개 세포가 RFP를 발현하는 초기 발달 단계에서 검출될 수 있음을 분명히 입증한다.

실시예 3

가이드 RNA 벡터의 설계

RFP 리포터 유전자를 성 염색체 W 또는 Z에 삽입하기 위해, CRISPR/Cas9 매개된 HDR 방법이 선택된다. 그후 성 염색체 둘 다로부터 관련 gRNA 부위를 찾는다.

암컷 Z 염색체 통합

암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477을 가이드 RNA 설계를 위해 분석한다. 보다 구체적으로, Z 염색체에의 RFP의 통합을 지시하기 위해, 서열 번호 26으로도 표시된 핵산 서열 GTAATACAGAGCTAAACCAG을 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7로 명명된 gRNA를 다음으로 제조하였다.

절차는 "PrecisionV Cas9 SmartNuclease 벡터 시스템" 사용자 매뉴얼에 따라 수행하였다. 보다 구체적으로, 두 가지 프라이머가 클로닝을 위해 설계되었다:

ChZgRNA_정방향: TGTATGAGACCACGTAATACAGAGCTAAACCAG, 서열 번호 53로 표시됨, ChZgRNA_역방향: AAACCTGGTTTAGCTCTGTATTACGTGGTCTCA, 서열 번호 54로 표시됨.

프라이머를 어닐링하여 5μM의 각 프라이머를 함유하는 반응 혼합물에서 이중체를 생성하였다. 혼합물을 95℃에서 5분 동안 배양하여 제거하여 실온으로 냉각시켰다.

나중에, 이중체를 다음과 같이 설정된 결찰 반응에 의해 제공된 선형화 Cas9 벡터에 클로닝하였다: 1 μl의 선형화 벡터, 3 μl의 어닐링된 올리고 믹스, 1 μl의 결찰 완충액 및 0.25 μl의 신속 리가제. 혼합물을 25℃에서 5-7분 동안 배양하였다.

혼합물을 DH5α 적격 세포로 형질전환시키고, 세포를 50 μg/ml 카나마이신을 함유하는 LB 플레이트에서 배양하고 37℃에서 밤새 항온처리하였다.

다음날, 2개의 콜로니를 무작위로 채취하고 LB/카나마이신 배지에서 밤새 37℃에서 진탕하면서 성장시켰다.

다음날, Qiagen mini-prep 키트를 사용하여 플라스미드 DNA를 제조하고 제공된 서열분석 프라이머를 사용하여 서열분석하였다.

일부 추가의 실시양태에서, 제한 없는 클로닝 프로토콜에 의해 4개의 추가 가이드 RNA를 선택하고, 합성하고, 야생형 Cas9 뉴클레아제 (Horizon)를 함유하는 Cas9 SmartNuclease 벡터로 별도로 클로닝한다: 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA.

이들 gRNA는 예측된 부정확한 부위가 거의 없으며, 이들 중 어느 것도 알려진 암호화 서열에 있지 않았다.

암컷 W 염색체 통합

서열 번호 3으로 표시된 핵산 서열을 포함하는 암닭의 염색체 W의 영역 1022859-1024215를 가이드 RNA 설계를 위해 분석한다. 제한 없는 클로닝 프로토콜에 의해 2개의 가이드 RNA를 선택하고, 합성하고, 야생형 Cas9 뉴클레아제 (Horizon)를 함유하는 Cas9 SmartNuclease 벡터로 별도로 클로닝한다: 서열 번호 1로 표시된 gRNA1: GCACTAGGAACCAGCAGCAG, 및 서열 번호 2로 표시된 gRNA2: GTAGCCCCAAGAGGGCTAGG.

이러한 2개의 gRNA의 예측된 파라미터는 표 7에 제시되어 있다:

실시예 4

RFP 표적화 벡터의 설계

암컷 W 염색체 또는 암컷 Z 염색체 유전자좌의 상기에 나타낸 적절한 측면 서열과 상동성인 측면 서열을 RFP-발현 벡터, 구체적으로 pDsRed1-N1 플라스미드에 도입한다.

본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 31로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

보다 구체적으로, 본 발명의 리포터 유전자를 gRNA7, 구체적으로 서열 번호 26로 표시된 GTAATACAGAGCTAAACCAG에 의해 지시된 특정 유전자좌에 통합시키기 위해, '좌측 아암'의 클로닝을 RF 방법론을 사용하여 pDsRed1-N1 플라스미드에서 CMV 인핸서 상류에서 수행하였다.

다음의 프라이머가 사용되었다:

정방향 프라이머: ACGGGGTCATTAGTTCATAGCCCATATATGGTGAACGGATAGGCAGCAAGC, 서열 번호 55로 표시됨 (5' 좌측 아암 서열 및 플라스미드의 통합 부위의 30개 뉴클레오티드를 함유함).

역방향 프라이머: GGCGGGCCATTTACCGTAAGTTATGTAACGTGAGGAAGGGTCTGTTACTGGA, 서열 번호 56으로 표시됨.

우측 아암을 다음 프라이머를 사용하여 Neo 저항 유전자의 하류에 클로닝하였다.

정방향 프라이머: TTCTATCGCCTTCTTGACGAGTTCTTCTGAGTCATGTCGGTGGAGGAGAAA, 서열 번호 57로 표시됨 (녹색으로 표시된 3' Neo 내성 서열)

역방향 프라이머: GTGATGGCAGGTTGGGCGTCGCTTGGTCGGGCATGGGATGTTAAAGAGAAGCT, 서열 번호 58로 표시됨 (오렌지 벡터에서 Neo 유전자에 대한 서열 3').

적절한 통합을 보장하기 위해 서열분석에 의해 클로닝을 확인하였다.

통합 부위의 측면에 있는 인핸서 영역에서의 16개의 뉴클레오티드 (CGGTAAATGGCCCGCC, 서열 번호 59로 표시됨)의 반복으로 인해 CMV 인핸서로부터 193개 뉴클레오티드가 결실됨을 주지한다.

일부 추가의 실시양태에서, RFP 리포터 유전자는 서열 번호 11로 표시된 gRNA3, 서열 번호 12로 표시된 gRNA4, 서열 번호 13으로 표시된 gRNA5, 또는 서열 번호 14로 표시된 gRNA6을 사용하여 클로닝할 수 있다.

gRNA3을 사용한 클로닝을 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 42로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA4를 사용한 클로닝을 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 44로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA5를 사용한 클로닝을 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA6을 사용한 클로닝을 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 48로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다.

추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.

암컷 W 염색체에 대해, 리포터 유전자, 특히 RFP를 서열 번호 1로 표시된 가이드 1 (gRNA1), 또는 서열 번호 2로 표시된 가이드 2 (gRNA2)를 사용하여 클로닝할 수 있다. gRNA1을 사용한 클로닝을 위해, 서열 번호 4로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 5로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA2를 사용한 클로닝을 위해, 서열 번호 6으로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 7로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다.

여전히 추가로, CMV-프로모터의 상류의 영역에 대한 "좌측 아암"은 서열 번호 8로 표시된 핵산 서열을 포함하고, 네오마이신-저항 하류 영역에 대한 "우측 아암"은 polyA 부위 하류 영역에 대해 서열 번호 9, 또는 서열 번호 10으로 표시된 핵산 서열을 포함할 수 있다.

실시예 5

암탉 세포주의 Z 염색체에의 RFP 리포터 유전자의 통합

암탉 세포주를 실험 절차 섹션에 상세히 기술된 바와 같이 두 가지 플라스미드, 즉 닭 염색체 좌측 및 우측 아암을 함유하는 pDsRed 및 CMV-hspCas9-H1-gRNA를 함유하는 플라스미드로 공동-형질감염시켰다.

사용된 gRNA 서열은 서열 번호 26으로 표시된 gRNA 7이었다. 표 8은 사용 된 가이드 RNA에 대한 보다 상세한 설명을 제공한다.

그후, 형질감염된 세포를 적색 형광으로 여기시켰다. 도 14에서 알 수 있는 바와 같이, 형질감염은 양성이었다. 조명 세포 (illuminate cell)를 수집하고, 게놈 DNA를 추출하고 (실험 절차에 기술된 바와 같이) 슬라이딩 PCR 분석을 수행하였다. 그후, PCR 단편을 SANGER 서열분석을 위해 보내고, 도 15에 예시된 바와 같은 통합된 서열을 수득하였으며, 이것은 Z 염색체로의 RFP 유전자의 성공적인 통합을 입증한다.

결론적으로, 이러한 결과는 다음을 입증한다:

· 암탉 세포주의 성공적인 성장 절차가 확립되었다

· RFP 리포터 유전자 및 CRISPR Cas9 시스템의 암탉 세포주로의 성공적인 형질감염이 확립되었다

· 강한 형광 신호가 적색 여기에서 생성되었다

· Z 염색체에의 RFP 리포터 유전자의 성공적인 포인트 통합이 확립되었다

실시예 6

CRISPR -처리된 세포의 생식선 전달

유전자이식 닭을 제조하기 위한 원시 생식 세포 (PGC)의 사용은 동물 생명공학 및 바이오모델링에 많은 이점을 갖는다. 닭 배아는 난생 (oviparous)이기 때문에, 초기 단계의 PGC는 쉽게 접근할 수 있으며 유전자 물질의 복원, 게놈 편집, 및 유전자이식 연구를 포함한 실제 응용을 위해 시험관내에서 조작할 수 있다. 상이한 배아 기원의 닭 PGC를 위한 배양 시스템을 구축하기 위해 상당한 노력이 이루어져 왔으며, 닭 PGC 만이 이들의 특성을 상실하지 않고 시험관내에서 무기한으로 유지될 수 있음이 입증되었다.

보다 구체적으로, 닭에서, PGC는 먼저 Eyal-Giladi 및 Kochav (EGK) 단계 X 배아의 에피블라스트에서 분리한 다음 명역 (area pellucida)의 내배엽 아래로 이동하고, 후속적으로 생식 신월환으로 이동하여 혈류로 들어간다. 순환계를 통해 이동한 후, 이들은 생식 융기에 도달한다.

생식선 발달에서의 이러한 독특한 특성은 이들을 수용자 알의 혈관에의 유전자 조작된 PGC의 주사를 통해 유전자이식 닭을 생산하는데 사용할 수 있게 한다.

상기 기술된 2개의 벡터, 구체적으로, gRNA/Cas9 및 리포터-유전자 벡터는 실험 절차에 상세히 기술된 바와 같이 PGC에 공동-형질감염시킨다. 안정적인 클론이 확인된 후, 세포를 확장하고 PCR에 의한 RFP 통합에 대해 확인한다. 확인된 클론을 단계 14-16 (H&H)에서 수용자 닭 배아에 주사한다. 주사된 배아를 대용 껍질로 옮기고 37℃에서 부화할 때까지 배양한다. 병아리의 성을 W- 또는 Z 염색체에 대한 PCR에 의해 부화 후 감별한다.

암컷과 수컷 키메라를 성적으로 성숙하도록 성장시키고 야생형 수컷과 암컷 닭으로 키운다. 부화한 병아리를 RFP의 발현에 대해 평가하고, 생식계열 자손은 표적화된 RFP를 지니는 것으로 PCR에 의해 확인된다.

SEQUENCE LISTING <110> EGGXYT LTD <120> METHODS FOR GENDER DETERMINATION OF AVIAN EMBRYOS IN UNHATCHED EGGS AND MEANS THEREOF <130> IPA191583-US <150> US 62/510,921 <151> 2017-05-25 <160> 67 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide 1 for W chromosome <400> 1 gcactaggaa ccagcagcag 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide 2 for W chromosome <400> 2 gtagccccaa gagggctagg 20 <210> 3 <211> 1460 <212> DNA <213> Artificial Sequence <220> <223> galGal5_dna range=chrW:1022859-1024215 <400> 3 tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60 gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120 ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180 gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240 gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300 ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360 cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420 tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480 ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540 ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600 aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660 ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720 aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780 cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840 aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900 gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960 tagtagcccc aagagggcta gggggcctca aaatcatgga acccaactcc ctggagtaga 1020 agggtcaggt aatgagtcca aaagagggac tataggaacc atgccagtaa cagagaggac 1080 tcacagccag catagggtcg tgctgtaagc cctgttgagg cagttggaaa tgacagttcg 1140 gtagtagtta aggtaccctt ttaaattaca gatttaaaca tttggaaagc agctgctggc 1200 agctaccgtg atgatcctaa acgggtagct aatgcttttg aaatgatgat taaaactcag 1260 gaactggata ggaaagatat ggaatttatt atgcacatgt tgtttgatag tacagaaaaa 1320 taaatgattc actagaccac acggacccaa gtggaggatc aggtaatggc aggggttttg 1380 cttggatgta atgctggaaa ggacaagagt cctttcctgt cctggggagg atttagaggt 1440 ggttagacct tggggaggag 1460 <210> 4 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA1, W chromosome, "Left arm" <400> 4 tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60 gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120 ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180 gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240 gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300 ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360 cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420 tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480 ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540 ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc ag 592 <210> 5 <211> 848 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA1, W chromosome, "Right arm" <400> 5 tggcagattt gtgatcatgg aaagaattgg tgggagcata cggcaccagg actcagataa 60 gatagctagc taaggtgatg aattgtagat ggtgtcagat aacgaaagaa gaaaaacaaa 120 tgtaataaag tgttaaatgc caatatgttt tttataatga ggcaatatcc tgaatggcat 180 tagtgtggga tcaatttggc ccagatgacc ctctgatttt aatggtagaa aatgataaga 240 gagagaggga gaaaggaaga gagtgtaaaa cgtgttgttc agcatgtagt attggactga 300 gatgcttcaa gcgaaacaag aatgagcagg aggaggattt agagatgcta gtagccccaa 360 gagggctagg gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa 420 tgagtccaaa agagggacta taggaaccat gccagtaaca gagaggactc acagccagca 480 tagggtcgtg ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag 540 gtaccctttt aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat 600 gatcctaaac gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg 660 aaagatatgg aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac 720 tagaccacac ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat 780 gctggaaagg acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg 840 gggaggag 848 <210> 6 <211> 962 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA2, W chromosome, "Left arm" <400> 6 tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60 gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120 ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180 gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240 gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300 ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360 cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420 tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480 ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540 ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600 aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660 ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720 aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780 cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840 aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900 gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960 ta 962 <210> 7 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA2, W chromosome, "Right arm" <400> 7 gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa tgagtccaaa 60 agagggacta taggaaccat gccagtaaca gagaggactc acagccagca tagggtcgtg 120 ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag gtaccctttt 180 aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat gatcctaaac 240 gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg aaagatatgg 300 aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac tagaccacac 360 ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat gctggaaagg 420 acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg gggaggag 478 <210> 8 <211> 669 <212> DNA <213> Artificial Sequence <220> <223> A "left arm" for the region upstream to the CMV-promoter <400> 8 aggcaaggct tgaccgacaa ttgcatgaag tcgggctaac attagacccg ttgtgtctta 60 atcctgccgt cgggtataca tatactaaaa gaacctcctt tccctcctat aaatcggagc 120 gagacaaggc attctttttt tattattatt ttggttgcct gcccatcaga tgtaatgaaa 180 gttgcacagg gtagggctaa gaaggtaaag gagttaaatt cccccgggag gttagagatt 240 ccctgtattg tggttgcctg cccattagac gtaacaaaag ttgtgaaggg taggactaag 300 gatccaggta aagaggttag tcccccaggg ttagagtccc tcctcagaag taaatgtaaa 360 acataaccac ggtaattgtc gttgagtgcg cttgtttgat tgttaattgt ttgtgctgtt 420 attgtatgct gattgtttgt gttgttatta tacaaagagc tcacatgcat cgttaaaatg 480 ggcattggat cacctagggg tgagggaatt ttgaaaaagt cacttttggg ctgtgtttta 540 agtcattgga aagaaatagc tggatcccct ggtggggttg cacagaagga tgatttaagt 600 acgatggatg cctttgaggc aggcactagg aaccagcagc gatgtacggg ccagatatac 660 gcgttgaca 669 <210> 9 <211> 911 <212> DNA <213> Artificial Sequence <220> <223> A "right arm" for the region downstream the Neomycin-resistance <400> 9 ttctatcgcc ttcttgacga gttcttctga cagtggcaga tttgtgatca tggaaagaat 60 tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120 gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180 ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240 accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300 aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360 aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420 aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480 catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540 gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600 atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660 gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720 ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780 caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840 tcctggggag gatttagagg tggttagacc ttggggagga gggttcgaaa tgaccgacca 900 agcgacgccc a 911 <210> 10 <211> 911 <212> DNA <213> Artificial Sequence <220> <223> A "right arm" for the region downstream the polyA site <400> 10 atctgtgtgt tggttttttg tgtgtctaga cagtggcaga tttgtgatca tggaaagaat 60 tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120 gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180 ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240 accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300 aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360 aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420 aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480 catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540 gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600 atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660 gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720 ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780 caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840 tcctggggag gatttagagg tggttagacc ttggggagga gcaagtaaga tgcttttctg 900 tgctgcaata g 911 <210> 11 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 3 for Z chromosome <400> 11 acagacctat gatatgt 17 <210> 12 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 4 for Z chromosome <400> 12 cgattatcac tcacaag 17 <210> 13 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 5 for Z chromosome <400> 13 ctggttagca tggggac 17 <210> 14 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Guide 6 for Z chromosome <400> 14 gtaaagagtc agataca 17 <210> 15 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> ENSGALG00000025945_ENSGALG00000023622|chrZ:9156874-9161874 <400> 15 cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60 gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120 ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180 caatgtgggc attgccgacc acagacctat gatatgtgag tggtgagtgg ggccaggaga 240 gcaggacagg agtgtggact cggaggcgcg ggcagaggag gtagctcaga gcatgagata 300 tattcgccag gtgtcagtgg acttctggca gtgcatactg cagagagctt tggttgctgg 360 ccatctggat gatgacaaaa tctcagccac agaccatgtg ggttggaaga gtcctcagga 420 gatcaccttt ccacctcctg ctaaagcaca ttccctacag tatgtttcac atgacaccgt 480 gctggcagat ttttaatatc atcagagaat gacactccat atcctctctg ggcagccttt 540 ttcagtgctc tgtcacccac aaagtaaagt atttgctcat gttctaatgg aacttcctat 600 gttctagttt gtgaccattg aaccttgttc tgtcactgga cagtgctgaa ggagcctggc 660 cctatccact tgactcccac actttacata tttacaagca tcgataagac ccccctcagt 720 cttctccaga ctagatagcc ccaggtctcc caaccattcc ttttatggga gatgcttcag 780 gcccctcatc acctctgtgg ccctctgctg gactgcctgc agtagttcca ggtttttttt 840 tttgaactgg ggagcccaga acttgacacg gtattccaga tgtggcctca ccagcgcaga 900 ggagagggga aggctcacct ccctcgacct ggtggccatg ttttttttaa cagacctcag 960 gataccactg gccttcttgg cccaagggca cactgctggc tcatggccca tgggttggct 1020 tccaggactc tcaggtcctt ctccgtagag ctcctctcaa gcaggacaac cctcagcctg 1080 tactgatgtg tgcggtgcgg ttattcctcc ccacgtgcaa gactctacat ctgccattgt 1140 taaatctcat aagcttcctc tctgcccaac tctccactgt gtacgggcct tagtgaatgg 1200 cagcacagac ttctggtgtg aggatagcat tcagaacaag ctgctgtacc ttcccagtca 1260 cagaggtgag ggtgactggc ttgtactttc ccagctttgc cttcttgccc ttttggaaga 1320 ctggagcgac attggccttc tggaggaaac ggtcctcagg cacccctcct gttctccatg 1380 acctttgaaa gatgatcgag agcaccttgg cagtcacttc tgccagctcc ttcagcacgc 1440 atgagtgcat cccgccagtg cccatggatt tgtgttcatt gaattagcct aggtgacctc 1500 tgatcagatc cttcttgacc aaggggaaga cttcctttcc ccaggttctt atctccaggg 1560 cctgggattc ccaaggggca atcttagcag gaaaggatga agtaaaggag gtgtgcagtt 1620 acagtgcttt catggtgtcc tccattactc caatgaggtc acccacctca ttcagcagca 1680 gacatacatt ctcccagtct tcctttttct actgccatac taaagtagtc cttcatgttg 1740 tccttgactg aaggtcaccc aacttgattt ccagtgagcc ttagcattcc ttgtagcatt 1800 catgcatgtc ctgacaacat tcctattttc ttcccaagtg gccagagacc ttttccacac 1860 tccagaggct ttgttcttcc attactgcct ttccatgagc ttcttgctca tctctgcagg 1920 tctcatgcca cctttgcccg atttcttagt cttagagatg caccgatctt gaatttggaa 1980 gaagtggtgc ttgaatgaca accagctctc ttggtccccc ttgctttcca aagctctaac 2040 ccatggaatg cctccatgta tgtctgtgaa gaggtcaaag tcagctctcc tgaagtcgtg 2100 gttgcaatcc tacaaactgc ctgatttctc ccatgggaga tcccgaactc cactatctca 2160 cagtcactgc actcaaggct tcccccagcc ttcacatccc cagctacagg aagagaagag 2220 gctcgaggct acttgcagct gtctgcggaa ggcttctcca gcttcctcct cttcatcagg 2280 cggcctgttg taaacaccca caacagcgtc acccatcata gcctgtccct tagtcctcac 2340 ccataaactt tctactcatt catcatgcat cccttggcag agctctgtac attccagctg 2400 ttccctcaca taaagagcaa ctccaccacc tcacaccgac gtctgtctgt cctaaaaagt 2460 acagagccat ccctgagagc attccagtca tgcgagctgc cccaccacgt ccctctgctg 2520 atcgcactga gatcgcggcc ctacgaccat ccatggatct atgactcttc ctgtttactc 2580 cccgcactgt gtgtgatgtt acacaggcac ttcagagaag aaaagagagc acaggatgcc 2640 gatttccctt ggcaggaccc caggggccgc acgcagcccc cacctctatc agcaggtctg 2700 agcaggactg gagctgcagg cagagcacag ctcagccctg agacacctcc atgctgcctc 2760 ctgcacagcc tcggccccac agcccccggg aaggagagca cgggtggggt gccgggagcc 2820 acgctgcgct ctgacacact gcgtgtcccc tgctcccagc gcgagctgca gggcccgtgc 2880 aggaacgagc tgggccccaa cgtgaccctc ggccccggtc actgctgaac gacagcgttc 2940 agctctccag gctgcaaaga gcgagccgtg aaatggagca acacgcggga ttcccgggtg 3000 tgaattccta aacggattcg aaggtgccca acaggcagcc actgcgtccg cagctgtgct 3060 tcggtacctg gagacccgcg agcccgtctg ttcccaccag cctccagcag ccggtgctcg 3120 cggatcaaaa gaccgccgtg aaggccgcag ggccgtccct gggacggagc gccgcccgct 3180 tccgccgcca gccgcggctc cgccctcccc gccgagctga cgctggcagc gcgcagagcg 3240 cggagcggag ccgcggcgct ttccggcggc agcgcccgca cggggctcgc cgagggccgc 3300 gcagagcgct gtgcccggcg ggccgcgtcg ccgctccggc ggcaccgcga ttccggcacg 3360 gagcgcaacg agcgcccgct gcccggctgc aggacgcggt cggggccaca ccgcggcggg 3420 gccgcagcct gccttccgcg ggaccgcacg tccggcctcc ccgaatttgg ccccgcagcc 3480 cccgggctgt caccgtgctg tcaccgtgcc gttcacggtt tacgggctgg ttcggcccgg 3540 ttcggcccgg ttccgtgact ggcgggacag agggattcgt ggatccgcgc ctccgggaag 3600 ggaaacggga ccccgaataa ttaaaaacag cggccacgat ctgaggggtt acaaatgtac 3660 taaaacgtac taaaaacaaa cagctgctta acacctccta ttccaaaggc ccatcgacac 3720 cccttggcac cctcaaagta tccccttctg aggtaatggg taccaagaat gcacggagcc 3780 cctgggccag tcacagcagg gtgcttttgc cagtctgtac cggtgaggcc tatttcggcc 3840 acaaacacag tcaattcttg ggaaccccca ttcaccccat gaatataagt tgattctgtc 3900 ccttggtgac tcgagggcgt gacagtgcac tgtgcaccag ggtccaccag ggcctcgtat 3960 tcctgaggtt ctgatgtgcc acaccacgaa cccacacggt tcaatacact ccatcatcct 4020 ttccccccat ggtgggggca gggtccctct atttgttacc tctgtcgttc ttagagcggt 4080 tgccatgtcc tgcagcaatg ggagcgatca cctctttggg gattaatctt ggtggttaat 4140 ctgccttgta attattttac ctgtgcttga aaatgcccct ccaggtgaaa gcaaactgca 4200 gcctgcattc tgtggccaaa ggaatggaaa agaaggcgtt agcaatgcca gtggtggcat 4260 accacttggc ttcttttgac tccagttcat actggagttc taacatgtcc agaacagcag 4320 cgctcagtgg gggtgtgact tcattctggc catggtagtc tactgtcagc ctccattctg 4380 cactggcttt atgcactgga gcacagggct tatggggagc ggcggaggga gctgggatgg 4440 ttcagtctgc agatgaggag gctcagggga gaccttattg ctctctgtaa ctccatgaag 4500 ggaggttgta gtgagctggg ggtcggtctc ttctctcatg tgactagtgg taggactaga 4560 gggaatggcc tccagttgca gcaggggaga ttcaggctgg atgttaggaa atgggctgga 4620 gtgggctgcc cggggaggtg gtggagtcac cgaccctgga ggtgctcaag gaatgtttag 4680 acaccgtgtt tagggacatg gtatagtgag aactgttggt gatgggtgga cagttgggct 4740 ggatgatctt gtaggtcttt ttaaagcttg gtgattcttt gattcgataa gtgcaaagtg 4800 ttgcatttgg gtcagagcaa tctcacgggt gtgcacaggc tgggagaaga actcctggga 4860 gaagaagaga gcagccctgc agagaaggac ttgacatgaa agacttaacg tcagccagac 4920 tccctctgct ctgccctcat gagcctctcc tactctgtaa aggtttgggc ccccagcaca 4980 <210> 16 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> ENSGALG00000015036_ENSGALG00000000438|chrZ:27764943-27769943 <400> 16 aggagtggct tctgaggctg gaaacaaggt gctcccctct tgtcaaacag ccaattccat 60 ctagctccaa cccatcctcc actggccaaa gctgagccca tcgctgatgg tgatagcatc 120 tgtaatagca tctcagaaag gctaaaagca ctgcgcagca gctgagagaa aagagtgagg 180 gaaaatggga cagaaacagc tctgcagccc tcagaggcaa tgcagaggag aggcaggagg 240 tgctccaggc atggagcatt agtttcttgc agtccaggag ttacaggtga tggtgcaggc 300 tctgtgcagc ccagtgatga ctgtttcagg atccatgctg cagcctgtgc cagagccagg 360 ggataggctt ggctgcttag tgcaggacgt ggagagccca tgctgagtgc aagctcccaa 420 aaggctagga cagaacaggt gtagtggagt agatcttgta ctgtggagca gtcttttcct 480 ggaggactaa cctgtgaaga ggaggactgc gctgaagcgg ttcatgaaga atgaaacctt 540 gtgggaggga ccccacactg aaaaaggaga aaaccacgat gaggaaggag cagcagagag 600 ctccccagcc ctgtgtgcac tgccaggaga gaaggaagta gaaaacgtgg gaatgtgcag 660 gtgtaaagct gagtctggga aaaaggtggg ggtggaataa aggtattttt agtcctatac 720 ctttctcatc aacctacttt aattgtagat tggccataaa ttaaatgttt tccccaggtc 780 aagtctgttt cttgcttgtg atggtggatg atctccctgt cctcatccca atcctgaagc 840 tatttcatca tatattctct ccctgccctg tttcaggaca gggagtgcaa gcagtttggc 900 agccagacga ggttaaccca gcaccagagg tttagtcaca tgcaagtgag agctattgcc 960 tcaacttaaa tgggagaaaa cattttagca ggttgagtct caccttgttt atccagatta 1020 tacagccatg ccagcacatg ggctgcatgc agcctggccc aacccatcct ctagccaccc 1080 cctgccccat actgaaaatg cagcggctct gccctgccaa gctgccaagc ctggctccag 1140 gcactcaccc attgcttaca aacaacaaaa cgtcagcgtg tgagcgcgcc ctgtgagctg 1200 caactggcat ggggagggca cagtcagcac aaatacatga cctgcaaatt ttcacatgga 1260 atgtatggag ttgcaatcag atactcagct caaaaaattt aatcatggct ccttacctgt 1320 ctttttttta acctttctct tagctcagag aggtatacct cacttcacaa tcatgccgta 1380 ttcatgtcat tgctttctgg cagtacgtac gtttgtgaac agctgttttc aagggtgatg 1440 cacaggaaga gtaaaatttc attaaaaaat ctccaaggag cacatggaga gctcactcag 1500 aagcctcacc gctgccactg aacaagactg atgcattagt ttcatgaaat caaggctatg 1560 tgtcccactg gtttcattat tttgttactc tttctttaaa acaaaaaaat tgttttattg 1620 cttatataca tcaactatgt tgttatatat tttccaaagg ccgctccaaa agtaatgcct 1680 cctgtttcat tctgttggcc caccgtgtca gaggcagatg gtggtacggc agtagagatg 1740 gaaccttccc accaatattc cattacatgt tgccatgtga tagacagcag cagatgggca 1800 ctctgacaga atggtatctg acatggaagc gtggatggag caaagttgtg tcactgaatt 1860 cctccataag gaaatgagca cccactaaca ttcactgatg cttgctgaac atttctggag 1920 accaaacagt ggatgtgagc acagtgaggt ggtgggtggt gcatttcagc agtggtgaca 1980 atgacgttgg gtcacctctg ctggtgcagg ttttgatgag tgcagcctgt gaggtcttgt 2040 tcatcaatgg agaaaatgca caactaatgg tggtgactgc tgaaaaatag tgttttgtag 2100 ctgagaattt tctctgtcaa acagtgctaa ttgtgctctt tgtatctgtt gtagtttcca 2160 tgggaataaa taggaggcat tacttgcaga ctgacctaca tatatgtggc cccaggcaag 2220 tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 2280 acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 2340 atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 2400 tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 2460 gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 2520 gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 2580 tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 2640 ccaccagact ggtccccgat tatcactcac aagctctcaa accgattgtg gctgtttctc 2700 agaggcaact ctttgcgctc tagcccctct ataacatggg gcaacttccc ctgccccacc 2760 ttcccttcct gtatcttctg aaaagcttgt agccctcaat tgtcacgctc cagccatatg 2820 aatcatccca ccacgtccct gtgttcacaa ttaccttcta gtcttctaat tgcaccatgg 2880 cttccaattc ctcctgttta tcacccacgt tgcatccatt gatgtagagg cacttcagtc 2940 gggctatcag caatgttacc acctgtgagg agccctcttg agatctttta ggacaattta 3000 gaggttttcc ccactgtttc ctaaaattac agcattccct gtcccttctt agtgatatag 3060 aactccatcc ccttccacca tcaaacctag cttaagctct ggtaaatgat ccagccagtc 3120 tgcttcccaa aactcttgct cagttgcatt ctatctgatg cctacatgcc caacaccttc 3180 aaggcctgtc caagatcata gaacacaaag gcttgatcat gacaacatcc atgcagccaa 3240 tcattcacat gacccattcc tctcctcctt tccaggtccc aacggccaac tgagagttgt 3300 gctctgagct cttcagtgtc cttccgaggg atgtaaagtc ccttttaatg ttctgcattt 3360 tctttgtcac agccttctga gacccaactt gaatgtggag gagtggagag taatcatccc 3420 gctctgatta tcagatacat tagcctcttc ttggcacctc tggcagacag aagacttccc 3480 tggagagatt acctggatga taactggggg cctcagtgcc tcacagcagc aagtccccag 3540 ttactaagac tctacacctc tttggtggcg ctagttctga tgtagttctt cagttgctta 3600 acatgcttgt tgtttcccaa gatttgactg ctatctgcac cctccctttc ttccagcccc 3660 agagccttat atcatgagct gagaacattc tgtgttcaaa atacaagaca catttatgca 3720 atttcgtatt ctctacccat atttttgtga tagaaattag ggctacttat ttcccatagt 3780 gatttccatg ctgcctacca ggttctaagt caggtcaccc tgccagcttc ttccaaacca 3840 tgctcaggag tgcatcaaat cacacgcaga cccaaggaaa aaatgtacca aacaatatta 3900 ccacgcatgc aaactcctca gtagctctgt cccatatgct acaattaggt ctgtataggc 3960 ttgttagatc ttgtctactt gattagtgtt ttccagcagg cctacaatcc aacctaaact 4020 gaacagacat taaagacatg tttcactaat acaaaacaac tccacctagt tcaacagtct 4080 gctcttttgt gtatggtacc tgaaactctt ctgttcactg aacttatccc aacatttttc 4140 ctcctaatgc atactttttc tagacgtgat gtgaaagtac agtgttatac cctggtgctg 4200 cattaatttg cataaccaca gcacacaaag cataatcata acacacaaag gcctcctatg 4260 aaaacatctg cttaaagtca taggtcactt atttattctc cctctagtta tgtaccagaa 4320 tgatgtatgt taataaataa tagattatta aatccatcaa aaattaggga agagctctag 4380 cacaaaggca aagcaaagaa gctttgaaga agtgcaagta aaatgaatta tttccaaaca 4440 actagcttct cactgtccca ctaagaacaa agactattct tatgcactgc tgtccttaaa 4500 attatcagct gctttgtgtt tatttcatgg agtaacacat gcaatatttt ttacaagaaa 4560 taagaaacca cagcagcaga agacgaatct gcttttattg aacgcagaaa tagatggaca 4620 ctgaaacaac agaagtttct accatgtttt gctgctgtga gagcaaatct gctgttgatc 4680 aactattagt tttgaaaagt atatgcaact ctgctatcaa ctccttcccc acatcacatc 4740 tcgtttcaag gagaaccttc ctgtccaggc aactagccag ggattttaat tttaacattt 4800 gctatctcag ataatctttt aatatttcta ggccgtgcac ataacccaca tagccctaac 4860 tccagatgtt cccagcatca cttagcagta gttccacttg aagcataaat acagcactgg 4920 cacaacaaat gaagacaatt caagcacgcc tttaacaagc atacagaaca tacagtttta 4980 <210> 17 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> ENSGALG00000012629_ENSGALG00000012628|chrZ:42172748-42177748 <400> 17 acaaattaaa tgtattttct cttgatacta ttttgattat aagctattaa cttgatttgt 60 aaaagcaccg atattatggt taatgtatgt atggtaactg ttgagtcaca gcctgaacct 120 ctgattgacc acctgcggaa aggtctgggt gagccctggg agcacaggca aaaacaattc 180 agttgtgcaa ctggaaggcc tctcttagac ctcatttaag ggctgactgt cactggggaa 240 ggatctgatt ctggagatcc cttattggtg aagctttccc ctgcaaacct agaatcttct 300 gatgcaagtg agcaatcttc ttcccttccc tagcagctct ctgttgcacc agtccttcca 360 tccttgcacc tttgttgtaa tgcttttccc atggcattga tctgtccagt tgctacagtg 420 tagaaacaag aaagtgtttt ctcaaaacat tatacatgct tactatcaga tcttacttaa 480 cattgataag aagtacacct ttcattacaa cagtgaacgg ataggcagca agcattcaga 540 acaatgaaaa agatctgcgt tctattgtaa agcaaacaaa ggtgatgacg gaacgtttat 600 ttgagataca ggcaccatag tacaagatat caaagaggaa ttaattcaac cctcccaaca 660 acagttggga aaaaaaaagg ataagctgag gaatgcagcc ttctccgatt tttactctgg 720 tgccggaagg aggaggagga gcgggggaaa acccagcgga ctcagactgc atacgcactc 780 tcggaagtac ctctgaggcg gggtgagagg aagggtggat ctaggctccc cccgctccac 840 acactcacgt gctcgtgtac tggttcaggc tgtgacttgg caactcctct acatctatcc 900 atctagttag actcaacaag accatcgtga ttcaggagtc tgaagatgct taactctctc 960 agaacgtcta gttctcctgg cctggtaaat gctatgtttc tcatactgcc tctctgaaga 1020 atgcttcgaa tgcttctagt gatgctctaa agttctaaac agaaaaatct ggagacagtt 1080 ctggtcttta gatagaaaaa atgccaacat gccaaaggat ggttacatcc ttcaagcaac 1140 cttgttgcat gctgtacaat agactcatgt aataacttag ccgtagtcat cgtatctctt 1200 atttacctgt tcgttattac attttcctgg tactgcttta tatttagtca gttgtccttt 1260 taagacaaat tttttggtgt gtgctaatag gcagttacca aatgttctag agggagggaa 1320 tataatcagt gagtatgtag atgtatatag atgtataacc agtaagtata cagagaagtt 1380 agggtggtct tttgagagca tatagctgga aagattatca catgggaaaa ggtaatcaga 1440 aataaatgga aaaatgctca ccagtgtcat aggctcacaa gaaaactccc caaggagcaa 1500 tctccagtaa cagacccttc ctcagtggca gtcagccctt aaatggcatc taggagaggt 1560 gtagccaggc accacccctt ctgtcacata ggtgaattgc cttcagctgt gctcctgcag 1620 ctgactcagt gttcacctca ggtgatcaat cagaggtcca gaccatgatt caacatttcc 1680 catgcggagg gagatgaaac aagactgtca tctcatcttc tgaagctgat aggagaatgg 1740 ttacaataag taggtcccct tccactggtt tagctctgta ttactcagtt taaaacttta 1800 tgtagttaat ggagttccat agaatcacat cgctggaaaa tgtatgtgat agctataccc 1860 aaaaagtgac acagcatcac agcctctacc aggtcctctg cctccagaca ggaccttgag 1920 ctgtgtgatc cctttgggat gtttctgttt aagacagggg acacttacac attaggaaac 1980 tggagtcatg tcggtggagg agaaagtggc tgtagaaaag gtaacggaca agaaatccct 2040 cactggctta gctgtaaagg tcagaggaaa atcatcttct gttctccata cacatctcct 2100 gtaattaggc acctgtgccc tttaaaaaag taaagtaatc aaagagtcat ttggtgaaaa 2160 tagaagccaa acagttacaa aatttagtta atattcaaag acaaaacaac tctggttcca 2220 aatataaaac cctttgtgta aacactgcgg gaaggtgcca aagagccacc tacacaaaga 2280 gatgccacag agtaatttgc gtaccccaac aataggatca tatatgggca aaccaaaaga 2340 ccaacaaaga ccccttgcaa taatcccttg attggcagaa gcaagtgcag cgttagattt 2400 agtatgtgtg acaattctga gaataggaag gaatttcact gaaactgtgt gaagatttgt 2460 atgttaaata catataatga gggttattta gctctggggt gtgcatgcta tgtggagaga 2520 tccccatgtg cccagcactg caatagacta atgtcagctt tttaaaccat catttggttt 2580 gaagagttta ttatgatttt cagaaacaga attatgtatt cagtgtctgt acattcttac 2640 aagcctgctg ttctgtacac atgaaaaagc tacttatggt gcaaatcagt atagagaagc 2700 agttttgaca tacagtggtc atgactgggt gatctgctgt cagaaggtaa gacactggta 2760 tacagaattg caaacgtgag atgaagacct caagtgcaac tctgtcatca taccacttct 2820 cttgctatta tctattcagt gtttgttcta aatattcagg cagaaggctt ggtttcacat 2880 caggtgttac atttaagtat tctttgccca ttttttgctg tttgtatgtg taacttcaga 2940 ttctcacatt gactgtgtag tgtaaatttg caaatagatg taacagcttc tctttaacat 3000 cccatgccaa acttttaatc actttcaatc aatgttggaa atctgcagta cataaatttt 3060 attttgattc attattcaga gaatcagaga aataaggact tttttagagg tttatgttta 3120 ttttagaaaa tataaataaa tcttgtatac atagatttcc aactagtaaa atttttagct 3180 atcgctgtag catttctatg aggagtttta ctttttactg tctcttatga aacttagtgg 3240 aaacaaagct aggtttcata aaacgtctaa tctcatattc atctctctcc aaaatatggt 3300 gaccttcaaa acaagaacag tttgcttatg taaacatttc ttacattgta ttctattaca 3360 ttatcatatt catgaagata ctttagaatt ttgttgctgt tagttctgtt gtgactggct 3420 gcttttctca gcttaagagc tctgcagaag tgatgataat atatattctc tttgctgagt 3480 tacaggaatt tcctgctttc ctctactgta cgttggagcc caggagatca gatccaacta 3540 ccagaatttt atatagctct ttgtgatcag tccttcctta gttgctgtta ttcctattga 3600 tgcaaaccta tttatggtgt attaaatgaa gaagatataa tgaggacagt ctaataatca 3660 aagttttttt ctgcagccag tagtacaggt agggtgacat gccttgcata aacagatcca 3720 gatgaaaggt gtgggtgagg caataagtct tcaggccctg ggctaaggca ggacctgttt 3780 tgtttcatga gatatgccta ggcctctcta tagacagggg gagatgtcag agaattctga 3840 agcatcagca gaggctatct tggttttcag gccctgtgct aagtatgaga ggaagttgag 3900 aacagataat gtgtgcaaca aagttagcaa catgcttttt caaaacagag gaaacgatcc 3960 ataaatactg gaacagaaca acctcacaga aatcactgac tgtccctttg ctggccatgg 4020 catcctgaag gttgtgctgg tagcactcat tgggttgctg tagctgataa ggcagtgcaa 4080 ggacattggg tctgcacctg ctatgaacag gcactggggc ctccaggagc tgctggtatt 4140 agtcatgggc atcagaggtg aagaaggcac ttgtagttct cacagctctg gcactgaccg 4200 atatttctgc tgtagttaat gggattattt gcatgtagtc aacagtttac aggctgattt 4260 ggctctgctc cgcaactagc aggacagagg gacccacaga tccatgtcct ggaaggggat 4320 aagggaaaag gatagagaga tgggcctaaa acaaaacaga agcaacgatc tgaggataaa 4380 caaagtaatt tactaaataa gatagtggaa tgcatgataa cacactatag tacaacataa 4440 tgcaatgtaa ttagaactgg agctaataaa tcaaatataa agagagtgtc tgaaagccaa 4500 aggccttact ctaatgctgt gatgagatgg cacccacaaa agagacgagc cagatgattg 4560 aaagggatgt atggtggtct accaaggcct gttatctgtt tgccctgagc agaaatgata 4620 gcagaacagc aaacagtcct ctggggaatg tagtagttct tctcttctgg gacaggtagc 4680 tggacctaga gcattaactc tttaaccccc agtacactac atgatgttat gatgtggaat 4740 accaataacc aaacatcata aaaccatgac atagtcttat gtcgctgtgt tgtaactgga 4800 agctgaggat ctccactcag tatttctgct gaatgaagca gatctttcag ttgaaggaga 4860 ccaacttaat catccacttc caacccctta ctatggacag gttcaccgtt cactagatca 4920 agctgcccag ggccccatcc aacctagcct tgaatgcctc cagggatgag gcatccacca 4980 <210> 18 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> ENSGALG00000015617_ENSGALG00000027714|chrZ:63363656-63368656 <400> 18 gaaaatctct gccactgatt gttttgcagc ttagttgtct agttattcgt gagatgttga 60 ttcaaacctt tgctcagatc aggcacagaa gcagtgctga actttgtttt tccgtagcct 120 tgctagtgtt gtaactgctg tcttagtgaa aacctgctta tttgcatccc cttcccaact 180 ttgggaaagt tgctgtctgt gattccagaa ttaggactcc ctcggttgca acatgactca 240 gattttcaga ccttggcttc agaggcacag tggtctttgg tgcagagaaa aatgaggctg 300 agaagaccag ggccatgatg agtgaggaag atgcaacaga acaagataga gaagagggaa 360 gagtttttta ggagctccac cagacatact gtagaagcag tgtagatgca cagtaccagt 420 aatgtactcc agccaaccac tcggtgaaga cccatgaaaa cctaatgagg ttcagtaagg 480 ccaagtgcag ggtgctgtac ttgggtcggg gcaatcccag gtatttatac aaactagggg 540 aagatctcct tgagagcagc cctgcagaga aggacttggg ggtcctggtg gatgagaagc 600 tggacgtgag ccagcagtgt gcacctgcag cccggaaggc caactgtgtt ctgggctgca 660 ttaaagaagg ggtgaccagc agggagaggg aggtgattgt ccccctctac tcagctcttg 720 tgaggcccca tctggagtac tgcatccagg cctggagccc ccagtacagg aaggacgtgg 780 agctcttgga gcgggtccag aggaagacca ctaagatgat cagagggctg gagcacctct 840 cctatgagga aaggttgagg gaactgtcct tgtttagctt agagaagaga aggcttcagg 900 gaaacctcag tgcagctttc cagtacttgg aaggagcaca taaacaggaa ggggaatggc 960 tgtttacgag ggtggatagt gacaggataa gggggaatgg ttttaaactg agacgggaga 1020 gttttaggtt agatattagg aggaagtttt tcacacagag ggtggtgacg cactggaaca 1080 ggttgcccaa ggaggttgtg gatgccccat ccctggaggc attcaaggcc aggctggatg 1140 tggctctggg cagcctgctc tggtggctgg caaccctcca catagcaggg gggttgaaac 1200 tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg aagactctgt 1260 aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca ccacattttt 1320 actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg ttaactgctg 1380 gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt cacccaaaat 1440 tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt acagcctcac 1500 atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg tatattatgc 1560 actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt aagcccagaa 1620 atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga cacagatgtg 1680 ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa tctctgaaat 1740 ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat agaattggtt 1800 gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag gtaaacaggt 1860 gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt gtttgttgtt 1920 tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca ttagcagacc 1980 agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt tctgtggaag 2040 aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac aaataatgtt 2100 atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag caaactgagt 2160 cttatcgttc ctactgtgct ttgcttttct tgcttagcaa aacatatcag aaaggttttc 2220 agttaaaaaa aaaaaaaaaa aaaaaggatt atactgcagc catcaaagag ttctgttaaa 2280 gaagttgtgg ttcatattct tttcaagttc tgaagacaat ctgacaatag aggagatgag 2340 ggtttagtgg aggtaaatgg agctgtttct gaaagtaggg caccgtcgtg aggtaatctc 2400 accactagat gttgctgtaa gcatgatgag gggagaagct ggagcacaaa aggtgtaaac 2460 ccaatggttg atcatgcgca ctcggacaga ggaaatcttc aaaatgggaa agttagcttt 2520 gaactgattt ggtgggttcc cattaaaaat gggggactta ctgccttatt gtctttatgt 2580 acccatttgg gggatagatg ccatacagaa acaccagagc ttacggtgtg aattcattgc 2640 acatcttatt agatcaacaa aatggaataa aagaatacag aagattacta ctccattggg 2700 catgtggacg ttttacaggc ctggataaat tagatcttaa aaacaaacaa acaaacaaac 2760 aaaaaaactc cttgcaaaga taatgttatg taatattagt tgcaagaagt aagcaaacac 2820 acagaactgg gagcagaagc aaagcactaa gttattaaag caagttgcac attttgagtt 2880 gcattttgcc actggtttta taaacatgtt tagcatgtct ggtcagaatt tgggcaccag 2940 gatgctttta agatgtctgt ctatggaacc tgtcagtgct caagaataac ttctgttatt 3000 tggatgctgc accaaagaat tcagaggaag acgagccaag ccagacgtta tcatagtcac 3060 tagtaaagtg gttctaagcc taattaagac atgtcagaac tatgtgttgt gcaaccaaat 3120 cctccaaaag agaaatcaga ggtgaacttg tgcaataaat atagaagaca cgtaaatcct 3180 gaggcagtta gctaaccata tgaagccaat catacctgac tgctggacgc aggagactga 3240 accttacaga ccctggagaa tcactgtttg gcctagttag gcctgaatgg aatttaccaa 3300 gattcatgac tttaacatgg atcaggtgca aagaaaagaa ggctcagtta gttcctacag 3360 gctaccagat ctttttccac ctctgctcag cctggagctg tgggctctac ctgcccctga 3420 agtgaagtgg catcaactgc aacacttttt gcagaggcaa aaatcatcaa gtcgtgcctc 3480 tgcattttaa ggtgatggat tccaagagat agattccaaa cccaacactg agattcctct 3540 ggtgatgcag atgactgctt actgggatcc ttctctctct atagcctaat cccatgcagc 3600 accaaaagtt gggcacctga atactatcta tcttcctcca tctgacctct gctgctggct 3660 catcacgcat ggctcctgag cctgacagag ccatggggaa agacatggcc tgaccttttc 3720 agacagcacg acttcctcca gtgtgctgca ctaacgacaa tattaaaaat aacactgcag 3780 gaaaacatgc tgttttctag caggctggag gaaaaaaaag gtgttcaagg tgagactcta 3840 taagatcact ctttccaaac acagcagtta actcttttct cacttgaagc tgaaattcat 3900 cttcagtagg tgacggttac aagcagctct ccaccggtaa gtgaaagttt gctgggtttt 3960 tttcaggcac ttcaagacac gaaggtaatt gctgcaacac cttcctagct cttcctgagt 4020 actcagccca aagctacact cttcagggct actctcctag cacggctctc tgtaattagc 4080 ctggctttct aacttatgaa ttaacgctgc agctactcaa cagggcagct ttgcagctat 4140 gaactttatg catacacttt ttattctggg tggtacaaat tcattgctaa gaaatcttat 4200 aaactctatg gaacactttt aaaagcctac atgtgattaa aaacaaaaaa acaaaaaaca 4260 ctgatatcac atgctatatt ctctagaaaa gagtattttg gaaacaattg taattcacag 4320 ctcaggagaa agagcaattg ttttcctttg tgctggagct ggaattctat gcagtataaa 4380 tacagatgtc caaacaaact cattaaatgg tagtcatagc aaatggagga aaaaaaaagg 4440 gggggggggg gggaactgaa gacactgaag aaattctgct gaaattcatg gagctgcaac 4500 aagaattgat attgattact tcaccatatt ccgctctaat taactagcac aacactgact 4560 gttgtgaaaa caagcatgtg atttgaccca ataagtgttt cttttagtaa ccaaaaccaa 4620 acaacaacaa accttctggc tgaccagatg gaggataaat tctaacctga tcattctgac 4680 acaaatgagg aattatgtag gttggaactg cattccaaag caaagcatgt ttttggctta 4740 gttgaacaca cagaattcat ttttcttgct gattcttgta actaagggca ggtatgaatt 4800 ggttccctta aaagaagtcc ccagaagcca tggtcctcaa caagtcttct cagattagca 4860 aggatgaacg actgagaaat caaaacccaa attcagatct aagagccttc aacagatttg 4920 ctaaatgaaa ctagcaaata ctgtagaagt taacttgatt ttgaaataaa acaggatttc 4980 <210> 19 <211> 4980 <212> DNA <213> Artificial Sequence <220> <223> ENSGALG00000008188_ENSGALG00000008197|chrZ:78777477-78782477 <400> 19 aaaggagttt cttgcctgaa accccttaag attttgtgta ttgttgttgc cctggtttca 60 gctgggacag gactgatatc cttcacagta tctggtatga tgctgtgttt tggttttagg 120 agaaaaccag tgctgatggc acaccgaggt tgtagttgcg actgagcagt gctgcacaga 180 gccaaggatg tttcagctgc ccacactggc cttcctctaa gggggtgtga gggcacatgg 240 agctggaggg aaccaaaggg gtattccaca ccatatgtca ctgagcaaag acattgctgc 300 ccaggcagag aatacagtgg tagaaatacg tcacataggt gcccatctac cccagaactg 360 ggccagcgaa gaacatcaga acaacaagca tgcgaatcag gctgctcaga ttgatgtggc 420 tcaggtagat ctcaactgtc aactgtcacc cataaaatgg atgagacagg agcaaggcct 480 gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 540 gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 600 aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 660 gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 720 acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 780 agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 840 atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 900 ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 960 ggcatggcat ggtcagtgac acccactggt tagcatgggg acaaactgcc agagcagagg 1020 gctgctgaaa cgccgagtgc caactgacac tgttcagctg acagcctcac gagagtgctg 1080 cgagggttaa gtgaggcaac aaaatacaag tactcaaaaa tagaatggaa tggaatggaa 1140 taacagaggg aatggggaac aggctgcagt gagaaggaaa cccccgtgca ccgaccaacc 1200 cgctcccagt agcctggtcc ctaccttgcc ccactccagc agctccacga ggtactcgaa 1260 gtgcccatgt ccggccatcc ccagcatggc acagctgtca cctgggagca gcgggggtcc 1320 ggcaggcatc gccggcaccc acagcctggg ctgggctgag gatgggcttg gtgggcagct 1380 gggtgctgcc gtggcagctg agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc 1440 acggctcggg acccgtggtg ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc 1500 cagagcaggg tgcatgatgt gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca 1560 ccacccggtc tgatgaaatt ccaggttttg tttaagatga aaatgcatgt gggcatacat 1620 ttgcacatga gaacacctgc taatgaaaca cacagagttg tatgtgcagt ctccctggct 1680 ggtggcatgt ctgtgggggc agttaggcag gaagaaaagc tccaccatct gtttctgtgt 1740 cccgggcttg gtgctgccac tagagatggg atgcacacag catgcctgcg tgctgccgag 1800 gcagctcagt acctgctgct gggggagagc agccctcagg gagctgctgc aaagaccccg 1860 tgggatggct ggtgaacagt gctggagaca tggcagatgt cgcacccctg ctccacacca 1920 ccctccgctg cagctgcctg cacgatgcca tttcagcgtg ccacggcttg tttcttcctc 1980 ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 2040 cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 2100 atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 2160 ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 2220 tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 2280 gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 2340 atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 2400 ttcccacact gcttttctgc aaatggatta ggagtaaaga gtcagataca caggggacca 2460 tcactcactt cctaggccat gcttcgtagt ttaactccat gcaaggtatt ttcttgctct 2520 gatctaactc tagatcacta aatggcactt gtgcaggaca cttttccact gtcattttgg 2580 ggggtagaag tgtggtcaga gccagggagg cttgcagggc ccacaccagc tgtggcccaa 2640 gcagctgctg tacaatggct gtatggcagt atcgatgtga acttcctgat aataaacaga 2700 actcagcagc aaataaaccc agattgttct gatcagtaac gagaggctgt gcaaaaagct 2760 gagaaatgta cagcccttcc tgctcaccac tacagccctt catgcagcgg cctgctgcac 2820 tagggcctgc ttggccagag gcagggctgc agcttgagat acgcagcacc cagtacccca 2880 gcaggctgcc atgtgcttct gtcaggccat gaattgcaca agttggtata gttttataca 2940 gtgtcatgca gaagcacaac tcttaccttg gcacactgat atggaaagca aagtgtaaag 3000 gaactgtatg tttcttggct tgtgagttcc attggttctc ccaggacagc agtgacagct 3060 ctagattttc tggttgatct cttccatcta agtttttact tctgaataca tctgtgcagc 3120 aaagcctgat gctttttttt ttccccctcc cctgggatcg tgaaatatta ttttcccatc 3180 tccataatac agatgatcca ctcaaacatg catcctcagt cgcagtcctc agaagggcct 3240 tttcccacca tacacctaca cgctacacca gactttattg gtcaccatgc cttgagggat 3300 tctgcctaac acaggcacac aggaagggct gataccagta attcattgct gaggagagaa 3360 ggggcacttc ttttatagta gagccacaga atcaccagga ttggaaaaca cctccaagat 3420 catccaatcc aaccacccac ctaccaccag tatttcccac taaaccatgc cccttggtac 3480 cacatctaaa agcatcttct gcaccttcac agcttcattg cctttctcag gacgtgctcc 3540 agggccttgg tgtctttctt gtattgagtg gcccaaaatt gaacacaata ctcgaggtgc 3600 agcttcacca aagctgagtg cagaggggtg atcacctcta ctaggccttg ttttacccct 3660 tccccctgca tacctagttt aaagcccttt cagcgagccc taccagctcc tgggctagga 3720 tccatttccc cctttaagag aggtgaaacc cacccgcagg catcaggcca ggcactgagt 3780 taaactgctc catcagctaa ccaccccaat gccctgatgt cccttctgat agtcctcagg 3840 cttctctcag cgacttcatc actgccagcc tgagctatcc gtaatggata acaaccagag 3900 ggctgaacca gactagggag tctcctggta atgtccctaa gtaatgaatt catgggggaa 3960 atggatctgt gcagatgcac tgccatctca cagggctcaa ctgtcacaga cagttgtcac 4020 aaaccagagc agcagagaga gcagcaaagg agatatcata aatagtggaa aagggtgcca 4080 gtgtttgtta ttgactgctt cactgtgtgt ttggaaatca caaagaaaac aacaaaaaaa 4140 ccccacagaa tacacatttc caagcatgca tgcttcaggt aaggactgcg gcccgcttta 4200 attcccctgg aagcgtccag aggcctacac acaaatcagg ccacaacaaa caggttccgt 4260 gcaagcagtt tgtgagttgt atgaaaatag ctttcttcca taaagcgtgg cattgatggg 4320 aactgttact agcagatgaa aatctgccat gcacgacacc cttaatggtt ggagtggttc 4380 gactgagttt tgcattcctc attctgatgg atgctggcaa aaccaagatc acccaacacg 4440 taacactgaa tatagctcac caacagcaac gagccacacc agatactgag gcatctccaa 4500 ggctacgtct ggtggaaaga agagacagtc tcaccctgca gtgcaaaagc atcagggctt 4560 ctgcgtaagg tttattgatc ccaaagatag gcaagttaat attcatcagt ttaatagaca 4620 ggtactcaca ttactggaga tggcatgcca ggagagcctc tgccaagtgc tcactgccag 4680 tggcagccgg ccagtgcaca gcttcttggt gctgtggcca tctatataac agaaggaagc 4740 aattaagcat cacctatcaa gataagcaag atcattcaaa gagaataagg gtacttggtt 4800 agagctgcag agcacttcct cacgaatgag tttcttccag ctacatgcag atgttacagg 4860 cagtttgctt gtgttctagg gataacacaa acccctcctc atgggctagc tgcctgctca 4920 ggctgtggtc tgtatttttg cacgtgcact gctagccttt acttcacatt tccctttact 4980 <210> 20 <211> 681 <212> DNA <213> Artificial Sequence <220> <223> pDsRed1 <400> 20 atggtgcgct cctccaagaa cgtcatcaag gagttcatgc gcttcaaggt gcgcatggag 60 ggcaccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120 ggccacaaca ccgtgaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180 atcctgtccc cccagttcca gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc 240 cccgactaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300 gaggacggcg gcgtggtgac cgtgacccag gactcctccc tgcaggacgg ctgcttcatc 360 tacaaggtga agttcatcgg cgtgaacttc ccctccgacg gccccgtaat gcagaagaag 420 accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480 gagatccaca aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagtcc 540 atctacatgg ccaagaagcc cgtgcagctg cccggctact actacgtgga ctccaagctg 600 gacatcacct cccacaacga ggactacacc atcgtggagc agtacgagcg caccgagggc 660 cgccaccacc tgttcctgta g 681 <210> 21 <211> 226 <212> PRT <213> Artificial Sequence <220> <223> pDsRed1 <400> 21 Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys 1 5 10 15 Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly 20 25 30 Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys 35 40 45 Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro 50 55 60 Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile 65 70 75 80 Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg 85 90 95 Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser 100 105 110 Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val 115 120 125 Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp 130 135 140 Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly 145 150 155 160 Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val 165 170 175 Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly 180 185 190 Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp 195 200 205 Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu 210 215 220 Phe Leu 225 <210> 22 <211> 876 <212> DNA <213> Discosoma sp <220> <221> misc_feature <222> (1)..(876) <223> red fluorescent protein (FP593) GenBank: AF272711.1 <400> 22 agtttcagcc agtgacaggg tgagctgcca ggtattctaa caagatgagt tgttccaaga 60 atgtgatcaa ggagttcatg aggttcaagg ttcgtatgga aggaacggtc aatgggcacg 120 agtttgaaat aaaaggcgaa ggtgaaggga ggccttacga aggtcactgt tccgtaaagc 180 ttatggtaac caagggtgga cctttgccat ttgcttttga tattttgtca ccacaatttc 240 agtatggaag caaggtatat gtcaaacacc ctgccgacat accagactat aaaaagctgt 300 catttcctga gggatttaaa tgggaaaggg tcatgaactt tgaagacggt ggcgtggtta 360 ctgtatccca agattccagt ttgaaagacg gctgtttcat ctacgaggtc aagttcattg 420 gggtgaactt tccttctgat ggacctgtta tgcagaggag gacacggggc tgggaagcca 480 gctctgagcg tttgtatcct cgtgatgggg tgctgaaagg agacatccat atggctctga 540 ggctggaagg aggcggccat tacctcgttg aattcaaaag tatttacatg gtaaagaagc 600 cttcagtgca gttgccaggc tactattatg ttgactccaa actggatatg acgagccaca 660 acgaagatta cacagtcgtt gagcagtatg aaaaaaccca gggacgccac catccgttca 720 ttaagcctct gcagtgaact cggctcagtc atggattagc ggtaatggcc acaaaaggca 780 cgatgatcgt tttttaggaa tgcagccaaa aattgaaggt tatgacagta gaaatacaag 840 caacaggctt tgcttattaa acatgtaatt gaaaac 876 <210> 23 <211> 230 <212> PRT <213> Discosoma sp <220> <221> MISC_FEATURE <222> (1)..(230) <223> red fluorescent protein D. GenBank: AAG16224.1 <400> 23 Met Ser Cys Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys Val 1 5 10 15 Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Lys Gly Glu 20 25 30 Gly Glu Gly Arg Pro Tyr Glu Gly His Cys Ser Val Lys Leu Met Val 35 40 45 Thr Lys Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ser Pro Gln 50 55 60 Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro 65 70 75 80 Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val 85 90 95 Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Ser Ser 100 105 110 Leu Lys Asp Gly Cys Phe Ile Tyr Glu Val Lys Phe Ile Gly Val Asn 115 120 125 Phe Pro Ser Asp Gly Pro Val Met Gln Arg Arg Thr Arg Gly Trp Glu 130 135 140 Ala Ser Ser Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Asp 145 150 155 160 Ile His Met Ala Leu Arg Leu Glu Gly Gly Gly His Tyr Leu Val Glu 165 170 175 Phe Lys Ser Ile Tyr Met Val Lys Lys Pro Ser Val Gln Leu Pro Gly 180 185 190 Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Met Thr Ser His Asn Glu Asp 195 200 205 Tyr Thr Val Val Glu Gln Tyr Glu Lys Thr Gln Gly Arg His His Pro 210 215 220 Phe Ile Lys Pro Leu Gln 225 230 <210> 24 <211> 4107 <212> DNA <213> Streptococcus pyogenes <220> <221> misc_feature <222> (1)..(4107) <223> M1 GAS Cas9 protein id: AAK33936.1 <400> 24 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600 attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720 ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960 atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160 catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220 gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280 attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340 atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400 gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460 gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520 attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580 gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640 aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700 acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760 ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820 actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880 aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940 taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000 tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060 atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120 aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180 cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240 gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300 cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360 gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420 tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480 aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540 tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600 tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660 caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720 cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780 cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840 attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900 ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960 cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020 gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080 gatttgagtc agctaggagg tgactga 4107 <210> 25 <211> 1368 <212> PRT <213> Streptococcus pyogenes <220> <221> MISC_FEATURE <222> (1)..(1368) <223> M1 GAS Cas9 protein id: AAK33936.1 <400> 25 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA7 for Z chromosome locus chrZ_42174515_-1 <400> 26 gtaatacaga gctaaaccag 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA8 for Z chromosome locus chrZ_9157091_1 <400> 27 acagacctat gatatgtgag 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA9 for Z chromosome locus chrZ_27767602_-1 <400> 28 gagcttgtga gtgataatcg 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA10 for Z chromosome locus chrZ_78779927_1 <400> 29 gtaaagagtc agatacacag 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA11 for Z chromosome locus chrZ_63364946_-1 <400> 30 cagtgggtac tgaagctgtg 20 <210> 31 <211> 1012 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA7 integration to Chromosome Z ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_ -1 <400> 31 gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60 caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120 aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180 atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240 ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300 gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360 tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420 caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480 tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540 ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600 caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660 taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720 ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780 agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840 gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900 gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960 gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct ca 1012 <210> 32 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA7 integration to Chromosome Z ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_ -1 <400> 32 gtcatgtcgg tggaggagaa agtggctgta gaaaaggtaa cggacaagaa atccctcact 60 ggcttagctg taaaggtcag aggaaaatca tcttctgttc tccatacaca tctcctgtaa 120 ttaggcacct gtgcccttta aaaaagtaaa gtaatcaaag agtcatttgg tgaaaataga 180 agccaaacag ttacaaaatt tagttaatat tcaaagacaa aacaactctg gttccaaata 240 taaaaccctt tgtgtaaaca ctgcgggaag gtgccaaaga gccacctaca caaagagatg 300 ccacagagta atttgcgtac cccaacaata ggatcatata tgggcaaacc aaaagaccaa 360 caaagacccc ttgcaataat cccttgattg gcagaagcaa gtgcagcgtt agatttagta 420 tgtgtgacaa ttctgagaat aggaaggaat ttcactgaaa ctgtgtgaag atttgtatgt 480 taaatacata taatgagggt tatttagctc tggggtgtgc atgctatgtg gagagatccc 540 catgtgccca gcactgcaat agactaatgt cagcttttta aaccatcatt tggtttgaag 600 agtttattat gattttcaga aacagaatta tgtattcagt gtctgtacat tcttacaagc 660 ctgctgttct gtacacatga aaaagctact tatggtgcaa atcagtatag agaagcagtt 720 ttgacataca gtggtcatga ctgggtgatc tgctgtcaga aggtaagaca ctggtataca 780 gaattgcaaa cgtgagatga agacctcaag tgcaactctg tcatcatacc acttctcttg 840 ctattatcta ttcagtgttt gttctaaata ttcaggcaga aggcttggtt tcacatcagg 900 tgttacattt aagtattctt tgcccatttt ttgctgtttg tatgtgtaac ttcagattct 960 cacattgact gtgtagtgta aatttgcaaa tagatgtaac agcttctctt taacatccca 1020 tgc 1023 <210> 33 <211> 1014 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA8 integration to Chromosome Z ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ _9157091_1 <400> 33 ctctgcatgg tcacaacggc cccaacagcc tcccatcccg atgtcaccaa tcagttcact 60 attactggtg agcaaccagt ccagcactgc atccccctgg tggggctgtc tgttacgtgg 120 ctcaggaagt tatcctcagt gcattccagg tgctcctgga tcgcctgtag ctcaccgtgc 180 tacttttcca gcaggtgtca gggtggtaga agtcccccag caggacgaga gcctgcgatt 240 gtgacagctt ctgtagctgg agggagaatg cttcatcaac aggctccgct tgatcagtgt 300 ccctgtactg ataccacaag gcttcttttg ctgctcccat cttaactctc accccatcgt 360 ggtgttatac gtgcataaca tcatgcagtg cactaagagt taaagagtta atgctccagt 420 tccgtcgatt gtcaataatt ccaggtgtac ctttctcaga agagaagaac tacaaatccc 480 ttaagatctt actgttccat tttcattctc cattcagaag gaaaggtaaa actgcagtgt 540 gtgctcccta gcattagagt aatttctccc ttagctcgtt gccaccattt tgtttttagg 600 cccacctcct taccttttcc ctacacccct cctgtgtctc tgagacgtgg gtccatgggt 660 ccctcaacca tagtagacac aaactcagat caaaccaagc cagagctttg acaaccccta 720 agctttcagc ttactcaggg ttgctctgca gggactgctc ttcacactct attccttcct 780 tgatatagag ggcaatgtct cctctcctcc ttccttacct gtccctcctc atctgcctgt 840 tgctgtcagt ggccacactt cagccatggg aatcatccca ccctgctttt gtgaaggaaa 900 ctacattatg gttctcaggt agcacagtgg cttccatcac ctcctgtttg cttcccaagc 960 tgtgtgtgtt ggtgtagagg cacttcagct gggcagctga agaactggac gcac 1014 <210> 34 <211> 1032 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA8 integration to Chromosome Z ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ _9157091_1 <400> 34 cacctttcca cctcctgcta aagcacattc cctacagtat gtttcacatg acaccgtgct 60 ggcagatttt taatatcatc agagaatgac actccatatc ctctctgggc agcctttttc 120 agtgctctgt cacccacaaa gtaaagtatt tgctcatgtt ctaatggaac ttcctatgtt 180 ctagtttgtg accattgaac cttgttctgt cactggacag tgctgaagga gcctggccct 240 atccacttga ctcccacact ttacatattt acaagcatcg ataagacccc cctcagtctt 300 ctccagacta gatagcccca ggtctcccaa ccattccttt tatgggagat gcttcaggcc 360 cctcatcacc tctgtggccc tctgctggac tgcctgcagt agttccaggt tttttttttt 420 gaactgggga gcccagaact tgacacggta ttccagatgt ggcctcacca gcgcagagga 480 gaggggaagg ctcacctccc tcgacctggt ggccatgttt tttttaacag acctcaggat 540 accactggcc ttcttggccc aagggcacac tgctggctca tggcccatgg gttggcttcc 600 aggactctca ggtccttctc cgtagagctc ctctcaagca ggacaaccct cagcctgtac 660 tgatgtgtgc ggtgcggtta ttcctcccca cgtgcaagac tctacatctg ccattgttaa 720 atctcataag cttcctctct gcccaactct ccactgtgta cgggccttag tgaatggcag 780 cacagacttc tggtgtgagg atagcattca gaacaagctg ctgtaccttc ccagtcacag 840 aggtgagggt gactggcttg tactttccca gctttgcctt cttgcccttt tggaagactg 900 gagcgacatt ggccttctgg aggaaacggt cctcaggcac ccctcctgtt ctccatgacc 960 tttgaaagat gatcgagagc accttggcag tcacttctgc cagctccttc agcacgcatg 1020 agtgcatccc gc 1032 <210> 35 <211> 1025 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA9 integration to Chromosome Z RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1 <400> 35 gcagtacgta cgtttgtgaa cagctgtttt caagggtgat gcacaggaag agtaaaattt 60 cattaaaaaa tctccaagga gcacatggag agctcactca gaagcctcac cgctgccact 120 gaacaagact gatgcattag tttcatgaaa tcaaggctat gtgtcccact ggtttcatta 180 ttttgttact ctttctttaa aacaaaaaaa ttgttttatt gcttatatac atcaactatg 240 ttgttatata ttttccaaag gccgctccaa aagtaatgcc tcctgtttca ttctgttggc 300 ccaccgtgtc agaggcagat ggtggtacgg cagtagagat ggaaccttcc caccaatatt 360 ccattacatg ttgccatgtg atagacagca gcagatgggc actctgacag aatggtatct 420 gacatggaag cgtggatgga gcaaagttgt gtcactgaat tcctccataa ggaaatgagc 480 acccactaac attcactgat gcttgctgaa catttctgga gaccaaacag tggatgtgag 540 cacagtgagg tggtgggtgg tgcatttcag cagtggtgac aatgacgttg ggtcacctct 600 gctggtgcag gttttgatga gtgcagcctg tgaggtcttg ttcatcaatg gagaaaatgc 660 acaactaatg gtggtgactg ctgaaaaata gtgttttgta gctgagaatt ttctctgtca 720 aacagtgcta attgtgctct ttgtatctgt tgtagtttcc atgggaataa ataggaggca 780 ttacttgcag actgacctac atatatgtgg ccccaggcaa gtcaacagct gtacgaaaag 840 tccatgcttc ctcattataa acggaggaaa aaaagttgtt tacagctgta atgggattat 900 aaaaggcaaa tggggatagt acagtggtga gaaccagatc tatgaaggaa aagccctaag 960 aaaaagagag tgcacagata ctcttaacca tctaataact gtttcctcca tcctacagct 1020 cagag 1025 <210> 36 <211> 1040 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA9 integration to Chromosome Z RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1 <400> 36 tggcttccaa ttcctcctgt ttatcaccca cgttgcatcc attgatgtag aggcacttca 60 gtcgggctat cagcaatgtt accacctgtg aggagccctc ttgagatctt ttaggacaat 120 ttagaggttt tccccactgt ttcctaaaat tacagcattc cctgtccctt cttagtgata 180 tagaactcca tccccttcca ccatcaaacc tagcttaagc tctggtaaat gatccagcca 240 gtctgcttcc caaaactctt gctcagttgc attctatctg atgcctacat gcccaacacc 300 ttcaaggcct gtccaagatc atagaacaca aaggcttgat catgacaaca tccatgcagc 360 caatcattca catgacccat tcctctcctc ctttccaggt cccaacggcc aactgagagt 420 tgtgctctga gctcttcagt gtccttccga gggatgtaaa gtccctttta atgttctgca 480 ttttctttgt cacagccttc tgagacccaa cttgaatgtg gaggagtgga gagtaatcat 540 cccgctctga ttatcagata cattagcctc ttcttggcac ctctggcaga cagaagactt 600 ccctggagag attacctgga tgataactgg gggcctcagt gcctcacagc agcaagtccc 660 cagttactaa gactctacac ctctttggtg gcgctagttc tgatgtagtt cttcagttgc 720 ttaacatgct tgttgtttcc caagatttga ctgctatctg caccctccct ttcttccagc 780 cccagagcct tatatcatga gctgagaaca ttctgtgttc aaaatacaag acacatttat 840 gcaatttcgt attctctacc catatttttg tgatagaaat tagggctact tatttcccat 900 agtgatttcc atgctgccta ccaggttcta agtcaggtca ccctgccagc ttcttccaaa 960 ccatgctcag gagtgcatca aatcacacgc agacccaagg aaaaaatgta ccaaacaata 1020 ttaccacgca tgcaaactcc 1040 <210> 37 <211> 1024 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA10 integration to Chromosome Z TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927 _1Chromosome Z <400> 37 ctaccttgcc ccactccagc agctccacga ggtactcgaa gtgcccatgt ccggccatcc 60 ccagcatggc acagctgtca cctgggagca gcgggggtcc ggcaggcatc gccggcaccc 120 acagcctggg ctgggctgag gatgggcttg gtgggcagct gggtgctgcc gtggcagctg 180 agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc acggctcggg acccgtggtg 240 ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc cagagcaggg tgcatgatgt 300 gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca ccacccggtc tgatgaaatt 360 ccaggttttg tttaagatga aaatgcatgt gggcatacat ttgcacatga gaacacctgc 420 taatgaaaca cacagagttg tatgtgcagt ctccctggct ggtggcatgt ctgtgggggc 480 agttaggcag gaagaaaagc tccaccatct gtttctgtgt cccgggcttg gtgctgccac 540 tagagatggg atgcacacag catgcctgcg tgctgccgag gcagctcagt acctgctgct 600 gggggagagc agccctcagg gagctgctgc aaagaccccg tgggatggct ggtgaacagt 660 gctggagaca tggcagatgt cgcacccctg ctccacacca ccctccgctg cagctgcctg 720 cacgatgcca tttcagcgtg ccacggcttg tttcttcctc ttgcagtctc aggttgccgc 780 agcagcagct gcctgaggtc tggtggcaaa gggcagagca cccagcccac tgctctccat 840 gagtgagcgg gtagggggca cgccgtgctt cgcttctggt atcgggtggc ctgtggagca 900 catcacccct ggacagtgaa aacatgtcaa agggtgtttt ataacagtat agcatatccc 960 tttgaggctg aatttcctga gcttatggat atggtagtaa tgctatacca ggctctctct 1020 gcag 1024 <210> 38 <211> 1022 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA10 integration to Chromosome Z TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927 _1Chromosome Z <400> 38 cagctgctgt acaatggctg tatggcagta tcgatgtgaa cttcctgata ataaacagaa 60 ctcagcagca aataaaccca gattgttctg atcagtaacg agaggctgtg caaaaagctg 120 agaaatgtac agcccttcct gctcaccact acagcccttc atgcagcggc ctgctgcact 180 agggcctgct tggccagagg cagggctgca gcttgagata cgcagcaccc agtaccccag 240 caggctgcca tgtgcttctg tcaggccatg aattgcacaa gttggtatag ttttatacag 300 tgtcatgcag aagcacaact cttaccttgg cacactgata tggaaagcaa agtgtaaagg 360 aactgtatgt ttcttggctt gtgagttcca ttggttctcc caggacagca gtgacagctc 420 tagattttct ggttgatctc ttccatctaa gtttttactt ctgaatacat ctgtgcagca 480 aagcctgatg cttttttttt tccccctccc ctgggatcgt gaaatattat tttcccatct 540 ccataataca gatgatccac tcaaacatgc atcctcagtc gcagtcctca gaagggcctt 600 ttcccaccat acacctacac gctacaccag actttattgg tcaccatgcc ttgagggatt 660 ctgcctaaca caggcacaca ggaagggctg ataccagtaa ttcattgctg aggagagaag 720 gggcacttct tttatagtag agccacagaa tcaccaggat tggaaaacac ctccaagatc 780 atccaatcca accacccacc taccaccagt atttcccact aaaccatgcc ccttggtacc 840 acatctaaaa gcatcttctg caccttcaca gcttcattgc ctttctcagg acgtgctcca 900 gggccttggt gtctttcttg tattgagtgg cccaaaattg aacacaatac tcgaggtgca 960 gcttcaccaa agctgagtgc agaggggtga tcacctctac taggccttgt tttacccctt 1020 cc 1022 <210> 39 <211> 1003 <212> DNA <213> Artificial Sequence <220> <223> Left arm for gRNA11 integration to Chromosome Z RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_- 1 <400> 39 gggttgaaac tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg 60 aagactctgt aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca 120 ccacattttt actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg 180 ttaactgctg gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt 240 cacccaaaat tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt 300 acagcctcac atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg 360 tatattatgc actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt 420 aagcccagaa atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga 480 cacagatgtg ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa 540 tctctgaaat ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat 600 agaattggtt gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag 660 gtaaacaggt gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt 720 gtttgttgtt tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca 780 ttagcagacc agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt 840 tctgtggaag aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac 900 aaataatgtt atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag 960 caaactgagt cttatcgttc ctactgtgct ttgcttttct tgc 1003 <210> 40 <211> 1003 <212> DNA <213> Artificial Sequence <220> <223> Right arm for gRNA11 integration to Chromosome Z RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_- 1 <400> 40 cagaaacacc agagcttacg gtgtgaattc attgcacatc ttattagatc aacaaaatgg 60 aataaaagaa tacagaagat tactactcca ttgggcatgt ggacgtttta caggcctgga 120 taaattagat cttaaaaaca aacaaacaaa caaacaaaaa aactccttgc aaagataatg 180 ttatgtaata ttagttgcaa gaagtaagca aacacacaga actgggagca gaagcaaagc 240 actaagttat taaagcaagt tgcacatttt gagttgcatt ttgccactgg ttttataaac 300 atgtttagca tgtctggtca gaatttgggc accaggatgc ttttaagatg tctgtctatg 360 gaacctgtca gtgctcaaga ataacttctg ttatttggat gctgcaccaa agaattcaga 420 ggaagacgag ccaagccaga cgttatcata gtcactagta aagtggttct aagcctaatt 480 aagacatgtc agaactatgt gttgtgcaac caaatcctcc aaaagagaaa tcagaggtga 540 acttgtgcaa taaatataga agacacgtaa atcctgaggc agttagctaa ccatatgaag 600 ccaatcatac ctgactgctg gacgcaggag actgaacctt acagaccctg gagaatcact 660 gtttggccta gttaggcctg aatggaattt accaagattc atgactttaa catggatcag 720 gtgcaaagaa aagaaggctc agttagttcc tacaggctac cagatctttt tccacctctg 780 ctcagcctgg agctgtgggc tctacctgcc cctgaagtga agtggcatca actgcaacac 840 tttttgcaga ggcaaaaatc atcaagtcgt gcctctgcat tttaaggtga tggattccaa 900 gagatagatt ccaaacccaa cactgagatt cctctggtga tgcagatgac tgcttactgg 960 gatccttctc tctctatagc ctaatcccat gcagcaccaa aag 1003 <210> 41 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA3, Z chromosome, "Left arm" <400> 41 cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60 gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120 ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180 caatgtgggc attgccgacc 200 <210> 42 <211> 258 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA3, Z chromosome, "Right arm" <400> 42 tggtgagtgg ggccaggaga gcaggacagg agtgtggact cggaggcgcg ggcagaggag 60 gtagctcaga gcatgagata tattcgccag gtgtcagtgg acttctggca gtgcatactg 120 cagagagctt tggttgctgg ccatctggat gatgacaaaa tctcagccac agaccatgtg 180 ggttggaaga gtcctcagga gatcaccttt ccacctcctg ctaaagcaca ttccctacag 240 tatgtttcac atgacacc 258 <210> 43 <211> 436 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA4, Z chromosome, "Left arm" <400> 43 tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 60 acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 120 atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 180 tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 240 gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 300 gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 360 tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 420 ccaccagact ggtccc 436 <210> 44 <211> 521 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA4, Z chromosome, "Right arm" <400> 44 tcaaaccgat tgtggctgtt tctcagaggc aactctttgc gctctagccc ctctataaca 60 tggggcaact tcccctgccc caccttccct tcctgtatct tctgaaaagc ttgtagccct 120 caattgtcac gctccagcca tatgaatcat cccaccacgt ccctgtgttc acaattacct 180 tctagtcttc taattgcacc atggcttcca attcctcctg tttatcaccc acgttgcatc 240 cattgatgta gaggcacttc agtcgggcta tcagcaatgt taccacctgt gaggagccct 300 cttgagatct tttaggacaa tttagaggtt ttccccactg tttcctaaaa ttacagcatt 360 ccctgtccct tcttagtgat atagaactcc atccccttcc accatcaaac ctagcttaag 420 ctctggtaaa tgatccagcc agtctgcttc ccaaaactct tgctcagttg cattctatct 480 gatgcctaca tgcccaacac cttcaaggcc tgtccaagat c 521 <210> 45 <211> 505 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA5, Z chromosome, "Left arm" <400> 45 gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 60 gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 120 aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 180 gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 240 acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 300 agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 360 atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 420 ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 480 ggcatggcat ggtcagtgac accca 505 <210> 46 <211> 599 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA5, Z chromosome, "Right arm" <400> 46 ctgccagagc agagggctgc tgaaacgccg agtgccaact gacactgttc agctgacagc 60 ctcacgagag tgctgcgagg gttaagtgag gcaacaaaat acaagtactc aaaaatagaa 120 tggaatggaa tggaataaca gagggaatgg ggaacaggct gcagtgagaa ggaaaccccc 180 gtgcaccgac caacccgctc ccagtagcct ggtccctacc ttgccccact ccagcagctc 240 cacgaggtac tcgaagtgcc catgtccggc catccccagc atggcacagc tgtcacctgg 300 gagcagcggg ggtccggcag gcatcgccgg cacccacagc ctgggctggg ctgaggatgg 360 gcttggtggg cagctgggtg ctgccgtggc agctgagtgc cgtcgtgcag gtgggctcgg 420 tgctctctgc agcccacggc tcgggacccg tggtgggcat actgctgggc aaggggacgg 480 ctcggatgtg catcccagag cagggtgcat gatgtgtgcg cagcggcaca cagcagcgca 540 cttgtccccg aggcaccacc cggtctgatg aaattccagg ttttgtttaa gatgaaaat 599 <210> 47 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA6, Z chromosome, "Left arm" <400> 47 ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 60 cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 120 atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 180 ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 240 tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 300 gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 360 atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 420 ttcccacact gcttttctgc aaatggatta gga 453 <210> 48 <211> 439 <212> DNA <213> Artificial Sequence <220> <223> For cloning using the gRNA6, Z chromosome, "Right arm" <400> 48 gggaccatca ctcacttcct aggccatgct tcgtagttta actccatgca aggtattttc 60 ttgctctgat ctaactctag atcactaaat ggcacttgtg caggacactt ttccactgtc 120 attttggggg gtagaagtgt ggtcagagcc agggaggctt gcagggccca caccagctgt 180 ggcccaagca gctgctgtac aatggctgta tggcagtatc gatgtgaact tcctgataat 240 aaacagaact cagcagcaaa taaacccaga ttgttctgat cagtaacgag aggctgtgca 300 aaaagctgag aaatgtacag cccttcctgc tcaccactac agcccttcat gcagcggcct 360 gctgcactag ggcctgcttg gccagaggca gggctgcagc ttgagatacg cagcacccag 420 taccccagca ggctgccat 439 <210> 49 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> LEFT PRIMER <400> 49 ttggtgtgtg ctaataggca gt 22 <210> 50 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> RIGHT PRIMER <400> 50 tagtcctcgt tgtgggaggt 20 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> LEFT PRIMER <400> 51 gcattgatct gtccagttgc 20 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> RIGHT PRIMER <400> 52 tactgccaaa accgcatcac 20 <210> 53 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> ChZgRNA_FORWARD PRIMER <400> 53 tgtatgagac cacgtaatac agagctaaac cag 33 <210> 54 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> ChZgRNA_Reverse PRIMER <400> 54 aaacctggtt tagctctgta ttacgtggtc tca 33 <210> 55 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer Forward for cloning of the 'Left arm' of gRNA 7 <400> 55 acggggtcat tagttcatag cccatatatg gtgaacggat aggcagcaag c 51 <210> 56 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer Reverse for cloning of the 'Left arm' of gRNA 7 <400> 56 ggcgggccat ttaccgtaag ttatgtaacg tgaggaaggg tctgttactg ga 52 <210> 57 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer Forward for cloning of the 'Right arm' of gRNA 7 <400> 57 ttctatcgcc ttcttgacga gttcttctga gtcatgtcgg tggaggagaa a 51 <210> 58 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer Reverse for cloning of the 'Right arm' of gRNA 7 <400> 58 gtgatggcag gttgggcgtc gcttggtcgg gcatgggatg ttaaagagaa gct 53 <210> 59 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Repetition of 16 nucleotides <400> 59 cggtaaatgg cccgcc 16 <210> 60 <211> 261 <212> DNA <213> Artificial Sequence <220> <223> Flanking left arm of Z chromosome <400> 60 tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60 gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120 ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180 aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240 agtacacctt tcattacaac a 261 <210> 61 <211> 245 <212> DNA <213> Artificial Sequence <220> <223> Flanking right arm of Z chromosome <400> 61 caaactttta atcactttca atcaatgttg gaaatctgca gtacataaat tttattttga 60 ttcattattc agagaatcag agaaataagg acttttttag aggtttatgt ttattttaga 120 aaatataaat aaatcttgta tacatagatt tccaactagt aaaattttta gctatcgctg 180 tagcatttct atgaggagtt ttacttttta ctgtctctta tgaaacttag tggaaacaaa 240 gctag 245 <210> 62 <211> 1014 <212> DNA <213> Artificial Sequence <220> <223> Left arm of Z chromosome <400> 62 gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60 caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120 aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180 atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240 ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300 gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360 tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420 caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480 tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540 ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600 caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660 taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720 ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780 agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840 gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900 gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960 gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct cagt 1014 <210> 63 <211> 629 <212> DNA <213> Artificial Sequence <220> <223> CMV Enhancer <400> 63 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 60 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 120 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 180 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 240 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 300 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 360 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 420 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 480 gtaggcgtgt acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatcc 540 gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 600 gcgggcccgg gatccaccgg tcgccacca 629 <210> 64 <211> 714 <212> DNA <213> Artificial Sequence <220> <223> dsRED2 reporter gene <400> 64 tggcctcctc cgagaacgtc atcaccgagt tcatgcgctt caaggtgcgc atggagggca 60 ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggcc 120 acaacaccgt gaagctgaag gtgaccaagg gcggccccct gcccttcgcc tgggacatcc 180 tgtcccccca gttccagtac ggctccaagg tgtacgtgaa gcaccccgcc gacatccccg 240 actacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg 300 acggcggcgt ggcgaccgtg acccaggact cctccctgca ggacggctgc ttcatctaca 360 aggtgaagtt catcggcgtg aacttcccct ccgacggccc cgtgatgcag aagaagacca 420 tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg aagggcgaga 480 cccacaaggc cctgaagctg aaggacggcg gccactacct ggtggagttc aagtccatct 540 acatggccaa gaagcccgtg cagctgcccg gctactacta cgtggacgcc aagctggaca 600 tcacctccca caacgaggac tacaccatcg tggagcagta cgagcgcacc gagggccgcc 660 accacctgtt cctgtagcgg ccgcgactct agatcataat cagccatacc acat 714 <210> 65 <211> 1026 <212> DNA <213> Artificial Sequence <220> <223> Right arm of Z chromosome <400> 65 gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60 ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120 aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180 gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240 tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300 tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360 aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420 tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480 gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540 cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600 agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660 gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720 ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780 cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840 tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900 ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960 ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020 catgca 1026 <210> 66 <211> 2618 <212> DNA <213> Artificial Sequence <220> <223> Right arm of Z chromosome of Figure 15 <400> 66 tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60 gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120 ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180 aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240 agtacacctt tcattacaac agtgaacgga taggcagcaa gcattcagaa caatgaaaaa 300 gatctgcgtt ctattgtaaa gcaaacaaag gtgatgacgg aacgtttatt tgagatacag 360 gcaccatagt acaagatatc aaagaggaat taattcaacc ctcccaacaa cagttgggaa 420 aaaaaaagga taagctgagg aatgcagcct tctccgattt ttactctggt gccggaagga 480 ggaggaggag cgggggaaaa cccagcggac tcagactgca tacgcactct cggaagtacc 540 tctgaggcgg ggtgagagga agggtggatc taggctcccc ccgctccaca cactcacgtg 600 ctcgtgtact ggttcaggct gtgacttggc aactcctcta catctatcca tctagttaga 660 ctcaacaaga ccatcgtgat tcaggagtct gaagatgctt aactctctca gaacgtctag 720 ttctcctggc ctggtaaatg ctatgtttct catactgcct ctctgaagaa tgcttcgaat 780 gcttctagtg atgctctaaa gttctaaaca gaaaaatctg gagacagttc tggtctttag 840 atagaaaaaa tgccaacatg ccaaaggatg gttacatcct tcaagcaacc ttgttgcatg 900 ctgtacaata gactcatgta ataacttagc cgtagtcatc gtatctctta tttacctgtt 960 cgttattaca ttttcctggt actgctttat atttagtcag ttgtcctttt aagacaaatt 1020 ttttggtgtg tgctaatagg cagttaccaa atgttctaga gggagggaat ataatcagtg 1080 agtatgtaga tgtatataga tgtataacca gtaagtatac agagaagtta gggtggtctt 1140 ttgagagcat atagctggaa agattatcac atgggaaaag gtaatcagaa ataaatggaa 1200 aaatgctcac cagtgtcata ggctcacaag aaaactcccc aaggagcaat ctccagtaac 1260 agacccttcc tcagttggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 1320 gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 1380 caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 1440 cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 1500 ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 1560 tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 1620 gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 1680 gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 1740 tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 1800 tgaaccgtca gatccgctag cgctaccgga ctcagatctc gagctcaagc ttcgaattct 1860 gcagtcgacg gtaccgcggg cccgggatcc accggtcgcc accatggcct cctccgagaa 1920 cgtcatcacc gagttcatgc gcttcaaggt gcgcatggag ggcaccgtga acggccacga 1980 gttcgagatc gagggcgagg gcgagggccg cccctacgag ggccacaaca ccgtgaagct 2040 gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc cccagttcca 2100 gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc cccgactaca agaagctgtc 2160 cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggcgac 2220 cgtgacccag gactcctccc tgcaggacgg ctgcttcatc tacaaggtga agttcatcgg 2280 cgtgaacttc ccctccgacg gccccgtgat gcagaagaag accatgggct gggaggcctc 2340 caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc gagacccaca aggccctgaa 2400 gctgaaggac ggcggccact acctggtgga gttcaagtcc atctacatgg ccaagaagcc 2460 cgtgcagctg cccggctact actacgtgga cgccaagctg gacatcacct cccacaacga 2520 ggactacacc atcgtggagc agtacgagcg caccgagggc cgccaccacc tgttcctgta 2580 gcggccgcga ctctagatca taatcagcca taccacat 2618 <210> 67 <211> 1271 <212> DNA <213> Artificial Sequence <220> <223> Left arm of Z chromosome of Figure 15 <400> 67 gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60 ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120 aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180 gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240 tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300 tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360 aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420 tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480 gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540 cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600 agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660 gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720 ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780 cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840 tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900 ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960 ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020 catgcacaaa cttttaatca ctttcaatca atgttggaaa tctgcagtac ataaatttta 1080 ttttgattca ttattcagag aatcagagaa ataaggactt ttttagaggt ttatgtttat 1140 tttagaaaat ataaataaat cttgtataca tagatttcca actagtaaaa tttttagcta 1200 tcgctgtagc atttctatga ggagttttac tttttactgt ctcttatgaa acttagtgga 1260 aacaaagcta g 1271

Claims

(a) 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자(reporter gene)를 포함하는 적어도 하나의 유전자이식 조류 대상체를 제공하는 단계;
(b) 상기 유전자이식 조류 대상체, 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계;
(c) 적어도 하나의 검출 가능한 신호가 검출되는지 상기 알에서 결정하는 단계로서, 여기서 상기 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 상기 수정된 부화되지 않은 알 내에 포함된 조류 배아에서 상기 W 염색체 또는 Z 염색체의 존재를 나타내는 단계를 포함하는, 조류의 수정된 부화되지 않은 알의 성 감별 방법.
제1항에 있어서, 상기 리포터 유전자가 적어도 하나의 형광 리포터 유전자인 방법.
제2항에 있어서, 상기 리포터 유전자가 적색 형광 단백질 (RFP)인 방법.
제2항 또는 제3항에 있어서, 검출 가능한 신호가 검출되는지 결정하는 단계가 상기 알을 광원에 적용하는 단계를 포함하는 방법.
제1항 내지 제4항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 대상체가 암컷 조류 대상체이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합됨으로써, 검출 가능한 신호의 검출이 상기 부화되지 않은 알에서 상기 배아가 수컷임을 나타내는 방법.
제1항 내지 제4항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 대상체가 암컷 조류 대상체이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합됨으로써, 검출 가능한 신호의 검출이 상기 부화되지 않은 알에서 상기 배아가 암컷임을 나타내는 방법.
제1항 내지 제6항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 프로그램 가능한 조작된 뉴클레아제 (PEN)를 사용하여 상기 유전자이식 조류 동물의 상기 성 염색체에 통합되는 방법.
제7항에 있어서, 상기 PEN이 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR) 타입 II 시스템인 방법.
제8항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 CRISPR/CRISPR-연관된 엔도뉴클레아제 9 (Cas9) 시스템에 의해 매개된 상동성 유도된 수선 (homology directed repair; HDR)에 의해 상기 유전자이식 조류 대상체의 상기 성 염색체에 통합되는 방법.
제9항에 있어서, 상기 적어도 하나의 리포터 유전자가, 상기 조류 대상체의 적어도 하나의 세포 또는 상기 조류 동물에 도입된 적어도 하나의 세포를
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서(protospacer)를 표적화하는 가이드 RNA (gRNA), 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 상기 유전자이식 조류 대상체의 성 염색체에 통합되는 방법.
제10항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암(homologous arm)이 측면에 있는 방법.
제10항 또는 제11항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자가 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결되는 방법.
제10항 내지 제12항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 상기 성 염색체의 적어도 하나의 비-암호화 영역(non-coding region)에 통합되는 방법.
제13항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 Z 염색체 유전자좌(locus) 42172748-42177748에서 적어도 하나의 부위에 통합되는 방법.
제10항 또는 제14항에 있어서, 상기 적어도 하나의 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하는 방법.
제15항에 있어서, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 핵산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 방법.
제13항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 W 염색체 유전자좌 1022859-1024215에서 적어도 하나의 부위에 통합되고, 여기서 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 방법.
성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 조류 유전자이식 대상체.
제18항에 있어서, 상기 리포터 유전자가 적어도 하나의 형광 리포터 유전자인 조류 유전자이식 대상체.
제19항에 있어서, 상기 리포터 유전자가 적색 형광 단백질 (RFP)인 조류 유전자이식 대상체.
제18항 내지 제20항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 동물이 암컷이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합되는 조류 유전자이식 대상체.
제18항 내지 제20항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 동물이 암컷이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합되는 조류 유전자이식 대상체.
제18항 내지 제20항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 PEN을 사용하여 상기 유전자이식 동물의 상기 성 염색체에 통합되는 조류 유전자이식 대상체.
제23항에 있어서, 상기 PEN이 CRISPR 타입 II 시스템인 조류 유전자이식 대상체.
제24항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 CRISPR/Cas9 시스템에 의해 매개된 HDR에 의해 상기 유전자이식 조류 대상체의 상기 성 염색체에 통합되는 조류 유전자이식 대상체.
제25항에 있어서, 상기 적어도 하나의 리포터 유전자가, 상기 조류 동물의 적어도 하나의 세포 또는 상기 조류 대상체에 도입된 적어도 하나의 세포를
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 상기 유전자이식 조류 대상체의 성 염색체에 통합되는 조류 유전자이식 대상체.
제26항에 있어서, 상기 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어 있는 조류 유전자이식 대상체.
제26항 또는 제27항에 있어서, 상기 제2 핵산 서열의 적어도 하나의 리포터 유전자가 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결되는 조류 유전자이식 대상체.
제26항 내지 제28항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 상기 성 염색체의 적어도 하나의 비-암호화 영역에 통합되는 조류 유전자이식 대상체.
제29항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 Z 염색체 유전자좌 42172748-42177748에서 적어도 하나의 부위에 통합되는 유전자이식 동물.
제26항 내지 제30항 중의 어느 한 항에 있어서, 상기 적어도 하나의 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하는 조류 유전자이식 대상체.
제31항에 있어서, 상기 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 조류 유전자이식 대상체.
제26항 내지 제29항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 W 염색체 유전자좌 1022859-1024215에서 적어도 하나의 부위에 통합되고, 여기서 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 조류 유전자이식 대상체.
성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포.
제34항에 있어서, 상기 세포가 조류 세포인 세포.
제35항에 있어서, 상기 조류 세포가 원시 생식 세포 (PGC)인 세포.
제34항 내지 제36항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가, 상기 세포를
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 상기 세포의 성 염색체에 통합되는 세포.
제37항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어 있는 세포.
제37항 또는 제38항에 있어서, 상기 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 세포.
제37항 또는 제38항에 있어서, 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 세포.
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열을 포함하는 키트(kit).
제41항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어 있는 키트.
제41항 또는 제42항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자가 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결되는 키트.
제41항 내지 제43항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 상기 성 염색체의 적어도 하나의 비-암호화 영역으로의 통합을 위해 조정되는 키트.
제44항에 있어서, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있고, 상기 적어도 하나의 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하는 키트.
제41항 내지 제43항 중의 어느 한 항에 있어서, 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 키트.
제41항 내지 제46항 중의 어느 한 항에 있어서, 상기 리포터 유전자가 적어도 하나의 형광 리포터 유전자인 키트.
제41항 내지 제47항 중의 어느 한 항에 있어서, 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 동물의 제조에 사용하기 위한 키트.