KR20210005661A - 변형된 아미노펩티다제 n(anpep) 유전자를 갖는 병원체-내성 동물 - Google Patents

변형된 아미노펩티다제 n(anpep) 유전자를 갖는 병원체-내성 동물 Download PDF

Info

Publication number
KR20210005661A
KR20210005661A KR1020207033628A KR20207033628A KR20210005661A KR 20210005661 A KR20210005661 A KR 20210005661A KR 1020207033628 A KR1020207033628 A KR 1020207033628A KR 20207033628 A KR20207033628 A KR 20207033628A KR 20210005661 A KR20210005661 A KR 20210005661A
Authority
KR
South Korea
Prior art keywords
protein
sequence
cell
animal
progeny
Prior art date
Application number
KR1020207033628A
Other languages
English (en)
Inventor
랜들 에스. 프래더
케빈 디. 웰즈
크리스틴 엠. 위트워스
Original Assignee
더 큐레이터스 오브 더 유니버시티 오브 미주리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 큐레이터스 오브 더 유니버시티 오브 미주리 filed Critical 더 큐레이터스 오브 더 유니버시티 오브 미주리
Publication of KR20210005661A publication Critical patent/KR20210005661A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70596Molecules with a "CD"-designation not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/485Exopeptidases (3.4.11-3.4.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/11Aminopeptidases (3.4.11)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/108Swine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/02Animal zootechnically ameliorated
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물 및 이의 자손이 제공된다. 이러한 변형된 염색체 서열을 함유하는 동물 세포가 또한 제공된다. 동물, 자손, 및 세포는 전염성 위장염 바이러스(TGEV) 및 돼지 호흡기 코로나바이러스(PRCV)를 포함하는 병원체에 대해 내성이 증가된다. 동물, 자손, 및 세포는 임의적으로 CD163 단백질 및/또는 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함할 수 있다. 병원체-내성 비인간 동물 또는 비인간 동물의 계통을 생산하는 방법이 또한 제공된다.

Description

변형된 아미노펩티다제 N(ANPEP) 유전자를 갖는 병원체-내성 동물
전자적으로 제출된 서열 목록 참조
서열 목록의 공식 사본은 2019년 4월 26일 생성되고 318.7 킬로바이트 크기의 파일명 "(16UMC002-WO) Sequence Listing filed 4.26.19"와 함께 ASCII-포맷의 서열 목록으로 EFS-Web를 통해 전자적으로 제출되며, 명세서와 동시에 제출된다. 이 ASCII-포맷의 서류에 포함된 서열 목록은 명세서의 일부이며 그 전체가 본원에 참조로 포함된다.
발명의 분야
본 발명은 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물 및 이의 자손에 관한 것이다. 본 발명은 또한 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 동물 세포에 관한 것이다. 동물 및 세포는 전염성 위장염 바이러스(TGEV) 및 돼지 호흡기 코로나바이러스(PRCV)를 포함하여 병원체에 대한 내성이 증가하였다. 본 발명은 또한 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하고 또한 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및/또는 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물, 자손, 및 동물 세포에 관한 것이다. 본 발명은 또한 병원체-내성 비인간 동물 또는 비인간 동물의 계통을 생산하는 방법에 관한 것이다.
코로나바이러스에 의해 유발된 호흡기 및 장내 감염은 인간 및 동물 건강 둘 다에 중요한 영향을 미친다. 면역학적으로 미접촉(naive) 갓 태어난 돼지를 전염성 위장염 바이러스(TGEV) 또는 돼지 유행성 설사병 바이러스(PEDV)로 감염시키면 100% 폐사율에 가까운 손실이 발생할 수 있으며; 장세포의 바이러스-매개 파괴에 의해 유발된 탈수로 인해 흡수장애성 설사 및 탈수를 초래한다(Madson et al., 2016; Saif et al., 2012). TGEV는 1940년 대에 미국에서 처음으로 나타났다(Doyle and Hutchings., 1946). 2013년에 돼지 유행성 설사병 바이러스(PEDV)의 최근 출현은 미국에서 거의 700 만 마리의 돼지가 사망한 원인이었으며, 돼지 생산에서 10% 손실로 추정된다(Stevenson et al., 2013). TGEV는 또한 100% 신생 동물 폐사율을 유발할 수 있다. 나이가 든 돼지에서, TGEV 또는 PEDV로 감염되면 경도 임상 징후만을 초래한 후 완전 회복된다.
인간, 개 및 고양이 코로나바이러스와 함께, PEDV 및 TGEV는 코로나비리다에(Coronaviridae) 과의 알파코로나바이러스(Alphacoronavirus) 속에 속한다(Lin et al., 2015). 돼지 호흡기 코로나바이러스(PRCV)는 또한 알파코로나바이러스이며 TGEV와 밀접하게 관련이 있다. PRCV는 일반적으로 준임상 감염 또는 경도 호흡기 질환을 유발하지만, 심각한 사례가 기재되어 있으며 돼지가 PRCV 및 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)와 같은 또 다른 바이러스로 이중으로 감염될 때 질환의 중증도를 악화시킬 수 있다는 증거가 있다(Killoran et al., 2016; Van Reeth et al., 1996). 더욱이, PRCV-양성 상태의 무리는 경제적으로 연루될 수 있는데, 일부 국가에서는 PRCV-양성인 동물이 중요하지 않을 것이기 때문이다.
코로나바이러스는 니도비랄레스(Nidovirales) 목을 차지하는 외피 단일 가닥 양성 센스 RNA 바이러스이다. 니도바이러스의 특징적 홀마크는 포개진 서브게놈 mRNA 세트의 합성이다. 코로나바이러스의 고유한 구조적 특성은 비리온의 표면에서 돌출되는 스파이크 단백질에 의해 형성된 "코로나"이다. 바이러스 스파이크 단백질이 모든 코로나바이러스에 대한 1차 수용체 단백질일지라도, 상응하는 세포 표면 수용체는 달라진다(Li, 2015). Delmas 등은 TGEV에 대한 후보 수용체로서 돼지 아미노펩티다제 N(ANPEP, APN 또는 CD13)을 처음으로 특징화하였다(Delmas et al., 1992). 돼지 ANPEP는 장에서 소화하는 동안 단백질 기질에서 N-말단 아미노산을 제거하는 역할을 하는 II형 막 메탈로펩티다제이다.
ANPEP는 소장 및 신장 뇨세관 상피 세포, 과립구, 대식세포, 및 시냅스 막을 포함하여 다양한 세포 유형 및 조직에서 발현된다. ANPEP는 소장의 상피 세포(장세포)에서 풍부하게 발현된다. ANPEP는 내피 유지, 종양 형성(Bhagwat et al., 2001; Guzman-Rojas et al., 2012) 및 유선형성과 같은 조직 혈관화 동안 주로 발현된다.
소장의 상피 세포가 PED 바이러스 임상 감염의 주요 부위인 것으로 보이지만, 폐포 대식세포와 같은 다른 부위 또한 감염될 수 있다(Park 및 Shin, 2014). 실제로, 폐포 대식세포의 심층 서열분석 데이터는 ANPEP에 대한 메시지를 식별하였다(미공개). 다른 감염 부위가 지속적인 감염에 대한 저장소로서 역할을 할 수 있는 것으로 제안되었다(Park 및 Shin, 2014).
ANPEP는 비치환된 N-말단 장기를 중성 측쇄로 가수분해하는 막-결합 아연-의존성 메탈로프로테아제이다. 신장 근위곡 세뇨관에서 유일하게 알려진 기질은 안지오텐신 III이며; 이는 안지오텐신 IV를 절단한다. 또한 엔케팔린 및 엔도르핀을 대사한다. 마지막으로, 신호 전달, 세포 주기 제어 및 분화에서 기능을 한다.
특정 코로나바이러스에 대한 수용체로서의 역할 이외에도, ANPEP는 또한 펩티드 대사, 세포 운동성 및 부착, 통증 감각, 혈압 조절, 종양 혈관형성 및 전이, 면역 세포 주화성, 정자 운동성, 세포-세포 부착, 및 기분 조절을 포함하여 많은 생리적 과정에서 중요한 역할을 한다(Chen et al., 2012).
돼지 및 인간 ANPEP는 높은 서열 동일성, 및 구별하기 어려운 생화학적 및 운동학적 특성을 공유한다(Chen et al., 2012). ANPEP 유전자는 돼지의 7 번 염색체에 위치하며, 적어도 3 개의 스플라이스 변이체를 갖는다. ANPEP의 2 개의 프로모터는 골수성/섬유아세포 세포 및 장내 상피 세포에서 식별되었다(Shapiro et al., 1991). 이들은 약 8 kb 떨어져 있으며 다양한 5' 비-코딩 영역을 갖는 전사체를 생성한다. 상피 프로모터는 코딩 영역에 더 가깝게 위치하지만, 골수성 프로모터는 먼 쪽에 있다(Shapiro et al., 1991). ANPEP 유전자와 관련된 공개적으로 용인된 3 개의 전사체/스플라이스 변이체가 있다: X1, X2 및 X3. 변이체 X1은 20 개 엑손이 있으며 1017 개 아미노산 단백질을 암호화한다. 변이체 X2 및 X3은 둘 다 21 개 엑손이 있으며 각각 963 개 아미노산 단백질을 암호화한다. 성숙 ANPEP 단백질은 N 말단 근처에 24 개 소수성 세그먼트가 있으며 막 삽입을 위한 신호로서 역할을 한다. 큰 세포외 C-말단 도메인은 아연-결합 메탈로프로테이나제 슈퍼패밀리 도메인 유사 영역, 세포질 Ser/Thr-풍부 접합부, 및 전이 상태 안정화제를 함유한다.
상기에서 인식될 수 있는 바와 같이, 동물에서 TGEV 및 PRCV와 같은 관련 바이러스에 대한 내성을 유도하는 전략 개발에 대한 요구가 당업계에 존재한다.
북미, 유럽 및 아시아에서 경제적으로 중요한 또 다른 돼지 질환은 돼지 생식기 및 호흡기 증후군(PRRS)이며, 북미 생산자는 연간 대략 6억 달러의 비용이 든다(Holtkamp et al., 2013). 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV) 감염으로 유발된 임상 질환 증후군은 1987년에 미국에서 처음으로 보고되었고(Keffaber, 1989) 나중에 유럽에서 1990년에 보고되었다(Wensvoort et al., 1991). PRRSV 감염은 기침 및 발열, 임신 후기 생식 장애, 및 성장 성능 감소를 포함하여 호흡기 질환을 초래한다. 바이러스는 또한 평생에 걸친 준임상 감염을 유지하면서 다양한 다균성 질환 증후군 상호작용에 참여한다(Rowland et al., 2012). 손실은 어린 돼지에서 호흡기 질환, 불량한 성장 성능, 생식 장애, 및 자궁 내 감염의 결과이다(Keffaber, 1989).
돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)는 뮤린 락테이트 데히드로게나제-상승 바이러스, 원숭이 출혈열 바이러스, 및 말 동맥염 바이러스와 함께 아르테리비다에(Arterividae) 과에 속한다. 구조적으로, 아르테리바이러스는 토가바이러스와 닮았지만, 코로나바이러스와 유사하며, 공통 리더 및 폴리-A 꼬리를 보유하는 서브게놈 mRNA의 포개진 3'-co-말단 세트를 통해 복제된다. 아르테리바이러스는 대식세포에 대한 향성 및 심각한 질환 및 지속적인 감염을 유발하는 능력을 포함하며, 바이러스 발병기전과 관련된 중요한 특성을 공유한다(Plagemann, 1996). 북미 및 유럽 바이러스 사이의 분자 비교는 모든 PRRSV 단리물을 각각 2형 또는 1형의 2 개의 유전자형 중 하나에 배치한다. 2 개의 유전자형이 뉴클레오티드 수준에서 약 70% 동일성만을 보유할지라도(Nelsen et al., 1999), 둘 다 CD163-양성 세포에 대한 향성을 공유하고, 장기 감염을 달성하고, 유사한 임상 징후를 생성한다.
CD163은 막관통 도메인 및 짧은 세포질 꼬리와 함께 9 개의 스캐빈저 수용체 시스테인-풍부(SRCR) 도메인 및 2 개의 스페이서 도메인으로 구성된 130 kDa 1형 막 단백질이다(Fabriek et al., 2005). 돼지 CD163은 펩티드 신호 서열을 코딩하는 17 개 엑손 이어서 9 개 SRCR 도메인, 2 개 링커 도메인(또한 SRCR 6 및 SRCR 9 뒤에 위치한 프롤린 세린 트레오닌(PST) 도메인으로도 지칭됨), 및 세포질 도메인 이어서 짧은 세포질 꼬리를 함유한다. CD163의 표면 발현은 단핵구-대식세포 계통의 세포로 제한된다. 바이러스 수용체로서 기능하는 것 이외에도, CD163은 정상 항상성을 유지하는 것과 관련된 여러 중요한 기능을 나타낸다. 예를 들어, 감염 또는 조직 손상 후, CD163은 스케빈저 분자로서 기능하여, 혈액에서 합토글로빈-헤모글로빈 복합체를 제거한다(Kristiansen et al., 2001). 생성된 헴(heme) 분해 산물은 관련 염증 반응을 조절한다(Fabriek et al., 2005). HbHp 스케빈저화는 CD163의 주요 기능이며 SRCR 3에 위치한다(Madsen et al., 2004). HbHp 분해 후 대식세포에 의해 방출된 대사산물은 빌리루빈, CO, 및 유리 철을 포함한다. CD163의 중요한 기능 중 하나는 유리 헤모글로빈으로 인한 산화 독성의 방지이다(Kristiansen et al., 2001; Soares et al., 2009).
C163의 다른 중요한 기능은 적혈모세포 부착(SRCR2), TWEAK(세포자멸사의 종양 괴사 인자-유사 약한 유도제) 수용체(SRCR1-4 & 6-9), 박테리아 수용체(SRCR5), 및 아프리카 돼지 바이러스 수용체를 포함한다(Sanchez-Torres et al. 2003). CD163은 또한 면역-조절제로서 잠재적인 역할을 한다(Van Gorp et al. 2010에서 논의됨).
CD163은 Calvert et. al. (2007)에 의해 PRRSV에 대한 수용체로서 처음으로 기재되었다. 비-허용 세포주를 유인원, 인간, 개, 및 마우스를 포함하여 다양한 종의 CD163 cDNA로 형질감염시키면 세포를 PRRSV에 감염시킬 수 있다(Calvert et al., 2007). CD163 이외에도, 제2 수용체 단백질인 CD169(또한 시알로어드헨신 또는 SIGLEC1로도 알려짐)는 비리온의 표면에서 주요 단백질인 GP5-매트릭스(M) 이형이량체와의 초기 상호작용을 형성하는 데 수반되는 1차 PRRSV 수용체인 것으로 식별되었다(Delputte et al., 2002). 이 모델에서, 엔도솜 구획에서 CD163 및 GP2, 3, 4 이형삼량체 사이의 후속 상호작용은 외피제거 및 바이러스 게놈의 세포질로의 방출을 매개한다(Van Breedam et al., 2010, Allende et al., 1999). 이러한 결과는 표면 CD169 및 CD163이 없는 PRRSV-내성 세포주가 CD163 플라스미드로 형질감염 후 바이러스 복제를 지원하였음을 제시하는 이전 시험관내 연구를 뒷받침하였다(Welch et al., 2010).
PRRSV에 대한 또 다른 수용체가 식별되고 정제되고 서열분석되고 SIGLEC1, CD169, 또는 시알로어드헨신으로 명명되었다(Vanderheijden et al., 2003; Wissink et al., 2003). SIGLEC1은 시알산 결합 면역글로불린-유사 렉틴 패밀리에 속하는 막관통 단백질이다. 이는 조혈 및 림프 조직의 대식세포에서 양 적혈구 결합 수용체로서 처음으로 기재되었다(Delputte et al., 2004). SIGLEC 단백질은 시알산 결합 부위를 함유하는 N-말단 V-세트 도메인, 이어서 가변 수의 C2-세트 도메인, 막관통 도메인, 및 세포질 꼬리를 함유한다. 다른 SIGLEC 단백질과 대조적으로, SIGLEC1은 세포질 꼬리에 티로신-기반 모티프가 없다(Oetke et al., 2006). 대식세포에서 발현되는 SIGLEC1은 적혈구, 호중구, 단핵구, NK 세포, B 세포, 및 일부 세포독성 T 세포에서 시알산 리간드의 결합을 통해 세포 간 상호작용에서 기능한다. SIGLEC1-시알산 상호작용은 항원 처리 및 T 세포에 대한 제시 및 B 세포 및 CD8 T 세포의 활성화와 같은 적응성 면역의 여러 측면에 참여한다(Martinez-Pomares et al., 2012 및 O'Neill et al., 2013에서 검토됨).
SIGLEC1 상의 온전한 N-말단 도메인은 PRRSV 결합 및 배양된 대식세포에 의한 내재화에 모두 필요하고 충분한 것으로 제안되었다(An et al., 2010; Delputte et al., 2007). PK-15과 같은 SIGLEC1-음성 세포를 SIGLEC1로 형질감염시키면 바이러스 내재화를 매개하는 데 충분하다. PRRSV-허용 세포를 항-SIGLEC1 모노클로날 항체(MAb)와 배양하면 PRRSV 결합 및 내재화를 차단한다(Vanderheijden N et al., 2003). 바이러스 측면에서, 비리온 표면에서 시알산을 제거하거나 또는 바이러스를 시알산-특이적 렉틴과 사전배양하면 감염을 차단한다(Delputte et al., 2004; Delputte et al., 2007; Van Breedam et al., 2010).
PRRSV 발병기전(특히 분자 수준에서) 및 동물전염병학 둘 다의 많은 특징은 제대로 이해되지 않아서 통제 노력을 어렵게 만든다. 현재, 생산자들은 종종 변형된-생 약독학 균주 또는 사멸된 바이러스 백신으로 돼지에게 PRRSV에 대한 백신접종을 하지만, 현재 백신은 종종 만족스러운 보호를 제공하지 않는다. 이는 균주 변이 및 면역계의 적절하지 않은 자극 둘 다에 기인한다. 이용가능한 PRRSV 백신의 효능에 관한 우려 이외에도, 현재 사용 중인 변형된-생 백신이 개별 돼지 및 돼지 무리에서 지속되고 돼지의 실험적 감염 후 악성 현장 단리로 입증된 바와 같이, 돌연변이를 축적할 수 있다(Mengeling et al. 1999)는 강력한 증거가 있다(Rowland et al., 1999). 더욱이, 백신 바이러스는 백신접종된 수퇘지의 정액에서 내뿜는 것으로 나타났다(Christopher-Hennings et al., 1997). 백신접종의 대안으로, 일부 전문가들은 번식 무리에서 "시험 및 제거" 전략을 지지하고 있다(Dee et al., 1998). 이 전략의 성공적인 사용은 PRRSV에 급성으로 또는 지속적으로 감염된 모든 돼지를 제거한 다음, 엄격하게 통제하여 바이러스의 재도입을 방지하는 데 달려있다. 이 전략과 관련된 어려움, 및 많은 비용은 지속적인 PRRSV 감염의 발병기전에 관해 거의 알려지지 않았서 지속적으로 감염된 돼지를 식별하는 신뢰할 수 있는 기술이 없다는 것이다.
따라서, 동물에서 PRRSV에 대한 내성을 유도하려는 요구가 또한 당업계에 존재한다. 또한 동일한 동물에서 PRRSV 및 TGEV 및/또는 PRCV 내성을 유도하는 것이 이익일 것이다.
가축 동물 및 이의 자손이 제공된다. 동물 및 자손은 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
동물 세포가 또한 제공된다. 동물 세포는 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
또한 가축 동물 및 이의 자손이 제공된다. 동물 및 자손은 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
또한 동물 세포가 제공된다. 동물 세포는 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
추가의 가축 동물 및 이의 자손이 제공된다. 동물 및 자손은 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
추가의 동물 세포가 제공된다. 동물 세포는 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
또한 가축 동물 및 이의 자손이 제공된다. 동물 및 자손은 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열, CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열, 및 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
또한 동물 세포가 제공된다. 동물 세포는 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열, CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열, 및 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함한다.
비인간 동물 또는 비인간 동물의 계통을 생산하는 방법이 제공된다. 동물 또는 계통은 병원체에 대한 감수성이 감소된다. 상기 방법은 난모세포 또는 정자 세포를 변형시켜 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 난모세포 및 정자 세포 중 적어도 하나에 도입하는 단계, 및 난모세포를 정자 세포와 수정하여 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 함유하는 수정란을 생성하는 단계를 포함한다. 상기 방법은 추가로 수정란을 대리 암컷 동물로 옮기는 단계를 포함하며, 여기서 임신 및 만기 분만은 자손 동물을 생산한다. 상기 방법은 추가적으로 병원체에 대한 감수성에 대해 자손 동물을 스크리닝하는 단계, 및 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물과 비교하여 병원체에 대한 감수성이 감소된 자손 동물을 선택하는 단계를 포함한다.
비인간 동물 또는 비인간 동물의 계통을 생산하는 또 다른 방법이 제공된다. 동물 또는 계통은 병원체에 대한 감수성이 감소된다. 상기 방법은 수정란을 변형시켜 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 수정란에 도입하는 단계를 포함한다. 상기 방법은 수정란을 대리 암컷 동물로 옮기는 단계를 추가로 포함하며, 여기서 임신 및 만기 분만은 자손 동물을 생산한다. 상기 방법은 추가적으로 병원체에 대한 감수성에 대해 자손 동물을 스크리닝하는 단계, 및 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물과 비교하여 병원체에 대한 감수성이 감소된 자손 동물을 선택하는 단계를 포함한다.
병원체 감염에 대한 가축 동물의 내성을 증가시키는 방법이 제공된다. 상기 방법은 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물의 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성이 감소되도록 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계를 포함한다.
가축 동물 집단이 제공된다. 집단은 본원에 기재된 임의의 가축 동물 및/또는 자손 중 2 마리 이상을 포함한다.
또 다른 동물 집단이 제공된다. 집단은 본원에 기재된 임의의 방법에 의해 만들어진 2 마리 이상의 동물 및/또는 이의 자손을 포함한다.
핵산 분자가 제공된다. 핵산 분자는 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함한다:
(a) 서열번호: 135의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함;
(b) 서열번호: 132의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함; 및
(c) (a) 또는 (b)의 cDNA.
다른 목적 및 특성은 부분적으로 명백하고 부분적으로 이하에서 지적될 것이다.
도 1. CD163을 변형시키는 데 사용되는 표적화 벡터 및 CRISPR. 패널 A는 CRISPR를 사용한 변형을 위해 표적화된 CD163 유전자의 야생형 엑손 7, 8 및 9를 도시한다. 패널 B는 돼지 엑손 7(CD163의 돼지 도메인 SRCR5)을 CD163L의 인간 SRCR8을 암호화하는 DNA로 대체하도록 설계된 표적화 벡터를 제시한다. 이 표적화 벡터를 G418에 의한 약물 선택으로 형질감염에 사용하였다. 원거리, 왼쪽 아암 및 오른쪽 아암 검정을 위한 PCR 프라이머는 1230, 3752, 8791, 7765 및 7775로 화살표로 표지된다. 패널 C는 패널 B에 제시된 것과 동일한 표적화 벡터를 도시하지만, 여기서 Neo 카세트는 제거되었다. 이 표적화 벡터를 이미 네오마이신 내성이 있는 세포에서 CD163을 표적하는 데 사용하였다. 작은 결실 검정에 사용되는 프라이머는 화살표로 표시되고 GCD163F 및 GCD163R로 표지된다. 패널 D는 CRISPR에 의해 표적화된 엑손을 강조한다. CRISPR 10, 131, 256 및 282의 위치는 엑손 7에서 아래쪽으로 대면하는 화살표로 나타낸다. CRISPR 번호는 인트론 6 및 엑손 7의 인트론-엑손 접합부에서 염기쌍의 수를 나타낸다.
도 2. CD1D를 변형시키는 데 사용되는 표적화 벡터 및 CRISPR. 패널 A는 CRISPR에 의한 변형을 위해 표적화된 CD1D 유전자의 야생형 엑손 3, 4, 5, 6 및 7을 도시한다. 패널 B는 엑손 3을 선택가능한 마커 Neo로 대체하도록 설계된 표적화 벡터를 제시한다. 이 표적화 벡터는 CD1D를 변형시키도록 CRISPR와 조합하여 사용되었다. 원거리, 왼쪽 아암 및 오른쪽 아암 검정을 위한 PCR 프라이머는 3991, 4363, 7373 및 12806으로 화살표로 표지된다. 패널 C는 CRISPR에 의해 표적화된 엑손을 도시한다. CRISPR 4800, 5350, 5620 및 5626의 위치는 엑손 3에서 아래쪽으로 대면하는 화살표로 나타낸다. 작은 결실 검정에 사용되는 프라이머는 화살표로 표시되고 GCD1DF 및 GCD1DR로 표지된다.
도 3. CRISPR/Cas9 및 SCNT에 의한 CD163CD1D 녹아웃(knock out) 돼지의 생성. A) CRISPR/Cas9 및 공여체 DNA로 형질감염 후 체세포에서 CD163의 표적화된 결실. 야생형(WT) 유전자형은 6545 염기쌍(bp) 밴드를 초래한다. 레인 1-6은 CRISPR 10과 Cas9 및 Neo를 함유하는 공여체 DNA로 단일 형질감염으로부터 6 개의 상이한 콜로니를 나타낸다. 레인 1, 4, 및 5는 1500-2000 bp의 큰 동형접합 결실을 나타낸다. 레인 2는 더 작은 동형접합 결실을 나타낸다. 레인 3 및 6은 WT 대립유전자 및 작은 결실 또는 두 대립유전자의 이중 대립유전자 변형을 나타낸다. 각 콜로니의 정확한 변형은 SCNT에 사용된 콜로니에 대한 서열분석에 의해서만 결정되었다. 일부 레인에서 희미한 WT 밴드는 이웃 WT 콜로니로부터 태아 섬유아세포의 교차-오염을 나타낼 수 있다. NTC = 주형 없음 대조군. B) CRISPR/Cas9 및 공여체 DNA로 형질감염 후 체세포에서 CD1D의 표적화된 결실. WT 유전자형은 8729 bp 밴드를 초래한다. 레인 1-4는 CD1D의 500-2000 bp 결실이 있는 콜로니를 나타낸다. 레인 4는 WT 콜로니로 보인다. NTC = 주형 없음 대조군. C) 연구 동안 SCNT에 의해 생산된 CD163 녹아웃 돼지의 이미지. 이 수컷 새끼 돼지는 CD163의 동형접합 1506 bp 결실을 함유한다. D) 연구 동안 생산된 CD1D 돼지의 이미지. 이들 새끼 돼지는 CD1D의 1653 bp 결실을 함유한다. E) CD163의 1506 bp 결실을 함유하는 2 마리의 SCNT 한 배 새끼의 유전자형. 레인 1-3(한 배 새끼 63) 및 레인 1-4(한 배 새끼 64)는 각 한 배 새끼로부터 각 새끼 돼지에 대한 유전자형을 나타낸다. 암퇘지는 SCNT 배아의 수령체 암컷을 나타내고, WT는 WT 대조군을 나타낸다. NTC = 주형 없음 대조군. F) CD1D의 1653 bp 결실을 함유하는 2 마리의 SCNT 한 배 새끼의 유전자형. 레인 1-7(한 배 새끼 158) 및 레인 1-4(한 배 새끼 159)는 각 새끼 돼지에 대한 유전자형을 나타낸다.
도 4. 돼지 배아에서 CRISPR/Cas9 시스템의 효과. A) 상이한 농도의 CRISPR/Cas9 시스템을 접합체에 주입한 후 배반포 형성 빈도. CRISPR/Cas9 시스템의 독성은 10 ng/μl에서 가장 낮았다. B) CRISPR/Cas9 시스템은 접합체에 도입될 때 배반포에서 eGFP의 발현을 성공적으로 방해할 수 있다. 원래 배율 X4. C) CRISPR/Cas9 시스템을 사용하여 생성된 eGFP 상의 돌연변이 유형: WT 유전자형(서열번호: 16), #1(서열번호: 17), #2(서열번호: 18), 및 #3(서열번호: 19).
도 5. 돼지 배아의 표적화 CD163에서 CRISPR/Cas9 시스템의 효과. A) CRISPR/Cas9 시스템에 의해 CD163 상에 생성된 돌연변이의 예: WT 유전자형(서열번호: 20), #1-1(서열번호: 21), #1-4(서열번호: 22), 및 #2-2(서열번호: 23). DNA 서열분석에 의해 조사된 모든 배아는 CD163 상의 돌연변이를 제시하였다(18/18). CRISPR 131은 굵은 글씨로 강조된다. B) CRISPR/Cas9 시스템에 의해 유발된 동형접합 결실의 서열분석 판독. 이미지는 CD163의 2 bp 결실을 보유하는 패널 A의 # 1-4를 나타낸다.
도 6. 두 유형의 CRISPR를 도입했을 때 CRISPR/Cas9 시스템의 효과. A) 접합체로서 CRISPR/ Cas9가 주입된 배반포에서 CD163에서 PCR 증폭. 레인 1, 3, 6, 및 12는 2 개의 상이한 CRISPR 사이의 설계된 결실을 나타낸다. B) 접합체로서 CRISPR/Cas9가 주입된 배반포에서 CD1D의 PCR 증폭. CD1D CD163(3/23)과 비교할 때 겔 전기영동에 의해 결정 시 더 낮은 결실 빈도를 가졌으며; 레인 1, 8, 및 15는 CD1D에서 명백한 결실을 나타낸다. C) CRISPR/Cas9 시스템은 시스템이 CD163eGFP를 표적으로 하는 2 개 CRISPR로 제공되었을 때 2 개 유전자를 성공적으로 표적화하였다. CD163eGFP의 변형은 다음과 같이 제시된다: CD163 WT(서열번호: 24), CD163 #1(서열번호: 25), CD163 #2(서열번호: 26), CD163 #3(서열번호: 27), eGFP WT(서열번호: 28), eGFP #1-1(서열번호: 29), eGFP #1-2(서열번호: 30), eGFP #2(서열번호: 31), 및 eGFP #3(서열번호: 32).
도 7. 접합체에 주입된 CRISPR/Cas9 시스템에 의해 생성된 CD163 녹아웃 돼지. A) 녹아웃 돼지로부터 CD163의 PCR 증폭; 한 배 새끼 67-2 및 67-4에서 명백한 결실 징후가 검출되었다. B) 대리모가 있는 CD163 녹아웃 돼지의 이미지. 모든 동물은 건강하고 이상 징후를 나타내지 않는다. C) CD163 녹아웃 돼지의 유전자형. 야생형(WT) 서열은 서열번호: 33으로 제시된다. 2 마리의 동물(한 배 새끼 67-1(서열번호: 34) 및 67-3 (서열번호: 37))은 CD163의 동형접합 결실 또는 삽입을 보유하고 있다. 다른 2 마리의 동물(한 배 새끼 67-2 및 67-4)은 CD163의 이중 대립유전자 변형을 보유하고 있다: #67-2 A1(서열번호: 35), #67-2 A2(서열번호: 36), #67-4 A1(서열번호: 38), 및 #67-4 a2(서열번호: 39). 결실은 2 개의 상이한 CRISPR를 Cas9 시스템과 도입함으로써 유발되었다. CD163에 대한 접합체를 주입받은 동물은 모자이크 유전자형을 나타내지 않았다.
도 8. 접합체에 주입된 CRISPR/Cas9 시스템에 의해 생성된 CD1D 녹아웃 돼지. A) 녹아웃 돼지로부터 CD1D의 PCR 증폭; 166-1은 CD1D에 대해 모자이크 유전자형을 나타낸다. 166-2, 166-3, 및 166-4는 앰플리콘에 대한 크기 변화를 나타내지 않지만, 앰플리콘의 서열분석은 변형을 입증하였다. WT FF = 야생형 태아 섬유아세포. B) 원거리 검정의 PCR 증폭은 새끼 돼지 166-1 및 166-2에서 하나의 대립유전자의 명백한 결실을 나타내었다. C) 대리모가 있는 CD1D 녹아웃 돼지의 이미지. D) CD1D 녹아웃 돼지의 서열 데이터; WT(서열번호: 40), #166-1.1(서열번호: 41), #166-1.2(서열번호: 42), #166-2(서열번호: 43), #166-3.1(서열번호: 44), #166-3.2(서열번호: 45), 및 #166-4 (서열번호: 46). 엑손 3에서 atg 개시 코돈은 굵은 글씨 및 또한 소문자로 나타낸다.
도 9. 급성 PRRSV 감염 동안 임상 징후. CD163 +/+(n=6) 및 CD163 -/-(n=3)에 대해 호흡기 징후 및 발열이 있는 일일 평가 결과.
도 10. 급성 PRRSV 감염 동안 폐 조직병리학. 야생형 및 녹아웃 돼지로부터의 H 및 E 염색된 조직의 대표적인 현미경 사진. 왼쪽 패널은 단핵 세포의 부종 및 침윤을 나타낸다. 녹아웃 돼지로부터의 오른쪽 패널은 정상 폐의 폐 구조를 나타낸다.
도 11. 다양한 유전자형의 바이러스 혈증. CD163-/- 새끼 돼지 데이터가 X 축을 따라 놓여 있음에 유의한다.
도 12. 무효(null), 야생형 및 비특성화 대립유전자 돼지에서 항체 생산.
도 13. 개별 돼지에서 CD163의 세포 표면 발현. 비특성화 A, 비특성화 B, 및 CD163 +/+ 패널에서 오른쪽으로 보이는 선은 CD163 항체를 나타내지만 이들 패널의 좌측 편으로 보이는 선은 항체 없음 대조군(배경)이다. CD163-/- 동물에서, CD163 염색은 배경 대조군과 중첩되고, 비특성화 대립유전자에서 CD163 염색은 WT 수준 및 배경 사이의 거의 중간에 있음에 유의한다(또한 이는 로그 척도이므로 ~10% 미만임에 유의).
도 14. 3 마리의 대표적인 돼지의 폐포 대식세포 및 항체 없음 대조군(FITC 표지된 항-CD169)에 대한 CD169의 수준.
도 15. 다양한 유전자형의 바이러스 혈증. Δ43 아미노산 새끼 돼지 데이터가 X-축을 따라 놓여 있음에 유의한다.
도 16. 참조 서열로 사용되는 야생형 CD163 엑손 7-10의 게놈 서열(서열번호: 47). 서열은 엑손 7의 3000 bp 상류에서 엑손 10의 마지막 염기까지 포함한다. 밑줄 친 영역은 각각 엑손 7, 8, 9, 및 10의 위치를 나타낸다.
도 17. 돼지 폐포 대식세포(PAM) 상의 표면 CD163의 수준에 의해 측정 시, 여러 CD163 염색체 변형, 각 변형에 대한 예측된 단백질 산물, 및 각 변형에 대한 관련 대식세포 발현을 예시하는 CD163 변형의 다이어그램. 검정색 영역은 인트론을 나타내고 흰색 영역은 엑손을 나타낸다. 빗금 친 영역은 돼지 엑손 7의 상동체인 hCD163L1 엑손 11 모방체를 나타낸다. 회색 영역은 PGK Neo 작제물을 갖는 합성된 인트론을 나타낸다.
도 18. 돼지 CD163 단백질 및 유전자 서열의 다이어그램. A) CD163 단백질 SRCR(타원형) 및 PST(사각형) 도메인과 함께 상응하는 유전자 엑손. B) 돼지 CD163 SRCR 5(서열번호: 120)와 인간 CD163L1 SRCR 8(서열번호: 121) 상동체의 비교.
도 19. 야생형 및 CD163-변형된 돼지의 PAM 상의 CD163 및 CD169의 표면 발현에 대한 대표적인 결과. 패널 A-E는 도 17에 예시된 바와 같이 CD163 변형에 대한 결과를 나타낸다. d7(1467) 및 d7(1280)에 대한 풀링된 데이터는 패널 D에 나타낸다.
도 20. 야생형 및 CD163-변형된 돼지에서 혈청 합토글로빈 수준.
도 21. 2형 PRRSV 단리물로의 감염에 대한 야생형 및 HL11m PAM의 상대적 허용성.
도 22. 1형 및 2형 PRRSV 단리물로 CD163 변형된 돼지의 감염.
도 23. 2형 바이러스로 감염된 WT 및 CD163-변형된 돼지에 대한 바이러스 부하.
도 24. SIGLEC1 녹아웃 전략. 패널 A는 21 개 엑손을 함유하고 대략 20 kb에 이르는 돼지 SIGLEC1의 조직을 나타낸다(GenBank 수탁 번호 CU467609). 패널 B는 상동 재조합에 사용되는 표적화 작제물을 예시한다. PCR 증폭 및 클로닝을 위한 프라이머 서열은 (F) 및 (R)로 표지된다. '상완(upper arm)' DNA 단편은 엑손 1의 ~3.5 kbp 상류이고 엑손 1의 일부(개시 코돈 이후)를 포함한다. 시알산 결합 도메인은 엑손 2에 위치한다. '하완(lower arm)' DNA 단편은 엑손 4, 5, 6 및 엑손 7의 일부를 포함한다. 엑손 1의 대부분 및 엑손 2 및 3 모두는 PGK 프로모터의 제어 하에 네오마이신(neo) 카세트로 치환되었다. 티미딘 키나제(TK) 카세트는 하완의 바로 하류에서 이용가능하였지만 선택에 사용되지 않았다. 3 개의 인프레임(in-frame) 정지 코돈(sss)은 영역을 증폭하는 데 사용되는 안티센스 및 센스 PCR 프라이머에 포함됨으로써 상완 및 하완의 끝에 도입되었다. 패널 C는 상동 재조합 후 돌연변이된 SIGLEC1 유전자를 나타낸다. 수평 화살표는 스크리닝에 사용되는 PCR 프라이머의 위치를 나타낸다(프라이머 서열에 대해 표 17 참조).
도 25. 유전자삽입 원조 돼지에서 야생형 및 표적화된 SIGLEC1 +/- 대립유전자의 PCR 스크리닝. PCR 프라이머, "c" 및 "d"(도 24의 표지된 화살표 참조)를 사용하여 수컷 4-18 클론에서 유래된 8 마리의 원조 돼지로부터의 게놈 DNA를 증폭시켰다. 패널 A는 KW2 세포(형질감염에 사용되는 초기 세포), 표적화 플라스미드, 표적화된 세포 4-18(2 개의 밴드, ~2,400 및 ~2,900 bp에 유의), 비표적화된 섬유아세포로부터의 DNA 및 음성 PCR 대조군으로써 물 블랭크를 나타낸다. 화살표는 4-18 클론에 대한 희미한 2,900 bp 밴드의 위치를 나타낸다. 패널 B는 8 마리 F0 유전자삽입 돼지에 대한 결과를 나타낸다. 각 새끼 돼지에 대한 2 개 밴드(~2,400 및 2,900 bp)의 존재에 유의한다. 야생형 4-18 클론, 11-1 및 표적화 플라스미드는 단일 밴드만을 나타낸다. 분자 크기 마커로부터의 일부 단편 크기가 표시된다.
도 26. F2 한 배 새끼 #52에서 녹아웃 돼지의 서던 블롯(Southern blot) 식별. 위쪽 화살표는 야생형 밴드의 위치(7,892 bp)를 지적하는 반면, 아래쪽 화살표는 유전자 녹아웃의 예측된 위치(7,204 bp)를 식별한다. 분자 크기 표준(STD)이 제시된다. SIGLEC1(-/-) 돼지 이외에도, 야생형(+/+), 및 이형접합(+/-) 돼지의 예가 또한 도시된다.
도 27. PAM 세포의 표면 상의 SIGLEC1(CD169) 및 CD163의 발현. 신선한 PAM 세포를 CD169(mAb 3B11/11) 또는 CD163(mAb 2A10/11)으로 염색하였다. FITC-접합된 염소-항 마우스 IgG로만 염색된 PAM 세포를 배경 대조군으로 포함하였다.
도 28. 참조 서열로서 사용되는 야생형 ANPEP 엑손 2-4의 게놈 서열(서열번호: 135). 서열은 인트론 2에서 마지막 773 염기쌍, 엑손 2, 인트론 3, 엑손 3, 인트론 4, 엑손 4, 및 인트론 5의 81 염기쌍을 포함한다. 밑줄 친 영역은 각각 엑손 2, 3, 및 4의 위치를 나타낸다. 엑손 2를 표적으로 하는 CRISPR 가이드 2 및 3(표 20)은 각각 굵은 글씨로 표시되고 이중 밑줄이 쳐 있다.
도 29. 변형된 ANPEP 대립유전자를 검출하는 SCNT-유래 태아에 대한 예시적인 PCR 결과.
도 30. 변형된 ANPEP 대립유전자를 검출하는 접합체-주입된 태아에 대한 예시적인 PCR 결과.
도 31 및 32. 변형된 ANPEP 대립유전자를 검출하는 접합체 주입으로부터 태어난 살아있는 돼지에 대한 예시적인 PCR 결과.
도 33. TGEV 및 PEDV 접종(challenge) 연구에서 사용되는 동물에 존재하는 야생형 및 변형된 ANPEP 대립유전자의 개략적인 다이어그램.
도 34. 야생형 돼지(+/+), 2 개의 무효 ANPEP 대립유전자를 갖는 돼지(-/-), 또는 9 염기쌍(3 개 아미노산 결실, -/d9) 또는 12 염기쌍(4 개 아미노산, -/d12) 인프레임 결실을 갖는 대립유전자와 조합된 무효 ANPEP 대립유전자에서 회장의 ANPEP 염색에 대한 예시적인 면역조직화학 결과.
도 35. 성적 성숙기에 ANPEP에 대한 변형된 염색체 서열을 갖는 돼지 158-1의 사진.
도 36. PEDV에 노출 후 0, 7, 및 9 일에 측정된 야생형 돼지 및 ANPEP에서 녹아웃 또는 인프레임 결실을 갖는 돼지의 혈청 및 대변에서 PEDV 바이러스 수준을 측정하는 예시적인 PCR 결과.
도 37. PEDV에 처음 노출 후 9 일에 야생형 돼지 및 ANPEP에서 녹아웃(KO) 또는 인프레임 결실을 갖는 돼지에서 회장의 PEDV 항원 염색에 대한 예시적인 면역조직화학 결과.
도 38. TGEV에 노출 후 0, 3, 6, 및 7 일에 측정된 야생형 돼지 및 ANPEP에서 녹아웃 또는 인프레임 결실을 갖는 돼지의 대변에서 TGEV 바이러스 수준을 측정하는 예시적인 PCR 결과.
도 39. 바이러스에 처음 노출 후 9 일에 야생형 돼지 및 ANPEP에서 녹아웃(KO) 또는 인프레임 결실을 갖는 돼지에서 회장의 TGEV 항원 염색에 대한 예시적인 면역조직화학 결과.
도 40. 야생형 돼지 및 ANPEP에서 녹아웃 (KO) 또는 인프레임 결실을 갖는 돼지에서 TGEV-특이적 항체의 존재 또는 부재를 나타내는 예시적인 ELISA 검정 데이터.
도 41. ANPEP, CD163 및/또는 SIGLEC1에 대해 변형된 염색체 서열을 갖는 돼지를 교배함으로써 생성된 동물의 한 배 새끼에서 변형된 CD163 대립유전자(패널 A), ANPEP 대립유전자(패널 B) 및 SIGLEC1 대립유전자(패널 C)를 나타내는 예시적인 PCR 결과. ANPEP 변형은 생어(Sanger) 서열분석에 의해 패널 B로부터 확인되었다(패널 D).
도 42. ANPEP-/-(KO, 패널 A) 및 야생형(WT, 패널 B) 동물로부터 수득된 돼지 폐 폐포 세포의 예시적인 형광 현미경 이미지. 세포는 표시된 바와 같이, TGEV, PRCV, 및 PEDV로 감염시켰다. 핵은 프로피듐 요오다이드로 염색하였다(패널 A 및 B의 왼쪽 칼럼). 바이러스-감염된 세포는 FITC-표지된 코로나바이러스 항-N 단백질 항체를 사용하여 검출하였다(패널 A 및 B의 중간 칼럼). 병합된 이미지는 패널 A 및 B의 오른쪽 패널에 나타낸다.
본 발명은 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물 및 이의 자손에 관한 것이다. 본 발명은 또한 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 동물 세포에 관한 것이다. 동물 및 세포는 전염성 위장염 바이러스(TGEV) 및 돼지 호흡기 코로나바이러스(PRCV)를 포함하여 병원체에 대한 내성이 증가된다.
동물 및 세포는 ANPEP 유전자 활성을 비활성화하거나 또는 달리 조절하는 염색체 변형(예를 들어, 삽입, 결실, 또는 치환)을 갖는다. ANPEP는 TGEV가 세포로 진입하는 데 수반된다. 따라서, 비활성화된 ANPEP 유전자를 갖는 동물 또는 세포는 접종될 때 TGEV에 대한 내성을 나타낸다. 동물 및 세포는 유전적 편집의 사용을 포함하여 임의의 수의 프로토콜을 사용하여 생성될 수 있다.
아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 이외에도, 동물, 자손, 및 동물은 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및/또는 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함할 수 있다. 이러한 동물은 적절하게 추가의 병원체, 예를 들어, 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)에 대한 내성이 증가된다.
본원에 기재된 임의의 동물 집단이 또한 제공된다.
본 발명은 또한 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 도입하는 단계를 포함하는, 병원체-내성 비인간 동물 또는 비인간 동물의 계통을 생산하는 방법에 관한 것이다.
상기 방법은 세포의 염색체 표적 부위에 특이적으로 결합하고 이중 가닥 DNA 파괴를 유발하거나 또는 달리 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR)/Cas 시스템, 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN), 리콤비나제 융합 단백질, 또는 메가뉴클레아제와 같은 유전적 편집 방법을 사용하여 ANPEP 유전자 또는 그 안의 단백질의 활성을 비활성화시키거나 또는 감소시키는 제제를 동물 세포 또는 난모세포 또는 배아에 도입하는 단계를 포함할 수 있다.
또한 본원에는 ANPEP 유전자좌 내에서 특이적 핵산 서열의 절단 및/또는 통합을 시행할 수 있는 폴리펩티드와 함께 하나 이상의 특정 ANPEP 유전자좌의 사용이 기재된다. ANPEP 유전자좌의 절단 및/또는 통합을 시행할 수 있는 폴리펩티드 또는 RNA와 함께 ANPEP 유전자좌의 사용의 예는 징크 핑거 단백질, 메가뉴클레아제, TAL 도메인, TALEN, RNA-유도된 CRISPR/Cas 리콤비나제, 류신 지퍼, 및 당업자에게 알려진 다른 것으로 이루어진 군으로부터 선택된 폴리펩티드를 포함한다. 특정 예는 부위-특이적 DNA 결합 도메인 폴리펩티드 및 절단 도메인 폴리펩티드(예를 들어, 뉴클레아제)를 포함하는 키메라("융합") 단백질, 예컨대 징크-핑거 폴리펩티드 및 FokI 뉴클레아제 폴리펩티드를 포함하는 ZFN 단백질을 포함한다. 본원에는 ANPEP 유전자에 특이적으로 결합하는 DNA-결합 도메인을 포함하는 폴리펩티드가 기재된다. 이러한 폴리펩티드는 또한 폴리펩티드가 표적화된 이중 가닥 파괴를 유도하고/하거나, 파괴 부위에서 관심 핵산의 재조합을 용이하게 할 수 있도록 뉴클레아제(절단) 도메인 또는 절반-도메인(예를 들어, 변형된 DNA-결합 도메인을 갖는 호밍 엔도뉴클레아제를 포함하는 호밍 엔도뉴클레아제), 및/또는 리가제 도메인을 포함할 수 있다. ANPEP 유전자좌를 표적으로 하는 DNA-결합 도메인은 DNA-절단 기능적 도메인일 수 있다. 상기 폴리펩티드를 사용하여 하나 이상의 ANPEP 유전자좌에서 숙주 유기체(예를 들어, 동물 종)의 게놈에 외인성 핵산을 도입할 수 있다. DNA-결합 도메인은 하나 이상의 징크 핑거(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9 개 또는 그 이상의 징크 핑거)를 갖는 징크 핑거 단백질을 포함할 수 있으며, 이는 ANPEP 유전자 내에서 임의의 서열에 결합하도록 조작된다(비자연적으로 발생). 본원에 기재된 임의의 징크 핑거 단백질은 표적 유전자의 코딩 서열 내 또는 인접 서열(예를 들어, 프로모터 또는 다른 발현 요소) 내의 표적 부위에 결합할 수 있다. 징크 핑거 단백질은 ANPEP 유전자에서 표적 부위에 결합할 수 있다.
정의
본 발명의 요소 또는 이의 바람직한 구현예(들)를 도입할 때, 관사, 및 "상기"는 하나 이상의 요소가 있음을 의미하는 것으로 의도된다.
용어 "및/또는"은 항목 중 임의의 하나, 항목의 임의의 조합, 또는 이 용어가 관련된 모든 항목을 의미한다.
"결합 단백질"은 다른 분자에 결합할 수 있는 단백질이다. 결합 단백질은 예를 들어, DNA 분자(DNA-결합 단백질), RNA 분자(RNA-결합 단백질) 및/또는 단백질 분자(단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우, (동종이량체, 동종삼량체 등을 형성하기 위해) 자체 결합할 수 있고/있거나 상이한 단백질 또는 단백질들의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 하나 초과의 결합 활성 유형을 가질 수 있다. 예를 들어, 징크 핑거 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 갖는다.
용어 "포함하는", "포함한", 및 "갖는"은 포괄적인 것으로 의도되며 나열된 요소 이외의 추가 요소가 있을 있음을 의미한다.
용어 "CRISPR"은 "클러스터링된 규칙적 간격의 짧은 회문 반복부"를 의미한다. CRISPR 시스템은 I형, II형, 및 III형 CRISPR 시스템을 포함한다.
용어 "Cas"는 "CRISPR 관련 단백질을 지칭한다". Cas 단백질은 Cas9 패밀리 구성원 단백질, Cas6 패밀리 구성원 단백질(예를 들어, Csy4 및 Cas6), 및 Cas5 패밀리 구성원 단백질을 포함하나 이에 제한되지 않는다.
용어 "Cas9"는 일반적으로 야생형 Cas9 폴리펩티드(예를 들어, 에스. 피오게네스(S. pyogenes)로부터의 Cas9)에 대해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭한다. 예시적인 Cas9 서열은 미국 특허 공개 번호 제2016/0046963호의 서열번호 1-256 및 795-1346으로 제공된다. 미국 특허 공개 번호 제2016/0046963호의 서열번호 1-256 및 795-1346은 본원에 참조로 포함된다. "Cas9"는 야생형 Cas9 폴리펩티드(예를 들어, 에스. 피오게네스로부터)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있도록 지칭할 수 있다. "Cas9"는 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이의 임의의 조합과 같은 아미노산 변화를 포함할 수 있는 Cas9 단백질의 변형된 형태 또는 야생형을 지칭할 수 있다.
용어 "Cas5"는 일반적으로 야생형 예시적인 Cas5 폴리펩티드(예를 들어, 디. 불가리스(D. vulgaris)로부터 Cas5)에 대해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있도록 지칭할 수 있다. 예시적인 Cas5 서열은 미국 특허 공개 번호 제2016/0046963호의 도 42에 제공된다. 미국 특허 공개 번호 제2016/0046963호의 도 42는 본원에 참조로 포함된다. "Cas5"는 일반적으로 야생형 Cas5 폴리펩티드(예를 들어, 디. 불가리스로부터 Cas5)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있도록 지칭할 수 있다. "Cas5"는 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이의 임의의 조합과 같은 아미노산 변화를 포함할 수 있는 Cas5 단백질의 변형된 형태 또는 야생형을 지칭할 수 있다.
용어 "Cas6"은 야생형 예시적인 Cas6 폴리펩티드(예를 들어, 티. 써모필루스(T. thermophilus)로부터 Cas6)에 대해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있도록 지칭할 수 있다. 예시적인 Cas6 서열은 미국 특허 공개 번호 제2016/0046963호의 도 41에 제공된다. 미국 특허 공개 번호 제2016/0046963호의 도 41은 본원에 참조로 포함된다. "Cas6"은 일반적으로 야생형 Cas6 폴리펩티드(예를 들어, 티. 써모필루스로부터)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 폴리펩티드를 지칭할 수 있도록 지칭할 수 있다. "Cas6"은 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이의 임의의 조합과 같은 아미노산 변화를 포함할 수 있는 Cas6 단백질의 변형된 형태 또는 야생형을 지칭할 수 있다.
용어 "CRISPR/Cas9" 또는 "CRISPR/Cas9 시스템"은 Cas9 단백질, 또는 이의 유도체, 및 Cas9에 대한 CRISPR RNA(crRNA) 및 트랜스-활성화 RNA(tracrRNA)의 기능을 제공할 수 있는 하나 이상의 비코딩 RNA를 포함하는 유전적 조작을 위한 프로그램가능한 뉴클레아제 시스템을 지칭한다. crRNA 및 tracrRNA는 개별적으로 사용될 수 있거나 또는 조합되어 "가이드 RNA" (gRNA)를 생산할 수 있다. crRNA 또는 gRNA는 게놈 표적에 상보적인 서열을 제공한다.
"질환 내성"은 동물의 특성이며, 여기서 동물은 돼지 동물 및 TGEV, PRCV, 또는 PRRSV 사이의 상호작용과 같은 동물-병원체 상호작용의 결과인 질환 증상을 피한다. 즉, 병원체는 동물 질환 및 관련 질환 증상의 유발을 방지하거나, 또는 대안적으로, 임상 징후 발병률 및/또는 중증도의 감소 또는 임상 증상의 감소를 방지한다. 당업자는 본원에 개시된 조성물 및 방법이 병원체 공격으로부터 동물을 보호하기 위해 당업계에서 이용가능한 다른 조성물 및 방법과 함께 사용될 수 있음을 이해할 것이다.
명시된 핵산과 관련하여, "암호화하는" 또는 "암호화된"이란 명시된 단백질로 번역하기 위한 정보를 포함함을 의미한다. 단백질을 암호화하는 핵산은 핵산의 번역된 영역 내에 개재 서열(예를 들어, 인트론)을 포함할 수 있거나, 또는 (예를 들어, cDNA에서와 같이) 이러한 개재 비번역 서열이 결여될 수 있다. 단백질이 암호화되는 정보는 코돈의 사용으로 명시된다. 전형적으로, 아미노산 서열은 "보편적인" 유전 코드를 사용하여 핵산에 의해 암호화된다. 핵산이 합성적으로 제조되거나 또는 변경될 때, 이점은 핵산이 발현되는 것으로 의도된 숙주의 알려진 코돈 선호도를 취할 수 있다.
본원에 사용된 바와 같이, "유전적 편집", "유전적 편집된", "유전적으로 편집된" 및 "유전적 편집 이펙터"는 "분자 가위", "호밍 엔도뉴클레아제", 또는 "표적화 엔도뉴클레아제"로도 지칭되는 자연적으로 발생하거나 또는 인공적으로 조작된 뉴클레아제와 함께 호밍 기술의 사용을 지칭한다. 뉴클레아제는 게놈의 원하는 위치에서 특이적 이중가닥 염색체 파괴(DSB)를 생성하며, 일부 경우에 세포의 내인성 메커니즘을 활용하여 상동 재조합(HR) 및/또는 비상동 말단-연결(NHEJ)의 자연적인 과정에 의해 유도된 파괴를 복구한다. 유전적 편집 이펙터는 징크 핑거 뉴클레아제(ZFN), 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템(예를 들어, CRISPR/Cas9 시스템), 및 메가뉴클레아제(예를 들어, 호밍 엔도뉴클레아제로서 재조작된 메가뉴클레아제)를 포함한다. 상기 용어는 또한 예를 들어, 변화가 결실이거나 또는 상대적으로 작은 삽입(전형적으로 20nt 미만)이고/이거나 외래 종으로부터 DNA를 도입하지 않는 경우를 포함하여, 유전자삽입 절차 및 기술의 사용을 포함한다. 상기 용어는 또한 초기 유전적 편집된 동물로부터 성적 교배 또는 무성 번식에 의해 생성된 것들과 같은 자손 동물을 포함한다.
용어 "게놈 조작", "유전적 조작", "유전적으로 조작된", "유전적으로 변경된", "유전적 변경", "게놈 변형", "게놈 변형", 및 "게놈적으로 변형된"은 특이적 핵산 서열을 결실, 삽입, 돌연변이, 또는 치환에 의해 게놈을 변경하는 것을 지칭할 수 있다. 변경은 유전자 또는 위치 특이적일 수 있다. 게놈 조작은 뉴클레아제를 사용하여 핵산을 절단시켜 변경 부위를 생성할 수 있다. 비게놈 핵산의 조작이 또한 고려된다. 뉴클레아제 도메인을 함유하는 단백질은 핵산-표적화 핵산과 복합체를 형성함으로써 표적 핵산에 결합하고 절단할 수 있다. 일 예에서, 절단은 표적 핵산에서 이중 가닥 파괴를 도입할 수 있다. 핵산은 예를 들어 내인성 비상동 말단 연결(NHEJ) 절차에 의해 복구될 수 있다. 추가 예에서, 핵산 조각이 삽입될 수 있다. 핵산-표적화 핵산 및 부위 지정 폴리펩티드의 변형은 게놈 조작에 사용될 새로운 기능을 도입할 수 있다.
본원에 사용된 바와 같은 "호밍 DNA 기술", "호밍 기술" 및 "호밍 엔도뉴클레아제"는 명시된 분자가 징크 핑거(ZF) 단백질, 전사 활성인자-유사 이펙터(TALE) 메가뉴클레아제, 및 CRISPR 시스템(예를 들어, CRISPR/Cas9 시스템)을 포함하는 명시된 DNA 서열에 표적화되도록 하는 임의의 메커니즘을 포함한다.
본원에서 용어 "내성 증가" 및 "감수성 감소"는 병원체의 감염과 관련된 임상 징후 또는 임상 증상의 발병률 및/또는 중증도의 통계적으로 유의한 감소를 의미하나 이에 제한되지 않는다. 예를 들어, "내성 증가" 또는 "감수성 감소"는 비변형된 염색체 서열을 갖는 대조군 동물과 비교하여 CD163 유전자 단백질에서 변형된 염색체 서열을 포함하는 동물의 TGEV, PRCV, 또는 PRRSV에 의한 감염과 관련된 임상 징후 또는 임상 증상의 발병률 및/또는 중증도의 통계적으로 유의한 감소를 지칭할 수 있다. 용어 "임상 증상의 통계적으로 유의한 감소"는 대상체의 변형된 그룹에서 적어도 하나의 임상 증상의 발병률 빈도가 감염제로 접종 후 비변형된 대조군 그룹에서보다 적어도 10%, 바람직하게는 적어도 20%, 보다 바람직하게는 적어도 30%, 보다 더 바람직하게는 적어도 50%, 및 보다 더 바람직하게는 적어도 70% 더 낮음을 의미하나 이에 제한되지는 않는다.
"녹아웃(Knock-out)"은 유전자의 구조 또는 조절 메커니즘의 파괴를 의미한다. 녹아웃은 표적화 벡터, 대체 벡터, 또는 기습적인 벡터의 상동 재조합 또는 완전, 부분 또는 조건부 유전자 기능 손실을 초래하는 유전자 포획 벡터의 무작위 삽입을 통해 생성될 수 있다.
용어 "가축 동물"은 전통적으로 가축 농장에서 사육된 임의의 동물, 예를 들어 유제류(예를 들어, 소목), 조류 동물 (예를 들어, 닭, 칠면조, 오리, 거위, 뿔닭, 또는 새끼 새), 말과 동물(예를 들어, 말 또는 당나귀)을 포함한다. 소목은 돼지 동물(예를 들어, 돼지), 소 동물(예를 들어, 젖소 소고기), 양 동물, 염소 동물, 물소, 낙타, 라마, 알파카, 및 사슴을 포함하나 이에 제한되지 않는다. 용어 "가축 동물"은 래트, 마우스, 또는 다른 설치류를 포함하지 않는다.
본원에 사용된 바와 같이, 용어 "돌연변이"는 야생형 서열과 비교하여, 예를 들어 유전자 또는 코딩 DNA 서열(CDS)과 같은 폴리뉴클레오티드의 뉴클레오티드 서열의 변경을 포함한다. 상기 용어는 제한 없이, 치환, 삽입, 프레임시프트, 결실, 반전, 전위, 복제, 스플라이스-공여체 부위 돌연변이, 점-돌연변이 등을 포함한다.
본원에서, "임상 징후의 발병률 및/또는 중증도의 감소" 또는 "임상 증상의 감소"는 그룹에서 감염된 대상체 수의 감소, 감염의 임상 징후를 나타내는 대상체 수의 감소 또는 제거, 또는 야생형 감염과 비교하여, 하나 이상의 대상체에 존재하는 임의의 임상 징후의 중증도 감소를 의미하나 이에 제한되지 않는다. 예를 들어, 이들 용어는 감염의 임의의 임상 징후, 폐 병리학, 바이러스 혈증, 항체 생산, 병원체 부하 감소, 병원체 발산, 병원체 전파 감소, 또는 TGEV, PRCV, 또는 PRRSV의 증상을 보이는 임의의 임상 징후 감소를 포함한다. 바람직하게는 이들 임상 징후는 CD163 유전자에서 변형이 없고 감염된 대상체와 비교하여 본 발명의 하나 이상의 동물에서 적어도 10% 감소된다. 보다 바람직하게는 임상 징후는 본 발명의 대상체에서 적어도 20%, 바람직하게는 적어도 30%, 보다 바람직하게는 적어도 40%, 및 보다 더 바람직하게는 적어도 50% 감소된다.
본원에서 뉴클레오티드 x에서 뉴클레오티드 y까지 뉴클레오티드 서열에서 결실에 대한 언급은 x 및 y를 포함하여 범위 내 모든 뉴클레오티드가 결실되었음을 의미한다. 따라서, 예를 들어, 어구 "서열번호: 135와 비교하여 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실"은 뉴클레오티드 1,397 및 1,578을 포함하여 뉴클레오티드 1,397 내지 1,578 각각이 결실되었음을 의미한다.
질환에 대한 동물의 "내성"은 동물의 특성이며, 여기서 동물은 돼지 동물 및 TGEV, PRCV, 또는 PRRSV 사이의 상호작용과 같은 동물-병원체 상호작용의 결과인 질환 증상을 피한다. 즉, 병원체는 동물 질환 및 관련 질환 증상의 유발을 방지하거나, 또는 대안적으로, 임상 징후의 발병률 및/또는 중증도 감소 또는 임상 증상의 감소를 방지한다. 당업자는 본원에 개시된 방법이 병원체 공격으로부터 동물을 보호하기 위해 당업계에서 이용가능한 다른 조성물 및 방법과 함께 사용될 수 있음을 이해할 것이다.
"TALE DNA 결합 도메인" 또는 "TALE"는 하나 이상의 TALE 반복 도메인/유닛을 포함하는 폴리펩티드이다. 반복 도메인은 TALE을 이의 동계 표적 DNA 서열에 결합하는 데 수반된다. 단일 "반복 유닛"(또한 "반복부"로도 지칭됨)은 전형적으로 33-35 개 아미노산 길이이며 자연적으로 발생하는 TALE 단백질 내에서 다른 TALE 반복 서열과 적어도 일부 서열 상동성을 나타낸다. 징크 핑거 및 TALE 결합 도메인은 예를 들어 자연적으로 발생하는 징크 핑거 또는 TALE 단백질의 인식 나선 영역의 조작(하나 이상의 아미노산의 변경)을 통해 미리 결정된 뉴클레오티드 서열에 결합하도록 "조작될" 수 있다. 따라서, 조작된 DNA 결합 단백질(징크 핑거 또는 TALE)은 자연적으로 발생하지 않는 단백질이다. DNA-결합 단백질을 조작하는 방법의 비제한적인 예는 설계 및 선택이다. 설계된 DNA 결합 단백질은 설계/조성이 주로 합리적인 기준에서 비롯된 자연에서 발생하지 않는 단백질이다. 설계에 대한 합리적인 기준은 치환 규칙 및 기존 ZFP 및/또는 TALE 설계 및 결합 데이터의 정보를 저장하는 데이터베이스에서 정보를 처리하는 컴퓨터 알고리즘의 적용을 포함한다. 예를 들어, 미국 특허 번호 제6,140,081호; 제6,453,242호; 및 제6,534,261호 참조; 또한 WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496 및 미국 특허 번호 제20110301073호 참조.
"징크 핑거 DNA 결합 단백질"(또는 결합 도메인)은 아연 이온의 배위를 통해 안정화된 구조를 갖는 결합 도메인 내에서 아미노산 서열 영역인 하나 이상의 징크 핑거를 통해 서열-특이적 방식으로 DNA에 결합하는 단백질, 또는 더 큰 단백질 내의 도메인이다. 용어 징크 핑거 DNA 결합 단백질은 종종 징크 핑거 단백질 또는 ZFP로 축약된다.
"선택된" 징크 핑거 단백질 또는 TALE는 주로 파지 디스플레이, 상호작용 포획 또는 하이브리드 선택과 같은 경험적 과정에서 비롯되어 생산되는 자연에서 발견되지 않는 단백질이다. 예를 들어, 미국 특허 번호 제5,789,538호; 미국 특허 번호 제5,925,523호; 미국 특허 번호 제6,007,988호; 미국 특허 번호 제6,013,453호; 미국 특허 번호 제6,200,759호; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197, WO 02/099084 및 미국 공개 번호 제20110301073호 참조.
다양한 다른 용어가 이하에 정의된다.
ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 갖는 동물 및 세포
본원에는 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열, 예를 들어, 병원체(예를 들어, 전염성 위장염 바이러스(TGEV) 또는 돼지 호흡기 코로나바이러스(PRCV))에 의한 감염에 대한 개선된 또는 완전한 내성을 부여하는 삽입 또는 결실("INDEL")을 포함하는 가축 동물 및 이의 자손 및 동물 세포가 기재된다.
전장 돼지 ANPEP 유전자(서열번호: 132)는 거의 30,000 염기쌍 길이이며 적어도 3 개의 스플라이스 변이체를 갖는다. 스플라이스 변이체에 따라, 돼지 ANPEP 유전자는 20 또는 21 개 엑손을 함유한다. 그러나, 3 개의 스플라이스 변이체는 본원에 기재된 대부분의 유전적으로 편집된 동물을 만들기 위해 표적화된 영역인 엑손 2에 걸쳐 사실상 동일하다. 참조의 용이성을 위해, 엑손 2의 코딩 영역, 개시 코돈 앞의 1000 개 뉴클레오티드, 및 엑손 2의 끝 뒤의 1000 개 뉴클레오티드를 포함하는 참조 서열이 제공된다(서열번호: 135). 개시 코돈은 엑손 2 내에서 발생하므로, 참조 서열 서열번호: 135는 인트론 2의 마지막 773 염기쌍, 엑손 2, 인트론 3, 엑손 3, 인트론 4, 엑손 4, 및 인트론 5의 81 염기쌍을 함유한다. 참조 서열 서열번호: 135의 주석이 달린 버전은 도 28에 제공된다. 도 28에서, 엑손 2, 3, 및 4의 위치는 밑줄 친 텍스트로 표시되고 개시 코돈은 굵은 소문자 텍스트("atg")로 표시된다.
스플라이스 변이체 X2 및 X3에 의해 암호화된 전장 야생형 돼지 ANPEP 단백질(963 개 아미노산; 서열번호: 134) 및 스플라이스 변이체 X1에 의해 암호화된 전장 야생형 돼지 ANPEP 단백질(1017 개 아미노산; 서열번호: 133)에 대한 아미노산 서열과 같이, 전장 야생형 돼지 ANPEP에 대한 뉴클레오티드 서열(서열번호: 132)이 또한 제공된다. 스플라이스 변이체 X2 및 X3은 동일한 아미노산 서열을 생산한다.
표 1은 3 개의 스플라이스 변이체 각각에 대해 서열번호: 132에서 엑손의 위치를 제공한다.
표 1: ANPEP 엑손
Figure pct00001
아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물 및 이의 자손이 제공된다.
ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 동물 세포가 또한 제공된다.
변형된 염색체 서열은 TGEV 및/또는 PRCV 감염과 관련된 ANPEP 단백질 기능이 손상되거나, 감소되거나, 또는 제거되도록 변경된 서열일 수 있다. 따라서, 본원에 기재된 동물 및 세포는 "녹아웃" 동물 또는 세포로 지칭될 수 있다.
ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 병원체 감염에 대한 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물, 자손, 또는 세포의 감수성과 비교하여, 병원체 감염에 대한 가축 동물, 자손, 또는 세포의 감수성을 감소시킨다.
변형은 바람직하게는 병원체에 대한 동물, 자손, 또는 세포의 감수성을 실질적으로 제거한다. 변형은 보다 바람직하게는 동물이 병원체에 노출 후 질환의 임의의 임상 징후를 나타내지 않도록 병원체에 대한 동물, 자손, 또는 세포의 감수성을 완전히 제거한다.
예를 들어, 동물이 돼지 동물이고 병원체가 TGEV인 경우, 변형이 있는 돼지 동물은 TGEV에 노출 후 TGEV 감염에 대한 임의의 임상 징후(예를 들어, 구토, 설사, 탈수, 과도한 갈증)를 나타내지 않는다. 게다가, 변형이 있는 돼지 동물에서, TGEV 핵산은 대변 또는 혈청에서 겸출될 수 없고, TGEV 항원은 회장에서 검출될 수 없고, 혈청은 TGEV-특이적 항체에 대해 음성이다.
유사하게, 병원체에 노출된 변형이 있는 세포는 병원체로 감염되지 않는다.
병원체는 바이러스를 포함할 수 있다. 예를 들어, 병원체는 코로나비리다에 패밀리 바이러스, 예를 들어, 코로나비리나에(Coronavirinae) 서브패밀리 바이러스를 포함할 수 있다.
바이러스는 바람직하게는 코로나바이러스(예를 들어, 알파코로나바이러스 속 바이러스)를 포함한다.
바이러스가 알파코로나바이러스 속 바이러스를 포함하는 경우, 알파코로나바이러스 속 바이러스는 바람직하게는 전염성 위장염 바이러스(TGEV)를 포함한다.
예를 들어, 전염성 위장염 바이러스는 TGEV 퍼듀(Purdue) 균주를 포함할 수 있다.
대안적으로 또는 추가로, 바이러스는 돼지 호흡기 코로나바이러스(PRCV)를 포함할 수 있다.
가축 동물 또는 자손은 유제류, 조류 동물, 또는 말과 동물을 포함할 수 있다. 세포는 유제류, 조류 동물, 또는 말과 동물로부터 유래될 수 있다.
동물 또는 자손이 조류 동물이거나 또는 세포가 조류 동물로부터 유래된 세포인 경우, 조류 동물은 닭, 칠면조, 오리, 거위, 뿔닭, 또는 새끼 새를 포함할 수 있다.
동물 또는 자손이 말과 동물이거나 또는 세포가 말과 동물로부터 유래된 세포인 경우, 말과 동물은 말 또는 당나귀를 포함할 수 있다.
동물 또는 자손이 유제류이거나 또는 세포가 유제류로부터 유래된 세포인 경우, 유제류는 소목을 포함할 수 있다. 예를 들어, 소목은 돼지 동물(예를 들어, 돼지), 소 동물(예를 들어, 육우 또는 젖소), 양 동물, 염소 동물, 물소, 낙타, 라마, 알파카, 또는 사슴을 포함할 수 있다.
동물 또는 자손은 바람직하게는 돼지 동물을 포함한다. 세포는 바람직하게는 돼지 동물로부터 유래된 세포를 포함한다.
동물 또는 자손은 배아, 발육기(juvenile), 또는 성체일 수 있다.
유사하게, 세포는 배아 세포, 발육기 동물로부터 유래된 세포, 또는 성체 동물로부터 유래된 세포를 포함할 수 있다.
예를 들어, 세포는 배아 세포를 포함할 수 있다.
세포는 발육기 동물로부터 유래된 세포를 포함할 수 있다.
동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합일 수 있다.
동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합일 수 있다.
ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 삽입, ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 결실, ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함할 수 있다.
예를 들어, 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함할 수 있다.
결실은 인프레임 결실을 포함할 수 있다.
변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 삽입을 포함할 수 있다.
삽입, 결실, 치환, 또는 이의 임의의 조합은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래할 수 있다.
삽입, 결실, 치환, 또는 이의 임의의 조합이 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래하는 경우, 암호화 오류는 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 조기 정지 코돈을 초래할 수 있다.
변형된 염색체 서열이 결실을 포함하는 경우, 결실은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 개시 코돈의 결실을 포함할 수 있다. 개시 코돈이 결실되는 경우, ANPEP 단백질은 생성되지 않는다.
변형된 염색체 서열이 결실을 포함하는 경우, 결실은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 전체 코딩 서열의 결실을 포함할 수 있다.
변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 치환을 포함할 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 바람직하게는 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성을 감소시킨다.
바람직하게는, ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 동물, 자손 또는 세포에 의해 실질적으로 ANPEP 단백질을 생산하지 않는다. "실질적으로 기능적 ANPEP 단백질이 없는"이란 동물, 자손, 또는 세포에서 기능적 ANPEP 단백질 수준이 검출가능하지 않거나, 또는 검출가능한 경우, 변형된 염색체 서열을 포함하지 않는 동물, 자손, 또는 세포에서 관찰된 수준보다 적어도 약 90% 더 낮고, 바람직하게는 적어도 약 95% 더 낮고, 보다 바람직하게는 적어도 약 98%, 더 낮고, 보다 더 바람직하게는 적어도 약 99% 더 낮음을 의미한다.
본원에 기재된 임의의 동물, 자손, 또는 세포의 경우, 동물, 자손, 또는 세포는 바람직하게는 ANPEP 단백질을 생산하지 않는다.
임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2; ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 4; ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2 또는 엑손 4와 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함한다.
변형된 염색체 서열은 적절하게 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 변형, ANPEP 단백질을 암호화하는 유전자의 대립유전자의 인트론 1에서 변형, 또는 이의 조합을 포함한다.
일 예로서, 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 인트론 1에서 시작하고 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 끝나는 결실을 포함할 수 있다.
변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2 에서 삽입 또는 결실을 포함할 수 있다. 예를 들어, ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2 에서 삽입 또는 결실은 개시 코돈의 하류에 있을 수 있다.
변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 결실을 포함할 수 있다.
변형된 염색체 서열이 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 결실을 포함하는 경우, 결실은 엑손 2에서 인프레임 결실을 포함할 수 있다.
예를 들어, ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 인프레임 결실은 ANPEP 단백질의 아미노산 194 내지 196의 결실을 초래할 수 있다.
대안적으로, ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 인프레임 결실은 ANPEP 단백질의 아미노산 194 내지 197의 결실을 초래할 수 있다. 인프레임 결실은 ANPEP 단백질의 위치 198에서 발린 잔기를 또 다른 아미노산, 예를 들어, 이소류신 잔기로 치환을 추가로 초래할 수 있다.
변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2 에서 삽입을 포함할 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함할 수 있다: 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,397에서 시작하는 5 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,574에서 뉴클레오티드 1,582까지 9 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,577에서 뉴클레오티드 1,585까지 9 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 819에서 뉴클레오티드 1,685까지 867 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 882에서 뉴클레오티드 1,688까지 867 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580 및 1,581 사이에 1 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,579 및 1,580 사이에 1 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,321에서 뉴클레오티드 1,587까지 267 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,323에서 뉴클레오티드 1,589까지 267 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,561에서 뉴클레오티드 1,585까지 25 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,560에서 뉴클레오티드 1,584까지 25 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,575에서 뉴클레오티드 1,582까지 8 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,574에서 뉴클레오티드 1,581까지 8 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨; 및 이의 임의의 조합.
예를 들어, 임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함할 수 있다: 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실; 및 이의 임의의 조합.
임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함할 수 있다: 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입; 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실; 및 이의 임의의 조합.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 1,397에서 시작하는 5 염기쌍 삽입으로 대체된다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실을 포함하는 경우, 여기서 결실된 서열은 뉴클레오티드 1,397에서 시작하는 5 염기쌍 삽입으로 대체되며, 5 염기쌍 삽입은 서열 CCCTC(서열번호: 169)를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,574에서 뉴클레오티드 1,582까지 9 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,577에서 뉴클레오티드 1,585까지 9 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 819에서 뉴클레오티드 1,685까지 867 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 882에서 뉴클레오티드 1,688까지 867 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함하는 경우, 삽입은 단일 티민(T) 잔기를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580 및 1,581 사이에 1 염기쌍 삽입을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580 및 1,581 사이에 1 염기쌍 삽입을 포함하는 경우, 삽입은 단일 티민(T) 잔기 또는 단일 아데닌(A) 잔기를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,579 및 1,580 사이에 1 염기쌍 삽입을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,579 및 1,580 사이에 1 염기쌍 삽입을 포함하는 경우, 삽입은 단일 아데닌(A) 잔기를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입을 포함하는 경우, 2 염기쌍 삽입은 AT 디뉴클레오티드를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,321에서 뉴클레오티드 1,587까지 267 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,323에서 뉴클레오티드 1,589까지 267 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,561에서 뉴클레오티드 1,585까지 25 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,560에서 뉴클레오티드 1,584까지 25 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,575에서 뉴클레오티드 1,582까지 8 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,574에서 뉴클레오티드 1,581까지 8 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체된다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실을 포함하는 경우, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체되며, 8 염기쌍 삽입은 서열 GGGGCTTA(서열번호: 179)를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체된다.
변형된 염색체 서열이 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실을 포함하는 경우, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체되며, 4 염기쌍 삽입은 서열 TCGT(서열번호: 180)를 포함할 수 있다.
동물, 자손, 또는 세포에서 ANPEP 유전자는 본원에 기재된 임의의 변형된 염색체 서열의 임의의 조합을 포함할 수 있다.
예를 들어, 동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체되고; ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입을 포함할 수 있다.
동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체되고; ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함할 수 있다.
동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체되고; ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체되고; ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입을 포함할 수 있다.
동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체되고; ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실을 포함할 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,422를 포함하는 영역 내에서 변형을 포함한다.
예를 들어, 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,016을 포함하는 영역 내에서 변형을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,446 내지 21,537을 포함하는 영역 내에서 변형을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479 내지 21,529를 포함하는 영역 내에서 변형을 포함할 수 있다.
예를 들어, 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479에서 뉴클레오티드 21,529까지 51 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479 내지 21,523을 포함하는 영역 내에서 변형을 포함할 수 있다.
예를 들어, 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479에서 뉴클레오티드 21,523까지 45 염기쌍 결실을 포함할 수 있다.
추가 예로서, 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,509에서 뉴클레오티드 21,511까지 3 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,538 내지 22,422를 포함하는 영역 내에서 변형을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 22,017 내지 22,422를 포함하는 영역 내에서 변형을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 22,054 내지 22,256을 포함하는 영역 내에서 변형을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 22,054 내지 22,126을 포함하는 영역 내에서 변형을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,422를 포함하는 영역 내에서 어디서든 변형을 포함하는 경우, 변형된 염색체 서열은 삽입 또는 결실을 포함할 수 있다.
예를 들어, 변형된 염색체 서열은 결실을 포함할 수 있다. 결실은 인프레임 결실을 임의적으로 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,422를 포함하는 영역 내에서 어디서든 변형을 포함하는 경우, 변형된 염색체 서열은 치환을 포함할 수 있다.
예를 들어, 치환은 상이한 아미노산을 암호화하는 코돈을 생성하기 위해 서열번호: 132의 뉴클레오티드 21,509 내지 21,511에서 ACC 코돈의 하나 이상의 뉴클레오티드를 상이한 뉴클레오티드로 치환하는 것을 포함할 수 있다.
치환이 상이한 아미노산을 암호화하는 코돈을 생성하기 위해 서열번호: 132의 뉴클레오티드 21,509 내지 21,511에서 ACC 코돈의 하나 이상의 뉴클레오티드를 상이한 뉴클레오티드로 치환하는 것을 포함하는 경우, 하나 이상의 뉴클레오티드의 치환은 서열번호: 134의 아미노산 738에서 트레오닌(T) 또는 서열번호: 133에서 아미노산 792의 트레오닌(T)을 글리신(G), 알라닌(A), 시스테인(C), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 프롤린(P), 페닐알라닌(F), 티로신(Y), 트립토판(W), 아스파르트산(D), 글루탐산(E), 아스파라긴(N), 글루타민(Q), 히스티딘(H), 리신(K), 또는 아르기닌(R) 잔기로 대체할 수 있다.
예를 들어, 치환은 서열번호: 134의 아미노산 738에서 트레오닌(T) 또는 서열번호: 133의 아미노산 792에서 트레오닌(T)을 글리신(G), 알라닌(A), 시스테인(C), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 프롤린(P), 페닐알라닌(F), 트립토판(W), 아스파라긴(N), 글루타민(Q), 히스티딘(H), 리신(K), 또는 아르기닌(R) 잔기로 대체한다.
치환은 적절하게 서열번호: 134의 아미노산 738에서 트레오닌(T) 또는 서열번호: 133의 아미노산 792에서 트레오닌(T)를 발린(V) 또는 아르기닌(R) 잔기로 대체한다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 인트론-엑손 스플라이스 영역을 분열시킬 수 있다. 인트론-엑손 스플라이스 영역의 분열은 인트론-엑손 스플라이스 영역의 하류, 뿐만 아니라 생성된 mRNA에서 추가 하류 엑손 스플라이싱의 결여로 인해 엑손 스키핑 또는 인트론 포함을 초래할 수 있다.
인트론-엑손 스플라이스 영역을 분열시키기 위해, 스플라이싱에 필요한 임의의 뉴클레오티드가 변경될 수 있다. 예를 들어, 대부분의 인트론은 서열 "AG"에서 끝난다. 이 서열에서 구아닌(G) 잔기가 상이한 염기로 대체되는 경우, 스플라이스는 이 부위에서 발생하지 않고 대신에 다음 하류 AG 디뉴클레오티드에서 발생할 것이다.
인트론-엑손 스플라이스 영역은 또한 인트론의 시작에서 서열을 변형시킴으로써 분열될 수 있다. 대부분의 인트론은 공통 서열 RRGTRRRY(서열번호: 186)로 시작하며, 여기서 "R"은 임의의 퓨린이고 "Y"는 임의의 피리미딘이다. 이 서열에서 구아닌(G) 잔기가 변형되는 경우 및/또는 2 개 이상의 다른 염기가 변형되는 경우, 인트론은 비기능적이게 제공될 수 있으며 스플라이스되지 않을 것이다.
인트론-엑손 스플라이스 영역은 또한 당업계에 알려진 임의의 다른 방법에 의해 분열될 수 있다.
본원에 기재된 ANPEP 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열은 결실, 삽입 또는 치환으로 이루어질 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 80% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 85% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 90% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 95% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 98% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 99% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 적어도 99.9% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135에 대해 100% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 80% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 85% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 90% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 95% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 98% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 99% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 적어도 99.9% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 132에 대해 100% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
임의의 동물, 자손, 또는 세포는 서열번호: 163, 164, 165, 166, 167, 168, 170, 171, 172, 173, 174, 176, 177, 또는 178을 포함하는 염색체 서열을 포함할 수 있다.
예를 들어, 임의의 동물, 자손, 또는 세포는 서열번호: 177, 178, 166, 167, 170, 172, 또는 171을 포함하는 염색체 서열을 포함할 수 있다.
임의의 동물, 자손, 또는 세포는 서열번호: 177, 178, 166, 167, 또는 171을 포함하는 염색체 서열을 포함할 수 있다.
ANPEP를 암호화하는 유전자에서 변형된 염색체 서열을 갖고 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 추가로 포함하는 동물 및 세포
ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 임의의 가축 동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함할 수 있다.
CD163은 17 엑손을 가지며 단백질은 9 개 스캐빈저 수용체 시스테인-풍부(SRCR) 도메인, 막관통 세그먼트, 및 짧은 세포질 꼬리를 갖는 세포외 영역으로 구성된다. 여러 상이한 변이체는 단일 유전자의 차등 스플라이싱으로 인해 발생한다(Ritter et al. 1999a; Ritter et al. 1999b). 이 변이의 대부분은 세포질 꼬리의 길이에 의해 설명된다.
CD163은 합토글로빈-헤모글로빈 스캐빈저 수용체로서 작용하는 것을 포함하여 다수의 중요한 기능을 갖는다. 혈액에서 유리 헤모글로빈의 제거는 헴 기가 매우 독성일 수 있으므로 CD163의 중요한 기능이다(Kristiansen et al. 2001). CD163은 세포내 이입을 용이하게 하는 세포질 꼬리를 갖는다. 이 꼬리의 돌연변이는 합토글로빈-헤모글로빈 복합체 흡수를 감소시킨다(Nielsen et al. 2006). C163의 다른 기능은 적혈모세포 부착(SRCR2), TWEAK 수용체(SRCR1-4 & 6-9), 박테리아 수용체(SRCR5), 아프리카 돼지 바이러스 수용체(Sanchez-Torres et al. 2003), 및 면역-조절제로서 잠재적인 역할(Van Gorp et al. 2010에 논의됨)을 포함한다.
CD163은 스캐빈저 수용체 시스테인-풍부(SRCR) 슈퍼패밀리의 구성원이며 세포내 도메인 및 9 개 세포외 SRCR 도메인을 갖는다. 인간에서, SRCR3을 통한 CD163 매개된 헤모글로빈-헴 흡수의 세포내 이입은 산화 스트레스로부터 세포를 보호한다(Schaer et al., 2006a; Schaer et al., 2006b; Schaer et al., 2006c). CD163은 또한 세포자멸사의 종양 괴사 인자-유사 약한 유도제에 대한 수용체(TWEAK: SRCR1-4 & 6-9), 병원체 수용체(아프리카 돼지 열병 바이러스; 박테리아: SRCR2), 및 적혈모세포 결합(SRCR2)으로 역할을 한다.
CD163은 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV) 뿐만 아니라 많은 다른 병원체 감염에서 역할을 한다. 따라서, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 갖는 동물, 자손, 및 세포는 PRRSV 감염에 대한 감수성이 감소될 수 있을 뿐만 아니라, 세포에 진입하기 위해 또는 세포에서 나중에 복제 및/또는 지속성을 위해 CD163에 의존하는 다른 병원체 감염에 대한 감수성이 감소될 수 있다. PRRSV의 감염 과정은 폐포 대식세포의 표면 상의 헤파란 술페이트에 초기 결합하여 시작한다. 그 다음에 바이러스는 클라테린-매개된 세포내 이입을 통해 내재화된다. 그 다음에 또 다른 분자인 CD163은 엔도솜에서 바이러스의 외피제거를 용이하게 한다(Van Breedam et al. 2010). 바이러스 게놈이 방출되고 세포가 감염된다.
본원에는 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열, 예를 들어, 동물에 대한 병원체(예를 들어, PRRSV)에 의한 감염에 대해 개선된 또는 완전한 내성을 부여하는 삽입 또는 결실("INDEL")을 포함하는 동물 및 이의 자손 및 세포가 기재된다. 본 출원은 CD163이 PRRSV 감염에서 중요한 유전자이며 원조 내성 동물 및 계통을 생산하였음을 입증하였다(예를 들어, PCT 공개 번호 WO 2017/023570 및 미국 특허 출원 공개 번호 제2017/0035035호 참조, 이의 내용은 그 전문이 본원에 참조로 포함됨).
따라서, 동물, 자손, 또는 세포가 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열 및 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 둘 다 포함하는 경우, 동물, 자손, 또는 세포는 다중 병원체에 대한 감염에 내성일 것이다. 예를 들어, 동물 또는 자손이 돼지 동물이거나 또는 세포가 돼지 세포인 경우, 동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열로 인해 TGEV에 의한 감염에 내성일 것이고 또한 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열로 인해 PRRSV에 의한 감염에 내성일 것이다.
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 병원체 감염에 대한 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물, 자손, 또는 세포의 감수성과 비교하여, 병원체(예를 들어, 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)와 같은 바이러스)에 의한 감염에 대한 동물, 자손, 또는 세포의 감수성이 감소된다.
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 바람직하게는 병원체에 대한 동물, 자손, 또는 세포의 감수성을 실질적으로 제거한다. 변형은 보다 바람직하게는 동물이 병원체에 노출 후 질환의 임의의 임상 징후를 나타내지 않도록병원체에 대한 동물, 자손, 또는 세포의 감수성을 완전히 제거한다.
예를 들어, 동물이 돼지 동물이고 병원체가 PRRSV인 경우, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 갖는 돼지 동물은 PRRSV에 노출 후 PRRSV 감염의 임의의 임상 징후(예를 들어, 호흡 곤란, 식욕부진, 무기력, 발열, 만기 임신 동안 생식 장애)를 나타내지 않는다. 게다가, 변형을 갖는 돼지 동물에서, PRRSV 핵산은 혈청에서 검출되지 않을 수 있고 PRRSV-특이적 항체를 생산하지 않는다.
병원체는 바이러스를 포함할 수 있다.
바이러스는 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)를 포함할 수 있다.
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 1형 PRRSV 바이러스, 2형 PRRSV, 또는 1형 및 2형 PRRSV 바이러스 둘 다에 대한 동물, 자손, 또는 세포의 감수성을 감소시킬 수 있다.
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 NVSL 97-7895, KS06-72109, P129, VR2332, CO90, AZ25, MLV-ResPRRS, KS62-06274, KS483(SD23983), CO84, SD13-15, 렐리스타트(Lelystad), 03-1059, 03-1060, SD01-08, 4353PZ, 및 이의 임의의 조합으로 이루어진 군으로부터 선택된 PRRSV 단리물에 대한 동물, 자손, 또는 세포의 감수성을 감소시킬 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합일 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합일 수 있다.
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 임의의 동물, 자손, 또는 세포에서, 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 삽입, CD163 단백질을 암호화하는 유전자의 대립유전자에서 결실, CD163 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함할 수 있다.
예를 들어, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함할 수 있다.
대안적으로 또는 추가로, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 삽입을 포함할 수 있다.
결실, 치환, 또는 이의 임의의 조합은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래할 수 있다.
삽입, 결실, 치환, 또는 암호화 오류는 CD163 단백질을 암호화하는 유전자의 대립유전자에서 조기 정지 코돈을 초래할 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 바람직하게는 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 CD163 단백질 생산 또는 활성과 비교하여, CD163 단백질 생산 또는 활성을 감소시킨다.
바람직하게는, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 동물, 자손 또는 세포에 의해 실질적으로 기능적 CD163 단백질을 생산하지 않는다. "실질적으로 기능적 CD163 단백질이 없는"이란 동물, 자손, 또는 세포에서 CD163 단백질이 검출가능하지 않거나, 또는 검출가능한 경우, 변형된 염색체 서열을 포함하지 않는 동물, 자손, 또는 세포에서 관찰된 수준보다 적어도 약 90% 더 낮고, 바람직하게는 적어도 약 95% 더 낮고, 보다 바람직하게는 적어도 약 98%, 더 낮고, 보다 더 바람직하게는 적어도 약 99% 더 낮음을 의미한다.
동물, 자손, 또는 세포가 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 경우, 동물, 자손, 또는 세포는 바람직하게는 CD163 단백질을 생산하지 않는다.
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 동물 또는 자손은 돼지 동물을 포함할 수 있다.
유사하게, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 세포는 돼지 세포를 포함할 수 있다.
동물 또는 자손이 돼지 동물을 포함하거나 또는 세포가 돼지 세포를 포함하는 경우, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7; CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 8; CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7 또는 엑손 8과 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함할 수 있다.
예를 들어, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7에서 변형을 포함할 수 있다.
CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7에서 변형은 삽입을 포함할 수 있다.
CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7에서 변형은 결실을 포함할 수 있다.
동물, 자손, 또는 세포가 CD163 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함하는 경우, 결실은 임의적으로 인프레임 결실을 포함할 수 있다.
동물 또는 자손이 돼지 동물을 포함하거나 또는 세포가 돼지 세포를 포함하는 경우, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함할 수 있다: 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,147까지 124 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,146까지 123 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,147 및 3,148 사이에 1 염기쌍 삽입; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,159까지 130 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,161까지 132 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 1,525에서 뉴클레오티드 3,030까지 1506 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,724에서 뉴클레오티드 4,096까지 1373 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 여기서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있음; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 3,172까지 28 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,440에서 뉴클레오티드 4,160까지 1720 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,015에서 뉴클레오티드 3,466까지 452 염기쌍 결실; 및 이의 임의의 조합.
서열번호: 47은 야생형 돼지 CD163에 대한 부분 뉴클레오티드 서열을 제공한다. 서열번호: 47은 야생형 돼지 CD163 유전자의 엑손 7의 3000 염기쌍(bp) 상류에서 시작하여 이 유전자의 엑손 10의 마지막 염기까지의 영역을 포함한다. 서열번호: 47은 본원의 참조 서열로 사용되며 도 16에 제시된다.
예를 들어, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함할 수 있다: 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실; 및 이의 임의의 조합.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함하는 경우, 2 염기쌍 삽입은 디뉴클레오티드 AG를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,147까지 124 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,146까지 123 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,147 및 3,148 사이에 1 염기쌍 삽입을 포함할 수 있다.
변형된 염색체 서열 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,147 및 3,148 사이에 1 염기쌍 삽입을 포함하는 경우, 1 염기쌍 삽입은 단일 아데닌 잔기를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,159까지 130 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,161까지 132 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 1,525에서 뉴클레오티드 3,030까지 1506 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입을 포함할 수 있다.
변형된 염색체 서열이 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입을 포함하는 경우, 7 염기쌍 삽입은 서열 TACTACT(서열번호: 115)를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,724에서 뉴클레오티드 4,096까지 1373 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있다.
변형된 염색체 서열이 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실을 포함하며, 여기서 결실된 서열이 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서추가 129 염기쌍 결실이 있는 경우, 12 염기쌍 삽입은 서열 TGTGGAGAATTC(서열번호: 116)를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 3,172까지 28 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체된다.
변형된 염색체 서열이 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함하며, 여기서 결실된 서열이 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체되는 경우, 11 염기쌍 삽입은 서열 AGCCAGCGTGC(서열번호: 117)를 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,440에서 뉴클레오티드 4,160까지 1720 염기쌍 결실을 포함할 수 있다.
변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,015에서 뉴클레오티드 3,466까지 452 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포에서 CD163 유전자는 본원에 기재된 임의의 변형된 염색체 서열의 임의의 조합을 포함할 수 있다.
예를 들어, 동물, 자손 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체된다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있고; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있고; CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실; 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 11 염기쌍 결실; 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,147까지 124 염기쌍 결실; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,146까지 123 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,159까지 130 염기쌍 결실; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,161까지 132 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,724에서 뉴클레오티드 4,096까지 1373 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 3,172까지 28 염기쌍 결실; 및 CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체되고; CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,440에서 뉴클레오티드 4,160까지 1720 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 CD163 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체되고; 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 CD163 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함할 수 있다.
동물, 자손, 또는 세포는 CD163 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함할 수 있으며, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체되고; CD163 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실을 포함할 수 있다.
본원에 기재된 CD163 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열은 결실, 삽입 또는 치환으로 이루어질 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 80% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 85% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 90% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 95% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 98% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 99% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 99.9% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 100% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
임의의 동물, 자손, 또는 세포는 서열번호: 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 또는 119를 포함하는 염색체 서열을 포함할 수 있다.
ANPEP 단백질을 암호화하는 유전자 및 CD163 단백질을 암호화하는 유전자 둘 다에서 변형된 염색체 서열을 포함하는 임의의 동물, 자손, 또는 세포에서, 동물, 자손, 또는 세포는 본원에 기재된 ANPEP 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열 및 본원에 기재된 CD163 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열의 임의의 조합을 포함할 수 있다.
예를 들어, ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함할 수 있고, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실을 포함할 수 있다.
ANPEP를 암호화하는 유전자에서 변형된 염색체 서열을 갖고 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 추가로 포함하는 동물 및 세포
ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 임의의 동물, 자손, 또는 세포는 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함할 수 있다.
동물, 자손, 또는 세포는 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합일 수 있다.
동물, 자손, 또는 세포는 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합일 수 있다.
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 삽입, SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 결실, SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함할 수 있다.
예를 들어, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함할 수 있다.
SIGLEC 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함하는 경우, 결실은 인프레임 결실을 포함할 수 있다.
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 삽입을 포함할 수 있다.
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 치환을 포함할 수 있다.
결실, 치환, 또는 이의 임의의 조합은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래할 수 있다.
삽입, 결실, 치환, 또는 암호화 오류는 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 조기 정지 코돈을 초래할 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 바람직하게는 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 SIGLEC1 단백질 생산 또는 활성과 비교하여, SIGLEC1 단백질 생산 또는 활성을 감소시킨다.
바람직하게는, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 동물, 자손 또는 세포에 의해 실질적으로 기능적 SIGLEC1 단백질을 생산하지 않는다. "실질적으로 기능적 SIGLEC1 단백질이 없는"이란 동물, 자손, 또는 세포에서 SIGLEC1 단백질 수준이 검출가능하지 않거나, 또는 검출가능한 경우, 변형된 염색체 서열을 포함하지 않는 동물, 자손, 또는 세포에서 관찰된 수준보다 적어도 약 90% 더 낮고, 바람직하게는 적어도 약 95% 더 낮고, 보다 바람직하게는 적어도 약 98%, 더 낮고, 보다 더 바람직하게는 적어도 약 99% 더 낮음을 의미한다.
동물, 자손, 또는 세포가 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 경우, 동물, 자손, 또는 세포는 바람직하게는 SIGLEC1 단백질을 생산하지 않는다.
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 동물 또는 자손은 돼지 동물을 포함할 수 있다.
유사하게, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 세포는 돼지 세포를 포함할 수 있다.
동물 또는 자손이 돼지 동물을 포함하거나 또는 세포가 돼지 세포를 포함하는 경우, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1; SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 2; SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 3; SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1, 엑손 2, 또는 엑손 3과 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함할 수 있다.
예를 들어, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1, 엑손 2, 및/또는 엑손 3에서 결실을 포함할 수 있다.
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1의 일부 및 엑손 2 및 3 모두의 결실을 포함할 수 있다.
예를 들어, 변형된 염색체 서열은 참조 서열 서열번호: 122와 비교하여 뉴클레오티드 4,279에서 뉴클레오티드 5,525까지 1,247 염기쌍 결실을 포함한다.
서열번호: 122는 야생형 돼지 SIGLEC1에 대한 부분 뉴클레오티드 서열을 제공한다. 서열번호: 122는 엑손 1의 4,236 뉴클레오티드 상류에서 시작하고, 모든 인트론 및 엑손 내지 엑손 7, 및 엑손 7의 끝 뒤의 1,008 뉴클레오티드를 포함한다. 서열번호: 122는 본원에서 참조 서열로서 사용된다.
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 결실을 포함하는 경우, 결실된 서열은 임의적으로 네오마이신 카세트로 대체될 수 있다. 예를 들어, 동물, 자손, 또는 세포는 서열번호: 123을 포함하는 염색체 서열을 포함할 수 있다. 서열번호: 123은 부분 뉴클레오티드 서열을 제공하며, 여기서, 참조 서열 서열번호: 122와 비교하여, 뉴클레오티드 4,279에서 5,525까지 1,247 염기쌍 결실이 있고 결실된 서열은 서열번호: 122와 비교하여 반대 방향으로 배향된 1,855 염기쌍 네오마이신 선택가능한 카세트로 대체된다. 이 삽입/결실은 SIGLEC1 유전자의 엑손 1의 일부 및 엑손 2 및 3 모두의 손실을 초래한다.
본원에 기재된 SIGLEC1 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열은 결실, 삽입 또는 치환으로 이루어질 수 있다.
본원에 기재된 임의의 동물, 자손, 또는 세포에서, 동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 80% 서열 동일성을 갖는 SIGLEC1 단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 85% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 90% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 95% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 98% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 99% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 99.9% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 100% 서열 동일성을 갖는 SIGLEC1단백질을 암호화하는 유전자에서 염색체 서열을 포함할 수 있다.
ANPEP 단백질을 암호화하는 유전자 및 SIGLEC1 단백질을 암호화하는 유전자 둘 다에서 변형된 염색체 서열을 포함하는 임의의 동물, 자손, 또는 세포에서, 동물, 자손, 또는 세포는 본원에 기재된 ANPEP 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열 및 본원에 기재된 SIGLEC1 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열의 임의의 조합을 포함할 수 있다.
예를 들어, ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함할 수 있고, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 122와 비교하여 뉴클레오티드 4,279에서 뉴클레오티드 5,525까지 1,247 염기쌍 결실을 포함할 수 있다.
ANPEP를 암호화하는 유전자에서 변형된 염색체 서열을 갖고 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열 및 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 추가로 포함하는 동물 및 세포
ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 임의의 동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열 및 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함할 수 있다.
동물, 자손, 또는 세포가 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열, 및 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 경우, 동물, 자손, 또는 세포는 본원에 기재된 ANPEP 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열, 본원에 기재된 CD163 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열, 및 본원에 기재된 SIGLEC1 단백질을 암호화하는 유전자에서 임의의 변형된 염색체 서열의 임의의 조합을 포함할 수 있다.
예를 들어, ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함할 수 있고, SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 122와 비교하여 뉴클레오티드 4,279에서 뉴클레오티드 5,525까지 1,247 염기쌍 결실을 포함할 수 있고, CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실을 포함할 수 있다.
유전적으로 편집된 동물 및 세포
본원에 기재된 임의의 동물 또는 자손은 유전적으로 편집된 동물일 수 있다.
마찬가지로, 본원에 기재된 임의의 세포는 유전적으로 편집된 세포일 수 있다.
동물, 자손, 또는 세포는 호밍 엔도뉴클레아제를 사용하여 편집된 동물, 자손, 또는 세포일 수 있다. 호밍 엔도뉴클레아제는 자연적으로 발생하는 엔도뉴클레아제일 수 있지만 바람직하게는 엔도뉴클레아제가 ANPEP, CD163, 또는 SIGLEC1 단백질을 암호화하는 유전자에서 염색체 서열을 표적하도록 설계된 DNA 인식 서열을 갖는 합리적으로 설계된 비자연적으로 발생하는 호밍 엔도뉴클레아제이다.
따라서, 호밍 엔도뉴클레아제는 설계된 호밍 엔도뉴클레아제일 수 있다. 호밍 엔도뉴클레아제는 예를 들어, 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템, 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN), 리콤비나제 융합 단백질, 메가뉴클레아제, 또는 이의 임의의 조합을 포함할 수 있다.
호밍 뉴클레아제는 바람직하게는 CRISPR 시스템을 포함한다. 본원에 기재된 방법에서 사용하기 위한 암컷 돼지 동물을 생성하는 데 사용될 수 있는 CRISPR 시스템의 예는 CRISPR/Cas9, CRISPR/Cas5, 및 CRISPR/Cas6을 포함하나 이에 제한되지 않는다.
유전적으로 편집된 동물을 생성하기 위해 CRISPR 시스템 및 TALEN을 포함하여 다양한 호밍 엔도뉴클레아제의 사용은 이하에 추가로 논의된다.
편집된 염색체 서열은 (1) 비활성화되거나, (2) 변형되거나, 또는 (3) 무효 돌연변이를 초래하는 통합 서열을 포함할 수 있다. 편집된 염색체 서열이 ANPEP 유전자에 있는 경우, TGEV 및/또는 PRCV 감염과 관련된 ANPEP 단백질 기능이 손상되거나, 감소되거나, 또는 제거되도록 비활성화된 염색체 서열이 변경된다. 편집된 염색체 서열이 CD163 유전자에 있는 경우, PRRSV 감염과 관련된 CD163 단백질 기능이 손상되거나, 감소되거나, 또는 제거되도록 비활성화된 염색체 서열이 변경된다. 따라서, 비활성화된 염색체 서열을 포함하는 유전적으로 편집된 동물은 "녹아웃" 또는 "조건부 녹아웃"으로 명명될 수 있다. 유사하게, 통합 서열을 포함하는 유전적으로 편집된 동물은 "녹인(knock in)" 또는 "조건부 녹인"으로 명명될 수 있다. 또한, 변형된 염색체 서열을 포함하는 유전적으로 편집된 동물은 표적화된 점 돌연변이(들) 또는 변경된 단백질 산물이 생성되도록 다른 변형을 포함할 수 있다. 간단히 말해서, 과정은 표적화된 징크 핑거 뉴클레아제를 암호화하는 적어도 하나의 RNA 분자 및, 임의적으로, 적어도 하나의 보조 폴리뉴클레오티드를 배아 또는 세포에 도입하는 단계를 포함할 수 있다. 방법은 징크 핑거 뉴클레아제의 발현을 허용하도록 배아 또는 세포를 배양하는 단계를 추가로 포함하며, 여기서 징크 핑거 뉴클레아제에 의해 표적화된 염색체 서열에 도입된 이중 가닥 파괴는 오류-유발 비상동 말단-연결 DNA 복구 과정 또는 상동성-지정 DNA 복구 과정에 의해 복구된다. 표적화된 징크 핑거 뉴클레아제 기술을 사용하여 생식선 발달과 관련된 단백질을 암호화하는 염색체 서열을 편집하는 방법은 빠르고, 정확하고, 매우 효율적이다.
대안적으로, 과정은 CRISPR 시스템(예를 들어, CRISPR/Cas9 시스템)을 사용하여 게놈 서열을 변형시키는 것을 포함할 수 있다. Cas9를 사용하여 게놈 서열을 변형시키기 위해, 단백질은 세포에 직접 전달될 수 있다. 대안적으로, Cas9를 암호화하는 mRNA는 세포에 전달될 수 있거나, 또는 Cas9를 암호화하는 mRNA의 발현을 제공하는 유전자는 세포에 전달될 수 있다. 게다가, 표적 특이적 crRNA 및 tracrRNA는 세포에 직접 전달될 수 있거나 또는 표적 특이적 gRNA(들)는 세포에 있을 수 있다(이러한 RNA는 대안적으로 이러한 RNA를 발현하도록 구성된 유전자에 의해 생산될 수 있음). 표적 부위의 선택 및 crRNA/gRNA의 설계는 당업계에 널리 알려져 있다. gRNA의 구성 및 클로닝에 대한 논의는 http://www.genome-engineering.org/crispr/wp-content/uploads/2014/05/CRISPR-Reagent-Description-Rev20140509.pdf에서 찾을 수 있다.
적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌는 부위-특이적 편집을 위한 표적 부위로 사용될 수 있다. 부위-특이적 편집은 외인성 핵산(예를 들어, 관심 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 핵산)의 삽입 또는 유전자좌로부터 핵산의 결실을 포함할 수 있다. 예를 들어, 외인성 핵산의 통합 및/또는 게놈 핵산 일부의 결실은 분열된(즉, ANPEP, CD163, 또는 SIGLEC1 단백질의 활성 감소) ANPEP, CD163, 또는 SIGLEC1 유전자를 생산하기 위해 유전자좌를 변형시킬 수 있다.
세포 유형
본원에 기재된 임의의 세포는 생식 세포 또는 배우자를 포함할 수 있다.
예를 들어, 본원에 기재된 임의의 세포는 정자 세포를 포함할 수 있다.
대안적으로, 본원에 기재된 임의의 세포는 난자 세포(예를 들어, 수정란)를 포함할 수 있다.
본원에 기재된 임의의 세포는 체세포를 포함할 수 있다.
예를 들어, 본원에 기재된 임의의 세포는 섬유아세포(예를 들어, 태아 섬유아세포)를 포함할 수 있다.
본원에 기재된 임의의 세포는 배아 세포를 포함할 수 있다.
본원에 기재된 임의의 세포는 발육기 동물로부터 유래된 세포를 포함할 수 있다.
본원에 기재된 임의의 세포는 성체 동물로부터 유래된 세포를 포함할 수 있다.
병원체에 대한 감수성이 감소된 동물 및 계통을 생산하는 방법
병원체에 대한 감수성이 감소된 비인간 동물 또는 비인간 동물의 계통을 생산하는 방법이 제공된다. 상기 방법은 난모세포 또는 정자 세포를 변형시켜 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 난모세포 및 정자 세포 중 적어도 하나에 도입하는 단계, 및 난모세포 정자 세포와 수정하여 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 함유하는 수정란을 생성하는 단계를 포함한다. 상기 방법은 수정란을 대리 암컷 동물로 옮기는 단계를 추가로 포함하며, 여기서 임신 및 만기 분만은 자손 동물을 생산한다. 상기 방법은 병원체에 대한 감수성에 대해 자손 동물을 스크리닝하는 단계, 및 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물과 비교하여 병원체에 대한 감수성이 감소된 자손 동물을 선택하는 단계를 추가로 포함한다.
병원체에 대한 감수성이 감소된 비인간 동물 또는 비인간 동물의 계통을 생산하는 또 다른 방법이 제공된다. 상기 방법은 수정란을 변형시켜 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 수정란에 도입하는 단계를 포함한다. 상기 방법은 수정란을 대리 암컷 동물로 옮기는 단계를 추가로 포함하며, 여기서 임신 및 만기 분만은 자손 동물을 생산한다. 상기 방법은 병원체에 대한 감수성에 대해 자손 동물을 스크리닝하는 단계, 및 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물과 비교하여 병원체에 대한 감수성이 감소된 자손 동물을 선택하는 단계를 추가로 포함한다.
이들 방법 중 어느 하나에서, 동물은 가축 동물을 포함할 수 있다.
난모세포, 정자 세포, 또는 수정란을 변형시키는 단계는 난모세포, 정자 세포, 또는 수정란의 유전적 편집을 포함할 수 있다.
난모세포, 정자 세포, 또는 수정란은 변형된 염색체 서열에 대해 이형접합일 수 있다.
난모세포, 정자 세포, 또는 수정란은 변형된 염색체 서열에 대해 동형접합일 수 있다.
수정은 인공 수정을 포함할 수 있다.
병원체에 대한 감수성이 감소된 비인간 동물 또는 비인간 동물의 계통을 생산하는 임의의 방법에서, 상기 방법은 난모세포, 정자 세포, 또는 수정란을 변형시켜 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 난모세포, 정자 세포, 또는 수정란에 도입하는 단계를 추가로 포함할 수 있다.
대안적으로 또는 추가로, 병원체에 대한 감수성이 감소된 비인간 동물 또는 비인간 동물의 계통을 생산하는 임의의 방법에서, 상기 방법은 난모세포, 정자 세포, 또는 수정란을 변형시켜 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 난모세포, 정자 세포, 또는 수정란에 도입하는 단계를 추가로 포함할 수 있다.
병원체 감염에 대한 가축 동물의 내성을 증가시키는 방법이 제공된다. 상기 방법은 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물에서 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성이 감소되도록 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계를 포함한다.
상기 방법은 추가로 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물에서 CD163 단백질 생산 또는 활성과 비교하여, CD163 단백질 생산 또는 활성이 감소되도록 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계를 임의적으로 포함할 수 있다.
대안적으로 또는 추가로, 상기 방법은 추가로 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물에서 SIGELC1 단백질 생산 또는 활성과 비교하여, SIGLEC1 단백질 생산 또는 활성이 감소되도록 SIGLEC1 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계를 임의적으로 포함할 수 있다.
ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계는 염색체 서열의 유전적 편집을 포함할 수 있다.
유전적 편집을 포함하는 본원에 기재된 임의의 방법에서, 유전적 편집은 호밍 엔도뉴클레아제의 사용을 포함할 수 있다. 호밍 엔도뉴클레아제는 자연적으로 발생하는 엔도뉴클레아제일 수 있지만 바람직하게는 엔도뉴클레아제가 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 표적하도록 설계된 DNA 인식 서열을 갖는 합리적으로 설계된 비자연적으로 발생하는 호밍 엔도뉴클레아제이다.
따라서, 호밍 엔도뉴클레아제는 설계된 호밍 엔도뉴클레아제일 수 있다. 호밍 엔도뉴클레아제는 예를 들어, 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템, 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN), 리콤비나제 융합 단백질, 메가뉴클레아제, 또는 이의 임의의 조합을 포함할 수 있다.
호밍 뉴클레아제는 바람직하게는 CRISPR 시스템을 포함한다. CRISPR 시스템의 예는 CRISPR/Cas9, CRISPR/Cas5, 및 CRISPR/Cas6을 포함하나 이에 제한되지 않는다.
본원에 기재된 임의의 방법은 본원에 기재된 임의의 동물을 생산할 수 있다.
본원에 기재된 임의의 방법은 원조 동물로서 동물을 사용하는 것을 추가로 포함할 수 있다.
동물의 집단
동물의 집단이 또한 본원에 제공된다.
가축 동물의 집단이 제공된다. 집단은 본원에 기재된 임의의 가축 동물 및/또는 이의 자손 중 2 마리 이상을 포함한다.
동물의 또 다른 집단이 제공된다. 집단은 본원에 기재된 임의의 방법에 의해 만들어진 2 마리 이상의 동물 및/또는 이의 자손을 포함한다.
따라서, 집단에서 동물은 모두 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함할 것이다. 집단에서 동물은 또한 CD163 단백질을 암호화하는 유전자 및/또는 SIGELC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 임의적으로 포함할 수 있다.
집단은 병원체 감염에 내성이 있다.
병원체는 바이러스를 포함할 수 있다. 예를 들어, 병원체는 코로나비리다에 패밀리 바이러스, 예를 들어, 코로나비리나에 서브패밀리 바이러스를 포함할 수 있다.
바이러스는 바람직하게는 코로나바이러스(예를 들어, 알파코로나바이러스 속 바이러스)를 포함한다.
바이러스가 알파코로나바이러스 속 바이러스를 포함하는 경우, 알파코로나바이러스 속 바이러스는 바람직하게는 전염성 위장염 바이러스(TGEV)를 포함한다.
예를 들어, 전염성 위장염 바이러스는 TGEV 퍼듀 균주를 포함할 수 있다.
대안적으로 또는 추가로, 바이러스는 돼지 호흡기 코로나바이러스(PRCV)를 포함할 수 있다.
집단에서 동물이 또한 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하는 경우, 집단은 또한 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)(예를 들어, 1형 PRRSV 바이러스, 2형 PRRSV 바이러스, 또는 1형 및 2형 PRRSV 바이러스 둘 다, 및/또는 NVSL 97-7895, KS06-72109, P129, VR2332, CO90, AZ25, MLV-ResPRRS, KS62-06274, KS483 (SD23983), CO84, SD13-15, Lelystad, 03-1059, 03-1060, SD01-08, 4353PZ, 및 이의 임의의 조합으로 이루어진 군으로부터 선택된 PRRSV 단리물)에 의한 감염에 내성이 있을 것이다.
핵산
핵산 분자가 또한 본원에 제공된다.
핵산 분자가 제공된다. 핵산 분자는 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함한다:
(a) 서열번호: 135의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함;
(b) 서열번호: 132의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함; 및
(c) (a) 또는 (b)의 cDNA.
임의의 핵산 분자는 단리된 핵산 분자일 수 있다.
핵산 분자는 서열번호: 132에 대해 적어도 80% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 85% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 87.5% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 95% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 98% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 132에 대해 적어도 99.9% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 80% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 85% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 87.5% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 90% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 95% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 98% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
핵산 분자는 서열번호: 135에 대해 적어도 99.9% 동일성을 갖는 뉴클레오티드 서열을 포함할 수 있으며, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
치환, 삽입, 또는 결실은 치환, 삽입, 또는 결실을 포함하지 않는 핵산과 비교하여, ANPEP 단백질 생산 또는 활성을 감소시키거나 또는 제거한다.
핵산 분자는 서열번호. 163, 164, 165, 166, 167, 168, 170, 171, 172, 173, 174, 176, 177, 또는 178을 포함할 수 있다.
예를 들어, 핵산 분자는 서열번호: 177, 178, 166, 167, 또는 171을 포함할 수 있다.
친화성 태그
"친화성 태그"는 펩티드 친화성 태그 또는 핵산 친화성 태그 중 어느 하나일 수 있다. 용어 "친화성 태그"는 일반적으로 분자에 결합될 수 있는(예를 들어, 소분자, 단백질, 또는 공유 결합에 의해 결합된) 단백질 또는 핵산 서열을 지칭한다. 친화성 태그는 비천연 서열일 수 있다. 펩티드 친화성 태그는 펩티드를 포함할 수 있다. 펩티드 친화성 태그는 분할 시스템의 일부일 수 있는 것일 수 있다(예를 들어, 2 개의 비활성 펩티드 단편은 트랜스에서 함께 조합하여 활성 친화성 태그를 형성할 수 있음). 핵산 친화성 태그는 핵산을 포함할 수 있다. 핵산 친화성 태그는 알려진 핵산 서열에 선택적으로 결합할 수 있는 (예를 들어 혼성화를 통해) 서열일 수 있다. 핵산 친화성 태그는 단백질에 선택적으로 결합할 수 있는 서열일 수 있다. 친화성 태그는 천연 단백질에 융합될 수 있다. 친화성 태그는 뉴클레오티드 서열에 융합될 수 있다.
때때로, 1, 2 개, 또는 복수의 친화성 태그가 천연 단백질 또는 뉴클레오티드 서열에 융합될 수 있다. 친화성 태그는 시험관내 또는 생체내 전사 방법을 사용하여 핵산-표적화 핵산에 도입될 수 있다. 핵산 친화성 태그는 예를 들어, 화학적 태그, RNA-결합 단백질 결합 서열, DNA-결합 단백질 결합 서열, 친화성-태깅된 폴리뉴클레오티드에 혼성화가능한 서열, 합성 RNA 앱타머, 또는 합성 DNA 앱타머를 포함할 수 있다. 화학적 핵산 친화성 태그의 예는 비오틴을 함유하는 리보-뉴클레오트리포스페이트, 형광 염료, 및 디곡세기닌을 포함할 수 있으나 이에 제한되지 않는다. 단백질-결합 핵산 친화성 태그의 예는 MS2 결합 서열, U1A 결합 서열, 줄기-루프 결합 단백질 서열, boxB 서열, eIF4A 서열, 또는 RNA 결합 단백질에 의해 인식된 임의의 서열을 포함할 수 있으나 이에 제한되지 않는다. 핵산 친화성-태깅된 올리고뉴클레오티드의 예는 비오티닐화 올리고뉴클레오티드, 2,4-디니트로페닐 올리고뉴클레오티드, 플루오레세인 올리고뉴클레오티드, 및 1차 아민-접합된 올리고뉴클레오티드를 포함할 수 있으나 이에 제한되지 않는다.
핵산 친화성 태그는 RNA 앱타머일 수 있다. 앱타머는 테오필린, 스트렙타비딘, 덱스트란 B512, 아데노신, 구아노신, 구아닌/크산틴, 7-메틸-GTP에 결합하는 앱타머, 아르기닌, 시트룰린, 발린, 트립토판, 시아노코발라민, N-메틸메소포르필린 IX, 플라빈, NAD에 결합하는 앱타머와 같은 아미노산 앱타머, 및 토브라마이신, 네오마이신, 리비도마이신, 카나마이신, 스트렙토마이신, 비오마이신, 및 클로람페니콜에 결합하는 앱타머와 같은 항생제 앱타머를 포함할 수 있다.
핵산 친화성 태그는 부위 지정 폴리펩티드에 의해 결합될 수 있는 RNA 서열을 포함할 수 있다. 부위 지정 폴리펩티드는 조건부로 효소적으로 비활성일 수 있다. RNA 서열은 I형, II형, 및/또는 III형 CRISPR 시스템의 구성원에 의해 결합될 수 있는 서열을 포함할 수 있다. RNA 서열은 RAMP 패밀리 구성원 단백질에 의해 결합될 수 있다. RNA 서열은 Cas9 패밀리 구성원 단백질, Cas6 패밀리 구성원 단백질(예를 들어, Csy4, Cas6)에 의해 결합될 수 있다. RNA 서열은 Cas5 패밀리 구성원 단백질(예를 들어, Cas5)에 의해 결합될 수 있다. 예를 들어, Csy4는 높은 친환성(Kd ~50 pM)으로 특이적 RNA 헤어핀 서열에 결합할 수 있고 부위 3'에서 RNA를 헤어핀으로 절단할 수 있다.
핵산 친화성 태그는 부위 지정 폴리펩티드에 의해 결합될 수 있는 DNA 서열을 포함할 수 있다. 부위 지정 폴리펩티드는 조건부로 효소적으로 비활성일 수 있다. DNA 서열은 I형, II형, 및/또는 III형 CRISPR 시스템의 구성원에 의해 결합될 수 있는 서열을 포함할 수 있다. DNA 서열은 아르고너트(Argonaut) 단백질에 의해 결합될 수 있다. DNA 서열은 징크 핑거 도메인, TALE 도메인, 또는 임의의 다른 DNA-결합 도메인을 함유하는 단백질에 의해 결합될 수 있다.
핵산 친화성 태그는 리보자임 서열을 포함할 수 있다. 적합한 리보자임은 펩티딜 트랜스퍼라제 23 SrRNA, RnaseP, 그룹 I 인트론, 그룹 II 인트론, GIR1 분지화 리보자임, 리드자임, 헤어핀 리보자임, 해머헤드 리보자임, HDV 리보자임, CPEB3 리보자임, VS 리보자임, glmS 리보자임, CoTC 리보자임, 및 합성 리보자임을 포함할 수 있다.
펩티드 친화성 태그는 추적 또는 정제에 사용될 수 있는 태그(예를 들어, 녹색 형광 단백질(GFP), YFP, RFP, CFP, mCherry, tdTomato와 같은 형광 단백질; His 태그, (예를 들어, 6XHis 태그); 헤마글루티닌(HA) 태그; FLAG 태그; Myc 태그; GST 태그; MBP 태그; 키틴 결합 단백질 태그; 칼모둘린 태그; V5 태그; 스트렙타비딘 결합 태그 등)를 포함할 수 있다.
핵산 및 펩티드 친화성 태그는 둘 다 비오틴, 또는 디기톡신과 같은 소분자 태그, 및 예를 들어, 플루오로세인, 로다민, 알렉사 플루오르 염료, 시아닌3 염료, 시아닌5 염료와 같은 형광 표지 태그를 포함할 수 있다.
핵산 친화성 태그는 핵산(예를 들어, 핵산- 표적화 핵산)에 5'에 위치할 수 있다. 핵산 친화성 태그는 핵산에 3'에 위치할 수 있다. 핵산 친화성 태그는 핵산에 5' 및 3'에 위치할 수 있다. 핵산 친화성 태그는 핵산 내에 위치할 수 있다. 펩티드 친화성 태그는 폴리펩티드 서열에 N-말단에 위치할 수 있다. 펩티드 친화성 태그는 폴리펩티드 서열에 C-말단에 위치할 수 있다. 펩티드 친화성 태그는 폴리펩티드 서열에 N-말단 및 C-말단에 위치할 수 있다. 복수의 친화성 태그는 핵산 및/또는 폴리펩티드 서열에 융합될 수 있다.
포획제
본원에 사용된 바와 같이, "포획제"는 일반적으로 폴리펩티드 및/또는 핵산을 정제할 수 있는 제제를 지칭할 수 있다. 포획제는 생물학적으로 활성 분자 또는 물질일 수 있다(예를 들어 자연에서 발견되는 임의의 생물학적 물질 또는 합성 물질이며, 세포, 바이러스, 세포하 입자, 단백질, 예컨대 보다 구체적으로 항체, 면역글로불린, 항원, 지질단백질, 당단백질, 펩티드, 폴리펩티드, 단백질 복합체, (스트렙트)아비딘-비오틴 복합체, 리간드, 수용체, 또는 소분자, 앱타머, 핵산, DNA, RNA, 펩티드 핵산, 올리고사카라이드, 폴리사카라이드, 리포폴리사카라이드, 세포 대사산물, 헵텐, 약제학적으로 활성 물질, 알칼로이드, 스테로이드, 비타민, 아미노산, 및 당을 포함하나 이에 제한되지 않음). 일부 구현예에서, 포획제는 친화성 태그를 포함할 수 있다. 일부 구현예에서, 포획제는 관심 표적 폴리펩티드 또는 핵산에 우선적으로 결합할 수 있다. 포획제는 혼합물에서 자유롭게 부유할 수 있다. 포획제는 입자(예를 들어 비드, 마이크로비드, 나노입자)에 결합될 수 있다. 포획제는 고체 또는 반고체 표면에 결합될 수 있다. 일부 경우에, 포획제는 표적에 비가역적으로 결합된다. 다른 경우에, 포획제는 표적에 가역적으로 결합된다(예를 들어, 표적이 용리될 수 있는 경우, 또는 이미다졸과 같은 화학물질의 사용에 의해).
CD163 유전자좌에서 핵산의 표적화된 통합
ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 외인성 핵산의 부위-특이적 통합은 당업자에게 알려진 임의의 기술에 의해 달성될 수 있다. 예를 들어, ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 외인성 핵산의 통합은 세포(예를 들어, 단리된 세포 또는 조직 또는 유기체의 세포)를 외인성 핵산을 포함하는 핵산 분자와 접촉시키는 것을 포함할 수 있다. 이러한 핵산 분자는 핵산 분자 및 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌 사이에 상동 재조합을 용이하게 하는 외인성 핵산에 측면에 있는 뉴클레오티드 서열을 포함할 수 있다. 상동 재조합을 용이하게 하는 외인성 핵산에 측면에 있는 뉴클레오티드 서열은 ANPEP, CD163, 또는 SIGLEC1 유전자좌의 내인성 뉴클레오티드에 상보적일 수 있다. 대안적으로, 상동 재조합을 용이하게 하는 외인성 핵산에 측면에 있는 뉴클레오티드 서열은 이전에 통합된 외인성 뉴클레오티드에 상보적일 수 있다. 복수의 외인성 핵산은 유전자 집적에서와 같이, 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 통합될 수 있다.
ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 핵산의 통합은 예를 들어 제한 없이, 내인성 DNA 및 내인성 리콤비나제 효소와 같은 숙주 세포의 내인성 세포 기구에 의해 용이하게 될 수 있다(예를 들어, 촉매화). 대안적으로, ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 핵산의 통합은 숙주 세포에 제공되는 하나 이상의 인자(예를 들어, 폴리펩티드)에 의해 용이하게 될 수 있다. 예를 들어, 뉴클레아제(들), 리콤비나제(들), 및/또는 리가제 폴리펩티드는 폴리펩티드를 숙주 세포와 접촉시키거나, 또는 숙주 세포 내에서 폴리펩티드를 발현시킴으로써 (독립적으로 또는 키메라 폴리펩디트의 일부로) 제공될 수 있다. 따라서, 적어도 하나의 뉴클레아제, 리콤비나제, 및/또는 리가제 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 핵산은 ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 부위-특이적으로 통합될 핵산과 동시에 또는 순차적으로 숙주 세포에 도입될 수 있으며, 여기서 적어도 하나의 뉴클레아제, 리콤비나제, 및/또는 리가제 폴리펩티드는 숙주 세포에서 뉴클레오티드 서열로부터 발현된다.
DNA-결합 폴리펩티드
부위-특이적 통합은 예를 들어, 숙주 유기체의 게놈에서 특정 뉴클레오티드 서열을 인식하고 이에 결합할 수 있는 인자를 사용함으로써 달성될 수 있다. 예를 들어, 많은 단백질은 부위-특이적 방식으로 DNA를 인식하고 이에 결합할 수 있는 폴리펩티드 도메인을 포함한다. DNA-결합 폴리펩티드에 의해 인식되는 DNA 서열은 "표적" 서열로 지칭될 수 있다. 부위-특이적 방식으로 DNA를 인식하고 이에 결합할 수 있는 폴리펩티드 도메인은 일반적으로 도메인이 원래 단리된 단백질 이외의 폴리펩티드에서 발현되는 경우에도, 부위-특이적 방식으로 DNA에 결합하도록 정확하게 폴딩되고 독립적으로 기능한다. 유사하게, DNA-결합 폴리펩티드에 의한 인식 및 결합을 위한 표적 서열은 일반적으로 큰 DNA 구조(예를 들어, 염색체)에 존재할 때조차, 특히 표적 서열이 위치한 부위가 가용성 세포 단백질(예를 들어, 유전자)에 접근할 수 있는 것으로 알려진 경우에, 이러한 폴리펩티드에 의해 인식되고 결합될 수 있다.
자연에 존재하는 단백질로부터 식별된 DNA-결합 폴리펩티드는 전형적으로 별개의 뉴클레오티드 서열 또는 모티프(예를 들어, 공통 인식 서열)에 결합하지만, 상이한 뉴클레오티드 서열 또는 모티프를 인식하도록 많은 이러한 DNA-결합 폴리펩티드를 변형하는 방법이 존재하고 당업계에 알려져 있다. DNA-결합 폴리펩티드는 예를 들어 및 제한 없이: 징크 핑거 DNA-결합 도메인; 류신 지퍼; UPA DNA-결합 도메인; GAL4; TAL; LexA; Tet 억제인자; LacI; 및 스테로이드 호르몬 수용체를 포함한다.
예를 들어, DNA-결합 폴리펩티드는 징크 핑거일 수 있다. 개별적인 징크 핑거 모티프는 임의의 광범위한 DNA 부위를 표적으로 하고 특이적으로 결합하도록 설계될 수 있다. 정규 Cys2His2(뿐만 아니라 비정규 Cys3His) 징크 핑거 폴리펩티드는 α-나선을 표적 DNA 이중 나선의 주요 홈에 삽입함으로써 DNA에 결합한다. 징크 핑거에 의한 DNA 인식은 모듈식이며; 각 핑거는 주로 표적에서 연속적인 3 염기쌍과 접촉하고, 폴리펩티드에서 일부 핵심 잔기는 인식을 매개한다. 표적화 엔도뉴클레아제에 다수의 징크 핑거 DNA-결합 도메인을 포함함으로써, 표적화 엔도뉴클레아제의 DNA-결합 특이성이 추가로 증가될 수 있다(따라서 이에 의해 부여된 임의의 유전자 조절 효과의 특이성이 또한 증가될 수 있다). 예를 들어, Urnov et al. (2005) Nature 435:646-51 참조. 따라서, 하나 이상의 징크 핑거 DNA-결합 폴리펩티드는 숙주 세포에 도입된 표적화 엔도뉴클레아제가 숙주 세포의 게놈 내에서 고유한 DNA 서열과 상호작용하도록 조작되고 활용될 수 있다.
바람직하게는, 징크 핑거 단백질은 선택한 표적 부위에 결합하도록 조작된다는 점에서 비자연적으로 발생한다. 예를 들어, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; 미국 특허 번호 제6,453,242호; 제6,534,261호; 제6,599,692호; 제6,503,717호; 제6,689,558호; 제7,030,215호; 제6,794,136호; 제7,067,317호; 제7,262,054호; 제7,070,934호; 제7,361,635호; 제7,253,273호; 및 미국 특허 공개 번호 제2005/0064474호; 제2007/0218528호; 제2005/0267061호 참조.
조작된 징크 핑거 결합 도메인은 자연적으로 발생하는 징크 핑거 단백질과 비교하여, 신규한 결합 특이성을 가질 수 있다. 조작 방법은 합리적인 설계 및 다양한 유형의 선택을 포함하나 이에 제한되지 않는다. 합리적인 설계는 예를 들어, 삼중항(또는 사중항) 뉴클레오티드 서열 및 개별 징크 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각 삼중항 또는 사중항 뉴클레오티드 서열은 특정 삼중항 또는 사중항 서열에 결합하는 징크 핑거의 하나 이상의 아미노산 서열과 관련된다. 예를 들어, 미국 특허 번호 제6,453,242호 및 제6,534,261호 참조.
파지 디스플레이 및 2-하이브리드 시스템을 포함하여 예시적인 선택 방법은 미국 특허 번호 제5,789,538호; 제5,925,523호; 제6,007,988호; 제6,013,453호; 제6,410,248호; 제6,140,466호; 제6,200,759호; 및 제6,242,568호; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 개시되어 있다. 게다가, 징크 핑거 결합 도메인에 대한 결합 특이성의 향상은 예를 들어, WO 02/077227에 기재되었다.
게다가, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다중-핑거 징크 핑거 단백질은 예를 들어, 5 개 이상의 아미노산 길이의 링커를 포함하여 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6 개 이상의 아미노산 길이의 예시적인 링커 서열에 대해 미국 특허 번호 제6,479,626호; 제6,903,185호; 및 제7,153,949호 참조. 본원에 기재된 단백질은 단백질의 개별 징크 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
표적 부위의 선택: 융합 단백질(및 이를 암호화하는 폴리뉴클레오티드)의 설계 및 구성을 위한 ZFP 및 방법은 당업자에게 알려져 있고 미국 특허 번호 제6,140,0815호; 제789,538호; 제6,453,242호; 제6,534,261호; 제5,925,523호; 제6,007,988호; 제6,013,453호; 제6,200,759호; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496에 상세히 기재되어 있다.
게다가, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다중-핑거 징크 핑거 단백질은 예를 들어, 5 개 이상의 아미노산 길이의 링커를 포함하여 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6 개 이상의 아미노산 길이의 예시적인 링커 서열에 대해 미국 특허 번호 제6,479,626호; 제6,903,185호; 및 제7,153,949호 참조. 본원에 기재된 단백질은 단백질의 개별 징크 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
본원에 기재된 바와 같이 동물 또는 세포가 징크-핑거 뉴클레아제를 사용하여 유전적으로 편집된 경우, 동물 또는 세포는 표적화된 징크 핑거 뉴클레아제 및, 임의적으로, 적어도 하나의 보조 폴리뉴클레오티드를 암호화하는 적어도 하나의 RNA 분자를 배아 또는 세포에 도입하는 단계를 포함하는 과정을 사용하여 생성될 수 있다. 상기 방법은 배아 또는 세포를 배양하여 징크 핑거 뉴클레아제를 발현시키는 단계를 추가로 포함하며, 여기서 징크 핑거 뉴클레아제에 의해 표적화된 염색체 서열에 도입된 이중 가닥 파괴는 오류-유발 비상동 말단-연결 DNA 복구 과정 또는 상동성-지정 DNA 복구 과정에 의해 복구된다. 표적화된 징크 핑거 뉴클레아제 기술을 사용하여 생식선 발달과 관련된 단백질을 암호화하는 염색체 서열을 편집하는 방법은 빠르고, 정확하고, 매우 효율적이다.
대안적으로, DNA-결합 폴리펩티드는 GAL4로부터의 DNA-결합 도메인이다. GAL4는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)에서 모듈식 전사활성인자이지만, 또한 많은 다른 유기체에서 전사활성인자로서 작동한다. 예를 들어, Sadowski et al. (1988) Nature 335:563-4 참조. 이 조절 시스템에서, 에스. 세레비지아에(S. cerevisiae)에서 갈락토스 대사 경로의 효소를 암호화하는 유전자의 발현은 이용가능한 탄소 공급원에 의해 엄격하게 조절된다. Johnston (1987) Microbiol. Rev. 51:458-76. 이들 대사 효소의 전사 제어는 양성 조절 단백질인 GAL4, 및 GAL4가 특이적으로 결합하는 17 bp 대칭 DNA 서열(상류 활성화 서열(UAS)) 사이의 상호작용에 의해 매개된다.
천연 GAL4는 881 개 아미노산 잔기로 이루어지며, 분자량은 99 kDa이다. GAL4는 기능적으로 자율 도메인을 포함하며, 이의 조합된 활성은 생체내 GAL4의 활성을 설명한다. Ma and Ptashne (1987) Cell 48:847-53); Brent and Ptashne (1985) Cell 43(3 Pt 2):729-36. GAL4의 N-말단 65 개 아미노산은 GAL4 DNA-결합 도메인을 포함한다. Keegan et al. (1986) Science 231:699-704; Johnston (1987) Nature 328:353-5. 서열-특이적 결합은 DNA 결합 도메인에 존재하는 6 개의 Cys 잔기에 의해 배위된 2가 양이온의 존재를 필요로 한다. 배위된 양이온-함유 도메인은 DNA 나선의 주요 홈과 직접 접촉을 통해 17 bp UAS의 각 끝에서 보존된 CCG 삼중항과 상호작용하고 인식한다. Marmorstein et al. (1992) Nature 356:408-14. 단백질의 DNA-결합 기능은 활성화 도메인이 전사를 지시할 수 있도록, 프로모터 부근에서 C-말단 전사 화성화 도메인을 위치시킨다.
사용될 수 있는 추가 DNA-결합 폴리펩티드는 예를 들어 및 제한 없이, AVRBS3-유도성 유전자로부터의 결합 서열; AVRBS3-유도성 유전자로부터의 공통 결합 서열 또는 이로부터 조작된 합성 결합 서열(예를 들어, UPA DNA-결합 도메인); TAL; LexA(예를 들어, 상기 Brent & Ptashne (1985) 참조); LacR(예를 들어, Labow et al. (1990) Mol. Cell. Biol. 10:3343-56; Baim et al. (1991) Proc. Natl. Acad. Sci. USA 88(12):5072-6 참조); 스테로이드 호르몬 수용체(Elliston et al. (1990) J. Biol. Chem. 265:11517-121); Tet 억제인자(미국 특허 번호 제6,271,341호) 및 테트라사이클린(Tc)의 부재가 아니라 존재 하에 tet 작동인자 서열에 결합하는 돌연변이된 Tet 억제인자; NF-카파B의 DNA-결합 도메인; 및 GAL4, 호르몬 수용체, 및 VP16의 융합을 활용하는, Wang et al. (1994) Proc. Natl. Acad. Sci. USA 91(17):8180-4에 기재된 조절 시스템의 구성요소를 포함한다.
본원에 기재된 방법 및 조성물에 사용되는 뉴클레아제 중 하나 이상의 DNA-결합 도메인은 자연적으로 발생하는 또는 조작된(비자연적으로 발생하는) TAL 이펙터 DNA 결합 도메인을 포함할 수 있다. 예를 들어, 미국 특허 공개 번호 제2011/0301073호 참조.
대안적으로, 뉴클레아제는 CRISPR 시스템을 포함할 수 있다. 예를 들어, 뉴클레아제는 CRISPR/Cas 시스템을 포함할 수 있다.
(CRISPR-관련) 시스템은 바이러스 공격을 방어하기 위한 적응 면역 시스템으로서 박테리아 및 고세균류에서 진화된다. 바이러스에 노출 시, 바이러스 DNA의 짧은 세그먼트는 CRISPR 유전자좌에 통합된다. RNA는 바이러스 서열을 포함하는 CRISPR 유전자좌의 일부로부터 전사된다. 바이러스 게놈에 상보적인 서열을 함유하는 해당 RNA는 바이러스 게놈에서 Cas 단백질(예를 들어, Cas9 단백질)을 서열에 표적화하는 것을 매개한다. Cas 단백질은 절단되어 바이러스 표적을 침묵시킨다. 최근에, CRISPR/Cas 시스템은 진핵 세포에서 게놈 편집에 적용되었다. 부위-특이적 이중 가닥 파괴(DSB)의 도입은 두 가지 내인성 DNA 복구 메커니즘인 비상동 말단-연결(NHEJ) 또는 상동성-지정 복구(HDR) 중 하나를 통해 표적 서열 변경을 가능하게 한다. CRISPR/Cas 시스템은 또한 표적 서열을 변경시키지 않으면서 전사 억제 및 활성화를 포함하여 유전자 조절에 사용되었다. 예를 들어, CRISPR/Cas 시스템을 기반으로 한 표적화된 유전자 조절은 효소적으로 비활성 Cas9(또한 촉매적으로 사멸된 Cas9로도 알려져 있음)를 사용할 수 있다.
CRISPR/Cas 시스템은 시스템의 RNA 구성요소를 암호화하는 CRISPR(클러스터링된 규칙적 간격의 짧은 회문 반복부) 유전자좌, 및 단백질을 암호화하는 Cas(CRISPR-관련) 유전자좌를 포함한다(Jansen et al., 2002. Mol. Microbiol. 43: 1565-1575; Makarova et al., 2002. Nucleic Acids Res. 30: 482-496; Makarova et al., 2006. Biol. Direct 1: 7; Haft et al., 2005. PLoS Comput. Biol. 1: e60). 미생물 숙주에서 CRISPR 유전자좌는 Cas 유전자의 조합 뿐만 아니라 CRISPR-매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비코딩 RNA 요소를 함유한다.
II형 CRISPR은 가장 널리 특성화된 시스템 중 하나이며 순차적인 4 단계로 자연에서 표적화된 DNA 이중 가닥 파괴를 수행한다. 먼저, 2 개의 비코딩 RNA인 프리-crRNA 어레이 및 tracrRNA가 CRISPR 유전자좌로부터 전사된다. 두번째로, tracrRNA를 프리-crRNA의 반복 영역에 혼성화하고 프리-crRNA의 개별 스페이서 서열을 함유하는 성숙 crRNA로 처리를 매개한다. 세번째로, 성숙 crRNA:tracrRNA 복합체는 crRNA 상의 스페이서 및 표적 인식에 대한 추가 요건인 프로토스페이서 인접 모티프(PAM) 옆에 표적 DNA 상의 프로토스페이서 사이의 왓슨-크릭(Watson-Crick) 염기쌍을 통해 표적 DNA에 Cas9를 지시한다. 마지막으로, Cas9는 표적 DNA의 절단을 매개하여 프로토스페이서 내에서 이중 가닥 파괴를 생성한다.
CRISPR/Cas 시스템을 사용하여 표적화된 삽입 및 결실을 생성하기 위해, 2 개의 비코딩 RNA(crRNA 및 TracrRNA)는 가이드 RNA(gRNA)로 지칭되는 단일 RNA로 대체될 수 있다. CRISPR/Cas 시스템의 활성은 다음 3 단계를 포함한다: (i) "적응"이라 불리는 과정에서, 향후 공격을 방지하기 위해 외인성 DNA 서열을 CRISPR에 삽입, (ii) 관련 단백질의 발현, 뿐만 아니라 어레이의 발현 및 처리, 이어서 (iii) 외래 핵산에 대한 RNA-매개 간섭. 박테리아 세포에서, 여러 Cas 단백질은 CRISPR/Cas 시스템의 천연 기능을 수반하고 외래 DNA의 삽입 등과 같은 기능에서 역할을 한다.
Cas 단백질은 자연적으로 발생하는 Cas 단백질의 "기능적 유도체"일 수 있다. 천연 서열 폴리펩티드의 "기능적 유도체"는 천연 서열 폴리펩티드와 공통인 정성적 생물학적 특성을 갖는 화합물이다. "기능적 유도체"는 천연 서열의 단편 및 천연 서열 폴리펩티드 및 이의 단편의 유도체를 포함하나 이에 제한되지 않지만, 이들은 상응하는 천연 서열 폴리펩티드와 공통인 생물학적 활성을 갖는다. 본원에서 고려되는 생물학적 활성은 DNA 기질을 단편에 가수분해하는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 두 아미노산 서열 변이체, 공유 변형, 및 이의 융합을 포함한다. Cas 폴리펩티드 또는 이의 단편의 적합한 유도체는 Cas 단백질 또는 이의 단편의 돌연변이체, 융합, 공유 변형을 포함하나 이에 제한되지 않는다. Cas 단백질 또는 이의 단편, 뿐만 아니라 Cas 단백질 또는 이의 단편의 유도체를 포함하는 Cas 단백질은 세포로부터 수득되거나 또는 화학적으로 합성되거나 또는 이들 두 절차의 조합에 의할 수 있다. 세포는 Cas 단백질을 자연적으로 생성하는 세포, 또는 Cas 단백질을 자연적으로 생산하고 내인성 Cas 단백질을 더 높은 발현 수준으로 생산하거나 또는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전적으로 조작된 세포일 수 있으며, 핵산은 내인성 Cas와 동일하거나 또는 상이한 Cas를 암호화한다. 일부 경우에, 세포는 Cas 단백질을 자연적으로 생산하지 않고 Cas 단백질을 생산하도록 유전적으로 조작된다.
본원에 기재된 바와 같은 동물 또는 세포가 CRISPR 시스템을 사용하여 유전적으로 편집된 경우, CRISPR/Cas9 시스템을 사용하여 동물 또는 세포를 생성할 수 있다. Cas9를 사용하여 게놈 서열을 편집하기 위해, 단백질은 세포에 직접 전달될 수 있다. 대안적으로, Cas9를 암호화하는 mRNA는 세포에 전달될 수 있거나, 또는 Cas9를 암호화하는 mRNA의 발현을 제공하는 유전자가 세포에 전달될 수 있다. 게다가, 표적 특이적 crRNA 및 tracrRNA는 세포에 직접 전달될 수 있거나 또는 표적 특이적 gRNA(들)는 세포에 있을 수 있다(이들 RNA는 대안적으로 이들 RNA를 발현하도록 구성된 유전자에 의해 생산될 수 있다). 표적 부위의 선택 및 crRNA/gRNA의 설계는 당업계에 널리 알려져 있다. gRNA의 구성 및 클로닝에 대한 논의는 http://www.genome-engineering.org/crispr/wp-content/uploads/2014/05/CRISPR-Reagent-Description-Rev20140509.pdf에서 찾을 수 있다.
DNA-결합 폴리펩티드는 숙주 유기체의 게놈 핵산 내에 포함된 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합할 수 있다. 표적 뉴클레오티드 서열의 임의의 수의 별개의 경우는 일부 예에서 숙주 게놈에서 찾을 수 있다. 표적 뉴클레오티드 서열은 유기체의 게놈 내에서 드물 수 있다(예를 들어, 표적 서열의 약 10 개 미만, 약 9 개, 약 8 개, 약 7 개, 약 6 개, 약 5 개, 약 4 개, 약 3 개, 약 2 개, 또는 약 1 개 카피(들)가 게놈에 존재할 수 있음). 예를 들어, 표적 뉴클레오티드 서열은 유기체의 게놈 내에서 고유한 부위에 위치할 수 있다. 표적 뉴클레오티드 서열은 예를 들어 및 제한 없이, 서로에 대해 게놈 전체에 걸쳐 무작위로 분산되고; 게놈에서 상이한 연결 기에 위치하고; 동일한 연결 기에 위치하고; 상이한 염색체 상에 위치하고; 동일한 염색체 상에 위치하고; 유기체에서 유사한 조건 하에(예를 들어, 동일하거나, 또는 실질적으로 기능적으로 동일한 조절 인자의 제어 하에) 발현되는 부위에서 게놈에 위치하고; 게놈에서 서로 밀접하게 위치할 수 있다(예를 들어, 표적 서열은 게놈 유전자좌에서 연쇄동일서열로 통합된 핵산 내에 포함될 수 있음).
엔도뉴클레아제 표적화
표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드는 키메라 폴리펩티드 상의 표적 서열에 특이적 결합을 부여하기 위해, 키메라 폴리펩티드 내에 포함될 수 있다. 예에서, 이러한 키메라 폴리펩티드는 예를 들어 및 제한 없이, 뉴클레아제, 리콤비나제, 및/또는 리가제 폴리펩티드를 포함할 수 있으며, 이들 폴리펩티드는 상기 기재된 바와 같다. DNA-결합 폴리펩티드 및 뉴클레아제, 리콤비나제, 및/또는 리가제 폴리펩티드를 포함하는 키메라 폴리펩티드는 또한 다른 기능적 폴리펩티드 모티프 및/또는 도메인, 예컨대 예를 들어 및 제한 없이: 키메라 단백질에서 기능적 폴리펩티드 사이에 위치한 스페이서 서열; 리더 펩티드; 융합 단백질을 세포기관(예를 들어, 핵)에 표적하는 펩티드; 세포 효소에 의해 절단되는 폴리펩티드; 펩티드 태그(예를 들어, Myc, His 등); 및 키메라 폴리펩티드의 기능에 간섭하지 않는 다른 아미노산 서열을 포함할 수 있다.
키메라 폴리펩티드에서 기능적 폴리펩티드(예를 들어, DNA-결합 폴리펩티드 및 뉴클레아제 폴리펩티드)는 작동적으로 연결될 수 있다. 키메라 폴리펩티드의 기능적 폴리펩티드는 키메라 단백질을 암호화하는 키메라 유전자를 생성하기 위해, 서로 인프레임으로 결찰된 적어도 기능적 폴리펩티드를 암호화하는 단일 폴리뉴클레오티드로부터 발현에 의해 작동가능하게 연결될 수 있다. 대안적으로, 키메라 폴리펩티드의 기능적 폴리펩티드는 독립적으로 발현된 폴리펩티드의 교차 결합에 의해서와 같은 다른 수단에 의해 작동가능하게 연결될 수 있다.
표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드, 또는 가이드 RNA는 천연 단리된 단백질(또는 이의 돌연변이체) 내에 포함될 수 있으며, 여기서 천연 단리된 단백질 또는 이의 돌연변이체는 또한 뉴클레아제 폴리펩티드를 포함한다(또한 리콤비나제 및/또는 리가제 폴리펩티드를 포함할 수 있다). 이러한 단리된 단백질의 예는 TALEN, 리콤비나제(예를 들어, Cre, Hin, Tre, 및 FLP 리콤비나제), RNA-유도된 CRISPR/Cas9, 및 메가뉴클레아제를 포함한다.
본원에 사용된 바와 같이, 용어 "표적화 엔도뉴클레아제"는 DNA-결합 폴리펩티드 또는 가이드 RNA 및 뉴클레아제 폴리펩티드를 포함하는 자연적 또는 조작된 단리된 단백질 및 이의 돌연변이체, 뿐만 아니라 DNA-결합 폴리펩티드 또는 가이드 RNA 및 뉴클레아제를 포함하는 키메라 폴리펩티드를 지칭한다. ANPEP, CD163, 또는 SIGLEC1 유전자좌 내에 포함된 표적 뉴클레오티드 서열을 구체적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드 또는 가이드 RNA를 포함하는 임의의 표적화 엔도뉴클레아제(예를 들어, 표적 서열이 유전자좌에서 천연 서열 내에 포함되기 때문, 또는 표적 서열이 예를 들어, 재조합에 의해 유전자좌에 도입되었기 때문)가 사용될 수 있다.
적합한 키메라 폴리펩티드의 일부 예는 제한 없이, 다음 폴리펩티드의 조합을 포함한다: 징크 핑거 DNA-결합 폴리펩티드; FokI 뉴클레아제 폴리펩티드; TALE 도메인; 류신 지퍼; 전사 인자 DNA-결합 모티프; 및 예를 들어 및 제한 없이, TALEN, 리콤비나제(예를 들어, Cre, Hin, RecA, Tre, 및 FLP 리콤비나제), RNA-유도된 CRISPR/Cas9, 메가뉴클레아제로부터 단리된 DNA 인식 및/또는 절단 도메인; 및 당업계에 알려진 다른 것들. 특정 예는 부위-특이적 DNA 결합 폴리펩티드 및 뉴클레아제 폴리펩티드를 포함하는 키메라 단백질을 포함한다. 키메라 폴리펩티드는 특정 관심 뉴클레오티드 서열에 키메라 폴리펩티드를 표적하기 위해, 키메라 폴리펩티드 내에 포함된 DNA-결합 폴리펩티드의 인식 서열을 변경하도록 당업자에게 알려진 방법에 의해 조작될 수 있다.
키메라 폴리펩티드는 DNA-결합 도메인(예를 들어, 징크 핑거, TAL-이펙터 도메인 등) 및 뉴클레아제(절단) 도메인을 포함할 수 있다. 절단 도메인은 DNA-결합 도메인, 예를 들어 징크 핑거 DNA-결합 도메인 및 뉴클레아제로부터의 절단 도메인 또는 TALEN DNA-결합 도메인 및 절단 도메인, 또는 메가뉴클레아제 DNA-결합 도메인 및 상이한 뉴클레아제로부터의 절단 도메인에 이종일 수 있다. 이종 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 수득될 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 호밍 엔도뉴클레아제를 포함하나 이에 제한되지 않는다. 예를 들어, 2002-2003 Catalogue, New England Biolabs, Beverly, Mass.; 및 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388 참조. DNA를 절단하는 추가 효소가 알려져 있다(예를 들어, 51 뉴클레아제; 녹두 뉴클레아제; 췌장 DNAse I; 마이크로코칼 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993 참조). 이들 효소(또는 이의 기능적 단편) 중 하나 이상은 절단 도메인 및 절단 절반-도메인의 공급원으로 사용될 수 있다.
유사하게, 절단 절반-도메인은 절단 활성에 대한 이량체화를 필요로 하는, 상기 제시된 바와 같은 임의의 뉴클레아제 또는 이의 일부로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우 2 개의 융합 단백질이 절단에 필요하다. 대안적으로, 2 개의 절단 절반-도메인을 포함하는 단일 단백질이 사용될 수 있다. 2 개의 절단 절반-도메인은 동일한 엔도뉴클레아제(또는 이의 기능적 단편)로부터 유래될 수 있거나, 또는 각 절단 절반-도메인은 상이한 엔도뉴클레아제(또는 이의 기능적 단편)로부터 유래될 수 있다. 게다가, 2 개의 융합 단백질에 대한 표적 부위는 바람직하게는 서로에 대해 배치되어, 2 개의 융합 단백질의 각각의 표적 부위에의 결합이 예를 들어, 이량체화에 의해 기능적 절단 도메인을 형성하도록 절단 절반-도메인을 허용하는 서로에 대한 공간적 배향으로 절단 절반-도메인을 배치하도록 한다. 따라서, 표적 부위 근처의 가장자리는 5-8 개 뉴클레오티드 또는 15-18 개 뉴클레오티드에 의해 분리될 수 있다. 그러나 임의의 정수의 뉴클레오티드, 또는 뉴클레오티드 쌍은 2 개의 표적 부위 사이에 개입할 수 있다(예를 들어, 2 내지 50 개 뉴클레오티드 쌍 또는 그 이상). 일반적으로, 절단 부위는 표적 부위 사이에 놓여 있다.
제한 엔도뉴클레아제(제한 효소)는 많은 종에 존재하며 DNA(인식 부위에서)에 서열-특이적 결합할 수 있고, 예를 들어, 결합 부위 또는 근처에서 DNA를 절단할 수 있어서 하나 이상의 외인성 서열(공여체/이식유전자)이 결합(표적) 부위 또는 근처에서 통합되도록 한다. 특정 제한 효소(예를 들어, IIS형)는 인식 부위로부터 제거된 부위에서 DNA를 절단하고 분리가능한 결합 및 절단 도메인을 갖는다. 예를 들어, IIS형 효소 Fok I은 1 개 가닥의 인식 부위로부터 9 개 뉴클레오티드 및 다른 가닥의 인식 부위로부터 13 개 뉴클레오티드에서 DNA의 이중 가닥 절단을 촉매한다. 예를 들어, 미국 특허 번호 제5,356,802호; 제5,436,150호 및 제5,487,994호; 뿐만 아니라 Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982 참조. 따라서, 융합 단백질은 적어도 하나의 IIS형 제한 효소로부터 절단 도메인(또는 절단 절반-도메인) 및 조작될 수 있거나 또는 조작될 수 없는 하나 이상의 징크 핑거 결합 도메인을 포함할 수 있다.
절단 도메인이 결합 도메인으로부터 분리가능한 예시적인 IIS형 제한 효소는 Fok I이다. 이 특정 효소는 이량체로서 활성이다. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575. 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에 사용되는 Fok I 효소의 일부는 절단 절반-도메인으로 간주된다. 따라서, 징크 핑거-Fok I 융합을 사용하여 표적화된 이중 가닥 절단 및/또는 세포 서열의 표적화된 대체를 위해, 각각 FokI 절단 절반-도메인을 포함하는 2 개의 융합 단백질을 사용하여 촉매적으로 활성 절단 도메인을 재구성할 수 있다. 대안적으로, DNA 결합 도메인 및 2 개의 Fok I 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다.
절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나, 또는 기능적 절단 도메인을 형성하기 위해 다량체화(예를 들어, 이량체화)하는 능력을 보유하는 단백질의 임의의 일부일 수 있다.
예시적인 IIS형 제한 효소는 미국 특허 공개 번호 제2007/0134796호에 기재되어 있다. 추가의 제한 효소는 또한 분리가능한 결합 및 절단 도메인을 함유하고, 이들은 본 개시내용에 의해 고려된다. 예를 들어, Roberts et al. (2003) Nucleic Acids Res. 31:418-420 참조.
절단 도메인은 예를 들어, 미국 특허 공개 번호 제2005/0064474호; 제2006/0188987호 및 제2008/0131962호에 기재된 바와 같이, 동종이량체화를 최소화하거나 또는 방지하는 하나 이상의 조작된 절단 절반-도메인(또한 이량체화 도메인 돌연변이체로도 지칭됨)을 포함할 수 있다.
대안적으로, 뉴클레아제는 소위 "분할-효소" 기술을 사용하여 핵산 표적 부위에서 생체내 어셈블리될 수 있다(예를 들어 미국 특허 공개 번호 제20090068164호 참조). 이러한 분할 효소의 구성요소는 별도의 발현 작제물 상에서 발현될 수 있거나, 또는 개별 구성요소가 예를 들어, 자가-절단 2A 펩티드 또는 IRES 서열에 의해 분리되는 경우 하나의 오픈 리딩 프레임에서 연결될 수 있다. 구성요소는 개별 징크 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.
징크 핑거 뉴클레아제
키메라 폴리펩티드는 통합될 수 있는 외인성 핵산, 또는 공여체 DNA에 표적화된 부위-특이적 이중 가닥 DNA 파괴를 전달하도록 설계될 수 있는 맞춤형-설계된 징크 핑거 뉴클레아제(ZFN)를 포함할 수 있다(미국 특허 공개 제2010/0257638호 참조). ZFN은 제한 엔도뉴클레아제(예를 들어, FokI)로부터 비특이적 절단 도메인 및 징크 핑거 DNA-결합 도메인 폴리펩티드를 함유하는 키메라 폴리펩티드이다. 예를 들어, Huang et al. (1996) J. Protein Chem. 15:481-9; Kim et al. (1997a) Proc. Natl. Acad. Sci. USA 94:3616-20; Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93:1156-60; Kim et al. (1994) Proc Natl. Acad. Sci. USA 91:883-7; Kim et al. (1997b) Proc. Natl. Acad. Sci. USA 94:12875-9; Kim et al. (1997c) Gene 203:43-9; Kim et al. (1998) Biol. Chem. 379:489-95; Nahon and Raveh (1998) Nucleic Acids Res. 26:1233-9; Smith et al. (1999) Nucleic Acids Res. 27:674-81 참조. ZFN은 비정규 징크 핑거 DNA 결합 도메인을 포함할 수 있다(미국 특허 공개 제2008/0182332호 참조). FokI 제한 엔도뉴클레아제는 DNA를 절단하고 이중 가닥 파괴를 도입하기 위해 뉴클레아제 도메인을 통해 이량체화해야 한다. 결과적으로, 이러한 엔도뉴클레아제로부터 뉴클레아제 도메인을 함유하는 ZFN은 또한 표적 DNA를 절단하기 위해 뉴클레아제 도메인의 이량체화를 필요로 한다. Mani et al. (2005) Biochem. Biophys. Res. Commun. 334:1191-7; Smith et al. (2000) Nucleic Acids Res. 28:3361-9. ZFN의 이량체화는 2 개의 인접한 반대로 배향된 DNA-결합 부위에 의해 용이하게 될 수 있다. Id.
숙주의 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌에 외인성 핵산의 부위-특이적 통합을 위한 방법은 숙주의 세포에 ZFN을 도입하는 단계를 포함할 수 있으며, 여기서 ZFN은 표적 뉴클레오티드 서열을 인식하고 이에 결합하며, 여기서 표적 뉴클레오티드 서열은 숙주의 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌 내에 포함된다. 특정 예에서, 표적 뉴클레오티드 서열은 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌 이외의 임의의 다른 위치에서 숙주의 게놈 내에 포함되지 않는다. 예를 들어, ZFN의 DNA-결합 폴리펩티드는 (예를 들어, ANPEP, CD163, 또는 SIGLEC1 유전자좌를 서열분석함으로써) 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌 내에서 식별된 표적 뉴클레오티드 서열을 인식하고 이에 결합하도록 조작될 수 있다. 숙주의 세포에 ZFN을 도입하는 단계를 포함하는 숙주의 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 성능 유전자좌에 외인성 핵산의 부위-특이적 통합을 위한 방법은 또한 세포에 외인성 핵산을 도입하는 단계를 포함할 수 있으며, 여기서 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌를 포함하는 숙주의 핵산으로 외인성 핵산의 재조합은 표적 서열에 대한 ZFN의 부위-특이적 인식 및 결합(및 ANPEP, CD163, 또는 SIGLEC1 유전자좌를 포함하는 핵산의 후속 절단)을 용이하게 한다.
ANPEP , CD163 , 또는 SIGLEC1 유전자좌에서 통합을 위한 임의적 외인성 핵산
ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 통합을 위한 외인성 핵산은 다음을 포함한다: 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 부위-특이적 통합을 위한 외인성 핵산, 예를 들어 및 제한 없이, ORF; 표적화 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열을 포함하는 핵산; 및 상기 중 어느 하나 또는 둘 다의 적어도 하나를 포함하는 벡터. 따라서, 특정 핵산은 폴리펩티드를 암호화하는 뉴클레오티드 서열, 구조적 뉴클레오티드 서열, 및/또는 DNA-결합 폴리펩티드 인식 및 결합 부위를 포함한다.
부위-특이적 통합을 위한 임의적 외인성 핵산 분자
상기 언급된 바와 같이, 외인성 서열(또한 "공여체 서열" 또는 "공여체" 또는 "이식유전자"로도 불림)의 삽입은 예를 들어 폴리펩티드의 발현, 돌연변이체 유전자의 교정 또는 야생형 유전자의 발현 증가를 위해 제공된다. 공여체 서열은 전형적으로 배치되는 게놈 서열에 대해 동일하지 않음이 쉽게 명백해질 것이다. 공여체 서열은 관심 위치에서 효율적인 상동성-지정 복구(HDR)를 허용하도록 2 개의 상동성 영역에 의해 측면에 있는 비상동 서열을 함유할 수 있다. 추가로, 공여체 서열은 세포 염색질에서 관심 영역에 상동이 아닌 서열을 함유하는 벡터 분자를 포함할 수 있다. 공여체 분자는 세포 염색질에 대해 여러 불연속적인 상동성 영역을 함유할 수 있다. 예를 들어, 관심 영역에 정상적으로 존재하지 않는 서열의 표적화된 삽입을 위해, 상기 서열은 공여체 핵산 분자에 존재하고 관심 영역에서 서열에 대해 상동성 영역에 의해 측면에 있을 수 있다.
공여체 폴리뉴클레오티드는 DNA 또는 RNA, 단일 가닥 또는 이중 가닥일 수 있고 선형 또는 원형 형태로 세포에 도입될 수 있다. 예를 들어, 미국 특허 공개 번호 제2010/0047805호, 제2011/0281361호, 제2011/0207221호, 및 제2013/0326645호 참조. 선형 형태가 도입되는 경우, 공여체 서열의 끝은 당업자에게 알려진 방법에 의해 (예를 들어, 엑소뉴클레올리틱 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기는 선형 분자의 3' 말단에 부가되고/되거나 자기-상보성 올리고뉴클레오티드는 한쪽 또는 양쪽 끝에 결찰된다. 예를 들어, Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889 참조. 분해로부터 외인성 폴리뉴클레오티드를 보호하기 위한 추가 방법은 말단 아미노 기(들)의 부가 및 예를 들어, 포스포로티오에이트, 포스포르아미데이트, 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 변형된 뉴클레오티드간 연결의 사용을 포함하나 이에 제한되지 않는다.
폴리뉴클레오티드는 예를 들어, 복제 기점, 프로모터 및 항생제 내성을 암호화하는 유전자와 같은 추가 서열을 갖는 벡터 분자의 일부로서 세포에 도입될 수 있다. 더욱이, 공여체 폴리뉴클레오티드는 네이키드 핵산으로, 리포솜 또는 폴록사머와 같은 제제와 복합체화된 핵산으로 도입될 수 있거나, 또는 바이러스(예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스 및 인터그라제 결함 렌티바이러스 (IDLV))에 의해 전달될 수 있다.
공여체는 일반적으로 발현이 통합 부위에서 내인성 프로모터, 즉 공여체가 통합된 내인성 유전자(예를 들어, ANPEP, CD163, 또는 SIGLEC1)의 발현을 구동하는 프로모터에 의해 구동되도록 통합된다. 그러나, 공여체는 프로모터 및/또는 인핸서, 예를 들어 구성적 프로모터 또는 유도성 또는 조직 특이적 프로모터를 포함할 수 있음이 명백할 것이다.
또한, 발현에 필요하지는 않지만, 외인성 서열은 또한 전사 또는 번역 조절 서열, 예를 들어, 프로모터, 인핸서, 절연체, 내부 리보솜 진입 부위, 2A 펩티드 및/또는 폴리아데닐화 신호를 암호화하는 서열을 포함할 수 있다.
ANPEP, CD163, 또는 SIGLEC1 유전자좌를 변형시키기 위해 적어도 하나의 ANPEP, CD163, 또는 SIGLEC1 유전자좌에 부위-특이적 방식으로 통합될 수 있는 외인성 핵산은 예를 들어 및 제한 없이, 관심 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 핵산; 작물학적 유전자를 포함하는 핵산; RNAi 분자를 암호화하는 뉴클레오티드 서열을 포함하는 핵산; 또는 ANPEP, CD163, 또는 SIGLEC1 유전자를 분열시키는 핵산을 포함한다.
외인성 핵산은 ANPEP, CD163, 또는 SIGLEC1 유전자좌를 변형시키기 위해 ANPEP, CD163, 또는 SIGLEC1 유전자좌에서 통합될 수 있으며, 여기서 핵산은 뉴클레오티드 서열이 ANPEP, CD163, 또는 SIGLEC1 유전자좌로부터 숙주에서 발현되도록 관심 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함한다. 일부 예에서, 관심 폴리펩티드(예를 들어, 외래 단백질)는 관심 폴리펩티드를 암호화하는 뉴클레오티드 서열로부터 상업적인 양으로 발현된다. 이러한 예에서, 관심 폴리펩티드는 숙주 세포, 조직, 또는 바이오매스로부터 추출될 수 있다.
표적화 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자
표적화 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열은 표적화 엔도뉴클레아제 내에 포함된 폴리펩티드를 암호화하는 천연 뉴클레오티드 서열의 조작(예를 들어, 결찰)에 의해 조작될 수 있다. 예를 들어, DNA-결합 폴리펩티드를 포함하는 단백질을 암호화하는 유전자의 뉴클레오티드 서열은 DNA-결합 폴리펩티드에 상응하는 유전자의 뉴클레오티드 서열을 식별하기 위해 검사될 수 있고, 해당 뉴클레오티드 서열은 DNA-결합 폴리펩티드를 포함하는 표적화 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열의 요소로 사용될 수 있다. 대안적으로, 표적화 엔도뉴클레아제의 아미노산 서열은 예를 들어, 유전 코드의 축퇴성에 따라 표적화 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열을 추론하기 위해 사용될 수 있다.
표적화 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열을 포함하는 예시적인 핵산 분자에서, 뉴클레아제 폴리펩티드를 암호화하는 첫번째 폴리뉴클레오티드 서열의 마지막 코돈, 및 DNA-결합 폴리펩티드를 암호화하는 두번째 폴리뉴클레오티드 서열의 첫번째 코돈은 예를 들어, 인트론 또는 "STOP"에 대한 코딩 없이, 임의의 수의 뉴클레오티드 삼중항에 의해 분리될 수 있다. 마찬가지로, DNA-결합 폴리펩티드를 암호화하는 첫번째 폴리뉴클레오티드 서열을 암호화하는 뉴클레오티드 서열의 마지막 코돈, 및 뉴클레아제 폴리펩티드를 암호화하는 두번째 폴리뉴클레오티드 서열의 첫번째 코돈은 임의의 수의 뉴클레오티드 삼중항에 의해 분리될 수 있다. 뉴클레아제 폴리펩티드를 암호화하는 첫번째 폴리뉴클레오티드 서열의 마지막 코돈(즉, 핵산 서열에서 대부분의 3'), 및 DNA-결합 폴리펩티드를 암호화하는 두번째 폴리뉴클레오티드 서열은 이에 직접적으로 인접한 추가 폴리뉴클레오티드 코딩 서열의 첫번째 코돈과 파지-레지스터에서 융합되거나, 또는 합성 뉴클레오티드 링커(예를 들어, 융합을 달성하기 위해 사용될 수 있는 뉴클레오티드 링커)에 의해 암호화되는 것과 같이 짧은 펩티드 서열로만 그로부터 분리될 수 있다. 이러한 추가 폴리뉴클레오티드 서열의 예는 예를 들어 및 제한 없이, 태그, 표적화 펩티드, 및 효소적 절단 부위를 포함한다. 마찬가지로, 첫번째 및 두번째 폴리뉴클레오티드 서열의 (핵산 서열에서) 대부분의 5'의 첫번째 코돈은 이에 직접적으로 인접한 추가 폴리뉴클레오티드 코딩 서열의 마지막 코돈과 파지-레지스터에서 융합되거나, 또는 짧은 펩티드 서열로만 그로부터 분리될 수 있다.
표적화 엔도뉴클레아제에서 기능적 폴리펩티드(예를 들어, DNA-결합 폴리펩티드 및 뉴클레아제 폴리펩티드)를 암호화하는 폴리뉴클레오티드 서열을 분리하는 서열은 예를 들어, 암호화된 아미노산 서열이 표적화 엔도뉴클레아제의 번역을 유의하게 변경하게 할 가능성이 없도록 임의의 서열로 이루어질 수 있다. 알려진 뉴클레아제 폴리펩티드 및 알려진 DNA-결합 폴리펩티드의 자율 특성으로 인해, 개재 서열은 이들 구조의 각각의 기능을 간섭하지 않을 것이다.
다른 녹아웃 방법
당업계에 알려진 다양한 다른 기술을 사용하여 유전자를 비활성화시켜 녹아웃 동물을 제조하고/하거나 핵산 작제물을 동물에 도입하여 원조 동물을 생산하고 동물 계열을 제조할 수 있으며, 여기서 녹아웃 또는 핵산 작제물은 게놈에 통합된다. 이러한 기술은 제한 없이, 전핵 미세주입(미국 특허 번호 제4,873,191호), 생식 계열에 레트로바이러스 매개 유전자 전달(Van der Putten et al. (1985) Proc. Natl. Acad. Sci. USA 82, 6148-1652), 배아 줄기 세포에 유전자 표적화(Thompson et al. (1989) Cell 56, 313-321), 배아의 전기천공(Lo (1983) Mol. Cell. Biol. 3, 1803-1814), 정자-매개 유전자 전달(Lavitrano et al. (2002) Proc. Natl. Acad. Sci. USA 99, 14230-14235; Lavitrano et al. (2006) Reprod. Fert. Develop. 18, 19-23), 및 난구 또는 유선 세포, 또는 성체, 태아, 또는 배아 줄기 세포와 같은 체세포의 시험관내 형질전환, 이어서 핵 이식(Wilmut et al. (1997) Nature 385, 810-813; 및 Wakayama et al. (1998) Nature 394, 369-374)을 포함한다. 전핵 미세주입, 정자 매개 유전자 전달, 및 체세포 핵 전달이 특히 유용한 기술이다. 게놈적으로 변형된 동물은 생식 계열 세포를 포함하여 모든 세포가 변형된 동물이다. 변형된 모자이크 동물을 생산하는 방법이 사용되는 경우, 동물은 근친 교배될 수 있고 게놈적으로 변형된 자손이 선택될 수 있다. 예를 들어 클로닝은 세포가 배반포 상태에서 변형된 경우 모자이크 동물을 만들기 위해 사용될 수 있거나, 또는 게놈 변형은 단일 세포가 변형된 경우 발생할 수 있다. 성적으로 성숙하지 않도록 변형된 동물은 사용되는 특이적 접근법에 따라, 변형에 대해 동형접합 또는 이형접합일 수 있다. 특정 유전자가 녹아웃 변형에 의해 비활성화되는 경우, 동형접합성이 정상적으로 필요할 것이다. 특정 유전자가 RNA 간섭 또는 우성 음성 전략에 의해 비활성화된다면, 이형접합성이 종종 적절하다.
전형적으로, 배아/접합체 미세주입에서, 핵산 작제물 또는 mRNA는 수정란에 도입되며; 1 또는 2 개의 세포 수정란은 정자 머리로부터의 유전 물질을 함유하는 핵 구조로 사용되고 난자는 원형질 내에서 보인다. 전핵 단계 수정란은 시험관내 또는 생체내에서 수득될 수 있다(즉, 공여체 동물의 난관에서 외과적으로 회수됨). 시험관내 수정란은 다음과 같이 생산될 수 있다. 예를 들어, 돼지 난소는 도살장에서 수집되어 수송 동안 22-28℃에서 유지될 수 있다. 난소는 세척되고 난포 흡입을 위해 단리되며, 4-8 mm 범위의 모낭은 18 게이지 바늘을 사용하고 진공 하에 50 mL 원추형 원심분리 튜브로 흡인할 수 있다. 난포액 및 흡인된 난모세포는 상업용 TL-HEPES(Minitube, 위스콘신주 베로나 소재)로 사전 필터를 통해 헹굴 수 있다. 조밀한 퇴적 덩어리로 둘러쌓인 난모세포가 선택되고 38.7℃ 및 5% CO2에서 가습 공기에서 대략 22 시간 동안 0.1 mg/mL 시스테인, 10 ng/mL 표피 성장 인자, 10% 돼지 난포액, 50 μM 2-메르캅토에탄올, 0.5 mg/ml cAMP, 10 IU/mL 각각의 임신 임신말 혈청 성선자극 호르몬(PMSG) 및 인간 융모성 성성자극 호르몬(hCG)이 보충된 TCM-199 난모세포 성숙 배지(Minitube, 위스콘신주 베로나 소재)에 배치될 수 있다. 후속적으로, 난모세포는 cAMP, PMSG 또는 hCG를 함유하지 않는 신선한 성숙 배지로 이동되고 추가 22 시간 동안 배양될 수 있다. 성숙된 난모세포는 1 분 동안 0.1% 히알루로니다제에서 볼텍싱함으로써 퇴적 세포가 제거될 수 있다.
돼지의 경우, 성숙 난모세포는 5-웰 수정 접시에서 500 μl Minitube PORCPRO IVF 배지 시스템(Minitube, 위스콘신주 베로나 소재)에서 수정될 수 있다. 체외 수정(IVF)을 준비하기 위해, 신선하게 수집되거나 또는 동결된 수퇘지 정액은 세척되고 PORCPRO IVF 배지에서 400,000 개 정자까지 재현탁될 수 있다. 정자 농도는 컴퓨터 지원 정액 분석(SPERMVISION, Minitube, 위스콘신주 베로나 소재)에 의해 분석될 수 있다. 최종 시험관내 정액주입은 수퇘지에 따라 대략 40 개 운동 정자/난모세포의 최종 농도로 10 μl 부피로 수행될 수 있다. 모든 수정 난모세포는 6 시간 동안 5.0% CO2 대기에서 38.7℃에서 배양될 수 있다. 6 시간 정액주입 후, 추정 접합체는 NCSU-23에서 2 회 세척되고 0.5 mL의 동일한 배지로 이동될 수 있다. 이 시스템은 10-30% 다정자 정액주입률로 대부분의 수퇘지에 걸쳐 일상적으로 20-30% 배반포를 생산할 수 있다.
선형화 핵산 작제물 또는 mRNA는 전핵 중 하나 또는 세포질에 주입될 수 있다. 그 다음에 주입된 난자는 수령체 암컷(예를 들어, 수령체 암컷의 난관으로) 옮겨지고 수령체 암컷에서 발달되게 하여 유전자삽입 또는 유전적 편집된 동물을 생산할 수 있다. 특히, 시험관내 수정된 배아는 5 분 동안 15,000 x g에서 원심분리하여 지질을 침전시켜 전핵을 시각화할 수 있다. 배아는 Eppendorf FEMTOJET 주입기를 사용하여 주입될 수 있고 배반포가 형성될 때까지 배양될 수 있다. 배아 절단 및 배반포 형성 속도 및 품질이 기록될 수 있다.
배아는 비동시성 수령체의 자궁으로 외과적으로 옮겨질 수 있다. 전형적으로, 100-200(예를 들어, 150-200) 개 배아는 5.5-인치 TOMCAT® 카테터를 사용하여 난관의 협부-팽대부 접합부에 침착될 수 있다. 수술 후, 실시간 임신 초음파 검사가 수행될 수 있다.
체세포 핵 이식에서, 상기 기재된 핵산 작제물을 포함하는 배아 할구, 태아 섬유아세포, 성체 귀 섬유아세포, 또는 과립막 세포와 같은 유전자삽입 또는 유전적 편집된 세포는 제핵 난모세포에 도입되어 조합 세포를 확립할 수 있다. 난모세포는 극체 근처의 부분 투명대 절개에 의해 제핵된 다음 절개 영역에서 세포질을 밀어낼 수 있다. 전형적으로, 날카로운 경사진 끝이 있는 주입 피펫을 사용하여 유전자삽입 또는 유전적 편집된 세포를 감수 분열 2에서 저지된 제핵 난모세포에 주입한다. 일부 관례에서, 감수 분열-2에서 저지된 난모세포는 난자라고 칭한다. 돼지 또는 소 배아를 생산한 후(예를 들어, 난모세포를 융합하고 활성화함으로써), 배아를 활성화 후 약 20 내지 24 시간에 수령체 암컷의 난관으로 옮긴다. 예를 들어, Cibelli et al. (1998) Science 280, 1256-1258 및 미국 특허 번호 제6,548,741호, 제7,547,816호, 제7,989,657호, 또는 제6,211,429호 참조. 돼지의 경우, 수령체 암컷은 배아를 옮긴 후 대략 20-21 일에 임신 여부가 확인될 수 있다.
표준 번식 기술을 사용하여 초기 이형접합 원조 동물로부터 비활성화된 유전자에 대해 동형접합인 동물을 생성할 수 있다. 그러나 동형접합성은 필요하지 않을 수 있다. 본원에 기재된 유전적 편집된 돼지는 다른 관심 돼지와 사육될 수 있다.
유전적 편집된 동물이 생성되면, 내인성 핵산의 비활성화는 표준 기술을 사용하여 평가될 수 있다. 초기 스크리닝은 서던 블롯 분석에 의해 수행되어 비활성화가 발생했는지 여부를 결정할 수 있다. 서던 분석의 설명을 위해, Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, second edition, Cold Spring Harbor Press, Plainview; N.Y의 섹션 9.37-9.52를 참조한다. 또한 폴리머라제 연쇄 반응(PCR) 기술은 표적 핵산이 증폭되는 절차 또는 기술을 지칭하는 초기 스크리닝 PCR에 사용될 수 있다. 일반적으로, 관심 영역의 끝 또는 그 너머의 서열 정보는 증폭될 주형의 반대 가닥과 서열이 동일하거나 유사한 올리고뉴클레오티드 프라이머를 설계하는 데 이용된다. PCR을 사용하여 총 게놈 DNA 또는 총 세포 RNA로부터의 서열을 포함하여 DNA 뿐만 아니라 RNA로부터의 특이적 서열을 증폭할 수 있다. 프라이머는 전형적으로 14 내지 40 개 뉴클레오티드 길이이지만, 10 개 뉴클레오티드에서 수백 개의 뉴클레오티드 길이까지 이를 수 있다. PCR은 예를 들어 PCR Primer: A Laboratory Manual, ed. Dieffenbach and Dveksler, Cold Spring Harbor Laboratory Press, 1995에 기재되어 있다. 핵산은 또한 리가제 연쇄 반응, 가닥 대체 증폭, 자기-지속 서열 복제, 또는 증폭된 핵산 서열-기반에 의해 증폭될 수 있다. 예를 들어, Lewis (1992) Genetic Engineering News 12,1; Guatelli et al. (1990) Proc. Natl. Acad. Sci. USA 87:1874; 및 Weiss (1991) Science 254:1292 참조. 배반포 단계에서, 배아는 PCR, 서던 혼성화 및 스플린커렛(splinkerette) PCR에 의한 분석을 위해 개별적으로 처리될 수 있다(예를 들어, Dupuy et al. Proc Natl Acad Sci USA (2002) 99:4495 참조).
간섭 RNA
다양한 간섭 RNA(RNAi) 시스템이 알려져 있다. 이중 가닥 RNA(dsRNA)는 상동 유전자 전사체의 서열-특이적 분해를 유도한다. RNA-유도 침묵 복합체(RISC)는 dsRNA를 작은 21-23-뉴클레오티드 작은 간섭 RNA(siRNA)로 대사한다. RISC는 이중 가닥 RNAse(dsRNAse, 예를 들어, Dicer) 및 ssRNAse(예를 들어, 아르고너트 2 또는 Ago2)를 함유한다. RISC는 가이드로서 안티센스 가닥을 활용하여 절단가능한 표적을 찾는다. siRNA 및 microRNA(miRNA) 둘 다 알려져 있다. 유전적으로 편집된 동물에서 유전자를 비활성화하는 방법은 표적 유전자 및/또는 핵산의 발현이 감소되도록 표적 유전자 및/또는 핵산에 대한 RNA 간섭을 유도하는 것을 포함한다.
예를 들어 외인성 핵산 서열은 폴리펩티드를 암호화하는 핵산에 대한 RNA 간섭을 유도할 수 있다. 예를 들어, 표적 DNA에 상동인 이중 가닥 작은 간섭 RNA(siRNA) 또는 작은 헤어핀 RNA(shRNA)를 사용하여 해당 DNA의 발현을 감소시킬 수 있다. siRNA에 대한 작제물은 예를 들어 하기 참고문헌에 기재된 바와 같이 생산될 수 있다: Fire et al. (1998) Nature 391:806; Romano and Masino (1992) Mol. Microbiol. 6:3343; Cogoni et al. (1996) EMBO J. 15:3153; Cogoni and Masino (1999) Nature 399:166; Misquitta and Paterson (1999) Proc. Natl. Acad. Sci. USA 96:1451; 및 Kennerdell and Carthew (1998) Cell 95:1017. shRNA에 대한 작제물은 McIntyre and Fanning (2006) BMC Biotechnology 6:1에 기재된 바와 같이 생산될 수 있다. 일반적으로, shRNA는 상보성 영역을 함유하는 단일 가닥 RNA 분자로서 전사되며, 이는 어닐링하고 짧은 헤어핀을 형성할 수 있다.
특이적 유전자에 대해 지시된 단일 개별 기능적 siRNA 또는 miRNA를 찾을 확률이 높다. 예를 들어, siRNA의 특이적 서열의 예측가능성은 약 50%이지만 간섭 RNA 중 적어도 하나가 효과적일 것이라는 강한 확신으로 다수의 간섭 RNA를 만들 수 있다.
시험관내 세포, 생체내 세포, 또는 ANPEP, CD163, 또는 SIGLEC1을 암호화하는 유전자에 대해 지시된 RNAi를 발현하는 가축 동물과 같은 유전적으로 편집된 동물이 사용될 수 있다. 예를 들어, RNAi는 siRNA, shRNA, dsRNA, RISC 및 miRNA로 이루어진 군으로부터 선택될 수 있다.
유도성 시스템
유도성 시스템을 사용하여 ANPEP, CD163, 또는 SIGLEC1 유전자를 비활성화시킬 수 있다. 유전자의 비활성화의 공간적 및 시간적 제어를 허용하는 다양한 유도성 시스템이 알려져 있다. 일부는 돼지 동물에서 생체 내에서 기능하는 것으로 입증되었다.
유도성 시스템의 예는 핵산의 전사를 조절하는 데 사용될 수 있는 테트라사이클린(tet)-온 프로모터 시스템이다. 이 시스템에서, 돌연변이된 Tet 억제인자(TetR)는 단순 헤르페스 바이러스 VP 16 트랜스-활성인자 단백질의 활성화 도메인에 융합되어 tet 또는 독시사이클린(dox)에 의해 조절되는 테트라사이클린-제어 전사 활성인자(tTA)를 생성한다. 항생제의 부재 하에 전사는 최소화되지만, tet 또는 dox의 존재 하에 전사는 유도된다. 대안적인 유도성 시스템은 엑디손 또는 라파마이신 시스템을 포함한다. 엑디손은 엑디손 수용체의 이형이량체 및 울트라스피라클 유전자(USP) 산물에 의해 생산이 제어되는 곤충 털갈이 호르몬이다. 발현은 엑디손 또는 무리스테론 A와 같은 엑디손의 유사체로의 처리에 의해 유도된다. 유도성 시스템을 촉발시키기 위해 동물에 투여되는 제제를 유도제라고 지칭한다.
테트라사이클린-유도성 시스템 및 Cre/loxP 리콤비나제 시스템(구성적 또는 유도성)은 보다 흔히 사용되는 유도성 시스템 중 하나이다. 테트라사이클린-유도성 시스템은 테트라사이클린-제어 전사활성인자(tTA)/역 tTA(rtTA)를 수반한다. 이들 시스템을 생체내에서 사용하는 방법은 2 개 계열의 유전적으로 편집된 동물을 생성하는 것을 수반한다. 하나의 동물 계열은 선택된 프로모터의 제어 하에 활성인자(tTA, rtTA, 또는 Cre 리콤비나제)를 발현한다. 또 다른 동물 계열은 수령체를 발현하며, 여기서 관심 유전자(또는 변경될 유전자)의 발현은 tTA/rtTA 전사활성인자에 대한 표적 서열의 제어 하에 있다(또는 loxP 서열 측면에 있다). 2 종의 동물을 교미하면 유전자 발현을 제어한다.
테트라사이클린-의존적 조절 시스템(tet 시스템)은 2 개의 구성요소, 즉, 테트라사이클린-제어 전사활성인자(tTA 또는 rtTA) 및 테트라사이클린-의존적 방식으로 하류 cDNA의 발현을 제어하는 tTA/rtTA-의존적 프로모터에 의존한다. 테트라사이클린 또는 이의 유도체(예컨대 독시사이클린)의 부재 하에, tTA는 tetO 서열에 결합하여, tTA-의존적 프로모터의 전사 활성화를 허용한다. 그러나, 독시사이클린의 존재 하에, tTA는 표적과 상호작용할 수 없으며 전사가 발생하지 않는다. tTA를 사용하는 tet 시스템은 tet-OFF라고 불리는 데, 테트라사이클린 또는 독시사이클린이 전사 하향 조절을 허용하기 때문이다. 테트라사이클린 또는 이의 유도체의 투여는 생체내에서 이식유전자 발현의 시간적 제어를 허용한다. rtTA는 독시사이클린의 부재 하에 기능하지 않지만 전사활성화를 위한 리간드의 존재를 필요로 하는 tTA의 변이체이다. 따라서 이 tet 시스템은 tet-ON이라고 불린다. tet 시스템은 예를 들어, 리포터 유전자, 종양유전자, 또는 신호전달 캐스케이드에 수반되는 단백질을 암호화하는 여러 이식유전자의 유도성 발현을 위해 생체내에서 사용되었다.
Cre/lox 시스템은 2 개의 떨어져 있는 Cre 인식 서열 사이, 즉, loxP 부위를 교차함으로써 부위-특이적 재조합을 촉매하는 Cre 리콤비나제를 사용한다. 2 개의 loxP 서열 사이에 도입된 DNA 서열(플록싱화 DNA라고 불림)은 Cre-매개 재조합에 의해 절제된다. 공간적 제어(조직- 또는 세포-특이적 프로모터 사용), 또는 시간적 제어(유도성 시스템 사용)를 사용하여 유전자삽입 및/또는 유전적 편집된 동물에서 Cre 발현의 제어는 2 개의 loxP 부위 사이의 DNA 절제 제어를 초래한다. 하나의 적용은 조건부 유전자 비활성화(조건부 녹아웃)를 위한 것이다. 또 다른 접근법은 단백질 과발현을 위한 것이며, 여기서 플록싱화 정지 코돈은 프로모터 서열 및 관심 DNA 사이에 삽입된다. 유전적으로 편집된 동물은 Cre가 발현될 때까지 이식유전자를 발현하지 않아서, 플록싱화 정지 코돈의 절제로 이어진다. 이 시스템은 B 림프구에서 조직-특이적 종양발생 및 제어된 항원 수용체 발현에 적용되었다. 또한 유도성 Cre 리콤비나제가 발달되었다. 유도성 Cre 리콤비나제는 외인성 리간드의 투여에 의해서만 활성화된다. 유도성 Cre 리콤비나제는 원래 Cre 리콤비나제 및 특이적 리간드-결합 도메인을 함유하는 융합 단백질이다. Cre 리콤비나제의 기능적 활성은 융합 단백질에서 이 특이적 도메인에 결합할 수 있는 외부 리간드에 의존한다.
시험관내 세포, 생체내 세포, 또는 유도성 시스템의 제어 하에 ANPEP, CD163, 또는 SIGLEC1 유전자를 포함하는 가축 동물과 같은 유전적으로 편집된 동물이 사용될 수 있다. 동물의 염색체 변형은 게놈 또는 모자이크일 수 있다. 예를 들어, 유도성 시스템은 Tet-On, Tet-Off, Cre-lox, 및 Hif1 알파로 이루어진 군으로부터 선택될 수 있다.
벡터 및 핵산
녹아웃 목적, 유전자의 비활성화, 유전자의 발현 수득, 또는 다른 목적을 위해 다양한 핵산이 세포에 도입될 수 있다. 본원에 사용된 바와 같이, 용어 핵산은 DNA, RNA, 및 핵산 유사체, 및 이중 가닥 또는 단일 가닥(즉, 센스 또는 안티센스 단일 가닥)인 핵산을 포함한다. 핵산 유사체는 염기 모이어티, 당 모이어티, 또는 포스페이트 백본에서 변형되어 예를 들어, 핵산의 안정성, 혼성화, 또는 용해도를 개선시킬 수 있다. 염기 모이어티에서의 변형은 데옥시티미딘의 경우 데옥시우리딘, 및 데옥시시티딘의 경우 5-메틸-2'-데옥시시티딘 및 5-브로모-2'-독시시티딘을 포함한다. 당 모이어티의 변형은 2'-O-메틸 또는 2'-O-알릴 당을 형성하기 위해 리보스 당의 2' 히드록실의 변형을 포함한다. 데옥시리보스 포스페이트 백본은 각 염기가 6 원 모르폴리노 고리에 연결된 모르폴리노 핵산, 또는 데옥시포스페이트 백본이 유사펩티드 백본에 의해 대체되고 4 개의 염기가 유지되는 펩티드 핵산을 생성하도록 변형될 수 있다. Summerton and Weller (1997) Antisense Nucleic Acid Drug Dev. 7(3):187; 및 Hyrup et al. (1996) Bioorgan. Med. Chem. 4:5 참조. 게다가, 데옥시포스페이트 백본은 예를 들어, 포스포로티오에이트 또는 포스포로디티오에이트 백본, 포스포로아미다이트, 또는 알킬 포스포트리에스테르 백본으로 대체될 수 있다.
표적 핵산 서열은 프로모터와 같은 조절 영역에 작동가능하게 연결될 수 있다. 조절 영역은 돼지 조절 영역일 수 있거나 또는 다른 종으로부터의 것일 수 있다. 본원에 사용된 바와 같이, 작동가능하게 연결된은 표적 핵산의 전사를 허용하거나 또는 용이하게 하는 방식으로 핵산 서열에 관한 조절 영역의 위치를 지칭한다.
임의의 유형의 프로모터는 표적 핵산 서열에 작동가능하게 연결될 수 있다. 프로모터의 예는 제한 없이, 조직-특이적 프로모터, 구성적 프로모터, 유도성 프로모터, 및 특정 자극에 반응성 또는 비반응성 프로모터를 포함한다. 적합한 조직 특이적 프로모터는 베타 세포에서 핵산 전사체의 우선적 발현을 초래할 수 있으며 예를 들어, 인간 인슐린 프로모터를 포함한다. 다른 조직 특이적 프로모터는 예를 들어, 간세포 또는 심장 조직에서 우선적 발현을 초래할 수 있으며 각각 알부민 또는 알파-미오신 중쇄 프로모터를 포함할 수 있다. 유의한 조직 또는 시간-특이성 없이 핵산 분자의 발현을 용이하게 하는 프로모터가 사용될 수 있다(즉, 구성적 프로모터). 예를 들어, 베타-액틴 프로모터 예컨대 닭 베타-액틴 유전자 프로모터, 유비퀴틴 프로모터, miniCAG 프로모터, 글리세르알데히드-3-포스페이트 데히드로게나제(GAPDH) 프로모터, 또는 3-포스포글리세레이트 키나제(PGK) 프로모터, 뿐만 아니라 바이러스 프로모터 예컨대 단순 헤르페스 바이러스 티미딘 키나제(HSV-TK) 프로모터, SV40 프로모터, 또는 사이토메갈로바이러스(CMV) 프로모터가 사용될 수 있다. 예를 들어, 닭 베타 액틴 유전자 프로모터 및 CMV 인핸서의 융합이 프로모터로서 사용될 수 있다. 예를 들어, Xu et al. (2001) Hum. Gene Ther. 12:563; 및 Kiwaki et al. (1996) Hum. Gene Ther. 7:821 참조.
핵산 작제물에 유용할 수 있는 추가 조절 영역은 폴리아데닐화 서열, 번역 제어 서열(예를 들어, 내부 리보솜 진입 세그먼트, IRES), 인핸서, 유도성 요소, 또는 인트론을 포함하나 이에 제한되지 않는다. 이러한 조절 영역이 필요하지 않을 수 있지만, 전사, mRNA의 안정성, 번역 효율 등에 영향을 미침으로써 발현을 증가시킬 수 있다. 이러한 조절 영역은 세포(들)에서 핵산의 최적 발현을 수득하기 위해 바람직한 경우 핵산 작제물에 포함될 수 있다. 그러나, 이러한 추가 요소 없이 충분한 발현이 때때로 수득될 수 있다.
신호 펩티드 또는 선택가능한 마커를 암호화하는 핵산 작제물이 사용될 수 있다. 신호 펩티드는 암호화된 폴리펩티드가 특정 세포 위치(예를 들어, 세포 표면)에 지시되도록 사용될 수 있다. 선택가능한 마커의 비제한적인 예는 푸로마이신, 간시클로비르, 아데노신 데아미나제(ADA), 아미노글리코시드 포스포트랜스퍼라제(neo, G418, APH), 디히드로폴레이트 리덕타제(DHFR), 히그로마이신-B-포스프트랜스퍼라제, 티미딘 키나제(TK), 및 크산틴-구아닌 포스포리보실트랜스퍼라제(XGPRT)를 포함한다. 이러한 마커는 배양물에서 안정한 형질전환체를 선택하는 데 유용하다. 다른 선택가능한 마커는 녹색 형광 단백질 또는 황색 형광 단백질과 같은 형광 폴리펩티드를 포함한다.
선택가능한 마커를 암호화하는 서열은 예를 들어, Cre 또는 Flp와 같은 리콤비나제에 대한 인식 서열 측면에 있을 수 있다. 예를 들어, 선택가능한 마커는 작제물로부터 절제될 수 있도록 loxP 인식 부위(Cre 리콤비나제에 의해 인식되는 34-bp 인식 부위) 또는 FRT 인식 부위 측면에 있을 수 있다. Cre/lox 기술의 검토를 위해 Orban, et al., Proc. Natl. Acad. Sci. (1992) 89:6861, 및 Brand 및 Dymecki, Dev. Cell (2004) 6:7 참조. 또한 선택가능한 마커 유전자에 의해 중단된 Cre- 또는 Flp-활성화가능한 이식유전자를 함유하는 전위인자를 사용하여 이식유전자의 조건부 발현을 가진 동물을 수득할 수 있다. 예를 들어, 마커/이식유전자의 발현을 구동하는 프로모터는 편재성 또는 조직-특이적일 수 있으며, F0 동물(예를 들어, 돼지)에서 마커의 편재성 또는 조직-특이적 발현을 초래할 수 있다. 이식유전자의 조직 특이적 활성화는 예를 들어, 마커-중단된 이식유전자를 조직-특이적 방식으로 Cre 또는 Flp를 발현하는 돼지에 편재적으로 발현하는 돼지를 교배하거나, 또는 Cre 또는 Flp 리콤비나제를 편재적으로 발현하는 돼지에 조직-특이적 방식으로 마커-중단된 이식유전자를 발현하는 돼지를 교배함으로써 달성될 수 있다. 이식유전자의 제어된 발현 또는 마커의 제어된 절제는 이식유전자의 발현을 허용한다.
외인성 핵산은 폴리펩티드를 암호화할 수 있다. 폴리펩티드를 암호화하는 핵산 서열은 암호화된 폴리펩티드의 후속 조작을 용이하게 하도록(예를 들어, 국소화 또는 검출을 용이하게 하도록) 설계된 "태그"를 암호화하는 태그 서열을 포함할 수 있다. 태그 서열은 암호화된 태그가 폴리펩티드의 카르복실 또는 아미노 말단에 위치하도록 폴리펩티드를 암호화하는 핵산 서열에 삽입될 수 있다. 암호화된 태그의 비제한적인 예는 글루타티온 S-트랜스퍼라제(GST) 및 FLAGTM태그(Kodak, 코네티컷주 뉴헤이븐 소재)를 포함한다.
핵산 작제물은 SssI CpG 메틸라제(New England Biolabs, 매사추세츠주 입시치 소재)를 사용하여 메틸화될 수 있다. 일반적으로, 핵산 작제물은 37℃에서 완충액에서 S-아데노실메티오닌 및 SssI CpG-메틸라제와 배양될 수 있다. 과메틸화는 37℃에서 1 시간 동안 1 유닛의 HinP1I 엔도뉴클레아제와 작제물을 배양하고 아가로스 겔 전기영동에 의해 검정함으로써 확인될 수 있다.
핵산 작제물은 다양한 기술을 사용하여 예를 들어, 생식 세포 예컨대 난모세포 또는 난자, 원조 세포, 성체 또는 배아 줄기 세포, 원시 생식 세포, 신장 세포 예컨대 PK-15 세포, 섬 세포, 베타 세포, 간 세포, 또는 섬유아세포 예컨대 진피 섬유아세포를 포함하는 임의의 유형의 배아, 태아, 또는 성체 동물 세포에 도입될 수 있다. 기술의 비제한적인 예는 전위인자 시스템, 곤충 세포, 또는 리포솜일 수 있는 재조합 바이러스 또는 핵산을 세포에 전달할 수 있는 전기천공, 미세주입, 또는 칼슘 포스페이트 침전과 같은 다른 비바이러스 방법의 사용을 포함한다.
전위인자 시스템에서, 핵산 작제물의 전사 유닛, 즉, 외인성 핵산 서열에 작동가능하게 연결된 조절 영역은 전위인자의 도립된 반복부의 측면에 있다. 예를 들어, Sleeping Beauty(미국 특허 번호 제6,613,752호 및 미국 공개 번호 제2005/0003542호 참조); Frog Prince(Miskey et al. (2003) Nucleic Acids Res. 31:6873); Tol2(Kawakami (2007) Genome Biology 8(Suppl.1):S7; Minos(Pavlopoulos et al. (2007) Genome Biology 8(Suppl.1):S2); Hsmar1(Miskey et al. (2007)) Mol Cell Biol. 27:4589); 및 Passport를 포함하는 여러 전위인자 시스템은 마우스, 인간, 및 돼지 세포를 포함하는 세포에 핵산을 도입하도록 개발되었다. Sleeping Beauty 전위인자가 특이 유용하다. 트랜스포사제는 외인성 핵산과 동일한 핵산 작제물 상의 암호화된 단백질로 전달될 수 있거나, 별개의 핵산 작제물 상에 도입되거나, 또는 mRNA(예를 들어, 시험관내-전사 및 캡핑된 mRNA)로 제공될 수 있다.
절연체 요소는 또한 외인성 핵산의 발현을 유지하고 숙주 유전자의 원치않은 전사를 억제하기 위해 핵산 작제물에 포함될 수 있다. 예를 들어, 미국 공개 번호 제2004/0203158호 참조. 전형적으로, 절연체 요소는 전사 유닛의 각 측면에 있고 전위인자의 도립된 반복부 내부에 있다. 절연체 요소의 비제한적인 예는 매트릭스 부착 영역-(MAR) 유형 절연체 요소 및 경계-유형 절연체 요소를 포함한다. 예를 들어, 미국 특허 번호 제6,395,549호, 제5,731,178호, 제6,100,448호, 및 제5,610,053호, 및 미국 공개 번호 제2004/0203158호 참조.
핵산은 벡터에 혼입될 수 있다. 벡터는 담체에서 표적 DNA로 이동하도록 설계된 임의의 특이적 DNA 세그먼트를 포함하는 광범위한 용어이다. 벡터는 발현 벡터, 또는 게놈 또는 에피솜, 플라스미드, 또는 심지어 바이러스/파지 DNA 세그먼트와 같은 다른 표적화된 DNA 서열에 DNA 삽입을 초래하는데 필요한 구성요소의 세트인 벡터 시스템으로 지칭될 수 있다. 동물에서 유전자 전달에 사용되는 바이러스 벡터(예를 들어, 레트로바이러스, 아데노 관련 바이러스 및 통합 파지 바이러스), 및 비바이러스 벡터(예를 들어, 전위인자)와 같은 벡터 시스템은 두 가지 기본적인 구성요소를 갖는다: 1) DNA(또는 cDNA에 역전사된 RNA)로 구성된 벡터 및 2) 트랜스포사제, 리콤비나제, 또는 벡터 및 DNA 표적 서열을 모두 인식하고 벡터를 표적 DNA 서열에 삽입하는 다른 인터그라제 효소. 벡터는 가장 흔히 하나 이상의 발현 제어 서열을 포함하는 하나 이상의 발현 카세트를 함유하며, 여기서 발현 제어 서열은 각각 또 다른 DNA 서열 또는 mRNA의 전사 및/또는 번역을 제어하고 조절하는 DNA 서열이다.
많은 상이한 유형의 벡터가 알려져 있다. 예를 들어, 플라스미드 및 바이러스 벡터, 예를 들어, 레트로바이러스 벡터가 알려져 있다. 포유류 발현 플라스미드는 전형적으로 복제 기점, 적합한 프로모터 및 임의적 인핸서, 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수여체 부위, 전사 종결 서열, 및 5' 측면에 있는 비전사 서열을 갖는다. 벡터의 예는 플라스미드(또한 또 다른 벡터 유형의 담체일 수 있음), 아데노바이러스, 아데노 관련 바이러스(AAV), 렌티바이러스(예를 들어, 변형된 HIV-1, SIV 또는 FIV), 레트로바이러스(예를 들어, ASV, ALV 또는 MoMLV), 및 전위인자(예를 들어, Sleeping Beauty, P-요소, Tol-2, Frog Prince, piggyBac)를 포함한다.
본원에 사용된 바와 같이, 용어 핵산은 예를 들어, cDNA, 게놈 DNA, 합성(예를 들어, 화학적으로 합성된) DNA, 뿐만 아니라 자연적으로 발생하고 화학적으로 변형된 핵산, 예를 들어, 합성 염기 또는 대안적인 백본을 포함하는 RNA 및 DNA를 모두 지칭한다. 핵산 분자는 이중 가닥 또는 단일 가닥(즉, 센스 또는 안티센스 단일 가닥)일 수 있다.
원조 동물, 동물 계열, 특성, 및 생식
원조 동물은 클로닝 및 본원에 기재된 다른 방법에 의해 생산될 수 있다. 원조는 접합체 또는 1차 세포가 동형접합 변형을 겪는 경우에서와 같이, 유전적 변경에 대해 동형접합일 수 있다. 유사하게, 이형접합인 원조가 또한 만들어질 수 있다. ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 동물의 경우에, 원조는 바람직하게는 이형접합이다. 원조는 게놈적으로 변형될 수 있으며, 이는 게놈에서 모든 세포가 변형을 겪음을 의미한다. 원조는 벡터가 전형적으로 배반포 단계에서 배아에서 복수의 세포 중 하나에 도입될 때 발생할 수 있는 것처럼 변형에 대해 모자이크될 수 있다. 모자이크 동물의 자손을 시험하여 게놈적으로 변형된 자손을 식별할 수 있다. 동물 계열은 성적으로 또는 보조 생식 기술에 의해 생식될 수 있는 동물의 풀이 생성되었을 때 확립되며, 이형 또는 동형접합 자손은 일관되게 변형을 나타낸다.
가축에서, 많은 대립유전자는 생산 특성, 유형 특성, 작업능력 특성, 및 다른 기능적 특성과 같은 다양한 특성과 연계되는 것으로 알려져 있다. 당업자는 이들 특성을 모니터링하고 정량화하는 데 익숙하며, 예를 들어, Visscher et al., Livestock Production Science, 40 (1994) 123-137, 미국 특허 번호 제7,709,206호, US 2001/0016315, US 2011/0023140, 및 US 2005/0153317. 동물 계열은 생산 특성, 유형 특성, 작업능력 특성, 수정 특성, 모육 특성, 및 질환 내성 특성으로 이루어진 군의 특성으로부터 선택된 특성을 포함할 수 있다. 추가 특성은 재조합 유전자 산물의 발현을 포함한다.
원하는 특성 또는 특성들을 가진 동물은 변형시켜 성적 성숙을 방지할 수 있다. 동물은 성숙될 때까지 무균 상태이므로, 동물의 보급을 제어하는 수단으로 성적 성숙을 조절하는 것이 가능하다. 따라서 하나 이상의 특성을 갖도록 사육되거나 또는 변형된 동물은 수령체가 동물을 번식하고 특성의 가치를 자신에게 적절하게 할 위험이 감소된 수령체에 제공될 수 있다. 예를 들어, 동물의 게놈은 변형될 수 있으며, 여기서 변형은 성적 성숙 유전자의 비활성화를 포함하며, 여기서 야생형 동물에서 성적 성숙 유전자는 성적 성숙에 대한 선택적 인자를 발현한다. 동물은 동물에서 성적 성숙을 유도하기 위해 유전자의 발현 손실로 인해 유발된 결핍을 치료하기 위해 화합물을 투여함으로써 치료될 수 있다.
성적 성숙을 유도하기 위해 화합물의 투여를 필요로 하는 동물의 번식은 치료 시설에서 유리하게 성취될 수 있다. 치료 시설은 일관된 동물을 효율적으로 생산하기 위해 잘 관리된 스톡에서 표준화된 프로토콜을 구현할 수 있다. 동물 자손은 사육될 복수의 위치에 분포될 수 있다. 따라서 농장 및 농장주(목장 및 목장주를 포함하는 용어)는 명시된 범위의 연령 및/또는 체중 및/또는 특성을 갖는 원하는 수의 자손을 주문하여 원하는 시간 및/또는 위치에 이들을 전달할 수 있다. 그 다음에 수령체, 예를 들어, 농장주는 동물을 사육하고 원하는 대로 시장에 전달할 수 있다.
비활성화된 성적 성숙 유전자를 갖는 유전적으로 편집된 가축 동물이 (예를 들어, 하나 이상의 위치로, 복수의 농장으로) 전달될 수 있다. 동물은 약 1 일령 내지 약 180 일령일 수 있다. 동물은 하나 이상의 특성(예를 들어 원하는 특성 또는 고가치 특성 또는 신규한 특성 또는 재조합 특성을 나타내는 것)을 가질 수 있다.
본 발명은 상세하게 기재되었으므로, 변형 및 변경이 청구된 청구범위에 정의된 본 발명의 범위를 벗어나지 않고 가능함이 명백할 것이다.
실시예
하기 비제한적인 실시예는 본 발명을 추가로 예시하기 위해 제공된다.
실시예 1 내지 3은 CD163 유전자에서 변형된 염색체 서열을 갖는 돼지의 생성, 및 이러한 돼지의 PRRSV 감염에 대한 내성을 기재한다. 실시예 4는 SIGLEC1 녹아웃 돼지의 생성을 기재한다. 실시예 5 및 6은 ANPEP 유전자에서 변형된 염색체 서열을 갖는 돼지의 생성 및 이러한 돼지의 TGEV에 대한 내성을 기재한다. 실시예 7은 CD163, SIGLEC1, 및 ANPEP로부터 선택된 적어도 2 개의 유전자에서 염색체 변형에 대해 이형접합인 돼지의 생성을 기재한다. 실시예 8은 실시예 7에서 생성된 돼지를 사용하여 CD163, SIGLEC1, 및 ANPEP로부터 선택된 적어도 2 개의 유전자에서 염색체 변형에 대해 동형접합인 동물을 생성하는 방법 및 이러한 동물을 TGEV 및 PRRSV에 대한 내성에 대해 시험하는 방법을 기재한다.
실시예 1: 시험관내-유래 난모세포 및 배아로부터 유전적으로 조작된 돼지를 생산하기 위한 CRISPR/Cas9 시스템의 사용
징크-핑거 뉴클레아제(ZFN), 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 및 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR)/CRISPR-관련(Cas9) 시스템의 구성요소와 같은 호밍 엔도뉴클레아제를 기재하는 최근 보고서는 돼지에서의 유전적 조작(GE)이 이제 더 효율적일 수 있음을 시사한다. 표적화된 호밍 엔도뉴클레아제는 게놈의 특이적 위치에서 이중 가닥 파괴(DSB)를 유도할 수 있고 공여체 DNA가 제공되는 경우 비상동 말단 연결(NHEJ) 또는 상동 재조합(HR)의 자극을 통해 무작위 돌연변이를 유발할 수 있다. HR을 통한 게놈의 표적화된 변형은 공여체 DNA가 표적화된 뉴클레아제와 함께 제공되는 경우 호밍 엔도뉴클레아제로 달성될 수 있다. 체세포에 특이적 변형을 도입한 후, 이들 세포를 사용하여 SCNT를 통해 다양한 목적을 위한 GE 돼지를 생산하였다. 따라서, 호밍 엔도뉴클레아제는 GE 돼지를 생성하는 유용한 도구이다. 상이한 호밍 엔도뉴클레아제 중에서, 방어 메커니즘으로 사용되는 원핵생물로부터 채택된 CRISPR/Cas9 시스템은 효과적인 접근법으로 보인다. 자연에서, Cas9 시스템은 세 가지 구성요소, 즉, 표적 서열에 상보적인 영역을 함유하는 RNA(~20 개 염기)(시스-억제 RNA[crRNA]), crRNA에 상보적인 영역을 함유하는 RNA(트랜스-활성화 crRNA[tracrRNA]), 및 이 복합체의 효소적 단백질 구성요소인 Cas9를 필요로 한다. 단일 가이드 RNA(gRNA)는 염기쌍 crRNA 및 tracrRNA의 역할을 제공하도록 구성될 수 있다. gRNA/단백질 복합체는 게놈을 스캔하고 crRNA/gRNA에 상보적인 영역에서 DSB를 촉매할 수 있다. 다른 설계된 뉴클레아제와 달리, 관심 유전자를 표적으로 하는 데 필요한 시약을 구성하기 위해 짧은 올리고머만 설계될 필요가 있지만 ZFN 및 TALEN을 어셈블리하기 위해 일련의 클로닝 단계가 필요하다.
유전자 분열에 대한 현재 표준 방법과 달리, 설계된 뉴클레아제의 사용은 GE에 대한 출발 물질로서 접합체를 사용할 기회를 제공한다. 가축에서 유전자 분열을 위한 표준 방법은 배양된 세포의 HR 및 체세포 핵 이식(SCNT)에 의한 배아의 후속 재구성을 수반한다. SCNT를 통해 생산된 클로닝된 동물은 때때로 발달 결함의 징후를 나타내기 때문에, SCNT/GE 원조의 자손은 전형적으로 연구에 사용되어 원조 동물이 실험에 사용되는 경우 발생할 수 있는 SCNT 이상 및 표현형을 교란시키는 것을 피한다. 설치류와 비교하여 돼지의 긴 임신 기간 및 더 많은 수용 비용을 고려하면, 번식에 대한 필요성이 감소된 데 따른 시간 및 비용 이익이 있다. 최근 보고서는 ZFN 및 TALEN을 돼지 접합체에 직접 주입하면 내인성 유전자를 분열시키고 원하는 돌연변이를 갖는 새끼 돼지를 생산할 수 있음을 입증하였다. 그러나, 약 10%의 새끼 돼지만이 표적 유전자의 이중 대립유전자 변형을 나타냈으며 일부는 모자이크 유전자형을 제시하였다. 최근 논문은 CRISPR/ Cas9 시스템이 배아 발달중에 돌연변이를 유도하고 ZFN 또는 TALEN보다 더 높은 효율로 GE 돼지를 생산할 수 있음을 입증하였다. 그러나, CRISPR/ Cas9 시스템으로부터 생산된 GE 돼지는 또한 모자이크 유전자형을 보유하였다. 게다가, 상기 언급된 모든 연구는 실험을 위해 생체내에서 유도된 접합체를 사용하였으며, 충분한 수의 접합체를 수득하기 위해 집중적인 노동 및 수많은 암퇘지가 필요하다.
본 실시예는 시험관내 유래된 접합체의 주입 및 체세포 변형 후 SCNT를 통해 GE 돼지를 생성하는 데 CRISPR/ Cas9 시스템을 사용하는 효율적인 접근법을 기재한다. 2 개의 내인성 유전자(CD163CD1D) 및 하나의 이식유전자(eGFP)가 표적화되었으며, 시험관내에서 유래된 난모세포 또는 접합체만을 각각 SCNT 또는 RNA 주입에 사용하였다. CD163은 돼지 산업에 상당한 경제적 손실을 유발하는 것으로 알려진 바이러스인 돼지 생식 및 호흡기 증후군 바이러스에 의한 생산적 감염에 필요한 것으로 보인다. CD1D는 비고전적인 주요 조직접합성 복합 단백질로 간주되며 지질 항원을 불변 자연 살해 T 세포에 제시하는 데 수반된다. 이들 유전자가 겹핍된 돼지는 농업 및 생물의학에 대한 모델이 되도록 설계되었다. eGFP 이식유전자는 예비 개념 증명 실험 및 방법의 최적화를 위한 표적으로 사용되었다.
재료 및 방법
화학물질 및 시약. 달리 언급되지 않는 한, 본 연구에 사용되는 모든 화학물질은 Sigma로부터 구입하였다.
특이적 CRISPR에 결합하는 gRNA의 설계
가이드 RNA를 야생형 CD163에 고유하고 도메인 swap 표적화 벡터(하기 기재됨)에 존재하지 않는 CD163의 엑손 7 내의 영역으로 설계하여, CRISPR이 야생형 CD163 내에서 DSB를 초래하지만 도메인 swap 표적화 벡터에서는 초래하지 않도록 하였다. 표적화 벡터가 에스. 피오게네스(Spy) 프로토스페이서 인접 모티프(PAM)를 변경하는 단일 뉴클레오티드 다형성(SNP)을 도입할 4 개의 위치만이 있었다. 다음을 포함하여 4 개의 표적을 모두 선택하였다:
(서열번호: 1) GGAAACCCAGGCTGGTTGGAgGG (CRISPR 10),
(서열번호: 2) GGAACTACAGTGCGGCACTGtGG (CRISPR 131),
(서열번호: 3) CAGTAGCACCCCGCCCTGACgGG (CRISPR 256) 및
(서열번호: 4) TGTAGCCACAGCAGGGACGTcGG (CRISPR 282).
PAM은 각 gRNA에서 굵은 글씨로 식별할 수 있다.
CD1D 돌연변이의 경우, CRISPR 표적에 대한 검색을 1차 전사체의 처음 1000 bp 내에서 코딩 가닥으로 임의로 제한하였다. 그러나, RepeatMasker[26]("돼지" 반복 라이브러리)는 1차 전사체의 염기 943에서 시작하는 반복 요소를 식별하였다. 그 다음에 CRISPR 표적에 대한 검색을 1차 전사체의 처음 942 bp로 제한하였다. 마지막 Spy PAM은 염기 873에 위치하므로 검색을 1차 전사체의 첫번째 873 bp로 추가로 제한하였다. 첫번째 표적(CRISPR 4800)을 선택하였는 데 이는 1차 전사체에서 염기 42에 위치하는 개시 코돈과 중첩되었기 때문이다(CCAGCCTCGCCCAGCGACATgGG(서열번호: 5)). 2 개의 추가 표적(CRISPR 5620 및 5626)을 선택하였는 데 이들은 임의로 선택된 영역 내 첫번째 선택에 가장 멀리 떨어져 있기 때문이다(CTTTCATTTATCTGAACTCAgGG(서열번호: 6)) 및 TTATCTGAACTCAGGGTCCCcGG(서열번호: 7)). 이들 표적은 중첩된다. 개시 코돈과 관련하여, 가장 근접한 Spy PAM은 시각적 평가에 의해 결정된 바와 같이 광범위한 동종중합체 서열에 함유된 단순 서열에 위치하였다. 네번째 표적(CRISPR 5350)을 선택하였는 데, 첫번째 표적 선택과 관련하여, 광범위한 동종중합체 영역을 함유하지 않는 가장 근접한 표적이었기 때문이다(CAGCTGCAGCATATATTTAAgGG(서열번호: 8)). 설계된 crRNA의 특이성은 GenBank에서 유사한 돼지 서열을 검색함으로써 확인하였다. 올리고뉴클레오티드(표 2)를 어닐링하고 2 개의 발현 카세트, 즉, 인간 코돈-최적화 에스. 피오게네스(hSpy) Cas9 및 키메라 가이드 RNA를 함유하는 p330X 벡터로 클로닝하였다. P330X를 Zhang 실험실 프로토콜(http://www.addgene.org/crispr/zhang/)에 따라 BbsI(New England Biolabs)로 소화시켰다.
eGFP를 표적하기 위해, eGFP 코딩 서열을 표적으로 하는 2 개의 특이적 gRNA를 eGFP 개시 코돈의 첫번째 60 bp 내에 설계하였다. Both eGFP1 및 eGFP2 gRNA는 모두 안티센스 가닥 상에 있었고 eGFP1는 개시 코돈을 직접 표적하였다. eGFP1 gRNA 서열은 CTCCTCGCCCTTGCTCACCAtGG(서열번호: 9)였고 eGFP2 gRNA 서열은 GACCAGGATGGGCACCACCCcGG(서열번호: 10)였다.
표 2. 설계된 crRNA. 프라이머 1 및 프라이머 2를 Zhang 프로토콜에 따라 어닐링하였다.
Figure pct00002
CD163 및 CD1D 유전자에 대한 공여체 DNA의 합성
돼지 CD163CD1D를 모두 표적화 벡터 및 형질감염된 세포주 사이의 동위원소 일치를 보장하기 위해 나중에 형질감염에 사용될 태아 섬유아세포에서 단리된 DNA로부터 PCR에 의해 증폭시켰다. 간단히 말해서, 정방향 프라이머 CTCTCCCTCACTCTAACCTACTT(서열번호: 11), 및 역방향 프라이머 TATTTCTCTCACATGGCCAGTC(서열번호: 12)를 사용하는 LA taq(Clontech)를 사용하여 CD163의 9538 bp 단편을 증폭시켰다. 단편은 도메인-swap 표적화 벡터를 구축하기 위해 입증되고 사용된 DNA 서열이었다(도 1). 이 벡터는 엑손 11로부터 인간 CD163L과 동일한 아미노산 서열을 암호화하도록 엑손 7 내에서 33 개 점 돌연변이를 포함하였다. 대체 엑손은 315 bp였다. 게다가, 후속 인트론을 Cre-리콤비나제(Cre)로 제거될 수 있는 선택가능한 마커 유전자를 수용하는 변형된 미오스타틴 인트론 B로 대체하고 남아있는 loxP 부위를 보유할 때(Wells, 미공개 결과) 정상 스플라이싱을 이전에 입증하였다. 작제물의 긴 아암(arm)은 3469 bp였고 도메인 swap DS 엑손을 포함하였다. 짧은 아암은 1578 bp였고 엑손 7 및 8을 포함하였다(도 1, 패널 B). 이 플라스미드를 사용하여 첫번째 형질감염 실험에서 엑손 7의 코딩 영역의 대체를 시도하였고 선택가능한 마커(G418)를 통해 표적화 사건의 선택을 허용하였다. 표적화가 발생한 경우, 마커는 Cre-리콤비나제에 의해 결실될 수 있다. 그 다음에 CD163 DS-표적화 벡터를 Cre 결실될 수 없는 Neo로 분열된 SIGLEC1 유전자를 이미 함유하는 세포주와 사용하기 위해 변형시켰다. 이 표적화 벡터에서, Neo 카세트, loxP 및 미오스타틴 인트론 B를 제거하였고, DS 엑손만이 WT 긴 아암 및 짧은 아암과 함께 남아있었다(도 1, 패널 C).
돼지 CD1D에 대한 게놈 서열을 정방향 프라이머 CTCTCCCTCACTCTAACCTACTT(서열번호: 13) 및 역방향 프라이머 GACTGGCCATGTGAGAGAAATA(서열번호: 14)를 사용하여 LA taq로 증폭시켜, 8729 bp 단편을 생성하였다. 단편은 도 2에 제시된 표적화 벡터를 구축하기 위해 서열분석되고 사용된 DNA였다. Neo 카세트는 포스포글리세롤 키나제(PGK) 프로모터의 제어 하에 있고 선택을 위해 도입된 loxP 서열 측면에 있다. 작제물의 긴 아암은 4832 bp였고 짧은 아암은 3563 bp였으며, 엑손 6 및 7을 포함하였다. 성공적인 HR이 발생하면, 엑손 3, 4, 및 5를 제거하고 Neo 카세트로 대체할 것이다. NHEJ 복구가 정확하게 발생하면, 엑손 3을 분열시킬 것이다.
태아 섬유아세포 수집
돼지 태아 조직을 임신 35 일에 수집하여 세포주를 생성하였다. 2 개의 야생형(WT) 수컷 및 암컷 태아 섬유아세포 세포주를 큰 흰색 국내 교배로부터 확립하였다. Neo 카세트(SIGLEC1-/- 유전적)를 함유하도록 이전에 변형된 수컷 및 암컷 태아 섬유아세포를 또한 이 연구에 사용하였다. 태아 섬유아세포를 사소한 변형으로 기재된 바와 같이 수집하였으며; 각 태아로부터의 다진 조직을 38.5℃에서 5 시간 동안 200 유닛/ml 콜라게나제 및 25 Kunitz 유닛/ml DNAseI이 보충된 20 ml의 소화 배지(L-글루타민 및 1 g/L D-글루코스[Cellgro]를 함유하는 듈베코-번형된 이글 배지[DMEM])에서 소화시켰다. 소화 후, 태아 섬유아세포 세포를 세척하고 DMEM, 15% 태아 소 혈청 (FBS), 및 40 μg/ml 젠타마이신과 함께 배양하였다. 밤새 배양 후, 세포를 트립신 처리하고 10% 디메틸 술폭시드가 포함된 FBS에서 분취량으로 -80℃에서 동결시키고 액체 질소에서 저장하였다.
세포 형질감염 및 유전자형 분석
형질감염 조건은 본질적으로 이전에 보고된 바와 같았다. 공여체 DNA는 항상 다양한 양의 CRISPR/Cas9 플라스미드(하기 나열됨)와 함께 1 μg의 일정한 양으로 사용하였다. 공여체 DNA를 형질감염 전에 MLUI(CD163)(NEB) 또는 AFLII(CD1D)(NEB)로 선형화하였다. 확립된 세포주의 성별은 형질감염 전에 이전에 기재된 바와 같이 PCR에 의해 결정하였다. 수컷 및 암컷 세포주를 모두 형질감염시키고, 형질감염 사이에 게놈 변형 데이터를 함께 분석하였다. 유사한 계대 수(2-4)의 태아 섬유아세포 세포주를 2 일 동안 배양하고 15% FBS, 2.5 ng/ml 염기성 섬유아세포 성장 인자, 및 10 mg/ml 젠타마이신이 보충된 L-글루타민 및 1 g/L D-글루코스(Cellgro)를 함유하는 DMEM에서 75%-85% 합류로 성장시켰다. 섬유아세포 세포를 포스페이트 완충 염수(PBS)(Life Technologies)로 세척하고 트립신 처리하였다. 세포가 분리되지마자, 세포를 전기천공 배지(75% 사이토솔트(cytosalt)[120 mM KCl, 0.15 mM CaCl2, 10 mM K2HPO4, pH 7.6, 5 Mm MgCl2]) 및 25% Opti-MEM(LifeTechnologies)으로 헹궜다. 세포 농도는 혈구계를 사용하여 정량화하였다. 세포를 600 X g에서 5 분 동안 펠릿화하고 전기천공 배지에서 1 X 106의 농도로 재현탁하였다. 각 전기천공은 250 V에서 BTX ECM 2001을 통해 투여된 3 개의(1 msec) 방형파 펄스와 함께 2 mm 갭 큐벳에서 200 μl의 세포를 사용하였다. 전기천공 후, 세포를 상기 기재된 DMEM에 재현탁하였다. 선택을 위해, 600 μg/ml G418(Life Technologies)을 형질감염 후 24 시간에 첨가하고, 배지를 7 일에 교환하였다. 콜로니를 형질감염 후 14 일에 선별하였다. 태아 섬유아세포를 G418 선택이 사용된 경우 10,000 개 세포/플레이트로 플레이팅하고 G418 선택이 사용되지 않은 경우 50 개 세포/플레이트로 플레이팅하였다. 태아 섬유아세포 콜로니를 오토클레이브 진공 그리스에 의해 각 콜로니 주위에 밀봉된 10 mm 오토클레이브 클로닝 실린더를 적용하여 수집하였다. 콜로니를 PBS로 헹구고 트립신을 통해 수집한 다음; DMEM 배양 배지에 재현탁하였다. 현탁된 콜로니의 일부(1/3)를 96-웰 PCR 플레이트로 옮기고, 나머지(2/3) 세포를 24-웰 플레이트의 웰에서 배양하였다. 세포 펠릿을 6 μl의 용해 완충액(40 mM Tris, pH 8.9, 0.9% Triton X-100, 0.4 mg/ml 프로테이나제 K [NEB])에 재현탁하고, 세포 용해를 위해 65℃에서 30 분 동안 배양한 후, 85℃에서 10 분 동안 배양하여 프로테이나제 K를 비활성화시켰다.
DS 및 크고 작은 결실에 대한 PCR 스크리닝
HR-지시된 복구의 검출. 원거리 PCR을 사용하여 CD163 또는 CD1D 상의 돌연변이를 식별하였다. 세 가지 상이한 PCR 검정을 사용하여 HR 사건을 식별하였다: 공여체 DNA에서 CD163 또는 CD1D 서열로부터 오른쪽 또는 왼쪽 상의 내인성 CD163 또는 CD1D 서열까지 이르는 영역의 PCR 증폭 및 설계된 공여체 DNA를 포함하는 CD163 또는 CD1D의 큰 영역이 증폭된 원거리 PCR. 외인성 Neo 서열의 첨가로 인한 1.8 kb(CD1D) 또는 3.5 kb(CD163)의 PCR 산물의 크기 증가를 유전자의 HR-지시된 복구에 대한 증거로 간주하였다. 모든 PCR 조건은 2 분 동안 95℃의 초기 변성 이어서 94℃에서 30 초, 50℃에서 30 초, 및 68℃에서 7-10분의 33 회 주기를 포함하였다. LA taq를 제조업체의 권장사항에 따라 모든 검정에 사용하였다. 프라이머는 표 3에 제시되어 있다.
표 3. CD163 CD1D 의 HR 지시된 복구를 식별하기 위해 사용되는 프라이머
Figure pct00003
작은 결실 검정(NHEJ). 작은 결실은 CRISPR/Cas9 시스템에 의해 도입된 예상된 절단 부위 측면에 있는 CD163 또는 CD1D의 PCR 증폭에 의해 결정하였다. 앰플리콘의 크기는 CD163CD1D에 대해 각각 435 bp 및 1244 bp였다. 배아 및 태아 섬유아세포 모두의 용해물을 LA taq로 PCR 증폭시켰다. 검정의 PCR 조건은 2 분 동안 95℃의 초기 변성 이어서 94℃에서 30 초, 56℃에서 30 초, 및 72℃에서 1 분의 33 회 주기였다. 형질감염된 세포의 유전자형 분석을 위해, 아가로스 겔 전기영동에 의해 PCR 앰플리콘을 분리함으로써 삽입 및 결실(INDEL)을 식별하였다. 배아 유전자형 분석을 위해, 생성된 PCR 산물을 후속적으로 DNA 서열분석하여 PCR에 사용된 정방향 프라이머를 사용하여 작은 결실을 식별하였다. 프라이머 정보는 표 4에 제시되어 있다.
표 4. CD163 및 CD1D 상의 NHEJ를 통한 돌연변이를 식별하기 위해 사용되는 프라이머
Figure pct00004
체세포 핵 이식(SCNT)
SCNT 배아를 생산하기 위해, 지방 도축장으로부터의 암퇘지-유래 난모세포(ART, Inc.) 또는 어린 암퇘지-유래 난모세포를 사용하였다. 암퇘지-유래 난모세포를 성숙 배지(2.9 mM Hepes, 5 μg/ml 인슐린, 10 ng/ml 표피 성장 인자[EGF], 0.5 μg/ml 돼지 난포 자극 호르몬[p-FSH], 0.91 mM 피루베이트, 0.5 mM 시스테인, 10% 돼지 난포액, 및 25 ng/ml 젠타마이신을 포함하는 TCM-199)에서 밤새 수송하고 24 시간 후 신선한 배지로 옮겼다. 40-42 시간의 성숙 후, 0.1% 히알루로니다제의 존재 하에 볼텍싱하여 난모세포에서 난구 세포를 제거하였다. 어린 암퇘지-유래 난모세포는 체외 수정(IVF)을 위해 하기 기재된 바와 같이 성숙시켰다. 조작 동안, 난모세포를 7.0 μg/ml 사이토칼라신 B가 보충된 조작 배지(0.6 mM NaHCO3, 2.9 mM Hepes, 30 mM NaCl, 10 ng/ml 젠타마이신, 및 3 mg/ml BSA를 함유하는 TCM-199[Life Technologies], 삼투압 305 mOsm)에 두었다. 중기 II 플레이트를 함유하는 것로 추정되는 인접한 세포질의 일부와 함께 극체를 제거하고, 공여체 세포를 얇은 유리 모세관을 사용하여 난황주위 공간에 두었다. 그 다음에 재구성된 배아를 BTX Electro 세포 조작기(Harvard Apparatus)를 사용하여 30 초 동안 1.2 kV/cm에서 2 개의 DC 펄스(1-초 간격)로 융합 배지(0.3 M 만니톨, 0.1 mM CaCl2, 0.1 mM MgCl2, 및 0.5 mM Hepes)에서 융합하였다. 융합 후, 융합된 배아를 어둠 속에서 200 μM 티메로살로 10 분 동안 및 8 mM 디티오트레이톨로 30 분 동안 완전히 활성화시켰다. 그 다음에 배아를 이전에 기재된 바와 같이 14-16 시간 동안 히스톤 데아세틸라제 억제제인 0.5 μM Scriptaid(S7817; Sigma-Aldrich)를 포함하는 변형된 돼지 접합체 배지 PZM3-MU1에서 배양하였다.
체외 수정(IVF)
IVF를 위해, 미성숙 어린 암퇘지의 난소를 도축장(Farmland Foods Inc.)으로부터 수득하였다. 미성숙 난모세포를 10 ml 주사기에 부착된 18-게이지 피하 바늘을 사용하여 중간 크기(3-6 mm) 난포로부터 흡입하였다. 그 다음에 고르게 어두운 세포질 및 온전한 주변 난구 세포를 갖는 난모세포를 성숙을 위해 선택하였다. 약 50 개의 난구 난모세포 복합체를 가습 공기에서 38.5℃, 5% CO2에서 42-44 시간 동안 3.05 mM 글루코스, 0.91 mM 나트륨 피루베이트, 0.57 mM 시스테인, 10 ng/ml EGF, 0.5 μg/ml 황체형성 호르몬(LH), 0.5 μg/ml FSH, 10 ng/ml 젠타마이신(APP Pharm), 및 0.1% 폴리비닐 알코올을 함유하는 성숙 배지인 TCM-199(Invitrogen) 500 μl를 함유하는 웰에 두었다. 성숙이 끝나면, 주변 난구 세포를 0.1% 히알루로니다제의 존재 하에 3 분 동안 볼텍싱하여 난모세포에서 제거하였다. 그 다음에, 시험관내에서 성숙된 난모세포를 25-30개 난모세포의 그룹으로 IVF 배지(113.1 mM NaCl, 3 mM KCl, 7.5 mM CaCl2, 11 mM 글루코스, 20 mM Tris, 2 mM 카페인, 5 mM 나트륨 피루베이트, 및 2 mg/ml 소 혈청 알부민[BSA]을 함유하는 변형된 Tris-완충 배지)의 50 μl 액적에 두었다. 하나의 100 μl 동결된 정액 펠릿을 0.1% BSA가 보충된 3 ml의 듈베코 PBS에서 해동시켰다. 동결된 WT 또는 신선한 eGFP 정액을 60% Percoll에서 20 분 동안 650 3 g로 세척하고 변형된 Tris-완충 배지에서 10 분 동안 원심분리하였다. 일부 경우에, 이전에 기재된 eGFP 이식유전자에 대해 이형접합인 신선하게 수집된 정액을 PBS로 3 회 세척하였다. 그 다음에 정액 펠릿을 IVF 배지로 0.5 X 106 개 세포/ml로 재현탁하였다. 50 마이크로리터의 정액 현탁액을 난모세포와 함께 액적에 도입하였다. 배우자를 공기 중 5% CO2의 대기에서 38.5℃에서 5 시간 동안 공배양하였다. 수정 후, 배아를 공기 중 5% CO2 및 38.5℃에서 PZM3-MU1에서 배양하였다.
배아 이식
GE CD163 또는 CD1D 돼지를 생산하기 생성된 배아를 첫번째 기립 발정기(standing estrus) 후 1 일(SCNT) 또는 6 일(주입된 접합체)에 대리모로 옮겼다. 6 일에 이식을 위해, 접합체를 10 ng/ml ps48(Stemgent, Inc.)의 존재 하에 PZM3-MU1에서 추가 5 일 동안 배양하였다. 배아를 대리모 난관의 팽대부-협부 접합부로 외과적으로 옮겼다.
CRISPR/Cas9 시스템을 위한 RNA의 시험관내 합성
시험관내 전사를 위한 주형 DNA를 PCR을 사용하여 증폭시켰다(표 5). 세포 형질감염 실험에 사용된 CRISPR/Cas9 플라스미드는 PCR을 위한 주형으로 역할을 하였다. 접합체에서 Cas9를 발현하기 위해, mMESSAGE mMACHINE Ultra Kit(Ambion)를 사용하여 Cas9의 mRNA를 생산하였다. 그 다음에 폴리 A 신호를 폴리 (A) 테일링 키트(Ambion)를 사용하여 Cas9 mRNA에 첨가하였다. CRISPR 가이드 RNA를 MEGAshortscript(Ambion)로 생산하였다. 합성된 RNA의 품질을 1.5% 아가로스 겔 상에서 시각화한 다음 10 ng/μl(gRNA 및 Cas9 모두)의 최종 농도로 희석하고 3 μl 분취량으로 분배하였다.
표 5. 시험관내 전사를 위한 주형을 증폭시키기 위해 사용되는 프라이머.
Figure pct00005
접합체에서 설계된 CRISPR/Cas9 시스템의 미세주입
Cas9 및 gRNA를 암호화하는 메신저 RNA를 FemtoJet 미세주입기(Eppendorf)를 사용하여 수정 후 14 시간에 수정된 난모세포의 세포질(추정 접합체)에 주입하였다. 미세주입을 Nikon 도립 현미경(Nikon Corporation; 일본 도쿄 소재)의 가열된 재물대 상의 조작 배지에서 수행하였다. 그 다음에 주입된 접합체를 추가 사용까지 10 ng/ml ps48을 포함하는 PZM3-MU1로 옮겼다.
통계 분석
변형된 게놈을 갖는 콜로니의 수를 1로 분류하였고, 게놈 변형이 없는 콜로니를 0으로 분류하였다. 차이는 PROC GLM(SAS)을 사용하여 결정하였으며 0.05의 P-값을 유의한 것으로 간주하였다. 평균은 최소 자승법으로 계산하였다. 데이터는 수치 평균 ± SEM으로 제시된다.
결과
체세포에서 CD163 및 CD1D의 CRISPR/Cas9-매개 녹아웃
CD163을 표적으로 하는 4 개의 상이한 CRISPR 플라스미드(가이드 10, 131, 256, 및 282)의 효율을 2 μg/μl의 공여체 DNA의 양으로 시험하였다(표 6). CRISPR 282는 CRISPR 10 및 256 처리보다 유의하게 더 많은 평균 콜로니 형성을 초래하였다(P < 0.05). 상기 기재된 원거리 PCR 검정에서, 원래 의도된 바와 같이 DS 대신에 HR을 통해 503 bp에서 1506 bp 정도까지 큰 결실을 발견하였다(도 3, 패널 A). 다른 DNA-편집 시스템에 대한 이전 보고서는 돼지에서 ZFN을 사용하여 6-333 bp의 훨씬 작은 결실을 나타내었 때문에 이를 예상하지 않았다. CRISPR 10 및 4 개의 모든 CRISPR의 믹스는 CRISPR 256 및 282보다 변형된 게놈을 갖는 더 많은 수의 콜로니를 초래하였다(표 6, P < 0.002). CRISPR 10 및 Neo를 함유하지만 CD163에 상동성이 아닌 플라스미드로의 형질감염은 큰 결실을 제시하는 콜로니를 초래하지 않았다. 흥미롭게도, 공여체 DNA가 임의의 CRISPR 없이 도입되었을 때 하나의 단일 대립유전자 결실을 또한 검출하였다. 이 검정은 형질감염된 체세포에서 아가로스 겔 상에서 검출될 수 없는 서열분석에 의해 임의의 잠재적인 작은 결실이 스크리닝되지 않았기 때문에 돌연변이율의 과소평가를 나타낼 것이다.
표 6. CD163을 표적으로 하는 4 개의 상이한 CRISPR 플라스미드(가이드 10, 131, 256, 및 282)의 효율. 4 개의 상이한 CRISPR을 2 μg 내지 1 μg 공여체 DNA의 양으로 시험하였다(도 1에 제시됨).
Figure pct00006
초기 목표는 CD163에 대한 HR에 의해 도메인 swap (DS)-표적화 사건을 수득하는 것이었지만, CRISPR은 CD163 표적화의 효율을 증가시키지 않았다. 이 표적화 벡터의 다양한 조합을 사용하여 전통적인 형질감염에 의한 HR에 의해 CD163을 변형시키고 3399 개 콜로니를 스크리닝한 후 0 개의 표적화 사건을 초래하였음을 유의해야 한다(Whitworth and Prather, 미공개 결과). CRISPR 10 및 공여체 DNA로서 DS-표적화 벡터로의 형질감염에 의해 도입되도록 시도된 모든 33 개의 돌연변이를 포함하는 HR에서 비롯된 완전 DS를 갖는 두 마리 돼지를 수득하였다.
다음으로, 약물 선택 없이 CRISPR/Cas9-유도 돌연변이의 효율을 시험하였으며; 이 연구에 사용되는 태아 섬유아세포 세포주는 이미 Neo 내성 카세트 및 SIGLEC1의 녹아웃의 통합을 가졌다. CRISPR/Cas9 및 공여체 DNA의 비가 게놈 변형을 증가시키거나 또는 고 농도에서 독성 효과를 초래하는지 여부를 또한 시험하였다. CRISPR 131은 이전 실험에서 많은 수의 총 콜로니 및 변형된 게놈을 보유하는 콜로니의 백분율 증가를 초래하였기 때문에 이 시험을 위해 선택하였다. CRISPR 131 DNA의 양을 3:1에서 20:1로 증가시키는 것은 태아 섬유아세포 생존가능성에 유의한 영향을 미치지 않았다. NHEJ에 의해 변형된 게놈이 있는 콜로니의 퍼센트는 다양한 CRISPR 농도 사이에 유의한 차이가 없었지만 10:1 비에서 NHEJ 수가 가장 많았다(표 7, P = 0.33). CRISPR DNA 대 공여체 DNA의 가장 높은 비(20:1)에서도, HR은 관찰되지 않았다.
표 7. 약물 선택 없이 CRISPR/Cas9-유도 돌연변이의 효율. 공여체 DNA 대 CRISPR 131 DNA의 네 가지 상이한 비를 G418 선택의 사용 없이 이전에 변형된 세포주와 비교하였다.
Figure pct00007
이 경험에 기초하여, 체세포에서 CD1D의 표적화된 분열을 시도하였다. 4 개의 상이한 CRISPR을 수컷 및 암컷 세포 모두에서 설계하고 시험하였다. CD1D의 변형은 적용된 CRISPR 중 3 개에서 검출될 수 있지만, CRISPR 5350의 사용은 아가로스 겔 전기영동에 의해 검출하기에 충분히 큰 결실이 있는 CD1D의 변형을 초래하지 않았다(표 8). 흥미롭게도, 공여체 DNA가 제공되었지만 HR을 통해 유전적 변화를 수득하지 못했다. 그러나, CD163 녹아웃 실험과 유사한 큰 결실을 관찰하였다(도 3, 패널 B). CRISPR/Cas9가 공여체 DNA와 함께 사용되지 않았을 때 큰 결실이 있는 CD1D의 표적화된 변형을 검출하지 못했다. CRISPR/Cas9-유도된 표적화에서 CD1D의 변형은 수컷 및 암컷 세포 콜로니에서 각각 4/121 및 3/28이었다. 아가로스 겔 전기영동에 의해 검출가능한 INDEL만을 형질감염 데이터에 포함시켰다.
표 8. 4 개의 상이한 CRISPRS를 2 μg 내지 1 μg 공여체 DNA의 양으로 시험하였다(도 2에 제시됨). 공여체 DNA 처리는 CRISPR 없는 대조군으로 역할을 하였다.
Figure pct00008
GE 세포를 사용하여 SCNT를 통한 CD163 및 CD1D 돼지의 생산
CD163 또는 CD1D의 변형을 제시하는 세포를 SCNT에 사용하여 CD163 및 CD1D 녹아웃 돼지를 생산하였다(도 3). 수령체 어린 암퇘지에 7 번의 배아 이식(CD163 표 9), 6 번의 배아 이식(CD163-Neo 없음), 및 5 번의 배아 이식(CD1D)을 CRISPR/ Cas9 시스템으로 형질감염된 수컷 및 암컷 태아 섬유아세포로부터의 SCNT 배아로 수행하였다. 6 마리(CD163), 2 마리(CD163-Neo 없음), 및 4 마리(CD1D)(표 10)의 수령체 어린 암퇘지는 각각 85.7%. 33.3%, 및 80%의 임신률을 초래하는 기간까지 임신을 유지하였다. CD163 수령체 중, 5 마리는 제왕 절개에 의해 건강한 새끼 돼지를 출산하였다. 1 마리(O044)는 자연 분만하였다. 한 배 새끼 크기는 1 내지 8 범위였다. 4 마리의 돼지는 출생 후 잘 자라지 못했기 때문에 안락사시켰다. 1 마리의 새끼 돼지는 심한 구개 파열로 인해 안락사시켰다. 나머지 모든 새끼 돼지는 건강해 보인다(도 3, 패널 C). 도 3, 패널 B에 기재된 CRISPR 10 및 공여체 DNA로 형질감염된 태아 섬유아세포로부터 비롯된 수컷 새끼 돼지 중 2 마리의 한 배 새끼는 CRISPR 10에 인접한 엑손 7에서 30 bp 결실 및 선행 인트론의 추가 1476 bp 결실을 가져서, CD163의 인트론 6/엑손 7 접합부를 제거하였다(도 3, 패널 E). 유전자형 및 예측된 번역은 표 11에 요약되어 있다. 1 마리의 수컷 새끼 돼지 및 1 마리의 암컷 한 배 새끼(4 마리의 새끼 돼지)를 이전에 변형된 SIGLEC1 세포의 CD163-Neo 없음 형질감염으로부터 수득하였다. 5 마리의 새끼 돼지를 모두 SIGLEC1 및 CD163에 대해 이중 녹아웃하였다. 수컷 새끼 돼지는 1 개의 대립유전자 상의 엑손 7 에서 28 bp 결실 및 엑손 7의 부분 결실 및 엑손 8의 완전 결실 및 선행 인트론을 포함하는 다른 대립유전자 상의 1387 bp 결실이 있는 CD163의 이중 대립유전자 변형을 가져서, 인트론 엑손 접합부를 제거하였다. 암컷 새끼 돼지는 1 개의 대립유전자 상의 11 bp 삽입과 1382 bp 결실 및 다른 대립유전자에서 CD163의 1720 bp 결실을 포함하여 CD163의 이중 대립유전자 돌연변이를 가졌다. CD163 변형 및 예측된 번역의 요약은 표 11에서 찾을 수 있다. CD1D 변형 및 CRISPR 변형에 의한 예측된 번역의 요약은 표 12에서 찾을 수 있다. 간단히 말해서, 1 마리의 암컷 및 2 마리의 수컷 한 배 새끼가 태어나서 13 마리의 새끼 돼지를 초래하였다. 1 마리의 새끼 돼지는 출생 직후 사망하였다. 13 마리의 새끼 돼지 중 12 마리는 CD1D의 이중 대립유전자 또는 동형접합 결실을 함유하였다(도 3, 패널 F). 1 마리의 새끼 돼지는 WT였다.
표 9. CD163 에 대한 배아 이식 데이터.
Figure pct00009
표 10. CD1D 에 대한 배아 이식 데이터.
Figure pct00010
표 11. CD163 변형된 돼지의 유전자형 및 번역 예측. 일부 돼지는 이중 대립유전자 유형의 변형을 포함하지만, 기재된 하나의 대립유전자 및 PCR에 의해 증폭되지 않은 또 다른 변형된 대립유전자만을 갖는다.
Figure pct00011
Figure pct00012
표 12. CD1D 변형된 돼지에 대한 유전자형 및 번역 예측
Figure pct00013
돼지 접합체에서 CRISPR/Cas9 시스템의 효율
CRISPR/Cas9 시스템을 사용하여 체세포에서 CD163CD1D의 표적화된 분열에 기초하여, 이 접근법을 돼지 배아발생에 적용하였다. 먼저, 배아 발달에서 CRISPR/Cas9 시스템의 효능을 시험하였다. eGFP를 표적으로 하는 CRISPR/Cas9 시스템을 eGFP 이식유전자에 대해 이형접합인 수퇘지로부터의 정액으로 수정된 접합체에 도입하였다. 주입 후, eGFP를 발현하는 후속 배아를 모니터링하였다. 다양한 농도의 CRISPR/Cas9 시스템을 시험하고 전달된 CRISPR/Cas9 시스템의 세포독성을 관찰하였으며(도 4, 패널 A); CRISPR/Cas9 주입 후 배아 발달은 대조군과 비교하여 낮았다. 그러나, 시험된 모든 농도의 CRISPR/Cas9는 eGFP 발현이 있는 배아가 CRISPR/Cas9-주입된 그룹에서 발견되지 않았기 때문에 eGFP의 변형을 생성하는데 효과적이었으며(도 4, 패널 B); 주입되지 않은 대조군 배아의 67.7%가 녹색이었는 데, 이는 eGFP의 발현을 나타낸다. 개별 배반포를 유전자형으로 분류하였을 때, CRISPR 결합 부위 근처의 작은 돌연변이를 식별하는 것이 가능하였다(도 4, 패널 C). 독성 및 효능에 기초하여, 10 ng/μl의 gRNA 및 Cas9 mRNA를 다음 실험에 사용하였다.
표적 CD163에 대해 설계된 CRISPR/Cas9 구성요소가 추정 접합체에 도입되었을 때, 후속 배반포에서 유전자의 표적화된 편집이 발견되었다. 개별 배반포를 CD163의 돌연변이에 대해 유전자형으로 분류하였을 때, 모든 배아에서 특이적 돌연변이를 발견하였다(100% GE 효율). 보다 중요하게는, 배아가 동형접합 또는 이중 대립유전자 변형으로 발견될 수 있는 동안(각각 8/18 개 및 3/18 개)(도 5), 모자이크(단일 대립유전자 변형) 유전자형 또한 검출되었다(4/18 개 배아). 풀에서 일부 배아(8/10 개)에 2 ng/μl Cas9 및 10 ng/μl CRISPR를 주입하였고 돌연변이유발의 효율에서 차이를 발견하지 못했다. 다음으로, 시험관내 결과에 기초하여, 상이한 gRNA를 나타내는 2 개의 CRISPR를 도입하여 배아발생 동안 CD163 또는 CD1D을 분열시켜 표적 유전자의 특이적 결실을 유도하였다. 결과적으로, 2 개의 가이드를 도입함으로써 CD163CD1D의 설계된 결실을 성공적으로 유도할 수 있었다. 설계된 결실은 도입된 2 개의 가이드 사이의 게놈 서열을 제거하는 결실로 정의된다. CD163을 표적으로 하는 2 개의 CRISPR를 받은 배아 중에서, 하나를 제외한 모든 배아가 CD163의 표적화된 변형을 초래하였다. 게다가, 5/13 개 배아가 CD163에서 설계된 결실을 갖는 것을 발견하였고(도 6, 패널 A) 10/13 개 배아가 동형접합 또는 이중 대립유전자 방식으로 CD163의 변형을 갖는 것으로 보였다. 모든 배아(23/23 개)가 CD1D의 변형을 나타내었기 때문에 2 개의 CRISPR로 CD1D의 표적화가 또한 효과적이었다. 그러나, CD1D의 설계된 결실은 2 개의 배아(2/23)에서만 발견될 수 있었다(도 6, 패널 B). 모자이크 유전자형을 보유하는 23 개의 배아 중 5 개가 또한 발견되었지만, 나머지 배아는 CD1D의 동형접합 또는 이중 대립유전자 변형을 가졌다. 마지막으로, 다수의 유전자가 동일한 배아 내에서 CRISPR/Cas9 시스템에 의해 표적화될 수 있는지 여부를 시험하였다. 이를 위해, 이형접합 eGFP 정액으로 수정된 접합체에서 CD163eGFP 둘 다의 표적화를 수행하였다. 주입된 배아의 배반포가 CD163eGFP에 대해 유전자형으로 분류되었을 때, CD163 및 eGFP가 배아발생 동안 성공적으로 표적화되었음을 발견하였다. 서열분석 결과는 다수의 유전자가 다수의 CRISPR을 Cas9와 함께 도입함으로써 표적화될 수 있음을 입증하였다(도 6, 패널 C).
CRISPR/ Cas9-주입된 접합체로부터 CD163 및 CD1D 돌연변이체의 생성
이전 시험관내 연구의 성공에 기초하여, 일부 CRISPR/Cas9-주입된 접합체를 생산하였고 수령체 당 46-55 개 배반포를 옮겼다(이 숫자는 시험관내 유래된 배아에서 돼지를 생산하는 데 효과적인 것으로 나타났기 때문). CD163CD1D에 대해 각각 2 번씩 4 번의 배아 이식을 수행하였고, 각 변형에 대해 임신을 수득하였다. CD163 상에 변형을 보유하는 4 마리의 건강한 새끼 돼지를 생산하였다(표 9). 수령체 암퇘지 ID O083의 한 배 새끼 67인 모든 새끼 돼지는 CD163의 동형접합 또는 이중 대립유전자 변형을 나타내었다(도 7). 2 마리의 새끼 돼지는 전달된 2 개의 CRISPR에 의해 CD163의 설계된 결실을 나타내었다. 모든 새끼 돼지는 건강하였다. CD1D의 경우, 1 번의 임신은 또한 4 마리의 새끼 돼지(수령체 암퇘지 식별 번호 O165의 한 배 새끼 166)를 생산하였다: 1 마리의 암컷 및 3 마리의 수컷(표 10). 1 마리의 새끼 돼지(166-1)는 개시 코돈으로 이루어진 엑손 3이 완전히 제거된 362 bp 결실을 포함하여 CD1D의 모자이크 돌연변이를 가지고 있었다(도 8). 1 마리의 새끼 돼지는 하나의 대립유전자에 2 bp 불일치 및 다른 대립유전자에 큰 결실이 있는 6 bp 삽입을 포함하였다. 2 마리의 추가 새끼 돼지는 이중 대립유전자 단일 bp 삽입을 가졌다. CD163에 대해 검출된 모자이크 돌연변이는 없었다.
논의
GE 돼지 생산 효율의 증가는 농업 및 생물의학에 더 많은 GE 돼지를 제공함으로써 광범위한 영향을 미칠 수 있다. 상기 기재된 데이터는 CRISPR/Cas9 시스템을 사용함으로써, 특이적 돌연변이가 있는 GE 돼지를 고효율로 생산할 수 있음을 나타낸다. CRISPR/Cas9 시스템은 체세포 및 착상전 배아에서 모두 유전자를 편집하는 데 성공적으로 적용되었다.
CRISPR/Cas9 시스템이 체세포에 도입되었을 때, NHEJ에 의한 표적 유전자의 표적화된 분열을 성공적으로 유도하였지만 HR에 의한 표적 능력은 증가하지 않았다. 체세포에서 개별 CRISPR/Cas9의 표적화 효율은 가변적이었으며, 이는 가이드의 설계가 표적화 효율에 영향을 미칠 수 있음을 나타내었다. 구체적으로, CRISPR 5350 및 Cas9가 체세포에 도입되었을 때 CD1D의 표적화된 변형을 찾을 수 없었다. 이는 다수의 gRNA를 설계하고 돼지 생산 이전에 효율성을 검증하는 것이 이익일 수 있음을 시사한다. 공여체 DNA의 존재로 HR-지시된 복구가 부족한 이유는 여전히 명확하지 않다. CRISPR 및 공여체 DNA로 형질감염된 886 개 콜로니(CD163 CD1D 모두)를 스크리닝한 후, 1 개의 콜로니만이 부분 HR 사건에 대한 증거를 가졌다. 결과는 CRISPR/Cas9 시스템이 도입된 공여체 DNA와 작동하여 표적 유전자 상의 예상치 못한 큰 결실을 유발하지만 이러한 2 개의 특정 표적화 벡터에 대한 HR 효율성을 증가시키지 않았음을 입증하였다. 그러나, 큰 결실 관찰에 대한 구체적 메커니즘은 알려져 있지 않다. 본 발명자 그룹의 이전 보고서는 공여체 DNA가 ZFN과 함께 효과적으로 사용되어 HR-지시된 복구를 유도할 수 있음을 시사하였다. 유사하게, 공여체 DNA가 CRISPR/ Cas9 시스템과 사용되었을 때 표적화 효율의 증가를 보였지만, 완전 HR 지시된 복구는 관찰되지 않았다. ZFN을 사용한 이전 연구에서, ZFN에 의해 DSB가 유도된 후 도입된 공여체 DNA의 부분 재조합이 발견되었기 때문에 표적화된 변형은 HR 및 NHEJ의 조합을 통해 발생할 수 있음을 관찰하였다. 한 가지 설명은 HR 및 NHEJ 경로가 독립적이지 않지만 호밍 엔도뉴클레아제에 의해 DSB가 유도된 후 복구 과정을 완료하기 위해 함께 작용할 수 있다는 것이다. 이들 실험 결과에서 통계적 차이는 발견되지 않았지만 더 높은 농도의 CRISPR은 체세포에서 표적화 효율을 개선시킬 수 있다. 이는 CRISPR이 CRISPR/Cas9 시스템에서 제한 인자이지만, 추가 검증이 필요함을 시사할 수 있다. 표적화된 세포는 SCNT를 통해 GE 돼지를 생산하는 데 성공적으로 사용되었으며, 이는 CRISPR/Cas9의 적용이 클로닝된 세포의 능력에 영향을 미치지 않음을 나타낸다. 일부 새끼 돼지는 건강 문제로 안락사시켰지만; 이는 SCNT-유래 새끼 돼지에서 드문 일은 아니다.
CRISPR/Cas9 시스템이 접합체 주입에 의해 발달중인 배아에 도입되었을 때, 거의 100%의 배아 및 돼지는 표적화된 유전자에 INDEL을 포함하였으며, 이는 기술이 배아발생 동안 매우 효과적임을 입증한다. 이 연구 동안 관찰된 효율은 배아발생 동안 호밍 엔도뉴클레아제를 활용하는 다른 연구에서 보고된 빈도를 능가한다. 배반포 단계에 도달하는 배아 수가 감소하는 것은 이 연구에 도입된 CRISPR/Cas9의 농도가 배아에 독성일 수 있음을 시사하였다. 전달 시스템의 추가 최적화는 배아의 생존가능성을 증가시킬 수 있고 따라서 과정의 전반적인 효율을 개선시킬 수 있다. 여기서 관찰된 거의 100% 돌연변이유발률은 돼지에서 CRISPR/Cas9-매개 녹아웃의 이전 보고서와 상이하였지만; 연구 간의 효율 차이는 선택된 가이드 및 표적의 조합일 수 있다. 현재 연구에서, 낮은 농도의 CRISPR/Cas9(각각 10 ng/μl)는 발달중인 배아에서 돌연변이를 생성하고 GE 돼지를 생산하는 데 효과적이었다. 농도는 돼지 접합체에서 이전에 보고된 것보다 낮다(125 ng/μl의 Cas9 및 12.5 ng/μl의 CRISPR). 과도한 양의 핵산이 발달중인 배아에 도입되면 독성일 수 있기 때문에 낮은 농도의 CRISPR/Cas9 구성요소는 발달중인 배아에 이익일 수 있다. 일부 모자이크 유전자형이 시험관내 검정의 CRISPR/Cas9-주입된 배아에서 보였지만; 접근법을 통해 생산된 1 마리의 새끼 돼지만이 모자이크 유전자형을 가졌다. 잠재적으로, 모자이크 유전자형은 접합체에서 CRISPR/Cas9 시스템을 사용하는 주요 장애물로 간주되었기 때문에 CRISPR/Cas9 구성요소를 주입하는 것은 다른 호밍 엔도뉴클레아제의 도입보다 더 효과적일 수 있다. 본 결과에 의해 입증된 CRISPR/Cas9 시스템을 사용하는 또 다른 이점은 CRISPR/Cas9 시스템이 주입된 IVF-유래 접합체에서 생산된 CD163 녹아웃 돼지가 손실되지 않았던 반면, SCNT에서 비롯된 일부 새끼 돼지는 며칠 후에 안락사되었다는 점이다. 이는 기술이 녹아웃 돼지를 생산하는 데 있어서 SCNT의 필요성을 우회할 뿐만 아니라 SCNT와 관련된 통상의 건강 문제를 극복할 수 있음을 시사한다. CRISPR/Cas9 mRNA를 접합체에 주입하는 것이 최적화되었으므로, 향후 실험은 공여체 DNA의 공동주입 또한 포함할 것이다.
본 연구는 접합체에서 2 개의 CRISPR과 Cas9의 도입이 발달중인 배아에서 염색체 결실을 유도하고 의도된 결실, 즉, 2 개의 CRISPR 가이드 사이에 특이적 결실을 갖는 돼지를 생산할 수 있음을 입증한다. 이 설계된 결실은 NHEJ에 의해 유발된 무작위 사건에 의존하는 대신 결실의 크기를 명시할 수 있기 때문에 유리할 수 있다. 구체적으로, 호밍 엔도뉴클레아제에 의해 유발된 3 배의 뉴클레오티드 삽입/결실이 있는 경우, 돌연변이는 프레임 시프트가 발생하지 않기 때문에 오히려 왜소체형(hypomorphic) 돌연변이를 초래할 수 있다. 그러나 2 개의 CRISPR을 도입함으로써, 비기능적 단백질을 생성할 기회가 더 높은 큰 결실을 유발할 수 있다. 흥미롭게도, CD1D CRISPR은 CD163보다 게놈에서 더 넓은 영역에 걸쳐 설계되었으며; CD163 CRISPR 10 및 131 사이에 124 bp 거리가 있었지만 CD1D의 경우 CRISPR 4800 및 5350 사이에 550 bp 거리가 있었다. CRISPR 사이의 더 긴 거리는 연구에서 나타낸 바와 같이 결실을 생성하는 데 매우 효과적이지 않았다. 그러나, 본 연구는 제한된 수의 관찰만을 포함하였고 여기에서 다루지 않은 개별 CRISPR의 효능을 고려할 필요가 있기 때문에, CRISPR 사이의 거리 및 의도된 결실을 유발할 가능성 사이의 관계를 확인하기 위한 추가 연구가 필요하다.
CRISPR/Cas9 시스템은 또한 하나의 추가 CRISPR과 crRNA를 도입하는 유일한 추가 단계로 동일한 배아 내에서 동시에 2 개의 유전자를 표적으로 하는 데 효과적이었다. 이는 다른 호밍 엔도뉴클레아제와 비교하여 다수의 유전자를 분열시키는 것이 용이함을 예시한다. 이러한 결과는 이 기술을 사용하여 보상 효과를 가질 수 있는 유전자 클러스터 또는 유전자 패밀리를 표적으로 할 수 있어서, 모든 유전자가 분열되지 않는 한 개별 유전자의 역할을 결정하기가 어렵다는 것을 시사한다. CRISPR/Cas9 기술이 체세포에서 유전자 효적화의 효율을 증가시키고 직접 접합체 주입에 의해 GE 돼지를 생성하는 데 적용될 수 있음을 입증한다.
실시예 2: CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 갖는 돼지에서 PRRSV에 대한 내성 증가
돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)는 지난 25년에 걸쳐 돼지 산업을 황폐하게 만들었다. 본 실시예에서는 CD163 무효 동물이 PRRSV 감염의 모든 특징인 감염, 폐 병리학, 바이러스 혈증 또는 항체 생산의 임상 징후를 보이지 않음을 보여준다. PRRSV 진입 매개인자가 확인되었을 뿐만 아니라; 유사하게 생성된 동물이 식량 공급에 착수하게 된다면, 상당한 경제적 손실 및 동물 고통을 방지하기 위한 전략이 기재되었다.
재료 및 방법
유전자형 분석
유전자형 분석은 DNA 서열분석 및 mRNA 서열분석 둘 다에 기초하였다. 아비(sire)의 유전자형은 하나의 대립유전자에서 11 bp 결실을 가졌으며 번역되었을 때 45 개 아미노산을 도메인 5에 예측하여, 아미노산 64에서 조기 정지 코돈을 초래하였다. 다른 대립유전자에서 엑손 7에서 2 bp 부가 및 엑손 7 앞의 인트론에서 377 bp 결실이 있었으며, 번역되었을 때 도메인 5의 처음 49 개 아미노산을 예측하여, 아미노산 85에서 조기 정지 코드를 초래하였다. 1 마리의 암퇘지는 하나의 대립유전자에서 7 bp 부가를 가졌으며 번역되었을 때 도메인 5의 처음 48 개 아미노산을 예측하여, 아미노산 70에서 조기 정지 코돈을 초래하였다. 다른 대립유전자는 PCR 또는 원거리 6.3 kb PCR에 의해 엑손 7에서 밴드가 없었으므로 비특성화 (A)였다. 다른 3 마리의 암퇘지를 클로닝하였고 엑손 7에서의 129 bp 결실을 가졌으며 이는 도메인 5에서 43 개 아미노산의 결실을 초래할 것으로 예측된다. 다른 대립유전자는 비특성화 (B)였다.
돼지의 감염을 위한 바이러스 접종물의 배양 및 생산에서 PRRSV의 성장은 승인된 IBC 적용 973 하에 보장된다
PRRSV 유형 균주인 단리물 NVSL 97-7895(GenBank # AF325691 2001-02-11)를 승인된 IBC 프로토콜 973에 기재된 바와 같이 성장시켰다. 이 실험실 단리물은 약 20 년 동안 실험 연구에 사용되었다(Ladinig et al., 2015). 두번째 단리물은 이전에 기재된 바와 같이 두번째 시험인 KS06-72109에 사용되었다(Prather et al., 2013).
PRRSV로 돼지 감염
PRRSV에 대한 표준화된 감염 프로토콜을 돼지 감염을 위해 사용하였다. 3 주령 새끼 돼지를 근육내(IM) 및 비강내(IN) 경로로 투여된 대략 104 TCID50의 PRRS 바이러스로 접종하였다. 돼지를 매일 모니터링하고 질병 증상을 나타내는 것들을 CMG 수의사의 권장사항에 따라 치료하였다. 심한 고통을 보이고 감염에 걸릴 위험이 있는 돼지를 인도적으로 안락사시키고 샘플을 수집한다. 직원 및 수의사는 평가 및 치료에서 편견을 제거하기 위해 돼지의 유전적 상태를 알지 못했다. PRRSV는 감염 동안 체액에 존재하며; 따라서, 혈액 샘플을 수집하고 각 돼지에서 바이러스 혈증의 양 또는 정도를 결정하기 위해 측정될 때까지 -80℃에서 저장하였다. 실험이 끝나면, 돼지의 무게를 재고 인도적으로 안락사시키고, 조직을 수집하고 10% 완충 포르말린에 고정시키고, 파라핀에 포매하고, 이사회의 인증을 받은 병리학자에 의해 조직병리학으로 처리하였다.
접종된 돼지의 표현형 점수화
돼지의 표현형을 다음과 같이 매일 무작정 점수화하였다: 돼지의 태도는 어떠한가? 태도 점수: 0: BAR, 1: QAR, 2: 약간 우울함, 3: 우울함, 4: 빈사상태. 돼지의 신체 상태는 어떠한가? 신체 상태 점수: 1: 쇠약함, 2: 마름, 3: 이상적, 4: 살찜, 5: 과잉살찜/비만. 돼지의 직장 온도는 얼마인가? 정상 체온 101.6-103.6℉(≥ 104℉는 발열로 간주됨). 절뚝거림(등급)이 있는가? 어떤 사지? 관절 부종 및 발굽 병변에 대해 사지를 평가한다(발굽의 바닥 및 측면 확인). 절뚝거림 점수: 1: 절뚝거림 없음, 2: 걸을 때 약간 고르지 않으며, 절뚝거림은 없지만 일부 관절에서 뻣뻣해 보임, 3: 경도 절뚝거림, 걷는 동안 약간 절뚝거림, 4: 중등도 절뚝거림, 발가락을 만지면 절뚝거리는 것을 포함하여 명백한 절뚝거림, 5: 심한 절뚝거림, 사지에 무게가 실리지 않고 서기/걷기 위해 격려가 필요함. 호흡 곤란(등급)이 있는가? 입을 벌리고 호흡하는가? 비강 분비물(분비물 색, 분비물 양: 경도/중등도/중증)이 있는가? 동물이 기침하는 것을 목격하였나? 안구 분비물이 있는가? 호흡기 점수: 0: 정상, 1: 스트레스 받을 때(취급될 때) 경도 호흡 곤란 및/또는 빈호흡, 2: 휴식할 때 경도 호흡 곤란 및/또는 빈호흡, 3: 스트레스 받을 때(취듭될 때) 중등도 호흡 곤란 및/또는 빈호흡, 4: 휴식할 때 중등도 호흡 곤란 및/또는 빈호흡, 5: 스트레스 받을 때(취듭될 때) 중증 호흡 곤란 및/또는 빈호흡, 6: 휴식할 때 중증 호흡 곤란 및/또는 빈호흡. 설사(등급) 또는 구토의 증거가 있는가? 혈액 또는 점액이 있는가? 설사 점수: 0: 대변 없음, 1: 정상 대변, 2: 부드러운 대변이지만 형성됨(소프트 아이스크림 요거트 농도, 소 패티 생성), 3: 입자성 대변 물질과 함께 갈색/탄색의 묽은 설사, 4: 입자성 대변 물질 없이 갈색/탄색 묽은 설사, 5: 물과 유사하게 보이는 묽은 설사.
이 점수화 시스템은 KSU의 Megan Niederwerder 박사가 개발하였으며 다음 간행물에 기초한다(Halbur et al., 1995; Merck; Miao et al., 2009; Patience and Thacker, 1989; Winckler and Willen, 2001). 점수 및 온도는 치료로서 유전자형에 기초하여 분리된 ANOVA를 사용하여 분석하였다.
PRRSV 바이러스 혈증의 측정
바이러스 혈증을 두 가지 접근법을 통해 결정하였다. 96 웰-플레이트에서 합류 MARC-145 세포에 혈청을 1:10 희석으로 첨가하여 바이러스 적정을 수행하였다. 혈청을 이전에 기재된 바와 같이 8% 태아 소 혈청, 페니실린, 스트렙토마이신, 및 암포테리신 B가 보충된 이글의 최소 필수 배지에 희석하였다(Prather et al., 2013). 세포를 현미경을 사용하여 세포변성 효과의 존재에 대해 4 일 배양 후 조사하였다. 세포변성 효과를 나타내는 가장 높은 희석을 적정 종점으로 점수화하였다. 바이러스 핵산을 측정하기 위해 Life Technologies MagMAX-96 바이러스 RNA 단리 키트를 사용하여 혈청에서 총 RNA를 단리하였다. 역 전사 폴리머라제 연쇄 반응을 제조업체의 설명서에 따라 CFX-96 실시간 PCR 시스템(Bio-Rad)에서 Tetracore의 EZ-PRRSV MPX 4.0 키트를 사용하여 수행하였다. 각 반응물(25 μl)에 5.8 μl의 혈청으로부터의 RNA가 포함되었다. 키트(Tetracore)에서 공급된 RNA 대조군의 연속 희석물을 제조하여 표준 곡선을 구성하였다. PCR 당 주형의 수를 기록한다.
PAM 세포의 SIGLEC1 및 CD163 염색
폐를 절개하고 ~100 ml 차가운 포스페이트 완충 염수로 채워 돼지 폐포 대식세포(PAM)를 수집하였다. 포스페이트 완충 염수를 회수한 후 세척 세포를 펠릿화하고 5 ml 차가운 포스페이트 완충 염수에 재현탁하고 얼음에서 저장하였다. 대략 107 개의 PAM을 5% 태아 소 혈청 및 0.1% 나트륨 아지드를 함유하는 포스페이트 완충 염수에 희석된 5 ml의 다양한 항체(항-돼지 CD169(클론 3B11/11; AbD Serotec); 항-돼지 CD163(클론 2A10/11; AbD Serotec))에서 30 분 동안 얼음에서 배양하였다. 세포를 세척하고 염색 완충액에 희석된 염소 항-마우스 IgG에 접합된 플루오레세인 이소티오시아네이트(FITC)(life Technologies)의 1/100 희석액에 재현탁하고 30 분 동안 얼음에서 배양하였다. 적어도 104 개의 세포를 FACSCalibur 유세포 분석기 및 Cell Quest 소프트웨어(Becton Dickinson)를 사용하여 분석하였다.
PRRSV-특이적 Ig의 측정
PRRSV-특이적 Ig를 측정하기 위해 재조합 PRRSV N 단백질을 박테리아에서 발현시키고(Trible et al., 2012) 키트(Luminex Corporation)를 사용하여 자기 Luminex 비드에 접합시켰다. N 단백질-커플링된 비드를 10% 염소 혈청을 함유하는 포스페이트 완충 염수에 2,500 개 비드/50 μl로 희석하고 96-웰 둥근 바닥 폴리스티렌 플레이트의 웰에 넣었다. 혈청을 10% 염소 혈청을 함유하는 포스페이트 완충 염수에 1:400으로 희석하고 50 μl를 이중 웰에 첨가하고 실온에서 부드럽게 진탕하면서 30 분 동안 배양하였다. 다음으로 플레이트를 10% 염소 혈청을 함유하는 포스페이트 완충 염수로 세척하고(3X) 50 μl의 비오틴-SP-접합된 친화성-정제된 염소 항-돼지 2차 항체(IgG, Jackson ImmunoResearch) 또는 10% 염소 혈청을 함유하는 포스페이트 완충 염수에 2 μg/ml로 희석된 비오틴-표지된 친화성 정제된 염소 항-돼지 IgM(KPL)를 첨가하였다. 플레이트를 30 분 배양 후 세척한 다음(3X) 50 μl의 스트렙타비딘-접합된 피코에리트린(10% 염소 혈청를 함유하는 포스페이트 완충 염수 중 2 μg/ml(Moss, Inc.))을 첨가하였다. 플레이트를 30 분 후 세척하고 미소구체를 10% 염소 혈청을 함유하는 포스페이트 완충 염수 100 μl에 재현탁하고 MAGPIX 및 Luminex xPONENT 4.2 소프트웨어를 사용하여 분석하였다. 형균 형광 강도(MFI)를 기록한다.
결과
상기 실시예 1에 기재된 바와 같이 CRISPR/Cas9 기술을 사용하여 CD163에서의 돌연변이를 생성하였다. 여러 원조 동물을 접합체 주입 및 체세포 핵 이식으로 생산하였다. 이들 원조 중 일부를 교배하여 연구할 자손을 생성하였다. 단일 원조 수컷을 2 개의 유전자형이 있는 암컷과 교배하였다. 원조 수컷(67-1)은 하나의 대립유전자의 엑손 7에서 11 bp 결실 및 다른 대립유전자의 엑손 7에서 2 bp 부가(및 선행 인트론에서 377 bp 결실)을 보유하였고 무효 동물(CD163 -/-)인 것으로 예측되었다. 1 마리의 원조 암컷(65-1)은 하나의 대립유전자의 엑손 7에서 7 bp 부가 및 비특성화 상응 대립유전자를 가졌으며 따라서 녹아웃에 대해 이형접합(CD163 -/?)인 것으로 예측되었다. 두번째 원조 암컷 유전자형(클로닝된 3 마리 동물)은 아직 비특성화 대립유전자 및 엑손 7에서 129 bp 결실을 가진 대립유전자를 함유하였다. 이 결실은 도메인 5에서 43 개 아미노산의 결실을 초래하는 것으로 예측된다. 이들 동물 사이의 교배로 모든 새끼 돼지는 수퇘지로부터 무효 대립유전자 및 암퇘지로부터 43 개 아미노산 결실 또는 비특성화 대립유전자 중 하나를 물려받았다. 바이러스 접종에 대한 양성 대조군으로 역할을 한 야생형 새끼 돼지 이외에도, 이는 4 개의 추가 유전자형을 생성하였다(표 13).
표 13. PRRSV 접종(NVSL 및 KS06 균주)에 대한 내성에 대해 시험된 유전자형
Figure pct00014
이유기에, 유전적 편집된 새끼 돼지 및 야생형 연령-일치 새끼 돼지를 PRRSV 접종을 위해 캔자스 주립 대학으로 수송하였다. PRRSV 접종을 이전에 기재된 바와 같이 수행하였다(Prather et al., 2013). 새끼 돼지를 3 주령에 접종 시설로 옮기고 단일 그룹으로 유지하였다. 모든 실험은 기관 동물 사용 및 생물안전성 위원회의 승인 후 시작하였다. 순응 후, 돼지를 MARC-145 세포에서 증식된 PRRSV 단리물인 NVSL 97-7895(Ladinig et al., 2015)로 접종하였다. 돼지를 대략 105 TCID50의 바이러스로 접종하였다. 접종물의 절반을 근육내로 전달하였고 나머지는 비강내로 전달하였다. 모든 감염된 돼지를 단일 그룹으로 유지하였으며, 감염된 우리 짝으로부터 바이러스에 연속적으로 노출시켰다. 혈액 샘플을 감염 후 최대 35 일까지 다양한 날 및 종료 시 35 일에 수집하였다. 돼지를 해부하고 조직을 10% 완충 포르말린에 고정시키고, 파라핀에 포매하고 조직병리학을 위해 처리하였다. 감염 과정 동안 기록된 PRRSV 관련 임상 징후는 호흡 곤란, 식욕부진, 무기력 및 발열을 포함하였다. 연구 기간에 걸친 임상 징후에 대한 결과는 도 9에 요약되어 있다. 예상된 바와 같이, 야생형 야생형(CD163+/+) 돼지는 PRRSV 감염의 초기 징후를 나타내었으며, 5 일 및 14 일 사이에 정점에 이르고 나머지 연구 기간 동안 그룹에서 지속되었다. 열성 돼지의 백분율은 약 10 일에 정점이 이르렀다. 대조적으로, 무효(CD163-/-) 새끼 돼지는 전체 연구 기간에 걸쳐 임상 징후의 증거를 나타내지 않았다. 급성 PRRSV 감염 동안 호흡기 징후는 폐에서 유의한 조직병리학 변화에 반영된다(표 14). 야생형 돼지의 감염은 단핵 세포의 침윤과 함께 간질성 부종을 포함하는 PRRS와 일치하는 조직병리학을 나타내었다(도 10). 대조적으로 무효(CD163-/-) 돼지에서 폐 변화에 대한 증거는 없었다. 다양한 유전자형에 대한 샘플 크기는 작고; 그럼에도 평균 점수는 야생형의 경우 3.85(n=7), 비특성화 A의 경우 1.75(n=4), 비특성화 B의 경우 1.33(n=3), 및 무효(CD163-/-)의 경우 0 (n=3)이었다.
표 14. 현미경 폐 평가
Figure pct00015
정점 임상 징후는 혈액 내 PRRSV의 수준과 상관관계가 있었다. 바이러스 핵산 측정은 혈청에서 총 RNA를 단리한 후 상업적인 리버스 트랜스트립타제 실시간 PRRSV PCR 검정(Tetracore, Rockville, MD)을 사용하여 PRRSV RNA를 증폭시켜 수행하였다. 표준 곡선은 RT-PCR 키트에 공급된 PRRSV RNA 대조군의 연속 희석을 제조하여 생성하였고 결과는 50 μl PCR 반응 당 주형의 수로 표준화하였다. PRRSV 단리물은 야생형 CD163 +/+ 돼지에서 PRRSV 바이러스 혈증에 대한 과정을 따랐다(도 11). 바이러스 혈증은 4 일에 명백하였고, 11 일에 정점에 도달하였으며 연구가 끝날 때까지 감소하였다. 대조적으로 바이러스 RNA는 연구 기간 동안 임의의 시점에서 CD163 -/- 돼지에서 검출되지 않았다. 바이러스 혈증과 일치하여, 무효 및 비특성화 대립유전자 돼지에 의한 항체 생산은 14 일에 검출가능하였고 28 일까지 증가하였다. 무효 동물에서는 항체 생산이 없었다(도 12). 동시에, 이들 데이터는 야생형 돼지가 PRRS와 일치하는 임상 징후의 생산과 함께 PRRSV 복제를 지원함을 나타낸다. 대조적으로, 녹아웃 돼지는 돼지가 접종되고 감염된 우리 짝에 지속적으로 노출되었음에도 불구하고 바이러스 혈증 및 임상 징후를 생산하지 않았다.
연구가 끝나면, 돼지 폐포 대식세포를 폐 세척으로 제거하고 이전에 기재된 바와 같이 SIGLEC1(CD169, 클론 3B11/11) 및 CD163(클론 2A10/11)의 표면 발현을 위해 염색하였다(Prather et al., 2013). CD163+/+ 야생형 동물에서 상대적으로 높은 수준의 CD163 발현을 검출하였다(도 13). 대조적으로, CD163-/- 돼지는 항-CD163 염색의 배경 수준만을 나타내었으며, 따라서 녹아웃 표현형을 확인하였다. 또 다른 대식세포 마커 CD169에 대한 발현 수준은 야생형 및 녹아웃 돼지 모두에 대해 유사하였다(도 14). MHC II 및 CD172를 포함하여 다른 대식세포 표면 마커는 두 유전자형에 대해 동일하였다(데이터는 제시되지 않음).
샘플 크기는 작았지만 야생형 돼지는 다른 3 개의 유전자형의 돼지(비특성화 A 1.32 kg ± 0.17, n=4; 비특성화 B 1.20 kg ± 0.16, n =3; 무효 1.21 kg ± 0.16, n=3)에 비해 실험 과정에 걸쳐 체중이 적게 증가하는 경향이 있었다(평균 일일 증가 0.81 kg ± 0.33, n=7).
두번째 시험에서 새끼 돼지를 접종하기 위해 KS06-72109를 사용한 것을 제외하고 6 마리의 야생형, 6 마리의 Δ43 아미노산, 및 비특성화 대립유전자 (B)를 갖는 6 마리의 돼지를 상기 기재된 바와 같이 접종하였다. NVSL 데이터와 유사하게 야생형 및 비특성화 B 새끼 돼지는 바이러스 혈증이 발생하였다. 그러나, Δ43 아미노산 돼지에서 KS06은 바이러스 혈증을 초래하지 않았다(도 15; 표 8).
시사점 및 결론
돼지 산업과 가장 임상적으로 관련된 질환은 PRRS이다. 백신 접종 프로그램은 대부분의 돼지 병원체를 예방하거나 또는 개선하는 데 성공적이었지만, PRRSV는 접종이 더 어려운 것으로 입증된다. 여기서 CD163은 이 바이러스 균주에 대한 진입 매개인자로 식별된다. 원조 수퇘지는 CRISPR/Cas9를 접합체에 주입하여 생성되었으며(Whitworth et al., 2014) 따라서 이식유전자가 없다. 추가로 암퇘지로부터의 대립유전자 중 하나(또한 CRISPR/Cas9를 사용하여 생성됨)는 이식유전자를 함유하지 않는다. 따라서 새끼 돼지 #40은 하나의 대립유전자에서 7 bp 부가 및 다른 대립유전자에서 11 bp 결실을 보유하지만, 이식유전자는 없다. CD163의 이들 바이러스-내성 대립유전자는 돼지 게놈이 약 28 억 bp라는 것을 고려하여 작은 게놈 편집을 나타낸다(Groenen et al., 2012). 유사하게 생성된 동물을 식량 공급에 도입한다면, 상당한 경제적 손실을 막을 수 있다.
실시예 3: 인간 CD163-유사 상동성 SRCR 도메인 8로 대체된 CD163 SRCR 도메인 5를 갖는 돼지에서 유전자형 1 돼지 생식 및 PRRS 바이러스에 대한 내성 증가
CD163은 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)에 대한 주요 수용체로 간주된다. 이 연구에서, 돼지를 다음 유전자형 중 하나를 보유하도록 유전적으로 편집하였다(GE): CD163의 완전 녹아웃(KO), CD163 스캐빈저 수용체 시스테인-풍부(SRCR) 도메인 5 내의 결실, 또는 인간 CD163-유사(hCD163L1) SRCR 8 도메인의 상동체를 암호화하는 합성된 엑손으로 SRCR 도메인 5의 대체(도메인 swap). 돼지 폐포 대식세포(PAM)의 면역표현형은 KO 또는 SRCR 도메인 5 결실이 있는 돼지가 CD163을 발현하지 않았고 PAM이 PRRSV 감염을 지원하지 않았음을 나타내었다. hCD163L1 도메인 8 상동체를 보유한 돼지의 PAM은 CD163을 발현하고 2형의 복제를 지원하였지만, 1형 유전자형 바이러스는 지원하지 않았다. 대표적인 1형 및 2형 바이러스로 CD163-변형된 돼지의 감염은 유사한 결과를 생산하였다. 1형 및 2형 바이러스는 수용체로서 CD163의 필요 조건을 포함하여 여러 수준에서 유전적으로 및 표현형적으로 유사한 것으로 간주되지만, 결과는 CD163 분자의 인식에서 PRRSV 유전자형 사이의 뚜렷한 차이를 입증한다.
재료 및 방법
돼지 CD163 유전자의 게놈 변형
동물 및 바이러스를 수반하는 실험을 연구 및 교육을 위한 농업 동물의 관리 및 사용에 대한 연방 동물 과학 협회 가이드, USDA 동물 복지법 및 동물 복지 규제에 따라 수행하였으며, 캔자스 주립 대학 및 미주리주 대학 기관 동물 관리 및 사용 위원회 및 기관 생물안전성 위원회의 승인을 받았다. 이 연구에 사용된 CD163의 돌연변이는 선행 실시예에 상기 기재된 바와 같이 CRISPR/Cas9 기술을 사용하여 생성하였다. 돌연변이는 도 17에 도식화되어 있다. 도 17에 도시된 도식화된 게놈 영역은 돼지 CD163 유전자의 인트론 6에서 인트론 8까지 서열을 포괄한다. 도 17에 도식화되어 있는 인트론 및 엑손은 축적 비율로 그려지지 않았다. 예측된 단백질 산물은 각 게놈 구조의 오른쪽에 예시된다. PAM에서 표면 CD163의 수준에 의해 측정된 바와 같이, 상대적 대식세포 발현은 도 17의 맨 오른쪽에 제시된다. 검정색 영역은 인트론을 나타내고; 흰색 영역은 엑손을 나타내고; 빗금 친 영역은 돼지 엑손 7의 상동체인 hCD163L1 엑손 11 모방체를 나타내고; 회색 영역은 도 17에 도시된 바와 같이 PGK Neo 작제물을 갖는 합성된 인트론을 나타낸다.
도 17에 제시된 CD163 유전자 작제물 KO-d7(11)은 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 엑손 7에서 11 염기쌍 결실을 보유한다. CD163 유전자 작제물 KO-i7(2)은 뉴클레오티드 3,149 및 3,150 사이에 엑손 7에서 2 염기쌍 삽입 뿐만 아니라 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 엑손 7의 인트론 상류에서 377 염기쌍 결실을 보유한다. 이러한 편집은 프레임시프트 돌연변이 및 조기 정지 코돈을 유발하여, SRCR 5 및 KO 표현형의 부분 번역만을 초래하는 것으로 예측된다. 3 개의 다른 돌연변이는 엑손 7에서 결실을 생산하였다. 첫번째로, d7(129)은 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 129 염기쌍 결실을 갖는다. d7(129) 작제물은 또한 엑손 6에서 뉴클레오티드 488에서 뉴클레오티드 2,417까지 결실을 가지며, 여기서 결실된 서열은 12 bp 삽입으로 대체된다. 다른 2 개의 결실 작제물인 d7(1467)d7(1280)은 도 17에 예시된 바와 같이 엑손 7 및 8의 완전 결실을 갖는다. d7(1467)은 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실을 갖고, d7(1280)은 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실을 갖는다. 이들 결실 작제물의 경우 다른 CD163 엑손은 온전하게 남아있다.
도 17에 도시된 마지막 작제물인 HL11m은 엑손 7이 결실되고 인간 CD163-유사 1 단백질의 SRCR 8의 상동체를 암호화하는(hCD163L1 도메인 8은 hCD163L1 엑손 11에 의해 암호화됨) 합성된 엑손으로 대체된 표적화 사건을 사용하여 생산하였다. SRCR 8 펩티드 서열은 돼지 엑손 7 서열에서 33 개 뉴클레오티드 변화를 만들어 생성하였다. 네오마이신 카세트는 변형에 대한 스크리닝을 가능하게 하기 위해 합성화된 엑손에 포함되었다. 서열번호: 118은 참조 서열 서열번호: 47의 동일한 영역에 상응하는 영역에서 HL11m 작제물에 대한 뉴클레오티드 서열을 제공한다.
돼지 CD163 단백질 및 유전자의 다이어그램은 도 18에 제공되어 있다. CD163 단백질 SCRC(타원형) 및 PST(사각형) 도메인은 상응하는 유전자 엑손과 함께 도 18의 패널 A에 도시되어 있다. 돼지 CD163 SRCR 5(서열번호: 120) 및 인간 CD163 SRCR 8 상동체(서열번호: 121)에 대한 펩티드 서열 비교는 도 18의 패널 B에 도시되어 있다. 도면은 GenBank 수탁 번호 AJ311716(돼지 CD163) 및 GQ397482(hCD163-L1)에 기초한다.
바이러스
이 실시예에 사용되는 바이러스의 패널은 표 15에 나열되어 있다. 단리물을 MARC-145 세포에서 증식시키고 적정하였다(Kim et al., 1993). 적정을 위해, 각 바이러스를 7% FBS, Pen-Strep(각각 80 유닛/ml 및 80 μg/ml), 3 μg/ml FUNGIZONE(암포테리신 B), 및 25 mM HEPES가 보충된 MEM에서 1:10으로 연속으로 희석하였다. 희석된 샘플을 웰당 200 μl의 최종 부피로 96 웰 플레이트에서 합류 MARC-145 세포에 4중으로 첨가하고 5% CO2에서 37℃에서 4 일 동안 배양하였다. 적정 종점은 세포변성 효과(CPE)가 있는 마지막 웰로 식별하였다. 50% 조직 배양 감염 용량(TCID50/ml)은 이전에 기재된 바와 같은 방법을 사용하여 계산하였다(Reed 및 Muench 1938).
표 15. PRRSV 단리물.
Figure pct00016
폐포 대식세포의 감염
대식세포의 제조 및 감염을 이전에 기재된 바와 같이 수행하였다(Gaudreault, et al., 2009 및 Patton, et al., 2008). 안락사시킨 돼지에서 폐를 제거하고 100 ml의 차가운 포스페이트 완충 염수(PBS)를 기관에 부어 세척하였다. 기관을 고정시키고 폐를 부드럽게 마사지하였다. 폐포 내용물을 50 ml 원심분리 튜브에 붓고 얼음에서 저장하였다. 돼지 폐포 대식세포(PAM)를 4℃에서 10 분 동안 1200 x g에서 원심분리하여 침전시켰다. 펠릿을 재현탁하고 차가운 멸균 PBS에서 1회 세척하였다. 세포 펠릿을 45% RPMI 1640, 45% 태아 소 혈청(FBS), 및 10% 디메틸술폭시드(DMSO)를 함유하는 동결 배지에 재현탁하고 사용할 때까지 액체 질소에서 저장하였다. 동결된 세포를 얼음에서 해동시키고, 카운팅하고 배지(10% FBS, PenStrep, 및 FUNGIZONE이 보충된 RPMI 1640; RPMI-FBS)에서 5x105 개 세포/ml로 조정하였다. 웰 당 대략 103 개의 PAM을 96 웰 플레이트에 첨가하고 5% CO2에서 37℃에서 밤새 배양하였다. 세포를 부드럽게 세척하여 비부착 세포를 제거하였다. 연속 1:10 바이러스 희석액을 삼중으로 웰에 첨가하였다. 밤새 배양 후, 세포를 PBS로 세척하고 10 분 동안 80% 아세톤으로 고정시켰다. 건조 후, 웰을 1% 어류 젤라틴(PBS-FG; Sigma Aldrich)을 포함하는 PBS에서 1:1000으로 희석된 PRRSV N-단백질 특이적 SDOW-17 mAb(Rural Technologies Inc.)로 염색하였다. 37℃에서 30 분 배양 후, 세포를 PBS로 세척하고 PBS-FG에 1:200으로 희석된 ALEXAFLUOR 488-표지된 항-마우스 IgG(Thermofisher Scientific)로 염색하였다. 플레이트를 37℃에서 어둠 속에서 30 분 동안 배양하고, PBS로 세척하고, 형광 현미경 하에 관찰하였다. 50% 조직 배양 감염 용량(TCID50)/ml을 이전에 기재된 바와 같은 방법에 따라 계산하였다(Reed and Muench 1938).
PAM 상의 CD169 및 CD163 표면 발현의 측정
CD169 및 CD163의 표면 발현을 위한 염색을 이전에 기재된 바와 같이 수행하였다(Prather et al., 2013). 대략 1X106 개의 PAM을 12 mm x 75 mm 폴리스티렌 유세포 분석(FACS) 튜브에 넣고 10% 정상 마우스 혈청을 함유하는 1 ml의 PBS에서 실온에서 15 분 동안 배양하여 Fc 수용체를 차단하였다. 세포를 원심분리에 의해 펠릿화하고 5 μl의 FITC-접합된 마우스 항-돼지 CD169 mAb(클론 3B11/11; AbD Serotec) 및 5 μl의 PE-접합된 마우스 항-돼지 CD163 mAb(클론: 2A10/11, AbD Serotec)에 재현탁하였다. 30 분 배양 후, 세포를 1% 소 혈청 알부민(BSA Fraction V; Hyclone)을 함유하는 PBS로 2 회 세척하고 FCS Express 5 소프트웨어(De Novo Software)를 사용하여 BD LSR Fortessa 유세포 분석기(BD Biosciences)에서 즉시 분석하였다. 각 샘플에 대해 최소 10,000 개의 세포를 분석하였다.
PRRS 바이러스 혈증의 측정
RNA를 제조업체의 설명서에 따라 Ambion의 MagMAX 96 바이러스 단리 키트(Applied Biosystems)를 사용하여 50 μl의 혈청에서 단리하였다. PRRSV RNA를 제조업체의 설명서에 따라 수행된 EZ-PRRSV MPX 4.0 Real-Time RT-PCR 표적-특이적 시약(Tetracore)을 사용하여 정량화하였다. 각 플레이트는 Tetracore 정량화 표준 및 RT-PCR 시약과 함께 사용하도록 설계된 대조군 세트를 함유하였다. PCR을 권장된 주기 파라미터를 사용하여 96-웰 포맷으로 CFX96 Touch Real-Time PCR 검출 시스템(Bio-Rad)에서 수행하였다. PCR 검정 결과를 50 μl 반응 부피 당 log10 PRRSV RNA 카피 수로 기록하였으며, 이는 혈청 ml 당 카피 수에 근사치이다. 시간 경과에 따른 바이러스 혈증에 대한 곡선하 면적(AUC)을 윈도우용 GraphPad Prism 버전 6.00을 사용하여 계산하였다.
PRRSV 항체의 측정
PRRSV 뉴클레오캡시드(N) 단백질에 대한 항체의 검출을 위한 미소구체 형광 면역검정(FMIA)을 이전에 기재된 바와 같이 수행하였다(Stephenson et al., 2015). 재조합 PRRSV N 단백질을 제조업체의 지시에 따라 카르복실화된 Luminex MAGPLEX 폴리스티렌 미소구체 비드에 커플링하였다. FMIA를 위해, 10% 염소 혈청을 포함하는 50 μL PBS(PBS-GS)에 현탁된 대략 2500 개의 항원-코팅된 비드를 96-웰 폴리스티렌 둥근 바닥 플레이트의 각 웰에 넣었다. 혈청을 PBS-GS에서 1:400으로 희석하고 50 μl를 각 웰에 첨가하였다. 플레이트를 호일로 감싸고 부드럽게 진탕하면서 실온에서 30 분 동안 배양하였다. 플레이트를 자석 위에 놓고 비드를 190 μl의 PBS-GS로 3 회 세척하였다. IgG의 검출을 위해, 50 μl의 비오틴-SP-접합된 친화성 정제된 염소 항-돼지 2차 항체(IgG, Jackson ImmunoResearch)를 PBS-GS에서 2 μg/ml로 희석하고 100 μl를 각 웰에 첨가하였다. 플레이트를 30 분 동안 실온에서 배양하고 3 회 세척한 후 50 μl의 스트렙타비딘-접합된 피코에리트린(PBS-GS 중 2 μg/ml; SAPE)을 첨가하였다. 30 분 후, 미소구체를 세척하고, 100 μl의 PBS-GS에 재현탁하고, MAGPIX 기구(LUMINEX) 및 LUMINEX xPONENT 4.2 소프트웨어를 사용하여 분석하였다. 평균 형광 강도(MFI)는 최소 100 개의 미소구체 비드에서 계산하였다.
합토글로빈(HP)의 측정
혈청 내 HP의 양을 돼지-특이적 Hp ELISA 키트(Genway Biotech Inc.)를 사용하여 측정하고 제조업체의 설명서에 따라 단계를 수행하였다. 혈청 샘플을 1X 희석 용액에서 1:10,000으로 희석하고 사전 코팅된 항-돼지 Hp 96 웰 ELISA 플레이트에서 이중으로 피펫팅하고, 15 분 동안 실온에서 배양한 다음, 3 회 세척하였다. 항-Hp-서양고추냉이 퍼옥시다제(HRP) 접합체를 각 웰에 첨가하고 15 분 동안 실온에서 어둠 속에서 배양하였다. 플레이트를 세척하고 100 μl 색소원-기질 용액을 각 웰에 첨가하였다. 10 분 동안 어둠 속에서 배양한 후, 100 μl의 정지 용액을 각 웰에 첨가하였다. 플레이트를 Fluostar Omega 필터-기반 마이크로플레이트 판독기(BMG Labtech)에서 450 nm에서 판독하였다.
결과
CD163-변형된 돼지로부터 PAM의 표현형 특성
폐 세척 물질에서 세포의 전방 및 측면 산란 특성을 사용하여 세포의 단핵 하위집단을 게이팅하였다. 도 17에 제시된 상이한 염색체 변형에 대한 대표적인 CD169 및 CD163 염색 결과는 도 19에 제시되어 있다. 도 19의 패널 A에 제시된 대표적인 예에서, WT 돼지로부터 91% 초과의 PAM은 CD169 및 CD163 모두에 대해 양성이었다. 이 연구에 사용된 12 마리의 WT 돼지에 대한 결과는 평균 85 +/- 8%의 이중-양성 세포를 나타내었다. 도 19의 패널 B에 제시된 바와 같이, CD163 KO 돼지로부터 PAM은 CD163의 증거를 나타내지 않았지만, CD169의 정상 표면 수준을 유지하였다. d7(1467) 및 d7(1280) 결실 유전자형에서 유래된 CD163 폴리펩티드는 PAM 표면에 고정된 변형된 CD163 폴리펩티드를 생산해야 하는 것으로 예측되었지만, 면역염색 결과는 CD163의 표면 발현이 없음을 나타내었다(도 19, 패널 D 참조). MAb 2A10은 처음 3 개의 SRCR 도메인에 위치한 에피토프를 인식하므로, 검출의 부재는 면역반응성 에피토프의 결실의 결과가 아니었다. d7(129) 유전자형은 SRCR 5에서 43 개 아미노산 결실을 보유하는 것으로 예측되었다(도 17 참조). 도 19의 패널 C에 제시된 예에서, 세포의 2.4%만이 이중-양성 사분면에 속하였다. 이 연구에 사용된 9 마리의 d7(129) 돼지로부터 PAM의 분석은 0% 내지 3.6% 범위의 이중-양성 세포의 백분율을 나타내었다(평균 = 0.9%). CD169의 표면 발현은 WT PAM와 유사하게 유지되었다. 이 연구의 목적을 위해, KO, d7(1467), d7(1280), 및 d7(129) 유전자형을 보유하는 돼지를 모두 CD163-무효 표현형을 보유하는 것으로 분류하였다.
hCD163L1 도메인 8 펩티드 서열 HL11m을 함유하는 CD163 변형은 PAM에서 CD163+ CD169+의 이중 발현을 나타내었다(도 19의 패널 E). 그러나, 이 연구에서 분석된 모든 HL11m 돼지에서, CD163의 표면 발현은 WT PAM에 비해 현저하게 감소하였다. CD163의 수준은 검출가능한 CD163이 없는 것에서 중간 수준의 CD163을 보유하는 돼지에 이르기까지 발현의 연속체에 속하였다. 도 19의 패널 E에 제시된 예에서, 세포의 대략 60%가 이중-양성 사분면에 있었지만 세포의 40%는 CD169에만 염색되었다. 총 24 마리의 HL11m 돼지로부터 PAM의 분석은 PAM 세포의 38 +/- 12%가 CD169에만 양성이고 54+/-14%가 이중-양성(CD169+CD163+)이었음을 나타내었다.
WT 및 CD163-변형된 돼지에서 순환 합토글로빈 수준
스케빈저화 분자로서, CD163은 혈액에서 HbHp 복합체를 제거하는 역할을 한다(Fabriek, et al., 2005; Kristiansen et al., 2001; 및 Madsen et al., 2004). 혈청 내 Hp의 수준은 CD163-발현 대식세포의 전반적인 기능적 특성을 결정하는 편리한 방법을 제공한다. WT, HL11mCD163-무효 돼지에서 혈청 내 Hp 수준을 PRRSV 감염 직전 3 내지 4 주령에 측정하였다. 도 20에 제시된 결과는 WT 돼지의 혈청이 가장 적은 양의 Hb를 가졌음을 나타내었다(평균 A450=23+/- 0.18, n=10). 각 그룹에 대한 평균 및 표준 편차는 WT, 0.23+/- 0.18, n=10; HL11m, 1.63+/- 0.8, n=11; 및 무효 그룹의 경우 2.06 +/- 0.57, n=9였다. 무효 그룹은 CD163을 발현하지 않는 유전자형으로 구성되었다(CD163 무효 표현형 돼지). Hp 측정은 단일 ELISA 플레이트에서 수행하였다. 동일한 문자를 갖는 그룹은 유의하게 차이가 없었다(p>0.05, Dunnett의 사후-검정과 함께 Kruskal-Wallis 일원 ANOVA). 평균 A450 값은 WT 돼지의 경우 HL11mCD163-무효 돼지와 유의하게 차이가 차이가 있었다(p< 0.05). 평균 A450 값은 CD163-무효 그룹과 비교하여 HL11m 그룹에 대해 낮았지만(A450 = 1.6+/-0.8 대 2.1+/-0.6), 차이는 통계적으로 유의하지 않았다. HbHp 및 CD163 사이의 상호작용은 SRCR 3을 통해 발생하므로(Madsen et al., 2004), WT 돼지와 비교하여 HL11m 돼지에서 순환 Hp 증가는 Hb/Hp에 대한 CD163의 감소된 친환성의 결과가 아닐 가능성이 있지만, 나머지 대식세포에서 감소된 CD163 발현과 함께 CD163+ 대식세포의 감소된 수의 결과일 수 있다(도 19의 패널 E 참조).
1형 및 2형 바이러스로 PAM의 감염
PRRSV에 대한 CD163-변형된 돼지의 허용성을 처음에 6 마리의 1형 및 9 마리의 2형 PRRSV 단리물의 패널로 시험관내에서 PAM을 감염시킴으로써 평가하였다(바이러스의 목록에 대해 표 15 참조). 패널에서 바이러스는 상이한 유전자형, 뿐만 아니라 뉴클레오티드 및 펩티드 서열, 발병기전, 및 단리 연도에서의 차이를 나타낸다. 표 16에 제시된 데이터는 각 CD163 유전자형 그룹에 대해 3 마리 돼지로부터의 PAM을 사용한 실험 결과를 나타낸다. 나열된 바이러스는 표 15에 나열된 PRRSV 단리물에 상응한다. 결과는 감염된 PAM 퍼센트의 평균 +/- 표준 편차로 나타낸다. CD163-무효 PAM는 d7(129) 대립유전자를 발현하는 돼지로부터 유래되었다(CD163 유전자 작제물 및 PAM에 대한 CD163 발현에 대해 각각 도 17 및 19 참조).
표 16. 상이한 PRRSV 단리물로 야생형 및 GE 돼지로부터의 PAM 감염
Figure pct00017
예상된 바와 같이, WT PAM은 모든 바이러스에 의해 감염되었다. 대조적으로, CD163-무효 표현형 돼지는 모든 바이러스에 의한 감염에 음성이었다. HL11m 돼지로부터의 PAM의 반응에서 현저한 차이가 관찰되었다. 1형 바이러스 중 어떤 것도 HL11m PAM을 감염시킬 수 없었지만; 2형 패널에서의 모든 바이러스는 WT PAM과 비교하여 훨씬 낮은 백분율이기는 하나 HL11m PAM을 감염시켰다.
또한 허용성을 동일한 2형 바이러스에 대해 WT 및 HL11m PAM 사이의 바이러스 적정 종점을 비교함으로써 평가하였다. 결과는 2 마리의 WT 및 2 마리의 HL11m 돼지에 대해 제시된다(도 21). log10TCID50 값을 동일한 바이러스 샘플을 사용한 대식세포 배양물의 감염에 기초하여 계산하였다. 감염 결과는 각 유전자형에서 2 마리의 상이한 돼지를 나타낸다. 감염에 사용되는 바이러스는 표 15에 나열되어 있다. HL11m 돼지의 PAM에 대한 log10TCID50 값은 동일한 바이러스로 감염된 WT PAM과 비교하여 1-3 로그 더 낮았다. 유일한 예외는 변형된-생 바이러스 백신 균주를 사용한 감염이었다. 종합하면, 결과는 HL11m 돼지의 PAM이 2형 바이러스 감염에 대한 감소된 감수성 또는 허용성을 보유함을 시사한다.
1형 및 2형 바이러스에 의한 CD163-변형된 돼지의 감염
WT(원형), HL11m(사각형), 및 CD163-무효(삼각형) 돼지를 대표적인 1형(SD13-15)(도 22, 패널 A, 왼쪽 그래프) 및 2형(NVSL 97-7895)(도 22, 패널 A, 오른쪽 그래프) 바이러스로 감염시켰다. 무효 표현형 돼지는 KO 및 d(1567) 대립유전자로부터 유래되었다(도 17 참조). 동일한 바이러스로 접종된 세 가지 유전자형의 돼지를 하나의 우리에서 함께 어울리게 하여, WT 우리 짝으롤부터 떨어져 나온 바이러스에 CD163-변형된 돼지를 계속 노출시켰다. 대표적인 1형 바이러스로 감염된 돼지의 수는 WT(n=4), HL11m(n=5), 및 무효(n=3)이고; 2형 바이러스로 감염된 돼지의 수는 WT(n=4), HL11m(n=4), 및 무효(n=3)이다. 도 22에 제시된 바와 같이, 1형 또는 2형 바이러스로 감염된 CD163-무효 돼지는 모든 시점에서 바이러스 혈증에 대해 음성이었으며 혈청전환하지 않았다. 예상된 바와 같이, WT 돼지는 두 바이러스에 감염 후 7 일에 50 μl PCR 반응물 당 106 개의 주형에 접근하는 평균 바이러스 혈증 수준을 보유하면서 생산적으로 감염되었다. 14 일까지, 모든 WT 돼지는 혈청전환되었다(도 22, 패널 B 참조). PAM 감염 결과와 일치하여(표 16), 1형 바이러스로 감염된 5 마리의 HL11m 돼지는 바이러스 혈증 또는 PRRSV 항체의 증거를 제시하지 않았다. 2형 단리물인 NVSL로 감염된 모든 HL11m 돼지는 감염을 지원하고 혈청전환되었다(도 22, 패널 B). HL11m 돼지의 감소된 허용성의 존재는 불분명하였다. HL11m 돼지 4 마리 중 3 마리에 대한 평균 바이러스 혈증은 WT 돼지와 유사하였다. 그러나, 1 마리의 HL11m 돼지인 #101의 경우(도 22, 패널 A 오른쪽 그래프에서 개방 사각형), 바이러스 혈증은 HL11m 유전자형 그룹에서 다른 돼지와 비교하여 크게 감소하였다. 돼지 #101에 대한 바이러스 혈증에서 3 내지 4 로그 감소에 대한 설명은 분명하지 않지만, 일부 HL11m 돼지는 시험관내 PAM 감염 결과를 지원하는 결과인 PRRSV에 대해 덜 허용될 수 있음을 시사하였다(표 16). 모든 돼지에 동일한 양의 바이러스를 접종하고 WT 돼지와 함께 어울리게 유지하였으므로, 돼지 #101의 낮은 바이러스 혈증은 적은 양의 바이러스를 받거나 또는 바이러스에 덜 노출되는 결과가 아니었다. 대식세포의 유세포 분석은 돼지 #101에 대한 CD163 발현이 다른 HL11m 돼지와 필적할만하였음을 나타내었다(데이터는 제시되지 않음). 엑손 11 모방체 서열에서는 차이가 없었다.
추가 바이러스 감염 시험을 두 바이러스, NVSL 97-7895 및 KS06-72109를 사용하여 수행하였다. 결과는 도 23에 제시되어 있다. 돼지를 감염 후 35 일 동안 추적하고 데이터를 감염 후 3, 7, 11, 14, 21, 28 및 35 일에 취한 바이러스 혈증 측정에 대한 곡선하 면적(AUC)으로 기록하였다. 도 23에 제시된 바와 같이, NVSL의 경우, NVSL로 감염된 7 마리의 WT 돼지에 대한 평균 AUC는 7 마리의 HL11m 돼지에 대한 165 +/- 15에 비해 168 +/- 8이었다. KS06의 경우, 6 마리의 WT 및 6 마리의 HL11m 돼지에 대한 평균 AUC 값은 각각 156 +/- 9 및 163 +/-13이었다. 두 바이러스의 경우, WT 및 HL11m 돼지 사이에 통계적으로 유의한 차이는 없었다(p> 0.05). 종합하면, 결과는 HL11m 돼지는 1형 PRRSV 감염을 지원하지 않았지만, 2형 바이러스 감염에 대해 허용성을 유지함을 나타내었다. 2형 단리물로 시험관내에서 감염된 HL11m 돼지의 PAM의 PRRSV 허용성은 감소했지만, 이 차이는 돼지로 번역되지 않았다. 도 23에 제시된 결과를 위해, 35 일 감염 기간에 걸쳐 각 돼지에 대해 곡선하 면적(AUC)을 계산함으로써 바이러스 부하를 결정하였다. AUC 계산은 감염 후 0, 4, 7, 10, 14, 21, 28 및 35 일에 취한 log10 PCR 바이러스 혈증 측정을 사용하여 수행하였다. 수평 선은 평균 및 표준 편차를 나타낸다. 기호 풀이: WT = 야생형 돼지, HL11 = HL11m 유전자형 돼지; 무효 = CD163-무효 유전자형.
논의
CD163은 혈액으로부터 과도한 HB를 스케빈저화하고 조직 손상에 반응하여 염증을 조절하는 데 중요한 대식세포 표면 단백질이다. 또한 바이러스 수용체로 기능한다. CD163은 전염증 및 항염증 반응에 모두 참여한다(Van Gorp et al., 2010). CD163-양성 대식세포는 대식세포의 대안적으로 활성화된 M2 그룹 내에 위치하며, 일반적으로 주로 식세포성 및 항염증성으로 기재된다. M2 대식세포는 기계적 조직 손상 또는 감염 후 정화 및 복구에 참여한다(Stein et al., 1992). 항염증 능력에서, CD163 발현은 IL-10과 같은 항염증 단백질에 의해 상향조절된다(Sulahian, et al., 2002). 염증 동안, CD163은 혈액에서 순환하는 헴을 제거하여 산화를 감소시킴으로써 염증을 감소시킨다. 빌베르딘, 빌리루빈, 및 일산화탄소와 같은 헴 분해 산물은 강력한 항염증 분자이다(Soares and Bach, 2009 및 Jeney et al., 2002). 전염증 능력에서, 항-CD163 항체 또는 박테리아에 의한 대식세포 표면 상의 CD163의 가교는 IL-6, GM-CSF, TNFα 및 IL-1β를 포함하여 전염증 사이토카인의 국소 방출을 초래한다(Van den Heuvel et al., 1999 및 Fabriek et al., 2009).
CD163이 없는 GE 돼지는 2형 PRRSV 단리물의 복제를 지원하지 못한다(Whitworth et al., 2016). 이 연구에서, 시험관내 감염 시험은 1형 및 2형 PRRSV 단리물의 광범위한 패널에 대한 CD163 무효 표현형 대식세포의 내성을 입증하며, 잠재적으로 모든 PRRSV 단리물을 포함하도록 내성을 추가로 확장한다(표 16). 1형 및 2형 바이러스에 대한 CD163-무효 표현형 대식세포의 내성을 생체내에서 확인하였다(도 22 및 도 23). 이들 결과에 기초하여, 이전에 문헌에 기재된 다른 PRRSV 수용체의 기여(Zhang and Yoo, 2015)는 배제될 수 있다. 예를 들어, Shanmukhappa et al. (2007)은 CD151 플라스미드로 형질감염된 비허용성 BHK 세포가 PRRSV 복제를 지원하는 능력을 획득하였고, 폴리클로날 항-CD151 항체와 배양하여 MARC-145 세포의 감염을 유의하게 감소시켰음을 나타내었다. 게다가, 원래 돼지 인플루엔자 바이러스를 전파시키는 데 사용하기 위해 개발된 유인원 세포주인 SJPL은 이전에 PRRSV 복제를 지원하는 것으로 나타났다(Provost, et al., 2012). SJPL 세포주의 중요한 특성은 CD151의 존재 및 시알로어드헨신 및 CD163의 부재를 포함하였다. 종합하면, 이들 데이터는 CD151 단독의 존재가 PRRSV 복제를 지원하는 데 충분하다는 설득력 있는 증거를 제공한다. CD163 무효 표현형을 보유하는 대식세포 및 돼지에서 PRRSV 감염의 부재를 나타내는 이 연구 결과는 PRRSV에 대한 대안적인 수용체로서 CD151이 생물학적으로 관련이 없음을 나타낸다.
PRRSV 표면 상의 GP2a, GP3, GP4 이형삼량체 복합체의 일부를 형성하는 바이러스 단백질 GP2a 및 GP4는 GP2 및 GP4 플라스미드로 형질감염된 세포의 풀다운 검정에서 CD163과 공동침전될 수 있다(Das, et al., 2009). 아마도, GP2 및 GP4는 CD163 SRCR 도메인의 하나 이상과 상호작용을 형성한다. 돼지 SRCR 5 및 hCD163-L1 SRCR 8의 상동체 사이에 도메인 swap를 함유하는 돼지 CD163 cDNA 백본을 혼입하는 시험관내 감염성 검정은 1형 바이러스에 의해 활용되는 영역을 SRCR 5에 추가로 국소화하였다(Van Gorp, et al., 2010). GP2/GP4 및 CD163 사이의 안정한 상호작용이 SRCR 5를 통해 발생한다고 추측하는 것은 흥미롭다. GP3 및 GP5와 같은 추가 바이러스 당단백질은 바이러스-수용체 복합체를 추가로 안정화시킬 수 있거나 또는 공동 수용체 분자로서 기능할 수 있다. SRCR 5에 대한 필요 조건은 HL11m 대립유전자를 보유하는 대식세포 및 돼지를 형질감염시켜 이 연구에서 조사하였으며, 돼지 엑손 7에서 33 bp 치환시켜 CD163L1 SRCR 8 도메인 swap 재생성하였다. HL11m 대립유전자는 또한 유전적 변경에 양성인 세포의 선택을 위한 네오마이신 카세트를 포함하였다(도 17). HL11m 돼지는 WT PAM와 비교하여 감소된 수준이지만 PAM 상의 CD163을 발현하였다(도 19, 패널 A 및 E 비교). 감소된 발현은 엑손 11 모방체 및 이후 인트론 사이에 위치한 네오마이신 카세트의 존재로 인할 가능성이 있었다. HL11m 돼지는 1형 바이러스 감염에 대해 허용되지 않았으며, SRCR 5의 중요성을 확인하였다. 그러나, HL11m 대식세포 및 HL11m 돼지는 2형 바이러스 감염을 지원하였다. 바이러스 적정 및 퍼센트 감염 결과에 기초하여, HL11m 돼지로부터의 PAM은 WT 대식세포와 비교하여 바이러스에 대한 전반적으로 감소된 허용성을 나타내었다(표 16 및 도 17). 감소된 허용성은 변형된 CD163 단백질에 대한 바이러스의 감소된 친화성과 조합하여, HL11m 대식세포 상의 CD163의 감소된 발현으로 인할 수 있다. 2형 바이러스가 SRCR 5의 필요 조건을 보유하고 L1 SRCR 8이 적합한 대체물로 기능할 수 있다고 가정하면, 낮은 친화성은 인간 SRCR 8 및 돼지 SRCR 5 사이의 펩티드 서열의 차이로 설명할 수 있다(도 18, 패널 B 참조). 그러나, PAM의 감소된 허용성은 돼지로 번역되지 않았다. HL11m 돼지에 대한 평균 바이러스 혈증은 WT 돼지와 비교했을 때 유의하게 상이하지 않았다(도 23). PAM 이외에도, 혈관내, 중격 및 림프 조직 대식세포의 PRRSV 감염은 바이러스 혈증에 기여한다(Lawson et al., 1997 및 Morgan et al., 2014). HL11m 돼지에서 전반적인 바이러스 부하를 유지하는 데 있어서 이들 및 다른 CD163-양성 세포 집단의 잠재적인 기여는 추가로 연구할 가치가 있다.
SRCR 도메인의 결실을 보유하는 CD163 플라스미드가 HEK 세포에서 안정되게 발현되지만(Van Gorp et al., 2010), d7(1467) 및 d7(1280)에서 엑손 7 및 8의 결실은 CD163의 검출가능한 표면 발현의 결여를 초래하였다(도 19, 패널 D). 유세포 분석에 사용되는 2A10 mAB는 3 개의 N-말단 SRCR 도메인(Van Gorp et al., 2010), 및 가능하게는 7번째 및 8번째 도메인(Sanchez, et al., 1999)을 인식하므로, 검출의 부재는 돌연변이된 단백질에서 2A10 에피토프의 제거로 인한 것이 아니었다. 소량의 CD163 발현은 d7(129) 돼지 일부의 PAM에서 검출될 수 있지만(도 19, 패널 C 참조), 발현된 단백질의 양은 PAM 또는 돼지에서 PRRSV 감염을 지원하기에 충분하지 않았다. 엑손 7 및 8 결실 돌연변이체에서 CD163 발현의 부재는 완전히 이해되지 않지만, mRNA 및/또는 단백질 분해의 결과일 가능성이 있다.
2003년에, CD163은 아프리카 돼지 열병 바이러스(ASFV;
Figure pct00018
-Torres et al., 2003)에 대한 수용체로 식별되었다. 이 결론은 감염된 대식세포가 성숙 CD163-양성 표현형을 보유하고, 2A10과 같은 항-CD163 항체가 시험관내에서 대식세포의 ASFV 감염을 차단한다는 관찰에 기초하였다. CD163-무효 돼지가 ASFV 감염에 내성이 있는지 여부를 결정해야 한다.
PRRSV 수용체에 변형을 혼입하는 세포 배양 모델은 PRRSV 진입, 복제 및 발병기전의 메커니즘에 귀중한 통찰력을 제공하였다. 이 연구의 한 가지 고유한 측면은 수용체-변형된 돼지를 사용한 생체내 동시 실험의 수행이었다. 이 연구는 전세계 돼지 산업이 직면한 가장 심각한 질환 중 하나에 대한 예방척 치유법을 개발하는 타당성에 중요한 영향을 미친다.
실시예 4: SIGLEC 녹아웃 돼지의 생성
하기 실시예는 SIGLEC1 녹아웃 돼지의 생성을 기재한다.
재료 및 방법
달리 나타내지 않는 한, 본 연구에 사용되는 모든 화학물질은 미주리주 세인트 루이스 소재의 Sigma로부터 비롯되었다.
돼지 SIGLEC1 유전자의 표적화된 분열
동물 및 바이러스의 사용은 미주리 대학 및/또는 캔자스 주립 대학의 대학 동물 관리 및 기관 생물안전성 위원회에 의해 승인되었다. 상동 재조합을 혼입하여 SIGLEC1로부터의 엑손 2 및 3을 암호화하는 단백질을 제거하고 조기 정지 코돈을 도입하여 나머지 코딩 서열의 발현을 제거하였다(도 24). 돼지 SIGLEC1 cDNA(GenBank 수탁 번호 NM214346)는 5,193개 염기의 mRNA전사체로부터 210-kDa 단백질을 암호화한다(Vanderheijden et al., 2003). SIGLEC1(GenBank 수탁 번호 CU467609) 주변 영역의 게놈 서열을 사용하여 올리고뉴클레오티드 프라이머를 제조하여 표적화 작제물의 생성을 위해 고-충실도 PCR(AccuTaq; Invitrogen)에 의해 게놈 단편을 증폭시켰다. 마우스 및 인간 게놈 서열과의 비교에 기초하여, 돼지 SIGLEC1은 21 개 엑손을 보유하는 것으로 예측되었다. 게다가, 엑손 2는 돼지, 마우스, 및 인간 중에서 보존된다. 펩티드 서열 정렬은 시알산 결합에 수반되는 것으로 알려진 마우스 SIGLEC1의 엑손 2 코딩 영역에서 6 개 아미노산이 돼지 SIGLEC1에서 보존됨을 나타냈다. 하나의 단편인 "상완"은 처음 코딩 엑손의 일부 및 개시 코돈으로부터 3,304 bp 상류를 나타낸다. 두번째 단편, 또는 "하완"은 4,753 bp 길이였고 세번째 코딩 엑손의 인트론 하류의 대부분을 나타내고 여섯번째 인트론으로 확장되었다(네번째, 다섯번째, 및 여섯번째 코딩 엑손 포함). 하완 및 상완 사이에 반대 방향으로 삽입된 neo 카세트가 있었고 포스포글리세롤 키나제(PGK) 프로모터의 제어 하에 배치되었다.
참조의 용이성을 위해, 부분 야생형 SIGLEC1 서열은 서열번호: 122로 본원에 제공된다. 참조 서열은 엑손 1의 4,236 뉴클레오티드 상류에서 시작하고 모든 인트론 및 엑손 내지 엑손 7, 엑손 7 끝 이후 1,008 개의 뉴클레오티드를 포함한다. 서열번호: 123은 도 24의 패널 C에 예시된 바와 같이, 본원에 기재된 변형을 포함하는 부분 SIGLEC1 서열을 제공한다. 부분 야생형 서열(서열번호: 122)과 비교하여, 서열번호: 123에서 뉴클레오티드 4,279에서 5,525까지 1,247 염기쌍 결실이 있고 결실된 서열은 서열번호: 122와 비교하여 반대 방향으로 배향된 1,855 염기쌍 네오마이신 선택가능한 카세트로 대체된다. 이 삽입/결실은 SIGLEC1 유전자의 엑손 1의 일부 및 엑손 2 및 3 모두의 손실을 초래한다.
임신 35 일부터 수컷 및 암컷 태아 섬유아세포 1차 세포주를 대형 상업용 백돼지(Landrace)로부터 단리하였다. 세포를 배양하고 48 시간 동안 5 mM 글루타민, 나트륨 비카르보네이트(3.7 g/리터), 페니실린-스트렙토마이신, 및 1 g/리터 D-글루코스를 함유하는 둘베코의 변형된 이글 배지(DMEM)에서 80% 합류로 성장시켰으며, 15% 태아 소 혈청(FBS; Hy- Clone), 10 g/ml 젠타마이신, 및 2.5 ng/ml 염기성 섬유아세포 성장 인자로 추가 보충하였다. 배지를 제거하고 형질감염 4 시간 전에 대체하였다. 섬유아세포 세포를 10 ml의 포스페이트 완충 염수(PBS)로 세척하고 1 ml의 0.05% 트립신-EDTA(Invitrogen)를 함유하는 75-cm2 플라스크에 넣었다.
세포를 DMEM에 재현탁하고, 600 Х g에서 10 분 동안 원심분리하여 수집하고, Opti-MEM(Invitrogen)으로 세척하고, 600 Х g에서 10 분 동안 다시 원심분리하였다. 사이토솔트(75% 사이토솔트[120 mM KCl, 0.15 mMCaCl2, 10mM K2HPO4, pH 7.6, 5 mM MgCl2] 및 25% Opti-MEM[Invitrogen])를 사용하여 펠릿을 재현탁하였다(van den Hoff et al., 1992). 세포를 혈구계로 카운팅하고 1 Х 106/ml로 조정하였다. 세포의 전기천공을 1 Х 106 개 세포/ml를 함유하는 형질감염 배지 200 μl에서 0.75 내지 10 g의 이중- 또는 단일 가닥 표적화 DNA(열 변성에 의해 달성됨)로 수행하였다. 세포를 250 V의 3 개의 1-ms 펄스를 사용하여 BTX ECM2001 Electro Cell Manipulator에서 전기천공하였다. 전기천공된 세포를 DMEM-FBS-염기성 섬유아세포 성장 인자에서 10,000/13-cm 플레이트로 희석하고 선택압 없이 밤새 배양하였다. 다음 날, 배지를 G418(GENTICIN, 0.6 mg/ml)을 함유하는 배양 배지로 대체하였다. 선택 10 일 후, G418-내성 콜로니를 단리하고 확장을 위해 24-웰 플레이트로 옮겼다. PCR을 사용하여 SIGLEC1의 표적화가 성공적이였는지 여부를 결정하였다. PCR 프라이머 "f" 및 "b" 및 PCR 프라이머 "a" 및 "e"(표 17; 도 24)를 사용하여 두 아암의 성공적인 표적화를 결정하였다. 프라이머 "f" 및 "e"를 각 표적화 아암의 영역 외부에서 어닐링하였다. PCR 프라이머 "c" 및 "d"를 사용하여 온전한 neo 유전자의 삽입을 결정하였다.
체세포 핵 이식
돼지 난모세포를 AR Inc.(위스콘신주 매디슨 소재)으로부터 구입하고 공급업체의 설명서에 따라 성숙시켰다. 42 내지 44 시간의 시험관내 성숙 후, 난모세포를 0.5 mg/ml 히알루로니다제에서 부드럽게 볼텍싱하여 난구 세포를 제거하였다. 형태가 좋고 극체를 보이는 난모세포(중기 II)를 선택하여 핵 이식까지 38.5℃에서 조작 배지(0.6 mM NaHCO3, 2.9 mM Hepes, 30 mM NaCl, 10 ng/ml 젠타마이신, 및 3 mg/ml BSA를 함유하는 TCM-199[Life Technologies], 삼투압 305 mOsm)에서 유지하였다.
도립 현미경을 사용하여, 난구-무함유 난모세포를 7.5 g/ml 사이토칼라신 B가 보충된 조작 배지의 방울에서 고정 마이크로피펫으로 고정시키고 미네랄 오일로 덮었다. 투명대를 첫번째 극체 근처에 미세 유리 주입 마이크로피펫으로 침투시켰고, 첫번째 극체 및 중기 II 염색체를 함유하는 인접한 세포질을 피펫으로 흡입하였다. 피펫을 빼내고, 내용물을 버렸다. 표면이 매끄러운 단일 둥글고 밝은 공여체 세포를 선택하여 난모세포 막에 인접한 난황주위 공간으로 옮겼다(Lai et al., 2006 및 Lai et al., 2002). 핵 이식 복합체(난모세포 + 섬유아세포)를 융합 배지에서 낮은 칼슘 농도(0.3M 만니톨, 0.1mM CaCl2 · 2H2O, 0.1 mM MgCl2 · 6H2O, 0.5 mM HEPES)로 융합하였다. 그 다음에 융합된 난모세포를 어둠 속에서 10 분 동안 200 M 티메로살로 처리하여 활성화시키고, 헹구고, 30 분 동안 8 mM 디티오트레이톨(DTT)로 처리하였으며; 난모세포를 다시 헹궈서 나머지 DTT를 제거하였다(Machaty et al., 2001; Machaty et al., 1997). 융합 및 활성화 후, 난모세포를 4 mg/ml의 소 혈청 알부민이 보충된 되재 접합체 배양 배지 3으로 3 회 세척하고(Im et al., 2004) 30 분 동안 5% O2, 90% N2, 및 5% CO2의 가습 대기에서 38.5℃에서 배양하였다. 성공적으로 융합된 이들 복합체를 외과적 배아 이식까지 15 내지 21 시간 동안 배양하였다.
배아 이식
발정 주기 주기 단계에 따른 계획에 따라 14 일 동안 사료에 혼합된 18 내지 20 mg REGU-MATE(알트레노게스트, 2.2 mg/mL; Intervet, 델라웨어주 밀스보로 소재)를 투여함으로써 대리모 어린 암퇘지를 동조하였다. 마지막 REGU-MATE 처리 후(105 시간), 1,000 유닛의 인간 융모성 성성자극 호르몬을 근육내 주사하여 발정을 유도하였다. 기립 발정기 일(0 일) 또는 기립 발정기 후 첫 날 대리모 돼지를 사용하였다(Lai et al., 2002). 대리모를 무균적으로 준비하고, 꼬리 복부 절개를 수행하여 생식관을 노출시켰다. 배아를 난소술을 통해 하나의 난관으로 옮겼다. 돼지를 30 일 전후에 복부 초음파 검사로 임신 여부를 확인한 다음 임신 114 일에 분만할 때까지 임신 내내 1 주에 한 번 확인하였다.
유전자삽입 새끼 돼지에서 PCR 및 서던 블롯 확인
PCR 및 서던 블롯 검정을 위해, 게놈 DNA를 꼬리 조직으로부터 단리하였다. 간단히 말해서, 조직을 100 mM NaCl,10 mM Tris(pH 8.0), 25 mM EDTA(pH 8.0) 및 0.5% SDS에서 0.1 mg/ml의 프로테이나제 K(Sigma, 미주리주 세인트 루이스 소재)를 사용하여 55℃에서 밤새 소화시켰다. 물질을 중화된 페놀 및 클로로포름으로 순차적으로 추출하고, DNA를 에탄올로 침전시켰다(Green et al., 2012). 야생형 및 표적화된 SIGLEC1 대립유전자 둘 다의 검출을 SIGLEC1의 표적화된 영역의 측면에 있는 DNA에 어닐링된 프라이머를 사용한 PCR에 의해 수행하였다. 프라이머는 하기 표 17에 나열되어 있다. 세 쌍의 프라이머를 사용하여 각각 티미딘 키나제(TK) 하완 영역(도 24에서 "a" 정방향 및 "e" 역방향, 검정색 화살표), 상완 Neo 영역(도 24에서 "f" 정방향, 및 "b" 역방향, 회색 화살표), 및 엑손 1 및 neo 유전자(도 24에서 "c" 정방향 및 "d" 역방향, 회색 화살표)를 증폭시켰다. 프라이머 "c" 및 "d"(도 24에서 진회색 화살표)의 혼입을 설계하여 각각 ~2,400 및 ~2,900 bp의 야생형 및 표적화된 대립유전자를 수득하였다.
표 17: SIGLEC1 변형을 증폭시키기 위한 PCR 프라이머
Figure pct00019
서던 블롯 검정을 위해, 게놈 DNA를 37℃에서 ScaI 및 MfeI(New England BioLabs)을 사용하여 소화시켰다. MfeI에 대한 부위는 번역 시작 부위의 게놈 영역 상류 및 인트론 6에 있다. ScaI 부위는 neo 카세트에 존재한다. 소화된 DNA를 아가로스 겔 상에서 분리하고, 모세관 작용에 의해 나일론 막(Immobilon NY+; EMD Millipore)으로 옮기고, UV 가교에 의해 고정시켰다(Green et al., 2012). 인트론 4 및 엑손 4 및 5의 일부를 함유하는 게놈 단편을 하기 표 18에 나열된 올리고뉴클레오티드를 사용하여 PCR에 의해 증폭시키고, 제조업체의 프로토콜(Roche)에 따라 디곡시게닌으로 표지하였다. 혼성화, 세척, 및 신호 검출을 제조업체의 권장사항(Roche)에 따라 수행하였다. 야생형 및 표적화된 SIGLEC1 유전자의 예측된 크기는 각각 7,892 및 7,204 bp였다.
표 18: 서던 블롯 검정을 위한 올리고뉴클레오티드
Figure pct00020
PAM 세포의 SIGLEC1(CD169) 및 CD163 표면 염색
PAM 세포(돼지 폐포 대식세포)를 폐 세척으로 수집하였다. 간단히 말해서, 절제된 폐를 대략 100 ml의 차가운 PBS로 채웠다. 단일 세척 후, 펠릿을 대략 5 ml의 차가운 PBS에 재현탁하고 얼음에서 저장하였다. 대략 107 개의 PAM 세포를 얼음에서 30 분 동안 5% FBS 및 0.1% 나트륨 아지드를 함유하는 PBS(PBS-FBS)에 희석된 5 ml의 20 μg/ml 항-돼지 CD169 (클론 3B11/11; AbD Serotec) 또는 항-돼지 CD163(클론 2A10/11; AbD Serotec)에서 배양하였다. 세포를 원심분리하고, 세척하고, 염색 완충액에 희석된 1/100 플루오레세인 이소티오시아네이트(FITC)-접합된 염소 항-마우스 IgG(Life Technologies)에 재현탁하고 얼음에서 30 분 동안 배양하였다. 적어도 104 개의 세포를 FACSCalibur 유세포 분석기 및 세포 Quest 소프트웨어(Becton, Dickinson)로 분석하였다.
결과
SIGLEC1 녹아웃 돼지 생성
도 24에 도표로 나타낸 사용된 녹아웃 전략은 엑손 2 및 3이 제거되고 돌연변이된 유전자에서 수득될 것으로 예상된 기능적 단백질이 없도록 SIGLEC1의 급격한 변경을 생성하는 데 초점을 맞추었다. 게다가, 엑손 1의 일부 및 엑손 2 및 3 모두를 반대 방향으로 배향된 네오마이신-선택가능한 카세트로 대체함으로써 유전자의 추가 분열을 달성하였다(Mansour et al., 1988). 34 번의 형질감염을 다양한 플라스미드 제제(0.75 내지 10 μg/μl, 단일 및 이중 가닥 작제물 모두, 및 중간 및 큰 크기 작제물 모두)로 수행하였다. 또한 5 개의 상이한 돼지 태아 세포주를 나타내는 수컷 및 암컷 세포를 포함하였다. 2,000 개 이상의 콜로니를 neo 카세트의 표적화된 삽입의 존재에 대해 스크리닝하였다. "f" + "b" 및 "a" + "e"의 PCR 프라이머쌍(도 24, 패널 B 및 C)을 사용하여 작제물의 상완 및 하완의 성공적인 표적화를 확인하였다. 1 마리의 수컷 및 1 마리의 암컷의 2 개의 콜로니가 정확한 삽입의 존재에 대해 양성으로 시험되었다(데이터는 제시되지 않음).
수컷 클론 4-18의 세포를 체세포 핵 이식에 사용하고 666 개의 배아를 대리모로 옮겼다. 클로닝된 배아를 2 마리의 대리모로 옮겨 총 8 마리의 새끼 돼지를 생산하였다. 1 마리의 대리모는 임신 115 일에 6 마리의 정상 수컷 새끼 돼지를 분만하였다. 임신 117 일에 두번째 대리모에서 제왕절개를 수행하여, 2 마리의 정상 수컷 새끼 돼지를 생성하였다. 또한 3 번의 배아 이식을 암컷 세포로 수행하였지만(658 개 배아), 임신이 확립된 것은 없었다. 도 25는 4-18 표적화된 태아 섬유아세포주로부터 생성된 8 개의 수컷 새끼 돼지 클론(F0)에서 추출된 게놈 DNA로 수행된 PCR 결과를 나타낸다. 두 대립유전자를 검출하기 위해, 프라이머 "c" 및 "d"로 PCR을 수행하였다(도 24, 패널 C). 예측된 PCR 산물 크기는 야생형 대립유전자의 경우 ~2,400 bp 및 표적화된 대립유전자의 경우 ~2,900 bp였다. 프라이머 "c" 및 "d"를 사용한 PCR 결과는 도 25에 제시되어 있다. 모든 돼지는 야생형 2,400-bp 및 표적화된 2,900-bp 대립유전자의 존재에 대해 양성으로 시험되었다(도 25, 패널 B). 클로닝에 사용된 세포주, 표적화된 4-18 섬유아세포 세포주, 및 비표적화된 4-18 세포주로부터의 DNA를 혼입하는 대조군 PCR은 예측된 생성물을 생산하였다(도 25, 패널 A). 표적화된 돌연변이의 존재는 도 24, 패널 C에서 연회색 및 검정색 화살표에 의해 식별된 프라이머 쌍으로 영역을 증폭시킴으로써 추가로 확인되었으며, 각각 ~4,500 및 ~5,000 bp의 생성물을 수득할 것으로 예측되었다. 결과는 8 마리의 원조 돼지에서 두 생성물의 존재를 나타내었다(데이터는 제시되지 않음).
F0 수컷 중 5 마리를 야생형 암컷과 교배하는 데 사용하여 67 마리의 F1 자손(40 마리의 수컷 및 27 마리의 암컷)을 초래하였으며, 이 중 39 마리(58%)는 SIGLEC1 +/-였다. F1 수컷 중 1 마리를 F1 암컷 중 1 마리와 교배시켜(한 배 새끼 52) 12 마리 돼지의 한 배 새끼를 수득하였으며, 이 중 11 마리는 젖떼기까지 생존하였다. 자손에서 야생형 및 표적화된 대립유전자의 식별은 게놈 DNA의 서던 블롯팅에 의해 수행하였다. 결과는 도 26에서 4 마리의 SIGLEC1 +//+, 3 마리의 SIGLEC1 +/-, 및 4 마리의 SIGLEC1 -/- F2 동물을 나타낸다.
PAM 세포 상에서 CD169(SIGLEC1) 및 CD163의 발현.
항체 염색을 위한 세포를 연구 종류 시 돼지로부터 수득하였다. 도 27에 나타낸 바와 같이, SIGLEC1 +//+SIGLEC1 +/- 돼지에서 PAM 세포의 90% 초과가 CD169 및 CD163에 대해 이중으로 양성이었다. 대조적으로, 모든 SIGLEC1 -/- 돼지가 CD169의 표면 발현에 대해 음성이었지만 CD163에 대해 양성을 유지하였다. 결과는 모든 SIGLEC1 -/- 돼지로부터의 세포에서 CD169 발현의 부재를 나타내었다. CD169 표면 발현의 부재는 PRRSV 공수용체인 CD163의 발현을 변경하지 않았다.
실시예 5: 시험관내-유래 난모세포 및 배아로부터 ANPEP 에서 염색체 변형을 갖는 돼지를 생산하기 위한 CRISPR/Cas9 시스템의 사용
재료 및 방법
화학물질 및 시약
달리 나타내지 않는 한, 본 연구에 사용된 모든 화학물질은 미주리주 세이트 루이스 소재의 Sigma로부터 구입하였다.
ANPEP 특이적 CRISPR를 구축하기 위한 gRNA의 설계
ANPEP의 전장 게놈 서열(서열번호: 132)을 사용하여 CRISPR 가이드 RNA를 설계하였다. 이 전사체는 30,000 염기쌍 및 3 개의 스플라이스 변이체(X1, X2, 및 X3)를 갖는다. X1은 20 개 엑손을 가지며 1017 개 아미노산 단백질 산물(서열번호: 133)을 암호화한다. X2 및 X3은 엑손 2에서 개시 코돈 전에 발생하는 스플라이스 부위가 상이하며 둘 다 동일한 963 개 아미노산 산물을 암호화한다(서열번호: 134).
가이드 RNA(gRNA)를 ANPEP 유전자의 엑손 2 내의 영역으로 설계하였는데 개시 코돈이 엑손 2 내에 있기 때문이다. 참조의 용이성을 위해, 전장 ANPEP 서열의 일부를 포함하는 참조 서열이 본원에 제공된다(서열번호: 135). 참조 서열 서열번호: 135는 인트론 2의 일부, 엑손 2, 인트론 3, 엑손 3, 인트론 4, 엑손 4 및 인트론 4의 일부를 포함한다. 이 참조 서열(서열번호: 135)은 엑손 2 내의 개시 코돈에 선행하는 1000 개 뉴클레오티드, 엑손 2의 코딩 영역, 및 엑손 2의 끝 이후 1000 개 뉴클레오티드를 포함한다. 이 서열의 주석달린 버전은 도 28에 제시된다. 도 28에서, 엑손 2, 3 및 4는 밑줄 쳐 있다. 엑손 2는 도 28에서 뉴클레오티드 775에서 시작하며, 변이체 X1 및 X2와 일치한다(변이체 X3은 뉴클레오티드 778에서 엑손 2에서 시작함). 이 차이는 개시 코돈 이전에 발생하므로 단백질 산물에 영향을 미치지 않는다(개시 코돈은 서열번호: 135의 뉴클레오티드 1001-1003에 있으며 도 28에서 굵은 소문자로 나타냄). 따라서, 서열번호: 135에서 엑손 2, 3, 및 4는 3 개의 변이체 사이에 암호화된 2 개의 단백질 산물에서 처음 294 개 아미노산을 암호화한다(서열번호: 133 또는 서열번호: 134). 참조의 용이성을 위해, 이 실시예 및 실시예 6에서 하기 기재된 INDEL 각각은 참조 서열 서열번호: 135를 참조하여 기재된다. 아미노산 서열을 언급할 때, 스플라이스 변이체 X2 및 X3 변이체에 의해 암호화된 963 개 아미노산 단백질을 참조한다(서열번호: 134). 그러나, 당업자는 삽입 또는 결실이 스플라이스 변이체 X1에 의해 암호화된 아미노산 서열(서열번호: 133)에서 발생하는지 여부를 쉽게 결정할 수 있을 것이다. 도 28에 나타낸 참조 서열번호: 135에 포함된 인트론 및 엑손에 상응하는 뉴클레오티드의 목록은 하기 표 19에 제공된다.
표 19: 도 28에서 인트론/엑손의 위치
Figure pct00021
모든 가이드 RNA는 INDEL이 프레임 시프트 및 조기 개시 코돈을 초래할 가능성이 더 높도록 개시 코돈 이후 설계되었다. 선택된 6 개의 표적은 에스. 피오게네스(Spy) 프로토스페이서 인접 모티프(PAM)에 인접하였으며(Ran et al. 2015) 하기 표 20에 나열되어 있다. PAM은 각 gRNA에서 괄호로 식별된다. 가이드 2 및 3은 또한 도 28의 서열변호: 135에 굵은 글씨 및 이중 밑줄로 식별된다. GenBank에서 유사한 돼지 서열을 검색하여 설계된 crRNA의 특이성을 확인하였다.
표 20: ANPEP CRISPR 가이드
Figure pct00022
하기 표 21에 나열된 각 ANPEP 표적에 상응하는 정방향(F) 및 역방향(R) 올리고뉴클레오티드를 어닐링하고 2 개의 발현 카세트, 즉 인간 코돈-최적화 에스. 피오게네스(hSpy) Cas9 및 키메라 가이드 RNA를 함유하는 p330X 벡터로 클로닝하였다. P330X를 Zhang 실험실 프로토콜(http://www.add gene.org/crispr/zhang/에서 이용가능함; 또한 Cong et al., 2013 및 Hsu et al., 2013 참조)에 따라 BbsI(New England Biolabs)로 설계하였다. 각 가이드의 클로닝 성공은 미주리 대학 DNA 핵심 시설에서 생어 서열분석에 의해 확인하였다. 성공적으로 클로닝된 플라스미드를 TOP10 전기적격 세포(Invitrogen, 캘리포니아주 칼즈배드 소재)에서 번식시키고 대규모 플라스미드 준비를 Qiagen 플라스미드 맥시 키트(Qiagen, 메릴랜드주 저먼타운 소재)로 수행하였다. 플라스미드를 시험관내 전사 주형 또는 형질감염에 사용할 때까지 -20℃에서 동결시켰다.
표 21: ANPEP 편집을 위해 설계된 crRNA.
Figure pct00023
태아 섬유아세포 수집
돼지 태아를 임신 35 일에 수집하여 형질감염을 위한 세포주를 생성하였다. 1 개의 야생형 수컷 및 1 개의 야생형 암컷 태아 섬유아세포 세포주를 큰 흰색 국내 교배로부터 확립하였다. 태아 섬유아세포를 이전에 기재된 바와 같이 약간의 변형으로 수집하였으며(Lai and Prather., 2003a); 각 태아의 등에서 다진 조직을 38.5℃에서 5 시간 동안 20 mL의 소화 배지(L-글루타민, 1 g/L D-글루코스(Cellgro, 버지니아주 머내서스 소재) 및 200 유닛/mL 콜라게나제 및 25 Kunitz 유닛/mL DNaseI를 함유하는 둘베코의 변형된 이글 배지)에서 소화하였다. 소화 후, 태아 섬유아세포 세포를 세척하고 15% 태아 소 혈청(FBS) 및 40 μg/mL 젠타마이신을 함유하는 DMEM과 배양하였다. 밤새 배양 후, 세포를 트립신 처리하고 10% 디메틸 술폭시드(DMSO)를 함유하는 FBS에서 분취량으로 -80℃로 서서히 동결시키고 액체 질소에서 장기간 저장하였다.
ANPEP CRISPR gRNA로 형질감염
형질감염 조건은 이전에 보고된 프로토콜과 유사하였다(Ross et al., 2010; Whitworth et al., 2014). 간단히 말해서, 6 개의 ANPEP 가이드를 17 번의 형질감염에 걸쳐 상이한 조합으로 시험하였다. 총 CRISPR 가이드 농도는 2 μg/형질감염이었다. 유사한 계대 번호(2-4)의 태아 섬유아세포 세포주를 2 일 동안 배양하고 15% 태아 소 혈청(FBS), 2.5 ng/ml 염기성 섬유아세포 성장 인자(Sigma), 10 mg/ml 젠타마이신, 및 25 μg/ml의 FUNGIZONE(암포테리신 B)가 보충된 L-글루타민 및 1g/L D-글루코스(Cellgro, 버지니아주 머내서스 소재; DMEM)를 함유하는 둘베코의 변형된 이글 배지에서 75-85% 합류로 성장시켰다. 섬유아세포 세포를 포스페이트 완충 염수(PBS; Life Technologies, 텍사스주 오스틴 소재)로 세척하고 트립신 처리하였다. 세포가 떨어지자마자, 세포를 전기천공 배지(75% 사이토솔트(120 mM KCl, 0.15 mM CaCl2, 10 mM K2HPO4; pH 7.6, 5 mM MgCl2))(Yanez et al., 2016) 및 25% OPTI-MEM(Life Technologies)으로 헹궜다. 세포를 혈구계를 사용하여 카운팅하였다. 세포를 600 x g에서 5 분 동안 펠릿화하고 전기천공 배지에 1X106/ml의 농도로 재현탁하였다. 각 전기천공은 250 볼트에서 BTX ECM 2001 전기천공 시스템을 통해 투여된 3 개의 (1 msec) 방형파 펄스와 함께 2 mm 갭 큐벳에서 200 μL(0.2 X 106 개의 총 세포)의 세포를 사용하였다. 전기천공 후, 세포를 상기 기재된 DMEM 배지에 재현탁하였다. 형질감염 후 14 일에 콜로니를 선별하였다. 태아 섬유아세포를 50 개 세포/플레이트로 플레이팅하였다(Beaton and Wells 2014). 각 콜로니 주변을 10 mm 오토클레이브 클로닝 실린더로 밀봉하여 태아 섬유아세포 콜로니를 수집하였다. 콜로니를 PBS로 헹구고 트립신을 통해 수확한 다음 DMEM 배양 배지에 재현탁하였다. 재현탁된 콜로니의 일부(1/3)를 유전자형 분석을 위한 96-웰 PCR 플레이트로 옮기고 나머지(2/3) 세포를 세포 번식 및 후속 체세포 핵 이식(SCNT)을 위해 24 웰 플레이트의 웰에서 배양하였다. 세포 펠릿을 6 μL의 용해 완충액(40 mM Tris, pH 8.9, 0.9% Triton X-100, 0.4 mg/mL 프로테이나제 K; New England Biolabs)에 재현탁하고, 세포 용해를 위해 65℃에서 30 분 이어서 85℃에서 10 분 동안 배양하여 프로테이나제 K를 비활성화시켰다. 그 다음에 세포 용해물을 PCR을 통해 유전자형 분석에 사용하였다.
체세포 핵 이식 (SCNT)
SCNT 배아를 생산하기 위해, 암퇘지-유래 난모세포를 Desoto Biosciences LLC(Seymour, NT)로부터 구입하였다. 암퇘지 유래 난모세포를 성숙 배지(2.9 mM HEPES, 5 μg/mL 인슐린, 10 ng/mL EGF, 0.5 μg/mL p-FSH, 0.91 mM 피루베이트, 0.5 mM 시스테인, 10% 돼지 난포액, 25 ng/mL 젠타마이신을 함유하는 TCM199)에서 밤새 수송하고 24 시간 후 신선한 배지로 옮겼다. 40-42 시간의 성숙 후, 난구 세포를 0.1% 히알루로니다제의 존재 하에 볼텍싱하여 난모 세포로부터 제거하였다. SCNT 동안, 난모세포를 7.0 μg/mL 사이토칼라신 B가 보충된 조작 배지(0.6 mM NaHCO3, 2.9 mM HEPES, 30 mM NaCl, 10 ng/mL 젠타마이신, 및 3 mg/mL BSA를 함유하는 TCM199; 및 삼투압 305)에 배치하였다. 아마도 중기 II 플레이트를 함유하는 인접 세포질의 일부와 함께 극체를 제거하고 공여체 세포를 얇은 유리 모세관을 사용하여 난황주위 공간에 배치하였다(Lai and Prather., 2003b). 그 다음에 재구성된 배아를 BTX Electro Cell Manipulator(Harvard Apparatus)를 사용하여 30 μsec 동안 1.2 kV/cm에서 2 개의 DC 펄스(1-초 간격)로 융합 배지(0.3 M 만니톨, 0.1 mM CaCl2, 0.1 mM MgCl2, 0.5 mM HEPES)에서 융합하였다. 융합 후, 융합된 배아를 어둠 속에서 10 분 동안 200 μM 티메로살 및 30 분 동안 8 mM 디티오트레이톨로 화학적으로 활성화시켰다(Machaty et al., 1997). 그 다음에 배아를 이전에 기재된 바와 같이 14-16 시간 동안 히스톤 데아세틸라제 억제제인 0.5 μM Scriptaid(Sigma-Aldrich, S7817)와 함께 변형된 돼지 접합체 배지 PZM3-MU1(Bauer et al., 2010; Yoshioka et al., 2002)에서 배양하였다(Whitworth et al., 2011; Zhao et al., 2010; Zhao et al., 2009).
체외 수정(IVF)
IVF를 위해, 사춘기 전 어린 암퇘지로부터의 난소를 도축장(Farmland Foods Inc., 미주리주 밀란 소재)으로부터 수득하였다. 미성숙 난모세포를 10 ml 주사기에 부착된 18-게이지 피하 주사기 바늘을 사용하여 중간 크기(3-6 mm) 난포로부터 흡입하였다. 그 다음에 균질한 세포질 및 온전한 원형질 막을 갖는 난모세포 및 주변 난구 세포를 성숙을 위해 선택하였다. 약 50 개의 난구 난모세포 복합체를 가습 대기에서 38.5℃, 5% CO2에서 42-44 시간 동안 500 μL의 성숙 배지(3.05 mM 글루코스, 0.91 mM 나트륨 피루베이트, 0.57 mM 시스테인, 10 ng/mL 표피 성장 인자(EGF), 0.5 μg/mL 황체형성 호르몬(LH), 0.5 μg/mL 난포 자극 호르몬(FSH), 10 ng/mL 젠타마이신(APP Pharm, 일리노이주 샴버그 소재), 및 0.1% 폴리비닐 알코올(PVA)을 함유하는 TCM 199(Invitrogen, 뉴욕주 그랜드 아일랜드 소재))를 함유하는 웰에 넣었다. 성숙 후, 주변 난구 세포를 0.1% 히알루로니다제의 존재 하에 3 분 동안 볼텍싱하여 난모세포로부터 제거하였다. 시험관내-성숙된 난모세포를 25-30 개 난모세포의 그룹에서 50 μL 액적의 IVF 배지(113.1 mM NaCl, 3 mM KCl, 7.5 mM CaCl2, 11 mM 글루코스, 20 mM Tris, 2 mM 카페인, 5 mM 나트륨 피루베이트, 및 2 mg/mL BSA를 함유하는 변형된 트리스-완충 배지(mTBM))에 넣었다. 야생형 정액의 100 μL 동결된 펠릿 하나를 0.1% BSA가 보충된 둘베코의 포스페이트 완충 염수(DPBS) 3 mL에서 해동시켰다. 정액을 60% 퍼콜에서 20 분 동안 650 Х g 및 mTBM에서 10 분 동안 원심분리에 의해 세척하였다. 그 다음에 정액 펠릿을 IVF 배지를 사용하여 0.5Х106 개 세포/mL로 재현탁하였다. 50 μL의 정액 현탁액을 난모세포와 함께 액적에 도입하였다. 배우자를 공기 중 5% CO2의 대기에서 38.5℃에서 5 시간 동안 공배양하였다. 수정 후, 배아를 공기 대기 중 38.5 ℃, 5% CO2에서 PZM3-MU1(Bauer et al. 2010; Yoshioka et al. 2002)에서 배양하였다.
CRISPR/Cas9 시스템을 위한 RNA의 시험관내 합성
접합체 주입을 위한 gRNA를 이전에 기재된 바와 같이 제조하였다(Whitworth et al., 2017). 주형 가이드 DNA를 먼저 Integrated DNA Technologies에 의해 gBlock의 형태로 합성하였다. T7 프로모터 서열을 시험관내 전사를 위한 가이드의 상류에 부가하였다(표 22에서 밑줄 표시됨). 각 gBlock을 최종 농도 0.1 ng/μl로 희석하고 표 22에 나열된 시험관내 전사(IVT) 정방향 프라이머(각 CRISPR 가이드에 대해 고유) 및 동일한 역방향 프라이머(gRNA Rev1)로 PCR 증폭하였다. PCR 조건은 1 분 동안 98℃의 초기 변성 이어서 98℃(10 초), 68℃(30 초) 및 72℃(30 초)의 35 주기를 포함하였다. 각 PCR-증폭된 gBlock을 QIAGEN PCR 정제 키트를 사용하여 정제하였다. 그 다음에 정제된 gBlock 앰플리콘을 MEGASHORTSCRIPT 전사 키트(Ambion)를 사용하여 시험관내 전사를 위한 주형으로 사용하였다. RNA 품질을 2.0% RNA-무함유 아가로스 겔 상에서 시각화하였다. 농도 및 260:280 비를 NANODROP 분광광도법을 통해 결정하였다. 캡핑 및 폴리아데닐화 Cas9 mRNA를 Sigma로부터 구입하였다. RNA를 20 ng/μL(gRNA 및 Cas9 모두)의 최종 농도로 희석하고, 3 μL 분취량으로 분배하고, 주입할 때까지 -80℃에서 저장하였다.
표 22: 시험관내 전사를 위한 주형 DNA를 증폭시키기 위해 사용되는 프라이머.
Figure pct00024
접합체에서 ANPEP CRISPR/Cas9 시스템의 접합체 주입
Cas9 mRNA를 Sigma Aldrich(미주리주 세인트 루이스 소재)에서 구입하고 ANPEP gRNA 2 및 3과 혼합하였다(표 20). gRNA 2는 태아 섬유아세포 형질감염 후 가장 높은 편집 효율을 가졌기 때문에 선택하였다. gRNA 3은 태아 섬유아세포 형질감염 후 편집 능력이 없었기 때문에 음성 대조군으로 선택하였다. 이 설계를 선택하여 유사한 편집 속도가 두 가지 방법, 태아 섬유아세포 형질감염 및 접합체 주입 사이에 관찰될 수 있는지를 확인하였다. gRNA 2 및 gRNA 3(20 ng/μl) 및 Cas9 mRNA(20 ng/μl)의 믹스를 FEMTOJET 미세주입기(Eppendorf; 독일 함부르크 소재)를 사용하여 수정 후 14 시간에 수정된 난모세포의 세포질(추정 접합체)에 공동주입하였다. 미세주입을 Nikon 도립 현미경(Nikon Corporation; 일본 도쿄 소재)의 가열된 재물대 상의 조작 배지(0.6 mM NaHCO3, 2.9 mM HEPES, 30 mM NaCl, 10 ng/mL 젠타마이신, 및 3 mg/mL BSA를 함유하는 TCM199; 및 삼투압 305)에서 수행하였다. 그 다음에 주입된 접합체를 배아 이식까지 10 ng/mL ps48로 PZM3-MU1로 옮기거나 또는 유전자형 확인을 위해 배반포 단계로 발달하게 하였다.
유전자형 분석 검정
게놈 DNA를 사용하여 PCR, 아가로스 겔 전기영동, 및 후속 생어 DNA 서열분석에 의해 유전자형을 평가하였다. PCR을 표준 프로토콜 및 LA Taq(Takara, 캘리포니아주 마운틴뷰 소재)을 사용하여 하기 표 23에 나열된 ANPEP-특이적 프라이머로 수행하였다. PCR 조건은 2 분 동안 96℃, 및 30 초 동안 95℃, 40 초 동안 50℃, 및 1 분 동안 72℃의 35 주기, 이어서 2 분 동안 72℃의 연장으로 이루어졌다. 그 다음에 965 bp 앰플리콘을 2.0% 아가로스 겔 상에서 분리하여 명백한 삽입 또는 결실을 결정하였다. 또한 앰플리콘을 생어 서열분석에 적용하여 변형의 정확한 위치를 결정하였다. 살아있는 돼지로부터의 앰플리콘을 TOPO 클로닝 및 DNA 서열분석하여 두 대립유전자의 정확한 변형을 결정하였다.
표 23: PCR을 위한 ANPEP 특이적 프라이머
Figure pct00025
배아 이식
ANPEP 편집된 돼지를 생산하기 위해 생성된 배아를 만기 출산을 위해 수령체 어린 암퇘지로 옮겼다. SCNT 및 IVF 접합체 주입된 배아의 경우, 배아를 밤새 배양하고 발정 주기(SCNT)의 1 일에 어린 암퇘지의 난관으로 옮기거나 또는 5일 동안 배양한 다음 발정 주기(IVF 및 SCNT)의 4, 5, 또는 6 일에 어린 암퇘지의 난관으로 옮겼다. 모든 배아를 10 ng/mL ps48(5-(4-클로로-페닐)-3-페닐-펜트-2-에노산; Stemgent, Inc., 매사추세츠주 케임브리지 소재)의 존재 하에 PZM3-MU1(Bauer et al. 2010)의 수술 부위로 전달하였다. 발달 단계에 관계없이, 모든 배아를 수령체 어린 암퇘지의 난관의 팽대부-협부 접합부로 외과적으로 옮겼다(Lee et al. 2013). SCNT 배아로 수행된 총 4 번의 배아 이식(ET) 및 접합체 주입된 배아로 수행된 6 번의 ET가 있었다. SCNT에 대한 처음 2 번의 배아 이식은 형질감염 후 단리된 원래 콜로니로부터의 공여체 세포를 사용하여 수행하였다. SCNT에 대한 두번째 2 번의 ET를 위한 공여체 세포를 처음 2 번의 ET로부터 수집된 35 일 태아로부터 단리하였다.
면역조직화학
변형된 돼지의 회장에서 ANPEP의 존재를 검출하기 위한 면역조직화학을 표준 절차를 사용하여 수행하였다. 수집하자마자, 장내 조직을 10% 완충된 포르말린에 즉시 넣었다. 처리 후, 파라핀에 포매된 섹션을 슬라이드 위에 고정시켰다. 섹션을 Leica BOND Dewax 용액(용액-기반 탈파라핀화 용액)으로 왁스를 제거하고 100℃에서 20 분 동안 Leica BOND 에피토프 회수 용액 1(포르말린-고정된, 파라핀-포매된 조직의 열-유도 에피토프 회수를 위한 시트레이트-기반 pH 6.0 에피토프 회수 용액)을 사용하여 항원 회수를 수행하였다. 슬라이드를 실온에서 5 분 동안 3% 과산화수소와 배양하고 NexES IHC 염색 모듈(Ventana Medical)에서 자동화 절차를 사용하여 시각화하였다. APN 항원의 검출을 위해 인간 CD13의 아미노산 400 내지 500 개를 포괄하는 펩티드에 대해 제조된 토끼 항-CD13(APN) 폴리클로날 항체(Abcam)를 사용하였다. 항체를 Leica BOND 1차 항체 희석액(Tris-완충 염수, 계면활성제, 단백질 안정화제, 및 0.35% PROCLIN 950(2-메틸-4-이소티아졸린-3-온 용액) 함유)에 1:3200으로 희석하고 실온에서 15 분 동안 슬라이스에서 배양하였다. 슬라이드를 세척하고 결합된 항체를 항-토끼 IgG 서양고추냉이 퍼옥시다제(HRP)로 겸출하였다. HRP 활성을 3,3'-디아미노벤지딘(DAB)으로 시각화하고 슬라이드를 헤마톡실린으로 대조염색하였다.
결과
ANPEP CRISPR 가이드 플라스미드로 형질감염
총 17 번의 형질감염을 수행하여 CRISPR 가이드가 ANPEP 유전자를 효율적으로 편집하는지를 결정하고 SCNT에서 사용하기 위해 CRISPR 유도 ANPEP 편집으로 1차 세포주 단리를 수행하였다. 각 실험의 형질감염 효율은 하기 표 24에 요약되어 있다. ANPEP 가이드 2는 단독으로 형질감염될 때 편집된 콜로니 수가 가장 많았다. ANPEP 가이드 2로 총 4 번의 형질감염이 있었고 편집 효율은 0-23.3% 범위였다. 콜로니는 DNA 전기영동 후 PCR 앰플리콘의 관찰가능한 크기 차이가 있는 경우 편집되는 것으로 간주되었다. 생성된 돼지 및 태아만을 서열분석하여 편집의 정확한 위치 및 크기를 결정하였다. ANPEP 가이드 1은 4 번의 형질감염에 걸쳐 0-7.1% 범위의 편집률을 가진 두번째로 가장 효율적인 가이드였다. 흥미롭게도, ANPEP 가이드 1 및 2가 혼합되고 공동형질감염될 때, 3 번의 형질감염에 걸쳐 편집률은 0%였다. ANPEP 가이드 3 및 4는 편집을 초래하지 않았고(각각 2 번의 형질감염) ANPEP 가이드 5 및 6은 2.9% 및 4.2% 편집을 초래하였지만, 각 가이드에 대해 단일 형질감염만을 수행하였다. ANPEP 가이드 2로 형질감염된 콜로니 E9, F7, D11 및 ANPEP 가이드 1로 형질감염된 콜로니 A10을 SCNT에 대해 선택하였다.
표 24: CRISPR 가이드의 형질감염 효율
Figure pct00026
ANPEP 편집된 세포의 체세포 핵 이식
콜로니 E9, F7, D11 및 A10의 세포를 SCNT에 대해 사용하였다. 동일한 수의 배아를 세포의 각 그룹으로부터 재구성하였지만, 배아를 ET 동안 단일 돼지에서 혼합하였다. 2 번의 배아 이식을 이들 1 차 콜로니 세포로 수행하였으며 두 돼지의 임신을 초래하였다. 태아 수집을 위해 35 일에 임신을 종료하였다. 10 마리의 태아를 돼지 O279로부터 수집하였으며, 이들 중 3 마리는 ANPEP 유전자에 이중 대립유전자 편집을 함유하였다. 5 마리의 태아를 돼지 O307로부터 수집하였으며, 이들 중 3 마리는 ANPEP 유전자에 이중 대립유전자 편집을 함유하였다. 각 태아를 유전자형 분석하였으며 생성된 유전자형은 하기 표 25에 나열되어 있다.
29는 ET로부터 관찰된 4 개의 유전자형에 걸쳐 PCR로부터의 앰플리콘을 수령체 O279 및 O307로 보여주는 대표적인 아가로스 겔을 나타낸다. 레인 1은 182bp 결실/WT 없음이고, 레인 2는 9 bp 결실/WT 없음이고, 레인 3은 야생형이고, 레인 4는 867 bp 결실(겔의 바닥을 향하는 연한 밴드)/WT 없음이고, 레인 5는 야생형이다. 많은 태아가 이중 대립유전자였다(즉, 2 개의 변형된 대립유전자를 가졌다). 각 경우에, 이들은 특성화된 대립유전자(예를 들어, 182 bp 결실) 및 비야생형 대립유전자를 가졌다. 두번째 비야생형 대립유전자는 서열분석되거나 식별되지 않았다. 야생형 핵산 및 물은 각각 양성 및 음성 대조군으로 사용하였다.
태아 섬유아세포 세포주를 각 태아로부터 생성한 다음 추가 SCNT 및 ET를 위해 3 개의 태아 계열을 SCNT에 대해 사용하였다. 수령체 돼지는 새롭게 확립된 태아 세포주로부터 임신하지 않았다(표 25).
표 25: ANPEP 편집된 배아의 체세포 핵 이식으로부터의 배아 이식 데이터.
Figure pct00027
접합체 주입
6 번의 ET를 ANPEP gRNA가 주입된 IVF 접합체로 시도하였다. 배아 이식 데이터는 하기 표 26에 요약되어 있다. 첫번째 3 번의 ET는 2 번의 임신을 초래하였다. 1 마리의 돼지는 임신하지 않았다. 1 마리의 수령체(돼지 O345)를 35 일에 안락사시키고 6 마리의 태아를 수집하였다. 6 마리의 태아 중, 4 마리는 표 26에 요약된 바와 같이 ANPEP 유전자의 편집을 함유하였다. 도 30은 이들 6 마리의 태아에 존재하는 대립유전자를 묘사하는 대표적인 PCR 결과를 제공한다. "물"로 표시된 레인은 음성 주형 없음 대조군이다. "WT 대조군"으로 표시된 레인은 형질감염되지 않은 태아 섬유아세포의 DNA를 함유하는 야생형 양성 대조군이다. 레인 1-6은 6 마리의 태아에 대한 PCR 결과를 제공하며, 다음 유전적 편집을 갖는 것으로 밝혀졌다: (1) 레인 1: 1 염기쌍 삽입/야생형 없음; (2) 레인 2: 2 염기쌍 삽입/ 야생형; (3) 레인 3: 야생형; (4) 레인 4: 야생형; (5) 레인 5: 3 염기쌍 삽입, 9 염기쌍 결실, 및 267 염기쌍 결실(모자이크); 및 (6) 레인 6: 9 염기쌍 결실/야생형. 유전자형 설명이 어구 "WT 없음" 또는 "야생형 없음"을 포함하는 경우 이는 태아가 비특성화였고 서열분석되지 않은(그러나 야생형이 아닌) 제2 대립유전자를 가졌음을 의미한다. 명명된 변형된 대립유전자를 서열분석하였고 이하에 기재되어 있다.
세번째 돼지는 4 마리의 새끼 돼지를 낳았으며, 이들 중 3 마리는 편집되었다. 이 한 배 새끼("한 배 새끼 4")의 유전자형은 TOPO 클로닝 및 생어 서열분석을 사용하여 결정하였으며 표 27에 요약되어 있다. 야생형(WT) 또는 주형 없음 대조군(NTC)과 비교하여 이들 4 마리의 새끼 돼지의 각 ANPEP 대립유전자를 나타내는 대표적인 PCR 결과는 도 4에 제시되어 있다. 도 31에서 레인 1-4는 다음에 상응한다: (1) 대립유전자 1의 엑손 2에서 9 염기쌍 결실 및 대립유전자 2에서 야생형 서열을 갖는 새끼 돼지 4-1; (2) 대립유전자 1의 엑손 2에서 1 염기쌍 삽입 및 대립유전자 2의 엑손 2에서 2 염기쌍 삽입을 갖는 새끼 돼지 4-2; (3) 두 대립유전자에서 야생형 서열을 갖는 새끼 돼지 4-3; 및 (4) 대립유전자 1의 엑손 2에서 9 염기쌍 결실 및 대립유전자 2에서 야생형 서열을 갖는 새끼 돼지. 변형된 대립유전자를 서열분석하였으며 본원에서 하기에 기재되어 있다(표 29 및 30). 이 한 배 새끼(4-2)로부터의 1 마리의 암컷을 원조 동물로 사용하여 하기 실시예 6에 기재된 PEDV 및 TGEV 접종을 위한 새끼 돼지를 생성하였다.
나머지 3 번의 ET를 섬유아세포 성장 인자 2(FGF2), 백혈병 억제 인자(LIF) 및 인슐린-유사 성장 인자 1(IGF1)(각각 40 ng/ml, 20 ng/ml, 및 20 ng/ml)을 함유하는 배지에서 성숙된 난모세포로 수행하였다. 이들 성장 인자(통틀어 FLI로 불림)는 Yuan 및 동료들에 의해 난모세포 성숙 품질을 개선시키는 것으로 제시되었다(Yuan et al., 2017). 이들 3 번의 FLI 배아 이식 중, 2 마리의 수령체는 임신되지 않았고 1 마리의 수령체는 9 마리의 새끼 돼지를 분만하였다. 9 마리의 새끼 돼지 중, 7 마리는 ANPEP에 편집을 함유하였고 2 마리는 야생형이었다. 이 한 배 새끼("한 배 새끼 158")의 유전자형은 TOPO 클로닝 및 생어 서열분석을 사용하여 결정하였으며 하기 표 28에 요약되어 있다. 야생형(WT) 또는 주형 없음 대조군(NTC)과 비교하여 이들 새끼 돼지의 각 ANPEP 대립유전자를 묘사하는 대표적인 PCR 결과는 도 32에 제시되어 있다. 이 한 배 새끼(158-1)로부터의 1 마리의 암컷 및 이 한 배 새끼(158-9)로부터의 1 마리의 수컷을 원조 동물로 사용하여 하기 실시예 6에 기재된 PEDV 및 TGEV 접종을 위해 새끼 돼지를 생성하였다.
표 26: ANPEP 가이드 RNA로 직접 주입된 시험관내 수정 유래된 접합체로부터의 배아 이식 데이터.
Figure pct00028
표 27: 한 배 새끼 "4"의 유전자형
Figure pct00029
표 28: 한 배 새끼 "158"에 대한 유전자형
Figure pct00030
삽입-결실(INDEL)의 유전자형 분석 및 표현형 특성화
표 25-28에서 식별된 변형된 대립유전자 각각을 엑손 2의 측면에 있는 게놈 DAN로부터 증폭된 PCR 산물의 서열분석에 기초하여 식별하였다. 단백질 번역 및 표현형에 대한 이들 대립유전자의 예상된 효과를 변형된 동물의 대표적인 RNA를 아미노산 서열로 번역함으로써 결정하였다. 각 대립유전자는 하기 표 29 및 30에 상세히 요약되어 있다.
2 마리의 살아있는 한 배 새끼로부터의 3 마리의 돼지(158-1, 158-9, 및 4-2)를 하기 실시예 6에 기재된 질환 연구를 위한 원조 동물로 선택하였다. 각 대립유전자를 A-H라는 문자 지정으로 할당하였으며, 대립유전자 A는 야생형이다. 각 변형된 대립유전자 및 야생형 ANPEP 대립유전자는 예측된 표현형과 함께 도 33에 도식화되어 있다. 도 33에서, 검정색 직사각형은 코딩 영역을 나타내고 회색 영역은 삽입을 나타낸다. 숫자는 삽입 및/또는 결실이 발생한 위치를 나타낸다.
ANPEP 변형된 수퇘지(158-9) 및 1 마리의 변형된 어미 말(dam)은 B 및 C 대립유전자(수퇘지) 또는 D 및 E 대립유전자(어미 말)로 이루어진 이중 대립유전자 무효 편집을 보유하였다. 두번째 변형된 어미 말(158-1)은 야생형(A), 무효(H), 무효(D) 및 다른 편집된 대립유전자(F 및 G)의 조합에 대해 모자이크였다. B 대립유전자는 개시 코돈의 결실을 포함하는 661 염기쌍 결실을 가지며 결실된 서열은 8 염기쌍 삽입으로 대체된다. 따라서, B 대립유전자는 단백질의 완전 손실을 초래한다. C 대립유전자는 8 염기쌍 결실을 초래하며, 여기서 결실된 서열은 3 염기쌍 삽입에 의해 대체되어, 아미노산 194에서 시작하는 암호화 오류로 인한 프레임 시프트 편집 및 아미노산 223에서 조기 정지 코돈을 야기한다. 2 개의 무효 대립유전자인 D 및 E는 또한 각각 1 또는 2 염기쌍 삽입의 결과인 프레인 시프트 편집을 함유하였다. 구체적으로, 엑손 2에서 1 및 2 bp 삽입은 두 대립유전자에 대해 아미노산 194에서 암호화 오류 및 1 염기쌍 삽입에 대해 아미노산 220 및 2 염기쌍 삽입에 대해 아미노산 225에서 조기 정지 코돈을 초래하였다. 대립유전자 H는 또한 아미노산 194에서 암호화 오류 및 아미노산 224에서 조기 정지 코돈을 초래하는 단일 염기쌍 결실을 함유하였다. F 및 G 대립유전자는 프레임 시프트 편집을 야기하지 않는 각각 9 개 및 12 염기쌍 결실을 보유하였으며; 오히려 이들은 야생형 아미노산 서열(서열번호: 134)과 비교하여 각각 펩티드 서열, 194-M-E-G 및 194-M-E-G-N의 제거를 초래하였다. 대립유전자 G는 또한 야생형 아미노산 서열(서열번호: 134)과 비교하여 V198I의 단일 아미노산 치환을 가졌다.
참조의 용이성을 위해, 하기 표 29는 SCNT 및 IVF 실험으로부터 수집된 태아에서 식별된 각 편집을 기재한다(도 29 및 30). 하기 표 30은 원조 동물에서의 것들(대립유전자 A-H)을 포함하여 한 배 새끼 4(도 31) 및 158(도 32)로부터의 살아있는 돼지에서 발견된 각 편집을 기재한다. 적용가능한 경우, 비원조 동물(또는 태아)에서 발견된 대립유전자 A-H와 동일한 대립유전자가 식별된다.
원조 동물(대립유전자 A-H)에서 각 편집의 표현형을 변형된 돼지의 회장에서 ANPEP(CD13)의 발현에 대해 면역조직화학(IHC)으로 확인하였다(도 34). 도 34는 2 개의 A 대립유전자(야생형, +/+), 2 개의 무효 대립유전자(E/B; -/-), 또는 대립유전자 F(9 염기쌍/3 개 아미노산 결실; B/F; -/d9) 또는 G(12 염기쌍/4 개 아미노산 결실; B/G 또는 C/G; -/d12)와 조합된 무효 대립유전자를 갖는 돼지 회장의 대표적인 IHC 이미지를 나타낸다. 도 34에서 -/d12로 표지된 이미지는 B/G 또는 C/G 유전자형으로 수득된 대표적인 결과이다.
도 34에 나타낸 결과를 생성하기 위해, 파라핀-포매된 조직 섹션을 인간 CD13의 아미노산 400-500 개를 포괄하는 펩티드에 대해 제조된 토끼 항-CD13 폴리클로날 항체(Abcam)의 1:32,000으로 염색하였다. 결합된 항체를 서양고추냉이 퍼옥시다제-표지된 항-토끼 IgG로 검출하였으며, HRP 활성을 3,3'-디아미노벤지딘(DAB)으로 시각화하였다. ANPEP에 대한 강한 면역반응성을 2 개의 야생형 대립유전자를 갖는 동물의 회장에서 관찰하였지만, 2 개의 무효 대립유전자를 갖는 동물에서 ANPEP 면역반응성은 관찰되지 않았다. 표현형적으로, F 또는 G 립유전자를 보유하는 돼지는 4 개 아미노산 결실 편집에서 약한 면역반응성을 제외하고 ANPEP에 대한 면역반응성을 나타내었다.
원조 동물(158-1, 158-9 및 4-2)을 돌연변이의 임의의 표현형적 효과에 대한 매일 기준으로 관찰하였다. 도 35는 성적 성숙된 돼지 158-1의 사진을 나타낸다. 동물은 모두 건강한 것으로 보였으며 임의의 동물에 대한 부작용은 관찰되지 않았다. 특히, 젖분비와 관련한 주목할만한 문제는 관찰되지 않았다. 원조 암퇘지 158-1(야생형 대립유전자를 갖는 모자이크 동물)은 정상적으로 젖이 났다. 원조 암퇘지 4-2는 첫번째 한 배 새끼에 대해 젖이 잘 나지 않았지만, 첫번째 출산 경험이 있는 암퇘지에게는 드문 일이 아니다. 원조 암퇘지 4-2는 두번째 한 배 새끼에 대해 정상적으로 젖이 났다. 따라서, 유선형성 및 젖분비는 정상인 것처럼 보였다. 제출 당시, 돼지 158-1 및 158-9는 대략 2.5 세였으며 돼지 4-2는 약 3 세였고, 주목할만한 부작용은 관찰되지 않았다.
하기 실시예 6에 기재된 바이러스 접종 연구에 사용된 모든 동물을 또한 돌연변이의 임의의 표현형 효과에 대해 매일 모니터링하였다. 변형된 ANPEP 대립유전자를 함유하는 동물은 TGEV 감염의 임의의 징후를 나타내지 않았으며 건간한 것으로 보였다.
표 29: SCNT 및 IVF 실험으로부터 태아에서의 편집(도 29 및 30)
Figure pct00031
표 30: 한 배 새끼 4 및 158로부터의 살아있는 돼지의 편집(도 31 및 32)
Figure pct00032
Figure pct00033
실시예 6: ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 갖는 돼지에서 TGEV에 대한 내성 증가
본 실시예에서, ANPEP에서 변형된 염색체 서열을 갖는 돼지를 돼지 유행성 설사병 바이러스(PEDV) 또는 전염성 위장염 바이러스(TGEV)로 접종하고 모니터링하여 감염에 대한 내성을 평가하였다. ANPEP의 결핍은 바이러스 혈증 역가 및 다른 마커에 의해 측정 시, TGEV에 대한 내성을 증가시켰지만, PEDV에 대해서는 그러지 않았다.
재료 및 방법
PEDV 연구를 위한 돼지 번식
PEDV 연구를 위해, 2 마리의 어린 암퇘지(4-2 및 158-1)를 14 일 동안 매일 15 mg의 알트레노게스트 제품인 MATRIX(Intervet Inc. 델라웨어주 밀스보로 소재)를 함유하는 6.8 mL를 공급하여 동조하였다. 어린 암퇘지 4-2 및 158-1은 알트레노게스트가 중단 된 후 5 일 이내에 열이 발생하였고 수퇘지 158-9로부터 수집된 정액과 인공 수정(AI)하여 번식시켰다. 어린 암퇘지 4-2는 임신되지 않았다. 임신 117일 후, 암퇘지 158-1은 8 마리의 건강한 새끼 돼지를 분만하였다. 1 마리의 새끼 돼지는 암퇘지에 의해 짓밟혔다.
TGEV 접종을 위한 돼지 번식
ANPEP-편집된 F1 돼지를 다시 번식시켜 TGEV 접종에 대해 ANPEP-편집된 돼지의 한 배 새끼를 생성하였다. 동일한 2 마리의 어린 암퇘지(4-2 및 158-1)를 상기 기재된 동일한 방법으로 동조시키고 수퇘지 158-9에서 수집된 정액과 인공 수정(AI)하여 번식시켰다. 두 암퇘지 158-1 및 4-2는 임신하였다. 암퇘지 158-1은 4 마리의 새끼 돼지(한 배 새끼 127)를 분만하였다. 3 마리의 새끼 돼지는 건강하였고 1 마리의 새끼 돼지는 뒷다리 구조가 나빠서 안락사시켰다. 암퇘지 4-2는 13 마리의 새끼 돼지(한 배 새끼 20)를 분만하였으며; 11 마리는 건강하였다. 1 마리의 새끼 돼지는 젖을 먹이지 못해 죽었고 또 다른 새끼 돼지는 뒷다리 구조가 나빴다. 2 마리의 다른 새끼 돼지는 나중에 암퇘지에 의해 짖밟혔다.
바이러스
PEDV KS13-09를 10% 태아 소 혈청(FBS; Sigma), 1% Pen-Strep(Gibco) 및 0.25 μg/ml FUNGIZONE(암포테리신 B)이 보충된 MEM에서 유지된 VERO76 세포에서 번식시켰다. 세포를 2% 트립토스 포스페이트 브로쓰(Sigma) 및 1 μg/ml L-1-토실아미드-2-페닐에틸 클로로메틸 케톤(TPCK; Sigma)을 함유하는 배지에서 감염시켰다. 바이러스 적정을 위해, 96-웰 플레이트의 VERO76 세포를 5% CO2로 37℃에서 8중으로 바이러스의 연속 1:10 희석으로 감염시켰다. 3 시간 후, 세포 배양 배지를 신선한 감염 배지로 대체하였다. 18 시간에, 세포를 4℃에서 30 분 동안 아세톤:메탄올 혼합물(3:2 비)로 고정시키고 PEDV M 단백질에 대해 지시된 토끼 폴리클로날 항체(Genscript)의 1:500 희석물과 반응시켰다. PBS로 세척한 후, FITC-접합된 염소-항-토끼 IgG(Jackson ImmunoResearch)를 2차 항체로 첨가하였다. 바이러스 농도를 Reed 및 Muench 방법을 사용하여 TCID50/ml로 계산하였다(Reed and Muench, 1938).
TGEV 퍼듀 균주를 PEDV에 대해 기재된 것과 동일한 MEM-FBS 배지 10%에서 유지된 돼지 고환(ST) 세포에서 배양하였다. 적정을 위해, 바이러스를 96-웰 조직 배앙 플레이트(BD Falcon)에서 합류 ST 세포 상에서 4중으로 1:10으로 연속 희석하였다. 37℃ 및 5% CO2에서 3 일 배양 후, 웰을 세포변성 효과(CPE)의 존재에 대해 조사하였다. CPE를 나타내는 마지막 웰을 적정 종점으로 사용하였으며 ml 당 50% 조직 배양 감염 용량(TCID50)을 (Reed and Muench, 1938에 기재된 바와 같이 계산하였다.
PEDV/TGEV로 감염
동물 및 바이러스를 수반하는 실험을 연구 및 교육을 위한 농업 동물의 관리 및 사용에 대한 연방 동물 과학 협회 가이드, USDA 동물 복지법 및 동물 복지 규제에 따라 수행하였으며, 캔자스 주립 대학 및 미주리주 대학 기관 동물 관리 및 기관 생물안전성 위원회의 승인을 받았다. 접종 동안, 모든 감염된 WT 및 ANPEP-변형된 돼지를 대형 동물 자원 센터의 단일 방에서 함께 수용하였다. 따라서, 모든 ANPEP-편집된 돼지는 감염된 야생형 한 배 새끼 짝이 흘린 바이러스에 지속적으로 노출되었다. 감염을 위해, 돼지는 실험적으로 감염된 돼지의 PCR-양성 장내 조직 균질액으로부터 제조된 초기 용량의 PEDV를 받았다(Niederwerder et al., 2016). 4 일 후, 돼지를 조직 배양-유래 단리물인 PEDV KS13-09로 두번째 감염시켰으며, 106 TCID50의 바이러스를 함유하는 단일 10 ml 용량으로 경구로 투여하였다. TGEV를 위해, 돼지는 동일한 양의 바이러스를 경구로 투여받았다.
대변 면봉을 연구가 종료될 때까지 PEDV로 접종 하루 전에 시작하여 각 동물로부터 매일 수집하였다. 각 면봉을 1% Pen-Strep 및 1% FUNGIZONE과 함께 1 ml의 MEM을 함유하는 15 ml 코니컬 튜브에 넣었다. 튜브를 잠시 볼텍싱하여 면봉 내용물을 혼합하고, 1.5 ml 저온 유리병에 분취한 다음 -80℃에서 저장하였다.
초기 노출 후 3, 7, 및 9 일에 혈청을 수집하였다. 대변 및 혈청을 RT-PCR을 사용하여 검사하여 PEDV 또는 TGEV 핵산을 검출하였다. 9 일 후, 동물을 희생시키고 면역조직화학(IHC)을 파라핀-포매된 장(회장)에서 수행하여 PEDV 또는 TGEV 항원을 검출하였다.
바이러스 핵산의 검출을 위한 RT-PCR
총 RNA를 KINGFISHER 기구(Thermo Scientific)에서 제조업체의 설명서에 따라 MAGMAXTM-96 총 RNA 단리 키트(Invitrogen)를 사용하여 대변 빛 혈청 샘플에서 추출하였다. PEDV 핵산을 PLATINUM Taq DNA 폴리머라제 및 총 부피 50 μl로 표 31에 나열된 프라이머를 사용하여 SUPERSCRIPT III 1-단계 RT-PCR 키트를 사용하여 증폭시켰다. PCR을 다음과 같이 수행하였다: 30 분 동안 58℃에서 초기 역전사 이어서 2 분 동안 94℃에서 변성시킨 다음; 15 초 동안 94℃, 30 초 동안 48℃, 및 90 초 동안 68℃의 40 주기. PCR 산물을 1% 아가로스 겔 상에서 시각화하였다. 결과를 에티듐 브로마이드 염색의 강도에 기초하여 기록하였다.
TGEV 핵산을 실시간 절차를 사용하여 증폭시켰다(Vemulapalli R., 2016). TAQMAN Fast 바이러스 1-단계 마스터 믹스(Thermo Fisher)에 포함된 정방향 및 역방향 프라이머 및 TAQMAN 프로브(BHQ-1)는 표 31에 나열되어 있다. RT-PCR은 30 분 동안 50℃에서 역전사, 15 분 동안 95℃에서 역전사 이어서 15 초 동안 95℃, 30 초 동안 56 ℃ 및 15 초 동안 72 ℃의 45 주기를 포함하였다. PCR을 CFX-96 실시간 PCR 시스템(Bio-Rad)에서 96-웰 포맷으로 수행하였고 각 샘플에 대한 결과를 Ct 값으로 기록한다.
표 31: 바이러스 핵산의 RT-PCR을 위한 프라이머
Figure pct00034
조직에서 바이러스 항원의 검출을 위한 면역조직화학(IHC)
감염된 동물의 장(회장)에서 PEDV 및 TGEV 항원의 수준을 겸출하기 위한 면역조직화학을 변형된 돼지에서 ANPEP 항원의 검출을 위해 실시예 5에서 상기 기재된 바와 유사한 방법을 사용하여 캔자스 주립 대학 및 미주리 대학 수의학 진단 실험실에 의해 일상적인 진단 검사로 수행하였다. 항-스파이크 단백질 모노클로날 항체를 사용하여 PEDV 항원을 검출하였다(Cao et al., 2013). TGEV 항원을 항-고양이 감염성 복막염 코로나바이러스 항체를 사용하여 검출하였다.
혈청에서 TGEV-특이적 항체의 검출
차단 ELISA 및 간접 면역형광 항체(IFA)를 사용하여 혈청에서 TGEV-특이적 항체를 검출하였다. IFA를 위해, 96 웰 플레이트 상의 합류 ST 세포를 200 TCID50/ml의 TGEV 퍼듀로 감염시켰다. 37℃ 및 5% CO2에서 3 일 배양 후, 세포를 80% 아세톤으로 고정시켰다. 각 돼지의 혈청을 5% 염소 혈청을 함유하는 PBS(PBS-GS)에서 연속적으로 희석하였다. 감염 전에 각 돼지에서 수득된 혈청 샘플은 음성 대조군으로 역할을 하였다. 37℃에서 1 시간 동안 배양 후, 플레이트를 세척하고 2차 항체를 각 웰에 첨가하였다. Alexa-Fluor-488 AffiPure 염소 항-돼지 IgG(Cat# 114-545-003, Jackson ImmunoResearch)를 PBS-GS에서 1:400 희석으로 희석하였다. 플레이트를 37℃에서 1 시간 동안 배양하고, PBS로 세척하고, 형광 현미경으로 관찰하였다. 차단 검정을 Sanova로부터의 키트인 SVANOVIR TGEV/PRCV를 사용하여 수행하였다. 검정을 키트 설명서에 따라 수행하였고 결과를 표지된 TGEV-특이적 항체의 결합의 퍼센트 억제로 기록하였다.
결과
돼지 번식 및 PEDV로 감염
PEDV 접종에 사용된 한 배 새끼로부터의 각 자손 새끼 돼지의 유전자형 분류는 하기 표 32에 요약되어 있다. 접종된 새끼 돼지는 야생형 ANPEP 대립유전자에 대해 이형접합인 3 마리의 돼지, 4 개 아미노산 결실을 보유하는 2 마리의 돼지, 3 개 아미노산 결실을 갖는 1 마리의 돼지, 및 단일 녹아웃 돼지를 포함하였다. 별개의 한 배 새끼로부터의 5 마리의 야생형 돼지를 변형되지 않은 대조군으로 사용하였으며 표에 포함되지 않는다.
표 32: PEDV로 접종된 F2 새끼 돼지로부터의 각 대립유전자의 유전자형
Figure pct00035
3 주에, 새끼 돼지를 상기 기재된 바와 같이 PEDV에 노출시키고 RT-PCR로 특성화하기 위해 대변 및 혈청을 수집하였다. 도 36은 0, 7 및 9 일에, WT 대립유전자에 대해 이형접합인 것들을 제외하고, 각 감염된 돼지의 대변 및 혈청에서 정규화된 양의 PEDV 핵산을 나타낸다. 각 돼지를 다음의 유전자형에 기초하여 분류하였다: 야생형(검정색), 녹아웃/무효(흰색), 3 개 aa 결실(9 bp 결실, 회색), 및 4 개 aa 결실(12 bp 결실, 줄무늬). 모든 돼지에 대한 PCR 및 IHC에 의한 PEDV 정량화 결과는 표 33에 묘사되어 있다. RT-PCR 산물에 대한 PEDV 정량화는 에티듐 브로마이드 염색의 척도로서 도 36에 묘사되어 있으며; 강렬한 염색에 대해 (3+)에서 검출가능한 PCR 산물이 없는 경우 (Neg.)까지 이른다. 모든 돼지는 감염 후 7 일에 시작하는 대변에서 PEDV 핵산에 대해 강하게 양성이었다(표 33, 도 36). 각 그룹으로부터의 적어도 1 마리의 돼지(무효, 3 개 아미노산 결실, 4 개 아미노산 결실, 및 WT)는 또한 7 일에 혈청에서 양성이었다(표 33; 도 36). 게다가, IHC는 모든 돼지가 장세포에서 항원을 보유함을 확인하였다(표 33, 도 37). 도 37은 PEDV 항원(검정색)에 대해 염색된 야생형(패널 A), 녹아웃(패널 B), 3 개 aa 결실(패널 C), 및 4 개 aa 결실(패널 D) 돼지에서 회장의 대표적인 이미지를 나타내다. 따라서, ANPEP의 부재는 PEDV 감염을 예방하지 않았다.
표 33: PEDV PCR 및 IHC 결과 *1 의 요약
Figure pct00036
TGEV 감염을 위한 돼지 번식
TGEV 접종에 사용된 각 자손 새끼 돼지의 유전형 분류는 하기 표 34(한 배 새끼 20에 대해) 및 35(한 배 새끼 127에 대해)에 요약되어 있다. 모두에서, 한 배 새끼 20으로부터의 6 마리의 새끼 돼지 및 한 배 새끼 127로부터의 2 마리의 새끼 돼지를 TGEV로 접종하였다. 이들 중, 7 마리는 ANPEP에 대해 무효이었고 1 마리는 3 개 아미노산 결실을 가졌다. 별개의 한 배 새끼로부터의 7 마리의 야생형 돼지는 양성 대조군으로 사용하였다.
표 34: TGEV로 접종된 암퇘지 4-2로부터의 한 배 새끼 20 새끼 돼지의 유전자형
Figure pct00037
표 35: TGEV로 접종된 암퇘지 158-1로부터의 한 배 새끼 127 새끼 돼지의 유전자형
Figure pct00038
TGEV 접종 결과
새끼 돼지가 3 주령이 되었을 때, PEDV 접종과 동일한 경로, 용량, 및 수용 조건을 사용하여 상기 기재된 바와 같이 TGEV 퍼듀로 접종시켰다. 야생형(WT) 및 녹아웃(KO) 돼지를 연구로부터 각각 제거하고 시험을 위해 4 일에 안락사시켰다. 상업용 RT-PCR 검정을 사용하여 대변 및 혈청에서 바이러스의 존재를 검출하였고, IHC를 사용하여 회장에서 TGEV 항원을 검출하였다. TGEV에 초기 노출 후 0, 3, 6, 7 일에 대변에서 바이러스에 대한 PCR 결과는 도 38에 제공되어 있다. 결과는 Ct 값으로 제시된다. 검정색 원은 WT 돼지를 나타내며, 이는 3 일에 시작하는 대변에서 TGEV 핵산의 존재에 대해 양성이었다. 바이러스 핵산은 감염 첫 주 동안 F 대립유전자를 보유하는 단일 돼지의 대변(3 개 아미노산 결실, 회색 원) 또는 임의의 7 마리의 녹아웃(KO) 돼지(흰색 원)에서 검출되지 않았다(도 38). 1 마리의 WT 및 1 마리의 KO 돼지가 면역조직화학을 위해 4 일에 연구로부터 제거되었기 때문에(하기) 6 마리의 WT 및 KO 동물만이 6 및 7 일에 플롯딩됨을 유의한다. 모든 돼지는 13 일 연구가 끝날 때까지 RT-PCR 음성이었다(데이터는 제시되지 않음).
도 39는 야생형 돼지(WT, 패널 A), 녹아웃 돼지(KO, 패널 B) 또는 무효 대립유전자 및 3 개 aa 결실을 함유하는 대립유전자를 갖는 돼지(KO/-d3; 패널 C)로부터의 TGEV 항원에 대해 염색된 회장의 대표적인 면역조직화학 이미지를 나타낸다. 장 조직에 대한 TGEV 항원 염색을 가장 많은 양의 바이러스 핵산이 대변에 존재했던 기간 동안 감염 후 4 일에 연구로부터 제거된 단일 WT 및 KO 돼지에서 수행하였다. WT 돼지는 회장에서 TGEV 항원의 존재에 대해 양성이었지만(도 39, 패널 A), ANPEP KO 돼지는 음성이었다(도 39, 패널 B). 3 개 아미노산 결실을 보유하는 돼지로부터의 장 조직(F 대립유전자)을 감염 후 13 일에 TGEV 항원에 대해 염색하였다. 결과는 회장에서 바이러스 항원에 대한 양성 항체 염색을 나타내었다(도 39, 패널 C).
연구가 끝나고 수득된 혈청을 면역형광(IFA) 및 차단 ELISA 검정을 사용하여 TGEV-특이적 항체의 존재에 대해 시험하였다. 면역형광 검정(IFA) 및 차단 ELISA 검정은 모두 WT 및 F 대립유전자 돼지가 TGEV-특이적 항체의 존재에 대해 양성이었지만; TGEV 특이적 항체가 ANPEP KO 돼지에서 검출되지 않았음을 나타내었다(도 40). 도 40에서, 수평선은 양성/음성 결과에 대한 컷오프를 나타낸다. 플러스 및 마이너스 기호는 간접 IFA를 사용한 항체 측정 결과를 나타낸다. 3 개 아미노산 결실을 보유하는 돼지는 대변에서 TGEV 핵산에 대해 음성이었지만, 회장에서 TGEV 항체에 대한 양성 염색 및 양성 항체 반응은 이 돼지가 생산적으로 감염되었음을 확인하였다. 도 40에서 돼지의 수는 4 일에 IHC에 대한 WT 및 KO 돼지의 제거 후 남아있는 돼지의 수를 반영함을 유의한다.
이들 데이터는 ANPEP의 존재가 돼지를 TGEV로 감염시키기 위해 필요함을 입증한다. 데이터는 또한 ANPEP 기능 감소(예를 들어, F 대립유전자의 경우에서와 같이)가 대변에서 감소된 바이러스 수준에 의해 측정된 바와 같이 유익한 결과를 제공할 수 있음을 시사한다.
실시예 7: ANPEP, SIGLEC1 및 CD163으로부터 선택된 적어도 2 개의 유전자에서 염색체 변형에 대해 이형접합인 동물의 생성
재료 및 방법
번식
ANPEP 편집을 갖는 하나의 대립유전자(1 bp 삽입, 대립유전자 D, 서열번호: 166), 및 야생형(WT) 대립유전자를 보유하는 이종교배 어린 암퇘지(14-1)를 CD163 유전자 및 SIGLEC1 유전자 모두에서 편집에 대해 이형접합인 이종교배 어린 암퇘지와 인공 수정에 의해 번식시켰다(표 36). CD163 유전자에서 편집은 CD163 유전자가 서열번호: 112를 포함하도록 참조 서열 서열번호: 4와 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실이었다. SIGLEC1 유전자에서 편집은 참조 서열 서열번호: 122와 비교하여 뉴클레오티드 4,279에서 뉴클레오티드 5,525까지 1,247 염기쌍 결실이었으며, 여기서 결실된 서열은 SIGLEC1 유전자가 서열번호: 123을 포함하도록 네오마이신 유전자 카세트로 대체되었다.
암퇘지는 미라 또는 아직 태어난 태아가 없는 10 마리의 건강한 새끼 돼지를 분만하였다. 새끼 돼지는 모두 태어날 때 건강해 보였다. 하나의 대립유전자만 편집되었기 때문에 2 마리의 새끼 돼지를 안락사시켰다. 나머지 새끼 돼지는 계속 건강하였으며 제출 시 거의 2 월령이었다.
표 36: 한 배 새끼 144를 생산한 번식 조합
Figure pct00039
유전자형 분석
DNA 단리: 250 μL의 용해 완충액(40 mM Tris, pH 8.9, 0.9% Triton X-100, 0.4 mg/mL 프로테이나제 K, (NEB))에 잘린 꼬리의 작은 조각을 소화시키고 세포 용해를 위해 12 시간 동안 56℃에서 배양한 후 10 분 동안 85℃에서 배양하여 프로테이나제 K를 불활성화시킴으로써 게놈 DNA 용해물을 제조하였다. 꼬리 용해물 게놈 DNA를 PCR을 위한 주형으로 직접 사용하였다.
CD163: 게놈 DNA를 사용하여 PCR 및 아가로스 겔 전기영동에 의해 유전자형을 평가하였다. PCR을 표준 프로토콜 및 LA Taq(Takara, 캘리포니아주 마운틴뷰 소재)을 사용하여 CD163 특이적 정방향 프라이머 "TTGTTGGAAGGCTCACTGTCCTTG"(서열번호: 68, 표 3) 및 역방향 프라이머 "ACAACTAAGGTGGGGCAAAG"(서열번호: 69, 표 3)로 수행하였다. PCR 조건은 2 분 동안 95℃ 및 30 초 동안 94℃, 30 초 동안 50℃ 및 7 분 동안 68℃의 33 주기 이어서 2 분 동안 72℃의 최종 연장이었다. 그 다음에 6358 bp 앰플리콘을 1.25 % 아가로스 겔 상에서 분리하였다. 전기영동 후에 1387 bp 결실이 보였으며 서열분석하지 않았다. 정확한 서열은 원조 동물로부터 알려져 있다.
ANPEP: 게놈 DNA를 사용하여 PCR 아가로스 겔 전기영동 및 후속 생어 DNA 서열분석에 의해 유전자형을 평가하였다. PCR을 표준 프로토콜 및 LA Taq(Takara, 캘리포니아주 마운틴뷰 소재)을 사용하여 ANPEP 특이적 정방향 프라이머 "ACGCTGTTCCTGAATCT"(서열번호: 161, 표 23) 및 역방향 프라이머 "GGGAAAGGGCTGATTGTCTA"(서열번호: 162, 표 23)로 수행하였다. PCR 조건은 2 분 동안 96℃ 및 30 초 동안 95℃, 40 초 동안 50℃ 및 1 분 동안 72℃의 35 주기 이어서 2 분 동안 72℃의 연장이었다. 그 다음에 965 bp 앰플리콘을 2.0 % 아가로스 겔 상에서 분리하였다. 앰플리콘을 PCR 정제하고 미주리 대학 DNA Core에서 생어 서열분석에 의해 서열분석하였다. 1 bp 삽입이 존재하는 경우, 대립유전자를 편집된 ANPEP로 분류하였다.
SIGLEC1: 게놈 DNA를 사용하여 PCR 및 아가로스 겔 전기영동에 의해 유전자형을 평가하였다. PCR을 표준 프로토콜 및 LA Taq(Takara, 캘리포니아주 마운틴뷰 소재)을 사용하여 다음 SIGLEC1 특이적 정방향 프라이머 "GCATTCCTAGGCACAGC"(서열번호: 128, 표 17) 및 역방향 프라이머 "CTCCTTGCCATGTCCAG"(서열번호: 129, 표 17)로 수행하였다. PCR 조건은 2 분 동안 94℃ 및 30 초 동안 94℃, 10 초 동안 50℃ 및 2.5 분 동안 72℃의 35 주기 이어서 5 분 동안 72℃의 최종 연장이었다. 프라이머는 Neo 삽입 측면에 있었다. 야생형 SIGLEC 앰플리콘은 2000 bp이다. Neo가 삽입되는 경우 앰플리콘은 2600 bp이다. 한 배 새끼 144로부터의 SIGLEC1+/-는 겔 상에서 2 개의 앰플리콘인 2000 bp 및 2600 bp를 가질 것이다.
결과
한 배 새끼 144 새끼 돼지의 유전자형 분석은 모두 3 개의 변형을 갖는 1 마리의 암컷 새끼 돼지(144-7)를 초래하였다(표 37). 2 마리의 수컷 새끼 돼지(144-3, 144-4)는 ANPEPCD163 편집을 모두 보유하였지만, SIGLEC1 편집을 보유하지 않았다. 돼지를 PCR로 유전자형 분석하였고 결과는 도 41에 제시되어 있다. CD163에서 1387 bp 결실은 야생형 이외에 더 작은 앰플리콘으로 예시되었다(도 41, 패널 A). ANPEP 유전자에서 1 bp 삽입은 겔 전기영동 후 보이지 않았으며 앰플리콘을 서열분석하여 1 bp 삽입의 존재를 결정하였다(도 41 패널 B 및 D). SIGLEC1 녹아웃을 네오마이신 카세트(Neo)의 삽입에 의해 달성하였으며, 따라서 앰플리콘의 증가된 크기는 녹아웃을 나타낸다(도 41 패널 C).
표 37: 한 배 새끼 144의 유전자형
Figure pct00040
실시예 8: ANPEP, SIGLEC1 및 CD163으로부터 선택된 2 개 이상의 유전자에서 염색체 변형에 대해 동형접합인 돼지의 생성, 및 TGEV 및 PRRSV에 대한 내성에 대해 이러한 돼지의 시험
일단 성적 성숙에 도달하면, 실시예 7에서 상기 기재된 바와 같이 생성된 돼지를 사용하여 ANPEPCD163 둘 다, 또는 ANPEP, CD163,SIGLEC1 셋 모두의 염색체 변형에 대해 동형접합인 돼지를 생성할 것이다. 이는 3 개의 변형을 모두 함유하는 암컷(144-7)과 ANPEP CD163에 대한 변형을 갖는 2 마리의 수컷(144-3, 144-4)을 번식함으로써 수행할 것이다. 이 교배는 ANPEP(-/-)CD163(-/-)에 대해 동형접합이지만, SIGLEC1(+/-)에 대해서만 이형접합인 자손을 초래해야 한다. 3 개의 대립유전자(ANPEP , CD163, 및 SIGLEC) 모두의 동형접합 녹아웃을 함유하는 동물을 생성하기 위해, 이들 자손(F1 세대)은 실시예 7에서와 같이 생성된 추가 3중 이형접합 자손과 역교배될 것이다. 대안적으로, 또는 함께, 실시예 7에 기재된 번식은 삼중 동형접합 자손을 생성하도록 교배될 수컷 및 암컷 삼중 이형접합 계열을 생성하도록 반복될 것이다. 따라서, 동형접합 삼중 녹아웃 동물의 생성은 최소 2 세대가 걸릴 것이지만 수컷 및 암컷 삼중 이형접합 계열을 확립하기 위해 추가 세대가 필요할 가능성이 높을 것이다.
일단 동형접합 이중(ANPEP -/- /CD163 -/- ) 및 삼중(ANPEP -/- /CD163 -/- /SIGLEC1 -/- ) 녹아웃 동물이 만들어지면, 실시예 6에서 상기 기재된 방법을 사용하여 TGEV에 대한 내성 및 실시예 2에서 상기 기재된 방법을 사용하여 PRRSV에 대한 내성에 대해 시험될 것이다. 이중 및 삼중 녹아웃 동물은 둘 다 TGEV 및 PRRSV 둘 다에 대해 내성일 것으로 예상된다.
상기 관점에서, 본 발명의 여러 목적이 달성되고 다른 유리한 결과가 수득됨을 볼 수 있을 것이다.
본 발명의 범위를 벗어나지 않고 상기 생성물 및 방법에서 다양한 변화가 이루어질 수 있으므로, 상기 설명에 포함되고 첨부된 도면에 도시된 모든 일은 예시적으로 해석되어야 하며 제한하는 의미가 아님이 의도된다.
실시예 9: TGEV, PRCV 및 PEDV로 ANPEP KO 및 WT 세포의 시험관내 감염.
돼지 폐포 대식세포(PAM)는 폐를 절제하고 ~100 ml 차가운 포스페이트 완충 염수로 폐 세척을 수행하여 ANPEP KO 돼지(돼지 20-10, 표 34) 및 WT 돼지로부터 수집하였다. 7% 태아 소 혈청(FBS) 및 항생제가 보충된 MEM에서 2 주 동안 배양한 후, 섬유아세포 세포의 집단이 출현하였다. 섬유아세포-유사 세포를 TGEV, PRCV, 및 PEDV 단리물로 감염 다중도(moi) = 1로 감염시켰다. TGEV 및 PEDV 단리물의 제제는 실시예 6에 기재되어 있다. ST 세포에서 바이러스를 성장시켜 PRCV 단리물을 제조하였다. 24 시간 동안 배양한 후, 세포를 80% 아세톤으로 고정시키고 건조시켰다. 바이러스-감염된 세포를 FITC-표지된 코로나바이러스 항-N 단백질 항체를 사용하여 검출하였다. TGEV 및 PRCV를 항-FIPV3-70 mAb로 검출하였다. PEDV를 사내에서 제조된 모노클로날 항체로 검출하였다. 핵을 프로피듐 요오다이드를 사용하여 염색하였다. 세포를 형광 현미경으로 관찰하였다.
도 42는 3 개의 상이한 바이러스로 감염된 세포의 대표적인 형광 이미지를 나타낸다. ANPEP KO 세포는 TGEV 및 PCRV 감염에 대한 분명한 내성을 나타내지만, PEDV 감염에 대해 감수성이었다(도 42, 패널 A). 모든 WT 세포는 모든 3 개의 바이러스에 대해 분명한 감염을 나타내었다(도 42, 패널 B). 따라서, ANPEP 단백질의 손실은 감수성 집단에서 PRCV 뿐만 아니라 TGEV에 대한 내성을 부여할 수 있다.
참고문헌
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
서열의 표
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
구현예
추가 예시를 위해, 본 개시내용의 추가 비제한적인 구현예가 하기 제시된다.
구현예 1은 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물 또는 이의 자손 또는 동물 세포이다.
구현예 2는 구현예 1의 가축 동물, 자손, 또는 세포이며, 여기서 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 병원체 감염에 대한 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물, 자손, 또는 세포의 감수성과 비교하여, 병원체 감염에 대한 동물, 자손, 또는 세포의 감수성을 감소시킨다.
구현예 3은 구현예 2의 가축 동물, 자손, 또는 세포이며, 여기서 병원체는 바이러스를 포함한다.
구현예 4는 구현예 3의 가축 동물, 자손, 또는 세포이며, 여기서 바이러스는 코로나비리다에 패밀리 바이러스를 포함한다.
구현예 5는 구현예 4의 가축 동물, 자손, 또는 세포이며, 여기서 바이러스는 코로나비리나에 서브패밀리 바이러스를 포함한다.
구현예 6은 구현예 5의 가축 동물, 자손, 또는 세포이며, 여기서 바이러스는 코로나바이러스를 포함한다.
구현예 7은 구현예 6의 가축 동물, 자손, 또는 세포이며, 여기서 코로나바이러스는 알파코로나바이러스 속 바이러스를 포함한다.
구현예 8은 구현예 7의 가축 동물, 자손, 또는 세포이며, 여기서 알파코로나바이러스 속 바이러스는 전염성 위장염 바이러스(TGEV) 또는 돼지 호흡기 코로나바이러스(PRCV)를 포함한다.
구현예 9는 구현예 8의 가축 동물, 자손, 또는 세포이며, 여기서 TGEV는 TGEV 퍼듀 균주를 포함한다.
구현예 10은 구현예 1-9 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물은 유제류, 조류 동물, 및 말과 동물로 이루어진 군으로부터 선택되거나; 또는 세포는 유제류, 조류 동물, 및 말과 동물로 이루어진 군으로부터 선택된 동물로부터 유래된다.
구현예 11은 구현예 10의 가축 동물, 자손, 또는 세포이며, 여기서 조류 동물은 닭, 칠면조, 오리, 거위, 뿔닭, 또는 새끼 새를 포함하거나; 또는 말과 동물은 말 또는 당나귀를 포함한다.
구현예 12는 구현예 10의 가축 동물, 자손, 또는 세포이며 여기서 유제류는 소목을 포함한다.
구현예 13은 구현예 11의 가축 동물, 자손, 또는 세포이며, 여기서 소목은 돼지 동물, 소 동물, 양 동물, 염소 동물, 물소, 낙타, 라마, 알파카, 또는 사슴을 포함한다.
구현예 14는 구현예 13의 가축 동물, 자손, 또는 세포이며, 여기서 소 동물은 육우 또는 젖소를 포함한다.
구현예 15는 구현예 13의 가축 동물, 자손, 또는 세포이며, 여기서 소목은 돼지 동물을 포함한다.
구현예 16은 구현예 15의 가축 동물, 자손, 또는 세포이며, 여기서 돼지 동물은 돼지를 포함한다.
구현예 17은 구현예 1-16 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물 또는 자손은 배아, 발육기, 또는 성체이거나, 또는 세포는 배아 세포, 발육기 동물로부터 유래된 세포, 또는 성체 동물로부터 유래된 세포를 포함한다.
구현예 18은 구현예 1-17 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합이다.
구현예 19는 구현예 1-17 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합이다.
구현예 20은 구현예 1-19 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 삽입, ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 결실, ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함한다.
구현예 21은 구현예 20의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함한다.
구현예 22는 구현예 21의 가축 동물, 자손, 또는 세포이며, 여기서 결실은 인프레임 결실을 포함한다.
구현예 23은 구현예 20-22 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 삽입을 포함한다.
구현예 24는 구현예 20, 21, 및 23 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 삽입, 결실, 치환, 또는 이의 임의의 조합은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래한다.
구현예 25는 구현예 20, 21, 23, 및 24 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 삽입, 결실, 치환, 또는 암호화 오류는 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 조기 정지 코돈을 초래한다.
구현예 26은 구현예 20, 21, 및 23 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 결실은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 개시 코돈의 결실을 포함한다.
구현예 27은 구현예 20, 21, 23, 및 26 중 어느 하나의 가축 동물, 자손, 또는 세포이며 여기서 결실은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 전체 코딩 서열의 결실을 포함한다.
구현예 28은 구현예 20-26 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 치환을 포함한다.
구현예 29는 구현예 1-28 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성 감소를 유발한다.
구현예 30은 구현예 1-29 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 동물, 자손, 또는 세포에 의해 실질적으로 기능적 ANPEP 단백질을 생산하지 않는다.
구현예 31은 구현예 1-30 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 ANPEP 단백질을 생산하지 않는다.
구현예 32는 구현예 1-31 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2; ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 4; ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2 또는 엑손 4와 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함한다.
구현예 33은 구현예 32의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 변형, ANPEP 단백질을 암호화하는 유전자의 대립유전자의 인트론 1에서 변형, 또는 이의 조합을 포함한다.
구현예 34는 구현예 32 또는 33의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 인트론 1에서 시작하고 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 끝나는 결실을 포함한다.
구현예 35는 구현예 32 또는 33의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 삽입 또는 결실을 포함한다.
구현예 36은 구현예 35의 가축 동물, 자손, 또는 세포이며, 여기서 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 삽입 또는 결실은 개시 코돈의 하류에 있다.
구현예 37은 구현예 32, 33, 36, 및 37의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 결실을 포함한다.
구현예 38은 구현예 37의 가축 동물, 자손, 또는 세포이며, 여기서 결실은 엑손 2에서 인프레임 결실을 포함한다.
구현예 39는 구현예 38의 가축 동물, 자손, 또는 세포이며, 여기서 엑손 2에서 인프레임 결실은 ANPEP 단백질의 아미노산 194 내지 196의 결실을 초래한다.
구현예 40은 구현예 38의 가축 동물, 자손, 또는 세포이며, 여기서 엑손 2에서 인프레임 결실은 ANPEP 단백질의 아미노산 194 내지 197의 결실을 초래한다.
구현예 41은 구현예 40의 가축 동물, 자손, 또는 세포이며, 여기서 인프레임 결실은 ANPEP 단백질의 위치 198에서 발린 잔기의 이소류신 잔기로의 치환을 추가로 초래한다.
구현예 42는 구현예 32-41 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2에서 삽입을 포함한다.
구현예 43은 구현예 32-42 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함한다:
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,397에서 시작하는 5 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,574에서 뉴클레오티드 1,582까지 9 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,577에서 뉴클레오티드 1,585까지 9 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 819에서 뉴클레오티드 1,685까지 867 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 882에서 뉴클레오티드 1,688까지 867 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580 및 1,581 사이에 1 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,579 및 1,580 사이에 1 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,321에서 뉴클레오티드 1,587까지 267 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,323에서 뉴클레오티드 1,589까지 267 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,561에서 뉴클레오티드 1,585까지 25 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,560에서 뉴클레오티드 1,584까지 25 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,575에서 뉴클레오티드 1,582까지 8 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,574에서 뉴클레오티드 1,581까지 8 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨;
및 이의 임의의 조합.
구현예 44는 구현예 43의 가축 동물, 자손, 또는 세포이며, 여기서:
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실을 포함하며, 여기서 결실된 서열은 뉴클레오티드 1,397에서 시작하는 5 염기쌍 삽입으로 대체되고, 5 염기쌍 삽입은 서열 CCCTC(서열번호: 169)를 포함하거나;
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함하고, 삽입은 단일 티민(T) 잔기를 포함하거나;
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580 및 1,581 사이에 1 염기쌍 삽입을 포함하고, 삽입은 단일 티민(T) 잔기 또는 단일 아데닌(A) 잔기를 포함하거나;
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,579 및 1,580 사이에 1 염기쌍 삽입을 포함하고, 삽입은 단일 아데닌(A) 잔기를 포함하거나;
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입을 포함하고, 삽입은 AT 디뉴클레오티드를 포함하거나;
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실을 포함하며, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체되고, 8 염기쌍 삽입은 서열 GGGGCTTA(서열번호: 179)를 포함하거나;
변형은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실을 포함하며, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체되고, 4 염기쌍 삽입은 서열 TCGT(서열번호: 180)를 포함한다.
구현예 45는 구현예 43 또는 44의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함한다:
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실;
및 이의 임의의 조합.
구현예 46은 구현예 45의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함한다:
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입;
참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실;
및 이의 임의의 조합.
구현예 47은 구현예 43-46 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 하기를 포함한다:
(a) ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨; 및
ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입;
(b) ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨; 및
ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입;
(c) ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨; 및
ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581의 1 염기쌍 결실;
(d) ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨; 및
ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입; 또는
(e) ANPEP 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨; 및
ANPEP 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실.
구현예 48은 구현예 1-31 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,422를 포함하는 영역 내에서 변형을 포함한다.
구현예 49는 구현예 48의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,016을 포함하는 영역 내에서 변형을 포함한다.
구현예 50은 구현예 48 또는 49의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,446 내지 21,537을 포함하는 영역 내에서 변형을 포함한다.
구현예 51은 구현예 48-50 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479 내지 21,529를 포함하는 영역 내에서 변형을 포함한다.
구현예 52는 구현예 48-51 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479 내지 21,523을 포함하는 영역 내에서 변형을 포함한다.
구현예 53은 구현예 52의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,538 내지 22,422를 포함하는 영역 내에서 변형을 포함한다.
구현예 54는 구현예 48 또는 53의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 22,017 내지 22,422를 포함하는 영역 내에서 변형을 포함한다.
구현예 55는 구현예 48, 53, 및 54의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 22,054 내지 22,256을 포함하는 영역 내에서 변형을 포함한다.
구현예 56은 구현예 48 및 53-55의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 22,054 내지 22,126을 포함하는 영역 내에서 변형을 포함한다.
구현예 57은 구현예 48-56 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 삽입 또는 결실을 포함한다.
구현예 58은 구현예 57의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 결실을 포함한다.
구현예 59는 구현예 58의 가축 동물, 자손, 또는 세포이며, 여기서 결실은 인프레임 결실을 포함한다.
구현예 60은 구현예 32-59 중 어느 하나의 가축 동물, 자손 또는 세포이며, 여기서 변형된 염색체 서열은 인트론-엑손 스플라이스 영역을 분열시킨다.
구현예 61은 구현예 48-60 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479에서 뉴클레오티드 21,529까지 51 염기쌍 결실을 포함한다.
구현예 62는 구현예 48-60 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,479에서 뉴클레오티드 21,523까지 45 염기쌍 결실을 포함한다.
구현예 63은 구현예 48-60 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 132의 뉴클레오티드 21,509에서 뉴클레오티드 21,511까지 3 염기쌍 결실을 포함한다.
구현예 64는 구현예 48-60 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 치환을 포함한다.
구현예 65는 구현예 64의 가축 동물, 자손, 또는 세포이며, 여기서 치환은 서열번호: 132의 뉴클레오티드 21,509 내지 21,511에서 ACC 코돈의 하나 이상의 뉴클레오티드를 상이한 뉴클레오티드로 치환하여, 상이한 아미노산을 암호화하는 코돈을 생성하는 것을 포함한다.
구현예 66은 구현예 65의 가축 동물, 자손, 또는 세포이며, 여기서 하나 이상의 뉴클레오티드의 치환은 서열번호: 134의 아미노산 738에서 트레오닌(T) 또는 서열번호: 133의 아미노산 792에서 트레오닌(T)을 글리신(G), 알라닌(A), 시스테인(C), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 프롤린(P), 페닐알라닌(F), 티로신(Y), 트립토판(W), 아스파르트산(D), 글루탐산(E), 아스파라긴(N), 글루타민(Q), 히스티딘(H), 리신(K), 또는 아르기닌(R) 잔기로 대체한다.
구현예 67은 구현예 65 또는 66의 가축 동물, 자손, 또는 세포이며, 여기서 치환은 서열번호: 134의 아미노산 738에서 트레오닌(T) 또는 서열번호: 133의 아미노산 792의 트레오닌(T)으을 글리신(G), 알라닌(A), 시스테인(C), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 프롤린(P), 페닐알라닌(F), 트립토판(W), 아스파라긴(N), 글루타민(Q), 히스티딘(H), 리신(K), 또는 아르기닌(R) 잔기로 대체한다.
구현예 68은 구현예 65-67 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 치환은 서열번호: 134의 아미노산 738에서 트레오닌(T) 또는 서열번호: 133의 아미노산 792에서 트레오닌(T)을 발린(V) 또는 아르기닌(R) 잔기로 대체한다.
구현예 69는 구현예 32-68 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 결실, 삽입, 또는 치환으로 이루어진다.
구현예 70은 구현예 20-69 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135 또는 132에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 적어도 99.9%, 또는 100% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함한다.
구현예 71은 구현예 1-70 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물, 자손, 또는 세포는 서열번호: 163, 164, 165, 166, 167, 168, 170, 171, 172, 173, 174, 176, 177, 또는 178을 포함하는 염색체 서열을 포함한다.
구현예 72는 구현예 71의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물, 자손, 또는 세포는 서열번호: 177, 178, 166, 167, 170, 172, 또는 171을 포함하는 염색체 서열을 포함한다.
구현예 73은 구현예 71의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물, 자손, 또는 세포는 서열번호: 177, 178, 166, 167, 또는 171을 포함하는 염색체 서열을 포함한다.
구현예 74는 구현예 1-73 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함한다.
구현예 75는 구현예 74의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 병원체 감염에 대한 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물, 자손, 또는 세포의 감수성과 비교하여, 병원체 감염에 대한 동물, 자손, 또는 세포의 감수성을 감소시킨다.
구현예 76은 구현예 75의 가축 동물, 자손, 또는 세포이며, 여기서 병원체는 바이러스를 포함한다.
구현예 77은 구현예 76의 가축 동물, 자손, 또는 세포이며, 여기서 바이러스는 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)를 포함한다.
구현예 78은 구현예 77의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 1형 PRRSV 바이러스, 2형 PRRSV, 또는 1형 및 2형 PRRSV 바이러스 둘 다에 대한 동물, 자손, 또는 세포의 감수성을 감소시킨다.
구현예 79는 구현예 78의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 NVSL 97-7895, KS06-72109, P129, VR2332, CO90, AZ25, MLV-ResPRRS, KS62-06274, KS483 (SD23983), CO84, SD13-15, Lelystad, 03-1059, 03-1060, SD01-08, 4353PZ, 및 이의 임의의 조합으로 이루어진 군으로부터 선택된 PRRSV 단리물에 대한 동물, 자손, 또는 세포의 감수성을 감소시킨다.
구현예 80은 구현예 74-79 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합이다.
구현예 81은 구현예 74-79 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합이다.
구현예 82는 구현예 74-81 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 삽입, CD163 단백질을 암호화하는 유전자의 대립유전자에서 결실, CD163 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함한다.
구현예 83은 구현예 82의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함한다.
구현예 84는 구현예 82 또는 83의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 삽입을 포함한다.
구현예 85는 구현예 82-84 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 삽입, 결실, 치환, 또는 이의 임의의 조합은 CD163 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래한다.
구현예 86은 구현예 82-85 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 삽입, 결실, 치환, 또는 암호화 오류는 CD163 단백질을 암호화하는 유전자의 대립유전자에서 조기 정지 코돈을 초래한다.
구현예 87은 구현예 74-86 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 CD163 단백질 생산 또는 활성과 비교하여 CD163 단백질 생산 또는 활성 감소를 유발한다.
구현예 88은 구현예 74-87 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 동물, 자손, 또는 세포에 의해 실질적으로 기능적 CD163 단백질을 생산하지 않는다.
구현예 89는 구현예 74-80 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 CD163 단백질을 생산하지 않는다.
구현예 90은 구현예 74-89 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물 또는 자손은 돼지 동물을 포함하거나 또는 세포는 돼지 세포를 포함한다.
구현예 91은 구현예 90의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7; CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 8; CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7 또는 엑손 8과 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함한다.
구현예 92는 구현예 91의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7에서 변형을 포함한다.
구현예 93은 구현예 92의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7에서 변형은 결실을 포함한다.
구현예 94는 구현예 82-93 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 결실은 인프레임 결실을 포함한다.
구현예 95는 구현예 92-94 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자의 대립유전자의 엑손 7에서 변형은 삽입을 포함한다.
구현예 96은 구현예 90-95 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함한다:
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,147까지 124 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,146까지 123 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,147 및 3,148 사이에 1 염기쌍 삽입;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,159까지 130 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,161까지 132 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 1,525에서 뉴클레오티드 3,030까지 1506 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,724에서 뉴클레오티드 4,096까지 1373 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있음;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 3,172까지 28 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,440에서 뉴클레오티드 4,160까지 1720 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,015에서 뉴클레오티드 3,466까지 452 염기쌍 결실;
및 이의 임의의 조합.
구현예 97은 구현예 96의 가축 동물, 자손, 또는 세포이며, 여기서:
변형은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실을 포함하고, 2 염기쌍 삽입은 디뉴클레오티드 AG를 포함하거나;
변형은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,147 및 3,148 사이에 1 염기쌍 삽입을 포함하고, 1 염기쌍 삽입은 단일 아데닌 잔기를 포함하거나;
변형은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입을 포함하고, 7 염기쌍 삽입은 서열 TACTACT(서열번호: 115)를 포함하거나;
변형은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실을 포함하며, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있고, 12 염기쌍 삽입은 서열 TGTGGAGAATTC(서열번호: 116)를 포함하거나; 또는
변형은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실을 포함하며, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체되고, 11 염기쌍 삽입은 서열 AGCCAGCGTGC(서열번호: 117)를 포함한다.
구현예 98은 구현예 96의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 하기로 이루어진 군으로부터 선택된 변형을 포함한다:
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; //여기서부터 P209
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 동일한 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨;
참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실;
및 이의 임의의 조합.
구현예 99는 구현예 96-98 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 하기를 포함한다:
(a) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실;
(b) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨;
(c) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실;
(d) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
(e) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있음; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
(f) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 488에서 뉴클레오티드 2,417까지 1930 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 488에서 시작하는 12 염기쌍 삽입으로 대체되고, 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,044에서 뉴클레오티드 3,172까지 엑손 7에서 추가 129 염기쌍 결실이 있음; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실;
(g) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
(h) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 1467 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실;
(i) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,431에서 뉴클레오티드 3,897까지 11 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
(j) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,147까지 124 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,024에서 뉴클레오티드 3,146까지 123 염기쌍 결실;
(k) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,159까지 130 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,030에서 뉴클레오티드 3,161까지 132 염기쌍 결실;
(l) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,818에서 뉴클레오티드 4,097까지 1280 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,724에서 뉴클레오티드 4,096까지 1373 염기쌍 결실;
(m) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 3,172까지 28 염기쌍 결실; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실;
(n) CD163 단백질을 암호화하는 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨; 및
CD163 단백질을 암호화하는 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,440에서 뉴클레오티드 4,160까지 1720 염기쌍 결실;
(o) CD163 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,148 및 뉴클레오티드 3,149 사이에 7 염기쌍 삽입; 및
CD163 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실;
(p) CD163 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 개 염기상 삽입으로 대체됨; 및
CD163 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,149 및 3,150 사이에 2 염기쌍 삽입, 및 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 2,573에서 뉴클레오티드 2,949까지 377 염기쌍 결실; 또는
(q) CD163 유전자의 하나의 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,113에서 뉴클레오티드 4,494까지 1382 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 3,113에서 시작하는 11 염기쌍 삽입으로 대체됨; 및
CD163 유전자의 다른 대립유전자에서 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,137에서 뉴클레오티드 3,147까지 11 염기쌍 결실.
구현예 100은 구현예 82-99 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 결실 삽입, 또는 치환으로 이루어진다.
구현예 101은 구현예 82-100 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 47에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 적어도 99.9%, 또는 100% 서열 동일성을 갖는 CD163 단백질을 암호화하는 유전자에서 염색체 서열을 포함한다.
구현예 102는 구현예 74-101 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 서열번호: 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 또는 119를 포함하는 염색체 서열을 포함한다.
구현예 103은 구현예 74-102 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서:
ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함하고;
CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실을 포함한다.
구현예 104는 구현예 1-103 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 가축 동물, 자손, 또는 세포는 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 추가로 포함한다.
구현예 105는 구현예 104의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합이다.
구현예 106은 구현예 104의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합이다.
구현예 107은 구현예 104-106 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 삽입, SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 결실, SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함한다.
구현예 108은 구현예 107의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 결실을 포함한다.
구현예 109는 구현예 108의 가축 동물, 자손, 또는 세포이며, 여기서 결실은 인프레임 결실을 포함한다.
구현예 110은 구현예 107-109 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 삽입을 포함한다.
구현예 111은 구현예 107-110 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 치환을 포함한다.
구현예 112는 구현예 107, 108, 110, 및 111 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 삽입, 결실, 치환, 또는 이의 임의의 조합은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래한다.
구현예 113은 구현예 107, 108, 및 110-112 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 삽입, 결실, 치환, 또는 암호화 오류는 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자에서 조기 정지 코돈을 초래한다.
구현예 114는 구현예 104-113 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 SIGLEC1 단백질 생산 또는 활성과 비교하여, SIGLEC1단백질 생산 또는 활성 감소를 야기한다.
구현예 115는 구현예 104-114 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 동물, 자손, 또는 세포에 의해 실질적으로 기능적 SIGLEC1 단백질을 생산하지 않는다.
구현예 116는 구현예 104-115 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 SIGLEC1 단백질을 생산하지 않는다.
구현예 117은 구현예 104-116 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물 또는 자손은 돼지 동물을 포함하거나 또는 세포는 돼지 세포를 포함한다.
구현예 118은 구현예 117의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1; SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 2; SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 3; SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1, 엑손 2, 또는 엑손 3과 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함한다.
구현예 119는 구현예 118의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1, 엑손 2, 및/또는 엑손 3에서 결실을 포함한다.
구현예 120은 구현예 118 또는 119의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 SIGLEC1 단백질을 암호화하는 유전자의 대립유전자의 엑손 1의 일부 및 엑손 2 및 3 모두의 결실을 포함한다.
구현예 121은 구현예 118-120 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 변형된 염색체 서열은 참조 서열 서열번호: 122와 비교하여 뉴클레오티드 4,279에서 뉴클레오티드 5,525까지 1,247 염기쌍 결실을 포함한다.
구현예 122는 구현예 119-121 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 결실된 서열은 네오마이신 유전자 카세트로 대체된다.
구현예 123은 구현예 107-122 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 결실 삽입, 또는 치환으로 이루어진다.
구현예 124는 구현예 107-123 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 122에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 적어도 99.9%, 또는 100% 서열 동일성을 갖는 SIGLEC1 단백질을 암호화하는 유전자에서 염색체 서열을 포함한다.
구현예 125는 구현예 104-124 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 서열번호: 123을 포함하는 염색체 서열을 포함한다.
구현예 126은 구현예 121-125 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서:
ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입을 포함하고;
SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열은 참조 서열 서열번호: 122와 비교하여 뉴클레오티드 4,279에서 뉴클레오티드 5,525까지 1,247 염기쌍 결실을 포함한다.
구현예 127은 구현예 126의 가축 동물, 자손, 또는 세포이며, 여기서 동물, 자손, 또는 세포는 참조 서열 서열번호: 47과 비교하여 뉴클레오티드 3,145에서 뉴클레오티드 4,531까지 1387 염기쌍 결실을 포함하는 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 추가로 포함한다.
구현예 128은 구현예 1-127 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물 또는 자손은 유전적으로 편집된 동물 또는 자손을 포함하거나 또는 세포는 유전적으로 편집된 세포를 포함한다.
구현예 129는 구현예 128의 가축 동물, 자손, 또는 세포이며, 여기서 동물 또는 세포는 호밍 엔도뉴클레아제를 사용하여 유전적으로 편집되었다.
구현예 130은 구현예 129의 가축 동물, 자손, 또는 세포이며, 여기서 호밍 엔도뉴클레아제는 설계된 호밍 엔도뉴클레아제를 포함한다.
구현예 131은 구현예 129 또는 130의 가축 동물, 자손, 또는 세포이며, 여기서 호밍 엔도뉴클레아제는 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템, 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN), 리콤비나제 융합 단백질, 메가뉴클레아제, 또는 이의 임의의 조합을 포함한다.
구현예 132는 구현예 128-131 중 어느 하나의 가축 동물, 자손, 또는 세포이며, 여기서 동물 또는 세포는 CRISPR 시스템을 사용하여 유전적으로 편집되었다.
구현예 133은 구현예 1-132 중 어느 하나의 가축동물이다.
구현예 134는 구현예 1-132 중 어느 하나의 자손이다.
구현예 135는 구현예 1-132 중 어느 하나의 세포이다.
구현예 136은 구현예 135의 세포이며, 여기서 세포는 정자 세포를 포함한다.
구현예 137은 구현예 135의 세포이며, 여기서 세포는 난자 세포를 포함한다.
구현예 138은 구현예 137의 세포이며, 여기서 난자 세포는 수정란을 포함한다.
구현예 139는 구현예 135의 세포이며, 여기서 세포는 체세포를 포함한다.
구현예 140은 구현예 139의 세포이며, 여기서 체세포는 섬유아세포를 포함한다.
구현예 141은 구현예 141의 세포이며, 여기서 섬유아세포는 태아 섬유아세포를 포함한다.
구현예 142는 구현예 135, 139, 및 140 중 어느 하나의 세포이며, 여기서 세포는 배아 세포 또는 발육기 동물로부터 유래된 세포를 포함한다.
구현예 143은 병원체 감염에 대한 감수성이 감소된 비인간 동물 또는 비인간 동물의 계통을 생산하는 방법이며, 여기서 방법은 하기를 포함한다:
난모세포 또는 정자 세포를 변형시켜 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 난모세포 및 정자 세포 중 적어도 하나에 도입하고, 난모세포를 정자 세포와 수정하여 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 함유하는 수정란을 생성하는 단계; 또는
수정란을 변형시켜 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 수정란에 도입하는 단계;
수정란을 대리 암컷 동물로 옮기며, 여기서 임신 및 만기 분만은 자손 동물을 생산하는, 단계;
병원체에 대한 감수성에 대해 자손 동물을 스크리닝하는 단계; 및
ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물과 비교하여 병원체에 대한 감수성이 감소된 자손 동물을 선택하는 단계.
구현예 144는 구현예 143의 방법이며, 여기서 동물은 가축 동물을 포함한다.
구현예 145는 구현예 143 또는 144의 방법이며, 여기서 난모세포, 정자 세포, 또는 수정란을 변형시키는 단계는 난모세포, 정자 세포, 또는 수정란의 유전적 편집을 포함한다.
구현예 146은 구현예 143-145 중 어느 하나의 방법이며, 여기서 난모세포, 정자 세포, 또는 수정란은 변형된 염색체 서열에 대해 이형접합이다.
구현예 147은 구현예 143-145 중 어느 하나의 방법이며, 여기서 난모세포, 정자 세포, 또는 수정란은 변형된 염색체 서열에 대해 동형접합이다.
구현예 148은 구현예 143-147 중 어느 하나의 방법이며, 여기서 수정은 인공 수정을 포함한다.
구현예 149는 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물에서 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성이 감소되도록 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계를 포함하는, 병원체 감염에 대한 가축 동물의 내성을 증가시키는 방법이다.
구현예 150은 구현예 149의 방법이며, 여기서 ANPEP 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계는 염색체 서열의 유전적 편집을 포함한다.
구현예 151은 구현예 145-148 및 150 중 어느 하나의 방법이며, 여기서 유전적 편집은 호밍 엔도뉴클레아제의 사용을 포함한다.
구현예 152는 구현예 151의 방법이며, 여기서 호밍 엔도뉴클레아제는 설계된 호밍 엔도뉴클레아제를 포함한다.
구현예 153은 구현예 151 또는 152의 방법이며, 여기서 호밍 엔도뉴클레아제는 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템, 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN), 리콤비나제 융합 단백질, 메가뉴클레아제, 또는 이의 조합을 포함한다.
구현예 154는 구현예 145-148 및 150-153 중 어느 하나의 방법이며, 여기서 유전적 편집은 CRISPR 시스템의 사용을 포함한다.
구현예 155는 구현예 143-154 중 어느 하나의 방법이며, 여기서 방법은 구현예 1-153 중 어느 하나의 동물을 생산한다.
구현예 156은 원조 동물로서 동물을 사용하는 것을 추가로 포함하는, 구현예 143-155 중 어느 하나의 방법이다.
구현예 157은 구현예 1-133 중 어느 하나의 2 마리 이상의 가축 동물 및/또는 이의 자손을 포함하는 가축 동물의 집단이다.
구현예 158은 구현예 143-156 중 어느 하나의 방법에 의해 만들어진 2 마리 이상의 동물 및/또는 이의 자손을 포함하는 동물의 집단이다.
구현예 159는 구현예 157 또는 158의 집단이며, 여기서 동물의 집단은 병원체 감염에 내성이다.
구현예 160은 구현예 159의 집단이며, 여기서 병원체는 바이러스를 포함한다.
구현예 161은 구현예 160의 집단이며, 여기서 바이러스는 전염성 위장염 바이러스(TGEV) 또는 돼지 호흡기 코로나바이러스(PRCV)를 포함한다.
구현예 162는 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하는 핵산 분자이다:
(a) 서열번호: 135의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함;
(b) 서열번호: 132의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함; 및
(c) (a) 또는 (b)의 cDNA.
구현예 163은 구현예 162의 핵산 분자이며, 여기서 핵산 분자는 단리된 핵산 분자이다.
구현예 164는 구현예 162 또는 163의 핵산 분자이며, 여기서 핵산은 서열번호: 132 또는 135에 대해 적어도 80%, 적어도 85%, 적어도 87.5%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 99.9% 동일성을 갖는 뉴클레오티드 서열을 포함하며, 뉴클레오티드 서열은 서열번호: 132 또는 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함한다.
구현예 165는 구현예 162-164 중 어느 하나의 핵산 분자이며, 여기서 치환, 삽입, 또는 결실은 치환, 삽입, 또는 결실을 포함하지 않는 핵산과 비교하여, ANPEP 단백질 생산 또는 활성을 감소시키거나 또는 제거한다.
구현예 166은 구현예 162-165 중 어느 하나의 핵산 분자이며, 여기서 핵산은 서열번호. 163, 164, 165, 166, 167, 168, 170, 171, 172, 173, 174, 176, 177, 또는 178을 포함한다.
구현예 167은 구현예 166의 핵산 분자이며, 여기서 핵산은 서열번호: 177, 178, 166, 167, 또는 171을 포함한다.
SEQUENCE LISTING <110> The Curators of the University of Missouri Prather, Randall Wells, Kevin Whitworth, Kristin <120> PATHOGEN-RESISTANT ANIMALS HAVING MODIFIED AMINOPEPTIDASE N (ANPEP) GENES <130> UMO 16002.WO <150> US 62/663,495 <151> 2018-04-27 <160> 186 <170> PatentIn version 3.5 <210> 1 <211> 23 <212> DNA <213> Sus scrofa <400> 1 ggaaacccag gctggttgga ggg 23 <210> 2 <211> 23 <212> DNA <213> Sus scrofa <400> 2 ggaactacag tgcggcactg tgg 23 <210> 3 <211> 23 <212> DNA <213> Sus scrofa <400> 3 cagtagcacc ccgccctgac ggg 23 <210> 4 <211> 23 <212> DNA <213> Sus scrofa <400> 4 tgtagccaca gcagggacgt cgg 23 <210> 5 <211> 23 <212> DNA <213> Sus scrofa <400> 5 ccagcctcgc ccagcgacat ggg 23 <210> 6 <211> 23 <212> DNA <213> Sus scrofa <400> 6 ctttcattta tctgaactca ggg 23 <210> 7 <211> 23 <212> DNA <213> Sus scrofa <400> 7 ttatctgaac tcagggtccc cgg 23 <210> 8 <211> 23 <212> DNA <213> Sus scrofa <400> 8 cagctgcagc atatatttaa ggg 23 <210> 9 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 9 ctcctcgccc ttgctcacca tgg 23 <210> 10 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 10 gaccaggatg ggcaccaccc cgg 23 <210> 11 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 11 ctctccctca ctctaaccta ctt 23 <210> 12 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 12 tatttctctc acatggccag tc 22 <210> 13 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 13 ctctccctca ctctaaccta ctt 23 <210> 14 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 14 gactggccat gtgagagaaa ta 22 <210> 15 <211> 27767 <212> DNA <213> Sus scrofa <400> 15 atacaagtgc cttttacaga caatctgcac aagttatttg ttagacatat ttgattatag 60 aattaatatt aaaaggggtt ataacaatca agcattgata atttaattat gtttgcctat 120 tttactttag ttttttgaca taactgtgta actattgcga tttttttatt cctaatgtaa 180 ttagttcaaa acaaagtgca gaaatttaaa atattcaatt caacaacagt atataagtca 240 atattccccc cttaaatttt tacaaatctt tagggagtgt ttctcaattt ctcaatttct 300 ttggttgttt catgtcccat atggaagaaa acatgggtgt gaaagggaag cttactcttt 360 tgattacttc ccttttctgg ttgactccac ctccattatg aagcctttct gtatttttgt 420 ggaagtgaaa tgatttttag aattcttagt ggttctcttc ttcaggagaa catttctagg 480 taataataca agaagattta aatggcataa aaccttggaa tggacaaact cagaatggtg 540 ctacatgaaa actctggatc tgcaggtaaa atcttctcat ttattctata tttacctttt 600 aaatagagtg tagcaatatt ccgacagtca atcaatctga tttaatagtg attggcatct 660 ggagaagaag taacagggaa aaaggcaata agctttataa ggggaacttt tatcttccat 720 agactcaaaa ttgaagacgt gactagaaga ttgctagatt tggcatcagt tttgtaaaat 780 tgctgaggtg aaattaagta agggatgaaa attaactaaa ttgtgttgag tatgaaacta 840 gtagttgtta gaaaagatag aacatgaagg aatgaatatt gattgaaagt tgatgaccta 900 gaggacattt agactaacac ctctgagtgt caaagtctaa tttatgattt acatcgatgc 960 gttaaactca tttaacattc ttactttttt cccctcaagc atttaagctg aagtataaca 1020 tttcacatga aagcctggat tataaatgca cagttcagtg acctatctca gaggagtgac 1080 tgccatagca ttttttttgt ctttttgcct tcagagccac agcaacgcgg gatccgaagc 1140 cgcgtctgcg acccacacca cagctcacgg caatgccgga tctttaaccc actgagcgag 1200 gccggggatc gaacccgcag tctcatggtt cctagtagga ttcgttaacc actgcgccac 1260 gacgggaact cctaccatag catttttact tttaagttac tgttggttta gagtaagaag 1320 gagaaatgag agtgatggag cgtttgctat atttggagac aaggtcctat attggaggtt 1380 ctcaaatata aattttgtcg ctttttcctc caatgtattg ttcaactact atttagcagg 1440 ccactgtgcc aggtactggt gaaactggtg aacatgatag atgtaattca ttccctcatg 1500 gaactttcca tctaacaatg tggatcaggt aggcttggag atgagaatgc cagtggttga 1560 ctatgactct gtggctgaag ggagagctac tcacttcgta gtttcatcaa tgtctttttg 1620 gttttccagg ttttaagccc tgctcttgca attcttttcc cttctccaac tttcttctaa 1680 tttctcaccc ctaggatgcc tataaacatg agtattttca aagctacttc actgaggtta 1740 tatgatcctg gtgtgaattt ttcctgcctg acttgccatt tagaaggaag tgtttcctgg 1800 aatttccatt gtggcttggt ggttaaagac cctgcattgt ctctgtgagg atgtgggttc 1860 aatctctggc ctcattcagt gagtgggtta aggatctggt gtcgctgcaa gctgtggcta 1920 agatcccaca ttgccatgtc tgtggtgtag actggcacct ggagctctga tttgaccaca 1980 atcttaggaa cttcagatgt ggccataaaa aggaaaaaaa agttaggaag ggttttctgt 2040 cttgtttgga ccttcgttaa tctcaaacct ttggaaccat ctctcctcca aaacctcctt 2100 tgggtaagac tgtatgtttg ccctctctct tcttttcgca gactttagaa gatgttctgc 2160 ccatttaagt tccttcactt tggctgtagt cgctgttctc agtgcctgct tggtcactag 2220 ttctcttggt gagtactttg acaaatttac ttgtaaccga gcccaactgt gacaagaaac 2280 actgaaaagc aaataattgc tcctgaagtc tagatagcat ctaaaaacat gcttcatggt 2340 ttcaaggatc atatattgaa accccaggga tcctctagag tcgacctgca gcatgcaggg 2400 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 2460 gggggggggg gggggggggg gggggggggg gggggggggg gtgcataagg aaagactatc 2520 tcaacgtctt attcctcagc ttacattaga tttgaaactc tagtcaccta aaatgcaaat 2580 ctcatttact taccatcaga gatattaatg acctatagaa ttcagcataa ataaagtttc 2640 atgtatggat attagcttat ggttctagtc actgctaatt gaaacctgtg atattgctgt 2700 ttgttttgac tcctatgaaa taacattctc ccattgtacc atggatgggt ccagaaacat 2760 ttctcaaatc ctggcttgaa aaaataaata agtaatctaa agaataataa ttctctactt 2820 gctctttgaa tcttgaccaa ttgctgcatt tacctattgt tacaggagga aaagacaagg 2880 agctgaggct aacgggtggt gaaaacaagt gctctggaag agtggaggtg aaagtgcagg 2940 aggagtgggg aactgtgtgt aataatggct gggacatgga tgtggtctct gttgtttgta 3000 ggcagctggg atgtccaact gctatcaaag ccactggatg ggctaatttt agtgcaggtt 3060 ctggacgcat ttggatggat catgtttctt gtcgagggaa tgagtcagct ctctgggact 3120 gcaaacatga tggatgggga aagcataact gtactcacca acaggatgct ggagtaacct 3180 gctcaggtaa gacatacaca aataagtcaa gcctatacat gaaatgcttt gtgggaaaaa 3240 atgtatagat gagttaaaaa caaaaaggaa ccagttttct ataagtcatc tagtccatgt 3300 ataaaattac ccaatccatt actaaaagac cacttctggt attttacaca tgacaaagcc 3360 catattaaaa aaaaaaaatt cagaagagat tctgaatgct ataataaatg agcaagtgac 3420 tagcttcaat tttatattag gtcattctac cttctacttc tacatgaaaa tatcataatg 3480 tctaagttaa ttccttgtcc cctttcccaa taaagcactg ctttcatgca ctggcctatg 3540 aatcatgaac tttttgccct ttaactgatg atcaacttac caaatcaaga aataaatatt 3600 cttagcactg atcctttttt gttgttgttg gaggaagaat gttttgcaaa gtagaattgc 3660 ttttttctgt ttaacagtgc tattcatttc atttacatgg tcgttttaat ttataaaaca 3720 tttcataagt ttcacctcat atgcccttac aataactcag gaagttatat gttagacctt 3780 tctgctgaca aatcccagag tcatgtttct gacccagttc agattccttg gcttcccatt 3840 tctctttgct catgtcattg acctttatgc agccctctta cctcccacct ttctattaca 3900 gaccatctcc tccataggac tggtgttaga aagtactaat ctctacccag gcattgtggt 3960 gcaatgtggg cagcacaggc tggtatctag aaaaatgctg aagtgaattc cagctcagct 4020 gctcgttaat actatcgttt taagtaagct gttcaatcct ttgaaattca ctttctgagc 4080 actcagtgat ataataaatg tagagctact ggtacactgt ctggtatgta ataggtgtta 4140 ccaattaacc ttagtttcct catgggtcac tggttctcat tacctagaca actcatttct 4200 ctttcttcct ctttctcttt ctccattctc ctcctccttc ttcctcttct tcttgtctgt 4260 tattgttata tcattttgct gagaaagtta agaaataaca actctaacct ctacatcgac 4320 cacctagagc aaagttaaaa ataataataa accttgccag actcttacta taattgttgc 4380 tgtctataga gttgactgtt taagttaaga catcagtata tatttttaat ttttgtgttt 4440 tttttttcat acttttacat gaggatcctt tatataagga tgagttaaac aaacttgatt 4500 tttgaagttt atacccctga ggctcaactg cataataata gaaagggatc catagcctct 4560 caaggactta actagtttca tgagttttca gaatctgaat ttctgagatt ctccacccca 4620 attaaagctc aagcctcaga acatatatcc ttctcttggt aaattctatt cttatcacat 4680 gcgtaataat aaaaaagaga gatgttggag acagattttt ttcctcacat tctgtctcta 4740 ctgttttcta ggtgtttgat tctgtgttat ttaacctcag tttgcttatc tgtgaagtag 4800 ggattatggt aataacatat aatgctttat gttgtaaaga ctaaagaaga tagcatatgt 4860 aacacatttg gaacagggaa tgcatatttt gattgtgagc tcttattatt attaccattc 4920 agccctaata aaaatcttgg taagtggaag gctttggatt tcagaacttt taaaatctaa 4980 ttactttttc aaaaaagaac ttcttagggt tttttttttt taaccacaaa gtgtttctat 5040 tttttaggtg tcccaaaatt tcgttccaaa tatctttttc tcagatattt tagtcctcat 5100 agaacaccta gggatagtgg atagagaaaa ttttctttat taaaaagctg ttctttgcta 5160 aaaattgtag caggtacttt tgggaggggg gaaaactttg attcagaaac tgctaagaca 5220 tggagtgttt tgactaattt ttcctcaatt tttaatgttt tttataccat agggtacttt 5280 tgcaaactat tatgcatact tatatatttt tacttttttc ctgtctttta acttccaaat 5340 tcaacttcag acaattattc atgcactaaa ctgtttgtag taagaaagat taaaattaaa 5400 aaattaacca ttcaacaaat gactggtttg ccatttttac tactttgttg tatgaacaat 5460 ttttttttct acaaatgaat actttgagtc tgatttatcc attcctacat aaaagttttt 5520 actatatctt agtattggaa ggaaacaaaa caaaacacaa tgtaaatttt aatctataaa 5580 ttttgggggg gtaaatatac atagatgaaa gtcttaacca ttaattagag tcaaaagatt 5640 aaaattctcc aatatgtgaa cttaggctgc atccaaaatg aagcatcatt tttaaggaca 5700 gcatcaaaag tgaccagagg aattttactt tctttctttt tttttttttt gaattttagt 5760 ttctaaactc acttctgaat aaatacaact tctaaattct cgtcttttct ctactctaga 5820 tggatctgat ttagagatga ggctggtgaa tggaggaaac cggtgcttag gaagaataga 5880 agtcaaattt caaggaacgt ggggaacagt gtgtgatgat cacttcaaca taaatcatgc 5940 ttctgtggtt tgtaaacaac ttgaatgtgg aagtgctgtc agtttctctg gttcagctaa 6000 ttttggagaa ggttctggac caatctggtt tgatgatctt gtatgcaatg gaaatgagtc 6060 agctctctgg aactgcaaac atgaaggatg gggaaagcac aattgcgatc atgctgagga 6120 tgctggagtg atttgcttaa gtaaggactg acctgggttt gttctgttct ccatgagagg 6180 gcaaaaaaag gggagtaaaa gtcttaaaag ctcaaactgt taaaaacata atgatgattg 6240 cttcttttat catcttatta ttatctaatt tcaggtcgaa attctagtac ctgtgcagtt 6300 ttttacctta actgaaatta agataaatag gatagggagg aaggatgagc agtgacattt 6360 aggtccaagt catgaggtta gaaggaaatg ttcagagaat agcccattcc ctcagccctc 6420 aaagaaagaa agaaagaaaa agaaaaaaaa aaagaaagct taactagaaa attttgttct 6480 ctggatgttt tagaggcaaa ccatcccttt atcattccta cctacaaagc cttctcttaa 6540 tcacattacc caccctttcc tactatagtc aggggggggg gggggggggg gggggggggg 6600 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 6660 gggggggggg gtgaaaaaag aaccaaacaa tttcaacaaa aaaccaaaca attccaacaa 6720 aattggtcca ataagcaaac ctctagataa atttcagtgc cctggatgtt ttgttaggaa 6780 ctcttcctac aatgcgtgct ttccattctg aaaagtccta tctacttgcc tgatccactt 6840 ctccttccat cctaaacgat tttcagtggt agtatattac tgttgtctct gtctctactt 6900 atatatcttc cccttttcac tcactcctct caggtacagc tcttcagttt gcccttattc 6960 ttgtttcctt gtcaatgact tgttttgtgt ccctcttaca gatggagcag acctgaaact 7020 gagagtggta gatggagtca ctgaatgttc aggaagattg gaagtgaaat tccaaggaga 7080 atggggaaca atctgtgatg atggctggga tagtgatgat gccgctgtgg catgtaagca 7140 actgggaggt ccaactgctg tcactgccat tgtcgagtta acgccagtga gggactggac 7200 acattggctc acacacatac agccatgaca cgatctgctc tatggtccga tgattaaagg 7260 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 7320 gggggggggg gggggggggg gggggggggg ggggggggag aagagctggt ggacatttct 7380 ggaaaggaac caaaacccgg aagggccttg ttcttcagga tttgggatgg attggggagg 7440 gagaaaattg tttctaatat ttcttggtgg gaattctttt acagttgtga caaatctttc 7500 acatattctt catttgagta gtttggaggg ttgtctgact gttttctata ataaatgtcc 7560 caagtgctat gaggtaccac atttcaaatt ctaattctac ctgaagctcc aaaaagacaa 7620 aatgttatag gtcttttctt tatatctaat ttgcttatgg tttttagcca ttgacaattt 7680 ttttttctta actcttgaaa ctataaccct atttctaacc aaattcatgt tctatactgg 7740 ctcttcaaaa acccaggaga tgggaaagcc agaatctcca gtgtttcagc ttctgggaag 7800 gagcaagttt ttaaaaatac cctctgggag ctaaattcca catgtatcta tggcctaagt 7860 gtatgtttat tttgcagatg gatcagatct ggaactgaga cttaaaggtg gaggcagcca 7920 ctgtgctggg acagtggagg tggaaattca gaaactggta ggaaaagtgt gtgatagaag 7980 ctggggactg aaagaagctg atgtggtttg caggcagctg ggatgtggat ctgcactcaa 8040 aacatcatat caagtttatt ccaaaaccaa ggcaacaaac acatggctgt ttgtaagcag 8100 ctgtaatgga aatgaaactt ctctttggga ctgcaagaat tggcagtggg gtggacttag 8160 ttgtgatcac tatgacgaag ccaaaattac ctgctcaggt aagaatttca atcaatgtgt 8220 taggaaattg cattctactt tcttttacat gtagctgtcc agttttccca gcaccacttg 8280 ttgaagagac tgtcttttct tcatcatata gtcctacatc ctttgtcata aattaattga 8340 ccataggtgt gtgggtttat atctgggctc tctattctgt tcctttgatc tatatgtctg 8400 tttttatgcc agcaccatgc tgttttgatt actatagctt tgtagtatca tctgaagtca 8460 ggaaacatga ttcctccagc tttgttcttc tttctcaaga ttgttttgtc tattcagagt 8520 ttatgttccc atgcagattt aatttttaaa tttatttaat ttttattttt tatttttaat 8580 ttaaattaat ttaaattttt tatttcccaa cgtacagcca agggggccag ggtaaccttt 8640 acatgtatac attaaaaatt tcaggttttt cccccaccca tttctttctg ttggcaagta 8700 aatttttgaa caaagtttcc caatgctttt taaggggaat tcccttgggg gggggggggg 8760 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 8820 gggggggggg gggggggggg gggggggggg gggggggggg agacgaaatt gactatattt 8880 tctttgttgg gaatctttta cagttgtgac aaatctttca catattcttc atttgagtag 8940 tttggagggt tgtctgactg ttttctataa taaatgtccc aagtgctatg aggtaccaca 9000 tttcaaattc taattctacc tgaagctcca aaaagacaaa atgttatagg tcttttcttt 9060 atatctaatt tgcttatggt ttttagccat tgacaatttt tttttcttaa ctcttgaaac 9120 tataacccta tttctaacca aattcatgtt ctatactggc tcttcaaaaa cccaggagat 9180 gggaaagcca gaatctccag tgtttcagct tctgggaagg agcaagtttt taaaaatacc 9240 ctctgggagc taaattccac atgtatctat ggcctaagtg tatgtttatt ttgcagatgg 9300 atcagatctg gaactgagac ttaaaggtgg aggcagccac tgtgctggga cagtggaggt 9360 ggaaattcag aaactggtag gaaaagtgtg tgatagaagc tggggactga aagaagctga 9420 tgtggtttgc aggcagctgg gatgtggatc tgcactcaaa acatcatatc aagtttattc 9480 caaaaccaag gcaacaaaca catggctgtt tgtaagcagc tgtaatggaa atgaaacttc 9540 tctttgggac tgcaagaatt ggcagtgggg tggacttagt tgtgatcact atgacgaaac 9600 caaaattacc tgctcaggta agaatttcaa tcaatgtgtt aggaaaattg cattctactt 9660 tcttttacat gtagctgtcc agttttccca gcaccacttg ttgaaaaaac tgtctttttc 9720 ttcatcatat agtcctacat cccttggcca taaattaatt gaccataagg ggtgtgggtt 9780 taatatccgg ggctcctcaa ttcgggtccc ttggatccta aaagccggtt ttataacccg 9840 acacatggcc tgtttttgac taaataaaac ctttggaaaa caatcccgaa ggtcgaggaa 9900 catggaatcc ccccaacaaa ggaccttctt tccccaaaaa tgcggctcag ccaactcaaa 9960 aagattttat gaatcacaaa ccgcacatta tcttcctaaa attactattc ctatgtttta 10020 atttgcaaag tcattccgat atagttggcg cagagtaact catttagata tccaccccac 10080 cagttcctca ctcaagtaag gggggggggg gggggggggg gggggggggg gggggggggg 10140 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggc 10200 ccccatgtga gattttgtgt gtcctttaag agtggagtct ctatttccca ctgctctctg 10260 gttctcccca aagtaagccc tgctggcttt caaaacttct gggagcttgc cttcttggta 10320 taggactcct gggctaggga gtctaatgtt tggcttagac cccttactgc ttgggaagaa 10380 tctctgcaac tgtaatgaat tatcttccta tttgtgggtt gctgaggata tggtcttaac 10440 tgttctgtgt tctacccctc ctatccatct tgttgtggtt ccttctttat atctttagtt 10500 gtagaaaagt ttttcttatc aacagttgct ctgtaaattg taacttgggt gtacacctag 10560 taggaggtga gctcagggtc ttcctactct gccatcttgg ccatgtcctc taaacatttt 10620 ggtgtatttc actgcaacct ttttaaaaat ctcaaaagtg agctgtgatt ggctagtctt 10680 gtggataatc tctagcattt gatgctaatc atatttatac aaatactttg ttgaaaagtg 10740 atgccttttt aactattatt aaaaaacgta ttgacataac tattgctatt atactgaaaa 10800 gaaagacctt agagaaaata gcataagagc aaaaccatta aacatggaga catctagtca 10860 tagggtggaa attttatgtg gtccatatcc cctaaccagt ggctttacac caggcacatc 10920 ctaactaaga tctgctccca agtgtcttcc ctgatgcttt aaattgtgtt acatggaaac 10980 tatcctttga tgaagaaatg caacctttta aaatacaaca ttgaaacttt tgtgctttaa 11040 ttttgctttt caacattttt tctttttaaa agaagaaatt tatttgtttt tttaaatttt 11100 aatggccacg gcatatggaa gttctcaggc cagggataga attcaagcca caggtgcgac 11160 ccatgccaca actgctgcaa caccagatcc tttaacccac tgcaccaggc cagggattga 11220 agccttgcct tactgacaat ctgagccact tcagtcagat aaagaaattt cttcattaag 11280 cagagtattc acatggttta aacttcaaaa tattaaagtg taaactcttt ccccaccact 11340 gtccccagct caccaactct acttaccaca gacaactgat gtggttaggg tatttaaata 11400 gtaaatccaa gaaaatataa acaaatccgt atatataggt ttcaccccat tttattatcc 11460 taatgttgca tatcatataa actatactgt cccttgggta ttcacttagt aaaatatttt 11520 gatcataatt tcctatcagt atttaaagag ctttctgaaa ttatttctgt ataacatttc 11580 ttttctcatc ggtagggggg gggggggggg gggggggggg gggggggggg gggggggggg 11640 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg ggggaatggg 11700 aagaaaaaac caccatggtt aatttttttt atccctctac acccgggaaa attacccttg 11760 gggccacact tttctataga aaggggatta tttaaaaggg tctgaaaaag aatttttttt 11820 tcgaaagggg aaatatttgg cctaacttag tcacataagc catgttctct ggcaagttag 11880 gtaacataca tttttgtcat tgggggcaac aaaaacaatt ttccttttgg accttttggg 11940 actccgcatt ggttagggaa ggggaagtat attggaattc ggaaaattcc ttccaaatta 12000 aaaaaggttt gttattttca tattaaccta tttcatatta attagcatga attccagcgc 12060 cattaaaagg gaaaacacct ggagtggtaa gaaaaaagtt tttttttctc tttttttttt 12120 ttttttttta atggccacat ctgtggcatg tgaagttccc aggctagggg tcgaatagga 12180 gctacagctg ccagcttgca ccacagccac aacaatgcca gagccaagcc tcatctgcga 12240 cctataccac aactcatggc aatgctggtt ccttaacccc ctgagtgagg cctggggtca 12300 aacccacatc ctcatggata ctaaccggct ttgttaccgc tgagccatga gggaaactcc 12360 ctttttctca ttgaaaataa gtcaaataga taagcagctt aaggctgttt gggtgattct 12420 gtggtccagt aattatcaaa tcctactgga caagaataga gaatgtgcaa atgagggaac 12480 gtgttggtga gatcaggctc tgcccactga gctatcctct gtcatgggcc ctgtgctgtt 12540 ctcagagctg tacttcctag ggcattgttc tcatttcaat tctgagttca gtgtggagag 12600 tatacgtgtg tgggggctgc acgcttttca caacccactt tctgctgata ctgatttagg 12660 gatccttgga ttgctttaca gttgagtcat cattaactag tgtcacttgc cttcaaagtc 12720 agcaaaataa ttgtctccaa actagtaggc ttctagtgta tttgctttaa tccaatgcca 12780 tgtgaaagta acatggtcaa agaataagtt atataccttg acctaccctg tgaccaggct 12840 cttcctctta atttattgac cactgcctta aggtcatttg aaaccatggg tttgggagga 12900 aggcaaggcc taaatcccgt ctttgttgga aggctcactg tccttgtctt tagagcatca 12960 ttttttttta aactggggta cagtttattt acagtgttgt gtcaatttct gctgtacagc 13020 acagtgaccc agtcatacac atacatacat tctttttctc atactatctt caattttatt 13080 ttctgctaag tctgccattt tatcatcacc tcagtttgaa ggacaggata tttagagttt 13140 gttttttttt tccccccaat cctgcaattt ctaaattata agactctcaa ttagccgtat 13200 ataacagctg caggcacagg atgtctccct cacaaaattg gtatttttcc ttccatttct 13260 tcttgcagtt tggctatttc ttgtctgagt tcatctctct ttttaagtgt taaaaagggc 13320 aaggaggatt catgctatgt caacattatg attttttctt ttctatactt gataagagta 13380 tacttttccc aaatgtcatc caacttttca gcatcagttt ggacatggtt ttcttttcaa 13440 ggtggtattt ctctaatgtc acttgaataa caagactcgt tagttctcca ggctacaata 13500 tcctagtctg agtatattct gcatgttaat tctattcagc cacatccata atttaggttt 13560 tattcctgga acacctcact tttttttttt tttttggtct ttttatagcc ataaccatgg 13620 catatggagg ttcccaggct aggggtctaa tctgagcttt agccactggc ccatgccaca 13680 gccacagcca tgccacatct gagccacatc tgtgaccttt tccacagctc acagaaacac 13740 cagatcccta acccactgag tgaggccagg ggtcaaacct gtaacccttc catggttcct 13800 agtcagattc gttcctctgt accacgatgg gaattcctaa tacctcactt atgataacac 13860 attctgaatt atttaggatt ctattatact gcatgtaata gaaatcccaa atagcaaaat 13920 ttgcaactta aggcaggttc ctgtctttac aaaatcatgt tttcctttgc tatatgtgca 13980 ctttgctttc ctctgtgaat tccctttttt gttatatttc tatagctttt ggaaacactt 14040 ttacttattt gggggggcct agatttttaa ccctctcctt gtttttctag aaatagagtt 14100 tataatttta tttcttcatt tacttgatac tttcaagaga ttcccaggaa aaaaattatg 14160 gaaatactgt ctctgtgcct gccaagttca aactaagaat tgtataatct gttttaattc 14220 ttaagcattt atagatgaca aggctttgtg tctgataggg gccagcgaac tcagtaaaga 14280 gggaagatga gaaagataat ggcaagaatt tatccctgaa gtgtagtttt gacaaaccag 14340 tcacaaagag gtctaagaaa ttttggtcac aaagttgttt tgaatcccag gcattttatt 14400 tgcaatgatt gcatatgttc tggaaaggac atctgaacct aagaaatagt tcatttgcat 14460 tgtgttatat tttactaagg tctgagaaat aatcttgaga tgagaatgaa ctctacttct 14520 tcagagtctg gaaggaataa attatgaaaa tgtattaatg cttctttaaa ccatattgta 14580 tatttatcta ttactaaaca aaaagaagta gctctattta tttatttatt tatttattta 14640 tttatgtctt ttgtctcttt agggccacac ctgtggcata tggaggttcc caggctagag 14700 gtccaattgg agatgtagca gccagcctat gccagagcca ccgcaacacg ggatctgagc 14760 cacgtctgtg acttacacca cagctcacag caacgcctga tcctcaaccc actgagcgag 14820 gccagggatc gaacccatgt cctcatggat gctagttggg ttcgttaact gctgagccat 14880 gatgggaact ccaaattaat tatttcttat atttgttctt catatattca tttctataga 14940 aagaaataaa tacagattca gttaatgatg gcaggtaaaa gcttaactta ttaatcaaag 15000 gagttaatcc aggcacaaaa attcaattca tggctctctg ttaaaattta ggtataggtt 15060 tagcaggaag aaaaggttag tagatgcaga ctattacatt tagaatggat ggacaatgaa 15120 gtcctactat acagcacagg gaactatatc caatctcttg ggatagaata tgatggaaga 15180 caaaatcaga acaagagagt atatatatat gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 15240 gtgtgtgtgt gtgtgactgg gtcaccctgc ggcacagcag aaattggcag aacattgtaa 15300 atcaactata ctttaatagg aaaaatactt ttaagggcta aatttccaat attctaacca 15360 tgtacacaga gtaaatgtca taaggatgcc agtctgtgta gagattgatg tgttactagc 15420 agattcatga aataaaggct gaggatgtag tccccaagtc acttctgagt ggaagaattt 15480 ctcctttgtc ctggactcaa atattttagg ataaaggaaa aaagaagata tttatagaag 15540 ggacttgttt tcaagtactt gacaaaattt caccattaaa gagaaatttg tgggagttcc 15600 catcgtggct cagtggaaac aaatccaact aggaaccatg aggttgtggg tttgatccct 15660 ggcctcactc agtgggttaa ggatccggtg ttgccgtgag ctgtggtgta ggttgcagac 15720 acggttctga tcctgcgttg ctgtggctgt ggctgtggtg taggccagca gcaaacagct 15780 ctgattagac ccctagcctg gaaacctcca tatgccacag gtgcagccct aaaaagacaa 15840 aaaaagagaa aagacaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaag 15900 aacccccaga ggtatttatt tgtttttgcc ttttttcact gactgttctt tgtttgtttg 15960 tttgagactg atctagaaga ctagagatta caagaaatat ggatttggct cactctaaga 16020 aactgctttc attccaaggt ttgggtctat ccaaaagtgg aatagaatca tatgaatact 16080 agtttatgag tatttagtga gaggaatttc aagctcaaat aatgattcag caagattaaa 16140 ttaaggaggg aattttcctt gtggctgagt gggttaagga cccaatgttg tctctgtgag 16200 gatgtaggtt ccatcctggg ctttgctcat taggttaagg atctggcatt gctgcagctc 16260 agacccagtg ctgccctggt tgtggcttag gccaaagctg cagctccaat tcaatctctg 16320 gcctgggaac ctccatgtgc tacaaggtgc ggccttaaaa ggaaaaaaaa aaaattaaat 16380 caaggactca agagtctttc attatttgtg ttgtggaagc tatatttgtt ttaaagtctt 16440 agttgtgttt agaaagcaag atgttcttca actcaaattt gggagggaac ttgtttcata 16500 catttttaat ggataagtgg caaaattttc atgctgaggt gatctatagt gttgtaatgc 16560 agaatatagt cagatcttga acattttagg aagttggtga gggccaattg tgtatctgtg 16620 ccatgctgat aagaatgtca agggatcaca agaattcgtg ttatttgaca gcagtcatct 16680 ttaaaaggca tttgagaaag tccaatttca aatgcatttc ctttctttaa aagataaatt 16740 gaagaaaata agtctttatt tcccaagtaa attgaattgc ctctcagtct gttaaaagaa 16800 actcttacct tgatgattgc gctcttaacc tggcaaagat tgtctttaaa atctgagctc 16860 catgtcttct gctttatttc tggtgtgcct ttgactccag attacagtaa atggaggact 16920 gagtataggg ctaaaaagta gagagaatgg atgcatatta tctgtggtct ccaatgtgat 16980 gaatgaagta ggcaaatact caaaggaaag agaaagcatg ctccaagaat tatgggttcc 17040 agaaggcaaa gtcccagaat tgtctccagg gaaggacagg gaggtctaga atcggctaag 17100 cccactgtag gcagaaaaac caagaggcat gaatggcttc cctttctcac ttttcactct 17160 ctggcttact cctatcatga aggaaaatat tggaatcata ttctccctca ccgaaatgct 17220 atttttcagc ccacaggaaa cccaggctgg ttggagggga cattccctgc tctggtcgtg 17280 ttgaagtaca acatggagac acgtggggca ccgtctgtga ttctgacttc tctctggagg 17340 cggccagcgt gctgtgcagg gaactacagt gcggcactgt ggtttccctc ctggggggag 17400 ctcactttgg agaaggaagt ggacagatct gggctgaaga attccagtgt gaggggcacg 17460 agtcccacct ttcactctgc ccagtagcac cccgccctga cgggacatgt agccacagca 17520 gggacgtcgg cgtagtctgc tcaagtgaga cccagggaat gtgttcactt tgttcccatg 17580 ccatgaagag ggtagggtta ggtagtcaca gacatctttt taaagccctg tctccttcca 17640 ggatacacac aaatccgctt ggtgaatggc aagaccccat gtgaaggaag agtggagctc 17700 aacattcttg ggtcctgggg gtccctctgc aactctcact gggacatgga agatgcccat 17760 gttttatgcc agcagcttaa atgtggagtt gccctttcta tcccgggagg agcacctttt 17820 gggaaaggaa gtgagcaggt ctggaggcac atgtttcact gcactgggac tgagaagcac 17880 atgggagatt gttccgtcac tgctctgggc gcatcactct gttcttcagg gcaagtggcc 17940 tctgtaatct gctcaggtaa gagaataagg gcagccagtg atgagccact catgacggtg 18000 ccttaagagt gggtgtacct aggagttccc attgtggctc agtggtaaca aactcgactg 18060 gtatccatga gggtatgggt ttgatccctg gccttgctca atgggttaag gatccagcat 18120 tgctgtgagc tgtggtatag gttgcagact ctgctcaggt cccatgttgc tgtgattgtg 18180 gtgtaggctg actgctgcag cttcaatttg acccctagcc cgggaatttc cataggccac 18240 acgtgcagca ctaaggaagg aaaaaaagaa aaaaaaaaaa aaagagtggg tgtgcctata 18300 gtgaagaaca gatgtaaaag ggaagtgaaa gggattcccc cattctgagg gattgtgaga 18360 agtgtgccag aatattaact tcatttgact tgttacaggg aaagtaaact tgactttcac 18420 ggacctccta gttacctggt gcttactata tgtcttctca gagtacctga ttcattccca 18480 gcctggttga cccatccccc tatctctatg gctatgttta tccagagcac atctatctaa 18540 cactccagct gatcttcctg acacagctgt ggcaaccctg gatcctttaa ccaactgtgc 18600 caggctggag atcaaaccta agcctctgca gcaacccaag ctgctgcagt cagattttta 18660 accccctgtg ccactgtggg tatctccgat attttgtatc ttctgtgact gagtggtttg 18720 ctgtttgcag ggaaccagag tcagacacta tccccgtgca attcatcatc ctcggaccca 18780 tcaagctcta ttatttcaga agaaaatggt gttgcctgca taggtgagaa tcagtgacca 18840 acctatgaaa atgatctcaa tcctctgaaa tgcattttat tcatgtttta tttcctcttt 18900 gcagggagtg gtcaacttcg cctggtcgat ggaggtggtc gttgtgctgg gagagtagag 18960 gtctatcatg agggctcctg gggcaccatc tgtgatgaca gctgggacct gaatgatgcc 19020 catgtggtgt gcaaacagct gagctgtgga tgggccatta atgccactgg ttctgctcat 19080 tttggggaag gaacagggcc catttggctg gatgagataa actgtaatgg aaaagaatct 19140 catatttggc aatgccactc acatggttgg gggcggcaca attgcaggca taaggaggat 19200 gcaggagtca tctgctcggg taagttctgc acatcacttc gggttacagt gatttaagaa 19260 acaactaagg tggggcaaag ggtagtgagg catatccatc agagcaaatt ccttgaaata 19320 cggactcaga gggaaccatt gtgagattga ggttcccaga ggtgtggatt taatgaatta 19380 gtgttacctc atgtacaagg tagtatacta ccagaaagat aaaaattcag aagcgagttt 19440 gcagcaaaac tcatagggag aacttctttt ataaataata tgaagctgga tatttagtgc 19500 accacctgat gaccacttta ttaataaata aagagttcct gttgtggcgc agcggaaatg 19560 aatccgacaa ataatcatga gtttgcgggt ttgatccctg acctcgctca gtgggttggg 19620 gatctggtgt tgccatgagc tgtggtgtag gtcgcagatg ctgcttggat cctgctttgc 19680 tgtggctgtg gtataggctt gtggctacag ctccgatttg accgctagcc tgggaacctc 19740 catatgctgc gggggtggcc ctcaaaagaa aaataaataa ataagtaaat aaataagtag 19800 tttaaaaagg acaagaagaa atatatttgg tgttatattc tacagagaca aagataatca 19860 ccatgcccga ttgatttttc aaggcatata aatgagacgt catgggagca aaaatggtca 19920 taatacaatg cccttgtttt gtgtacatgg taagatttta gaaagcattg tgaggtaaaa 19980 aagtgtactc agttataata tattggggaa aacagtacta tgagaagtaa aaaaatctac 20040 atgccggaag ttattttttt aatgtctctt ttagagtcgc acatgcggca tatggaggtt 20100 cccaggctag gggtcgaatc agagctatag ccactggctt atggcacagc cacaacaaca 20160 ctagatctga gccacatcag cgacctatac tatagctcat ggcaatgcca gatccttaac 20220 ctactgagcc aagccatggg tcaaatccag gtcctcacgg atcctaggca aattcatttc 20280 tgctgagcca cgaagggaac tcctcagaag tgattttgat gttactttct tttcatgaca 20340 aatctggtaa agtacataca catagaaact gaagtgtcag aaagggaaat atttcatttt 20400 aaggtaatgt atacaaaaca gtggttttac catctgagta tctcgctaaa ttttaactat 20460 caaggacaat tgccaaaaaa aaaaaaaaaa gagagagaga gagaacagaa tagggttatg 20520 aagctaaaat cacagggtta tgaagctaaa atcacagtaa tttagggaga aaaaaatcca 20580 aagcatgtaa ttgataaaag gttctgagcc tttgtttgag atttagaatt caacttagaa 20640 ataccggtgg tattttaaag cagtccataa gtataaaatc caaggctaaa aaaccagaag 20700 gtatttgtag aacaaatata ttttaataag ctctaccaag tcatccagaa gctattaaag 20760 aattactggt cactgacata gtgtacctgt tttcaaggcc attcttacat cagaataaag 20820 ggagagcacc ctctgaatct tcagaaaaga tgtgaaagtg ctaattctct atttcatccc 20880 agagttcatg tctctgagac tgatcagtga aaacagcaga gagacctgtg cagggcgcct 20940 ggaagttttt tacaacggag cttggggcag cgttggcaag aatagcatgt ctccagccac 21000 agtgggggtg gtatgcaggc agctaggctg tgcagacaga ggggacatca gccctgcatc 21060 ttcagacaag acagtgtcca ggcacatgtg ggtggacaat gttcagtgtc ctaaaggacc 21120 tgacacacta tggcagtgcc catcatctcc atggaagaag agactggcca gcccctcaga 21180 ggagacatgg atcacatgtg ccagtgagta tccattcttt agcgccactg ttatcttctg 21240 atctacctaa gcagaagttt tataatctgt agttaatccc tattctacct ggatgatggg 21300 attcattctg tttaatttgg tgtgcaggta ttcagcatca gtgatcattt tcccaaagac 21360 catcatgctc tgatggtctt ctcaaaagtt ctaatcagtt gcttcctccg tgaacagttg 21420 aggagcagag aatatgtaat tcagaatttg actattgaat catcccattt ttctttcaca 21480 tagtcttttg ttgcactgaa tataaggaga gaagcagtca gaaagatcaa tcctgaatta 21540 tttctccatt ctacatctgt tttaaatttc aaaaaaaaaa attgttatag gtgatttaca 21600 atgtctgtca atttctgctc tacagcaaag tgacccagtt atttacatat acattctgtt 21660 tctcatattt ttaaaccagg agatttctat ctgcctggcg gtttgaggga atttaacatt 21720 atgcatttat gttaacttta ttcacctgat gttttctaag tcatactgag attcttatgc 21780 ccaggatgga atacacctgg tttgctggaa agacatgtgc tttcataaag acgaattttg 21840 gaaaaaatat aaaatttaaa aggcccatta aataagcaaa gttttaagag atttcaaaaa 21900 aaatttcatc tctctctttt cctctttgac ctcttgggca cgttcatctt ctcaaatatg 21960 atcttggtgt ttctgacttt tcagacaaaa taagacttca agaaggaaac actaattgtt 22020 ctggacgtgt ggagatctgg tacggaggtt cctggggcac tgtgtgtgac gactcctggg 22080 accttgaaga tgctcaggtg gtgtgccgac agctgggctg tggctcagct ttggaggcag 22140 gaaaagaggc cgcatttggc caggggactg ggcccatatg gctcaatgaa gtgaagtgca 22200 aggggaatga aacctccttg tgggattgtc ctgccagatc ctggggccac agtgactgtg 22260 gacacaagga ggatgctgct gtgacgtgtt caggtgaggg cagagagtct ggattgagct 22320 tggaagctct ggcagcaaag agagggtggg cggtgacctg cattgggtaa agattggaag 22380 gtccagccta aggatctggt ggtgggggga gacatgatgt ttcagtctga agaatgatga 22440 aaacctgtgt ggttacgcat gggccttcgc cgaggaaagg gacataacta ccatgtatcc 22500 tcctgcagag ggaggaagaa ctaggggatt ctagttttgt gtgggaagga gcagtttact 22560 tggctcagga ggcactaaag gctcagatag gaaacagaga tctgttccat tcttactccc 22620 agaactgatt ctcttctctt ttctcctaca gaaattgcaa agagccgaga atccctacat 22680 gccacaggta tatcaaaaag tttaagaaca tgggacccat tgtctgcatt ttgtggaatc 22740 cctcttatta agacattctg ggtcagaagt tctgaggatt tgacatttac ttcagctatc 22800 tgttatctta cccaagagag ggatggtaac taggaaccca ggtcttttag ctaagacatt 22860 atcacctctt gtgatgttta cttgttctca ggtcgctcat cttttgttgc acttgcaatc 22920 tttggggtca ttctgttggc ctgtctcatc gcattcctca tttggactca gaagcgaaga 22980 cagaggcagc ggctctcagg tctgaacaaa attacggtct ctctaatgtt tctatgggag 23040 aagaagcctc tctggataat aaaacaaaaa aattacattc aagtatcagt tggccagaaa 23100 gagggaacct agaagaggtt taagcagttt ctccgaaaca gggaacaaga attcagagaa 23160 gaaaaggcac attggctgta ctgatgatac ctgcactcgc tatgtatgtt taatggggga 23220 cagtagagaa ttgatagttt agaaggagta tgcttatatg gttctggatg aatcctgtat 23280 ccccccaaac atttattttc tcttactata tacttattac taatttaact cttctgtcaa 23340 gccatgtgct aggttctgaa gatggttcag acttggataa ccaagtgctt ttgttttcat 23400 ggaatttcca gtttagtgga agagataaat atgtaaacaa ataaatgggg gggggggggg 23460 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23520 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23580 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23640 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23700 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23760 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23820 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23880 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 23940 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg 24000 gggggggggg gggggggggg gggggggggg gggggggggg ggggggggtt ggcgggcccc 24060 cctcgaggtc gacggtatcg ataagcttga tatcgaattc gtgagccaga ggacgagact 24120 agagatggat gatgactacg ttatgcttgc actgctgggg aaaagcacac atagggaggg 24180 aacgttttat tatgacccag tccctaacct atgacctctg ttatcagttt tctcaggagg 24240 agagaattct gtccatcaaa ttcaataccg ggagatgaat tcttgcctga aagcagatga 24300 aacggatatg ctaaatccct caggtccgtg ggttctttga ggggctgtag ccctggggtt 24360 cagatcagca gctgcagttg aggttgaggc atgctacttt gcatagcagt agaaagaaat 24420 ctcaactgta ataggaagct tgggatgcat atgaggaaga aaggcaagaa tgaactacaa 24480 attattctta gggaagataa aaattgcagt catggggaga cctctggctg agagggccgt 24540 gattatttct gacagaggga ttatggagta gaatatgatg gcttggacct tttttcacta 24600 aaacaagtca gtcttctcaa aggtagttta gcttttcata tatctttcac agtttcttcc 24660 attcccattt cctgccattt tcctttctct aacttttatt tattatattt tttcctaaaa 24720 gtttaaattt tctatatctt tatcccttca gaagccatcc ctagtcacag gactagtctc 24780 atttcccatt atgtaatgct tctttctctg tctgttgact tctatttaga accagtgcac 24840 taaatctgcc tttaggaaca tacctctgct aggttgcaag aaatatccca ttccccactc 24900 actctgtgaa gactcaatgc ttctcaatat tccttacctc ctgagaggga cttgcctcac 24960 ttctttaatc caagggactc gatttttgcc aaaactaagt caggaaaacc tacataagac 25020 ataggaaaga cttgctgtgc ttcttaaacc ccactgtttg ttttcctaat tgtgaacagt 25080 atttttaaag ttaacaagag agcttctaag gcacttgagg ggagatctga tttatttccc 25140 agtaattatt ttcttccttt cagaaaattc cactgaataa gatggtttta acggatgtgg 25200 gactaatttt tgtgtctaaa tctcttccta tttctggatg aaaaaaagga gaccactctg 25260 aagtacaatg aaaaggaaaa tgggaattat aacctggtga ggtgagtagg aagaatttat 25320 tcatcattgc tgaaaacagg tacattcctt ttgaaagttg agaactcctc tggtattaga 25380 aaaaaaaaaa gaacgtatat acacatatat ttccatgtct atgtttatgt ttgtaaatcc 25440 atattcagaa tatgcaacaa ctttttataa ctatgacttc agtccatctt ttagttacat 25500 atatattcta aacaacaact attgctaaga gaagctgggt aagtaaatgt gaataaatct 25560 tctaaagata ttacaggaag ttcctgctgc ggctcagtgg gttaaagact tgatgtcttt 25620 gtgaagatga gggctcgagc cctggcctca ctcagtgagt taaggatcta gcattgctgt 25680 aagctgcagc gtaggttgca gatagggctc agatccagtg ttgctgtggc tgtggcctca 25740 gttgcagctc tgattcaacc cttaggcgag gaacttccat atgcagcaaa tgtggccatt 25800 aaaaaaaaaa aaaacattat aggagtcatt tcataaaaga gataagacgt ttctatagtt 25860 atatagtgca tactctggta aagatagtat aggatactat aggaatatag aaagcttgcc 25920 tatgaaaatt tgggaagatt gtggaaaaga catctcaaaa tatggcatag aaaagaatca 25980 tatctttgag gaacagtaag tttttcattc aaaaccgtgt attgaacata cttgtggtga 26040 caagtggtgt cctgagtact aaaaattcag tgataaaaga tgctcttgac aaagacatgg 26100 ctgttgaata gaaggtctca ctgtcaatgt gtgggaatta tggacagcct atgtggacac 26160 agggaataga tgagactcta ggctggaagg ctgcattgag cccaataatg aatggtcctg 26220 tctgatatat ttcatgctca tattttattt tagggactat tggggaggtg gtgggttttg 26280 gaagattaag ctgaggcaag acacaatcag attgcctttt ataatttact ttcaggagga 26340 aagtctaact aaaaaaagaa ttcgatatca agcttatcga taccgtcgac ctcgaggagg 26400 cccgcctgcc cttttggggg gggggggggg gggggggggg gggggggggg gggggggggg 26460 gggggggggg gggggggggg gggggggggg gggggggggg gggggggggg gggggcagca 26520 ccaattttat tattggcggg aataaagaga aaaatgtaat ttcaaagatt gctgttggaa 26580 atgaggggtg tggtagcttt tggagaaagc attctggaga cttctattaa tttttttttt 26640 ttaagtgctt caaagatcct ttgatccaac aattctactc ctaaaaattt cttccataca 26700 gataaagcca tttgtctgta tataacaaat agaagagaat tcctttttgc agccttgtta 26760 gtagtgcccc caaactggaa acaaagtgaa tatcagtcag tggggtagcg gctggaaaaa 26820 ttttagtgca cccaaccaac aaagaaaaac catgcacaaa aattcaataa atatcatctc 26880 acttttgtgt tcatgttatt gaatataatt aaacataatg tttacatcta taaaattatc 26940 atatgtatac atgtaaagaa acattaaaac atttttaaca gactgtaaac ttgaggactg 27000 tgaatgactt ttgattgata atctcaaaca tatggatact attctgatgt aataaataat 27060 gattaaattt tttccctaaa gagtaatcac tactgaatcg ttgcctcaga atcatatgga 27120 ggtgctttta aaaaaggcat ttctgcactg ttgttctctg gaatagaagt aattcttatg 27180 tacactgaag tttgaaaatc attgcattta agtgttctgt tcaggaaagt agtgtgcttt 27240 ttaatatttg tgagtgaatg agtaacacaa tacattatat cacattttaa tgtaattcta 27300 cacatgtgca tatgaagaga aaagtaacat ttttttctat ttatgtcttt agttcagcct 27360 ttaagatacc ttgatgaaga cctggactat tgaatgagca agaatctgcc tcttacactg 27420 aagattacaa tacagtcctc tgtctcctgg tattccaaag actgctgttg aatttctaaa 27480 aaatagattg gtgaatgtga ctactcaaag ttgtatgtaa gactttcaag ggcattaaat 27540 aaaaaagaat attgctgatt cttgttcttg attttctgaa tttctgaatc tcttattggg 27600 cttctaattt aaaaaaaaat atctgggcgc ccgcagatat cgaactcttg ggcagtgtga 27660 ccaaacgaag acatatccaa tcaagcatgc aaatggacca gcccactgta ctagcacgct 27720 gtggcagcca atctgaccga gaaagcagac aaccgcaggg agcaacg 27767 <210> 16 <211> 55 <212> DNA <213> Sus scrofa <400> 16 ggtcgccacc atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatc 55 <210> 17 <211> 54 <212> DNA <213> Sus scrofa <400> 17 ggtcgccacc atggccatga gcaagggcga ggagctgttc accggggtgg tgcc 54 <210> 18 <211> 48 <212> DNA <213> Sus scrofa <400> 18 ggtcgccacc atggtgagca agggcgagga gctgttcacc ggggtggt 48 <210> 19 <211> 55 <212> DNA <213> Sus scrofa <400> 19 ggtcgccacc atggttgagc aagggcgagg agctgttcac cggggtggtg cccat 55 <210> 20 <211> 43 <212> DNA <213> Sus scrofa <400> 20 tgcagggaac tacagtgcgg cactgtggtt tccctcctgg ggg 43 <210> 21 <211> 60 <212> DNA <213> Sus scrofa <400> 21 tgcagggaac tacagtgcgg cactgtaaac cactactact gtggtttccc tcctgggggg 60 <210> 22 <211> 41 <212> DNA <213> Sus scrofa <400> 22 tgcagggaac tacagtgcgg ctgtggtttc cctcctgggg g 41 <210> 23 <211> 46 <212> DNA <213> Sus scrofa <400> 23 tgcagggaac tacagtgcgg aactactgtg gtttccctcc tggggg 46 <210> 24 <211> 31 <212> DNA <213> Sus scrofa <400> 24 gaaacccagg ctggttggag gggacattcc c 31 <210> 25 <211> 24 <212> DNA <213> Sus scrofa <400> 25 gaaacccagg ctggggacat tccc 24 <210> 26 <211> 13 <212> DNA <213> Sus scrofa <400> 26 aggggacatt ccc 13 <210> 27 <211> 13 <212> DNA <213> Sus scrofa <400> 27 gaaacccatt ccc 13 <210> 28 <211> 31 <212> DNA <213> Sus scrofa <400> 28 ggtcgccacc atggtgagca agggcgagga g 31 <210> 29 <211> 32 <212> DNA <213> Sus scrofa <400> 29 ggtcgccacc atggctgagc aagggcgagg ag 32 <210> 30 <211> 29 <212> DNA <213> Sus scrofa <400> 30 ggtcgccacc atggtgagag ggcgaggag 29 <210> 31 <211> 32 <212> DNA <213> Sus scrofa <400> 31 ggtcgccacc atggttgagc aagggcgagg ag 32 <210> 32 <211> 48 <212> DNA <213> Sus scrofa <400> 32 ggtcgccacc atggtgagca agggcgagga gaacccaggc tggttgga 48 <210> 33 <211> 49 <212> DNA <213> Sus scrofa <400> 33 tgctgtgcag ggaactacag tgcggcactg tggtttccct cctgggggg 49 <210> 34 <211> 38 <212> DNA <213> Sus scrofa <400> 34 tgctgtgcag ggaactctgt ggtttccctc ctgggggg 38 <210> 35 <211> 22 <212> DNA <213> Sus scrofa <400> 35 ctgtggtttc cctcctgggg gg 22 <210> 36 <211> 23 <212> DNA <213> Sus scrofa <400> 36 actgtggttt ccctcctggg ggg 23 <210> 37 <211> 50 <212> DNA <213> Sus scrofa <400> 37 tgctgtgcag ggaactacag tgcggcaact gtggtttccc tcctgggggg 50 <210> 38 <211> 10 <212> DNA <213> Sus scrofa <400> 38 tcctgggggg 10 <210> 39 <211> 8 <212> DNA <213> Sus scrofa <400> 39 ctgggggg 8 <210> 40 <211> 52 <212> DNA <213> Sus scrofa <400> 40 agagagcaga gccagcgact cgcccagcga catggggtac ctgccgtttg tg 52 <210> 41 <211> 33 <212> DNA <213> Sus scrofa <400> 41 agagagcaga gccagcgact cgcccagcga gat 33 <210> 42 <211> 30 <212> DNA <213> Sus scrofa <400> 42 agagagcaga gccagcgact cgcccagcga 30 <210> 43 <211> 50 <212> DNA <213> Sus scrofa <400> 43 agagccagcc tcgcccagca ggggtaccat ggggtacctg ccgtttgtgt 50 <210> 44 <211> 53 <212> DNA <213> Sus scrofa <400> 44 agagagcaga gccagcgact cgcccagcga gcagtgggta cctgccgttt gtg 53 <210> 45 <211> 53 <212> DNA <213> Sus scrofa <400> 45 agagagcaga gccagcgact cgcccagcga tcagtgggta cctgccgttt gtg 53 <210> 46 <211> 53 <212> DNA <213> Sus scrofa <400> 46 agagagcaga gccagcgact cgcccagcga acatggggta cctgccgttt gtg 53 <210> 47 <211> 4990 <212> DNA <213> Sus scrofa <400> 47 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcggccagcg 3120 tgctgtgcag ggaactacag tgcggcactg tggtttccct cctgggggga gctcactttg 3180 gagaaggaag tggacagatc tgggctgaag aattccagtg tgaggggcac gagtcccacc 3240 tttcactctg cccagtagca ccccgccctg acgggacatg tagccacagc agggacgtcg 3300 gcgtagtctg ctcaagtgag acccagggaa tgtgttcact ttgttcccat gccatgaaga 3360 gggtagggtt aggtagtcac agacatcttt ttaaagccct gtctccttcc aggatacaca 3420 caaatccgct tggtgaatgg caagacccca tgtgaaggaa gagtggagct caacattctt 3480 gggtcctggg ggtccctctg caactctcac tgggacatgg aagatgccca tgttttatgc 3540 cagcagctta aatgtggagt tgccctttct atcccgggag gagcaccttt tgggaaagga 3600 agtgagcagg tctggaggca catgtttcac tgcactggga ctgagaagca catgggagat 3660 tgttccgtca ctgctctggg cgcatcactc tgttcttcag ggcaagtggc ctctgtaatc 3720 tgctcaggta agagaataag ggcagccagt gatgagccac tcatgacggt gccttaagag 3780 tgggtgtacc taggagttcc cattgtggct cagtggtaac aaactcgact ggtatccatg 3840 agggtatggg tttgatccct ggccttgctc aatgggttaa ggatccagca ttgctgtgag 3900 ctgtggtata ggttgcagac tctgctcagg tcccatgttg ctgtgattgt ggtgtaggct 3960 gactgctgca gcttcaattt gacccctagc ccgggaattt ccataggcca cacgtgcagc 4020 actaaggaag gaaaaaaaga aaaaaaaaaa aaaagagtgg gtgtgcctat agtgaagaac 4080 agatgtaaaa gggaagtgaa agggattccc ccattctgag ggattgtgag aagtgtgcca 4140 gaatattaac ttcatttgac ttgttacagg gaaagtaaac ttgactttca cggacctcct 4200 agttacctgg tgcttactat atgtcttctc agagtacctg attcattccc agcctggttg 4260 acccatcccc ctatctctat ggctatgttt atccagagca catctatcta acactccagc 4320 tgatcttcct gacacagctg tggcaaccct ggatccttta accaactgtg ccaggctgga 4380 gatcaaacct aagcctctgc agcaacccaa gctgctgcag tcagattttt aaccccctgt 4440 gccactgtgg gtatctccga tattttgtat cttctgtgac tgagtggttt gctgtttgca 4500 gggaaccaga gtcagacact atccccgtgc aattcatcat cctcggaccc atcaagctct 4560 attatttcag aagaaaatgg tgttgcctgc ataggtgaga atcagtgacc aacctatgaa 4620 aatgatctca atcctctgaa atgcatttta ttcatgtttt atttcctctt tgcagggagt 4680 ggtcaacttc gcctggtcga tggaggtggt cgttgtgctg ggagagtaga ggtctatcat 4740 gagggctcct ggggcaccat ctgtgatgac agctgggacc tgaatgatgc ccatgtggtg 4800 tgcaaacagc tgagctgtgg atgggccatt aatgccactg gttctgctca ttttggggaa 4860 ggaacagggc ccatttggct ggatgagata aactgtaatg gaaaagaatc tcatatttgg 4920 caatgccact cacatggttg ggggcggcac aattgcaggc ataaggagga tgcaggagtc 4980 atctgctcgg 4990 <210> 48 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 48 caccggaaac ccaggctggt tgga 24 <210> 49 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 49 aaactccaac cagcctgggt ttcc 24 <210> 50 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 50 caccggaact acagtgcggc actg 24 <210> 51 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 51 aaaccagtgc cgcactgtag ttcc 24 <210> 52 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 52 caccgcagta gcaccccgcc ctgac 25 <210> 53 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 53 aaacgtcagg gcggggtgct actgc 25 <210> 54 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 54 caccgtgtag ccacagcagg gacgt 25 <210> 55 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 55 aaacacgtcc ctgctgtggc tacac 25 <210> 56 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 56 caccgccagc ctcgcccagc gacat 25 <210> 57 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 57 aaacatgtcg ctgggcgagg ctggc 25 <210> 58 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 58 caccgcagct gcagcatata tttaa 25 <210> 59 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 59 aaacttaaat atatgctgca gctgc 25 <210> 60 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 60 caccgctttc atttatctga actca 25 <210> 61 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 61 aaactgagtt cagataaatg aaagc 25 <210> 62 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 62 caccgttatc tgaactcagg gtccc 25 <210> 63 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 63 aaacgggacc ctgagttcag ataac 25 <210> 64 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 64 caccgctcct cgcccttgct cacca 25 <210> 65 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 65 aaactggtga gcaagggcga ggagc 25 <210> 66 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 66 caccggacca ggatgggcac caccc 25 <210> 67 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 67 aaacgggtgg tgcccatcct ggtcc 25 <210> 68 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 68 ttgttggaag gctcactgtc cttg 24 <210> 69 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 69 acaactaagg tggggcaaag 20 <210> 70 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 70 ttgttggaag gctcactgtc cttg 24 <210> 71 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 71 ggagctcaac attcttgggt cct 23 <210> 72 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 72 ggcaaaattt tcatgctgag gtg 23 <210> 73 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 73 gcacatcact tcgggttaca gtg 23 <210> 74 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 74 cccaagtatc ttcagttctg cag 23 <210> 75 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 75 tacaggtagg agagcctgtt ttg 23 <210> 76 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 76 cccaagtatc ttcagttctg cag 23 <210> 77 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 77 ctcaaaagga tgtaaaccct gga 23 <210> 78 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 78 tgttgatgtg gtttgtttgc cc 22 <210> 79 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 79 tacaggtagg agagcctgtt ttg 23 <210> 80 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 80 ggaggtctag aatcggctaa gcc 23 <210> 81 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 81 ggctacatgt cccgtcaggg 20 <210> 82 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 82 gcaggccact aggcagatga a 21 <210> 83 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 83 gagctgacac ccaagaagtt cct 23 <210> 84 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 84 ggctctagag cctctgctaa cc 22 <210> 85 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 85 ggacttgaag aagtcgtgct gc 22 <210> 86 <211> 44 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 86 taatacgact cactataggg agaatggact ataaggacca cgac 44 <210> 87 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 87 gcgagctcta ggaattctta c 21 <210> 88 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 88 ttaatacgac tcactatagg ctcctcgccc ttgctcacca 40 <210> 89 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 89 aaaagcaccg actcggtgcc 20 <210> 90 <211> 38 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 90 ttaatacgac tcactatagg aaacccaggc tggttgga 38 <210> 91 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 91 aaaagcaccg actcggtgcc 20 <210> 92 <211> 38 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 92 ttaatacgac tcactatagg aactacagtg cggcactg 38 <210> 93 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 93 aaaagcaccg actcggtgcc 20 <210> 94 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 94 ttaatacgac tcactatagg ccagcctcgc ccagcgacat 40 <210> 95 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 95 aaaagcaccg actcggtgcc 20 <210> 96 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 96 ttaatacgac tcactatagg cagctgcagc atatatttaa 40 <210> 97 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 97 aaaagcaccg actcggtgcc 20 <210> 98 <211> 3484 <212> DNA <213> Sus scrofa <400> 98 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggcacattc cctgctctgg tcgtgttgaa gtacaacatg 1560 gagacacgtg gggcaccgtc tgtgattctg acttctctct ggaggcggcc agcgtgctgt 1620 gcagggaact acagtgcggc actgtggttt ccctcctggg gggagctcac tttggagaag 1680 gaagtggaca gatctgggct gaagaattcc agtgtgaggg gcacgagtcc cacctttcac 1740 tctgcccagt agcaccccgc cctgacggga catgtagcca cagcagggac gtcggcgtag 1800 tctgctcaag tgagacccag ggaatgtgtt cactttgttc ccatgccatg aagagggtag 1860 ggttaggtag tcacagacat ctttttaaag ccctgtctcc ttccaggata cacacaaatc 1920 cgcttggtga atggcaagac cccatgtgaa ggaagagtgg agctcaacat tcttgggtcc 1980 tgggggtccc tctgcaactc tcactgggac atggaagatg cccatgtttt atgccagcag 2040 cttaaatgtg gagttgccct ttctatcccg ggaggagcac cttttgggaa aggaagtgag 2100 caggtctgga ggcacatgtt tcactgcact gggactgaga agcacatggg agattgttcc 2160 gtcactgctc tgggcgcatc actctgttct tcagggcaag tggcctctgt aatctgctca 2220 ggtaagagaa taagggcagc cagtgatgag ccactcatga cggtgcctta agagtgggtg 2280 tacctaggag ttcccattgt ggctcagtgg taacaaactc gactggtatc catgagggta 2340 tgggtttgat ccctggcctt gctcaatggg ttaaggatcc agcattgctg tgagctgtgg 2400 tataggttgc agactctgct caggtcccat gttgctgtga ttgtggtgta ggctgactgc 2460 tgcagcttca atttgacccc tagcccggga atttccatag gccacacgtg cagcactaag 2520 gaaggaaaaa aagaaaaaaa aaaaaaaaga gtgggtgtgc ctatagtgaa gaacagatgt 2580 aaaagggaag tgaaagggat tcccccattc tgagggattg tgagaagtgt gccagaatat 2640 taacttcatt tgacttgtta cagggaaagt aaacttgact ttcacggacc tcctagttac 2700 ctggtgctta ctatatgtct tctcagagta cctgattcat tcccagcctg gttgacccat 2760 ccccctatct ctatggctat gtttatccag agcacatcta tctaacactc cagctgatct 2820 tcctgacaca gctgtggcaa ccctggatcc tttaaccaac tgtgccaggc tggagatcaa 2880 acctaagcct ctgcagcaac ccaagctgct gcagtcagat ttttaacccc ctgtgccact 2940 gtgggtatct ccgatatttt gtatcttctg tgactgagtg gtttgctgtt tgcagggaac 3000 cagagtcaga cactatcccc gtgcaattca tcatcctcgg acccatcaag ctctattatt 3060 tcagaagaaa atggtgttgc ctgcataggt gagaatcagt gaccaaccta tgaaaatgat 3120 ctcaatcctc tgaaatgcat tttattcatg ttttatttcc tctttgcagg gagtggtcaa 3180 cttcgcctgg tcgatggagg tggtcgttgt gctgggagag tagaggtcta tcatgagggc 3240 tcctggggca ccatctgtga tgacagctgg gacctgaatg atgcccatgt ggtgtgcaaa 3300 cagctgagct gtggatgggc cattaatgcc actggttctg ctcattttgg ggaaggaaca 3360 gggcccattt ggctggatga gataaactgt aatggaaaag aatctcatat ttggcaatgc 3420 cactcacatg gttgggggcg gcacaattgc aggcataagg aggatgcagg agtcatctgc 3480 tcgg 3484 <210> 99 <211> 4997 <212> DNA <213> Sus scrofa <400> 99 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcggccagcg 3120 tgctgtgcag ggaactacag tgcggctact actactgtgg tttccctcct ggggggagct 3180 cactttggag aaggaagtgg acagatctgg gctgaagaat tccagtgtga ggggcacgag 3240 tcccaccttt cactctgccc agtagcaccc cgccctgacg ggacatgtag ccacagcagg 3300 gacgtcggcg tagtctgctc aagtgagacc cagggaatgt gttcactttg ttcccatgcc 3360 atgaagaggg tagggttagg tagtcacaga catcttttta aagccctgtc tccttccagg 3420 atacacacaa atccgcttgg tgaatggcaa gaccccatgt gaaggaagag tggagctcaa 3480 cattcttggg tcctgggggt ccctctgcaa ctctcactgg gacatggaag atgcccatgt 3540 tttatgccag cagcttaaat gtggagttgc cctttctatc ccgggaggag caccttttgg 3600 gaaaggaagt gagcaggtct ggaggcacat gtttcactgc actgggactg agaagcacat 3660 gggagattgt tccgtcactg ctctgggcgc atcactctgt tcttcagggc aagtggcctc 3720 tgtaatctgc tcaggtaaga gaataagggc agccagtgat gagccactca tgacggtgcc 3780 ttaagagtgg gtgtacctag gagttcccat tgtggctcag tggtaacaaa ctcgactggt 3840 atccatgagg gtatgggttt gatccctggc cttgctcaat gggttaagga tccagcattg 3900 ctgtgagctg tggtataggt tgcagactct gctcaggtcc catgttgctg tgattgtggt 3960 gtaggctgac tgctgcagct tcaatttgac ccctagcccg ggaatttcca taggccacac 4020 gtgcagcact aaggaaggaa aaaaagaaaa aaaaaaaaaa agagtgggtg tgcctatagt 4080 gaagaacaga tgtaaaaggg aagtgaaagg gattccccca ttctgaggga ttgtgagaag 4140 tgtgccagaa tattaacttc atttgacttg ttacagggaa agtaaacttg actttcacgg 4200 acctcctagt tacctggtgc ttactatatg tcttctcaga gtacctgatt cattcccagc 4260 ctggttgacc catcccccta tctctatggc tatgtttatc cagagcacat ctatctaaca 4320 ctccagctga tcttcctgac acagctgtgg caaccctgga tcctttaacc aactgtgcca 4380 ggctggagat caaacctaag cctctgcagc aacccaagct gctgcagtca gatttttaac 4440 cccctgtgcc actgtgggta tctccgatat tttgtatctt ctgtgactga gtggtttgct 4500 gtttgcaggg aaccagagtc agacactatc cccgtgcaat tcatcatcct cggacccatc 4560 aagctctatt atttcagaag aaaatggtgt tgcctgcata ggtgagaatc agtgaccaac 4620 ctatgaaaat gatctcaatc ctctgaaatg cattttattc atgttttatt tcctctttgc 4680 agggagtggt caacttcgcc tggtcgatgg aggtggtcgt tgtgctggga gagtagaggt 4740 ctatcatgag ggctcctggg gcaccatctg tgatgacagc tgggacctga atgatgccca 4800 tgtggtgtgc aaacagctga gctgtggatg ggccattaat gccactggtt ctgctcattt 4860 tggggaagga acagggccca tttggctgga tgagataaac tgtaatggaa aagaatctca 4920 tatttggcaa tgccactcac atggttgggg gcggcacaat tgcaggcata aggaggatgc 4980 aggagtcatc tgctcgg 4997 <210> 100 <211> 3710 <212> DNA <213> Sus scrofa <400> 100 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaagggaa 2820 agggattccc ccattctgag ggattgtgag aagtgtgcca gaatattaac ttcatttgac 2880 ttgttacagg gaaagtaaac ttgactttca cggacctcct agttacctgg tgcttactat 2940 atgtcttctc agagtacctg attcattccc agcctggttg acccatcccc ctatctctat 3000 ggctatgttt atccagagca catctatcta acactccagc tgatcttcct gacacagctg 3060 tggcaaccct ggatccttta accaactgtg ccaggctgga gatcaaacct aagcctctgc 3120 agcaacccaa gctgctgcag tcagattttt aaccccctgt gccactgtgg gtatctccga 3180 tattttgtat cttctgtgac tgagtggttt gctgtttgca gggaaccaga gtcagacact 3240 atccccgtgc aattcatcat cctcggaccc atcaagctct attatttcag aagaaaatgg 3300 tgttgcctgc ataggtgaga atcagtgacc aacctatgaa aatgatctca atcctctgaa 3360 atgcatttta ttcatgtttt atttcctctt tgcagggagt ggtcaacttc gcctggtcga 3420 tggaggtggt cgttgtgctg ggagagtaga ggtctatcat gagggctcct ggggcaccat 3480 ctgtgatgac agctgggacc tgaatgatgc ccatgtggtg tgcaaacagc tgagctgtgg 3540 atgggccatt aatgccactg gttctgctca ttttggggaa ggaacagggc ccatttggct 3600 ggatgagata aactgtaatg gaaaagaatc tcatatttgg caatgccact cacatggttg 3660 ggggcggcac aattgcaggc ataaggagga tgcaggagtc atctgctcgg 3710 <210> 101 <211> 3617 <212> DNA <213> Sus scrofa <400> 101 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gattgaaagg gattccccca ttctgaggga ttgtgagaag 2760 tgtgccagaa tattaacttc atttgacttg ttacagggaa agtaaacttg actttcacgg 2820 acctcctagt tacctggtgc ttactatatg tcttctcaga gtacctgatt cattcccagc 2880 ctggttgacc catcccccta tctctatggc tatgtttatc cagagcacat ctatctaaca 2940 ctccagctga tcttcctgac acagctgtgg caaccctgga tcctttaacc aactgtgcca 3000 ggctggagat caaacctaag cctctgcagc aacccaagct gctgcagtca gatttttaac 3060 cccctgtgcc actgtgggta tctccgatat tttgtatctt ctgtgactga gtggtttgct 3120 gtttgcaggg aaccagagtc agacactatc cccgtgcaat tcatcatcct cggacccatc 3180 aagctctatt atttcagaag aaaatggtgt tgcctgcata ggtgagaatc agtgaccaac 3240 ctatgaaaat gatctcaatc ctctgaaatg cattttattc atgttttatt tcctctttgc 3300 agggagtggt caacttcgcc tggtcgatgg aggtggtcgt tgtgctggga gagtagaggt 3360 ctatcatgag ggctcctggg gcaccatctg tgatgacagc tgggacctga atgatgccca 3420 tgtggtgtgc aaacagctga gctgtggatg ggccattaat gccactggtt ctgctcattt 3480 tggggaagga acagggccca tttggctgga tgagataaac tgtaatggaa aagaatctca 3540 tatttggcaa tgccactcac atggttgggg gcggcacaat tgcaggcata aggaggatgc 3600 aggagtcatc tgctcgg 3617 <210> 102 <211> 4979 <212> DNA <213> Sus scrofa <400> 102 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcggccagcg 3120 tgctgtgcag ggaactctgt ggtttccctc ctggggggag ctcactttgg agaaggaagt 3180 ggacagatct gggctgaaga attccagtgt gaggggcacg agtcccacct ttcactctgc 3240 ccagtagcac cccgccctga cgggacatgt agccacagca gggacgtcgg cgtagtctgc 3300 tcaagtgaga cccagggaat gtgttcactt tgttcccatg ccatgaagag ggtagggtta 3360 ggtagtcaca gacatctttt taaagccctg tctccttcca ggatacacac aaatccgctt 3420 ggtgaatggc aagaccccat gtgaaggaag agtggagctc aacattcttg ggtcctgggg 3480 gtccctctgc aactctcact gggacatgga agatgcccat gttttatgcc agcagcttaa 3540 atgtggagtt gccctttcta tcccgggagg agcacctttt gggaaaggaa gtgagcaggt 3600 ctggaggcac atgtttcact gcactgggac tgagaagcac atgggagatt gttccgtcac 3660 tgctctgggc gcatcactct gttcttcagg gcaagtggcc tctgtaatct gctcaggtaa 3720 gagaataagg gcagccagtg atgagccact catgacggtg ccttaagagt gggtgtacct 3780 aggagttccc attgtggctc agtggtaaca aactcgactg gtatccatga gggtatgggt 3840 ttgatccctg gccttgctca atgggttaag gatccagcat tgctgtgagc tgtggtatag 3900 gttgcagact ctgctcaggt cccatgttgc tgtgattgtg gtgtaggctg actgctgcag 3960 cttcaatttg acccctagcc cgggaatttc cataggccac acgtgcagca ctaaggaagg 4020 aaaaaaagaa aaaaaaaaaa aaagagtggg tgtgcctata gtgaagaaca gatgtaaaag 4080 ggaagtgaaa gggattcccc cattctgagg gattgtgaga agtgtgccag aatattaact 4140 tcatttgact tgttacaggg aaagtaaact tgactttcac ggacctccta gttacctggt 4200 gcttactata tgtcttctca gagtacctga ttcattccca gcctggttga cccatccccc 4260 tatctctatg gctatgttta tccagagcac atctatctaa cactccagct gatcttcctg 4320 acacagctgt ggcaaccctg gatcctttaa ccaactgtgc caggctggag atcaaaccta 4380 agcctctgca gcaacccaag ctgctgcagt cagattttta accccctgtg ccactgtggg 4440 tatctccgat attttgtatc ttctgtgact gagtggtttg ctgtttgcag ggaaccagag 4500 tcagacacta tccccgtgca attcatcatc ctcggaccca tcaagctcta ttatttcaga 4560 agaaaatggt gttgcctgca taggtgagaa tcagtgacca acctatgaaa atgatctcaa 4620 tcctctgaaa tgcattttat tcatgtttta tttcctcttt gcagggagtg gtcaacttcg 4680 cctggtcgat ggaggtggtc gttgtgctgg gagagtagag gtctatcatg agggctcctg 4740 gggcaccatc tgtgatgaca gctgggacct gaatgatgcc catgtggtgt gcaaacagct 4800 gagctgtgga tgggccatta atgccactgg ttctgctcat tttggggaag gaacagggcc 4860 catttggctg gatgagataa actgtaatgg aaaagaatct catatttggc aatgccactc 4920 acatggttgg gggcggcaca attgcaggca taaggaggat gcaggagtca tctgctcgg 4979 <210> 103 <211> 4615 <212> DNA <213> Sus scrofa <400> 103 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aagaaggaaa 2580 atattggaat catattctcc ctcaccgaaa tgctattttt cagcccacag gaaacccagg 2640 ctggttggag gggacattcc ctgctctggt cgtgttgaag tacaacatgg agacacgtgg 2700 ggcaccgtct gtgattctga cttctctctg gaggcggcca gcgtgctgtg cagggaacta 2760 cagtgcggca cagtgtggtt tccctcctgg ggggagctca ctttggagaa ggaagtggac 2820 agatctgggc tgaagaattc cagtgtgagg ggcacgagtc ccacctttca ctctgcccag 2880 tagcaccccg ccctgacggg acatgtagcc acagcaggga cgtcggcgta gtctgctcaa 2940 gtgagaccca gggaatgtgt tcactttgtt cccatgccat gaagagggta gggttaggta 3000 gtcacagaca tctttttaaa gccctgtctc cttccaggat acacacaaat ccgcttggtg 3060 aatggcaaga ccccatgtga aggaagagtg gagctcaaca ttcttgggtc ctgggggtcc 3120 ctctgcaact ctcactggga catggaagat gcccatgttt tatgccagca gcttaaatgt 3180 ggagttgccc tttctatccc gggaggagca ccttttggga aaggaagtga gcaggtctgg 3240 aggcacatgt ttcactgcac tgggactgag aagcacatgg gagattgttc cgtcactgct 3300 ctgggcgcat cactctgttc ttcagggcaa gtggcctctg taatctgctc aggtaagaga 3360 ataagggcag ccagtgatga gccactcatg acggtgcctt aagagtgggt gtacctagga 3420 gttcccattg tggctcagtg gtaacaaact cgactggtat ccatgagggt atgggtttga 3480 tccctggcct tgctcaatgg gttaaggatc cagcattgct gtgagctgtg gtataggttg 3540 cagactctgc tcaggtccca tgttgctgtg attgtggtgt aggctgactg ctgcagcttc 3600 aatttgaccc ctagcccggg aatttccata ggccacacgt gcagcactaa ggaaggaaaa 3660 aaagaaaaaa aaaaaaaaag agtgggtgtg cctatagtga agaacagatg taaaagggaa 3720 gtgaaaggga ttcccccatt ctgagggatt gtgagaagtg tgccagaata ttaacttcat 3780 ttgacttgtt acagggaaag taaacttgac tttcacggac ctcctagtta cctggtgctt 3840 actatatgtc ttctcagagt acctgattca ttcccagcct ggttgaccca tccccctatc 3900 tctatggcta tgtttatcca gagcacatct atctaacact ccagctgatc ttcctgacac 3960 agctgtggca accctggatc ctttaaccaa ctgtgccagg ctggagatca aacctaagcc 4020 tctgcagcaa cccaagctgc tgcagtcaga tttttaaccc cctgtgccac tgtgggtatc 4080 tccgatattt tgtatcttct gtgactgagt ggtttgctgt ttgcagggaa ccagagtcag 4140 acactatccc cgtgcaattc atcatcctcg gacccatcaa gctctattat ttcagaagaa 4200 aatggtgttg cctgcatagg tgagaatcag tgaccaacct atgaaaatga tctcaatcct 4260 ctgaaatgca ttttattcat gttttatttc ctctttgcag ggagtggtca acttcgcctg 4320 gtcgatggag gtggtcgttg tgctgggaga gtagaggtct atcatgaggg ctcctggggc 4380 accatctgtg atgacagctg ggacctgaat gatgcccatg tggtgtgcaa acagctgagc 4440 tgtggatggg ccattaatgc cactggttct gctcattttg gggaaggaac agggcccatt 4500 tggctggatg agataaactg taatggaaaa gaatctcata tttggcaatg ccactcacat 4560 ggttgggggc ggcacaattg caggcataag gaggatgcag gagtcatctg ctcgg 4615 <210> 104 <211> 4866 <212> DNA <213> Sus scrofa <400> 104 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttctgtggt ttccctcctg gggggagctc actttggaga 3060 aggaagtgga cagatctggg ctgaagaatt ccagtgtgag gggcacgagt cccacctttc 3120 actctgccca gtagcacccc gccctgacgg gacatgtagc cacagcaggg acgtcggcgt 3180 agtctgctca agtgagaccc agggaatgtg ttcactttgt tcccatgcca tgaagagggt 3240 agggttaggt agtcacagac atctttttaa agccctgtct ccttccagga tacacacaaa 3300 tccgcttggt gaatggcaag accccatgtg aaggaagagt ggagctcaac attcttgggt 3360 cctgggggtc cctctgcaac tctcactggg acatggaaga tgcccatgtt ttatgccagc 3420 agcttaaatg tggagttgcc ctttctatcc cgggaggagc accttttggg aaaggaagtg 3480 agcaggtctg gaggcacatg tttcactgca ctgggactga gaagcacatg ggagattgtt 3540 ccgtcactgc tctgggcgca tcactctgtt cttcagggca agtggcctct gtaatctgct 3600 caggtaagag aataagggca gccagtgatg agccactcat gacggtgcct taagagtggg 3660 tgtacctagg agttcccatt gtggctcagt ggtaacaaac tcgactggta tccatgaggg 3720 tatgggtttg atccctggcc ttgctcaatg ggttaaggat ccagcattgc tgtgagctgt 3780 ggtataggtt gcagactctg ctcaggtccc atgttgctgt gattgtggtg taggctgact 3840 gctgcagctt caatttgacc cctagcccgg gaatttccat aggccacacg tgcagcacta 3900 aggaaggaaa aaaagaaaaa aaaaaaaaaa gagtgggtgt gcctatagtg aagaacagat 3960 gtaaaaggga agtgaaaggg attcccccat tctgagggat tgtgagaagt gtgccagaat 4020 attaacttca tttgacttgt tacagggaaa gtaaacttga ctttcacgga cctcctagtt 4080 acctggtgct tactatatgt cttctcagag tacctgattc attcccagcc tggttgaccc 4140 atccccctat ctctatggct atgtttatcc agagcacatc tatctaacac tccagctgat 4200 cttcctgaca cagctgtggc aaccctggat cctttaacca actgtgccag gctggagatc 4260 aaacctaagc ctctgcagca acccaagctg ctgcagtcag atttttaacc ccctgtgcca 4320 ctgtgggtat ctccgatatt ttgtatcttc tgtgactgag tggtttgctg tttgcaggga 4380 accagagtca gacactatcc ccgtgcaatt catcatcctc ggacccatca agctctatta 4440 tttcagaaga aaatggtgtt gcctgcatag gtgagaatca gtgaccaacc tatgaaaatg 4500 atctcaatcc tctgaaatgc attttattca tgttttattt cctctttgca gggagtggtc 4560 aacttcgcct ggtcgatgga ggtggtcgtt gtgctgggag agtagaggtc tatcatgagg 4620 gctcctgggg caccatctgt gatgacagct gggacctgaa tgatgcccat gtggtgtgca 4680 aacagctgag ctgtggatgg gccattaatg ccactggttc tgctcatttt ggggaaggaa 4740 cagggcccat ttggctggat gagataaact gtaatggaaa agaatctcat atttggcaat 4800 gccactcaca tggttggggg cggcacaatt gcaggcataa ggaggatgca ggagtcatct 4860 gctcgg 4866 <210> 105 <211> 4867 <212> DNA <213> Sus scrofa <400> 105 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttactgtgg tttccctcct ggggggagct cactttggag 3060 aaggaagtgg acagatctgg gctgaagaat tccagtgtga ggggcacgag tcccaccttt 3120 cactctgccc agtagcaccc cgccctgacg ggacatgtag ccacagcagg gacgtcggcg 3180 tagtctgctc aagtgagacc cagggaatgt gttcactttg ttcccatgcc atgaagaggg 3240 tagggttagg tagtcacaga catcttttta aagccctgtc tccttccagg atacacacaa 3300 atccgcttgg tgaatggcaa gaccccatgt gaaggaagag tggagctcaa cattcttggg 3360 tcctgggggt ccctctgcaa ctctcactgg gacatggaag atgcccatgt tttatgccag 3420 cagcttaaat gtggagttgc cctttctatc ccgggaggag caccttttgg gaaaggaagt 3480 gagcaggtct ggaggcacat gtttcactgc actgggactg agaagcacat gggagattgt 3540 tccgtcactg ctctgggcgc atcactctgt tcttcagggc aagtggcctc tgtaatctgc 3600 tcaggtaaga gaataagggc agccagtgat gagccactca tgacggtgcc ttaagagtgg 3660 gtgtacctag gagttcccat tgtggctcag tggtaacaaa ctcgactggt atccatgagg 3720 gtatgggttt gatccctggc cttgctcaat gggttaagga tccagcattg ctgtgagctg 3780 tggtataggt tgcagactct gctcaggtcc catgttgctg tgattgtggt gtaggctgac 3840 tgctgcagct tcaatttgac ccctagcccg ggaatttcca taggccacac gtgcagcact 3900 aaggaaggaa aaaaagaaaa aaaaaaaaaa agagtgggtg tgcctatagt gaagaacaga 3960 tgtaaaaggg aagtgaaagg gattccccca ttctgaggga ttgtgagaag tgtgccagaa 4020 tattaacttc atttgacttg ttacagggaa agtaaacttg actttcacgg acctcctagt 4080 tacctggtgc ttactatatg tcttctcaga gtacctgatt cattcccagc ctggttgacc 4140 catcccccta tctctatggc tatgtttatc cagagcacat ctatctaaca ctccagctga 4200 tcttcctgac acagctgtgg caaccctgga tcctttaacc aactgtgcca ggctggagat 4260 caaacctaag cctctgcagc aacccaagct gctgcagtca gatttttaac cccctgtgcc 4320 actgtgggta tctccgatat tttgtatctt ctgtgactga gtggtttgct gtttgcaggg 4380 aaccagagtc agacactatc cccgtgcaat tcatcatcct cggacccatc aagctctatt 4440 atttcagaag aaaatggtgt tgcctgcata ggtgagaatc agtgaccaac ctatgaaaat 4500 gatctcaatc ctctgaaatg cattttattc atgttttatt tcctctttgc agggagtggt 4560 caacttcgcc tggtcgatgg aggtggtcgt tgtgctggga gagtagaggt ctatcatgag 4620 ggctcctggg gcaccatctg tgatgacagc tgggacctga atgatgccca tgtggtgtgc 4680 aaacagctga gctgtggatg ggccattaat gccactggtt ctgctcattt tggggaagga 4740 acagggccca tttggctgga tgagataaac tgtaatggaa aagaatctca tatttggcaa 4800 tgccactcac atggttgggg gcggcacaat tgcaggcata aggaggatgc aggagtcatc 4860 tgctcgg 4867 <210> 106 <211> 4991 <212> DNA <213> Sus scrofa <400> 106 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcggccagcg 3120 tgctgtgcag ggaactacag tgcggcaact gtggtttccc tcctgggggg agctcacttt 3180 ggagaaggaa gtggacagat ctgggctgaa gaattccagt gtgaggggca cgagtcccac 3240 ctttcactct gcccagtagc accccgccct gacgggacat gtagccacag cagggacgtc 3300 ggcgtagtct gctcaagtga gacccaggga atgtgttcac tttgttccca tgccatgaag 3360 agggtagggt taggtagtca cagacatctt tttaaagccc tgtctccttc caggatacac 3420 acaaatccgc ttggtgaatg gcaagacccc atgtgaagga agagtggagc tcaacattct 3480 tgggtcctgg gggtccctct gcaactctca ctgggacatg gaagatgccc atgttttatg 3540 ccagcagctt aaatgtggag ttgccctttc tatcccggga ggagcacctt ttgggaaagg 3600 aagtgagcag gtctggaggc acatgtttca ctgcactggg actgagaagc acatgggaga 3660 ttgttccgtc actgctctgg gcgcatcact ctgttcttca gggcaagtgg cctctgtaat 3720 ctgctcaggt aagagaataa gggcagccag tgatgagcca ctcatgacgg tgccttaaga 3780 gtgggtgtac ctaggagttc ccattgtggc tcagtggtaa caaactcgac tggtatccat 3840 gagggtatgg gtttgatccc tggccttgct caatgggtta aggatccagc attgctgtga 3900 gctgtggtat aggttgcaga ctctgctcag gtcccatgtt gctgtgattg tggtgtaggc 3960 tgactgctgc agcttcaatt tgacccctag cccgggaatt tccataggcc acacgtgcag 4020 cactaaggaa ggaaaaaaag aaaaaaaaaa aaaaagagtg ggtgtgccta tagtgaagaa 4080 cagatgtaaa agggaagtga aagggattcc cccattctga gggattgtga gaagtgtgcc 4140 agaatattaa cttcatttga cttgttacag ggaaagtaaa cttgactttc acggacctcc 4200 tagttacctg gtgcttacta tatgtcttct cagagtacct gattcattcc cagcctggtt 4260 gacccatccc cctatctcta tggctatgtt tatccagagc acatctatct aacactccag 4320 ctgatcttcc tgacacagct gtggcaaccc tggatccttt aaccaactgt gccaggctgg 4380 agatcaaacc taagcctctg cagcaaccca agctgctgca gtcagatttt taaccccctg 4440 tgccactgtg ggtatctccg atattttgta tcttctgtga ctgagtggtt tgctgtttgc 4500 agggaaccag agtcagacac tatccccgtg caattcatca tcctcggacc catcaagctc 4560 tattatttca gaagaaaatg gtgttgcctg cataggtgag aatcagtgac caacctatga 4620 aaatgatctc aatcctctga aatgcatttt attcatgttt tatttcctct ttgcagggag 4680 tggtcaactt cgcctggtcg atggaggtgg tcgttgtgct gggagagtag aggtctatca 4740 tgagggctcc tggggcacca tctgtgatga cagctgggac ctgaatgatg cccatgtggt 4800 gtgcaaacag ctgagctgtg gatgggccat taatgccact ggttctgctc attttgggga 4860 aggaacaggg cccatttggc tggatgagat aaactgtaat ggaaaagaat ctcatatttg 4920 gcaatgccac tcacatggtt gggggcggca caattgcagg cataaggagg atgcaggagt 4980 catctgctcg g 4991 <210> 107 <211> 4860 <212> DNA <213> Sus scrofa <400> 107 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggt cctgggggga gctcactttg gagaaggaag 3060 tggacagatc tgggctgaag aattccagtg tgaggggcac gagtcccacc tttcactctg 3120 cccagtagca ccccgccctg acgggacatg tagccacagc agggacgtcg gcgtagtctg 3180 ctcaagtgag acccagggaa tgtgttcact ttgttcccat gccatgaaga gggtagggtt 3240 aggtagtcac agacatcttt ttaaagccct gtctccttcc aggatacaca caaatccgct 3300 tggtgaatgg caagacccca tgtgaaggaa gagtggagct caacattctt gggtcctggg 3360 ggtccctctg caactctcac tgggacatgg aagatgccca tgttttatgc cagcagctta 3420 aatgtggagt tgccctttct atcccgggag gagcaccttt tgggaaagga agtgagcagg 3480 tctggaggca catgtttcac tgcactggga ctgagaagca catgggagat tgttccgtca 3540 ctgctctggg cgcatcactc tgttcttcag ggcaagtggc ctctgtaatc tgctcaggta 3600 agagaataag ggcagccagt gatgagccac tcatgacggt gccttaagag tgggtgtacc 3660 taggagttcc cattgtggct cagtggtaac aaactcgact ggtatccatg agggtatggg 3720 tttgatccct ggccttgctc aatgggttaa ggatccagca ttgctgtgag ctgtggtata 3780 ggttgcagac tctgctcagg tcccatgttg ctgtgattgt ggtgtaggct gactgctgca 3840 gcttcaattt gacccctagc ccgggaattt ccataggcca cacgtgcagc actaaggaag 3900 gaaaaaaaga aaaaaaaaaa aaaagagtgg gtgtgcctat agtgaagaac agatgtaaaa 3960 gggaagtgaa agggattccc ccattctgag ggattgtgag aagtgtgcca gaatattaac 4020 ttcatttgac ttgttacagg gaaagtaaac ttgactttca cggacctcct agttacctgg 4080 tgcttactat atgtcttctc agagtacctg attcattccc agcctggttg acccatcccc 4140 ctatctctat ggctatgttt atccagagca catctatcta acactccagc tgatcttcct 4200 gacacagctg tggcaaccct ggatccttta accaactgtg ccaggctgga gatcaaacct 4260 aagcctctgc agcaacccaa gctgctgcag tcagattttt aaccccctgt gccactgtgg 4320 gtatctccga tattttgtat cttctgtgac tgagtggttt gctgtttgca gggaaccaga 4380 gtcagacact atccccgtgc aattcatcat cctcggaccc atcaagctct attatttcag 4440 aagaaaatgg tgttgcctgc ataggtgaga atcagtgacc aacctatgaa aatgatctca 4500 atcctctgaa atgcatttta ttcatgtttt atttcctctt tgcagggagt ggtcaacttc 4560 gcctggtcga tggaggtggt cgttgtgctg ggagagtaga ggtctatcat gagggctcct 4620 ggggcaccat ctgtgatgac agctgggacc tgaatgatgc ccatgtggtg tgcaaacagc 4680 tgagctgtgg atgggccatt aatgccactg gttctgctca ttttggggaa ggaacagggc 4740 ccatttggct ggatgagata aactgtaatg gaaaagaatc tcatatttgg caatgccact 4800 cacatggttg ggggcggcac aattgcaggc ataaggagga tgcaggagtc atctgctcgg 4860 <210> 108 <211> 4858 <212> DNA <213> Sus scrofa <400> 108 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggc tggggggagc tcactttgga gaaggaagtg 3060 gacagatctg ggctgaagaa ttccagtgtg aggggcacga gtcccacctt tcactctgcc 3120 cagtagcacc ccgccctgac gggacatgta gccacagcag ggacgtcggc gtagtctgct 3180 caagtgagac ccagggaatg tgttcacttt gttcccatgc catgaagagg gtagggttag 3240 gtagtcacag acatcttttt aaagccctgt ctccttccag gatacacaca aatccgcttg 3300 gtgaatggca agaccccatg tgaaggaaga gtggagctca acattcttgg gtcctggggg 3360 tccctctgca actctcactg ggacatggaa gatgcccatg ttttatgcca gcagcttaaa 3420 tgtggagttg ccctttctat cccgggagga gcaccttttg ggaaaggaag tgagcaggtc 3480 tggaggcaca tgtttcactg cactgggact gagaagcaca tgggagattg ttccgtcact 3540 gctctgggcg catcactctg ttcttcaggg caagtggcct ctgtaatctg ctcaggtaag 3600 agaataaggg cagccagtga tgagccactc atgacggtgc cttaagagtg ggtgtaccta 3660 ggagttccca ttgtggctca gtggtaacaa actcgactgg tatccatgag ggtatgggtt 3720 tgatccctgg ccttgctcaa tgggttaagg atccagcatt gctgtgagct gtggtatagg 3780 ttgcagactc tgctcaggtc ccatgttgct gtgattgtgg tgtaggctga ctgctgcagc 3840 ttcaatttga cccctagccc gggaatttcc ataggccaca cgtgcagcac taaggaagga 3900 aaaaaagaaa aaaaaaaaaa aagagtgggt gtgcctatag tgaagaacag atgtaaaagg 3960 gaagtgaaag ggattccccc attctgaggg attgtgagaa gtgtgccaga atattaactt 4020 catttgactt gttacaggga aagtaaactt gactttcacg gacctcctag ttacctggtg 4080 cttactatat gtcttctcag agtacctgat tcattcccag cctggttgac ccatccccct 4140 atctctatgg ctatgtttat ccagagcaca tctatctaac actccagctg atcttcctga 4200 cacagctgtg gcaaccctgg atcctttaac caactgtgcc aggctggaga tcaaacctaa 4260 gcctctgcag caacccaagc tgctgcagtc agatttttaa ccccctgtgc cactgtgggt 4320 atctccgata ttttgtatct tctgtgactg agtggtttgc tgtttgcagg gaaccagagt 4380 cagacactat ccccgtgcaa ttcatcatcc tcggacccat caagctctat tatttcagaa 4440 gaaaatggtg ttgcctgcat aggtgagaat cagtgaccaa cctatgaaaa tgatctcaat 4500 cctctgaaat gcattttatt catgttttat ttcctctttg cagggagtgg tcaacttcgc 4560 ctggtcgatg gaggtggtcg ttgtgctggg agagtagagg tctatcatga gggctcctgg 4620 ggcaccatct gtgatgacag ctgggacctg aatgatgccc atgtggtgtg caaacagctg 4680 agctgtggat gggccattaa tgccactggt tctgctcatt ttggggaagg aacagggccc 4740 atttggctgg atgagataaa ctgtaatgga aaagaatctc atatttggca atgccactca 4800 catggttggg ggcggcacaa ttgcaggcat aaggaggatg caggagtcat ctgctcgg 4858 <210> 109 <211> 3523 <212> DNA <213> Sus scrofa <400> 109 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gagctgtggt ataggttgca gactctgctc 2460 aggtcccatg ttgctgtgat tgtggtgtag gctgactgct gcagcttcaa tttgacccct 2520 agcccgggaa tttccatagg ccacacgtgc agcactaagg aaggaaaaaa agaaaaaaaa 2580 aaaaaaagag tgggtgtgcc tatagtgaag aacagatgta aaagggaagt gaaagggatt 2640 cccccattct gagggattgt gagaagtgtg ccagaatatt aacttcattt gacttgttac 2700 agggaaagta aacttgactt tcacggacct cctagttacc tggtgcttac tatatgtctt 2760 ctcagagtac ctgattcatt cccagcctgg ttgacccatc cccctatctc tatggctatg 2820 tttatccaga gcacatctat ctaacactcc agctgatctt cctgacacag ctgtggcaac 2880 cctggatcct ttaaccaact gtgccaggct ggagatcaaa cctaagcctc tgcagcaacc 2940 caagctgctg cagtcagatt tttaaccccc tgtgccactg tgggtatctc cgatattttg 3000 tatcttctgt gactgagtgg tttgctgttt gcagggaacc agagtcagac actatccccg 3060 tgcaattcat catcctcgga cccatcaagc tctattattt cagaagaaaa tggtgttgcc 3120 tgcataggtg agaatcagtg accaacctat gaaaatgatc tcaatcctct gaaatgcatt 3180 ttattcatgt tttatttcct ctttgcaggg agtggtcaac ttcgcctggt cgatggaggt 3240 ggtcgttgtg ctgggagagt agaggtctat catgagggct cctggggcac catctgtgat 3300 gacagctggg acctgaatga tgcccatgtg gtgtgcaaac agctgagctg tggatgggcc 3360 attaatgcca ctggttctgc tcattttggg gaaggaacag ggcccatttg gctggatgag 3420 ataaactgta atggaaaaga atctcatatt tggcaatgcc actcacatgg ttgggggcgg 3480 cacaattgca ggcataagga ggatgcagga gtcatctgct cgg 3523 <210> 110 <211> 3603 <212> DNA <213> Sus scrofa <400> 110 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgttgt ggagaattcc acaagaattc gtgttatttg acagcagtca tctttaaaag 540 gcatttgaga aagtccaatt tcaaatgcat ttcctttctt taaaagataa attgaagaaa 600 ataagtcttt atttcccaag taaattgaat tgcctctcag tctgttaaaa gaaactctta 660 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 720 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 780 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 840 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 900 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 960 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 1020 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 1080 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 1140 gagatgttgt ggagaattcc acaagaattc gtgttatttg acagcagtca tctttaaaag 1200 gcatttgaga aagtccaatt tcaaatgcat ttcctttctt taaaagataa attgaagaaa 1260 ataagtcttt atttcccaag taaattgaat tgcctctcag tctgttaaaa gaaactctta 1320 ccttgatgat tgcgctctta acctggcaaa gattgtcttt aaaatctgag ctccatgtct 1380 tctgctttat ttctggtgtg cctttgactc cagattacag taaatggagg actgagtata 1440 gggctaaaaa gtagagagaa tggatgcata ttatctgtgg tctccaatgt gatgaatgaa 1500 gtaggcaaat actcaaagga aagagaaagc atgctccaag aattatgggt tccagaaggc 1560 aaagtcccag aattgtctcc agggaaggac agggaggtct agaatcggct aagcccactg 1620 taggcagaaa aaccaagagg catgaatggc ttccctttct cacttttcac tctctggctt 1680 actcctatca tgaaggaaaa tattggaatc atattctccc tcaccgaaat gctatttttc 1740 agcccacagg aaacccaggc tggttggagg ggacattccc tgctctcact ttggagaagg 1800 aagtggacag atctgggctg aagaattcca gtgtgagggg cacgagtccc acctttcact 1860 ctgcccagta gcaccccgcc ctgacgggac atgtagccac agcagggacg tcggcgtagt 1920 ctgctcaagt gagacccagg gaatgtgttc actttgttcc catgccatga agagggtagg 1980 gttaggtagt cacagacatc tttttaaagc cctgtctcct tccaggatac acacaaatcc 2040 gcttggtgaa tggcaagacc ccatgtgaag gaagagtgga gctcaacatt cttgggtcct 2100 gggggtccct ctgcaactct cactgggaca tggaagatgc ccatgtttta tgccagcagc 2160 ttaaatgtgg agttgccctt tctatcccgg gaggagcacc ttttgggaaa ggaagtgagc 2220 aggtctggag gcacatgttt cactgcactg ggactgagaa gcacatggga gattgttccg 2280 tcactgctct gggcgcatca ctctgttctt cagggcaagt ggcctctgta atctgctcag 2340 gtaagagaat aagggcagcc agtgatgagc cactcatgac ggtgccttaa gagtgggtgt 2400 acctaggagt tcccattgtg gctcagtggt aacaaactcg actggtatcc atgagggtat 2460 gggtttgatc cctggccttg ctcaatgggt taaggatcca gcattgctgt gagctgtggt 2520 ataggttgca gactctgctc aggtcccatg ttgctgtgat tgtggtgtag gctgactgct 2580 gcagcttcaa tttgacccct agcccgggaa tttccatagg ccacacgtgc agcactaagg 2640 aaggaaaaaa agaaaaaaaa aaaaaaagag tgggtgtgcc tatagtgaag aacagatgta 2700 aaagggaagt gaaagggatt cccccattct gagggattgt gagaagtgtg ccagaatatt 2760 aacttcattt gacttgttac agggaaagta aacttgactt tcacggacct cctagttacc 2820 tggtgcttac tatatgtctt ctcagagtac ctgattcatt cccagcctgg ttgacccatc 2880 cccctatctc tatggctatg tttatccaga gcacatctat ctaacactcc agctgatctt 2940 cctgacacag ctgtggcaac cctggatcct ttaaccaact gtgccaggct ggagatcaaa 3000 cctaagcctc tgcagcaacc caagctgctg cagtcagatt tttaaccccc tgtgccactg 3060 tgggtatctc cgatattttg tatcttctgt gactgagtgg tttgctgttt gcagggaacc 3120 agagtcagac actatccccg tgcaattcat catcctcgga cccatcaagc tctattattt 3180 cagaagaaaa tggtgttgcc tgcataggtg agaatcagtg accaacctat gaaaatgatc 3240 tcaatcctct gaaatgcatt ttattcatgt tttatttcct ctttgcaggg agtggtcaac 3300 ttcgcctggt cgatggaggt ggtcgttgtg ctgggagagt agaggtctat catgagggct 3360 cctggggcac catctgtgat gacagctggg acctgaatga tgcccatgtg gtgtgcaaac 3420 agctgagctg tggatgggcc attaatgcca ctggttctgc tcattttggg gaaggaacag 3480 ggcccatttg gctggatgag ataaactgta atggaaaaga atctcatatt tggcaatgcc 3540 actcacatgg ttgggggcgg cacaattgca ggcataagga ggatgcagga gtcatctgct 3600 cgg 3603 <210> 111 <211> 4962 <212> DNA <213> Sus scrofa <400> 111 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcggccagcg 3120 tgctgtgcag ggaactacag tgcgtcactt tggagaagga agtggacaga tctgggctga 3180 agaattccag tgtgaggggc acgagtccca cctttcactc tgcccagtag caccccgccc 3240 tgacgggaca tgtagccaca gcagggacgt cggcgtagtc tgctcaagtg agacccaggg 3300 aatgtgttca ctttgttccc atgccatgaa gagggtaggg ttaggtagtc acagacatct 3360 ttttaaagcc ctgtctcctt ccaggataca cacaaatccg cttggtgaat ggcaagaccc 3420 catgtgaagg aagagtggag ctcaacattc ttgggtcctg ggggtccctc tgcaactctc 3480 actgggacat ggaagatgcc catgttttat gccagcagct taaatgtgga gttgcccttt 3540 ctatcccggg aggagcacct tttgggaaag gaagtgagca ggtctggagg cacatgtttc 3600 actgcactgg gactgagaag cacatgggag attgttccgt cactgctctg ggcgcatcac 3660 tctgttcttc agggcaagtg gcctctgtaa tctgctcagg taagagaata agggcagcca 3720 gtgatgagcc actcatgacg gtgccttaag agtgggtgta cctaggagtt cccattgtgg 3780 ctcagtggta acaaactcga ctggtatcca tgagggtatg ggtttgatcc ctggccttgc 3840 tcaatgggtt aaggatccag cattgctgtg agctgtggta taggttgcag actctgctca 3900 ggtcccatgt tgctgtgatt gtggtgtagg ctgactgctg cagcttcaat ttgaccccta 3960 gcccgggaat ttccataggc cacacgtgca gcactaagga aggaaaaaaa gaaaaaaaaa 4020 aaaaaagagt gggtgtgcct atagtgaaga acagatgtaa aagggaagtg aaagggattc 4080 ccccattctg agggattgtg agaagtgtgc cagaatatta acttcatttg acttgttaca 4140 gggaaagtaa acttgacttt cacggacctc ctagttacct ggtgcttact atatgtcttc 4200 tcagagtacc tgattcattc ccagcctggt tgacccatcc ccctatctct atggctatgt 4260 ttatccagag cacatctatc taacactcca gctgatcttc ctgacacagc tgtggcaacc 4320 ctggatcctt taaccaactg tgccaggctg gagatcaaac ctaagcctct gcagcaaccc 4380 aagctgctgc agtcagattt ttaaccccct gtgccactgt gggtatctcc gatattttgt 4440 atcttctgtg actgagtggt ttgctgtttg cagggaacca gagtcagaca ctatccccgt 4500 gcaattcatc atcctcggac ccatcaagct ctattatttc agaagaaaat ggtgttgcct 4560 gcataggtga gaatcagtga ccaacctatg aaaatgatct caatcctctg aaatgcattt 4620 tattcatgtt ttatttcctc tttgcaggga gtggtcaact tcgcctggtc gatggaggtg 4680 gtcgttgtgc tgggagagta gaggtctatc atgagggctc ctggggcacc atctgtgatg 4740 acagctggga cctgaatgat gcccatgtgg tgtgcaaaca gctgagctgt ggatgggcca 4800 ttaatgccac tggttctgct cattttgggg aaggaacagg gcccatttgg ctggatgaga 4860 taaactgtaa tggaaaagaa tctcatattt ggcaatgcca ctcacatggt tgggggcggc 4920 acaattgcag gcataaggag gatgcaggag tcatctgctc gg 4962 <210> 112 <211> 3603 <212> DNA <213> Sus scrofa <400> 112 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcggccagcg 3120 tgctgtgcag ggaactacag tgcgattcat catcctcgga cccatcaagc tctattattt 3180 cagaagaaaa tggtgttgcc tgcataggtg agaatcagtg accaacctat gaaaatgatc 3240 tcaatcctct gaaatgcatt ttattcatgt tttatttcct ctttgcaggg agtggtcaac 3300 ttcgcctggt cgatggaggt ggtcgttgtg ctgggagagt agaggtctat catgagggct 3360 cctggggcac catctgtgat gacagctggg acctgaatga tgcccatgtg gtgtgcaaac 3420 agctgagctg tggatgggcc attaatgcca ctggttctgc tcattttggg gaaggaacag 3480 ggcccatttg gctggatgag ataaactgta atggaaaaga atctcatatt tggcaatgcc 3540 actcacatgg ttgggggcgg cacaattgca ggcataagga ggatgcagga gtcatctgct 3600 cgg 3603 <210> 113 <211> 3619 <212> DNA <213> Sus scrofa <400> 113 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagggg acattccctg ctctggtcgt gttgaagtac 3060 aacatggaga cacgtggggc accgtctgtg attctgactt ctctctggag gcagccagcg 3120 tgctttgcag ggaaccagag tcagacacta tccccgtgca attcatcatc ctcggaccca 3180 tcaagctcta ttatttcaga agaaaatggt gttgcctgca taggtgagaa tcagtgacca 3240 acctatgaaa atgatctcaa tcctctgaaa tgcattttat tcatgtttta tttcctcttt 3300 gcagggagtg gtcaacttcg cctggtcgat ggaggtggtc gttgtgctgg gagagtagag 3360 gtctatcatg agggctcctg gggcaccatc tgtgatgaca gctgggacct gaatgatgcc 3420 catgtggtgt gcaaacagct gagctgtgga tgggccatta atgccactgg ttctgctcat 3480 tttggggaag gaacagggcc catttggctg gatgagataa actgtaatgg aaaagaatct 3540 catatttggc aatgccactc acatggttgg gggcggcaca attgcaggca taaggaggat 3600 gcaggagtca tctgctcgg 3619 <210> 114 <211> 3270 <212> DNA <213> Sus scrofa <400> 114 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac ttgttacagg gaaagtaaac 2460 ttgactttca cggacctcct agttacctgg tgcttactat atgtcttctc agagtacctg 2520 attcattccc agcctggttg acccatcccc ctatctctat ggctatgttt atccagagca 2580 catctatcta acactccagc tgatcttcct gacacagctg tggcaaccct ggatccttta 2640 accaactgtg ccaggctgga gatcaaacct aagcctctgc agcaacccaa gctgctgcag 2700 tcagattttt aaccccctgt gccactgtgg gtatctccga tattttgtat cttctgtgac 2760 tgagtggttt gctgtttgca gggaaccaga gtcagacact atccccgtgc aattcatcat 2820 cctcggaccc atcaagctct attatttcag aagaaaatgg tgttgcctgc ataggtgaga 2880 atcagtgacc aacctatgaa aatgatctca atcctctgaa atgcatttta ttcatgtttt 2940 atttcctctt tgcagggagt ggtcaacttc gcctggtcga tggaggtggt cgttgtgctg 3000 ggagagtaga ggtctatcat gagggctcct ggggcaccat ctgtgatgac agctgggacc 3060 tgaatgatgc ccatgtggtg tgcaaacagc tgagctgtgg atgggccatt aatgccactg 3120 gttctgctca ttttggggaa ggaacagggc ccatttggct ggatgagata aactgtaatg 3180 gaaaagaatc tcatatttgg caatgccact cacatggttg ggggcggcac aattgcaggc 3240 ataaggagga tgcaggagtc atctgctcgg 3270 <210> 115 <211> 7 <212> DNA <213> Sus scrofa <400> 115 tactact 7 <210> 116 <211> 12 <212> DNA <213> Sus scrofa <400> 116 tgtggagaat tc 12 <210> 117 <211> 11 <212> DNA <213> Sus scrofa <400> 117 agccagcgtg c 11 <210> 118 <211> 8532 <212> DNA <213> Sus scrofa <400> 118 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccaggctg gttggagctg acatgccctg ctctggtcgt gttgaagtaa 3060 aacatgcaga cacgtggggc tccgtctgtg attctgactt ctctctgcat gcggccaacg 3120 tgctgtgcag ggaactaaat tgcggcgatg cgatttccct ctcggtggga gatcactttg 3180 gaaaaggaaa tggactgacc tgggctgaaa aattccagtg tgaggggagc gagacccacc 3240 ttgcactctg cccaatagta caacaccctg aagacacatg tatccacagc agggaagtcg 3300 gcgtagtctg ctcaagtaag agtttactga aaataacact cttaaaatct tgttatgttt 3360 ttattcataa tgtgaatgag tagtagtgga aaataactac cagtttccta agcttataac 3420 ttcgtatagc atacattata cgaagttata agcctgcagg aattctaccg ggtaggggag 3480 gcgcttttcc caaggcagtc tggagcatgc gctttagcag ccccgctggg cacttggcgc 3540 tacacaagtg gcctctggcc tcgcacacat tccacatcca ccggtaggcg ccaaccggct 3600 ccgttctttg gtggcccctt cgcgccacct tctactcctc ccctagtcag gaagttcccc 3660 cccgccccgc agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg tctcactagt 3720 ctcgtgcaga tggacagcac cgctgagcaa tggaagcggg taggcctttg gggcagcggc 3780 caatagcagc tttgctcctt cgctttctgg gctcagaggc tgggaagggg tgggtccggg 3840 ggcgggctca ggggcgggct caggggcggg gcgggcgccc gaaggtcctc cggaggcccg 3900 gcattctgca cgcttcaaaa gcgcacgtct gccgcgctgt tctcctcttc ctcatctccg 3960 ggcctttcga cctgcagcca ccatggccat gattgaacag gatggcctgc atgcaggttc 4020 tccagctgcc tgggtggaga gactgtttgg ctatgactgg gcacagcaga ccattggttg 4080 ctctgatgca gcagtgttca gactgtcagc ccagggcagg ccagtcctgt ttgtgaagac 4140 agacctcagt ggggctctca atgagctgca ggatgaggct gccagactct cctggctggc 4200 aacaactggg gtcccctgtg cagctgtcct ggatgtggtc acagaagctg gaagggactg 4260 gctcctgctg ggtgaggtgc ctgggcagga cctcctgtcc tctcacctgg ctccagctga 4320 gaaagtgtca atcatggctg atgccatgag aagactccac accctggacc cagccacctg 4380 cccctttgac caccaggcca agcacaggat tgagagggcc agaaccagga tggaggctgg 4440 cctggtggac caggatgacc tggatgaaga acaccagggc ctggcccctg ctgaactgtt 4500 tgccaggctc aaggcatcca tgccagatgg tgaggacctg gtggtgactc atggggatgc 4560 ctgcctgccc aacatcatgg tggaaaatgg aaggttctct ggcttcattg actgtggcag 4620 gctgggagtg gctgacaggt accaggacat tgccctggca accagggaca ttgcagaaga 4680 gctgggggga gaatgggcag acaggttcct ggtgctctat ggcattgcag cccctgactc 4740 ccagagaatt gccttctaca gactgctgga tgagttcttc taaatcgatt ataatcagcc 4800 ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc 4860 tgaaacataa aatgaatgca atgttgttgt taaacttgtt tattgcagct tataatggtt 4920 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 4980 gttgtggttt gtccaaactc atcaatgtgg aaaataacta ccagtttcct aagcttataa 5040 cttcgtatag catacattat acgaagttat aagctagaca aaagtatctt accccaatgg 5100 tagccctgta cccaataaaa gtaggtgttc agtttcatat cctatgaaat accctcttga 5160 tacttttact ttgcatgagg atttagaaga aaaaagtttt actataatcc ttaacttagg 5220 aaattctttt gaattggaaa tgaaacacaa attgcttttc attgatatgc catatgatta 5280 tatgaataaa acatgaaatc ttcatattgg attctagtat atacccaagt aaatattttt 5340 tccctagaag agtgccaagt gtgttaaaac cttttggttt aataaagcag aaaaaaataa 5400 actctaaaaa tcataattaa aaatgaaatg cttttattta tagcaattaa ctacaacatg 5460 tttagactta catactatta aatataatat atttaagatc ccctcatgat aaatatgttc 5520 attattttgt aggctgttga tgcactaata tgtatgtaga ttactttgtg aattgccctt 5580 aataaaattt aaaactttag gctagtaaac ctgtaacact caacttagtt ctgaactatc 5640 tcactattct tttgcaagaa tttacttagg taatgccaac taatttattc caaggccaaa 5700 aagatgacaa tgtcttatat attataaaaa ctaataaaaa ccattttaaa acctagtata 5760 aatttaaagg tacttgctct tctggttcat ctcttctttt gtttacttct gctttcaaaa 5820 acttatttat tgtgaccata ttctttactt ccatttattg ttataattta taagatacta 5880 tacttgcaag caataaatgt tatcttttta gcttttaaat ggtctcattt gaaaagaata 5940 tataattagt aagtcatagc tactttaaat aaaaacttat tctttaagag attaaacact 6000 tctccaagtg atctgttttt ctttaattaa aacgttatta actcccaaaa tgatgttatt 6060 gtttttttat aatcttaaat accaataatt accaggtcta ttttgatttt gatacaggat 6120 aaaaactact attaattact taagaatgtg ttctttttta tatgtaccat tttcatgatc 6180 aaagttggtg atatgactga ggttttgatt attattaaac agatagttaa tatgatatat 6240 tcctcatttt tccaaatgaa aggaaaaatg tcttatatgg aggaaaagat tggggcaggg 6300 ggattagtaa attattactt aaatatctga ataggaggat ttttcaatga aaggataaag 6360 gaagaatgat tgtatcatct gaatctttcc ctccctttcc tggagtttgt cctttcaacc 6420 cagtatacct accactccct tcatcaccta ctttcccatt acagtcccta tgtgttgggt 6480 ggtaactatt ttgttttggt gttaatatcc aagtttccct taataacacc tagtgaatgg 6540 aggaaggatg agcataccta cccatcagac atatttagcc accatattta atcaacaagc 6600 atgaagaaag gaagctagcc tctccccttc ctttcctcct gcctctctct ctcttctctg 6660 tcctcgctcc ctttcttccc atcaatattt tcagagcacc tcttatgcgc caggcattgg 6720 gatactcaaa ctggaggaaa caagaaaaaa aaaaaaaaaa ggcgaagacc tcagggaaat 6780 ttatattgct gctatatttt tttgagccta gtgtaaatta aaattcctta atgctgtgcc 6840 ttttaaaaac acaaataagc aaaatagttt atttcttcaa cagttaaatc cttagggtag 6900 gaaagtgatt caggatctat tgctactatt aactcttctt tcattttcac acaggataca 6960 cacaaatccg cttggtgaat ggcaagaccc catgtgaagg aagagtggag ctcaacattc 7020 ttgggtcctg ggggtccctc tgcaactctc actgggacat ggaagatgcc catgttttat 7080 gccagcagct taaatgtgga gttgcccttt ctatcccggg aggagcacct tttgggaaag 7140 gaagtgagca ggtctggagg cacatgtttc actgcactgg gactgagaag cacatgggag 7200 attgttccgt cactgctctg ggcgcatcac tctgttcttc agggcaagtg gcctctgtaa 7260 tctgctcagg taagagaata agggcagcca gtgatgagcc actcatgacg gtgccttaag 7320 agtgggtgta cctaggagtt cccattgtgg ctcagtggta acaaactcga ctggtatcca 7380 tgagggtatg ggtttgatcc ctggccttgc tcaatgggtt aaggatccag cattgctgtg 7440 agctgtggta taggttgcag actctgctca ggtcccatgt tgctgtgatt gtggtgtagg 7500 ctgactgctg cagcttcaat ttgaccccta gcccgggaat ttccataggc cacacgtgca 7560 gcactaagga aggaaaaaaa gaaaaaaaaa aaaaaagagt gggtgtgcct atagtgaaga 7620 acagatgtaa aagggaagtg aaagggattc ccccattctg agggattgtg agaagtgtgc 7680 cagaatatta acttcatttg acttgttaca gggaaagtaa acttgacttt cacggacctc 7740 ctagttacct ggtgcttact atatgtcttc tcagagtacc tgattcattc ccagcctggt 7800 tgacccatcc ccctatctct atggctatgt ttatccagag cacatctatc taacactcca 7860 gctgatcttc ctgacacagc tgtggcaacc ctggatcctt taaccaactg tgccaggctg 7920 gagatcaaac ctaagcctct gcagcaaccc aagctgctgc agtcagattt ttaaccccct 7980 gtgccactgt gggtatctcc gatattttgt atcttctgtg actgagtggt ttgctgtttg 8040 cagggaacca gagtcagaca ctatccccgt gcaattcatc atcctcggac ccatcaagct 8100 ctattatttc agaagaaaat ggtgttgcct gcataggtga gaatcagtga ccaacctatg 8160 aaaatgatct caatcctctg aaatgcattt tattcatgtt ttatttcctc tttgcaggga 8220 gtggtcaact tcgcctggtc gatggaggtg gtcgttgtgc tgggagagta gaggtctatc 8280 atgagggctc ctggggcacc atctgtgatg acagctggga cctgaatgat gcccatgtgg 8340 tgtgcaaaca gctgagctgt ggatgggcca ttaatgccac tggttctgct cattttgggg 8400 aaggaacagg gcccatttgg ctggatgaga taaactgtaa tggaaaagaa tctcatattt 8460 ggcaatgcca ctcacatggt tgggggcggc acaattgcag gcataaggag gatgcaggag 8520 tcatctgctc gg 8532 <210> 119 <211> 4538 <212> DNA <213> Sus scrofa <400> 119 tatagatgac aaggctttgt gtctgatagg ggccagcgaa ctcagtaaag agggaagatg 60 agaaagataa tggcaagaat ttatccctga agtgtagttt tgacaaacca gtcacaaaga 120 ggtctaagaa attttggtca caaagttgtt ttgaatccca ggcattttat ttgcaatgat 180 tgcatatgtt ctggaaagga catctgaacc taagaaatag ttcatttgca ttgtgttata 240 ttttactaag gtctgagaaa taatcttgag atgagaatga actctacttc ttcagagtct 300 ggaaggaata aattatgaaa atgtattaat gcttctttaa accatattgt atatttatct 360 attactaaac aaaaagaagt agctctattt atttatttat ttatttattt atttatgtct 420 tttgtctctt tagggccaca cctgtggcat atggaggttc ccaggctaga ggtccaattg 480 gagatgtagc agccagccta tgccagagcc accgcaacac gggatctgag ccacgtctgt 540 gacttacacc acagctcaca gcaacgcctg atcctcaacc cactgagcga ggccagggat 600 cgaacccatg tcctcatgga tgctagttgg gttcgttaac tgctgagcca tgatgggaac 660 tccaaattaa ttatttctta tatttgttct tcatatattc atttctatag aaagaaataa 720 atacagattc agttaatgat ggcaggtaaa agcttaactt attaatcaaa ggagttaatc 780 caggcacaaa aattcaattc atggctctct gttaaaattt aggtataggt ttagcaggaa 840 gaaaaggtta gtagatgcag actattacat ttagaatgga tggacaatga agtcctacta 900 tacagcacag ggaactatat ccaatctctt gggatagaat atgatggaag acaaaatcag 960 aacaagagag tatatatata tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 1020 tgtgtgactg ggtcaccctg cggcacagca gaaattggca gaacattgta aatcaactat 1080 actttaatag gaaaaatact tttaagggct aaatttccaa tattctaacc atgtacacag 1140 agtaaatgtc ataaggatgc cagtctgtgt agagattgat gtgttactag cagattcatg 1200 aaataaaggc tgaggatgta gtccccaagt cacttctgag tggaagaatt tctcctttgt 1260 cctggactca aatattttag gataaaggaa aaaagaagat atttatagaa gggacttgtt 1320 ttcaagtact tgacaaaatt tcaccattaa agagaaattt gtgggagttc ccatcgtggc 1380 tcagtggaaa caaatccaac taggaaccat gaggttgtgg gtttgatccc tggcctcact 1440 cagtgggtta aggatccggt gttgccgtga gctgtggtgt aggttgcaga cacggttctg 1500 atcctgcgtt gctgtggctg tggctgtggt gtaggccagc agcaaacagc tctgattaga 1560 cccctagcct ggaaacctcc atatgccaca ggtgcagccc taaaaagaca aaaaaagaga 1620 aaagacaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaacccccag 1680 aggtatttat ttgtttttgc cttttttcac tgactgttct ttgtttgttt gtttgagact 1740 gatctagaag actagagatt acaagaaata tggatttggc tcactctaag aaactgcttt 1800 cattccaagg tttgggtcta tccaaaagtg gaatagaatc atatgaatac tagtttatga 1860 gtatttagtg agaggaattt caagctcaaa taatgattca gcaagattaa attaaggagg 1920 gaattttcct tgtggctgag tgggttaagg acccaatgtt gtctctgtga ggatgtaggt 1980 tccatcctgg gctttgctca ttaggttaag gatctggcat tgctgcagct cagacccagt 2040 gctgccctgg ttgtggctta ggccaaagct gcagctccaa ttcaatctct ggcctgggaa 2100 cctccatgtg ctacaaggtg cggccttaaa aggaaaaaaa aaaaattaaa tcaaggactc 2160 aagagtcttt cattatttgt gttgtggaag ctatatttgt tttaaagtct tagttgtgtt 2220 tagaaagcaa gatgttcttc aactcaaatt tgggagggaa cttgtttcat acatttttaa 2280 tggataagtg gcaaaatttt catgctgagg tgatctatag tgttgtaatg cagaatatag 2340 tcagatcttg aacattttag gaagttggtg agggccaatt gtgtatctgt gccatgctga 2400 taagaatgtc aagggatcac aagaattcgt gttatttgac agcagtcatc tttaaaaggc 2460 atttgagaaa gtccaatttc aaatgcattt cctttcttta aaagataaat tgaagaaaat 2520 aagtctttat ttcccaagta aattgaattg cctctcagtc tgttaaaaga aactcttacc 2580 ttgatgattg cgctcttaac ctggcaaaga ttgtctttaa aatctgagct ccatgtcttc 2640 tgctttattt ctggtgtgcc tttgactcca gattacagta aatggaggac tgagtatagg 2700 gctaaaaagt agagagaatg gatgcatatt atctgtggtc tccaatgtga tgaatgaagt 2760 aggcaaatac tcaaaggaaa gagaaagcat gctccaagaa ttatgggttc cagaaggcaa 2820 agtcccagaa ttgtctccag ggaaggacag ggaggtctag aatcggctaa gcccactgta 2880 ggcagaaaaa ccaagaggca tgaatggctt ccctttctca cttttcactc tctggcttac 2940 tcctatcatg aaggaaaata ttggaatcat attctccctc accgaaatgc tatttttcag 3000 cccacaggaa acccagctca acattcttgg gtcctggggg tccctctgca actctcactg 3060 ggacatggaa gatgcccatg ttttatgcca gcagcttaaa tgtggagttg ccctttctat 3120 cccgggagga gcaccttttg ggaaaggaag tgagcaggtc tggaggcaca tgtttcactg 3180 cactgggact gagaagcaca tgggagattg ttccgtcact gctctgggcg catcactctg 3240 ttcttcaggg caagtggcct ctgtaatctg ctcaggtaag agaataaggg cagccagtga 3300 tgagccactc atgacggtgc cttaagagtg ggtgtaccta ggagttccca ttgtggctca 3360 gtggtaacaa actcgactgg tatccatgag ggtatgggtt tgatccctgg ccttgctcaa 3420 tgggttaagg atccagcatt gctgtgagct gtggtatagg ttgcagactc tgctcaggtc 3480 ccatgttgct gtgattgtgg tgtaggctga ctgctgcagc ttcaatttga cccctagccc 3540 gggaatttcc ataggccaca cgtgcagcac taaggaagga aaaaaagaaa aaaaaaaaaa 3600 aagagtgggt gtgcctatag tgaagaacag atgtaaaagg gaagtgaaag ggattccccc 3660 attctgaggg attgtgagaa gtgtgccaga atattaactt catttgactt gttacaggga 3720 aagtaaactt gactttcacg gacctcctag ttacctggtg cttactatat gtcttctcag 3780 agtacctgat tcattcccag cctggttgac ccatccccct atctctatgg ctatgtttat 3840 ccagagcaca tctatctaac actccagctg atcttcctga cacagctgtg gcaaccctgg 3900 atcctttaac caactgtgcc aggctggaga tcaaacctaa gcctctgcag caacccaagc 3960 tgctgcagtc agatttttaa ccccctgtgc cactgtgggt atctccgata ttttgtatct 4020 tctgtgactg agtggtttgc tgtttgcagg gaaccagagt cagacactat ccccgtgcaa 4080 ttcatcatcc tcggacccat caagctctat tatttcagaa gaaaatggtg ttgcctgcat 4140 aggtgagaat cagtgaccaa cctatgaaaa tgatctcaat cctctgaaat gcattttatt 4200 catgttttat ttcctctttg cagggagtgg tcaacttcgc ctggtcgatg gaggtggtcg 4260 ttgtgctggg agagtagagg tctatcatga gggctcctgg ggcaccatct gtgatgacag 4320 ctgggacctg aatgatgccc atgtggtgtg caaacagctg agctgtggat gggccattaa 4380 tgccactggt tctgctcatt ttggggaagg aacagggccc atttggctgg atgagataaa 4440 ctgtaatgga aaagaatctc atatttggca atgccactca catggttggg ggcggcacaa 4500 ttgcaggcat aaggaggatg caggagtcat ctgctcgg 4538 <210> 120 <211> 101 <212> PRT <213> Sus scrofa <400> 120 Pro Arg Leu Val Gly Gly Asp Ile Pro Cys Ser Gly Arg Val Glu Val 1 5 10 15 Gln His Gly Asp Thr Trp Gly Thr Val Cys Asp Ser Asp Phe Ser Leu 20 25 30 Glu Ala Ala Ser Val Leu Cys Arg Glu Leu Gln Cys Gly Thr Val Val 35 40 45 Ser Leu Leu Gly Gly Ala His Phe Gly Glu Gly Ser Gly Gln Ile Trp 50 55 60 Ala Glu Glu Phe Gln Cys Glu Gly His Glu Ser His Leu Ser Leu Cys 65 70 75 80 Pro Val Ala Pro Arg Pro Asp Gly Thr Cys Ser His Ser Arg Asp Val 85 90 95 Gly Val Val Cys Ser 100 <210> 121 <211> 100 <212> PRT <213> Homo sapiens <400> 121 Leu Arg Leu Val Asp Gly Asp Ser Arg Cys Ala Gly Arg Val Glu Ile 1 5 10 15 Tyr His Asp Gly Phe Trp Gly Thr Ile Cys Asp Asp Gly Trp Asp Leu 20 25 30 Ser Asp Ala His Val Val Cys Gln Lys Leu Gly Cys Gly Val Ala Phe 35 40 45 Asn Ala Thr Val Ser Ala His Phe Gly Glu Gly Ser Gly Pro Ile Trp 50 55 60 Leu Asp Asp Leu Asn Cys Thr Gly Met Glu Ser His Leu Trp Gln Cys 65 70 75 80 Pro Ser Arg Gly Trp Gly Gln His Asp Cys Arg His Lys Glu Asp Ala 85 90 95 Gly Val Ile Cys 100 <210> 122 <211> 7278 <212> DNA <213> Sus scrofa <400> 122 tcagagtagg aaagggggac ctttcaggga tgcactggga accccatctc atgggaaatg 60 gggagccaca gaaggttttc aagcagggga gggactcaaa ggcagcactt tggtatgtgc 120 tcagctctat agctggtaag gctgctgata gggagcaagt ctcaaacaag aaagcatcat 180 gtgtgctgga tgccttggag taagtcgctg ggcctctctg ggctcccatt tctgttaact 240 tgggtgcaga gacagggcag ggaagtgggg aaagagaaac agctatttat ccttgagggg 300 ctgggaaagc agaacttagg gtgtggccaa gtgacagagg actttctggg gcatgccatc 360 aagtgaaggc attcctaggc acagcctgag ctggggaagt gggctcctgg ctccctgctg 420 gcagctgccc tgccctctca ctgggttggc cagcgtagca cgtggggaaa caggactggg 480 ttcccagcag gctctgagac ccaggtaccc tgaggttccc caggaggctc ccgtgtgccc 540 tgccagccca ctgtgtgcca ccctcttagg ctccagaagc agcgccagaa cctgctatgg 600 acttcctgct cctgctcctc ctcctggctt catctgctct agcaggtaag ttgttctggc 660 ttttttcttc tcacagggcc tggctcagca aggccagccc ttggctggcc tgggcacact 720 ggactgtatc tggtcacagg tttagctgct gaggttgaag aagggcatgg ggaagcagtg 780 acagggagcc atgaccctcc ctggggtgcc ccgtggggct gcattgctga ggacacggca 840 gggttcgggg gcccatctgg agcacctcct atgtgacaga tcaggaggtg accctggcct 900 gcatcacact ccaccctgtc ctgtccctcc ctcaggcctg gcctcgtgga cggtttccag 960 ccccgagacc gtgcagggca tcaagggctc ctgcctcatc atcccctgca ccttcggctt 1020 cccggccaac gtggaggtgc cccatggcat cacagccatc tggtactatg actactcagg 1080 caagcgcctg gtagtgagcc actccaggaa cccaaaggtg gtggagaacc acttccaagg 1140 ccgggccctg ctgttggggc aggttgagca gaggacgtgc agcctgctgc tgaaggacct 1200 gcagccccag gactcgggct cctataactt ccgctttgag atcagcgagg gcaaccgctg 1260 gtcagatgtc aaaggcacag ttgtcaccgt gacaggtgag gagcagggtg gcccagccac 1320 tgcctgggct cccaggccac ccctggcccc actggctcac agttcccatc ctggtctgaa 1380 agccaacccc agccccaatc ttggccgcag ttccagtcct agccctgtgc cccctggcat 1440 tcgcccctgt gaactacttg cattctcctt ctccttgaag ctccagcctg gagccagggt 1500 ttccaaggca ggagggctca ggtgtggtga acgggagtcc ccagcctcct ctctcatcct 1560 tagaggtgcc cagcgtgccc accattgcct tgccagccaa gctgcatgag ggcatggagg 1620 tggacttcaa ctgctccact ccctatgtgt gcccgacgga gccggtcaac ctacagtggc 1680 aaggccagga tcccacccgc tccgtcacct cccacctcca gaagcttgag ccctcgggca 1740 ccagccacat ggagaccctg cacatggccc tgtcctggca ggaccatggc cggatcctga 1800 gctgccaggt ctcagcagcc gaacgcagga tgcagaagga gattcacctc caagtgcagt 1860 gtgagtgcac agggatgggg ggacatgccc ttcccacttt ggtggggcag gtggagagtg 1920 ttaagcccta agcaccacgg tgaaagtctc cctttcatct cctgaacctg cagccaggct 1980 gggctgagaa cgggagacag aaaaaccaga gaatttggag tctggcaaca ggggccctgg 2040 gatttagccc agctctggag gaggccaggg aggaagggga tcaccccttt cctgcctcag 2100 gccacttgca cacatgaccg gggtaacatc tggacgtggc aaggaggcaa tgggagaaag 2160 ccggagtttt cacttgatta tgcatcttcc catcacagta aaagagggca gcctgttcta 2220 gaaccaccac tatacacaga cgtcaggctg ctggctctgc catccactag atgagcaaac 2280 ttcaggcaag ttccttgcct cttggagcct ctgttttcat atctgtatac tggcagtaac 2340 agtacatatg tttccatctc acaggattgt tatgaaaatt aagagtgctt ggtacctatt 2400 aagcactcaa aaataccaac ttcttggact tccctggtgg tacagtgggt taaggaccta 2460 gtgttgtcac tgctgtgaca tgggttcgat ccctggccca ggaacttctg catgtcatgg 2520 gggcagccaa aaatattagc ttctatcatt ttcatattta tatagattaa gcacttgaaa 2580 acatgatctt ttattagcat agttacatag agagaggctt tggaacaaga tttaaagaca 2640 ggtcatttct tcgtattgtg gacaccctcc cagcaaagga gttaaccatt cttagagcta 2700 ctttgacact gcttttggcc ccctgcatta ggtggcggtt ccttgtcaac cgctaccaca 2760 agccaggcga aaaagcagtg cggtgcccat gacccttaaa tagaagggag ggctatggga 2820 ggcatcatga ggcagaaaac caaggacggt agtgcaggct ggctgtaggc caaccctttg 2880 caatatcagg ctctcggtgg agaaggaagg ggtcagtatt cctcacaagg tggggagcag 2940 ggcctgccct ggacagggga actagtggga cttaagattt atctgggtgg aattcccctg 3000 gtggcgcagc agtaacggac cccactagta cccatgagga caagaattca atccctggcc 3060 ctgctcagtg ggttaaggat ctggtgctcc cgcgagctgc ggtataggtc gcagatgcgg 3120 cttggatctg gtgttgctgt ggctgtggca taggccggct gctgtagctc tgattggacc 3180 ttagcctggg aacttccatt cgctgcgtgt gcggccctaa aagaccccga tccggcaaaa 3240 aaaaagattt atctggatgg gctttctagg gcagagggtt gaaagaggag agggacatgc 3300 cccctgccct ccctgggccc ttgctcagca tccccccatc atgccttgca gatgccccca 3360 agggtgtgga gatccttttc agccactccg gacggaacgt ccttccaggt gatctggtca 3420 ccctcagctg ccaggtgaat agcagcaacc ctcaggtcag ttccgtgcag tgggtcaagg 3480 atgggacgaa gctcaaagac cagaaacgtg tacttcagtt gcgccgggca gcctgggctg 3540 atgctggcgt ctacacctgc caagccggga atgccgtggg ctcttcagtc tcacccccgg 3600 tcagcctcca cgtcttcagt gagtcctgaa ggagcctggg tcttgatcag agggcagcgt 3660 tggggttaag gaaaccaggc caaggcacct ctggggatgc gggtggggag tcccaacccg 3720 gcctcagaca ggtgatcgcc tgggatgtat ggaggatccc agtgaacagg gccaagagat 3780 gcggagccaa tccgagaggc gcctccgcag aaggggcggg gcgtagactg tgcagagctt 3840 aaggctgatt ggctgcaacc atgaggggtt gggcctggaa gtcctctggg tatcccccag 3900 cgtgtcctat gctgtcccca cagtggctga ggtccaggta agccctgtgg gctccatcct 3960 ggagaaccag acggtgacgc tggcctgcaa tacacctaag gaagcgccca gcgagctgcg 4020 ctacagctgg tacaagaacc acgccctgct ggagggctct cacagccgca ccctccggct 4080 gcactcagtc accagggcgg attcgggctt ctacttctgc gaggtgcaga acgcccgggg 4140 cagagagcgc tctccccctg tcagcgtggt ggtcagccgt aagtgagggt ggagggaccg 4200 gtggggagtc tggacctggg aactgagcca aaaagtagga ggccctgcag gacgtttggg 4260 gtcctgggcc caggtgccct tgagctcaca tcttggagag gccttgacct tcctgggcct 4320 cagtttcatc ctatttttat tactattttt taaaatttat tttgtctttg tttgttttgt 4380 cttttctagg gcatatggag gttcccaggc taggggtcta actggcactg tagccacccg 4440 cctacgccac agccacagca atgcaggatc ctagctacat ctgtgaccta caccacagct 4500 catggcaacg ccggatcctt aacccactga gtgaggccag ggatcaaacc cgcaacctca 4560 tggttcctag ttggtttcgt tcaccactga gccacgacag gaactgctat ttattttgtc 4620 ttttgtcttc cctagattct ccatttgtta acattttgat acctttgctt ttctctctct 4680 gtgtattatg tatgtgtgtg tataggtgct cacacatgca cacacatgca tgtatgtgca 4740 tatgtacata tacacatgaa agtgtgcata caggcataca ttttctccac ataaacacat 4800 agacatttat actctctcta gccacatgca tatacacaca tgcactctat atgtatacac 4860 acacacacat gctatctatt atcaatctat ctatttatct acctatctat ctatctatca 4920 atcctcctga acgtgcaggc ataatgcctc tttactcctt aatttctcag catgtatttc 4980 ctaaggtcat tcttgtgcat aactgcagta caataactat agtcaggaaa cttaacattg 5040 ataccattga tataagactc ttatccaatc cacaacccac atttaaattt taccaggtgg 5100 cccaacaatg tcctttatgg caattatttt tctgctccag gatttggtct gggatcctgc 5160 cttgcattca gttgtcgagt gtctttatcc tccctcagtc tgggacagct cctaagtctc 5220 tccttgtttt ccttgacatt gaatcccaaa gatcacaggc ctgttgctct gtgctgtcct 5280 cagtgtgcgt tgatctgagt ggggcagact gaggctatgc acgtgagcag ggacatcgtg 5340 gctgtgatgc tgtgtctgtc tccccctgca tcacaacagg aggcacgtgg ggtctgtttg 5400 tcccattgct gggagcattc actttgatca tttgctgcag tgctggccgc tggctggttt 5460 ctttgttaga tttcccgtct ttatttttat ttcattttat gtttttaggg ccgcacctgc 5520 ggcatatgga ggttcccagg ctaggggtcg aattagagct atagccactg gcctatgcca 5580 cagccacagc aatgccagat ccgagttgga tctgcagcct acaccacagc tcacagcaac 5640 accagatcct taacccactg agcaaggcca ggaactgaac ctgtgtcctc atgggtacta 5700 gtcagattcg tttctgctga gccacgacag gaactctagt tttcccgtct ttaaaatggg 5760 tccctggagc cccattctca gggttgccac aaggattgag taggatggca gggcaattta 5820 cccagttcag ggacaggcac tcaggagcca ttggggtgcc ccctttccca gggcattatg 5880 ggacaaaaat gggtgcaggg gtcataggct ataaagggag atccaggagt gcccctgttg 5940 agagtgacag gccttccttc atccccacgc agacccaccc ctcaccccgg acctaactgc 6000 cttcctggag acacaggcgg ggctggtggg catcctccaa tgctctgtgg tcagcgagcc 6060 cccagctact ctggtgttgt cacacggggg cctcatcttg gcctctacct ccggggaggg 6120 tgaccacagc ccacgcttca gtgtcgcctc tgcccccaac tccctgcgcc tggagattca 6180 agacctgggg ccaacagaca gtggggaata catgtgctca gccagcagtt ctcttgggaa 6240 tgcgtcctcc accctggact tccatgccaa tggtaagacg gccacagcag ggctagtgga 6300 gggagcctca ggtttgttct gccccctcct cctgggagtc cagagacctc aaccaagggc 6360 ctgaactagc tgtctagaaa aaaggaatat caaaaatctg agctgtaccg tcatcccagg 6420 ctcagaggtt cctagaagtc aaggcaaaaa ggggaacatg gtcgattgca ttattccttt 6480 tttacccatt ctgactctga acttggaggg ttcctcgata tgcatttatt tgtctttaaa 6540 ttattgaaca tttgggggca gactctgtgc tggggtcttc tagttcttgg tgcatatgct 6600 gctcttccct ccttctgaga caggcagagc taatcaatca agccaggttt ttaacataag 6660 cctgggattg ggctcagaat ccttctcaat catgctgcag ccagctacga ccaattagat 6720 ccaaatgggc attcaaagcc aaactctcct gatcattgag agattcgcag agctgatgta 6780 atgaagctca gacctcccta cattgtatgg ggagagggga accctggcgg gcttcctgca 6840 gtggggggca tggaaccgcg gatgtgtggg ggagctgagc ctccctctct ccctctctgc 6900 cagcagcccg cctcctcatc agcccagcag cagaggtggt ggaagggcag gcggtgacac 6960 tgagctgcag gagcagcctg agcctgatgc ctgacacccg tttttcctgg taccggaacg 7020 gggccctgct tctcgagggg cccagcagca gcctcctgct cccagcagcc tccagcacag 7080 atgccggctc ataccactgc cgggcccaga gcagccacag cgccagtggg ccctcctcac 7140 ctgctgttct caccgtgctc tgtgagtagc cggcctgcca gccgtgcctg ctagggggag 7200 ggtcagctcc cacctcctcc aggccctcct gactctgccc tgtctgggag tcttgataag 7260 gaggcagccc aggcaccc 7278 <210> 123 <211> 11527 <212> DNA <213> Sus scrofa <220> <221> misc_feature <222> (43)..(43) <223> n is a, c, g, or t <220> <221> misc_feature <222> (46)..(46) <223> n is a, c, g, or t <400> 123 gcatatgagg ttccagggct aggggtctaa tcggagctgt agncancagt ctacaccaga 60 gccacagcaa cgcgggatct gagctgcggc tgcaacctac actaaccact gcgccatgac 120 aggaactcct tgccttctct tttttccagg aaagttctct gggttgaggc tggtcttggg 180 gtggaacagg ctgagccaat aagctggact ctggtgggac aaccccctgg gtactggggc 240 tgggctaagt ataggtgaca cccatgtaat ggaatttggg gcggttctag aaagagtcct 300 ctcgaaaatc cctgctcctt tctggggtca gtgtgtcaaa actcccacca ttcctcctgt 360 aggttcagca ctggcctttc cagggccctg aatgggaaca gtgggtgagt tggggacatg 420 ggcactggtg atgtctcagc tatagaggga gctgatcctg atgcccagtg tagctctggg 480 ccctggggtc acaccagcct ccaaacgtgt ccagcaggct gccactcagt ctagcatcag 540 gccacagcat ccgggtggtg gtgcccagcc tggccagcat gatcctctcc tgtggccaag 600 gaccaggtgt ggagggtctg gatacctctt cctgggagac gagcaggact agaactgctc 660 caagaactga ggatgaggag ttcccactgt gggcagcggg ttaagtatcc agcattgcca 720 cagctatggt ataggttgca gctgcggctc agattcagtc cccagcccag gaacttctat 780 aggtcacaga tgtagcaaaa aacgaaaaca aacaaaaaaa cccaaaccaa acaaccaatc 840 aaaaaaaaaa actcccccaa aaccaacaga ggacaagcca ccgggcctca gcaaatgacc 900 agatctgtct gcaggagtag cccagccagg ggcccagatt ccctgagaac aaggctctgc 960 ctggctttcc cacagctcgc ctttgctctg ctccctcctc cccttgtact tggctgagta 1020 gggcatcatc atccctgcag gcgattcagg ccccatcccg acctgggtgt ctgttcagcc 1080 tctccccagg tgtgaaccct ggtagccacc agaatcagcc cccgccccca ggctgggagc 1140 tgagagatgt catgtgtttc ctgtccccac gtccagcctc cccaggcccc tcctttcact 1200 gcagagtcag cacttaggag cagggaggat tgcaaagttg gcaacatgtg ttttgtacat 1260 gtatgtggta aaatatacac aagataactt ttcttgtttt caccactttt aagtgtgcaa 1320 ttcagtggca ttaaatacag tcacgatatg gtgtaaccat cattaccgtt tattcccaga 1380 actttttcat catccaaaat agagactcta tacctattaa acactaactt cctagtccct 1440 cctctcttca gcccctggta acctctattc tactttctct ttctatgaat ttgcctattc 1500 gaggcatctc atgtacatgg actcataaaa catttactct tttgtgcctg gcttatttta 1560 cttagtacaa tgttttcatt acttaggatc atgacaatgt tgtacatgtg tcagaatttc 1620 tttctttttg ttcttttgtt tgtttgcttt tgctttttag ggccgcactc gtggtgtatg 1680 gaggttccca ggctaggggt caaatgggag ctacagctgc cagcctacac cgcagccaca 1740 gcaactaggg atccaagctg catctgtgac ctacacagct ctcggctggc aacaccagat 1800 ccttaaccca atgagcgagg ccagggatca aacccacatc ctcatggatc ctagtcaggt 1860 ttgttaacca ctgagccacg aaaggaagtc cagaatttat tccttcttat ggctgaataa 1920 tattctattg catggacata ccacatttaa aaaaatccat tcgtctgtgg atggacactc 1980 ggaaacacta aatggttcca caggagctgc atcattttac attcccacca acagtacacg 2040 aatcttccat ttttccacag cctcgctgac atgtgttatt ttctggtttt gtttgtttgt 2100 tttttacagt cattctaatg ggtatgaagt ggtagcttat tgtggttttg atttgctggt 2160 gactaatgat gttgagcatc ttttcatggg tttatccgcc atttgtacgt atcttggaga 2220 aatgtctata caaatctgta gcctattttt tgaatttggg ttgtttgggt tttttagttg 2280 ttgaattgta gcagttcttt acatattcca aatggtaatc ccttatcaga tatttggatt 2340 tttttttttt tttttttttt tagggctgca ggtgcagcat atggaagttc ccaggctagt 2400 ggttgaatca gagctacaga tgccggccta tgctacagcc acagcaccac cagatctgaa 2460 ccatatctgt gacctgcacc acagctcatg gcaatgccag atccttaacc caccgagtga 2520 ggccagggat tgaacctgca ttctcatgga taccaattgg gtttgtttcc actgagccac 2580 aatggaaact ccctttatca gatgtatgat gtgcacgtat ttttgcccat tctgtgggtt 2640 ggcttttcac tctcctgata ttgtcttttt tttttttttt tttttttttt ttggcctttt 2700 gccttttcta gggccactcc tgtggcatat gaaggttccc aggctagggg tctaatcaaa 2760 gctgtagcca ccggcctacg ccagagccac agccatgtgg gatccgagcc acatcttcga 2820 cctacaccac agctcatggc aacgccagat cctcaaccca ctgagtgagg ccagggatca 2880 aacccgcaac ctcatggttc ctattcggat tcgttaacca ctgagccacg acaggagctc 2940 cctgatagtg tcctttgatg caaaaagatt ttcattttga ttcagttcag tttatctgtt 3000 ttttcttttg ttgcttgtgt tcttagtgtc atacttaaga aatcattgcc tgaagttagg 3060 tcatgaagat tttcacccat tttcttctaa gagttttata gtttctgtta tttgtgtttc 3120 tggcatctct cccctttgga ttcacatctg tgtccccatc cccatcaggg gcactccatg 3180 gtggagggcc tgccctcttg tgcatagtat acagtaggct ttcaactcat gtttgtggga 3240 tatgtgttgg gcagggtcct tgtgctccct gccacaccta gacttgcccc gtcatcaact 3300 ttaaatcccc aagaaccaca cccctctctt gcctgccact gaaaggcctg ggggtgctct 3360 gccctgctgc aggacaatgt cctcagttcc aggtcttgag aagtgggtgc tcaccaggga 3420 caaggcaacc acagagatgg ttctggattg actagagacc ccaaaaggga cgtttcacct 3480 ggaagccacc ttgaagactg aatgagattt cagcaagaaa agatcatttt tggtgatgcc 3540 agacctggcc agctggagag cccatgggca gacaggactg gccccagagt gagactggtc 3600 ctagggcgaa cccaggggga gcagggaatg gggcagagct cagagtagga aagggggacc 3660 tttcagggat gcactgggaa ccccatctca tgggaaatgg ggagccacag aaggttttca 3720 agcaggggag ggactcaaag gcagcacttt ggtatgtgct cagctctata gctggtaagg 3780 ctgctgatag ggagcaagtc tcaaacaaga aagcatcatg tgtgctggat gccttggagt 3840 aagtcgctgg gcctctctgg gctcccattt ctgttaactt gggtgcagag acagggcagg 3900 gaagtgggga aagagaaaca gctatttatc cttgaggggc tgggaaagca gaacttaggg 3960 tgtggccaag tgacagagga ctttctgggg catgccatca agtgaaggca ttcctaggca 4020 cagcctgagc tggggaagtg ggctcctggc tccctgctgg cagctgccct gccctctcac 4080 tgggttggcc agcgtagcac gtggggaaac aggactgggt tcccagcagg ctctgagacc 4140 caggtaccct gaggttcccc aggaggctcc cgtgtgccct gccagcccac tgtgtgccac 4200 cctcttaggc tccagaagca gcgccagaac ctgctatgga cttcctgctc ctgctcctcc 4260 tcctggcttc atctgcttaa tgaagcttct gatggaatta gaacttggca aaacaatact 4320 gagaatgaag tgtatgtgga acagaggctg ctgatctcgt tcttcaggct atgaaactga 4380 cacatttgga aaccacagta cttagaacca caaagtggga atcaagagaa aaacaatgat 4440 cccacgagag atctatagat ctatagatca tgagtgggag gaatgagctg gcccttaatt 4500 tggttttgct tgtttaaatt atgatatcca actatgaaac attatcataa agcaatagta 4560 aagagccttc agtaaagagc aggcatttat ctaatcccac cccaccccca cccccgtagc 4620 tccaatcctt ccattcaaaa tgtaggtact ctgttctccc cttcttaaca aagtatgaca 4680 ggaaaaactt ccattttagt ggacatcttt attggttaat agatcatcaa tttctgcaga 4740 cttacagcgg atcccctcag aagaactcgt caagaaggcg atagaaggcg atgcgctgcg 4800 aatcgggagc ggcgataccg taaagcacga ggaagcggtc agcccattcg ccgccaagct 4860 cttcagcaat atcacgggta gccaacgcta tgtcctgata gcggtccgcc acacccagcc 4920 ggccacagtc gatgaatcca gaaaagcggc cattttccac catgatattc ggcaagcagg 4980 catcgccatg ggtcacgacg agatcctcgc cgtcgggcat gcgcgccttg agcctggcga 5040 acagttcggc tggcgcgagc ccctgatgct cttcgtccag atcatcctga tcgacaagac 5100 cggcttccat ccgagtacgt gctcgctcga tgcgatgttt cgcttggtgg tcgaatgggc 5160 aggtagccgg atcaagcgta tgcagccgcc gcattgcatc agccatgatg gatactttct 5220 cggcaggagc aaggtgagat gacaggagat cctgccccgg cacttcgccc aatagcagcc 5280 agtcccttcc cgcttcagtg acaacgtcga gcacagctgc gcaaggaacg cccgtcgtgg 5340 ccagccacga tagccgcgct gcctcgtcct gcagttcatt cagggcaccg gacaggtcgg 5400 tcttgacaaa aagaaccggg cgcccctgcg ctgacagccg gaacacggcg gcatcagagc 5460 agccgattgt ctgttgtgcc cagtcatagc cgaatagcct ctccacccaa gcggccggag 5520 aacctgcgtg caatccatct tgttcaatgg ccgatcccat attggctgca ggtcgaaagg 5580 cccggagatg aggaagagga gaacagcgcg gcagacgtgc gcttttgaag cgtgcagaat 5640 gccgggcctc cggaggacct tcgggcgccc gccccgcccc tgagcccgcc cctgagcccg 5700 cccccggacc caccccttcc cagcctctga gcccagaaag cgaaggagca aagctgctat 5760 tggccgctgc cccaaaggcc tacccgcttc cattgctcag cggtgctgtc catctgcacg 5820 agactagtga gacgtgctac ttccatttgt cacgtcctgc acgacgcgag ctgcggggcg 5880 ggggggaact tcctgactag gggaggagta gaaggtggcg cgaaggggcc accaaagaac 5940 ggagccggtt ggcgcctacc ggtggatgtg gaatgtgtgc gaggccagag gccacttgtg 6000 tagcgccaag tgcccagcgg ggctgctaaa gcgcatgctc cagactgcct tgggaaaagc 6060 gcctccccta cccggtagaa ttcctgcagc ccgggggatc cactagttct agagcggccg 6120 ctgactaact agtgcccttc ccactttggt ggggcaggtg gagagtgtta agccctaagc 6180 accacggtga aagtctccct ttcatctcct gaacctgcag ccaggctggg ctgagaacgg 6240 gagacagaaa aaccagagaa tttggagtct ggcaacaggg gccctgggat ttagcccagc 6300 tctggaggag gccagggagg aaggggatca cccctttcct gcctcaggcc acttgcacac 6360 atgaccgggg taacatctgg acgtggcaag gaggcaatgg gagaaagccg gagttttcac 6420 ttgattatgc atcttcccat cacagtaaaa gagggcagcc tgttctagaa ccaccactat 6480 acacagacgt caggctgctg gctctgccat ccactagatg agcaaacttc aggcaagttc 6540 cttgcctctt ggagcctctg ttttcatatc tgtatactgg cagtaacagt acatatgttt 6600 ccatctcaca ggattgttat gaaaattaag agtgcttggt acctattaag cactcaaaaa 6660 taccaacttc ttggacttcc ctggtggtac agtgggttaa ggacctagtg ttgtcactgc 6720 tgtgacatgg gttcgatccc tggcccagga acttctgcat gtcatggggg cagccaaaaa 6780 tattagcttc tatcattttc atatttatat agattaagca cttgaaaaca tgatctttta 6840 ttagcatagt tacatagaga gaggctttgg aacaagattt aaagacaggt catttcttcg 6900 tattgtggac accctcccag caaaggagtt aaccattctt agagctactt tgacactgct 6960 tttggccccc tgcattaggt ggcggttcct tgtcaaccgc taccacaagc caggcgaaaa 7020 agcagtgcgg tgcccatgac ccttaaatag aagggagggc tatgggaggc atcatgaggc 7080 agaaaaccaa ggacggtagt gcaggctggc tgtaggccaa ccctttgcaa tatcaggctc 7140 tcggtggaga aggaaggggt cagtattcct cacaaggtgg ggagcagggc ctgccctgga 7200 caggggaact agtgggactt aagatttatc tgggtggaat tcccctggtg gcgcagcagt 7260 aacggacccc actagtaccc atgaggacaa gaattcaatc cctggccctg ctcagtgggt 7320 taaggatctg gtgctcccgc gagctgcggt ataggtcgca gatgcggctt ggatctggtg 7380 ttgctgtggc tgtggcatag gccggctgct gtagctctga ttggacctta gcctgggaac 7440 ttccattcgc tgcgtgtgcg gccctaaaag accccgatcc ggcaaaaaaa aagatttatc 7500 tggatgggct ttctagggca gagggttgaa agaggagagg gacatgcccc ctgccctccc 7560 tgggcccttg ctcagcatcc ccccatcatg ccttgcagat gcccccaagg gtgtggagat 7620 ccttttcagc cactccggac ggaacgtcct tccaggtgat ctggtcaccc tcagctgcca 7680 ggtgaatagc agcaaccctc aggtcagttc cgtgcagtgg gtcaaggatg ggacgaagct 7740 caaagaccag aaacgtgtac ttcagttgcg ccgggcagcc tgggctgatg ctggcgtcta 7800 cacctgccaa gccgggaatg ccgtgggctc ttcagtctca cccccggtca gcctccacgt 7860 cttcagtgag tcctgaagga gcctgggtct tgatcagagg gcagcgttgg ggttaaggaa 7920 accaggccaa ggcacctctg gggatgcggg tggggagtcc caacccggcc tcagacaggt 7980 gatcgcctgg gatgtatgga ggatcccagt gaacagggcc aagagatgcg gagccaatcc 8040 gagaggcgcc tccgcagaag gggcggggcg tagactgtgc agagcttaag gctgattggc 8100 tgcaaccatg aggggttggg cctggaagtc ctctgggtat cccccagcgt gtcctatgct 8160 gtccccacag tggctgaggt ccaggtaagc cctgtgggct ccatcctgga gaaccagacg 8220 gtgacgctgg cctgcaatac acctaaggaa gcgcccagcg agctgcgcta cagctggtac 8280 aagaaccacg ccctgctgga gggctctcac agccgcaccc tccggctgca ctcagtcacc 8340 agggcggatt cgggcttcta cttctgcgag gtgcagaacg cccggggcag agagcgctct 8400 ccccctgtca gcgtggtggt cagccgtaag tgagggtgga gggaccggtg gggagtctgg 8460 acctgggaac tgagccaaaa agtaggaggc cctgcaggac gtttggggtc ctgggcccag 8520 gtgcccttga gctcacatct tggagaggcc ttgaccttcc tgggcctcag tttcatccta 8580 tttttattac tattttttaa aatttatttt gtctttgttt gttttgtctt ttctagggca 8640 tatggaggtt cccaggctag gggtctaact ggcactgtag ccacccgcct acgccacagc 8700 cacagcaatg caggatccta gctacatctg tgacctacac cacagctcat ggcaacgccg 8760 gatccttaac ccactgagtg aggccaggga tcaaacccgc aacctcatgg ttcctagttg 8820 gtttcgttca ccactgagcc acgacaggaa ctgctattta ttttgtcttt tgtcttccct 8880 agattctcca tttgttaaca ttttgatacc tttgcttttc tctctctgtg tattatgtat 8940 gtgtgtgtat aggtgctcac acatgcacac acatgcatgt atgtgcatat gtacatatac 9000 acatgaaagt gtgcatacag gcatacattt tctccacata aacacataga catttatact 9060 ctctctagcc acatgcatat acacacatgc actctatatg tatacacaca cacacatgct 9120 atctattatc aatctatcta tttatctacc tatctatcta tctatcaatc ctcctgaacg 9180 tgcaggcata atgcctcttt actccttaat ttctcagcat gtatttccta aggtcattct 9240 tgtgcataac tgcagtacaa taactatagt caggaaactt aacattgata ccattgatat 9300 aagactctta tccaatccac aacccacatt taaattttac caggtggccc aacaatgtcc 9360 tttatggcaa ttatttttct gctccaggat ttggtctggg atcctgcctt gcattcagtt 9420 gtcgagtgtc tttatcctcc ctcagtctgg gacagctcct aagtctctcc ttgttttcct 9480 tgacattgaa tcccaaagat cacaggcctg ttgctctgtg ctgtcctcag tgtgcgttga 9540 tctgagtggg gcagactgag gctatgcacg tgagcaggga catcgtggct gtgatgctgt 9600 gtctgtctcc ccctgcatca caacaggagg cacgtggggt ctgtttgtcc cattgctggg 9660 agcattcact ttgatcattt gctgcagtgc tggccgctgg ctggtttctt tgttagattt 9720 cccgtcttta tttttatttc attttatgtt tttagggccg cacctgcggc atatggaggt 9780 tcccaggcta ggggtcgaat tagagctata gccactggcc tatgccacag ccacagcaat 9840 gccagatccg agttggatct gcagcctaca ccacagctca cagcaacacc agatccttaa 9900 cccactgagc aaggccagga actgaacctg tgtcctcatg ggtactagtc agattcgttt 9960 ctgctgagcc acgacaggaa ctctagtttt cccgtcttta aaatgggtcc ctggagcccc 10020 attctcaggg ttgccacaag gattgagtag gatggcaggg caatttaccc agttcaggga 10080 caggcactca ggagccattg gggtgccccc tttcccaggg cattatggga caaaaatggg 10140 tgcaggggtc ataggctata aagggagatc caggagtgcc cctgttgaga gtgacaggcc 10200 ttccttcatc cccacgcaga cccacccctc accccggacc taactgcctt cctggagaca 10260 caggcggggc tggtgggcat cctccaatgc tctgtggtca gcgagccccc agctactctg 10320 gtgttgtcac acgggggcct catcttggcc tctacctccg gggagggtga ccacagccca 10380 cgcttcagtg tcgcctctgc ccccaactcc ctgcgcctgg agattcaaga cctggggcca 10440 acagacagtg gggaatacat gtgctcagcc agcagttctc ttgggaatgc gtcctccacc 10500 ctggacttcc atgccaatgg taagacggcc acagcagggc tagtggaggg agcctcaggt 10560 ttgttctgcc ccctcctcct gggagtccag agacctcaac caagggcctg aactagctgt 10620 ctagaaaaaa ggaatatcaa aaatctgagc tgtaccgtca tcccaggctc agaggttcct 10680 agaagtcaag gcaaaaaggg gaacatggtc gattgcatta ttcctttttt acccattctg 10740 actctgaact tggagggttc ctcgatatgc atttatttgt ctttaaatta ttgaacattt 10800 gggggcagac tctgtgctgg ggtcttctag ttcttggtgc atatgctgct cttccctcct 10860 tctgagacag gcagagctaa tcaatcaagc caggttttta acataagcct gggattgggc 10920 tcagaatcct tctcaatcat gctgcagcca gctacgacca attagatcca aatgggcatt 10980 caaagccaaa ctctcctgat cattgagaga ttcgcagagc tgatgtaatg aagctcagac 11040 ctccctacaa ttgtatgggg agaggggaac cctggcgggc ttcctgcagt ggggggcatg 11100 gaaccgcgga tgtgtggggg agctgagcct ccctctctcc ctctcctgcc agcagcccgc 11160 ctcctcatca gcccagcagc agaggtggtg gaagggcagg cggtgacact gagctgcagg 11220 agcagcctga gcctgatgcc tgacacccgt ttttcctggt accggaacgg ggccctgctt 11280 ctcgaggggc ccagcagcag cctcctgctc ccagcagcct ccagcacaga tgccggctca 11340 taccactgcc gggcccagag cagccacagc gccagtgggc cctcctcacc tgctgttctc 11400 accgtgctct gtgagtagcc ggcctgccag ccgtgcctgc tagggggagg gtcagctccc 11460 acctcctcca ggccctcctg actctgccct gtctgggagt cttgataagg aggcagccca 11520 ggcaccc 11527 <210> 124 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 124 agaggccact tgtgtagcgc 20 <210> 125 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 125 caggtaccag gaaaaacggg t 21 <210> 126 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 126 ggaacaggct gagccaataa 20 <210> 127 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 127 ggttctaagt actgtggttt cc 22 <210> 128 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 128 gcattcctag gcacagc 17 <210> 129 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 129 ctccttgcca tgtccag 17 <210> 130 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 130 gatctggtca ccctcagct 19 <210> 131 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 131 gcgcttcctt aggtgtattg 20 <210> 132 <211> 29999 <212> DNA <213> Sus scrofa <400> 132 cagtagtcat aaaacaggat ttgtttttca cagtaggatg ggatttcata tttcatttca 60 aatatggcca gaccataatt tactcaacca atcacctaca gctgaatatt tgggttattt 120 ctgatttttc ctgaattata aatatcactg caggagttcc cgtcatcgtg gtgcctcgaa 180 atcgaatccg actaggaacc atgaggttgc aggtttgatc cctggcctcg agcagtaggt 240 taaggatcct cgtttccatg agctgtggtg taggtcacag acgcggcttg gatctggtgt 300 tgctgtggct gtggtgtatg ccggcagctg tagctccgat tcgacgccta gtctgggaac 360 ctccatatgc cacaggtgcg gccctaaaaa gcaaaacaat caaacgaaaa aaactcactg 420 cagtaaaagc tttatccata aatgttctac ttcattaggc taaattctga aagttacctt 480 cacttctatc cccaaactgc cctccagaag atccagctac ccttcggcca cagggatatg 540 tgtactactt tccaagtgcc ctcagagcct aaggtggaca ggcaggaacc caggattcag 600 attgtctcct ggccttgctg agcctttgta tggcttgtcc gccatagaga gaattatggc 660 aaataggctg gaggaggggt ctaggcatct tgagatcgga gggagagaag gaagccccaa 720 agaagctgct gggatctcgc tcagagccaa cttattcacc ttacacacaa ttctatattc 780 cagtaaactt gtgacctggc ttttaagagc acagcaacga attaggaaga ataggaagga 840 gaagcaaggc tgcttcttag aggcaccctg gcccatggtg ctgtttccag aagagcaagc 900 acaagtcaga caacaagcaa ccacccacag accagtgcta aactgtccca cagaccccag 960 gaatggatga ggaagagtca attagattgg gtgatctcaa tttgcttcta aacctgagat 1020 tctggaaggt atcttgaaca atgtgggggg cagaataatg ccccctcctc aaagaagttc 1080 ttgtcctaat ccctagattc tgtaaatacg ctttgctatg tggcaaagag gtattaaagt 1140 tgcagatgga aataattgct aatcagctgg ccttaaaata aggagattgg tgttcccatt 1200 gtggctcaga ggtaacaaac ctgactagta tccatgagga tgtgggttca atccatggcc 1260 tcgctctgtg ggttaaggat cctgcgttgc tgtggcagtg gtggatgggc ctttgcctgc 1320 tttgaaaatg gtagggtgcc acaagccaag ggatgtgggc aggctctaaa agctggaaaa 1380 ggcaaagaaa tggatgtttc ttatgtagac tgtccagaag gaagtcctgt ggacacccat 1440 gaatataacc tagtgacacc caatttggac ttgacttaca gaactgcaag ataataatgt 1500 gcattaaatg tgtatttatt tgttacagca gccataggta aggaatacaa ataatctggc 1560 ccagtcaaaa gatgctcaga gaagaggagt gcccttcccc tggccacaca gcttctgaaa 1620 gcagcatacc tctggctcca gtttttgttg ttgttgtcct tgtttttgct aggtcctgct 1680 gcttctctgc cttcttaata atgagcccca tgtctcacat aagttaaatt atgtccttct 1740 gagattcagt tatctggaac agccatctcc agggaacgtc ggatttcttt ttctgaatga 1800 gtggttggtt ccccttgccc cagatcgaaa ggcgaggctc tgtgcccctc cgccaagggc 1860 agatgcccgc cagatgtgta ggggcggggc cctggggaag ggggtgcggt agcaggaggt 1920 ctggaacgga agagccactg cggtggctct acgtctgggg gcctccaggg agtggaggtg 1980 gggtcagtcg gggcggggct gcgggcgggc aggggttaac tcgggaggaa tagtggtggg 2040 gtcaggttac ttccctttaa aaagacgcgg aaaggaggag tcaggttctg gtgggcagtg 2100 tcggtggctg gcctggctct tcgtcccagg gaggaggctc tgagccggct ggggttgagc 2160 gcccctgcgg ccgcaggcaa gtggagtgcg ggttcggagg ggctgcgggg ctgctgcggg 2220 cggcagctgg agtgaggcag ggacctggac ggaagcgcgc gcgcggaact ccccgcgacg 2280 gccgccgcgg acgctctctt ctcagactgg tacactgagg tcagccgaga gtgaagaatt 2340 cttttggtca atgtcccgct ttgatctctc ggccaaattg gtccccgcag cgcgcctatc 2400 agcgggccag gggaccaccc acctggagag gtggcccccc agggtgggga ggggggcttc 2460 tggcgcctct gggggaggac agatggagag acccgggtgg tgccgcagac tctgccctgc 2520 tgggatctga ggcagggtgg tctgggggac tcaaccccag ccgagtgcca gctgggtgac 2580 tgtgaggcac agcagctgag tcctccagtg ggtggggcac agccaaagat gagcgggaat 2640 tccagcggcc ccagggatcc gcacagcccc caggagagga gagggccccc ttcgccaacc 2700 ttggacattt gcctctctcc aaaggcttcc acctaacccc tattttaaag agaattcctg 2760 tttttaagca tccattttaa aatcgtagtc tcccttctta caccgacccc attgggatgc 2820 atgtgggttt tccagatgcg ggaacagagg ctctgggatt atggagtctg ctccagccct 2880 ccttggggag cagccaagac agatcaatgt tccaaccaac attgaaaggg gaggggtccc 2940 caaatggggc caacggggtc cgtaccctgc acctccaaaa ccctcagtag cgcagtgggc 3000 cagggtgccc agctgggtca tgccttgcac ttttgtgact tgaatccgcc tcctctctct 3060 agcccagccc aggccaagct gttcaattgt cccagcattg ttctcagtga gacctgaggt 3120 ctcattgtag ctttgtccct gagtctttat atgacctgga cctctctgag cctggcttta 3180 ttcacctgtg aaaggggagt gttggaccag atatgggccc ttgagtccgt ccatctgtgt 3240 ttgaggagtt ggctgtagag gaatgaggtg gaggaagggg aaatgatgat gtggctggga 3300 ggaagtggaa atgggcctcc aggccaagga agcctgaggg taagggagct gggaaaggca 3360 gggcaccctc cactaccgtg gactggcatc ctccactagc ccacctcccg aaggagccct 3420 agcatcgaag gctggatgag tttggataat agcctacctg agagcactgc cccatttccc 3480 agatggagaa acgccccctg ccctgtctca gagccttggg agagggggca gctccttccc 3540 acttccacaa gtcctccagc ccctttgctt caagagtttt attgctaagt attctgagga 3600 gataagtggg ggcccccgca tgcgtaggca ctagggcact ggaactaggc ctagttcctg 3660 ggcctgcggc tctgctggaa gatattagac aggaccccat gctgggggct attcgagaat 3720 cttggagaga aacatggacg gtgggccagc tggtcacgct gaggccgctg ggtctttcat 3780 tcacacgggc agacagccat tgcctccagc ccaggcccag ccctgggtgt ctgtcctcag 3840 agatgctgca tgatttggct gcacccttca ggacaggcca gagtccctcc ggaggcctgt 3900 gcctggtagt gcacccctgc tgagagaaag tgcccctccc taggaccacc cctagcttct 3960 ggtcctggtc tgggggtagg gagttcatgt cccctgggta aagtccccaa actgacttcc 4020 accaggttcc cagtctctca gtcattcctt tgcagcagcc actcccatcc ctgcccttta 4080 gtatgcctat aaaattcagt aaaagggaca cacagttccc ttaaaaggtg atcagacatt 4140 tcatcctgcc cagatcagcc ttgctttagt tgactaaaag gcgtatgtct cctcctgtgg 4200 tgttttagcc ctcctgggca ctgctcagga aatgtgggga gatgtatggg aggatgcttt 4260 aggaggtgta tatagttaag cgagagaatc tgccactaac tagctgtgtg accttgggca 4320 agtcacttaa cttctctgtg ccttggtttc ctaaatagcc aaacagtgat gattatcctg 4380 gtcgtgatta tctgctcagt tagatagatg ggatttaacg ggcaggatcc gaagcccaga 4440 atggcccttc caaagctagt gtgcatcccc cctattccac gagggcctct tctgctcgtt 4500 ttgttctgag tgccctgcca ctgggctcca gaggccacga caggaaccga ctctccactg 4560 gggccgtctg tggttctcac aggatggacc atgttcacgg ctcccagagg aagcaccctg 4620 cggctggccc caggcccagc ctcttggagc tgtgggtgga gacctcagaa gcctgggaga 4680 aggccagggg cctgaagggc cagtgtgtgc cctgtgttgg agccccagcc ccagcctcat 4740 ccccctcccc actctctgct ccttcccagc agacagatgg gctttgggtt gttccctggc 4800 tcccagcctg cccagccctg cagctgaggg ggctgggggg tagcactggg ggcggggccg 4860 gcaggaggca ccgagtgagc agcagttatc ccaagaccca gggatctgcg aggaagcctg 4920 ggctgcacag ttgtttgcct gcctgctgat cctaggctcc ccctcccagc ccctcgcagg 4980 ctcctggcga gttcatgttt gaaacgaagg caacttgtac cctcacatct gagattgagc 5040 tgcctttggc tcttcatttg atgtcttcta tgtgagtggc tatgccttaa agattctcta 5100 atacaattgt tatcaacctt aaattttttt tttttaattt agaacttttg ttctcaaaca 5160 caaacatagg cagggcaggc ataatacata atttctgtat gtatacataa acccatagat 5220 agactgcttt ggttgagact ggggcttggt actaggcttc tccctcatca agagatgggc 5280 agtgaaagga atgtgcacat tctgctcacc tgtccacccc caagacagcc ggcaggtgat 5340 gccaccccca gaatcatgta ggatggagta gtgattccca aagtaagtgc agctatacaa 5400 gatcatttta gggaatacct agatgtatag tttttttttt tttttttttt tttttttttt 5460 ggtcttttta gggccacaac cgtggcacat ggaagttccc aggctagggt tgaattagag 5520 ctgtggctgc cagcctatac cacagccaga gcaacgccag atccgaacca catttgcaac 5580 ctacaccaca gctcatggca acaccggatc cttagcccac tgagccgggc cagggatcaa 5640 acctgcaccc tcctggatac tatgttacca ctgagccaca atgggaactc ctgaatcatt 5700 tttaaatcag tagtcataaa tggaaagtgt atcaggaaaa atataatgta atacatccaa 5760 ccatgacttt atggtcatta ctattcagaa ggagagcagt aaattgattt gaagaaaagt 5820 ataagtaaat aatgtacagg aggatcacgg atatggcaaa actcatgcaa gtggtttgta 5880 tgcacagcct tggagcccga gaaggagtgt gagccacaga gggaatctgt gctgagagtc 5940 aagagtttga gttacaccga gttccatctt taaccgctgc cactcatttt cttactgctg 6000 cttccattcc actagcgtgt gtgacttgcc tgctgcatac tagctgcttg cctggtgtgg 6060 aggatactgt cctcacagcg ctgggtcttg gggaagcagg agggctgtgc tgggacagca 6120 tgactgaagt gagcatccag catgaggggg tgataggtga gggaaagaca gaagctttcc 6180 aggcccagag ggtgggtggg gggagggtgg gtgctggaag agggaagaga tgatgggctt 6240 gagaaaccga aagaggccaa agcgttgaga caagactgga gactcatggg gctgtgtcac 6300 accggacctc taagccatgg caaacatcgt ggacattgtc attcgtttag ccaacatagg 6360 gcttctgccc tgtgctaggc atggaggggt gttcgcagag ccttcccttg aggtgccttg 6420 gtctagcgag aagctttaga acacatggat ggccttttct taagtgctgc gatagatgaa 6480 tgaaccagag gccagggaag cactggggta aggggctgcc cactcatgag aaggtagtga 6540 catctgagct gtgttttcaa gaatgagtag gaaggagctt gacaggaggg agaggaaagg 6600 cattcctcag cagtggaaat aggatgggtc aagaggtatg aaaaagtgga gagtatggag 6660 aaatgctaac agctggagcc atgttgggca ttggaagcag aggccagagg gttaacttca 6720 cagaaggttt tcagactcaa gccagaaatg aggtttcatt ctgccagcag tgaggaactg 6780 gagaccaggt tcaagcagga gaggaagatc cctctgcgga gctgtgtggg caggctgggg 6840 gacagggagg acagctcagt tattgctgtt ccctgggggt ggagatctgt gcctgggtca 6900 ggggctgaaa gaagggtccc ttttcattat caaagaaaat ggggactgtg gagcaggccc 6960 ctctgtgccc ccagcctggg ctggcatggt gcccagaaca gggacctctc attacagggc 7020 aatgggtggc ccgctgcgcc aacttggagg accagaggcc ctttccaaag gagtaaagac 7080 tccagccaac caggcccgtg gtctgtgtcc aaagcaaaca ggaagaggcc atggtaggcc 7140 aggccgggcc tcttcctttg tttggagtag ggattaggcc aggcaggctt gtgtgtcttt 7200 ctgcagcaaa gggagggggc tgaaggccct gcagagtgaa actcagtgca ggggatacat 7260 ggcccctggg tgccagacca tcggcctata aaggtaaata aaggggacct gccttggcaa 7320 agtctagctc tgatggaggg aggccagaag tatatacttc tcaccctcgg tcaacttcag 7380 gggctgctgt tccttctgtc actgtgccca agctggagtc ctcccccggg tacttggctt 7440 ctcactcatg ccccctggcc atcagcccag gcctgatgga ggtggctgta ggtcaccgag 7500 gtggtaagtc cacactgccc agcctagggc cctgagggca agtctccaga gagaaggagg 7560 gaagtgctaa gggctcagag cccccttaag ctgaacgata ggtacctggg atccctctga 7620 agaccctgca ctcaagtccc tggcctccac tggccatagg acaggtagca gtcattcact 7680 cttacaagca tgcctgaagg aattaatcta tgcatacatt taatccatgc atgcattcat 7740 tcaccaggct ttcaggcagg ctcggggggt ggccagccca agccagagca gggagtggca 7800 gatgaacaag gtcctcaagg cgttgacaag ataggcataa gccctgagat gcgtttggcc 7860 ccaggagagt cttgcccatc tgccatggtc ggaggagggc tcaaaagaaa ggggctgaca 7920 attctcccag ggcaagggtg ggaatgggga caggggacag atgggctaga aagacttcag 7980 caaggagtga ctcttgaatt gactcatttg tctatgcacc cattcatgca tgtgtgtatt 8040 cactcaacaa atatgtattg agcaactact gtgtgctggg caccatgcct agtgccagtg 8100 agcagaagca gccaaggatc tgttctccag gggcctgtcc tgcaggagtt cccatcgtgg 8160 ctcagcagaa atgaatctga ctagtaacca tgaggatgca gattcgatcc ctggcttcac 8220 ttggtgggtt aagcatccgg tgttgctgtg agctgtggtg tagatcgcag atgtggctca 8280 aatcctgtgt ggctgtggct gtggtgtagg ctggcagcta cagctctgat tggaccccta 8340 gcctgggaac ttccatatgg cgcaggtgca gccctaagaa gacaaaaggg gggggtcctg 8400 cagttagtgg gggagccagg cagtccttga gtcatcacca cacagataaa tggtgctcag 8460 ttatagggct ttaaggaaga gatttgtggt gctgaagggg catgactggt cagggaggtc 8520 agggtgactt ctctgaggtg gaatgggggg ataaagagga tattaaccag ggcaagaaga 8580 ggaaaaggag gatccaagct gagggaactg cacgtgcaag gtcctgtggt ggaggggctg 8640 gatgaaggcc agagtggtta cagttctgca cagagctggg tatggtgaga atgaggttgg 8700 gaaattagcc agccgatagc acttgaactt gtgggtgtct tttaaaagac tgggtctgaa 8760 ttccaagagc aaaaggaagg tcttaagcag tgggtaaaat gatccaattt gtgtggcaag 8820 cttgtttgag ggggccctag tgcaagtgat tatccactag gataacgtga ggatccagcc 8880 ttgcccacat aaatgatgag aatggctttt gccaaggaca cggtgagaat gggggagagg 8940 gtgagtcaga tgttggggtg agggtcaggc gttgaggtcc aagaaactgg tggatgggaa 9000 gggtgacagt gaacattgtt ttcctgtaag gacatgtgct gttgagtata aggagtacct 9060 tcatttctac cacggataga atgggtgacc ctctggatga gaaagaaggg aaggattttg 9120 aggttctact atatggtgtt taatatgttt tctaacatta aatccgctca ccaaatctga 9180 gacgtaaatt ctagtattta tttatgtgaa cagggttctc agaaaggaga acttacctgc 9240 cagaggtcat ggctgggaag aggttaagcc gccgctagcc tcccttcttt aaaaaaaaaa 9300 aaaaaaaaaa aaaaaggcaa aacaacttat ttcattctac tcagtgagct gataattgag 9360 gggaaagttt ttggcaagaa gggaaagtgg cggggggagg acctggaaga actccctgct 9420 ctggaagaat gcgggaggct gggaccatgt ccctgaggag cgccgggcat ccctccaact 9480 gcagggctga cccggtgtgg tcttgacccg agccagaggc cggctctccc cgtcttttca 9540 cctcccacct cttgctcctg ggacgtcctt cgaccctcct ggatctaacc tcagtcttcc 9600 tgctcctgtg cctgttgtca tagctcacag ctcacaggga gatccaagcc acctggccgc 9660 tccctctccc cgctgggcca gctgcctgcc acctgccctt cagcccttgg tgggctccca 9720 ggctcctgca gcctgtaacc agaccctgtt tgctcccagc aggcacccct gagccgcact 9780 ccgcacgctg ttcctgaatc tcccctccag aaccggagca gtgtctctac ccagttcagt 9840 gaccttcgtc tgtctgagcc ctggttaatt tttgcccagt ctgcaggctg tggggctcct 9900 ccccttcagg gatataagcc tggtccgaag ctgccctgtc ccctgcccgt cctgagcctc 9960 cccgagctcc cttctcaccc tcaccatggc caagggattc tacatttcca aggccctggg 10020 catcctgggc atcctcctcg gcgtggcggc cgtggccacc atcatcgctc tgtctgtggt 10080 gtacgcccag gagaagaaca agaatgccga gcatgtcccc caggccccca cgtcgcccac 10140 catcaccacc acagccgcca tcaccttgga ccagagcaag ccgtggaacc ggtaccgcct 10200 acccacaacg ctgttgcctg attcctacaa cgtgacgctg agaccctacc tcactcccaa 10260 cgcggatggc ctgtacatct tcaagggcaa aagcatcgtc cgcttcatct gccaggagcc 10320 caccgatgtc atcatcatcc atagcaagaa gctcaactac accacccagg ggcacatggt 10380 ggtcctgcgg ggcgtggggg actcccaggt cccagagatc gacaggactg agctggtaga 10440 gctcactgag tacctggtgg tccacctcaa gggctcgctg cagcccggcc acatgtacga 10500 gatggagagt gaattccagg gggaacttgc cgacgacctg gcaggcttct accgcagcga 10560 gtacatggag ggcaacgtca aaaagtaagt caggtggggg cacaccctag atgctgaggc 10620 agagctggat cctgggggcc aaggaagggc ttggattcgg gaccttggaa ccttctggag 10680 actttggctg gcccgtcgct ccatccgcag ctctggtaga gaagctatct agacaatcag 10740 ccctttcccg gagagccccc ctaaccttag ggagtcaggg gtgagtgatc caagtgcccc 10800 cttgggtaga aaggaaaaca ggctctgagg acagaaattt gcccaaggtc tcccagctaa 10860 ttcaggggtg gagcctgccc ggactttgac cccaagtcca gaaggagctc tgctctccca 10920 agtcagctgg cctgtcagcc tggaggcggc ctgggggagg cggggagggc agggatgggg 10980 ctgtgcaccc ctttccatgc ccagccagcc atggcctaca ccccccaccc ccggccaccc 11040 ccatgggcac aggcattttg ctggcatacc ttctaacccc ctgcttcggg cagggtgctg 11100 gccacgacac agatgcagtc tacagatgcc cggaaatcct tcccatgctt tgacgagcca 11160 gccatgaagg ccacgttcaa catcactctc atccacccta acaacctcac ggccctgtcc 11220 aatatgccgc ccaaaggtga gcgggcctgg cggggaccac acggcctggg aaagcaggtc 11280 cctggggctg gggtgcaggt ccctgttgct ggggtgcagg cccaggaaga gggcacccct 11340 ccacgcctgc gtgtcgcacc caggttccag caccccactt gcagaagacc ccaactggtc 11400 tgtcactgag ttcgaaacca cacctgtgat gtccacgtac cttctggcct acatcgtgag 11460 cgagttccag agcgtgaatg aaacggccca aaatggcgtc ctggtaaggg gctgagccca 11520 cctgcccttc cccacattgg ccctggcctg ggaagtattc ccatttatcc tcatccttgt 11580 ccctgtgctt gagtcgtgag gcagtgtttg aattccagct ctgagtcatc ttgggcaaat 11640 gtcccaagtt ctctgacctt cagtctctgc atctgaaaaa tgggaccctc ctcatgaagg 11700 gagttcctgg cccctgaatg ccagacagat agcagctgag tctgtggtta ttccccaaag 11760 gctcaaagct ccgcagggac acccccttta ccgccccacc gcccccgcca ccctcttctc 11820 tgctgaccaa acctccactt taacctggtt tgtccccctg actctgggac ttggcccacc 11880 agcaccagga cccaaggggg gccctgaccc acctctatct ttgcagatcc ggatctgggc 11940 tcggcctaat gcaattgcag agggccatgg catgtatgcc ctgaatgtga caggtcccat 12000 cctaaacttc tttgccaatc attataatac accctaccca ctccccaaat ccggtgagtg 12060 aggggccttg catgggggga ggcggactgg tctcccccca cctccccata cccagagacc 12120 atcctgccaa caccctggcc tccccagacc agattgcctt gcccgacttc aatgccggtg 12180 ccatggagaa ctgggggctg gtgacctacc gggagaacgc gctgctgttt gacccacagt 12240 cctcctccat cagcaacaaa gagcgagttg tcactgtgat tgctcacgag ctggcccacc 12300 aggtagcccc catagcaggg cgtgcagaca gagaagggag gggggctctg ggaggagatg 12360 gcacaggtcc tggctctgtc cttggcagcc aaggagggag gaggggtcca cctggcaggt 12420 ggcagggagg agtcacaatt aggtcagtaa agcctcacac tcaagcctgg catgcgaaga 12480 acacttggtc aagagtagct ctgggtactt agcgacctcc ctcccccaca gtggtttggc 12540 aacctggtga ccctggcctg gtggaatgac ctgtggctga atgagggctt tgcctcctat 12600 gtggagtacc tgggtgctga ccacgcagag cccacctgga atctggtaag cccactgccc 12660 gggggccctg tggtctggga tgggggaggg cctgcgtcac ccttcccagg ccagtctcct 12720 gatggctctc agggctttgc agaaagacct catcgtgcca ggcgacgtgt accgagtgat 12780 ggctgtggat gctctggctt cctcccaccc gctgaccacc cctgctgagg aggtcaacac 12840 acctgcccag atcagcgaga tgtttgactc catctcctac agcaaggtgc tgcccagcct 12900 ccgtgctggt gctgagacag tggggggcgc agggaaggag gtggggaccc tgcccatgcg 12960 gacccactga agctggggct cccagagcgc ctgtcccagc ccagtgggga cacagggtcc 13020 tgctggctct gcgcagcctt ctgagccccc tcccctctac cagggagcct cggttatcag 13080 gatgctctcc aacttcctga ctgaggacct gttcaaggag ggcctggcgg tgagtaccct 13140 tggccagctg ttgggtgggg ggcgtttcct ccagccctgg ccaattgcag aggtccattg 13200 ctagagcctg gcagcaccgg ctttcccctc actgtgccct gtctttccac agtcctactt 13260 gcatgccttt gcctatcaga acaccaccta cctggacctg tgggagcacc tgcagaaggt 13320 cagtgatagc cagccaccac cccactcccc gccgccaccc cgcccctgcc ccccccccgc 13380 cctcccaacc caagctgttc tatgggggct ctgagatgct ggaagtccct aggggcagca 13440 cgcatataag agaacaggcc cagcccccct gcttaccctc ccacacaggt cacgtggagc 13500 ctcagttgct catctctaaa atgggctagg tgatggctcc tcgaggaggc atggtgagag 13560 cctgtgttgg gagctctggc agagggctgg ccctaccact gtagtgagct ctgaggggtc 13620 ccctcatcta ggtggggagg acatgggctc tcaggtttcc cagggccaag ccttcctctg 13680 ccaggaactt tggagcctgt ggttcacctg ctcagcactt ctggctgccc tgtgcccggc 13740 cagcccctcc caggcatgac ttcgcacaga ccagcaccct cagcacagct ttgaccctcc 13800 cacccagctc cactccaccg tctgtgaggg caaacctttg ggccaagtcc cccctccctc 13860 cctccagcct gcccctccct gccctcctga ggctggagtt gcaccctctc caccatcccc 13920 caccacagtc tctccttgac agctgccgcc acccacccct tctctatggc cctcatcagt 13980 cccactgacc cctccacgtg cccatgctcc atgaccagcc tgaccaggga ggggagccct 14040 ggggccttgt tccagagccc cggccaggct gcagggccct cccagcgcca gctcaacacc 14100 ctctaccacg agtctggtcc cctcccccac ctcccatagc ctcagtccct cccctctgct 14160 tccacatctt ccttgccctg cctggatttc tcactccatc cctcctccac gccagagccc 14220 cttcagcccc atctctgcct ccccttccct ctttccctga gcgccccctc ccccagctcc 14280 tctcctgctc agcttgcccc ttttaacgtg gtcttctgcc ctctttttat gctgttgtta 14340 gtttttattt tctcagttat taacagaggt ggttgccctt ttgttattac aaaagcaatg 14400 agggagttcc cgtcgtggcg cagtggttaa cgaatccgac taggaaccat gaggttgcag 14460 gttcggtccc tgcccttgct cagtgggtta acgatccggc gttgccgtga gctgtggtgt 14520 aggccagtgg ctacagctct gattcgaccc ctagcctggg aacctccata tgccgcggga 14580 gcagcccaag aaatagctaa aaaaaaagca gtgggactct cttgtgggtt aaggatctgg 14640 catagccact atagtggcca aggtcgctgc tgtggcacag attcaatccc tggcctggga 14700 acttccacgt gctgtggggg cagccaaaaa agacaagaca aaacaaagct ttaagacaat 14760 aatagccacc caaagcccat ccccacattc tcagcctggt gcacttcctt tgcatcgacc 14820 acagcccgct ccttggccct gcctgtgaca tcttccttca tccctgccca tcctcccaga 14880 tccgttcagg ctgacccatg gcatcctgga tgcccctccc cgacacacac ccacctcagg 14940 ttggaccaca gaaaaggagg gccagggatg tgttgaatca gtgcagaata aaccggaggc 15000 tggggcactc ttggctcatc cagtgccagg cagctgaggg gagagatggc caggccggga 15060 ccccagctcc tgcctcccag cccagtgctc ctccactgcc ttccagcaag gcaccactag 15120 ggctagtcca ggggtaccag ggctgccgag atgggcaggt gggagaagag cagtctgctg 15180 acggctgcgc tatctcactc tacccaaggc tgtggatgct cagacgtcca tcaggctgcc 15240 agacactgtg agagccatca tggatcgatg gaccctgcag atgggcttcc ccgtcatcac 15300 cgtggacacc aagacaggaa acatctcaca gaagcacttc ctcctcgact ccgaatccaa 15360 cgtcacccgc tcctcagcgt tcgagtgagc agatggagtc attgagccag gcgttctccc 15420 gagggttctg aggactattt gctgtgggac actctgacca tagcagggtc tggcctctgt 15480 ggcctcggcc acaatagttg ttgacagtct tcctcttggg gccagagtcg agcagaaacc 15540 gagaggccgg gcagggctgc cttcgctggc ggtggtcaca agctgccgtc tctcacacct 15600 ggcctctgga tctcttgttg cagctacctc tggattgttc ccatctcatc tattaaaaat 15660 ggtgtgatgc aggatcacta ctggctgcgg gatgtttccc aaggtaagcc cctctccttg 15720 gcattgcccc agtggcctga gggccagctg ctgccaggct gcaggaggga ctgctctgct 15780 gaagcctggg gagaggaggg ccgggggtca ggtcagtcca tggccttctc agcagcccct 15840 ccccggctct gctccctccc cacagcccag aatgatttgt tcaaaaccgc atcggacgat 15900 tgggtcttgc tgaacatcaa cgtgacaggc tatttccagg tgaactacga cgaggacaac 15960 tggaggatga ttcagcatca gctgcagaca aacctgtcgg tgggtacctg tcgccccacc 16020 ccattcccgg gatgttgccc cagactgcag gccctgcctg catcgccagc ctgaggtcac 16080 acgctctgtt gcccctccta ggtcatccct gtcatcaatc gggctcaggt catctacgac 16140 agcttcaacc tggccacgtg agtgtccctt cctcctccag ccctgccagc tcagccacag 16200 aagcctagtg acttggcaag tgtgactcca tagtgagagc cagtgctcct ccccctgtcc 16260 tcaccgcgag cggcacagca cagcgggctc cctgggcttc cggacacccc tcccctggcc 16320 tcacatcccc agagattgtt agtgttacag cccacatttc ccagagaagg aatccgagac 16380 tcagagtttg agttccttgt ctgaggtcac atagttgccc aggacagcca gacacaggcc 16440 tgtccttctc taaaactaca ctgaattcca tggcaccaag gttctcctga gggctaacta 16500 tgggccaggc cactgtgcta gaggctaaaa aacatctggg aaggtcggta caggagagac 16560 gcagtatgga tgaacaaata tttatcaagc agctgctgtg tgtgtgaaca ctggcaggtg 16620 cgaggttctt tgccatagat gtcacccata gacacggaca ttgctcataa atgtcaaaat 16680 ggtcaccgat ggaggaggag gagggaggaa agaccagaga gccaagcaga tcagagaaga 16740 gagggcacag gaagaagcac agtcttcttg tctttttgaa cctcagttct gtctcttatg 16800 ggctgtgtgg ctttaggcag ggcatgtcac ctctctgagc ctcagtttcc tcacctgtaa 16860 aacggggacc atgagcaagg acatgtgact ggcagtggat gagggccagg cctgggctgc 16920 ccttgtttgt ggcaccaccc agccgccatg tctcccactc ctggtgaatg ttggagctgg 16980 ctcaactgca gctctgggac ctcaggctct aggaggaggc tgaggttcct acagggagga 17040 tgggctggct gggggtgctt atttgagccc ctctatctcc ccccagtgcc cacatggtcc 17100 ctgtcaccct ggctctggac aacaccctct tcctgaacgg agagaaagag tacatgccct 17160 ggcaggccgc cctgagcagc ctgagctact tcagcctcat gttcgaccgc tccgaggtct 17220 atggccccat gaaggtacag aggagcatgg cagggttcag ggaccagttc ctccgtgttt 17280 gaaattacgc ctcaaggagg tgaagagaaa tattgccggg agtggtgaaa ctgccaggct 17340 gacacgacac caggtccttg gctgagagta gccttggcag tggtgagaga gcgggaggga 17400 tggaggggtg aaaggagcag gagctgggaa ggtgagcagg ttgggcaaca caaagaaggg 17460 gcacagactt ctagcaaagt ttgctagatt tggaaattag cactttcaga aggcaacaga 17520 aaaagccacc aaacgggggt ggggccgggt agggaggcca gtctttcacc cgaggtgtgg 17580 ccttggacaa tcctcttcag gcccagagaa ctcctccgtg aaaggggtgg acctgtgcct 17640 gtctagcctg ccctaagggc caggagggag ttgcagatgt cgcagggagg cgggaggatc 17700 agagggaaac tgcttgctct ggatgaagct gaatctgtaa aggatgttca ctgcagtgtg 17760 gtttataaaa gacaagaaaa ccaaagccgg agttcccgtt gtggctcagc gctaatgaac 17820 ccgactagtg ttcatgagga tgtgggttcg atccctcacc tcaatcagtg ggtcaggaat 17880 ctggcgttgc cgtgagctgt ggtgtagctt gcagacgtgc cttggatctg gcgttgctgt 17940 gactgtggcg caggccagca gccgtagctc ccattcgacc tctaaactag aataagcatt 18000 tggtggaata ttatgcactc ttagatcaca cttagagagg tcatttaaaa atgttttggt 18060 ttttttttca cattattaac ttcctggtat ggtaaatgag gttttaacct atttttaatt 18120 tataagcctt ggagctctga ttcgacccct agcctgggaa cttccgtatg tcaagggtgc 18180 ggccctagaa aaggcaaaaa gaccaaaaaa aaaaaaaaaa aaatgtatta gcttacctac 18240 accttggatc aaccgcatcc tcgtaatgta gttaaatcac agtgtttggt caactcagta 18300 tcaatattta ctttatgtga tttctaaact gtcattctct gctaagccac atagagtgct 18360 gtttacatcc cctttttata tatcttatcc aatgtagcag gtaatacatc agttttgctt 18420 tctcctggag gcatcctcct ggagccctct gctagccggc ccctctgggg ctgctcctca 18480 gctcccacgc cagaggcgct cccttgttgg tcttgtttcc tgaacccacg gttccttcct 18540 tgagtttgtt ctctattggg gcacatcttc cagtttggca ggaagggttc gtaagaggtg 18600 gattgttttc aggtagattg tctgacatgt ctttattcta ccttcacact ggattgcgag 18660 tttacttggg tttagaattt tctaggttag aaattattct ccagaaaatt tcaggttgaa 18720 attgacctca agtctctcgt gctactgtca aaactcccag agccgttctc atttccgctt 18780 ctttcagtgt ggccaggttc ccccttctgg gagcttatgg gcttttctct ccatcctggt 18840 gggcttttct catccttctg tgctttcaat ctgggcaact ttttggagtt cccattgtgg 18900 cttatcagta atgaatctga ctaatatcca tgaggatgaa ggtttgatcc ctggccctgc 18960 tcagtgggtt aaggatctag cattgccgtg ggctgtggta taggttgcag atgcggctca 19020 gatcccacgt ggctgtggct gtggtgtagg ccagcagctg cagctccgat tcgaccccta 19080 gcctgggaac ctccatgcac cacaggtttg gccctaaaaa agcaaaaaaa aaaaaaaaaa 19140 aacacccaat ctggacaacg ttgtctcgct cctttaactg ttcttccccc acccccagcc 19200 cagttttctc cctctggggc ccttgttaat tcaatttact gttcttacac tggtcctcta 19260 gttttcttct ctcctatctt ccagcttgtt gactttttgt tctgtcctct gggatatgct 19320 ctcagcttag cacaccacct ctctacagac tgttttcatt tttcctatcg tatttttaag 19380 cttccaagtg ctattcctgg ctccagcatc ctatgcaata tcccctctgc actctcagag 19440 gatatttatc ataggctttt atgaagtttt attttccttt cactgactta tttcctctga 19500 gttttttgct ttggtctcct ctttcaagtt ggaggctgag ctgccccttt gaatttgaga 19560 atgaggcaat gaaaagtggg aattcccact gtggctcagt gggttaagaa cccgattagt 19620 atccatgagg acacgggttc gatccctgcc ttccctcact gggttgagga tctggcgttg 19680 ccgtggctgt ggtgtaggct ggcagctgta gctctgattc aacccctggc ctgggaactt 19740 cctcatgcca catgtgtggc cctaaaaaga aaaaagaaag aaagaaagct ccatggggag 19800 gtggagtttg tcacctgtag tctccttgtg gggtgactag gtggccaagt aattcctgat 19860 ggggaacctc aaaaattagt atccatgagt gtgttccctg gggactcttc agtgtccaga 19920 gagtgaccct ctctcttatg caccgaggct cactttctgg gatcagggtg aggaagaaga 19980 ctgggggtac ctttgttcag aatgcaaata ttcacctctg gccccctctg cagtccagca 20040 accctcccac tgtgtctggg gaccagaggt ctgagtccct ctgatttagc cttgcccatg 20100 gaaggaggga ggggtgctgc tcgatgcagg gagggaagtg gaggcttgaa agtttaattc 20160 atccttctac agactttgac tccatcgacc tgttcacggc cctgcctcac tcctgtcccc 20220 tgcatgccct tctctctaat cctgagcctt gtcacagcaa gtctccggct tctgtctcca 20280 tctcccccat ggcaggtgct ctgctgcagc ctctccccct ctgccaggcc tgttccacct 20340 ccctcttaca ccttccacct cctaaatgtg cgaactctct catcctctgt ggcttccttt 20400 cctattctct ttgttctggg ctggggggtg agggtgttcc ttttacattc ggatgtggat 20460 gctagttgac gtacatgaca atctactctg ctgaaccaag gtcggcaaag aattttaata 20520 acgtggaata gggcttacac ggggatgcca gctaaaaaga tcagcatact acattgcaga 20580 cctgctgggc agaaaagagg aaagaggggg caaatgcacc aatttggaaa tcttgggttt 20640 ggtacattct agagtcgtta gtgttttctg cctatgcttt aaggcgtttt ctgaattcct 20700 cacaataaag gggcctaaca cttattagga aatggtgaca cttagacaca agagtatcag 20760 aagagatcaa ggggagttcc ctggtagcct aatgcttaag gatccggcat tgtcactgct 20820 gtgatgcagg ttcagtccct ggcccgggaa cttctgcctg ccacaggtat gacccaaaac 20880 agcaaaaaaa agtaaaaaat aaaatgaaga tatcctttaa aaaaaagaag aagaagaact 20940 ggtcaaggat ttgtggagga gaacctcaga tcagtcatct gaaacctgga cgagtgccag 21000 cccctttgag cacagtctgg ccttgtgcga ggcctttagc ctctggcctc ttgctcctgt 21060 agccattagc tcttgctaca tctgcccacc cacatcagag gctccatggg tctccagatg 21120 actcaggcat gagtctcttc tttgaagcta tttttagggc tgcatcctcg gcatgtggag 21180 gttcccaagc taggggttga atcggagctg tagccgccag cctacaccac agccacagca 21240 acacgggatc cgagccacat ctgcgaccta caccacagct cacagcaatg ccagatcctt 21300 aacccactga gtggggccag ggttgaaccc atgtcctcat gtttcccagt cagattcgtt 21360 tctgctgtgc catgacggga actctggaac ttcctctttg aagctcttta tgttttgttc 21420 ttgttttttg tttttgtttt tctagaaata cctcaggaag caggtcgaac ccctcttcca 21480 acatttcgaa actctcacta aaaactggac cgagcgccca gaaaatctga tggaccagtg 21540 agtatgagct cgcttggtct ggagatcatg ggtggtgcag gtagcctgac ctgggggccc 21600 atagcaagtc cagcagcatc ctctctggag ctcccaactc ctggccggac cagggccaca 21660 gtcagggaga gcgacccctc ccaaccccac tcccggcccc aggagtaggg actctgctct 21720 gaggctctgt gtggcctatg aaccatctgg cctctttggg caaaggacca aactgaacct 21780 ctgagggtcc ctcacccgca tggtgaggtt ctaggtgtta aagctggggc tggagcctgt 21840 gccagccctc cccaggctgc ccaagggcaa gaagcaaaga agggaaccca aaggtggctg 21900 gtgggctata cctgcagagt gcgggtctgc ctccctgttg ggagttgtgt gtcagcaggg 21960 gagtcttggt cagcgtcagg tccaggcgtg ctgacagagt gtcacccccg gggtaggtac 22020 agtgagatta atgccatcag cactgcctgc tccaatggat tgcctcaatg tgagaatctg 22080 gccaagaccc ttttcgacca gtggatgagc gacccagaaa ataacccgtg agtgtgtcct 22140 ttgttcctcc cttgattttc atctgcccct caagcccaca accctgtccg cctcaggccc 22200 tcatcccacc ctccctgctg ctgctccatc cctgacaccc ctaccccacg ccaggatcca 22260 ccccaacctg cggtccacca tctactgcaa tgccatagcc cagggcggcc aggaccagtg 22320 ggactttgcc tgggggcagt tacaacaagc ccagctggta aatgaggccg acaaactccg 22380 ctcagcgctg gcctgcagca acgaggtctg gctcctgaac aggtgaggac tgcagccaga 22440 cagggctggg taagctcact gccccccgac cccagggacc aggctcccag cgtgggagga 22500 gcaagaacca gccaggcctc cacattccct cgtgggatcc ccacaagtct gtgcagtggg 22560 gcagtaccta ccccatttga gagatgaagc tgctgaggct gcgagaagca agacaacttg 22620 ctcgaggccc agaagcttaa ccaagtaaaa aagccaagac ttgaatctgg gtccaggtcc 22680 atgtcctgtg ctcaaaactg ctgcagcctc ctagccttta cgtctctgtc aagggctctg 22740 gtgcagctag acctgagtcc ttctgttcat ccagctgggc accccacccc cacccacaac 22800 ctttgaagga gggccctact gtgtgccatc tctgggacct cagtaaggaa gagccaccct 22860 cagtgccaaa ggcaggagtg gccaccctat ctgactcagg gctcacccct tccttggctc 22920 attcattgac aggggtttat caggcacctg gtctaagtca ggcctgacac ctggcgaagc 22980 cagggaccct gcttagtgga ctcagtgtct catccccaca aaggaggtag gaccaagggg 23040 tctttaaccc tcagccggct gaagggatgc tgatgggatg caggacaggt gtgtggggtt 23100 ggggagaggg cagggtcctt ctatgaacac agattctgct ctcaaaggta cctgggttac 23160 accctgaacc cggacctcat tcggaagcaa gacgccacct ccactattaa cagcattgcc 23220 agcaatgtca tcgggcagcc tctggcctgg gattttgtcc agagcaactg gaagaagctc 23280 tttcaggagt gagtctcccg agaatgtgtt aggggaagca cctgccaggc ctgggtgtcc 23340 ctggggatgg cccgtgtgca caggacccca cggggtcagg actggaaagt agaccctgcc 23400 taggcgtggt gaaaaagaac ccaactttag gccaggtagg ggcaggaatt gaaagatagg 23460 acagtggtga gagttcccac tgtagctcgg gggtaacaaa cccaagtagg atccatgaga 23520 acatgggttc gatccctggc cctgctcagt gggttaagga tctggcattg ccttgagcta 23580 tggtgtagat tccagatgca gcttggatcc cacgttgctg tggctgtggt gtaggccggt 23640 agctgcagct ccaattcgac ccctagcctg ggaacctcca tatgtcatgg atgcggccat 23700 aaaaagccaa aaagaaaaag gaaggaagga agggaaggag ggagggaggg aaggaaagga 23760 aggaagaaag aaagaggaaa aaaggaagaa agagagggaa aaaggaagaa agctagacag 23820 ggcagcggga acggctatcc ctttttccac ttgggggaca tctggctggt gggagtactc 23880 tctgaagagg tgggaggaag gacattgcag tcaaacctgt gttcgcgtct ccagtggtgt 23940 ctcctcaggt gtgtcgttgt tttgcatcta caagacaggg atggtcacag ggtcctgtca 24000 cctgccagtc actaaccatt ccctgtcccc tgatggtgcc cctctctccc tgccctgcag 24060 ctatggcggt ggttccttct ccttctccaa cctcatccag ggtgtgaccc gaagattctc 24120 ctctgagttt gagctgcagc aggtaggaag ccctgggccc cggggctctc gcctggagag 24180 ggaggacaga ggccctggca gccctctcct cagggctgta ttagcgaccc agcctgccgc 24240 tcagaatcac ccttgtcctg gcagctggag cagttcaaga agaacaacat ggatgtgggc 24300 ttcggctccg gcacccgggc tctggagcaa gccctggaga agaccaaggc caacatcaag 24360 tgggtgaagg agaacaagga ggtggtgttg aattggttca tagagcacag ctaatagtgc 24420 ctggtccttc ccgccacctg gccccccgca caagatgccc gcatgtgtcc atcccagggc 24480 ccacggcagg gcccatgttc ctgaagcccg aggcacctgc gtcctccctt tagggacaaa 24540 gcctgtggcc catgttatct ccattctgcc ctggggccca atccagtttc tggtgaccag 24600 actgtccagg tgtctcccag ccactgcccc ttgtgccaac cccaccctgg gcctggccca 24660 gggcccttct cagggaagtc cagctccaag gccagatgag cagaagccct tgatggatga 24720 tggatggcct tgaagaactg ccctctaccc tctctcccct ttttccataa agaccctgaa 24780 cctgagaatc aacagggcat cagatctgta tatttttttc ctaggagtaa atgtaaataa 24840 aggatttcta gatgagcttc caggctcttt actaaactca agaaggaatg agtctgcata 24900 atagctggag agacagggat ggagggaacc tggggtgcat gggggtctgg ggacccccag 24960 gaagcctagg agggaggtac ccagcctgct agatcttcct acaggacacc cgtgtggctc 25020 tagcttggag atggaggaca gtgtctgcct gcagtgttca ttgccttggc aggattgaaa 25080 ctctgggtgc tggggagcca ggggaggtag agggaatgag acacagcggt ccccatggtg 25140 gagagagcca gggcctgacg gtggaggcag tgcttttcta gaaagcaaga agtgccatgg 25200 ttcgagaagc taggattggc acctgaacta acatgaggca agatagtagc gtgccggctg 25260 gcccttttcc tgctccgccg ctgggacgtc tgggacagtg agcgaaaggg gcttgcaggg 25320 aggacagcag ccctgggtcg gggcctggtg cgaccatgca ctggccaagg taatggccag 25380 gatcgctggt ggagggcggc atattgattt gtaaaccggt gttttcaaga gtagcaggca 25440 gaaaaaggca ggtgtcctcc agatcatctg gggcagccag tggtgaaggc cacctctggg 25500 gagaaagttt gggacccaga agactccaag ccccacatcc attttggtgg aactttcttg 25560 gccaataagg ccctgccgag catccaaggc tggttggagg gaaagaagga gggaatagac 25620 agacaggcca gggctcctct ggggtcacct ccagtcgaca ccactgtgag ctctgctcca 25680 gctccagccc tggaatccag ccactgttcc ttgaacaagt gacctaaacc cttaggcgat 25740 ggttttctca tttggacgct agagctggtc tatcctaggg ttggggtgtg gatctaagga 25800 gatgcacgga cttagctcac agtctgacgc ttaaatggag ctgggtgtta ctaacatcct 25860 tagcccggtg tctgctcaaa gcccctccac cttttccctc ccagcctcct tcccctcctg 25920 agaaggtgca aacaggcctg gggccaggaa ggctcccccc agctctgggg gctcctgcac 25980 atcaaagggt ggggcgggcc aaggggcggt cccagccctg gttatggatc cctccaccaa 26040 tcaggaagct cccccccagc ccagtccctc tagaccagct cttcctgtcg ccagggccca 26100 gcagccttgg ctggcacttg accttctgcg gaccagaggg caggagggcc ccctccggtg 26160 gctcctctgg gggagggact agccttgcca tcaagggtcc cagagggaga gctggcctcc 26220 aggtaggaga gtcagcaggg accctagtct ctgtgcctgg cactgggcta aggctttatg 26280 cgcattatct catttggttc tcaacagcgc cagaagataa ggactgtctt tatctcagtg 26340 ttgcagataa gtaaactgag gttcaggaag gttaaggccc tggctctgat gccctgtgca 26400 tgagtgggag ccaggtctcc atctggggcc atggcagagt catccacatc ttctcgtctg 26460 acagcttcaa tgcaggcatt cagaacggcc tgtgcggctg gaggaaatca ttctggggag 26520 gcagggagga cacgtagagc cagagacctg cttgcggaac ctcgttcaag gttgtatgca 26580 ggatgggatc tgactagaac tcaggctgct catttcctgt ccagaggtgg gttgacctct 26640 catggctaca gggggatagc aggagctgag gatcagtcca gagcagtggg aggtggcacc 26700 ctctcccacc tccccaccct ctgggaggct cctcaggagg caggtcctct gcactgcagg 26760 attattgaaa ggcctggatg cagtactcag tgaatgtccc gtcatttagg gatggtgact 26820 gggtccctag gaaggtatgg gtagaccagt tatcccagac aggacactag catcagccat 26880 gctccctcct ctgccaggca cttagcagag aggagcagcc agcagcagtc tgcctgggat 26940 ggagccacag atggggacag gggctgctgc tcctgagagg cagggctgag cctccctcct 27000 gagggtgagg acaggggtgg gggattagcc caaacccccc aggccctgct ccctccctgt 27060 agcagcatct aggaagggtc caggctgctc catctgcagt gatggcagcc ttttgccctg 27120 gcctttgtat ctcccagagg agcacctctt gacgagagct gggagaacaa ggctgctaag 27180 ttcctgaaga tgctcacctc tggctgctgc tggtggaggc tgcaacgcag tccttattgt 27240 gactccagcc gtcatcagca gcttgaccag ggatccccct ctctgtctct gtaaggacta 27300 agcccagata ggtgggagcc aaaggaagga ggcaggcaac tgttcagatc tgtctttggt 27360 gcaagtgccg tgacactgtg gagccaagaa tttgggtctt ctctggaagg agagcgctct 27420 ggacagggag tcagggggcc tgatgtccaa ggagggctgg agaaaactgt tcccctcctt 27480 gggcctgctt tctcaactgt caaatggagg agcagggagt tcccgttgtg gcaaagggga 27540 aatgaatacg actagtatct gtgagggtgc aggttcggtc cctggccttg ctcggttggt 27600 taaggatcca gcgtttctgt gacctgtggt gtagctcgca gatgcgactc ggatctggtg 27660 ttgctgtggt tgtggtggag gcgggcagct acagctccga ttcgaccccc tagcctggaa 27720 acctccatat gccacagctg cggccctaaa aagcaaaaaa aattaaaaaa aaaaatagaa 27780 tgaaggagca aaaaatatcc attgctccta aacttggctg ggcctcagcc ccaggtccca 27840 ggtcccaacc catgcactga gtcatgccct cagggtagga ccagatggct caccttgcag 27900 ccagtttagg gaagcactag attggatcat cagctatcat gtactgagcc attactatgt 27960 gccaagcctg agagccctga gaggtcagta ttttactgtc tccatttcac agctgagaag 28020 accaaggctc agggaggttt gcagcttgcg ggcgcttgtg cagaaaatag gtgcatgaag 28080 gagcacctgg ggcagctgtg ccctgggtct gtctccctgc catgtggaat ttcatgtgag 28140 gtttcctcgc cctctgctgc cgcgggcagc ccctgcagaa ggccctgggg taggaagcag 28200 aacctccttt tagggagtta ggagaaggag gcacgtggtc acttaggcca gttcctcttt 28260 aagagatggg gacactgaga catggagggg gagtggcttg tctgatgtcc aagggcacaa 28320 gggtcagata tgaggctcgg gtggggtaga ccaggctctt gtctccctcc ctcccttctc 28380 tcgccctgca ctgttacagg acctcctgcc tggctccatc tctgtgaagc agccagagac 28440 cacgagtggc tctaatgagc acacctatcc ccaaccttca ctgcctcctc cacccaggac 28500 ccagaggcca gatgcttccc tgtgctgccg catgcagttc cccacagccc tgcctccaaa 28560 ctccctttcc aactcatcac tttccgcatc gactctgaac ttcagccacc tctgttccca 28620 cttggctcct gctgcttctc ctgcttactc ctttttggca aactccggca catccttcga 28680 tattcattgc aactcttccc ctcctggaat ccggagaacg aagtcactat cactgctggc 28740 tcccaagccc acgacagcct ttgctaatgg atcgtggcac cctttctcca agatcctgga 28800 ggtgcctctt agtcttgctc aaggctgcat aaatcaatgc agcaggactg atggatcagg 28860 taactcaaga atgaaactgt gtcatcaatc ccatcatcag gggttggcac atcccctctg 28920 gtcccaaagt accttgtatg aacccccacc tcggcctctg atcatttctt tcctttaatt 28980 cacccactag tcaggaaaca tgggaaagtt tgcgggtttt tttgtctttt tagggctgca 29040 cccacagcat atggaagttc ccaggcaaga ggtcaaatca gagggcagcc aatggcctac 29100 accacagcca cagcaactcg ggatccgagc cacatctgca acttatacca cagctcagag 29160 caacgctgga tcactgagca aggccaggga gcaaacccgt gtcctcatgg atatgagtca 29220 ggcttgttac cactgagcca cgacggaact tccatagact gttttctctg gcacctagta 29280 ctgggtacca tgggctgaag ggtatgcccc aaaactcgtg gtgaagttct aaaccccagt 29340 gcctgagaat gtgactatat ttggaaacag agcctggaag aggtaattaa ggtaaaatga 29400 ggtcatatgg gtggacccaa atccaattgg actggtgccc ctgtaagaag attaagacac 29460 agacacactg gaccacagga taaccatgtg aggacacaac aagaaggcgg ccatctgcaa 29520 gccacagaga gaggcctcag aactcaccaa agctgctgac cccttggtct tggactccca 29580 gtctccagaa ctgtgagaaa attaattttt gttaagccac ccaatttggc atattgtctc 29640 atggcagtcc tagtacacta gtacactggg cccagcaggc gggagccact cacaagcgcc 29700 ctctggaaac agtttcacat aatcgtgaaa gatcccttca ggttggcagg aatgcatcca 29760 ggagaaggaa aaagggcagt ggtgaggggg cggaggccag gggggagagg cccgagcatg 29820 atcccacatg tgccgccttg cacagcaggc caggtggagc ccctgcacag tcattgccaa 29880 atcaacaagt gagggcccac atcaaccttg gtaggcttag attccaggag gggaaaagca 29940 aacgcgactt gttccctgcg ggatgggaac attttttcct tttccagagc aataacaac 29999 <210> 133 <211> 1017 <212> PRT <213> Sus scrofa <400> 133 Met Ala Lys Gly Phe Tyr Ile Ser Lys Ala Leu Gly Ile Leu Gly Ile 1 5 10 15 Leu Leu Gly Val Ala Ala Val Ala Thr Ile Ile Ala Leu Ser Val Val 20 25 30 Tyr Ala Gln Glu Lys Asn Lys Asn Ala Glu His Val Pro Gln Ala Pro 35 40 45 Thr Ser Pro Thr Ile Thr Thr Thr Ala Ala Ile Thr Leu Asp Gln Ser 50 55 60 Lys Pro Trp Asn Arg Tyr Arg Leu Pro Thr Thr Leu Leu Pro Asp Ser 65 70 75 80 Tyr Asn Val Thr Leu Arg Pro Tyr Leu Thr Pro Asn Ala Asp Gly Leu 85 90 95 Tyr Ile Phe Lys Gly Lys Ser Ile Val Arg Phe Ile Cys Gln Glu Pro 100 105 110 Thr Asp Val Ile Ile Ile His Ser Lys Lys Leu Asn Tyr Thr Thr Gln 115 120 125 Gly His Met Val Val Leu Arg Gly Val Gly Asp Ser Gln Val Pro Glu 130 135 140 Ile Asp Arg Thr Glu Leu Val Glu Leu Thr Glu Tyr Leu Val Val His 145 150 155 160 Leu Lys Gly Ser Leu Gln Pro Gly His Met Tyr Glu Met Glu Ser Glu 165 170 175 Phe Gln Gly Glu Leu Ala Asp Asp Leu Ala Gly Phe Tyr Arg Ser Glu 180 185 190 Tyr Met Glu Gly Asn Val Lys Lys Val Leu Ala Thr Thr Gln Met Gln 195 200 205 Ser Thr Asp Ala Arg Lys Ser Phe Pro Cys Phe Asp Glu Pro Ala Met 210 215 220 Lys Ala Thr Phe Asn Ile Thr Leu Ile His Pro Asn Asn Leu Thr Ala 225 230 235 240 Leu Ser Asn Met Pro Pro Lys Gly Ser Ser Thr Pro Leu Ala Glu Asp 245 250 255 Pro Asn Trp Ser Val Thr Glu Phe Glu Thr Thr Pro Val Met Ser Thr 260 265 270 Tyr Leu Leu Ala Tyr Ile Val Ser Glu Phe Gln Ser Val Asn Glu Thr 275 280 285 Ala Gln Asn Gly Val Leu Ile Arg Ile Trp Ala Arg Pro Asn Ala Ile 290 295 300 Ala Glu Gly His Gly Met Tyr Ala Leu Asn Val Thr Gly Pro Ile Leu 305 310 315 320 Asn Phe Phe Ala Asn His Tyr Asn Thr Pro Tyr Pro Leu Pro Lys Ser 325 330 335 Asp Gln Ile Ala Leu Pro Asp Phe Asn Ala Gly Ala Met Glu Asn Trp 340 345 350 Gly Leu Val Thr Tyr Arg Glu Asn Ala Leu Leu Phe Asp Pro Gln Ser 355 360 365 Ser Ser Ile Ser Asn Lys Glu Arg Val Val Thr Val Ile Ala His Glu 370 375 380 Leu Ala His Gln Trp Phe Gly Asn Leu Val Thr Leu Ala Trp Trp Asn 385 390 395 400 Asp Leu Trp Leu Asn Glu Gly Phe Ala Ser Tyr Val Glu Tyr Leu Gly 405 410 415 Ala Asp His Ala Glu Pro Thr Trp Asn Leu Lys Asp Leu Ile Val Pro 420 425 430 Gly Asp Val Tyr Arg Val Met Ala Val Asp Ala Leu Ala Ser Ser His 435 440 445 Pro Leu Thr Thr Pro Ala Glu Glu Val Asn Thr Pro Ala Gln Ile Ser 450 455 460 Glu Met Phe Asp Ser Ile Ser Tyr Ser Lys Gly Ala Ser Val Ile Arg 465 470 475 480 Met Leu Ser Asn Phe Leu Thr Glu Asp Leu Phe Lys Glu Gly Leu Ala 485 490 495 Ser Tyr Leu His Ala Phe Ala Tyr Gln Asn Thr Thr Tyr Leu Asp Leu 500 505 510 Trp Glu His Leu Gln Lys Ala Val Asp Ala Gln Thr Ser Ile Arg Leu 515 520 525 Pro Asp Thr Val Arg Ala Ile Met Asp Arg Trp Thr Leu Gln Met Gly 530 535 540 Phe Pro Val Ile Thr Val Asp Thr Lys Thr Gly Asn Ile Ser Gln Lys 545 550 555 560 His Phe Leu Leu Asp Ser Glu Ser Asn Val Thr Arg Ser Ser Ala Phe 565 570 575 Asp Tyr Leu Trp Ile Val Pro Ile Ser Ser Ile Lys Asn Gly Val Met 580 585 590 Gln Asp His Tyr Trp Leu Arg Asp Val Ser Gln Gly Lys Pro Leu Ser 595 600 605 Leu Ala Leu Pro Gln Trp Pro Glu Gly Gln Leu Leu Pro Gly Cys Arg 610 615 620 Arg Asp Cys Ser Ala Glu Ala Trp Gly Glu Glu Gly Arg Gly Ser Gly 625 630 635 640 Gln Ser Met Ala Phe Ser Ala Ala Pro Pro Arg Leu Cys Ser Leu Pro 645 650 655 Thr Ala Gln Asn Asp Leu Phe Lys Thr Ala Ser Asp Asp Trp Val Leu 660 665 670 Leu Asn Ile Asn Val Thr Gly Tyr Phe Gln Val Asn Tyr Asp Glu Asp 675 680 685 Asn Trp Arg Met Ile Gln His Gln Leu Gln Thr Asn Leu Ser Val Ile 690 695 700 Pro Val Ile Asn Arg Ala Gln Val Ile Tyr Asp Ser Phe Asn Leu Ala 705 710 715 720 Thr Ala His Met Val Pro Val Thr Leu Ala Leu Asp Asn Thr Leu Phe 725 730 735 Leu Asn Gly Glu Lys Glu Tyr Met Pro Trp Gln Ala Ala Leu Ser Ser 740 745 750 Leu Ser Tyr Phe Ser Leu Met Phe Asp Arg Ser Glu Val Tyr Gly Pro 755 760 765 Met Lys Lys Tyr Leu Arg Lys Gln Val Glu Pro Leu Phe Gln His Phe 770 775 780 Glu Thr Leu Thr Lys Asn Trp Thr Glu Arg Pro Glu Asn Leu Met Asp 785 790 795 800 Gln Tyr Ser Glu Ile Asn Ala Ile Ser Thr Ala Cys Ser Asn Gly Leu 805 810 815 Pro Gln Cys Glu Asn Leu Ala Lys Thr Leu Phe Asp Gln Trp Met Ser 820 825 830 Asp Pro Glu Asn Asn Pro Ile His Pro Asn Leu Arg Ser Thr Ile Tyr 835 840 845 Cys Asn Ala Ile Ala Gln Gly Gly Gln Asp Gln Trp Asp Phe Ala Trp 850 855 860 Gly Gln Leu Gln Gln Ala Gln Leu Val Asn Glu Ala Asp Lys Leu Arg 865 870 875 880 Ser Ala Leu Ala Cys Ser Asn Glu Val Trp Leu Leu Asn Arg Tyr Leu 885 890 895 Gly Tyr Thr Leu Asn Pro Asp Leu Ile Arg Lys Gln Asp Ala Thr Ser 900 905 910 Thr Ile Asn Ser Ile Ala Ser Asn Val Ile Gly Gln Pro Leu Ala Trp 915 920 925 Asp Phe Val Gln Ser Asn Trp Lys Lys Leu Phe Gln Asp Tyr Gly Gly 930 935 940 Gly Ser Phe Ser Phe Ser Asn Leu Ile Gln Gly Val Thr Arg Arg Phe 945 950 955 960 Ser Ser Glu Phe Glu Leu Gln Gln Leu Glu Gln Phe Lys Lys Asn Asn 965 970 975 Met Asp Val Gly Phe Gly Ser Gly Thr Arg Ala Leu Glu Gln Ala Leu 980 985 990 Glu Lys Thr Lys Ala Asn Ile Lys Trp Val Lys Glu Asn Lys Glu Val 995 1000 1005 Val Leu Asn Trp Phe Ile Glu His Ser 1010 1015 <210> 134 <211> 963 <212> PRT <213> Sus scrofa <400> 134 Met Ala Lys Gly Phe Tyr Ile Ser Lys Ala Leu Gly Ile Leu Gly Ile 1 5 10 15 Leu Leu Gly Val Ala Ala Val Ala Thr Ile Ile Ala Leu Ser Val Val 20 25 30 Tyr Ala Gln Glu Lys Asn Lys Asn Ala Glu His Val Pro Gln Ala Pro 35 40 45 Thr Ser Pro Thr Ile Thr Thr Thr Ala Ala Ile Thr Leu Asp Gln Ser 50 55 60 Lys Pro Trp Asn Arg Tyr Arg Leu Pro Thr Thr Leu Leu Pro Asp Ser 65 70 75 80 Tyr Asn Val Thr Leu Arg Pro Tyr Leu Thr Pro Asn Ala Asp Gly Leu 85 90 95 Tyr Ile Phe Lys Gly Lys Ser Ile Val Arg Phe Ile Cys Gln Glu Pro 100 105 110 Thr Asp Val Ile Ile Ile His Ser Lys Lys Leu Asn Tyr Thr Thr Gln 115 120 125 Gly His Met Val Val Leu Arg Gly Val Gly Asp Ser Gln Val Pro Glu 130 135 140 Ile Asp Arg Thr Glu Leu Val Glu Leu Thr Glu Tyr Leu Val Val His 145 150 155 160 Leu Lys Gly Ser Leu Gln Pro Gly His Met Tyr Glu Met Glu Ser Glu 165 170 175 Phe Gln Gly Glu Leu Ala Asp Asp Leu Ala Gly Phe Tyr Arg Ser Glu 180 185 190 Tyr Met Glu Gly Asn Val Lys Lys Val Leu Ala Thr Thr Gln Met Gln 195 200 205 Ser Thr Asp Ala Arg Lys Ser Phe Pro Cys Phe Asp Glu Pro Ala Met 210 215 220 Lys Ala Thr Phe Asn Ile Thr Leu Ile His Pro Asn Asn Leu Thr Ala 225 230 235 240 Leu Ser Asn Met Pro Pro Lys Gly Ser Ser Thr Pro Leu Ala Glu Asp 245 250 255 Pro Asn Trp Ser Val Thr Glu Phe Glu Thr Thr Pro Val Met Ser Thr 260 265 270 Tyr Leu Leu Ala Tyr Ile Val Ser Glu Phe Gln Ser Val Asn Glu Thr 275 280 285 Ala Gln Asn Gly Val Leu Ile Arg Ile Trp Ala Arg Pro Asn Ala Ile 290 295 300 Ala Glu Gly His Gly Met Tyr Ala Leu Asn Val Thr Gly Pro Ile Leu 305 310 315 320 Asn Phe Phe Ala Asn His Tyr Asn Thr Pro Tyr Pro Leu Pro Lys Ser 325 330 335 Asp Gln Ile Ala Leu Pro Asp Phe Asn Ala Gly Ala Met Glu Asn Trp 340 345 350 Gly Leu Val Thr Tyr Arg Glu Asn Ala Leu Leu Phe Asp Pro Gln Ser 355 360 365 Ser Ser Ile Ser Asn Lys Glu Arg Val Val Thr Val Ile Ala His Glu 370 375 380 Leu Ala His Gln Trp Phe Gly Asn Leu Val Thr Leu Ala Trp Trp Asn 385 390 395 400 Asp Leu Trp Leu Asn Glu Gly Phe Ala Ser Tyr Val Glu Tyr Leu Gly 405 410 415 Ala Asp His Ala Glu Pro Thr Trp Asn Leu Lys Asp Leu Ile Val Pro 420 425 430 Gly Asp Val Tyr Arg Val Met Ala Val Asp Ala Leu Ala Ser Ser His 435 440 445 Pro Leu Thr Thr Pro Ala Glu Glu Val Asn Thr Pro Ala Gln Ile Ser 450 455 460 Glu Met Phe Asp Ser Ile Ser Tyr Ser Lys Gly Ala Ser Val Ile Arg 465 470 475 480 Met Leu Ser Asn Phe Leu Thr Glu Asp Leu Phe Lys Glu Gly Leu Ala 485 490 495 Ser Tyr Leu His Ala Phe Ala Tyr Gln Asn Thr Thr Tyr Leu Asp Leu 500 505 510 Trp Glu His Leu Gln Lys Ala Val Asp Ala Gln Thr Ser Ile Arg Leu 515 520 525 Pro Asp Thr Val Arg Ala Ile Met Asp Arg Trp Thr Leu Gln Met Gly 530 535 540 Phe Pro Val Ile Thr Val Asp Thr Lys Thr Gly Asn Ile Ser Gln Lys 545 550 555 560 His Phe Leu Leu Asp Ser Glu Ser Asn Val Thr Arg Ser Ser Ala Phe 565 570 575 Asp Tyr Leu Trp Ile Val Pro Ile Ser Ser Ile Lys Asn Gly Val Met 580 585 590 Gln Asp His Tyr Trp Leu Arg Asp Val Ser Gln Ala Gln Asn Asp Leu 595 600 605 Phe Lys Thr Ala Ser Asp Asp Trp Val Leu Leu Asn Ile Asn Val Thr 610 615 620 Gly Tyr Phe Gln Val Asn Tyr Asp Glu Asp Asn Trp Arg Met Ile Gln 625 630 635 640 His Gln Leu Gln Thr Asn Leu Ser Val Ile Pro Val Ile Asn Arg Ala 645 650 655 Gln Val Ile Tyr Asp Ser Phe Asn Leu Ala Thr Ala His Met Val Pro 660 665 670 Val Thr Leu Ala Leu Asp Asn Thr Leu Phe Leu Asn Gly Glu Lys Glu 675 680 685 Tyr Met Pro Trp Gln Ala Ala Leu Ser Ser Leu Ser Tyr Phe Ser Leu 690 695 700 Met Phe Asp Arg Ser Glu Val Tyr Gly Pro Met Lys Lys Tyr Leu Arg 705 710 715 720 Lys Gln Val Glu Pro Leu Phe Gln His Phe Glu Thr Leu Thr Lys Asn 725 730 735 Trp Thr Glu Arg Pro Glu Asn Leu Met Asp Gln Tyr Ser Glu Ile Asn 740 745 750 Ala Ile Ser Thr Ala Cys Ser Asn Gly Leu Pro Gln Cys Glu Asn Leu 755 760 765 Ala Lys Thr Leu Phe Asp Gln Trp Met Ser Asp Pro Glu Asn Asn Pro 770 775 780 Ile His Pro Asn Leu Arg Ser Thr Ile Tyr Cys Asn Ala Ile Ala Gln 785 790 795 800 Gly Gly Gln Asp Gln Trp Asp Phe Ala Trp Gly Gln Leu Gln Gln Ala 805 810 815 Gln Leu Val Asn Glu Ala Asp Lys Leu Arg Ser Ala Leu Ala Cys Ser 820 825 830 Asn Glu Val Trp Leu Leu Asn Arg Tyr Leu Gly Tyr Thr Leu Asn Pro 835 840 845 Asp Leu Ile Arg Lys Gln Asp Ala Thr Ser Thr Ile Asn Ser Ile Ala 850 855 860 Ser Asn Val Ile Gly Gln Pro Leu Ala Trp Asp Phe Val Gln Ser Asn 865 870 875 880 Trp Lys Lys Leu Phe Gln Asp Tyr Gly Gly Gly Ser Phe Ser Phe Ser 885 890 895 Asn Leu Ile Gln Gly Val Thr Arg Arg Phe Ser Ser Glu Phe Glu Leu 900 905 910 Gln Gln Leu Glu Gln Phe Lys Lys Asn Asn Met Asp Val Gly Phe Gly 915 920 925 Ser Gly Thr Arg Ala Leu Glu Gln Ala Leu Glu Lys Thr Lys Ala Asn 930 935 940 Ile Lys Trp Val Lys Glu Asn Lys Glu Val Val Leu Asn Trp Phe Ile 945 950 955 960 Glu His Ser <210> 135 <211> 2599 <212> DNA <213> Sus scrofa <400> 135 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca tggagggcaa cgtcaaaaag taagtcaggt gggggcacac 1620 cctagatgct gaggcagagc tggatcctgg gggccaagga agggcttgga ttcgggacct 1680 tggaaccttc tggagacttt ggctggcccg tcgctccatc cgcagctctg gtagagaagc 1740 tatctagaca atcagccctt tcccggagag cccccctaac cttagggagt caggggtgag 1800 tgatccaagt gcccccttgg gtagaaagga aaacaggctc tgaggacaga aatttgccca 1860 aggtctccca gctaattcag gggtggagcc tgcccggact ttgaccccaa gtccagaagg 1920 agctctgctc tcccaagtca gctggcctgt cagcctggag gcggcctggg ggaggcgggg 1980 agggcaggga tggggctgtg cacccctttc catgcccagc cagccatggc ctacaccccc 2040 cacccccggc cacccccatg ggcacaggca ttttgctggc ataccttcta accccctgct 2100 tcgggcaggg tgctggccac gacacagatg cagtctacag atgcccggaa atccttccca 2160 tgctttgacg agccagccat gaaggccacg ttcaacatca ctctcatcca ccctaacaac 2220 ctcacggccc tgtccaatat gccgcccaaa ggtgagcggg cctggcgggg accacacggc 2280 ctgggaaagc aggtccctgg ggctggggtg caggtccctg ttgctggggt gcaggcccag 2340 gaagagggca cccctccacg cctgcgtgtc gcacccaggt tccagcaccc cacttgcaga 2400 agaccccaac tggtctgtca ctgagttcga aaccacacct gtgatgtcca cgtaccttct 2460 ggcctacatc gtgagcgagt tccagagcgt gaatgaaacg gcccaaaatg gcgtcctggt 2520 aaggggctga gcccacctgc ccttccccac attggccctg gcctgggaag tattcccatt 2580 tatcctcatc cttgtccct 2599 <210> 136 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 136 cttctaccgc agcgagtaca tgg 23 <210> 137 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 137 taccgcagcg agtacatgga ggg 23 <210> 138 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 138 cctcctcggc gtggcggccg tgg 23 <210> 139 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 139 caccatcatc gctctgtctg tgg 23 <210> 140 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 140 tacctcactc ccaacgcgga tgg 23 <210> 141 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 141 agctcaacta caccacccag ggg 23 <210> 142 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 142 caccgcttct accgcagcga gtaca 25 <210> 143 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 143 aaactgtact cgctgcggta gaagc 25 <210> 144 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 144 caccgtaccg cagcgagtac atgga 25 <210> 145 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 145 aaactccatg tactcgctgc ggtac 25 <210> 146 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 146 caccgcctcc tcggcgtggc ggccg 25 <210> 147 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 147 aaaccggccg ccacgccgag gaggc 25 <210> 148 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 148 caccgcacca tcatcgctct gtctg 25 <210> 149 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 149 aaaccagaca gagcgatgat ggtgc 25 <210> 150 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 150 caccgtacct cactcccaac gcgga 25 <210> 151 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 151 aaactccgcg ttgggagtga ggtac 25 <210> 152 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 152 caccgagctc aactacacca cccag 25 <210> 153 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 153 aaacctgggt ggtgtagttg agctc 25 <210> 154 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 154 ttaatacgac tcactatagg cttctaccgc agcgagtaca 40 <210> 155 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 155 ttaatacgac tcactatagg taccgcagcg agtacatgga 40 <210> 156 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 156 ttaatacgac tcactatagg cctcctcggc gtggcggccg 40 <210> 157 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 157 ttaatacgac tcactatagg caccatcatc gctctgtctg 40 <210> 158 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 158 ttaatacgac tcactatagg caccatcatc gctctgtctg 40 <210> 159 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 159 ttaatacgac tcactatagg agctcaacta caccacccag 40 <210> 160 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 160 aaaagcaccg actcggtgcc 20 <210> 161 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 161 acgctgttcc tgaatct 17 <210> 162 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 162 gggaaagggc tgattgtcta 20 <210> 163 <211> 2422 <212> DNA <213> Sus scrofa <400> 163 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtgccct ccatggaggg caacgtcaaa aagtaagtca ggtgggggca 1440 caccctagat gctgaggcag agctggatcc tgggggccaa ggaagggctt ggattcggga 1500 ccttggaacc ttctggagac tttggctggc ccgtcgctcc atccgcagct ctggtagaga 1560 agctatctag acaatcagcc ctttcccgga gagcccccct aaccttaggg agtcaggggt 1620 gagtgatcca agtgccccct tgggtagaaa ggaaaacagg ctctgaggac agaaatttgc 1680 ccaaggtctc ccagctaatt caggggtgga gcctgcccgg actttgaccc caagtccaga 1740 aggagctctg ctctcccaag tcagctggcc tgtcagcctg gaggcggcct gggggaggcg 1800 gggagggcag ggatggggct gtgcacccct ttccatgccc agccagccat ggcctacacc 1860 ccccaccccc ggccaccccc atgggcacag gcattttgct ggcatacctt ctaaccccct 1920 gcttcgggca gggtgctggc cacgacacag atgcagtcta cagatgcccg gaaatccttc 1980 ccatgctttg acgagccagc catgaaggcc acgttcaaca tcactctcat ccaccctaac 2040 aacctcacgg ccctgtccaa tatgccgccc aaaggtgagc gggcctggcg gggaccacac 2100 ggcctgggaa agcaggtccc tggggctggg gtgcaggtcc ctgttgctgg ggtgcaggcc 2160 caggaagagg gcacccctcc acgcctgcgt gtcgcaccca ggttccagca ccccacttgc 2220 agaagacccc aactggtctg tcactgagtt cgaaaccaca cctgtgatgt ccacgtacct 2280 tctggcctac atcgtgagcg agttccagag cgtgaatgaa acggcccaaa atggcgtcct 2340 ggtaaggggc tgagcccacc tgcccttccc cacattggcc ctggcctggg aagtattccc 2400 atttatcctc atccttgtcc ct 2422 <210> 164 <211> 2590 <212> DNA <213> Sus scrofa <400> 164 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagggca acgtcaaaaa gtaagtcagg tgggggcaca ccctagatgc 1620 tgaggcagag ctggatcctg ggggccaagg aagggcttgg attcgggacc ttggaacctt 1680 ctggagactt tggctggccc gtcgctccat ccgcagctct ggtagagaag ctatctagac 1740 aatcagccct ttcccggaga gcccccctaa ccttagggag tcaggggtga gtgatccaag 1800 tgcccccttg ggtagaaagg aaaacaggct ctgaggacag aaatttgccc aaggtctccc 1860 agctaattca ggggtggagc ctgcccggac tttgacccca agtccagaag gagctctgct 1920 ctcccaagtc agctggcctg tcagcctgga ggcggcctgg gggaggcggg gagggcaggg 1980 atggggctgt gcaccccttt ccatgcccag ccagccatgg cctacacccc ccacccccgg 2040 ccacccccat gggcacaggc attttgctgg cataccttct aaccccctgc ttcgggcagg 2100 gtgctggcca cgacacagat gcagtctaca gatgcccgga aatccttccc atgctttgac 2160 gagccagcca tgaaggccac gttcaacatc actctcatcc accctaacaa cctcacggcc 2220 ctgtccaata tgccgcccaa aggtgagcgg gcctggcggg gaccacacgg cctgggaaag 2280 caggtccctg gggctggggt gcaggtccct gttgctgggg tgcaggccca ggaagagggc 2340 acccctccac gcctgcgtgt cgcacccagg ttccagcacc ccacttgcag aagaccccaa 2400 ctggtctgtc actgagttcg aaaccacacc tgtgatgtcc acgtaccttc tggcctacat 2460 cgtgagcgag ttccagagcg tgaatgaaac ggcccaaaat ggcgtcctgg taaggggctg 2520 agcccacctg cccttcccca cattggccct ggcctgggaa gtattcccat ttatcctcat 2580 ccttgtccct 2590 <210> 165 <211> 1732 <212> DNA <213> Sus scrofa <400> 165 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc ttctggagac tttggctggc 840 ccgtcgctcc atccgcagct ctggtagaga agctatctag acaatcagcc ctttcccgga 900 gagcccccct aaccttaggg agtcaggggt gagtgatcca agtgccccct tgggtagaaa 960 ggaaaacagg ctctgaggac agaaatttgc ccaaggtctc ccagctaatt caggggtgga 1020 gcctgcccgg actttgaccc caagtccaga aggagctctg ctctcccaag tcagctggcc 1080 tgtcagcctg gaggcggcct gggggaggcg gggagggcag ggatggggct gtgcacccct 1140 ttccatgccc agccagccat ggcctacacc ccccaccccc ggccaccccc atgggcacag 1200 gcattttgct ggcatacctt ctaaccccct gcttcgggca gggtgctggc cacgacacag 1260 atgcagtcta cagatgcccg gaaatccttc ccatgctttg acgagccagc catgaaggcc 1320 acgttcaaca tcactctcat ccaccctaac aacctcacgg ccctgtccaa tatgccgccc 1380 aaaggtgagc gggcctggcg gggaccacac ggcctgggaa agcaggtccc tggggctggg 1440 gtgcaggtcc ctgttgctgg ggtgcaggcc caggaagagg gcacccctcc acgcctgcgt 1500 gtcgcaccca ggttccagca ccccacttgc agaagacccc aactggtctg tcactgagtt 1560 cgaaaccaca cctgtgatgt ccacgtacct tctggcctac atcgtgagcg agttccagag 1620 cgtgaatgaa acggcccaaa atggcgtcct ggtaaggggc tgagcccacc tgcccttccc 1680 cacattggcc ctggcctggg aagtattccc atttatcctc atccttgtcc ct 1732 <210> 166 <211> 2600 <212> DNA <213> Sus scrofa <400> 166 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca ttggagggca acgtcaaaaa gtaagtcagg tgggggcaca 1620 ccctagatgc tgaggcagag ctggatcctg ggggccaagg aagggcttgg attcgggacc 1680 ttggaacctt ctggagactt tggctggccc gtcgctccat ccgcagctct ggtagagaag 1740 ctatctagac aatcagccct ttcccggaga gcccccctaa ccttagggag tcaggggtga 1800 gtgatccaag tgcccccttg ggtagaaagg aaaacaggct ctgaggacag aaatttgccc 1860 aaggtctccc agctaattca ggggtggagc ctgcccggac tttgacccca agtccagaag 1920 gagctctgct ctcccaagtc agctggcctg tcagcctgga ggcggcctgg gggaggcggg 1980 gagggcaggg atggggctgt gcaccccttt ccatgcccag ccagccatgg cctacacccc 2040 ccacccccgg ccacccccat gggcacaggc attttgctgg cataccttct aaccccctgc 2100 ttcgggcagg gtgctggcca cgacacagat gcagtctaca gatgcccgga aatccttccc 2160 atgctttgac gagccagcca tgaaggccac gttcaacatc actctcatcc accctaacaa 2220 cctcacggcc ctgtccaata tgccgcccaa aggtgagcgg gcctggcggg gaccacacgg 2280 cctgggaaag caggtccctg gggctggggt gcaggtccct gttgctgggg tgcaggccca 2340 ggaagagggc acccctccac gcctgcgtgt cgcacccagg ttccagcacc ccacttgcag 2400 aagaccccaa ctggtctgtc actgagttcg aaaccacacc tgtgatgtcc acgtaccttc 2460 tggcctacat cgtgagcgag ttccagagcg tgaatgaaac ggcccaaaat ggcgtcctgg 2520 taaggggctg agcccacctg cccttcccca cattggccct ggcctgggaa gtattcccat 2580 ttatcctcat ccttgtccct 2600 <210> 167 <211> 2601 <212> DNA <213> Sus scrofa <400> 167 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca tatggagggc aacgtcaaaa agtaagtcag gtgggggcac 1620 accctagatg ctgaggcaga gctggatcct gggggccaag gaagggcttg gattcgggac 1680 cttggaacct tctggagact ttggctggcc cgtcgctcca tccgcagctc tggtagagaa 1740 gctatctaga caatcagccc tttcccggag agccccccta accttaggga gtcaggggtg 1800 agtgatccaa gtgccccctt gggtagaaag gaaaacaggc tctgaggaca gaaatttgcc 1860 caaggtctcc cagctaattc aggggtggag cctgcccgga ctttgacccc aagtccagaa 1920 ggagctctgc tctcccaagt cagctggcct gtcagcctgg aggcggcctg ggggaggcgg 1980 ggagggcagg gatggggctg tgcacccctt tccatgccca gccagccatg gcctacaccc 2040 cccacccccg gccaccccca tgggcacagg cattttgctg gcataccttc taaccccctg 2100 cttcgggcag ggtgctggcc acgacacaga tgcagtctac agatgcccgg aaatccttcc 2160 catgctttga cgagccagcc atgaaggcca cgttcaacat cactctcatc caccctaaca 2220 acctcacggc cctgtccaat atgccgccca aaggtgagcg ggcctggcgg ggaccacacg 2280 gcctgggaaa gcaggtccct ggggctgggg tgcaggtccc tgttgctggg gtgcaggccc 2340 aggaagaggg cacccctcca cgcctgcgtg tcgcacccag gttccagcac cccacttgca 2400 gaagacccca actggtctgt cactgagttc gaaaccacac ctgtgatgtc cacgtacctt 2460 ctggcctaca tcgtgagcga gttccagagc gtgaatgaaa cggcccaaaa tggcgtcctg 2520 gtaaggggct gagcccacct gcccttcccc acattggccc tggcctggga agtattccca 2580 tttatcctca tccttgtccc t 2601 <210> 168 <211> 2332 <212> DNA <213> Sus scrofa <400> 168 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 caacgtcaaa aagtaagtca ggtgggggca caccctagat gctgaggcag agctggatcc 1380 tgggggccaa ggaagggctt ggattcggga ccttggaacc ttctggagac tttggctggc 1440 ccgtcgctcc atccgcagct ctggtagaga agctatctag acaatcagcc ctttcccgga 1500 gagcccccct aaccttaggg agtcaggggt gagtgatcca agtgccccct tgggtagaaa 1560 ggaaaacagg ctctgaggac agaaatttgc ccaaggtctc ccagctaatt caggggtgga 1620 gcctgcccgg actttgaccc caagtccaga aggagctctg ctctcccaag tcagctggcc 1680 tgtcagcctg gaggcggcct gggggaggcg gggagggcag ggatggggct gtgcacccct 1740 ttccatgccc agccagccat ggcctacacc ccccaccccc ggccaccccc atgggcacag 1800 gcattttgct ggcatacctt ctaaccccct gcttcgggca gggtgctggc cacgacacag 1860 atgcagtcta cagatgcccg gaaatccttc ccatgctttg acgagccagc catgaaggcc 1920 acgttcaaca tcactctcat ccaccctaac aacctcacgg ccctgtccaa tatgccgccc 1980 aaaggtgagc gggcctggcg gggaccacac ggcctgggaa agcaggtccc tggggctggg 2040 gtgcaggtcc ctgttgctgg ggtgcaggcc caggaagagg gcacccctcc acgcctgcgt 2100 gtcgcaccca ggttccagca ccccacttgc agaagacccc aactggtctg tcactgagtt 2160 cgaaaccaca cctgtgatgt ccacgtacct tctggcctac atcgtgagcg agttccagag 2220 cgtgaatgaa acggcccaaa atggcgtcct ggtaaggggc tgagcccacc tgcccttccc 2280 cacattggcc ctggcctggg aagtattccc atttatcctc atccttgtcc ct 2332 <210> 169 <211> 5 <212> DNA <213> Sus scrofa <400> 169 ccctc 5 <210> 170 <211> 2590 <212> DNA <213> Sus scrofa <400> 170 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca acgtcaaaaa gtaagtcagg tgggggcaca ccctagatgc 1620 tgaggcagag ctggatcctg ggggccaagg aagggcttgg attcgggacc ttggaacctt 1680 ctggagactt tggctggccc gtcgctccat ccgcagctct ggtagagaag ctatctagac 1740 aatcagccct ttcccggaga gcccccctaa ccttagggag tcaggggtga gtgatccaag 1800 tgcccccttg ggtagaaagg aaaacaggct ctgaggacag aaatttgccc aaggtctccc 1860 agctaattca ggggtggagc ctgcccggac tttgacccca agtccagaag gagctctgct 1920 ctcccaagtc agctggcctg tcagcctgga ggcggcctgg gggaggcggg gagggcaggg 1980 atggggctgt gcaccccttt ccatgcccag ccagccatgg cctacacccc ccacccccgg 2040 ccacccccat gggcacaggc attttgctgg cataccttct aaccccctgc ttcgggcagg 2100 gtgctggcca cgacacagat gcagtctaca gatgcccgga aatccttccc atgctttgac 2160 gagccagcca tgaaggccac gttcaacatc actctcatcc accctaacaa cctcacggcc 2220 ctgtccaata tgccgcccaa aggtgagcgg gcctggcggg gaccacacgg cctgggaaag 2280 caggtccctg gggctggggt gcaggtccct gttgctgggg tgcaggccca ggaagagggc 2340 acccctccac gcctgcgtgt cgcacccagg ttccagcacc ccacttgcag aagaccccaa 2400 ctggtctgtc actgagttcg aaaccacacc tgtgatgtcc acgtaccttc tggcctacat 2460 cgtgagcgag ttccagagcg tgaatgaaac ggcccaaaat ggcgtcctgg taaggggctg 2520 agcccacctg cccttcccca cattggccct ggcctgggaa gtattcccat ttatcctcat 2580 ccttgtccct 2590 <210> 171 <211> 2598 <212> DNA <213> Sus scrofa <400> 171 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca ggagggcaac gtcaaaaagt aagtcaggtg ggggcacacc 1620 ctagatgctg aggcagagct ggatcctggg ggccaaggaa gggcttggat tcgggacctt 1680 ggaaccttct ggagactttg gctggcccgt cgctccatcc gcagctctgg tagagaagct 1740 atctagacaa tcagcccttt cccggagagc ccccctaacc ttagggagtc aggggtgagt 1800 gatccaagtg cccccttggg tagaaaggaa aacaggctct gaggacagaa atttgcccaa 1860 ggtctcccag ctaattcagg ggtggagcct gcccggactt tgaccccaag tccagaagga 1920 gctctgctct cccaagtcag ctggcctgtc agcctggagg cggcctgggg gaggcgggga 1980 gggcagggat ggggctgtgc acccctttcc atgcccagcc agccatggcc tacacccccc 2040 acccccggcc acccccatgg gcacaggcat tttgctggca taccttctaa ccccctgctt 2100 cgggcagggt gctggccacg acacagatgc agtctacaga tgcccggaaa tccttcccat 2160 gctttgacga gccagccatg aaggccacgt tcaacatcac tctcatccac cctaacaacc 2220 tcacggccct gtccaatatg ccgcccaaag gtgagcgggc ctggcgggga ccacacggcc 2280 tgggaaagca ggtccctggg gctggggtgc aggtccctgt tgctggggtg caggcccagg 2340 aagagggcac ccctccacgc ctgcgtgtcg cacccaggtt ccagcacccc acttgcagaa 2400 gaccccaact ggtctgtcac tgagttcgaa accacacctg tgatgtccac gtaccttctg 2460 gcctacatcg tgagcgagtt ccagagcgtg aatgaaacgg cccaaaatgg cgtcctggta 2520 aggggctgag cccacctgcc cttccccaca ttggccctgg cctgggaagt attcccattt 2580 atcctcatcc ttgtccct 2598 <210> 172 <211> 2587 <212> DNA <213> Sus scrofa <400> 172 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca tcaaaaagta agtcaggtgg gggcacaccc tagatgctga 1620 ggcagagctg gatcctgggg gccaaggaag ggcttggatt cgggaccttg gaaccttctg 1680 gagactttgg ctggcccgtc gctccatccg cagctctggt agagaagcta tctagacaat 1740 cagccctttc ccggagagcc cccctaacct tagggagtca ggggtgagtg atccaagtgc 1800 ccccttgggt agaaaggaaa acaggctctg aggacagaaa tttgcccaag gtctcccagc 1860 taattcaggg gtggagcctg cccggacttt gaccccaagt ccagaaggag ctctgctctc 1920 ccaagtcagc tggcctgtca gcctggaggc ggcctggggg aggcggggag ggcagggatg 1980 gggctgtgca cccctttcca tgcccagcca gccatggcct acacccccca cccccggcca 2040 cccccatggg cacaggcatt ttgctggcat accttctaac cccctgcttc gggcagggtg 2100 ctggccacga cacagatgca gtctacagat gcccggaaat ccttcccatg ctttgacgag 2160 ccagccatga aggccacgtt caacatcact ctcatccacc ctaacaacct cacggccctg 2220 tccaatatgc cgcccaaagg tgagcgggcc tggcggggac cacacggcct gggaaagcag 2280 gtccctgggg ctggggtgca ggtccctgtt gctggggtgc aggcccagga agagggcacc 2340 cctccacgcc tgcgtgtcgc acccaggttc cagcacccca cttgcagaag accccaactg 2400 gtctgtcact gagttcgaaa ccacacctgt gatgtccacg taccttctgg cctacatcgt 2460 gagcgagttc cagagcgtga atgaaacggc ccaaaatggc gtcctggtaa ggggctgagc 2520 ccacctgccc ttccccacat tggccctggc ctgggaagta ttcccattta tcctcatcct 2580 tgtccct 2587 <210> 173 <211> 2574 <212> DNA <213> Sus scrofa <400> 173 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 ggcaacgtca aaaagtaagt caggtggggg cacaccctag atgctgaggc agagctggat 1620 cctgggggcc aaggaagggc ttggattcgg gaccttggaa ccttctggag actttggctg 1680 gcccgtcgct ccatccgcag ctctggtaga gaagctatct agacaatcag ccctttcccg 1740 gagagccccc ctaaccttag ggagtcaggg gtgagtgatc caagtgcccc cttgggtaga 1800 aaggaaaaca ggctctgagg acagaaattt gcccaaggtc tcccagctaa ttcaggggtg 1860 gagcctgccc ggactttgac cccaagtcca gaaggagctc tgctctccca agtcagctgg 1920 cctgtcagcc tggaggcggc ctgggggagg cggggagggc agggatgggg ctgtgcaccc 1980 ctttccatgc ccagccagcc atggcctaca ccccccaccc ccggccaccc ccatgggcac 2040 aggcattttg ctggcatacc ttctaacccc ctgcttcggg cagggtgctg gccacgacac 2100 agatgcagtc tacagatgcc cggaaatcct tcccatgctt tgacgagcca gccatgaagg 2160 ccacgttcaa catcactctc atccacccta acaacctcac ggccctgtcc aatatgccgc 2220 ccaaaggtga gcgggcctgg cggggaccac acggcctggg aaagcaggtc cctggggctg 2280 gggtgcaggt ccctgttgct ggggtgcagg cccaggaaga gggcacccct ccacgcctgc 2340 gtgtcgcacc caggttccag caccccactt gcagaagacc ccaactggtc tgtcactgag 2400 ttcgaaacca cacctgtgat gtccacgtac cttctggcct acatcgtgag cgagttccag 2460 agcgtgaatg aaacggccca aaatggcgtc ctggtaaggg gctgagccca cctgcccttc 2520 cccacattgg ccctggcctg ggaagtattc ccatttatcc tcatccttgt ccct 2574 <210> 174 <211> 2591 <212> DNA <213> Sus scrofa <400> 174 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcggagggc aacgtcaaaa agtaagtcag gtgggggcac accctagatg 1620 ctgaggcaga gctggatcct gggggccaag gaagggcttg gattcgggac cttggaacct 1680 tctggagact ttggctggcc cgtcgctcca tccgcagctc tggtagagaa gctatctaga 1740 caatcagccc tttcccggag agccccccta accttaggga gtcaggggtg agtgatccaa 1800 gtgccccctt gggtagaaag gaaaacaggc tctgaggaca gaaatttgcc caaggtctcc 1860 cagctaattc aggggtggag cctgcccgga ctttgacccc aagtccagaa ggagctctgc 1920 tctcccaagt cagctggcct gtcagcctgg aggcggcctg ggggaggcgg ggagggcagg 1980 gatggggctg tgcacccctt tccatgccca gccagccatg gcctacaccc cccacccccg 2040 gccaccccca tgggcacagg cattttgctg gcataccttc taaccccctg cttcgggcag 2100 ggtgctggcc acgacacaga tgcagtctac agatgcccgg aaatccttcc catgctttga 2160 cgagccagcc atgaaggcca cgttcaacat cactctcatc caccctaaca acctcacggc 2220 cctgtccaat atgccgccca aaggtgagcg ggcctggcgg ggaccacacg gcctgggaaa 2280 gcaggtccct ggggctgggg tgcaggtccc tgttgctggg gtgcaggccc aggaagaggg 2340 cacccctcca cgcctgcgtg tcgcacccag gttccagcac cccacttgca gaagacccca 2400 actggtctgt cactgagttc gaaaccacac ctgtgatgtc cacgtacctt ctggcctaca 2460 tcgtgagcga gttccagagc gtgaatgaaa cggcccaaaa tggcgtcctg gtaaggggct 2520 gagcccacct gcccttcccc acattggccc tggcctggga agtattccca tttatcctca 2580 tccttgtccc t 2591 <210> 175 <211> 2599 <212> DNA <213> Sus scrofa <400> 175 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca acgagggcaa cgtcaaaaag taagtcaggt gggggcacac 1620 cctagatgct gaggcagagc tggatcctgg gggccaagga agggcttgga ttcgggacct 1680 tggaaccttc tggagacttt ggctggcccg tcgctccatc cgcagctctg gtagagaagc 1740 tatctagaca atcagccctt tcccggagag cccccctaac cttagggagt caggggtgag 1800 tgatccaagt gcccccttgg gtagaaagga aaacaggctc tgaggacaga aatttgccca 1860 aggtctccca gctaattcag gggtggagcc tgcccggact ttgaccccaa gtccagaagg 1920 agctctgctc tcccaagtca gctggcctgt cagcctggag gcggcctggg ggaggcgggg 1980 agggcaggga tggggctgtg cacccctttc catgcccagc cagccatggc ctacaccccc 2040 cacccccggc cacccccatg ggcacaggca ttttgctggc ataccttcta accccctgct 2100 tcgggcaggg tgctggccac gacacagatg cagtctacag atgcccggaa atccttccca 2160 tgctttgacg agccagccat gaaggccacg ttcaacatca ctctcatcca ccctaacaac 2220 ctcacggccc tgtccaatat gccgcccaaa ggtgagcggg cctggcgggg accacacggc 2280 ctgggaaagc aggtccctgg ggctggggtg caggtccctg ttgctggggt gcaggcccag 2340 gaagagggca cccctccacg cctgcgtgtc gcacccaggt tccagcaccc cacttgcaga 2400 agaccccaac tggtctgtca ctgagttcga aaccacacct gtgatgtcca cgtaccttct 2460 ggcctacatc gtgagcgagt tccagagcgt gaatgaaacg gcccaaaatg gcgtcctggt 2520 aaggggctga gcccacctgc ccttccccac attggccctg gcctgggaag tattcccatt 2580 tatcctcatc cttgtccct 2599 <210> 176 <211> 2600 <212> DNA <213> Sus scrofa <400> 176 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtaca atggagggca acgtcaaaaa gtaagtcagg tgggggcaca 1620 ccctagatgc tgaggcagag ctggatcctg ggggccaagg aagggcttgg attcgggacc 1680 ttggaacctt ctggagactt tggctggccc gtcgctccat ccgcagctct ggtagagaag 1740 ctatctagac aatcagccct ttcccggaga gcccccctaa ccttagggag tcaggggtga 1800 gtgatccaag tgcccccttg ggtagaaagg aaaacaggct ctgaggacag aaatttgccc 1860 aaggtctccc agctaattca ggggtggagc ctgcccggac tttgacccca agtccagaag 1920 gagctctgct ctcccaagtc agctggcctg tcagcctgga ggcggcctgg gggaggcggg 1980 gagggcaggg atggggctgt gcaccccttt ccatgcccag ccagccatgg cctacacccc 2040 ccacccccgg ccacccccat gggcacaggc attttgctgg cataccttct aaccccctgc 2100 ttcgggcagg gtgctggcca cgacacagat gcagtctaca gatgcccgga aatccttccc 2160 atgctttgac gagccagcca tgaaggccac gttcaacatc actctcatcc accctaacaa 2220 cctcacggcc ctgtccaata tgccgcccaa aggtgagcgg gcctggcggg gaccacacgg 2280 cctgggaaag caggtccctg gggctggggt gcaggtccct gttgctgggg tgcaggccca 2340 ggaagagggc acccctccac gcctgcgtgt cgcacccagg ttccagcacc ccacttgcag 2400 aagaccccaa ctggtctgtc actgagttcg aaaccacacc tgtgatgtcc acgtaccttc 2460 tggcctacat cgtgagcgag ttccagagcg tgaatgaaac ggcccaaaat ggcgtcctgg 2520 taaggggctg agcccacctg cccttcccca cattggccct ggcctgggaa gtattcccat 2580 ttatcctcat ccttgtccct 2600 <210> 177 <211> 1946 <212> DNA <213> Sus scrofa <400> 177 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtg gggcttataa gtcaggtggg 960 ggcacaccct agatgctgag gcagagctgg atcctggggg ccaaggaagg gcttggattc 1020 gggaccttgg aaccttctgg agactttggc tggcccgtcg ctccatccgc agctctggta 1080 gagaagctat ctagacaatc agccctttcc cggagagccc ccctaacctt agggagtcag 1140 gggtgagtga tccaagtgcc cccttgggta gaaaggaaaa caggctctga ggacagaaat 1200 ttgcccaagg tctcccagct aattcagggg tggagcctgc ccggactttg accccaagtc 1260 cagaaggagc tctgctctcc caagtcagct ggcctgtcag cctggaggcg gcctggggga 1320 ggcggggagg gcagggatgg ggctgtgcac ccctttccat gcccagccag ccatggccta 1380 caccccccac ccccggccac ccccatgggc acaggcattt tgctggcata ccttctaacc 1440 ccctgcttcg ggcagggtgc tggccacgac acagatgcag tctacagatg cccggaaatc 1500 cttcccatgc tttgacgagc cagccatgaa ggccacgttc aacatcactc tcatccaccc 1560 taacaacctc acggccctgt ccaatatgcc gcccaaaggt gagcgggcct ggcggggacc 1620 acacggcctg ggaaagcagg tccctggggc tggggtgcag gtccctgttg ctggggtgca 1680 ggcccaggaa gagggcaccc ctccacgcct gcgtgtcgca cccaggttcc agcaccccac 1740 ttgcagaaga ccccaactgg tctgtcactg agttcgaaac cacacctgtg atgtccacgt 1800 accttctggc ctacatcgtg agcgagttcc agagcgtgaa tgaaacggcc caaaatggcg 1860 tcctggtaag gggctgagcc cacctgccct tccccacatt ggccctggcc tgggaagtat 1920 tcccatttat cctcatcctt gtccct 1946 <210> 178 <211> 2595 <212> DNA <213> Sus scrofa <400> 178 actggtggat gggaagggtg acagtgaaca ttgttttcct gtaaggacat gtgctgttga 60 gtataaggag taccttcatt tctaccacgg atagaatggg tgaccctctg gatgagaaag 120 aagggaagga ttttgaggtt ctactatatg gtgtttaata tgttttctaa cattaaatcc 180 gctcaccaaa tctgagacgt aaattctagt atttatttat gtgaacaggg ttctcagaaa 240 ggagaactta cctgccagag gtcatggctg ggaagaggtt aagccgccgc tagcctccct 300 tctttaaaaa aaaaaaaaaa aaaaaaaaaa ggcaaaacaa cttatttcat tctactcagt 360 gagctgataa ttgaggggaa agtttttggc aagaagggaa agtggcgggg ggaggacctg 420 gaagaactcc ctgctctgga agaatgcggg aggctgggac catgtccctg aggagcgccg 480 ggcatccctc caactgcagg gctgacccgg tgtggtcttg acccgagcca gaggccggct 540 ctccccgtct tttcacctcc cacctcttgc tcctgggacg tccttcgacc ctcctggatc 600 taacctcagt cttcctgctc ctgtgcctgt tgtcatagct cacagctcac agggagatcc 660 aagccacctg gccgctccct ctccccgctg ggccagctgc ctgccacctg cccttcagcc 720 cttggtgggc tcccaggctc ctgcagcctg taaccagacc ctgtttgctc ccagcaggca 780 cccctgagcc gcactccgca cgctgttcct gaatctcccc tccagaaccg gagcagtgtc 840 tctacccagt tcagtgacct tcgtctgtct gagccctggt taatttttgc ccagtctgca 900 ggctgtgggg ctcctcccct tcagggatat aagcctggtc cgaagctgcc ctgtcccctg 960 cccgtcctga gcctccccga gctcccttct caccctcacc atggccaagg gattctacat 1020 ttccaaggcc ctgggcatcc tgggcatcct cctcggcgtg gcggccgtgg ccaccatcat 1080 cgctctgtct gtggtgtacg cccaggagaa gaacaagaat gccgagcatg tcccccaggc 1140 ccccacgtcg cccaccatca ccaccacagc cgccatcacc ttggaccaga gcaagccgtg 1200 gaaccggtac cgcctaccca caacgctgtt gcctgattcc tacaacgtga cgctgagacc 1260 ctacctcact cccaacgcgg atggcctgta catcttcaag ggcaaaagca tcgtccgctt 1320 catctgccag gagcccaccg atgtcatcat catccatagc aagaagctca actacaccac 1380 ccaggggcac atggtggtcc tgcggggcgt gggggactcc caggtcccag agatcgacag 1440 gactgagctg gtagagctca ctgagtacct ggtggtccac ctcaagggct cgctgcagcc 1500 cggccacatg tacgagatgg agagtgaatt ccagggggaa cttgccgacg acctggcagg 1560 cttctaccgc agcgagtact cgtcaacgtc aaaaagtaag tcaggtgggg gcacacccta 1620 gatgctgagg cagagctgga tcctgggggc caaggaaggg cttggattcg ggaccttgga 1680 accttctgga gactttggct ggcccgtcgc tccatccgca gctctggtag agaagctatc 1740 tagacaatca gccctttccc ggagagcccc cctaacctta gggagtcagg ggtgagtgat 1800 ccaagtgccc ccttgggtag aaaggaaaac aggctctgag gacagaaatt tgcccaaggt 1860 ctcccagcta attcaggggt ggagcctgcc cggactttga ccccaagtcc agaaggagct 1920 ctgctctccc aagtcagctg gcctgtcagc ctggaggcgg cctgggggag gcggggaggg 1980 cagggatggg gctgtgcacc cctttccatg cccagccagc catggcctac accccccacc 2040 cccggccacc cccatgggca caggcatttt gctggcatac cttctaaccc cctgcttcgg 2100 gcagggtgct ggccacgaca cagatgcagt ctacagatgc ccggaaatcc ttcccatgct 2160 ttgacgagcc agccatgaag gccacgttca acatcactct catccaccct aacaacctca 2220 cggccctgtc caatatgccg cccaaaggtg agcgggcctg gcggggacca cacggcctgg 2280 gaaagcaggt ccctggggct ggggtgcagg tccctgttgc tggggtgcag gcccaggaag 2340 agggcacccc tccacgcctg cgtgtcgcac ccaggttcca gcaccccact tgcagaagac 2400 cccaactggt ctgtcactga gttcgaaacc acacctgtga tgtccacgta ccttctggcc 2460 tacatcgtga gcgagttcca gagcgtgaat gaaacggccc aaaatggcgt cctggtaagg 2520 ggctgagccc acctgccctt ccccacattg gccctggcct gggaagtatt cccatttatc 2580 ctcatccttg tccct 2595 <210> 179 <211> 8 <212> DNA <213> Sus scrofa <400> 179 ggggctta 8 <210> 180 <211> 4 <212> DNA <213> Sus scrofa <400> 180 tcgt 4 <210> 181 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 181 atggcttctg tcagttttca g 21 <210> 182 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 182 ttaatttcct gtgtcgaaga t 21 <210> 183 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 183 tctgctgaag gtgctattat atgc 24 <210> 184 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 184 cacaatttgc ctctgaatta gaag 24 <210> 185 <211> 26 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 185 yaagggctca ccacctacta ccacca 26 <210> 186 <211> 8 <212> DNA <213> Artificial sequence <220> <223> Synthetic construct <220> <221> misc_feature <222> (1)..(2) <223> n = any purine <220> <221> misc_feature <222> (5)..(7) <223> n = any purine <220> <221> misc_feature <222> (8)..(8) <223> n = any pyrimidine <400> 186 nngtnnnn 8

Claims (35)

  1. 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 포함하는 가축 동물 또는 이의 자손 또는 동물 세포.
  2. 제1항에 있어서, 상기 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 병원체 감염에 대한 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축동물, 자손, 또는 세포의 감수성과 비교하여, 병원체 감염에 대한 동물, 자손, 또는 세포의 감수성을 감소시키는, 가축 동물, 자손, 또는 세포.
  3. 제2항에 있어서, 상기 병원체가 바이러스를 포함하는, 가축 동물, 자손, 또는 세포.
  4. 제3항에 있어서, 상기 바이러스가 알파코로나바이러스 속 바이러스를 포함하는, 가축 동물, 자손, 또는 세포.
  5. 제4항에 있어서, 상기 알파코로나바이러스 속 바이러스가 전염성 위장염 바이러스(TGEV) 또는 돼지 호흡기 코로나바이러스(PRCV)를 포함하는, 가축 동물, 자손, 또는 세포.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 가축 동물이 돼지 동물을 포함하거나 또는 상기 세포가 돼지 동물로부터 유래되는, 가축 동물, 자손, 또는 세포.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 동물 또는 자손이 배아, 발육기, 또는 성체이거나, 또는 상기 세포가 배아 세포, 발육기 동물로부터 유래된 세포, 또는 성체 동물로부터 유래된 세포를 포함하는, 가축 동물, 자손, 또는 세포.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 동물, 자손, 또는 세포가 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 이형접합인, 가축 동물, 자손, 또는 세포.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 동물, 자손, 또는 세포가 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열에 대해 동형접합인, 가축 동물, 자손, 또는 세포.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 변형된 염색체 서열이 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 삽입, ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 결실, ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 치환, 또는 이의 임의의 조합을 포함하는, 가축 동물, 자손, 또는 세포.
  11. 제10항에 있어서, 상기 삽입, 결실, 치환, 또는 이의 임의의 조합이 ANPEP 단백질을 암호화하는 유전자의 대립유전자에서 암호화 오류를 초래하는, 가축 동물, 자손, 또는 세포.
  12. 제10항에 있어서, 상기 결실이 하기를 포함하는, 가축 동물, 자손, 또는 세포:
    상기 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 개시 코돈의 결실; 또는
    상기 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 전체 코딩 서열의 결실.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 없는 동물, 자손, 또는 세포에서 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성의 감소를 유발하는, 가축 동물, 자손, 또는 세포.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 동물, 자손, 또는 세포에 의해 실질적으로 기능적 ANPEP 단백질을 생산하지 않는, 가축 동물, 자손, 또는 세포.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 변형된 염색체 서열이 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2; ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 4; ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2 또는 엑손 4와 인접한 인트론; 또는 이의 임의의 조합에서 변형을 포함하는, 가축 동물, 자손, 또는 세포.
  16. 제15항에 있어서, 상기 변형된 염색체 서열이 ANPEP 단백질을 암호화하는 유전자의 대립유전자의 엑손 2의 결실을 포함하며, 상기 결실이 엑손 2에서 인프레임 결실을 포함하는, 가축 동물, 자손, 또는 세포.
  17. 제16항에 있어서, 상기 엑손 2에서 인프레임 결실이,
    상기 ANPEP 단백질의 아미노산 194 내지 196의 결실을 초래하거나; 또는
    상기 ANPEP 단백질의 아미노산 194 내지 197의 결실을 초래하며, 상기 인프레임 결실은 임의적으로 ANPEP 단백질의 위치 198에서 발린 잔기의 이소류신 잔기로의 치환을 추가로 초래하는, 가축 동물, 자손, 또는 세포.
  18. 제15항에 있어서, 상기 변형된 염색체 서열이 하기로 이루어진 군으로부터 선택된 변형을 포함하는, 가축 동물, 자손, 또는 세포:
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,397에서 뉴클레오티드 1,578까지 182 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,397에서 시작하는 5 염기쌍 삽입으로 대체됨;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,574에서 뉴클레오티드 1,582까지 9 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,577에서 뉴클레오티드 1,585까지 9 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여 뉴클레오티드 819에서 뉴클레오티드 1,685까지 867 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여 뉴클레오티드 882에서 뉴클레오티드 1,688까지 867 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,580 및 1,581 사이에 1 염기쌍 삽입;
    참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,579 및 1,580 사이에 1 염기쌍 삽입;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,321에서 뉴클레오티드 1,587까지 267 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,323에서 뉴클레오티드 1,589까지 267 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581의 1 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,561에서 뉴클레오티드 1,585까지 25 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,560에서 뉴클레오티드 1,584까지 25 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,575에서 뉴클레오티드 1,582까지 8 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,574에서 뉴클레오티드 1,581까지 8 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨;
    및 이의 임의의 조합.
  19. 제18항에 있어서, 상기 변형된 염색체 서열이 하기로 이루어진 군으로부터 선택된 변형을 포함하는, 가축 동물, 자손, 또는 세포:
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 940에서 뉴클레오티드 1,600까지 661 염기쌍 결실, 여기서 결실된 서열은 뉴클레오티드 940에서 시작하는 8 염기쌍 삽입으로 대체됨;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,580에서 뉴클레오티드 1,587까지 8 염기쌍 결실, 여기서 결실된 뉴클레오티드 1,580에서 시작하는 4 염기쌍 삽입으로 대체됨;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581 및 1,582 사이에 1 염기쌍 삽입;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581 및 1,582 사이에 2 염기쌍 삽입;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581에서 뉴클레오티드 1,589까지 9 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,582에서 뉴클레오티드 1,593까지 12 염기쌍 결실;
    참조 서열 서열번호: 135와 비교하여, 뉴클레오티드 1,581의 1 염기쌍 결실;
    및 이의 임의의 조합.
  20. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 변형된 염색체 서열이 참조 서열 서열번호: 132의 뉴클레오티드 17,235 내지 22,422를 포함하는 영역 내에서 변형을 포함하는, 가축 동물, 자손, 또는 세포.
  21. 제10항 내지 제20항 중 어느 한 항에 있어서, 상기 동물, 자손 또는 세포가 삽입, 결실, 또는 치환 이외에 염색체 서열의 영역에서 서열번호: 135 또는 132에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 적어도 99.9%, 또는 100% 서열 동일성을 갖는 ANPEP 단백질을 암호화하는 유전자에서 염색체 서열을 포함하는, 가축 동물, 자손, 또는 세포.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 가축 동물, 자손, 또는 세포가 서열번호: 163, 164, 165, 166, 167, 168, 170, 171, 172, 173, 174, 176, 177, 또는 178을 포함하는 염색체 서열을 포함하는, 가축 동물, 자손, 또는 세포.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 가축 동물, 자손, 또는 세포가 CD163 단백질을 암호화하는 유전자에서 적어도 하나의 변형된 염색체 서열을 추가로 포함하는, 가축 동물, 자손, 또는 세포.
  24. 제23항에 있어서, 상기 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 돼지 생식 및 호흡기 증후군 바이러스에 의한 감염에 대한 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물, 자손, 또는 세포의 감수성과 비교하여, 돼지 생식기 및 호흡기 증후군 바이러스(PRRSV)에 의한 감염에 대한 동물, 자손, 또는 세포의 감수성을 감소시키는, 가축 동물, 자손, 또는 세포.
  25. 제23항 또는 제24항에 있어서, 상기 CD163 단백질을 암호화하는 유전자에서 변형된 염색체 서열이 동물, 자손, 또는 세포에 의해 실질적으로 기능적 CD163 단백질을 생산하지 않는, 가축 동물, 자손, 또는 세포.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 가축 동물, 자손, 또는 세포가 SIGLEC1 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 추가로 포함하는, 가축 동물, 자손, 또는 세포.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 동물 또는 자손이 유전적으로 편집된 동물 또는 자손을 포함하거나 또는 세포가 유전적으로 편집된 세포를 포함하는, 가축 동물, 자손, 또는 세포.
  28. 제27항에 있어서, 상기 동물 또는 세포가 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템, 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN), 리콤비나제 융합 단백질, 메가뉴클레아제, 또는 이의 임의의 조합을 포함하는 호밍 엔도뉴클레아제를 사용하여 유전적으로 편집된, 가축 동물, 자손, 또는 세포.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 세포가 정자 세포, 난자 세포(임의적으로 수정란), 또는 체세포(임의적으로 섬유아세포)를 포함하는, 세포.
  30. 병원체 감염에 대한 감수성이 감소된 비인간 동물 또는 비인간 동물의 계통을 생산하는 방법으로, 여기서 상기 방법은 하기를 포함하는, 방법:
    난모세포 또는 정자 세포를 변형시켜 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 난모세포 및 정자 세포 중 적어도 하나에 도입하고, 난모세포를 정자 세포와 수정하여 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 함유하는 수정란을 생성하는 단계; 또는
    수정란을 변형시켜 ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 수정란에 도입하는 단계;
    수정란을 대리 암컷 동물로 옮기며, 여기서 임신 및 만기 분만이 자손 동물을 생산하는, 단계;
    병원체에 대한 감수성에 대해 자손 동물을 스크리닝하는 단계; 및
    ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 동물과 비교하여 병원체에 대한 감수성이 감소된 자손 동물을 선택하는 단계.
  31. ANPEP 단백질을 암호화하는 유전자에서 변형된 염색체 서열을 포함하지 않는 가축 동물에서 ANPEP 단백질 생산 또는 활성과 비교하여, ANPEP 단백질 생산 또는 활성이 감소하도록 아미노펩티다제 N(ANPEP) 단백질을 암호화하는 유전자에서 적어도 하나의 염색체 서열을 변형시키는 단계를 포함하는, 병원체 감염에 대한 가축 동물의 내성을 증가시키는 방법.
  32. 제1항 내지 제28항 중 어느 한 항의 2 마리 이상의 가축 동물 및/또는 이의 자손을 포함하는 가축 동물의 집단.
  33. 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하는 핵산 분자:
    (a) 서열번호: 135의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함;
    (b) 서열번호: 132의 서열에 대해 적어도 80% 서열 동일성을 갖는 뉴클레오티드 서열, 여기서 뉴클레오티드 서열은 서열번호: 132와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함함; 및
    (c) (a) 또는 (b)의 cDNA.
  34. 제33항에 있어서, 상기 핵산이 서열번호: 132 또는 135에 대해 적어도 80%, 적어도 85%, 적어도 87.5%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 99.9% 동일성을 갖는 뉴클레오티드 서열을 포함하며, 뉴클레오티드 서열이 서열번호: 132 또는 135와 관련한 적어도 하나의 치환, 삽입, 또는 결실을 포함하는, 핵산 분자.
  35. 제33항 또는 제34항에 있어서, 상기 핵산이 서열번호. 163, 164, 165, 166, 167, 168, 170, 171, 172, 173, 174, 176, 177, 또는 178을 포함하는, 핵산 분자.
KR1020207033628A 2018-04-27 2019-04-26 변형된 아미노펩티다제 n(anpep) 유전자를 갖는 병원체-내성 동물 KR20210005661A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862663495P 2018-04-27 2018-04-27
US62/663,495 2018-04-27
PCT/US2019/029356 WO2019210175A1 (en) 2018-04-27 2019-04-26 Pathogen-resistant animals having modified aminopeptidase n (anpep) genes

Publications (1)

Publication Number Publication Date
KR20210005661A true KR20210005661A (ko) 2021-01-14

Family

ID=68295755

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207033628A KR20210005661A (ko) 2018-04-27 2019-04-26 변형된 아미노펩티다제 n(anpep) 유전자를 갖는 병원체-내성 동물

Country Status (10)

Country Link
US (1) US20200236914A1 (ko)
JP (1) JP2021521844A (ko)
KR (1) KR20210005661A (ko)
CN (1) CN112313330A (ko)
AU (1) AU2019257776A1 (ko)
BR (1) BR112020021476A2 (ko)
CA (1) CA3096283A1 (ko)
MX (1) MX2020010926A (ko)
PH (1) PH12020551629A1 (ko)
WO (1) WO2019210175A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112063620A (zh) * 2020-06-16 2020-12-11 中国人民解放军陆军军医大学 抑制猪流行性腹泻病毒M基因表达的shRNA
CN113512534B (zh) * 2020-09-23 2024-04-23 杭州启函生物科技有限公司 用于遗传修饰和靶向的组合物和方法
CN113604502A (zh) * 2021-08-26 2021-11-05 中国农业科学院北京畜牧兽医研究所 pAPN基因第16外显子的基因编辑系统及其应用
WO2024013514A2 (en) * 2022-07-15 2024-01-18 Pig Improvement Company Uk Limited Gene edited livestock animals having coronavirus resistance

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2691618T3 (es) * 2011-05-16 2018-11-28 The Curators Of The University Of Missouri Animales resistentes al virus del síndrome reproductivo y respiratorio porcino
US20150275231A1 (en) * 2014-03-31 2015-10-01 Mice With Horns, Llc Method of Preventing or Reducing Virus Transmission in Animals
KR102631856B1 (ko) * 2015-08-06 2024-02-01 더 큐레이터스 오브 더 유니버시티 오브 미주리 변형된 cd163 유전자를 갖는 병원균-내성 동물
CN107034218A (zh) * 2017-06-07 2017-08-11 浙江大学 用于猪APN基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
CN107937345B (zh) * 2017-11-16 2019-01-29 山东蓝思种业股份有限公司 一种制备同时敲除cd163基因和cd13基因的猪成纤维细胞的方法

Also Published As

Publication number Publication date
JP2021521844A (ja) 2021-08-30
CN112313330A (zh) 2021-02-02
MX2020010926A (es) 2021-01-08
WO2019210175A1 (en) 2019-10-31
AU2019257776A1 (en) 2020-10-22
BR112020021476A2 (pt) 2021-01-19
US20200236914A1 (en) 2020-07-30
CA3096283A1 (en) 2019-10-31
PH12020551629A1 (en) 2021-07-12

Similar Documents

Publication Publication Date Title
US20240122164A1 (en) Pathogen-resistant animals having modified cd163 genes
US11160260B2 (en) Methods for protecting porcine fetuses from infection with porcine reproductive and respiratory syndrome virus (PRRSV)
KR102495662B1 (ko) 변형된 cd163 유전자를 갖는 병원균-내성 동물
KR20210005661A (ko) 변형된 아미노펩티다제 n(anpep) 유전자를 갖는 병원체-내성 동물
AU2021201827B2 (en) Non-human animals having a disruption in a c9orf72 locus
JP2023098940A (ja) ウイルス感染からブタ胎児を保護するための方法
RU2778405C2 (ru) Способы защиты плодов свиней от инфицирования вирусом
US20240000051A1 (en) Influenza a-resistant animals having edited anp32 genes