KR102628872B1 - 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 - Google Patents

세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 Download PDF

Info

Publication number
KR102628872B1
KR102628872B1 KR1020177028536A KR20177028536A KR102628872B1 KR 102628872 B1 KR102628872 B1 KR 102628872B1 KR 1020177028536 A KR1020177028536 A KR 1020177028536A KR 20177028536 A KR20177028536 A KR 20177028536A KR 102628872 B1 KR102628872 B1 KR 102628872B1
Authority
KR
South Korea
Prior art keywords
cells
cell
negative selection
selection marker
cdk1
Prior art date
Application number
KR1020177028536A
Other languages
English (en)
Other versions
KR20170136528A (ko
Inventor
안드라스 나지
클라우디오 모네티
친 리앙
Original Assignee
시나이 헬스 시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시나이 헬스 시스템 filed Critical 시나이 헬스 시스템
Priority to KR1020247002264A priority Critical patent/KR20240013291A/ko
Publication of KR20170136528A publication Critical patent/KR20170136528A/ko
Application granted granted Critical
Publication of KR102628872B1 publication Critical patent/KR102628872B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • C12N5/0606Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination

Abstract

본 개시는 동물 세포에서 세포 증식을 제어하기 위해 세포 분열 좌위(CDL)를 사용하기 위한 분자 도구, 방법 및 키트를 제공한다. 본 명세서에서 제공되는 바와 같이, CDL은, 그 전사 산물(들)이 세포 분열 동안 발현되는 좌위들이다. CDL은 음성 선택 마커 및/또는 유도성 활성인자 기반 유전자 발현 시스템을 포함하도록, 본 명세서에 기재된 바와 같이 유전적으로 변형될 수 있으며, 이는 사용자로 하여금 적절한 유도인자의 부가 또는 제거에 의해, 상기 유전적으로 변형된 세포(들)의 증식을 허용하고, 어블레이션하고/하거나, 억제할 수 있도록 한다.

Description

세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
이전 출원과의 상호 참조
본 출원은, 각각이 본 명세서에서 그 전문이 제공되는 바와 같이 참고로 포함되는 것으로, 2015년 3월 9일자로 출원된 미국 가출원 제 62/130,258호 및 2015년 3월 9일자로 출원된 미국 가출원 제 62/130,270호에 대한 파리 협약하의 우선권을 주장한다.
본 명세서는 일반적으로 세포 및 분자 생물학 분야에 관한 것이다. 더욱 구체적으로, 본 명세서는 동물 세포의 분열을 제어하기 위한 분자 도구, 방법 및 키트 및 이와 관련된 유전적으로 변형된 세포에 관한 것이다.
인간 만능성 줄기(hPS) 세포는 정상적인 세포 발생, 질병 발생을 이해하고, 현재의 난치성 장애, 예를 들어 유전적 장애, 퇴행성 질병 및/또는 다양한 손상을 치료하기 위한 세포 치료법에 사용하기 위한 도구로서 사용될 수 있다. 이들 세포의 만능성 특성은 줄기세포 상태에서 자가 재생 기간 후에 이들을 임의의 세포 유형으로 분화할 수 있도록 한다(문헌[Rossant and Nagy, 1999]). hPS 세포의 절대 표준은, 1998년에 보고된 인간 배아 줄기(hES) 세포이다(문헌[Thomson et al., 1998]). 2006년과 2007년에, 피부 섬유아세포와 같은 분화된 체세포를 ES 세포와 유사한 "유도된 만능성 줄기"(iPS) 세포로 재프로그래밍하는 방법이 보고되었고, 만능성 세포의 유형이 확장되었다(문헌[Takahashi and Yamanaka, 2006; Takahashi et al., 2007]). iPS 세포를 생성하는 방법 및 질병과 생리적 이상 질환을 치료하기 위한 세포 기반 치료법을 포함한 다방면으로의 응용이 이후 수년 동안 더욱 발전되어 왔다.
만능성 세포 기반 치료법에 관한 한 가지 우려 사항은 안전성이다. 예를 들어, 세포 이식으로부터 기인한 악성 성장이 우려된다. 재프로그래밍 방법이, iPS 세포 유래 세포의 악성 형질전환 위험이 있을 수 있는 게놈 손상 및 비정상적인 후성 변화를 야기할 수 있다고 보고된 바와 같이, 분화된 세포를 iPS 세포로 재프로그래밍하는 과정은 안전성과 관련된다(문헌[Hussein et al., 2011; Laurent et al., 2011; Lister et al., 2011]).
시험관내에서 확장된 만능성 세포를 포함하는 세포 기반 치료법의 한 가지 과제는 세포 자체의 만능성 특성이다. 예를 들어, 만능성 세포가 분화된 치료 세포 사이에 남아 있는 경우, 만능성 세포는 기형종으로 진행될 수 있다(문헌[Yoshida and Yamanaka, 2010]). 만능성 세포 유래 제품 및 치료법의 안전성을 높이기 위한 시도에는 시험관내 분화 후에 세포 배양물로부터 만능성 세포를 제거하려는 노력이 포함된다. 예를 들어: 만능성 특이적 항원을 갖는 세포를 제거하기 위해, 세포독성 항체를 사용하였고(문헌[Choo et al., 2008; Tan et al., 2009]); 세포를 만능성 세포 표면 마커를 기반으로 분류하였으며(문헌[Ben-David et al., 2013a; Fong et al., 2009; Tang et al., 2011]); 종양 진행 유전자를 세포에서 유전적으로 변형시켰고(문헌[Blum et al., 2009; Menendez et al., 2012]); 분화된 세포의 분리를 돕기 위한 전이유전자를 세포 내로 도입하였으며(문헌[Chung et al., 2006; Eiges et al., 2001; Huber et al., 2007]); 자살 유전자를 세포로 도입시켜, 분화 후 잔존하는 만능성 줄기세포를 제거하는데 사용하였고(문헌[Rong et al., 2012; Schuldiner et al., 2003]); 원치 않는 만능성 세포를, 화학 물질을 사용함으로써 어블레이션(ablation)하였다(문헌[Ben-David et al., 2013b; Dabir et al., 2013; Tohyama et al., 2013]). 잔존하는 만능성 세포가 분화된 배양물로부터 제거되더라도, 만능성 세포의 분화 유도체는 발암 성질을 가질 수 있다(문헌[Ghosh et al., 2011]). 관련 발암 현상은 i) 시험관내에서 세포를 제조하는 동안; 또는 ii) 세포를 숙주로 이식한 후, 치료 세포에서 발생될 수 있다.
원치 않는 세포 성장 및/또는 분화를 제거 또는 방지하기 위한 가장 최근의 전략은, 악성종양이 생성된 경우, 이식편을 완전히 제거하거나(문헌[Schuldiner et al., 2003]), 또는 의도된 분화 유도체를 '오염시키는' 만능성 세포만을 제거하는데(문헌[Ben-David and Benvenisty, 2014; Lim et al., 2013]) 사용될 수 있는 단순 포진 바이러스 티미딘 키나제(herpes simplex virus-thymidine kinase)(HSV-TK)/간사이클로비르(ganciclovir)(GCV) 음성 선택 시스템을 기반으로 한다. GCV 유도 세포 사멸 및 아폽토시스(apoptosis)의 메커니즘은 잘 알려져 있다. 이는 DNA 이중 가닥 파열의 복제 의존적 유발을 야기하며(문헌[Halloran and Fenton, 1998]), 이는 아폽토시스로 이어진다(문헌[Tomicic et al., 2002]). 그러나, 많은 HSV-TK/GCV 기반 시스템은, 최소한, HSV-TK의 무작위적 혼입 또는 일과성 발현에 의존하므로, 신뢰할 수 없는 수준으로 발현된다. 예를 들어, 카스파제 9(문헌[Di Stasi et al., 2011])와 같은 상이한 사멸 메커니즘을 갖는 음성 선택 마커를 포함하는 전략이 시험되었으나, 음성 선택 마커의 신뢰할 만한 발현은 나타나지 않았다. 세포 기반 치료법은 수백만 또는 수십억 개의 세포를 필요로 할 수 있으며, 이는 원치 않는 세포 성장 및/또는 분화에 의해 야기되는 모든 문제를 증폭시킬 수 있다.
본 발명의 목적은 상기 결점 중 하나 이상을 완화 및/또는 방지하는 것이다.
일 양태에서, 동물 세포의 증식을 제어하는 방법이 제공된다. 상기 방법은 동물 세포를 제공하는 단계; 상기 동물 세포에서 세포 분열 좌위(CDL)를 유전적으로 변형시키는 단계로서, CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이며, CDL의 유전적 변형은: a) 상기 CDL을 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ablation link)(ALINK) 시스템; 및 b) 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 유도성 외인성 활성인자 조절(EARC) 시스템 중 하나 이상을 포함하는 것인 단계; 상기 음성 선택 마커의 유도인자에 의해, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 제어하는 단계; 및/또는 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 의해, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 제어하는 단계를 포함한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 구현예에서, ALINK 변형된 동물 세포의 제어는: ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포를 상기 음성 선택 마커의 유도인자의 부재하에 유지시킴으로써, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 허용하는 단계; 및 ALINK 시스템을 포함하는 동물 세포를 상기 음성 선택 마커의 유도인자에 노출시킴으로써, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 어블레이션 또는 억제하는 단계 중 하나 이상을 포함한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 일 구현예에서, EARC 변형된 동물 세포의 제어는 EARC 시스템을 포함하는 유전적으로 변형된 동물 세포를 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 노출시킴으로써, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 허용하는 단계; 및 EARC 시스템을 포함하는 동물 세포를 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자의 부재하에 유지시킴으로써, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 방지 또는 억제하는 단계 중 하나 이상을 포함한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, CDL의 유전적 변형은 다음 중 하나 이상에 의한 CDL의 표적화된 대체를 수행하는 단계를 포함한다: a) ALINK 시스템을 포함하는 DNA 벡터; b) EARC 시스템을 포함하는 DNA 벡터; 및 c) ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, CDL의 ALINK 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성이고/이거나, EARC 유전적 변형은, 기능적 CDL 변형이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, 상기 CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, 상기 CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제(cytosine deaminase)/5-플루오로시토신(5-fluorocytosine) 시스템, 카르복실 에스테라제(carboxyl esterase)/이리노테칸(irinotecan) 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템(dox-bridge system), 큐메이트 스위치 유도성 시스템(cumate switch inducible system), 엑디손 유도성 시스템(ecdysone inducible system), 전파 유도성 시스템(radio wave inducible system) 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, 상기 동물 세포는 포유류 세포 또는 조류 세포이다. 다양한 구현예에서, 상기 포유류 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소(cow), 말, 사슴, 엘크, 들소, 소(oxen), 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포이며, 바람직하게는 상기 포유류 세포는 인간 세포이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포로부터 유래된다.
일 양태에서, 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포가 제공된다. 상기 유전적으로 변형된 동물 세포는 하나 이상의 세포 분열 좌위(CDL)의 유전적 변형을 포함하며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 유전적 변형은: a) 상기 CDL을 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ALINK) 시스템; 및 b) 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CEDL의 외인성 활성인자 조절(EARC) 시스템 중 하나 이상이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 구현예에서, CDL의 유전적 변형은 다음 중 하나 이상에 의한 CDL의 표적화된 대체를 수행하는 단계를 포함한다: a) ALINK 시스템을 포함하는 DNA 벡터; b) EARC 시스템을 포함하는 DNA 벡터; 및 c) ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, CDL의 ALINK 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성이고/이거나, EARC 유전적 변형은, 기능적 CDL 변형이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장한다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, 상기 동물 세포는 포유류 세포 또는 조류 세포이다. 다양한 구현예에서, 상기 포유류 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포이며, 바람직하게는 상기 포유류 세포는 인간 세포이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포로부터 유래된다.
일 양태에서, 세포 분열 좌위(CDL)의 발현을 변형시키기 위한 DNA 벡터가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 DNA 벡터는 상기 CDL에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ALINK) 시스템을 포함하며, 상기 DNA 벡터가 하나 이상의 숙주 세포 내로 삽입된다면, 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 음성 선택 마커의 유도인자에 노출되는 경우, 상기 DNA 벡터를 포함하는 증식 숙주 세포는 사멸될 것이다.
일 양태에서, 세포 분열 필수 좌위(CDL)의 발현을 변형시키기 위한 DNA 벡터가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 DNA 벡터는 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 외인성 활성인자 조절(EARC) 시스템을 포함하며, 상기 DNA 벡터가 하나 이상의 숙주 세포 내로 삽입된다면, 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 유도성 활성인자 상기 기반 유전자 발현 시스템의 유도인자에 노출되지 않는 경우, 상기 DNA 벡터를 포함하는 증식 숙주 세포는 사멸될 것이다.
일 양태에서, 세포 분열 필수 좌위(CDL)의 발현을 변형시키기 위한 DNA 벡터가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 DNA 벡터는 상기 CDL에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열인 어블레이션 연결(ALINK) 시스템; 및 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 외인성 활성인자 조절(EARC) 시스템을 포함하며, 상기 DNA 벡터가 하나 이상의 숙주 세포 내로 삽입된다면, 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 음성 선택 마커의 유도인자에 노출되는 경우, 및 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 노출되지 않는 경우, 상기 DNA 벡터를 포함하는 증식 숙주 세포는 사멸될 것이다.
본 명세서에서 제공되는 DNA 벡터의 다양한 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 DNA 벡터의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 DNA 벡터의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
일 양태에서, 하나 이상의 세포 분열 필수 좌위/좌위들(CDL)의 유전적 변형에 의해, 동물 세포의 증식을 제어하기 위한 키트가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 키트는 상기 CDL을 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ALINK) 시스템을 포함하는 DNA 벡터; 및/또는 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 외인성 활성인자 조절(EARC) 시스템을 포함하는 DNA 벡터; 및/또는 각각 CDL에 작동 가능하게 연결된 ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터; 및 하나 이상의 DNA 벡터를 사용하는 동물 세포에서 CDL의 표적화된 대체를 위한 지침서를 포함한다.
본 명세서에서 제공되는 키트의 일 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 키트의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 키트의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
본 특허 또는 출원 파일은 적어도 하나의 컬러 도면을 포함한다. 컬러 도면이 첨부된 본 특허 또는 특허 출원 공보의 사본은 요청 및 필요한 수수료의 지불 시에 국제사무국에 의해 제공될 것이다.
본 개시 내용의 이러한 특징 및 다른 특징은 첨부된 도면을 참고로 하는 다음의 상세한 설명에서 더욱 명백해질 것이다:
도 1a 내지 도 1g는 본 명세서에서 제공되는 방법 및 도구에서 사용하기 위해 고려되는 증식의 유도된 음성 효과기(iNEP)의 개념 및 iNEP 시스템의 예를 설명하는 개략도를 도시한다. 도 1a는 CDL1에서의 동형접합성 변형, CDL1 및 CDL2에서의 동형접합성 삽입, 세포 분열에 함께 필수적인 2개의 별도의 좌위를 포함하는 CDL(CDL3)을 포함하는 iNEP 변형된 CDL의 상이한 예를 나타내는 개략도를 도시한다. 도 1b는 상이한 구성으로 어블레이션 연결(ALINK) 및 CDL의 외인성 활성인자 조절(EARC)을 포함하는 iNEP의 예를 나타내는 개략도를 도시한다. 도 1c는 이량체화제 조절된 발현 유도와 조합된 전사 활성인자 유사 효과기(TALE) 기법을 설명하는 개략도를 도시한다. 도 1d는 역 큐메이트 트랜스활성인자(reverse-cumate-Trans-Activator)(rcTA) 시스템을 설명하는 개략도를 도시한다. 도 1e는 레티노이드 X 수용체(RXR) 및 Vp16(VpEcR)의 활성화 도메인에 융합된 엑디손 수용체(EcR)의 N-말단 절두(N-terminal truncation)을 설명하는 개략도를 도시한다. 도 1f는 본 명세서에 제시된 바와 같은 iNEP 시스템의 일례인 일과성 수용체 전위 바닐로이드-1(transient receptor potential vanilloid-1)(TRPV1)을 페리틴(ferritin)과 함께 설명하는 개략도를 도시한다. 도 1g는 IRES 및 이량체화제가 iNEP로서 어떻게 사용될 수 있는지를 설명하는 개략도를 도시한다.
도 2의 A 내지 도 2의 F는 분열 중인 변형된 CDK1 발현 세포의 제거를 가능하게 하는 ALINK를 생성하기 위해, Cdk1 좌위의 3'UTR 내로 HSV-TK를 표적화하는 것을 설명하는 개략도를 도시한다. 도 2의 A는 마우스 Cdk1 좌위의 개략도를 도시한다. 도 2의 B는 마우스 표적 벡터 I의 개략도를 도시한다. 도 2의 C는 Cdk1TC 대립유전자의 개략도를 도시한다. 도 2의 D는 마우스 표적 벡터 II의 개략도를 도시한다. 도 2의 E는 Cdk1TClox 대립유전자의 개략도를 도시한다. 도 2의 F는 CRISPR 안내 RNA의 위치를 도시하며; 황색 박스의 서열은 Cdk1의 8번째 엑손이다.
도 3ab 내지 도 3g는 ALINK 예로서, 마우스 ES 세포주에서 ALINK를 생성하기 위해 CDK1 좌위의 3'UTR로의 HSV-TK-mCherry의 생성을 도시한다. 도 3ab의 A는 마우스 C2 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 3ab의 B는 Cdk1(TK/+), Cdk1(TK, loxP-TK) 및 Cdk1(TK/TK)의 올바른 유전자형 분석의 서던 블롯팅(southern blotting) 결과를 도시한다. 도 3c는 마우스 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 3d는 표적화 벡터 I의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 포함한다. 도 3e는 HSV-TK-mCherry의 발현을 활성화하기 위해, 표적화 벡터 I로 이미 올바르게하게 표적화된 마우스 ES 세포주에서 선택 마커의 절개 상황(excision event)을 설명하는 PCR 결과를 도시한다. 도 3f는 표적화 벡터 II의 Cdk1(TK/+) 세포 내로의 표적화를 설명하는 PCR 결과를 도시한다. 도 3g는 HSV-TK-mCherry의 제2 대립유전자 발현을 활성화시킴으로써, Cdk1(TK/TK)를 생성하는 Cdk1(TK, loxP-TK)에서의 선택 마커의 절개 상황을 설명하는 PCR 결과를 도시한다.
도 4a 내지 도 4jk는 ALINK 변형으로서, 인간 ES 세포주에서 CDK1 좌위의 3'UTR로의 HSV-TK-mCherry의 생성을 도시한다. 도 4a는 인간 CA1 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 4b는 인간 CA1 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 4c는 표적화 벡터 I의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 도시한다. 도 4d는 HSV-TK-mCherry의 발현을 활성화시키기 위한 인간 Cdk1(PB-TK/+) ES 세포주에서의 선택 마커의 절개 상황을 설명하는 유동 세포계측법을 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4e는 표적화 벡터 II(puro-버전)의 Cdk1(TK/+) 세포 내로의 표적화를 설명하는 PCR 결과를 도시하며; 상단 패널은 5' 상동성 아암(arm)에 플랭킹된 프라이머를 사용하는 PCR이고; 하단 패널은 5' 및 3' 상동성 아암 내부의 프라이머를 사용하는 PCR이며, 0.7kb 밴드가 부재하고, 클론이 ALINK에서 동형접합성임을 의미하는 2.8kb 밴드가 존재하며, 클론이 ALINK에서 이형접합성이거나, 집단이 클론이 아니라는 것을 의미하는 0.7kb 밴드가 존재한다. 도 4f는 HSV-TK-mCherry의 제2 대립유전자 발현을 활성화하기 위한 Cdk1(TK, loxP-TK)에서의 선택 마커의 절개 상황을 설명하는 유동 세포계측 분석을 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4g는 인간 H1 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 4h는 인간 H1 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 4i는 표적화 벡터 II의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 도시한다. 도 4jk의 J는 HSV-TK-mCherry의 발현을 활성화시키기 위한 인간 H1 Cdk1(loxP-TK/+)에서의 선택 마커의 절개 상황을 설명하는 PCR 결과를 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4jk의 K는 Cdk1(TK/+) 세포 내로의 표적화 벡터 Ⅲ(GFP-버전)의 표적화의 형광 활성화 세포 분류(FACS)를 도시한다. FACS 분류 후, 밀집도가 낮은 플레이트에서 채취한 클론을 mCherry 대립유전자 특이적 프라이머, eGFP 대립유전자 특이적 프라이머 및 5' 및 3' 상동성 아암의 프라이머로 유전자형을 분석하였으며; 주황색 별표로 표시된 클론은 mCherry의 하나의 대립유전자 및 eGFP의 하나의 대립유전자를 갖는 동형접합성 ALINK이고; 녹색 별표로 표시된 하나의 클론은 eGFP의 2개의 대립유전자를 갖는 동형접합성 ALINK이다.
도 5a 내지 도 5c는 기형종 조직학(기형종의 내배엽, 중배엽 및 외배엽 부분이 각각 좌측에서 우측으로 도시됨)을 도시한다. 도 5a는 마우스 ES Cdk1+/+, alink/alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다. 도 5b는 마우스 ES Cdk1earc/earc, alink / alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다. 도 5c는 인간 ES Cdk1+/+, alink/alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다.
도 6a 내지 도 6b는 CDK1 좌위의 3'UTR로의 HSV-TK mCherry 녹인(knock-in)을 갖는 마우스 ES 세포의 시험관내 기능 분석을 도시한다. 도 6a는 세포를 상이한 농도의 GCV에 3일 동안 노출시킨 후, TK.007 유전자에 의해 제공되는 사멸 효율을 도시한다. 콜로니 크기 및 수는 GCV 농도에 정비례한다. 두 번째 저농도인 0.01 μM은 콜로니 수에 영향을 미치지 않았으나, 세포 성장을 둔화시켰으며, 이는 감소된 콜로니 크기(n=5)에 의해 입증된 바와 같다. 도 6b는 네오-카세트의 PB 매개된 제거 전(Cdk1ㆍHSV-TKㆍNeoIN)과 후(Cdk1ㆍHSV-TK), mCherry의 발현을 설명한다.
도 7a 내지 도 7def는 ALINK 변형된 세포를 사용한 세포 실험의 결과를 도시한다. 도 7a는 ALINK 변형된 마우스 C2 세포를 포함하는 피하 기형종의 GCV 처리 결과를 그래프로 도시한다. 도 7b는 ALINK 변형된 H1 ES 세포를 포함하는 피하 기형종의 GCV 처리 결과를 그래프로 도시한다. 도 7c는 ALINK 변형된 세포를 포함하는 유선 종양의 GCV 처리 결과를 그래프로 도시한다. 도 7def의 D는 신경 분석의 실험적 설계를 개략적으로 도시한다. 도 7def의 E는 Cdk1+/+, alink 인간 CA1 ES 세포로부터 유래된 신경 상피 전구세포(NEP) 세포의 현미경 이미지이다. 도 7def의 F는 분열 중인 ALINK 변형된 NEP의 GCV 유도된 사멸 및 비분열 뉴런의 비사멸을 설명하는 현미경 이미지를 도시한다.
도 8은 집단이 이형접합성(청색선) 및 동형접합성(적색선) ALINK 세포로부터 확장됨에 따라, HSV-TK 유전자에서 자연발생 돌연변이를 포함하는 추정 세포 수를 나타내는 그래프를 도시한다.
도 9a 내지 도 9b는, EARC를 생성하기 위한 마우스 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화 및 Cdk1 내로의 삽입 후 가교의 거동을 도시한다. 도 9a는 마우스 Cdk1 좌위의 구조, 표적 벡터 및 상동성 재조합 상황에 대한 유전자형 분석에 사용되는 프라이머의 위치를 설명하는 개략도이다. 도 9b는 dox 가교가 Cdk1 5'UTR에 혼입된 것들을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 10은, 동형접합성 dox 가교 녹인을 갖는 ES 세포가 독시사이클린(또는, 독시사이클린 중복 기능을 갖는 약물)의 존재하에서만 생존하고, 분열하는 것을 설명하는 흐름도를 도시한다.
도 11은, 동형접합성 dox 가교 녹인 ES 세포가 독시사이클린 농도 의존적 생존 및 성장을 나타내는 것을 설명하는 대표적인 현미경 사진을 도시한다.
도 12는, ES 세포의 독시사이클린 의존적 생존을 복구하는 Cre 재조합효소 매개된 절개에 의한 dox 가교 제거를 도시한다.
도 13a 및 도 13b는 dox 가교 ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 13a는 독시사이클린의 존재하에 세포가 기하급수적으로 성장하며(원형이 포함된 적색 선), 이는 그의 정상적인 성장을 나타내는 것임을 나타내는 그래프를 도시한다. 1일째에 독시사이클린 회수 시에, 세포는 2일 동안만 성장하였으며, 그 후, 플레이트들로부터 세포들이 사라지기 시작하여, 9일째에는 세포가 존재하지 않았다(사각형이 포함된 어두운 청색 선). 처음 3일의 성장 후에 20배 더 낮은 독시사이클린 농도(50ng/ml)는 플레이트 상에 적어도 5일 동안 일정한 수의 세포를 유지시켰다(도 13, 삼각형이 포함된 밝은 청색 선). 정상 농도의 독시사이클린을 10일째에 플레이트에 다시 부가하였으며, 세포는 정상 ES 세포와 같이 다시 성장하기 시작하였다. 도 13b는 Dox 제거 0일, 1일 및 2일 후, Cdk1 mRNA의 수준(정량적 PCR에 의해 측정된 바와 같음)을 나타내는 막대 그래프를 도시한다. 발현 수준은 베타 액틴으로 정상화한다.
도 14는 dox 가교 ES 세포의 성장 과정을 도시하며, 독시사이클린이 배지로부터 제거된 경우, 100,000,000개의 dox 가교된 ES 세포 중에서 회피 세포가 존재하지 않는 것으로 나타났으나, 센티넬(sentinel)(야생형, GFP 양성) 세포는 고효율로 생존한 것을 설명한다.
도 15는 dox 가교 ES 세포에 대한 독시사이클린 고농도(10 μg/ml)의 효과를 나타내는 그래프를 도시하며: 고 독시사이클린의 존재하에, 세포는 저 독시사이클린에서와 유사한 그의 성장 속도로 둔화되며(고 dox는 10 μg/ml이고, 정상 dox는 1 μg/ml이며, 저 dox는 0.05 μg/ml임), 이는 세포 증식을 위한 CDK1 발현의 최적 수준을 정의하는 Dox 농도에 대한 창(window)이 존재한다는 것을 나타낸다.
도 16a 및 도 16b는 ALINK 변형을 포함하는 마우스 세포(즉, Cdk1(TK/TK) 세포; 도 3ab 내지 도 3g에 기재된 세포 산물)의 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 16a는 Cdk1(TK/TK) 세포에서의 Cdk1 좌위의 구조, 가교 표적 벡터 및 유전자형 분석 프라이머의 위치를 설명하는 개략도이다. 도 16b는 마우스 Cdk1(TK/TK) 세포에서 Cdk1 5'UTR에 dox 가교가 혼입됨으로써, 마우스 세포 산물 Cdk1earc/earc, alink / alink이 생성된 것을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 17a 내지 도 17b는 ALINK 변형을 포함하는 인간 세포(즉, Cdk1(TK/TK) 세포; 도 4a 내지 도 4f에 기재된 세포 산물)의 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 17a는 Cdk1(TK/TK) 세포에서의 Cdk1 좌위의 구조, 가교 표적 벡터 및 유전자형 분석 프라이머의 위치를 설명하는 개략도이다. 도 17b는 인간 Cdk1(TK/TK) 세포에서 Cdk1 5'UTR에 dox 가교가 혼입됨으로써, 인간 세포 산물 Cdk1earc/earc, alink / alink이 생성된 것을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 18a 및 도 18b는 Top2a로의 EARC 삽입을 생성하기 위한 Top2 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 18a는 Top2a 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. TOP2a_5scrF, rttaRev, CMVforw 및 TOP2a_3scrR은 상동성 재조합 상황에 대한 유전자형 분석에 사용되는 프라이머의 위치를 나타낸다. 도 18b는, Top2a 5'UTR로 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포주 중 9개는 상동성 재조합에 의해 Top2a의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것으로 밝혀졌다.
도 19a 및 도 19b는 Top2a-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 19a는, 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 나타낸다. 도 19b는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 2일 후에는, 세포 성장이 완전히 저지되었다.
도 20a 및 도 20b는 Cenpa로의 EARC 삽입을 생성하기 위한 Cenpa 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 20a는 Cenpa 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Cenpa_5scrF, rttaRev, CMVforw 및 Cenpa_3scrR은 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 20b는, Cenpa 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포들 중 6개는 5' 및 3'에 올바른 삽입을 갖는 것으로 밝혀졌으며, 적어도 하나의 클론(Cenpa # 4)은 상동성 재조합에 의해 Cenpa의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것으로 밝혀졌다.
도 21a 및 도 21b는 Cenpa-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 21a는 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 도시한다. 도 21b는 Dox를 갖는 Cenpa-EARC 세포 및 Dox 제거 2일 후의 Cenpa 유전자 발현 수준(q-PCR에 의해 결정됨)이며, 야생형 마우스 ES 세포(C2)의 발현 수준과 비교한 것이다. 추정된 바와 같이, Cenpa 발현 수준은 Dox의 부재하에 Cenpa-EARC 세포에서 2일 동안 크게 감소한다.
도 22는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Cenpa-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 80시간 후에는, 세포 성장이 완전히 저지되었다.
도 23a 및 도 23b는 Birc5로의 EARC 삽입을 생성하기 위한 Birc5 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 23a는 Birc5 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Birc_5scrF 및 rttaRev는 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 23b는, Birc5 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 5개의 클론은 재조합에 의해 Birc5의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 올바르게 표적화된 것으로 밝혀졌다. 이들 클론 중 하나는 Birc#3이었으며, Dox의 부재하에 성장이 중지되거나 사멸된 것으로 밝혀졌다.
도 24a 및 도 24b는 Birc5-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 24a는 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 도시한다. 도 24b는 Dox를 갖는 Birc5-EARC 세포에서 Dox 제거 2일 후의 Birc5 유전자 발현 수준(q-PCR에 의해 결정됨)이며, 야생형 마우스 ES 세포(C2)의 발현 수준과 비교한 것이다. 추정된 바와 같이, Birc5 발현 수준은 Dox의 부재하에 Birc5-EARC 세포에서 2일 동안 크게 감소한다.
도 25는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Birc5-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 50시간 후에는, 세포 성장이 완전히 저지되었다. 흥미롭게도, 더 저농도 Dox(0.5 및 0.05 μg/ml)가 더 고농도(1 μg/ml)보다 더 양호한 세포 성장을 촉진하는 것으로 나타난다.
도 26a 및 도 26b는 Eef2로의 EARC 삽입을 생성하기 위한 Eef2 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 26a는 Eef2 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Eef2_5scrF 및 rttaRev는 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 26b는, Eef2 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포주 중 9개가 올바르게 표적화된 것으로 밝혀졌으며, 적어도 하나의 클론은 Dox-배지에서만 성장하였다.
도 27은 Eef2-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한다.
도 28은 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Eef2-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 부재 시에 세포는 성장에 완전히 실패한다.
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및 과학 용어는, 본 개시 내용이 속하는 기술 분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다.
정의
본 명세서에 사용되는 바와 같이, 용어 "세포 분열 좌위", "세포 분열 좌위들", 및 "CDL"은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 게놈 좌위(또는, 좌위들)를 지칭한다. CDL이 단일 좌위를 포함하는 경우, CDL 발현의 부재 시에 세포(들)가 어블레이션되거나, CDL 발현의 부재 시에 세포(들)의 증식이 차단 또는 훼손될 것이므로, 세포(또는, 그의 유도체)에서 CDL 발현의 부재는 종양 개시 및/또는 형성이 금지된다는 것을 의미한다. CDL이 다수 좌위들을 포함하는 경우, CDL 발현의 부재 시에 세포(들)가 어블레이션되거나, CDL 발현의 부재 시에 세포(들)의 증식이 차단 또는 훼손될 것이므로, 세포(또는, 그의 유도체)에서 상기 좌위들의 전부 또는 그의 하위세트에 의한 발현의 부재는 종양 개시 및/또는 형성이 금지된다는 것을 의미한다. CDL은 비분열성 및/또는 비증식성 세포에서 발현될 수 있거나, 발현되지 않을 수 있다. CDL은 숙주 세포에 대해 내인성이거나, 전이유전자일 수 있다. CDL이 전이유전자인 경우, 숙주 세포와 동일하거나 상이한 종으로부터 유래될 수 있거나, 합성 유래의 것일 수 있다. 일 구현예에서, CDL은 세포 분열 동안 전사되는 단일 좌위이다. 예를 들어, 일 구현예에서, 단일 좌위 CDL은 CDK1이다. 일 구현예에서, CDL은 세포 분열 동안 전사되는 2개 이상의 좌위들을 포함한다. 예를 들어, 일 구현예에서, 다좌위 CDL은 2개의 MYC 유전자(c-Myc 및 N-myc)를 포함한다(문헌[Scognamiglio et al., 2016]). 일 구현예에서, 다좌위 CDL은 중복 기능을 가질 수 있는 AURORA B 및 C 키나제를 포함한다(문헌[Fernandez-Miranda et al., 2011]). 세포 분열 및 세포 증식은 본 명세서에서 상호교환적으로 사용될 수 있는 용어이다.
본 명세서에 사용되는 바와 같이, 용어 "세포 분열의 정상 속도", "정상 세포 분열 속도", "세포 증식의 정상 속도" 및 "정상 세포 증식 속도"는 비암성의 건강한 세포의 전형적인 세포 분열 및/또는 증식의 속도를 지칭한다. 세포 분열 및/또는 증식의 정상 속도는 세포 유형에 특이적일 수 있다. 예를 들어, 표피, 장, 폐, 혈액, 골수, 흉선, 고환, 자궁 및 유선의 세포 수가 고속 세포 분열 및 고속 사멸에 의해 유지된다는 것이 광범위하게 인정되고 있다. 반대로, 췌장, 신장, 각막, 전립선, 골, 심장 및 뇌의 세포 수는 저속 세포 분열 및 저속 세포 사멸에 의해 유지된다(문헌[Pellettieri and Saenchez Alvarado, 2007]).
본 명세서에 사용되는 바와 같이, 용어 "증식의 유도성 음성 효과기" 및 "iNEP"는: i) CDL 발현을 유도적으로 중지시키거나 차단함으로써, 세포 분열 및 증식을 금지하거나; ii) CDL 발현 세포의 적어도 일부를 유도적으로 어블레이션하거나(즉, 증식 세포의 적어도 일부를 사멸시킴); 또는 iii) 세포 분열 속도가 종양 형성에 기여할 만큼 충분히 빠르지 않도록, 세포 분열 속도를 세포의 정상 세포 분열 속도에 비해 유도적으로 둔화시킴으로써, 세포 분열 및/또는 증식을 제어하기 위한 CDL 발현의 사용을 용이하게 하는 유전적 변형을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "어블레이션 연결" 및 "ALINK"은 CDL과 음성 선택 마커를 인코딩하는 서열 사이의 전사 연결을 포함하는 iNEP의 예를 지칭한다. ALINK 변형은 사용자로 하여금, 음성 선택 마커의 유도인자에 ALINK 변형된 세포를 노출시킴으로써, 증식 세포의 적어도 일부를 사멸시킴으로써, ALINK를 포함하는 증식 숙주 세포를 유도적으로 사멸시키거나, 상기 숙주 세포의 증식을 억제할 수 있도록 한다. 예를 들어, CDL에 ALINK를 포함하도록 변형된 세포는, 증식 세포의 적어도 일부를 사멸시킴으로써, 증식 세포를 어블레이션하거나, 세포 증식을 억제하기 위해, 음성 선택 마커의 유도인자(예를 들어, 전구약물)에 의해 치료될 수 있다(도 1b).
본 명세서에 사용되는 바와 같이, 용어 "CDL의 외인성 활성인자 조절" 및 "EARC"는, 활성인자를 통한 비코딩 또는 코딩 DNA 전사 또는 상응하는 번역의 외인성 변경을 용이하게 하는 메커니즘 또는 시스템을 포함하는 iNEP의 예를 지칭한다. EARC 변형은 사용자로 하여금, EARC 변형된 CDL의 전사 및/또는 번역을 허용하는 유도인자를 EARC 변형된 세포로부터 제거함으로써, EARC를 포함하는 세포의 분열을 유도적으로 중지 또는 억제할 수 있도록 한다. 예를 들어, 유도성 활성인자 기반 유전자 발현 시스템은 CDL에 작동 가능하게 연결될 수 있으며, 약물 유도성 활성인자 및 상응하는 유도인자 약물의 존재가 CDL 전사 및/또는 번역을 위해 요구되도록, CDL의 발현 또는 CDL 번역을 외인적으로 제어하는데 사용될 수 있다. 유도인자 약물의 부재하에, 세포 분열 및/또는 증식은 중지 또는 억제될 것이다(예를 들어, 정상 세포 분열 속도로 둔화됨). 예를 들어, Cdk1/CDK1의 발현, 그리고 세포 분열 및 증식이 유도인자(예를 들어, 독시사이클린)의 존재하에서만 가능할 수 있도록, CDL Cdk1/CDK1은 dox 가교를 포함하도록 변형될 수 있다(도 1b).
본 명세서에 사용되는 바와 같이, 용어 "증식 길항제 시스템"는, 그의 존재가 세포의 증식을 (완전히 또는 부분적으로) 억제하는 천연 또는 조작된 화합물(들)을 지칭한다.
도구 및 방법에 대한 일반적인 설명
본 명세서에 기재된 바와 같이, 본 발명자들은, 사용자에 의해 세포 분열 및/또는 증식이 하나 이상의 iNEP를 통해 제어될 수 있는 유전적으로 변형된 세포를 생성하기 위해, 동물 세포에서 하나 이상의 세포 분열 좌위들(CDL)을 사용하기 위한 분자 도구, 방법 및 키트를 제공하였다(도 1a). 예를 들어, 본 명세서에서 제공되는 하나 이상의 도구 및/또는 방법을 사용함으로써 생성된 세포의 분열은, 세포 분열 속도가 종양 형성에 기여할 만큼 충분히 빠르지 않도록, 사용자에 의해 중지, 차단 또는 억제될 수 있다. 예를 들어, 본 명세서에서 제공되는 하나 이상의 도구 및/또는 방법을 사용함으로써 생성된 세포의 증식은, 세포의 증식 속도 또는 체적이 각각 사용자가 원하는 속도 또는 크기로 유지될 수 있도록, 증식 세포의 적어도 일부를 사멸 또는 중지시킴으로써, 사용자에 의해 중지, 차단 또는 억제될 수 있다.
세포 분열 및/또는 증식을 제어하기 위한 도구 및 방법은, 예를 들어 (정상 세포 분열 속도에 비해) 더 빠른 세포 분열 속도가 바람직하지 않은 경우에, 바람직하다. 예를 들어, 정상 속도보다 더 빠르게 분열하는 세포는 그 위치에서 종양을 형성할 수 있으며, 이는 숙주에 유해할 수 있다. 일 구현예에서, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는, 바람직하지 않은 세포 분열 및/또는 증식이 사용자에 의해 제어될 수 있도록, 정상 세포 분열 및/또는 증식을 허용하고, 세포 분열 및/또는 증식을 중지, 어블레이션, 차단 및/또는 둔화시키기 위한 하나 이상의 메커니즘을 포함한다(도 1b). 도 1b와 관련하여, 실시예(I)에서, EARC는 CDL의 5'UTR에 삽입되고, ALINK는 3'UTR에 삽입되며, 그 전사 산물은, 2개의 단백질로 가공되는 이중 시스트론(bi-cistronic) mRNA이다. 실시예(II)에서, EARC 및 ALINK 둘 모두는 CDL의 5'UTR에 삽입되며, 그 전사 산물은, 2개의 단백질로 가공되는 이중 시스트론 mRNA이다. 실시예(Ⅲ)에서, EARC는 CDL의 5'UTR에 삽입되고, ALINK는 CDL 코딩 서열 내에 삽입되며, 그 전사 산물은, 특이적으로 설계된 절단 서열의 절단 시에 2개의 개별 단백질을 생성할 것인 전구체 단백질로 가공되는 mRNA이다. 실시예(IV)에서, EARC 및 ALINK 둘 모두는 CDL의 5'UTR에 삽입되며, 그 전사 산물은 CDL 및 ALINK 기능 둘 모두를 유지하는 융합 단백질로 가공되는 mRNA이다. 실시예(V)에서, EARC는 CDL의 5'UTR에 삽입되고, ALINK는 3'UTR에 삽입되며, 그 전사 산물은 CDL 및 ALINK 기능 둘 모두를 유지하는 융합 단백질로 가공되는 mRNA이다.
예를 들어, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는 대상체에게 적용되는 세포 치료적 처리에 사용될 수 있다. 대상체에 제공되는 하나 이상의 유전적으로 변형된 동물 세포가 바람직하지 않은 속도(예를 들어, 정상보다 더 빠름)로 분열하기 시작하는 경우, 그 후, 사용자는, i) 바람직하지 않은 속도로 분열하는 세포에 상기 세포의 유전적 변형에 상응하는 유도인자를 적용하거나; ii) 바람직하지 않은 속도로 분열하는 세포의 상기 세포의 유전적 변형에 상응하는 유도인자에 대한 접근을 제한함으로써, 바람직하지 않은 속도로 분열하는 세포의 분열을 중지 또는 둔화시킬 수 있거나, 바람직하지 않은 속도로 증식하는 세포를 차단, 둔화 또는 중지시킬 수 있으며, i) 또는 ii)는 유전적으로 변형된 동물 세포에 제공되는 iNEP(들)의 유형을 기반으로 하여 결정된다.
일 구현예에서, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는 "페일 세이프 세포"(fail-safe cell)로서 지칭될 수 있다. 페일 세이프 세포는 하나 이상의 CDL에 하나 이상의 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 ALINK를 포함한다. 일 구현예에서, 페일 세이프 세포는 하나 이상의 CDL에 하나 이상의 EARC를 추가로 포함한다. 일 구현예에서, 페일 세이프 세포는 ALINK 및 EARC 변형 둘 모두를 포함하는 CDL을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "페일 세이프"는, 세포 수를 정의하는 확률(pFS로서 지정됨)을 지칭한다. 예를 들어, 모든 ALINK를 상실한 세포를 포함하는 클론을 얻을 확률인, 단일 페일 세이프 세포로부터 성장할 수 있는 세포의 수(클론 용적)는 임의의 값(pFS)보다 작다. 예를 들어, pFS=0.01은, 클론이 ALINK 변형된 CDL을 포함하는 단일 세포로부터 100배 성장한 경우, 하나의 클론만이 ALINK 기능(음성 선택 마커의 발현)을 상실하여, 여전히 세포 분열할 수 있는 세포를 가질 것으로 예상되는 시나리오를 지칭한다. 페일 세이프 용적은 ALINK 수 및 ALINK 표적 CDL의 수에 의존적일 것이다. 페일 세이프 성질은 표 1에 추가로 기재되어 있다.
페일 세이프 세포 용적과 인체의 관계는 수학적 모델링을 사용함으로써 계산하였다. 상기 모델은, CDL 발현이 음성 선택 마커 활성의 상실과 함께 공동 상실되어, 세포 증식이 훼손된 상황은 계수하지 않았다. 따라서, 상기 값은 과소 평가되며, 음성 선택 마커의 경우, 10 내지 6의 전향 돌연변이율(forward mutation rate)을 가정하여 계산하였다. 인체에서의 추정 세포 수는 3.72x1013으로서 산정되었다(문헌[Bianconi et al., 2013]).
CDL # ALINK # CDL의 유전자형 페일 세이프 용적(#세포) 인체에 대한 상대값 (x)=3.72x1013 세포 클론의 추정 중량
1 1 het 512 0.0000000000137 1 μg
1 2 hom 16777216 0.000000451 31 mg
2 3 het, hom 1.374E+11 0.004 0.26 kg
2 4 hom, hom 1.13E+15 30 2100 kg
본 명세서에서, 페일 세이프 세포는, 세포를 숙주 내로 이식하기 전 또는 후에 이러한 세포의 생성 여부에 관계없이, 바람직하지 않은 성장 속도를 나타내는 세포를 제거하는 것이 바람직할 수 있는 세포 기반 치료법에 유용할 수 있는 것으로 고려될 수 있다.
세포 분열 좌위들(CDL )
본 명세서에서 제공되는 시스템, 방법 및 조성물은, 예를 들어 표 2에 제시된 CDL과 같은 하나 이상의 CDL의 확인을 기반으로 한다. 본 명세서에서 제공되는 방법을 사용함으로써, 다양한 CDL이 표적화될 수 있다는 것이 본 명세서에서 고려된다.
다양한 구현예에서, CDL은, 본 명세서에서 그 전문이 제시된 것과 같이, 참조로서 포함되는 문헌[Wang et al., 2015]에 제시된 바와 같이, "필수 유전자"로서 확인된 좌위이다. 문헌[Wang et al., 2015]에서의 필수 유전자는, 상기 유전자의 불활성화에 의해 부여되는 적합도 값(fitness cost)을 반영하는 각 유전자에 대한 점수(즉, CRISPR 점수)를 계산함으로써, 확인하였다. 일 구현예에서, CDL은 약 -1.0 미만의 CRISPR 점수를 갖는다(표 2, 5열).
다양한 구현예에서, CDL은, 세포 분열 및/또는 복제에 관련되는 유전자 산물을 인코딩하는 좌위/좌위들이다(표 2, 6열). 예를 들어, 다양한 구현예에서, CDL은: i) 세포 주기; ii) DNA 복제; iii) RNA 전사 및/또는 단백질 번역; 및 iv) 대사작용 중 하나 이상에 관련되는 유전자 산물을 인코딩하는 좌위/좌위들이다(표 2, 7열).
일 구현예에서, CDL은, 세포 주기 진행의 조절(예를 들어, G1/S G2/M 및 중기로부터 후기로의 전이의 제어)과 관련된 하나 이상의 사이클린 의존성 키나제, 예를 들어 CDK1, CDK2, CDK3, CDK4, CDK5, CDK6, CDK7, CDK8, CDK9 및/또는 CDK11이다(문헌[Morgan, 2007]). 일 구현예에서, CDL은, 하나 이상의 CDK를 활성화시킴으로써, 세포 주기의 진행을 제어하는 것과 관련된 하나 이상의 사이클린, 예를 들어, 사이클린B, 사이클린E, 사이클린A, 사이클린C, 사이클린D, 사이클린H, 사이클린C, 사이클린T, 사이클린L 및/또는 사이클린F이다(문헌[FUNG and POON, 2005]). 일 구현예에서, CDL은, 세포 주기의 M기에서 중기로부터 후기로의 전이의 진행을 제어하는 후기 촉진 복합체에 포함되는 하나 이상의 좌위들이다(문헌[Peters, 2002]). 일 구현예에서, CDL은, 세포 주기의 M기에서 중기로부터 후기로의 전이의 진행을 제어하는 방추사부착점 구성요소와 관련된 하나 이상의 좌위들이다(문헌[Fukagawa, 2007]). 일 구현예에서, CDL은, 세포 주기에 요구되는 미소관 역학을 제어하는 미소관 구성요소와 관련된 하나 이상의 좌위들이다(문헌[Cassimeris, 1999]).
다양한 구현예에서, CDL은 세포유지(housekeeping)와 관련된 좌위/좌위들이다. 본 명세서에 사용되는 바와 같이, 용어 "세포유지 유전자" 또는 "세포유지 좌위"는 기본 세포 기능의 유지에 요구되는 하나 이상의 유전자를 지칭한다. 세포유지 유전자는 정상 조건 및 병리학적 조건하에서 유기체의 모든 세포에서 발현된다.
다양한 구현예에서, CDL은, 세포 분열 및/또는 증식에 관련되는 유전자 산물을 인코딩하고, 약 -1.0 미만의 CRISPR 점수를 갖는 좌위/좌위들이다. 예를 들어, 일 구현예에서, CDL은, i) 세포 주기; ii) DNA 복제; iii) RNA 전사 및/또는 단백질 번역; 및 iv) 대사작용 중 하나 이상에 관련되는 유전자 산물을 인코딩하고, 약 -1.0 미만의 CRISPR 점수를 갖는 좌위/좌위들이다. 일 구현예에서, CDL은 또한 세포유지 유전자일 수 있다.
일 구현예에서, 잠재적인 CDL을 확인하기 위해, 본 발명자들은, 유전자 녹아웃(KO; 표 2, 8열)의 초기 마우스 배아 치사 표현형(embryonic lethal phenotype)을 시험하였다. 예를 들어, 본 발명자들은 Cdk1(사이클린 의존성 키나제 1, 세포 분열 주기 단백질 2 상동체(CDC2)로도 지칭됨) 눌 돌연변이에 대해 동형접합성 눌인 마우스 배아가 2 세포기(E1.5)에 사멸한다는 것을 발견하였다(문헌[Santamariea et al., 2007]). Cdk1(인간에서 CDK1으로도 지칭됨)은 세포 주기를 조절하는 데 중요한 기능을 하는 고도로 보존된 세린/트레오닌 키나제이다. Cdk1의 단백질 복합체는 많은 수의 표적 기질을 인산화시킴으로써, 세포 주기의 진행을 야기한다. Cdk1 발현의 부재 시에, 세포는 세포 주기의 G2기에서 M기로 전이할 수 없다.
Cdk1/CDK1은 단일 좌위 CDL의 일례이다. 상기 좌위의 전사가 ALINK 변형의 삽입에 의해 어블레이션되고/되거나, EARC 변형의 삽입에 의해 외인적으로 제어되는 Cdk1/CDK1의 유전적 변형이 실시예 1, 2 및 3에 제시된 바와 같이 본 명세서에서 시험된다. Top2A/TOP2A는 CDL의 일례이다. Cenpa/CEPNA는 CDL의 일례이다. Birc5/BIRC5는 CDL의 일례이다. Eef2/EEF2는 CDL의 일례이다. 상기 좌위의 전사가 EARC 변형의 삽입에 의해 외인적으로 제어될 수 있는 Top2a, Cenpa, Birc5 및 Eef2의 유전적 변형은 각각 실시예 4 내지 7에 제시된 바와 같이 본 명세서에서 시험된다.
대안적 및/또는 추가적 좌위들이 본 명세서에서 제공되는 방법을 사용함으로써 표적화될 수 있는 CDL인 구현예가 본 명세서에서 고려된다.
예를 들어, 인간 세포주의 RNAi 스크리닝에서 세포 증식에 필수적인 다수의 유전자가 확인되었다(문헌[Harborth et al., 2001; Kittler et al., 2004]). 본 발명자들은, 오르소로그(orthologue)가 결핍된 마우스의 상기 좌위들의 초기 배아 치사 표현형을 확인하고/하거나, 상기 좌위들의 GO 기간 및/또는 진카드(genecard)를 확인한 후에, 이들 좌위들의 하위세트가 CDL이었음을 추정하였다(표 2, 8열).
어블레이션 연결( ALINK ) 유전적 변형에 의한 CDL의 표적화
일 양태에서, 본 개시는, 음성 선택 마커를 인코딩하는 DNA 서열의 발현과 CDL의 발현을 연결시킴으로써, 결과적으로 CDL 및 음성 선택 마커를 발현하는 유사분열 활성 세포의 약물 유도된 어블레이션을 허용하도록 CDL을 변형시키기 위한 분자 도구, 방법 및 키트를 제공한다. 예를 들어, 세포 증식이 세포의 정상 분열 속도에 비해 비제어 및/또는 가속화되는 경우(예를 들어, 암종 세포에 의해 나타나는 비제어 세포 분열), 증식 세포의 어블레이션이 바람직할 수 있다. 증식 세포의 어블레이션은, 음성 선택 마커를 인코딩하는 DNA 서열의 발현을 CDL의 발현과 연결시킴으로써, 결과적으로 CDL 좌위를 발현하는 ALINK 변형된 증식 세포의 제거 또는 충분한 억제(충분한 억제란, 너무 저속이어서, 종양 형성에 기여할 수 없는 속도로 세포 확장 속도가 억제되는 것임)를 허용하는, 본 명세서에서 "어블레이션 연결"(ALINK)로 지칭되는 세포에 대한 유전적 변형을 통해 달성될 수 있다. 음성 선택 시스템의 전구약물 또는 다른 유도인자의 존재하에, 음성 마커를 발현하는 세포는 선택 마커의 작용 메커니즘에 따라 증식을 중지하거나, 사멸할 것이다. 세포는 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 ALINK를 포함하도록 변형될 수 있다. 일 구현예에서, 어블레이션의 정확도를 향상시키기 위해, 음성 선택 마커는 CDL의 모든 기능적 대립유전자에 도입될 수 있다. 바람직한 일 구현예에서, 음성 선택 마커는 CDL의 모든 기능적 대립유전자에 도입될 수 있다.
ALINK는, CDL 및 음성 선택 마커의 공동 발현을 허용하는 CDL의 임의의 위치에 삽입될 수 있다.
하기 실시예 1에서 추가로 논의되는 바와 같이, 음성 선택 마커(예를 들어, HSV-TK)를 인코딩하는 DNA를 숙주 세포의 CDL(예를 들어, CDK1) 내로 삽입함으로써, 음성 선택 마커의 발현이, 음성 선택 마커 및 필연적으로 CDL을 발현하는 숙주 세포를 음성 선택 마커(예를 들어, 간사이클로비르(GCV))의 유도인자(예를 들어, 전구약물)의 존재하에 사멸될 수 있도록 할 수 있다. 이 실시예에서, ALINK에 의해 변형된 숙주 세포는 티미딘 키나제(TK)를 생성할 것이고, TK 단백질은 GCV를 GCV 일인산염으로 전환시키며, 이어서, 세포 키나제에 의해 GCV 삼인산염으로 전환된다. GCV 삼인산염은 S기 동안 복제 DNA 내로 혼입됨으로써, DNA 연장의 종결 및 세포 아폽토시스를 야기한다(문헌[Halloran and Fenton, 1998]).
바람직하지 않은 세포 분열 속도를 포함하는 세포를 선택적으로 어블레이션하기 위해, ALINK 유전적 변형에 사용될 수 있는 음성 선택 마커를 인코딩하는 DNA의 일례로서 변형된 HSV-TK 유전자(문헌[Preuß et al., 2010])가 본 명세서에 개시되어 있다.
대안적 및/또는 추가적 음성 선택 시스템이 본 명세서에서 제공되는 도구 및/또는 방법에 사용될 수 있음이 본 명세서에서 고려된다. 다양한 음성 선택 마커 시스템이 당 업계에 공지되어 있다(예를 들어, dCK.DM(문헌[Neschadim et al., 2012])).
예를 들어, 부작용 없이 또는 최소화하여, 기존의 암 치료법의 치료적 효능을 향상시키는 것을 목표로 하는, 임상적 관련성을 갖는 다양한 음성 선택 시스템이 "유전자 직접 효소/전구약물 치료법"(GEPT) 분야에서 활발히 개발되어 왔다(문헌[Hedley et al., 2007; Nawa et al., 2008]). 종종, GEPT는, 포유류 세포에서 발견되지 않고, 상대적으로 무독성인 전구약물을 독성 제제로 전환시킬 수 있는 효소를 생성하는 암세포의 영역에서 암세포 또는 암세포의 근처에 유전자를 전달하기 위해, 바이러스 벡터의 사용을 포함한다.
HSV-TK/GCV, 시토신 데아미나제/5-플루오로시토신(CD/5-FC) 및 카르복시 에스테라제/이리노테칸(CE/CPT-11)이 GEPT 전임상 시험 및 임상 시험에서 평가되는 음성 선택 마커 시스템의 예이다(문헌[Danks et al., 2007; Shah, 2012]).
단순 포진 바이러스 1형 티미딘 키나제/간사이클로비르(TK/GCV) 시스템의 잠재적인 면역원성 문제를 극복하기 위해, 인간 데옥시시티딘 키나제 효소를 티미딘 활성이 되도록 하고, 비독성 전구약물에 의한 음성 선택(자살) 시스템으로서 작용하도록 조작함으로써, "인간화된" 자살 시스템이 개발되어 왔다: 브로모비닐-데옥시우리딘(BVdU), L-데옥시티미딘(LdT) 또는 L-데옥시우리딘(LdU)(문헌[Neschadim et al., 2012]).
CD/5-FC 음성 선택 마커 시스템은 광범위하게 사용되는 "자살 유전자" 시스템이다. 시토신 데아미나제(CD)는 박테리아 또는 효모(예를 들어, 각각 에세리키아 콜라이(Escherichia coli) 또는 사카로마이세스 세레비시아에(Saccharomyces cerevisiae)로부터 얻을 수 있는 비포유류 효소이다(문헌[Ramnaraine et al., 2003]). CD는 시토신의 우라실로의 전환을 촉매하고, 원핵생물 및 진균류에서 피리미딘 회수 경로의 중요한 구성원이나, 포유류 세포에는 존재하지 않는다. 5-플루오로시토신(5-FC)은 인간에게 저수준의 세포독성을 야기하는 항진균성 전구약물이다(문헌[Denny, 2003]). CD는 5-FC의 인간에서 고수준의 독성을 갖는 유전자 독성 물질 5-FU로의 전환을 촉매한다(문헌[Ireton et al., 2002]).
CE/CPT-11 시스템은 포유류 종의 상이한 조직들에서 발견되는 세린 에스테라아제인 카르복시 에스테라제 효소를 기반으로 한다(문헌[Humerickhouse et al., 2000]). 항암제 CPT-11은, CE에 의해 활성화됨으로써, 강력한 포유류 토포아이소머라제 I 억제제인 7-에틸-10-하이드록시캄토테신(SN-38)으로 불리는 활성을 생성하는 전구약물이다(문헌[Wierdl et al., 2001]). SN-38은 분열 세포에서 이중 가닥 DNA 파열의 축적을 유도한다(문헌[Kojima et al., 1998]).
음성 선택 마커 시스템의 또 다른 예는 iCasp9/AP1903 자살 시스템이며, 이는 인간 FK506 결합 단백질(FKBP)에 융합된 변형된 인간 카스파제 9를 기반으로 하고, 소분자 AP1903을 사용한 화학적 이량체화를 허용하며, 인간에서 안전하게 시험되었다. 이량체화 약물의 투여는 조작된 카스파제 9 구성요소를 발현하는 세포의 아폽토시스를 유도한다. 이 시스템은, 예를 들어, 인간 유전자 산물로 구성되어 있으며, 이 이량체화 약물이, 조작된 카스파제 9 구성요소를 발현하는 세포에만 영향을 미침으로 인한 잠재적 저면역원성을 포함하는 몇 가지 이점을 가진다(문헌[Straathof et al., 2005]). iCasp/AP1903 자살 시스템은 임상 환경에서 시험되고 있다(문헌[Di Stasi et al., 2011]).
본 명세서에서, ALINK 시스템의 음성 선택 마커 시스템이 증식 길항제 시스템으로 대체될 수 있음이 고려된다. 본 명세서에 사용되는 바와 같이, 용어 "증식 길항제"는, 그 존재가 세포 분열을 (완전히 또는 부분적으로) 억제하는 천연 또는 조작된 화합물(들)을 지칭한다. 예를 들어, OmomycER는 돌연변이 쥣과동물 에스트로겐 수용체(ER) 도메인을 갖는 MYC 우성 음성 Omomyc의 융합 단백질이다. 타목시펜(tamoxifen)(TAM)으로 유도되는 경우, 융합 단백질 OmomycER는 핵에 국소화되며, 여기서, 우성 음성 Omomyc는 C-Myc, L-Myc 및 N-Myc와 이량체함으로써, Myc DNA 결합 공통 서열과 결합할 수 없는 복합체 내로 이들을 격리시킨다(문헌[Soucek et al., 2002]). Myc 활성의 결여의 결과로서, 세포는 분열할 수 없다(문헌[Oricchio et al., 2014]). 증식 길항제의 또 다른 예는, 등몰농도 경쟁에서 DNA 결합을 억제하는 활성화 단백질-1(AP1)에 대해 우성 음성인 A-Fos(종양 유전자 Fos와 Jun의 이종이량체)이다(문헌[Olive et al., 1997]). A-Fos는 또한 ER 도메인에 융합됨으로써, TAM에 의해 핵 국소화가 유도되도록 할 수 있다. OmomycER/타목시펜 또는 A-FosER/타목시펜은 TK/GCV를 ALINK로 대체할 수 있다.
EARC 유전적 변형에 의한 CDL의 표적화
일 양태에서, 본 개시는, EARC, 예를 들어 유도성 활성인자 기반 유전자 발현 시스템과 CDL을 작동 가능하게 연결시킴으로써, CDL을 외인적으로 제어하기 위한 분자 도구, 방법 및 키트를 제공한다. 이러한 조건하에서, CDL은 유도성 활성인자 기반 유전자 발현 시스템의 유도인자의 존재하에서만 발현될 것이다(그리고, 세포는 분열할 수 있음). 이러한 조건하에서, EARC 변형된 세포는, 유도성 활성인자 기반 유전자 발현 시스템 및 CDL 기능의 작용 메커니즘에 따라, 유도인자의 부재 시에, 분열을 중지하거나, 유의하게 둔화되거나, 사멸된다. 세포는 동형접합성 또는 복합 이형접합성 EARC를 포함하도록 변형되거나, EARC 변형된 대립유전자만이 기능적 CDL을 생성할 수 있도록 변경될 수 있다. 일 구현예에서, EARC 변형은 CDL의 모든 대립유전자에 도입되어, 예를 들어, 세포 분열 제어를 위한 메커니즘을 제공할 수 있다.
EARC는, 유도인자의 존재하에 CDL 및 유도성 시스템의 활성인자 구성요소의 공동 발현을 허용하는 CDL의 임의의 위치에 삽입될 수 있다.
일 구현예에서, "활성인자" 기반 유전자 발현 시스템은 "리프레서"(repressor) 기반 유전자 발현 시스템보다 바람직하다. 예를 들어, 리프레서가 CDL을 억제하는데 사용되는 경우, 리프레서의 기능 돌연변이의 상실은 CDL 발현을 해제함으로써, 세포 증식을 허용할 수 있다. 활성화에 기반한 세포 분열 억제의 경우, 활성인자 기능(돌연변이)의 상실은 CDL 발현을 폐쇄시킴으로써, 세포 증식을 불허할 수 있다.
하기 실시예 2 내지 6에서 추가로 논의되는 바와 같이, dox 가교를 숙주 세포의 CDL(예를 들어, CDK1) 내로 삽입하여, 유도인자(예를 들어, 독시사이클린 또는 "DOX")의 존재하에, dox 가교가 CDL 발현을 허용함으로써, 세포 분열 및 증식이 허용될 수 있도록 할 수 있다. dox 가교 EARC에 의해 변형된 숙주 세포는, 분열 세포(예를 들어, CDL)에서 활성인 프로모터의 전사적 제어 하의 역 테트라사이클린 트랜스활성인자(rtTA) 유전자(문헌[Urlinger et al., 2000])를 포함할 수 있다. 이러한 표적 삽입은 CDL 프로모터가 CDL 전사에 더 이상 사용될 수 없도록 한다. CDL 전사를 재획득하기 위해, 테트라사이클린 반응자 요소 프로모터(예를 들어, TRE(문헌[Agha-Mohammadi et al., 2004]))를 CDL 전사체 앞에 삽입하면, rtTA가 발현되고, 독시사이클린이 존재하는 경우에만, CDL 유전자가 발현될 것이다. CDL 발현의 유일한 원천이 dox 가교 대립유전자인 경우, 독시사이클린의 부재 시에, CDL 유전자 발현은 존재하지 않는다. CDL 발현의 결여는, 사멸되거나, 세포 분열이 중지되거나, EARC 변형된 세포가 종양 형성에 기여할 수 없도록 세포 유사분열 속도가 둔화되도록 함으로써, EARC 변형된 세포에서 그의 증식이 훼손되도록 야기한다.
본 명세서에 사용되는 바와 같이, 용어 "dox 가교"는, 내인성 또는 외인성 프로모터에 의해 rtTA(문헌[Gossen et al., 1995])를 발현시키고, TRE의 제어하에 표적 영역이 전사되도록 함으로써, 표적 전사 영역으로부터 프로모터의 활성을 분리시키는 메커니즘을 지칭한다. 본 명세서에 사용되는 바와 같이, "rtTA"는 테트라사이클린 유도성 시스템의 역 테트라사이클린 트랜스활성인자 요소(문헌[Gossen et al., 1995])를 지칭하고, "TRE"는 최소 프로모터의 상류에 TetO 오퍼레이터 서열로 이루어진 프로모터를 지칭한다. 독시사이클린의 존재하에 rtTA가 TRE 프로모터와 결합하는 경우, TRE 프로모터 하류의 좌위들의 전사가 증가한다. rtTA 서열은, 표적 영역의 전사 발현의 허용 또는 불허 상태가 독시사이클에 의해 제어되는 한, CDL과 동일한 전사 단위 또는 게놈의 다른 위치에 삽입될 수 있다. dox 가교는 EARC의 일례이다.
EARC 시스템을 CDL의 5' 조절 영역에 도입하는 것이 또한 본 명세서에서 고려된다.
대안적 및/또는 추가적 유도성 활성인자 기반 유전자 발현 시스템이 EARC 변형을 생성하기 위해, 본 명세서에서 제공되는 도구 및/또는 방법에 사용될 수 있음이 본 명세서에서 고려된다. 다양한 유도성 활성인자 기반 유전자 발현 시스템이 당 업계에 공지되어 있다.
예를 들어, 코딩 CDL의 작용 단백질 산물과 융합된 불안정화 단백질 도메인(문헌[Banaszynski et al., 2006])은, 세포 분열 및/또는 증식이 바람직한 경우, CDL 융합 단백질을 안정화시키기 위해, 소분자 합성 리간드와 함께 사용될 수 있다. 안정화제의 부재 시에, 불안정화된 CDL 단백질은 세포에 의해 분해됨으로써, 이어서 증식이 중지될 것이다. 안정화제 화합물이 부가되는 경우, 이는 불안정화된 CDL 단백질과 결합하고, 분해되지 않음으로써, 세포의 증식이 허용될 것이다.
예를 들어, 전사 활성인자 유사 효과기(TALE) 기법(문헌[Maeder et al., 2013])은 이량체화제 조절된 발현 유도(문헌[Pollock and Clackson, 2002])와 조합될 수 있다. TALE 기법은 CDL의 프로모터를 대체하는 최소 프로모터와 함께 배치된 서열 특이적으로 설계된 DNA 결합 도메인을 생성하는데 사용될 수 있다. TALE DNA 결합 도메인은 또한 약물 이량체화 도메인으로 확장되었다. 후자는 상응하는 이량체화 도메인 및 전사 활성화 도메인을 갖는 또 다른 조작 단백질과 결합할 수 있다(도 1c).
예를 들어, 도 1d를 참조하면, 역 큐메이트 트랜스활성인자(rcTA)는 CDL의 5' 비번역 영역에 삽입됨으로써, 이는 내인성 CDL 프로모터에 의해 발현될 수 있다. 큐메이트 오퍼레이터(6xCuO)의 6회 반복체가 CDL의 번역 시작(ATG) 직전에 삽입될 수 있다. 상기 시스템에 큐메이트가 부재하는 경우, rcTA는 6xCuO와 결합할 수 없고, 따라서, 6xCuO가 활성화되지 않으므로, CDL이 전사되지 않을 것이다. 큐메이트가 부가되는 경우, rcTA와 복합체를 형성함으로써, 6xCuO와의 결합을 가능하게 하고, CDL 전사를 가능하게 한다(문헌[Mullick et al., 2006]).
예를 들어, 도 1e를 참조하면, Vp16(VpEcR)의 활성화 도메인에 융합된 레티노이드 X 수용체(RXR) 및 엑디손 수용체(EcR)의 N-말단 절두가 CDL의 5' 비번역 영역에 삽입됨으로써, 이들이 내인성 CDL 프로모터에 의해 공동 발현될 수 있다. 하류의 최소 프로모터를 갖는 엑디손 반응성 요소(EcRE)는 또한 개시 코돈 바로 상류의 CDL에 삽입될 수 있다. 공동 발현된 RXR 및 VpEcR은 서로 이종이량체화될 수 있다. 엑디손 또는 합성 약물 유사체 무리스테론 A가 부재하는 경우, 이량체화된 RXR/VpEcR은 EcRE와 결합할 수 없으므로, CDL은 전사되지 않는다. 엑디손 또는 무리스테론 A가 존재하는 경우, 이량체화된 RXR/VpEcR은 EcRE에 결합할 수 있음으로써, CDL이 전사된다(문헌[No et al., 1996]).
예를 들어, 도 1f를 참조하면, 일과성 수용체 전위 바닐로이드-1(TRPV1)은 페리틴과 함께 CDL의 5' 비번역 영역에 삽입되어, 내인성 CDL 프로모터에 의해 공동 발현될 수 있다. NFAT에 의한 유도성 프로모터(NFATre)는 개시 코돈의 바로 상류의 CDL에 삽입될 수 있다. 정상 환경에서는, NFAT 프로모터는 활성이 아니다. 그러나, TRPV1 및 페리틴이 저주파 전파에 노출되는 경우, 세포로 유입되는 Ca++ 파(wave)가 생성되고, 이어서, 세포질-NFAT(NFATc)가 핵-NFAT(NFATn)로 전환되며, 궁극적으로는 NFATre이 활성화되고, CDL이 전사될 것이다(문헌[Stanley et al., 2015]).
예를 들어, 도 1g를 참조하면, CDL은 일부분/도메인: 5' CDL 및 3' CDL로 기능적으로 분열될 수 있으며, FKBP 펩티드 서열은 각각의 도메인에 삽입될 수 있다. IRES(내부 리보솜 유입 부위) 서열은 2개의 도메인 사이에 배치됨으로써, CDL 프로모터에 의해 동시에 전사되나, 2개의 별도의 단백질을 생성할 수 있다. 유도인자의 부재 하에, 2개의 별도의 CDL 도메인은 기능적으로 비활성이다. 이량체화제, 예를 들어 라파마이신 또는 AP20187이 도입되는 경우, FKBP 펩티드는 이량체화되고, 5' 및 3' CDL 일부분을 함께 취합하여, 활성 단백질을 재구성한다(문헌[Rollins et al., 2000]).
동물 세포의 분열을 제어하는 방법
일 양태에서, 동물 세포의 분열을 제어하는 방법이 본 명세서에서 제공된다.
상기 방법은 동물 세포를 제공하는 단계를 포함한다. 예를 들어, 동물 세포는 조류 또는 포유류 세포일 수 있다. 예를 들어, 포유류 세포는, 만능성(예를 들어, 배아 줄기세포 또는 iPS 세포), 다능성, 단능성 전구세포, 또는 최종 분화된 단리된 인간 또는 비인간 세포일 수 있다. 상기 포유류 세포는 만능성, 다능성, 단능성 전구세포 또는 최종 분화된 세포로부터 유래될 수 있다. 상기 포유류 세포는 체세포 줄기세포, 다능성 또는 단능성 전구세포, 다능성 체세포 또는 체세포 줄기세포, 다능성 전구세포 또는 체세포로부터 유래된 세포일 수 있다. 바람직하게는, 상기 동물 세포는 유전적으로 변형되도록 처리될 수 있다. 바람직하게는, 상기 동물 세포는 사용자에 의해 치료적 가치를 갖는 것으로 고려되며, 이는 상기 세포가 질병, 장애, 결함 또는 손상을 치료할 필요가 있는 대상체에서 이를 치료하는데 사용될 수 있음을 의미한다. 다양한 구현예에서, 상기 비인간 포유류 세포는 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포일 수 있다. 바람직한 구현예에서, 상기 동물 세포는 인간 세포이다.
상기 방법은 동물 세포에서 CDL을 유전적으로 변형시키는 단계를 추가로 포함한다. CDL을 유전적으로 변형시키는 단계는 iNEP, 예를 들어 하나 이상의 ALINK 시스템 또는 ALINK 시스템 및 EARC 시스템 중 하나 이상을 숙주 동물 세포에 도입하는 단계를 포함한다. 다양한 유전적 변형, 예를 들어 음성 선택 마커 시스템 및 유도성 활성인자 기반 유전자 발현 시스템을 동물 세포에 도입하기 위한 기법은 그의 표적화(즉, 비무작위), 복합 이형접합성 및 동형접합성 도입 기법을 포함하여, 당 업계에 공지되어 있다. EARC 변형의 사용을 포함하는 경우, 상기 변형은, 기능적 CDL 발현이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장해야 한다. 예를 들어, 하나 이상의 ALINK를 단독으로 또는 하나 이상의 EARC 시스템과 함께 포함하는 DNA 벡터에 의한 CDL 또는 CDL의 표적화된 대체를 숙주 동물 세포의 유전적 변형을 위해, 수행할 수 있다.
상기 방법은 iNEP 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 분열을 허용하는 단계를 추가로 포함한다.
예를 들어, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포를 상응하는 ALINK 음성 선택 마커의 유도인자의 부재 하에 유지시킴으로써, ALINK 변형된 세포의 분열을 허용한다. 세포 분열 및 증식은 시험관내 및/또는 생체내에서 수행될 수 있다. 예를 들어, 유전적으로 변형된 세포는, 치료용으로 충분히 큰 세포 집단이 생성될 때까지, 시험관내에서 증식 및 확장이 허용될 수 있다. 예를 들어, 증식 및 확장된 하나 이상의 유전적으로 변형된 동물 세포(들)는 (예를 들어, 이식에 의해) 숙주 내로 도입될 수 있고, 생체내에서 추가로 증식하도록 허용될 수 있다. 다양한 구현예에서, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 분열의 어블레이션 및/또는 억제는, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포(들)을 상응하는 음성 선택 마커의 유도인자에 노출시킴으로써, 시험관내 및/또는 생체내에서 수행될 수 있다. 이러한 노출은 증식 세포를 어블레이션하고/하거나, 증식 세포의 적어도 일부를 사멸시킴으로써, 유전적으로 변형된 동물 세포의 증식 속도를 억제할 것이다. 예를 들어, 세포가 시험관내 또는 생체내에서 정상보다 더 빠른 속도로 분열되기 시작함으로써, 종양 형성 및/또는 바람직하지 않은 세포 성장을 유도할 수 있는 경우, 유전적으로 변형된 세포의 어블레이션 및/또는 유전적으로 변형된 동물 세포의 세포 증식의 억제가 바람직할 수 있다.
예를 들어, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포를 유도성 활성인자 기반 유전자 발현 시스템의 유도인자의 존재하에 유지시킴으로써, EARC 변형된 세포의 분열을 허용한다. 세포 분열 및 증식은 시험관내 및/또는 생체내에서 수행될 수 있다. 예를 들어, 유전적으로 변형된 세포는, 치료용으로 충분히 큰 세포 집단이 생성될 때까지, 시험관내에서 증식 및 확장이 허용될 수 있다. 예를 들어, 증식 및 확장된 하나 이상의 유전적으로 변형된 동물 세포(들)는 (예를 들어, 이식에 의해) 숙주 내로 도입될 수 있고, 생체내에서 추가로 증식하도록 허용될 수 있다. 다양한 구현예에서, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 분열의 어블레이션 및/또는 억제는, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 대한 노출을 방지 또는 억제함으로써, 시험관내 및/또는 생체내에서 수행될 수 있다. 상기 유도인자의 부재는 증식 세포를 어블레이션하고/하거나, 너무 느려서, 종양 형성에 기여할 수 없도록, 상기 유전적으로 변형된 동물 세포의 증식에 의한 확장을 억제할 것이다. 예를 들어, 세포가 시험관내 또는 생체내에서 정상보다 더 빠른 속도로 분열되기 시작함으로써, 종양 형성 및/또는 바람직하지 않은 세포 성장을 유도할 수 있는 경우, 상기 유전적으로 변형된 동물 세포의 세포 분열의 어블레이션 및/또는 억제가 바람직할 수 있다.
예를 들어, 하기 다양한 실시예에 제시된 본 명세서에서 제공되는 방법의 다양한 구현예에서, 상기 유도인자는 독시사이클린 및 간사이클로비르이다.
일 구현예에서, 독시사이클린은, 예를 들어, 약 1 mg/ml의 Dox를 물에 용해시키고, 성장 배지의 최종 농도가 약 1 μg/ml가 되도록 한 상기 유도인자의 농축액을 세포 성장 배지에 부가함으로써, 시험관내에서 세포로 전달될 수 있다. 생체내에서, 독시사이클린은, 예를 들어, 주사(예를 들어, 약 50 mg/kg의 투여량으로 IV 또는 IP) 또는 정제(약 1 내지 4 mg/kg의 투여량)에 의해, 음용수(예를 들어, 약 5 내지 10 mg/kg의 투여량) 또는 먹는 음식(예를 들어, 약 100 mg/kg의 투여량)을 통해 대상체에 경구 투여될 수 있다.
일 양태에서, 간사이클로비르는, 예를 들어, 약 10 mg/ml의 GCV를 물에 용해시키고, 성장 배지의 최종 농도가 약 0.25 내지 25 μg/ml가 되도록 한 상기 유도인자의 농축액을 세포 성장 배지에 부가함으로써, 시험관내에서 세포로 전달될 수 있다. 생체내에서, GCV는, 예를 들어, 주사(예를 들어, 약 IV 또는 IP 50 mg/kg의 투여량) 또는 정제(약 4 내지 20 mg/kg의 투여량)에 의해, 음용수(예를 들어, 약 4 내지 20 mg/kg의 투여량) 또는 먹는 음식(예를 들어, 약 4 내지 20 mg/kg의 투여량)을 통해 대상체에 경구 투여될 수 있다.
일 구현예에서, 시험관내에서 상기 유도인자가 작용하는지를 평가하기 위해, 예를 들어, 처리 개시 후, 24시간마다 (예를 들어, 세포 계수 및 생존율 검정에 의해) 세포 성장 및 세포 사멸을 측정할 수 있다. 생체내에서 상기 유도인자가 작용하는지를 평가하기 위해, 예를 들어, 처리 개시 후, 1 내지 2일마다, 유전적 변형된 만능성 세포로부터 생성된 기형종의 크기를 측정할 수 있다.
본 명세서에서 제공되는 방법의 특히 바람직한 구현예에서, 상기 동물 세포는 ALINK 및 EARC 시스템 둘 모두를 포함하도록 유전적으로 변형될 수 있다. ALINK 및 EARC 시스템은 동일하거나 상이한 CDL을 표적화할 수 있다. 이러한 세포는, 예를 들어, 세포 분열의 어블레이션 및/또는 억제, 및/또는 증식 세포의 적어도 일부의 사멸에 의한 증식의 어블레이션 및/또는 억제를 위한 적어도 2개의 메커니즘을 사용자에 제공하므로, 특정 용도를 위해 바람직할 수 있다.
본 명세서에서 제공되는 방법이 조류 세포, 예를 들어 닭 세포의 분열 및/또는 증식을 제어하는데 사용될 수 있다는 것이 본 명세서에서 고려된다.
세포 분열을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 조작된 세포
일 양태에서, 세포 분열 및/또는 증식을 제어하기 위한 적어도 하나의 메커니즘 및 이의 집단을 포함하도록 유전적으로 변형된 동물 세포가 본 명세서에서 제공된다. 예를 들어, 포유류 세포는, 만능성(예를 들어, 배아 줄기세포 또는 iPS 세포), 다능성, 단능성 전구세포, 또는 최종 분화된 단리된 인간 또는 비인간 세포일 수 있다. 상기 포유류 세포는 만능성, 다능성, 단능성 전구세포 또는 최종 분화된 세포로부터 유래될 수 있다. 상기 포유류 세포는 체세포 줄기세포, 다능성, 단능성 전구세포, 전구세포 또는 체세포 또는, 체세포 줄기세포, 다능성 또는 단능성 전구세포 또는 체세포로부터 유래된 세포일 수 있다. 바람직하게는, 상기 동물 세포는 유전적으로 변형되도록 처리될 수 있다. 바람직하게는, 상기 동물 세포는 사용자에 의해 치료적 가치를 갖는 것으로 고려되며, 이는 상기 세포가 질병, 장애, 결함 또는 손상을 치료할 필요가 있는 대상체에서 이를 치료하는데 사용될 수 있음을 의미한다. 일부 구현예에서, 상기 비인간 포유류 세포는 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포일 수 있다.
본 명세서에서 제공되는 유전적으로 변형된 세포는 하나 이상의 CDL의 하나 이상의 유전적 변형을 포함한다. ALINK 시스템인 하나의 CDL의 유전적 변형 및 복수의 CDL의 경우, ALINK 시스템 및 EARC 시스템 중 하나 이상, 예를 들어 ALINK 및/또는 EARC 시스템 중 하나 이상인 복수의 CDL의 유전적 변형이 본 명세서에 기재된다. 예를 들어, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는: 하나 이상의 CDL의 ALINK 시스템; 하나 이상의 CDL의 EARC 시스템; 또는 하나 이상의 CDL의 ALINK 및 EARC 시스템을 포함할 수 있으며, ALINK 및 EARC 시스템은 동일하거나 상이한 CDL에 상응한다. 상기 유전적으로 변형된 세포는 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 ALINK 유전적 변형을 포함할 수 있다. EARC 변형의 경우, 상기 변형은, 기능적 CDL 발현이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장해야 한다.
본 명세서에서 제공되는 유전적으로 변형된 세포는 질병, 장애 또는 손상의 치료와 관련된 세포 치료법 및/또는, 화합물 및/또는 조성물(예를 들어, 천연 또는 조작된 생물학적 제제)의 제어된 세포 전달을 포함하는 세포 치료법에 유용할 수 있다는 것이 고려된다. 전술된 바와 같이, 환자 안전성은 특히 치료용 세포 이식편에서 발생하는 악성 성장 가능성과 관련된, 세포 치료법에서의 관심사이다. 치료용 세포 이식편의 집중적인 증식이 요구되지 않는 세포 기반 치료법에서, 본 명세서에 기재된 바와 같은 하나 이상의 iNEP 변형을 포함하는 유전적으로 변형된 세포는 치료 및 안전성 요구를 처리하기에 적합할 것으로 고려된다. 치료용 세포 이식편의 집중적인 증식이 요구되는 세포 기반 치료법에서, 본 명세서에 기재된 바와 같은 2개 이상의 iNEP 변형을 포함하는 유전적 변형된 세포가 치료 및 안전성 요구를 처리하기에 적합할 것으로 고려된다.
본 명세서에서는 조류 세포, 예를 들어 닭 세포가 제공될 수 있으며, 상기 조류 세포는 상기 유전적 변형을 포함하는 것으로 고려된다.
CDL을 표적화하기 위한 분자 도구
일 양태에서, CDL의 발현을 변형시키기 위한 다양한 DNA 벡터가 본 명세서에서 제공된다.
일 구현예에서, 상기 DNA 벡터는 ALINK 시스템을 포함하고, ALINK 시스템은 음성 선택 마커를 인코딩하는 DNA 서열을 포함한다. 상기 음성 선택 마커의 발현은 CDL의 발현과 연결된다.
일 구현예에서, 상기 DNA 벡터는 EARC 시스템을 포함하고, EARC 시스템은 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하며, CDL의 발현은 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 의해 유도될 수 있다.
일 구현예에서, 상기 DNA 벡터는 본 명세서에 기재된 바와 같은 ALINK 시스템 및 본 명세서에 기재된 바와 같은 EARC 시스템을 포함한다. 이러한 카세트가 숙주 세포 내로 삽입되는 경우, CDL 전사 산물의 발현은 ALINK 시스템의 음성 선택 마커의 유도인자에 의해 방지 및/또는 억제될 수 있고, CDL의 발현은 EARC 시스템의 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 의해 유도될 수 있다.
다양한 구현예에서, DNA 벡터 내의 CDL은 표 2에 나열된 CDL이다.
다양한 구현예에서, DNA 벡터 내의 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템이다.
다양한 구현예에서, DNA 벡터 내의 EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이다.
키트
본 개시는 본 명세서에 개시된 방법을 수행하기 위한 키트를 고려한다. 이러한 키트는 전형적으로 세포 증식을 제어하기 위해 CDL들 및/또는 CDL들을 사용하기 위해 요구되는 2개 이상의 구성요소를 포함한다. 키트의 구성요소에는 화합물, 시약, 용기, 장비 및 키트 사용 지침서 중 하나 이상이 포함되지만, 이에 제한되지 않는다. 따라서, 본 명세서에 기재된 방법은 본 명세서에서 제공되는 사전 포장된 키트를 사용함으로써, 수행될 수 있다. 일 구현예에서, 상기 키트는 하나 이상의 DNA 벡터 및 지침서를 포함한다. 일부 구현예에서, 상기 지침서는 하나 이상의 DNA 벡터를 숙주 세포로 도입하기 위한 하나 이상의 프로토콜을 포함한다. 일부 구현예에서, 상기 키트는 하나 이상의 제어를 포함한다.
일 구현예에서, 상기 키트는 본 명세서에 기재된 바와 같이, CDL의 발현을 변형시키기 위한 하나 이상의 DNA 벡터를 포함한다. 예로서, 상기 키트는 ALINK 시스템을 포함하는 DNA 벡터; 및/또는 EARC 시스템을 포함하는 DNA 벡터; 및/또는 ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터; 및 하나 이상의 DNA 벡터를 사용함으로써, 동물 세포에서 하나의 CDL 및/또는 CDL의 표적화된 대체를 위한 지침서를 함유할 수 있다. 바람직한 구현예에서, 상기 키트는 상기 키트의 DNA 벡터(들)에 제공되는 ALINK 및/또는 EARC 시스템에 상응하는 하나 이상의 유도인자(예를 들어, 약물 유도인자)를 추가로 포함할 수 있다.
본 개시의 실례가 되는 하기의 비제한 실시예가 제공된다.
실시예 1: ALINK 변형된 세포(마우스 및 인간)의 생성
실시예 1에서, Cdk1/CDK1을 표적화하는 ALINK(HSV-TK) 벡터의 작제 및 증식 세포의 적어도 일부를 사멸시키는 방식에 의해, 마우스 및 인간 ES 세포에서 세포 증식을 제어하기 위한 그의 용도가 기재된다. 이 실시예에서, CDL은 Cdk1/CDK1이고, 음성 선택 마커는 HSV-TK이다.
Cdk1/CDK1은 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. CDK1 좌위와 HSV-TK 사이에 동형접합성 ALINK를 포함하도록 변형된 세포에서, 모든 유사분열 활성 세포는 CDK1 및 HSV-TK를 발현한다. 따라서, ALINK 변형된 유사분열 활성 세포는 GCV(HSV-TK의 전구약물)의 처리에 의해 제거될 수 있다. 모든 기능적 CDK1 발현 대립유전자가 ALINK 변형되고, 세포에서 HSV-TK 발현이 사일런싱(silencing)된 경우, 이어서, CDK1 발현 가능성이 또한 사일런싱되고, 세포는 더 이상 분열할 수 없게 된다. 휴지기(quiescence)(즉, 비분열) 세포는 Cdk1/CDK1을 발현하지 않는다. 따라서, ALINK 변형된 휴지기 세포는 Cdk1/CDK1-HSV-TK 연결을 발현하지 않을 것이다.
실시예 1에서, Cdk1/CDK1과 HSV-TK 사이의 전사 연결은 상동성 재조합 기반 녹인에 의해 달성하였다.
방법
표적 벡터의 생성
마우스 표적 벡터 I: 마우스 Cdk1 게놈 좌위가 도 2의 A에 도시되어 있다. 도 2의 B를 참조하면, 2개의 DNA 단편: 5TK(SEQ ID NO: 1) 및 3TK(SEQ ID NO: 2)(SalI-F2A-5'TK.007-PB 5'LTR-NotI-SacII 및 SalI-SacII-3'TK.007-PB 3'LTR-3'TK.007-T2A-XhoI-mCherry-NheI)를 pUC57 벡터(GenScript)에서 유전자 합성에 의해 획득하였다. 단편 5TK를 SalI+SacII에 의해 분해하고, 동일한 분해에 의해 3TK로 클로닝함으로써, pUC57-5TK-3TK를 생성시켰다. NotI+HindⅢ에 의해 플라스미드 pBluescript-M214(SEQ ID NO: 3)를 절단함으로써, PGK-네오마이신 카세트를 획득하고, pUC57-5TK-3TK의 NotI+SacII 부위에 결찰시킴으로써, Cdk1(즉, CDL)의 3' 말단에 삽입되는 ALINK 카세트를 생성시켰다.
CDL의 3' 말단에서의 삽입 ALINK를 위한 상동성 아암: Cdk1 DNA 코딩 서열을: The Center for Applied Genomics(TCAG)에서 구입한 Cdk1의 게놈 서열(SEQ ID NO: 4)과 박테리아 인공 염색체(BAC)를 함유하는 DH10B E. 콜라이(E. coli) 세포 균주를 재조합조작(recombineering)함으로써 클로닝하였다. 재조합조작 과정은 플라스미드 pSC101-BAD-γβα Red/ET(pRET)(GeneBridges, Heidelberg Germany)에 의해 매개되었다. pRET는 1.8 kV, 25 μF, 400Ohms(BioRad GenePulserI/II 시스템, BioRad, ON, CA)에서 BAC- 함유 DH10B E. 콜라이에 우선 전기천공한 다음, 콜로람페니콜 및 테트라사이클린 저항성에 대해 선택하였다. ALINK 삽입 지점(Cdk1 종결 코돈의 5' 및 3')에 걸쳐있는 짧은 상동성 아암(50bp)(각각 SEQ ID NO: 5 및 6)을 PCR에 의해 카세트 F2A-5'TK-PB-PGKneo-PB-3'TK-T2A-cherry에 부가하였다. 이어서, 이 PCR 산물을 상기 기재된 조건하에 Bac+pRET DH10B E. 콜라이에 전기천공한 후, 카나마이신 저항성에 대해 선택하였다. 755bp 및 842 염기 쌍(bp) 상동성 아암(각각 SEQ ID NO: 7 및 8)으로 이루어진 최종 표적화 카세트를 프라이머(각각 SEQ ID NO: 9 및 10)에 의한 PCR에 의해 회수하고, pGemT-Easy 벡터에 클로닝함으로써, 마우스 표적 벡터 I를 생성시켰다. 상기 벡터의 주요 접합 영역을 TCAG에서 서열분석하고, 확인하였다.
마우스 표적 벡터 II: 도 2의 D를 참조하면, F2A-loxP-PGK-neo-pA-loxP-AscI(SEQ ID NO: 11)를 pLoxPNeo1 벡터로부터 PCR 증폭시키고, TA를 pDrive 벡터(Qiagen)에 클로닝하였다. AscI-TK-T2A-mCherry-EcoRI(SEQ ID NO: 12)를 절개된 TC 대립유전자 I로부터 PCR 증폭시키고, TA를 pDrive 벡터에 클로닝하였다. 이어서, 후자의 단편을 BamHI+AscI 제한 부위에 의해 전자의 벡터에 클로닝하였다. 이 F2A-loxP-PGK-neo-pA-loxP-TK-T2A-mCherry 카세트를 GeneArt® Seamless Cloning and Assembly Kit(Life Technologies)에 의해 마우스 Cdk1 상동성 아암 사이에 삽입하였다. 퓨로마이신(puro) 버전 벡터를 생성하기 위해, PGN-puro-pA 단편(SEQ ID NO: 13)을 BamHI+NotI에 의해 pNewDockZ로부터 절단하고, T4로 평활화하였다. neo 버전 벡터를 AscI+ClaI에 의해 절단하고, T4로 평활화하였으며, PGK-puro-pA에 의해 결찰시켰다.
인간 표적 벡터 I: 마우스 표적 벡터 I과 유사하게, 인간 CDK1 종결 코돈(SEQ ID NO: 14)의 상류의 847 bp + F2A-5'TK-PB-PGKneo-PB-3'TK-T2A-cherry(SEQ ID NO: 15) + 인간 CDK1 종결 코돈(SEQ ID NO: 16)의 하류의 831 bp를 재조합조작 기법에 의해 생성시켰다. 동종접합성 표적화의 원샷(one-shot) 생성을 용이하게 하기 위해, 선택을 위해 퓨로마이신 저항성 카세트를 함유하는 상이한 버전의 벡터를 생성하고: AgeI-PGK-puro-pA-FseI(SEQ ID NO: 17)를 pNewDockZ 벡터로부터 증폭시키고, 분해하여, AgeI+FseI에 의해 절단된 neo 버전 벡터로 클로닝하였다.
인간 표적화 벡터 II: BamHI-F2A-loxP-PGK-neo-pA-loxP-TK-T2A-mCherry(SEQ ID NO: 18) 및 BamHI-F2A-loxP-PGK-puro-pA-loxP-TK-T2A-mCherry(SEQ ID NO: 19)를 상응하는 마우스 표적 벡터 II로부터 증폭시키고, BamHI+SgrAI에 의해 분해하였다. mCherry(3' 30bp)-hCDK13'HA-pGemEasy-hCDK15'HA-BamHI(SEQ ID NO: 20)를 PCR 증폭시키고, 또한 BamHI+SgrAI로 분해하였다. 인간 표적 벡터 II의 neo 및 퓨로마이신 버전을 상기 상동성 아암 골격 및 neo 또는 퓨로마이신 버전 ALINK 카세트의 결찰에 의해 생성시켰다.
인간 표적 벡터 Ⅲ: FACS에 의한 형광 표지(mCherry 또는 eGFP)로 표적화하고, 선택 카세트의 절개 단계를 피하기 위해, 선택 카세트가 없는 표적 벡터를 제조하였다. BamHI-F2A-TK-T2A-mCherry-SgrAI(SEQ ID NO: 58)를 절개된 TC 대립유전자 I로부터 PCR 증폭시키고, BamHI+SgrAI에 의해 분해하고, 분해된 mCherry(3' 30bp)-hCDK13'HA-pGemEasy-hCDK15'HA-BamHI(SEQ ID NO: 20)에 의해 결찰시켰다. 표적 벡터의 CRISPR PAM 부위를 부위 유도 PCR 기반 돌연변이유발 프로토콜을 사용함으로써, 프라이머 PAM_fwd(SEQ ID NO: 59) 및 PAM_rev(SEQ ID NO: 60)에 의해, 돌연변이유발시켰다. NEBuiler HiFi DNA 어셈블리 클로닝 키트(New England Biolabs Inc.)에 의해, GFP 버전 벡터를 PCR 증폭된 XhoI-GFP(SEQ ID NO: 61) 및 pGemT-hCdk1-TK-PAMmut(SEQ ID NO: 62)의 융합에 의해 생성시켰다.
CRISPR / Cas9 플라스미드의 생성
고효율 표적화를 달성하기 위해, CRISPR/Cas9-지원 유전자 표적화를 사용 하였다(문헌[Cong et al., 2013]). CRISPR/Cas9의 안내 서열을 온라인 CRISPR 설계 도구(http://crispr.mit.edu)를 사용함으로써, 분석하였다(문헌[Hsu et al., 2013]).
SEQ ID NO: 23의 마우스 Cdk1을 표적화하기 위해, CRISPR/Cas9 플라스미드 pX335-mCdkTK-A(SEQ ID NO: 21) 및 pX335-mCdkTK-B(SEQ ID NO: 22)를 설계하였다.
SEQ ID NO: 26의 인간 Cdk1을 표적화하기 위해, CRISPR/Cas9 플라스미드 pX330-hCdkTK-A(SEQ ID NO: 24) 및 pX459-hCdkTK-A(SEQ ID NO: 25)를 설계하였다.
제안된 프로토콜에 따라 Addgene으로부터 구입한 골격 플라스미드에 의해 CRISPR을 생성시켰다(문헌[Ran et al., 2013]).
ALINK 변형된 마우스 ES 세포의 생성
마우스 ES 세포 배양: 마우스 ES 세포를 15% 소 태아 혈청(Invitrogen), 1 mM 피루브산나트륨(Invitrogen), 0.1 mM MEM 비필수 아미노산(Invitrogen), 2 mM GlutaMAX(Invitrogen), 0.1 mM 2-mEARCaptoethanol(Sigma), 50 U/ml 각 페니실린/스트렙토마이신(Invitrogen) 및 1000 U/ml 백혈병 억제 인자(LIF)(Chemicon)로 보충된 둘베코 변형 이글 배지(DMEM)(고 글루코오스, 4500 mg/l)(Invitrogen)에서 배양하였다. 마우스 ES 세포를 0.25% 트립신 및 0.1% EDTA에 의해 통과시킨다.
표적화: 5x105 마우스 C57BL/6 C2 ES 세포(문헌[Gertsenstein et al., 2010])를 JetPrime 형질감염(Polyplus)에 의해 2 ug DNA(표적 벡터:0.5 μg, CRISPR 벡터: 1.5 μg)로 형질감염시켰다. 형질감염 48시간 후, 세포를 G418 또는/및 퓨로마이신 저항성에 대해 선택하였다. 저항성 클론을 독립적으로 채취하여, 96-웰 플레이트로 이동시켰다. 96-웰 플레이트를 동결 및 유전자형 분석(SEQ ID NO: 27, 28, 29 및 30)을 위해 복제하였다. PCR 양성 클론을 확장시키고, 다수의 바이알에 동결시키고, 서던 블롯팅에 의해 유전자형을 분석하였다.
선택 카세트의 절개: 올바르게 표적화된 ES 클론을 Episomal-hyPBase(표적 벡터 I)(SEQ ID NO: 34) 또는 pCAGGs-NLS-Cre-Ires-퓨로마이신(표적 벡터 II)(SEQ ID NO: 35)에 의해 형질감염시켰다. 형질감염 2 내지 3일 후에, 세포를 트립신 처리하고, 클론(10 cm 플레이트당 1000 내지 2000개의 세포)으로 플레이팅하였다. mCherry 양성 클론을 채취하여, 96-웰 플레이트에 독립적으로 운반하고, PCR(SEQ ID NO: 31 및 36) 및 서던 블롯에 의해 유전자형을 분석함으로써, 절개 상황을 확인하였다. 제거 영역의 접합부를 PCR 증폭시키고, 서열분석하고, 구조 이동(frame shift) 없이, 온전하고 이음부(seam)가 없는지를 확인하였다.
동형접합성 표적화: 이미 neo 버전 표적 벡터로 올바르게 표적화되고, 선택 카세트로 절개된 ES 클론을 표적 벡터의 퓨로마이신 저항성 버전으로 다시 형질감염시켰다. 형질감염 48시간 후, 퓨로마이신의 선택을 부가한 후, 상기에 기재된 바와 같이 콜로니를 채취하여, 분석하였다(SEQ ID NO: 31 및 32). 독립적인 puro 저항성 클론을 젤라틴 상에서 성장시킨 후, PCR을 위해 DNA를 추출하여, 야생형 대립유전자 밴드가 없음을 확인하였다(SEQ ID NO: 31, 33).
ALINK 변형된 인간 ES 세포의 생성
인간 ES 세포 배양: 인간 CA1 또는 H1(문헌[Adewumi et al., 2007]) ES 세포를 Geltrex(Life Technologies) 배양보조세포 무함유(feeder-free) 조건하에서, mTeSR1 배지(STEMCELL Technologies) + 페니실린-스트렙토마이신(Life Technologies의 Gibco)으로 배양하였다. 세포를 TryplE Express(Life Technologies) 또는 Accutase(STEMCELL Technologies)에 의해 통과시키고, 처음 24시간 동안 mTeSR 배지 + ROCK 억제제(STEMCELL Technologies)에 플레이팅한 후, mTeSR 배지로 교체하였다. 완전한 컨플루언스(confluence)의 6-웰 플레이트의 절반의 세포를 1ml 90% FBS(Life Technologies) + 10% DMSO(Sigma)에서 동결시켰다.
표적화: 6x106 CA1 hES 세포를 24 ug DNA(표적 벡터: pX330-hCdkTK-A=18 ug:6 ug)으로 Neon 프로토콜 14에 의해 형질감염시켰다. 형질감염 후, 세포를 4개의 10 cm 플레이트에 플레이팅하였다. G418 및/또는 퓨로마이신 선택을 형질감염 48시간 후에 시작하였다. 독립적인 콜로니를 채취하여, 96-웰 플레이트로 옮겼다. 각 플레이트를 추가의 성장 및 유전자형 분석(SEQ ID NO: 37, 38, 39 및 40)을 위해 복제하였다. PCR 양성 클론을 확장시키고, 다수의 바이알에 동결시키고, 서던 블롯팅에 의해 유전자형을 분석하였다.
선택 카세트의 절개: ALINK 표적화된 ES 클론을 hyPBase 또는 pCAGGs-NLS-Cre-IRES-퓨로마이신으로 형질감염시키고, 6-웰 플레이트에 플레이팅하였다. 세포가 6-웰 플레이트에서 컨플루언스에 도달한 경우, 세포를 항크스 평형 염류 용액(Hanks Balanced Salt Solution)(HBSS)(Ca2+/ Mg2+ 무함유)(25 mM HEPES pH7.0, 1% 소 태아 혈청)에 현탁시키고, mCherry 양성 세포를 ASTRIOS EQ 세포 분류기(Beckman Coulter)를 사용하여, 96-웰 플레이트에 분류하였다.
동형접합성 표적화: 마우스 시스템에서와 동일한 방식에 의해, 또는 mCherry 및 eGFP 인간 표적 벡터 Ⅲ + pX330-hCdkTK-A 또는 pX459-hCdkTK-A를 형질감염시킨 후, mCherry 및 eGFP 이중 양성 세포에 대한 FACS 분류에 의해, 동형접합성 표적화를 달성할 수 있다.
기형종 검정
Matrigel Matrix High Concentration(Corning)을 얼음 상에서 저온의 DMEM 배지에 의해 1:3으로 희석하였다. 5x106 내지 10x106 세포를 100 ul의 66% DMEM + 33% Matrigel 배지에 현탁시키고, B6N 마우스(마우스 C2 ES 세포) 및 NOD-SCID 마우스(인간 ES 세포) 중 어느 하나 또는 둘 모두의 등쪽 측복부에 피하 주사하였다. 주사 후 2 내지 4주 후에 기형종이 형성되었다. 기형종 크기를 캘리퍼(caliper)로 측정하고, 기형종 체적을 V=(LxWxH)π/6을 사용하여 계산하였다. 상이한 처리 기간으로 50 mg/kg을 복강 내로 매일 주사하여, GCV/PBS 처리를 수행하였다. 처리 종료시, 마우스를 희생시키고, 조직학 분석을 위해 종양을 해부하고, 4% 파라포름알데하이드로 고정시켰다.
유선 종양 검정
Cdk1+/+, +/ loxp - alink 마우스 C2 ES 및 CD-1 배경의 키메라를 배수체 응집을 통해 생성한 후, B6N WT 마우스와 교배시켜, 생식선 전달(germline transmission)을 통해 Cdk1+/+, +/ loxp - alink 마우스를 생성시켰다. Cdk1+/+, +/ loxp - alink 마우스를 EIIa-Cre 마우스와 교배시켜, Cdk1+/+, +/ alink 마우스를 생성시켰다. 이어서, Cdk1+/+, +/ alink 마우스를 MMTV-PyMT 마우스(문헌[Guy et al., 1992])와 교배시켜, 유선 종양 및 ALINK 변형을 가진 이중 양성 자손을 획득하였다. 페일 세이프 변형을 가진 유선 종양을 분리하고, 1 mm3 조각으로 절단하고, 야생형 B6N 암컷의 제4 유선에 이식하였다. GCV/PBS 치료를 상이한 처리 기간으로 50 mg/kg의 투여량에서 복강 내로 격일로 주사하였다. 유선 종양 크기를 캘리퍼로 측정하고, 식 V=길이*너비*높이*π/6으로 계산하였다.
신경 전구세포 대 뉴런 사멸 검정
Cdk1+/+, +/ alink 인간 CA1 ES 세포를 신경 상피 전구세포(NEP)로 분화시켰다. 후속하여, NEP를 뉴런으로의 분화를 위한 조건하에서 배양함으로써, DAPI, Ki67 및 Sox2의 면역염색을 특징으로 하는 비분열 뉴런과 분열 NEP의 혼합 배양물을 생성시켰다. GCV(10uM)를 20일 동안 격일로 상기 혼합 배양물에 제공하였다. 그런 다음, GCV를 4일 동안 배양물로부터 회수한 후, 세포를 4% PFA로 고정시켰다. 모든 잔여 세포의 세포 주기 이탈 여부를 조사하기 위해, 고정된 세포를 증식 마커 Ki67로 면역염색하고, 성숙 뉴런 마커 베타-튜블린Ⅲ로 면역염색하였다.
결과
마우스 Cdk1 게놈 좌위가 도 2의 A에 도시되어 있다. T2A(문헌[Szymczak et al., 2004]) 서열을 갖는 mCherry 리포터와 연결된 증대된 HSV -TK(TK.007(Preuß et al., 2010)) 유전자에 선행하는 F2A(문헌[Szymczak et al., 2004]) 서열에 의해 마지막 엑손의 종결 코돈을 대체함으로써, 각각 Cdk1 유전자(도 2의 A)의 3'UTR이 변형되도록 구성된 쥣과동물 Cdk1을 표적화하는 2개의 벡터를 생성시켰다(도 2의 B 및 도 2의 D).
도 2의 B 및 마우스 표적 벡터 I를 참조하면, PGK-neo-pA 선택 마커(표적화에 필요함)를 piggyBac 전이인자(transposon)에 의해 TK.007 개방형 판독 프레임 내로 삽입함으로써, TK 발현을 저지시켰다. piggyBac 전이인자 삽입은 전이인자 제거가 TK.007의 정상 ORF를 복원함으로써, 기능적 티미딘 키나제의 발현이 유도되도록 설계하였다(도 2의 C).
도 2의 D 및 마우스 표적 벡터 II를 참조하면, neo 카세트는 loxP-플랭킹되며, F2A와 TK.007 사이에 삽입하였다.
표적 벡터 I 및 II는 짧은(약 800 bp) 상동성 아암을 가졌으며, 이는, CRISPR이 상동성 재조합 표적화를 지원하고, 표적화 상황을 확인하기 위한 PCR 유전자형 분석을 쉽고 신뢰할 수 있도록 하기에 충분한 것이었다. CRISPR은 약물 저항성 클론의 40% PCR 양성으로 고빈도 표적화를 용이하게 하였다(도 3d).
piggyBac-삽입된 neo 카세트 및 loxP-플랭킹된 neo 카세트 둘 모두를 각각 piggyBac 전이효소 및 Cre 재조합효소의 일과성 발현에 의해 제거함으로써, 각각 도 2의 C 및 도 2의 E에 도시된 대립유전자를 포함하는 세포주를 생성시켰다. 도 2의 E를 참조하면, 나머지 loxP 부위는 TK와 프레임 내에 존재하고, TK의 N-말단에 13개의 아미노산이 부가되어 있다. TK 기능성 시험(GCV 사멸)은, 이 N-말단 삽입이 TK 기능을 방해하지 않는다는 것을 증명하였다.
도 4를 참조하면, CRISPR-Cas9 기법의 지원하에, 동형접합성 ALINK는 또한 2개의 상이한 인간 ES 세포주인 CA1 및 H1(문헌[Adewumi et al., 2007])에서 효율적으로 생성될 수 있다.
도 5a 및 도 5c를 참조하면, 데이터는 다음을 나타낸다: i) Cdk1의 3'UTR로의 TK.007 삽입은 Cdk1 발현을 방해하지 않으며; ii) ALINK 변형된 동형접합성 마우스 C2 ES 세포는 ES 세포 조건하에서 적절하게 자체 재생되고, 생체내에서 분화되고, 복합 기형종을 형성하고; iii) ALINK 변형된 동형접합성 인간 CA1 ES 세포는 ES 세포 조건하에서 적절하게 자체 재생되고, 생체내에서 분화되고, 복합 기형종을 형성한다.
도 6을 참조하면, 데이터는 다음을 나타낸다: i) TK.007이 적절하게 발현되며; 미분화된 ES 세포의 GCV 처리는 동형접합성 및 이형접합성 변형된 세포 둘 모두를 어블레이션하고(도 6a); 그리고, ii) T2A-연결된 mCherry는 ES 세포에서 지속적으로 발현된다(도 6b).
도 7a를 참조하면, 데이터는, ALINK 변형된 세포 이식편을 포함하는 숙주에서, ALINK 변형된 ES 세포를 포함하는 피하 기형종의 GCV 처리는 분열 세포를 어블레이션함으로써, 기형종의 성장을 중지시킨다는 것을 나타낸다. GCV 처리는 기형종의 휴지기 세포에는 영향을 주지 않았다. 수용체의 단기간(3주)의 GCV 처리 기간은 기형종을 휴면기(dormant)가 되도록 하는데 충분하였다. 도 7b를 참조하면, ALINK 변형된 인간 세포 이식편을 포함하는 NOD scid 감마 마우스 숙주에서, 2회의 GCV 처리(제1 회 15일 + 제2 회 40일)는 기형종을 휴면기가 되도록 하였다.
도 7c를 참조하면, ALINK 변형된 MMTV-PyMT-형질전환된 유방 상피 종양 형성 세포 이식편을 포함하는 B6N 숙주에서, GCV 처리는 유선 종양을 휴면기가 되도록 할 수 있다.
도 7def의 D 내지 도 7def의 F를 참조하면, 모든 세포가 Cdk1+/+, +/ alink 인간 CA1 ES 세포로부터 유래된, 비분열 뉴런과 분열 NEP의 혼합 배양물에서, GCV는 분열 NEP를 사멸시켰으나, 비분열 뉴런은 사멸시키지 않았다.
일 구현예에서, 불활성화 돌연변이가 CDL-HSV-TK 전사 연결의 HSV-TK 구성요소에서 발생된 경우, 하나 이상의 분열 세포가 GCV 매개된 어블레이션을 회피할 수 있다고 고려된다. 세포 회피의 가능성을 처리하기 위해, 본 발명자는 세포 분열당 대체적인 돌연변이율(즉, 10-6)을 고려하여, 1개의 돌연변이 세포를 생성하는데 필요한 것으로 추정되는 세포 분열 횟수는 이형접합성 Cdk1 HSV-TK 전사 연결을 포함하는 세포의 경우, 16회, 동형접합성 Cdk1 HSV-TK 전사 연결을 포함하는 세포의 경우, 30회의 세포 분열인 것으로 결정하였다. 이는, 하나의 이형접합성 ALINK 변형된 세포가 216개(즉, 65,000개의 세포)로 확장되고, 단일 동형접합성 ALINK 변형된 세포가 230개(즉, 10억 개의 세포)로 확장되는 경우, 그 후, 이형접합성 및 동형접합성 세포 집단당 상실된 HSV-TK 활성을 포함하는 평균 하나의 돌연변이 세포가 생성될 것이라는 것을 의미한다(도 8). 따라서, 본 발명자들은, 동형접합성 ALINK 변형된 세포가 세포 기반 치료법용으로 매우 안전할 것이라고 결정하였다. 세포 치료법의 안전성 수준을 계산하는 또 다른 방법은 상기에 제시되어 있다.
실시예 2: Cdk1 좌위에서의 EARC 변형된 마우스 ES 세포의 생성
실시예 2에, Cdk1을 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Cdk1/CDK1이다.
상기에 기재된 바와 같이, Cdk1/CDK1은 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Cdk1 좌위에 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Cdk1의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재 시에 제거될 수 있다.
실시예 2에서, Cdk1 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는 EARC 표적화 벡터의 작제
3x SV40 pA 신호에 선행하는 rTTA 코딩 서열(SEQ ID NO: 41)을 함유하는 단편을 rTTA의 5'에 부가된 lox71 부위를 함유하는 프라이머(rtta3xpaFrw1(SEQ ID NO: 63), rtta3xpaRev1(SEQ ID NO: 64))를 사용하여, PCR에 의해 pPB-CAGG-rtta 플라스미드로부터 증폭시켰다. 이 단편을 pGemT 플라스미드에 서브클로닝함으로써, pGem-가교-단계1을 생성시켰다. 후속하여, TetO 프로모터(SEQ ID NO: 42)(pPB-TetO-IRES-mCherry로부터 유래됨)를 함유하는 SacII 단편을 pGem-가교-단계1의 SacII 부위에 클로닝함으로써, pGem-가교-단계2를 생성시켰다. 상기 가교의 최종 요소를 pGem-가교-단계2의 BamHI 부위에 BamHI IRES-퓨로마이신 단편(SEQ ID NO: 43)을 삽입하여 클로닝함으로써, pGem-가교-단계3을 생성시켰다. C57/B6 게놈 DNA로부터 900 bp 단편(SEQ ID NO: 44)을 PCR 증폭시키고(프라이머 cdk5FrwPst(SEQ ID NO: 45) 및 cdk5RevSpe(SEQ ID NO: 46)), 이를 pGem-가교-단계3의 SbfI 및 SpeI에 클로닝함으로써, 5' 상동성 아암을 클로닝하였다. 유사하게, 프라이머 dkex3_5'FSpe(SEQ ID NO: 48), cdkex3_3lox(SEQ ID NO: 49)를 사용하여, PCR에 의해 3' 상동성 아암(900bp)(SEQ ID NO: 47)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge(SEQ ID NO: 148)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR / Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해, 이중 닉카아제(nickase) 전략을 선택하였다. 안내 RNA 서열(SEQ ID NO: 50, 51, 52 및 53)을 pX335(제안된 프로토콜에 따라 Addgene으로부터 획득됨)에 클로닝하였다(문헌[Ran et al., 2013]).
EARC 변형된 마우스 ES 세포의 생성
마우스 ES 세포 배양: 모든 유전적 조작은 종래에 특성화된 C57BL/6N 마우스 ES 세포주(C2)(문헌[Gertsenstein et al., 2010])에서 수행하였다. 마우스 ES 세포를, 15% ES 세포 등급 FBS(Gibco), 0.1 mM 2-mEARCaptophenol, 2 mM L-글루타민, 1 mM 피루브산나트륨, 0.1 mM 비필수 아미노산 및 2,000 단위/ml 백혈병 억제 인자(LIF)가 보충된 고 글루코스 DMEM(Invitrogen)을 기반으로 한 배지에서 성장시켰다. 세포를, 미토마이신 C 처리된 마우스 배아 섬유아세포(MEF)에서 5% CO2로 37℃에서 유지시켰다.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-cdk-ex3A(SEQ ID NO: 151) 및 px335-cdk-ex3B(SEQ ID NO: 152)) 및 표적화 플라스미드(pBridge; SEQ ID NO: 148)를 제조사의 지침에 따라, FuGENE HD(Clontech)를 사용하고, 8:2의 FuGENE:DNA 비(2 μg 총 DNA: 각 pX330의 경우 250 ng 및 pBridge의 경우 1500 ng)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다. 전형적인 형질감염을 3x105개의 세포에서 수행하고, 35 mm 플레이트에 플레이팅하였다. 형질감염 시에, 독시사이클린을 배지에 부가하여, 최종 농도가 1 μg/ml가 되도록 하였다. 형질감염 2일 후에, 세포를 100 mm 플레이트에 플레이팅하고, 선택을 1 μg/ml의 퓨로마이신에 의해 적용하였다. 퓨로마이신 저항성 콜로니를 선택 시작 후 8 내지 10일 후에 채취하고, PCR 스크리닝시까지 96 웰 플레이트에 유지하였다.
유전자형 분석: 문헌[Nagy et al., 2003]에 따라 96 웰 플레이트에서 ES 세포로부터 DNA를 직접 추출하였다. Cdk1 유전자의 5'에서 pBridge의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 및 3' 상동성 아암에 걸친 프라이머(5' 아암의 경우, 프라이머 rttaRev(SEQ ID NO: 54), ex3_5scr(SEQ ID NO: 55), 3' 아암의 경우, 프라이머 CMVforw(SEQ ID NO: 56), ex3_3scr(SEQ ID NO: 57))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: F3-가교 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 각 조건에 대해 3개의 웰을 트립신 처리하고, Countess 자동 세포 계수기(Life Technologies)를 사용하여, 생존 세포를 계수함으로써, 세포 계수를 수행하였다. 플레이팅 2일 후에, 독시사이클린을 제거하거나, 0.05 ng/ml로 감소시켰으며, 생존 세포를 상이한 조건에서 매일 최대 18일 동안 계수하였다.
Cre-절개: F3-가교 세포(Dox+ 배지에서 성장함)를 트립신 처리하고, Cre(pCAGG-NLS-Cre)를 발현하는 2 μg의 플라스미드로 형질감염시켰다. 형질감염은 JetPrime(Polyplus)을 사용하여, 제조사의 프로토콜에 따라 수행하였다. 형질감염 후, 독시사이클린을 제거하고, 콜로니를 트립신 처리하고, 풀(pool)로 확장시켰다.
정량적 PCR: 제조사의 프로토콜에 따라 GeneElute 총 RNA 미니프렙 키트(Sigma)를 사용하여, 1 μg/ml 및 0 μg/ml의 Dox로 2일 동안 처리한 세포로부터 총 RNA를 추출하였다. 제조사의 프로토콜에 따라 QuantiTect 역전사 키트(Qiagen)를 사용하여, 1 μg의 RNA의 역전사에 의해 cDNA를 생성시켰다. 실시간 qPCR을 SensiFast-SYBR qPCR 믹스(Bioline)를 사용하여, BioRad CFX 유전자증폭기(thermocycler)에서 설정하였다. 사용된 프라이머는: qpcrcdk1_F(SEQ ID NO: 65), qpcrcdk1_R(SEQ ID NO:66) 및 actBf(SEQ ID NO: 67), actBr(SEQ ID NO: 68)이었다. 결과를 ΔΔCT 방법으로 분석하고, 베타 액틴에 대하여 정상화(normalization)하였다.
결과
도 9를 참조하면, 도 9a에 도시된 dox 가교 표적 벡터를 사용함으로써, 3개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 9b). 이들 세포주 중 하나는, 상동성 재조합에 의해 Cdk1의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 세포주(도 9b의 3F)인 것으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Cdk1 프로모터 활성 생성된 rtTA는 TRE와 결합하고, Cdk1의 전사를 개시시킨다. 3' 변형과 유사하게, CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Cdk1의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 5일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 10). doc 가교 세포주의 유도 및 유지에 사용된 농도에 비해, 독시사이클린 농도를 20배(50 ng/ml) 감소시킨 경우, 일부 세포/콜로니의 5일의 기간의 생존이 허용되었다(도 11).
도 12를 참조하면, dox 가교는, 2개의 lox71 부위 사이의 절편의 Cre 재조합효소 매개된 절개에 의해 제거될 수 있으며, 이는, 상기 대립유전자의 본래의 내인성 발현 조절을 복원시키고, 독시사이클린의 결여로부터 세포 치사율을 복구시킨다. 이러한 데이터는 dox 가교가 추정된 바와 같이, 세포에 작용하고 있음을 나타낸다.
도 13을 참조하면, 본 발명자들은, 독시사이클린의 존재 및 부재하에서 세포 성장을 측정함으로써, 독시사이클린 회수가 dox 가교 ES 세포의 제거에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린의 회수 시(1일째)에, 세포는 2일 동안만 성장하였으며, 그 후, 세포 사멸이 시작되어, 9일째에는 생존 세포가 존재하지 않았다. 처음 3일의 세포 성장 후에 제공된 20배 더 저농도 독시사이클린(50ng/ml)은 플레이트 상에 적어도 5일 동안 일정한 수의 세포를 유지하기에 충분하였다(도 13, 밝은 청색 선). 정상 농도의 독시사이클린을 10일째에 플레이트에 다시 부가하는 경우, 세포는 정상 ES 세포와 같이 다시 성장하기 시작하였다.
독시사이클린이 결여된 배지에서 성장한 경우, 분열 세포는 Cdk1의 EARC(dox 가교) 변형을 회피할 수 있을 것으로 고려된다. 세포 회피 가능성을 처리하기 위해, EARC(dox 가교) 변형된 마우스 ES 세포를 독시사이클린을 함유하는 배지에서 10개의 플레이트에 100,000,000 세포/플레이트까지 성장시켰다. 이어서, 변형된 ES 세포의 10개의 플레이트 각각에 300개의 GFP 양성 야생형 ES 세포(센티넬)를 혼합하고, 독시사이클린을 배양 배지로부터 회수하였다. GFP 양성 콜로니만이 회복되었고(도 14), 이는, 배양 중의 100,000,000개의 세포 중에 회피된 dox 가교 ES 세포가 존재하지 않음을 나타낸다. 따라서, 본 발명자들은, 돌연변이에 의해, dox 가교의 상실이 발생할 개연성이 낮고, CDL 발현의 차단으로 인해, 유도인자(독시사이클린)의 부재하에 세포 분열이 가능하지 않기 때문에, EARC(dox 가교) 변형된 ES 세포는 특정 세포 치료 적용을 위해 ALINK 변형에 추가적 수준의 안전성을 부가할 것으로 결정하였다.
도 15를 참조하면, dox 가교 ES 세포의 성장에 대한 고농도 독시사이클린(10 μg/ml)의 영향을 조사하였다. 고농도 독시사이클린의 존재하에, dox 가교 ES 세포의 성장 속도는 저농도 독시사이클린에서 성장한 세포와 유사한 속도로 둔화되었다. 이러한 데이터는 야생형 세포 유사 증식을 위한 최적의 Cdk1 발현을 허용할 수 있는 독시사이클린 농도의 범위가 존재함을 나타낸다.
실시예 3: CDK1 좌위에서 EARC - ALINK 변형된 세포의 생성(마우스 및 인간)
실시예 3에서, CDK1을 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 및 인간 ALINK 변형된 ES 세포 둘 모두에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, CDL은 Cdk1/CDK1이고, EARC는 dox 가교이며, ALINK는 HSV-TK이다. CDL Cdk1은 동형접합성 형태로 EARC 및 ALINK 시스템 둘 모두에 의해 변형되고, 여기서, CDL의 발현을 유도하기 위해 독시사이클린이 요구되며, 독시사이클린 및 GCV는 함께, 변형된 증식 세포를 사멸시키는 방법을 제공한다.
실시예 3에서, CDK1 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
마우스 표적화를 위한 마우스 EARC 표적화 벡터, CRISPR/Cas9 플라스미드의 작제는 실시예 2에서와 동일하다. 표적화 및 유전자형 분석 방법은 또한, C2 WT 세포 대신에, 실시예 1(도 3ab 내지 도 3g)에서 생성된 Cdk1(TK/TK) 세포를 형질감염을 위해 사용하였다는 것을 제외하고, 실시예 2에 기재된 바와 동일하다.
인간 CDK1에 대한 dox 가교를 포함하는 EARC 표적화 벡터의 작제
CA1 게놈 DNA로부터의 981 bp 단편을 PCR 증폭시키고(프라이머 hcdk5'F(SEQ ID NO: 70) 및 hcdk5'R(SEQ ID NO: 71)), 이를 pGem-가교-단계3의 SbfI에 클로닝함으로써, 5' 상동성 아암(SEQ ID NO: 69)을 클로닝하였다. 유사하게, 프라이머 hcdk3'F(SEQ ID NO: 73) 및 hcdk3'R(SEQ ID NO: 74)를 사용하여, PCR에 의해 3' 상동성 아암(943 bp; SEQ ID NO: 72)을 증폭시키고, SphINcoI에 클로닝함으로써, pBridge-hCdk1(SEQ ID NO: 75)로 지칭되는 최종 표적화 벡터를 생성시켰다.
인간 표적화를 위한 CRISPR / Cas9 플라스미드의 작제
안내 RNA(hCdk1A_up(SEQ ID NO: 76), hCdk1A_low(SEQ ID NO: 77), hCdk1B_up(SEQ ID NO: 78), hCdk1B_low(SEQ ID NO: 79))를 pX335(SEQ ID NO: 149) 및 pX330(SEQ ID NO: 150)에 클로닝하여, pX335-1A(SEQ ID NO: 80), pX335-1B(SEQ ID NO: 81) 및 pX330-1B(SEQ ID NO: 82)를 생성시켰다.
EARC 변형된 인간 ES 세포의 생성
표적화: 2x106 CA1 Cdk1(TK/TK)(즉, 도 4a 내지 도 4f에 기재된 세포 산물) hES 세포를 Neon 프로토콜 14에 의해 8 ug의 DNA(표적 벡터: pX330-hCdkTK-A=6 ug: 2 ug)로 형질감염시켰다. 형질감염 후, 세포를 4개의 10 cm 플레이트에 플레이팅하였다. 형질감염 시, 독시사이클린을 배지에 부가하여, 최종 농도가 1 μg/ml이 되도록 하였다. 형질감염 2일 후에, 0.75 μg/ml의 퓨로마이신에 의한 선택을 적용하였다. 퓨로마이신 저항성 콜로니를 96-웰 플레이트에 채취하고, 추가적 성장 및 프라이머(hCdk1Br-5HAgen_F1(SEQ ID NO: 83), rtTA_rev_1(SEQ ID NO: 84), mCMV_F(SEQ ID NO:85), hCdk1Br-3HAgen_R1(SEQ ID NO: 86))에 의한 유전자형 분석을 위해 복제하였다.
결과
도 16a를 참조하면, 실시예 1에서 생성된 마우스 세포 산물, Cdk1(TK/TK)를 표적화하기 위해, 마우스 dox 가교 표적 벡터, pBridge를 사용함으로써, 마우스 Cdk1earc/earc,alink/alink 세포를 생성시켰다. 9개의 Cdk1earc / earc,alink / alink 클론이 원샷 형질감염에 의해 생성되었다(도 16b).
도 5b를 참조하면, 데이터는, EARC-및-ALINK-변형된 동형접합성 마우스 C2 ES Cdk1 earc / earc,alink / alink 세포가 ES 세포 조건하에서 적절하게 자가 재생되고, 생체내에서 분화되고, 복합 기형종을 형성하였다는 것을 나타낸다.
도 17a를 참조하면, 인간 dox 가교 표적 벡터인 pBridge-hCdk1을 사용하여, 실시예 1에서 생성된 인간 CA1 세포 산물, Cdk1(TK/TK)를 표적화함으로써, 인간 Cdk1 earc / earc,alink / alink 세포를 생성시켰다. 원샷 형질감염에 의해 적어도 Cdk1 earc/earc,alink/alink CA1 클론이 생성되었다(도 17b).
실시예 4: Top2a 좌위에서 EARC 변형된 마우스 ES 세포의 생성
실시예 4에서, Top2a를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템에 의해 표적화되는 CDL은 Top2a/TOP2A이다.
상기에서 기재된 바와 같이, Top2a/TOP2A는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Top2a 좌위에 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Top2a의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에 제거될 수 있다.
실시예 4에서, Top2a 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
Top2a에 대한 dox 가교를 포함하는 EARC 표적화 벡터의 작제
C57/B6 게놈 DNA로부터의 870 bp 단편을 PCR 증폭시키고(프라이머 Top5F(SEQ ID NO: 88) 및 Top5R(SEQ ID NO: 89)), pGem-가교-단계3의 SbfI 및 SpeI로 클로닝함으로써, 5' 상동성 아암(SEQ ID NO: 87)을 클로닝하였다. 유사하게, 프라이머 Top3F(SEQ ID NO: 91), Top3R(SEQ ID NO: 92)를 사용하여, PCR에 의해 3' 상동성 아암(818 bp; SEQ ID NO: 90)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge-Top2a(SEQ ID NO: 93)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR / Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고(oligos): TOP2A1BF(SEQ ID NO: 94), TOP2A1BR(SEQ ID NO: 95), TOP2A1AF(SEQ ID NO: 96), TOP2A1AR(SEQ ID NO: 97)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-Top2aA(SEQ ID NO: 98) 및 px335-Top2aB(SEQ ID NO: 99)를 생성시켰다.
EARC 변형된 마우스 ES 세포의 생성
마우스 ES 세포 배양: 모든 유전적 조작은 종래에 특성화된 C57/B6 마우스 ES 세포주(C2)(문헌[Gertsenstein et al., 2010])에서 수행하였다. 마우스 ES 세포를, 15% ES 세포 등급 FBS(Gibco), 0.1 mM 2-mEARCaptophenol, 2 mM L-글루타민, 1 mM 피루브산나트륨, 0.1 mM 비필수 아미노산 및 2,000 단위/ml 백혈병 억제 인자(LIF)가 보충된 고 글루코스 DMEM(Invitrogen)을 기반으로 한 배지에서 성장시켰다. 세포를, 미토마이신 C 처리된 마우스 배아 섬유아세포(MEF)에서 5% CO2로 37℃에서 유지시켰다.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-Top2aA(SEQ ID NO: 98) 및 px335-Top2aB(SEQ ID NO: 99)) 및 표적화 플라스미드(pBridge-Top2a(SEQ ID NO: 93)를 제조사의 지침에 따라, FuGENE HD(Clontech)를 사용하고, 8:2의 FuGENE:DNA 비(2 μg 총 DNA: 각 pX335의 경우 250 ng 및 pBridge-Top2a의 경우 1500 ng)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다. 전형적인 형질감염을 3x105개의 세포에서 수행하고, 35 mm 플레이트에 플레이팅하였다. 형질감염 시에, 독시사이클린을 배지에 부가하여, 최종 농도가 1 μg/ml가 되도록 하였다. 형질감염 2일 후에, 세포를 100 mm 플레이트에 플레이팅하고, 선택을 1 μg/ml의 퓨로마이신에 의해 적용하였다. 퓨로마이신 저항성 콜로니를 선택 시작 후 8 내지 10일째에 채취하고, PCR 스크리닝시까지 96 웰 플레이트에 유지하였다.
유전자형 분석: 문헌[Nagy et al., 2003]에 따라 96 웰 플레이트에서 ES 세포로부터 DNA를 직접 추출하였다. Top2a 유전자의 5'에서 pBridge-Top2a의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 및 3' 상동성 아암에 걸친 프라이머(5' 아암의 경우, 프라이머 rttaRev(SEQ ID NO: 54), top2a_5scrF(SEQ ID NO: 55), 3' 아암의 경우, 프라이머 CMVforw(SEQ ID NO: 56), top2a_3scrR(SEQ ID NO: 57)를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Top2a 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
결과
도 18을 참조하면, 도 18a에 도시된 dox 가교 표적 벡터를 사용함으로써, 여러 개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 18b). 이들 세포주 중 9개는, 상동성 재조합에 의해 Top2a의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것(도 18b)으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Top2a 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Top2a 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Top2a의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 19a).
도 19b를 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 2일 후에는, EARC 변형된 세포의 세포 성장이 완전히 저지되었다.
실시예 5: Cenpa 좌위에서 EARC 변형된 마우스 ES 세포의 생성
실시예 5에서, Cenpa를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Cenpa/CENPA이다.
상기에서 기재된 바와 같이, Cenpa/CENPA는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Cenpa 좌위에서 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Cenpa의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에서 제거될 수 있다.
실시예 5에서, Cenpa 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는 EARC 표적화 벡터의 작제
C57/B6 게놈 DNA로부터의 874 bp 단편을 PCR 증폭시키고(프라이머 Cenpa5F(SEQ ID NO: 101) 및 Cenpa5R(SEQ ID NO: 102)), pGem-가교-단계3의 SbfI 및 SpeI로 클로닝함으로써, 5' 상동성 아암(SEQ ID NO: 100)을 클로닝하였다. 유사하게, 프라이머 Cenpa3F(SEQ ID NO: 104), Cenpa3R(SEQ ID NO: 105)를 사용하여, PCR에 의해 3' 상동성 아암(825 bp; SEQ ID NO: 103)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge-Cenpa(SEQ ID NO: 106)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR / Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고 CenpaAF(SEQ ID NO: 107), CenpaAR(SEQ ID NO: 108), CenpaBF(SEQ ID NO: 109), CenpaBR(SEQ ID NO: 110)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-CenpaA(SEQ ID NO: 111) 및 px335-CenpaB(SEQ ID NO: 112)를 생성시켰다.
EARC 변형된 마우스 ES 세포의 생성
마우스 ES 세포 배양: 실시예 4에서와 같음.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-CenpaA; SEQ ID NO: 111, 및 px335-CenpaB; SEQ ID NO: 112) 및 표적화 플라스미드(pBridge-Cenpa; SEQ ID NO: 106)를 실시예 4에서와 같이, FuGENE HD(Clontech)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다.
유전자형 분석: 실시예 4에서와 같이 DNA를 추출하였다. Cenpa 유전자의 5'에서 pBridge-Cenpa의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 및 3' 상동성 아암에 걸친 프라이머(5' 아암의 경우, 프라이머 rttaRev(SEQ ID NO: 54), Cenpa_5scr(SEQ ID NO: 113), 3' 아암의 경우, 프라이머 CMVforw(SEQ ID NO: 114), Cenpa_3scr(SEQ ID NO: 115))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Cenpa 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
정량적 PCR: 제조사의 프로토콜에 따라 GeneElute 총 RNA 미니프렙 키트(Sigma)를 사용하여, 1 μg/ml 및 0 μg/ml의 Dox로 2일 동안 처리한 세포로부터 총 RNA를 추출하였다. 제조사의 프로토콜에 따라 QuantiTect 역전사 키트(Qiagen)를 사용하여, 1 μg의 RNA의 역전사에 의해 cDNA를 생성시켰다. 실시간 qPCR을 SensiFast-SYBR qPCR 믹스(Bioline)를 사용하여, BioRad CFX 유전자증폭기에서 설정하였다. 사용된 프라이머는: qpcrcenpa_F(SEQ ID NO: 116), qpcrcenpa_R(SEQ ID NO: 117) 및 actBf(SEQ ID NO: 67), actBr(SEQ ID NO: 68)이었다. 결과를 ΔΔCT 방법으로 분석하고, 베타 액틴에 대하여 정상화하였다.
결과
도 20을 참조하면, 도 20a에 도시된 dox 가교 표적 벡터를 사용함으로써, 여러 개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 20b). 이들 세포주 중 6개는 5' 및 3'에 올바른 삽입을 갖는 것으로 밝혀졌으며, 적어도 하나의 클론(Cenpa#4)은, 상동성 재조합에 의해 Cenpa의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화(도 20b)를 갖는 것으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Cenpa 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Cenpa 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Cenpa의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 21a).
도 21b를 참조하면, 본 발명자들은 qPCR에 의해 Dox를 갖는 Cenpa-EARC 세포에서 Dox 제거 2일 후에, Cenpa 유전자 발현 수준을 결정하고, 야생형 마우스 ES 세포(C2)에서의 발현 수준과 비교하였다. 추정된 바와 같이, Cenpa 발현 수준은 Dox의 부재하에 Cenpa-EARC 세포에서 2일 동안 크게 감소한다.
도 22를 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 80시간 후에는, 세포 성장이 완전히 저지되었다.
실시예 6: Birc5 좌위에서 EARC 변형된 마우스 ES 세포의 생성
실시예 6에서, Birc5를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Birc5/BIRC5이다.
상기에서 기재된 바와 같이, Birc5/BIRC5는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Birc5 좌위에서 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Birc5의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에서 제거될 수 있다.
실시예 6에서, Birc5 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는 EARC 표적화 벡터의 작제
C57/B6 게놈 DNA로부터의 775 bp 단편을 PCR 증폭시키고(프라이머 Birc3F(SEQ ID NO: 119), Birc3R(SEQ ID NO: 120)), pGem-가교-단계3의 SbfI 및 NcoI로 클로닝함으로써, 3' 상동성 아암(SEQ ID NO: 118)을 클로닝하였다. 유사하게, 프라이머 Birc5F(SEQ ID NO: 122) 및 Birc5R PstI(SEQ ID NO: 123)를 사용하여, PCR에 의해 5' 상동성 아암(617 bp; SEQ ID NO: 121)을 증폭시키고, SpeI에 클로닝함으로써, pBridge-Birc5(SEQ ID NO: 124)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR/Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고 Birc5AF(SEQ ID NO: 125), Birc5AR(SEQ ID NO: 126), Birc5BF(SEQ ID NO: 127), Birc5BR(SEQ ID NO: 128)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-Birc5A(SEQ ID NO: 129) 및 px335-Birc5B(SEQ ID NO: 130)를 생성시켰다.
EARC 변형된 마우스 ES 세포의 생성
마우스 ES 세포 배양: 실시예 4에서와 같음.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-Birc5A 및 px335-Birc5B) 및 표적화 플라스미드(pBridge-Birc5)를 실시예 4에서와 같이, FuGENE HD(Clontech)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다.
유전자형 분석: 실시예 4에서와 같이 DNA를 추출하였다. Birc5 유전자의 5'에서 pBridge-Birc5의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 상동성 아암에 걸친 프라이머(프라이머 rttaRev(SEQ ID NO: 54), Birc_5scrF(SEQ ID NO: 131))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Birc5 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
정량적 PCR: 제조사의 프로토콜에 따라 GeneElute 총 RNA 미니프렙 키트(Sigma)를 사용하여, 1 μg/ml 및 0 μg/ml의 Dox로 2일 동안 처리한 세포로부터 총 RNA를 추출하였다. 제조사의 프로토콜에 따라 QuantiTect 역전사 키트(Qiagen)를 사용하여, 1 μg의 RNA의 역전사에 의해 cDNA를 생성시켰다. 실시간 qPCR을 SensiFast-SYBR qPCR 믹스(Bioline)를 사용하여, BioRad CFX 유전자증폭기에서 설정하였다. 사용된 프라이머는: qpcrbirc_F(SEQ ID NO: 132), qpcrbirc_R(SEQ ID NO: 133) 및 actBf(SEQ ID NO: 67), actBr(SEQ ID NO: 68)이었다. 결과를 ΔΔCT 방법으로 분석하고, 베타 액틴에 대하여 정상화하였다.
결과
도 23을 참조하면, 도 23a에 도시된 dox 가교 표적 벡터를 사용함으로써, 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 23b). 5개의 클론은, 재조합에 의해 Birc5의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 올바르게 표적화된 것(도 23b)으로 밝혀졌다. 이들 클론 중 하나는 Birc#3이었으며, Dox의 부재하에 성장이 중지되거나 사멸되는 것으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Birc5 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Birc5 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Birc5의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 24a).
도 24b를 참조하면, 본 발명자들은 qPCR에 의해 Dox를 갖는 Birc5-EARC 세포에서 Dox 제거 2일 후에, Birc5 유전자 발현 수준을 결정하고, 야생형 마우스 ES 세포(C2)에서의 발현 수준과 비교하였다. 추정된 바와 같이, Birc5 발현 수준은 Dox의 부재하에 Birc5-EARC 세포에서 2일 동안 크게 감소한다.
도 25를 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 50시간 후에는, 세포 성장이 완전히 저지되었다. 흥미롭게도, 더 저농도 Dox(0.5 및 0.05 μg/ml)가 더 고농도(1 μg/ml)보다 더 양호한 세포 성장을 촉진하는 것으로 나타난다.
실시예 7: Eef2 좌위에서 EARC 변형된 마우스 ES 세포의 생성
실시예 7에서, Eef2를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Eef2/EEF2이다.
상기에서 기재된 바와 같이, Eef2/EEF2는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Eef2 좌위에서 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Eef2의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에서 제거될 수 있다.
실시예 7에서, Eef2 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는 EARC 표적화 벡터의 작제
C57/B6 게놈 DNA로부터의 817 bp 단편(SEQ ID NO: 134)을 PCR 증폭시키고(프라이머 Eef2_5F(SEQ ID NO: 135) 및 Eef2_5R(SEQ ID NO: 136)), pGem-가교-단계3의 SbfI 및 SpeI로 클로닝함으로써, 5' 상동성 아암을 클로닝하였다. 유사하게, 프라이머 Eef2_3F(SEQ ID NO: 138), Eef2_3R(SEQ ID NO: 139)를 사용하여, PCR에 의해 3' 상동성 아암(826 bp; SEQ ID NO: 137)을 증폭시키고, SphI to에 클로닝함으로써, pBridge-Eef2(SEQ ID NO: 140)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR/Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고 Eef2aFWD(SEQ ID NO: 141), Eef2aREV(SEQ ID NO: 142), Eef2bFWD(SEQ ID NO: 143), Eef2bREV(SEQ ID NO: 144)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-Eef2A(SEQ ID NO: 145) 및 px335-Eef2B(SEQ ID NO: 146)를 생성시켰다.
EARC 변형된 마우스 ES 세포의 생성
마우스 ES 세포 배양: 실시예 4에서와 같음.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-Eef2A 및 px335-Eef2B) 및 표적화 플라스미드(pBridge-Eef2)를 실시예 4에서와 같이, FuGENE HD(Clontech)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다.
유전자형 분석: 실시예 4에서와 같이 DNA를 추출하였다. Eef2 유전자의 5'에서 pBridge-Eef2의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 상동성 아암에 걸친 프라이머(프라이머 rttaRev(SEQ ID NO: 54), Eef2_5scrF(SEQ ID NO: 147))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Eef2 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
결과
도 26을 참조하면, 도 26a에 도시된 dox 가교 표적 벡터를 사용함으로써, 여러 개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 26b). 이들 세포주 중 9개는 올바르게 표적화된 것(도 26b)으로 밝혀졌으며, 적어도 하나의 클론은 Dox-배지에서만 성장하였다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Eef2 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Eef2 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Eef2의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 27).
도 28을 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린의 부재 시에, 세포는 성장에 완전히 실패하였다.
본 개시는 특정의 구체적인 구현예를 참조하여 기재되었으나, 그의 다양한 변형이 당업자에게 명백할 것이다. 본 명세서에서 제공되는 임의의 실시예는 본 개시를 설명하기 위한 목적으로만 포함되며, 어떤 방식으로든 본 개시를 제한하려는 의도가 아니다. 본 명세서에서 제공되는 임의의 도면은 본 개시의 다양한 양태를 설명하기 위한 목적일 뿐이며, 어떤 방식으로든 본 개시의 규모를 도출하거나, 제한하려는 의도가 아니다. 본 명세서에 첨부된 청구범위의 범위는 상기 설명에서 제시된 바람직한 구현예들에 의해 제한되어서는 안되며, 전체적으로 본 명세서와 일치하는 가장 넓은 해석이 주어져야 한다. 본 명세서에 나열된 모든 선행 기술의 개시는 그 전문이 본 명세서에 참조로 포함된다.
표 2: 추정 CDL(ID는 EntrezGene 식별 번호를 지칭하고; CS 점수는 문헌[Wang et al., 2015]에 제공되는 CRISPR 점수 평균을 지칭하며; 기능은 공지되었거나, 추정된 좌위의 기능을 지칭하고, 추정은 GO 기간을 기반으로 하며, Gene Ontology Consortium 웹 사이트 http://geneontology.org/에서 제시된 바와 같고; 기능 범주는 GO 기간 추정된 기능을 기반으로 한 4가지 범주의 세포 기능을 지칭하며; CDL(기준)은, 본 발명자들이 유전자가 CDL이라는 것을 추정하는데 사용했던 정보를 지칭하며, 추정은 CS 점수, 이용 가능한 유전자 녹아웃(KO) 데이터, 유전자 기능 및 본 명세서에서 제공되는 실험 데이터를 기반으로 함).
Figure 112017098490451-pct00002
Figure 112017098490451-pct00003
Figure 112017098490451-pct00004
Figure 112017098490451-pct00005
Figure 112017098490451-pct00006
Figure 112017098490451-pct00007
Figure 112017098490451-pct00008
Figure 112017098490451-pct00009
Figure 112017098490451-pct00010
Figure 112017098490451-pct00011
Figure 112017098490451-pct00012
Figure 112017098490451-pct00013
Figure 112017098490451-pct00014
Figure 112017098490451-pct00015
Figure 112017098490451-pct00016
Figure 112017098490451-pct00017
Figure 112017098490451-pct00018
Figure 112017098490451-pct00019
Figure 112017098490451-pct00020
Figure 112017098490451-pct00021
Figure 112017098490451-pct00022
Figure 112017098490451-pct00023
Figure 112017098490451-pct00024
Figure 112017098490451-pct00025
Figure 112017098490451-pct00026
Figure 112017098490451-pct00027
Figure 112017098490451-pct00028
Figure 112017098490451-pct00029
Figure 112017098490451-pct00030
Figure 112017098490451-pct00031
Figure 112017098490451-pct00032
Figure 112017098490451-pct00033
Figure 112017098490451-pct00034
인용 문헌
Rossant J, Nagy A. Nature Biotechnology, Jan., pp. 23. (1999)
Thomson JA et al. Science. 282(5391):1145. (1998)
Takahashi K, Yamanaka S. Cell. 126(4):663. (2006)
Takahashi K et al. Cell. 131(5):861. (2007)
Hussein SM et al. Nature. 471(7336):58. (2011)
Laurent LC et al. Stem Cell. 8(1):106. (2011)
Lister R et al. Nature. 471(7336):68. (2011)
Yoshida Y, Yamanaka S. Circulation. 122(1):80. (2010)
Choo AB et al. STEM CELLS. 26(6):1454. (2008)
Tan HL et al. STEM CELLS. 27(8):1792. (2009)
Ben-David U, Nudel N, Benvenisty N. Nature Communications. 4:. (2013a)
Fong CY, Peh GSL, Gauthaman K, Bongso A. Stem Cell Rev and Rep. 5(1):72. (2009)
Tang C et al. Nature Biotechnology. 29(9):829. (2011)
Blum B, Bar-Nur O, Golan-Lev T, Benvenisty N. Nature Biotechnology. 27(3):281. (2009)
Menendez S et al. Aging Cell. 11(1):41. (2012)
Chung S et al. J Neurochem. 97(5):1467. (2006)
Eiges R et al. Current Biology. 11(7):514. (2001)
Huber I et al. The FASEB Journal. 21(10):2551. (2007)
Rong Z, Fu X, Wang M, Xu Y. Journal of Biological Chemistry. 287(39):32338. (2012)
Schuldiner M, Itskovitz-Eldor J, Benvenisty N. STEM CELLS. 21(3):257. (2003)
Ben-David U et al. Cell Stem Cell. 12(2):167. (2013b)
Dabir DV et al. Developmental Cell. 25(1):81. (2013)
Tohyama S et al. Stem Cell. 12(1):127. (2013)
Ghosh Z et al. Cancer Research. 71(14):5030. (2011)
Ben-David U, Benvenisty N. Nat Protoc. 9(3):729. (2014)
Lim T-T et al. PLoS ONE. 8(7):e70543. (2013)
Halloran PJ, Fenton RG. Cancer Research. 58(17):3855. (1998)
Tomicic MT, Thust R, Kaina B. Oncogene. 21(14):2141. (2002)
Di Stasi A et al. N Engl J Med. 365(18):1673. (2011)
Santamaria D et al. Nature. 448(7155):811. (2007)
Diril MK et al. Proceedings of the National Academy of Sciences. 109(10):3826. (2012)
Scognamiglio R et al. Cell. 164(4):668. (2016)
Fernandez-Miranda G et al. Development. 138(13):2661. (2011)
Pellettieri J, Sanchez Alvarado A. Annu. Rev. Genet. 41:83. (2007)
Bianconi E et al. Ann. Hum. Biol. 40(6):463. (2013)
Wang T et al. Science. 350(6264):1096. (2015)
Morgan DO. (2007)
FUNG T, POON R. Seminars in Cell and Developmental Biology. 16(3):335. (2005)
Peters J-M. Mol Cell. 9(5):931. (2002)
Fukagawa T. Front Biosci. 13(13):2705. (2007)
Cassimeris L. Current Opinion in Cell Biology. 11(1):134. (1999)
Satyanarayana A et al. Development. 135(20):3389. (2008)
Kittler R et al. Nature. 432(7020):1036. (2004)
Harborth J et al. J. Cell. Sci. 114(Pt 24):4557. (2001)
Silk AD, Holland AJ, Cleveland DW. The Journal of Cell Biology. 184(5):677. (2009)
Oda H et al. Molecular and Cellular Biology. 29(8):2278. (2009)
Liu Q et al. Genes & Development. 14(12):1448. (2000)
Martin-McCaffrey L et al. Developmental Cell. 7(5):763. (2004)
Uren AG et al. Curr. Biol. 10(21):1319. (2000)
Leung CG et al. J Exp Med. 204(7):1603. (2007)
Cutts SM et al. Human Molecular Genetics. 8(7):1145. (1999)
Howman EV et al. Proceedings of the National Academy of Sciences. 97(3):1148. (2000)
Chauviere M, Kress C, Kress M. Biochem Biophys Res Commun. 372(4):513. (2008)
Miura K et al. Biochem Biophys Res Commun. 341(1):132. (2006)
Magnaghi P et al. Nat Chem Biol. 9(9):548. (2013)
Smith ED et al. Molecular and Cellular Biology. 24(3):1168. (2004)
Morham SG, Kluckman KD, Voulomanos N, Smithies O. Molecular and Cellular Biology. 16(12):6804. (1996)
Akimitsu N et al. Genes Cells. 8(4):393. (2003)
Jeganathan K et al. The Journal of Cell Biology. 179(2):255. (2007)
Ono T et al. Cell. 115(1):109. (2003)
Bharadwaj R, Qi W, Yu H. J. Biol. Chem. 279(13):13076. (2004)
Parisi G, Fornasari MS, Echave J. FEBS Lett. 562(1-3):1. (2004)
Harborth J, Weber K, Osborn M. J. Biol. Chem. 275(41):31979. (2000)
Krull S et al. Mol. Biol. Cell. 15(9):4261. (2004)
Topper LM et al. Cell Cycle. 1(4):282. (2002)
Zhang Y-W et al. J. Biol. Chem. 284(27):18085. (2009)
Simmons AD et al. Human Molecular Genetics. 8(12):2155. (1999)
Plate M et al. Mol Cells. 29(4):355. (2010)
Franco M et al. Proceedings of the National Academy of Sciences. 95(17):9926. (1998)
Ohno M, Shimura Y. Genes & Development. 10(8):997. (1996)
Achsel T et al. EMBO J. 18(20):5789. (1999)
Shichijo S et al. J Exp Med. 187(3):277. (1998)
Jurica MS et al. RNA. 8(4):426. (2002)
Chari A et al. Cell. 135(3):497. (2008)
Xu C et al. J. Biol. Chem. 281(23):15900. (2006)
Yeh H et al. Genomics. 23(2):443. (1994)
Kokkola T et al. FEBS Lett. 585(17):2665. (2011)
Chan CC et al. RNA. 10(2):200. (2004)
Zhou M et al. Proceedings of the National Academy of Sciences. 105(47):18139. (2008)
Takatsu H et al. J. Biol. Chem. 273(38):24693. (1998)
Chen Y et al. Cell Research. 22(2):333. (2012)
Mansfeld J et al. Nat. Cell Biol. 13(10):1234. (2011)
He F, Wang C-T, Gou L-T. Genet. Mol. Res. 8(4):1466. (2009)
Lieu A-S et al. Int J Oncol. 37(2):429. (2010)
Preuß E et al. Human Gene Therapy. 21(8):929. (2010)
Neschadim A et al. Molecular Therapy. 20(5):1002. (2012)
Hedley D, Ogilvie L, Springer C. Nat Rev Cancer. 7(11):870. (2007)
Nawa A et al. Anticancer Agents Med Chem. 8(2):232. (2008)
Danks MK et al. Cancer Research. 67(1):22. (2007)
Shah K. Adv. Drug Deliv. Rev. 64(8):739. (2012)
Ramnaraine M et al. Cancer Research. 63(20):6847. (2003)
Denny WA. J. Biomed. Biotechnol. 2003(1):48. (2003)
Ireton GC, McDermott G, Black ME, Stoddard BL. J. Mol. Biol. 315(4):687. (2002)
Humerickhouse R et al. Cancer Research. 60(5):1189. (2000)
Wierdl M et al. Cancer Research. 61(13):5078. (2001)
Kojima A, Hackett NR, Ohwada A, Crystal RG. J. Clin. Invest. 101(8):1789. (1998)
Straathof KC et al. Blood. 105(11):4247. (2005)
Soucek L et al. Cancer Research. 62(12):3507. (2002)
Oricchio E et al. CellReports, pp. 1. (2014)
Olive M et al. J. Biol. Chem. 272(30):18586. (1997)
Urlinger S et al. Proceedings of the National Academy of Sciences. 97(14):7963. (2000)
Agha-Mohammadi S et al. J Gene Med. 6(7):817. (2004)
Gossen M et al. Science. 268(5218):1766. (1995)
Banaszynski LA et al. Cell. 126(5):995. (2006)
Maeder ML et al. Nature Methods. 10(3):243. (2013)
Pollock R, Clackson T. Current Opinion in Biotechnology. 13(5):459. (2002)
Mullick A et al. BMC Biotechnology. 6(1):43. (2006)
No D, Yao TP, Evans RM. Proceedings of the National Academy of Sciences. 93(8):3346. (1996)
Stanley SA et al. Nature Medicine. 21(1):92. (2015)
Rollins CT et al. Proceedings of the National Academy of Sciences. 97(13):7096. (2000)
Cong L et al. Science. 339(6121):819. (2013)
Hsu PD et al. Nature Biotechnology. 31(9):827. (2013)
Ran FA et al. Nat Protoc. 8(11):2281. (2013)
Gertsenstein M et al. PLoS ONE. 5(6):e11260. (2010)
Adewumi O et al. Nature Biotechnology. 25(7):803. (2007)
Guy CT, Cardiff RD, Muller WJ. Molecular and Cellular Biology. 12(3):954. (1992)
Szymczak AL et al. Nature Biotechnology. 22(5):589. (2004)
Nagy A. et al. Manipulating the Mouse Embryo. (2003)
SEQUENCE LISTING <110> Mount Sinai Hospital Nagy, Andras Monetti, Claudio Liang, Qin <120> TOOLS AND METHODS FOR USING CELL DIVISION LOCI TO CONTROL PROLIFERATION OF CELLS <130> 35941-2013 <150> US 62/130,258 <151> 2015-03-09 <150> US 62/130,270 <151> 2015-03-09 <160> 152 <170> PatentIn version 3.5 <210> 1 <211> 562 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 1 gtcgacggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60 gtggagtcca acccagggcc catggccagc tacccctgtc accagcacgc cagcgccttc 120 gaccaggccg ccagaagcag gggccacagc aaccggcgga ccgccctgag acccaggcgg 180 cagcaggaag ccaccgaagt ccggctggaa cagaagatgc ccaccctgtt aaccctagaa 240 agatagtctg cgtaaaattg acgcatgcat tcttgaaata ttgctctctc tttctaaata 300 gcgcgaatcc gtcgctgtgc atttaggaca tctcagtcgc cgcttggagc tcccgtgagg 360 cgtgcttgtc aatgcggtaa gtgtcactga ttttgaacta taacgaccgc gtgagtcaaa 420 atgacgcatg attatctttt acgtgacttt taagatttaa ctcatacgat aattatattg 480 ttatttcatg ttctacttac gtgataactt attatatata tattttcttg ttatagatat 540 cgtggcggcc gcattaccgc gg 562 <210> 2 <211> 2031 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 2 gtcgacatta ccgcgggttt tgttacttta tagaagaaat tttgagtttt tgtttttttt 60 taataaataa ataaacataa ataaattgtt tgttgaattt attattagta tgtaagtgta 120 aatataataa aacttaatat ctattcaaat taataaataa acctcgatat acagaccgat 180 aaaacacatg cgtcaatttt acgcatgatt atctttaacg tacgtcacaa tatgattatc 240 tttctagggt taagggtgta catcgacggc ccccacggca tgggcaagac caccaccacc 300 cagctgctgg tggccctggg cagccgggac gacatcgtgt acgtgcccga gcccatgacc 360 tactggcagg tgctgggcgc cagcgagacc atcgccaaca tctacaccac acagcacagg 420 ctggaccagg gcgagatctc tgccggcgac gccgccgtgg tgatgaccag cgcccagatc 480 acaatgggca tgccctacgc cgtgaccgac gccgtgctgg cccctcacgt gggcggcgag 540 gccggctcta gccacgcccc tccccctgcc ctgaccctga tcttcgaccg gcaccccatc 600 gcccacctgc tgtgctaccc tgccgccaga tacctgatgg gcagcatgac cccccaggcc 660 gtgctggcct tcgtggccct gatccccccc accctgcccg gcaccaacat cgtgctggga 720 gccctgcccg aggaccggca catcgaccgg ctggccaagc ggcagagacc cggcgagcgg 780 ctggacctgg ccatgctggc cgccatccgg cgggtgtacg gcctgctggc caacaccgtg 840 agatacctgc agggcggagg gtcttggtgg gaggactggg gccagctgtc cggcaccgcc 900 gtgccacctc agggcgccga gccccagagc aatgccggcc ctcggcccca catcggcgac 960 accctgttta ccctgttcag agcccccgag ctgctggccc ccaacggcga cctgtacaac 1020 gtgttcgcct gggccctgga cgtgctggcc aagaggctgc ggcccatgca cgtgttcatc 1080 ctggactacg accagagccc tgccggctgc agggacgccc tgctgcagct gaccagcggc 1140 atggtgcaga cccacgtgac cacccccggc agcatcccca ccatctgcga cctggcccgg 1200 accttcgccc gggagatggg cgaggccaac ggctccggag agggcagagg aagtctgcta 1260 acatgcggtg acgtcgagga gaatcctggc ccactcgaga tggccacaac catggtgagc 1320 aagggcgagg aggataacat ggccatcatc aaggagttca tgcgcttcaa ggtgcacatg 1380 gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac 1440 gagggcaccc agaccgccaa gctgaaggtg accaagggtg gccccctgcc cttcgcctgg 1500 gacatcctgt cccctcagtt catgtacggc tccaaggcct acgtgaagca ccccgccgac 1560 atccccgact acttgaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac 1620 ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga cggcgagttc 1680 atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt aatgcagaag 1740 aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg cgccctgaag 1800 ggcgagatca agcagaggct gaagctgaag gacggcggcc actacgacgc tgaggtcaag 1860 accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt caacatcaag 1920 ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga acgcgccgag 1980 ggccgccact ccaccggcgg catggacgag ctgtacaagg ctagcaagct t 2031 <210> 3 <211> 1848 <212> DNA <213> Artificial Sequence <220> <223> Plasmid DNA <400> 3 gcggccgcat ccaggcggcc gagatccgaa gttcctatac tatttgaaga ataggaactt 60 cagatccccc gggctgcagg atctaccggg taggggaggc gcttttccca aggcagtctg 120 gagcatgcgc tttagcagcc ccgctgggca cttggcgcta cacaagtggc ctctggcctc 180 gcacacattc cacatccacc ggtaggcgcc aaccggctcc gttctttggt ggccccttcg 240 cgccaccttc tactcctccc ctagtcagga agttcccccc cgccccgcag ctcgcgtcgt 300 gcaggacgtg acaaatggaa gtagcacgtc tcactagtct cgtgcagatg gacagcaccg 360 ctgagcaatg gaagcgggta ggcctttggg gcagcggcca atagcagctt tgctccttcg 420 ctttctgggc tcagaggctg ggaaggggtg ggtccggggg cgggctcagg ggcgggctca 480 ggggcggggc gggcgcccga aggtcctccg gaggcccggc attctgcacg cttcaaaagc 540 gcacgtctgc cgcgctgttc tcctcttcct catctccggg cctttcgacc tgcagcaatt 600 aatcatcggc atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg 660 gatcggccat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 720 tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 780 tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 840 aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 900 ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 960 ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 1020 caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 1080 atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 1140 acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 1200 ccgacggcga tgatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 1260 aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 1320 aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 1380 gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 1440 ttcttgacga gttcttctga tcgagaaatt gatgatctat taaacaataa agatgtccac 1500 atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac ctacattttg 1560 aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa tgcctgctct 1620 ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat atcataattt 1680 aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc tatagatccg 1740 gtcgacgaag ttcctatact atttgaagaa taggaacttc ggatctggcc ggcctaggga 1800 taacagggta atggatcccc cgggctgcag gaattcgata tcaagctt 1848 <210> 4 <211> 8003 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 4 ggtctacctt aagccaaggt agaaatactt ggttgaaaaa tgtttctgct gccaggcagt 60 ggcagcacac accagcactt ggggggacag aggcaggcag atctcttgag tttaaggcca 120 gcctagtcta tagagcaagt cctggaacac ccagggctac acagagaaac cttgtctcag 180 aaaaccaaac aaaaagttct gttctggtag tgttggctaa ctgctttttt attgccactt 240 cactcttgtt tgtgtggtct gtgaaaagga agacagaccc tttggcatct ttgtcagggg 300 agattgatgg cctgggggga cctccaggaa ggggcttatt gtagttttag gggttctcgt 360 ttctctgtgt tgaacttccg cagagctgtg cttcctcctg attggacctg ctgtgctcat 420 tcagatcaat taaaaggcag gttttgctgt gtgagggaga ttattgtgaa agatttagga 480 gccagcctac tctagctggg ggagggagca ctagggattg aaccccagtc tttggcccct 540 gttgcttggg tgtcctgtca ctgagctgtg cccttggccc tgtcatcagg ctttgtcagt 600 ggattcccat gtggttgtct gttttattat tttcctctgc aatggggctt gaaccatggg 660 ccacacacac acactcacac actctgctcc ttgttttgag aacgtctcac tgacttgccc 720 tggttggccc tgaggtcact ggcgtagata gactttggac ctgggactcc tacagcggcc 780 ttcccagtag taggtctaca gcaccagact aggttcctct ggtatttctg aaagggcatt 840 ggcttgtata atacaggaac attggcatct tgggaggtgt gagcctggag tctacagtgt 900 cggtcccctg tgtgtcattt ggattttgag gcagggtctc ctgtagccct gactggcctc 960 attctctggg tgctaagatt acacagatgt gtgccctgct ggggccctgg tcctgctcgt 1020 tttgcctgat agggaagcta gccacccact gagcagcctt ctcagtcctg tcttgtttat 1080 tcttttttat tttttcacag tttatgatat gactcgtctt taatggctgt aactgctgct 1140 gacctcattg cattgttcat tgaggtcatt cactattttg ataaataaac tgtagttcta 1200 aatcactaat catttgaatc ccctcctacc gctttggctt agatttcttt tcatttttct 1260 tttttttctt tttttttggt ttttttgaga cagggtttct ctgtgtagct ctggctgtcc 1320 tggaactcac tttgtagacc aggctggcct caaactctgc ctccagagtg ctggtattaa 1380 agttgtatgc cagccaggta tatgccaccc aggtatatgc cagccaggat atggctgctt 1440 tggtcctttg actttagaga tctgaaaagc aagaggtcta tggtacttac ccactaatga 1500 gcagaaatca gaaataaaat aggttcaact tagtaatttg catatagcta attgtctgaa 1560 gttcttggtg acacctgcac agcttcctaa aagacaaccg tgtgtggtct gtcctgtgcc 1620 aggtagtgac gctgtggtac cgatctccag aagtgttgct gggctcggct cgttactcca 1680 ctccggttga catctggagt atagggacca tatttgcaga actggccacc aagaagccgc 1740 ttttccacgg cgactcagag attgaccagc tcttcaggat cttcaggtaa ttgtgtttta 1800 tacctaagct gttaaaagcc tgtatggtta aaataataaa ggcaccgtgt atgtgatagg 1860 acttttgctt cctttcagag ctctgggcac tcctaacaac gaagtgtggc cagaagtcga 1920 gtccctgcag gactacaaga acacctttcc caagtggaag ccggggagcc tcgcatccca 1980 cgtcaagaac ctggacgaga acggcttgga tttgctctca gtaagtgagc tgttctttat 2040 ggttcgagcg tggtgccctt gggtgtcagt agtgacaggt aagggtgact ggatgtactc 2100 agtcctggac ttgtcagcac gaagacacag cagctgagtc ggatgcccgg taatcctgta 2160 gtgacagcga gctgcctttg aggtgtgaag tgcctggtgg tctgaggagc ctctggtgtt 2220 ggactttgtc atttacttct catccggtag gagaggctgg actcacacac cttcttgctt 2280 gagagtatgt tgatgagtta caatgactca ctcctctctg tttgctactg agccctcagt 2340 tcatcggttt acactgttga ctgcttagga tactgagctg ttcaggcttt tgacagcata 2400 actccattgc tcaggtctgg ccttgtttcc tcagaaaagc tagcaaagac taattaattc 2460 tgattttctt cagttgtctt ggtgcacaat attagcaatg caaagaacaa aattactgtt 2520 caggattaat aaaggtctcc tttaggaaat ttgctgtagg tagagcaggg tttaaaatct 2580 gagtttgtag aaggaatcaa gtagacgatt cagttggtct ttccgctccc ttgcaatcta 2640 taaacgatgc caccaaatgg ggctcagatt tgtccagacc cctacagctg tcacatagtt 2700 tgttacatat tggtattggc taacttagaa gccttcccgt agcctgggtc caatctgctg 2760 gtattatcta aagttattag ctctgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 2820 gtgtgtgtgt tgctgggggc tatggacaga aggcagagct ttcttgaggt ggtgtaggaa 2880 ggttggtcat tgactgttga ggcgcagccc tacttctcag tctttaaaca aaggacttca 2940 cttaacagac atcagttctg ggcaccaatt tcctctgttg agccaacacc ctgcaatagc 3000 taagcttgcc gtggccctgc tgcctgctga gcactgtggc tatcactgcc ctgtccccca 3060 ctccagcggc agactgctga gttagcaggg cctgtgtcta tcgcaggacc ccagaagcaa 3120 actgccccag ttggagacca ctggattatt gatgagactt ggcttcagtt tattttctcc 3180 cacattgatg gattcgggca agtttcttgc tgtccttgaa agacttggtg tcttaagcca 3240 aacagtgtgg cacatctttc tcatatgtct gtgcggactg acagacatat cctcaaggcc 3300 ttcatattta tttgtttgcc tttttaaaaa tttacttatt tattttacat atgcaaatac 3360 actgttgctg tcctcagaca cagtagaaga gggcatcgga tcccattaca gatggttgtg 3420 agccaccatg tggttgctgg gagttgaact caggacttct ggaagagtag tcatcgctct 3480 taattgctga gccatctctc cacctcctta atctattttc tctgaagata atatgcatga 3540 tcagatttaa gatctggagt atttaaatta gtttacaata attagtccat ctattataac 3600 tgtgtttata aaaatgctat ggggtttttc ctttgttggc ttgacgaagg ggttgtgtgg 3660 acactatcat gaaacactat aactgattgc tactttttca gttgtgaata acagatggac 3720 atttaatttc tagggtagat ataattagct agataatgtg aagatttatg ttttggtttt 3780 aagctgtctg ggtgcttatc ttataattta taacaggtta ccaaggtgtc tgtgtgtgat 3840 ttaagtatct tggagaggta aatagagggc aggcttctaa atttatttcc ctttttctct 3900 ctagaaaatg ctagtctatg atcctgccaa acgaatctct ggcaaaatgg ccctgaagca 3960 cccgtacttt gatgacttgg acaatcagat taagaagatg tagccctctg gatggatgtc 4020 cctgtctgct ggtcgtaggg gaagatcgtg ttgtttaccg ttggctctct tcctgtcttg 4080 tatagttttc tttgtttgta aactgtcatc tggacttttc ttaatttcct acgtataact 4140 taattaacat gtaaatatta ttccatatga atttaaatat aattctgtat atgtgcagat 4200 gtcactgtgg tggctgttaa ttactataac acaagtgtta attactacaa cataagactt 4260 gagtctccct agacttccca gcagccattc ctgcagctcg gagcacagtt gaaggagctg 4320 agctcaggcc tcgtgatgct ttcaagtgcc tccgtgttct ggatatatat gattcctggt 4380 cagtttcttg ccatttggaa actacaaccc acctacggac agtgtttttc tacttgtgct 4440 taagcagttg ggatgagaag gccaaagacc cgaggatgtc tagagtaatg acccccagat 4500 ggaagtgcac caaagctggc tgggtttcac agctagagat caggggctgt ccagagcagg 4560 acagcttaga acatttatga agactcccta tttttaggtt tgttgtaaag ctgttgtcta 4620 gttggattcc tgtgctctgc atggtcagag gtaggttaga ggatttgcct tggcttctaa 4680 atccaatttg aaaactgctt aaaatctcct gtcctctctt agcagtgtct aaaaatgtcc 4740 ttgtccaaat atttagctga gattcctcac tttggaaaag gagccgtatc gctgtgctgc 4800 ttagtgtaat tcttagaagc agcctgactt atctgctagc agtcaaaggg atgcctgaga 4860 cgactgctcc tcttagaact aaaggctggg atgcttaagt ttgtctactg tttggaggat 4920 ctcggtaaga ctgagcccct gttcctgtgg ccacctcagt ttaccagtac ctcagcctca 4980 gcctcctgca tttgctggag tcagggaagg tccccagccc tgagccctga cgctcctgat 5040 tgtagagact gtcagttgga ggtaaaacgt tcattgaagt agtcagcagc cacatgcatt 5100 tagggcactc cagtgtcaga gaccatcctg gaggtttcta accctgccgc tggcagtcta 5160 ctcccaagac agatcagtta gagtggtcag caaacaccaa ctgctgcaga aacctgtgtt 5220 ggtgtggttc cctgctgctg ctgggaactg ggcccaagac tagagagctt ggggctgcgg 5280 ttgatcatgg gttctgttcc tgcattacac cttgaaatcc aagccttcta atatctccct 5340 tcggatcata agttgtgaat ttggtcctcc gcccccgcca ggttttctat acttgggttt 5400 gtcttgctga cattttcaag agtcctgact aagacggtga ttagtgtgac atgacttgag 5460 aactaccgat ttgaagcaca cttgaagtta acaaattctc tcatgattat acttttaact 5520 ttttataaga ttgcttgagc tcacccagat ctctgttggg aagtaactgg gtaacaaaag 5580 ccgttgcact ggtttgacag ctaacaactg ttggtacttt gtattcagaa ggaatgaggt 5640 agcgattgaa tggctggggt gttgtttcca cagtttatac actaaaaatt tgggtagcca 5700 ggaggtagtg gcgcgcaatc tttaatctca gcagaggcag tcctatctct tgagttggag 5760 gccagcctgc ctgagttcca gaccagccag ggctacagga agaagtctta aaaaaatttt 5820 ttttccctgt ggatgtaaac ccatgagaat gactgctgta tctatcactt tctgtataat 5880 agaggtttct tccgccgcag cgctccattg gtctcagccc ctcatgttgg gggcgggaag 5940 gaggggcaag cgtccccaag cacaggaagg cctgctgaag agttggcggc tttgagggtt 6000 caaatcctgc ttgggtctga ggagtccccc aaacgatctt ggactgtaaa aacctgccag 6060 gaacaagcgc taagggatgg ttctcaacct gtgggtcgcg accccctggg gagttggaca 6120 gccctttcct gaggatcaga acaaacatcc tgcatatcag atattaacgt ggcatttcat 6180 aactgcaaac ttacagttag gaagtagcag tgacaaagaa ttttatgggt ggggtggggt 6240 gggggctcac caccatatta aagggttaca gcattaggag ggttgacaac agaaccatcg 6300 cactgaggga aagtgagtta gcacgaagag atgagcattt cccagaacac agaataagac 6360 acgtttaacc aacatcagtc tgtaacccca gcggactgtg acaagctctc acccatgccg 6420 tggagctcag aactagcatt gcacgctttt accccatctt tggttgcctc actccctttg 6480 agtagtaagt ccctcttcaa agtaatagcc tctaaacagc ctgctgcgca tgctctagtc 6540 ctttgctttc ctccacgggt aggccacagg cttaagcagc agttggaaat ggaacttggg 6600 ctttctggct cctggtttag aaaactcttg aaatggacaa gatttagtcc taggcaagtt 6660 ctgtgtagtc agcaatggaa gcaaaggggg gtggggcaaa cattccagtc aggtggaatc 6720 tgagcccttg agagtgtgag gcaggaggat cactaggcag gagttctcaa ccagcctaga 6780 cgacagcttg gaacccatcg cactccacaa tgaggacccc tcagcttctg aagagaggag 6840 agctgctagc tctgagaagg gtgtataaaa tgggcttttg gttcccagac atcagacttg 6900 aagaggcaac cgagtaagcc agctatagac taagtaagat tgtcgtacct agcctactcc 6960 ttgggagctc attcttcaga gtatgttgat ggatgaccta acgccatctc agatgctgga 7020 gcattttgct ggaaaggctc tcagcactag cgaggctgcc tcaatgtaat cctgcctcag 7080 cctgagaact gattatgagt taccgtttgg tactttatgt atttttctct cttcctagta 7140 accaaggaca aacctgcttc cttccagcca cgtggcagac actagctgta ctaaagtatt 7200 attacacacc ggtcccctgc tgccagaaca aagaactcag cctcgagaaa tttctcctat 7260 tatatttggg atccagcatg tcccaagaca gggacgactc aataatttaa tgtgcctaat 7320 ggcacggaat aaaaggatta ttcacaaaca gaaaaccgga cttaagcaga tgtttatttg 7380 aacacaaata ccataaccct ccttctcatg atgttcccaa ttacacgttg caacattttc 7440 acgaagaagc tctttctaaa acggccttct agggagcgaa taaacaggac tatatttggc 7500 taacagctgc ttctgaaaac tgagatgtca gcaaagcaag ctgttgttta aagaaaacta 7560 attacccagc taccttgggc ttggatgggg gtaaataacg ccctcccgtt tcttggcagt 7620 gatttgtctg ggattttaat actgttaaga ttttatttct cttcctccac ttctcctttg 7680 gatcaaatgg tttttaaagg attccttgtg ttcctgctgc caatggcgag tcctttgcgt 7740 ttgccgcccc tgcttcgtca ccaactgcta ttttgtttag tgcaaagcag tgtgtttaag 7800 gacacactaa actttagatg acccagtgac acagtgatcc gtatttgcaa gcgtctggtt 7860 atgcagatgt cattgtgttg tttatcagca atgtcagcaa tgtctttttt tttttttttt 7920 tatgcacagg ctttgaaact tattttggaa attcattcat tttgagggga ggcagtgagc 7980 tgggagttat acaatctctc ttt 8003 <210> 5 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 5 ccctgaagca cccgtacttt gatgacttgg acaatcagat taagaagatg 50 <210> 6 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 6 tagccctctg gatggatgtc cctgtctgct ggtcgtaggg gaagatcgtg 50 <210> 7 <211> 755 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 7 tgtggcacat ctttctcata tgtctgtgcg gactgacaga catatcctca aggccttcat 60 atttatttgt ttgccttttt aaaaatttac ttatttattt tacatatgca aatacactgt 120 tgctgtcctc agacacagta gaagagggca tcggatccca ttacagatgg ttgtgagcca 180 ccatgtggtt gctgggagtt gaactcagga cttctggaag agtagtcatc gctcttaatt 240 gctgagccat ctctccacct ccttaatcta ttttctctga agataatatg catgatcaga 300 tttaagatct ggagtattta aattagttta caataattag tccatctatt ataactgtgt 360 ttataaaaat gctatggggt ttttcctttg ttggcttgac gaaggggttg tgtggacact 420 atcatgaaac actataactg attgctactt tttcagttgt gaataacaga tggacattta 480 atttctaggg tagatataat tagctagata atgtgaagat ttatgttttg gttttaagct 540 gtctgggtgc ttatcttata atttataaca ggttaccaag gtgtctgtgt gtgatttaag 600 tatcttggag aggtaaatag agggcaggct tctaaattta tttccctttt tctctctaga 660 aaatgctagt ctatgatcct gccaaacgaa tctctggcaa aatggccctg aagcacccgt 720 actttgatga cttggacaat cagattaaga agatg 755 <210> 8 <211> 842 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 8 ccctctggat ggatgtccct gtctgctggt cgtaggggaa gatcgtgttg tttaccgttg 60 gctctcttcc tgtcttgtat agttttcttt gtttgtaaac tgtcatctgg acttttctta 120 atttcctacg tataacttaa ttaacatgta aatattattc catatgaatt taaatataat 180 tctgtatatg tgcagatgtc actgtggtgg ctgttaatta ctataacaca agtgttaatt 240 actacaacat aagacttgag tctccctaga cttcccagca gccattcctg cagctcggag 300 cacagttgaa ggagctgagc tcaggcctcg tgatgctttc aagtgcctcc gtgttctgga 360 tatatatgat tcctggtcag tttcttgcca tttggaaact acaacccacc tacggacagt 420 gtttttctac ttgtgcttaa gcagttggga tgagaaggcc aaagacccga ggatgtctag 480 agtaatgacc cccagatgga agtgcaccaa agctggctgg gtttcacagc tagagatcag 540 gggctgtcca gagcaggaca gcttagaaca tttatgaaga ctccctattt ttaggtttgt 600 tgtaaagctg ttgtctagtt ggattcctgt gctctgcatg gtcagaggta ggttagagga 660 tttgccttgg cttctaaatc caatttgaaa actgcttaaa atctcctgtc ctctcttagc 720 agtgtctaaa aatgtccttg tccaaatatt tagctgagat tcctcacttt ggaaaaggag 780 ccgtatcgct gtgctgctta gtgtaattct tagaagcagc ctgacttatc tgctagcagt 840 ca 842 <210> 9 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 9 tgtggcacat ctttctcata tgtctgtgcg 30 <210> 10 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 10 gaagcagcct gacttatctg ctagcagtca 30 <210> 11 <211> 2034 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 11 ggttctggcg tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60 tccaacccag ggcccataac ttcgtataat gtatgctata cgaagttatt aggtctgaag 120 aggagtttac gtccagccaa gctagcttgg ctgcaggtcg tcgacggtat cgataagctt 180 gatatcgaat ttcgagggcc cctgcaggtc aattctaccg ggtaggggag gcgcttttcc 240 caaggcagtc tggagcatgc gctttagcag ccccgctggc acttggcgct acacaagtgg 300 cctctggcct cgcacacatt ccacatccac cggtagcgcc aaccggctcc gttctttggt 360 ggccccttcg cgccaccttc tactcctccc ctagtcagga agttcccccc cgccccgcag 420 ctcgcgtcgt gcaggacgtg acaaatggaa gtagcacgtc tcactagtct cgtgcagatg 480 gacagcaccg ctgagcaatg gaagcgggta ggcctttggg gcagcggcca atagcagctt 540 tgctccttcg ctttctgggc tcagaggctg ggaaggggtg ggtccggggg cgggctcagg 600 ggcgggctca ggggcggggc gggcgcgaag gtcctcccga ggcccggcat tctcgcacgc 660 ttcaaaagcg cacgtctgcc gcgctgttct cctcttcctc atctccgggc ctttcgacct 720 gcagccaata tgggatcggc cattgaacaa gatggattgc acgcaggttc tccggccgct 780 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 840 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 900 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 960 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 1020 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 1080 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 1140 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 1200 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 1260 aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc ctgcttgccg 1320 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 1380 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 1440 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 1500 gccttctatc gccttcttga cgagttcttc tgaggggatc gatccgtcct gtaagtctgc 1560 agaaattgat gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca 1620 tactttgtta agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta 1680 cgggggtggg ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact 1740 attgctttat gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt 1800 aagggccagc tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca 1860 ttgtttttct cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag 1920 tttcatagcc tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta 1980 ttgttttgcc aagttctaat tccatcagaa gctgactcta gagcttggcg cgcc 2034 <210> 12 <211> 1971 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 12 ggcgcgccat aacttcgtat aatgtatgct atacgaagtt atctatggcc agctacccct 60 gtcaccagca cgccagcgcc ttcgaccagg ccgccagaag caggggccac agcaaccggc 120 ggaccgccct gagacccagg cggcagcagg aagccaccga agtccggctg gaacagaaga 180 tgcccaccct gttaagggtg tacatcgacg gcccccacgg catgggcaag accaccacca 240 cccagctgct ggtggccctg ggcagccggg acgacatcgt gtacgtgccc gagcccatga 300 cctactggca ggtgctgggc gccagcgaga ccatcgccaa catctacacc acacagcaca 360 ggctggacca gggcgagatc tctgccggcg acgccgccgt ggtgatgacc agcgcccaga 420 tcacaatggg catgccctac gccgtgaccg acgccgtgct ggcccctcac gtgggcggcg 480 aggccggctc tagccacgcc cctccccctg ccctgaccct gatcttcgac cggcacccca 540 tcgcccacct gctgtgctac cctgccgcca gatacctgat gggcagcatg accccccagg 600 ccgtgctggc cttcgtggcc ctgatccccc ccaccctgcc cggcaccaac atcgtgctgg 660 gagccctgcc cgaggaccgg cacatcgacc ggctggccaa gcggcagaga cccggcgagc 720 ggctggacct ggccatgctg gccgccatcc ggcgggtgta cggcctgctg gccaacaccg 780 tgagatacct gcagggcgga gggtcttggt gggaggactg gggccagctg tccggcaccg 840 ccgtgccacc tcagggcgcc gagccccaga gcaatgccgg ccctcggccc cacatcggcg 900 acaccctgtt taccctgttc agagcccccg agctgctggc ccccaacggc gacctgtaca 960 acgtgttcgc ctgggccctg gacgtgctgg ccaagaggct gcggcccatg cacgtgttca 1020 tcctggacta cgaccagagc cctgccggct gcagggacgc cctgctgcag ctgaccagcg 1080 gcatggtgca gacccacgtg accacccccg gcagcatccc caccatctgc gacctggccc 1140 ggaccttcgc ccgggagatg ggcgaggcca acggctccgg agagggcaga ggaagtctgc 1200 taacatgcgg tgacgtcgag gagaatcctg gcccactcga gatggccaca accatggtga 1260 gcaagggcga ggaggataac atggccatca tcaaggagtt catgcgcttc aaggtgcaca 1320 tggagggctc cgtgaacggc cacgagttcg agatcgaggg cgagggcgag ggccgcccct 1380 acgagggcac ccagaccgcc aagctgaagg tgaccaaggg tggccccctg cccttcgcct 1440 gggacatcct gtcccctcag ttcatgtacg gctccaaggc ctacgtgaag caccccgccg 1500 acatccccga ctacttgaag ctgtccttcc ccgagggctt caagtgggag cgcgtgatga 1560 acttcgagga cggcggcgtg gtgaccgtga cccaggactc ctccctgcag gacggcgagt 1620 tcatctacaa ggtgaagctg cgcggcacca acttcccctc cgacggcccc gtaatgcaga 1680 agaagaccat gggctgggag gcctcctccg agcggatgta ccccgaggac ggcgccctga 1740 agggcgagat caagcagagg ctgaagctga aggacggcgg ccactacgac gctgaggtca 1800 agaccaccta caaggccaag aagcccgtgc agctgcccgg cgcctacaac gtcaacatca 1860 agttggacat cacctcccac aacgaggact acaccatcgt ggaacagtac gaacgcgccg 1920 agggccgcca ctccaccggc ggcatggacg agctgtacaa gatctgaatt c 1971 <210> 13 <211> 1726 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 13 gcggccgcat ctagagtcga ccagcttctg atggaattag aacttggcaa aacaatactg 60 agaatgaagt gtatgtggaa cagaggctgc tgatctcgtt cttcaggcta tgaaactgac 120 acatttggaa accacagtac ttagaaccac aaagtgggaa tcaagagaaa aacaatgatc 180 ccacgagaga tctatagatc tatagatcat gagtgggagg aatgagctgg cccttaattt 240 ggttttgctt gtttaaatta tgatatccaa ctatgaaaca ttatcataaa gcaatagtaa 300 agagccttca gtaaagagca ggcatttatc taatcccacc ccacccccac ccccgtagct 360 ccaatccttc cattcaaaat gtaggtactc tgttctcacc cttcttaaca aagtatgaca 420 ggaaaaactt ccattttagt ggacatcttt attgtttaat agatcatcaa tttctgcatc 480 ccggggatct gatatcatcg atgcatgggg tcgtgcgctc ctttcggtcg ggcgctgcgg 540 gtcgtggggc gggcgtcagg caccgggctt gcgggtcatg caccaggtgc gcggtccttc 600 gggcacctcg acgtcggcgg tgacggtgaa gccgagccgc tcgtagaagg ggaggttgcg 660 gggcgcggag gtctccagga aggcgggcac cccggcgcgc tcggccgcct ccactccggg 720 gagcacgacg gcgctgccca gacccttgcc ctggtggtcg ggcgagacgc cgacggtggc 780 caggaaccac gcgggctcct tgggccggtg cggcgccagg aggccttcca tctgttgctg 840 cgcggccagc cgggaaccgc tcaactcggc catgcgcggg ccgatctcgg cgaacaccgc 900 ccccgcttcg acgctctccg gcgtggtcca gaccgccacc gcggcgccgt cgtccgcgac 960 ccacaccttg ccgatgtcga gcccgacgcg cgtgaggaag agttcttgca gctcggtgac 1020 ccgctcgatg tggcggtccg gatcgacggt gtggcgcgtg gcggggtagt cggcgaacgc 1080 ggcggcgagg gtgcgtacgg ccctggggac gtcgtcgcgg gtggcgaggc gcaccgtggg 1140 cttgtactcg gtcatggtaa gcttcagctg ctcgagatct agatggatgc aggtcgaaag 1200 gcccggagat gaggaagagg agaacagcgc ggcagacgtg cgcttttgaa gcgtgcagaa 1260 tgccgggcct ccggaggacc ttcgggcgcc cgccccgccc ctgagcccgc ccctgagccc 1320 gcccccggac ccaccccttc ccagcctctg agcccagaaa gcgaaggagc aaagctgcta 1380 ttggccgctg ccccaaaggc ctacccgctt ccattgctca gcggtgctgt ccatctgcac 1440 gagactagtg agacgtgcta cttccatttg tcacgtcctg cacgacgcga gctgcggggc 1500 gggggggaac ttcctgacta ggggaggagt agaaggtggc gcgaaggggc caccaaagaa 1560 cggagccggt tggcgcctac cggtggatgt ggaatgtgtg cgaggccaga ggccacttgt 1620 gtagcgccaa gtgcccagcg gggctgctaa agcgcatgct ccagactgcc ttgggaaaag 1680 cgcctcccct acccggtaga atttcgaggt cgacgaattc ggatcc 1726 <210> 14 <211> 847 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 14 gttacttccc ttcgagcctc aatgtcctca tttgtaaaat gacattaata cctactttta 60 gctgtgggaa ttgagtacca tgatttatac aaagcagttt gtatggtgct ggttacatga 120 gagttcagat ggtaactagt tagtaaaaaa tctctagtgt gcttgttgat tttattttat 180 tttagtattt cttaaagatc aaatttaaca tcaatcctaa actttattta gctttttctg 240 gcgcgtaaac taacatacta agttgtgtga ctataattca tttagtgact catttttagc 300 tatttttata acacattgtg ctatgggggg ttttggaact tgctggaagc tacatcagaa 360 actgccatag ttaattgcca tttcaagaat gttgtaaata actcaggtgg ccgtttaatt 420 ctcaatgtaa atataattaa ctagacgtct ttcctatatt tgtgtctcag ttttaaagct 480 atttctggat gcttgagtct taccgtaatt gataacaaaa agaggttatt gagaatatct 540 atgatttaca gagtaagtta ttctagacct caagagtgaa atgtagggga ggagacattt 600 gtgtgttaaa ctaatggaaa tgctcattta atagatattc actgaaagta ttagttttgg 660 tttattgcta gaaaagttga ggttttatgg agatttttgt aaaaaatggt ttatttccta 720 aataaatatc tctttttctt ttttctccca gaaaatgtta atctatgatc cagccaaacg 780 aatttctggc aaaatggcac tgaatcatcc atattttaat gatttggaca atcagattaa 840 gaagatg 847 <210> 15 <211> 4382 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 15 ggttctggcg tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60 tccaacccag ggcccatggc cagctacccc tgtcaccagc acgccagcgc cttcgaccag 120 gccgccagaa gcaggggcca cagcaaccgg cggaccgccc tgagacccag gcggcagcag 180 gaagccaccg aagtccggct ggaacagaag atgcccaccc tgttaaccct agaaagatag 240 tctgcgtaaa attgacgcat gcattcttga aatattgctc tctctttcta aatagcgcga 300 atccgtcgct gtgcatttag gacatctcag tcgccgcttg gagctcccgt gaggcgtgct 360 tgtcaatgcg gtaagtgtca ctgattttga actataacga ccgcgtgagt caaaatgacg 420 catgattatc ttttacgtga cttttaagat ttaactcata cgataattat attgttattt 480 catgttctac ttacgtgata acttattata tatatatttt cttgttatag atatcgtggc 540 ggccgcagat ccgaagttcc tatactattt gaagaatagg aacttcagat cccccgggct 600 gcaggatcta ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag 660 cagccccgct gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat 720 ccaccggtag gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc 780 ctcccctagt caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa 840 tggaagtagc acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc 900 gggtaggcct ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga 960 ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg 1020 cccgaaggtc ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc 1080 tgttctcctc ttcctcatct ccgggccttt cgacctgcag caattaatca tcggcatagt 1140 atatcggcat agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac 1200 aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 1260 gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 1320 gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 1380 cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 1440 tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 1500 catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 1560 atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 1620 cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 1680 ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc 1740 tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 1800 ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 1860 ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 1920 acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 1980 tctgatcgag aaattgatga tctattaaac aataaagatg tccacatgga agtttttcct 2040 gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 2100 gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 2160 tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 2220 aattaagggc cagctcattc ctcccactca tgatctatag atccggtcga cgaagttcct 2280 attcttcaaa tagtatagga acttcggatc tggccggcct agggataaca gggtaatgga 2340 tcccccgggc tgcaggaatt cgatatcaag ctgcgggttt tgttacttta tagaagaaat 2400 tttgagtttt tgtttttttt taataaataa ataaacataa ataaattgtt tgttgaattt 2460 attattagta tgtaagtgta aatataataa aacttaatat ctattcaaat taataaataa 2520 acctcgatat acagaccgat aaaacacatg cgtcaatttt acgcatgatt atctttaacg 2580 tacgtcacaa tatgattatc tttctagggt taagggtgta catcgacggc ccccacggca 2640 tgggcaagac caccaccacc cagctgctgg tggccctggg cagccgggac gacatcgtgt 2700 acgtgcccga gcccatgacc tactggcagg tgctgggcgc cagcgagacc atcgccaaca 2760 tctacaccac acagcacagg ctggaccagg gcgagatctc tgccggcgac gccgccgtgg 2820 tgatgaccag cgcccagatc acaatgggca tgccctacgc cgtgaccgac gccgtgctgg 2880 cccctcacgt gggcggcgag gccggctcta gccacgcccc tccccctgcc ctgaccctga 2940 tcttcgaccg gcaccccatc gcccacctgc tgtgctaccc tgccgccaga tacctgatgg 3000 gcagcatgac cccccaggcc gtgctggcct tcgtggccct gatccccccc accctgcccg 3060 gcaccaacat cgtgctggga gccctgcccg aggaccggca catcgaccgg ctggccaagc 3120 ggcagagacc cggcgagcgg ctggacctgg ccatgctggc cgccatccgg cgggtgtacg 3180 gcctgctggc caacaccgtg agatacctgc agggcggagg gtcttggtgg gaggactggg 3240 gccagctgtc cggcaccgcc gtgccacctc agggcgccga gccccagagc aatgccggcc 3300 ctcggcccca catcggcgac accctgttta ccctgttcag agcccccgag ctgctggccc 3360 ccaacggcga cctgtacaac gtgttcgcct gggccctgga cgtgctggcc aagaggctgc 3420 ggcccatgca cgtgttcatc ctggactacg accagagccc tgccggctgc agggacgccc 3480 tgctgcagct gaccagcggc atggtgcaga cccacgtgac cacccccggc agcatcccca 3540 ccatctgcga cctggcccgg accttcgccc gggagatggg cgaggccaac ggctccggag 3600 agggcagagg aagtctgcta acatgcggtg acgtcgagga gaatcctggc ccactcgaga 3660 tggccacaac catggtgagc aagggcgagg aggataacat ggccatcatc aaggagttca 3720 tgcgcttcaa ggtgcacatg gagggctccg tgaacggcca cgagttcgag atcgagggcg 3780 agggcgaggg ccgcccctac gagggcaccc agaccgccaa gctgaaggtg accaagggtg 3840 gccccctgcc cttcgcctgg gacatcctgt cccctcagtt catgtacggc tccaaggcct 3900 acgtgaagca ccccgccgac atccccgact acttgaagct gtccttcccc gagggcttca 3960 agtgggagcg cgtgatgaac ttcgaggacg gcggcgtggt gaccgtgacc caggactcct 4020 ccctgcagga cggcgagttc atctacaagg tgaagctgcg cggcaccaac ttcccctccg 4080 acggccccgt aatgcagaag aagaccatgg gctgggaggc ctcctccgag cggatgtacc 4140 ccgaggacgg cgccctgaag ggcgagatca agcagaggct gaagctgaag gacggcggcc 4200 actacgacgc tgaggtcaag accacctaca aggccaagaa gcccgtgcag ctgcccggcg 4260 cctacaacgt caacatcaag ttggacatca cctcccacaa cgaggactac accatcgtgg 4320 aacagtacga acgcgccgag ggccgccact ccaccggcgg catggacgag ctgtacaagt 4380 ag 4382 <210> 16 <211> 931 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 16 ctttctgaca aaaagtttcc atatgttata tcaacagata gttgtgtttt tattgttaac 60 tcttgtctat ttttgtctta tatatatttc tttgttatca aacttcagct gtacttcgtc 120 ttctaatttc aaaaatataa cttaaaaatg taaatattct atatgaattt aaatataatt 180 ctgtaaatgt gtgtaggtct cactgtaaca actatttgtt actataataa aactataata 240 ttgatgtcag gaatcaggaa aaaatttgag ttggcttaaa tcatctcagt ccttatggca 300 gttttatttt cctgtagttg gaactactaa aatttaggaa aatgctaagt tcaagtttcg 360 taatgctttg aagtattttt atgctctgaa tgtttaaatg ttctcatcag tttcttgcca 420 tgttgttaac tatacaacct ggctaaagat gaatattttt ctactggtat tttaattttt 480 gacctaaatg tttaagcatt cggaatgaga aaactataca gatttgagaa atgatgctaa 540 atttatagga gttttcagta acttaaaaag ctaacatgag agcatgccaa aatttgctaa 600 gtcttacaaa gatcaagggc tgtccgcaac agggaagaac agttttgaaa atttatgaac 660 tatcttattt ttaggtaggt tttgaaagct ttttgtctaa gtgaattctt atgccttggt 720 cagagtaata actgaaggag ttgcttatct tggctttcga gtctgagttt aaaactacac 780 attttgacat agtgtttatt agcagccatc taaaaaggct ctaatgtata tttaactaaa 840 attactagct ttgggaatta aactgtttaa caaataatgc tgctcattgt gattcttacc 900 tataagcagc ctaatttgaa ttatttgctg c 931 <210> 17 <211> 1623 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 17 accggtaggc gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct 60 cccctagtca ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg 120 gaagtagcac gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg 180 gtaggccttt ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg 240 ctgggaaggg gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc 300 cgaaggtcct ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg 360 ttctcctctt cctcatctcc gggcctttcg acctgcatcc atctagatct cgagcagctg 420 aagcttacca tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 480 agggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 540 gatccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 600 gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 660 acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 720 ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 780 cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 840 ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 900 gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 960 gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 1020 ggtgcctgac gcccgcccca cgacccgcag cgcccgaccg aaaggagcgc acgaccccat 1080 gcatcgatga tatcagatcc ccgggatgca gaaattgatg atctattaaa caataaagat 1140 gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 1200 ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 1260 tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 1320 atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 1380 tatagatcta tagatctctc gtgggatcat tgtttttctc ttgattccca ctttgtggtt 1440 ctaagtactg tggtttccaa atgtgtcagt ttcatagcct gaagaacgag atcagcagcc 1500 tctgttccac atacacttca ttctcagtat tgttttgcca agttctaatt ccatcagaag 1560 ctggtcgact ctagatgcgg cgaagttcct attcttcaaa tagtatagga acttcggccg 1620 gcc 1623 <210> 18 <211> 3990 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 18 ggatccggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60 gtggagtcca acccagggcc cataacttcg tataatgtat gctatacgaa gttattaggt 120 ctgaagagga gtttacgtcc agccaagcta gcttggctgc aggtcgtcga cggtatcgat 180 aagcttgata tcgagggccc ctgcaggtca attctaccgg gtaggggagg cgcttttccc 240 aaggcagtct ggagcatgcg ctttagcagc cccgctgggc acttggcgct acacaagtgg 300 cctctggcct cgcacacatt ccacatccac cggtaggcgc caaccggctc cgttctttgg 360 tggccccttc gcgccacctt ctactcctcc cctagtcagg aagttccccc ccgccccgca 420 gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt ctcactagtc tcgtgcagat 480 ggacagcacc gctgagcaat ggaagcgggt aggcctttgg ggcagcggcc aatagcagct 540 ttgctccttc gctttctggg ctcagaggct gggaaggggt gggtccgggg gcgggctcag 600 gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc cgaggcccgg cattctgcac 660 gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc tcatctccgg gcctttcgac 720 ctgcagccaa tatgggatcg gccattgaac aagatggatt gcacgcaggt tctccggccg 780 cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 840 ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 900 ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg 960 gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 1020 tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 1080 ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 1140 accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 1200 atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 1260 tcaaggcgcg catgcccgac ggcgatgatc tcgtcgtgac ccatggcgat gcctgcttgc 1320 cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 1380 tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 1440 gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 1500 tcgccttcta tcgccttctt gacgagttct tctgagggga tcgatccgct gtaagtctgc 1560 agaaattgat gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca 1620 tactttgtta agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta 1680 cgggggtggg ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact 1740 attgctttat gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt 1800 aagggccagc tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca 1860 ttgtttttct cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag 1920 tttcatagcc tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta 1980 ttgttttgcc aagttctaat tccatcagaa gctgactcta gagcttggcg cgccataact 2040 tcgtataatg tatgctatac gaagttatct atggccagct acccctgtca ccagcacgcc 2100 agcgccttcg accaggccgc cagaagcagg ggccacagca accggcggac cgccctgaga 2160 cccaggcggc agcaggaagc caccgaagtc cggctggaac agaagatgcc caccctgtta 2220 agggtgtaca tcgacggccc ccacggcatg ggcaagacca ccaccaccca gctgctggtg 2280 gccctgggca gccgggacga catcgtgtac gtgcccgagc ccatgaccta ctggcaggtg 2340 ctgggcgcca gcgagaccat cgccaacatc tacaccacac agcacaggct ggaccagggc 2400 gagatctctg ccggcgacgc cgccgtggtg atgaccagcg cccagatcac aatgggcatg 2460 ccctacgccg tgaccgacgc cgtgctggcc cctcacgtgg gcggcgaggc cggctctagc 2520 cacgcccctc cccctgccct gaccctgatc ttcgaccggc accccatcgc ccacctgctg 2580 tgctaccctg ccgccagata cctgatgggc agcatgaccc cccaggccgt gctggccttc 2640 gtggccctga tcccccccac cctgcccggc accaacatcg tgctgggagc cctgcccgag 2700 gaccggcaca tcgaccggct ggccaagcgg cagagacccg gcgagcggct ggacctggcc 2760 atgctggccg ccatccggcg ggtgtacggc ctgctggcca acaccgtgag atacctgcag 2820 ggcggagggt cttggtggga ggactggggc cagctgtccg gcaccgccgt gccacctcag 2880 ggcgccgagc cccagagcaa tgccggccct cggccccaca tcggcgacac cctgtttacc 2940 ctgttcagag cccccgagct gctggccccc aacggcgacc tgtacaacgt gttcgcctgg 3000 gccctggacg tgctggccaa gaggctgcgg cccatgcacg tgttcatcct ggactacgac 3060 cagagccctg ccggctgcag ggacgccctg ctgcagctga ccagcggcat ggtgcagacc 3120 cacgtgacca cccccggcag catccccacc atctgcgacc tggcccggac cttcgcccgg 3180 gagatgggcg aggccaacgg ctccggagag ggcagaggaa gtctgctaac atgcggtgac 3240 gtcgaggaga atcctggccc actcgagatg gccacaacca tggtgagcaa gggcgaggag 3300 gataacatgg ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg 3360 aacggccacg agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag 3420 accgccaagc tgaaggtgac caagggtggc cccctgccct tcgcctggga catcctgtcc 3480 cctcagttca tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac 3540 ttgaagctgt ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc 3600 ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg gcgagttcat ctacaaggtg 3660 aagctgcgcg gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc 3720 tgggaggcct cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag 3780 cagaggctga agctgaagga cggcggccac tacgacgctg aggtcaagac cacctacaag 3840 gccaagaagc ccgtgcagct gcccggcgcc tacaacgtca acatcaagtt ggacatcacc 3900 tcccacaacg aggactacac catcgtggaa cagtacgaac gcgccgaggg ccgccactcc 3960 accggcggca tggacgagct gtacaagtag 3990 <210> 19 <211> 3860 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 19 ggatccggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60 gtggagtcca acccagggcc cataacttcg tataatgtat gctatacgaa gttattaggt 120 ctgaagagga gtttacgtcc agccaagcta gcttggctgc aggtcgtcga cggtatcggc 180 cgcatctaga gtcgaccagc ttctgatgga attagaactt ggcaaacaat actgagaatg 240 aagtgtatgt ggaacagagg ctgctgatct cgttcttcag gctatgaaac tgacacattt 300 ggaaaccaca gtacttagaa ccacaaagtg ggaatcaaga gaaaaacaat gatcccacga 360 gagatctata gatctataga tcatgagtgg gaggaatgag ctggccctta atttggtttt 420 gcttgtttaa attatgatat ccaactatga aacattatca taaagcaata gtaaagagcc 480 ttcagtaaag agcaggcatt tatctaatcc caccccaccc ccacccccgt agctccaatc 540 cttccattca aaatgtaggt actctgttct cacccttctt aacaaagtat gacaggaaaa 600 acttccattt tagtggacat ctttattgtt taatagatca tcaatttctg catcccgggg 660 atctgatatc atcgatgcat ggggtcgtgc gctcctttcg gtcgggcgct gcgggtcgtg 720 gggcgggcgt caggcaccgg gcttgcgggt catgcaccag gtgcgcggtc cttcgggcac 780 ctcgacgtcg gcggtgacgg tgaagccgag ccgctcgtag aaggggaggt tgcggggcgc 840 ggaggtctcc aggaaggcgg gcaccccggc gcgctcggcc gcctccactc cggggagcac 900 gacggcgctg cccagaccct tgccctggtg gtcgggcgag acgccgacgg tggccaggaa 960 ccacgcgggc tccttgggcc ggtgcggcgc caggaggcct tccatctgtt gctgcgcggc 1020 cagccgggaa ccgctcaact cggccatgcg cgggccgatc tcggcgaaca ccgcccccgc 1080 ttcgacgctc tccggcgtgg tccagaccgc caccgcggcg ccgtcgtccg cgacccacac 1140 cttgccgatg tcgagcccga cgcgcgtgag gaagagttct tgcagctcgg tgacccgctc 1200 gatgtggcgg tccggatcga cggtgtggcg cgtggcgggg tagtcggcga acgcggcggc 1260 gagggtgcgt acggccctgg ggacgtcgtc gcgggtggcg aggcgcaccg tgggcttgta 1320 ctcggtcatg gtaagcttca gctgctcgag atctagatgg atgcaggtcg aaaggcccgg 1380 agatgaggaa gaggagaaca gcgcggcaga cgtgcgcttt tgaagcgtgc agaatgccgg 1440 gcctccggag gaccttcggg cgcccgcccc gcccctgagc ccgcccctga gcccgccccc 1500 ggacccaccc cttcccagcc tctgagccca gaaagcgaag gagcaaagct gctattggcc 1560 gctgccccaa aggcctaccc gcttccattg ctcagcggtg ctgtccatct gcacgagact 1620 agtgagacgt gctacttcca tttgtcacgt cctgcacgac gcgagctgcg gggcgggggg 1680 gaacttcctg actaggggag gagtagaagg tggcgcgaag gggccaccaa agaacggagc 1740 cggttggcgc ctaccggtgg atgtggaatg tgtgcgaggc cagaggccac ttgtgtagcg 1800 ccaagtgccc agcggggctg ctaaagcgca tgctccagac tgccttggga aaagcgcctc 1860 ccctacccgg tagaatttcg aggtcgacga attcggatcg cgccataact tcgtataatg 1920 tatgctatac gaagttatct atggccagct acccctgtca ccagcacgcc agcgccttcg 1980 accaggccgc cagaagcagg ggccacagca accggcggac cgccctgaga cccaggcggc 2040 agcaggaagc caccgaagtc cggctggaac agaagatgcc caccctgtta agggtgtaca 2100 tcgacggccc ccacggcatg ggcaagacca ccaccaccca gctgctggtg gccctgggca 2160 gccgggacga catcgtgtac gtgcccgagc ccatgaccta ctggcaggtg ctgggcgcca 2220 gcgagaccat cgccaacatc tacaccacac agcacaggct ggaccagggc gagatctctg 2280 ccggcgacgc cgccgtggtg atgaccagcg cccagatcac aatgggcatg ccctacgccg 2340 tgaccgacgc cgtgctggcc cctcacgtgg gcggcgaggc cggctctagc cacgcccctc 2400 cccctgccct gaccctgatc ttcgaccggc accccatcgc ccacctgctg tgctaccctg 2460 ccgccagata cctgatgggc agcatgaccc cccaggccgt gctggccttc gtggccctga 2520 tcccccccac cctgcccggc accaacatcg tgctgggagc cctgcccgag gaccggcaca 2580 tcgaccggct ggccaagcgg cagagacccg gcgagcggct ggacctggcc atgctggccg 2640 ccatccggcg ggtgtacggc ctgctggcca acaccgtgag atacctgcag ggcggagggt 2700 cttggtggga ggactggggc cagctgtccg gcaccgccgt gccacctcag ggcgccgagc 2760 cccagagcaa tgccggccct cggccccaca tcggcgacac cctgtttacc ctgttcagag 2820 cccccgagct gctggccccc aacggcgacc tgtacaacgt gttcgcctgg gccctggacg 2880 tgctggccaa gaggctgcgg cccatgcacg tgttcatcct ggactacgac cagagccctg 2940 ccggctgcag ggacgccctg ctgcagctga ccagcggcat ggtgcagacc cacgtgacca 3000 cccccggcag catccccacc atctgcgacc tggcccggac cttcgcccgg gagatgggcg 3060 aggccaacgg ctccggagag ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga 3120 atcctggccc actcgagatg gccacaacca tggtgagcaa gggcgaggag gataacatgg 3180 ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg aacggccacg 3240 agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag accgccaagc 3300 tgaaggtgac caagggtggc cccctgccct tcgcctggga catcctgtcc cctcagttca 3360 tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac ttgaagctgt 3420 ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc ggcgtggtga 3480 ccgtgaccca ggactcctcc ctgcaggacg gcgagttcat ctacaaggtg aagctgcgcg 3540 gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct 3600 cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag cagaggctga 3660 agctgaagga cggcggccac tacgacgctg aggtcaagac cacctacaag gccaagaagc 3720 ccgtgcagct gcccggcgcc tacaacgtca acatcaagtt ggacatcacc tcccacaacg 3780 aggactacac catcgtggaa cagtacgaac gcgccgaggg ccgccactcc accggcggca 3840 tggacgagct gtacaagtag 3860 <210> 20 <211> 4848 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 20 tccaccggcg gcatggacga gctgtacaag tagctttctg acaaaaagtt tccatatgtt 60 atgtcaacag atagttgtgt ttttattgtt aactcttgtc tatttttgtc ttatatatat 120 ttctttgtta tcaaacttca gctgtacttc gtcttctaat ttcaaaaata taacttaaaa 180 atgtaaatat tctatatgaa tttaaatata attctgtaaa tgtgtgtagg tctcactgta 240 acaactattt gttactataa taaaactata atattgatgt caggaatcag gaaaaaattt 300 gagttggctt aaatcatctc agtccttatg gcagttttat tttcctgtag ttggaactac 360 taaaatttag gaaaatgcta agttcaagtt tcgtaatgct ttgaagtatt tttatgctct 420 gaatgtttaa atgttctcat cagtttcttg ccatgttgtt aactatacaa cctggctaaa 480 gatgaatatt tttctactgg tattttaatt tttgacctaa atgtttaagc attcggaatg 540 agaaaactat acagatttga gaaatgatgc taaatttata ggagttttca gtaacttaaa 600 aagctaacat gagagcatgc caaaatttgc taagtcttac aaagatcaag ggctgtccgc 660 aacagggaag aacagttttg aaaatttatg aactatctta tttttaggta ggttttgaaa 720 gctttttgtc taagtgaatt cttatgcctt ggtcagagta ataactgaag gaggtgctta 780 tcttggcttt cgagtctgag tttaaaacta cacattttga catagtgttt attagcagcc 840 atctaaaaag gctctaatgt atatttaact aaaattacta gctttgggaa ttaaactgtt 900 taacaaataa tgctgctcat tgtgattctt acctataagc agcctaattt gaattatttg 960 ctgcaatcga attcccgcgg ccgccatggc ggccgggagc atgcgacgtc gggcccaatt 1020 cgccctatag tgagtcgtat tacaattcac tggccgtcgt tttacaacgt cgtgactggg 1080 aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc 1140 gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg 1200 aatggacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 1260 gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 1320 cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 1380 atttagtgct ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag 1440 tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 1500 tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga 1560 tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 1620 atttaacgcg aattttaaca aaatattaac gcttacaatt tcctgatgcg gtattttctc 1680 cttacgcatc tgtgcggtat ttcacaccgc atcaggtggc acttttcggg gaaatgtgcg 1740 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 1800 ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 1860 ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 1920 aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 1980 actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2040 gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2100 agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2160 cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2220 catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2280 aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2340 gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 2400 aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2460 agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2520 ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 2580 actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 2640 aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 2700 gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 2760 atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 2820 tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 2880 tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 2940 ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 3000 agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 3060 ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 3120 tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 3180 gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 3240 cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 3300 ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 3360 agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 3420 tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 3480 ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 3540 ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 3600 ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa 3660 accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga 3720 ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc 3780 ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca 3840 atttcacaca ggaaacagct atgaccatga ttacgccaag ctatttaggt gacactatag 3900 aatactcaag ctatgcatcc aacgcgttgg gagctctccc atatggtcga cctgcaggcg 3960 gccgcgaatt cactagtgat tgttacttcc cttcgagcct caatgtcctc atttgtaaaa 4020 tgacattaat acctactttt agctgtggga attgagtacc atgatttata caaagcagtt 4080 tgtatggtgc tggttacatg agagttcaga tggtaactag ttagtaaaaa atctctagtg 4140 tgcttgttga ttttatttta ttttagtatt tcttaaagat caaatttaac atcaatccta 4200 aactttattt agctttttct ggcgtgtaaa ctaacatact aagttgtgtg actataattc 4260 atttagtgac tcatttttag ctatttttat aacacattgt gctatggggg gttttggaac 4320 ttgctggaag ctacatcaga aactgccata gttaattgcc atttcaagaa tgttgtaaat 4380 aactcaggtg gccgtttaat tctcaatgta aatataatta actagacatc tttcctatat 4440 ttgtgtctca gttttaaagc tatttctgga tgcttgagtc ttaccgtaat tgataacaaa 4500 aagaggttat tgagaatatc tatgatttac agagtaagtt attctagacc tcaagagtga 4560 aatgtagggg aggagacatt tgtgtgttaa actaatggaa atgctcattt aatagatatt 4620 cactgaaagt attagttttg gtttattgct agaaaagttg aggttttatg gagatttttg 4680 taaaaaatgg tttatttcct aaataaatat ctctttttct tttttctccc agaaaatgtt 4740 aatctatgat ccagccaaac gaatttctgg caaaatggca ctgaatcatc catattttaa 4800 tgatttggac aatcagatta agaagatggg atccggttct ggcgtgaa 4848 <210> 21 <211> 8507 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 21 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg taagaagatg tagccctcgt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360 tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420 caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480 cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140 gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200 cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catggactat 1260 aaggaccacg acggagacta caaggatcat gatattgatt acaaagacga tgacgataag 1320 atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 1380 tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 1440 tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 1500 aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 1560 aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 1620 atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 1680 ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 1740 gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 1800 agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 1860 cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 1920 ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 1980 ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 2040 ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 2100 agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 2160 cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 2220 cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 2280 atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 2340 tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 2400 gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 2460 ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 2520 ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 2580 ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 2640 cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 2700 accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 2760 atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 2820 ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 2880 gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 2940 accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 3000 aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 3060 aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 3120 gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 3180 gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 3240 ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 3300 gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 3360 aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 3420 tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 3480 aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 3540 gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 3600 gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 3660 agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 3720 gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 3780 cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 3840 gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 3900 agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 3960 ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 4020 cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 4080 agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 4140 cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 4200 gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 4260 gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 4320 cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 4380 gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 4440 agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 4500 tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 4560 acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 4620 aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 4680 ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 4740 gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 4800 gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 4860 gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 4920 aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 4980 gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 5040 gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 5100 ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 5160 tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 5220 gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 5280 caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 5340 aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 5400 gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 5460 ctgggaggcg acaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 5520 taagaattcc tagagctcgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg 5580 ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 5640 cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 5700 gtggggtggg gcaggacagc aagggggagg attgggaaga gaatagcagg catgctgggg 5760 agcggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 5820 tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 5880 tgagcgagcg agcgcgcagc tgcctgcagg ggcgcctgat gcggtatttt ctccttacgc 5940 atctgtgcgg tatttcacac cgcatacgtc aaagcaacca tagtacgcgc cctgtagcgg 6000 cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc 6060 cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc 6120 ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct 6180 cgaccccaaa aaacttgatt tgggtgatgg ttcacgtagt gggccatcgc cctgatagac 6240 ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac 6300 tggaacaaca ctcaacccta tctcgggcta ttcttttgat ttataaggga ttttgccgat 6360 ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa 6420 aatattaacg tttacaattt tatggtgcac tctcagtaca atctgctctg atgccgcata 6480 gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 6540 cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 6600 ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 6660 ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt 6720 gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 6780 acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 6840 tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 6900 agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 6960 cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 7020 aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg 7080 gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 7140 agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 7200 aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 7260 gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 7320 ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc 7380 aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 7440 aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 7500 tggctggttt attgctgata aatctggagc cggtgagcgt ggaagccgcg gtatcattgc 7560 agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 7620 ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 7680 ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 7740 ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 7800 acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 7860 agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 7920 ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 7980 cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 8040 gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 8100 cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 8160 gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 8220 caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 8280 aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 8340 tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 8400 gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 8460 ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgt 8507 <210> 22 <211> 8507 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 22 catatacgat acaaggctgt tagagagata attggaatta atttgactgt aaacacaaag 60 atattagtac aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta 120 aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc 180 ttggctttat atatcttgtg gaaaggacga aacaccgaca gggacatcca tccaggtttt 240 agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 300 cgagtcggtg cttttttgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 360 ttttagcgcg tgcgccaatt ctgcagacaa atggctctag aggtacccgt tacataactt 420 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaatagta 480 acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 540 ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 600 aaatggcccg cctggcattg tgcccagtac atgaccttat gggactttcc tacttggcag 660 tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc 720 actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 780 ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg 840 ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg 900 ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc 960 gcgcggcggg cgggagtcgc tgcgacgctg ccttcgcccc gtgccccgct ccgccgccgc 1020 ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga gcgggcggga 1080 cggcccttct cctccgggct gtaattagct gagcaagagg taagggttta agggatggtt 1140 ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca 1200 ggttggaccg gtgccaccat ggactataag gaccacgacg gagactacaa ggatcatgat 1260 attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa ggtcggtatc 1320 cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg caccaactct 1380 gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt caaggtgctg 1440 ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct gttcgacagc 1500 ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata caccagacgg 1560 aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa ggtggacgac 1620 agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa gcacgagcgg 1680 caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta ccccaccatc 1740 taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg gctgatctat 1800 ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg cgacctgaac 1860 cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta caaccagctg 1920 ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct gtctgccaga 1980 ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga gaagaagaat 2040 ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt caagagcaac 2100 ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga cgacgacctg 2160 gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc cgccaagaac 2220 ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat caccaaggcc 2280 cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct gaccctgctg 2340 aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt cgaccagagc 2400 aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt ctacaagttc 2460 atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa gctgaacaga 2520 gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca ccagatccac 2580 ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt cctgaaggac 2640 aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt gggccctctg 2700 gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac catcaccccc 2760 tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat cgagcggatg 2820 accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag cctgctgtac 2880 gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga gggaatgaga 2940 aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct gttcaagacc 3000 aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat cgagtgcttc 3060 gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg cacataccac 3120 gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa cgaggacatt 3180 ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat cgaggaacgg 3240 ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa gcggcggaga 3300 tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga caagcagtcc 3360 ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa cttcatgcag 3420 ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca ggtgtccggc 3480 cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc cattaagaag 3540 ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg ccggcacaag 3600 cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa gggacagaag 3660 aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg cagccagatc 3720 ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta cctgtactac 3780 ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg gctgtccgac 3840 tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat cgacaacaag 3900 gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc cgaagaggtc 3960 gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat tacccagaga 4020 aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga taaggccggc 4080 ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc acagatcctg 4140 gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga agtgaaagtg 4200 atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt ttacaaagtg 4260 cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt cgtgggaacc 4320 gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga ctacaaggtg 4380 tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc taccgccaag 4440 tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct ggccaacggc 4500 gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat cgtgtgggat 4560 aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt gaatatcgtg 4620 aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc caagaggaac 4680 agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg cggcttcgac 4740 agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg caagtccaag 4800 aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag cagcttcgag 4860 aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa ggacctgatc 4920 atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag aatgctggcc 4980 tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata tgtgaacttc 5040 ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa tgagcagaaa 5100 cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca gatcagcgag 5160 ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc cgcctacaac 5220 aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct gtttaccctg 5280 accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga ccggaagagg 5340 tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat caccggcctg 5400 tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc ggccacgaaa 5460 aaggccggcc aggcaaaaaa gaaaaagtaa gaattcctag agctcgctga tcagcctcga 5520 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 5580 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 5640 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 5700 gggaagagaa tagcaggcat gctggggagc ggccgcagga acccctagtg atggagttgg 5760 ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 5820 gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc 5880 gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atacgtcaaa 5940 gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 6000 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 6060 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 6120 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg gtgatggttc 6180 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 6240 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cgggctattc 6300 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 6360 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat ggtgcactct 6420 cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 6480 tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt 6540 ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa 6600 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 6660 gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 6720 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 6780 aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 6840 attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 6900 tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 6960 gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 7020 cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 7080 tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 7140 agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 7200 tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 7260 tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 7320 tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 7380 acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 7440 accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 7500 tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 7560 cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 7620 tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 7680 actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 7740 tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 7800 cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 7860 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 7920 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt 7980 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 8040 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 8100 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 8160 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 8220 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 8280 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 8340 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 8400 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 8460 ttttgctcac atgtgagggc ctatttccca tgattccttc atatttg 8507 <210> 23 <211> 35 <212> DNA <213> Mus musculus <400> 23 acagggacat ccatccagag ggctacatct tctta 35 <210> 24 <211> 8509 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 24 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg ctatctgttg acataacata gttttagagc tagaaatagc aagttaaaat 300 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttgttttaga 360 gctagaaata gcaagttaaa ataaggctag tccgttttta gcgcgtgcgc caattctgca 420 gacaaatggc tctagaggta cccgttacat aacttacggt aaatggcccg cctggctgac 480 cgcccaacga cccccgccca ttgacgtcaa tagtaacgcc aatagggact ttccattgac 540 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 600 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattgtgccc 660 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 720 ttaccatggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 780 cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 840 gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc 900 ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga 960 ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga gtcgctgcga 1020 cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga 1080 ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat 1140 tagctgagca agaggtaagg gtttaaggga tggttggttg gtggggtatt aatgtttaat 1200 tacctggagc acctgcctga aatcactttt tttcaggttg gaccggtgcc accatggact 1260 ataaggacca cgacggagac tacaaggatc atgatattga ttacaaagac gatgacgata 1320 agatggcccc aaagaagaag cggaaggtcg gtatccacgg agtcccagca gccgacaaga 1380 agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg atcaccgacg 1440 agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg cacagcatca 1500 agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag gccacccggc 1560 tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc tatctgcaag 1620 agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga ctggaagagt 1680 ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc aacatcgtgg 1740 acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag aaactggtgg 1800 acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac atgatcaagt 1860 tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac gtggacaagc 1920 tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc atcaacgcca 1980 gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga cggctggaaa 2040 atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac ctgattgccc 2100 tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag gatgccaaac 2160 tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc cagatcggcg 2220 accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc ctgctgagcg 2280 acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct atgatcaaga 2340 gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg cagcagctgc 2400 ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc ggctacattg 2460 acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg gaaaagatgg 2520 acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg aagcagcgga 2580 ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac gccattctgc 2640 ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc gagaagatcc 2700 tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc agattcgcct 2760 ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa gtggtggaca 2820 agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag aacctgccca 2880 acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg tataacgagc 2940 tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg agcggcgagc 3000 agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc 3060 tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc tccggcgtgg 3120 aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt atcaaggaca 3180 aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg ctgaccctga 3240 cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc cacctgttcg 3300 acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc aggctgagcc 3360 ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg gatttcctga 3420 agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac agcctgacct 3480 ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg cacgagcaca 3540 ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca gtgaaggtgg 3600 tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg atcgaaatgg 3660 ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga atgaagcgga 3720 tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc gtggaaaaca 3780 cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg gatatgtacg 3840 tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat atcgtgcctc 3900 agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc gacaagaacc 3960 ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag aactactggc 4020 ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg accaaggccg 4080 agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag ctggtggaaa 4140 cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac actaagtacg 4200 acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc aagctggtgt 4260 ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac taccaccacg 4320 cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc 4380 tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag atgatcgcca 4440 agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc aacatcatga 4500 actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg cctctgatcg 4560 agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt gccaccgtgc 4620 ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg cagacaggcg 4680 gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc gccagaaaga 4740 aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc tattctgtgc 4800 tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg aaagagctgc 4860 tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac tttctggaag 4920 ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag tactccctgt 4980 tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg cagaagggaa 5040 acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc cactatgaga 5100 agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa cagcacaagc 5160 actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg atcctggccg 5220 acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag cccatcagag 5280 agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc cctgccgcct 5340 tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa gaggtgctgg 5400 acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc gacctgtctc 5460 agctgggagg cgacaaaagg ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa 5520 agtaagaatt cctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc 5580 tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 5640 ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 5700 gggtggggtg gggcaggaca gcaaggggga ggattgggaa gagaatagca ggcatgctgg 5760 ggagcggccg caggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 5820 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 5880 agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt ttctccttac 5940 gcatctgtgc ggtatttcac accgcatacg tcaaagcaac catagtacgc gccctgtagc 6000 ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 6060 gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 6120 ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 6180 ctcgacccca aaaaacttga tttgggtgat ggttcacgta gtgggccatc gccctgatag 6240 acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 6300 actggaacaa cactcaaccc tatctcgggc tattcttttg atttataagg gattttgccg 6360 atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 6420 aaaatattaa cgtttacaat tttatggtgc actctcagta caatctgctc tgatgccgca 6480 tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 6540 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 6600 ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 6660 taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 6720 gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 6780 agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 6840 catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 6900 ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 6960 atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 7020 ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 7080 gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 7140 ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 7200 ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 7260 gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 7320 ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 7380 gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 7440 ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 7500 gctggctggt ttattgctga taaatctgga gccggtgagc gtggaagccg cggtatcatt 7560 gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 7620 caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 7680 cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 7740 ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 7800 taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 7860 tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 7920 gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 7980 agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 8040 aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 8100 gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 8160 gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 8220 tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 8280 agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 8340 cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 8400 gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 8460 gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgt 8509 <210> 25 <211> 9177 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 25 ctggcctttt gctcacatgt gagggcctat ttcccatgat tccttcatat ttgcatatac 60 gatacaaggc tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag 120 tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat 180 gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt 240 tatatatctt gtggaaagga cgaaacaccg ctatctgttg acataacata gttttagagc 300 tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt 360 cggtgctttt ttgttttaga gctagaaata gcaagttaaa ataaggctag tccgttttta 420 gcgcgtgcgc caattctgca gacaaatggc tctagaggta cccgttacat aacttacggt 480 aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa tagtaacgcc 540 aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 600 agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 660 gcccgcctgg cattgtgccc agtacatgac cttatgggac tttcctactt ggcagtacat 720 ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc cccacgttct gcttcactct 780 ccccatctcc cccccctccc cacccccaat tttgtattta tttatttttt aattattttg 840 tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 900 ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 960 aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 1020 gcgggcggga gtcgctgcga cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 1080 gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 1140 cttctcctcc gggctgtaat tagctgagca agaggtaagg gtttaaggga tggttggttg 1200 gtggggtatt aatgtttaat tacctggagc acctgcctga aatcactttt tttcaggttg 1260 gaccggtgcc accatggact ataaggacca cgacggagac tacaaggatc atgatattga 1320 ttacaaagac gatgacgata agatggcccc aaagaagaag cggaaggtcg gtatccacgg 1380 agtcccagca gccgacaaga agtacagcat cggcctggac atcggcacca actctgtggg 1440 ctgggccgtg atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa 1500 caccgaccgg cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga 1560 aacagccgag gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa 1620 ccggatctgc tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt 1680 cttccacaga ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc 1740 catcttcggc aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca 1800 cctgagaaag aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc 1860 cctggcccac atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga 1920 caacagcgac gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga 1980 ggaaaacccc atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag 2040 caagagcaga cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct 2100 gttcggaaac ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga 2160 cctggccgag gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa 2220 cctgctggcc cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc 2280 cgacgccatc ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct 2340 gagcgcctct atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc 2400 tctcgtgcgg cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa 2460 cggctacgcc ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa 2520 gcccatcctg gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga 2580 cctgctgcgg aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg 2640 agagctgcac gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg 2700 ggaaaagatc gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag 2760 gggaaacagc agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa 2820 cttcgaggaa gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa 2880 cttcgataag aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta 2940 cttcaccgtg tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc 3000 cgccttcctg agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg 3060 gaaagtgacc gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc 3120 cgtggaaatc tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct 3180 gctgaaaatt atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga 3240 agatatcgtg ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa 3300 aacctatgcc cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac 3360 cggctggggc aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa 3420 gacaatcctg gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat 3480 ccacgacgac agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg 3540 cgatagcctg cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat 3600 cctgcagaca gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga 3660 gaacatcgtg atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag 3720 ccgcgagaga atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa 3780 agaacacccc gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca 3840 gaatgggcgg gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga 3900 tgtggaccat atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct 3960 gaccagaagc gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa 4020 gaagatgaag aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt 4080 cgacaatctg accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat 4140 caagagacag ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc 4200 ccggatgaac actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac 4260 cctgaagtcc aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga 4320 gatcaacaac taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct 4380 gatcaaaaag taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga 4440 cgtgcggaag atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt 4500 cttctacagc aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat 4560 ccggaagcgg cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg 4620 ccgggatttt gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa 4680 gaccgaggtg cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga 4740 taagctgatc gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc 4800 caccgtggcc tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact 4860 gaagagtgtg aaagagctgc tggggatcac catcatggaa agaagcagct tcgagaagaa 4920 tcccatcgac tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa 4980 gctgcctaag tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc 5040 cggcgaactg cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta 5100 cctggccagc cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct 5160 gtttgtggaa cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc 5220 caagagagtg atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca 5280 ccgggataag cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa 5340 tctgggagcc cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac 5400 cagcaccaaa gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga 5460 gacacggatc gacctgtctc agctgggagg cgacaaaagg ccggcggcca cgaaaaaggc 5520 cggccaggca aaaaagaaaa aggaattcgg cagtggagag ggcagaggaa gtctgctaac 5580 atgcggtgac gtcgaggaga atcctggccc aatgaccgag tacaagccca cggtgcgcct 5640 cgccacccgc gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta 5700 ccccgccacg cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca 5760 agaactcttc ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg 5820 cgccgcggtg gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga 5880 gatcggcccg cgcatggccg agttgagcgg ttcccggctg gccgcgcagc aacagatgga 5940 aggcctcctg gcgccgcacc ggcccaagga gcccgcgtgg ttcctggcca ccgtcggagt 6000 ctcgcccgac caccagggca agggtctggg cagcgccgtc gtgctccccg gagtggaggc 6060 ggccgagcgc gccggggtgc ccgccttcct ggagacctcc gcgccccgca acctcccctt 6120 ctacgagcgg ctcggcttca ccgtcaccgc cgacgtcgag gtgcccgaag gaccgcgcac 6180 ctggtgcatg acccgcaagc ccggtgcctg agaattctaa ctagagctcg ctgatcagcc 6240 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 6300 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 6360 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 6420 gattgggaag agaatagcag gcatgctggg gagcggccgc aggaacccct agtgatggag 6480 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 6540 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag 6600 gggcgcctga tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt 6660 caaagcaacc atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta 6720 cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc 6780 cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt 6840 tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg 6900 gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca 6960 cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct 7020 attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga 7080 tttaacaaaa atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca 7140 ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac 7200 ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga 7260 ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac 7320 gaaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt 7380 agacgtcagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct 7440 aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 7500 attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 7560 cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 7620 aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc 7680 ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat 7740 gtggcgcggt attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact 7800 attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca 7860 tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact 7920 tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg 7980 atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg 8040 agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg 8100 aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg 8160 caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag 8220 ccggtgagcg tggaagccgc ggtatcattg cagcactggg gccagatggt aagccctccc 8280 gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga 8340 tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat 8400 atatacttta gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc 8460 tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 8520 accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 8580 gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 8640 caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 8700 tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 8760 ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 8820 tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 8880 gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 8940 tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 9000 gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 9060 gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 9120 ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gcctttt 9177 <210> 26 <211> 21 <212> DNA <213> Homo sapiens <400> 26 ccatatgtta tatcaacaga t 21 <210> 27 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 27 ggttggtcat tgactgttga gg 22 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 28 gtgctggtga caggggtagc 20 <210> 29 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 29 atggccacaa ccatggtgag caag 24 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 30 cctcctgcat ttgctggagt caggg 25 <210> 31 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 31 tgatggattc gggcaagttt ct 22 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 32 acatcggcaa ggtgtgggtc 20 <210> 33 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 33 accgagatcc tccaaacagt agaca 25 <210> 34 <211> 14437 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <220> <221> misc_feature <222> (8819)..(8821) <223> n is a, c, g, or t <400> 34 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 60 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 120 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 180 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 240 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 300 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 360 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 420 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 480 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 540 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 600 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 660 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 720 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 780 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 840 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 900 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 960 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 1020 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 1080 gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 1140 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 1200 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 1260 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 1320 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 1380 gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga actttaaaag 1440 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 1500 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 1560 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 1620 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 1680 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 1740 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 1800 tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa gaattctcat 1860 gtttgacagc ttatcatcga taagctgatc ctcacaggcc gcacccagct tttcttccgt 1920 tgccccagta gcatctctgt ctggtgacct tgaagaggaa gaggaggggt cccgagaatc 1980 cccatcccta ccgtccagca aaaaggggga cgaggaattt gaggcctggc ttgaggctca 2040 ggacgcaaat cttgaggatg ttcagcggga gttttccggg ctgcgagtaa ttggtgatga 2100 ggacgaggat ggttcggagg atggggaatt ttcagacctg gatctgtctg acagcgacca 2160 tgaaggggat gagggtgggg gggctgttgg agggggcagg agtctgcact ccctgtattc 2220 actgagcgtc gtctaataaa gatgtctatt gatctctttt agtgtgaatc atgtctgacg 2280 aggggccagg tacaggacct ggaaatggcc taggagagaa gggagacaca tctggaccag 2340 aaggctccgg cggcagtgga cctcaaagaa gagggggtga taaccatgga cgaggacggg 2400 gaagaggacg aggacgagga ggcggaagac caggagcccc gggcggctca ggatcagggc 2460 caagacatag agatggtgtc cggagacccc aaaaacgtcc aagttgcatt ggctgcaaag 2520 ggacccacgg tggaacagga gcaggagcag gagcgggagg ggcaggagca ggaggggcag 2580 gagcaggagg aggggcagga gcaggaggag gggcaggagg ggcaggaggg gcaggagggg 2640 caggagcagg aggaggggca ggagcaggag gaggggcagg aggggcagga ggggcaggag 2700 caggaggagg ggcaggagca ggaggagggg caggaggggc aggagcagga ggaggggcag 2760 gaggggcagg aggggcagga gcaggaggag gggcaggagc aggaggaggg gcaggagggg 2820 caggagcagg aggaggggca ggaggggcag gaggggcagg agcaggagga ggggcaggag 2880 caggaggggc aggaggggca ggaggggcag gagcaggagg ggcaggagca ggaggagggg 2940 caggaggggc aggaggggca ggagcaggag gggcaggagc aggaggggca ggagcaggag 3000 gggcaggagc aggaggggca ggaggggcag gagcaggagg ggcaggaggg gcaggagcag 3060 gaggggcagg aggggcagga gcaggaggag gggcaggagg ggcaggagca ggaggagggg 3120 caggaggggc aggagcagga ggggcaggag gggcaggagc aggaggggca ggaggggcag 3180 gagcaggagg ggcaggaggg gcaggagcag gaggaggggc aggagcagga ggggcaggag 3240 caggaggtgg aggccggggt cgaggaggca gtggaggccg gggtcgagga ggtagtggag 3300 gccggggtcg aggaggtagt ggaggccgcc ggggtagagg acgtgaaaga gccagggggg 3360 gaagtcgtga aagagccagg gggagaggtc gtggacgtgg agaaaagagg cccaggagtc 3420 ccagtagtca gtcatcatca tccgggtctc caccgcgcag gccccctcca ggtagaaggc 3480 catttttcca ccctgtaggg gaagccgatt attttgaata ccaccaagaa ggtggcccag 3540 atggtgagcc tgacgtgccc ccgggagcga tagagcaggg ccccgcagat gacccaggag 3600 aaggcccaag cactggaccc cggggtcagg gtgatggagg caggcgcaaa aaaggagggt 3660 ggtttggaaa gcatcgtggt caaggaggtt ccaacccgaa atttgagaac attgcagaag 3720 gtttaagagc tctcctggct aggagtcacg tagaaaggac taccgacgaa ggaacttggg 3780 tcgccggtgt gttcgtatat ggaggtagta agacctccct ttacaaccta aggcgaggaa 3840 ctgcccttgc tattccacaa tgtcgtctta caccattgag tcgtctcccc tttggaatgg 3900 cccctggacc cggcccacaa cctggcccgc taagggagtc cattgtctgt tatttcatgg 3960 tctttttaca aactcatata tttgctgagg ttttgaagga tgcgattaag gaccttgtta 4020 tgacaaagcc cgctcctacc tgcaatatca gggtgactgt gtgcagcttt gacgatggag 4080 tagatttgcc tccctggttt ccacctatgg tggaaggggc tgccgcggag ggtgatgacg 4140 gagatgacgg agatgaagga ggtgatggag atgagggtga ggaagggcag gagtgatgta 4200 acttgttagg agacgccctc aatcgtatta aaagccgtgt attcccccgc actaaagaat 4260 aaatccccag tagacatcat gcgtgctgtt ggtgtatttc tggccatctg tcttgtcacc 4320 attttcgtcc tcccaacatg gggcaattgg gcatacccat gttgtcacgt cactcagctc 4380 cgcgctcaac accttctcgc gttggaaaac attagcgaca tttacctggt gagcaatcag 4440 acatgcgacg gctttagcct ggcctcctta aattcaccta agaatgggag caaccagcag 4500 gaaaaggaca agcagcgaaa attcacgccc ccttgggagg tggcggcata tgcaaaggat 4560 agcactccca ctctactact gggtatcata tgctgactgt atatgcatga ggatagcata 4620 tgctacccgg atacagatta ggatagcata tactacccag atatagatta ggatagcata 4680 tgctacccag atatagatta ggatagccta tgctacccag atataaatta ggatagcata 4740 tactacccag atatagatta ggatagcata tgctacccag atatagatta ggatagccta 4800 tgctacccag atatagatta ggatagcata tgctacccag atatagatta ggatagcata 4860 tgctatccag atatttgggt agtatatgct acccagatat aaattaggat agcatatact 4920 accctaatct ctattaggat agcatatgct acccggatac agattaggat agcatatact 4980 acccagatat agattaggat agcatatgct acccagatat agattaggat agcctatgct 5040 acccagatat aaattaggat agcatatact acccagatat agattaggat agcatatgct 5100 acccagatat agattaggat agcctatgct acccagatat agattaggat agcatatgct 5160 atccagatat ttgggtagta tatgctaccc atggcaacat tagcccaccg tgctctcagc 5220 gacctcgtga atatgaggac caacaaccct gtgcttggcg ctcaggcgca agtgtgtgta 5280 atttgtcctc cagatcgcag caatcgcgcc cctatcttgg cccgcccacc tacttatgca 5340 ggtattcccc ggggtgccat tagtggtttt gtgggcaagt ggtttgaccg cagtggttag 5400 cggggttaca atcagccaag ttattacacc cttattttac agtccaaaac cgcagggcgg 5460 cgtgtggggg ctgacgcgtg cccccactcc acaatttcaa aaaaaagagt ggccacttgt 5520 ctttgtttat gggccccatt ggcgtggagc cccgtttaat tttcgggggt gttagagaca 5580 accagtggag tccgctgctg tcggcgtcca ctctctttcc ccttgttaca aatagagtgt 5640 aacaacatgg ttcacctgtc ttggtccctg cctgggacac atcttaataa ccccagtatc 5700 atattgcact aggattatgt gttgcccata gccataaatt cgtgtgagat ggacatccag 5760 tctttacggc ttgtccccac cccatggatt tctattgtta aagatattca gaatgtttca 5820 ttcctacact agtatttatt gcccaagggg tttgtgaggg ttatattggt gtcatagcac 5880 aatgccacca ctgaaccccc cgtccaaatt ttattctggg ggcgtcacct gaaaccttgt 5940 tttcgagcac ctcacataca ccttactgtt cacaactcag cagttattct attagctaaa 6000 cgaaggagaa tgaagaagca ggcgaagatt caggagagtt cactgcccgc tccttgatct 6060 tcagccactg cccttgtgac taaaatggtt cactaccctc gtggaatcct gaccccatgt 6120 aaataaaacc gtgacagctc atggggtggg agatatcgct gttccttagg acccttttac 6180 taaccctaat tcgatagcat atgcttcccg ttgggtaaca tatgctattg aattagggtt 6240 agtctggata gtatatacta ctacccggga agcatatgct acccgtttag ggttaacaag 6300 ggggccttat aaacactatt gctaatgccc tcttgagggt ccgcttatcg gtagctacac 6360 aggcccctct gattgacgtt ggtgtagcct cccgtagtct tcctgggccc ctgggaggta 6420 catgtccccc agcattggtg taagagcttc agccaagagt tacacataaa ggcaatgttg 6480 tgttgcagtc cacagactgc aaagtctgct ccaggatgaa agccactcag tgttggcaaa 6540 tgtgcacatc catttataag gatgtcaact acagtcagag aacccctttg tgtttggtcc 6600 ccccccgtgt cacatgtgga acagggccca gttggcaagt tgtaccaacc aactgaaggg 6660 attacatgca ctgccccgcg aagaaggggc agagatgtcg tagtcaggtt tagttcgtcc 6720 ggggcgggga tcgatcctct agagtcgact agtaacggcc gccagtgtgc tggaattcgg 6780 cttacaagtt tgtacaaaaa agcaggctag ctcactcatt aggcacccca ggctttacac 6840 tttatgcttc cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga 6900 aacagctatg accatgatta cgccaagctt gcatgcctgc aggtcgacat tgattattga 6960 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 7020 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 7080 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 7140 aatgggtgga ctatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 7200 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 7260 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 7320 ccatgggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 7380 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 7440 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 7500 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 7560 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgttgcc 7620 ttcgccccgt gccccgctcc gcgccgcctc gcgccgcccg ccccggctct gactgaccgc 7680 gttactccca caggtgagcg ggcgggacgg cccttctcct ccgggctgta attagcgctt 7740 ggtttaatga cggctcgttt cttttctgtg gctgcgtgaa agccttaaag ggctccggga 7800 gggccctttg tgcggggggg agcggctcgg ggggtgcgtg cgtgtgtgtg tgcgtgggga 7860 gcgccgcgtg cggcccgcgc tgcccggcgg ctgtgagcgc tgcgggcgcg gcgcggggct 7920 ttgtgcgctc cgcgtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 7980 ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 8040 gtgtgggcgc ggcggtcggg ctgtaacccc cccctgcacc cccctccccg agttgctgag 8100 cacggcccgg cttcgggtgc ggggctccgt gcggggcgtg gcgcggggct cgccgtgccg 8160 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 8220 ggctcggggg aggggcgcgg cggccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 8280 gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 8340 tctggcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc gcgggcgaag 8400 cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 8460 cgtccccttc tccatctcca gcctcggggc tgccgcaggg ggacggctgc cttcgggggg 8520 gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta 8580 accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg gttgttgtgc 8640 tgtctcatca ttttggcaaa gaattccttc tagaggatcc ccgggtaccg agctcgaccc 8700 aacttttcta tactctatac aaagttggtc agtcagaaac aactttggca catatcaata 8760 ttatgctctc gttaattaac tcgaggtaaa acttaagctt ggtaccgagc tcggatccnn 8820 natgggtagt tctttagacg atgagcatat cctctctgct cttctgcaaa gcgatgacga 8880 gcttgttggt gaggattctg acagtgaaat atcagatcac gtaagtgaag atgacgtcca 8940 gagcgataca gaagaagcgt ttatagatga ggtacatgaa gtgcagccaa cgtcaagcgg 9000 tagtgaaata ttagacgaac aaaatgttat tgaacaacca ggttcttcat tggcttctaa 9060 cagaatcttg accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac 9120 ttcaaagtcc acgaggcgta gccgagtctc tgcactgaac attgtcagat ctcaaagagg 9180 tccgacgcgt atgtgccgca atatatatga cccactttta tgcttcaaac tattttttac 9240 tgatgagata atttcggaaa ttgtaaaatg gacaaatgct gagatatcat tgaaacgtcg 9300 ggaatctatg acaggtgcta catttcgtga cacgaatgaa gatgaaatct atgctttctt 9360 tggtattctg gtaatgacag cagtgagaaa agataaccac atgtccacag atgacctctt 9420 tgatcgatct ttgtcaatgg tgtacgtctc tgtaatgagt cgtgatcgtt ttgatttttt 9480 gatacgatgt cttagaatgg atgacaaaag tatacggccc acacttcgag aaaacgatgt 9540 atttactcct gttagaaaaa tatgggatct ctttatccat cagtgcatac aaaattacac 9600 tccaggggct catttgacca tagatgaaca gttacttggt tttagaggac ggtgtccgtt 9660 taggatgtat atcccaaaca agccaagtaa gtatggaata aaaatcctca tgatgtgtga 9720 cagtggtacg aagtatatga taaatggaat gccttatttg ggaagaggaa cacagaccaa 9780 cggagtacca ctcggtgaat actacgtgaa ggagttatca aagcctgtgc acggtagttg 9840 tcgtaatatt acgtgtgaca attggttcac ctcaatccct ttggcaaaaa acttactaca 9900 agaaccgtat aagttaacca ttgtgggaac cgtgcgatca aacaaacgcg agataccgga 9960 agtactgaaa aacagtcgct ccaggccagt gggaacatcg atgttttgtt ttgacggacc 10020 ccttactctc gtctcatata aaccgaagcc agctaagatg gtatacttat tatcatcttg 10080 tgatgaggat gcttctatca acgaaagtac cggtaaaccg caaatggtta tgtattataa 10140 tcaaactaaa ggcggagtgg acacgctaga ccaaatgtgt tctgtgatga cctgcagtag 10200 gaagacgaat aggtggccta tggcattatt gtacggaatg ataaacattg cctgcataaa 10260 ttcttttatt atatacagcc ataatgtcag tagcaaggga gaaaaggttc aaagtcgcaa 10320 aaaatttatg agaaaccttt acatgagcct gacgtcatcg tttatgcgta agcgtttaga 10380 agctcctact ttgaagagat atttgcgcga taatatctct aatattttgc caaatgaagt 10440 gcctggtaca tcagatgaca gtactgaaga gccagtaatg aaaaaacgta cttactgtac 10500 ttactgcccc tctaaaataa ggcgaaaggc aaatgcatcg tgcaaaaaat gcaaaaaagt 10560 tatttgtcga gagcataata ttgatatgtg ccaaagttgt ttctgactgc ggccgcacta 10620 gtctagagcg atcgcccggg tttaaacgct agcaacaagc tcgtcatcgc tttgcagaag 10680 agcacaactt tgtataataa agttgagcta aaacgcggcc tcgaatcgaa ttccgccccc 10740 ccccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 10800 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 10860 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 10920 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 10980 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 11040 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 11100 acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 11160 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 11220 gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 11280 gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat gaccgagtac 11340 aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg caccctcgcc 11400 gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg ccacatcgag 11460 cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat cggcaaggtg 11520 tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag cgtcgaagcg 11580 ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc ccggctggcc 11640 gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc cgcgtggttc 11700 ctggccaccg tcggcgtctc gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg 11760 ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg 11820 ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg 11880 cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg cccgccccac 11940 gacccgcagc gcccgaccga aaggagcgca cgaccccatg catcgatgat ctagagctcg 12000 ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 12060 gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 12120 tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 12180 caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc 12240 ttctgaggcg gaaagaatac ccagctttct tgtacaaagt ggtaagccga attctgcaga 12300 ttcgactagc ttggcacgcc agaaatccgc gcggtggttt ttgggggtcg ggggtgtttg 12360 gcagccacag acgcccggtg ttcgtgtcgc gccagtacat gcggtccatg cccaggccat 12420 ccaaaaacca tgggtctgtc tgctcagtcc agtcgtggac ctgaccccac gcaacgccca 12480 aaataataac ccccacgaac cataaaccat tccccatggg ggaccccgtc cctaacccac 12540 ggggccagtg gctatggcag ggcctgccgc cccgacgttg gctgcgagcc ctgggccttc 12600 acccgaactt ggggggtggg gtggggaaaa ggaagaaacg cgggcgtatt ggccccaatg 12660 gggtctcggt ggggtatcga cagagtgcca gccctgggac cgaaccccgc gtttatgaac 12720 aaacgaccca acacccgtgc gttttattct gtctttttat tgccgtcata gcgcgggttc 12780 cttccggtat tgtctccttc cgtgtttcag ttagcctccc ccatctcccg atccggacga 12840 gtgctggggc gtcggtttcc actatcggcg agtacttcta cacagccatc ggtccagacg 12900 gccgcgcttc tgcgggcgat ttgtgtacgc ccgacagtcc cggctccgga tcggacgatt 12960 gcgtcgcatc gaccctgcgc ccaagctgca tcatcgaaat tgccgtcaac caagctctga 13020 tagagttggt caagaccaat gcggagcata tacgcccgga gccgcggcga tcctgcaagc 13080 tccggatgcc tccgctcgaa gtagcgcgtc tgctgctcca tacaagccaa ccacggcctc 13140 cagaagaaga tgttggcgac ctcgtattgg gaatccccga acatcgcctc gctccagtca 13200 atgaccgctg ttatgcggcc attgtccgtc aggacattgt tggagccgaa atccgcgtgc 13260 acgaggtgcc ggacttcggg gcagtcctcg gcccaaagca tcagctcatc gagagcctgc 13320 gcgacggacg cactgacggt gtcgtccatc acagtttgcc agtgatacac atggggatca 13380 gcaatcgcgc atatgaaatc acgccatgta gtgtattgac cgattccttg cggtccgaat 13440 gggccgaacc cgctcgtctg gctaagatcg gccgcagcga tcgcatccat ggcctccgcg 13500 accggctgca gaacagcggg cagttcggtt tcaggcaggt cttgcaacgt gacaccctgt 13560 gcacggcggg agatgcaata ggtcaggctc tcgctgaatt ccccaatgtc aagcacttcc 13620 ggaatcggga gcgcggccga tgcaaagtgc cgataaacat aacgatcttt gtagaaacca 13680 tcggcgcagc tatttacccg caggacatat ccacgccctc ctacatcgaa gctgaaagca 13740 cgagattctt cgccctccga gagctgcatc aggtcggaga cgctgtcgaa cttttcgatc 13800 agaaacttct cgacagacgt cgcggtgagt tcaggctttt tcatatctca ttgccccccg 13860 ggatctgcgg cacgctgttg acgctgttaa gcgggtcgct gcagggtcgc tcggtgttcg 13920 aggccacacg cgtcacctta atatgcgaag tggacctcgg accgcgccgc cccgactgca 13980 tctgcgtgtt cgaattcgcc aatgacaaga cgctgggcgg ggtttgtgtc atcatagaac 14040 taaagacatg caaatatatt tcttccgggg acaccgccag caaacgcgag caacgggcca 14100 cggggatgaa gcagggcggc acctcgctaa cggattcacc actccaagaa ttggagccaa 14160 tcaattcttg cggagaactg tgaatgcgca aaccaaccct tggcagaaca tatccatcgc 14220 gtccgccatc tccagcagcc gcacgcggcg catctcgggg ccgacgcgct gggctacgtc 14280 ttgctggcgt tcgcgacgcg aggctggatg gccttcccca ttatgattct tctcgcttcc 14340 ggcggcatcg ggatgcccgc gttgcaggcc atgctgtcca ggcaggtaga tgacgaccat 14400 cagggacagc ttcaaggcca gcaaaaggcc aggaacc 14437 <210> 35 <211> 7602 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 35 actcttcctt tttcaatgac cgctttggaa aaacaaagac tgtatttcct ggaaattaat 60 gtttattcaa taaactgtgt attcagctat atcacatagt ggtgaggctg aaatgaggcg 120 ggaagaggcg gttggggctt aattatatca atttgggtgg ccccacagcg cctccaaggc 180 gccagtcctg ttttgacaag ttgcctctgg aagcctctac aatgcctctc ttctttttct 240 ccagagtaag cggaggccag gggcccccgg cctctgctta atactaaaaa aaacagctgt 300 tgtcatagta atgattgggt ggaaacattc caggcctggg tggagaggct ttttgcttcc 360 tcttgcaaaa ccacactgac attccaggcc tgggtggaga ggctttttgc ttcctcttgc 420 aaaaccacac tgccctctgg agggcagttg cctagcaact aactaaaaga ggatgtcgca 480 cggccagctg cggtcagtta gtcacttcct gcttaactga cttgacattt tctattttaa 540 gagtcgggag gaaaattact gtgttggagg ccctccgcca tcttctgaag ctgaatcgaa 600 ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 660 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 720 cttatcatgt ctggatctga tatcatcgtc gacattgatt attgactagt tattaatagt 780 aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 840 cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 900 cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 960 tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta 1020 ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg 1080 actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtcgaggtga 1140 gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca attttgtatt 1200 tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc 1260 caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt gcggcggcag 1320 ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 1380 cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc 1440 cccgctccgc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt tactcccaca 1500 ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg tttaatgacg 1560 gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg gccctttgtg 1620 cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg 1680 ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg 1740 cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg ggggctgcga 1800 ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc 1860 gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc acggcccggc 1920 ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg 1980 gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga 2040 ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg 2100 ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga 2160 gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg 2220 cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct 2280 tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg 2340 cagggcgggg ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt 2400 tcatgccttc ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca 2460 tcattttggc aaagaatttc gacctgcagc ccaagctgta ccccctcgaa actgacagga 2520 gaaccaccat gggcccaaag aagaagagaa aggtttcgaa tttactgacc gtacaccaaa 2580 atttgcctgc attaccggtc gatgcaacga gtgatgaggt tcgcaagaac ctgatggaca 2640 tgttcaggga tcgccaggcg ttttctgagc atacctggaa aatgcttctg tccgtttgcc 2700 ggtcgtgggc ggcatggtgc aagttgaata accggaaatg gtttcccgca gaacctgaag 2760 atgttcgcga ttatcttcta tatcttcagg cgcgcggtct ggcagtaaaa actatccagc 2820 aacatttggg ccagctaaac atgcttcatc gtcggtccgg gctgccacga ccaagtgaca 2880 gcaatgctgt ttcactggtt atgcggcgga tccgaaaaga aaacgttgat gccggtgaac 2940 gtgcaaaaca ggctctagcg ttcgaacgca ctgatttcga ccaggttcgt tcactcatgg 3000 aaaatagcga tcgctgccag gatatacgta atctggcatt tctggggatt gcttataaca 3060 ccctgttacg tatagccgaa attgccagga tcagggttaa agatatctca cgtactgacg 3120 gtgggagaat gttaatccat attggcagaa cgaaaacgct ggttagcacc gcaggtgtag 3180 agaaggcact tagcctgggg gtaactaaac tggtcgagcg atggatttcc gtctctggtg 3240 tagctgatga tccgaataac tacctgtttt gccgggtcag aaaaaatggt gttgccgcgc 3300 catctgccac cagccagcta tcaactcgcg ccctggaagg gatttttgaa gcaactcatc 3360 gattgattta cggcgctaag gatgactctg gtcagagata cctggcctgg tctggacaca 3420 gtgcccgtgt cggagccgcg cgagatatgg cccgcgctgg agtttcaata ccggagatca 3480 tgcaagctgg tggctggacc aatgtaaata ttgtcatgaa ctatatccgt aacctggata 3540 gtgaaacagg ggcaatggtg cgcctgctgg aagatggcga ttagccatta acgcgcgacc 3600 agcttgatat cgaattaatt cactcctcag gtgcaggctg cctatcagaa ggtggtggct 3660 ggtgtggcca atgccctggc tcacaaatac cactgaatta agaattccgc ccctctccct 3720 cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 3780 atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 3840 ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 3900 tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 3960 tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 4020 agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 4080 ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 4140 atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 4200 catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt 4260 cctttgaaaa acacgatgat aatatggcca caaccatgac cgagtacaag cccacggtgc 4320 gcctcgccac ccgcgacgac gtcccccggg ccgtacgcac cctcgccgcc gcgttcgccg 4380 actaccccgc cacgcgccac accgtcgacc cggaccgcca catcgagcgg gtcaccgagc 4440 tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg caaggtgtgg gtcgcggacg 4500 acggcgccgc ggtggcggtc tggaccacgc cggagagcgt cgaagcgggg gcggtgttcg 4560 ccgagatcgg cccgcgcatg gccgagttga gcggttcccg gctggccgcg cagcaacaga 4620 tggaaggcct cctggcgccg caccggccca aggagcccgc gtggttcctg gccaccgtcg 4680 gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc cgtcgtgctc cccggagtgg 4740 aggcggccga gcgcgccggg gtgcccgcct tcctggagac ctccgcgccc cgcaacctcc 4800 ccttctacga gcggctcggc ttcaccgtca ccgccgacgt cgaggtgccc gaaggaccgc 4860 gcacctggtg catgacccgc aagcccggtg cctgacgccc gccccacgac ccgcagcgcc 4920 cgaccgaaag gagcgcacga ccccatgcat ggatcgatag cctcgactgt gccttctagt 4980 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 5040 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 5100 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 5160 aggcatgctg gggatgcggt gggctctatc ttctgaggcg gaaagaacct gcagcccaag 5220 cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 5280 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 5340 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 5400 gcggatccgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 5460 cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 5520 tatgcagagg ccgaggccgc ctcggcctct gagctattcc agaagtagtg aggaggcttt 5580 tttggaggcc taggcttttg caaaaagcta acttgtttat tgcagcttat aatggttaca 5640 aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 5700 gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccgctgc attaatgaat 5760 cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 5820 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 5880 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 5940 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 6000 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 6060 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 6120 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg 6180 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 6240 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 6300 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6360 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6420 aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6480 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6540 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6600 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6660 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6720 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6780 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6840 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 6900 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 6960 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 7020 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 7080 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 7140 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 7200 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 7260 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 7320 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 7380 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7440 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7500 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7560 aaaaaaggga ataagggcga cacggaaatg ttgaatactc at 7602 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 36 gtatctggcg gcagggtagc 20 <210> 37 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 37 tttgttgctg gcattgttct g 21 <210> 38 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 38 tggacgtaaa ctcctcttca gacc 24 <210> 39 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 39 gaggactaca ccatcgtgga acag 24 <210> 40 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 40 ggcttccacc aaagaccaca g 21 <210> 41 <211> 2041 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 41 taccgttcgt atagcataca ttatacgaag ttataccatg tctagactgg acaagagcaa 60 agtcataaac ggcgctctgg aattactcaa tggagtcggt atcgaaggcc tgacgacaag 120 gaaactcgct caaaagctgg gagttgagca gcctaccctg tactggcacg tgaagaacaa 180 gcgggccctg ctcgatgccc tgccaatcga gatgctggac aggcatcata cccacttctg 240 ccccctggaa ggcgagtcat ggcaagactt tctgcggaac aacgccaagt cattccgctg 300 tgctctcctc tcacatcgcg acggggctaa agtgcatctc ggcacccgcc caacagagaa 360 acagtacgaa accctggaaa atcagctcgc gttcctgtgt cagcaaggct tctccctgga 420 gaacgcactg tacgctctgt ccgccgtggg ccactttaca ctgggctgcg tattggagga 480 acaggagcat caagtagcaa aagaggaaag agagacacct accaccgatt ctatgccccc 540 acttctgaga caagcaattg agctgttcga ccggcaggga gccgaacctg ccttcctttt 600 cggcctggaa ctaatcatat gtggcctgga gaaacagcta aagtgcgaaa gcggcgggcc 660 ggccgacgcc cttgacgatt ttgacttaga catgctccca gccgatgccc ttgacgactt 720 tgaccttgat atgctgcctg ctgacgctct tgacgatttt gaccttgaca tgctccccgg 780 gtaactaagt aaggatccag acatgataag atacattgat gagtttggac aaaccacaac 840 tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt 900 aaccattata agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca 960 ggttcagggg gaggtgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtat 1020 ggctgattat gatcctctag agtcgcagat ccagacatga taagatacat tgatgagttt 1080 ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 1140 attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 1200 cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc 1260 tacaaatgtg gtatggctga ttatgatcct ctagagtcgc agatccagac atgataagat 1320 acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg 1380 aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca 1440 acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa 1500 gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tcctctagag tcgcagatcc 1560 tctagagtcg cagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt 1620 gagcatctga cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat 1680 tttttgtgtc tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat 1740 gagtatttgg tttagagttt ggcaacatat gccatatgct ggctgccatg aacaaaggtg 1800 gctataaaga ggtcatcagt atatgaaaca gccccctgct gtccattcct tattccatag 1860 aaaagccttg acttgaggtt agattttttt tatattttgt tttgtgttat ttttttcttt 1920 aacatcccta aaattttcct tacatgtttt actagccaga tttttcctcc tctcctgact 1980 actcccagtc atagctgtcc ctcttctctt atgaagatcc ctcgacctgc agcccaagct 2040 t 2041 <210> 42 <211> 413 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 42 ccgcggtggc ggccgcacgt ctccctatca gtgatagaga agtcgacacg tctcgagctc 60 cctatcagtg atagagaagg tacgtctaga acgtctccct atcagtgata gagaagtcga 120 cacgtctcga gctccctatc agtgatagag aaggtacgtc tagaacgtct ccctatcagt 180 gatagagaag tcgacacgtc tcgagctccc tatcagtgat agagaaggta cgtctagaac 240 gtctccctat cagtgataga gaagtcgaca cgtctcgagc tccctatcag tgatagagaa 300 ggtaccccct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 360 ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg cgg 413 <210> 43 <211> 1224 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 43 ggatcccaaa taccactgaa ttaagaattc cgcccctctc cctccccccc ccctaacgtt 60 actggccgaa gccgcttgga ataaggccgg tgtgcgtttg tctatatgtt attttccacc 120 atattgccgt cttttggcaa tgtgagggcc cggaaacctg gccctgtctt cttgacgagc 180 attcctaggg gtctttcccc tctcgccaaa ggaatgcaag gtctgttgaa tgtcgtgaag 240 gaagcagttc ctctggaagc ttcttgaaga caaacaacgt ctgtagcgac cctttgcagg 300 cagcggaacc ccccacctgg cgacaggtgc ctctgcggcc aaaagccacg tgtataagat 360 acacctgcaa aggcggcaca accccagtgc cacgttgtga gttggatagt tgtggaaaga 420 gtcaaatggc tctcctcaag cgtattcaac aaggggctga aggatgccca gaaggtaccc 480 cattgtatgg gatctgatct ggggcctcgg tgcacatgct ttacatgtgt ttagtcgagg 540 ttaaaaaacg tctaggcccc ccgaaccacg gggacgtggt tttcctttga aaaacacgat 600 gataatatgg ccacaaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 660 gacgtccccc gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 720 cacaccgtcg acccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 780 acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 840 gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 900 atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 960 ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac 1020 cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 1080 ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 1140 ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 1200 cgcaagcccg gtgcctgagg atcc 1224 <210> 44 <211> 1044 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 44 actagttaat taagaaactg acctaaagac ttgcctccag ccccatccta tgggagcatt 60 ttcttaactg aggttctctc ctctcaagat gacttcagct tgtgacaatg tgacctggcc 120 taaagctagc cagcacagca caacaccttc cattctttct tctaaggtgc ttatggacat 180 ttctttctct ttgagtacct tgagtgggat tgtctgtggc tgcttttggg aagcattcaa 240 ttgaatgatt tttgtttttt gtttatttcc cccgagacag ggtttctctg tgtagccctg 300 gctgtcctgg aactcacttt gtagacctcg aactcagaaa tccgcctgcc tctgcctccc 360 aagtgctggg attaatggca tgtgccacca ctgcctggag aattgaatgc ttataaggta 420 aacagatgct tttattaaaa acaacaacaa caactgttat tcctagtggt tggactttac 480 agttgtactt tgtttccttt tgaaacagtg ttgcagcgaa cgaggccaca ggttggcctt 540 gaacttgttc ttccctgtgc taggattaca tcgtgcacaa cttccttctc gcagactctt 600 attattttaa gaaaaactaa aacagtacac cattttagta cggtagtagt gtgctgaaat 660 tcagccctgg ggatcagggc cttttgcttt ttttggtaaa ttttgagaca tagtgtcact 720 aagttgcttt agctagctgt gtatcagtct ccacagtggc cggcttgaca ggcctgcttg 780 ctttgtgcat gtgaaggggc taagcccttg gctgtgtaga atatacaaac gcagtgtctg 840 agaaggctca gaatggctca cttgcaagaa cagctaaacc ctaacaagac catctgacca 900 tctgggatga ctgacgtttg ccggctacgc gggaggccct ggaaaagatg tcttccagat 960 gatgcttaga ctgtttttga gttagtagca cggaatcaca gcactgtttc ccctcatttt 1020 agggtccgtc gtaacctgac tagt 1044 <210> 45 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 45 actagttaat taagaaactg acctaaagac ttgcct 36 <210> 46 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 46 actagtcagg ttacgacgga ccctaaaatg agggg 35 <210> 47 <211> 682 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 47 ccatggtacc gttcgtatag catacattat acgaagttat ttgagtaact atggaagact 60 atatcaaaat agagaaaatt ggagaaggta agtggtttta gcagaatgtt ttttgaaaag 120 aagataacaa tgctactgtg gaacacagaa acctttactg agtgcagtcg tagatgcatc 180 tgtacgcgtg cgcatgagtg tgctgtgaga gttggtgttt gtggcctcct agacaggatc 240 tgggatcact ctgagcacac ctgtagggga ttgtctttga ctctattaat tgacgtgggc 300 aggaacctcc cccagtgtgg gtgccttcct tgcctgagat cctggactgt gtgactggag 360 aagggtgtca agccacagtg aacctcactc tcccactgcc tgtgctcttg ctgctgctgc 420 tgctggactc taaccccgat cctgagtgca aacaaaccct tccttgggct acttttgtct 480 gggtgtttct cacagcacca gcaaaaggaa ggcacgcagc tgggcgtggt ggcacacacc 540 tttaatccca gcacttggga ggcagaggca ggcggatttc tgagttcgag gccagcctgg 600 tctacaaagt tccaggatag ccagggctat acagagaaac cctgtctcga aaaacagaaa 660 agaaaaaaaa aagaaagcat gc 682 <210> 48 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 48 gcatgctttc tttttttttt cttttctgtt tttcgagaca gggtttctct g 51 <210> 49 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 49 ccatggtacc gttcgtatag catacattat acgaagttat ttgagtaact atggaagact 60 atatcaaaat ag 72 <210> 50 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 50 caccgacgac ggaccctaaa atga 24 <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 51 aaactcattt tagggtccgt cgtc 24 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 52 caccgatatc aaaatagaga aaat 24 <210> 53 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 53 aaacattttc tctattttga tatc 24 <210> 54 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 54 ccaggccaca tatgattagt tcc 23 <210> 55 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 55 gtgagccaag aaattgtttc tcc 23 <210> 56 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 56 ttgacctcca tagaagacac cg 22 <210> 57 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 57 gctaagtccc ctgccttgg 19 <210> 58 <211> 1978 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 58 ggatccggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60 gtggagtcca acccagggcc catggccagc tacccctgtc accagcacgc cagcgccttc 120 gaccaggccg ccagaagcag gggccacagc aaccggcgga ccgccctgag acccaggcgg 180 cagcaggaag ccaccgaagt ccggctggaa cagaagatgc ccaccctgtt aagggtgtac 240 atcgacggcc cccacggcat gggcaagacc accaccaccc agctgctggt ggccctgggc 300 agccgggacg acatcgtgta cgtgcccgag cccatgacct actggcaggt gctgggcgcc 360 agcgagacca tcgccaacat ctacaccaca cagcacaggc tggaccaggg cgagatctct 420 gccggcgacg ccgccgtggt gatgaccagc gcccagatca caatgggcat gccctacgcc 480 gtgaccgacg ccgtgctggc ccctcacgtg ggcggcgagg ccggctctag ccacgcccct 540 ccccctgccc tgaccctgat cttcgaccgg caccccatcg cccacctgct gtgctaccct 600 gccgccagat acctgatggg cagcatgacc ccccaggccg tgctggcctt cgtggccctg 660 atccccccca ccctgcccgg caccaacatc gtgctgggag ccctgcccga ggaccggcac 720 atcgaccggc tggccaagcg gcagagaccc ggcgagcggc tggacctggc catgctggcc 780 gccatccggc gggtgtacgg cctgctggcc aacaccgtga gatacctgca gggcggaggg 840 tcttggtggg aggactgggg ccagctgtcc ggcaccgccg tgccacctca gggcgccgag 900 ccccagagca atgccggccc tcggccccac atcggcgaca ccctgtttac cctgttcaga 960 gcccccgagc tgctggcccc caacggcgac ctgtacaacg tgttcgcctg ggccctggac 1020 gtgctggcca agaggctgcg gcccatgcac gtgttcatcc tggactacga ccagagccct 1080 gccggctgca gggacgccct gctgcagctg accagcggca tggtgcagac ccacgtgacc 1140 acccccggca gcatccccac catctgcgac ctggcccgga ccttcgcccg ggagatgggc 1200 gaggccaacg gctccggaga gggcagagga agtctgctaa catgcggtga cgtcgaggag 1260 aatcctggcc cactcgagat ggccacaacc atggtgagca agggcgagga ggataacatg 1320 gccatcatca aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac 1380 gagttcgaga tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag 1440 ctgaaggtga ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc 1500 atgtacggct ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg 1560 tccttccccg agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg 1620 accgtgaccc aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc 1680 ggcaccaact tcccctccga cggccccgta atgcagaaga agaccatggg ctgggaggcc 1740 tcctccgagc ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg 1800 aagctgaagg acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag 1860 cccgtgcagc tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac 1920 gaggactaca ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcg 1978 <210> 59 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 59 gctttctgac aaaaagtttc aatatgttat gtcaacagat ag 42 <210> 60 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 60 ctatctgttg acataacata ttgaaacttt ttgtcagaaa gc 42 <210> 61 <211> 758 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 61 ggagaatcct ggcccactcg aggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc 60 catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg 120 cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct 180 gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg 240 ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt 300 ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa 360 gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga 420 cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg tctatatcat 480 ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga 540 cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt 600 gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga 660 gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat 720 ggacgagctg tacaagtagc tttctgacaa aaagtttc 758 <210> 62 <211> 6080 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 62 tagctttctg acaaaaagtt tcaatatgtt atgtcaacag atagttgtgt ttttattgtt 60 aactcttgtc tatttttgtc ttatatatat ttctttgtta tcaaacttca gctgtacttc 120 gtcttctaat ttcaaaaata taacttaaaa atgtaaatat tctatatgaa tttaaatata 180 attctgtaaa tgtgtgtagg tctcactgta acaactattt gttactataa taaaactata 240 atattgatgt caggaatcag gaaaaaattt gagttggctt aaatcatctc agtccttatg 300 gcagttttat tttcctgtag ttggaactac taaaatttag gaaaatgcta agttcaagtt 360 tcgtaatgct ttgaagtatt tttatgctct gaatgtttaa atgttctcat cagtttcttg 420 ccatgttgtt aactatacaa cctggctaaa gatgaatatt tttctactgg tattttaatt 480 tttgacctaa atgtttaagc attcggaatg agaaaactat acagatttga gaaatgatgc 540 taaatttata ggagttttca gtaacttaaa aagctaacat gagagcatgc caaaatttgc 600 taagtcttac aaagatcaag ggctgtccgc aacagggaag aacagttttg aaaatttatg 660 aactatctta tttttaggta ggttttgaaa gctttttgtc taagtgaatt cttatgcctt 720 ggtcagagta ataactgaag gaggtgctta tcttggcttt cgagtctgag tttaaaacta 780 cacattttga catagtgttt attagcagcc atctaaaaag gctctaatgt atatttaact 840 aaaattacta gctttgggaa ttaaactgtt taacaaataa tgctgctcat tgtgattctt 900 acctataagc agcctaattt gaattatttg ctgcaatcga attcccgcgg ccgccatggc 960 ggccgggagc atgcgacgtc gggcccaatt cgccctatag tgagtcgtat tacaattcac 1020 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 1080 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 1140 cttcccaaca gttgcgcagc ctgaatggcg aatggacgcg ccctgtagcg gcgcattaag 1200 cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 1260 cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 1320 tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 1380 aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 1440 ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 1500 actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 1560 ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 1620 gcttacaatt tcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 1680 atcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 1740 acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 1800 aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 1860 attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 1920 tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 1980 gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2040 cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 2100 tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2160 agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2220 tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 2280 tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 2340 tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 2400 acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 2460 accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 2520 tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 2580 cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 2640 tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 2700 actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 2760 tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 2820 cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 2880 gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 2940 tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3000 gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3060 gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3120 ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3180 acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3240 agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 3300 cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 3360 tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 3420 gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 3480 ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 3540 ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 3600 cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 3660 ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 3720 taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 3780 tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 3840 ttacgccaag ctatttaggt gacactatag aatactcaag ctatgcatcc aacgcgttgg 3900 gagctctccc atatggtcga cctgcaggcg gccgcgaatt cactagtgat tgttacttcc 3960 cttcgagcct caatgtcctc atttgtaaaa tgacattaat acctactttt agctgtggga 4020 attgagtacc atgatttata caaagcagtt tgtatggtgc tggttacatg agagttcaga 4080 tggtaactag ttagtaaaaa atctctagtg tgcttgttga ttttatttta ttttagtatt 4140 tcttaaagat caaatttaac atcaatccta aactttattt agctttttct ggcgtgtaaa 4200 ctaacatact aagttgtgtg actataattc atttagtgac tcatttttag ctatttttat 4260 aacacattgt gctatggggg gttttggaac ttgctggaag ctacatcaga aactgccata 4320 gttaattgcc atttcaagaa tgttgtaaat aactcaggtg gccgtttaat tctcaatgta 4380 aatataatta actagacatc tttcctatat ttgtgtctca gttttaaagc tatttctgga 4440 tgcttgagtc ttaccgtaat tgataacaaa aagaggttat tgagaatatc tatgatttac 4500 agagtaagtt attctagacc tcaagagtga aatgtagggg aggagacatt tgtgtgttaa 4560 actaatggaa atgctcattt aatagatatt cactgaaagt attagttttg gtttattgct 4620 agaaaagttg aggttttatg gagatttttg taaaaaatgg tttatttcct aaataaatat 4680 ctctttttct tttttctccc agaaaatgtt aatctatgat ccagccaaac gaatttctgg 4740 caaaatggca ctgaatcatc catattttaa tgatttggac aatcagatta agaagatggg 4800 atccggttct ggcgtgaaac agactttgaa ttttgacctt ctcaagttgg cgggagacgt 4860 ggagtccaac ccagggccca tggccagcta cccctgtcac cagcacgcca gcgccttcga 4920 ccaggccgcc agaagcaggg gccacagcaa ccggcggacc gccctgagac ccaggcggca 4980 gcaggaagcc accgaagtcc ggctggaaca gaagatgccc accctgttaa gggtgtacat 5040 cgacggcccc cacggcatgg gcaagaccac caccacccag ctgctggtgg ccctgggcag 5100 ccgggacgac atcgtgtacg tgcccgagcc catgacctac tggcaggtgc tgggcgccag 5160 cgagaccatc gccaacatct acaccacaca gcacaggctg gaccagggcg agatctctgc 5220 cggcgacgcc gccgtggtga tgaccagcgc ccagatcaca atgggcatgc cctacgccgt 5280 gaccgacgcc gtgctggccc ctcacgtggg cggcgaggcc ggctctagcc acgcccctcc 5340 ccctgccctg accctgatct tcgaccggca ccccatcgcc cacctgctgt gctaccctgc 5400 cgccagatac ctgatgggca gcatgacccc ccaggccgtg ctggccttcg tggccctgat 5460 cccccccacc ctgcccggca ccaacatcgt gctgggagcc ctgcccgagg accggcacat 5520 cgaccggctg gccaagcggc agagacccgg cgagcggctg gacctggcca tgctggccgc 5580 catccggcgg gtgtacggcc tgctggccaa caccgtgaga tacctgcagg gcggagggtc 5640 ttggtgggag gactggggcc agctgtccgg caccgccgtg ccacctcagg gcgccgagcc 5700 ccagagcaat gccggccctc ggccccacat cggcgacacc ctgtttaccc tgttcagagc 5760 ccccgagctg ctggccccca acggcgacct gtacaacgtg ttcgcctggg ccctggacgt 5820 gctggccaag aggctgcggc ccatgcacgt gttcatcctg gactacgacc agagccctgc 5880 cggctgcagg gacgccctgc tgcagctgac cagcggcatg gtgcagaccc acgtgaccac 5940 ccccggcagc atccccacca tctgcgacct ggcccggacc ttcgcccggg agatgggcga 6000 ggccaacggc tccggagagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa 6060 tcctggccca ctcgaggtga 6080 <210> 63 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 63 taccgttcgt atagcataca ttatacgaag ttataccatg tctagactgg acaagagc 58 <210> 64 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 64 gcagagggaa aaagatctgc gactctagag g 31 <210> 65 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 65 acgagtgtac acacacgagg tag 23 <210> 66 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 66 tgtcaaccgg agtggagtaa cg 22 <210> 67 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 67 atggagggga atacagccc 19 <210> 68 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 68 ttctttgcag ctccttcgtt 20 <210> 69 <211> 982 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 69 aagatacatc tctgcttctt tctggattga tttttctttg aagatgaatg tgagaaatag 60 aacttaaagg tctattctga gtgtgcttta taaatgattt tatcatcagt gatgggtgtt 120 agaaaaatct aggtaattat gcctggagtt ctgacgtttc attggcaaac ttcagaggaa 180 gtcttgaact tctggttgtc agcttttttt tttaacccat tcattgtgat tcaagtatac 240 cgtttttctg cttagtcctt gacattgttt aggttataat tagaatttta tctgtggaat 300 tgcacttttc attcttttgt tttacggtgc ttaagtgata tttcctactc ttggaaaaag 360 taccttgaaa gtcttgagca tgtttgtctg tgacctcagc aagcagagga aaaagattaa 420 aattgtcacg tgggcaactg taaacactta aaatgttttt gtcgttttaa acaaaatttt 480 cctaatgaac agtctgaaca cattttagtt ctgtcctcat aactttaaaa aataatgttt 540 tgaataaaat taggagtatc ataaagcggt ataaatttgt tgaaatattt gggtataact 600 ttggcacacg caggtactac tttaaagtgt cacaaaaagg gaacataatt ctggtttttg 660 tttggaaaga atagacaagt tgatacctga atttgagggt tattttgatt ggaagaagct 720 aaatactaca ctagtataga atatacacgt ttccaatgtc tcaggagtca agaaggatgg 780 aaagttattg taggagtcct tacccttgta aatattgttt gaatgtaatt aatatttatg 840 gaatacttat gctgcagtag gcactgtgga aaatgcttta catatagtgt ttcattaatg 900 cttaaaacta ctcgagttag tggcatgtaa ttaagtcagt ttttccttca ctttaggatc 960 taccataccc attgactaac tc 982 <210> 70 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 70 aaatcctgca ggaagataca tctctgcttc tttctggatt g 41 <210> 71 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 71 aaatcctgca ggagttagtc aatgggtatg gtagatccta aagtg 45 <210> 72 <211> 943 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 72 aagattatac caaaatagag aaaattggag aaggtgagtg gttttagtaa aataaatttt 60 atggaatgat ttaacaatgc tacaacttct gtaatatgaa cacatttaaa tatttattaa 120 aattcaacca ttaagttgtc ttgtagtacc agtgtgcatt aacatatgtt ctttacttaa 180 taaacgcaaa tttgctcaca tttcaagaga attgaaatta ccgaatccct aatgaccgtt 240 cgcctcaccc ccatagtctt acagtcttct gatactaaac acttatagta gtacttgtat 300 tttgaagaca ctattgataa cttgcatgtg tgttgagggg cagaggttag ggctgcagaa 360 ttatgctaac ttcataatat atttttagtt ttagtctctt tcaattgttt ttaggatgat 420 aaatattttt atccagactt tatagactgg ttacaataat tgacttaatc taatttaaat 480 aaaatttcta tttagttacc ctaagtataa atgacctgtc atatagacat gtttaagcta 540 ttctaaaatt ataacttatg tatataatcc ttccctttct gtggtacttg aaggaatgtt 600 tagatctata tatggcacaa atgaggggta tatcccttcg cctgttcctc gactccagca 660 gaacattctc gattctccag gtacaaaata atttgctaat agaatccagt ttatataggt 720 tctgccagaa gaaaattccc aactatattt ttaatgtgat caaagacccc acttgacaag 780 aaatagtgaa aaacaagggg gaatactgga gggaatttag tggaatagga gtgacaagtt 840 agtgtggtgt tcgattggag gtgtgtgtgt gtatacatat atatatatat ttttttttta 900 aatcacttaa atacctcata cccattctac taaacaaatt ttg 943 <210> 73 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 73 ttaaccatgg aagattatac caaaatagag aaaattgg 38 <210> 74 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 74 tttagcatgc caaaatttgt ttagtagaat gggtatgagg 40 <210> 75 <211> 8604 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 75 tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600 acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660 gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820 acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880 tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggaagatac 2940 atctctgctt ctttctggat tgatttttct ttgaagatga atgtgagaaa tagaacttaa 3000 aggtctattc tgagtgtgct ttataaatga ttttatcatc agtgatgggt gttagaaaaa 3060 tctaggtaat tatgcctgga gttctgacgt ttcattggca aacttcagag gaagtcttga 3120 acttctggtt gtcagctttt ttttttaacc cattcattgt gattcaagta taccgttttt 3180 ctgcttagtc cttgacattg tttaggttat aattagaatt ttatctgtgg aattgcactt 3240 ttcattcttt tgttttacgg tgcttaagtg atatttccta ctcttggaaa aagtaccttg 3300 aaagtcttga gcatgtttgt ctgtgacctc agcaagcaga ggaaaaagat taaaattgtc 3360 acgtgggcaa ctgtaaacac ttaaaatgtt tttgtcgttt taaacaaaat tttcctaatg 3420 aacagtctga acacatttta gttctgtcct cataacttta aaaaataatg ttttgaataa 3480 aattaggagt atcataaagc ggtataaatt tgttgaaata tttgggtata actttggcac 3540 acgcaggtac tactttaaag tgtcacaaaa agggaacata attctggttt ttgtttggaa 3600 agaatagaca agttgatacc tgaatttgag ggttattttg attggaagaa gctaaatact 3660 acactagtat agaatataca cgtttccaat gtctcaggag tcaagaagga tggaaagtta 3720 ttgtaggagt ccttaccctt gtaaatattg tttgaatgta attaatattt atggaatact 3780 tatgctgcag taggcactgt ggaaaatgct ttacatatag tgtttcatta atgcttaaaa 3840 ctactcgagt tagtggcatg taattaagtc agtttttcct tcactttagg atctaccata 3900 cccattgact aactcctgca ggcggccgcg aattcactag tgattaccgt tcgtatagca 3960 tacattatac gaagttatac catgtctaga ctggacaaga gcaaagtcat aaacggcgct 4020 ctggaattac tcaatggagt cggtatcgaa ggcctgacga caaggaaact cgctcaaaag 4080 ctgggagttg agcagcctac cctgtactgg cacgtgaaga acaagcgggc cctgctcgat 4140 gccctgccaa tcgagatgct ggacaggcat catacccact tctgccccct ggaaggcgag 4200 tcatggcaag actttctgcg gaacaacgcc aagtcattcc gctgtgctct cctctcacat 4260 cgcgacgggg ctaaagtgca tctcggcacc cgcccaacag agaaacagta cgaaaccctg 4320 gaaaatcagc tcgcgttcct gtgtcagcaa ggcttctccc tggagaacgc actgtacgct 4380 ctgtccgccg tgggccactt tacactgggc tgcgtattgg aggaacagga gcatcaagta 4440 gcaaaagagg aaagagagac acctaccacc gattctatgc ccccacttct gagacaagca 4500 attgagctgt tcgaccggca gggagccgaa cctgccttcc ttttcggcct ggaactaatc 4560 atatgtggcc tggagaaaca gctaaagtgc gaaagcggcg ggccggccga cgcccttgac 4620 gattttgact tagacatgct cccagccgat gcccttgacg actttgacct tgatatgctg 4680 cctgctgacg ctcttgacga ttttgacctt gacatgctcc ccgggtaact aagtaaggat 4740 cccaaatacc actgaattaa gaattccgcc cctctccctc ccccccccct aacgttactg 4800 gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 4860 tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 4920 ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 4980 cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 5040 ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 5100 ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 5160 aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 5220 gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 5280 aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata 5340 atatggccac aaccatgacc gagtacaagc ccacggtgcg cctcgccacc cgcgacgacg 5400 tcccccgggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc acgcgccaca 5460 ccgtcgaccc ggaccgccac atcgagcggg tcaccgagct gcaagaactc ttcctcacgc 5520 gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg gtggcggtct 5580 ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc ccgcgcatgg 5640 ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc ctggcgccgc 5700 accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg cgtctcgccc gaccaccagg 5760 gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag cgcgccgggg 5820 tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag cggctcggct 5880 tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc atgacccgca 5940 agcccggtgc ctgaggatcc agacatgata agatacattg atgagtttgg acaaaccaca 6000 actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 6060 gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 6120 caggttcagg gggaggtgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 6180 atggctgatt atgatcctct agagtcgcag atccagacat gataagatac attgatgagt 6240 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 6300 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 6360 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 6420 tctacaaatg tggtatggct gattatgatc ctctagagtc gcagatccag acatgataag 6480 atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg 6540 tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 6600 caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 6660 aagcaagtaa aacctctaca aatgtggtat ggctgattat gatcctctag agtcgcagat 6720 cctctagagt cgcagatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc 6780 ttgagcatct gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga 6840 attttttgtg tctctcactc ggaaggacat atgggagggc aaatcattta aaacatcaga 6900 atgagtattt ggtttagagt ttggcaacat atgccatatg ctggctgcca tgaacaaagg 6960 tggctataaa gaggtcatca gtatatgaaa cagccccctg ctgtccattc cttattccat 7020 agaaaagcct tgacttgagg ttagattttt tttatatttt gttttgtgtt atttttttct 7080 ttaacatccc taaaattttc cttacatgtt ttactagcca gatttttcct cctctcctga 7140 ctactcccag tcatagctgt ccctcttctc ttatgaagat ccctcgacct gcagcccaag 7200 cttatcgaat tcccgcggtg gcggccgcac gtctccctat cagtgataga gaagtcgaca 7260 cgtctcgagc tccctatcag tgatagagaa ggtacgtcta gaacgtctcc ctatcagtga 7320 tagagaagtc gacacgtctc gagctcccta tcagtgatag agaaggtacg tctagaacgt 7380 ctccctatca gtgatagaga agtcgacacg tctcgagctc cctatcagtg atagagaagg 7440 tacgtctaga acgtctccct atcagtgata gagaagtcga cacgtctcga gctccctatc 7500 agtgatagag aaggtacccc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 7560 tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg atccagcctc 7620 cgcggccgcc atggaagatt ataccaaaat agagaaaatt ggagaaggtg agtggtttta 7680 gtaaaataaa ttttatggaa tgatttaaca atgctacaac ttctgtaata tgaacacatt 7740 taaatattta ttaaaattca accattaagt tgtcttgtag taccagtgtg cattaacata 7800 tgttctttac ttaataaacg caaatttgct cacatttcaa gagaattgaa attaccgaat 7860 ccctaatgac cgttcgcctc acccccatag tcttacagtc ttctgatact aaacacttat 7920 agtagtactt gtattttgaa gacactattg ataacttgca tgtgtgttga ggggcagagg 7980 ttagggctgc agaattatgc taacttcata atatattttt agttttagtc tctttcaatt 8040 gtttttagga tgataaatat ttttatccag actttataga ctggttacaa taattgactt 8100 aatctaattt aaataaaatt tctatttagt taccctaagt ataaatgacc tgtcatatag 8160 acatgtttaa gctattctaa aattataact tatgtatata atccttccct ttctgtggta 8220 cttgaaggaa tgtttagatc tatatatggc acaaatgagg ggtatatccc ttcgcctgtt 8280 cctcgactcc agcagaacat tctcgattct ccaggtacaa aataatttgc taatagaatc 8340 cagtttatat aggttctgcc agaagaaaat tcccaactat atttttaatg tgatcaaaga 8400 ccccacttga caagaaatag tgaaaaacaa gggggaatac tggagggaat ttagtggaat 8460 aggagtgaca agttagtgtg gtgttcgatt ggaggtgtgt gtgtgtatac atatatatat 8520 atattttttt tttaaatcac ttaaatacct catacccatt ctactaaaca aattttggca 8580 tgcgacgtcg ggcccaattc gccc 8604 <210> 76 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 76 caccgatacc aaaatagaga aaat 24 <210> 77 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 77 aaacattttc tctattttgg tac 23 <210> 78 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 78 caccgcatag ttagtcaatg ggta 24 <210> 79 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 79 aaactaccca ttgactaact atgc 24 <210> 80 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 80 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg ataccaaaat agagaaaatg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 81 <211> 8440 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 81 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccc accgcatagt tagtcaatgg gtagttttag agctagaaat agcaagttaa 300 aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct tttttgtttt 360 agagctagaa atagcaagtt aaaataaggc tagtccgttt ttagcgcgtg cgccaattct 420 gcagacaaat ggctctagag gtacccgtta cataacttac ggtaaatggc ccgcctggct 480 gaccgcccaa cgacccccgc ccattgacgt caatagtaac gccaataggg actttccatt 540 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattgtg 660 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 720 ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 780 ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 840 gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga 900 ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg 960 cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg 1020 cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc 1080 tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt 1140 aattagctga gcaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1200 aattacctgg agcacctgcc tgaaatcact ttttttcagg ttggaccggt gccaccatgt 1260 acccatacga tgttccagat tacgcttcgc cgaagaaaaa gcgcaaggtc gaagcgtccg 1320 acaagaagta cagcatcggc ctggccatcg gcaccaactc tgtgggctgg gccgtgatca 1380 ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gaccggcaca 1440 gcatcaagaa gaacctgatc ggagccctgc tgttcgacag cggcgaaaca gccgaggcca 1500 cccggctgaa gagaaccgcc agaagaagat acaccagacg gaagaaccgg atctgctatc 1560 tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg 1620 aagagtcctt cctggtggaa gaggataaga agcacgagcg gcaccccatc ttcggcaaca 1680 tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac 1740 tggtggacag caccgacaag gccgacctgc ggctgatcta tctggccctg gcccacatga 1800 tcaagttccg gggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg 1860 acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca 1920 acgccagcgg cgtggacgcc aaggccatcc tgtctgccag actgagcaag agcagacggc 1980 tggaaaatct gatcgcccag ctgcccggcg agaagaagaa tggcctgttc ggcaacctga 2040 ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg 2100 ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga 2160 tcggcgacca gtacgccgac ctgtttctgg ccgccaagaa cctgtccgac gccatcctgc 2220 tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga 2280 tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc 2340 agctgcctga gaagtacaaa gagattttct tcgaccagag caagaacggc tacgccggct 2400 acattgacgg cggagccagc caggaagagt tctacaagtt catcaagccc atcctggaaa 2460 agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgcggaagc 2520 agcggacctt cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcca 2580 ttctgcggcg gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga 2640 agatcctgac cttccgcatc ccctactacg tgggccctct ggccagggga aacagcagat 2700 tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg 2760 tggacaaggg cgcttccgcc cagagcttca tcgagcggat gaccaacttc gataagaacc 2820 tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtata 2880 acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg 2940 gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caaccggaaa gtgaccgtga 3000 agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg 3060 gcgtggaaga tcggttcaac gcctccctgg gcacatacca cgatctgctg aaaattatca 3120 aggacaagga cttcctggac aatgaggaaa acgaggacat tctggaagat atcgtgctga 3180 ccctgacact gtttgaggac agagagatga tcgaggaacg gctgaaaacc tatgcccacc 3240 tgttcgacga caaagtgatg aagcagctga agcggcggag atacaccggc tggggcaggc 3300 tgagccggaa gctgatcaac ggcatccggg acaagcagtc cggcaagaca atcctggatt 3360 tcctgaagtc cgacggcttc gccaacagaa acttcatgca gctgatccac gacgacagcc 3420 tgacctttaa agaggacatc cagaaagccc aggtgtccgg ccagggcgat agcctgcacg 3480 agcacattgc caatctggcc ggcagccccg ccattaagaa gggcatcctg cagacagtga 3540 aggtggtgga cgagctcgtg aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg 3600 aaatggccag agagaaccag accacccaga agggacagaa gaacagccgc gagagaatga 3660 agcggatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg 3720 aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat gggcgggata 3780 tgtacgtgga ccaggaactg gacatcaacc ggctgtccga ctacgatgtg gaccatatcg 3840 tgcctcagag ctttctgaag gacgactcca tcgacaacaa ggtgctgacc agaagcgaca 3900 agaaccgggg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact 3960 actggcggca gctgctgaac gccaagctga ttacccagag aaagttcgac aatctgacca 4020 aggccgagag aggcggcctg agcgaactgg ataaggccgg cttcatcaag agacagctgg 4080 tggaaacccg gcagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta 4140 agtacgacga gaatgacaag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc 4200 tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc 4260 accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc 4320 ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga 4380 tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca 4440 tcatgaactt tttcaagacc gagattaccc tggccaacgg cgagatccgg aagcggcctc 4500 tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggccgg gattttgcca 4560 ccgtgcggaa agtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga 4620 caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgataag ctgatcgcca 4680 gaaagaagga ctgggaccct aagaagtacg gcggcttcga cagccccacc gtggcctatt 4740 ctgtgctggt ggtggccaaa gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag 4800 agctgctggg gatcaccatc atggaaagaa gcagcttcga gaagaatccc atcgactttc 4860 tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact 4920 ccctgttcga gctggaaaac ggccggaaga gaatgctggc ctctgccggc gaactgcaga 4980 agggaaacga actggccctg ccctccaaat atgtgaactt cctgtacctg gccagccact 5040 atgagaagct gaagggctcc cccgaggata atgagcagaa acagctgttt gtggaacagc 5100 acaagcacta cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc 5160 tggccgacgc taatctggac aaagtgctgt ccgcctacaa caagcaccgg gataagccca 5220 tcagagagca ggccgagaat atcatccacc tgtttaccct gaccaatctg ggagcccctg 5280 ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg 5340 tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca cggatcgacc 5400 tgtctcagct gggaggcgac agccccaaga agaagagaaa ggtggaggcc agctaagaat 5460 tcctagagct cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 5520 cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 5580 aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 5640 ggggcaggac agcaaggggg aggattggga agagaatagc aggcatgctg gggagcggcc 5700 gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 5760 ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 5820 gcgagcgcgc agctgcctgc aggggcgcct gatgcggtat tttctcctta cgcatctgtg 5880 cggtatttca caccgcatac gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta 5940 agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 6000 cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 6060 gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 6120 aaaaaacttg atttgggtga tggttcacgt agtgggccat cgccctgata gacggttttt 6180 cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 6240 acactcaacc ctatctcggg ctattctttt gatttataag ggattttgcc gatttcggcc 6300 tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 6360 acgtttacaa ttttatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 6420 cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 6480 tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 6540 tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 6600 gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 6660 acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 6720 ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 6780 gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 6840 ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 6900 gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 6960 agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 7020 caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 7080 gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 7140 agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 7200 gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 7260 aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 7320 ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 7380 tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 7440 tttattgctg ataaatctgg agccggtgag cgtggaagcc gcggtatcat tgcagcactg 7500 gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 7560 atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 7620 ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 7680 aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 7740 ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 7800 ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 7860 tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 7920 cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 7980 gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 8040 gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 8100 tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 8160 ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 8220 gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 8280 ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 8340 tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 8400 ttacggttcc tggccttttg ctggcctttt gctcacatgt 8440 <210> 82 <211> 8509 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 82 cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 60 caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 120 cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 180 gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 240 cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 300 cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 360 ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 420 cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 480 gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 540 gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 600 caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 660 cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 720 ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa 780 ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga 840 caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa 900 cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct 960 gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 1020 aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa 1080 gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 1140 ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 1200 cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 1260 cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 1320 aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 1380 cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 1440 aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag 1500 catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 1560 gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc 1620 taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 1680 agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 1740 catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 1800 agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 1860 cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 1920 gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 1980 ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga 2040 gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 2100 caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa 2160 tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 2220 caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 2280 ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 2340 caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagt aagaattcct 2400 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 2460 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 2520 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 2580 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 2640 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 2700 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 2760 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 2880 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 2940 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 3000 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 3060 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 3120 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 3180 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 3240 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 3300 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 3360 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 3420 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 3480 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 3540 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 3600 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 3660 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 3720 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 3780 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 3840 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 3900 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 3960 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4020 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4080 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4140 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4200 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4260 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4320 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4380 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 4440 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 4500 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 4560 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 4620 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 4680 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 4740 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 4800 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 4860 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 4920 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 4980 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5040 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5100 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5160 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5220 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5280 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5340 ggttcctggc cttttgctgg ccttttgctc acatgtgagg gcctatttcc catgattcct 5400 tcatatttgc atatacgata caaggctgtt agagagataa ttggaattaa tttgactgta 5460 aacacaaaga tattagtaca aaatacgtga cgtagaaagt aataatttct tgggtagttt 5520 gcagttttaa aattatgttt taaaatggac tatcatatgc ttaccgtaac ttgaaagtat 5580 ttcgatttct tggctttata tatcttgtgg aaaggacgaa acaccgccat agttagtcaa 5640 tgggtagttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 5700 aaaagtggca ccgagtcggt gcttttttgt tttagagcta gaaatagcaa gttaaaataa 5760 ggctagtccg tttttagcgc gtgcgccaat tctgcagaca aatggctcta gaggtacccg 5820 ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 5880 cgtcaatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 5940 aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 6000 tcaatgacgg taaatggccc gcctggcatt gtgcccagta catgacctta tgggactttc 6060 ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca 6120 cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta 6180 ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg 6240 gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 6300 agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 6360 aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc 6420 tccgccgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg 6480 agcgggcggg acggcccttc tcctccgggc tgtaattagc tgagcaagag gtaagggttt 6540 aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc 6600 actttttttc aggttggacc ggtgccacca tggactataa ggaccacgac ggagactaca 6660 aggatcatga tattgattac aaagacgatg acgataagat ggccccaaag aagaagcgga 6720 aggtcggtat ccacggagtc ccagcagccg acaagaagta cagcatcggc ctggacatcg 6780 gcaccaactc tgtgggctgg gccgtgatca ccgacgagta caaggtgccc agcaagaaat 6840 tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc ggagccctgc 6900 tgttcgacag cggcgaaaca gccgaggcca cccggctgaa gagaaccgcc agaagaagat 6960 acaccagacg gaagaaccgg atctgctatc tgcaagagat cttcagcaac gagatggcca 7020 aggtggacga cagcttcttc cacagactgg aagagtcctt cctggtggaa gaggataaga 7080 agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac cacgagaagt 7140 accccaccat ctaccacctg agaaagaaac tggtggacag caccgacaag gccgacctgc 7200 ggctgatcta tctggccctg gcccacatga tcaagttccg gggccacttc ctgatcgagg 7260 gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg gtgcagacct 7320 acaaccagct gttcgaggaa aaccccatca acgccagcgg cgtggacgcc aaggccatcc 7380 tgtctgccag actgagcaag agcagacggc tggaaaatct gatcgcccag ctgcccggcg 7440 agaagaagaa tggcctgttc ggaaacctga ttgccctgag cctgggcctg acccccaact 7500 tcaagagcaa cttcgacctg gccgaggatg ccaaactgca gctgagcaag gacacctacg 7560 acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac ctgtttctgg 7620 ccgccaagaa cctgtccgac gccatcctgc tgagcgacat cctgagagtg aacaccgaga 7680 tcaccaaggc ccccctgagc gcctctatga tcaagagata cgacgagcac caccaggacc 7740 tgaccctgct gaaagctctc gtgcggcagc agctgcctga gaagtacaaa gagattttct 7800 tcgaccagag caagaacggc tacgccggct acattgacgg cggagccagc caggaagagt 7860 tctacaagtt catcaagccc atcctggaaa agatggacgg caccgaggaa ctgctcgtga 7920 agctgaacag agaggacctg ctgcggaagc agcggacctt cgacaacggc agcatccccc 7980 accagatcca cctgggagag ctgcacgcca ttctgcggcg gcaggaagat ttttacccat 8040 tcctgaagga caaccgggaa aagatcgaga agatcctgac cttccgcatc ccctactacg 8100 tgggccctct ggccagggga aacagcagat tcgcctggat gaccagaaag agcgaggaaa 8160 ccatcacccc ctggaacttc gaggaagtgg tggacaaggg cgcttccgcc cagagcttca 8220 tcgagcggat gaccaacttc gataagaacc tgcccaacga gaaggtgctg cccaagcaca 8280 gcctgctgta cgagtacttc accgtgtata acgagctgac caaagtgaaa tacgtgaccg 8340 agggaatgag aaagcccgcc ttcctgagcg gcgagcagaa aaaggccatc gtggacctgc 8400 tgttcaagac caaccggaaa gtgaccgtga agcagctgaa agaggactac ttcaagaaaa 8460 tcgagtgctt cgactccgtg gaaatctccg gcgtggaaga tcggttcaa 8509 <210> 83 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 83 ggcccacctg gagctgttaa 20 <210> 84 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 84 cgccgtttat gactttgctc tt 22 <210> 85 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 85 agacgccatc cacgctgttt 20 <210> 86 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 86 gccaaaactc ataggccaaa 20 <210> 87 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 87 ccacagggag tgttagtgct gctcgcgatt ttgctggcat ctctatactc ttcgtgtgtg 60 gcagcctaag accgcaagca gaagaacttg ccagaacttt gccagcatta actcagcgct 120 tctcaacttc ctaaggttgc gacccttcaa catagcgtct catgttgtga tgccctgcta 180 ccataattat tccattgcta cttcataact gtaatttttt tgctgctgtt atgagttgta 240 aggtaaacta tctgatatgc gacccccaag agtcacgacc cacaggctga gaaccgctgc 300 cttggccagc cttgagggag ggatggcgtt gtttcctcgg tcaggaaaaa aaaaggaaaa 360 ctcatcgcag gattaagact ctgtaatctc aacagatctg aaataaagaa tgagcatccg 420 ttttctagtt atattcagaa ggacggctta gtcaaccact ttgcacttcc aaaatgcctt 480 ccctctcttc agagtgtctc tcagagcaca tggaccttcc tcattggtca gattttctgt 540 cagtaccacc aacaattgct attggtccat tttgaagatt ctcccgcctt cttttaccta 600 attggtttat tcgaaaaggc ggtcttttgt tcgaataaaa gacgatctac gattggttac 660 tgcaaacaga gccaatgaga gcgagtcggt gattggttcc tctgatttgg gcgggctaga 720 taaaggttca aatgaaacta gggaagctct cctaaccgac aagcgtctgt gaggggagcg 780 tccaggtccc gcgtcgcgcg tcgcgggtcg cctagcgttt cccgctggtt ttgtcgcttt 840 ccggattctc gagcctcttc aggaccgtca 870 <210> 88 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 88 aattcctgca ggccacaggg agtgttagtg ctgctcg 37 <210> 89 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 89 ttactagttg acggtcctga agaggctcga gaatcc 36 <210> 90 <211> 818 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 90 agttgtcacc gctgcaggta cagctcgcgg atggggccgg gtagtagagc ctttacgtgg 60 cctctgcgtt catggctgac ggcgagagtt gaggttccag ggccgagcgc tggccggcga 120 ccggctggat ccggtcagcc ccatcttctg ggccttgagg ggtcgtggac tgggtgaagc 180 tctttccgaa atgatatcta taatctaatc tgggttcttg agtgttgtgt ttttattgtt 240 tgtgggagca ggttcaacta gtcctgcgat cggtctgtag tctaatggct tctgtgtgac 300 ttccagccgg cttatactcg aattcagtgg ccctcttccc ttccctgggt gatttgaata 360 actcatcacg gaaggtgcag agcatggcag ttcccattga ggagctggcc gaccgagtgg 420 ctcaaaaaaa gtccagtttc gggatgtgaa tgtagccaag ggtttgcatt gctagcatcc 480 caactgctac gggtggatac catctgtaat cggcacgagc ctatgtcggc actcactaaa 540 tattttccca ttagatggaa gaagttgagt gtagtttatc gatgacataa aaaatattac 600 tcaaggcaga aatgtccata cttgcagaac taaaatacct atttaaacgg gcatctgtag 660 ccagacctag tggggcaggc ctgaaatggc agctgctcca gagactgagg caagaggatg 720 ccttaagcta tttaatggga ctctcaaaaa cagcaacagg gggtgaaaaa aatggtctgg 780 gaattttgct cagtggtcag agcatttgcc tagcatgt 818 <210> 91 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 91 ccgtcaccat ggagttgtca ccgctgc 27 <210> 92 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 92 cccttgcatg cacatgctag gcaaatgctc 30 <210> 93 <211> 8347 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 93 tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600 acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660 gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820 acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880 tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggccacagg 2940 gagtgttagt gctgctcgcg attttgctgg catctctata ctcttcgtgt gtggcagcct 3000 aagaccgcaa gcagaagaac ttgccagaac tttgccagca ttaactcagc gcttctcaac 3060 ttcctaaggt tgcgaccctt caacatagcg tctcatgttg tgatgccctg ctaccataat 3120 tattccattg ctacttcata actgtaattt ttttgctgct gttatgagtt gtaaggtaaa 3180 ctatctgata tgcgaccccc aagagtcacg acccacaggc tgagaaccgc tgccttggcc 3240 agccttgagg gagggatggc gttgtttcct cggtcaggaa aaaaaaagga aaactcatcg 3300 caggattaag actctgtaat ctcaacagat ctgaaataaa gaatgagcat ccgttttcta 3360 gttatattca gaaggacggc ttagtcaacc actttgcact tccaaaatgc cttccctctc 3420 ttcagagtgt ctctcagagc acatggacct tcctcattgg tcagattttc tgtcagtacc 3480 accaacaatt gctattggtc cattttgaag attctcccgc cttcttttac ctaattggtt 3540 tattcgaaaa ggcggtcttt tgttcgaata aaagacgatc tacgattggt tactgcaaac 3600 agagccaatg agagcgagtc ggtgattggt tcctctgatt tgggcgggct agataaaggt 3660 tcaaatgaaa ctagggaagc tctcctaacc gacaagcgtc tgtgagggga gcgtccaggt 3720 cccgcgtcgc gcgtcgcggg tcgcctagcg tttcccgctg gttttgtcgc tttccggatt 3780 ctcgagcctc ttcaggaccg tcaactagtg attaccgttc gtatagcata cattatacga 3840 agttatacca tgtctagact ggacaagagc aaagtcataa acggcgctct ggaattactc 3900 aatggagtcg gtatcgaagg cctgacgaca aggaaactcg ctcaaaagct gggagttgag 3960 cagcctaccc tgtactggca cgtgaagaac aagcgggccc tgctcgatgc cctgccaatc 4020 gagatgctgg acaggcatca tacccacttc tgccccctgg aaggcgagtc atggcaagac 4080 tttctgcgga acaacgccaa gtcattccgc tgtgctctcc tctcacatcg cgacggggct 4140 aaagtgcatc tcggcacccg cccaacagag aaacagtacg aaaccctgga aaatcagctc 4200 gcgttcctgt gtcagcaagg cttctccctg gagaacgcac tgtacgctct gtccgccgtg 4260 ggccacttta cactgggctg cgtattggag gaacaggagc atcaagtagc aaaagaggaa 4320 agagagacac ctaccaccga ttctatgccc ccacttctga gacaagcaat tgagctgttc 4380 gaccggcagg gagccgaacc tgccttcctt ttcggcctgg aactaatcat atgtggcctg 4440 gagaaacagc taaagtgcga aagcggcggg ccggccgacg cccttgacga ttttgactta 4500 gacatgctcc cagccgatgc ccttgacgac tttgaccttg atatgctgcc tgctgacgct 4560 cttgacgatt ttgaccttga catgctcccc gggtaactaa gtaaggatcc caaataccac 4620 tgaattaaga attccgcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 4680 tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg 4740 gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 4800 cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 4860 aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 4920 ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 4980 cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 5040 caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 5100 atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg 5160 ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggccacaa 5220 ccatgaccga gtacaagccc acggtgcgcc tcgccacccg cgacgacgtc ccccgggccg 5280 tacgcaccct cgccgccgcg ttcgccgact accccgccac gcgccacacc gtcgacccgg 5340 accgccacat cgagcgggtc accgagctgc aagaactctt cctcacgcgc gtcgggctcg 5400 acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt ggcggtctgg accacgccgg 5460 agagcgtcga agcgggggcg gtgttcgccg agatcggccc gcgcatggcc gagttgagcg 5520 gttcccggct ggccgcgcag caacagatgg aaggcctcct ggcgccgcac cggcccaagg 5580 agcccgcgtg gttcctggcc accgtcggcg tctcgcccga ccaccagggc aagggtctgg 5640 gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg cgccggggtg cccgccttcc 5700 tggagacctc cgcgccccgc aacctcccct tctacgagcg gctcggcttc accgtcaccg 5760 ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat gacccgcaag cccggtgcct 5820 gaggatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 5880 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 5940 agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 6000 gaggtgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtat ggctgattat 6060 gatcctctag agtcgcagat ccagacatga taagatacat tgatgagttt ggacaaacca 6120 caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat 6180 ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt 6240 ttcaggttca gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg 6300 gtatggctga ttatgatcct ctagagtcgc agatccagac atgataagat acattgatga 6360 gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 6420 tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 6480 cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 6540 cctctacaaa tgtggtatgg ctgattatga tcctctagag tcgcagatcc tctagagtcg 6600 cagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt gagcatctga 6660 cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat tttttgtgtc 6720 tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat gagtatttgg 6780 tttagagttt ggcaacatat gccatatgct ggctgccatg aacaaaggtg gctataaaga 6840 ggtcatcagt atatgaaaca gccccctgct gtccattcct tattccatag aaaagccttg 6900 acttgaggtt agattttttt tatattttgt tttgtgttat ttttttcttt aacatcccta 6960 aaattttcct tacatgtttt actagccaga tttttcctcc tctcctgact actcccagtc 7020 atagctgtcc ctcttctctt atgaagatcc ctcgacctgc agcccaagct tatcgaattc 7080 ccgcggtggc ggccgcacgt ctccctatca gtgatagaga agtcgacacg tctcgagctc 7140 cctatcagtg atagagaagg tacgtctaga acgtctccct atcagtgata gagaagtcga 7200 cacgtctcga gctccctatc agtgatagag aaggtacgtc tagaacgtct ccctatcagt 7260 gatagagaag tcgacacgtc tcgagctccc tatcagtgat agagaaggta cgtctagaac 7320 gtctccctat cagtgataga gaagtcgaca cgtctcgagc tccctatcag tgatagagaa 7380 ggtaccccct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 7440 ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgccat 7500 ggagttgtca ccgctgcagg tacagctcgc ggatggggcc gggtagtaga gcctttacgt 7560 ggcctctgcg ttcatggctg acggcgagag ttgaggttcc agggccgagc gctggccggc 7620 gaccggctgg atccggtcag ccccatcttc tgggccttga ggggtcgtgg actgggtgaa 7680 gctctttccg aaatgatatc tataatctaa tctgggttct tgagtgttgt gtttttattg 7740 tttgtgggag caggttcaac tagtcctgcg atcggtctgt agtctaatgg cttctgtgtg 7800 acttccagcc ggcttatact cgaattcagt ggccctcttc ccttccctgg gtgatttgaa 7860 taactcatca cggaaggtgc agagcatggc agttcccatt gaggagctgg ccgaccgagt 7920 ggctcaaaaa aagtccagtt tcgggatgtg aatgtagcca agggtttgca ttgctagcat 7980 cccaactgct acgggtggat accatctgta atcggcacga gcctatgtcg gcactcacta 8040 aatattttcc cattagatgg aagaagttga gtgtagttta tcgatgacat aaaaaatatt 8100 actcaaggca gaaatgtcca tacttgcaga actaaaatac ctatttaaac gggcatctgt 8160 agccagacct agtggggcag gcctgaaatg gcagctgctc cagagactga ggcaagagga 8220 tgccttaagc tatttaatgg gactctcaaa aacagcaaca gggggtgaaa aaaatggtct 8280 gggaattttg ctcagtggtc agagcatttg cctagcatgt gcatgcgacg tcgggcccaa 8340 ttcgccc 8347 <210> 94 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 94 caccgcatgg tgacggtcct gaag 24 <210> 95 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 95 aaaccttcag gaccgtcacc atgc 24 <210> 96 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 96 caccgccgct gcaggtacag ctcg 24 <210> 97 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 97 aaaccgagct gtacctgcag cggc 24 <210> 98 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 98 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg ccgctgcagg tacagctcgg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 99 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 99 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg catggtgacg gtcctgaagg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 100 <211> 874 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 100 catttcagat tcgaaccatg acacatttcc atagcagctg tgccatttta caccacccac 60 cccaatgttc caccaggctt ctatgaaacc actgattata taagtatttt cctgattaga 120 gtacacgttc atgatagatc atttagaaaa ctcaaaaaag caaaatgacg aaattctctt 180 tattctaatt acggagccat gacctgaatt catattactc ccgggagaaa aggaaaagcc 240 ggtttttttc tcaggcaatt ctgtcattgt gtttgatagc atggtccaat aatagtgctg 300 gcgcctgccc tgcctggacc ttgtcctcag attcctccgt cctggctgtc cccacgaccc 360 tatcttctga aaaggtcatg cagttaacca ggcttctgaa tcatatttgc tggttgcttt 420 caggagtgtc acgggtgctg tgtggagctg tcacattctt gggcatctgt ttccgtattt 480 ttaaagccac ctcaacgttt gatagaaaag cataaaactt ttgaggaagt gagctctaca 540 aacccaccac ccacgtaaga actgagccgt cctgcccaga gggcatctga aaaagagatc 600 aacaggaaaa gggtggggaa atcctgcctt ccttcccgtc ttcaagtacc cattggcttc 660 agacctttat tctcattggt ttatctggat gtcgctccac gctggctttc cagaaccagc 720 cactgagagt cacaaagttg ggatttaaaa gatgcggtgg gaggggcggg tgattttttg 780 aactgctggc gaccgagttc tggcggtcct gacgcgcacc ttgggcttgc tcgcgttcgg 840 tttcggcagc aggaccaaga aggcttaggg aagg 874 <210> 101 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 101 aattcctgca ggcatttcag attcgaacca tgacacattt cc 42 <210> 102 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 102 ttactagtcc ttccctaagc cttcttggtc ctgctgc 37 <210> 103 <211> 825 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 103 gcccgcgtcg caaaccgcag accccaagga ggagaccctc cagcccggcg cctggaccct 60 cgcgacagag ctccagtgta ggtaagcgag cctgccctgc acctccgagg ccggtgcggt 120 catcctgtgg ggccgggcct gtagagggac ggttcctggt cacggcttgc cgctaacctc 180 gcgtaggggt aatggttttt ttgtttattt gtttgtttgt ttgcttgttt gttcctgacc 240 ggtttacagc agggagaaaa acgaaatgca gacaagacaa ggagttggag caaagacaaa 300 ctcattctga cggacacggg gtcttttttt gcatttattt actttgcatg tattttgcat 360 ttattttgtg ttcgtgctct ggcgacggcc agaagagagc gtcggaaccc cggggccgga 420 gttacagttg tgagctgccc ttttttttag agtgctagga agagaactcg gcccccctgg 480 aagagcagcc tgggctatta acagctgaac cagctttcta actcctactc tttattattt 540 atttgcagca ctagagatgg aacccaggac tccgtgtatg ttaggcaagg gttctactac 600 agaactatat ccccaaccct ctccccgacc cttttttttt taagacggga actcggtatg 660 tatcggtgtg tagccttggc ttgctgacct gaaacgtgct atgtagacta ggctagccta 720 gagctcacag atctctgcct gtgttgggga tggttgtatg cagtgtgtat tcaggaacta 780 tttctgagat ctggttacaa tccagacact gcctcaatgt gatgt 825 <210> 104 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 104 agccatgggc ccgcgtcgca aac 23 <210> 105 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 105 aattgcatgc acatcacatt gaggcagtgt ctgg 34 <210> 106 <211> 8358 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 106 tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600 acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660 gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820 acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880 tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcatttca 2940 gattcgaacc atgacacatt tccatagcag ctgtgccatt ttacaccacc caccccaatg 3000 ttccaccagg cttctatgaa accactgatt atataagtat tttcctgatt agagtacacg 3060 ttcatgatag atcatttaga aaactcaaaa aagcaaaatg acgaaattct ctttattcta 3120 attacggagc catgacctga attcatatta ctcccgggag aaaaggaaaa gccggttttt 3180 ttctcaggca attctgtcat tgtgtttgat agcatggtcc aataatagtg ctggcgcctg 3240 ccctgcctgg accttgtcct cagattcctc cgtcctggct gtccccacga ccctatcttc 3300 tgaaaaggtc atgcagttaa ccaggcttct gaatcatatt tgctggttgc tttcaggagt 3360 gtcacgggtg ctgtgtggag ctgtcacatt cttgggcatc tgtttccgta tttttaaagc 3420 cacctcaacg tttgatagaa aagcataaaa cttttgagga agtgagctct acaaacccac 3480 cacccacgta agaactgagc cgtcctgccc agagggcatc tgaaaaagag atcaacagga 3540 aaagggtggg gaaatcctgc cttccttccc gtcttcaagt acccattggc ttcagacctt 3600 tattctcatt ggtttatctg gatgtcgctc cacgctggct ttccagaacc agccactgag 3660 agtcacaaag ttgggattta aaagatgcgg tgggaggggc gggtgatttt ttgaactgct 3720 ggcgaccgag ttctggcggt cctgacgcgc accttgggct tgctcgcgtt cggtttcggc 3780 agcaggacca agaaggctta gggaaggact agtgattacc gttcgtatag catacattat 3840 acgaagttat accatgtcta gactggacaa gagcaaagtc ataaacggcg ctctggaatt 3900 actcaatgga gtcggtatcg aaggcctgac gacaaggaaa ctcgctcaaa agctgggagt 3960 tgagcagcct accctgtact ggcacgtgaa gaacaagcgg gccctgctcg atgccctgcc 4020 aatcgagatg ctggacaggc atcataccca cttctgcccc ctggaaggcg agtcatggca 4080 agactttctg cggaacaacg ccaagtcatt ccgctgtgct ctcctctcac atcgcgacgg 4140 ggctaaagtg catctcggca cccgcccaac agagaaacag tacgaaaccc tggaaaatca 4200 gctcgcgttc ctgtgtcagc aaggcttctc cctggagaac gcactgtacg ctctgtccgc 4260 cgtgggccac tttacactgg gctgcgtatt ggaggaacag gagcatcaag tagcaaaaga 4320 ggaaagagag acacctacca ccgattctat gcccccactt ctgagacaag caattgagct 4380 gttcgaccgg cagggagccg aacctgcctt ccttttcggc ctggaactaa tcatatgtgg 4440 cctggagaaa cagctaaagt gcgaaagcgg cgggccggcc gacgcccttg acgattttga 4500 cttagacatg ctcccagccg atgcccttga cgactttgac cttgatatgc tgcctgctga 4560 cgctcttgac gattttgacc ttgacatgct ccccgggtaa ctaagtaagg atcccaaata 4620 ccactgaatt aagaattccg cccctctccc tccccccccc ctaacgttac tggccgaagc 4680 cgcttggaat aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct 4740 tttggcaatg tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt 4800 ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct 4860 ctggaagctt cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc 4920 ccacctggcg acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag 4980 gcggcacaac cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc 5040 tcctcaagcg tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga 5100 tctgatctgg ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc 5160 taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc 5220 acaaccatga ccgagtacaa gcccacggtg cgcctcgcca cccgcgacga cgtcccccgg 5280 gccgtacgca ccctcgccgc cgcgttcgcc gactaccccg ccacgcgcca caccgtcgac 5340 ccggaccgcc acatcgagcg ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg 5400 ctcgacatcg gcaaggtgtg ggtcgcggac gacggcgccg cggtggcggt ctggaccacg 5460 ccggagagcg tcgaagcggg ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg 5520 agcggttccc ggctggccgc gcagcaacag atggaaggcc tcctggcgcc gcaccggccc 5580 aaggagcccg cgtggttcct ggccaccgtc ggcgtctcgc ccgaccacca gggcaagggt 5640 ctgggcagcg ccgtcgtgct ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc 5700 ttcctggaga cctccgcgcc ccgcaacctc cccttctacg agcggctcgg cttcaccgtc 5760 accgccgacg tcgaggtgcc cgaaggaccg cgcacctggt gcatgacccg caagcccggt 5820 gcctgaggat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 5880 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 5940 tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 6000 gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtatggctga 6060 ttatgatcct ctagagtcgc agatccagac atgataagat acattgatga gtttggacaa 6120 accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 6180 ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 6240 atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa 6300 tgtggtatgg ctgattatga tcctctagag tcgcagatcc agacatgata agatacattg 6360 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 6420 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 6480 attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt taaagcaagt 6540 aaaacctcta caaatgtggt atggctgatt atgatcctct agagtcgcag atcctctaga 6600 gtcgcagatc tttttccctc tgccaaaaat tatggggaca tcatgaagcc ccttgagcat 6660 ctgacttctg gctaataaag gaaatttatt ttcattgcaa tagtgtgttg gaattttttg 6720 tgtctctcac tcggaaggac atatgggagg gcaaatcatt taaaacatca gaatgagtat 6780 ttggtttaga gtttggcaac atatgccata tgctggctgc catgaacaaa ggtggctata 6840 aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc 6900 cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc 6960 cctaaaattt tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc 7020 agtcatagct gtccctcttc tcttatgaag atccctcgac ctgcagccca agcttatcga 7080 attcccgcgg tggcggccgc acgtctccct atcagtgata gagaagtcga cacgtctcga 7140 gctccctatc agtgatagag aaggtacgtc tagaacgtct ccctatcagt gatagagaag 7200 tcgacacgtc tcgagctccc tatcagtgat agagaaggta cgtctagaac gtctccctat 7260 cagtgataga gaagtcgaca cgtctcgagc tccctatcag tgatagagaa ggtacgtcta 7320 gaacgtctcc ctatcagtga tagagaagtc gacacgtctc gagctcccta tcagtgatag 7380 agaaggtacc ccctatataa gcagagctcg tttagtgaac cgtcagatcg cctggagacg 7440 ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg 7500 ccatgggccc gcgtcgcaaa ccgcagaccc caaggaggag accctccagc ccggcgcctg 7560 gaccctcgcg acagagctcc agtgtaggta agcgagcctg ccctgcacct ccgaggccgg 7620 tgcggtcatc ctgtggggcc gggcctgtag agggacggtt cctggtcacg gcttgccgct 7680 aacctcgcgt aggggtaatg gtttttttgt ttatttgttt gtttgtttgc ttgtttgttc 7740 ctgaccggtt tacagcaggg agaaaaacga aatgcagaca agacaaggag ttggagcaaa 7800 gacaaactca ttctgacgga cacggggtct ttttttgcat ttatttactt tgcatgtatt 7860 ttgcatttat tttgtgttcg tgctctggcg acggccagaa gagagcgtcg gaaccccggg 7920 gccggagtta cagttgtgag ctgccctttt ttttagagtg ctaggaagag aactcggccc 7980 ccctggaaga gcagcctggg ctattaacag ctgaaccagc tttctaactc ctactcttta 8040 ttatttattt gcagcactag agatggaacc caggactccg tgtatgttag gcaagggttc 8100 tactacagaa ctatatcccc aaccctctcc ccgacccttt tttttttaag acgggaactc 8160 ggtatgtatc ggtgtgtagc cttggcttgc tgacctgaaa cgtgctatgt agactaggct 8220 agcctagagc tcacagatct ctgcctgtgt tggggatggt tgtatgcagt gtgtattcag 8280 gaactatttc tgagatctgg ttacaatcca gacactgcct caatgtgatg tgcatgcgac 8340 gtcgggccca attcgccc 8358 <210> 107 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 107 caccgtcgca aaccgcagac ccca 24 <210> 108 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 108 aaactggggt ctgcggtttg cgac 24 <210> 109 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 109 caccgtggct ggcctcgagg ggcc 24 <210> 110 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 110 aaacggcccc tcgaggccag ccac 24 <210> 111 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 111 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg tcgcaaaccg cagaccccag ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 112 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 112 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg tggctggcct cgaggggccg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 113 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 113 tctggaactc actatgtagg tctactggc 29 <210> 114 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 114 ttgacctcca tagaagacac cg 22 <210> 115 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 115 ctcttcttct cacctggtct cttcaggacc 30 <210> 116 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 116 acctcctctc cttacatgct ggtc 24 <210> 117 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 117 tacattccac tggcagctta ggg 23 <210> 118 <211> 617 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 118 ggagctccgg cgctgcccca gatctggcag ctgtacctca agaactaccg catcgccacc 60 ttcaagaact ggcccttcct ggaggactgc gcctgcaccc cagagcgagt gagtcccagc 120 ttccagcgac tccaccctgg gcccgacggt gccttagttg tgtgacccgg gatcagaacc 180 cgctatcccc accctcgctt cgtactgtta gccaggctgc tttgctctgc tctgtcctcc 240 acgaggccac cccccccccc cgctctcccc accctctgcc tgaaccactg ttagcctccg 300 ggcctcttcc cactgtcctc agttctcggc ccggaacgat ctctgggaat catgggataa 360 ggtcagactg ttgatcccgc tcacgagctg tcattttcag atggcggagg ctggcttcat 420 ccactgccct accgagaacg agcctgattt ggcccagtgt tttttctgct ttaaggaatt 480 ggaaggctgg gaacccgatg acaacccgat gtaagtccca caggctactc tcggtgggtt 540 tcctggtgtt ccccttccat tgagagcctt ttgggttgaa ctggagttgg gacaaaccat 600 ttgtatttag tagaaga 617 <210> 119 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 119 caccatggga gctccggcgc tgccccagat c 31 <210> 120 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 120 taactggaac acttgagcaa gaagcatgct cttc 34 <210> 121 <211> 775 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 121 cagtgtgaag ctctttagaa gccactgcaa ccacaggccg cccgacagga acagagacac 60 tgaaaacggg cccgcagcaa ggcaggctca gcagccaaca gtcacaccca ggaagcagta 120 tttttcttct gctcctggac tctcttgcgg tgtatggctg cttccctttg gtctgagcca 180 ggccgatggt ctcagaaata gacacccatt gactttcttt tccagcgctg ggacatacag 240 accccgcctc catcccaggg tgtctatagg aaggatggcg gctgctgcag ggaggagggt 300 ctcctgtctt cctaagggcg cccctccacc agcctgtggg tgggtccgag gcacttccat 360 tccgatatct agctggccaa atcctgcaaa ccttgaggca ggaagaacct gcagagcaca 420 tgggacttgc agcggacatg ctttaaagag gtgccccagg cccgtccacc gccctcggcc 480 accctccgtg tcctctgggg agcagctgcg gaagattcga gtcagaatag caagaaggaa 540 ccgcagcaga aggtacaact cccagcatgc cctgcgcccg ccacgcccac aaggccaggc 600 gcagatgggc gtggggcggg actttcccgg ctcgcctcgc gccgtccact cccagaaggc 660 agcgggcgag ggcgtggggc cggggctctc ccggcatgct ctgcggcgcg cctccgcccg 720 cgcgatttga atcctgcgtt tgagtcgtct tggcggaggt tgtggtgacg ccatc 775 <210> 122 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 122 aattcctgca ggcagtgtga agctctttag aagccactg 39 <210> 123 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 123 ttactagtga tggcgtcacc acaacctccg ccaag 35 <210> 124 <211> 8050 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 124 tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600 acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660 gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820 acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880 tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcagtgtg 2940 aagctcttta gaagccactg caaccacagg ccgcccgaca ggaacagaga cactgaaaac 3000 gggcccgcag caaggcaggc tcagcagcca acagtcacac ccaggaagca gtatttttct 3060 tctgctcctg gactctcttg cggtgtatgg ctgcttccct ttggtctgag ccaggccgat 3120 ggtctcagaa atagacaccc attgactttc ttttccagcg ctgggacata cagaccccgc 3180 ctccatccca gggtgtctat aggaaggatg gcggctgctg cagggaggag ggtctcctgt 3240 cttcctaagg gcgcccctcc accagcctgt gggtgggtcc gaggcacttc cattccgata 3300 tctagctggc caaatcctgc aaaccttgag gcaggaagaa cctgcagagc acatgggact 3360 tgcagcggac atgctttaaa gaggtgcccc aggcccgtcc accgccctcg gccaccctcc 3420 gtgtcctctg gggagcagct gcggaagatt cgagtcagaa tagcaagaag gaaccgcagc 3480 agaaggtaca actcccagca tgccctgcgc ccgccacgcc cacaaggcca ggcgcagatg 3540 ggcgtggggc gggactttcc cggctcgcct cgcgccgtcc actcccagaa ggcagcgggc 3600 gagggcgtgg ggccggggct ctcccggcat gctctgcggc gcgcctccgc ccgcgcgatt 3660 tgaatcctgc gtttgagtcg tcttggcgga ggttgtggtg acgccatcac tagtgattac 3720 cgttcgtata gcatacatta tacgaagtta taccatgtct agactggaca agagcaaagt 3780 cataaacggc gctctggaat tactcaatgg agtcggtatc gaaggcctga cgacaaggaa 3840 actcgctcaa aagctgggag ttgagcagcc taccctgtac tggcacgtga agaacaagcg 3900 ggccctgctc gatgccctgc caatcgagat gctggacagg catcataccc acttctgccc 3960 cctggaaggc gagtcatggc aagactttct gcggaacaac gccaagtcat tccgctgtgc 4020 tctcctctca catcgcgacg gggctaaagt gcatctcggc acccgcccaa cagagaaaca 4080 gtacgaaacc ctggaaaatc agctcgcgtt cctgtgtcag caaggcttct ccctggagaa 4140 cgcactgtac gctctgtccg ccgtgggcca ctttacactg ggctgcgtat tggaggaaca 4200 ggagcatcaa gtagcaaaag aggaaagaga gacacctacc accgattcta tgcccccact 4260 tctgagacaa gcaattgagc tgttcgaccg gcagggagcc gaacctgcct tccttttcgg 4320 cctggaacta atcatatgtg gcctggagaa acagctaaag tgcgaaagcg gcgggccggc 4380 cgacgccctt gacgattttg acttagacat gctcccagcc gatgcccttg acgactttga 4440 ccttgatatg ctgcctgctg acgctcttga cgattttgac cttgacatgc tccccgggta 4500 actaagtaag gatcccaaat accactgaat taagaattcc gcccctctcc ctcccccccc 4560 cctaacgtta ctggccgaag ccgcttggaa taaggccggt gtgcgtttgt ctatatgtta 4620 ttttccacca tattgccgtc ttttggcaat gtgagggccc ggaaacctgg ccctgtcttc 4680 ttgacgagca ttcctagggg tctttcccct ctcgccaaag gaatgcaagg tctgttgaat 4740 gtcgtgaagg aagcagttcc tctggaagct tcttgaagac aaacaacgtc tgtagcgacc 4800 ctttgcaggc agcggaaccc cccacctggc gacaggtgcc tctgcggcca aaagccacgt 4860 gtataagata cacctgcaaa ggcggcacaa ccccagtgcc acgttgtgag ttggatagtt 4920 gtggaaagag tcaaatggct ctcctcaagc gtattcaaca aggggctgaa ggatgcccag 4980 aaggtacccc attgtatggg atctgatctg gggcctcggt gcacatgctt tacatgtgtt 5040 tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg ggacgtggtt ttcctttgaa 5100 aaacacgatg ataatatggc cacaaccatg accgagtaca agcccacggt gcgcctcgcc 5160 acccgcgacg acgtcccccg ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 5220 gccacgcgcc acaccgtcga cccggaccgc cacatcgagc gggtcaccga gctgcaagaa 5280 ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 5340 gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 5400 ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 5460 ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 5520 cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 5580 gagcgcgccg gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac 5640 gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 5700 tgcatgaccc gcaagcccgg tgcctgagga tccagacatg ataagataca ttgatgagtt 5760 tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc 5820 tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat 5880 tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca agtaaaacct 5940 ctacaaatgt ggtatggctg attatgatcc tctagagtcg cagatccaga catgataaga 6000 tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 6060 gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 6120 aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa 6180 agcaagtaaa acctctacaa atgtggtatg gctgattatg atcctctaga gtcgcagatc 6240 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 6300 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 6360 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt 6420 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg tatggctgat tatgatcctc 6480 tagagtcgca gatcctctag agtcgcagat ctttttccct ctgccaaaaa ttatggggac 6540 atcatgaagc cccttgagca tctgacttct ggctaataaa ggaaatttat tttcattgca 6600 atagtgtgtt ggaatttttt gtgtctctca ctcggaagga catatgggag ggcaaatcat 6660 ttaaaacatc agaatgagta tttggtttag agtttggcaa catatgccat atgctggctg 6720 ccatgaacaa aggtggctat aaagaggtca tcagtatatg aaacagcccc ctgctgtcca 6780 ttccttattc catagaaaag ccttgacttg aggttagatt ttttttatat tttgttttgt 6840 gttatttttt tctttaacat ccctaaaatt ttccttacat gttttactag ccagattttt 6900 cctcctctcc tgactactcc cagtcatagc tgtccctctt ctcttatgaa gatccctcga 6960 cctgcagccc aagcttatcg aattcccgcg gtggcggccg cacgtctccc tatcagtgat 7020 agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtacgt ctagaacgtc 7080 tccctatcag tgatagagaa gtcgacacgt ctcgagctcc ctatcagtga tagagaaggt 7140 acgtctagaa cgtctcccta tcagtgatag agaagtcgac acgtctcgag ctccctatca 7200 gtgatagaga aggtacgtct agaacgtctc cctatcagtg atagagaagt cgacacgtct 7260 cgagctccct atcagtgata gagaaggtac cccctatata agcagagctc gtttagtgaa 7320 ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga 7380 ccgatccagc ctccgcggcc gccatgggag ctccggcgct gccccagatc tggcagctgt 7440 acctcaagaa ctaccgcatc gccaccttca agaactggcc cttcctggag gactgcgcct 7500 gcaccccaga gcgagtgagt cccagcttcc agcgactcca ccctgggccc gacggtgcct 7560 tagttgtgtg acccgggatc agaacccgct atccccaccc tcgcttcgta ctgttagcca 7620 ggctgctttg ctctgctctg tcctccacga ggccaccccc cccccccgct ctccccaccc 7680 tctgcctgaa ccactgttag cctccgggcc tcttcccact gtcctcagtt ctcggcccgg 7740 aacgatctct gggaatcatg ggataaggtc agactgttga tcccgctcac gagctgtcat 7800 tttcagatgg cggaggctgg cttcatccac tgccctaccg agaacgagcc tgatttggcc 7860 cagtgttttt tctgctttaa ggaattggaa ggctgggaac ccgatgacaa cccgatgtaa 7920 gtcccacagg ctactctcgg tgggtttcct ggtgttcccc ttccattgag agccttttgg 7980 gttgaactgg agttgggaca aaccatttgt atttagtaga agagcatgcg acgtcgggcc 8040 caattcgccc 8050 <210> 125 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 125 caccggacgc catcatggga gctc 24 <210> 126 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 126 aaacgagctc ccatgatggc gtcc 24 <210> 127 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 127 caccggccaa gacgactcaa acgc 24 <210> 128 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 128 aaacgcgttt gagtcgtctt ggcc 24 <210> 129 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 129 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg gacgccatca tgggagctcg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 130 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 130 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg gccaagacga ctcaaacgcg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 131 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 131 cactcgtttg caacgccaac ctgg 24 <210> 132 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 132 gaacccgatg acaacccgat ag 22 <210> 133 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 133 tccatctgct tcttgacagt gagg 24 <210> 134 <211> 817 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 134 gattaaaggc gtgcaccact actgtctgcc ttttgttttg gttttatcat aattgttgca 60 tttttgcccg caggaggatc aggaattcaa ggacaacctc tacagccaac ccagttgagg 120 gccagcctgt tctatcgaga tcctgtctcc ggacaaaaaa agtttcatga gagcgtggtg 180 tgttggcaca gtcttttagt ccgagcactg acgcagtaga ttaaggcaga tcttcatgat 240 ttggtgcggt cctgggctgc atccaaagac cttgtttcca aaacaaacaa acgaaaaagt 300 gtaataaaaa tacaagcaag gttttgcaga aataaatctg tggcctcaag ggtccctttc 360 tccagctttt cccagaggtg tcaaattaca taacagtctc aaacccagga aattgaactt 420 tggcacaacc cactgaccgg tccgaatttc aaagtctttt tcctattgac ctacaaggtt 480 ttcaagaatc atgttgtaag caactgtgtt ctgaggaatc tatgtttaaa aacccatccg 540 tggatcttgg cccagggtcc agagactgag ctagccacgc cccggccgcg ccgcagccac 600 tcccacggca gttcaagtgt taagtcccaa agaccgcgct ctgtgcatgc gcagacccgt 660 ccacagctgg ctcctagcca acccggccgg acgagcaccc ggcgccgtca cgtgacgcac 720 ccaaccggcg tcgacctata aaaggccggg cgttgacgtc agcggtctct tccgccgcag 780 ccgccgccat cgtcggcgcg cttccctgtt cacctct 817 <210> 135 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 135 tttaacctgc agggattaaa ggcgtgcacc actactg 37 <210> 136 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 136 tatataacta gtagaggtga acagggaagc gcgccg 36 <210> 137 <211> 826 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 137 gactctgaga atccgtcgcc atccgccacc atggtgagtc tcctcggctc cgctagactc 60 ggggaccgag acgaatctct ggggcagcgg gacgtggctg tagcgggacg ctgagaggga 120 cgggaggaag agacatggct gccctggccc gggcggcagg acgtggtcgg gccgcggcgc 180 catatctgcg cgtccctgag ggccttggga gtgtcaactg ccgaggtcgg ggtgttttct 240 tgaagtcctt caactccccg cggccgccgg ggtgactgcg ggaggggttg tgcttggtga 300 tgtggcagcg ggcaaagcgc cgtccccgcg cccctggtga cgggcggagg gtgtcctcgg 360 gaggtgacag cctgtagggc tggcttcctt ggacacctcc agtgggctga acgccttccg 420 ggccctttcc ggtagccccc gtctctgttt tctatctgag ttcacacgtg agcaccggtc 480 cccataatct aagaaagtgg ctcactgggc ctagtggcgc attgtggcct ttgatccggg 540 ctttgacctt ggcgcacagc acccagtggt ttggggaaga ggtgtgtgta gcagaggagg 600 ttttttcgtg ctttggtccc aatcaatccg gcatctttgc agtgccgagg tggccgtgca 660 ccttggcttt gaattcttgt gctgaggtta tgtgacttga gcctcaagat agggtcttct 720 agcacaggct tgctcttaag tgtcgcagtt gtcggtttcg gcgtttgttt agagctgtgg 780 acacatctgt gaacttttga tgcttatttc agaggtcctg ggttgt 826 <210> 138 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 138 ttatagcatg cgactctgag aatccgtcgc catccg 36 <210> 139 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 139 ttatagcatg cacaacccag gacctctgaa ataagc 36 <210> 140 <211> 8317 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 140 tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600 acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660 gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820 acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880 tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc agggattaaa 2940 ggcgtgcacc actactgtct gccttttgtt ttggttttat cataattgtt gcatttttgc 3000 ccgcaggagg atcaggaatt caaggacaac ctctacagcc aacccagttg agggccagcc 3060 tgttctatcg agatcctgtc tccggacaaa aaaagtttca tgagagcgtg gtgtgttggc 3120 acagtctttt agtccgagca ctgacgcagt agattaaggc agatcttcat gatttggtgc 3180 ggtcctgggc tgcatccaaa gaccttgttt ccaaaacaaa caaacgaaaa agtgtaataa 3240 aaatacaagc aaggttttgc agaaataaat ctgtggcctc aagggtccct ttctccagct 3300 tttcccagag gtgtcaaatt acataacagt ctcaaaccca ggaaattgaa ctttggcaca 3360 acccactgac cggtccgaat ttcaaagtct ttttcctatt gacctacaag gttttcaaga 3420 atcatgttgt aagcaactgt gttctgagga atctatgttt aaaaacccat ccgtggatct 3480 tggcccaggg tccagagact gagctagcca cgccccggcc gcgccgcagc cactcccacg 3540 gcagttcaag tgttaagtcc caaagaccgc gctctgtgca tgcgcagacc cgtccacagc 3600 tggctcctag ccaacccggc cggacgagca cccggcgccg tcacgtgacg cacccaaccg 3660 gcgtcgacct ataaaaggcc gggcgttgac gtcagcggtc tcttccgccg cagccgccgc 3720 catcgtcggc gcgcttccct gttcacctct actagtgatt accgttcgta tagcatacat 3780 tatacgaagt tataccatgt ctagactgga caagagcaaa gtcataaacg gcgctctgga 3840 attactcaat ggagtcggta tcgaaggcct gacgacaagg aaactcgctc aaaagctggg 3900 agttgagcag cctaccctgt actggcacgt gaagaacaag cgggccctgc tcgatgccct 3960 gccaatcgag atgctggaca ggcatcatac ccacttctgc cccctggaag gcgagtcatg 4020 gcaagacttt ctgcggaaca acgccaagtc attccgctgt gctctcctct cacatcgcga 4080 cggggctaaa gtgcatctcg gcacccgccc aacagagaaa cagtacgaaa ccctggaaaa 4140 tcagctcgcg ttcctgtgtc agcaaggctt ctccctggag aacgcactgt acgctctgtc 4200 cgccgtgggc cactttacac tgggctgcgt attggaggaa caggagcatc aagtagcaaa 4260 agaggaaaga gagacaccta ccaccgattc tatgccccca cttctgagac aagcaattga 4320 gctgttcgac cggcagggag ccgaacctgc cttccttttc ggcctggaac taatcatatg 4380 tggcctggag aaacagctaa agtgcgaaag cggcgggccg gccgacgccc ttgacgattt 4440 tgacttagac atgctcccag ccgatgccct tgacgacttt gaccttgata tgctgcctgc 4500 tgacgctctt gacgattttg accttgacat gctccccggg taactaagta aggatcccaa 4560 ataccactga attaagaatt ccgcccctct ccctcccccc cccctaacgt tactggccga 4620 agccgcttgg aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg 4680 tcttttggca atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg 4740 ggtctttccc ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt 4800 cctctggaag cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac 4860 cccccacctg gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca 4920 aaggcggcac aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg 4980 ctctcctcaa gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg 5040 ggatctgatc tggggcctcg gtgcacatgc tttacatgtg tttagtcgag gttaaaaaac 5100 gtctaggccc cccgaaccac ggggacgtgg ttttcctttg aaaaacacga tgataatatg 5160 gccacaacca tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 5220 cgggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 5280 gacccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 5340 gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 5400 acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 5460 ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 5520 cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 5580 ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 5640 gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 5700 gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 5760 ggtgcctgag gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag 5820 aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 5880 cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 5940 tcagggggag gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc 6000 tgattatgat cctctagagt cgcagatcca gacatgataa gatacattga tgagtttgga 6060 caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 6120 gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 6180 tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta aaacctctac 6240 aaatgtggta tggctgatta tgatcctcta gagtcgcaga tccagacatg ataagataca 6300 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 6360 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 6420 acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca 6480 agtaaaacct ctacaaatgt ggtatggctg attatgatcc tctagagtcg cagatcctct 6540 agagtcgcag atctttttcc ctctgccaaa aattatgggg acatcatgaa gccccttgag 6600 catctgactt ctggctaata aaggaaattt attttcattg caatagtgtg ttggaatttt 6660 ttgtgtctct cactcggaag gacatatggg agggcaaatc atttaaaaca tcagaatgag 6720 tatttggttt agagtttggc aacatatgcc atatgctggc tgccatgaac aaaggtggct 6780 ataaagaggt catcagtata tgaaacagcc ccctgctgtc cattccttat tccatagaaa 6840 agccttgact tgaggttaga ttttttttat attttgtttt gtgttatttt tttctttaac 6900 atccctaaaa ttttccttac atgttttact agccagattt ttcctcctct cctgactact 6960 cccagtcata gctgtccctc ttctcttatg aagatccctc gacctgcagc ccaagcttat 7020 cgaattcccg cggtggcggc cgcacgtctc cctatcagtg atagagaagt cgacacgtct 7080 cgagctccct atcagtgata gagaaggtac gtctagaacg tctccctatc agtgatagag 7140 aagtcgacac gtctcgagct ccctatcagt gatagagaag gtacgtctag aacgtctccc 7200 tatcagtgat agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtacgt 7260 ctagaacgtc tccctatcag tgatagagaa gtcgacacgt ctcgagctcc ctatcagtga 7320 tagagaaggt accccctata taagcagagc tcgtttagtg aaccgtcaga tcgcctggag 7380 acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca gcctccgcgg 7440 ccgccatggc ggccgggagc atgcgactct gagaatccgt cgccatccgc caccatggtg 7500 agtctcctcg gctccgctag actcggggac cgagacgaat ctctggggca gcgggacgtg 7560 gctgtagcgg gacgctgaga gggacgggag gaagagacat ggctgccctg gcccgggcgg 7620 caggacgtgg tcgggccgcg gcgccatatc tgcgcgtccc tgagggcctt gggagtgtca 7680 actgccgagg tcggggtgtt ttcttgaagt ccttcaactc cccgcggccg ccggggtgac 7740 tgcgggaggg gttgtgcttg gtgatgtggc agcgggcaaa gcgccgtccc cgcgcccctg 7800 gtgacgggcg gagggtgtcc tcgggaggtg acagcctgta gggctggctt ccttggacac 7860 ctccagtggg ctgaacgcct tccgggccct ttccggtagc ccccgtctct gttttctatc 7920 tgagttcaca cgtgagcacc ggtccccata atctaagaaa gtggctcact gggcctagtg 7980 gcgcattgtg gcctttgatc cgggctttga ccttggcgca cagcacccag tggtttgggg 8040 aagaggtgtg tgtagcagag gaggtttttt cgtgctttgg tcccaatcaa tccggcatct 8100 ttgcagtgcc gaggtggccg tgcaccttgg ctttgaattc ttgtgctgag gttatgtgac 8160 ttgagcctca agatagggtc ttctagcaca ggcttgctct taagtgtcgc agttgtcggt 8220 ttcggcgttt gtttagagct gtggacacat ctgtgaactt ttgatgctta tttcagaggt 8280 cctgggttgt gcatgcgacg tcgggcccaa ttcgccc 8317 <210> 141 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 141 caccgtcggc tccgctagac tcg 23 <210> 142 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 142 aaaccgagtc tagcggagcc gac 23 <210> 143 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 143 caccgactca ccatggtggc gga 23 <210> 144 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 144 aaactccgcc accatggtga gtc 23 <210> 145 <211> 8435 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 145 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg tcggctccgc tagactcggt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360 tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420 caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480 cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140 gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200 cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catgtaccca 1260 tacgatgttc cagattacgc ttcgccgaag aaaaagcgca aggtcgaagc gtccgacaag 1320 aagtacagca tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac 1380 gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 1440 aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 1500 ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 1560 gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1620 tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1680 gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1740 gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1800 ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1860 ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1920 agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1980 aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc 2040 ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 2100 ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 2160 gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 2220 gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 2280 agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 2340 cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 2400 gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 2460 gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2520 accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 2580 cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2640 ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2700 tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2760 aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2820 aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2880 ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2940 cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 3000 ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 3060 gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 3120 aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 3180 acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 3240 gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 3300 cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 3360 aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 3420 tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 3480 attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 3540 gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3600 gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3660 atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3720 acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3780 gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 3840 cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3900 cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3960 cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 4020 gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 4080 acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 4140 gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 4200 tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 4260 gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 4320 ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 4380 aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 4440 aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 4500 gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 4560 cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4620 ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4680 aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4740 ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4800 ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4860 gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4920 ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4980 aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 5040 aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 5100 cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 5160 gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 5220 gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 5280 ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 5340 gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 5400 cagctgggag gcgacagccc caagaagaag agaaaggtgg aggccagcta agaattccta 5460 gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 5520 cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 5580 aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 5640 aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag cggccgcagg 5700 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 5760 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 5820 cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 5880 tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc 5940 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6000 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6060 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6120 acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6180 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6240 caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6300 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 6360 tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420 ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480 ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540 accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 6600 gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6660 tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6720 ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6780 ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6840 gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6900 caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6960 ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7020 cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7080 gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7140 taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7200 tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7260 agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7320 caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7380 ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7440 tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag cactggggcc 7500 agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7560 tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7620 agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 7680 gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 7740 gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 7800 tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 7860 gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 7920 accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 7980 accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 8040 gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 8100 ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 8160 atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 8220 gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 8280 cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 8340 gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 8400 gttcctggcc ttttgctggc cttttgctca catgt 8435 <210> 146 <211> 8435 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 146 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg actcaccatg gtggcggagt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360 tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420 caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480 cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140 gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200 cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catgtaccca 1260 tacgatgttc cagattacgc ttcgccgaag aaaaagcgca aggtcgaagc gtccgacaag 1320 aagtacagca tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac 1380 gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 1440 aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 1500 ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 1560 gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1620 tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1680 gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1740 gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1800 ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1860 ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1920 agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1980 aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc 2040 ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 2100 ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 2160 gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 2220 gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 2280 agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 2340 cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 2400 gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 2460 gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2520 accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 2580 cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2640 ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2700 tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2760 aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2820 aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2880 ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2940 cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 3000 ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 3060 gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 3120 aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 3180 acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 3240 gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 3300 cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 3360 aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 3420 tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 3480 attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 3540 gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3600 gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3660 atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3720 acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3780 gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 3840 cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3900 cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3960 cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 4020 gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 4080 acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 4140 gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 4200 tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 4260 gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 4320 ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 4380 aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 4440 aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 4500 gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 4560 cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4620 ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4680 aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4740 ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4800 ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4860 gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4920 ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4980 aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 5040 aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 5100 cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 5160 gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 5220 gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 5280 ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 5340 gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 5400 cagctgggag gcgacagccc caagaagaag agaaaggtgg aggccagcta agaattccta 5460 gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 5520 cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 5580 aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 5640 aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag cggccgcagg 5700 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 5760 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 5820 cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 5880 tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc 5940 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6000 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6060 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6120 acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6180 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6240 caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6300 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 6360 tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420 ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480 ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540 accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 6600 gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6660 tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6720 ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6780 ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6840 gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6900 caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6960 ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7020 cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7080 gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7140 taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7200 tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7260 agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7320 caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7380 ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7440 tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag cactggggcc 7500 agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7560 tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7620 agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 7680 gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 7740 gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 7800 tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 7860 gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 7920 accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 7980 accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 8040 gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 8100 ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 8160 atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 8220 gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 8280 cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 8340 gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 8400 gttcctggcc ttttgctggc cttttgctca catgt 8435 <210> 147 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 147 agaccaggtt agccttgaac aaagatctcc 30 <210> 148 <211> 6681 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 148 tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600 acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660 gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720 cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780 cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840 tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900 tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960 atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020 gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080 aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140 aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200 gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260 cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320 atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380 tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680 tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740 aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800 tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460 tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520 attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580 cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640 ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700 aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760 ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820 acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880 tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcggccgc 2940 gaattcacta gtgattaccg ttcgtatagc atacattata cgaagttata ccatgtctag 3000 actggacaag agcaaagtca taaacggcgc tctggaatta ctcaatggag tcggtatcga 3060 aggcctgacg acaaggaaac tcgctcaaaa gctgggagtt gagcagccta ccctgtactg 3120 gcacgtgaag aacaagcggg ccctgctcga tgccctgcca atcgagatgc tggacaggca 3180 tcatacccac ttctgccccc tggaaggcga gtcatggcaa gactttctgc ggaacaacgc 3240 caagtcattc cgctgtgctc tcctctcaca tcgcgacggg gctaaagtgc atctcggcac 3300 ccgcccaaca gagaaacagt acgaaaccct ggaaaatcag ctcgcgttcc tgtgtcagca 3360 aggcttctcc ctggagaacg cactgtacgc tctgtccgcc gtgggccact ttacactggg 3420 ctgcgtattg gaggaacagg agcatcaagt agcaaaagag gaaagagaga cacctaccac 3480 cgattctatg cccccacttc tgagacaagc aattgagctg ttcgaccggc agggagccga 3540 acctgccttc cttttcggcc tggaactaat catatgtggc ctggagaaac agctaaagtg 3600 cgaaagcggc gggccggccg acgcccttga cgattttgac ttagacatgc tcccagccga 3660 tgcccttgac gactttgacc ttgatatgct gcctgctgac gctcttgacg attttgacct 3720 tgacatgctc cccgggtaac taagtaagga tcccaaatac cactgaatta agaattccgc 3780 ccctctccct cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt 3840 gcgtttgtct atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg 3900 aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga 3960 atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa 4020 acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc 4080 tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac 4140 gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag 4200 gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc 4260 acatgcttta catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg 4320 acgtggtttt cctttgaaaa acacgatgat aatatggcca caaccatgac cgagtacaag 4380 cccacggtgc gcctcgccac ccgcgacgac gtcccccggg ccgtacgcac cctcgccgcc 4440 gcgttcgccg actaccccgc cacgcgccac accgtcgacc cggaccgcca catcgagcgg 4500 gtcaccgagc tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg caaggtgtgg 4560 gtcgcggacg acggcgccgc ggtggcggtc tggaccacgc cggagagcgt cgaagcgggg 4620 gcggtgttcg ccgagatcgg cccgcgcatg gccgagttga gcggttcccg gctggccgcg 4680 cagcaacaga tggaaggcct cctggcgccg caccggccca aggagcccgc gtggttcctg 4740 gccaccgtcg gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc cgtcgtgctc 4800 cccggagtgg aggcggccga gcgcgccggg gtgcccgcct tcctggagac ctccgcgccc 4860 cgcaacctcc ccttctacga gcggctcggc ttcaccgtca ccgccgacgt cgaggtgccc 4920 gaaggaccgc gcacctggtg catgacccgc aagcccggtg cctgaggatc cagacatgat 4980 aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 5040 ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 5100 taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt 5160 ttaaagcaag taaaacctct acaaatgtgg tatggctgat tatgatcctc tagagtcgca 5220 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 5280 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 5340 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 5400 gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc tgattatgat 5460 cctctagagt cgcagatcca gacatgataa gatacattga tgagtttgga caaaccacaa 5520 ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 5580 taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 5640 aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta aaacctctac aaatgtggta 5700 tggctgatta tgatcctcta gagtcgcaga tcctctagag tcgcagatct ttttccctct 5760 gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg ctaataaagg 5820 aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact cggaaggaca 5880 tatgggaggg caaatcattt aaaacatcag aatgagtatt tggtttagag tttggcaaca 5940 tatgccatat gctggctgcc atgaacaaag gtggctataa agaggtcatc agtatatgaa 6000 acagccccct gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt 6060 ttttatattt tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt 6120 tttactagcc agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct 6180 cttatgaaga tccctcgacc tgcagcccaa gcttatcgaa ttcccgcggt ggcggccgca 6240 cgtctcccta tcagtgatag agaagtcgac acgtctcgag ctccctatca gtgatagaga 6300 aggtacgtct agaacgtctc cctatcagtg atagagaagt cgacacgtct cgagctccct 6360 atcagtgata gagaaggtac gtctagaacg tctccctatc agtgatagag aagtcgacac 6420 gtctcgagct ccctatcagt gatagagaag gtacgtctag aacgtctccc tatcagtgat 6480 agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtaccc cctatataag 6540 cagagctcgt ttagtgaacc gtcagatcgc ctggagacgc catccacgct gttttgacct 6600 ccatagaaga caccgggacc gatccagcct ccgcggccgc catggcggcc gggagcatgc 6660 gacgtcgggc ccaattcgcc c 6681 <210> 149 <211> 8434 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 149 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300 gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360 agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420 aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480 ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140 ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200 ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atgtacccat 1260 acgatgttcc agattacgct tcgccgaaga aaaagcgcaa ggtcgaagcg tccgacaaga 1320 agtacagcat cggcctggcc atcggcacca actctgtggg ctgggccgtg atcaccgacg 1380 agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg cacagcatca 1440 agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag gccacccggc 1500 tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc tatctgcaag 1560 agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga ctggaagagt 1620 ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc aacatcgtgg 1680 acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag aaactggtgg 1740 acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac atgatcaagt 1800 tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac gtggacaagc 1860 tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc atcaacgcca 1920 gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga cggctggaaa 1980 atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggcaac ctgattgccc 2040 tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag gatgccaaac 2100 tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc cagatcggcg 2160 accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc ctgctgagcg 2220 acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct atgatcaaga 2280 gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg cagcagctgc 2340 ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc ggctacattg 2400 acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg gaaaagatgg 2460 acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg aagcagcgga 2520 ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac gccattctgc 2580 ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc gagaagatcc 2640 tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc agattcgcct 2700 ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa gtggtggaca 2760 agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag aacctgccca 2820 acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg tataacgagc 2880 tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg agcggcgagc 2940 agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc 3000 tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc tccggcgtgg 3060 aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt atcaaggaca 3120 aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg ctgaccctga 3180 cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc cacctgttcg 3240 acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc aggctgagcc 3300 ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg gatttcctga 3360 agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac agcctgacct 3420 ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg cacgagcaca 3480 ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca gtgaaggtgg 3540 tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg atcgaaatgg 3600 ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga atgaagcgga 3660 tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc gtggaaaaca 3720 cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg gatatgtacg 3780 tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat atcgtgcctc 3840 agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc gacaagaacc 3900 ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag aactactggc 3960 ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg accaaggccg 4020 agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag ctggtggaaa 4080 cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac actaagtacg 4140 acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc aagctggtgt 4200 ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac taccaccacg 4260 cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc 4320 tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag atgatcgcca 4380 agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc aacatcatga 4440 actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg cctctgatcg 4500 agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt gccaccgtgc 4560 ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg cagacaggcg 4620 gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc gccagaaaga 4680 aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc tattctgtgc 4740 tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg aaagagctgc 4800 tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac tttctggaag 4860 ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag tactccctgt 4920 tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg cagaagggaa 4980 acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc cactatgaga 5040 agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa cagcacaagc 5100 actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg atcctggccg 5160 acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag cccatcagag 5220 agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc cctgccgcct 5280 tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa gaggtgctgg 5340 acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc gacctgtctc 5400 agctgggagg cgacagcccc aagaagaaga gaaaggtgga ggccagctaa gaattcctag 5460 agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 5520 ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 5580 ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 5640 ggacagcaag ggggaggatt gggaagagaa tagcaggcat gctggggagc ggccgcagga 5700 acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 5760 gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 5820 gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 5880 ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg 5940 gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 6000 cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 6060 aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 6120 cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 6180 ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 6240 aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc ggcctattgg 6300 ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt 6360 acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc 6420 cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct 6480 tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca 6540 ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 6600 ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct 6660 atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 6720 taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 6780 cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 6840 aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 6900 aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 6960 tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc 7020 ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 7080 catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 7140 aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 7200 ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 7260 gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc 7320 aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 7380 gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 7440 gctgataaat ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca 7500 gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 7560 gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 7620 gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 7680 atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 7740 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 7800 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 7860 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 7920 ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 7980 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 8040 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 8100 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 8160 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 8220 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 8280 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 8340 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 8400 ttcctggcct tttgctggcc ttttgctcac atgt 8434 <210> 150 <211> 8506 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 150 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300 gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360 agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420 aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480 ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140 ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200 ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atggactata 1260 aggaccacga cggagactac aaggatcatg atattgatta caaagacgat gacgataaga 1320 tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt 1380 acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt 1440 acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga 1500 agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga 1560 agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga 1620 tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct 1680 tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg 1740 aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca 1800 gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc 1860 ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt 1920 tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg 1980 gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc 2040 tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga 2100 gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc 2160 agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc 2220 agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca 2280 tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat 2340 acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg 2400 agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg 2460 gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg 2520 gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct 2580 tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc 2640 ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga 2700 ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga 2760 tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg 2820 gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg 2880 agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga 2940 ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga 3000 aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga 3060 aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag 3120 atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg 3180 acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac 3240 tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg 3300 acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga 3360 agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt 3420 ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta 3480 aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg 3540 ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg 3600 acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca 3660 gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg 3720 aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc 3780 agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg 3840 accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga 3900 gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg 3960 gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc 4020 agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga 4080 gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc 4140 ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg 4200 agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg 4260 atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc 4320 acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg 4380 aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga 4440 gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact 4500 ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga 4560 caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga 4620 aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct 4680 tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg 4740 actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg 4800 tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg 4860 ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca 4920 agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg 4980 agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg 5040 aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc 5100 tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact 5160 acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg 5220 ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc 5280 aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca 5340 agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg 5400 ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc 5460 tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagt 5520 aagaattcct agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 5580 tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 5640 ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 5700 tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 5760 gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 5820 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 5880 gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 5940 tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 6000 gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 6060 ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 6120 cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 6180 gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 6240 gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 6300 ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 6360 tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 6420 atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 6480 ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 6540 ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 6600 tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 6660 gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 6720 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 6780 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 6840 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 6900 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 6960 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 7020 atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 7080 caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 7140 gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 7200 accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 7260 ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 7320 gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 7380 acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 7440 atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 7500 ggctggttta ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca 7560 gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 7620 gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 7680 tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 7740 taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 7800 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 7860 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 7920 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 7980 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 8040 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 8100 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 8160 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 8220 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 8280 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 8340 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 8400 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 8460 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 8506 <210> 151 <211> 8436 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 151 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg gatcccggga gctttaccgg ttttagagct agaaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360 ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420 acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480 gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540 tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600 gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660 gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720 taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780 acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840 gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900 gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960 gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140 agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200 acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260 atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320 gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380 cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440 caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500 gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560 agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620 gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680 ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740 ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800 gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860 gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920 cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980 aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040 cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100 actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160 cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220 cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280 gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340 gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400 tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460 ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520 gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580 gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640 cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700 ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760 caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820 caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880 gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940 gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000 gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060 ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120 caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180 gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240 cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300 ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360 gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420 ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480 cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540 ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600 ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660 gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720 cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780 cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840 tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900 ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960 gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020 cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080 aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140 cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200 gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260 cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320 gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380 caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440 gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500 cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560 gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620 cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680 gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740 gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800 gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860 agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920 gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980 aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040 gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100 gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160 cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220 agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280 cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340 ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400 tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640 caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760 gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820 gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880 atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120 aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240 tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360 ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480 cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540 caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440 ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400 ggttcctggc cttttgctgg ccttttgctc acatgt 8436 <210> 152 <211> 8435 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 152 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccc tcgccgcggt aaagctccgt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360 tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420 caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480 cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140 gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200 cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catgtaccca 1260 tacgatgttc cagattacgc ttcgccgaag aaaaagcgca aggtcgaagc gtccgacaag 1320 aagtacagca tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac 1380 gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 1440 aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 1500 ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 1560 gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1620 tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1680 gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1740 gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1800 ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1860 ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1920 agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1980 aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc 2040 ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 2100 ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 2160 gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 2220 gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 2280 agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 2340 cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 2400 gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 2460 gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2520 accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 2580 cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2640 ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2700 tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2760 aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2820 aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2880 ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2940 cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 3000 ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 3060 gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 3120 aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 3180 acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 3240 gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 3300 cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 3360 aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 3420 tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 3480 attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 3540 gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3600 gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3660 atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3720 acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3780 gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 3840 cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3900 cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3960 cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 4020 gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 4080 acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 4140 gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 4200 tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 4260 gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 4320 ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 4380 aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 4440 aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 4500 gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 4560 cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4620 ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4680 aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4740 ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4800 ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4860 gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4920 ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4980 aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 5040 aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 5100 cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 5160 gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 5220 gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 5280 ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 5340 gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 5400 cagctgggag gcgacagccc caagaagaag agaaaggtgg aggccagcta agaattccta 5460 gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 5520 cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 5580 aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 5640 aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag cggccgcagg 5700 aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 5760 ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 5820 cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 5880 tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc 5940 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6000 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6060 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6120 acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6180 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6240 caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6300 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 6360 tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420 ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480 ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540 accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 6600 gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6660 tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6720 ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6780 ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6840 gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6900 caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6960 ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7020 cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7080 gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7140 taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7200 tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7260 agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7320 caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7380 ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7440 tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag cactggggcc 7500 agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7560 tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7620 agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 7680 gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 7740 gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 7800 tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 7860 gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 7920 accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 7980 accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 8040 gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 8100 ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 8160 atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 8220 gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 8280 cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 8340 gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 8400 gttcctggcc ttttgctggc cttttgctca catgt 8435

Claims (42)

  1. CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자의 유전적 변형을 포함하는, 단리되고 유전적으로 변형된 동물 세포로서, 상기 유전적 변형은:
    a) 음성 선택 마커 및 적어도 하나의 상기 유전자가 공동 발현되도록, 적어도 하나의 상기 유전자를 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열; 및
    b) 적어도 하나의 상기 유전자에 작동 가능하게 연결된 외인성 유도성 전사 활성인자
    중 하나 이상을 포함하는, 단리되고 유전적으로 변형된 동물 세포.
  2. 제1항에 있어서, 적어도 하나의 상기 유전자의 유전적 변형이:
    a) 음성 선택 마커를 포함하는 DNA 벡터;
    b) 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터; 및
    c) 음성 선택 마커 및 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터
    중 하나 이상에 의해 적어도 하나의 상기 유전자의 표적화된 변형을 수행하는 것에 의해 생성된 것인, 단리되고 유전적으로 변형된 동물 세포.
  3. 제1항에 있어서, 음성 선택 마커를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 유전적 변형이고/이거나, 외인성 유도성 전사 활성인자를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 외인성 유도성 전사 활성인자를 포함하는 대립유전자만 적어도 하나의 상기 유전자를 발현할 수 있도록 보장하는 것인, 단리되고 유전적으로 변형된 동물 세포.
  4. 제1항에 있어서,
    상기 내인성 유전자 중 2개 이상은 유전적 변형을 포함하는 것인, 단리되고 유전적으로 변형된 동물 세포.
  5. 제4항에 있어서, 2개 이상의 내인성 유전자는 CDK1 및 TOP2A 또는 CDK1 및 EEF2인, 단리되고 유전적으로 변형된 동물 세포.
  6. 제1항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
    b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템(doxycycline inducible system), 큐메이트 스위치 유도성 시스템(cumate switch inducible system), 엑디손 유도성 시스템(ecdysone inducible system), 전파 유도성 시스템(radio wave inducible system) 또는 리간드 가역성 이량체화 시스템(ligand reversible dimerization system)인, 단리되고 유전적으로 변형된 동물 세포.
  7. 제6항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
    b) 시스템은 독시사이클린 유도성 시스템인, 단리되고 유전적으로 변형된 동물 세포.
  8. 제7항에 있어서, 유전자는 CDK1인, 단리되고 유전적으로 변형된 동물 세포.
  9. 제7항에 있어서, 유전자는 CDK1 및 TOP2A인, 단리되고 유전적으로 변형된 동물 세포.
  10. 제1항에 있어서,
    a) 동물 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는 포유류 세포 또는 조류 세포이고/이거나;
    b) 동물 세포는 만능성 줄기세포, 다능성 세포 또는 단능성 전구세포이거나, 이들 세포로부터 유래되거나, 또는 최종 분화된 세포인, 단리되고 유전적으로 변형된 동물 세포.
  11. 제1항 내지 제10항 중 어느 한 항에 따른 하나 이상의 유전적으로 변형된 동물 세포를 포함하는 조성물.
  12. 제11항에 있어서, 대상체를 치료하는 데 사용하기 위한 조성물.
  13. 제1항의 단리되고 유전적으로 변형된 동물 세포의 증식을 제어하는 방법으로서,
    a) 음성 선택 마커를 포함하는 단리되고 유전적으로 변형된 동물 세포를, 상기 음성 선택 마커의 유도인자와 접촉시켜 세포의 증식을 제어하거나; 또는
    b) 외인성 유도성 전사 활성인자를 포함하는 단리되고 유전적으로 변형된 동물 세포를, 상기 외인성 유도성 전사 활성인자의 유도인자와 접촉시켜 세포의 증식을 제어하는 것
    을 포함하는 방법.
  14. 제13항에 있어서,
    a) 음성 선택 마커를 포함하는 단리되고 유전적으로 변형된 동물 세포의 증식을 제어하는 것이
    i) 세포를 상기 음성 선택 마커의 유도인자의 부재 하에 유지시킴으로써, 상기 세포의 증식을 허용하거나; 또는
    ii) 상기 세포를 상기 음성 선택 마커의 유도인자에 노출시킴으로써, 상기 세포의 증식을 어블레이션 또는 억제하는 것
    중 하나 이상을 포함하거나; 또는
    b) 외인성 유도성 전사 활성인자를 포함하는 단리되고 유전적으로 변형된 동물 세포의 증식을 제어하는 것이
    i) 상기 세포를 상기 외인성 유도성 전사 활성인자의 유도인자에 노출시킴으로써, 상기 세포의 증식을 허용하거나; 또는
    ii) 상기 세포를 상기 외인성 유도성 전사 활성인자의 유도인자의 부재 하에 유지시킴으로써, 상기 세포의 증식을 방지 또는 억제하는 것
    중 하나 이상을 포함하는 것인 방법.
  15. 제13항에 있어서, 적어도 하나의 상기 유전자의 유전적 변형이:
    a) 음성 선택 마커를 포함하는 DNA 벡터;
    b) 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터; 및
    c) 음성 선택 마커 및 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터
    중 하나 이상에 의해 적어도 하나의 상기 유전자의 표적화된 변형을 수행하는 것에 의해 생성된 것인 방법.
  16. 제13항에 있어서, 음성 선택 마커를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 유전적 변형이고/이거나, 외인성 유도성 전사 활성인자를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 외인성 유도성 전사 활성인자를 포함하는 대립유전자만 적어도 하나의 상기 유전자를 발현할 수 있도록 보장하는 것인 방법.
  17. 제13항에 있어서,
    상기 내인성 유전자 중 2개 이상은 유전적 변형을 포함하는 것인, 방법.
  18. 제17항에 있어서, 2개 이상의 내인성 유전자는 CDK1 및 TOP2A 또는 CDK1 및 EEF2인, 방법.
  19. 제13항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
    b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템인 방법.
  20. 제19항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
    b) 시스템은 독시사이클린 유도성 시스템인 방법.
  21. 제20항에 있어서, 유전자는 CDK1인 방법.
  22. 제20항에 있어서, 유전자는 CDK1 및 TOP2A인 방법.
  23. 제19항에 있어서,
    i) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하고, 유도인자는 간사이클로비르를 포함하거나;
    ii) 음성 선택 마커는 시토신 데아미나제를 포함하고, 유도인자는 5-플루오로시토신을 포함하거나;
    iii) 음성 선택 마커는 카르복실 에스테라제를 포함하고, 유도인자는 이리노테칸을 포함하거나; 또는
    iv) 음성 선택 마커는 iCasp9를 포함하고, 유도인자는 AP1903을 포함하는 것인 방법.
  24. 제13항에 있어서,
    a) 동물 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는 포유류 세포 또는 조류 세포이고/이거나;
    b) 동물 세포는 만능성 줄기세포, 다능성 세포 또는 단능성 전구세포이거나, 이들 세포로부터 유래되거나, 또는 최종 분화된 세포인 방법.
  25. 제13항 내지 제24항 중 어느 한 항의 방법에 따라 동물 세포 집단의 증식을 제어하는 방법.
  26. 유전적으로 변형된 동물 세포를 제조하는 방법으로서,
    a) 동물 세포에서 음성 선택 마커를 인코딩하는 DNA 서열을, CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자의 좌위에 삽입함으로써, 음성 선택 마커를 인코딩하는 DNA 서열이 적어도 하나의 상기 내인성 유전자를 인코딩하는 DNA 서열에 전사적으로 연결되도록 함으로써, 음성 선택 마커 및 적어도 하나의 상기 유전자가 공동 발현되도록 하고/하거나;
    b) 동물 세포에서 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열을, CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자의 좌위에 삽입함으로써, 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열이 적어도 하나의 상기 유전자에 작동 가능하게 연결되도록 하는 것
    을 포함하는 방법.
  27. 제26항에 있어서, 적어도 하나의 상기 유전자의 유전적 변형이:
    a) 음성 선택 마커를 포함하는 DNA 벡터;
    b) 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터; 및
    c) 음성 선택 마커 및 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터
    중 하나 이상에 의해 적어도 하나의 상기 유전자의 표적화된 변형을 수행하는 것을 포함하는 것인 방법.
  28. 제26항에 있어서, 음성 선택 마커를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 유전적 변형이고/이거나, 외인성 유도성 전사 활성인자를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 외인성 유도성 전사 활성인자를 포함하는 대립유전자만 적어도 하나의 상기 유전자를 발현할 수 있도록 보장하는 것인 방법.
  29. 제26항에 있어서,
    상기 내인성 유전자 중 2개 이상은 유전적 변형을 포함하는 것인 방법.
  30. 제29항에 있어서, 2개 이상의 내인성 유전자는 CDK1 및 TOP2A 또는 CDK1 및 EEF2인 방법.
  31. 제26항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
    b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템인 방법.
  32. 제31항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
    b) 시스템은 독시사이클린 유도성 시스템인 방법.
  33. 제32항에 있어서, 유전자는 CDK1인 방법.
  34. 제32항에 있어서, 유전자는 CDK1 및 TOP2A인 방법.
  35. 제26항에 있어서,
    a) 동물 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는 포유류 세포 또는 조류 세포이고/이거나;
    b) 동물 세포는 만능성 줄기세포, 다능성 세포 또는 단능성 전구세포이거나, 이들 세포로부터 유래되거나, 또는 최종 분화된 세포인 방법.
  36. 동물 세포에서 CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자를 변형시키기 위한 DNA 벡터로서,
    a) 음성 선택 마커를 인코딩하는 DNA 서열의 세포 혼입 시에, 음성 선택 마커를 인코딩하는 DNA 서열이 상기 내인성 유전자를 인코딩하는 DNA 서열에 전사적으로 연결되고, 음성 선택 마커가 내인성 유전자와 공동 발현되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 음성 선택 마커를 인코딩하는 DNA 서열;
    b) 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열의 세포 혼입 시에, 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열이 상기 내인성 유전자에 작동 가능하게 연결되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열; 또는
    c) 음성 선택 마커를 인코딩하는 DNA 서열의 세포 혼입 시에, 음성 선택 마커를 인코딩하는 DNA 서열이 상기 내인성 유전자를 인코딩하는 DNA 서열에 전사적으로 연결되고, 음성 선택 마커가 내인성 유전자와 공동 발현되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 음성 선택 마커를 인코딩하는 DNA 서열; 및
    외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열의 세포 혼입 시에, 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열이 내인성 유전자에 작동 가능하게 연결되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열
    을 포함하는 DNA 벡터.
  37. 제36항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
    b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템인 DNA 벡터.
  38. 제37항에 있어서,
    a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
    b) 시스템은 독시사이클린 유도성 시스템인 DNA 벡터.
  39. 제38항에 있어서, 유전자는 CDK1인 DNA 벡터.
  40. 제36항에 있어서,
    a) 음성 선택 마커를 포함하는 DNA 서열의 하나 이상의 숙주 세포로의 혼입은, 음성 선택 마커의 유도인자에 대한 숙주 세포의 노출 시에 증식하는 숙주 세포의 사멸을 촉진하거나; 또는
    b) 외인성 유도성 전사 활성인자를 포함하는 DNA 서열의 하나 이상의 숙주 세포로의 혼입은, 외인성 유도성 전사 활성인자의 유도인자에 대한 숙주 세포의 노출 시에 숙주 세포의 증식을 촉진 또는 허용하는 것인 DNA 벡터.
  41. 그 발현이 세포 생존력 또는 세포 증식에 필요한 동물 세포의 적어도 하나의 유전자를 유전적으로 변형시켜 유전적으로 변형된 동물 세포의 증식을 제어하기 위한 키트로서,
    제36항 내지 제40항 중 어느 한 항의 DNA 벡터 및
    상기 DNA 벡터 중 하나 이상을 사용한, 동물 세포에서의 상기 내인성 유전자의 표적화된 변형을 위한 지침서
    를 포함하는 키트.
  42. 삭제
KR1020177028536A 2015-03-09 2016-03-09 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 KR102628872B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020247002264A KR20240013291A (ko) 2015-03-09 2016-03-09 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562130270P 2015-03-09 2015-03-09
US201562130258P 2015-03-09 2015-03-09
US62/130,270 2015-03-09
US62/130,258 2015-03-09
PCT/CA2016/050256 WO2016141480A1 (en) 2015-03-09 2016-03-09 Tools and methods for using cell division loci to control proliferation of cells

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247002264A Division KR20240013291A (ko) 2015-03-09 2016-03-09 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법

Publications (2)

Publication Number Publication Date
KR20170136528A KR20170136528A (ko) 2017-12-11
KR102628872B1 true KR102628872B1 (ko) 2024-01-26

Family

ID=56879714

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020177028536A KR102628872B1 (ko) 2015-03-09 2016-03-09 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
KR1020247002264A KR20240013291A (ko) 2015-03-09 2016-03-09 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020247002264A KR20240013291A (ko) 2015-03-09 2016-03-09 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법

Country Status (12)

Country Link
US (2) US20180044686A1 (ko)
EP (2) EP3929298A1 (ko)
JP (3) JP6938380B2 (ko)
KR (2) KR102628872B1 (ko)
CN (2) CN107849583B (ko)
AU (1) AU2016228914B2 (ko)
CA (1) CA2978633A1 (ko)
DK (1) DK3268480T3 (ko)
HU (1) HUE055500T2 (ko)
IL (1) IL254385B (ko)
LT (1) LT3268480T (ko)
WO (1) WO2016141480A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3478325A4 (en) * 2016-07-01 2020-01-15 Research Development Foundation REMOVAL OF CELL PROLIFERATIVE CELLS DERIVED FROM STEM CELLS
KR20200016954A (ko) * 2017-06-12 2020-02-17 시나이 헬스 시스템 전신 면역억제가 불필요한 동종 이식편 내성
CN108048405A (zh) * 2018-01-15 2018-05-18 上海市东方医院 稳定表达人内源性INav的细胞模型及其制备方法和用途
US20220016181A1 (en) * 2018-12-13 2022-01-20 Sinai Health System Immunomodulatory cells and uses thereof
EP3942298A4 (en) * 2019-03-21 2022-12-21 The UAB Research Foundation METHOD OF INCREASING CELLULAR SENSITIVITY TO COMPLEMENT-MEDIATED LYSIS
CN112921052B (zh) * 2019-12-06 2023-07-21 中国科学院分子细胞科学卓越创新中心 体内细胞增殖标记与示踪系统及其应用
US11661459B2 (en) 2020-12-03 2023-05-30 Century Therapeutics, Inc. Artificial cell death polypeptide for chimeric antigen receptor and uses thereof
US11883432B2 (en) 2020-12-18 2024-01-30 Century Therapeutics, Inc. Chimeric antigen receptor system with adaptable receptor specificity

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009139921A2 (en) 2008-05-16 2009-11-19 Genelux Corporation Microorganisms for preventing and treating neoplasms accompanying cellular therapy

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9703633D0 (en) * 1997-02-21 1997-04-09 Imp Cancer Res Tech Cancer therapy
KR101171408B1 (ko) * 2004-05-21 2012-08-08 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 테트라사이클린 및 이의 유사체의 합성
SG10201509679XA (en) * 2007-05-29 2015-12-30 Christopher B Reid Methods for production and uses of multipotent cell populations
EP3165606A1 (en) * 2009-05-01 2017-05-10 Ophthotech Corporation Methods for treating or preventing ophthalmological diseases
US20120171213A1 (en) * 2009-09-10 2012-07-05 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Method of treating tumors

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009139921A2 (en) 2008-05-16 2009-11-19 Genelux Corporation Microorganisms for preventing and treating neoplasms accompanying cellular therapy

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
J Biol Chem.,287(39):32338-32345(2012.8.4.)*
PLOS ONE.,8(7):e70543(2013.7.30.)
Stem Cells Dev.,17(4):619-627(2008.8.)

Also Published As

Publication number Publication date
CN115323000A (zh) 2022-11-11
KR20240013291A (ko) 2024-01-30
JP2021166529A (ja) 2021-10-21
JP7284213B2 (ja) 2023-05-30
KR20170136528A (ko) 2017-12-11
HUE055500T2 (hu) 2021-11-29
EP3929298A1 (en) 2021-12-29
EP3268480A4 (en) 2018-07-04
LT3268480T (lt) 2021-07-26
AU2016228914A1 (en) 2017-09-21
US20220325289A1 (en) 2022-10-13
CN107849583A (zh) 2018-03-27
CA2978633A1 (en) 2016-09-15
AU2016228914B2 (en) 2022-04-21
JP2023103412A (ja) 2023-07-26
WO2016141480A1 (en) 2016-09-15
JP2018507701A (ja) 2018-03-22
CN107849583B (zh) 2022-01-14
EP3268480B1 (en) 2021-05-19
DK3268480T3 (da) 2021-07-26
IL254385B (en) 2021-04-29
EP3268480A1 (en) 2018-01-17
IL254385A0 (en) 2017-11-30
US20180044686A1 (en) 2018-02-15
JP6938380B2 (ja) 2021-09-22

Similar Documents

Publication Publication Date Title
AU2021204620A1 (en) Central nervous system targeting polynucleotides
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
KR102451510B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR20200064129A (ko) 트랜스제닉 선택 방법 및 조성물
KR20180097631A (ko) 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법
JP2023036921A (ja) 蝸牛および前庭細胞に核酸を送達するための物質および方法
KR20200032174A (ko) 강화된 키메라 항원 수용체 및 이의 용도
US20200188531A1 (en) Single-vector gene construct comprising insulin and glucokinase genes
CN111733174B (zh) 一种分离的核酸分子及其用途
US20230364266A1 (en) Methods and compositions for genomic integration
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
KR20220130093A (ko) 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 조성물 및 방법
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN115768890A (zh) 通过分子和物理启动对t细胞免疫疗法的热控制
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물
EP1395612A2 (en) Modified recombinase
CN116323942A (zh) 用于基因组编辑的组合物及其使用方法
KR20220142502A (ko) 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
CN113260704B (zh) CYP4V2和RdCVF在制备药物中的用途
NL2027815B1 (en) Genomic integration

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent