KR20220078607A - 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들 - Google Patents

융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들 Download PDF

Info

Publication number
KR20220078607A
KR20220078607A KR1020227012166A KR20227012166A KR20220078607A KR 20220078607 A KR20220078607 A KR 20220078607A KR 1020227012166 A KR1020227012166 A KR 1020227012166A KR 20227012166 A KR20227012166 A KR 20227012166A KR 20220078607 A KR20220078607 A KR 20220078607A
Authority
KR
South Korea
Prior art keywords
tcr
domain
nucleic acid
sequence
recombinant nucleic
Prior art date
Application number
KR1020227012166A
Other languages
English (en)
Inventor
패트릭 배월
로버트 호프마이스터
다니엘 겟츠
다리오 구티에레즈
필리프 키에퍼-권
줄리 도나헤이
Original Assignee
티씨알2 테라퓨틱스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 티씨알2 테라퓨틱스 인크. filed Critical 티씨알2 테라퓨틱스 인크.
Publication of KR20220078607A publication Critical patent/KR20220078607A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4632T-cell receptors [TCR]; antibody T-cell receptor constructs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464402Receptors, cell surface antigens or cell surface determinants
    • A61K39/464411Immunoglobulin superfamily
    • A61K39/464412CD19 or B4
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/26Universal/off- the- shelf cellular immunotherapy; Allogenic cells or means to avoid rejection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/46Indexing codes associated with cellular immunotherapy of group A61K39/46 characterised by the cancer treated
    • A61K2239/48Blood cells, e.g. leukemia or lymphoma
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector

Abstract

융합 단백질들을 이용한 TCR 재프로그래밍을 위한 조성물 및 방법들
요약서
T 세포 수용체 (TCR) 융합 단백질들 (TFPs) 및 TCR 불변 도메인을 인코드하는 재조합 핵산, 상기 인코드된 분자들을 발현시키는 변형된 T 세포들, 그리고 암을 비롯한 질환 치료에 이를 이용하는 방법들이 본원에서 제공된다. 세포 표면 항원에 대한 특이적 결합 도메인과 함께, CD3 입실론, CD3 감마, CD3 델타, TCR 감마, TCR 델타, TCR 알파 및 TCR 베타 쇄를 포함하는 TCR 소단위를 포함하는 융합 단백질을 포함하고, 기존 접근법의 한계를 극복할 잠재력을 갖는 변형된 T 세포를 본원에서 제공한다.

Description

융합 단백질들을 이용한 TCR 재프로그래밍을 위한 조성물 및 방법들
상호-참조
본 출원은 2019년 9월 12일자로 제출된 U.S. 가특허 출원 번호 62/899,563, 그리고 2020년 2월 7일자로 제출된 U.S. 가특허 출원 62/971,682에 대해 우선권을 주장하며, 이들 출원은 이들 전문이 여기에 참고자료로 편입된다.
발명의 배경
혈액 종양 또는 말기 고형 종양을 갖고 있는 대부분의 환자들은 표준 요법으로 치료할 수 없다. 또한, 전통적인 치료 옵션에는 종종 심각한 부작용이 있다. 암 세포를 거부하기 위하여 환자의 면역 체계를 사용하려는 수많은 시도가 있었고, 이들을 총괄적으로 암 면역요법이라고 부른다. 그러나, 몇 가지 장애물로 인해 임상 효과를 얻기는 다소 어렵다. 비록 수 백 가지의 소위 종양 항원이 확인되었지만, 이들은 대개 자가(self)에서 파생되어, 건강한 조직에 대해서도 암 면역요법을 지시할 수 있고, 또는 면역원성이 좋지 않다. 더욱이, 암세포는 암 면역요법에 의한 면역 공격의 개시 및 전파에 대해 스스로를 보이지 않게 하거나, 또는 거부하도록 만들기 위해 여러 메커니즘을 사용한다.
키메라 항원 수용체 (CAR) 변형된 자가조직의 T 세포 요법(유전공학적으로 공작된 T 세포들을 암 세포 상의 적합한 세포-표면 분자로 돌려보내는 것에 의존하는)을 이용한 최근 개발은 B 세포 악성종양을 치료하기 위한 면역계의 힘을 활용하는 유망한 결과를 보여준다 (가령, Sadelain et al., Cancer Discovery 3:388-398 (2013) 참고). CD19-특이적 CAR T 세포들 (일명 CTL019)을 이용한 임상 결과에서 만성 림프구 백혈병 (CLL)을 앓는 환자들, 뿐만 아니라 어린이의 급성 림프아구성 백혈병 (ALL)의 완벽한 완화(remissions)를 보여주었다(가령, Kalos et al., Sci Transl Med 3:95ra73 (2011), Porter et al., NEJM 365:725-733 (2011), Grupp et al., NEJM 368:1509-1518 (2013) 참고). 대안적인 접근법은 자가조직의 T 세포들의 유전공학적 공작을 위한 종양-연합된 펩티드 항원에 대하여 선별된 세포수용체 (TCR) 알파 쇄와 베타 쇄의 사용이다. 이들 TCR 쇄는 완전한 TCR 복합체들을 형성하고, 제 2 정의된 특이성을 갖는 TCR을 갖는 T 세포들을 제공한다. 활막 암종 환자에서 NY-ESO-1-특이적 TCR 알파 쇄와 베타 쇄를 발현시키는 공작된 자가조직의 T 세포들로부터 고무적인 결과를 얻었다.
시험관내/생체외에서 각각의 표적 세포들을 인지하고, 파괴하기 위하여 CAR 또는 제 2 TCR을 발현시키는 유전공학적으로 변형된 T 세포들에 대한 능력이외에, 공작된 T 세포들를 이용한 환자 요법이 성공적이기 위해서는 이들 T 세포들은 강력한 활성화, 확장, 시간이 경과해도 지속적이어야 하고, 그리고 재발 질환의 경우, "기억" 반응이 가능해야 한다. CAR T 세포들의 높은 관리가능한 임상 효과는 CD19-양성 B 세포 악성종양과 HLA-A2를 발현시키는 NY-ESO-1-펩티드 발현하는 활액 육종 환자들에게 현재 국한된다.
발명의 요약
각종 인간 악성종양에 대하여 더 광범위하게 작용하도록 유전공학적으로 공작된 T 세포들을 개선시킬 필요성이 분명히 있다.
세포 표면 항원에 대한 특이적 결합 도메인과 함께, CD3 입실론, CD3 감마, CD3 델타, TCR 감마, TCR 델타, TCR 알파 및 TCR 베타 쇄를 포함하는 TCR 소단위를 포함하는 융합 단백질을 포함하고, 기존 접근법의 한계를 극복할 잠재력을 갖는 변형된 T 세포를 본원에서 제공한다. 추가적으로, 이들 변형된 T 세포는 내생성(endogenous) TCR (가령 TCR 알파, 베타 또는 이둘 모두)의 기능적 파괴를 보유할 수 있다. 이들 변형된 T 세포는 CARs과 필적할 수준의 또는 더 낮은 수준의 전-염증성 사이토킨을 방출하지만, 이보다는 더 효과적으로 표적 세포들을 사멸 시키는 능력을 보유할 수 있다. 이들 변형된 T 세포와 이를 이용하는 방법은 CARs과 비교하여 이들 세포에 더 이익을 제시할 수 있는데, 그 이유는 상승된 수준의 사이토킨은 채택성 CAR T 요법의 투여분량-제한 독성(dose-limiting toxicities)과 연관되기 때문이다.
T-세포 수용체 (TCR) 융합 단백질 (TFP)과 TCR 불변 도메인을 포함하는 변형된 T-세포, 이러한 변형된 T 세포들을 만드는 방법, 그리고 질환 치료용으로 이들을 이용하는 방법들이 본원에서 제공된다. 본원에서 기술된 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, TCR 알파 불변 도메인 및 TCR 베타 불변 도메인, TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인 및 TCR 불변 도메인일 수 있다. 본원에서 기술된 TFP는 TCR 소단위 및 항체 또는 이의 단편을 포함할 수 있다. 본원에서 기술된 TFP는 TCR 소단위 및 결합 리간드 또는 이의 단편을 포함할 수 있다. 상기 TCR 소단위는 TCR 쇄들 이를 테면, TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론, CD3 델타, 또는 CD3 감마중 임의의 것으로부터 유래될 수 있다. 상기 항체 또는 이의 단편은 뮤린, 인간, 또는 인간화된 것일 수 있다.
한 측면에서, 본 명세서는 TCR 세포외 도메인의 적어도 일부분과 막경유 도메인을 포함하는 TCR 소단위, 그리고 항원 결합 도메인을 포함하는 항체를 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성(endogenous) TCR의 기능성 파괴(disruption)를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체(complex)로 기능적으로 편입된다.
한 측면에서, 본 명세서는 TCR 세포외 도메인의 적어도 일부분과 막경유 도메인을 포함하는 TCR 소단위, 그리고 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 TCR 불변 도메인을 인코딩하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며; 그리고 이때 상기 TCR 소단위와 결합 리간드 또는 이의 단편 상기 항체 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 더 포함한다. 일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이다. 일부 구체예들에서, 상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 적어도 하나의 변형, 그러나, 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 감마의 세포내 도메인이다. 일부 구체예들에서, 상기 TCR 델타 불변 도메인을 인코딩하는 서열은 상기 TCR 델타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드한다. 일부 구체예들에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이하다. 일부 구체예들에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 델타 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이다. 일부 구체예들에서, 상기 TCR 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 델타의 세포내 도메인이다. 일부 구체예들에서, 상기 TCR 감마 불변 도메인을 인코딩하는 서열은 상기 TCR 감마 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드한다. 일부 구체예들에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이하다. 일부 구체예들에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 감마 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된다.
일부 구체예들에서, 상기 재조합 핵산은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열을 인코드하는 서열을 포함한다. 일부 구체예들에서, 상기 TCR 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 감마 불변 도메인을 인코드하는 서열은 TCR 감마 가변 도메인을 더 인코드하며, 이로써 전체(full) TCR 감마 도메인을 인코드하게 된다. 일부 구체예들에서, 상기 전체 TCR 감마 도메인은 감마 9 또는 감마 4이다. 일부 구체예들에서, 상기 전체 TCR 감마 도메인은 서열 식별 번호: 255, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 적어도 하나의 변형, 그러나, 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 델타 불변 도메인을 인코드하는 서열은 TCR 델타 가변 도메인을 더 인코드하며, 이로써 전체 TCR 델타 도메인을 인코드하게 된다. 일부 구체예들에서, 상기 전체 TCR 델타 도메인은 델타 2 또는 델타 1이다. 일부 구체예들에서, 상기 전체 TCR 델타 불변 도메인은 서열 식별 번호: 256, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 세포내 신호생성 도메인은 CD3 입실론, CD3 감마, 또는 CD3 델타이다. 일부 구체예들에서, 상기 세포내 신호생성 도메인은 CD3 입실론이다. 일부 구체예들에서, 상기 재조합 핵산은 적어도 하나의 리더(leader) 서열과 적어도 하나의 링커를 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 불변 도메인의 일부분, TCR 베타 도메인의 일부분, 또는 이 둘 모두를 더 포함한다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRGC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 TRGC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열, 절단가능한 링커, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, 및 TRGC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRGC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, 제 1 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열 또는 이의 단편, TRAC 유전자 서열 또는 이의 단편, 절단가능한 링커 서열, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, TRGC 유전자 서열 또는 이의 단편, 및 TRBC 유전자 서열 또는 이의 단편을 포함한다.
일부 구체예들에서, 상기 서열은 서열 식별 번호: 1에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 2에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 3에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 4에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 5에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 242에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 244에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 245에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 246에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 248에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 250에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 252에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 257에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 263에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 264에서 제시된 폴리펩티드를 인코드한다.
일부 구체예들에서, 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG4 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
또다른 측면에서, 본 명세서는 TCR 세포외 도메인의 적어도 일부분과 막경유 도메인을 포함하는 TCR 소단위, 그리고 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인; 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며; 이때 상기 TCR 소단위 및 항원 결합 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 불변 도메인, TCR 베타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인 모두의 일부분 서열을 더 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 리간드를 포함한다. 일부 구체예들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 구체예들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답(response) 수용체 또는 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 구체예들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항원 결합 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 구체예들에서, 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 가변 영역을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 CDR을 포함하지 않는다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때 기능적 TCR 복합체로 통합된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 인코드된 TFP 및 상기 인코드된 TCR 불변 도메인은 제 1 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 제 1 링커는 프로테아제 절단 부위를 포함한다. 일부 구체예들에서, 상기 프로테아제 절단 부위는 2A, 가령, T2A 또는 P2A 절단 부위다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 상이한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TCR 소단위 및 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 TFP의 결합 리간드 또는 이의 단편은 제 2 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 제 2 링커 서열은 (G4S)n이며, 이때 n=1 ~ 4. 일부 구체예들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 TCR 막경유 도메인이다. 일부 구체예들에서, 상기 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타에서만 유래된다. 일부 구체예들에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 감마 쇄 또는 TCR 델타 쇄의 TCR 세포내 도메인를 포함한다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인의 세포외 일부분, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하거나, 또는 델타 불변 도메인, 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 갖는다. 일부 구체예들에서, (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하는 상기 TCR 소단위는 감마 불변 도메인이거나, 또는 이를 포함한다. 일부 구체예들에서, 상기 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 갖는다. 일부 구체예들에서, 상기 TFP의 세포외 도메인은 감마 쇄 또는 델타 쇄의 가변 도메인을 포함하지 않는다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인로부터 선택된 단백질의 자극 도메인을 포함하거나, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함하는 TCR 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 TFP의 TCR 소단위는 CD3 입실론의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 CD3 입실론의 TCR 소단위는 서열 식별 번호: 258의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다.
일부 구체예들에서, 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다. 일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 델타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 감마, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 상기 TCR 불변 도메인은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다. 일부 구체예들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다. 일부 구체예들에서, 상기 항체는 항체 단편이다. 일부 구체예들에서, 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인이다. 일부 구체예들에서, 항원 결합 도메인은 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD20 결합 도메인, 항-CD70 결합 도메인, 항-79b 결합 도메인, 항-HER2 결합 도메인, 항-PMSA 결합 도메인, 항-MUC16 결합 도메인, 항-CD22 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 항-Nectin-4 결합 도메인, 항-TROP-2 결합 도메인, 항-GPC3 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 60의 CDR1, 서열 식별 번호: 61의 CDR2, 그리고 서열 식별 번호: 62의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 63의 CDR1, 서열 식별 번호: 64의 CDR2, 그리고 서열 식별 번호: 65의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 66의 CDR1, 서열 식별 번호: 67의 CDR2, 그리고 서열 식별 번호: 68의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 69, 서열 식별 번호: 70, 또는 서열 식별 번호: 71의 서열에 대해 적어도 약 80% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 항-CD19 결합 도메인은 서열 식별 번호: 73의 CDR1, 서열 식별 번호: 75의 CDR2, 그리고 서열 식별 번호: 77의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-CD19 결합 도메인은 서열 식별 번호: 79의 CDR1, 서열 식별 번호: 81의 CDR2, 그리고 서열 식별 번호: 83의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-CD19 결합 도메인은 서열 식별 번호: 85 및/또는 서열 식별 번호: 87의 서열에 대해 적어도 약 80% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다.
또다른 측면에서, 본 명세서는 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, 그리고 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인을 포함하는 TCR 소단위, 그리고 항원 결합 도메인을 포함하는 항체 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열, 그리고 TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며; 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
또다른 측면에서, 본 명세서는 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분과 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인을 포함하는 TCR 소단위, 그리고 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며; 그리고 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 TCR 소단위는 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이다. 일부 구체예들에서, 상기 TCR 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 알파 불변 도메인은 뮤린 TCR 알파 불변 도메인을 포함한다. 일부 구체예들에서, 상기 뮤린 TCR 알파 불변 도메인은 상기 뮤린 TCR 알파 불변 도메인의 아미노산 2-137을 포함한다. 일부 구체예들에서, 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 아미노산 2-137을 포함한다. 일부 구체예들에서, 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 207의 서열을 포함한다. 일부 구체예들에서, 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 아미노산 82-137을 포함한다. 일부 구체예들에서, 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 17의 서열을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 베타의 세포내 도메인이다. 일부 구체예들에서, 상기 TCR 알파 불변 도메인을 인코딩하는 서열은 상기 TCR 알파 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드한다. 일부 구체예들에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이하다. 일부 구체예에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 알파 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 베타 불변 도메인이다. 일부 구체예들에서, 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, TCR 베타 불변 도메인은 뮤린 TCR 베타 불변 도메인을 포함한다. 일부 구체예들에서, 뮤린 TCR 베타 불변 도메인은 상기 뮤린 TCR 베타 불변 도메인의 아미노산 2-173을 포함한다. 일부 구체예들에서, 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 152아미노산 2-173을 포함한다. 일부 구체예들에서, 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 209를 포함한다. 일부 구체예들에서, 상기 TCR 베타 불변 도메인은 서열 식별 번호: 152의 아미노산 123-173을 포함한다. 일부 구체예들에서, 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 알파의 세포내 도메인이다. 일부 구체예들에서, 상기 TCR 베타 불변 도메인을 인코딩하는 서열은 상기 TCR 베타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드한다. 일부 구체예들에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이하다. 일부 구체예에서, 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 베타 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 불변 도메인과 TCR 베타 불변 도메인을 인코딩하는 서열을 포함한다. 일부 구체예들에서, 상기 TCR 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 세포내 신호생성 도메인은 CD3 입실론, CD3 감마, 또는 CD3 델타이다. 일부 구체예들에서, 상기 세포내 신호생성 도메인은 CD3 입실론이다.
일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커, 및 TRBC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커, 및 TRBC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRAC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRBC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 10에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 204에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 206에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 210에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 211에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 217에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 218에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 219에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 220에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 259에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 261에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 262에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 재조합 핵산은 적어도 하나의 리더 서열과 적어도 하나의 링커를 더 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG4 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
또다른 측면에서, 본 명세서는 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분과 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인을 포함하는 TCR 소단위, 그리고 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산을 제공하며; 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며; 그리고 이때 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 TCR 소단위는 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 상기 세포외 TCR 알파 불변 도메인의 일부분 또는 TCR 베타 불변 도메인, 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 감마 불변 도메인, TCR 델타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인 모두의 적어도 일부분 서열을 더 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 리간드를 포함한다. 일부 구체예들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 구체예들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 구체예들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항원 결합 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 구체예들에서, 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 가변 영역을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 CDR을 포함하지 않는다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때 기능적 TCR 복합체로 통합된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합된다 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TFP 및 상기 TCR 불변 도메인은 제 1 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 제 1 링커는 프로테아제 절단 부위를 포함한다. 일부 구체예들에서, 상기 프로테아제 절단 부위는 2A, 가령, T2A 또는 P2A 절단 부위다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 상이한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TCR 소단위 및 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 TFP의 결합 리간드 또는 이의 단편은 제 2 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 제 2 링커 서열은 (G4S)n이며, 이때 n=1 ~ 4이다. 일부 구체예들에서, 상기 막경유 도메인은 TCR 알파 또는 TCR 베타, 가령, 뮤린 TCR 알파 또는 TCR 베타의 TCR 막경유 도메인이다. 일부 구체예들에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 알파 또는 TCR 베타의 TCR 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 불변 도메인 TCR 알파 쇄 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 세포외 일부분, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 TCR 알파 쇄 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 막경유 도메인, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 막경유 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 TCR 알파 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 TCR 세포내 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 또는 알파 불변 도메인이거나 이를 포함한다. 일부 구체예들에서, 상기 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 갖는다. 일부 구체예들에서, (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하는 인코드된 TCR은 베타 불변 도메인이거나, 또는 이를 포함한다. 일부 구체예들에서, 상기 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 갖는다. 일부 구체예들에서, 상기 TCR 소단위의 세포외 도메인은 알파 쇄 또는 베타 쇄의 가변 도메인을 포함하지 않는다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인로부터 선택된 단백질의 자극 도메인을 포함하거나, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함하는 TCR 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 TFP의 TCR 소단위는 CD3 입실론의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 CD3 입실론의 TCR 소단위는 서열 식별 번호: 258의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TFP, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다.
일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다;
상기 TCR 불변 도메인은 TCR 베타 불변 도메인이며, 상기 TFP CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다; 또는 상기 TCR 불변 도메인은 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다. 일부 구체예들에서, 상기 항체는 항체 단편이다. 일부 구체예들에서, 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인이다. 일부 구체예들에서, 항원 결합 도메인은 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD20 결합 도메인, 항-CD70 결합 도메인, 항-79b 결합 도메인, 항-HER2 결합 도메인, 항-PMSA 결합 도메인, 항-MUC16 결합 도메인, 항-CD22 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 항-Nectin-4 결합 도메인, 항-TROP-2 결합 도메인, 항-GPC3 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 60의 CDR1, 서열 식별 번호: 61의 CDR2, 그리고 서열 식별 번호: 62의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 63의 CDR1, 서열 식별 번호: 64의 CDR2, 그리고 서열 식별 번호: 65의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 66의 CDR1, 서열 식별 번호: 67의 CDR2, 그리고 서열 식별 번호: 68의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-MSLN 결합 도메인은 서열 식별 번호: 69, 서열 식별 번호: 70, 또는 서열 식별 번호: 71의 서열에 대해 적어도 약 80% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 항-CD19 결합 도메인은 서열 식별 번호: 73의 CDR1, 서열 식별 번호: 75의 CDR2, 그리고 서열 식별 번호: 77의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-CD19 결합 도메인은 서열 식별 번호: 79의 CDR1, 서열 식별 번호: 81의 CDR2, 그리고 서열 식별 번호: 83의 CDR3을 포함한다. 일부 구체예들에서, 상기 항-CD19 결합 도메인은 서열 식별 번호: 85 및/또는 서열 식별 번호: 87의 서열에 대해 적어도 약 80% 동일성을 갖는 서열을 포함한다.
일부 구체예들에서, 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 핵산은 mRNA이다. 일부 구체예들에서, 상기 핵산은 circRNA이다. 일부 구체예들에서, 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 상기 재조합 핵산의 인코딩 서열에 존재하지 않는다. 일부 구체예들에서, 상기 핵 유사체는 다음으로 구성된 군에서 선택된다: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트. 일부 구체예들에서, 상기 재조합 핵산은 리더 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 프로모터 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 poly(A) 꼬리를 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 3'UTR 서열을 더 포함한다. 일부 구체예들에서, 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산이다. 일부 구체예들에서, 상기 핵산은 시험관내 전사된 핵산이다. 또다른 측면에서, 본 명세서는 상기 재조합 핵산을 포함하는 벡터를 제공한다. 일부 구체예들에서, 상기 벡터는 DNA, RNA, 플라스미드, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연합된 바이러스 벡터 (AAV), Rous 육종 바이러스 (RSV) 벡터, 또는 레트로바이러스 벡터로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 벡터는 AAV6 벡터이다. 일부 구체예들에서, 상기 방법은 프로모터를 더 포함한다. 일부 구체예들에서, 상기 벡터는 시험관내 전사된 벡터이다.
또다른 측면에서, 본 명세서는 상기 재조합 핵산, 또는 상기 벡터를 포함하는 변형된 T 세포를 제공하며, 이때 상기 변형된 T 세포는 내생성 TCR의 기능성 파괴를 포함한다.
또다른 측면에서, 본 명세서는 상기 TFP를 인코딩하는 핵산 서열, 또는 상기 TFP를 인코드하는 핵산 서열에 의해 인코드된 TFP를 포함하는 변형된 T 세포를 제공하며, 이때 상기 변형된 T 세포는 내생성 TCR의 기능성 파괴를 포함한다.
또다른 측면에서, 본 명세서는 상기 TFP를 인코딩하는 서열 또는 상기 TFP를 인코드하는 핵산 서열에 의해 인코드된 TFP를 포함하는 변형된 동종이계(allogenic) T 세포를 제공한다.
일부 구체예들에서, 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성(heterologous) 서열을 더 포함하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이다. 일부 구체예들에서, 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성 서열을 더 포함하고, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이다. 일부 구체예들에서, 상기 TCR 불변 도메인, 가령, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 불변 도메인 또는 상기 TCR 알파 불변 도메인 및 상기 TCR 베타 불변 도메인은 뮤린 TCR 불변 도메인, 가령, 뮤린 TCR 알파 불변 도메인, 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인이다. 일부 구체예들에서, 기능적으로 파괴된 내생성 TCR은 내생성 TCR 알파 쇄, 내생성 TCR 베타 쇄, 또는 내생성 TCR 알파 쇄 및 내생성 TCR 베타 쇄이다. 일부 구체예들에서, 기능적으로 파괴된 내생성 TCR은 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된다. 일부 구체예들에서, 상기 기능성 파괴는 내생성 TCR을 인코드하는 유전자의 파괴를 말한다. 일부 구체예들에서, 상기 내생성 TCR을 인코드하는 유전자의 파괴란 상기 내생성 TCR을 인코드하는 유전자 서열을 이 T 세포의 게놈으로부터 제거함을 말한다. 일부 구체예들에서, 상기 T 세포는 CD4 세포들, CD8 세포들, 나이브 T-세포들, 기억 줄기 T-세포들, 중추 기억 T- 세포들, 이중 음성 T-세포들, 작동체 기억 T-세포들, 작동체 T-세포들, ThO 세포들, TcO 세포들, Th1 세포들, Tc1 세포들, Th2 세포들, Tc2 세포들, Th17 세포들, Th22 세포들, 알파/베타 T 세포들, 감마/델타 T 세포들, 천연 킬러 (NK) 세포들, 천연 킬러 T (NKT) 세포들, 조혈 줄기 세포들 및 다능성 줄기 세포들로부터 선택된 인간 T 세포다. 일부 구체예들에서, 상기 T 세포는 CD8+ 또는 CD4+ T 세포이다. 일부 구체예들에서, 상기 T 세포는 동종이계 T 세포이다. 일부 구체예들에서, 상기 방법은 세포내 신호생성 도메인의 양성 신호를 포함하는 제 2 폴리펩티드와 연합된, 저해성 분자의 적어도 일부분을 포함하는 제 1 폴리펩티드를 포함하는 저해성 분자를 인코드하는 핵산을 더 포함한다. 일부 구체예들에서, 상기 저해성 분자는 PD1의 적어도 일부분을 포함하는 제 1 폴리펩티드와 공동자극 도메인과 일차(primary) 신호생성 도메인을 포함하는 제 2 폴리펩티드를 포함한다.
또다른 측면에서, 본 명세서는 다음을 포함하는 약제학적 조성물을 제공한다: 상기 변형된 T 세포; 그리고 약제학적으로 수용가능한 담체.
또다른 측면에서, 본 명세서는 상기 변형된 T 세포를 만드는 방법을 제공하며, 상기 방법은 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자를 파괴하고; 이로써 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포가 만들어지고; 그리고 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포에 상기 재조합 핵산 또는 상기 벡터를 형질도입시키는 것을 포함한다.
일부 구체예들에서, 상기 방법은 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 유전자를 표적으로 하는 뉴클레아제 단백질 또는 뉴클레아제 단백질을 인코딩하는 핵산 서열로 상기 T 세포를 형질도입시키는 것을 포함하는 파괴를 포함한다.
또다른 측면에서, 본 명세서는 상기 변형된 T 세포를 만드는 방법을 제공하며, 상기 방법은 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포에 재조합 핵산, 또는 벡터를 형질도입시키는 것을 포함한다.
일부 구체예들에서, 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포이다.
일부 구체예들에서, 상기 T 세포는 인간 T 세포이다.
일부 구체예들에서, 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포는 변형안된 대조군 T 세포의 것과 비교하였을 때, MHC-펩티드 복합체에 대한 결합이 감소되었다.
일부 구체예들에서, 상기 뉴클레아제는 메가뉴클레아제, 아연-핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 작동체 뉴클레아제 (TALEN), CRISPR/Cas 뉴클레아제, 또는 megaTAL 뉴클레아제이다.
일부 구체예들에서, 상기 재조합 핵산 또는 상기 벡터에 포함된 서열은 내생성 TCR 소단위 유전자의 절단 부위로 삽입되고, 이때 이 내생성 TCR 소단위 유전자로 이러한 서열의 삽입으로 인하여, 당해 내생성 TCR 소단위는 기능적으로 파괴된다.
일부 구체예들에서, 상기 뉴클레아제는 메가뉴클레아제다.
일부 구체예들에서, 상기 메가뉴클레아제는 제 1 소단위와 제 2 소단위를 포함하는데, 이때 상기 제 1 소단위는 인지 서열의 제 1 인지 절반-부위에 결합하고, 그리고 상기 제 2 소단위는 당해 인지 서열의 제 2 인지 절반-부위에 결합한다.
일부 구체예들에서, 상기 메가뉴클레아제는 링커를 포함하는 단일-쇄 메가뉴클레아제이며, 이때 상기 링커는 상기 제 1 소단위와 제 2 소단위를 공유적으로 연결한다.
또다른 측면에서, 본 명세서는 치료를 요하는 대상체의 암을 치료하는 방법을 제공하며, 이 방법은 당해 대상체에게 약제학적 조성물의 치료요법적으로 유효량을 투여하는 것을 포함한다.
또다른 측면에서, 본 명세서는 치료를 요하는 대상체의 암을 치료하는 방법을 제공하며, 상기 방법은 (a) 본원에 기술된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 담체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다.
또다른 측면에서, 본 명세서는 치료를 요하는 대상체의 암을 치료하는 방법을 제공하며, 상기 방법은 (a) 본원에 기술된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 담체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다.
일부 구체예들에서, 상기 변형된 T 세포는 동종이계(allogeneic) T 세포이다. 일부 구체예들에서, 변형안된 대조군 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 구체예들에서, 상기 재조합 핵산, 또는 상기 벡터를 포함하는 변형된 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 구체예들에서, 상기 방법은 상기 약제학적 조성물의 효과를 증가시키는 작용제(agent)와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 구체예들에서, 상기 방법은 상기 약제학적 조성물와 연합된 하나 또는 그 이상의 부작용을 경감시키는 작용제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 구체예들에서, 상기 암은 고형 암, 림프종 또는 백혈병이다. 일부 구체예들에서, 상기 암은 신장 세포 암종, 유방암, 폐암, 난소암, 전립선암, 결장암, 자궁경부암, 뇌암, 간암, 췌장암, 콩팥 및 위암으로 구성된 군에서 선택된다. 일부 구체예들에서, 본원에서 기술된 TFP를 발현시키는 자가 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 구체예들에서, 상기 방법은 이식편 대 숙주 질환을 유도하지 않는다. 일부 구체예들에서, 상기 대상체는 본원에서 기술된 TFP를 발현시키는 자가 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 이식편 대 숙주 질환이 발생될 위험이 적다.
또다른 측면에서, 본 명세서는 약물로써 또는 약물 제조에 사용하는 용도로 상기 재조합 핵산, 상기 벡터, 상기 변형된 T 세포, 또는 상기 약제학적 조성물을 제공한다.
참고문헌으로 포함
본 명세서에 언급된 모든 간행물 및 특허 출원은 각각의 개별 간행물 또는 특허 출원이 구체적으로 및 개별적으로 참조로 포함되도록 지시된 것과 동일한 정도로 본 명세서에 참조 문헌으로 인용된다.
도면의 간단한 설명
도 1은 TRA-편집된 세포 (좌측), 그리고 TRB-편집된 세포 (우측)에서 CD3 (SK7) 대비 TCRαβ (IP26)의 표면 발현을 나타내는 일련의 그래프다. TRA 표면 발현 또는 TRB 표면 발현을 파괴하기 위하여, 야생형 Jurkat 세포들은 TRAC 또는 TRBC 유전자에서 편집되었다. CD3 및 TCRαβ에 대하여 음성인 세포들은 자기-활성화된 세포 분류법(Magnetic-Activated Cell Sorting)(MACS)을 이용하여 정제되었다. 플롯 상의 게이트(gates)는 CD3 및 TCRαβ 음성-음성 세포 집단을 묘사하기 위하여 그려진 것이며, 각 사분면에 남아있는 세포의 백분율은 코너에 나타낸다.
도 2는 TRA-/- (좌측) 및 TRB-/- (우측) Jurkat 세포에서 CD3 (SK7) 대비 TCRαβ (IP26)의 표면 발현을 나타내는 일련의 그래프다. 왼쪽에서 첫 번째 패널은 형질도입되지-않은 음성 대조군이다. 두 번째 패널은 TCRβ 전장 TFP로 형질도입된 TRB-/- 세포를 보여준다. 세 번째 및 네 번째 패널은 TCRγδ TFP 구성물로 형질도입된 TRA-/- 및 TRB-/-를 보여준다.
도 3은 동종이계 TFP T 세포들을 만들기 위한 다양한 전략을 도시한다.
도 4는 동종이계 TFP T 세포들을 만들 때 이용된 구조체들의 요소들을 보여주는 도식이다.
도 5는 야생형 세포들, 그리고 TRAC 편집된, 형질도입-안된 T 세포와 대비하여, TRAC 유전자좌(locus)의 편집 후, TCRγδ TFP 구조체들로 형질도입된 T 세포에서 CD3 대비 TCRαβ의 표면 발현을 나타내는 일련의 그래프다. 상기 그래프는 MACS 정제 전, 세포 집단을 나타낸다.
도 6은 야생형 세포들, 그리고 TRAC 편집된, 형질도입-안된 T 세포와 대비하여 TRAC 좌의 편집 후, TCRγδ TFP 구조체들로 형질도입된 T 세포에서 CD3 대비 TCRαβ의 표면 발현을 나타내는 일련의 그래프다. 상기 그래프는 MACS 정제 후, 세포 집단을 나타낸다.
도 7은 동종이계 TFP 형질도입된 T 세포 (TFP+)의 표면 발현을 나타내는 일련의 그래프다. 좌측-패널은 TCRγδ TFP 구성체로 형질도입된 T 세포의 TFP+ 백분율을 보여준다. 우측-패널은 형질도입-안된 대조군 세포와 비교하였을 때, TCRβ 전장의 양성 대조군 구조체들로 형질도입된 T 세포의 TFP+ 백분율을 나타낸다.
도 8은 TCRβ 전장 양성 대조군 구조체들로 형질도입된 T 세포와 비교하였을 때, TCRγδ TFP 구조체들로 형질도입된 T 세포 안에 CD4 집단 대비 CD8 집단의 표면 발현을 나타내는 일련의 그래프다.
도 9는 TCRβ 전장 양성 대조군 구조체들로 형질도입된 T 세포와 비교하였을 때, TCRγδ TFP 구조체들로 형질도입된 CD4 또는 CD8 T 세포에서 CD45RA 집단 대비 CCR7 집단의 표면 발현을 나타내는 일련의 그래프다.
도 10은 종양 표적 세포를 3-대-1, 1-대-1, 또는 1-대-3 및 1-대-9 비율로 배양된 동종이계 T 작동체 세포의 Luc-Cyto 분석을 보여주는 두 개 그래프다. 표적 Nalm-6 (CD19 양성) 세포들은 좌측 패널에 나타내고, CD19 음성 세포들 (K562 세포들)은 우측 패널에 나타낸다. x-축은 종양 세포 용해(lysis) 백분율을 나타낸다.
도 11은 도 10의 Nalm-6 공동-배양 분석에서 취한 상층액의 사이토카인 분비(pg/mL)를 보여주는 4개의 그래프다. 그래프는 GM-CSF, IFNγ, IL2 및 TNFα에 대한 사이토킨 분비를 나타낸다.
도 12는 TRAC 또는 TRBC 편집된 세포들에서 TFP 구조체들을 보여주는 개략도이며, 그리고 TCR이 이 구조체의 발현으로 재구성되는 지의 여부를 나타낸다. 도 12에서는 뮤린 TCRα 또는 TCRβ TFP 구조체들은 상기 TCR을 재구성시킬 수 있고, 인간 TCRγ 또는 TCRδ TFP 구조체들은 상기 TCR을 재구성시킬 수 있음을 보여준다.
도 13A 13B는 인간 TCRβ TFP 구조체들의 세포 표면 발현을 보여준다. 도 13A는 도 13B에서 발현된 구조체들을 보여주는 개략도다. 인간 항-CD19 TCRβ TFP 및 인간 항-CD19 TCRβ(불변 도메인) TFP를 나타낸다. 도 13B는 도 13A의 구조체들로 형질도입된 TRBC 녹아웃(knockout) Jurkat 세포에서 CD3 대비 TCRαβ의 표면 발현을 보여준다.
도 14는 다음의 표면 발현을 보여주는 일련의 그래프들이다: 나타낸 구조체들로 형질도입된 TRAC 녹아웃 T 세포들에서, 정제-전 (i) SSC-A 대비 CD19; (ii) CD3 대비 TCRαβ, 그리고 정제-후 (i) SSC-A 대비 CD19; (ii) CD3 대비 TCRαβ; (iii)CD4 대비 CD8; 그리고 (iv) CD45RA 대비 CCR7. TRAC는 항-CD19-CD3ε로 형질도입된 세포에서 녹아웃되지 않았다.
도 15는 좌측에서 우측 방향으로, 3-대-1, 1-대-1, 또는 1-대-3 및 1-대-9 비율로 종양 표적 세포와 배양된, 보여진 구조체들로 형질도입된 TRAC 녹아웃 T 세포들의 Luc-Cyto 분석을 보여주는 일련의 그래프들이다. TRAC는 항-CD19-CD3ε로 형질도입된 세포에서 녹아웃되지 않았다. 표적 Nalm-6 (CD19 양성) 세포들은 상부 패널에 나타내고, CD19 음성 세포들 (K562 세포들)은 하부 패널에 나타낸다. x-축은 종양 세포 용해 백분율을 나타낸다.
도 16은 좌측에서 우측 방향으로, 3-대-1, 1-대-1, 또는 1-대-3 및 1-대-9 비율로 종양 표적 세포와 배양된, 도 15의 동종이계 T 작동체 세포의 Nalm-6 공동-배양 분석에서 취한 상층액의 사이토킨 분비 (pg/mL)를 보여주는 일련의 그래프들이다. 그래프는 GM-CSF, IFNγ, IL2 및 TNFα에 대한 사이토킨 분비를 나타낸다.
도 17은 (좌측에서 우측 방향으로) HLA-매치-안된 수지상 세포들 없이, 또는 이들과 함께, 나타낸 구조체들로 형질도입된 TRAC 녹아웃 T 세포의 GM-CSF 및 IFNγ의 분비 (pg/mL)를 보여주는 일련의 그래프들이다. TRAC는 항-CD19-CD3ε로 형질도입된 세포에서 녹아웃되지 않았다.
도 18A-18C는 나타낸 구조체들로 형질도입된 TRAC 녹아웃 T 세포를 주사한 Nalm6-luc 종양 마우스 모델에서 발광 측정에 의해 종양 부하를 보여주는 일련의 그래프다. TRAC는 항-CD19-CD3ε로 형질도입된 세포에서 녹아웃되지 않았다.
도 19는 도 18에서 나타낸 생체내 검정에서 양을 품고 있지 않은 마우스의 간으로 CD7+ 세포들의 침윤을 보여준다. 마우스 간에서 CD45RA 대비 CD7의 표면 발현을 나타내고, 상기 뮤린 간에서 CD7 발현의 면역조직화학을 나타낸다.
도 20은 좌측에서 우측 방향으로, 3-대-1, 1-대-1, 또는 1-대-3 비율로 종양 표적 세포와 배양된, 보여진 구조체들로 형질도입된 TRAC 녹아웃 T 세포들의 Luc-Cyto 분석을 보여주는 일련의 그래프들이다. 표적 Nalm-6 (CD19 양성) 세포들은 좌측 패널에 나타내고, CD19 음성 세포들 (K562 세포들)은 우측 패널에 나타낸다. x-축은 종양 세포 용해 백분율을 나타낸다.
도 21은 좌측에서 우측 방향으로, 3-대-1, 1-대-1, 또는 1-대-3 비율로 종양 표적 세포와 배양된, 도 20의 동종이계 T 작동체 세포의 Nalm-6 공동-배양 분석에서 취한 상층액의 사이토킨 분비 (pg/mL)를 보여주는 일련의 그래프들이다. 그래프는 GM-CSF, IFNγ, IL2 및 TNFα에 대한 사이토킨 분비를 나타낸다.
도 22는 좌측에서 우측 방향으로, 3-대-1, 1-대-1, 또는 0.1:1 비율로 종양 표적 세포와 배양된, 보여진 구조체들로 형질도입된 TRAC 녹아웃 T 세포들의 Luc-Cyto 분석을 보여주는 일련의 그래프들이다. 표적 Nalm-6 (CD19 양성) 세포들은 좌측 패널에 나타내고, CD19 음성 세포들 (K562 세포들)은 우측 패널에 나타낸다. x-축은 종양 세포 용해 백분율을 나타낸다.
도 23은 좌측에서 우측 방향으로, 3-대-1, 1-대-1, 또는 0.1:1 비율로 종양 표적 세포와 배양된, 도 20의 동종이계 T 작동체 세포의 Nalm-6 공동-배양 분석에서 취한 상층액의 사이토킨 분비 (pg/mL)를 보여주는 일련의 그래프들이다. 그래프는 GM-CSF, IFNγ, IL2 및 TNFα에 대한 사이토킨 분비를 나타낸다.
발명의 상세한 설명
일부 구체예들에서, (a)(i)(1) TCR 세포외 도메인의 적어도 일부분, 그리고 (2) 막경유 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항원 결합 도메인을 포함하는 항체를 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 백신을 기술하며; 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나이며, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열; 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며; 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, 그리고 (2) 막경유 도메인을 포함하는TCR 소단위, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열, 그리고 (b) TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산이 본원에서 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나; 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며; 이때 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예에서, (a) (i) (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, 그리고 (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항원 결합 도메인을 포함하는 항체 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열, 그리고 (b) TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산이 기술되며, 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며; 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
(a) (i) (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, 그리고 (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인(들)을 인코딩하는 서열을 포함하는 재조합 핵산이 본원에서 기술되며, 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며; 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타를 포함하는 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인로부터 자극 도메인을 포함하는 TCR 소단위, 그리고 (ii) 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체를 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에서 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 델타 불변 도메인 및 TCR 감마 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타를 포함하는 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인으로부터 자극 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코드하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 본원에서 기술하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타를 포함하는 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인으로부터 자극 도메인을 포함하는 TCR 소단위, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코드하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에서 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인; 이때 상기 TCR 소단위와 상기 항원 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타를 포함하는 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인으로부터 자극 도메인을 포함하는 TCR 소단위, 그리고 (ii) 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체를 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에 기술되며, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타를 포함하는 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인으로부터 자극 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에서 기술되며, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타를 포함하는 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인으로부터 자극 도메인을 포함하는 TCR 소분자, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코드하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 제공되며, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, 본원에 기술된 상기 재조합 핵산을 포함하는 벡터가 본원에서 기술된다.
일부 구체예들에서, 본원에서 기술된 재조합 핵산, 또는 본원에서 기술된 벡터를 포함하는 변형된 T 세포가 본원에서 기술되며; 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함한다.
일부 구체예들에서, 본원에서 기술된 핵산의 TFP를 인코딩하는 서열, 또는 본원에서 기술된 핵산의 서열에 의해 인코드된 TFP를 포함하는 변형된 T 세포를 본원에서 개시하며,이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함한다.
일부 구체예들에서, 본원에서 개시된 TFP를 인코딩하는 서열 또는 본원에서 개시된 핵산 서열에 의해 인코드된 TFP를 포함하는 변형된 동종이계 T 세포들이 본원에서 개시된다.
일부 구체예들에서, (a) 본원의 변형된 T 세포들; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물들이 본원에서 개시된다.
일부 구체예들에서, 본 명세서의 변형된 T 세포를 만드는 방법들이 본원에서 개시되는데, 상기 방법은 다음을 포함한다: (a) TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자를 파괴하고; 이로 인하여 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포가 만들어지고; 그리고 (b) 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포로 본원의 재조합 핵산, 또는 본원에서 개시된 벡터를 형질도입시킨다.
일부 구체예들에서, 본 명세서의 변형된 T 세포를 만드는 방법들이 본원에서 더 개시되는데, 상기 방법은 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포로 본원에서 개시된 재조합 핵산, 또는 본원에서 개시된 벡터를 형질도입시키는 것을 포함한다.
일부 구체예들에서, 치료를 요하는 대상체의 암을 치료하는 방법들이 본원에서 개시되며, 상기 방법은 당해 대상체에게 본원에서 개시된 약제학적 조성물들의 치료요법적으로 유효량을 투여하는 것을 포함한다.
일부 구체예들에서, 치료를 요하는 대상체의 암을 치료하는 방법들을 본원에서 개시하는데, 상기 방법은 당해 대상체에게 (a) 본원에서 개시된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다.
특정 용어
명시적으로 다른 언급이 없는 한, 본 명세서에서 이용된 모든 기술적 그리고 과학적 용어는 본 발명에 속하는 당업계 숙련자들에 의해 공통적으로 이해되는 것과 동일한 의미를 가진다.
용어 단수 관사("a" 및 "an")은 당해 글의 문법적 대상의 하나 또는 하나 이상 (가령, 적어도 하나)을 지칭한다. 예를 들어, "요소"는 하나의 요소 또는 하나 이상의 요소를 의미한다.
본원에서 사용된 바와 같이, "약(about)"이란 당업자에게 인지된 또는 인지가능한 여부 및 상황에 따라, 플러스 또는 마이너스 1 미만, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 또는 30 퍼센트 이상을 의미한다.
본원 명세서에서 사용된 바와 같이, "대상체(subject)" 또는 "대상체들" 또는 "개체들(individuals)"이란 인간 또는 인간이 아닌 포유류와 같은 포유동물, 예를 들어, 가축, 농업용 동물 또는 야생 동물, 뿐만 아니라, 조류 및 수생 동물을 포함하지만, 이에 국한되지 않는다. "환자들"은 질환, 장애 또는 병태를 앓고 있거나 또는 발병 위험이 있거나 또는 그렇지 않으면, 본원에 제공된 조성물 및 방법을 필요로 하는 대상체들이다.
본원에서 사용된 바와 같이, "치료하는" 또는 "치료"는 질환 또는 병태의 치료 또는 개선에서 성공을 나타내는 임의의 표시를 지칭한다. 치료는 예를 들어, 질활 또는 병태의 하나 또는 그 이상의 증상의 심각성을 감소, 지연 또는 완화시키는 것이 내포될 수 있거나, 또는 환자가 경험하는 질환, 결함, 장애 또는 불리한 상태 및 이와 유사한 것들의 증상이 나타나는 빈도를 줄이는 것이 내포될 수 있다. 본원에서 사용된 바와 같이, "치료 또는 예방"은 때때로 질환 또는 병태의 일부 수준의 치료 또는 개선을 초래하는 방법을 지칭하기 위해 본원에서 사용되며, 이러한 병태를 완전히 예방하는 것을 비롯한, 그러나 이에 국한되지 않는 범위의 결과들이 고려된다.
본원에서 사용된 바와 같이, "예방"은 환자에서 질환 또는 병태, 예를 들어, 종양 형성의 예방을 지칭한다. 예를 들어, 종양 또는 다른 형태의 암이 발생할 위험이 있는 개체가 본 개시 내용의 방법으로 치료되고, 이후 종양 또는 다른 형태의 암이 발생하지 않는다면, 이 질환은 적어도 당해 개체에서 일정 기간에 걸쳐 예방되었다.
본원에서 사용된 바와 같이, "치료요법적 유효량"이란 당해 조성물이 투여된 개체에서 유익한 효과를 제공하기에 충분한, 또는 그렇지 않으면 이러한 개체에서 유해한 비-유익한 효과를 감소시키기에 충분한 당해 조성물 또는 이의 활성 성분의 양을 말한다. 본원에서 "치료요법적 효과적인 투여분량"이란 주어진 기간에 걸쳐 일회 또는 그 이상의 횟수로 투여될 때, 이러한 투여에 대한 한 가지 또는 그 이상의 원하는 또는 바람직한(가령, 유익한) 효과를 만들어내는 투여분량(dose)을 의미한다. 정확한 투여분량은 치료 목적에 따라 다르며, 공지된 기술을 사용하여 당업자가 확인할 수 있다 (가령, Lieberman, Pharmaceutical Dosage Forms (vols. 1-3, 1992); Lloyd, The Art, Science and Technology of Pharmaceutical Compounding (1999); 그리고 Pickar, Dosage Calculations (1999) 참고)
본원에서 사용된 바와 같이, "T 세포수용체 (TCR) 융합 단백질" 또는 "TFP"에는 일반적으로, i) 표적 세포들 상의 표면 항원에 결합할 수 있고, 그리고 ii) T 세포의 표면 또는 표면 상에 공동-위치될 때, 전형적으로 무손상(intact) TCR 복합체의 다른 폴리펩티드 성분들과 상호작용할 수 있는 TCR을 포함하는 각종 폴리펩티드로부터 유래된 재조합 폴리펩티드가 내포된다.
용어 "자극(stimulation)"이란 자극 도메인 또는 자극 분자 (가령, TCR/CD3 복합체)가 이의 동계(cognate) 리간드에 결합함으로써 유도된 일차(primary) 반응을 지칭하고, 이로 인하여 신호 변환 사건, 이를 테면, 상기 TCR/CD3 복합체를 통한 신호 변환이 내포되나, 이에 국한되지 않은 사건을 중재한다. 자극은 특정 분자의 변경된 발현 및/또는 세포골격 구조의 재구성 및 이와 유사한 것 등을 중재할 수 있다.
용어 "자극 분자(stimulatory molecule)" 또는 "자극 도메인(stimulatory domain)"이란 T 세포에 의해 발현되는 분자 또는 이의 일부분을 지칭하는데, 이는 상기 T 세포신호생성 경로의 적어도 일부 측면에 대하여 자극 방식으로 TCR 복합체의 일차 활성화를 조정하는 일차 세포질 신호생성 서열(들)을 제공한다. 하나의 측면에서, 상기 일차 신호는 예를 들면, TCR/CD3 복합체가 펩티드가 적재된(loaded) MCH 분자에 결합함으로써 개시되며, 그리고 이로써 증식, 활성화, 분화, 그리고 이와 유사한 것들을 포함하나, 이에 국한되지 않는 T 세포 반응의 조정으로 이어진다. 자극 방식으로 작용하는 일차 세포질 신호생성 서열 (일명 "일차 신호생성 도메인"으로도 지칭됨)은 면역수용체 티로신-기반의 활성화 모티프 또는 "ITAM"으로 공지된 신호생성 모티프를 내포할 수 있다. 본 발명에서 특히 사용되는 일차 세포질 신호 전달 서열을 포함하는 ITAM의 예로는 TCR 제타, FcR 감마, FcR 베타, CD3 감마, CD3 델타, CD3 입실론, CD5, CD22, CD79a, CD79b, CD278 (일명 "ICOS"으로도 공지됨) 및 CD66d로부터 유도된 것들이 내포되나, 이에 국한되지 않는다.
용어 "항원 제시 세포(antigen presenting cell)" 또는 "APC"는 세포 표면에서 주요 조직접합성 복합체들 (MHC's)과 복합된 외래(foreign) 항원을 도시하는 보조 세포(가령, B-세포, 수지상 세포 및 이와 유사한 것들)을 지칭한다. T 세포들은 이들의 T 세포 수용체들 (TCRs)을 이용하여 이들 복합체를 인지할 수 있다. APCs는 항원들을 처리하고, 이들을 T 세포들에게 제시한다.
"주요 조직적합성 복합체 (MHC) 분자들은 펩티드:MHC 복합체의 일부분으로써, TCRs에 전형적으로 결합된다. 상기 MHC 분자는 MHC 클래스 I 또는 II 분자일 수 있다. 상기 복합체는 항원 제시 세포, 이를 테면, 수지상 세포 또는 B 세포, 또는 암 세포들을 비롯한 임의의 다른 세포의 표면 상에 있을 수 있거나, 또는 예를 들면, 비드 또는 플레이트 상에 피복시킴으로써 고정될 수 있다.
상기 인간 백혈구 항원 시스템 (HLA)은 유전자 복합체의 이름이며, 인간에서 주요 조직접합성 복합체 (MHC)를 인코드하고, HLA 클래스 I 항원들 (A, B & C) 및 HLA 클래스 II 항원들 (DP, DQ, & DR)이 내포된다. HLA 대립유전자(alleles) A, B 및 C는 세포내 단백질들로부터 주로 유래된 펩티드, 가령, 당해 세포 안에서 발현되는 단백질들을 제시한다.
생체내 T 세포 발생 동안, T 세포들은 자가 MHCs의 인식을 보장하기 위해 양성(positive) 선택 단계를 거친 후, 자가-항원을 제시하는 MHC에 너무 강하게 결합하는 T 세포를 제거하는 음성(negative) 단계를 거친다. 결과적으로, 특정 T 세포들과 이들이 발현시키는 TCRs은 특정 유형의 MHC 분자 (가령, 특정 HLA 대립유전자에 의해 인코드된 것)에 의해 제시된 펩티드 만을 인지할 것이다. 이를 HLA 제한(restriction)이라고 한다.
관심대상의 HLA 대립유전자 중 하나는 HLA-A*0201이며, 이는 Caucasian 집단의 대다수 (> 50%)에서 발현된다. 따라서, HLA-A*0201 (즉, HLA-A*0201 제한됨)에 의해 인코드된 MHC에 의해 제시되는 WT1 펩티드에 결합하는 TCRs은 이러한 TCRs을 사용하는 면역요법이 Caucasian 집단의 많은 비율을 치료하는 데 적합할 것이기 때문에, 유리하다.
기타 관심대상의 HLA-A 대립유전자는 HLA-A*0101, HLA-A*2402, 그리고 HLA-A*0301이다.
광범위하게 발현된 관심대상의 HLA-B 대립유전자는 HLA-B*3501, HLA-B*0702 및 HLA-B*3502이다.
"세포내 신호생성 도메인(intracellular signaling domain)"이란 용어가 본원에서 이용될 때, 이는 분자의 세포내 부분을 지칭한다. 상기 세포내 신호생성 도메인은 상기 TFP 함유 세포, 가령, 변형된 T-T 세포의 면역 작동체 기능을 촉진시키는 신호를 만들어낸다. 가령, 변형된 T-T 세포에서 면역 작동체 기능의 예로는 사이토킨 분비를 포함한, 세포 용해 활성 및 T 헬퍼(helper) 세포 활성을 포함한다. 구체예에서, 상기 세포내 신호생성 도메인은 일차 세포내 신호생성 도메인을 포함할 수 있다. 예시적인 일차 세포내 신호생성 도메인에는 일차 자극, 또는 항원 의존적 자극을 담당하는 분자들로부터 유래된 것들이 내포된다. 구체예에서, 상기 세포내 신호생성 도메인은 공동-자극 세포내 도메인을 포함할 수 있다. 예시적인 공동-자극 세포내 신호생성 도메인에는 공동자극 신호들, 또는 항원 독립적인 자극을 담당하는 분자들로부터 유래된 것들이 내포된다.
일차 세포내 신호생성 도메인은 ITAM ("면역수용체 티로신-기반 활성화 모티프')을 포함할 수 있다. 일차 세포질 신호생성 서열을 함유하는 ITAM의 예로는 CD3 제타, FcR 감마, FcR 베타, CD3 감마, CD3 델타, CD3 입실론, CD5, CD22, CD79a, CD79b, 그리고 CD66d DAP10 및 DAP12로부터 유래된 것들이 포함되나, 이에 국한되지 않는다.
본원에서 사용된 바와 같이, 용어 "공동-자극 분자(costimulatory molecule)"란 공동자극 리간드에 특이적으로 결합하고, 이로써 T 세포의 공동자극 반응, 이를 테면, 증식을 포함하나, 이에 국한되지 않는 반응을 조정하는, T 세포 상의 동계 결합 짝을 지칭한다. 공동자극 분자들은 항원 수용체들 또는 이들의 리간드를 제외한 세포 표면 분자로써, 효과적인 면역 반응에 요구된다. 공동자극 분자에는 MHC 클래스 1 분자, BTLA와 Toll 리간드 수용체, 뿐만 아니라 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1(CD11a/CD18) 및 4-1BB (CD137)가 내포되나 이에 국한되지 않는다. 공동-자극 세포내 신호생성 도메인은 공동자극 분자의 세포내 일부분일 수 있다. 공동자극 분자는 다음의 단백질 패밀리로 대표될 수 있다: TNF 수용체 단백질들, 면역글로불린-유사 단백질들, 사이토킨 수용체들, 인테그린, 신호생성 림프구성 활성화 분자들 (SLAM 단백질들), 그리고 활성화 NK 세포 수용체들. 이러한 분자들의 예로는 CD27, CD28, 4-1BB (CD137), OX40, GITR, CD30, CD40, ICOS, BAFFR, HVEM, 림프구 기능-연합된 항원-1 (LFA-1), CD2, CD7, LIGHT, NKG2C, SLAMF7, NKp80, CD160, B7-H3, 및 CD83에 특이적으로 결합하는 리간드, 그리고 이와 유사한 것들이 내포된다. 상기 세포내 신호생성 도메인은 이것이 유래된 분자의 전체(entire) 세포내 일부분, 또는 전체 고유의(native) 세포내 신호생성 도메인, 또는 이의 기능적 단편을 포함할 수 있다. 용어 "4-1BB"란 GenBank 수탁 번호. AAA62478.2로 제공된 아미노산 서열을 갖는, 또는 인간이 아닌 종, 가령, 마우스, 설치류, 원숭이, 유인원 및 이와 유사한 것들의 등가 잔기들을 갖는 TNFR 슈퍼패밀리의 구성요소를 지칭하며; 그리고 "4-1BB 공동-자극 도메인"이란 GenBank 수탁 번호. AAA62478.2의 아미노산 잔기 214-255의 아미노산 서열, 또는 인간이-아닌 종, 가령, 마우스, 설치류, 원숭이, 유인원 및 이와 유사한 것들로부터 등가 잔기들로 정의된다.
용어 "항체"는 본원에서 사용된 바와 같이, 항원에 특이적으로 결합하는, 면역글로불린 분자로부터터 유래된 단백질, 또는 폴리펩티드 서열을 지칭한다. 항체는 다중클론성 또는 단일클론성 기원(origin)의 무손상 면역글로불린, 또는 이의 단편들이 될 수 있고, 천연 원천 또는 재조합 원천으로부터 유래될 수 있다.
용어 "항체 단편"이란 항원 결합 도메인, 가령, 표적, 이를 테면 항원 및 이의 특정된 에피토프를 항체 단편이 인지하고, 특이적으로 결합하는데 충분한, 무손상 항체의 항원 결정 가변 영역을 함유하는 항체의 적어도 하나의 일부분, 또는 이의 재조합 변이체들을 지칭한다. 항체 단편들의 예로는 Fab, Fab', F(ab')2, 그리고 Fv 단편들, 단일-쇄 (sc) Fv ("scFv") 항체 단편, 선형(linear) 항체들, 단일 도메인 항체들 이를 테면 sdAb (VL 또는 VH), 카멜리드(camelid) VHH 도메인, 그리고 항체 단편들로부터 형성된 다중-특이적 항체들이 내포되나, 이에 국한되지 않는다.
용어 "scFv"는 경쇄의 가변 영역을 포함하는 적어도 하나의 항체 단편과 중쇄의 가변 영역을 포함하는 적어도 하나의 항체 단편을 포함하는 융합 단백질을 지칭하며, 이때 상기 경쇄 및 중쇄 가변 영역들은 짧은 유연성 폴리펩티드 링커에 의해 인접하게 연계되며, 그리고 단일 폴리펩티드 쇄로써 발현될 수 있으며, 그리고 이때 상기 scFv는 이것이 유래된 무손상 항체의 특이성을 유지한다.
항체 관련하여, "중쇄 가변 영역" 또는 "VH"는 프레임워크(framework) 영역들로 알려진 측방(flanking) 스트레취(stretches) 사이에 끼어져 있는 3개 CDRs를 함유하는 중쇄의 단편을 지칭하며, 이들 프레임워크 영역은 일반적으로 CDRs보다 더 많이 보존되며, CDRs를 지탱하기 위한 스캐폴드(scaffold)를 형성한다. 카멜리드 "VHH" 도메인은 단일 가변 항체 도메인을 포함하는 중쇄다.
명시하지 않는 한, 본원에서 사용된 바와 같이, scFv는 가령, 폴리펩티드의 N-말단 단부와 C-말단 단부에 대하여 임의의 순서로, VL 가변 영역과 VH 가변 영역을 가질 수 있고, 이 scFv는 VL-링커-VH 를 포함하거나, 또는 VH-링커-VL를 포함할 수 있다.
항체 또는 항체 이의 결합 단편을 포함하는 본 명세서의 TFP 조성물의 일부분은 다양한 형태로 존재할 수 있는데, 여기에서 상기 항원 결합 도메인은 뮤린, 인간화된 또는 인간 항체로부터 유래된 단일 도메인 항체 단편 (sdAb), 단일 쇄 항체 (scFv)를 포함하는 인접(contiguous) 폴리펩티드 쇄의 일부분으로 발현된다(Harlow et al., 1999, In: Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.; Harlow et al., 1989, In: Antibodies: A Laboratory Manual, Cold Spring Harbor, N.Y.; Houston et al., 1988, Proc. Natl. Acad. Sci. USA 85:5879-5883; Bird et al., 1988, Science 242:423-426). 하나의 측면에서, 본 명세서의 TFP 조성물의 항원 결합 도메인은 항체 단편을 포함한다. 추가 측면에서, 상기 TFP는 scFv 또는 sdAb를 포함하는 항체 단편을 포함한다.
용어 "재조합 항체"란 재조합 DNA 기술을 이용하여 생성된 항체, 이를 테면, 예를 들면, 박테리오파아지 또는 이스트 발현 시스템에 의해 발현된 항체를 지칭한다. 이 용어는 상기 항체를 인코딩하는 DNA 분자의 합성과, 이 DNA 분자는 항체 단백질, 또는 당해 항체를 특정하는 아미노산 서열을 발현시켜 생성된 항체를 의미하는 것으로 또한 간주되어야 하며, 이때 DNA 또는 아미노산 서열은 당분야에 공지되고, 이용가능한 재조합 DNA 또는 아미노산 서열 기술에 의해 획득되었다.
용어 "항원" 또는 "Ag"란 항체가 특이적으로 결합할 수 있는 분자, 또는 그렇지 않으면 면역 반응을 일으키는 분자를 지칭한다. 이 면역 반응은 항체 생산, 또는 면역학적으로-특이적인 컴피턴트(competent) 세포들, 또는 이둘 모두의 활성화와 관련될 수 있다.
당업자는 사실상 모든 단백질 또는 펩티드를 포함한, 임의의 거대 분자가 항원으로 작용할 수 있음을 이해할 것이다. 더욱이, 항원들은 재조합 또는 게놈 DNA로부터 유래될 수 있다. 따라서, 당업자는 면역 반응을 유도하는 단백질을 인코드하는 뉴클레오티드 서열 또는 부분적 뉴클레오티드 서열을 포함하는 임의의 DNA는 본원에서 이용된 용어로써 "항원"을 인코드한다는 것을 인지할 것이다. 더욱이, 항원은 유전자의 전장 뉴클레오티드 서열에 의해서만 전적으로 인코드될 필요가 없다는 것을 당업자는 인지할 것이다. 본 명세서에는 하나 이상의 유전자의 부분적 뉴클레오티드 서열의 용도, 이들 뉴클레오티드 서열은 원하는 면역 반응을 유도하는 폴리펩티드들을 인코드하도록 다양하게 조합되어 배열된다는 것이 내포되나, 이에 국한되지 않음은 자명할 것이다. 더욱이, 항원이 "유전자"에 의해 인코드될 필요가 전혀 없음을 당업자는 이해할 것이다. 항원이 합성되어 만들어질 수 있거나, 또는 생물학적 샘플에서 유래될 수 있거나, 또는 폴리펩티드 외에 거대 분자일 수 있다는 것은 자명하다. 이러한 생물학적 샘플은 조직 샘플, 종양 샘플, 다른 생물학적 성분들을 갖는 세포 또는 유체를 포함할 수 있으나, 이에 국한되지 않는다.
본원에서 사용된 바와 같이, 용어 "CD19"란 분화 19 단백질의 클러스터(Cluster)를 지칭하는데, 이것은 B 세포 백혈병 전구체 세포들, 기타 악성 B 세포들과 정상적인 B 세포 계통의 대부분 세포들에서 탐지가능한 항원성 결정인자다.
본원에서 사용된 바와 같이, 용어 "BCMA"이란 종양 괴사 인자 수용체 수퍼패밀리 구성원 17 (TNFRSF17)로 또한 알려진 B-세포 성숙 항원을 지칭하며, 분화 269 단백질 (CD269)의 클러스터는 인간에서 TNFRSF17 유전자에 의해 인코드된 단백질이다. TNFRSF17은 B-세포 활성화 인자 (BAFF)를 인지하는 TNF 수용체 수퍼패밀리의 세포 표면 수용체다 (가령, Laabi et al., EMBO 11 (11): 3897-904 (1992) 참고. 이 수용체는 성숙한 B 림프구에서 발현되며, B-세포 발달 및 자가면역 반응에 중요할 수 있다.
본원에서 사용된 바와 같이, 용어 "CD16" (FcγRIII로 또한 알려짐)은 천연 킬러 세포들, 호중구 다형핵 백혈구, 단핵구 및 대식세포의 표면 상에 발견되는 분화 분자 클러스터를 지칭한다. CD16은 Fc 수용체 FcγRIIIa (CD16a) 및 FcγRIIIb (CD16b)로 식별되었으며, 이들은 신호 변환에 참여한다. CD16은 항체-의존적 세포의 세포독성 (ADCC)에 관련된 면역글로불린 수퍼패밀리 (IgSF)의 분자다.
"NKG2D"는 본원에서 사용된 바와 같이, C-타입 렉틴-유사 수용체들의 CD94/NKG2 패밀리에 속하는 막경유 단백질을 지칭한다. 인간에서, NKG2D는 NK 세포들, γδ T 세포들 및 CD8+ αβ T 세포들에 의해 발현된다. NKG2D는 스트레스를 받은 세포, 악성 형질변환된 세포, 그리고 감염된 세포의 표면 상에 나타나는 MIC 및 RAET1/ULBP 패밀리로부터 유도된-자가 단백질들을 인지한다.
메소텔린 (MSLN)이란 흉막, 복막 및 심장막의 내층 중피 세포들 상에 정상적으로 존재하는 종양 분화 항원을 지칭한다. 메소텔린은 중피종과 난소 암종 및 췌장 암종을 비롯한 몇 가지 인간 종양에서 과다 발현된다.
티로신-단백질 키나제 막경유 수용체 ROR1(일명, 신경영양성 티로신 키나제, 수용체-관련된 1 (NTRKR1)로도 알려짐)는 수용체 티로신 키나제-유사 올판(orphan) 수용체 (ROR) 패밀리의 구성원이다. 이것은 암의 전이에 역할을 한다.
용어 "MUC16"은 "세포-표면 연합된, 뮤신 16" 또는 "난소암-관련된 종양 마커 CA125"로도 또한 알려져 있는데, 이것은 이의 아미노 말단에서 세포외 도메인, 큰 텐덤(tandem) 반복 도메인, 그리고 짧은 세포질 도메인과 함께, 막경유 도메인을 내포하는 막-묶여있는 뮤신이다. 이 유전자의 산물은 다른 암에 대한 마커로 사용되었으며, 더 높은 발현 수준은 더 나쁜 예후와 관련있다.
용어 "CD22"는 시알산 결합 Ig-유사 렉틴 2, SIGLEC-2, T 세포 표면 항원 leu-14, 그리고 B 세포 수용체 CD22로도 또한 알려져 있으며, 이것은 B 세포/B 세포 상호작용을 중재하는 단백질이며, 그리고 림프 조직에서 B 세포들의 국소화에 관련되는 것으로 간주되며, 그리고 난치성 조혈 암 및 털 세포 백혈병을 비롯한 질환과 연합된다. 본원에서 기술되는 방법들에 사용하기에 적합한 완전한(fully) 인간 항-CD22 단일클론성 항체 ("M971")는 가령, Xiao et al., MAbs. 2009 May-Jun; 1(3): 297- 303에서 기술된다.
프로그램된 세포 사멸 단백질 1 ("PD-1"로 공지됨) 및 CD279 (분화 클러스터 279)은 세포 표면 상의 단백질로써, T 세포 염증 활성을 억제함으로써, 면역 체계를 하향-조절하고, 자기-내성을 촉진시킴으로써, 인체 세포에 대한 면역계의 반응을 조절하는 역할을 한다. 이것은 자가면역 질환을 예방하지만, 그러나 면역 체계가 암세포를 죽이는 것 또한 막을 수 있다. PD-1은 면역관문(checkpoint)이며, 다음 두 가지 기전을 통해 자가면역에 대항하여 방어한다. 첫째, 림프절에서 항원-특이적 T-세포들의 아팝토시스(예정된 세포 사멸)를 촉진시킨다. 둘째, 조절 T 세포(항-염증성, 억제 T 세포)에서 세포자멸사를 감소시킨다. PD-1은 면역글로불린 수퍼패밀리에 속하고, T 세포들과 전(pro)-B 세포들 상에서 발현되는 세포 표면 수용체다. PD-1은 두 개 리간드, PD-L1 및 PD-L2에 결합한다.
프로그램된 사멸-리간드 1 ("PD-L1")은 40kDa 유형 1 막경유 단백질로써, 특정 이벤트, 이를 테면, 임신, 조직 동종이식, 자가면역 질환 및 기타 질환 상태, 이를 테면, 간염과 같은 특정 이벤트 동안 면역계의 적응적 부분(arm)의 억제에 중요한 역할을 하는 것으로 추측되었다. 일반적으로, 적응적(adaptive) 면역계는 외생성 위험 신호 또는 내생성 위험 신호에 의해, 면역계 활성화가 연루된 항원에 대한 반응이다. 차례로, 항원-특이적 CD8+ T 세포 및/또는 CD4+ 헬퍼 세포들의 클론 확장이 전파된다. 상기 저해성 체크포인트 분자 PD-1에 PD-L1의 결합으로 면역수용체 티로신-기반의 스위치 모티프 (ITSM) 모티프를 통하여 포스포타제 (SHP-1 또는 SHP-2)와의 상호작용에 기초하여 저해성 신호가 전달된다. 이로써 림프절에서 항원-특이적 T-세포의 증식이 감소되는 한편, 동시에 조절 T 세포 (항-염증성, 억제 T 세포)에서 동시에 아팝토시스가 감소되며, 이는 유전자 Bcl-2의 더 낮은 제어에 의해 추가 매개된다.
"CD79α" 및 "CD79β" 유전자는 B 림프구 항원 수용체, 항원-특이적 성분, 표면 면역글로불린 (Ig)을 비롯한, 다량체 복합체를 구성하는 단백질들을 인코드한다. 표면 Ig는 B-세포 항원 수용체의 발현 및 기능에 필수적인, 두 개의 다른 단백질들, Ig-알파 및 Ig-베타 (차례로 CD79α 및 이의 파라로그(paralog) CD79β에 의해 인코드됨)와 비-공유적으로 연합된다. 이 복합체의 기능적 파괴로 인하여 가령, 인간 B-세포 만성 림프구 백혈병이 유도될 수 있다.
B 세포 활성화 인자, 또는 "BAFF"는 종양 괴사 인자 (TNF) 리간드 패밀리에 속하는 사이토킨이다. 이 사이토킨은 수용체 TNFRSF13B/TACI, TNFRSF17/BCMA, 그리고 TNFRSF13C/BAFF-R에 대한 리간드다. 이 사이토킨은 B 세포 계통 세포들에서 발현되고, 그리고 강력한 B 세포 활성제로 작용한다. 또한, B 세포의 증식과 분화에 중요한 역할을 하는 것으로 나타났다.
용어 "항-종양 효과"란 각종 수단에 의해 현시될 수 있는 생물학적 효과를 지칭하는데, 가령, 종양 부피 감소, 종양 세포 수 감소, 전이 수의 감소, 기대 수명 증가, 종양 세포 증식 감소, 종양 세포 생존 감소 또는 암 병태와 관련된 다양한 생리적 증상의 개선이 내포되나, 그러나 이에 국한되지 않는다. "항-종양 효과"는 먼저 종양 발생 예방에 있어서, 본 명세서의 펩티드, 폴리뉴클레오티드, 세포 및 항체의 능력에 의해 또한 현시될 수 있다.
용어 "자가조직의(autologous)"라는 용어는 한 개체로부터 유래된 임의의 물질이 당해 동일한 개체에게 재-도입될 수 있는 임의의 물질을 의미한다.
용어 "동종이계(allogeneic)" 또는 대체용으로 "동종이형(allogenic)"이란 당해 물질이 도입된 동일한 종에 속하는 상이한 동물, 또는 다른 환자로부터 파생된 임의의 물질을 지칭한다. 둘 또는 그 이상의 개체에 있어서 하나 또는 그 이상의 유전자 좌에 있는 유전자가 동일하지 않을 때, 이들 개체는 서로 동종이계라고 한다. 일부 측면들에서, 동일한 종에 속하는 개체에서 나온 동종이계 물질은 항원적으로 상호 작용하기에는 유전적으로 충분히 다를 수 있다.
용어 "이종발생적(xenogeneic)"이란 상이한 종의 동물로부터 유래된 이식편을 지칭한다.
용어 "암"이란 비정상적 세포의 신속하고, 제어되지 않은 성장을 특징으로 하는 질환을 지칭한다. 암 세포들은 국소 적으로 또는 혈류 및 림프계를 통해 신체의 다른 부분으로 퍼질 수 있다. 각종 암의 예시가 본원에서 개시되는데, 유방암, 전립선암, 난소암, 자궁경부암, 피부암, 췌장암, 결장직장암, 신장암, 간암, 뇌암, 림프종, 백혈병, 폐암 및 이와 유사한 것들이 내포되나, 이에 국한되지 않는다.
용어 "인코딩(encoding)"이란 생물학적 공정에서 특정된 서열의 뉴클레오티드 (가령, rRNA, tRNA 및 mRNA) 또는 특정된 서열의 아미노산을 갖고, 이로부터 발생되는 생물학적 성질들을 보유하는 임의의 중합체 및 거대 분자를 합성하기 위한 주형으로 기능하는 폴리뉴클레오티드, 이를 테면, 유전자, cDNA, 또는 mRNA에서 특이적 서열의 뉴클레오티드의 고유 성질을 지칭한다. 따라서, 유전자, cDNA, 또는 RNA는 해당 유전자에 대응하는 mRNA의 전사 및 해독으로 세포 또는 기타 생물학적 시스템에서 단백질이 생산하는 경우, 이 단백질을 인코드한다. 코딩 가닥(strand)(이의 뉴클레오티드 서열은 mRNA 서열과 동일하며, 통상적으로 서열 목록에서 제시됨) 및 비-코딩 가닥(유전자 또는 cDNA의 해독을 위한 주형을 이용)은 모두 이 유전자 또는 cDNA의 단백질 또는 기타 산물을 인코딩하는 것으로 지칭될 수 있다.
명시적인 언급이 없는 한, "아미노산 서열을 인코딩하는 뉴클레오티드 서열"은 서로 축퇴(degenerate) 형태이며, 동일한 아미노산 서열을 인코드하는 모든 뉴클레오티드 서열을 포함한다. 단백질 또는 RNA를 인코딩하는 관용구(phrase) 뉴클레오티드 서열에는 또한 단백질을 코딩하는 뉴클레오티드 서열이 일부 형태에서 하나 또는 이상의 인트론을 포함할 수 있는 정도로 인트론을 포함할 수 있다.
용어 "유효량" 또는 "치료요법적 유효량"은 본원에서 호환사용되며, 특정 생물학적 결과 또는 치료요법적 결과를 얻는데 효과적인 본원에서 기술된 화합물, 제형, 물질, 또는 조성물의 양을 지칭한다.
용어 "내생성(endogenous)"이란 유기체, 세포, 조직 또는 시스템으로부터 또는 내부에서 만들어진 임의의 물질을 지칭한다.
용어 "외생성(exogenous)"이란 유기체, 세포, 조직 또는 시스템으로 도입된, 또는 외부에서 만들어진 임의의 물질을 지칭한다.
용어 "발현"이란 프로모터에 의해 구동된 특정 뉴클레오티드 서열의 전사 및/또는 해독을 지칭한다.
용어 "기능적 파괴(functional disruption)"란 세포 안에서 정상적인 발현 및/또는 거동을 방해하기 위하여, 특정 (가령, 표적) 핵산 (가령, 유전자, RNA 전사체, 이에 인코드된 단백질의)에 가해지는 물리적 또는 생화학적 변화를 지칭한다. 한 구체예에서, 기능적 파괴란 유전자 편집(editing) 방법을 통하여 당해 유전자의 변형을 지칭한다. 한 구체예에서, 기능적 파괴로 표적 유전자 (가령, 내생성 유전자)의 발현이 방해된다.
용어 "전이(transfer) 벡터"란 단리된 핵산을 포함하고, 이러한 단리된 핵산을 세포 내부로 전달하는데 이용될 수 있는 물질의 조성물을 지칭한다. 선형 폴리뉴클레오티드들, 이온성 또는 양쪽성 화합물들, 플라스미드들과 연합된 폴리뉴클레오티드들, 그리고 바이러스들이 내포되나, 이에 국한되지 않은 다수의 벡터들이 당분야에 공지되어 있다. 따라서, 용어 "전이 벡터"에는 자가 복제가능한 플라스미드 또는 바이러스가 내포된다. 이 용어에는 이를 테면, 예를 들면, 폴리리신 화합물, 리포좀, 그리고 이와 유사한 것들과 같은 세포 안으로 핵산의 전이를 실행하는 비-플라스미드성 화합물과 비-바이러스성 화합물이 더 내포되는 것으로 또한 간주되어야 한다. 바이러스성 전이 벡터의 예로는 아데노바이러스 벡터들, 아데노-연합된 바이러스 벡터들, 레트로바이러스성 벡터들, 렌티바이러스성 벡터들, 그리고 이와 유사한 것들이 내포되나, 이에 국한되지 않는다.
용어 "발현 벡터"란 뉴클레오티드 서열이 발현되도록 작동가능하게 연계된 발현 제어 서열을 포함하는 재조합 폴리뉴클레오티드를 포함하는 벡터를 지칭한다. 발현 벡터는 발현을 위하여 충분한 시스(cis)-작용 요소들을 포함하고; 발현을 위한 기타 요소들은 숙주 세포 또는 시험관내 발현 시스템에 의해 공급될 수 있다. 발현 벡터들에는 상기 재조합 폴리뉴클레오티드가 통합되는 당분야에 공지된 모든 것들이 내포되는데, 가령, 코스미드, 플라스미드들 (가령, 네이키드 또는 리포좀 안에 함유된) 및 바이러스들 (가령, 렌티바이러스들, 레트로바이러스들, 아데노바이러스들, 그리고 아데노-연합된 바이러스들)이 있다.
용어 "렌티바이러스"는 레트로비리데(Retroviridae) 패밀리의 속(genus)을 지칭한다. 렌티바이러스들은 비-분열 세포를 감염시킬 수 있다는 점에서 레트로바이러스 중에서 독특하고; 이 바이러스들은 상당한 양의 유전 정보를 숙주 세포의 DNA에 전달할 수 있으므로 유전자 전달 벡터의 가장 효율적인 방법 중 하나다. HIV, SIV, 그리고 FIV는 모두 렌티바이러스의 예들이다.
용어 "렌티바이러스성 벡터"는 Milone et al., Mol. Ther. 17(8): 1453-1464 (2009)에서 제공된 바와 같이, 특히, 자가-비활성화 렌티바이러스성 벡터를 포함하는, 렌티바이러스 게놈의 적어도 일부분으로부터 유래된 벡터를 지칭한다. 임상에서 이용될 수 있는 렌티바이러스 벡터들에는 가령, LENTIVECTOR™ 유전자 전달 기술(Oxford BioMedica 사의), LENTIMAX™ 벡터 시스템(Lentigen 사의), 그리고 이와 유사한 것들이 내포되나, 이에 국한되지 않는다. 비-임상용 렌티바이러스성 벡터들이 또한 이용가능하며, 당업자들이 인지하고 있을 것이다.
용어 "상동성(homologous)" 또는 "동일성(identity)"이란 두 개의 중합체 분자들, 가령, 두 개의 핵산 분자들, 이를 테면, 두 개의 DNA 분자 또는 두 개의 RNA 분자, 또는 두 개의 폴리펩티드 분자 간에 소단위 서열 동일성을 지칭한다. 두 분자 모두의 소단위 위치에 동일한 단량체 소단위가 있을 경우; 예를 들어, 두 개의 DNA 분자 각각의 위치에 아데닌이 있다면, 해당 위치에서 동종이거나 또는 동일하다. 두 서열 간의 상동성은 정합(matching)의 수 또는 상동성 위치의 수에 대한 직접 함수이고; 가령, 두 서열에서 위치의 절반 (가령, 길이가 10개 소단위인 중합체에서 5개 위치)가 상동성이라면, 50%의 상동성이며; 이들 위치중 90%(가령, 10개중 9개 위치)가 정합되거나 또는 상동성이면, 이 두 서열은 90%의 상동성이다.
인간이-아닌 (가령, 뮤린) 항체들의 "인간화된(humanized)" 형태는 인간이-아닌 면역글로불린으로부터 유래된 최소 서열을 함유하는 키메라 면역글로불린, 면역글로불린 쇄 또는 이의 단편들 (이를 테면 Fv, Fab, Fab', F(ab')2 또는 항체들의 기타 항원-결합 하위서열)이다. 대부분의 경우, 인간화된 항체들 및 이의 항체 단편들은 수령자의 상보성-결정 영역(CDR)의 잔기가 원하는 특이성, 친화력, 그리고 능력(capacity)을 보유한, 인간이-아닌 종 (공여자 항체) 이를 테면 마우스, 렛(rat) 또는 토끼의 CDR 잔기로 대체된, 인간 면역글로불린 (수령자 항체 또는 항체 단편)이다. 일부 경우에서, 인간 면역글로블린의 Fv 프레임워크 영역 (FR) 잔기는 대응하는 비-인간 잔기로 대체된다. 더욱이, 인간화된 항체/항체 단편은 수령자 항체 또는 수입된(imported) CDR 또는 프레임워크 서열에서 발견되지 않는 잔기를 포함할 수 있다. 이러한 변형으로 항체 또는 항체 단편 수행능이 더 세분화되고, 최적화될 수 있다. 일반적으로, 상기 인간화된 항체 또는 이의 항체 단편은 적어도 하나의, 전형적으로 두 개의 가변성 도메인 모두를 실질적으로 포함할 것이며, 이때 CDR 영역들 모두 또는 실질적으로 모두는 인간이 아닌 면역글로불린의 것에 대응하며, FR 영역의 모두 또는 유의적인 영역은 인간 면역글로불린 서열의 것이다. 상기 인간화된 항체 또는 항체 단편은 면역글로블린 불변 영역 (Fc)의 적어도 일부분, 전형적으로 인간 면역글로블린의 것을 포함할 것이다. 더욱 상세한 내용은 Jones et al., Nature, 321: 522-525, 1986; Reichmann et al., Nature, 332: 323-329, 1988; Presta, Curr. Op. Struct. Biol., 2: 593-596, 1992를 참고한다.
"인간" 또는 "완전한(fully) 인간"이란 면역글로불린, 이를 테면 항체 또는 항체 단편을 지칭하는데, 여기에서 온전체(whole) 분자는 인간 기원이거나 또는 상기 항체 또는 면역글로불린의 인간 형태와 동일한 아미노산 서열로 구성된다.
용어 "단리된(isolated)"이란 자연 상태로부터 변경된 또는 제거된 상태를 의미한다. 예를 들면, 살아있는 동물에 자연적으로 존재하는 핵산 또는 펩티드는 "단리된" 것이 아니지만, 자연 상태에서 이와 공존하는 물질로부터 부분적 또는 완벽하게 분리된 동일한 핵산 또는 펩티드는 "단리된" 것이다. 단리된 핵산 또는 단백질은 실질적으로 정제된 형태로 존재할 수 있고, 또는 비-고유적 환경, 이를 테면, 예를 들면, 숙주 세포에 존재할 수 있다.
본 명세서의 내용에서, 공통적으로 발생되는 핵산 염기에 대하여 다음의 약어가 이용된다. "A"는 아데노신을 지칭하고, "C"는 시토신을 지칭하고, "G"는 구아노신을 지칭하고, "T"는 티미딘을 지칭하고, 그리고 "U"는 우리딘을 지칭한다.
용어 "보존적(conservative) 서열 변형"란 당해 아미노산 서열이 내포된 항체 또는 항체 단편의 결합 특징에 유의적으로 영향을 주지 않거나 또는 변형시키지 않는 아미노산 변형을 지칭한다. 이러한 보존적 변형에는 아미노산 치환, 추가 및 결손이 내포된다. 변형은 부위-지향된(directed) 돌연변이유발 및 PCR-중재 돌연변이유발과 같은 당업계에 공지된 표준 기술에 의해 본 명세서의 항체 또는 항체 단편으로 도입될 수 있다. 보존적 아미노산 치환이란 하나의 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것을 말한다. 유사한 측쇄를 갖는 아미노산 잔기 패밀리는 당분야에 특정되어 있다. 이들 패밀리는 염기성 측쇄 (가령, 리신, 아르기닌, 히스티딘), 산성 측쇄 (가령, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (가령, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인, 트립토판, 비극성 측쇄 (가령, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌), 베타-분지 측쇄 (가령, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (가령, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다. 따라서, 본 명세서의 TFP 내의 하나 또는 이상의 아미노산 잔기는 동일한 측쇄 패밀리로부터의 다른 아미노산 잔기로 대체될 수 있고, 변경된 TFP는 본원에 기재된 기능적 검정을 사용하여 시험될 수 있다.
용어 "작동가능하도록 연계된(operably linked)" 또는 "전사 조절(transcriptional control)"이란 조절 서열과 이종기원의 핵산 서열 간의 기능적 연계를 지칭하고, 이로 인하여 후자가 발현된다. 예를 들면, 제 1 핵산 서열이 제 2 핵산 서열과 기능적 상관관계에 위치할 때, 상기 제 1 핵산 서열은 제 2 핵산 서열에 작동가능하도록 연계된다. 가령, 프로모터가 코딩 서열의 전사 또는 발현에 영향을 준다면, 이 프로모터는 해당 코딩 서열에 작동가능하도록 연계된다. 작동가능하도록 연계된 DNA 서열은 서로 인접해 있을 수 있고, 가령, 두 단백질 코딩 영역을 연결시킬 필요가 있을 때, 이들은 동일한 판독 틀 안에 있다.
면역원성 조성물의 "비경구(parenteral)" 투여란 가령, 피하 (s.c.), 정맥내 (i.v.), 근육내 (i.m.), 또는 흉골내(intrasternal) 주사, 종양내, 또는 주입(infusion) 기술이 내포된다.
용어 "핵산" 또는 "폴리뉴클레오티드"란 단일 또는 이중-가닥 형태의 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA) 및 이의 중합체를 지칭한다. 특별히 제한되지 않는 한, 이 용어에는 기준 핵산과 유사한 결합 성질을 갖고, 자연 발생적 뉴클레오티드들와 동일한 방식으로 대사되는 천연 뉴클레오티드의 공지된 유사체를 함유하는 핵산이 포괄된다. 명시적으로 지적되지 않는 한, 특정 핵산 서열은 명시된 서열, 뿐만 아니라, 보존적으로 변형된 이의 변이체들(가령, 축중 코돈 치환), 대립유전자, 오르소로그(orthologs), SNPs, 그리고 상보적 (complementary)서열이 또한 포괄된다. 특히, 축중 코돈 치환은 하나 또는 그 이상의 선택된 (또는 모든) 코돈의 세 번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성함으로써 달성될 수 있다(Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); 그리고 Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)).
용어 "펩티드", "폴리펩티드", 및 "단백질"은 호환사용되며, 그리고 펩티드 결합에 의해 공유적으로 연계된 아미노산 잔기들을 포함하는 화합물을 지칭한다. 단백질 또는 펩티드는 적어도 두 개의 아미노산을 함유해야 하며, 단백질 서열 또는 펩티드 서열을 구성할 수 있는 아미노산의 최대 숫자에는 제약이 없다. 폴리펩티드에는 펩티드 결합에 의해 서로 연결된 두 개 또는 그 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질이 내포된다. 본원에서 사용된 바와 같이, 이 용어는 짧은 쇄(당분야에서 펩티드, 올리고펩티드 및 올리고머로 또한 흔히 불리는)펩티드들과 더 긴 쇄(일반적으로 다양한 유형의 단백질로 지칭됨)를 모두 지칭한다. "폴리펩티드"에는 그중에서도 예를 들면, 생물학적으로 활성 단편들, 실질적으로 상동성 폴리펩티드들, 올리고펩티드들, 동종이량체들, 이종(hetero)이량체, 폴리펩티드들의 변이체들, 변형된 폴리펩티드들, 유도체들, 유사체들, 융합 단백질들이 내포된다. 폴리펩티드에는 천연 펩티드, 재조합 펩티드, 또는 이의 조합이 내포된다.
용어 "프로모터(promoter)"란 폴리뉴클레오티드 서열의 특이적 전사를 개시하는데 요구되는 세포의 전사 기전, 또는 도입된 합성 기전에 의해 인지되는 DNA 서열을 지칭한다.
용어 "프로모터/조절 서열"이란 프로모터/조절 서열에 작동가능하도록 연계된 유전자 산물의 발현에 요구되는 핵산 서열을 지칭한다. 일부 경우에서, 이 서열은 코어(core) 프로모터 서열일 수 있고, 다른 경우들에서, 이 서열은 또한 유전자 산물의 발현에 필요한 인핸서(enhancer) 서열 및 기타 조절 요소를 포함할 수 있다. 이 프로모터/조절 서열은 예를 들면, 조직 특이적 방식으로 당해 유전자 산물을 발현시키는 것일 수 있다.
용어 "구성적(constitutive)" 프로모터란 유전자 산물을 인코드하거나, 또는 명시하는 폴리뉴클레오티드와 작동가능하도록 연계될 때, 세포의 대부분 또는 모든 생리학적 조건 하에서 세포 안에서 당해 유전자 산물이 만들어지도록 하는 뉴클레오티드 서열을 지칭한다.
용어 "유도성(inducible)" 프로모터란 유전자 산물을 인코드하거나, 또는 명시하는 폴리뉴클레오티드와 작동가능하도록 연계될 때, 당해 프로모터에 대응하는 유도자(inducer)가 이 세포 안에 존재할 때만 실질적으로 이 세포 안에서 당해 유전자 산물이 만들어지도록 하는 뉴클레오티드 서열을 지칭한다.
용어 "조직-특이적" 프로모터란 유전자에 의해 인코딩되거나 또는 특정된 폴리뉴클레오티드와 작동가능하도록 연계된 경우, 세포가 당해 프로모터에 대응하는 조직 유형의 세포인 경우에만 실질적으로 이 세포 안에서 유전자 산물이 만들어지도록 하는 뉴클레오티드 서열을 지칭한다.
scFv 내용에서 이용되는 용어 "링커" 및 "유연성(flexible) 폴리펩티드 링커"란 가변성 중쇄와 가변성 경쇄 영역들을 함께 연계하기 위하여, 아미노산, 이를 테면 글리신 및/또는 세린 잔기만 단독으로 또는 조합으로 구성된 펩티드 링커를 지칭한다. 한 구체예에서, 상기 유연성 폴리펩티드 링커는 Gly/Ser 링커이며, 아미노산 서열 (Gly-Gly-Gly-Ser)n을 포함하고, 여기에서 n은 1이거나 또는 이보다 큰 양의 정수다. 예를 들면, n=1, n=2, n=3, n=4, n=5, n=6, n=7, n=8, n=9 그리고 n=10이다. 한 구체예에서, 상기 유연성 폴리펩티드 링커에는 (Gly4Ser)4 또는 (Gly4Ser)3가 내포되나, 그러나, 이에 국한되지 않는다. 또다른 구체예에서, 상기 링커에는 (Gly2Ser), (GlySer) 또는 (Gly3Ser)의 다중 반복부가 내포된다. 또한, WO2012/138475(본원의 참고자료에 편입됨)에 기재된 링커들 또한 본 명세서 범위 안에 포함된다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=2 ~ 5다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 3이다.
본원에서 사용된 바와 같이, 5' 캡 (일명 RNA 캡, RNA 7-메틸구아노신 캡 또는 RNA m7G 캡이라고도 함)은 전사 시작 직후, 진핵 메신져 RNA의 "전방(front) 또는 5' 단부에 추가된 변형된 구아닌 뉴클레오티드이다. 상기 5' 캡은 상기 제 1 전사된 뉴클레오티드에 연계된 말단 기로 구성된다. 이의 존재는 리보솜에 의한 인지와 RNase로부터의 보호에 중요하다. 캡 추가는 전사에 연결되어, 공동-전사적으로 발생하여 서로 영향을 미친다. 전사 시작 직후, 합성되는 mRNA의 5' 단부는 RNA 중합효소와 연합된 캡-합성 복합체에 의해 결합된다. 이 효소 복합체는 mRNA 캡핑에 필요한 화학 반응을 촉매한다. 합성은 다중-단계 생화학 반응을 진행된다. 이 캡핑 모이어티가 변형되어, mRNA의 기능, 이를 테면, 이의 안정성 또는 해독 효능을 조정할 수 있다.
본원에서 사용된 바와 같이, "시험관 전사된 RNA"는 시험관내에서 합성된, RNA, 바람직하게는 mRNA를 지칭한다. 일반적으로, 이러한 시험관내 전사된 RNA는 시험관내 전사 벡터로부터 만들어진다. 상기 시험관내 전사 벡터는 당해 시험관내 전사된 RNA를 만들 때 이용되는 주형을 포함한다.
본원에서 사용된 바와 같이, "poly(A)"는 mRNA에 폴리아데닐화에 의해 부탁된 일련의 아데노신이다. 일시적(transient) 발현용 구조체의 바람직한 구체예에서, polyA는 50 내지 5000개, 바람직하게는 64개 이상, 더 바람직하게는 100개 이상, 가장 바람직하게는 300개 또는 400개 이상이다. poly(A) 서열은 mRNA 기능성, 이를 테면, 국소화(localization), 안정성 또는 해독 효능을 조정하기 위하여, 화학적으로 또는 효소적으로 변형될 수 있다.
본원에서 사용된 바와 같이, "폴리아데닐화(polyadenylation)"란 메신져 RNA 분자로 폴리아데닐일 모이어티, 또는 이의 변형된 변이체의 공유적 연계를 지칭한다. 진핵 유기체에서, 대부분 메신져 RNA (mRNA) 분자들은 3' 단부에서 폴리아데닐화된다. 3' poly(A) 꼬리는 폴리아데닐레이트 중합효소의 효소 작용을 통하여 프레(pre)-mRNA에 추가된 아데닌 뉴클레오티드들의 긴 서열(흔히, 700개)이다. 더-고등한 진핵생물에서, 상기 poly(A) 꼬리는 특이적 서열인, 폴리아데닐화 신호를 내포하는 전사체 상에 추가된다. 상기 poly(A) 꼬리와 이에 결합된 단백질은 엑소뉴클레아제에 의한 mRNA 분해로부터 이를 보호하는 것을 지원한다. 폴리아데닐화는 전사 종료, 핵으로부터 mRNA의 추출, 그리고 해독에 또한 중요하다. 폴리아데닐화는 DNA가 RNA로 전사 직후 핵에서 일어나지만, 그러나 세포질에서 나중에 추가적으로 또한 발생될 수 있다. 전사가 종료된 후, mRNA 쇄는 RNA 중합효소와 연합된 엔도뉴클레아제 복합체 작용을 통하여 절단된다. 상기 절단 부위는 당해 절단 부위 인근에 염기 서열 AAUAAA의 존재가 항상 특징적이다. 상기 mRNA가 절단된 후, 이 절단 부위에서 자유 3' 단부에 아데노신 잔기들이 추가된다.
본원에서 사용된 바와 같이, "일시적(transient)"이란 수 시간, 수일 또는 수주동안 비-통합된 이식유전자(transgene)의 발현을 지칭하는데, 이때 발현 시간은 게놈으로 통합되거나, 또는 숙주 세포 안의 플라스미드 레플리콘 안에 안정적으로 함유된 경우의 당해 유전자의 발현 시간 보다는 짧다.
용어 "신호 전달 경로(signal transduction pathway)"란 세포의 한 부분에서 세포의 다른 부분으로 신호를 전달하는 역할을 하는 다양한 신호 전달 분자 간의 생화학적 관계를 의미한다. 구절 "세포 표면 수용체"는 신호를 수신하고, 세포막을 통해 신호를 전송할 수 있는 분자들 및 분자 복합체들이 내포된다.
용어 "대상체"란 면역 반응이 유도될 수 있는 살아있는 유기체 (예를 들어, 포유류)들이 내포되는 것으로 의도된다.
용어 "실질적으로 정제된" 세포란 본질적으로 다른 세포 유형이 포함안된 세포를 의미한다. 실질적으로 정제된 세포는 자연적으로 발생하는 상태에서 정상적으로 연관된 다른 세포 유형과 분리된 세포를 또한 지칭할 수 있다. 일부 경우들에서, 실질적으로 정제된 세포 집단은 균질한 세포 집단을 의미한다. 다른 경우들에서, 이 용어는 이의 자연 상태에서 자연적으로 연관된 세포와 분리된 세포를 단순히 의미한다. 일부 측면들에서, 이들 세포는 시험관내에서 배양된다. 다른 측면들에서, 이들 세포는 시험관내에서 배양되지 않는다.
용어 "치료요법적"이란 본원에서 사용된 바와 같이, 치료를 의미한다. 치료요법적 효과는 질환 상태의 감소, 억제, 완화 또는 근절을 통해 얻는다.
용어 "예방(prophylaxis)"이란 본원에서 사용된 바와 같이, 질환 또는 질환 상태에 대한 예방 또는 보호 치료를 의미한다.
본 명세서의 내용에서, "종양 항원" 또는 "과증식성 장애 항원" 또는 "과증식성 장애에 연루된 항원"이란 특이적 과증식성 장애에 공통적인 항원들을 지칭한다. 특정 측면들에서, 본 명세서의 과증식성 장애 항원들은 원발성 또는 전이성 흑색종, 흉선종, 림프종, 육종, 폐암, 간암, NHL, 백혈병, 자궁암, 자궁경부암, 방광 암, 신장 암 및 선암, 이를 테면 유방암, 전립선암, 난소암, 췌장암, 그리고 이와 유사한 것들을 비롯한, 그러나, 이에 국한되지 않는 암으로부터 유래된다.
용어 "형질감염된(transfected)" 또는 "형질변형된(transformed)" 또는 "형질도입된(transduced)"이란 본외생성 핵산이 숙주 세포 안으로 전달되거나 또는 도입되는 과정을 지칭한다. "형질감염된" 또는 "형질변형된" 또는 "형질도입된" 세포는 외생성(exogenous) 핵산이 형질감염된, 형질변형된 또는 형질도입된 것을 말한다. 상기 세포에는 일차 대상 세포 및 그의 자손들이 내포된다.
용어 "특이적으로 결합하는"이란 샘플에 존재하는 동족 결합 짝 (가령, CD19)을 인지하고 결합하지만, 이 샘플 안에 있는 다른 분자는 반드시 그리고 실질적으로 인지하거나 또는 결합하지 않는 항체, 항체 단편 또는 특정 리간드를 의미한다.
본원에서 사용된 바와 같이, 용어 "메가뉴클레아제(meganuclease)"란 인지 서열에서 12개 염기쌍 이상의 이중- 가닥 DNA에 결합하는 엔도뉴클레아제를 지칭한다. 바람직하게는, 본 명세서의 메가뉴클레아제에 대한 인지 서열은 22개 염기 쌍이다. 메가뉴클레아제는 I-Crel로부터 유래된 엔도뉴클레아제일 수 있으며, 그리고 예를 들면, DNA-결합 특이성, DNA 절단 활성, DNA-결합 친화력, 또는 이량체화 성질에 대하여 천연 I-Crel과 비교하여 변형된 I-Crel의 공작된 변이체를 지칭할 수 있다. 이러한 I-Crel의 변형된 변이체를 만드는 방법은 당업계에 공지되어 있다 (가령, WO 2007/047859). 메가뉴클레아제는 본원에서 사용된 바와 같이, 이종이량체로써 또는 "단일-쇄 메가뉴클레아제"로써 이중-가닥의 DNA에 결합하며, 이때 DNA-결합 도메인들의 쌍은 펩티드 링커를 이용하여 단일 폴리펩티드에 연결된다. 용어 "귀소(homing) 앤도뉴클레아제"는 용어 "메가뉴클레아제"와 동의어다. 본 명세서의 메가뉴클레아제는 세포들, 특히 인간 T 세포들에서 발현될 때 실질적으로 비-독성이며, 본원에서 기술된 방법을 이용하여 측정하였을 때, 세포 생존력에 유해한 영향 없이 또는 메가뉴클레아제 절단 활성의 유의적인 감소 없이, 세포들이 형질감염되며, 37℃에서 유지될 수 있다.
본원에서 사용된 바와 같이, 용어 "단일-쇄 메가뉴클레아제(single-chain meganuclease)"란 링커에 의해 연결된 뉴클레아제 소단위 쌍을 포함하는 폴리펩티드를 지칭한다. 단일-쇄 메가뉴클레아제는 다음과 같은 체계를 갖는다: N-말단 소단위 - 링커 - C-말단 소단위. 두 개의 메가뉴클레아제 소단위는 아미노산 서열에서 일반적으로 동일하지 않을 것이며, 동일하지-않는 DNA 서열을 인지할 것이다. 따라서, 단일-쇄 메가뉴클레아제는 위(pseudo)-팔린드롬(palindromic) 또는 비(non)-팔린드롬 인지 서열을 전형적으로 절단한다. 단일-쇄 메가뉴클레아제는 실질적으로 이량체는 아닐 수 있지만, "단일-쇄 이종이량체" 또는 "단일-쇄 이종이량체성 메가뉴클레아제"라고 지칭될 수 있다. 명확하게 하기 위하여, 명시적인 언급이 없는 한, 용어 "메가뉴클레아제"는 이량체성 또는 단일-쇄 메가뉴클레아제를 지칭할 수 있다.
본원에서 사용된 바와 같이, 용어 "TALEN"은 Fok1 뉴클레아제 도메인의 임의의 부분에 융합된 16-22 개의 TAL 도메인 반복을 포함하는 DNA-결합 도메인을 포함하는 엔도뉴클레아제를 지칭한다.
본원에서 사용된 바와 같이, 용어 "콤팩트(Compact) TALEN"란 I-Tevl 귀소 엔도뉴클레아제의 뉴클레아제 도메인의 임의의 촉매 활성 부분에 대해 임의의 방향으로 융합된 16-22 TAL 도메인 반복부를 갖는, DNA-결합 도메인을 포함하는 엔토뉴클레아제를 지칭한다.
본원에서 사용된 바와 같이, 용어 "CRISPR"란 카스파제, 이를 테면, Cas9, 그리고 가이드 RNA(게놈 DNA에 있는 인지 부위에 혼성화됨으로써 당해 카스파제의 DNA 절단을 지시하는)를 포함하는 카스파제-기반의 앤도뉴클레아제를 지칭한다.
본원에서 사용된 바와 같이, 용어 "megaTAL"란 공작된, 서열-특이적 귀소 앤도뉴클레아제와 함께, 전사 활성화제-유사 작동체 (TALE) DNA 결합 도메인을 포함하는 단일-쇄 뉴클레아제를 지칭한다.
본원에서 사용된 바와 같이, 용어 "T 세포 수용체" 및 "T 세포 수용체 복합체"는 호환사용되며, T 세포 표면 상에 있는 일반적으로 항원 인지를 담당하는 분자를 지칭한다. 상기 TCR은 T 세포의 95%에서 TCR 알파 및 TCR 베타 쇄로 구성된 이종이량체를 포함하며, 한편 T 세포의 5%는 TCR 감마 쇄 및 TCR 델타 쇄로 구성된 TCRs을 갖는다. 상기 TCR은 CD3ε, CD3γ, 및 CD3δ중 하나 또는 그 이상을 더 포함한다. 일부 구체예들에서, 상기 TCR은 CD3ε를 포함한다. 일부 구체예들에서, 상기 TCR은 CD3γ를 포함한다. 일부 구체예들에서, 상기 TCR은 CD3δ를 포함한다. 일부 구체예들에서, 상기 TCR은 CD3ζ를 포함한다. TCR과 항원, 가령, 항원 및 MHC과의 관계로 연루된 효소, 공동-수용체들 그리고 특화된 보조 분자들에 의해 매개되는 일련의 생화학적 사건을 통해 이의 T 세포들이 활성화된다. 일부 구체예들에서, 인간 TCR 알파의 불변 도메인은 서열 식별 번호: 142의 서열을 갖는다. 일부 구체예들에서, 상기 인간 TCR 알파의 불변 도메인은 서열 식별 번호: 143의 서열을 갖는 IgC 도메인, 서열 식별 번호: 144의 서열을 갖는 막경유 도메인, 그리고 SS의 서열을 갖는 세포내 도메인을 갖는다. 일부 구체예들에서, 상기 뮤린 TCR 알파의 불변 도메인은 서열 식별 번호: 147의 서열을 갖는다. 일부 구체예들에서, 상기 뮤린 TCR 알파의 불변 도메인은 서열 식별 번호: 144의 서열을 갖는 막경유 도메인, 그리고 SS의 서열을 갖는 세포내 도메인을 갖는다. 일부 구체예들에서, 인간 TCR 베타의 불변 도메인은 서열 식별 번호: 148의 서열을 갖는다. 일부 구체예들에서, 상기 인간 TCR 베타의 불변 도메인은 서열 식별 번호: 149의 서열을 갖는 IgC 도메인, 서열 식별 번호: 150의 서열을 갖는 막경유 도메인, 그리고 서열 식별 번호: 151의 서열을 갖는 세포내 도메인을 갖는다. 일부 구체예들에서, 뮤린 TCR 베타의 불변 도메인은 서열 식별 번호: 152의 서열을 갖는다. 일부 구체예들에서, 상기 뮤린 TCR 베타의 불변 도메인은 서열 식별 번호: 152의 서열을 갖는 막경유 도메인, 그리고 서열 식별 번호: 153의 서열을 갖는 세포내 도메인을 갖는다. 일부 구체예들에서, 인간 TCR 델타의 불변 도메인은 서열 식별 번호: 243의 서열을 갖는다. 일부 구체예들에서, 상기 인간 TCR 델타의 불변 도메인은 서열 식별 번호: 265의 서열을 갖는 IgC 도메인, 서열 식별 번호: 159의 서열을 갖는 막경유 도메인, 그리고 서열 L의 서열을 갖는 세포내 도메인을 갖는다. 일부 구체예들에서, 상기 인간 TCR 감마의 불변 도메인은 서열 식별 번호: 21의 서열을 갖는다. 일부 구체예들에서, 상기 인간 TCR 감마의 불변 도메인은 서열 식별 번호: 155의 서열을 갖는 IgC 도메인, 서열 식별 번호: 156의 서열을 갖는 막경유 도메인, 그리고 서열 식별 번호: 157의 서열을 갖는 세포내 도메인을 갖는다.
일부 구체예들에서, 인간 CD3 입실론은 서열 식별 번호: 258의 서열을 갖는다. 일부 구체예들에서, 인간 CD3 입실론은 서열 식별 번호: 126의 서열을 갖는 세포외 도메인, 서열 식별 번호: 127의 서열을 갖는 막경유 도메인, 그리고 세포내 도메인, 가령, 서열 식별 번호: 128의 서열을 갖는 세포내 신호생성 도메인을 갖는다. 일부 구체예들에서, 인간 CD3 델타는 서열 식별 번호: 136의 서열을 갖는다. 일부 구체예들에서, 인간 CD3 델타는 서열 식별 번호: 138의 서열을 갖는 세포외 도메인, 서열 식별 번호: 139의 서열을 갖는 막경유 도메인, 그리고 세포내 도메인, 가령, 서열 식별 번호: 140의 서열을 갖는 세포내 신호생성 도메인을 갖는다. 일부 구체예들에서, 인간 CD3 감마는 서열 식별 번호: 130의 서열을 갖는다. 일부 구체예들에서, 인간 CD3 감마는 서열 식별 번호: 132의 서열을 갖는 세포외 도메인, 서열 식별 번호: 133의 서열을 갖는 막경유 도메인, 그리고 세포내 도메인, 가령, 서열 식별 번호: 134의 서열을 갖는 세포내 신호생성 도메인을 갖는다.
범위: 본 개시 전반에 걸쳐, 본 개시의 다양한 측면이 범위 형식으로 제시될 수 있다. 범위 형식의 설명은 단지 편의성과 간결성을 위한 것이며, 본 발명의 범위에 대한 융통성 없는 제한으로 해석되어서는 안된다. 따라서, 범위에 대한 설명은 가능한 모든 하위 범위와 해당 범위 내의 개별 숫자 값을 구체적으로 공개한 것으로 간주되어야 한다. 예를 들면, 1 ~ 6과 같은 범위에 대한 설명은 1 ~ 3, 1 ~ 4, 1 ~ 5, 2 ~ 4, 2 ~ 6, 3 ~ 6 등과 같은 하위범위 뿐만 아니라, 해당 범위 내의 개별 수치 (가령, 1, 2, 2.7, 3, 4, 5, 5.3 및 6)를 구체적으로 공개한 것으로 간주되어야 한다. 다른 예로서, 95-99% 동일성 범위는 95%, 96%, 97%, 98% 또는 99% 동일성을 가진 것을 포함하고, 96-99%, 96-98%, 96-97%, 97-99%, 97-98% 및 98-99% 동일성과 같은 하위범위를 포함한다. 이것은 범위의 폭에 관계없이 적용된다.
T 세포수용체들 (TCR) 융합 단백질 (TFP 및 TCR 불변 도메인을 포함하는 변형된 T 세포들을 이용하여, 질환, 이를 테면, 암 치료에 이용되는 물질의 조성물 및 방법이 본원에 제공되는데, 이때 상기 변형된 T 세포는 기능적으로 파괴된 내생성 TCR 소단위를 또한 보유한다. 본원에서 사용된 바와 같이, "T 세포수용체 (TCR) 융합 단백질" 또는 "TFP"에는 일반적으로, i) 표적 세포들 상의 표면 항원에 결합할 수 있고, 그리고 ii) T 세포의 표면 또는 표면 상에 공동-위치될 때, 전형적으로 무손상(intact) TCR 복합체의 다른 폴리펩티드 성분들과 상호작용할 수 있는 TCR을 포함하는 각종 폴리펩티드로부터 유래된 재조합 폴리펩티드가 내포된다. 본원에서 제공된 바와 같이, TFPs는 키메라 항원 수용체들과 비교하였을 때, 실질적인 잇점을 제공한다. 용어 "키메라 항원 수용체(Chimeric Antigen Receptor)" 또는 대안으로 "CAR"란 가령, 단일 도메인 항체, 또는 scFv 형태의 세포외 항원 결합 도메인, 막경유 도메인, 그리고 하기에서 정의된 바의 자극 분자로부터 유래된 기능적 신호생성 도메인을 포함하는 세포질 신호생성 도메인 (본원에서 또한 "세포내 신호생성 도메인"로 지칭됨)을 포함하는 재조합 폴리펩티드 구조체를 지칭한다. 일반적으로, CAR의 중심 세포내 신호생성 도메인은 CD3 제타 쇄로부터 유래되며, 상기 TCR 복합체와 연루된 것으로 보통 발견된다. 상기 CD3 제타 신호생성 도메인은 적어도 하나의 공동-자극 분자,이를 테면 4-1BB (가령, CD137), CD27 및/또는 CD28로부터 유래된 하나 또는 그 이상의 기능성 신호전달 도메인과 융합될 수 있다.
T 세포 수용체 (TCR) 융합 단백질 (TFPs)
본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하며, 이때 상기 TFP는 결합 도메인, 가령, 항체 또는 항체 단편, 리간드, 또는 리간드 결합 단백질을 포함하고, 이때 상기 결합 도메인의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열에 인접하고, 이와 동일한 판독 틀 안에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 CD19, 가령, 인간 CD19에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 메소텔린, 가령, 인간 메소텔린에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 MUC16, 가령, 인간 MUC16에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 CD20, 가령, 인간 CD20에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 CD70, 가령, 인간 CD70에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 CD79B, 가령, 인간 CD79B에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 HER2, 가령, 인간 HER2에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 PSMA, 가령, 인간 PSMA에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 BCMA, 가령, 인간 BCMA에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 ROR1, 가령, 인간 ROR1에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 CD22, 가령, 인간 CD22에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 GPC3, 가령, 인간 GPC3에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 Nectin-4, 가령, 인간 Nectin-4에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본 명세서는 TFPs를 인코딩하는 재조합 DNA 구조체들을 포괄하는데, 이때 상기 TFP는 Trop-2, 가령, 인간 Trop-2에 특이적으로 결합하는 항체 단편을 포함하며, 이때 상기 항체 단편의 서열은 TCR 소단위 또는 이의 일부분을 인코딩하는 핵산 서열과 동일한 판독 틀에 인접하고, 이에 있다. 본원에 제공된 TFPs는 기능적 TCR 복합체를 형성하기 위해, 하나 또는 그 이상의 내생성 (또는 대안으로, 하나 또는 그 이상의 외생성, 또는 내생성과 외생성의 조합) TCR 소단위와 결합할 수 있다.
하나의 측면에서, 본 명세서의 TFP는 항원 결합 도메인으로 지칭되는 표적-특이적 결합 요소를 포함한다. 모이어티의 선택은 표적 세포의 표면을 특정하는 표적 항원의 유형과 수에 따라 달라진다. 예를 들면, 상기 항원 결합 도메인은 특정 질환 상태와 관련된 표적 세포 상에서 세포 표면 마커(marker)로서 작용하는 표적을 인지하도록 선택될 수 있다. 따라서, 본 명세서의 TFP에서 항원-결합 도메인에 대한 표적 항원으로 작용할 수 있는 세포 표면 마커들의 예로는 바이러스성 감염, 박테리아성 감염 및 기생충 감염; 자가면역 질환; 그리고 암 질환들 (가령, 악성 질환들)에 연루된 것들이 내포된다.
하나의 측면에서, 상기 TFP-중재된 T 세포반응은 상기 TFP에서 원하는 항원에 특이적으로 결합하는 항원-결합 도메인을 공작하는 방식으로 관심대상 항원을 지향하도록 할 수 있다.
상기 항원 결합 도메인은 상기 항원에 결합하는 임의의 도메인일 수 있는데, 가령, 단일클론성 항체, 다중클론성 항체, 재조합 항체, 인간 항체, 인간화된 항체, 그리고 이를 테면, 카멜리드 유래된 나노바디(nanobody)의 중쇄 가변성 도메인 (VH), 경쇄 가변성 도메인 (VL) 및 가변성 도메인 (VHH)이 내포되나, 이에 국한되지 않는 기능적 단편, 그리고 항원 결합 도메인으로 기능하는 당분야에 공지된 대체 스캐폴드, 이를 테면, 재조합 피브로넥틴 도메인, 안티칼린, DARPIN 및 이와 유사한 것들이 내포되나, 이에 국한되지 않는다. 유사하게 표적 항원을 특이적으로 인지하고, 이에 결합하는 천연 리간드 또는 합성 리간드를 상기 TFP의 항원 결합 도메인으로 이용할 수 있다. 일부 경우에서, TFP가 궁극적으로 사용될 동일한 종에서 항원 결합 도메인이 유래되는 것이 유익하다. 예를 들면, 인간에서 사용하기 위해, TFP의 항원 결합 도메인은 항체 또는 항체 단편의 항원 결합 도메인에 대한 인간 또는 인간화된 잔기를 포함하는 것이 유익할 수 있다.
따라서, 하나의 측면에서, 상기 항원-결합 도메인은 인간화된 또는 인간 항체 또는 항체 단편, 또는 뮤린 항체 또는 항체 단편을 포함한다. 한 구체예에서, 상기 인간화된 또는 인간 항-TAA 결합 도메인은 본원에서 기술된 인간화된 또는 인간 항-TAA 결합 도메인의 경쇄 상보성 결정 영역 1 (LC CDR1), 경쇄 상보성 결정 영역 2 (LC CDR2), 그리고 경쇄 상보성 결정 영역 3 (LC CDR3)중 하나 또는 그 이상 (가령, 세 가지 모두), 및/또는 본원에서 기술된 인간화된 또는 인간 항-CD19 결합 도메인의 중쇄 상보성 결정 영역 1 (HC CDR1), 중쇄 상보성 결정 영역 2 (HC CDR2), 그리고 중쇄 상보성 결정 영역 3 (HC CDR3)중 하나 또는 그 이상(가령, 세 가지 모두)을 포함하고, 가령, 인간화된 또는 인간 항-TAA 결합 도메인은 하나 또는 그 이상의, 가령, 세 가지 모두의 LC CDRs 및 하나 또는 그 이상의, 가령, 세 가지 모두의 HC CDRs을 포함한다. 한 구체예에서, 상기 인간화된 또는 인간 항-CD19 결합 도메인은 본원에서 기술된 인간화된 또는 인간 항-TAA 결합 도메인의 중쇄 상보적 결정 영역 1 (HC CDR1), 중쇄 상보적 결정 영역 2 (HC CDR2), 그리고 중쇄 상보적 결정 영역 3 (HC CDR3)중 하나 또는 그 이상의 (가령, 세 가지 모두)을 포함하며, 가령, 상기 인간화된 또는 인간 항-TAA 결합 도메인은 두 개의 가변성 중쇄 영역을 갖는데, 각각은 본원에서 기술된 HC CDR1, HC CDR2 및 HC CDR3을 포함한다. 한 구체예에서, 상기 인간화된 또는 인간 항-TAA 결합 도메인은 본원에 기술된 인간화된 또는 인간 경쇄 가변 영역 및/또는 본원에 기술된 인간화된 또는 인간 중쇄 가변 영역을 포함한다. 한 구체예에서, 상기 인간화된 또는 인간 항-TAA 결합 도메인은 본원에서 기술된 인간화된 중쇄 가변 영역을 포함하는데, 가령, 본원에서 기술된 적어도 두 개의인간화된 또는 인간 중쇄 가변 영역을 포함한다. 한 구체예에서, 상기 항-TAA 결합 도메인은 본원에서 기술된 아미노산 서열의 경쇄 및 중쇄를 포함하는 scFv이다. 구체예에서, 상기 항-=TAA 결합 도메인 (가령, scFv)은 다음을 포함한다: 본원에서 제공되는 경쇄 가변 영역의 아미노산 서열에서 적어도 하나, 둘 또는 세 개 변형 (가령, 치환) 그러나, 30개, 20개 또는 10개를 넘지 않는 변형 (가령, 치환)을 가지는 아미노산 서열, 또는 본원에서 제공되는 아미노산 서열에 대하여 95-99% 동일성을 갖는 서열을 포함하는 경쇄 가변 영역; 및/또는 본원에서 제공되는 중쇄 가변 영역의 아미노산 서열에서 적어도 하나, 둘 또는 세 개 변형 (가령, 치환), 그러나, 30개, 20개 또는 10개를 넘지 않는 변형(가령, 치환)을 가지는 아미노산 서열, 또는 본원에서 제공되는 아미노산 서열에 대하여 95-99% 동일성을 갖는 서열을 포함하는 중쇄 가변 영역. 한 구체예에서, 상기 인간화된 또는 인간 항-TAA 결합 도메인은 scFv이며, 그리고 본원에서 기술된 아미노산 서열을 포함하는 경쇄 가변 영역은 링커, 가령, 본원에서 기술된 링커를 통하여 본원에서 기술된 아미노산 서열을 포함하는 중쇄 가변 영역에 부착된다. 한 구체예에서, 상기 인간화된 항-TAA 결합 도메인은 (Gly4-Ser)n 링커를 함유하며, 이때 n은 1, 2, 3, 4, 5, 또는 6, 바람직하게는 3 또는 4이다. 상기 scFv의 경쇄 가변 영역과 중쇄 가변 영역은 다음중 하나의 방향을 가질 수 있다: 가령, 경쇄 가변 영역-링커-중쇄 가변 영역 또는 중쇄 가변 영역-링커-경쇄 가변 영역. 일부 경우에서, 상기 링커 서열은 긴 링커 (LL) 서열을 포함한다. 일부 경우에서, 상기 긴 링커 서열은 (G4S)n을 포함하며, 이때 n=2 ~ 4이다. 일부 경우에서, 상기 링커 서열은 짧은 링커 (SL) 서열을 포함한다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 3이다.
일부 구체예들에서, 상기 항원-결합 도메인은 서열 식별 번호: 73의 경쇄 CDR1, 서열 식별 번호: 75의 경쇄 CDR2, 및 서열 식별 번호: 77의 경쇄 CDR3, 그리고 서열 식별 번호: 79의 중쇄 CDR1, 서열 식별 번호: 81의 중쇄 CDR2, 및 서열 식별 번호: 83의 중쇄 CDR3을 갖는 항-CD19 인간화된 또는 인간 항체 또는 항체 단편, 또는 뮤린 항체 또는 항체 단편을 포함한다. 일부 구체예들에서, 상기 항-CD19 항체는 뮤린 scFv이다. 일부 구체예들에서, 상기 항-CD-19 항체는 서열 식별 번호: 85의 VL과 서열 식별 번호: 87의 VH를 포함한다.
일부 구체예들에서, 상기 항원-결합 도메인은 서열 식별 번호: 60의 CDR1, 서열 식별 번호: 61의 CDR2, 및 서열 식별 번호: 62의 CDR3 또는 서열 식별 번호: 63의 CDR1, 서열 식별 번호: 64의 CDR2, 및 서열 식별 번호: 65의 CDR3 또는 서열 식별 번호: 66의 CDR1, 서열 식별 번호: 67의 CDR2, 및 서열 식별 번호: 68의 CDR3을 갖는 항-메소텔린 인간화된 또는 인간 단일 도메인 항체 또는 항체 단편을 포함한다. 일부 구체예들에서, 상기 항-메소텔린 항체는 서열 식별 번호: 69, 서열 식별 번호: 70, 또는 서열 식별 번호: 71의 가변 도메인을 갖는다.
일부 구체예들에서, 상기 항원-결합 도메인은 서열 식별 번호: 88의 CDR1, 서열 식별 번호: 89의 CDR2, 및 서열 식별 번호: 90의 CDR3, 또는 서열 식별 번호: 92의 CDR1, 서열 식별 번호: 93의 CDR2, 및 서열 식별 번호: 94의 CDR3, 또는 서열 식별 번호: 96의 CDR1, 서열 식별 번호: 97의 CDR2, 및 서열 식별 번호: 98의 CDR3, 또는 서열 식별 번호: 100의 CDR1, 서열 식별 번호: 101의 CDR2, 및 서열 식별 번호: 102의 CDR3, 또는 서열 식별 번호: 104의 CDR1, 서열 식별 번호: 105의 CDR2, 및 서열 식별 번호: 106의 CDR3, 또는 서열 식별 번호: 108의 CDR1, 서열 식별 번호: 109의 CDR2, 및 서열 식별 번호: 110의 CDR3, 또는 서열 식별 번호: 112의 CDR1, 서열 식별 번호: 113의 CDR2, 및 서열 식별 번호: 114의 CDR3, 또는 서열 식별 번호116의 CDR1, 서열 식별 번호: 117의 CDR2, 및 서열 식별 번호: 118의 CDR3, 또는 서열 식별 번호: 120의 CDR1, 서열 식별 번호: 121의 CDR2, 및 서열 식별 번호: 122의 CDR3을 갖는 항-메소텔린 인간화된 또는 인간 단일 도메인 항체 또는 항체 단편을 포함한다.
일부 측면들에서, 인간이-아닌 항체는 인간화되며, 여기에서 항체의 특이적 서열 또는 영역은 인간 또는 이의 결합 단편에서 자연적으로 만들어지는 항체와의 유사성이 증가되도록 변형된다. 한 측면에서, 상기 항원 결합 도메인은 인간화된다.
인간화된 항체는 다음의 기술을 포함하나, 이에 국한되지 않은 당분야에 공지된 다양한 기술을 이용하여 만들어질 수 있다: CDR-그래프팅(grafting) (가령, 유럽 특허 번호 EP 239,400; 국제 공개 번호. WO 91/09967; 그리고 U.S. 특허 번호 5,225,539, 5,530,101, 그리고 5,585,089 참고, 각각은 이의 전문이 본원의 참고자료에 편입됨), 베니어링(veneering) 또는 재포장(resurfacing) (가령, 유럽 특허 번호 EP 592,106 및 EP 519,596; Padlan, 1991, Molecular Immunology, 28(4/5):489-498; Studnicka et al., 1994, Protein Engineering, 7(6):805-814; 그리고 Roguska et al., 1994, PNAS, 91:969-973, 각각은 이의 전문이 본원의 참고자료에 편입됨), 쇄 셔플링(shuffling) (가령, U.S. 특허 번호 5,565,332 참고, 이의 전문이 본원의 참고자료에 편입됨), 그리고 가령, U.S.특허 출원 공개 번호. US2005/0042664, U.S. 특허 출원 공개 번호. US2005/0048617, U.S. 특허 번호 6,407,213, U.S. 특허 번호 5,766,886, 국제 공개 번호. WO 9317105, Tan et al., J. Immunol., 169:1119-25 (2002), Caldas et al., Protein Eng., 13(5):353-60 (2000), Morea et al., Methods, 20(3):267-79 (2000), Baca et al., J. Biol. Chem., 272(16):10678-84 (1997), Roguska et al., Protein Eng., 9(10):895-904 (1996), Couto et al., Cancer Res., 55 (23 Supp):5973s-5977s (1995), Couto et al., Cancer Res., 55(8):1717-22 (1995), Sandhu J S, Gene, 150(2):409-10 (1994), 그리고 Pedersen et al., J. Mol. Biol., 235(3):959-73 (1994)에 기술된 기술(각각은 이의 전문이 본원의 참고자료에 편입됨). 대개, 프레임워크 영역의 프레임워크 잔기들은 예를 들어, 항원 결합을 개선하기 위해, CDR 공여자 항체로부터의 상응하는 잔기로 치환될 것이다. 이러한 프레임워크 치환은 당업계에 잘 알려진 방법, 예를 들어, 항원 결합에 중요한 프레임워크 잔기를 확인하기 위한 CDR 및 프레임워크 잔기의 상호 작용 모델링 및 특정 위치에서 비정상적인 프레임워크 잔기를 확인하기 위한 서열 비교에 의해 확인된다 (가령, Queen et al., U.S. 특허 번호. 5,585,089; 그리고 Riechmann et al., 1988, Nature, 332:323 참고, 이들의 전문은 본원의 참고자료에 편입됨)
인간화된 항체 또는 항체 단편은 인간이-아닌 공급원으로부터 그 안에 남아있는 하나 또는 그 이상의 아미노산 잔기를 갖는다. 이들 비-인간 아미노산 잔기들은 대개 "수입(import)" 잔기라고 하며, "수입" 가변 도메인으로부터 전형적으로 취해진다. 본원에서 제공된 바와 같이, 인간화된 항체들 또는 항체 단편들은 비-인간 면역글로불린 분자들의 하나 또는 그 이상의 CDRs와 프레임워크 영역들을 포함하며, 이때 상기 프레임워크를 포함하는 아미노산 잔기들은 인간 생식계열로부터 완전하게 또는 대부분 유래된다. 항체들 또는 항체 단편들의 인간화를 위한 다중 기술들이 당분야에 공지되어 있고, Winter 및 공동-작업자들의 방법 (Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-327 (1988); Verhoeyen et al., Science, 239:1534-1536 (1988))에 따라, 인간 항체의 대응하는 서열을 설치류 CDRs 또는 CDR 서열로 대체함으로써, 가령, CDR-그래프팅에 의해 기본적으로 실행될 수 있다 (EP 239,400; PCT 공개 번호 WO 91/09967; 그리고 U.S. 특허 번호. 4,816,567; 6,331,415; 5,225,539; 5,530,101; 5,585,089; 6,548,640, 이의 내용은 이들의 전문이 본원의 참고자료에 편입됨). 이러한 인간화된 항체들과 항체 단편들에서, 무손상 인간 가변 도메인보다 실질적으로 적은 수가 비-인간 종의 상응하는 서열로 대체되었다. 인간화된 항체들은 대개 이의 일부 CDR 잔기들과 아마도 일부 프레임워크 (FR) 잔기들이 설치류 항체들의 유사 부위의 잔기로 대체된, 인간 항체들이다. 항체들과 항체 단편들의 인간화는 베니어링(veneering) 또는 재포장(resurfacing) (EP 592,106; EP 519,596; Padlan, 1991, Molecular Immunology, 28(4/5):489-498; Studnicka et al., Protein Engineering, 7(6):805-814 (1994); 그리고 Roguska et al., Proc. Natl. Acad. Sci. USA, 91:969-973 (1994)) 또는 쇄 셔플링(shuffling) (U.S. 특허 번호 5,565,332)에 의해 또한 이루어질 수 있으며, 상기 자료 내용은 이의 전문이 본원의 참고자료에 편입된다.
이러한 인간화된 항체를 만드는데 이용되는 인간의 중쇄와 경쇄 모두의 가변성 도메인의 선택은 항원성의 감소를 위함이다. 소위 "최적(best-fit)" 방법에 따라, 설치류 항체의 가변 도메인의 서열을 공지된 인간 가변 도메인 서열의 전체 라이브러리에 대해 스크리닝한다. 설치류의 서열과 가장 가까운 인간 서열은 인간화된 항체에 대한 인간 프레임워크(FR)로 선택될 수 있다 (Sims et al., J. Immunol., 151:2296 (1993); Chothia et al., J. Mol. Biol., 196:901 (1987), 상기 자료 내용은 이의 전문이 본원의 참고자료에 편입된다). 다른 방법은 경쇄 또는 중쇄의 특정 하위 군의 모든 인간 항체의 컨센서스(consensus) 서열로부터 유도된 특정 프레임워크을 사용한다. 몇 가지 상이한 인간화된 항체에 대하여 동일한 프레임워크가 이용될 수 있다 (가령, Nicholson et al. Mol. Immun. 34 (16-17): 1157-1165 (1997); Carter et al., Proc. Natl. Acad. Sci. USA, 89:4285 (1992); Presta et al., J. Immunol., 151:2623 (1993) 참고, 상기 자료 내용은 이의 전문이 본원의 참고자료에 편입된다). 일부 구체예들에서, 중쇄 가변 영역의 프레임워크 영역, 가령, 네 개의 모든 프레임워크 영역은 VH4-4-59 생식계열 서열로부터 유래된다. 한 구체예에서, 상기 프레임워크 영역은 가령, 대응하는 뮤린 서열의 아미노산에서 하나, 둘, 셋, 넷, 또는 다섯 개의 변형, 가령, 치환을 포함할 수 있다. 한 구체예에서, 경쇄 가변 영역의 상기 프레임워크 영역, 가령, 네 개의 모두 프레임워크 영역은 VK3-1.25 생식계열 서열로부터 유래된다. 한 구체예에서, 상기 프레임워크 영역은 가령, 대응하는 뮤린 서열의 아미노산에서 하나, 둘, 셋, 넷, 또는 다섯 개의 변형, 가령, 치환을 포함할 수 있다.
일부 측면들에서, 항체 단편을 포함하는 본 명세서의 TFP 조성물의 일부분은 표적 항원에 대한 높은 친화력을 유지하고, 기타 우호적인 생물학적 성질을 갖도록 인간화된다. 본 명세서의 한 측면에 따르면, 인간화된 항체들 및 항체 단편들은 부모 서열 및 인간화된 서열의 3-차원 모델을 사용하여, 부모 서열 및 다양한 개념적 인간화 생성물을 분석하는 공정에 의해 제조된다. 3-차원 면역글로불린 모델은 일반적으로 이용가능하며 당업자에게 익숙하다. 선택된 후보 면역글로불린 서열의 가능한 3-차원 형태적 구조를 설명하고, 표시하는 컴퓨터 프로그램이 이용 가능하다. 이러한 디스플레이의 검사는 후보 면역글로불린 서열의 기능에서 잔기의 가능한 역할의 분석, 가령, 후보 면역글로블린이 표적 항원에 결합하는 능력에 영향을 미치는 잔기의 분석을 허용한다. 이러한 방식으로, FR 잔기는 수용체 및 수입 서열로부터 선택되고 결합되어, 표적 항원에 대한 증가된 친화력과 같은 원하는 항체 또는 항체 단편 특성이 달성된다. 일반적으로, CDR 잔기는 항원 결합에 영향을 미치는데 직접적이고 가장 실질적으로 관여한다.
인간화된 항체 또는 항체 단편은 기원 항체와 유사한 항원 특이성을 유지할 수 있는데, 가령, 본 명세서에서 인간 종양 연합된 항원(TAA)에 결합하는 능력을 유지할 수 있다. 일부 구체예들에서, 인간화된 항체 또는 항체 단편은 가령, 인간 CD19, 인간 BCMA, 또는 또다른 종양 연합된 항원에 대해 개선된 친화력 및/또는 특이성을 가질 수 있다.
한 측면에서, 상기 결합 도메인은 항체 또는 항체 단편의 특정 기능적 특징 또는 속성에 의해 특징화된다. 예를 들면, 한 측면에서, 항원 결합 도메인을 포함하는, 본 명세서의 TFP 조성물의 일부분은 인간 CD19에 특이적으로 결합한다. 하나의 측면에서, 상기 항원 결합 도메인은 인간 CD19에 대하여 Nicholson et al. Mol. Immun. 34 (16-17): 1157-1165 (1997)에서 기술된 FMC63 scFv와 동일한 또는 유사한 결합 특이성을 갖는다. 하나의 측면에서, 본 명세서는 항체 또는 항체 단편을 포함하는 항원 결합 도메인에 관계하는데, 이때 상기 항체 결합 도메인은 CD19 또는 BCMA 단백질 또는 이의 단편에 특이적으로 결합하고, 이때 상기 항체 또는 항체 단편은 본원에서 제공되는 아미노산 서열을 내포하는 가변성 경쇄 및/또는 가변성 중쇄를 포함한다. 특정 측면들에서, 상기 scFv은 리더 서열과 동일한 판독 틀에 인접하고, 이 안에 있다.
한 측면에서, 상기 항-종양-연합된 항원 결합 도메인은 단편, 가령, 단일 쇄 가변 단편 (scFv)이다. 한 측면에서, 상기 항-TAA 결합 도메인은 Fv, Fab, (Fab')2, 또는 이중-기능성 (가령, 이중-특이적) 하이브리드 항체다(가령, Lanzavecchia et al., Eur. J. Immunol. 17, 105 (1987)). 하나의 측면에서, 본 명세서의 상기 항체들과 이의 단편들은 야생형 또는 강화된 친화력으로 CD19 단백질에 결합한다. 또다른 측면에서, 상기 항-TAA 결합 도메인은 단일 도메인 항체 (sdAb 또는 VHH)를 포함한다.
표적 항원 (가령, 융합 모이어티 결합 도메인의 표적에 대하여 본 명세서의 도처에서 기술된 CD19, BCMA 또는 임의의 표적 항원)에 특이적인 항체 항원 결합 도메인을 수득하는 방법들이 또한 본원에서 제공되는데, 상기 방법은 다음을 포함한다: 본원에서 제시된 VH 도메인의 아미노산 서열에 하나 또는 그 이상의 아미노산을 추가, 결손, 치환 또는 삽입의 방식으로, 당해 VH 도메인의 아미노산 서열 변이체인 VH 도메인을 제공하고, 이에 따라 제공된 VH 도메인에 임의선택적으로 하나 또는 그 이상의 VL 도메인을 복합시키고, 그리고 VH 도메인 또는 VH/VL 조합 또는 조합들을 테스트하여 관심 대상의 표적 항원(가령, MSLN, CD79B, 등등)에 특이적이고, 임의선택적으로 하나 또는 그 이상의 원하는 성질을 갖는, 특이적 결합 구성원 또는 항체 항원 결합 도메인을 식별해낸다.
일부 경우에서, VH 도메인과 scFvs는 당분야에 공지된 방법에 따라 만들어질 수 있다 (예를 들면, Bird et al., (1988) Science 242:423-426 및 Huston et al., (1988) Proc. Natl. Acad. Sci. USA 85:5879-5883 참고). scFv 분자들은 유연성 폴리펩티드 링커들을 이용하여 VH 영역과 VL 영역을 연계시켜 만들 수 있다. 상기 scFv 분자들은 최적화된 길이 및/또는 아미노산 조성물을 갖는 링커 (가령, Ser-Gly 링커)를 포함한다. 상기 링커 길이는 scFv의 가변 영역이 접히고, 상호 작용하는 방식에 크게 영향을 줄 수 있다. 실제, 짧은(가령, 5-10개의 아미노산) 폴리펩티드 링커가 이용된다면, 쇄-내(intra) 폴딩이 방해된다. 기능적 에피토프 결합 부위를 형성하기 위하여 두 개의 가변 영역을 함께 가져올 때, 쇄-간(inter) 폴딩이 필요하다. 일부 경우들에서, 상기 링커 서열은 링커 서열을 포함한다. 일부 경우에서, 상기 긴 링커 서열은 (G4S)n을 포함하며, 이때 n=2 ~ 4이다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 3이다. 링커의 방향 및 크기의 예시는 가령, Hollinger et al. 1993 Proc Natl Acad. Sci. U.S.A. 90:6444-6448, U.S. 특허 출원 공개 번호 2005/0100543, 2005/0175606, 2007/0014794, 그리고 PCT 공개 번호. WO2006/020258 및 WO2007/024715를 참고한다(이들은 본원의 참고자료에 편입됨).
scFv는 이의 VL 영역과 VH 영역 사이에 약 10개, 11개, 12개, 13개, 14개, 15개, 또는 15개 이상의 잔기로 된 링커를 포함할 수 있다. 상기 링커 서열은 임의의 자연 발생적 아미노산을 포함할 수 있다. 일부 구체예들에서, 상기 링커 서열은 아미노산 글리신과 세린을 포함한다. 또다른 구체예에서, 상기 링커 서열은 글리신 및 세린 반복부, 이를 테면, (Gly4Ser)n을 포함하고, 여기에서 n은 1이거나 또는 이보다 큰 양의 정수다. 한 구체예에서, 상기 링커는 (Gly4Ser)4 또는 (Gly4Ser)3일 수 있다. 링커 길이의 변화는 활성을 유지하거나 또는 향상시킬 수 있고, 활성 연구에서 우수한 효능을 제공한다. 일부 경우에서, 상기 링커 서열은 (G4S)n를 포함하며, 이때 n=2 ~ 4이다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 3이다.
안정성과 돌연변이
종양 연합된 항원 결합 도메인, 가령, scFv 분자들 (가령, 가용성 scFv)의 안정성은 전통적인 대조군 scFv 분자 또는 전장-항체의 생물물리적 성질 (가령, 열 안정성)에 기준하여 평가될 수 있다. 한 구체예에서, 상기 인간화된 또는 인간 scFv는 기술된 검정에서 부모 scFv보다 섭씨 약 0.1, 약 0.25, 약 0.5, 약 0.75, 약 1, 약 1.25, 약 1.5, 약 1.75, 약 2, 약 2.5, 약 3, 약 3.5, 약 4, 약 4.5, 약 5, 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8, 약 8.5, 약 9, 약 9.5, 약 10 도, 약 11 도, 약 12 도, 약 13 도, 약 14 도, 또는 약 15 도 이상의 열 안정성을 갖는다.
상기 항-TAA 결합 도메인, 가령, scFv의 개선된 열 안정성은 항-TAA-TFP 전체 구조체에 후속적으로 부여되어, 상기 항-TAA TFP 구조체의 개선된 치료요법적 성질로 이어질 수 있다. 상기 결합 도메인, 가령, scFv의 열 안정성은 전통적인 항체와 비교하였을 때, 적어도 약 2 ℃ 또는 3 ℃ 개선될 수 있다. 한 구체예에서, 상기 결합 도메인은 전통적인 항체와 비교하였을 때, 1 ℃ 개선된 열 안정성을 갖는다. 또다른 구체예에서, 상기 결합 도메인은 전통적인 항체와 비교하였을 때, 2 ℃ 개선된 열 안정성을 갖는다. 또다른 구체예에서, 상기 scFv는 전통적인 항체와 비교하였을 때, 4 ℃, 5 ℃, 6 ℃, 7 ℃, 8 ℃, 9 ℃, 10 ℃, 11 ℃, 12 ℃, 13 ℃, 14 ℃, 또는 15 ℃ 개선된 열 안정성을 갖는다. 예를 들면, 본원에서 기술된 scFv 분자들과 상기 scFv VH 및 VL이 유래된 항체의 scFv 분자들 또는 Fab 단편들 간에 비교가 이루어질 수 있다. 열 안정성은 당분야에 공지된 공통적 방법들에 의해 측정될 수 있다. 예를 들면, 한 구체예에서, TM이 측정될 수 있다. TM을 측정하는 방법들과 단백질 안정성을 결정하는 다른 방법들이 하기에서 상세하게 기술된다.
항체 서열에서 돌연변이 (가용성 scFv의 인간화 또는 직접 돌연변이 유발을 통하여 발생)는 상기 항체 또는 이의 단편의 안정성을 변경시키고, 상기 항체 및 TFP 구조체의 전반적인 안정성을 개선시킨다. 상기 인간화된 항체 또는 이의 단편의 안정성은 측정, 이를 테면 TM, 변성 온도 및 응집 온도의 측정을 통하여, 뮤린 항체 또는 이의 단편과 비교된다. 한 구체예에서, 상기 결합 도메인, 가령, scFv 또는 sdAb는 인간화 과정으로 발생된 적어도 하나의 돌연변이를 포함하고, 이러한 돌연변이된 scFv는 상기 항-TAA TFP 구조체에 개선된 안정성을 부여한다. 또다른 구체예에서, 상기 항-TAA 결합 도메인, 가령, scFv 또는 sdAb는 인간화 과정으로 발생된 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 돌연변이를 포함하고, 이러한 돌연변이된 scFv 또는 sdAb는 TAA-TFP 구조체에 개선된 안정성을 부여한다.
하나의 측면에서, 상기 TFP의 항원 결합 도메인은 본원에서 기술된 항원 결합 도메인 아미노산 서열에 대하여 상동성인 아미노산 서열을 포함하며, 그리고 상기 항원 결합 도메인은 본원에서 기술된 항-종양-연합된 항원 항체 단편들의 원하는 기능적 성질을 유지한다. 하나의 특정 측면에서, 상기 본 명세서의 TFP 조성물은 항체 단편을 포함한다. 추가 측면에서, 이 항체 단편은 scFv를 포함한다.
다양한 측면들에서, 하나 또는 이둘 모두의 가변 영역 (가령, VH 및/또는 VL), 예를 들면, 하나 또는 그 이상의 CDR 영역 안에 및/또는 하나 또는 그 이상의 프레임워크 영역 안에 하나 또는 그 이상의 아미노산을 변형시킴으로써, 상기 TFP의 항원 결합 도메인이 공작된다. 하나의 특정 측면에서, 상기 본 명세서의 TFP 조성물은 항체 단편을 포함한다. 추가 측면에서, 이 항체 단편은 scFv를 포함한다.
본 명세서의 항체 또는 항체 단편은 이들의 아미노산 서열의 변화 (가령, 야생형으로부터 변화)되기만, 그러나 원하는 활성에서는 변화가 없는, 추가 변형이 있을 수 있음을 당업자는 인지할 것이다. 예를 들면, "비-필수(essential)" 아미노산 잔기에서 아미노산 치환을 유도하는 추가 뉴클레오티드 치환이 당해 단백질에서 만들어질 수 있다. 예를 들면, 한 분자에서 비-필수 아미노산 잔기는 동일한 측쇄 패밀리의 또다른 아미노산 잔기로 대체될 수 있다. 또다른 구체예에서, 아미노산들의 스트링은 측쇄 패밀리 구성원의 순서 및/또는 조성에서 상이하지만 구조적으로 유사한 아미노산 스트링으로 대체될 수 있는데, 가령, 보존적 치환, 즉, 한 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 치환이 만들어질 수 있다.
당분야에 정의된 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 염기성 측쇄 (가령, 리신, 아르기닌, 히스티딘), 산성 측쇄 (가령, 아스파르트산, 글루탐산), 하전되지 않은 극성한 측쇄 (가령, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (가령, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지 측쇄 (가령, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (가령, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다.
두 가지 또는 그 이상의 핵산 또는 폴리펩티드 서열들 내용에서 용어 동일성 백분율은 동일한 두 가지 또는 그 이상의 서열을 지칭한다. 서열들이 하기 서열 비교 창에 걸쳐, 또는 명시된 영역에서, 다음의 서열 비교 알고리즘들중 하나를 이용하여 측정될 때, 또는 수작업 배열 및 눈으로 관찰에 의해 측정될 때, 두 서열이 동일한 아미노산 잔기들 또는 뉴클레오티드들의 백분율 (가령, 명시된 영역, 또는 명시되지 않을 경우 전체 서열에 걸쳐 60% 동일성, 임의선택적으로 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성)하다면, 이 두 서열은 "실질적으로 동일하다". 임의선택적으로, 적어도 약 50개 뉴클레오티드들 (또는 10개 아미노산) 길이의 영역, 또는 더 바람직하게는 100개 내지 500개 또는 1000개 또는 그 이상의 뉴클레오티드들 (또는 20개, 50개, 200개 또는 그 이상의 아미노산) 길이의 영역에 걸쳐 동일성이 존재한다.
서열 비교를 위해, 전형적으로 테스트 서열과 비교되는 하나의 서열은 기준 서열로 삼는다. 서열 비교 알고리즘을 사용하는 경우, 테스트 서열과 기준 서열을 컴퓨터에 유입하고, 필요에 따라 하위 서열 좌표를 지정하고, 그리고 서열 알고리즘 프로그램 매개 변수를 지정한다. 디폴트 프로그램 매개 변수를 사용할 수 있거나, 대체 매개 변수를 지정할 수 있다. 그 다음, 서열 비교 알고리즘은 프로그램 매개 변수에 기초하여, 기준 서열에 대한 테스트 서열의 서열 동일성 백분율을 산출한다. 비교를 위한 서열 정렬 방법들은 당업계에 잘 알려져 있다. 가령, Smith and Waterman, (1970) Adv. Appl. Math. 2:482c의 국소 상동성 알고리즘, Needleman and Wunsch, (1970) J. Mol. Biol. 48:443의 상동성 정렬 알고리즘, Pearson and Lipman, (1988) Proc. Natl. Acad. Sci. USA 85:2444의 유사성 방법의 조사, Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.에서 이들 알고리즘 GAP, BESTFIT, FASTA, 그리고 TFASTA의 자동 실행, 또는 수작업 정렬 및 시각적 관찰(가령, Brent et al., (2003) Current Protocols in Molecular Biology 참고)에 의해, 비교를 위한 최적의 서열 정렬을 수행할 수 있다. 서열 동일성 백분율 및 서열 유사성 백분율을 결정하는데 적합한 두 가지 예시적인 알고리즘이 BLAST 및 BLAST 2.0 알고리즘이며, 이들은 차례로 Altschul et al., (1977) Nuc. Acids Res. 25:3389-3402; 그리고 Altschul et al., (1990) J. Mol. Biol. 215:403-410에서 기술된다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information를 통해 공개적으로 제공된다.
하나의 측면에서, 본 명세서에서는 출발 항체 또는 단편 (가령, scFv)의 아미노산 서열을 변형시켜, 기능적으로 등가의 분자들을 만드는 것이 고려된다. 예를 들면, 상기 TFP에 포함된 결합 도메인, 가령, scFv의 VH 또는 VL는 항-CD19 결합 도메인, 가령, scFv의 출발 VH 또는 VL 프레임워크 영역과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일성이 유지되도록 변형될 수 있다. 본 명세서에서는 전체 TFP 구조체의 변형이 고려되는데, 가령, 기능적으로 등가의 분자들을 만들기 위하여, 상기 TFP 구조체의 다양한 도메인의 하나 또는 그 이상의 아미노산 서열에 변형이 고려된다. 상기 TFP 구조체는 출발 TFP 구조체에 대하여 적어도 약 70%, 71%. 72%. 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일성이 유지되도록 변형될 수 있다.
세포외 도메인
상기 세포외 도메인은 천연 원천 또는 재조합 원천으로부터 유래될 수 있다. 여기에서 원천이 자연 원천인 경우, 이 도메인은 임의의 단백질, 그러나 특히 막-결합된 단백질 또는 막경유 단백질로부터 유래된다. 하나의 측면에서, 상기 세포외 도메인은 상기 막경유 도메인과 연합될 수 있다. 본 명세서에서 특정 용도의 세포외 도메인은 적어도 T 세포 수용체의 알파 쇄, 베타 쇄 또는 제타 쇄, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포외 영역(들)을 함유할 수 있거나, 또는 대체 구체예들에서, CD28, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD37, CD64, CD80, CD86, CD134, CD137, CD154의 세포외 영역(들)을 함유할 수 있다. 일부 구체예들에서, 상기 세포외 도메인은 TCR 세포외 도메인이다. 일부 경우에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다.
일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, 또는 TCR 감마 쇄의 세포외 도메인 또는 이의 일부분을 포함한다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, 또는 TCR 감마 쇄의 IgC 도메인을 포함한다.
일부 구체예들에서, 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, 또는 TCR 감마 쇄의 상기 세포외 도메인의 적어도 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개, 100개 또는 그 이상의 연속 아미노산 잔기들을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, 또는 TCR 감마 쇄의 세포외 도메인을 인코딩하는 서열에 대해 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 N-말단 또는 C-말단, 또는 N-말단과 C-말단 모두에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 그 이상의 아미노산 절두를 갖는, TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, 또는 TCR 감마 쇄의 세포외 도메인을 인코드하는 서열을 포함한다.
일부 구체예들에서, 상기 세포외 도메인은 TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 IgC 도메인의 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개, 100개 또는 그 이상의 연속 아미노산 잔기들을 포함하거나, 또는 적어도 이들 개수의 아미노산 잔기들을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 IgC 도메인을 인코딩하는 서열에 대해 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 N-말단 또는 C-말단, 또는 N-말단과 C-말단 모두에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 그 이상의 아미노산 절두를 갖는, TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 IgC 도메인을 인코드하는 서열을 포함한다.
일부 구체예들에서, 상기 세포외 도메인은 CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포외 도메인의 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개, 100개 또는 그 이상의 연속 아미노산 잔기들을 포함하거나, 또는 적어도 이들 개수의 아미노산 잔기들을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포외 도메인을 인코딩하는 서열에 대해 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 세포외 도메인은 N-말단 또는 C-말단, 또는 N-말단과 C-말단 모두에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 그 이상의 아미노산 절두를 갖는, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포외 도메인을 인코드하는 서열을 포함한다.
상기 세포외 도메인은 TCR 세포외 도메인일 수 있다. 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위 또는 CD3 델타 TCR 소단위로부터 유래될 수 있다. 상기 세포외 도메인은 전장의 TCR 세포외 도메인 또는 이의 단편 (가령, 기능성 단편)일 수 있다. 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 가변 도메인을 포함할 수 있다. 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 가변 도메인과 불변 도메인을 포함할 수 있다. 일부 경우들에서, 상기 세포외 도메인은 가변 도메인을 포함하지 않을 수 있다.
상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인을 포함할 수 있다. 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 전장의 불변 도메인을 포함할 수 있다. 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 전장의 불변 도메인의 단편 (가령, 기능성 단편)을 포함할 수 있다. 예를 들면, 상기 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 포함할 수 있다.
본원에서 기술된 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄는 다양한 종으로부터 유래될 수 있다. 상기 TCR 쇄는 뮤린 또는 인간 TCR 쇄일 수 있다. 예를 들면, 상기 세포외 도메인은 뮤린 TCR 알파 쇄, 뮤린 TCR 베타 쇄, 인간 TCR 감마 쇄 또는 인간 TCR 델타 쇄의 불변 도메인을 포함할 수 있다.
막경유 도메인
일반적으로, TFP 서열은 단일 게놈 서열에 의해 인코드된 세포외 도메인과 막경유 도메인을 함유한다. 대체 구체예들에서, TFP는 당해 TFP의 세포외 도메인에 대하여 이종기원의 막경유 도메인을 포함하도록 기획될 수 있다. 막경유 도메인은 상기 막경유 영역에 인접한 하나 또는 그 이상의 추가적인 아미노산을 포함할 수 있는데, 가령, 상기 막경유 영역이 유래된 단백질의 세포외 영역과 연합된 가령, 하나 또는 그 이상의 아미노산 (가령, 상기 세포외 영역의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개 또는 그 이상의 아미노산) 및/또는 상기 막경유 단백질이 유래된 단백질의 세포내 영역과 연합된 하나 또는 그 이상의 추가 아미노산 (가령, 상기 세포내 영역의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 또는 그 이상의 아미노산)을 포함할 수 있다. 일부 경우들에서, 상기 막경유 도메인에는 상기 세포외 영역의 적어도 30개, 35개, 40개, 45개, 50개, 55개, 60개 또는 그 이상의 아미노산이 내포될 수 있다. 일부 경우들에서, 상기 막경유 도메인에는 상기 세포내 영역의 적어도 30개, 35개, 40개, 45개, 50개, 55개, 60개 또는 그 이상의 아미노산이 내포될 수 있다. 하나의 측면에서, 상기 막경유 도메인은 상기 TFP의 다른 도메인들중 하나와 연합되어 이용된 도메인이다. 일부 경우들에서, 가령, 상기 수용체 복합체의 다른 구성요소들과의 상호작용을 최소화시키기 위하여, 상기 막통과 도메인은 동일한 또는 상이한 표면 막 단백질의 막통과 도메인에 이러한 도메인이 결합되는 것을 회피하도록 아미노산 치환으로 선택되거나 또는 변형될 수 있다. 하나의 측면에서, 상기 막경유 도메인은 상기 TFP-T 세포 표면 상에서 또다른 TFP와 동종이량체화될 수 있다. 상이한 측면에서, 상기 막통과 도메인의 아미노산 서열은 동일한 TFP에 존재하는 고유의 결합 짝의 결합 도메인과의 상호작용을 최소화하도록, 변형되거나 또는 치환될 수 있다.
상기 막경유 도메인은 천연 원천 또는 재조합 원천으로부터 유래될 수 있다. 여기에서 상기 원천이 자연 원천인 경우, 이 도메인은 임의의 막-결합된 단백질 또는 막경유 단백질로부터 유래된다. 하나의 측면에서, 상기 막경유 도메인은 상기 TFP가 표적에 결합되었을 때 마다, 상기 세포내 도메인(들)로 신호전달할 수 있다. 일부 경우에서, 상기 TCR-통합된 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, TCR 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다.
일부 구체예들에서, 상기 막경유 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 막경유 도메인의 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 또는 30개 또는 그 이상의 연속 아미노산을 포함하거나, 또는 적어도 상기 수치들중 하나 또는 그 이상의 연속 아미노산 잔기를 포함한다. 일부 구체예들에서, 상기 막경유 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 막경유 도메인을 인코딩하는 서열에 대해 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 막경유 도메인은 N-말단 또는 C-말단, 또는 N-말단과 C-말단 모두에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개 또는 그 이상의 절두를 갖는, TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 막경유 도메인을 인코드하는 서열을 포함한다.
일부 경우에서, 상기 막경유 도메인은 상기 TFP의 세포외 영역, 가령, 상기 TFP의 항원 결합 도메인에 힌지(hinge), 가령, 인간 단백질의 힌지를 통하여 부착될 수 있다. 예를 들면, 한 구체예에서, 상기 힌지는 인간 면역글로불린 (Ig) 힌지, 가령, IgG4 힌지, 또는 CD8a 힌지일 수 있다.
링커
임의선택적으로, 짧은 올리고- 또는 폴리펩티드 링커 (길이가 2개 내지 10개 아미노산)는 상기 결합 요소와 TFP의 TCR 세포외 도메인 사이에 링키지를 형성할 수 있다. 글리신-세린 더블릿(doublet)이 특별히 적합한 링커를 제공한다. 일부 경우들에서, 상기 링커의 길이는 적어도 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 또는 그 이상일 수 있다. 예를 들면, 한 측면에서, 상기 링커는 아미노산 서열 GGGGSGGGGS 또는 서열 (GGGGS)x을 포함하며, 이때 X는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 또는 그 이상이다. 일부 구체예들에서, X는 2이다. 일부 구체예들에서, X는 4이다. 일부 구체예들에서, 상기 링커는 뉴클레오티드 서열 GGTGGCGGAGGTTCTGGAGGTGGAGGTTCC에 의해 인코드된다.
세포질 도메인
상기 TFP의 세포질 도메인에는 세포내 도메인이 내포될 수 있다. 일부 구체예들에서, 상기 세포내 도메인은 CD3 감마, CD3 델타, CD3 입실론, TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타로부터 유래된다. 일부 구체예들에서, 상기 세포내 도메인은 상기 TFP가 CD3 감마, 델타 또는 입실론 폴리펩티드를 함유한다면, 신호생성 도메인을 포함하고; TCR 알파, TCR 베타, TCR 감마, 및 TCR 델타 소단위들은 일반적으로 짧은 (가령, 길이가 1-19개의 아미노산) 세포내 도메인을 갖고, 일반적으로 신호생성 도메인에서 결여된다. 세포내 신호생성 도메인은 상기 TFP가 도입되는 면역 세포의 정상적인 작동체 기능중 적어도 하나의 활성을 일반적으로 담당한다. TCR 알파, TCR 베타, TCR 감마, 및 TCR 델타의 세포내 도메인은 신호생성 도메인을 갖지 않고, 이들은 본원에서 기술된, 일차 세포내 신호생성 도메인, 가령, CD3 제타를 갖는 단백질을 모집할 수 있고, 이는 세포내 신호생성 도메인으로 기능한다. 용어 "작동체 기능(effector function)"이란 세포의 특화된 기능을 지칭한다. T 세포의 작동체 기능은 예를 들면, 사이토킨의 분비를 포함하는 세포 용해 활성 또는 헬퍼 활성일 수 있다. 따라서, 용어 "세포내 신호전달 도메인"이란 당해 작동체 기능 신호를 변환하고, 세포에게 특화된 기능을 수행하도록 지시하는 단백질의 부분을 지칭한다. 통상적으로 전체 세포내 신호전달 도메인이 이용될 수 있지만, 많은 경우에 있어서 상기 전체 쇄를 사용할 필요는 없다. 상기 세포내 신호전달 도메인의 절두된(truncated) 부분이 사용되는 경우, 이러한 절두된 부분은 작동체 기능 신호를 변환시키는 한, 무손상 쇄를 대신하여 사용될 수 있다. 따라서, 용어 세포내 신호전달 도메인은 당해 작동체 기능 신호를 변환시키는데 충분한 세포내 신호전달 도메인의 임의의 절두된 부분이 포함되는 것을 의미한다.
본 명세서의 TFP에 사용하기 위한 세포내 도메인의 예로는 항원 수용체 참여 후, 신호전달을 개시하기 위하여 협력해서 작용할 수 있는 이러한 T 세포 수용체(TCR)과 이의 공동-수용체들의 세포질 서열 뿐만 아니라, 이들 서열의 임의의 유도체 또는 변이체, 및 동일한 기능적 능력을 갖는 임의의 재조합 서열을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 알파의 세포내 도메인 쇄, TCR 베타 쇄, TCR 감마 쇄, 또는 TCR 델타 쇄의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 또는 19개 또는 그 이상의 연속 아미노산 잔기를 포함하거나, 또는 적어도 상기 수치들중 하나 또는 그 이상의 연속 아미노산 잔기를 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, 또는 TCR 델타 쇄의 세포내 도메인을 인코딩하는 서열에 대해 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 막경유 도메인은 N-말단 또는 C-말단, 또는 N-말단과 C-말단 모두에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개 또는 그 이상의 아미노산 절두를 갖는, TCR 알파의 쇄, TCR 베타 쇄, TCR 감마 쇄, 또는 TCR 델타 쇄의 세포내 도메인을 인코딩하는 서열을 포함한다.
일부 구체예들에서, 상기 세포내 도메인은 CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포내 도메인의 적어도 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 또는 62개 또는 그 이상의 연속 아미노산을 잔기들을 포함하거나, 또는 적어도 이들 수치들중 하나 또는 그 이상의 수의 아미노산 잔기들을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포내 도메인을 인코딩하는 서열에 대해 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 세포내 도메인은 N-말단 또는 C-말단, 또는 N-말단과 C-말단 모두에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 그 이상의 아미노산 절두를 갖는, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 또는 CD3 델타 TCR 소단위의 세포내 도메인을 인코드하는 서열을 포함한다.
상기 TCR 단독으로 생성된 신호는 나이브 T 세포들의 완전한 활성화에 불충분하고, 부차적 및/또는 공동자극 신호가 필요하다는 것은 알려져 있다. 따라서, 나이브(
Figure pct00001
) T 세포 활성화는 별개의 두 클래스의 세포질 신호생성 서열에 의해 중재된다고 말할 수 있다: 상기 TCR (일차 세포내 신호생성 도메인)을 통하여 항원-의존적 일차 활성화를 개시하는 클래스, 그리고 부차적 또는 공동자극 신호를 제공하기 위하여 항원-독립적인 방식으로 작용하는 클래스 (부차적 세포질 도메인, 가령, 공동자극 도메인).
일차 신호생성 도메인은 자극 방식, 또는 저해 방식으로 TCR 복합체의 일차 활성화를 조절한다. 자극 방식으로 작용하는 일차 세포내 신호전달 도메인은 면역수용체 티로신-기반 활성화 모티프 (ITAMs)로 알려진 신호전달 모티프를 함유할 수 있다.
본 명세서에 특별히 사용되는 용도의 일차 세포내 신호생성 도메인을 함유하는 ITAMs의 예로는 CD3 제타, FcR 감마, FcR 베타, CD3 감마, CD3 델타, CD3 입실론, CD5, CD22, CD79a, CD79b, 그리고 CD66d가 내포된다. 한 구체예에서, 본 명세서의 TFP는 세포내 신호생성 도메인, 가령, CD3-입실론의 일차 신호생성 도메인을 포함한다. 한 구체예에서, 일차 신호생성 도메인은 변형된 ITAM 도메인을 포함하는데, 가령, 고유의 ITAM 도메인과 비교하였을 때, 활성이 변경된(가령, 증가되거나 또는 감소된) 돌연변이된 ITAM 도메인을 포함한다. 한 구체예에서, 일차 신호생성 도메인은 변형된 ITAM-함유하는 일차 세포내 신호생성 도메인, 가령, 최적화된 및/또는 절두된 ITAM-함유하는 일차 세포내 신호생성 도메인을 포함한다. 구체예에서, 일차(primary) 신호생성 도메인은 1개, 2개, 3개, 4개 또는 그 이상의 ITAM 모티프를 포함한다.
상기 TFP의 세포내 신호생성 도메인은 자체가 CD3 제타 신호생성 도메인, 가령, CD3 입실론, CD3 델타, CD3 감마, 또는 CD3 제타을 포함할 수 있거나, 또는 본 명세서의 TFP의 내용에서 유용한 임의의 다른 원하는 세포내 신호생성 도메인(들)과 복합될 수 있다. 예를 들면, 상기 TFP의 세포내 신호생성 도메인은 CD3 입실론 쇄 일부분과 공동자극 신호생성 도메인을 포함할 수 있다. 상기 공동-자극 신호생성 도메인은 공동-자극 분자의 상기 세포내 도메인을 포함하는 TFP의 일부분을 지칭한다. 공동-자극 분자는 항원에 대한 림프구의 효과적인 반응에 요구되는 항원 수용체 또는 이의 리간드를 제외한 세포 표면 분자다. 이러한 분자들의 예로는 CD27, CD28, 4-1BB (CD137), OX40, CD30, CD40, PD1, ICOS, 림프구 기능-연합된 항원-1 (LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, 그리고 CD83에 특이적으로 결합하는 리간드, 그리고 이와 유사한 것들이 내포된다. 예를 들면, CD27 공동-자극은 시험관내에서 인간 TFP-T 세포들의 확장, 작동체 기능 및 생존을 강화시키고, 그리고 생체내에서 인간 T 세포 지속성 및 항종양 활성을 증가시킨다고 실증되었다(Song et al. Blood. 2012; 119(3):696-706).
본 명세서의 TFP의 세포질 부분 안에 세포내 신호생성 서열은 무작위로 또는 명시된 순서로 서로 연계될 수 있다. 임의선택적으로, 짧은 올리고- 또는 폴리펩티드 링커, 예를 들면, 2개 내지 10개 길이의 아미노산 (가령, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개 아미노산)이 세포내 신호생성 서열 간에 링키지를 형성할 수 있다.
한 구체예에서, 글리신-세린 더블릿이 적합한 링커로 이용될 수 있다. 한 구체예에서, 단일 아미노산, 가령, 알라닌, 글리신이 적합한 링커로 이용될 수 있다.
하나의 측면에서, 본원에서 기술된 상기 TFP-발현하는 세포는 제 2 TFP, 가령, 동일한 표적 (MSLN) 또는 상이한 표적 (가령, CD70, CD19, 또는 MUC16)에 대한 상이한 항원 결합 도메인을 포함하는 제 2 TFP를 더 포함할 수 있다. 한 구체예에서, 상기 TFP-발현하는 세포가 두 개 또는 그 이상의 상이한 TFPs를 포함하는 경우, 상기 상이한 TFPs의 항원 결합 도메인은 당해 항원 결합 도메인들이 서로 상호작용하지 않을 수 있다. 예를 들면, 제 1 및 제 2 TFP를 발현시키는 세포는 제 1 TFP의 항원 결합 도메인을, 가령, 단편으로써, 가령, 제 2 TFP의 항원 결합 도메인과 연합을 형성하지 않는 scFv를 보유할 수 있고, 가령, 제 2 TFP의 상기 항원 결합 도메인은 VHH이다.
또다른 측면에서, 본원에서 기술된 상기 TFP-발현하는 세포는 또다른 작용제, 가령, 변형된 T 세포의 활성을 강화시키는 작용제를 추가 발현시킬 수 있다. 예를 들면, 한 구체예에서, 상기 작용제는 저해성 분자를 억제하는 작용제일 수 있다. 저해성 분자들, 가령, PD1은 일부 구체예들에서, 변형된 T 세포의 면역 작동체 반응을 탑재하는 능력을 감소시킨다. 저해성 분자들의 예로는 PD1, PD-L1, CTLA4, TIM3, LAG3, VISTA, BTLA, TIGIT, LAIR1, CD160, 2B4 및 TGFR 베타가 내포된다. 한 구체예에서, 저해성 분자를 억제하는 상기 작용제는 제 1 폴리펩티드, 가령, 상기 세포로 양성 신호를 제공하는 제 2 폴리펩티드, 가령, 본원에서 기술된 세포내 신호생성 도메인과 연합된 저해성 분자이다. 한 구체예에서, 상기 작용제는 가령, 저해성 분자, 이를 테면 PD1, LAG3, CTLA4, CD160, BTLA, LAIR1, TIM3, 2B4 및 TIGIT, 또는 이들중 임의의 것의 단편 (가령, 이들중 임의의 것의 세포외 도메인의 적어도 일부분)의 제 1 폴리펩티드 그리고 본원에서 기술된 세포내 신호생성 도메인인 제 2 폴리펩티드(가령, 공동자극 도메인 (가령, 본원에서 기술된 4-1BB, CD27 또는 CD28) 및/또는 일차 신호생성 도메인 (가령, 본원에서 기술된 CD3 제타 신호생성 도메인)를 포함한다. 한 구체예에서, 상기 작용제는 PD1 또는 이의 결합 단편 (가령, PD1의 세포외 도메인의 적어도 일부분)의 제 1 폴리펩티드, 그리고 본원에서 기술된 세포내 신호생성 도메인(가령, 본원에서 기술된 CD28 신호생성 도메인 및/또는 본원에서 기술된 CD3 제타 신호생성 도메인 )의 제 2 폴리펩티드를 포함한다. PD1은 CD28, CTLA-4, ICOS, 그리고 BTLA를 비롯한, CD28 패밀리 수용체들의 저해성 구성원이다. PD-1은 활성화된 B 세포들, T 세포들 그리고 골수 세포들 (Agata et al. 1996 Int. Immunol 8:765-75) 상에서 발현된다. PD1의 두 리간드, PD-L1 및 PD-L2는 PD1에 결합할 때, T 세포 활성화를 하향조절하였다 (Freeman et al., 2000 J. Exp. Med. 192:1027-34; Latchman et al., 2001 Nat. Immunol. 2:261-8; Carter et al., 2002 Eur. J. Immunol. 32:634-43). PD-L1은 인간 암에서 풍부하다 (Dong et al., 2003 J. Mol. Med. 81:281-7; Blank et al., 2005 Cancer Immunol. Immunother. 54:307-314; Konishi et al., 2004 Clin. Cancer Res. 10:5094). PD1과 PD-L1의 국소 상호작용을 억제함으로써 면역 억제는 역전될 수 있다.
한 구체예에서, 상기 작용제는 저해성 분자의 세포외 도메인 (ECD)을 포함하는데, 가령, 예정된 사멸 1 (PD1)은 막경유 도메인과 임의선택적으로 세포내 신호생성 도메인, 이를 테면 41BB 및 CD3 제타 (또한 본원에서는 PD1 TFP로도 지칭됨)에 융합될 수 있다. 한 구체예에서, 본원에서 기술된 항-TAA TFP와 조합하여 사용될 때, 상기 PD1 TFP는 상기 T 세포의 지속성을 개선시킨다. 한 구체예에서, 상기 TFP는 PD1의 세포외 도메인을 포함하는 PD1 TFP이다. 대안으로, 예정된 사멸-리간드 1 (PD-L1) 또는 예정된 사멸- 리간드 2 (PD-L2)에 특이적으로 결합하는 항체 또는 항체 단편 이를 테면 scFv를 함유하는 TFPs가 제공된다.
또다른 측면에서, 본 명세서는 TFP-발현하는 T 세포들, 가령, TFP-T 세포들의 집단을 제공한다. 일부 구체예들에서, TFP-발현하는 T 세포들의 집단은 상이한 TFPs를 발현시키는 세포들의 혼합물을 포함한다. 예를 들면, 한 구체예에서, TFP-T 세포 집단에는 본원에서 기술된 결합 도메인을 갖는 TFP를 발현시키는 제 1 세포, 그리고 상이한 항-TAA 결합 도메인, 가령, 상기 제 1 세포에 의해 발현되는 TFP에서 해당 결합 도메인과는 상이한, 본원에 기술된 결합 도메인을 갖는 TFP를 발현시키는 제 2 세포가 내포될 수 있다. 또다른 예로써, TFP-발현시키는 세포들의 집단에는 제 1 결합 도메인 결합 도메인, 가령, 본원에서 기술된 결합 도메인이 내포된 TFP를 발현시키는 제 1 세포, 그리고 상기 제 1 세포의 결합 도메인 이외의 표적 (가령, 또다른 종양-연합된 항원)에 대한 항원 결합 도메인이 내포된 TFP를 발현시키는 제 2 세포가 내포될 수 있다.
또다른 측면에서, 본 명세서는 세포들 집단을 제공하는데, 이때 이 집단에서 적어도 하나의 세포는 본원에서 기술된 도메인을 갖는 TFP를 발현시키고, 그리고 또다른 작용제, 가령, 변형된 T 세포의 활성을 강화시키는 작용제를 발현시키는 제 2 세포의 집단을 제공한다. 예를 들면, 한 구체예에서, 상기 작용제는 저해성 분자를 억제하는 작용제일 수 있다. 저해성 분자들은 가령, 일부 구체예들에서, 변형된 T 세포의 면역 작동체 반응을 탑재하는 능력을 감소시킨다. 저해성 분자들의 예로는 PD1, PD-L1, PD-L2, CTLA4, TIM3, LAG3, VISTA, BTLA, TIGIT, LAIR1, CD160, 2B4 및 TGFR 베타가 내포된다. 한 구체예에서, 저해성 분자를 억제하는 작용제는 제 1 폴리펩티드, 가령, 상기 세포로 양성 신호를 제공하는 제 2 폴리펩티드, 가령, 본원에서 기술된 세포내 신호생성 도메인과 연합된 저해성 분자이다.
시험관내에서 TFPs를 인코딩하는 전사된 RNA를 만드는 방법들이 본원에서 개시된다. 본 명세서에는 세포로 직접적으로 형질감염될 수 있는 TFP 인코딩 RNA 구조체가 또한 내포된다. 형질감염에 사용을 위하여 mRNA를 만드는 방법은 특별히 기획된 프라이머에 이어서, polyA 추가, 3' 및 5' 해독안된 서열 ("UTR")을 함유하는 구조체를 만들기 위하여 폴리A 추가, 5' 캡(cap) 및/또는 내부 리보솜 진입 부위(Internal Ribosome Entry Site: IRES), 발현될 핵산, 그리고 polyA 꼬리(tail)-전형적으로 50-2000개 염기 길이의 주형을 시험관내 전사(IVT)와 관련될 수 있다. 이렇게 만들어진 RNA는 상이한 종류의 세포들을 효과적으로 형질감염시킬 수 있다. 하나의 측면에서, 상기 주형에는 상기 TFP의 서열이 내포된다.
한 측면에서, 상기 항-TAA TFP는 메신져 RNA (mRNA)에 의해 인코드된다. 한 측면에서, 상기 항-TAA TFP를 인코딩하는 mRNA는 TFP-T 세포의 생산을 위하여 T 세포 내로 도입된다. 한 구체예에서, 상기 시험관내 전사된 RNA TFP는 일시적 형질감염 형태로 세포 안으로 도입될 수 있다. 상기 RNA는 중합효소 쇄 반응 (PCR)-생성된 주형을 이용하여 시험관내 전사에 의해 만들어진다. 임의의 원천의 관심대상 DNA는 적절한 프라이머 및 RNA 중합효소를 이용한 시험관내 mRNA 합성을 위하여 PCR에 의해 주형으로 바로 전환될 수 있다. 상기 DNA의 원천은 예를 들면, 게놈 DNA, 플라스미드 DNA, 파아지 DNA, cDNA, 합성 DNA 서열 또는 임의의 적합한 DNA 원천일 수 있다. 시험관내 전사를 위한 바람직한 주형은 본 명세서의 TFP이다. 한 구체예에서, PCR에 이용되는 DNA는 개방 해독 틀(open reading frame)을 함유한다. 상기 DNA는 유기체 게놈의 자연 발생적 DNA 서열로부터 유래될 수 있다. 한 구체예에서, 상기 핵산에는 5' 및/또는 3' 해독안된 영역들 (UTRs)의 전부 또는 일부분이 내포될 수 있다. 상기 핵산에는 엑손 및 인트론이 내포될 수 있다. 한 구체예에서, PCR에 이용되는 DNA는 인간 핵산 서열이다. 또다른 구체예에서, PCR에 이용되는 DNA에는 5' 및 3' UTRs이 내포된 인간 핵산 서열이다. 대안으로, 상기 DNA는 자연 발생적 유기체에서 정상적으로 발현되지 않은 인공 DNA 서열일 수 있다. 예시적인 인공 DNA 서열은 융합 단백질을 인코드하는 개방 해독 틀을 형성하기 위하여 함께 결찰되는 유전자의 일부분을 함유하는 서열이다. 함께 결찰되는 상기 DNA의 일부분은 단일 유기체, 또는 하나 이상의 유기체로부터 유래될 수 있다.
형질감염에 이용되는 mRNA의 시험관내 전사를 위한 주형을 만드는 데 PCR이 이용된다. PCR을 실행하는 방법들은 당업계에 잘 알려져 있다. PCR에 사용을 위한 프라이머는 PCR의 주형으로 이용되는 DNA의 영역에 실질적으로 상보적인 영역을 갖도록 기획된다. 본원에서 사용된 바와 같이, "실질적으로 상보적"이란 일차 서열의 염기의 대부분 또는 전부가 상보적인 뉴틀레오티드 서열을 지칭하거나, 또는 하나 또는 그 이상의 염기가 비-상보적, 또는 비-합치(mismatched)된다. 실질적으로 상보적 서열은 PCR에 이용되는 어닐링 조건 하에서 의도된 DNA 표적에 어닐링되거나 또는 혼성화될 수 있다. 상기 프라이머는 DNA 주형의 임의의 일부분에 실질적으로 상보적이 되도록 기획될 수 있다. 예를 들면, 상기 프라이머는 5' 및 3' UTRs이 내포된, 세포에서 정상적으로 전사되는 핵산(개방 해독 틀)의 일부분을 증폭시키도록 기획될 수 있다. 상기 프라이머는 관심대상의 특정 도메인을 인코드하는 핵산의 일부분을 증폭시키도록 기획될 수 있다. 한 구체예에서, 상기 프라이머는 5' 및 3' UTRs의 전부 또는 일부분이 내포된, 인간 cDNA의 코딩 영역을 증폭시키도록 기획될 수 있다. 당분야에 공지된 합성 방법들에 의해 PCR에 유용한 프라이머를 생성시킬 수 있다. "전방 프라이머(forward primers)"는 DNA 주형 상에서 증폭될 DNA 서열의 상류인 뉴클레오티드에 실질적으로 상보적인 뉴클레오티드 영역이 함유된 프라이머다. "상류(upstream)"는 본원에서 코딩 가닥에 대하여 증폭되는 DNA 서열에 대하여 위치 5를 지칭할 때 이용된다. "역 프라이머(Reverse primers)"란 증폭되는 DNA 서열의 하류인 이중-가닥의 DNA 주형에 실질적으로 상보적인 뉴클레오티드 영역을 함유하는 프라이머다. "하류(downstream)"란 본원에서 코딩 가닥에 대하여 증폭되는 DNA 서열에 대하여 위치 3'을 지칭할 때 이용된다.
본원에서 기술된 방법에서 PCR에 유용한 임의의 DNA 중합효소들이 이용될 수 있다. 시약 및 중합효소들은 다수의 출처로부터 상업적으로 이용가능하다.
안정성 및/또는 해독 효능을 촉진시키는 능력을 갖는 화학 구조가 또한 이용될 수 있다. RNA는 바람직하게는 5' 및 3' UTRs를 보유한다. 한 구체예에서, 5' UTR은 1 내지 3000개 길이의 뉴클레오티드다. 코딩 영역에 첨가되는 5' 및 3' UTR 서열의 길이는 이 UTRs의 상이한 영역에 어닐링하는 PCR용 프라이머를 디자인하는 것을 포함하지만, 이에 한정되지 않는 상이한 방법에 의해 변경될 수 있다. 이 접근법을 사용하여, 당업자는 전사된 RNA의 형질감염 후, 최적의 해독 효율을 달성하는데 필요한 5' 및 3' UTR 길이를 변형시킬 수 있다.
5' 및 3' UTRs은 관심대상의 핵산에 대해 자연 발생적이고, 내생성인 5' 및 3' UTRs일 수 있다. 대안으로, 관심대상 핵산에 내생성이 아닌 UTR 서열은 UTR 서열을 순방향 및 역방향 프라이머에 혼입시킴으로써, 또는 주형의 임의의 다른 변형에 의해 첨가될 수 있다. 관심대상 핵산에 내생성이 아닌 UTR 서열의 사용은 RNA의 안정성 및/또는 해독 효율을 변형시키는데 유용할 수 있다. 예를 들면, 3'UTR 서열의 AU-풍부한 요소들이 mRNA의 안정성을 감소시킬 수 있다는 것이 공지되어 있다. 따라서, 3' UTRs는 당업계에 잘 공지된 UTRs의 특성에 기초하여 전사된 RNA의 안정성을 증가시키도록 선택되거나 디자인될 수 있다.
한 구체예에서, 5' UTR은 내생성 핵산의 Kozak 서열을 함유할 수 있다. 대안으로, 관심대상 핵산에 내생성이 아닌 5' UTR이 전술한 바와 같이 PCR에 의해 첨가될 때, 컨센수스(consensus) Kozak 서열은 5' UTR 서열을 첨가함으로써, 재-설계 될 수 있다. Kozak 서열은 일부 RNA 전사체의 해독 효율을 증가시킬 수 있지만, 모든 RNAs가 효율적인 해독을 수행하는데 필요하지는 않다. 많은 mRNAs에 대한 Kozak 서열에 대한 요건은 당업계에 공지되어 있다. 다른 구체예들에서, 5' UTR은 이의 RNA 게놈이 세포에서 안정적인 RNA 바이러스의 5' UTR로부터 유래될 수 있다. 다른 구체예들에서, 다양한 뉴클레오티드 유사체들이 mRNA의 엑소뉴클레아제 분해를 방해하기 위해 3' 또는 5' UTR에서 사용될 수 있다.
유전자 클로닝의 필요없이, DNA 주형으로부터 RNA를 합성하기 위해서, 전사 프로모터는 전사될 서열의 DNA 주형 상류에 부착되어야만 한다. RNA 중합효소의 프로모터로 기능을 하는 서열을 전방 프라이머의 5' 단부에 추가할 때, 상기 RNA 중합효소 프로모터는 전사될 개방 해독 틀의 상류 PCR 산물에 통합된다. 하나의 바람직한 구체예에서, 상기 프로모터는 본원의 도체에서 기술된 T7 중합효소 프로모터다. 다른 유용한 프로모터로는 T3 및 SP6 RNA 중합효소 프로모터가 내포되나, 이에 국한되지 않는다. T7, T3 및 SP6 프로모터에 대한 컨센수스 뉴클레오티드 서열은 당분야에 공지되어 있다.
일부 구체예들에서, mRNA는 리보솜 결합, 이 세포에서 mRNA의 해독 개시 및 안정성을 결정하는 5' 말단과 3' poly(A) 꼬리에 모두 캡을 가지고 있다. 가령, 원형의 DNA 주형 상에서 플라스미드 DNA, RNA 중합효소는 진핵 세포에서 발현에 적합하지 않은 긴 콘카타머(concatameric) 산물을 만든다. 3' UTR의 단부에서 선형화된 플라스미드 DNA 전사로 인하여 비록 전사 후 폴리아데닐화되더라도 진핵 형질감염에서 효과가 없는 정상 크기의 mRNA가 만들어진다.
선형 DNA 주형 상에서, 파아지 T7 RNA 중합효소는 이 전사체의 3' 단부를 당해 주형의 마지막 염기를 지나서 까지 연장시킬 수 있다(Schenborn and Mierendorf, Nuc Acids Res., 13:6223-36 (1985); Nacheva and Berzal-Herranz, Eur. J. Biochem., 270:1485-65 (2003).
polyA/T 스트레취가 DNA 주형으로 통합되는 전통적인 방법은 분자 클로닝이다. 그러나, 플라스미드 DNA로 통합된 polyA/T 서열은 플라스미드를 불안정하게 할 수 있고, 그 이유는 박테리아성 세포들로부터 획득된 플라스미드 DNA 주형은 흔히 결손 및 기타 이상으로 인하여 상당히 오염되기 때문이다. 이것은 클로닝 절차를 힘들고, 시간 소모적으로 만들 뿐만 아니라, 종종 신뢰할 수 없게 한다. 그 이유는 클로닝없이, polyA/T 3' 스트레취를 갖는 DNA 주형의 구축을 허용하는 수 있는 방법이 매우 바람직하다.
전사 DNA 주형의 polyA/T 세그먼트는 poly-T 꼬리, 이를 테면 100개의 T 꼬리 (크기는 50-5000개의 T가 될 수 있음)를 함유하는 역 프라이머를 이용하여 PCR 동안, 또는 임의의 다른 방법, 가령, DNA 결찰 또는 시험관내 재조합을 포함하나, 이에 국한되지 않는 임의의 다른 방법에 의해 PCR 후, 만들어질 수 있다. poly(A) 꼬리는 또한 RNAs에게 안정성을 제공하고, 이의 분해를 감소시킨다. 일반적으로, poly(A) 꼬리의 길이는 전사된 RNA의 안정성과 양의 상관관계에 있다. 한 구체예에서, poly(A) 꼬리는 100개 내지 5000개 사이의 아데노신이다.
RNAs의 poly(A) 꼬리는 poly(A) 중합효소, 이를 테면, 대장균(E. coli) polyA 중합효소 (E-PAP)를 사용하여 시험관내 전수 후, 더 연장될 수 있다. 한 구체예에서, poly(A) 꼬리의 뉴클레오티드 길이를 100개에서 300개 내지 400개의 뉴클레오티드 길이로 증가시키면, RNA의 해독 효과가 약 2-배 증가된다. 추가적으로, 3' 단부에 상이한 화학기를 부착시키면 mRNA 안정성이 증가될 수 있다. 이러한 부착은 변형된/인공 뉴클레오티드들, 압타머 및 기타 화합물들을 함유할 수 있다. 예를 들면, poly(A) 중합효소를 이용하여 ATP 유사체들은 이러한 poly(A) 꼬리에 통합될 수 있다. ATP 유사체들은 당해 RNA의 안정성을 더 증가시킬 수 있다.
5' 캡은 또한 RNA 분자들에게 안정성을 제공할 수 있다. 일부 구체예들에서, 본원에서 개시된 방법들에 의해 만들어진 RNAs에는 5' 캡이 포함된다. 상기 5' 캡은 당분야에 공지된 기술 및 본원에서 기술된 기술에 의해 제공된다(Cougot, et al., Trends in Biochem. Sci., 29:436-444 (2001); Stepinski, et al., RNA, 7:1468-95 (2001); Elango, et al., Biochim. Biophys. Res. Commun., 330:958-966 (2005)).
본원에서 개시된 방법들에 의해 만들어진 RNAs에는 내부 리보솜 진입 부위 (IRES) 서열을 또한 함유할 수 있다. 상기 IRES 서열은 mRNA에 캡-독립적 리보솜 결합을 개시하고, 해독 개시를 촉진시킬 수 있는 임의의 바이러스성, 염색체 또는 인공으로 기획된 서열일 수 있다. 세포 전기천공(electroporation)에 적합한 임의의 용질은 세포 침투성 및 생존력을 촉진시키는 인자, 이를 테면, 당(sugars), 펩티드들, 지질, 단백질들, 항산화제, 그리고 계면활성제가 포함될 수 있다.
RNA는 임의의 다수의 상이한 방법, 예를 들면, 전기천공(Amaxa Nucleofector®-II (Amaxa Biosystems, Cologne, Germany)), ECM 830 (BTX) (Harvard Instruments, Boston, Mass.) 또는 Gene Pulser® II (BioRad, Denver, Colo.), Multiporator® (Eppendorf, Hamburg Germany), 리포펙션을 이용한 양이온 리포좀 중재된 형질감염, 폴리머 포집화(encapsulation), 펩티드 중재된 형질감염, 또는 바이오리스틱(biolistic) 입자 전달 시스템, 이를 테면, "유전자 총(gene guns)" (예를 들면, Nishikawa, et al. Hum Gene Ther., 12(8):861-70 (2001) 참고)이 내포되나, 이에 국한되지 않는 상업적으로 이용가능한 방법들을 이용하여 표적 세포로 도입시킬 수 있다.
TFP 및 TCR 불변 도메인을 인코딩하는 재조합 핵산
일부 구체예들에서, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열을 포함하는 재조합 핵산 분자가 본원에서 기술된다. 상기 TFP는 TCR 세포외 도메인의 적어도 일부분을 포함하는 TCR 소단위를 포함할 수 있다. 상기 TCR 소단위는 막경유 도메인을 더 포함할 수 있다. 상기 TCR 소단위는 TCR 감마, TCR 델타, TCR 알파 또는 TCR 베타의 세포내 도메인, 또는 CD3 입실론, CD3 감마, CD3 델타의 세포내 신호생성 도메인으로부터 자극 도메인을 포함하는 세포내 도메인을 더 포함할 수 있다. 상기 TFP는 항원 결합 도메인을 포함하는 항체 (가령, 인간, 인간화된, 또는 뮤린 항체)를 더 포함할 수 있다. 상기 재조합 핵산 분자는 TCR 불변 도메인을 인코드하는 서열을 더 포함할 수 있고, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, TCR 알파 불변 도메인 및 TCR 베타 불변 도메인, TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이다. 상기 TCR 소단위 및 상기 항체는 작동가능하도록 연계될 수 있다. 상기 TFP는 T 세포에서 발현될 때, TCR 복합체 (가령, 내생성 TCR 복합체)에 기능적으로 통합될 수 있다.
상기 불변 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 쇄의 불변 도메인을 포함할 수 있다. 상기 불변 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 전장의 불변 도메인을 포함할 수 있다. 상기 불변 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 전장의 불변 도메인의 단편 (가령, 기능성 단편)을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 포함할 수 있다. 상기 TCR 불변 도메인을 인코딩하는 서열은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 막경유 도메인 및/또는 세포내 영역을 더 인코드할 수 있다. TCR 불변 도메인을 인코딩하는 서열은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 전장의 불변 영역을 인코드할 수 있다. TCR 쇄의 불변 영역은 불변 도메인, 막경유 도메인, 및 세포내 영역을 포함할 수 있다. TCR 쇄의 불변 영역에는 상기 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 상기 막경유 도메인 및 상기 세포내 영역이 또한 배제될 수 있다.
본원에서 기술된 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄는 다양한 종으로부터 유래될 수 있다. 상기 TCR 쇄는 뮤린 또는 인간 TCR 쇄일 수 있다. 예를 들면, 상기 불변 도메인은 뮤린 또는 인간 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인을 포함할 수 있다.
상기 불변 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는, 본원에 기술된 불변 도메인의 절두형 형태를 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 서열 또는 이의 단편을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 16, 서열 식별 번호: 17, 서열 식별 번호: 18, 서열 식별 번호: 19, 서열 식별 번호: 20, 서열 식별 번호: 21, 또는 서열 식별 번호: 22, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 서열 식별 번호: 155, 서열 식별 번호: 207, 서열 식별 번호: 209, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 서열의 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다.
상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 위치 2-137을 포함할 수 있다. 상기 뮤린 TCR 알파 불변 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 146의 위치 2-137의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는 불변 도메인의 절두된 형태를 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 146의 위치 2-137의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 146의 위치 2-137의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 146의 위치 2-137의 서열 또는 이의 단편을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 146의 위치 2-137 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 146의 위치 2-137의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 146의 위치 2-137의 서열에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 서열 동일성을 갖는 서열을 포함할 수 있다.
상기 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 152의 위치 2-173을 포함할 수 있다. 상기 뮤린 TCR 베타 불변 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 152의 위치 2-173의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는 불변 도메인의 절두된 형태를 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 152의 위치 2-173의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 152의 위치 2-173의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 152의 위치 22-173의 서열 또는 이의 단편을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 152의 위치 2-173 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 152의 위치 2-173의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 152의 위치 2-173의 서열에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 서열 동일성을 갖는 서열을 포함할 수 있다.
일부 경우들에서, 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이다. 상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 그리고 적어도 하나의 변형, 그러나, 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 델타 불변 도메인은 서열 식별 번호: 243을 포함할 수 있다. 상기 TCR 델타 불변 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 243의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는 본원에 기술된 불변 도메인의 절두된 형태를 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 243의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 243의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 243의 서열 또는 이의 단편을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 243의 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 243의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 243의 서열에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 서열 동일성을 갖는 서열을 포함할 수 있다.
상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 또는 적어도 하나의 변형, 그러나, 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 경우들에서, 상기 TCR 델타 불변 도메인을 인코드하는 서열은 TCR 델타 가변 도메인을 더 인코드하며, 이로써 전체 TCR 델타 도메인을 인코드하게 된다. 상기 전체 TCR 델타 도메인은 델타 2 또는 델타 1일 수 있다. 상기 전체 TCR 델타 불변 도메인은 서열 식별 번호: 256, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다.
상기 전체 TCR 델타 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 델타 도메인은 서열 식별 번호: 256의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는 본원에 기술된 델타 도메인의 절두된 형태를 포함할 수 있다. 예를 들면, 상기 델타 도메인은 서열 식별 번호: 256의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 델타 도메인은 서열 식별 번호: 256의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 델타 도메인은 서열 식별 번호: 256의 서열 또는 이의 단편을 포함할 수 있다. 상기 델타 도메인은 서열 식별 번호: 256의 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 델타 도메인은 서열 식별 번호: 256의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 델타 도메인은 서열 식별 번호: 256의 서열에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 서열 동일성을 갖는 서열을 포함할 수 있다.
상기 TCR 감마 불변 도메인은 서열 식별 번호: 21을 포함할 수 있다. 상기 TCR 감마 불변 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 불변 도메인은 서열 식별 번호: 21의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는 본원에 기술된 불변 도메인의 절두된 형태를 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 21의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 불변 도메인은서열 식별 번호: 21의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 21의 서열 또는 이의 단편을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 21의 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 21의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 불변 도메인은 서열 식별 번호: 243의 서열에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 서열 동일성을 갖는 서열을 포함할 수 있다.
상기 TCR 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다. 일부 경우들에서, 상기 TCR 감마 불변 도메인을 인코드하는 서열은 TCR 감마 가변 도메인, 이로써 전체 TCR 감마 도메인을 더 인코드하게 된다. 상기 전체 TCR 감마 도메인은 감마 9 또는 감마 4일 수 있다. 상기 전체 TCR 감마 도메인은 서열 식별 번호: 255, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다.
상기 전체 TCR 감마 도메인은 본원에 기술된 불변 도메인의 서열의 절두, 추가, 또는 치환을 포함할 수 있다. 예를 들면, 상기 감마 도메인은 서열 식별 번호: 255의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 잔기를 갖는 본원에 기술된 감마 도메인의 절두된 형태를 포함할 수 있다. 예를 들면, 상기 감마 도메인은 서열 식별 번호: 255의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 추가 아미노산 잔기를 갖는 서열을 포함할 수 있다. 예를 들면, 상기 감마 도메인은 서열 식별 번호: 255의 적어도 약 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 150개 또는 그 이상의 아미노산 치환을 갖는 서열을 포함할 수 있다. 상기 감마 도메인은 서열 식별 번호: 255의 서열 또는 이의 단편을 포함할 수 있다. 상기 감마 도메인은 서열 식별 번호: 255의 서열의 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 감마 도메인은 서열 식별 번호: 255의 서열의 많아야 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 변형, 돌연변이 또는 결손을 포함할 수 있다. 상기 감마 도메인은 서열 식별 번호: 255의 서열에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 서열 동일성을 갖는 서열을 포함할 수 있다.
TCR 베타 쇄 (호모 사피엔스): VEDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF (서열 식별 번호: 16).
상기 뮤린 TCR 베타 쇄 불변 영역 기본형(canonical) 서열은 다음과 같다:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS (서열 식별 번호: 152).
TCR 알파 불변 영역 (무스 무스쿨루스) (또는 [mm]TRAC(82-137)):
ATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS (서열 식별 번호: 17).
상기 뮤린 TCR 알파 쇄 불변 (mTRAC) 영역 기본형 서열은 다음과 같다:
XIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS (서열 식별 번호: 146).
TCR 베타 불변 영역 (무스 무스쿨루스) (또는 [mm]TRBC1(123-173)): GRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS (서열 식별 번호: 18).
상기 뮤린 TCR 베타 쇄 불변 영역 기본형 서열은 다음과 같다:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS (서열 식별 번호: 152).
TCR 베타 쇄 (호모 사피엔스): PVDSGVTQTPKHLITATGQRVTLRCSPRSGDLSVSWYQQSLDQGLQFLIQYYNGEERAKGNILERFSAQQFPDLHSELNLSSLELGDSALYFCASSPRTGLNTEAFFGQGTRLTVVEDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF (서열 식별 번호: 19).
TCR 델타 불변 영역 형태(version) 1 (호모 사피엔스): SQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFF (서열 식별 번호: 20).
TCR 감마 불변 영역 (호모 사피엔스) (또는 [hs]TRGC(1-173)): DKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호: 21).
TCR 델타 불변 영역 형태 2 (호모 사피엔스): SQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAK (서열 식별 번호: 22).
일부 경우들에서, 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이다. 상기 TCR 델타 불변 도메인을 인코딩하는 서열은 상기 TCR 델타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드할 수 있다. 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이할 수 있다.
일부 경우들에서, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이다. 상기 TCR 감마 불변 도메인을 인코드하는 서열은 상기 TCR 감마 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드할 수 있다. 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이할 수 있다.
일부 경우들에서, 상기 재조합 핵산은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열을 포함한다. 상기 TCR 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다. 상기 TCR 감마 불변 도메인을 인코드하는 서열은 TCR 감마 가변 도메인을 더 인코드할 수 있고, 이로써 전체 TCR 감마 도메인을 인코드하게 된다. 상기 TCR 감마 도메인은 감마 9 또는 감마 4일 수 있다. 상기 전체 TCR 감마 도메인은 서열 식별 번호: 255, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다. 상기 TCR 델타 불변 도메인을 인코딩하는 서열은 TCR 델타 가변 도메인을 더 인코드할 수 있고, 이로써 전체 TCR 델타 도메인을 인코드하게 된다. 상기 TCR 델타 도메인은 델타 2 또는 델타 1일 수 있다. 상기 전체 TCR 델타 도메인은 서열 식별 번호: 256, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다.
일부 경우들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때, 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자들 안에 함유된다. 상기 서열은 상기 인코드된 TFP와 상기 TCR 불변 도메인 사이에 절단 부위 (가령, 프로테아제 절단 부위)를 더 인코드한다. 상기 절단 부위는 프로테아제 절단 부위일 수 있다. 상기 절단 부위는 자가-절단 펩티드, 이를 테면, T2A, P2A, E2A 또는 F2A 절단 부위일 수 있다. 상기 절단 부위는 서열 식별 번호: 23의 서열을 포함할 수 있다.
T2A 절단 부위: EGRGSLLTCGDVEENPGP (서열 식별 번호: 23).
상기 TFP의 TCR 소단위 및 상기 불변 도메인은 동일한 TCR 쇄 또는 상이한 TCR 쇄로부터 유래된 서열을 포함한다. 일부 경우들에서, 상기 TFP의 TCR 소단위 및 상기 불변 도메인은 상이한 TCR 쇄들로부터 유래된다. 예를 들면, 상기 TCR 소단위는 (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) 세포내 도메인을 포함할 수 있고, 여기에서 상기 TCR 세포외 도메인, 상기 막경유 도메인 및 상기 세포내 도메인은 TCR 알파 쇄로부터 유래되며, 상기 불변 도메인은 TCR 베타 쇄의 불변 도메인을 포함한다. 또다른 예로써, 상기 TCR 소단위는 (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) 세포내 도메인을 포함할 수 있고, 여기에서 상기 TCR 세포외 도메인, 상기 막경유 도메인 및 상기 세포내 도메인은 TCR 베타 쇄로부터 유래되며, 상기 불변 도메인은 TCR 알파 쇄의 불변 도메인을 포함한다. 또다른 예로써, 상기 TCR 소단위는 (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) 세포내 도메인을 포함할 수 있고, 여기에서 상기 TCR 세포외 도메인, 상기 막경유 도메인 및 상기 세포내 도메인은 TCR 감마 쇄로부터 유래되며, 상기 불변 도메인은 TCR 델타 쇄의 불변 도메인을 포함한다. 여전히 또다른 예로써, 상기 TCR 소단위는 (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 그리고 (3) 세포내 도메인을 포함할 수 있고, 여기에서 상기 TCR 세포외 도메인, 상기 막경유 도메인 및 상기 세포내 도메인은 TCR 델타 쇄로부터 유래되며, 상기 불변 도메인은 TCR 감마 쇄의 불변 도메인을 포함한다.
일부 경우에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4이다.
일부 경우들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 감마, TCR 델타, TCR 알파 또는 TCR 베타의 TCR 막경유 도메인이다. 일부 경우들에서, 상기 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 감마, 오로지 TCR 델타, 오로지 TCR 알파 또는 오로지 TCR 베타로부터 유래된다.
일부 경우에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개 또는 이들 모두는 동일한 TCR 소단위로부터 유래된다.
일부 경우에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다.
일부 경우들에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다.
일부 경우들에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, 또는 이의 단편의 TCR 세포내 도메인을 포함한다. 일부 경우에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 경우들에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 감마의 쇄 또는 TCR 델타 쇄의 TCR 세포내 도메인를 포함할 수 있다. 상기 TCR 세포외 도메인은 TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인의 세포외 일부분, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다. 일부 구체예들에서, (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하는 TCR 소단위는 본원에 기술된 델타 불변 도메인, 또는 이의 단편, 가령, 델타 불변 도메인이거나, 또는 이를 포함한다. 상기 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열의 서열을 가질 수 있다. 일부 구체예들에서, (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하는 TCR 소단위는 감마 불변 도메인, 가령, 본원에 기술된 감마 불변 도메인이거나, 또는 이를 포함한다. 상기 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열의 서열을 갖는다. 상기 TFP의 세포외 도메인은 감마 쇄 또는 델타 쇄의 가변 도메인을 포함하지 않을 수 있다.
상기 TFP의 TCR 소단위는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인을 포함할 수 있다. 일부 구체예들에서, 재조합 핵산은 CD3 입실론,, CD3 감마, 또는 CD3 델타의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인, 그리고 TCR 베타 및 TCR 알파의 불변 도메인을 포함하는 TFP를 포함한다. 일부 구체예들에서, 재조합 핵산은 CD3 입실론의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인 그리고 TCR 감마 및 TCR 델타의 불변 도메인을 포함하는 TFP를 포함한다. 일부 구체예들에서, 재조합 핵산은 CD3 입실론의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인, 그리고 전장 TCR 감마 및 전장 TCR 델타를 포함하는 TFP를 포함한다. 일부 구체예들에서, 상기 TFP의 TCR 소단위는 CD3 입실론을 포함한다. 상기 CD3 입실론의 TCR 소단위는 서열 식별 번호: 258의 서열, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다.
일부 경우들에서, 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인 및 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인의 적어도 일부분을 포함하는 TCR 소단위는 TCR 알파 불변 도메인 또는 TCR 베타 불변 도메인이거나, 또는 이를 포함한다. 상기 TCR 소단위는 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함할 수 있다. 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, 가령, 본원에 기술된 TCR 알파 불변 도메인일 수 있다. 상기 TCR 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다. 상기 상기 TCR 알파 불변 도메인을 인코드하는 서열은 상기 TCR 알파 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드한다. 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이할 수 있다. 상기 TCR 알파 불변 도메인은 뮤린 TCR 알파 불변 도메인을 포함할 수 있다. 상기 뮤린 TCR 알파 불변 도메인은 상기 뮤린 TCR 알파 불변 도메인의 아미노산 2-137을 포함할 수 있다. 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 아미노산 2-137을 포함할 수 있다. 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 207의 서열을 포함할 수 있다. 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 아미노산 82-137을 포함할 수 있다. 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 17의 서열을 포함한다. 상기 TCR 불변 도메인은 TCR 베타 불변 도메인, 가령, 본원에서 기술된 TCR 베타 불변 도메인일 수 있다. 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함할 수 있다. 상기 TCR 베타 불변 도메인을 인코딩하는 서열은 상기 TCR 베타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드할 수 있다. 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이할 수 있다. TCR 베타 불변 도메인은 뮤린 TCR 베타 불변 도메인을 포함한다. 상기 뮤린 TCR 베타 불변 도메인은 상기 뮤린 TCR 베타 불변 도메인의 아미노산 2-173을 포함한다. 상기 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 152의 아미노산 2-173을 포함한다. 상기 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 209를 포함한다. 상기 TCR 베타 불변 도메인은 서열 식별 번호: 152의 아미노산 123-173을 포함한다. 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18을 포함한다.
상기 재조합 핵산은 TCR 알파 불변 도메인과 TCR 베타 불변 도메인을 인코딩하는 서열을 포함할 수 있다. 상기 TCR 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 상기 세포내 신호생성 도메인은 CD3 입실론, CD3 감마, 또는 CD3 델타일 수 있다. 상기 세포내 신호생성 도메인은 CD3 입실론일 수 있다.
상기 TCR 불변 도메인을 인코딩하는 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함할 수 있다. 상기 TCR 불변 도메인을 인코딩하는 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함할 수 있다. 상기 TCR 불변 도메인을 인코딩하는 서열은 5'에서 3' 방향으로, 제 1 리더 서열, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커, 및 TRBC 유전자 서열을 포함할 수 있다. 상기 TCR 불변 도메인을 인코딩하는 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커, 및 TRBC 유전자 서열을 포함할 수 있다. 상기 TCR 불변 도메인을 인코딩하는 서열은 5'-3' 방향으로, 제 1 리더 서열, TRAC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRBC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함할 수 있다.
본원에 기술된 바와 같이,본원에 기술된 서열에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함할 수 있다.
일부 경우에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 경우들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다.
일부 경우에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, TCR 제타 쇄, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1 쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 경우에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 경우들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다.
일부 경우들에서, 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다. 일부 경우들에서, (a) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 델타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; (b) 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 감마, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 (c) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
일부 경우들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다.
상기 항체 또는 항원 결합 도메인은 항체 단편일 수 있다. 상기 항체 또는 항원 결합 도메인은 뮤린, 인간 또는 인간화된 것일 수 있다. 일부 경우들에서, 상기 인간 또는 인간화된 항체는 항체 단편이다. 일부 경우들에서, 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인이다. 일부 경우들에서, 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체는 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD22 결합 도메인, 항-PD-1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택된다.
본원에서 기술된 항원 결합 도메인은 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD20 결합 도메인, 항-CD70 결합 도메인, 항-79b 결합 도메인, 항-HER2 결합 도메인, 항-PMSA 결합 도메인, 항-MUC16 결합 도메인, 항-CD22 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 항-Nectin-4 결합 도메인, 항-TROP-2 결합 도메인, 항-GPC3 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택될 수 있다.
일부 경우에서, 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택된다. 일부 경우들에서, 상기 핵산은 mRNA이다. 일부 경우에서, 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 이 재조합 핵산의 인코딩 서열에 존재하지 않는다. 일부 경우들에서, 상기 핵 유사체는 다음으로 구성된 군에서 선택된다: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트.
일부 경우들에서, 상기 재조합 핵산은 리더 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 프로모터 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 poly(A) 꼬리를 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 3'UTR 서열을 더 포함한다. 일부 경우들에서, 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산이다. 일부 경우들에서, 상기 핵산은 시험관내 전사된 핵산이다.
일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다.
일부 구체예들에서, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열을 포함하는 재조합 핵산이 본원에서 기술된다. 상기 TFP는 TCR 세포외 도메인의 적어도 일부분을 포함하는 TCR 소단위를 포함할 수 있다. 상기 TCR 소단위는 막경유 도메인을 더 포함할 수 있다. 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, 또는 이의 단편의 세포내 도메인을 더 포함할 수 있다. 일부 경우들에서, 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인을 포함하거나, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함한다. 상기 TFP는 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 더 포함할 수 있다. 상기 재조합 핵산 분자는 TCR 불변 도메인을 인코드하는 서열을 포함할 수 있고, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, TCR 알파 불변 도메인 및 TCR 베타 불변 도메인, TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 이때 상기 TCR 소단위 및 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다. 일부 경우들에서, 상기 결합 리간드는 상기 항체의 Fc 도메인에 결합할 수 있다. 일부 경우들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 경우들에서, 상기 결합 리간드는 IgG1 항체에 특이적으로 결합할 수 있다. 일부 경우들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 경우들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 경우들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 경우들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 경우들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 경우들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 경우들에서, 상기 결합 리간드는 인간 또는 인간화된 리간드이다. 일부 경우들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 경우들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
일부 경우들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때, 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자들 안에 함유된다.
일부 경우에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 경우들에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4이다.
일부 경우들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 TCR 막경유 도메인이다. 일부 경우에서, 상기 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파 또는 오로지 TCR 베타에서만 유래된다.
일부 경우에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다.
일부 경우에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다.
일부 경우들에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다.
일부 경우들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 TCR 세포내 도메인을 포함한다.
일부 경우에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 경우들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다.
일부 경우에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, TCR 제타 쇄, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1 쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 경우에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 경우들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다.
일부 경우들에서, 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다. 일부 경우들에서, (a) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 베타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; (b) 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 알파, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위을 포함하는 TCR 복합체에 기능적으로 통합되며; (c) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, 및 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; (d) 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이며, 상기 TFP는 TCR 베타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 (e) 상기 TCR 불변 도메인은 TCR 베타 불변 도메인이며, 상기 TFP는 TCR 알파, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
일부 경우들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다.
일부 경우들에서, 상기 인간 또는 인간화된 항체는 항체 단편이다. 일부 경우들에서, 상기 항체 단편은 scFv, 단일 도메인 항체 도메인 (sdAb), VH 도메인 또는 VL 도메인이다. 일부 경우들에서, 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체는 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD22 결합 도메인, 항-PD-1 결합 도메인, 항-PD-L1 결합 도메인, 항-IL13Rα2 결합 도메인, 항-BAFF 또는 BAFFR 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택된다.
일부 경우에서, 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택된다. 일부 경우들에서, 상기 핵산은 mRNA이다. 일부 경우에서, 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 이 재조합 핵산의 인코딩 서열에 존재하지 않는다. 일부 경우들에서, 상기 핵 유사체는 다음으로 구성된 군에서 선택된다: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트.
일부 경우들에서, 상기 재조합 핵산은 리더 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 프로모터 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 poly(A) 꼬리를 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 3'UTR 서열을 더 포함한다. 일부 경우들에서, 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산이다. 일부 경우들에서, 상기 핵산은 시험관내 전사된 핵산이다.
일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 대안으로, 상기 재조합 핵산은 TCR 감마 또는 TCR 델타 도메인, 가령, 막경유 도메인을 인코딩하는 서열을 포함한다.
일부 구체예들에서, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열을 포함하는 재조합 핵산이 본원에서 기술된다. 상기 TFP는 TCR 소단위를 포함할 수 있다. 상기 TCR 소단위는 TCR 세포외 도메인의 적어도 일부분을 포함할 수 있다. 상기 TCR 소단위는 막경유 도메인을 더 포함할 수 있다. 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 더 포함할 수 있다. 상기 TFP는 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 도메인을 더 포함할 수 있다. 상기 재조합 핵산 분자는 TCR 불변 도메인을 인코드하는 서열을 포함할 수 있고, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, TCR 알파 불변 도메인 및 TCR 베타 불변 도메인, TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항원 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다. 일부 경우들에서, 상기 항원 도메인은 리간드를 포함한다. 일부 경우들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 경우들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 경우들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함한다. 일부 경우들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 경우들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 경우들에서, 상기 항원 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 경우들에서, 상기 항원 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다. 일부 경우들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 경우들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 경우들에서, 상기 항원 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 경우들에서, 상기 항원 도메인은 가변 영역을 포함하지 않는다. 일부 경우들에서, 상기 항원 도메인은 CDR을 포함하지 않는다. 일부 경우들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다.
일부 경우들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때, 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자들 안에 함유된다.
일부 경우에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 경우에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4이다.
일부 경우들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 TCR 막경유 도메인이다. 일부 경우들에서, 상기 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파, 오로지 TCR 베타, 오로지 TCR 델타, 또는 오로지 TCR 감마로부터 유래된다.
일부 경우에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다.
일부 경우에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, TCR 감마 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다.
일부 경우에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 델타 쇄, TCR 감마 쇄, TCR 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다.
일부 경우들에서, 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 TCR 세포내 도메인을 포함한다. 일부 경우들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 TCR 세포내 도메인을 포함한다.
일부 경우에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 경우들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다.
일부 경우에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, TCR 제타 쇄, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1 쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 경우에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 경우들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다.
일부 경우들에서, 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다. 일부 경우들에서, (a) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 베타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; (b) 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 감마, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위을 포함하는 TCR 복합체에 기능적으로 통합되며; (c) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; (d) 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이며, 상기 TFP는 TCR 베타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 (e) 상기 TCR 불변 도메인은 TCR 베타 불변 도메인이며, 상기 TFP는 TCR 알파, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
일부 경우들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다.
일부 경우들에서, 상기 인간 또는 인간화된 항체는 항체 단편이다. 일부 경우들에서, 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인이다. 일부 경우들에서, 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체는 항-CD19 결합 도메인, 항-CD20 결합 도메인, 항-메소텔린 결합 도메인, 항-PMSA 결합 도메인, 항-CD70 결합 도메인, 항-CD79b 결합 도메인, 항-MUC16 결합 도메인, 항-항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-IL13Rα2 결합 도메인, 항-CD22 결합 도메인, 항-BAFF 또는 항-BAFFR 결합 도메인, 항-PD-1 결합 도메인, 항-PD-L1 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택된다.
일부 경우에서, 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택된다. 일부 경우들에서, 상기 핵산은 mRNA이다. 일부 경우에서, 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 이 재조합 핵산의 인코딩 서열에 존재하지 않는다. 일부 경우들에서, 상기 핵 유사체는 다음으로 구성된 군에서 선택된다: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트.
일부 경우들에서, 상기 재조합 핵산은 리더 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 프로모터 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 poly(A) 꼬리를 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 3'UTR 서열을 더 포함한다. 일부 경우들에서, 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산이다. 일부 경우들에서, 상기 핵산은 시험관내 전사된 핵산이다.
일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 감마 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 델타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 감마 막경유 도메인을 인코딩하는 서열과 TCR 델타 막경유 도메인을 인코딩하는 서열을 더 포함한다.
일부 구체예들에서, 본원에 기술된 상기 재조합 핵산을 포함하는 벡터가 본원에서 추가 기술된다. 일부 경우들에서, 상기 벡터는 DNA, RNA, 플라스미드, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연합된 바이러스 벡터 (AAV), Rous 육종 바이러스 (RSV) 벡터, 또는 레트로바이러스 벡터로 구성된 군에서 선택된다. 일부 경우들에서, 상기 벡터는 AAV6 벡터이다. 일부 경우들에서, 상기 벡터는 프로모터를 더 포함한다. 일부 경우들에서, 상기 벡터는 시험관내 전사된 벡터다.
원하는 분자들을 코딩하는 핵산 서열은 당분야에 공지된 재조합 방법, 이를 테면, 예를 들면, 표준 기술을 이용하여 이 유전자를 발현시키는 세포로 부터 라이브러리를 스크리닝함으로써, 상기 동일한 것을 포함하는 것으로 알려진 벡터로부터 당해 유전자를 유도함으로써, 또는 상기 동일한 것을 함유하는 세포 및 조직으로부터 직접적으로 단리함으로써 획득될 수 있다. 대안으로, 관심대상 유전자는 클론보다는 합성에 의해 만들어질 수 있다.
본 명세서는 본 명세서의 DNA가 삽입된 벡터들을 또한 제공한다. 렌티바이러스와 같은 레트로바이러스로부터 유래된 벡터는 장기 유전자 전이를 달성하는데 적합한 도구인데, 그 이유는 이식유전자의 장기적이고, 안정적인 통합 및 이의 딸 세포에서의 그의 전파를 허용하기 때문이다. 렌티바이러스성 벡터들은 암-레트로바이러스들, 이를 테면, 비-증식 세포들, 이를 테면 간세포를 형질도입시킬 수 있는 뮤린 백혈병 바이러스들로부터 유래된 벡터보다 추가적인 장점을 갖는다. 이들은 면역원성이 낮다는 장점을 또한 갖고 있다.
또다른 구체예에서, 본 명세서의 바람직한 TFP를 인코딩하는 핵산을 포함하는 벡터는 아데노바이러스 벡터 (A5/35)이다. 또다른 구체예에서, 상기 TFPs를 인코딩하는 핵산은 트랜스포존, 이를 테면, 슬리핑 뷰티, 크리스퍼, CAS9, 그리고 아연 핑거 뉴클레아제를 이용하여 발현이 이루어질 수 있다. 하기 June et al. 2009 Nature Reviews Immunology 9.10: 704-716 참고(이는 본원의 참고자료에 편입됨).
본 명세서의 발현 구조체들을 표준 유전자 전달 프로토콜을 이용하여 핵산 면역화 및 유전자 요법에 또한 이용할 수도 있다. 유전자 전달 방법들은 당분야에 공지되어 있다 (가령, U.S. 특허 번호 5,399,346, 5,580,859, 5,589,466 참고-이들의 전문이 본원의 참고자료에 편입됨). 또다른 구체예에서, 본 명세서는 유전자 요법 벡터를 제공한다.
상기 핵산은 다수의 벡터 유형으로 클로닝될 수 있다. 예를 들면, 상기 핵산은 플라스미드, 파아지미드, 파아지 유도체, 동물 바이러스, 그리고 코스미드를 포함하나, 이에 국한되지 않은 벡터 안으로 클로닝될 수 있다. 특히 관심대상 벡터들에는 발현 벡터들, 복제 벡터들, 프로브 생성 벡터들, 그리고 서열화 벡터들이 포함된다.
또한, 상기 발현 벡터는 바이러스성 벡터 형태로 세포에 제공될 수 있다. 바이러스성 벡터 기술은 당분야에 잘 공지되어 있으며, 예를 들면, Sambrook et al., 2012, Molecular Cloning: A Laboratory Manual, volumes 1-4, Cold Spring Harbor Press, NY), 그리고 다른 바이러스학 및 분자 생물학 메뉴얼에 기술된다. 벡터로 유용한 바이러스들에는 레트로바이러스들, 아데노바이러스들, 아데노-연합된 바이러스들, 헤르페스 바이러스들, 그리고 렌티바이러스들이 포함되나, 이에 국한되지 않는다. 일반적으로, 적합한 벡터는 적어도 하나의 유기체 안에서 기증적으로 복제되는 원점, 프로모터 서열, 통상적인 제한 앤도뉴클레아제 부위, 그리고 하나 또는 그 이상의 선택성 마커들을 함유한다 (가령, WO 01/96584; WO 01/29058; 그리고 U.S. 특허 번호 6,326,193).
포유 동물 세포로의 유전자 전이를 위해 다수의 바이러스 기반 시스템이 개발되었다. 예를 들면, 레트로바이러스는 유전자 전달 시스템을 위한 편리한 플랫폼을 제공한다. 선택된 유전자는 벡터에 삽입되고, 당업계에 공지된 기술을 사용하여 레트로바이러스 입자로 포장될 수 있다. 그 다음, 상기 재조합 바이러스는 단리되고, 시험관내 또는 생체 외에서 대상체의 세포들로 전달될 수 있다. 다수의 레트로바이러스 시스템이 당업계에 공지되어 있다. 일부 구체예들에서, 아데노바이러스 벡터들이 이용된다. 다수의 아데노바이러스 벡터가 당분야에 공지되어 있다. 한 구체예에서, 렌티바이러스 벡터들이 이용된다.
추가 프로모터 요소들, 가령, 인핸서는 전사 개시 빈도를 조절한다. 비록 다수의 프로모터는 시작 부위의 하류에 기능적 요소를 함유하는 것으로 나타났지만, 전형적으로, 이들은 시작 부위의 상류 30-110 bp 영역에 위치한다. 프로모터 요소들 간의 공간은 유연성이 있고, 이러한 요소들이 서로에 대하여 역전되어 있거나, 또는 이동될 때, 프로모터 기능은 보존된다. 티미딘 키나제 (tk) 프로모터에서, 상기 프로모터 요소들 간의 공간은 50개 bp로 벌어질 때까지 증가될 수 있지만, 이때부터 활성은 감소되기 시작한다. 상기 프로모터에 의존적으로, 개별 요소들은 공조적으로 또는 독립적으로 전사를 활성화시키는 기능을 할 수 있다.
포유류 T 세포에서 TFP 이식유전자를 발현시킬 수 있는 예시적인 프로모터는 EF1a 프로모터다. 고유의 EF1a 프로모터는 연장 인자-1 복합체의 알파 소단위의 발현을 이끄는데, 이것은 아미노아실 tRNAs를 리보솜으로 효소적 운반을 담당한다. 상기 EF1a 프로모터는 포유류 발현 플라스미드에서 광범위하게 이용되었으며, 클론된 이식유전자들로부터 렌티바이러스성 벡터로 TFP 발현을 구동시키는데 효과적임을 보여주었다 (가령, Milone et al., Mol. Ther. 17(8): 1453-1464 (2009)). 프로모터의 또다른 예로는 즉각 초기 사이토메갈로바이러스 (CMV) 프로모터 서열이다. 이 프로모터 서열은 이에 작동가능하도록 연계된 임의의 폴리뉴클레오티드 서열의 높은 수준의 발현을 구동시킬 수 있는 강력한 구성적 프로모터 서열이다. 그러나, 기타 구성적 프로모터 서열이 또한 이용될 수 있는데, 예를 들면, 원숭이 바이러스 40 (SV40) 초기(early) 프로모터, 마우스 유방 종양 바이러스 (MMTV), 인간 면역결핍 바이러스 (HIV) 긴 말단 반복부 (LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, Epstein-Barr 바이러스 즉각 초기 프로모터, Rous 육종 바이러스 프로모터를 포함하나 이에 국한되지 않으며, 뿐만 아니라 인간 유전자 프로모터, 이를 테면, 액틴 프로모터, 미오신 프로모터, 연장 인자-1a 프로모터, 헤모글로빈 프로모터, 그리고 크레아틴 키나제 프로모터를 포함하나, 이에 국한되지 않는다. 더욱이, 본 명세서는 구성적 프로모터의 사용에 한정되지 않아야 한다. 유도성 프로모터는 본 명세서의 일부분으로 또한 간주된다. 유도성 프로모터의 사용으로 분자 스위치를 제공하는데, 이것은 발현이 바람직한 경우에, 작동가능하도록 연계된 폴리뉴클레오티드 서열의 발현을 켤 수 있고, 이러한 발현을 원하지 않는 경우 발현을 끌 수 있다. 유도성 프로모터의 예로는 메탈로티오닌 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터, 그리고 테트라사이클린-조절된 프로모터가 포함되나, 이에 국한되지 않는다.
TFP 폴리펩티드 또는 이의 일부분들의 발현을 평가하기 위하여, 세포 안으로 도입될 발현 벡터는 바이러스성 벡터들을 통하여 형질감염 또는 감염시키고자 하는 세포 집단으로부터 발현 세포의 식별 및 선별을 용이하게 하기 위하여, 선택성 마커 유전자 또는 리포터 유전자 또는 이둘 모두를 또한 함유할 수 있다. 다른 측면들에서, 상기 선택성 마커는 별개의 DNA 조각을 통하여 운반되고, 공동-형질감염 과정에 이용될 수 있다. 선별 가능한 마커와 리포터 유전자 모두는 숙주 세포에서의 발현을 가능하게 하기 위해 적절한 조절 서열에 의해 측면에 있을 수 있다. 유용한 선택성 마커들에는 예를 들면, 항생제-저항성 유전자들, 이를 테면 neo 및 이와 유사한 것들이 포함된다.
리포터 유전자는 잠재적으로 형질감염된 세포를 확인하고, 조절 서열의 기능성을 평가하기 위해 사용된다. 일반적으로, 리포터 유전자는 수용자 유기체 또는 조직에 존재하지 않거나, 또는 발현되지 않는 유전자이며, 폴리펩티드의 발현으로 쉽게 검출 가능한 특성, 예를 들어, 효소 활성으로 현시되는 폴리펩티드를 코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용자 세포로 도입된 후 적절한 시간에 분석된다. 적합한 리포터 유전자는 루시페라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비된 알칼리성 포스파타제 또는 녹색 형광 단백질 유전자를 암호화하는 유전자를 포함할 수 있다 (가령, Ui-Tei et al., 2000 FEBS Letters 479: 79-82). 적합한 발현 시스템은 공지되어 있고, 공지된 기술을 사용하여 제조되거나 상업적으로 입수될 수 있다. 일반적으로, 리포터 유전자의 최대 발현 수준을 나타내는 최소 5' 측면 영역을 갖는 구조체는 프로모터로써 식별된다. 이러한 프로모터 영역들은 리포터 유전자에 연계될 수 있고, 프로모터-구동된 전사를 조절하는 능력에 대하여 물질들을 평가하는데 이용될 수 있다.
세포 안으로 유전자를 도입시키고, 발현시키는 방법은 당업계에 공지되어 있다. 발현 벡터와 관련하여, 벡터는 숙주 세포, 예를 들어, 포유류, 박테리아, 효모 또는 곤충 세포 내로 당업계의 임의의 방법으로 용이하게 도입될 수 있다. 예를 들면, 발현 벡터는 물리적, 화학적 또는 생물학적 수단에 의해 숙주 세포로 전달될 수 있다.
폴리뉴클레오티드를 숙주 세포에 도입시키는 물리적 방법은 인산 칼슘 침전, 리포펙션, 입자 충격, 마이크로인젝션, 전기천공 등을 포함한다. 벡터 및/또는 외생성 핵산을 포함하는 세포를 생산하는 방법은 당업계에 잘 알려져 있다. 예를 들면, Sambrook et al., 2012, Molecular Cloning: A Laboratory Manual, volumes 1-4, Cold Spring Harbor Press, NY 참고). 폴리뉴클레오티드를 숙주 세포에 도입하는 바람직한 방법은 인산 칼슘 형질감염이다.
관심대상의 폴리뉴클레오티드를 숙주 세포에 도입시키는 생물학적 방법은 DNA 및 RNA 벡터의 사용을 포함한다. 바이러스 벡터 및 특히 레트로 바이러스 벡터는 인간 세포와 같은 포유 동물 세포에 유전자를 삽입하는 가장 널리 사용되는 방법이 되었다. 다른 바이러스 벡터는 렌티바이러스, 폭스바이러스, 단순 포진 바이러스 I, 아데노 바이러스 및 아데노-관련 바이러스 등으로부터 유래될 수 있다(가령, U.S. 특허 번호 5,350,674 및 5,585,362 참고.
폴리뉴클레오티드를 숙조 세포 안으로 도입시키는 화학적 수단은 콜로이드성 분산 시스템, 이를 테면, 거대분자 복합체, 나노캡슐, 미소구, 비드, 그리고 수중유 에멀션, 미셀, 혼합 미셀 및 리포좀을 포함하는 지질-기반 시스템을 포함한다. 시험관내 및 생체내 전달 비히클로 사용하기 위한 예시적인 콜로이드계는 리포좀 (예를 들어, 인공 막 소포)이다. 핵산의 표적화 운반을 위한 최신 방법이 이용될 수 있는데, 이를 테면, 표적화된 나노입자 또는 다른 적합한 준-미크론 크기의 운반 시스템을 사용한 폴리뉴클레오티드의 운반이 이용가능하다.
비-바이러스성 전달 시스템이 사용되는 경우, 예시적인 전달 비히클은 리포좀이다. 지질 제형의 사용은 핵산을 숙주 세포 내로 (시험관내, 생체외 또는 생체내) 도입하기 위해 고려된다. 또다른 측면에서, 핵산은 지질과 연합될 수 있다. 지질과 연합된 핵산은 리포좀의 수성 내부에 캡슐화될 수 있으며, 리포좀의 지질 이중층 내에 산재되어 리포좀 및 올리고 뉴클레오티이드 둘 다와 결합된 연결 분자를 통해 리포좀에 부착되어 리포좀에 포획될 수 있고, 리포좀과 복합체를 이루고, 지질을 함유하는 용액에 분산되거나, 지질과 혼합되거나, 지질과 결합되거나, 지질 중 현탁액으로서 함유되거나, 미셀과 함유되거나 또는 복합체 화되거나 그렇지 않으면 지질과 연합될 수 있다. 지질, 지질/DNA 또는 지질/발현 벡터와 관련된 조성물은 용액 중 임의의 특정 구조로 제한되지 않는다. 예를 들면, 그들은 이중층 구조, 미셀 또는 "붕괴된" 구조로 존재할 수 있다. 그것들은 단순히 용액에 흩어져 있어 크기 또는 모양이 균일하지 않은 응집체를 또한 형성할 수도 있다. 지질은 자연 발생 또는 합성 지질일 수 있는 지방성 물질이다. 예를 들면, 지질은 지방산, 알코올, 아민, 아미노 알코올 및 알데히드와 같은 장쇄 지방족 탄화수소 및 이들의 유도체를 함유하는 부류, 뿐만 아니라 세포질에서 자연적으로 발생하는 지방 방울을 포함한다.
상업적 공급원으로부터 사용에 적합한 지질을 구할 수 있다. 예를 들면, 디미리스틸 포스파티딜콜린 ("DMPC")은 Sigma, St. Louis, Mo.에서 얻을 수 있으며; 디세틸 포스페이트 ("DCP")는 K & K Laboratories (Plainview, N.Y.)에서 얻을 수 있고; 콜레스테롤("Choi")은 Calbiochem-Behring에서 얻을 수 있고; 디미리스틸 포스파티딜글리세롤 ("DMPG") 및 기타 지질은 Avanti Polar Lipids, Inc.(Birmingham, Ala.)에서 얻을 수 있다. 클로로포름 또는 클로로포름/메탄올의 지질 원액은 약 -20 ℃에서 보관할 수 있다. 클로로포름은 메탄올보다 쉽게 증발하기 때문에 유일한 용매로 사용된다. "리포좀"은 봉입된 지질 이중층 또는 응집체의 생성에 의해 형성된 다양한 단일 및 다중-박층 지질 비히클을 포함하는 일반적인 용어다. 리포좀은 인지질 이중층 막 및 내부 수성 매질을 갖는 소포 구조를 갖는 것이 특징이 될 수 있다. 다중-박층 리포좀은 수성 매질로 분리된 여러 지질 층을 가지고 있다. 인지질이 과량의 수용액에 현탁될 때, 이들은 자발적으로 형성된다. 지질 성분들은 폐쇄 구조가 형성되기 전에 자가-재배열을 거쳐, 지질 이중층 사이에 물과 용해된 용질을 포획한다(Ghosh et al., 1991 Glycobiology 5: 505-10). 그러나, 용액에서 정상적인 소포 구조와 다른 구조를 갖는 조성물도 또한 포함된다. 예를 들면, 지질은 미셀 구조로 추정될 수 있거나, 또는 단순히 지질 분자의 불균일 응집체로 존재할 수 있다. 리포펙타민-핵산 복합체 또한 고려된다.
숙주 세포 안으로 외생성 핵산을 도입하거나 또는 본 명세서의 억제제에 세포를 노출시키는 데 사용되는 방법과 무관하게, 숙주 세포에서 재조합 DNA 서열의 존재를 확인하기 위해 다양한 분석을 수행할 수 있다. 이러한 검정에는 예를 들면, 당분야에 잘 공지된 "분자 생물학적" 검정, 이를 테면, Southern 및 Northern 블랏팅, RT-PCR 및 PCR; "생화학적" 검정, 이를 테면 특정 펩티드의 존재 또는 부재를 가령, 면역학적 방법(이를 테면 ELISAs 및 웨스턴 블랏)에 의해 탐지하는 검정, 또는 본 명세서 범위 안에 속하는 물질을 식별하기 위한 본원에 기술된 검정이 포함된다.
본 명세서는 TFP 인코딩 핵산 분자를 포함하는 벡터를 추가 제공한다. 하나의 측면에서, TFP 벡터는 세포, 가령, T 세포로 직접적으로 형질도입될 수 있다. 하나의 측면에서, 상기 벡터는 클로닝 또는 발현 벡터, 가령, 하나 또는 그 이상의 플라스미드들 (가령, 발현 플라스미드들, 클로닝 벡터들, 미니서클, 미니벡터들, 이중 극미 염색체, 레트로바이러스성 벡터 구조체들과 렌티바이러스성 벡터 구조체들을 비롯한, 그러나, 이에 국한되지 않는 벡터다. 하나의 측면에서, 상기 벡터는 포유류 T 세포들에서 상기 TFP 구조체를 발현시킬 수 있다. 한 측면에서, 상기 포유류 T 세포는 인간 T 세포이다.
한 측면에서, 본 명세서는 (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항원 결합 도메인을 포함하는 항체를 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며; 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
또다른 측면에서, 본 명세서는 (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 델타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 감마의 세포내 도메인이다. 일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 감마 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 델타의 세포내 도메인이다. 일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 TCR 델타 불변 도메인 또는 이의 단편을 인코딩하는 서열과 TCR 감마 불변 도메인 또는 이의 단편을 인코딩하는 서열 모두에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 신호생성 도메인은 CD3 입실론, CD3 감마, 또는 CD3 델타이다. 일부 구체예들에서, 상기 세포내 신호생성 도메인은 CD3 입실론이다. 일부 구체예들에서, 상기 재조합 핵산은 적어도 하나의 리더 서열과 적어도 하나의 링커를 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 불변 도메인의 일부분, TCR 베타 도메인의 일부분, 또는 이 둘 모두를 더 포함한다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRGC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 TRGC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열, 절단가능한 링커, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, 및 TRGC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRGC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, 제 1 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열 또는 이의 단편, TRAC 유전자 서열 또는 이의 단편, 절단가능한 링커 서열, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, TRGC 유전자 서열 또는 이의 단편, 및 TRBC 유전자 서열 또는 이의 단편을 포함한다 . 일부 구체예들에서, 상기 서열은 서열 식별 번호: 1에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 2에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 3에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 4에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 5에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG4 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
또다른 측면에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에서 제공되며; 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 불변 도메인, TCR 베타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인 모두의 일부분 서열을 더 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 리간드를 포함한다. 일부 구체예들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 구체예들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 구체예들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항원 결합 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 구체예들에서, 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 가변 영역을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 CDR을 포함하지 않는다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때 기능적 TCR 복합체로 통합된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR에 통합된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4이다. 일부 구체예들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 TCR 막경유 도메인이다. 일부 구체예들에서, 상기 인코드된 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타로부터 유래된다. 일부 구체예들에서, 상기 인코드된 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인 또는 이의 일부분을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, TCR 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인로부터 선택된 단백질의 자극 도메인을 포함하거나, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함하는 TCR 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 구체예들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, TCR 제타 쇄, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1 쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 구체예들에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 구체예들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다. 일부 구체예들에서, 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다.
일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 델타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 감마, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 상기 TCR 불변 도메인은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다. 일부 구체예들에서, 상기 항체는 항체 단편이다. 일부 구체예들에서 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인이다. 일부 구체예들에서, 항원 결합 도메인은 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD20 결합 도메인, 항-CD70 결합 도메인, 항-79b 결합 도메인, 항-HER2 결합 도메인, 항-PMSA 결합 도메인, 항-MUC16 결합 도메인, 항-CD22 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다.
또다른 측면에서, 본 명세서는 (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항원 결합 도메인을 포함하는 항체 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며; 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
또다른 측면에서, 본 명세서는 (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 알파 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 베타의 세포내 도메인이다. 일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 베타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 알파의 세포내 도메인이다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 10에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 재조합 핵산은 적어도 하나의 리더 서열과 적어도 하나의 링커를 더 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG4 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
또다른 측면에서, 본 명세서는 (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며; 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, 또는 TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 TCR 불변 도메인은 뮤린 TCR 불변 도메인, 가령, 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인이다. 일부 구체예들에서, 상기 세포외 도메인은 TCR 알파 세포외 도메인 또는 TCR 베타 세포외 도메인의 적어도 일부분을 포함한다. 일부 구체예들에서, 상기 TCR 알파 세포외 도메인 또는 TCR 베타 세포외 도메인은 뮤린 TCR 알파 세포외 도메인 또는 뮤린 TCR 베타 세포외 도메인이다. 일부 구체예들에서, 상기 세포외 도메인은 TCR 알파 불변 도메인 또는 TCR 베타 불변 도메인의 적어도 일부분을 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 감마 불변 도메인, TCR 델타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인 모두의 적어도 일부분 서열을 더 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 리간드를 포함한다. 일부 구체예들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 구체예들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 구체예들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항원 결합 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다.
일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 구체예들에서, 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 가변 영역을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 CDR을 포함하지 않는다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때 기능적 TCR 복합체로 통합된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR에 통합된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4이다. 일부 구체예들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 TCR 막경유 도메인이다. 일부 구체예들에서, 상기 인코드된 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타로부터 유래된다. 일부 구체예들에서, 상기 인코드된 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다. 일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, TCR 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인로부터 선택된 단백질의 자극 도메인을 포함하거나, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함하는 TCR 세포내 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 구체예들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, TCR 제타 쇄, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1 쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 구체예들에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 구체예들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다. 일부 구체예들에서, 상기 TFP, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다.
일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이며, 상기 TFP CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되고; 상기 TCR 불변 도메인은 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 상기 TCR 불변 도메인은 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
또다른 측면에서, 본 명세서는 (a) (i) (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인, 및 (3) 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항원 결합 도메인을 포함하는 항체 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
또다른 측면에서, 본 명세서는 (a) (i) (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인, 및 (3) 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며, 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 알파 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 베타의 세포내 도메인이다. 일부 구체예들에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 베타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 일부 구체예들에서, 상기 세포내 도메인은 TCR 알파의 세포내 도메인이다. 일부 구체예들에서, 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함한다. 일부 구체예들에서, 상기 서열은 서열 식별 번호: 10에서 제시된 폴리펩티드를 인코드한다. 일부 구체예들에서, 상기 재조합 핵산은 적어도 하나의 리더 서열과 적어도 하나의 링커를 더 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 결합 리간드는 IgG4 항체에 선택적으로 결합할 수 있다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 구체예들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 구체예들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 결합 리간드는 인간 또는 인간화된 것이다. 일부 구체예들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 구체예들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
또다른 측면에서, 본 명세서는 (a) (i) (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인, 및 (3) 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산을 제공하며; 이때 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인이며; 그리고 이때 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
일부 구체예들에서, 상기 세포외 도메인은 TCR 알파 불변 도메인 또는 TCR 베타 불변 도메인의 적어도 일부분을 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 TCR 감마 불변 도메인, TCR 델타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인 모두의 적어도 일부분 서열을 더 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 리간드를 포함한다. 일부 구체예들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 구체예들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함한다. 일부 구체예들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 구체예들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 항원 결합 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 구체예들에서, 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 구체예들에서, 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 가변 영역을 포함하지 않는다. 일부 구체예들에서, 상기 항원 결합 도메인은 CDR을 포함하지 않는다. 일부 구체예들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포에서 발현될 때 기능적 TCR 복합체로 통합된다. 일부 구체예들에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR에 통합된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자 안에 함유된다. 일부 구체예들에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 구체예들에서, 상기 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4이다. 일부 구체예들에서, 상기 막경유 도메인은 TCR 알파 또는 TCR 베타, 가령, 뮤린 TCR 알파 또는 TCR 베타의 TCR 막경유 도메인이다.
일부 구체예들에서, 상기 인코드된 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다.
일부 구체예들에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 세포외 도메인 또는 이의 일부분, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 TCR 알파 쇄 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 막경유 도메인, 이의 기능성 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 막경유 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 TCR 알파 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 TCR 세포내 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다.
일부 구체예들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다. 일부 구체예들에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, TCR 제타 쇄, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1 쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 구체예들에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 구체예들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다. 일부 구체예들에서, 상기 TFP, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다. 일부 구체예들에서, 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이며, 상기 TFP CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되고; 상기 TCR 불변 도메인은 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 상기 TCR 불변 도메인은 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 핵산은 mRNA이다. 일부 구체예들에서, 상기 핵산은 circRNA이다. 일부 구체예들에서, 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 상기 재조합 핵산의 인코딩 서열에 존재하지 않는다. 일부 구체예들에서, 상기 핵 유사체는 다음으로 구성된 군에서 선택된다: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트. 일부 구체예들에서, 상기 재조합 핵산은 리더 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 프로모터 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 poly(A) 꼬리를 인코딩하는 서열을 더 포함한다. 일부 구체예들에서, 상기 재조합 핵산은 3'UTR 서열을 더 포함한다. 일부 구체예들에서, 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산이다. 일부 구체예들에서, 상기 핵산은 시험관내 전사된 핵산이다.
또다른 측면에서, 본 명세서는 본원에서 기술된 재조합 핵산을 포함하는 벡터를 제공한다.
일부 구체예들에서, 상기 벡터는 DNA, RNA, 플라스미드, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연합된 바이러스 벡터 (AAV), Rous 육종 바이러스 (RSV) 벡터, 또는 레트로바이러스 벡터로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 벡터는 AAV6 벡터이다. 일부 구체예들에서, 상기 벡터는 프로모터를 더 포함한다. 일부 구체예들에서, 상기 벡터는 시험관내 전사된 벡터이다.
또다른 측면에서, 본 명세서는 본원에서 기술된 재조합 핵산, 또는 본원에서 기술된 벡터를 포함하는 변형된 T 세포를 제공하며, 상기 변형된 T 세포는 내생성 TCR의 기능성 파괴를 포함한다.
또다른 측면에서, 본 명세서는 본원에서 기술된 TFP를 인코딩하는 핵산 서열, 또는 본원에서 기술된 TFP를 인코드하는 핵산 서열에 의해 인코드된 TFP를 포함하는 변형된 T 세포를 제공하며, 그리고 상기 변형된 T 세포는 내생성 TCR의 기능성 붕괴를 포함한다.
또다른 측면에서, 본 명세서는 본원에서 기술된 TFP를 인코딩하는 서열 또는 본원에서 기술된 TFP를 인코드하는 핵산 서열에 의해 인코드된 TFP를 포함하는 변형된 동종이계 T 세포를 제공한다.
일부 구체예들에서, 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성(heterologous) 서열을 더 포함하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이다. 일부 구체예들에서, 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성 서열을 더 포함하고, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이다. 일부 구체예들에서, 상기 TCR 불변 도메인, 가령, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 불변 도메인 또는 상기 TCR 알파 불변 도메인 및 상기 TCR 베타 불변 도메인은 뮤린 TCR 불변 도메인, 가령, 뮤린 TCR 알파 불변 도메인, 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인이다. 일부 구체예들에서, 기능적으로 파괴된 내생성 TCR은 내생성 TCR 알파 쇄, 내생성 TCR 베타 쇄, 또는 내생성 TCR 알파 쇄 및 내생성 TCR 베타 쇄이다. 일부 구체예들에서, 기능적으로 파괴된 내생성 TCR은 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된다. 일부 구체예들에서, 상기 기능성 파괴는 내생성 TCR을 인코드하는 유전자의 파괴를 말한다. 일부 구체예들에서, 상기 내생성 TCR을 인코드하는 유전자의 파괴란 상기 내생성 TCR을 인코드하는 유전자 서열을 이 T 세포의 게놈으로부터 제거함을 말한다. 일부 구체예들에서, 상기 T 세포는 CD4 세포들, CD8 세포들, 나이브 T-세포들, 기억 줄기 T-세포들, 중추 기억 T-세포들, 이중 음성 T-세포들, 작동체 기억 T-세포들, 작동체 T-세포들, ThO 세포들, TcO 세포들, Th1 세포들, Tc1 세포들, Th2 세포들, Tc2 세포들, Th17 세포들, Th22 세포들, 알파/베타 T 세포들, 감마/델타 T 세포들, 천연 킬러 (NK) 세포들, 천연 킬러 T (NKT) 세포들, 조혈 줄기 세포들 및 다능성 줄기 세포들로부터 선택된 인간 T 세포다. 일부 구체예들에서, 상기 T 세포는 CD8+ 또는 CD4+ T 세포이다. 일부 구체예들에서, 상기 T 세포는 동종이계 T 세포이다. 일부 구체예들에서, 상기 변형된 T 세포는 세포내 신호생성 도메인의 양성 신호를 포함하는 제 2 폴리펩티드와 연합된, 저해성 분자의 적어도 일부분을 포함하는 제 1 폴리펩티드를 포함하는 저해성 분자를 인코드하는 핵산을 포함한다. 일부 구체예들에서, 상기 저해성 분자는 PD1의 적어도 일부분을 포함하는 제 1 폴리펩티드와 공동자극 도메인과 일차 신호생성 도메인을 포함하는 제 2 폴리펩티드를 포함한다.
또다른 측면에서, 본 명세서는 본원에서 기술된 변형된 T 세포; 그리고 약제학적으로 수용가능한 담체를 포함하는 약제학적 조성물을 제공한다.
또다른 측면에서, 본 명세서는 본원에서 기술된 변형된 T 세포를 만드는 방법, 상기 방법은 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자를 파괴하고; 이로써 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포가 만들어지고; 그리고 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포에 본원에서 기술된 재조합 핵산 또는 본원에서 기술된 벡터를 형질도입시키는 것을 포함한다.
일부 구체예들에서, 파괴는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 유전자를 표적으로 하는 뉴클레아제 단백질 또는 뉴클레아제 단백질을 인코딩하는 핵산 서열로 상기 T 세포를 형질도입시키는 것을 포함한다.
또다른 측면에서, 본 명세서는 본원에서 기술된 변형된 T 세포를 만드는 방법을 제공하며, 이 방법은 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포에 본원에서 기술된 재조합 핵산, 또는 본원에서 기술된 벡터를 형질도입시키는 것을 포함한다.
일부 구체예들에서, 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포이다. 일부 구체예들에서, 상기 T 세포는 인간 T 세포이다. 일부 구체예들에서, 내생성 TCR의 기능성 파괴 유전자를 함유하는 T 세포는 변형안된 대조군 T 세포의 것과 비교하였을 때, MHC-펩티드 복합체에 대한 결합이 감소되었다. 일부 구체예들에서, 상기 뉴클레아제는 메가뉴클레아제, 아연-핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 작동체 뉴클레아제 (TALEN), CRISPR/Cas 뉴클레아제, 또는 megaTAL 뉴클레아제이다. 일부 구체예들에서, 상기 재조합 핵산 또는 상기 벡터에 포함된 서열은 내생성 TCR 소단위 유전자의 절단 부위로 삽입되고, 이때 이 내생성 TCR 소단위 유전자로 이러한 서열의 삽입으로 인하여, 당해 내생성 TCR 소단위는 기능적으로 파괴된다. 일부 구체예들에서, 상기 뉴클레아제는 메가뉴클레아제다. 일부 구체예들에서, 상기 메가뉴클레아제는 제 1 소단위와 제 2 소단위를 포함하는데, 이때 상기 제 1 소단위는 인지 서열의 제 1 인지 절반-부위에 결합하고, 그리고 상기 제 2 소단위는 당해 인지 서열의 제 2 인지 절반-부위에 결합한다. 일부 구체예들에서, 상기 메가뉴클레아제는 링커를 포함하는 단일-쇄 메가뉴클레아제이며, 이때 상기 링커는 상기 제 1 소단위와 제 2 소단위를 공유적으로 연결한다.
또다른 측면에서, 본 명세서는 치료를 요하는 대상체의 암을 치료하는 방법을 제공하며, 이 방법은 당해 대상체에게 본원에 기술된 약제학적 조성물의 치료요법적으로 유효량을 투여하는 것을 포함한다.
또다른 측면에서, 본 명세서는 치료를 요하는 대상체의 암을 치료하는 방법을 제공하며, 상기 방법은 (a) 본원에 기술된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 담체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다.
또다른 측면에서, 본 명세서는 치료를 요하는 대상체의 암을 치료하는 방법을 제공하며, 상기 방법은 (a) 본원에 기술된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 담체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다.
일부 구체예들에서, 상기 변형된 T 세포는 동종이계 T 세포이다. 일부 구체예들에서, 변형안된 대조군 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 구체예들에서, 본원에 기술된 재조합 핵산, 또는 본원에 기술된 벡터를 포함하는 변형된 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 구체예들에서, 상기 방법은 상기 약제학적 조성물의 효과를 증가시키는 작용제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 구체예들에서, 상기 방법은 상기 약제학적 조성물와 연합된 하나 또는 그 이상의 부작용을 경감시키는 작용제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 구체예들에서, 상기 암은 고형 암, 림프종 또는 백혈병이다. 일부 구체예들에서, 상기 암은 신장 세포 암종, 유방암, 폐암, 난소암, 전립선암, 결장암, 자궁경부암, 뇌암, 간암, 췌장암, 콩팥 및 위암으로 구성된 군에서 선택된다. 일부 구체예들에서, 본원에서 기술된 TFP를 발현시키는 자가 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 구체예들에서, 상기 방법은 이식편 대 숙주 질환을 유도하지 않는다. 일부 구체예들에서, 상기 대상체는 본원에서 기술된 TFP를 발현시키는 자가 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 이식편 대 숙주 질환이 발생될 위험이 적다.
또다른 측면에서, 본 명세서는 약물로써 또는 약물 제조에 사용하는 용도로써 본원에서 기술된 재조합 핵산, 본원에서 기술된 벡터, 본원에서 기술된 변형된 T 세포, 또는 본원에 기술된 약제학적 조성물을 제공한다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) CD3 입실론, CD3 감마, CD3 델타, TCR 감마, TCR 델타, TCR 알파 또는 TCR 베타의 세포내 신호생성 도메인의 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체를 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 이때 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고 이때 상기 TFP는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 감마 또는 TCR 델타의 세포내 신호생성 도메인의 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 이때 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다.
한 구체예에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 델타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된다. 또다른 구체예에서, 상기 항원 결합 도메인 또는 리간드 결합 도메인을 인코딩하는 서열은 TCR 델타 불변 도메인 또는 이의 단편과 TCR 감마 불변 도메인 또는 이의 단편을 인코드하는 서열 모두에 작동가능하도록 연계된다. 또다른 구체예에서, 상기 세포내 신호생성 도메인은 CD3ε이다. 또다른 구체예에서, 상기 세포내 신호생성 도메인은 CD3γ이다. 또다른 구체예에서, 상기 재조합 핵산은 적어도 하나의 리더 서열과 적어도 하나의 링커를 더 포함한다. 또다른 구체예에서, 상기 재조합 핵산은 TCR 알파 불변 도메인의 일부분, TCR 베타 도메인의 일부분, 또는 이 둘 모두를 더 포함한다.
또다른 구체예에서, 상기 재조합 핵산 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRGC 유전자 서열을 포함한다.
또다른 구체예에서, 상기 재조합 핵산 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 TRGC 유전자 서열을 포함한다.
또다른 구체예에서, 상기 재조합 핵산 서열은 5'-3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열, 절단가능한 링커, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, 및 TRGC 유전자 서열을 포함한다.
또다른 구체예에서, 상기 재조합 핵산 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRGC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함한다.
또다른 구체예에서, 상기 재조합 핵산 서열은 5'-3' 방향으로, 제 1 리더 서열, 제 1 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열 또는 이의 단편, TRAC 유전자 서열 또는 이의 단편, 절단가능한 링커 서열, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, TRGC 유전자 서열 또는 이의 단편, 및 TRBC 유전자 서열 또는 이의 단편을 포함한다.
한 구체예에서, 상기 서열은 서열 식별 번호: 1에서 제시된 폴리펩티드를 인코드한다. 또다른 구체예에서, 상기 서열은 서열 식별 번호: 2에서 제시된 폴리펩티드를 인코드한다. 또다른 구체예에서, 상기 서열은 서열 식별 번호: 3에서 제시된 폴리펩티드를 인코드한다. 또다른 구체예에서, 상기 서열은 서열 식별 번호: 4에서 제시된 폴리펩티드를 인코드한다. 또다른 구체예에서, 상기 서열은 서열 식별 번호: 5에서 제시된 폴리펩티드를 인코드한다. 한 구체예에서, 상기 재조합 핵산은 TCR 알파 불변 도메인, TCR 베타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인 모두의 일부분 서열을 더 포함한다.
일부 경우들에서, 상기 결합 리간드는 상기 항체의 Fc 도메인에 결합할 수 있다. 일부 경우들에서, 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있다. 일부 경우들에서, 상기 결합 리간드는 IgG1 항체에 특이적으로 결합할 수 있다. 일부 경우들에서, 상기 항체 또는 이의 단편은 세포 표면 항원에 결합한다. 일부 경우들에서, 상기 항체 또는 이의 단편은 종양 세포의 표면 상에 있는 세포 표면 항원에 결합한다. 일부 경우들에서, 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 경우들에서, 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는다. 일부 경우들에서, 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함한다. 일부 경우들에서, 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함한다. 일부 경우들에서, 상기 결합 리간드는 인간 또는 인간화된 리간드이다. 일부 경우들에서, 상기 재조합 핵산은 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코드하는 핵산 서열을 더 포함한다. 일부 경우들에서, 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있다.
일부 구체예들에서, (a) (i) (1) TCR 세포외 도메인의 적어도 일부분, (2) 막경유 도메인, 및 (3) CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 감마 또는 TCR 델타의 세포내 신호생성 도메인의 자극 도메인을 포함하는 세포내 도메인을 포함하는 TCR 소단위, 그리고 (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 도메인을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열; 그리고 (b) TCR 불변 도메인을 인코드하는 서열을 포함하는 재조합 핵산이 본원에 기술되며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며; 이때 상기 TCR 소단위와 상기 항원 도메인은 작동가능하도록 연계되며, 이때 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 T 세포 안에서 발현될 때, TCR 복합체에 기능적으로 통합된다. 일부 경우들에서, 상기 항원 도메인은 리간드를 포함한다. 일부 경우들에서, 상기 리간드는 세포의 수용체에 결합한다. 일부 경우들에서, 상기 리간드는 세포 표면 상에 발현된 폴리펩티드에 결합한다. 일부 경우들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함한다. 일부 경우들에서, 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질이다. 일부 경우들에서, 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택된다. 일부 경우들에서, 상기 항원 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함한다. 일부 경우들에서, 상기 항원 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함한다. 일부 경우들에서, 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체이다. 일부 경우들에서, 상기 리간드 또는 이의 단편은 단량체 또는 이량체다. 일부 경우들에서, 상기 항원 도메인은 항체 또는 이의 단편을 포함하지 않는다. 일부 경우들에서, 상기 항원 도메인은 가변 영역을 포함하지 않는다. 일부 경우들에서, 상기 항원 도메인은 CDR을 포함하지 않는다. 일부 경우들에서, 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편이다.
일부 구체예들에서, 상기에서 개시된 재조합 핵산의 경우, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 동일한 핵산 분자 안에 함유된다. 일부 경우에서, 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자들 안에 함유된다. 일부 경우에서, 상기 TCR 소단위와 상기 항체 도메인, 상기 항원 도메인 또는 상기 결합 리간드 또는 이의 단편은 링커 서열에 의해 작동가능하도록 연계된다. 일부 경우들에서, 상기 링커 서열은 (G4S)n을 포함하고, 이때 n=1 ~ 4이다. 일부 경우들에서, 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 감마 또는 TCR 델타의 TCR 막경유 도메인이다. 일부 경우들에서, 상기 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파, 오로지 TCR 베타, 오로지 TCR 감마 또는 오로지 TCR 델타에서만 유래된다. 일부 경우에서, 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래된다. 일부 경우에서, 상기 TCR 세포외 도메인은 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함한다. 일부 경우에서, 상기 TCR 소단위는 TCR 알파 쇄, TCR 베타 쇄, TCR 감마 쇄, TCR 델타 쇄, CD3 제타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, CD45, CD4, CD5, CD8, CD9, CD16, CD22, CD33, CD28, CD37, CD64, CD80, CD86, CD134, CD137, CD154, 이의 기능적 단편들, 그리고 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 막경유 도메인을 포함하는 막경유 도메인을 포함한다. 일부 경우들에서, 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 TCR 세포내 도메인을 포함한다. 일부 경우에서, 상기 TCR 소단위는 4-1BB의 기능적 신호생성 도메인 및/또는 CD3 제타의 기능적 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 세포내 도메인을 포함한다. 일부 경우들에서, 상기 재조합 핵산은 공동-자극 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우에서, 상기 공동자극 도메인은 OX40, CD2, CD27, CD28, CDS, ICAM-1, LFA-1 (CD11a/CD18), ICOS (CD278), 그리고 4-1BB (CD137), 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 기능적 신호생성 도메인을 포함한다. 일부 경우에서, 상기 TCR 소단위는 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, Fc 입실론 수용체 1 쇄, Fc 입실론 수용체 2 쇄, Fc 감마 수용체 1 쇄, Fc 감마 수용체 2a 쇄, Fc 감마 수용체 2b1쇄, Fc 감마 수용체 2b2 쇄, Fc 감마 수용체 3a 쇄, Fc 감마 수용체 3b 쇄, Fc 베타 수용체 1 쇄, TYROBP (DAP12), CD5, CD16a, CD16b, CD22, CD23, CD32, CD64, CD79a, CD79b, CD89, CD278, CD66d, 이의 기능적 단편들, 그리고 이에 대하여 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 면역수용체 티로신-기반의 활성화 모티프(ITAM) 또는 이의 일부분을 포함하는 TCR 소단위의 ITAM을 포함한다. 일부 경우에서, 상기 ITAM은 CD3 감마, CD3 델타, 또는 CD3 입실론의 ITAM을 대체한다. 일부 경우들에서, 상기 ITAM은 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택되며, 그리고 CD3 제타 TCR 소단위, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, 그리고 CD3 델타 TCR 소단위로 구성된 군에서 선택된 상이한 ITAM을 대체한다. 일부 경우들에서, 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있다. 일부 경우들에서, (a) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 델타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; (b) 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 감마, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는 (c) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합된다. 일부 경우들에서, 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함한다. 일부 경우들에서, 상기 항체는 항체 단편이다. 일부 경우들에서, 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인이다. 일부 경우들에서, 인간 또는 인간화된 항원 결합 도메인을 포함하는 항체는 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-MUC16 결합 도메인, 항-IL13Rα2 결합 도메인, 항-CD22 결합 도메인, 항-PD-1 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 및 항-ROR-1 결합 도메인을 포함하는 군에서 선택된다. 일부 경우에서, 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택된다. 일부 경우들에서, 상기 핵산은 mRNA이다. 일부 경우에서, 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 이 재조합 핵산의 인코딩 서열에 존재하지 않는다. 일부 경우들에서, 상기 핵 유사체는 다음으로 구성된 군에서 선택된다: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트. 일부 경우들에서, 상기 재조합 핵산은 리더 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 프로모터 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 poly(A) 꼬리를 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 3'UTR 서열을 더 포함한다. 일부 경우들에서, 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산이다. 일부 경우들에서, 상기 핵산은 시험관내 전사된 핵산이다. 일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다. 일부 경우들에서, 상기 재조합 핵산은 TCR 알파 막경유 도메인을 인코딩하는 서열과 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함한다.
일부 구체예들에서, 본원에 기술된 상기 재조합 핵산을 포함하는 벡터가 본원에서 기술된다. 일부 경우들에서, 상기 벡터는 DNA, RNA, 플라스미드, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연합된 바이러스 벡터 (AAV), Rous 육종 바이러스 (RSV) 벡터, 또는 레트로바이러스 벡터로 구성된 군에서 선택된다. 일부 경우들에서, 상기 벡터는 AAV6 벡터이다. 일부 경우에서, 상기 벡터는 프로모터를 더 포함한다. 일부 경우들에서, 상기 벡터는 시험관내 전사된 벡터다.
일부 구체예들에서, 상기에서 기술된 재조합 핵산, 또는 상기에서 기술된 벡터를 포함하는 변형된 T 세포가 본원에서 기술되며; 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함한다. 일부 구체예들에서, 상기에서 기술된 핵산의 TFP를 인코딩하는 서열, 또는 상기에서 기술된 상기 TFP를 인코드하는 핵산의 서열에 의해 인코드된 TFP를 포함하는 변형된 T 세포를 본원에서 추가 개시하며, 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함한다. 상기에서 기술된 TFP를 인코딩하는 서열, 또는 상기에서 기술된 TFP를 인코드하는 핵산의 서열에 의해 인코드된 TFP를 포함하는 변형된 동종이계 T 세포를 본원에서 또한 기술한다. 일부 경우들에서, 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성 서열을 더 포함하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이다. 일부 경우들에서, 기능적으로 파괴된 내생성 TCR은 내생성 TCR 알파 쇄, 내생성 TCR 베타 쇄, 또는 내생성 TCR 알파 쇄 및 내생성 TCR 베타 쇄이다. 일부 경우들에서, 상기 기능적으로 파괴된 내생성 TCR은 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된다. 일부 경우에서, 상기 기능적 파괴란 상기 내생성 TCR을 인코드하는 유전자의 파괴를 말한다. 일부 경우들에서, 상기 내생성 TCR을 인코드하는 유전자의 파괴란 상기 내생성 TCR을 인코드하는 유전자 서열을 이 T 세포의 게놈으로부터 제거함을 말한다. 일부 경우들에서, 상기 T 세포는 인간 T 세포이다. 일부 경우에서, 상기 T 세포는 CD8+ T 세포, CD4+ T 세포, 나이브 T 세포, 기억 줄기 T 세포, 중추 기억 T 세포, 이중 음성 T 세포, 작동체 기억 T 세포, 작동체 T 세포, ThO 세포, TcO 세포, Th1 세포, Tc1 세포, Th2 세포, Tc2 세포, Th17 세포, Th22 세포, 감마 델타 T 세포, 천연 킬러 (NK) 세포, 천연 킬러 T (NKT) 세포, 조혈 줄기 세포, 또는 다능성 줄기 세포이다. 일부 경우들에서, 상기 T 세포는 CD8+ 또는 CD4+ T 세포이다. 일부 구체예들에서, 상기 T 세포는 CD4+CD8+ T 세포이다. 일부 경우들에서, 상기 T 세포는 동종이계 T 세포이다. 일부 경우들에서, 상기 변형된 T 세포들은 세포내 신호생성 도메인의 양성 신호를 포함하는 제 2 폴리펩티드와 연합된, 저해성 분자의 적어도 일부분을 포함하는 제 1 폴리펩티드를 포함하는 저해성 분자를 인코드하는 핵산을 더 포함한다. 일부 경우들에서, 상기 저해성 분자는 PD1의 적어도 일부분을 포함하는 제 1 폴리펩티드와 공동자극 도메인과 일차 신호생성 도메인을 포함하는 제 2 폴리펩티드를 포함한다.
일부 구체예들에서, (a) 본원의 변형된 T 세포들; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물들이 본원에서 개시된다.
일부 구체예들에서, 본 명세서의 변형된 T 세포를 만드는 방법이 본원에서 개시되는데, 이 방법은 다음을 포함한다: (a) TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자를 파괴하고; 이로 인하여 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포가 만들어지고; 그리고 (b) 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포로 본원에서 개시된 재조합 핵산, 또는 벡터를 형질도입시킨다. 일부 경우들에서, 파괴는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 유전자를 표적으로 하는 뉴클레아제 단백질 또는 뉴클레아제 단백질을 인코딩하는 핵산 서열로 상기 T 세포를 형질도입시키는 것을 포함한다. 일부 구체예들에서, 본 명세서의 변형된 T 세포를 만드는 방법이 본원에서 더 개시되는데, 이 방법은 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포로 본원에서 개시된 재조합 핵산, 또는 벡터를 형질도입시키는 것을 포함한다. 일부 경우들에서, 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포이다. 일부 경우들에서, 상기 T 세포는 인간 T 세포이다. 일부 경우들에서, 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포는 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된다. 일부 경우에서, 상기 뉴클레아제는 메가뉴클레아제, 아연-핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 작동체 뉴클레아제 (TALEN), CRISPR/Cas 뉴클레아제, 또는 megaTAL 뉴클레아제이다. 일부 경우에서, 상기 재조합 핵산 또는 상기 벡터에 포함된 서열은 내생성 TCR 소단위 유전자의 절단 부위로 삽입되고, 그리고 이때 이 내생성 TCR 소단위 유전자로 이러한 서열의 삽입으로 인하여 당해 내생성 TCR 소단위는 기능적으로 파괴된다. 일부 경우들에서, 상기 뉴클레아제는 메가뉴클레아제이다. 일부 경우들에서, 상기 메가뉴클레아제는 제 1 소단위와 제 2 소단위를 포함하는데, 이때 상기 제 1 소단위는 인지 서열의 제 1 인지 절반-부위에 결합하고, 그리고 상기 제 2 소단위는 당해 인지 서열의 제 2 인지 절반-부위에 결합한다. 일부 경우에서, 상기 메가뉴클레아제는 링커를 포함하는 단일-쇄 메가뉴클레아제이며, 이때 상기 링커는 상기 제 1 소단위와 제 2 소단위를 공유적으로 연결한다.
일부 구체예들에서, 치료를 요하는 대상체의 암을 치료하는 방법이 본원에서 개시되며, 상기 방법은 당해 대상체에게 본원에서 개시된 약제학적 조성물의 치료요법적으로 유효량을 투여하는 것을 포함한다. 일부 구체예들에서, 치료를 요하는 대상체의 암을 치료하는 방법을 또한 본원에서 개시하는데, 이 방법은 당해 대상체에게 (a) 본원에서 개시된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다. 일부 경우들에서, 상기 변형된 T 세포는 동종이계 T 세포이다. 일부 경우들에서, 변형안된 대조군 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 경우들에서, 본원에서 기술된 재조합 핵산, 또는 본원에서 기술된 벡터를 포함하는 변형된 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 경우들에서, 상기 방법은 상기 약제학적 조성물의 효과를 증가시키는 제제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 경우들에서, 상기 방법은 상기 약제학적 조성물와 연합된 하나 또는 그 이상의 부작용을 경감시키는 제제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 경우에서, 상기 암은 고형 암, 림프종 또는 백혈병이다. 일부 경우들에서, 상기 암은 신장 세포 암종, 유방암, 폐암, 난소암, 전립선암, 결장암, 자궁경부암, 뇌암, 간암, 췌장암, 콩팥 및 위암으로 구성된 군에서 선택된다.
일부 구체예들에서, 본원에서 개시된 재조합 핵산, 벡터, 변형된 T 세포, 또는 약제학적 조성물을 약물로써 또는 약물 제조에 사용하는 용도를 본원에서 개시한다.
변형된 T 세포
일부 구체예들에서, 본원에서 기술된 재조합 핵산, 또는 본원에서 기술된 벡터를 포함하는 변형된 T 세포가 본원에서 기술되며; 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함한다. 일부 구체예들에서, 본원에서 기술된 핵산의 TFP를 인코딩하는 서열, 또는 본원에서 기술된 핵산의 서열에 의해 인코드된 TFP를 포함하는 변형된 T 세포를 본원에서 또한 개시하며, 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함한다. 일부 구체예들에서, 본원에서 개시된 TFP를 인코딩하는 서열 또는 본원에서 개시된 핵산 서열에 의해 인코드된 TFP를 포함하는 변형된 동종이계 T 세포들이 본원에서 추가 개시된다.
일부 경우들에서, 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성 서열을 더 포함하며, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인, TCR 알파 불변 도메인 및 TCR 베타 불변 도메인, TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이다. 일부 경우들에서, 기능적으로 파괴된 내생성 TCR은 내생성 TCR 알파 쇄, 내생성 TCR 베타 불변 도메인, 내생성 TCR 알파 불변 도메인 및 내생성 TCR 베타 불변 도메인, 내생성 TCR 감마 쇄, 내생성 TCR 델타 쇄, 또는 내생성 TCR 감마 쇄 및 내생성 TCR 델타 쇄이다. 일부 경우들에서, 상기 기능적으로 파괴된 내생성 TCR은 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된다. 일부 경우에서, 상기 기능적 파괴란 상기 내생성 TCR을 인코드하는 유전자의 파괴를 말한다. 일부 경우들에서, 상기 내생성 TCR을 인코드하는 유전자의 파괴란 상기 내생성 TCR을 인코드하는 유전자 서열을 이 T 세포의 게놈으로부터 제거함을 말한다. 일부 경우들에서, 상기 T 세포는 인간 T 세포이다. 일부 경우들에서, 상기 T 세포는 CD8+ 또는 CD4+ T 세포이다. 일부 경우들에서, 상기 T 세포는 동종이계 T 세포이다. 일부 경우들에서, 상기 변형된 T 세포들은 세포내 신호생성 도메인의 양성 신호를 포함하는 제 2 폴리펩티드와 연합된, 저해성 분자의 적어도 일부분을 포함하는 제 1 폴리펩티드를 포함하는 저해성 분자를 인코드하는 핵산을 더 포함한다. 일부 경우들에서, 상기 저해성 분자는 PD1의 적어도 일부분을 포함하는 제 1 폴리펩티드와 공동자극 도메인과 일차 신호생성 도메인을 포함하는 제 2 폴리펩티드를 포함한다.
T 세포의 공급원
확장 및 유전자 변형에 앞서, 대상체로부터 T 세포의 공급원이 수득된다. 용어 "대상체"란 면역 반응이 유도될 수 있는 살아있는 유기체 (예를 들어, 포유류)가 내포되는 것으로 의도된다. 대상체의 예로는 인간, 개, 고양이, 생쥐, 쥐 및 이의 형질 전환 종이 있다. T 세포는 말초 혈액 단핵 세포, 골수, 림프절 조직, 제대혈, 흉선 조직, 감염 부위의 조직, 복수, 흉막 삼출액, 비장 조직 및 종양을 포함하는 다수의 공급원으로부터 얻을 수 있다. 본 명세서의 특정 측면들에서, 당업계에서 이용 가능한 임의의 수의 T 세포주가 사용될 수 있다. 본 명세서의 특정 측면들에서, 이를 테면, Ficoll™ 분리와 같은 당업자에게 공지된 임의의 수의 기술을 사용하여, 대상으로부터 수집된 혈액 단위로부터 T 세포를 수득할 수 있다. 하나의 바람직한 측면에서, 개체의 순환 혈액으로부터의 세포는 성분채집술(apheresis)에 의해 수득된다. 성분 채집 산물은 전형적으로 T 세포, 단핵구, 과립구, B 세포, 다른 유핵(nucleated) 백혈구, 적혈구 및 혈소판을 포함한 림프구를 함유한다. 하나의 측면에서, 성분 채집술에 의해 수집된 세포를 세척하여 혈장 분획(fraction)을 제거하고, 세포를 후속 처리 단계에 적합한 완충제 또는 배지에 넣을 수 있다. 본 명세서의 하나의 측면에서, 상기 세포들은 인산염 완충된 염수(PBS)로 세척된다. 대안적 측면에서, 상기 세척액은 칼슘이 부족하고, 마그네슘이 부족할 수 있거나, 또는 이들 모두 2가 양이온이 아닐지라도 많은 것이 부족할 수 있다. 칼슘이 없는 초기 활성화 단계는 확대된 (magnified) 활성화로 이어진다. 세척 단계가 제조업자의 지시에 따라 반-자동 "흐름-통과" 원심 분리기 (예를 들어, Cobe® 2991 세포 처리기, Baxter Oncology CytoMate™ 또는 Haemonetics® Cell Saver® 5)를 이용하여 당분야에 공지된 방법에 따라 이루어질 수 있음을 당업자는 용이하게 인지할 것이다. 세척 후, 이들 세포는 다양한 생체 적합성 완충제, 예를 들어, Ca-없는, Mg-없는 PBS, PlasmaLyte A 또는 완충액이 있거나 또는 없는 다른 식염수 용액에 재현탁될 수 있다. 대안적으로, 성분 채집 샘플에서 바람직하지 않은 성분들이 제거될 수 있고, 세포가 배양 배지에 직접 재현탁될 수 있다.
하나의 측면에서, T 세포는 적혈구를 용해시키고, 예를 들어, PERCOLL® 구배(gradient)를 통한 원심 분리 또는 역류 원심 분리 용리에 의해 단핵구를 고갈시킴으로써, 말초 혈액 림프구로부터 단리된다. T 세포의 특정 하위집단, 이를 테면, CD3+, CD28+, CD4+, CD8+, CD45RA+, 및 CD45RO+T 세포는 양성 또는 음성 선별 기술에 의해 추가 분리될 수 있다. 예를 들면, 하나의 측면에서, 원하는 T 세포의 양성 선별에 충분한 시간 동안 항-CD3/항-CD28 (가령, 3×28)-접합된 비드, 이를 테면 DYNABEADS® M-450 CD3/CD28 T와 항온처리함으로써, T 세포는 단리된다. 하나의 측면에서, 기간은 약 30 분이다. 추가 측면에서, 기간은 30 분 내지 36 시간, 또는 더 긴 시간 및 그 사이의 모든 정수 값 범위이다. 추가 측면에서, 기간은 적어도 1, 2, 3, 4, 5, 또는 6 시간이다. 여전히 또다른 바람직한 측면에서, 기간은 10 내지 24 시간이다. 하나의 측면에서, 상기 항온처리 기간은 24 시간이다. 다른 세포 유형과 비교하여, T 세포가 거의 없는 임의의 상황에서 T 세포를 단리하기 위해, 예를 들어, 종양 침윤 림프구 (TIL)를 종양 조직으로부터 또는 면역절충된(immunocompromised) 개체로부터 단리시키는 것은 더 긴 배양 기간이 사용될 수 있다. 또한, 더 긴 배양 시간의 사용은 CD8+ T 세포의 포획 효율을 증가시킬 수 있다. 따라서, T 세포가 CD3/CD28 비드에 결합하는 시간을 단순히 단축 또는 연장시킴으로써, 및/또는 (본 명세서에 추가로 기술 된 바와 같이) 비드에 대한 T 세포의 비를 증가 또는 감소시킴으로써, T 세포의 하위집단은 배양 개시 동안 또는 공정 동안 다른 시점에서 또는 이에 대해 우선적으로 선택되거나, 또는 반하여(against) 선택될 수 있다. 추가적으로, 비드 또는 다른 표면 상의 항-CD3 및/또는 항-CD28 항체의 비율을 증가시키거나 또는 감소시킴으로써, T 세포의 하위집단이 배양 개시 또는 다른 바람직한 시점에서 우선적으로 선택되거나, 또는 반하여(against) 선택될 수 있다. 당업자는 본 명세서의 내용에서 다수의 선택 라운드가 또한 사용될 수 있음을 인지할 것이다. 특정 측면들에서, 선택 절차를 수행하고, 활성화 및 확장 과정에서 "선택되지 않은(unselected)" 세포를 사용하는 것이 바람직할 수 있다. "선택되지 않은" 세포는 또한 추가 선택 라운드를 또한 거칠 수 있다.
음성 선택에 의한 T 세포 집단의 집중(enrichment)은 음성적으로 선택된 세포에 대하여 특유한 표면 마커를 지향하는 항체의 조합으로 달성될 수 있다. 하나의 방법은 음성으로 선택된 세포 상에 존재하는 세포 표면 마커에 대한 단일 클론 항체의 칵테일을 사용하는 음성 자성(magnetic) 면역흡착 또는 유세포 분석을 통한 세포 분류(sorting) 및/또는 선택법이다. 예를 들면, 음성 선택에 의해 CD4+ 세포를 집중되도록 하기 위해, 단일클론 항체 칵테일은 전형적으로 CD14, CD20, CD11b, CD16, HLA-DR 및 CD8에 대한 항체를 포함한다. 특정 측면들에서, 전형적으로 CD4+, CD25+, CD62Lhi, GITR+ 및 FoxP3+를 발현하는 조절 T 세포를 풍부하게 하거나 양성적으로 선택하는 것이 바람직할 수 있다. 대안으로, 특정 측면들에서, T 조절 세포는 항-C25 콘쥬게이트된 비드 또는 다른 유사한 선택 방법에 의해 고갈될 수 있다.
한 구체예에서, 하나 또는 그 이상의 IFNγ TNF-알파, IL-17A, IL-2, IL-3, IL-4, GM-CSF, IL-10, IL-13, 그랜자임(granzyme) B, 그리고 퍼포린(perforin), 또는 다른 적절한 분자들, 가령, 기타 사이토킨을 발현시키는 T 세포 집단이 선택될 수 있다. 세포 발현의 스크리닝 방법은 가령, PCT 공개 번호: WO 2013/126712에 기술된 방법에 의해 결정될 수 있다.
양성 또는 음성 선택에 의해 원하는 세포 집단을 단리하기 위해, 세포 및 표면 (예를 들어, 비드와 같은 입자)의 농도를 변화시킬 수 있다. 특정 측면들에서, 세포와 비드의 최대 접촉을 보장하기 위해 비드와 세포가 함께 혼합되는 부피를 상당히 감소시키는 것 (가령, 세포의 농도를 증가시키는 것)이 바람직할 수 있다. 예를 들면, 하나의 측면에서, 20 억개 세포/mL의 농도가 사용된다. 하나의 측면에서, 10 억개 세포/mL의 농도가 사용된다. 추가 측면에서, 1 억 개 이상의 세포/mL가 사용된다. 추가 측면에서, 10, 15, 20, 25, 30, 35, 40, 45 또는 5 천만 세포/mL의 세포 농도가 사용된다. 여전히 한 측면에서, 7천5백만개, 8천만개, 8천 5백만개, 9천만개, 9천5백만개 또는 1 억개 세포/mL의 세포 농도가 사용된다. 추가 측면들에서, 1억 2천 5백만 또는 1 억 5 천만 세포/mL의 농도가 사용될 수 있다. 높은 농도를 사용하면 세포 수율, 세포 활성화 및 세포 확장이 증가할 수 있다. 또한, 높은 세포 농도의 사용은 CD28-음성 T 세포와 같이 관심대상 표적 항원을 약하게 발현시킬 수 있거나 또는 많은 종양 세포가 존재하는 샘플 (가령, 백혈병 혈액, 종양 조직 등)로부터 약하게 발현될 수 있는 세포를 보다 효율적으로 포획할 수 있게 한다. 이러한 세포 집단은 치료적 가치를 가질 수 있고, 획득하는 것이 바람직할 것이다. 예를 들면, 고농도의 세포를 사용하면 일반적으로 더 약한 CD28 발현을 갖는 CD8+ T 세포를 보다 더 효율적으로 선택할 수 있다.
관련된 측면에서, 보다 낮은 농도의 세포를 사용하는 것이 바람직할 수 있다. T 세포와 표면 (예를 들어, 비드와 같은 입자)의 혼합물을 상당히 희석함으로써, 입자와 세포 사이의 상호 작용이 최소화된다. 이는 입자에 결합될 다량의 원하는 항원을 발현하는 세포를 선택한다. 예를 들면, CD4+ T 세포는 CD28을 더 높은 수준으로 발현시키고, 희석 농도에서 CD8+ T 세포보다 더 효율적으로 포획된다. 하나의 측면에서, 사용된 세포의 농도는 5x106/mL이다. 다른 측면들에서, 사용된 농도는 약 1x105/mL 내지 1x106/mL 및 그 사이의 임의의 정수 값일 수 있다. 다른 측면들에서, 세포는 2-10℃ 또는 실온에서 다양한 속도로 다양한 시간 길이 동안 회전자(rotator)에서 항온처리될 수 있다.
자극을 위한 T 세포는 또한 세척 단계 후에 동결될 수 있다. 이론에 결부되지 않고, 동결 및 후속 해동 단계는 세포 집단에서 과립구 및 어느 정도의 단핵구를 제거함으로써 보다 균일한 생성물을 제공한다. 혈장 및 혈소판을 제거하는 세척 단계 후, 세포는 동결 용액에 현탁될 수 있다. 많은 동결 용액 및 매개변수가 관련 기술 분야에 공지되어 있고, 이 문맥에서 유용할 수 있지만, 한 가지 방법은 20% DMSO 및 8% 인간 혈청 알부민을 함유하는 PBD, 또는 10% 덱스트란 40 및 5% 덱스트로스, 20% 인간 혈청 알부민 및 7.5% DMSO, 또는 31.25% Plasmalyte-A, 31.25% 덱스트로스 5%, 0.45% NaCl, 10% 덱스트란 40 및 5% 덱스트로스, 20% 인간 혈청 알부민, 및 7.5% DMSO를 함유하는 배양 배지, 또는 예를 들면, Hespan 및 PlasmaLyte A를 함유하는 적합한 세포 동결 배지를 이용하는 것과 관련되며, 그 다음 세포는 분당 1의 속도로 -80oC로 동결시키고, 액체 질소 저장 탱크의 증기 상(vapor phase)에 저장된다. 다른 제어된 동결 방법이 이용될 수 있고, 뿐만 아니라 -20℃에서 즉시 또는 액체 질소에서 제어되지 않는 동결이 이용될 수 있다. 특정 측면들에서, 동결보존된 세포를 본원에 기재된 바와 같이 해동시키고, 세척하고, 그리고 본 명세서의 방법을 이용하여 활성화 전에 실온에서 1 시간 동안 휴면(rest)시켰다.
본원에 기술된 바와 같은 확장된 세포가 필요할 수 있는 시간 이전에 대상으로부터 혈액 샘플 또는 성분 채집 산물의 수집이 또한 본 명세서의 내용에서 고려된다. 이와 같이, 확장될 세포의 공급원은 필요한 임의의 시점에 수집 될 수 있고, T 세포와 같은 바람직한 세포는 분리 및 동결되어, 본원에 기재된 것과 같은 T 세포로부터 혜택을 받을 수 있는 임의의 수의 질환 또는 상태를 위한 T 세포 요법에서 나중에 사용될 수 있다. 하나의 측면에서, 혈액 샘플 또는 성분 채집은 일반적으로 건강한 대상에서 채취된다. 특정 측면들에서, 혈액 샘플 또는 성분 채집은 질환이 발생할 위험이 있지만, 아직 질환이 발생하지 않은 일반적으로 건강한 대상으로부터 채취되며, 관심대상 세포는 분리되어 추후 사용을 위해 동결된다. 특정 측면들에서, T 세포는 팽창, 동결되며, 추후에 사용될 수 있다. 특정 측면들에서, 샘플은 본원에 기술된 바와 같은 특정 질환의 진단 직후, 그리나 임의의 치료에 앞서 환자로부터 수집된다. 추가 측면에서, 상기 세포는 하기 임의의 수의 관련 치료 양식에 앞서 대상으로부터 혈액 샘플 또는 성분 채집으로부터 단리된다: 나탈리주맙,에팔리주맙, 항바이러스제, 화학 요법, 방사선, 면역억제제, 예컨대 사이클로스포린, 아자티오프린, 메토트렉세이트, 미코페놀레이트, 항체, 또는 다른 면역절제(immunoablative) 제제, 이를 테면, 알렘투주맙(alemtuzumab), 항-CD3 항체, 사이토산, 플루다라빈, 사이클로스포린, 타크로리무스(tacrolimus), 라파마이신, 미코페놀 산, 스테로이드, 로미뎁신(romidepsin)과 같은 제제를 이용한 치료 및 조사(irradiation).
본 명세서의 추가 측면에서, T 세포는 대상체에서 기능적 T 세포가 남아있도록 처리를 한 후, 해당 환자로부터 직접 얻는다. 이와 관련하여, 특정 암 치료, 특히 면역계를 손상시키는 약물로 치료 후, 치료 직후 환자가 치료로부터 정상적으로 회복되는 기간 동안, 수득된 T 세포의 품질이 최적일 수 있거나, 또는 생체 외에서 확장하는 이들의 능력이 개선될 수 있다. 마찬가지로, 본원에 기재된 방법을 사용한 생체 외 조작 후, 이들 세포는 강화된 생착(engraftment) 및 생체 내 확장에 바람직한 상태일 수 있다. 따라서, 이러한 회복 단계 동안, T 세포, 수지상 세포 또는 조혈 계통의 다른 세포를 포함하는 혈액 세포를 수집하는 것이 본 명세서의 맥락 내에서 고려된다. 더욱이, 특정 측면들에서, 동원(mobilization) (예를 들어, GM-CSF에 의한 동원) 및 컨디셔닝 요법은 대상에서 특히, 치료 후 특정된 시간대(window of time) 동안 특정 세포 유형의 재-증식(repopulation), 재순환, 재생 및/또는 확장이 선호되는 상태를 창출하는데 이용될 수 있다. 예시적인 세포 유형에는 T 세포, B 세포, 수지상 세포 및 면역계의 다른 세포들이 내포된다.
T 세포의 활성화 및 확장
T 세포들은 예를 들면, U.S. 특허 번호 6,352,694; 6,534,055; 6,905,680; 6,692,964; 5,858,358; 6,887,466; 6,905,681; 7,144,575; 7,067,318; 7,172,869; 7,232,566; 7,175,843; 5,883,223; 6,905,874; 6,797,514; 6,867,041; 그리고 7,572,631에서 기술된 방법들을 일반적으로 이용하여 활성화되고, 확장될 수 있다.
일반적으로, 본 명세서의 T 세포들은 CD3/TCR 복합체 연합된 신호를 자극하는 작용제 및 T 세포 표면 상의 공동자극 분자를 자극하는 리간드가 부착된 표면과의 접촉에 의해 확장될 수 있다. 특히, T 세포 집단은 본원에 기술된 바와 같이, 예를 들어, 항-CD3 항체 또는 이의 항원 결합 단편과의 접촉에 의해, 또는 표면에 고정된 항-CD2 항체와의 접촉에 의해, 또는 칼슘 이오노포어와 함께 단백질 키나제 C 활성화제(가령, 브리오스태틴)과의 접촉에 의해 자극될 수 있다. T 세포의 표면에서 보조 분자의 공동-자극을 위해, 보조 분자에 결합하는 리간드가 사용된다. 예를 들면, T 세포의 집단은 T 세포의 증식을 자극하기에 적합한 조건 하에서 항-CD3 항체 및 항-CD28 항체와 접촉될 수 있다. CD4+ T 세포 또는 CD8+ T 세포의 증식을 자극하기 위하여, 항-CD3 항체 및 항-CD28 항체. 항-CD28 항체의 예로는 9.3, B-T3, XR-CD28 (Diaclone, Besancon, France)을 포함하며, 당분야에 흔히 공지된 다른 방법에서와 같이 이용될 수 있다 (Berg et al., Transplant Proc. 30(8):3975-3977, 1998; Haanen et al., J. Exp. Med. 190(9):13191328, 1999; Garland et al., J. Immunol. Meth. 227(1-2):53-63, 1999). T 세포는 항-CD3 및/또는 CD28 항체가 있거나 없는 사이토카인의 존재 하에 추가로 활성화되고, 확장될 수 있다. 예시적인 사이토킨에는 IL-2, IL-7, IL-15, 및 IL-21이 내포된다.
다양한 자극 시간에 노출된 T 세포들은 상이한 특성을 나타낼 수 있다. 예를 들면, 전형적인 혈액 또는 성분채집된 말초 혈액 단핵 세포 산물은 세포 독성 또는 억제제 T 세포 집단 (TC, CD8+)보다 큰 헬퍼 T 세포 집단 (TH, CD4+)을 갖는다. CD3 및 CD28 수용체를 자극함으로써 T 세포의 생체외 확장은 약 8 일-9 일 전, 주로 TH 세포로 구성되는 T 세포 집단을 생성하는 반면, 약 8 일-9 일 후, T 세포 집단은 점점 더 많은 TC 세포 집단을 포함한다. 따라서, 치료 목적에 따라, 주로 TH 세포들을 포함하는 T 세포 집단을 대상체에게 주입하는 것이 유리할 수 있다. 유사하게, TC 세포의 항원-특이적 하위세트가 분리된 경우, 이 하위세트를 더 크게 확장시키는 것이 유리할 수 있다.
또한, CD4 및 CD8 마커 이외에도, 다른 표현형 마커는 세포 확장 과정 동안 상당히 유의적으로, 그러나 상당부분 재현가능하게 변한다. 따라서, 이러한 재현성(reproducibility)은 특정 목적을 위해 활성화된 T 세포 생성물을 맞춤화하는 능력을 가능하게 한다.
항-CD19 항-BCMA, 항-CD22, 항-ROR1, 항-PD-1, 또는 항-BAFF, 항-MUC16, 항-메소텔린, 항-HER2, 항-PMSA, 항-CD20, 항-CD70, 항-GPC3, 항-Nectin-4, 항-Trop2, 또는 항-CD79b TFP가 일단 구축되면, 각종 검정을 이용하여 적절한 시험관내에서, 그리고 동물 모델에서 이 분자의 활성, 이를 테면, 항원 자극 후 T 세포들을 확장시키는 능력, 재-자극 없이 T 세포 확장을 유지하는 능력, 그리고 항-암 활성을 포함하나, 이에 국한되지 않는 활성을 평가할 수 있다. 항-CD19 항-BCMA, 항-GPC3, 항-Nectin-4, 항-Trop2, 항-CD22, 항-MSLN, 항-CD79B, 항-ROR1, 항-PD-1, 항-IL13Ra2, 항-PD-L1, 항-CD20, 항-CD70, 또는 항-BAFF 또는 BAFFR TFP의 효과를 평가하기 위한 검정은 하기에서 더 상세하게 기술된다.
일차 T 세포들에서 TFP 발현의 Western 블랏 분석을 이용하여 단량체 및 이량체 존재를 탐지할 수 있다(가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009) 참고). 매우 간략하게, 상기 TFPs를 발현시키는 T 세포들 (CD4+ 및 CD8+ T 세포의 1:1 혼합물)은 10일 이상 동안 시험관내에서 확장되고, 용해 후, 환원 조건에서 SDS-PAGE를 거친다. TFPs는 TCR 쇄에 대한 항체를 이용한 웨스턴 블랏팅에 의해 탐지된다. 동일한 T 세포 하위세트를 비-환원 조건 하에서 SDS-PAGE 분석에 사용하여 공유적 이량체 형성을 평가할 수 있다.
항원 자극 후,TFP+ T 세포들의 시험관내 확장은 유동세포분석에 의해 측정될 수 있다. 예를 들면, CD4+ 및 CD8+ T 세포의 혼합물은 알파CD3/알파CD28 그리고 APCs에 의해 자극을 받은 후, 프로모터의 제어 하에 분석될 GFP를 발현시키는 렌티바이러스성 벡터로 형질도입된다. 예시적인 프로모터에는 CMV IE 유전자, EF-1알파, 유비퀴틴 C, 또는 포스포글리세로키나제 (PGK) 프로모터들이 내포된다. GFP 형광은 CD4+ 및/또는 CD8+ T 세포 하위세트에서 배양 6 일차에 유동세포분석에 의해 평가된다 (가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009)). 대안으로, CD4+ 및 CD8+ T 세포들의 혼합물은 0 일차에 알파CD3/알파CD28 피복된 자성 비드로 자극을 받고, 1일차에 2A 리보솜 스키핑(skipping) 서열을 이용하여 eGFP와 함께 TFP를 발현시키는 바이시트론성(bicistronic) 렌티바이러스성 벡터를 이용하여 TFP로 형질도입된다. 배양물은 세척 후, 항-CD3 및 항-CD28 항체 (K562-BBL-3/28) 존재 하에서, TAA+ K562 세포들 (K562-TAA), 야생형 K562 세포들 (K562 야생형) 또는 hCD32 및 4-1BBL을 발현시키는 K562 세포들로 다시-자극된다. 외생성 IL-2는 이틀 마다 100 IU/mL로 이 배양물에 추가된다. GFP+ T 세포들은 비드-기반의 카운팅을 이용하여 유동세포분석에 의해 계수된다 (가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009) 참고).
재-자극 없이, 유지된 TFP+T세포 확장을 또한 측정할 수 있다(가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009) 참고). 간략하게 설명하자면, 평균 T 세포 용적 (fl)은 0 일차에 알파CD3/알파CD28 피복된 자성 비드로 자극 후, 1일차에 지정 TFP로 형질도입 후, Coulter Multisizer III 입자 계수기를 이용하여 배양 8일차에 측정된다.
TFP-T 활성을 측정하기 위하여, 동물 모델이 또한 이용될 수 있다. 예를 들면, 면역결핍 마우스에서 일차 인간 프레-B ALL를 치료하기 위한 인간 CD19-특이적 TFP+ T 세포들을 이용한 이종이식편 모델이 이용될 수 있다(가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009) 참고). ALL 확립 후, 마우스를 처리군으로 무작위화시킨다. 상이한 수의 공작된 T 세포들을 B-ALL를 품고 있는 NOD/SCID/γ-/- 1:1 비율로 마우스에게 공동주사한다. T 세포 주사 후, 다양한 시점에서 마우스 비장 DNA에서 각 벡터의 복제 수를 평가한다. 매주 간격으로 백혈병에 대하여 동물을 평가한다. 말초 혈액 CD19+ B-ALL 모세포 수는 알파CD19-제타 TFP+ T 세포들 또는 모의(mock)-형질도입된 T 세포들이 주사된 마우스에서 측정된다. 그룹에 대한 생존 곡선은 로그-등급(log-rank) 테스트를 사용하여 비교된다. 추가적으로, NOD/SCID/γ-/- 마우스에게 T 세포 주사-후 4 주 시점에, 절대 말초 혈액 CD4+ 및 CD8+ T 세포 수를 또한 분석할 수도 있다. 마우스에게 백혈병 세포를 주사하고, 3 주 후 eGFP에 연계된 TFP를 인코딩하는 바이시스트론성 렌티바이러스성 벡터에 의해 TFP가 발현되도록 공작된 T 세포를 주입한다. T 세포는 주사-전, 모의-형질도입된 세포와 혼합하여 45-50% 유입 GFP+ T 세포로 정상화되고, 유동세포 분석으로 확인된다. 1-주 간격으로 백혈병에 대하여 동물을 평가한다. 상기 TFP+ T 세포 그룹에 대한 생존 곡선은 로그-등급(log-rank) 테스트를 사용하여 비교된다.
투여량 의존적 TFP 처리 반응이 평가될 수 있다(가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009) 참고). 예를 들면, 21 일 차에 TFP T 세포, 동등한 수의 모의-형질도입된 T 세포를 주사한 마우스에서, 또는 T 세포를 주사하지 않은 마우스에서 백혈병이 확립된 후, 35-70 일차에 말초 혈액을 수득한다. 각 그룹의 마우스는 말초 혈액 CD19+ ALL 모세포를 계수하기 위해, 무작위 채혈한 다음, 35 일과 49 일 시점에 죽였다. 나머지 동물은 57 일과 70 일차에 평가된다.
세포 증식 및 사이토킨 생산에 대한 평가는 이미 기술된 바 있는데, 가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009)에서 기술되고 있다. 간단히 말해서, TFP-중재된 증식의 평가는 미량적정 플레이트 상에서 세척된 T 세포에 종양 연합된 항원 (TAA, 가령, CD19) CD19 (K19) 또는 CD32 및 CD137 (KT32-BBL)을 발현하는 K562 세포와 혼합하는데, 이때 T 세포: K562의 최종 비율은 2:1이 되도록 혼합된다. K562 세포들은 사용하기 전, 감마-방사선으로 조사된다(irradiated). 항-CD3 (클론 OKT3) 및 항-CD28 (클론 9.3) 단일클론성 항체들은 T 세포 증식을 자극하기 위한 양성 대조군으로 작용하는 KT32-BBL 세포들와 배양하기 위하여 추가되는데, 그 이유는 이들 신호가 생체외에서 장기적(long-term) CD8+ T 세포 확장을 뒷받침하기 때문이다. 제조업체에서 설명한대로, T 세포는 CountBright™ 형광 비드 (Invitrogen) 및 유동세포 분석을 사용하여 배양물에서 계수된다. TFP+ T 세포들은 eGFP-2A 연계된 TFP-발현시키는 렌티바이러스성 벡터들과 함께 공작된 T 세포를 이용한 GFP 발현에 의해 식별된다. GFP를 발현시키지 않는 TFP+ T 세포들의 경우, TFP+ T 세포들은 바이오티닐화된 재조합 CD19 단백질 및 2 차 아비딘-PE 콘쥬게이트로 탐지된다. T 세포들 상에서 CD4+ 및 CD8+ 발현은 특이적 단일클론성 항체들 (BD Biosciences)을 이용하여 또한 동시에 탐지된다. 제조업체의 지침에 따라, 인간 TH1/TH2 사이토킨 혈구계산(cytometric) 어레이 키트 (BD Biosciences)를 사용하여, 재-자극 후 24 시간 동안 수집된 상청액에서 사이토킨을 측정한다. 형광은 FACScalibur™ 유동세포 분석기 (BD Biosciences)를 사용하여 평가되고, 데이터는 제조업체의 지침에 따라 분석된다.
세포독성은 표준 51Cr-방출 검정에 의해 평가될 수 있다 (가령, Milone et al., Molecular Therapy 17(8): 1453-1464 (2009) 참고). 표적 세포들 (K562 계통 및 일차 프로-B- ALL 세포들)은 51Cr (NaCrO4으로써, New England Nuclear)와 함께, 37 ℃에서 2 시간 동안 로딩되는데, 이때 빈번한 교반이 가해지며, 완전 RPMI에서 2회 세척한 후, 미량적정 플레이트 상에 도말된다. 작동체 T 세포들은 작동체 세포:표적 세포(E:T)의 비율을 다양하게 하면서, 완전 RMPI가 있는 웰에서 표적 세포들과 혼합된다. 오로지 배지만을 함유하거나 (자발적 방출, SR) 또는 Triton-X 100 세제의 1% 용액 (전체 방출, TR)을 함유하는 추가 웰들 또한 준비된다. 37 ℃에서 4 시간 동안 배양한 후, 각 웰로부터 상층액을 수거한다. 그 다음, 방출된 51Cr은 감마 입자 계수기 (Packard Instrument Co., Waltham, Mass.)를 이용하여 측정된다. 각 조건은 적어도 세 번 수행되며, 용해 비율은 공식을 사용하여 산출된다: 용해 %=(ER-SR)/(TR-SR), 여기에서 ER은 각 실험 조건에서 평균 방출된 51Cr를 나타낸다.
이미징 기술은 종양이 있는 동물 모델에서 TFPs의 특정 트래피킹(trafficking) 및 증식의 평가에 사용할 수 있다. 이러한 검증은 가령, Barrett et al., Human Gene Therapy 22:1575-1586 (2011)에서 기술된다. NOD/SCID/γc-/- (NSG) 마우스에게 IV로 Nalm-6 세포들 (ATCC® CRL-3273™)을 주사하고, 7 일-후 상기 TFP 구조체들로 전기천공 후 4시간 시점에, T 세포들을 주사한다. 상기 T 세포들은 반딧불이 루시페라제를 발현하기 위해 렌티바이러스 구조체로 안정적으로 형질감염되고, 생물발광에 대하여 생쥐의 영상을 찍는다. 대안으로, Nalm-6 이종이식 모델에서 TFP+ T 세포의 단일 주사에 대한 치료 효능 및 특이성은 다음과 같이 측정할 수 있다: NSG 마우스에게서 반딧불이 루시퍼라제를 안정적으로 발현시키기 위해 형질도입된 Nalm-6을 주사하고, 7 일 후 TAA-TFP로 전기천공된 T 세포를 일회 꼬리 정맥 주사한다. 주사 후 다양한 시점에서 동물을 촬영한다. 예를 들면, 5 일 (치료 전 2 일) 및 8 일 (TFP+ PBL 후 24 시간)시점에 대표적인 마우스에서 반딧불이 루시퍼라제 양성 백혈병의 광자-밀도 열 지도를 만들 수 있다.
본원의 실시예 섹션에서 기술된 것들, 뿐만 아니라 당분야에 공지된 것들을 비롯한 기타 검정을 또한 이용하여, 본원에서 기술된 항-CD19, 항-BCMA,, 항-CD22, 항-MSLN, 항-CD79B, 항-GPC3, 항-Nectin-4, 항-Trop2, 항-IL13Ra2, 항-PD-1, 항-ROR1, 항-PD-L1, 또는 항-BAFF 또는 BAFFR TFP 구조체들을 평가할 수 있다.
약제학적 조성물
일부 구체예들에서, (a) 본원의 변형된 T 세포들; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물들이 본원에서 개시된다. 이러한 조성물은 중성 완충 식염수, 인산염 완충 식염수 및 이와 유사한 것들과 같은 완충액; 포도당, 만노스, 수크로스 또는 덱스트란, 만니톨과 같은 탄수화물; 단백질; 글리신과 같은 폴리펩티드 또는 아미노산; 항산화제; EDTA 또는 글루타티온과 같은 킬레이트제; 어쥬번트 (가령, 수산화 알루미늄); 그리고 보존제를 포함할 수 있다. 본 명세서의 조성물은 하나의 측면에서, 정맥내 투여용으로 제형화된다.
본 명세서의 약제학적 조성물은 치료 (또는 예방)할 질환에 적합한 방식으로 투여될 수 있다. 투여량과 빈도는 환자의 상태, 환자의 질환의 유형 및 중증도와 같은 요인에 따라 결정되지만, 적절한 용량(dosages)은 임상 시험에 의해 결정될 수 있다.
한 구체예에서, 상기 약제학적 조성물에는 오염물질, 가령, 엔도톡신, 미코플라스마, 복제 컴피턴트(competent) 렌티바이러스 (RCL), p24, VSV-G 핵산, HIV gag, 항-CD3/항-CD28 피복된 잔류 비드, 마우스 항체들, 푸울된(pooled) 인간 혈청, 소 혈청 알부민, 소 혈청, 배양 배지 성분들, 벡터 패치지 세포 또는 플라스미드 성분들, 박테리아 및 곰팡이로 구성된 군에서 선택된 오염물질이 실질적으로 없거나, 또는 가령, 탐지불가능한 수준으로 존재한다. 한 구체예에서, 상기 박테리아는 알칼리게네스 패칼리스(Alcaligenes faecalis), 칸디다 알비칸스(Candida albicans), 대장균(Escherichia coli), 헤모필러스 인플루엔자(Haemophilus influenza), 나이세리아 메닝지티드스(Neisseria meningitides), 슈도모나스 에어루기노사(Pseudomonas aeruginosa), 스타필로코커스 아우레우스(Staphylococcus aureus), 스트렙토코커스 뉴모니아(Streptococcus pneumonia), 그리고 스트렙토코커스 피오게네스(Streptococcus pyogenes) 그룹 A로 구성된 군에서 선택된 적어도 하나의 박테리아다.
"면역학적으로 유효량", "항-종양 유효량", "종양-억제 유효량", 또는 "치료요법적 양"이 표시될 경우, 투여될 본 명세서의 조성물의 정확한 양은 환자 (대상체)의 연령, 체중, 종양 크기, 감염 또는 전이 정도 그리고 상태에 따른 개인차를 고려하여 의사에 의해 결정될 수 있다. 본원에서 기술된 T 세포들을 포함하는 약제학적 조성물은 체중 kg당 104 ~ 109 개 세포, 일부 경우에서 체중 kg 당 105 ~ 106 개 세포의 용량으로 투여될 수 있다고 일반적으로 말할 수 있고, 이때 이들 범위 안의 모든 정수 범위도 포함된다. T 세포 조성물은 또한 이러한 투여량으로 여러 번 투여될 수 있다. 면역요법에서 일반적으로 알려진 주입 기술을 사용하여 이들 세포를 투여할 수 있다(가령, Rosenberg et al., New Eng. J. Med. 319:1676, 1988 참고).
특정 측면들에서, 활성화된 T 세포를 대상체에게 투여한 다음, 후속적으로 혈액을 다시 채취하고 (또는 성분채집술을 수행하고), 본 개시 내용에 따라 이로부터 T 세포를 활성화시키고, 이러한 활성화된, 그리고 확장된 T 세포를 환자에게 재-주입하는 것이 바람직할 수 있다. 이 프로세스는 몇 주마다 여러 번 수행될 수 있다. 특정 측면들에서, T 세포는 10cc ~ 400cc의 채혈로 활성화될 수 있다. 특정 측면들에서, T 세포들은 20 cc, 30 cc, 40 cc, 50 cc, 60 cc, 70 cc, 80 cc, 90 cc, 또는 100 cc의 채혈로 활성화된다.
당해 조성물의 투여는 에어로졸 흡입, 주사, 복용(ingestion), 투입(transfusion), 착상(implantation) 또는 이식(transplantation)을 비롯한 임의의 편리한 방식으로 수행될 수 있다. 본원에서 기술된 조성물은 환자에게 동맥을 경유하여(transarterially), 피하(subcutaneously), 피내(intradermal), 종양내, 마디내(intranodally), 골수내, 근육내, 정맥내 (i.v.) 또는 복강내로 투여될 수 있다. 하나의 측면에서, 본 명세서의 T 세포 조성물은 피내 또는 피하 주사에 의해 환자에게 투여된다. 하나의 측면에서, 본 명세서의 T 세포 조성물은 i.v. 주사에 의해 투여된다. 상기 T 세포의 조성물은 종양, 림프절, 또는 감염 부위에 바로 주사될 수 있다.
특정 예시적인 측면에서, 대상체들은 백혈구성분채집술(leukapheresis)을 겪을 수 있고, 이때 관심 대상의 세포들, 가령, T 세포들을 선별 및/또는 단리시키기 위하여, 백혈구를 수집하고, 농축시키고, 또는 생체외 감손된다(depleted). 이들 T 세포 단리물(isolates)은 당업계에 공지된 방법에 의해 확장될 수 있고, 본 명세서의 하나 또는 그 이상의 TFP 구조체가 도입될 수 있도록 처리되어, 이로 인하여 본 명세서의 변형된 T-T 세포가 탄생할 수 있다. 이를 필요로 하는 대상체는 후속적으로 고용량 화학 요법에 이어, 말초 혈액 줄기 세포 이식에 의한 표준 치료를 받을 수 있다. 특정 측면들에서, 이식 후 또는 이식과 동시에, 대상체는 본 명세서의 확장 변형된 T 세포를 주입받게 된다. 추가 측면에서, 확장된 세포는 수술 전 또는 후에 투여된다.
환자에게 투여되는 상기 치료의 용량은 치료될 병태의 정확한 성질 및 치료를 받는 대상자에 따라 달라질 수 있다. 인간 투여를 위한 용량 조정(scaling)은 당업계에서 인정하는 관행에 따라 수행될 수 있다. 예를 들면, 알렘투주맙의 투여량은 일반적으로 성인 환자의 경우 일반적으로 1 일 ~ 30 일 동안 매일 1 ~ 약 100mg 범위로 투여된다. 일부 경우, 하루 최대 40mg까지 더 많은 용량을 사용할 수 있지만, 바람직한 일일 투여량은 하루에 1 ~ 10mg이다 (U.S. 특허 번호 6,120,766에서 기술됨).
한 구체예에서, 상기 TFP는 가령, 시험관내 전사를 이용하여 T 세포 내로 도입되며, 그리고 대상체 (가령, 인간)는 본 명세서의 TFP T 세포들을 최초 투여받고, 그리고 후속적으로 본 명세서의 TFP T 세포의 한번 또는 그 이상의 투여를 제공받으며, 이때 이러한 한번 하나 또는 그 이상의 후속 투여는 앞서 받은 투여 후 15 일 이내, 가령, 14일, 13일, 12일, 11일, 10일, 9일, 8일, 7일, 6일, 5일, 4일, 3일, 또는 2 일 이내에 투여된다. 한 구체예에서, 본 명세서의 TFP T 세포들의 한 번 이상의 투여는 주당 당해 대상체에게 (가령, 인간)투여되는데, 가령, 본 명세서의 TFP T 세포들은 주당 2회, 3회, 또는 4회 투여된다. 한 구체예에서, 상기 대상체 (가령, 인간 대상체)는 주당 한 번 이상의 TFP T 세포들을 투여받고(가령, 주당 2회, 3회, 또는 4회 투여) (이를 또한 본원에서는 주기(cycle)로 칭함), 이어서 TFP T 세포 투여가 없이 한 주를 보내고, 그리고 상기 TFP T 세포들의 한번 또는 그 이상의 추가 투여 (가령, 상기 TFP T 세포들을 주당 한 번 이상)를 당해 대상체에게 제공한다. 또다른 구체예에서, 상기 대상체 (가령, 인간 대상체)는 일회 이상의 주기로 TFP T 세포들을 제공받고, 이때 각 주기 사이의 기간은 10일, 9일, 8일, 7일, 6일, 5일, 4일, 또는 3 일 미만이다. 한 구체예에서, 상기 TFP T 세포들은 주당 3회 투여를 위하여 격일로 투여된다. 한 구체예에서, 본 명세서의 TFP T 세포들은 적어도 2주, 3주, 4주, 5주, 6주, 7주, 8주, 9주 또는 그 이상 주 동안 투여된다.
한 측면에서, CD19 TFP T 세포들은 렌티바이러스성 바이러스성 벡터들, 이를 테면, 렌티바이러스를 이용하여 생성된다. 생성된 TFP-T 세포들은 안정적인 TFP 발현을 가질 것이다.
하나의 측면에서, TFP T 세포들은 형질도입 후, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15 일 동안 TFP 벡터를 일시적으로 발현시킨다. TFPs의 일시작 발현은 RNA TFP 벡터 운반에 영향을 받을 수 있다. 하나의 측면에서, 상기 TFP RNA는 상기 T 세포로 전기천공에 의해 형질도입된다.
TFP를 일과적으로 발현시키는 T 세포 (특히 TFP T 세포를 품고 있는 뮤린 scFv을 이용)를 사용하여 치료중인 환자에서 발생할 수 있는 잠재적인 문제는 다중 치료 후 과민증이다.
이 이론에 얽매이지 않고, 그러한 과민 반응은 체액 성 항-TFP 반응, 즉 항-IgE 아이소타입을 갖는 항-TFP 항체를 발달시키는 환자에 의해 야기될 수 있다고 본다. 환자의 항체 생산 세포는 항원 노출이 10 일에서 14 일 사이에있을 때 IgG 아이소타입 (과민증를 유발하지 않음)에서 IgE 아이소타입으로 클래스 전환을 겪는 것으로 보인다.
환자가 일시적 TFP 요법 (가령, RNA 형질 도입에 의해 생성된 것) 동안, 항-TFP 항체 반응을 생성할 위험이 높은 경우, TFP T 세포 주입 휴지기는 10 ~ 14 일 이상 지속되지 않아야 한다.
변형된 T 세포들을 만드는 방법
일부 구체예들에서, 본 명세서의 변형된 T 세포를 만드는 방법들이 본원에서 개시되는데, 이 방법은 다음을 포함한다: (a) TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 감마 쇄, TCR 델타 쇄 또는 이의 임의의 조합을 인코드하는 내생성 TCR 유전자를 파괴하고; 이로 인하여 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포가 만들어지고; 그리고 (b) 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포로 본원의 재조합 핵산, 또는 본원에서 개시된 벡터를 형질도입시킨다. 일부 경우들에서, 파괴는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 유전자를 표적으로 하는 뉴클레아제 단백질 또는 뉴클레아제 단백질을 인코딩하는 핵산 서열로 상기 T 세포를 형질도입시키는 것을 포함한다.
일부 구체예들에서, 본 명세서의 변형된 T 세포를 만드는 방법들이 본원에서 더 개시되는데, 이 방법은 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포로 본원에서 개시된 재조합 핵산, 또는 본원에서 개시된 벡터를 형질도입시키는 것을 포함한다. 일부 경우들에서, 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포이다.
일부 경우들에서, 상기 T 세포는 인간 T 세포이다. 일부 경우들에서, 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포는 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된다.
일부 경우들에서, 상기 뉴클레아제는 메가뉴클레아제, 아연-핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 작동체 뉴클레아제 (TALEN), CRISPR/Cas 뉴클레아제, CRISPR/Cas 니카제, 또는 megaTAL 뉴클레아제이다. 일부 경우에서, 상기 재조합 핵산 또는 상기 벡터에 포함된 서열은 내생성 TCR 소단위 유전자의 절단 부위로 삽입되고, 그리고 이때 이 내생성 TCR 소단위 유전자로 이러한 서열의 삽입으로 인하여 당해 내생성 TCR 소단위는 기능적으로 파괴된다. 일부 경우들에서, 상기 뉴클레아제는 메가뉴클레아제이다. 일부 경우들에서, 상기 메가뉴클레아제는 제 1 소단위와 제 2 소단위를 포함하는데, 이때 상기 제 1 소단위는 인지 서열의 제 1 인지 절반-부위에 결합하고, 그리고 상기 제 2 소단위는 당해 인지 서열의 제 2 인지 절반-부위에 결합한다. 일부 경우에서, 상기 메가뉴클레아제는 링커를 포함하는 단일-쇄 메가뉴클레아제이며, 이때 상기 링커는 상기 제 1 소단위와 제 2 소단위를 공유적으로 연결한다.
유전자 편집 기술
일부 구체예들에서, 본원에서 개시되는 변형된 T 세포들은 유전자 편집 기술, 이를 테면, 클러스트화된 규칙적으로 공간을 둔(clustered regularly interspaced) 짧은 팔린드롬 반복부(CRISPR®, 가령, US 특허 번호 8,697,359 참고), 전사 활성화제-유사 작동체 (TALE) 뉴클레아제 (TALENs, 가령, U.S. 특허 번호 No. 9,393,257 참고), 메가뉴클레아제 (12 내지 40개 염기쌍의 이중-가닥으로된 DNA 서열을 포함하는 큰 인지부위를 갖는 엔도데옥시리보뉴클레아제), 아연 핑거 뉴클레아제 (ZFN, 가령, Urnov et al., Nat. Rev. Genetics (2010) v11, 636-646 참고), 또는 megaTAL 뉴클레아제 (메가뉴클레아제 TAL 반복부에 메가 뉴클레아제가 융합된 단백질) 방법을 이용하여 공작된다. 이러한 방식으로, 키메라 구조체는 배좌(conformation) 또는 신호 전달 능력과 같은 각 소단위의 바람직한 특성이 복합되도록 설계될 수 있다. Sander & Joung, Nat. Biotech. (2014) v32, 347-55; 그리고 June et al., 2009 Nature Reviews Immunol. 9.10: 704-716을 또한 참고, 이들 각각은 본원의 참고자료에 편입됨. 일부 구체예들에서, TFP 소단위의 하나 또는 그 이상의 세포외 도메인, 막경유 도메인, 또는 세포질 도메인은 천연 TCR 소단위 도메인의 하나 이상의 측면을 갖도록 공작된다 (가령, 키메라로).
인간 게놈을 영구적으로 변경시키고, 질환 관련 유전자에 부위-특이적 게놈 변형을 도입시키는 기술의 최근 발달은 치료 응용의 토대가 된다. 이러한 기술은 이제 흔히 "게놈 편집"으로 알려져 있다.
TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코딩하는 내생성 TCR 유전자는 본원에서 기술된 변형된 세포 (가령, 변형된 T 세포)에서 비활성화될 수 있다. 상기 비활성화에는 게놈 유전자 좌의 파괴, 유전자 침묵, 전사의 억제 또는 감소, 또는 해독의 억제 또는 감소가 내포될 수 있다. 상기 내생성 TCR 유전자는 예를 들면, 저해성 핵산, 이를 테면, siRNA 및 shRNA에 의해 침묵화될 수 있다. 상기 내생성 TCR 유전자의 해독은 저해성 핵산, 이를 테면, microRNA에 의해 억제될 수 있다. 일부 구체예들에서, 내생성 TCR 유전자를 파괴하기 위해 유전자 편집 기술이 사용된다. 일부 구체예들에서, 언급된 내생성 TCR 유전자는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드한다. 일부 구체예들에서, 유전자 편집 기술은 내생성 TCR 유전자에서 여러 게놈 유전자좌를 동시에 파괴할 수 있는 다중 게놈 편집을 위한 길을 열어준다. 일부 구체예들에서, 다중 게놈 편집 기술은 내생성 TCR 및/또는 인간 백혈구 항원 (HLAs) 및/또는 예정된 세포 사멸 단백질 1 (PD1) 및/또는 기타 유전자의 발현이 부족한 유전자-파괴된 T 세포를 생성하는데 적용된다.
현행 유전자 편집 기술은 메가뉴클레아제, 아연-핑거 뉴클레아제 (ZFN), TAL 작동체 뉴클레아제 (TALEN), 그리고 클러스트화된 규칙적으로 공간을 둔 짧은 팔린드롬 반복부 (CRISPR)/CRISPR-연합된 (Cas) 시스템을 포함한다. 이들 네 가지 주요 유전자-편집 기술은 사용자-정의 DNA 서열 결합, 이중-가닥 DNA 파손(break) (DSB)을 중재함에 있어서 공통 작용 모드를 공유한다. 그 다음, DSB는 비-상동성 단부 연결 (NHEJ) 또는 (공여자 DNA가 존재할 때) 상동성 재조합 (HR)-공여자 DNA 단편으로부터 상동성 서열을 도입시키는 사건-에 의해 복구될 수 있다. 추가적으로, 니카제 뉴클레아제는 단일-가닥 DNA 파손 (SSB)을 만든다. DSBs는 단일 가닥 DNA 편입 (ssDI) 또는 단일 가닥 주형 복구 (ssTR), 공여자 DNA로부터 상동성 서열을 도입시키는 사건-에 의해 복구될 수 있다.
게놈 DNA의 유전적 변형은 관심대상의 유전자좌(locus)의 DNA 서열을 인지하도록 공작된 부위-특이적, 희귀-절단(rare-cutting) 엔도뉴클레아제를 사용하여 수행될 수 있다. 공작된, 부위-특이적 엔도뉴클레아제를 만드는 방법들은 당분야에 공지되어 있다. 예를 들면, 아연-핑거 뉴클레아제 (ZFNs)는 게놈에 있는 사전결정된 부위들을 인지하고, 이를 절단하도록 공작될 수 있다. ZFNs는 Fok1 제한효소에 융합된 아연 핑거 DNA-결합 도메인을 포함하는 키메라 단백질이다. 상기 아연 핑거 도메인은 합리적 또는 실험적 수단을 통해 재-설계되어, 사전결정된 DNA 서열 - 18개 염기쌍에 결합하는 단백질을 생산할 수 있다. Fok1 뉴클레아제에 이렇게 공작된 단백질 도메인이 융합됨으로써, 게놈-수준 특이성을 갖는 DNA 파손을 표적으로 하는 것이 가능하다. ZFNs는 광범위한 진핵 유기체에서 유전자의 추가, 제거 및 치환을 표적으로 하는데 상당히 이용되어 왔었다(Durai et al. (2005), Nucleic Acids Res 33, 5978에서 검토됨). 유사하게, 게놈 DNA에서 특정 부위를 절단하기 위해, TAL-작동체 뉴클레아제 (TALENs)가 만들어질 수 있다. ZFN과 같이, TALEN은 Fok1 뉴클레아제 도메인에 융합된 공작된, 부위-특이적 DNA-결합 도메인을 포함한다 (Mak et al. (2013), Curr Opin Struct Biol. 23:93-9에서 검토됨). 이 경우, 그러나, 상기 DNA 결합 도메인은 TAL-작동체 도메인의 텐덤(tandem) 어레이를 포함하는데, 이들 각각은 단일 DNA 염기쌍을 특이적으로 인지한다. 콤팩트 TALENs는 이량체화 요구를 회피하기 위한 대체 앤도뉴클레아제 구조를 갖는다 (Beurdeley et al. (2013), Nat Commun. 4: 1762). 콤팩트 TALEN은 I-TevI 귀소 앤도뉴클레아제로부터 기인된 뉴클레아제 도메인에 융합된 공작된, 부위-특이적 TAL-작동체 DNA-결합 도메인을 포함한다. Fok1과는 달리, I-TevI는 이중-가닥 DNA 파손을 만들기 위하여 이량체화를 요구하지 않고, 따라서 콤팩트 TALEN는 단량체로 기능한다.
CRISPR/Cas9 시스템 기반의 공작된 앤도뉴클레아제는 당분야에 또한 공지되어 있다 (Ran et al. (2013), Nat Protoc. 8:2281-2308; Mali et al. (2013), Nat Methods 10:957-63). CRISPR 유전자-편집 기술은 앤도뉴클레아제 단백질로 구성되는데, 이의 DNA-표적화 특이성 및 절단 활성은 짧은 가이드 RNA 또는 듀플렉스(duplex) crRNA/TracrRNA에 의해 프로그래밍될 수 있다. CRISPR 앤도뉴클레아제는 두 성분을 포함한다: (1) 카스파제 작동체 뉴클레아제, 전형적으로 미생물 Cas9; 그리고 (2) 상기 뉴클레아제를 게놈의 관심 부위로 지향시키는 18 내지 20개의 뉴클레오티드 표적화 서열을 포함하는 짧은 "가이드 RNA" 또는 RNA 듀플렉스. 동일한 세포에서 다중 가이드 RNAs를 발현시키는데, 이들 각각은 상이한 표적화 서열을 갖고 있음으로써, 게놈에서 다중 부위로 DNA 파손을 동시에 표적화시키는 것이 가능하다(복합(multiplex) 게놈 편집).
당분야에는 두 가지 클래스의 CRISPR 가 공지되어 있는데(Adli (2018) Nat. Commun. 9:1911), 이들 각각은 다중 CRISPR 타입을 함유한다. 클래스 1은 타입 I과 타입 III CRISPR 시스템을 함유하는데, 이들은 고세균류(Archaea)에서 흔히 찾을 수 있다. 그리고, 클래스 II는 타입 II, IV, V, 그리고 VI CRISPR 시스템을 함유한다. 비록 가장 광범위하게 이용되는 CRISPR/Cas 시스템은 타입 II CRISPR-Cas9 시스템이지만, CRISPR/Cas 시스템은 게놈 편집을 위하여 연구자들에 의해 용도변경되었다. 10가지 이상의 상이한 CRISPR/Cas 단백질들이 최근 수년 동안 리모델링되었다 (Adli (2018) Nat. Commun. 9:1911). 그중에서, 이를 테면, 악시도-아미노코커스(Acid-aminococcus) 종 (AsCpf1) 및 란치노스피라세 박테리움(Lachnospiraceae bacterium) (LbCpf1)으로부터 유래된 Cas12a (Cpf1) 단백질들이 특히 주목된다.
귀소 앤도뉴클레아제는 자연-발생적 뉴클레아제 군으로써 식물 및 곰팡이의 게놈에서 흔히 발견되는 15-40개 염기-쌍 절단 부위를 인지한다. 이들은 기생충 DNA 요소들, 이를 테면 그룹 1 자가-스플라이싱(self-splicing) 인트론 및 인테인(inteins)과 빈번하게 연합된다. 그들은 세포 DNA 복구 기전을 동원하는 염색체에서 이중-가닥 파손을 생성함으로써, 숙주 게놈의 특정 위치에서 상동성 재조합 또는 유전자 삽입을 자연스럽게 촉진시킨다 (Stoddard (2006), Q. Rev. Biophys. 38: 49-95). 특이적 아미노산 치환은 귀소 뉴클레아제의 DNA 절단 특이성을 재-프로그램할 수 있다(Niyonzima (2017), Protein Eng Des Sel. 30(7): 503-522). 메가뉴클레아제 (MN)는 박테리아성 귀소 앤도뉴클레아제로부터 유래되고, 독특한 표적 부위를 위하여 공작된, 선천적 뉴클레아제활서을 갖는 단량체 단백질이다(Gersbach (2016), Molecular Therapy. 24: 430-446). 일부 구체예들에서, 메가뉴클레아제는 공작된 I-CreI 귀소 엔도뉴클레아제다. 다른 구체예들에서, 메가뉴클레아제는 공작된 I-SceI 귀소 엔도뉴클레아제다.
언급된 4가지 주요 유전자 편집 기술에 추가하여, 메가뉴클레아제, ZFNs, 그리고 TALENs의 융합을 포함하는 키메라 단백질들은 ZFNs 및 TALENs의 결합 친화력과 메가뉴클레아제의 절단 특이성의 장점을 취하는 새로운 단량체 효소를 만들기 위하여 공작되었다(Gersbach (2016), Molecular Therapy. 24: 430-446). 예를 들면, megaTAL는 단일 키메라 단백질로써, 메가뉴클레아제의 높은 절단 효능을 갖추고, TALENs으로부터 다루기 용이한(easy-to-tailor) DNA 결합 도메인의 조합이다.
유전자 편집 기술을 실행하기 위하여, 상기 뉴클레아제, 그리고 CRISPR/ Cas9 시스템의 경우, gRNA는 관심대상 세포로 효과적으로 전달될 필요가 있을 수 있다. 전달 방법, 이를 테면 물리적 방법, 화학적 방법, 그리고 바이러스성 방법들이 당분야에 또한 공지되어 있다 (Mali (2013). Indian J. Hum. Genet. 19: 3-8.). 일부 경우에서, 물리적 전달 방법은 전기천공, 현미주사, 또는 탄도(ballistic) 입자의 사용을 포함하나, 이에 국한되지 않은 방법에서 선택될 수 있다. 다른 한편으로, 화학적 전달 방법은 복합체 분자들, 이를 테면 인산칼슘, 지질, 또는 단백질의 사용을 필요로 한다. 일부 구체예들에서, 바이러스성 전달 방법은 바이러스들, 이를 테면 아데노바이러스, 렌티바이러스, 그리고 레트로바이러스를 포함하나, 이에 국한되지 않는 바이러스를 사용한 유전자 편집 기술에 적용된다.
예로써, TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코딩하는 내생성 TCR 유전자 (가령, TRAC 유전자좌 또는 TRBC 유전자좌)는 CRISPR/Cas9 시스템에 의해 비활성화될 수 있다. TRAC 좌를 비활성화시키는데(가령, 파괴시키는데) 이용된 gRNA는 서열 식별 번호: 196을 포함할 수 있다. TRBC 좌를 파괴시키는데 이용된 gRNA는 서열 식별 번호: 197을 포함할 수 있다.
CTCGACCAGCTTGACATCAC (서열 식별 번호: 196).
ACACTGGTGTGCCTGGCCAC (서열 식별 번호: 197).
치료 방법
일부 구체예들에서, 치료를 요하는 대상체의 암을 치료하는 방법들이 본원에서 개시되며, 상기 방법은 당해 대상체에게 본원에서 개시된 약제학적 조성물들의 치료요법적으로 유효량을 투여하는 것을 포함한다. 일부 구체예들에서, 치료를 요하는 대상체의 암을 치료하는 방법들을 본원에서 더 개시하는데, 이 방법은 당해 대상체에게 (a) 본원에서 개시된 방법에 따라 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물을 투여하는 것을 포함한다.
일부 경우들에서, 상기 변형된 T 세포는 동종이계 T 세포이다. 일부 경우들에서, 변형안된 대조군 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다. 일부 경우들에서, 본원에서 기술된 재조합 핵산, 또는 본원에서 기술된 벡터를 포함하는 변형된 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출된다.
일부 경우들에서, 상기 방법은 상기 약제학적 조성물의 효과를 증가시키는 제제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다. 일부 경우들에서, 상기 방법은 상기 약제학적 조성물와 연합된 하나 또는 그 이상의 부작용을 경감시키는 제제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함한다.
일부 경우에서, 상기 암은 고형 암, 림프종 또는 백혈병이다. 일부 경우들에서, 상기 암은 신장 세포 암종, 유방암, 폐암, 난소암, 전립선암, 결장암, 자궁경부암, 뇌암, 간암, 췌장암, 콩팥 및 위암으로 구성된 군에서 선택된다.
본 명세서는 세포 요법 유형을 포함하는데, 여기에서 T 세포들은 TFP 및 TCR 감마 및/또는 델타 불변 도메인을 발현시키도록 유전적으로 변형되며, 이런 변형된 T 세포는 이를 필요로 하는 수령자에게 주입된다. 이렇게 주입된 세포는 수령자의 종양 세포를 사멸시킬 수 있다. 항체 요법과 달리, 변형된 T 세포들은 생체내에서 복제가능하여 장기적으로 지속되며, 이로써 지속적인 종양 관리가 유도될 수 있다. 다양한 측면들에서, 당해 환자에게 투여된 상기 T 세포들 또는 이들의 자손들은 당해 환자에게 이 T 세포를 투여한 후, 이 환자에서 적어도 4 개월, 5 개월, 6 개월, 7 개월, 8 개월, 9 개월, 10 개월, 11 개월, 12 개월, 13 개월, 14 개월, 15 개월, 16 개월, 17 개월, 18 개월, 19 개월, 20 개월, 21 개월, 22 개월, 23 개월, 2 년, 3 년, 4 년, 또는 5 년 동안 지속된다.
본 명세서는 세포 요법 유형을 또한 포함하는데, 여기에서 T 세포들은 TFP 및 TCR 감마 및/또는 델타 불변 도메인을 일과적으로 발현시키도록, 가령, 시험관내 전사된 RNA에 의해 변형되며, 이런 변형된 T 세포는 이를 필요로 하는 수령자에게 주입된다. 이렇게 주입된 세포는 수령자의 종양 세포를 사멸시킬 수 있다. 따라서, 다양한 측면들에서, 상기 환자에게 투여된 T 세포들은 이 환자에게 상기 T 세포를 투여한 후, 1 개월 미만, 가령, 3 주, 2 주, 또는 1 주 동안 존재한다.
임의의 특정 이론에 결부되지 않고, 상기 변형된 T 세포들에 의해 유도된 항-종양 면역 반응은 활성 또는 수동적(passive) 면역 반응일 수 있으며, 또는 대안으로 직접 면역 반응 대비(vs) 간접 면역 반응일 수 있다.
하나의 측면에서, 본 명세서의 인간 변형된 T 세포들은 포유류에서 생체외 면역화 및/또는 생체내 요법을 위한 백신 타입일 수 있다. 하나의 측면에서, 상기 포유류는 인간이다.
생체외 면역화에 있어서, 포유류에게 상기 세포를 투여하기 전, 다음중 적어도 하나가 발생된다: i) 상기 세포들의 확장, ii) TFP 및 TCR 감마 및/또는 델타 불변 도메인을 인코딩하는 핵산을 상기 세포들에게 도입, 또는 iii) 상기 세포들의 저온보존.
생체외 과정은 당분야에 잘 공지되어 있고, 하기에서 더 상술된다. 간략하게 설명하자면, 세포들을 포유류 (가령, 인간)로부터 단리시키고, 본원에서 기술한 벡터로 유전적으로 변형된다 (가령, 시험관내에서 형질도입 또는 형질감염됨). 상기 변형된 T 세포를 포유류 수령자에게 투여하여 치료요법적 이익을 제공할 수 있다. 상기 포유류 수령자는 인간일 수 있고, 상기 변형된 세포는 당해 수령자의 자가조직일 수 있다. 대안으로, 상기 세포들은 당해 수령자에 대하여 동종이계, 유전적동계(syngeneic) 또는 이종발생적(xenogeneic)일 수 있다.
조혈 줄기 및 선조 세포들의 생체외 확장 과정은 U.S. 특허 번호 5,199,942에서 기술되며(본원의 참고자료에 편입됨), 본 명세서의 세포에 적용될 수 있다. 다른 적합한 방법들이 당분야에 공지되어 있고, 따라서, 본 명세서는 상기 세포외 확장을 위한 임의의 특정 방법에 국한되지 않는다. 간략하게 설명하자면, T 세포의 세포외 배양 및 확장은 다음을 포함한다: (1) 포유류의 말초 혈액 수거물 또는 골수 절편(explants)으로부터 CD34+ 조혈 줄기 및 이의 선조 세포들을 수거하고; 그리고 (2) 이러한 세포들을 생체외에서 확장시킨다. U.S. 특허 번호 5,199,942에서 기술된 세포 성장 인자에 추가로, 다른 인자들, 이를 테면 flt3-L, IL-1, IL-3 및 c-kit 리간드를 이들 세포의 배양 및 확장에 이용할 수 있다.
생체외 면역화에 있어서 세포-기반 백신을 이용하는 것에 추가로, 본 명세서는 환자에서 항원에 대항하여 지향된 면역 반응을 유도하기 위한 생체내면역화를 위한 조성물 및 방법을 또한 제공한다.
일반적으로, 본원에서 기술된 바와 같이 활성화되고, 확장된 상기 세포들을 면역절출된 개체에서 발생되는 질환의 치료 및 예방에 이용할 수 있다.
본 명세서의 변형된 T 세포들은 단독으로 투여되거나, 또는 희석제와 조합하여, 및/또는 기타 성분들, 이를 테면, IL-2 또는 기타 사이토킨 또는 다른 세포 집단과 조합된 약제학적 조성물로 투여될 수 있다.
조합 요법(Combination Therapies)
본원에서 기술된 변형된 T 세포는 공지의 다른 제제 및 요법과 조합하여 이용될 수 있다. "조합(in combination)"하여 투여된다라는 것은 본원에서 사용된 바와 같이, 두 가지(또는 그 이상의) 상이한 치료가 장애로 인한 고통을 받는 대상의 과정 동안 당해 대상체에게 전달되는데, 가령, 이 대상체가 장애로 진단받은 후, 그리고 이 장애게 완치되거나, 또는 제거되기 전, 또는 다른 이유로 인하여 치료가 중단되기 전, 두 가지 또는 그 이상의 치료는 당해 대상체에게 전달된다라는 의미다. 일부 구체예들에서, 하나의 치료 전달이 두 번째의 전달이 시작될 때 여전히 진행중이므로, 투여 측면에서 볼 때, 중첩된다. 이것은 때때로 본원에서 "동시(simultaneous)" 또는 "공존(concurrent) 전달"로 지칭된다. 다른 구체예들에서, 한 가지 치료의 전달은 다른 치료의 전달이 시작되기 전에 종료된다. 어느 경우이건 일부 구체예들에서, 이 치료는 조합 투여로 인하여 더 효과적이다. 예를 들면, 두 번째 치료가 더 효과적인데, 가령, 두 번째 치료를 덜 받으면 등가의 효과를 보이며, 또는 두 번째 치료는 첫 번째 치료가 없는 상태에서 두 번째 치료가 투여되거나, 또는 첫 번째 치료에서 유사한 상황이 보이는 경우보다 증상을 더 많이 감소시킨다. 일부 구체예들에서, 전달은 증상의 감소 또는 장애와 관련된 기타 매개 변수가 다른 치료가 없는 상태에서 전달되는 한 치료로 관찰되는 것보다 더 크다. 두 치료의 효과는 부분적으로 가산적일 수 있거나, 완전히 가산적이거나, 또는 가산적인 경우 보다 클 수 있다. 전달은 전달된 첫 번째 치료의 효과가 두 번째가 전달될 때 여전히 검출가능하도록 할 수 있다.
일부 구체예들에서, 상기 "적어도 하나의 추가 치료요법제"에는 변형된 T 세포가 내포된다. 동일한 또는 상이한 표적 항원들, 또는 이러한 동일한 표적 항원 상의 동일한 또는 상이한 에피토프에 결합하는 다중 TFPs를 발현시키는 T 세포를 또한 제공한다. T 세포들의 제 1 하위세트는 제 1 TFP 및 TCR 감마 및/또는 델타 불변 도메인을 발현시키고, T 세포들의 제 2 하위세트는 제 2 TFP 및 TCR 감마 및/또는 델타 불변 도메인을 발현시키는, T 세포 집단이 또한 제공된다.
본원에서 기술된 변형된 T 세포 및 적어도 하나의 추가 치료요법제는 동일한 조성물에서 동시 투여되거나, 또는 별도의 조성물로 순차적으로 투여될 수 있다. 순차적 투여의 경우, 본원에서 기술된 변형된 T 세포를 우선 투여하고, 추가 제제는 두 번째로 투여하거나, 또는 투여 순서는 뒤바뀔 수 있다.
추가 측면들에서, 본원에서 기술된 변형된 T 세포는 외과술, 화학요법, 방사능, 면역억제제(이를 테면 사이클로스포린, 아자티오프린, 메토트렉세이트, 미코페놀레이트, 및 타클로리무스), 항체들, 또는 다른 면역절제제(immunoablative)(이를 테면 알렘투주맙), 항-CD3 항체들 또는 다른 항체 요법, 사이톡신, 플루다라빈, 사이클로스포린, 타크로리무스, 라파마이신, 미코페놀산, 스테로이드, 로미셉신, 사이토킨, 그리고 조사(irradiation), 펩티드 백신(이를 테면, Izumoto et al., 2008 J. Neurosurg. 108:963-971에서 기술된 것들)과 조합된 치료 섭생에 이용될 수 있다.
한 구체예에서, 상기 대상체에게 변형된 T 세포의 투여와 연합된 부작용을 감소 또는 개선시키는 물질이 투여될 수 있다. 변형된 T 세포의 투여와 연합된 부작용에는 사이토킨 방출 증후군 (CRS), 그리고 혈구식작용성 림프조직구증식(hemophagocytic lymphohistiocytosis (HLH)-일명 대식세포 활성화 증후군 (MAS)-이 내포되나, 이에 국한되지 않는다. CRS 증상에는 고열, 메쓰꺼움, 일시적 저혈압, 저산소증, 그리고 이와 유사한 것들이 내포된다. 따라서, 본 명세서에서 개시된 방법들은 본원에서 기술된 변형된 T 세포를 대상체에게 투여하고, 변형된 T 세포 치료로 인간 가용성 인자의 상승된 수준을 관리하는 물질을 추가 투여하는 것을 포함한다. 한 구체예에서, 상기 대상체에서 상승된 가용성 인자는 IFNγ, TNFα, IL-2 및 IL-6중 하나 또는 그 이상이다. 따라서, 이러한 부작용을 치료하기 위하여 투여되는 작용제는 이들 가용성 인자 하나 또는 그 이상을 중화시키는 작용제일 수 있다. 이러한 작용제에는 스테로이드, TNFα의 억제제, 그리고 IL-6의 억제제가 내포되나, 이에 국한되지 않는다. TNFα 억제제의 예는 에타너셉트(entanercept)이다. IL-6 억제제의 예는 토실리주밥(tocilizumab) (toc)이다.
한 구체예에서, 상기 대상체에게 변형된 T 세포의 활성을 강화시키는 물질이 투여될 수 있다. 예를 들면, 한 구체예에서, 상기 작용제는 저해성 분자를 억제하는 작용제일 수 있다. 일부 구체예들에서, 저해성 분자들, 가령, 예정된 사멸 1 (PD1)은 변형된 T 세포의 면역 작동체 반응을 탑재하는 능력을 감소시킬 수 있다. 저해성 분자들의 예로는 PD1, PD-L1, CTLA4, TIM3, LAG3, VISTA, BTLA, TIGIT, LAIR1, CD160, 2B4 및 TGFR 베타가 내포된다. 가령, DNA, RNA 또는 단백질 수준에서 억제함으로써 저해성 분자의 억제로 변형된 T 세포 수행능을 최적화시킬 수 있다. 구체예들에서, 저해성 핵산, 가령, 저해성 핵산, 가령, dsRNA, 가령, siRNA 또는 shRNA를 이용하여, 상기 TFP-발현시키는 세포에서 저해성 분자 발현을 억제시킬 수 있다. 구체예에서, 상기 억제제는 shRNA이다. 구체예에서, 상기 저해성 분자는 변형된 T 세포 안에서 억제된다. 이들 구체예에서, 상기 저해성 분자의 발현을 억제시키는 dsRNA 분자는 성분, 가령, 상기 TFP의 모든 성분을 인코드하는 핵산에 연계된다. 한 구체예에서, 저해성 신호의 억제제는 가령, 저해성 분자에 결합하는 항체 또는 항체 단편일 수 있다. 예를 들면, 상기 제제는 PD1, PD-L1, PD-L2 또는 CTLA4 (가령, 이필리무맙 (일명, MDX-010 및 MDX-101, 그리고 Yervoy®로 시판됨; Bristol-Myers Squibb; 프레멜리무맙 (Pfizer의 IgG2 단일클론성 항체, 기존 티실리무맙, CP-675,206으로 알려짐))에 결합하는 항체 또는 항체 단편일 수 있다. 구체예에서, 상기 작용제는 TIM3에 결합하는 항체 또는 항체 단편이다. 구체예에서, 상기 작용제는 LAG3에 결합하는 항체 또는 항체 단편이다.
일부 구체예들에서, 변형된 T 세포의 활성을 강화시키는 작용제는 가령, 제 1 도메인과 제 2 도메인을 포함하는 융합 단백질일 수 있고, 이때 상기 제 1 도메인은 저해성 분자, 또는 이의 단편이며, 그리고 제 2 도메인은 양성 신호와 연합된 폴리펩티드, 가령, 본원에서 기술된 세포내 신호생성 도메인을 포함하는 폴리펩티드이다. 일부 구체예들에서, 상기 양성 신호와 연합된 폴리펩티드에는 CD28, CD27, ICOS의 공동자극 도메인, 가령, CD28, CD27 및/또는 ICOS의 세포내 신호생성 도메인, 및/또는 가령, 본원에서 기술된, 가령, CD3 제타의 일차 신호생성 도메인이 내포될 수 있다. 한 구체예에서, 상기 융합 단백질은 상기 TFP를 발현시켰던 동일한 세포에 의해 발현된다. 또다른 구체예에서, 상기 융합 단백질은 세포, 가령, 항-TAA TFP를 발현시키지 못하는 T 세포에 의해 발현된다.
실시예
본 발명은 다음의 실험 실시예들을 참고하여 더 설명된다. 이들 실시예는 오로지 설명을 위한 것이며, 다른 언급이 없는 한, 본 발명의 범위를 제한시키는 것으로 간주되어서는 안된다. 따라서, 본 발명은 어떠한 경우에도 다음의 실시예들로 국한되는 것으로 간주되지 않아야 하며, 오히려 본 명세서에서 제공되는 교시의 결과로써 자명하게 되는 임의의 그리고 모든 변이를 포괄하는 것으로 간주되어야 한다. 추가 설명없이도, 당업자는 전술한 설명 및 다음의 예시적인 실시예를 이용하여 본 발명의 화합물들을 만들고 이용하며, 청구된 방법을 실시할 수 있을 것이다. 다음의 작업 실시예는 본 발명의 다양한 측면을 특이적으로 지적하며, 어떠한 방식으로도 명세서의 나머지 내용을 제한하는 것으로 간주되어서는 안된다.
실시예들의 배경
T-세포 수용체 (TCR)는 이량체 TCRα/β, CD3γ/ε, CD3δ/ε 및 동종이량체 CD3ζ/ζ의 복합체에 의해 형성된다. 일부 특정 T 세포들에서, TCRα/β 대신 TCRγ/δ이 발현되어, 기능성 TCR이 형성된다. TCRα/β/γ/δ는 모든 T-세포에 공통적인 불변 도메인, 그리고 항원에 특이적인 가변 도메인을 보유한다. TRAC, TRBC, TRGC 및 TRDC 유전자는 차례로, TCRα, TCRβ, TCRγ 및 TCRδ의 불변 C-말단 영역을 인코드한다. 이들 분자 사이의 높은 구조적 상동성에도 불구하고, TCRα는 TCRβ와만 쌍을 이루고, TCR γ는 TCRδ와만 쌍을 이룬다. 이로써, TCR 복합체는 α/β T 세포들에서 TCRα/β와 함께 형성되거나, 또는 γ/δT 세포에서 TCRγ/δ와 함께 형성된다.
상기 TCRα/β/γ/δ 불변 영역(들)의 파괴로 TCR 단백질(들)이 상기 세포 표면으로 전좌(translocation)되는 것이 차단된다. 따라서, 상기 TCR 수용체 복합체의 어셈블리가 억제된다. TCRα 또는 TCRβ의 전좌 손상만으로도 TCR α/β T 세포에서 전체 TCR 수용체의 어셈블리가 억제된다. 유사하게, TCRγ 또는 TCRδ의 전좌 손상만으로도 TCRγ/δ T 세포에서 전체 TCR 수용체의 어셈블리가 억제된다. 따라서, 상기 TCR 복합체의 비활성화는 클러스트화된 규칙적으로 공간을 둔 짧은 팔린드롬 반복부 (CRISPR) 방법, 전사 활성화제-유사 작동체 뉴클레아제 (TALENs), 아연 핑거 뉴클레아제 또는 메가뉴클레아제를 이용하는 유전자 편집 방법으로 TRAC 또는 TRBC 유전자를 표적화함으로써 실행될 수 있다. 그러나, CD3ε 또는 CD3γ 또는 CD3δ 융합 단백질들에 기반된 TFP T 세포들은 기능적 TCR 복합체로의 통합을 위하여 TCRα/β 또는 TCRγ/δ의 표면 발현을 필요로 한다.
미스매치된 HLA 분자 또는 동계 항원 (가령, 항원 제시 세포들 상에 있는 주요 조직접합성 복합체 (MHC)에 의해 제시되는 항원들의 인지)에 의해 동종반응성 공여자 T 세포의 표면 상에 상기 TCR 복합체의 활성화로 원치않은 효과, 이를 테면, 이식편-대-숙주 질환 (GvHD)과 사이토킨 방출 증후군 (CRS)을 촉발시킬 수 있다. 따라서, 다음 실시예들은 하나 또는 양쪽 모두, 또는 CD3 TFP 상에 결합자를 갖는 TCRα (뮤린) 및 TCR β (뮤린)의 절두된 형태, 또는 하나 또는 양쪽 절두된 TCRs 상에, 또는 자가-절단 신호 (가령, T2A)에 의해 분리된 융합 단백질 자체를 갖는 CD3 TFP 상에 결합자를 갖는 절두된 또는 전장 TCRγ 또는 TCRδ를 인코드하는 이식유전자를 TCRα 또는 TCRβ 녹-아웃 세포에 도입시키는 방법을 기술한다. 한 구체예에서, TCRγ 또는 TCRδ의 절두된 형태에는 막경유 도메인 및 연결 펩티드 도메인 (CP), 그리고 TCRγ 또는 TCRδ의 불변 도메인이 내포된다. 또다른 구체예에서, TCRγ 또는 TCRδ의 절두된 형태에는 막경유 도메인 및 연결 펩티드 도메인 (CP), 및 TCRα 또는 TCRβ의 불변 도메인이 내포된다. 또다른 구체예에서, 상기 TFP의 항원 결합 도메인은 절두된 TCRγ 및/또는 TCRδ중 하나 또는 양쪽 모두의 N-말단 단부에 융합된다.
실시예 1. crRNA (CRISPR RNA) 디자인
TRA를 비활성화시키기 위한 crRNAs는 DeskGen™ CRISPR 라이브러이 웹사이트 (www.deskgen.com)에서 접근가능한 "Dunne 2017" 알고리즘으로 기획되었다. TRA 좌에 결합하는 임의의 crRNAs는 이 TRA 유전자에서 이중 가닥 파손을 효과적으로 만들 수 있다. CRISPR 앤도뉴클레아제의 표적-외(off-target) 활성을 최소화시키기 위하여, 이용된 crRNAs는 >90%의 표적-외 득점을 갖고, Genome Reference Consortium의 인간 게놈 빌트(build) 38 (GRCh38/hg38) 게놈에서 가장 근접한 상동성 서열과 적어도 3개의 미스메치를 포함한다. 바람직한 구체예에서, 하나의 불합치는 프로토스페이스(protospacer) 인접 모티프 (PAM)에 대해 8bp 상류에 위치한다. 표 1-2에서는 TRA 유전자를 비활성화시키기 위하여 선택된 예시적인 crRNA 서열 (표 1)과 예상되는 표적 활성 (표 2)을 보여준다.
표 1: TRA 유전자를 비활성화시키기 위해 선택된 crRNAs:
Figure pct00002
표 2: 예상된 표적-외 부위; 표적과 표적-외 사이의 미스매치는 굵게 표시됨
Figure pct00003
TRBC를 비활성화시키기 위한 crRNAs는 상기에서 기술된 바와 같이 Dunne 2017 알고리즘으로 기획되었다. TCRβ의 불변 영역은 두 개 유전자 TRBC1 및 TRBC2에 의해 인코드되기 때문에, crRNAs는 TRBC1 및 TRBC2 모두에서 동일한 서열을 지향한다. 결과적으로, DeskGen™에 의해 생성된 표적-외 득점은 94%보다 낮다. 그러나, TRBC1 및 TRBC2를 표적으로 하는 것 이외에, crRNAs와 GRCh38/hg38 게놈 간의 다른 상동성 서열은 적어도 3개의 미스매치를 담고 있다. 바람직한 구체예에서, 이들 불합치중 하나는 프로토스페이스 인접 모티프 (PAM)에 대해 8bp 상류에 위치한다. 표 3-4에서는 TRB 유전자를 비활성화시키기 위하여 선택된 예시적인 crRNA 서열 (표 3)과 예상되는 표적 활성 (표 4)을 보여준다.
표 3: TRB 유전자를 비활성화시키기 위해 선택된 crRNAs
Figure pct00004
표 4: 예상된 표적-외 부위; 표적과 표적-외 사이의 미스매치는 굵게 표시됨
Figure pct00005
Figure pct00006
Figure pct00007
실시예 2: Jurkat 세포들에서 내생성 TCRα 또는 β의 편집
Jurkat 세포들에서 TRAC 유전자 또는 TRBC 유전자의 비활성화는 TRAC 유전자 또는 TRBC 유전자를 지향하는 SpCas9 리보뉴클레오단백질들 (RNPs)의 전기천공에 의해 실행되었다. 전기천공 전까지 세포들은 10% 태아 소 혈청 (FBS) 및 300mg/L의 L-글루타민이 보충된 RPMI 1640 배지 mL 당 0.2x106 세포 수준으로 유지되었다. TRA 유전자 또는 TRB 유전자를 표적으로 하는 SpCas9 리보뉴클레오단백질들은 TRAC (TRAC2-4598) 또는 TRBC (TRBC-44345)을 표적으로 하는 crRNA를 tracrRNA에 1:1의 분자 비율로 어닐링함으로써 준비되었다. 어닐링된 듀플렉스는 1.5:1의 분자 비율로 SpCas9 단백질과 혼합되었다. 0.61 μM의 RNPs는 2.5x106 T 세포들과 혼합된 후, Neon Transfection System (Thermo Fisher Scientific)의 제조업자 프로토콜에 따라 전기천공되었다. 전기천공은 1600V, 10ms, 3 펄스로 설정되었다. 펄스 후, 상기 세포들을 바로 따뜻한 배지로 이동시키고, 3일 동안 37℃에서 항온처리하였다.
편집 효능은 유동세포분석에 의해 TCRαβ 및 CD3ε의 표면 발현 상실을 관찰함으로써 평가되었다. 도 1에서는 TRA 편집된 세포들 (좌측 패널) 및 TRB 편집된 세포들 (우측 패널)의 결과를 나타낸다. 편집된 Jurkat 세포들은 자기-활성화된 세포 분류법 (MACS, Miltenyi Biotec) 세포 분리 시스템을 통하여 정제되었다. 편집된 Jurkat 세포들은 TCRαβ (클론: IP27) (eBioscience #17-9986-42) 항체 및 항-CD3ε (클론:SK7) (eBioscience #25-0036-42)에 대하여 음성적으로 선별되었다. TCRαβ 또는 CD3ε를 세포 표면에서 발현시키는 세포들은 MACS MS (Cat. #130-041-301) 또는 LS (Cat. #130-041-306) 컬럼에 고정시키고, 한편 TCRαβ 및 CD3ε, 모두에 대하여 음석인 편집된 Jurkat 세포들은 컬럼을 통하여 흘려보냄으로써 수거되었고, 상기 명시된 배지에서 0.4x106 세포들/mL 수준으로 배양물에서 유지되었다. TCRα 및 TCRβ 녹-아웃(knock out) 세포들은 본원에서 TRA-/- 또는 TRB-/- Jurkat 세포로 지칭된다.
실시예 3: 동종이계 T 세포 수용체 융합 단백질 T 세포의 생성
Jurkat 세포의 형질도입
가령, 공동-계류중인 U.S. 특허 공개 번호 2017-0166622에서 기술된 바와 같이, 렌티바이러스들을 이용하여, TFP 이식유전자들이 Jurkat 세포 안으로 도입되었다. Jurkat 세포들은 감염비(multiplicity of infection: MOI) 5에서 바이러스와 함께 항온처리되었다. 배양 24-시간-후, 배지를 교체하였다. 형질 도입 효능 및 TFP 발현은 관심있는 TFP 결합제에 특이적인 리간드 및/또는 TCRαβ 및 CD3ε의 표면 발현을 사용하여 유동세포 분석으로 평가되었다. TRAC-/- 및 TRBC-/- Jurkat 세포들은 TCRγδ TFPs로 형질도입되었고, 양성이 매우 강한 CD3ε 착색은 표면 TCR의 복귀를 나타낸다 (도 2). TRBC-/- Jurkat 세포에 TCRβ의 오로지 불변 도메인만을 갖는 항-CD19 TCRβ-TFP 또는 항-CD19 TCRβ-TFP를 또한 형질도입시켰다(도 12B). 이들 결과에서, 전체 인간 TCRβ을 갖는 TFP는 상기 세포 표면에서 발현되지만, 한편 인간 TCRβ의 오로지 불변 도메인만을 갖는 TFP는 상기 세포 표면에서 발현되지 않는다 (도 13). 이것은 TCRβ의 불변 도메인이 상기 세포 표면에 국소화될 수 없기 때문이며, 한편 뮤린 TCRβ 및 뮤린 인간 키메라 TCRβ의 불변 도메인은 상기 세포 표면에 국소화될 수 있다.
T 세포의 형질도입
가령, 공동-계류중인 U.S. 특허 공개 번호 2017-0166622에서 기술된 바와 같이, 렌티바이러스들을 이용하여, TFP 이식유전자들이 T 세포 안으로 도입되었다. T 세포는 감염비(multiplicity of infection: MOI) 5에서 바이러스, 그리고 100ng/mL의 LentiBOOST™ (Sirion Biotech)와 함께 혼합되었다. 형질 도입 효능 및 TFP 발현은 관심있는 TFP 결합제에 특이적인 리간드 및/또는 TCRαβ 및 CD3ε의 표면 발현을 사용하여 유동세포 분석으로 평가되었다.
삽입유전자의 설명
α/βT 세포에서, TRAC 또는 TRBC의 비활성화로 모든 TCR 소단위들의 세포 표면으로의 전좌가 차단된다. TCRα 또는 TCRβ은 TCRγ 또는 TCRδ와 쌍을 이룰 수 없다. 결과적으로, 외생성 TRGC 및 TRDC 삽입유전자 또는 TRAC 및 TRBC 삽입유전자는 TRAC-/- 또는 TRBC-/- 세포에서 발현되어, 기능성 TFP T 세포를 복원시킨다.
인간 TCRγ/δTFP의 발현
TCRα 음성 세포들은 여전히 TCRβ를 발현시키고, 그리고 상호적으로, TCRα는 TCRβ 음성 세포들에서 발현되지만; 그러나, TCRα 또는 TCRβ은 TCRγ 또는 TCRδ과 쌍을 이룰 수 없다. 따라서, TCRγ TFP 및 TCRδ TFPs는 TRAC-/- 세포들 또는 TRB-/- 세포들에서 함께 발현되었다. 전체 TCR 복합체의 전좌를 복원시키기 위한 최적의 구조체를 결정하기 위해, TCR 음성 세포에서 TCRγ/δ TFPs의 다중 형태를 테스트하였다 (도 3의 도해 참고). 한 구체예에서, TCRγ/δ TFPs는 TCRγ 또는/및 TCR δ의 불변 도메인과 항원 결합자 (가령, scFv 또는 sdAb)를 어셈블링시킴으로써, 만들어졌다. 또다른 구체예에서, TCRγ/δ 불변 도메인은 CD3ε TFP와 함께 발현된다 (도 4). TRGC1 및 TRDC 잔기들은 본원에서 제공된 서열 및 국제 ImMunoGeneTics 정보 시스템 (IMGT)에 따라 계산된다.
TCR 소단위들의 공급원
TCR 복합체는 CD3-입실론 폴리펩티드, CD3-감마 폴리 펩티드, CD3-델타 폴리펩티드, 및 상기 TCR 알파 쇄 폴리펩티드 그리고 TCR 베타 쇄 폴리펩티드 또는 상기 TCR 델타 쇄 폴리펩티드 및 상기 TCR 감마 쇄 폴리펩티드를 함유한다. TCR 알파, TCR 베타, TCR 감마, 및 TCR 델타는 CD3 제타 폴리펩티드를 모집한다. 상기 인간 CD3-입실론 폴리펩티드 기본형 서열은 Uniprot 수탁 번호. P07766이다. 상기 인간 CD3-감마 폴리펩티드 기본형 서열은 Uniprot 수탁 번호. P09693이다. 상기 인간 CD3-델타 폴리펩티드 기본형 서열은 Uniprot 수탁 번호. P043234이다. 상기 인간 CD3-제타 폴리펩티드 기본형 서열은 Uniprot 수탁 번호. P20963이다. 상기 인간 TCR 알파 쇄 기본형 서열은 Uniprot 수탁 번호. Q6ISU1이다. 상기 뮤린 TCR 알파 쇄 기본형 서열은 Uniprot 수탁 번호. A0A075B662이다. 상기 인간 TCR 베타 쇄 불변 영역 기본형 서열은 Uniprot 수탁 번호. P01850이다. 상기 뮤린 TCR 베타 쇄 불변 영역 기본형 서열은 Uniprot 수탁 번호. P01852이다.
상기 인간 CD3-입실론 폴리펩티드 기본형 서열은 다음과 같다: MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI (서열 식별 번호: 124).
인간 CD3-입실론 성숙 폴리펩티드 서열은 다음과 같다:
DGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI (서열 식별 번호: 258).
인간 CD3ε의 신호 펩티드는 다음과 같다:
MQSGTHWRVLGLCLLSVGVWGQ (서열 식별 번호: 125).
인간 CD3ε의 세포외 도메인은 다음과 같다:
DGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMD (서열 식별 번호: 126).
인간 CD3ε의 막경유 도메인은 다음과 같다:
VMSVATIVIVDICITGGLLLLVYYWS (서열 식별 번호: 127).
인간 CD3ε의 세포내 도메인은 다음과 같다:
KNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI (서열 식별 번호: 128).
상기 인간 CD3-감마 폴리펩티드 기본형 서열은 다음과 같다:
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDGKMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATISGFLFAEIVSIFVLAVGVYFIAGQDGVRQSRASDKQTLLPNDQLYQPLKDREDDQYSHLQGNQLRRN (서열 식별 번호: 129).
인간 CD3-감마 성숙 폴리펩티드 서열은 다음과 같다:
QSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDGKMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATISGFLFAEIVSIFVLAVGVYFIAGQDGVRQSRASDKQTLLPNDQLYQPLKDREDDQYSHLQGNQLRRN (서열 식별 번호: 130).
인간 CD3γ의 신호 펩티드는 다음과 같다:
MEQGKGLAVLILAIILLQGTLA (서열 식별 번호: 131).
인간 CD3γ의 세포외 도메인은 다음과 같다:
QSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDGKMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATIS (서열 식별 번호: 132).
인간 CD3 γ의 막경유 도메인 도메인은 다음과 같다:
GFLFAEIVSIFVLAVGVYFIA (서열 식별 번호: 133).
인간 CD3γ의 세포내 도메인은 다음과 같다:
GQDGVRQSRASDKQTLLPNDQLYQPLKDREDDQYSHLQGNQLRRN (서열 식별 번호: 134).
인간 CD3-델타 폴리펩티드 기본형 서열은 다음과 같다:
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALGVFCFAGHETGRLSGAADTQALLRNDQVYQPLRDRDDAQYSHLGGNWARNKS (서열 식별 번호: 135).
인간 CD3-델타 성숙 폴리펩티드 서열은 다음과 같다: FKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALGVFCFAGHETGRLSGAADTQALLRNDQVYQPLRDRDDAQYSHLGGNWARNKS (서열 식별 번호: 136).
인간 CD3δ의 신호 펩티드는 다음과 같다:
MEHSTFLSGLVLATLLSQVSP (서열 식별 번호: 137).
인간 CD3δ의 세포외 도메인은 다음과 같다:
FKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLGKRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVA (서열 식별 번호: 138).
인간 CD3δ의 막경유 도메인은 다음과 같다:
GIIVTDVIATLLLALGVFCFA (서열 식별 번호: 139).
인간 CD3δ의 세포내 도메인은 다음과 같다:
GHETGRLSGAADTQALLRNDQVYQPLRDRDDAQYSHLGGNWARNK (서열 식별 번호: 140).
인간 CD3-제타 폴리펩티드 기본형 서열은 다음과 같다: MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADAPAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPQRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (서열 식별 번호: 141).
인간 TCR 알파 쇄 불변 영역 기본형 서열은 다음과 같다: IQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLSVIGFRILLLKVAGFNLLMTLRLWSS (서열 식별 번호: 142).
인간 TCR 알파 쇄 인간 IgC 서열은 다음과 같다:
IQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLS (서열 식별 번호: 143)
인간 TCR 알파 쇄의 막경유 도메인은 다음과 같다:
VIGFRILLLKVAGFNLLMTLRLW (서열 식별 번호: 144).
인간 TCR 알파 쇄의 세포내 도메인은 다음과 같다: SS (서열 식별 번호: 145)
뮤린 TCR 알파 쇄 불변 (mTRAC) 영역 기본형 서열은 다음과 같다:
XIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS (서열 식별 번호: 146).
뮤린 TCR 알파 쇄의 막경유 도메인은 다음과 같다:
MGLRILLLKVAGFNLLMTLRLW (서열 식별 번호: 147).
뮤린 TCR 알파 쇄의 세포내 도메인은 다음과 같다: SS
인간 TCR 베타 쇄 불변 영역 (mTRBC) 기본형 서열은 다음과 같다: EDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF (서열 식별 번호: 148).
인간 TCR 베타 쇄 인간 IgC 서열은 다음과 같다:
EDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYE (서열 식별 번호: 149)
인간 TCR 베타 쇄의 막경유 도메인은 다음과 같다:
ILLGKATLYAVLVSALVLMAM (서열 식별 번호: 150).
인간 TCR 베타 쇄의 세포내 도메인은 다음과 같다:
VKRKDF (서열 식별 번호: 151)
뮤린 TCR 베타 쇄 불변 영역 기본형 서열은 다음과 같다:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS (서열 식별 번호: 152).
뮤린 TCR 베타 쇄의 막경유 도메인은 다음과 같다:
ILYEILLGKATLYAVLVS TLVVMAMVK (서열 식별 번호: 153).
뮤린 TCR 베타 쇄의 세포내 도메인은 다음과 같다:
KRKNS (서열 식별 번호: 154)
인간 TCR 감마 쇄 불변 영역 기본형 서열은 다음과 같다:
DKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호: 21).
인간 TCR 감마 인간 IgC 서열은 다음과 같다:
DKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSA (서열 식별 번호: 155)
인간 TCR 감마 쇄의 막경유 도메인은 다음과 같다:
YYMYLLLLLKSVVYFAIITCCLL (서열 식별 번호: 156).
인간 TCR 감마 쇄의 세포내 도메인은 다음과 같다:
RRTAFCCNGEKS (서열 식별 번호: 157)
인간 TCR 델타 쇄 C 영역 기본형 서열은 다음과 같다:
SQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFL (서열 식별 번호: 243).
인간 TCR 델타 인간 IgC 서열은 다음과 같다:
SQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTV (서열 식별 번호: 265)
인간 TCR 델타 쇄의 막경유 도메인은 다음과 같다:
LGLRMLFAKTVAVNFLLTAKLFF (서열 식별 번호: 158).
인간 TCR 델타 쇄의 세포내 도메인은 다음과 같다: L
Nt-FMC63-TRDC(1-153)-T2A-TRGC1(1-173)-Ct, 신호 펩티드(Nt-FMC63-TRDC(-6, 189)-2A-TRGC1(1.8, 189)-Ct 내포, IMGT 번호매김에 따름):
MLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLESQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFLGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호:1)
Nt-FMC63-TRDC(1-153)-T2A-FMC63-TRGC1(1-173)-Ct (Nt-FMC63-TRDC(-6,1 89)-2A-FMC63-TRGC1(1.8, 189)-Ct IMGT 번호매김에 따름):
MLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLESQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFLGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLEDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호:2)
Nt-TRDC(1-153)-T2A-TRGC1(1-173)-T2A-FMC63-CD3ε(1-185)-Ct (Nt-TRDC(-6, 189)-2A-TRGC1(1.8, 189)-2A-FMC63-CD3ε(1, 186)-Ct IMGT 번호매김에 따름):
MLLLVTSLLLCELPHPAFLLIPSQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFLGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKSGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLEDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI (서열 식별 번호:3)
Nt-TRDC(1-153)-T2A-FMC63-TRGC1(1-173)-Ct-(Nt-TRDC(-6,189)-2A-FMC63-TRGC1(1.8, 189)-Ct IMGT 번호매김에 따름) (신호 펩티드와 함께):
MLLLVTSLLLCELPHPAFLLIPSQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFLGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLEDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호:4)
Nt-FMC63-TRDC(1-129)-TRAC(116-140)-T2A-FMC63-TRGC1(1-106)-TRBC1(145-177)-Ct (Nt-FMC63-TRDC(-6, 165)-TRAC(150, 174)-2A-FMC63-TRGC1(1.8, 189)-TRBC1(142, 173)-Ct IMGT 번호매김에 따름) :
MLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLESQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVVIGFRILLLKVAGFNLLMTLRLWSSGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLEDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPTILYEILLGKATLYAVLVSALVLMAMVKRKDF (서열 식별 번호:5)
Nt-FMC63-TRDC(1-153)-T2A-TRGC1(1-173)-Ct, 신호 펩티드 없음(아미노산 서열) (Nt-FMC63-TRDC(-6, 189)-2A-TRGC1(1.8, 189)-Ct IMGT 번호매김에 따름):
DIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLESQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFLGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호:6)
Nt-FMC63-TRDC(1-153)-T2A-TRGC1(1-173)-Ct, 신호 펩티드 없음(핵산 서열) (Nt-FMC63-TRDC(-6, 189)-2A-TRGC1(1.8, 189)-Ct IMGT 번호매김에 따름):
GACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGCGGCCGCAGGTGGAGGAGGTTCTGGAGGTGGTGGATCAGGTGGTGGAGGATCTTTAGAAAGTCAGCCTCATACCAAACCATCCGTTTTTGTCATGAAAAATGGAACAAATGTCGCTTGTCTGGTGAAGGAATTCTACCCCAAGGATATAAGAATAAATCTCGTGTCATCCAAGAAGATAACAGAGTTTGATCCTGCTATTGTCATCTCTCCCAGTGGGAAGTACAATGCTGTCAAGCTTGGTAAATATGAAGATTCAAATTCAGTGACATGTTCAGTTCAACACGACAATAAAACTGTGCACTCCACTGACTTTGAAGTGAAGACAGATTCTACAGATCACGTAAAACCAAAGGAAACTGAAAACACAAAGCAACCTTCAAAGAGCTGCCATAAACCCAAAGCCATAGTTCATACCGAGAAGGTGAACATGATGTCCCTCACAGTGCTTGGGCTACGAATGCTGTTTGCAAAGACTGTTGCCGTCAATTTTCTCTTGACTGCCAAGTTATTTTTCTTGGGGTCAGGCGAGGGCAGAGGAAGTCTGCTAACATGCGGTGACGTCGAGGAGAATCCTGGACCTATGCTACTACTTGTGACCTCACTATTGTTATGCGAACTCCCTCATCCCGCATTCTTGCTGATTCCAGATAAACAACTTGATGCAGATGTTTCCCCCAAGCCCACTATTTTTCTTCCTTCAATTGCTGAAACAAAGCTCCAGAAGGCTGGAACATACCTTTGTCTTCTTGAGAAATTTTTCCCTGATGTTATTAAGATACATTGGCAAGAAAAGAAGAGCAACACGATTCTGGGATCCCAGGAGGGGAACACCATGAAGACTAACGACACATACATGAAATTTAGCTGGTTAACGGTGCCAGAAAAGTCACTGGACAAAGAACACAGATGTATCGTCAGACATGAGAATAATAAAAACGGAGTTGATCAAGAAATTATCTTTCCTCCAATAAAGACAGATGTCATCACAATGGATCCCAAAGACAATTGTTCAAAAGATGCAAATGATACACTACTGCTGCAGCTCACAAACACCTCTGCATATTACATGTACCTCCTCCTGCTCCTCAAGAGTGTGGTCTATTTTGCCATCATCACCTGCTGTCTGCTTAGAAGAACGGCTTTCTGCTGCAATGGAGAGAAATCA (서열 식별 번호: 7)
Nt-TRDC(1-153)-T2A-FMC63-TRGC1(1-173)-Ct (신호 펩티드 없음; 아미노산 서열) (Nt-TRDC(-6,189)-2A-FMC63-TRGC1(1.8, 189)-Ct IMGT 번호매김에 따름) :
SQPHTKPSVFVMKNGTNVACLVKEFYPKDIRINLVSSKKITEFDPAIVISPSGKYNAVKLGKYEDSNSVTCSVQHDNKTVHSTDFEVKTDSTDHVKPKETENTKQPSKSCHKPKAIVHTEKVNMMSLTVLGLRMLFAKTVAVNFLLTAKLFFLGSGEGRGSLLTCGDVEENPGPMLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLEDKQLDADVSPKPTIFLPSIAETKLQKAGTYLCLLEKFFPDVIKIHWQEKKSNTILGSQEGNTMKTNDTYMKFSWLTVPEKSLDKEHRCIVRHENNKNGVDQEIIFPPIKTDVITMDPKDNCSKDANDTLLLQLTNTSAYYMYLLLLLKSVVYFAIITCCLLRRTAFCCNGEKS (서열 식별 번호: 8)
Nt-TRDC(1-153)-T2A-FMC63-TRGC1(1-173)-Ct (신호 펩티드와 함께; 핵산 서열) (Nt-TRDC(-6,189)-2A-FMC63-TRGC1(1.8, 189)-Ct IMGT 번호매김에 따름):
AGTCAGCCTCATACCAAACCATCCGTTTTTGTCATGAAAAATGGAACAAATGTCGCTTGTCTGGTGAAGGAATTCTACCCCAAGGATATAAGAATAAATCTCGTGTCATCCAAGAAGATAACAGAGTTTGATCCTGCTATTGTCATCTCTCCCAGTGGGAAGTACAATGCTGTCAAGCTTGGTAAATATGAAGATTCAAATTCAGTGACATGTTCAGTTCAACACGACAATAAAACTGTGCACTCCACTGACTTTGAAGTGAAGACAGATTCTACAGATCACGTAAAACCAAAGGAAACTGAAAACACAAAGCAACCTTCAAAGAGCTGCCATAAACCCAAAGCCATAGTTCATACCGAGAAGGTGAACATGATGTCCCTCACAGTGCTTGGGCTACGAATGCTGTTTGCAAAGACTGTTGCCGTCAATTTTCTCTTGACTGCCAAGTTATTTTTCTTGGGGTCAGGCGAGGGCAGAGGAAGTCTGCTAACATGCGGTGACGTCGAGGAGAATCCTGGACCTATGCTACTACTTGTGACCTCACTATTGTTATGCGAACTCCCTCATCCCGCATTCTTGCTGATTCCAGACATTCAGATGACTCAAACAACTTCCAGCCTCTCCGCCTCACTCGGCGACCGCGTAACAATAAGCTGTCGGGCCTCGCAAGATATTAGTAAGTACCTGAATTGGTATCAGCAAAAACCCGATGGTACAGTCAAGCTTCTGATCTACCATACCAGTCGTCTGCACAGCGGTGTCCCCAGCAGGTTCAGCGGCTCAGGATCTGGTACCGATTATTCACTGACGATTTCCAACCTTGAGCAGGAGGACATCGCCACCTACTTCTGCCAGCAGGGTAATACTCTGCCGTACACATTCGGGGGCGGTACCAAGCTCGAGATCACGGGTTCAACAAGCGGTTCTGGCAAGCCAGGCAGCGGCGAGGGGAGTACAAAGGGGGAGGTGAAGTTGCAGGAAAGTGGCCCTGGATTGGTGGCCCCGAGCCAGAGTCTGTCTGTCACCTGCACAGTTTCCGGAGTAAGTCTGCCTGATTACGGAGTGTCCTGGATCAGACAGCCACCTCGAAAGGGCTTGGAGTGGCTTGGGGTCATTTGGGGCAGTGAAACCACATACTACAACAGCGCTCTTAAGTCCAGGCTCACTATCATCAAGGACAATTCAAAGAGCCAAGTATTCTTGAAAATGAATTCCCTGCAGACTGATGACACCGCTATTTATTATTGCGCTAAACATTATTACTATGGAGGTTCTTATGCCATGGACTACTGGGGGCAGGGTACCTCTGTGACAGTGAGTTCAGCTGCAGCTGGAGGTGGAGGTAGCGGAGGCGGTGGTAGTGGAGGGGGTGGTTCTCTGGAAGATAAACAACTTGATGCAGATGTTTCCCCCAAGCCCACTATTTTTCTTCCTTCAATTGCTGAAACAAAGCTCCAGAAGGCTGGAACATACCTTTGTCTTCTTGAGAAATTTTTCCCTGATGTTATTAAGATACATTGGCAAGAAAAGAAGAGCAACACGATTCTGGGATCCCAGGAGGGGAACACCATGAAGACTAACGACACATACATGAAATTTAGCTGGTTAACGGTGCCAGAAAAGTCACTGGACAAAGAACACAGATGTATCGTCAGACATGAGAATAATAAAAACGGAGTTGATCAAGAAATTATCTTTCCTCCAATAAAGACAGATGTCATCACAATGGATCCCAAAGACAATTGTTCAAAAGATGCAAATGATACACTACTGCTGCAGCTCACAAACACCTCTGCATATTACATGTACCTCCTCCTGCTCCTCAAGAGTGTGGTCTATTTTGCCATCATCACCTGCTGTCTGCTTAGAAGAACGGCTTTCTGCTGCAATGGAGAGAAATCA (서열 식별 번호: 9)
뮤린 TCRβ/αTFP의 발현
TCRα 음성 세포들은 여전히 TCRβ를 발현시키고, 그리고 상호적으로 TCRα는 TCRβ 음성 세포들에서 발현되지만; 그러나, TCRα 및/또는 TCRβ의 불변 도메인과 항원 결합자 (가령, scFv 또는 sdAb)의 어셈블링에 의해 생성된 TCRα 또는 TCRβ TFPs는 TCRα 또는 TCRβ의 불변 도메인과 쌍을 이룰 수 있지만, 그러나, 인간 TCRα 및 TCRβ의 불변 도메인은 이들 세포 표면으로 이동할 수 없다. 뮤린 또는 인간 뮤린 키메라 TCRα 및 TCRβ 불변 도메인이 이용될 수 있다. 도 12A는 어느 TFPs가 이들 세포 표면에서 재구성될 수 있는지, 그리고 없는 지를 보여주는 도해 다이아그램이다. 뮤린 TCRα 불변, 세포내, 및 막경유 도메인, 그리고 이들 TCRβ 불변, 세포내, 및 막경유 도메인을 포함하는 단백질을 비롯한 뮤린 항-CD19 TCRα TFP는 TRA-/- 세포에서 또는 TRB-/- 세포에서 함께 발현되었다. 한 구체예에서, TCRαTFPs는 TCRα의 불변 도메인과 항원 결합자 (가령, scFv 또는 sdAb)의 어셈블링에 의해 생성되었다.
TRA -/- 또는 TRB -/- 세포들에서 발현된 TCRγ/δ FMC63 TFP
Nt-pLRPO FMC63-mTRAC(82-137) T2A mTRBC(123-173)-Ct (Nt-pLRPO FMC63-mTRAC(197-252) T2A mTRBC(233-283)-Ct IMGT 번호매김에 따름) (아미노산 서열):
DIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGGGGSGGGGSGGGGSEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSGATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSSGSGEGRGSLLTCGDVEENPGPGRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS (서열 식별 번호:10)
Nt-pLRPO FMC63-mTRAC(82-137) T2A mTRBC(123-173)-Ct (Nt-pLRPO FMC63-mTRAC(197-252) T2A mTRBC(233-283)-Ct IMGT 번호매김에 따름) (핵산 서열):
GACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGAGGTGGAGGTTCTGGTGGAGGAGGTTCAGGAGGTGGTGGAAGTGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGGAGCCACCTACCCCAGTTCAGACGTTCCCTGTGATGCCACGTTGACTGAGAAAAGCTTTGAAACAGATATGAACCTAAACTTTCAAAACCTGTCAGTTATGGGACTCCGAATCCTCCTGCTGAAAGTAGCCGGATTTAACCTGCTCATGACGCTGAGGCTGTGGTCCAGTGGCAGCGGCGAGGGCAGAGGAAGTCTGCTAACATGCGGTGACGTCGAGGAGAATCCTGGACCTGGTCGAGCAGACTGTGGTATTACCTCAGCATCCTATCAACAAGGAGTCTTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAAGCCACCCTGTATGCTGTGCTTGTCAGTACACTGGTGGTGATGGCTATGGTCAAAAGAAAGAATTCA (서열 식별 번호:11)
pLRPO FMC63-TCR베타1 (아미노산 서열)
DIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLELGAGPVDSGVTQTPKHLITATGQRVTLRCSPRSGDLSVSWYQQSLDQGLQFLIQYYNGEERAKGNILERFSAQQFPDLHSELNLSSLELGDSALYFCASSPRTGLNTEAFFGQGTRLTVVEDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF (서열 식별 번호:12)
pLRPO FMC63-TCR베타1 (핵산 서열)
GACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGCGGCCGCAGGTGGAGGAGGTTCTGGAGGTGGAGGTTCAGGTGGAGGTGGTTCACTCGAGCTGGGAGCAGGCCCAGTGGATTCTGGAGTCACACAAACCCCAAAGCACCTGATCACAGCAACTGGACAGCGAGTGACGCTGAGATGCTCCCCTAGGTCTGGAGACCTCTCTGTGTCATGGTACCAACAGAGCCTGGACCAGGGCCTCCAGTTCCTCATTCAGTATTATAATGGAGAAGAGAGAGCAAAAGGAAACATTCTTGAACGATTCTCCGCACAACAGTTCCCTGACTTGCACTCTGAACTAAACCTGAGCTCTCTGGAGCTGGGGGACTCAGCTTTGTATTTCTGTGCCAGCAGCCCCCGGACAGGCCTGAACACTGAAGCTTTCTTTGGACAAGGCACCAGACTCACAGTTGTAGAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACGGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTC (서열 식별 번호:13)
pLRPO FMC63 endoL TRBC1 (126-177) (pLRPO FMC63 endoL TRBC1 (132-309) IMGT 번호매김에 따름) (아미노산 서열)
DIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGSTSGSGKPGSGEGSTKGEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSGVEDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF (서열 식별 번호:14)
pLRPO FMC63 endoL TRBC1 (126-177) (pLRPO FMC63 endoL TRBC1 (132-309) IMGT 번호매김에 따름) (핵산 서열)
GACATCCAGATGACACAGACTACATCCTCCCTGTCTGCCTCTCTGGGAGACAGAGTCACCATCAGTTGCAGGGCAAGTCAGGACATTAGTAAATATTTAAATTGGTATCAGCAGAAACCAGATGGAACTGTTAAACTCCTGATCTACCATACATCAAGATTACACTCAGGAGTCCCATCAAGGTTCAGTGGCAGTGGGTCTGGAACAGATTATTCTCTCACCATTAGCAACCTGGAGCAAGAAGATATTGCCACTTACTTTTGCCAACAGGGTAATACGCTTCCGTACACGTTCGGAGGGGGGACTAAGTTGGAAATAACAGGCTCCACCTCTGGATCCGGCAAGCCCGGATCTGGCGAGGGATCCACCAAGGGCGAGGTGAAACTGCAGGAGTCAGGACCTGGCCTGGTGGCGCCCTCACAGAGCCTGTCCGTCACATGCACTGTCTCAGGGGTCTCATTACCCGACTATGGTGTAAGCTGGATTCGCCAGCCTCCACGAAAGGGTCTGGAGTGGCTGGGAGTAATATGGGGTAGTGAAACCACATACTATAATTCAGCTCTCAAATCCAGACTGACCATCATCAAGGACAACTCCAAGAGCCAAGTTTTCTTAAAAATGAACAGTCTGCAAACTGATGACACAGCCATTTACTACTGTGCCAAACATTATTACTACGGTGGTAGCTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGGAGTAGAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACTCTAGTATGTCTAGCTACAGGCTTCTTCCCTGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACGGACCCGCAGCCACTTAAAGAACAGCCAGCTCTCAATGACTCCAGATACTGTCTAAGCAGTCGACTTAGAGTCTCGGCTACATTTTGGCAAAATCCTCGAAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTC (서열 식별 번호:15)
일차 인간 T 세포의 편집
그 다음, TRA 유전자 또는 TRB 유전자는 인간 공여자의 일차 T 세포들에서 비활성화된다. 전기천공 4일-전 시점에서, 3% 인간 혈청을 함유하는 TexMac 배지에서 IL7/IL15가 보충된 TransAct®(Milltenyi)로 T 세포를 활성화시켰다. TRA 유전자 또는 TRB 유전자를 표적으로 하는 SpCas9 리보뉴클레오단백질(RNPs)은 TRAC (TRAC2-4598) 또는 TRBC (TRBC-44345)을 표적으로 하는 crRNA를 tracrRNA에 1:1의 분자 비율로 어닐링함으로써 준비되었다. 어닐링된 듀플렉스는 1.5:1의 분자 비율로 SpCas9 단백질과 혼합되었다. 0.61 μM의 RNPs는 2.5x106 T 세포들과 혼합된 후, Neon Transfection System의 제조업자 프로토콜에 따라 전기천공되었고, 이때 전기천공은 1600V, 10ms, 3 펄스로 설정되었다. 세포들은 보충된 따뜻한 배지로 즉시 이동되었고, 편집된 T 세포들의 확장을 허용하기 위하여 37℃에서 항온처리되었으며, 적절한 배가(doubling time)은 3 내지 5 일이다. 편집 효능은 유동세포분석에 의해 TCRαβ 및 CD3ε의 표면 발현 상실을 측정함으로써 평가되었다. 편집된 T 세포들은 제조업자에 따라 자기-활성화된 세포 분류법 (MACS®, Miltenyi Biotec) 세포 분리 시스템을 이용하여 정제되었으며, 항-TCRαβ (클론: IP27) 항체 (eBioscience #14-9986-82) 및 항-CD3ε (클론: SK7) 항체들(eBioscience #16-0036-81)에 대하여 음성적으로 선별되었다. TCRαβ 또는 CD3ε를 세포 표면에서 발현시키는 세포들은 MACS MS (Cat. #130-041-301) 또는 LS (Cat#130-041-306) 컬럼에 고정시키고, 한편 TCRαβ 및 CD3ε 모두에 대하여 음석인 편집된 T 세포들은 컬럼을 통하여 흘려보냄으로써 수거되었고, 상기 명시된 배지에서 106 세포들/mL 수준으로 배양물에서 유지되었다.
동종이계-TFP T 세포들의 표현형 특징
동종이계-TFP T 세포들은 이들에 의한 다음 발현에 대하여 검사되었다: TCRαβ (항-인간 TCR에 의해, Miltenyi Bio, 클론 BW242/412), 인간 CD3ε (항-인간 CD3ε에 의해, BioLegend, 클론 UCHT1), 인간 CD4 (항-인간 CD4에 의해, BioLegend, 클론 RPA-T4), 인간 CD8 (항-인간 CD8에 의해, BioLegend, 클론 SK-1), 인간 CD45RA 및 인간 CCR7과 TFPs (바이오티닐화된 CD19 (Cat.# CD9-H8259, AcroBio)에 의한 CD19 결합자 FMC63의 탐지에 의해 비교용으로, 동일한 패널에서 야생형 T 세포, 그리고 동일한 공여자의 대조군 TCRβ 전장 (FL) 구조체들 (편집안된)이 형질도입된 TFPs가 검사되었다.
도 5-9에서 결과는 보여준다. TFP 형질도입-후, 그리고 TRAC 편집-후, T 세포는 인간 TCRαβ 및 CD3ε(상부 우측-편 패널)의 표면 발현에 대해 이중 양성을 유지한다. 대조적으로, TRAC 유전자가 삭제되도록 편집된 T 세포는 두 개의 세포 집단을 보여준다(하단 오른쪽 패널). 세포의 대부분은 TCRαβ 및 CD3ε의 표면 발현을 상실했다. 대조적으로, TCRγδ TFP 형질도입된 T 세포(서열 식별 번호: 1, 2, 또는 4를 발현시키는 벡터로 형질도입된 세포)는 별개의 세 집단을 나타낸다(좌측-편 패널). 대부분의 세포가 TCRαβ 표면 발현을 상실한 반면, 현재 TCRαβ의 발현 없이 CD3ε을 발현하는 세포의 새로운 하위집합이 있으며, 이것은 전체 TCR 복합체가 다시-어셈블링에 성공했음을 시사한다. 이 집단은 TCRαβ가 제거되도록 편집되고, TCRγδ를 발현하도록 형질도입된 세포에 해당한다. 도 6은 TCRαβ를 발현시키는 잔류 세포를 제거하기 위한 MACS 정제 후의 세포를 나타낸다. TCRγδ TFP로 형질도입된 Τ 세포들은 이제 2개의 세포 집단을 갖는다. 둘 다 TCRαβ에 대해 음성이고, 한 집단은 높은 수준의 CD3ε을 나타낸다. 도 7은 TCR 베타 전장(FL) 대조군 TFPs 및 형질도입되지 않은 대조군 T 세포와 비교하였을 때, TCRγδ 형질도입된 TFP의 TFP 발현을 나타낸다. 인간 CD4 및 CD8의 발현은 TCR 베타 FL TFP 대조군과 TCRγδ TFP T 세포 간에 크게 다르지 않고; 또한 CD45RA 및 CCR7 발현에 의해 특정된 메모리 상태에는 차이가 없다 (차례로 도 8 및 도 9).
도 14는 α-CD19 scFv TFP 구조체를 함유하는 렌티바이러스로 활성화시킨 후 24시간 시점에 형질도입된 일차 T 세포를 보여준다: αCD19-CD3ε, αCD19-TCRγ(불변)-2A-TCRδ (불변) (FMC63-TRDC(1-153)-T2A-TRGC1(1-173) 또는 FMC63-TRDC(-6, 189)-2A-TRGC1(1.8, 189) IMGT 번호매김에 따라), TCRγ(불변)-2A-αCD19-TCRδ (불변) (TRDC(1-153)-T2A-FMC63-TRGC1(1-173) 또는 TRDC(-6,189)-2A-FMC63-TRGC1(1.8, 189) IMGT 번호매김에 따라), 또는 αCD19-TCRα(뮤린 불변)-2A-뮤린TCRβ (불변)(pLRPC FMC63mTRAC_T2A_mTRBC). αCD19-CD3ε-발현 세포를 제외한 모든 TFP 발현 세포에서, 내생성 TCR은 TCRα 불변 영역 유전자좌를 표적화함으로써, 활성화-후 72시간 시점에 CRISPR/Cas9로 비활성화되었다. 음성 선택에 의해 내생성 TCR을 여전히 발현시키는 T 세포를 제거하기 위해 T 세포를 정제하였다. 형질도입, 편집 효율 그리고 T-세포 표현형을 평가하기 위해, 나타낸 유동세포분석 패널은 9일차 및 10일차에 수행되었다. 이들 결과에서 동종이계 TFP-발현 세포가 내생성 T 세포 수용체 α 및 β 서브유닛을 뮤린 TCRα 및 TCRβ의 불변 영역 또는 인간 TCRγ 및 TCRδ의 불변 영역을 함유하는 TCR 이식유전자로 대체시킴으로써, 성공적으로 공작되었음이 입증된다.
TFPs를 발현시키는 인간 TCR-음성 T 세포들의 MLR
혼합형 림프구 반응 (MLR) 검정을 이용하여 TFPs를 발현시키는 인간 TCR-음성 T 세포들의 동종이계성을 평가하였다. 미스매치된 PBMC 공여자 세포들은 CD-19 음성 세포들의 자기-활성화된 세포 분류에 의해 우선 B 세포를 고갈시켰다. 조사된(irradiated) PBMC(Astarte Biologics)는 세포 라벨링 염료 CellTrace™(Thermo Fisher Scientific)로 라벨링된다. 동시에, 상이한 색의 CellTrace 염료를 표적 T 세포들에 통합시켰다. TFPs를 발현시키는 인간 TCR-음성 T 세포들과 동일한 공여자의 야생형 T 세포들은 1:1 비율 (PBMCs 대 T 세포)에서 후속적으로 공동-배양하거나, 또는 T 세포들만 단독으로 배양한다. 공여자 T 세포의 증식은 6일~12-일 시점에 걸쳐 라벨링 염료를 추적하여 모니터링한다. 염료는 세포 분열시 절반으로 희석되며, 따라서, 상기 T세포에서 발생되었던 증식의 양이 평가되고, 야생형 대조군과 비교된다.
실시예 4: TFPs를 발현시키는 동종이계 TCR T 세포의 세포독성 및 사이토카인 생산
루시퍼라제-기반의 세포독성 검정 ("Luc-Cyto" 검정) 은 공동-배양 후, 잔류 생존 표적 세포에서 루시퍼라제 효소 활성을 간접적으로 측정함으로써, TFP T 세포의 세포독성을 평가한다.
반딧불이 루시퍼라제 (Luc)를 발현하는 종양 세포의 생성
Luc-Cyto 검정에 이용된 표적 세포들은 반딧불이 루시퍼라제를 발현시키기 위하여 Nalm6-Luc (CD19 양성) 및 K562-Luc (CD19 음성은 Nalm6 (DSMZ Cat. # ACC 128) 및 K562 ((ATCC® Cat. #CCL-243™)을 안정적으로 형질도입시켜 만들어짐) 세포들을 이용하였다. 반딧불이 루시퍼라제를 인코딩하는 DNA는 GeneArt® (ThermoFisher)에서 합성되었으며, 단일-프로모터 렌티바이러스성 벡터 pCDH527A-1 (System Biosciences)의 다중 클로닝 부위로 삽입되었다. 이 렌티바이러스는 제작자의 지침에 따라 패키지되었다. 그 다음, 종양 세포들은 렌티바이러스로 24 시간동안 형질도입되었으며, 퓨로마이신 (5μg/mL)을 이용하여 선별되었다. Nalm6-Luc 세포 및 K562-Luc 세포의 성공적인 생산은 Bright-Glo™ 루시퍼라제 검정 시스템 (Promega)에서 상기 세포들의 루시퍼라제 효소 활성을 측정함으로써 확인되었다.
동종이계 T 세포의 세포독성 및 사이토킨 생산을 평가하는 Luc-Cyto 검정
상기 Luc-Cyto 검정은 표적 (종양 세포)에 대한 작동체 (T 세포) (E-대비-T)의 상이한 비율에서 종양 세포와 T 세포를 혼합하여 설정되었다. 상기 표적 세포들 (Nalm6-Luc 또는 K562-Luc)은 10% 열-불활성화된 (HI) FBS가 보충된 RPMI-1640 배지가 있는 96-웰 플레이트에서 웰당 10,000개 세포로 도말되었다. 동종이계 TFP T 세포들은 E-대-T의 비율이 3-대-1, 1-대-1, 또는 1-대-3 또는 1-대-9에 도달되도록, 웰당 30000개, 10000개, 또는 3333개 또는 1111개의 세포로 수준으로 종양 세포에 추가되었다. 세포 혼합물은 24 시간 동안 37℃, 5 % CO2에서 항온처리되었다. 루시퍼라제 효소 활성은 Bright-Glo™ 루시퍼라제 검정 시스템 (Promega)을 이용하여 측정되었고, 이것은 상기 T 세포와 종양 세포의 공동-배양물에 남아있는 생존 표적 세포로부터의 활성을 측정한다.
결과는 도 10에 나타낸다. 동종이계 TCRγδ TFP T 세포들은 CD19 양성 종양 세포 Nalm6-Luc에 대항하여 강력하고 특이적인 용해를 보이지만, 그러나 CD19 음성 종양 세포 K562-Luc에 대항해서는 그렇지 않았다.
다음의 사이토킨의 동종이계 T 세포 생산을 평가하기 위해, 24시간-후 동일한 공동-배양 분석에서 상청액을 취했다: GM-CSF, IFNγ, IL2, 및 TNFα. 사이토킨 생산은 U-PLEX 바이오마커 그룹 I (hu) 분석(Catalog 번호: K15067L-4)과 함께, Meso Scale Discovery Technology(MesoScale Diagnostics, LLC)를 사용하여 분석되었다. 모든 구조체에서 강력한 사이토킨 분비가 투여분량-의존적 방식으로 관찰되었다 (도 11).
추가 실험의 결과는 도 14와 동일한 구조체를 이용하여 도 15 및 도 16에 나타낸다. 동종이계 TCRγδ TFP T 세포 및 뮤린 TCRαβ T 세포는 CD19 양성 종양 세포 Nalm6-Luc에 대항하여 강력하고 특이적인 용해를 보이지만, 그러나 CD19 음성 종양 세포 K562-Luc에 대항해서는 그렇지 않았다(도 15). 모든 구조체에서 강력한 사이토킨 분비가 투여분량-의존적 방식으로 관찰되었다 (도 16). TFP+ 집단의 백분율은 구조체들간의 TFP 형질도입 효율의 차이를 설명하기 위해 그래프에 표시된다. αCD19 scFv가 있는 동종이계 TFP 세포들은 시험관 내에서 CD19+ 종양 세포를 효율적으로 용해시키고, 편집되지 않은 αCD19 TFP 세포들과 유사한 수준에서 사이토킨을 만들었다.
추가 실험 결과는 도 20-23에 나타낸다. 동종이계 뮤린 TCRα (FMC63mTRAC_P2A_mTRBC U5; FMC63SLmTRAC_P2A_mTRBC U5; FMC63mTRAC_T2A_mTRBC; FMC63mTRAC_T2A_mTRBC U5) 및 TCRαβ (FMC63SLmTRAC_P2A_FMC63SLmTRBC U5) TFP T 세포들은 CD19 양성 종양 세포 Nalm6-Luc에 대항하여 특이적이고, 강력한 용해를 보였지만, 그러나 CD19 음성 종양 세포 K562-Luc에 대항해서는 그렇지 않았다 (도 20). TFP+ 집단의 백분율은 구조체들간의 TFP 형질도입 효율의 차이를 설명하기 위해 그래프에 표시된다. 모든 구조체에서 강력한 사이토킨 분비가 투여분량-의존적 방식으로 관찰되었다 (도 21). 동종이계 TCRδ (FMC63TRDC T2A TRGC1), TCRγδ (FMC63TRDC_T2A_FM63opTRGC1), 및 TCRεFMC63TCRγ9G115T2Aδ2cl5P2AFMC63ε) TFP T 세포는 CD19 양성 종양 세포 Nalm6-Luc에 대항하여 특이적이고, 강력한 용해를 보였지만, 그러나 CD19 음성 종양 세포 K562-Luc에 대항해서는 그렇지 않았다 (도 22). TFP+ 집단의 백분율은 구조체들간의 TFP 형질도입 효율의 차이를 설명하기 위해 그래프에 표시된다. 모든 구조체에서 강력한 사이토킨 분비가 투여분량-의존적 방식으로 관찰되었다 (도 23). 도 22 및 도 23에서, TFP T 세포는 표적 세포에 3:1, 1:1, 및 0.1:1의 비율로 추가되었다. 도 21 및 도 23에서, 항-CD19-CD3ε TFP.TFP를 갖는 편집안된 T-세포에서 사이토킨 생산에 대해 표준화된 사이토킨 생산을 보여준다. 사이토킨 발현을 위해 TFPs를 발현시키는 인간 TCR-음성 T 세포의 MLR
혼합형 림프구 반응 (MLR) 검정을 이용하여, TFPs를 발현시키는 인간 TCR-음성 또는 TCR-양성 T 세포들의 동종이계성을 평가하였다. HLA-미스매치된, 시험관내-유래된 수지상 세포를 TCR-음성 또는 TCR-양성 TFP 발현 세포와 1:3(T:DC) 비율로, 72시간 동안 공동-배양했다. 분비된 사이토킨인은 위에서 설명한 대로, MSD 분석에 의해 상층액에서 측정되었다. TCR-음성 TFP-발현시키는 T 세포들은 편집되지 않은 TFP-발현시키는 T 세포에 비교하였을 때, 훨씬 적은 사이토킨을 분비했으며, HLA-미스매치된 수지상 세포와의 혼합형 백혈구 반응에서 동종반응을 나타내지 않았다. (도 17).
실시예 5: TFPs를 발현시키는 동종이계 TCR T 세포의 생체내 효과
Nalm6-luc 종양 마우스 모델을 이용하여 TFPs를 발현시키는 동종이계 TCR T 세포의 생체내 효과를 평가하였다. 종양 세포를 -10일 시점에서 NSG 마우스에게 주사하였다. 종양이 확립된 후, 0일 시점에 2.2x106의 편집안된, 또는 동종이계 TFP 세포를 마우스에게 1회 주사했다. TFP 세포 주입-후, 매 3일 마다 마우스의 영상촬영에 의해, 종양 부하를 평가했다. 생체내, 편집되지 않은 TFP-발현시키는 세포는 완전한 항-종양 활성을 나타내는 반면, 동종이계 TFP-발현시키는 세포들에서는 종양 퇴행이 나타났다 (도 18).
TFP-발현시키는 T 세포를 주사-후 50일 시점에, 종양을 품고 있지 않은 마우스로부터 간을 수거하였고, 인간 세포의 조직 침윤을 통해 이식편-대 숙주 질환(GvHD)에 대해 평가하였다. 마우스 간에서 인간 CD7+ 세포의 유동세포분석에서 αCD19-CD3ε를 발현시키는 편집되지 않은 T 세포로 처리된 동물에서 인간 세포의 침윤을 나타냈다(좌측 패널). TFP-발현시키는 동종이계 세포에서는 침윤이 관찰되지 않았고, 동종이계 세포로 처리된 마우스에서는 GvHD의 징후를 나타내지 않았다. 침윤 분석은 CD7+ 세포 염색에 대한 IHC 분석으로 확인되었다(n=2; 우측 패널).
표 5. 항원 결합 도메인서열.
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
표 6. 구조체 서열.
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
Figure pct00089
Figure pct00090
Figure pct00091
벡터 서열:
pLRPO V5-mTRAC(82-137) T2A mTRBC(123-173) (서열 식별 번호:159)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAggtaag cctatcccta accctctcct cggtctcgat tctacgGGAG
5281 CCACCTACCC CAGTTCAGAC GTTCCCTGTG ATGCCACGTT GACTGAGAAA AGCTTTGAAA
5341 CAGATATGAA CCTAAACTTT CAAAACCTGT CAGTTATGGG ACTCCGAATC CTCCTGCTGA
5401 AAGTAGCCGG ATTTAACCTG CTCATGACGC TGAGGCTGTG GTCCAGTGGC AGCGGCGAGG
5461 GCAGAGGAAG TCTGCTAACA TGCGGTGACG TCGAGGAGAA TCCTGGACCT GGTCGAGCAG
5521 ACTGTGGTAT TACCTCAGCA TCCTATCAAC AAGGAGTCTT GTCTGCCACC ATCCTCTATG
5581 AGATCCTGCT AGGGAAAGCC ACCCTGTATG CTGTGCTTGT CAGTACACTG GTGGTGATGG
5641 CTATGGTCAA AAGAAAGAAT TCATGAGATA TCGAGCATCT TACCGCCATT TATACCCATA
5701 TTTGTTCTGT TTTTCTTGAT TTGGGTATAC ATTTAAATGT TAATAAAACA AAATGGTGGG
5761 GCAATCATTT ACATTTTTAG GGATATGTAA TTACTAGTTC AGGTGTATTG CCACAAGACA
5821 AACATGTTAA GAAACTTTCC CGTTATTTAC GCTCTGTTCC TGTTAATCAA CCTCTGGATT
5881 ACAAAATTTG TGAAAGATTG ACTGATATTC TTAACTATGT TGCTCCTTTT ACGCTGTGTG
5941 GATATGCTGC TTTATAGCCT CTGTATCTAG CTATTGCTTC CCGTACGGCT TTCGTTTTCT
6001 CCTCCTTGTA TAAATCCTGG TTGCTGTCTC TTTTAGAGGA GTTGTGGCCC GTTGTCCGTC
6061 AACGTGGCGT GGTGTGCTCT GTGTTTGCTG ACGCAACCCC CACTGGCTGG GGCATTGCCA
6121 CCACCTGTCA ACTCCTTTCT GGGACTTTCG CTTTCCCCCT CCCGATCGCC ACGGCAGAAC
6181 TCATCGCCGC CTGCCTTGCC CGCTGCTGGA CAGGGGCTAG GTTGCTGGGC ACTGATAATT
6241 CCGTGGTGTT GTCAGTACTG GTACCTTTAA GACCAATGAC TTACAAGGCA GCTGTAGATC
6301 TTAGCCACTT TTTAAAAGAA AAGGGGGGAC TGGAAGGGCT AATTCACTCC CAAAGAAGAC
6361 AAGATCTGCT TTTTGCCTGT ACTGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC
6421 TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTTC
6481 AATGATCATA ATCAAGCCAT ATCACATCTG TAGAGGTTTA CTTGCTTTAA AAAACCTCCA
6541 CACCTCCCCC TGAACCTGAA ACATAAAATG AATGCAATTG TTGTTGTTAA CTTGTTTATT
6601 GCAGCTTATA ATGGTTACAA ATAAAGCAAT AGCATCACAA ATTTCACAAA TAAAGCATTT
6661 TTTTCACTGC ATTCTAGTTG TGGTTTGTCC AAACTCATCA ATGTATCTTA TCATGTCTGG
6721 ATCTGCGTCG ACACGAAGAG ACGACTGACT GACTGACTGG AAAGAGGAAG GGCTGGAAGA
6781 GGAAGGAGCT TGATCCAGAT CCCGATCTCG ATCCAGATCC GGATCGCAGC TTGGCGTAAT
6841 CATGGTCATA GCTGTTTCCT GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC
6901 GAGCCGGAAG CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA
6961 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG CTGCATTAAT
7021 GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG GCGCTCTTCC GCTTCCTCGC
7081 TCACTGACTC GCTGCGCTCG GTCGTTCGGC TGCGGCGAGC GGTATCAGCT CACTCAAAGG
7141 CGGTAATACG GTTATCCACA GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG
7201 GCCAGCAAAA GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC
7261 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA AACCCGACAG
7321 GACTATAAAG ATACCAGGCG TTTCCCCCTG GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA
7381 CCCTGCCGCT TACCGGATAC CTGTCCGCCT TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC
7441 ATAGCTCACG CTGTAGGTAT CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG
7501 TGCACGAACC CCCCGTTCAG CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT
7561 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC AGGATTAGCA
7621 GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG GTGGCCTAAC TACGGCTACA
7681 CTAGAAGAAC AGTATTTGGT ATCTGCGCTC TGCTGAAGCC AGTTACCTTC GGAAAAAGAG
7741 TTGGTAGCTC TTGATCCGGC AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA
7801 AGCAGCAGAT TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG
7861 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG AGATTATCAA
7921 AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG TTTTAAATCA ATCTAAAGTA
7981 TATATGAGTA AACTTGGTCT GACAGTTACC AATGCTTAAT CAGTGAGGCA CCTATCTCAG
8041 CGATCTGTCT ATTTCGTTCA TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA
8101 TACGGGAGGG CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCAGCTT GGGAAACCAT
8161 AAGAGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA
8221 CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG
8281 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT
8341 CACGTTAAGG GATTTTGGTC ATGAGCTTGC GCCGTCCCGT CAAGTCAGCG TAATGCTCTG
8401 CCAGTGTTAC AA
pLRPO FMC63-mTRAC(82-137) T2A mTRBC(123-173) (서열 식별 번호:160)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
5281 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
5341 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
5401 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
5461 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
5521 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGAGG TGGAGGTTCT GGTGGAGGAG
5581 GTTCAGGAGG TGGTGGAAGT GAGGTGAAAC TGCAGGAGTC AGGACCTGGC CTGGTGGCGC
5641 CCTCACAGAG CCTGTCCGTC ACATGCACTG TCTCAGGGGT CTCATTACCC GACTATGGTG
5701 TAAGCTGGAT TCGCCAGCCT CCACGAAAGG GTCTGGAGTG GCTGGGAGTA ATATGGGGTA
5761 GTGAAACCAC ATACTATAAT TCAGCTCTCA AATCCAGACT GACCATCATC AAGGACAACT
5821 CCAAGAGCCA AGTTTTCTTA AAAATGAACA GTCTGCAAAC TGATGACACA GCCATTTACT
5881 ACTGTGCCAA ACATTATTAC TACGGTGGTA GCTATGCTAT GGACTACTGG GGTCAAGGAA
5941 CCTCAGTCAC CGTCTCCTCA GGAGCCACCT ACCCCAGTTC AGACGTTCCC TGTGATGCCA
6001 CGTTGACTGA GAAAAGCTTT GAAACAGATA TGAACCTAAA CTTTCAAAAC CTGTCAGTTA
6061 TGGGACTCCG AATCCTCCTG CTGAAAGTAG CCGGATTTAA CCTGCTCATG ACGCTGAGGC
6121 TGTGGTCCAG TGGCAGCGGC GAGGGCAGAG GAAGTCTGCT AACATGCGGT GACGTCGAGG
6181 AGAATCCTGG ACCTGGTCGA GCAGACTGTG GTATTACCTC AGCATCCTAT CAACAAGGAG
6241 TCTTGTCTGC CACCATCCTC TATGAGATCC TGCTAGGGAA AGCCACCCTG TATGCTGTGC
6301 TTGTCAGTAC ACTGGTGGTG ATGGCTATGG TCAAAAGAAA GAATTCATGA GATATCGAGC
6361 ATCTTACCGC CATTTATACC CATATTTGTT CTGTTTTTCT TGATTTGGGT ATACATTTAA
6421 ATGTTAATAA AACAAAATGG TGGGGCAATC ATTTACATTT TTAGGGATAT GTAATTACTA
6481 GTTCAGGTGT ATTGCCACAA GACAAACATG TTAAGAAACT TTCCCGTTAT TTACGCTCTG
6541 TTCCTGTTAA TCAACCTCTG GATTACAAAA TTTGTGAAAG ATTGACTGAT ATTCTTAACT
6601 ATGTTGCTCC TTTTACGCTG TGTGGATATG CTGCTTTATA GCCTCTGTAT CTAGCTATTG
6661 CTTCCCGTAC GGCTTTCGTT TTCTCCTCCT TGTATAAATC CTGGTTGCTG TCTCTTTTAG
6721 AGGAGTTGTG GCCCGTTGTC CGTCAACGTG GCGTGGTGTG CTCTGTGTTT GCTGACGCAA
6781 CCCCCACTGG CTGGGGCATT GCCACCACCT GTCAACTCCT TTCTGGGACT TTCGCTTTCC
6841 CCCTCCCGAT CGCCACGGCA GAACTCATCG CCGCCTGCCT TGCCCGCTGC TGGACAGGGG
6901 CTAGGTTGCT GGGCACTGAT AATTCCGTGG TGTTGTCAGT ACTGGTACCT TTAAGACCAA
6961 TGACTTACAA GGCAGCTGTA GATCTTAGCC ACTTTTTAAA AGAAAAGGGG GGACTGGAAG
7021 GGCTAATTCA CTCCCAAAGA AGACAAGATC TGCTTTTTGC CTGTACTGGG TCTCTCTGGT
7081 TAGACCAGAT CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG CTTAAGCCTC
7141 AATAAAGCTT GCCTTGAGTG CTTCAATGAT CATAATCAAG CCATATCACA TCTGTAGAGG
7201 TTTACTTGCT TTAAAAAACC TCCACACCTC CCCCTGAACC TGAAACATAA AATGAATGCA
7261 ATTGTTGTTG TTAACTTGTT TATTGCAGCT TATAATGGTT ACAAATAAAG CAATAGCATC
7321 ACAAATTTCA CAAATAAAGC ATTTTTTTCA CTGCATTCTA GTTGTGGTTT GTCCAAACTC
7381 ATCAATGTAT CTTATCATGT CTGGATCTGC GTCGACACGA AGAGACGACT GACTGACTGA
7441 CTGGAAAGAG GAAGGGCTGG AAGAGGAAGG AGCTTGATCC AGATCCCGAT CTCGATCCAG
7501 ATCCGGATCG CAGCTTGGCG TAATCATGGT CATAGCTGTT TCCTGTGTGA AATTGTTATC
7561 CGCTCACAAT TCCACACAAC ATACGAGCCG GAAGCATAAA GTGTAAAGCC TGGGGTGCCT
7621 AATGAGTGAG CTAACTCACA TTAATTGCGT TGCGCTCACT GCCCGCTTTC CAGTCGGGAA
7681 ACCTGTCGTG CCAGCTGCAT TAATGAATCG GCCAACGCGC GGGGAGAGGC GGTTTGCGTA
7741 TTGGGCGCTC TTCCGCTTCC TCGCTCACTG ACTCGCTGCG CTCGGTCGTT CGGCTGCGGC
7801 GAGCGGTATC AGCTCACTCA AAGGCGGTAA TACGGTTATC CACAGAATCA GGGGATAACG
7861 CAGGAAAGAA CATGTGAGCA AAAGGCCAGC AAAAGGCCAG GAACCGTAAA AAGGCCGCGT
7921 TGCTGGCGTT TTTCCATAGG CTCCGCCCCC CTGACGAGCA TCACAAAAAT CGACGCTCAA
7981 GTCAGAGGTG GCGAAACCCG ACAGGACTAT AAAGATACCA GGCGTTTCCC CCTGGAAGCT
8041 CCCTCGTGCG CTCTCCTGTT CCGACCCTGC CGCTTACCGG ATACCTGTCC GCCTTTCTCC
8101 CTTCGGGAAG CGTGGCGCTT TCTCATAGCT CACGCTGTAG GTATCTCAGT TCGGTGTAGG
8161 TCGTTCGCTC CAAGCTGGGC TGTGTGCACG AACCCCCCGT TCAGCCCGAC CGCTGCGCCT
8221 TATCCGGTAA CTATCGTCTT GAGTCCAACC CGGTAAGACA CGACTTATCG CCACTGGCAG
8281 CAGCCACTGG TAACAGGATT AGCAGAGCGA GGTATGTAGG CGGTGCTACA GAGTTCTTGA
8341 AGTGGTGGCC TAACTACGGC TACACTAGAA GAACAGTATT TGGTATCTGC GCTCTGCTGA
8401 AGCCAGTTAC CTTCGGAAAA AGAGTTGGTA GCTCTTGATC CGGCAAACAA ACCACCGCTG
8461 GTAGCGGTGG TTTTTTTGTT TGCAAGCAGC AGATTACGCG CAGAAAAAAA GGATCTCAAG
8521 AAGATCCTTT GATCTTTTCT ACGGGGTCTG ACGCTCAGTG GAACGAAAAC TCACGTTAAG
8581 GGATTTTGGT CATGAGATTA TCAAAAAGGA TCTTCACCTA GATCCTTTTA AATTAAAAAT
8641 GAAGTTTTAA ATCAATCTAA AGTATATATG AGTAAACTTG GTCTGACAGT TACCAATGCT
8701 TAATCAGTGA GGCACCTATC TCAGCGATCT GTCTATTTCG TTCATCCATA GTTGCCTGAC
8761 TCCCCGTCGT GTAGATAACT ACGATACGGG AGGGCTTACC ATCTGGCCCC AGTGCTGCAA
8821 TGATACCGCA GCTTGGGAAA CCATAAGAGC TGAAGCCAGT TACCTTCGGA AAAAGAGTTG
8881 GTAGCTCTTG ATCCGGCAAA CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC
8941 AGCAGATTAC GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT
9001 CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGC TTGCGCCGTC
9061 CCGTCAAGTC AGCGTAATGC TCTGCCAGTG TTACAA
pLRPO FMC63mTRAC_P2A_Mtrbc (서열 식별 번호:161)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGCGTAATCA
361 TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA
421 GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG TGAGCTAACT CACATTAATT
481 GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA
541 ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC
601 ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG
661 GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC
721 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC
781 CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA
841 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC
901 CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT
961 AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG
1021 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC
1081 AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
1141 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
1201 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
1261 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
1321 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
1381 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
1441 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
1501 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
1561 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA
1621 CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCAGCTTGG GAAACCATAA
1681 GAGCTGAAGC CAGTTACCTT CGGAAAAAGA GTTGGTAGCT CTTGATCCGG CAAACAAACC
1741 ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC AAGCAGCAGA TTACGCGCAG AAAAAAAGGA
1801 TCTCAAGAAG ATCCTTTGAT CTTTTCTACG GGGTCTGACG CTCAGTGGAA CGAAAACTCA
1861 CGTTAAGGGA TTTTGGTCAT GAGCTTGCGC CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC
1921 AGTGTTACAA CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT
1981 GCAATTTATT CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG
2041 AAGGAGAAAA CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA
2101 TTCCGACTCG TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT
2161 CAAGTGAGAA ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA
2221 TTTCTTTCCA GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT
2281 CAACCAAACC GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT
2341 TAAAAGGACA ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT
2401 CAACAATATT TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG
2461 GGATCGCAGT GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG
2521 GAAGAGGCAT AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG
2581 CAACGCTACC TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC
2641 GATAGATTGT CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT
2701 CAGCATCCAT GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA
2761 CACCCCTTGT ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT
2821 TATCTTGTGC AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC
2881 CATGACATTA ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC
2941 GAGATAGAGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC
3001 TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA
3061 CCCAAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG
3121 AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAG
3181 AAAGCGAAAG GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC
3241 ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA
3301 TGCGGTGTGA AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC
3361 CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC
3421 AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC
3481 AGTCACGACG TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA
3541 TCCAGATCGA ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG
3601 TCTCAACCTC CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG
3661 TCATTAGTTC ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG
3721 CCTGGCTGAC CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA
3781 GTAACGCCAA TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC
3841 CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC
3901 GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG
3961 CAGTACATCT ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC
4021 AATGGGCGTG GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC
4081 AATGGGAGTT TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC
4141 GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT
4201 CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA
4261 ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG
4321 TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG
4381 GAAAATCTCT AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG
4441 ATCTCTCGAC GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA
4501 CTGGTGAGTA CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG
4561 AGCGTCGGTA TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG
4621 GGGAAAGAAA CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT
4681 CGCAGTTAAT CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT
4741 ACAACCATCC CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT
4801 CCTCTATTGT GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT
4861 AGAGGAAGAG CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCAGACCTGGAGG
4921 AGGCAGGAGG CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA
4981 AAATTGAACC ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA
5041 AAAGAGCAGT GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA
5101 TGGGCGCAGC GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC
5161 AGCAGCAGAA CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG
5221 TCTGGGGCAT CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC
5281 AACAGCTCCT GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT
5341 GGAATGCTAG TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG
5401 AGTGGGACAG AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC
5461 AAAACCAGCA AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT
5521 GGAATTGGTT TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG
5581 GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC
5641 AGGGATATTC ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC
5701 AAATGGCAGT ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG
5761 GGGAAAGAAT AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA
5821 TTACAAAAAT TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG
5881 CTGAGCATCC GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA
5941 GAAGTTGGGG GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA
6001 CTGGGAAAGT GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA
6061 TATAAGTGCA GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA
6121 GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT
6181 GCCTTGAATT ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG
6241 TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT
6301 GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG
6361 CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA
6421 CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT
6481 CGGTTTTTGG GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA
6541 GGCGGGGCCT GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC
6601 CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG
6661 CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA
6721 GCTCAAAATG GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA
6781 AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT
6841 CCAGGCACCT CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG
6901 GGTTTTATGC GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT
6961 GGCACTTGAT GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC
7021 TCAAGCCTCA GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC
7081 CCCTCAGAGC CGCCACCATG CTTCTCCTGG TGACAAGCCT TCTGCTCTGT GAGTTACCAC
7141 ACCCAGCATT CCTCCTGATC CCAGACATCC AGATGACACA GACTACATCC TCCCTGTCTG
7201 CCTCTCTGGG AGACAGAGTC ACCATCAGTT GCAGGGCAAG TCAGGACATT AGTAAATATT
7261 TAAATTGGTA TCAGCAGAAA CCAGATGGAA CTGTTAAACT CCTGATCTAC CATACATCAA
7321 GATTACACTC AGGAGTCCCA TCAAGGTTCA GTGGCAGTGG GTCTGGAACA GATTATTCTC
7381 TCACCATTAG CAACCTGGAG CAAGAAGATA TTGCCACTTA CTTTTGCCAA CAGGGTAATA
7441 CGCTTCCGTA CACGTTCGGA GGGGGGACTA AGTTGGAAAT AACAGGAGGT GGAGGTTCTG
7501 GTGGAGGAGG TTCAGGAGGT GGTGGAAGTG AGGTGAAACT GCAGGAGTCA GGACCTGGCC
7561 TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC TCATTACCCG
7621 ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG CTGGGAGTAA
7681 TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG ACCATCATCA
7741 AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT GATGACACAG
7801 CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG GACTACTGGG
7861 GTCAAGGAAC CTCAGTCACC GTCTCCTCAG GAATTCAGAA CCCTGAGCCT GCCGTGTACC
7921 AGCTGAAGGA CCCTAGAAGC CAGGACAGCA CCCTGTGCCT GTTCACCGAC TTCGACAGCC
7981 AGATCAACGT GCCCAAGACC ATGGAAAGCG GCACCTTCAT CACCGATAAG ACTGTGCTGG
8041 ACATGAAGGC CATGGACAGC AAGAGCAACG GCGCCATTGC NTGGTCCAAT CAGACCAGCT
8101 TTACCTGCCA AGACATCTTC AAAGAGACAA ACGCCACCTA CCCCAGTTCA GACGTTCCCT
8161 GTGATGCCAC GTTGACTGAG AAAAGCTTTG AAACAGATAT GAACCTAAAC TTTCAAAACC
8221 TGTCAGTTAT GGGACTCCGA ATCCTCCTGC TGAAAGTAGC CGGATTTAAC CTGCTCATGA
8281 CGCTGAGGCT GTGGTCCAGT GGCAGCGGCG CTACTAACTT CAGCCTGCTG AAGCAGGCTG
8341 GAGACGTGGA GGAGAACCCT GGACCTGATC TGAGAAATGT GACTCCACCC AAGGTCTCCT
8401 TGTTTGAGCC ATCAAAAGCA GAGATTGCAA ACAAACAAAA GGCTACCCTC GTGTGCTTGG
8461 CCAGGGGCTT CTTCCCTGAC CACGTGGAGC TGAGCTGGTG GGTGAATGGC AAGGAGGTCC
8521 ACAGTGGGGT CAGCACGGAC CCTCAGGCCT ACAAGGAGAG CAATTATAGC TACTGCCTGA
8581 GCAGCCGCCT GAGGGTCTCT GCTACCTTCT GGCACAATCC TCGCAACCAC TTCCGCTGCC
8641 AAGTGCAGTT CCATGGGCTT TCAGAGGAGG ACAAGTGGCC AGAGGGCTCA CCCAAACCTG
8701 TCACACAGAA CATCAGTGCA GAGGCCTGGG GTCGAGCAGA CTGTGGTATT ACCTCAGCAT
8761 CCTATCAACA AGGAGTCTTG TCTGCCACCA TCCTCTATGA GATCCTGCTA GGGAAAGCCA
8821 CCCTGTATGC TGTGCTTGTC AGTACACTGG TGGTGATGGC TATGGTCAAA AGAAAGAATT
8881 CATGAGATAT CGAGCATCTT ACCGCCATTT ATACCCATAT TTGTTCTGTT TTTCTTGATT
8941 TGGGTATACA TTTAAATGTT AATAAAACAA AATGGTGGGG CAATCATTTA CATTTTTAGG
9001 GATATGTAAT TACTAGTTCA GGTGTATTGC CACAAGACAA ACATGTTAAG AAACTTTCCC
9061 GTTATTTACG CTCTGTTCCT GTTAATCAAC CTCTGGATTA CAAAATTTGT GAAAGATTGA
9121 CTGATATTCT TAACTATGTT GCTCCTTTTA CGCTGTGTGG ATATGCTGCT TTATAGCCTC
9181 TGTATCTAGC TATTGCTTCC CGTACGGCTT TCGTTTTCTC CTCCTTGTAT AAATCCTGGT
9241 TGCTGTCTCT TTTAGAGGAG TTGTGGCCCG TTGTCCGTCA ACGTGGCGTG GTGTGCTCTG
9301 TGTTTGCTGA CGCAACCCCC ACTGGCTGGG GCATTGCCAC CACCTGTCAA CTCCTTTCTG
9361 GGACTTTCGC TTTCCCCCTC CCGATCGCCA CGGCAGAACT CATCGCCGCC TGCCTTGCCC
9421 GCTGCTGGAC AGGGGCTAGG TTGCTGGGCA CTGATAATTC CGTGGTGTTG TCAGTACTGG
9481 TACCTTTAAG ACCAATGACT TACAAGGCAG CTGTAGATCT TAGCCACTTT TTAAAAGAAA
9541 AGGGGGGACT GGAAGGGCTA ATTCACTCCC AAAGAAGACA AGATCTGCTT TTTGCCTGTA
9601 CTGGGTCTCT CTGGTTAGAC CAGATCTGAG CCTGGGAGCT CTCTGGCTAA CTAGGGAACC
9661 CACTGCTTAA GCCTCAATAA AGCTTGCCTT GAGTGCTTCA A
pLRPO Jet_FMC63mTRAC_T2A_mTRBC (서열 식별 번호:162)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGCGTAATCA
361 TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA
421 GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG TGAGCTAACT CACATTAATT
481 GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA
541 ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC
601 ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG
661 GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC
721 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC
781 CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA
841 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC
901 CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT
961 AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG
1021 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC
1081 AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
1141 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
1201 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
1261 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
1321 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
1381 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
1441 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
1501 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
1561 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA
1621 CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCAGCTTGG GAAACCATAA
1681 GAGCTGAAGC CAGTTACCTT CGGAAAAAGA GTTGGTAGCT CTTGATCCGG CAAACAAACC
1741 ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC AAGCAGCAGA TTACGCGCAG AAAAAAAGGA
1801 TCTCAAGAAG ATCCTTTGAT CTTTTCTACG GGGTCTGACG CTCAGTGGAA CGAAAACTCA
1861 CGTTAAGGGA TTTTGGTCAT GAGCTTGCGC CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC
1921 AGTGTTACAA CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT
1981 GCAATTTATT CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG
2041 AAGGAGAAAA CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA
2101 TTCCGACTCG TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT
2161 CAAGTGAGAA ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA
2221 TTTCTTTCCA GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT
2281 CAACCAAACC GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT
2341 TAAAAGGACA ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT
2401 CAACAATATT TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG
2461 GGATCGCAGT GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG
2521 GAAGAGGCAT AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG
2581 CAACGCTACC TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC
2641 GATAGATTGT CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT
2701 CAGCATCCAT GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA
2761 CACCCCTTGT ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT
2821 TATCTTGTGC AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC
2881 CATGACATTA ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC
2941 GAGATAGAGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC
3001 TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA
3061 CCCAAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG
3121 AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAG
3181 AAAGCGAAAG GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC
3241 ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA
3301 TGCGGTGTGA AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC
3361 CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC
3421 AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC
3481 AGTCACGACG TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA
3541 TCCAGATCGA ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG
3601 TCTCAACCTC CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG
3661 TCATTAGTTC ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG
3721 CCTGGCTGAC CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA
3781 GTAACGCCAA TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC
3841 CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC
3901 GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG
3961 CAGTACATCT ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC
4021 AATGGGCGTG GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC
4081 AATGGGAGTT TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC
4141 GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT
4201 CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA
4261 ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG
4321 TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG
4381 GAAAATCTCT AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG
4441 ATCTCTCGAC GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA
4501 CTGGTGAGTA CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG
4561 AGCGTCGGTA TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG
4621 GGGAAAGAAA CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT
4681 CGCAGTTAAT CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT
4741 ACAACCATCC CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT
4801 CCTCTATTGT GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT
4861 AGAGGAAGAG CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCAGACCTGGAGG
4921 AGGCAGGAGG CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA
4981 AAATTGAACC ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA
5041 AAAGAGCAGT GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA
5101 TGGGCGCAGC GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC
5161 AGCAGCAGAA CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG
5221 TCTGGGGCAT CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC
5281 AACAGCTCCT GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT
5341 GGAATGCTAG TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG
5401 AGTGGGACAG AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC
5461 AAAACCAGCA AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT
5521 GGAATTGGTT TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG
5581 GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC
5641 AGGGATATTC ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC
5701 AAATGGCAGT ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG
5761 GGGAAAGAAT AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA
5821 TTACAAAAAT TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG
5881 CTGAGCTAGC GGGCGGAGTT AGGGCGGAGC CAATCAGCGT GCGCCGTTCC GAAAGTTGCC
5941 TTTTATGGCT GGGCGGAGAA TGGGCGGTGA ACGCCGATGA TTATATAAGG ACGCGCCGGG
6001 TGTGGCACAG CTAGTTCCGT CGCAGCCGGG ATTTGGGTCG CGGTTCTTGT TTGTTCAGAG
6061 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
6121 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
6181 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
6241 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
6301 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
6361 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
6421 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGAGG TGGAGGTTCT GGTGGAGGAG
6481 GTTCAGGAGG TGGTGGAAGT GAGGTGAAAC TGCAGGAGTC AGGACCTGGC CTGGTGGCGC
6541 CCTCACAGAG CCTGTCCGTC ACATGCACTG TCTCAGGGGT CTCATTACCC GACTATGGTG
6601 TAAGCTGGAT TCGCCAGCCT CCACGAAAGG GTCTGGAGTG GCTGGGAGTA ATATGGGGTA
6661 GTGAAACCAC ATACTATAAT TCAGCTCTCA AATCCAGACT GACCATCATC AAGGACAACT
6721 CCAAGAGCCA AGTTTTCTTA AAAATGAACA GTCTGCAAAC TGATGACACA GCCATTTACT
6781 ACTGTGCCAA ACATTATTAC TACGGTGGTA GCTATGCTAT GGACTACTGG GGTCAAGGAA
6841 CCTCAGTCAC CGTCTCCTCA GGAATTCAGA ACCCTGAGCC TGCCGTGTAC CAGCTGAAGG
6901 ACCCTAGAAG CCAGGACAGC ACCCTGTGCC TGTTCACCGA CTTCGACAGC CAGATCAACG
6961 TGCCCAAGAC CATGGAAAGC GGCACCTTCA TCACCGATAA GACTGTGCTG GACATGAAGG
7021 CCATGGACAG CAAGAGCAAC GGCGCCATTG CNTGGTCCAA TCAGACCAGC TTTACCTGCC
7081 AAGACATCTT CAAAGAGACA AACGCCACCT ACCCCAGTTC AGACGTTCCC TGTGATGCCA
7141 CGTTGACTGA GAAAAGCTTT GAAACAGATA TGAACCTAAA CTTTCAAAAC CTGTCAGTTA
7201 TGGGACTCCG AATCCTCCTG CTGAAAGTAG CCGGATTTAA CCTGCTCATG ACGCTGAGGC
7261 TGTGGTCCAG TGGCAGCGGC GAGGGCAGAG GAAGTCTGCT AACATGCGGT GACGTCGAGG
7321 AGAATCCTGG ACCTGATCTG AGAAATGTGA CTCCACCCAA GGTCTCCTTG TTTGAGCCAT
7381 CAAAAGCAGA GATTGCAAAC AAACAAAAGG CTACCCTCGT GTGCTTGGCC AGGGGCTTCT
7441 TCCCTGACCA CGTGGAGCTG AGCTGGTGGG TGAATGGCAA GGAGGTCCAC AGTGGGGTCA
7501 GCACGGACCC TCAGGCCTAC AAGGAGAGCA ATTATAGCTA CTGCCTGAGC AGCCGCCTGA
7561 GGGTCTCTGC TACCTTCTGG CACAATCCTC GCAACCACTT CCGCTGCCAA GTGCAGTTCC
7621 ATGGGCTTTC AGAGGAGGAC AAGTGGCCAG AGGGCTCACC CAAACCTGTC ACACAGAACA
7681 TCAGTGCAGA GGCCTGGGGT CGAGCAGACT GTGGTATTAC CTCAGCATCC TATCAACAAG
7741 GAGTCTTGTC TGCCACCATC CTCTATGAGA TCCTGCTAGG GAAAGCCACC CTGTATGCTG
7801 TGCTTGTCAG TACACTGGTG GTGATGGCTA TGGTCAAAAG AAAGAATTCA TGAGATATCG
7861 AGCATCTTAC CGCCATTTAT ACCCATATTT GTTCTGTTTT TCTTGATTTG GGTATACATT
7921 TAAATGTTAA TAAAACAAAA TGGTGGGGCA ATCATTTACA TTTTTAGGGA TATGTAATTA
7981 CTAGTTCAGG TGTATTGCCA CAAGACAAAC ATGTTAAGAA ACTTTCCCGT TATTTACGCT
8041 CTGTTCCTGT TAATCAACCT CTGGATTACA AAATTTGTGA AAGATTGACT GATATTCTTA
8101 ACTATGTTGC TCCTTTTACG CTGTGTGGAT ATGCTGCTTT ATAGCCTCTG TATCTAGCTA
8161 TTGCTTCCCG TACGGCTTTC GTTTTCTCCT CCTTGTATAA ATCCTGGTTG CTGTCTCTTT
8221 TAGAGGAGTT GTGGCCCGTT GTCCGTCAAC GTGGCGTGGT GTGCTCTGTG TTTGCTGACG
8281 CAACCCCCAC TGGCTGGGGC ATTGCCACCA CCTGTCAACT CCTTTCTGGG ACTTTCGCTT
8341 TCCCCCTCCC GATCGCCACG GCAGAACTCA TCGCCGCCTG CCTTGCCCGC TGCTGGACAG
8401 GGGCTAGGTT GCTGGGCACT GATAATTCCG TGGTGTTGTC AGTACTGGTA CCTTTAAGAC
8461 CAATGACTTA CAAGGCAGCT GTAGATCTTA GCCACTTTTT AAAAGAAAAG GGGGGACTGG
8521 AAGGGCTAAT TCACTCCCAA AGAAGACAAG ATCTGCTTTT TGCCTGTACT GGGTCTCTCT
8581 GGTTAGACCA GATCTGAGCC TGGGAGCTCT CTGGCTAACT AGGGAACCCA CTGCTTAAGC
8641 CTCAATAAAG CTTGCCTTGA GTGCTTCAA
pLRPC FMC63SLmTRAC(82-137) T2A optiFMC63SLmTRBC(123-173) (서열 식별 번호:163)
1 AAAGCTGAGC ATCCGGCTCC GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC
61 CCGAGAAGTT GGGGGGAGGG GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG
121 TAAACTGGGA AAGTGATGTC GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC
181 CGTATATAAG TGCAGTAGTC GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA
241 CACAGGTAAG TGCCGTGTGT GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT
301 GCGTGCCTTG AATTACTTCC ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT
361 CGGGTTGGAA GTGGGTGGGA GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT
421 GCTTGAGTTG AGGCCTGGCC TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT
481 CGCGCCTGTC TCGCTGCTTT CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT
541 GCGACGCTTT TTTTCTGGCA AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT
601 ATTTCGGTTT TTGGGGCCGC GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG
661 GCGAGGCGGG GCCTGCGAGC GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC
721 CGGCCTGCTC TGGTGCCTGG CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG
781 CTGGCCCGGT CGGCACCAGT TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA
841 GGGAGCTCAA AATGGAGGAC GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA
901 AGGAAAAGGG CCTTTCCGTC CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG
961 CCGTCCAGGC ACCTCGATTA GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG
1021 GAGGGGTTTT ATGCGATGGA GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA
1081 GCTTGGCACT TGATGTAATT CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC
1141 ATTCTCAAGC CTCAGACAGT GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA
1201 CTACCCCTCT AGAGCCGCCA CCATGCTTCT CCTGGTGACA AGCCTTCTGC TCTGTGAGTT
1261 ACCACACCCA GCATTCCTCC TGATCCCAGA CATCCAGATG ACACAGACTA CATCCTCCCT
1321 GTCTGCCTCT CTGGGAGACA GAGTCACCAT CAGTTGCAGG GCAAGTCAGG ACATTAGTAA
1381 ATATTTAAAT TGGTATCAGC AGAAACCAGA TGGAACTGTT AAACTCCTGA TCTACCATAC
1441 ATCAAGATTA CACTCAGGAG TCCCATCAAG GTTCAGTGGC AGTGGGTCTG GAACAGATTA
1501 TTCTCTCACC ATTAGCAACC TGGAGCAAGA AGATATTGCC ACTTACTTTT GCCAACAGGG
1561 TAATACGCTT CCGTACACGT TCGGAGGGGG GACTAAGTTG GAAATAACAG GCTCCACCTC
1621 TGGATCCGGC AAGCCCGGAT CTGGCGAGGG ATCCACCAAG GGCGAGGTGA AACTGCAGGA
1681 GTCAGGACCT GGCCTGGTGG CGCCCTCACA GAGCCTGTCC GTCACATGCA CTGTCTCAGG
1741 GGTCTCATTA CCCGACTATG GTGTAAGCTG GATTCGCCAG CCTCCACGAA AGGGTCTGGA
1801 GTGGCTGGGA GTAATATGGG GTAGTGAAAC CACATACTAT AATTCAGCTC TCAAATCCAG
1861 ACTGACCATC ATCAAGGACA ACTCCAAGAG CCAAGTTTTC TTAAAAATGA ACAGTCTGCA
1921 AACTGATGAC ACAGCCATTT ACTACTGTGC CAAACATTAT TACTACGGTG GTAGCTATGC
1981 TATGGACTAC TGGGGTCAAG GAACCTCAGT CACCGTCTCC TCAGCGGCCG CAGGTGGAGG
2041 AGGTTCTGGA GGTGGTGGAT CAGGTGGTGG AGGATCTTTA GAAGGAGCCA CCTACCCCAG
2101 TTCAGACGTT CCCTGTGATG CCACGTTGAC TGAGAAAAGC TTTGAAACAG ATATGAACCT
2161 AAACTTTCAA AACCTGTCAG TTATGGGACT CCGAATCCTC CTGCTGAAAG TAGCCGGATT
2221 TAACCTGCTC ATGACGCTGA GGCTGTGGTC CAGTGGGTCA GGCGAGGGCA GAGGAAGTCT
2281 GCTAACATGC GGTGACGTCG AGGAGAATCC TGGACCTATG CTACTACTTG TGACCTCACT
2341 ATTGTTATGC GAACTCCCTC ATCCCGCATT CTTGCTGATT CCAGACATTC AGATGACTCA
2401 AACAACTTCC AGCCTCTCCG CCTCACTCGG CGACCGCGTA ACAATAAGCT GTCGGGCCTC
2461 GCAAGATATT AGTAAGTACC TGAATTGGTA TCAGCAAAAA CCCGATGGTA CAGTCAAGCT
2521 TCTGATCTAC CATACCAGTC GTCTGCACAG CGGTGTCCCC AGCAGGTTCA GCGGCTCAGG
2581 ATCTGGTACC GATTATTCAC TGACGATTTC CAACCTTGAG CAGGAGGACA TCGCCACCTA
2641 CTTCTGCCAG CAGGGTAATA CTCTGCCGTA CACATTCGGG GGCGGTACCA AGCTCGAGAT
2701 CACGGGTTCA ACAAGCGGTT CTGGCAAGCC AGGCAGCGGC GAGGGGAGTA CAAAGGGGGA
2761 GGTGAAGTTG CAGGAAAGTG GCCCTGGATT GGTGGCCCCG AGCCAGAGTC TGTCTGTCAC
2821 CTGCACAGTT TCCGGAGTAA GTCTGCCTGA TTACGGAGTG TCCTGGATCA GACAGCCACC
2881 TCGAAAGGGC TTGGAGTGGC TTGGGGTCAT TTGGGGCAGT GAAACCACAT ACTACAACAG
2941 CGCTCTTAAG TCCAGGCTCA CTATCATCAA GGACAATTCA AAGAGCCAAG TATTCTTGAA
3001 AATGAATTCC CTGCAGACTG ATGACACCGC TATTTATTAT TGCGCTAAAC ATTATTACTA
3061 TGGAGGTTCT TATGCCATGG ACTACTGGGG GCAGGGTACC TCTGTGACAG TGAGTTCAGC
3121 TGCAGCTGGA GGTGGAGGTA GCGGAGGCGG TGGTAGTGGA GGGGGTGGTT CTCTGGAAGG
3181 TCGAGCAGAC TGTGGTATTA CCTCAGCATC CTATCAACAA GGAGTCTTGT CTGCCACCAT
3241 CCTCTATGAG ATCCTGCTAG GGAAAGCCAC CCTGTATGCT GTGCTTGTCA GTACACTGGT
3301 GGTGATGGCT ATGGTCAAAA GAAAGAATTC ATGAGATATC GAGCATCTTA CCGCCATTTA
3361 TACCCATATT TGTTCTGTTT TTCTTGATTT GGGTATACAT TTAAATGTTA ATAAAACAAA
3421 ATGGTGGGGC AATCATTTAC ATTTTTAGGG ATATGTAATT ACTAGTTCAG GTGTATTGCC
3481 ACAAGACAAA CATGTTAAGA AACTTTCCCG TTATTTACGC TCTGTTCCTG TTAATCAACC
3541 TCTGGATTAC AAAATTTGTG AAAGATTGAC TGATATTCTT AACTATGTTG CTCCTTTTAC
3601 GCTGTGTGGA TATGCTGCTT TATAGCCTCT GTATCTAGCT ATTGCTTCCC GTACGGCTTT
3661 CGTTTTCTCC TCCTTGTATA AATCCTGGTT GCTGTCTCTT TTAGAGGAGT TGTGGCCCGT
3721 TGTCCGTCAA CGTGGCGTGG TGTGCTCTGT GTTTGCTGAC GCAACCCCCA CTGGCTGGGG
3781 CATTGCCACC ACCTGTCAAC TCCTTTCTGG GACTTTCGCT TTCCCCCTCC CGATCGCCAC
3841 GGCAGAACTC ATCGCCGCCT GCCTTGCCCG CTGCTGGACA GGGGCTAGGT TGCTGGGCAC
3901 TGATAATTCC GTGGTGTTGT CAGTACTGGT ACCTTTAAGA CCAATGACTT ACAAGGCAGC
3961 TGTAGATCTT AGCCACTTTT TAAAAGAAAA GGGGGGACTG GAAGGGCTAA TTCACTCCCA
4021 AAGAAGACAA GATCTGCTTT TTGCCTGTAC TGGGTCTCTC TGGTTAGACC AGATCTGAGC
4081 CTGGGAGCTC TCTGGCTAAC TAGGGAACCC ACTGCTTAAG CCTCAATAAA GCTTGCCTTG
4141 AGTGCTTCAA TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA
4201 AACCTCCACA CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT
4261 TGTTTATTGC AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA
4321 AAGCATTTTT TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC
4381 ATGTCTGGAT CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG
4441 CTGGAAGAGG AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT
4501 GGCGTAATCA TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA
4561 CAACATACGA GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG TGAGCTAACT
4621 CACATTAATT GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT
4681 GCATTAATGA ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC
4741 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
4801 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
4861 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
4921 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
4981 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
5041 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
5101 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
5161 GGGCTGTGTG CACGAACCCC CCCGGTAAGA CACGACTTAT CGCCACTGGC AGCAGCCACT
5221 GGTAACAGGA TTAGCAGAGC GAGGTATGTA GGCGGTGCTA CAGAGTTCTT GAAGTGGTGG
5281 CCTAACTACG GCTACACTAG AAGAACAGTA TTTGGTATCT GCGCTCTGCT GAAGCCAGTT
5341 ACCTTCGGAA AAAGAGTTGG TAGCTCTTGA TCCGGCAAAC AAACCACCGC TGGTAGCGGT
5401 GGTTTTTTTG TTTGCAAGCA GCAGATTACG CGCAGAAAAA AAGGATCTCA AGAAGATCCT
5461 TTGATCTTTT CTACGGGGTC TGACGCTCAG TGGAACGAAA ACTCACGTTA AGGGATTTTG
5521 GTCATGAGAT TATCAAAAAG GATCTTCACC TAGATCCTTT TAAATTAAAA ATGAAGTTTT
5581 AAATCAATCT AAAGTATATA TGAGTAAACT TGGTCTGACA GTTACCAATG CTTAATCAGT
5641 GAGGCACCTA TCTCAGCGAT CTGTCTATTT CGTTCATCCA TAGTTGCCTG ACTCCCCGTC
5701 GTTGCTAGGT TACTGTCATG AGCGGATACA TATTTGAATG TATTTAGAAA AATAAACAAA
5761 AGAGTTTGTA GAAACGCAAA AAGGCCATCC GTCAGGATGG CCTTCTGCTT AATTTGATCG
5821 GTGGCAGTTT ATGGCGGGCG TCCTGCCCGC CACCCTCCGG GCCGTTGCTT CGCAACGTTC
5881 AAATCCGCTC CCGGCGGATT TGTCCTACTC AGGAGAGCGT TCACCGACAA ACAACAGATA
5941 AAACGAAAGG CCCAGTCTTT CGACTGAGCC TTTCGTTTTA TTTGATGCCT GGCAGTTCCC
6001 TACTCTCGCA TGGGTTGCGG CCGCCCGGGC CGTCGACCAA TTCTCATGTT TGACAGCTTA
6061 TCATCGAATT TCTGCCATTC ATCCGCTTAT TATCACTTAT TCAGGCGTAG CAACCAGGCG
6121 TTTAAGGGCA CCAATAACTG CCTTAAAAAA ATTACGCCCC GCCCTGCCAC TCATCGCAGT
6181 ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG GCATGATGAA
6241 CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG CCCATGGTGA
6301 AAACGGGGGC GAAGAAGTTG TCCATATTGG CCACGTTTAA ATCAAAACTG GTGAAACTCA
6361 CCCAGGGATT GGCTGAGACG AAAAACATAT TCTCAATAAA CCCTTTAGGG AAATAGGCCA
6421 GGTTTTCACC GTAACACGCC ACATCTTGCG AATATATGTG TAGAAACTGC CGGAAATCGT
6481 CGTGGTATTC ACTCCAGAGC GATGAAAACG TTTCAGTTTG CTCATGGAAA ACGGTGTAAC
6541 AAGGGTGAAC ACTATCCCAT ATCACCAGCT CACCGTCTTT CATTGCCATA CGAAATTCCG
6601 GATGAGCATT CATCAGGCGG GCAAGAATGT GAATAAAGGC CGGATAAAAC TTGTGCTTAT
6661 TTTTCTTTAC GGTCTTTAAA AAGGCCGTAA TATCCAGCTG AACGGTCTGG TTATAGGTAC
6721 ATTGAGCAAC TGACTGAAAT GCCTCAAAAT GTTCTTTACG ATGCCATTGG GATATATCAA
6781 CGGTGGTATA TCCAGTGATT TTTTTCTCCA TTTTAGCTTC CTTAGCTCCT GAAAATCTCG
6841 ATAACTCAAA AAATACGCCC GGTAGTGATC TTATTTCATT ATGGTGAAAG TTGGAACCTC
6901 TTACGTGCCG ATCAACGTCT CATTTTCGCC AAAAGTGACA TTAACCTATA AAAATAGGCG
6961 TATCACGAGG CCAGCTTGGG AAACCATAAG ACCGAGATAG AGTTGAGTGT TGTTCCAGTT
7021 TGGAACAAGA GTCCACTATT AAAGAACGTG GACTCCAACG TCAAAGGGCG AAAAACCGTC
7081 TATCAGGGCG ATGGCCCACT ACGTGAACCA TCACCCAAAT CAAGTTTTTT GGGGTCGAGG
7141 TGCCGTAAAG CACTAAATCG GAACCCTAAA GGGAGCCCCC GATTTAGAGC TTGACGGGGA
7201 AAGCCGGCGA ACGTGGCGAG AAAGGAAGGG AAGAAAGCGAAAGGAGCGGGCGCTAAGGCG
7261 CTGGCAAGTG TAGCGGTCAC GCTGCGCGTA ACCACCACAC CCGCCGCGCT TAATGCGCCG
7321 CTACAGGGCG CGTACTATGG TTGCTTTGAC GTATGCGGTG TGAAATACCG CACAGATGCG
7381 TAAGGAGAAA ATACCGCATC AGGCGCCATT CGCCATTCAG GCTGCGCAAC TGTTGGGAAG
7441 GGCGATCGGT GCGGGCCTCT TCGCTATTAC GCCAGCTGGC GAAAGGGGGA TGTGCTGCAA
7501 GGCGATTAAG TTGGGTAACG CCAGGGTTTT CCCAGTCACG ACGTTGTAAA ACGACGGCCA
7561 GTGAATTGAT CGAGATCGTG ATCCGGATCA AGATCCAGAT CGAATTGGAG GCTACAGTCA
7621 GTGGAGAGGA CTTTCACTGA CTGACTGACT GCGTCTCAAC CTCCTAGGGG ACATTGATTA
7681 TTGACTAGTT ATTAATAGTA ATCAATTACG GGGTCATTAG TTCATAGCCC ATATATGGAG
7741 TTCCGCGTTA CATAACTTAC GGTAAATGGC CCGCCTGGCT GACCGCCCAA CGACCCCCGC
7801 CCATTGACGT CAATAATGAC GTATGTTCCC ATAGTAACGC CAATAGGGAC TTTCCATTGA
7861 CGTCAATGGG TGGAGTATTT ACGGTAAACT GCCCACTTGG CAGTACATCA AGTGTATCAT
7921 ATGCCAAGTA CGCCCCCTAT TGACGTCAAT GACGGTAAAT GGCCCGCCTG GCATTATGCC
7981 CAGTACATGA CCTTATGGGA CTTTCCTACT TGGCAGTACA TCTACGTATT AGTCATCGCT
8041 ATTACCATGG TGATGCGGTT TTGGCAGTAC ATCAATGGGC GTGGATAGCG GTTTGACTCA
8101 CGGGGATTTC CAAGTCTCCA CCCCATTGAC GTCAATGGGA GTTTGTTTTG GCACCAAAAT
8161 CAACGGGACT TTCCAAAATG TCGTAACAAC TCCGCCCCAT TGACGCAAAT GGGCGGTAGG
8221 CGTGTACGGT GGGAGGTCTA TATAAGCAGA GCTCGTTTAG TGAACCGGGT CTCTCTGGTT
8281 AGACCAGATC TGAGCCTGGG AGCTCTCTGG CTAACTAGGG AACCCACTGC TTAAGCCTCA
8341 ATAAAGCTTG CCTTGAGTGC TCAAAGTAGT GTGTGCCCGT CTGTTGTGTG ACTCTGGTAA
8401 CTAGAGATCC CTCAGACCCT TTTAGTCAGT GTGGAAAATC TCTAGCAGTG GCGCCCGAAC
8461 AGGGACTTGA AAGCGAAAGT AAAGCCAGAG GAGATCTCTC GACGCAGGAC TCGGCTTGCT
8521 GAAGCGCGCA CGGCAAGAGG CGAGGGGCGG CGACTGGTGA GTACGCCAAA AATTTTGACT
8581 AGCGGAGGCT AGAAGGAGAG AGTAGGGTGC GAGAGCGTCG GTATTAAGCG GGGGAGAATT
8641 AGATAAATGG GAAAAAATTC GGTTAAGGCC AGGGGGAAAG AAACAATATA AACTAAAACA
8701 TATAGTTAGG GCAAGCAGGG AGCTAGAACG ATTCGCAGTT AATCCTGGCC TTTTAGAGAC
8761 ATCAGAAGGC TGTAGACAAA TACTGGGACA GCTACAACCA TCCCTTCAGA CAGGATCAGA
8821 AGAACTTAGA TCATTATATA ATACAATAGC AGTCCTCTAT TGTGTGCATC AAAGGATAGA
8881 TGTAAAAGAC ACCAAGGAAG CCTTAGATAA GATAGAGGAA GAGCAAAACA AAAGTAAGAA
8941 AAAGGCACAG CAAGCGATCT TCAGACCTGG AGGAGGCAGG AGGCGATATG AGGGACAATT
9001 GGAGAAGTGA ATTATATAAA TATAAAGTAG TAAAAATTGA ACCATTAGGA GTAGCACCCA
9061 CCAAGGCAAA GAGAAGAGTG GTGCAGAGAG AAAAAAGAGC AGTGGGAATA GGAGCTTTGT
9121 TCCTTGGGTT CTTGGGAGCA GCAGGAAGCA CTATGGGCGC AGCGTCAATG ACGCTGACGG
9181 TACAGGCCAG ACAATTATTG TCTGATATAG TGCAGCAGCA GAACAATTTG CTGAGGGCTA
9241 TTGAGGCGCA ACAGCATCTG TTGCAACTCA CAGTCTGGGG CATCAAACAG CTCCAGGCAA
9301 GAATCCTGGC TGTGGAAAGA TACCTAAAGG ATCAACAGCT CCTGGGGATT TGGGGTTGCT
9361 CTGGAAAACT CATTTGCACC ACTGCTGTGC CTTGGAATGC TAGTTGGAGT AATAAATCTC
9421 TGGAACAGAT TTGGAATAAC ATGACCTGGA TGGAGTGGGA CAGAGAAATT AACAATTACA
9481 CAAGCTTAAT ACACTCCTTA ATTGAAGAAT CGCAAAACCA GCAAGAAAAG AATGAACAAG
9541 AATTATTGGA ATTAGATAAA TGGGCAAGTT TGTGGAATTG GTTTAACATA ACAAATTGGC
9601 TGTGGTATAT AAAATTATTC ATAATGATAG TAGGAGGCTT GGTAGGTTTA AGAATAGTTT
9661 TTGCTGTACT TTCTATAGTG AATAGAGTTA GGCAGGGATA TTCACCATTA TCGTTTCAGA
9721 CCCACCTCCC AATCCCGAGG GGACCACGCG TACAAATGGC AGTATTCATC CACAATTTTA
9781 AAAGAAAAGG GGGGATTGGG GGGTACAGTG CAGGGGAAAG AATAGTAGACATAATAGCAA
9841 CAGACATACA AACTAAAGAA TTACAAAAAC AAATTACAAA AATTCAAAAT TTTCGGGTTT
9901 ATTACAGGGA CAGCAGAAAT CCACTTTGG
pLRPC FMC63mTRAC_T2A_mTRBC (서열 식별 번호:164)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGCGTAATCA
361 TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA
421 GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG TGAGCTAACT CACATTAATT
481 GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA
541 ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC
601 ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG
661 GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC
721 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC
781 CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA
841 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC
901 CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT
961 AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG
1021 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC
1081 AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
1141 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
1201 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
1261 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
1321 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
1381 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
1441 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
1501 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
1561 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTTGCTAG GTTACTGTCA
1621 TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA AAAGAGTTTG TAGAAACGCA
1681 AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT CGGTGGCAGT TTATGGCGGG
1741 CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT TCAAATCCGC TCCCGGCGGA
1801 TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA TAAAACGAAA GGCCCAGTCT
1861 TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC CCTACTCTCG CATGGGTTGC
1921 GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT TATCATCGAA TTTCTGCCAT
1981 TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG CGTTTAAGGG CACCAATAAC
2041 TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA GTACTGTTGT AATTCATTAA
2101 GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA
2161 TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT GAAAACGGGG GCGAAGAAGT
2221 TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT CACCCAGGGA TTGGCTGAGA
2281 CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC CAGGTTTTCA CCGTAACACG
2341 CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC GTCGTGGTAT TCACTCCAGA
2401 GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA ACAAGGGTGA ACACTATCCC
2461 ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC CGGATGAGCA TTCATCAGGC
2521 GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT ATTTTTCTTT ACGGTCTTTA
2581 AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT ACATTGAGCA ACTGACTGAA
2641 ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC AACGGTGGTA TATCCAGTGA
2701 TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT CGATAACTCA AAAAATACGC
2761 CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC TCTTACGTGC CGATCAACGT
2821 CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG CGTATCACGA GGCCAGCTTG
2881 GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG TTTGGAACAA GAGTCCACTA
2941 TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG TCTATCAGGG CGATGGCCCA
3001 CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA GGTGCCGTAA AGCACTAAAT
3061 CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG GAAAGCCGGC GAACGTGGCG
3121 AGAAAGGAAG GGAAGAAAGC GAAAGGAGCG GGCGCTAAGG CGCTGGCAAGTGTAGCGGTC
3181 ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC CGCTACAGGG CGCGTACTAT
3241 GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG CGTAAGGAGA AAATACCGCA
3301 TCAGGCGCCA TTCGCCATTC AGGCTGCGCA ACTGTTGGGA AGGGCGATCG GTGCGGGCCT
3361 CTTCGCTATT ACGCCAGCTG GCGAAAGGGG GATGTGCTGC AAGGCGATTA AGTTGGGTAA
3421 CGCCAGGGTT TTCCCAGTCA CGACGTTGTA AAACGACGGC CAGTGAATTG ATCGAGATCG
3481 TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT CAGTGGAGAG GACTTTCACT
3541 GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT TATTGACTAG TTATTAATAG
3601 TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT
3661 ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG
3721 ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT
3781 TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT
3841 ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG CCCAGTACAT GACCTTATGG
3901 GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG
3961 TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC
4021 CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA
4081 TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC
4141 TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG TTAGACCAGA TCTGAGCCTG
4201 GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT CAATAAAGCT TGCCTTGAGT
4261 GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT AACTAGAGAT CCCTCAGACC
4321 CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA ACAGGGACTT GAAAGCGAAA
4381 GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG CTGAAGCGCG CACGGCAAGA
4441 GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA CTAGCGGAGG CTAGAAGGAG
4501 AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA TTAGATAAAT GGGAAAAAAT
4561 TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA CATATAGTTA GGGCAAGCAG
4621 GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG ACATCAGAAG GCTGTAGACA
4681 AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA GAAGAACTTA GATCATTATA
4741 TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA GATGTAAAAG ACACCAAGGA
4801 AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG AAAAAGGCACAGCAAGCGAT
4861 CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA TTGGAGAAGT GAATTATATA
4921 AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC CACCAAGGCA AAGAGAAGAG
4981 TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT GTTCCTTGGG TTCTTGGGAG
5041 CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC GGTACAGGCC AGACAATTAT
5101 TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC TATTGAGGCG CAACAGCATC
5161 TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC AAGAATCCTG GCTGTGGAAA
5221 GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG CTCTGGAAAA CTCATTTGCA
5281 CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC TCTGGAACAG ATTTGGAATA
5341 ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA CACAAGCTTA ATACACTCCT
5401 TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA AGAATTATTG GAATTAGATA
5461 AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG GCTGTGGTAT ATAAAATTAT
5521 TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT TTTTGCTGTA CTTTCTATAG
5581 TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA GACCCACCTC CCAATCCCGA
5641 GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT TAAAAGAAAA GGGGGGATTG
5701 GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC AACAGACATA CAAACTAAAG
5761 AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT TTATTACAGG GACAGCAGAA
5821 ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT CAGTGGGCAG AGCGCACATC
5881 GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT TGAACCGGTG CCTAGAGAAG
5941 GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG CTCCGCCTTT TTCCCGAGGG
6001 TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC GTTCTTTTTC GCAACGGGTT
6061 TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC GGGCCTGGCC TCTTTACGGG
6121 TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG GCTGCAGTAC GTGATTCTTG
6181 ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG GCCTTGCGCT TAAGGAGCCC
6241 CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG GGGCCGCCGC GTGCGAATCT
6301 GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC TCTAGCCATT TAAAATTTTT
6361 GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT TGTAAATGCG GGCCAAGATC
6421 TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA CGGGGCCCGT GCGTCCCAGC
6481 GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC GAGAATCGGA CGGGGGTAGT
6541 CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC GCCGTGTATC GCCCCGCCCT
6601 GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC GGAAAGATGG CCGCTTCCCG
6661 GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC GGGAGAGCGG GCGGGTGAGT
6721 CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT CGCTTCATGT GACTCCACGG
6781 AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG CTTTTGGAGT ACGTCGTCTT
6841 TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA CACTGAGTGG GTGGAGACTG
6901 AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA ATTTGCCCTT TTTGAGTTTG
6961 GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG TTTTTTTCTT CCATTTCAGG
7021 TGTCGTGAAA ACTACCCCTC TAGAGCCGCC ACCATGCTTC TCCTGGTGAC AAGCCTTCTG
7081 CTCTGTGAGT TACCACACCC AGCATTCCTC CTGATCCCAG ACATCCAGAT GACACAGACT
7141 ACATCCTCCC TGTCTGCCTC TCTGGGAGAC AGAGTCACCA TCAGTTGCAG GGCAAGTCAG
7201 GACATTAGTA AATATTTAAA TTGGTATCAG CAGAAACCAG ATGGAACTGT TAAACTCCTG
7261 ATCTACCATA CATCAAGATT ACACTCAGGA GTCCCATCAA GGTTCAGTGG CAGTGGGTCT
7321 GGAACAGATT ATTCTCTCAC CATTAGCAAC CTGGAGCAAG AAGATATTGC CACTTACTTT
7381 TGCCAACAGG GTAATACGCT TCCGTACACG TTCGGAGGGG GGACTAAGTT GGAAATAACA
7441 GGAGGTGGAG GTTCTGGTGG AGGAGGTTCA GGAGGTGGTG GAAGTGAGGT GAAACTGCAG
7501 GAGTCAGGAC CTGGCCTGGT GGCGCCCTCA CAGAGCCTGT CCGTCACATG CACTGTCTCA
7561 GGGGTCTCAT TACCCGACTA TGGTGTAAGC TGGATTCGCC AGCCTCCACG AAAGGGTCTG
7621 GAGTGGCTGG GAGTAATATG GGGTAGTGAA ACCACATACT ATAATTCAGC TCTCAAATCC
7681 AGACTGACCA TCATCAAGGA CAACTCCAAG AGCCAAGTTT TCTTAAAAAT GAACAGTCTG
7741 CAAACTGATG ACACAGCCAT TTACTACTGT GCCAAACATT ATTACTACGG TGGTAGCTAT
7801 GCTATGGACT ACTGGGGTCA AGGAACCTCA GTCACCGTCT CCTCAGGAAT TCAGAACCCT
7861 GAGCCTGCCG TGTACCAGCT GAAGGACCCT AGAAGCCAGG ACAGCACCCT GTGCCTGTTC
7921 ACCGACTTCG ACAGCCAGAT CAACGTGCCC AAGACCATGG AAAGCGGCAC CTTCATCACC
7981 GATAAGACTG TGCTGGACAT GAAGGCCATG GACAGCAAGA GCAACGGCGC CATTGCNTGG
8041 TCCAATCAGA CCAGCTTTAC CTGCCAAGAC ATCTTCAAAG AGACAAACGC CACCTACCCC
8101 AGTTCAGACG TTCCCTGTGA TGCCACGTTG ACTGAGAAAA GCTTTGAAAC AGATATGAAC
8161 CTAAACTTTC AAAACCTGTC AGTTATGGGA CTCCGAATCC TCCTGCTGAA AGTAGCCGGA
8221 TTTAACCTGC TCATGACGCT GAGGCTGTGG TCCAGTGGCA GCGGCGAGGG CAGAGGAAGT
8281 CTGCTAACAT GCGGTGACGT CGAGGAGAAT CCTGGACCTG ATCTGAGAAA TGTGACTCCA
8341 CCCAAGGTCT CCTTGTTTGA GCCATCAAAA GCAGAGATTG CAAACAAACA AAAGGCTACC
8401 CTCGTGTGCT TGGCCAGGGG CTTCTTCCCT GACCACGTGG AGCTGAGCTG GTGGGTGAAT
8461 GGCAAGGAGG TCCACAGTGG GGTCAGCACG GACCCTCAGG CCTACAAGGA GAGCAATTAT
8521 AGCTACTGCC TGAGCAGCCG CCTGAGGGTC TCTGCTACCT TCTGGCACAA TCCTCGCAAC
8581 CACTTCCGCT GCCAAGTGCA GTTCCATGGG CTTTCAGAGG AGGACAAGTG GCCAGAGGGC
8641 TCACCCAAAC CTGTCACACA GAACATCAGT GCAGAGGCCT GGGGTCGAGC AGACTGTGGT
8701 ATTACCTCAG CATCCTATCA ACAAGGAGTC TTGTCTGCCA CCATCCTCTA TGAGATCCTG
8761 CTAGGGAAAG CCACCCTGTA TGCTGTGCTT GTCAGTACAC TGGTGGTGAT GGCTATGGTC
8821 AAAAGAAAGA ATTCATGAGA TATCGAGCAT CTTACCGCCA TTTATACCCA TATTTGTTCT
8881 GTTTTTCTTG ATTTGGGTAT ACATTTAAAT GTTAATAAAA CAAAATGGTG GGGCAATCAT
8941 TTACATTTTT AGGGATATGT AATTACTAGT TCAGGTGTAT TGCCACAAGA CAAACATGTT
9001 AAGAAACTTT CCCGTTATTT ACGCTCTGTT CCTGTTAATC AACCTCTGGA TTACAAAATT
9061 TGTGAAAGAT TGACTGATAT TCTTAACTAT GTTGCTCCTT TTACGCTGTG TGGATATGCT
9121 GCTTTATAGC CTCTGTATCT AGCTATTGCT TCCCGTACGG CTTTCGTTTT CTCCTCCTTG
9181 TATAAATCCT GGTTGCTGTC TCTTTTAGAG GAGTTGTGGC CCGTTGTCCG TCAACGTGGC
9241 GTGGTGTGCT CTGTGTTTGC TGACGCAACC CCCACTGGCT GGGGCATTGC CACCACCTGT
9301 CAACTCCTTT CTGGGACTTT CGCTTTCCCC CTCCCGATCG CCACGGCAGA ACTCATCGCC
9361 GCCTGCCTTG CCCGCTGCTG GACAGGGGCT AGGTTGCTGG GCACTGATAA TTCCGTGGTG
9421 TTGTCAGTAC TGGTACCTTT AAGACCAATG ACTTACAAGG CAGCTGTAGA TCTTAGCCAC
9481 TTTTTAAAAG AAAAGGGGGG ACTGGAAGGG CTAATTCACT CCCAAAGAAG ACAAGATCTG
9541 CTTTTTGCCT GTACTGGGTC TCTCTGGTTA GACCAGATCT GAGCCTGGGA GCTCTCTGGC
9601 TAACTAGGGA ACCCACTGCT TAAGCCTCAA TAAAGCTTGC CTTGAGTGCT TCAA
pLRPC FMC63mTRAC_T2A_mTRBC U5 (서열 식별 번호:165)
1 GACATTGATT ATTGACTAGT TATTAATAGT AATCAATTAC GGGGTCATTA GTTCATAGCC
61 CATATATGGA GTTCCGCGTT ACATAACTTA CGGTAAATGG CCCGCCTGGC TGACCGCCCA
121 ACGACCCCCG CCCATTGACG TCAATAATGA CGTATGTTCC CATAGTAACG CCAATAGGGA
181 CTTTCCATTG ACGTCAATGG GTGGAGTATT TACGGTAAAC TGCCCACTTG GCAGTACATC
241 AAGTGTATCA TATGCCAAGT ACGCCCCCTA TTGACGTCAA TGACGGTAAA TGGCCCGCCT
301 GGCATTATGC CCAGTACATG ACCTTATGGG ACTTTCCTAC TTGGCAGTAC ATCTACGTAT
361 TAGTCATCGC TATTACCATG GTGATGCGGT TTTGGCAGTA CATCAATGGG CGTGGATAGC
421 GGTTTGACTC ACGGGGATTT CCAAGTCTCC ACCCCATTGA CGTCAATGGG AGTTTGTTTT
481 GGCACCAAAA TCAACGGGAC TTTCCAAAAT GTCGTAACAA CTCCGCCCCA TTGACGCAAA
541 TGGGCGGTAG GCGTGTACGG TGGGAGGTCT ATATAAGCAG AGCTCGTTTA GTGAACCGGG
601 TCTCTCTGGT TAGACCAGAT CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG
661 CTTAAGCCTC AATAAAGCTT GCCTTGAGTG CTCAAAGTAG TGTGTGCCCG TCTGTTGTGT
721 GACTCTGGTA ACTAGAGATC CCTCAGACCC TTTTAGTCAG TGTGGAAAAT CTCTAGCAGT
781 GGCGCCCGAA CAGGGACTTG AAAGCGAAAG TAAAGCCAGA GGAGATCTCT CGACGCAGGA
841 CTCGGCTTGC TGAAGCGCGC ACGGCAAGAG GCGAGGGGCG GCGACTGGTG AGTACGCCAA
901 AAATTTTGAC TAGCGGAGGC TAGAAGGAGA GAGTAGGGTG CGAGAGCGTC GGTATTAAGC
961 GGGGGAGAAT TAGATAAATG GGAAAAAATT CGGTTAAGGC CAGGGGGAAA GAAACAATAT
1021 AAACTAAAAC ATATAGTTAG GGCAAGCAGG GAGCTAGAAC GATTCGCAGT TAATCCTGGC
1081 CTTTTAGAGA CATCAGAAGG CTGTAGACAA ATACTGGGAC AGCTACAACC ATCCCTTCAG
1141 ACAGGATCAG AAGAACTTAG ATCATTATAT AATACAATAG CAGTCCTCTA TTGTGTGCAT
1201 CAAAGGATAG ATGTAAAAGA CACCAAGGAA GCCTTAGATA AGATAGAGGA AGAGCAAAAC
1261 AAAAGTAAGA AAAAGGCACA GCAAGCGATC TTCAGACCTG GAGGAGGCAG GAGGCGATAT
1321 GAGGGACAAT TGGAGAAGTG AATTATATAA ATATAAAGTA GTAAAAATTG AACCATTAGG
1381 AGTAGCACCC ACCAAGGCAA AGAGAAGAGT GGTGCAGAGA GAAAAAAGAGCAGTGGGAAT
1441 AGGAGCTTTG TTCCTTGGGT TCTTGGGAGC AGCAGGAAGC ACTATGGGCG CAGCGTCAAT
1501 GACGCTGACG GTACAGGCCA GACAATTATT GTCTGATATA GTGCAGCAGC AGAACAATTT
1561 GCTGAGGGCT ATTGAGGCGC AACAGCATCT GTTGCAACTC ACAGTCTGGG GCATCAAACA
1621 GCTCCAGGCA AGAATCCTGG CTGTGGAAAG ATACCTAAAG GATCAACAGC TCCTGGGGAT
1681 TTGGGGTTGC TCTGGAAAAC TCATTTGCAC CACTGCTGTG CCTTGGAATG CTAGTTGGAG
1741 TAATAAATCT CTGGAACAGA TTTGGAATAA CATGACCTGG ATGGAGTGGG ACAGAGAAAT
1801 TAACAATTAC ACAAGCTTAA TACACTCCTT AATTGAAGAA TCGCAAAACC AGCAAGAAAA
1861 GAATGAACAA GAATTATTGG AATTAGATAA ATGGGCAAGT TTGTGGAATT GGTTTAACAT
1921 AACAAATTGG CTGTGGTATA TAAAATTATT CATAATGATA GTAGGAGGCT TGGTAGGTTT
1981 AAGAATAGTT TTTGCTGTAC TTTCTATAGT GAATAGAGTT AGGCAGGGAT ATTCACCATT
2041 ATCGTTTCAG ACCCACCTCC CAATCCCGAG GGGACCACGC GTACAAATGG CAGTATTCAT
2101 CCACAATTTT AAAAGAAAAG GGGGGATTGG GGGGTACAGT GCAGGGGAAA GAATAGTAGA
2161 CATAATAGCA ACAGACATAC AAACTAAAGA ATTACAAAAA CAAATTACAA AAATTCAAAA
2221 TTTTCGGGTT TATTACAGGG ACAGCAGAAA TCCACTTTGG AAAGCTGAGC ATCCGGCTCC
2281 GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC CCGAGAAGTT GGGGGGAGGG
2341 GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG TAAACTGGGA AAGTGATGTC
2401 GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC CGTATATAAG TGCAGTAGTC
2461 GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA CACAGGTAAG TGCCGTGTGT
2521 GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT GCGTGCCTTG AATTACTTCC
2581 ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT CGGGTTGGAA GTGGGTGGGA
2641 GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT GCTTGAGTTG AGGCCTGGCC
2701 TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT CGCGCCTGTC TCGCTGCTTT
2761 CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT GCGACGCTTT TTTTCTGGCA
2821 AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT ATTTCGGTTT TTGGGGCCGC
2881 GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG GCGAGGCGGG GCCTGCGAGC
2941 GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC CGGCCTGCTC TGGTGCCTGG
3001 CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG CTGGCCCGGT CGGCACCAGT
3061 TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA GGGAGCTCAA AATGGAGGAC
3121 GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA AGGAAAAGGG CCTTTCCGTC
3181 CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG CCGTCCAGGC ACCTCGATTA
3241 GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG GAGGGGTTTT ATGCGATGGA
3301 GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA GCTTGGCACT TGATGTAATT
3361 CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC ATTCTCAAGC CTCAGACAGT
3421 GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA CTACCCCTCT AGAGCCGCCA
3481 CCATGCTTCT CCTGGTGACA AGCCTTCTGC TCTGTGAGTT ACCACACCCA GCATTCCTCC
3541 TGATCCCAGA CATCCAGATG ACACAGACTA CATCCTCCCT GTCTGCCTCT CTGGGAGACA
3601 GAGTCACCAT CAGTTGCAGG GCAAGTCAGG ACATTAGTAA ATATTTAAAT TGGTATCAGC
3661 AGAAACCAGA TGGAACTGTT AAACTCCTGA TCTACCATAC ATCAAGATTA CACTCAGGAG
3721 TCCCATCAAG GTTCAGTGGC AGTGGGTCTG GAACAGATTA TTCTCTCACC ATTAGCAACC
3781 TGGAGCAAGA AGATATTGCC ACTTACTTTT GCCAACAGGG TAATACGCTT CCGTACACGT
3841 TCGGAGGGGG GACTAAGTTG GAAATAACAG GAGGTGGAGG TTCTGGTGGA GGAGGTTCAG
3901 GAGGTGGTGG AAGTGAGGTG AAACTGCAGG AGTCAGGACC TGGCCTGGTG GCGCCCTCAC
3961 AGAGCCTGTC CGTCACATGC ACTGTCTCAG GGGTCTCATT ACCCGACTAT GGTGTAAGCT
4021 GGATTCGCCA GCCTCCACGA AAGGGTCTGG AGTGGCTGGG AGTAATATGG GGTAGTGAAA
4081 CCACATACTA TAATTCAGCT CTCAAATCCA GACTGACCAT CATCAAGGAC AACTCCAAGA
4141 GCCAAGTTTT CTTAAAAATG AACAGTCTGC AAACTGATGA CACAGCCATT TACTACTGTG
4201 CCAAACATTA TTACTACGGT GGTAGCTATG CTATGGACTA CTGGGGTCAA GGAACCTCAG
4261 TCACCGTCTC CTCAGGAATT CAGAACCCTG AGCCTGCCGT GTACCAGCTG AAGGACCCTA
4321 GAAGCCAGGA CAGCACCCTG TGCCTGTTCA CCGACTTCGA CAGCCAGATC AACGTGCCCA
4381 AGACCATGGA AAGCGGCACC TTCATCACCG ATAAGACTGT GCTGGACATG AAGGCCATGG
4441 ACAGCAAGAG CAACGGCGCC ATTGCTTGGT CCAATCAGAC CAGCTTTACC TGCCAAGACA
4501 TCTTCAAAGA GACAAACGCC ACCTACCCCA GTTCAGACGT TCCCTGTGAT GCCACGTTGA
4561 CTGAGAAAAG CTTTGAAACA GATATGAACC TAAACTTTCA AAACCTGTCA GTTATGGGAC
4621 TCCGAATCCT CCTGCTGAAA GTAGCCGGAT TTAACCTGCT CATGACGCTG AGGCTGTGGT
4681 CCAGTGGCAG CGGCGAGGGC AGAGGAAGTC TGCTAACATG CGGTGACGTC GAGGAGAATC
4741 CTGGACCTGA TCTGAGAAAT GTGACTCCAC CCAAGGTCTC CTTGTTTGAG CCATCAAAAG
4801 CAGAGATTGC AAACAAACAA AAGGCTACCC TCGTGTGCTT GGCCAGGGGC TTCTTCCCTG
4861 ACCACGTGGA GCTGAGCTGG TGGGTGAATG GCAAGGAGGT CCACAGTGGG GTCAGCACGG
4921 ACCCTCAGGC CTACAAGGAG AGCAATTATA GCTACTGCCT GAGCAGCCGC CTGAGGGTCT
4981 CTGCTACCTT CTGGCACAAT CCTCGCAACC ACTTCCGCTG CCAAGTGCAG TTCCATGGGC
5041 TTTCAGAGGA GGACAAGTGG CCAGAGGGCT CACCCAAACC TGTCACACAG AACATCAGTG
5101 CAGAGGCCTG GGGTCGAGCA GACTGTGGTA TTACCTCAGC ATCCTATCAA CAAGGAGTCT
5161 TGTCTGCCAC CATCCTCTAT GAGATCCTGC TAGGGAAAGC CACCCTGTAT GCTGTGCTTG
5221 TCAGTACACT GGTGGTGATG GCTATGGTCA AAAGAAAGAA TTCATGAGAT ATCGAGCATC
5281 TTACCGCCAT TTATACCCAT ATTTGTTCTG TTTTTCTTGA TTTGGGTATA CATTTAAATG
5341 TTAATAAAAC AAAATGGTGG GGCAATCATT TACATTTTTA GGGATATGTA ATTACTAGTT
5401 CAGGTGTATT GCCACAAGAC AAACATGTTA AGAAACTTTC CCGTTATTTA CGCTCTGTTC
5461 CTGTTAATCA ACCTCTGGAT TACAAAATTT GTGAAAGATT GACTGATATT CTTAACTATG
5521 TTGCTCCTTT TACGCTGTGT GGATATGCTG CTTTATAGCC TCTGTATCTA GCTATTGCTT
5581 CCCGTACGGC TTTCGTTTTC TCCTCCTTGT ATAAATCCTG GTTGCTGTCT CTTTTAGAGG
5641 AGTTGTGGCC CGTTGTCCGT CAACGTGGCG TGGTGTGCTC TGTGTTTGCT GACGCAACCC
5701 CCACTGGCTG GGGCATTGCC ACCACCTGTC AACTCCTTTC TGGGACTTTC GCTTTCCCCC
5761 TCCCGATCGC CACGGCAGAA CTCATCGCCG CCTGCCTTGC CCGCTGCTGG ACAGGGGCTA
5821 GGTTGCTGGG CACTGATAAT TCCGTGGTGT TGTCAGTACT GGTACCTTTA AGACCAATGA
5881 CTTACAAGGC AGCTGTAGAT CTTAGCCACT TTTTAAAAGA AAAGGGGGGA CTGGAAGGGC
5941 TAATTCACTC CCAAAGAAGA CAAGATCTGC TTTTTGCCTG TACTGGGTCT CTCTGGTTAG
6001 ACCAGATCTG AGCCTGGGAG CTCTCTGGCT AACTAGGGAA CCCACTGCTT AAGCCTCAAT
6061 AAAGCTTGCC TTGAGTGCTT CAAGTAGTGT GTGCCCGTCT GTTGTGTGAC TCTGGTAACT
6121 AGAGATCCCT CAGACCCTTT TAGTCAGTGT GGAAAATCTC TAGCATGATC ATAATCAAGC
6181 CATATCACAT CTGTAGAGGT TTACTTGCTT TAAAAAACCT CCACACCTCC CCCTGAACCT
6241 GAAACATAAA ATGAATGCAA TTGTTGTTGT TAACTTGTTT ATTGCAGCTT ATAATGGTTA
6301 CAAATAAAGC AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC TGCATTCTAG
6361 TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGGATCTGCG TCGACACGAA
6421 GAGACGACTG ACTGACTGAC TGGAAAGAGG AAGGGCTGGA AGAGGAAGGA GCTTGATCCA
6481 GATCCCGATC TCGATCCAGA TCCGGATCGC AGCTTGGCGT AATCATGGTC ATAGCTGTTT
6541 CCTGTGTGAA ATTGTTATCC GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG
6601 TGTAAAGCCT GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG
6661 CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG CCAACGCGCG
6721 GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT CGCTCACTGA CTCGCTGCGC
6781 TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT ACGGTTATCC
6841 ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCAAAAGGCCAGG
6901 AACCGTAAAA AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT
6961 CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA AAGATACCAG
7021 GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC GCTTACCGGA
7081 TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC ACGCTGTAGG
7141 TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT
7201 CAGCCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC
7261 GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG GTATGTAGGC
7321 GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG AACAGTATTT
7381 GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG CTCTTGATCC
7441 GGCAAACAAA CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC
7501 AGAAAAAAAG GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG
7561 AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG
7621 ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATATATGA GTAAACTTGG
7681 TCTGACAGTT ACCAATGCTT AATCAGTGAG GCACCTATCT CAGCGATCTG TCTATTTCGT
7741 TCATCCATAG TTGCCTGACT CCCCGTCGTT GCTAGGTTAC TGTCATGAGC GGATACATAT
7801 TTGAATGTAT TTAGAAAAAT AAACAAAAGA GTTTGTAGAA ACGCAAAAAG GCCATCCGTC
7861 AGGATGGCCT TCTGCTTAAT TTGATCGGTG GCAGTTTATG GCGGGCGTCC TGCCCGCCAC
7921 CCTCCGGGCC GTTGCTTCGC AACGTTCAAA TCCGCTCCCG GCGGATTTGT CCTACTCAGG
7981 AGAGCGTTCA CCGACAAACA ACAGATAAAA CGAAAGGCCC AGTCTTTCGA CTGAGCCTTT
8041 CGTTTTATTT GATGCCTGGC AGTTCCCTAC TCTCGCATGG GTTGCGGCCG CCCGGGCCGT
8101 CGACCAATTC TCATGTTTGA CAGCTTATCA TCGAATTTCT GCCATTCATC CGCTTATTAT
8161 CACTTATTCA GGCGTAGCAA CCAGGCGTTT AAGGGCACCA ATAACTGCCT TAAAAAAATT
8221 ACGCCCCGCC CTGCCACTCA TCGCAGTACT GTTGTAATTC ATTAAGCATT CTGCCGACAT
8281 GGAAGCCATC ACAAACGGCA TGATGAACCT GAATCGCCAG CGGCATCAGC ACCTTGTCGC
8341 CTTGCGTATA ATATTTGCCC ATGGTGAAAA CGGGGGCGAA GAAGTTGTCC ATATTGGCCA
8401 CGTTTAAATC AAAACTGGTG AAACTCACCC AGGGATTGGC TGAGACGAAA AACATATTCT
8461 CAATAAACCC TTTAGGGAAA TAGGCCAGGT TTTCACCGTA ACACGCCACA TCTTGCGAAT
8521 ATATGTGTAG AAACTGCCGG AAATCGTCGT GGTATTCACT CCAGAGCGAT GAAAACGTTT
8581 CAGTTTGCTC ATGGAAAACG GTGTAACAAG GGTGAACACT ATCCCATATC ACCAGCTCAC
8641 CGTCTTTCAT TGCCATACGA AATTCCGGAT GAGCATTCAT CAGGCGGGCA AGAATGTGAA
8701 TAAAGGCCGG ATAAAACTTG TGCTTATTTT TCTTTACGGT CTTTAAAAAG GCCGTAATAT
8761 CCAGCTGAAC GGTCTGGTTA TAGGTACATT GAGCAACTGA CTGAAATGCC TCAAAATGTT
8821 CTTTACGATG CCATTGGGAT ATATCAACGG TGGTATATCC AGTGATTTTT TTCTCCATTT
8881 TAGCTTCCTT AGCTCCTGAA AATCTCGATA ACTCAAAAAA TACGCCCGGT AGTGATCTTA
8941 TTTCATTATG GTGAAAGTTG GAACCTCTTA CGTGCCGATC AACGTCTCAT TTTCGCCAAA
9001 AGTGACATTA ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC
9061 GAGATAGAGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC
9121 TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA
9181 CCCAAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG
9241 AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAG
9301 AAAGCGAAAG GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC
9361 ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA
9421 TGCGGTGTGA AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC
9481 CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC
9541 AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC
9601 AGTCACGACG TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA
9661 TCCAGATCGA ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG
9721 TCTCAACCTC CTAGGG
pLCUS FMC63mTRAC_P2A_mTRBC (서열 식별 번호:166)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
361 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
421 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
481 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
541 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
601 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
661 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
721 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
781 GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG
841 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG
901 GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA
961 CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG
1021 AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT
1081 TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT
1141 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG
1201 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG
1261 TCGTTGCTAG GTTACTGTCA TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA
1321 AAAGAGTTTG TAGAAACGCA AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT
1381 CGGTGGCAGT TTATGGCGGG CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT
1441 TCAAATCCGC TCCCGGCGGA TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA
1501 TAAAACGAAA GGCCCAGTCT TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC
1561 CCTACTCTCG CATGGGTTGC GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT
1621 TATCATCGAA TTTCTGCCAT TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG
1681 CGTTTAAGGG CACCAATAAC TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA
1741 GTACTGTTGT AATTCATTAA GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG
1801 AACCTGAATC GCCAGCGGCA TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT
1861 GAAAACGGGG GCGAAGAAGT TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT
1921 CACCCAGGGA TTGGCTGAGA CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC
1981 CAGGTTTTCA CCGTAACACG CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC
2041 GTCGTGGTAT TCACTCCAGA GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA
2101 ACAAGGGTGA ACACTATCCC ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC
2161 CGGATGAGCA TTCATCAGGC GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT
2221 ATTTTTCTTT ACGGTCTTTA AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT
2281 ACATTGAGCA ACTGACTGAA ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC
2341 AACGGTGGTA TATCCAGTGA TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT
2401 CGATAACTCA AAAAATACGC CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC
2461 TCTTACGTGC CGATCAACGT CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG
2521 CGTATCACGA GGCCAGCTTG GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG
2581 TTTGGAACAA GAGTCCACTA TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG
2641 TCTATCAGGG CGATGGCCCA CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA
2701 GGTGCCGTAA AGCACTAAAT CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG
2761 GAAAGCCGGC GAACGTGGCG AGAAAGGAAG GGAAGAAAGCGAAAGGAGCGGGCGCTAAGG
2821 CGCTGGCAAG TGTAGCGGTC ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC
2881 CGCTACAGGG CGCGTACTAT GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG
2941 CGTAAGGAGA AAATACATCG TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT
3001 CAGTGGAGAG GACTTTCACT GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT
3061 TATTGACTAG TTATTAATAG TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG
3121 AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC
3181 GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT
3241 GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC
3301 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
3361 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
3421 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
3481 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
3541 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
3601 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG
3661 TTAGACCAGA TCTGAGCCTG GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT
3721 CAATAAAGCT TGCCTTGAGT GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT
3781 AACTAGAGAT CCCTCAGACC CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA
3841 ACAGGGACTT GAAAGCGAAA GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG
3901 CTGAAGCGCG CACGGCAAGA GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA
3961 CTAGCGGAGG CTAGAAGGAG AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA
4021 TTAGATAAAT GGGAAAAAAT TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA
4081 CATATAGTTA GGGCAAGCAG GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG
4141 ACATCAGAAG GCTGTAGACA AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA
4201 GAAGAACTTA GATCATTATA TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA
4261 GATGTAAAAG ACACCAAGGA AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG
4321 AAAAAGGCAC AGCAAGCGAT CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA
4381 TTGGAGAAGT GAATTATATA AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC
4441 CACCAAGGCA AAGAGAAGAG TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT
4501 GTTCCTTGGG TTCTTGGGAG CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC
4561 GGTACAGGCC AGACAATTAT TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC
4621 TATTGAGGCG CAACAGCATC TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC
4681 AAGAATCCTG GCTGTGGAAA GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG
4741 CTCTGGAAAA CTCATTTGCA CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC
4801 TCTGGAACAG ATTTGGAATA ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA
4861 CACAAGCTTA ATACACTCCT TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA
4921 AGAATTATTG GAATTAGATA AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG
4981 GCTGTGGTAT ATAAAATTAT TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT
5041 TTTTGCTGTA CTTTCTATAG TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA
5101 GACCCACCTC CCAATCCCGA GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT
5161 TAAAAGAAAA GGGGGGATTG GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC
5221 AACAGACATA CAAACTAAAG AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT
5281 TTATTACAGG GACAGCAGAA ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT
5341 CAGTGGGCAG AGCGCACATC GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT
5401 TGAACCGGTG CCTAGAGAAG GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG
5461 CTCCGCCTTT TTCCCGAGGG TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC
5521 GTTCTTTTTC GCAACGGGTT TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC
5581 GGGCCTGGCC TCTTTACGGG TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG
5641 GCTGCAGTAC GTGATTCTTG ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG
5701 GCCTTGCGCT TAAGGAGCCC CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG
5761 GGGCCGCCGC GTGCGAATCT GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC
5821 TCTAGCCATT TAAAATTTTT GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT
5881 TGTAAATGCG GGCCAAGATC TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA
5941 CGGGGCCCGT GCGTCCCAGC GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC
6001 GAGAATCGGA CGGGGGTAGT CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC
6061 GCCGTGTATC GCCCCGCCCT GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC
6121 GGAAAGATGG CCGCTTCCCG GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC
6181 GGGAGAGCGG GCGGGTGAGT CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT
6241 CGCTTCATGT GACTCCACGG AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG
6301 CTTTTGGAGT ACGTCGTCTT TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA
6361 CACTGAGTGG GTGGAGACTG AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA
6421 ATTTGCCCTT TTTGAGTTTG GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG
6481 TTTTTTTCTT CCATTTCAGG TGTCGTGAAA ACTACCCCTC AGAGCCGCCA CCATGCTTCT
6541 CCTGGTGACA AGCCTTCTGC TCTGTGAGTT ACCACACCCA GCATTCCTCC TGATCCCAGA
6601 CATCCAGATG ACACAGACTA CATCCTCCCT GTCTGCCTCT CTGGGAGACA GAGTCACCAT
6661 CAGTTGCAGG GCAAGTCAGG ACATTAGTAA ATATTTAAAT TGGTATCAGC AGAAACCAGA
6721 TGGAACTGTT AAACTCCTGA TCTACCATAC ATCAAGATTA CACTCAGGAG TCCCATCAAG
6781 GTTCAGTGGC AGTGGGTCTG GAACAGATTA TTCTCTCACC ATTAGCAACC TGGAGCAAGA
6841 AGATATTGCC ACTTACTTTT GCCAACAGGG TAATACGCTT CCGTACACGT TCGGAGGGGG
6901 GACTAAGTTG GAAATAACAG GCTCCACCTC TGGATCCGGC AAGCCCGGAT CTGGCGAGGG
6961 ATCCACCAAG GGCGAGGTGA AACTGCAGGA GTCAGGACCT GGCCTGGTGG CGCCCTCACA
7021 GAGCCTGTCC GTCACATGCA CTGTCTCAGG GGTCTCATTA CCCGACTATG GTGTAAGCTG
7081 GATTCGCCAG CCTCCACGAA AGGGTCTGGA GTGGCTGGGA GTAATATGGG GTAGTGAAAC
7141 CACATACTAT AATTCAGCTC TCAAATCCAG ACTGACCATC ATCAAGGACA ACTCCAAGAG
7201 CCAAGTTTTC TTAAAAATGA ACAGTCTGCA AACTGATGAC ACAGCCATTT ACTACTGTGC
7261 CAAACATTAT TACTACGGTG GTAGCTATGC TATGGACTAC TGGGGTCAAG GAACCTCAGT
7321 CACCGTCTCC TCAATTCAGA ACCCTGAGCC TGCCGTGTAC CAGCTGAAGG ACCCTAGAAG
7381 CCAGGACAGC ACCCTGTGCC TGTTCACCGA CTTCGACAGC CAGATCAACG TGCCCAAGAC
7441 CATGGAAAGC GGCACCTTCA TCACCGATAA GACTGTGCTG GACATGAAGG CCATGGACAG
7501 CAAGAGCAAC GGCGCCATTG CNTGGTCCAA TCAGACCAGC TTTACCTGCC AAGACATCTT
7561 CAAAGAGACA AACGCCACCT ACCCCAGTTC AGACGTTCCC TGTGATGCCA CGTTGACTGA
7621 GAAAAGCTTT GAAACAGATA TGAACCTAAA CTTTCAAAAC CTGTCAGTTA TGGGACTCCG
7681 AATCCTCCTG CTGAAAGTAG CCGGATTTAA CCTGCTCATG ACGCTGAGGC TGTGGTCCAG
7741 TGGCAGCGGC GCTACTAACT TCAGCCTGCT GAAGCAGGCT GGAGACGTGG AGGAGAACCC
7801 TGGACCTATG CTACTACTTG TGACCTCACT ATTGTTATGC GAACTCCCTC ATCCCGCATT
7861 CTTGCTGATT CCAGATCTGA GAAATGTGAC TCCACCCAAG GTCTCCTTGT TTGAGCCATC
7921 AAAAGCAGAG ATTGCAAACA AACAAAAGGC TACCCTCGTG TGCTTGGCCA GGGGCTTCTT
7981 CCCTGACCAC GTGGAGCTGA GCTGGTGGGT GAATGGCAAG GAGGTCCACA GTGGGGTCAG
8041 CACGGACCCT CAGGCCTACA AGGAGAGCAA TTATAGCTAC TGCCTGAGCA GCCGCCTGAG
8101 GGTCTCTGCT ACCTTCTGGC ACAATCCTCG CAACCACTTC CGCTGCCAAG TGCAGTTCCA
8161 TGGGCTTTCA GAGGAGGACA AGTGGCCAGA GGGCTCACCC AAACCTGTCA CACAGAACAT
8221 CAGTGCAGAG GCCTGGGGTC GAGCAGACTG TGGTATTACC TCAGCATCCT ATCAACAAGG
8281 AGTCTTGTCT GCCACCATCC TCTATGAGAT CCTGCTAGGG AAAGCCACCC TGTATGCTGT
8341 GCTTGTCAGT ACACTGGTGG TGATGGCTAT GGTCAAAAGA AAGAATTCAT GAGATATCGA
8401 GCATCTTACC GCCATTTATA CCCATATTTG TTCTGTTTTT CTTGATTTGG GTATACATTT
8461 AAATGTTAAT AAAACAAAAT GGTGGGGCAA TCATTTACAT TTTTAGGGAT ATGTAATTAC
8521 TAGTTCAGGT GTATTGCCAC AAGACAAACA TGTTAAGAAA CTTTCCCGTT ATTTACGCTC
8581 TGTTCCTGTT AATCAACCTC TGGATTACAA AATTTGTGAA AGATTGACTG ATATTCTTAA
8641 CTATGTTGCT CCTTTTACGC TGTGTGGATA TGCTGCTTTA TAGCCTCTGT ATCTAGCTAT
8701 TGCTTCCCGT ACGGCTTTCG TTTTCTCCTC CTTGTATAAA TCCTGGTTGC TGTCTCTTTT
8761 AGAGGAGTTG TGGCCCGTTG TCCGTCAACG TGGCGTGGTG TGCTCTGTGT TTGCTGACGC
8821 AACCCCCACT GGCTGGGGCA TTGCCACCAC CTGTCAACTC CTTTCTGGGA CTTTCGCTTT
8881 CCCCCTCCCG ATCGCCACGG CAGAACTCAT CGCCGCCTGC CTTGCCCGCT GCTGGACAGG
8941 GGCTAGGTTG CTGGGCACTG ATAATTCCGT GGTGTTGTCA GTACTGGTAC CTTTAAGACC
9001 AATGACTTAC AAGGCAGCTG TAGATCTTAG CCACTTTTTA AAAGAAAAGG GGGGACTGGA
9061 AGGGCTAATT CACTCCCAAA GAAGACAAGA TCTGCTTTTT GCCTGTACTG GGTCTCTCTG
9121 GTTAGACCAG ATCTGAGCCT GGGAGCTCTC TGGCTAACTA GGGAACCCAC TGCTTAAGCC
9181 TCAATAAAGC TTGCCTTGAG TGCTTCAAGT AGTGTGTGCC CGTCTGTTGT GTGACTCTGG
9241 TAACTAGAGA TCCCTCAGAC CCTTTTAGTC AGTGTGGAAA ATCTCTAGCA
pLCUS FMC63SLmTRAC_P2A_mTRBC (서열 식별 번호:167)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
361 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
421 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
481 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
541 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
601 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
661 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
721 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
781 GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG
841 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG
901 GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA
961 CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG
1021 AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT
1081 TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT
1141 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG
1201 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG
1261 TCGTTGCTAG GTTACTGTCA TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA
1321 AAAGAGTTTG TAGAAACGCA AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT
1381 CGGTGGCAGT TTATGGCGGG CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT
1441 TCAAATCCGC TCCCGGCGGA TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA
1501 TAAAACGAAA GGCCCAGTCT TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC
1561 CCTACTCTCG CATGGGTTGC GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT
1621 TATCATCGAA TTTCTGCCAT TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG
1681 CGTTTAAGGG CACCAATAAC TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA
1741 GTACTGTTGT AATTCATTAA GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG
1801 AACCTGAATC GCCAGCGGCA TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT
1861 GAAAACGGGG GCGAAGAAGT TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT
1921 CACCCAGGGA TTGGCTGAGA CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC
1981 CAGGTTTTCA CCGTAACACG CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC
2041 GTCGTGGTAT TCACTCCAGA GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA
2101 ACAAGGGTGA ACACTATCCC ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC
2161 CGGATGAGCA TTCATCAGGC GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT
2221 ATTTTTCTTT ACGGTCTTTA AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT
2281 ACATTGAGCA ACTGACTGAA ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC
2341 AACGGTGGTA TATCCAGTGA TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT
2401 CGATAACTCA AAAAATACGC CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC
2461 TCTTACGTGC CGATCAACGT CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG
2521 CGTATCACGA GGCCAGCTTG GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG
2581 TTTGGAACAA GAGTCCACTA TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG
2641 TCTATCAGGG CGATGGCCCA CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA
2701 GGTGCCGTAA AGCACTAAAT CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG
2761 GAAAGCCGGC GAACGTGGCG AGAAAGGAAG GGAAGAAAGCGAAAGGAGCGGGCGCTAAGG
2821 CGCTGGCAAG TGTAGCGGTC ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC
2881 CGCTACAGGG CGCGTACTAT GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG
2941 CGTAAGGAGA AAATACATCG TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT
3001 CAGTGGAGAG GACTTTCACT GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT
3061 TATTGACTAG TTATTAATAG TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG
3121 AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC
3181 GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT
3241 GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC
3301 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
3361 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
3421 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
3481 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
3541 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
3601 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG
3661 TTAGACCAGA TCTGAGCCTG GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT
3721 CAATAAAGCT TGCCTTGAGT GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT
3781 AACTAGAGAT CCCTCAGACC CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA
3841 ACAGGGACTT GAAAGCGAAA GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG
3901 CTGAAGCGCG CACGGCAAGA GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA
3961 CTAGCGGAGG CTAGAAGGAG AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA
4021 TTAGATAAAT GGGAAAAAAT TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA
4081 CATATAGTTA GGGCAAGCAG GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG
4141 ACATCAGAAG GCTGTAGACA AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA
4201 GAAGAACTTA GATCATTATA TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA
4261 GATGTAAAAG ACACCAAGGA AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG
4321 AAAAAGGCAC AGCAAGCGAT CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA
4381 TTGGAGAAGT GAATTATATA AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC
4441 CACCAAGGCA AAGAGAAGAG TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT
4501 GTTCCTTGGG TTCTTGGGAG CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC
4561 GGTACAGGCC AGACAATTAT TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC
4621 TATTGAGGCG CAACAGCATC TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC
4681 AAGAATCCTG GCTGTGGAAA GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG
4741 CTCTGGAAAA CTCATTTGCA CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC
4801 TCTGGAACAG ATTTGGAATA ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA
4861 CACAAGCTTA ATACACTCCT TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA
4921 AGAATTATTG GAATTAGATA AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG
4981 GCTGTGGTAT ATAAAATTAT TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT
5041 TTTTGCTGTA CTTTCTATAG TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA
5101 GACCCACCTC CCAATCCCGA GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT
5161 TAAAAGAAAA GGGGGGATTG GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC
5221 AACAGACATA CAAACTAAAG AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT
5281 TTATTACAGG GACAGCAGAA ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT
5341 CAGTGGGCAG AGCGCACATC GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT
5401 TGAACCGGTG CCTAGAGAAG GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG
5461 CTCCGCCTTT TTCCCGAGGG TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC
5521 GTTCTTTTTC GCAACGGGTT TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC
5581 GGGCCTGGCC TCTTTACGGG TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG
5641 GCTGCAGTAC GTGATTCTTG ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG
5701 GCCTTGCGCT TAAGGAGCCC CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG
5761 GGGCCGCCGC GTGCGAATCT GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC
5821 TCTAGCCATT TAAAATTTTT GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT
5881 TGTAAATGCG GGCCAAGATC TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA
5941 CGGGGCCCGT GCGTCCCAGC GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC
6001 GAGAATCGGA CGGGGGTAGT CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC
6061 GCCGTGTATC GCCCCGCCCT GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC
6121 GGAAAGATGG CCGCTTCCCG GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC
6181 GGGAGAGCGG GCGGGTGAGT CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT
6241 CGCTTCATGT GACTCCACGG AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG
6301 CTTTTGGAGT ACGTCGTCTT TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA
6361 CACTGAGTGG GTGGAGACTG AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA
6421 ATTTGCCCTT TTTGAGTTTG GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG
6481 TTTTTTTCTT CCATTTCAGG TGTCGTGAAA ACTACCCCTC AGAGCCGCCA CCATGCTTCT
6541 CCTGGTGACA AGCCTTCTGC TCTGTGAGTT ACCACACCCA GCATTCCTCC TGATCCCAGA
6601 CATCCAGATG ACACAGACTA CATCCTCCCT GTCTGCCTCT CTGGGAGACA GAGTCACCAT
6661 CAGTTGCAGG GCAAGTCAGG ACATTAGTAA ATATTTAAAT TGGTATCAGC AGAAACCAGA
6721 TGGAACTGTT AAACTCCTGA TCTACCATAC ATCAAGATTA CACTCAGGAG TCCCATCAAG
6781 GTTCAGTGGC AGTGGGTCTG GAACAGATTA TTCTCTCACC ATTAGCAACC TGGAGCAAGA
6841 AGATATTGCC ACTTACTTTT GCCAACAGGG TAATACGCTT CCGTACACGT TCGGAGGGGG
6901 GACTAAGTTG GAAATAACAG GCTCCACCTC TGGATCCGGC AAGCCCGGAT CTGGCGAGGG
6961 ATCCACCAAG GGCGAGGTGA AACTGCAGGA GTCAGGACCT GGCCTGGTGG CGCCCTCACA
7021 GAGCCTGTCC GTCACATGCA CTGTCTCAGG GGTCTCATTA CCCGACTATG GTGTAAGCTG
7081 GATTCGCCAG CCTCCACGAA AGGGTCTGGA GTGGCTGGGA GTAATATGGG GTAGTGAAAC
7141 CACATACTAT AATTCAGCTC TCAAATCCAG ACTGACCATC ATCAAGGACA ACTCCAAGAG
7201 CCAAGTTTTC TTAAAAATGA ACAGTCTGCA AACTGATGAC ACAGCCATTT ACTACTGTGC
7261 CAAACATTAT TACTACGGTG GTAGCTATGC TATGGACTAC TGGGGTCAAG GAACCTCAGT
7321 CACCGTCTCC TCAGCTGCCG CAGGAGGCGG TGGCAGTGGT GGGGGAGGAT CTGGCGGAGG
7381 AGGTAGCTTG GAAATTCAGA ACCCTGAGCC TGCCGTGTAC CAGCTGAAGG ACCCTAGAAG
7441 CCAGGACAGC ACCCTGTGCC TGTTCACCGA CTTCGACAGC CAGATCAACG TGCCCAAGAC
7501 CATGGAAAGC GGCACCTTCA TCACCGATAA GACTGTGCTG GACATGAAGG CCATGGACAG
7561 CAAGAGCAAC GGCGCCATTG CNTGGTCCAA TCAGACCAGC TTTACCTGCC AAGACATCTT
7621 CAAAGAGACA AACGCCACCT ACCCCAGTTC AGACGTTCCC TGTGATGCCA CGTTGACTGA
7681 GAAAAGCTTT GAAACAGATA TGAACCTAAA CTTTCAAAAC CTGTCAGTTA TGGGACTCCG
7741 AATCCTCCTG CTGAAAGTAG CCGGATTTAA CCTGCTCATG ACGCTGAGGC TGTGGTCCAG
7801 TGGCAGCGGC GCTACTAACT TCAGCCTGCT GAAGCAGGCT GGAGACGTGG AGGAGAACCC
7861 TGGACCTATG CTACTACTTG TGACCTCACT ATTGTTATGC GAACTCCCTC ATCCCGCATT
7921 CTTGCTGATT CCAGATCTGA GAAATGTGAC TCCACCCAAG GTCTCCTTGT TTGAGCCATC
7981 AAAAGCAGAG ATTGCAAACA AACAAAAGGC TACCCTCGTG TGCTTGGCCA GGGGCTTCTT
8041 CCCTGACCAC GTGGAGCTGA GCTGGTGGGT GAATGGCAAG GAGGTCCACA GTGGGGTCAG
8101 CACGGACCCT CAGGCCTACA AGGAGAGCAA TTATAGCTAC TGCCTGAGCA GCCGCCTGAG
8161 GGTCTCTGCT ACCTTCTGGC ACAATCCTCG CAACCACTTC CGCTGCCAAG TGCAGTTCCA
8221 TGGGCTTTCA GAGGAGGACA AGTGGCCAGA GGGCTCACCC AAACCTGTCA CACAGAACAT
8281 CAGTGCAGAG GCCTGGGGTC GAGCAGACTG TGGTATTACC TCAGCATCCT ATCAACAAGG
8341 AGTCTTGTCT GCCACCATCC TCTATGAGAT CCTGCTAGGG AAAGCCACCC TGTATGCTGT
8401 GCTTGTCAGT ACACTGGTGG TGATGGCTAT GGTCAAAAGA AAGAATTCAT GAGATATCGA
8461 GCATCTTACC GCCATTTATA CCCATATTTG TTCTGTTTTT CTTGATTTGG GTATACATTT
8521 AAATGTTAAT AAAACAAAAT GGTGGGGCAA TCATTTACAT TTTTAGGGAT ATGTAATTAC
8581 TAGTTCAGGT GTATTGCCAC AAGACAAACA TGTTAAGAAA CTTTCCCGTT ATTTACGCTC
8641 TGTTCCTGTT AATCAACCTC TGGATTACAA AATTTGTGAA AGATTGACTG ATATTCTTAA
8701 CTATGTTGCT CCTTTTACGC TGTGTGGATA TGCTGCTTTA TAGCCTCTGT ATCTAGCTAT
8761 TGCTTCCCGT ACGGCTTTCG TTTTCTCCTC CTTGTATAAA TCCTGGTTGC TGTCTCTTTT
8821 AGAGGAGTTG TGGCCCGTTG TCCGTCAACG TGGCGTGGTG TGCTCTGTGT TTGCTGACGC
8881 AACCCCCACT GGCTGGGGCA TTGCCACCAC CTGTCAACTC CTTTCTGGGA CTTTCGCTTT
8941 CCCCCTCCCG ATCGCCACGG CAGAACTCAT CGCCGCCTGC CTTGCCCGCT GCTGGACAGG
9001 GGCTAGGTTG CTGGGCACTG ATAATTCCGT GGTGTTGTCA GTACTGGTAC CTTTAAGACC
9061 AATGACTTAC AAGGCAGCTG TAGATCTTAG CCACTTTTTA AAAGAAAAGG GGGGACTGGA
9121 AGGGCTAATT CACTCCCAAA GAAGACAAGA TCTGCTTTTT GCCTGTACTG GGTCTCTCTG
9181 GTTAGACCAG ATCTGAGCCT GGGAGCTCTC TGGCTAACTA GGGAACCCAC TGCTTAAGCC
9241 TCAATAAAGC TTGCCTTGAG TGCTTCAAGT AGTGTGTGCC CGTCTGTTGT GTGACTCTGG
9301 TAACTAGAGA TCCCTCAGAC CCTTTTAGTC AGTGTGGAAA ATCTCTAGCA
pLCUS FMC63SLmTRAC_P2A_FMC63SLmTRBC (서열 식별 번호:168)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
361 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
421 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
481 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
541 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
601 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
661 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
721 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
781 GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG
841 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG
901 GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA
961 CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG
1021 AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT
1081 TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT
1141 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG
1201 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG
1261 TCGTTGCTAG GTTACTGTCA TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA
1321 AAAGAGTTTG TAGAAACGCA AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT
1381 CGGTGGCAGT TTATGGCGGG CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT
1441 TCAAATCCGC TCCCGGCGGA TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA
1501 TAAAACGAAA GGCCCAGTCT TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC
1561 CCTACTCTCG CATGGGTTGC GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT
1621 TATCATCGAA TTTCTGCCAT TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG
1681 CGTTTAAGGG CACCAATAAC TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA
1741 GTACTGTTGT AATTCATTAA GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG
1801 AACCTGAATC GCCAGCGGCA TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT
1861 GAAAACGGGG GCGAAGAAGT TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT
1921 CACCCAGGGA TTGGCTGAGA CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC
1981 CAGGTTTTCA CCGTAACACG CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC
2041 GTCGTGGTAT TCACTCCAGA GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA
2101 ACAAGGGTGA ACACTATCCC ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC
2161 CGGATGAGCA TTCATCAGGC GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT
2221 ATTTTTCTTT ACGGTCTTTA AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT
2281 ACATTGAGCA ACTGACTGAA ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC
2341 AACGGTGGTA TATCCAGTGA TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT
2401 CGATAACTCA AAAAATACGC CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC
2461 TCTTACGTGC CGATCAACGT CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG
2521 CGTATCACGA GGCCAGCTTG GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG
2581 TTTGGAACAA GAGTCCACTA TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG
2641 TCTATCAGGG CGATGGCCCA CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA
2701 GGTGCCGTAA AGCACTAAAT CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG
2761 GAAAGCCGGC GAACGTGGCG AGAAAGGAAG GGAAGAAAGCGAAAGGAGCGGGCGCTAAGG
2821 CGCTGGCAAG TGTAGCGGTC ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC
2881 CGCTACAGGG CGCGTACTAT GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG
2941 CGTAAGGAGA AAATACATCG TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT
3001 CAGTGGAGAG GACTTTCACT GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT
3061 TATTGACTAG TTATTAATAG TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG
3121 AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC
3181 GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT
3241 GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC
3301 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
3361 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
3421 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
3481 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
3541 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
3601 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG
3661 TTAGACCAGA TCTGAGCCTG GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT
3721 CAATAAAGCT TGCCTTGAGT GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT
3781 AACTAGAGAT CCCTCAGACC CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA
3841 ACAGGGACTT GAAAGCGAAA GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG
3901 CTGAAGCGCG CACGGCAAGA GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA
3961 CTAGCGGAGG CTAGAAGGAG AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA
4021 TTAGATAAAT GGGAAAAAAT TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA
4081 CATATAGTTA GGGCAAGCAG GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG
4141 ACATCAGAAG GCTGTAGACA AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA
4201 GAAGAACTTA GATCATTATA TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA
4261 GATGTAAAAG ACACCAAGGA AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG
4321 AAAAAGGCAC AGCAAGCGAT CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA
4381 TTGGAGAAGT GAATTATATA AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC
4441 CACCAAGGCA AAGAGAAGAG TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT
4501 GTTCCTTGGG TTCTTGGGAG CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC
4561 GGTACAGGCC AGACAATTAT TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC
4621 TATTGAGGCG CAACAGCATC TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC
4681 AAGAATCCTG GCTGTGGAAA GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG
4741 CTCTGGAAAA CTCATTTGCA CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC
4801 TCTGGAACAG ATTTGGAATA ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA
4861 CACAAGCTTA ATACACTCCT TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA
4921 AGAATTATTG GAATTAGATA AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG
4981 GCTGTGGTAT ATAAAATTAT TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT
5041 TTTTGCTGTA CTTTCTATAG TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA
5101 GACCCACCTC CCAATCCCGA GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT
5161 TAAAAGAAAA GGGGGGATTG GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC
5221 AACAGACATA CAAACTAAAG AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT
5281 TTATTACAGG GACAGCAGAA ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT
5341 CAGTGGGCAG AGCGCACATC GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT
5401 TGAACCGGTG CCTAGAGAAG GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG
5461 CTCCGCCTTT TTCCCGAGGG TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC
5521 GTTCTTTTTC GCAACGGGTT TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC
5581 GGGCCTGGCC TCTTTACGGG TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG
5641 GCTGCAGTAC GTGATTCTTG ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG
5701 GCCTTGCGCT TAAGGAGCCC CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG
5761 GGGCCGCCGC GTGCGAATCT GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC
5821 TCTAGCCATT TAAAATTTTT GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT
5881 TGTAAATGCG GGCCAAGATC TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA
5941 CGGGGCCCGT GCGTCCCAGC GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC
6001 GAGAATCGGA CGGGGGTAGT CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC
6061 GCCGTGTATC GCCCCGCCCT GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC
6121 GGAAAGATGG CCGCTTCCCG GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC
6181 GGGAGAGCGG GCGGGTGAGT CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT
6241 CGCTTCATGT GACTCCACGG AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG
6301 CTTTTGGAGT ACGTCGTCTT TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA
6361 CACTGAGTGG GTGGAGACTG AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA
6421 ATTTGCCCTT TTTGAGTTTG GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG
6481 TTTTTTTCTT CCATTTCAGG TGTCGTGAAA ACTACCCCTC AGAGCCGCCA CCATGCTTCT
6541 CCTGGTGACA AGCCTTCTGC TCTGTGAGTT ACCACACCCA GCATTCCTCC TGATCCCAGA
6601 CATCCAGATG ACACAGACTA CATCCTCCCT GTCTGCCTCT CTGGGAGACA GAGTCACCAT
6661 CAGTTGCAGG GCAAGTCAGG ACATTAGTAA ATATTTAAAT TGGTATCAGC AGAAACCAGA
6721 TGGAACTGTT AAACTCCTGA TCTACCATAC ATCAAGATTA CACTCAGGAG TCCCATCAAG
6781 GTTCAGTGGC AGTGGGTCTG GAACAGATTA TTCTCTCACC ATTAGCAACC TGGAGCAAGA
6841 AGATATTGCC ACTTACTTTT GCCAACAGGG TAATACGCTT CCGTACACGT TCGGAGGGGG
6901 GACTAAGTTG GAAATAACAG GCTCCACCTC TGGATCCGGC AAGCCCGGAT CTGGCGAGGG
6961 ATCCACCAAG GGCGAGGTGA AACTGCAGGA GTCAGGACCT GGCCTGGTGG CGCCCTCACA
7021 GAGCCTGTCC GTCACATGCA CTGTCTCAGG GGTCTCATTA CCCGACTATG GTGTAAGCTG
7081 GATTCGCCAG CCTCCACGAA AGGGTCTGGA GTGGCTGGGA GTAATATGGG GTAGTGAAAC
7141 CACATACTAT AATTCAGCTC TCAAATCCAG ACTGACCATC ATCAAGGACA ACTCCAAGAG
7201 CCAAGTTTTC TTAAAAATGA ACAGTCTGCA AACTGATGAC ACAGCCATTT ACTACTGTGC
7261 CAAACATTAT TACTACGGTG GTAGCTATGC TATGGACTAC TGGGGTCAAG GAACCTCAGT
7321 CACCGTCTCC TCAGCTGCCG CAGGAGGCGG TGGCAGTGGT GGGGGAGGAT CTGGCGGAGG
7381 AGGTAGCTTG GAAATTCAGA ACCCTGAGCC TGCCGTGTAC CAGCTGAAGG ACCCTAGAAG
7441 CCAGGACAGC ACCCTGTGCC TGTTCACCGA CTTCGACAGC CAGATCAACG TGCCCAAGAC
7501 CATGGAAAGC GGCACCTTCA TCACCGATAA GACTGTGCTG GACATGAAGG CCATGGACAG
7561 CAAGAGCAAC GGCGCCATTG CNTGGTCCAA TCAGACCAGC TTTACCTGCC AAGACATCTT
7621 CAAAGAGACA AACGCCACCT ACCCCAGTTC AGACGTTCCC TGTGATGCCA CGTTGACTGA
7681 GAAAAGCTTT GAAACAGATA TGAACCTAAA CTTTCAAAAC CTGTCAGTTA TGGGACTCCG
7741 AATCCTCCTG CTGAAAGTAG CCGGATTTAA CCTGCTCATG ACGCTGAGGC TGTGGTCCAG
7801 TGGCAGCGGC GCTACTAACT TCAGCCTGCT GAAGCAGGCT GGAGACGTGG AGGAGAACCC
7861 TGGACCTATG CTACTACTTG TGACCTCACT ATTGTTATGC GAACTCCCTC ATCCCGCATT
7921 CTTGCTGATT CCAGACATTC AGATGACTCA AACAACTTCC AGCCTCTCCG CCTCACTCGG
7981 CGACCGCGTA ACAATAAGCT GTCGGGCCTC GCAAGATATT AGTAAGTACC TGAATTGGTA
8041 TCAGCAAAAA CCCGATGGTA CAGTCAAGCT TCTGATCTAC CATACCAGTC GTCTGCACAG
8101 CGGTGTCCCC AGCAGGTTCA GCGGCTCAGG ATCTGGTACC GATTATTCAC TGACGATTTC
8161 CAACCTTGAG CAGGAGGACA TCGCCACCTA CTTCTGCCAG CAGGGTAATA CTCTGCCGTA
8221 CACATTCGGG GGCGGTACCA AGCTCGAGAT CACGGGTTCA ACAAGCGGTT CTGGCAAGCC
8281 AGGCAGCGGC GAGGGGAGTA CAAAGGGGGA GGTGAAGTTG CAGGAAAGTG GCCCTGGATT
8341 GGTGGCCCCG AGCCAGAGTC TGTCTGTCAC CTGCACAGTT TCCGGAGTAA GTCTGCCTGA
8401 TTACGGAGTG TCCTGGATCA GACAGCCACC TCGAAAGGGC TTGGAGTGGC TTGGGGTCAT
8461 TTGGGGCAGT GAAACCACAT ACTACAACAG CGCTCTTAAG TCCAGGCTCA CTATCATCAA
8521 GGACAATTCA AAGAGCCAAG TATTCTTGAA AATGAATTCC CTGCAGACTG ATGACACCGC
8581 TATTTATTAT TGCGCTAAAC ATTATTACTA TGGAGGTTCT TATGCCATGG ACTACTGGGG
8641 GCAGGGTACC TCTGTGACAG TGAGTTCAGC TGCAGCTGGA GGTGGAGGTA GCGGAGGCGG
8701 TGGTAGTGGA GGGGGTGGTT CTCTGGAAGA TCTGAGAAAT GTGACTCCAC CCAAGGTCTC
8761 CTTGTTTGAG CCATCAAAAG CAGAGATTGC AAACAAACAA AAGGCTACCC TCGTGTGCTT
8821 GGCCAGGGGC TTCTTCCCTG ACCACGTGGA GCTGAGCTGG TGGGTGAATG GCAAGGAGGT
8881 CCACAGTGGG GTCAGCACGG ACCCTCAGGC CTACAAGGAG AGCAATTATA GCTACTGCCT
8941 GAGCAGCCGC CTGAGGGTCT CTGCTACCTT CTGGCACAAT CCTCGCAACC ACTTCCGCTG
9001 CCAAGTGCAG TTCCATGGGC TTTCAGAGGA GGACAAGTGG CCAGAGGGCT CACCCAAACC
9061 TGTCACACAG AACATCAGTG CAGAGGCCTG GGGTCGAGCA GACTGTGGTA TTACCTCAGC
9121 ATCCTATCAA CAAGGAGTCT TGTCTGCCAC CATCCTCTAT GAGATCCTGC TAGGGAAAGC
9181 CACCCTGTAT GCTGTGCTTG TCAGTACACT GGTGGTGATG GCTATGGTCA AAAGAAAGAA
9241 TTCATGAGAT ATCGAGCATC TTACCGCCAT TTATACCCAT ATTTGTTCTG TTTTTCTTGA
9301 TTTGGGTATA CATTTAAATG TTAATAAAAC AAAATGGTGG GGCAATCATT TACATTTTTA
9361 GGGATATGTA ATTACTAGTT CAGGTGTATT GCCACAAGAC AAACATGTTA AGAAACTTTC
9421 CCGTTATTTA CGCTCTGTTC CTGTTAATCA ACCTCTGGAT TACAAAATTT GTGAAAGATT
9481 GACTGATATT CTTAACTATG TTGCTCCTTT TACGCTGTGT GGATATGCTG CTTTATAGCC
9541 TCTGTATCTA GCTATTGCTT CCCGTACGGC TTTCGTTTTC TCCTCCTTGT ATAAATCCTG
9601 GTTGCTGTCT CTTTTAGAGG AGTTGTGGCC CGTTGTCCGT CAACGTGGCG TGGTGTGCTC
9661 TGTGTTTGCT GACGCAACCC CCACTGGCTG GGGCATTGCC ACCACCTGTC AACTCCTTTC
9721 TGGGACTTTC GCTTTCCCCC TCCCGATCGC CACGGCAGAA CTCATCGCCG CCTGCCTTGC
9781 CCGCTGCTGG ACAGGGGCTA GGTTGCTGGG CACTGATAAT TCCGTGGTGT TGTCAGTACT
9841 GGTACCTTTA AGACCAATGA CTTACAAGGC AGCTGTAGAT CTTAGCCACT TTTTAAAAGA
9901 AAAGGGGGGA CTGGAAGGGC TAATTCACTC CCAAAGAAGA CAAGATCTGC TTTTTGCCTG
9961 TACTGGGTCT CTCTGGTTAG ACCAGATCTG AGCCTGGGAG CTCTCTGGCT AACTAGGGAA
10021 CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTT CAAGTAGTGT GTGCCCGTCT
10081 GTTGTGTGAC TCTGGTAACT AGAGATCCCT CAGACCCTTT TAGTCAGTGT GGAAAATCTC
10141 TAGCA
pLKaUS FMC63mTRAC_P2A_FMC63mTRBC (서열 식별 번호:169)
1 CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT
61 ACGGTTATCC ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA
121 AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC
181 TGACGAGCAT CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA
241 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC
301 GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC
361 ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA
421 ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC
481 GGTAAGACAC GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG
541 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG
601 AACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG
661 CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA
721 GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA
781 CGCTCAGTGG AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGTTAAT TAACTTGCGC
841 CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC AGTGTTACAA CCAATTAACC AATTCTGATT
901 AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT CACATCAGGA TTATCAATAC
961 CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA CTCACCGAGG CAGTTCCATA
1021 GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG TCCAACATCA ATACAACCTA
1081 TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA ATCACCATGA GTGACGACTG
1141 AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA GACTTGTTCA ACAGGCCAGC
1201 CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC GTTATTCATT CGTGATTGCG
1261 CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA ATTACAAACA GGAATCGAAT
1321 GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT TTCACCTGAA TCAGGATATT
1381 CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT GGTGAGTAAC CATGCATCAT
1441 CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT AAATTCCGTC AGCCAGTTTA
1501 GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC TTTGCCATGT TTCAGAAACA
1561 ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT CGCACCTGAT TGCCCGACAT
1621 TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT GTTGGAATTT AATCGCGGCC
1681 TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT ATTACTGTTT ATGTAAGCAG
1741 ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC AATGTAACAT CAGAGATTTT
1801 GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA ACCTATAAAA ATAGGCGTAT
1861 CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT TGAGTGTTGT TCCAGTTTGG
1921 AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA AAGGGCGAAA AACCGTCTAT
1981 CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA GTTTTTTGGG GTCGAGGTGC
2041 CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG
2101 CCGGCGAACG TGGCGAGAAA GGAAGGGAAG AAAGCGAAAG GAGCGGGCGCTAAGGCGCTG
2161 GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG CCGCGCTTAA TGCGCCGCTA
2221 CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA AATACCGCAC AGATGCGTAA
2281 GGAGAAAATA CATCGTGATC CGGATCAAGA TCCAGATCGA ATTGGAGGCT ACAGTCAGTG
2341 GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC CTAGGGGACA TTGATTATTG
2401 ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC ATAGCCCATA TATGGAGTTC
2461 CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC CGCCCAACGA CCCCCGCCCA
2521 TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA TAGGGACTTT CCATTGACGT
2581 CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG TACATCAAGT GTATCATATG
2641 CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC CCGCCTGGCA TTATGCCCAG
2701 TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT ACGTATTAGT CATCGCTATT
2761 ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG GATAGCGGTT TGACTCACGG
2821 GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT TGTTTTGGCA CCAAAATCAA
2881 CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA CGCAAATGGG CGGTAGGCGT
2941 GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA
3001 CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA
3061 AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG TTGTGTGACT CTGGTAACTA
3121 GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT AGCAGTGGCG CCCGAACAGG
3181 GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC GCAGGACTCG GCTTGCTGAA
3241 GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA CGCCAAAAAT TTTGACTAGC
3301 GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA TTAAGCGGGG GAGAATTAGA
3361 TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA CAATATAAAC TAAAACATAT
3421 AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT CCTGGCCTTT TAGAGACATC
3481 AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC CTTCAGACAG GATCAGAAGA
3541 ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT GTGCATCAAA GGATAGATGT
3601 AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG CAAAACAAAAGTAAGAAAAA
3661 GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG CGATATGAGG GACAATTGGA
3721 GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC ATTAGGAGTA GCACCCACCA
3781 AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT GGGAATAGGA GCTTTGTTCC
3841 TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC GTCAATGACG CTGACGGTAC
3901 AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA CAATTTGCTG AGGGCTATTG
3961 AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT CAAACAGCTC CAGGCAAGAA
4021 TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT GGGGATTTGG GGTTGCTCTG
4081 GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG TTGGAGTAAT AAATCTCTGG
4141 AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG AGAAATTAAC AATTACACAA
4201 GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA AGAAAAGAAT GAACAAGAAT
4261 TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT TAACATAACA AATTGGCTGT
4321 GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG
4381 CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC ACCATTATCG TTTCAGACCC
4441 ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT ATTCATCCAC AATTTTAAAA
4501 GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT AGTAGACATA ATAGCAACAG
4561 ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT TCAAAATTTT CGGGTTTATT
4621 ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC GGCTCCGGTG CCCGTCAGTG
4681 GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG GGAGGGGTCG GCAATTGAAC
4741 CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT GATGTCGTGT ACTGGCTCCG
4801 CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA GTAGTCGCCG TGAACGTTCT
4861 TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC
4921 TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT ACTTCCACGC CCCTGGCTGC
4981 AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT
5041 GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC
5101 GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG
5161 CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA
5221 ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG GGCCGCGGGC GGCGACGGGG
5281 CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT GCGAGCGCGG CCACCGAGAA
5341 TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT
5401 GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA
5461 GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG GAGGACGCGG CGCTCGGGAG
5521 AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT
5581 CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT CGATTAGTTC TCGAGCTTTT
5641 GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC GATGGAGTTT CCCCACACTG
5701 AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT GTAATTCTCC TTGGAATTTG
5761 CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA GACAGTGGTT CAAAGTTTTT
5821 TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCAGAGC CGCCACCATG CTTCTCCTGG
5881 TGACAAGCCT TCTGCTCTGT GAGTTACCAC ACCCAGCATT CCTCCTGATC CCAGACATCC
5941 AGATGACACA GACTACATCC TCCCTGTCTG CCTCTCTGGG AGACAGAGTC ACCATCAGTT
6001 GCAGGGCAAG TCAGGACATT AGTAAATATT TAAATTGGTA TCAGCAGAAA CCAGATGGAA
6061 CTGTTAAACT CCTGATCTAC CATACATCAA GATTACACTC AGGAGTCCCA TCAAGGTTCA
6121 GTGGCAGTGG GTCTGGAACA GATTATTCTC TCACCATTAG CAACCTGGAG CAAGAAGATA
6181 TTGCCACTTA CTTTTGCCAA CAGGGTAATA CGCTTCCGTA CACGTTCGGA GGGGGGACTA
6241 AGTTGGAAAT AACAGGCTCC ACCTCTGGAT CCGGCAAGCC CGGATCTGGC GAGGGATCCA
6301 CCAAGGGCGA GGTGAAACTG CAGGAGTCAG GACCTGGCCT GGTGGCGCCC TCACAGAGCC
6361 TGTCCGTCAC ATGCACTGTC TCAGGGGTCT CATTACCCGA CTATGGTGTA AGCTGGATTC
6421 GCCAGCCTCC ACGAAAGGGT CTGGAGTGGC TGGGAGTAAT ATGGGGTAGT GAAACCACAT
6481 ACTATAATTC AGCTCTCAAA TCCAGACTGA CCATCATCAA GGACAACTCC AAGAGCCAAG
6541 TTTTCTTAAA AATGAACAGT CTGCAAACTG ATGACACAGC CATTTACTAC TGTGCCAAAC
6601 ATTATTACTA CGGTGGTAGC TATGCTATGG ACTACTGGGG TCAAGGAACC TCAGTCACCG
6661 TCTCCTCAAT TCAGAACCCT GAGCCTGCCG TGTACCAGCT GAAGGACCCT AGAAGCCAGG
6721 ACAGCACCCT GTGCCTGTTC ACCGACTTCG ACAGCCAGAT CAACGTGCCC AAGACCATGG
6781 AAAGCGGCAC CTTCATCACC GATAAGACTG TGCTGGACAT GAAGGCCATG GACAGCAAGA
6841 GCAACGGCGC CATTGCNTGG TCCAATCAGA CCAGCTTTAC CTGCCAAGAC ATCTTCAAAG
6901 AGACAAACGC CACCTACCCC AGTTCAGACG TTCCCTGTGA TGCCACGTTG ACTGAGAAAA
6961 GCTTTGAAAC AGATATGAAC CTAAACTTTC AAAACCTGTC AGTTATGGGA CTCCGAATCC
7021 TCCTGCTGAA AGTAGCCGGA TTTAACCTGC TCATGACGCT GAGGCTGTGG TCCAGTGGCA
7081 GCGGCGCTAC TAACTTCAGC CTGCTGAAGC AGGCTGGAGA CGTGGAGGAG AACCCTGGAC
7141 CTATGCTACT ACTTGTGACC TCACTATTGT TATGCGAACT CCCTCATCCC GCATTCTTGC
7201 TGATTCCAGA CATTCAGATG ACTCAAACAA CTTCCAGCCT CTCCGCCTCA CTCGGCGACC
7261 GCGTAACAAT AAGCTGTCGG GCCTCGCAAG ATATTAGTAA GTACCTGAAT TGGTATCAGC
7321 AAAAACCCGA TGGTACAGTC AAGCTTCTGA TCTACCATAC CAGTCGTCTG CACAGCGGTG
7381 TCCCCAGCAG GTTCAGCGGC TCAGGATCTG GTACCGATTA TTCACTGACG ATTTCCAACC
7441 TTGAGCAGGA GGACATCGCC ACCTACTTCT GCCAGCAGGG TAATACTCTG CCGTACACAT
7501 TCGGGGGCGG TACCAAGCTC GAGATCACGG GTTCAACAAG CGGTTCTGGC AAGCCAGGCA
7561 GCGGCGAGGG GAGTACAAAG GGGGAGGTGA AGTTGCAGGA AAGTGGCCCT GGATTGGTGG
7621 CCCCGAGCCA GAGTCTGTCT GTCACCTGCA CAGTTTCCGG AGTAAGTCTG CCTGATTACG
7681 GAGTGTCCTG GATCAGACAG CCACCTCGAA AGGGCTTGGA GTGGCTTGGG GTCATTTGGG
7741 GCAGTGAAAC CACATACTAC AACAGCGCTC TTAAGTCCAG GCTCACTATC ATCAAGGACA
7801 ATTCAAAGAG CCAAGTATTC TTGAAAATGA ATTCCCTGCA GACTGATGAC ACCGCTATTT
7861 ATTATTGCGC TAAACATTAT TACTATGGAG GTTCTTATGC CATGGACTAC TGGGGGCAGG
7921 GTACCTCTGT GACAGTGAGT TCAGATCTGA GAAATGTGAC TCCACCCAAG GTCTCCTTGT
7981 TTGAGCCATC AAAAGCAGAG ATTGCAAACA AACAAAAGGC TACCCTCGTG TGCTTGGCCA
8041 GGGGCTTCTT CCCTGACCAC GTGGAGCTGA GCTGGTGGGT GAATGGCAAG GAGGTCCACA
8101 GTGGGGTCAG CACGGACCCa CAGGCCTACA AGGAGAGCAA TTATAGCTAC TGCCTGAGCA
8161 GCCGCCTGAG GGTCTCTGCT ACCTTCTGGC ACAATCCTCG CAACCACTTC CGCTGCCAAG
8221 TGCAGTTCCA TGGGCTTTCA GAGGAGGACA AGTGGCCAGA GGGCTCACCC AAACCTGTCA
8281 CACAGAACAT CAGTGCAGAG GCCTGGGGTC GAGCAGACTG TGGTATTACC TCAGCATCCT
8341 ATCAACAAGG AGTCTTGTCT GCCACCATCC TCTATGAGAT CCTGCTAGGG AAAGCCACCC
8401 TGTATGCTGT GCTTGTCAGT ACACTGGTGG TGATGGCTAT GGTCAAAAGA AAGAATTCAT
8461 GAGATATCGA GCATCTTACC GCCATTTATA CCCATATTTG TTCTGTTTTT CTTGATTTGG
8521 GTATACATTT AAATGTTAAT AAAACAAAAT GGTGGGGCAA TCATTTACAT TTTTAGGGAT
8581 ATGTAATTAC TAGTTCAGGT GTATTGCCAC AAGACAAACA TGTTAAGAAA CTTTCCCGTT
8641 ATTTACGCTC TGTTCCTGTT AATCAACCTC TGGATTACAA AATTTGTGAA AGATTGACTG
8701 ATATTCTTAA CTATGTTGCT CCTTTTACGC TGTGTGGATA TGCTGCTTTA TAGCCTCTGT
8761 ATCTAGCTAT TGCTTCCCGT ACGGCTTTCG TTTTCTCCTC CTTGTATAAA TCCTGGTTGC
8821 TGTCTCTTTT AGAGGAGTTG TGGCCCGTTG TCCGTCAACG TGGCGTGGTG TGCTCTGTGT
8881 TTGCTGACGC AACCCCCACT GGCTGGGGCA TTGCCACCAC CTGTCAACTC CTTTCTGGGA
8941 CTTTCGCTTT CCCCCTCCCG ATCGCCACGG CAGAACTCAT CGCCGCCTGC CTTGCCCGCT
9001 GCTGGACAGG GGCTAGGTTG CTGGGCACTG ATAATTCCGT GGTGTTGTCA GTACTGGTAC
9061 CTTTAAGACC AATGACTTAC AAGGCAGCTG TAGATCTTAG CCACTTTTTA AAAGAAAAGG
9121 GGGGACTGGA AGGGCTAATT CACTCCCAAA GAAGACAAGA TCTGCTTTTT GCCTGTACTG
9181 GGTCTCTCTG GTTAGACCAG ATCTGAGCCT GGGAGCTCTC TGGCTAACTA GGGAACCCAC
9241 TGCTTAAGCC TCAATAAAGC TTGCCTTGAG TGCTTCAAGT AGTGTGTGCC CGTCTGTTGT
9301 GTGACTCTGG TAACTAGAGA TCCCTCAGAC CCTTTTAGTC AGTGTGGAAA ATCTCTAGCA
9361 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
9421 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
9481 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
9541 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
9601 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
9661 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
9721 TTCCTCGCTC ACTGA
pLRPO FMC63 endoL TRBC1(126-177) (서열 식별 번호:170)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
5281 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
5341 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
5401 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
5461 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
5521 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA TCCGGCAAGC
5581 CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA GGACCTGGCC
5641 TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC TCATTACCCG
5701 ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG CTGGGAGTAA
5761 TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG ACCATCATCA
5821 AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT GATGACACAG
5881 CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG GACTACTGGG
5941 GTCAAGGAAC CTCAGTCACC GTCTCCTCAG GATGGGGTAG AGCAGACTGT GGCTTTACCT
6001 CGGTGTCCTA CCAGCAAGGG GTCCTGTCTG CCACCATCCT CTATGAGATC CTGCTAGGGA
6061 AGGCCACCCT GTATGCTGTG CTGGTCAGCG CCCTTGTGTT GATGGCCATG GTCAAGAGAA
6121 AGGATTTCTG AGATATCGAG CATCTTACCG CCATTTATAC CCATATTTGT TCTGTTTTTC
6181 TTGATTTGGG TATACATTTA AATGTTAATA AAACAAAATG GTGGGGCAAT CATTTACATT
6241 TTTAGGGATA TGTAATTACT AGTTCAGGTG TATTGCCACA AGACAAACAT GTTAAGAAAC
6301 TTTCCCGTTA TTTACGCTCT GTTCCTGTTA ATCAACCTCT GGATTACAAA ATTTGTGAAA
6361 GATTGACTGA TATTCTTAAC TATGTTGCTC CTTTTACGCT GTGTGGATAT GCTGCTTTAT
6421 AGCCTCTGTA TCTAGCTATT GCTTCCCGTA CGGCTTTCGT TTTCTCCTCC TTGTATAAAT
6481 CCTGGTTGCT GTCTCTTTTA GAGGAGTTGT GGCCCGTTGT CCGTCAACGT GGCGTGGTGT
6541 GCTCTGTGTT TGCTGACGCA ACCCCCACTG GCTGGGGCAT TGCCACCACC TGTCAACTCC
6601 TTTCTGGGAC TTTCGCTTTC CCCCTCCCGA TCGCCACGGC AGAACTCATC GCCGCCTGCC
6661 TTGCCCGCTG CTGGACAGGG GCTAGGTTGC TGGGCACTGA TAATTCCGTG GTGTTGTCAG
6721 TACTGGTACC TTTAAGACCA ATGACTTACA AGGCAGCTGT AGATCTTAGC CACTTTTTAA
6781 AAGAAAAGGG GGGACTGGAA GGGCTAATTC ACTCCCAAAG AAGACAAGAT CTGCTTTTTG
6841 CCTGTACTGG GTCTCTCTGG TTAGACCAGA TCTGAGCCTG GGAGCTCTCT GGCTAACTAG
6901 GGAACCCACT GCTTAAGCCT CAATAAAGCT TGCCTTGAGT GCTTCAATGA TCATAATCAA
6961 GCCATATCAC ATCTGTAGAG GTTTACTTGC TTTAAAAAAC CTCCACACCT CCCCCTGAAC
7021 CTGAAACATA AAATGAATGC AATTGTTGTT GTTAACTTGT TTATTGCAGC TTATAATGGT
7081 TACAAATAAA GCAATAGCAT CACAAATTTC ACAAATAAAG CATTTTTTTC ACTGCATTCT
7141 AGTTGTGGTT TGTCCAAACT CATCAATGTA TCTTATCATG TCTGGATCTG CGTCGACACG
7201 AAGAGACGAC TGACTGACTG ACTGGAAAGA GGAAGGGCTG GAAGAGGAAG GAGCTTGATC
7261 CAGATCCCGA TCTCGATCCA GATCCGGATC GCAGCTTGGC GTAATCATGG TCATAGCTGT
7321 TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CATACGAGCC GGAAGCATAA
7381 AGTGTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC ATTAATTGCG TTGCGCTCAC
7441 TGCCCGCTTT CCAGTCGGGA AACCTGTCGT GCCAGCTGCA TTAATGAATC GGCCAACGCG
7501 CGGGGAGAGG CGGTTTGCGT ATTGGGCGCT CTTCCGCTTC CTCGCTCACT GACTCGCTGC
7561 GCTCGGTCGT TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT
7621 CCACAGAATC AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG CAAAAGGCCA
7681 GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG GCTCCGCCCC CCTGACGAGC
7741 ATCACAAAAA TCGACGCTCA AGTCAGAGGT GGCGAAACCC GACAGGACTA TAAAGATACC
7801 AGGCGTTTCC CCCTGGAAGC TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG
7861 GATACCTGTC CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCATAGC TCACGCTGTA
7921 GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC GAACCCCCCG
7981 TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT TGAGTCCAAC CCGGTAAGAC
8041 ACGACTTATC GCCACTGGCA GCAGCCACTG GTAACAGGAT TAGCAGAGCG AGGTATGTAG
8101 GCGGTGCTAC AGAGTTCTTG AAGTGGTGGC CTAACTACGG CTACACTAGA AGAACAGTAT
8161 TTGGTATCTG CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT
8221 CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG CAGATTACGC
8281 GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC TACGGGGTCT GACGCTCAGT
8341 GGAACGAAAA CTCACGTTAA GGGATTTTGG TCATGAGATT ATCAAAAAGG ATCTTCACCT
8401 AGATCCTTTT AAATTAAAAA TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT
8461 GGTCTGACAG TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC
8521 GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG GAGGGCTTAC
8581 CATCTGGCCC CAGTGCTGCA ATGATACCGC AGCTTGGGAA ACCATAAGAG CTGAAGCCAG
8641 TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG
8701 GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC
8761 CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT
8821 TGGTCATGAG CTTGCGCCGT CCCGTCAAGT CAGCGTAATG CTCTGCCAGT GTTACAA
pLRPO FMC63 SL TRBC1(131-177) (서열 식별 번호:171)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
5281 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
5341 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
5401 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
5461 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
5521 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA TCCGGCAAGC
5581 CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA GGACCTGGCC
5641 TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC TCATTACCCG
5701 ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG CTGGGAGTAA
5761 TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG ACCATCATCA
5821 AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT GATGACACAG
5881 CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG GACTACTGGG
5941 GTCAAGGAAC CTCAGTCACC GTCTCCTCAG CaGCtGCaGG aGGTGGAGGt AGTGGTGGTG
6001 GaGGtTCTGG aGGTGGaGGT AGtCTaGAaT GTGGCTTTAC CTCGGTGTCC TACCAGCAAG
6061 GGGTCCTGTC TGCCACCATC CTCTATGAGA TCCTGCTAGG GAAGGCCACC CTGTATGCTG
6121 TGCTGGTCAG CGCCCTTGTG TTGATGGCCA TGGTCAAGAG AAAGGATTTC TGAGATATCG
6181 AGCATCTTAC CGCCATTTAT ACCCATATTT GTTCTGTTTT TCTTGATTTG GGTATACATT
6241 TAAATGTTAA TAAAACAAAA TGGTGGGGCA ATCATTTACA TTTTTAGGGA TATGTAATTA
6301 CTAGTTCAGG TGTATTGCCA CAAGACAAAC ATGTTAAGAA ACTTTCCCGT TATTTACGCT
6361 CTGTTCCTGT TAATCAACCT CTGGATTACA AAATTTGTGA AAGATTGACT GATATTCTTA
6421 ACTATGTTGC TCCTTTTACG CTGTGTGGAT ATGCTGCTTT ATAGCCTCTG TATCTAGCTA
6481 TTGCTTCCCG TACGGCTTTC GTTTTCTCCT CCTTGTATAA ATCCTGGTTG CTGTCTCTTT
6541 TAGAGGAGTT GTGGCCCGTT GTCCGTCAAC GTGGCGTGGT GTGCTCTGTG TTTGCTGACG
6601 CAACCCCCAC TGGCTGGGGC ATTGCCACCA CCTGTCAACT CCTTTCTGGG ACTTTCGCTT
6661 TCCCCCTCCC GATCGCCACG GCAGAACTCA TCGCCGCCTG CCTTGCCCGC TGCTGGACAG
6721 GGGCTAGGTT GCTGGGCACT GATAATTCCG TGGTGTTGTC AGTACTGGTA CCTTTAAGAC
6781 CAATGACTTA CAAGGCAGCT GTAGATCTTA GCCACTTTTT AAAAGAAAAG GGGGGACTGG
6841 AAGGGCTAAT TCACTCCCAA AGAAGACAAG ATCTGCTTTT TGCCTGTACT GGGTCTCTCT
6901 GGTTAGACCA GATCTGAGCC TGGGAGCTCT CTGGCTAACT AGGGAACCCA CTGCTTAAGC
6961 CTCAATAAAG CTTGCCTTGA GTGCTTCAAT GATCATAATC AAGCCATATC ACATCTGTAG
7021 AGGTTTACTT GCTTTAAAAA ACCTCCACAC CTCCCCCTGA ACCTGAAACA TAAAATGAAT
7081 GCAATTGTTG TTGTTAACTT GTTTATTGCA GCTTATAATG GTTACAAATA AAGCAATAGC
7141 ATCACAAATT TCACAAATAA AGCATTTTTT TCACTGCATT CTAGTTGTGG TTTGTCCAAA
7201 CTCATCAATG TATCTTATCA TGTCTGGATC TGCGTCGACA CGAAGAGACG ACTGACTGAC
7261 TGACTGGAAA GAGGAAGGGC TGGAAGAGGA AGGAGCTTGA TCCAGATCCC GATCTCGATC
7321 CAGATCCGGA TCGCAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG TGAAATTGTT
7381 ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG
7441 CCTAATGAGT GAGCTAACTC ACATTAATTG CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG
7501 GAAACCTGTC GTGCCAGCTG CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC
7561 GTATTGGGCG CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC
7621 GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA TCAGGGGATA
7681 ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC CAGGAACCGTAAAAAGGCCG
7741 CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC CCCCTGACGA GCATCACAAA AATCGACGCT
7801 CAAGTCAGAG GTGGCGAAAC CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA
7861 GCTCCCTCGT GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC
7921 TCCCTTCGGG AAGCGTGGCG CTTTCTCATA GCTCACGCTG TAGGTATCTC AGTTCGGTGT
7981 AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC CGTTCAGCCC GACCGCTGCG
8041 CCTTATCCGG TAACTATCGT CTTGAGTCCA ACCCGGTAAG ACACGACTTA TCGCCACTGG
8101 CAGCAGCCAC TGGTAACAGG ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT
8161 TGAAGTGGTG GCCTAACTAC GGCTACACTA GAAGAACAGT ATTTGGTATC TGCGCTCTGC
8221 TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA CAAACCACCG
8281 CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC GCGCAGAAAA AAAGGATCTC
8341 AAGAAGATCC TTTGATCTTT TCTACGGGGT CTGACGCTCA GTGGAACGAA AACTCACGTT
8401 AAGGGATTTT GGTCATGAGA TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA
8461 AATGAAGTTT TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT
8521 GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC ATAGTTGCCT
8581 GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG
8641 CAATGATACC GCAGCTTGGG AAACCATAAG AGCTGAAGCC AGTTACCTTC GGAAAAAGAG
8701 TTGGTAGCTC TTGATCCGGC AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA
8761 AGCAGCAGAT TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG
8821 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG AGCTTGCGCC
8881 GTCCCGTCAA GTCAGCGTAA TGCTCTGCCA GTGTTACAA
pLRPO FMC63 endoL TRBC1 (서열 식별 번호:172)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
5281 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
5341 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
5401 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
5461 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
5521 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA TCCGGCAAGC
5581 CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA GGACCTGGCC
5641 TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC TCATTACCCG
5701 ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG CTGGGAGTAA
5761 TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG ACCATCATCA
5821 AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT GATGACACAG
5881 CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG GACTACTGGG
5941 GTCAAGGAAC CTCAGTCACC GTCTCCTCAG GAGTAGAGGA CCTGAACAAG GTGTTCCCAC
6001 CCGAGGTCGC TGTGTTTGAG CCATCAGAAG CAGAGATCTC CCACACCCAA AAGGCCACtC
6061 TaGTaTGtCT aGCtACAGGC TTCTTCCCTG ACCACGTGGA GCTGAGCTGG TGGGTGAATG
6121 GGAAGGAGGT GCACAGTGGG GTCAGCACGG ACCCGCAGCC aCTtAAaGAa CAGCCaGCtC
6181 TCAATGACTC CAGATACTGt CTaAGCAGtC GaCTtAGaGT CTCGGCtACa TTtTGGCAaA
6241 AtCCtCGaAA CCACTTCCGC TGTCAAGTCC AGTTCTACGG GCTCTCGGAG AATGACGAGT
6301 GGACCCAGGA TAGGGCCAAA CCCGTCACCC AGATCGTCAG CGCCGAGGCC TGGGGTAGAG
6361 CAGACTGTGG CTTTACCTCG GTGTCCTACC AGCAAGGGGT CCTGTCTGCC ACCATCCTCT
6421 ATGAGATCCT GCTAGGGAAG GCCACCCTGT ATGCTGTGCT GGTCAGCGCC CTTGTGTTGA
6481 TGGCCATGGT CAAGAGAAAG GATTTCTGAG ATATCGAGCA TCTTACCGCC ATTTATACCC
6541 ATATTTGTTC TGTTTTTCTT GATTTGGGTA TACATTTAAA TGTTAATAAA ACAAAATGGT
6601 GGGGCAATCA TTTACATTTT TAGGGATATG TAATTACTAG TTCAGGTGTA TTGCCACAAG
6661 ACAAACATGT TAAGAAACTT TCCCGTTATT TACGCTCTGT TCCTGTTAAT CAACCTCTGG
6721 ATTACAAAAT TTGTGAAAGA TTGACTGATA TTCTTAACTA TGTTGCTCCT TTTACGCTGT
6781 GTGGATATGC TGCTTTATAG CCTCTGTATC TAGCTATTGC TTCCCGTACG GCTTTCGTTT
6841 TCTCCTCCTT GTATAAATCC TGGTTGCTGT CTCTTTTAGA GGAGTTGTGG CCCGTTGTCC
6901 GTCAACGTGG CGTGGTGTGC TCTGTGTTTG CTGACGCAAC CCCCACTGGC TGGGGCATTG
6961 CCACCACCTG TCAACTCCTT TCTGGGACTT TCGCTTTCCC CCTCCCGATC GCCACGGCAG
7021 AACTCATCGC CGCCTGCCTT GCCCGCTGCT GGACAGGGGC TAGGTTGCTG GGCACTGATA
7081 ATTCCGTGGT GTTGTCAGTA CTGGTACCTT TAAGACCAAT GACTTACAAG GCAGCTGTAG
7141 ATCTTAGCCA CTTTTTAAAA GAAAAGGGGG GACTGGAAGG GCTAATTCAC TCCCAAAGAA
7201 GACAAGATCT GCTTTTTGCC TGTACTGGGT CTCTCTGGTT AGACCAGATC TGAGCCTGGG
7261 AGCTCTCTGG CTAACTAGGG AACCCACTGC TTAAGCCTCA ATAAAGCTTG CCTTGAGTGC
7321 TTCAATGATC ATAATCAAGC CATATCACAT CTGTAGAGGT TTACTTGCTT TAAAAAACCT
7381 CCACACCTCC CCCTGAACCT GAAACATAAA ATGAATGCAA TTGTTGTTGT TAACTTGTTT
7441 ATTGCAGCTT ATAATGGTTA CAAATAAAGC AATAGCATCA CAAATTTCAC AAATAAAGCA
7501 TTTTTTTCAC TGCATTCTAG TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC
7561 TGGATCTGCG TCGACACGAA GAGACGACTG ACTGACTGAC TGGAAAGAGG AAGGGCTGGA
7621 AGAGGAAGGA GCTTGATCCA GATCCCGATC TCGATCCAGA TCCGGATCGC AGCTTGGCGT
7681 AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC GCTCACAATT CCACACAACA
7741 TACGAGCCGG AAGCATAAAG TGTAAAGCCT GGGGTGCCTA ATGAGTGAGC TAACTCACAT
7801 TAATTGCGTT GCGCTCACTG CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT
7861 AATGAATCGG CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT
7921 CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA
7981 AGGCGGTAAT ACGGTTATCC ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA
8041 AAGGCCAGCA AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT TTCCATAGGC
8101 TCCGCCCCCC TGACGAGCAT CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA
8161 CAGGACTATA AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC
8221 CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT
8281 CTCATAGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT
8341 GTGTGCACGA ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG
8401 AGTCCAACCC GGTAAGACAC GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA
8461 GCAGAGCGAG GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT
8521 ACACTAGAAG AACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA
8581 GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TTTTTTGTTT
8641 GCAAGCAGCA GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG ATCTTTTCTA
8701 CGGGGTCTGA CGCTCAGTGG AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT
8761 CAAAAAGGAT CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA
8821 GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG GCACCTATCT
8881 CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT CCCCGTCGTG TAGATAACTA
8941 CGATACGGGA GGGCTTACCA TCTGGCCCCA GTGCTGCAAT GATACCGCAG CTTGGGAAAC
9001 CATAAGAGCT GAAGCCAGTT ACCTTCGGAA AAAGAGTTGG TAGCTCTTGA TCCGGCAAAC
9061 AAACCACCGC TGGTAGCGGT GGTTTTTTTG TTTGCAAGCA GCAGATTACG CGCAGAAAAA
9121 AAGGATCTCA AGAAGATCCT TTGATCTTTT CTACGGGGTC TGACGCTCAG TGGAACGAAA
9181 ACTCACGTTA AGGGATTTTG GTCATGAGCT TGCGCCGTCC CGTCAAGTCA GCGTAATGCT
9241 CTGCCAGTGT TACAA
pLRPO V5-TRAC(94-140) T2A PuroR (서열 식별 번호:173)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAggtaag cctatcccta accctctcct cggtctcgat tctacgGGAT
5281 GCGACGTAAA ACTGGTGGAA AAGTCCTTCG AGACTGATAC AAACTTGAAC TTTCAAAACT
5341 TGAGCGTGAT CGGCTTTCGG ATATTGCTGC TCAAGGTGGC CGGTTTCAAT CTGCTGATGA
5401 CACTTAGGCT TTGGTCGTCC GGCAGCGGCG AGGGCAGAGG AAGTCTGCTA ACATGCGGTG
5461 ACGTCGAGGA GAATCCTGGC CCAATGACCG AGTACAAGCC CACGGTGCGC CTCGCCACCC
5521 GCGACGACGT CCCCAGGGCC GTACGCACCC TCGCCGCCGC GTTCGCCGAC TACCCCGCCA
5581 CGCGCCACAC CGTCGATCCG GACCGCCACA TCGAGCGGGT CACCGAGCTG CAAGAACTCT
5641 TCCTCACGCG CGTCGGGCTC GACATCGGCA AGGTGTGGGT CGCGGACGAC GGCGCCGCGG
5701 TGGCGGTCTG GACCACGCCG GAGAGCGTCG AAGCGGGGGC GGTGTTCGCC GAGATCGGCC
5761 CGCGCATGGC CGAGTTGAGC GGTTCCCGGC TGGCCGCGCA GCAACAGATG GAAGGCCTCC
5821 TGGCGCCGCA CCGGCCCAAG GAGCCCGCGT GGTTCCTGGC CACCGTCGGC GTCTCGCCCG
5881 ACCACCAGGG CAAGGGTCTG GGCAGCGCCG TCGTGCTCCC CGGAGTGGAG GCGGCCGAGC
5941 GCGCCGGGGT GCCCGCCTTC CTGGAGACCT CCGCGCCCCG CAACCTCCCC TTCTACGAGC
6001 GGCTCGGCTT CACCGTCACC GCCGACGTCG AGGTGCCCGA AGGACCGCGC ACCTGGTGCA
6061 TGACCCGCAA GCCCGGTGCC TGAGATATCG AGCATCTTAC CGCCATTTAT ACCCATATTT
6121 GTTCTGTTTT TCTTGATTTG GGTATACATT TAAATGTTAA TAAAACAAAA TGGTGGGGCA
6181 ATCATTTACA TTTTTAGGGA TATGTAATTA CTAGTTCAGG TGTATTGCCA CAAGACAAAC
6241 ATGTTAAGAA ACTTTCCCGT TATTTACGCT CTGTTCCTGT TAATCAACCT CTGGATTACA
6301 AAATTTGTGA AAGATTGACT GATATTCTTA ACTATGTTGC TCCTTTTACG CTGTGTGGAT
6361 ATGCTGCTTT ATAGCCTCTG TATCTAGCTA TTGCTTCCCG TACGGCTTTC GTTTTCTCCT
6421 CCTTGTATAA ATCCTGGTTG CTGTCTCTTT TAGAGGAGTT GTGGCCCGTT GTCCGTCAAC
6481 GTGGCGTGGT GTGCTCTGTG TTTGCTGACG CAACCCCCAC TGGCTGGGGC ATTGCCACCA
6541 CCTGTCAACT CCTTTCTGGG ACTTTCGCTT TCCCCCTCCC GATCGCCACG GCAGAACTCA
6601 TCGCCGCCTG CCTTGCCCGC TGCTGGACAG GGGCTAGGTT GCTGGGCACT GATAATTCCG
6661 TGGTGTTGTC AGTACTGGTA CCTTTAAGAC CAATGACTTA CAAGGCAGCT GTAGATCTTA
6721 GCCACTTTTT AAAAGAAAAG GGGGGACTGG AAGGGCTAAT TCACTCCCAA AGAAGACAAG
6781 ATCTGCTTTT TGCCTGTACT GGGTCTCTCT GGTTAGACCA GATCTGAGCC TGGGAGCTCT
6841 CTGGCTAACT AGGGAACCCA CTGCTTAAGC CTCAATAAAG CTTGCCTTGA GTGCTTCAAT
6901 GATCATAATC AAGCCATATC ACATCTGTAG AGGTTTACTT GCTTTAAAAA ACCTCCACAC
6961 CTCCCCCTGA ACCTGAAACA TAAAATGAAT GCAATTGTTG TTGTTAACTT GTTTATTGCA
7021 GCTTATAATG GTTACAAATA AAGCAATAGC ATCACAAATT TCACAAATAA AGCATTTTTT
7081 TCACTGCATT CTAGTTGTGG TTTGTCCAAA CTCATCAATG TATCTTATCA TGTCTGGATC
7141 TGCGTCGACA CGAAGAGACG ACTGACTGAC TGACTGGAAA GAGGAAGGGC TGGAAGAGGA
7201 AGGAGCTTGA TCCAGATCCC GATCTCGATC CAGATCCGGA TCGCAGCTTG GCGTAATCAT
7261 GGTCATAGCT GTTTCCTGTG TGAAATTGTT ATCCGCTCAC AATTCCACAC AACATACGAG
7321 CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG CCTAATGAGT GAGCTAACTC ACATTAATTG
7381 CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG GAAACCTGTC GTGCCAGCTG CATTAATGAA
7441 TCGGCCAACG CGCGGGGAGA GGCGGTTTGC GTATTGGGCG CTCTTCCGCT TCCTCGCTCA
7501 CTGACTCGCT GCGCTCGGTC GTTCGGCTGC GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG
7561 TAATACGGTT ATCCACAGAA TCAGGGGATA ACGCAGGAAA GAACATGTGA GCAAAAGGCC
7621 AGCAAAAGGC CAGGAACCGT AAAAAGGCCG CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC
7681 CCCCTGACGA GCATCACAAA AATCGACGCT CAAGTCAGAG GTGGCGAAAC CCGACAGGAC
7741 TATAAAGATA CCAGGCGTTT CCCCCTGGAA GCTCCCTCGT GCGCTCTCCT GTTCCGACCC
7801 TGCCGCTTAC CGGATACCTG TCCGCCTTTC TCCCTTCGGG AAGCGTGGCG CTTTCTCATA
7861 GCTCACGCTG TAGGTATCTC AGTTCGGTGT AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC
7921 ACGAACCCCC CGTTCAGCCC GACCGCTGCG CCTTATCCGG TAACTATCGT CTTGAGTCCA
7981 ACCCGGTAAG ACACGACTTA TCGCCACTGG CAGCAGCCAC TGGTAACAGG ATTAGCAGAG
8041 CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG GCCTAACTAC GGCTACACTA
8101 GAAGAACAGT ATTTGGTATC TGCGCTCTGC TGAAGCCAGT TACCTTCGGA AAAAGAGTTG
8161 GTAGCTCTTG ATCCGGCAAA CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC
8221 AGCAGATTAC GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT
8281 CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGA TTATCAAAAA
8341 GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT TAAATCAATC TAAAGTATAT
8401 ATGAGTAAAC TTGGTCTGAC AGTTACCAAT GCTTAATCAG TGAGGCACCT ATCTCAGCGA
8461 TCTGTCTATT TCGTTCATCC ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC
8521 GGGAGGGCTT ACCATCTGGC CCCAGTGCTG CAATGATACC GCAGCTTGGG AAACCATAAG
8581 AGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC AAACAAACCA
8641 CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT TACGCGCAGA AAAAAAGGAT
8701 CTCAAGAAGA TCCTTTGATC TTTTCTACGG GGTCTGACGC TCAGTGGAAC GAAAACTCAC
8761 GTTAAGGGAT TTTGGTCATG AGCTTGCGCC GTCCCGTCAA GTCAGCGTAA TGCTCTGCCA
8821 GTGTTACAA
pLRPO V5-TRAC(7-140) T2A PuroR (서열 식별 번호:174)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAggtaag cctatcccta accctctcct cggtctcgat tctacgGGAG
5281 CTGTGTACCA GCTCAGGGAT TCCAAGAGTT CAGATAAGTC AGTGTGCCTG TTCACCGACT
5341 TTGATAGTCA GACCAATGTC TCACAGTCTA AAGACTCGGA TGTGTACATC ACCGATAAGA
5401 CAGTCCTCGA CATGCGAAGC ATGGATTTTA AGAGTAATTC AGCCGTGGCC TGGTCCAACA
5461 AGTCAGATTT CGCCTGCGCC AACGCCTTCA ATAACTCAAT CATTCCCGAA GATACATTTT
5521 TCCCCTCCCC CGAGTCTTCG TGTGATGTTA AACTTGTGGA GAAATCTTTC GAAACTGATA
5581 CAAACCTCAA TTTCCAGAAC TTGAGCGTCA TAGGATTTAG AATCCTCCTC TTAAAGGTTG
5641 CTGGCTTTAA CTTACTGATG ACACTCCGAC TCTGGAGCTC CGGCAGCGGC GAGGGCAGAG
5701 GAAGTCTGCT AACATGCGGT GACGTCGAGG AGAATCCTGG CCCAATGACC GAGTACAAGC
5761 CCACGGTGCG CCTCGCCACC CGCGACGACG TCCCCAGGGC CGTACGCACC CTCGCCGCCG
5821 CGTTCGCCGA CTACCCCGCC ACGCGCCACA CCGTCGATCC GGACCGCCAC ATCGAGCGGG
5881 TCACCGAGCT GCAAGAACTC TTCCTCACGC GCGTCGGGCT CGACATCGGC AAGGTGTGGG
5941 TCGCGGACGA CGGCGCCGCG GTGGCGGTCT GGACCACGCC GGAGAGCGTC GAAGCGGGGG
6001 CGGTGTTCGC CGAGATCGGC CCGCGCATGG CCGAGTTGAG CGGTTCCCGG CTGGCCGCGC
6061 AGCAACAGAT GGAAGGCCTC CTGGCGCCGC ACCGGCCCAA GGAGCCCGCG TGGTTCCTGG
6121 CCACCGTCGG CGTCTCGCCC GACCACCAGG GCAAGGGTCT GGGCAGCGCC GTCGTGCTCC
6181 CCGGAGTGGA GGCGGCCGAG CGCGCCGGGG TGCCCGCCTT CCTGGAGACC TCCGCGCCCC
6241 GCAACCTCCC CTTCTACGAG CGGCTCGGCT TCACCGTCAC CGCCGACGTC GAGGTGCCCG
6301 AAGGACCGCG CACCTGGTGC ATGACCCGCA AGCCCGGTGC CTGAGATATC GAGCATCTTA
6361 CCGCCATTTA TACCCATATT TGTTCTGTTT TTCTTGATTT GGGTATACAT TTAAATGTTA
6421 ATAAAACAAA ATGGTGGGGC AATCATTTAC ATTTTTAGGG ATATGTAATT ACTAGTTCAG
6481 GTGTATTGCC ACAAGACAAA CATGTTAAGA AACTTTCCCG TTATTTACGC TCTGTTCCTG
6541 TTAATCAACC TCTGGATTAC AAAATTTGTG AAAGATTGAC TGATATTCTT AACTATGTTG
6601 CTCCTTTTAC GCTGTGTGGA TATGCTGCTT TATAGCCTCT GTATCTAGCT ATTGCTTCCC
6661 GTACGGCTTT CGTTTTCTCC TCCTTGTATA AATCCTGGTT GCTGTCTCTT TTAGAGGAGT
6721 TGTGGCCCGT TGTCCGTCAA CGTGGCGTGG TGTGCTCTGT GTTTGCTGAC GCAACCCCCA
6781 CTGGCTGGGG CATTGCCACC ACCTGTCAAC TCCTTTCTGG GACTTTCGCT TTCCCCCTCC
6841 CGATCGCCAC GGCAGAACTC ATCGCCGCCT GCCTTGCCCG CTGCTGGACA GGGGCTAGGT
6901 TGCTGGGCAC TGATAATTCC GTGGTGTTGT CAGTACTGGT ACCTTTAAGA CCAATGACTT
6961 ACAAGGCAGC TGTAGATCTT AGCCACTTTT TAAAAGAAAA GGGGGGACTG GAAGGGCTAA
7021 TTCACTCCCA AAGAAGACAA GATCTGCTTT TTGCCTGTAC TGGGTCTCTC TGGTTAGACC
7081 AGATCTGAGC CTGGGAGCTC TCTGGCTAAC TAGGGAACCC ACTGCTTAAG CCTCAATAAA
7141 GCTTGCCTTG AGTGCTTCAA TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT
7201 TGCTTTAAAA AACCTCCACA CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT
7261 GTTGTTAACT TGTTTATTGC AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT
7321 TTCACAAATA AAGCATTTTT TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT
7381 GTATCTTATC ATGTCTGGAT CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA
7441 AGAGGAAGGG CTGGAAGAGG AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG
7501 ATCGCAGCTT GGCGTAATCA TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA
7561 CAATTCCACA CAACATACGA GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG
7621 TGAGCTAACT CACATTAATT GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT
7681 CGTGCCAGCT GCATTAATGA ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC
7741 GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG
7801 TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA
7861 AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG
7921 CGTTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA
7981 GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG
8041 TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG
8101 GAAGCGTGGC GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC
8161 GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG
8221 GTAACTATCG TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA
8281 CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT
8341 GGCCTAACTA CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG
8401 TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG
8461 GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC
8521 CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT
8581 TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT
8641 TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA
8701 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG
8761 TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC
8821 CGCAGCTTGG GAAACCATAA GAGCTGAAGC CAGTTACCTT CGGAAAAAGA GTTGGTAGCT
8881 CTTGATCCGG CAAACAAACC ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC AAGCAGCAGA
8941 TTACGCGCAG AAAAAAAGGA TCTCAAGAAG ATCCTTTGAT CTTTTCTACG GGGTCTGACG
9001 CTCAGTGGAA CGAAAACTCA CGTTAAGGGA TTTTGGTCAT GAGCTTGCGC CGTCCCGTCA
9061 AGTCAGCGTA ATGCTCTGCC AGTGTTACAA
pLRPO FMC63 endoL TRBC1(126-177) T2AW trEGFR (서열 식별 번호:175)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
5281 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
5341 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
5401 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
5461 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
5521 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA TCCGGCAAGC
5581 CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA GGACCTGGCC
5641 TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC TCATTACCCG
5701 ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG CTGGGAGTAA
5761 TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG ACCATCATCA
5821 AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT GATGACACAG
5881 CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG GACTACTGGG
5941 GTCAAGGAAC CTCAGTCACC GTCTCCTCAG GATGGGGTAG AGCAGACTGT GGCTTTACCT
6001 CGGTGTCCTA CCAGCAAGGG GTCCTGTCTG CCACCATCCT CTATGAGATC CTGCTAGGGA
6061 AGGCCACCCT GTATGCTGTG CTGGTCAGCG CCCTTGTGTT GATGGCCATG GTCAAGAGAA
6121 AGGATTTCGG GTCAGGCGAG GGCAGAGGAA GTCTGCTAAC ATGCGGTGAC GTCGAGGAGA
6181 ATCCTGGACC TATGCTTCTC CTGGTGACAA GCCTTCTGCT CTGTGAGTTA CCACACCCAG
6241 CATTCCTCCT GATCCCACGC AAAGTGTGTA ACGGAATAGG TATTGGTGAA TTTAAAGACT
6301 CACTCTCCAT AAATGCTACG AATATTAAAC ACTTCAAAAA CTGCACCTCC ATCAGTGGCG
6361 ATCTCCACAT CCTGCCGGTG GCATTTAGGG GTGACTCCTT CACACATACT CCTCCTCTGG
6421 ATCCACAGGA ACTGGATATT CTGAAAACCG TAAAGGAAAT CACAGGGTTT TTGCTGATTC
6481 AGGCTTGGCC TGAAAACAGG ACGGACCTCC ATGCCTTTGA GAACCTAGAA ATCATACGCG
6541 GCAGGACCAA GCAACATGGT CAGTTTTCTC TTGCAGTCGT CAGCCTGAAC ATAACATCCT
6601 TGGGATTACG CTCCCTCAAG GAGATAAGTG ATGGAGATGT GATAATTTCA GGAAACAAAA
6661 ATTTGTGCTA TGCAAATACA ATAAACTGGA AAAAACTGTT TGGGACCTCC GGTCAGAAAA
6721 CCAAAATTAT AAGCAACAGA GGTGAAAACA GCTGCAAGGC CACAGGCCAG GTCTGCCATG
6781 CCTTGTGCTC CCCCGAGGGC TGCTGGGGCC CGGAGCCCAG GGACTGCGTC TCTTGCCGGA
6841 ATGTCAGCCG AGGCAGGGAA TGCGTGGACA AGTGCAACCT TCTGGAGGGT GAGCCAAGGG
6901 AGTTTGTGGA GAACTCTGAG TGCATACAGT GCCACCCAGA GTGCCTGCCT CAGGCCATGA
6961 ACATCACCTG CACAGGACGG GGACCAGACA ACTGTATCCA GTGTGCCCAC TACATTGACG
7021 GCCCCCACTG CGTCAAGACC TGCCCGGCAG GAGTCATGGG AGAAAACAAC ACCCTGGTCT
7081 GGAAGTACGC AGACGCCGGC CATGTGTGCC ACCTGTGCCA TCCAAACTGC ACCTACGGAT
7141 GCACTGGGCC AGGTCTTGAA GGCTGTCCAA CGAATGGGCC TAAGATCCCG TCCATCGCCA
7201 CTGGGATGGT GGGGGCCCTC CTCTTGCTGC TGGTGGTGGC CCTGGGGATC GGCCTCTTCA
7261 TGTGAGATAT CGAGCATCTT ACCGCCATTT ATACCCATAT TTGTTCTGTT TTTCTTGATT
7321 TGGGTATACA TTTAAATGTT AATAAAACAA AATGGTGGGG CAATCATTTA CATTTTTAGG
7381 GATATGTAAT TACTAGTTCA GGTGTATTGC CACAAGACAA ACATGTTAAG AAACTTTCCC
7441 GTTATTTACG CTCTGTTCCT GTTAATCAAC CTCTGGATTA CAAAATTTGT GAAAGATTGA
7501 CTGATATTCT TAACTATGTT GCTCCTTTTA CGCTGTGTGG ATATGCTGCT TTATAGCCTC
7561 TGTATCTAGC TATTGCTTCC CGTACGGCTT TCGTTTTCTC CTCCTTGTAT AAATCCTGGT
7621 TGCTGTCTCT TTTAGAGGAG TTGTGGCCCG TTGTCCGTCA ACGTGGCGTG GTGTGCTCTG
7681 TGTTTGCTGA CGCAACCCCC ACTGGCTGGG GCATTGCCAC CACCTGTCAA CTCCTTTCTG
7741 GGACTTTCGC TTTCCCCCTC CCGATCGCCA CGGCAGAACT CATCGCCGCC TGCCTTGCCC
7801 GCTGCTGGAC AGGGGCTAGG TTGCTGGGCA CTGATAATTC CGTGGTGTTG TCAGTACTGG
7861 TACCTTTAAG ACCAATGACT TACAAGGCAG CTGTAGATCT TAGCCACTTT TTAAAAGAAA
7921 AGGGGGGACT GGAAGGGCTA ATTCACTCCC AAAGAAGACA AGATCTGCTT TTTGCCTGTA
7981 CTGGGTCTCT CTGGTTAGAC CAGATCTGAG CCTGGGAGCT CTCTGGCTAA CTAGGGAACC
8041 CACTGCTTAA GCCTCAATAA AGCTTGCCTT GAGTGCTTCA ATGATCATAA TCAAGCCATA
8101 TCACATCTGT AGAGGTTTAC TTGCTTTAAA AAACCTCCAC ACCTCCCCCT GAACCTGAAA
8161 CATAAAATGA ATGCAATTGT TGTTGTTAAC TTGTTTATTG CAGCTTATAA TGGTTACAAA
8221 TAAAGCAATA GCATCACAAA TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT
8281 GGTTTGTCCA AACTCATCAA TGTATCTTAT CATGTCTGGA TCTGCGTCGA CACGAAGAGA
8341 CGACTGACTG ACTGACTGGA AAGAGGAAGG GCTGGAAGAG GAAGGAGCTT GATCCAGATC
8401 CCGATCTCGA TCCAGATCCG GATCGCAGCT TGGCGTAATC ATGGTCATAG CTGTTTCCTG
8461 TGTGAAATTG TTATCCGCTC ACAATTCCAC ACAACATACG AGCCGGAAGC ATAAAGTGTA
8521 AAGCCTGGGG TGCCTAATGA GTGAGCTAAC TCACATTAAT TGCGTTGCGC TCACTGCCCG
8581 CTTTCCAGTC GGGAAACCTG TCGTGCCAGC TGCATTAATG AATCGGCCAA CGCGCGGGGA
8641 GAGGCGGTTT GCGTATTGGG CGCTCTTCCG CTTCCTCGCT CACTGACTCG CTGCGCTCGG
8701 TCGTTCGGCT GCGGCGAGCG GTATCAGCTC ACTCAAAGGC GGTAATACGG TTATCCACAG
8761 AATCAGGGGA TAACGCAGGA AAGAACATGT GAGCAAAAGG CCAGCAAAAGGCCAGGAACC
8821 GTAAAAAGGC CGCGTTGCTG GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC GAGCATCACA
8881 AAAATCGACG CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA TACCAGGCGT
8941 TTCCCCCTGG AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT ACCGGATACC
9001 TGTCCGCCTT TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA TAGCTCACGC TGTAGGTATC
9061 TCAGTTCGGT GTAGGTCGTT CGCTCCAAGC TGGGCTGTGT GCACGAACCC CCCGTTCAGC
9121 CCGACCGCTG CGCCTTATCC GGTAACTATC GTCTTGAGTC CAACCCGGTA AGACACGACT
9181 TATCGCCACT GGCAGCAGCC ACTGGTAACA GGATTAGCAG AGCGAGGTAT GTAGGCGGTG
9241 CTACAGAGTT CTTGAAGTGG TGGCCTAACT ACGGCTACAC TAGAAGAACA GTATTTGGTA
9301 TCTGCGCTCT GCTGAAGCCA GTTACCTTCG GAAAAAGAGT TGGTAGCTCT TGATCCGGCA
9361 AACAAACCAC CGCTGGTAGC GGTGGTTTTT TTGTTTGCAA GCAGCAGATT ACGCGCAGAA
9421 AAAAAGGATC TCAAGAAGAT CCTTTGATCT TTTCTACGGG GTCTGACGCT CAGTGGAACG
9481 AAAACTCACG TTAAGGGATT TTGGTCATGA GATTATCAAA AAGGATCTTC ACCTAGATCC
9541 TTTTAAATTA AAAATGAAGT TTTAAATCAA TCTAAAGTAT ATATGAGTAA ACTTGGTCTG
9601 ACAGTTACCA ATGCTTAATC AGTGAGGCAC CTATCTCAGC GATCTGTCTA TTTCGTTCAT
9661 CCATAGTTGC CTGACTCCCC GTCGTGTAGA TAACTACGAT ACGGGAGGGC TTACCATCTG
9721 GCCCCAGTGC TGCAATGATA CCGCAGCTTG GGAAACCATA AGAGCTGAAG CCAGTTACCT
9781 TCGGAAAAAG AGTTGGTAGC TCTTGATCCG GCAAACAAAC CACCGCTGGT AGCGGTGGTT
9841 TTTTTGTTTG CAAGCAGCAG ATTACGCGCA GAAAAAAAGG ATCTCAAGAA GATCCTTTGA
9901 TCTTTTCTAC GGGGTCTGAC GCTCAGTGGA ACGAAAACTC ACGTTAAGGG ATTTTGGTCA
9961 TGAGCTTGCG CCGTCCCGTC AAGTCAGCGT AATGCTCTGC CAGTGTTACA A
pLRPO FMC63-TCR베타1 (37GRK) (서열 식별 번호:176)
1 CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT
61 CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA
121 CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG
181 TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA
241 ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA
301 GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC
361 GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA
421 ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT
481 TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT
541 GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT
601 AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC
661 TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT
721 CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT
781 GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT
841 ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC
901 AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA
961 ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT
1021 TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA
1081 AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA
1141 GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT
1201 TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAGAAAGCGAAAG
1261 GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG
1321 CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA
1381 AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC CATTCAGGCT
1441 GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC AGCTGGCGAA
1501 AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC AGTCACGACG
1561 TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA TCCAGATCGA
1621 ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC
1681 CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC
1741 ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC
1801 CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA
1861 TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG
1921 TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC
1981 CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT
2041 ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG
2101 GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT
2161 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA
2221 CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA
2281 ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC
2341 CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG
2401 TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT
2461 AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC
2521 GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA
2581 CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA
2641 TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA
2701 CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT
2761 CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC
2821 CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT
2881 GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG
2941 CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG
3001 CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC
3061 ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT
3121 GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC
3181 GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA
3241 CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT
3301 CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT
3361 GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG
3421 TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG
3481 AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA
3541 AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT
3601 TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT
3661 AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC
3721 ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT
3781 ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT
3841 AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT
3901 TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC
3961 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
4021 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
4081 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
4141 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
4201 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
4261 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
4321 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
4381 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
4441 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
4501 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
4561 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
4621 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
4681 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
4741 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
4801 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
4861 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
4921 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
4981 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
5041 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
5101 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCTCTAGAG
5161 CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
5221 TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT GCCTCTCTGG
5281 GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT TTAAATTGGT
5341 ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA AGATTACACT
5401 CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT CTCACCATTA
5461 GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT
5521 ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA TCCGGCAAGC
5581 CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA GGACCTGGCC
5641 TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC TCATTACCCG
5701 ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG CTGGGAGTAA
5761 TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG ACCATCATCA
5821 AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT GATGACACAG
5881 CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG GACTACTGGG
5941 GTCAAGGAAC CTCAGTCACC GTCTCCTCAG CGGCCGCAGG TGGAGGAGGT TCTGGAGGTG
6001 GAGGTTCAGG TGGAGGTGGT TCACTCGAGC TGGGAGCAGG CCCAGTGGAT TCTGGAGTCA
6061 CACAAACCCC AAAGCACCTG ATCACAGCAA CTGGACAGCG AGTGACGCTG AGATGCTCCC
6121 CTAGGTCTGG AGACCTCTCT GTGTCATGGT ACCAACAGAG CCTGGACCAG GGCCTCCAGT
6181 TCCTCATTCA GTATTATAAT GGAGAAGAGA GAGCAAAAGG AAACATTCTT GAACGATTCT
6241 CCGCACAACA GTTCCCTGAC TTGCACTCTG AACTAAACCT GAGCTCTCTG GAGCTGGGGG
6301 ACTCAGCTTT GTATTTCTGT GCCAGCAGCC CCCGGACAGG CCTGAACACT GAAGCTTTCT
6361 TTGGACAAGG CACCAGACTC ACAGTTGTAG AGGACCTGAA CAAGGTGTTC CCACCCGAGG
6421 TCGCTGTGTT TGAGCCATCA GAAGCAGAGA TCTCCCACAC CCAAAAGGCC ACACTGGTGT
6481 GCCTGGCCAC AGGCTTCTTC CCCGACCACG TGGAGCTGAG CTGGTGGGTG AATGGGAAGG
6541 AGGTGCACAG TGGGGTCAGC ACGGACCCGC AGCCCCTCAA GGAGCAGCCC GCCCTCAATG
6601 ACTCCAGATA CTGCCTGAGC AGCCGCCTGA GGGTCTCGGC CACCTTCTGG CAGAACCCCC
6661 GCAACCACTT CCGCTGTCAA GTCCAGTTCT ACGGGCTCTC GGAGAATGAC GAGTGGACCC
6721 AGGATAGGGC CAAACCCGTC ACCCAGATCG TCAGCGCCGA GGCCTGGGGT AGAGCAGACT
6781 GTGGCTTTAC CTCGGTGTCC TACCAGCAAG GGGTCCTGTC TGCCACCATC CTCTATGAGA
6841 TCCTGCTAGG GAAGGCCACC CTGTATGCTG TGCTGGTCAG CGCCCTTGTG TTGATGGCCA
6901 TGGTCAAGAG AAAGGATTTC TGATAAGATA TCGAGCATCT TACCGCCATT TATACCCATA
6961 TTTGTTCTGT TTTTCTTGAT TTGGGTATAC ATTTAAATGT TAATAAAACA AAATGGTGGG
7021 GCAATCATTT ACATTTTTAG GGATATGTAA TTACTAGTTC AGGTGTATTG CCACAAGACA
7081 AACATGTTAA GAAACTTTCC CGTTATTTAC GCTCTGTTCC TGTTAATCAA CCTCTGGATT
7141 ACAAAATTTG TGAAAGATTG ACTGATATTC TTAACTATGT TGCTCCTTTT ACGCTGTGTG
7201 GATATGCTGC TTTATAGCCT CTGTATCTAG CTATTGCTTC CCGTACGGCT TTCGTTTTCT
7261 CCTCCTTGTA TAAATCCTGG TTGCTGTCTC TTTTAGAGGA GTTGTGGCCC GTTGTCCGTC
7321 AACGTGGCGT GGTGTGCTCT GTGTTTGCTG ACGCAACCCC CACTGGCTGG GGCATTGCCA
7381 CCACCTGTCA ACTCCTTTCT GGGACTTTCG CTTTCCCCCT CCCGATCGCC ACGGCAGAAC
7441 TCATCGCCGC CTGCCTTGCC CGCTGCTGGA CAGGGGCTAG GTTGCTGGGC ACTGATAATT
7501 CCGTGGTGTT GTCAGTACTG GTACCTTTAA GACCAATGAC TTACAAGGCA GCTGTAGATC
7561 TTAGCCACTT TTTAAAAGAA AAGGGGGGAC TGGAAGGGCT AATTCACTCC CAAAGAAGAC
7621 AAGATCTGCT TTTTGCCTGT ACTGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC
7681 TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTTC
7741 AATGATCATA ATCAAGCCAT ATCACATCTG TAGAGGTTTA CTTGCTTTAA AAAACCTCCA
7801 CACCTCCCCC TGAACCTGAA ACATAAAATG AATGCAATTG TTGTTGTTAA CTTGTTTATT
7861 GCAGCTTATA ATGGTTACAA ATAAAGCAAT AGCATCACAA ATTTCACAAA TAAAGCATTT
7921 TTTTCACTGC ATTCTAGTTG TGGTTTGTCC AAACTCATCA ATGTATCTTA TCATGTCTGG
7981 ATCTGCGTCG ACACGAAGAG ACGACTGACT GACTGACTGG AAAGAGGAAG GGCTGGAAGA
8041 GGAAGGAGCT TGATCCAGAT CCCGATCTCG ATCCAGATCC GGATCGCAGC TTGGCGTAAT
8101 CATGGTCATA GCTGTTTCCT GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC
8161 GAGCCGGAAG CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA
8221 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG CTGCATTAAT
8281 GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG GCGCTCTTCC GCTTCCTCGC
8341 TCACTGACTC GCTGCGCTCG GTCGTTCGGC TGCGGCGAGC GGTATCAGCT CACTCAAAGG
8401 CGGTAATACG GTTATCCACA GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG
8461 GCCAGCAAAA GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC
8521 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA AACCCGACAG
8581 GACTATAAAG ATACCAGGCG TTTCCCCCTG GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA
8641 CCCTGCCGCT TACCGGATAC CTGTCCGCCT TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC
8701 ATAGCTCACG CTGTAGGTAT CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG
8761 TGCACGAACC CCCCGTTCAG CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT
8821 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC AGGATTAGCA
8881 GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG GTGGCCTAAC TACGGCTACA
8941 CTAGAAGAAC AGTATTTGGT ATCTGCGCTC TGCTGAAGCC AGTTACCTTC GGAAAAAGAG
9001 TTGGTAGCTC TTGATCCGGC AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA
9061 AGCAGCAGAT TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG
9121 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG AGATTATCAA
9181 AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG TTTTAAATCA ATCTAAAGTA
9241 TATATGAGTA AACTTGGTCT GACAGTTACC AATGCTTAAT CAGTGAGGCA CCTATCTCAG
9301 CGATCTGTCT ATTTCGTTCA TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA
9361 TACGGGAGGG CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCAGCTT GGGAAACCAT
9421 AAGAGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA
9481 CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG
9541 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT
9601 CACGTTAAGG GATTTTGGTC ATGAGCTTGC GCCGTCCCGT CAAGTCAGCG TAATGCTCTG
9661 CCAGTGTTAC AA
pLRPO FMC63-HAP17(1-258) (서열 식별 번호:177)
1 ATATGAGTAA ACTTGGTCTG ACAGTTACCA ATGCTTAATC AGTGAGGCAC CTATCTCAGC
61 GATCTGTCTA TTTCGTTCAT CCATAGTTGC CTGACTCCCC GTCGTGTAGA TAACTACGAT
121 ACGGGAGGGC TTACCATCTG GCCCCAGTGC TGCAATGATA CCGCAGCTTG GGAAACCATA
181 AGAGCTGAAG CCAGTTACCT TCGGAAAAAG AGTTGGTAGC TCTTGATCCG GCAAACAAAC
241 CACCGCTGGT AGCGGTGGTT TTTTTGTTTG CAAGCAGCAG ATTACGCGCA GAAAAAAAGG
301 ATCTCAAGAA GATCCTTTGA TCTTTTCTAC GGGGTCTGAC GCTCAGTGGA ACGAAAACTC
361 ACGTTAAGGG ATTTTGGTCA TGAGCTTGCG CCGTCCCGTC AAGTCAGCGT AATGCTCTGC
421 CAGTGTTACA ACCAATTAAC CAATTCTGAT TAGAAAAACT CATCGAGCAT CAAATGAAAC
481 TGCAATTTAT TCACATCAGG ATTATCAATA CCATATTTTT GAAAAAGCCG TTTCTGTAAT
541 GAAGGAGAAA ACTCACCGAG GCAGTTCCAT AGGATGGCAA GATCCTGGTA TCGGTCTGCG
601 ATTCCGACTC GTCCAACATC AATACAACCT ATTAATTTCC CCTCGTCAAA AATAAGGTTA
661 TCAAGTGAGA AATCACCATG AGTGACGACT GAATCCGGTG AGAATGGCAA AAGTTTATGC
721 ATTTCTTTCC AGACTTGTTC AACAGGCCAG CCATTACGCT CGTCATCAAA ATCACTCGCA
781 TCAACCAAAC CGTTATTCAT TCGTGATTGC GCCTGAGCAA GACGAAATAC GCGATCGCTG
841 TTAAAAGGAC AATTACAAAC AGGAATCGAA TGCAACCGGC GCAGGAACAC TGCCAGCGCA
901 TCAACAATAT TTTCACCTGA ATCAGGATAT TCTTCTAATA CCTGGAATGC TGTTTTTCCG
961 GGGATCGCAG TGGTGAGTAA CCATGCATCA TCAGGAGTAC GGATAAAATG CTTGATGGTC
1021 GGAAGAGGCA TAAATTCCGT CAGCCAGTTT AGTCTGACCA TCTCATCTGT AACATCATTG
1081 GCAACGCTAC CTTTGCCATG TTTCAGAAAC AACTCTGGCG CATCGGGCTT CCCATACAAG
1141 CGATAGATTG TCGCACCTGA TTGCCCGACA TTATCGCGAG CCCATTTATA CCCATATAAA
1201 TCAGCATCCA TGTTGGAATT TAATCGCGGC CTCGACGTTT CCCGTTGAAT ATGGCTCATA
1261 ACACCCCTTG TATTACTGTT TATGTAAGCA GACAGTTTTA TTGTTCATGA TGATATATTT
1321 TTATCTTGTG CAATGTAACA TCAGAGATTT TGAGACACAA CGTGGCTTTC CCCCCCCCCC
1381 CCATGACATT AACCTATAAA AATAGGCGTA TCACGAGGCC AGCTTGGGAA ACCATAAGAC
1441 CGAGATAGAG TTGAGTGTTG TTCCAGTTTG GAACAAGAGT CCACTATTAA AGAACGTGGA
1501 CTCCAACGTC AAAGGGCGAA AAACCGTCTA TCAGGGCGAT GGCCCACTAC GTGAACCATC
1561 ACCCAAATCA AGTTTTTTGG GGTCGAGGTG CCGTAAAGCA CTAAATCGGA ACCCTAAAGG
1621 GAGCCCCCGA TTTAGAGCTT GACGGGGAAA GCCGGCGAAC GTGGCGAGAA AGGAAGGGAA
1681 GAAAGCGAAA GGAGCGGGCG CTAAGGCGCT GGCAAGTGTA GCGGTCACGC TGCGCGTAAC
1741 CACCACACCC GCCGCGCTTA ATGCGCCGCT ACAGGGCGCG TACTATGGTT GCTTTGACGT
1801 ATGCGGTGTG AAATACCGCA CAGATGCGTA AGGAGAAAAT ACCGCATCAG GCGCCATTCG
1861 CCATTCAGGC TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC GCTATTACGC
1921 CAGCTGGCGA AAGGGGGATG TGCTGCAAGG CGATTAAGTT GGGTAACGCC AGGGTTTTCC
1981 CAGTCACGAC GTTGTAAAAC GACGGCCAGT GAATTGATCG AGATCGTGAT CCGGATCAAG
2041 ATCCAGATCG AATTGGAGGC TACAGTCAGT GGAGAGGACT TTCACTGACT GACTGACTGC
2101 GTCTCAACCT CCTAGGGGAC ATTGATTATT GACTAGTTAT TAATAGTAAT CAATTACGGG
2161 GTCATTAGTT CATAGCCCAT ATATGGAGTT CCGCGTTACA TAACTTACGG TAAATGGCCC
2221 GCCTGGCTGA CCGCCCAACG ACCCCCGCCC ATTGACGTCA ATAATGACGT ATGTTCCCAT
2281 AGTAACGCCA ATAGGGACTT TCCATTGACG TCAATGGGTG GAGTATTTAC GGTAAACTGC
2341 CCACTTGGCA GTACATCAAG TGTATCATAT GCCAAGTACG CCCCCTATTG ACGTCAATGA
2401 CGGTAAATGG CCCGCCTGGC ATTATGCCCA GTACATGACC TTATGGGACT TTCCTACTTG
2461 GCAGTACATC TACGTATTAG TCATCGCTAT TACCATGGTG ATGCGGTTTT GGCAGTACAT
2521 CAATGGGCGT GGATAGCGGT TTGACTCACG GGGATTTCCA AGTCTCCACC CCATTGACGT
2581 CAATGGGAGT TTGTTTTGGC ACCAAAATCA ACGGGACTTT CCAAAATGTC GTAACAACTC
2641 CGCCCCATTG ACGCAAATGG GCGGTAGGCG TGTACGGTGG GAGGTCTATA TAAGCAGAGC
2701 TCGTTTAGTG AACCGGGTCT CTCTGGTTAG ACCAGATCTG AGCCTGGGAG CTCTCTGGCT
2761 AACTAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTC AAAGTAGTGT
2821 GTGCCCGTCT GTTGTGTGAC TCTGGTAACT AGAGATCCCT CAGACCCTTT TAGTCAGTGT
2881 GGAAAATCTC TAGCAGTGGC GCCCGAACAG GGACTTGAAA GCGAAAGTAA AGCCAGAGGA
2941 GATCTCTCGA CGCAGGACTC GGCTTGCTGA AGCGCGCACG GCAAGAGGCG AGGGGCGGCG
3001 ACTGGTGAGT ACGCCAAAAA TTTTGACTAG CGGAGGCTAG AAGGAGAGAG TAGGGTGCGA
3061 GAGCGTCGGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA AAAAATTCGG TTAAGGCCAG
3121 GGGGAAAGAA ACAATATAAA CTAAAACATA TAGTTAGGGC AAGCAGGGAG CTAGAACGAT
3181 TCGCAGTTAA TCCTGGCCTT TTAGAGACAT CAGAAGGCTG TAGACAAATA CTGGGACAGC
3241 TACAACCATC CCTTCAGACA GGATCAGAAG AACTTAGATC ATTATATAAT ACAATAGCAG
3301 TCCTCTATTG TGTGCATCAA AGGATAGATG TAAAAGACAC CAAGGAAGCC TTAGATAAGA
3361 TAGAGGAAGA GCAAAACAAA AGTAAGAAAA AGGCACAGCA AGCGATCTTC AGACCTGGAG
3421 GAGGCAGGAG GCGATATGAG GGACAATTGG AGAAGTGAAT TATATAAATA TAAAGTAGTA
3481 AAAATTGAAC CATTAGGAGT AGCACCCACC AAGGCAAAGA GAAGAGTGGT GCAGAGAGAA
3541 AAAAGAGCAG TGGGAATAGG AGCTTTGTTC CTTGGGTTCT TGGGAGCAGC AGGAAGCACT
3601 ATGGGCGCAG CGTCAATGAC GCTGACGGTA CAGGCCAGAC AATTATTGTC TGATATAGTG
3661 CAGCAGCAGA ACAATTTGCT GAGGGCTATT GAGGCGCAAC AGCATCTGTT GCAACTCACA
3721 GTCTGGGGCA TCAAACAGCT CCAGGCAAGA ATCCTGGCTG TGGAAAGATA CCTAAAGGAT
3781 CAACAGCTCC TGGGGATTTG GGGTTGCTCT GGAAAACTCA TTTGCACCAC TGCTGTGCCT
3841 TGGAATGCTA GTTGGAGTAA TAAATCTCTG GAACAGATTT GGAATAACAT GACCTGGATG
3901 GAGTGGGACA GAGAAATTAA CAATTACACA AGCTTAATAC ACTCCTTAAT TGAAGAATCG
3961 CAAAACCAGC AAGAAAAGAA TGAACAAGAA TTATTGGAAT TAGATAAATG GGCAAGTTTG
4021 TGGAATTGGT TTAACATAAC AAATTGGCTG TGGTATATAA AATTATTCAT AATGATAGTA
4081 GGAGGCTTGG TAGGTTTAAG AATAGTTTTT GCTGTACTTT CTATAGTGAA TAGAGTTAGG
4141 CAGGGATATT CACCATTATC GTTTCAGACC CACCTCCCAA TCCCGAGGGG ACCACGCGTA
4201 CAAATGGCAG TATTCATCCA CAATTTTAAA AGAAAAGGGG GGATTGGGGG GTACAGTGCA
4261 GGGGAAAGAA TAGTAGACAT AATAGCAACA GACATACAAA CTAAAGAATT ACAAAAACAA
4321 ATTACAAAAA TTCAAAATTT TCGGGTTTAT TACAGGGACA GCAGAAATCC ACTTTGGAAA
4381 GCTGAGCATC CGGCTCCGGT GCCCGTCAGT GGGCAGAGCG CACATCGCCC ACAGTCCCCG
4441 AGAAGTTGGG GGGAGGGGTC GGCAATTGAA CCGGTGCCTA GAGAAGGTGG CGCGGGGTAA
4501 ACTGGGAAAG TGATGTCGTG TACTGGCTCC GCCTTTTTCC CGAGGGTGGG GGAGAACCGT
4561 ATATAAGTGC AGTAGTCGCC GTGAACGTTC TTTTTCGCAA CGGGTTTGCC GCCAGAACAC
4621 AGGTAAGTGC CGTGTGTGGT TCCCGCGGGC CTGGCCTCTT TACGGGTTAT GGCCCTTGCG
4681 TGCCTTGAAT TACTTCCACG CCCCTGGCTG CAGTACGTGA TTCTTGATCC CGAGCTTCGG
4741 GTTGGAAGTG GGTGGGAGAG TTCGAGGCCT TGCGCTTAAG GAGCCCCTTC GCCTCGTGCT
4801 TGAGTTGAGG CCTGGCCTGG GCGCTGGGGC CGCCGCGTGC GAATCTGGTG GCACCTTCGC
4861 GCCTGTCTCG CTGCTTTCGA TAAGTCTCTA GCCATTTAAA ATTTTTGATG ACCTGCTGCG
4921 ACGCTTTTTT TCTGGCAAGA TAGTCTTGTA AATGCGGGCC AAGATCTGCA CACTGGTATT
4981 TCGGTTTTTG GGGCCGCGGG CGGCGACGGG GCCCGTGCGT CCCAGCGCAC ATGTTCGGCG
5041 AGGCGGGGCC TGCGAGCGCG GCCACCGAGA ATCGGACGGG GGTAGTCTCA AGCTGGCCGG
5101 CCTGCTCTGG TGCCTGGCCT CGCGCCGCCG TGTATCGCCC CGCCCTGGGC GGCAAGGCTG
5161 GCCCGGTCGG CACCAGTTGC GTGAGCGGAA AGATGGCCGC TTCCCGGCCC TGCTGCAGGG
5221 AGCTCAAAAT GGAGGACGCG GCGCTCGGGA GAGCGGGCGG GTGAGTCACC CACACAAAGG
5281 AAAAGGGCCT TTCCGTCCTC AGCCGTCGCT TCATGTGACT CCACGGAGTA CCGGGCGCCG
5341 TCCAGGCACC TCGATTAGTT CTCGAGCTTT TGGAGTACGT CGTCTTTAGG TTGGGGGGAG
5401 GGGTTTTATG CGATGGAGTT TCCCCACACT GAGTGGGTGG AGACTGAAGT TAGGCCAGCT
5461 TGGCACTTGA TGTAATTCTC CTTGGAATTT GCCCTTTTTG AGTTTGGATC TTGGTTCATT
5521 CTCAAGCCTC AGACAGTGGT TCAAAGTTTT TTTCTTCCAT TTCAGGTGTC GTGAAAACTA
5581 CCCCTCTAGA GCCGCCACCA TGCTTCTCCT GGTGACAAGC CTTCTGCTCT GTGAGTTACC
5641 ACACCCAGCA TTCCTCCTGA TCCCAGACAT CCAGATGACA CAGACTACAT CCTCCCTGTC
5701 TGCCTCTCTG GGAGACAGAG TCACCATCAG TTGCAGGGCA AGTCAGGACA TTAGTAAATA
5761 TTTAAATTGG TATCAGCAGA AACCAGATGG AACTGTTAAA CTCCTGATCT ACCATACATC
5821 AAGATTACAC TCAGGAGTCC CATCAAGGTT CAGTGGCAGT GGGTCTGGAA CAGATTATTC
5881 TCTCACCATT AGCAACCTGG AGCAAGAAGA TATTGCCACT TACTTTTGCC AACAGGGTAA
5941 TACGCTTCCG TACACGTTCG GAGGGGGGAC TAAGTTGGAA ATAACAGGCT CCACCTCTGG
6001 ATCCGGCAAG CCCGGATCTG GCGAGGGATC CACCAAGGGC GAGGTGAAAC TGCAGGAGTC
6061 AGGACCTGGC CTGGTGGCGC CCTCACAGAG CCTGTCCGTC ACATGCACTG TCTCAGGGGT
6121 CTCATTACCC GACTATGGTG TAAGCTGGAT TCGCCAGCCT CCACGAAAGG GTCTGGAGTG
6181 GCTGGGAGTA ATATGGGGTA GTGAAACCAC ATACTATAAT TCAGCTCTCA AATCCAGACT
6241 GACCATCATC AAGGACAACT CCAAGAGCCA AGTTTTCTTA AAAATGAACA GTCTGCAAAC
6301 TGATGACACA GCCATTTACT ACTGTGCCAA ACATTATTAC TACGGTGGTA GCTATGCTAT
6361 GGACTACTGG GGTCAAGGAA CCTCAGTCAC CGTCTCCTCA GCGGCCGCAG GTGGAGGAGG
6421 TTCTGGAGGT GGTGGATCAG GTGGTGGAGG ATCTCTAGAA GTGAATGGAG AGAATGTGGA
6481 GCAGCATCCT TCAACCCTGA GTGTCCAGGA GGGAGACAGC GCTGTTATCA AGTGTACTTA
6541 TTCAGACAGT GCCTCAAACT ACTTCCCTTG GTATAAGCAA GAACTTGGAA AAAGACCTCA
6601 GCTTATTATA GACATTCGTT CAAATGTGGG CGAAAAGAAA GACCAACGAA TTGCTGTTAC
6661 ATTGAACAAG ACAGCCAAAC ATTTCTCCCT GCACATCACA GAGACCCAAC CTGAAGACTC
6721 GGCTGTCTAC TTCTGTGCAG CAAGTAGGAA GGACTCTGGG GGTTACCAGA AAGTTACCTT
6781 TGGAACTGGA ACAAAGCTCC AAGTCATCCC AAATATCCAG AACCCTGACC CTGCCGTGTA
6841 CCAGCTGAGA GACTCTAAAT CCAGTGACAA GTCTGTCTGC CTATTCACCG ATTTTGATTC
6901 TCAAACAAAT GTGTCACAAA GTAAGGATTC TGATGTGTAT ATCACAGACA AAACTGTGCT
6961 AGACATGAGG TCTATGGACT TCAAGAGCAA CAGTGCTGTG GCCTGGAGCA ACAAATCTGA
7021 CTTTGCATGT GCAAACGCCT TCAACAACAG CATTATTCCA GAAGACACCT TCTTCCCCAG
7081 CCCAGAAAGT TCCTGTGATG TCAAGCTGGT CGAGAAAAGC TTTGAAACAG ATACGAACCT
7141 AAACTTTCAA AACCTGTCAG TGATTGGGTT CCGAATCCTC CTCCTGAAAG TGGCCGGGTT
7201 TAATCTGCTC ATGACGCTGC GGCTGTGGTC CAGCTGATAA GATATCGAGC ATCTTACCGC
7261 CATTTATACC CATATTTGTT CTGTTTTTCT TGATTTGGGT ATACATTTAA ATGTTAATAA
7321 AACAAAATGG TGGGGCAATC ATTTACATTT TTAGGGATAT GTAATTACTA GTTCAGGTGT
7381 ATTGCCACAA GACAAACATG TTAAGAAACT TTCCCGTTAT TTACGCTCTG TTCCTGTTAA
7441 TCAACCTCTG GATTACAAAA TTTGTGAAAG ATTGACTGAT ATTCTTAACT ATGTTGCTCC
7501 TTTTACGCTG TGTGGATATG CTGCTTTATA GCCTCTGTAT CTAGCTATTG CTTCCCGTAC
7561 GGCTTTCGTT TTCTCCTCCT TGTATAAATC CTGGTTGCTG TCTCTTTTAG AGGAGTTGTG
7621 GCCCGTTGTC CGTCAACGTG GCGTGGTGTG CTCTGTGTTT GCTGACGCAA CCCCCACTGG
7681 CTGGGGCATT GCCACCACCT GTCAACTCCT TTCTGGGACT TTCGCTTTCC CCCTCCCGAT
7741 CGCCACGGCA GAACTCATCG CCGCCTGCCT TGCCCGCTGC TGGACAGGGG CTAGGTTGCT
7801 GGGCACTGAT AATTCCGTGG TGTTGTCAGT ACTGGTACCT TTAAGACCAA TGACTTACAA
7861 GGCAGCTGTA GATCTTAGCC ACTTTTTAAA AGAAAAGGGG GGACTGGAAG GGCTAATTCA
7921 CTCCCAAAGA AGACAAGATC TGCTTTTTGC CTGTACTGGG TCTCTCTGGT TAGACCAGAT
7981 CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG CTTAAGCCTC AATAAAGCTT
8041 GCCTTGAGTG CTTCAATGAT CATAATCAAG CCATATCACA TCTGTAGAGG TTTACTTGCT
8101 TTAAAAAACC TCCACACCTC CCCCTGAACC TGAAACATAA AATGAATGCA ATTGTTGTTG
8161 TTAACTTGTT TATTGCAGCT TATAATGGTT ACAAATAAAG CAATAGCATC ACAAATTTCA
8221 CAAATAAAGC ATTTTTTTCA CTGCATTCTA GTTGTGGTTT GTCCAAACTC ATCAATGTAT
8281 CTTATCATGT CTGGATCTGC GTCGACACGA AGAGACGACT GACTGACTGA CTGGAAAGAG
8341 GAAGGGCTGG AAGAGGAAGG AGCTTGATCC AGATCCCGAT CTCGATCCAG ATCCGGATCG
8401 CAGCTTGGCG TAATCATGGT CATAGCTGTT TCCTGTGTGA AATTGTTATC CGCTCACAAT
8461 TCCACACAAC ATACGAGCCG GAAGCATAAA GTGTAAAGCC TGGGGTGCCT AATGAGTGAG
8521 CTAACTCACA TTAATTGCGT TGCGCTCACT GCCCGCTTTC CAGTCGGGAA ACCTGTCGTG
8581 CCAGCTGCAT TAATGAATCG GCCAACGCGC GGGGAGAGGC GGTTTGCGTA TTGGGCGCTC
8641 TTCCGCTTCC TCGCTCACTG ACTCGCTGCG CTCGGTCGTT CGGCTGCGGC GAGCGGTATC
8701 AGCTCACTCA AAGGCGGTAA TACGGTTATC CACAGAATCA GGGGATAACG CAGGAAAGAA
8761 CATGTGAGCA AAAGGCCAGC AAAAGGCCAG GAACCGTAAA AAGGCCGCGT TGCTGGCGTT
8821 TTTCCATAGG CTCCGCCCCC CTGACGAGCA TCACAAAAAT CGACGCTCAA GTCAGAGGTG
8881 GCGAAACCCG ACAGGACTAT AAAGATACCA GGCGTTTCCC CCTGGAAGCT CCCTCGTGCG
8941 CTCTCCTGTT CCGACCCTGC CGCTTACCGG ATACCTGTCC GCCTTTCTCC CTTCGGGAAG
9001 CGTGGCGCTT TCTCATAGCT CACGCTGTAG GTATCTCAGT TCGGTGTAGG TCGTTCGCTC
9061 CAAGCTGGGC TGTGTGCACG AACCCCCCGT TCAGCCCGAC CGCTGCGCCT TATCCGGTAA
9121 CTATCGTCTT GAGTCCAACC CGGTAAGACA CGACTTATCG CCACTGGCAG CAGCCACTGG
9181 TAACAGGATT AGCAGAGCGA GGTATGTAGG CGGTGCTACA GAGTTCTTGA AGTGGTGGCC
9241 TAACTACGGC TACACTAGAA GAACAGTATT TGGTATCTGC GCTCTGCTGA AGCCAGTTAC
9301 CTTCGGAAAA AGAGTTGGTA GCTCTTGATC CGGCAAACAA ACCACCGCTG GTAGCGGTGG
9361 TTTTTTTGTT TGCAAGCAGC AGATTACGCG CAGAAAAAAA GGATCTCAAG AAGATCCTTT
9421 GATCTTTTCT ACGGGGTCTG ACGCTCAGTG GAACGAAAAC TCACGTTAAG GGATTTTGGT
9481 CATGAGATTA TCAAAAAGGA TCTTCACCTA GATCCTTTTA AATTAAAAAT GAAGTTTTAA
9541 ATCAATCTAA AGTAT
pLRPO FMC63-HAP17(35-258) (서열 식별 번호:178)
1 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
61 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA
121 CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCAGCTTGG GAAACCATAA
181 GAGCTGAAGC CAGTTACCTT CGGAAAAAGA GTTGGTAGCT CTTGATCCGG CAAACAAACC
241 ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC AAGCAGCAGA TTACGCGCAG AAAAAAAGGA
301 TCTCAAGAAG ATCCTTTGAT CTTTTCTACG GGGTCTGACG CTCAGTGGAA CGAAAACTCA
361 CGTTAAGGGA TTTTGGTCAT GAGCTTGCGC CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC
421 AGTGTTACAA CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT
481 GCAATTTATT CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG
541 AAGGAGAAAA CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA
601 TTCCGACTCG TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT
661 CAAGTGAGAA ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA
721 TTTCTTTCCA GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT
781 CAACCAAACC GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT
841 TAAAAGGACA ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT
901 CAACAATATT TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG
961 GGATCGCAGT GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG
1021 GAAGAGGCAT AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG
1081 CAACGCTACC TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC
1141 GATAGATTGT CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT
1201 CAGCATCCAT GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA
1261 CACCCCTTGT ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT
1321 TATCTTGTGC AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC
1381 CATGACATTA ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC
1441 GAGATAGAGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC
1501 TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA
1561 CCCAAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG
1621 AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAG
1681 AAAGCGAAAG GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC
1741 ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA
1801 TGCGGTGTGA AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC
1861 CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC
1921 AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC
1981 AGTCACGACG TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA
2041 TCCAGATCGA ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG
2101 TCTCAACCTC CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG
2161 TCATTAGTTC ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG
2221 CCTGGCTGAC CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA
2281 GTAACGCCAA TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC
2341 CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC
2401 GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG
2461 CAGTACATCT ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC
2521 AATGGGCGTG GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC
2581 AATGGGAGTT TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC
2641 GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT
2701 CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA
2761 ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG
2821 TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG
2881 GAAAATCTCT AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG
2941 ATCTCTCGAC GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA
3001 CTGGTGAGTA CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG
3061 AGCGTCGGTA TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG
3121 GGGAAAGAAA CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT
3181 CGCAGTTAAT CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT
3241 ACAACCATCC CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT
3301 CCTCTATTGT GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT
3361 AGAGGAAGAG CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCAGACCTGGAGG
3421 AGGCAGGAGG CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA
3481 AAATTGAACC ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA
3541 AAAGAGCAGT GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA
3601 TGGGCGCAGC GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC
3661 AGCAGCAGAA CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG
3721 TCTGGGGCAT CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC
3781 AACAGCTCCT GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT
3841 GGAATGCTAG TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG
3901 AGTGGGACAG AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC
3961 AAAACCAGCA AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT
4021 GGAATTGGTT TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG
4081 GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC
4141 AGGGATATTC ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC
4201 AAATGGCAGT ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG
4261 GGGAAAGAAT AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA
4321 TTACAAAAAT TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG
4381 CTGAGCATCC GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA
4441 GAAGTTGGGG GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA
4501 CTGGGAAAGT GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA
4561 TATAAGTGCA GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA
4621 GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT
4681 GCCTTGAATT ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG
4741 TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT
4801 GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG
4861 CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA
4921 CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT
4981 CGGTTTTTGG GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA
5041 GGCGGGGCCT GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC
5101 CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG
5161 CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA
5221 GCTCAAAATG GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA
5281 AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT
5341 CCAGGCACCT CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG
5401 GGTTTTATGC GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT
5461 GGCACTTGAT GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC
5521 TCAAGCCTCA GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC
5581 CCCTCTAGAG CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA
5641 CACCCAGCAT TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT
5701 GCCTCTCTGG GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT
5761 TTAAATTGGT ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA
5821 AGATTACACT CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT
5881 CTCACCATTA GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT
5941 ACGCTTCCGT ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA
6001 TCCGGCAAGC CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA
6061 GGACCTGGCC TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC
6121 TCATTACCCG ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG
6181 CTGGGAGTAA TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG
6241 ACCATCATCA AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT
6301 GATGACACAG CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG
6361 GACTACTGGG GTCAAGGAAC CTCAGTCACC GTCTCCTCAG CGGCCGCAGG TGGAGGAGGT
6421 TCTGGAGGTG GTGGATCAGG TGGTGGAGGA TCTCTAGAAG AAAAGAAAGA CCAACGAATT
6481 GCTGTTACAT TGAACAAGAC AGCCAAACAT TTCTCCCTGC ACATCACAGA GACCCAACCT
6541 GAAGACTCGG CTGTCTACTT CTGTGCAGCA AGTAGGAAGG ACTCTGGGGG TTACCAGAAA
6601 GTTACCTTTG GAACTGGAAC AAAGCTCCAA GTCATCCCAA ATATCCAGAA CCCTGACCCT
6661 GCCGTGTACC AGCTGAGAGA CTCTAAATCC AGTGACAAGT CTGTCTGCCT ATTCACCGAT
6721 TTTGATTCTC AAACAAATGT GTCACAAAGT AAGGATTCTG ATGTGTATAT CACAGACAAA
6781 ACTGTGCTAG ACATGAGGTC TATGGACTTC AAGAGCAACA GTGCTGTGGC CTGGAGCAAC
6841 AAATCTGACT TTGCATGTGC AAACGCCTTC AACAACAGCA TTATTCCAGA AGACACCTTC
6901 TTCCCCAGCC CAGAAAGTTC CTGTGATGTC AAGCTGGTCG AGAAAAGCTT TGAAACAGAT
6961 ACGAACCTAA ACTTTCAAAA CCTGTCAGTG ATTGGGTTCC GAATCCTCCT CCTGAAAGTG
7021 GCCGGGTTTA ATCTGCTCAT GACGCTGCGG CTGTGGTCCA GCTGATAAGA TATCGAGCAT
7081 CTTACCGCCA TTTATACCCA TATTTGTTCT GTTTTTCTTG ATTTGGGTAT ACATTTAAAT
7141 GTTAATAAAA CAAAATGGTG GGGCAATCAT TTACATTTTT AGGGATATGT AATTACTAGT
7201 TCAGGTGTAT TGCCACAAGA CAAACATGTT AAGAAACTTT CCCGTTATTT ACGCTCTGTT
7261 CCTGTTAATC AACCTCTGGA TTACAAAATT TGTGAAAGAT TGACTGATAT TCTTAACTAT
7321 GTTGCTCCTT TTACGCTGTG TGGATATGCT GCTTTATAGC CTCTGTATCT AGCTATTGCT
7381 TCCCGTACGG CTTTCGTTTT CTCCTCCTTG TATAAATCCT GGTTGCTGTC TCTTTTAGAG
7441 GAGTTGTGGC CCGTTGTCCG TCAACGTGGC GTGGTGTGCT CTGTGTTTGC TGACGCAACC
7501 CCCACTGGCT GGGGCATTGC CACCACCTGT CAACTCCTTT CTGGGACTTT CGCTTTCCCC
7561 CTCCCGATCG CCACGGCAGA ACTCATCGCC GCCTGCCTTG CCCGCTGCTG GACAGGGGCT
7621 AGGTTGCTGG GCACTGATAA TTCCGTGGTG TTGTCAGTAC TGGTACCTTT AAGACCAATG
7681 ACTTACAAGG CAGCTGTAGA TCTTAGCCAC TTTTTAAAAG AAAAGGGGGG ACTGGAAGGG
7741 CTAATTCACT CCCAAAGAAG ACAAGATCTG CTTTTTGCCT GTACTGGGTC TCTCTGGTTA
7801 GACCAGATCT GAGCCTGGGA GCTCTCTGGC TAACTAGGGA ACCCACTGCT TAAGCCTCAA
7861 TAAAGCTTGC CTTGAGTGCT TCAATGATCA TAATCAAGCC ATATCACATC TGTAGAGGTT
7921 TACTTGCTTT AAAAAACCTC CACACCTCCC CCTGAACCTG AAACATAAAA TGAATGCAAT
7981 TGTTGTTGTT AACTTGTTTA TTGCAGCTTA TAATGGTTAC AAATAAAGCA ATAGCATCAC
8041 AAATTTCACA AATAAAGCAT TTTTTTCACT GCATTCTAGT TGTGGTTTGT CCAAACTCAT
8101 CAATGTATCT TATCATGTCT GGATCTGCGT CGACACGAAG AGACGACTGA CTGACTGACT
8161 GGAAAGAGGA AGGGCTGGAA GAGGAAGGAG CTTGATCCAG ATCCCGATCT CGATCCAGAT
8221 CCGGATCGCA GCTTGGCGTA ATCATGGTCA TAGCTGTTTC CTGTGTGAAA TTGTTATCCG
8281 CTCACAATTC CACACAACAT ACGAGCCGGA AGCATAAAGT GTAAAGCCTG GGGTGCCTAA
8341 TGAGTGAGCT AACTCACATT AATTGCGTTG CGCTCACTGC CCGCTTTCCA GTCGGGAAAC
8401 CTGTCGTGCC AGCTGCATTA ATGAATCGGC CAACGCGCGG GGAGAGGCGG TTTGCGTATT
8461 GGGCGCTCTT CCGCTTCCTC GCTCACTGAC TCGCTGCGCT CGGTCGTTCG GCTGCGGCGA
8521 GCGGTATCAG CTCACTCAAA GGCGGTAATA CGGTTATCCA CAGAATCAGG GGATAACGCA
8581 GGAAAGAACA TGTGAGCAAA AGGCCAGCAA AAGGCCAGGA ACCGTAAAAA GGCCGCGTTG
8641 CTGGCGTTTT TCCATAGGCT CCGCCCCCCT GACGAGCATC ACAAAAATCG ACGCTCAAGT
8701 CAGAGGTGGC GAAACCCGAC AGGACTATAA AGATACCAGG CGTTTCCCCC TGGAAGCTCC
8761 CTCGTGCGCT CTCCTGTTCC GACCCTGCCG CTTACCGGAT ACCTGTCCGC CTTTCTCCCT
8821 TCGGGAAGCG TGGCGCTTTC TCATAGCTCA CGCTGTAGGT ATCTCAGTTC GGTGTAGGTC
8881 GTTCGCTCCA AGCTGGGCTG TGTGCACGAA CCCCCCGTTC AGCCCGACCG CTGCGCCTTA
8941 TCCGGTAACT ATCGTCTTGA GTCCAACCCG GTAAGACACG ACTTATCGCC ACTGGCAGCA
9001 GCCACTGGTA ACAGGATTAG CAGAGCGAGG TATGTAGGCG GTGCTACAGA GTTCTTGAAG
9061 TGGTGGCCTA ACTACGGCTA CACTAGAAGA ACAGTATTTG GTATCTGCGC TCTGCTGAAG
9121 CCAGTTACCT TCGGAAAAAG AGTTGGTAGC TCTTGATCCG GCAAACAAAC CACCGCTGGT
9181 AGCGGTGGTT TTTTTGTTTG CAAGCAGCAG ATTACGCGCA GAAAAAAAGG ATCTCAAGAA
9241 GATCCTTTGA TCTTTTCTAC GGGGTCTGAC GCTCAGTGGA ACGAAAACTC ACGTTAAGGG
9301 ATTTTGGTCA TGAGATTATC AAAAAGGATC TTCACCTAGA TCCTTTTAAA TTAAAAATGA
9361 AGTTTTAAAT CAATCTAAAG TATA
pLRPO FMC63-HAP17(79-258) (서열 식별 번호:179)
1 ATATGAGTAA ACTTGGTCTG ACAGTTACCA ATGCTTAATC AGTGAGGCAC CTATCTCAGC
61 GATCTGTCTA TTTCGTTCAT CCATAGTTGC CTGACTCCCC GTCGTGTAGA TAACTACGAT
121 ACGGGAGGGC TTACCATCTG GCCCCAGTGC TGCAATGATA CCGCAGCTTG GGAAACCATA
181 AGAGCTGAAG CCAGTTACCT TCGGAAAAAG AGTTGGTAGC TCTTGATCCG GCAAACAAAC
241 CACCGCTGGT AGCGGTGGTT TTTTTGTTTG CAAGCAGCAG ATTACGCGCA GAAAAAAAGG
301 ATCTCAAGAA GATCCTTTGA TCTTTTCTAC GGGGTCTGAC GCTCAGTGGA ACGAAAACTC
361 ACGTTAAGGG ATTTTGGTCA TGAGCTTGCG CCGTCCCGTC AAGTCAGCGT AATGCTCTGC
421 CAGTGTTACA ACCAATTAAC CAATTCTGAT TAGAAAAACT CATCGAGCAT CAAATGAAAC
481 TGCAATTTAT TCACATCAGG ATTATCAATA CCATATTTTT GAAAAAGCCG TTTCTGTAAT
541 GAAGGAGAAA ACTCACCGAG GCAGTTCCAT AGGATGGCAA GATCCTGGTA TCGGTCTGCG
601 ATTCCGACTC GTCCAACATC AATACAACCT ATTAATTTCC CCTCGTCAAA AATAAGGTTA
661 TCAAGTGAGA AATCACCATG AGTGACGACT GAATCCGGTG AGAATGGCAA AAGTTTATGC
721 ATTTCTTTCC AGACTTGTTC AACAGGCCAG CCATTACGCT CGTCATCAAA ATCACTCGCA
781 TCAACCAAAC CGTTATTCAT TCGTGATTGC GCCTGAGCAA GACGAAATAC GCGATCGCTG
841 TTAAAAGGAC AATTACAAAC AGGAATCGAA TGCAACCGGC GCAGGAACAC TGCCAGCGCA
901 TCAACAATAT TTTCACCTGA ATCAGGATAT TCTTCTAATA CCTGGAATGC TGTTTTTCCG
961 GGGATCGCAG TGGTGAGTAA CCATGCATCA TCAGGAGTAC GGATAAAATG CTTGATGGTC
1021 GGAAGAGGCA TAAATTCCGT CAGCCAGTTT AGTCTGACCA TCTCATCTGT AACATCATTG
1081 GCAACGCTAC CTTTGCCATG TTTCAGAAAC AACTCTGGCG CATCGGGCTT CCCATACAAG
1141 CGATAGATTG TCGCACCTGA TTGCCCGACA TTATCGCGAG CCCATTTATA CCCATATAAA
1201 TCAGCATCCA TGTTGGAATT TAATCGCGGC CTCGACGTTT CCCGTTGAAT ATGGCTCATA
1261 ACACCCCTTG TATTACTGTT TATGTAAGCA GACAGTTTTA TTGTTCATGA TGATATATTT
1321 TTATCTTGTG CAATGTAACA TCAGAGATTT TGAGACACAA CGTGGCTTTC CCCCCCCCCC
1381 CCATGACATT AACCTATAAA AATAGGCGTA TCACGAGGCC AGCTTGGGAA ACCATAAGAC
1441 CGAGATAGAG TTGAGTGTTG TTCCAGTTTG GAACAAGAGT CCACTATTAA AGAACGTGGA
1501 CTCCAACGTC AAAGGGCGAA AAACCGTCTA TCAGGGCGAT GGCCCACTAC GTGAACCATC
1561 ACCCAAATCA AGTTTTTTGG GGTCGAGGTG CCGTAAAGCA CTAAATCGGA ACCCTAAAGG
1621 GAGCCCCCGA TTTAGAGCTT GACGGGGAAA GCCGGCGAAC GTGGCGAGAA AGGAAGGGAA
1681 GAAAGCGAAA GGAGCGGGCG CTAAGGCGCT GGCAAGTGTA GCGGTCACGC TGCGCGTAAC
1741 CACCACACCC GCCGCGCTTA ATGCGCCGCT ACAGGGCGCG TACTATGGTT GCTTTGACGT
1801 ATGCGGTGTG AAATACCGCA CAGATGCGTA AGGAGAAAAT ACCGCATCAG GCGCCATTCG
1861 CCATTCAGGC TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC GCTATTACGC
1921 CAGCTGGCGA AAGGGGGATG TGCTGCAAGG CGATTAAGTT GGGTAACGCC AGGGTTTTCC
1981 CAGTCACGAC GTTGTAAAAC GACGGCCAGT GAATTGATCG AGATCGTGAT CCGGATCAAG
2041 ATCCAGATCG AATTGGAGGC TACAGTCAGT GGAGAGGACT TTCACTGACT GACTGACTGC
2101 GTCTCAACCT CCTAGGGGAC ATTGATTATT GACTAGTTAT TAATAGTAAT CAATTACGGG
2161 GTCATTAGTT CATAGCCCAT ATATGGAGTT CCGCGTTACA TAACTTACGG TAAATGGCCC
2221 GCCTGGCTGA CCGCCCAACG ACCCCCGCCC ATTGACGTCA ATAATGACGT ATGTTCCCAT
2281 AGTAACGCCA ATAGGGACTT TCCATTGACG TCAATGGGTG GAGTATTTAC GGTAAACTGC
2341 CCACTTGGCA GTACATCAAG TGTATCATAT GCCAAGTACG CCCCCTATTG ACGTCAATGA
2401 CGGTAAATGG CCCGCCTGGC ATTATGCCCA GTACATGACC TTATGGGACT TTCCTACTTG
2461 GCAGTACATC TACGTATTAG TCATCGCTAT TACCATGGTG ATGCGGTTTT GGCAGTACAT
2521 CAATGGGCGT GGATAGCGGT TTGACTCACG GGGATTTCCA AGTCTCCACC CCATTGACGT
2581 CAATGGGAGT TTGTTTTGGC ACCAAAATCA ACGGGACTTT CCAAAATGTC GTAACAACTC
2641 CGCCCCATTG ACGCAAATGG GCGGTAGGCG TGTACGGTGG GAGGTCTATA TAAGCAGAGC
2701 TCGTTTAGTG AACCGGGTCT CTCTGGTTAG ACCAGATCTG AGCCTGGGAG CTCTCTGGCT
2761 AACTAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTC AAAGTAGTGT
2821 GTGCCCGTCT GTTGTGTGAC TCTGGTAACT AGAGATCCCT CAGACCCTTT TAGTCAGTGT
2881 GGAAAATCTC TAGCAGTGGC GCCCGAACAG GGACTTGAAA GCGAAAGTAA AGCCAGAGGA
2941 GATCTCTCGA CGCAGGACTC GGCTTGCTGA AGCGCGCACG GCAAGAGGCG AGGGGCGGCG
3001 ACTGGTGAGT ACGCCAAAAA TTTTGACTAG CGGAGGCTAG AAGGAGAGAG TAGGGTGCGA
3061 GAGCGTCGGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA AAAAATTCGG TTAAGGCCAG
3121 GGGGAAAGAA ACAATATAAA CTAAAACATA TAGTTAGGGC AAGCAGGGAG CTAGAACGAT
3181 TCGCAGTTAA TCCTGGCCTT TTAGAGACAT CAGAAGGCTG TAGACAAATA CTGGGACAGC
3241 TACAACCATC CCTTCAGACA GGATCAGAAG AACTTAGATC ATTATATAAT ACAATAGCAG
3301 TCCTCTATTG TGTGCATCAA AGGATAGATG TAAAAGACAC CAAGGAAGCC TTAGATAAGA
3361 TAGAGGAAGA GCAAAACAAA AGTAAGAAAA AGGCACAGCA AGCGATCTTC AGACCTGGAG
3421 GAGGCAGGAG GCGATATGAG GGACAATTGG AGAAGTGAAT TATATAAATA TAAAGTAGTA
3481 AAAATTGAAC CATTAGGAGT AGCACCCACC AAGGCAAAGA GAAGAGTGGT GCAGAGAGAA
3541 AAAAGAGCAG TGGGAATAGG AGCTTTGTTC CTTGGGTTCT TGGGAGCAGC AGGAAGCACT
3601 ATGGGCGCAG CGTCAATGAC GCTGACGGTA CAGGCCAGAC AATTATTGTC TGATATAGTG
3661 CAGCAGCAGA ACAATTTGCT GAGGGCTATT GAGGCGCAAC AGCATCTGTT GCAACTCACA
3721 GTCTGGGGCA TCAAACAGCT CCAGGCAAGA ATCCTGGCTG TGGAAAGATA CCTAAAGGAT
3781 CAACAGCTCC TGGGGATTTG GGGTTGCTCT GGAAAACTCA TTTGCACCAC TGCTGTGCCT
3841 TGGAATGCTA GTTGGAGTAA TAAATCTCTG GAACAGATTT GGAATAACAT GACCTGGATG
3901 GAGTGGGACA GAGAAATTAA CAATTACACA AGCTTAATAC ACTCCTTAAT TGAAGAATCG
3961 CAAAACCAGC AAGAAAAGAA TGAACAAGAA TTATTGGAAT TAGATAAATG GGCAAGTTTG
4021 TGGAATTGGT TTAACATAAC AAATTGGCTG TGGTATATAA AATTATTCAT AATGATAGTA
4081 GGAGGCTTGG TAGGTTTAAG AATAGTTTTT GCTGTACTTT CTATAGTGAA TAGAGTTAGG
4141 CAGGGATATT CACCATTATC GTTTCAGACC CACCTCCCAA TCCCGAGGGG ACCACGCGTA
4201 CAAATGGCAG TATTCATCCA CAATTTTAAA AGAAAAGGGG GGATTGGGGG GTACAGTGCA
4261 GGGGAAAGAA TAGTAGACAT AATAGCAACA GACATACAAA CTAAAGAATT ACAAAAACAA
4321 ATTACAAAAA TTCAAAATTT TCGGGTTTAT TACAGGGACA GCAGAAATCC ACTTTGGAAA
4381 GCTGAGCATC CGGCTCCGGT GCCCGTCAGT GGGCAGAGCG CACATCGCCC ACAGTCCCCG
4441 AGAAGTTGGG GGGAGGGGTC GGCAATTGAA CCGGTGCCTA GAGAAGGTGG CGCGGGGTAA
4501 ACTGGGAAAG TGATGTCGTG TACTGGCTCC GCCTTTTTCC CGAGGGTGGG GGAGAACCGT
4561 ATATAAGTGC AGTAGTCGCC GTGAACGTTC TTTTTCGCAA CGGGTTTGCC GCCAGAACAC
4621 AGGTAAGTGC CGTGTGTGGT TCCCGCGGGC CTGGCCTCTT TACGGGTTAT GGCCCTTGCG
4681 TGCCTTGAAT TACTTCCACG CCCCTGGCTG CAGTACGTGA TTCTTGATCC CGAGCTTCGG
4741 GTTGGAAGTG GGTGGGAGAG TTCGAGGCCT TGCGCTTAAG GAGCCCCTTC GCCTCGTGCT
4801 TGAGTTGAGG CCTGGCCTGG GCGCTGGGGC CGCCGCGTGC GAATCTGGTG GCACCTTCGC
4861 GCCTGTCTCG CTGCTTTCGA TAAGTCTCTA GCCATTTAAA ATTTTTGATG ACCTGCTGCG
4921 ACGCTTTTTT TCTGGCAAGA TAGTCTTGTA AATGCGGGCC AAGATCTGCA CACTGGTATT
4981 TCGGTTTTTG GGGCCGCGGG CGGCGACGGG GCCCGTGCGT CCCAGCGCAC ATGTTCGGCG
5041 AGGCGGGGCC TGCGAGCGCG GCCACCGAGA ATCGGACGGG GGTAGTCTCA AGCTGGCCGG
5101 CCTGCTCTGG TGCCTGGCCT CGCGCCGCCG TGTATCGCCC CGCCCTGGGC GGCAAGGCTG
5161 GCCCGGTCGG CACCAGTTGC GTGAGCGGAA AGATGGCCGC TTCCCGGCCC TGCTGCAGGG
5221 AGCTCAAAAT GGAGGACGCG GCGCTCGGGA GAGCGGGCGG GTGAGTCACC CACACAAAGG
5281 AAAAGGGCCT TTCCGTCCTC AGCCGTCGCT TCATGTGACT CCACGGAGTA CCGGGCGCCG
5341 TCCAGGCACC TCGATTAGTT CTCGAGCTTT TGGAGTACGT CGTCTTTAGG TTGGGGGGAG
5401 GGGTTTTATG CGATGGAGTT TCCCCACACT GAGTGGGTGG AGACTGAAGT TAGGCCAGCT
5461 TGGCACTTGA TGTAATTCTC CTTGGAATTT GCCCTTTTTG AGTTTGGATC TTGGTTCATT
5521 CTCAAGCCTC AGACAGTGGT TCAAAGTTTT TTTCTTCCAT TTCAGGTGTC GTGAAAACTA
5581 CCCCTCTAGA GCCGCCACCA TGCTTCTCCT GGTGACAAGC CTTCTGCTCT GTGAGTTACC
5641 ACACCCAGCA TTCCTCCTGA TCCCAGACAT CCAGATGACA CAGACTACAT CCTCCCTGTC
5701 TGCCTCTCTG GGAGACAGAG TCACCATCAG TTGCAGGGCA AGTCAGGACA TTAGTAAATA
5761 TTTAAATTGG TATCAGCAGA AACCAGATGG AACTGTTAAA CTCCTGATCT ACCATACATC
5821 AAGATTACAC TCAGGAGTCC CATCAAGGTT CAGTGGCAGT GGGTCTGGAA CAGATTATTC
5881 TCTCACCATT AGCAACCTGG AGCAAGAAGA TATTGCCACT TACTTTTGCC AACAGGGTAA
5941 TACGCTTCCG TACACGTTCG GAGGGGGGAC TAAGTTGGAA ATAACAGGCT CCACCTCTGG
6001 ATCCGGCAAG CCCGGATCTG GCGAGGGATC CACCAAGGGC GAGGTGAAAC TGCAGGAGTC
6061 AGGACCTGGC CTGGTGGCGC CCTCACAGAG CCTGTCCGTC ACATGCACTG TCTCAGGGGT
6121 CTCATTACCC GACTATGGTG TAAGCTGGAT TCGCCAGCCT CCACGAAAGG GTCTGGAGTG
6181 GCTGGGAGTA ATATGGGGTA GTGAAACCAC ATACTATAAT TCAGCTCTCA AATCCAGACT
6241 GACCATCATC AAGGACAACT CCAAGAGCCA AGTTTTCTTA AAAATGAACA GTCTGCAAAC
6301 TGATGACACA GCCATTTACT ACTGTGCCAA ACATTATTAC TACGGTGGTA GCTATGCTAT
6361 GGACTACTGG GGTCAAGGAA CCTCAGTCAC CGTCTCCTCA GCGGCCGCAG GTGGAGGAGG
6421 TTCTGGAGGT GGTGGATCAG GTGGTGGAGG ATCTCTAGAA TACCAGAAAG TTACCTTTGG
6481 AACTGGAACA AAGCTCCAAG TCATCCCAAA TATCCAGAAC CCTGACCCTG CCGTGTACCA
6541 GCTGAGAGAC TCTAAATCCA GTGACAAGTC TGTCTGCCTA TTCACCGATT TTGATTCTCA
6601 AACAAATGTG TCACAAAGTA AGGATTCTGA TGTGTATATC ACAGACAAAA CTGTGCTAGA
6661 CATGAGGTCT ATGGACTTCA AGAGCAACAG TGCTGTGGCC TGGAGCAACA AATCTGACTT
6721 TGCATGTGCA AACGCCTTCA ACAACAGCAT TATTCCAGAA GACACCTTCT TCCCCAGCCC
6781 AGAAAGTTCC TGTGATGTCA AGCTGGTCGA GAAAAGCTTT GAAACAGATA CGAACCTAAA
6841 CTTTCAAAAC CTGTCAGTGA TTGGGTTCCG AATCCTCCTC CTGAAAGTGG CCGGGTTTAA
6901 TCTGCTCATG ACGCTGCGGC TGTGGTCCAG CTGATAAGAT ATCGAGCATC TTACCGCCAT
6961 TTATACCCAT ATTTGTTCTG TTTTTCTTGA TTTGGGTATA CATTTAAATG TTAATAAAAC
7021 AAAATGGTGG GGCAATCATT TACATTTTTA GGGATATGTA ATTACTAGTT CAGGTGTATT
7081 GCCACAAGAC AAACATGTTA AGAAACTTTC CCGTTATTTA CGCTCTGTTC CTGTTAATCA
7141 ACCTCTGGAT TACAAAATTT GTGAAAGATT GACTGATATT CTTAACTATG TTGCTCCTTT
7201 TACGCTGTGT GGATATGCTG CTTTATAGCC TCTGTATCTA GCTATTGCTT CCCGTACGGC
7261 TTTCGTTTTC TCCTCCTTGT ATAAATCCTG GTTGCTGTCT CTTTTAGAGG AGTTGTGGCC
7321 CGTTGTCCGT CAACGTGGCG TGGTGTGCTC TGTGTTTGCT GACGCAACCC CCACTGGCTG
7381 GGGCATTGCC ACCACCTGTC AACTCCTTTC TGGGACTTTC GCTTTCCCCC TCCCGATCGC
7441 CACGGCAGAA CTCATCGCCG CCTGCCTTGC CCGCTGCTGG ACAGGGGCTA GGTTGCTGGG
7501 CACTGATAAT TCCGTGGTGT TGTCAGTACT GGTACCTTTA AGACCAATGA CTTACAAGGC
7561 AGCTGTAGAT CTTAGCCACT TTTTAAAAGA AAAGGGGGGA CTGGAAGGGC TAATTCACTC
7621 CCAAAGAAGA CAAGATCTGC TTTTTGCCTG TACTGGGTCT CTCTGGTTAG ACCAGATCTG
7681 AGCCTGGGAG CTCTCTGGCT AACTAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC
7741 TTGAGTGCTT CAATGATCAT AATCAAGCCA TATCACATCT GTAGAGGTTT ACTTGCTTTA
7801 AAAAACCTCC ACACCTCCCC CTGAACCTGA AACATAAAAT GAATGCAATT GTTGTTGTTA
7861 ACTTGTTTAT TGCAGCTTAT AATGGTTACA AATAAAGCAA TAGCATCACA AATTTCACAA
7921 ATAAAGCATT TTTTTCACTG CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT
7981 ATCATGTCTG GATCTGCGTC GACACGAAGA GACGACTGAC TGACTGACTG GAAAGAGGAA
8041 GGGCTGGAAG AGGAAGGAGC TTGATCCAGA TCCCGATCTC GATCCAGATC CGGATCGCAG
8101 CTTGGCGTAA TCATGGTCAT AGCTGTTTCC TGTGTGAAAT TGTTATCCGC TCACAATTCC
8161 ACACAACATA CGAGCCGGAA GCATAAAGTG TAAAGCCTGG GGTGCCTAAT GAGTGAGCTA
8221 ACTCACATTA ATTGCGTTGC GCTCACTGCC CGCTTTCCAG TCGGGAAACC TGTCGTGCCA
8281 GCTGCATTAA TGAATCGGCC AACGCGCGGG GAGAGGCGGT TTGCGTATTG GGCGCTCTTC
8341 CGCTTCCTCG CTCACTGACT CGCTGCGCTC GGTCGTTCGG CTGCGGCGAG CGGTATCAGC
8401 TCACTCAAAG GCGGTAATAC GGTTATCCAC AGAATCAGGG GATAACGCAG GAAAGAACAT
8461 GTGAGCAAAA GGCCAGCAAA AGGCCAGGAA CCGTAAAAAG GCCGCGTTGC TGGCGTTTTT
8521 CCATAGGCTC CGCCCCCCTG ACGAGCATCA CAAAAATCGA CGCTCAAGTC AGAGGTGGCG
8581 AAACCCGACA GGACTATAAA GATACCAGGC GTTTCCCCCT GGAAGCTCCC TCGTGCGCTC
8641 TCCTGTTCCG ACCCTGCCGC TTACCGGATA CCTGTCCGCC TTTCTCCCTT CGGGAAGCGT
8701 GGCGCTTTCT CATAGCTCAC GCTGTAGGTA TCTCAGTTCG GTGTAGGTCG TTCGCTCCAA
8761 GCTGGGCTGT GTGCACGAAC CCCCCGTTCA GCCCGACCGC TGCGCCTTAT CCGGTAACTA
8821 TCGTCTTGAG TCCAACCCGG TAAGACACGA CTTATCGCCA CTGGCAGCAG CCACTGGTAA
8881 CAGGATTAGC AGAGCGAGGT ATGTAGGCGG TGCTACAGAG TTCTTGAAGT GGTGGCCTAA
8941 CTACGGCTAC ACTAGAAGAA CAGTATTTGG TATCTGCGCT CTGCTGAAGC CAGTTACCTT
9001 CGGAAAAAGA GTTGGTAGCT CTTGATCCGG CAAACAAACC ACCGCTGGTA GCGGTGGTTT
9061 TTTTGTTTGC AAGCAGCAGA TTACGCGCAG AAAAAAAGGA TCTCAAGAAG ATCCTTTGAT
9121 CTTTTCTACG GGGTCTGACG CTCAGTGGAA CGAAAACTCA CGTTAAGGGA TTTTGGTCAT
9181 GAGATTATCA AAAAGGATCT TCACCTAGAT CCTTTTAAAT TAAAAATGAA GTTTTAAATC
9241 AATCTAAAGT AT
pLRPC FMC63-TCR베타1 (CRISPR 저항성) (서열 식별 번호:180)
1 AAAGCTGAGC ATCCGGCTCC GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC
61 CCGAGAAGTT GGGGGGAGGG GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG
121 TAAACTGGGA AAGTGATGTC GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC
181 CGTATATAAG TGCAGTAGTC GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA
241 CACAGGTAAG TGCCGTGTGT GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT
301 GCGTGCCTTG AATTACTTCC ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT
361 CGGGTTGGAA GTGGGTGGGA GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT
421 GCTTGAGTTG AGGCCTGGCC TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT
481 CGCGCCTGTC TCGCTGCTTT CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT
541 GCGACGCTTT TTTTCTGGCA AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT
601 ATTTCGGTTT TTGGGGCCGC GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG
661 GCGAGGCGGG GCCTGCGAGC GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC
721 CGGCCTGCTC TGGTGCCTGG CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG
781 CTGGCCCGGT CGGCACCAGT TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA
841 GGGAGCTCAA AATGGAGGAC GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA
901 AGGAAAAGGG CCTTTCCGTC CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG
961 CCGTCCAGGC ACCTCGATTA GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG
1021 GAGGGGTTTT ATGCGATGGA GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA
1081 GCTTGGCACT TGATGTAATT CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC
1141 ATTCTCAAGC CTCAGACAGT GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA
1201 CTACCCCTCT AGAGCCGCCA CCATGCTTCT CCTGGTGACA AGCCTTCTGC TCTGTGAGTT
1261 ACCACACCCA GCATTCCTCC TGATCCCAGA CATCCAGATG ACACAGACTA CATCCTCCCT
1321 GTCTGCCTCT CTGGGAGACA GAGTCACCAT CAGTTGCAGG GCAAGTCAGG ACATTAGTAA
1381 ATATTTAAAT TGGTATCAGC AGAAACCAGA TGGAACTGTT AAACTCCTGA TCTACCATAC
1441 ATCAAGATTA CACTCAGGAG TCCCATCAAG GTTCAGTGGC AGTGGGTCTG GAACAGATTA
1501 TTCTCTCACC ATTAGCAACC TGGAGCAAGA AGATATTGCC ACTTACTTTT GCCAACAGGG
1561 TAATACGCTT CCGTACACGT TCGGAGGGGG GACTAAGTTG GAAATAACAG GCTCCACCTC
1621 TGGATCCGGC AAGCCCGGAT CTGGCGAGGG ATCCACCAAG GGCGAGGTGA AACTGCAGGA
1681 GTCAGGACCT GGCCTGGTGG CGCCCTCACA GAGCCTGTCC GTCACATGCA CTGTCTCAGG
1741 GGTCTCATTA CCCGACTATG GTGTAAGCTG GATTCGCCAG CCTCCACGAA AGGGTCTGGA
1801 GTGGCTGGGA GTAATATGGG GTAGTGAAAC CACATACTAT AATTCAGCTC TCAAATCCAG
1861 ACTGACCATC ATCAAGGACA ACTCCAAGAG CCAAGTTTTC TTAAAAATGA ACAGTCTGCA
1921 AACTGATGAC ACAGCCATTT ACTACTGTGC CAAACATTAT TACTACGGTG GTAGCTATGC
1981 TATGGACTAC TGGGGTCAAG GAACCTCAGT CACCGTCTCC TCAGCGGCCG CAGGTGGAGG
2041 AGGTTCTGGA GGTGGAGGTT CAGGTGGAGG TGGTTCACTC GAGCTGGGAG CAGGCCCAGT
2101 GGATTCTGGA GTCACACAAA CCCCAAAGCA CCTGATCACA GCAACTGGAC AGCGAGTGAC
2161 GCTGAGATGC TCCCCTAGGT CTGGAGACCT CTCTGTGTCA TGGTACCAAC AGAGCCTGGA
2221 CCAGGGCCTC CAGTTCCTCA TTCAGTATTA TAATGGAGAA GAGAGAGCAA AAGGAAACAT
2281 TCTTGAACGA TTCTCCGCAC AACAGTTCCC TGACTTGCAC TCTGAACTAA ACCTGAGCTC
2341 TCTGGAGCTG GGGGACTCAG CTTTGTATTT CTGTGCCAGC AGCCCCCGGA CAGGCCTGAA
2401 CACTGAAGCT TTCTTTGGAC AAGGCACCAG ACTCACAGTT GTAGAGGACC TGAACAAGGT
2461 GTTCCCACCC GAGGTCGCTG TGTTTGAGCC ATCAGAAGCA GAGATCTCCC ACACCCAAAA
2521 GGCCACgCTa GTaTGtCTaG CtACAGGCTT CTTCCCCGAC CACGTGGAGC TGAGCTGGTG
2581 GGTGAATGGG AAGGAGGTGC ACAGTGGGGT CAGCACGGAC CCGCAGCCCC TCAAGGAGCA
2641 GCCCGCCCTC AATGACTCCA GATACTGCCT GAGCAGCCGC CTGAGGGTCT CGGCCACCTT
2701 CTGGCAGAAC CCCCGCAACC ACTTCCGCTG TCAAGTCCAG TTCTACGGGC TCTCGGAGAA
2761 TGACGAGTGG ACCCAGGATA GGGCCAAACC CGTCACCCAG ATCGTCAGCG CCGAGGCCTG
2821 GGGTAGAGCA GACTGTGGCT TTACCTCGGT GTCCTACCAG CAAGGGGTCC TGTCTGCCAC
2881 CATCCTCTAT GAGATCCTGC TAGGGAAGGC CACCCTGTAT GCTGTGCTGG TCAGCGCCCT
2941 TGTGTTGATG GCCATGGTCA AGAGAAAGGA TTTCTGATAA GATATCGAGC ATCTTACCGC
3001 CATTTATACC CATATTTGTT CTGTTTTTCT TGATTTGGGT ATACATTTAA ATGTTAATAA
3061 AACAAAATGG TGGGGCAATC ATTTACATTT TTAGGGATAT GTAATTACTA GTTCAGGTGT
3121 ATTGCCACAA GACAAACATG TTAAGAAACT TTCCCGTTAT TTACGCTCTG TTCCTGTTAA
3181 TCAACCTCTG GATTACAAAA TTTGTGAAAG ATTGACTGAT ATTCTTAACT ATGTTGCTCC
3241 TTTTACGCTG TGTGGATATG CTGCTTTATA GCCTCTGTAT CTAGCTATTG CTTCCCGTAC
3301 GGCTTTCGTT TTCTCCTCCT TGTATAAATC CTGGTTGCTG TCTCTTTTAG AGGAGTTGTG
3361 GCCCGTTGTC CGTCAACGTG GCGTGGTGTG CTCTGTGTTT GCTGACGCAA CCCCCACTGG
3421 CTGGGGCATT GCCACCACCT GTCAACTCCT TTCTGGGACT TTCGCTTTCC CCCTCCCGAT
3481 CGCCACGGCA GAACTCATCG CCGCCTGCCT TGCCCGCTGC TGGACAGGGG CTAGGTTGCT
3541 GGGCACTGAT AATTCCGTGG TGTTGTCAGT ACTGGTACCT TTAAGACCAA TGACTTACAA
3601 GGCAGCTGTA GATCTTAGCC ACTTTTTAAA AGAAAAGGGG GGACTGGAAG GGCTAATTCA
3661 CTCCCAAAGA AGACAAGATC TGCTTTTTGC CTGTACTGGG TCTCTCTGGT TAGACCAGAT
3721 CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG CTTAAGCCTC AATAAAGCTT
3781 GCCTTGAGTG CTTCAATGAT CATAATCAAG CCATATCACA TCTGTAGAGG TTTACTTGCT
3841 TTAAAAAACC TCCACACCTC CCCCTGAACC TGAAACATAA AATGAATGCA ATTGTTGTTG
3901 TTAACTTGTT TATTGCAGCT TATAATGGTT ACAAATAAAG CAATAGCATC ACAAATTTCA
3961 CAAATAAAGC ATTTTTTTCA CTGCATTCTA GTTGTGGTTT GTCCAAACTC ATCAATGTAT
4021 CTTATCATGT CTGGATCTGC GTCGACACGA AGAGACGACT GACTGACTGA CTGGAAAGAG
4081 GAAGGGCTGG AAGAGGAAGG AGCTTGATCC AGATCCCGAT CTCGATCCAG ATCCGGATCG
4141 CAGCTTGGCG TAATCATGGT CATAGCTGTT TCCTGTGTGA AATTGTTATC CGCTCACAAT
4201 TCCACACAAC ATACGAGCCG GAAGCATAAA GTGTAAAGCC TGGGGTGCCT AATGAGTGAG
4261 CTAACTCACA TTAATTGCGT TGCGCTCACT GCCCGCTTTC CAGTCGGGAA ACCTGTCGTG
4321 CCAGCTGCAT TAATGAATCG GCCAACGCGC GGGGAGAGGC GGTTTGCGTA TTGGGCGCTC
4381 TTCCGCTTCC TCGCTCACTG ACTCGCTGCG CTCGGTCGTT CGGCTGCGGC GAGCGGTATC
4441 AGCTCACTCA AAGGCGGTAA TACGGTTATC CACAGAATCA GGGGATAACG CAGGAAAGAA
4501 CATGTGAGCA AAAGGCCAGC AAAAGGCCAG GAACCGTAAA AAGGCCGCGT TGCTGGCGTT
4561 TTTCCATAGG CTCCGCCCCC CTGACGAGCA TCACAAAAAT CGACGCTCAA GTCAGAGGTG
4621 GCGAAACCCG ACAGGACTAT AAAGATACCA GGCGTTTCCC CCTGGAAGCT CCCTCGTGCG
4681 CTCTCCTGTT CCGACCCTGC CGCTTACCGG ATACCTGTCC GCCTTTCTCC CTTCGGGAAG
4741 CGTGGCGCTT TCTCATAGCT CACGCTGTAG GTATCTCAGT TCGGTGTAGG TCGTTCGCTC
4801 CAAGCTGGGC TGTGTGCACG AACCCCCCCG GTAAGACACG ACTTATCGCC ACTGGCAGCA
4861 GCCACTGGTA ACAGGATTAG CAGAGCGAGG TATGTAGGCG GTGCTACAGA GTTCTTGAAG
4921 TGGTGGCCTA ACTACGGCTA CACTAGAAGA ACAGTATTTG GTATCTGCGC TCTGCTGAAG
4981 CCAGTTACCT TCGGAAAAAG AGTTGGTAGC TCTTGATCCG GCAAACAAAC CACCGCTGGT
5041 AGCGGTGGTT TTTTTGTTTG CAAGCAGCAG ATTACGCGCA GAAAAAAAGG ATCTCAAGAA
5101 GATCCTTTGA TCTTTTCTAC GGGGTCTGAC GCTCAGTGGA ACGAAAACTC ACGTTAAGGG
5161 ATTTTGGTCA TGAGATTATC AAAAAGGATC TTCACCTAGA TCCTTTTAAA TTAAAAATGA
5221 AGTTTTAAAT CAATCTAAAG TATATATGAG TAAACTTGGT CTGACAGTTA CCAATGCTTA
5281 ATCAGTGAGG CACCTATCTC AGCGATCTGT CTATTTCGTT CATCCATAGT TGCCTGACTC
5341 CCCGTCGTTG CTAGGTTACT GTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA
5401 AACAAAAGAG TTTGTAGAAA CGCAAAAAGG CCATCCGTCA GGATGGCCTT CTGCTTAATT
5461 TGATCGGTGG CAGTTTATGG CGGGCGTCCT GCCCGCCACC CTCCGGGCCG TTGCTTCGCA
5521 ACGTTCAAAT CCGCTCCCGG CGGATTTGTC CTACTCAGGA GAGCGTTCAC CGACAAACAA
5581 CAGATAAAAC GAAAGGCCCA GTCTTTCGAC TGAGCCTTTC GTTTTATTTG ATGCCTGGCA
5641 GTTCCCTACT CTCGCATGGG TTGCGGCCGC CCGGGCCGTC GACCAATTCT CATGTTTGAC
5701 AGCTTATCAT CGAATTTCTG CCATTCATCC GCTTATTATC ACTTATTCAG GCGTAGCAAC
5761 CAGGCGTTTA AGGGCACCAA TAACTGCCTT AAAAAAATTA CGCCCCGCCC TGCCACTCAT
5821 CGCAGTACTG TTGTAATTCA TTAAGCATTC TGCCGACATG GAAGCCATCA CAAACGGCAT
5881 GATGAACCTG AATCGCCAGC GGCATCAGCA CCTTGTCGCC TTGCGTATAA TATTTGCCCA
5941 TGGTGAAAAC GGGGGCGAAG AAGTTGTCCA TATTGGCCAC GTTTAAATCA AAACTGGTGA
6001 AACTCACCCA GGGATTGGCT GAGACGAAAA ACATATTCTC AATAAACCCT TTAGGGAAAT
6061 AGGCCAGGTT TTCACCGTAA CACGCCACAT CTTGCGAATA TATGTGTAGA AACTGCCGGA
6121 AATCGTCGTG GTATTCACTC CAGAGCGATG AAAACGTTTC AGTTTGCTCA TGGAAAACGG
6181 TGTAACAAGG GTGAACACTA TCCCATATCA CCAGCTCACC GTCTTTCATT GCCATACGAA
6241 ATTCCGGATG AGCATTCATC AGGCGGGCAA GAATGTGAAT AAAGGCCGGA TAAAACTTGT
6301 GCTTATTTTT CTTTACGGTC TTTAAAAAGG CCGTAATATC CAGCTGAACG GTCTGGTTAT
6361 AGGTACATTG AGCAACTGAC TGAAATGCCT CAAAATGTTC TTTACGATGC CATTGGGATA
6421 TATCAACGGT GGTATATCCA GTGATTTTTT TCTCCATTTT AGCTTCCTTA GCTCCTGAAA
6481 ATCTCGATAA CTCAAAAAAT ACGCCCGGTA GTGATCTTAT TTCATTATGG TGAAAGTTGG
6541 AACCTCTTAC GTGCCGATCA ACGTCTCATT TTCGCCAAAA GTGACATTAA CCTATAAAAA
6601 TAGGCGTATC ACGAGGCCAG CTTGGGAAAC CATAAGACCG AGATAGAGTT GAGTGTTGTT
6661 CCAGTTTGGA ACAAGAGTCC ACTATTAAAG AACGTGGACT CCAACGTCAA AGGGCGAAAA
6721 ACCGTCTATC AGGGCGATGG CCCACTACGT GAACCATCAC CCAAATCAAG TTTTTTGGGG
6781 TCGAGGTGCC GTAAAGCACT AAATCGGAAC CCTAAAGGGA GCCCCCGATT TAGAGCTTGA
6841 CGGGGAAAGC CGGCGAACGT GGCGAGAAAG GAAGGGAAGAAAGCGAAAGGAGCGGGCGCT
6901 AAGGCGCTGG CAAGTGTAGC GGTCACGCTG CGCGTAACCA CCACACCCGC CGCGCTTAAT
6961 GCGCCGCTAC AGGGCGCGTA CTATGGTTGC TTTGACGTAT GCGGTGTGAA ATACCGCACA
7021 GATGCGTAAG GAGAAAATAC CGCATCAGGC GCCATTCGCC ATTCAGGCTG CGCAACTGTT
7081 GGGAAGGGCG ATCGGTGCGG GCCTCTTCGC TATTACGCCA GCTGGCGAAA GGGGGATGTG
7141 CTGCAAGGCG ATTAAGTTGG GTAACGCCAG GGTTTTCCCA GTCACGACGT TGTAAAACGA
7201 CGGCCAGTGA ATTGATCGAG ATCGTGATCC GGATCAAGAT CCAGATCGAA TTGGAGGCTA
7261 CAGTCAGTGG AGAGGACTTT CACTGACTGA CTGACTGCGT CTCAACCTCC TAGGGGACAT
7321 TGATTATTGA CTAGTTATTA ATAGTAATCA ATTACGGGGT CATTAGTTCA TAGCCCATAT
7381 ATGGAGTTCC GCGTTACATA ACTTACGGTA AATGGCCCGC CTGGCTGACC GCCCAACGAC
7441 CCCCGCCCAT TGACGTCAAT AATGACGTAT GTTCCCATAG TAACGCCAAT AGGGACTTTC
7501 CATTGACGTC AATGGGTGGA GTATTTACGG TAAACTGCCC ACTTGGCAGT ACATCAAGTG
7561 TATCATATGC CAAGTACGCC CCCTATTGAC GTCAATGACG GTAAATGGCC CGCCTGGCAT
7621 TATGCCCAGT ACATGACCTT ATGGGACTTT CCTACTTGGC AGTACATCTA CGTATTAGTC
7681 ATCGCTATTA CCATGGTGAT GCGGTTTTGG CAGTACATCA ATGGGCGTGG ATAGCGGTTT
7741 GACTCACGGG GATTTCCAAG TCTCCACCCC ATTGACGTCA ATGGGAGTTT GTTTTGGCAC
7801 CAAAATCAAC GGGACTTTCC AAAATGTCGT AACAACTCCG CCCCATTGAC GCAAATGGGC
7861 GGTAGGCGTG TACGGTGGGA GGTCTATATA AGCAGAGCTC GTTTAGTGAA CCGGGTCTCT
7921 CTGGTTAGAC CAGATCTGAG CCTGGGAGCT CTCTGGCTAA CTAGGGAACC CACTGCTTAA
7981 GCCTCAATAA AGCTTGCCTT GAGTGCTCAA AGTAGTGTGT GCCCGTCTGT TGTGTGACTC
8041 TGGTAACTAG AGATCCCTCA GACCCTTTTA GTCAGTGTGG AAAATCTCTA GCAGTGGCGC
8101 CCGAACAGGG ACTTGAAAGC GAAAGTAAAG CCAGAGGAGA TCTCTCGACG CAGGACTCGG
8161 CTTGCTGAAG CGCGCACGGC AAGAGGCGAG GGGCGGCGAC TGGTGAGTAC GCCAAAAATT
8221 TTGACTAGCG GAGGCTAGAA GGAGAGAGTA GGGTGCGAGA GCGTCGGTAT TAAGCGGGGG
8281 AGAATTAGAT AAATGGGAAA AAATTCGGTT AAGGCCAGGG GGAAAGAAAC AATATAAACT
8341 AAAACATATA GTTAGGGCAA GCAGGGAGCT AGAACGATTC GCAGTTAATC CTGGCCTTTT
8401 AGAGACATCA GAAGGCTGTA GACAAATACT GGGACAGCTA CAACCATCCC TTCAGACAGG
8461 ATCAGAAGAA CTTAGATCAT TATATAATAC AATAGCAGTC CTCTATTGTG TGCATCAAAG
8521 GATAGATGTA AAAGACACCA AGGAAGCCTT AGATAAGATA GAGGAAGAGC AAAACAAAAG
8581 TAAGAAAAAG GCACAGCAAG CGATCTTCAG ACCTGGAGGA GGCAGGAGGC GATATGAGGG
8641 ACAATTGGAG AAGTGAATTA TATAAATATA AAGTAGTAAA AATTGAACCA TTAGGAGTAG
8701 CACCCACCAA GGCAAAGAGA AGAGTGGTGC AGAGAGAAAA AAGAGCAGTGGGAATAGGAG
8761 CTTTGTTCCT TGGGTTCTTG GGAGCAGCAG GAAGCACTAT GGGCGCAGCG TCAATGACGC
8821 TGACGGTACA GGCCAGACAA TTATTGTCTG ATATAGTGCA GCAGCAGAAC AATTTGCTGA
8881 GGGCTATTGA GGCGCAACAG CATCTGTTGC AACTCACAGT CTGGGGCATC AAACAGCTCC
8941 AGGCAAGAAT CCTGGCTGTG GAAAGATACC TAAAGGATCA ACAGCTCCTG GGGATTTGGG
9001 GTTGCTCTGG AAAACTCATT TGCACCACTG CTGTGCCTTG GAATGCTAGT TGGAGTAATA
9061 AATCTCTGGA ACAGATTTGG AATAACATGA CCTGGATGGA GTGGGACAGA GAAATTAACA
9121 ATTACACAAG CTTAATACAC TCCTTAATTG AAGAATCGCA AAACCAGCAA GAAAAGAATG
9181 AACAAGAATT ATTGGAATTA GATAAATGGG CAAGTTTGTG GAATTGGTTT AACATAACAA
9241 ATTGGCTGTG GTATATAAAA TTATTCATAA TGATAGTAGG AGGCTTGGTA GGTTTAAGAA
9301 TAGTTTTTGC TGTACTTTCT ATAGTGAATA GAGTTAGGCA GGGATATTCA CCATTATCGT
9361 TTCAGACCCA CCTCCCAATC CCGAGGGGAC CACGCGTACA AATGGCAGTA TTCATCCACA
9421 ATTTTAAAAG AAAAGGGGGG ATTGGGGGGT ACAGTGCAGG GGAAAGAATA GTAGACATAA
9481 TAGCAACAGA CATACAAACT AAAGAATTAC AAAAACAAAT TACAAAAATT CAAAATTTTC
9541 GGGTTTATTA CAGGGACAGC AGAAATCCAC TTTGG
pLRPO FMC63 TRDC T2AW FMC63op TRGC1 (서열 식별 번호:181)
1 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
61 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA
121 CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCAGCTTGG GAAACCATAA
181 GAGCTGAAGC CAGTTACCTT CGGAAAAAGA GTTGGTAGCT CTTGATCCGG CAAACAAACC
241 ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC AAGCAGCAGA TTACGCGCAG AAAAAAAGGA
301 TCTCAAGAAG ATCCTTTGAT CTTTTCTACG GGGTCTGACG CTCAGTGGAA CGAAAACTCA
361 CGTTAAGGGA TTTTGGTCAT GAGCTTGCGC CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC
421 AGTGTTACAA CCAATTAACC AATTCTGATT AGAAAAACTC ATCGAGCATC AAATGAAACT
481 GCAATTTATT CACATCAGGA TTATCAATAC CATATTTTTG AAAAAGCCGT TTCTGTAATG
541 AAGGAGAAAA CTCACCGAGG CAGTTCCATA GGATGGCAAG ATCCTGGTAT CGGTCTGCGA
601 TTCCGACTCG TCCAACATCA ATACAACCTA TTAATTTCCC CTCGTCAAAA ATAAGGTTAT
661 CAAGTGAGAA ATCACCATGA GTGACGACTG AATCCGGTGA GAATGGCAAA AGTTTATGCA
721 TTTCTTTCCA GACTTGTTCA ACAGGCCAGC CATTACGCTC GTCATCAAAA TCACTCGCAT
781 CAACCAAACC GTTATTCATT CGTGATTGCG CCTGAGCAAG ACGAAATACG CGATCGCTGT
841 TAAAAGGACA ATTACAAACA GGAATCGAAT GCAACCGGCG CAGGAACACT GCCAGCGCAT
901 CAACAATATT TTCACCTGAA TCAGGATATT CTTCTAATAC CTGGAATGCT GTTTTTCCGG
961 GGATCGCAGT GGTGAGTAAC CATGCATCAT CAGGAGTACG GATAAAATGC TTGATGGTCG
1021 GAAGAGGCAT AAATTCCGTC AGCCAGTTTA GTCTGACCAT CTCATCTGTA ACATCATTGG
1081 CAACGCTACC TTTGCCATGT TTCAGAAACA ACTCTGGCGC ATCGGGCTTC CCATACAAGC
1141 GATAGATTGT CGCACCTGAT TGCCCGACAT TATCGCGAGC CCATTTATAC CCATATAAAT
1201 CAGCATCCAT GTTGGAATTT AATCGCGGCC TCGACGTTTC CCGTTGAATA TGGCTCATAA
1261 CACCCCTTGT ATTACTGTTT ATGTAAGCAG ACAGTTTTAT TGTTCATGAT GATATATTTT
1321 TATCTTGTGC AATGTAACAT CAGAGATTTT GAGACACAAC GTGGCTTTCC CCCCCCCCCC
1381 CATGACATTA ACCTATAAAA ATAGGCGTAT CACGAGGCCA GCTTGGGAAA CCATAAGACC
1441 GAGATAGAGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC CACTATTAAA GAACGTGGAC
1501 TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG GCCCACTACG TGAACCATCA
1561 CCCAAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC TAAATCGGAA CCCTAAAGGG
1621 AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG TGGCGAGAAA GGAAGGGAAG
1681 AAAGCGAAAG GAGCGGGCGC TAAGGCGCTG GCAAGTGTAG CGGTCACGCT GCGCGTAACC
1741 ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT ACTATGGTTG CTTTGACGTA
1801 TGCGGTGTGA AATACCGCAC AGATGCGTAA GGAGAAAATA CCGCATCAGG CGCCATTCGC
1861 CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC
1921 AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC
1981 AGTCACGACG TTGTAAAACG ACGGCCAGTG AATTGATCGA GATCGTGATC CGGATCAAGA
2041 TCCAGATCGA ATTGGAGGCT ACAGTCAGTG GAGAGGACTT TCACTGACTG ACTGACTGCG
2101 TCTCAACCTC CTAGGGGACA TTGATTATTG ACTAGTTATT AATAGTAATC AATTACGGGG
2161 TCATTAGTTC ATAGCCCATA TATGGAGTTC CGCGTTACAT AACTTACGGT AAATGGCCCG
2221 CCTGGCTGAC CGCCCAACGA CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA
2281 GTAACGCCAA TAGGGACTTT CCATTGACGT CAATGGGTGG AGTATTTACG GTAAACTGCC
2341 CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA CGTCAATGAC
2401 GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT TATGGGACTT TCCTACTTGG
2461 CAGTACATCT ACGTATTAGT CATCGCTATT ACCATGGTGA TGCGGTTTTG GCAGTACATC
2521 AATGGGCGTG GATAGCGGTT TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC
2581 AATGGGAGTT TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC
2641 GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT AAGCAGAGCT
2701 CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA
2761 ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG
2821 TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT AGTCAGTGTG
2881 GAAAATCTCT AGCAGTGGCG CCCGAACAGG GACTTGAAAG CGAAAGTAAA GCCAGAGGAG
2941 ATCTCTCGAC GCAGGACTCG GCTTGCTGAA GCGCGCACGG CAAGAGGCGA GGGGCGGCGA
3001 CTGGTGAGTA CGCCAAAAAT TTTGACTAGC GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG
3061 AGCGTCGGTA TTAAGCGGGG GAGAATTAGA TAAATGGGAA AAAATTCGGT TAAGGCCAGG
3121 GGGAAAGAAA CAATATAAAC TAAAACATAT AGTTAGGGCA AGCAGGGAGC TAGAACGATT
3181 CGCAGTTAAT CCTGGCCTTT TAGAGACATC AGAAGGCTGT AGACAAATAC TGGGACAGCT
3241 ACAACCATCC CTTCAGACAG GATCAGAAGA ACTTAGATCA TTATATAATA CAATAGCAGT
3301 CCTCTATTGT GTGCATCAAA GGATAGATGT AAAAGACACC AAGGAAGCCT TAGATAAGAT
3361 AGAGGAAGAG CAAAACAAAA GTAAGAAAAA GGCACAGCAA GCGATCTTCAGACCTGGAGG
3421 AGGCAGGAGG CGATATGAGG GACAATTGGA GAAGTGAATT ATATAAATAT AAAGTAGTAA
3481 AAATTGAACC ATTAGGAGTA GCACCCACCA AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA
3541 AAAGAGCAGT GGGAATAGGA GCTTTGTTCC TTGGGTTCTT GGGAGCAGCA GGAAGCACTA
3601 TGGGCGCAGC GTCAATGACG CTGACGGTAC AGGCCAGACA ATTATTGTCT GATATAGTGC
3661 AGCAGCAGAA CAATTTGCTG AGGGCTATTG AGGCGCAACA GCATCTGTTG CAACTCACAG
3721 TCTGGGGCAT CAAACAGCTC CAGGCAAGAA TCCTGGCTGT GGAAAGATAC CTAAAGGATC
3781 AACAGCTCCT GGGGATTTGG GGTTGCTCTG GAAAACTCAT TTGCACCACT GCTGTGCCTT
3841 GGAATGCTAG TTGGAGTAAT AAATCTCTGG AACAGATTTG GAATAACATG ACCTGGATGG
3901 AGTGGGACAG AGAAATTAAC AATTACACAA GCTTAATACA CTCCTTAATT GAAGAATCGC
3961 AAAACCAGCA AGAAAAGAAT GAACAAGAAT TATTGGAATT AGATAAATGG GCAAGTTTGT
4021 GGAATTGGTT TAACATAACA AATTGGCTGT GGTATATAAA ATTATTCATA ATGATAGTAG
4081 GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG CTGTACTTTC TATAGTGAAT AGAGTTAGGC
4141 AGGGATATTC ACCATTATCG TTTCAGACCC ACCTCCCAAT CCCGAGGGGA CCACGCGTAC
4201 AAATGGCAGT ATTCATCCAC AATTTTAAAA GAAAAGGGGG GATTGGGGGG TACAGTGCAG
4261 GGGAAAGAAT AGTAGACATA ATAGCAACAG ACATACAAAC TAAAGAATTA CAAAAACAAA
4321 TTACAAAAAT TCAAAATTTT CGGGTTTATT ACAGGGACAG CAGAAATCCA CTTTGGAAAG
4381 CTGAGCATCC GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA
4441 GAAGTTGGGG GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA
4501 CTGGGAAAGT GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA
4561 TATAAGTGCA GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA
4621 GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT
4681 GCCTTGAATT ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG
4741 TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT
4801 GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG
4861 CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA
4921 CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT
4981 CGGTTTTTGG GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA
5041 GGCGGGGCCT GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC
5101 CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG
5161 CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA
5221 GCTCAAAATG GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA
5281 AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT
5341 CCAGGCACCT CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG
5401 GGTTTTATGC GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT
5461 GGCACTTGAT GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC
5521 TCAAGCCTCA GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC
5581 CCCTCTAGAG CCGCCACCAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA
5641 CACCCAGCAT TCCTCCTGAT CCCAGACATC CAGATGACAC AGACTACATC CTCCCTGTCT
5701 GCCTCTCTGG GAGACAGAGT CACCATCAGT TGCAGGGCAA GTCAGGACAT TAGTAAATAT
5761 TTAAATTGGT ATCAGCAGAA ACCAGATGGA ACTGTTAAAC TCCTGATCTA CCATACATCA
5821 AGATTACACT CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG GGTCTGGAAC AGATTATTCT
5881 CTCACCATTA GCAACCTGGA GCAAGAAGAT ATTGCCACTT ACTTTTGCCA ACAGGGTAAT
5941 ACGCTTCCGT ACACGTTCGG AGGGGGGACT AAGTTGGAAA TAACAGGCTC CACCTCTGGA
6001 TCCGGCAAGC CCGGATCTGG CGAGGGATCC ACCAAGGGCG AGGTGAAACT GCAGGAGTCA
6061 GGACCTGGCC TGGTGGCGCC CTCACAGAGC CTGTCCGTCA CATGCACTGT CTCAGGGGTC
6121 TCATTACCCG ACTATGGTGT AAGCTGGATT CGCCAGCCTC CACGAAAGGG TCTGGAGTGG
6181 CTGGGAGTAA TATGGGGTAG TGAAACCACA TACTATAATT CAGCTCTCAA ATCCAGACTG
6241 ACCATCATCA AGGACAACTC CAAGAGCCAA GTTTTCTTAA AAATGAACAG TCTGCAAACT
6301 GATGACACAG CCATTTACTA CTGTGCCAAA CATTATTACT ACGGTGGTAG CTATGCTATG
6361 GACTACTGGG GTCAAGGAAC CTCAGTCACC GTCTCCTCAG CGGCCGCAGG TGGAGGAGGT
6421 TCTGGAGGTG GTGGATCAGG TGGTGGAGGA TCTTTAGAAA GTCAGCCTCA TACCAAACCA
6481 TCCGTTTTTG TCATGAAAAA TGGAACAAAT GTCGCTTGTC TGGTGAAGGA ATTCTACCCC
6541 AAGGATATAA GAATAAATCT CGTGTCATCC AAGAAGATAA CAGAGTTTGA TCCTGCTATT
6601 GTCATCTCTC CCAGTGGGAA GTACAATGCT GTCAAGCTTG GTAAATATGA AGATTCAAAT
6661 TCAGTGACAT GTTCAGTTCA ACACGACAAT AAAACTGTGC ACTCCACTGA CTTTGAAGTG
6721 AAGACAGATT CTACAGATCA CGTAAAACCA AAGGAAACTG AAAACACAAA GCAACCTTCA
6781 AAGAGCTGCC ATAAACCCAA AGCCATAGTT CATACCGAGA AGGTGAACAT GATGTCCCTC
6841 ACAGTGCTTG GGCTACGAAT GCTGTTTGCA AAGACTGTTG CCGTCAATTT TCTCTTGACT
6901 GCCAAGTTAT TTTTCTTGGG GTCAGGCGAG GGCAGAGGAA GTCTGCTAAC ATGCGGTGAC
6961 GTCGAGGAGA ATCCTGGACC TATGCTACTA CTTGTGACCT CACTATTGTT ATGCGAACTC
7021 CCTCATCCCG CATTCTTGCT GATTCCAGAC ATTCAGATGA CTCAAACAAC TTCCAGCCTC
7081 TCCGCCTCAC TCGGCGACCG CGTAACAATA AGCTGTCGGG CCTCGCAAGA TATTAGTAAG
7141 TACCTGAATT GGTATCAGCA AAAACCCGAT GGTACAGTCA AGCTTCTGAT CTACCATACC
7201 AGTCGTCTGC ACAGCGGTGT CCCCAGCAGG TTCAGCGGCT CAGGATCTGG TACCGATTAT
7261 TCACTGACGA TTTCCAACCT TGAGCAGGAG GACATCGCCA CCTACTTCTG CCAGCAGGGT
7321 AATACTCTGC CGTACACATT CGGGGGCGGT ACCAAGCTCG AGATCACGGG TTCAACAAGC
7381 GGTTCTGGCA AGCCAGGCAG CGGCGAGGGG AGTACAAAGG GGGAGGTGAA GTTGCAGGAA
7441 AGTGGCCCTG GATTGGTGGC CCCGAGCCAG AGTCTGTCTG TCACCTGCAC AGTTTCCGGA
7501 GTAAGTCTGC CTGATTACGG AGTGTCCTGG ATCAGACAGC CACCTCGAAA GGGCTTGGAG
7561 TGGCTTGGGG TCATTTGGGG CAGTGAAACC ACATACTACA ACAGCGCTCT TAAGTCCAGG
7621 CTCACTATCA TCAAGGACAA TTCAAAGAGC CAAGTATTCT TGAAAATGAA TTCCCTGCAG
7681 ACTGATGACA CCGCTATTTA TTATTGCGCT AAACATTATT ACTATGGAGG TTCTTATGCC
7741 ATGGACTACT GGGGGCAGGG TACCTCTGTG ACAGTGAGTT CAGCTGCAGC TGGAGGTGGA
7801 GGTAGCGGAG GCGGTGGTAG TGGAGGGGGT GGTTCTCTGG AAGATAAACA ACTTGATGCA
7861 GATGTTTCCC CCAAGCCCAC TATTTTTCTT CCTTCAATTG CTGAAACAAA GCTCCAGAAG
7921 GCTGGAACAT ACCTTTGTCT TCTTGAGAAA TTTTTCCCTG ATGTTATTAA GATACATTGG
7981 CAAGAAAAGA AGAGCAACAC GATTCTGGGA TCCCAGGAGG GGAACACCAT GAAGACTAAC
8041 GACACATACA TGAAATTTAG CTGGTTAACG GTGCCAGAAA AGTCACTGGA CAAAGAACAC
8101 AGATGTATCG TCAGACATGA GAATAATAAA AACGGAGTTG ATCAAGAAAT TATCTTTCCT
8161 CCAATAAAGA CAGATGTCAT CACAATGGAT CCCAAAGACA ATTGTTCAAA AGATGCAAAT
8221 GATACACTAC TGCTGCAGCT CACAAACACC TCTGCATATT ACATGTACCT CCTCCTGCTC
8281 CTCAAGAGTG TGGTCTATTT TGCCATCATC ACCTGCTGTC TGCTTAGAAG AACGGCTTTC
8341 TGCTGCAATG GAGAGAAATC ATAATGAGAT ATCGAGCATC TTACCGCCAT TTATACCCAT
8401 ATTTGTTCTG TTTTTCTTGA TTTGGGTATA CATTTAAATG TTAATAAAAC AAAATGGTGG
8461 GGCAATCATT TACATTTTTA GGGATATGTA ATTACTAGTT CAGGTGTATT GCCACAAGAC
8521 AAACATGTTA AGAAACTTTC CCGTTATTTA CGCTCTGTTC CTGTTAATCA ACCTCTGGAT
8581 TACAAAATTT GTGAAAGATT GACTGATATT CTTAACTATG TTGCTCCTTT TACGCTGTGT
8641 GGATATGCTG CTTTATAGCC TCTGTATCTA GCTATTGCTT CCCGTACGGC TTTCGTTTTC
8701 TCCTCCTTGT ATAAATCCTG GTTGCTGTCT CTTTTAGAGG AGTTGTGGCC CGTTGTCCGT
8761 CAACGTGGCG TGGTGTGCTC TGTGTTTGCT GACGCAACCC CCACTGGCTG GGGCATTGCC
8821 ACCACCTGTC AACTCCTTTC TGGGACTTTC GCTTTCCCCC TCCCGATCGC CACGGCAGAA
8881 CTCATCGCCG CCTGCCTTGC CCGCTGCTGG ACAGGGGCTA GGTTGCTGGG CACTGATAAT
8941 TCCGTGGTGT TGTCAGTACT GGTACCTTTA AGACCAATGA CTTACAAGGC AGCTGTAGAT
9001 CTTAGCCACT TTTTAAAAGA AAAGGGGGGA CTGGAAGGGC TAATTCACTC CCAAAGAAGA
9061 CAAGATCTGC TTTTTGCCTG TACTGGGTCT CTCTGGTTAG ACCAGATCTG AGCCTGGGAG
9121 CTCTCTGGCT AACTAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTT
9181 CAATGATCAT AATCAAGCCA TATCACATCT GTAGAGGTTT ACTTGCTTTA AAAAACCTCC
9241 ACACCTCCCC CTGAACCTGA AACATAAAAT GAATGCAATT GTTGTTGTTA ACTTGTTTAT
9301 TGCAGCTTAT AATGGTTACA AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT
9361 TTTTTCACTG CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG
9421 GATCTGCGTC GACACGAAGA GACGACTGAC TGACTGACTG GAAAGAGGAA GGGCTGGAAG
9481 AGGAAGGAGC TTGATCCAGA TCCCGATCTC GATCCAGATC CGGATCGCAG CTTGGCGTAA
9541 TCATGGTCAT AGCTGTTTCC TGTGTGAAAT TGTTATCCGC TCACAATTCC ACACAACATA
9601 CGAGCCGGAA GCATAAAGTG TAAAGCCTGG GGTGCCTAAT GAGTGAGCTA ACTCACATTA
9661 ATTGCGTTGC GCTCACTGCC CGCTTTCCAG TCGGGAAACC TGTCGTGCCA GCTGCATTAA
9721 TGAATCGGCC AACGCGCGGG GAGAGGCGGT TTGCGTATTG GGCGCTCTTC CGCTTCCTCG
9781 CTCACTGACT CGCTGCGCTC GGTCGTTCGG CTGCGGCGAG CGGTATCAGC TCACTCAAAG
9841 GCGGTAATAC GGTTATCCAC AGAATCAGGG GATAACGCAG GAAAGAACAT GTGAGCAAAA
9901 GGCCAGCAAA AGGCCAGGAA CCGTAAAAAG GCCGCGTTGC TGGCGTTTTT CCATAGGCTC
9961 CGCCCCCCTG ACGAGCATCA CAAAAATCGA CGCTCAAGTC AGAGGTGGCG AAACCCGACA
10021 GGACTATAAA GATACCAGGC GTTTCCCCCT GGAAGCTCCC TCGTGCGCTC TCCTGTTCCG
10081 ACCCTGCCGC TTACCGGATA CCTGTCCGCC TTTCTCCCTT CGGGAAGCGT GGCGCTTTCT
10141 CATAGCTCAC GCTGTAGGTA TCTCAGTTCG GTGTAGGTCG TTCGCTCCAA GCTGGGCTGT
10201 GTGCACGAAC CCCCCGTTCA GCCCGACCGC TGCGCCTTAT CCGGTAACTA TCGTCTTGAG
10261 TCCAACCCGG TAAGACACGA CTTATCGCCA CTGGCAGCAG CCACTGGTAA CAGGATTAGC
10321 AGAGCGAGGT ATGTAGGCGG TGCTACAGAG TTCTTGAAGT GGTGGCCTAA CTACGGCTAC
10381 ACTAGAAGAA CAGTATTTGG TATCTGCGCT CTGCTGAAGC CAGTTACCTT CGGAAAAAGA
10441 GTTGGTAGCT CTTGATCCGG CAAACAAACC ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC
10501 AAGCAGCAGA TTACGCGCAG AAAAAAAGGA TCTCAAGAAG ATCCTTTGAT CTTTTCTACG
10561 GGGTCTGACG CTCAGTGGAA CGAAAACTCA CGTTAAGGGA TTTTGGTCAT GAGATTATCA
10621 AAAAGGATCT TCACCTAGAT CCTTTTAAAT TAAAAATGAA GTTTTAAATC AATCTAAAGT
10681 ATA
pLKaUS FMC63 TRDC P2AW FMC63op TRGC1 (서열 식별 번호:182)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
361 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
421 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
481 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
541 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
601 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
661 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
721 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
781 GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG
841 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG
901 GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA
961 CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG
1021 AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT
1081 TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT
1141 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG
1201 TTAATTAACT TGCGCCGTCC CGTCAAGTCA GCGTAATGCT CTGCCAGTGT TACAACCAAT
1261 TAACCAATTC TGATTAGAAA AACTCATCGA GCATCAAATG AAACTGCAAT TTATTCACAT
1321 CAGGATTATC AATACCATAT TTTTGAAAAA GCCGTTTCTG TAATGAAGGA GAAAACTCAC
1381 CGAGGCAGTT CCATAGGATG GCAAGATCCT GGTATCGGTC TGCGATTCCG ACTCGTCCAA
1441 CATCAATACA ACCTATTAAT TTCCCCTCGT CAAAAATAAG GTTATCAAGT GAGAAATCAC
1501 CATGAGTGAC GACTGAATCC GGTGAGAATG GCAAAAGTTT ATGCATTTCT TTCCAGACTT
1561 GTTCAACAGG CCAGCCATTA CGCTCGTCAT CAAAATCACT CGCATCAACC AAACCGTTAT
1621 TCATTCGTGA TTGCGCCTGA GCAAGACGAA ATACGCGATC GCTGTTAAAA GGACAATTAC
1681 AAACAGGAAT CGAATGCAAC CGGCGCAGGA ACACTGCCAG CGCATCAACA ATATTTTCAC
1741 CTGAATCAGG ATATTCTTCT AATACCTGGA ATGCTGTTTT TCCGGGGATC GCAGTGGTGA
1801 GTAACCATGC ATCATCAGGA GTACGGATAA AATGCTTGAT GGTCGGAAGA GGCATAAATT
1861 CCGTCAGCCA GTTTAGTCTG ACCATCTCAT CTGTAACATC ATTGGCAACG CTACCTTTGC
1921 CATGTTTCAG AAACAACTCT GGCGCATCGG GCTTCCCATA CAAGCGATAG ATTGTCGCAC
1981 CTGATTGCCC GACATTATCG CGAGCCCATT TATACCCATA TAAATCAGCA TCCATGTTGG
2041 AATTTAATCG CGGCCTCGAC GTTTCCCGTT GAATATGGCT CATAACACCC CTTGTATTAC
2101 TGTTTATGTA AGCAGACAGT TTTATTGTTC ATGATGATAT ATTTTTATCT TGTGCAATGT
2161 AACATCAGAG ATTTTGAGAC ACAACGTGGC TTTCCCCCCC CCCCCCATGA CATTAACCTA
2221 TAAAAATAGG CGTATCACGA GGCCAGCTTG GGAAACCATA AGACCGAGAT AGAGTTGAGT
2281 GTTGTTCCAG TTTGGAACAA GAGTCCACTA TTAAAGAACG TGGACTCCAA CGTCAAAGGG
2341 CGAAAAACCG TCTATCAGGG CGATGGCCCA CTACGTGAAC CATCACCCAA ATCAAGTTTT
2401 TTGGGGTCGA GGTGCCGTAA AGCACTAAAT CGGAACCCTA AAGGGAGCCC CCGATTTAGA
2461 GCTTGACGGG GAAAGCCGGC GAACGTGGCG AGAAAGGAAGGGAAGAAAGCGAAAGGAGCG
2521 GGCGCTAAGG CGCTGGCAAG TGTAGCGGTC ACGCTGCGCG TAACCACCAC ACCCGCCGCG
2581 CTTAATGCGC CGCTACAGGG CGCGTACTAT GGTTGCTTTG ACGTATGCGG TGTGAAATAC
2641 CGCACAGATG CGTAAGGAGA AAATACATCG TGATCCGGAT CAAGATCCAG ATCGAATTGG
2701 AGGCTACAGT CAGTGGAGAG GACTTTCACT GACTGACTGA CTGCGTCTCA ACCTCCTAGG
2761 GGACATTGAT TATTGACTAG TTATTAATAG TAATCAATTA CGGGGTCATT AGTTCATAGC
2821 CCATATATGG AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG CTGACCGCCC
2881 AACGACCCCC GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC GCCAATAGGG
2941 ACTTTCCATT GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT GGCAGTACAT
3001 CAAGTGTATC ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC
3061 TGGCATTATG CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA
3121 TTAGTCATCG CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG
3181 CGGTTTGACT CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT
3241 TGGCACCAAA ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA
3301 ATGGGCGGTA GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT AGTGAACCGG
3361 GTCTCTCTGG TTAGACCAGA TCTGAGCCTG GGAGCTCTCT GGCTAACTAG GGAACCCACT
3421 GCTTAAGCCT CAATAAAGCT TGCCTTGAGT GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG
3481 TGACTCTGGT AACTAGAGAT CCCTCAGACC CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG
3541 TGGCGCCCGA ACAGGGACTT GAAAGCGAAA GTAAAGCCAG AGGAGATCTC TCGACGCAGG
3601 ACTCGGCTTG CTGAAGCGCG CACGGCAAGA GGCGAGGGGC GGCGACTGGT GAGTACGCCA
3661 AAAATTTTGA CTAGCGGAGG CTAGAAGGAG AGAGTAGGGT GCGAGAGCGT CGGTATTAAG
3721 CGGGGGAGAA TTAGATAAAT GGGAAAAAAT TCGGTTAAGG CCAGGGGGAA AGAAACAATA
3781 TAAACTAAAA CATATAGTTA GGGCAAGCAG GGAGCTAGAA CGATTCGCAG TTAATCCTGG
3841 CCTTTTAGAG ACATCAGAAG GCTGTAGACA AATACTGGGA CAGCTACAAC CATCCCTTCA
3901 GACAGGATCA GAAGAACTTA GATCATTATA TAATACAATA GCAGTCCTCT ATTGTGTGCA
3961 TCAAAGGATA GATGTAAAAG ACACCAAGGA AGCCTTAGAT AAGATAGAGG AAGAGCAAAA
4021 CAAAAGTAAG AAAAAGGCAC AGCAAGCGAT CTTCAGACCT GGAGGAGGCA GGAGGCGATA
4081 TGAGGGACAA TTGGAGAAGT GAATTATATA AATATAAAGT AGTAAAAATT GAACCATTAG
4141 GAGTAGCACC CACCAAGGCA AAGAGAAGAG TGGTGCAGAG AGAAAAAAGAGCAGTGGGAA
4201 TAGGAGCTTT GTTCCTTGGG TTCTTGGGAG CAGCAGGAAG CACTATGGGC GCAGCGTCAA
4261 TGACGCTGAC GGTACAGGCC AGACAATTAT TGTCTGATAT AGTGCAGCAG CAGAACAATT
4321 TGCTGAGGGC TATTGAGGCG CAACAGCATC TGTTGCAACT CACAGTCTGG GGCATCAAAC
4381 AGCTCCAGGC AAGAATCCTG GCTGTGGAAA GATACCTAAA GGATCAACAG CTCCTGGGGA
4441 TTTGGGGTTG CTCTGGAAAA CTCATTTGCA CCACTGCTGT GCCTTGGAAT GCTAGTTGGA
4501 GTAATAAATC TCTGGAACAG ATTTGGAATA ACATGACCTG GATGGAGTGG GACAGAGAAA
4561 TTAACAATTA CACAAGCTTA ATACACTCCT TAATTGAAGA ATCGCAAAAC CAGCAAGAAA
4621 AGAATGAACA AGAATTATTG GAATTAGATA AATGGGCAAG TTTGTGGAAT TGGTTTAACA
4681 TAACAAATTG GCTGTGGTAT ATAAAATTAT TCATAATGAT AGTAGGAGGC TTGGTAGGTT
4741 TAAGAATAGT TTTTGCTGTA CTTTCTATAG TGAATAGAGT TAGGCAGGGA TATTCACCAT
4801 TATCGTTTCA GACCCACCTC CCAATCCCGA GGGGACCACG CGTACAAATG GCAGTATTCA
4861 TCCACAATTT TAAAAGAAAA GGGGGGATTG GGGGGTACAG TGCAGGGGAA AGAATAGTAG
4921 ACATAATAGC AACAGACATA CAAACTAAAG AATTACAAAA ACAAATTACA AAAATTCAAA
4981 ATTTTCGGGT TTATTACAGG GACAGCAGAA ATCCACTTTG GAAAGCTGAG CATCCGGCTC
5041 CGGTGCCCGT CAGTGGGCAG AGCGCACATC GCCCACAGTC CCCGAGAAGT TGGGGGGAGG
5101 GGTCGGCAAT TGAACCGGTG CCTAGAGAAG GTGGCGCGGG GTAAACTGGG AAAGTGATGT
5161 CGTGTACTGG CTCCGCCTTT TTCCCGAGGG TGGGGGAGAA CCGTATATAA GTGCAGTAGT
5221 CGCCGTGAAC GTTCTTTTTC GCAACGGGTT TGCCGCCAGA ACACAGGTAA GTGCCGTGTG
5281 TGGTTCCCGC GGGCCTGGCC TCTTTACGGG TTATGGCCCT TGCGTGCCTT GAATTACTTC
5341 CACGCCCCTG GCTGCAGTAC GTGATTCTTG ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG
5401 AGAGTTCGAG GCCTTGCGCT TAAGGAGCCC CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC
5461 CTGGGCGCTG GGGCCGCCGC GTGCGAATCT GGTGGCACCT TCGCGCCTGT CTCGCTGCTT
5521 TCGATAAGTC TCTAGCCATT TAAAATTTTT GATGACCTGC TGCGACGCTT TTTTTCTGGC
5581 AAGATAGTCT TGTAAATGCG GGCCAAGATC TGCACACTGG TATTTCGGTT TTTGGGGCCG
5641 CGGGCGGCGA CGGGGCCCGT GCGTCCCAGC GCACATGTTC GGCGAGGCGG GGCCTGCGAG
5701 CGCGGCCACC GAGAATCGGA CGGGGGTAGT CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG
5761 GCCTCGCGCC GCCGTGTATC GCCCCGCCCT GGGCGGCAAG GCTGGCCCGG TCGGCACCAG
5821 TTGCGTGAGC GGAAAGATGG CCGCTTCCCG GCCCTGCTGC AGGGAGCTCA AAATGGAGGA
5881 CGCGGCGCTC GGGAGAGCGG GCGGGTGAGT CACCCACACA AAGGAAAAGG GCCTTTCCGT
5941 CCTCAGCCGT CGCTTCATGT GACTCCACGG AGTACCGGGC GCCGTCCAGG CACCTCGATT
6001 AGTTCTCGAG CTTTTGGAGT ACGTCGTCTT TAGGTTGGGG GGAGGGGTTT TATGCGATGG
6061 AGTTTCCCCA CACTGAGTGG GTGGAGACTG AAGTTAGGCC AGCTTGGCAC TTGATGTAAT
6121 TCTCCTTGGA ATTTGCCCTT TTTGAGTTTG GATCTTGGTT CATTCTCAAG CCTCAGACAG
6181 TGGTTCAAAG TTTTTTTCTT CCATTTCAGG TGTCGTGAAA ACTACCCCTC AGAGCCGCCA
6241 CCATGCTTCT CCTGGTGACA AGCCTTCTGC TCTGTGAGTT ACCACACCCA GCATTCCTCC
6301 TGATCCCAGA CATCCAGATG ACACAGACTA CATCCTCCCT GTCTGCCTCT CTGGGAGACA
6361 GAGTCACCAT CAGTTGCAGG GCAAGTCAGG ACATTAGTAA ATATTTAAAT TGGTATCAGC
6421 AGAAACCAGA TGGAACTGTT AAACTCCTGA TCTACCATAC ATCAAGATTA CACTCAGGAG
6481 TCCCATCAAG GTTCAGTGGC AGTGGGTCTG GAACAGATTA TTCTCTCACC ATTAGCAACC
6541 TGGAGCAAGA AGATATTGCC ACTTACTTTT GCCAACAGGG TAATACGCTT CCGTACACGT
6601 TCGGAGGGGG GACTAAGTTG GAAATAACAG GCTCCACCTC TGGATCCGGC AAGCCCGGAT
6661 CTGGCGAGGG ATCCACCAAG GGCGAGGTGA AACTGCAGGA GTCAGGACCT GGCCTGGTGG
6721 CGCCCTCACA GAGCCTGTCC GTCACATGCA CTGTCTCAGG GGTCTCATTA CCCGACTATG
6781 GTGTAAGCTG GATTCGCCAG CCTCCACGAA AGGGTCTGGA GTGGCTGGGA GTAATATGGG
6841 GTAGTGAAAC CACATACTAT AATTCAGCTC TCAAATCCAG ACTGACCATC ATCAAGGACA
6901 ACTCCAAGAG CCAAGTTTTC TTAAAAATGA ACAGTCTGCA AACTGATGAC ACAGCCATTT
6961 ACTACTGTGC CAAACATTAT TACTACGGTG GTAGCTATGC TATGGACTAC TGGGGTCAAG
7021 GAACCTCAGT CACCGTCTCC TCAGCGGCCG CAGGTGGAGG AGGTTCTGGA GGTGGTGGAT
7081 CAGGTGGTGG AGGATCTTTA GAAAGTCAGC CTCATACCAA ACCATCCGTT TTTGTCATGA
7141 AAAATGGAAC AAATGTCGCT TGTCTGGTGA AGGAATTCTA CCCCAAGGAT ATAAGAATAA
7201 ATCTCGTGTC ATCCAAGAAG ATAACAGAGT TTGATCCTGC TATTGTCATC TCTCCCAGTG
7261 GGAAGTACAA TGCTGTCAAG CTTGGTAAAT ATGAAGATTC AAATTCAGTG ACATGTTCAG
7321 TTCAACACGA CAATAAAACT GTGCACTCCA CTGACTTTGA AGTGAAGACA GATTCTACAG
7381 ATCACGTAAA ACCAAAGGAA ACTGAAAACA CAAAGCAACC TTCAAAGAGC TGCCATAAAC
7441 CCAAAGCCAT AGTTCATACC GAGAAGGTGA ACATGATGTC CCTCACAGTG CTTGGGCTAC
7501 GAATGCTGTT TGCAAAGACT GTTGCCGTCA ATTTTCTCTT GACTGCCAAG TTATTTTTCT
7561 TGGGGTCAGG CGCTACTAAC TTCAGCCTGC TGAAGCAGGC TGGAGACGTG GAGGAGAACC
7621 CTGGACCTAT GCTACTACTT GTGACCTCAC TATTGTTATG CGAACTCCCT CATCCCGCAT
7681 TCTTGCTGAT TCCAGACATT CAGATGACTC AAACAACTTC CAGCCTCTCC GCCTCACTCG
7741 GCGACCGCGT AACAATAAGC TGTCGGGCCT CGCAAGATAT TAGTAAGTAC CTGAATTGGT
7801 ATCAGCAAAA ACCCGATGGT ACAGTCAAGC TTCTGATCTA CCATACCAGT CGTCTGCACA
7861 GCGGTGTCCC CAGCAGGTTC AGCGGCTCAG GATCTGGTAC CGATTATTCA CTGACGATTT
7921 CCAACCTTGA GCAaGAGGAC ATCGCCACCT ACTTCTGCCA GCAGGGTAAT ACTCTGCCGT
7981 ACACATTCGG GGGCGGTACC AAGCTCGAGA TCACGGGTTC AACAAGCGGT TCTGGCAAGC
8041 CAGGCAGCGG CGAGGGGAGT ACAAAGGGGG AGGTGAAGTT GCAGGAAAGT GGCCCTGGAT
8101 TGGTGGCCCC GAGCCAGAGT CTGTCTGTCA CCTGCACAGT TTCCGGAGTA AGTCTGCCTG
8161 ATTACGGAGT GTCCTGGATC AGACAGCCAC CTCGAAAGGG CTTGGAGTGG CTTGGGGTCA
8221 TTTGGGGCAG TGAAACCACA TACTACAACA GCGCTCTTAA GTCCAGGCTC ACTATCATCA
8281 AGGACAATTC AAAGAGCCAA GTATTCTTGA AAATGAATTC CCTGCAGACT GATGACACCG
8341 CTATTTATTA TTGCGCTAAA CATTATTACT ATGGAGGTTC TTATGCCATG GACTACTGGG
8401 GGCAGGGTAC CTCTGTGACA GTGAGTTCAG CTGCAGCTGG AGGTGGAGGT AGCGGAGGCG
8461 GTGGTAGTGG AGGGGGTGGT TCTCTGGAAG ATAAACAACT TGATGCAGAT GTTTCCCCCA
8521 AGCCCACTAT TTTTCTTCCT TCAATTGCTG AAACAAAGCT CCAGAAGGCT GGAACATACC
8581 TTTGTCTTCT TGAGAAATTT TTCCCTGATG TTATTAAGAT ACATTGGCAA GAAAAGAAGA
8641 GCAACACGAT TCTGGGATCC CAGGAGGGGA ACACCATGAA GACTAACGAC ACATACATGA
8701 AATTTAGCTG GTTAACGGTG CCAGAAAAGT CACTGGACAA AGAACACAGA TGTATCGTCA
8761 GACATGAGAA TAATAAAAAC GGAGTTGATC AAGAAATTAT CTTTCCTCCA ATAAAGACAG
8821 ATGTCATCAC AATGGATCCC AAAGACAATT GTTCAAAAGA TGCAAATGAT ACACTACTGC
8881 TGCAGCTCAC AAACACCTCT GCATATTACA TGTACCTCCT CCTGCTCCTC AAGAGTGTGG
8941 TCTATTTTGC CATCATCACC TGCTGTCTGC TTAGAAGAAC GGCTTTCTGC TGCAATGGAG
9001 AGAAATCATA ATGAGATATC GAGCATCTTA CCGCCATTTA TACCCATATT TGTTCTGTTT
9061 TTCTTGATTT GGGTATACAT TTAAATGTTA ATAAAACAAA ATGGTGGGGC AATCATTTAC
9121 ATTTTTAGGG ATATGTAATT ACTAGTTCAG GTGTATTGCC ACAAGACAAA CATGTTAAGA
9181 AACTTTCCCG TTATTTACGC TCTGTTCCTG TTAATCAACC TCTGGATTAC AAAATTTGTG
9241 AAAGATTGAC TGATATTCTT AACTATGTTG CTCCTTTTAC GCTGTGTGGA TATGCTGCTT
9301 TATAGCCTCT GTATCTAGCT ATTGCTTCCC GTACGGCTTT CGTTTTCTCC TCCTTGTATA
9361 AATCCTGGTT GCTGTCTCTT TTAGAGGAGT TGTGGCCCGT TGTCCGTCAA CGTGGCGTGG
9421 TGTGCTCTGT GTTTGCTGAC GCAACCCCCA CTGGCTGGGG CATTGCCACC ACCTGTCAAC
9481 TCCTTTCTGG GACTTTCGCT TTCCCCCTCC CGATCGCCAC GGCAGAACTC ATCGCCGCCT
9541 GCCTTGCCCG CTGCTGGACA GGGGCTAGGT TGCTGGGCAC TGATAATTCC GTGGTGTTGT
9601 CAGTACTGGT ACCTTTAAGA CCAATGACTT ACAAGGCAGC TGTAGATCTT AGCCACTTTT
9661 TAAAAGAAAA GGGGGGACTG GAAGGGCTAA TTCACTCCCA AAGAAGACAA GATCTGCTTT
9721 TTGCCTGTAC TGGGTCTCTC TGGTTAGACC AGATCTGAGC CTGGGAGCTC TCTGGCTAAC
9781 TAGGGAACCC ACTGCTTAAG CCTCAATAAA GCTTGCCTTG AGTGCTTCAA GTAGTGTGTG
9841 CCCGTCTGTT GTGTGACTCT GGTAACTAGA GATCCCTCAG ACCCTTTTAG TCAGTGTGGA
9901 AAATCTCTAG CA
pLRPC TRDC T2AW FMC63op TRGC1 (서열 식별 번호:183)
1 AAAGCTGAGC ATCCGGCTCC GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC
61 CCGAGAAGTT GGGGGGAGGG GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG
121 TAAACTGGGA AAGTGATGTC GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC
181 CGTATATAAG TGCAGTAGTC GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA
241 CACAGGTAAG TGCCGTGTGT GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT
301 GCGTGCCTTG AATTACTTCC ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT
361 CGGGTTGGAA GTGGGTGGGA GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT
421 GCTTGAGTTG AGGCCTGGCC TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT
481 CGCGCCTGTC TCGCTGCTTT CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT
541 GCGACGCTTT TTTTCTGGCA AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT
601 ATTTCGGTTT TTGGGGCCGC GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG
661 GCGAGGCGGG GCCTGCGAGC GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC
721 CGGCCTGCTC TGGTGCCTGG CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG
781 CTGGCCCGGT CGGCACCAGT TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA
841 GGGAGCTCAA AATGGAGGAC GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA
901 AGGAAAAGGG CCTTTCCGTC CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG
961 CCGTCCAGGC ACCTCGATTA GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG
1021 GAGGGGTTTT ATGCGATGGA GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA
1081 GCTTGGCACT TGATGTAATT CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC
1141 ATTCTCAAGC CTCAGACAGT GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA
1201 CTACCCCTCT AGAGCCGCCA CCATGCTTCT CCTGGTGACA AGCCTTCTGC TCTGTGAGTT
1261 ACCACACCCA GCATTCCTCC TGATCCCAAG TCAGCCTCAT ACCAAACCAT CCGTTTTTGT
1321 CATGAAAAAT GGAACAAATG TCGCTTGTCT GGTGAAGGAA TTCTACCCCA AGGATATAAG
1381 AATAAATCTC GTGTCATCCA AGAAGATAAC AGAGTTTGAT CCTGCTATTG TCATCTCTCC
1441 CAGTGGGAAG TACAATGCTG TCAAGCTTGG TAAATATGAA GATTCAAATT CAGTGACATG
1501 TTCAGTTCAA CACGACAATA AAACTGTGCA CTCCACTGAC TTTGAAGTGA AGACAGATTC
1561 TACAGATCAC GTAAAACCAA AGGAAACTGA AAACACAAAG CAACCTTCAA AGAGCTGCCA
1621 TAAACCCAAA GCCATAGTTC ATACCGAGAA GGTGAACATG ATGTCCCTCA CAGTGCTTGG
1681 GCTACGAATG CTGTTTGCAA AGACTGTTGC CGTCAATTTT CTCTTGACTG CCAAGTTATT
1741 TTTCTTGGGG TCAGGCGAGG GCAGAGGAAG TCTGCTAACA TGCGGTGACG TCGAGGAGAA
1801 TCCTGGACCT ATGCTACTAC TTGTGACCTC ACTATTGTTA TGCGAACTCC CTCATCCCGC
1861 ATTCTTGCTG ATTCCAGACA TTCAGATGAC TCAAACAACT TCCAGCCTCT CCGCCTCACT
1921 CGGCGACCGC GTAACAATAA GCTGTCGGGC CTCGCAAGAT ATTAGTAAGT ACCTGAATTG
1981 GTATCAGCAA AAACCCGATG GTACAGTCAA GCTTCTGATC TACCATACCA GTCGTCTGCA
2041 CAGCGGTGTC CCCAGCAGGT TCAGCGGCTC AGGATCTGGT ACCGATTATT CACTGACGAT
2101 TTCCAACCTT GAGCAGGAGG ACATCGCCAC CTACTTCTGC CAGCAGGGTA ATACTCTGCC
2161 GTACACATTC GGGGGCGGTA CCAAGCTCGA GATCACGGGT TCAACAAGCG GTTCTGGCAA
2221 GCCAGGCAGC GGCGAGGGGA GTACAAAGGG GGAGGTGAAG TTGCAGGAAA GTGGCCCTGG
2281 ATTGGTGGCC CCGAGCCAGA GTCTGTCTGT CACCTGCACA GTTTCCGGAG TAAGTCTGCC
2341 TGATTACGGA GTGTCCTGGA TCAGACAGCC ACCTCGAAAG GGCTTGGAGT GGCTTGGGGT
2401 CATTTGGGGC AGTGAAACCA CATACTACAA CAGCGCTCTT AAGTCCAGGC TCACTATCAT
2461 CAAGGACAAT TCAAAGAGCC AAGTATTCTT GAAAATGAAT TCCCTGCAGA CTGATGACAC
2521 CGCTATTTAT TATTGCGCTA AACATTATTA CTATGGAGGT TCTTATGCCA TGGACTACTG
2581 GGGGCAGGGT ACCTCTGTGA CAGTGAGTTC AGCTGCAGCT GGAGGTGGAG GTAGCGGAGG
2641 CGGTGGTAGT GGAGGGGGTG GTTCTCTGGA AGATAAACAA CTTGATGCAG ATGTTTCCCC
2701 CAAGCCCACT ATTTTTCTTC CTTCAATTGC TGAAACAAAG CTCCAGAAGG CTGGAACATA
2761 CCTTTGTCTT CTTGAGAAAT TTTTCCCTGA TGTTATTAAG ATACATTGGC AAGAAAAGAA
2821 GAGCAACACG ATTCTGGGAT CCCAGGAGGG GAACACCATG AAGACTAACG ACACATACAT
2881 GAAATTTAGC TGGTTAACGG TGCCAGAAAA GTCACTGGAC AAAGAACACA GATGTATCGT
2941 CAGACATGAG AATAATAAAA ACGGAGTTGA TCAAGAAATT ATCTTTCCTC CAATAAAGAC
3001 AGATGTCATC ACAATGGATC CCAAAGACAA TTGTTCAAAA GATGCAAATG ATACACTACT
3061 GCTGCAGCTC ACAAACACCT CTGCATATTA CATGTACCTC CTCCTGCTCC TCAAGAGTGT
3121 GGTCTATTTT GCCATCATCA CCTGCTGTCT GCTTAGAAGA ACGGCTTTCT GCTGCAATGG
3181 AGAGAAATCA TAATGAGATA TCGAGCATCT TACCGCCATT TATACCCATA TTTGTTCTGT
3241 TTTTCTTGAT TTGGGTATAC ATTTAAATGT TAATAAAACA AAATGGTGGG GCAATCATTT
3301 ACATTTTTAG GGATATGTAA TTACTAGTTC AGGTGTATTG CCACAAGACA AACATGTTAA
3361 GAAACTTTCC CGTTATTTAC GCTCTGTTCC TGTTAATCAA CCTCTGGATT ACAAAATTTG
3421 TGAAAGATTG ACTGATATTC TTAACTATGT TGCTCCTTTT ACGCTGTGTG GATATGCTGC
3481 TTTATAGCCT CTGTATCTAG CTATTGCTTC CCGTACGGCT TTCGTTTTCT CCTCCTTGTA
3541 TAAATCCTGG TTGCTGTCTC TTTTAGAGGA GTTGTGGCCC GTTGTCCGTC AACGTGGCGT
3601 GGTGTGCTCT GTGTTTGCTG ACGCAACCCC CACTGGCTGG GGCATTGCCA CCACCTGTCA
3661 ACTCCTTTCT GGGACTTTCG CTTTCCCCCT CCCGATCGCC ACGGCAGAAC TCATCGCCGC
3721 CTGCCTTGCC CGCTGCTGGA CAGGGGCTAG GTTGCTGGGC ACTGATAATT CCGTGGTGTT
3781 GTCAGTACTG GTACCTTTAA GACCAATGAC TTACAAGGCA GCTGTAGATC TTAGCCACTT
3841 TTTAAAAGAA AAGGGGGGAC TGGAAGGGCT AATTCACTCC CAAAGAAGAC AAGATCTGCT
3901 TTTTGCCTGT ACTGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA
3961 ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTTC AATGATCATA
4021 ATCAAGCCAT ATCACATCTG TAGAGGTTTA CTTGCTTTAA AAAACCTCCA CACCTCCCCC
4081 TGAACCTGAA ACATAAAATG AATGCAATTG TTGTTGTTAA CTTGTTTATT GCAGCTTATA
4141 ATGGTTACAA ATAAAGCAAT AGCATCACAA ATTTCACAAA TAAAGCATTT TTTTCACTGC
4201 ATTCTAGTTG TGGTTTGTCC AAACTCATCA ATGTATCTTA TCATGTCTGG ATCTGCGTCG
4261 ACACGAAGAG ACGACTGACT GACTGACTGG AAAGAGGAAG GGCTGGAAGA GGAAGGAGCT
4321 TGATCCAGAT CCCGATCTCG ATCCAGATCC GGATCGCAGC TTGGCGTAAT CATGGTCATA
4381 GCTGTTTCCT GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG
4441 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA TTGCGTTGCG
4501 CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA
4561 ACGCGCGGGG AGAGGCGGTT TGCGTATTGG GCGCTCTTCC GCTTCCTCGC TCACTGACTC
4621 GCTGCGCTCG GTCGTTCGGC TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG
4681 GTTATCCACA GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA
4741 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC GCCCCCCTGA
4801 CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA AACCCGACAG GACTATAAAG
4861 ATACCAGGCG TTTCCCCCTG GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT
4921 TACCGGATAC CTGTCCGCCT TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC ATAGCTCACG
4981 CTGTAGGTAT CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC
5041 CCCCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
5101 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
5161 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
5221 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
5281 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
5341 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
5401 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
5461 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
5521 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTTGCTAG GTTACTGTCA
5581 TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA AAAGAGTTTG TAGAAACGCA
5641 AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT CGGTGGCAGT TTATGGCGGG
5701 CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT TCAAATCCGC TCCCGGCGGA
5761 TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA TAAAACGAAA GGCCCAGTCT
5821 TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC CCTACTCTCG CATGGGTTGC
5881 GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT TATCATCGAA TTTCTGCCAT
5941 TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG CGTTTAAGGG CACCAATAAC
6001 TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA GTACTGTTGT AATTCATTAA
6061 GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA
6121 TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT GAAAACGGGG GCGAAGAAGT
6181 TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT CACCCAGGGA TTGGCTGAGA
6241 CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC CAGGTTTTCA CCGTAACACG
6301 CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC GTCGTGGTAT TCACTCCAGA
6361 GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA ACAAGGGTGA ACACTATCCC
6421 ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC CGGATGAGCA TTCATCAGGC
6481 GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT ATTTTTCTTT ACGGTCTTTA
6541 AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT ACATTGAGCA ACTGACTGAA
6601 ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC AACGGTGGTA TATCCAGTGA
6661 TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT CGATAACTCA AAAAATACGC
6721 CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC TCTTACGTGC CGATCAACGT
6781 CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG CGTATCACGA GGCCAGCTTG
6841 GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG TTTGGAACAA GAGTCCACTA
6901 TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG TCTATCAGGG CGATGGCCCA
6961 CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA GGTGCCGTAA AGCACTAAAT
7021 CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG GAAAGCCGGC GAACGTGGCG
7081 AGAAAGGAAG GGAAGAAAGC GAAAGGAGCG GGCGCTAAGG CGCTGGCAAGTGTAGCGGTC
7141 ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC CGCTACAGGG CGCGTACTAT
7201 GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG CGTAAGGAGA AAATACCGCA
7261 TCAGGCGCCA TTCGCCATTC AGGCTGCGCA ACTGTTGGGA AGGGCGATCG GTGCGGGCCT
7321 CTTCGCTATT ACGCCAGCTG GCGAAAGGGG GATGTGCTGC AAGGCGATTA AGTTGGGTAA
7381 CGCCAGGGTT TTCCCAGTCA CGACGTTGTA AAACGACGGC CAGTGAATTG ATCGAGATCG
7441 TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT CAGTGGAGAG GACTTTCACT
7501 GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT TATTGACTAG TTATTAATAG
7561 TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT
7621 ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG
7681 ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT
7741 TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT
7801 ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG CCCAGTACAT GACCTTATGG
7861 GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG
7921 TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC
7981 CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA
8041 TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC
8101 TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG TTAGACCAGA TCTGAGCCTG
8161 GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT CAATAAAGCT TGCCTTGAGT
8221 GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT AACTAGAGAT CCCTCAGACC
8281 CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA ACAGGGACTT GAAAGCGAAA
8341 GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG CTGAAGCGCG CACGGCAAGA
8401 GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA CTAGCGGAGG CTAGAAGGAG
8461 AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA TTAGATAAAT GGGAAAAAAT
8521 TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA CATATAGTTA GGGCAAGCAG
8581 GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG ACATCAGAAG GCTGTAGACA
8641 AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA GAAGAACTTA GATCATTATA
8701 TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA GATGTAAAAG ACACCAAGGA
8761 AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG AAAAAGGCACAGCAAGCGAT
8821 CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA TTGGAGAAGT GAATTATATA
8881 AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC CACCAAGGCA AAGAGAAGAG
8941 TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT GTTCCTTGGG TTCTTGGGAG
9001 CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC GGTACAGGCC AGACAATTAT
9061 TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC TATTGAGGCG CAACAGCATC
9121 TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC AAGAATCCTG GCTGTGGAAA
9181 GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG CTCTGGAAAA CTCATTTGCA
9241 CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC TCTGGAACAG ATTTGGAATA
9301 ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA CACAAGCTTA ATACACTCCT
9361 TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA AGAATTATTG GAATTAGATA
9421 AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG GCTGTGGTAT ATAAAATTAT
9481 TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT TTTTGCTGTA CTTTCTATAG
9541 TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA GACCCACCTC CCAATCCCGA
9601 GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT TAAAAGAAAA GGGGGGATTG
9661 GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC AACAGACATA CAAACTAAAG
9721 AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT TTATTACAGG GACAGCAGAA
9781 ATCCACTTTG G
pLRPC FMC63 TRDC T2AW TRGC1 (서열 식별 번호:184)
1 AAAGCTGAGC ATCCGGCTCC GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC
61 CCGAGAAGTT GGGGGGAGGG GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG
121 TAAACTGGGA AAGTGATGTC GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC
181 CGTATATAAG TGCAGTAGTC GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA
241 CACAGGTAAG TGCCGTGTGT GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT
301 GCGTGCCTTG AATTACTTCC ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT
361 CGGGTTGGAA GTGGGTGGGA GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT
421 GCTTGAGTTG AGGCCTGGCC TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT
481 CGCGCCTGTC TCGCTGCTTT CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT
541 GCGACGCTTT TTTTCTGGCA AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT
601 ATTTCGGTTT TTGGGGCCGC GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG
661 GCGAGGCGGG GCCTGCGAGC GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC
721 CGGCCTGCTC TGGTGCCTGG CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG
781 CTGGCCCGGT CGGCACCAGT TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA
841 GGGAGCTCAA AATGGAGGAC GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA
901 AGGAAAAGGG CCTTTCCGTC CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG
961 CCGTCCAGGC ACCTCGATTA GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG
1021 GAGGGGTTTT ATGCGATGGA GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA
1081 GCTTGGCACT TGATGTAATT CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC
1141 ATTCTCAAGC CTCAGACAGT GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA
1201 CTACCCCTCT AGAGCCGCCA CCATGCTTCT CCTGGTGACA AGCCTTCTGC TCTGTGAGTT
1261 ACCACACCCA GCATTCCTCC TGATCCCAGA CATCCAGATG ACACAGACTA CATCCTCCCT
1321 GTCTGCCTCT CTGGGAGACA GAGTCACCAT CAGTTGCAGG GCAAGTCAGG ACATTAGTAA
1381 ATATTTAAAT TGGTATCAGC AGAAACCAGA TGGAACTGTT AAACTCCTGA TCTACCATAC
1441 ATCAAGATTA CACTCAGGAG TCCCATCAAG GTTCAGTGGC AGTGGGTCTG GAACAGATTA
1501 TTCTCTCACC ATTAGCAACC TGGAGCAAGA AGATATTGCC ACTTACTTTT GCCAACAGGG
1561 TAATACGCTT CCGTACACGT TCGGAGGGGG GACTAAGTTG GAAATAACAG GCTCCACCTC
1621 TGGATCCGGC AAGCCCGGAT CTGGCGAGGG ATCCACCAAG GGCGAGGTGA AACTGCAGGA
1681 GTCAGGACCT GGCCTGGTGG CGCCCTCACA GAGCCTGTCC GTCACATGCA CTGTCTCAGG
1741 GGTCTCATTA CCCGACTATG GTGTAAGCTG GATTCGCCAG CCTCCACGAA AGGGTCTGGA
1801 GTGGCTGGGA GTAATATGGG GTAGTGAAAC CACATACTAT AATTCAGCTC TCAAATCCAG
1861 ACTGACCATC ATCAAGGACA ACTCCAAGAG CCAAGTTTTC TTAAAAATGA ACAGTCTGCA
1921 AACTGATGAC ACAGCCATTT ACTACTGTGC CAAACATTAT TACTACGGTG GTAGCTATGC
1981 TATGGACTAC TGGGGTCAAG GAACCTCAGT CACCGTCTCC TCAGCGGCCG CAGGTGGAGG
2041 AGGTTCTGGA GGTGGTGGAT CAGGTGGTGG AGGATCTTTA GAAAGTCAGC CTCATACCAA
2101 ACCATCCGTT TTTGTCATGA AAAATGGAAC AAATGTCGCT TGTCTGGTGA AGGAATTCTA
2161 CCCCAAGGAT ATAAGAATAA ATCTCGTGTC ATCCAAGAAG ATAACAGAGT TTGATCCTGC
2221 TATTGTCATC TCTCCCAGTG GGAAGTACAA TGCTGTCAAG CTTGGTAAAT ATGAAGATTC
2281 AAATTCAGTG ACATGTTCAG TTCAACACGA CAATAAAACT GTGCACTCCA CTGACTTTGA
2341 AGTGAAGACA GATTCTACAG ATCACGTAAA ACCAAAGGAA ACTGAAAACA CAAAGCAACC
2401 TTCAAAGAGC TGCCATAAAC CCAAAGCCAT AGTTCATACC GAGAAGGTGA ACATGATGTC
2461 CCTCACAGTG CTTGGGCTAC GAATGCTGTT TGCAAAGACT GTTGCCGTCA ATTTTCTCTT
2521 GACTGCCAAG TTATTTTTCT TGGGGTCAGG CGAGGGCAGA GGAAGTCTGC TAACATGCGG
2581 TGACGTCGAG GAGAATCCTG GACCTATGCT ACTACTTGTG ACCTCACTAT TGTTATGCGA
2641 ACTCCCTCAT CCCGCATTCT TGCTGATTCC AGATAAACAA CTTGATGCAG ATGTTTCCCC
2701 CAAGCCCACT ATTTTTCTTC CTTCAATTGC TGAAACAAAG CTCCAGAAGG CTGGAACATA
2761 CCTTTGTCTT CTTGAGAAAT TTTTCCCTGA TGTTATTAAG ATACATTGGC AAGAAAAGAA
2821 GAGCAACACG ATTCTGGGAT CCCAGGAGGG GAACACCATG AAGACTAACG ACACATACAT
2881 GAAATTTAGC TGGTTAACGG TGCCAGAAAA GTCACTGGAC AAAGAACACA GATGTATCGT
2941 CAGACATGAG AATAATAAAA ACGGAGTTGA TCAAGAAATT ATCTTTCCTC CAATAAAGAC
3001 AGATGTCATC ACAATGGATC CCAAAGACAA TTGTTCAAAA GATGCAAATG ATACACTACT
3061 GCTGCAGCTC ACAAACACCT CTGCATATTA CATGTACCTC CTCCTGCTCC TCAAGAGTGT
3121 GGTCTATTTT GCCATCATCA CCTGCTGTCT GCTTAGAAGA ACGGCTTTCT GCTGCAATGG
3181 AGAGAAATCA TAATGAGATA TCGAGCATCT TACCGCCATT TATACCCATA TTTGTTCTGT
3241 TTTTCTTGAT TTGGGTATAC ATTTAAATGT TAATAAAACA AAATGGTGGG GCAATCATTT
3301 ACATTTTTAG GGATATGTAA TTACTAGTTC AGGTGTATTG CCACAAGACA AACATGTTAA
3361 GAAACTTTCC CGTTATTTAC GCTCTGTTCC TGTTAATCAA CCTCTGGATT ACAAAATTTG
3421 TGAAAGATTG ACTGATATTC TTAACTATGT TGCTCCTTTT ACGCTGTGTG GATATGCTGC
3481 TTTATAGCCT CTGTATCTAG CTATTGCTTC CCGTACGGCT TTCGTTTTCT CCTCCTTGTA
3541 TAAATCCTGG TTGCTGTCTC TTTTAGAGGA GTTGTGGCCC GTTGTCCGTC AACGTGGCGT
3601 GGTGTGCTCT GTGTTTGCTG ACGCAACCCC CACTGGCTGG GGCATTGCCA CCACCTGTCA
3661 ACTCCTTTCT GGGACTTTCG CTTTCCCCCT CCCGATCGCC ACGGCAGAAC TCATCGCCGC
3721 CTGCCTTGCC CGCTGCTGGA CAGGGGCTAG GTTGCTGGGC ACTGATAATT CCGTGGTGTT
3781 GTCAGTACTG GTACCTTTAA GACCAATGAC TTACAAGGCA GCTGTAGATC TTAGCCACTT
3841 TTTAAAAGAA AAGGGGGGAC TGGAAGGGCT AATTCACTCC CAAAGAAGAC AAGATCTGCT
3901 TTTTGCCTGT ACTGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC TCTCTGGCTA
3961 ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTTC AATGATCATA
4021 ATCAAGCCAT ATCACATCTG TAGAGGTTTA CTTGCTTTAA AAAACCTCCA CACCTCCCCC
4081 TGAACCTGAA ACATAAAATG AATGCAATTG TTGTTGTTAA CTTGTTTATT GCAGCTTATA
4141 ATGGTTACAA ATAAAGCAAT AGCATCACAA ATTTCACAAA TAAAGCATTT TTTTCACTGC
4201 ATTCTAGTTG TGGTTTGTCC AAACTCATCA ATGTATCTTA TCATGTCTGG ATCTGCGTCG
4261 ACACGAAGAG ACGACTGACT GACTGACTGG AAAGAGGAAG GGCTGGAAGA GGAAGGAGCT
4321 TGATCCAGAT CCCGATCTCG ATCCAGATCC GGATCGCAGC TTGGCGTAAT CATGGTCATA
4381 GCTGTTTCCT GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG
4441 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA TTGCGTTGCG
4501 CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA
4561 ACGCGCGGGG AGAGGCGGTT TGCGTATTGG GCGCTCTTCC GCTTCCTCGC TCACTGACTC
4621 GCTGCGCTCG GTCGTTCGGC TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG
4681 GTTATCCACA GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA
4741 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC GCCCCCCTGA
4801 CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA AACCCGACAG GACTATAAAG
4861 ATACCAGGCG TTTCCCCCTG GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT
4921 TACCGGATAC CTGTCCGCCT TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC ATAGCTCACG
4981 CTGTAGGTAT CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC
5041 CCCCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
5101 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
5161 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
5221 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
5281 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
5341 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
5401 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
5461 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
5521 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTTGCTAG GTTACTGTCA
5581 TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA AAAGAGTTTG TAGAAACGCA
5641 AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT CGGTGGCAGT TTATGGCGGG
5701 CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT TCAAATCCGC TCCCGGCGGA
5761 TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA TAAAACGAAA GGCCCAGTCT
5821 TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC CCTACTCTCG CATGGGTTGC
5881 GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT TATCATCGAA TTTCTGCCAT
5941 TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG CGTTTAAGGG CACCAATAAC
6001 TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA GTACTGTTGT AATTCATTAA
6061 GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA
6121 TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT GAAAACGGGG GCGAAGAAGT
6181 TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT CACCCAGGGA TTGGCTGAGA
6241 CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC CAGGTTTTCA CCGTAACACG
6301 CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC GTCGTGGTAT TCACTCCAGA
6361 GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA ACAAGGGTGA ACACTATCCC
6421 ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC CGGATGAGCA TTCATCAGGC
6481 GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT ATTTTTCTTT ACGGTCTTTA
6541 AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT ACATTGAGCA ACTGACTGAA
6601 ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC AACGGTGGTA TATCCAGTGA
6661 TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT CGATAACTCA AAAAATACGC
6721 CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC TCTTACGTGC CGATCAACGT
6781 CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG CGTATCACGA GGCCAGCTTG
6841 GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG TTTGGAACAA GAGTCCACTA
6901 TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG TCTATCAGGG CGATGGCCCA
6961 CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA GGTGCCGTAA AGCACTAAAT
7021 CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG GAAAGCCGGC GAACGTGGCG
7081 AGAAAGGAAG GGAAGAAAGC GAAAGGAGCG GGCGCTAAGG CGCTGGCAAGTGTAGCGGTC
7141 ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC CGCTACAGGG CGCGTACTAT
7201 GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG CGTAAGGAGA AAATACCGCA
7261 TCAGGCGCCA TTCGCCATTC AGGCTGCGCA ACTGTTGGGA AGGGCGATCG GTGCGGGCCT
7321 CTTCGCTATT ACGCCAGCTG GCGAAAGGGG GATGTGCTGC AAGGCGATTA AGTTGGGTAA
7381 CGCCAGGGTT TTCCCAGTCA CGACGTTGTA AAACGACGGC CAGTGAATTG ATCGAGATCG
7441 TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT CAGTGGAGAG GACTTTCACT
7501 GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT TATTGACTAG TTATTAATAG
7561 TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT
7621 ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG
7681 ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT
7741 TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT
7801 ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG CCCAGTACAT GACCTTATGG
7861 GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG
7921 TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC
7981 CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA
8041 TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC
8101 TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG TTAGACCAGA TCTGAGCCTG
8161 GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT CAATAAAGCT TGCCTTGAGT
8221 GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT AACTAGAGAT CCCTCAGACC
8281 CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA ACAGGGACTT GAAAGCGAAA
8341 GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG CTGAAGCGCG CACGGCAAGA
8401 GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA CTAGCGGAGG CTAGAAGGAG
8461 AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA TTAGATAAAT GGGAAAAAAT
8521 TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA CATATAGTTA GGGCAAGCAG
8581 GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG ACATCAGAAG GCTGTAGACA
8641 AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA GAAGAACTTA GATCATTATA
8701 TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA GATGTAAAAG ACACCAAGGA
8761 AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG AAAAAGGCACAGCAAGCGAT
8821 CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA TTGGAGAAGT GAATTATATA
8881 AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC CACCAAGGCA AAGAGAAGAG
8941 TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT GTTCCTTGGG TTCTTGGGAG
9001 CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC GGTACAGGCC AGACAATTAT
9061 TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC TATTGAGGCG CAACAGCATC
9121 TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC AAGAATCCTG GCTGTGGAAA
9181 GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG CTCTGGAAAA CTCATTTGCA
9241 CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC TCTGGAACAG ATTTGGAATA
9301 ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA CACAAGCTTA ATACACTCCT
9361 TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA AGAATTATTG GAATTAGATA
9421 AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG GCTGTGGTAT ATAAAATTAT
9481 TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT TTTTGCTGTA CTTTCTATAG
9541 TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA GACCCACCTC CCAATCCCGA
9601 GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT TAAAAGAAAA GGGGGGATTG
9661 GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC AACAGACATA CAAACTAAAG
9721 AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT TTATTACAGG GACAGCAGAA
9781 ATCCACTTTG G
pLRPCU TRDC T2AW FMC63op TRGC1 (서열 식별 번호:185)
1 GACATTGATT ATTGACTAGT TATTAATAGT AATCAATTAC GGGGTCATTA GTTCATAGCC
61 CATATATGGA GTTCCGCGTT ACATAACTTA CGGTAAATGG CCCGCCTGGC TGACCGCCCA
121 ACGACCCCCG CCCATTGACG TCAATAATGA CGTATGTTCC CATAGTAACG CCAATAGGGA
181 CTTTCCATTG ACGTCAATGG GTGGAGTATT TACGGTAAAC TGCCCACTTG GCAGTACATC
241 AAGTGTATCA TATGCCAAGT ACGCCCCCTA TTGACGTCAA TGACGGTAAA TGGCCCGCCT
301 GGCATTATGC CCAGTACATG ACCTTATGGG ACTTTCCTAC TTGGCAGTAC ATCTACGTAT
361 TAGTCATCGC TATTACCATG GTGATGCGGT TTTGGCAGTA CATCAATGGG CGTGGATAGC
421 GGTTTGACTC ACGGGGATTT CCAAGTCTCC ACCCCATTGA CGTCAATGGG AGTTTGTTTT
481 GGCACCAAAA TCAACGGGAC TTTCCAAAAT GTCGTAACAA CTCCGCCCCA TTGACGCAAA
541 TGGGCGGTAG GCGTGTACGG TGGGAGGTCT ATATAAGCAG AGCTCGTTTA GTGAACCGGG
601 TCTCTCTGGT TAGACCAGAT CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG
661 CTTAAGCCTC AATAAAGCTT GCCTTGAGTG CTCAAAGTAG TGTGTGCCCG TCTGTTGTGT
721 GACTCTGGTA ACTAGAGATC CCTCAGACCC TTTTAGTCAG TGTGGAAAAT CTCTAGCAGT
781 GGCGCCCGAA CAGGGACTTG AAAGCGAAAG TAAAGCCAGA GGAGATCTCT CGACGCAGGA
841 CTCGGCTTGC TGAAGCGCGC ACGGCAAGAG GCGAGGGGCG GCGACTGGTG AGTACGCCAA
901 AAATTTTGAC TAGCGGAGGC TAGAAGGAGA GAGTAGGGTG CGAGAGCGTC GGTATTAAGC
961 GGGGGAGAAT TAGATAAATG GGAAAAAATT CGGTTAAGGC CAGGGGGAAA GAAACAATAT
1021 AAACTAAAAC ATATAGTTAG GGCAAGCAGG GAGCTAGAAC GATTCGCAGT TAATCCTGGC
1081 CTTTTAGAGA CATCAGAAGG CTGTAGACAA ATACTGGGAC AGCTACAACC ATCCCTTCAG
1141 ACAGGATCAG AAGAACTTAG ATCATTATAT AATACAATAG CAGTCCTCTA TTGTGTGCAT
1201 CAAAGGATAG ATGTAAAAGA CACCAAGGAA GCCTTAGATA AGATAGAGGA AGAGCAAAAC
1261 AAAAGTAAGA AAAAGGCACA GCAAGCGATC TTCAGACCTG GAGGAGGCAG GAGGCGATAT
1321 GAGGGACAAT TGGAGAAGTG AATTATATAA ATATAAAGTA GTAAAAATTG AACCATTAGG
1381 AGTAGCACCC ACCAAGGCAA AGAGAAGAGT GGTGCAGAGA GAAAAAAGAGCAGTGGGAAT
1441 AGGAGCTTTG TTCCTTGGGT TCTTGGGAGC AGCAGGAAGC ACTATGGGCG CAGCGTCAAT
1501 GACGCTGACG GTACAGGCCA GACAATTATT GTCTGATATA GTGCAGCAGC AGAACAATTT
1561 GCTGAGGGCT ATTGAGGCGC AACAGCATCT GTTGCAACTC ACAGTCTGGG GCATCAAACA
1621 GCTCCAGGCA AGAATCCTGG CTGTGGAAAG ATACCTAAAG GATCAACAGC TCCTGGGGAT
1681 TTGGGGTTGC TCTGGAAAAC TCATTTGCAC CACTGCTGTG CCTTGGAATG CTAGTTGGAG
1741 TAATAAATCT CTGGAACAGA TTTGGAATAA CATGACCTGG ATGGAGTGGG ACAGAGAAAT
1801 TAACAATTAC ACAAGCTTAA TACACTCCTT AATTGAAGAA TCGCAAAACC AGCAAGAAAA
1861 GAATGAACAA GAATTATTGG AATTAGATAA ATGGGCAAGT TTGTGGAATT GGTTTAACAT
1921 AACAAATTGG CTGTGGTATA TAAAATTATT CATAATGATA GTAGGAGGCT TGGTAGGTTT
1981 AAGAATAGTT TTTGCTGTAC TTTCTATAGT GAATAGAGTT AGGCAGGGAT ATTCACCATT
2041 ATCGTTTCAG ACCCACCTCC CAATCCCGAG GGGACCACGC GTACAAATGG CAGTATTCAT
2101 CCACAATTTT AAAAGAAAAG GGGGGATTGG GGGGTACAGT GCAGGGGAAA GAATAGTAGA
2161 CATAATAGCA ACAGACATAC AAACTAAAGA ATTACAAAAA CAAATTACAA AAATTCAAAA
2221 TTTTCGGGTT TATTACAGGG ACAGCAGAAA TCCACTTTGG AAAGCTGAGC ATCCGGCTCC
2281 GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC CCGAGAAGTT GGGGGGAGGG
2341 GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG TAAACTGGGA AAGTGATGTC
2401 GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC CGTATATAAG TGCAGTAGTC
2461 GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA CACAGGTAAG TGCCGTGTGT
2521 GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT GCGTGCCTTG AATTACTTCC
2581 ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT CGGGTTGGAA GTGGGTGGGA
2641 GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT GCTTGAGTTG AGGCCTGGCC
2701 TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT CGCGCCTGTC TCGCTGCTTT
2761 CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT GCGACGCTTT TTTTCTGGCA
2821 AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT ATTTCGGTTT TTGGGGCCGC
2881 GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG GCGAGGCGGG GCCTGCGAGC
2941 GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC CGGCCTGCTC TGGTGCCTGG
3001 CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG CTGGCCCGGT CGGCACCAGT
3061 TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA GGGAGCTCAA AATGGAGGAC
3121 GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA AGGAAAAGGG CCTTTCCGTC
3181 CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG CCGTCCAGGC ACCTCGATTA
3241 GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG GAGGGGTTTT ATGCGATGGA
3301 GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA GCTTGGCACT TGATGTAATT
3361 CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC ATTCTCAAGC CTCAGACAGT
3421 GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA CTACCCCTCA GAGCCGCCAC
3481 CATGCTTCTC CTGGTGACAA GCCTTCTGCT CTGTGAGTTA CCACACCCAG CATTCCTCCT
3541 GATCCCAAGT CAGCCTCATA CCAAACCATC CGTTTTTGTC ATGAAAAATG GAACAAATGT
3601 CGCTTGTCTG GTGAAGGAAT TCTACCCCAA GGATATAAGA ATAAATCTCG TGTCATCCAA
3661 GAAGATAACA GAGTTTGATC CTGCTATTGT CATCTCTCCC AGTGGGAAGT ACAATGCTGT
3721 CAAGCTTGGT AAATATGAAG ATTCAAATTC AGTGACATGT TCAGTTCAAC ACGACAATAA
3781 AACTGTGCAC TCCACTGACT TTGAAGTGAA GACAGATTCT ACAGATCACG TAAAACCAAA
3841 GGAAACTGAA AACACAAAGC AACCTTCAAA GAGCTGCCAT AAACCCAAAG CCATAGTTCA
3901 TACCGAGAAG GTGAACATGA TGTCCCTCAC AGTGCTTGGG CTACGAATGC TGTTTGCAAA
3961 GACTGTTGCC GTCAATTTTC TCTTGACTGC CAAGTTATTT TTCTTGGGGT CAGGCGAGGG
4021 CAGAGGAAGT CTGCTAACAT GCGGTGACGT CGAGGAGAAT CCTGGACCTA TGCTACTACT
4081 TGTGACCTCA CTATTGTTAT GCGAACTCCC TCATCCCGCA TTCTTGCTGA TTCCAGACAT
4141 TCAGATGACT CAAACAACTT CCAGCCTCTC CGCCTCACTC GGCGACCGCG TAACAATAAG
4201 CTGTCGGGCC TCGCAAGATA TTAGTAAGTA CCTGAATTGG TATCAGCAAA AACCCGATGG
4261 TACAGTCAAG CTTCTGATCT ACCATACCAG TCGTCTGCAC AGCGGTGTCC CCAGCAGGTT
4321 CAGCGGCTCA GGATCTGGTA CCGATTATTC ACTGACGATT TCCAACCTTG AGCAGGAGGA
4381 CATCGCCACC TACTTCTGCC AGCAGGGTAA TACTCTGCCG TACACATTCG GGGGCGGTAC
4441 CAAGCTCGAG ATCACGGGTT CAACAAGCGG TTCTGGCAAG CCAGGCAGCG GCGAGGGGAG
4501 TACAAAGGGG GAGGTGAAGT TGCAGGAAAG TGGCCCTGGA TTGGTGGCCC CGAGCCAGAG
4561 TCTGTCTGTC ACCTGCACAG TTTCCGGAGT AAGTCTGCCT GATTACGGAG TGTCCTGGAT
4621 CAGACAGCCA CCTCGAAAGG GCTTGGAGTG GCTTGGGGTC ATTTGGGGCA GTGAAACCAC
4681 ATACTACAAC AGCGCTCTTA AGTCCAGGCT CACTATCATC AAGGACAATT CAAAGAGCCA
4741 AGTATTCTTG AAAATGAATT CCCTGCAGAC TGATGACACC GCTATTTATT ATTGCGCTAA
4801 ACATTATTAC TATGGAGGTT CTTATGCCAT GGACTACTGG GGGCAGGGTA CCTCTGTGAC
4861 AGTGAGTTCA GCTGCAGCTG GAGGTGGAGG TAGCGGAGGC GGTGGTAGTG GAGGGGGTGG
4921 TTCTCTGGAA GATAAACAAC TTGATGCAGA TGTTTCCCCC AAGCCCACTA TTTTTCTTCC
4981 TTCAATTGCT GAAACAAAGC TCCAGAAGGC TGGAACATAC CTTTGTCTTC TTGAGAAATT
5041 TTTCCCTGAT GTTATTAAGA TACATTGGCA AGAAAAGAAG AGCAACACGA TTCTGGGATC
5101 CCAGGAGGGG AACACCATGA AGACTAACGA CACATACATG AAATTTAGCT GGTTAACGGT
5161 GCCAGAAAAG TCACTGGACA AAGAACACAG ATGTATCGTC AGACATGAGA ATAATAAAAA
5221 CGGAGTTGAT CAAGAAATTA TCTTTCCTCC AATAAAGACA GATGTCATCA CAATGGATCC
5281 CAAAGACAAT TGTTCAAAAG ATGCAAATGA TACACTACTG CTGCAGCTCA CAAACACCTC
5341 TGCATATTAC ATGTACCTCC TCCTGCTCCT CAAGAGTGTG GTCTATTTTG CCATCATCAC
5401 CTGCTGTCTG CTTAGAAGAA CGGCTTTCTG CTGCAATGGA GAGAAATCAT AATGAGATAT
5461 CGAGCATCTT ACCGCCATTT ATACCCATAT TTGTTCTGTT TTTCTTGATT TGGGTATACA
5521 TTTAAATGTT AATAAAACAA AATGGTGGGG CAATCATTTA CATTTTTAGG GATATGTAAT
5581 TACTAGTTCA GGTGTATTGC CACAAGACAA ACATGTTAAG AAACTTTCCC GTTATTTACG
5641 CTCTGTTCCT GTTAATCAAC CTCTGGATTA CAAAATTTGT GAAAGATTGA CTGATATTCT
5701 TAACTATGTT GCTCCTTTTA CGCTGTGTGG ATATGCTGCT TTATAGCCTC TGTATCTAGC
5761 TATTGCTTCC CGTACGGCTT TCGTTTTCTC CTCCTTGTAT AAATCCTGGT TGCTGTCTCT
5821 TTTAGAGGAG TTGTGGCCCG TTGTCCGTCA ACGTGGCGTG GTGTGCTCTG TGTTTGCTGA
5881 CGCAACCCCC ACTGGCTGGG GCATTGCCAC CACCTGTCAA CTCCTTTCTG GGACTTTCGC
5941 TTTCCCCCTC CCGATCGCCA CGGCAGAACT CATCGCCGCC TGCCTTGCCC GCTGCTGGAC
6001 AGGGGCTAGG TTGCTGGGCA CTGATAATTC CGTGGTGTTG TCAGTACTGG TACCTTTAAG
6061 ACCAATGACT TACAAGGCAG CTGTAGATCT TAGCCACTTT TTAAAAGAAA AGGGGGGACT
6121 GGAAGGGCTA ATTCACTCCC AAAGAAGACA AGATCTGCTT TTTGCCTGTA CTGGGTCTCT
6181 CTGGTTAGAC CAGATCTGAG CCTGGGAGCT CTCTGGCTAA CTAGGGAACC CACTGCTTAA
6241 GCCTCAATAA AGCTTGCCTT GAGTGCTTCA AGTAGTGTGT GCCCGTCTGT TGTGTGACTC
6301 TGGTAACTAG AGATCCCTCA GACCCTTTTA GTCAGTGTGG AAAATCTCTA GCATGATCAT
6361 AATCAAGCCA TATCACATCT GTAGAGGTTT ACTTGCTTTA AAAAACCTCC ACACCTCCCC
6421 CTGAACCTGA AACATAAAAT GAATGCAATT GTTGTTGTTA ACTTGTTTAT TGCAGCTTAT
6481 AATGGTTACA AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG
6541 CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG GATCTGCGTC
6601 GACACGAAGA GACGACTGAC TGACTGACTG GAAAGAGGAA GGGCTGGAAGAGGAAGGAGC
6661 TTGATCCAGA TCCCGATCTC GATCCAGATC CGGATCGCAG CTTGGCGTAA TCATGGTCAT
6721 AGCTGTTTCC TGTGTGAAAT TGTTATCCGC TCACAATTCC ACACAACATA CGAGCCGGAA
6781 GCATAAAGTG TAAAGCCTGG GGTGCCTAAT GAGTGAGCTA ACTCACATTA ATTGCGTTGC
6841 GCTCACTGCC CGCTTTCCAG TCGGGAAACC TGTCGTGCCA GCTGCATTAA TGAATCGGCC
6901 AACGCGCGGG GAGAGGCGGT TTGCGTATTG GGCGCTCTTC CGCTTCCTCG CTCACTGACT
6961 CGCTGCGCTC GGTCGTTCGG CTGCGGCGAG CGGTATCAGC TCACTCAAAG GCGGTAATAC
7021 GGTTATCCAC AGAATCAGGG GATAACGCAG GAAAGAACAT GTGAGCAAAA GGCCAGCAAA
7081 AGGCCAGGAA CCGTAAAAAG GCCGCGTTGC TGGCGTTTTT CCATAGGCTC CGCCCCCCTG
7141 ACGAGCATCA CAAAAATCGA CGCTCAAGTC AGAGGTGGCG AAACCCGACA GGACTATAAA
7201 GATACCAGGC GTTTCCCCCT GGAAGCTCCC TCGTGCGCTC TCCTGTTCCG ACCCTGCCGC
7261 TTACCGGATA CCTGTCCGCC TTTCTCCCTT CGGGAAGCGT GGCGCTTTCT CATAGCTCAC
7321 GCTGTAGGTA TCTCAGTTCG GTGTAGGTCG TTCGCTCCAA GCTGGGCTGT GTGCACGAAC
7381 CCCCCGTTCA GCCCGACCGC TGCGCCTTAT CCGGTAACTA TCGTCTTGAG TCCAACCCGG
7441 TAAGACACGA CTTATCGCCA CTGGCAGCAG CCACTGGTAA CAGGATTAGC AGAGCGAGGT
7501 ATGTAGGCGG TGCTACAGAG TTCTTGAAGT GGTGGCCTAA CTACGGCTAC ACTAGAAGAA
7561 CAGTATTTGG TATCTGCGCT CTGCTGAAGC CAGTTACCTT CGGAAAAAGA GTTGGTAGCT
7621 CTTGATCCGG CAAACAAACC ACCGCTGGTA GCGGTGGTTT TTTTGTTTGC AAGCAGCAGA
7681 TTACGCGCAG AAAAAAAGGA TCTCAAGAAG ATCCTTTGAT CTTTTCTACG GGGTCTGACG
7741 CTCAGTGGAA CGAAAACTCA CGTTAAGGGA TTTTGGTCAT GAGATTATCA AAAAGGATCT
7801 TCACCTAGAT CCTTTTAAAT TAAAAATGAA GTTTTAAATC AATCTAAAGT ATATATGAGT
7861 AAACTTGGTC TGACAGTTAC CAATGCTTAA TCAGTGAGGC ACCTATCTCA GCGATCTGTC
7921 TATTTCGTTC ATCCATAGTT GCCTGACTCC CCGTCGTTGC TAGGTTACTG TCATGAGCGG
7981 ATACATATTT GAATGTATTT AGAAAAATAA ACAAAAGAGT TTGTAGAAAC GCAAAAAGGC
8041 CATCCGTCAG GATGGCCTTC TGCTTAATTT GATCGGTGGC AGTTTATGGC GGGCGTCCTG
8101 CCCGCCACCC TCCGGGCCGT TGCTTCGCAA CGTTCAAATC CGCTCCCGGC GGATTTGTCC
8161 TACTCAGGAG AGCGTTCACC GACAAACAAC AGATAAAACG AAAGGCCCAG TCTTTCGACT
8221 GAGCCTTTCG TTTTATTTGA TGCCTGGCAG TTCCCTACTC TCGCATGGGT TGCGGCCGCC
8281 CGGGCCGTCG ACCAATTCTC ATGTTTGACA GCTTATCATC GAATTTCTGC CATTCATCCG
8341 CTTATTATCA CTTATTCAGG CGTAGCAACC AGGCGTTTAA GGGCACCAAT AACTGCCTTA
8401 AAAAAATTAC GCCCCGCCCT GCCACTCATC GCAGTACTGT TGTAATTCAT TAAGCATTCT
8461 GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC
8521 CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGTGAAAACG GGGGCGAAGA AGTTGTCCAT
8581 ATTGGCCACG TTTAAATCAA AACTGGTGAA ACTCACCCAG GGATTGGCTG AGACGAAAAA
8641 CATATTCTCA ATAAACCCTT TAGGGAAATA GGCCAGGTTT TCACCGTAAC ACGCCACATC
8701 TTGCGAATAT ATGTGTAGAA ACTGCCGGAA ATCGTCGTGG TATTCACTCC AGAGCGATGA
8761 AAACGTTTCA GTTTGCTCAT GGAAAACGGT GTAACAAGGG TGAACACTAT CCCATATCAC
8821 CAGCTCACCG TCTTTCATTG CCATACGAAA TTCCGGATGA GCATTCATCA GGCGGGCAAG
8881 AATGTGAATA AAGGCCGGAT AAAACTTGTG CTTATTTTTC TTTACGGTCT TTAAAAAGGC
8941 CGTAATATCC AGCTGAACGG TCTGGTTATA GGTACATTGA GCAACTGACT GAAATGCCTC
9001 AAAATGTTCT TTACGATGCC ATTGGGATAT ATCAACGGTG GTATATCCAG TGATTTTTTT
9061 CTCCATTTTA GCTTCCTTAG CTCCTGAAAA TCTCGATAAC TCAAAAAATA CGCCCGGTAG
9121 TGATCTTATT TCATTATGGT GAAAGTTGGA ACCTCTTACG TGCCGATCAA CGTCTCATTT
9181 TCGCCAAAAG TGACATTAAC CTATAAAAAT AGGCGTATCA CGAGGCCAGC TTGGGAAACC
9241 ATAAGACCGA GATAGAGTTG AGTGTTGTTC CAGTTTGGAA CAAGAGTCCA CTATTAAAGA
9301 ACGTGGACTC CAACGTCAAA GGGCGAAAAA CCGTCTATCA GGGCGATGGC CCACTACGTG
9361 AACCATCACC CAAATCAAGT TTTTTGGGGT CGAGGTGCCG TAAAGCACTA AATCGGAACC
9421 CTAAAGGGAG CCCCCGATTT AGAGCTTGAC GGGGAAAGCC GGCGAACGTG GCGAGAAAGG
9481 AAGGGAAGAA AGCGAAAGGA GCGGGCGCTA AGGCGCTGGC AAGTGTAGCG GTCACGCTGC
9541 GCGTAACCAC CACACCCGCC GCGCTTAATG CGCCGCTACA GGGCGCGTAC TATGGTTGCT
9601 TTGACGTATG CGGTGTGAAA TACCGCACAG ATGCGTAAGG AGAAAATACC GCATCAGGCG
9661 CCATTCGCCA TTCAGGCTGC GCAACTGTTG GGAAGGGCGA TCGGTGCGGG CCTCTTCGCT
9721 ATTACGCCAG CTGGCGAAAG GGGGATGTGC TGCAAGGCGA TTAAGTTGGG TAACGCCAGG
9781 GTTTTCCCAG TCACGACGTT GTAAAACGAC GGCCAGTGAA TTGATCGAGA TCGTGATCCG
9841 GATCAAGATC CAGATCGAAT TGGAGGCTAC AGTCAGTGGA GAGGACTTTC ACTGACTGAC
9901 TGACTGCGTC TCAACCTCCT AGGG
pLRPC_TRDC P2AW FMC63op TRGC1 (서열 식별 번호:186)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGCGTAATCA
361 TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA
421 GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG TGAGCTAACT CACATTAATT
481 GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA
541 ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC
601 ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG
661 GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC
721 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC
781 CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA
841 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC
901 CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT
961 AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG
1021 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC
1081 AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
1141 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
1201 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
1261 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
1321 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
1381 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
1441 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
1501 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
1561 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTTGCTAG GTTACTGTCA
1621 TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA AAAGAGTTTG TAGAAACGCA
1681 AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT CGGTGGCAGT TTATGGCGGG
1741 CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT TCAAATCCGC TCCCGGCGGA
1801 TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA TAAAACGAAA GGCCCAGTCT
1861 TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC CCTACTCTCG CATGGGTTGC
1921 GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT TATCATCGAA TTTCTGCCAT
1981 TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG CGTTTAAGGG CACCAATAAC
2041 TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA GTACTGTTGT AATTCATTAA
2101 GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA
2161 TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT GAAAACGGGG GCGAAGAAGT
2221 TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT CACCCAGGGA TTGGCTGAGA
2281 CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC CAGGTTTTCA CCGTAACACG
2341 CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC GTCGTGGTAT TCACTCCAGA
2401 GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA ACAAGGGTGA ACACTATCCC
2461 ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC CGGATGAGCA TTCATCAGGC
2521 GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT ATTTTTCTTT ACGGTCTTTA
2581 AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT ACATTGAGCA ACTGACTGAA
2641 ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC AACGGTGGTA TATCCAGTGA
2701 TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT CGATAACTCA AAAAATACGC
2761 CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC TCTTACGTGC CGATCAACGT
2821 CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG CGTATCACGA GGCCAGCTTG
2881 GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG TTTGGAACAA GAGTCCACTA
2941 TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG TCTATCAGGG CGATGGCCCA
3001 CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA GGTGCCGTAA AGCACTAAAT
3061 CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG GAAAGCCGGC GAACGTGGCG
3121 AGAAAGGAAG GGAAGAAAGC GAAAGGAGCG GGCGCTAAGG CGCTGGCAAGTGTAGCGGTC
3181 ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC CGCTACAGGG CGCGTACTAT
3241 GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG CGTAAGGAGA AAATACCGCA
3301 TCAGGCGCCA TTCGCCATTC AGGCTGCGCA ACTGTTGGGA AGGGCGATCG GTGCGGGCCT
3361 CTTCGCTATT ACGCCAGCTG GCGAAAGGGG GATGTGCTGC AAGGCGATTA AGTTGGGTAA
3421 CGCCAGGGTT TTCCCAGTCA CGACGTTGTA AAACGACGGC CAGTGAATTG ATCGAGATCG
3481 TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT CAGTGGAGAG GACTTTCACT
3541 GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT TATTGACTAG TTATTAATAG
3601 TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT
3661 ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG
3721 ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT
3781 TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT
3841 ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG CCCAGTACAT GACCTTATGG
3901 GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG
3961 TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC
4021 CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA
4081 TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC
4141 TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG TTAGACCAGA TCTGAGCCTG
4201 GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT CAATAAAGCT TGCCTTGAGT
4261 GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT AACTAGAGAT CCCTCAGACC
4321 CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA ACAGGGACTT GAAAGCGAAA
4381 GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG CTGAAGCGCG CACGGCAAGA
4441 GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA CTAGCGGAGG CTAGAAGGAG
4501 AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA TTAGATAAAT GGGAAAAAAT
4561 TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA CATATAGTTA GGGCAAGCAG
4621 GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG ACATCAGAAG GCTGTAGACA
4681 AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA GAAGAACTTA GATCATTATA
4741 TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA GATGTAAAAG ACACCAAGGA
4801 AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG AAAAAGGCACAGCAAGCGAT
4861 CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA TTGGAGAAGT GAATTATATA
4921 AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC CACCAAGGCA AAGAGAAGAG
4981 TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT GTTCCTTGGG TTCTTGGGAG
5041 CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC GGTACAGGCC AGACAATTAT
5101 TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC TATTGAGGCG CAACAGCATC
5161 TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC AAGAATCCTG GCTGTGGAAA
5221 GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG CTCTGGAAAA CTCATTTGCA
5281 CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC TCTGGAACAG ATTTGGAATA
5341 ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA CACAAGCTTA ATACACTCCT
5401 TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA AGAATTATTG GAATTAGATA
5461 AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG GCTGTGGTAT ATAAAATTAT
5521 TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT TTTTGCTGTA CTTTCTATAG
5581 TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA GACCCACCTC CCAATCCCGA
5641 GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT TAAAAGAAAA GGGGGGATTG
5701 GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC AACAGACATA CAAACTAAAG
5761 AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT TTATTACAGG GACAGCAGAA
5821 ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT CAGTGGGCAG AGCGCACATC
5881 GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT TGAACCGGTG CCTAGAGAAG
5941 GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG CTCCGCCTTT TTCCCGAGGG
6001 TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC GTTCTTTTTC GCAACGGGTT
6061 TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC GGGCCTGGCC TCTTTACGGG
6121 TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG GCTGCAGTAC GTGATTCTTG
6181 ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG GCCTTGCGCT TAAGGAGCCC
6241 CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG GGGCCGCCGC GTGCGAATCT
6301 GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC TCTAGCCATT TAAAATTTTT
6361 GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT TGTAAATGCG GGCCAAGATC
6421 TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA CGGGGCCCGT GCGTCCCAGC
6481 GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC GAGAATCGGA CGGGGGTAGT
6541 CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC GCCGTGTATC GCCCCGCCCT
6601 GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC GGAAAGATGG CCGCTTCCCG
6661 GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC GGGAGAGCGG GCGGGTGAGT
6721 CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT CGCTTCATGT GACTCCACGG
6781 AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG CTTTTGGAGT ACGTCGTCTT
6841 TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA CACTGAGTGG GTGGAGACTG
6901 AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA ATTTGCCCTT TTTGAGTTTG
6961 GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG TTTTTTTCTT CCATTTCAGG
7021 TGTCGTGAAA ACTACCCCTC AGAGCCGCCA CCATGCTTCT CCTGGTGACA AGCCTTCTGC
7081 TCTGTGAGTT ACCACACCCA GCATTCCTCC TGATCCCAAG TCAGCCTCAT ACCAAACCAT
7141 CCGTTTTTGT CATGAAAAAT GGAACAAATG TCGCTTGTCT GGTGAAGGAA TTCTACCCCA
7201 AGGATATAAG AATAAATCTC GTGTCATCCA AGAAGATAAC AGAGTTTGAT CCTGCTATTG
7261 TCATCTCTCC CAGTGGGAAG TACAATGCTG TCAAGCTTGG TAAATATGAA GATTCAAATT
7321 CAGTGACATG TTCAGTTCAA CACGACAATA AAACTGTGCA CTCCACTGAC TTTGAAGTGA
7381 AGACAGATTC TACAGATCAC GTAAAACCAA AGGAAACTGA AAACACAAAG CAACCTTCAA
7441 AGAGCTGCCA TAAACCCAAA GCCATAGTTC ATACCGAGAA GGTGAACATG ATGTCCCTCA
7501 CAGTGCTTGG GCTACGAATG CTGTTTGCAA AGACTGTTGC CGTCAATTTT CTCTTGACTG
7561 CCAAGTTATT TTTCTTGGGG TCAGGCGCTA CTAACTTCAG CCTGCTGAAG CAGGCTGGAG
7621 ACGTGGAGGA GAACCCTGGA CCTATGCTAC TACTTGTGAC CTCACTATTG TTATGCGAAC
7681 TCCCTCATCC CGCATTCTTG CTGATTCCAG ACATTCAGAT GACTCAAACA ACTTCCAGCC
7741 TCTCCGCCTC ACTCGGCGAC CGCGTAACAA TAAGCTGTCG GGCCTCGCAA GATATTAGTA
7801 AGTACCTGAA TTGGTATCAG CAAAAACCCG ATGGTACAGT CAAGCTTCTG ATCTACCATA
7861 CCAGTCGTCT GCACAGCGGT GTCCCCAGCA GGTTCAGCGG CTCAGGATCT GGTACCGATT
7921 ATTCACTGAC GATTTCCAAC CTTGAGCAGG AGGACATCGC CACCTACTTC TGCCAGCAGG
7981 GTAATACTCT GCCGTACACA TTCGGGGGCG GTACCAAGCT CGAGATCACG GGTTCAACAA
8041 GCGGTTCTGG CAAGCCAGGC AGCGGCGAGG GGAGTACAAA GGGGGAGGTG AAGTTGCAGG
8101 AAAGTGGCCC TGGATTGGTG GCCCCGAGCC AGAGTCTGTC TGTCACCTGC ACAGTTTCCG
8161 GAGTAAGTCT GCCTGATTAC GGAGTGTCCT GGATCAGACA GCCACCTCGA AAGGGCTTGG
8221 AGTGGCTTGG GGTCATTTGG GGCAGTGAAA CCACATACTA CAACAGCGCT CTTAAGTCCA
8281 GGCTCACTAT CATCAAGGAC AATTCAAAGA GCCAAGTATT CTTGAAAATG AATTCCCTGC
8341 AGACTGATGA CACCGCTATT TATTATTGCG CTAAACATTA TTACTATGGA GGTTCTTATG
8401 CCATGGACTA CTGGGGGCAG GGTACCTCTG TGACAGTGAG TTCAGCTGCA GCTGGAGGTG
8461 GAGGTAGCGG AGGCGGTGGT AGTGGAGGGG GTGGTTCTCT GGAAGATAAA CAACTTGATG
8521 CAGATGTTTC CCCCAAGCCC ACTATTTTTC TTCCTTCAAT TGCTGAAACA AAGCTCCAGA
8581 AGGCTGGAAC ATACCTTTGT CTTCTTGAGA AATTTTTCCC TGATGTTATT AAGATACATT
8641 GGCAAGAAAA GAAGAGCAAC ACGATTCTGG GATCCCAGGA GGGGAACACC ATGAAGACTA
8701 ACGACACATA CATGAAATTT AGCTGGTTAA CGGTGCCAGA AAAGTCACTG GACAAAGAAC
8761 ACAGATGTAT CGTCAGACAT GAGAATAATA AAAACGGAGT TGATCAAGAA ATTATCTTTC
8821 CTCCAATAAA GACAGATGTC ATCACAATGG ATCCCAAAGA CAATTGTTCA AAAGATGCAA
8881 ATGATACACT ACTGCTGCAG CTCACAAACA CCTCTGCATA TTACATGTAC CTCCTCCTGC
8941 TCCTCAAGAG TGTGGTCTAT TTTGCCATCA TCACCTGCTG TCTGCTTAGA AGAACGGCTT
9001 TCTGCTGCAA TGGAGAGAAA TCATAATGAG ATATCGAGCA TCTTACCGCC ATTTATACCC
9061 ATATTTGTTC TGTTTTTCTT GATTTGGGTA TACATTTAAA TGTTAATAAA ACAAAATGGT
9121 GGGGCAATCA TTTACATTTT TAGGGATATG TAATTACTAG TTCAGGTGTA TTGCCACAAG
9181 ACAAACATGT TAAGAAACTT TCCCGTTATT TACGCTCTGT TCCTGTTAAT CAACCTCTGG
9241 ATTACAAAAT TTGTGAAAGA TTGACTGATA TTCTTAACTA TGTTGCTCCT TTTACGCTGT
9301 GTGGATATGC TGCTTTATAG CCTCTGTATC TAGCTATTGC TTCCCGTACG GCTTTCGTTT
9361 TCTCCTCCTT GTATAAATCC TGGTTGCTGT CTCTTTTAGA GGAGTTGTGG CCCGTTGTCC
9421 GTCAACGTGG CGTGGTGTGC TCTGTGTTTG CTGACGCAAC CCCCACTGGC TGGGGCATTG
9481 CCACCACCTG TCAACTCCTT TCTGGGACTT TCGCTTTCCC CCTCCCGATC GCCACGGCAG
9541 AACTCATCGC CGCCTGCCTT GCCCGCTGCT GGACAGGGGC TAGGTTGCTG GGCACTGATA
9601 ATTCCGTGGT GTTGTCAGTA CTGGTACCTT TAAGACCAAT GACTTACAAG GCAGCTGTAG
9661 ATCTTAGCCA CTTTTTAAAA GAAAAGGGGG GACTGGAAGG GCTAATTCAC TCCCAAAGAA
9721 GACAAGATCT GCTTTTTGCC TGTACTGGGT CTCTCTGGTT AGACCAGATC TGAGCCTGGG
9781 AGCTCTCTGG CTAACTAGGG AACCCACTGC TTAAGCCTCA ATAAAGCTTG CCTTGAGTGC
9841 TTCAA
pLRPCU TRDC P2AW FMC63op TRGC1 (서열 식별 번호:187)
1 GACATTGATT ATTGACTAGT TATTAATAGT AATCAATTAC GGGGTCATTA GTTCATAGCC
61 CATATATGGA GTTCCGCGTT ACATAACTTA CGGTAAATGG CCCGCCTGGC TGACCGCCCA
121 ACGACCCCCG CCCATTGACG TCAATAATGA CGTATGTTCC CATAGTAACG CCAATAGGGA
181 CTTTCCATTG ACGTCAATGG GTGGAGTATT TACGGTAAAC TGCCCACTTG GCAGTACATC
241 AAGTGTATCA TATGCCAAGT ACGCCCCCTA TTGACGTCAA TGACGGTAAA TGGCCCGCCT
301 GGCATTATGC CCAGTACATG ACCTTATGGG ACTTTCCTAC TTGGCAGTAC ATCTACGTAT
361 TAGTCATCGC TATTACCATG GTGATGCGGT TTTGGCAGTA CATCAATGGG CGTGGATAGC
421 GGTTTGACTC ACGGGGATTT CCAAGTCTCC ACCCCATTGA CGTCAATGGG AGTTTGTTTT
481 GGCACCAAAA TCAACGGGAC TTTCCAAAAT GTCGTAACAA CTCCGCCCCA TTGACGCAAA
541 TGGGCGGTAG GCGTGTACGG TGGGAGGTCT ATATAAGCAG AGCTCGTTTA GTGAACCGGG
601 TCTCTCTGGT TAGACCAGAT CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG
661 CTTAAGCCTC AATAAAGCTT GCCTTGAGTG CTCAAAGTAG TGTGTGCCCG TCTGTTGTGT
721 GACTCTGGTA ACTAGAGATC CCTCAGACCC TTTTAGTCAG TGTGGAAAAT CTCTAGCAGT
781 GGCGCCCGAA CAGGGACTTG AAAGCGAAAG TAAAGCCAGA GGAGATCTCT CGACGCAGGA
841 CTCGGCTTGC TGAAGCGCGC ACGGCAAGAG GCGAGGGGCG GCGACTGGTG AGTACGCCAA
901 AAATTTTGAC TAGCGGAGGC TAGAAGGAGA GAGTAGGGTG CGAGAGCGTC GGTATTAAGC
961 GGGGGAGAAT TAGATAAATG GGAAAAAATT CGGTTAAGGC CAGGGGGAAA GAAACAATAT
1021 AAACTAAAAC ATATAGTTAG GGCAAGCAGG GAGCTAGAAC GATTCGCAGT TAATCCTGGC
1081 CTTTTAGAGA CATCAGAAGG CTGTAGACAA ATACTGGGAC AGCTACAACC ATCCCTTCAG
1141 ACAGGATCAG AAGAACTTAG ATCATTATAT AATACAATAG CAGTCCTCTA TTGTGTGCAT
1201 CAAAGGATAG ATGTAAAAGA CACCAAGGAA GCCTTAGATA AGATAGAGGA AGAGCAAAAC
1261 AAAAGTAAGA AAAAGGCACA GCAAGCGATC TTCAGACCTG GAGGAGGCAG GAGGCGATAT
1321 GAGGGACAAT TGGAGAAGTG AATTATATAA ATATAAAGTA GTAAAAATTG AACCATTAGG
1381 AGTAGCACCC ACCAAGGCAA AGAGAAGAGT GGTGCAGAGA GAAAAAAGAGCAGTGGGAAT
1441 AGGAGCTTTG TTCCTTGGGT TCTTGGGAGC AGCAGGAAGC ACTATGGGCG CAGCGTCAAT
1501 GACGCTGACG GTACAGGCCA GACAATTATT GTCTGATATA GTGCAGCAGC AGAACAATTT
1561 GCTGAGGGCT ATTGAGGCGC AACAGCATCT GTTGCAACTC ACAGTCTGGG GCATCAAACA
1621 GCTCCAGGCA AGAATCCTGG CTGTGGAAAG ATACCTAAAG GATCAACAGC TCCTGGGGAT
1681 TTGGGGTTGC TCTGGAAAAC TCATTTGCAC CACTGCTGTG CCTTGGAATG CTAGTTGGAG
1741 TAATAAATCT CTGGAACAGA TTTGGAATAA CATGACCTGG ATGGAGTGGG ACAGAGAAAT
1801 TAACAATTAC ACAAGCTTAA TACACTCCTT AATTGAAGAA TCGCAAAACC AGCAAGAAAA
1861 GAATGAACAA GAATTATTGG AATTAGATAA ATGGGCAAGT TTGTGGAATT GGTTTAACAT
1921 AACAAATTGG CTGTGGTATA TAAAATTATT CATAATGATA GTAGGAGGCT TGGTAGGTTT
1981 AAGAATAGTT TTTGCTGTAC TTTCTATAGT GAATAGAGTT AGGCAGGGAT ATTCACCATT
2041 ATCGTTTCAG ACCCACCTCC CAATCCCGAG GGGACCACGC GTACAAATGG CAGTATTCAT
2101 CCACAATTTT AAAAGAAAAG GGGGGATTGG GGGGTACAGT GCAGGGGAAA GAATAGTAGA
2161 CATAATAGCA ACAGACATAC AAACTAAAGA ATTACAAAAA CAAATTACAA AAATTCAAAA
2221 TTTTCGGGTT TATTACAGGG ACAGCAGAAA TCCACTTTGG AAAGCTGAGC ATCCGGCTCC
2281 GGTGCCCGTC AGTGGGCAGA GCGCACATCG CCCACAGTCC CCGAGAAGTT GGGGGGAGGG
2341 GTCGGCAATT GAACCGGTGC CTAGAGAAGG TGGCGCGGGG TAAACTGGGA AAGTGATGTC
2401 GTGTACTGGC TCCGCCTTTT TCCCGAGGGT GGGGGAGAAC CGTATATAAG TGCAGTAGTC
2461 GCCGTGAACG TTCTTTTTCG CAACGGGTTT GCCGCCAGAA CACAGGTAAG TGCCGTGTGT
2521 GGTTCCCGCG GGCCTGGCCT CTTTACGGGT TATGGCCCTT GCGTGCCTTG AATTACTTCC
2581 ACGCCCCTGG CTGCAGTACG TGATTCTTGA TCCCGAGCTT CGGGTTGGAA GTGGGTGGGA
2641 GAGTTCGAGG CCTTGCGCTT AAGGAGCCCC TTCGCCTCGT GCTTGAGTTG AGGCCTGGCC
2701 TGGGCGCTGG GGCCGCCGCG TGCGAATCTG GTGGCACCTT CGCGCCTGTC TCGCTGCTTT
2761 CGATAAGTCT CTAGCCATTT AAAATTTTTG ATGACCTGCT GCGACGCTTT TTTTCTGGCA
2821 AGATAGTCTT GTAAATGCGG GCCAAGATCT GCACACTGGT ATTTCGGTTT TTGGGGCCGC
2881 GGGCGGCGAC GGGGCCCGTG CGTCCCAGCG CACATGTTCG GCGAGGCGGG GCCTGCGAGC
2941 GCGGCCACCG AGAATCGGAC GGGGGTAGTC TCAAGCTGGC CGGCCTGCTC TGGTGCCTGG
3001 CCTCGCGCCG CCGTGTATCG CCCCGCCCTG GGCGGCAAGG CTGGCCCGGT CGGCACCAGT
3061 TGCGTGAGCG GAAAGATGGC CGCTTCCCGG CCCTGCTGCA GGGAGCTCAA AATGGAGGAC
3121 GCGGCGCTCG GGAGAGCGGG CGGGTGAGTC ACCCACACAA AGGAAAAGGG CCTTTCCGTC
3181 CTCAGCCGTC GCTTCATGTG ACTCCACGGA GTACCGGGCG CCGTCCAGGC ACCTCGATTA
3241 GTTCTCGAGC TTTTGGAGTA CGTCGTCTTT AGGTTGGGGG GAGGGGTTTT ATGCGATGGA
3301 GTTTCCCCAC ACTGAGTGGG TGGAGACTGA AGTTAGGCCA GCTTGGCACT TGATGTAATT
3361 CTCCTTGGAA TTTGCCCTTT TTGAGTTTGG ATCTTGGTTC ATTCTCAAGC CTCAGACAGT
3421 GGTTCAAAGT TTTTTTCTTC CATTTCAGGT GTCGTGAAAA CTACCCCTCA GAGCCGCCAC
3481 CATGCTTCTC CTGGTGACAA GCCTTCTGCT CTGTGAGTTA CCACACCCAG CATTCCTCCT
3541 GATCCCAAGT CAGCCTCATA CCAAACCATC CGTTTTTGTC ATGAAAAATG GAACAAATGT
3601 CGCTTGTCTG GTGAAGGAAT TCTACCCCAA GGATATAAGA ATAAATCTCG TGTCATCCAA
3661 GAAGATAACA GAGTTTGATC CTGCTATTGT CATCTCTCCC AGTGGGAAGT ACAATGCTGT
3721 CAAGCTTGGT AAATATGAAG ATTCAAATTC AGTGACATGT TCAGTTCAAC ACGACAATAA
3781 AACTGTGCAC TCCACTGACT TTGAAGTGAA GACAGATTCT ACAGATCACG TAAAACCAAA
3841 GGAAACTGAA AACACAAAGC AACCTTCAAA GAGCTGCCAT AAACCCAAAG CCATAGTTCA
3901 TACCGAGAAG GTGAACATGA TGTCCCTCAC AGTGCTTGGG CTACGAATGC TGTTTGCAAA
3961 GACTGTTGCC GTCAATTTTC TCTTGACTGC CAAGTTATTT TTCTTGGGGT CAGGCGCTAC
4021 TAACTTCAGC CTGCTGAAGC AGGCTGGAGA CGTGGAGGAG AACCCTGGAC CTATGCTACT
4081 ACTTGTGACC TCACTATTGT TATGCGAACT CCCTCATCCC GCATTCTTGC TGATTCCAGA
4141 CATTCAGATG ACTCAAACAA CTTCCAGCCT CTCCGCCTCA CTCGGCGACC GCGTAACAAT
4201 AAGCTGTCGG GCCTCGCAAG ATATTAGTAA GTACCTGAAT TGGTATCAGC AAAAACCCGA
4261 TGGTACAGTC AAGCTTCTGA TCTACCATAC CAGTCGTCTG CACAGCGGTG TCCCCAGCAG
4321 GTTCAGCGGC TCAGGATCTG GTACCGATTA TTCACTGACG ATTTCCAACC TTGAGCAGGA
4381 GGACATCGCC ACCTACTTCT GCCAGCAGGG TAATACTCTG CCGTACACAT TCGGGGGCGG
4441 TACCAAGCTC GAGATCACGG GTTCAACAAG CGGTTCTGGC AAGCCAGGCA GCGGCGAGGG
4501 GAGTACAAAG GGGGAGGTGA AGTTGCAGGA AAGTGGCCCT GGATTGGTGG CCCCGAGCCA
4561 GAGTCTGTCT GTCACCTGCA CAGTTTCCGG AGTAAGTCTG CCTGATTACG GAGTGTCCTG
4621 GATCAGACAG CCACCTCGAA AGGGCTTGGA GTGGCTTGGG GTCATTTGGG GCAGTGAAAC
4681 CACATACTAC AACAGCGCTC TTAAGTCCAG GCTCACTATC ATCAAGGACA ATTCAAAGAG
4741 CCAAGTATTC TTGAAAATGA ATTCCCTGCA GACTGATGAC ACCGCTATTT ATTATTGCGC
4801 TAAACATTAT TACTATGGAG GTTCTTATGC CATGGACTAC TGGGGGCAGG GTACCTCTGT
4861 GACAGTGAGT TCAGCTGCAG CTGGAGGTGG AGGTAGCGGA GGCGGTGGTA GTGGAGGGGG
4921 TGGTTCTCTG GAAGATAAAC AACTTGATGC AGATGTTTCC CCCAAGCCCA CTATTTTTCT
4981 TCCTTCAATT GCTGAAACAA AGCTCCAGAA GGCTGGAACA TACCTTTGTC TTCTTGAGAA
5041 ATTTTTCCCT GATGTTATTA AGATACATTG GCAAGAAAAG AAGAGCAACA CGATTCTGGG
5101 ATCCCAGGAG GGGAACACCA TGAAGACTAA CGACACATAC ATGAAATTTA GCTGGTTAAC
5161 GGTGCCAGAA AAGTCACTGG ACAAAGAACA CAGATGTATC GTCAGACATG AGAATAATAA
5221 AAACGGAGTT GATCAAGAAA TTATCTTTCC TCCAATAAAG ACAGATGTCA TCACAATGGA
5281 TCCCAAAGAC AATTGTTCAA AAGATGCAAA TGATACACTA CTGCTGCAGC TCACAAACAC
5341 CTCTGCATAT TACATGTACC TCCTCCTGCT CCTCAAGAGT GTGGTCTATT TTGCCATCAT
5401 CACCTGCTGT CTGCTTAGAA GAACGGCTTT CTGCTGCAAT GGAGAGAAAT CATAATGAGA
5461 TATCGAGCAT CTTACCGCCA TTTATACCCA TATTTGTTCT GTTTTTCTTG ATTTGGGTAT
5521 ACATTTAAAT GTTAATAAAA CAAAATGGTG GGGCAATCAT TTACATTTTT AGGGATATGT
5581 AATTACTAGT TCAGGTGTAT TGCCACAAGA CAAACATGTT AAGAAACTTT CCCGTTATTT
5641 ACGCTCTGTT CCTGTTAATC AACCTCTGGA TTACAAAATT TGTGAAAGAT TGACTGATAT
5701 TCTTAACTAT GTTGCTCCTT TTACGCTGTG TGGATATGCT GCTTTATAGC CTCTGTATCT
5761 AGCTATTGCT TCCCGTACGG CTTTCGTTTT CTCCTCCTTG TATAAATCCT GGTTGCTGTC
5821 TCTTTTAGAG GAGTTGTGGC CCGTTGTCCG TCAACGTGGC GTGGTGTGCT CTGTGTTTGC
5881 TGACGCAACC CCCACTGGCT GGGGCATTGC CACCACCTGT CAACTCCTTT CTGGGACTTT
5941 CGCTTTCCCC CTCCCGATCG CCACGGCAGA ACTCATCGCC GCCTGCCTTG CCCGCTGCTG
6001 GACAGGGGCT AGGTTGCTGG GCACTGATAA TTCCGTGGTG TTGTCAGTAC TGGTACCTTT
6061 AAGACCAATG ACTTACAAGG CAGCTGTAGA TCTTAGCCAC TTTTTAAAAG AAAAGGGGGG
6121 ACTGGAAGGG CTAATTCACT CCCAAAGAAG ACAAGATCTG CTTTTTGCCT GTACTGGGTC
6181 TCTCTGGTTA GACCAGATCT GAGCCTGGGA GCTCTCTGGC TAACTAGGGA ACCCACTGCT
6241 TAAGCCTCAA TAAAGCTTGC CTTGAGTGCT TCAAGTAGTG TGTGCCCGTC TGTTGTGTGA
6301 CTCTGGTAAC TAGAGATCCC TCAGACCCTT TTAGTCAGTG TGGAAAATCT CTAGCATGAT
6361 CATAATCAAG CCATATCACA TCTGTAGAGG TTTACTTGCT TTAAAAAACC TCCACACCTC
6421 CCCCTGAACC TGAAACATAA AATGAATGCA ATTGTTGTTG TTAACTTGTT TATTGCAGCT
6481 TATAATGGTT ACAAATAAAG CAATAGCATC ACAAATTTCA CAAATAAAGC ATTTTTTTCA
6541 CTGCATTCTA GTTGTGGTTT GTCCAAACTC ATCAATGTAT CTTATCATGT CTGGATCTGC
6601 GTCGACACGA AGAGACGACT GACTGACTGA CTGGAAAGAG GAAGGGCTGG AAGAGGAAGG
6661 AGCTTGATCC AGATCCCGAT CTCGATCCAG ATCCGGATCG CAGCTTGGCG TAATCATGGT
6721 CATAGCTGTT TCCTGTGTGA AATTGTTATC CGCTCACAAT TCCACACAAC ATACGAGCCG
6781 GAAGCATAAA GTGTAAAGCC TGGGGTGCCT AATGAGTGAG CTAACTCACA TTAATTGCGT
6841 TGCGCTCACT GCCCGCTTTC CAGTCGGGAA ACCTGTCGTG CCAGCTGCAT TAATGAATCG
6901 GCCAACGCGC GGGGAGAGGC GGTTTGCGTA TTGGGCGCTC TTCCGCTTCC TCGCTCACTG
6961 ACTCGCTGCG CTCGGTCGTT CGGCTGCGGC GAGCGGTATC AGCTCACTCA AAGGCGGTAA
7021 TACGGTTATC CACAGAATCA GGGGATAACG CAGGAAAGAA CATGTGAGCA AAAGGCCAGC
7081 AAAAGGCCAG GAACCGTAAA AAGGCCGCGT TGCTGGCGTT TTTCCATAGG CTCCGCCCCC
7141 CTGACGAGCA TCACAAAAAT CGACGCTCAA GTCAGAGGTG GCGAAACCCG ACAGGACTAT
7201 AAAGATACCA GGCGTTTCCC CCTGGAAGCT CCCTCGTGCG CTCTCCTGTT CCGACCCTGC
7261 CGCTTACCGG ATACCTGTCC GCCTTTCTCC CTTCGGGAAG CGTGGCGCTT TCTCATAGCT
7321 CACGCTGTAG GTATCTCAGT TCGGTGTAGG TCGTTCGCTC CAAGCTGGGC TGTGTGCACG
7381 AACCCCCCGT TCAGCCCGAC CGCTGCGCCT TATCCGGTAA CTATCGTCTT GAGTCCAACC
7441 CGGTAAGACA CGACTTATCG CCACTGGCAG CAGCCACTGG TAACAGGATT AGCAGAGCGA
7501 GGTATGTAGG CGGTGCTACA GAGTTCTTGA AGTGGTGGCC TAACTACGGC TACACTAGAA
7561 GAACAGTATT TGGTATCTGC GCTCTGCTGA AGCCAGTTAC CTTCGGAAAA AGAGTTGGTA
7621 GCTCTTGATC CGGCAAACAA ACCACCGCTG GTAGCGGTGG TTTTTTTGTT TGCAAGCAGC
7681 AGATTACGCG CAGAAAAAAA GGATCTCAAG AAGATCCTTT GATCTTTTCT ACGGGGTCTG
7741 ACGCTCAGTG GAACGAAAAC TCACGTTAAG GGATTTTGGT CATGAGATTA TCAAAAAGGA
7801 TCTTCACCTA GATCCTTTTA AATTAAAAAT GAAGTTTTAA ATCAATCTAA AGTATATATG
7861 AGTAAACTTG GTCTGACAGT TACCAATGCT TAATCAGTGA GGCACCTATC TCAGCGATCT
7921 GTCTATTTCG TTCATCCATA GTTGCCTGAC TCCCCGTCGT TGCTAGGTTA CTGTCATGAG
7981 CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAAAG AGTTTGTAGA AACGCAAAAA
8041 GGCCATCCGT CAGGATGGCC TTCTGCTTAA TTTGATCGGT GGCAGTTTAT GGCGGGCGTC
8101 CTGCCCGCCA CCCTCCGGGC CGTTGCTTCG CAACGTTCAA ATCCGCTCCC GGCGGATTTG
8161 TCCTACTCAG GAGAGCGTTC ACCGACAAAC AACAGATAAA ACGAAAGGCC CAGTCTTTCG
8221 ACTGAGCCTT TCGTTTTATT TGATGCCTGG CAGTTCCCTA CTCTCGCATG GGTTGCGGCC
8281 GCCCGGGCCG TCGACCAATT CTCATGTTTG ACAGCTTATC ATCGAATTTC TGCCATTCAT
8341 CCGCTTATTA TCACTTATTC AGGCGTAGCA ACCAGGCGTT TAAGGGCACC AATAACTGCC
8401 TTAAAAAAAT TACGCCCCGC CCTGCCACTC ATCGCAGTAC TGTTGTAATT CATTAAGCAT
8461 TCTGCCGACA TGGAAGCCAT CACAAACGGC ATGATGAACC TGAATCGCCA GCGGCATCAG
8521 CACCTTGTCG CCTTGCGTAT AATATTTGCC CATGGTGAAA ACGGGGGCGA AGAAGTTGTC
8581 CATATTGGCC ACGTTTAAAT CAAAACTGGT GAAACTCACC CAGGGATTGG CTGAGACGAA
8641 AAACATATTC TCAATAAACC CTTTAGGGAA ATAGGCCAGG TTTTCACCGT AACACGCCAC
8701 ATCTTGCGAA TATATGTGTA GAAACTGCCG GAAATCGTCG TGGTATTCAC TCCAGAGCGA
8761 TGAAAACGTT TCAGTTTGCT CATGGAAAAC GGTGTAACAA GGGTGAACAC TATCCCATAT
8821 CACCAGCTCA CCGTCTTTCA TTGCCATACG AAATTCCGGA TGAGCATTCA TCAGGCGGGC
8881 AAGAATGTGA ATAAAGGCCG GATAAAACTT GTGCTTATTT TTCTTTACGG TCTTTAAAAA
8941 GGCCGTAATA TCCAGCTGAA CGGTCTGGTT ATAGGTACAT TGAGCAACTG ACTGAAATGC
9001 CTCAAAATGT TCTTTACGAT GCCATTGGGA TATATCAACG GTGGTATATC CAGTGATTTT
9061 TTTCTCCATT TTAGCTTCCT TAGCTCCTGA AAATCTCGAT AACTCAAAAA ATACGCCCGG
9121 TAGTGATCTT ATTTCATTAT GGTGAAAGTT GGAACCTCTT ACGTGCCGAT CAACGTCTCA
9181 TTTTCGCCAA AAGTGACATT AACCTATAAA AATAGGCGTA TCACGAGGCC AGCTTGGGAA
9241 ACCATAAGAC CGAGATAGAG TTGAGTGTTG TTCCAGTTTG GAACAAGAGT CCACTATTAA
9301 AGAACGTGGA CTCCAACGTC AAAGGGCGAA AAACCGTCTA TCAGGGCGAT GGCCCACTAC
9361 GTGAACCATC ACCCAAATCA AGTTTTTTGG GGTCGAGGTG CCGTAAAGCA CTAAATCGGA
9421 ACCCTAAAGG GAGCCCCCGA TTTAGAGCTT GACGGGGAAA GCCGGCGAAC GTGGCGAGAA
9481 AGGAAGGGAA GAAAGCGAAA GGAGCGGGCG CTAAGGCGCT GGCAAGTGTA GCGGTCACGC
9541 TGCGCGTAAC CACCACACCC GCCGCGCTTA ATGCGCCGCT ACAGGGCGCG TACTATGGTT
9601 GCTTTGACGT ATGCGGTGTG AAATACCGCA CAGATGCGTA AGGAGAAAAT ACCGCATCAG
9661 GCGCCATTCG CCATTCAGGC TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC
9721 GCTATTACGC CAGCTGGCGA AAGGGGGATG TGCTGCAAGG CGATTAAGTT GGGTAACGCC
9781 AGGGTTTTCC CAGTCACGAC GTTGTAAAAC GACGGCCAGT GAATTGATCG AGATCGTGAT
9841 CCGGATCAAG ATCCAGATCG AATTGGAGGC TACAGTCAGT GGAGAGGACT TTCACTGACT
9901 GACTGACTGC GTCTCAACCT CCTAGGG
pLCUS FMC63 TRDC P2AW TRGC1 (서열 식별 번호:188)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
361 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
421 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
481 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
541 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
601 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
661 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
721 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
781 GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG
841 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG
901 GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA
961 CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG
1021 AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT
1081 TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT
1141 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG
1201 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG
1261 TCGTTGCTAG GTTACTGTCA TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA
1321 AAAGAGTTTG TAGAAACGCA AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT
1381 CGGTGGCAGT TTATGGCGGG CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT
1441 TCAAATCCGC TCCCGGCGGA TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA
1501 TAAAACGAAA GGCCCAGTCT TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC
1561 CCTACTCTCG CATGGGTTGC GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT
1621 TATCATCGAA TTTCTGCCAT TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG
1681 CGTTTAAGGG CACCAATAAC TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA
1741 GTACTGTTGT AATTCATTAA GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG
1801 AACCTGAATC GCCAGCGGCA TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT
1861 GAAAACGGGG GCGAAGAAGT TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT
1921 CACCCAGGGA TTGGCTGAGA CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC
1981 CAGGTTTTCA CCGTAACACG CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC
2041 GTCGTGGTAT TCACTCCAGA GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA
2101 ACAAGGGTGA ACACTATCCC ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC
2161 CGGATGAGCA TTCATCAGGC GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT
2221 ATTTTTCTTT ACGGTCTTTA AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT
2281 ACATTGAGCA ACTGACTGAA ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC
2341 AACGGTGGTA TATCCAGTGA TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT
2401 CGATAACTCA AAAAATACGC CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC
2461 TCTTACGTGC CGATCAACGT CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG
2521 CGTATCACGA GGCCAGCTTG GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG
2581 TTTGGAACAA GAGTCCACTA TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG
2641 TCTATCAGGG CGATGGCCCA CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA
2701 GGTGCCGTAA AGCACTAAAT CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG
2761 GAAAGCCGGC GAACGTGGCG AGAAAGGAAG GGAAGAAAGCGAAAGGAGCGGGCGCTAAGG
2821 CGCTGGCAAG TGTAGCGGTC ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC
2881 CGCTACAGGG CGCGTACTAT GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG
2941 CGTAAGGAGA AAATACATCG TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT
3001 CAGTGGAGAG GACTTTCACT GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT
3061 TATTGACTAG TTATTAATAG TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG
3121 AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC
3181 GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT
3241 GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC
3301 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
3361 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
3421 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
3481 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
3541 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
3601 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG
3661 TTAGACCAGA TCTGAGCCTG GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT
3721 CAATAAAGCT TGCCTTGAGT GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT
3781 AACTAGAGAT CCCTCAGACC CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA
3841 ACAGGGACTT GAAAGCGAAA GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG
3901 CTGAAGCGCG CACGGCAAGA GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA
3961 CTAGCGGAGG CTAGAAGGAG AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA
4021 TTAGATAAAT GGGAAAAAAT TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA
4081 CATATAGTTA GGGCAAGCAG GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG
4141 ACATCAGAAG GCTGTAGACA AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA
4201 GAAGAACTTA GATCATTATA TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA
4261 GATGTAAAAG ACACCAAGGA AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG
4321 AAAAAGGCAC AGCAAGCGAT CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA
4381 TTGGAGAAGT GAATTATATA AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC
4441 CACCAAGGCA AAGAGAAGAG TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT
4501 GTTCCTTGGG TTCTTGGGAG CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC
4561 GGTACAGGCC AGACAATTAT TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC
4621 TATTGAGGCG CAACAGCATC TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC
4681 AAGAATCCTG GCTGTGGAAA GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG
4741 CTCTGGAAAA CTCATTTGCA CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC
4801 TCTGGAACAG ATTTGGAATA ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA
4861 CACAAGCTTA ATACACTCCT TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA
4921 AGAATTATTG GAATTAGATA AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG
4981 GCTGTGGTAT ATAAAATTAT TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT
5041 TTTTGCTGTA CTTTCTATAG TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA
5101 GACCCACCTC CCAATCCCGA GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT
5161 TAAAAGAAAA GGGGGGATTG GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC
5221 AACAGACATA CAAACTAAAG AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT
5281 TTATTACAGG GACAGCAGAA ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT
5341 CAGTGGGCAG AGCGCACATC GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT
5401 TGAACCGGTG CCTAGAGAAG GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG
5461 CTCCGCCTTT TTCCCGAGGG TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC
5521 GTTCTTTTTC GCAACGGGTT TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC
5581 GGGCCTGGCC TCTTTACGGG TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG
5641 GCTGCAGTAC GTGATTCTTG ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG
5701 GCCTTGCGCT TAAGGAGCCC CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG
5761 GGGCCGCCGC GTGCGAATCT GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC
5821 TCTAGCCATT TAAAATTTTT GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT
5881 TGTAAATGCG GGCCAAGATC TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA
5941 CGGGGCCCGT GCGTCCCAGC GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC
6001 GAGAATCGGA CGGGGGTAGT CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC
6061 GCCGTGTATC GCCCCGCCCT GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC
6121 GGAAAGATGG CCGCTTCCCG GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC
6181 GGGAGAGCGG GCGGGTGAGT CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT
6241 CGCTTCATGT GACTCCACGG AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG
6301 CTTTTGGAGT ACGTCGTCTT TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA
6361 CACTGAGTGG GTGGAGACTG AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA
6421 ATTTGCCCTT TTTGAGTTTG GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG
6481 TTTTTTTCTT CCATTTCAGG TGTCGTGAAA ACTACCCCTC AGAGCCGCCA CCATGCTTCT
6541 CCTGGTGACA AGCCTTCTGC TCTGTGAGTT ACCACACCCA GCATTCCTCC TGATCCCAGA
6601 CATCCAGATG ACACAGACTA CATCCTCCCT GTCTGCCTCT CTGGGAGACA GAGTCACCAT
6661 CAGTTGCAGG GCAAGTCAGG ACATTAGTAA ATATTTAAAT TGGTATCAGC AGAAACCAGA
6721 TGGAACTGTT AAACTCCTGA TCTACCATAC ATCAAGATTA CACTCAGGAG TCCCATCAAG
6781 GTTCAGTGGC AGTGGGTCTG GAACAGATTA TTCTCTCACC ATTAGCAACC TGGAGCAAGA
6841 AGATATTGCC ACTTACTTTT GCCAACAGGG TAATACGCTT CCGTACACGT TCGGAGGGGG
6901 GACTAAGTTG GAAATAACAG GCTCCACCTC TGGATCCGGC AAGCCCGGAT CTGGCGAGGG
6961 ATCCACCAAG GGCGAGGTGA AACTGCAGGA GTCAGGACCT GGCCTGGTGG CGCCCTCACA
7021 GAGCCTGTCC GTCACATGCA CTGTCTCAGG GGTCTCATTA CCCGACTATG GTGTAAGCTG
7081 GATTCGCCAG CCTCCACGAA AGGGTCTGGA GTGGCTGGGA GTAATATGGG GTAGTGAAAC
7141 CACATACTAT AATTCAGCTC TCAAATCCAG ACTGACCATC ATCAAGGACA ACTCCAAGAG
7201 CCAAGTTTTC TTAAAAATGA ACAGTCTGCA AACTGATGAC ACAGCCATTT ACTACTGTGC
7261 CAAACATTAT TACTACGGTG GTAGCTATGC TATGGACTAC TGGGGTCAAG GAACCTCAGT
7321 CACCGTCTCC TCAGCGGCCG CAGGTGGAGG AGGTTCTGGA GGTGGTGGAT CAGGTGGTGG
7381 AGGATCTTTA GAAAGTCAGC CTCATACCAA ACCATCCGTT TTTGTCATGA AAAATGGAAC
7441 AAATGTCGCT TGTCTGGTGA AGGAATTCTA CCCCAAGGAT ATAAGAATAA ATCTCGTGTC
7501 ATCCAAGAAG ATAACAGAGT TTGATCCTGC TATTGTCATC TCTCCCAGTG GGAAGTACAA
7561 TGCTGTCAAG CTTGGTAAAT ATGAAGATTC AAATTCAGTG ACATGTTCAG TTCAACACGA
7621 CAATAAAACT GTGCACTCCA CTGACTTTGA AGTGAAGACA GATTCTACAG ATCACGTAAA
7681 ACCAAAGGAA ACTGAAAACA CAAAGCAACC TTCAAAGAGC TGCCATAAAC CCAAAGCCAT
7741 AGTTCATACC GAGAAGGTGA ACATGATGTC CCTCACAGTG CTTGGGCTAC GAATGCTGTT
7801 TGCAAAGACT GTTGCCGTCA ATTTTCTCTT GACTGCCAAG TTATTTTTCT TGGGGTCAGG
7861 CGCTACTAAC TTCAGCCTGC TGAAGCAGGC TGGAGACGTG GAGGAGAACC CTGGACCTAT
7921 GCTACTACTT GTGACCTCAC TATTGTTATG CGAACTCCCT CATCCCGCAT TCTTGCTGAT
7981 TCCAGATAAA CAACTTGATG CAGATGTTTC CCCCAAGCCC ACTATTTTTC TTCCTTCAAT
8041 TGCTGAAACA AAGCTCCAGA AGGCTGGAAC ATACCTTTGT CTTCTTGAGA AATTTTTCCC
8101 TGATGTTATT AAGATACATT GGCAAGAAAA GAAGAGCAAC ACGATTCTGG GATCCCAGGA
8161 GGGGAACACC ATGAAGACTA ACGACACATA CATGAAATTT AGCTGGTTAA CGGTGCCAGA
8221 AAAGTCACTG GACAAAGAAC ACAGATGTAT CGTCAGACAT GAGAATAATA AAAACGGAGT
8281 TGATCAAGAA ATTATCTTTC CTCCAATAAA GACAGATGTC ATCACAATGG ATCCCAAAGA
8341 CAATTGTTCA AAAGATGCAA ATGATACACT ACTGCTGCAG CTCACAAACA CCTCTGCATA
8401 TTACATGTAC CTCCTCCTGC TCCTCAAGAG TGTGGTCTAT TTTGCCATCA TCACCTGCTG
8461 TCTGCTTAGA AGAACGGCTT TCTGCTGCAA TGGAGAGAAA TCATAATGAG ATATCGAGCA
8521 TCTTACCGCC ATTTATACCC ATATTTGTTC TGTTTTTCTT GATTTGGGTA TACATTTAAA
8581 TGTTAATAAA ACAAAATGGT GGGGCAATCA TTTACATTTT TAGGGATATG TAATTACTAG
8641 TTCAGGTGTA TTGCCACAAG ACAAACATGT TAAGAAACTT TCCCGTTATT TACGCTCTGT
8701 TCCTGTTAAT CAACCTCTGG ATTACAAAAT TTGTGAAAGA TTGACTGATA TTCTTAACTA
8761 TGTTGCTCCT TTTACGCTGT GTGGATATGC TGCTTTATAG CCTCTGTATC TAGCTATTGC
8821 TTCCCGTACG GCTTTCGTTT TCTCCTCCTT GTATAAATCC TGGTTGCTGT CTCTTTTAGA
8881 GGAGTTGTGG CCCGTTGTCC GTCAACGTGG CGTGGTGTGC TCTGTGTTTG CTGACGCAAC
8941 CCCCACTGGC TGGGGCATTG CCACCACCTG TCAACTCCTT TCTGGGACTT TCGCTTTCCC
9001 CCTCCCGATC GCCACGGCAG AACTCATCGC CGCCTGCCTT GCCCGCTGCT GGACAGGGGC
9061 TAGGTTGCTG GGCACTGATA ATTCCGTGGT GTTGTCAGTA CTGGTACCTT TAAGACCAAT
9121 GACTTACAAG GCAGCTGTAG ATCTTAGCCA CTTTTTAAAA GAAAAGGGGG GACTGGAAGG
9181 GCTAATTCAC TCCCAAAGAA GACAAGATCT GCTTTTTGCC TGTACTGGGT CTCTCTGGTT
9241 AGACCAGATC TGAGCCTGGG AGCTCTCTGG CTAACTAGGG AACCCACTGC TTAAGCCTCA
9301 ATAAAGCTTG CCTTGAGTGC TTCAAGTAGT GTGTGCCCGT CTGTTGTGTG ACTCTGGTAA
9361 CTAGAGATCC CTCAGACCCT TTTAGTCAGT GTGGAAAATC TCTAGCA
pLCUS FMC63 TRDC P2AW FMC63op TRGC1 (서열 식별 번호:189)
1 CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT
61 ACGGTTATCC ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA
121 AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC
181 TGACGAGCAT CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA
241 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC
301 GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC
361 ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA
421 ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC
481 GGTAAGACAC GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG
541 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG
601 AACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG
661 CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA
721 GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA
781 CGCTCAGTGG AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGGTGAG GCACCTATCT
841 CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT CCCCGTCGTT GCTAGGTTAC
901 TGTCATGAGC GGATACATAT TTGAATGTAT TTAGAAAAAT AAACAAAAGA GTTTGTAGAA
961 ACGCAAAAAG GCCATCCGTC AGGATGGCCT TCTGCTTAAT TTGATCGGTG GCAGTTTATG
1021 GCGGGCGTCC TGCCCGCCAC CCTCCGGGCC GTTGCTTCGC AACGTTCAAA TCCGCTCCCG
1081 GCGGATTTGT CCTACTCAGG AGAGCGTTCA CCGACAAACA ACAGATAAAA CGAAAGGCCC
1141 AGTCTTTCGA CTGAGCCTTT CGTTTTATTT GATGCCTGGC AGTTCCCTAC TCTCGCATGG
1201 GTTGCGGCCG CCCGGGCCGT CGACCAATTC TCATGTTTGA CAGCTTATCA TCGAATTTCT
1261 GCCATTCATC CGCTTATTAT CACTTATTCA GGCGTAGCAA CCAGGCGTTT AAGGGCACCA
1321 ATAACTGCCT TAAAAAAATT ACGCCCCGCC CTGCCACTCA TCGCAGTACT GTTGTAATTC
1381 ATTAAGCATT CTGCCGACAT GGAAGCCATC ACAAACGGCA TGATGAACCT GAATCGCCAG
1441 CGGCATCAGC ACCTTGTCGC CTTGCGTATA ATATTTGCCC ATGGTGAAAA CGGGGGCGAA
1501 GAAGTTGTCC ATATTGGCCA CGTTTAAATC AAAACTGGTG AAACTCACCC AGGGATTGGC
1561 TGAGACGAAA AACATATTCT CAATAAACCC TTTAGGGAAA TAGGCCAGGT TTTCACCGTA
1621 ACACGCCACA TCTTGCGAAT ATATGTGTAG AAACTGCCGG AAATCGTCGT GGTATTCACT
1681 CCAGAGCGAT GAAAACGTTT CAGTTTGCTC ATGGAAAACG GTGTAACAAG GGTGAACACT
1741 ATCCCATATC ACCAGCTCAC CGTCTTTCAT TGCCATACGA AATTCCGGAT GAGCATTCAT
1801 CAGGCGGGCA AGAATGTGAA TAAAGGCCGG ATAAAACTTG TGCTTATTTT TCTTTACGGT
1861 CTTTAAAAAG GCCGTAATAT CCAGCTGAAC GGTCTGGTTA TAGGTACATT GAGCAACTGA
1921 CTGAAATGCC TCAAAATGTT CTTTACGATG CCATTGGGAT ATATCAACGG TGGTATATCC
1981 AGTGATTTTT TTCTCCATTT TAGCTTCCTT AGCTCCTGAA AATCTCGATA ACTCAAAAAA
2041 TACGCCCGGT AGTGATCTTA TTTCATTATG GTGAAAGTTG GAACCTCTTA CGTGCCGATC
2101 AACGTCTCAT TTTCGCCAAA AGTGACATTA ACCTATAAAA ATAGGCGTAT CACGAGGCCA
2161 GCTTGGGAAA CCATAAGACC GAGATAGAGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC
2221 CACTATTAAA GAACGTGGAC TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG
2281 GCCCACTACG TGAACCATCA CCCAAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC
2341 TAAATCGGAA CCCTAAAGGG AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG
2401 TGGCGAGAAA GGAAGGGAAG AAAGCGAAAG GAGCGGGCGC TAAGGCGCTGGCAAGTGTAG
2461 CGGTCACGCT GCGCGTAACC ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT
2521 ACTATGGTTG CTTTGACGTA TGCGGTGTGA AATACCGCAC AGATGCGTAA GGAGAAAATA
2581 CATCGTGATC CGGATCAAGA TCCAGATCGA ATTGGAGGCT ACAGTCAGTG GAGAGGACTT
2641 TCACTGACTG ACTGACTGCG TCTCAACCTC CTAGGGGACA TTGATTATTG ACTAGTTATT
2701 AATAGTAATC AATTACGGGG TCATTAGTTC ATAGCCCATA TATGGAGTTC CGCGTTACAT
2761 AACTTACGGT AAATGGCCCG CCTGGCTGAC CGCCCAACGA CCCCCGCCCA TTGACGTCAA
2821 TAATGACGTA TGTTCCCATA GTAACGCCAA TAGGGACTTT CCATTGACGT CAATGGGTGG
2881 AGTATTTACG GTAAACTGCC CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC
2941 CCCCTATTGA CGTCAATGAC GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT
3001 TATGGGACTT TCCTACTTGG CAGTACATCT ACGTATTAGT CATCGCTATT ACCATGGTGA
3061 TGCGGTTTTG GCAGTACATC AATGGGCGTG GATAGCGGTT TGACTCACGG GGATTTCCAA
3121 GTCTCCACCC CATTGACGTC AATGGGAGTT TGTTTTGGCA CCAAAATCAA CGGGACTTTC
3181 CAAAATGTCG TAACAACTCC GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG
3241 AGGTCTATAT AAGCAGAGCT CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA CCAGATCTGA
3301 GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT
3361 TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC
3421 AGACCCTTTT AGTCAGTGTG GAAAATCTCT AGCAGTGGCG CCCGAACAGG GACTTGAAAG
3481 CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC GCAGGACTCG GCTTGCTGAA GCGCGCACGG
3541 CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA CGCCAAAAAT TTTGACTAGC GGAGGCTAGA
3601 AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA TTAAGCGGGG GAGAATTAGA TAAATGGGAA
3661 AAAATTCGGT TAAGGCCAGG GGGAAAGAAA CAATATAAAC TAAAACATAT AGTTAGGGCA
3721 AGCAGGGAGC TAGAACGATT CGCAGTTAAT CCTGGCCTTT TAGAGACATC AGAAGGCTGT
3781 AGACAAATAC TGGGACAGCT ACAACCATCC CTTCAGACAG GATCAGAAGA ACTTAGATCA
3841 TTATATAATA CAATAGCAGT CCTCTATTGT GTGCATCAAA GGATAGATGT AAAAGACACC
3901 AAGGAAGCCT TAGATAAGAT AGAGGAAGAG CAAAACAAAA GTAAGAAAAAGGCACAGCAA
3961 GCGATCTTCA GACCTGGAGG AGGCAGGAGG CGATATGAGG GACAATTGGA GAAGTGAATT
4021 ATATAAATAT AAAGTAGTAA AAATTGAACC ATTAGGAGTA GCACCCACCA AGGCAAAGAG
4081 AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT GGGAATAGGA GCTTTGTTCC TTGGGTTCTT
4141 GGGAGCAGCA GGAAGCACTA TGGGCGCAGC GTCAATGACG CTGACGGTAC AGGCCAGACA
4201 ATTATTGTCT GATATAGTGC AGCAGCAGAA CAATTTGCTG AGGGCTATTG AGGCGCAACA
4261 GCATCTGTTG CAACTCACAG TCTGGGGCAT CAAACAGCTC CAGGCAAGAA TCCTGGCTGT
4321 GGAAAGATAC CTAAAGGATC AACAGCTCCT GGGGATTTGG GGTTGCTCTG GAAAACTCAT
4381 TTGCACCACT GCTGTGCCTT GGAATGCTAG TTGGAGTAAT AAATCTCTGG AACAGATTTG
4441 GAATAACATG ACCTGGATGG AGTGGGACAG AGAAATTAAC AATTACACAA GCTTAATACA
4501 CTCCTTAATT GAAGAATCGC AAAACCAGCA AGAAAAGAAT GAACAAGAAT TATTGGAATT
4561 AGATAAATGG GCAAGTTTGT GGAATTGGTT TAACATAACA AATTGGCTGT GGTATATAAA
4621 ATTATTCATA ATGATAGTAG GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG CTGTACTTTC
4681 TATAGTGAAT AGAGTTAGGC AGGGATATTC ACCATTATCG TTTCAGACCC ACCTCCCAAT
4741 CCCGAGGGGA CCACGCGTAC AAATGGCAGT ATTCATCCAC AATTTTAAAA GAAAAGGGGG
4801 GATTGGGGGG TACAGTGCAG GGGAAAGAAT AGTAGACATA ATAGCAACAG ACATACAAAC
4861 TAAAGAATTA CAAAAACAAA TTACAAAAAT TCAAAATTTT CGGGTTTATT ACAGGGACAG
4921 CAGAAATCCA CTTTGGAAAG CTGAGCATCC GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC
4981 ACATCGCCCA CAGTCCCCGA GAAGTTGGGG GGAGGGGTCG GCAATTGAAC CGGTGCCTAG
5041 AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT GATGTCGTGT ACTGGCTCCG CCTTTTTCCC
5101 GAGGGTGGGG GAGAACCGTA TATAAGTGCA GTAGTCGCCG TGAACGTTCT TTTTCGCAAC
5161 GGGTTTGCCG CCAGAACACA GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT
5221 ACGGGTTATG GCCCTTGCGT GCCTTGAATT ACTTCCACGC CCCTGGCTGC AGTACGTGAT
5281 TCTTGATCCC GAGCTTCGGG TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG
5341 AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG
5401 AATCTGGTGG CACCTTCGCG CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG CCATTTAAAA
5461 TTTTTGATGA CCTGCTGCGA CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA
5521 AGATCTGCAC ACTGGTATTT CGGTTTTTGG GGCCGCGGGC GGCGACGGGG CCCGTGCGTC
5581 CCAGCGCACA TGTTCGGCGA GGCGGGGCCT GCGAGCGCGG CCACCGAGAA TCGGACGGGG
5641 GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT GTATCGCCCC
5701 GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA GATGGCCGCT
5761 TCCCGGCCCT GCTGCAGGGA GCTCAAAATG GAGGACGCGG CGCTCGGGAG AGCGGGCGGG
5821 TGAGTCACCC ACACAAAGGA AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT CATGTGACTC
5881 CACGGAGTAC CGGGCGCCGT CCAGGCACCT CGATTAGTTC TCGAGCTTTT GGAGTACGTC
5941 GTCTTTAGGT TGGGGGGAGG GGTTTTATGC GATGGAGTTT CCCCACACTG AGTGGGTGGA
6001 GACTGAAGTT AGGCCAGCTT GGCACTTGAT GTAATTCTCC TTGGAATTTG CCCTTTTTGA
6061 GTTTGGATCT TGGTTCATTC TCAAGCCTCA GACAGTGGTT CAAAGTTTTT TTCTTCCATT
6121 TCAGGTGTCG TGAAAACTAC CCCTCTAGAG CCGCCACCAT GCTTCTCCTG GTGACAAGCC
6181 TTCTGCTCTG TGAGTTACCA CACCCAGCAT TCCTCCTGAT CCCAGACATC CAGATGACAC
6241 AGACTACATC CTCCCTGTCT GCCTCTCTGG GAGACAGAGT CACCATCAGT TGCAGGGCAA
6301 GTCAGGACAT TAGTAAATAT TTAAATTGGT ATCAGCAGAA ACCAGATGGA ACTGTTAAAC
6361 TCCTGATCTA CCATACATCA AGATTACACT CAGGAGTCCC ATCAAGGTTC AGTGGCAGTG
6421 GGTCTGGAAC AGATTATTCT CTCACCATTA GCAACCTGGA GCAAGAAGAT ATTGCCACTT
6481 ACTTTTGCCA ACAGGGTAAT ACGCTTCCGT ACACGTTCGG AGGGGGGACT AAGTTGGAAA
6541 TAACAGGCTC CACCTCTGGA TCCGGCAAGC CCGGATCTGG CGAGGGATCC ACCAAGGGCG
6601 AGGTGAAACT GCAGGAGTCA GGACCTGGCC TGGTGGCGCC CTCACAGAGC CTGTCCGTCA
6661 CATGCACTGT CTCAGGGGTC TCATTACCCG ACTATGGTGT AAGCTGGATT CGCCAGCCTC
6721 CACGAAAGGG TCTGGAGTGG CTGGGAGTAA TATGGGGTAG TGAAACCACA TACTATAATT
6781 CAGCTCTCAA ATCCAGACTG ACCATCATCA AGGACAACTC CAAGAGCCAA GTTTTCTTAA
6841 AAATGAACAG TCTGCAAACT GATGACACAG CCATTTACTA CTGTGCCAAA CATTATTACT
6901 ACGGTGGTAG CTATGCTATG GACTACTGGG GTCAAGGAAC CTCAGTCACC GTCTCCTCAG
6961 CGGCCGCAGG TGGAGGAGGT TCTGGAGGTG GTGGATCAGG TGGTGGAGGA TCTTTAGAAA
7021 GTCAGCCTCA TACCAAACCA TCCGTTTTTG TCATGAAAAA TGGAACAAAT GTCGCTTGTC
7081 TGGTGAAGGA ATTCTACCCC AAGGATATAA GAATAAATCT CGTGTCATCC AAGAAGATAA
7141 CAGAGTTTGA TCCTGCTATT GTCATCTCTC CCAGTGGGAA GTACAATGCT GTCAAGCTTG
7201 GTAAATATGA AGATTCAAAT TCAGTGACAT GTTCAGTTCA ACACGACAAT AAAACTGTGC
7261 ACTCCACTGA CTTTGAAGTG AAGACAGATT CTACAGATCA CGTAAAACCA AAGGAAACTG
7321 AAAACACAAA GCAACCTTCA AAGAGCTGCC ATAAACCCAA AGCCATAGTT CATACCGAGA
7381 AGGTGAACAT GATGTCCCTC ACAGTGCTTG GGCTACGAAT GCTGTTTGCA AAGACTGTTG
7441 CCGTCAATTT TCTCTTGACT GCCAAGTTAT TTTTCTTGGG GTCAGGCGCT ACTAACTTCA
7501 GCCTGCTGAA GCAGGCTGGA GACGTGGAGG AGAACCCTGG ACCTATGCTA CTACTTGTGA
7561 CCTCACTATT GTTATGCGAA CTCCCTCATC CCGCATTCTT GCTGATTCCA GACATTCAGA
7621 TGACTCAAAC AACTTCCAGC CTCTCCGCCT CACTCGGCGA CCGCGTAACA ATAAGCTGTC
7681 GGGCCTCGCA AGATATTAGT AAGTACCTGA ATTGGTATCA GCAAAAACCC GATGGTACAG
7741 TCAAGCTTCT GATCTACCAT ACCAGTCGTC TGCACAGCGG TGTCCCCAGC AGGTTCAGCG
7801 GCTCAGGATC TGGTACCGAT TATTCACTGA CGATTTCCAA CCTTGAGCAa GAGGACATCG
7861 CCACCTACTT CTGCCAGCAG GGTAATACTC TGCCGTACAC ATTCGGGGGC GGTACCAAGC
7921 TCGAGATCAC GGGTTCAACA AGCGGTTCTG GCAAGCCAGG CAGCGGCGAG GGGAGTACAA
7981 AGGGGGAGGT GAAGTTGCAG GAAAGTGGCC CTGGATTGGT GGCCCCGAGC CAGAGTCTGT
8041 CTGTCACCTG CACAGTTTCC GGAGTAAGTC TGCCTGATTA CGGAGTGTCC TGGATCAGAC
8101 AGCCACCTCG AAAGGGCTTG GAGTGGCTTG GGGTCATTTG GGGCAGTGAA ACCACATACT
8161 ACAACAGCGC TCTTAAGTCC AGGCTCACTA TCATCAAGGA CAATTCAAAG AGCCAAGTAT
8221 TCTTGAAAAT GAATTCCCTG CAGACTGATG ACACCGCTAT TTATTATTGC GCTAAACATT
8281 ATTACTATGG AGGTTCTTAT GCCATGGACT ACTGGGGGCA GGGTACCTCT GTGACAGTGA
8341 GTTCAGCTGC AGCTGGAGGT GGAGGTAGCG GAGGCGGTGG TAGTGGAGGG GGTGGTTCTC
8401 TGGAAGATAA ACAACTTGAT GCAGATGTTT CCCCCAAGCC CACTATTTTT CTTCCTTCAA
8461 TTGCTGAAAC AAAGCTCCAG AAGGCTGGAA CATACCTTTG TCTTCTTGAG AAATTTTTCC
8521 CTGATGTTAT TAAGATACAT TGGCAAGAAA AGAAGAGCAA CACGATTCTG GGATCCCAGG
8581 AGGGGAACAC CATGAAGACT AACGACACAT ACATGAAATT TAGCTGGTTA ACGGTGCCAG
8641 AAAAGTCACT GGACAAAGAA CACAGATGTA TCGTCAGACA TGAGAATAAT AAAAACGGAG
8701 TTGATCAAGA AATTATCTTT CCTCCAATAA AGACAGATGT CATCACAATG GATCCCAAAG
8761 ACAATTGTTC AAAAGATGCA AATGATACAC TACTGCTGCA GCTCACAAAC ACCTCTGCAT
8821 ATTACATGTA CCTCCTCCTG CTCCTCAAGA GTGTGGTCTA TTTTGCCATC ATCACCTGCT
8881 GTCTGCTTAG AAGAACGGCT TTCTGCTGCA ATGGAGAGAA ATCATAATGA GATATCGAGC
8941 ATCTTACCGC CATTTATACC CATATTTGTT CTGTTTTTCT TGATTTGGGT ATACATTTAA
9001 ATGTTAATAA AACAAAATGG TGGGGCAATC ATTTACATTT TTAGGGATAT GTAATTACTA
9061 GTTCAGGTGT ATTGCCACAA GACAAACATG TTAAGAAACT TTCCCGTTAT TTACGCTCTG
9121 TTCCTGTTAA TCAACCTCTG GATTACAAAA TTTGTGAAAG ATTGACTGAT ATTCTTAACT
9181 ATGTTGCTCC TTTTACGCTG TGTGGATATG CTGCTTTATA GCCTCTGTAT CTAGCTATTG
9241 CTTCCCGTAC GGCTTTCGTT TTCTCCTCCT TGTATAAATC CTGGTTGCTG TCTCTTTTAG
9301 AGGAGTTGTG GCCCGTTGTC CGTCAACGTG GCGTGGTGTG CTCTGTGTTT GCTGACGCAA
9361 CCCCCACTGG CTGGGGCATT GCCACCACCT GTCAACTCCT TTCTGGGACT TTCGCTTTCC
9421 CCCTCCCGAT CGCCACGGCA GAACTCATCG CCGCCTGCCT TGCCCGCTGC TGGACAGGGG
9481 CTAGGTTGCT GGGCACTGAT AATTCCGTGG TGTTGTCAGT ACTGGTACCT TTAAGACCAA
9541 TGACTTACAA GGCAGCTGTA GATCTTAGCC ACTTTTTAAA AGAAAAGGGG GGACTGGAAG
9601 GGCTAATTCA CTCCCAAAGA AGACAAGATC TGCTTTTTGC CTGTACTGGG TCTCTCTGGT
9661 TAGACCAGAT CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG CTTAAGCCTC
9721 AATAAAGCTT GCCTTGAGTG CTTCAAGTAG TGTGTGCCCG TCTGTTGTGT GACTCTGGTA
9781 ACTAGAGATC CCTCAGACCC TTTTAGTCAG TGTGGAAAAT CTCTAGCATG ATCATAATCA
9841 AGCCATATCA CATCTGTAGA GGTTTACTTG CTTTAAAAAA CCTCCACACC TCCCCCTGAA
9901 CCTGAAACAT AAAATGAATG CAATTGTTGT TGTTAACTTG TTTATTGCAG CTTATAATGG
9961 TTACAAATAA AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC
10021 TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGGATCT GCGTCGACAC
10081 GAAGAGACGA CTGACTGACT GACTGGAAAG AGGAAGGGCT GGAAGAGGAAGGAGCTTGAT
10141 CCAGATCCCG ATCTCGATCC AGATCCGGAT CGCAGCTTGG TCTTCCGCTT CCTCGCTCAC
10201 TGA
pLRPC m971 TRDC T2AW m971op TRGC1 (서열 식별 번호:190)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGCGTAATCA
361 TGGTCATAGC TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA
421 GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT GCCTAATGAG TGAGCTAACT CACATTAATT
481 GCGTTGCGCT CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA
541 ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC
601 ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG
661 GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC
721 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC
781 CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA
841 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC
901 CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT
961 AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG
1021 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC
1081 AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA
1141 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT
1201 AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT
1261 GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG
1321 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG
1381 TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA
1441 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA
1501 TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG
1561 ATCTGTCTAT TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTTGCTAG GTTACTGTCA
1621 TGAGCGGATA CATATTTGAA TGTATTTAGA AAAATAAACA AAAGAGTTTG TAGAAACGCA
1681 AAAAGGCCAT CCGTCAGGAT GGCCTTCTGC TTAATTTGAT CGGTGGCAGT TTATGGCGGG
1741 CGTCCTGCCC GCCACCCTCC GGGCCGTTGC TTCGCAACGT TCAAATCCGC TCCCGGCGGA
1801 TTTGTCCTAC TCAGGAGAGC GTTCACCGAC AAACAACAGA TAAAACGAAA GGCCCAGTCT
1861 TTCGACTGAG CCTTTCGTTT TATTTGATGC CTGGCAGTTC CCTACTCTCG CATGGGTTGC
1921 GGCCGCCCGG GCCGTCGACC AATTCTCATG TTTGACAGCT TATCATCGAA TTTCTGCCAT
1981 TCATCCGCTT ATTATCACTT ATTCAGGCGT AGCAACCAGG CGTTTAAGGG CACCAATAAC
2041 TGCCTTAAAA AAATTACGCC CCGCCCTGCC ACTCATCGCA GTACTGTTGT AATTCATTAA
2101 GCATTCTGCC GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA
2161 TCAGCACCTT GTCGCCTTGC GTATAATATT TGCCCATGGT GAAAACGGGG GCGAAGAAGT
2221 TGTCCATATT GGCCACGTTT AAATCAAAAC TGGTGAAACT CACCCAGGGA TTGGCTGAGA
2281 CGAAAAACAT ATTCTCAATA AACCCTTTAG GGAAATAGGC CAGGTTTTCA CCGTAACACG
2341 CCACATCTTG CGAATATATG TGTAGAAACT GCCGGAAATC GTCGTGGTAT TCACTCCAGA
2401 GCGATGAAAA CGTTTCAGTT TGCTCATGGA AAACGGTGTA ACAAGGGTGA ACACTATCCC
2461 ATATCACCAG CTCACCGTCT TTCATTGCCA TACGAAATTC CGGATGAGCA TTCATCAGGC
2521 GGGCAAGAAT GTGAATAAAG GCCGGATAAA ACTTGTGCTT ATTTTTCTTT ACGGTCTTTA
2581 AAAAGGCCGT AATATCCAGC TGAACGGTCT GGTTATAGGT ACATTGAGCA ACTGACTGAA
2641 ATGCCTCAAA ATGTTCTTTA CGATGCCATT GGGATATATC AACGGTGGTA TATCCAGTGA
2701 TTTTTTTCTC CATTTTAGCT TCCTTAGCTC CTGAAAATCT CGATAACTCA AAAAATACGC
2761 CCGGTAGTGA TCTTATTTCA TTATGGTGAA AGTTGGAACC TCTTACGTGC CGATCAACGT
2821 CTCATTTTCG CCAAAAGTGA CATTAACCTA TAAAAATAGG CGTATCACGA GGCCAGCTTG
2881 GGAAACCATA AGACCGAGAT AGAGTTGAGT GTTGTTCCAG TTTGGAACAA GAGTCCACTA
2941 TTAAAGAACG TGGACTCCAA CGTCAAAGGG CGAAAAACCG TCTATCAGGG CGATGGCCCA
3001 CTACGTGAAC CATCACCCAA ATCAAGTTTT TTGGGGTCGA GGTGCCGTAA AGCACTAAAT
3061 CGGAACCCTA AAGGGAGCCC CCGATTTAGA GCTTGACGGG GAAAGCCGGC GAACGTGGCG
3121 AGAAAGGAAG GGAAGAAAGC GAAAGGAGCG GGCGCTAAGG CGCTGGCAAGTGTAGCGGTC
3181 ACGCTGCGCG TAACCACCAC ACCCGCCGCG CTTAATGCGC CGCTACAGGG CGCGTACTAT
3241 GGTTGCTTTG ACGTATGCGG TGTGAAATAC CGCACAGATG CGTAAGGAGA AAATACCGCA
3301 TCAGGCGCCA TTCGCCATTC AGGCTGCGCA ACTGTTGGGA AGGGCGATCG GTGCGGGCCT
3361 CTTCGCTATT ACGCCAGCTG GCGAAAGGGG GATGTGCTGC AAGGCGATTA AGTTGGGTAA
3421 CGCCAGGGTT TTCCCAGTCA CGACGTTGTA AAACGACGGC CAGTGAATTG ATCGAGATCG
3481 TGATCCGGAT CAAGATCCAG ATCGAATTGG AGGCTACAGT CAGTGGAGAG GACTTTCACT
3541 GACTGACTGA CTGCGTCTCA ACCTCCTAGG GGACATTGAT TATTGACTAG TTATTAATAG
3601 TAATCAATTA CGGGGTCATT AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT
3661 ACGGTAAATG GCCCGCCTGG CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG
3721 ACGTATGTTC CCATAGTAAC GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT
3781 TTACGGTAAA CTGCCCACTT GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT
3841 ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG CCCAGTACAT GACCTTATGG
3901 GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG
3961 TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC
4021 CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA
4081 TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC
4141 TATATAAGCA GAGCTCGTTT AGTGAACCGG GTCTCTCTGG TTAGACCAGA TCTGAGCCTG
4201 GGAGCTCTCT GGCTAACTAG GGAACCCACT GCTTAAGCCT CAATAAAGCT TGCCTTGAGT
4261 GCTCAAAGTA GTGTGTGCCC GTCTGTTGTG TGACTCTGGT AACTAGAGAT CCCTCAGACC
4321 CTTTTAGTCA GTGTGGAAAA TCTCTAGCAG TGGCGCCCGA ACAGGGACTT GAAAGCGAAA
4381 GTAAAGCCAG AGGAGATCTC TCGACGCAGG ACTCGGCTTG CTGAAGCGCG CACGGCAAGA
4441 GGCGAGGGGC GGCGACTGGT GAGTACGCCA AAAATTTTGA CTAGCGGAGG CTAGAAGGAG
4501 AGAGTAGGGT GCGAGAGCGT CGGTATTAAG CGGGGGAGAA TTAGATAAAT GGGAAAAAAT
4561 TCGGTTAAGG CCAGGGGGAA AGAAACAATA TAAACTAAAA CATATAGTTA GGGCAAGCAG
4621 GGAGCTAGAA CGATTCGCAG TTAATCCTGG CCTTTTAGAG ACATCAGAAG GCTGTAGACA
4681 AATACTGGGA CAGCTACAAC CATCCCTTCA GACAGGATCA GAAGAACTTA GATCATTATA
4741 TAATACAATA GCAGTCCTCT ATTGTGTGCA TCAAAGGATA GATGTAAAAG ACACCAAGGA
4801 AGCCTTAGAT AAGATAGAGG AAGAGCAAAA CAAAAGTAAG AAAAAGGCACAGCAAGCGAT
4861 CTTCAGACCT GGAGGAGGCA GGAGGCGATA TGAGGGACAA TTGGAGAAGT GAATTATATA
4921 AATATAAAGT AGTAAAAATT GAACCATTAG GAGTAGCACC CACCAAGGCA AAGAGAAGAG
4981 TGGTGCAGAG AGAAAAAAGA GCAGTGGGAA TAGGAGCTTT GTTCCTTGGG TTCTTGGGAG
5041 CAGCAGGAAG CACTATGGGC GCAGCGTCAA TGACGCTGAC GGTACAGGCC AGACAATTAT
5101 TGTCTGATAT AGTGCAGCAG CAGAACAATT TGCTGAGGGC TATTGAGGCG CAACAGCATC
5161 TGTTGCAACT CACAGTCTGG GGCATCAAAC AGCTCCAGGC AAGAATCCTG GCTGTGGAAA
5221 GATACCTAAA GGATCAACAG CTCCTGGGGA TTTGGGGTTG CTCTGGAAAA CTCATTTGCA
5281 CCACTGCTGT GCCTTGGAAT GCTAGTTGGA GTAATAAATC TCTGGAACAG ATTTGGAATA
5341 ACATGACCTG GATGGAGTGG GACAGAGAAA TTAACAATTA CACAAGCTTA ATACACTCCT
5401 TAATTGAAGA ATCGCAAAAC CAGCAAGAAA AGAATGAACA AGAATTATTG GAATTAGATA
5461 AATGGGCAAG TTTGTGGAAT TGGTTTAACA TAACAAATTG GCTGTGGTAT ATAAAATTAT
5521 TCATAATGAT AGTAGGAGGC TTGGTAGGTT TAAGAATAGT TTTTGCTGTA CTTTCTATAG
5581 TGAATAGAGT TAGGCAGGGA TATTCACCAT TATCGTTTCA GACCCACCTC CCAATCCCGA
5641 GGGGACCACG CGTACAAATG GCAGTATTCA TCCACAATTT TAAAAGAAAA GGGGGGATTG
5701 GGGGGTACAG TGCAGGGGAA AGAATAGTAG ACATAATAGC AACAGACATA CAAACTAAAG
5761 AATTACAAAA ACAAATTACA AAAATTCAAA ATTTTCGGGT TTATTACAGG GACAGCAGAA
5821 ATCCACTTTG GAAAGCTGAG CATCCGGCTC CGGTGCCCGT CAGTGGGCAG AGCGCACATC
5881 GCCCACAGTC CCCGAGAAGT TGGGGGGAGG GGTCGGCAAT TGAACCGGTG CCTAGAGAAG
5941 GTGGCGCGGG GTAAACTGGG AAAGTGATGT CGTGTACTGG CTCCGCCTTT TTCCCGAGGG
6001 TGGGGGAGAA CCGTATATAA GTGCAGTAGT CGCCGTGAAC GTTCTTTTTC GCAACGGGTT
6061 TGCCGCCAGA ACACAGGTAA GTGCCGTGTG TGGTTCCCGC GGGCCTGGCC TCTTTACGGG
6121 TTATGGCCCT TGCGTGCCTT GAATTACTTC CACGCCCCTG GCTGCAGTAC GTGATTCTTG
6181 ATCCCGAGCT TCGGGTTGGA AGTGGGTGGG AGAGTTCGAG GCCTTGCGCT TAAGGAGCCC
6241 CTTCGCCTCG TGCTTGAGTT GAGGCCTGGC CTGGGCGCTG GGGCCGCCGC GTGCGAATCT
6301 GGTGGCACCT TCGCGCCTGT CTCGCTGCTT TCGATAAGTC TCTAGCCATT TAAAATTTTT
6361 GATGACCTGC TGCGACGCTT TTTTTCTGGC AAGATAGTCT TGTAAATGCG GGCCAAGATC
6421 TGCACACTGG TATTTCGGTT TTTGGGGCCG CGGGCGGCGA CGGGGCCCGT GCGTCCCAGC
6481 GCACATGTTC GGCGAGGCGG GGCCTGCGAG CGCGGCCACC GAGAATCGGA CGGGGGTAGT
6541 CTCAAGCTGG CCGGCCTGCT CTGGTGCCTG GCCTCGCGCC GCCGTGTATC GCCCCGCCCT
6601 GGGCGGCAAG GCTGGCCCGG TCGGCACCAG TTGCGTGAGC GGAAAGATGG CCGCTTCCCG
6661 GCCCTGCTGC AGGGAGCTCA AAATGGAGGA CGCGGCGCTC GGGAGAGCGG GCGGGTGAGT
6721 CACCCACACA AAGGAAAAGG GCCTTTCCGT CCTCAGCCGT CGCTTCATGT GACTCCACGG
6781 AGTACCGGGC GCCGTCCAGG CACCTCGATT AGTTCTCGAG CTTTTGGAGT ACGTCGTCTT
6841 TAGGTTGGGG GGAGGGGTTT TATGCGATGG AGTTTCCCCA CACTGAGTGG GTGGAGACTG
6901 AAGTTAGGCC AGCTTGGCAC TTGATGTAAT TCTCCTTGGA ATTTGCCCTT TTTGAGTTTG
6961 GATCTTGGTT CATTCTCAAG CCTCAGACAG TGGTTCAAAG TTTTTTTCTT CCATTTCAGG
7021 TGTCGTGAAA ACTACCCCTC TGAGCCGCCA CCATGCTTCT GCTTGTGACG TCCCTCCTGC
7081 TTTGTGAACT CCCGCATCCT GCCTTCCTGC TCATCCCGCA GGTCCAACTT CAACAATCAG
7141 GACCAGGGCT CGTGAAGCCG TCCCAAACGC TTAGTCTCAC ATGCGCCATT AGTGGGGACT
7201 CCGTGAGTTC AAATTCCGCC GCCTGGAATT GGATTAGGCA AAGTCCATCT AGGGGTCTTG
7261 AGTGGCTCGG CCGCACTTAC TACAGATCCA AGTGGTATAA CGACTACGCA GTATCCGTAA
7321 AATCAAGAAT AACAATTAAT CCAGATACTT CTAAGAACCA ATTTAGTCTT CAACTGAACA
7381 GCGTGACCCC GGAGGATACA GCGGTGTATT ATTGTGCGCG AGAAGTTACC GGGGATCTGG
7441 AGGATGCTTT TGATATCTGG GGCCAAGGAA CAATGGTAAC CGTTAGTTCA GGAGGAGGGG
7501 GAAGTGATAT ACAAATGACA CAGAGCCCTA GTTCCCTTAG TGCCTCAGTT GGGGATAGGG
7561 TAACAATCAC TTGCCGAGCA TCACAGACGA TATGGTCCTA TCTCAACTGG TATCAACAAC
7621 GCCCTGGCAA GGCACCCAAC CTGCTGATCT ACGCCGCTAG TAGTTTGCAA AGTGGGGTAC
7681 CTAGTAGATT CTCCGGCAGA GGTTCTGGCA CTGACTTTAC CTTGACAATC AGCAGCCTCC
7741 AAGCAGAAGA CTTCGCGACA TACTACTGTC AGCAAAGTTA CTCTATACCT CAGACGTTCG
7801 GTCAGGGGAC CAAGCTCGAG ATCAAGGCGG CCGCAGGTGG AGGAGGTTCT GGAGGTGGTG
7861 GATCAGGTGG TGGAGGATCT TTAGAAAGTC AGCCTCATAC CAAACCATCC GTTTTTGTCA
7921 TGAAAAATGG AACAAATGTC GCTTGTCTGG TGAAGGAATT CTACCCCAAG GATATAAGAA
7981 TAAATCTCGT GTCATCCAAG AAGATAACAG AGTTTGATCC TGCTATTGTC ATCTCTCCCA
8041 GTGGGAAGTA CAATGCTGTC AAGCTTGGTA AATATGAAGA TTCAAATTCA GTGACATGTT
8101 CAGTTCAACA CGACAATAAA ACTGTGCACT CCACTGACTT TGAAGTGAAG ACAGATTCTA
8161 CAGATCACGT AAAACCAAAG GAAACTGAAA ACACAAAGCA ACCTTCAAAG AGCTGCCATA
8221 AACCCAAAGC CATAGTTCAT ACCGAGAAGG TGAACATGAT GTCCCTCACA GTGCTTGGGC
8281 TACGAATGCT GTTTGCAAAG ACTGTTGCCG TCAATTTTCT CTTGACTGCC AAGTTATTTT
8341 TCTTGGGGTC AGGCGAGGGC AGAGGAAGTC TGCTAACATG CGGTGACGTC GAGGAGAATC
8401 CTGGACCTAT GCTTCTCCTG GTGACAAGCC TTCTGCTCTG TGAGTTACCA CACCCAGCAT
8461 TCCTCCTGAT CCCACAGGTG CAGCTGCAGC AGAGCGGCCC CGGCCTGGTG AAGCCCAGCC
8521 AGACCCTGAG CCTGACCTGC GCTATCAGCG GCGACAGCGT TAGCAGCAAC AGCGCTGCTT
8581 GGAACTGGAT CAGACAGAGC CCCAGCAGAG GCCTGGAGTG GCTGGGCAGA ACCTACTATA
8641 GAAGCAAATG GTACAACGAT TACGCCGTGA GCGTGAAGAG CAGGATCACC ATCAACCCCG
8701 ACACCAGCAA GAATCAGTTC AGCCTGCAGC TCAATTCCGT CACCCCCGAG GACACCGCCG
8761 TGTACTACTG CGCCAGAGAG GTGACCGGCG ACCTCGAGGA CGCCTTCGAC ATTTGGGGAC
8821 AGGGCACCAT GGTTACCGTG TCTAGCGGTG GCGGAGGCAG CGACATCCAG ATGACCCAGT
8881 CCCCCAGCAG CCTGAGCGCC AGCGTGGGCG ACAGAGTGAC CATCACCTGC AGAGCCAGCC
8941 AGACCATCTG GAGCTACCTG AATTGGTACC AGCAGAGACC CGGAAAAGCC CCTAACCTCC
9001 TCATTTACGC TGCCAGCAGC CTGCAGAGCG GCGTGCCCAG CAGGTTCAGC GGAAGAGGCA
9061 GCGGAACCGA CTTCACCCTG ACCATTTCCT CTCTGCAGGC CGAGGACTTT GCCACCTATT
9121 ACTGCCAGCA GAGCTACAGC ATCCCCCAGA CCTTTGGCCA GGGCACAAAA CTGGAGATTA
9181 AGGCTGCAGC TGGAGGTGGA GGTAGCGGAG GCGGTGGTAG TGGAGGGGGT GGTTCTCTGG
9241 AAGATAAACA ACTTGATGCA GATGTTTCCC CCAAGCCCAC TATTTTTCTT CCTTCAATTG
9301 CTGAAACAAA GCTCCAGAAG GCTGGAACAT ACCTTTGTCT TCTTGAGAAA TTTTTCCCTG
9361 ATGTTATTAA GATACATTGG CAAGAAAAGA AGAGCAACAC GATTCTGGGA TCCCAGGAGG
9421 GGAACACCAT GAAGACTAAC GACACATACA TGAAATTTAG CTGGTTAACG GTGCCAGAAA
9481 AGTCACTGGA CAAAGAACAC AGATGTATCG TCAGACATGA GAATAATAAA AACGGAGTTG
9541 ATCAAGAAAT TATCTTTCCT CCAATAAAGA CAGATGTCAT CACAATGGAT CCCAAAGACA
9601 ATTGTTCAAA AGATGCAAAT GATACACTAC TGCTGCAGCT CACAAACACC TCTGCATATT
9661 ACATGTACCT CCTCCTGCTC CTCAAGAGTG TGGTCTATTT TGCCATCATC ACCTGCTGTC
9721 TGCTTAGAAG AACGGCTTTC TGCTGCAATG GAGAGAAATC ATAATGAGAT ATCGAGCATC
9781 TTACCGCCAT TTATACCCAT ATTTGTTCTG TTTTTCTTGA TTTGGGTATA CATTTAAATG
9841 TTAATAAAAC AAAATGGTGG GGCAATCATT TACATTTTTA GGGATATGTA ATTACTAGTT
9901 CAGGTGTATT GCCACAAGAC AAACATGTTA AGAAACTTTC CCGTTATTTA CGCTCTGTTC
9961 CTGTTAATCA ACCTCTGGAT TACAAAATTT GTGAAAGATT GACTGATATT CTTAACTATG
10021 TTGCTCCTTT TACGCTGTGT GGATATGCTG CTTTATAGCC TCTGTATCTA GCTATTGCTT
10081 CCCGTACGGC TTTCGTTTTC TCCTCCTTGT ATAAATCCTG GTTGCTGTCT CTTTTAGAGG
10141 AGTTGTGGCC CGTTGTCCGT CAACGTGGCG TGGTGTGCTC TGTGTTTGCT GACGCAACCC
10201 CCACTGGCTG GGGCATTGCC ACCACCTGTC AACTCCTTTC TGGGACTTTC GCTTTCCCCC
10261 TCCCGATCGC CACGGCAGAA CTCATCGCCG CCTGCCTTGC CCGCTGCTGG ACAGGGGCTA
10321 GGTTGCTGGG CACTGATAAT TCCGTGGTGT TGTCAGTACT GGTACCTTTA AGACCAATGA
10381 CTTACAAGGC AGCTGTAGAT CTTAGCCACT TTTTAAAAGA AAAGGGGGGA CTGGAAGGGC
10441 TAATTCACTC CCAAAGAAGA CAAGATCTGC TTTTTGCCTG TACTGGGTCT CTCTGGTTAG
10501 ACCAGATCTG AGCCTGGGAG CTCTCTGGCT AACTAGGGAA CCCACTGCTT AAGCCTCAAT
10561 AAAGCTTGCC TTGAGTGCTT CAA
pLRPS TCR γ9G115 T2A δ2cl5 (서열 식별 번호:191)
1 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
61 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
121 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
181 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
241 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
301 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
361 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
421 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
481 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
541 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
601 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
661 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
721 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
781 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
841 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
901 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
961 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
1021 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
1081 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
1141 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCGGGATGC
1201 TACTACTTGT GACCTCACTA TTGTTATGCG AACTCCCTCA TCCCGCATTC TTGCTGATTC
1261 CAGCAGGACA CCTGGAGCAG CCTCAAATCT CTTCCACAAA GACTCTGTCT AAGACTGCTA
1321 GACTTGAGTG CGTCGTTAGC GGGATCACCA TCTCCGCAAC CTCCGTATAC TGGTACCGCG
1381 AACGGCCTGG AGAGGTGATT CAGTTTCTGG TAAGCATTTC TTACGATGGT ACCGTGCGTA
1441 AAGAAAGCGG GATCCCTTCA GGCAAGTTCG AAGTTGACCG CATCCCCGAG ACGTCAACTA
1501 GCACCCTCAC TATCCACAAC GTGGAGAAGC AGGACATCGC GACCTACTAT TGTGCCTTGT
1561 GGGAAGCGCA GCAGGAGCTG GGAAAAAAGA TTAAGGTGTT CGGGCCAGGG ACAAAGTTGA
1621 TTATTACCGA TAAGCAGCTC GATGCGGACG TGTCACCTAA ACCGACTATT TTCTTGCCAA
1681 GTATAGCCGA GACAAAGCTT CAGAAGGCAG GGACTTACTT ATGCCTGCTG GAGAAGTTTT
1741 TCCCTGACGT CATCAAGATT CACTGGGAAG AAAAGAAGAG CAACACTATC CTCGGATCCC
1801 AGGAGGGGAA TACAATGAAG ACCAATGATA CCTATATGAA GTTTTCTTGG CTGACTGTGC
1861 CCGAGAAGTC CCTTGATAAG GAACATAGAT GCATCGTGAG ACATGAGAAC AATAAAAACG
1921 GGGTGGATCA GGAAATCATT TTCCCCCCCA TTAAGACCGA CGTTATCACC ATGGATCCAA
1981 AGGATAATTG CTCTAAGGAC GCCAACGACA CTCTTCTGCT TCAGCTGACT AATACAAGCG
2041 CTTACTATAT GTACCTGCTC CTGCTTCTGA AAAGCGTGGT GTACTTCGCA ATCATTACTT
2101 GTTGCCTTCT GCGGAGAACT GCCTTCTGTT GTAACGGTGA AAAATCCGGG TCAGGCGAGG
2161 GCAGAGGAAG TCTGCTAACA TGCGGTGACG TCGAGGAGAA TCCTGGACCT ATGCAGAGAA
2221 TCAGCTCTCT GATCCACCTG AGCCTGTTCT GGGCAGGCGT GATGTCTGCC ATCGAGCTGG
2281 TGCCTGAGCA CCAGACCGTT CCAGTGAGCA TCGGCGTGCC TGCCACCCTG AGATGCAGCA
2341 TGAAGGGCGA GGCCATCGGC AACTATTACA TCAACTGGTA CAGAAAGACC CAGGGCAACA
2401 CCATGACCTT CATCTACAGA GAGAAGGACA TCTACGGACC CGGCTTCAAG GACAACTTCC
2461 AGGGGGACAT TGACATCGCC AAGAACCTGG CTGTGCTGAA GATCCTGGCC CCTAGCGAGA
2521 GAGACGAGGG CAGCTACTAT TGCGCCTGCG ATGCACTGAA GAGAACCGAC ACCGATAAGC
2581 TGATCTTCGG CAAGGGAACC AGAGTGACCG TTGAGCCCAG AAGCCAGCCT CACACCAAGC
2641 CCAGCGTGTT CGTGATGAAG AACGGCACCA ACGTTGCCTG CCTGGTGAAG GAGTTCTACC
2701 CTAAGGACAT CAGAATCAAC CTGGTGTCCA GCAAGAAGAT CACCGAGTTC GACCCAGCCA
2761 TCGTGATCAG CCCAAGCGGA AAGTACAACG CCGTGAAACT GGGCAAGTAC GAGGACAGCA
2821 ACTCTGTGAC TTGCAGCGTG CAGCACGACA ACAAGACCGT TCACTCCACC GACTTCGAGG
2881 TGAAGACCGA CAGCACCGAT CACGTGAAGC CCAAGGAGAC CGAGAACACC AAACAGCCTA
2941 GCAAGAGCTG CCACAAGCCC AAAGCCATCG TGCACACCGA GAAGGTGAAC ATGATGAGCC
3001 TGACCGTGCT TGGACTCAGA ATGCTGTTCG CCAAGACCGT AGCCGTGAAC TTCCTGCTTA
3061 CCGCCAAGCT GTTCTTCCTG TAGATATCGA GCATCTTACC GCCATTTATA CCCATATTTG
3121 TTCTGTTTTT CTTGATTTGG GTATACATTT AAATGTTAAT AAAACAAAAT GGTGGGGCAA
3181 TCATTTACAT TTTTAGGGAT ATGTAATTAC TAGTTCAGGT GTATTGCCAC AAGACAAACA
3241 TGTTAAGAAA CTTTCCCGTT ATTTACGCTC TGTTCCTGTT AATCAACCTC TGGATTACAA
3301 AATTTGTGAA AGATTGACTG ATATTCTTAA CTATGTTGCT CCTTTTACGC TGTGTGGATA
3361 TGCTGCTTTA TAGCCTCTGT ATCTAGCTAT TGCTTCCCGT ACGGCTTTCG TTTTCTCCTC
3421 CTTGTATAAA TCCTGGTTGC TGTCTCTTTT AGAGGAGTTG TGGCCCGTTG TCCGTCAACG
3481 TGGCGTGGTG TGCTCTGTGT TTGCTGACGC AACCCCCACT GGCTGGGGCA TTGCCACCAC
3541 CTGTCAACTC CTTTCTGGGA CTTTCGCTTT CCCCCTCCCG ATCGCCACGG CAGAACTCAT
3601 CGCCGCCTGC CTTGCCCGCT GCTGGACAGG GGCTAGGTTG CTGGGCACTG ATAATTCCGT
3661 GGTGTTGTCA GTACTGGTAC CTTTAAGACC AATGACTTAC AAGGCAGCTG TAGATCTTAG
3721 CCACTTTTTA AAAGAAAAGG GGGGACTGGA AGGGCTAATT CACTCCCAAA GAAGACAAGA
3781 TCTGCTTTTT GCCTGTACTG GGTCTCTCTG GTTAGACCAG ATCTGAGCCT GGGAGCTCTC
3841 TGGCTAACTA GGGAACCCAC TGCTTAAGCC TCAATAAAGC TTGCCTTGAG TGCTTCAATG
3901 ATCATAATCA AGCCATATCA CATCTGTAGA GGTTTACTTG CTTTAAAAAA CCTCCACACC
3961 TCCCCCTGAA CCTGAAACAT AAAATGAATG CAATTGTTGT TGTTAACTTG TTTATTGCAG
4021 CTTATAATGG TTACAAATAA AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT
4081 CACTGCATTC TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGGATCT
4141 GCGTCGACAC GAAGAGACGA CTGACTGACT GACTGGAAAG AGGAAGGGCT GGAAGAGGAA
4201 GGAGCTTGAT CCAGATCCCG ATCTCGATCC AGATCCGGAT CGCAGCTTGG TCTTCCGCTT
4261 CCTCGCTCAC TGACTCGCTG CGCTCGGTCG TTCGGCTGCG GCGAGCGGTA TCAGCTCACT
4321 CAAAGGCGGT AATACGGTTA TCCACAGAAT CAGGGGATAA CGCAGGAAAG AACATGTGAG
4381 CAAAAGGCCA GCAAAAGGCC AGGAACCGTA AAAAGGCCGC GTTGCTGGCG TTTTTCCATA
4441 GGCTCCGCCC CCCTGACGAG CATCACAAAA ATCGACGCTC AAGTCAGAGG TGGCGAAACC
4501 CGACAGGACT ATAAAGATAC CAGGCGTTTC CCCCTGGAAG CTCCCTCGTG CGCTCTCCTG
4561 TTCCGACCCT GCCGCTTACC GGATACCTGT CCGCCTTTCT CCCTTCGGGA AGCGTGGCGC
4621 TTTCTCATAG CTCACGCTGT AGGTATCTCA GTTCGGTGTA GGTCGTTCGC TCCAAGCTGG
4681 GCTGTGTGCA CGAACCCCCC GTTCAGCCCG ACCGCTGCGC CTTATCCGGT AACTATCGTC
4741 TTGAGTCCAA CCCGGTAAGA CACGACTTAT CGCCACTGGC AGCAGCCACT GGTAACAGGA
4801 TTAGCAGAGC GAGGTATGTA GGCGGTGCTA CAGAGTTCTT GAAGTGGTGG CCTAACTACG
4861 GCTACACTAG AAGAACAGTA TTTGGTATCT GCGCTCTGCT GAAGCCAGTT ACCTTCGGAA
4921 AAAGAGTTGG TAGCTCTTGA TCCGGCAAAC AAACCACCGC TGGTAGCGGT GGTTTTTTTG
4981 TTTGCAAGCA GCAGATTACG CGCAGAAAAA AAGGATCTCA AGAAGATCCT TTGATCTTTT
5041 CTACGGGGTC TGACGCTCAG TGGAACGAAA ACTCACGTTA AGGGATTTTG GTCATGAGTT
5101 AATTAACTTG CGCCGTCCCG TCAAGTCAGC GTAATGCTCT GCCAGTGTTA CAACCAATTA
5161 ACCAATTCTG ATTAGAAAAA CTCATCGAGC ATCAAATGAA ACTGCAATTT ATTCACATCA
5221 GGATTATCAA TACCATATTT TTGAAAAAGC CGTTTCTGTA ATGAAGGAGA AAACTCACCG
5281 AGGCAGTTCC ATAGGATGGC AAGATCCTGG TATCGGTCTG CGATTCCGAC TCGTCCAACA
5341 TCAATACAAC CTATTAATTT CCCCTCGTCA AAAATAAGGT TATCAAGTGA GAAATCACCA
5401 TGAGTGACGA CTGAATCCGG TGAGAATGGC AAAAGTTTAT GCATTTCTTT CCAGACTTGT
5461 TCAACAGGCC AGCCATTACG CTCGTCATCA AAATCACTCG CATCAACCAA ACCGTTATTC
5521 ATTCGTGATT GCGCCTGAGC AAGACGAAAT ACGCGATCGC TGTTAAAAGG ACAATTACAA
5581 ACAGGAATCG AATGCAACCG GCGCAGGAAC ACTGCCAGCG CATCAACAAT ATTTTCACCT
5641 GAATCAGGAT ATTCTTCTAA TACCTGGAAT GCTGTTTTTC CGGGGATCGC AGTGGTGAGT
5701 AACCATGCAT CATCAGGAGT ACGGATAAAA TGCTTGATGG TCGGAAGAGG CATAAATTCC
5761 GTCAGCCAGT TTAGTCTGAC CATCTCATCT GTAACATCAT TGGCAACGCT ACCTTTGCCA
5821 TGTTTCAGAA ACAACTCTGG CGCATCGGGC TTCCCATACA AGCGATAGAT TGTCGCACCT
5881 GATTGCCCGA CATTATCGCG AGCCCATTTA TACCCATATA AATCAGCATC CATGTTGGAA
5941 TTTAATCGCG GCCTCGACGT TTCCCGTTGA ATATGGCTCA TAACACCCCT TGTATTACTG
6001 TTTATGTAAG CAGACAGTTT TATTGTTCAT GATGATATAT TTTTATCTTG TGCAATGTAA
6061 CATCAGAGAT TTTGAGACAC AACGTGGCTT TCCCCCCCCC CCCCATGACA TTAACCTATA
6121 AAAATAGGCG TATCACGAGG CCAGCTTGGG AAACCATAAG ACCGAGATAG AGTTGAGTGT
6181 TGTTCCAGTT TGGAACAAGA GTCCACTATT AAAGAACGTG GACTCCAACG TCAAAGGGCG
6241 AAAAACCGTC TATCAGGGCG ATGGCCCACT ACGTGAACCA TCACCCAAAT CAAGTTTTTT
6301 GGGGTCGAGG TGCCGTAAAG CACTAAATCG GAACCCTAAA GGGAGCCCCC GATTTAGAGC
6361 TTGACGGGGA AAGCCGGCGA ACGTGGCGAG AAAGGAAGGGAAGAAAGCGAAAGGAGCGGG
6421 CGCTAAGGCG CTGGCAAGTG TAGCGGTCAC GCTGCGCGTA ACCACCACAC CCGCCGCGCT
6481 TAATGCGCCG CTACAGGGCG CGTACTATGG TTGCTTTGAC GTATGCGGTG TGAAATACCG
6541 CACAGATGCG TAAGGAGAAA ATACATCGTG ATCCGGATCA AGATCCAGAT CGAATTGGAG
6601 GCTACAGTCA GTGGAGAGGA CTTTCACTGA CTGACTGACT GCGTCTCAAC CTCCTAGGGG
6661 ACATTGATTA TTGACTAGTT ATTAATAGTA ATCAATTACG GGGTCATTAG TTCATAGCCC
6721 ATATATGGAG TTCCGCGTTA CATAACTTAC GGTAAATGGC CCGCCTGGCT GACCGCCCAA
6781 CGACCCCCGC CCATTGACGT CAATAATGAC GTATGTTCCC ATAGTAACGC CAATAGGGAC
6841 TTTCCATTGA CGTCAATGGG TGGAGTATTT ACGGTAAACT GCCCACTTGG CAGTACATCA
6901 AGTGTATCAT ATGCCAAGTA CGCCCCCTAT TGACGTCAAT GACGGTAAAT GGCCCGCCTG
6961 GCATTATGCC CAGTACATGA CCTTATGGGA CTTTCCTACT TGGCAGTACA TCTACGTATT
7021 AGTCATCGCT ATTACCATGG TGATGCGGTT TTGGCAGTAC ATCAATGGGC GTGGATAGCG
7081 GTTTGACTCA CGGGGATTTC CAAGTCTCCA CCCCATTGAC GTCAATGGGA GTTTGTTTTG
7141 GCACCAAAAT CAACGGGACT TTCCAAAATG TCGTAACAAC TCCGCCCCAT TGACGCAAAT
7201 GGGCGGTAGG CGTGTACGGT GGGAGGTCTA TATAAGCAGA GCTCGTTTAG TGAACCGGGT
7261 CTCTCTGGTT AGACCAGATC TGAGCCTGGG AGCTCTCTGG CTAACTAGGG AACCCACTGC
7321 TTAAGCCTCA ATAAAGCTTG CCTTGAGTGC TCAAAGTAGT GTGTGCCCGT CTGTTGTGTG
7381 ACTCTGGTAA CTAGAGATCC CTCAGACCCT TTTAGTCAGT GTGGAAAATC TCTAGCAGTG
7441 GCGCCCGAAC AGGGACTTGA AAGCGAAAGT AAAGCCAGAG GAGATCTCTC GACGCAGGAC
7501 TCGGCTTGCT GAAGCGCGCA CGGCAAGAGG CGAGGGGCGG CGACTGGTGA GTACGCCAAA
7561 AATTTTGACT AGCGGAGGCT AGAAGGAGAG AGTAGGGTGC GAGAGCGTCG GTATTAAGCG
7621 GGGGAGAATT AGATAAATGG GAAAAAATTC GGTTAAGGCC AGGGGGAAAG AAACAATATA
7681 AACTAAAACA TATAGTTAGG GCAAGCAGGG AGCTAGAACG ATTCGCAGTT AATCCTGGCC
7741 TTTTAGAGAC ATCAGAAGGC TGTAGACAAA TACTGGGACA GCTACAACCA TCCCTTCAGA
7801 CAGGATCAGA AGAACTTAGA TCATTATATA ATACAATAGC AGTCCTCTAT TGTGTGCATC
7861 AAAGGATAGA TGTAAAAGAC ACCAAGGAAG CCTTAGATAA GATAGAGGAA GAGCAAAACA
7921 AAAGTAAGAA AAAGGCACAG CAAGCGATCT TCAGACCTGG AGGAGGCAGG AGGCGATATG
7981 AGGGACAATT GGAGAAGTGA ATTATATAAA TATAAAGTAG TAAAAATTGA ACCATTAGGA
8041 GTAGCACCCA CCAAGGCAAA GAGAAGAGTG GTGCAGAGAG AAAAAAGAGCAGTGGGAATA
8101 GGAGCTTTGT TCCTTGGGTT CTTGGGAGCA GCAGGAAGCA CTATGGGCGC AGCGTCAATG
8161 ACGCTGACGG TACAGGCCAG ACAATTATTG TCTGATATAG TGCAGCAGCA GAACAATTTG
8221 CTGAGGGCTA TTGAGGCGCA ACAGCATCTG TTGCAACTCA CAGTCTGGGG CATCAAACAG
8281 CTCCAGGCAA GAATCCTGGC TGTGGAAAGA TACCTAAAGG ATCAACAGCT CCTGGGGATT
8341 TGGGGTTGCT CTGGAAAACT CATTTGCACC ACTGCTGTGC CTTGGAATGC TAGTTGGAGT
8401 AATAAATCTC TGGAACAGAT TTGGAATAAC ATGACCTGGA TGGAGTGGGA CAGAGAAATT
8461 AACAATTACA CAAGCTTAAT ACACTCCTTA ATTGAAGAAT CGCAAAACCA GCAAGAAAAG
8521 AATGAACAAG AATTATTGGA ATTAGATAAA TGGGCAAGTT TGTGGAATTG GTTTAACATA
8581 ACAAATTGGC TGTGGTATAT AAAATTATTC ATAATGATAG TAGGAGGCTT GGTAGGTTTA
8641 AGAATAGTTT TTGCTGTACT TTCTATAGTG AATAGAGTTA GGCAGGGATA TTCACCATTA
8701 TCGTTTCAGA CCCACCTCCC AATCCCGAGG GGACCACGCG TACAAATGGC AGTATTCATC
8761 CACAATTTTA AAAGAAAAGG GGGGATTGGG GGGTACAGTG CAGGGGAAAG AATAGTAGAC
8821 ATAATAGCAA CAGACATACA AACTAAAGAA TTACAAAAAC AAATTACAAA AATTCAAAAT
8881 TTTCGGGTTT ATTACAGGGA CAGCAGAAAT CCACTTTGGA AAGCTGAGCA TCC
pLRPS TCR γ9G115 T2A δ2cl5 P2A FMC63ε (서열 식별 번호:192)
1 GGCTCCGGTG CCCGTCAGTG GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG
61 GGAGGGGTCG GCAATTGAAC CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT
121 GATGTCGTGT ACTGGCTCCG CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA
181 GTAGTCGCCG TGAACGTTCT TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC
241 GTGTGTGGTT CCCGCGGGCC TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT
301 ACTTCCACGC CCCTGGCTGC AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG
361 GTGGGAGAGT TCGAGGCCTT GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC
421 CTGGCCTGGG CGCTGGGGCC GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC
481 TGCTTTCGAT AAGTCTCTAG CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT
541 CTGGCAAGAT AGTCTTGTAA ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG
601 GGCCGCGGGC GGCGACGGGG CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT
661 GCGAGCGCGG CCACCGAGAA TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT
721 GCCTGGCCTC GCGCCGCCGT GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC
781 ACCAGTTGCG TGAGCGGAAA GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG
841 GAGGACGCGG CGCTCGGGAG AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT
901 TCCGTCCTCA GCCGTCGCTT CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT
961 CGATTAGTTC TCGAGCTTTT GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC
1021 GATGGAGTTT CCCCACACTG AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT
1081 GTAATTCTCC TTGGAATTTG CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA
1141 GACAGTGGTT CAAAGTTTTT TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCGGGATGC
1201 TACTACTTGT GACCTCACTA TTGTTATGCG AACTCCCTCA TCCCGCATTC TTGCTGATTC
1261 CAGCAGGACA CCTGGAGCAG CCTCAAATCT CTTCCACAAA GACTCTGTCT AAGACTGCTA
1321 GACTTGAGTG CGTCGTTAGC GGGATCACCA TCTCCGCAAC CTCCGTATAC TGGTACCGCG
1381 AACGGCCTGG AGAGGTGATT CAGTTTCTGG TAAGCATTTC TTACGATGGT ACCGTGCGTA
1441 AAGAAAGCGG GATCCCTTCA GGCAAGTTCG AAGTTGACCG CATCCCCGAG ACGTCAACTA
1501 GCACCCTCAC TATCCACAAC GTGGAGAAGC AGGACATCGC GACCTACTAT TGTGCCTTGT
1561 GGGAAGCGCA GCAGGAGCTG GGAAAAAAGA TTAAGGTGTT CGGGCCAGGG ACAAAGTTGA
1621 TTATTACCGA TAAGCAGCTC GATGCGGACG TGTCACCTAA ACCGACTATT TTCTTGCCAA
1681 GTATAGCCGA GACAAAGCTT CAGAAGGCAG GGACTTACTT ATGCCTGCTG GAGAAGTTTT
1741 TCCCTGACGT CATCAAGATT CACTGGGAAG AAAAGAAGAG CAACACTATC CTCGGATCCC
1801 AGGAGGGGAA TACAATGAAG ACCAATGATA CCTATATGAA GTTTTCTTGG CTGACTGTGC
1861 CCGAGAAGTC CCTTGATAAG GAACATAGAT GCATCGTGAG ACATGAGAAC AATAAAAACG
1921 GGGTGGATCA GGAAATCATT TTCCCCCCCA TTAAGACCGA CGTTATCACC ATGGATCCAA
1981 AGGATAATTG CTCTAAGGAC GCCAACGACA CTCTTCTGCT TCAGCTGACT AATACAAGCG
2041 CTTACTATAT GTACCTGCTC CTGCTTCTGA AAAGCGTGGT GTACTTCGCA ATCATTACTT
2101 GTTGCCTTCT GCGGAGAACT GCCTTCTGTT GTAACGGTGA AAAATCCGGG TCAGGCGAGG
2161 GCAGAGGAAG TCTGCTAACA TGCGGTGACG TCGAGGAGAA TCCTGGACCT ATGCAGAGAA
2221 TCAGCTCTCT GATCCACCTG AGCCTGTTCT GGGCAGGCGT GATGTCTGCC ATCGAGCTGG
2281 TGCCTGAGCA CCAGACCGTT CCAGTGAGCA TCGGCGTGCC TGCCACCCTG AGATGCAGCA
2341 TGAAGGGCGA GGCCATCGGC AACTATTACA TCAACTGGTA CAGAAAGACC CAGGGCAACA
2401 CCATGACCTT CATCTACAGA GAGAAGGACA TCTACGGACC CGGCTTCAAG GACAACTTCC
2461 AGGGGGACAT TGACATCGCC AAGAACCTGG CTGTGCTGAA GATCCTGGCC CCTAGCGAGA
2521 GAGACGAGGG CAGCTACTAT TGCGCCTGCG ATGCACTGAA GAGAACCGAC ACCGATAAGC
2581 TGATCTTCGG CAAGGGAACC AGAGTGACCG TTGAGCCCAG AAGCCAGCCT CACACCAAGC
2641 CCAGCGTGTT CGTGATGAAG AACGGCACCA ACGTTGCCTG CCTGGTGAAG GAGTTCTACC
2701 CTAAGGACAT CAGAATCAAC CTGGTGTCCA GCAAGAAGAT CACCGAGTTC GACCCAGCCA
2761 TCGTGATCAG CCCAAGCGGA AAGTACAACG CCGTGAAACT GGGCAAGTAC GAGGACAGCA
2821 ACTCTGTGAC TTGCAGCGTG CAGCACGACA ACAAGACCGT TCACTCCACC GACTTCGAGG
2881 TGAAGACCGA CAGCACCGAT CACGTGAAGC CCAAGGAGAC CGAGAACACC AAACAGCCTA
2941 GCAAGAGCTG CCACAAGCCC AAAGCCATCG TGCACACCGA GAAGGTGAAC ATGATGAGCC
3001 TGACCGTGCT TGGACTCAGA ATGCTGTTCG CCAAGACCGT AGCCGTGAAC TTCCTGCTTA
3061 CCGCCAAGCT GTTCTTCCTG GGAAGTGGCG CTACTAACTT CAGCCTGCTG AAGCAGGCTG
3121 GAGACGTGGA GGAGAACCCT GGACCTATGC TTCTCCTGGT GACAAGCCTT CTGCTCTGTG
3181 AGTTACCACA CCCAGCATTC CTCCTGATCC CAGACATCCA GATGACACAG ACTACATCCT
3241 CCCTGTCTGC CTCTCTGGGA GACAGAGTCA CCATCAGTTG CAGGGCAAGT CAGGACATTA
3301 GTAAATATTT AAATTGGTAT CAGCAGAAAC CAGATGGAAC TGTTAAACTC CTGATCTACC
3361 ATACATCAAG ATTACACTCA GGAGTCCCAT CAAGGTTCAG TGGCAGTGGG TCTGGAACAG
3421 ATTATTCTCT CACCATTAGC AACCTGGAGC AAGAAGATAT TGCCACTTAC TTTTGCCAAC
3481 AGGGTAATAC GCTTCCGTAC ACGTTCGGAG GGGGGACTAA GTTGGAAATA ACAGGCTCCA
3541 CCTCTGGATC CGGCAAGCCC GGATCTGGCG AGGGATCCAC CAAGGGCGAG GTGAAACTGC
3601 AGGAGTCAGG ACCTGGCCTG GTGGCGCCCT CACAGAGCCT GTCCGTCACA TGCACTGTCT
3661 CAGGGGTCTC ATTACCCGAC TATGGTGTAA GCTGGATTCG CCAGCCTCCA CGAAAGGGTC
3721 TGGAGTGGCT GGGAGTAATA TGGGGTAGTG AAACCACATA CTATAATTCA GCTCTCAAAT
3781 CCAGACTGAC CATCATCAAG GACAACTCCA AGAGCCAAGT TTTCTTAAAA ATGAACAGTC
3841 TGCAAACTGA TGACACAGCC ATTTACTACT GTGCCAAACA TTATTACTAC GGTGGTAGCT
3901 ATGCTATGGA CTACTGGGGT CAAGGAACCT CAGTCACCGT CTCCTCAGCT GCCGCAGGTG
3961 GGGGAGGATC TGGAGGCGGT GGCAGTGGGG GTGGAGGCTC ACTGGAGGAT GGTAATGAAG
4021 AAATGGGTGG TATTACACAG ACACCATATA AAGTCTCCAT CTCTGGAACC ACAGTAATAT
4081 TGACATGCCC TCAGTATCCT GGATCTGAAA TACTATGGCA ACACAATGAT AAGAACATCG
4141 GCGGAGATGA GGATGATAAA AACATAGGCA GTGATGAGGA TCACCTGTCA CTGAAGGAAT
4201 TTTCAGAATT GGAGCAAAGT GGTTATTATG TCTGCTACCC CAGAGGAAGC AAACCAGAAG
4261 ATGCGAACTT TTATCTCTAC CTGAGGGCAA GAGTGTGTGA GAACTGCATG GAGATGGATG
4321 TGATGTCGGT GGCCACAATT GTCATAGTGG ACATCTGCAT CACTGGGGGC TTGCTGCTGC
4381 TGGTTTACTA CTGGAGCAAG AATAGAAAGG CCAAGGCCAA GCCTGTGACA CGAGGAGCGG
4441 GTGCTGGCGG CAGGCAAAGG GGACAAAACA AGGAGAGGCC ACCACCTGTT CCCAACCCAG
4501 ACTATGAGCC CATCCGGAAA GGCCAGCGGG ACCTGTATTC TGGCCTGAAT CAGAGACGCA
4561 TCTAAGATAT CGAGCATCTT ACCGCCATTT ATACCCATAT TTGTTCTGTT TTTCTTGATT
4621 TGGGTATACA TTTAAATGTT AATAAAACAA AATGGTGGGG CAATCATTTA CATTTTTAGG
4681 GATATGTAAT TACTAGTTCA GGTGTATTGC CACAAGACAA ACATGTTAAG AAACTTTCCC
4741 GTTATTTACG CTCTGTTCCT GTTAATCAAC CTCTGGATTA CAAAATTTGT GAAAGATTGA
4801 CTGATATTCT TAACTATGTT GCTCCTTTTA CGCTGTGTGG ATATGCTGCT TTATAGCCTC
4861 TGTATCTAGC TATTGCTTCC CGTACGGCTT TCGTTTTCTC CTCCTTGTAT AAATCCTGGT
4921 TGCTGTCTCT TTTAGAGGAG TTGTGGCCCG TTGTCCGTCA ACGTGGCGTG GTGTGCTCTG
4981 TGTTTGCTGA CGCAACCCCC ACTGGCTGGG GCATTGCCAC CACCTGTCAA CTCCTTTCTG
5041 GGACTTTCGC TTTCCCCCTC CCGATCGCCA CGGCAGAACT CATCGCCGCC TGCCTTGCCC
5101 GCTGCTGGAC AGGGGCTAGG TTGCTGGGCA CTGATAATTC CGTGGTGTTG TCAGTACTGG
5161 TACCTTTAAG ACCAATGACT TACAAGGCAG CTGTAGATCT TAGCCACTTT TTAAAAGAAA
5221 AGGGGGGACT GGAAGGGCTA ATTCACTCCC AAAGAAGACA AGATCTGCTT TTTGCCTGTA
5281 CTGGGTCTCT CTGGTTAGAC CAGATCTGAG CCTGGGAGCT CTCTGGCTAA CTAGGGAACC
5341 CACTGCTTAA GCCTCAATAA AGCTTGCCTT GAGTGCTTCA ATGATCATAA TCAAGCCATA
5401 TCACATCTGT AGAGGTTTAC TTGCTTTAAA AAACCTCCAC ACCTCCCCCT GAACCTGAAA
5461 CATAAAATGA ATGCAATTGT TGTTGTTAAC TTGTTTATTG CAGCTTATAA TGGTTACAAA
5521 TAAAGCAATA GCATCACAAA TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT
5581 GGTTTGTCCA AACTCATCAA TGTATCTTAT CATGTCTGGA TCTGCGTCGA CACGAAGAGA
5641 CGACTGACTG ACTGACTGGA AAGAGGAAGG GCTGGAAGAG GAAGGAGCTT GATCCAGATC
5701 CCGATCTCGA TCCAGATCCG GATCGCAGCT TGGTCTTCCG CTTCCTCGCT CACTGACTCG
5761 CTGCGCTCGG TCGTTCGGCT GCGGCGAGCG GTATCAGCTC ACTCAAAGGC GGTAATACGG
5821 TTATCCACAG AATCAGGGGA TAACGCAGGA AAGAACATGT GAGCAAAAGG CCAGCAAAAG
5881 GCCAGGAACC GTAAAAAGGC CGCGTTGCTG GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC
5941 GAGCATCACA AAAATCGACG CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA
6001 TACCAGGCGT TTCCCCCTGG AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT
6061 ACCGGATACC TGTCCGCCTT TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA TAGCTCACGC
6121 TGTAGGTATC TCAGTTCGGT GTAGGTCGTT CGCTCCAAGC TGGGCTGTGT GCACGAACCC
6181 CCCGTTCAGC CCGACCGCTG CGCCTTATCC GGTAACTATC GTCTTGAGTC CAACCCGGTA
6241 AGACACGACT TATCGCCACT GGCAGCAGCC ACTGGTAACA GGATTAGCAG AGCGAGGTAT
6301 GTAGGCGGTG CTACAGAGTT CTTGAAGTGG TGGCCTAACT ACGGCTACAC TAGAAGAACA
6361 GTATTTGGTA TCTGCGCTCT GCTGAAGCCA GTTACCTTCG GAAAAAGAGT TGGTAGCTCT
6421 TGATCCGGCA AACAAACCAC CGCTGGTAGC GGTGGTTTTT TTGTTTGCAA GCAGCAGATT
6481 ACGCGCAGAA AAAAAGGATC TCAAGAAGAT CCTTTGATCT TTTCTACGGG GTCTGACGCT
6541 CAGTGGAACG AAAACTCACG TTAAGGGATT TTGGTCATGA GTTAATTAAC TTGCGCCGTC
6601 CCGTCAAGTC AGCGTAATGC TCTGCCAGTG TTACAACCAA TTAACCAATT CTGATTAGAA
6661 AAACTCATCG AGCATCAAAT GAAACTGCAA TTTATTCACA TCAGGATTAT CAATACCATA
6721 TTTTTGAAAA AGCCGTTTCT GTAATGAAGG AGAAAACTCA CCGAGGCAGT TCCATAGGAT
6781 GGCAAGATCC TGGTATCGGT CTGCGATTCC GACTCGTCCA ACATCAATAC AACCTATTAA
6841 TTTCCCCTCG TCAAAAATAA GGTTATCAAG TGAGAAATCA CCATGAGTGA CGACTGAATC
6901 CGGTGAGAAT GGCAAAAGTT TATGCATTTC TTTCCAGACT TGTTCAACAG GCCAGCCATT
6961 ACGCTCGTCA TCAAAATCAC TCGCATCAAC CAAACCGTTA TTCATTCGTG ATTGCGCCTG
7021 AGCAAGACGA AATACGCGAT CGCTGTTAAA AGGACAATTA CAAACAGGAA TCGAATGCAA
7081 CCGGCGCAGG AACACTGCCA GCGCATCAAC AATATTTTCA CCTGAATCAG GATATTCTTC
7141 TAATACCTGG AATGCTGTTT TTCCGGGGAT CGCAGTGGTG AGTAACCATG CATCATCAGG
7201 AGTACGGATA AAATGCTTGA TGGTCGGAAG AGGCATAAAT TCCGTCAGCC AGTTTAGTCT
7261 GACCATCTCA TCTGTAACAT CATTGGCAAC GCTACCTTTG CCATGTTTCA GAAACAACTC
7321 TGGCGCATCG GGCTTCCCAT ACAAGCGATA GATTGTCGCA CCTGATTGCC CGACATTATC
7381 GCGAGCCCAT TTATACCCAT ATAAATCAGC ATCCATGTTG GAATTTAATC GCGGCCTCGA
7441 CGTTTCCCGT TGAATATGGC TCATAACACC CCTTGTATTA CTGTTTATGT AAGCAGACAG
7501 TTTTATTGTT CATGATGATA TATTTTTATC TTGTGCAATG TAACATCAGA GATTTTGAGA
7561 CACAACGTGG CTTTCCCCCC CCCCCCCATG ACATTAACCT ATAAAAATAG GCGTATCACG
7621 AGGCCAGCTT GGGAAACCAT AAGACCGAGA TAGAGTTGAG TGTTGTTCCA GTTTGGAACA
7681 AGAGTCCACT ATTAAAGAAC GTGGACTCCA ACGTCAAAGG GCGAAAAACC GTCTATCAGG
7741 GCGATGGCCC ACTACGTGAA CCATCACCCA AATCAAGTTT TTTGGGGTCG AGGTGCCGTA
7801 AAGCACTAAA TCGGAACCCT AAAGGGAGCC CCCGATTTAG AGCTTGACGG GGAAAGCCGG
7861 CGAACGTGGC GAGAAAGGAA GGGAAGAAAG CGAAAGGAGCGGGCGCTAAGGCGCTGGCAA
7921 GTGTAGCGGT CACGCTGCGC GTAACCACCA CACCCGCCGC GCTTAATGCG CCGCTACAGG
7981 GCGCGTACTA TGGTTGCTTT GACGTATGCG GTGTGAAATA CCGCACAGAT GCGTAAGGAG
8041 AAAATACATC GTGATCCGGA TCAAGATCCA GATCGAATTG GAGGCTACAG TCAGTGGAGA
8101 GGACTTTCAC TGACTGACTG ACTGCGTCTC AACCTCCTAG GGGACATTGA TTATTGACTA
8161 GTTATTAATA GTAATCAATT ACGGGGTCAT TAGTTCATAG CCCATATATG GAGTTCCGCG
8221 TTACATAACT TACGGTAAAT GGCCCGCCTG GCTGACCGCC CAACGACCCC CGCCCATTGA
8281 CGTCAATAAT GACGTATGTT CCCATAGTAA CGCCAATAGG GACTTTCCAT TGACGTCAAT
8341 GGGTGGAGTA TTTACGGTAA ACTGCCCACT TGGCAGTACA TCAAGTGTAT CATATGCCAA
8401 GTACGCCCCC TATTGACGTC AATGACGGTA AATGGCCCGC CTGGCATTAT GCCCAGTACA
8461 TGACCTTATG GGACTTTCCT ACTTGGCAGT ACATCTACGT ATTAGTCATC GCTATTACCA
8521 TGGTGATGCG GTTTTGGCAG TACATCAATG GGCGTGGATA GCGGTTTGAC TCACGGGGAT
8581 TTCCAAGTCT CCACCCCATT GACGTCAATG GGAGTTTGTT TTGGCACCAA AATCAACGGG
8641 ACTTTCCAAA ATGTCGTAAC AACTCCGCCC CATTGACGCA AATGGGCGGT AGGCGTGTAC
8701 GGTGGGAGGT CTATATAAGC AGAGCTCGTT TAGTGAACCG GGTCTCTCTG GTTAGACCAG
8761 ATCTGAGCCT GGGAGCTCTC TGGCTAACTA GGGAACCCAC TGCTTAAGCC TCAATAAAGC
8821 TTGCCTTGAG TGCTCAAAGT AGTGTGTGCC CGTCTGTTGT GTGACTCTGG TAACTAGAGA
8881 TCCCTCAGAC CCTTTTAGTC AGTGTGGAAA ATCTCTAGCA GTGGCGCCCG AACAGGGACT
8941 TGAAAGCGAA AGTAAAGCCA GAGGAGATCT CTCGACGCAG GACTCGGCTT GCTGAAGCGC
9001 GCACGGCAAG AGGCGAGGGG CGGCGACTGG TGAGTACGCC AAAAATTTTG ACTAGCGGAG
9061 GCTAGAAGGA GAGAGTAGGG TGCGAGAGCG TCGGTATTAA GCGGGGGAGA ATTAGATAAA
9121 TGGGAAAAAA TTCGGTTAAG GCCAGGGGGA AAGAAACAAT ATAAACTAAA ACATATAGTT
9181 AGGGCAAGCA GGGAGCTAGA ACGATTCGCA GTTAATCCTG GCCTTTTAGA GACATCAGAA
9241 GGCTGTAGAC AAATACTGGG ACAGCTACAA CCATCCCTTC AGACAGGATC AGAAGAACTT
9301 AGATCATTAT ATAATACAAT AGCAGTCCTC TATTGTGTGC ATCAAAGGAT AGATGTAAAA
9361 GACACCAAGG AAGCCTTAGA TAAGATAGAG GAAGAGCAAA ACAAAAGTAAGAAAAAGGCA
9421 CAGCAAGCGA TCTTCAGACC TGGAGGAGGC AGGAGGCGAT ATGAGGGACA ATTGGAGAAG
9481 TGAATTATAT AAATATAAAG TAGTAAAAAT TGAACCATTA GGAGTAGCAC CCACCAAGGC
9541 AAAGAGAAGA GTGGTGCAGA GAGAAAAAAG AGCAGTGGGA ATAGGAGCTT TGTTCCTTGG
9601 GTTCTTGGGA GCAGCAGGAA GCACTATGGG CGCAGCGTCA ATGACGCTGA CGGTACAGGC
9661 CAGACAATTA TTGTCTGATA TAGTGCAGCA GCAGAACAAT TTGCTGAGGG CTATTGAGGC
9721 GCAACAGCAT CTGTTGCAAC TCACAGTCTG GGGCATCAAA CAGCTCCAGG CAAGAATCCT
9781 GGCTGTGGAA AGATACCTAA AGGATCAACA GCTCCTGGGG ATTTGGGGTT GCTCTGGAAA
9841 ACTCATTTGC ACCACTGCTG TGCCTTGGAA TGCTAGTTGG AGTAATAAAT CTCTGGAACA
9901 GATTTGGAAT AACATGACCT GGATGGAGTG GGACAGAGAA ATTAACAATT ACACAAGCTT
9961 AATACACTCC TTAATTGAAG AATCGCAAAA CCAGCAAGAA AAGAATGAAC AAGAATTATT
10021 GGAATTAGAT AAATGGGCAA GTTTGTGGAA TTGGTTTAAC ATAACAAATT GGCTGTGGTA
10081 TATAAAATTA TTCATAATGA TAGTAGGAGG CTTGGTAGGT TTAAGAATAG TTTTTGCTGT
10141 ACTTTCTATA GTGAATAGAG TTAGGCAGGG ATATTCACCA TTATCGTTTC AGACCCACCT
10201 CCCAATCCCG AGGGGACCAC GCGTACAAAT GGCAGTATTC ATCCACAATT TTAAAAGAAA
10261 AGGGGGGATT GGGGGGTACA GTGCAGGGGA AAGAATAGTA GACATAATAGCAACAGACAT
10321 ACAAACTAAA GAATTACAAA AACAAATTAC AAAAATTCAA AATTTTCGGG TTTATTACAG
10381 GGACAGCAGA AATCCACTTT GGAAAGCTGA GCATCC
pLKaUS mTRAC(82-137) T2A mTRBC(123-173) P2A MH1CD3ε (서열 식별 번호:193)
1 TGATCATAAT CAAGCCATAT CACATCTGTA GAGGTTTACT TGCTTTAAAA AACCTCCACA
61 CCTCCCCCTG AACCTGAAAC ATAAAATGAA TGCAATTGTT GTTGTTAACT TGTTTATTGC
121 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA AAGCATTTTT
181 TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT GTATCTTATC ATGTCTGGAT
241 CTGCGTCGAC ACGAAGAGAC GACTGACTGA CTGACTGGAA AGAGGAAGGG CTGGAAGAGG
301 AAGGAGCTTG ATCCAGATCC CGATCTCGAT CCAGATCCGG ATCGCAGCTT GGTCTTCCGC
361 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA
421 CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG
481 AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA
541 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA
601 CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC
661 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC
721 GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT
781 GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG
841 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG
901 GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA
961 CGGCTACACT AGAAGAACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG
1021 AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT
1081 TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT
1141 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG
1201 TTAATTAACT TGCGCCGTCC CGTCAAGTCA GCGTAATGCT CTGCCAGTGT TACAACCAAT
1261 TAACCAATTC TGATTAGAAA AACTCATCGA GCATCAAATG AAACTGCAAT TTATTCACAT
1321 CAGGATTATC AATACCATAT TTTTGAAAAA GCCGTTTCTG TAATGAAGGA GAAAACTCAC
1381 CGAGGCAGTT CCATAGGATG GCAAGATCCT GGTATCGGTC TGCGATTCCG ACTCGTCCAA
1441 CATCAATACA ACCTATTAAT TTCCCCTCGT CAAAAATAAG GTTATCAAGT GAGAAATCAC
1501 CATGAGTGAC GACTGAATCC GGTGAGAATG GCAAAAGTTT ATGCATTTCT TTCCAGACTT
1561 GTTCAACAGG CCAGCCATTA CGCTCGTCAT CAAAATCACT CGCATCAACC AAACCGTTAT
1621 TCATTCGTGA TTGCGCCTGA GCAAGACGAA ATACGCGATC GCTGTTAAAA GGACAATTAC
1681 AAACAGGAAT CGAATGCAAC CGGCGCAGGA ACACTGCCAG CGCATCAACA ATATTTTCAC
1741 CTGAATCAGG ATATTCTTCT AATACCTGGA ATGCTGTTTT TCCGGGGATC GCAGTGGTGA
1801 GTAACCATGC ATCATCAGGA GTACGGATAA AATGCTTGAT GGTCGGAAGA GGCATAAATT
1861 CCGTCAGCCA GTTTAGTCTG ACCATCTCAT CTGTAACATC ATTGGCAACG CTACCTTTGC
1921 CATGTTTCAG AAACAACTCT GGCGCATCGG GCTTCCCATA CAAGCGATAG ATTGTCGCAC
1981 CTGATTGCCC GACATTATCG CGAGCCCATT TATACCCATA TAAATCAGCA TCCATGTTGG
2041 AATTTAATCG CGGCCTCGAC GTTTCCCGTT GAATATGGCT CATAACACCC CTTGTATTAC
2101 TGTTTATGTA AGCAGACAGT TTTATTGTTC ATGATGATAT ATTTTTATCT TGTGCAATGT
2161 AACATCAGAG ATTTTGAGAC ACAACGTGGC TTTCCCCCCC CCCCATGACA TTAACCTATA
2221 AAAATAGGCG TATCACGAGG CCAGCTTGGG AAACCATAAG ACCGAGATAG AGTTGAGTGT
2281 TGTTCCAGTT TGGAACAAGA GTCCACTATT AAAGAACGTG GACTCCAACG TCAAAGGGCG
2341 AAAAACCGTC TATCAGGGCG ATGGCCCACT ACGTGAACCA TCACCCAAAT CAAGTTTTTT
2401 GGGGTCGAGG TGCCGTAAAG CACTAAATCG GAACCCTAAA GGGAGCCCCC GATTTAGAGC
2461 TTGACGGGGA AAGCCGGCGA ACGTGGCGAG AAAGGAAGGGAAGAAAGCGAAAGGAGCGGG
2521 CGCTAAGGCG CTGGCAAGTG TAGCGGTCAC GCTGCGCGTA ACCACCACAC CCGCCGCGCT
2581 TAATGCGCCG CTACAGGGCG CGTACTATGG TTGCTTTGAC GTATGCGGTG TGAAATACCG
2641 CACAGATGCG TAAGGAGAAA ATACATCGTG ATCCGGATCA AGATCCAGAT CGAATTGGAG
2701 GCTACAGTCA GTGGAGAGGA CTTTCACTGA CTGACTGACT GCGTCTCAAC CTCCTAGGGG
2761 ACATTGATTA TTGACTAGTT ATTAATAGTA ATCAATTACG GGGTCATTAG TTCATAGCCC
2821 ATATATGGAG TTCCGCGTTA CATAACTTAC GGTAAATGGC CCGCCTGGCT GACCGCCCAA
2881 CGACCCCCGC CCATTGACGT CAATAATGAC GTATGTTCCC ATAGTAACGC CAATAGGGAC
2941 TTTCCATTGA CGTCAATGGG TGGAGTATTT ACGGTAAACT GCCCACTTGG CAGTACATCA
3001 AGTGTATCAT ATGCCAAGTA CGCCCCCTAT TGACGTCAAT GACGGTAAAT GGCCCGCCTG
3061 GCATTATGCC CAGTACATGA CCTTATGGGA CTTTCCTACT TGGCAGTACA TCTACGTATT
3121 AGTCATCGCT ATTACCATGG TGATGCGGTT TTGGCAGTAC ATCAATGGGC GTGGATAGCG
3181 GTTTGACTCA CGGGGATTTC CAAGTCTCCA CCCCATTGAC GTCAATGGGA GTTTGTTTTG
3241 GCACCAAAAT CAACGGGACT TTCCAAAATG TCGTAACAAC TCCGCCCCAT TGACGCAAAT
3301 GGGCGGTAGG CGTGTACGGT GGGAGGTCTA TATAAGCAGA GCTCGTTTAG TGAACCGGGT
3361 CTCTCTGGTT AGACCAGATC TGAGCCTGGG AGCTCTCTGG CTAACTAGGG AACCCACTGC
3421 TTAAGCCTCA ATAAAGCTTG CCTTGAGTGC TCAAAGTAGT GTGTGCCCGT CTGTTGTGTG
3481 ACTCTGGTAA CTAGAGATCC CTCAGACCCT TTTAGTCAGT GTGGAAAATC TCTAGCAGTG
3541 GCGCCCGAAC AGGGACTTGA AAGCGAAAGT AAAGCCAGAG GAGATCTCTC GACGCAGGAC
3601 TCGGCTTGCT GAAGCGCGCA CGGCAAGAGG CGAGGGGCGG CGACTGGTGA GTACGCCAAA
3661 AATTTTGACT AGCGGAGGCT AGAAGGAGAG AGTAGGGTGC GAGAGCGTCG GTATTAAGCG
3721 GGGGAGAATT AGATAAATGG GAAAAAATTC GGTTAAGGCC AGGGGGAAAG AAACAATATA
3781 AACTAAAACA TATAGTTAGG GCAAGCAGGG AGCTAGAACG ATTCGCAGTT AATCCTGGCC
3841 TTTTAGAGAC ATCAGAAGGC TGTAGACAAA TACTGGGACA GCTACAACCA TCCCTTCAGA
3901 CAGGATCAGA AGAACTTAGA TCATTATATA ATACAATAGC AGTCCTCTAT TGTGTGCATC
3961 AAAGGATAGA TGTAAAAGAC ACCAAGGAAG CCTTAGATAA GATAGAGGAA GAGCAAAACA
4021 AAAGTAAGAA AAAGGCACAG CAAGCGATCT TCAGACCTGG AGGAGGCAGG AGGCGATATG
4081 AGGGACAATT GGAGAAGTGA ATTATATAAA TATAAAGTAG TAAAAATTGA ACCATTAGGA
4141 GTAGCACCCA CCAAGGCAAA GAGAAGAGTG GTGCAGAGAG AAAAAAGAGCAGTGGGAATA
4201 GGAGCTTTGT TCCTTGGGTT CTTGGGAGCA GCAGGAAGCA CTATGGGCGC AGCGTCAATG
4261 ACGCTGACGG TACAGGCCAG ACAATTATTG TCTGATATAG TGCAGCAGCA GAACAATTTG
4321 CTGAGGGCTA TTGAGGCGCA ACAGCATCTG TTGCAACTCA CAGTCTGGGG CATCAAACAG
4381 CTCCAGGCAA GAATCCTGGC TGTGGAAAGA TACCTAAAGG ATCAACAGCT CCTGGGGATT
4441 TGGGGTTGCT CTGGAAAACT CATTTGCACC ACTGCTGTGC CTTGGAATGC TAGTTGGAGT
4501 AATAAATCTC TGGAACAGAT TTGGAATAAC ATGACCTGGA TGGAGTGGGA CAGAGAAATT
4561 AACAATTACA CAAGCTTAAT ACACTCCTTA ATTGAAGAAT CGCAAAACCA GCAAGAAAAG
4621 AATGAACAAG AATTATTGGA ATTAGATAAA TGGGCAAGTT TGTGGAATTG GTTTAACATA
4681 ACAAATTGGC TGTGGTATAT AAAATTATTC ATAATGATAG TAGGAGGCTT GGTAGGTTTA
4741 AGAATAGTTT TTGCTGTACT TTCTATAGTG AATAGAGTTA GGCAGGGATA TTCACCATTA
4801 TCGTTTCAGA CCCACCTCCC AATCCCGAGG GGACCACGCG TACAAATGGC AGTATTCATC
4861 CACAATTTTA AAAGAAAAGG GGGGATTGGG GGGTACAGTG CAGGGGAAAG AATAGTAGAC
4921 ATAATAGCAA CAGACATACA AACTAAAGAA TTACAAAAAC AAATTACAAA AATTCAAAAT
4981 TTTCGGGTTT ATTACAGGGA CAGCAGAAAT CCACTTTGGA AAGCTGAGCA TCCGGCTCCG
5041 GTGCCCGTCA GTGGGCAGAG CGCACATCGC CCACAGTCCC CGAGAAGTTG GGGGGAGGGG
5101 TCGGCAATTG AACCGGTGCC TAGAGAAGGT GGCGCGGGGT AAACTGGGAA AGTGATGTCG
5161 TGTACTGGCT CCGCCTTTTT CCCGAGGGTG GGGGAGAACC GTATATAAGT GCAGTAGTCG
5221 CCGTGAACGT TCTTTTTCGC AACGGGTTTG CCGCCAGAAC ACAGGTAAGT GCCGTGTGTG
5281 GTTCCCGCGG GCCTGGCCTC TTTACGGGTT ATGGCCCTTG CGTGCCTTGA ATTACTTCCA
5341 CGCCCCTGGC TGCAGTACGT GATTCTTGAT CCCGAGCTTC GGGTTGGAAG TGGGTGGGAG
5401 AGTTCGAGGC CTTGCGCTTA AGGAGCCCCT TCGCCTCGTG CTTGAGTTGA GGCCTGGCCT
5461 GGGCGCTGGG GCCGCCGCGT GCGAATCTGG TGGCACCTTC GCGCCTGTCT CGCTGCTTTC
5521 GATAAGTCTC TAGCCATTTA AAATTTTTGA TGACCTGCTG CGACGCTTTT TTTCTGGCAA
5581 GATAGTCTTG TAAATGCGGG CCAAGATCTG CACACTGGTA TTTCGGTTTT TGGGGCCGCG
5641 GGCGGCGACG GGGCCCGTGC GTCCCAGCGC ACATGTTCGG CGAGGCGGGG CCTGCGAGCG
5701 CGGCCACCGA GAATCGGACG GGGGTAGTCT CAAGCTGGCC GGCCTGCTCT GGTGCCTGGC
5761 CTCGCGCCGC CGTGTATCGC CCCGCCCTGG GCGGCAAGGC TGGCCCGGTC GGCACCAGTT
5821 GCGTGAGCGG AAAGATGGCC GCTTCCCGGC CCTGCTGCAG GGAGCTCAAA ATGGAGGACG
5881 CGGCGCTCGG GAGAGCGGGC GGGTGAGTCA CCCACACAAA GGAAAAGGGC CTTTCCGTCC
5941 TCAGCCGTCG CTTCATGTGA CTCCACGGAG TACCGGGCGC CGTCCAGGCA CCTCGATTAG
6001 TTCTCGAGCT TTTGGAGTAC GTCGTCTTTA GGTTGGGGGG AGGGGTTTTA TGCGATGGAG
6061 TTTCCCCACA CTGAGTGGGT GGAGACTGAA GTTAGGCCAG CTTGGCACTT GATGTAATTC
6121 TCCTTGGAAT TTGCCCTTTT TGAGTTTGGA TCTTGGTTCA TTCTCAAGCC TCAGACAGTG
6181 GTTCAAAGTT TTTTTCTTCC ATTTCAGGTG TCGTGAAAAC TACCCCTCAG AGCCGCCACC
6241 ATGCTTCTCC TGGTGACAAG CCTTCTGCTC TGTGAGTTAC CACACCCAGC ATTCCTCCTG
6301 ATCCCCGCCA CCTACCCCAG TTCAGACGTT CCCTGTGATG CCACGTTGAC TGAGAAAAGC
6361 TTTGAAACAG ATATGAACCT AAACTTTCAA AACCTGTCAG TTATGGGACT CCGAATCCTC
6421 CTGCTGAAAG TAGCCGGATT TAACCTGCTC ATGACGCTGA GGCTGTGGTC CAGTGGCAGC
6481 GGCGAGGGCA GAGGAAGTCT GCTAACATGC GGTGACGTCG AGGAGAATCC TGGACCTGGT
6541 CGAGCAGACT GTGGTATTAC CTCAGCATCC TATCAACAAG GAGTCTTGTC TGCCACCATC
6601 CTCTATGAGA TCCTGCTAGG GAAAGCCACC CTGTATGCTG TGCTTGTCAG TACACTGGTG
6661 GTGATGGCTA TGGTCAAAAG AAAGAATTCA GGGTCAGGCG CTACTAACTT CAGCCTGCTG
6721 AAGCAGGCTG GAGACGTGGA GGAGAACCCT GGACCTATGC TACTACTTGT GACCTCACTA
6781 TTGTTATGCG AACTCCCTCA TCCCGCATTC TTGCTGATTC CAGAAGTTCA GCTGGTAGAG
6841 TCCGGTGGCG GGCTGGTACA GCCAGGGGGA TCTCTCCGTC TCTCATGTGC TGCCAGTGGG
6901 GGAGATTGGT CCGCTAACTT TATGTACTGG TATCGTCAAG CACCTGGGAA ACAACGCGAG
6961 CTGGTTGCAC GGATCTCTGG ACGAGGGGTA GTGGATTACG TGGAAAGTGT GAAAGGACGA
7021 TTCACAATTT CCAGGGACAA TTCTAAAAAC ACCCTTTATT TGCAAATGAA TAGTCTGAGA
7081 GCAGAAGACA CAGCCGTATA TTATTGTGCA GTCGCATCCT ATTGGGGGCA GGGGACTCTT
7141 GTCACAGTCT CGAGTGCTGC CGCAGGAGGC GGTGGCAGTG GTGGGGGAGG ATCTGGCGGA
7201 GGAGGTAGCC TCGAGGATGG TAATGAAGAA ATGGGTGGTA TTACACAGAC ACCATATAAA
7261 GTCTCCATCT CTGGAACCAC AGTAATATTG ACATGCCCTC AGTATCCTGG ATCTGAAATA
7321 CTATGGCAAC ACAATGAcAA AAACATAGGC GGaGATGAGG ATGATAAgAA CATAGGCAGT
7381 GATGAGGATC ACCTGTCACT GAAGGAATTT TCAGAATTGG AGCAAAGTGG TTATTATGTC
7441 TGCTACCCCA GAGGAAGCAA ACCAGAAGAT GCGAACTTTT ATCTCTACCT GAGGGCAAGA
7501 GTGTGTGAGA ACTGCATGGA GATGGATGTG ATGTCGGTGG CCACAATTGT CATAGTGGAC
7561 ATCTGCATCA CTGGGGGCTT GCTGCTGCTG GTTTACTACT GGAGCAAGAA TAGAAAGGCC
7621 AAGGCCAAGC CTGTGACACG AGGAGCGGGT GCTGGCGGCA GGCAAAGGGG ACAAAACAAG
7681 GAGAGGCCAC CACCTGTTCC CAACCCAGAC TATGAGCCCA TCCGGAAAGG CCAGCGGGAC
7741 CTGTATTCTG GCCTGAATCA GAGACGCATC TAAGATATCG AGCATCTTAC CGCCATTTAT
7801 ACCCATATTT GTTCTGTTTT TCTTGATTTG GGTATACATT TAAATGTTAA TAAAACAAAA
7861 TGGTGGGGCA ATCATTTACA TTTTTAGGGA TATGTAATTA CTAGTTCAGG TGTATTGCCA
7921 CAAGACAAAC ATGTTAAGAA ACTTTCCCGT TATTTACGCT CTGTTCCTGT TAATCAACCT
7981 CTGGATTACA AAATTTGTGA AAGATTGACT GATATTCTTA ACTATGTTGC TCCTTTTACG
8041 CTGTGTGGAT ATGCTGCTTT ATAGCCTCTG TATCTAGCTA TTGCTTCCCG TACGGCTTTC
8101 GTTTTCTCCT CCTTGTATAA ATCCTGGTTG CTGTCTCTTT TAGAGGAGTT GTGGCCCGTT
8161 GTCCGTCAAC GTGGCGTGGT GTGCTCTGTG TTTGCTGACG CAACCCCCAC TGGCTGGGGC
8221 ATTGCCACCA CCTGTCAACT CCTTTCTGGG ACTTTCGCTT TCCCCCTCCC GATCGCCACG
8281 GCAGAACTCA TCGCCGCCTG CCTTGCCCGC TGCTGGACAG GGGCTAGGTT GCTGGGCACT
8341 GATAATTCCG TGGTGTTGTC AGTACTGGTA CCTTTAAGAC CAATGACTTA CAAGGCAGCT
8401 GTAGATCTTA GCCACTTTTT AAAAGAAAAG GGGGGACTGG AAGGGCTAAT TCACTCCCAA
8461 AGAAGACAAG ATCTGCTTTT TGCCTGTACT GGGTCTCTCT GGTTAGACCA GATCTGAGCC
8521 TGGGAGCTCT CTGGCTAACT AGGGAACCCA CTGCTTAAGC CTCAATAAAG CTTGCCTTGA
8581 GTGCTTCAAG TAGTGTGTGC CCGTCTGTTG TGTGACTCTG GTAACTAGAG ATCCCTCAGA
8641 CCCTTTTAGT CAGTGTGGAA AATCTCTAGC A
pLKaUS MH1mTRAC(2-137) P2A MH1mTRBC(2-173) (서열 식별 번호:194)
1 CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT
61 ACGGTTATCC ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA
121 AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC
181 TGACGAGCAT CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA
241 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC
301 GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC
361 ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA
421 ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC
481 GGTAAGACAC GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG
541 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG
601 AACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG
661 CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA
721 GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA
781 CGCTCAGTGG AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGTTAAT TAACTTGCGC
841 CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC AGTGTTACAA CCAATTAACC AATTCTGATT
901 AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT CACATCAGGA TTATCAATAC
961 CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA CTCACCGAGG CAGTTCCATA
1021 GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG TCCAACATCA ATACAACCTA
1081 TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA ATCACCATGA GTGACGACTG
1141 AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA GACTTGTTCA ACAGGCCAGC
1201 CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC GTTATTCATT CGTGATTGCG
1261 CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA ATTACAAACA GGAATCGAAT
1321 GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT TTCACCTGAA TCAGGATATT
1381 CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT GGTGAGTAAC CATGCATCAT
1441 CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT AAATTCCGTC AGCCAGTTTA
1501 GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC TTTGCCATGT TTCAGAAACA
1561 ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT CGCACCTGAT TGCCCGACAT
1621 TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT GTTGGAATTT AATCGCGGCC
1681 TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT ATTACTGTTT ATGTAAGCAG
1741 ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC AATGTAACAT CAGAGATTTT
1801 GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA ACCTATAAAA ATAGGCGTAT
1861 CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT TGAGTGTTGT TCCAGTTTGG
1921 AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA AAGGGCGAAA AACCGTCTAT
1981 CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA GTTTTTTGGG GTCGAGGTGC
2041 CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG
2101 CCGGCGAACG TGGCGAGAAA GGAAGGGAAG AAAGCGAAAG GAGCGGGCGCTAAGGCGCTG
2161 GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG CCGCGCTTAA TGCGCCGCTA
2221 CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA AATACCGCAC AGATGCGTAA
2281 GGAGAAAATA CATCGTGATC CGGATCAAGA TCCAGATCGA ATTGGAGGCT ACAGTCAGTG
2341 GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC CTAGGGGACA TTGATTATTG
2401 ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC ATAGCCCATA TATGGAGTTC
2461 CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC CGCCCAACGA CCCCCGCCCA
2521 TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA TAGGGACTTT CCATTGACGT
2581 CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG TACATCAAGT GTATCATATG
2641 CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC CCGCCTGGCA TTATGCCCAG
2701 TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT ACGTATTAGT CATCGCTATT
2761 ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG GATAGCGGTT TGACTCACGG
2821 GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT TGTTTTGGCA CCAAAATCAA
2881 CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA CGCAAATGGG CGGTAGGCGT
2941 GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA
3001 CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA
3061 AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG TTGTGTGACT CTGGTAACTA
3121 GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT AGCAGTGGCG CCCGAACAGG
3181 GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC GCAGGACTCG GCTTGCTGAA
3241 GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA CGCCAAAAAT TTTGACTAGC
3301 GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA TTAAGCGGGG GAGAATTAGA
3361 TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA CAATATAAAC TAAAACATAT
3421 AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT CCTGGCCTTT TAGAGACATC
3481 AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC CTTCAGACAG GATCAGAAGA
3541 ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT GTGCATCAAA GGATAGATGT
3601 AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG CAAAACAAAAGTAAGAAAAA
3661 GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG CGATATGAGG GACAATTGGA
3721 GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC ATTAGGAGTA GCACCCACCA
3781 AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT GGGAATAGGA GCTTTGTTCC
3841 TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC GTCAATGACG CTGACGGTAC
3901 AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA CAATTTGCTG AGGGCTATTG
3961 AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT CAAACAGCTC CAGGCAAGAA
4021 TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT GGGGATTTGG GGTTGCTCTG
4081 GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG TTGGAGTAAT AAATCTCTGG
4141 AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG AGAAATTAAC AATTACACAA
4201 GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA AGAAAAGAAT GAACAAGAAT
4261 TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT TAACATAACA AATTGGCTGT
4321 GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG
4381 CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC ACCATTATCG TTTCAGACCC
4441 ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT ATTCATCCAC AATTTTAAAA
4501 GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT AGTAGACATA ATAGCAACAG
4561 ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT TCAAAATTTT CGGGTTTATT
4621 ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC GGCTCCGGTG CCCGTCAGTG
4681 GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG GGAGGGGTCG GCAATTGAAC
4741 CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT GATGTCGTGT ACTGGCTCCG
4801 CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA GTAGTCGCCG TGAACGTTCT
4861 TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC
4921 TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT ACTTCCACGC CCCTGGCTGC
4981 AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT
5041 GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC
5101 GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG
5161 CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA
5221 ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG GGCCGCGGGC GGCGACGGGG
5281 CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT GCGAGCGCGG CCACCGAGAA
5341 TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT
5401 GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA
5461 GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG GAGGACGCGG CGCTCGGGAG
5521 AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT
5581 CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT CGATTAGTTC TCGAGCTTTT
5641 GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC GATGGAGTTT CCCCACACTG
5701 AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT GTAATTCTCC TTGGAATTTG
5761 CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA GACAGTGGTT CAAAGTTTTT
5821 TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCATGCCGC CACCATGCTT CTCCTGGTGA
5881 CAAGCCTTCT GCTCTGTGAG TTACCACACC CAGCATTCCT CCTGATCCCA GAAGTTCAGC
5941 TGGTAGAGTC CGGTGGCGGG CTGGTACAGC CAGGGGGATC TCTCCGTCTC TCATGTGCTG
6001 CCAGTGGGGG AGATTGGTCC GCTAACTTTA TGTACTGGTA TCGTCAAGCA CCTGGGAAAC
6061 AACGCGAGCT GGTTGCACGG ATCTCTGGAC GAGGGGTAGT GGATTACGTG GAAAGTGTGA
6121 AAGGACGATT CACAATTTCC AGGGACAATT CTAAAAACAC CCTTTATTTG CAAATGAATA
6181 GTCTGAGAGC AGAAGACACA GCCGTATATT ATTGTGCAGT CGCATCCTAT TGGGGGCAGG
6241 GGACTCTTGT CACAGTCTCG AGTATTCAGA ACCCTGAGCC TGCCGTGTAT CAACTGAAGG
6301 ACCCTAGAAG CCAGGACAGC ACCCTGTGCC TGTTCACCGA CTTCGACAGC CAGATCAACG
6361 TGCCCAAGAC CATGGAAAGC GGCACCTTCA TCACCGATAA GACTGTGCTG GACATGAAGG
6421 CCATGGACAG CAAGAGCAAC GGCGCCATTG CATGGTCCAA TCAGACCAGC TTTACCTGCC
6481 AAGACATCTT CAAAGAGACA AACGCCACCT ACCCCAGTTC AGACGTTCCC TGTGATGCCA
6541 CGTTGACTGA GAAAAGCTTT GAAACAGATA TGAACCTAAA CTTTCAAAAC CTGTCAGTTA
6601 TGGGACTCCG AATCCTCCTG CTGAAAGTAG CCGGATTTAA CCTGCTCATG ACGCTGAGGC
6661 TGTGGTCCAG TGGCAGCGGC GCTACTAACT TCAGCCTGCT GAAGCAGGCT GGAGACGTGG
6721 AGGAGAACCC TGGACCTATG CTACTACTTG TGACCTCACT ATTGTTATGC GAACTCCCTC
6781 ATCCCGCATT CTTGCTGATT CCAGAGGTGC AACTTGTGGA AAGTGGGGGA GGTCTCGTTC
6841 AACCTGGTGG CAGCCTTAGA CTGAGCTGCG CAGCTTCAGG AGGTGACTGG AGTGCAAATT
6901 TCATGTATTG GTACAGACAG GCTCCAGGAA AGCAGCGAGA ACTTGTAGCC AGAATTAGCG
6961 GTAGGGGAGT TGTCGACTAT GTCGAGTCAG TTAAGGGTAG GTTTACCATC AGTCGAGATA
7021 ACAGCAAGAA TACATTGTAC CTCCAGATGA ACTCACTTCG GGCTGAGGAT ACTGCAGTGT
7081 ACTACTGCGC TGTTGCTAGT TACTGGGGAC AAGGTACATT GGTAACTGTT AGTTCAGATC
7141 TGAGAAATGT GACTCCACCC AAGGTCTCCT TGTTTGAGCC ATCAAAAGCA GAGATTGCAA
7201 ACAAACAAAA GGCTACCCTC GTGTGCTTGG CCAGGGGCTT CTTCCCTGAC CACGTGGAGC
7261 TGAGCTGGTG GGTGAATGGC AAGGAGGTCC ACAGTGGGGT CAGCACGGAC CCaCAGGCCT
7321 ACAAGGAGAG CAATTATAGC TACTGCCTGA GCAGCCGCCT GAGGGTCTCT GCTACCTTCT
7381 GGCACAATCC TCGCAACCAC TTCCGCTGCC AAGTGCAGTT CCATGGGCTT TCAGAGGAGG
7441 ACAAGTGGCC AGAGGGCTCA CCCAAACCTG TCACACAGAA CATCAGTGCA GAGGCCTGGG
7501 GTCGAGCAGA CTGTGGTATT ACCTCAGCAT CCTATCAACA AGGAGTCTTG TCTGCCACCA
7561 TCCTCTATGA GATCCTGCTA GGGAAAGCCA CCCTGTATGC TGTGCTTGTC AGTACACTGG
7621 TGGTGATGGC TATGGTCAAA AGAAAGAATT CATGAGATAT CGAGCATCTT ACCGCCATTT
7681 ATACCCATAT TTGTTCTGTT TTTCTTGATT TGGGTATACA TTTAAATGTT AATAAAACAA
7741 AATGGTGGGG CAATCATTTA CATTTTTAGG GATATGTAAT TACTAGTTCA GGTGTATTGC
7801 CACAAGACAA ACATGTTAAG AAACTTTCCC GTTATTTACG CTCTGTTCCT GTTAATCAAC
7861 CTCTGGATTA CAAAATTTGT GAAAGATTGA CTGATATTCT TAACTATGTT GCTCCTTTTA
7921 CGCTGTGTGG ATATGCTGCT TTATAGCCTC TGTATCTAGC TATTGCTTCC CGTACGGCTT
7981 TCGTTTTCTC CTCCTTGTAT AAATCCTGGT TGCTGTCTCT TTTAGAGGAG TTGTGGCCCG
8041 TTGTCCGTCA ACGTGGCGTG GTGTGCTCTG TGTTTGCTGA CGCAACCCCC ACTGGCTGGG
8101 GCATTGCCAC CACCTGTCAA CTCCTTTCTG GGACTTTCGC TTTCCCCCTC CCGATCGCCA
8161 CGGCAGAACT CATCGCCGCC TGCCTTGCCC GCTGCTGGAC AGGGGCTAGG TTGCTGGGCA
8221 CTGATAATTC CGTGGTGTTG TCAGTACTGG TACCTTTAAG ACCAATGACT TACAAGGCAG
8281 CTGTAGATCT TAGCCACTTT TTAAAAGAAA AGGGGGGACT GGAAGGGCTA ATTCACTCCC
8341 AAAGAAGACA AGATCTGCTT TTTGCCTGTA CTGGGTCTCT CTGGTTAGAC CAGATCTGAG
8401 CCTGGGAGCT CTCTGGCTAA CTAGGGAACC CACTGCTTAA GCCTCAATAA AGCTTGCCTT
8461 GAGTGCTTCA AGTAGTGTGT GCCCGTCTGT TGTGTGACTC TGGTAACTAG AGATCCCTCA
8521 GACCCTTTTA GTCAGTGTGG AAAATCTCTA GCATGATCAT AATCAAGCCA TATCACATCT
8581 GTAGAGGTTT ACTTGCTTTA AAAAACCTCC ACACCTCCCC CTGAACCTGA AACATAAAAT
8641 GAATGCAATT GTTGTTGTTA ACTTGTTTAT TGCAGCTTAT AATGGTTACA AATAAAGCAA
8701 TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG CATTCTAGTT GTGGTTTGTC
8761 CAAACTCATC AATGTATCTT ATCATGTCTG GATCTGCGTC GACACGAAGA GACGACTGAC
8821 TGACTGACTG GAAAGAGGAA GGGCTGGAAG AGGAAGGAGC TTGATCCAGA TCCCGATCTC
8881 GATCCAGATC CGGATCGCAG CTTGGTCTTC CGCTTCCTCG CTCACTGA
pLKaUS mTRAC(2-137) T2A mTRBC(2-173) P2A MH1CD3ε (서열 식별 번호:195)
1 CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT
61 ACGGTTATCC ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA
121 AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC
181 TGACGAGCAT CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA
241 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC
301 GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC
361 ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA
421 ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC
481 GGTAAGACAC GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG
541 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG
601 AACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG
661 CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA
721 GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA
781 CGCTCAGTGG AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGTTAAT TAACTTGCGC
841 CGTCCCGTCA AGTCAGCGTA ATGCTCTGCC AGTGTTACAA CCAATTAACC AATTCTGATT
901 AGAAAAACTC ATCGAGCATC AAATGAAACT GCAATTTATT CACATCAGGA TTATCAATAC
961 CATATTTTTG AAAAAGCCGT TTCTGTAATG AAGGAGAAAA CTCACCGAGG CAGTTCCATA
1021 GGATGGCAAG ATCCTGGTAT CGGTCTGCGA TTCCGACTCG TCCAACATCA ATACAACCTA
1081 TTAATTTCCC CTCGTCAAAA ATAAGGTTAT CAAGTGAGAA ATCACCATGA GTGACGACTG
1141 AATCCGGTGA GAATGGCAAA AGTTTATGCA TTTCTTTCCA GACTTGTTCA ACAGGCCAGC
1201 CATTACGCTC GTCATCAAAA TCACTCGCAT CAACCAAACC GTTATTCATT CGTGATTGCG
1261 CCTGAGCAAG ACGAAATACG CGATCGCTGT TAAAAGGACA ATTACAAACA GGAATCGAAT
1321 GCAACCGGCG CAGGAACACT GCCAGCGCAT CAACAATATT TTCACCTGAA TCAGGATATT
1381 CTTCTAATAC CTGGAATGCT GTTTTTCCGG GGATCGCAGT GGTGAGTAAC CATGCATCAT
1441 CAGGAGTACG GATAAAATGC TTGATGGTCG GAAGAGGCAT AAATTCCGTC AGCCAGTTTA
1501 GTCTGACCAT CTCATCTGTA ACATCATTGG CAACGCTACC TTTGCCATGT TTCAGAAACA
1561 ACTCTGGCGC ATCGGGCTTC CCATACAAGC GATAGATTGT CGCACCTGAT TGCCCGACAT
1621 TATCGCGAGC CCATTTATAC CCATATAAAT CAGCATCCAT GTTGGAATTT AATCGCGGCC
1681 TCGACGTTTC CCGTTGAATA TGGCTCATAA CACCCCTTGT ATTACTGTTT ATGTAAGCAG
1741 ACAGTTTTAT TGTTCATGAT GATATATTTT TATCTTGTGC AATGTAACAT CAGAGATTTT
1801 GAGACACAAC GTGGCTTTCC CCCCCCCCCC CATGACATTA ACCTATAAAA ATAGGCGTAT
1861 CACGAGGCCA GCTTGGGAAA CCATAAGACC GAGATAGAGT TGAGTGTTGT TCCAGTTTGG
1921 AACAAGAGTC CACTATTAAA GAACGTGGAC TCCAACGTCA AAGGGCGAAA AACCGTCTAT
1981 CAGGGCGATG GCCCACTACG TGAACCATCA CCCAAATCAA GTTTTTTGGG GTCGAGGTGC
2041 CGTAAAGCAC TAAATCGGAA CCCTAAAGGG AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG
2101 CCGGCGAACG TGGCGAGAAA GGAAGGGAAG AAAGCGAAAG GAGCGGGCGCTAAGGCGCTG
2161 GCAAGTGTAG CGGTCACGCT GCGCGTAACC ACCACACCCG CCGCGCTTAA TGCGCCGCTA
2221 CAGGGCGCGT ACTATGGTTG CTTTGACGTA TGCGGTGTGA AATACCGCAC AGATGCGTAA
2281 GGAGAAAATA CATCGTGATC CGGATCAAGA TCCAGATCGA ATTGGAGGCT ACAGTCAGTG
2341 GAGAGGACTT TCACTGACTG ACTGACTGCG TCTCAACCTC CTAGGGGACA TTGATTATTG
2401 ACTAGTTATT AATAGTAATC AATTACGGGG TCATTAGTTC ATAGCCCATA TATGGAGTTC
2461 CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC CGCCCAACGA CCCCCGCCCA
2521 TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA TAGGGACTTT CCATTGACGT
2581 CAATGGGTGG AGTATTTACG GTAAACTGCC CACTTGGCAG TACATCAAGT GTATCATATG
2641 CCAAGTACGC CCCCTATTGA CGTCAATGAC GGTAAATGGC CCGCCTGGCA TTATGCCCAG
2701 TACATGACCT TATGGGACTT TCCTACTTGG CAGTACATCT ACGTATTAGT CATCGCTATT
2761 ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG GATAGCGGTT TGACTCACGG
2821 GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT TGTTTTGGCA CCAAAATCAA
2881 CGGGACTTTC CAAAATGTCG TAACAACTCC GCCCCATTGA CGCAAATGGG CGGTAGGCGT
2941 GTACGGTGGG AGGTCTATAT AAGCAGAGCT CGTTTAGTGA ACCGGGTCTC TCTGGTTAGA
3001 CCAGATCTGA GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA
3061 AAGCTTGCCT TGAGTGCTCA AAGTAGTGTG TGCCCGTCTG TTGTGTGACT CTGGTAACTA
3121 GAGATCCCTC AGACCCTTTT AGTCAGTGTG GAAAATCTCT AGCAGTGGCG CCCGAACAGG
3181 GACTTGAAAG CGAAAGTAAA GCCAGAGGAG ATCTCTCGAC GCAGGACTCG GCTTGCTGAA
3241 GCGCGCACGG CAAGAGGCGA GGGGCGGCGA CTGGTGAGTA CGCCAAAAAT TTTGACTAGC
3301 GGAGGCTAGA AGGAGAGAGT AGGGTGCGAG AGCGTCGGTA TTAAGCGGGG GAGAATTAGA
3361 TAAATGGGAA AAAATTCGGT TAAGGCCAGG GGGAAAGAAA CAATATAAAC TAAAACATAT
3421 AGTTAGGGCA AGCAGGGAGC TAGAACGATT CGCAGTTAAT CCTGGCCTTT TAGAGACATC
3481 AGAAGGCTGT AGACAAATAC TGGGACAGCT ACAACCATCC CTTCAGACAG GATCAGAAGA
3541 ACTTAGATCA TTATATAATA CAATAGCAGT CCTCTATTGT GTGCATCAAA GGATAGATGT
3601 AAAAGACACC AAGGAAGCCT TAGATAAGAT AGAGGAAGAG CAAAACAAAAGTAAGAAAAA
3661 GGCACAGCAA GCGATCTTCA GACCTGGAGG AGGCAGGAGG CGATATGAGG GACAATTGGA
3721 GAAGTGAATT ATATAAATAT AAAGTAGTAA AAATTGAACC ATTAGGAGTA GCACCCACCA
3781 AGGCAAAGAG AAGAGTGGTG CAGAGAGAAA AAAGAGCAGT GGGAATAGGA GCTTTGTTCC
3841 TTGGGTTCTT GGGAGCAGCA GGAAGCACTA TGGGCGCAGC GTCAATGACG CTGACGGTAC
3901 AGGCCAGACA ATTATTGTCT GATATAGTGC AGCAGCAGAA CAATTTGCTG AGGGCTATTG
3961 AGGCGCAACA GCATCTGTTG CAACTCACAG TCTGGGGCAT CAAACAGCTC CAGGCAAGAA
4021 TCCTGGCTGT GGAAAGATAC CTAAAGGATC AACAGCTCCT GGGGATTTGG GGTTGCTCTG
4081 GAAAACTCAT TTGCACCACT GCTGTGCCTT GGAATGCTAG TTGGAGTAAT AAATCTCTGG
4141 AACAGATTTG GAATAACATG ACCTGGATGG AGTGGGACAG AGAAATTAAC AATTACACAA
4201 GCTTAATACA CTCCTTAATT GAAGAATCGC AAAACCAGCA AGAAAAGAAT GAACAAGAAT
4261 TATTGGAATT AGATAAATGG GCAAGTTTGT GGAATTGGTT TAACATAACA AATTGGCTGT
4321 GGTATATAAA ATTATTCATA ATGATAGTAG GAGGCTTGGT AGGTTTAAGA ATAGTTTTTG
4381 CTGTACTTTC TATAGTGAAT AGAGTTAGGC AGGGATATTC ACCATTATCG TTTCAGACCC
4441 ACCTCCCAAT CCCGAGGGGA CCACGCGTAC AAATGGCAGT ATTCATCCAC AATTTTAAAA
4501 GAAAAGGGGG GATTGGGGGG TACAGTGCAG GGGAAAGAAT AGTAGACATA ATAGCAACAG
4561 ACATACAAAC TAAAGAATTA CAAAAACAAA TTACAAAAAT TCAAAATTTT CGGGTTTATT
4621 ACAGGGACAG CAGAAATCCA CTTTGGAAAG CTGAGCATCC GGCTCCGGTG CCCGTCAGTG
4681 GGCAGAGCGC ACATCGCCCA CAGTCCCCGA GAAGTTGGGG GGAGGGGTCG GCAATTGAAC
4741 CGGTGCCTAG AGAAGGTGGC GCGGGGTAAA CTGGGAAAGT GATGTCGTGT ACTGGCTCCG
4801 CCTTTTTCCC GAGGGTGGGG GAGAACCGTA TATAAGTGCA GTAGTCGCCG TGAACGTTCT
4861 TTTTCGCAAC GGGTTTGCCG CCAGAACACA GGTAAGTGCC GTGTGTGGTT CCCGCGGGCC
4921 TGGCCTCTTT ACGGGTTATG GCCCTTGCGT GCCTTGAATT ACTTCCACGC CCCTGGCTGC
4981 AGTACGTGAT TCTTGATCCC GAGCTTCGGG TTGGAAGTGG GTGGGAGAGT TCGAGGCCTT
5041 GCGCTTAAGG AGCCCCTTCG CCTCGTGCTT GAGTTGAGGC CTGGCCTGGG CGCTGGGGCC
5101 GCCGCGTGCG AATCTGGTGG CACCTTCGCG CCTGTCTCGC TGCTTTCGAT AAGTCTCTAG
5161 CCATTTAAAA TTTTTGATGA CCTGCTGCGA CGCTTTTTTT CTGGCAAGAT AGTCTTGTAA
5221 ATGCGGGCCA AGATCTGCAC ACTGGTATTT CGGTTTTTGG GGCCGCGGGC GGCGACGGGG
5281 CCCGTGCGTC CCAGCGCACA TGTTCGGCGA GGCGGGGCCT GCGAGCGCGG CCACCGAGAA
5341 TCGGACGGGG GTAGTCTCAA GCTGGCCGGC CTGCTCTGGT GCCTGGCCTC GCGCCGCCGT
5401 GTATCGCCCC GCCCTGGGCG GCAAGGCTGG CCCGGTCGGC ACCAGTTGCG TGAGCGGAAA
5461 GATGGCCGCT TCCCGGCCCT GCTGCAGGGA GCTCAAAATG GAGGACGCGG CGCTCGGGAG
5521 AGCGGGCGGG TGAGTCACCC ACACAAAGGA AAAGGGCCTT TCCGTCCTCA GCCGTCGCTT
5581 CATGTGACTC CACGGAGTAC CGGGCGCCGT CCAGGCACCT CGATTAGTTC TCGAGCTTTT
5641 GGAGTACGTC GTCTTTAGGT TGGGGGGAGG GGTTTTATGC GATGGAGTTT CCCCACACTG
5701 AGTGGGTGGA GACTGAAGTT AGGCCAGCTT GGCACTTGAT GTAATTCTCC TTGGAATTTG
5761 CCCTTTTTGA GTTTGGATCT TGGTTCATTC TCAAGCCTCA GACAGTGGTT CAAAGTTTTT
5821 TTCTTCCATT TCAGGTGTCG TGAAAACTAC CCCATGCCGC CACCATGCTT CTCCTGGTGA
5881 CAAGCCTTCT GCTCTGTGAG TTACCACACC CAGCATTCCT CCTGATCCCA ATTCAGAACC
5941 CTGAGCCTGC CGTGTATCAA CTGAAGGACC CTAGAAGCCA GGACAGCACC CTGTGCCTGT
6001 TCACCGACTT CGACAGCCAG ATCAACGTGC CCAAGACCAT GGAAAGCGGC ACCTTCATCA
6061 CCGATAAGAC TGTGCTGGAC ATGAAGGCCA TGGACAGCAA GAGCAACGGC GCCATTGCAT
6121 GGTCCAATCA GACCAGCTTT ACCTGCCAAG ACATCTTCAA AGAGACAAAC GCCACCTACC
6181 CCAGTTCAGA CGTTCCCTGT GATGCCACGT TGACTGAGAA AAGCTTTGAA ACAGATATGA
6241 ACCTAAACTT TCAAAACCTG TCAGTTATGG GACTCCGAAT CCTCCTGCTG AAAGTAGCCG
6301 GATTTAACCT GCTCATGACG CTGAGGCTGT GGTCCAGTGG CAGCGGCGAG GGCAGAGGAA
6361 GTCTGCTAAC ATGCGGTGAC GTCGAGGAGA ATCCTGGACC TATGCTACTA CTTGTGACCT
6421 CACTATTGTT ATGCGAACTC CCTCATCCCG CATTCTTGCT GATTCCAGAT CTGAGAAATG
6481 TGACTCCACC CAAGGTCTCC TTGTTTGAGC CATCAAAAGC AGAGATTGCA AACAAACAAA
6541 AGGCTACCCT CGTGTGCTTG GCCAGGGGCT TCTTCCCTGA CCACGTGGAG CTGAGCTGGT
6601 GGGTGAATGG CAAGGAGGTC CACAGTGGGG TCAGCACGGA CCCaCAGGCC TACAAGGAGA
6661 GCAATTATAG CTACTGCCTG AGCAGCCGCC TGAGGGTCTC TGCTACCTTC TGGCACAATC
6721 CTCGCAACCA CTTCCGCTGC CAAGTGCAGT TCCATGGGCT TTCAGAGGAG GACAAGTGGC
6781 CAGAGGGCTC ACCCAAACCT GTCACACAGA ACATCAGTGC AGAGGCCTGG GGTCGAGCAG
6841 ACTGTGGTAT TACCTCAGCA TCCTATCAAC AAGGAGTCTT GTCTGCCACC ATCCTCTATG
6901 AGATCCTGCT AGGGAAAGCC ACCCTGTATG CTGTGCTTGT CAGTACACTG GTGGTGATGG
6961 CTATGGTCAA AAGAAAGAAT TCAGGATCTG GTGCTACTAA CTTCAGCCTG CTGAAGCAGG
7021 CTGGAGACGT GGAGGAGAAC CCTGGACCTA TGCTCCTGCT TGTGACGTCC CTCCTGCTTT
7081 GTGAACTCCC GCATCCTGCC TTCCTGCTCA TCCCTGAAGT TCAGCTGGTA GAGTCCGGTG
7141 GCGGGCTGGT ACAGCCAGGG GGATCTCTCC GTCTCTCATG TGCTGCCAGT GGGGGAGATT
7201 GGTCCGCTAA CTTTATGTAC TGGTATCGTC AAGCACCTGG GAAACAACGC GAGCTGGTTG
7261 CACGGATCTC TGGACGAGGG GTAGTGGATT ACGTGGAAAG TGTGAAAGGA CGATTCACAA
7321 TTTCCAGGGA CAATTCTAAA AACACCCTTT ATTTGCAAAT GAATAGTCTG AGAGCAGAAG
7381 ACACAGCCGT ATATTATTGT GCAGTCGCAT CCTATTGGGG GCAGGGGACT CTTGTCACAG
7441 TCTCGAGTGC TGCCGCAGGA GGCGGTGGCA GTGGTGGGGG AGGATCTGGC GGAGGAGGTA
7501 GCCTCGAGGA CGGAAACGAG GAGATGGGGG GAATCACTCA AACCCCTTAC AAGGTGTCTA
7561 TTTCCGGCAC TACCGTGATT CTTACCTGTC CACAATACCC AGGCAGCGAT ATTCTCTGGC
7621 AGCATAACGA CAAAAATATC GGAGGAGACG AAGACGACAA GAATATCGGG TCGGACGAAG
7681 ACCATCTCAG CCTTAAAGAG TTCAGCGAGC TTGAACAGAG CGGCTACTAC GTTTGTTATC
7741 CACGAGGGTC TAAGCCTGAG GACGCAAATT TCTACCTGTA TCTCAGAGCT AGGGTTTGCG
7801 AAAATTGTAT GGAAATGGAC GTTATGAGTG TCGCTACGAT CGTGATTGTT GATATTTGTA
7861 TTACAGGAGG GCTGCTTTTG CTCGTCTATT ATTGGTCTAA AAACCGGAAA GCTAAAGCAA
7921 AACCCGTAAC GAGGGGCGCT GGAGCAGGAG GAAGACAGAG AGGCCAGAATAAAGAACGTC
7981 CTCCCCCAGT GCCAAATCCC GATTACGAAC CAATTAGAAA GGGACAAAGA GATTTGTACA
8041 GCGGACTCAA CCAACGGAGA ATTTGAGATA TCGAGCATCT TACCGCCATT TATACCCATA
8101 TTTGTTCTGT TTTTCTTGAT TTGGGTATAC ATTTAAATGT TAATAAAACA AAATGGTGGG
8161 GCAATCATTT ACATTTTTAG GGATATGTAA TTACTAGTTC AGGTGTATTG CCACAAGACA
8221 AACATGTTAA GAAACTTTCC CGTTATTTAC GCTCTGTTCC TGTTAATCAA CCTCTGGATT
8281 ACAAAATTTG TGAAAGATTG ACTGATATTC TTAACTATGT TGCTCCTTTT ACGCTGTGTG
8341 GATATGCTGC TTTATAGCCT CTGTATCTAG CTATTGCTTC CCGTACGGCT TTCGTTTTCT
8401 CCTCCTTGTA TAAATCCTGG TTGCTGTCTC TTTTAGAGGA GTTGTGGCCC GTTGTCCGTC
8461 AACGTGGCGT GGTGTGCTCT GTGTTTGCTG ACGCAACCCC CACTGGCTGG GGCATTGCCA
8521 CCACCTGTCA ACTCCTTTCT GGGACTTTCG CTTTCCCCCT CCCGATCGCC ACGGCAGAAC
8581 TCATCGCCGC CTGCCTTGCC CGCTGCTGGA CAGGGGCTAG GTTGCTGGGC ACTGATAATT
8641 CCGTGGTGTT GTCAGTACTG GTACCTTTAA GACCAATGAC TTACAAGGCA GCTGTAGATC
8701 TTAGCCACTT TTTAAAAGAA AAGGGGGGAC TGGAAGGGCT AATTCACTCC CAAAGAAGAC
8761 AAGATCTGCT TTTTGCCTGT ACTGGGTCTC TCTGGTTAGA CCAGATCTGA GCCTGGGAGC
8821 TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT TGAGTGCTTC
8881 AAGTAGTGTG TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC AGACCCTTTT
8941 AGTCAGTGTG GAAAATCTCT AGCATGATCA TAATCAAGCC ATATCACATC TGTAGAGGTT
9001 TACTTGCTTT AAAAAACCTC CACACCTCCC CCTGAACCTG AAACATAAAA TGAATGCAAT
9061 TGTTGTTGTT AACTTGTTTA TTGCAGCTTA TAATGGTTAC AAATAAAGCA ATAGCATCAC
9121 AAATTTCACA AATAAAGCAT TTTTTTCACT GCATTCTAGT TGTGGTTTGT CCAAACTCAT
9181 CAATGTATCT TATCATGTCT GGATCTGCGT CGACACGAAG AGACGACTGA CTGACTGACT
9241 GGAAAGAGGA AGGGCTGGAA GAGGAAGGAG CTTGATCCAG ATCCCGATCT CGATCCAGAT
9301 CCGGATCGCA GCTTGGTCTT CCGCTTCCTC GCTCACTGA
항-MSLN-CD3 엡실론 (서열 식별 번호 198)
MLLLVTSLLLCELPHPAFLLIPEVQLVESGGGLVQPGGSLRLSCAASGGDWSANFMYWYRQAPGKQRELVARISGRGVVDYVESVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCAVASYWGQGTLVTVSSAAAGGGGSGGGGSGGGGSLEDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI
항-CD19-CD3 엡실론 (서열 식별 번호 199)
MLLLVTSLLLCELPHPAFLLIPDIQMTQTTSSLSASLGDRVTISCRASQDISKYLNWYQQKPDGTVKLLIYHTSRLHSGVPSRFSGSGSGTDYSLTISNLEQEDIATYFCQQGNTLPYTFGGGTKLEITGGGGSGGGGSGGGGSEVKLQESGPGLVAPSQSLSVTCTVSGVSLPDYGVSWIRQPPRKGLEWLGVIWGSETTYYNSALKSRLTIIKDNSKSQVFLKMNSLQTDDTAIYYCAKHYYYGGSYAMDYWGQGTSVTVSSAAAGGGGSGGGGSGGGGSLEDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILWQHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARVCENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQNKERPPPVPNPDYEPIRKGQRDLYSGLNQRRI
SEQUENCE LISTING <110> TCR2 THERAPEUTICS INC. <120> COMPOSITIONS AND METHODS FOR TCR REPROGRAMMING USING FUSION PROTEINS <130> 48538-735.601 <140> PCT/US2020/050503 <141> 2020-09-11 <150> 62/971,682 <151> 2020-02-07 <150> 62/899,563 <151> 2019-09-12 <160> 360 <170> PatentIn version 3.5 <210> 1 <211> 656 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 1 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Glu Gly Arg Gly Ser 435 440 445 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 450 455 460 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 465 470 475 480 Leu Ile Pro Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr 485 490 495 Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr 500 505 510 Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His 515 520 525 Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn 530 535 540 Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val 545 550 555 560 Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu 565 570 575 Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys 580 585 590 Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala 595 600 605 Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met 610 615 620 Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr 625 630 635 640 Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 645 650 655 <210> 2 <211> 921 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 2 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Glu Gly Arg Gly Ser 435 440 445 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 450 455 460 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 465 470 475 480 Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala 485 490 495 Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile 500 505 510 Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys 515 520 525 Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg 530 535 540 Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn 545 550 555 560 Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr 565 570 575 Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser 580 585 590 Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly 595 600 605 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 610 615 620 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 625 630 635 640 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 645 650 655 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 660 665 670 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 675 680 685 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 690 695 700 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 705 710 715 720 Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser 725 730 735 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln Leu 740 745 750 Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile Ala 755 760 765 Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu Lys 770 775 780 Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser Asn 785 790 795 800 Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp Thr 805 810 815 Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp Lys 820 825 830 Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val Asp 835 840 845 Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met Asp 850 855 860 Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu Gln 865 870 875 880 Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys 885 890 895 Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg Thr 900 905 910 Ala Phe Cys Cys Asn Gly Glu Lys Ser 915 920 <210> 3 <211> 884 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 3 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 180 185 190 Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu 195 200 205 Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Lys Gln Leu Asp Ala 210 215 220 Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr 225 230 235 240 Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe 245 250 255 Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser Asn Thr Ile 260 265 270 Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp Thr Tyr Met 275 280 285 Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp Lys Glu His 290 295 300 Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val Asp Gln Glu 305 310 315 320 Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met Asp Pro Lys 325 330 335 Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr 340 345 350 Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys Ser Val 355 360 365 Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe 370 375 380 Cys Cys Asn Gly Glu Lys Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu 385 390 395 400 Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu 405 410 415 Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu 420 425 430 Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser 435 440 445 Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser 450 455 460 Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu 465 470 475 480 Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe 485 490 495 Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu 500 505 510 Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu 515 520 525 Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr 530 535 540 Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu 545 550 555 560 Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser 565 570 575 Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly 580 585 590 Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly 595 600 605 Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser 610 615 620 Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys 625 630 635 640 Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys 645 650 655 His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly 660 665 670 Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly 675 680 685 Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Gly Asn Glu Glu 690 695 700 Met Gly Gly Ile Thr Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr 705 710 715 720 Thr Val Ile Leu Thr Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp 725 730 735 Gln His Asn Asp Lys Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile 740 745 750 Gly Ser Asp Glu Asp His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu 755 760 765 Gln Ser Gly Tyr Tyr Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp 770 775 780 Ala Asn Phe Tyr Leu Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met 785 790 795 800 Glu Met Asp Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys 805 810 815 Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg 820 825 830 Lys Ala Lys Ala Lys Pro Val Thr Arg Gly Ala Gly Ala Gly Gly Arg 835 840 845 Gln Arg Gly Gln Asn Lys Glu Arg Pro Pro Pro Val Pro Asn Pro Asp 850 855 860 Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn 865 870 875 880 Gln Arg Arg Ile <210> 4 <211> 656 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 4 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 180 185 190 Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu 195 200 205 Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln 210 215 220 Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser 225 230 235 240 Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln 245 250 255 Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu 260 265 270 His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp 275 280 285 Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr 290 295 300 Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr 305 310 315 320 Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser 325 330 335 Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro 340 345 350 Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser 355 360 365 Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro 370 375 380 Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr 385 390 395 400 Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn 405 410 415 Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp 420 425 430 Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr 435 440 445 Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala 450 455 460 Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 465 470 475 480 Ser Leu Glu Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr 485 490 495 Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr 500 505 510 Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His 515 520 525 Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn 530 535 540 Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val 545 550 555 560 Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu 565 570 575 Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys 580 585 590 Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala 595 600 605 Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met 610 615 620 Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr 625 630 635 640 Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 645 650 655 <210> 5 <211> 887 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 5 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu 420 425 430 Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Glu Gly Arg Gly 435 440 445 Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu 450 455 460 Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe 465 470 475 480 Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser 485 490 495 Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp 500 505 510 Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val 515 520 525 Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser 530 535 540 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser 545 550 555 560 Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn 565 570 575 Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly 580 585 590 Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys 595 600 605 Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser 610 615 620 Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp 625 630 635 640 Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp 645 650 655 Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu 660 665 670 Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe 675 680 685 Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys 690 695 700 Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly 705 710 715 720 Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly 725 730 735 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln 740 745 750 Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile 755 760 765 Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu 770 775 780 Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser 785 790 795 800 Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp 805 810 815 Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp 820 825 830 Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val 835 840 845 Asp Gln Glu Ile Ile Phe Pro Thr Ile Leu Tyr Glu Ile Leu Leu Gly 850 855 860 Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met Ala 865 870 875 880 Met Val Lys Arg Lys Asp Phe 885 <210> 6 <211> 634 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly 100 105 110 Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys 115 120 125 Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser 130 135 140 Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser 145 150 155 160 Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile 165 170 175 Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu 180 185 190 Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn 195 200 205 Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr 210 215 220 Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser 225 230 235 240 Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly 245 250 255 Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser Gln Pro His Thr Lys Pro 260 265 270 Ser Val Phe Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys 275 280 285 Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys 290 295 300 Ile Thr Glu Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr 305 310 315 320 Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys 325 330 335 Ser Val Gln His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val 340 345 350 Lys Thr Asp Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr 355 360 365 Lys Gln Pro Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr 370 375 380 Glu Lys Val Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu 385 390 395 400 Phe Ala Lys Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe 405 410 415 Phe Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp 420 425 430 Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu 435 440 445 Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Lys Gln 450 455 460 Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile 465 470 475 480 Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu 485 490 495 Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser 500 505 510 Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp 515 520 525 Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp 530 535 540 Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val 545 550 555 560 Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met 565 570 575 Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu 580 585 590 Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu 595 600 605 Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg 610 615 620 Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 625 630 <210> 7 <211> 1902 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 gacatccaga tgacacagac tacatcctcc ctgtctgcct ctctgggaga cagagtcacc 60 atcagttgca gggcaagtca ggacattagt aaatatttaa attggtatca gcagaaacca 120 gatggaactg ttaaactcct gatctaccat acatcaagat tacactcagg agtcccatca 180 aggttcagtg gcagtgggtc tggaacagat tattctctca ccattagcaa cctggagcaa 240 gaagatattg ccacttactt ttgccaacag ggtaatacgc ttccgtacac gttcggaggg 300 gggactaagt tggaaataac aggctccacc tctggatccg gcaagcccgg atctggcgag 360 ggatccacca agggcgaggt gaaactgcag gagtcaggac ctggcctggt ggcgccctca 420 cagagcctgt ccgtcacatg cactgtctca ggggtctcat tacccgacta tggtgtaagc 480 tggattcgcc agcctccacg aaagggtctg gagtggctgg gagtaatatg gggtagtgaa 540 accacatact ataattcagc tctcaaatcc agactgacca tcatcaagga caactccaag 600 agccaagttt tcttaaaaat gaacagtctg caaactgatg acacagccat ttactactgt 660 gccaaacatt attactacgg tggtagctat gctatggact actggggtca aggaacctca 720 gtcaccgtct cctcagcggc cgcaggtgga ggaggttctg gaggtggtgg atcaggtggt 780 ggaggatctt tagaaagtca gcctcatacc aaaccatccg tttttgtcat gaaaaatgga 840 acaaatgtcg cttgtctggt gaaggaattc taccccaagg atataagaat aaatctcgtg 900 tcatccaaga agataacaga gtttgatcct gctattgtca tctctcccag tgggaagtac 960 aatgctgtca agcttggtaa atatgaagat tcaaattcag tgacatgttc agttcaacac 1020 gacaataaaa ctgtgcactc cactgacttt gaagtgaaga cagattctac agatcacgta 1080 aaaccaaagg aaactgaaaa cacaaagcaa ccttcaaaga gctgccataa acccaaagcc 1140 atagttcata ccgagaaggt gaacatgatg tccctcacag tgcttgggct acgaatgctg 1200 tttgcaaaga ctgttgccgt caattttctc ttgactgcca agttattttt cttggggtca 1260 ggcgagggca gaggaagtct gctaacatgc ggtgacgtcg aggagaatcc tggacctatg 1320 ctactacttg tgacctcact attgttatgc gaactccctc atcccgcatt cttgctgatt 1380 ccagataaac aacttgatgc agatgtttcc cccaagccca ctatttttct tccttcaatt 1440 gctgaaacaa agctccagaa ggctggaaca tacctttgtc ttcttgagaa atttttccct 1500 gatgttatta agatacattg gcaagaaaag aagagcaaca cgattctggg atcccaggag 1560 gggaacacca tgaagactaa cgacacatac atgaaattta gctggttaac ggtgccagaa 1620 aagtcactgg acaaagaaca cagatgtatc gtcagacatg agaataataa aaacggagtt 1680 gatcaagaaa ttatctttcc tccaataaag acagatgtca tcacaatgga tcccaaagac 1740 aattgttcaa aagatgcaaa tgatacacta ctgctgcagc tcacaaacac ctctgcatat 1800 tacatgtacc tcctcctgct cctcaagagt gtggtctatt ttgccatcat cacctgctgt 1860 ctgcttagaa gaacggcttt ctgctgcaat ggagagaaat ca 1902 <210> 8 <211> 634 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Ser Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr 1 5 10 15 Asn Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile 20 25 30 Asn Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val 35 40 45 Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu 50 55 60 Asp Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val 65 70 75 80 His Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys 85 90 95 Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys 100 105 110 Pro Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr 115 120 125 Val Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe 130 135 140 Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Glu Gly Arg Gly 145 150 155 160 Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu 165 170 175 Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe 180 185 190 Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser 195 200 205 Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp 210 215 220 Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val 225 230 235 240 Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser 245 250 255 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser 260 265 270 Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn 275 280 285 Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly 290 295 300 Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys 305 310 315 320 Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser 325 330 335 Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp 340 345 350 Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp 355 360 365 Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu 370 375 380 Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe 385 390 395 400 Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys 405 410 415 Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly 420 425 430 Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly 435 440 445 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln 450 455 460 Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile 465 470 475 480 Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu 485 490 495 Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser 500 505 510 Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp 515 520 525 Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp 530 535 540 Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val 545 550 555 560 Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met 565 570 575 Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu 580 585 590 Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu 595 600 605 Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg 610 615 620 Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 625 630 <210> 9 <211> 1902 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 9 agtcagcctc ataccaaacc atccgttttt gtcatgaaaa atggaacaaa tgtcgcttgt 60 ctggtgaagg aattctaccc caaggatata agaataaatc tcgtgtcatc caagaagata 120 acagagtttg atcctgctat tgtcatctct cccagtggga agtacaatgc tgtcaagctt 180 ggtaaatatg aagattcaaa ttcagtgaca tgttcagttc aacacgacaa taaaactgtg 240 cactccactg actttgaagt gaagacagat tctacagatc acgtaaaacc aaaggaaact 300 gaaaacacaa agcaaccttc aaagagctgc cataaaccca aagccatagt tcataccgag 360 aaggtgaaca tgatgtccct cacagtgctt gggctacgaa tgctgtttgc aaagactgtt 420 gccgtcaatt ttctcttgac tgccaagtta tttttcttgg ggtcaggcga gggcagagga 480 agtctgctaa catgcggtga cgtcgaggag aatcctggac ctatgctact acttgtgacc 540 tcactattgt tatgcgaact ccctcatccc gcattcttgc tgattccaga cattcagatg 600 actcaaacaa cttccagcct ctccgcctca ctcggcgacc gcgtaacaat aagctgtcgg 660 gcctcgcaag atattagtaa gtacctgaat tggtatcagc aaaaacccga tggtacagtc 720 aagcttctga tctaccatac cagtcgtctg cacagcggtg tccccagcag gttcagcggc 780 tcaggatctg gtaccgatta ttcactgacg atttccaacc ttgagcagga ggacatcgcc 840 acctacttct gccagcaggg taatactctg ccgtacacat tcgggggcgg taccaagctc 900 gagatcacgg gttcaacaag cggttctggc aagccaggca gcggcgaggg gagtacaaag 960 ggggaggtga agttgcagga aagtggccct ggattggtgg ccccgagcca gagtctgtct 1020 gtcacctgca cagtttccgg agtaagtctg cctgattacg gagtgtcctg gatcagacag 1080 ccacctcgaa agggcttgga gtggcttggg gtcatttggg gcagtgaaac cacatactac 1140 aacagcgctc ttaagtccag gctcactatc atcaaggaca attcaaagag ccaagtattc 1200 ttgaaaatga attccctgca gactgatgac accgctattt attattgcgc taaacattat 1260 tactatggag gttcttatgc catggactac tgggggcagg gtacctctgt gacagtgagt 1320 tcagctgcag ctggaggtgg aggtagcgga ggcggtggta gtggaggggg tggttctctg 1380 gaagataaac aacttgatgc agatgtttcc cccaagccca ctatttttct tccttcaatt 1440 gctgaaacaa agctccagaa ggctggaaca tacctttgtc ttcttgagaa atttttccct 1500 gatgttatta agatacattg gcaagaaaag aagagcaaca cgattctggg atcccaggag 1560 gggaacacca tgaagactaa cgacacatac atgaaattta gctggttaac ggtgccagaa 1620 aagtcactgg acaaagaaca cagatgtatc gtcagacatg agaataataa aaacggagtt 1680 gatcaagaaa ttatctttcc tccaataaag acagatgtca tcacaatgga tcccaaagac 1740 aattgttcaa aagatgcaaa tgatacacta ctgctgcagc tcacaaacac ctctgcatat 1800 tacatgtacc tcctcctgct cctcaagagt gtggtctatt ttgccatcat cacctgctgt 1860 ctgcttagaa gaacggcttt ctgctgcaat ggagagaaat ca 1902 <210> 10 <211> 371 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Gly Gly Gly Ser 100 105 110 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val Lys Leu Gln Glu 115 120 125 Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys 130 135 140 Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg 145 150 155 160 Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser 165 170 175 Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile 180 185 190 Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln 195 200 205 Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly 210 215 220 Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val 225 230 235 240 Ser Ser Gly Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr 245 250 255 Leu Thr Glu Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn 260 265 270 Leu Ser Val Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe 275 280 285 Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Glu Gly 290 295 300 Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 305 310 315 320 Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val 325 330 335 Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu 340 345 350 Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg 355 360 365 Lys Asn Ser 370 <210> 11 <211> 1113 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 gacatccaga tgacacagac tacatcctcc ctgtctgcct ctctgggaga cagagtcacc 60 atcagttgca gggcaagtca ggacattagt aaatatttaa attggtatca gcagaaacca 120 gatggaactg ttaaactcct gatctaccat acatcaagat tacactcagg agtcccatca 180 aggttcagtg gcagtgggtc tggaacagat tattctctca ccattagcaa cctggagcaa 240 gaagatattg ccacttactt ttgccaacag ggtaatacgc ttccgtacac gttcggaggg 300 gggactaagt tggaaataac aggaggtgga ggttctggtg gaggaggttc aggaggtggt 360 ggaagtgagg tgaaactgca ggagtcagga cctggcctgg tggcgccctc acagagcctg 420 tccgtcacat gcactgtctc aggggtctca ttacccgact atggtgtaag ctggattcgc 480 cagcctccac gaaagggtct ggagtggctg ggagtaatat ggggtagtga aaccacatac 540 tataattcag ctctcaaatc cagactgacc atcatcaagg acaactccaa gagccaagtt 600 ttcttaaaaa tgaacagtct gcaaactgat gacacagcca tttactactg tgccaaacat 660 tattactacg gtggtagcta tgctatggac tactggggtc aaggaacctc agtcaccgtc 720 tcctcaggag ccacctaccc cagttcagac gttccctgtg atgccacgtt gactgagaaa 780 agctttgaaa cagatatgaa cctaaacttt caaaacctgt cagttatggg actccgaatc 840 ctcctgctga aagtagccgg atttaacctg ctcatgacgc tgaggctgtg gtccagtggc 900 agcggcgagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct 960 ggtcgagcag actgtggtat tacctcagca tcctatcaac aaggagtctt gtctgccacc 1020 atcctctatg agatcctgct agggaaagcc accctgtatg ctgtgcttgt cagtacactg 1080 gtggtgatgg ctatggtcaa aagaaagaat tca 1113 <210> 12 <211> 562 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 12 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly 100 105 110 Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys 115 120 125 Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser 130 135 140 Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser 145 150 155 160 Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile 165 170 175 Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu 180 185 190 Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn 195 200 205 Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr 210 215 220 Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser 225 230 235 240 Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly 245 250 255 Gly Ser Gly Gly Gly Gly Ser Leu Glu Leu Gly Ala Gly Pro Val Asp 260 265 270 Ser Gly Val Thr Gln Thr Pro Lys His Leu Ile Thr Ala Thr Gly Gln 275 280 285 Arg Val Thr Leu Arg Cys Ser Pro Arg Ser Gly Asp Leu Ser Val Ser 290 295 300 Trp Tyr Gln Gln Ser Leu Asp Gln Gly Leu Gln Phe Leu Ile Gln Tyr 305 310 315 320 Tyr Asn Gly Glu Glu Arg Ala Lys Gly Asn Ile Leu Glu Arg Phe Ser 325 330 335 Ala Gln Gln Phe Pro Asp Leu His Ser Glu Leu Asn Leu Ser Ser Leu 340 345 350 Glu Leu Gly Asp Ser Ala Leu Tyr Phe Cys Ala Ser Ser Pro Arg Thr 355 360 365 Gly Leu Asn Thr Glu Ala Phe Phe Gly Gln Gly Thr Arg Leu Thr Val 370 375 380 Val Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu 385 390 395 400 Pro Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys 405 410 415 Leu Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val 420 425 430 Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu 435 440 445 Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg 450 455 460 Leu Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg 465 470 475 480 Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln 485 490 495 Asp Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly 500 505 510 Arg Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu 515 520 525 Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr 530 535 540 Ala Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys 545 550 555 560 Asp Phe <210> 13 <211> 1686 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 13 gacatccaga tgacacagac tacatcctcc ctgtctgcct ctctgggaga cagagtcacc 60 atcagttgca gggcaagtca ggacattagt aaatatttaa attggtatca gcagaaacca 120 gatggaactg ttaaactcct gatctaccat acatcaagat tacactcagg agtcccatca 180 aggttcagtg gcagtgggtc tggaacagat tattctctca ccattagcaa cctggagcaa 240 gaagatattg ccacttactt ttgccaacag ggtaatacgc ttccgtacac gttcggaggg 300 gggactaagt tggaaataac aggctccacc tctggatccg gcaagcccgg atctggcgag 360 ggatccacca agggcgaggt gaaactgcag gagtcaggac ctggcctggt ggcgccctca 420 cagagcctgt ccgtcacatg cactgtctca ggggtctcat tacccgacta tggtgtaagc 480 tggattcgcc agcctccacg aaagggtctg gagtggctgg gagtaatatg gggtagtgaa 540 accacatact ataattcagc tctcaaatcc agactgacca tcatcaagga caactccaag 600 agccaagttt tcttaaaaat gaacagtctg caaactgatg acacagccat ttactactgt 660 gccaaacatt attactacgg tggtagctat gctatggact actggggtca aggaacctca 720 gtcaccgtct cctcagcggc cgcaggtgga ggaggttctg gaggtggagg ttcaggtgga 780 ggtggttcac tcgagctggg agcaggccca gtggattctg gagtcacaca aaccccaaag 840 cacctgatca cagcaactgg acagcgagtg acgctgagat gctcccctag gtctggagac 900 ctctctgtgt catggtacca acagagcctg gaccagggcc tccagttcct cattcagtat 960 tataatggag aagagagagc aaaaggaaac attcttgaac gattctccgc acaacagttc 1020 cctgacttgc actctgaact aaacctgagc tctctggagc tgggggactc agctttgtat 1080 ttctgtgcca gcagcccccg gacaggcctg aacactgaag ctttctttgg acaaggcacc 1140 agactcacag ttgtagagga cctgaacaag gtgttcccac ccgaggtcgc tgtgtttgag 1200 ccatcagaag cagagatctc ccacacccaa aaggccacac tggtgtgcct ggccacaggc 1260 ttcttccccg accacgtgga gctgagctgg tgggtgaatg ggaaggaggt gcacagtggg 1320 gtcagcacgg acccgcagcc cctcaaggag cagcccgccc tcaatgactc cagatactgc 1380 ctgagcagcc gcctgagggt ctcggccacc ttctggcaga acccccgcaa ccacttccgc 1440 tgtcaagtcc agttctacgg gctctcggag aatgacgagt ggacccagga tagggccaaa 1500 cccgtcaccc agatcgtcag cgccgaggcc tggggtagag cagactgtgg ctttacctcg 1560 gtgtcctacc agcaaggggt cctgtctgcc accatcctct atgagatcct gctagggaag 1620 gccaccctgt atgctgtgct ggtcagcgcc cttgtgttga tggccatggt caagagaaag 1680 gatttc 1686 <210> 14 <211> 424 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly 100 105 110 Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys 115 120 125 Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser 130 135 140 Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser 145 150 155 160 Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile 165 170 175 Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu 180 185 190 Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn 195 200 205 Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr 210 215 220 Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser 225 230 235 240 Val Thr Val Ser Ser Gly Val Glu Asp Leu Asn Lys Val Phe Pro Pro 245 250 255 Glu Val Ala Val Phe Glu Pro Ser Glu Ala Glu Ile Ser His Thr Gln 260 265 270 Lys Ala Thr Leu Val Cys Leu Ala Thr Gly Phe Phe Pro Asp His Val 275 280 285 Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser 290 295 300 Thr Asp Pro Gln Pro Leu Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg 305 310 315 320 Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp Gln Asn 325 330 335 Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu 340 345 350 Asn Asp Glu Trp Thr Gln Asp Arg Ala Lys Pro Val Thr Gln Ile Val 355 360 365 Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Val Ser 370 375 380 Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu 385 390 395 400 Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met 405 410 415 Ala Met Val Lys Arg Lys Asp Phe 420 <210> 15 <211> 1272 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 gacatccaga tgacacagac tacatcctcc ctgtctgcct ctctgggaga cagagtcacc 60 atcagttgca gggcaagtca ggacattagt aaatatttaa attggtatca gcagaaacca 120 gatggaactg ttaaactcct gatctaccat acatcaagat tacactcagg agtcccatca 180 aggttcagtg gcagtgggtc tggaacagat tattctctca ccattagcaa cctggagcaa 240 gaagatattg ccacttactt ttgccaacag ggtaatacgc ttccgtacac gttcggaggg 300 gggactaagt tggaaataac aggctccacc tctggatccg gcaagcccgg atctggcgag 360 ggatccacca agggcgaggt gaaactgcag gagtcaggac ctggcctggt ggcgccctca 420 cagagcctgt ccgtcacatg cactgtctca ggggtctcat tacccgacta tggtgtaagc 480 tggattcgcc agcctccacg aaagggtctg gagtggctgg gagtaatatg gggtagtgaa 540 accacatact ataattcagc tctcaaatcc agactgacca tcatcaagga caactccaag 600 agccaagttt tcttaaaaat gaacagtctg caaactgatg acacagccat ttactactgt 660 gccaaacatt attactacgg tggtagctat gctatggact actggggtca aggaacctca 720 gtcaccgtct cctcaggagt agaggacctg aacaaggtgt tcccacccga ggtcgctgtg 780 tttgagccat cagaagcaga gatctcccac acccaaaagg ccactctagt atgtctagct 840 acaggcttct tccctgacca cgtggagctg agctggtggg tgaatgggaa ggaggtgcac 900 agtggggtca gcacggaccc gcagccactt aaagaacagc cagctctcaa tgactccaga 960 tactgtctaa gcagtcgact tagagtctcg gctacatttt ggcaaaatcc tcgaaaccac 1020 ttccgctgtc aagtccagtt ctacgggctc tcggagaatg acgagtggac ccaggatagg 1080 gccaaacccg tcacccagat cgtcagcgcc gaggcctggg gtagagcaga ctgtggcttt 1140 acctcggtgt cctaccagca aggggtcctg tctgccacca tcctctatga gatcctgcta 1200 gggaaggcca ccctgtatgc tgtgctggtc agcgcccttg tgttgatggc catggtcaag 1260 agaaaggatt tc 1272 <210> 16 <211> 178 <212> PRT <213> Homo sapiens <400> 16 Val Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu 1 5 10 15 Pro Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys 20 25 30 Leu Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val 35 40 45 Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu 50 55 60 Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg 65 70 75 80 Leu Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg 85 90 95 Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln 100 105 110 Asp Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly 115 120 125 Arg Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu 130 135 140 Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr 145 150 155 160 Ala Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys 165 170 175 Asp Phe <210> 17 <211> 56 <212> PRT <213> Mus musculus <400> 17 Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu 1 5 10 15 Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val 20 25 30 Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu 35 40 45 Met Thr Leu Arg Leu Trp Ser Ser 50 55 <210> 18 <211> 51 <212> PRT <213> Mus musculus <400> 18 Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val 1 5 10 15 Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu 20 25 30 Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg 35 40 45 Lys Asn Ser 50 <210> 19 <211> 293 <212> PRT <213> Homo sapiens <400> 19 Pro Val Asp Ser Gly Val Thr Gln Thr Pro Lys His Leu Ile Thr Ala 1 5 10 15 Thr Gly Gln Arg Val Thr Leu Arg Cys Ser Pro Arg Ser Gly Asp Leu 20 25 30 Ser Val Ser Trp Tyr Gln Gln Ser Leu Asp Gln Gly Leu Gln Phe Leu 35 40 45 Ile Gln Tyr Tyr Asn Gly Glu Glu Arg Ala Lys Gly Asn Ile Leu Glu 50 55 60 Arg Phe Ser Ala Gln Gln Phe Pro Asp Leu His Ser Glu Leu Asn Leu 65 70 75 80 Ser Ser Leu Glu Leu Gly Asp Ser Ala Leu Tyr Phe Cys Ala Ser Ser 85 90 95 Pro Arg Thr Gly Leu Asn Thr Glu Ala Phe Phe Gly Gln Gly Thr Arg 100 105 110 Leu Thr Val Val Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala 115 120 125 Val Phe Glu Pro Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr 130 135 140 Leu Val Cys Leu Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser 145 150 155 160 Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro 165 170 175 Gln Pro Leu Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu 180 185 190 Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn 195 200 205 His Phe Arg Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu 210 215 220 Trp Thr Gln Asp Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu 225 230 235 240 Ala Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln 245 250 255 Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala 260 265 270 Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val 275 280 285 Lys Arg Lys Asp Phe 290 <210> 20 <211> 152 <212> PRT <213> Homo sapiens <400> 20 Ser Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr 1 5 10 15 Asn Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile 20 25 30 Asn Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val 35 40 45 Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu 50 55 60 Asp Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val 65 70 75 80 His Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys 85 90 95 Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys 100 105 110 Pro Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr 115 120 125 Val Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe 130 135 140 Leu Leu Thr Ala Lys Leu Phe Phe 145 150 <210> 21 <211> 173 <212> PRT <213> Homo sapiens <400> 21 Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu 1 5 10 15 Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys 20 25 30 Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu 35 40 45 Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys 50 55 60 Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys 65 70 75 80 Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys 85 90 95 Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val 100 105 110 Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr 115 120 125 Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu 130 135 140 Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu 145 150 155 160 Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 165 170 <210> 22 <211> 149 <212> PRT <213> Homo sapiens <400> 22 Ser Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr 1 5 10 15 Asn Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile 20 25 30 Asn Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val 35 40 45 Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu 50 55 60 Asp Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val 65 70 75 80 His Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys 85 90 95 Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys 100 105 110 Pro Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr 115 120 125 Val Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe 130 135 140 Leu Leu Thr Ala Lys 145 <210> 23 <211> 18 <212> PRT <213> Thosea asigna virus <400> 23 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 24 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Asp Val Val Met Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly 1 5 10 15 Asp Gln Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser Leu Val His Ser 20 25 30 Asn Gly Asn Thr Tyr Leu His Trp Tyr Leu Gln Lys Pro Gly Gln Ser 35 40 45 Pro Lys Leu Leu Ile Tyr Lys Val Ser Asn Arg Phe Ser Gly Val Pro 50 55 60 Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile 65 70 75 80 Thr Arg Val Glu Ala Glu Asp Leu Gly Val Phe Phe Cys Ser Gln Ser 85 90 95 Thr His Val Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys 100 105 110 <210> 25 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 25 gatgttgtga tgacccaaac tccactctcc ctgcctgtca gtcttggaga tcaagcctcc 60 atctcttgca gatctagtca gagccttgta cacagtaatg gaaacaccta tttacattgg 120 tacctgcaga agccaggcca gtctccaaag ctcctgatct acaaagtttc caaccgattt 180 tctggggtcc cagacaggtt cagtggcagt ggatcaggga ctgatttcac actcaagatc 240 accagagtgg aggctgagga tctgggagtt tttttctgct ctcaaagtac acatgttcca 300 ttcacgttcg gctcggggac aaagttggaa ataaaa 336 <210> 26 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ala 1 5 10 15 Ser Val Thr Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Phe Asp Tyr 20 25 30 Glu Met His Trp Val Lys Gln Thr Pro Val His Gly Leu Glu Trp Ile 35 40 45 Gly Ala Ile Asp Pro Glu Ile Asp Gly Thr Ala Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Lys Ala Ile Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys 85 90 95 Thr Asp Tyr Tyr Gly Ser Ser Tyr Trp Tyr Phe Asp Val Trp Gly Thr 100 105 110 Gly Thr Thr Val Thr Val Ser Ser 115 120 <210> 27 <211> 359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 caggttcaac tgcagcagtc tggggctgag ctggtgaggc ctggggcttc agtgacgctg 60 tcctgcaagg cttcgggcta cacatttttt gactatgaaa tgcactgggt gaagcagaca 120 cctgtgcatg gcctggaatg gattggagct attgatcctg aaattgatgg tactgcctac 180 aatcagaagt tcaagggcaa ggccatactg actgcagaca aatcctccag cacagcctac 240 atggagctcc gcagcctgac atctgaggac tctgccgtct attactgtac agattactac 300 ggtagtagct actggtactt cgatgtctgg ggcacaggga ccacggtcac cgtctcctc 359 <210> 28 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Asp Val Met Met Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly 1 5 10 15 Asp Gln Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser Leu Val His Ser 20 25 30 Asn Gly Asn Thr Tyr Leu His Trp Phe Leu Gln Lys Pro Gly Gln Ser 35 40 45 Pro Lys Leu Leu Ile Tyr Lys Val Ser Asn Arg Phe Ser Gly Val Pro 50 55 60 Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile 65 70 75 80 Ser Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Phe Cys Ser Gln Thr 85 90 95 Thr His Val Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys 100 105 110 <210> 29 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 gatgttatga tgacccaaac tccactctcc ctgcctgtca gtcttggaga tcaagcctcc 60 atctcttgca gatctagtca gagccttgta cacagtaatg gaaacaccta tttacattgg 120 ttcctgcaga agccaggcca gtctccaaag ctcctgatct acaaagtttc caaccgattt 180 tctggggtcc cagacaggtt cagtggcagt ggatcaggga cagatttcac actcaagatc 240 agcagagtgg aggctgagga tctgggagtt tatttctgct ctcaaactac acatgttccg 300 ctcacgttcg gtgctgggac caagctggag ctgaaa 336 <210> 30 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 30 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ala 1 5 10 15 Ser Val Thr Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Asp Tyr 20 25 30 Glu Met His Trp Val Lys Gln Thr Pro Val His Gly Leu Glu Trp Ile 35 40 45 Gly Ala Ile Asp Pro Glu Ile Ala Gly Thr Ala Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Lys Ala Ile Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys 85 90 95 Ser Arg Tyr Gly Gly Asn Tyr Leu Tyr Tyr Phe Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Thr Leu Thr Val Ser Ser 115 120 <210> 31 <211> 360 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 caggttcaac tgcagcagtc tggggctgag ctggtgaggc ctggggcttc agtgacgctg 60 tcctgcaagg cttcgggcta cacttttact gactatgaaa tgcactgggt gaagcagaca 120 cctgtccatg gcctggaatg gattggagct attgatcctg aaattgctgg tactgcctac 180 aatcagaagt tcaagggcaa ggccatactg actgcagaca aatcctccag cacagcctac 240 atggagctcc gcagcctgac atctgaggac tctgccgtct attactgttc aagatacggt 300 ggtaactacc tttactactt tgactactgg ggccaaggca ccactctcac agtctcctca 360 <210> 32 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Asp Val Leu Met Thr Gln Ile Pro Leu Ser Leu Pro Val Ser Leu Gly 1 5 10 15 Asp Gln Ala Ser Ile Ser Cys Arg Ser Ser Gln Asn Ile Val Tyr Ser 20 25 30 Asn Gly Asn Thr Tyr Leu Glu Trp Tyr Leu Gln Lys Pro Gly Gln Ser 35 40 45 Pro Lys Leu Leu Ile Tyr Lys Val Ser Asn Arg Phe Ser Gly Val Pro 50 55 60 Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile 65 70 75 80 Ser Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Tyr Cys Phe Gln Gly 85 90 95 Ser His Val Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys 100 105 110 <210> 33 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 gatgttttga tgacccaaat tccactctcc ctgcctgtca gtcttggaga tcaagcctcc 60 atctcttgca gatctagtca gaacattgtg tatagtaatg gaaacaccta tttagagtgg 120 tacctgcaga aaccaggcca gtctccaaag ctcctgatct acaaagtttc caaccgattt 180 tctggggtcc cagacaggtt cagtggcagt ggatcaggga cagatttcac actcaagatc 240 agcagagtgg aggctgagga tctgggagtt tattactgct ttcaaggttc acatgttcca 300 ttcacgttcg gctcggggac aaagttggaa ataaaa 336 <210> 34 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ala 1 5 10 15 Ser Val Thr Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Asp Tyr 20 25 30 Glu Met His Trp Val Lys Gln Thr Pro Val His Gly Leu Glu Trp Ile 35 40 45 Gly Ala Ile Asp Pro Glu Ile Gly Gly Ser Ala Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Arg Ala Ile Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys 85 90 95 Thr Gly Tyr Asp Gly Tyr Phe Trp Phe Ala Tyr Trp Gly Gln Gly Thr 100 105 110 Leu Val Thr Val Ser Ser 115 <210> 35 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 caggttcaac tgcagcagtc cggggctgag ctggtgaggc ctggggcttc agtgacgctg 60 tcctgcaagg cttcgggcta cacatttact gactatgaaa tgcactgggt gaagcagaca 120 cctgtgcatg gcctggaatg gattggagct attgatcctg aaattggtgg ttctgcctac 180 aatcagaagt tcaagggcag ggccatattg actgcagaca aatcctccag cacagcctac 240 atggagctcc gcagcctgac atctgaggac tctgccgtct attattgtac gggctatgat 300 ggttactttt ggtttgctta ctggggccaa gggactctgg tcactgtctc ttca 354 <210> 36 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Glu Asn Val Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met 20 25 30 His Trp Tyr Gln Gln Lys Ser Ser Thr Ser Pro Lys Leu Trp Ile Tyr 35 40 45 Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Met Glu Ala Glu 65 70 75 80 Asp Val Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly Tyr Pro Leu Thr 85 90 95 Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys 100 105 <210> 37 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 37 gaaaatgttc tcacccagtc tccagcaatc atgtccgcat ctccagggga aaaggtcacc 60 atgacctgca gtgctagctc aagtgtaagt tacatgcact ggtaccagca gaagtcaagc 120 acctccccca aactctggat ttatgacaca tccaaactgg cttctggagt cccaggtcgc 180 ttcagtggca gtgggtctgg aaactcttac tctctcacga tcagcagcat ggaggctgaa 240 gatgttgcca cttattactg ttttcagggg agtgggtacc cactcacgtt cggctcgggg 300 acaaagttgg aaataaaa 318 <210> 38 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ala 1 5 10 15 Ser Val Thr Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Asp Tyr 20 25 30 Glu Met His Trp Val Lys Gln Thr Pro Val His Gly Leu Glu Trp Ile 35 40 45 Gly Gly Ile Asp Pro Glu Thr Gly Gly Thr Ala Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Lys Ala Ile Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys 85 90 95 Thr Ser Tyr Tyr Gly Ser Arg Val Phe Trp Gly Thr Gly Thr Thr Val 100 105 110 Thr Val Ser Ser 115 <210> 39 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 caggttcaac tgcagcagtc tggggctgag ctggtgaggc ctggggcttc agtgacgctg 60 tcctgcaagg cttcgggcta cacatttact gactatgaaa tgcactgggt gaaacagaca 120 cctgtgcatg gcctggaatg gattggaggt attgatcctg aaactggtgg tactgcctac 180 aatcagaagt tcaagggtaa ggccatactg actgcagaca aatcctccag cacagcctac 240 atggagctcc gcagcctgac atctgaggac tctgccgtct attactgtac aagttactat 300 ggtagtagag tcttctgggg cacagggacc acggtcaccg tctcctca 348 <210> 40 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Gln Ile Val Leu Ser Gln Ser Pro Ala Ile Leu Ser Ala Phe Pro Gly 1 5 10 15 Glu Lys Val Thr Met Thr Cys Arg Ala Ser Ser Ser Val Ser Tyr Met 20 25 30 His Trp Tyr Gln Gln Lys Pro Gly Ser Ser Pro Lys Pro Trp Ile Tyr 35 40 45 Ala Thr Ser Asn Leu Ala Ser Gly Val Pro Ala Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Ser Val Glu Ala Glu 65 70 75 80 Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser Asn Pro Pro Thr 85 90 95 Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys 100 105 <210> 41 <211> 324 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 41 caaattgttc tctcccagtc tccagcaatc ctgtctgcat ttccagggga gaaggtcact 60 atgacttgca gggccagctc aagtgtaagt tacatgcact ggtaccagca gaagccagga 120 tcctccccca aaccctggat ttatgccaca tccaacctgg cttctggagt ccctgctcgc 180 ttcagtggca gtgggtctgg gacctcttac tctctcacaa tcagcagtgt ggaggctgaa 240 gatgctgcca cttattactg ccagcagtgg agtagtaacc cacccacgct cacgttcggt 300 gctgggacca agctggagct gaaa 324 <210> 42 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala Arg Pro Gly Ala 1 5 10 15 Ser Val Lys Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr 20 25 30 Gly Ile Ser Trp Val Lys Gln Arg Thr Gly Gln Gly Leu Glu Trp Ile 35 40 45 Gly Glu Ile Tyr Pro Arg Ser Gly Asn Thr Tyr Tyr Asn Glu Ser Phe 50 55 60 Lys Gly Lys Val Thr Leu Thr Ala Asp Lys Ser Ser Gly Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys 85 90 95 Ala Arg Trp Gly Ser Tyr Gly Ser Pro Pro Phe Tyr Tyr Gly Met Asp 100 105 110 Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser 115 120 <210> 43 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 caggttcagc tgcagcagtc tggagctgag ctggcgaggc ctggggcttc agtgaagctg 60 tcctgcaagg cttctggcta caccttcaca agctatggta taagctgggt gaagcagagg 120 actggacagg gccttgagtg gattggagag atttatccta gaagtggtaa tacttactac 180 aatgagagct tcaagggcaa ggtcacactg accgcagaca aatcttccgg cacagcgtac 240 atggagctcc gcagcctgac atctgaggac tctgcggtct atttctgtgc aagatggggc 300 tcctacggta gtcccccctt ttactatggt atggactact ggggtcaagg aacctcagtc 360 accgtctcct ca 372 <210> 44 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Asp Val Leu Met Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly 1 5 10 15 Asn Gln Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser Ile Val His Ser 20 25 30 Ser Gly Ser Thr Tyr Leu Glu Trp Tyr Leu Gln Lys Pro Gly Gln Ser 35 40 45 Pro Lys Leu Leu Ile Tyr Lys Val Ser Asn Arg Phe Ser Gly Val Pro 50 55 60 Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile 65 70 75 80 Ser Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Tyr Cys Phe Gln Gly 85 90 95 Ser His Val Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys 100 105 110 <210> 45 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 gatgttttga tgacccaaac tccactctcc ctgcctgtca gtcttggaaa tcaagcctcc 60 atctcttgca gatctagtca gagcattgta catagtagtg gaagcaccta tttagaatgg 120 tacctgcaga aaccaggcca gtctccaaag ctcctgatct acaaagtttc caaccgattt 180 tctggggtcc cagacaggtt cagtggcagt ggatcaggga cagatttcac actcaagatc 240 agcagagtgg aggctgagga tctgggagtt tattactgct ttcaaggctc acatgttcca 300 tacacgttcg gaggggggac caagctggaa ataaaa 336 <210> 46 <211> 123 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala Arg Pro Gly Thr 1 5 10 15 Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr 20 25 30 Gly Ile Ser Trp Val Lys Gln Arg Ile Gly Gln Gly Leu Glu Trp Ile 35 40 45 Gly Glu Ile His Pro Arg Ser Gly Asn Ser Tyr Tyr Asn Glu Lys Ile 50 55 60 Arg Gly Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Ile Ser Glu Asp Ser Ala Val Tyr Phe Cys 85 90 95 Ala Arg Leu Ile Thr Thr Val Val Ala Asn Tyr Tyr Ala Met Asp Tyr 100 105 110 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser 115 120 <210> 47 <211> 369 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 caggttcagc tgcagcagtc tggagctgag ctggcgaggc ctgggacttc agtgaaggtg 60 tcctgcaagg cttctggcta taccttcaca agttatggta taagctgggt gaagcagaga 120 attggacagg gccttgagtg gattggagag attcatccta gaagtggtaa tagttactat 180 aatgagaaga tcaggggcaa ggccacactg actgcagaca aatcctccag cacagcgtac 240 atggagctcc gcagcctgat atctgaggac tctgcggtct atttctgtgc aaggctgatt 300 actacggtag ttgctaatta ctatgctatg gactactggg gtcaaggaac ctcagtcacc 360 gtctcctca 369 <210> 48 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Asp Ile Val Met Ser Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly 1 5 10 15 Glu Lys Val Thr Met Ser Cys Lys Ser Ser Gln Ser Leu Leu Asn Ser 20 25 30 Arg Thr Arg Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln 35 40 45 Ser Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val 50 55 60 Pro Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr 65 70 75 80 Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Val Tyr Tyr Cys Lys Gln 85 90 95 Ser Tyr Asn Leu Val Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys 100 105 110 <210> 49 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 49 gacattgtga tgtcacagtc tccatcctcc ctggctgtgt cagcaggaga gaaggtcact 60 atgagctgca aatccagtca gagtctgctc aacagtagaa cccgaaagaa ctacttggct 120 tggtaccagc agaaaccagg gcagtctcct aaactgctga tctactgggc atccactagg 180 gaatctgggg tccctgatcg cttcacaggc agtggatctg ggacagattt cactctcacc 240 atcagcagtg tgcaggctga agacctggca gtttattact gcaaacaatc ttataatctg 300 gtcacgttcg gtgctgggac caagctggag ctgaaa 336 <210> 50 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 50 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg Pro Gly Ala 1 5 10 15 Ser Val Thr Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Phe Asp Tyr 20 25 30 Glu Met His Trp Val Lys Gln Thr Pro Val His Gly Leu Glu Trp Ile 35 40 45 Gly Ala Ile Asp Pro Glu Ile Asp Gly Thr Ala Tyr Asn Gln Lys Phe 50 55 60 Lys Gly Lys Ala Ile Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys 85 90 95 Thr Asp Tyr Tyr Gly Ser Ser Tyr Trp Tyr Phe Asp Val Trp Gly Thr 100 105 110 Gly Thr Thr Val Thr Val Ser Ser 115 120 <210> 51 <211> 359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 caggttcaac tgcagcagtc tggggctgag ctggtgaggc ctggggcttc agtgacgctg 60 tcctgcaagg cttcgggcta cacatttttt gactatgaaa tgcactgggt gaagcagaca 120 cctgtgcatg gcctggaatg gattggagct attgatcctg aaattgatgg tactgcctac 180 aatcagaagt tcaagggcaa ggccatactg actgcagaca aatcctccag cacagcctac 240 atggagctcc gcagcctgac atctgaggac tctgccgtct attactgtac agattactac 300 ggtagtagct actggtactt cgatgtctgg ggcacaggga ccacggtcac cgtctcctc 359 <210> 52 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 52 Gln Ile Val Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Lys Val Thr Ile Ser Cys Ser Ala Ser Ser Ser Val Ser Tyr Met 20 25 30 Tyr Trp Tyr Gln Gln Lys Pro Gly Ser Ser Pro Lys Pro Trp Ile Tyr 35 40 45 Arg Thr Ser Asn Leu Ala Ser Gly Val Pro Ala Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Ser Met Glu Ala Glu 65 70 75 80 Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Tyr His Ser Tyr Pro Leu Thr 85 90 95 Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys 100 105 <210> 53 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 caaattgttc tcacccagtc tccagcaatc atgtctgcat ctccagggga gaaggtcacc 60 atatcctgca gtgccagctc aagtgtaagt tacatgtact ggtaccagca gaagccagga 120 tcctccccca aaccctggat ttatcgcaca tccaacctgg cttctggagt ccctgctcgc 180 ttcagtggca gtgggtctgg gacctcttac tctctcacaa tcagcagcat ggaggctgaa 240 gatgctgcca cttattactg ccagcagtat catagttacc cactcacgtt cggtgctggg 300 accaagctgg agctgaaa 318 <210> 54 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 54 Gln Ile Val Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Arg Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val Ser Ser Ser 20 25 30 Tyr Leu Tyr Trp Tyr Gln Gln Lys Ser Gly Ser Ser Pro Lys Leu Trp 35 40 45 Ile Tyr Ser Ile Ser Asn Leu Ala Ser Gly Val Pro Ala Arg Phe Ser 50 55 60 Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Asn Ser Met Glu 65 70 75 80 Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser Asn Pro 85 90 95 Gln Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys 100 105 <210> 55 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 55 caaattgttc tcacccagtc tccagcaatc atgtctgcat ctcctgggga acgggtcacc 60 atgacctgca gtgccagctc aagtgtaagt tccagctact tgtactggta ccagcagaag 120 tcaggatcct ccccaaaact ctggatttat agcatatcca acctggcttc tggagtccca 180 gctcgcttca gtggcagtgg gtctgggacc tcttactctc tcacaatcaa cagcatggag 240 gctgaagatg ctgccactta ttactgccag cagtggagta gtaacccaca gctcacgttc 300 ggtgctggga ccaagctgga gctgaaa 327 <210> 56 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 56 Gln Val Gln Leu Lys Gln Ser Gly Ala Glu Leu Val Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Asp Tyr 20 25 30 Tyr Ile Asn Trp Val Lys Gln Arg Pro Gly Gln Gly Leu Glu Trp Ile 35 40 45 Gly Lys Ile Gly Pro Gly Ser Gly Ser Thr Tyr Tyr Asn Glu Lys Phe 50 55 60 Lys Gly Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys 85 90 95 Ala Arg Thr Gly Tyr Tyr Val Gly Tyr Tyr Ala Met Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Ser Val Thr Val Ser Ser 115 120 <210> 57 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 caggtccagc tgaagcagtc tggagctgag ctggtgaagc ctggggcttc agtgaagata 60 tcctgcaagg cttctggcta caccttcact gactactata taaactgggt gaagcagagg 120 cctggacagg gccttgagtg gattggaaag attggtcctg gaagtggtag tacttactac 180 aatgagaagt tcaagggcaa ggccacactg actgcagaca aatcctccag cacagcctac 240 atgcagctca gcagcctgac atctgaggac tctgcagtct atttctgtgc aagaactggt 300 tactacgttg gttactatgc tatggactac tggggtcaag gaacctcagt caccgtctcc 360 tca 363 <210> 58 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala Arg Pro Gly Ala 1 5 10 15 Ser Val Lys Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ile Tyr 20 25 30 Gly Ile Ser Trp Val Lys Gln Arg Thr Gly Gln Gly Leu Glu Trp Ile 35 40 45 Gly Glu Ile Tyr Pro Arg Ser Asp Asn Thr Tyr Tyr Asn Glu Lys Phe 50 55 60 Lys Gly Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys 85 90 95 Ala Arg Trp Tyr Ser Phe Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr 100 105 110 Ser Val Thr Val Ser Ser 115 <210> 59 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 59 caggttcagc tgcagcagtc tggagctgag ctggcgaggc ctggggcttc agtgaagctg 60 tcctgcaagg cttctggcta caccttcaca atctatggta taagctgggt gaaacagaga 120 actggacagg gccttgagtg gattggagag atttatccta gaagtgataa tacttactac 180 aatgagaagt tcaagggcaa ggccacactg actgcagaca aatcctccag cacagcgtac 240 atggagctcc gcagcctgac atctgaggac tctgcggtct atttctgtgc aagatggtac 300 tcgttctatg ctatggacta ctggggtcaa ggaacctcag tcaccgtctc ctca 354 <210> 60 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Gly Gly Asp Trp Ser Ala Asn Phe Met Tyr 1 5 10 <210> 61 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 61 Arg Ile Ser Gly Arg Gly Val Val Asp Tyr Val Glu Ser Val Lys Gly 1 5 10 15 Arg Phe Thr <210> 62 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 62 Ala Ser Tyr 1 <210> 63 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 63 Gly Ser Thr Ser Ser Ile Asn Thr Met Tyr 1 5 10 <210> 64 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 64 Phe Ile Ser Ser Gly Gly Ser Thr Asn Val Arg Asp Ser Val Lys Gly 1 5 10 15 Arg Phe Thr <210> 65 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 65 Tyr Ile Pro Tyr Gly Gly Thr Leu His Asp Phe 1 5 10 <210> 66 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 66 Gly Ser Thr Phe Ser Ile Arg Ala Met Arg 1 5 10 <210> 67 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 67 Val Ile Tyr Gly Ser Ser Thr Tyr Tyr Ala Asp Ala Val Lys Gly Arg 1 5 10 15 Phe Thr <210> 68 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 68 Asp Thr Ile Gly Thr Ala Arg Asp Tyr 1 5 <210> 69 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 69 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Gly Asp Trp Ser Ala Asn 20 25 30 Phe Met Tyr Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Arg Ile Ser Gly Arg Gly Val Val Asp Tyr Val Glu Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala 85 90 95 Val Ala Ser Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser 100 105 110 <210> 70 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 70 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Ser Thr Ser Ser Ile Asn 20 25 30 Thr Met Tyr Trp Tyr Arg Gln Ala Pro Gly Lys Glu Arg Glu Leu Val 35 40 45 Ala Phe Ile Ser Ser Gly Gly Ser Thr Asn Val Arg Asp Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Asn 85 90 95 Thr Tyr Ile Pro Tyr Gly Gly Thr Leu His Asp Phe Trp Gly Gln Gly 100 105 110 Thr Leu Val Thr Val Ser Ser 115 <210> 71 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 71 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Ser Thr Phe Ser Ile Arg 20 25 30 Ala Met Arg Trp Tyr Arg Gln Ala Pro Gly Thr Glu Arg Asp Leu Val 35 40 45 Ala Val Ile Tyr Gly Ser Ser Thr Tyr Tyr Ala Asp Ala Val Lys Gly 50 55 60 Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln 65 70 75 80 Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Asn Ala 85 90 95 Asp Thr Ile Gly Thr Ala Arg Asp Tyr Trp Gly Gln Gly Thr Leu Val 100 105 110 Thr Val Ser Ser 115 <210> 72 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 agggcaagtc aggacattag taaa 24 <210> 73 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 73 Arg Ala Ser Gln Asp Ile Ser Lys 1 5 <210> 74 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 74 atctaccata catcaagatt a 21 <210> 75 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 75 Ile Tyr His Thr Ser Arg Leu 1 5 <210> 76 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 76 caacagggta atacgcttcc gtacacg 27 <210> 77 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 77 Gln Gln Gly Asn Thr Leu Pro Tyr Thr 1 5 <210> 78 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 78 ggggtctcat tacccgacta tggtgtaagc 30 <210> 79 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 79 Gly Val Ser Leu Pro Asp Tyr Gly Val Ser 1 5 10 <210> 80 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 80 gtaatatggg gtagtgaaac cacatactat aattcagctc tc 42 <210> 81 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 81 Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu 1 5 10 <210> 82 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 82 cattattact acggtggtag ctatgctatg gactac 36 <210> 83 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 83 His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 1 5 10 <210> 84 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 84 gacatccaga tgacacagac tacatcctcc ctgtctgcct ctctgggaga cagagtcacc 60 atcagttgca gggcaagtca ggacattagt aaatatttaa attggtatca gcagaaacca 120 gatggaactg ttaaactcct gatctaccat acatcaagat tacactcagg agtcccatca 180 aggttcagtg gcagtgggtc tggaacagat tattctctca ccattagcaa cctggagcaa 240 gaagatattg ccacttactt ttgccaacag ggtaatacgc ttccgtacac gttcggaggg 300 gggactaagt tggaaataac a 321 <210> 85 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 85 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr 100 105 <210> 86 <211> 360 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 86 gaggtgaaac tgcaggagtc aggacctggc ctggtggcgc cctcacagag cctgtccgtc 60 acatgcactg tctcaggggt ctcattaccc gactatggtg taagctggat tcgccagcct 120 ccacgaaagg gtctggagtg gctgggagta atatggggta gtgaaaccac atactataat 180 tcagctctca aatccagact gaccatcatc aaggacaact ccaagagcca agttttctta 240 aaaatgaaca gtctgcaaac tgatgacaca gccatttact actgtgccaa acattattac 300 tacggtggta gctatgctat ggactactgg ggtcaaggaa cctcagtcac cgtctcctca 360 <210> 87 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 87 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 1 5 10 15 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 20 25 30 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 35 40 45 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 50 55 60 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 65 70 75 80 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 85 90 95 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Ser Val Thr Val Ser Ser 115 120 <210> 88 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 88 Ser Ile Phe Asp Ile Val Arg Gly Ser 1 5 <210> 89 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 89 Ala Ile Ile Thr Ser Gly Gly Ala Thr Asn Tyr Ala 1 5 10 <210> 90 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 90 Cys Asn Met Glu Ser Val Arg Tyr Arg Asn Tyr Trp 1 5 10 <210> 91 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 91 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Thr Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Ser Ile Phe Asp Ile Val 20 25 30 Arg Gly Ser Trp Tyr Arg Gln Ala Pro Gly Asn Gln Arg Glu Leu Val 35 40 45 Ala Ile Ile Thr Ser Gly Gly Ala Thr Asn Tyr Ala Asp Ser Val Ala 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Ser Ala Trp Lys Ala Leu Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Phe Cys Asn 85 90 95 Met Glu Ser Val Arg Tyr Arg Asn Tyr Trp Gly Gln Gly Thr Gln Val 100 105 110 Thr Val Ser Ser 115 <210> 92 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 92 Phe Thr Leu Glu His Tyr Ser Ile Gly 1 5 <210> 93 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 93 Ser Cys Ile Thr Ser Ser Gly Gly Ile Pro Lys Tyr Ala 1 5 10 <210> 94 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 94 Cys Gly Ala Ala Thr Pro Asp Asp Asp Cys Ser Val Pro Gly His Tyr 1 5 10 15 Gly Leu Asn Tyr Trp 20 <210> 95 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 95 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Leu Glu His Tyr 20 25 30 Ser Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys Asp Leu Glu Gly Val 35 40 45 Ser Cys Ile Thr Ser Ser Gly Gly Ile Pro Lys Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn Thr Gly Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Gly Ala Ala Thr Pro Asp Asp Asp Cys Ser Val Pro Gly His Tyr Gly 100 105 110 Leu Asn Tyr Trp Gly Lys Gly Thr Gln Val Thr Val Ser Ser 115 120 125 <210> 96 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 96 Phe Thr Phe Asp Ala Tyr Ala Ile Gly 1 5 <210> 97 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 97 Ile Cys Leu Ser Pro Ser Asp Gly Ser Thr Tyr Tyr Ala 1 5 10 <210> 98 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 98 Cys Ala Thr Pro Ser Trp Cys Ser Leu Lys Ala Asp Phe Gly Ser Trp 1 5 10 15 <210> 99 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 99 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Pro Gly Phe Thr Phe Asp Ala Tyr 20 25 30 Ala Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val 35 40 45 Ile Cys Leu Ser Pro Ser Asp Gly Ser Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ser Asp Asn Ala Lys Asn Thr Val Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Thr Pro Ser Trp Cys Ser Leu Lys Ala Asp Phe Gly Ser Trp Gly 100 105 110 Gln Gly Thr Gln Val Thr Val Ser Ser 115 120 <210> 100 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 100 Ser Ile Phe Ser Ala Thr Arg Met Glu 1 5 <210> 101 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 101 Ala Ile Val Thr Ser Gly Gly Arg Thr Asn Tyr Ala 1 5 10 <210> 102 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 102 Cys Lys Phe Glu Arg Tyr Asp Tyr Val Asn Tyr Trp 1 5 10 <210> 103 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 103 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Ser Ile Phe Ser Ala Thr 20 25 30 Arg Met Glu Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Ile Val Thr Ser Gly Gly Arg Thr Asn Tyr Ala Asp Ser Val Asn 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr Leu 65 70 75 80 Gln Met Asn Asn Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Lys 85 90 95 Phe Glu Arg Tyr Asp Tyr Val Asn Tyr Trp Gly Arg Gly Thr Gln Val 100 105 110 Thr Val Ser Ser 115 <210> 104 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 104 Ser Ile Phe Ser Ile Ala Arg Met Asn 1 5 <210> 105 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 105 Ala Ile Leu Asn Arg Ala Gly Arg Thr Asp Tyr Ala 1 5 10 <210> 106 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 106 Cys Asn Leu Gln Thr Ile Ser Tyr His Asp Phe Trp 1 5 10 <210> 107 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 107 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Val Ala Ser Gly Ser Ile Phe Ser Ile Ala 20 25 30 Arg Met Asn Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Ile Leu Asn Arg Ala Gly Arg Thr Asp Tyr Ala Asp Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Ser Asp Asn Ala Lys Thr Thr Val Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Leu Tyr Tyr Cys Asn 85 90 95 Leu Gln Thr Ile Ser Tyr His Asp Phe Trp Gly Gln Gly Thr Gln Val 100 105 110 Thr Val Ser Ser 115 <210> 108 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 108 Ser Ile Phe Asp Ile Ala Arg Gly Asn 1 5 <210> 109 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 109 Ala Ile Ile Thr Ser Gly Gly Ala Thr Asn Tyr Ala 1 5 10 <210> 110 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 110 Cys Asn Met Glu Ser Leu Ser Tyr Arg His Tyr Trp 1 5 10 <210> 111 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 111 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Thr Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Ser Ile Phe Asp Ile Ala 20 25 30 Arg Gly Asn Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Ile Ile Thr Ser Gly Gly Ala Thr Asn Tyr Ala Asp Ser Val Ala 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asp Ala Lys Asn Thr Val Tyr Leu 65 70 75 80 Gln Met Asn Gly Leu Lys Pro Glu Asp Thr Ala Val Tyr Phe Cys Asn 85 90 95 Met Glu Ser Leu Ser Tyr Arg His Tyr Trp Gly Gln Gly Thr Gln Val 100 105 110 Thr Val Ser Ser 115 <210> 112 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 112 Ser Ile Ile Arg Asp Asn Val Met Ala 1 5 <210> 113 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 113 Ala Ile Ile Asn Thr Gly Gly Ser Ala Asn Val Asp 1 5 10 <210> 114 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 114 Cys Asn Val Tyr Tyr Arg Asp Leu Trp 1 5 <210> 115 <211> 113 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 115 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Lys Ser Ile Ile Arg Asp Asn 20 25 30 Val Met Ala Trp His Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Ile Ile Asn Thr Gly Gly Ser Ala Asn Val Asp Asp Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Met Val Tyr Leu 65 70 75 80 Gln Met Asn Asn Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn 85 90 95 Val Tyr Tyr Arg Asp Leu Trp Gly Gln Gly Thr Gln Val Thr Val Ser 100 105 110 Ser <210> 116 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 116 Phe Thr Leu Asp Arg Tyr Ala Val Gly 1 5 <210> 117 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 117 Ser Cys Ile Ser Ser Ser Gly Asp Ile Ile Lys Tyr Ala 1 5 10 <210> 118 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 118 Cys Thr Ala Ala Asp Pro Lys Asp Asp Cys Ser Val Pro Gly Tyr Tyr 1 5 10 15 Gly Leu Asn Tyr Trp 20 <210> 119 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 119 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Val Ala Ser Gly Phe Thr Leu Asp Arg Tyr 20 25 30 Ala Val Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Leu Glu Gly Val 35 40 45 Ser Cys Ile Ser Ser Ser Gly Asp Ile Ile Lys Tyr Ala Asp Ser Ala 50 55 60 Lys Gly Arg Phe Thr Ile Ala Arg Asp Asn Ala Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Thr Ala Ala Asp Pro Lys Asp Asp Cys Ser Val Pro Gly Tyr Tyr Gly 100 105 110 Leu Asn Tyr Trp Gly Lys Gly Thr Gln Val Thr Val Ser Ser 115 120 125 <210> 120 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 120 Phe Thr Leu Asp Lys Tyr Ala Ile Gly 1 5 <210> 121 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 121 Ser Cys Ile Thr Ser Ser Ser Gly Val Val Lys Tyr Ala 1 5 10 <210> 122 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 122 Cys Ala Ala Ala Gly Pro Pro Asp Asp Cys Ser Val Pro Gly Tyr Tyr 1 5 10 15 Gly Leu Asn Tyr Trp 20 <210> 123 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 123 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Val Ala Ser Gly Phe Thr Leu Asp Lys Tyr 20 25 30 Ala Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Leu Glu Gly Val 35 40 45 Ser Cys Ile Thr Ser Ser Ser Gly Val Val Lys Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Ile Ile Ser Arg Asp Asn Thr Asn Asn Arg Ala Phe 65 70 75 80 Leu Gln Met Ser Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Ala Ala Gly Pro Pro Asp Asp Cys Ser Val Pro Gly Tyr Tyr Gly 100 105 110 Leu Asn Tyr Trp Gly Lys Gly Thr Gln Val Thr Val Ser Ser 115 120 125 <210> 124 <211> 207 <212> PRT <213> Homo sapiens <400> 124 Met Gln Ser Gly Thr His Trp Arg Val Leu Gly Leu Cys Leu Leu Ser 1 5 10 15 Val Gly Val Trp Gly Gln Asp Gly Asn Glu Glu Met Gly Gly Ile Thr 20 25 30 Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val Ile Leu Thr 35 40 45 Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp Gln His Asn Asp Lys 50 55 60 Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp 65 70 75 80 His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr 85 90 95 Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu 100 105 110 Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met Glu Met Asp Val Met 115 120 125 Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly Gly Leu 130 135 140 Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg Lys Ala Lys Ala Lys 145 150 155 160 Pro Val Thr Arg Gly Ala Gly Ala Gly Gly Arg Gln Arg Gly Gln Asn 165 170 175 Lys Glu Arg Pro Pro Pro Val Pro Asn Pro Asp Tyr Glu Pro Ile Arg 180 185 190 Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn Gln Arg Arg Ile 195 200 205 <210> 125 <211> 22 <212> PRT <213> Homo sapiens <400> 125 Met Gln Ser Gly Thr His Trp Arg Val Leu Gly Leu Cys Leu Leu Ser 1 5 10 15 Val Gly Val Trp Gly Gln 20 <210> 126 <211> 104 <212> PRT <213> Homo sapiens <400> 126 Asp Gly Asn Glu Glu Met Gly Gly Ile Thr Gln Thr Pro Tyr Lys Val 1 5 10 15 Ser Ile Ser Gly Thr Thr Val Ile Leu Thr Cys Pro Gln Tyr Pro Gly 20 25 30 Ser Glu Ile Leu Trp Gln His Asn Asp Lys Asn Ile Gly Gly Asp Glu 35 40 45 Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp His Leu Ser Leu Lys Glu 50 55 60 Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr Val Cys Tyr Pro Arg Gly 65 70 75 80 Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu Tyr Leu Arg Ala Arg Val 85 90 95 Cys Glu Asn Cys Met Glu Met Asp 100 <210> 127 <211> 26 <212> PRT <213> Homo sapiens <400> 127 Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly 1 5 10 15 Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser 20 25 <210> 128 <211> 55 <212> PRT <213> Homo sapiens <400> 128 Lys Asn Arg Lys Ala Lys Ala Lys Pro Val Thr Arg Gly Ala Gly Ala 1 5 10 15 Gly Gly Arg Gln Arg Gly Gln Asn Lys Glu Arg Pro Pro Pro Val Pro 20 25 30 Asn Pro Asp Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser 35 40 45 Gly Leu Asn Gln Arg Arg Ile 50 55 <210> 129 <211> 182 <212> PRT <213> Homo sapiens <400> 129 Met Glu Gln Gly Lys Gly Leu Ala Val Leu Ile Leu Ala Ile Ile Leu 1 5 10 15 Leu Gln Gly Thr Leu Ala Gln Ser Ile Lys Gly Asn His Leu Val Lys 20 25 30 Val Tyr Asp Tyr Gln Glu Asp Gly Ser Val Leu Leu Thr Cys Asp Ala 35 40 45 Glu Ala Lys Asn Ile Thr Trp Phe Lys Asp Gly Lys Met Ile Gly Phe 50 55 60 Leu Thr Glu Asp Lys Lys Lys Trp Asn Leu Gly Ser Asn Ala Lys Asp 65 70 75 80 Pro Arg Gly Met Tyr Gln Cys Lys Gly Ser Gln Asn Lys Ser Lys Pro 85 90 95 Leu Gln Val Tyr Tyr Arg Met Cys Gln Asn Cys Ile Glu Leu Asn Ala 100 105 110 Ala Thr Ile Ser Gly Phe Leu Phe Ala Glu Ile Val Ser Ile Phe Val 115 120 125 Leu Ala Val Gly Val Tyr Phe Ile Ala Gly Gln Asp Gly Val Arg Gln 130 135 140 Ser Arg Ala Ser Asp Lys Gln Thr Leu Leu Pro Asn Asp Gln Leu Tyr 145 150 155 160 Gln Pro Leu Lys Asp Arg Glu Asp Asp Gln Tyr Ser His Leu Gln Gly 165 170 175 Asn Gln Leu Arg Arg Asn 180 <210> 130 <211> 160 <212> PRT <213> Homo sapiens <400> 130 Gln Ser Ile Lys Gly Asn His Leu Val Lys Val Tyr Asp Tyr Gln Glu 1 5 10 15 Asp Gly Ser Val Leu Leu Thr Cys Asp Ala Glu Ala Lys Asn Ile Thr 20 25 30 Trp Phe Lys Asp Gly Lys Met Ile Gly Phe Leu Thr Glu Asp Lys Lys 35 40 45 Lys Trp Asn Leu Gly Ser Asn Ala Lys Asp Pro Arg Gly Met Tyr Gln 50 55 60 Cys Lys Gly Ser Gln Asn Lys Ser Lys Pro Leu Gln Val Tyr Tyr Arg 65 70 75 80 Met Cys Gln Asn Cys Ile Glu Leu Asn Ala Ala Thr Ile Ser Gly Phe 85 90 95 Leu Phe Ala Glu Ile Val Ser Ile Phe Val Leu Ala Val Gly Val Tyr 100 105 110 Phe Ile Ala Gly Gln Asp Gly Val Arg Gln Ser Arg Ala Ser Asp Lys 115 120 125 Gln Thr Leu Leu Pro Asn Asp Gln Leu Tyr Gln Pro Leu Lys Asp Arg 130 135 140 Glu Asp Asp Gln Tyr Ser His Leu Gln Gly Asn Gln Leu Arg Arg Asn 145 150 155 160 <210> 131 <211> 22 <212> PRT <213> Homo sapiens <400> 131 Met Glu Gln Gly Lys Gly Leu Ala Val Leu Ile Leu Ala Ile Ile Leu 1 5 10 15 Leu Gln Gly Thr Leu Ala 20 <210> 132 <211> 94 <212> PRT <213> Homo sapiens <400> 132 Gln Ser Ile Lys Gly Asn His Leu Val Lys Val Tyr Asp Tyr Gln Glu 1 5 10 15 Asp Gly Ser Val Leu Leu Thr Cys Asp Ala Glu Ala Lys Asn Ile Thr 20 25 30 Trp Phe Lys Asp Gly Lys Met Ile Gly Phe Leu Thr Glu Asp Lys Lys 35 40 45 Lys Trp Asn Leu Gly Ser Asn Ala Lys Asp Pro Arg Gly Met Tyr Gln 50 55 60 Cys Lys Gly Ser Gln Asn Lys Ser Lys Pro Leu Gln Val Tyr Tyr Arg 65 70 75 80 Met Cys Gln Asn Cys Ile Glu Leu Asn Ala Ala Thr Ile Ser 85 90 <210> 133 <211> 21 <212> PRT <213> Homo sapiens <400> 133 Gly Phe Leu Phe Ala Glu Ile Val Ser Ile Phe Val Leu Ala Val Gly 1 5 10 15 Val Tyr Phe Ile Ala 20 <210> 134 <211> 45 <212> PRT <213> Homo sapiens <400> 134 Gly Gln Asp Gly Val Arg Gln Ser Arg Ala Ser Asp Lys Gln Thr Leu 1 5 10 15 Leu Pro Asn Asp Gln Leu Tyr Gln Pro Leu Lys Asp Arg Glu Asp Asp 20 25 30 Gln Tyr Ser His Leu Gln Gly Asn Gln Leu Arg Arg Asn 35 40 45 <210> 135 <211> 172 <212> PRT <213> Homo sapiens <400> 135 Met Glu His Ser Thr Phe Leu Ser Gly Leu Val Leu Ala Thr Leu Leu 1 5 10 15 Ser Gln Val Ser Pro Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg 20 25 30 Val Phe Val Asn Cys Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val 35 40 45 Gly Thr Leu Leu Ser Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile 50 55 60 Leu Asp Pro Arg Gly Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys 65 70 75 80 Asp Lys Glu Ser Thr Val Gln Val His Tyr Arg Met Cys Gln Ser Cys 85 90 95 Val Glu Leu Asp Pro Ala Thr Val Ala Gly Ile Ile Val Thr Asp Val 100 105 110 Ile Ala Thr Leu Leu Leu Ala Leu Gly Val Phe Cys Phe Ala Gly His 115 120 125 Glu Thr Gly Arg Leu Ser Gly Ala Ala Asp Thr Gln Ala Leu Leu Arg 130 135 140 Asn Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp Asp Ala Gln Tyr 145 150 155 160 Ser His Leu Gly Gly Asn Trp Ala Arg Asn Lys Ser 165 170 <210> 136 <211> 151 <212> PRT <213> Homo sapiens <400> 136 Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg Val Phe Val Asn Cys 1 5 10 15 Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val Gly Thr Leu Leu Ser 20 25 30 Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile Leu Asp Pro Arg Gly 35 40 45 Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys Asp Lys Glu Ser Thr 50 55 60 Val Gln Val His Tyr Arg Met Cys Gln Ser Cys Val Glu Leu Asp Pro 65 70 75 80 Ala Thr Val Ala Gly Ile Ile Val Thr Asp Val Ile Ala Thr Leu Leu 85 90 95 Leu Ala Leu Gly Val Phe Cys Phe Ala Gly His Glu Thr Gly Arg Leu 100 105 110 Ser Gly Ala Ala Asp Thr Gln Ala Leu Leu Arg Asn Asp Gln Val Tyr 115 120 125 Gln Pro Leu Arg Asp Arg Asp Asp Ala Gln Tyr Ser His Leu Gly Gly 130 135 140 Asn Trp Ala Arg Asn Lys Ser 145 150 <210> 137 <211> 21 <212> PRT <213> Homo sapiens <400> 137 Met Glu His Ser Thr Phe Leu Ser Gly Leu Val Leu Ala Thr Leu Leu 1 5 10 15 Ser Gln Val Ser Pro 20 <210> 138 <211> 84 <212> PRT <213> Homo sapiens <400> 138 Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg Val Phe Val Asn Cys 1 5 10 15 Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val Gly Thr Leu Leu Ser 20 25 30 Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile Leu Asp Pro Arg Gly 35 40 45 Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys Asp Lys Glu Ser Thr 50 55 60 Val Gln Val His Tyr Arg Met Cys Gln Ser Cys Val Glu Leu Asp Pro 65 70 75 80 Ala Thr Val Ala <210> 139 <211> 21 <212> PRT <213> Homo sapiens <400> 139 Gly Ile Ile Val Thr Asp Val Ile Ala Thr Leu Leu Leu Ala Leu Gly 1 5 10 15 Val Phe Cys Phe Ala 20 <210> 140 <211> 45 <212> PRT <213> Homo sapiens <400> 140 Gly His Glu Thr Gly Arg Leu Ser Gly Ala Ala Asp Thr Gln Ala Leu 1 5 10 15 Leu Arg Asn Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp Asp Ala 20 25 30 Gln Tyr Ser His Leu Gly Gly Asn Trp Ala Arg Asn Lys 35 40 45 <210> 141 <211> 164 <212> PRT <213> Homo sapiens <400> 141 Met Lys Trp Lys Ala Leu Phe Thr Ala Ala Ile Leu Gln Ala Gln Leu 1 5 10 15 Pro Ile Thr Glu Ala Gln Ser Phe Gly Leu Leu Asp Pro Lys Leu Cys 20 25 30 Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu Thr Ala 35 40 45 Leu Phe Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr 50 55 60 Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg 65 70 75 80 Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met 85 90 95 Gly Gly Lys Pro Gln Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn 100 105 110 Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met 115 120 125 Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly 130 135 140 Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala 145 150 155 160 Leu Pro Pro Arg <210> 142 <211> 140 <212> PRT <213> Homo sapiens <400> 142 Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser 1 5 10 15 Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn 20 25 30 Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr Val 35 40 45 Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala Trp 50 55 60 Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile 65 70 75 80 Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp Val 85 90 95 Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln 100 105 110 Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly 115 120 125 Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser 130 135 140 <210> 143 <211> 115 <212> PRT <213> Homo sapiens <400> 143 Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser 1 5 10 15 Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn 20 25 30 Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr Val 35 40 45 Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala Trp 50 55 60 Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile 65 70 75 80 Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp Val 85 90 95 Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln 100 105 110 Asn Leu Ser 115 <210> 144 <211> 23 <212> PRT <213> Homo sapiens <400> 144 Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu 1 5 10 15 Leu Met Thr Leu Arg Leu Trp 20 <210> 145 <211> 2 <212> PRT <213> Homo sapiens <400> 145 Ser Ser 1 <210> 146 <211> 137 <212> PRT <213> Mus musculus <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <400> 146 Xaa Ile Gln Asn Pro Glu Pro Ala Val Tyr Gln Leu Lys Asp Pro Arg 1 5 10 15 Ser Gln Asp Ser Thr Leu Cys Leu Phe Thr Asp Phe Asp Ser Gln Ile 20 25 30 Asn Val Pro Lys Thr Met Glu Ser Gly Thr Phe Ile Thr Asp Lys Thr 35 40 45 Val Leu Asp Met Lys Ala Met Asp Ser Lys Ser Asn Gly Ala Ile Ala 50 55 60 Trp Ser Asn Gln Thr Ser Phe Thr Cys Gln Asp Ile Phe Lys Glu Thr 65 70 75 80 Asn Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr Leu Thr 85 90 95 Glu Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn Leu Ser 100 105 110 Val Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu 115 120 125 Leu Met Thr Leu Arg Leu Trp Ser Ser 130 135 <210> 147 <211> 22 <212> PRT <213> Mus musculus <400> 147 Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu 1 5 10 15 Met Thr Leu Arg Leu Trp 20 <210> 148 <211> 177 <212> PRT <213> Homo sapiens <400> 148 Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro 1 5 10 15 Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu 20 25 30 Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn 35 40 45 Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys 50 55 60 Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu 65 70 75 80 Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys 85 90 95 Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp 100 105 110 Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg 115 120 125 Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser 130 135 140 Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala 145 150 155 160 Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp 165 170 175 Phe <210> 149 <211> 150 <212> PRT <213> Homo sapiens <400> 149 Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro 1 5 10 15 Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu 20 25 30 Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn 35 40 45 Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys 50 55 60 Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu 65 70 75 80 Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys 85 90 95 Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp 100 105 110 Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg 115 120 125 Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser 130 135 140 Ala Thr Ile Leu Tyr Glu 145 150 <210> 150 <211> 21 <212> PRT <213> Homo sapiens <400> 150 Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu 1 5 10 15 Val Leu Met Ala Met 20 <210> 151 <211> 6 <212> PRT <213> Homo sapiens <400> 151 Val Lys Arg Lys Asp Phe 1 5 <210> 152 <211> 173 <212> PRT <213> Mus musculus <400> 152 Glu Asp Leu Arg Asn Val Thr Pro Pro Lys Val Ser Leu Phe Glu Pro 1 5 10 15 Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala Thr Leu Val Cys Leu 20 25 30 Ala Arg Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn 35 40 45 Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Ala Tyr Lys 50 55 60 Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala 65 70 75 80 Thr Phe Trp His Asn Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe 85 90 95 His Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu Gly Ser Pro Lys Pro 100 105 110 Val Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly 115 120 125 Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu 130 135 140 Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser 145 150 155 160 Thr Leu Val Val Met Ala Met Val Lys Arg Lys Asn Ser 165 170 <210> 153 <211> 27 <212> PRT <213> Mus musculus <400> 153 Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu 1 5 10 15 Val Ser Thr Leu Val Val Met Ala Met Val Lys 20 25 <210> 154 <211> 5 <212> PRT <213> Mus musculus <400> 154 Lys Arg Lys Asn Ser 1 5 <210> 155 <211> 138 <212> PRT <213> Homo sapiens <400> 155 Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu 1 5 10 15 Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys 20 25 30 Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu 35 40 45 Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys 50 55 60 Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys 65 70 75 80 Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys 85 90 95 Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val 100 105 110 Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr 115 120 125 Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala 130 135 <210> 156 <211> 23 <212> PRT <213> Homo sapiens <400> 156 Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala 1 5 10 15 Ile Ile Thr Cys Cys Leu Leu 20 <210> 157 <211> 12 <212> PRT <213> Homo sapiens <400> 157 Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 1 5 10 <210> 158 <211> 23 <212> PRT <213> Homo sapiens <400> 158 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 1 5 10 15 Leu Thr Ala Lys Leu Phe Phe 20 <210> 159 <211> 8412 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 159 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccaggtaag cctatcccta accctctcct cggtctcgat tctacgggag 5280 ccacctaccc cagttcagac gttccctgtg atgccacgtt gactgagaaa agctttgaaa 5340 cagatatgaa cctaaacttt caaaacctgt cagttatggg actccgaatc ctcctgctga 5400 aagtagccgg atttaacctg ctcatgacgc tgaggctgtg gtccagtggc agcggcgagg 5460 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct ggtcgagcag 5520 actgtggtat tacctcagca tcctatcaac aaggagtctt gtctgccacc atcctctatg 5580 agatcctgct agggaaagcc accctgtatg ctgtgcttgt cagtacactg gtggtgatgg 5640 ctatggtcaa aagaaagaat tcatgagata tcgagcatct taccgccatt tatacccata 5700 tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 5760 gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 5820 aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 5880 acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 5940 gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 6000 cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 6060 aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 6120 ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 6180 tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 6240 ccgtggtgtt gtcagtactg gtacctttaa gaccaatgac ttacaaggca gctgtagatc 6300 ttagccactt tttaaaagaa aaggggggac tggaagggct aattcactcc caaagaagac 6360 aagatctgct ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc 6420 tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct tgagtgcttc 6480 aatgatcata atcaagccat atcacatctg tagaggttta cttgctttaa aaaacctcca 6540 cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt 6600 gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 6660 ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg 6720 atctgcgtcg acacgaagag acgactgact gactgactgg aaagaggaag ggctggaaga 6780 ggaaggagct tgatccagat cccgatctcg atccagatcc ggatcgcagc ttggcgtaat 6840 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6900 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6960 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 7020 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 7080 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7140 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7200 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7260 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7320 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7380 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 7440 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 7500 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 7560 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 7620 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 7680 ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 7740 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 7800 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 7860 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 7920 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 7980 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 8040 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 8100 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcagctt gggaaaccat 8160 aagagctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 8220 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 8280 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 8340 cacgttaagg gattttggtc atgagcttgc gccgtcccgt caagtcagcg taatgctctg 8400 ccagtgttac aa 8412 <210> 160 <211> 9096 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 160 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 5280 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 5340 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 5400 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 5460 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 5520 acacgttcgg aggggggact aagttggaaa taacaggagg tggaggttct ggtggaggag 5580 gttcaggagg tggtggaagt gaggtgaaac tgcaggagtc aggacctggc ctggtggcgc 5640 cctcacagag cctgtccgtc acatgcactg tctcaggggt ctcattaccc gactatggtg 5700 taagctggat tcgccagcct ccacgaaagg gtctggagtg gctgggagta atatggggta 5760 gtgaaaccac atactataat tcagctctca aatccagact gaccatcatc aaggacaact 5820 ccaagagcca agttttctta aaaatgaaca gtctgcaaac tgatgacaca gccatttact 5880 actgtgccaa acattattac tacggtggta gctatgctat ggactactgg ggtcaaggaa 5940 cctcagtcac cgtctcctca ggagccacct accccagttc agacgttccc tgtgatgcca 6000 cgttgactga gaaaagcttt gaaacagata tgaacctaaa ctttcaaaac ctgtcagtta 6060 tgggactccg aatcctcctg ctgaaagtag ccggatttaa cctgctcatg acgctgaggc 6120 tgtggtccag tggcagcggc gagggcagag gaagtctgct aacatgcggt gacgtcgagg 6180 agaatcctgg acctggtcga gcagactgtg gtattacctc agcatcctat caacaaggag 6240 tcttgtctgc caccatcctc tatgagatcc tgctagggaa agccaccctg tatgctgtgc 6300 ttgtcagtac actggtggtg atggctatgg tcaaaagaaa gaattcatga gatatcgagc 6360 atcttaccgc catttatacc catatttgtt ctgtttttct tgatttgggt atacatttaa 6420 atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta 6480 gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg 6540 ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact 6600 atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg 6660 cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag 6720 aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa 6780 cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc 6840 ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6900 ctaggttgct gggcactgat aattccgtgg tgttgtcagt actggtacct ttaagaccaa 6960 tgacttacaa ggcagctgta gatcttagcc actttttaaa agaaaagggg ggactggaag 7020 ggctaattca ctcccaaaga agacaagatc tgctttttgc ctgtactggg tctctctggt 7080 tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc 7140 aataaagctt gccttgagtg cttcaatgat cataatcaag ccatatcaca tctgtagagg 7200 tttacttgct ttaaaaaacc tccacacctc cccctgaacc tgaaacataa aatgaatgca 7260 attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 7320 acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 7380 atcaatgtat cttatcatgt ctggatctgc gtcgacacga agagacgact gactgactga 7440 ctggaaagag gaagggctgg aagaggaagg agcttgatcc agatcccgat ctcgatccag 7500 atccggatcg cagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 7560 cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 7620 aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 7680 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 7740 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 7800 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 7860 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 7920 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 7980 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 8040 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 8100 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 8160 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 8220 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 8280 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 8340 agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 8400 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 8460 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 8520 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 8580 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 8640 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 8700 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 8760 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 8820 tgataccgca gcttgggaaa ccataagagc tgaagccagt taccttcgga aaaagagttg 8880 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 8940 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 9000 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgagc ttgcgccgtc 9060 ccgtcaagtc agcgtaatgc tctgccagtg ttacaa 9096 <210> 161 <211> 9701 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (8081)..(8081) <223> a, c, t, g, unknown or other <400> 161 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggcgtaatca 360 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 420 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 480 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 540 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 600 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 660 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 720 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 780 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 840 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 900 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 960 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1020 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1080 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1140 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1200 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1260 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1320 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1380 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1440 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1500 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 1560 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 1620 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcagcttgg gaaaccataa 1680 gagctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 1740 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 1800 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 1860 cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta atgctctgcc 1920 agtgttacaa ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact 1980 gcaatttatt cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 2040 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 2100 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 2160 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 2220 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 2280 caaccaaacc gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt 2340 taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat 2400 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg 2460 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 2520 gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 2580 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 2640 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 2700 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa 2760 caccccttgt attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt 2820 tatcttgtgc aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc 2880 catgacatta acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc 2940 gagatagagt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 3000 tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 3060 cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 3120 agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 3180 aaagcgaaag gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 3240 accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta 3300 tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 3360 cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 3420 agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 3480 agtcacgacg ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga 3540 tccagatcga attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg 3600 tctcaacctc ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg 3660 tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg 3720 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 3780 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 3840 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 3900 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 3960 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 4020 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 4080 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 4140 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 4200 cgtttagtga accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 4260 actagggaac ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg 4320 tgcccgtctg ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg 4380 gaaaatctct agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag 4440 atctctcgac gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga 4500 ctggtgagta cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag 4560 agcgtcggta ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg 4620 gggaaagaaa caatataaac taaaacatat agttagggca agcagggagc tagaacgatt 4680 cgcagttaat cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct 4740 acaaccatcc cttcagacag gatcagaaga acttagatca ttatataata caatagcagt 4800 cctctattgt gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat 4860 agaggaagag caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg 4920 aggcaggagg cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa 4980 aaattgaacc attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa 5040 aaagagcagt gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta 5100 tgggcgcagc gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc 5160 agcagcagaa caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag 5220 tctggggcat caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc 5280 aacagctcct ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt 5340 ggaatgctag ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg 5400 agtgggacag agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc 5460 aaaaccagca agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt 5520 ggaattggtt taacataaca aattggctgt ggtatataaa attattcata atgatagtag 5580 gaggcttggt aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc 5640 agggatattc accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac 5700 aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag 5760 gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa 5820 ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag 5880 ctgagcatcc ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga 5940 gaagttgggg ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa 6000 ctgggaaagt gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta 6060 tataagtgca gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca 6120 ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt 6180 gccttgaatt acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg 6240 ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 6300 gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 6360 cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 6420 cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 6480 cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 6540 ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 6600 ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 6660 cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 6720 gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 6780 aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 6840 ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 6900 ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 6960 ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 7020 tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac 7080 ccctcagagc cgccaccatg cttctcctgg tgacaagcct tctgctctgt gagttaccac 7140 acccagcatt cctcctgatc ccagacatcc agatgacaca gactacatcc tccctgtctg 7200 cctctctggg agacagagtc accatcagtt gcagggcaag tcaggacatt agtaaatatt 7260 taaattggta tcagcagaaa ccagatggaa ctgttaaact cctgatctac catacatcaa 7320 gattacactc aggagtccca tcaaggttca gtggcagtgg gtctggaaca gattattctc 7380 tcaccattag caacctggag caagaagata ttgccactta cttttgccaa cagggtaata 7440 cgcttccgta cacgttcgga ggggggacta agttggaaat aacaggaggt ggaggttctg 7500 gtggaggagg ttcaggaggt ggtggaagtg aggtgaaact gcaggagtca ggacctggcc 7560 tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc tcattacccg 7620 actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa 7680 tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg accatcatca 7740 aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact gatgacacag 7800 ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg gactactggg 7860 gtcaaggaac ctcagtcacc gtctcctcag gaattcagaa ccctgagcct gccgtgtacc 7920 agctgaagga ccctagaagc caggacagca ccctgtgcct gttcaccgac ttcgacagcc 7980 agatcaacgt gcccaagacc atggaaagcg gcaccttcat caccgataag actgtgctgg 8040 acatgaaggc catggacagc aagagcaacg gcgccattgc ntggtccaat cagaccagct 8100 ttacctgcca agacatcttc aaagagacaa acgccaccta ccccagttca gacgttccct 8160 gtgatgccac gttgactgag aaaagctttg aaacagatat gaacctaaac tttcaaaacc 8220 tgtcagttat gggactccga atcctcctgc tgaaagtagc cggatttaac ctgctcatga 8280 cgctgaggct gtggtccagt ggcagcggcg ctactaactt cagcctgctg aagcaggctg 8340 gagacgtgga ggagaaccct ggacctgatc tgagaaatgt gactccaccc aaggtctcct 8400 tgtttgagcc atcaaaagca gagattgcaa acaaacaaaa ggctaccctc gtgtgcttgg 8460 ccaggggctt cttccctgac cacgtggagc tgagctggtg ggtgaatggc aaggaggtcc 8520 acagtggggt cagcacggac cctcaggcct acaaggagag caattatagc tactgcctga 8580 gcagccgcct gagggtctct gctaccttct ggcacaatcc tcgcaaccac ttccgctgcc 8640 aagtgcagtt ccatgggctt tcagaggagg acaagtggcc agagggctca cccaaacctg 8700 tcacacagaa catcagtgca gaggcctggg gtcgagcaga ctgtggtatt acctcagcat 8760 cctatcaaca aggagtcttg tctgccacca tcctctatga gatcctgcta gggaaagcca 8820 ccctgtatgc tgtgcttgtc agtacactgg tggtgatggc tatggtcaaa agaaagaatt 8880 catgagatat cgagcatctt accgccattt atacccatat ttgttctgtt tttcttgatt 8940 tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg 9000 gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc 9060 gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga 9120 ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc 9180 tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt 9240 tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg 9300 tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg 9360 ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc 9420 gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tcagtactgg 9480 tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 9540 aggggggact ggaagggcta attcactccc aaagaagaca agatctgctt tttgcctgta 9600 ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 9660 cactgcttaa gcctcaataa agcttgcctt gagtgcttca a 9701 <210> 162 <211> 8669 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (7052)..(7052) <223> a, c, t, g, unknown or other <400> 162 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggcgtaatca 360 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 420 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 480 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 540 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 600 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 660 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 720 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 780 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 840 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 900 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 960 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1020 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1080 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1140 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1200 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1260 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1320 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1380 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1440 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1500 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 1560 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 1620 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcagcttgg gaaaccataa 1680 gagctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 1740 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 1800 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 1860 cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta atgctctgcc 1920 agtgttacaa ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact 1980 gcaatttatt cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 2040 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 2100 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 2160 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 2220 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 2280 caaccaaacc gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt 2340 taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat 2400 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg 2460 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 2520 gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 2580 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 2640 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 2700 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa 2760 caccccttgt attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt 2820 tatcttgtgc aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc 2880 catgacatta acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc 2940 gagatagagt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 3000 tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 3060 cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 3120 agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 3180 aaagcgaaag gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 3240 accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta 3300 tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 3360 cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 3420 agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 3480 agtcacgacg ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga 3540 tccagatcga attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg 3600 tctcaacctc ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg 3660 tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg 3720 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 3780 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 3840 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 3900 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 3960 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 4020 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 4080 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 4140 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 4200 cgtttagtga accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 4260 actagggaac ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg 4320 tgcccgtctg ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg 4380 gaaaatctct agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag 4440 atctctcgac gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga 4500 ctggtgagta cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag 4560 agcgtcggta ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg 4620 gggaaagaaa caatataaac taaaacatat agttagggca agcagggagc tagaacgatt 4680 cgcagttaat cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct 4740 acaaccatcc cttcagacag gatcagaaga acttagatca ttatataata caatagcagt 4800 cctctattgt gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat 4860 agaggaagag caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg 4920 aggcaggagg cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa 4980 aaattgaacc attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa 5040 aaagagcagt gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta 5100 tgggcgcagc gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc 5160 agcagcagaa caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag 5220 tctggggcat caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc 5280 aacagctcct ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt 5340 ggaatgctag ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg 5400 agtgggacag agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc 5460 aaaaccagca agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt 5520 ggaattggtt taacataaca aattggctgt ggtatataaa attattcata atgatagtag 5580 gaggcttggt aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc 5640 agggatattc accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac 5700 aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag 5760 gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa 5820 ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag 5880 ctgagctagc gggcggagtt agggcggagc caatcagcgt gcgccgttcc gaaagttgcc 5940 ttttatggct gggcggagaa tgggcggtga acgccgatga ttatataagg acgcgccggg 6000 tgtggcacag ctagttccgt cgcagccggg atttgggtcg cggttcttgt ttgttcagag 6060 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 6120 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 6180 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 6240 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 6300 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 6360 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 6420 acacgttcgg aggggggact aagttggaaa taacaggagg tggaggttct ggtggaggag 6480 gttcaggagg tggtggaagt gaggtgaaac tgcaggagtc aggacctggc ctggtggcgc 6540 cctcacagag cctgtccgtc acatgcactg tctcaggggt ctcattaccc gactatggtg 6600 taagctggat tcgccagcct ccacgaaagg gtctggagtg gctgggagta atatggggta 6660 gtgaaaccac atactataat tcagctctca aatccagact gaccatcatc aaggacaact 6720 ccaagagcca agttttctta aaaatgaaca gtctgcaaac tgatgacaca gccatttact 6780 actgtgccaa acattattac tacggtggta gctatgctat ggactactgg ggtcaaggaa 6840 cctcagtcac cgtctcctca ggaattcaga accctgagcc tgccgtgtac cagctgaagg 6900 accctagaag ccaggacagc accctgtgcc tgttcaccga cttcgacagc cagatcaacg 6960 tgcccaagac catggaaagc ggcaccttca tcaccgataa gactgtgctg gacatgaagg 7020 ccatggacag caagagcaac ggcgccattg cntggtccaa tcagaccagc tttacctgcc 7080 aagacatctt caaagagaca aacgccacct accccagttc agacgttccc tgtgatgcca 7140 cgttgactga gaaaagcttt gaaacagata tgaacctaaa ctttcaaaac ctgtcagtta 7200 tgggactccg aatcctcctg ctgaaagtag ccggatttaa cctgctcatg acgctgaggc 7260 tgtggtccag tggcagcggc gagggcagag gaagtctgct aacatgcggt gacgtcgagg 7320 agaatcctgg acctgatctg agaaatgtga ctccacccaa ggtctccttg tttgagccat 7380 caaaagcaga gattgcaaac aaacaaaagg ctaccctcgt gtgcttggcc aggggcttct 7440 tccctgacca cgtggagctg agctggtggg tgaatggcaa ggaggtccac agtggggtca 7500 gcacggaccc tcaggcctac aaggagagca attatagcta ctgcctgagc agccgcctga 7560 gggtctctgc taccttctgg cacaatcctc gcaaccactt ccgctgccaa gtgcagttcc 7620 atgggctttc agaggaggac aagtggccag agggctcacc caaacctgtc acacagaaca 7680 tcagtgcaga ggcctggggt cgagcagact gtggtattac ctcagcatcc tatcaacaag 7740 gagtcttgtc tgccaccatc ctctatgaga tcctgctagg gaaagccacc ctgtatgctg 7800 tgcttgtcag tacactggtg gtgatggcta tggtcaaaag aaagaattca tgagatatcg 7860 agcatcttac cgccatttat acccatattt gttctgtttt tcttgatttg ggtatacatt 7920 taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta 7980 ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct 8040 ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta 8100 actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta 8160 ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt 8220 tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg 8280 caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt 8340 tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag 8400 gggctaggtt gctgggcact gataattccg tggtgttgtc agtactggta cctttaagac 8460 caatgactta caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg 8520 aagggctaat tcactcccaa agaagacaag atctgctttt tgcctgtact gggtctctct 8580 ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc 8640 ctcaataaag cttgccttga gtgcttcaa 8669 <210> 163 <211> 9929 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 163 aaagctgagc atccggctcc ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc 60 ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg 120 taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt gggggagaac 180 cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt gccgccagaa 240 cacaggtaag tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt 300 gcgtgccttg aattacttcc acgcccctgg ctgcagtacg tgattcttga tcccgagctt 360 cgggttggaa gtgggtggga gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt 420 gcttgagttg aggcctggcc tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt 480 cgcgcctgtc tcgctgcttt cgataagtct ctagccattt aaaatttttg atgacctgct 540 gcgacgcttt ttttctggca agatagtctt gtaaatgcgg gccaagatct gcacactggt 600 atttcggttt ttggggccgc gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg 660 gcgaggcggg gcctgcgagc gcggccaccg agaatcggac gggggtagtc tcaagctggc 720 cggcctgctc tggtgcctgg cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg 780 ctggcccggt cggcaccagt tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca 840 gggagctcaa aatggaggac gcggcgctcg ggagagcggg cgggtgagtc acccacacaa 900 aggaaaaggg cctttccgtc ctcagccgtc gcttcatgtg actccacgga gtaccgggcg 960 ccgtccaggc acctcgatta gttctcgagc ttttggagta cgtcgtcttt aggttggggg 1020 gaggggtttt atgcgatgga gtttccccac actgagtggg tggagactga agttaggcca 1080 gcttggcact tgatgtaatt ctccttggaa tttgcccttt ttgagtttgg atcttggttc 1140 attctcaagc ctcagacagt ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa 1200 ctacccctct agagccgcca ccatgcttct cctggtgaca agccttctgc tctgtgagtt 1260 accacaccca gcattcctcc tgatcccaga catccagatg acacagacta catcctccct 1320 gtctgcctct ctgggagaca gagtcaccat cagttgcagg gcaagtcagg acattagtaa 1380 atatttaaat tggtatcagc agaaaccaga tggaactgtt aaactcctga tctaccatac 1440 atcaagatta cactcaggag tcccatcaag gttcagtggc agtgggtctg gaacagatta 1500 ttctctcacc attagcaacc tggagcaaga agatattgcc acttactttt gccaacaggg 1560 taatacgctt ccgtacacgt tcggaggggg gactaagttg gaaataacag gctccacctc 1620 tggatccggc aagcccggat ctggcgaggg atccaccaag ggcgaggtga aactgcagga 1680 gtcaggacct ggcctggtgg cgccctcaca gagcctgtcc gtcacatgca ctgtctcagg 1740 ggtctcatta cccgactatg gtgtaagctg gattcgccag cctccacgaa agggtctgga 1800 gtggctggga gtaatatggg gtagtgaaac cacatactat aattcagctc tcaaatccag 1860 actgaccatc atcaaggaca actccaagag ccaagttttc ttaaaaatga acagtctgca 1920 aactgatgac acagccattt actactgtgc caaacattat tactacggtg gtagctatgc 1980 tatggactac tggggtcaag gaacctcagt caccgtctcc tcagcggccg caggtggagg 2040 aggttctgga ggtggtggat caggtggtgg aggatcttta gaaggagcca cctaccccag 2100 ttcagacgtt ccctgtgatg ccacgttgac tgagaaaagc tttgaaacag atatgaacct 2160 aaactttcaa aacctgtcag ttatgggact ccgaatcctc ctgctgaaag tagccggatt 2220 taacctgctc atgacgctga ggctgtggtc cagtgggtca ggcgagggca gaggaagtct 2280 gctaacatgc ggtgacgtcg aggagaatcc tggacctatg ctactacttg tgacctcact 2340 attgttatgc gaactccctc atcccgcatt cttgctgatt ccagacattc agatgactca 2400 aacaacttcc agcctctccg cctcactcgg cgaccgcgta acaataagct gtcgggcctc 2460 gcaagatatt agtaagtacc tgaattggta tcagcaaaaa cccgatggta cagtcaagct 2520 tctgatctac cataccagtc gtctgcacag cggtgtcccc agcaggttca gcggctcagg 2580 atctggtacc gattattcac tgacgatttc caaccttgag caggaggaca tcgccaccta 2640 cttctgccag cagggtaata ctctgccgta cacattcggg ggcggtacca agctcgagat 2700 cacgggttca acaagcggtt ctggcaagcc aggcagcggc gaggggagta caaaggggga 2760 ggtgaagttg caggaaagtg gccctggatt ggtggccccg agccagagtc tgtctgtcac 2820 ctgcacagtt tccggagtaa gtctgcctga ttacggagtg tcctggatca gacagccacc 2880 tcgaaagggc ttggagtggc ttggggtcat ttggggcagt gaaaccacat actacaacag 2940 cgctcttaag tccaggctca ctatcatcaa ggacaattca aagagccaag tattcttgaa 3000 aatgaattcc ctgcagactg atgacaccgc tatttattat tgcgctaaac attattacta 3060 tggaggttct tatgccatgg actactgggg gcagggtacc tctgtgacag tgagttcagc 3120 tgcagctgga ggtggaggta gcggaggcgg tggtagtgga gggggtggtt ctctggaagg 3180 tcgagcagac tgtggtatta cctcagcatc ctatcaacaa ggagtcttgt ctgccaccat 3240 cctctatgag atcctgctag ggaaagccac cctgtatgct gtgcttgtca gtacactggt 3300 ggtgatggct atggtcaaaa gaaagaattc atgagatatc gagcatctta ccgccattta 3360 tacccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ataaaacaaa 3420 atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag gtgtattgcc 3480 acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg ttaatcaacc 3540 tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ctccttttac 3600 gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc gtacggcttt 3660 cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt tgtggcccgt 3720 tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca ctggctgggg 3780 cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc cgatcgccac 3840 ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt tgctgggcac 3900 tgataattcc gtggtgttgt cagtactggt acctttaaga ccaatgactt acaaggcagc 3960 tgtagatctt agccactttt taaaagaaaa ggggggactg gaagggctaa ttcactccca 4020 aagaagacaa gatctgcttt ttgcctgtac tgggtctctc tggttagacc agatctgagc 4080 ctgggagctc tctggctaac tagggaaccc actgcttaag cctcaataaa gcttgccttg 4140 agtgcttcaa tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa 4200 aacctccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact 4260 tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 4320 aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 4380 atgtctggat ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg 4440 ctggaagagg aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt 4500 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 4560 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 4620 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 4680 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 4740 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 4800 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 4860 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 4920 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 4980 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 5040 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 5100 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 5160 gggctgtgtg cacgaacccc cccggtaaga cacgacttat cgccactggc agcagccact 5220 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 5280 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 5340 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 5400 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 5460 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 5520 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 5580 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 5640 gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 5700 gttgctaggt tactgtcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 5760 agagtttgta gaaacgcaaa aaggccatcc gtcaggatgg ccttctgctt aatttgatcg 5820 gtggcagttt atggcgggcg tcctgcccgc caccctccgg gccgttgctt cgcaacgttc 5880 aaatccgctc ccggcggatt tgtcctactc aggagagcgt tcaccgacaa acaacagata 5940 aaacgaaagg cccagtcttt cgactgagcc tttcgtttta tttgatgcct ggcagttccc 6000 tactctcgca tgggttgcgg ccgcccgggc cgtcgaccaa ttctcatgtt tgacagctta 6060 tcatcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 6120 tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 6180 actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 6240 cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 6300 aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 6360 cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 6420 ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 6480 cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 6540 aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cgaaattccg 6600 gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 6660 ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 6720 attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 6780 cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 6840 ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 6900 ttacgtgccg atcaacgtct cattttcgcc aaaagtgaca ttaacctata aaaataggcg 6960 tatcacgagg ccagcttggg aaaccataag accgagatag agttgagtgt tgttccagtt 7020 tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc 7080 tatcagggcg atggcccact acgtgaacca tcacccaaat caagtttttt ggggtcgagg 7140 tgccgtaaag cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga 7200 aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctaaggcg 7260 ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg 7320 ctacagggcg cgtactatgg ttgctttgac gtatgcggtg tgaaataccg cacagatgcg 7380 taaggagaaa ataccgcatc aggcgccatt cgccattcag gctgcgcaac tgttgggaag 7440 ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 7500 ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 7560 gtgaattgat cgagatcgtg atccggatca agatccagat cgaattggag gctacagtca 7620 gtggagagga ctttcactga ctgactgact gcgtctcaac ctcctagggg acattgatta 7680 ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc atatatggag 7740 ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc 7800 ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac tttccattga 7860 cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat 7920 atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc 7980 cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct 8040 attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca 8100 cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat 8160 caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg 8220 cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgggt ctctctggtt 8280 agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 8340 ataaagcttg ccttgagtgc tcaaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 8400 ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 8460 agggacttga aagcgaaagt aaagccagag gagatctctc gacgcaggac tcggcttgct 8520 gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 8580 agcggaggct agaaggagag agtagggtgc gagagcgtcg gtattaagcg ggggagaatt 8640 agataaatgg gaaaaaattc ggttaaggcc agggggaaag aaacaatata aactaaaaca 8700 tatagttagg gcaagcaggg agctagaacg attcgcagtt aatcctggcc ttttagagac 8760 atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga caggatcaga 8820 agaacttaga tcattatata atacaatagc agtcctctat tgtgtgcatc aaaggataga 8880 tgtaaaagac accaaggaag ccttagataa gatagaggaa gagcaaaaca aaagtaagaa 8940 aaaggcacag caagcgatct tcagacctgg aggaggcagg aggcgatatg agggacaatt 9000 ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 9060 ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 9120 tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 9180 tacaggccag acaattattg tctgatatag tgcagcagca gaacaatttg ctgagggcta 9240 ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaaacag ctccaggcaa 9300 gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 9360 ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 9420 tggaacagat ttggaataac atgacctgga tggagtggga cagagaaatt aacaattaca 9480 caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 9540 aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 9600 tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 9660 ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 9720 cccacctccc aatcccgagg ggaccacgcg tacaaatggc agtattcatc cacaatttta 9780 aaagaaaagg ggggattggg gggtacagtg caggggaaag aatagtagac ataatagcaa 9840 cagacataca aactaaagaa ttacaaaaac aaattacaaa aattcaaaat tttcgggttt 9900 attacaggga cagcagaaat ccactttgg 9929 <210> 164 <211> 9654 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (8037)..(8037) <223> a, c, t, g, unknown or other <400> 164 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggcgtaatca 360 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 420 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 480 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 540 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 600 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 660 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 720 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 780 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 840 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 900 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 960 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1020 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1080 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1140 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1200 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1260 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1320 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1380 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1440 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1500 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 1560 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgttgctag gttactgtca 1620 tgagcggata catatttgaa tgtatttaga aaaataaaca aaagagtttg tagaaacgca 1680 aaaaggccat ccgtcaggat ggccttctgc ttaatttgat cggtggcagt ttatggcggg 1740 cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 1800 tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 1860 ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catgggttgc 1920 ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 1980 tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 2040 tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 2100 gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 2160 tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 2220 tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 2280 cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 2340 ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 2400 gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 2460 atatcaccag ctcaccgtct ttcattgcca tacgaaattc cggatgagca ttcatcaggc 2520 gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 2580 aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 2640 atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 2700 tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 2760 ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 2820 ctcattttcg ccaaaagtga cattaaccta taaaaatagg cgtatcacga ggccagcttg 2880 ggaaaccata agaccgagat agagttgagt gttgttccag tttggaacaa gagtccacta 2940 ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca 3000 ctacgtgaac catcacccaa atcaagtttt ttggggtcga ggtgccgtaa agcactaaat 3060 cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg 3120 agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg cgctggcaag tgtagcggtc 3180 acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtactat 3240 ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 3300 tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 3360 cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 3420 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg atcgagatcg 3480 tgatccggat caagatccag atcgaattgg aggctacagt cagtggagag gactttcact 3540 gactgactga ctgcgtctca acctcctagg ggacattgat tattgactag ttattaatag 3600 taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt 3660 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 3720 acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 3780 ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 3840 attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 3900 gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg 3960 ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc 4020 caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa 4080 tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc 4140 tatataagca gagctcgttt agtgaaccgg gtctctctgg ttagaccaga tctgagcctg 4200 ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 4260 gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 4320 cttttagtca gtgtggaaaa tctctagcag tggcgcccga acagggactt gaaagcgaaa 4380 gtaaagccag aggagatctc tcgacgcagg actcggcttg ctgaagcgcg cacggcaaga 4440 ggcgaggggc ggcgactggt gagtacgcca aaaattttga ctagcggagg ctagaaggag 4500 agagtagggt gcgagagcgt cggtattaag cgggggagaa ttagataaat gggaaaaaat 4560 tcggttaagg ccagggggaa agaaacaata taaactaaaa catatagtta gggcaagcag 4620 ggagctagaa cgattcgcag ttaatcctgg ccttttagag acatcagaag gctgtagaca 4680 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 4740 taatacaata gcagtcctct attgtgtgca tcaaaggata gatgtaaaag acaccaagga 4800 agccttagat aagatagagg aagagcaaaa caaaagtaag aaaaaggcac agcaagcgat 4860 cttcagacct ggaggaggca ggaggcgata tgagggacaa ttggagaagt gaattatata 4920 aatataaagt agtaaaaatt gaaccattag gagtagcacc caccaaggca aagagaagag 4980 tggtgcagag agaaaaaaga gcagtgggaa taggagcttt gttccttggg ttcttgggag 5040 cagcaggaag cactatgggc gcagcgtcaa tgacgctgac ggtacaggcc agacaattat 5100 tgtctgatat agtgcagcag cagaacaatt tgctgagggc tattgaggcg caacagcatc 5160 tgttgcaact cacagtctgg ggcatcaaac agctccaggc aagaatcctg gctgtggaaa 5220 gatacctaaa ggatcaacag ctcctgggga tttggggttg ctctggaaaa ctcatttgca 5280 ccactgctgt gccttggaat gctagttgga gtaataaatc tctggaacag atttggaata 5340 acatgacctg gatggagtgg gacagagaaa ttaacaatta cacaagctta atacactcct 5400 taattgaaga atcgcaaaac cagcaagaaa agaatgaaca agaattattg gaattagata 5460 aatgggcaag tttgtggaat tggtttaaca taacaaattg gctgtggtat ataaaattat 5520 tcataatgat agtaggaggc ttggtaggtt taagaatagt ttttgctgta ctttctatag 5580 tgaatagagt taggcaggga tattcaccat tatcgtttca gacccacctc ccaatcccga 5640 ggggaccacg cgtacaaatg gcagtattca tccacaattt taaaagaaaa ggggggattg 5700 gggggtacag tgcaggggaa agaatagtag acataatagc aacagacata caaactaaag 5760 aattacaaaa acaaattaca aaaattcaaa attttcgggt ttattacagg gacagcagaa 5820 atccactttg gaaagctgag catccggctc cggtgcccgt cagtgggcag agcgcacatc 5880 gcccacagtc cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag 5940 gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg 6000 tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt 6060 tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg 6120 ttatggccct tgcgtgcctt gaattacttc cacgcccctg gctgcagtac gtgattcttg 6180 atcccgagct tcgggttgga agtgggtggg agagttcgag gccttgcgct taaggagccc 6240 cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct 6300 ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc tctagccatt taaaattttt 6360 gatgacctgc tgcgacgctt tttttctggc aagatagtct tgtaaatgcg ggccaagatc 6420 tgcacactgg tatttcggtt tttggggccg cgggcggcga cggggcccgt gcgtcccagc 6480 gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc gagaatcgga cgggggtagt 6540 ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct 6600 gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg 6660 gccctgctgc agggagctca aaatggagga cgcggcgctc gggagagcgg gcgggtgagt 6720 cacccacaca aaggaaaagg gcctttccgt cctcagccgt cgcttcatgt gactccacgg 6780 agtaccgggc gccgtccagg cacctcgatt agttctcgag cttttggagt acgtcgtctt 6840 taggttgggg ggaggggttt tatgcgatgg agtttcccca cactgagtgg gtggagactg 6900 aagttaggcc agcttggcac ttgatgtaat tctccttgga atttgccctt tttgagtttg 6960 gatcttggtt cattctcaag cctcagacag tggttcaaag tttttttctt ccatttcagg 7020 tgtcgtgaaa actacccctc tagagccgcc accatgcttc tcctggtgac aagccttctg 7080 ctctgtgagt taccacaccc agcattcctc ctgatcccag acatccagat gacacagact 7140 acatcctccc tgtctgcctc tctgggagac agagtcacca tcagttgcag ggcaagtcag 7200 gacattagta aatatttaaa ttggtatcag cagaaaccag atggaactgt taaactcctg 7260 atctaccata catcaagatt acactcagga gtcccatcaa ggttcagtgg cagtgggtct 7320 ggaacagatt attctctcac cattagcaac ctggagcaag aagatattgc cacttacttt 7380 tgccaacagg gtaatacgct tccgtacacg ttcggagggg ggactaagtt ggaaataaca 7440 ggaggtggag gttctggtgg aggaggttca ggaggtggtg gaagtgaggt gaaactgcag 7500 gagtcaggac ctggcctggt ggcgccctca cagagcctgt ccgtcacatg cactgtctca 7560 ggggtctcat tacccgacta tggtgtaagc tggattcgcc agcctccacg aaagggtctg 7620 gagtggctgg gagtaatatg gggtagtgaa accacatact ataattcagc tctcaaatcc 7680 agactgacca tcatcaagga caactccaag agccaagttt tcttaaaaat gaacagtctg 7740 caaactgatg acacagccat ttactactgt gccaaacatt attactacgg tggtagctat 7800 gctatggact actggggtca aggaacctca gtcaccgtct cctcaggaat tcagaaccct 7860 gagcctgccg tgtaccagct gaaggaccct agaagccagg acagcaccct gtgcctgttc 7920 accgacttcg acagccagat caacgtgccc aagaccatgg aaagcggcac cttcatcacc 7980 gataagactg tgctggacat gaaggccatg gacagcaaga gcaacggcgc cattgcntgg 8040 tccaatcaga ccagctttac ctgccaagac atcttcaaag agacaaacgc cacctacccc 8100 agttcagacg ttccctgtga tgccacgttg actgagaaaa gctttgaaac agatatgaac 8160 ctaaactttc aaaacctgtc agttatggga ctccgaatcc tcctgctgaa agtagccgga 8220 tttaacctgc tcatgacgct gaggctgtgg tccagtggca gcggcgaggg cagaggaagt 8280 ctgctaacat gcggtgacgt cgaggagaat cctggacctg atctgagaaa tgtgactcca 8340 cccaaggtct ccttgtttga gccatcaaaa gcagagattg caaacaaaca aaaggctacc 8400 ctcgtgtgct tggccagggg cttcttccct gaccacgtgg agctgagctg gtgggtgaat 8460 ggcaaggagg tccacagtgg ggtcagcacg gaccctcagg cctacaagga gagcaattat 8520 agctactgcc tgagcagccg cctgagggtc tctgctacct tctggcacaa tcctcgcaac 8580 cacttccgct gccaagtgca gttccatggg ctttcagagg aggacaagtg gccagagggc 8640 tcacccaaac ctgtcacaca gaacatcagt gcagaggcct ggggtcgagc agactgtggt 8700 attacctcag catcctatca acaaggagtc ttgtctgcca ccatcctcta tgagatcctg 8760 ctagggaaag ccaccctgta tgctgtgctt gtcagtacac tggtggtgat ggctatggtc 8820 aaaagaaaga attcatgaga tatcgagcat cttaccgcca tttataccca tatttgttct 8880 gtttttcttg atttgggtat acatttaaat gttaataaaa caaaatggtg gggcaatcat 8940 ttacattttt agggatatgt aattactagt tcaggtgtat tgccacaaga caaacatgtt 9000 aagaaacttt cccgttattt acgctctgtt cctgttaatc aacctctgga ttacaaaatt 9060 tgtgaaagat tgactgatat tcttaactat gttgctcctt ttacgctgtg tggatatgct 9120 gctttatagc ctctgtatct agctattgct tcccgtacgg ctttcgtttt ctcctccttg 9180 tataaatcct ggttgctgtc tcttttagag gagttgtggc ccgttgtccg tcaacgtggc 9240 gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ggggcattgc caccacctgt 9300 caactccttt ctgggacttt cgctttcccc ctcccgatcg ccacggcaga actcatcgcc 9360 gcctgccttg cccgctgctg gacaggggct aggttgctgg gcactgataa ttccgtggtg 9420 ttgtcagtac tggtaccttt aagaccaatg acttacaagg cagctgtaga tcttagccac 9480 tttttaaaag aaaagggggg actggaaggg ctaattcact cccaaagaag acaagatctg 9540 ctttttgcct gtactgggtc tctctggtta gaccagatct gagcctggga gctctctggc 9600 taactaggga acccactgct taagcctcaa taaagcttgc cttgagtgct tcaa 9654 <210> 165 <211> 9736 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 165 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccggg 600 tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 660 cttaagcctc aataaagctt gccttgagtg ctcaaagtag tgtgtgcccg tctgttgtgt 720 gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 780 ggcgcccgaa cagggacttg aaagcgaaag taaagccaga ggagatctct cgacgcagga 840 ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 900 aaattttgac tagcggaggc tagaaggaga gagtagggtg cgagagcgtc ggtattaagc 960 gggggagaat tagataaatg ggaaaaaatt cggttaaggc cagggggaaa gaaacaatat 1020 aaactaaaac atatagttag ggcaagcagg gagctagaac gattcgcagt taatcctggc 1080 cttttagaga catcagaagg ctgtagacaa atactgggac agctacaacc atcccttcag 1140 acaggatcag aagaacttag atcattatat aatacaatag cagtcctcta ttgtgtgcat 1200 caaaggatag atgtaaaaga caccaaggaa gccttagata agatagagga agagcaaaac 1260 aaaagtaaga aaaaggcaca gcaagcgatc ttcagacctg gaggaggcag gaggcgatat 1320 gagggacaat tggagaagtg aattatataa atataaagta gtaaaaattg aaccattagg 1380 agtagcaccc accaaggcaa agagaagagt ggtgcagaga gaaaaaagag cagtgggaat 1440 aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcgtcaat 1500 gacgctgacg gtacaggcca gacaattatt gtctgatata gtgcagcagc agaacaattt 1560 gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaaaca 1620 gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcctggggat 1680 ttggggttgc tctggaaaac tcatttgcac cactgctgtg ccttggaatg ctagttggag 1740 taataaatct ctggaacaga tttggaataa catgacctgg atggagtggg acagagaaat 1800 taacaattac acaagcttaa tacactcctt aattgaagaa tcgcaaaacc agcaagaaaa 1860 gaatgaacaa gaattattgg aattagataa atgggcaagt ttgtggaatt ggtttaacat 1920 aacaaattgg ctgtggtata taaaattatt cataatgata gtaggaggct tggtaggttt 1980 aagaatagtt tttgctgtac tttctatagt gaatagagtt aggcagggat attcaccatt 2040 atcgtttcag acccacctcc caatcccgag gggaccacgc gtacaaatgg cagtattcat 2100 ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga 2160 cataatagca acagacatac aaactaaaga attacaaaaa caaattacaa aaattcaaaa 2220 ttttcgggtt tattacaggg acagcagaaa tccactttgg aaagctgagc atccggctcc 2280 ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg 2340 gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg taaactggga aagtgatgtc 2400 gtgtactggc tccgcctttt tcccgagggt gggggagaac cgtatataag tgcagtagtc 2460 gccgtgaacg ttctttttcg caacgggttt gccgccagaa cacaggtaag tgccgtgtgt 2520 ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg aattacttcc 2580 acgcccctgg ctgcagtacg tgattcttga tcccgagctt cgggttggaa gtgggtggga 2640 gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt gcttgagttg aggcctggcc 2700 tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt cgcgcctgtc tcgctgcttt 2760 cgataagtct ctagccattt aaaatttttg atgacctgct gcgacgcttt ttttctggca 2820 agatagtctt gtaaatgcgg gccaagatct gcacactggt atttcggttt ttggggccgc 2880 gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg gcgaggcggg gcctgcgagc 2940 gcggccaccg agaatcggac gggggtagtc tcaagctggc cggcctgctc tggtgcctgg 3000 cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg ctggcccggt cggcaccagt 3060 tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca gggagctcaa aatggaggac 3120 gcggcgctcg ggagagcggg cgggtgagtc acccacacaa aggaaaaggg cctttccgtc 3180 ctcagccgtc gcttcatgtg actccacgga gtaccgggcg ccgtccaggc acctcgatta 3240 gttctcgagc ttttggagta cgtcgtcttt aggttggggg gaggggtttt atgcgatgga 3300 gtttccccac actgagtggg tggagactga agttaggcca gcttggcact tgatgtaatt 3360 ctccttggaa tttgcccttt ttgagtttgg atcttggttc attctcaagc ctcagacagt 3420 ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa ctacccctct agagccgcca 3480 ccatgcttct cctggtgaca agccttctgc tctgtgagtt accacaccca gcattcctcc 3540 tgatcccaga catccagatg acacagacta catcctccct gtctgcctct ctgggagaca 3600 gagtcaccat cagttgcagg gcaagtcagg acattagtaa atatttaaat tggtatcagc 3660 agaaaccaga tggaactgtt aaactcctga tctaccatac atcaagatta cactcaggag 3720 tcccatcaag gttcagtggc agtgggtctg gaacagatta ttctctcacc attagcaacc 3780 tggagcaaga agatattgcc acttactttt gccaacaggg taatacgctt ccgtacacgt 3840 tcggaggggg gactaagttg gaaataacag gaggtggagg ttctggtgga ggaggttcag 3900 gaggtggtgg aagtgaggtg aaactgcagg agtcaggacc tggcctggtg gcgccctcac 3960 agagcctgtc cgtcacatgc actgtctcag gggtctcatt acccgactat ggtgtaagct 4020 ggattcgcca gcctccacga aagggtctgg agtggctggg agtaatatgg ggtagtgaaa 4080 ccacatacta taattcagct ctcaaatcca gactgaccat catcaaggac aactccaaga 4140 gccaagtttt cttaaaaatg aacagtctgc aaactgatga cacagccatt tactactgtg 4200 ccaaacatta ttactacggt ggtagctatg ctatggacta ctggggtcaa ggaacctcag 4260 tcaccgtctc ctcaggaatt cagaaccctg agcctgccgt gtaccagctg aaggacccta 4320 gaagccagga cagcaccctg tgcctgttca ccgacttcga cagccagatc aacgtgccca 4380 agaccatgga aagcggcacc ttcatcaccg ataagactgt gctggacatg aaggccatgg 4440 acagcaagag caacggcgcc attgcttggt ccaatcagac cagctttacc tgccaagaca 4500 tcttcaaaga gacaaacgcc acctacccca gttcagacgt tccctgtgat gccacgttga 4560 ctgagaaaag ctttgaaaca gatatgaacc taaactttca aaacctgtca gttatgggac 4620 tccgaatcct cctgctgaaa gtagccggat ttaacctgct catgacgctg aggctgtggt 4680 ccagtggcag cggcgagggc agaggaagtc tgctaacatg cggtgacgtc gaggagaatc 4740 ctggacctga tctgagaaat gtgactccac ccaaggtctc cttgtttgag ccatcaaaag 4800 cagagattgc aaacaaacaa aaggctaccc tcgtgtgctt ggccaggggc ttcttccctg 4860 accacgtgga gctgagctgg tgggtgaatg gcaaggaggt ccacagtggg gtcagcacgg 4920 accctcaggc ctacaaggag agcaattata gctactgcct gagcagccgc ctgagggtct 4980 ctgctacctt ctggcacaat cctcgcaacc acttccgctg ccaagtgcag ttccatgggc 5040 tttcagagga ggacaagtgg ccagagggct cacccaaacc tgtcacacag aacatcagtg 5100 cagaggcctg gggtcgagca gactgtggta ttacctcagc atcctatcaa caaggagtct 5160 tgtctgccac catcctctat gagatcctgc tagggaaagc caccctgtat gctgtgcttg 5220 tcagtacact ggtggtgatg gctatggtca aaagaaagaa ttcatgagat atcgagcatc 5280 ttaccgccat ttatacccat atttgttctg tttttcttga tttgggtata catttaaatg 5340 ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt 5400 caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc 5460 ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg 5520 ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt 5580 cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg 5640 agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc 5700 ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc 5760 tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta 5820 ggttgctggg cactgataat tccgtggtgt tgtcagtact ggtaccttta agaccaatga 5880 cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 5940 taattcactc ccaaagaaga caagatctgc tttttgcctg tactgggtct ctctggttag 6000 accagatctg agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat 6060 aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac tctggtaact 6120 agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcatgatc ataatcaagc 6180 catatcacat ctgtagaggt ttacttgctt taaaaaacct ccacacctcc ccctgaacct 6240 gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta 6300 caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 6360 ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgcg tcgacacgaa 6420 gagacgactg actgactgac tggaaagagg aagggctgga agaggaagga gcttgatcca 6480 gatcccgatc tcgatccaga tccggatcgc agcttggcgt aatcatggtc atagctgttt 6540 cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 6600 tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 6660 cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 6720 gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 6780 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 6840 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 6900 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 6960 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7020 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7080 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7140 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7200 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7260 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7320 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 7380 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 7440 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 7500 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 7560 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 7620 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 7680 tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 7740 tcatccatag ttgcctgact ccccgtcgtt gctaggttac tgtcatgagc ggatacatat 7800 ttgaatgtat ttagaaaaat aaacaaaaga gtttgtagaa acgcaaaaag gccatccgtc 7860 aggatggcct tctgcttaat ttgatcggtg gcagtttatg gcgggcgtcc tgcccgccac 7920 cctccgggcc gttgcttcgc aacgttcaaa tccgctcccg gcggatttgt cctactcagg 7980 agagcgttca ccgacaaaca acagataaaa cgaaaggccc agtctttcga ctgagccttt 8040 cgttttattt gatgcctggc agttccctac tctcgcatgg gttgcggccg cccgggccgt 8100 cgaccaattc tcatgtttga cagcttatca tcgaatttct gccattcatc cgcttattat 8160 cacttattca ggcgtagcaa ccaggcgttt aagggcacca ataactgcct taaaaaaatt 8220 acgccccgcc ctgccactca tcgcagtact gttgtaattc attaagcatt ctgccgacat 8280 ggaagccatc acaaacggca tgatgaacct gaatcgccag cggcatcagc accttgtcgc 8340 cttgcgtata atatttgccc atggtgaaaa cgggggcgaa gaagttgtcc atattggcca 8400 cgtttaaatc aaaactggtg aaactcaccc agggattggc tgagacgaaa aacatattct 8460 caataaaccc tttagggaaa taggccaggt tttcaccgta acacgccaca tcttgcgaat 8520 atatgtgtag aaactgccgg aaatcgtcgt ggtattcact ccagagcgat gaaaacgttt 8580 cagtttgctc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 8640 cgtctttcat tgccatacga aattccggat gagcattcat caggcgggca agaatgtgaa 8700 taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 8760 ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 8820 ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 8880 tagcttcctt agctcctgaa aatctcgata actcaaaaaa tacgcccggt agtgatctta 8940 tttcattatg gtgaaagttg gaacctctta cgtgccgatc aacgtctcat tttcgccaaa 9000 agtgacatta acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc 9060 gagatagagt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 9120 tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 9180 cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 9240 agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 9300 aaagcgaaag gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 9360 accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta 9420 tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9480 cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9540 agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9600 agtcacgacg ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga 9660 tccagatcga attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg 9720 tctcaacctc ctaggg 9736 <210> 166 <211> 9290 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (7522)..(7522) <223> a, c, t, g, unknown or other <400> 166 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 360 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 420 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 480 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 540 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 600 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 660 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 720 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 780 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 840 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 900 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 960 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1020 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1080 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1140 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1200 gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1260 tcgttgctag gttactgtca tgagcggata catatttgaa tgtatttaga aaaataaaca 1320 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 1380 cggtggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 1440 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 1500 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 1560 cctactctcg catgggttgc ggccgcccgg gccgtcgacc aattctcatg tttgacagct 1620 tatcatcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaaccagg 1680 cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca 1740 gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaaa cggcatgatg 1800 aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt 1860 gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact 1920 cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc 1980 caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc 2040 gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta 2100 acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca tacgaaattc 2160 cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt 2220 atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt 2280 acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc 2340 aacggtggta tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct 2400 cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc 2460 tcttacgtgc cgatcaacgt ctcattttcg ccaaaagtga cattaaccta taaaaatagg 2520 cgtatcacga ggccagcttg ggaaaccata agaccgagat agagttgagt gttgttccag 2580 tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg 2640 tctatcaggg cgatggccca ctacgtgaac catcacccaa atcaagtttt ttggggtcga 2700 ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg 2760 gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg 2820 cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc 2880 cgctacaggg cgcgtactat ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg 2940 cgtaaggaga aaatacatcg tgatccggat caagatccag atcgaattgg aggctacagt 3000 cagtggagag gactttcact gactgactga ctgcgtctca acctcctagg ggacattgat 3060 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 3120 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 3180 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 3240 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 3300 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 3360 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 3420 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3480 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3540 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3600 ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgg gtctctctgg 3660 ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 3720 caataaagct tgccttgagt gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt 3780 aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 3840 acagggactt gaaagcgaaa gtaaagccag aggagatctc tcgacgcagg actcggcttg 3900 ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 3960 ctagcggagg ctagaaggag agagtagggt gcgagagcgt cggtattaag cgggggagaa 4020 ttagataaat gggaaaaaat tcggttaagg ccagggggaa agaaacaata taaactaaaa 4080 catatagtta gggcaagcag ggagctagaa cgattcgcag ttaatcctgg ccttttagag 4140 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 4200 gaagaactta gatcattata taatacaata gcagtcctct attgtgtgca tcaaaggata 4260 gatgtaaaag acaccaagga agccttagat aagatagagg aagagcaaaa caaaagtaag 4320 aaaaaggcac agcaagcgat cttcagacct ggaggaggca ggaggcgata tgagggacaa 4380 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 4440 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 4500 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 4560 ggtacaggcc agacaattat tgtctgatat agtgcagcag cagaacaatt tgctgagggc 4620 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaaac agctccaggc 4680 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 4740 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 4800 tctggaacag atttggaata acatgacctg gatggagtgg gacagagaaa ttaacaatta 4860 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 4920 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 4980 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 5040 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 5100 gacccacctc ccaatcccga ggggaccacg cgtacaaatg gcagtattca tccacaattt 5160 taaaagaaaa ggggggattg gggggtacag tgcaggggaa agaatagtag acataatagc 5220 aacagacata caaactaaag aattacaaaa acaaattaca aaaattcaaa attttcgggt 5280 ttattacagg gacagcagaa atccactttg gaaagctgag catccggctc cggtgcccgt 5340 cagtgggcag agcgcacatc gcccacagtc cccgagaagt tggggggagg ggtcggcaat 5400 tgaaccggtg cctagagaag gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg 5460 ctccgccttt ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac 5520 gttctttttc gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc 5580 gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattacttc cacgcccctg 5640 gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg agagttcgag 5700 gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 5760 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 5820 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 5880 tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 5940 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 6000 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 6060 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 6120 ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga cgcggcgctc 6180 gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt cctcagccgt 6240 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctcgag 6300 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 6360 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 6420 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 6480 tttttttctt ccatttcagg tgtcgtgaaa actacccctc agagccgcca ccatgcttct 6540 cctggtgaca agccttctgc tctgtgagtt accacaccca gcattcctcc tgatcccaga 6600 catccagatg acacagacta catcctccct gtctgcctct ctgggagaca gagtcaccat 6660 cagttgcagg gcaagtcagg acattagtaa atatttaaat tggtatcagc agaaaccaga 6720 tggaactgtt aaactcctga tctaccatac atcaagatta cactcaggag tcccatcaag 6780 gttcagtggc agtgggtctg gaacagatta ttctctcacc attagcaacc tggagcaaga 6840 agatattgcc acttactttt gccaacaggg taatacgctt ccgtacacgt tcggaggggg 6900 gactaagttg gaaataacag gctccacctc tggatccggc aagcccggat ctggcgaggg 6960 atccaccaag ggcgaggtga aactgcagga gtcaggacct ggcctggtgg cgccctcaca 7020 gagcctgtcc gtcacatgca ctgtctcagg ggtctcatta cccgactatg gtgtaagctg 7080 gattcgccag cctccacgaa agggtctgga gtggctggga gtaatatggg gtagtgaaac 7140 cacatactat aattcagctc tcaaatccag actgaccatc atcaaggaca actccaagag 7200 ccaagttttc ttaaaaatga acagtctgca aactgatgac acagccattt actactgtgc 7260 caaacattat tactacggtg gtagctatgc tatggactac tggggtcaag gaacctcagt 7320 caccgtctcc tcaattcaga accctgagcc tgccgtgtac cagctgaagg accctagaag 7380 ccaggacagc accctgtgcc tgttcaccga cttcgacagc cagatcaacg tgcccaagac 7440 catggaaagc ggcaccttca tcaccgataa gactgtgctg gacatgaagg ccatggacag 7500 caagagcaac ggcgccattg cntggtccaa tcagaccagc tttacctgcc aagacatctt 7560 caaagagaca aacgccacct accccagttc agacgttccc tgtgatgcca cgttgactga 7620 gaaaagcttt gaaacagata tgaacctaaa ctttcaaaac ctgtcagtta tgggactccg 7680 aatcctcctg ctgaaagtag ccggatttaa cctgctcatg acgctgaggc tgtggtccag 7740 tggcagcggc gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc 7800 tggacctatg ctactacttg tgacctcact attgttatgc gaactccctc atcccgcatt 7860 cttgctgatt ccagatctga gaaatgtgac tccacccaag gtctccttgt ttgagccatc 7920 aaaagcagag attgcaaaca aacaaaaggc taccctcgtg tgcttggcca ggggcttctt 7980 ccctgaccac gtggagctga gctggtgggt gaatggcaag gaggtccaca gtggggtcag 8040 cacggaccct caggcctaca aggagagcaa ttatagctac tgcctgagca gccgcctgag 8100 ggtctctgct accttctggc acaatcctcg caaccacttc cgctgccaag tgcagttcca 8160 tgggctttca gaggaggaca agtggccaga gggctcaccc aaacctgtca cacagaacat 8220 cagtgcagag gcctggggtc gagcagactg tggtattacc tcagcatcct atcaacaagg 8280 agtcttgtct gccaccatcc tctatgagat cctgctaggg aaagccaccc tgtatgctgt 8340 gcttgtcagt acactggtgg tgatggctat ggtcaaaaga aagaattcat gagatatcga 8400 gcatcttacc gccatttata cccatatttg ttctgttttt cttgatttgg gtatacattt 8460 aaatgttaat aaaacaaaat ggtggggcaa tcatttacat ttttagggat atgtaattac 8520 tagttcaggt gtattgccac aagacaaaca tgttaagaaa ctttcccgtt atttacgctc 8580 tgttcctgtt aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa 8640 ctatgttgct ccttttacgc tgtgtggata tgctgcttta tagcctctgt atctagctat 8700 tgcttcccgt acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctctttt 8760 agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc 8820 aacccccact ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt 8880 ccccctcccg atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg 8940 ggctaggttg ctgggcactg ataattccgt ggtgttgtca gtactggtac ctttaagacc 9000 aatgacttac aaggcagctg tagatcttag ccacttttta aaagaaaagg ggggactgga 9060 agggctaatt cactcccaaa gaagacaaga tctgcttttt gcctgtactg ggtctctctg 9120 gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac tgcttaagcc 9180 tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt gtgactctgg 9240 taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 9290 <210> 167 <211> 9350 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (7582)..(7582) <223> a, c, t, g, unknown or other <400> 167 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 360 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 420 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 480 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 540 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 600 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 660 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 720 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 780 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 840 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 900 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 960 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1020 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1080 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1140 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1200 gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1260 tcgttgctag gttactgtca tgagcggata catatttgaa tgtatttaga aaaataaaca 1320 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 1380 cggtggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 1440 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 1500 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 1560 cctactctcg catgggttgc ggccgcccgg gccgtcgacc aattctcatg tttgacagct 1620 tatcatcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaaccagg 1680 cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca 1740 gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaaa cggcatgatg 1800 aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt 1860 gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact 1920 cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc 1980 caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc 2040 gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta 2100 acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca tacgaaattc 2160 cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt 2220 atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt 2280 acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc 2340 aacggtggta tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct 2400 cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc 2460 tcttacgtgc cgatcaacgt ctcattttcg ccaaaagtga cattaaccta taaaaatagg 2520 cgtatcacga ggccagcttg ggaaaccata agaccgagat agagttgagt gttgttccag 2580 tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg 2640 tctatcaggg cgatggccca ctacgtgaac catcacccaa atcaagtttt ttggggtcga 2700 ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg 2760 gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg 2820 cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc 2880 cgctacaggg cgcgtactat ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg 2940 cgtaaggaga aaatacatcg tgatccggat caagatccag atcgaattgg aggctacagt 3000 cagtggagag gactttcact gactgactga ctgcgtctca acctcctagg ggacattgat 3060 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 3120 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 3180 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 3240 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 3300 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 3360 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 3420 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3480 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3540 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3600 ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgg gtctctctgg 3660 ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 3720 caataaagct tgccttgagt gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt 3780 aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 3840 acagggactt gaaagcgaaa gtaaagccag aggagatctc tcgacgcagg actcggcttg 3900 ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 3960 ctagcggagg ctagaaggag agagtagggt gcgagagcgt cggtattaag cgggggagaa 4020 ttagataaat gggaaaaaat tcggttaagg ccagggggaa agaaacaata taaactaaaa 4080 catatagtta gggcaagcag ggagctagaa cgattcgcag ttaatcctgg ccttttagag 4140 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 4200 gaagaactta gatcattata taatacaata gcagtcctct attgtgtgca tcaaaggata 4260 gatgtaaaag acaccaagga agccttagat aagatagagg aagagcaaaa caaaagtaag 4320 aaaaaggcac agcaagcgat cttcagacct ggaggaggca ggaggcgata tgagggacaa 4380 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 4440 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 4500 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 4560 ggtacaggcc agacaattat tgtctgatat agtgcagcag cagaacaatt tgctgagggc 4620 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaaac agctccaggc 4680 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 4740 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 4800 tctggaacag atttggaata acatgacctg gatggagtgg gacagagaaa ttaacaatta 4860 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 4920 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 4980 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 5040 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 5100 gacccacctc ccaatcccga ggggaccacg cgtacaaatg gcagtattca tccacaattt 5160 taaaagaaaa ggggggattg gggggtacag tgcaggggaa agaatagtag acataatagc 5220 aacagacata caaactaaag aattacaaaa acaaattaca aaaattcaaa attttcgggt 5280 ttattacagg gacagcagaa atccactttg gaaagctgag catccggctc cggtgcccgt 5340 cagtgggcag agcgcacatc gcccacagtc cccgagaagt tggggggagg ggtcggcaat 5400 tgaaccggtg cctagagaag gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg 5460 ctccgccttt ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac 5520 gttctttttc gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc 5580 gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattacttc cacgcccctg 5640 gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg agagttcgag 5700 gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 5760 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 5820 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 5880 tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 5940 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 6000 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 6060 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 6120 ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga cgcggcgctc 6180 gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt cctcagccgt 6240 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctcgag 6300 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 6360 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 6420 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 6480 tttttttctt ccatttcagg tgtcgtgaaa actacccctc agagccgcca ccatgcttct 6540 cctggtgaca agccttctgc tctgtgagtt accacaccca gcattcctcc tgatcccaga 6600 catccagatg acacagacta catcctccct gtctgcctct ctgggagaca gagtcaccat 6660 cagttgcagg gcaagtcagg acattagtaa atatttaaat tggtatcagc agaaaccaga 6720 tggaactgtt aaactcctga tctaccatac atcaagatta cactcaggag tcccatcaag 6780 gttcagtggc agtgggtctg gaacagatta ttctctcacc attagcaacc tggagcaaga 6840 agatattgcc acttactttt gccaacaggg taatacgctt ccgtacacgt tcggaggggg 6900 gactaagttg gaaataacag gctccacctc tggatccggc aagcccggat ctggcgaggg 6960 atccaccaag ggcgaggtga aactgcagga gtcaggacct ggcctggtgg cgccctcaca 7020 gagcctgtcc gtcacatgca ctgtctcagg ggtctcatta cccgactatg gtgtaagctg 7080 gattcgccag cctccacgaa agggtctgga gtggctggga gtaatatggg gtagtgaaac 7140 cacatactat aattcagctc tcaaatccag actgaccatc atcaaggaca actccaagag 7200 ccaagttttc ttaaaaatga acagtctgca aactgatgac acagccattt actactgtgc 7260 caaacattat tactacggtg gtagctatgc tatggactac tggggtcaag gaacctcagt 7320 caccgtctcc tcagctgccg caggaggcgg tggcagtggt gggggaggat ctggcggagg 7380 aggtagcttg gaaattcaga accctgagcc tgccgtgtac cagctgaagg accctagaag 7440 ccaggacagc accctgtgcc tgttcaccga cttcgacagc cagatcaacg tgcccaagac 7500 catggaaagc ggcaccttca tcaccgataa gactgtgctg gacatgaagg ccatggacag 7560 caagagcaac ggcgccattg cntggtccaa tcagaccagc tttacctgcc aagacatctt 7620 caaagagaca aacgccacct accccagttc agacgttccc tgtgatgcca cgttgactga 7680 gaaaagcttt gaaacagata tgaacctaaa ctttcaaaac ctgtcagtta tgggactccg 7740 aatcctcctg ctgaaagtag ccggatttaa cctgctcatg acgctgaggc tgtggtccag 7800 tggcagcggc gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc 7860 tggacctatg ctactacttg tgacctcact attgttatgc gaactccctc atcccgcatt 7920 cttgctgatt ccagatctga gaaatgtgac tccacccaag gtctccttgt ttgagccatc 7980 aaaagcagag attgcaaaca aacaaaaggc taccctcgtg tgcttggcca ggggcttctt 8040 ccctgaccac gtggagctga gctggtgggt gaatggcaag gaggtccaca gtggggtcag 8100 cacggaccct caggcctaca aggagagcaa ttatagctac tgcctgagca gccgcctgag 8160 ggtctctgct accttctggc acaatcctcg caaccacttc cgctgccaag tgcagttcca 8220 tgggctttca gaggaggaca agtggccaga gggctcaccc aaacctgtca cacagaacat 8280 cagtgcagag gcctggggtc gagcagactg tggtattacc tcagcatcct atcaacaagg 8340 agtcttgtct gccaccatcc tctatgagat cctgctaggg aaagccaccc tgtatgctgt 8400 gcttgtcagt acactggtgg tgatggctat ggtcaaaaga aagaattcat gagatatcga 8460 gcatcttacc gccatttata cccatatttg ttctgttttt cttgatttgg gtatacattt 8520 aaatgttaat aaaacaaaat ggtggggcaa tcatttacat ttttagggat atgtaattac 8580 tagttcaggt gtattgccac aagacaaaca tgttaagaaa ctttcccgtt atttacgctc 8640 tgttcctgtt aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa 8700 ctatgttgct ccttttacgc tgtgtggata tgctgcttta tagcctctgt atctagctat 8760 tgcttcccgt acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctctttt 8820 agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc 8880 aacccccact ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt 8940 ccccctcccg atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg 9000 ggctaggttg ctgggcactg ataattccgt ggtgttgtca gtactggtac ctttaagacc 9060 aatgacttac aaggcagctg tagatcttag ccacttttta aaagaaaagg ggggactgga 9120 agggctaatt cactcccaaa gaagacaaga tctgcttttt gcctgtactg ggtctctctg 9180 gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac tgcttaagcc 9240 tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt gtgactctgg 9300 taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 9350 <210> 168 <211> 10145 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (7582)..(7582) <223> a, c, t, g, unknown or other <400> 168 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 360 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 420 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 480 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 540 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 600 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 660 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 720 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 780 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 840 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 900 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 960 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1020 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1080 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1140 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1200 gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1260 tcgttgctag gttactgtca tgagcggata catatttgaa tgtatttaga aaaataaaca 1320 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 1380 cggtggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 1440 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 1500 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 1560 cctactctcg catgggttgc ggccgcccgg gccgtcgacc aattctcatg tttgacagct 1620 tatcatcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaaccagg 1680 cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca 1740 gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaaa cggcatgatg 1800 aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt 1860 gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact 1920 cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc 1980 caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc 2040 gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta 2100 acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca tacgaaattc 2160 cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt 2220 atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt 2280 acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc 2340 aacggtggta tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct 2400 cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc 2460 tcttacgtgc cgatcaacgt ctcattttcg ccaaaagtga cattaaccta taaaaatagg 2520 cgtatcacga ggccagcttg ggaaaccata agaccgagat agagttgagt gttgttccag 2580 tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg 2640 tctatcaggg cgatggccca ctacgtgaac catcacccaa atcaagtttt ttggggtcga 2700 ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg 2760 gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg 2820 cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc 2880 cgctacaggg cgcgtactat ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg 2940 cgtaaggaga aaatacatcg tgatccggat caagatccag atcgaattgg aggctacagt 3000 cagtggagag gactttcact gactgactga ctgcgtctca acctcctagg ggacattgat 3060 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 3120 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 3180 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 3240 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 3300 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 3360 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 3420 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3480 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3540 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3600 ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgg gtctctctgg 3660 ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 3720 caataaagct tgccttgagt gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt 3780 aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 3840 acagggactt gaaagcgaaa gtaaagccag aggagatctc tcgacgcagg actcggcttg 3900 ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 3960 ctagcggagg ctagaaggag agagtagggt gcgagagcgt cggtattaag cgggggagaa 4020 ttagataaat gggaaaaaat tcggttaagg ccagggggaa agaaacaata taaactaaaa 4080 catatagtta gggcaagcag ggagctagaa cgattcgcag ttaatcctgg ccttttagag 4140 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 4200 gaagaactta gatcattata taatacaata gcagtcctct attgtgtgca tcaaaggata 4260 gatgtaaaag acaccaagga agccttagat aagatagagg aagagcaaaa caaaagtaag 4320 aaaaaggcac agcaagcgat cttcagacct ggaggaggca ggaggcgata tgagggacaa 4380 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 4440 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 4500 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 4560 ggtacaggcc agacaattat tgtctgatat agtgcagcag cagaacaatt tgctgagggc 4620 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaaac agctccaggc 4680 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 4740 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 4800 tctggaacag atttggaata acatgacctg gatggagtgg gacagagaaa ttaacaatta 4860 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 4920 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 4980 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 5040 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 5100 gacccacctc ccaatcccga ggggaccacg cgtacaaatg gcagtattca tccacaattt 5160 taaaagaaaa ggggggattg gggggtacag tgcaggggaa agaatagtag acataatagc 5220 aacagacata caaactaaag aattacaaaa acaaattaca aaaattcaaa attttcgggt 5280 ttattacagg gacagcagaa atccactttg gaaagctgag catccggctc cggtgcccgt 5340 cagtgggcag agcgcacatc gcccacagtc cccgagaagt tggggggagg ggtcggcaat 5400 tgaaccggtg cctagagaag gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg 5460 ctccgccttt ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac 5520 gttctttttc gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc 5580 gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattacttc cacgcccctg 5640 gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg agagttcgag 5700 gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 5760 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 5820 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 5880 tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 5940 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 6000 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 6060 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 6120 ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga cgcggcgctc 6180 gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt cctcagccgt 6240 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctcgag 6300 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 6360 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 6420 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 6480 tttttttctt ccatttcagg tgtcgtgaaa actacccctc agagccgcca ccatgcttct 6540 cctggtgaca agccttctgc tctgtgagtt accacaccca gcattcctcc tgatcccaga 6600 catccagatg acacagacta catcctccct gtctgcctct ctgggagaca gagtcaccat 6660 cagttgcagg gcaagtcagg acattagtaa atatttaaat tggtatcagc agaaaccaga 6720 tggaactgtt aaactcctga tctaccatac atcaagatta cactcaggag tcccatcaag 6780 gttcagtggc agtgggtctg gaacagatta ttctctcacc attagcaacc tggagcaaga 6840 agatattgcc acttactttt gccaacaggg taatacgctt ccgtacacgt tcggaggggg 6900 gactaagttg gaaataacag gctccacctc tggatccggc aagcccggat ctggcgaggg 6960 atccaccaag ggcgaggtga aactgcagga gtcaggacct ggcctggtgg cgccctcaca 7020 gagcctgtcc gtcacatgca ctgtctcagg ggtctcatta cccgactatg gtgtaagctg 7080 gattcgccag cctccacgaa agggtctgga gtggctggga gtaatatggg gtagtgaaac 7140 cacatactat aattcagctc tcaaatccag actgaccatc atcaaggaca actccaagag 7200 ccaagttttc ttaaaaatga acagtctgca aactgatgac acagccattt actactgtgc 7260 caaacattat tactacggtg gtagctatgc tatggactac tggggtcaag gaacctcagt 7320 caccgtctcc tcagctgccg caggaggcgg tggcagtggt gggggaggat ctggcggagg 7380 aggtagcttg gaaattcaga accctgagcc tgccgtgtac cagctgaagg accctagaag 7440 ccaggacagc accctgtgcc tgttcaccga cttcgacagc cagatcaacg tgcccaagac 7500 catggaaagc ggcaccttca tcaccgataa gactgtgctg gacatgaagg ccatggacag 7560 caagagcaac ggcgccattg cntggtccaa tcagaccagc tttacctgcc aagacatctt 7620 caaagagaca aacgccacct accccagttc agacgttccc tgtgatgcca cgttgactga 7680 gaaaagcttt gaaacagata tgaacctaaa ctttcaaaac ctgtcagtta tgggactccg 7740 aatcctcctg ctgaaagtag ccggatttaa cctgctcatg acgctgaggc tgtggtccag 7800 tggcagcggc gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc 7860 tggacctatg ctactacttg tgacctcact attgttatgc gaactccctc atcccgcatt 7920 cttgctgatt ccagacattc agatgactca aacaacttcc agcctctccg cctcactcgg 7980 cgaccgcgta acaataagct gtcgggcctc gcaagatatt agtaagtacc tgaattggta 8040 tcagcaaaaa cccgatggta cagtcaagct tctgatctac cataccagtc gtctgcacag 8100 cggtgtcccc agcaggttca gcggctcagg atctggtacc gattattcac tgacgatttc 8160 caaccttgag caggaggaca tcgccaccta cttctgccag cagggtaata ctctgccgta 8220 cacattcggg ggcggtacca agctcgagat cacgggttca acaagcggtt ctggcaagcc 8280 aggcagcggc gaggggagta caaaggggga ggtgaagttg caggaaagtg gccctggatt 8340 ggtggccccg agccagagtc tgtctgtcac ctgcacagtt tccggagtaa gtctgcctga 8400 ttacggagtg tcctggatca gacagccacc tcgaaagggc ttggagtggc ttggggtcat 8460 ttggggcagt gaaaccacat actacaacag cgctcttaag tccaggctca ctatcatcaa 8520 ggacaattca aagagccaag tattcttgaa aatgaattcc ctgcagactg atgacaccgc 8580 tatttattat tgcgctaaac attattacta tggaggttct tatgccatgg actactgggg 8640 gcagggtacc tctgtgacag tgagttcagc tgcagctgga ggtggaggta gcggaggcgg 8700 tggtagtgga gggggtggtt ctctggaaga tctgagaaat gtgactccac ccaaggtctc 8760 cttgtttgag ccatcaaaag cagagattgc aaacaaacaa aaggctaccc tcgtgtgctt 8820 ggccaggggc ttcttccctg accacgtgga gctgagctgg tgggtgaatg gcaaggaggt 8880 ccacagtggg gtcagcacgg accctcaggc ctacaaggag agcaattata gctactgcct 8940 gagcagccgc ctgagggtct ctgctacctt ctggcacaat cctcgcaacc acttccgctg 9000 ccaagtgcag ttccatgggc tttcagagga ggacaagtgg ccagagggct cacccaaacc 9060 tgtcacacag aacatcagtg cagaggcctg gggtcgagca gactgtggta ttacctcagc 9120 atcctatcaa caaggagtct tgtctgccac catcctctat gagatcctgc tagggaaagc 9180 caccctgtat gctgtgcttg tcagtacact ggtggtgatg gctatggtca aaagaaagaa 9240 ttcatgagat atcgagcatc ttaccgccat ttatacccat atttgttctg tttttcttga 9300 tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta 9360 gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc 9420 ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt 9480 gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc 9540 tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg 9600 gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc 9660 tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc 9720 tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc 9780 ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt tgtcagtact 9840 ggtaccttta agaccaatga cttacaaggc agctgtagat cttagccact ttttaaaaga 9900 aaagggggga ctggaagggc taattcactc ccaaagaaga caagatctgc tttttgcctg 9960 tactgggtct ctctggttag accagatctg agcctgggag ctctctggct aactagggaa 10020 cccactgctt aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct 10080 gttgtgtgac tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc 10140 tagca 10145 <210> 169 <211> 9735 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (6857)..(6857) <223> a, c, t, g, unknown or other <400> 169 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 60 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 120 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 180 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 240 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 300 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 360 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 420 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 480 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 540 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 600 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 660 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 720 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 780 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagttaat taacttgcgc 840 cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc aattctgatt 900 agaaaaactc atcgagcatc aaatgaaact gcaatttatt cacatcagga ttatcaatac 960 catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 1020 ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 1080 ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 1140 aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 1200 cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 1260 cctgagcaag acgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgaat 1320 gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 1380 cttctaatac ctggaatgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 1440 caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc agccagttta 1500 gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 1560 actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 1620 tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 1680 tcgacgtttc ccgttgaata tggctcataa caccccttgt attactgttt atgtaagcag 1740 acagttttat tgttcatgat gatatatttt tatcttgtgc aatgtaacat cagagatttt 1800 gagacacaac gtggctttcc cccccccccc catgacatta acctataaaa ataggcgtat 1860 cacgaggcca gcttgggaaa ccataagacc gagatagagt tgagtgttgt tccagtttgg 1920 aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 1980 cagggcgatg gcccactacg tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc 2040 cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 2100 ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc taaggcgctg 2160 gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 2220 cagggcgcgt actatggttg ctttgacgta tgcggtgtga aataccgcac agatgcgtaa 2280 ggagaaaata catcgtgatc cggatcaaga tccagatcga attggaggct acagtcagtg 2340 gagaggactt tcactgactg actgactgcg tctcaacctc ctaggggaca ttgattattg 2400 actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 2460 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 2520 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 2580 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 2640 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 2700 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 2760 accatggtga tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg 2820 ggatttccaa gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa 2880 cgggactttc caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt 2940 gtacggtggg aggtctatat aagcagagct cgtttagtga accgggtctc tctggttaga 3000 ccagatctga gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata 3060 aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta 3120 gagatccctc agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg 3180 gacttgaaag cgaaagtaaa gccagaggag atctctcgac gcaggactcg gcttgctgaa 3240 gcgcgcacgg caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc 3300 ggaggctaga aggagagagt agggtgcgag agcgtcggta ttaagcgggg gagaattaga 3360 taaatgggaa aaaattcggt taaggccagg gggaaagaaa caatataaac taaaacatat 3420 agttagggca agcagggagc tagaacgatt cgcagttaat cctggccttt tagagacatc 3480 agaaggctgt agacaaatac tgggacagct acaaccatcc cttcagacag gatcagaaga 3540 acttagatca ttatataata caatagcagt cctctattgt gtgcatcaaa ggatagatgt 3600 aaaagacacc aaggaagcct tagataagat agaggaagag caaaacaaaa gtaagaaaaa 3660 ggcacagcaa gcgatcttca gacctggagg aggcaggagg cgatatgagg gacaattgga 3720 gaagtgaatt atataaatat aaagtagtaa aaattgaacc attaggagta gcacccacca 3780 aggcaaagag aagagtggtg cagagagaaa aaagagcagt gggaatagga gctttgttcc 3840 ttgggttctt gggagcagca ggaagcacta tgggcgcagc gtcaatgacg ctgacggtac 3900 aggccagaca attattgtct gatatagtgc agcagcagaa caatttgctg agggctattg 3960 aggcgcaaca gcatctgttg caactcacag tctggggcat caaacagctc caggcaagaa 4020 tcctggctgt ggaaagatac ctaaaggatc aacagctcct ggggatttgg ggttgctctg 4080 gaaaactcat ttgcaccact gctgtgcctt ggaatgctag ttggagtaat aaatctctgg 4140 aacagatttg gaataacatg acctggatgg agtgggacag agaaattaac aattacacaa 4200 gcttaataca ctccttaatt gaagaatcgc aaaaccagca agaaaagaat gaacaagaat 4260 tattggaatt agataaatgg gcaagtttgt ggaattggtt taacataaca aattggctgt 4320 ggtatataaa attattcata atgatagtag gaggcttggt aggtttaaga atagtttttg 4380 ctgtactttc tatagtgaat agagttaggc agggatattc accattatcg tttcagaccc 4440 acctcccaat cccgagggga ccacgcgtac aaatggcagt attcatccac aattttaaaa 4500 gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 4560 acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 4620 acagggacag cagaaatcca ctttggaaag ctgagcatcc ggctccggtg cccgtcagtg 4680 ggcagagcgc acatcgccca cagtccccga gaagttgggg ggaggggtcg gcaattgaac 4740 cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt gatgtcgtgt actggctccg 4800 cctttttccc gagggtgggg gagaaccgta tataagtgca gtagtcgccg tgaacgttct 4860 ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc gtgtgtggtt cccgcgggcc 4920 tggcctcttt acgggttatg gcccttgcgt gccttgaatt acttccacgc ccctggctgc 4980 agtacgtgat tcttgatccc gagcttcggg ttggaagtgg gtgggagagt tcgaggcctt 5040 gcgcttaagg agccccttcg cctcgtgctt gagttgaggc ctggcctggg cgctggggcc 5100 gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc tgctttcgat aagtctctag 5160 ccatttaaaa tttttgatga cctgctgcga cgcttttttt ctggcaagat agtcttgtaa 5220 atgcgggcca agatctgcac actggtattt cggtttttgg ggccgcgggc ggcgacgggg 5280 cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct gcgagcgcgg ccaccgagaa 5340 tcggacgggg gtagtctcaa gctggccggc ctgctctggt gcctggcctc gcgccgccgt 5400 gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc accagttgcg tgagcggaaa 5460 gatggccgct tcccggccct gctgcaggga gctcaaaatg gaggacgcgg cgctcgggag 5520 agcgggcggg tgagtcaccc acacaaagga aaagggcctt tccgtcctca gccgtcgctt 5580 catgtgactc cacggagtac cgggcgccgt ccaggcacct cgattagttc tcgagctttt 5640 ggagtacgtc gtctttaggt tggggggagg ggttttatgc gatggagttt ccccacactg 5700 agtgggtgga gactgaagtt aggccagctt ggcacttgat gtaattctcc ttggaatttg 5760 ccctttttga gtttggatct tggttcattc tcaagcctca gacagtggtt caaagttttt 5820 ttcttccatt tcaggtgtcg tgaaaactac ccctcagagc cgccaccatg cttctcctgg 5880 tgacaagcct tctgctctgt gagttaccac acccagcatt cctcctgatc ccagacatcc 5940 agatgacaca gactacatcc tccctgtctg cctctctggg agacagagtc accatcagtt 6000 gcagggcaag tcaggacatt agtaaatatt taaattggta tcagcagaaa ccagatggaa 6060 ctgttaaact cctgatctac catacatcaa gattacactc aggagtccca tcaaggttca 6120 gtggcagtgg gtctggaaca gattattctc tcaccattag caacctggag caagaagata 6180 ttgccactta cttttgccaa cagggtaata cgcttccgta cacgttcgga ggggggacta 6240 agttggaaat aacaggctcc acctctggat ccggcaagcc cggatctggc gagggatcca 6300 ccaagggcga ggtgaaactg caggagtcag gacctggcct ggtggcgccc tcacagagcc 6360 tgtccgtcac atgcactgtc tcaggggtct cattacccga ctatggtgta agctggattc 6420 gccagcctcc acgaaagggt ctggagtggc tgggagtaat atggggtagt gaaaccacat 6480 actataattc agctctcaaa tccagactga ccatcatcaa ggacaactcc aagagccaag 6540 ttttcttaaa aatgaacagt ctgcaaactg atgacacagc catttactac tgtgccaaac 6600 attattacta cggtggtagc tatgctatgg actactgggg tcaaggaacc tcagtcaccg 6660 tctcctcaat tcagaaccct gagcctgccg tgtaccagct gaaggaccct agaagccagg 6720 acagcaccct gtgcctgttc accgacttcg acagccagat caacgtgccc aagaccatgg 6780 aaagcggcac cttcatcacc gataagactg tgctggacat gaaggccatg gacagcaaga 6840 gcaacggcgc cattgcntgg tccaatcaga ccagctttac ctgccaagac atcttcaaag 6900 agacaaacgc cacctacccc agttcagacg ttccctgtga tgccacgttg actgagaaaa 6960 gctttgaaac agatatgaac ctaaactttc aaaacctgtc agttatggga ctccgaatcc 7020 tcctgctgaa agtagccgga tttaacctgc tcatgacgct gaggctgtgg tccagtggca 7080 gcggcgctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 7140 ctatgctact acttgtgacc tcactattgt tatgcgaact ccctcatccc gcattcttgc 7200 tgattccaga cattcagatg actcaaacaa cttccagcct ctccgcctca ctcggcgacc 7260 gcgtaacaat aagctgtcgg gcctcgcaag atattagtaa gtacctgaat tggtatcagc 7320 aaaaacccga tggtacagtc aagcttctga tctaccatac cagtcgtctg cacagcggtg 7380 tccccagcag gttcagcggc tcaggatctg gtaccgatta ttcactgacg atttccaacc 7440 ttgagcagga ggacatcgcc acctacttct gccagcaggg taatactctg ccgtacacat 7500 tcgggggcgg taccaagctc gagatcacgg gttcaacaag cggttctggc aagccaggca 7560 gcggcgaggg gagtacaaag ggggaggtga agttgcagga aagtggccct ggattggtgg 7620 ccccgagcca gagtctgtct gtcacctgca cagtttccgg agtaagtctg cctgattacg 7680 gagtgtcctg gatcagacag ccacctcgaa agggcttgga gtggcttggg gtcatttggg 7740 gcagtgaaac cacatactac aacagcgctc ttaagtccag gctcactatc atcaaggaca 7800 attcaaagag ccaagtattc ttgaaaatga attccctgca gactgatgac accgctattt 7860 attattgcgc taaacattat tactatggag gttcttatgc catggactac tgggggcagg 7920 gtacctctgt gacagtgagt tcagatctga gaaatgtgac tccacccaag gtctccttgt 7980 ttgagccatc aaaagcagag attgcaaaca aacaaaaggc taccctcgtg tgcttggcca 8040 ggggcttctt ccctgaccac gtggagctga gctggtgggt gaatggcaag gaggtccaca 8100 gtggggtcag cacggaccca caggcctaca aggagagcaa ttatagctac tgcctgagca 8160 gccgcctgag ggtctctgct accttctggc acaatcctcg caaccacttc cgctgccaag 8220 tgcagttcca tgggctttca gaggaggaca agtggccaga gggctcaccc aaacctgtca 8280 cacagaacat cagtgcagag gcctggggtc gagcagactg tggtattacc tcagcatcct 8340 atcaacaagg agtcttgtct gccaccatcc tctatgagat cctgctaggg aaagccaccc 8400 tgtatgctgt gcttgtcagt acactggtgg tgatggctat ggtcaaaaga aagaattcat 8460 gagatatcga gcatcttacc gccatttata cccatatttg ttctgttttt cttgatttgg 8520 gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat ttttagggat 8580 atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa ctttcccgtt 8640 atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa agattgactg 8700 atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta tagcctctgt 8760 atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa tcctggttgc 8820 tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt 8880 ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc ctttctggga 8940 ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc cttgcccgct 9000 gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtca gtactggtac 9060 ctttaagacc aatgacttac aaggcagctg tagatcttag ccacttttta aaagaaaagg 9120 ggggactgga agggctaatt cactcccaaa gaagacaaga tctgcttttt gcctgtactg 9180 ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 9240 tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 9300 gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 9360 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 9420 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 9480 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 9540 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 9600 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 9660 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 9720 ttcctcgctc actga 9735 <210> 170 <211> 8877 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 170 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 5280 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 5340 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 5400 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 5460 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 5520 acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga tccggcaagc 5580 ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca ggacctggcc 5640 tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc tcattacccg 5700 actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa 5760 tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg accatcatca 5820 aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact gatgacacag 5880 ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg gactactggg 5940 gtcaaggaac ctcagtcacc gtctcctcag gatggggtag agcagactgt ggctttacct 6000 cggtgtccta ccagcaaggg gtcctgtctg ccaccatcct ctatgagatc ctgctaggga 6060 aggccaccct gtatgctgtg ctggtcagcg cccttgtgtt gatggccatg gtcaagagaa 6120 aggatttctg agatatcgag catcttaccg ccatttatac ccatatttgt tctgtttttc 6180 ttgatttggg tatacattta aatgttaata aaacaaaatg gtggggcaat catttacatt 6240 tttagggata tgtaattact agttcaggtg tattgccaca agacaaacat gttaagaaac 6300 tttcccgtta tttacgctct gttcctgtta atcaacctct ggattacaaa atttgtgaaa 6360 gattgactga tattcttaac tatgttgctc cttttacgct gtgtggatat gctgctttat 6420 agcctctgta tctagctatt gcttcccgta cggctttcgt tttctcctcc ttgtataaat 6480 cctggttgct gtctctttta gaggagttgt ggcccgttgt ccgtcaacgt ggcgtggtgt 6540 gctctgtgtt tgctgacgca acccccactg gctggggcat tgccaccacc tgtcaactcc 6600 tttctgggac tttcgctttc cccctcccga tcgccacggc agaactcatc gccgcctgcc 6660 ttgcccgctg ctggacaggg gctaggttgc tgggcactga taattccgtg gtgttgtcag 6720 tactggtacc tttaagacca atgacttaca aggcagctgt agatcttagc cactttttaa 6780 aagaaaaggg gggactggaa gggctaattc actcccaaag aagacaagat ctgctttttg 6840 cctgtactgg gtctctctgg ttagaccaga tctgagcctg ggagctctct ggctaactag 6900 ggaacccact gcttaagcct caataaagct tgccttgagt gcttcaatga tcataatcaa 6960 gccatatcac atctgtagag gtttacttgc tttaaaaaac ctccacacct ccccctgaac 7020 ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt 7080 tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 7140 agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg cgtcgacacg 7200 aagagacgac tgactgactg actggaaaga ggaagggctg gaagaggaag gagcttgatc 7260 cagatcccga tctcgatcca gatccggatc gcagcttggc gtaatcatgg tcatagctgt 7320 ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 7380 agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 7440 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 7500 cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 7560 gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 7620 ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca 7680 ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 7740 atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 7800 aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 7860 gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 7920 ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 7980 ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 8040 acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 8100 gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 8160 ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 8220 ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 8280 gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 8340 ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 8400 agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 8460 ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 8520 gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 8580 catctggccc cagtgctgca atgataccgc agcttgggaa accataagag ctgaagccag 8640 ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 8700 gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 8760 ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 8820 tggtcatgag cttgcgccgt cccgtcaagt cagcgtaatg ctctgccagt gttacaa 8877 <210> 171 <211> 8919 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 171 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 5280 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 5340 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 5400 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 5460 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 5520 acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga tccggcaagc 5580 ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca ggacctggcc 5640 tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc tcattacccg 5700 actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa 5760 tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg accatcatca 5820 aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact gatgacacag 5880 ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg gactactggg 5940 gtcaaggaac ctcagtcacc gtctcctcag cagctgcagg aggtggaggt agtggtggtg 6000 gaggttctgg aggtggaggt agtctagaat gtggctttac ctcggtgtcc taccagcaag 6060 gggtcctgtc tgccaccatc ctctatgaga tcctgctagg gaaggccacc ctgtatgctg 6120 tgctggtcag cgcccttgtg ttgatggcca tggtcaagag aaaggatttc tgagatatcg 6180 agcatcttac cgccatttat acccatattt gttctgtttt tcttgatttg ggtatacatt 6240 taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta 6300 ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct 6360 ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta 6420 actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta 6480 ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt 6540 tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg 6600 caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt 6660 tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag 6720 gggctaggtt gctgggcact gataattccg tggtgttgtc agtactggta cctttaagac 6780 caatgactta caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg 6840 aagggctaat tcactcccaa agaagacaag atctgctttt tgcctgtact gggtctctct 6900 ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc 6960 ctcaataaag cttgccttga gtgcttcaat gatcataatc aagccatatc acatctgtag 7020 aggtttactt gctttaaaaa acctccacac ctccccctga acctgaaaca taaaatgaat 7080 gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 7140 atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 7200 ctcatcaatg tatcttatca tgtctggatc tgcgtcgaca cgaagagacg actgactgac 7260 tgactggaaa gaggaagggc tggaagagga aggagcttga tccagatccc gatctcgatc 7320 cagatccgga tcgcagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 7380 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 7440 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 7500 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 7560 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 7620 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 7680 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 7740 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7800 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7860 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7920 tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 7980 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8040 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8100 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8160 tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 8220 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 8280 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 8340 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 8400 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 8460 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 8520 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 8580 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 8640 caatgatacc gcagcttggg aaaccataag agctgaagcc agttaccttc ggaaaaagag 8700 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 8760 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 8820 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agcttgcgcc 8880 gtcccgtcaa gtcagcgtaa tgctctgcca gtgttacaa 8919 <210> 172 <211> 9255 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 172 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 5280 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 5340 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 5400 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 5460 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 5520 acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga tccggcaagc 5580 ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca ggacctggcc 5640 tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc tcattacccg 5700 actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa 5760 tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg accatcatca 5820 aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact gatgacacag 5880 ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg gactactggg 5940 gtcaaggaac ctcagtcacc gtctcctcag gagtagagga cctgaacaag gtgttcccac 6000 ccgaggtcgc tgtgtttgag ccatcagaag cagagatctc ccacacccaa aaggccactc 6060 tagtatgtct agctacaggc ttcttccctg accacgtgga gctgagctgg tgggtgaatg 6120 ggaaggaggt gcacagtggg gtcagcacgg acccgcagcc acttaaagaa cagccagctc 6180 tcaatgactc cagatactgt ctaagcagtc gacttagagt ctcggctaca ttttggcaaa 6240 atcctcgaaa ccacttccgc tgtcaagtcc agttctacgg gctctcggag aatgacgagt 6300 ggacccagga tagggccaaa cccgtcaccc agatcgtcag cgccgaggcc tggggtagag 6360 cagactgtgg ctttacctcg gtgtcctacc agcaaggggt cctgtctgcc accatcctct 6420 atgagatcct gctagggaag gccaccctgt atgctgtgct ggtcagcgcc cttgtgttga 6480 tggccatggt caagagaaag gatttctgag atatcgagca tcttaccgcc atttataccc 6540 atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt 6600 ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag 6660 acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg 6720 attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 6780 gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt 6840 tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc 6900 gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 6960 ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 7020 aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 7080 attccgtggt gttgtcagta ctggtacctt taagaccaat gacttacaag gcagctgtag 7140 atcttagcca ctttttaaaa gaaaaggggg gactggaagg gctaattcac tcccaaagaa 7200 gacaagatct gctttttgcc tgtactgggt ctctctggtt agaccagatc tgagcctggg 7260 agctctctgg ctaactaggg aacccactgc ttaagcctca ataaagcttg ccttgagtgc 7320 ttcaatgatc ataatcaagc catatcacat ctgtagaggt ttacttgctt taaaaaacct 7380 ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt taacttgttt 7440 attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca 7500 tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc 7560 tggatctgcg tcgacacgaa gagacgactg actgactgac tggaaagagg aagggctgga 7620 agaggaagga gcttgatcca gatcccgatc tcgatccaga tccggatcgc agcttggcgt 7680 aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca 7740 tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat 7800 taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt 7860 aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 7920 cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 7980 aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 8040 aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 8100 tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 8160 caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 8220 cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 8280 ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 8340 gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 8400 agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 8460 gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 8520 acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 8580 gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 8640 gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 8700 cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 8760 caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 8820 gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 8880 cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 8940 cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcag cttgggaaac 9000 cataagagct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 9060 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 9120 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 9180 actcacgtta agggattttg gtcatgagct tgcgccgtcc cgtcaagtca gcgtaatgct 9240 ctgccagtgt tacaa 9255 <210> 173 <211> 8829 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 173 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccaggtaag cctatcccta accctctcct cggtctcgat tctacgggat 5280 gcgacgtaaa actggtggaa aagtccttcg agactgatac aaacttgaac tttcaaaact 5340 tgagcgtgat cggctttcgg atattgctgc tcaaggtggc cggtttcaat ctgctgatga 5400 cacttaggct ttggtcgtcc ggcagcggcg agggcagagg aagtctgcta acatgcggtg 5460 acgtcgagga gaatcctggc ccaatgaccg agtacaagcc cacggtgcgc ctcgccaccc 5520 gcgacgacgt ccccagggcc gtacgcaccc tcgccgccgc gttcgccgac taccccgcca 5580 cgcgccacac cgtcgatccg gaccgccaca tcgagcgggt caccgagctg caagaactct 5640 tcctcacgcg cgtcgggctc gacatcggca aggtgtgggt cgcggacgac ggcgccgcgg 5700 tggcggtctg gaccacgccg gagagcgtcg aagcgggggc ggtgttcgcc gagatcggcc 5760 cgcgcatggc cgagttgagc ggttcccggc tggccgcgca gcaacagatg gaaggcctcc 5820 tggcgccgca ccggcccaag gagcccgcgt ggttcctggc caccgtcggc gtctcgcccg 5880 accaccaggg caagggtctg ggcagcgccg tcgtgctccc cggagtggag gcggccgagc 5940 gcgccggggt gcccgccttc ctggagacct ccgcgccccg caacctcccc ttctacgagc 6000 ggctcggctt caccgtcacc gccgacgtcg aggtgcccga aggaccgcgc acctggtgca 6060 tgacccgcaa gcccggtgcc tgagatatcg agcatcttac cgccatttat acccatattt 6120 gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca 6180 atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac 6240 atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca 6300 aaatttgtga aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat 6360 atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct 6420 ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac 6480 gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca 6540 cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca 6600 tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg 6660 tggtgttgtc agtactggta cctttaagac caatgactta caaggcagct gtagatctta 6720 gccacttttt aaaagaaaag gggggactgg aagggctaat tcactcccaa agaagacaag 6780 atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6840 ctggctaact agggaaccca ctgcttaagc ctcaataaag cttgccttga gtgcttcaat 6900 gatcataatc aagccatatc acatctgtag aggtttactt gctttaaaaa acctccacac 6960 ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 7020 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 7080 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 7140 tgcgtcgaca cgaagagacg actgactgac tgactggaaa gaggaagggc tggaagagga 7200 aggagcttga tccagatccc gatctcgatc cagatccgga tcgcagcttg gcgtaatcat 7260 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 7320 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 7380 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 7440 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 7500 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 7560 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 7620 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 7680 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 7740 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 7800 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 7860 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 7920 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 7980 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 8040 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 8100 gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 8160 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 8220 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 8280 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 8340 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 8400 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 8460 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 8520 gggagggctt accatctggc cccagtgctg caatgatacc gcagcttggg aaaccataag 8580 agctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 8640 ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 8700 ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 8760 gttaagggat tttggtcatg agcttgcgcc gtcccgtcaa gtcagcgtaa tgctctgcca 8820 gtgttacaa 8829 <210> 174 <211> 9090 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 174 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccaggtaag cctatcccta accctctcct cggtctcgat tctacgggag 5280 ctgtgtacca gctcagggat tccaagagtt cagataagtc agtgtgcctg ttcaccgact 5340 ttgatagtca gaccaatgtc tcacagtcta aagactcgga tgtgtacatc accgataaga 5400 cagtcctcga catgcgaagc atggatttta agagtaattc agccgtggcc tggtccaaca 5460 agtcagattt cgcctgcgcc aacgccttca ataactcaat cattcccgaa gatacatttt 5520 tcccctcccc cgagtcttcg tgtgatgtta aacttgtgga gaaatctttc gaaactgata 5580 caaacctcaa tttccagaac ttgagcgtca taggatttag aatcctcctc ttaaaggttg 5640 ctggctttaa cttactgatg acactccgac tctggagctc cggcagcggc gagggcagag 5700 gaagtctgct aacatgcggt gacgtcgagg agaatcctgg cccaatgacc gagtacaagc 5760 ccacggtgcg cctcgccacc cgcgacgacg tccccagggc cgtacgcacc ctcgccgccg 5820 cgttcgccga ctaccccgcc acgcgccaca ccgtcgatcc ggaccgccac atcgagcggg 5880 tcaccgagct gcaagaactc ttcctcacgc gcgtcgggct cgacatcggc aaggtgtggg 5940 tcgcggacga cggcgccgcg gtggcggtct ggaccacgcc ggagagcgtc gaagcggggg 6000 cggtgttcgc cgagatcggc ccgcgcatgg ccgagttgag cggttcccgg ctggccgcgc 6060 agcaacagat ggaaggcctc ctggcgccgc accggcccaa ggagcccgcg tggttcctgg 6120 ccaccgtcgg cgtctcgccc gaccaccagg gcaagggtct gggcagcgcc gtcgtgctcc 6180 ccggagtgga ggcggccgag cgcgccgggg tgcccgcctt cctggagacc tccgcgcccc 6240 gcaacctccc cttctacgag cggctcggct tcaccgtcac cgccgacgtc gaggtgcccg 6300 aaggaccgcg cacctggtgc atgacccgca agcccggtgc ctgagatatc gagcatctta 6360 ccgccattta tacccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 6420 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 6480 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 6540 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 6600 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 6660 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 6720 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 6780 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 6840 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 6900 tgctgggcac tgataattcc gtggtgttgt cagtactggt acctttaaga ccaatgactt 6960 acaaggcagc tgtagatctt agccactttt taaaagaaaa ggggggactg gaagggctaa 7020 ttcactccca aagaagacaa gatctgcttt ttgcctgtac tgggtctctc tggttagacc 7080 agatctgagc ctgggagctc tctggctaac tagggaaccc actgcttaag cctcaataaa 7140 gcttgccttg agtgcttcaa tgatcataat caagccatat cacatctgta gaggtttact 7200 tgctttaaaa aacctccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 7260 gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 7320 ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 7380 gtatcttatc atgtctggat ctgcgtcgac acgaagagac gactgactga ctgactggaa 7440 agaggaaggg ctggaagagg aaggagcttg atccagatcc cgatctcgat ccagatccgg 7500 atcgcagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca 7560 caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag 7620 tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 7680 cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 7740 gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 7800 tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 7860 agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 7920 cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 7980 ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 8040 tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 8100 gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 8160 gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 8220 gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 8280 ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 8340 ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 8400 ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 8460 gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 8520 ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 8580 tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 8640 ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 8700 gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 8760 tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 8820 cgcagcttgg gaaaccataa gagctgaagc cagttacctt cggaaaaaga gttggtagct 8880 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 8940 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 9000 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca 9060 agtcagcgta atgctctgcc agtgttacaa 9090 <210> 175 <211> 10011 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 175 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 5280 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 5340 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 5400 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 5460 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 5520 acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga tccggcaagc 5580 ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca ggacctggcc 5640 tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc tcattacccg 5700 actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa 5760 tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg accatcatca 5820 aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact gatgacacag 5880 ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg gactactggg 5940 gtcaaggaac ctcagtcacc gtctcctcag gatggggtag agcagactgt ggctttacct 6000 cggtgtccta ccagcaaggg gtcctgtctg ccaccatcct ctatgagatc ctgctaggga 6060 aggccaccct gtatgctgtg ctggtcagcg cccttgtgtt gatggccatg gtcaagagaa 6120 aggatttcgg gtcaggcgag ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga 6180 atcctggacc tatgcttctc ctggtgacaa gccttctgct ctgtgagtta ccacacccag 6240 cattcctcct gatcccacgc aaagtgtgta acggaatagg tattggtgaa tttaaagact 6300 cactctccat aaatgctacg aatattaaac acttcaaaaa ctgcacctcc atcagtggcg 6360 atctccacat cctgccggtg gcatttaggg gtgactcctt cacacatact cctcctctgg 6420 atccacagga actggatatt ctgaaaaccg taaaggaaat cacagggttt ttgctgattc 6480 aggcttggcc tgaaaacagg acggacctcc atgcctttga gaacctagaa atcatacgcg 6540 gcaggaccaa gcaacatggt cagttttctc ttgcagtcgt cagcctgaac ataacatcct 6600 tgggattacg ctccctcaag gagataagtg atggagatgt gataatttca ggaaacaaaa 6660 atttgtgcta tgcaaataca ataaactgga aaaaactgtt tgggacctcc ggtcagaaaa 6720 ccaaaattat aagcaacaga ggtgaaaaca gctgcaaggc cacaggccag gtctgccatg 6780 ccttgtgctc ccccgagggc tgctggggcc cggagcccag ggactgcgtc tcttgccgga 6840 atgtcagccg aggcagggaa tgcgtggaca agtgcaacct tctggagggt gagccaaggg 6900 agtttgtgga gaactctgag tgcatacagt gccacccaga gtgcctgcct caggccatga 6960 acatcacctg cacaggacgg ggaccagaca actgtatcca gtgtgcccac tacattgacg 7020 gcccccactg cgtcaagacc tgcccggcag gagtcatggg agaaaacaac accctggtct 7080 ggaagtacgc agacgccggc catgtgtgcc acctgtgcca tccaaactgc acctacggat 7140 gcactgggcc aggtcttgaa ggctgtccaa cgaatgggcc taagatcccg tccatcgcca 7200 ctgggatggt gggggccctc ctcttgctgc tggtggtggc cctggggatc ggcctcttca 7260 tgtgagatat cgagcatctt accgccattt atacccatat ttgttctgtt tttcttgatt 7320 tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg 7380 gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc 7440 gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga 7500 ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc 7560 tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt 7620 tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg 7680 tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg 7740 ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc 7800 gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tcagtactgg 7860 tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 7920 aggggggact ggaagggcta attcactccc aaagaagaca agatctgctt tttgcctgta 7980 ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 8040 cactgcttaa gcctcaataa agcttgcctt gagtgcttca atgatcataa tcaagccata 8100 tcacatctgt agaggtttac ttgctttaaa aaacctccac acctccccct gaacctgaaa 8160 cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa 8220 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 8280 ggtttgtcca aactcatcaa tgtatcttat catgtctgga tctgcgtcga cacgaagaga 8340 cgactgactg actgactgga aagaggaagg gctggaagag gaaggagctt gatccagatc 8400 ccgatctcga tccagatccg gatcgcagct tggcgtaatc atggtcatag ctgtttcctg 8460 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 8520 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 8580 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 8640 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 8700 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 8760 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 8820 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 8880 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 8940 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 9000 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 9060 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 9120 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 9180 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 9240 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 9300 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 9360 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 9420 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 9480 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 9540 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 9600 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 9660 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 9720 gccccagtgc tgcaatgata ccgcagcttg ggaaaccata agagctgaag ccagttacct 9780 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 9840 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 9900 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 9960 tgagcttgcg ccgtcccgtc aagtcagcgt aatgctctgc cagtgttaca a 10011 <210> 176 <211> 9672 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 176 ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 60 cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 120 ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 180 tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 240 atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca tttctttcca 300 gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 360 gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt taaaaggaca 420 attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 480 ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg ggatcgcagt 540 ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 600 aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 660 tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc gatagattgt 720 cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 780 gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa caccccttgt 840 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 900 aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc catgacatta 960 acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc gagatagagt 1020 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 1080 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca cccaaatcaa 1140 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 1200 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 1260 gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 1320 ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta tgcggtgtga 1380 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct 1440 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 1500 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 1560 ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga tccagatcga 1620 attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg tctcaacctc 1680 ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 1740 atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 1800 cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 1860 tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 1920 tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 1980 ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 2040 acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 2100 gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 2160 tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 2220 cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 2280 accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 2340 ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg 2400 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 2460 agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag atctctcgac 2520 gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga ctggtgagta 2580 cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag agcgtcggta 2640 ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg gggaaagaaa 2700 caatataaac taaaacatat agttagggca agcagggagc tagaacgatt cgcagttaat 2760 cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct acaaccatcc 2820 cttcagacag gatcagaaga acttagatca ttatataata caatagcagt cctctattgt 2880 gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat agaggaagag 2940 caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg aggcaggagg 3000 cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3060 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3120 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3180 gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc agcagcagaa 3240 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3300 caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc aacagctcct 3360 ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt ggaatgctag 3420 ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg agtgggacag 3480 agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc aaaaccagca 3540 agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt ggaattggtt 3600 taacataaca aattggctgt ggtatataaa attattcata atgatagtag gaggcttggt 3660 aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc agggatattc 3720 accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac aaatggcagt 3780 attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 3840 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 3900 tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag ctgagcatcc 3960 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 4020 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 4080 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 4140 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 4200 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 4260 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 4320 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 4380 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 4440 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 4500 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 4560 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 4620 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 4680 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 4740 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 4800 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 4860 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 4920 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 4980 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 5040 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 5100 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac ccctctagag 5160 ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 5220 tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct gcctctctgg 5280 gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat ttaaattggt 5340 atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca agattacact 5400 caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct ctcaccatta 5460 gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat acgcttccgt 5520 acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga tccggcaagc 5580 ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca ggacctggcc 5640 tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc tcattacccg 5700 actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa 5760 tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg accatcatca 5820 aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact gatgacacag 5880 ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg gactactggg 5940 gtcaaggaac ctcagtcacc gtctcctcag cggccgcagg tggaggaggt tctggaggtg 6000 gaggttcagg tggaggtggt tcactcgagc tgggagcagg cccagtggat tctggagtca 6060 cacaaacccc aaagcacctg atcacagcaa ctggacagcg agtgacgctg agatgctccc 6120 ctaggtctgg agacctctct gtgtcatggt accaacagag cctggaccag ggcctccagt 6180 tcctcattca gtattataat ggagaagaga gagcaaaagg aaacattctt gaacgattct 6240 ccgcacaaca gttccctgac ttgcactctg aactaaacct gagctctctg gagctggggg 6300 actcagcttt gtatttctgt gccagcagcc cccggacagg cctgaacact gaagctttct 6360 ttggacaagg caccagactc acagttgtag aggacctgaa caaggtgttc ccacccgagg 6420 tcgctgtgtt tgagccatca gaagcagaga tctcccacac ccaaaaggcc acactggtgt 6480 gcctggccac aggcttcttc cccgaccacg tggagctgag ctggtgggtg aatgggaagg 6540 aggtgcacag tggggtcagc acggacccgc agcccctcaa ggagcagccc gccctcaatg 6600 actccagata ctgcctgagc agccgcctga gggtctcggc caccttctgg cagaaccccc 6660 gcaaccactt ccgctgtcaa gtccagttct acgggctctc ggagaatgac gagtggaccc 6720 aggatagggc caaacccgtc acccagatcg tcagcgccga ggcctggggt agagcagact 6780 gtggctttac ctcggtgtcc taccagcaag gggtcctgtc tgccaccatc ctctatgaga 6840 tcctgctagg gaaggccacc ctgtatgctg tgctggtcag cgcccttgtg ttgatggcca 6900 tggtcaagag aaaggatttc tgataagata tcgagcatct taccgccatt tatacccata 6960 tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 7020 gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 7080 aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 7140 acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 7200 gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 7260 cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 7320 aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 7380 ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 7440 tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 7500 ccgtggtgtt gtcagtactg gtacctttaa gaccaatgac ttacaaggca gctgtagatc 7560 ttagccactt tttaaaagaa aaggggggac tggaagggct aattcactcc caaagaagac 7620 aagatctgct ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc 7680 tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct tgagtgcttc 7740 aatgatcata atcaagccat atcacatctg tagaggttta cttgctttaa aaaacctcca 7800 cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt 7860 gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 7920 ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg 7980 atctgcgtcg acacgaagag acgactgact gactgactgg aaagaggaag ggctggaaga 8040 ggaaggagct tgatccagat cccgatctcg atccagatcc ggatcgcagc ttggcgtaat 8100 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 8160 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 8220 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 8280 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8340 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8400 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 8460 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8520 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8580 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8640 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 8700 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 8760 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 8820 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 8880 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 8940 ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9000 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9060 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9120 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 9180 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 9240 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 9300 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 9360 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcagctt gggaaaccat 9420 aagagctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 9480 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 9540 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 9600 cacgttaagg gattttggtc atgagcttgc gccgtcccgt caagtcagcg taatgctctg 9660 ccagtgttac aa 9672 <210> 177 <211> 9555 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 177 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 60 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 120 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcagcttg ggaaaccata 180 agagctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 240 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 300 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 360 acgttaaggg attttggtca tgagcttgcg ccgtcccgtc aagtcagcgt aatgctctgc 420 cagtgttaca accaattaac caattctgat tagaaaaact catcgagcat caaatgaaac 480 tgcaatttat tcacatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat 540 gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg 600 attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta 660 tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc 720 atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca 780 tcaaccaaac cgttattcat tcgtgattgc gcctgagcaa gacgaaatac gcgatcgctg 840 ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca 900 tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc tgtttttccg 960 gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc 1020 ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg 1080 gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaag 1140 cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa 1200 tcagcatcca tgttggaatt taatcgcggc ctcgacgttt cccgttgaat atggctcata 1260 acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga tgatatattt 1320 ttatcttgtg caatgtaaca tcagagattt tgagacacaa cgtggctttc cccccccccc 1380 ccatgacatt aacctataaa aataggcgta tcacgaggcc agcttgggaa accataagac 1440 cgagatagag ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 1500 ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 1560 acccaaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 1620 gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 1680 gaaagcgaaa ggagcgggcg ctaaggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 1740 caccacaccc gccgcgctta atgcgccgct acagggcgcg tactatggtt gctttgacgt 1800 atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gcgccattcg 1860 ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 1920 cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 1980 cagtcacgac gttgtaaaac gacggccagt gaattgatcg agatcgtgat ccggatcaag 2040 atccagatcg aattggaggc tacagtcagt ggagaggact ttcactgact gactgactgc 2100 gtctcaacct cctaggggac attgattatt gactagttat taatagtaat caattacggg 2160 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 2220 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 2280 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 2340 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 2400 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 2460 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 2520 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 2580 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 2640 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 2700 tcgtttagtg aaccgggtct ctctggttag accagatctg agcctgggag ctctctggct 2760 aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctc aaagtagtgt 2820 gtgcccgtct gttgtgtgac tctggtaact agagatccct cagacccttt tagtcagtgt 2880 ggaaaatctc tagcagtggc gcccgaacag ggacttgaaa gcgaaagtaa agccagagga 2940 gatctctcga cgcaggactc ggcttgctga agcgcgcacg gcaagaggcg aggggcggcg 3000 actggtgagt acgccaaaaa ttttgactag cggaggctag aaggagagag tagggtgcga 3060 gagcgtcggt attaagcggg ggagaattag ataaatggga aaaaattcgg ttaaggccag 3120 ggggaaagaa acaatataaa ctaaaacata tagttagggc aagcagggag ctagaacgat 3180 tcgcagttaa tcctggcctt ttagagacat cagaaggctg tagacaaata ctgggacagc 3240 tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat acaatagcag 3300 tcctctattg tgtgcatcaa aggatagatg taaaagacac caaggaagcc ttagataaga 3360 tagaggaaga gcaaaacaaa agtaagaaaa aggcacagca agcgatcttc agacctggag 3420 gaggcaggag gcgatatgag ggacaattgg agaagtgaat tatataaata taaagtagta 3480 aaaattgaac cattaggagt agcacccacc aaggcaaaga gaagagtggt gcagagagaa 3540 aaaagagcag tgggaatagg agctttgttc cttgggttct tgggagcagc aggaagcact 3600 atgggcgcag cgtcaatgac gctgacggta caggccagac aattattgtc tgatatagtg 3660 cagcagcaga acaatttgct gagggctatt gaggcgcaac agcatctgtt gcaactcaca 3720 gtctggggca tcaaacagct ccaggcaaga atcctggctg tggaaagata cctaaaggat 3780 caacagctcc tggggatttg gggttgctct ggaaaactca tttgcaccac tgctgtgcct 3840 tggaatgcta gttggagtaa taaatctctg gaacagattt ggaataacat gacctggatg 3900 gagtgggaca gagaaattaa caattacaca agcttaatac actccttaat tgaagaatcg 3960 caaaaccagc aagaaaagaa tgaacaagaa ttattggaat tagataaatg ggcaagtttg 4020 tggaattggt ttaacataac aaattggctg tggtatataa aattattcat aatgatagta 4080 ggaggcttgg taggtttaag aatagttttt gctgtacttt ctatagtgaa tagagttagg 4140 cagggatatt caccattatc gtttcagacc cacctcccaa tcccgagggg accacgcgta 4200 caaatggcag tattcatcca caattttaaa agaaaagggg ggattggggg gtacagtgca 4260 ggggaaagaa tagtagacat aatagcaaca gacatacaaa ctaaagaatt acaaaaacaa 4320 attacaaaaa ttcaaaattt tcgggtttat tacagggaca gcagaaatcc actttggaaa 4380 gctgagcatc cggctccggt gcccgtcagt gggcagagcg cacatcgccc acagtccccg 4440 agaagttggg gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa 4500 actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 4560 atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 4620 aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat ggcccttgcg 4680 tgccttgaat tacttccacg cccctggctg cagtacgtga ttcttgatcc cgagcttcgg 4740 gttggaagtg ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct 4800 tgagttgagg cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc 4860 gcctgtctcg ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg 4920 acgctttttt tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt 4980 tcggtttttg gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg 5040 aggcggggcc tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg 5100 cctgctctgg tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg 5160 gcccggtcgg caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg 5220 agctcaaaat ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg 5280 aaaagggcct ttccgtcctc agccgtcgct tcatgtgact ccacggagta ccgggcgccg 5340 tccaggcacc tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag 5400 gggttttatg cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct 5460 tggcacttga tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt 5520 ctcaagcctc agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgaaaacta 5580 cccctctaga gccgccacca tgcttctcct ggtgacaagc cttctgctct gtgagttacc 5640 acacccagca ttcctcctga tcccagacat ccagatgaca cagactacat cctccctgtc 5700 tgcctctctg ggagacagag tcaccatcag ttgcagggca agtcaggaca ttagtaaata 5760 tttaaattgg tatcagcaga aaccagatgg aactgttaaa ctcctgatct accatacatc 5820 aagattacac tcaggagtcc catcaaggtt cagtggcagt gggtctggaa cagattattc 5880 tctcaccatt agcaacctgg agcaagaaga tattgccact tacttttgcc aacagggtaa 5940 tacgcttccg tacacgttcg gaggggggac taagttggaa ataacaggct ccacctctgg 6000 atccggcaag cccggatctg gcgagggatc caccaagggc gaggtgaaac tgcaggagtc 6060 aggacctggc ctggtggcgc cctcacagag cctgtccgtc acatgcactg tctcaggggt 6120 ctcattaccc gactatggtg taagctggat tcgccagcct ccacgaaagg gtctggagtg 6180 gctgggagta atatggggta gtgaaaccac atactataat tcagctctca aatccagact 6240 gaccatcatc aaggacaact ccaagagcca agttttctta aaaatgaaca gtctgcaaac 6300 tgatgacaca gccatttact actgtgccaa acattattac tacggtggta gctatgctat 6360 ggactactgg ggtcaaggaa cctcagtcac cgtctcctca gcggccgcag gtggaggagg 6420 ttctggaggt ggtggatcag gtggtggagg atctctagaa gtgaatggag agaatgtgga 6480 gcagcatcct tcaaccctga gtgtccagga gggagacagc gctgttatca agtgtactta 6540 ttcagacagt gcctcaaact acttcccttg gtataagcaa gaacttggaa aaagacctca 6600 gcttattata gacattcgtt caaatgtggg cgaaaagaaa gaccaacgaa ttgctgttac 6660 attgaacaag acagccaaac atttctccct gcacatcaca gagacccaac ctgaagactc 6720 ggctgtctac ttctgtgcag caagtaggaa ggactctggg ggttaccaga aagttacctt 6780 tggaactgga acaaagctcc aagtcatccc aaatatccag aaccctgacc ctgccgtgta 6840 ccagctgaga gactctaaat ccagtgacaa gtctgtctgc ctattcaccg attttgattc 6900 tcaaacaaat gtgtcacaaa gtaaggattc tgatgtgtat atcacagaca aaactgtgct 6960 agacatgagg tctatggact tcaagagcaa cagtgctgtg gcctggagca acaaatctga 7020 ctttgcatgt gcaaacgcct tcaacaacag cattattcca gaagacacct tcttccccag 7080 cccagaaagt tcctgtgatg tcaagctggt cgagaaaagc tttgaaacag atacgaacct 7140 aaactttcaa aacctgtcag tgattgggtt ccgaatcctc ctcctgaaag tggccgggtt 7200 taatctgctc atgacgctgc ggctgtggtc cagctgataa gatatcgagc atcttaccgc 7260 catttatacc catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa 7320 aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt 7380 attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa 7440 tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc 7500 ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac 7560 ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg 7620 gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg 7680 ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat 7740 cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct 7800 gggcactgat aattccgtgg tgttgtcagt actggtacct ttaagaccaa tgacttacaa 7860 ggcagctgta gatcttagcc actttttaaa agaaaagggg ggactggaag ggctaattca 7920 ctcccaaaga agacaagatc tgctttttgc ctgtactggg tctctctggt tagaccagat 7980 ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc aataaagctt 8040 gccttgagtg cttcaatgat cataatcaag ccatatcaca tctgtagagg tttacttgct 8100 ttaaaaaacc tccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg 8160 ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 8220 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 8280 cttatcatgt ctggatctgc gtcgacacga agagacgact gactgactga ctggaaagag 8340 gaagggctgg aagaggaagg agcttgatcc agatcccgat ctcgatccag atccggatcg 8400 cagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 8460 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 8520 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 8580 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 8640 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 8700 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 8760 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 8820 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 8880 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 8940 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 9000 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 9060 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 9120 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 9180 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 9240 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 9300 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 9360 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 9420 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 9480 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 9540 atcaatctaa agtat 9555 <210> 178 <211> 9384 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 178 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 60 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 120 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcagcttgg gaaaccataa 180 gagctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 240 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 300 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 360 cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta atgctctgcc 420 agtgttacaa ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact 480 gcaatttatt cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 540 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 600 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 660 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 720 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 780 caaccaaacc gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt 840 taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat 900 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg 960 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 1020 gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1080 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1140 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1200 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa 1260 caccccttgt attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt 1320 tatcttgtgc aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc 1380 catgacatta acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc 1440 gagatagagt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 1500 tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 1560 cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 1620 agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 1680 aaagcgaaag gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 1740 accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta 1800 tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 1860 cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 1920 agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 1980 agtcacgacg ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga 2040 tccagatcga attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg 2100 tctcaacctc ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg 2160 tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg 2220 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 2280 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 2340 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 2400 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 2460 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 2520 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 2580 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 2640 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 2700 cgtttagtga accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 2760 actagggaac ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg 2820 tgcccgtctg ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg 2880 gaaaatctct agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag 2940 atctctcgac gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga 3000 ctggtgagta cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag 3060 agcgtcggta ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg 3120 gggaaagaaa caatataaac taaaacatat agttagggca agcagggagc tagaacgatt 3180 cgcagttaat cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct 3240 acaaccatcc cttcagacag gatcagaaga acttagatca ttatataata caatagcagt 3300 cctctattgt gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat 3360 agaggaagag caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg 3420 aggcaggagg cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa 3480 aaattgaacc attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa 3540 aaagagcagt gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta 3600 tgggcgcagc gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc 3660 agcagcagaa caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag 3720 tctggggcat caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc 3780 aacagctcct ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt 3840 ggaatgctag ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg 3900 agtgggacag agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc 3960 aaaaccagca agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt 4020 ggaattggtt taacataaca aattggctgt ggtatataaa attattcata atgatagtag 4080 gaggcttggt aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc 4140 agggatattc accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac 4200 aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag 4260 gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa 4320 ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag 4380 ctgagcatcc ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga 4440 gaagttgggg ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa 4500 ctgggaaagt gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta 4560 tataagtgca gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca 4620 ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt 4680 gccttgaatt acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg 4740 ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 4800 gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 4860 cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 4920 cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 4980 cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 5040 ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 5100 ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 5160 cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 5220 gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 5280 aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 5340 ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 5400 ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 5460 ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 5520 tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac 5580 ccctctagag ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca 5640 cacccagcat tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct 5700 gcctctctgg gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat 5760 ttaaattggt atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca 5820 agattacact caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct 5880 ctcaccatta gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat 5940 acgcttccgt acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga 6000 tccggcaagc ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca 6060 ggacctggcc tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc 6120 tcattacccg actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg 6180 ctgggagtaa tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg 6240 accatcatca aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact 6300 gatgacacag ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg 6360 gactactggg gtcaaggaac ctcagtcacc gtctcctcag cggccgcagg tggaggaggt 6420 tctggaggtg gtggatcagg tggtggagga tctctagaag aaaagaaaga ccaacgaatt 6480 gctgttacat tgaacaagac agccaaacat ttctccctgc acatcacaga gacccaacct 6540 gaagactcgg ctgtctactt ctgtgcagca agtaggaagg actctggggg ttaccagaaa 6600 gttacctttg gaactggaac aaagctccaa gtcatcccaa atatccagaa ccctgaccct 6660 gccgtgtacc agctgagaga ctctaaatcc agtgacaagt ctgtctgcct attcaccgat 6720 tttgattctc aaacaaatgt gtcacaaagt aaggattctg atgtgtatat cacagacaaa 6780 actgtgctag acatgaggtc tatggacttc aagagcaaca gtgctgtggc ctggagcaac 6840 aaatctgact ttgcatgtgc aaacgccttc aacaacagca ttattccaga agacaccttc 6900 ttccccagcc cagaaagttc ctgtgatgtc aagctggtcg agaaaagctt tgaaacagat 6960 acgaacctaa actttcaaaa cctgtcagtg attgggttcc gaatcctcct cctgaaagtg 7020 gccgggttta atctgctcat gacgctgcgg ctgtggtcca gctgataaga tatcgagcat 7080 cttaccgcca tttataccca tatttgttct gtttttcttg atttgggtat acatttaaat 7140 gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 7200 tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 7260 cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 7320 gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 7380 tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 7440 gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 7500 cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 7560 ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 7620 aggttgctgg gcactgataa ttccgtggtg ttgtcagtac tggtaccttt aagaccaatg 7680 acttacaagg cagctgtaga tcttagccac tttttaaaag aaaagggggg actggaaggg 7740 ctaattcact cccaaagaag acaagatctg ctttttgcct gtactgggtc tctctggtta 7800 gaccagatct gagcctggga gctctctggc taactaggga acccactgct taagcctcaa 7860 taaagcttgc cttgagtgct tcaatgatca taatcaagcc atatcacatc tgtagaggtt 7920 tacttgcttt aaaaaacctc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 7980 tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 8040 aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 8100 caatgtatct tatcatgtct ggatctgcgt cgacacgaag agacgactga ctgactgact 8160 ggaaagagga agggctggaa gaggaaggag cttgatccag atcccgatct cgatccagat 8220 ccggatcgca gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg 8280 ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa 8340 tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 8400 ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 8460 gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 8520 gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 8580 ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 8640 ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 8700 cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 8760 ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 8820 tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 8880 gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 8940 tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 9000 gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 9060 tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 9120 ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 9180 agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 9240 gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 9300 attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 9360 agttttaaat caatctaaag tata 9384 <210> 179 <211> 9252 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 179 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 60 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 120 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcagcttg ggaaaccata 180 agagctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 240 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 300 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 360 acgttaaggg attttggtca tgagcttgcg ccgtcccgtc aagtcagcgt aatgctctgc 420 cagtgttaca accaattaac caattctgat tagaaaaact catcgagcat caaatgaaac 480 tgcaatttat tcacatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat 540 gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg 600 attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta 660 tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc 720 atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca 780 tcaaccaaac cgttattcat tcgtgattgc gcctgagcaa gacgaaatac gcgatcgctg 840 ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca 900 tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc tgtttttccg 960 gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc 1020 ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg 1080 gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaag 1140 cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa 1200 tcagcatcca tgttggaatt taatcgcggc ctcgacgttt cccgttgaat atggctcata 1260 acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga tgatatattt 1320 ttatcttgtg caatgtaaca tcagagattt tgagacacaa cgtggctttc cccccccccc 1380 ccatgacatt aacctataaa aataggcgta tcacgaggcc agcttgggaa accataagac 1440 cgagatagag ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 1500 ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 1560 acccaaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 1620 gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 1680 gaaagcgaaa ggagcgggcg ctaaggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 1740 caccacaccc gccgcgctta atgcgccgct acagggcgcg tactatggtt gctttgacgt 1800 atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gcgccattcg 1860 ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 1920 cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 1980 cagtcacgac gttgtaaaac gacggccagt gaattgatcg agatcgtgat ccggatcaag 2040 atccagatcg aattggaggc tacagtcagt ggagaggact ttcactgact gactgactgc 2100 gtctcaacct cctaggggac attgattatt gactagttat taatagtaat caattacggg 2160 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 2220 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 2280 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 2340 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 2400 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 2460 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 2520 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 2580 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 2640 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 2700 tcgtttagtg aaccgggtct ctctggttag accagatctg agcctgggag ctctctggct 2760 aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctc aaagtagtgt 2820 gtgcccgtct gttgtgtgac tctggtaact agagatccct cagacccttt tagtcagtgt 2880 ggaaaatctc tagcagtggc gcccgaacag ggacttgaaa gcgaaagtaa agccagagga 2940 gatctctcga cgcaggactc ggcttgctga agcgcgcacg gcaagaggcg aggggcggcg 3000 actggtgagt acgccaaaaa ttttgactag cggaggctag aaggagagag tagggtgcga 3060 gagcgtcggt attaagcggg ggagaattag ataaatggga aaaaattcgg ttaaggccag 3120 ggggaaagaa acaatataaa ctaaaacata tagttagggc aagcagggag ctagaacgat 3180 tcgcagttaa tcctggcctt ttagagacat cagaaggctg tagacaaata ctgggacagc 3240 tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat acaatagcag 3300 tcctctattg tgtgcatcaa aggatagatg taaaagacac caaggaagcc ttagataaga 3360 tagaggaaga gcaaaacaaa agtaagaaaa aggcacagca agcgatcttc agacctggag 3420 gaggcaggag gcgatatgag ggacaattgg agaagtgaat tatataaata taaagtagta 3480 aaaattgaac cattaggagt agcacccacc aaggcaaaga gaagagtggt gcagagagaa 3540 aaaagagcag tgggaatagg agctttgttc cttgggttct tgggagcagc aggaagcact 3600 atgggcgcag cgtcaatgac gctgacggta caggccagac aattattgtc tgatatagtg 3660 cagcagcaga acaatttgct gagggctatt gaggcgcaac agcatctgtt gcaactcaca 3720 gtctggggca tcaaacagct ccaggcaaga atcctggctg tggaaagata cctaaaggat 3780 caacagctcc tggggatttg gggttgctct ggaaaactca tttgcaccac tgctgtgcct 3840 tggaatgcta gttggagtaa taaatctctg gaacagattt ggaataacat gacctggatg 3900 gagtgggaca gagaaattaa caattacaca agcttaatac actccttaat tgaagaatcg 3960 caaaaccagc aagaaaagaa tgaacaagaa ttattggaat tagataaatg ggcaagtttg 4020 tggaattggt ttaacataac aaattggctg tggtatataa aattattcat aatgatagta 4080 ggaggcttgg taggtttaag aatagttttt gctgtacttt ctatagtgaa tagagttagg 4140 cagggatatt caccattatc gtttcagacc cacctcccaa tcccgagggg accacgcgta 4200 caaatggcag tattcatcca caattttaaa agaaaagggg ggattggggg gtacagtgca 4260 ggggaaagaa tagtagacat aatagcaaca gacatacaaa ctaaagaatt acaaaaacaa 4320 attacaaaaa ttcaaaattt tcgggtttat tacagggaca gcagaaatcc actttggaaa 4380 gctgagcatc cggctccggt gcccgtcagt gggcagagcg cacatcgccc acagtccccg 4440 agaagttggg gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa 4500 actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 4560 atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 4620 aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat ggcccttgcg 4680 tgccttgaat tacttccacg cccctggctg cagtacgtga ttcttgatcc cgagcttcgg 4740 gttggaagtg ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct 4800 tgagttgagg cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc 4860 gcctgtctcg ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg 4920 acgctttttt tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt 4980 tcggtttttg gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg 5040 aggcggggcc tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg 5100 cctgctctgg tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg 5160 gcccggtcgg caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg 5220 agctcaaaat ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg 5280 aaaagggcct ttccgtcctc agccgtcgct tcatgtgact ccacggagta ccgggcgccg 5340 tccaggcacc tcgattagtt ctcgagcttt tggagtacgt cgtctttagg ttggggggag 5400 gggttttatg cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct 5460 tggcacttga tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt 5520 ctcaagcctc agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgaaaacta 5580 cccctctaga gccgccacca tgcttctcct ggtgacaagc cttctgctct gtgagttacc 5640 acacccagca ttcctcctga tcccagacat ccagatgaca cagactacat cctccctgtc 5700 tgcctctctg ggagacagag tcaccatcag ttgcagggca agtcaggaca ttagtaaata 5760 tttaaattgg tatcagcaga aaccagatgg aactgttaaa ctcctgatct accatacatc 5820 aagattacac tcaggagtcc catcaaggtt cagtggcagt gggtctggaa cagattattc 5880 tctcaccatt agcaacctgg agcaagaaga tattgccact tacttttgcc aacagggtaa 5940 tacgcttccg tacacgttcg gaggggggac taagttggaa ataacaggct ccacctctgg 6000 atccggcaag cccggatctg gcgagggatc caccaagggc gaggtgaaac tgcaggagtc 6060 aggacctggc ctggtggcgc cctcacagag cctgtccgtc acatgcactg tctcaggggt 6120 ctcattaccc gactatggtg taagctggat tcgccagcct ccacgaaagg gtctggagtg 6180 gctgggagta atatggggta gtgaaaccac atactataat tcagctctca aatccagact 6240 gaccatcatc aaggacaact ccaagagcca agttttctta aaaatgaaca gtctgcaaac 6300 tgatgacaca gccatttact actgtgccaa acattattac tacggtggta gctatgctat 6360 ggactactgg ggtcaaggaa cctcagtcac cgtctcctca gcggccgcag gtggaggagg 6420 ttctggaggt ggtggatcag gtggtggagg atctctagaa taccagaaag ttacctttgg 6480 aactggaaca aagctccaag tcatcccaaa tatccagaac cctgaccctg ccgtgtacca 6540 gctgagagac tctaaatcca gtgacaagtc tgtctgccta ttcaccgatt ttgattctca 6600 aacaaatgtg tcacaaagta aggattctga tgtgtatatc acagacaaaa ctgtgctaga 6660 catgaggtct atggacttca agagcaacag tgctgtggcc tggagcaaca aatctgactt 6720 tgcatgtgca aacgccttca acaacagcat tattccagaa gacaccttct tccccagccc 6780 agaaagttcc tgtgatgtca agctggtcga gaaaagcttt gaaacagata cgaacctaaa 6840 ctttcaaaac ctgtcagtga ttgggttccg aatcctcctc ctgaaagtgg ccgggtttaa 6900 tctgctcatg acgctgcggc tgtggtccag ctgataagat atcgagcatc ttaccgccat 6960 ttatacccat atttgttctg tttttcttga tttgggtata catttaaatg ttaataaaac 7020 aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt caggtgtatt 7080 gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc ctgttaatca 7140 acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg ttgctccttt 7200 tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt cccgtacggc 7260 tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg agttgtggcc 7320 cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg 7380 gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc tcccgatcgc 7440 cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta ggttgctggg 7500 cactgataat tccgtggtgt tgtcagtact ggtaccttta agaccaatga cttacaaggc 7560 agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc taattcactc 7620 ccaaagaaga caagatctgc tttttgcctg tactgggtct ctctggttag accagatctg 7680 agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc 7740 ttgagtgctt caatgatcat aatcaagcca tatcacatct gtagaggttt acttgcttta 7800 aaaaacctcc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 7860 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 7920 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 7980 atcatgtctg gatctgcgtc gacacgaaga gacgactgac tgactgactg gaaagaggaa 8040 gggctggaag aggaaggagc ttgatccaga tcccgatctc gatccagatc cggatcgcag 8100 cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 8160 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 8220 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 8280 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 8340 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 8400 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 8460 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 8520 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 8580 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 8640 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 8700 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 8760 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 8820 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 8880 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 8940 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 9000 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 9060 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 9120 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 9180 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 9240 aatctaaagt at 9252 <210> 180 <211> 9575 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 180 aaagctgagc atccggctcc ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc 60 ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg 120 taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt gggggagaac 180 cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt gccgccagaa 240 cacaggtaag tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt 300 gcgtgccttg aattacttcc acgcccctgg ctgcagtacg tgattcttga tcccgagctt 360 cgggttggaa gtgggtggga gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt 420 gcttgagttg aggcctggcc tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt 480 cgcgcctgtc tcgctgcttt cgataagtct ctagccattt aaaatttttg atgacctgct 540 gcgacgcttt ttttctggca agatagtctt gtaaatgcgg gccaagatct gcacactggt 600 atttcggttt ttggggccgc gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg 660 gcgaggcggg gcctgcgagc gcggccaccg agaatcggac gggggtagtc tcaagctggc 720 cggcctgctc tggtgcctgg cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg 780 ctggcccggt cggcaccagt tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca 840 gggagctcaa aatggaggac gcggcgctcg ggagagcggg cgggtgagtc acccacacaa 900 aggaaaaggg cctttccgtc ctcagccgtc gcttcatgtg actccacgga gtaccgggcg 960 ccgtccaggc acctcgatta gttctcgagc ttttggagta cgtcgtcttt aggttggggg 1020 gaggggtttt atgcgatgga gtttccccac actgagtggg tggagactga agttaggcca 1080 gcttggcact tgatgtaatt ctccttggaa tttgcccttt ttgagtttgg atcttggttc 1140 attctcaagc ctcagacagt ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa 1200 ctacccctct agagccgcca ccatgcttct cctggtgaca agccttctgc tctgtgagtt 1260 accacaccca gcattcctcc tgatcccaga catccagatg acacagacta catcctccct 1320 gtctgcctct ctgggagaca gagtcaccat cagttgcagg gcaagtcagg acattagtaa 1380 atatttaaat tggtatcagc agaaaccaga tggaactgtt aaactcctga tctaccatac 1440 atcaagatta cactcaggag tcccatcaag gttcagtggc agtgggtctg gaacagatta 1500 ttctctcacc attagcaacc tggagcaaga agatattgcc acttactttt gccaacaggg 1560 taatacgctt ccgtacacgt tcggaggggg gactaagttg gaaataacag gctccacctc 1620 tggatccggc aagcccggat ctggcgaggg atccaccaag ggcgaggtga aactgcagga 1680 gtcaggacct ggcctggtgg cgccctcaca gagcctgtcc gtcacatgca ctgtctcagg 1740 ggtctcatta cccgactatg gtgtaagctg gattcgccag cctccacgaa agggtctgga 1800 gtggctggga gtaatatggg gtagtgaaac cacatactat aattcagctc tcaaatccag 1860 actgaccatc atcaaggaca actccaagag ccaagttttc ttaaaaatga acagtctgca 1920 aactgatgac acagccattt actactgtgc caaacattat tactacggtg gtagctatgc 1980 tatggactac tggggtcaag gaacctcagt caccgtctcc tcagcggccg caggtggagg 2040 aggttctgga ggtggaggtt caggtggagg tggttcactc gagctgggag caggcccagt 2100 ggattctgga gtcacacaaa ccccaaagca cctgatcaca gcaactggac agcgagtgac 2160 gctgagatgc tcccctaggt ctggagacct ctctgtgtca tggtaccaac agagcctgga 2220 ccagggcctc cagttcctca ttcagtatta taatggagaa gagagagcaa aaggaaacat 2280 tcttgaacga ttctccgcac aacagttccc tgacttgcac tctgaactaa acctgagctc 2340 tctggagctg ggggactcag ctttgtattt ctgtgccagc agcccccgga caggcctgaa 2400 cactgaagct ttctttggac aaggcaccag actcacagtt gtagaggacc tgaacaaggt 2460 gttcccaccc gaggtcgctg tgtttgagcc atcagaagca gagatctccc acacccaaaa 2520 ggccacgcta gtatgtctag ctacaggctt cttccccgac cacgtggagc tgagctggtg 2580 ggtgaatggg aaggaggtgc acagtggggt cagcacggac ccgcagcccc tcaaggagca 2640 gcccgccctc aatgactcca gatactgcct gagcagccgc ctgagggtct cggccacctt 2700 ctggcagaac ccccgcaacc acttccgctg tcaagtccag ttctacgggc tctcggagaa 2760 tgacgagtgg acccaggata gggccaaacc cgtcacccag atcgtcagcg ccgaggcctg 2820 gggtagagca gactgtggct ttacctcggt gtcctaccag caaggggtcc tgtctgccac 2880 catcctctat gagatcctgc tagggaaggc caccctgtat gctgtgctgg tcagcgccct 2940 tgtgttgatg gccatggtca agagaaagga tttctgataa gatatcgagc atcttaccgc 3000 catttatacc catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa 3060 aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt 3120 attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa 3180 tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc 3240 ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac 3300 ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg 3360 gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg 3420 ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat 3480 cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct 3540 gggcactgat aattccgtgg tgttgtcagt actggtacct ttaagaccaa tgacttacaa 3600 ggcagctgta gatcttagcc actttttaaa agaaaagggg ggactggaag ggctaattca 3660 ctcccaaaga agacaagatc tgctttttgc ctgtactggg tctctctggt tagaccagat 3720 ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc aataaagctt 3780 gccttgagtg cttcaatgat cataatcaag ccatatcaca tctgtagagg tttacttgct 3840 ttaaaaaacc tccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg 3900 ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 3960 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 4020 cttatcatgt ctggatctgc gtcgacacga agagacgact gactgactga ctggaaagag 4080 gaagggctgg aagaggaagg agcttgatcc agatcccgat ctcgatccag atccggatcg 4140 cagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 4200 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 4260 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 4320 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 4380 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 4440 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 4500 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 4560 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 4620 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 4680 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 4740 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 4800 caagctgggc tgtgtgcacg aacccccccg gtaagacacg acttatcgcc actggcagca 4860 gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 4920 tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 4980 ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 5040 agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 5100 gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 5160 attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 5220 agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 5280 atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 5340 cccgtcgttg ctaggttact gtcatgagcg gatacatatt tgaatgtatt tagaaaaata 5400 aacaaaagag tttgtagaaa cgcaaaaagg ccatccgtca ggatggcctt ctgcttaatt 5460 tgatcggtgg cagtttatgg cgggcgtcct gcccgccacc ctccgggccg ttgcttcgca 5520 acgttcaaat ccgctcccgg cggatttgtc ctactcagga gagcgttcac cgacaaacaa 5580 cagataaaac gaaaggccca gtctttcgac tgagcctttc gttttatttg atgcctggca 5640 gttccctact ctcgcatggg ttgcggccgc ccgggccgtc gaccaattct catgtttgac 5700 agcttatcat cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcaac 5760 caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat 5820 cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca caaacggcat 5880 gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 5940 tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 6000 aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 6060 aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 6120 aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 6180 tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgaa 6240 attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 6300 gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 6360 aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 6420 tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 6480 atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 6540 aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gtgacattaa cctataaaaa 6600 taggcgtatc acgaggccag cttgggaaac cataagaccg agatagagtt gagtgttgtt 6660 ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa agggcgaaaa 6720 accgtctatc agggcgatgg cccactacgt gaaccatcac ccaaatcaag ttttttgggg 6780 tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt tagagcttga 6840 cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct 6900 aaggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat 6960 gcgccgctac agggcgcgta ctatggttgc tttgacgtat gcggtgtgaa ataccgcaca 7020 gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc attcaggctg cgcaactgtt 7080 gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg 7140 ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga 7200 cggccagtga attgatcgag atcgtgatcc ggatcaagat ccagatcgaa ttggaggcta 7260 cagtcagtgg agaggacttt cactgactga ctgactgcgt ctcaacctcc taggggacat 7320 tgattattga ctagttatta atagtaatca attacggggt cattagttca tagcccatat 7380 atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac 7440 ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc 7500 cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg 7560 tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat 7620 tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc 7680 atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt 7740 gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 7800 caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc 7860 ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgggtctct 7920 ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc cactgcttaa 7980 gcctcaataa agcttgcctt gagtgctcaa agtagtgtgt gcccgtctgt tgtgtgactc 8040 tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta gcagtggcgc 8100 ccgaacaggg acttgaaagc gaaagtaaag ccagaggaga tctctcgacg caggactcgg 8160 cttgctgaag cgcgcacggc aagaggcgag gggcggcgac tggtgagtac gccaaaaatt 8220 ttgactagcg gaggctagaa ggagagagta gggtgcgaga gcgtcggtat taagcggggg 8280 agaattagat aaatgggaaa aaattcggtt aaggccaggg ggaaagaaac aatataaact 8340 aaaacatata gttagggcaa gcagggagct agaacgattc gcagttaatc ctggcctttt 8400 agagacatca gaaggctgta gacaaatact gggacagcta caaccatccc ttcagacagg 8460 atcagaagaa cttagatcat tatataatac aatagcagtc ctctattgtg tgcatcaaag 8520 gatagatgta aaagacacca aggaagcctt agataagata gaggaagagc aaaacaaaag 8580 taagaaaaag gcacagcaag cgatcttcag acctggagga ggcaggaggc gatatgaggg 8640 acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca ttaggagtag 8700 cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg ggaataggag 8760 ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg tcaatgacgc 8820 tgacggtaca ggccagacaa ttattgtctg atatagtgca gcagcagaac aatttgctga 8880 gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc aaacagctcc 8940 aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg gggatttggg 9000 gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt tggagtaata 9060 aatctctgga acagatttgg aataacatga cctggatgga gtgggacaga gaaattaaca 9120 attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa gaaaagaatg 9180 aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt aacataacaa 9240 attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta ggtttaagaa 9300 tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca ccattatcgt 9360 ttcagaccca cctcccaatc ccgaggggac cacgcgtaca aatggcagta ttcatccaca 9420 attttaaaag aaaagggggg attggggggt acagtgcagg ggaaagaata gtagacataa 9480 tagcaacaga catacaaact aaagaattac aaaaacaaat tacaaaaatt caaaattttc 9540 gggtttatta cagggacagc agaaatccac tttgg 9575 <210> 181 <211> 10683 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 181 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 60 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 120 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcagcttgg gaaaccataa 180 gagctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 240 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 300 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 360 cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta atgctctgcc 420 agtgttacaa ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact 480 gcaatttatt cacatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 540 aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 600 ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 660 caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 720 tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 780 caaccaaacc gttattcatt cgtgattgcg cctgagcaag acgaaatacg cgatcgctgt 840 taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat 900 caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct gtttttccgg 960 ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 1020 gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1080 caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1140 gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1200 cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcataa 1260 caccccttgt attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt 1320 tatcttgtgc aatgtaacat cagagatttt gagacacaac gtggctttcc cccccccccc 1380 catgacatta acctataaaa ataggcgtat cacgaggcca gcttgggaaa ccataagacc 1440 gagatagagt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 1500 tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 1560 cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 1620 agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 1680 aaagcgaaag gagcgggcgc taaggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 1740 accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt actatggttg ctttgacgta 1800 tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 1860 cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 1920 agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 1980 agtcacgacg ttgtaaaacg acggccagtg aattgatcga gatcgtgatc cggatcaaga 2040 tccagatcga attggaggct acagtcagtg gagaggactt tcactgactg actgactgcg 2100 tctcaacctc ctaggggaca ttgattattg actagttatt aatagtaatc aattacgggg 2160 tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg 2220 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 2280 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 2340 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 2400 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 2460 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 2520 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 2580 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 2640 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 2700 cgtttagtga accgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 2760 actagggaac ccactgctta agcctcaata aagcttgcct tgagtgctca aagtagtgtg 2820 tgcccgtctg ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg 2880 gaaaatctct agcagtggcg cccgaacagg gacttgaaag cgaaagtaaa gccagaggag 2940 atctctcgac gcaggactcg gcttgctgaa gcgcgcacgg caagaggcga ggggcggcga 3000 ctggtgagta cgccaaaaat tttgactagc ggaggctaga aggagagagt agggtgcgag 3060 agcgtcggta ttaagcgggg gagaattaga taaatgggaa aaaattcggt taaggccagg 3120 gggaaagaaa caatataaac taaaacatat agttagggca agcagggagc tagaacgatt 3180 cgcagttaat cctggccttt tagagacatc agaaggctgt agacaaatac tgggacagct 3240 acaaccatcc cttcagacag gatcagaaga acttagatca ttatataata caatagcagt 3300 cctctattgt gtgcatcaaa ggatagatgt aaaagacacc aaggaagcct tagataagat 3360 agaggaagag caaaacaaaa gtaagaaaaa ggcacagcaa gcgatcttca gacctggagg 3420 aggcaggagg cgatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa 3480 aaattgaacc attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa 3540 aaagagcagt gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta 3600 tgggcgcagc gtcaatgacg ctgacggtac aggccagaca attattgtct gatatagtgc 3660 agcagcagaa caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag 3720 tctggggcat caaacagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc 3780 aacagctcct ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt 3840 ggaatgctag ttggagtaat aaatctctgg aacagatttg gaataacatg acctggatgg 3900 agtgggacag agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc 3960 aaaaccagca agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt 4020 ggaattggtt taacataaca aattggctgt ggtatataaa attattcata atgatagtag 4080 gaggcttggt aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc 4140 agggatattc accattatcg tttcagaccc acctcccaat cccgagggga ccacgcgtac 4200 aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg tacagtgcag 4260 gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa 4320 ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagaaatcca ctttggaaag 4380 ctgagcatcc ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga 4440 gaagttgggg ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa 4500 ctgggaaagt gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta 4560 tataagtgca gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca 4620 ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt 4680 gccttgaatt acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg 4740 ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 4800 gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 4860 cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 4920 cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 4980 cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 5040 ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 5100 ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 5160 cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 5220 gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 5280 aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 5340 ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 5400 ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 5460 ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 5520 tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac 5580 ccctctagag ccgccaccat gcttctcctg gtgacaagcc ttctgctctg tgagttacca 5640 cacccagcat tcctcctgat cccagacatc cagatgacac agactacatc ctccctgtct 5700 gcctctctgg gagacagagt caccatcagt tgcagggcaa gtcaggacat tagtaaatat 5760 ttaaattggt atcagcagaa accagatgga actgttaaac tcctgatcta ccatacatca 5820 agattacact caggagtccc atcaaggttc agtggcagtg ggtctggaac agattattct 5880 ctcaccatta gcaacctgga gcaagaagat attgccactt acttttgcca acagggtaat 5940 acgcttccgt acacgttcgg aggggggact aagttggaaa taacaggctc cacctctgga 6000 tccggcaagc ccggatctgg cgagggatcc accaagggcg aggtgaaact gcaggagtca 6060 ggacctggcc tggtggcgcc ctcacagagc ctgtccgtca catgcactgt ctcaggggtc 6120 tcattacccg actatggtgt aagctggatt cgccagcctc cacgaaaggg tctggagtgg 6180 ctgggagtaa tatggggtag tgaaaccaca tactataatt cagctctcaa atccagactg 6240 accatcatca aggacaactc caagagccaa gttttcttaa aaatgaacag tctgcaaact 6300 gatgacacag ccatttacta ctgtgccaaa cattattact acggtggtag ctatgctatg 6360 gactactggg gtcaaggaac ctcagtcacc gtctcctcag cggccgcagg tggaggaggt 6420 tctggaggtg gtggatcagg tggtggagga tctttagaaa gtcagcctca taccaaacca 6480 tccgtttttg tcatgaaaaa tggaacaaat gtcgcttgtc tggtgaagga attctacccc 6540 aaggatataa gaataaatct cgtgtcatcc aagaagataa cagagtttga tcctgctatt 6600 gtcatctctc ccagtgggaa gtacaatgct gtcaagcttg gtaaatatga agattcaaat 6660 tcagtgacat gttcagttca acacgacaat aaaactgtgc actccactga ctttgaagtg 6720 aagacagatt ctacagatca cgtaaaacca aaggaaactg aaaacacaaa gcaaccttca 6780 aagagctgcc ataaacccaa agccatagtt cataccgaga aggtgaacat gatgtccctc 6840 acagtgcttg ggctacgaat gctgtttgca aagactgttg ccgtcaattt tctcttgact 6900 gccaagttat ttttcttggg gtcaggcgag ggcagaggaa gtctgctaac atgcggtgac 6960 gtcgaggaga atcctggacc tatgctacta cttgtgacct cactattgtt atgcgaactc 7020 cctcatcccg cattcttgct gattccagac attcagatga ctcaaacaac ttccagcctc 7080 tccgcctcac tcggcgaccg cgtaacaata agctgtcggg cctcgcaaga tattagtaag 7140 tacctgaatt ggtatcagca aaaacccgat ggtacagtca agcttctgat ctaccatacc 7200 agtcgtctgc acagcggtgt ccccagcagg ttcagcggct caggatctgg taccgattat 7260 tcactgacga tttccaacct tgagcaggag gacatcgcca cctacttctg ccagcagggt 7320 aatactctgc cgtacacatt cgggggcggt accaagctcg agatcacggg ttcaacaagc 7380 ggttctggca agccaggcag cggcgagggg agtacaaagg gggaggtgaa gttgcaggaa 7440 agtggccctg gattggtggc cccgagccag agtctgtctg tcacctgcac agtttccgga 7500 gtaagtctgc ctgattacgg agtgtcctgg atcagacagc cacctcgaaa gggcttggag 7560 tggcttgggg tcatttgggg cagtgaaacc acatactaca acagcgctct taagtccagg 7620 ctcactatca tcaaggacaa ttcaaagagc caagtattct tgaaaatgaa ttccctgcag 7680 actgatgaca ccgctattta ttattgcgct aaacattatt actatggagg ttcttatgcc 7740 atggactact gggggcaggg tacctctgtg acagtgagtt cagctgcagc tggaggtgga 7800 ggtagcggag gcggtggtag tggagggggt ggttctctgg aagataaaca acttgatgca 7860 gatgtttccc ccaagcccac tatttttctt ccttcaattg ctgaaacaaa gctccagaag 7920 gctggaacat acctttgtct tcttgagaaa tttttccctg atgttattaa gatacattgg 7980 caagaaaaga agagcaacac gattctggga tcccaggagg ggaacaccat gaagactaac 8040 gacacataca tgaaatttag ctggttaacg gtgccagaaa agtcactgga caaagaacac 8100 agatgtatcg tcagacatga gaataataaa aacggagttg atcaagaaat tatctttcct 8160 ccaataaaga cagatgtcat cacaatggat cccaaagaca attgttcaaa agatgcaaat 8220 gatacactac tgctgcagct cacaaacacc tctgcatatt acatgtacct cctcctgctc 8280 ctcaagagtg tggtctattt tgccatcatc acctgctgtc tgcttagaag aacggctttc 8340 tgctgcaatg gagagaaatc ataatgagat atcgagcatc ttaccgccat ttatacccat 8400 atttgttctg tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg 8460 ggcaatcatt tacattttta gggatatgta attactagtt caggtgtatt gccacaagac 8520 aaacatgtta agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat 8580 tacaaaattt gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt 8640 ggatatgctg ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc 8700 tcctccttgt ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt 8760 caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc 8820 accacctgtc aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa 8880 ctcatcgccg cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat 8940 tccgtggtgt tgtcagtact ggtaccttta agaccaatga cttacaaggc agctgtagat 9000 cttagccact ttttaaaaga aaagggggga ctggaagggc taattcactc ccaaagaaga 9060 caagatctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120 ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180 caatgatcat aatcaagcca tatcacatct gtagaggttt acttgcttta aaaaacctcc 9240 acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat 9300 tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 9360 tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 9420 gatctgcgtc gacacgaaga gacgactgac tgactgactg gaaagaggaa gggctggaag 9480 aggaaggagc ttgatccaga tcccgatctc gatccagatc cggatcgcag cttggcgtaa 9540 tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 9600 cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 9660 attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 9720 tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 9780 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 9840 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 9900 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 9960 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 10020 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 10080 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 10140 catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 10200 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 10260 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 10320 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 10380 actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 10440 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 10500 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 10560 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 10620 aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 10680 ata 10683 <210> 182 <211> 9912 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 182 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 360 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 420 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 480 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 540 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 600 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 660 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 720 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 780 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 840 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 900 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 960 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1020 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1080 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1140 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1200 ttaattaact tgcgccgtcc cgtcaagtca gcgtaatgct ctgccagtgt tacaaccaat 1260 taaccaattc tgattagaaa aactcatcga gcatcaaatg aaactgcaat ttattcacat 1320 caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac 1380 cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa 1440 catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac 1500 catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt 1560 gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat 1620 tcattcgtga ttgcgcctga gcaagacgaa atacgcgatc gctgttaaaa ggacaattac 1680 aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac 1740 ctgaatcagg atattcttct aatacctgga atgctgtttt tccggggatc gcagtggtga 1800 gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt 1860 ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc 1920 catgtttcag aaacaactct ggcgcatcgg gcttcccata caagcgatag attgtcgcac 1980 ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg 2040 aatttaatcg cggcctcgac gtttcccgtt gaatatggct cataacaccc cttgtattac 2100 tgtttatgta agcagacagt tttattgttc atgatgatat atttttatct tgtgcaatgt 2160 aacatcagag attttgagac acaacgtggc tttccccccc ccccccatga cattaaccta 2220 taaaaatagg cgtatcacga ggccagcttg ggaaaccata agaccgagat agagttgagt 2280 gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 2340 cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccaa atcaagtttt 2400 ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 2460 gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg 2520 ggcgctaagg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg 2580 cttaatgcgc cgctacaggg cgcgtactat ggttgctttg acgtatgcgg tgtgaaatac 2640 cgcacagatg cgtaaggaga aaatacatcg tgatccggat caagatccag atcgaattgg 2700 aggctacagt cagtggagag gactttcact gactgactga ctgcgtctca acctcctagg 2760 ggacattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc 2820 ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 2880 aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 2940 actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 3000 caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 3060 tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 3120 ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 3180 cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 3240 tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 3300 atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgg 3360 gtctctctgg ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact 3420 gcttaagcct caataaagct tgccttgagt gctcaaagta gtgtgtgccc gtctgttgtg 3480 tgactctggt aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag 3540 tggcgcccga acagggactt gaaagcgaaa gtaaagccag aggagatctc tcgacgcagg 3600 actcggcttg ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca 3660 aaaattttga ctagcggagg ctagaaggag agagtagggt gcgagagcgt cggtattaag 3720 cgggggagaa ttagataaat gggaaaaaat tcggttaagg ccagggggaa agaaacaata 3780 taaactaaaa catatagtta gggcaagcag ggagctagaa cgattcgcag ttaatcctgg 3840 ccttttagag acatcagaag gctgtagaca aatactggga cagctacaac catcccttca 3900 gacaggatca gaagaactta gatcattata taatacaata gcagtcctct attgtgtgca 3960 tcaaaggata gatgtaaaag acaccaagga agccttagat aagatagagg aagagcaaaa 4020 caaaagtaag aaaaaggcac agcaagcgat cttcagacct ggaggaggca ggaggcgata 4080 tgagggacaa ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag 4140 gagtagcacc caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa 4200 taggagcttt gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa 4260 tgacgctgac ggtacaggcc agacaattat tgtctgatat agtgcagcag cagaacaatt 4320 tgctgagggc tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaaac 4380 agctccaggc aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga 4440 tttggggttg ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga 4500 gtaataaatc tctggaacag atttggaata acatgacctg gatggagtgg gacagagaaa 4560 ttaacaatta cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa 4620 agaatgaaca agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca 4680 taacaaattg gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt 4740 taagaatagt ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat 4800 tatcgtttca gacccacctc ccaatcccga ggggaccacg cgtacaaatg gcagtattca 4860 tccacaattt taaaagaaaa ggggggattg gggggtacag tgcaggggaa agaatagtag 4920 acataatagc aacagacata caaactaaag aattacaaaa acaaattaca aaaattcaaa 4980 attttcgggt ttattacagg gacagcagaa atccactttg gaaagctgag catccggctc 5040 cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt tggggggagg 5100 ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg aaagtgatgt 5160 cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt 5220 cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg 5280 tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattacttc 5340 cacgcccctg gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg 5400 agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc 5460 ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt 5520 tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc 5580 aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg 5640 cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag 5700 cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg 5760 gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag 5820 ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga 5880 cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt 5940 cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt 6000 agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg 6060 agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat 6120 tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag 6180 tggttcaaag tttttttctt ccatttcagg tgtcgtgaaa actacccctc agagccgcca 6240 ccatgcttct cctggtgaca agccttctgc tctgtgagtt accacaccca gcattcctcc 6300 tgatcccaga catccagatg acacagacta catcctccct gtctgcctct ctgggagaca 6360 gagtcaccat cagttgcagg gcaagtcagg acattagtaa atatttaaat tggtatcagc 6420 agaaaccaga tggaactgtt aaactcctga tctaccatac atcaagatta cactcaggag 6480 tcccatcaag gttcagtggc agtgggtctg gaacagatta ttctctcacc attagcaacc 6540 tggagcaaga agatattgcc acttactttt gccaacaggg taatacgctt ccgtacacgt 6600 tcggaggggg gactaagttg gaaataacag gctccacctc tggatccggc aagcccggat 6660 ctggcgaggg atccaccaag ggcgaggtga aactgcagga gtcaggacct ggcctggtgg 6720 cgccctcaca gagcctgtcc gtcacatgca ctgtctcagg ggtctcatta cccgactatg 6780 gtgtaagctg gattcgccag cctccacgaa agggtctgga gtggctggga gtaatatggg 6840 gtagtgaaac cacatactat aattcagctc tcaaatccag actgaccatc atcaaggaca 6900 actccaagag ccaagttttc ttaaaaatga acagtctgca aactgatgac acagccattt 6960 actactgtgc caaacattat tactacggtg gtagctatgc tatggactac tggggtcaag 7020 gaacctcagt caccgtctcc tcagcggccg caggtggagg aggttctgga ggtggtggat 7080 caggtggtgg aggatcttta gaaagtcagc ctcataccaa accatccgtt tttgtcatga 7140 aaaatggaac aaatgtcgct tgtctggtga aggaattcta ccccaaggat ataagaataa 7200 atctcgtgtc atccaagaag ataacagagt ttgatcctgc tattgtcatc tctcccagtg 7260 ggaagtacaa tgctgtcaag cttggtaaat atgaagattc aaattcagtg acatgttcag 7320 ttcaacacga caataaaact gtgcactcca ctgactttga agtgaagaca gattctacag 7380 atcacgtaaa accaaaggaa actgaaaaca caaagcaacc ttcaaagagc tgccataaac 7440 ccaaagccat agttcatacc gagaaggtga acatgatgtc cctcacagtg cttgggctac 7500 gaatgctgtt tgcaaagact gttgccgtca attttctctt gactgccaag ttatttttct 7560 tggggtcagg cgctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 7620 ctggacctat gctactactt gtgacctcac tattgttatg cgaactccct catcccgcat 7680 tcttgctgat tccagacatt cagatgactc aaacaacttc cagcctctcc gcctcactcg 7740 gcgaccgcgt aacaataagc tgtcgggcct cgcaagatat tagtaagtac ctgaattggt 7800 atcagcaaaa acccgatggt acagtcaagc ttctgatcta ccataccagt cgtctgcaca 7860 gcggtgtccc cagcaggttc agcggctcag gatctggtac cgattattca ctgacgattt 7920 ccaaccttga gcaagaggac atcgccacct acttctgcca gcagggtaat actctgccgt 7980 acacattcgg gggcggtacc aagctcgaga tcacgggttc aacaagcggt tctggcaagc 8040 caggcagcgg cgaggggagt acaaaggggg aggtgaagtt gcaggaaagt ggccctggat 8100 tggtggcccc gagccagagt ctgtctgtca cctgcacagt ttccggagta agtctgcctg 8160 attacggagt gtcctggatc agacagccac ctcgaaaggg cttggagtgg cttggggtca 8220 tttggggcag tgaaaccaca tactacaaca gcgctcttaa gtccaggctc actatcatca 8280 aggacaattc aaagagccaa gtattcttga aaatgaattc cctgcagact gatgacaccg 8340 ctatttatta ttgcgctaaa cattattact atggaggttc ttatgccatg gactactggg 8400 ggcagggtac ctctgtgaca gtgagttcag ctgcagctgg aggtggaggt agcggaggcg 8460 gtggtagtgg agggggtggt tctctggaag ataaacaact tgatgcagat gtttccccca 8520 agcccactat ttttcttcct tcaattgctg aaacaaagct ccagaaggct ggaacatacc 8580 tttgtcttct tgagaaattt ttccctgatg ttattaagat acattggcaa gaaaagaaga 8640 gcaacacgat tctgggatcc caggagggga acaccatgaa gactaacgac acatacatga 8700 aatttagctg gttaacggtg ccagaaaagt cactggacaa agaacacaga tgtatcgtca 8760 gacatgagaa taataaaaac ggagttgatc aagaaattat ctttcctcca ataaagacag 8820 atgtcatcac aatggatccc aaagacaatt gttcaaaaga tgcaaatgat acactactgc 8880 tgcagctcac aaacacctct gcatattaca tgtacctcct cctgctcctc aagagtgtgg 8940 tctattttgc catcatcacc tgctgtctgc ttagaagaac ggctttctgc tgcaatggag 9000 agaaatcata atgagatatc gagcatctta ccgccattta tacccatatt tgttctgttt 9060 ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac 9120 atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga 9180 aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg 9240 aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt 9300 tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata 9360 aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg 9420 tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac 9480 tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct 9540 gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt 9600 cagtactggt acctttaaga ccaatgactt acaaggcagc tgtagatctt agccactttt 9660 taaaagaaaa ggggggactg gaagggctaa ttcactccca aagaagacaa gatctgcttt 9720 ttgcctgtac tgggtctctc tggttagacc agatctgagc ctgggagctc tctggctaac 9780 tagggaaccc actgcttaag cctcaataaa gcttgccttg agtgcttcaa gtagtgtgtg 9840 cccgtctgtt gtgtgactct ggtaactaga gatccctcag acccttttag tcagtgtgga 9900 aaatctctag ca 9912 <210> 183 <211> 9791 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 183 aaagctgagc atccggctcc ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc 60 ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg 120 taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt gggggagaac 180 cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt gccgccagaa 240 cacaggtaag tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt 300 gcgtgccttg aattacttcc acgcccctgg ctgcagtacg tgattcttga tcccgagctt 360 cgggttggaa gtgggtggga gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt 420 gcttgagttg aggcctggcc tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt 480 cgcgcctgtc tcgctgcttt cgataagtct ctagccattt aaaatttttg atgacctgct 540 gcgacgcttt ttttctggca agatagtctt gtaaatgcgg gccaagatct gcacactggt 600 atttcggttt ttggggccgc gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg 660 gcgaggcggg gcctgcgagc gcggccaccg agaatcggac gggggtagtc tcaagctggc 720 cggcctgctc tggtgcctgg cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg 780 ctggcccggt cggcaccagt tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca 840 gggagctcaa aatggaggac gcggcgctcg ggagagcggg cgggtgagtc acccacacaa 900 aggaaaaggg cctttccgtc ctcagccgtc gcttcatgtg actccacgga gtaccgggcg 960 ccgtccaggc acctcgatta gttctcgagc ttttggagta cgtcgtcttt aggttggggg 1020 gaggggtttt atgcgatgga gtttccccac actgagtggg tggagactga agttaggcca 1080 gcttggcact tgatgtaatt ctccttggaa tttgcccttt ttgagtttgg atcttggttc 1140 attctcaagc ctcagacagt ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa 1200 ctacccctct agagccgcca ccatgcttct cctggtgaca agccttctgc tctgtgagtt 1260 accacaccca gcattcctcc tgatcccaag tcagcctcat accaaaccat ccgtttttgt 1320 catgaaaaat ggaacaaatg tcgcttgtct ggtgaaggaa ttctacccca aggatataag 1380 aataaatctc gtgtcatcca agaagataac agagtttgat cctgctattg tcatctctcc 1440 cagtgggaag tacaatgctg tcaagcttgg taaatatgaa gattcaaatt cagtgacatg 1500 ttcagttcaa cacgacaata aaactgtgca ctccactgac tttgaagtga agacagattc 1560 tacagatcac gtaaaaccaa aggaaactga aaacacaaag caaccttcaa agagctgcca 1620 taaacccaaa gccatagttc ataccgagaa ggtgaacatg atgtccctca cagtgcttgg 1680 gctacgaatg ctgtttgcaa agactgttgc cgtcaatttt ctcttgactg ccaagttatt 1740 tttcttgggg tcaggcgagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa 1800 tcctggacct atgctactac ttgtgacctc actattgtta tgcgaactcc ctcatcccgc 1860 attcttgctg attccagaca ttcagatgac tcaaacaact tccagcctct ccgcctcact 1920 cggcgaccgc gtaacaataa gctgtcgggc ctcgcaagat attagtaagt acctgaattg 1980 gtatcagcaa aaacccgatg gtacagtcaa gcttctgatc taccatacca gtcgtctgca 2040 cagcggtgtc cccagcaggt tcagcggctc aggatctggt accgattatt cactgacgat 2100 ttccaacctt gagcaggagg acatcgccac ctacttctgc cagcagggta atactctgcc 2160 gtacacattc gggggcggta ccaagctcga gatcacgggt tcaacaagcg gttctggcaa 2220 gccaggcagc ggcgagggga gtacaaaggg ggaggtgaag ttgcaggaaa gtggccctgg 2280 attggtggcc ccgagccaga gtctgtctgt cacctgcaca gtttccggag taagtctgcc 2340 tgattacgga gtgtcctgga tcagacagcc acctcgaaag ggcttggagt ggcttggggt 2400 catttggggc agtgaaacca catactacaa cagcgctctt aagtccaggc tcactatcat 2460 caaggacaat tcaaagagcc aagtattctt gaaaatgaat tccctgcaga ctgatgacac 2520 cgctatttat tattgcgcta aacattatta ctatggaggt tcttatgcca tggactactg 2580 ggggcagggt acctctgtga cagtgagttc agctgcagct ggaggtggag gtagcggagg 2640 cggtggtagt ggagggggtg gttctctgga agataaacaa cttgatgcag atgtttcccc 2700 caagcccact atttttcttc cttcaattgc tgaaacaaag ctccagaagg ctggaacata 2760 cctttgtctt cttgagaaat ttttccctga tgttattaag atacattggc aagaaaagaa 2820 gagcaacacg attctgggat cccaggaggg gaacaccatg aagactaacg acacatacat 2880 gaaatttagc tggttaacgg tgccagaaaa gtcactggac aaagaacaca gatgtatcgt 2940 cagacatgag aataataaaa acggagttga tcaagaaatt atctttcctc caataaagac 3000 agatgtcatc acaatggatc ccaaagacaa ttgttcaaaa gatgcaaatg atacactact 3060 gctgcagctc acaaacacct ctgcatatta catgtacctc ctcctgctcc tcaagagtgt 3120 ggtctatttt gccatcatca cctgctgtct gcttagaaga acggctttct gctgcaatgg 3180 agagaaatca taatgagata tcgagcatct taccgccatt tatacccata tttgttctgt 3240 ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt 3300 acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa 3360 gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg 3420 tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc 3480 tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta 3540 taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt 3600 ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca 3660 actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc 3720 ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt 3780 gtcagtactg gtacctttaa gaccaatgac ttacaaggca gctgtagatc ttagccactt 3840 tttaaaagaa aaggggggac tggaagggct aattcactcc caaagaagac aagatctgct 3900 ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 3960 actagggaac ccactgctta agcctcaata aagcttgcct tgagtgcttc aatgatcata 4020 atcaagccat atcacatctg tagaggttta cttgctttaa aaaacctcca cacctccccc 4080 tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 4140 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 4200 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg atctgcgtcg 4260 acacgaagag acgactgact gactgactgg aaagaggaag ggctggaaga ggaaggagct 4320 tgatccagat cccgatctcg atccagatcc ggatcgcagc ttggcgtaat catggtcata 4380 gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 4440 cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 4500 ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 4560 acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 4620 gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 4680 gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 4740 ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 4800 cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 4860 ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 4920 taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 4980 ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 5040 cccccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5100 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 5160 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 5220 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 5280 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 5340 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 5400 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 5460 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5520 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgttgctag gttactgtca 5580 tgagcggata catatttgaa tgtatttaga aaaataaaca aaagagtttg tagaaacgca 5640 aaaaggccat ccgtcaggat ggccttctgc ttaatttgat cggtggcagt ttatggcggg 5700 cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 5760 tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 5820 ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catgggttgc 5880 ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 5940 tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 6000 tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 6060 gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 6120 tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 6180 tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 6240 cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 6300 ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 6360 gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 6420 atatcaccag ctcaccgtct ttcattgcca tacgaaattc cggatgagca ttcatcaggc 6480 gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 6540 aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 6600 atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 6660 tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 6720 ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 6780 ctcattttcg ccaaaagtga cattaaccta taaaaatagg cgtatcacga ggccagcttg 6840 ggaaaccata agaccgagat agagttgagt gttgttccag tttggaacaa gagtccacta 6900 ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca 6960 ctacgtgaac catcacccaa atcaagtttt ttggggtcga ggtgccgtaa agcactaaat 7020 cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg 7080 agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg cgctggcaag tgtagcggtc 7140 acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtactat 7200 ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 7260 tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 7320 cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 7380 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg atcgagatcg 7440 tgatccggat caagatccag atcgaattgg aggctacagt cagtggagag gactttcact 7500 gactgactga ctgcgtctca acctcctagg ggacattgat tattgactag ttattaatag 7560 taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt 7620 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 7680 acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 7740 ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 7800 attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 7860 gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg 7920 ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc 7980 caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa 8040 tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc 8100 tatataagca gagctcgttt agtgaaccgg gtctctctgg ttagaccaga tctgagcctg 8160 ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 8220 gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 8280 cttttagtca gtgtggaaaa tctctagcag tggcgcccga acagggactt gaaagcgaaa 8340 gtaaagccag aggagatctc tcgacgcagg actcggcttg ctgaagcgcg cacggcaaga 8400 ggcgaggggc ggcgactggt gagtacgcca aaaattttga ctagcggagg ctagaaggag 8460 agagtagggt gcgagagcgt cggtattaag cgggggagaa ttagataaat gggaaaaaat 8520 tcggttaagg ccagggggaa agaaacaata taaactaaaa catatagtta gggcaagcag 8580 ggagctagaa cgattcgcag ttaatcctgg ccttttagag acatcagaag gctgtagaca 8640 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 8700 taatacaata gcagtcctct attgtgtgca tcaaaggata gatgtaaaag acaccaagga 8760 agccttagat aagatagagg aagagcaaaa caaaagtaag aaaaaggcac agcaagcgat 8820 cttcagacct ggaggaggca ggaggcgata tgagggacaa ttggagaagt gaattatata 8880 aatataaagt agtaaaaatt gaaccattag gagtagcacc caccaaggca aagagaagag 8940 tggtgcagag agaaaaaaga gcagtgggaa taggagcttt gttccttggg ttcttgggag 9000 cagcaggaag cactatgggc gcagcgtcaa tgacgctgac ggtacaggcc agacaattat 9060 tgtctgatat agtgcagcag cagaacaatt tgctgagggc tattgaggcg caacagcatc 9120 tgttgcaact cacagtctgg ggcatcaaac agctccaggc aagaatcctg gctgtggaaa 9180 gatacctaaa ggatcaacag ctcctgggga tttggggttg ctctggaaaa ctcatttgca 9240 ccactgctgt gccttggaat gctagttgga gtaataaatc tctggaacag atttggaata 9300 acatgacctg gatggagtgg gacagagaaa ttaacaatta cacaagctta atacactcct 9360 taattgaaga atcgcaaaac cagcaagaaa agaatgaaca agaattattg gaattagata 9420 aatgggcaag tttgtggaat tggtttaaca taacaaattg gctgtggtat ataaaattat 9480 tcataatgat agtaggaggc ttggtaggtt taagaatagt ttttgctgta ctttctatag 9540 tgaatagagt taggcaggga tattcaccat tatcgtttca gacccacctc ccaatcccga 9600 ggggaccacg cgtacaaatg gcagtattca tccacaattt taaaagaaaa ggggggattg 9660 gggggtacag tgcaggggaa agaatagtag acataatagc aacagacata caaactaaag 9720 aattacaaaa acaaattaca aaaattcaaa attttcgggt ttattacagg gacagcagaa 9780 atccactttg g 9791 <210> 184 <211> 9791 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 184 aaagctgagc atccggctcc ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc 60 ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg 120 taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt gggggagaac 180 cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt gccgccagaa 240 cacaggtaag tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt 300 gcgtgccttg aattacttcc acgcccctgg ctgcagtacg tgattcttga tcccgagctt 360 cgggttggaa gtgggtggga gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt 420 gcttgagttg aggcctggcc tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt 480 cgcgcctgtc tcgctgcttt cgataagtct ctagccattt aaaatttttg atgacctgct 540 gcgacgcttt ttttctggca agatagtctt gtaaatgcgg gccaagatct gcacactggt 600 atttcggttt ttggggccgc gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg 660 gcgaggcggg gcctgcgagc gcggccaccg agaatcggac gggggtagtc tcaagctggc 720 cggcctgctc tggtgcctgg cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg 780 ctggcccggt cggcaccagt tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca 840 gggagctcaa aatggaggac gcggcgctcg ggagagcggg cgggtgagtc acccacacaa 900 aggaaaaggg cctttccgtc ctcagccgtc gcttcatgtg actccacgga gtaccgggcg 960 ccgtccaggc acctcgatta gttctcgagc ttttggagta cgtcgtcttt aggttggggg 1020 gaggggtttt atgcgatgga gtttccccac actgagtggg tggagactga agttaggcca 1080 gcttggcact tgatgtaatt ctccttggaa tttgcccttt ttgagtttgg atcttggttc 1140 attctcaagc ctcagacagt ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa 1200 ctacccctct agagccgcca ccatgcttct cctggtgaca agccttctgc tctgtgagtt 1260 accacaccca gcattcctcc tgatcccaga catccagatg acacagacta catcctccct 1320 gtctgcctct ctgggagaca gagtcaccat cagttgcagg gcaagtcagg acattagtaa 1380 atatttaaat tggtatcagc agaaaccaga tggaactgtt aaactcctga tctaccatac 1440 atcaagatta cactcaggag tcccatcaag gttcagtggc agtgggtctg gaacagatta 1500 ttctctcacc attagcaacc tggagcaaga agatattgcc acttactttt gccaacaggg 1560 taatacgctt ccgtacacgt tcggaggggg gactaagttg gaaataacag gctccacctc 1620 tggatccggc aagcccggat ctggcgaggg atccaccaag ggcgaggtga aactgcagga 1680 gtcaggacct ggcctggtgg cgccctcaca gagcctgtcc gtcacatgca ctgtctcagg 1740 ggtctcatta cccgactatg gtgtaagctg gattcgccag cctccacgaa agggtctgga 1800 gtggctggga gtaatatggg gtagtgaaac cacatactat aattcagctc tcaaatccag 1860 actgaccatc atcaaggaca actccaagag ccaagttttc ttaaaaatga acagtctgca 1920 aactgatgac acagccattt actactgtgc caaacattat tactacggtg gtagctatgc 1980 tatggactac tggggtcaag gaacctcagt caccgtctcc tcagcggccg caggtggagg 2040 aggttctgga ggtggtggat caggtggtgg aggatcttta gaaagtcagc ctcataccaa 2100 accatccgtt tttgtcatga aaaatggaac aaatgtcgct tgtctggtga aggaattcta 2160 ccccaaggat ataagaataa atctcgtgtc atccaagaag ataacagagt ttgatcctgc 2220 tattgtcatc tctcccagtg ggaagtacaa tgctgtcaag cttggtaaat atgaagattc 2280 aaattcagtg acatgttcag ttcaacacga caataaaact gtgcactcca ctgactttga 2340 agtgaagaca gattctacag atcacgtaaa accaaaggaa actgaaaaca caaagcaacc 2400 ttcaaagagc tgccataaac ccaaagccat agttcatacc gagaaggtga acatgatgtc 2460 cctcacagtg cttgggctac gaatgctgtt tgcaaagact gttgccgtca attttctctt 2520 gactgccaag ttatttttct tggggtcagg cgagggcaga ggaagtctgc taacatgcgg 2580 tgacgtcgag gagaatcctg gacctatgct actacttgtg acctcactat tgttatgcga 2640 actccctcat cccgcattct tgctgattcc agataaacaa cttgatgcag atgtttcccc 2700 caagcccact atttttcttc cttcaattgc tgaaacaaag ctccagaagg ctggaacata 2760 cctttgtctt cttgagaaat ttttccctga tgttattaag atacattggc aagaaaagaa 2820 gagcaacacg attctgggat cccaggaggg gaacaccatg aagactaacg acacatacat 2880 gaaatttagc tggttaacgg tgccagaaaa gtcactggac aaagaacaca gatgtatcgt 2940 cagacatgag aataataaaa acggagttga tcaagaaatt atctttcctc caataaagac 3000 agatgtcatc acaatggatc ccaaagacaa ttgttcaaaa gatgcaaatg atacactact 3060 gctgcagctc acaaacacct ctgcatatta catgtacctc ctcctgctcc tcaagagtgt 3120 ggtctatttt gccatcatca cctgctgtct gcttagaaga acggctttct gctgcaatgg 3180 agagaaatca taatgagata tcgagcatct taccgccatt tatacccata tttgttctgt 3240 ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt 3300 acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa 3360 gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg 3420 tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc 3480 tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta 3540 taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt 3600 ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca 3660 actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc 3720 ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt 3780 gtcagtactg gtacctttaa gaccaatgac ttacaaggca gctgtagatc ttagccactt 3840 tttaaaagaa aaggggggac tggaagggct aattcactcc caaagaagac aagatctgct 3900 ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 3960 actagggaac ccactgctta agcctcaata aagcttgcct tgagtgcttc aatgatcata 4020 atcaagccat atcacatctg tagaggttta cttgctttaa aaaacctcca cacctccccc 4080 tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 4140 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 4200 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg atctgcgtcg 4260 acacgaagag acgactgact gactgactgg aaagaggaag ggctggaaga ggaaggagct 4320 tgatccagat cccgatctcg atccagatcc ggatcgcagc ttggcgtaat catggtcata 4380 gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 4440 cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 4500 ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 4560 acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 4620 gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 4680 gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 4740 ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 4800 cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 4860 ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 4920 taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 4980 ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 5040 cccccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5100 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 5160 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 5220 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 5280 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 5340 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 5400 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 5460 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5520 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgttgctag gttactgtca 5580 tgagcggata catatttgaa tgtatttaga aaaataaaca aaagagtttg tagaaacgca 5640 aaaaggccat ccgtcaggat ggccttctgc ttaatttgat cggtggcagt ttatggcggg 5700 cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 5760 tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 5820 ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catgggttgc 5880 ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 5940 tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 6000 tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 6060 gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 6120 tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 6180 tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 6240 cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 6300 ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 6360 gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 6420 atatcaccag ctcaccgtct ttcattgcca tacgaaattc cggatgagca ttcatcaggc 6480 gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 6540 aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 6600 atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 6660 tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 6720 ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 6780 ctcattttcg ccaaaagtga cattaaccta taaaaatagg cgtatcacga ggccagcttg 6840 ggaaaccata agaccgagat agagttgagt gttgttccag tttggaacaa gagtccacta 6900 ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca 6960 ctacgtgaac catcacccaa atcaagtttt ttggggtcga ggtgccgtaa agcactaaat 7020 cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg 7080 agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg cgctggcaag tgtagcggtc 7140 acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtactat 7200 ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 7260 tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 7320 cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 7380 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg atcgagatcg 7440 tgatccggat caagatccag atcgaattgg aggctacagt cagtggagag gactttcact 7500 gactgactga ctgcgtctca acctcctagg ggacattgat tattgactag ttattaatag 7560 taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt 7620 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 7680 acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 7740 ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 7800 attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 7860 gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg 7920 ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc 7980 caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa 8040 tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc 8100 tatataagca gagctcgttt agtgaaccgg gtctctctgg ttagaccaga tctgagcctg 8160 ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 8220 gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 8280 cttttagtca gtgtggaaaa tctctagcag tggcgcccga acagggactt gaaagcgaaa 8340 gtaaagccag aggagatctc tcgacgcagg actcggcttg ctgaagcgcg cacggcaaga 8400 ggcgaggggc ggcgactggt gagtacgcca aaaattttga ctagcggagg ctagaaggag 8460 agagtagggt gcgagagcgt cggtattaag cgggggagaa ttagataaat gggaaaaaat 8520 tcggttaagg ccagggggaa agaaacaata taaactaaaa catatagtta gggcaagcag 8580 ggagctagaa cgattcgcag ttaatcctgg ccttttagag acatcagaag gctgtagaca 8640 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 8700 taatacaata gcagtcctct attgtgtgca tcaaaggata gatgtaaaag acaccaagga 8760 agccttagat aagatagagg aagagcaaaa caaaagtaag aaaaaggcac agcaagcgat 8820 cttcagacct ggaggaggca ggaggcgata tgagggacaa ttggagaagt gaattatata 8880 aatataaagt agtaaaaatt gaaccattag gagtagcacc caccaaggca aagagaagag 8940 tggtgcagag agaaaaaaga gcagtgggaa taggagcttt gttccttggg ttcttgggag 9000 cagcaggaag cactatgggc gcagcgtcaa tgacgctgac ggtacaggcc agacaattat 9060 tgtctgatat agtgcagcag cagaacaatt tgctgagggc tattgaggcg caacagcatc 9120 tgttgcaact cacagtctgg ggcatcaaac agctccaggc aagaatcctg gctgtggaaa 9180 gatacctaaa ggatcaacag ctcctgggga tttggggttg ctctggaaaa ctcatttgca 9240 ccactgctgt gccttggaat gctagttgga gtaataaatc tctggaacag atttggaata 9300 acatgacctg gatggagtgg gacagagaaa ttaacaatta cacaagctta atacactcct 9360 taattgaaga atcgcaaaac cagcaagaaa agaatgaaca agaattattg gaattagata 9420 aatgggcaag tttgtggaat tggtttaaca taacaaattg gctgtggtat ataaaattat 9480 tcataatgat agtaggaggc ttggtaggtt taagaatagt ttttgctgta ctttctatag 9540 tgaatagagt taggcaggga tattcaccat tatcgtttca gacccacctc ccaatcccga 9600 ggggaccacg cgtacaaatg gcagtattca tccacaattt taaaagaaaa ggggggattg 9660 gggggtacag tgcaggggaa agaatagtag acataatagc aacagacata caaactaaag 9720 aattacaaaa acaaattaca aaaattcaaa attttcgggt ttattacagg gacagcagaa 9780 atccactttg g 9791 <210> 185 <211> 9924 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 185 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccggg 600 tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 660 cttaagcctc aataaagctt gccttgagtg ctcaaagtag tgtgtgcccg tctgttgtgt 720 gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 780 ggcgcccgaa cagggacttg aaagcgaaag taaagccaga ggagatctct cgacgcagga 840 ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 900 aaattttgac tagcggaggc tagaaggaga gagtagggtg cgagagcgtc ggtattaagc 960 gggggagaat tagataaatg ggaaaaaatt cggttaaggc cagggggaaa gaaacaatat 1020 aaactaaaac atatagttag ggcaagcagg gagctagaac gattcgcagt taatcctggc 1080 cttttagaga catcagaagg ctgtagacaa atactgggac agctacaacc atcccttcag 1140 acaggatcag aagaacttag atcattatat aatacaatag cagtcctcta ttgtgtgcat 1200 caaaggatag atgtaaaaga caccaaggaa gccttagata agatagagga agagcaaaac 1260 aaaagtaaga aaaaggcaca gcaagcgatc ttcagacctg gaggaggcag gaggcgatat 1320 gagggacaat tggagaagtg aattatataa atataaagta gtaaaaattg aaccattagg 1380 agtagcaccc accaaggcaa agagaagagt ggtgcagaga gaaaaaagag cagtgggaat 1440 aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcgtcaat 1500 gacgctgacg gtacaggcca gacaattatt gtctgatata gtgcagcagc agaacaattt 1560 gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaaaca 1620 gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcctggggat 1680 ttggggttgc tctggaaaac tcatttgcac cactgctgtg ccttggaatg ctagttggag 1740 taataaatct ctggaacaga tttggaataa catgacctgg atggagtggg acagagaaat 1800 taacaattac acaagcttaa tacactcctt aattgaagaa tcgcaaaacc agcaagaaaa 1860 gaatgaacaa gaattattgg aattagataa atgggcaagt ttgtggaatt ggtttaacat 1920 aacaaattgg ctgtggtata taaaattatt cataatgata gtaggaggct tggtaggttt 1980 aagaatagtt tttgctgtac tttctatagt gaatagagtt aggcagggat attcaccatt 2040 atcgtttcag acccacctcc caatcccgag gggaccacgc gtacaaatgg cagtattcat 2100 ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga 2160 cataatagca acagacatac aaactaaaga attacaaaaa caaattacaa aaattcaaaa 2220 ttttcgggtt tattacaggg acagcagaaa tccactttgg aaagctgagc atccggctcc 2280 ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg 2340 gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg taaactggga aagtgatgtc 2400 gtgtactggc tccgcctttt tcccgagggt gggggagaac cgtatataag tgcagtagtc 2460 gccgtgaacg ttctttttcg caacgggttt gccgccagaa cacaggtaag tgccgtgtgt 2520 ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg aattacttcc 2580 acgcccctgg ctgcagtacg tgattcttga tcccgagctt cgggttggaa gtgggtggga 2640 gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt gcttgagttg aggcctggcc 2700 tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt cgcgcctgtc tcgctgcttt 2760 cgataagtct ctagccattt aaaatttttg atgacctgct gcgacgcttt ttttctggca 2820 agatagtctt gtaaatgcgg gccaagatct gcacactggt atttcggttt ttggggccgc 2880 gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg gcgaggcggg gcctgcgagc 2940 gcggccaccg agaatcggac gggggtagtc tcaagctggc cggcctgctc tggtgcctgg 3000 cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg ctggcccggt cggcaccagt 3060 tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca gggagctcaa aatggaggac 3120 gcggcgctcg ggagagcggg cgggtgagtc acccacacaa aggaaaaggg cctttccgtc 3180 ctcagccgtc gcttcatgtg actccacgga gtaccgggcg ccgtccaggc acctcgatta 3240 gttctcgagc ttttggagta cgtcgtcttt aggttggggg gaggggtttt atgcgatgga 3300 gtttccccac actgagtggg tggagactga agttaggcca gcttggcact tgatgtaatt 3360 ctccttggaa tttgcccttt ttgagtttgg atcttggttc attctcaagc ctcagacagt 3420 ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa ctacccctca gagccgccac 3480 catgcttctc ctggtgacaa gccttctgct ctgtgagtta ccacacccag cattcctcct 3540 gatcccaagt cagcctcata ccaaaccatc cgtttttgtc atgaaaaatg gaacaaatgt 3600 cgcttgtctg gtgaaggaat tctaccccaa ggatataaga ataaatctcg tgtcatccaa 3660 gaagataaca gagtttgatc ctgctattgt catctctccc agtgggaagt acaatgctgt 3720 caagcttggt aaatatgaag attcaaattc agtgacatgt tcagttcaac acgacaataa 3780 aactgtgcac tccactgact ttgaagtgaa gacagattct acagatcacg taaaaccaaa 3840 ggaaactgaa aacacaaagc aaccttcaaa gagctgccat aaacccaaag ccatagttca 3900 taccgagaag gtgaacatga tgtccctcac agtgcttggg ctacgaatgc tgtttgcaaa 3960 gactgttgcc gtcaattttc tcttgactgc caagttattt ttcttggggt caggcgaggg 4020 cagaggaagt ctgctaacat gcggtgacgt cgaggagaat cctggaccta tgctactact 4080 tgtgacctca ctattgttat gcgaactccc tcatcccgca ttcttgctga ttccagacat 4140 tcagatgact caaacaactt ccagcctctc cgcctcactc ggcgaccgcg taacaataag 4200 ctgtcgggcc tcgcaagata ttagtaagta cctgaattgg tatcagcaaa aacccgatgg 4260 tacagtcaag cttctgatct accataccag tcgtctgcac agcggtgtcc ccagcaggtt 4320 cagcggctca ggatctggta ccgattattc actgacgatt tccaaccttg agcaggagga 4380 catcgccacc tacttctgcc agcagggtaa tactctgccg tacacattcg ggggcggtac 4440 caagctcgag atcacgggtt caacaagcgg ttctggcaag ccaggcagcg gcgaggggag 4500 tacaaagggg gaggtgaagt tgcaggaaag tggccctgga ttggtggccc cgagccagag 4560 tctgtctgtc acctgcacag tttccggagt aagtctgcct gattacggag tgtcctggat 4620 cagacagcca cctcgaaagg gcttggagtg gcttggggtc atttggggca gtgaaaccac 4680 atactacaac agcgctctta agtccaggct cactatcatc aaggacaatt caaagagcca 4740 agtattcttg aaaatgaatt ccctgcagac tgatgacacc gctatttatt attgcgctaa 4800 acattattac tatggaggtt cttatgccat ggactactgg gggcagggta cctctgtgac 4860 agtgagttca gctgcagctg gaggtggagg tagcggaggc ggtggtagtg gagggggtgg 4920 ttctctggaa gataaacaac ttgatgcaga tgtttccccc aagcccacta tttttcttcc 4980 ttcaattgct gaaacaaagc tccagaaggc tggaacatac ctttgtcttc ttgagaaatt 5040 tttccctgat gttattaaga tacattggca agaaaagaag agcaacacga ttctgggatc 5100 ccaggagggg aacaccatga agactaacga cacatacatg aaatttagct ggttaacggt 5160 gccagaaaag tcactggaca aagaacacag atgtatcgtc agacatgaga ataataaaaa 5220 cggagttgat caagaaatta tctttcctcc aataaagaca gatgtcatca caatggatcc 5280 caaagacaat tgttcaaaag atgcaaatga tacactactg ctgcagctca caaacacctc 5340 tgcatattac atgtacctcc tcctgctcct caagagtgtg gtctattttg ccatcatcac 5400 ctgctgtctg cttagaagaa cggctttctg ctgcaatgga gagaaatcat aatgagatat 5460 cgagcatctt accgccattt atacccatat ttgttctgtt tttcttgatt tgggtataca 5520 tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg gatatgtaat 5580 tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc gttatttacg 5640 ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga ctgatattct 5700 taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc tgtatctagc 5760 tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgctgtctct 5820 tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgtttgctga 5880 cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg ggactttcgc 5940 tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc gctgctggac 6000 aggggctagg ttgctgggca ctgataattc cgtggtgttg tcagtactgg tacctttaag 6060 accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa aggggggact 6120 ggaagggcta attcactccc aaagaagaca agatctgctt tttgcctgta ctgggtctct 6180 ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc cactgcttaa 6240 gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc 6300 tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta gcatgatcat 6360 aatcaagcca tatcacatct gtagaggttt acttgcttta aaaaacctcc acacctcccc 6420 ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 6480 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 6540 cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgcgtc 6600 gacacgaaga gacgactgac tgactgactg gaaagaggaa gggctggaag aggaaggagc 6660 ttgatccaga tcccgatctc gatccagatc cggatcgcag cttggcgtaa tcatggtcat 6720 agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 6780 gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 6840 gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 6900 aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 6960 cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 7020 ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 7080 aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 7140 acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 7200 gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 7260 ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 7320 gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 7380 cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 7440 taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 7500 atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 7560 cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 7620 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 7680 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 7740 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 7800 tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 7860 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 7920 tatttcgttc atccatagtt gcctgactcc ccgtcgttgc taggttactg tcatgagcgg 7980 atacatattt gaatgtattt agaaaaataa acaaaagagt ttgtagaaac gcaaaaaggc 8040 catccgtcag gatggccttc tgcttaattt gatcggtggc agtttatggc gggcgtcctg 8100 cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc cgctcccggc ggatttgtcc 8160 tactcaggag agcgttcacc gacaaacaac agataaaacg aaaggcccag tctttcgact 8220 gagcctttcg ttttatttga tgcctggcag ttccctactc tcgcatgggt tgcggccgcc 8280 cgggccgtcg accaattctc atgtttgaca gcttatcatc gaatttctgc cattcatccg 8340 cttattatca cttattcagg cgtagcaacc aggcgtttaa gggcaccaat aactgcctta 8400 aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 8460 gccgacatgg aagccatcac aaacggcatg atgaacctga atcgccagcg gcatcagcac 8520 cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 8580 attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 8640 catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 8700 ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 8760 aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 8820 cagctcaccg tctttcattg ccatacgaaa ttccggatga gcattcatca ggcgggcaag 8880 aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 8940 cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 9000 aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 9060 ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 9120 tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 9180 tcgccaaaag tgacattaac ctataaaaat aggcgtatca cgaggccagc ttgggaaacc 9240 ataagaccga gatagagttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 9300 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 9360 aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 9420 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 9480 aagggaagaa agcgaaagga gcgggcgcta aggcgctggc aagtgtagcg gtcacgctgc 9540 gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtac tatggttgct 9600 ttgacgtatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 9660 ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 9720 attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 9780 gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa ttgatcgaga tcgtgatccg 9840 gatcaagatc cagatcgaat tggaggctac agtcagtgga gaggactttc actgactgac 9900 tgactgcgtc tcaacctcct aggg 9924 <210> 186 <211> 9845 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 186 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggcgtaatca 360 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 420 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 480 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 540 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 600 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 660 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 720 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 780 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 840 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 900 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 960 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1020 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1080 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1140 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1200 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1260 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1320 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1380 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1440 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1500 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 1560 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgttgctag gttactgtca 1620 tgagcggata catatttgaa tgtatttaga aaaataaaca aaagagtttg tagaaacgca 1680 aaaaggccat ccgtcaggat ggccttctgc ttaatttgat cggtggcagt ttatggcggg 1740 cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 1800 tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 1860 ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catgggttgc 1920 ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 1980 tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 2040 tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 2100 gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 2160 tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 2220 tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 2280 cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 2340 ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 2400 gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 2460 atatcaccag ctcaccgtct ttcattgcca tacgaaattc cggatgagca ttcatcaggc 2520 gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 2580 aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 2640 atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 2700 tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 2760 ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 2820 ctcattttcg ccaaaagtga cattaaccta taaaaatagg cgtatcacga ggccagcttg 2880 ggaaaccata agaccgagat agagttgagt gttgttccag tttggaacaa gagtccacta 2940 ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca 3000 ctacgtgaac catcacccaa atcaagtttt ttggggtcga ggtgccgtaa agcactaaat 3060 cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg 3120 agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg cgctggcaag tgtagcggtc 3180 acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtactat 3240 ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 3300 tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 3360 cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 3420 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg atcgagatcg 3480 tgatccggat caagatccag atcgaattgg aggctacagt cagtggagag gactttcact 3540 gactgactga ctgcgtctca acctcctagg ggacattgat tattgactag ttattaatag 3600 taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt 3660 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 3720 acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 3780 ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 3840 attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 3900 gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg 3960 ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc 4020 caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa 4080 tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc 4140 tatataagca gagctcgttt agtgaaccgg gtctctctgg ttagaccaga tctgagcctg 4200 ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 4260 gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 4320 cttttagtca gtgtggaaaa tctctagcag tggcgcccga acagggactt gaaagcgaaa 4380 gtaaagccag aggagatctc tcgacgcagg actcggcttg ctgaagcgcg cacggcaaga 4440 ggcgaggggc ggcgactggt gagtacgcca aaaattttga ctagcggagg ctagaaggag 4500 agagtagggt gcgagagcgt cggtattaag cgggggagaa ttagataaat gggaaaaaat 4560 tcggttaagg ccagggggaa agaaacaata taaactaaaa catatagtta gggcaagcag 4620 ggagctagaa cgattcgcag ttaatcctgg ccttttagag acatcagaag gctgtagaca 4680 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 4740 taatacaata gcagtcctct attgtgtgca tcaaaggata gatgtaaaag acaccaagga 4800 agccttagat aagatagagg aagagcaaaa caaaagtaag aaaaaggcac agcaagcgat 4860 cttcagacct ggaggaggca ggaggcgata tgagggacaa ttggagaagt gaattatata 4920 aatataaagt agtaaaaatt gaaccattag gagtagcacc caccaaggca aagagaagag 4980 tggtgcagag agaaaaaaga gcagtgggaa taggagcttt gttccttggg ttcttgggag 5040 cagcaggaag cactatgggc gcagcgtcaa tgacgctgac ggtacaggcc agacaattat 5100 tgtctgatat agtgcagcag cagaacaatt tgctgagggc tattgaggcg caacagcatc 5160 tgttgcaact cacagtctgg ggcatcaaac agctccaggc aagaatcctg gctgtggaaa 5220 gatacctaaa ggatcaacag ctcctgggga tttggggttg ctctggaaaa ctcatttgca 5280 ccactgctgt gccttggaat gctagttgga gtaataaatc tctggaacag atttggaata 5340 acatgacctg gatggagtgg gacagagaaa ttaacaatta cacaagctta atacactcct 5400 taattgaaga atcgcaaaac cagcaagaaa agaatgaaca agaattattg gaattagata 5460 aatgggcaag tttgtggaat tggtttaaca taacaaattg gctgtggtat ataaaattat 5520 tcataatgat agtaggaggc ttggtaggtt taagaatagt ttttgctgta ctttctatag 5580 tgaatagagt taggcaggga tattcaccat tatcgtttca gacccacctc ccaatcccga 5640 ggggaccacg cgtacaaatg gcagtattca tccacaattt taaaagaaaa ggggggattg 5700 gggggtacag tgcaggggaa agaatagtag acataatagc aacagacata caaactaaag 5760 aattacaaaa acaaattaca aaaattcaaa attttcgggt ttattacagg gacagcagaa 5820 atccactttg gaaagctgag catccggctc cggtgcccgt cagtgggcag agcgcacatc 5880 gcccacagtc cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag 5940 gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg 6000 tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt 6060 tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg 6120 ttatggccct tgcgtgcctt gaattacttc cacgcccctg gctgcagtac gtgattcttg 6180 atcccgagct tcgggttgga agtgggtggg agagttcgag gccttgcgct taaggagccc 6240 cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct 6300 ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc tctagccatt taaaattttt 6360 gatgacctgc tgcgacgctt tttttctggc aagatagtct tgtaaatgcg ggccaagatc 6420 tgcacactgg tatttcggtt tttggggccg cgggcggcga cggggcccgt gcgtcccagc 6480 gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc gagaatcgga cgggggtagt 6540 ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct 6600 gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg 6660 gccctgctgc agggagctca aaatggagga cgcggcgctc gggagagcgg gcgggtgagt 6720 cacccacaca aaggaaaagg gcctttccgt cctcagccgt cgcttcatgt gactccacgg 6780 agtaccgggc gccgtccagg cacctcgatt agttctcgag cttttggagt acgtcgtctt 6840 taggttgggg ggaggggttt tatgcgatgg agtttcccca cactgagtgg gtggagactg 6900 aagttaggcc agcttggcac ttgatgtaat tctccttgga atttgccctt tttgagtttg 6960 gatcttggtt cattctcaag cctcagacag tggttcaaag tttttttctt ccatttcagg 7020 tgtcgtgaaa actacccctc agagccgcca ccatgcttct cctggtgaca agccttctgc 7080 tctgtgagtt accacaccca gcattcctcc tgatcccaag tcagcctcat accaaaccat 7140 ccgtttttgt catgaaaaat ggaacaaatg tcgcttgtct ggtgaaggaa ttctacccca 7200 aggatataag aataaatctc gtgtcatcca agaagataac agagtttgat cctgctattg 7260 tcatctctcc cagtgggaag tacaatgctg tcaagcttgg taaatatgaa gattcaaatt 7320 cagtgacatg ttcagttcaa cacgacaata aaactgtgca ctccactgac tttgaagtga 7380 agacagattc tacagatcac gtaaaaccaa aggaaactga aaacacaaag caaccttcaa 7440 agagctgcca taaacccaaa gccatagttc ataccgagaa ggtgaacatg atgtccctca 7500 cagtgcttgg gctacgaatg ctgtttgcaa agactgttgc cgtcaatttt ctcttgactg 7560 ccaagttatt tttcttgggg tcaggcgcta ctaacttcag cctgctgaag caggctggag 7620 acgtggagga gaaccctgga cctatgctac tacttgtgac ctcactattg ttatgcgaac 7680 tccctcatcc cgcattcttg ctgattccag acattcagat gactcaaaca acttccagcc 7740 tctccgcctc actcggcgac cgcgtaacaa taagctgtcg ggcctcgcaa gatattagta 7800 agtacctgaa ttggtatcag caaaaacccg atggtacagt caagcttctg atctaccata 7860 ccagtcgtct gcacagcggt gtccccagca ggttcagcgg ctcaggatct ggtaccgatt 7920 attcactgac gatttccaac cttgagcagg aggacatcgc cacctacttc tgccagcagg 7980 gtaatactct gccgtacaca ttcgggggcg gtaccaagct cgagatcacg ggttcaacaa 8040 gcggttctgg caagccaggc agcggcgagg ggagtacaaa gggggaggtg aagttgcagg 8100 aaagtggccc tggattggtg gccccgagcc agagtctgtc tgtcacctgc acagtttccg 8160 gagtaagtct gcctgattac ggagtgtcct ggatcagaca gccacctcga aagggcttgg 8220 agtggcttgg ggtcatttgg ggcagtgaaa ccacatacta caacagcgct cttaagtcca 8280 ggctcactat catcaaggac aattcaaaga gccaagtatt cttgaaaatg aattccctgc 8340 agactgatga caccgctatt tattattgcg ctaaacatta ttactatgga ggttcttatg 8400 ccatggacta ctgggggcag ggtacctctg tgacagtgag ttcagctgca gctggaggtg 8460 gaggtagcgg aggcggtggt agtggagggg gtggttctct ggaagataaa caacttgatg 8520 cagatgtttc ccccaagccc actatttttc ttccttcaat tgctgaaaca aagctccaga 8580 aggctggaac atacctttgt cttcttgaga aatttttccc tgatgttatt aagatacatt 8640 ggcaagaaaa gaagagcaac acgattctgg gatcccagga ggggaacacc atgaagacta 8700 acgacacata catgaaattt agctggttaa cggtgccaga aaagtcactg gacaaagaac 8760 acagatgtat cgtcagacat gagaataata aaaacggagt tgatcaagaa attatctttc 8820 ctccaataaa gacagatgtc atcacaatgg atcccaaaga caattgttca aaagatgcaa 8880 atgatacact actgctgcag ctcacaaaca cctctgcata ttacatgtac ctcctcctgc 8940 tcctcaagag tgtggtctat tttgccatca tcacctgctg tctgcttaga agaacggctt 9000 tctgctgcaa tggagagaaa tcataatgag atatcgagca tcttaccgcc atttataccc 9060 atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt 9120 ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag 9180 acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg 9240 attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 9300 gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt 9360 tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc 9420 gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 9480 ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 9540 aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 9600 attccgtggt gttgtcagta ctggtacctt taagaccaat gacttacaag gcagctgtag 9660 atcttagcca ctttttaaaa gaaaaggggg gactggaagg gctaattcac tcccaaagaa 9720 gacaagatct gctttttgcc tgtactgggt ctctctggtt agaccagatc tgagcctggg 9780 agctctctgg ctaactaggg aacccactgc ttaagcctca ataaagcttg ccttgagtgc 9840 ttcaa 9845 <210> 187 <211> 9927 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 187 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccggg 600 tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 660 cttaagcctc aataaagctt gccttgagtg ctcaaagtag tgtgtgcccg tctgttgtgt 720 gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 780 ggcgcccgaa cagggacttg aaagcgaaag taaagccaga ggagatctct cgacgcagga 840 ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 900 aaattttgac tagcggaggc tagaaggaga gagtagggtg cgagagcgtc ggtattaagc 960 gggggagaat tagataaatg ggaaaaaatt cggttaaggc cagggggaaa gaaacaatat 1020 aaactaaaac atatagttag ggcaagcagg gagctagaac gattcgcagt taatcctggc 1080 cttttagaga catcagaagg ctgtagacaa atactgggac agctacaacc atcccttcag 1140 acaggatcag aagaacttag atcattatat aatacaatag cagtcctcta ttgtgtgcat 1200 caaaggatag atgtaaaaga caccaaggaa gccttagata agatagagga agagcaaaac 1260 aaaagtaaga aaaaggcaca gcaagcgatc ttcagacctg gaggaggcag gaggcgatat 1320 gagggacaat tggagaagtg aattatataa atataaagta gtaaaaattg aaccattagg 1380 agtagcaccc accaaggcaa agagaagagt ggtgcagaga gaaaaaagag cagtgggaat 1440 aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcgtcaat 1500 gacgctgacg gtacaggcca gacaattatt gtctgatata gtgcagcagc agaacaattt 1560 gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaaaca 1620 gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcctggggat 1680 ttggggttgc tctggaaaac tcatttgcac cactgctgtg ccttggaatg ctagttggag 1740 taataaatct ctggaacaga tttggaataa catgacctgg atggagtggg acagagaaat 1800 taacaattac acaagcttaa tacactcctt aattgaagaa tcgcaaaacc agcaagaaaa 1860 gaatgaacaa gaattattgg aattagataa atgggcaagt ttgtggaatt ggtttaacat 1920 aacaaattgg ctgtggtata taaaattatt cataatgata gtaggaggct tggtaggttt 1980 aagaatagtt tttgctgtac tttctatagt gaatagagtt aggcagggat attcaccatt 2040 atcgtttcag acccacctcc caatcccgag gggaccacgc gtacaaatgg cagtattcat 2100 ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga 2160 cataatagca acagacatac aaactaaaga attacaaaaa caaattacaa aaattcaaaa 2220 ttttcgggtt tattacaggg acagcagaaa tccactttgg aaagctgagc atccggctcc 2280 ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg 2340 gtcggcaatt gaaccggtgc ctagagaagg tggcgcgggg taaactggga aagtgatgtc 2400 gtgtactggc tccgcctttt tcccgagggt gggggagaac cgtatataag tgcagtagtc 2460 gccgtgaacg ttctttttcg caacgggttt gccgccagaa cacaggtaag tgccgtgtgt 2520 ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg aattacttcc 2580 acgcccctgg ctgcagtacg tgattcttga tcccgagctt cgggttggaa gtgggtggga 2640 gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt gcttgagttg aggcctggcc 2700 tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt cgcgcctgtc tcgctgcttt 2760 cgataagtct ctagccattt aaaatttttg atgacctgct gcgacgcttt ttttctggca 2820 agatagtctt gtaaatgcgg gccaagatct gcacactggt atttcggttt ttggggccgc 2880 gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg gcgaggcggg gcctgcgagc 2940 gcggccaccg agaatcggac gggggtagtc tcaagctggc cggcctgctc tggtgcctgg 3000 cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg ctggcccggt cggcaccagt 3060 tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca gggagctcaa aatggaggac 3120 gcggcgctcg ggagagcggg cgggtgagtc acccacacaa aggaaaaggg cctttccgtc 3180 ctcagccgtc gcttcatgtg actccacgga gtaccgggcg ccgtccaggc acctcgatta 3240 gttctcgagc ttttggagta cgtcgtcttt aggttggggg gaggggtttt atgcgatgga 3300 gtttccccac actgagtggg tggagactga agttaggcca gcttggcact tgatgtaatt 3360 ctccttggaa tttgcccttt ttgagtttgg atcttggttc attctcaagc ctcagacagt 3420 ggttcaaagt ttttttcttc catttcaggt gtcgtgaaaa ctacccctca gagccgccac 3480 catgcttctc ctggtgacaa gccttctgct ctgtgagtta ccacacccag cattcctcct 3540 gatcccaagt cagcctcata ccaaaccatc cgtttttgtc atgaaaaatg gaacaaatgt 3600 cgcttgtctg gtgaaggaat tctaccccaa ggatataaga ataaatctcg tgtcatccaa 3660 gaagataaca gagtttgatc ctgctattgt catctctccc agtgggaagt acaatgctgt 3720 caagcttggt aaatatgaag attcaaattc agtgacatgt tcagttcaac acgacaataa 3780 aactgtgcac tccactgact ttgaagtgaa gacagattct acagatcacg taaaaccaaa 3840 ggaaactgaa aacacaaagc aaccttcaaa gagctgccat aaacccaaag ccatagttca 3900 taccgagaag gtgaacatga tgtccctcac agtgcttggg ctacgaatgc tgtttgcaaa 3960 gactgttgcc gtcaattttc tcttgactgc caagttattt ttcttggggt caggcgctac 4020 taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatgctact 4080 acttgtgacc tcactattgt tatgcgaact ccctcatccc gcattcttgc tgattccaga 4140 cattcagatg actcaaacaa cttccagcct ctccgcctca ctcggcgacc gcgtaacaat 4200 aagctgtcgg gcctcgcaag atattagtaa gtacctgaat tggtatcagc aaaaacccga 4260 tggtacagtc aagcttctga tctaccatac cagtcgtctg cacagcggtg tccccagcag 4320 gttcagcggc tcaggatctg gtaccgatta ttcactgacg atttccaacc ttgagcagga 4380 ggacatcgcc acctacttct gccagcaggg taatactctg ccgtacacat tcgggggcgg 4440 taccaagctc gagatcacgg gttcaacaag cggttctggc aagccaggca gcggcgaggg 4500 gagtacaaag ggggaggtga agttgcagga aagtggccct ggattggtgg ccccgagcca 4560 gagtctgtct gtcacctgca cagtttccgg agtaagtctg cctgattacg gagtgtcctg 4620 gatcagacag ccacctcgaa agggcttgga gtggcttggg gtcatttggg gcagtgaaac 4680 cacatactac aacagcgctc ttaagtccag gctcactatc atcaaggaca attcaaagag 4740 ccaagtattc ttgaaaatga attccctgca gactgatgac accgctattt attattgcgc 4800 taaacattat tactatggag gttcttatgc catggactac tgggggcagg gtacctctgt 4860 gacagtgagt tcagctgcag ctggaggtgg aggtagcgga ggcggtggta gtggaggggg 4920 tggttctctg gaagataaac aacttgatgc agatgtttcc cccaagccca ctatttttct 4980 tccttcaatt gctgaaacaa agctccagaa ggctggaaca tacctttgtc ttcttgagaa 5040 atttttccct gatgttatta agatacattg gcaagaaaag aagagcaaca cgattctggg 5100 atcccaggag gggaacacca tgaagactaa cgacacatac atgaaattta gctggttaac 5160 ggtgccagaa aagtcactgg acaaagaaca cagatgtatc gtcagacatg agaataataa 5220 aaacggagtt gatcaagaaa ttatctttcc tccaataaag acagatgtca tcacaatgga 5280 tcccaaagac aattgttcaa aagatgcaaa tgatacacta ctgctgcagc tcacaaacac 5340 ctctgcatat tacatgtacc tcctcctgct cctcaagagt gtggtctatt ttgccatcat 5400 cacctgctgt ctgcttagaa gaacggcttt ctgctgcaat ggagagaaat cataatgaga 5460 tatcgagcat cttaccgcca tttataccca tatttgttct gtttttcttg atttgggtat 5520 acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt 5580 aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt 5640 acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat 5700 tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct 5760 agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc 5820 tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc 5880 tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt 5940 cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg 6000 gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtcagtac tggtaccttt 6060 aagaccaatg acttacaagg cagctgtaga tcttagccac tttttaaaag aaaagggggg 6120 actggaaggg ctaattcact cccaaagaag acaagatctg ctttttgcct gtactgggtc 6180 tctctggtta gaccagatct gagcctggga gctctctggc taactaggga acccactgct 6240 taagcctcaa taaagcttgc cttgagtgct tcaagtagtg tgtgcccgtc tgttgtgtga 6300 ctctggtaac tagagatccc tcagaccctt ttagtcagtg tggaaaatct ctagcatgat 6360 cataatcaag ccatatcaca tctgtagagg tttacttgct ttaaaaaacc tccacacctc 6420 cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 6480 tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 6540 ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatctgc 6600 gtcgacacga agagacgact gactgactga ctggaaagag gaagggctgg aagaggaagg 6660 agcttgatcc agatcccgat ctcgatccag atccggatcg cagcttggcg taatcatggt 6720 catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 6780 gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 6840 tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 6900 gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 6960 actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 7020 tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 7080 aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 7140 ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 7200 aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 7260 cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 7320 cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 7380 aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 7440 cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 7500 ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 7560 gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 7620 gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 7680 agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 7740 acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 7800 tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 7860 agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 7920 gtctatttcg ttcatccata gttgcctgac tccccgtcgt tgctaggtta ctgtcatgag 7980 cggatacata tttgaatgta tttagaaaaa taaacaaaag agtttgtaga aacgcaaaaa 8040 ggccatccgt caggatggcc ttctgcttaa tttgatcggt ggcagtttat ggcgggcgtc 8100 ctgcccgcca ccctccgggc cgttgcttcg caacgttcaa atccgctccc ggcggatttg 8160 tcctactcag gagagcgttc accgacaaac aacagataaa acgaaaggcc cagtctttcg 8220 actgagcctt tcgttttatt tgatgcctgg cagttcccta ctctcgcatg ggttgcggcc 8280 gcccgggccg tcgaccaatt ctcatgtttg acagcttatc atcgaatttc tgccattcat 8340 ccgcttatta tcacttattc aggcgtagca accaggcgtt taagggcacc aataactgcc 8400 ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt cattaagcat 8460 tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca gcggcatcag 8520 caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga agaagttgtc 8580 catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg ctgagacgaa 8640 aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt aacacgccac 8700 atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac tccagagcga 8760 tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac tatcccatat 8820 caccagctca ccgtctttca ttgccatacg aaattccgga tgagcattca tcaggcgggc 8880 aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg tctttaaaaa 8940 ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg actgaaatgc 9000 ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc cagtgatttt 9060 tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa atacgcccgg 9120 tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat caacgtctca 9180 ttttcgccaa aagtgacatt aacctataaa aataggcgta tcacgaggcc agcttgggaa 9240 accataagac cgagatagag ttgagtgttg ttccagtttg gaacaagagt ccactattaa 9300 agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac 9360 gtgaaccatc acccaaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga 9420 accctaaagg gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa 9480 aggaagggaa gaaagcgaaa ggagcgggcg ctaaggcgct ggcaagtgta gcggtcacgc 9540 tgcgcgtaac caccacaccc gccgcgctta atgcgccgct acagggcgcg tactatggtt 9600 gctttgacgt atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 9660 gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 9720 gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 9780 agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgatcg agatcgtgat 9840 ccggatcaag atccagatcg aattggaggc tacagtcagt ggagaggact ttcactgact 9900 gactgactgc gtctcaacct cctaggg 9927 <210> 188 <211> 9407 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 188 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 360 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 420 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 480 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 540 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 600 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 660 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 720 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 780 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 840 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 900 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 960 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1020 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1080 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1140 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1200 gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1260 tcgttgctag gttactgtca tgagcggata catatttgaa tgtatttaga aaaataaaca 1320 aaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat 1380 cggtggcagt ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt 1440 tcaaatccgc tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga 1500 taaaacgaaa ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc 1560 cctactctcg catgggttgc ggccgcccgg gccgtcgacc aattctcatg tttgacagct 1620 tatcatcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaaccagg 1680 cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca 1740 gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaaa cggcatgatg 1800 aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt 1860 gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact 1920 cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc 1980 caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc 2040 gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta 2100 acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca tacgaaattc 2160 cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt 2220 atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt 2280 acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc 2340 aacggtggta tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct 2400 cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc 2460 tcttacgtgc cgatcaacgt ctcattttcg ccaaaagtga cattaaccta taaaaatagg 2520 cgtatcacga ggccagcttg ggaaaccata agaccgagat agagttgagt gttgttccag 2580 tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg 2640 tctatcaggg cgatggccca ctacgtgaac catcacccaa atcaagtttt ttggggtcga 2700 ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg 2760 gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg 2820 cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc 2880 cgctacaggg cgcgtactat ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg 2940 cgtaaggaga aaatacatcg tgatccggat caagatccag atcgaattgg aggctacagt 3000 cagtggagag gactttcact gactgactga ctgcgtctca acctcctagg ggacattgat 3060 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 3120 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 3180 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 3240 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 3300 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 3360 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 3420 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3480 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3540 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3600 ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgg gtctctctgg 3660 ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 3720 caataaagct tgccttgagt gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt 3780 aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 3840 acagggactt gaaagcgaaa gtaaagccag aggagatctc tcgacgcagg actcggcttg 3900 ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 3960 ctagcggagg ctagaaggag agagtagggt gcgagagcgt cggtattaag cgggggagaa 4020 ttagataaat gggaaaaaat tcggttaagg ccagggggaa agaaacaata taaactaaaa 4080 catatagtta gggcaagcag ggagctagaa cgattcgcag ttaatcctgg ccttttagag 4140 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 4200 gaagaactta gatcattata taatacaata gcagtcctct attgtgtgca tcaaaggata 4260 gatgtaaaag acaccaagga agccttagat aagatagagg aagagcaaaa caaaagtaag 4320 aaaaaggcac agcaagcgat cttcagacct ggaggaggca ggaggcgata tgagggacaa 4380 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 4440 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 4500 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 4560 ggtacaggcc agacaattat tgtctgatat agtgcagcag cagaacaatt tgctgagggc 4620 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaaac agctccaggc 4680 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 4740 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 4800 tctggaacag atttggaata acatgacctg gatggagtgg gacagagaaa ttaacaatta 4860 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 4920 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 4980 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 5040 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 5100 gacccacctc ccaatcccga ggggaccacg cgtacaaatg gcagtattca tccacaattt 5160 taaaagaaaa ggggggattg gggggtacag tgcaggggaa agaatagtag acataatagc 5220 aacagacata caaactaaag aattacaaaa acaaattaca aaaattcaaa attttcgggt 5280 ttattacagg gacagcagaa atccactttg gaaagctgag catccggctc cggtgcccgt 5340 cagtgggcag agcgcacatc gcccacagtc cccgagaagt tggggggagg ggtcggcaat 5400 tgaaccggtg cctagagaag gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg 5460 ctccgccttt ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac 5520 gttctttttc gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc 5580 gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattacttc cacgcccctg 5640 gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg agagttcgag 5700 gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 5760 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 5820 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 5880 tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 5940 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 6000 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 6060 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 6120 ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga cgcggcgctc 6180 gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt cctcagccgt 6240 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctcgag 6300 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 6360 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 6420 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 6480 tttttttctt ccatttcagg tgtcgtgaaa actacccctc agagccgcca ccatgcttct 6540 cctggtgaca agccttctgc tctgtgagtt accacaccca gcattcctcc tgatcccaga 6600 catccagatg acacagacta catcctccct gtctgcctct ctgggagaca gagtcaccat 6660 cagttgcagg gcaagtcagg acattagtaa atatttaaat tggtatcagc agaaaccaga 6720 tggaactgtt aaactcctga tctaccatac atcaagatta cactcaggag tcccatcaag 6780 gttcagtggc agtgggtctg gaacagatta ttctctcacc attagcaacc tggagcaaga 6840 agatattgcc acttactttt gccaacaggg taatacgctt ccgtacacgt tcggaggggg 6900 gactaagttg gaaataacag gctccacctc tggatccggc aagcccggat ctggcgaggg 6960 atccaccaag ggcgaggtga aactgcagga gtcaggacct ggcctggtgg cgccctcaca 7020 gagcctgtcc gtcacatgca ctgtctcagg ggtctcatta cccgactatg gtgtaagctg 7080 gattcgccag cctccacgaa agggtctgga gtggctggga gtaatatggg gtagtgaaac 7140 cacatactat aattcagctc tcaaatccag actgaccatc atcaaggaca actccaagag 7200 ccaagttttc ttaaaaatga acagtctgca aactgatgac acagccattt actactgtgc 7260 caaacattat tactacggtg gtagctatgc tatggactac tggggtcaag gaacctcagt 7320 caccgtctcc tcagcggccg caggtggagg aggttctgga ggtggtggat caggtggtgg 7380 aggatcttta gaaagtcagc ctcataccaa accatccgtt tttgtcatga aaaatggaac 7440 aaatgtcgct tgtctggtga aggaattcta ccccaaggat ataagaataa atctcgtgtc 7500 atccaagaag ataacagagt ttgatcctgc tattgtcatc tctcccagtg ggaagtacaa 7560 tgctgtcaag cttggtaaat atgaagattc aaattcagtg acatgttcag ttcaacacga 7620 caataaaact gtgcactcca ctgactttga agtgaagaca gattctacag atcacgtaaa 7680 accaaaggaa actgaaaaca caaagcaacc ttcaaagagc tgccataaac ccaaagccat 7740 agttcatacc gagaaggtga acatgatgtc cctcacagtg cttgggctac gaatgctgtt 7800 tgcaaagact gttgccgtca attttctctt gactgccaag ttatttttct tggggtcagg 7860 cgctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc ctggacctat 7920 gctactactt gtgacctcac tattgttatg cgaactccct catcccgcat tcttgctgat 7980 tccagataaa caacttgatg cagatgtttc ccccaagccc actatttttc ttccttcaat 8040 tgctgaaaca aagctccaga aggctggaac atacctttgt cttcttgaga aatttttccc 8100 tgatgttatt aagatacatt ggcaagaaaa gaagagcaac acgattctgg gatcccagga 8160 ggggaacacc atgaagacta acgacacata catgaaattt agctggttaa cggtgccaga 8220 aaagtcactg gacaaagaac acagatgtat cgtcagacat gagaataata aaaacggagt 8280 tgatcaagaa attatctttc ctccaataaa gacagatgtc atcacaatgg atcccaaaga 8340 caattgttca aaagatgcaa atgatacact actgctgcag ctcacaaaca cctctgcata 8400 ttacatgtac ctcctcctgc tcctcaagag tgtggtctat tttgccatca tcacctgctg 8460 tctgcttaga agaacggctt tctgctgcaa tggagagaaa tcataatgag atatcgagca 8520 tcttaccgcc atttataccc atatttgttc tgtttttctt gatttgggta tacatttaaa 8580 tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag 8640 ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt 8700 tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta 8760 tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc 8820 ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga 8880 ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac 8940 ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc 9000 cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 9060 taggttgctg ggcactgata attccgtggt gttgtcagta ctggtacctt taagaccaat 9120 gacttacaag gcagctgtag atcttagcca ctttttaaaa gaaaaggggg gactggaagg 9180 gctaattcac tcccaaagaa gacaagatct gctttttgcc tgtactgggt ctctctggtt 9240 agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 9300 ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 9360 ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagca 9407 <210> 189 <211> 10203 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 189 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 60 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 120 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 180 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 240 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 300 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 360 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 420 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 480 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 540 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 600 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 660 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 720 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 780 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgaggtgag gcacctatct 840 cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtt gctaggttac 900 tgtcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaaaga gtttgtagaa 960 acgcaaaaag gccatccgtc aggatggcct tctgcttaat ttgatcggtg gcagtttatg 1020 gcgggcgtcc tgcccgccac cctccgggcc gttgcttcgc aacgttcaaa tccgctcccg 1080 gcggatttgt cctactcagg agagcgttca ccgacaaaca acagataaaa cgaaaggccc 1140 agtctttcga ctgagccttt cgttttattt gatgcctggc agttccctac tctcgcatgg 1200 gttgcggccg cccgggccgt cgaccaattc tcatgtttga cagcttatca tcgaatttct 1260 gccattcatc cgcttattat cacttattca ggcgtagcaa ccaggcgttt aagggcacca 1320 ataactgcct taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc 1380 attaagcatt ctgccgacat ggaagccatc acaaacggca tgatgaacct gaatcgccag 1440 cggcatcagc accttgtcgc cttgcgtata atatttgccc atggtgaaaa cgggggcgaa 1500 gaagttgtcc atattggcca cgtttaaatc aaaactggtg aaactcaccc agggattggc 1560 tgagacgaaa aacatattct caataaaccc tttagggaaa taggccaggt tttcaccgta 1620 acacgccaca tcttgcgaat atatgtgtag aaactgccgg aaatcgtcgt ggtattcact 1680 ccagagcgat gaaaacgttt cagtttgctc atggaaaacg gtgtaacaag ggtgaacact 1740 atcccatatc accagctcac cgtctttcat tgccatacga aattccggat gagcattcat 1800 caggcgggca agaatgtgaa taaaggccgg ataaaacttg tgcttatttt tctttacggt 1860 ctttaaaaag gccgtaatat ccagctgaac ggtctggtta taggtacatt gagcaactga 1920 ctgaaatgcc tcaaaatgtt ctttacgatg ccattgggat atatcaacgg tggtatatcc 1980 agtgattttt ttctccattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa 2040 tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 2100 aacgtctcat tttcgccaaa agtgacatta acctataaaa ataggcgtat cacgaggcca 2160 gcttgggaaa ccataagacc gagatagagt tgagtgttgt tccagtttgg aacaagagtc 2220 cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 2280 gcccactacg tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac 2340 taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 2400 tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc taaggcgctg gcaagtgtag 2460 cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 2520 actatggttg ctttgacgta tgcggtgtga aataccgcac agatgcgtaa ggagaaaata 2580 catcgtgatc cggatcaaga tccagatcga attggaggct acagtcagtg gagaggactt 2640 tcactgactg actgactgcg tctcaacctc ctaggggaca ttgattattg actagttatt 2700 aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat 2760 aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 2820 taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 2880 agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 2940 cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 3000 tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 3060 tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 3120 gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 3180 caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 3240 aggtctatat aagcagagct cgtttagtga accgggtctc tctggttaga ccagatctga 3300 gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 3360 tgagtgctca aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 3420 agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 3480 cgaaagtaaa gccagaggag atctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 3540 caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 3600 aggagagagt agggtgcgag agcgtcggta ttaagcgggg gagaattaga taaatgggaa 3660 aaaattcggt taaggccagg gggaaagaaa caatataaac taaaacatat agttagggca 3720 agcagggagc tagaacgatt cgcagttaat cctggccttt tagagacatc agaaggctgt 3780 agacaaatac tgggacagct acaaccatcc cttcagacag gatcagaaga acttagatca 3840 ttatataata caatagcagt cctctattgt gtgcatcaaa ggatagatgt aaaagacacc 3900 aaggaagcct tagataagat agaggaagag caaaacaaaa gtaagaaaaa ggcacagcaa 3960 gcgatcttca gacctggagg aggcaggagg cgatatgagg gacaattgga gaagtgaatt 4020 atataaatat aaagtagtaa aaattgaacc attaggagta gcacccacca aggcaaagag 4080 aagagtggtg cagagagaaa aaagagcagt gggaatagga gctttgttcc ttgggttctt 4140 gggagcagca ggaagcacta tgggcgcagc gtcaatgacg ctgacggtac aggccagaca 4200 attattgtct gatatagtgc agcagcagaa caatttgctg agggctattg aggcgcaaca 4260 gcatctgttg caactcacag tctggggcat caaacagctc caggcaagaa tcctggctgt 4320 ggaaagatac ctaaaggatc aacagctcct ggggatttgg ggttgctctg gaaaactcat 4380 ttgcaccact gctgtgcctt ggaatgctag ttggagtaat aaatctctgg aacagatttg 4440 gaataacatg acctggatgg agtgggacag agaaattaac aattacacaa gcttaataca 4500 ctccttaatt gaagaatcgc aaaaccagca agaaaagaat gaacaagaat tattggaatt 4560 agataaatgg gcaagtttgt ggaattggtt taacataaca aattggctgt ggtatataaa 4620 attattcata atgatagtag gaggcttggt aggtttaaga atagtttttg ctgtactttc 4680 tatagtgaat agagttaggc agggatattc accattatcg tttcagaccc acctcccaat 4740 cccgagggga ccacgcgtac aaatggcagt attcatccac aattttaaaa gaaaaggggg 4800 gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac 4860 taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag 4920 cagaaatcca ctttggaaag ctgagcatcc ggctccggtg cccgtcagtg ggcagagcgc 4980 acatcgccca cagtccccga gaagttgggg ggaggggtcg gcaattgaac cggtgcctag 5040 agaaggtggc gcggggtaaa ctgggaaagt gatgtcgtgt actggctccg cctttttccc 5100 gagggtgggg gagaaccgta tataagtgca gtagtcgccg tgaacgttct ttttcgcaac 5160 gggtttgccg ccagaacaca ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt 5220 acgggttatg gcccttgcgt gccttgaatt acttccacgc ccctggctgc agtacgtgat 5280 tcttgatccc gagcttcggg ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg 5340 agccccttcg cctcgtgctt gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg 5400 aatctggtgg caccttcgcg cctgtctcgc tgctttcgat aagtctctag ccatttaaaa 5460 tttttgatga cctgctgcga cgcttttttt ctggcaagat agtcttgtaa atgcgggcca 5520 agatctgcac actggtattt cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc 5580 ccagcgcaca tgttcggcga ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg 5640 gtagtctcaa gctggccggc ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc 5700 gccctgggcg gcaaggctgg cccggtcggc accagttgcg tgagcggaaa gatggccgct 5760 tcccggccct gctgcaggga gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg 5820 tgagtcaccc acacaaagga aaagggcctt tccgtcctca gccgtcgctt catgtgactc 5880 cacggagtac cgggcgccgt ccaggcacct cgattagttc tcgagctttt ggagtacgtc 5940 gtctttaggt tggggggagg ggttttatgc gatggagttt ccccacactg agtgggtgga 6000 gactgaagtt aggccagctt ggcacttgat gtaattctcc ttggaatttg ccctttttga 6060 gtttggatct tggttcattc tcaagcctca gacagtggtt caaagttttt ttcttccatt 6120 tcaggtgtcg tgaaaactac ccctctagag ccgccaccat gcttctcctg gtgacaagcc 6180 ttctgctctg tgagttacca cacccagcat tcctcctgat cccagacatc cagatgacac 6240 agactacatc ctccctgtct gcctctctgg gagacagagt caccatcagt tgcagggcaa 6300 gtcaggacat tagtaaatat ttaaattggt atcagcagaa accagatgga actgttaaac 6360 tcctgatcta ccatacatca agattacact caggagtccc atcaaggttc agtggcagtg 6420 ggtctggaac agattattct ctcaccatta gcaacctgga gcaagaagat attgccactt 6480 acttttgcca acagggtaat acgcttccgt acacgttcgg aggggggact aagttggaaa 6540 taacaggctc cacctctgga tccggcaagc ccggatctgg cgagggatcc accaagggcg 6600 aggtgaaact gcaggagtca ggacctggcc tggtggcgcc ctcacagagc ctgtccgtca 6660 catgcactgt ctcaggggtc tcattacccg actatggtgt aagctggatt cgccagcctc 6720 cacgaaaggg tctggagtgg ctgggagtaa tatggggtag tgaaaccaca tactataatt 6780 cagctctcaa atccagactg accatcatca aggacaactc caagagccaa gttttcttaa 6840 aaatgaacag tctgcaaact gatgacacag ccatttacta ctgtgccaaa cattattact 6900 acggtggtag ctatgctatg gactactggg gtcaaggaac ctcagtcacc gtctcctcag 6960 cggccgcagg tggaggaggt tctggaggtg gtggatcagg tggtggagga tctttagaaa 7020 gtcagcctca taccaaacca tccgtttttg tcatgaaaaa tggaacaaat gtcgcttgtc 7080 tggtgaagga attctacccc aaggatataa gaataaatct cgtgtcatcc aagaagataa 7140 cagagtttga tcctgctatt gtcatctctc ccagtgggaa gtacaatgct gtcaagcttg 7200 gtaaatatga agattcaaat tcagtgacat gttcagttca acacgacaat aaaactgtgc 7260 actccactga ctttgaagtg aagacagatt ctacagatca cgtaaaacca aaggaaactg 7320 aaaacacaaa gcaaccttca aagagctgcc ataaacccaa agccatagtt cataccgaga 7380 aggtgaacat gatgtccctc acagtgcttg ggctacgaat gctgtttgca aagactgttg 7440 ccgtcaattt tctcttgact gccaagttat ttttcttggg gtcaggcgct actaacttca 7500 gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acctatgcta ctacttgtga 7560 cctcactatt gttatgcgaa ctccctcatc ccgcattctt gctgattcca gacattcaga 7620 tgactcaaac aacttccagc ctctccgcct cactcggcga ccgcgtaaca ataagctgtc 7680 gggcctcgca agatattagt aagtacctga attggtatca gcaaaaaccc gatggtacag 7740 tcaagcttct gatctaccat accagtcgtc tgcacagcgg tgtccccagc aggttcagcg 7800 gctcaggatc tggtaccgat tattcactga cgatttccaa ccttgagcaa gaggacatcg 7860 ccacctactt ctgccagcag ggtaatactc tgccgtacac attcgggggc ggtaccaagc 7920 tcgagatcac gggttcaaca agcggttctg gcaagccagg cagcggcgag gggagtacaa 7980 agggggaggt gaagttgcag gaaagtggcc ctggattggt ggccccgagc cagagtctgt 8040 ctgtcacctg cacagtttcc ggagtaagtc tgcctgatta cggagtgtcc tggatcagac 8100 agccacctcg aaagggcttg gagtggcttg gggtcatttg gggcagtgaa accacatact 8160 acaacagcgc tcttaagtcc aggctcacta tcatcaagga caattcaaag agccaagtat 8220 tcttgaaaat gaattccctg cagactgatg acaccgctat ttattattgc gctaaacatt 8280 attactatgg aggttcttat gccatggact actgggggca gggtacctct gtgacagtga 8340 gttcagctgc agctggaggt ggaggtagcg gaggcggtgg tagtggaggg ggtggttctc 8400 tggaagataa acaacttgat gcagatgttt cccccaagcc cactattttt cttccttcaa 8460 ttgctgaaac aaagctccag aaggctggaa catacctttg tcttcttgag aaatttttcc 8520 ctgatgttat taagatacat tggcaagaaa agaagagcaa cacgattctg ggatcccagg 8580 aggggaacac catgaagact aacgacacat acatgaaatt tagctggtta acggtgccag 8640 aaaagtcact ggacaaagaa cacagatgta tcgtcagaca tgagaataat aaaaacggag 8700 ttgatcaaga aattatcttt cctccaataa agacagatgt catcacaatg gatcccaaag 8760 acaattgttc aaaagatgca aatgatacac tactgctgca gctcacaaac acctctgcat 8820 attacatgta cctcctcctg ctcctcaaga gtgtggtcta ttttgccatc atcacctgct 8880 gtctgcttag aagaacggct ttctgctgca atggagagaa atcataatga gatatcgagc 8940 atcttaccgc catttatacc catatttgtt ctgtttttct tgatttgggt atacatttaa 9000 atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta 9060 gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg 9120 ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact 9180 atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg 9240 cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag 9300 aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa 9360 cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc 9420 ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 9480 ctaggttgct gggcactgat aattccgtgg tgttgtcagt actggtacct ttaagaccaa 9540 tgacttacaa ggcagctgta gatcttagcc actttttaaa agaaaagggg ggactggaag 9600 ggctaattca ctcccaaaga agacaagatc tgctttttgc ctgtactggg tctctctggt 9660 tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc 9720 aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt gactctggta 9780 actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcatg atcataatca 9840 agccatatca catctgtaga ggtttacttg ctttaaaaaa cctccacacc tccccctgaa 9900 cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg 9960 ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 10020 tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggatct gcgtcgacac 10080 gaagagacga ctgactgact gactggaaag aggaagggct ggaagaggaa ggagcttgat 10140 ccagatcccg atctcgatcc agatccggat cgcagcttgg tcttccgctt cctcgctcac 10200 tga 10203 <210> 190 <211> 10583 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 190 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggcgtaatca 360 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 420 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 480 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 540 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 600 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 660 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 720 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 780 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 840 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 900 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 960 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1020 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1080 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1140 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1200 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1260 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1320 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1380 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1440 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1500 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 1560 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgttgctag gttactgtca 1620 tgagcggata catatttgaa tgtatttaga aaaataaaca aaagagtttg tagaaacgca 1680 aaaaggccat ccgtcaggat ggccttctgc ttaatttgat cggtggcagt ttatggcggg 1740 cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 1800 tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 1860 ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catgggttgc 1920 ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 1980 tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 2040 tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 2100 gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 2160 tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 2220 tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 2280 cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 2340 ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 2400 gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 2460 atatcaccag ctcaccgtct ttcattgcca tacgaaattc cggatgagca ttcatcaggc 2520 gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 2580 aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 2640 atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 2700 tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 2760 ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 2820 ctcattttcg ccaaaagtga cattaaccta taaaaatagg cgtatcacga ggccagcttg 2880 ggaaaccata agaccgagat agagttgagt gttgttccag tttggaacaa gagtccacta 2940 ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca 3000 ctacgtgaac catcacccaa atcaagtttt ttggggtcga ggtgccgtaa agcactaaat 3060 cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg 3120 agaaaggaag ggaagaaagc gaaaggagcg ggcgctaagg cgctggcaag tgtagcggtc 3180 acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtactat 3240 ggttgctttg acgtatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 3300 tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 3360 cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 3420 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg atcgagatcg 3480 tgatccggat caagatccag atcgaattgg aggctacagt cagtggagag gactttcact 3540 gactgactga ctgcgtctca acctcctagg ggacattgat tattgactag ttattaatag 3600 taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt 3660 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 3720 acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 3780 ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 3840 attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 3900 gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg 3960 ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc 4020 caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa 4080 tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc 4140 tatataagca gagctcgttt agtgaaccgg gtctctctgg ttagaccaga tctgagcctg 4200 ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 4260 gctcaaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 4320 cttttagtca gtgtggaaaa tctctagcag tggcgcccga acagggactt gaaagcgaaa 4380 gtaaagccag aggagatctc tcgacgcagg actcggcttg ctgaagcgcg cacggcaaga 4440 ggcgaggggc ggcgactggt gagtacgcca aaaattttga ctagcggagg ctagaaggag 4500 agagtagggt gcgagagcgt cggtattaag cgggggagaa ttagataaat gggaaaaaat 4560 tcggttaagg ccagggggaa agaaacaata taaactaaaa catatagtta gggcaagcag 4620 ggagctagaa cgattcgcag ttaatcctgg ccttttagag acatcagaag gctgtagaca 4680 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 4740 taatacaata gcagtcctct attgtgtgca tcaaaggata gatgtaaaag acaccaagga 4800 agccttagat aagatagagg aagagcaaaa caaaagtaag aaaaaggcac agcaagcgat 4860 cttcagacct ggaggaggca ggaggcgata tgagggacaa ttggagaagt gaattatata 4920 aatataaagt agtaaaaatt gaaccattag gagtagcacc caccaaggca aagagaagag 4980 tggtgcagag agaaaaaaga gcagtgggaa taggagcttt gttccttggg ttcttgggag 5040 cagcaggaag cactatgggc gcagcgtcaa tgacgctgac ggtacaggcc agacaattat 5100 tgtctgatat agtgcagcag cagaacaatt tgctgagggc tattgaggcg caacagcatc 5160 tgttgcaact cacagtctgg ggcatcaaac agctccaggc aagaatcctg gctgtggaaa 5220 gatacctaaa ggatcaacag ctcctgggga tttggggttg ctctggaaaa ctcatttgca 5280 ccactgctgt gccttggaat gctagttgga gtaataaatc tctggaacag atttggaata 5340 acatgacctg gatggagtgg gacagagaaa ttaacaatta cacaagctta atacactcct 5400 taattgaaga atcgcaaaac cagcaagaaa agaatgaaca agaattattg gaattagata 5460 aatgggcaag tttgtggaat tggtttaaca taacaaattg gctgtggtat ataaaattat 5520 tcataatgat agtaggaggc ttggtaggtt taagaatagt ttttgctgta ctttctatag 5580 tgaatagagt taggcaggga tattcaccat tatcgtttca gacccacctc ccaatcccga 5640 ggggaccacg cgtacaaatg gcagtattca tccacaattt taaaagaaaa ggggggattg 5700 gggggtacag tgcaggggaa agaatagtag acataatagc aacagacata caaactaaag 5760 aattacaaaa acaaattaca aaaattcaaa attttcgggt ttattacagg gacagcagaa 5820 atccactttg gaaagctgag catccggctc cggtgcccgt cagtgggcag agcgcacatc 5880 gcccacagtc cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag 5940 gtggcgcggg gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg 6000 tgggggagaa ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt 6060 tgccgccaga acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg 6120 ttatggccct tgcgtgcctt gaattacttc cacgcccctg gctgcagtac gtgattcttg 6180 atcccgagct tcgggttgga agtgggtggg agagttcgag gccttgcgct taaggagccc 6240 cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct 6300 ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc tctagccatt taaaattttt 6360 gatgacctgc tgcgacgctt tttttctggc aagatagtct tgtaaatgcg ggccaagatc 6420 tgcacactgg tatttcggtt tttggggccg cgggcggcga cggggcccgt gcgtcccagc 6480 gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc gagaatcgga cgggggtagt 6540 ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct 6600 gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg 6660 gccctgctgc agggagctca aaatggagga cgcggcgctc gggagagcgg gcgggtgagt 6720 cacccacaca aaggaaaagg gcctttccgt cctcagccgt cgcttcatgt gactccacgg 6780 agtaccgggc gccgtccagg cacctcgatt agttctcgag cttttggagt acgtcgtctt 6840 taggttgggg ggaggggttt tatgcgatgg agtttcccca cactgagtgg gtggagactg 6900 aagttaggcc agcttggcac ttgatgtaat tctccttgga atttgccctt tttgagtttg 6960 gatcttggtt cattctcaag cctcagacag tggttcaaag tttttttctt ccatttcagg 7020 tgtcgtgaaa actacccctc tgagccgcca ccatgcttct gcttgtgacg tccctcctgc 7080 tttgtgaact cccgcatcct gccttcctgc tcatcccgca ggtccaactt caacaatcag 7140 gaccagggct cgtgaagccg tcccaaacgc ttagtctcac atgcgccatt agtggggact 7200 ccgtgagttc aaattccgcc gcctggaatt ggattaggca aagtccatct aggggtcttg 7260 agtggctcgg ccgcacttac tacagatcca agtggtataa cgactacgca gtatccgtaa 7320 aatcaagaat aacaattaat ccagatactt ctaagaacca atttagtctt caactgaaca 7380 gcgtgacccc ggaggataca gcggtgtatt attgtgcgcg agaagttacc ggggatctgg 7440 aggatgcttt tgatatctgg ggccaaggaa caatggtaac cgttagttca ggaggagggg 7500 gaagtgatat acaaatgaca cagagcccta gttcccttag tgcctcagtt ggggataggg 7560 taacaatcac ttgccgagca tcacagacga tatggtccta tctcaactgg tatcaacaac 7620 gccctggcaa ggcacccaac ctgctgatct acgccgctag tagtttgcaa agtggggtac 7680 ctagtagatt ctccggcaga ggttctggca ctgactttac cttgacaatc agcagcctcc 7740 aagcagaaga cttcgcgaca tactactgtc agcaaagtta ctctatacct cagacgttcg 7800 gtcaggggac caagctcgag atcaaggcgg ccgcaggtgg aggaggttct ggaggtggtg 7860 gatcaggtgg tggaggatct ttagaaagtc agcctcatac caaaccatcc gtttttgtca 7920 tgaaaaatgg aacaaatgtc gcttgtctgg tgaaggaatt ctaccccaag gatataagaa 7980 taaatctcgt gtcatccaag aagataacag agtttgatcc tgctattgtc atctctccca 8040 gtgggaagta caatgctgtc aagcttggta aatatgaaga ttcaaattca gtgacatgtt 8100 cagttcaaca cgacaataaa actgtgcact ccactgactt tgaagtgaag acagattcta 8160 cagatcacgt aaaaccaaag gaaactgaaa acacaaagca accttcaaag agctgccata 8220 aacccaaagc catagttcat accgagaagg tgaacatgat gtccctcaca gtgcttgggc 8280 tacgaatgct gtttgcaaag actgttgccg tcaattttct cttgactgcc aagttatttt 8340 tcttggggtc aggcgagggc agaggaagtc tgctaacatg cggtgacgtc gaggagaatc 8400 ctggacctat gcttctcctg gtgacaagcc ttctgctctg tgagttacca cacccagcat 8460 tcctcctgat cccacaggtg cagctgcagc agagcggccc cggcctggtg aagcccagcc 8520 agaccctgag cctgacctgc gctatcagcg gcgacagcgt tagcagcaac agcgctgctt 8580 ggaactggat cagacagagc cccagcagag gcctggagtg gctgggcaga acctactata 8640 gaagcaaatg gtacaacgat tacgccgtga gcgtgaagag caggatcacc atcaaccccg 8700 acaccagcaa gaatcagttc agcctgcagc tcaattccgt cacccccgag gacaccgccg 8760 tgtactactg cgccagagag gtgaccggcg acctcgagga cgccttcgac atttggggac 8820 agggcaccat ggttaccgtg tctagcggtg gcggaggcag cgacatccag atgacccagt 8880 cccccagcag cctgagcgcc agcgtgggcg acagagtgac catcacctgc agagccagcc 8940 agaccatctg gagctacctg aattggtacc agcagagacc cggaaaagcc cctaacctcc 9000 tcatttacgc tgccagcagc ctgcagagcg gcgtgcccag caggttcagc ggaagaggca 9060 gcggaaccga cttcaccctg accatttcct ctctgcaggc cgaggacttt gccacctatt 9120 actgccagca gagctacagc atcccccaga cctttggcca gggcacaaaa ctggagatta 9180 aggctgcagc tggaggtgga ggtagcggag gcggtggtag tggagggggt ggttctctgg 9240 aagataaaca acttgatgca gatgtttccc ccaagcccac tatttttctt ccttcaattg 9300 ctgaaacaaa gctccagaag gctggaacat acctttgtct tcttgagaaa tttttccctg 9360 atgttattaa gatacattgg caagaaaaga agagcaacac gattctggga tcccaggagg 9420 ggaacaccat gaagactaac gacacataca tgaaatttag ctggttaacg gtgccagaaa 9480 agtcactgga caaagaacac agatgtatcg tcagacatga gaataataaa aacggagttg 9540 atcaagaaat tatctttcct ccaataaaga cagatgtcat cacaatggat cccaaagaca 9600 attgttcaaa agatgcaaat gatacactac tgctgcagct cacaaacacc tctgcatatt 9660 acatgtacct cctcctgctc ctcaagagtg tggtctattt tgccatcatc acctgctgtc 9720 tgcttagaag aacggctttc tgctgcaatg gagagaaatc ataatgagat atcgagcatc 9780 ttaccgccat ttatacccat atttgttctg tttttcttga tttgggtata catttaaatg 9840 ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt 9900 caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc 9960 ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg 10020 ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt 10080 cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg 10140 agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc 10200 ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc 10260 tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta 10320 ggttgctggg cactgataat tccgtggtgt tgtcagtact ggtaccttta agaccaatga 10380 cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 10440 taattcactc ccaaagaaga caagatctgc tttttgcctg tactgggtct ctctggttag 10500 accagatctg agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat 10560 aaagcttgcc ttgagtgctt caa 10583 <210> 191 <211> 8933 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 191 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 360 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 420 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 480 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 540 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 600 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 660 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 720 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 780 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 840 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 900 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 960 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 1020 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 1080 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 1140 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac cccgggatgc 1200 tactacttgt gacctcacta ttgttatgcg aactccctca tcccgcattc ttgctgattc 1260 cagcaggaca cctggagcag cctcaaatct cttccacaaa gactctgtct aagactgcta 1320 gacttgagtg cgtcgttagc gggatcacca tctccgcaac ctccgtatac tggtaccgcg 1380 aacggcctgg agaggtgatt cagtttctgg taagcatttc ttacgatggt accgtgcgta 1440 aagaaagcgg gatcccttca ggcaagttcg aagttgaccg catccccgag acgtcaacta 1500 gcaccctcac tatccacaac gtggagaagc aggacatcgc gacctactat tgtgccttgt 1560 gggaagcgca gcaggagctg ggaaaaaaga ttaaggtgtt cgggccaggg acaaagttga 1620 ttattaccga taagcagctc gatgcggacg tgtcacctaa accgactatt ttcttgccaa 1680 gtatagccga gacaaagctt cagaaggcag ggacttactt atgcctgctg gagaagtttt 1740 tccctgacgt catcaagatt cactgggaag aaaagaagag caacactatc ctcggatccc 1800 aggaggggaa tacaatgaag accaatgata cctatatgaa gttttcttgg ctgactgtgc 1860 ccgagaagtc ccttgataag gaacatagat gcatcgtgag acatgagaac aataaaaacg 1920 gggtggatca ggaaatcatt ttccccccca ttaagaccga cgttatcacc atggatccaa 1980 aggataattg ctctaaggac gccaacgaca ctcttctgct tcagctgact aatacaagcg 2040 cttactatat gtacctgctc ctgcttctga aaagcgtggt gtacttcgca atcattactt 2100 gttgccttct gcggagaact gccttctgtt gtaacggtga aaaatccggg tcaggcgagg 2160 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct atgcagagaa 2220 tcagctctct gatccacctg agcctgttct gggcaggcgt gatgtctgcc atcgagctgg 2280 tgcctgagca ccagaccgtt ccagtgagca tcggcgtgcc tgccaccctg agatgcagca 2340 tgaagggcga ggccatcggc aactattaca tcaactggta cagaaagacc cagggcaaca 2400 ccatgacctt catctacaga gagaaggaca tctacggacc cggcttcaag gacaacttcc 2460 agggggacat tgacatcgcc aagaacctgg ctgtgctgaa gatcctggcc cctagcgaga 2520 gagacgaggg cagctactat tgcgcctgcg atgcactgaa gagaaccgac accgataagc 2580 tgatcttcgg caagggaacc agagtgaccg ttgagcccag aagccagcct cacaccaagc 2640 ccagcgtgtt cgtgatgaag aacggcacca acgttgcctg cctggtgaag gagttctacc 2700 ctaaggacat cagaatcaac ctggtgtcca gcaagaagat caccgagttc gacccagcca 2760 tcgtgatcag cccaagcgga aagtacaacg ccgtgaaact gggcaagtac gaggacagca 2820 actctgtgac ttgcagcgtg cagcacgaca acaagaccgt tcactccacc gacttcgagg 2880 tgaagaccga cagcaccgat cacgtgaagc ccaaggagac cgagaacacc aaacagccta 2940 gcaagagctg ccacaagccc aaagccatcg tgcacaccga gaaggtgaac atgatgagcc 3000 tgaccgtgct tggactcaga atgctgttcg ccaagaccgt agccgtgaac ttcctgctta 3060 ccgccaagct gttcttcctg tagatatcga gcatcttacc gccatttata cccatatttg 3120 ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa 3180 tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca 3240 tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa 3300 aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata 3360 tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc 3420 cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg 3480 tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac 3540 ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat 3600 cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt 3660 ggtgttgtca gtactggtac ctttaagacc aatgacttac aaggcagctg tagatcttag 3720 ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 3780 tctgcttttt gcctgtactg ggtctctctg gttagaccag atctgagcct gggagctctc 3840 tggctaacta gggaacccac tgcttaagcc tcaataaagc ttgccttgag tgcttcaatg 3900 atcataatca agccatatca catctgtaga ggtttacttg ctttaaaaaa cctccacacc 3960 tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 4020 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 4080 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggatct 4140 gcgtcgacac gaagagacga ctgactgact gactggaaag aggaagggct ggaagaggaa 4200 ggagcttgat ccagatcccg atctcgatcc agatccggat cgcagcttgg tcttccgctt 4260 cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 4320 caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 4380 caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 4440 ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 4500 cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 4560 ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 4620 tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 4680 gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 4740 ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 4800 ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 4860 gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 4920 aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 4980 tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 5040 ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagtt 5100 aattaacttg cgccgtcccg tcaagtcagc gtaatgctct gccagtgtta caaccaatta 5160 accaattctg attagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcacatca 5220 ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg 5280 aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca 5340 tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca 5400 tgagtgacga ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt 5460 tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc 5520 attcgtgatt gcgcctgagc aagacgaaat acgcgatcgc tgttaaaagg acaattacaa 5580 acaggaatcg aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct 5640 gaatcaggat attcttctaa tacctggaat gctgtttttc cggggatcgc agtggtgagt 5700 aaccatgcat catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc 5760 gtcagccagt ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca 5820 tgtttcagaa acaactctgg cgcatcgggc ttcccataca agcgatagat tgtcgcacct 5880 gattgcccga cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa 5940 tttaatcgcg gcctcgacgt ttcccgttga atatggctca taacacccct tgtattactg 6000 tttatgtaag cagacagttt tattgttcat gatgatatat ttttatcttg tgcaatgtaa 6060 catcagagat tttgagacac aacgtggctt tccccccccc ccccatgaca ttaacctata 6120 aaaataggcg tatcacgagg ccagcttggg aaaccataag accgagatag agttgagtgt 6180 tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg 6240 aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat caagtttttt 6300 ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc gatttagagc 6360 ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg 6420 cgctaaggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct 6480 taatgcgccg ctacagggcg cgtactatgg ttgctttgac gtatgcggtg tgaaataccg 6540 cacagatgcg taaggagaaa atacatcgtg atccggatca agatccagat cgaattggag 6600 gctacagtca gtggagagga ctttcactga ctgactgact gcgtctcaac ctcctagggg 6660 acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 6720 atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 6780 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 6840 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 6900 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 6960 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 7020 agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 7080 gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 7140 gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 7200 gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgggt 7260 ctctctggtt agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc 7320 ttaagcctca ataaagcttg ccttgagtgc tcaaagtagt gtgtgcccgt ctgttgtgtg 7380 actctggtaa ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg 7440 gcgcccgaac agggacttga aagcgaaagt aaagccagag gagatctctc gacgcaggac 7500 tcggcttgct gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa 7560 aattttgact agcggaggct agaaggagag agtagggtgc gagagcgtcg gtattaagcg 7620 ggggagaatt agataaatgg gaaaaaattc ggttaaggcc agggggaaag aaacaatata 7680 aactaaaaca tatagttagg gcaagcaggg agctagaacg attcgcagtt aatcctggcc 7740 ttttagagac atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga 7800 caggatcaga agaacttaga tcattatata atacaatagc agtcctctat tgtgtgcatc 7860 aaaggataga tgtaaaagac accaaggaag ccttagataa gatagaggaa gagcaaaaca 7920 aaagtaagaa aaaggcacag caagcgatct tcagacctgg aggaggcagg aggcgatatg 7980 agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga accattagga 8040 gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata 8100 ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg 8160 acgctgacgg tacaggccag acaattattg tctgatatag tgcagcagca gaacaatttg 8220 ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaaacag 8280 ctccaggcaa gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt 8340 tggggttgct ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt 8400 aataaatctc tggaacagat ttggaataac atgacctgga tggagtggga cagagaaatt 8460 aacaattaca caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag 8520 aatgaacaag aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata 8580 acaaattggc tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta 8640 agaatagttt ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta 8700 tcgtttcaga cccacctccc aatcccgagg ggaccacgcg tacaaatggc agtattcatc 8760 cacaatttta aaagaaaagg ggggattggg gggtacagtg caggggaaag aatagtagac 8820 ataatagcaa cagacataca aactaaagaa ttacaaaaac aaattacaaa aattcaaaat 8880 tttcgggttt attacaggga cagcagaaat ccactttgga aagctgagca tcc 8933 <210> 192 <211> 10416 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 192 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300 acttccacgc ccctggctgc agtacgtgat tcttgatccc gagcttcggg ttggaagtgg 360 gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt gagttgaggc 420 ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc 480 tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga cgcttttttt 540 ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt cggtttttgg 600 ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct 660 gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc ctgctctggt 720 gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc 780 accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga gctcaaaatg 840 gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga aaagggcctt 900 tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt ccaggcacct 960 cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg ggttttatgc 1020 gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt ggcacttgat 1080 gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc tcaagcctca 1140 gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaaaactac cccgggatgc 1200 tactacttgt gacctcacta ttgttatgcg aactccctca tcccgcattc ttgctgattc 1260 cagcaggaca cctggagcag cctcaaatct cttccacaaa gactctgtct aagactgcta 1320 gacttgagtg cgtcgttagc gggatcacca tctccgcaac ctccgtatac tggtaccgcg 1380 aacggcctgg agaggtgatt cagtttctgg taagcatttc ttacgatggt accgtgcgta 1440 aagaaagcgg gatcccttca ggcaagttcg aagttgaccg catccccgag acgtcaacta 1500 gcaccctcac tatccacaac gtggagaagc aggacatcgc gacctactat tgtgccttgt 1560 gggaagcgca gcaggagctg ggaaaaaaga ttaaggtgtt cgggccaggg acaaagttga 1620 ttattaccga taagcagctc gatgcggacg tgtcacctaa accgactatt ttcttgccaa 1680 gtatagccga gacaaagctt cagaaggcag ggacttactt atgcctgctg gagaagtttt 1740 tccctgacgt catcaagatt cactgggaag aaaagaagag caacactatc ctcggatccc 1800 aggaggggaa tacaatgaag accaatgata cctatatgaa gttttcttgg ctgactgtgc 1860 ccgagaagtc ccttgataag gaacatagat gcatcgtgag acatgagaac aataaaaacg 1920 gggtggatca ggaaatcatt ttccccccca ttaagaccga cgttatcacc atggatccaa 1980 aggataattg ctctaaggac gccaacgaca ctcttctgct tcagctgact aatacaagcg 2040 cttactatat gtacctgctc ctgcttctga aaagcgtggt gtacttcgca atcattactt 2100 gttgccttct gcggagaact gccttctgtt gtaacggtga aaaatccggg tcaggcgagg 2160 gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct atgcagagaa 2220 tcagctctct gatccacctg agcctgttct gggcaggcgt gatgtctgcc atcgagctgg 2280 tgcctgagca ccagaccgtt ccagtgagca tcggcgtgcc tgccaccctg agatgcagca 2340 tgaagggcga ggccatcggc aactattaca tcaactggta cagaaagacc cagggcaaca 2400 ccatgacctt catctacaga gagaaggaca tctacggacc cggcttcaag gacaacttcc 2460 agggggacat tgacatcgcc aagaacctgg ctgtgctgaa gatcctggcc cctagcgaga 2520 gagacgaggg cagctactat tgcgcctgcg atgcactgaa gagaaccgac accgataagc 2580 tgatcttcgg caagggaacc agagtgaccg ttgagcccag aagccagcct cacaccaagc 2640 ccagcgtgtt cgtgatgaag aacggcacca acgttgcctg cctggtgaag gagttctacc 2700 ctaaggacat cagaatcaac ctggtgtcca gcaagaagat caccgagttc gacccagcca 2760 tcgtgatcag cccaagcgga aagtacaacg ccgtgaaact gggcaagtac gaggacagca 2820 actctgtgac ttgcagcgtg cagcacgaca acaagaccgt tcactccacc gacttcgagg 2880 tgaagaccga cagcaccgat cacgtgaagc ccaaggagac cgagaacacc aaacagccta 2940 gcaagagctg ccacaagccc aaagccatcg tgcacaccga gaaggtgaac atgatgagcc 3000 tgaccgtgct tggactcaga atgctgttcg ccaagaccgt agccgtgaac ttcctgctta 3060 ccgccaagct gttcttcctg ggaagtggcg ctactaactt cagcctgctg aagcaggctg 3120 gagacgtgga ggagaaccct ggacctatgc ttctcctggt gacaagcctt ctgctctgtg 3180 agttaccaca cccagcattc ctcctgatcc cagacatcca gatgacacag actacatcct 3240 ccctgtctgc ctctctggga gacagagtca ccatcagttg cagggcaagt caggacatta 3300 gtaaatattt aaattggtat cagcagaaac cagatggaac tgttaaactc ctgatctacc 3360 atacatcaag attacactca ggagtcccat caaggttcag tggcagtggg tctggaacag 3420 attattctct caccattagc aacctggagc aagaagatat tgccacttac ttttgccaac 3480 agggtaatac gcttccgtac acgttcggag gggggactaa gttggaaata acaggctcca 3540 cctctggatc cggcaagccc ggatctggcg agggatccac caagggcgag gtgaaactgc 3600 aggagtcagg acctggcctg gtggcgccct cacagagcct gtccgtcaca tgcactgtct 3660 caggggtctc attacccgac tatggtgtaa gctggattcg ccagcctcca cgaaagggtc 3720 tggagtggct gggagtaata tggggtagtg aaaccacata ctataattca gctctcaaat 3780 ccagactgac catcatcaag gacaactcca agagccaagt tttcttaaaa atgaacagtc 3840 tgcaaactga tgacacagcc atttactact gtgccaaaca ttattactac ggtggtagct 3900 atgctatgga ctactggggt caaggaacct cagtcaccgt ctcctcagct gccgcaggtg 3960 ggggaggatc tggaggcggt ggcagtgggg gtggaggctc actggaggat ggtaatgaag 4020 aaatgggtgg tattacacag acaccatata aagtctccat ctctggaacc acagtaatat 4080 tgacatgccc tcagtatcct ggatctgaaa tactatggca acacaatgat aagaacatcg 4140 gcggagatga ggatgataaa aacataggca gtgatgagga tcacctgtca ctgaaggaat 4200 tttcagaatt ggagcaaagt ggttattatg tctgctaccc cagaggaagc aaaccagaag 4260 atgcgaactt ttatctctac ctgagggcaa gagtgtgtga gaactgcatg gagatggatg 4320 tgatgtcggt ggccacaatt gtcatagtgg acatctgcat cactgggggc ttgctgctgc 4380 tggtttacta ctggagcaag aatagaaagg ccaaggccaa gcctgtgaca cgaggagcgg 4440 gtgctggcgg caggcaaagg ggacaaaaca aggagaggcc accacctgtt cccaacccag 4500 actatgagcc catccggaaa ggccagcggg acctgtattc tggcctgaat cagagacgca 4560 tctaagatat cgagcatctt accgccattt atacccatat ttgttctgtt tttcttgatt 4620 tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg 4680 gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc 4740 gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga 4800 ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc 4860 tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt 4920 tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg 4980 tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg 5040 ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc 5100 gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tcagtactgg 5160 tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 5220 aggggggact ggaagggcta attcactccc aaagaagaca agatctgctt tttgcctgta 5280 ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 5340 cactgcttaa gcctcaataa agcttgcctt gagtgcttca atgatcataa tcaagccata 5400 tcacatctgt agaggtttac ttgctttaaa aaacctccac acctccccct gaacctgaaa 5460 cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa 5520 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 5580 ggtttgtcca aactcatcaa tgtatcttat catgtctgga tctgcgtcga cacgaagaga 5640 cgactgactg actgactgga aagaggaagg gctggaagag gaaggagctt gatccagatc 5700 ccgatctcga tccagatccg gatcgcagct tggtcttccg cttcctcgct cactgactcg 5760 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 5820 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 5880 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 5940 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 6000 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 6060 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 6120 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 6180 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 6240 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 6300 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 6360 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 6420 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 6480 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 6540 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gttaattaac ttgcgccgtc 6600 ccgtcaagtc agcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa 6660 aaactcatcg agcatcaaat gaaactgcaa tttattcaca tcaggattat caataccata 6720 tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat 6780 ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa 6840 tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc 6900 cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag gccagccatt 6960 acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg 7020 agcaagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa 7080 ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc 7140 taatacctgg aatgctgttt ttccggggat cgcagtggtg agtaaccatg catcatcagg 7200 agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct 7260 gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc 7320 tggcgcatcg ggcttcccat acaagcgata gattgtcgca cctgattgcc cgacattatc 7380 gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga 7440 cgtttcccgt tgaatatggc tcataacacc ccttgtatta ctgtttatgt aagcagacag 7500 ttttattgtt catgatgata tatttttatc ttgtgcaatg taacatcaga gattttgaga 7560 cacaacgtgg ctttcccccc cccccccatg acattaacct ataaaaatag gcgtatcacg 7620 aggccagctt gggaaaccat aagaccgaga tagagttgag tgttgttcca gtttggaaca 7680 agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg 7740 gcgatggccc actacgtgaa ccatcaccca aatcaagttt tttggggtcg aggtgccgta 7800 aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg ggaaagccgg 7860 cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctaag gcgctggcaa 7920 gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg ccgctacagg 7980 gcgcgtacta tggttgcttt gacgtatgcg gtgtgaaata ccgcacagat gcgtaaggag 8040 aaaatacatc gtgatccgga tcaagatcca gatcgaattg gaggctacag tcagtggaga 8100 ggactttcac tgactgactg actgcgtctc aacctcctag gggacattga ttattgacta 8160 gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 8220 ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 8280 cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 8340 gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 8400 gtacgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 8460 tgaccttatg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 8520 tggtgatgcg gttttggcag tacatcaatg ggcgtggata gcggtttgac tcacggggat 8580 ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg 8640 actttccaaa atgtcgtaac aactccgccc cattgacgca aatgggcggt aggcgtgtac 8700 ggtgggaggt ctatataagc agagctcgtt tagtgaaccg ggtctctctg gttagaccag 8760 atctgagcct gggagctctc tggctaacta gggaacccac tgcttaagcc tcaataaagc 8820 ttgccttgag tgctcaaagt agtgtgtgcc cgtctgttgt gtgactctgg taactagaga 8880 tccctcagac ccttttagtc agtgtggaaa atctctagca gtggcgcccg aacagggact 8940 tgaaagcgaa agtaaagcca gaggagatct ctcgacgcag gactcggctt gctgaagcgc 9000 gcacggcaag aggcgagggg cggcgactgg tgagtacgcc aaaaattttg actagcggag 9060 gctagaagga gagagtaggg tgcgagagcg tcggtattaa gcgggggaga attagataaa 9120 tgggaaaaaa ttcggttaag gccaggggga aagaaacaat ataaactaaa acatatagtt 9180 agggcaagca gggagctaga acgattcgca gttaatcctg gccttttaga gacatcagaa 9240 ggctgtagac aaatactggg acagctacaa ccatcccttc agacaggatc agaagaactt 9300 agatcattat ataatacaat agcagtcctc tattgtgtgc atcaaaggat agatgtaaaa 9360 gacaccaagg aagccttaga taagatagag gaagagcaaa acaaaagtaa gaaaaaggca 9420 cagcaagcga tcttcagacc tggaggaggc aggaggcgat atgagggaca attggagaag 9480 tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 9540 aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 9600 gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 9660 cagacaatta ttgtctgata tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 9720 gcaacagcat ctgttgcaac tcacagtctg gggcatcaaa cagctccagg caagaatcct 9780 ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 9840 actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 9900 gatttggaat aacatgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 9960 aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 10020 ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 10080 tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 10140 actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 10200 cccaatcccg aggggaccac gcgtacaaat ggcagtattc atccacaatt ttaaaagaaa 10260 aggggggatt ggggggtaca gtgcagggga aagaatagta gacataatag caacagacat 10320 acaaactaaa gaattacaaa aacaaattac aaaaattcaa aattttcggg tttattacag 10380 ggacagcaga aatccacttt ggaaagctga gcatcc 10416 <210> 193 <211> 8671 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 193 tgatcataat caagccatat cacatctgta gaggtttact tgctttaaaa aacctccaca 60 cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 120 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 180 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 240 ctgcgtcgac acgaagagac gactgactga ctgactggaa agaggaaggg ctggaagagg 300 aaggagcttg atccagatcc cgatctcgat ccagatccgg atcgcagctt ggtcttccgc 360 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 420 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 480 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 540 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 600 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 660 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 720 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 780 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 840 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 900 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 960 cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1020 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1080 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1140 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1200 ttaattaact tgcgccgtcc cgtcaagtca gcgtaatgct ctgccagtgt tacaaccaat 1260 taaccaattc tgattagaaa aactcatcga gcatcaaatg aaactgcaat ttattcacat 1320 caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac 1380 cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa 1440 catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac 1500 catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt 1560 gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat 1620 tcattcgtga ttgcgcctga gcaagacgaa atacgcgatc gctgttaaaa ggacaattac 1680 aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac 1740 ctgaatcagg atattcttct aatacctgga atgctgtttt tccggggatc gcagtggtga 1800 gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt 1860 ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc 1920 catgtttcag aaacaactct ggcgcatcgg gcttcccata caagcgatag attgtcgcac 1980 ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg 2040 aatttaatcg cggcctcgac gtttcccgtt gaatatggct cataacaccc cttgtattac 2100 tgtttatgta agcagacagt tttattgttc atgatgatat atttttatct tgtgcaatgt 2160 aacatcagag attttgagac acaacgtggc tttccccccc ccccatgaca ttaacctata 2220 aaaataggcg tatcacgagg ccagcttggg aaaccataag accgagatag agttgagtgt 2280 tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg 2340 aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat caagtttttt 2400 ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc gatttagagc 2460 ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg 2520 cgctaaggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct 2580 taatgcgccg ctacagggcg cgtactatgg ttgctttgac gtatgcggtg tgaaataccg 2640 cacagatgcg taaggagaaa atacatcgtg atccggatca agatccagat cgaattggag 2700 gctacagtca gtggagagga ctttcactga ctgactgact gcgtctcaac ctcctagggg 2760 acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 2820 atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 2880 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 2940 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 3000 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 3060 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 3120 agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 3180 gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 3240 gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 3300 gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgggt 3360 ctctctggtt agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc 3420 ttaagcctca ataaagcttg ccttgagtgc tcaaagtagt gtgtgcccgt ctgttgtgtg 3480 actctggtaa ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg 3540 gcgcccgaac agggacttga aagcgaaagt aaagccagag gagatctctc gacgcaggac 3600 tcggcttgct gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa 3660 aattttgact agcggaggct agaaggagag agtagggtgc gagagcgtcg gtattaagcg 3720 ggggagaatt agataaatgg gaaaaaattc ggttaaggcc agggggaaag aaacaatata 3780 aactaaaaca tatagttagg gcaagcaggg agctagaacg attcgcagtt aatcctggcc 3840 ttttagagac atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga 3900 caggatcaga agaacttaga tcattatata atacaatagc agtcctctat tgtgtgcatc 3960 aaaggataga tgtaaaagac accaaggaag ccttagataa gatagaggaa gagcaaaaca 4020 aaagtaagaa aaaggcacag caagcgatct tcagacctgg aggaggcagg aggcgatatg 4080 agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga accattagga 4140 gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata 4200 ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg 4260 acgctgacgg tacaggccag acaattattg tctgatatag tgcagcagca gaacaatttg 4320 ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaaacag 4380 ctccaggcaa gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt 4440 tggggttgct ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt 4500 aataaatctc tggaacagat ttggaataac atgacctgga tggagtggga cagagaaatt 4560 aacaattaca caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag 4620 aatgaacaag aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata 4680 acaaattggc tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta 4740 agaatagttt ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta 4800 tcgtttcaga cccacctccc aatcccgagg ggaccacgcg tacaaatggc agtattcatc 4860 cacaatttta aaagaaaagg ggggattggg gggtacagtg caggggaaag aatagtagac 4920 ataatagcaa cagacataca aactaaagaa ttacaaaaac aaattacaaa aattcaaaat 4980 tttcgggttt attacaggga cagcagaaat ccactttgga aagctgagca tccggctccg 5040 gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg 5100 tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa agtgatgtcg 5160 tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt gcagtagtcg 5220 ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt gccgtgtgtg 5280 gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga attacttcca 5340 cgcccctggc tgcagtacgt gattcttgat cccgagcttc gggttggaag tgggtgggag 5400 agttcgaggc cttgcgctta aggagcccct tcgcctcgtg cttgagttga ggcctggcct 5460 gggcgctggg gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct cgctgctttc 5520 gataagtctc tagccattta aaatttttga tgacctgctg cgacgctttt tttctggcaa 5580 gatagtcttg taaatgcggg ccaagatctg cacactggta tttcggtttt tggggccgcg 5640 ggcggcgacg gggcccgtgc gtcccagcgc acatgttcgg cgaggcgggg cctgcgagcg 5700 cggccaccga gaatcggacg ggggtagtct caagctggcc ggcctgctct ggtgcctggc 5760 ctcgcgccgc cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc ggcaccagtt 5820 gcgtgagcgg aaagatggcc gcttcccggc cctgctgcag ggagctcaaa atggaggacg 5880 cggcgctcgg gagagcgggc gggtgagtca cccacacaaa ggaaaagggc ctttccgtcc 5940 tcagccgtcg cttcatgtga ctccacggag taccgggcgc cgtccaggca cctcgattag 6000 ttctcgagct tttggagtac gtcgtcttta ggttgggggg aggggtttta tgcgatggag 6060 tttccccaca ctgagtgggt ggagactgaa gttaggccag cttggcactt gatgtaattc 6120 tccttggaat ttgccctttt tgagtttgga tcttggttca ttctcaagcc tcagacagtg 6180 gttcaaagtt tttttcttcc atttcaggtg tcgtgaaaac tacccctcag agccgccacc 6240 atgcttctcc tggtgacaag ccttctgctc tgtgagttac cacacccagc attcctcctg 6300 atccccgcca cctaccccag ttcagacgtt ccctgtgatg ccacgttgac tgagaaaagc 6360 tttgaaacag atatgaacct aaactttcaa aacctgtcag ttatgggact ccgaatcctc 6420 ctgctgaaag tagccggatt taacctgctc atgacgctga ggctgtggtc cagtggcagc 6480 ggcgagggca gaggaagtct gctaacatgc ggtgacgtcg aggagaatcc tggacctggt 6540 cgagcagact gtggtattac ctcagcatcc tatcaacaag gagtcttgtc tgccaccatc 6600 ctctatgaga tcctgctagg gaaagccacc ctgtatgctg tgcttgtcag tacactggtg 6660 gtgatggcta tggtcaaaag aaagaattca gggtcaggcg ctactaactt cagcctgctg 6720 aagcaggctg gagacgtgga ggagaaccct ggacctatgc tactacttgt gacctcacta 6780 ttgttatgcg aactccctca tcccgcattc ttgctgattc cagaagttca gctggtagag 6840 tccggtggcg ggctggtaca gccaggggga tctctccgtc tctcatgtgc tgccagtggg 6900 ggagattggt ccgctaactt tatgtactgg tatcgtcaag cacctgggaa acaacgcgag 6960 ctggttgcac ggatctctgg acgaggggta gtggattacg tggaaagtgt gaaaggacga 7020 ttcacaattt ccagggacaa ttctaaaaac accctttatt tgcaaatgaa tagtctgaga 7080 gcagaagaca cagccgtata ttattgtgca gtcgcatcct attgggggca ggggactctt 7140 gtcacagtct cgagtgctgc cgcaggaggc ggtggcagtg gtgggggagg atctggcgga 7200 ggaggtagcc tcgaggatgg taatgaagaa atgggtggta ttacacagac accatataaa 7260 gtctccatct ctggaaccac agtaatattg acatgccctc agtatcctgg atctgaaata 7320 ctatggcaac acaatgacaa aaacataggc ggagatgagg atgataagaa cataggcagt 7380 gatgaggatc acctgtcact gaaggaattt tcagaattgg agcaaagtgg ttattatgtc 7440 tgctacccca gaggaagcaa accagaagat gcgaactttt atctctacct gagggcaaga 7500 gtgtgtgaga actgcatgga gatggatgtg atgtcggtgg ccacaattgt catagtggac 7560 atctgcatca ctgggggctt gctgctgctg gtttactact ggagcaagaa tagaaaggcc 7620 aaggccaagc ctgtgacacg aggagcgggt gctggcggca ggcaaagggg acaaaacaag 7680 gagaggccac cacctgttcc caacccagac tatgagccca tccggaaagg ccagcgggac 7740 ctgtattctg gcctgaatca gagacgcatc taagatatcg agcatcttac cgccatttat 7800 acccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 7860 tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 7920 caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 7980 ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 8040 ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 8100 gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 8160 gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 8220 attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 8280 gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 8340 gataattccg tggtgttgtc agtactggta cctttaagac caatgactta caaggcagct 8400 gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat tcactcccaa 8460 agaagacaag atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc 8520 tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag cttgccttga 8580 gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag atccctcaga 8640 cccttttagt cagtgtggaa aatctctagc a 8671 <210> 194 <211> 8928 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 194 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 60 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 120 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 180 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 240 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 300 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 360 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 420 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 480 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 540 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 600 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 660 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 720 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 780 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagttaat taacttgcgc 840 cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc aattctgatt 900 agaaaaactc atcgagcatc aaatgaaact gcaatttatt cacatcagga ttatcaatac 960 catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 1020 ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 1080 ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 1140 aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 1200 cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 1260 cctgagcaag acgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgaat 1320 gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 1380 cttctaatac ctggaatgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 1440 caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc agccagttta 1500 gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 1560 actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 1620 tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 1680 tcgacgtttc ccgttgaata tggctcataa caccccttgt attactgttt atgtaagcag 1740 acagttttat tgttcatgat gatatatttt tatcttgtgc aatgtaacat cagagatttt 1800 gagacacaac gtggctttcc cccccccccc catgacatta acctataaaa ataggcgtat 1860 cacgaggcca gcttgggaaa ccataagacc gagatagagt tgagtgttgt tccagtttgg 1920 aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 1980 cagggcgatg gcccactacg tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc 2040 cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 2100 ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc taaggcgctg 2160 gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 2220 cagggcgcgt actatggttg ctttgacgta tgcggtgtga aataccgcac agatgcgtaa 2280 ggagaaaata catcgtgatc cggatcaaga tccagatcga attggaggct acagtcagtg 2340 gagaggactt tcactgactg actgactgcg tctcaacctc ctaggggaca ttgattattg 2400 actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 2460 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 2520 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 2580 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 2640 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 2700 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 2760 accatggtga tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg 2820 ggatttccaa gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa 2880 cgggactttc caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt 2940 gtacggtggg aggtctatat aagcagagct cgtttagtga accgggtctc tctggttaga 3000 ccagatctga gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata 3060 aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta 3120 gagatccctc agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg 3180 gacttgaaag cgaaagtaaa gccagaggag atctctcgac gcaggactcg gcttgctgaa 3240 gcgcgcacgg caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc 3300 ggaggctaga aggagagagt agggtgcgag agcgtcggta ttaagcgggg gagaattaga 3360 taaatgggaa aaaattcggt taaggccagg gggaaagaaa caatataaac taaaacatat 3420 agttagggca agcagggagc tagaacgatt cgcagttaat cctggccttt tagagacatc 3480 agaaggctgt agacaaatac tgggacagct acaaccatcc cttcagacag gatcagaaga 3540 acttagatca ttatataata caatagcagt cctctattgt gtgcatcaaa ggatagatgt 3600 aaaagacacc aaggaagcct tagataagat agaggaagag caaaacaaaa gtaagaaaaa 3660 ggcacagcaa gcgatcttca gacctggagg aggcaggagg cgatatgagg gacaattgga 3720 gaagtgaatt atataaatat aaagtagtaa aaattgaacc attaggagta gcacccacca 3780 aggcaaagag aagagtggtg cagagagaaa aaagagcagt gggaatagga gctttgttcc 3840 ttgggttctt gggagcagca ggaagcacta tgggcgcagc gtcaatgacg ctgacggtac 3900 aggccagaca attattgtct gatatagtgc agcagcagaa caatttgctg agggctattg 3960 aggcgcaaca gcatctgttg caactcacag tctggggcat caaacagctc caggcaagaa 4020 tcctggctgt ggaaagatac ctaaaggatc aacagctcct ggggatttgg ggttgctctg 4080 gaaaactcat ttgcaccact gctgtgcctt ggaatgctag ttggagtaat aaatctctgg 4140 aacagatttg gaataacatg acctggatgg agtgggacag agaaattaac aattacacaa 4200 gcttaataca ctccttaatt gaagaatcgc aaaaccagca agaaaagaat gaacaagaat 4260 tattggaatt agataaatgg gcaagtttgt ggaattggtt taacataaca aattggctgt 4320 ggtatataaa attattcata atgatagtag gaggcttggt aggtttaaga atagtttttg 4380 ctgtactttc tatagtgaat agagttaggc agggatattc accattatcg tttcagaccc 4440 acctcccaat cccgagggga ccacgcgtac aaatggcagt attcatccac aattttaaaa 4500 gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 4560 acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 4620 acagggacag cagaaatcca ctttggaaag ctgagcatcc ggctccggtg cccgtcagtg 4680 ggcagagcgc acatcgccca cagtccccga gaagttgggg ggaggggtcg gcaattgaac 4740 cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt gatgtcgtgt actggctccg 4800 cctttttccc gagggtgggg gagaaccgta tataagtgca gtagtcgccg tgaacgttct 4860 ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc gtgtgtggtt cccgcgggcc 4920 tggcctcttt acgggttatg gcccttgcgt gccttgaatt acttccacgc ccctggctgc 4980 agtacgtgat tcttgatccc gagcttcggg ttggaagtgg gtgggagagt tcgaggcctt 5040 gcgcttaagg agccccttcg cctcgtgctt gagttgaggc ctggcctggg cgctggggcc 5100 gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc tgctttcgat aagtctctag 5160 ccatttaaaa tttttgatga cctgctgcga cgcttttttt ctggcaagat agtcttgtaa 5220 atgcgggcca agatctgcac actggtattt cggtttttgg ggccgcgggc ggcgacgggg 5280 cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct gcgagcgcgg ccaccgagaa 5340 tcggacgggg gtagtctcaa gctggccggc ctgctctggt gcctggcctc gcgccgccgt 5400 gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc accagttgcg tgagcggaaa 5460 gatggccgct tcccggccct gctgcaggga gctcaaaatg gaggacgcgg cgctcgggag 5520 agcgggcggg tgagtcaccc acacaaagga aaagggcctt tccgtcctca gccgtcgctt 5580 catgtgactc cacggagtac cgggcgccgt ccaggcacct cgattagttc tcgagctttt 5640 ggagtacgtc gtctttaggt tggggggagg ggttttatgc gatggagttt ccccacactg 5700 agtgggtgga gactgaagtt aggccagctt ggcacttgat gtaattctcc ttggaatttg 5760 ccctttttga gtttggatct tggttcattc tcaagcctca gacagtggtt caaagttttt 5820 ttcttccatt tcaggtgtcg tgaaaactac cccatgccgc caccatgctt ctcctggtga 5880 caagccttct gctctgtgag ttaccacacc cagcattcct cctgatccca gaagttcagc 5940 tggtagagtc cggtggcggg ctggtacagc cagggggatc tctccgtctc tcatgtgctg 6000 ccagtggggg agattggtcc gctaacttta tgtactggta tcgtcaagca cctgggaaac 6060 aacgcgagct ggttgcacgg atctctggac gaggggtagt ggattacgtg gaaagtgtga 6120 aaggacgatt cacaatttcc agggacaatt ctaaaaacac cctttatttg caaatgaata 6180 gtctgagagc agaagacaca gccgtatatt attgtgcagt cgcatcctat tgggggcagg 6240 ggactcttgt cacagtctcg agtattcaga accctgagcc tgccgtgtat caactgaagg 6300 accctagaag ccaggacagc accctgtgcc tgttcaccga cttcgacagc cagatcaacg 6360 tgcccaagac catggaaagc ggcaccttca tcaccgataa gactgtgctg gacatgaagg 6420 ccatggacag caagagcaac ggcgccattg catggtccaa tcagaccagc tttacctgcc 6480 aagacatctt caaagagaca aacgccacct accccagttc agacgttccc tgtgatgcca 6540 cgttgactga gaaaagcttt gaaacagata tgaacctaaa ctttcaaaac ctgtcagtta 6600 tgggactccg aatcctcctg ctgaaagtag ccggatttaa cctgctcatg acgctgaggc 6660 tgtggtccag tggcagcggc gctactaact tcagcctgct gaagcaggct ggagacgtgg 6720 aggagaaccc tggacctatg ctactacttg tgacctcact attgttatgc gaactccctc 6780 atcccgcatt cttgctgatt ccagaggtgc aacttgtgga aagtggggga ggtctcgttc 6840 aacctggtgg cagccttaga ctgagctgcg cagcttcagg aggtgactgg agtgcaaatt 6900 tcatgtattg gtacagacag gctccaggaa agcagcgaga acttgtagcc agaattagcg 6960 gtaggggagt tgtcgactat gtcgagtcag ttaagggtag gtttaccatc agtcgagata 7020 acagcaagaa tacattgtac ctccagatga actcacttcg ggctgaggat actgcagtgt 7080 actactgcgc tgttgctagt tactggggac aaggtacatt ggtaactgtt agttcagatc 7140 tgagaaatgt gactccaccc aaggtctcct tgtttgagcc atcaaaagca gagattgcaa 7200 acaaacaaaa ggctaccctc gtgtgcttgg ccaggggctt cttccctgac cacgtggagc 7260 tgagctggtg ggtgaatggc aaggaggtcc acagtggggt cagcacggac ccacaggcct 7320 acaaggagag caattatagc tactgcctga gcagccgcct gagggtctct gctaccttct 7380 ggcacaatcc tcgcaaccac ttccgctgcc aagtgcagtt ccatgggctt tcagaggagg 7440 acaagtggcc agagggctca cccaaacctg tcacacagaa catcagtgca gaggcctggg 7500 gtcgagcaga ctgtggtatt acctcagcat cctatcaaca aggagtcttg tctgccacca 7560 tcctctatga gatcctgcta gggaaagcca ccctgtatgc tgtgcttgtc agtacactgg 7620 tggtgatggc tatggtcaaa agaaagaatt catgagatat cgagcatctt accgccattt 7680 atacccatat ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa 7740 aatggtgggg caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc 7800 cacaagacaa acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac 7860 ctctggatta caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta 7920 cgctgtgtgg atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt 7980 tcgttttctc ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg 8040 ttgtccgtca acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg 8100 gcattgccac cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca 8160 cggcagaact catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca 8220 ctgataattc cgtggtgttg tcagtactgg tacctttaag accaatgact tacaaggcag 8280 ctgtagatct tagccacttt ttaaaagaaa aggggggact ggaagggcta attcactccc 8340 aaagaagaca agatctgctt tttgcctgta ctgggtctct ctggttagac cagatctgag 8400 cctgggagct ctctggctaa ctagggaacc cactgcttaa gcctcaataa agcttgcctt 8460 gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc tggtaactag agatccctca 8520 gaccctttta gtcagtgtgg aaaatctcta gcatgatcat aatcaagcca tatcacatct 8580 gtagaggttt acttgcttta aaaaacctcc acacctcccc ctgaacctga aacataaaat 8640 gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa 8700 tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 8760 caaactcatc aatgtatctt atcatgtctg gatctgcgtc gacacgaaga gacgactgac 8820 tgactgactg gaaagaggaa gggctggaag aggaaggagc ttgatccaga tcccgatctc 8880 gatccagatc cggatcgcag cttggtcttc cgcttcctcg ctcactga 8928 <210> 195 <211> 9339 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 195 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 60 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 120 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 180 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 240 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 300 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 360 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 420 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 480 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 540 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 600 aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 660 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 720 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 780 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagttaat taacttgcgc 840 cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc aattctgatt 900 agaaaaactc atcgagcatc aaatgaaact gcaatttatt cacatcagga ttatcaatac 960 catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 1020 ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 1080 ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 1140 aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 1200 cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 1260 cctgagcaag acgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgaat 1320 gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 1380 cttctaatac ctggaatgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 1440 caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc agccagttta 1500 gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 1560 actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 1620 tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 1680 tcgacgtttc ccgttgaata tggctcataa caccccttgt attactgttt atgtaagcag 1740 acagttttat tgttcatgat gatatatttt tatcttgtgc aatgtaacat cagagatttt 1800 gagacacaac gtggctttcc cccccccccc catgacatta acctataaaa ataggcgtat 1860 cacgaggcca gcttgggaaa ccataagacc gagatagagt tgagtgttgt tccagtttgg 1920 aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 1980 cagggcgatg gcccactacg tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc 2040 cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 2100 ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc taaggcgctg 2160 gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 2220 cagggcgcgt actatggttg ctttgacgta tgcggtgtga aataccgcac agatgcgtaa 2280 ggagaaaata catcgtgatc cggatcaaga tccagatcga attggaggct acagtcagtg 2340 gagaggactt tcactgactg actgactgcg tctcaacctc ctaggggaca ttgattattg 2400 actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 2460 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 2520 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 2580 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 2640 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 2700 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 2760 accatggtga tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg 2820 ggatttccaa gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa 2880 cgggactttc caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt 2940 gtacggtggg aggtctatat aagcagagct cgtttagtga accgggtctc tctggttaga 3000 ccagatctga gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata 3060 aagcttgcct tgagtgctca aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta 3120 gagatccctc agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg 3180 gacttgaaag cgaaagtaaa gccagaggag atctctcgac gcaggactcg gcttgctgaa 3240 gcgcgcacgg caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc 3300 ggaggctaga aggagagagt agggtgcgag agcgtcggta ttaagcgggg gagaattaga 3360 taaatgggaa aaaattcggt taaggccagg gggaaagaaa caatataaac taaaacatat 3420 agttagggca agcagggagc tagaacgatt cgcagttaat cctggccttt tagagacatc 3480 agaaggctgt agacaaatac tgggacagct acaaccatcc cttcagacag gatcagaaga 3540 acttagatca ttatataata caatagcagt cctctattgt gtgcatcaaa ggatagatgt 3600 aaaagacacc aaggaagcct tagataagat agaggaagag caaaacaaaa gtaagaaaaa 3660 ggcacagcaa gcgatcttca gacctggagg aggcaggagg cgatatgagg gacaattgga 3720 gaagtgaatt atataaatat aaagtagtaa aaattgaacc attaggagta gcacccacca 3780 aggcaaagag aagagtggtg cagagagaaa aaagagcagt gggaatagga gctttgttcc 3840 ttgggttctt gggagcagca ggaagcacta tgggcgcagc gtcaatgacg ctgacggtac 3900 aggccagaca attattgtct gatatagtgc agcagcagaa caatttgctg agggctattg 3960 aggcgcaaca gcatctgttg caactcacag tctggggcat caaacagctc caggcaagaa 4020 tcctggctgt ggaaagatac ctaaaggatc aacagctcct ggggatttgg ggttgctctg 4080 gaaaactcat ttgcaccact gctgtgcctt ggaatgctag ttggagtaat aaatctctgg 4140 aacagatttg gaataacatg acctggatgg agtgggacag agaaattaac aattacacaa 4200 gcttaataca ctccttaatt gaagaatcgc aaaaccagca agaaaagaat gaacaagaat 4260 tattggaatt agataaatgg gcaagtttgt ggaattggtt taacataaca aattggctgt 4320 ggtatataaa attattcata atgatagtag gaggcttggt aggtttaaga atagtttttg 4380 ctgtactttc tatagtgaat agagttaggc agggatattc accattatcg tttcagaccc 4440 acctcccaat cccgagggga ccacgcgtac aaatggcagt attcatccac aattttaaaa 4500 gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 4560 acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 4620 acagggacag cagaaatcca ctttggaaag ctgagcatcc ggctccggtg cccgtcagtg 4680 ggcagagcgc acatcgccca cagtccccga gaagttgggg ggaggggtcg gcaattgaac 4740 cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt gatgtcgtgt actggctccg 4800 cctttttccc gagggtgggg gagaaccgta tataagtgca gtagtcgccg tgaacgttct 4860 ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc gtgtgtggtt cccgcgggcc 4920 tggcctcttt acgggttatg gcccttgcgt gccttgaatt acttccacgc ccctggctgc 4980 agtacgtgat tcttgatccc gagcttcggg ttggaagtgg gtgggagagt tcgaggcctt 5040 gcgcttaagg agccccttcg cctcgtgctt gagttgaggc ctggcctggg cgctggggcc 5100 gccgcgtgcg aatctggtgg caccttcgcg cctgtctcgc tgctttcgat aagtctctag 5160 ccatttaaaa tttttgatga cctgctgcga cgcttttttt ctggcaagat agtcttgtaa 5220 atgcgggcca agatctgcac actggtattt cggtttttgg ggccgcgggc ggcgacgggg 5280 cccgtgcgtc ccagcgcaca tgttcggcga ggcggggcct gcgagcgcgg ccaccgagaa 5340 tcggacgggg gtagtctcaa gctggccggc ctgctctggt gcctggcctc gcgccgccgt 5400 gtatcgcccc gccctgggcg gcaaggctgg cccggtcggc accagttgcg tgagcggaaa 5460 gatggccgct tcccggccct gctgcaggga gctcaaaatg gaggacgcgg cgctcgggag 5520 agcgggcggg tgagtcaccc acacaaagga aaagggcctt tccgtcctca gccgtcgctt 5580 catgtgactc cacggagtac cgggcgccgt ccaggcacct cgattagttc tcgagctttt 5640 ggagtacgtc gtctttaggt tggggggagg ggttttatgc gatggagttt ccccacactg 5700 agtgggtgga gactgaagtt aggccagctt ggcacttgat gtaattctcc ttggaatttg 5760 ccctttttga gtttggatct tggttcattc tcaagcctca gacagtggtt caaagttttt 5820 ttcttccatt tcaggtgtcg tgaaaactac cccatgccgc caccatgctt ctcctggtga 5880 caagccttct gctctgtgag ttaccacacc cagcattcct cctgatccca attcagaacc 5940 ctgagcctgc cgtgtatcaa ctgaaggacc ctagaagcca ggacagcacc ctgtgcctgt 6000 tcaccgactt cgacagccag atcaacgtgc ccaagaccat ggaaagcggc accttcatca 6060 ccgataagac tgtgctggac atgaaggcca tggacagcaa gagcaacggc gccattgcat 6120 ggtccaatca gaccagcttt acctgccaag acatcttcaa agagacaaac gccacctacc 6180 ccagttcaga cgttccctgt gatgccacgt tgactgagaa aagctttgaa acagatatga 6240 acctaaactt tcaaaacctg tcagttatgg gactccgaat cctcctgctg aaagtagccg 6300 gatttaacct gctcatgacg ctgaggctgt ggtccagtgg cagcggcgag ggcagaggaa 6360 gtctgctaac atgcggtgac gtcgaggaga atcctggacc tatgctacta cttgtgacct 6420 cactattgtt atgcgaactc cctcatcccg cattcttgct gattccagat ctgagaaatg 6480 tgactccacc caaggtctcc ttgtttgagc catcaaaagc agagattgca aacaaacaaa 6540 aggctaccct cgtgtgcttg gccaggggct tcttccctga ccacgtggag ctgagctggt 6600 gggtgaatgg caaggaggtc cacagtgggg tcagcacgga cccacaggcc tacaaggaga 6660 gcaattatag ctactgcctg agcagccgcc tgagggtctc tgctaccttc tggcacaatc 6720 ctcgcaacca cttccgctgc caagtgcagt tccatgggct ttcagaggag gacaagtggc 6780 cagagggctc acccaaacct gtcacacaga acatcagtgc agaggcctgg ggtcgagcag 6840 actgtggtat tacctcagca tcctatcaac aaggagtctt gtctgccacc atcctctatg 6900 agatcctgct agggaaagcc accctgtatg ctgtgcttgt cagtacactg gtggtgatgg 6960 ctatggtcaa aagaaagaat tcaggatctg gtgctactaa cttcagcctg ctgaagcagg 7020 ctggagacgt ggaggagaac cctggaccta tgctcctgct tgtgacgtcc ctcctgcttt 7080 gtgaactccc gcatcctgcc ttcctgctca tccctgaagt tcagctggta gagtccggtg 7140 gcgggctggt acagccaggg ggatctctcc gtctctcatg tgctgccagt gggggagatt 7200 ggtccgctaa ctttatgtac tggtatcgtc aagcacctgg gaaacaacgc gagctggttg 7260 cacggatctc tggacgaggg gtagtggatt acgtggaaag tgtgaaagga cgattcacaa 7320 tttccaggga caattctaaa aacacccttt atttgcaaat gaatagtctg agagcagaag 7380 acacagccgt atattattgt gcagtcgcat cctattgggg gcaggggact cttgtcacag 7440 tctcgagtgc tgccgcagga ggcggtggca gtggtggggg aggatctggc ggaggaggta 7500 gcctcgagga cggaaacgag gagatggggg gaatcactca aaccccttac aaggtgtcta 7560 tttccggcac taccgtgatt cttacctgtc cacaataccc aggcagcgat attctctggc 7620 agcataacga caaaaatatc ggaggagacg aagacgacaa gaatatcggg tcggacgaag 7680 accatctcag ccttaaagag ttcagcgagc ttgaacagag cggctactac gtttgttatc 7740 cacgagggtc taagcctgag gacgcaaatt tctacctgta tctcagagct agggtttgcg 7800 aaaattgtat ggaaatggac gttatgagtg tcgctacgat cgtgattgtt gatatttgta 7860 ttacaggagg gctgcttttg ctcgtctatt attggtctaa aaaccggaaa gctaaagcaa 7920 aacccgtaac gaggggcgct ggagcaggag gaagacagag aggccagaat aaagaacgtc 7980 ctcccccagt gccaaatccc gattacgaac caattagaaa gggacaaaga gatttgtaca 8040 gcggactcaa ccaacggaga atttgagata tcgagcatct taccgccatt tatacccata 8100 tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 8160 gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 8220 aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 8280 acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 8340 gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 8400 cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 8460 aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 8520 ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 8580 tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 8640 ccgtggtgtt gtcagtactg gtacctttaa gaccaatgac ttacaaggca gctgtagatc 8700 ttagccactt tttaaaagaa aaggggggac tggaagggct aattcactcc caaagaagac 8760 aagatctgct ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc 8820 tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct tgagtgcttc 8880 aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc agaccctttt 8940 agtcagtgtg gaaaatctct agcatgatca taatcaagcc atatcacatc tgtagaggtt 9000 tacttgcttt aaaaaacctc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 9060 tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 9120 aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 9180 caatgtatct tatcatgtct ggatctgcgt cgacacgaag agacgactga ctgactgact 9240 ggaaagagga agggctggaa gaggaaggag cttgatccag atcccgatct cgatccagat 9300 ccggatcgca gcttggtctt ccgcttcctc gctcactga 9339 <210> 196 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 196 ctcgaccagc ttgacatcac 20 <210> 197 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 197 acactggtgt gcctggccac 20 <210> 198 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 198 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Glu Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 35 40 45 Gly Asp Trp Ser Ala Asn Phe Met Tyr Trp Tyr Arg Gln Ala Pro Gly 50 55 60 Lys Gln Arg Glu Leu Val Ala Arg Ile Ser Gly Arg Gly Val Val Asp 65 70 75 80 Tyr Val Glu Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser 85 90 95 Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr 100 105 110 Ala Val Tyr Tyr Cys Ala Val Ala Ser Tyr Trp Gly Gln Gly Thr Leu 115 120 125 Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly 130 135 140 Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Gly Asn Glu Glu Met Gly 145 150 155 160 Gly Ile Thr Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val 165 170 175 Ile Leu Thr Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp Gln His 180 185 190 Asn Asp Lys Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser 195 200 205 Asp Glu Asp His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser 210 215 220 Gly Tyr Tyr Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala Asn 225 230 235 240 Phe Tyr Leu Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met Glu Met 245 250 255 Asp Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr 260 265 270 Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg Lys Ala 275 280 285 Lys Ala Lys Pro Val Thr Arg Gly Ala Gly Ala Gly Gly Arg Gln Arg 290 295 300 Gly Gln Asn Lys Glu Arg Pro Pro Pro Val Pro Asn Pro Asp Tyr Glu 305 310 315 320 Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn Gln Arg 325 330 335 Arg Ile <210> 199 <211> 469 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 199 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 145 150 155 160 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 165 170 175 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 180 185 190 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 195 200 205 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 210 215 220 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 225 230 235 240 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 245 250 255 Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser 260 265 270 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Gly Asn Glu 275 280 285 Glu Met Gly Gly Ile Thr Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly 290 295 300 Thr Thr Val Ile Leu Thr Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu 305 310 315 320 Trp Gln His Asn Asp Lys Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn 325 330 335 Ile Gly Ser Asp Glu Asp His Leu Ser Leu Lys Glu Phe Ser Glu Leu 340 345 350 Glu Gln Ser Gly Tyr Tyr Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu 355 360 365 Asp Ala Asn Phe Tyr Leu Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys 370 375 380 Met Glu Met Asp Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile 385 390 395 400 Cys Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn 405 410 415 Arg Lys Ala Lys Ala Lys Pro Val Thr Arg Gly Ala Gly Ala Gly Gly 420 425 430 Arg Gln Arg Gly Gln Asn Lys Glu Arg Pro Pro Pro Val Pro Asn Pro 435 440 445 Asp Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu 450 455 460 Asn Gln Arg Arg Ile 465 <210> 200 <211> 165 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 200 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly 20 25 30 Leu Asp Ser Thr Gly Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp 35 40 45 Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe 50 55 60 Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala 65 70 75 80 Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly 85 90 95 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 100 105 110 Gly Pro Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln 115 120 125 Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala 130 135 140 Thr Leu Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val 145 150 155 160 Lys Arg Lys Asn Ser 165 <210> 201 <211> 22 <212> PRT <213> Unknown <220> <223> Description of Unknown: GM-CSFRa signal peptide sequence <400> 201 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro 20 <210> 202 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 202 Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr 1 5 10 <210> 203 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 203 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 204 <211> 393 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 204 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 145 150 155 160 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 165 170 175 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 180 185 190 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 195 200 205 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 210 215 220 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 225 230 235 240 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 245 250 255 Gly Thr Ser Val Thr Val Ser Ser Gly Ala Thr Tyr Pro Ser Ser Asp 260 265 270 Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met 275 280 285 Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu 290 295 300 Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser 305 310 315 320 Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val 325 330 335 Glu Glu Asn Pro Gly Pro Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala 340 345 350 Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu 355 360 365 Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Thr Leu Val Val 370 375 380 Met Ala Met Val Lys Arg Lys Asn Ser 385 390 <210> 205 <211> 242 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 205 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Gly Gly Gly Ser 100 105 110 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val Lys Leu Gln Glu 115 120 125 Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys 130 135 140 Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg 145 150 155 160 Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser 165 170 175 Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile 180 185 190 Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln 195 200 205 Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly 210 215 220 Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val 225 230 235 240 Ser Ser <210> 206 <211> 595 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 206 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 145 150 155 160 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 165 170 175 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 180 185 190 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 195 200 205 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 210 215 220 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 225 230 235 240 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 245 250 255 Gly Thr Ser Val Thr Val Ser Ser Gly Ile Gln Asn Pro Glu Pro Ala 260 265 270 Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu Cys Leu 275 280 285 Phe Thr Asp Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met Glu Ser 290 295 300 Gly Thr Phe Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala Met Asp 305 310 315 320 Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser Phe Thr 325 330 335 Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser Ser Asp 340 345 350 Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met 355 360 365 Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu 370 375 380 Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser 385 390 395 400 Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp 405 410 415 Val Glu Glu Asn Pro Gly Pro Asp Leu Arg Asn Val Thr Pro Pro Lys 420 425 430 Val Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys 435 440 445 Ala Thr Leu Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val Glu 450 455 460 Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr 465 470 475 480 Asp Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser 485 490 495 Arg Leu Arg Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn His Phe 500 505 510 Arg Cys Gln Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp Pro 515 520 525 Glu Gly Ser Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala Trp 530 535 540 Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val 545 550 555 560 Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu 565 570 575 Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg 580 585 590 Lys Asn Ser 595 <210> 207 <211> 136 <212> PRT <213> Mus musculus <400> 207 Ile Gln Asn Pro Glu Pro Ala Val Tyr Gln Leu Lys Asp Pro Arg Ser 1 5 10 15 Gln Asp Ser Thr Leu Cys Leu Phe Thr Asp Phe Asp Ser Gln Ile Asn 20 25 30 Val Pro Lys Thr Met Glu Ser Gly Thr Phe Ile Thr Asp Lys Thr Val 35 40 45 Leu Asp Met Lys Ala Met Asp Ser Lys Ser Asn Gly Ala Ile Ala Trp 50 55 60 Ser Asn Gln Thr Ser Phe Thr Cys Gln Asp Ile Phe Lys Glu Thr Asn 65 70 75 80 Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu 85 90 95 Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val 100 105 110 Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu 115 120 125 Met Thr Leu Arg Leu Trp Ser Ser 130 135 <210> 208 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 208 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 209 <211> 172 <212> PRT <213> Mus musculus <400> 209 Asp Leu Arg Asn Val Thr Pro Pro Lys Val Ser Leu Phe Glu Pro Ser 1 5 10 15 Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala Thr Leu Val Cys Leu Ala 20 25 30 Arg Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn Gly 35 40 45 Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Ala Tyr Lys Glu 50 55 60 Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr 65 70 75 80 Phe Trp His Asn Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe His 85 90 95 Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu Gly Ser Pro Lys Pro Val 100 105 110 Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Ile 115 120 125 Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr 130 135 140 Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Thr 145 150 155 160 Leu Val Val Met Ala Met Val Lys Arg Lys Asn Ser 165 170 <210> 210 <211> 594 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 210 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 145 150 155 160 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 165 170 175 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 180 185 190 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 195 200 205 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 210 215 220 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 225 230 235 240 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 245 250 255 Gly Thr Ser Val Thr Val Ser Ser Gly Ile Gln Asn Pro Glu Pro Ala 260 265 270 Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu Cys Leu 275 280 285 Phe Thr Asp Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met Glu Ser 290 295 300 Gly Thr Phe Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala Met Asp 305 310 315 320 Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser Phe Thr 325 330 335 Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser Ser Asp 340 345 350 Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met 355 360 365 Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu 370 375 380 Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser 385 390 395 400 Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val 405 410 415 Glu Glu Asn Pro Gly Pro Asp Leu Arg Asn Val Thr Pro Pro Lys Val 420 425 430 Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala 435 440 445 Thr Leu Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val Glu Leu 450 455 460 Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp 465 470 475 480 Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg 485 490 495 Leu Arg Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn His Phe Arg 500 505 510 Cys Gln Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu 515 520 525 Gly Ser Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly 530 535 540 Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu 545 550 555 560 Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr 565 570 575 Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg Lys 580 585 590 Asn Ser <210> 211 <211> 703 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 211 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Gly 275 280 285 Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu 290 295 300 Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val 305 310 315 320 Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu 325 330 335 Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Glu Gly Arg Gly Ser 340 345 350 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 355 360 365 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 370 375 380 Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala 385 390 395 400 Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile 405 410 415 Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys 420 425 430 Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg 435 440 445 Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn 450 455 460 Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr 465 470 475 480 Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser 485 490 495 Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly 500 505 510 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 515 520 525 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 530 535 540 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 545 550 555 560 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 565 570 575 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 580 585 590 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 595 600 605 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 610 615 620 Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser 625 630 635 640 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Gly Arg Ala Asp 645 650 655 Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr 660 665 670 Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu 675 680 685 Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg Lys Asn Ser 690 695 700 <210> 212 <211> 245 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 212 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 1 5 10 15 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 35 40 45 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 65 70 75 80 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 85 90 95 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly 100 105 110 Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys 115 120 125 Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser 130 135 140 Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser 145 150 155 160 Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile 165 170 175 Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu 180 185 190 Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn 195 200 205 Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr 210 215 220 Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser 225 230 235 240 Val Thr Val Ser Ser 245 <210> 213 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 213 Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Leu Glu Gly 20 <210> 214 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 214 Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Leu Glu 20 <210> 215 <211> 594 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 215 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 145 150 155 160 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 165 170 175 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 180 185 190 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 195 200 205 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 210 215 220 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 225 230 235 240 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 245 250 255 Gly Thr Ser Val Thr Val Ser Ser Gly Ile Gln Asn Pro Glu Pro Ala 260 265 270 Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu Cys Leu 275 280 285 Phe Thr Asp Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met Glu Ser 290 295 300 Gly Thr Phe Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala Met Asp 305 310 315 320 Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser Phe Thr 325 330 335 Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser Ser Asp 340 345 350 Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met 355 360 365 Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu 370 375 380 Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser 385 390 395 400 Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val 405 410 415 Glu Glu Asn Pro Gly Pro Asp Leu Arg Asn Val Thr Pro Pro Lys Val 420 425 430 Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala 435 440 445 Thr Leu Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val Glu Leu 450 455 460 Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp 465 470 475 480 Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg 485 490 495 Leu Arg Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn His Phe Arg 500 505 510 Cys Gln Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu 515 520 525 Gly Ser Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly 530 535 540 Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu 545 550 555 560 Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr 565 570 575 Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg Lys 580 585 590 Asn Ser <210> 216 <211> 594 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 216 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 145 150 155 160 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 165 170 175 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 180 185 190 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 195 200 205 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 210 215 220 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 225 230 235 240 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 245 250 255 Gly Thr Ser Val Thr Val Ser Ser Gly Ile Gln Asn Pro Glu Pro Ala 260 265 270 Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu Cys Leu 275 280 285 Phe Thr Asp Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met Glu Ser 290 295 300 Gly Thr Phe Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala Met Asp 305 310 315 320 Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser Phe Thr 325 330 335 Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser Ser Asp 340 345 350 Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met 355 360 365 Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu 370 375 380 Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser 385 390 395 400 Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val 405 410 415 Glu Glu Asn Pro Gly Pro Asp Leu Arg Asn Val Thr Pro Pro Lys Val 420 425 430 Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala 435 440 445 Thr Leu Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val Glu Leu 450 455 460 Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp 465 470 475 480 Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg 485 490 495 Leu Arg Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn His Phe Arg 500 505 510 Cys Gln Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu 515 520 525 Gly Ser Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly 530 535 540 Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu 545 550 555 560 Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr 565 570 575 Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg Lys 580 585 590 Asn Ser <210> 217 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 217 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Gln Asn Pro Glu 260 265 270 Pro Ala Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu 275 280 285 Cys Leu Phe Thr Asp Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met 290 295 300 Glu Ser Gly Thr Phe Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala 305 310 315 320 Met Asp Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser 325 330 335 Phe Thr Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser 340 345 350 Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr 355 360 365 Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile 370 375 380 Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu 385 390 395 400 Trp Ser Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala 405 410 415 Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser 420 425 430 Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp 435 440 445 Leu Arg Asn Val Thr Pro Pro Lys Val Ser Leu Phe Glu Pro Ser Lys 450 455 460 Ala Glu Ile Ala Asn Lys Gln Lys Ala Thr Leu Val Cys Leu Ala Arg 465 470 475 480 Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn Gly Lys 485 490 495 Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Ala Tyr Lys Glu Ser 500 505 510 Asn Tyr Ser Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr Phe 515 520 525 Trp His Asn Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe His Gly 530 535 540 Leu Ser Glu Glu Asp Lys Trp Pro Glu Gly Ser Pro Lys Pro Val Thr 545 550 555 560 Gln Asn Ile Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Ile Thr 565 570 575 Ser Ala Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu 580 585 590 Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Thr Leu 595 600 605 Val Val Met Ala Met Val Lys Arg Lys Asn Ser 610 615 <210> 218 <211> 639 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 218 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ile 275 280 285 Gln Asn Pro Glu Pro Ala Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln 290 295 300 Asp Ser Thr Leu Cys Leu Phe Thr Asp Phe Asp Ser Gln Ile Asn Val 305 310 315 320 Pro Lys Thr Met Glu Ser Gly Thr Phe Ile Thr Asp Lys Thr Val Leu 325 330 335 Asp Met Lys Ala Met Asp Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser 340 345 350 Asn Gln Thr Ser Phe Thr Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala 355 360 365 Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu Lys 370 375 380 Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val Met 385 390 395 400 Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met 405 410 415 Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu 420 425 430 Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 435 440 445 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 450 455 460 Leu Ile Pro Asp Leu Arg Asn Val Thr Pro Pro Lys Val Ser Leu Phe 465 470 475 480 Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala Thr Leu Val 485 490 495 Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp 500 505 510 Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Ala 515 520 525 Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg Leu Arg Val 530 535 540 Ser Ala Thr Phe Trp His Asn Pro Arg Asn His Phe Arg Cys Gln Val 545 550 555 560 Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu Gly Ser Pro 565 570 575 Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly Arg Ala Asp 580 585 590 Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr 595 600 605 Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu 610 615 620 Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg Lys Asn Ser 625 630 635 <210> 219 <211> 904 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 219 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ile 275 280 285 Gln Asn Pro Glu Pro Ala Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln 290 295 300 Asp Ser Thr Leu Cys Leu Phe Thr Asp Phe Asp Ser Gln Ile Asn Val 305 310 315 320 Pro Lys Thr Met Glu Ser Gly Thr Phe Ile Thr Asp Lys Thr Val Leu 325 330 335 Asp Met Lys Ala Met Asp Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser 340 345 350 Asn Gln Thr Ser Phe Thr Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala 355 360 365 Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu Lys 370 375 380 Ser Phe Glu Thr Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val Met 385 390 395 400 Gly Leu Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met 405 410 415 Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu 420 425 430 Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 435 440 445 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 450 455 460 Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala 465 470 475 480 Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile 485 490 495 Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys 500 505 510 Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg 515 520 525 Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn 530 535 540 Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr 545 550 555 560 Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser 565 570 575 Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly 580 585 590 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 595 600 605 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 610 615 620 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 625 630 635 640 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 645 650 655 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 660 665 670 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 675 680 685 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 690 695 700 Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser 705 710 715 720 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Leu Arg Asn 725 730 735 Val Thr Pro Pro Lys Val Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile 740 745 750 Ala Asn Lys Gln Lys Ala Thr Leu Val Cys Leu Ala Arg Gly Phe Phe 755 760 765 Pro Asp His Val Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His 770 775 780 Ser Gly Val Ser Thr Asp Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser 785 790 795 800 Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp His Asn 805 810 815 Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe His Gly Leu Ser Glu 820 825 830 Glu Asp Lys Trp Pro Glu Gly Ser Pro Lys Pro Val Thr Gln Asn Ile 835 840 845 Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser 850 855 860 Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu 865 870 875 880 Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Thr Leu Val Val Met 885 890 895 Ala Met Val Lys Arg Lys Asn Ser 900 <210> 220 <211> 864 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 220 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ile Gln Asn Pro Glu 260 265 270 Pro Ala Val Tyr Gln Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu 275 280 285 Cys Leu Phe Thr Asp Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met 290 295 300 Glu Ser Gly Thr Phe Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala 305 310 315 320 Met Asp Ser Lys Ser Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser 325 330 335 Phe Thr Cys Gln Asp Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser 340 345 350 Ser Asp Val Pro Cys Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr 355 360 365 Asp Met Asn Leu Asn Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile 370 375 380 Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu 385 390 395 400 Trp Ser Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala 405 410 415 Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser 420 425 430 Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp 435 440 445 Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp 450 455 460 Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu 465 470 475 480 Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr 485 490 495 His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser 500 505 510 Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu 515 520 525 Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr 530 535 540 Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser 545 550 555 560 Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu 565 570 575 Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val 580 585 590 Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp 595 600 605 Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp 610 615 620 Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr 625 630 635 640 Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser 645 650 655 Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr 660 665 670 Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val 675 680 685 Thr Val Ser Ser Asp Leu Arg Asn Val Thr Pro Pro Lys Val Ser Leu 690 695 700 Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln Lys Ala Thr Leu 705 710 715 720 Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp 725 730 735 Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln 740 745 750 Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser Ser Arg Leu Arg 755 760 765 Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn His Phe Arg Cys Gln 770 775 780 Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp Pro Glu Gly Ser 785 790 795 800 Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala Trp Gly Arg Ala 805 810 815 Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly Val Leu Ser Ala 820 825 830 Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val 835 840 845 Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys Arg Lys Asn Ser 850 855 860 <210> 221 <211> 320 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 221 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Gly Trp Gly Arg Ala 260 265 270 Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser Ala 275 280 285 Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val 290 295 300 Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 305 310 315 320 <210> 222 <211> 52 <212> PRT <213> Homo sapiens <400> 222 Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly 1 5 10 15 Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr 20 25 30 Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys 35 40 45 Arg Lys Asp Phe 50 <210> 223 <211> 334 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 223 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Cys 275 280 285 Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile 290 295 300 Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val 305 310 315 320 Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 325 330 <210> 224 <211> 47 <212> PRT <213> Homo sapiens <400> 224 Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr 1 5 10 15 Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu 20 25 30 Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 35 40 45 <210> 225 <211> 446 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 225 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Gly Val Glu Asp Leu 260 265 270 Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro Ser Glu Ala 275 280 285 Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu Ala Thr Gly 290 295 300 Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn Gly Lys Glu 305 310 315 320 Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys Glu Gln Pro 325 330 335 Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser 340 345 350 Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys Gln Val Gln 355 360 365 Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp Arg Ala Lys 370 375 380 Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys 385 390 395 400 Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile 405 410 415 Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val 420 425 430 Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 435 440 445 <210> 226 <211> 2 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 226 Val Glu 1 <210> 227 <211> 176 <212> PRT <213> Homo sapiens <400> 227 Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro Ser 1 5 10 15 Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu Ala 20 25 30 Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn Gly 35 40 45 Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys Glu 50 55 60 Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu Arg 65 70 75 80 Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys Gln 85 90 95 Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp Arg 100 105 110 Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg Ala 115 120 125 Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser Ala 130 135 140 Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val 145 150 155 160 Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 165 170 175 <210> 228 <211> 304 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 228 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly 20 25 30 Leu Asp Ser Thr Gly Cys Asp Val Lys Leu Val Glu Lys Ser Phe Glu 35 40 45 Thr Asp Thr Asn Leu Asn Phe Gln Asn Leu Ser Val Ile Gly Phe Arg 50 55 60 Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg 65 70 75 80 Leu Trp Ser Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 85 90 95 Gly Asp Val Glu Glu Asn Pro Gly Pro Met Thr Glu Tyr Lys Pro Thr 100 105 110 Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala Val Arg Thr Leu 115 120 125 Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His Thr Val Asp Pro 130 135 140 Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu Leu Phe Leu Thr 145 150 155 160 Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala Asp Asp Gly Ala 165 170 175 Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu Ala Gly Ala Val 180 185 190 Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser Gly Ser Arg Leu 195 200 205 Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro His Arg Pro Lys 210 215 220 Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser Pro Asp His Gln 225 230 235 240 Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly Val Glu Ala Ala 245 250 255 Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser Ala Pro Arg Asn 260 265 270 Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr Ala Asp Val Glu 275 280 285 Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg Lys Pro Gly Ala 290 295 300 <210> 229 <211> 228 <212> PRT <213> Streptomyces alboniger <400> 229 Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Glu Gly Arg Gly Ser 1 5 10 15 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Thr Glu 20 25 30 Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val Pro Arg Ala 35 40 45 Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala Thr Arg His 50 55 60 Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu Leu Gln Glu 65 70 75 80 Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val Trp Val Ala 85 90 95 Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu Ser Val Glu 100 105 110 Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala Glu Leu Ser 115 120 125 Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu Leu Ala Pro 130 135 140 His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val Gly Val Ser 145 150 155 160 Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val Leu Pro Gly 165 170 175 Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu Glu Thr Ser 180 185 190 Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe Thr Val Thr 195 200 205 Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys Met Thr Arg 210 215 220 Lys Pro Gly Ala 225 <210> 230 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 230 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly 20 25 30 Leu Asp Ser Thr Gly Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser Ser 35 40 45 Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn Val 50 55 60 Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr Val Leu 65 70 75 80 Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala Trp Ser 85 90 95 Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile Ile 100 105 110 Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp Val Lys 115 120 125 Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln Asn 130 135 140 Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe 145 150 155 160 Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Glu Gly 165 170 175 Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 180 185 190 Met Thr Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val 195 200 205 Pro Arg Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala 210 215 220 Thr Arg His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu 225 230 235 240 Leu Gln Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val 245 250 255 Trp Val Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu 260 265 270 Ser Val Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala 275 280 285 Glu Leu Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu 290 295 300 Leu Ala Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val 305 310 315 320 Gly Val Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val 325 330 335 Leu Pro Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu 340 345 350 Glu Thr Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe 355 360 365 Thr Val Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys 370 375 380 Met Thr Arg Lys Pro Gly Ala 385 390 <210> 231 <211> 698 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 231 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Gly Trp Gly Arg Ala 260 265 270 Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser Ala 275 280 285 Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val 290 295 300 Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 305 310 315 320 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 325 330 335 Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys 340 345 350 Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro Arg Lys Val Cys Asn 355 360 365 Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn Ala Thr 370 375 380 Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp Leu His 385 390 395 400 Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr Pro Pro 405 410 415 Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu Ile Thr 420 425 430 Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg Thr Asp Leu His 435 440 445 Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr Lys Gln His Gly 450 455 460 Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr Ser Leu Gly Leu 465 470 475 480 Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile Ile Ser Gly Asn 485 490 495 Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys Lys Leu Phe Gly 500 505 510 Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg Gly Glu Asn Ser 515 520 525 Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys Ser Pro Glu Gly 530 535 540 Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys Arg Asn Val Ser 545 550 555 560 Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu Glu Gly Glu Pro 565 570 575 Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys His Pro Glu Cys 580 585 590 Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg Gly Pro Asp Asn 595 600 605 Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His Cys Val Lys Thr 610 615 620 Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu Val Trp Lys Tyr 625 630 635 640 Ala Asp Ala Gly His Val Cys His Leu Cys His Pro Asn Cys Thr Tyr 645 650 655 Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro Thr Asn Gly Pro Lys 660 665 670 Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala Leu Leu Leu Leu Leu 675 680 685 Val Val Ala Leu Gly Ile Gly Leu Phe Met 690 695 <210> 232 <211> 335 <212> PRT <213> Unknown <220> <223> Description of Unknown: trEGFR sequence <400> 232 Arg Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu 1 5 10 15 Ser Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile 20 25 30 Ser Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe 35 40 45 Thr His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr 50 55 60 Val Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn 65 70 75 80 Arg Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg 85 90 95 Thr Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile 100 105 110 Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val 115 120 125 Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp 130 135 140 Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn 145 150 155 160 Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu 165 170 175 Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser 180 185 190 Cys Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu 195 200 205 Leu Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln 210 215 220 Cys His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly 225 230 235 240 Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro 245 250 255 His Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr 260 265 270 Leu Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His 275 280 285 Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro 290 295 300 Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala 305 310 315 320 Leu Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met 325 330 335 <210> 233 <211> 584 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 233 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Leu 275 280 285 Gly Ala Gly Pro Val Asp Ser Gly Val Thr Gln Thr Pro Lys His Leu 290 295 300 Ile Thr Ala Thr Gly Gln Arg Val Thr Leu Arg Cys Ser Pro Arg Ser 305 310 315 320 Gly Asp Leu Ser Val Ser Trp Tyr Gln Gln Ser Leu Asp Gln Gly Leu 325 330 335 Gln Phe Leu Ile Gln Tyr Tyr Asn Gly Glu Glu Arg Ala Lys Gly Asn 340 345 350 Ile Leu Glu Arg Phe Ser Ala Gln Gln Phe Pro Asp Leu His Ser Glu 355 360 365 Leu Asn Leu Ser Ser Leu Glu Leu Gly Asp Ser Ala Leu Tyr Phe Cys 370 375 380 Ala Ser Ser Pro Arg Thr Gly Leu Asn Thr Glu Ala Phe Phe Gly Gln 385 390 395 400 Gly Thr Arg Leu Thr Val Val Glu Asp Leu Asn Lys Val Phe Pro Pro 405 410 415 Glu Val Ala Val Phe Glu Pro Ser Glu Ala Glu Ile Ser His Thr Gln 420 425 430 Lys Ala Thr Leu Val Cys Leu Ala Thr Gly Phe Phe Pro Asp His Val 435 440 445 Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser 450 455 460 Thr Asp Pro Gln Pro Leu Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg 465 470 475 480 Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp Gln Asn 485 490 495 Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu 500 505 510 Asn Asp Glu Trp Thr Gln Asp Arg Ala Lys Pro Val Thr Gln Ile Val 515 520 525 Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Val Ser 530 535 540 Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu 545 550 555 560 Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met 565 570 575 Ala Met Val Lys Arg Lys Asp Phe 580 <210> 234 <211> 297 <212> PRT <213> Homo sapiens <400> 234 Leu Gly Ala Gly Pro Val Asp Ser Gly Val Thr Gln Thr Pro Lys His 1 5 10 15 Leu Ile Thr Ala Thr Gly Gln Arg Val Thr Leu Arg Cys Ser Pro Arg 20 25 30 Ser Gly Asp Leu Ser Val Ser Trp Tyr Gln Gln Ser Leu Asp Gln Gly 35 40 45 Leu Gln Phe Leu Ile Gln Tyr Tyr Asn Gly Glu Glu Arg Ala Lys Gly 50 55 60 Asn Ile Leu Glu Arg Phe Ser Ala Gln Gln Phe Pro Asp Leu His Ser 65 70 75 80 Glu Leu Asn Leu Ser Ser Leu Glu Leu Gly Asp Ser Ala Leu Tyr Phe 85 90 95 Cys Ala Ser Ser Pro Arg Thr Gly Leu Asn Thr Glu Ala Phe Phe Gly 100 105 110 Gln Gly Thr Arg Leu Thr Val Val Glu Asp Leu Asn Lys Val Phe Pro 115 120 125 Pro Glu Val Ala Val Phe Glu Pro Ser Glu Ala Glu Ile Ser His Thr 130 135 140 Gln Lys Ala Thr Leu Val Cys Leu Ala Thr Gly Phe Phe Pro Asp His 145 150 155 160 Val Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val 165 170 175 Ser Thr Asp Pro Gln Pro Leu Lys Glu Gln Pro Ala Leu Asn Asp Ser 180 185 190 Arg Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp Gln 195 200 205 Asn Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe Tyr Gly Leu Ser 210 215 220 Glu Asn Asp Glu Trp Thr Gln Asp Arg Ala Lys Pro Val Thr Gln Ile 225 230 235 240 Val Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Val 245 250 255 Ser Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu 260 265 270 Leu Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu 275 280 285 Met Ala Met Val Lys Arg Lys Asp Phe 290 295 <210> 235 <211> 545 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 235 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Val 275 280 285 Asn Gly Glu Asn Val Glu Gln His Pro Ser Thr Leu Ser Val Gln Glu 290 295 300 Gly Asp Ser Ala Val Ile Lys Cys Thr Tyr Ser Asp Ser Ala Ser Asn 305 310 315 320 Tyr Phe Pro Trp Tyr Lys Gln Glu Leu Gly Lys Arg Pro Gln Leu Ile 325 330 335 Ile Asp Ile Arg Ser Asn Val Gly Glu Lys Lys Asp Gln Arg Ile Ala 340 345 350 Val Thr Leu Asn Lys Thr Ala Lys His Phe Ser Leu His Ile Thr Glu 355 360 365 Thr Gln Pro Glu Asp Ser Ala Val Tyr Phe Cys Ala Ala Ser Arg Lys 370 375 380 Asp Ser Gly Gly Tyr Gln Lys Val Thr Phe Gly Thr Gly Thr Lys Leu 385 390 395 400 Gln Val Ile Pro Asn Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu 405 410 415 Arg Asp Ser Lys Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe 420 425 430 Asp Ser Gln Thr Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile 435 440 445 Thr Asp Lys Thr Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn 450 455 460 Ser Ala Val Ala Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala 465 470 475 480 Phe Asn Asn Ser Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu 485 490 495 Ser Ser Cys Asp Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr 500 505 510 Asn Leu Asn Phe Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu 515 520 525 Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser 530 535 540 Ser 545 <210> 236 <211> 258 <212> PRT <213> Homo sapiens <400> 236 Val Asn Gly Glu Asn Val Glu Gln His Pro Ser Thr Leu Ser Val Gln 1 5 10 15 Glu Gly Asp Ser Ala Val Ile Lys Cys Thr Tyr Ser Asp Ser Ala Ser 20 25 30 Asn Tyr Phe Pro Trp Tyr Lys Gln Glu Leu Gly Lys Arg Pro Gln Leu 35 40 45 Ile Ile Asp Ile Arg Ser Asn Val Gly Glu Lys Lys Asp Gln Arg Ile 50 55 60 Ala Val Thr Leu Asn Lys Thr Ala Lys His Phe Ser Leu His Ile Thr 65 70 75 80 Glu Thr Gln Pro Glu Asp Ser Ala Val Tyr Phe Cys Ala Ala Ser Arg 85 90 95 Lys Asp Ser Gly Gly Tyr Gln Lys Val Thr Phe Gly Thr Gly Thr Lys 100 105 110 Leu Gln Val Ile Pro Asn Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln 115 120 125 Leu Arg Asp Ser Lys Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp 130 135 140 Phe Asp Ser Gln Thr Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr 145 150 155 160 Ile Thr Asp Lys Thr Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser 165 170 175 Asn Ser Ala Val Ala Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn 180 185 190 Ala Phe Asn Asn Ser Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro 195 200 205 Glu Ser Ser Cys Asp Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp 210 215 220 Thr Asn Leu Asn Phe Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu 225 230 235 240 Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp 245 250 255 Ser Ser <210> 237 <211> 488 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 237 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Glu 275 280 285 Lys Lys Asp Gln Arg Ile Ala Val Thr Leu Asn Lys Thr Ala Lys His 290 295 300 Phe Ser Leu His Ile Thr Glu Thr Gln Pro Glu Asp Ser Ala Val Tyr 305 310 315 320 Phe Cys Ala Ala Ser Arg Lys Asp Ser Gly Gly Tyr Gln Lys Val Thr 325 330 335 Phe Gly Thr Gly Thr Lys Leu Gln Val Ile Pro Asn Ile Gln Asn Pro 340 345 350 Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser Ser Asp Lys Ser 355 360 365 Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn Val Ser Gln Ser 370 375 380 Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr Val Leu Asp Met Arg 385 390 395 400 Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala Trp Ser Asn Lys Ser 405 410 415 Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile Ile Pro Glu Asp 420 425 430 Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp Val Lys Leu Val Glu 435 440 445 Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln Asn Leu Ser Val 450 455 460 Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu 465 470 475 480 Met Thr Leu Arg Leu Trp Ser Ser 485 <210> 238 <211> 201 <212> PRT <213> Homo sapiens <400> 238 Glu Lys Lys Asp Gln Arg Ile Ala Val Thr Leu Asn Lys Thr Ala Lys 1 5 10 15 His Phe Ser Leu His Ile Thr Glu Thr Gln Pro Glu Asp Ser Ala Val 20 25 30 Tyr Phe Cys Ala Ala Ser Arg Lys Asp Ser Gly Gly Tyr Gln Lys Val 35 40 45 Thr Phe Gly Thr Gly Thr Lys Leu Gln Val Ile Pro Asn Ile Gln Asn 50 55 60 Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser Ser Asp Lys 65 70 75 80 Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn Val Ser Gln 85 90 95 Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr Val Leu Asp Met 100 105 110 Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala Trp Ser Asn Lys 115 120 125 Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile Ile Pro Glu 130 135 140 Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp Val Lys Leu Val 145 150 155 160 Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln Asn Leu Ser 165 170 175 Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu 180 185 190 Leu Met Thr Leu Arg Leu Trp Ser Ser 195 200 <210> 239 <211> 444 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 239 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Tyr 275 280 285 Gln Lys Val Thr Phe Gly Thr Gly Thr Lys Leu Gln Val Ile Pro Asn 290 295 300 Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser 305 310 315 320 Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn 325 330 335 Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr Val 340 345 350 Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala Trp 355 360 365 Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile 370 375 380 Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp Val 385 390 395 400 Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln 405 410 415 Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly 420 425 430 Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser 435 440 <210> 240 <211> 157 <212> PRT <213> Homo sapiens <400> 240 Tyr Gln Lys Val Thr Phe Gly Thr Gly Thr Lys Leu Gln Val Ile Pro 1 5 10 15 Asn Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys 20 25 30 Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr 35 40 45 Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr 50 55 60 Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala 65 70 75 80 Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser 85 90 95 Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp 100 105 110 Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe 115 120 125 Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala 130 135 140 Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser 145 150 155 <210> 241 <211> 584 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 241 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Leu 275 280 285 Gly Ala Gly Pro Val Asp Ser Gly Val Thr Gln Thr Pro Lys His Leu 290 295 300 Ile Thr Ala Thr Gly Gln Arg Val Thr Leu Arg Cys Ser Pro Arg Ser 305 310 315 320 Gly Asp Leu Ser Val Ser Trp Tyr Gln Gln Ser Leu Asp Gln Gly Leu 325 330 335 Gln Phe Leu Ile Gln Tyr Tyr Asn Gly Glu Glu Arg Ala Lys Gly Asn 340 345 350 Ile Leu Glu Arg Phe Ser Ala Gln Gln Phe Pro Asp Leu His Ser Glu 355 360 365 Leu Asn Leu Ser Ser Leu Glu Leu Gly Asp Ser Ala Leu Tyr Phe Cys 370 375 380 Ala Ser Ser Pro Arg Thr Gly Leu Asn Thr Glu Ala Phe Phe Gly Gln 385 390 395 400 Gly Thr Arg Leu Thr Val Val Glu Asp Leu Asn Lys Val Phe Pro Pro 405 410 415 Glu Val Ala Val Phe Glu Pro Ser Glu Ala Glu Ile Ser His Thr Gln 420 425 430 Lys Ala Thr Leu Val Cys Leu Ala Thr Gly Phe Phe Pro Asp His Val 435 440 445 Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser 450 455 460 Thr Asp Pro Gln Pro Leu Lys Glu Gln Pro Ala Leu Asn Asp Ser Arg 465 470 475 480 Tyr Cys Leu Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp Gln Asn 485 490 495 Pro Arg Asn His Phe Arg Cys Gln Val Gln Phe Tyr Gly Leu Ser Glu 500 505 510 Asn Asp Glu Trp Thr Gln Asp Arg Ala Lys Pro Val Thr Gln Ile Val 515 520 525 Ser Ala Glu Ala Trp Gly Arg Ala Asp Cys Gly Phe Thr Ser Val Ser 530 535 540 Tyr Gln Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu 545 550 555 560 Gly Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met 565 570 575 Ala Met Val Lys Arg Lys Asp Phe 580 <210> 242 <211> 921 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 242 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Glu Gly Arg Gly Ser 435 440 445 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 450 455 460 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 465 470 475 480 Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala 485 490 495 Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile 500 505 510 Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys 515 520 525 Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg 530 535 540 Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn 545 550 555 560 Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr 565 570 575 Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser 580 585 590 Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly 595 600 605 Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 610 615 620 Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr 625 630 635 640 Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu 645 650 655 Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys 660 665 670 Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 675 680 685 Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala 690 695 700 Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln 705 710 715 720 Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser 725 730 735 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln Leu 740 745 750 Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile Ala 755 760 765 Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu Lys 770 775 780 Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser Asn 785 790 795 800 Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp Thr 805 810 815 Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp Lys 820 825 830 Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val Asp 835 840 845 Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met Asp 850 855 860 Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu Gln 865 870 875 880 Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys 885 890 895 Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg Thr 900 905 910 Ala Phe Cys Cys Asn Gly Glu Lys Ser 915 920 <210> 243 <211> 153 <212> PRT <213> Homo sapiens <400> 243 Ser Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr 1 5 10 15 Asn Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile 20 25 30 Asn Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val 35 40 45 Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu 50 55 60 Asp Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val 65 70 75 80 His Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys 85 90 95 Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys 100 105 110 Pro Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr 115 120 125 Val Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe 130 135 140 Leu Leu Thr Ala Lys Leu Phe Phe Leu 145 150 <210> 244 <211> 922 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 244 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Ala Thr Asn Phe Ser 435 440 445 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu 450 455 460 Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe 465 470 475 480 Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser 485 490 495 Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp 500 505 510 Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val 515 520 525 Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser 530 535 540 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser 545 550 555 560 Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn 565 570 575 Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly 580 585 590 Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys 595 600 605 Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser 610 615 620 Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp 625 630 635 640 Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp 645 650 655 Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu 660 665 670 Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe 675 680 685 Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys 690 695 700 Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly 705 710 715 720 Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly 725 730 735 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln 740 745 750 Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile 755 760 765 Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu 770 775 780 Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser 785 790 795 800 Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp 805 810 815 Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp 820 825 830 Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val 835 840 845 Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met 850 855 860 Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu 865 870 875 880 Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu 885 890 895 Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg 900 905 910 Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 915 920 <210> 245 <211> 656 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 245 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 180 185 190 Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu 195 200 205 Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln 210 215 220 Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser 225 230 235 240 Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln 245 250 255 Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu 260 265 270 His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp 275 280 285 Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr 290 295 300 Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr 305 310 315 320 Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser 325 330 335 Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro 340 345 350 Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser 355 360 365 Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro 370 375 380 Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr 385 390 395 400 Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn 405 410 415 Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp 420 425 430 Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr 435 440 445 Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala 450 455 460 Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 465 470 475 480 Ser Leu Glu Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr 485 490 495 Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr 500 505 510 Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His 515 520 525 Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn 530 535 540 Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val 545 550 555 560 Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu 565 570 575 Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys 580 585 590 Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala 595 600 605 Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met 610 615 620 Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr 625 630 635 640 Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 645 650 655 <210> 246 <211> 656 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 246 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Glu Gly Arg Gly Ser 435 440 445 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu 450 455 460 Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu 465 470 475 480 Leu Ile Pro Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr 485 490 495 Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr 500 505 510 Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His 515 520 525 Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn 530 535 540 Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val 545 550 555 560 Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu 565 570 575 Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys 580 585 590 Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala 595 600 605 Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met 610 615 620 Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr 625 630 635 640 Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 645 650 655 <210> 247 <211> 656 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 247 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 180 185 190 Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu 195 200 205 Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln 210 215 220 Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser 225 230 235 240 Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln 245 250 255 Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu 260 265 270 His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp 275 280 285 Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr 290 295 300 Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr 305 310 315 320 Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser 325 330 335 Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro 340 345 350 Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser 355 360 365 Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro 370 375 380 Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr 385 390 395 400 Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn 405 410 415 Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp 420 425 430 Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr 435 440 445 Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala 450 455 460 Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 465 470 475 480 Ser Leu Glu Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr 485 490 495 Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr 500 505 510 Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His 515 520 525 Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn 530 535 540 Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val 545 550 555 560 Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu 565 570 575 Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys 580 585 590 Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala 595 600 605 Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met 610 615 620 Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr 625 630 635 640 Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 645 650 655 <210> 248 <211> 657 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 248 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 180 185 190 Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys 195 200 205 Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr 210 215 220 Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile 225 230 235 240 Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln 245 250 255 Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg 260 265 270 Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr 275 280 285 Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr 290 295 300 Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly 305 310 315 320 Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly 325 330 335 Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly 340 345 350 Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val 355 360 365 Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro 370 375 380 Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr 385 390 395 400 Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp 405 410 415 Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp 420 425 430 Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser 435 440 445 Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser 450 455 460 Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 465 470 475 480 Gly Ser Leu Glu Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro 485 490 495 Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly 500 505 510 Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile 515 520 525 His Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly 530 535 540 Asn Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr 545 550 555 560 Val Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His 565 570 575 Glu Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile 580 585 590 Lys Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp 595 600 605 Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr 610 615 620 Met Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile 625 630 635 640 Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys 645 650 655 Ser <210> 249 <211> 657 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 249 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 180 185 190 Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys 195 200 205 Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr 210 215 220 Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile 225 230 235 240 Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln 245 250 255 Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg 260 265 270 Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr 275 280 285 Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr 290 295 300 Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly 305 310 315 320 Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly 325 330 335 Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly 340 345 350 Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val 355 360 365 Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro 370 375 380 Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr 385 390 395 400 Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp 405 410 415 Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp 420 425 430 Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser 435 440 445 Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser 450 455 460 Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 465 470 475 480 Gly Ser Leu Glu Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro 485 490 495 Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly 500 505 510 Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile 515 520 525 His Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly 530 535 540 Asn Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr 545 550 555 560 Val Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His 565 570 575 Glu Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile 580 585 590 Lys Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp 595 600 605 Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr 610 615 620 Met Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile 625 630 635 640 Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys 645 650 655 Ser <210> 250 <211> 657 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 250 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Ala Thr Asn Phe Ser 435 440 445 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu 450 455 460 Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe 465 470 475 480 Leu Leu Ile Pro Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro 485 490 495 Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly 500 505 510 Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile 515 520 525 His Trp Gln Glu Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly 530 535 540 Asn Thr Met Lys Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr 545 550 555 560 Val Pro Glu Lys Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His 565 570 575 Glu Asn Asn Lys Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile 580 585 590 Lys Thr Asp Val Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp 595 600 605 Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr 610 615 620 Met Tyr Leu Leu Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile 625 630 635 640 Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys 645 650 655 Ser <210> 251 <211> 922 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 251 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Leu Gly Leu Arg Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu 420 425 430 Leu Thr Ala Lys Leu Phe Phe Leu Gly Ser Gly Ala Thr Asn Phe Ser 435 440 445 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu 450 455 460 Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe 465 470 475 480 Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser 485 490 495 Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp 500 505 510 Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val 515 520 525 Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser 530 535 540 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser 545 550 555 560 Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn 565 570 575 Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly 580 585 590 Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys 595 600 605 Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser 610 615 620 Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp 625 630 635 640 Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp 645 650 655 Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu 660 665 670 Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe 675 680 685 Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys 690 695 700 Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly 705 710 715 720 Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly 725 730 735 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln 740 745 750 Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile 755 760 765 Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu 770 775 780 Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser 785 790 795 800 Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp 805 810 815 Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp 820 825 830 Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val 835 840 845 Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met 850 855 860 Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu 865 870 875 880 Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu 885 890 895 Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg 900 905 910 Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser 915 920 <210> 252 <211> 903 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 252 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Gln Val Gln Leu Gln Gln Ser Gly Pro Gly 20 25 30 Leu Val Lys Pro Ser Gln Thr Leu Ser Leu Thr Cys Ala Ile Ser Gly 35 40 45 Asp Ser Val Ser Ser Asn Ser Ala Ala Trp Asn Trp Ile Arg Gln Ser 50 55 60 Pro Ser Arg Gly Leu Glu Trp Leu Gly Arg Thr Tyr Tyr Arg Ser Lys 65 70 75 80 Trp Tyr Asn Asp Tyr Ala Val Ser Val Lys Ser Arg Ile Thr Ile Asn 85 90 95 Pro Asp Thr Ser Lys Asn Gln Phe Ser Leu Gln Leu Asn Ser Val Thr 100 105 110 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Glu Val Thr Gly Asp 115 120 125 Leu Glu Asp Ala Phe Asp Ile Trp Gly Gln Gly Thr Met Val Thr Val 130 135 140 Ser Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr Gln Ser Pro Ser 145 150 155 160 Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala 165 170 175 Ser Gln Thr Ile Trp Ser Tyr Leu Asn Trp Tyr Gln Gln Arg Pro Gly 180 185 190 Lys Ala Pro Asn Leu Leu Ile Tyr Ala Ala Ser Ser Leu Gln Ser Gly 195 200 205 Val Pro Ser Arg Phe Ser Gly Arg Gly Ser Gly Thr Asp Phe Thr Leu 210 215 220 Thr Ile Ser Ser Leu Gln Ala Glu Asp Phe Ala Thr Tyr Tyr Cys Gln 225 230 235 240 Gln Ser Tyr Ser Ile Pro Gln Thr Phe Gly Gln Gly Thr Lys Leu Glu 245 250 255 Ile Lys Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 260 265 270 Gly Gly Gly Ser Leu Glu Ser Gln Pro His Thr Lys Pro Ser Val Phe 275 280 285 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 290 295 300 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 305 310 315 320 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 325 330 335 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 340 345 350 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 355 360 365 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 370 375 380 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 385 390 395 400 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 405 410 415 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 420 425 430 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 435 440 445 Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu 450 455 460 Leu Pro His Pro Ala Phe Leu Leu Ile Pro Gln Val Gln Leu Gln Gln 465 470 475 480 Ser Gly Pro Gly Leu Val Lys Pro Ser Gln Thr Leu Ser Leu Thr Cys 485 490 495 Ala Ile Ser Gly Asp Ser Val Ser Ser Asn Ser Ala Ala Trp Asn Trp 500 505 510 Ile Arg Gln Ser Pro Ser Arg Gly Leu Glu Trp Leu Gly Arg Thr Tyr 515 520 525 Tyr Arg Ser Lys Trp Tyr Asn Asp Tyr Ala Val Ser Val Lys Ser Arg 530 535 540 Ile Thr Ile Asn Pro Asp Thr Ser Lys Asn Gln Phe Ser Leu Gln Leu 545 550 555 560 Asn Ser Val Thr Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Glu 565 570 575 Val Thr Gly Asp Leu Glu Asp Ala Phe Asp Ile Trp Gly Gln Gly Thr 580 585 590 Met Val Thr Val Ser Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr 595 600 605 Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile 610 615 620 Thr Cys Arg Ala Ser Gln Thr Ile Trp Ser Tyr Leu Asn Trp Tyr Gln 625 630 635 640 Gln Arg Pro Gly Lys Ala Pro Asn Leu Leu Ile Tyr Ala Ala Ser Ser 645 650 655 Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Arg Gly Ser Gly Thr 660 665 670 Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala Glu Asp Phe Ala Thr 675 680 685 Tyr Tyr Cys Gln Gln Ser Tyr Ser Ile Pro Gln Thr Phe Gly Gln Gly 690 695 700 Thr Lys Leu Glu Ile Lys Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly 705 710 715 720 Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln Leu Asp Ala 725 730 735 Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr 740 745 750 Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe 755 760 765 Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser Asn Thr Ile 770 775 780 Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp Thr Tyr Met 785 790 795 800 Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp Lys Glu His 805 810 815 Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val Asp Gln Glu 820 825 830 Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met Asp Pro Lys 835 840 845 Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr 850 855 860 Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys Ser Val 865 870 875 880 Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe 885 890 895 Cys Cys Asn Gly Glu Lys Ser 900 <210> 253 <211> 236 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 253 Gln Val Gln Leu Gln Gln Ser Gly Pro Gly Leu Val Lys Pro Ser Gln 1 5 10 15 Thr Leu Ser Leu Thr Cys Ala Ile Ser Gly Asp Ser Val Ser Ser Asn 20 25 30 Ser Ala Ala Trp Asn Trp Ile Arg Gln Ser Pro Ser Arg Gly Leu Glu 35 40 45 Trp Leu Gly Arg Thr Tyr Tyr Arg Ser Lys Trp Tyr Asn Asp Tyr Ala 50 55 60 Val Ser Val Lys Ser Arg Ile Thr Ile Asn Pro Asp Thr Ser Lys Asn 65 70 75 80 Gln Phe Ser Leu Gln Leu Asn Ser Val Thr Pro Glu Asp Thr Ala Val 85 90 95 Tyr Tyr Cys Ala Arg Glu Val Thr Gly Asp Leu Glu Asp Ala Phe Asp 100 105 110 Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Gly Gly Gly Gly 115 120 125 Ser Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val 130 135 140 Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Thr Ile Trp Ser 145 150 155 160 Tyr Leu Asn Trp Tyr Gln Gln Arg Pro Gly Lys Ala Pro Asn Leu Leu 165 170 175 Ile Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser 180 185 190 Gly Arg Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln 195 200 205 Ala Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Ile Pro 210 215 220 Gln Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys 225 230 235 <210> 254 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 254 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ala Gly His Leu Glu Gln Pro Gln Ile Ser 20 25 30 Ser Thr Lys Thr Leu Ser Lys Thr Ala Arg Leu Glu Cys Val Val Ser 35 40 45 Gly Ile Thr Ile Ser Ala Thr Ser Val Tyr Trp Tyr Arg Glu Arg Pro 50 55 60 Gly Glu Val Ile Gln Phe Leu Val Ser Ile Ser Tyr Asp Gly Thr Val 65 70 75 80 Arg Lys Glu Ser Gly Ile Pro Ser Gly Lys Phe Glu Val Asp Arg Ile 85 90 95 Pro Glu Thr Ser Thr Ser Thr Leu Thr Ile His Asn Val Glu Lys Gln 100 105 110 Asp Ile Ala Thr Tyr Tyr Cys Ala Leu Trp Glu Ala Gln Gln Glu Leu 115 120 125 Gly Lys Lys Ile Lys Val Phe Gly Pro Gly Thr Lys Leu Ile Ile Thr 130 135 140 Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu 145 150 155 160 Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys 165 170 175 Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Glu Glu 180 185 190 Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys 195 200 205 Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys 210 215 220 Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys 225 230 235 240 Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val 245 250 255 Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr 260 265 270 Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu 275 280 285 Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu 290 295 300 Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser Gly Ser Gly 305 310 315 320 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 325 330 335 Gly Pro Met Gln Arg Ile Ser Ser Leu Ile His Leu Ser Leu Phe Trp 340 345 350 Ala Gly Val Met Ser Ala Ile Glu Leu Val Pro Glu His Gln Thr Val 355 360 365 Pro Val Ser Ile Gly Val Pro Ala Thr Leu Arg Cys Ser Met Lys Gly 370 375 380 Glu Ala Ile Gly Asn Tyr Tyr Ile Asn Trp Tyr Arg Lys Thr Gln Gly 385 390 395 400 Asn Thr Met Thr Phe Ile Tyr Arg Glu Lys Asp Ile Tyr Gly Pro Gly 405 410 415 Phe Lys Asp Asn Phe Gln Gly Asp Ile Asp Ile Ala Lys Asn Leu Ala 420 425 430 Val Leu Lys Ile Leu Ala Pro Ser Glu Arg Asp Glu Gly Ser Tyr Tyr 435 440 445 Cys Ala Cys Asp Ala Leu Lys Arg Thr Asp Thr Asp Lys Leu Ile Phe 450 455 460 Gly Lys Gly Thr Arg Val Thr Val Glu Pro Arg Ser Gln Pro His Thr 465 470 475 480 Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu 485 490 495 Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser 500 505 510 Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly 515 520 525 Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val 530 535 540 Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His Ser Thr Asp Phe 545 550 555 560 Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu 565 570 575 Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val 580 585 590 His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg 595 600 605 Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys 610 615 620 Leu Phe Phe Leu 625 <210> 255 <211> 295 <212> PRT <213> Unknown <220> <223> Description of Unknown: TCRgamma9G115 sequence <400> 255 Ala Gly His Leu Glu Gln Pro Gln Ile Ser Ser Thr Lys Thr Leu Ser 1 5 10 15 Lys Thr Ala Arg Leu Glu Cys Val Val Ser Gly Ile Thr Ile Ser Ala 20 25 30 Thr Ser Val Tyr Trp Tyr Arg Glu Arg Pro Gly Glu Val Ile Gln Phe 35 40 45 Leu Val Ser Ile Ser Tyr Asp Gly Thr Val Arg Lys Glu Ser Gly Ile 50 55 60 Pro Ser Gly Lys Phe Glu Val Asp Arg Ile Pro Glu Thr Ser Thr Ser 65 70 75 80 Thr Leu Thr Ile His Asn Val Glu Lys Gln Asp Ile Ala Thr Tyr Tyr 85 90 95 Cys Ala Leu Trp Glu Ala Gln Gln Glu Leu Gly Lys Lys Ile Lys Val 100 105 110 Phe Gly Pro Gly Thr Lys Leu Ile Ile Thr Asp Lys Gln Leu Asp Ala 115 120 125 Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr 130 135 140 Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe 145 150 155 160 Pro Asp Val Ile Lys Ile His Trp Glu Glu Lys Lys Ser Asn Thr Ile 165 170 175 Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp Thr Tyr Met 180 185 190 Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp Lys Glu His 195 200 205 Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val Asp Gln Glu 210 215 220 Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met Asp Pro Lys 225 230 235 240 Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr 245 250 255 Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys Ser Val 260 265 270 Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe 275 280 285 Cys Cys Asn Gly Glu Lys Ser 290 295 <210> 256 <211> 290 <212> PRT <213> Unknown <220> <223> Description of Unknown: TCRdelta2cl5 sequence <400> 256 Met Gln Arg Ile Ser Ser Leu Ile His Leu Ser Leu Phe Trp Ala Gly 1 5 10 15 Val Met Ser Ala Ile Glu Leu Val Pro Glu His Gln Thr Val Pro Val 20 25 30 Ser Ile Gly Val Pro Ala Thr Leu Arg Cys Ser Met Lys Gly Glu Ala 35 40 45 Ile Gly Asn Tyr Tyr Ile Asn Trp Tyr Arg Lys Thr Gln Gly Asn Thr 50 55 60 Met Thr Phe Ile Tyr Arg Glu Lys Asp Ile Tyr Gly Pro Gly Phe Lys 65 70 75 80 Asp Asn Phe Gln Gly Asp Ile Asp Ile Ala Lys Asn Leu Ala Val Leu 85 90 95 Lys Ile Leu Ala Pro Ser Glu Arg Asp Glu Gly Ser Tyr Tyr Cys Ala 100 105 110 Cys Asp Ala Leu Lys Arg Thr Asp Thr Asp Lys Leu Ile Phe Gly Lys 115 120 125 Gly Thr Arg Val Thr Val Glu Pro Arg Ser Gln Pro His Thr Lys Pro 130 135 140 Ser Val Phe Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys 145 150 155 160 Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys 165 170 175 Ile Thr Glu Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr 180 185 190 Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys 195 200 205 Ser Val Gln His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val 210 215 220 Lys Thr Asp Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr 225 230 235 240 Lys Gln Pro Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr 245 250 255 Glu Lys Val Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu 260 265 270 Phe Ala Lys Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe 275 280 285 Phe Leu 290 <210> 257 <211> 1122 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 257 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ala Gly His Leu Glu Gln Pro Gln Ile Ser 20 25 30 Ser Thr Lys Thr Leu Ser Lys Thr Ala Arg Leu Glu Cys Val Val Ser 35 40 45 Gly Ile Thr Ile Ser Ala Thr Ser Val Tyr Trp Tyr Arg Glu Arg Pro 50 55 60 Gly Glu Val Ile Gln Phe Leu Val Ser Ile Ser Tyr Asp Gly Thr Val 65 70 75 80 Arg Lys Glu Ser Gly Ile Pro Ser Gly Lys Phe Glu Val Asp Arg Ile 85 90 95 Pro Glu Thr Ser Thr Ser Thr Leu Thr Ile His Asn Val Glu Lys Gln 100 105 110 Asp Ile Ala Thr Tyr Tyr Cys Ala Leu Trp Glu Ala Gln Gln Glu Leu 115 120 125 Gly Lys Lys Ile Lys Val Phe Gly Pro Gly Thr Lys Leu Ile Ile Thr 130 135 140 Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu 145 150 155 160 Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys 165 170 175 Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Glu Glu 180 185 190 Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys 195 200 205 Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys 210 215 220 Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys 225 230 235 240 Asn Gly Val Asp Gln Glu Ile Ile Phe Pro Pro Ile Lys Thr Asp Val 245 250 255 Ile Thr Met Asp Pro Lys Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr 260 265 270 Leu Leu Leu Gln Leu Thr Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu 275 280 285 Leu Leu Leu Lys Ser Val Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu 290 295 300 Leu Arg Arg Thr Ala Phe Cys Cys Asn Gly Glu Lys Ser Gly Ser Gly 305 310 315 320 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 325 330 335 Gly Pro Met Gln Arg Ile Ser Ser Leu Ile His Leu Ser Leu Phe Trp 340 345 350 Ala Gly Val Met Ser Ala Ile Glu Leu Val Pro Glu His Gln Thr Val 355 360 365 Pro Val Ser Ile Gly Val Pro Ala Thr Leu Arg Cys Ser Met Lys Gly 370 375 380 Glu Ala Ile Gly Asn Tyr Tyr Ile Asn Trp Tyr Arg Lys Thr Gln Gly 385 390 395 400 Asn Thr Met Thr Phe Ile Tyr Arg Glu Lys Asp Ile Tyr Gly Pro Gly 405 410 415 Phe Lys Asp Asn Phe Gln Gly Asp Ile Asp Ile Ala Lys Asn Leu Ala 420 425 430 Val Leu Lys Ile Leu Ala Pro Ser Glu Arg Asp Glu Gly Ser Tyr Tyr 435 440 445 Cys Ala Cys Asp Ala Leu Lys Arg Thr Asp Thr Asp Lys Leu Ile Phe 450 455 460 Gly Lys Gly Thr Arg Val Thr Val Glu Pro Arg Ser Gln Pro His Thr 465 470 475 480 Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu 485 490 495 Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser 500 505 510 Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly 515 520 525 Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val 530 535 540 Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His Ser Thr Asp Phe 545 550 555 560 Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu 565 570 575 Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val 580 585 590 His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg 595 600 605 Met Leu Phe Ala Lys Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys 610 615 620 Leu Phe Phe Leu Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln 625 630 635 640 Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu Val Thr 645 650 655 Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu Ile Pro 660 665 670 Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly 675 680 685 Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser Lys Tyr 690 695 700 Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu Leu Ile 705 710 715 720 Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly 725 730 735 Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln 740 745 750 Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Tyr 755 760 765 Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr Ser Gly 770 775 780 Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu Val Lys 785 790 795 800 Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu Ser 805 810 815 Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val Ser 820 825 830 Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val Ile 835 840 845 Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg Leu 850 855 860 Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met Asn 865 870 875 880 Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His Tyr 885 890 895 Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser 900 905 910 Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly 915 920 925 Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Gly Asn Glu Glu Met Gly 930 935 940 Gly Ile Thr Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val 945 950 955 960 Ile Leu Thr Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp Gln His 965 970 975 Asn Asp Lys Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser 980 985 990 Asp Glu Asp His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser 995 1000 1005 Gly Tyr Tyr Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala 1010 1015 1020 Asn Phe Tyr Leu Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met 1025 1030 1035 Glu Met Asp Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile 1040 1045 1050 Cys Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys 1055 1060 1065 Asn Arg Lys Ala Lys Ala Lys Pro Val Thr Arg Gly Ala Gly Ala 1070 1075 1080 Gly Gly Arg Gln Arg Gly Gln Asn Lys Glu Arg Pro Pro Pro Val 1085 1090 1095 Pro Asn Pro Asp Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu 1100 1105 1110 Tyr Ser Gly Leu Asn Gln Arg Arg Ile 1115 1120 <210> 258 <211> 185 <212> PRT <213> Homo sapiens <400> 258 Asp Gly Asn Glu Glu Met Gly Gly Ile Thr Gln Thr Pro Tyr Lys Val 1 5 10 15 Ser Ile Ser Gly Thr Thr Val Ile Leu Thr Cys Pro Gln Tyr Pro Gly 20 25 30 Ser Glu Ile Leu Trp Gln His Asn Asp Lys Asn Ile Gly Gly Asp Glu 35 40 45 Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp His Leu Ser Leu Lys Glu 50 55 60 Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr Val Cys Tyr Pro Arg Gly 65 70 75 80 Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu Tyr Leu Arg Ala Arg Val 85 90 95 Cys Glu Asn Cys Met Glu Met Asp Val Met Ser Val Ala Thr Ile Val 100 105 110 Ile Val Asp Ile Cys Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr 115 120 125 Trp Ser Lys Asn Arg Lys Ala Lys Ala Lys Pro Val Thr Arg Gly Ala 130 135 140 Gly Ala Gly Gly Arg Gln Arg Gly Gln Asn Lys Glu Arg Pro Pro Pro 145 150 155 160 Val Pro Asn Pro Asp Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu 165 170 175 Tyr Ser Gly Leu Asn Gln Arg Arg Ile 180 185 <210> 259 <211> 510 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 259 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys 20 25 30 Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met Asn Leu Asn 35 40 45 Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu Leu Lys Val 50 55 60 Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser 65 70 75 80 Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 85 90 95 Pro Gly Pro Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln 100 105 110 Gln Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys 115 120 125 Ala Thr Leu Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met 130 135 140 Val Lys Arg Lys Asn Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu 145 150 155 160 Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu 165 170 175 Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu 180 185 190 Ile Pro Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro 195 200 205 Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Gly Asp Trp Ser 210 215 220 Ala Asn Phe Met Tyr Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu 225 230 235 240 Leu Val Ala Arg Ile Ser Gly Arg Gly Val Val Asp Tyr Val Glu Ser 245 250 255 Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu 260 265 270 Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr 275 280 285 Cys Ala Val Ala Ser Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser 290 295 300 Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 305 310 315 320 Gly Gly Ser Leu Glu Asp Gly Asn Glu Glu Met Gly Gly Ile Thr Gln 325 330 335 Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val Ile Leu Thr Cys 340 345 350 Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp Gln His Asn Asp Lys Asn 355 360 365 Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp His 370 375 380 Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr Val 385 390 395 400 Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu Tyr 405 410 415 Leu Arg Ala Arg Val Cys Glu Asn Cys Met Glu Met Asp Val Met Ser 420 425 430 Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly Gly Leu Leu 435 440 445 Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg Lys Ala Lys Ala Lys Pro 450 455 460 Val Thr Arg Gly Ala Gly Ala Gly Gly Arg Gln Arg Gly Gln Asn Lys 465 470 475 480 Glu Arg Pro Pro Pro Val Pro Asn Pro Asp Tyr Glu Pro Ile Arg Lys 485 490 495 Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn Gln Arg Arg Ile 500 505 510 <210> 260 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 260 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Gly Asp Trp Ser Ala Asn 20 25 30 Phe Met Tyr Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Arg Ile Ser Gly Arg Gly Val Val Asp Tyr Val Glu Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala 85 90 95 Val Ala Ser Tyr Trp Gly Gln Gly Thr Leu Val Thr Val 100 105 <210> 261 <211> 596 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 261 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Glu Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 35 40 45 Gly Asp Trp Ser Ala Asn Phe Met Tyr Trp Tyr Arg Gln Ala Pro Gly 50 55 60 Lys Gln Arg Glu Leu Val Ala Arg Ile Ser Gly Arg Gly Val Val Asp 65 70 75 80 Tyr Val Glu Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser 85 90 95 Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr 100 105 110 Ala Val Tyr Tyr Cys Ala Val Ala Ser Tyr Trp Gly Gln Gly Thr Leu 115 120 125 Val Thr Val Ser Ser Ile Gln Asn Pro Glu Pro Ala Val Tyr Gln Leu 130 135 140 Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu Cys Leu Phe Thr Asp Phe 145 150 155 160 Asp Ser Gln Ile Asn Val Pro Lys Thr Met Glu Ser Gly Thr Phe Ile 165 170 175 Thr Asp Lys Thr Val Leu Asp Met Lys Ala Met Asp Ser Lys Ser Asn 180 185 190 Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser Phe Thr Cys Gln Asp Ile 195 200 205 Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys Asp 210 215 220 Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met Asn Leu Asn Phe 225 230 235 240 Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu Leu Lys Val Ala 245 250 255 Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly 260 265 270 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 275 280 285 Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu 290 295 300 Pro His Pro Ala Phe Leu Leu Ile Pro Glu Val Gln Leu Val Glu Ser 305 310 315 320 Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala 325 330 335 Ala Ser Gly Gly Asp Trp Ser Ala Asn Phe Met Tyr Trp Tyr Arg Gln 340 345 350 Ala Pro Gly Lys Gln Arg Glu Leu Val Ala Arg Ile Ser Gly Arg Gly 355 360 365 Val Val Asp Tyr Val Glu Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 370 375 380 Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala 385 390 395 400 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Val Ala Ser Tyr Trp Gly Gln 405 410 415 Gly Thr Leu Val Thr Val Ser Ser Asp Leu Arg Asn Val Thr Pro Pro 420 425 430 Lys Val Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys Gln 435 440 445 Lys Ala Thr Leu Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His Val 450 455 460 Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val Ser 465 470 475 480 Thr Asp Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu Ser 485 490 495 Ser Arg Leu Arg Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn His 500 505 510 Phe Arg Cys Gln Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys Trp 515 520 525 Pro Glu Gly Ser Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu Ala 530 535 540 Trp Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln Gly 545 550 555 560 Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr 565 570 575 Leu Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val Lys 580 585 590 Arg Lys Asn Ser 595 <210> 262 <211> 733 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 262 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ile Gln Asn Pro Glu Pro Ala Val Tyr Gln 20 25 30 Leu Lys Asp Pro Arg Ser Gln Asp Ser Thr Leu Cys Leu Phe Thr Asp 35 40 45 Phe Asp Ser Gln Ile Asn Val Pro Lys Thr Met Glu Ser Gly Thr Phe 50 55 60 Ile Thr Asp Lys Thr Val Leu Asp Met Lys Ala Met Asp Ser Lys Ser 65 70 75 80 Asn Gly Ala Ile Ala Trp Ser Asn Gln Thr Ser Phe Thr Cys Gln Asp 85 90 95 Ile Phe Lys Glu Thr Asn Ala Thr Tyr Pro Ser Ser Asp Val Pro Cys 100 105 110 Asp Ala Thr Leu Thr Glu Lys Ser Phe Glu Thr Asp Met Asn Leu Asn 115 120 125 Phe Gln Asn Leu Ser Val Met Gly Leu Arg Ile Leu Leu Leu Lys Val 130 135 140 Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser 145 150 155 160 Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn 165 170 175 Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu 180 185 190 Pro His Pro Ala Phe Leu Leu Ile Pro Asp Leu Arg Asn Val Thr Pro 195 200 205 Pro Lys Val Ser Leu Phe Glu Pro Ser Lys Ala Glu Ile Ala Asn Lys 210 215 220 Gln Lys Ala Thr Leu Val Cys Leu Ala Arg Gly Phe Phe Pro Asp His 225 230 235 240 Val Glu Leu Ser Trp Trp Val Asn Gly Lys Glu Val His Ser Gly Val 245 250 255 Ser Thr Asp Pro Gln Ala Tyr Lys Glu Ser Asn Tyr Ser Tyr Cys Leu 260 265 270 Ser Ser Arg Leu Arg Val Ser Ala Thr Phe Trp His Asn Pro Arg Asn 275 280 285 His Phe Arg Cys Gln Val Gln Phe His Gly Leu Ser Glu Glu Asp Lys 290 295 300 Trp Pro Glu Gly Ser Pro Lys Pro Val Thr Gln Asn Ile Ser Ala Glu 305 310 315 320 Ala Trp Gly Arg Ala Asp Cys Gly Ile Thr Ser Ala Ser Tyr Gln Gln 325 330 335 Gly Val Leu Ser Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala 340 345 350 Thr Leu Tyr Ala Val Leu Val Ser Thr Leu Val Val Met Ala Met Val 355 360 365 Lys Arg Lys Asn Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys 370 375 380 Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu Val 385 390 395 400 Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu Ile 405 410 415 Pro Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly 420 425 430 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Gly Asp Trp Ser Ala 435 440 445 Asn Phe Met Tyr Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu 450 455 460 Val Ala Arg Ile Ser Gly Arg Gly Val Val Asp Tyr Val Glu Ser Val 465 470 475 480 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 485 490 495 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 500 505 510 Ala Val Ala Ser Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser 515 520 525 Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 530 535 540 Gly Ser Leu Glu Asp Gly Asn Glu Glu Met Gly Gly Ile Thr Gln Thr 545 550 555 560 Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val Ile Leu Thr Cys Pro 565 570 575 Gln Tyr Pro Gly Ser Asp Ile Leu Trp Gln His Asn Asp Lys Asn Ile 580 585 590 Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp His Leu 595 600 605 Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr Val Cys 610 615 620 Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu Tyr Leu 625 630 635 640 Arg Ala Arg Val Cys Glu Asn Cys Met Glu Met Asp Val Met Ser Val 645 650 655 Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly Gly Leu Leu Leu 660 665 670 Leu Val Tyr Tyr Trp Ser Lys Asn Arg Lys Ala Lys Ala Lys Pro Val 675 680 685 Thr Arg Gly Ala Gly Ala Gly Gly Arg Gln Arg Gly Gln Asn Lys Glu 690 695 700 Arg Pro Pro Pro Val Pro Asn Pro Asp Tyr Glu Pro Ile Arg Lys Gly 705 710 715 720 Gln Arg Asp Leu Tyr Ser Gly Leu Asn Gln Arg Arg Ile 725 730 <210> 263 <211> 884 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 263 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Ser Gln Pro His Thr Lys Pro Ser Val Phe 20 25 30 Val Met Lys Asn Gly Thr Asn Val Ala Cys Leu Val Lys Glu Phe Tyr 35 40 45 Pro Lys Asp Ile Arg Ile Asn Leu Val Ser Ser Lys Lys Ile Thr Glu 50 55 60 Phe Asp Pro Ala Ile Val Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val 65 70 75 80 Lys Leu Gly Lys Tyr Glu Asp Ser Asn Ser Val Thr Cys Ser Val Gln 85 90 95 His Asp Asn Lys Thr Val His Ser Thr Asp Phe Glu Val Lys Thr Asp 100 105 110 Ser Thr Asp His Val Lys Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro 115 120 125 Ser Lys Ser Cys His Lys Pro Lys Ala Ile Val His Thr Glu Lys Val 130 135 140 Asn Met Met Ser Leu Thr Val Leu Gly Leu Arg Met Leu Phe Ala Lys 145 150 155 160 Thr Val Ala Val Asn Phe Leu Leu Thr Ala Lys Leu Phe Phe Leu Gly 165 170 175 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 180 185 190 Asn Pro Gly Pro Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu 195 200 205 Leu Pro His Pro Ala Phe Leu Leu Ile Pro Asp Lys Gln Leu Asp Ala 210 215 220 Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile Ala Glu Thr 225 230 235 240 Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu Lys Phe Phe 245 250 255 Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser Asn Thr Ile 260 265 270 Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp Thr Tyr Met 275 280 285 Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp Lys Glu His 290 295 300 Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val Asp Gln Glu 305 310 315 320 Ile Ile Phe Pro Pro Ile Lys Thr Asp Val Ile Thr Met Asp Pro Lys 325 330 335 Asp Asn Cys Ser Lys Asp Ala Asn Asp Thr Leu Leu Leu Gln Leu Thr 340 345 350 Asn Thr Ser Ala Tyr Tyr Met Tyr Leu Leu Leu Leu Leu Lys Ser Val 355 360 365 Val Tyr Phe Ala Ile Ile Thr Cys Cys Leu Leu Arg Arg Thr Ala Phe 370 375 380 Cys Cys Asn Gly Glu Lys Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu 385 390 395 400 Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Leu Leu 405 410 415 Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe Leu Leu 420 425 430 Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser 435 440 445 Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Ser 450 455 460 Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val Lys Leu 465 470 475 480 Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser Arg Phe 485 490 495 Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu 500 505 510 Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu 515 520 525 Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly Ser Thr 530 535 540 Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Glu 545 550 555 560 Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser 565 570 575 Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly 580 585 590 Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly 595 600 605 Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser 610 615 620 Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys 625 630 635 640 Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys 645 650 655 His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly 660 665 670 Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly Ser Gly 675 680 685 Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Gly Asn Glu Glu 690 695 700 Met Gly Gly Ile Thr Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr 705 710 715 720 Thr Val Ile Leu Thr Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp 725 730 735 Gln His Asn Asp Lys Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile 740 745 750 Gly Ser Asp Glu Asp His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu 755 760 765 Gln Ser Gly Tyr Tyr Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp 770 775 780 Ala Asn Phe Tyr Leu Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met 785 790 795 800 Glu Met Asp Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys 805 810 815 Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg 820 825 830 Lys Ala Lys Ala Lys Pro Val Thr Arg Gly Ala Gly Ala Gly Gly Arg 835 840 845 Gln Arg Gly Gln Asn Lys Glu Arg Pro Pro Pro Val Pro Asn Pro Asp 850 855 860 Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn 865 870 875 880 Gln Arg Arg Ile <210> 264 <211> 887 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 264 Met Leu Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro 1 5 10 15 Ala Phe Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser 20 25 30 Leu Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser 35 40 45 Gln Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly 50 55 60 Thr Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val 65 70 75 80 Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr 85 90 95 Ile Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln 100 105 110 Gly Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile 115 120 125 Thr Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser 130 135 140 Thr Lys Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala 145 150 155 160 Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu 165 170 175 Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu 180 185 190 Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser 195 200 205 Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln 210 215 220 Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr 225 230 235 240 Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr 245 250 255 Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Ser 275 280 285 Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr Asn 290 295 300 Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile Asn 305 310 315 320 Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val Ile 325 330 335 Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu Asp 340 345 350 Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val His 355 360 365 Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys Pro 370 375 380 Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys Pro 385 390 395 400 Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr Val 405 410 415 Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu 420 425 430 Leu Met Thr Leu Arg Leu Trp Ser Ser Gly Ser Gly Glu Gly Arg Gly 435 440 445 Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu 450 455 460 Leu Leu Val Thr Ser Leu Leu Leu Cys Glu Leu Pro His Pro Ala Phe 465 470 475 480 Leu Leu Ile Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser 485 490 495 Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp 500 505 510 Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val 515 520 525 Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser 530 535 540 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser 545 550 555 560 Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn 565 570 575 Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly 580 585 590 Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys 595 600 605 Gly Glu Val Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser 610 615 620 Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp 625 630 635 640 Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp 645 650 655 Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu 660 665 670 Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe 675 680 685 Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys 690 695 700 Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly 705 710 715 720 Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ala Ala Gly Gly Gly Gly 725 730 735 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Glu Asp Lys Gln 740 745 750 Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu Pro Ser Ile 755 760 765 Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys Leu Leu Glu 770 775 780 Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu Lys Lys Ser 785 790 795 800 Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys Thr Asn Asp 805 810 815 Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys Ser Leu Asp 820 825 830 Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys Asn Gly Val 835 840 845 Asp Gln Glu Ile Ile Phe Pro Thr Ile Leu Tyr Glu Ile Leu Leu Gly 850 855 860 Lys Ala Thr Leu Tyr Ala Val Leu Val Ser Ala Leu Val Leu Met Ala 865 870 875 880 Met Val Lys Arg Lys Asp Phe 885 <210> 265 <211> 129 <212> PRT <213> Homo sapiens <400> 265 Ser Gln Pro His Thr Lys Pro Ser Val Phe Val Met Lys Asn Gly Thr 1 5 10 15 Asn Val Ala Cys Leu Val Lys Glu Phe Tyr Pro Lys Asp Ile Arg Ile 20 25 30 Asn Leu Val Ser Ser Lys Lys Ile Thr Glu Phe Asp Pro Ala Ile Val 35 40 45 Ile Ser Pro Ser Gly Lys Tyr Asn Ala Val Lys Leu Gly Lys Tyr Glu 50 55 60 Asp Ser Asn Ser Val Thr Cys Ser Val Gln His Asp Asn Lys Thr Val 65 70 75 80 His Ser Thr Asp Phe Glu Val Lys Thr Asp Ser Thr Asp His Val Lys 85 90 95 Pro Lys Glu Thr Glu Asn Thr Lys Gln Pro Ser Lys Ser Cys His Lys 100 105 110 Pro Lys Ala Ile Val His Thr Glu Lys Val Asn Met Met Ser Leu Thr 115 120 125 Val <210> 266 <211> 25 <212> PRT <213> Homo sapiens <400> 266 Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu 1 5 10 15 Leu Met Thr Leu Arg Leu Trp Ser Ser 20 25 <210> 267 <211> 106 <212> PRT <213> Homo sapiens <400> 267 Asp Lys Gln Leu Asp Ala Asp Val Ser Pro Lys Pro Thr Ile Phe Leu 1 5 10 15 Pro Ser Ile Ala Glu Thr Lys Leu Gln Lys Ala Gly Thr Tyr Leu Cys 20 25 30 Leu Leu Glu Lys Phe Phe Pro Asp Val Ile Lys Ile His Trp Gln Glu 35 40 45 Lys Lys Ser Asn Thr Ile Leu Gly Ser Gln Glu Gly Asn Thr Met Lys 50 55 60 Thr Asn Asp Thr Tyr Met Lys Phe Ser Trp Leu Thr Val Pro Glu Lys 65 70 75 80 Ser Leu Asp Lys Glu His Arg Cys Ile Val Arg His Glu Asn Asn Lys 85 90 95 Asn Gly Val Asp Gln Glu Ile Ile Phe Pro 100 105 <210> 268 <211> 32 <212> PRT <213> Homo sapiens <400> 268 Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala Val 1 5 10 15 Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp Phe 20 25 30 <210> 269 <211> 47 <212> PRT <213> Homo sapiens <400> 269 Cys Asp Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu 1 5 10 15 Asn Phe Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys 20 25 30 Val Ala Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser 35 40 45 <210> 270 <211> 134 <212> PRT <213> Homo sapiens <400> 270 Ala Val Tyr Gln Leu Arg Asp Ser Lys Ser Ser Asp Lys Ser Val Cys 1 5 10 15 Leu Phe Thr Asp Phe Asp Ser Gln Thr Asn Val Ser Gln Ser Lys Asp 20 25 30 Ser Asp Val Tyr Ile Thr Asp Lys Thr Val Leu Asp Met Arg Ser Met 35 40 45 Asp Phe Lys Ser Asn Ser Ala Val Ala Trp Ser Asn Lys Ser Asp Phe 50 55 60 Ala Cys Ala Asn Ala Phe Asn Asn Ser Ile Ile Pro Glu Asp Thr Phe 65 70 75 80 Phe Pro Ser Pro Glu Ser Ser Cys Asp Val Lys Leu Val Glu Lys Ser 85 90 95 Phe Glu Thr Asp Thr Asn Leu Asn Phe Gln Asn Leu Ser Val Ile Gly 100 105 110 Phe Arg Ile Leu Leu Leu Lys Val Ala Gly Phe Asn Leu Leu Met Thr 115 120 125 Leu Arg Leu Trp Ser Ser 130 <210> 271 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(20) <223> This sequence may encompass 1-4 "Gly Gly Gly Gly Ser" repeating units <400> 271 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser 20 <210> 272 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MISC_FEATURE <222> (1)..(40) <223> This sequence may encompass 1-10 "Gly Gly Gly Ser" repeating units <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 272 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 20 25 30 Gly Gly Gly Ser Gly Gly Gly Ser 35 40 <210> 273 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 273 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser 20 <210> 274 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 274 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 275 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 275 Gly Gly Gly Ser 1 <210> 276 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(25) <223> This sequence may encompass 2-5 "Gly Gly Gly Gly Ser" repeating units <400> 276 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 <210> 277 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(15) <223> This sequence may encompass 1-3 "Gly Gly Gly Gly Ser" repeating units <400> 277 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 278 <211> 5000 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(5000) <223> This sequence may encompass 50-5000 nucleotides <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 278 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 420 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 660 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 960 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1020 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1080 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1140 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1200 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1560 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1620 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1680 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2280 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2340 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2400 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2460 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2520 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2580 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2700 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2760 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2820 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2880 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2940 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3060 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3120 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3180 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3360 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3420 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3660 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3780 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3900 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3960 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4020 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4080 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4560 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4620 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4680 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4980 aaaaaaaaaa aaaaaaaaaa 5000 <210> 279 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MISC_FEATURE <222> (1)..(30) <223> This sequence may encompass 1-6 "Gly Gly Gly Gly Ser" repeating units <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 279 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 <210> 280 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(20) <223> This sequence may encompass 2-4 "Gly Gly Gly Gly Ser" repeating units <400> 280 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser 20 <210> 281 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 281 Gly Gly Gly Gly Ser 1 5 <210> 282 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 282 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 283 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MISC_FEATURE <222> (1)..(50) <223> This sequence may encompass 1-10 "Gly Gly Gly Gly Ser" repeating units <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 283 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser 50 <210> 284 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 284 ggtggcggag gttctggagg tggaggttcc 30 <210> 285 <211> 5000 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(5000) <223> This sequence may encompass 50-5000 nucleotides <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 285 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 60 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 120 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 180 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 240 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 300 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 360 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 420 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 480 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 540 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 600 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 660 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 720 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 780 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 840 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 900 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 960 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1020 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1080 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1140 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1200 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1260 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1320 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1380 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1440 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1500 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1560 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1620 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1680 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1740 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1800 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1860 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1920 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 1980 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2040 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2100 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2160 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2220 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2280 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2340 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2400 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2460 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2520 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2580 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2640 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2700 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2760 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2820 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2880 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 2940 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3000 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3060 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3120 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3180 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3240 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3300 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3360 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3420 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3480 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3540 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3600 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3660 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3720 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3780 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3840 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3900 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 3960 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4020 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4080 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4140 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4200 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4260 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4320 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4380 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4440 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4500 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4560 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4620 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4680 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4740 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4800 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4860 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4920 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 4980 tttttttttt tttttttttt 5000 <210> 286 <211> 5000 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(5000) <223> This sequence may encompass 100-5000 nucleotides <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 286 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 420 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 660 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 960 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1020 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1080 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1140 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1200 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1560 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1620 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1680 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2280 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2340 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2400 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2460 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2520 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2580 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2700 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2760 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2820 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2880 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2940 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3060 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3120 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3180 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3360 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3420 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3660 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3720 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3780 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3900 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3960 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4020 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4080 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4560 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4620 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4680 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4980 aaaaaaaaaa aaaaaaaaaa 5000 <210> 287 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 287 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 60 tttttttttt tttttttttt tttttttttt tttttttttt 100 <210> 288 <211> 400 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(400) <223> This sequence may encompass 100-400 nucleotides <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 288 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 400 <210> 289 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 289 tctctcagct ggtacacggc 20 <210> 290 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 290 ctcgaccagc ttgacatcac 20 <210> 291 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 291 gattaaaccc ggccactttc 20 <210> 292 <211> 23 <212> DNA <213> Homo sapiens <400> 292 tccctcagct ggtacaagga tgg 23 <210> 293 <211> 23 <212> DNA <213> Homo sapiens <400> 293 tctgtcaact ggtacatggc aag 23 <210> 294 <211> 23 <212> DNA <213> Homo sapiens <400> 294 tctcatagct ggtacatggc ggg 23 <210> 295 <211> 23 <212> DNA <213> Homo sapiens <400> 295 tttctcagct ggtacatgga ggg 23 <210> 296 <211> 23 <212> DNA <213> Homo sapiens <400> 296 gcactcagct ggtacccggc aag 23 <210> 297 <211> 23 <212> DNA <213> Homo sapiens <400> 297 tcactcagct ggtacatggg cag 23 <210> 298 <211> 23 <212> DNA <213> Homo sapiens <400> 298 tctcccagct gggacacggt gag 23 <210> 299 <211> 23 <212> DNA <213> Homo sapiens <400> 299 tcaatcagct ggtgcacggc tgg 23 <210> 300 <211> 23 <212> DNA <213> Homo sapiens <400> 300 tctcacagct gatatacggc tgg 23 <210> 301 <211> 23 <212> DNA <213> Homo sapiens <400> 301 ctccaccacc ttgacctcac cgg 23 <210> 302 <211> 23 <212> DNA <213> Homo sapiens <400> 302 ctcaaccaga atgacatcac cag 23 <210> 303 <211> 23 <212> DNA <213> Homo sapiens <400> 303 ctagaccagc ttgacctccc cag 23 <210> 304 <211> 23 <212> DNA <213> Homo sapiens <400> 304 ctagaccagc ttggcaacac agg 23 <210> 305 <211> 23 <212> DNA <213> Homo sapiens <400> 305 gaataaaacc ggccactttg ggg 23 <210> 306 <211> 23 <212> DNA <213> Homo sapiens <400> 306 gattatacct ggccacattc aag 23 <210> 307 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 307 acactggtgt gcctggccac 20 <210> 308 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 308 agggcgggct gctccttgag 20 <210> 309 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 309 ctgcctgagc agccgcctga 20 <210> 310 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 310 gcgggggttc tgccagaagg 20 <210> 311 <211> 23 <212> DNA <213> Homo sapiens <400> 311 actctgggct gcctggccac ggg 23 <210> 312 <211> 23 <212> DNA <213> Homo sapiens <400> 312 actctgttgt gcctggacac cgg 23 <210> 313 <211> 23 <212> DNA <213> Homo sapiens <400> 313 tcacaggtga gcctggccac agg 23 <210> 314 <211> 23 <212> DNA <213> Homo sapiens <400> 314 gcacgggtgg gcctggccac tgg 23 <210> 315 <211> 23 <212> DNA <213> Homo sapiens <400> 315 gcaggggtgt gcctggccac tgg 23 <210> 316 <211> 23 <212> DNA <213> Homo sapiens <400> 316 atcctgctgt gcctggccac agg 23 <210> 317 <211> 23 <212> DNA <213> Homo sapiens <400> 317 tctctggtgt gcctggccaa gag 23 <210> 318 <211> 23 <212> DNA <213> Homo sapiens <400> 318 acacatgtgg gcctggccac ggg 23 <210> 319 <211> 23 <212> DNA <213> Homo sapiens <400> 319 agcctggtgt gtctggccac tgg 23 <210> 320 <211> 23 <212> DNA <213> Homo sapiens <400> 320 cctctggtgt gcctggcccc agg 23 <210> 321 <211> 23 <212> DNA <213> Homo sapiens <400> 321 ccacttgtgt gcatggccac tag 23 <210> 322 <211> 23 <212> DNA <213> Homo sapiens <400> 322 ataatggtgt gcctggcaac tag 23 <210> 323 <211> 23 <212> DNA <213> Homo sapiens <400> 323 acactggcct gcctgggcac tag 23 <210> 324 <211> 23 <212> DNA <213> Homo sapiens <400> 324 agcgcgggct cctccttgac ggg 23 <210> 325 <211> 23 <212> DNA <213> Homo sapiens <400> 325 agggcctgct gctccttcag cag 23 <210> 326 <211> 23 <212> DNA <213> Homo sapiens <400> 326 agggctgaca gctccttgag tgg 23 <210> 327 <211> 23 <212> DNA <213> Homo sapiens <400> 327 ggggtgggct gctcctggag cag 23 <210> 328 <211> 23 <212> DNA <213> Homo sapiens <400> 328 agagcggcct gctcctcgag ggg 23 <210> 329 <211> 23 <212> DNA <213> Homo sapiens <400> 329 ggggtgggct gcaccttgag ggg 23 <210> 330 <211> 23 <212> DNA <213> Homo sapiens <400> 330 aaggcaggct cctccttgag agg 23 <210> 331 <211> 23 <212> DNA <213> Homo sapiens <400> 331 aggaagggct gctctttgag gag 23 <210> 332 <211> 23 <212> DNA <213> Homo sapiens <400> 332 aggctgggct gctctttgag cag 23 <210> 333 <211> 23 <212> DNA <213> Homo sapiens <400> 333 agtgccggct gctcctggag tgg 23 <210> 334 <211> 23 <212> DNA <213> Homo sapiens <400> 334 agggtggggt gctcctcgag ggg 23 <210> 335 <211> 23 <212> DNA <213> Homo sapiens <400> 335 tgggctggct gcaccttgag tag 23 <210> 336 <211> 23 <212> DNA <213> Homo sapiens <400> 336 tgggcgggct gttccttggg gag 23 <210> 337 <211> 23 <212> DNA <213> Homo sapiens <400> 337 cttcctgagc agccgtctgc agg 23 <210> 338 <211> 23 <212> DNA <213> Homo sapiens <400> 338 ctgcctgagc agctgccaca agg 23 <210> 339 <211> 23 <212> DNA <213> Homo sapiens <400> 339 cagcgttagc agccgcctga ggg 23 <210> 340 <211> 23 <212> DNA <213> Homo sapiens <400> 340 cacccagagc agccgcctga cag 23 <210> 341 <211> 23 <212> DNA <213> Homo sapiens <400> 341 ctgcctggga agccgcctgc cag 23 <210> 342 <211> 23 <212> DNA <213> Homo sapiens <400> 342 ctgcctcctc agccgcctga ggg 23 <210> 343 <211> 23 <212> DNA <213> Homo sapiens <400> 343 ctgtctgacc agccgcctgc cgg 23 <210> 344 <211> 23 <212> DNA <213> Homo sapiens <400> 344 cagcctgagc tgccgcctgc ggg 23 <210> 345 <211> 23 <212> DNA <213> Homo sapiens <400> 345 caacctgagc agcctcctga gag 23 <210> 346 <211> 23 <212> DNA <213> Homo sapiens <400> 346 ctccctgatc agccgcatga ggg 23 <210> 347 <211> 23 <212> DNA <213> Homo sapiens <400> 347 cggccggagc agccgcctca ggg 23 <210> 348 <211> 23 <212> DNA <213> Homo sapiens <400> 348 ctgcctcaac atccgcctga aag 23 <210> 349 <211> 23 <212> DNA <213> Homo sapiens <400> 349 gttgggattc tgccagaagg cag 23 <210> 350 <211> 23 <212> DNA <213> Homo sapiens <400> 350 gaggggggcc tgccagaagg agg 23 <210> 351 <211> 23 <212> DNA <213> Homo sapiens <400> 351 gcggaagatc tgccagaagg ggg 23 <210> 352 <211> 23 <212> DNA <213> Homo sapiens <400> 352 ggtggggttc tgccaggagg agg 23 <210> 353 <211> 23 <212> DNA <213> Homo sapiens <400> 353 gcgggggatg tgccaggagg agg 23 <210> 354 <211> 23 <212> DNA <213> Homo sapiens <400> 354 gaggggattc tgccagcagg cgg 23 <210> 355 <211> 23 <212> DNA <213> Homo sapiens <400> 355 gagggggtcc tgccagcagg gag 23 <210> 356 <211> 23 <212> DNA <213> Homo sapiens <400> 356 gagggtgttc tgccagcagg cag 23 <210> 357 <211> 23 <212> DNA <213> Homo sapiens <400> 357 gcaggggttc agccaggagg cag 23 <210> 358 <211> 23 <212> DNA <213> Homo sapiens <400> 358 gagggggttc agacagaagg cag 23 <210> 359 <211> 23 <212> DNA <213> Homo sapiens <400> 359 gcaggggttc tcccagtagg cag 23 <210> 360 <211> 23 <212> DNA <213> Homo sapiens <400> 360 gtgggggttc tgccagcagc tgg 23

Claims (290)

  1. 다음을 포함하는, 재조합 핵산:
    (a) 다음을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열:
    (i) 다음을 포함하는 TCR 소단위:
    (1) TCR 세포외 도메인의 적어도 일부분, 그리고
    (2) 막경유 도메인; 그리고
    (ii)항원 결합 도메인을 포함하는 항체;
    그리고
    (b) TCR 불변 도메인을 인코딩하는 서열;
    이때, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며;
    이때, 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고
    이때, 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
  2. 다음을 포함하는, 재조합 핵산:
    (a) 다음을 포함하는 T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열:
    (i) 다음을 포함하는 TCR 소단위:
    (1) TCR 세포외 도메인의 적어도 일부분, 그리고
    (2) 막경유 도메인; 그리고
    (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편; 그리고
    (b) TCR 불변 도메인을 인코딩하는 서열;
    이때, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열이며;
    이때, 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 그리고
    이때, 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
  3. 청구항 1 또는 청구항 2에 있어서, 이때 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인을 더 포함하거나, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 더 포함하는, 재조합 핵산.
  4. 청구항 1-3중 임의의 한 항에 있어서, 이때 상기 TCR 불변 도메인은 TCR 델타 불변 도메인인, 재조합 핵산.
  5. 청구항 4에 있어서, 이때 상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  6. 청구항 3-5중 임의의 한 항에 있어서, 이때 상기 세포내 도메인은 TCR 감마의 세포내 도메인인, 재조합 핵산.
  7. 청구항 3-5중 임의의 한 항에 있어서, 이때 상기 TCR 델타 불변 도메인을 인코딩하는 서열은 상기 TCR 델타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드하는, 재조합 핵산.
  8. 청구항 7에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이한, 재조합 핵산.
  9. 청구항 7에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 델타 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된, 재조합 핵산.
  10. 청구항 1-3중 임의의 한 항에 있어서, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인인, 재조합 핵산.
  11. 청구항 10에 있어서, 이때 상기 TCR 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  12. 청구항 10 또는 11에 있어서, 이때 상기 세포내 도메인은 TCR 델타의 세포내 도메인인, 재조합 핵산.
  13. 청구항 8-12중 임의의 한 항에 있어서, 이때 상기 TCR 감마 불변 도메인을 인코드하는 서열은 상기 TCR 감마 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드하는, 재조합 핵산.
  14. 청구항 13에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이한, 재조합 핵산.
  15. 청구항 13에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 감마 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된, 재조합 핵산.
  16. 청구항 1-3중 임의의 한 항에 있어서, 이때 상기 재조합 핵산은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인을 인코딩하는 서열을 포함하는, 재조합 핵산.
  17. 청구항 16에 있어서, 이때 상기 TCR 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는 재조합 핵산.
  18. 청구항 16 또는 17에 있어서, 이때 상기 TCR 감마 불변 도메인을 인코드하는 서열은 TCR 감마 가변 도메인을 더 포함하고, 이로써 전체 TCR 감마 도메인을 인코드하게 되는, 재조합 핵산.
  19. 청구항 18에 있어서, 이때 상기 전체 TCR 감마 도메인은 감마 9 또는 감마 4인, 재조합 핵산.
  20. 청구항 18 또는 19에 있어서, 이때 상기 전체 TCR 감마 도메인은 서열 식별 번호: 255, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  21. 청구항 16-20중 임의의 한 항에 있어서, 이때 상기 TCR 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  22. 청구항 16-21중 임의의 한 항에 있어서, 이때 상기 TCR 델타 불변 도메인을 인코딩하는 서열은 TCR 델타 가변 도메인을 더 포함하고, 이로써 전체 TCR 델타 도메인이 인코딩되는, 재조합 핵산.
  23. 청구항 22에 있어서, 이때 상기 전체 TCR 델타 도메인은 델타 2 또는 델타 1인, 재조합 핵산.
  24. 청구항 22 또는 23, 이때 상기 전체 TCR 델타 불변 도메인은 서열 식별 번호: 256, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  25. 청구항 16-24중 임의의 한 항에 있어서, 이때 상기 세포내 신호생성 도메인은 CD3 입실론, CD3 감마, 또는 CD3 델타인, 재조합 핵산.
  26. 청구항 16-25중 임의의 한 항에 있어서, 이때 상기 세포내 신호생성 도메인은 CD3 입실론인, 재조합 핵산.
  27. 청구항 1-26중 임의의 한 항에 있어서, 적어도 하나의 리더 서열 및 적어도 하나의 링커를 더 포함하는, 재조합 핵산.
  28. 청구항 27에 있어서, TCR 알파 불변 도메인의 일부분, TCR 베타 도메인의 일부분, 또는 이 둘 모두를 더 포함하는, 재조합 핵산.
  29. 청구항 1에 있어서, 이때 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRGC 유전자 서열을 포함하는, 재조합 핵산.
  30. 청구항 1에 있어서, 이때 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 TRGC 유전자 서열을 포함하는, 재조합 핵산.
  31. 청구항 1에 있어서, 이때 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열, 절단가능한 링커, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, 및 TRGC 유전자 서열을 포함하는, 재조합 핵산.
  32. 청구항 1, 이때 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRDC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRGC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함하는, 재조합 핵산.
  33. 청구항 1에 있어서, 이때 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, 제 1 항원 결합 도메인 서열, 제 1 링커 서열, TRDC 유전자 서열 또는 이의 단편, TRAC 유전자 서열 또는 이의 단편, 절단가능한 링커 서열, 제 2 리더 서열, 제 2 항원 결합 도메인 서열, 제 2 링커 서열, TRGC 유전자 서열 또는 이의 단편, 및 TRBC 유전자 서열 또는 이의 단편을 포함하는, 재조합 핵산.
  34. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 1에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  35. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 2에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  36. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 3에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  37. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 4에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  38. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 5에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  39. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 242에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  40. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 244에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  41. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 245에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  42. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 246에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  43. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 248에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  44. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 250에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  45. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 252에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  46. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 257에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  47. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 263에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  48. 청구항 1-33중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 264에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  49. 청구항 1에 있어서, 이때 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있는, 재조합 핵산.
  50. 청구항 1에 있어서, 이때 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있는, 재조합 핵산.
  51. 청구항 1에 있어서, 이때 상기 결합 리간드는 IgG4 항체에 특이적으로 결합할 수 있는, 재조합 핵산.
  52. 청구항 1에 있어서, 이때 상기 항체 또는 이의 단편은 세포 표면 항원에 결합하는, 재조합 핵산.
  53. 청구항 1에 있어서, 이때 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된, 재조합 핵산.
  54. 청구항 1에 있어서, 이때 상기 항체 또는 이의 단편은 종양 세포의 표면 상에서 세포 표면 항원에 결합하는, 재조합 핵산.
  55. 청구항 1에 있어서, 이때 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함하는, 재조합 핵산.
  56. 청구항 1에 있어서, 이때 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않는, 재조합 핵산.
  57. 청구항 56에 있어서, 이때 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함하는, 재조합 핵산.
  58. 청구항 56에 있어서, 이때 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함하는, 재조합 핵산.
  59. 청구항 1에 있어서, 이때 상기 결합 리간드는 인간 또는 인간화된, 재조합 핵산.
  60. 청구항 1에 있어서, 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코딩하는 핵산 서열을 더 포함하는, 재조합 핵산.
  61. 청구항 60에 있어서, 이때 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있는, 재조합 핵산.
  62. 다음을 포함하는, 재조합 핵산:
    (a) 다음을 포함하는, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열;
    (i) 다음을 포함하는, TCR 소단위:
    (1) TCR 세포외 도메인의 적어도 일부분, 그리고
    (2) 막경유 도메인; 그리고
    (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인; 그리고
    (b) TCR 불변 도메인(들)을 인코딩하는 서열;
    이때, 상기 TCR 불변 도메인은 TCR 감마 불변 도메인 또는 TCR 델타 불변 도메인이거나; 또는 TCR 감마 불변 도메인 및 TCR 델타 불변 도메인을 인코딩하는 서열이며;
    이때, 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며, 그리고
    이때, 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된, 재조합 핵산.
  63. 청구항 62에 있어서, 이때 상기 TCR 소단위는 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타의 세포내 도메인을 더 포함하거나, 또는 CD3 입실론, CD3 감마, 또는 CD3 델타의 세포내 신호생성 도메인으로부터 유래된 자극 도메인을 포함하는 세포내 도메인을 더 포함하는, 재조합 핵산.
  64. 청구항 1-63중 임의의 한 항에 있어서, TCR 알파 불변 도메인, TCR 베타 불변 도메인을 인코딩하는 적어도 일부분 서열, 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인 모두의 일부분 서열을 더 포함한하는, 재조합 핵산.
  65. 청구항 62에 있어서, 이때 상기 항원 도메인은 리간드를 포함하는, 재조합 핵산.
  66. 청구항 62에 있어서, 이때 상기 리간드 세포의 수용체에 결합하는, 재조합 핵산.
  67. 청구항 62에 있어서, 이때 상기 리간드 세포 표면 상에 발현된 폴리펩티드에 결합하는, 재조합 핵산.
  68. 청구항 62에 있어서, 이때 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함하는, 재조합 핵산.
  69. 청구항 62, 이때 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질인, 재조합 핵산.
  70. 청구항 69에 있어서, 이때 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택되는, 재조합 핵산.
  71. 청구항 62에 있어서, 이때 상기 항원 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함하는, 재조합 핵산.
  72. 청구항 71에 있어서, 이때 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함하는, 재조합 핵산.
  73. 청구항 62에 있어서, 이때 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체인, 재조합 핵산.
  74. 청구항 73에 있어서, 이때 상기 리간드 또는 이의 단편은 단량체 또는 이량체인, 재조합 핵산.
  75. 청구항 62에 있어서, 이때 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는, 재조합 핵산.
  76. 청구항 62에 있어서, 이때 상기 항원 결합 도메인은 가변 영역을 포함하지 않는, 재조합 핵산.
  77. 청구항 62에 있어서, 이때 상기 항원 결합 도메인은 CDR을 포함하지 않는, 재조합 핵산.
  78. 청구항 62에 있어서, 이때 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편인, 재조합 핵산.
  79. 청구항 1-78중 임의의 한 항에 있어서, 이때 상기 TCR 불변 도메인이 T 세포에서 발현될 때 기능적 TCR 복합체로 통합되는, 재조합 핵산.
  80. 청구항 1-79중 임의의 한 항에 있어서, 이때 상기 TCR 불변 도메인은 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합되는, 재조합 핵산.
  81. 청구항 1-80중 임의의 한 항에 있어서, 이때 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 동일한 핵산 분자 안에 내포되는, 재조합 핵산.
  82. 청구항 1-81중 임의의 한 항에 있어서, 이때 상기 인코드된 TFP 및 상기 인코드된 TCR 불변 도메인은 제 1 링커 서열에 의해 작동가능하도록 연계되는, 재조합 핵산.
  83. 청구항 82에 있어서, 이때 상기 제 1 링커는 프로테아제 절단 부위를 포함하는, 재조합 핵산.
  84. 청구항 83에 있어서, 이때 상기 프로테아제 절단 부위는 2A, 가령, T2A 또는 P2A 절단 부위인, 재조합 핵산.
  85. 청구항 1-84중 임의의 한 항에 있어서, 이때 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인을 인코딩하는 서열은 상이한 핵산 분자 안에 내포되는, 재조합 핵산.
  86. 청구항 1-85중 임의의 한 항에 있어서, 이때 상기 TCR 소단위 및 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 TFP의 결합 리간드 또는 이의 단편은 제 2 링커 서열에 의해 작동가능하도록 연계되는, 재조합 핵산.
  87. 청구항 86에 있어서, 이때 상기 제 2 링커 서열은 (G4S)n을 포함하며, 이때 n=1 ~ 4인, 재조합 핵산.
  88. 청구항 1-87중 임의의 한 항에 있어서, 이때 상기 막경유 도메인은 CD3 입실론, CD3 감마, CD3 델타, TCR 알파, TCR 베타, TCR 델타, 또는 TCR 감마의 TCR 막경유 도메인인,재조합 핵산.
  89. 청구항 3-61 및 63-88중 임의의 한 항에 있어서, 이때 상기 세포내 도메인은 오로지 CD3 입실론, 오로지 CD3 감마, 오로지 CD3 델타, 오로지 TCR 알파, TCR 베타, TCR 감마, 또는 TCR 델타로부터 유래된, 재조합 핵산.
  90. 청구항 1-89중 임의의 한 항에 있어서, 이때 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 이때 (i), (ii), 그리고 (iii) 중 적어도 두 개는 동일한 TCR 소단위로부터 유래되는, 재조합 핵산.
  91. 청구항 1-90중 임의의 한 항에 있어서, 이때 상기 TCR 세포외 도메인은 TCR 감마 쇄, TCR 델타 쇄, CD3 입실론 TCR 소단위, CD3 감마 TCR 소단위, CD3 델타 TCR 소단위, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열로 구성된 군에서 선택된 단백질의 세포외 도메인 또는 이의 일부분을 포함하는, 재조합 핵산.
  92. 청구항 91에 있어서, 이때 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 감마의 세포내 도메인 쇄 또는 TCR 델타 쇄를 포함하는, 재조합 핵산.
  93. 청구항 92에 있어서, 이때 상기 TCR 세포외 도메인은 TCR 감마 쇄 또는 TCR 델타 쇄의 불변 도메인의 세포외 일부분, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  94. 청구항 92 또는 93에 있어서, 이때 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하거나, 또는 델타 불변 도메인, 또는 이의 단편이거나, 또는 이를 포함하는,재조합 핵산.
  95. 청구항 94에 있어서, 이때 상기 델타 불변 도메인은 서열 식별 번호: 20, 서열 식별 번호: 22, 서열 식별 번호: 243 또는 서열 식별 번호: 265의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  96. 청구항 92 또는 93에 있어서, 이때 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하거나, 또는 감마 불변 도메인, 또는 이의 단편이거나, 또는 이를 포함하는, 재조합 핵산.
  97. 청구항 96에 있어서, 이때 상기 감마 불변 도메인은 서열 식별 번호: 21 또는 서열 식별 번호: 155의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  98. 청구항 94-97중 임의의 한 항에 있어서, 이때 상기 TFP의 세포외 도메인은 감마 쇄 또는 델타 쇄의 가변 도메인을 포함하지 않는, 재조합 핵산.
  99. 청구항 3-61 및 63-88중 임의의 한 항에 있어서, 이때 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 TCR 세포내 도메인을 포함하는, 재조합 핵산.
  100. 청구항 99에 있어서, 이때 상기 상기 TFP의 TCR 소단위는 CD3 입실론의 세포외, 막경유 및 세포내 도메인을 포함하는, 재조합 핵산.
  101. 청구항 100에 있어서, 이때 상기 CD3 입실론의 TCR 소단위는 서열 식별 번호: 258의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  102. 청구항 1-101중 임의의 한 항에 있어서, 이때 상기 TFP, 상기 TCR 감마 불변 도메인, 상기 TCR 델타 불변 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있는, 재조합 핵산.
  103. 청구항 1-102중 임의의 한 항에 있어서, 이때
    (a) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인이며, 상기 TFP는 TCR 델타, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체로 기능적으로 통합되며;
    (b) 상기 TCR 불변 도메인은 TCR 델타 불변 도메인이며, 상기 TFP는 TCR 감마, CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며; 또는
    (c) 상기 TCR 불변 도메인은 TCR 감마 불변 도메인과 TCR 델타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되는, 재조합 핵산.
  104. 청구항 1-103중 임의의 한 항에 있어서, 이때 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함하는, 재조합 핵산.
  105. 청구항 1, 3-61 및 85-104중 임의의 한 항에 있어서, 이때 상기 항체는 항체 단편인, 재조합 핵산.
  106. 청구항 105에 있어서, 이때 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인인, 재조합 핵산.
  107. 청구항 1, 3-61 및 85-106중 임의의 한 항에 있어서, 이때 항원 결합 도메인은 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD20 결합 도메인, 항-CD70 결합 도메인, 항-79b 결합 도메인, 항-HER2 결합 도메인, 항-PMSA 결합 도메인, 항-MUC16 결합 도메인, 항-CD22 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 항-Nectin-4 결합 도메인, 항-TROP-2 결합 도메인, 항-GPC3 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택되는, 재조합 핵산.
  108. 청구항 107에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 60의 CDR1, 서열 식별 번호: 61의 CDR2, 그리고 서열 식별 번호: 62의 CDR3을 포함하는, 재조합 핵산.
  109. 청구항 107에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 63의 CDR1, 서열 식별 번호: 64의 CDR2, 그리고 서열 식별 번호: 65의 CDR3을 포함하는, 재조합 핵산.
  110. 청구항 107에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 66의 CDR1, 서열 식별 번호: 67의 CDR2, 그리고 서열 식별 번호: 68의 CDR3을 포함하는, 재조합 핵산.
  111. 청구항 107에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 69, 서열 식별 번호: 70, 또는 서열 식별 번호: 71의 서열에 대해 적어도 약 80% 동일성을 갖는 서열을 포함하는, 재조합 핵산.
  112. 청구항 107에 있어서, 이때 상기 항-CD19 결합 도메인은 서열 식별 번호: 73의 경쇄 CDR1, 서열 식별 번호: 75의 CDR2, 및 서열 식별 번호: 77의 CDR3을 포함하는, 재조합 핵산.
  113. 청구항 107에 있어서, 이때 상기 항-CD19 결합 도메인은 서열 식별 번호: 79의 중쇄 CDR1, 서열 식별 번호: 81의 CDR2, 및 서열 식별 번호: 83의 CDR3을 포함하는, 재조합 핵산.
  114. 청구항 107에 있어서, 이때 상기 항-CD19 결합 도메인은 서열 식별 번호: 85의 서열에 대해 적어도 약 80% 서열 동일을 갖는 경쇄 가변 영역 및/또는 서열 식별 번호: 87의 서열에 대해 적어도 약 80% 서열 동일을 갖는 중쇄 가변 영역을 포함하는, 재조합 핵산.
  115. 청구항 1-114중 임의의 한 항에 있어서, TCR 알파 막경유 도메인을 인코딩하는 서열을 더 포함하는, 재조합 핵산.
  116. 청구항 1-114중 임의의 한 항에 있어서, TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함하는, 재조합 핵산.
  117. 청구항 1-114중 임의의 한 항에 있어서, TCR 알파 막경유 도메인을 인코딩하는 서열 및 TCR 베타 막경유 도메인을 인코딩하는 서열을 더 포함하는, 재조합 핵산.
  118. 다음을 포함하는, 재조합 핵산:
    (a) 다음을 포함하는, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열:
    (i) 다음을 포함하는, TCR 소단위:
    (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, 그리고
    (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인; 그리고
    (ii)항원 결합 도메인을 포함하는 항체 또는 이의 단편;
    그리고
    (b) TCR 불변 도메인(들)을 인코딩하는 서열;
    이때, 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며;
    이때, 상기 TCR 소단위와 상기 항체는 작동가능하도록 연계되며, 그리고
    이때, 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
  119. 다음을 포함하는, 재조합 핵산:
    (a) 다음을 포함하는, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열:
    (i) 다음을 포함하는, TCR 소단위:
    (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, 그리고
    (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인; 그리고
    (ii) 항체 또는 이의 단편에 결합할 수 있는 결합 리간드 또는 이의 단편; 그리고
    (b) TCR 불변 도메인(들)을 인코딩하는 서열;
    이때, 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며;
    이때, 상기 TCR 소단위와 상기 결합 리간드 또는 이의 단편은 작동가능하도록 연계되며, 그리고
    이때, 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입된다.
  120. 청구항 118 또는 119에 있어서, 이때 상기 TCR 소단위는 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함하는, 재조합 핵산.
  121. 청구항 118 또는 120에 있어서, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인인, 재조합 핵산.
  122. 청구항 121에 있어서, 이때 상기 TCR 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  123. 청구항 121에 있어서, 이때 상기 TCR 알파 불변 도메인은 뮤린 TCR 알파 불변 도메인을 포함하는, 재조합 핵산.
  124. 청구항 123에 있어서, 이때 상기 뮤린 TCR 알파 불변 도메인은 뮤린 TCR 알파 불변 도메인의 아미노산 2-137을 포함하는, 재조합 핵산.
  125. 청구항 124에 있어서, 이때 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 아미노산 2-137을 포함하는, 재조합 핵산.
  126. 청구항 124에 있어서, 이때 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 207의 서열을 포함하는, 재조합 핵산.
  127. 청구항 123에 있어서, 이때 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 146의 아미노산 82-137을 포함하는, 재조합 핵산.
  128. 청구항 127에 있어서, 이때 상기 뮤린 TCR 알파 불변 도메인은 서열 식별 번호: 17의 서열을 포함하는, 재조합 핵산.
  129. 청구항 122-128중 임의의 한 항에 있어서, 이때 상기 세포내 도메인은 TCR 베타의 세포내 도메인인, 재조합 핵산.
  130. 청구항 121-129중 임의의 한 항에 있어서, 이때 상기 상기 TCR 알파 불변 도메인을 인코드하는 서열은 상기 TCR 알파 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드하는, 재조합 핵산.
  131. 청구항 130에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이한, 재조합 핵산.
  132. 청구항 130에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 알파 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된, 재조합 핵산.
  133. 청구항 118-120중 임의의 한 항에 있어서, 이때 상기 TCR 불변 도메인은 TCR 베타 불변 도메인인, 재조합 핵산.
  134. 청구항 133에 있어서, 이때 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  135. 청구항 134에 있어서, 이때 TCR 베타 불변 도메인은 뮤린 TCR 베타 불변 도메인을 포함하는, 재조합 핵산.
  136. 청구항 134에 있어서, 이때 뮤린 TCR 베타 불변 도메인은 뮤린 TCR 베타 불변 도메인의 아미노산 2-173을 포함하는, 재조합 핵산.
  137. 청구항 134에 있어서, 이때 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 152의 아미노산 2-173을 포함하는, 재조합 핵산.
  138. 청구항 134에 있어서, 이때 뮤린 TCR 베타 불변 도메인은 서열 식별 번호: 209를 포함하는, 재조합 핵산.
  139. 청구항 134에 있어서, 이때 상기 TCR 베타 불변 도메인은 서열 식별 번호: 152의 아미노산 123-173을 포함하는, 재조합 핵산.
  140. 청구항 134에 있어서, 이때 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18을 포함하는, 재조합 핵산.
  141. 청구항 133-140중 임의의 한 항에 있어서, 이때 상기 세포내 도메인은 TCR 알파의 세포내 도메인인, 재조합 핵산.
  142. 청구항 118-141중 임의의 한 항에 있어서, 이때 상기 TCR 베타 불변 도메인을 인코드하는 서열은 상기 TCR 베타 불변 도메인을 인코딩하는 서열에 작동가능하도록 연계된, 제 2 항원 결합 도메인 또는 리간드 결합 도메인을 더 인코드하는, 재조합 핵산.
  143. 청구항 142에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TFP의 항원 결합 도메인 또는 리간드 결합 도메인과 동일하거나, 또는 상이한, 재조합 핵산.
  144. 청구항 142에 있어서, 이때 상기 제 2 항원 결합 도메인 또는 리간드 결합 도메인은 상기 TCR 베타 불변 도메인을 인코딩하는 서열에 링커를 통하여 작동가능하도록 연계된, 재조합 핵산.
  145. 청구항 118-120중 임의의 한 항에 있어서, 이때 상기 재조합 핵산은 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인을 인코딩하는 서열을 포함하는, 재조합 핵산.
  146. 청구항 145에 있어서, 이때 상기 TCR 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열의 서열을 포함하는, 재조합 핵산.
  147. 청구항 145 또는 146에 있어서, 이때 상기 TCR 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열의 서열을 포함하는,재조합 핵산.
  148. 청구항 118-147중 임의의 한 항에 있어서, 이때 상기 세포내 신호생성 도메인은 CD3 입실론, CD3 감마, 또는 CD3 델타인, 재조합 핵산.
  149. 청구항 118-147중 임의의 한 항에 있어서, 이때 상기 세포내 신호생성 도메인은 CD3 입실론인, 재조합 핵산.
  150. 청구항 145에 있어서, 이때 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함하는, 재조합 핵산.
  151. 청구항 145에 있어서, 이때 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 및 TRBC 유전자 서열을 포함하는, 재조합 핵산.
  152. 청구항 145에 있어서, 이때 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커, 및 TRBC 유전자 서열을 포함하는, 재조합 핵산.
  153. 청구항 145에 있어서, 이때 상기 서열은 5'에서 3' 방향으로, 제 1 리더 서열, 항원 결합 도메인 서열, 링커, TRAC 유전자 서열, 절단가능한 링커 서열, 제 2 리더 서열, 항원 결합 도메인 서열, 링커, 및 TRBC 유전자 서열을 포함하는, 재조합 핵산.
  154. 청구항 145에 있어서, 이때 상기 서열은 5'-3' 방향으로, 제 1 리더 서열, TRAC 유전자 서열, 제 1 절단가능한 링커 서열, 제 2 리더 서열, TRBC 유전자 서열, 제 2 절단가능한 링커 서열, 제 3 리더 서열, 항원 결합 도메인 서열, 링커 서열, 및 CD3 입실론 유전자 서열을 포함하는, 재조합 핵산.
  155. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 10에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  156. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 204에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  157. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 206에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  158. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 210에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  159. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 211에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  160. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 217에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  161. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 218에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  162. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 219에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  163. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 220에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  164. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 259에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  165. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 261에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  166. 청구항 115-154중 임의의 한 항에 있어서, 이때 상기 서열은 서열 식별 번호: 262에서 제시된 폴리펩티드를 인코드하는, 재조합 핵산.
  167. 청구항 115-166중 임의의 한 항에 있어서, 적어도 하나의 리더 서열과 적어도 하나의 링커를 더 포함하는, 재조합 핵산.
  168. 청구항 119-167중 임의의 한 항에 있어서, 이때 상기 결합 리간드는 항체의 Fc 도메인에 결합할 수 있는, 재조합 핵산.
  169. 청구항 119-167중 임의의 한 항에 있어서, 이때 상기 결합 리간드는 IgG1 항체에 선택적으로 결합할 수 있는, 재조합 핵산.
  170. 청구항 119-167중 임의의 한 항에 있어서, 이때 상기 결합 리간드는 IgG4 항체에 특이적으로 결합할 수 있는, 재조합 핵산.
  171. 청구항 118 및 120-170중 임의의 한 항에 있어서, 이때 상기 항체 또는 이의 단편은 세포 표면 항원에 결합하는, 재조합 핵산.
  172. 청구항 118 및 120-170중 임의의 한 항에 있어서, 이때 상기 항체 또는 이의 단편은 뮤린, 인간 또는 인간화된, 재조합 핵산.
  173. 청구항 118 및 120-170중 임의의 한 항에 있어서, 이때 상기 항체 또는 이의 단편은 종양 세포의 표면의 세포 표면 항원에 결합하는, 재조합 핵산.
  174. 청구항 119-167중 임의의 한 항에 있어서, 이때 상기 결합 리간드는 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함하는, 재조합 핵산.
  175. 청구항 119-167중 임의의 한 항에 있어서, 이때 상기 결합 리간드는 항체 또는 이의 단편을 포함하지 않은, 재조합 핵산.
  176. 청구항 175에 있어서, 이때 상기 결합 리간드는 CD16 폴리펩티드 또는 이의 단편을 포함하는, 재조합 핵산.
  177. 청구항 175, 이때 상기 결합 리간드는 CD16-결합 폴리펩티드를 포함하는, 재조합 핵산.
  178. 청구항 119-167중 임의의 한 항에 있어서, 이때 상기 결합 리간드는 인간 또는 인간화된, 재조합 핵산.
  179. 청구항 119-167중 임의의 한 항에 있어서, 상기 결합 리간드에 의해 결합될 수 있는 항체 또는 이의 단편을 인코딩하는 핵산 서열을 더 포함하는, 재조합 핵산.
  180. 청구항 118 및 120-170중 임의의 한 항에 있어서, 이때 상기 항체 또는 이의 단편은 세포로부터 분비될 수 있는, 재조합 핵산.
  181. 다음을 포함하는, 재조합 핵산:
    (a) 다음을 포함하는, T 세포 수용체 (TCR) 융합 단백질 (TFP)을 인코딩하는 서열:
    (i) 다음을 포함하는, TCR 소단위:
    (1) 뮤린 TCR 알파 또는 뮤린 TCR 베타 세포외 도메인의 적어도 일부분, 그리고
    (2) 뮤린 TCR 알파 또는 뮤린 TCR 베타 막경유 도메인, 그리고
    (ii) 세포의 표면 상에 발현된 수용체 또는 폴리펩티드에 결합하는 리간드 또는 이의 단편을 포함하는 항원 결합 도메인; 그리고
    (b) TCR 불변 도메인을 인코드하는 서열;
    이때, 상기 TCR 불변 도메인은 뮤린 TCR 알파 불변 도메인 또는 뮤린 TCR 베타 불변 도메인이거나; 또는 뮤린 TCR 알파 불변 도메인과 뮤린 TCR 베타 불변 도메인을 인코딩하는 서열이며;
    이때, 상기 TCR 소단위와 상기 항원 결합 도메인은 작동가능하도록 연계되며,
    이때, 상기 TFP는 내생성 TCR의 기능성 파괴를 포함하는 변형된 T 세포에서 발현될 때, TCR 복합체로 기능적으로 편입되는, 재조합 핵산.
  182. 청구항 181에 있어서, 이때 상기 TCR 소단위는 뮤린 TCR 알파 또는 뮤린 TCR 베타의 세포내 도메인을 포함하는, 재조합 핵산.
  183. 청구항 118-182중 임의의 한 항에 있어서, 이때 상기 세포외 도메인은 상기 세포외 TCR 알파 불변 도메인의 일부분 또는 TCR 베타 불변 도메인, 또는 이의 단편을 포함하는, 재조합 핵산.
  184. 청구항 118-183중 임의의 한 항에 있어서, TCR 감마 불변 도메인, TCR 델타 불변 도메인, 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인 모두의 적어도 일부분 서열을 인코드하는 적어도 일부 서열을 더 포함하는, 재조합 핵산.
  185. 청구항 181-184중 임의의 한 항에 있어서, 이때 상기 항원 결합 도메인은 리간드를 포함하는, 재조합 핵산.
  186. 청구항 185에 있어서, 이때 상기 리간드 세포의 수용체에 결합하는, 재조합 핵산.
  187. 청구항 185에 있어서, 이때 상기 리간드 세포는 표면 상에 발현된 폴리펩티드에 결합하는, 재조합 핵산.
  188. 청구항 185에 있어서, 이때 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 스트레스 응답 수용체 또는 폴리펩티드를 포함하는, 재조합 핵산.
  189. 청구항 185에 있어서, 이때 상기 세포의 표면 상에 발현된 수용체 또는 폴리펩티드는 MHC 클래스 I-관련된 당단백질인, 재조합 핵산.
  190. 청구항 189에 있어서, 이때 상기 MHC 클래스 I-관련된 당단백질은 MICA, MICB, RAET1E, RAET1G, ULBP1, ULBP2, ULBP3, ULBP4 및 이의 조합으로 구성된 군에서 선택되는, 재조합 핵산.
  191. 청구항 185에 있어서, 이때 상기 항원 도메인은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체를 포함하는, 재조합 핵산.
  192. 청구항 191에 있어서, 이때 상기 항원 결합 도메인은 상기 리간드 또는 이의 단편의 단량체 또는 이량체를 포함하는, 재조합 핵산.
  193. 청구항 185에 있어서, 이때 상기 리간드 또는 이의 단편은 단량체, 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체, 구량체, 또는 십량체인, 재조합 핵산.
  194. 청구항 193에 있어서, 이때 상기 리간드 또는 이의 단편은 단량체 또는 이량체인, 재조합 핵산.
  195. 청구항 185에 있어서, 이때 상기 항원 결합 도메인은 항체 또는 이의 단편을 포함하지 않는, 재조합 핵산.
  196. 청구항 185에 있어서, 이때 상기 항원 결합 도메인은 가변 영역을 포함하지 않는, 재조합 핵산.
  197. 청구항 185에 있어서, 이때 상기 항원 결합 도메인은 CDR을 포함하지 않는, 재조합 핵산.
  198. 청구항 185에 있어서, 이때 상기 리간드 또는 이의 단편은 Natural Killer Group 2D (NKG2D) 리간드 또는 이의 단편인, 재조합 핵산.
  199. 청구항 118-198중 임의의 한 항에 있어서, 이때 상기 TCR 불변 도메인은 T 세포에서 발현될 때 기능적 TCR 복합체로 통합된, 재조합 핵산.
  200. 청구항 199에 있어서, 이때 상기 TCR 불변 도메인 T 세포 안에서 발현될 때, 상기 TFP를 통합시킨 기능적 TCR 복합체와 동일한 기능적 TCR 복합체로 통합되는, 재조합 핵산.
  201. 청구항 118-200중 임의의 한 항에 있어서, 이때 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 동일한 핵산 분자 안에 내포되는, 재조합 핵산.
  202. 청구항 118-200중 임의의 한 항에 있어서, 이때 상기 TFP 및 상기 TCR 불변 도메인은 제 1 링커 서열에 의해 작동가능하도록 연계된, 재조합 핵산.
  203. 청구항 202에 있어서, 이때 상기 제 1 링커는 프로테아제 절단 부위를 포함하는, 재조합 핵산.
  204. 청구항 203에 있어서, 이때 상기 프로테아제 절단 부위는 2A, 가령, T2A 또는 P2A 절단 부위인, 재조합 핵산.
  205. 청구항 118-200중 임의의 한 항에 있어서, 이때 상기 TFP를 인코딩하는 서열과 상기 TCR 불변 도메인(들)을 인코딩하는 서열은 상이한 핵산 분자 안에 함유된, 재조합 핵산.
  206. 청구항 118-205중 임의의 한 항에 있어서, 이때 상기 TCR 소단위 및 상기 항체 도메인, 상기 항원 결합 도메인 또는 상기 TFP의 결합 리간드 또는 이의 단편 제 2 링커 서열에 의해 작동가능하도록 연계된, 재조합 핵산.
  207. 청구항 206에 있어서, 이때 상기 제 2 링커 서열은 (G4S)n을 포함하고, 이때 n=1 ~ 4인, 재조합 핵산.
  208. 청구항 118-207중 임의의 한 항에 있어서, 이때 상기 막경유 도메인은 TCR 알파 또는 TCR 베타, 가령, 뮤린 TCR 알파 또는 TCR 베타의 TCR 막경유 도메인인, 재조합 핵산.
  209. 청구항 118-207중 임의의 한 항에 있어서, 이때 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 알파 또는 TCR 베타의 TCR 세포내 도메인을 포함하는, 재조합 핵산.
  210. 청구항 118-207중 임의의 한 항에 있어서, 이때 상기 TCR 세포외 도메인은 불변 도메인 TCR 알파 쇄 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 세포외 일부분, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  211. 청구항 118-207중 임의의 한 항에 있어서, 이때 TCR 소단위는 TCR 알파 쇄 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 막경유 도메인, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 막경유 도메인을 포함하는, 재조합 핵산.
  212. 청구항 118-207중 임의의 한 항에 있어서, 이때 상기 TCR 소단위는 TCR 알파 또는 TCR 베타 쇄, 가령, 뮤린 TCR 알파 쇄 또는 TCR 베타 쇄의 TCR 세포내 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열을 포함하는, 재조합 핵산.
  213. 청구항 118-207중 임의의 한 항에 있어서, 이때 상기 TCR 소단위는 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하고, 또는 알파 불변 도메인이거나, 또는 이를 포함하는, 재조합 핵산.
  214. 청구항 213, 이때 상기 알파 불변 도메인은 서열 식별 번호: 17, 서열 식별 번호: 142, 서열 식별 번호: 143, 서열 식별 번호: 146, 또는 서열 식별 번호: 207의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열, 가령, 서열 식별 번호: 146의 아미노산 2-137 서열을 갖는, 재조합 핵산.
  215. 청구항 118-207중 임의의 한 항에 있어서, 이때 (i) TCR 세포외 도메인의 적어도 일부분, (ii) TCR 막경유 도메인, 그리고 (iii) TCR 세포내 도메인을 포함하는 상기 인코드된 TCR은 베타 불변 도메인이거나, 또는 이를 포함하는, 재조합 핵산.
  216. 청구항 215에 있어서, 이때 상기 베타 불변 도메인은 서열 식별 번호: 18, 서열 식별 번호: 148, 서열 식별 번호: 149, 서열 식별 번호: 152, 또는 서열 식별 번호: 209의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열, 가령, 서열 식별 번호: 152의 아미노산 2-173을 갖는, 재조합 핵산.
  217. 청구항 215 또는 216에 있어서, 이때 상기 TCR 소단위의 세포외 도메인은 알파 쇄 또는 베타 쇄의 가변 도메인을 포함하지 않는, 재조합 핵산.
  218. 청구항 1-217중 임의의 한 항에 있어서, 이때 상기 TCR 소단위는 CD3 입실론, CD3 감마 또는 CD3 델타의 세포내 신호생성 도메인, 또는 이에 대하여 적어도 하나의 변형을 갖는 아미노산 서열에서 선택된 단백질의 자극 도메인을 포함하는 TCR 세포내 도메인을 포함하는, 재조합 핵산.
  219. 청구항 218에 있어서, 이때 상기 TFP의 TCR 소단위는 CD3 입실론의 세포외 도메인, 막경유 도메인 그리고 세포내 도메인을 포함하는, 재조합 핵산.
  220. 청구항 218 또는 219에 있어서, 이때 상기 CD3 입실론의 TCR 소단위는 서열 식별 번호: 258의 서열, 이의 기능성 단편들, 또는 적어도 하나의, 그러나 20개를 넘지 않는 변형을 갖는 이의 아미노산 서열을 포함하는, 재조합 핵산.
  221. 청구항 1-220중 임의의 한 항에 있어서, 이때 상기 TFP, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 도메인, 및 이의 임의의 조합은 내생성 TCR 복합체 및/또는 적어도 하나의 내생성 TCR 폴리펩티드와 기능적으로 상호작용할 수 있는, 재조합 핵산.
  222. 청구항 1-221중 임의의 한 항에 있어서, 이때
    (a) 상기 TCR 불변 도메인은 TCR 알파 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되며;
    (b) 상기 TCR 불변 도메인은 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되고; 또는
    (c) 상기 TCR 불변 도메인은 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인이며, 상기 TFP는 CD3 입실론, CD3 감마, CD3 델타, 또는 이의 조합의 내생성 소단위를 포함하는 TCR 복합체에 기능적으로 통합되는, 재조합 핵산.
  223. 청구항 220-222중 임의의 한 항에 있어서, 이때 이때 상기 이에 대하여 적어도 하나, 그러나 20개를 넘지 않는 변형은 세포 신호생성을 중개하는 아미노산의 변형, 또는 상기 TFP에 결합하는 리간드에 반응하여 인산화되는 아미노산의 변형을 포함하는, 재조합 핵산.
  224. 청구항 118 및 120-180중 임의의 한 항에 있어서, 이때 상기 항체는 항체 단편인, 재조합 핵산.
  225. 청구항 224에 있어서, 이때 상기 항체 단편은 scFv, 단일 도메인 항체 도메인, VH 도메인 또는 VL 도메인인, 재조합 핵산.
  226. 청구항 118 및 120-180중 임의의 한 항에 있어서, 이때 항원 결합 도메인은 항-CD19 결합 도메인, 항-B-세포 성숙 항원 (BCMA) 결합 도메인, 항-메소텔린 (MSLN) 결합 도메인, 항-CD20 결합 도메인, 항-CD70 결합 도메인, 항-79b 결합 도메인, 항-HER2 결합 도메인, 항-PMSA 결합 도메인, 항-MUC16 결합 도메인, 항-CD22 결합 도메인, 항-PD-L1 결합 도메인, 항-BAFF 또는 BAFF 수용체 결합 도메인, 항-Nectin-4 결합 도메인, 항-TROP-2 결합 도메인, 항-GPC3 결합 도메인, 및 항-ROR-1 결합 도메인으로 구성된 군에서 선택되는, 재조합 핵산.
  227. 청구항 226에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 60의 CDR1, 서열 식별 번호: 61의 CDR2, 그리고 서열 식별 번호: 62의 CDR3을 포함하는, 재조합 핵산.
  228. 청구항 226에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 63의 CDR1, 서열 식별 번호: 64의 CDR2, 그리고 서열 식별 번호: 65의 CDR3을 포함하는, 재조합 핵산.
  229. 청구항 226에 있어서, 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 66의 CDR1, 서열 식별 번호: 67의 CDR2, 그리고 서열 식별 번호: 68의 CDR3을 포함하는, 재조합 핵산.
  230. 청구항 226에 있어서, 이때 이때 상기 항-MSLN 결합 도메인은 서열 식별 번호: 69, 서열 식별 번호: 70, 또는 서열 식별 번호: 71의 서열에 대해 적어도 약 80% 동일성을 갖는 서열을 포함하는, 재조합 핵산.
  231. 청구항 226에 있어서, 이때 상기 항-CD19 결합 도메인은 서열 식별 번호: 73의 경쇄 CDR1, 서열 식별 번호: 75의 CDR2, 및 서열 식별 번호: 77의 CDR3을 포함하는, 재조합 핵산.
  232. 청구항 226에 있어서, 이때 상기 항-CD19 결합 도메인은 서열 식별 번호: 79의 중쇄 CDR1, 서열 식별 번호: 81의 CDR2, 및 서열 식별 번호: 83의 CDR3을 포함하는, 재조합 핵산.
  233. 청구항 226에 있어서, 이때 상기 항-CD19 결합 도메인은 서열 식별 번호: 85의 서열에 대해 적어도 약 80% 서열 동일을 갖는 경쇄 가변 영역 및/또는 서열 식별 번호: 87의 서열에 대해 적어도 약 80% 서열 동일을 갖는 중쇄 가변 영역을 포함하는, 재조합 핵산.
  234. 전술한 항들중 임의의 한 항에 있어서, 이때 상기 핵산은 DNA 및 RNA로 구성된 군에서 선택되는, 재조합 핵산.
  235. 전술한 항들중 임의의 한 항에 있어서, 이때 상기 핵산은 mRNA인, 재조합 핵산.
  236. 전술한 항들중 임의의 한 항에 있어서, 이때 상기 핵산은 circRNA인, 재조합 핵산.
  237. 전술한 항들중 임의의 한 항에 있어서, 이때 상기 재조합 핵산은 핵산 유사체를 포함하고, 이때 상기 핵산 유사체는 이 재조합 핵산의 인코딩 서열에 존재하지 않는, 재조합 핵산.
  238. 청구항 237에 있어서, 상기 핵 유사체는 다음으로 구성된 군에서 선택되는, 재조합 핵산: 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필, 2'-데옥시, T-데옥시-2'-플로오르, 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), T-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 2'-O-N-메틸아세트아미도 (2'-O-NMA) 변형된, 잠김 핵산 (LNA), 에틸렌 핵산 (ENA), 펩티드 핵산 (PNA), 1',5'-무수헥시톨 핵산 (HNA), 몰포리노, 메틸포스포네이트 뉴클레오티드, 티올포스포네이트 뉴클레오티드, 그리고 2'-플루오르 N3-P5'-포스포라미디트.
  239. 전술한 항들중 임의의 한 항에 있어서, 리더 서열을 더 포함하는, 재조합 핵산.
  240. 전술한 항들중 임의의 한 항에 있어서, 프로모터 서열을 더 포함하는, 재조합 핵산.
  241. 전술한 항들중 임의의 한 항에 있어서, poly(A) 꼬리를 인코딩하는 서열을 더 포함하는, 재조합 핵산.
  242. 전술한 항들중 임의의 한 항에 있어서, 3'UTR 서열을 더 포함하는, 재조합 핵산.
  243. 전술한 항들중 임의의 한 항에 있어서, 이때 상기 핵산은 단리된 핵산 또는 자연 발생적이 아닌 핵산인, 재조합 핵산.
  244. 전술한 항들중 임의의 한 항에 있어서, 이때 상기 핵산은 시험관내 전사된 핵산인, 재조합 핵산.
  245. 전술한 항들중 임의의 한 항에 따른 재조합 핵산을 포함하는 벡터.
  246. 청구항 245에 있어서, 이때 상기 벡터는 DNA, RNA, 플라스미드, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연합된 바이러스성 벡터 (AAV), Rous 육종 바이러스 (RSV) 벡터, 또는 레트로바이러스 벡터로 구성된 군에서 선택된, 벡터.
  247. 청구항 245 또는 246에 있어서, 이때 상기 벡터는 AAV6 벡터인, 벡터.
  248. 청구항 245-247중 임의의 한 항에 있어서, 프로모터를 더 포함하는, 벡터.
  249. 청구항 245-248중 임의의 한 항에 있어서, 이때 상기 벡터는 시험관내 전사된 벡터인, 벡터.
  250. 청구항 1-244, 또는 청구항 245-249중 임의의 한 항에 따른 벡터를 포함하는 변형된 T 세포에 있어서, 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함하는, 변형된 T 세포.
  251. 청구항 1-244중 임의의 한 항에 따른 TFP 핵산을 인코딩하는 서열, 또는 상기 TFP를 인코딩하는 청구항 1-244중 임의의 한 항에 따른 핵산 서열에 의애 인코딩되는 TFP를 포함하는 변형된 T 세포에 있어서, 이때 상기 변형된 T 세포는 내생성 TCR의 기능적 파괴를 포함하는, 변형된 T 세포.
  252. 청구항 1-244중 임의의 한 항에 따른 TFP를 인코딩하는 서열, 또는 TFP를 인코딩하는 청구항 1-244중 임의의 한 항에 따른 핵산의 서열에 의해 인코드된 TFP를 포함하는 변형된 동종이계(allogenic) T 세포.
  253. 청구항 250-252중 임의의 한 항에 있어서, 이때 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성 서열을 더 포함하며, 이때 상기 TCR 불변 도메인은 TCR 감마 불변 도메인, TCR 델타 불변 도메인 또는 TCR 감마 불변 도메인과 TCR 델타 불변 도메인인, 변형된 T 세포.
  254. 청구항 250-253중 임의의 한 항에 있어서, 이때 상기 T 세포는 TCR 불변 도메인을 인코드하는 이종성 서열을 더 포함하고, 이때 상기 TCR 불변 도메인은 TCR 알파 불변 도메인, TCR 베타 불변 도메인 또는 TCR 알파 불변 도메인 및 TCR 베타 불변 도메인인, 변형된 T 세포.
  255. 청구항 254에 있어서, 이때 상기 TCR 불변 도메인, 가령, 상기 TCR 알파 불변 도메인, 상기 TCR 베타 불변 도메인 또는 상기 TCR 알파 불변 도메인 및 상기 TCR 베타 불변 도메인은 뮤린 TCR 불변 도메인, 가령, 뮤린 TCR 알파 불변 도메인, 뮤린 TCR 베타 불변 도메인 또는 뮤린 TCR 알파 불변 도메인 및 뮤린 TCR 베타 불변 도메인인, 변형된 T 세포.
  256. 청구항 250-255중 임의의 한 항에 있어서, 이때 기능적으로 파괴된 내생성 TCR은 내생성 TCR 알파 쇄, 내생성 TCR 베타 쇄, 또는 내생성 TCR 알파 쇄 및 내생성 TCR 베타 쇄인, 변형된 T 세포.
  257. 청구항 250-256중 임의의 한 항에 있어서, 이때 상기 기능적으로 파괴된 내생성 TCR은 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소된, 변형된 T 세포.
  258. 청구항 250-257중 임의의 한 항에 있어서, 이때 상기 기능적 파괴란 상기 내생성 TCR을 인코드하는 유전자의 파괴인, 변형된 T 세포.
  259. 청구항 258에 있어서, 이때 상기 내생성 TCR을 인코드하는 유전자의 파괴는 상기 내생성 TCR을 인코드하는 유전자 서열을 이 T 세포의 게놈으로부터 제거인, 변형된 T 세포.
  260. 청구항 250-259중 임의의 한 항에 있어서, 이때 상기 T 세포는 CD4 세포들, CD8 세포들, 나이브 T-세포들, 기억 줄기 T-세포들, 중추 기억 T-세포들, 이중 음성 T-세포들, 작동체 기억 T-세포들, 작동체 T-세포들, ThO 세포들, TcO 세포들, Th1 세포들, Tc1 세포들, Th2 세포들, Tc2 세포들, Th17 세포들, Th22 세포들, 알파/베타 T 세포들, 감마/델타 T 세포들, 천연 킬러 (NK) 세포들, 천연 킬러 T (NKT) 세포들, 조혈 줄기 세포들 및 다능성 줄기 세포들로부터 선택된 인간 T 세포인, 변형된 T 세포.
  261. 청구항 250-260중 임의의 한 항에 있어서, 이때 상기 T 세포는 CD8+ 또는 CD4+ T 세포인, 변형된 T 세포.
  262. 청구항 250-261중 임의의 한 항에 있어서, 이때 상기 T 세포는 동종이계 T 세포인, 변형된 T 세포.
  263. 청구항 250-262중 임의의 한 항에 있어서, 세포내 신호생성 도메인의 양성 신호를 포함하는 제 2 폴리펩티드와 연합된, 저해성 분자의 적어도 일부분을 포함하는 제 1 폴리펩티드를 포함하는 저해성 분자를 인코드하는 핵산을 더 포함하는, 변형된 T 세포.
  264. 청구항 263에 있어서, 이때 상기 저해성 분자는 PD1의 적어도 일부분을 포함하는 제 1 폴리펩티드와 공동자극 도메인과 일차 신호생성 도메인을 포함하는 제 2 폴리펩티드를 포함하는, 변형된 T 세포.
  265. 다음을 포함하는 약제학적 조성물:
    (a) 청구항 250-264중 임의의 한 항에 따른 변형된 T 세포; 그리고
    (b) 약제학적으로 수용가능한 담체.
  266. 청구항 250-264중 임의의 한 항에 따른 변형된 T 세포를 만드는 방법에 있어서, 이 방법은 다음을 포함하는 방법:
    (a) TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코딩하는 내생성 TCR 유전자를 파괴하고, 이로 인하여 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포가 만들어지며; 그리고
    (b) 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포에 청구항 1-244중 임의의 한 항에 따른 재조합 핵산, 또는 청구항 245-249중 임의의 한 항에 따른 벡터를 형질도입시킨다.
  267. 청구항 266에 있어서, 이때 파괴는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 유전자를 표적으로 하는 뉴클레아제 단백질 또는 뉴클레아제 단백질을 인코딩하는 핵산 서열로 상기 T 세포를 형질도입시키는 것을 포함하는, 방법.
  268. 청구항 250-264중 임의의 한 항에 따른 변형된 T 세포를 만드는 방법에 있어서, 상기 방법은 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포에 청구항 청구항 1-244중 임의의 한 항에 따른 재조합 핵산, 또는 청구항 245-249중 임의의 한 항에 따른 벡터를 형질도입시키는 것을 포함하는, 방법.
  269. 청구항 268에 있어서, 이때 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포는 TCR 알파 쇄, TCR 베타 쇄, 또는 TCR 알파 쇄와 TCR 베타 쇄를 인코드하는 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포인, 방법.
  270. 청구항 266-269중 임의의 한 항에 있어서, 이때 상기 T 세포는 인간 T 세포인, 방법.
  271. 청구항 266-270중 임의의 한 항에 있어서, 이때 상기 내생성 TCR 유전자의 기능적 파괴를 내포하는 T 세포는 변형안된 대조군 T 세포의 것과 비교하여, MHC-펩티드 복합체에 대한 결합이 감소되는, 방법.
  272. 청구항 267-271중 임의의 한 항에 있어서, 이때 상기 뉴클레아제는 메가뉴클레아제, 아연-핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 작동체 뉴클레아제 (TALEN), CRISPR/Cas 뉴클레아제, 또는 megaTAL 뉴클레아제인, 방법.
  273. 청구항 266-272중 임의의 한 항에 있어서, 이때 상기 재조합 핵산 또는 상기 벡터에 포함된 서열은 내생성 TCR 소단위 유전자의 절단 부위로 삽입되고, 그리고 이때 이 내생성 TCR 소단위 유전자로 이러한 서열의 삽입으로 인하여 당해 내생성 TCR 소단위는 기능적으로 파괴되는, 방법.
  274. 청구항 267-271중 임의의 한 항에 있어서, 이때 상기 뉴클레아제는 메가뉴클레아제인, 방법.
  275. 청구항 274에 있어서, 이때 상기 메가뉴클레아제는 제 1 소단위와 제 2 소단위를 포함하는데, 이때 상기 제 1 소단위는 인지 서열의 제 1 인지 절반-부위에 결합하고, 그리고 상기 제 2 소단위는 당해 인지 서열의 제 2 인지 절반-부위에 결합하는, 방법.
  276. 청구항 275에 있어서, 이때 상기 메가뉴클레아제는 링커를 포함하는 단일-쇄 메가뉴클레아제이며, 이때 상기 링커는 상기 제 1 소단위와 제 2 소단위를 공유적으로 연결하는, 방법.
  277. 치료를 요하는 대상체의 암을 치료하는 방법에 있어서, 상기 방법은 당해 대상체에게 청구항 265에 따른 약제학적 조성물의 치료요법적으로 유효량을 투여하는 것을 포함하는, 방법.
  278. 치료를 요하는 대상체의 암을 치료하는 방법에 있어서, 상기 방법은 당해 대상체에게 (a) 청구항 266-276중 임의의 한 항에 따른 방법에 의해 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물을 투여하는 것을 포함하는, 방법.
  279. 치료를 요하는 대상체의 암을 치료하는 방법에 있어서, 상기 방법은 당해 대상체에게 (a) 청구항 266-276중 임의의 한 항에 따른 방법에 의해 만들어진 변형된 T 세포; 그리고 (b) 약제학적으로 수용가능한 운반체를 포함하는 약제학적 조성물을 투여하는 것을 포함하는, 방법.
  280. 청구항 277-279중 임의의 한 항에 있어서, 이때 상기 변형된 T 세포는 동종이계 T 세포인, 방법.
  281. 청구항 277-280중 임의의 한 항에 있어서, 이때 변형안된 대조군 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출되는, 방법.
  282. 청구항 277-281중 임의의 한 항에 있어서, 이때 청구항 1-244중 임의의 한 항에 따른 재조합 핵산, 또는 청구항 245-249중 임의의 한 항에 따른 벡터를 포함하는 변형된 T 세포의 효과량이 투여된 대상체와 비교하였을 때, 이 대상체에서 사이토킨 방출이 더 적은, 방법.
  283. 청구항 277-282중 임의의 한 항에 있어서, 이때 상기 방법은 상기 약제학적 조성물의 효과를 증가시키는 제제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함하는, 방법.
  284. 청구항 277-283중 임의의 한 항에 있어서, 이때 상기 방법은 상기 약제학적 조성물와 연합된 하나 또는 그 이상의 부작용을 경감시키는 제제와 조합하여, 당해 약제학적 조성물을 투여하는 것을 포함하는, 방법.
  285. 청구항 277-284중 임의의 한 항에 있어서, 이때 상기 암은 고형 암, 림프종 또는 백혈병인, 방법.
  286. 청구항 277-285중 임의의 한 항에 있어서, 이때 상기 암은 신장 세포 암종, 유방암, 폐암, 난소암, 전립선암, 결장암, 자궁경부암, 뇌암, 간암, 췌장암, 콩팥 및 위암으로 구성된 군에서 선택되는, 방법.
  287. 청구항 277-286중 임의의 한 항에 있어서, 이때 청구항 1-244에 따른 TFP를 발현시키는 자가 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 사이토킨이 덜 방출되는, 방법.
  288. 청구항 277-287중 임의의 한 항에 있어서, 이때 상기 방법은 이식편 대 숙주 질환을 유도하지 않는, 방법.
  289. 청구항 277-288중 임의의 한 항에 있어서, 이때 청구항 1-244의 TFP를 발현시키는 자가 T 세포의 효과량을 투여받은 대상체와 비교하였을 때, 당해 대상체에서 이식편 대 숙주 질환이 발생될 위험이 감소되는, 방법.
  290. 약물로써 또는 약물 제조에 사용하는 용도로써 청구항 1-244중 임의의 한 항에 따른 재조합 핵산, 청구항 245-249중 임의의 한 항에 따른 벡터, 청구항250-264중 임의의 한 항에 따른 변형된 T 세포, 또는 청구항 265중 임의의 한 항에 따른 약제학적 조성물.
KR1020227012166A 2019-09-12 2020-09-11 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들 KR20220078607A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962899563P 2019-09-12 2019-09-12
US62/899,563 2019-09-12
US202062971682P 2020-02-07 2020-02-07
US62/971,682 2020-02-07
PCT/US2020/050503 WO2021050948A1 (en) 2019-09-12 2020-09-11 Compositions and methods for tcr reprogramming using fusion proteins

Publications (1)

Publication Number Publication Date
KR20220078607A true KR20220078607A (ko) 2022-06-10

Family

ID=74866684

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227012166A KR20220078607A (ko) 2019-09-12 2020-09-11 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들

Country Status (10)

Country Link
EP (1) EP4028033A4 (ko)
JP (1) JP2022548866A (ko)
KR (1) KR20220078607A (ko)
CN (1) CN114828862A (ko)
AU (1) AU2020344628A1 (ko)
BR (1) BR112022004458A2 (ko)
CA (1) CA3154287A1 (ko)
IL (1) IL291236A (ko)
MX (1) MX2022002984A (ko)
WO (1) WO2021050948A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023091420A2 (en) * 2021-11-16 2023-05-25 TCR2 Therapeutics Inc. Compositions and methods for t cell engineering
WO2023133296A2 (en) * 2022-01-07 2023-07-13 Sorrento Therapeutics, Inc. Engineered pd-l1-targeting gamma delta t cell receptors
WO2024039576A2 (en) * 2022-08-19 2024-02-22 Memorial Sloan-Kettering Cancer Center T cell receptors targeting ras mutations and uses thereof

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9181527B2 (en) * 2009-10-29 2015-11-10 The Trustees Of Dartmouth College T cell receptor-deficient T cell compositions
ES2691475T3 (es) * 2011-10-28 2018-11-27 Regeneron Pharmaceuticals, Inc. Ratones modificados genéticamente, receptores de linfocitos T
AU2016342041B2 (en) * 2015-10-23 2021-12-02 Eureka Therapeutics, Inc. Antibody/T-cell receptor chimeric constructs and uses thereof
GB201604494D0 (en) * 2016-03-16 2016-04-27 Immatics Biotechnologies Gmbh Transfected T-Cells and T-Cell receptors for use in immunotherapy against cancers
PL3445787T3 (pl) * 2016-10-07 2021-05-31 TCR2 Therapeutics Inc. Kompozycje i sposoby reprogramowania receptorów limfocytów t przy użyciu białek fuzyjnych
CA3044593A1 (en) * 2016-11-22 2018-05-31 TCR2 Therapeutics Inc. Compositions and methods for tcr reprogramming using fusion proteins
JP2020513754A (ja) * 2016-12-21 2020-05-21 ティーシーアール2 セラピューティクス インク. がん治療用に操作されたt細胞
US20210079057A1 (en) * 2017-06-13 2021-03-18 TCR2 Therapeutics Inc. Compositions and methods for tcr reprogramming using fusion proteins
WO2019118508A1 (en) * 2017-12-12 2019-06-20 The Trustees Of The University Of Pennsylvania Genetically modified immune cells targeting ny-eso-1 and methods of use thereof
WO2019133443A1 (en) * 2017-12-28 2019-07-04 Janux Therapeutics, Inc. Modified t cell receptors
WO2019173693A1 (en) * 2018-03-09 2019-09-12 TCR2 Therapeutics Inc. Compositions and methods for tcr reprogramming using fusion proteins

Also Published As

Publication number Publication date
AU2020344628A1 (en) 2022-04-07
WO2021050948A1 (en) 2021-03-18
JP2022548866A (ja) 2022-11-22
EP4028033A4 (en) 2023-10-04
IL291236A (en) 2022-05-01
EP4028033A1 (en) 2022-07-20
MX2022002984A (es) 2022-06-16
CA3154287A1 (en) 2021-03-18
CN114828862A (zh) 2022-07-29
BR112022004458A2 (pt) 2022-05-31

Similar Documents

Publication Publication Date Title
AU2019203955B2 (en) Multipartite signaling proteins and uses thereof
AU2020260485B2 (en) Gene therapies for lysosomal disorders
ES2819976T3 (es) Composiciones y usos médicos para la reprogramación de TCR con proteínas de fusión
US10704061B2 (en) Lentiviral vectors
RU2758489C2 (ru) Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий
RU2650860C2 (ru) Векторы для экспрессии простатоассоциированных антигенов
KR20220078607A (ko) 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
KR20230010231A (ko) 생체내 형질도입을 위한 벡터 및 방법
KR20240037185A (ko) 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
TW202233830A (zh) 使用下一代工程化t細胞療法治療癌症之組合物及方法
KR20230117327A (ko) 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법
WO2024062259A1 (en) Retroviral vector comprising rre inserted within an intron
CN115803440A (zh) 用于蛋白质制造的核酸构建体