KR20160135738A - 폴리펩티드를 발현하는 숙주 세포의 선택을 위한 발현 구조물 및 방법 - Google Patents

폴리펩티드를 발현하는 숙주 세포의 선택을 위한 발현 구조물 및 방법 Download PDF

Info

Publication number
KR20160135738A
KR20160135738A KR1020167026968A KR20167026968A KR20160135738A KR 20160135738 A KR20160135738 A KR 20160135738A KR 1020167026968 A KR1020167026968 A KR 1020167026968A KR 20167026968 A KR20167026968 A KR 20167026968A KR 20160135738 A KR20160135738 A KR 20160135738A
Authority
KR
South Korea
Prior art keywords
seq
expression
human
membrane
pglex41
Prior art date
Application number
KR1020167026968A
Other languages
English (en)
Inventor
크리스텔 애비셔-구미
피에르 모레티
마틴 베르트싱거
Original Assignee
그렌마크 파머수티칼스 에스. 아.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그렌마크 파머수티칼스 에스. 아. filed Critical 그렌마크 파머수티칼스 에스. 아.
Publication of KR20160135738A publication Critical patent/KR20160135738A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 선택적 스플라이스를 사용하는, 숙주 세포에서 폴리펩티드의 가용성 발현 및 숙주 세포의 표면상에 폴리펩티드의 발현을 위한 발현 구조물에 관한 것이다. 폴리펩티드, 예를 들어 항체, 항체 단편 및 이중특이성 항체의 세포막 발현의 양을 발현된 가용성 폴리펩티드의 양에 직접적으로 상관시킬 수 있다. 이중특이성 항체의 경우에, 이종이량체 및 동종이량체 생성물의 세포막 발현을 이들 생성물의 가용성 발현에 직접적으로 상관시킬 수 있으며, 이에 의해 목적하는 생산자 클론의 선택을 도울 수 있다.

Description

폴리펩티드를 발현하는 숙주 세포의 선택을 위한 발현 구조물 및 방법{EXPRESSION CONSTRUCTS AND METHODS FOR SELECTING HOST CELLS EXPRESSING POLYPEPTIDES}
본 발명은 선택적 스플라이스(alternate splicing)를 사용하여 진핵생물 세포의 표면상에 분비된 관심 단백질의 분획을 발현하기 위한 발현 구조물 및 방법에 관한 것이다. 본 발명은 또한 분비된 관심 단백질의 막 발현 수준을 검출함으로써 상기 관심 단백질을 목적하는 수준으로 발현하는 세포(들)를 선택하는 방법에 관한 것이다. 본 발명은 추가로, 분비된 이종다량체성 관심 단백질의 막 발현 수준의 검출에 의한 상기 이종다량체성 관심 단백질을 발현하는 세포(들)의 선택에 관한 것이다.
진핵생물 세포 중에 단백질을 생성시키기 위해서, 상기 단백질을 암호화하는 DNA를 전령 RNA(mRNA)에 전사시켜야 하며, 상기 RNA는 차례로 단백질로 번역될 것이다. 상기 mRNA는 처음에 인트론 및 엑손을 함유하는 pre-mRNA로서 핵 중에 전사된다. 상기 pre-mRNA의 성숙 mRNA로의 성숙화 동안, 상기 인트론은 스플라이스 복합체 (splicesome)라 칭하는 세포 기구에 의해 컷아웃된다("스플라이싱 된다"). 엑손들이 함께 융합되고 상기 mRNA는 5' 단부에서 소위 CAP 및 3' 단부에서 폴리아데닐화(폴리(A)) 꼬리의 첨가에 의해 변형된다. 상기 성숙 mRNA는 세포질로 유출되어 (exported) 단백질의 번역을 위한 주형으로서 작용한다.
선택적 스플라이스는, 동일한 전사물을 상이한 방식들로 스플라이싱되어 상이한 성숙 mRNA 및 일부의 경우 상이한 단백질을 유도할 수 있음을 기술하는 용어이다. 상기 기전은 사실상 단백질의 발현 수준을 변화시키거나 또는 발생 중 몇몇 단백질의 활성을 변형시키기 위해 사용된다(Cooper TA & Ordahl CP (1985), J Biol Chem, 260(20): 11140-8). 선택적 스플라이스는 대개 다수 인자들의 복잡한 상호작용에 의해 조절된다(Orengo JP et al., (2006) Nucleic Acids Res, 34(22): e148).
선택적 스플라이스는 동일한 DNA 주형으로부터 2개(또는 그 이상)의 상이한 RNA 전사물의 생성을 가능하게 한다. 이를 사용하여 동일한 단백질 또는 폴리펩티드의 2개(또는 그 이상)의 동형을 생성시킬 수 있다. 본 명세서 전체를 통해서 단백질 및 폴리펩티드란 용어는 호화적으로 사용될 것이다.
사실상, 상기는 예를 들어 인간 면역계에서 활성화된 B 세포에 의한 항체 생성 과정 중에 사용되는 고도로 조절되는 과정이다. 상기 항체의 대부분은 세포외 공간내로 분비되나, 상기 생성된 항체의 일부 소량은 막 결합된 동형의 형태로 상기 분비 경로로부터 다시 외부 세포막으로 향한다.
상기 막 결합된 동형은 상기 세포외 공간내로 분비된 항체와 동일한 아미노산 서열 및 구조를 갖는다. 차이는 막관통 도메인을 포함하는 막관통 영역을 갖는 상기 분비된 항체 중쇄의 C-말단 연장부이다. B 세포에서 상기 도메인은 대략 40 내지 75 아미노산의 길이를 가질 수 있다(Major JG et al., (1996) Mol. Immunol. 33: 179-87).
재조합 폴리펩티드의 생성을 위한 발현 시스템은 당해 분야에 주지되어 있다. 약학 제제에 사용되는 폴리펩티드 및 단백질의 생성을 위해서 CHO, BHK, NS0, Sp2/0, COS, HEK 및 PER.C6과 같은 포유동물 숙주 세포가 일반적으로 사용된다. 치료학적 단백질의 대규모 생산을 위해서, 고 생산자 세포주가 생성되어야 한다. 관심 폴리펩티드를 암호화하는 유전자에 의한 상기 숙주 세포주의 형질감염 후에, 상이한 특성들을 갖는 다수의 클론이 획득되고 선택된다. 이는 예를 들어 선택성 마커, 유전자 증폭 및/또는 리포터 분자를 사용하여 통상적으로 수행된다. 목적하는 성질을 갖는 적합한 클론, 예를 들어 고 생산자 클론의 선택은 시간 소모적이고, 종종 통상적이지 않으며 따라서 비용이 많이 드는 과정이다.
이종다량체성 단백질, 예를 들어 이중특이성 항체의 발현을 위해서, 적합한 숙주 세포주의 생성은 훨씬 더 복잡해 진다. 상기 다량체를 구성하는 단백질 서브유닛들을 별도의 세포주에서 발현시키고 이어서 다량체성 단백질로 함께 결합시키거나 또는 한편으로 상기 상이한 서브유닛들을 동일한 세포주에서 발현시킬 수 있다. 동일한 세포주에서 상기 서브유닛들의 발현은, 모든 단백질 서브유닛이 정확한 형태로 결합하지는 않고, 그 결과 상이한 종들의 혼합물이 생성된다는 단점과 관련된다. 이중특이성 항체 생성의 경우 목적하는 이종이량체보다는 상당한 수준의 동종이량체가 생성되는 것이 통상적이며 이는 이중특이성 항체 생성 수율에 큰 영향을 미친다. 불필요한 동종이량체를 다양한 정제 기법에 의해 제거할 수 있지만, 이종이량체를 동종이량체보다 더 높은 수준으로 발현하여 하류 가공시 낭비되는 시간과 비용을 줄이는 숙주 세포주를 갖는 것이 바람직할 수 있다.
따라서 관심 생성물을 높은 수준, 즉 정량적 선택으로 발현하는 세포 클론(들)을 선택하는데 사용될 수 있는 발현 시스템이 필요하다. 또한 목적하는 성질, 즉 정성적 선택, 예를 들어 이종다량체성 관심 단백질을 발현하는 세포 클론(들)을 선택할 수 있을 필요가 있다.
본 발명은 가용성 관심 폴리펩티드의 선택적 스플라이스에 의한 발현을 위한 발현 구조물 또는 구조물 세트에 관한 것이며, 여기에서 상기 가용성 펩티드의 일부는 세포외 공간내로 분비되고 일부는 세포(들)의 외막상에 디스플레이된다.
본 발명은 또한 외막상에 관심 폴리펩티드를 목적하는 수준으로 디스플레이하는, 본 발명에 따른 하나 이상의 구조물을 포함하는 숙주 세포의 선택 방법을 포함한다.
본 발명은 또한 본 발명에 따른 하나 이상의 구조물을 포함하는 세포(들) 상의 분비된 이종이량체성 관심 단백질의 막 디스플레이를 검출함으로써 상기 이종이량체성 관심 단백질을 발현하는 세포(들)를 선택함에 관한 것이다.
첫 번째 태양에서, 본 발명은 5'에서 3' 방향으로
프로모터;
관심 폴리펩티드를 암호화하는 제1 엑손;
스플라이스 공여 부위 (splice donor site), 인트론 및 스플라이스 수용 부위(여기에서 제1 정지 코돈이 상기 인트론 내의 스플라이스 공여 부위와 스플라이스 수용 부위 사이에 위치한다);
변형된 면역글로불린 막관통 영역 또는 비-면역글로불린 막관통 영역인 막관통 영역을 암호화하는 제2 엑손;
제2 정지 코돈; 및
폴리아데닐화 부위
를 포함하는 발현 구조물을 제공하며, 여기에서 숙주 세포에 진입시 상기 제1 및 제2 엑손의 전사는 상기 숙주 세포의 외막상에 상기 관심 폴리펩티드의 발현 및 상기 관심 폴리펩티드의 일부의 디스플레이를 생성시킨다.
본 발명의 또 다른 태양에 따라 상기 구조물의 제2 엑손에 의해 암호화된 막관통 영역은 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개 아미노산 잔기를 포함한다.
본 발명의 또 다른 태양에 따라 상기 구조물의 제2 엑손에 의해 암호화된 막관통 영역은 48, 47, 46, 45, 44, 43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26개 이하의 아미노산 잔기를 포함한다.
특히 상기 막관통 영역은 17 내지 29개 잔기, 19 내지 26개 잔기 또는 21 내지 24개 잔기를 포함할 수 있다.
본 발명에 따라, 상기 변형된 면역글로불린 막관통 영역 또는 변형된 비-면역글로불린 막관통 영역은 천연 면역글로불린 또는 비-면역글로불린 막관통 영역의 임의의 변형된 버전일 수 있다.
발명자들은 다양한 막관통 영역의 그룹들을, 그들의 성질을 변경시키고 특히 그들의 세포막에의 통합 및 따라서 상기 관심 폴리펩티드의 디스플레이를 조절하기 위해서 변형시켰다. 특히 상기 막관통 영역의 아미노산 조성을 하나 이상의 잔기에 의해 상기 영역 중의 비-소수성 잔기의 수를 감소 또는 증가시킬뿐만 아니라 상기 막관통 영역의 크기를 증가 또는 감소시키기 위해 변형시킬 수 있다.
본 발명의 발명자들은 놀랍게도 비-면역글로불린 막관통 영역, 예를 들어 쥐 B7-1 막관통 영역(서열번호 173)의 사용이 IgG1 막관통 영역을 사용할 때 관찰되는 수준에 비해 높은 수준의 세포막 발현을 유도함을 발견하였다.
발명자들은 또한 ACLV1 (NP_001070869.1) 서열번호 174, ANTR2 (NP_477520.2) 서열번호 175, CD4 (NP_000607.1) 서열번호 176, PTPRM (NP_002836.3) 서열번호 177, TNR5 (NP_001241.1) 서열번호 178, ITB1 (NP_596867.1) 서열번호 179, IGF1R (NP_000866.1) 서열번호 181, 1B07 (NP_005505.2) 서열번호 180, TRMB (NP_000352.1) 서열번호 182, IL4RA (NP_000409.1) 서열번호 183, LRP6 (NP_002327.2) 서열번호 184, GpA (NP_002090) 서열번호 185, PTCRA (NP_001230097.1) 서열번호 186으로부터의 다른 막관통 영역들뿐만 아니라 이들 막관통 영역의 변형된 버전을 시험하였으며 이들은 본 발명에 따른 구조물(들)에 사용하기에 적합함을 입증하였다.
본 발명의 또 다른 태양에 따라, 상기 제1 정지 코돈은 상기 인트론의 스플라이스 공여 부위의 3'에 위치한다.
하나의 실시태양에서 본 발명은 또한 충분량의 폴리펩티드가 세포막 상에 디스플레이되어(상기 폴리펩티드의 대부분은 용해 가능하게 발현되지만) 세포 선택이 가능하도록, 주어진 구조물에 대해 관찰된 스플라이스 비를 변경시키는 방법을 제공한다.
발명자들은 특허청구된 발현 구조물의 상이한 성분들이 관심 단백질의 막 디스플레이의 조절을 허용하는 지를 시험하였다.
본 발명에 따라, 가용성 폴리펩티드 발현의 수준을, 폴리(A) 부위를 본 명세서에 개시된 바와 같은 발현 구조물의 인트론에 포함시킴으로써 증가시킬 수 있다.
본 발명의 하나의 태양에 따라, 상기 구조물은 프로모터와 제1 엑손 사이에 위치한 구성 인트론 (constitutive intron)을 포함할 수 있다.
본 발명에 따라 상기 스플라이스 수용체 및 스플라이스 공여체의 강도를 세포막상에 디스플레이된 관심 단백질의 양을 증가시키거나 감소시키기 위해서 조절할 수도 있다.
특히 상기 스플라이스 공여 부위의 컨센서스 서열 (consensus sequence)을, 컨센서스 스플라이스 공여 부위 서열 (C/A)AGGT(A/G)AGT (서열번호 345)에 대한 상기 구조물 중에 존재하는 스플라이스 공여 부위의 서열의 일치성 또는 유사성 (%)를 감소시키거나 증가시킴으로써 조절할 수 있다.
추가의 실시태양에서, 상기 스플라이스 공여 부위의 컨센서스 서열을 상기 스플라이스 공여체 강도를 감소시키기 위해서 변형시킨다. 상기 스플라이스 공여 부위의 컨센서스 서열을 선택적 코돈 용법에 의해, 예를 들어 리신을 암호화하는 AAA를 리신을 암호화하는 AAG로 치환시킴으로써 변형시킬 수 있다. 이는 막 발현 수준을 감소시킬 것이다. 역으로 상기 컨센서스 스플라이스 공여 부위 서열 (C/A)AGGT(A/G)AGT (서열번호 345)에 대한 상기 스플라이스 공여 부위의 일치성 또는 유사성 (%)를 증가시킴으로써, 상기 구조물 중의 스플라이스 공여 부위의 강도가 증가되고 막 발현의 수준이 증가될 것이다.
본 발명의 하나의 태양에 따라, 상기 스플라이스 공여 부위는 상기 제1 엑손의 3' 단부 및 상기 인트론의 5' 단부와 중첩되고 상기 인트론의 스플라이스 수용 부위는 상기 인트론의 3' 단부에 위치한다.
본 발명의 하나의 태양에 따라, 상기 제1 정지 코돈은 상기 스플라이스 공여 부위의 3'에 위치한다.
상기 발현 구조물의 인트론에 따라 상기 스플라이스 수용 부위 중에 포함된 폴리(Y) 트랙을 임의로 포함한다. 상기 발현 구조물의 인트론의 스플라이스 수용 부위 중에 포함된 폴리(Y) 트랙의 Y 함량을 변형시킬 수 있다. 상기 폴리(Y) 트랙 중의 피리미딘 염기(Y) 수의 변형을 사용하여 상기 관심 폴리펩티드의 세포막 발현을 증가시키거나 감소시킬 수 있다. 상기 세포에 의해 높은 수준의 막 발현을 갖는 관심 폴리펩타이드의 경우, 상기 폴리(Y) 트랙 중의 Y 수의 감소는 막 발현의 수준을 감소시킬 것이다. 상기 세포에 의한 낮은 수준의 막 발현을 갖는 폴리펩티드의 경우, 상기 폴리(Y) 트랙 중의 Y 수의 증가는 막 발현의 수준을 증가시킬 것이다.
특히 상기 스플라이스 수용 부위의 강도를 감소시키기 위해서 상기 스플라이스 수용 부위의 폴리(Y) 함량을 변경시킴으로써 상기 스플라이스 수용체의 폴리(Y) 함량을 감소시켜 상기 관심 폴리펩티드의 막 디스플레이를 감소시킬 수 있다.
한편으로, 상기 스플라이스 수용 부위의 강도를 증가시키기 위해서 상기 스플라이스 수용 부위의 폴리(Y) 함량을 변경시킴으로써 상기 스플라이스 수용체의 폴리(Y) 함량을 증가시켜 상기 관심 폴리펩티드의 막 디스플레이를 증가시킬 수 있다.
상기 개략된 변형 외에, 막 디스플레이된 폴리펩티드를 유도하는 선택적 스플라이스 사건이 또한, 분지점 영역의 DNA(및 따라서 RNA) 서열의 변형에 의해 영향을 받을 수 있다. 상기 분지점 영역의 뉴클레오티드는 5' 스플라이스 부위에서 상기 인트론의 제1 뉴클레오티드를 공격하고, 따라서 래리어트(lariat) 중간체를 형성함으로써 상기 스플라이스 사건을 개시시킨다. 컨센서스 서열 (CTRAYY 서열번호 347)에 대해 상기 분지점 영역의 서열을 변화시켜 상기 스플라이스 사건의 개시 효능 및 따라서 분비된 폴리펩티드 대 막 디스플레이 폴리펩티드의 비에 영향을 미칠 수 있다.
더욱이, 상기 인트론의 길이가 스플라이스 비에 영향을 미칠 수 있다. CD44 중에 선택적 엑손이 포함될 가능성은 상기 엑손의 바로 상류의 인트론이 단축될 때 증가하는 것으로 입증되었다(Bell, M. , Cowper, A., Lefranc, M., Bell, J. and Screaton, G. (1998). Influence of Intron Length on Alternative Splicing of CD44 Mol Cell Biol. 18(10): 5930-5941). 따라서 상기 구조물을 변형시키는 추가의 수단은 상기 막 디스플레이 폴리펩티드의 분획을 증가시키기 위해서 상기 선택적 스플라이스 구조물 중의 인트론의 길이를 단축시키거나 또는 이와 역으로 하는 것이다.
상기 스플라이스 사건에 영향을 미치는 추가의 기전은 엑손 포함 또는 스키핑(skipping)을 유도하는 RNA-결합 단백질의 동시-발현이다. 예를 들어 단백질 CUG-BP(유니프롯(Uniprot) Acc.-No.: Q5F3T7) 및 머슬-블라인드형 3(MBNL)(유니프롯 Acc.-No.: Q5ZKW9)은 EGFP 및 dsRED를 발현하는 구조물 중의 스플라이스 비에 영향을 미치는 것으로 나타났다(Orengo et al., 2006).
따라서 본 발명은 또한 엑손 포함 또는 스키핑을 야기하는 RNA-결합 단백질을 암호화하는 발현 가능한 ORF를 포함하는 추가의 변형된 구조물을 제공한다. 본 발명에 따른 구조물들의 동시-형질감염을 수반하는 방법뿐만 아니라 엑손 포함 또는 스키핑을 야기하는 RNA-결합 단백질을 암호화하는 발현 가능한 ORF 및/또는 상기와 같은 ORF를 포함하는 별도의 구조물을 포함한다.
또한 대부분의 막 단백질은 세포 표면에 도달하기 전에 소포체(ER) 및 골지체를 거친다. 상기 ER로부터의 유출은 ER 출구의 부위로부터 발아하는 코트머 복합체 II(COPII) 수송 소낭에 의해 매개되는 선택적 과정이다. 상기 COPII 수송 소낭의 성분들과 막-고정된 단백질의 세포질 도메인 중의 선형 이-산, 소수성 및 방향족 동기 또는 구조 동기를 갖는 짧은 아미노산 서열간의 상호작용은 ER 출구 부위에서 수송 단백질을 농축시키고 COPII 소낭내로의 수송 단백질 보충을 증대시킨다. 이러한 짧은 선형 또는 구조 아미노산 서열 동기를 ER 유출 신호라 칭한다.
따라서 관심 단백질의 막 디스플레이를 조절하기 위한 또 다른 접근법은 막관통 영역과 융합된 관심 폴리펩티드의 ER 통과를 조절하기 위해서 ER 유출 신호를 포함시키거나 포함시키지 않는 것이다. ER 유출을 증가시키기 위한 상기 구조물 내에 포함된 ER 유출 신호의 변형은 낮은 반감기 또는 다른 안정성 또는 분해 문제를 갖는 단백질의 막 디스플레이를 증가시키는데 유용하다.
본 발명의 발명자들은 세포막 상에 디스플레이된 관심 폴리펩티드의 양이 가용성 폴리펩티드의 발현 수준에 직접적으로 비례함을 발견하였다. 따라서 높은 역가로 상기 관심 폴리펩티드를 발현하는 숙주 세포는 낮은 역가로 상기 폴리펩티드를 발현하는 숙주 세포보다 상기 막상에 더 많은 폴리펩티드를 디스플레이한다. 이는 고 생산성 재조합 숙주 세포의 간단한 식별 및 단리를 가능하게 한다.
본 발명의 하나의 태양에서, 상기 발현 구조물에 의해 암호화된 폴리펩티드는 단백질 다량체, 예를 들어 이종다량체성 폴리펩티드, 예를 들어 재조합 항체 또는 그의 단편 부분일 수 있다. 상기 항체 단편을 Fab, Fd, Fv, dAb, F(ab')2 및 scFv로 이루어지는 목록 중에서 선택할 수 있다. 바람직한 실시태양에서, 상기 발현 구조물에 의해 발현된 폴리펩티드는 항체 중쇄 또는 그의 단편일 수 있다.
본 발명의 추가의 태양에서, 상기 발현 구조물을 숙주 세포에서의 이중특이성 항체의 발현에 사용할 수 있다. 하나의 실시태양에서, 상기 발현된 폴리펩티드는 항체 중쇄이다. 한편으로, 상기 발현된 폴리펩티드는 항체 Fc 영역에 연결된 항체의 단편이다. 상기 항체 단편을 Fab, Fd, Fv, dAb, F(ab')2 및 scFv로 이루어지는 목록 중에서 선택할 수 있다. 바람직하게 상기 항체 단편은 Fab 또는 scFv이다. 보다 바람직하게 상기 항체 단편은 scFv이다. 이중특이성 항체의 발현을 수행하기 위해서, 별도의 발현 구조물을 또한 항체 경쇄의 발현을 위해 제공할 수 있다. 숙주 세포에서 항체 중쇄 및 항체 단편-Fc를 암호화하는 발현 구조물과 항체 경쇄를 암호화하는 발현 구조물과의 동시-발현은 이중특이성 항체의 발현을 생성시킨다. 상기에 논의된 바와 같이, 숙주 세포에서 이중특이성 항체의 발현은 목적하는 이종이량체 외에 다수의 불필요한 동종이량체성 종들을 생성시킨다. 본 발명의 바람직한 실시태양에서, 이들 이중특이성 항체 성분의 세포막 디스플레이는 이종이량체성 항체를 우세하게 발현하는 숙주 세포의 간단한 선택을 가능하게 한다.
본 발명은 또한 충분량의 폴리펩티드가 세포막 상에 디스플레이되어 세포 선택이 가능하도록(상기 폴리펩티드의 대부분은 용해 가능하게 발현되지만) 상기 스플라이스 비를 변경시키는 방법을 제공한다.
본 발명의 상기 태양에 따라 상기 방법은 관심 폴리펩티드의 막 디스플레이를 측정하고 이어서 상기 관심 폴리펩티드를 발현하는 세포(들)의 보다 양호한 선택이 허용되도록 막 디스플레이를 증가시키거나 감소시키기 위해 상기 관심 폴리펩티드의 관찰된 막 디스플레이를 토대로 상기 구조물의 성분들을 변형시킴을 수반한다.
본 발명은 또한 관심 단백질 또는 상기 관심 단백질을 포함하는 이종다량체성 단백질의 막 발현 수준을 검출함으로써 세포(들)를 선택함을 수반하는, 본 발명에 따른 적어도 하나의 구조물을 포함하는 세포(들)의 선택 방법을 제공한다.
도 1은 본 발명의 선택적 스플라이스 구조물의 개략적 도면이다. 상기 폴리펩티드의 선택적 스플라이스는 2개의 스플라이스 생성물을 생성시킨다. 스플라이스 생성물 1에 대해서, 2개의 최종 아미노산 글리신(G) 및 리신(K)을 암호화하는 코돈이 mRNA에 통합되며 상기 폴리펩티드는 세포로부터 분비된다. 스플라이스 생성물 2에 대해서, 상기 폴리펩티드는 2개의 아미노산 G 및 K를 포함하지 않고, 임의의 연결 영역, 막관통 도메인 및 임의의 작은 세포내 도메인으로 구성된 막관통 영역에 의해 연장되며, 생성되는 폴리펩티드는 분비되지 않고 상기 세포의 외막 상에 존재한다.
도 2는 상이한 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 음성 대조용으로서, CHO-S 세포를 분비된 IgG1 항체(ctrl)를 암호화하는 비-스플라이스 구조물로 형질감염시켰다. 상이한 선택적 스플라이스 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로 나타내고 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염된 대조용 세포의 염색은 중첩된 검은선으로서 포함된다(A-D). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(E) 및 염색의 평균 형광(G)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟(Octet) 장치를 사용하여 형질감염 후 4일째에 측정하였다(H).
도 3은 IgG4 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 음성 대조용으로서, CHO-S 세포를 분비된 IgG4 항체(IgG4)를 암호화하는 비-스플라이스 구조물로 형질감염시켰다. 선택적 스플라이스 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로 나타내고 분비된 IgG4 항체를 암호화하는 비-스플라이스 구조물로 형질감염된 대조용 세포의 염색은 중첩된 검은선으로서 포함된다(A). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(B) 및 염색의 평균 형광(D)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(C).
도 4는 선택적 스플라이스 기술을 사용하는 세포막 상에 디스플레이된 이중특이적 항체의 특정한 검출이다. 세포를 형질감염 후 1일째에 염색하였다. Fc 단편(scFv-Fc 및 HC)을 PE 접합된 염소 항-인간 Fc 감마 특이성 항체(A-C, J-L)를 사용하여 검출하였다. 카파 경쇄를 마우스 항-인간 카파 LC APC 표지된 항체(D-F, M-O)를 사용하여 검출하였다. scFv-Fc의 염색을 FITC-표지된 단백질 A를 사용하여 수행하였다. 상기 형질감염된 세포에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내었다. 첫 번째 형질감염 칵테일(A,D,G)에 대해서, 형질감염되지 않은 세포에 대해 획득된 프로파일을 중첩(검은선)으로서 나타내었다. 다른 모든 실험들(B,C,E,F 및 H-R)에 대해서, 음성 대조용(막관통 도메인 부재하의 형질감염된 세포에 대해 획득된 프로파일)은 중첩(파선)으로서 나타내었다.
도 5는 일시 형질감염 후 6일째의 분비된 BEAT® 및 scFv-Fc 동종이량체 분자의 역가이다.
도 6은 발현 구조물의 상이한 막관통 영역 및 상이한 변형을 포함하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 음성 대조용으로서, CHO-S 세포를 분비된 IgG1 항체(대조용)를 암호화하는 비-스플라이스 구조물로 형질감염시켰다.
도 7은 CHO-S 세포에서 형질감염된 IgG1 항체의 디스플레이 및 분비를 위한 상이한 선택적 스플라이스 구조물의 표준화된 발현 수준이다. 상등액을 옥텟 QK 장치 및 단백질 A 생체 탐침을 사용하여 분석하였다(표준 HC: 선택적 스플라이스 없는 대조용).
도 8은 스플라이스 수용체의 폴리(Y) 트랙의 상이한 Y 함량 및 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 음성 대조용으로서, CHO-S 세포를 분비된 IgG1 항체(ctrl)를 암호화하는 비-스플라이스 구조물로 형질감염시켰다. 상이한 선택적 스플라이스 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(A-G). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(H) 및 염색의 평균 형광(J)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(I).
도 9는 스플라이스 공여체 컨센서스 서열의 변형 및 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 음성 대조용으로서, CHO-S 세포를 분비된 IgG1(ctrl)을 암호화하는 비-스플라이스 구조물로 형질감염시켰다. 상이한 선택적 스플라이스 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(A-C). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(D) 및 염색의 평균 형광(F)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(E).
도 10은 22-23 소수성 아미노산의 상이한 막관통 도메인을 갖는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). 상이한 막관통 도메인을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-G). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(H) 및 염색의 평균 형광(I)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(G).
도 11은 소수성, 극성 및 하전된 잔기를 함유하는 21-24 소수성 아미노산의 상이한 막관통 도메인을 갖는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). 상이한 막관통 도메인을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-H). PTCRA 막관통 도메인을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포에 대해 수행된 염색을 색칠 된 막대그래프로서 나타내며, 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(I). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(J) 및 염색의 평균 형광(L)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(K).
도 12는 PTCRA 막관통 도메인 중에 소수성 잔기 수의 변화를 갖는 PTCRA 막관통 도메인을 포함하는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, B7-1 막관통 영역 및 야생형 PTCRA 막관통 도메인을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). PTCRA 막관통 도메인의 상이한 변형을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, 야생형 PTCRA 막관통 도메인을 갖는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-H). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(I) 및 염색의 평균 형광(K)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(J).
도 13은 소수성, 극성 및 하전된 잔기를 함유하는 17-19 소수성 아미노산의 상이한 막관통 도메인을 갖는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). 상이한 막관통 도메인을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-D). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(E) 및 염색의 평균 형광(G)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(F).
도 14는 소수성, 극성 및 하전된 잔기를 함유하는 26-27 소수성 아미노산의 상이한 막관통 도메인을 갖는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). 상이한 막관통 도메인을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-E). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(F) 및 염색의 평균 형광(H)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(G).
도 15는 단축되거나 연장된 B7-1 막관통 도메인을 갖는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, 야생형 B7-1 막관통 도메인을 포함하는 B7-1 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). 상이한 막관통 도메인을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, B7-1 야생형 막관통 도메인을 포함하는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-E). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(F) 및 염색의 평균 형광(H)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(G).
도 16은 상이한 시토졸 꼬리를 갖는 B7-1 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, B7-1 시토졸 꼬리를 포함하는 B7-1 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1을 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). 상이한 시토졸 꼬리를 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, B7-1 시토졸 꼬리를 포함하는 B7-1 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B-N). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(O) 및 염색의 평균 형광(Q)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(P).
도 17은 상이한 시토졸 꼬리를 갖는 M1M2 막관통 영역을 사용하는 IgG1 항체의 디스플레이 및 분비를 위한 선택적 스플라이스 구조물로 형질감염된 CHO-S 세포의 염색 프로파일이다. 상기 분석을 형질감염 후 당일에 수행하였다. 양성 대조용으로서, 상기 M1M2 시토졸 꼬리를 포함하는 M1M2 막관통 영역을 갖는 분비되고 막 디스플레이된 IgG1를 암호화하는 선택적 스플라이스 구조물을 형질감염시키고((A)에서 색칠 된 막대그래프), 음성 대조용으로서 CHO-S 세포를 분비된 IgG1 항체를 암호화하는 비-스플라이스 구조물로 형질감염시켰다((A)에서 중첩된 검은선). B7-1 시토졸 꼬리를 갖는 상기 M1M2 막관통 영역을 사용하는 분비되고 막 디스플레이된 IgG1을 암호화하는 구조물로 형질감염된 세포들에 대해 수행된 염색은 색칠 된 막대그래프로서 나타내고, 상기 M1M2 시토졸 꼬리를 포함하는 상기 M1M2 막관통 영역을 사용하는 구조물로 형질감염된 세포의 염색은 중첩된 검은선으로서 포함된다(B). 상기 막대그래프는 상기 선택적 스플라이스 구조물 및 대조용의 염색된 세포의 백분율(C) 및 염색의 평균 형광(E)을 측정하기 위해 사용되었다. 분비된 항체의 역가를 옥텟 장치를 사용하여 형질감염 후 4일째에 측정하였다(D).
도 18은 BEAT 이중특이성 항체의 3개의 서브유닛의 조립 변이체이다.
도 19는 선택된 안정한 세포 풀의 이중 카파 경쇄(LC) 및 Fc 단편 염색 후 획득된 점 도표의 예이다. 상기 세포막상의 염색에 의해 검출된 잠재적인 분자들을 우측에 나타낸다. Fc 단편은 PE 접합된 염소 항-인간 Fc 감마 특이성 항체를 사용하여 검출되었다. 카파 경쇄는 마우스 항-인간 카파 LC APC 표지된 항체를 사용하여 검출되었다.
도 20은 선택적 스플라이스 벡터로 형질감염된 안정한 풀의 표면 염색과 분비 프로파일간의 상관성이다. 플롯팅된 Q6* 및 Q7*의 백분율은 100%가 전체 생산 세포 집단(Q8 제외)임을 지칭한다.
도 21은 세포 분류 전 안정한 세포 풀의 표면 염색 후 획득된 점 도표이다. 염색은 상기 세포 표면상에 디스플레이된 결합제들의 검출을 위해 가용성 표적1 및 2를 사용한다. 상기 세포막상의 염색에 의해 검출된 잠재적인 분자들을 상응하는 사분면에 나타낸다.
도 22는 14일 유가배양 (fed-batch)의 상등액 중에서 검출된 BEAT® 분자의 분율과 표면상에 BEAT® 표현형을 디스플레이하는 세포의 분율간의 상관성이다.
도 23은 선택적 스플라이스 구조물로 형질감염된 선택된 안정한 세포 풀에 대해 획득된 측정된 표면 Fc 프로파일의 예이다. 상기 세포막상에 존재하는 IgG는 PE 접합된 염소 항-인간 Fc 감마 특이성 항체를 사용하여 검출되었다. 살아있는 세포는 상기 시험된 선택적 스플라이스 풀의 형광 분포를 나타내기 위해 FSC 대 SSC 점 도표(A에서 g1)에서 게이팅(gating)되었다 ((A)에서 색칠된 막대그래프). 상기 선택적 스플라이스 구조물 부재 하의 IgG 분비 클론의 염색은 음성 대조용으로서 사용되었고 중첩(파선)으로서 나타낸다.
도 24는 배치 과정 동안 분석된 표면 염색 강도와 분비 세포의 발현 수준간의 상관성이다: 보충된 배치의 1일째의 표면강도와 IgG 역가간의 상관성(A) 및 1일째 표면 강도와 지수 증식기(1 내지 3일) 동안 측정된 qP간의 상관성(B).
25: 1일째의 표면 염색 강도는 7일째의 축적된 분비된 IgG를 예견한다.
도 26은 IgG 표면 디스플레이에 따른 고 생산자의 선택이다. 막상에 IgG의 "저", "중간" 및 "고" 밀도를 디스플레이하는 세포는 유식 세포측정 세포 분류에 의해 선택되었다(A). 표면 형광의 분포는 분류 후 2주째에 측정되었고(B) 상기 분류된 클론의 비생산성은 보충된 배치에서 평가되었다(C).
본 발명은 폴리펩티드, 특히 이종다량체성 폴리펩티드의 세포막 발현을 위한 발현 구조물 및 방법을 제공한다. 특히 관심 단백질은 선택적 스플라이스를 사용하는 숙주 세포 중의 재조합 항체 또는 그의 단편 또는 이중특이성 항체일 수 있다. 세포막 디스플레이의 수준은 재조합 숙주 세포중의 상기 폴리펩티드의 분비 수준을 가리키며 이종다량체성 항체의 경우 상기 세포막 디스플레이는 또한 상기 분비 프로파일, 즉 이종이량체 또는 동종이량체 발현을 가리킨다.
본 명세서에서 호환적으로 사용되는 바와 같은 "발현 구조물" 또는 "구조물"이란 용어는 발현시키려는 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열 및 그의 발현을 조절하는 서열, 예를 들어 프로모터 및 임의로 인헨서 서열을 포함하며, 시스-작용 전사 조절 요소들의 임의의 조합을 포함한다. 상기 유전자의 발현, 즉 그의 전사 및 전사 산물의 번역을 조절하는 서열을 통상적으로 조절 유닛이라 칭한다. 상기 조절 유닛의 대부분은 상기 유전자의 암호화 서열의 상류에 위치하며 상기에 작동적으로 연결된다. 상기 발현 구조물은 또한 폴리(A) 부위를 포함하는 하류 3' 번역되지 않은 영역을 함유할 수 있다.
본 발명의 조절 유닛은 발현시키려는 유전자, 즉 전사 유닛에 작동적으로 연결되거나, 또는 개재 DNA (intervening DNA)에 의해, 예를 들어 이종 유전자의 5'-번역되지 않은 영역(5'UTR)에 의해 상기로부터 분리된다. 바람직하게 상기 발현 구조물은 상기 발현 구조물의 벡터내로의 삽입 및/또는 벡터로부터의 그의 절제를 가능하게 하기 위해서 하나 이상의 적합한 제한 부위가 측면에 인접해 있다. 따라서, 본 발명에 따른 발현 구조물을 발현 벡터, 특히 포유동물 발현 벡터의 구성에 사용할 수 있다.
본 명세서에 사용되는 바와 같은 "폴리펩티드를 암호화하는 폴리뉴클레오티드 서열"이란 용어는 유전자, 바람직하게 상기 폴리펩티드를 발현하는 이종 유전자를 암호화하는 DNA를 포함한다.
본 명세서에 사용되는 바와 같은 "이종 암호화 서열", "이종 유전자 서열", "이종 유전자", "재조합 유전자" 또는 "유전자"란 용어들은 호환적으로 사용된다. 이들 용어는 재조합 폴리펩티드, 특히 숙주 세포, 바람직하게는 포유동물 세포에서 발현시키고 추후의 사용을 위해 수확하고자 하는 재조합 이종 단백질 생성물을 암호화하는 DNA 서열을 지칭한다. 상기 유전자의 생성물은 폴리펩티드, 글리코펩티드 또는 리포글리코펩티드일 수 있다. 상기 이종 유전자 서열은 숙주 세포 중에 자연적으로 존재하지 않을 수도 있으며 동일하거나 상이한 종의 유기체로부터 유래하고 유전자 변형될 수도 있다. 한편으로 상기 이종 유전자 서열은 숙주 세포 중에 자연적으로 존재한다.
"단백질" 및 "폴리펩티드"란 용어는 인접 잔기들의 알파-아미노와 카복시기 사이의 펩티드 결합에 의해 다른 것에 연결된 일련의 아미노산 잔기를 포함하는데 호환적으로 사용된다.
본 명세서에 사용되는 바와 같은 "프로모터"란 용어는 RNA 폴리머라제가 DNA에 결합하게 지시하고 RNA 합성을 개시시킴으로써 전사의 개시를 매개하는 유전자의 상류에 일반적으로 위치하는 조절 DNA를 정의한다. 본 발명에 사용하기 위한 프로모터는 예를 들어 높은 수준의 발현을 제공하는 바이러스, 포유동물, 곤충 및 효모 프로모터, 예를 들어 포유동물 거대세포바이러스 (cytomegalovirus) 또는 CMV 프로모터, SV40 프로모터, 또는 진핵생물 세포에서의 발현에 적합한 당해 분야에 공지된 임의의 프로모터를 포함한다. 본 발명의 발현 구조물에 사용하기에 특히 적합한 프로모터는 하기로 이루어지는 목록 중에서 선택될 수 있다: SV40 프로모터, 인간 tk 프로모터, MPSV 프로모터, 마우스 CMV, 인간 CMV, 래트 CMV, 인간 EF1알파, 중국 햄스터 EF1알파, 인간 GAPDH, MYC, HYK 및 CX 프로모터를 포함한 하이브리드 프로모터, 전자 인자 결합 부위의 재배열을 기본으로 하는 합성 프로모터. 본 발명의 특히 바람직한 프로모터는 마우스 CMV 프로모터이다.
"5' 번역되지 않은 영역(5'UTR)"이란 용어는 pre-mRNA 또는 성숙 mRNA의 5' 말단 중의 번역되지 않은 분절을 지칭한다. 성숙 mRNA상에서, 상기 5'UTR은 전형적으로 그의 5' 단부상에 7-메틸구아노신 캡을 가지며 다수의 과정들, 예를 들어 스플라이스, 폴리아데닐화, 세포질을 향한 mRNA 유출, 번역 기구에 의한 상기 mRNA의 5' 단부의 식별 및 분해에 대한 상기 mRNA의 보호에 관련된다(Cowling VH(2010) Biochem J, 425:295-302).
"인트론"이란 용어는, 전사되고 pre-mRNA 중에 존재하지만 상기 인트론의 5' 및 3' 단부에서 각각 스플라이스 공여 부위 및 스플라이스 수용 부위의 서열들을 기본으로 하는 스플라이스 기구에 의해 절제되는, 따라서 성숙 mRNA 전사물 중에 존재하지 않는 핵산 비-암호화 서열의 분절을 지칭한다. 전형적으로 인트론은 상기 3' 스플라이스 부위의 상류 20 내지 50 뉴클레오티드 사이에 위치한, 분지점이라 칭하는 내부 부위를 갖는다. 본 발명에 사용되는 인트론의 길이는 50 내지 10000 뉴클레오티드 길이일 수 있다. 단축된 인트론은 50개 이상의 뉴클레오티드를 포함할 수 있다. 완전길이 인트론은 10000개 초과의 뉴클레오티드를 포함할 수 있다. 본 발명의 발현 구조물에 사용하기에 적합한 인트론은 하기로 이루어지는 목록 중에서 선택될 수 있다: 합성 또는 인공 인트론; 또는 천연 인트론, 예를 들어 -글로빈/IgG 키메릭 인트론, -글로빈 인트론, IgG 인트론, 마우스 CMV 1차 인트론, 래트 CMV 1차 인트론, 인간 CMV 1차 인트론, Ig 가변 영역 인트론 및 스플라이스 수용 부위(Bothwell et al., (1981) Cell, 24:625-637; 미국특허 제 5,024,939 호), 치킨 TNT 유전자의 인트론 및 EF1알파의 1차 인트론 또는 이들의 변형된 버전.
본 발명에 사용되는 인트론은 상이한 인트론들로부터의 스플라이스 수용 및 스플라이스 공여 부위를 가질 수 있다, 예를 들어 상기 인트론은 인간 IgG 인트론으로부터의 스플라이스 공여 부위, 예를 들어 ighg1 유전자의 스플라이스 공여 부위 및 치킨 cTNT 인트론 4로부터의 스플라이스 수용 부위를 포함할 수 있다.
바람직한 실시태양에서 상기 인트론은 인간 IgG 인트론으로부터의 스플라이스 공여 부위 및 치킨 cTNT 인트론 4로부터의 스플라이스 수용 부위를 포함한다. 인간 IgG 인트론으로부터의 스플라이스 공여 부위 및 치킨 cTNT 인트론 4(서열번호 69) 및 치킨 TNT 인트론 4로부터 유래된 구조물(서열번호 70-78)로 이루어진 그룹 중에서 선택된 스플라이스 수용체를 포함하는 인트론이 보다 바람직하다.
"엑손"이란 용어는, mRNA로 전사되고 스플라이스 후에 성숙 mRNA 중에서 유지되는 핵산 서열의 분절을 지칭한다.
"스플라이스 부위"란 용어는, 절단되기에 적합한 진핵생물 세포의 스플라이스 기구에 의해 인식되고/되거나 상응하는 스플라이스 부위에 연결될 수 있는 특정한 핵산 서열을 지칭한다. 스플라이스 부위는 pre-mRNA 전사물 중에 존재하는 인트론의 절제를 허용한다. 전형적으로 상기 스플라이스 부위의 5' 부분은 스플라이스 공여 부위라 지칭되고 3' 상응하는 스플라이스 부위는 스플라이스 수용 부위라 지칭된다. 스플라이스 부위란 용어는 예를 들어 천연 스플라이스 부위, 조작된 스플라이스 부위, 예를 들어 합성 스플라이스 부위, 표준 또는 컨센서스 스플라이스 부위, 및/또는 비-표준 스플라이스 부위, 예를 들어 잠재 (cryptic) 스플라이스 부위를 포함한다. 본 발명의 발현 구조물에 사용하기에 적합한 스플라이스 공여 또는 수용 부위는 하기로 이루어지는 목록 중에서 선택될 수 있다: -글로빈/IgG 키메릭 인트론으로부터의 스플라이스 공여체 및 수용체, -글로빈 인트론으로부터의 스플라이스 공여체 및 수용체, IgG 인트론으로부터의 스플라이스 공여체 및 수용체, 마우스 CMV 1차 인트론으로부터의 스플라이스 공여체 및 수용체, 래트 CMV 1차 인트론으로부터의 스플라이스 공여체 및 수용체, 인간 CMV 1차 인트론으로부터의 스플라이스 공여체 및 수용체, Ig 가변 영역 인트론으로부터의 스플라이스 공여체 및 수용체 및 스플라이스 수용체 서열(Bothwell et al., (1981) Cell, 24:625-637; 미국특허 제 5,024,939 호), 치킨 TNT 유전자의 인트론으로부터의 스플라이스 공여체 및 수용체, 및 EF1알파 유전자의 1차 인트론으로부터의 스플라이스 공여체 및 수용체, 또는 이들의 융합 구조물. 바람직한 실시태양에서 상기 스플라이스 공여 부위는 인간 IgG 인트론으로부터 유래하며 상기 스플라이스 수용 부위는 치킨 TNT 인트론 4(서열번호 69) 및 치킨 TNT 인트론 4로부터 유래된 구조물(서열번호 70-78)로 이루어진 그룹 중에서 선택된다.
본 명세서에 사용되는 바와 같은 스플라이스 공여 영역의 컨센서스 서열이란 용어는 문헌["Molecular Biology of the Cell" (Alberts et al., Garland Publishing, New York 1995)]에 개시된 바와 같은 서열 (C/A)AGGU(A/G)AGU (밑줄 친 서열이 인트론 부분이다) 서열번호 345를 지칭한다.
본 명세서에 사용되는 바와 같은 스플라이스 수용 영역의 컨센서스 서열이란 용어는 문헌["Molecular Biology of the Cell" (Alberts et al., Garland Science, New York 2002)]에 개시된 바와 같은 서열 CTRAYY - - - poly (Y) 트랙- - - NCAGG (밑줄 친 서열이 인트론 부분이고; 이탤릭체: 분지점 영역) 서열번호 346을 지칭한다.
"정지 코돈"이란 용어는 단백질 합성의 종결을 신호하는 3개의 정지 코돈 중 어느 하나를 지칭한다(TAA (RNA: UAA), TAG (RNA: UAG) 및 TGA (RNA: UGA). 정지 코돈의 불완전한 종결 효율 또는 "누출"을 피하기 위해서, 2, 3 또는 다수의 정지 코돈을 사용하여 단백질 합성의 종결을 신호할 수 있다.
"막관통 영역"이란 용어는, 핵산 서열에 의해 암호화되고 임의의 세포외 부분, 막관통 도메인 및 임의의 시토졸 꼬리를 포함하는 폴리펩티드 또는 단백질을 지칭한다. 막관통 도메인은 막 중에서 열역학적으로 안정하고 대개는, 주로 소수성 아미노산들로 구성된 막관통 단백질의 단일 막관통 알파 나선을 포함하는 임의의 3차원 단백질 구조이다. 상기 막관통 도메인의 길이는 평균 21개 아미노산이나, 4 내지 48개 아미노산으로 다양할 수도 있다(Baeza-Delagdo et al., 2012). 막관통 영역은 아미노산의 임의의 N-말단 세포외 연결 신장부 및 막관통 도메인을 포함한다. 일부 실시태양에서, 상기 막관통 영역은 C-말단 세포질 아미노산 신장부 또는 세포내 도메인을 추가로 포함할 수도 있다. 인간 ighg1 유전자 중에서 발견되는 막관통 영역은 예를 들어 아미노산들의 연결 신장부에 이어서 2개의 도메인 M1 및 M2로 구성된다(상기 막관통 영역을 "M1M2" 또는 "IgG1 막관통 영역"이라 칭할 것이다). 본 발명에 사용되는 막관통 영역은 비제한적으로 인간 혈소판-유래된 성장인자 수용체(PDGFR) 유전자 (스위스프롯 엔트리 P16234), 인간 아시알로당단백질 수용체 (스위스프롯 엔트리 P07306), 인간 및 쥐 B7-1 (인간: 스위스프롯 엔트리 P33681 및 쥐: 스위스프롯 엔트리 Q00609), 인간 ICAM-1 (스위스프롯 엔트리 P05362), 인간 erbb1 (스위스프롯 엔트리 P00533), 인간 erbb2 (스위스프롯 엔트리 P04626), 인간 erbb3 (스위스프롯 엔트리 P21860), 인간 erbb4 (스위스프롯 엔트리 Q15303), 인간 섬유아세포 성장인자 수용체, 예를 들어 FGFR 1 (스위스프롯 엔트리 P11362), FGFR2 (스위스프롯 엔트리 P21802), FGFR3 (스위스프롯 엔트리 P22607), FGFR4 (스위스프롯 엔트리 P22455), 인간 VEGFR-1 (스위스프롯 엔트리 P17948), 인간 VEGFR-2 (스위스프롯 엔트리 P35968), 인간 에리트로포이에틴 수용체 (스위스프롯 엔트리 P19235), 인간 PRL-R, 프로락틴 수용체 (스위스프롯 엔트리 P16471), 인간 EphA1, 에프린 A형 수용체 1 (스위스프롯 엔트리 P21709), 인간 인슐린 (스위스프롯 엔트리 P06213), 인슐린-유사 성장인자 1 수용체 (IGFR1, 스위스프롯 엔트리 P08069, 서열번호 181), 인간 수용체-유사 단백질 티로신 포스파타제 (스위스프롯 엔트리 Q12913, P23471, P23467, P18433, P23470, P23469, P23468), 인간 뉴로필린 (스위스프롯 엔트리 PO14786), 인간 주요 조직적합성 복합체 부류 II (알파 및 베타쇄), 인간 인테그린 (알파 및 베타 패밀리), 인간 신데칸, 인간 마이엘린 단백질, 인간 카데린, 인간 시냅토브레빈-2 (스위스프롯 엔트리 P63027), 인간 글리코포린-A (GpA, 스위스프롯 엔트리 P02724, 서열번호 185), 인간 Bnip3 (스위스프롯 엔트리 Q12983), 인간 APP (스위스프롯 엔트리 P05067), 아밀로이드 전구체 단백질 (스위스프롯 엔트리 P0DJI8), 인간 T-세포 수용체 알파 유전자 (PTCRA, 스위스프롯 엔트리 PQ6ISU1, 서열번호 186) 및 T-세포 수용체 베타, CD3 감마 (스위스프롯 엔트리 P09693), CD3 델타 (스위스프롯 엔트리 P04234), CD3 제타 (스위스프롯 엔트리 P20963), 및 CD3 입실론 (CD3E, 스위스프롯 엔트리 P07766, 서열번호 197), 인간 세린/트레오닌-단백질 키나제 수용체 R3 (ACVL1, 스위스프롯 엔트리 P37023, 서열번호 174), 인간 안트락스 독소 수용체 2 (ANTR2, 스위스프롯 엔트리 P58335, 서열번호 175), 인간 T-세포 표면 당단백질 CD4 (CD4, 스위스프롯 엔트리 P01730, 서열번호 176), 인간 수용체-형 티로신-단백질 포스파타제 뮤 (PTPRM, 스위스프롯 엔트리 P28827, 서열번호 177), 인간 종양 괴사 인자 수용체 슈퍼패밀리 구성원 5 (TNR5, 스위스프롯 엔트리 P25942, 서열번호 178). 인간 인테그린 베타-1 (ITB1, 스위스프롯 엔트리 P05556, 서열번호 179), 인간 HLA 부류 I 조직적합성 항원, B-7 알파 쇄 (스위스프롯 엔트리 P01889, 서열번호 180), 인간 트롬보모듈린 (TRBM, 스위스프롯 엔트리 P07204, 서열번호 182), 인간 인터류킨-4 수용체 서브유닛 알파 (IL4RA, 스위스프롯 엔트리 P24394 , 서열번호 183), 인간 저-밀도 지단백질 수용체-관련된 단백질 6 (LRP6, 스위스프롯 엔트리 O75581, 서열번호 184), 인간 고 친화성 면역글로불린 입실론 수용체 서브유닛 알파 (FCERA, 스위스프롯 엔트리 P12319, 서열번호 194), 인간 살해세포 면역글로불린-유사 수용체 2DL2 (KI2L2, 스위스프롯 엔트리 P43627, 서열번호 195), 인간 사이토킨 수용체 공통 서브유닛 베타 (IL3RB, 스위스프롯 엔트리 P32927, 서열번호 196), 인간 인테그린 알파-IIb (ITA2B, 스위스프롯 엔트리 P08514, 서열번호 198), 인간 T-세포-특이성 표면 당단백질 CD28 (CD28, 스위스프롯 엔트리 P10747, 서열번호 199)의 막관통 영역을 포함한다.
바람직한 실시태양에서 본 발명에 사용되는 막관통 영역은 인간 B7-1 막관통 영역, 쥐 B7-1 막관통 영역, PDGFR 막관통 영역, 인간 아시알로당단백질 수용체 막관통 영역 및 erbb-2 막관통 영역으로 이루어지는 그룹 중에서 선택된다. 쥐 B7-1 막관통 영역이 보다 바람직하고, 서열번호 66에 나타낸 바와 같은 쥐 B7-1 막관통 영역이 가장 바람직하다.
면역글로불린 막관통 영역은 인간 면역글로불린 유전자 IGHA1 (NCBI 접근 부호: M60193), IGHA2 (NCBI 접근 부호: M60194), IGHD (NCBI 접근 부호: K02881), IGHE (NCBI 접근 부호: X63693), IGHG1 (NCBI 접근 부호: X52847), IGHG2 (NCBI 접근 부호: AB006775), IGHG3 (NCBI 접근 부호: D78345), IGHG4(NCBI 접근 부호: AL928742), IGHGP (NCBI 접근 부호: X52849), IGHM (NCBI 접근 부호: X14940)으로부터의 막관통 영역뿐만 아니라 쥐 면역글로불린 유전자 IGHA1 (NCBI 접근 부호:K00691), IGHD (NCBI 접근 부호: J00450), IGHE (NCBI 접근 부호: X03624, U08933), IGHG1 (NCBI 접근 부호:J00454, J00455), IGHG2A (NCBI 접근 부호: J00471), IGHG2B (NCBI 접근 부호: J00462, D78344), IGHG3 (NCBI 접근 부호: X00915, V01526), IGHM (NCBI 접근 부호: J00444)로부터의 막관통 영역을 포함한다.
본 발명의 하나의 실시태양에서 상기 사용되는 막관통 영역은 면역글로불린 유전자에 의해 암호화된 막관통 영역을 포함하지 않는 비-면역글로불린 막관통 영역, 특히 인간 면역글로불린 유전자 IGHA1 (NCBI 접근 부호: M60193), IGHA2 (NCBI 접근 부호: M60194), IGHD (NCBI 접근 부호: K02881), IGHE (NCBI 접근 부호: X63693), IGHG1 (NCBI 접근 부호: X52847), IGHG2 (NCBI 접근 부호: AB006775), IGHG3 (NCBI 접근 부호: D78345), IGHG4(NCBI 접근 부호: AL928742), IGHGP (NCBI 접근 부호: X52849), IGHM (NCBI 접근 부호: X14940)에 의해 암호화된 막관통 영역을 포함하지 않을 뿐만 아니라 쥐 면역글로불린 유전자 IGHA1 (NCBI 접근 부호:K00691), IGHD (NCBI 접근 부호: J00450), IGHE (NCBI 접근 부호: X03624, U08933), IGHG1 (NCBI 접근 부호:J00454, J00455), IGHG2A (NCBI 접근 부호: J00471), IGHG2B (NCBI 접근 부호: J00462, D78344), IGHG3 (NCBI 접근 부호: X00915, V01526), IGHM (NCBI 접근 부호: J00444)에 의해 암호화된 막관통 영역을 포함하지 않는 비-면역글로불린 막관통 영역이다.
"폴리(Y) 트랙"이란 용어는 인트론의 분지점과 인트론-엑손 경계 사이에서 발견되는 핵산의 신장부를 지칭한다. 상기 핵산의 신장부는 다수의 피리미딘(Y)(이는 다수의 피리미딘 염기 C 또는 T를 의미한다)을 갖는다.
"3' 번역되지 않은 영역(3'UTR)"이란 용어는 pre-mRNA 또는 성숙 mRNA의 3' 말단 중의 번역되지 않은 분절을 지칭한다. 성숙 mRNA상에서 상기 영역은 폴리(A) 꼬리를 가지며 mRNA 안정성, 번역 개시 및 mRNA 유출에 많은 역할을 하는 것으로 공지되어 있다(Jia J et al., (2013) Curr Opin Genet Dev, 23(1):29-34).
본 발명에 사용되는 바와 같은 "인헨서"란 용어는 유전자의 정체, 상기 유전자와 관련된 서열의 위치, 또는 상기 서열의 배향에 관계 없이 상기 유전자의 전사를 강화시키는 작용을 하는 뉴클레오티드 서열을 정의한다. 본 발명의 벡터는 인헨서를 임의로 포함한다.
"폴리아데닐화 신호" 또는 "폴리(A) 신호" 또는 "폴리(A)" 또는 "폴리(A) 부위"란 용어는 폴리(A) 폴리머라제의 존재하에 있을 때 mRNA 전사물이 상기 폴리(A) 신호의 10 내지 30 염기 하류에 위치한 폴리아데닐화 부위상에서 폴리아데닐화되게 하는, 상기 전사물 중에 존재하는 핵산 서열을 지칭한다. 다수의 폴리(A) 신호들이 당해 분야에 공지되어 있으며 본 발명에 유용할 수 있다. 예로서 인간 변이체 성장 호르몬 폴리(A) 신호, SV40 말기 폴리(A) 신호 및 소 성장 호르몬 폴리(A) 신호가 있다.
"기능적으로 연결된" 및 "작동적으로 연결된"이란 용어는 호환적으로 사용되며 2개 이상의 DNA 분절들, 특히 발현시키려는 유전자 서열과 그의 발현을 조절하는 서열간의 기능적 관계를 지칭한다. 예를 들어, 시스-작용 전사 조절 요소들의 임의의 조합을 포함하여 프로모터 및/또는 인헨서 서열은 적합한 숙주 세포 또는 다른 발현 시스템에서 암호화 서열의 전사를 자극하거나 조절하는 경우 상기 암호화 서열에 작동적으로 연결된다. 전사된 유전자 서열에 작동적으로 연결된 프로모터 조절 서열은 전사된 서열에 물리적으로 인접해 있다.
"배향"은 주어진 DNA 서열 중의 뉴클레오티드들의 순서를 지칭한다. 예를 들어, 또 다른 DNA 서열에 대해 반대 방향의 DNA 서열의 배향은 상기 서열들이 획득된 DNA 중의 참조 지점과 비교할 때 또 다른 서열에 대한 상기 서열의 5'에서 3'으로의 순서가 역전된 것이다. 상기와 같은 참조 지점은 공급원 DNA 중의 다른 명시된 DNA 서열의 전사 방향 및/또는 상기 서열을 함유하는 복제성 벡터들의 복제 기원을 포함할 수 있다.
본 명세서에 사용되는 바와 같은 "핵산 서열 상동성" 또는 "뉴클레오티드 서열 상동성"이란 용어는 최대의 서열 일치성 퍼센트를 성취하기 위해서 서열을 정렬시키고 필요한 경우 틈을 도입시킨 후에 비교 서열의 뉴클레오티드 서열과 일치하는 후보 서열 중의 뉴클레오티드의 백분율을 포함한다. 따라서 서열 일치성을 2개의 뉴클레오티드 서열의 뉴클레오티드 위치의 유사성을 비교하는데 통상적으로 사용되는 표준 방법에 의해 측정할 수 있다.
본 명세서에 사용되는 바와 같은 "발현 벡터"란 용어는 적합한 숙주 세포내에 형질감염시 상기 숙주 세포내에 적합한 발현 수준의 재조합 유전자 생성물을 제공하는 단리되고 정제된 DNA 분자를 포함한다. 상기 발현 벡터는 상기 재조합 또는 유전자 생성물을 암호화하는 DNA 서열 외에 상기 DNA 암호화 서열의 mRNA내로의 효율적인 전사 및 숙주 세포에서 상기 mRNA의 단백질로의 효율적인 번역에 필요한 조절 DNA 서열을 포함한다.
본 명세서에 사용되는 바와 같은 "숙주 세포" 또는 "숙주 세포주"란 용어는 배양물 중에서 성장할 수 있고 목적하는 재조합 생성물 단백질을 발현할 수 있는 임의의 세포, 특히 포유동물 세포를 포함한다.
재조합 폴리펩티드 및 단백질을 다양한 발현 시스템, 예를 들어 원핵생물(예를 들어 이 콜라이), 진핵생물(예를 들어 효모, 곤충, 척추동물, 포유동물) 및 시험관내 발현 시스템에서 생성시킬 수 있다. 단백질-기반 생물학의 대규모 생산에 가장 통상적으로 사용되는 방법은 DNA 벡터의 형질감염에 의한 숙주 세포내로의 유전 물질의 도입에 의존한다. 폴리펩티드의 일시 발현을 숙주 세포의 일시 형질감염으로 성취할 수 있다. 벡터 DNA의 숙주 세포 게놈내로의 통합은 안정하게 형질감염된 세포주를 생성시키며 상기와 같은 안정한 세포주의 번식은 폴리펩티드 및 단백질의 대규모 생산에 사용될 수 있다.
선택적 스플라이스에 의한 원핵생물 세포에서의 다수의 폴리펩티드의 생성 방법들이 WO2005/089285에 개시되어 있다. 2개의 상이한 발현 카세트가 단일 프로모터의 조절하에 있으며 여기에서 상기 발현 카세트들은 그들의 선택적 스플라이스 및 목적하는 비의 2개 이상의 독립적인 유전자 생성물로서의 발현을 허용하는 스플라이스 부위를 갖는다.
그러나, 본 발명자들은 상기와 같은 접근법이, 2개의 전적으로 독립적인 단백질이 생성될 것이고 따라서 원형질막-결합된 변이체는 가용성 폴리펩티드 변이체의 목적하는 생성물 성질을 나타내지 않기 때문에, 상기 가용성 폴리펩티드 변이체 및 원형질막-결합된 변이체의 발현이 제한됨을 발견하였다.
이종 단백질을 발현하는 진핵생물 세포의 선택 방법 및 선택적으로 스플라이스 가능한 핵산으로부터 가용성 폴리펩티드 변이체 및 원형질막-결합된 변이체의 발현이 WO2007/131774에 개시되어 있다. 상기 원형질막-결합된 변이체는 상기를 발현하는 세포에 연결되며 마커로서 사용되어 성공적으로 형질감염된 세포를 단리시킬 수 있다.
그러나, 본 발명자들은 상기와 같은 접근법이, 가용성 폴리펩티드 발현 대 막 디스플레이된 폴리펩티드의 비를 조절하는 수단이 존재하지 않기 때문에 제한됨을 발견하였다. 상기에 언급한 바와 같이, 선택적 스플라이스는 폴리펩티드의 상이한 변이체들을 발현시킬 수 있는 과정이지만, 선택적 스플라이스의 기전은 매우 가변적이므로 상기 스플라이스 비를 조절하는 어떠한 능력도 없으면 발현되는 폴리펩티드 변이체의 양이 달라질 것이다.
따라서 상기 발현된 폴리펩티드의 일부를 세포막상에 발현시키고자 다시 지시하는 세포 발현 시스템은 가용성 폴리펩티드의 감소된 역가를 가질 것이다. 폴리펩티드의 세포막 발현은 고 발현 클론을 단리시키는 유용한 마커인 반면 상기 세포막상에서 발현되는 폴리펩티드량의 어떠한 형태 조절도 없으며, 가용성 폴리펩티드의 역가는 현저하게 감소될 수 있다. 더욱 또한, 2개의 폴리펩티드는 동일한 배양 조건하에서 동일한 수준으로 발현되지 않기 때문에, 하나의 폴리펩티드의 가용성 및 세포막 발현을 위해 개발된 방법이 모든 폴리펩티드에 적합하지는 않을 것 같다.
이전에 개시된 선택적 스플라이스 접근법과 대조적으로, 본 출원인들은, 발현된 가용성 폴리펩티드의 세포막 발현을 여전히 세포 클론을 선택할 수 있기에 충분한 양으로 허용하면서 발현 구조물의 성분들을 상기 폴리펩티드의 양을 최적화하기 위해 변형시킬 수 있는, 가용성이고 세포막 디스플레이된 폴리펩티드의 발현을 위한 선택적 스플라이스 접근법을 설계하였다.
항체 중쇄의 발현을 위한 본 발명의 예시적인 발현 구조물에서, IgG1 중쇄 불변 영역은 분비된 중쇄의 개방 판독 프레임을 종결시키는 정지 코돈의 상류에 약한 스플라이스 공여체를 함유한다. 스플라이스 수용 부위 및 막관통 영역을 암호화하는 DNA 서열에 이어서, 정지 코돈, 및 상기 막관통 영역이 스플라이스 후에 상기 IgG1 중쇄의 개방 판독 프레임과 인프레임 (in frame)이도록 상기 정지 코돈의 3'에 위치한 폴리(A) 부위가 있다. 상기 생성되는 선택적 개방 판독 프레임들은 각각 정지 코돈 및 폴리(A) 부위에 의해 종결된다. 출원인들은 상기 발현 구조물을 변형시킴으로써 스플라이스 비 및 따라서 막 디스플레이된 폴리펩티드에 대한 가용성 폴리펩티드의 양을 변경시킬 수 있음을 발견하였다.
이러한 변형은 예를 들어 이종 막관통 영역의 사용을 포함할 수 있다. IgG1의 천연 막관통 영역은 아미노산의 연결 신장부 및 도메인 M1 및 M2에 의해 구성된다. 상기 IgG1 막관통 영역을 비-면역글로불린 막관통 영역인 막관통 영역으로 치환시킴으로써, 예를 들어 쥐 B7-1 막관통 영역으로 치환시킴으로써, 막 디스플레이된 폴리펩티드의 양을 증가시킬 수 있다. 실시예 2의 도 2에 도시된 바와 같이, 일시적으로 형질감염된 세포의 거의 40%는 막 디스플레이된 IgG1에 대해 양성이었으며, 이는 IgG1 막관통 영역을 포함하는 구조물로 형질감염된 세포의 백분율(20% 이하)에 비해 현저한 증가이다. 상기와 같은 결과는 이종 막관통 영역이 아닌, 천연 IgG1 막관통 영역의 사용이 IgG1의 세포막 디스플레이에 가장 효율적일 것이라 예상될 수 있었기 때문에 놀라운 것이다. 바람직하게, 본 발명의 발현 구조물에 사용된 막관통 영역은 인간 혈소판-유래된 성장인자 수용체(PDGFR) 유전자, 인간 아시알로당단백질 수용체, 인간 및 쥐 B7-1, 인간 ICAM-1, 인간 erbb1, 인간 erbb2, 인간 erbb3, 인간 erbb4, 인간 섬유아세포 성장인자 수용체, 예를 들어 FGFR 1, FGFR2, FGFR3, FGFR4, 인간 VEGFR-1, 인간 VEGFR-2, 인간 에리트로포이에틴 수용체, 인간 PRL-R, 프로락틴 수용체, 인간 EphA1, 에프린 A형 수용체 1, 인간 인슐린, IGF-1 수용체, 인간 수용체-유사 단백질 티로신 포스파타제, 인간 뉴로필린, 인간 주요 조직적합성 복합체 부류 II(알파 및 베타쇄), 인간 인테그린(알파 및 베타 패밀리), 인간 신데칸, 인간 마이엘린 단백질, 인간 카데린, 인간 시냅토브레빈-2, 인간 글리코포린-A, 인간 Bnip3, 인간 APP, 아밀로이드 전구체 단백질, 인간 T-세포 수용체 알파(PTCRA) 및 T-세포 수용체 베타, CD3 감마, CD3 델타, CD3 제타, 및 CD3 입실론의 막관통 영역으로 이루어지는 그룹 중에서 선택된 막관통 영역을 포함한다. 바람직한 실시태양에서 본 발명에 사용되는 막관통 영역은 인간 B7-1 막관통 영역, 쥐 B7-1 막관통 영역, PDGFR 막관통 영역, 인간 아시알로당단백질 수용체 막관통 영역 및 erbb-2 막관통 영역으로 이루어지는 그룹 중에서 선택된다. 쥐 B7-1 막관통 영역이 보다 바람직하고, 서열번호 66에 나타낸 바와 같은 쥐 B7-1 막관통 영역이 가장 바람직하다.
막 디스플레이된 폴리펩티드에 대한 분비된 폴리펩티드의 양의 스플라이스 비를 변경시키기 위한 추가의 변형은 상기 막관통 영역을 암호화하는 엑손의 상류 폴리피리미딘(폴리(Y)) 트랙 중의 피리미딘 염기의 수를 변경시키고/시키거나 스플라이스 공여체 및 수용체 컨센서스 서열을 변형시킴을 포함한다. 상기 피리미딘 염기(Y)의 수를 감소시키는 것은 분비된 단백질을 향한 상기 스플라이스 비의 이동을 야기하는 것으로 실시예 3에 입증되어 있다. 피리미딘 염기가 상기 구조물 중에 포함되지 않은 경우, 관심 단백질의 표면 발현은 존재하지 않는다. 스플라이스 비를 세포막 발현으로부터 멀리 이동시키는 상기와 같은 기전은, 세포막 상에서 강하게 발현되지만 보다 약한 가용성 발현을 나타내는 단백질에 유용할 수 있다. 상기 폴리(Y) 트랙 중의 피리미딘 염기의 수는 0 내지 30 염기를 포함할 수 있다. 바람직하게, 상기 폴리(Y) 트랙은 20 피리미딘 염기 이하, 보다 바람직하게는 15 염기 이하, 훨씬 더 바람직하게는 10 염기 이하를 포함한다.
막 디스플레이된 단백질량의 증가는 가용성 폴리펩티드의 역가에는 부정적인 영향을 미칠 수 있기 때문에, 발명자들은 상기 막 디스플레이된 폴리펩티드의 양에는 영향을 미치지 않으면서 숙주 세포에서의 가용성 폴리펩티드 발현을 증가시킬 수 있는 발현 구조물에 대한 변형을 개발하였다. 인트론 중의 폴리(A) 부위의 첨가는 현저한 수준의 세포막 디스플레이를 유지시키면서 가용성 폴리펩티드 역가를 최대 50%(M1M2 막관통 영역에 대해서)까지 증가시키는 것으로 밝혀졌다. 본 발명의 추가의 실시태양에서, 폴리(A) 부위는 발현 구조물의 인트론 중에 위치한다.
본 발명의 하나의 태양에서, 상기 발현 구조물은 폴리펩티드 다량체 및 단백질, 예를 들어 항체 또는 그의 단편 또는 이중특이성 항체 또는 그의 단편에 적합하다.
본 명세서에서 지칭되는 바와 같은 "항체"란 용어는 완전 항체 및 그의 임의의 항원 결합 단편 또는 단쇄를 포함한다. "항체"는 디설파이드 결합에 의해 상호연결된 적어도 2개의 중(H)쇄 및 2개의 경(L)쇄를 포함하는 당단백질, 또는 그의 항원 결합 단편을 지칭한다. 각각의 중쇄는 중쇄 가변 영역(본 명세서에서 VH로서 약기됨) 및 중쇄 불변 영역으로 구성된다. 상기 중쇄 불변 영역은 3개의 도메인, CH1, CH2 및 CH3으로 구성된다. 각각의 경쇄는 경쇄 가변 영역(본 명세서에서 VL로서 약기됨) 및 경쇄 불변 영역으로 구성된다. 상기 경쇄 불변 영역은 하나의 도메인 CL로 구성된다. 상기 VH 및 VL 영역을 상보성 결정 영역(CDR)이라 칭하는 고가변성의 영역들로 추가로 세분할 수 있으며, 이들 영역은 서열이 고가변성이고/이거나 항원 인식에 관련되고/되거나 대개는 구조적으로 한정된 고리를 형성하고, 프레임워크 영역(FR 또는 FW)이라 칭하는, 보다 보존된 영역들과 산재된다. 각각의 VH 및 VL은 3개의 CDR 및 4개의 FW로 구성되며, 하기의 순서로 아미노-말단에서부터 카복시-말단으로 배열된다: FW1, CDR1, FW2, CDR2, FW3, CDR3, FW4. FW1, FW2, FW3 및 FW4의 아미노산 서열들은 모두 함께 본 명세서에서 지칭되는 바와 같은 VH 또는 VL의 "비-CDR 영역" 또는 "비-연장된 CDR 영역"을 구성한다.
상기 중쇄 및 경쇄의 가변 영역들은 항원과 상호작용하는 결합 도메인을 함유한다. 상기 항체의 불변 영역은 면역글로빈의, 면역계의 다양한 세포(예를 들어 효과기 세포) 및 고전 보체계의 제1 성분(C1q)을 포함한 숙주 조직 또는 인자들에의 결합을 매개할 수 있다.
항체를 불변 영역에 의해 유전학적으로 결정되는 바와 같이, 또한 아이소타입이라 칭하는 부류들로 분류한다. 인간 불변 경쇄는 카파(Cκ) 및 람다(C) 경쇄로서 분류된다. 중쇄는 뮤(μ), 델타(δ), 감마(γ), 알파(α) 또는 입실론(ε)으로서 분류되고, 항체의 아이소타입을 각각 IgM, IgD, IgG, IgA 및 IgE로서 정의한다. 상기 IgG 부류가 치료학적 목적에 가장 통상적으로 사용된다. 인간에서 상기 부류는 하위부류 IgG1, IgG2, IgG3 및 IgG4를 포함한다.
본 명세서에서 사용되는 바와 같은 "Fab" 또는 "Fab 영역"이란 용어는 VH, CH1, VL 및 CL 면역글로불린 도메인을 포함하는 폴리펩티드를 포함한다. Fab는 단리시의 상기 영역을 지칭하거나, 또는 완전길이 항체 또는 항체 단편과 관련하여 상기 영역을 지칭할 수 있다.
본 명세서에서 사용되는 바와 같은 "Fc" 또는 "Fc 영역"이란 용어는 제1 불변 영역 면역글로불린 도메인을 제외한 항체의 불변 영역을 포함하는 폴리펩티드를 포함한다. 따라서 Fc는 IgA, IgD 및 IgG의 최종 2개 불변 영역 면역글로불린 도메인, IgE 및 IgM의 최종 3개 불변 영역 면역글로불린 도메인, 및 이들 도메인의 N-말단 가요성 힌지를 지칭한다. IgA 및 IgM의 경우, Fc는 J 쇄를 포함할 수 있다. IgG의 경우, Fc는 면역글로불린 도메인 C 감마 2 및 C 감마 3(C2 및 C3) 및 C 감마 1(C1)과 C 감마 2(C2)사이의 힌지를 포함한다. 상기 Fc 영역의 경계는 다양할 수 있지만, 인간 IgG 중쇄 Fc 영역은 대개 그의 카복시-말단에 잔기 C226 또는 P230을 포함하는 것으로 한정되며, 여기에서 넘버링은 EU 넘버링 시스템에 따른다. 인간 IgG1의 경우 Fc 영역은 본 명세서에서 그의 카복시-말단에 잔기 P232를 포함하는 것으로 한정되며, 여기에서 넘버링은 EU 넘버링 시스템에 따른다(Edelman GM et al., (1969) Proc Natl Acad Sci USA, 63(1): 78-85). Fc는 단리시의 상기 영역 또는 Fc 폴리펩티드, 예를 들어 항체와 관련하여 상기 영역을 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "완전길이 항체"란 용어는 가변 및 불변 영역들을 포함하여, 항체의 천연 생물학적 형태를 구성하는 구조를 포함한다. 예를 들어, 인간 및 마우스를 포함한 대부분의 포유동물에서, 상기 IgG 부류의 완전길이 항체는 사량체이며 2개의 면역글로불린 쇄의 2개의 동일한 쌍으로 이루어지고, 각각의 쌍은 하나의 경쇄 및 중쇄를 갖고, 각각의 경쇄는 면역글로불린 도메인 VL 및 CL을 포함하고, 각각의 중쇄는 면역글로불린 도메인 VH, CH1(C1), CH2(C2) 및 CH3(C3)를 포함한다. 일부 포유동물에서, 예를 들어 낙타 및 라마에서, IgG 항체는 단지 2개의 중쇄만으로 이루어질 수 있으며, 각각의 중쇄는 Fc 영역에 부착된 가변 도메인을 포함한다.
항체 단편은 비제한적으로 (i) Fab 및 Fab-SH를 포함하여, VL, VH, CL 및 CH1 도메인으로 이루어지는 Fab 단편, (ii) VH 및 CH1 도메인으로 이루어지는 Fd 단편, (iii) 단일 항체의 VL 및 VH 도메인으로 이루어지는 Fv 단편; (iv) 단일 가변으로 이루어지는 dAb 단편(Ward ES et al ., (1989) Nature, 341: 544-546), (v) 2개의 연결된 Fab 단편을 포함하는 2가 단편인 F(ab')2 단편, (vi) 단쇄 Fv 분자(scFv)(여기에서 VH 도메인 및 VL 도메인은 항원 결합 부위를 형성하도록 2개의 도메인을 결합시키는 펩티드 링커에 의해 연결된다(Bird RE et al., (1988) Science 242: 423-426; Huston JS et al., (1988) Proc. Natl. Acad. Sci. USA, 85: 5879-83), (vii) 이중특이성 단쇄 Fv 이량체(PCT/US92/09965), (viii) 유전자 융합에 의해 구성되는 다가 또는 다중특이성 단편인 "디아바디" 또는 "트라이아바디"(Tomlinson I & Hollinger P (2000) Methods Enzymol. 326: 461-79; WO94/13804; Holliger P et al., (1993) Proc Natl Acad Sci USA, 90: 6444-48) 및 (ix) 동일하거나 상이한 항체에 유전자 융합된 scFv(Coloma MJ & Morrison SL (1997) Nature Biotech, 15(2): 159-163)를 포함한다.
본 명세서에 개시되는 바와 같은 발현 구조물에 의해 발현될 수 있는 항체 및 그의 단편은 AXL, Bcl2, HER2, HER3, EGF, EGFR, VEGF, VEGFR, IGFR, PD-1, PD-1L, BTLA, CTLA-4, GITR, mTOR, CS1, CD3, CD16, CD16a, CD19, CD20, CD22, CD25, CD27, CD28, CD30, CD32b, CD33, CD38, CD40, CD52, CD64, CD79, CD89, CD137, CD138, CA125, cMet, CCR6, MUCI, PEM 항원, Ep-CAM, EphA2, 17-1a, CEA, AFP, HLA II 부류, HLA-DR, HSG, IgE, IL-12, IL-17a, IL-18, IL-23, IL-1알파, IL-1베타, GD2-강글리오사이드, MCSP, NG2, SK-I 항원, Lag3, PAR2, PDGFR, PSMA, Tim3, TF, CTLA4, TL1A, TIGIT, SIRPa, ICOS, Treml2, NCR3, HVEM, OX40, VLA-2 및 4-1BB로 이루어지는 그룹 중에서 선택된 항원에 결합할 수 있다.
이중특이성 또는 이종이량체성 항체는 수년간 당해 분야에서 입수 가능하였다. 그러나 상기와 같은 항체의 생성은 종종 잘못 짝지어진 부산물(이는 목적하는 이중특이성 항체의 생성 수율을 현저하게 감소시키며 생성물 균일성을 성취하기 위해 복잡한 정제 과정을 요한다)의 존재와 관련된다. 면역글로불린 중쇄의 잘못 짝지음은 여러 가지 적합한 설계 전략을 사용하여 감소시킬 수 있으며, 상기 전략의 대부분은 상기 항체 중쇄를 CH3 도메인 동종이량체의 2개의 서브유닛간의 인공 상보성 이종이량체성 계면의 설계를 통해 이종이량체화를 위해 조작한다. 조작된 CH3 이종이량체성 도메인 쌍의 최초 보고서는 이종-이량체성 Fc 부분을 생성시키기 위한 "공동내로의 돌기"를 개시하는 카터(Carter) 등에 의해 작성되었다(미국특허 제 5,807,706 호; '구멍에 손잡이'; Merchant AM et al.,(1998) Nat Biotechnol, 16(7):677-81). 또 다른 설계가 최근에 개발되었으며 상기 설계는 WO2007110205에 개시된 바와 같은 모듈의 코어 조성 변형에 의한 새로운 CH3 모듈쌍의 설계 또는 WO2007147901 또는 WO2009089004에 개시된 바와 같은 모듈간의 상보성 염 가교의 설계를 수반하였다. 상기 CH3 조작 전략의 단점은 이들 기법이 여전히 상당량의 바람직하지 못한 동종이량체를 생성시킨다는 것이다. 이종이량체를 우세하게 생성시키는 이중특이성 항체의 생성을 위한 보다 바람직한 기법은 PCT 공보 제 WO2012/131555에 개시되어 있다. 다수의 표적, 예를 들어 종양 세포상에 위치한 표적 및/또는 효과기 세포상에 위치한 표적에 대한 이중특이성 항체를 생성시킬 수 있다. 바람직하게 이중특이성 항체는 AXL, Bcl2, HER2, HER3, EGF, EGFR, VEGF, VEGFR, IGFR, PD-1, PD-1L, BTLA, CTLA-4, GITR, mTOR, CS1, CD3, CD16, CD16a, CD19, CD20, CD22, CD25, CD27, CD28, CD30, CD32b, CD33, CD38, CD40, CD52, CD64, CD79, CD89, CD137, CD138, CA125, cMet, CCR6, MUCI, PEM 항원, Ep-CAM, EphA2, 17-1a, CEA, AFP, HLA II 부류, HLA-DR, HSG, IgE, IL-12, IL-17a, IL-18, IL-23, IL-1알파, IL-1베타, GD2-강글리오사이드, MCSP, NG2, SK-I 항원, Lag3, PAR2, PDGFR, PSMA, Tim3, TF, CTLA4, TL1A, TIGIT, SIRPa, ICOS, Treml2, NCR3, HVEM, OX40, VLA-2 및 4-1BB로 이루어지는 그룹 중에서 선택된 2개의 표적에 결합할 수 있다.
추가의 태양에서, 본 발명은 상술한 바와 같은 발현 구조물 또는 발현 벡터를 포함하는 숙주 세포를 제공한다. 상기 숙주 세포는 인간 또는 비-인간 세포일 수 있다. 대개 상기 숙주 세포는 포유동물 세포, 곤충 세포 및 효모 세포로 이루어지는 그룹 중에서 선택된다. 바람직한 숙주 세포는 포유동물 세포이다. 포유동물 숙주 세포의 바람직한 예는 비제한적으로 인간 배아 신장 세포(Graham FL et al., (1977) J. Gen. Virol. 36: 59-74), MRC5 인간 섬유아세포, 983M 인간 흑색종 세포, MDCK 개 신장 세포, 스프래그-다우리 래트로부터 단리된 RF 배양된 래트 폐 섬유아세포, B16BL6 쥐 흑색종 세포, P815 쥐 비만세포종 세포, MT1 A2 쥐 유방 선암종 세포, PER:C6 세포(라이덴(Leiden), 네덜란드 소재) 및 중국 햄스터 난소(CHO) 세포 또는 세포주(Puck TT et al., (1958), J. Exp. Med. 108: 945-955)를 포함한다. 특히 바람직한 실시태양에서 상기 숙주 세포는 중국 햄스터 난소(CHO) 세포 또는 세포주이다. 적합한 CHO 세포주는 예를 들어 CHO-S(인비트로젠(Invitrogen), 미국 캘리포니아주 칼스바드 소재), CHO Kl(ATCC CCL-61), CHO pro3-, CHO DG44, CHO P12 또는 dhfr- CHO 세포주 DUK-BII(Urlaub G & Chasin LA (1980) PNAS 77(7): 4216-4220), DUXBI l(Simonsen CC & Levinson AD (1983) PNAS 80(9): 2495-2499), 또는 CHO-K1SV를 포함한다.
추가의 태양에서, 본 명세는 숙주 세포를 상술한 바와 같은 발현 구조물 또는 발현 벡터로 형질감염시키고, 상기 숙주 세포를 인큐베이션하고, 관심 폴리펩티드의 세포막 발현을 검출하고 목적하는 세포막 발현을 갖는 숙주 세포 클론을 선택함을 포함하는 관심 폴리펩티드를 발현하는 숙주 세포의 선택 방법을 제공한다. 추가의 단계에서 상기 관심 폴리펩티드를 상기 숙주 세포로부터 회수할 수 있다. 상기 폴리펩티드는 바람직하게는 이종, 보다 바람직하게는 인간 폴리펩티드이다. 실시예들에 나타낸 바와 같이, 상기 관심 폴리펩티드의 세포막 발현 수준은 발현된 가용성 폴리펩티드의 수준에 직접 비례한다. 따라서 상기는 높은 수준의 관심 폴리펩티드를 발현하는 숙주 세포 클론의 정량적인 선택을 가능하게 한다.
바람직한 실시태양에서, 본 발명은 숙주 세포를 상술한 바와 같은 발현 구조물 또는 발현 벡터로 형질감염시키고, 상기 숙주 세포를 인큐베이션하고, 다량체성 관심 단백질의 세포막 발현을 검출하고 목적하는 세포막 발현을 갖는 숙주 세포 클론을 선택함에 의한 다량체성 단백질, 바람직하게는 이종이량체성 항체를 발현하는 숙주 세포의 시험관내 선택 방법을 제공한다. 추가의 단계에서 상기 다량체성 관심 단백질, 예를 들이 이종이량체성 항체를 상기 숙주 세포로부터 회수할 수 있다. 실시예들에 나타낸 바와 같이, 불필요한 동종이량체성 항체종보다 많은 이종이량체성 항체를 디스플레이하는 숙주 세포를 용이하게 선택할 수 있다, 즉 숙주 세포 클론의 정성적인 선택을 허용할 수 있다.
본 발명에 따라 상기 발현 구조물 또는 발현 벡터를 숙주 세포에 형질감염시키기 위해서, 당해 분야에 주지된 바와 같은 임의의 형질감염 기법, 예를 들어 일렉트로포레이션, 칼슘 포스페이트 공-침전, 양이온성 중합체 매개된 형질감염, 리포펙션을 적합한 경우 주어진 숙주 세포 유형에 사용할 수 있다. 본 발명의 발현 구조물 또는 발현 벡터로 형질감염된 숙주 세포는 일시적으로 또는 안정하게 형질감염된 세포주인 것으로서 해석됨에 유의한다. 따라서, 본 발명에 따라 본 발명의 발현 구조물 또는 발현 벡터를 에피솜으로 유지시키거나, 즉 일시적으로 형질감염시키거나, 또는 숙주 세포의 게놈에 안정하게 통합시킬 수 있다, 즉 안정하게 형질감염시킬 수 있다.
일시적인 형질감염은 벡터 전달 선택 마커에 대한 임의의 선택압의 비-적용을 특징으로 한다. 형질감염 후 통상적으로 2 내지 10일 지속되는 일시 발현 실험에서, 상기 형질감염된 발현 구조물 또는 발현 벡터는 에피솜 요소로서 유지되며 아직 게놈에는 통합되지 않는다. 즉 상기 형질감염된 DNA는 대개 숙주 세포 게놈에 통합되지 않는다. 상기 숙주 세포는 상기 형질감염된 DNA를 상실하는 경향이 있으며 상기 형질감염된 DNA를 상실한 세포는 일시 형질감염된 세포 풀의 배양시 집단 중 형질감염된 세포를 과잉번식시키는 경향이 있다. 따라서 발현은 형질감염 직후 기간에 가장 강력하며 시간에 따라 감소한다. 바람직하게, 본 발명에 따른 일시 형질감염체는 형질감염 후 2 내지 10일의 시간까지 선택압의 부재하에 세포 배양물 중에서 유지되는 것으로서 이해된다.
본 발명의 바람직한 실시태양에서 숙주 세포, 예를 들어 CHO 숙주 세포는 본 발명의 발현 구조물 또는 발현 벡터로 안정하게 형질감염된다. 안정한 형질감염은 새로 도입된 외래 DNA, 예를 들어 벡터 DNA가, 대개는 무작위, 비-동종 재조합 사건들에 의해 게놈 DNA내로 통합됨을 의미한다. 상기 벡터 DNA의 사본수 및 부수적으로 유전자 생성물의 양을, 상기 벡터 서열이 상기 숙주 세포의 DNA내에 통합 후 증폭된 세포주를 선택함으로써 증가시킬 수 있다. 따라서, 상기와 같은 안정한 통합은, 유전자 증폭을 위한 추가의 선택압의 증가에 노출시, CHO 세포 중에 미소쌍 염색체를 생성시킬 수 있다. 더욱 또한, 안정한 형질감염은 재조합 유전자 생성물의 발현과 직접적인 관련이 없는 벡터 서열 부분을 상실시킬 수 있다, 예를 들어 세균 사본수 조절 영역을 게놈 통합시 불필요하게 만들 수 있다. 따라서, 형질감염된 숙주 세포는 상기 발현 구조물 또는 발현 벡터의 적어도 일부 또는 상이한 부분이 게놈내에 통합되었다.
추가의 태양에서, 본 명세는 포유동물 숙주 세포로부터 이종 폴리펩티드의 발현을 위한 상술한 바와 같은 발현 구조물 또는 발현 벡터의 용도, 특히 포유동물 숙주 세포로부터 이종 폴리펩티드의 시험관내 발현을 위한 상술한 바와 같은 발현 구조물 또는 발현 벡터의 용도를 제공한다. 바람직한 실시태양에서 상술한 발현 구조물 또는 발현 벡터는 포유동물 숙주 세포로부터의 이종이량체성 항체의 시험관내 발현에 사용된다.
본 발명에 개시된 바와 같은 발현 구조물을, 관심 폴리펩티드 또는 단백질을 발현하는 재조합 숙주 세포의 선택 방법에 사용할 수 있다. 바람직하게, 상기 관심 단백질은 항체이다. 상기 방법은
(i) 숙주 세포를
(a) 5'에서 3' 방향으로
프로모터;
항체 중쇄를 암호화하는 엑손;
스플라이스 공여 부위, 인트론 및 스플라이스 수용 부위(여기에서 제1 정지 코돈이 상기 인트론 내의 스플라이스 공여 부위와 스플라이스 수용 부위 사이에 위치한다);
변형된 면역글로불린 막관통 영역 또는 변형되거나 변형되지 않은 비-면역글로불린 막관통 영역 중에서 선택된 막관통 영역을 암호화하는 제2 엑손;
제2 정지 코돈; 및
폴리(A) 부위
를 포함하는 발현 구조물,
(b) 항체 경쇄를 암호화하는 발현 구조물
과 함께 동시-형질감염시키고,
(ii) 상기 항체의 발현에 적합한 조건하에서 상기 형질감염된 숙주 세포를 배양하고;
(iii) 상기 항체의 세포막 발현을 검출하고;
(iv) 상기 세포막의 표면상에 상기 항체를 디스플레이하는 숙주 세포를 선택함
을 포함한다.
더욱 또한, 상기 상세히 나타낸 방법을 이중특이성 항체를 발현하는 재조합 숙주 세포의 선택에 사용할 수 있으며, 이때 상기 숙주 세포를 비-면역글로불린 막관통 영역, 예를 들어 쥐 B7-1 막관통 영역의 스플라이스와 함께, scFv-Fc를 암호화하는 제3 발현 구조물 또는 scFv-Fc를 암호화하는 제3 발현 구조물로 동시-형질감염시킨다.
상기 목적하는 숙주 세포의 선택을 당해 분야에 공지된 방법에 따라 수행할 수 있다. 상기와 같은 방법은 형광, ELISA, 웨스턴 블럿팅, SDS 폴리아크릴아미드 젤 전기영동, 방사성면역분석, 또는 항체 또는 특이성 분자, 예를 들어 관심 단백질을 인식하여 결합하는 앱타머의 사용을 포함한다. 바람직하게, 상기 숙주 세포의 막상에 디스플레이된 관심 단백질을 형광 탐침에 의해 검출하거나, 또는 형광 표지에 연결시키며, 따라서 형광 활성화된 세포 분류 또는 FACS를 사용하는 선택이 허용된다.
상기 단백질의 발현 및 회수를 당해 분야의 숙련가에게 공지된 방법들에 따라서 수행할 수 있다.
추가의 태양에서, 본 명세는 질환의 치료를 위한 약제의 제조를 위한 상술한 바와 같은 발현 구조물 또는 발현 벡터의 용도를 제공한다.
추가의 태양에서, 본 명세는 질환의 치료를 위한 약제로서 사용하기 위한 상술한 바와 같은 발현 구조물 또는 발현 벡터를 제공한다.
추가의 태양에서, 본 명세는 유전자 요법에 사용하기 위한 상술한 바와 같은 발현 구조물 또는 발현 벡터를 제공한다.
실시예
실시예 1: 벡터의 클로닝
도입
제조된 선택적 스플라이스 구조물은 인간 ighg1 유전자의 스플라이스 공여체 서열을 포함하였다. 인트론(스플라이스 수용 부위를 포함한다)은 치킨 cTNT 인트론 4로부터 유래된 반면, 엑손은 상기 ighg1 유전자의 막관통 영역(하기에서 M1M2라 칭한다), T-세포 수용체 알파의 막관통 영역(PTCRA), 또는 쥐 B7-1 유전자로부터 유래되었다. 다수의 구조물에서, 상기 쥐 B7-1 막관통 도메인은 천연 막관통 도메인을 포함한 다른 막관통 도메인들, 및 이들의 변형에 의해 치환되었다. 더욱 또한, 상기 B7-1 막관통 영역 중의 B7-1 시토졸 꼬리는 ER 유출 신호가 있거나 없는 다수의 다른 시토졸 꼬리에 의해 치환되었다.
IgG1 또는 IgG4 포맷의 완전길이 항체의 발현을 위해서, 중쇄 및 경쇄의 동시 발현이 필요하였다. 모든 서브유닛을 동시-형질감염 전략을 사용하여 별도의 플라스미드를 사용하여 발현시켰다. 상기 선택적 스플라이스 구조물을 IgG1 또는 IgG4 중쇄의 발현에 사용하였다. 상기 IgG1 또는 IgG4의 경쇄를 동일한 발현 벡터 주쇄 (backbone) 중에서, 그러나 선택적 스플라이스 없이 클로닝하였다.
사내(in-house) 생성된 이중특이성 항체 포맷(BEAT® 테크놀로지; WO2012/131555에 개시됨)의 발현을 위해서, 3개의 상이한 서브유닛을 세포 중에 형질감염시켜야 했다: 중쇄, 경쇄 및 scFv-Fc. 상기 이중특이성 항체 포맷의 막 디스플레이에 최선의 전략을 평가하기 위해서, 스플라이싱된 구조물 및 선택적 스플라이스 구조물을 중쇄 및 scFv-Fc의 발현을 위해 클로닝하였다. 경쇄를 동일한 발현 벡터 주쇄 중에, 그러나 선택적 스플라이스 없이 클로닝하였다. 표 1은 본 실시예에서 생성된 모든 구조물들을 요약한다.
생성된 모든 구조물들에 대한 요약(*)
플라스미드 명칭 플라스미드 배치 번호 DNA 서열
서열번호
단백질 서열
서열번호
pGLEX41_IgG4-HC   GSB59 79 126
pGLEX41_HC GSC314 48 286
pGLEX41_LC GSC315 294 295
pGLEX41_IgG4-LC GSC3704 319 320
pGLEX41_HC-AS GSC3836 287 288
pGLEX41_HC-cTNT인트론4 GSC3848 289 288
pGLEX41_HC-I4-M1M2-M1M2-M1M2 GSC3899 36 290
pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2 GSC4398 37 290
pGLEX41_HC-I4(폴리A)-M1M2-M1M2-M1M2 GSC4401 38 290
pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter GSC4402 39 290
pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2 GSC5537 50 299
pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2 GSC5538 52 301
pGLEX41_BEAT-LC GSC5540 302 303
pGLEX41_BEAT-HC-His GSC5607 296 297
pGLEX41_scFv-Fc GSC5608 51 300
pGLEX41_BEAT-HC GSC5644 49 298
pGLEX41_HC-I4-PTCRA GSC5854 40 291
pGLEX41_HC-I4(0Y)-PTCRA GSC5855 41 291
pGLEX41_HC-I4-PTCRA-SV40ter GSC5856 43 291
pGLEX41_HC-I4(폴리A)-PTCRA GSC5857 42 291
pGLEX41_HC-I4-M1M2-PTCRA-M1M2 GSC6030 44 292
pGLEX41_HC-I4-M1M2-PTCRA-M1M2-SV40ter GSC6046 47 292
pGLEX41_HC-I4(폴리A)-M1M2-PTCRA-M1M2 GSC6047 46 292
pGLEX41_HC-I4(0Y)-M1M2-PTCRA-M1M2 GSC6048 45 292
pGLEX41_HC-I4-B7-B7-B7 GSC7056 55 293
pGLEX41_HC-I4(0Y)-B7-B7-B7 GSC7057 53 293
pGLEX41_HC-I4(폴리A)-B7-B7-B7 GSC7058 54 293
pGLEX41_HC-I4-B7-B7-B7-SV40ter GSC7059 56 293
pGLEX41_HC-I4(5Y)-I4-B7-B7-B7 GSC9763 61 293
pGLEX41_HC-SD_CCC-I4-B7-B7-B7 GSC9764 58 293
pGLEX41_HC-SD_GGC-I4-B7-B7-B7 GSC9765 57 293
pGLEX41_HC-I4(5Y-5)-I4-B7-B7-B7 GSC9768 60 293
pGLEX41_HC-I4(3Y)-I4-B7-B7-B7 GSC9770 62 293
pGLEX41_HC-I4(9Y)-I4-B7-B7-B7 GSC9949 59 293
pGLEX41_HC-I4(15Y-3')-I4-B7-B7-B7 GSC9950 63 293
pGLEX41_scFv-Fc-I4-B7-B7-B7 GSC10487 323 324
pGLEX41_BEAT-HC-I4-B7-B7-B7 GSC10488 321 322
pGLEX41_HC-I4-B7-PTCRA_K13V-B7 GSC11203 95 142
pGLEX41_HC-I4-B7-PTCRA-B7 GSC11204 93 140
pGLEX41_HC-I4-B7-PTPMR-B7 GSC11205 84 131
pGLEX41_HC-I4-M1M2-PTCRA-M1M2_버전 1 GSC11206 284 285
pGLEX41_HC-I4-B7-B7-6His GSC11207 112 159
pGLEX41_HC-I4-B7-PTCRA_K13V_D18V-B7 GSC11208 99 146
pGLEX41_HC-I4-B7-B7-KCFCK GSC11209 113 160
pGLEX41_HC-I4-B7-CD4-B7 GSC11210 83 130
pGLEX41_HC-I4-B7-PTCRA_D18V-B7 GSC11211 96 143
pGLEX41_HC-I4-B7-PTCRA_R8V_K13V-B7 GSC11212 97 144
pGLEX41_HC-I4-B7-ACVL1-B7 GSC11213 81 128
pGLEX41_HC-I4-B7-ANTR2-B7 GSC11214 82 129
pGLEX41_HC-I4-B7-PTCRA_R8V-B7 GSC11216 94 141
pGLEX41_HC-I4-B7-TNR5-B7 GSC11217 85 132
pGLEX41_IgG4-HC-B7-B7-B7 GSC11218 80 127
pGLEX41_HC-I4-B7-PTCRA_R8V_K13V_D18V-B7 GSC11291 100 147
pGLEX41_HC-I4-B7-B7(26)-B7 GSC11292 111 158
pGLEX41_HC-I4-B7-IGF1R-B7 GSC11295 88 135
pGLEX41_HC-I4-B7-1B07-B7 GSC11296 87 134
pGLEX41_HC-I4-B7-FCERA-B7 GSC11297 101 148
pGLEX41_HC-I4-B7-KI2L2-B7 GSC11298 102 149
pGLEX41_HC-I4-B7-M1M2-B7 GSC11389 107 154
pGLEX41_HC-I4-B7-TRBM-B7 GSC11390 89 136
pGLEX41_HC-I4-B7-IL4RA-B7 GSC11391 90 137
pGLEX41_HC-I4-B7-LRP6-B7 GSC11392 91 138
pGLEX41_HC-I4-B7-IL3RB-B7 GSC11393 103 150
pGLEX41_HC-I4-B7-CD3E-B7 GSC11394 104 151
pGLEX41_HC-I4-B7-ITA2B-B7 GSC11395 105 152
pGLEX41_HC-I4-B7-CD28-B7 GSC11396 106 153
pGLEX41_HC-I4-B7-GpA-B7 GSC11397 92 139
pGLEX41_HC-I4-B7-PTCRA_R8V_D18V-B7 GSC11398 98 145
pGLEX41_HC-I4-B7-B7-GAT1noER GSC11483 118 165
pGLEX41_HC-I4-B7-B7(24)-B7 GSC11484 110 157
pGLEX41_HC-I4-B7-B7(18)-B7 GSC11677 108 155
pGLEX41_HC-I4-B7-B7-ERGIC53_noER GSC11678 116 163
pGLEX41_HC-I4-B7-B7(20)-B7 GSC11679 109 156
pGLEX41_HC-I4-B7-ITB1-B7 GSC11756 86 133
pGLEX41_HC-I4-B7-B7-M1M2 GSC11758 114 161
pGLEX41_HC-I4-B7-B7-GAT1 GSC11759 117 164
pGLEX41_HC-I4-B7-B7-AGTR2 GSC11760 119 166
pGLEX41_HC-I4-B7-B7-AGTR2_noER GSC11761 120 167
pGLEX41_HC-I4-B7-B7-V1BR GSC11762 121 168
pGLEX41_HC-I4-B7-B7-VGLG_noER GSC11763 124 171
pGLEX41_HC-I4-B7-B7-ERGIC53 GSC11764 115 162
pGLEX41_HC-I4-B7-B7-V1BR_noER GSC11765 122 169
pGLEX41_HC-I4-B7-B7-VGLG GSC11766 123 170
pGLEX41_HC-I4-M1M2-M1M2-B7 GSC11294 125 172
*서열은 GSC314 (서열번호 48), GSC315 (서열번호 294), GSC5607 (서열번호 296), GSC5644 (서열번호 49), GSC5608 (서열번호 51), GSC5540 (서열번호 302), GSB59 (서열번호 79)(완전한 ORF 서열)를 제외하고, 스플라이싱되지 않은 ORF의 최종 5개 아미노산으로부터 DNA 서열을 위한 발현 구조물의 단부까지 및 동일한 아미노산으로부터 단백질 서열을 위한 융합된 막관통 영역의 단부까지의 신장부를 나열하였다
물질 및 방법
LB 배양 플레이트
500 ㎖의 물을 혼합하고 16 g의 LB 아가(인비트로젠, 미국 캘리포니아주 칼스바드 소재)(1 L의 LB는 10 g의 트립톤, 5 g의 효모 추출물 및 10 g의 NaCl을 함유한다)와 함께 비등시켰다. 냉각 후, 각 항생제를 상기 용액에 가하고 이어서 상기 용액을 도말하였다(암피실린 플레이트 100 g/㎖ 및 가나마이신 플레이트 50 g/㎖).
폴리머라제 쇄 반응( PCR )
모든 PCR을 1 ℓ의 dNTP(각각의 dNTP에 대해서 10 mM; 인비트로젠, 미국 캘리포니아주 칼스바드 소재), 2 단위의 퓨전(Phusion)® DNA 폴리머라제(핀자임스(Finnzymes) Oy, 핀란드 에스포 소재), 25 nmol의 프라이머 A(마이크로신스(Microsynth), 스위스 발가 소재, 또는 오페론(Operon), 독일 에베르스베르크 소재), 25 nmol의 프라이머 B(마이크로신스, 스위스 발가 소재, 또는 오페론, 독일 에베르스베르크 소재), 10 ℓ의 5X HF 완충제(7.5 mM MgCl2, 핀자임스, 핀란드 에스포 소재), 1.5 ℓ의 디메틸 설폭사이드(DMSO, 핀자임스, 핀란드 에스포 소재) 및 1 내지 3 ℓ의 주형(10 내지 20 ng)을 50 ℓ의 최종 부피로 사용하여 수행하였다. 사용된 모든 프라이머를 표 2에 나열한다.
상기 PCR은 98 ℃에서 3분의 초기 변성에 의해 개시된 다음, 35 주기의 98 ℃에서 30초 변성, 프라이머-특이적 온도(GC 함량에 따라)에서 30초 어닐링 및 72 ℃에서 2분 연장을 수행하였다. 72 ℃에서 10분간의 최종 연장을 냉각 전에 수행하고 4 ℃에서 유지시켰다.
PCR에 사용된 프라이머들에 대한 요약. 프라이머들을 오페론 (독일 에베르스베르크 소재) 또는 마이크로신스(스위스 발가 소재)로부터 수득하였다.
프라이머 명칭 프라이머 서열 서열번호
GlnPr269 CAGGGGGGCGGAGCCTATGG 1
GlnPr497 GCCCCCCTCCCGCGAGGAGATGACCAAGAACCAGGTGTCCCTG 2
GlnPr498 TTTCTAGATTCATCACTTGCCGGGGGACAGGCTC 3
GlnPr501 TATAAAGCTTCCACCATGGAGAGCCCTGCCC 4
GlnPr502 TATATCTAGATTCATCAGCACTCGCCCCGGTTG 5
GlnPr1285 CGGAAGAATTCAGCCACAGCTTTAAGGCACCTGGCTAAC 259
GlnPr1437 CCAAATCGATTTATCAGCACTCGCCCCGGTTGAAG 6
GlnPr1452 ACGTATCGATTCATCACTTGCCGGGGGACAG 327
GlnPr1487 CTGCTGCTGTGGCTGCCCGACGGGGTGCACGCTGAGATCGTGCTGACACAGAG 325
GlnPr1488 CTGCTGCTGTGGCTGCCCGACGGGGTGCACGCTCAGGTCACACTGAAAGAGTC 328
GlnPr1491 CCAAATCGATTTATCAGCACTCGCCCCGGTTGAAG 326
GlnPr1494 ACGAACTAGTCCACCATGGAAAGCCCAGCCCAGCTGCTGTTCCTGCTGCTGCTGTGGCTGCCCGAC 260
GlnPr1500 CCGGGATCGATTTATCAGTGATGGTGATGGTGATG 7
GlnPr1502 GGCCGATCGATTTATCACTTGCCAGGAGACAG 8
GlnPr1516 GATGAAAGCTTGGTAGGTGATCCTCCTG 9
GlnPr1517 ATGTATTCGAATATCTCCACCGGTTGCAGCTCTGAGCCAGGGAGGAGGGAAG 10
GlnPr1518 TAAGCTAGCCCACCATGGAGAGCCCTGC 11
GlnPr1519 GAGGCTCTTCTGCGTGTAGTGGTTGTGCAAGGCCTCGTGCATCACGCTG 12
GlnPr1520 CTACCAAGCTTTCATCATTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTG 13
GlnPr1521 GGGAGCTGGACGGGCTGTGGACGACCATCACCATCTTCATCACACTCTTCCTGTTAAGCGTGTGCTACAGTGCCACCGTCACCTTCTTCAAG 14
GlnPr1522 GTAGTCGGGGATGATGGTCTGCTTCAGGTCCACCACCGAGGAGAAGATCCACTTCACCTTGAAGAAGGTGACGGTGGCACTGTAGCACACGC 15
GlnPr1523 ATATACCGGTGGAGAGCTGTGCGGAGGCGCAGGACGGGGAGCTGGACGGGCTGTG 16
GlnPr1524 ATATTTCGAATCACTAGGCCCCCTGTCCGATCATGTTCCTGTAGTCGGGGATGATGGTC 17
GlnPr1649 TCTCCACCGGTTGCAGCTCTGTTCCCTCCTCCCTCGGTTAG 18
GlnPr1650 GCGCCATCGATACAGACATGATAAGATACATTG 19
GlnPr1651 GCGCGATCGATACTTGTTTATTGCAGCTTATAATGG 20
GlnPr1689 ATATGCTAGCCCACCATGCGGAGCCCTGCCCAGCTGCTGTTCCTGCTGCTGCTG 21
GlnPr1690 TGCTGTTCCTGCTGCTGCTGTGGATCCCTGGCACCAACGCCGAGGTGCAGCTGGTCGAGTC 22
GlnPr1725 ATATACTAGTCCACCATGCGGAGCCCTGCCCAGCTGCTGTTCCTGCTGCTGCTG 23
GlnPr1726 CTGTTCCTGCTGCTGCTGTGGATCCCTGGCACCAACGCCCAGGTGCAGCTGCAGCAGTC 24
GlnPr1727 CTGTTCCTGCTGCTGCTGTGGATCCCTGGCACCAACGCCATGGAGACAGACACACTCC 25
GlnPr1735 GACTTCGAATCATCAATGATGGTGGTGGTGATGGGCGCTGGCGAGGAGCAGGTCGAACAGGAGCAGCTTG 26
GlnPr1760 CCGCATCGATTTATCATTTACCCGGGCTCAGGCTCAG 27
GlnPr1799 ATATACCGGTGGAGGCCCTGTGGCTGGGCGTGCTGAGACTGCTGCTGTTCAAGCTGCTCCTGTTCGACCTG 28
GlnPr1800 GTAAGCTTTCATCATTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGAATCGGTTGTGC 29
GlnPr1801 GCGCGAAGCTTTCATCATTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTATAATGATTG 30
GlnPr1840 ATATACCGGTGGAGGCCCTGTGGCTGGGCGTGCTG 31
GlnPr2099 TCCTCGGGGGGAGATCCACCACCACCTGAGCCAGGGAGGAGGGAAG 32
GlnPr2100 GCGCTTCGAATCATCACAGAAACACGGTCTG 33
GlnPr2101 TGGTGGTGGATCTCCCCCCGAGGACCCCCCTGACTCCAAG 34
GlnPr2102 TCCTCGGGGGGAGATCCACCACCACCTGTTCCCTCCTCCCTCGGTTAG 35
GlnPr2160 CCAAGCTTTCATCATTTGCCCGGAGACAGGGAGAGG 312
GlnPr2161 CCAAGCTTTCATCATTTACCGGGAGACAGGGAGAGGCTCTTC 313
GlnPr2162 GTCCTCGGGGGGAGATCCACCACCACCTGTCCCAGAAGGAGACGGTTAG 314
GlnPr2163 GTCCTCGGGGGGAGATCCACCACCACCTGTGCAATCCTCCCAGGGTTAG 315
GlnPr2164 GTCCTCGGGGGGAGATCCACCACCACCTGTGCAATAAGGACAGGGTTAG 316
GlnPr2165 GTCCTCGGGGGGAGATCCACCACCACCTGTCCCCTCAGGTCTCGGTTAG 317
GlnPr2166 GTCCTCGGGGGGAGATCCACCACCACCTGAGCCAGGTAGCAGGGAAGGG 318
GlnPr2294 CTACCAAGCTTTCATCATTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGTTGTGCAAGGCCTCG 261
GlnPr2376 GGCCGTTCGAATCATCACTTGCAGAAGCACTTGATAATC 219
GlnPr2377 GTCATTTCGAATCATCAATGATGGTGGTGGTGATGGGCGCTGGCGATAATCACGACGATCACGAC 220
GlnPr2378 TTGAACAGCAGCAGTCTCAGCACGCCCAGCCACAGGGCCCCGTCCAGCTCCCCGTCCTG 221
GlnPr2379 CTGAGACTGCTGCTGTTCAAGCTGCTCCTGTTCGACCTGCTCCTCAAGTGGATCTTCTCCTCGGTG 222
GlnPr2380 GCTTGAACAGCAGCAGTCTCAGCACGCCCAGCCACAGGGCATTCTTGGAGTCAGGGGGGTCCTC 223
GlnPr2381 CAGGACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGTCGAACAGGAGCAGCTTGAACAGCAGCAGTCTC 224
GlnPr2382 GCTTGAACAGCAGCAGTACCAGCACGCCCAGCCACAGGGCATTCTTGGAGTCAGGGGGGTCCTC 225
GlnPr2383 CAGGACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGTCGAACAGGAGCAGCTTGAACAGCAGCAGTACC 226
GlnPr2384 GACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGTCGAACAGGAGCAGCACGAACAGCAGCAGTCTC 227
GlnPr2385 GACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGACGAACAGGAGCAGCTTGAACAGCAGCAGTCTC 228
GlnPr2386 CAGGACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGTCGAACAGGAGCAGCACGAACAGCAGCAGTACC 229
GlnPr2387 CAGGACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGACGAACAGGAGCAGCTTGAACAGCAGCAGTACC 230
GlnPr2388 GACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGACGAACAGGAGCAGCACGAACAGCAGCAGTCTC 231
GlnPr2389 CAGGACCGGTGCTTGCAGAAGCACTTGAGGAGCAGGACGAACAGGAGCAGCACGAACAGCAGCAGTACC 232
GlnPr2390 GGTCGTGATCGTCGTGATTATCAAGTGGATCTTCTCCTCGGTGGTGG 233
GlnPr2391 CCACCACCGAGGAGAAGATCCACTTGATAATCACGACGATCACGACC 234
GlnPr2392 CTTCGGCGCCACCGTGGTCGTGATCGTCGTGATTATCAAGTG 235
GlnPr2393 CAGGACCGGTGCTTGCAGAAGCACTTGATAATCACGACGATC 236
GlnPr2394 CTTCGGCGCCACCGTGATCGTCGTGATTATCAAGTGCTTC 237
GlnPr2395 CAGGACCGGTGCTTGCAGAAGCACTTGATAATCACGAC 238
GlnPr2396 CTTCGGCGCCGTGGTCATTGTAACCGTGGTCGTGATCGTCGTG 239
GlnPr2397 CAGGACCGGTGCTTGCAGAAGCACTTGATAATCACGACGATCACGACCAC 240
GlnPr2398 CTTCGGCGCCGTGGTCATTGTAGTCGTAACCGTGGTCGTGATCGTCGTG 241
GlnPr2399 CAGGACCGGTGCTTGCAGAAGCACTTGATAATCACGACGATCACGACCACGG 242
GlnPr2400 GAGCCACCAGTGCCAGCAGAGCCAGCACAGGTCCCAGGATCAGAGCCAGATTCTTGGAGTCAGGGGGGTC 243
GlnPr2401 CAGGACCGGTGCTTGCAGAAGCACTTCCACAGTCCCAGCACTCCCAGAGCCACCAGTGCCAGCAG 244
GlnPr2402 CGATGCCCAGCAGCAGGAGCAACACCAGGATCACGATGATGGCGGCGATATTCTTGGAGTCAGGGGGGTC 245
GlnPr2403 CAGGACCGGTGCTTGCAGAAGCACTTCCAGAACCACCACATCAGGCCGATGCCCAGCAGCAGGAG 246
GlnPr2404 GATAAACAGCAGCAGGCCAGCCACTCCGCCCAGCACAATCAGGGCCATATTCTTGGAGTCAGGGGGGTC 247
GlnPr2405 CAGGACCGGTGCTTGCAGAAGCACTTGAAGAAGATGCCCAGGCCGATAAACAGCAGCAGGCC 248
GlnPr2406 GTCCAATCAGCACGATGCCAGCCACCACGCCGGCCACGATAGGGATGATATTCTTGGAGTCAGGGGGGTC 249
GlnPr2407 CAGGACCGGTGCTTGCAGAAGCACTTCCAGATCAGCAGCAGGGCCAGTCCAATCAGCACGATGCC 250
GlnPr2408 CCAGGAAGATGATCACGAACAGCAGGATGCCAGCGATCACGCCAGCGATATTCTTGGAGTCAGGGGGGTC 251
GlnPr2409 CAGGACCGGTGCTTGCAGAAGCACTTCATCACGAGCACCACGCCCAGGAAGATGATCACGAA 252
GlnPr2410 GCAGGATGGCGAACAGGATGCCGAAGATGATGGGGATCACGACCAGAGCATTCTTGGAGTCAGGGGGGTC 253
GlnPr2411 CAGGACCGGTGCTTGCAGAAGCACTTGATGAACACCAGCACCAGCAGGATGGCGAACAGGATG 254
GlnPr2412 CTTCGGCGCCGTGATTACCGTGGTCGTGATCGTCGTGATTATCAGGTCCCAGCAGGAGGCCGCCG 255
GlnPr2413 GTCATTTCGAATCATCAGAAGAACTTCTTGGCGGCGGCCTCCTGCTGGGAC 256
GlnPr2414 GTCATTTCGAATCATCACCACCACTTCTTGGCGGCGGCCTCCTGCTGGGAC 257
GlnPr2415 GGTCATTTCGAATCATCAGGAGCCCTTCAGGGTCAGGAACATGATAATCACGACGATCACGAC 258
제한 절단
모든 제한 절단을 위해서 대략 1 g의 플라스미드 DNA(나노드롭(NanoDrop)에 의해 정량분석됨, ND -1000 분광광도계(써모 사이언티픽(Thermo Scientific), 미국 델라웨어주 윌밍톤 소재))를 10 내지 20 단위의 각 효소, 4 ℓ의 상응하는 10X NEBuffer(NEB, 미국 매사추세츠주 입스위치 소재)와 혼합하고, 부피를 멸균 H2O로 40 ℓ까지 만들었다. 상기 반응물을 상기 효소들에 필요한 온도에서 1시간 동안 인큐베이션하였다.
주쇄의 각각의 예비 절단 후에, 1 단위의 송아지 장 알칼리성 포스파타제(CIP; NEB, 미국 매사추세츠주 입스위치 소재)를 가하고 상기 혼합물을 37 ℃에서 30분 인큐베이션하였다.
PCR 클린업
절단을 허용하기 위해서, 모든 PCR 단편을 제한 절단에 앞서 40 ㎕의 용리 완충제를 사용하여 제조사의 매뉴얼에 따라 마슈레이 나겔(Macherey Nagel) 추출 II 키트(마슈레이 나겔, 스위스 왼징겐 소재) 또는 젤 및 PCR 클린업 키트(동일한 키트의 새로운 상표명)를 사용하여 세척하였다. 상기 프로토콜을 또한 DNA 샘플의 교환에 사용하였다.
DNA 추출
젤 전기영동을 1 내지 2% 아가로스 젤을 사용하여 수행하였다. 상기를 필요량의 울트라퓨어(UltraPure)™ 아가로스(인비트로젠, 미국 캘리포니아주 칼스바드 소재) 및 1X 트리스 아세트산 EDTA 완충제(TAE, pH 8.3; Bio RAD, 독일 뮌헨 소재)를 사용하여 제조하였다. DNA의 염색을 위해서 1 ℓ의 젤 레드 염료(바이오툼(Biotum), 미국 캘리포니아주 헤이워드 소재)를 100 ㎖의 아가로스 젤에 가하였다. 크기 마커로서 2 ℓ의 1 kb DNA 사다리 (DNA ladder)(NEB, 미국 매사추세츠주 입스위치 소재)를 사용하였다. 상기 전기영동을 125 볼트에서 대략 1시간 동안 실행하였다.
관심 밴드를 상기 아가로스 젤로부터 잘라 내고 40 ㎕의 용리 완충제를 사용하여 제조사의 매뉴얼에 따라 상기 추출 II 키트(마슈레이 나겔, 스위스 왼징겐 소재) 또는 젤 및 PCR 클린업 키트(동일한 키트의 새로운 상표명) 또는 퀴아퀵(Qiaquick) 젤 추출 키트(퀴아겐(Qiagen), 독일 힐덴 소재)를 사용하여 정제하였다.
연결
각각의 연결 (ligation)을 위해서, 4 ℓ의 삽입물을 1 ℓ의 벡터, 400 단위의 리가제(T4 DNA 리가제, NEB, 미국 매사추세츠주 입스위치 소재) 및 1 ℓ의 10X 리가제 완충제(T4 DNA 리가제 완충제; NEB, 미국 매사추세츠주 입스위치 소재)와 혼합하고 UHP 수를 사용하여 10 ℓ의 최종 부피로 충전하였다. 상기 혼합물을 RT에서 1 내지 2시간 인큐베이션하였다.
연결 생성물의 수용성( competent ) 세균내로의 형질전환
연결 생성물의 형질전환을 위해서, 수용성 세균 "TOP 10"(원샷(OneShot)® TOP 10 컴피턴트 이 콜라이; 라이프 테크놀로지스(Life Technologies), 미국 캘리포니아주 칼스바드 소재)을 사용하였다. 25 내지 50 ℓ의 세균을 얼음상에서 5분간 해동시켰다. 이어서 3 내지 5 ℓ의 연결 생성물을 수용성 세균에 가하고 얼음상에서 20 내지 30분간 인큐베이션한 후에 42 ℃에서 1분의 짧은 열 충격을 가하였다. 이어서, 튜브당 500 ℓ의 S.O.C 배지(인비트로젠, 미국 캘리포니아주 칼스바드 소재)를 가하고 교반하에 37 ℃에서 1시간 동안 인큐베이션하였다. 최종적으로, 상기 세균을 암피실린 또는 가나마이신(시그마 알드리치, 미국 미주리주 세인트 루이스 소재)이 있는 LB 플레이트상에 놓고 37 ℃에서 밤새 인큐베이션하였다.
플라스미드의 소량표본
소량표본 (minipreparation)을 위해서, 형질전환된 세균의 콜로니를 2.5 ㎖의 LB 및 암피실린 또는 가나마이신 중에서 37 ℃, 200 rpm에서 6 내지 16시간 동안 증식시켰다. 이 콜라이용 플라스미드 정제 키트(뉴클레오스핀 퀵퓨어(NucleoSpin QuickPure) 또는 뉴클레오스핀 플라스미드(마슈레이 나겔, 스위스 외징겐 소재) 또는 퀴아겐 퀵라이스 미니프렙(Qiagen QuickLyse Miniprep)(퀴아겐))로 제조사의 매뉴얼에 따라 DNA를 추출하였다.
소량표본으로부터의 플라스미드 DNA를 나노드롭(NanoDrop) ND-1000 분광광도계(써모 사이언티픽, 미국 델라웨어주 윌밍톤 소재)로 260 ㎚에서 흡광도를 측정하고 OD260 ㎚/OD280 ㎚의 비(1.8 내지 2 사이에 있어야 한다)를 평가함으로써 정량분석하였다. 대조용 절단을, 상기 샘플을 서열 확인을 위해 파스테리스(Fasteris) SA(스위스 Plan-les-Quates 소재)로 보내기 전에 수행하였다.
플라스미드의 중간표본
중간표본을 위해서, 형질전환된 세균을 37 ℃에서 밤새 200 ㎖의 LB 및 암피실린(또는 가나마이신) 중에서 증식시켰다. 이어서, 상기 배양물을 725 g에서 20분 동안 원심분리시키고 상기 플라스미드를 제조사의 매뉴얼에 제공된 프로토콜에 따라 상업용 키트(뉴클레오본드 엑스트라 미디(NucleoBond Xtra Midi); 마슈레이 나겔, 스위스 외징겐 소재)를 사용하여 정제하였다.
중간표본으로부터의 플라스미드 DNA를 나노드롭 ND-1000 분광광도계로 260 ㎚에서 흡광도를 측정하고 OD260 ㎚/OD280 ㎚의 비(제한 절단에 의해 확인된 바와 같이 1.8 내지 2 사이에 있어야 한다)를 평가함으로써 3회 정량분석하였다. 이어서 상기 샘플을 서열분석을 위해 보냈다(파스테리스 SA, 스위스 Plan-les-Quates 소재).
플라스미드의 대량표본
대량표본을 위해서, 형질전환된 세균을 37 ℃에서 밤새 500 ㎖의 LB 및 암피실린(또는 가나마이신) 중에서 증식시켰다. 상기 배양물을 725 g에서 20분 동안 원심분리시키고 상기 플라스미드를 제조사의 매뉴얼에 제공된 프로토콜에 따라 상업용 키트(뉴클레오본드 PC500 또는 뉴클레오본드 엑스트라 맥시; 마슈레이 나겔, 스위스 외징겐 소재)를 사용하여 정제하였다.
대량표본으로부터의 플라스미드 DNA를 나노드롭 ND-1000 분광광도계로 260 ㎚에서 흡광도를 측정하고 OD260 ㎚/OD280 ㎚의 비(제한 절단에 의해 확인된 바와 같이 1.8 내지 2 사이에 있어야 한다)를 평가함으로써 3회 정량분석하였다. 이어서 상기 샘플을 서열분석을 위해 보냈다(파스테리스 SA, 스위스 Plan-les-Quates 소재).
플라스미드의 기가표본
기가표본을 위해서, 형질전환된 세균을 37 ℃에서 밤새 1500 ㎖의 LB 및 암피실린(또는 가나마이신) 중에서 증식시켰다. 상기 배양물을 725 g에서 20분 동안 원심분리시키고 상기 플라스미드를 제조사의 매뉴얼에 제공된 프로토콜에 따라 상업용 키트(뉴클레오본드 PC1000; 마슈레이 나겔, 스위스 외징겐 소재)를 사용하여 정제하였다.
기가표본으로부터의 플라스미드 DNA를 나노드롭 ND-1000 분광광도계로 260 ㎚에서 흡광도를 측정하고 OD260 ㎚/OD280 ㎚의 비(제한 절단에 의해 확인된 바와 같이 1.8 내지 2 사이에 있어야 한다)를 평가함으로써 3회 정량분석하였다. 이어서 상기 샘플을 서열분석을 위해 보냈다(파스테리스 SA, 스위스 Plan-les-Quates 소재).
결과
IgG1 항체의 중쇄의 클로닝
본 특허에 사용된 IgG1 중쇄를 암호화하는 유전자를 진아트(GeneArt)(독일 레겐스부르크 소재)에 의해 중국 햄스터 세포에서의 발현을 위해 최적화하였다. 상기 중쇄의 가변 부분 및 불변 부분을 진아트에 의해 2개의 상이한 플라스미드에 제공하였다. 수령 후에, 진아트 구조물을 물에 용해시키고 중쇄 불변 영역 및 중쇄 가변 영역을 함께 효소 KpnI 및 ApaI를 사용하여 클로닝하였다. 이 작업은 외부 CRO에 의해 수행되었으며 융합된 생성물을 클렌마크(Glenmark)로 전달하였다. 상기 융합된 구조물의 서열분석 후에, 이론적인 서열과 비교된 중쇄 불변 영역 중의 서열 변화를 Fc 영역의 CH2 도메인 중에서 확인하였다(EEMTK에서 DELTK로). 프라이머를 메가프라이머 PCR에 의해 상기 영역이 변하도록 설계하고 동시에 개방 판독 프레임의 편리한 제한 부위 5' 및 3'을 도입시켰다.
프라이머 GlnPr497(서열번호 2) 및 GlnPr498(서열번호 3)을 사용하는 첫 번째 PCR을 원래 구조물상에서 수행하였다. 수득된 앰플리콘(304 bp)을, 제2 프라이머 GlnPr501 및 주형으로서 원래 구조물을 사용하여, 두 번째 PCR에서 메가프라이머로서 상이한 농도로 사용하였다. 최종 PCR 생성물을 젤-정제하고 셔틀 벡터 pCR-블런트(제로 블런트(Zero Blunt)® PCR 클로닝 키트, 인비트로젠, 라이프 테크놀로지스)내로 클로닝하였다. 소량표본 선별 후에, 상기 삽입 서열은 정확하였지만 상기 개방 판독 프레임에 대한 제한 부위 5' 및 3'은 누락된 것으로 나타났다. 따라서 상기 삽입물을 프라이머 GlnPr501(서열번호 4) 및 GlnPr498(서열번호 3) 및 보다 높은 어닐링 온도(64 ℃)를 사용하여 재-증폭시켰다. 상기 앰플리콘을 젤-정제하고 pCR-블런트(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프 테크놀로지스)내로 클로닝하였다. 정확한 제한 패턴을 갖는 하나의 소량표본을, 제한 효소 HindIII 및 XbaI를 사용하여, 셔틀 벡터, pSEL1에서 서브클로닝을 위해 선택하였다. 소량표본 선별 후에, 대량표본을 생성시켰다. 상기 대량표본의 삽입물을 제한 효소 XbaI 및 HindIII를 사용하여 다시 컷아웃하고, 동일한 효소로 개방하고 CIP로 처리한 플라스미드 pGLEX41(GSC281, 서열번호 304)의 주쇄내에 클로닝하였다. pGLEX41은 발현을 위한 표준 사내 벡터이며 마우스 CMV 프로모터에 이어서 구성적으로 스플라이싱된 인트론, 다중 클로닝 부위(MCS) 및 SV40 폴리(A) 서열로 이루어지는 발현 카세트를 함유한다. 소량표본 선별 후에, pGLEX41_HC의 대량표본을 생성시키고 플라스미드 배치 번호 GSC314를 받았다. 동일한 DNA의 추가의 소량표본 또는 기가표본은 플라스미드 배치 번호 GSC314a, GSC314b, GSC314c, GSC314d 및 GSC314e 를 받았다(이들 모든 표본은 DNA 서열분석에 의해 동일한 것으로 확인되었으며 GSC314 플라스미드(서열번호 48)라 지칭될 것이다).
IgG1 항체의 막 디스플레이된 중쇄에 대한 선택적 스플라이스 발현 벡터의 클로닝
IgG1 포맷의 항체의 중쇄의 암호화 영역을 프라이머 GlnPr1518(서열번호 11), GlnPr1519(서열번호 12) 및 GlnPr1520(서열번호 13) 및 주형으로서 플라스미드 pGLEX41_HC(GSC314, 서열번호 48)를 사용하여 PCR에 의해 증폭시켰다. 생성되는 PCR 생성물은 5' 단부에 NheI 제한 부위를 함유하였으며, 상기 앰플리콘의 3' 단부를 ighg1 유전자(서열번호 65)에 대한 NCBI 데이터베이스 엔트리의 최종 40 pb뿐만 아니라 HindIII 제한 부위를 정확하게 함유하도록 변형시켰다. 상기 3' 단부 변형은 천연 스플라이스 공여 부위를 상기 IgG1 중쇄의 불변 부분의 C-말단 영역 중에 재구성하기 위해서 수행되었다. 상기 PCR 생성물을 제한 효소 NheI 및 HindIII를 사용하여 절단하고, 동일한 효소를 사용하여 절단하고 CIP로 처리한 pGLEX41(GSC281, 서열번호 304)에 클로닝하였다. 상기 생성 벡터를 pGLEX41_HC-AS(플라스미드 배치 번호 GSC3836, 서열번호 287)라 칭하였으며 이는 제한 절단 및 서열 분석에 의해 확인되었다.
치킨 트로포닌(cTNT) 인트론 4번(서열번호 69)을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr1517(서열번호 10)로 그의 서열(GSC2819, 서열번호 67)을 함유하는 사내 플라스미드로부터 증폭시켰다. 트로포닌은 심장근 및 배아 골격근에서 독점적으로 발현된다. 상기 mRNA의 90% 이상은 엑손을 초기 배아 심장 및 골격근 중에 포함하는 반면 성인에서는 mRNA의 >95%가 상기 엑손을 차단한다(Cooper & Ordahl (1985) J Biol Chem, 260(20): 11140-8). 상기 프라이머는 HindIII 부위 5' 및 AgeI 부위에 이어서 3' 말단에 BstBI를 가하였다. 상기 앰플리콘을 젤-정제하고 HindIII 및 BstBI를 사용하여 절단하고, 동일한 효소를 사용하여 개방하고 CIP로 처리한 벡터 pGLEX41_HC-IgAS(GSC3836, 서열번호 287)내에 클로닝하였다. 상기 생성 벡터를 pGLEX41_HC-cTNT인트론4(플라스미드 배치 번호 GSC3848, 서열번호 289)라 칭하였으며 이는 제한 절단 및 서열 분석에 의해 확인되었다.
인간 ighg1 유전자의 막관통 영역(M1M2)을 암호화하는 서열을 플라스미드 GlnPr1521(서열번호 14) 및 GlnPr1522(서열번호 15)를 사용하여 조립하였다. 이들 프라이머는 부분적으로 중첩되며 PCR을 사용하여 이중 가닥 DNA로 완성시켰다. 상기 블런트-단부 PCR 생성물을 pCR-블런트(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프테크놀로지스)내로 클로닝하여 플라스미드 pCR블런트-M1M2를 생성시키고 이를 서열분석에 의해 확인하였다. 상기 삽입물을 프라이머 GlnPr1523(서열번호 16) 및 GlnPr1524(서열번호 17)로 재-증폭시켜 M1M2 막관통 도메인 서열을 완성시켰다. 상기 앰플리콘을 젤-정제하고, AgeI 및 BstBI를 사용하여 절단하고, 벡터 pGLEX41_HC-cTNT인트론4(GSC3848, 서열번호 289)에 클로닝하였다. 상기 생성 플라스미드를 pGLEX41_HC-I4-M1M2-M1M2-M1M2라 명명하고 대량표본 규모로 생성시키고, 플라스미드 배치 번호 GSC3899를 받았으며, 서열 분석에 의해 확인하였다(서열번호 36).
발현된 및 막 디스플레이된 항체간의 스플라이스 비를 증가시키기 위해서, 상기 막관통 영역을 암호화하는 엑손 상류 폴리(Y) 트랙 중의 피리미딘의 수를 감소시켰다. 이를 위해서 I4(0Y) 단편(서열번호 70)을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr1649(서열번호 18)를 사용하여 사내 벡터(GSC3469, 서열번호 68)로부터 증폭시켰다. 상기 앰플리콘을 제한 효소 HindIII 및 AgeI를 사용하여 절단하고, 동일한 효소를 사용하여 개방하고 CIP로 처리한 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)의 주쇄내로 클로닝하였다. 소량표본 선별 후에, 상기 중간표본 pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2를 제조하고, 배치 번호 GSC4389를 받고 서열분석에 의해 확인하였다(서열번호 37).
폴리(A)를 인트론에 도입시켜 IgG1을 암호화하는 엑손과 막관통 영역을 암호화하는 선택적 엑손을 분리시켰다. SV40 폴리(A) 신호를 프라이머 GlnPr1650(서열번호 19) 및 GlnPr1651(서열번호 20)로 사내 벡터(GSC3469, 서열번호 305)로부터 증폭시켰다. 상기 앰플리콘을 제한 효소 ClaI를 사용하여 절단하고 ClaI를 사용하여 절단하고 CIP로 처리한 벡터 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 클로닝하여 I4(폴리A) 인트론(서열번호 71)을 생성시켰다. 소량표본 선별 및 삽입물의 바른 배향 확인 후에, 상기 pGLEX41_HC-I4(폴리A)-M1M2-M1M2-M1M2 소량표본을 제조하고, 배치 번호 GSC4401을 받고 서열분석에 의해 확인하였다(서열번호 38).
가스트린 종결자 서열을 앞서, pGLEX41(GSC281, 서열번호 304)과 동일한 일반적인 주쇄를 공유하지만 상이한 프로모터를 갖는 사내 벡터(GSC23, 서열번호 306)의 SV40 폴리(A) 신호에 가하였다. SV40 폴리(A)와 가스트린 종결자의 융합을 플라스미드 명명법에서 "SV40ter"(서열번호 306)로서 표시하였다. GSC23(서열번호 306)의 발현 카세트(프로모터 + 암호화 서열)를 상기 SV40 폴리(A) 신호(즉 프로모터 및 암호화 서열)를 제외하고 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)의 발현 카세트에 의해 치환시켰다. 상기 삽입물을 제한 효소 BstBI 및 NruI로 컷아웃하고, 동일한 효소로 절단하고 CIP로 처리한 GSC23(서열번호 306)의 주쇄에 클로닝하였다. 소량표본 선별 후에, 플라스미드 pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter의 중간표본을 제조하였으며, 플라스미드 배치 번호 GSC4402를 받고 서열분석에 의해 확인하였다(서열번호 39).
또 다른 바람직한 구조물은 인트론 중에 가스트린 종결자를 갖는 폴리(A) 신호를 포함한다. I4(SV40ter)의 서열을 서열번호 77로 제공한다.
인간 T-세포 수용체 알파 막관통 도메인( PTCRA )을 사용하는 IgG1 항체의 막 디스플레이된 중쇄에 대한 선택적 스플라이스 발현 벡터의 클로닝
상기 선택적 스플라이스 구조물 중의 M1M2 막관통 영역을 인간 T-세포 수용체 알파(PTCRA) 유전자의 막관통 영역으로 치환시키기 위해서, 상보성 프라이머 GlnPr1799(서열번호 28) 및 GlnPr1735(서열번호 26)를 삽입 단편의 생성에 사용하였다. 이들 프라이머는 부분적으로 중첩되며 PCR을 사용하여 이중 가닥 DNA로 완성시켰다. 상기 삽입 단편을 AgeI 및 BstBI를 사용하여 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)의 주쇄내로 클로닝하였다. 상기 삽입물의 일부가 상기 생성 소량표본으로부터 누락되었기 때문에, 상기 소량표본상에 프라이머 GlnPr1799(서열번호 28) 및 GlnPr269(서열번호 1)를 사용하여 새로운 증폭을 수행하였다. 상기 증폭된 삽입 단편을 AgeI 및 BstBI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398, 서열번호 37)의 주쇄내에 클로닝하였다. 하나의 소량표본을 서열분석에 의해 확인하고 프라이머 GlnPr1840(서열번호 31) 및 GlnPr269(서열번호 1)와 함께 또 다른 PCR에 사용하였다. 상기 앰플리콘을 AgeI 및 BstBI로 절단하고, 동일한 효소를 사용하여 절단하고 CIP로 처리한 주쇄들 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36), pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398, 서열번호 37), pGLEX41_HC-I4(폴리A)-M1M2-M1M2-M1M2(GSC4401, 서열번호 38) 및 pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402, 서열번호 39)에 클로닝하였다. 연결은 각각 중간표본 pGLEX41_HC-I4-PTCRA(GSC5854, 서열번호 40), pGLEX41_HC-I4(0Y)-PTCRA(GSC5855, 서열번호 41), pGLEX41_HC-I4(polyA)-PTCRA(GSC5857, 서열번호 42) 및 pGLEX41_HC-I4-PTCRA-SV40ter(GSC5856, 서열번호 43)을 생성시켰다. 상기 중간표본들은 모두 서열분석에 의해 확인되었다.
M1M2 - PTCRA 융합 구조물을 사용하는 IgG1 항체의 막 디스플레이된 중쇄에 대한 선택적 스플라이스 발현 벡터의 클로닝
상기 M1M2-PTCRA 융합 구조물을 암호화하는 삽입물을 진아트로부터 명칭 진아트_Seq32(서열번호 64)로 주문하였다. 상기 단편은 T-세포 수용체 알파 서브유닛의 막관통 도메인(PTCRA)에 의해 치환된 막관통 도메인을 제외하고, IgG1 중쇄의 정규 M1M2 막관통 영역을 함유한다. 진아트에 의해 제공된 플라스미드를 제한 효소 AgeI 및 BstBI를 사용하여 절단하고 정제된 삽입물을, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36), pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398, 서열번호 37), pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401, 서열번호 38) 및 pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402, 서열번호 39) 각각에 클로닝하였다. 연결은 중간표본 pGLEX41_HC-I4-M1M2-PTCRA-M1M2(GSC6030, 서열번호 44), pGLEX41_HC-I4(0Y)-M1M2-PTCRA-M1M2(GSC6048, 서열번호 45), pGLEX41_HC-I4(polyA)-M1M2-PTCRA-M1M2(GSC6047, 서열번호 46) 및 pGLEX41_HC-I4-M1M2-PTCRA-M1M2-SV40ter(GSC6046, 서열번호 47)을 생성시켰다. 상기 중간표본들은 모두 서열분석에 의해 확인되었다.
첫 번째 M1M2-PTCRA 융합을 생성시켰으며, 상기 구조물은 상기 IgG1의 막 디스플레이를 허용하였고 천연 M1M2 구조물과 동일한 인트론의 변형에 대한 양상을 보였다(실시예 3에서 도 6을 참조하시오).
추가의 구조물 pGLEX41_HC-I4-M1M2-PTCRA-M1M2_보정된(corrected)을 상기 막관통 영역 중의 막관통 도메인의 변형의 영향에 대한 정확한 분석을 허용하도록 설계하였다.
상기 구조물에 대해서, 융합 PCR을 수행하였다. 상기 cTNT4 인트론의 일부 및 상기 M1M2 막관통 영역의 M1M2 세포외 부분을 프라이머 GlnPr1285(서열번호 259) 및 GlnPr2378(서열번호 221)로 상기 플라스미드 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)로부터 증폭시켰다. 상기 M1M2 막관통 영역의 시토졸 꼬리뿐만 아니라 SV40 폴리(A) 신호를 프라이머 GlnPr2379(서열번호 222) 및 GlnPr1650(서열번호 19)로 동일한 주형으로부터 증폭시켰다. 프라이머 GlnPr2378(서열번호 221) 및 GlnPr2379(서열번호 222)는 2개의 PCR 생성물의 중첩 단부의 생성을 허용하여 보정된 PTCRA 막관통 도메인을 생성시켰다. 이어서 중첩 PCR을 프라이머 GlnP1285(서열번호 259) 및 GlnPr1650(서열번호 19)으로 이들 2개의 첫 번째 PCR 생성물로부터 수행하였다. 상기 생성되는 융합 PCR 생성물을 AgeI 및 BstBI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_HC-I4-M1M2-PTCRA-M1M2_보정된이 생성되었으며, 플라스미드 배치 번호 GSC11206을 받았고, 서열분석에 의해 확인되었다(서열번호 284).
쥐 B7-1 막관통 영역을 사용하는 IgG1 항체의 막 디스플레이된 중쇄에 대한 선택적 스플라이스 발현 벡터의 클로닝
상기 막관통 영역을 쥐 B7-1 유전자의 막관통 영역으로 바꾸기 위해서, 융합 PCR을 수행하였다.
먼저, 상기 쥐 B7-1 막관통 영역을 암호화하는 서열을 프라이머 GlnPr2100(서열번호 33) 및 GlnPr2101(서열번호 34)을 사용하여 사내 구조물(진아트로부터 진아트_Seq43, 서열번호 66으로서 주문되었다)로부터 PCR에 의해 증폭시켰다. 벡터 pGLEX41_HC-I4(0Y)-B7-B7-B7의 클로닝을 위해서, cTNT-I4(0Y)를 암호화하는 단편을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2102(서열번호 35)를 사용하여 주형 pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398, 서열번호 37)로부터 PCR에 의해 증폭시켰다. 상기 쥐 B7-1 막관통 영역을 암호화하는 서열을 프라이머 GlnPr2100(서열번호 33) 및 GlnPr2101(서열번호 34)을 사용하여 사내 구조물(진아트로부터 진아트_Seq43, 서열번호 66으로서 주문되었다)로부터 PCR에 의해 증폭시켰다. 상기 두 PCR 생성물을 모두 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2100(서열번호 33)을 사용하여 융합시켰다. 상기 생성되는 PCR 생성물을 BstBI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 연결하였다. 소량표본 선별 후에, pGLEX41_HC-I4(0Y)-B7-B7-B7의 중간표본을 생성시켰으며, 플라스미드 배치 번호 GSC7057을 받았고, 서열분석에 의해 확인하였다(서열번호 53).
벡터 pGLEX41_HC-I4(폴리Y)-B7-B7-B7의 클로닝을 위해서, cTNT-I4(폴리Y)를 암호화하는 단편을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2099(서열번호 32)를 사용하여 주형 pGLEX41_HC-I4(폴리A)-M1M2-M1M2-M1M2(GSC4401, 서열번호 38)로부터 PCR에 의해 증폭시켰다. 상기 쥐 B7-1 막관통 영역을 암호화하는 서열을 프라이머 GlnPr2100(서열번호 33) 및 GlnPr2101(서열번호 34)을 사용하여 사내 구조물(진아트로부터 진아트_Seq43, 서열번호 66으로서 주문되었다)로부터 PCR에 의해 증폭시켰다. 상기 두 PCR 생성물을 모두 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2100(서열번호 33)을 사용하여 융합시켰다. 상기 생성되는 PCR 생성물을 BstBI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 연결하였다. 소량표본 선별 후에, pGLEX41_HC-I4(폴리A)-B7-B7-B7의 중간표본을 생성시켰으며, 플라스미드 배치 번호 GSC7058을 받았고, 제한 절단 및 서열분석에 의해 확인하였다(서열번호 54).
벡터 pGLEX41_HC-I4-B7-B7-B7의 클로닝을 위해서, cTNT-I4를 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2099(서열번호 32)를 사용하여 주형 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)로부터 PCR에 의해 증폭시켰다. 상기 쥐 B7-1 막관통 영역을 암호화하는 서열을 프라이머 GlnPr2100(서열번호 33) 및 GlnPr2101(서열번호 34)을 사용하여 사내 구조물(진아트로부터 진아트_Seq43, 서열번호 66으로서 주문되었다)로부터 PCR에 의해 증폭시켰다. 상기 두 PCR 생성물을 모두 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2100(서열번호 33)을 사용하여 융합시켰다. 상기 생성되는 PCR 생성물을 BstBI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 연결하였다. 소량표본 선별 후에, pGLEX41_HC-I4-B7-B7-B7의 중간표본을 생성시켰으며, 플라스미드 배치 번호 GSC7056을 받았고, 제한 절단 및 서열분석에 의해 확인하였다(서열번호 55).
벡터 pGLEX41_HC-I4-B7-B7-B7-Sv40ter의 클로닝을 위해서, 상기 pGLEX41_HC-I4-B7-B7-B7 구조물에 대해 동일한 PCR 생성물을 사용하였으며, BstBI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402, 서열번호 39)에 연결하였다. 소량표본 선별 후에, 상기 생성되는 pGLEX41_HC-I4-B7-B7-B7-SV40ter 중간표본은 배치 번호 GSC7059를 제공받았으며, 제한 절단 및 서열분석에 의해 확인되었다(서열번호 56).
쥐 B7-1 막관통 영역을 사용하는 IgG1 항체의 분비된 대 막 디스플레이된 중쇄의 스플라이스 비의 추가적인 감소
키메릭 단백질의 막 디스플레이는 쥐 B7-1 막관통 영역을 사용하는 경우 매우 효율적임이 입증되었다(Chou W-C et al., (1999) Biotechnol Bioeng, 65: 160-9; Liao K-W et al., (2001) Biotechnol Bioeng, 73: 313-23). 또한 본 명세서에서 0으로의 상기 스플라이스-수용체의 폴리(Y) 중의 Y량의 감소는 상기 세포막상에 디스플레이된 항체의 양을 현저하게 낮추는 것이 입증되었다(실시예 3에서 도 6F를 참조하시오).
인트론의 폴리(Y) 트랙 중의 피리미딘량의 감소 효과를 평가하기 위해서 다수의 구조물들을 PCR 융합에 의해 생성시켰다.
인트론의 변형: PCR에 사용된 프라이머 쌍 및 주형
구조물 ID 인트론 서열
서열번호
인트론 중의 Y의 수 주형 PCR 1 프라이머쌍 PCR 1
pGLEX41_HC-I4(3Y)-I4-B7-B7-B7 72 3Y GSC4340
(서열번호 307)
GlnPr1516 (서열번호 9) / GlnPr2165 (서열번호317)
pGLEX41_HC-I4(5Y)-I4-B7-B7-B7 73 10Y GSC4222
(서열번호 308)
GlnPr1516 (서열번호 9) / GlnPr2164 (서열번호316)
pGLEX41_HC-I4(5Y-5)-I4-B7-B7-B7 74 5Y GSC2617
(서열번호 309)
GlnPr1516 (서열번호 9)/ GlnPr2163 (서열번호315)
pGLEX41_HC-I4(9Y)-I4-B7-B7-B7 75 9Y GSC4335
(서열번호 310)
GlnPr1516 (서열번호 9) / GlnPr2162 (서열번호314)
pGLEX41_HC-I4(15Y-3')-I4-B7-B7-B7 76 25Y GSC2332
(서열번호 311)
GlnPr1516 (서열번호 9)/ GlnPr2166 (서열번호318)
첫 번째 PCR은 변형된 인트론을 함유하는 사내 주쇄로부터 목적하는 인트론의 증폭을 허용하였다. 각각의 구조물에 사용된 프라이머 및 주형을 표 3에 나열한다. 두 번째 PCR(모든 구조물에 공통적임)은 프라이머 GlnPr2101(서열번호 34) 및 GlnPr2100(서열번호 33)으로 구조물 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)로부터 B7-1 막관통 도메인의 증폭을 허용하였다. 이들 PCR 생성물의 정제 후에, 인트론 및 막관통 도메인을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2100(서열번호 33)으로 중첩 연장 PCR에 의해 융합시켰다. 이어서 정제된 PCR 생성물을 HindIII 및 BstBI으로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)의 주쇄에 연결하였다. 소량표본 선별 후에, 중간표본을 상기 각각의 구조물들에 대해서 생성시키고 서열분석에 의해 확인하였다. 각 구조물에 부여된 플라스미드 배치 번호는 하기와 같다:
Figure pct00001
상기 스플라이스를 감소시키는 또 다른 방법은 상기 스플라이스 공여 부위를 약화시키는 것이었다. 상기 스플라이스 공여체는 인트론의 5' 단부를 한정하는 컨센서스 서열을 특징으로 한다. 따라서, 2개의 구조물을 설계하였으며, 이때 상기 스플라이스 공여체의 공통 DNA 서열은 상기 유전자에 의해 발현된 단백질 서열에 영향을 미치지 않으면서 변형되었다.
변형된 3' 단부 서열을 갖는 상기 IgG1 중쇄를 증폭시키는 PCR을 SD_CCC 구조물의 경우 프라이머 GlnPr1518(서열번호 11) 및 GlnPr2161(서열번호 313) 및 SD_GGC 구조물의 경우 프라이머 GlnPr1518(서열번호 11) 및 GlnPr2160(서열번호 34)으로 주형 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)상에서 수행하였다. 상기 PCR을 NheI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_HC-SD_CCC-I4-B7-B7-B7(플라스미드 배치 번호 GSC9764, 서열번호 58) 및 pGLEX41_HC-SD_GGC-I4-B7-B7-B7(플라스미드 배치 번호 GSC9765, 서열번호 57)이 생성되었으며 서열분석에 의해 확인되었다. 상기 구조물 pGLEX41_HC-SD_GGC-I4-B7-B7-B7의 인트론 서열을 서열번호 78에 제공한다.
오직 소수성 잔기만을 갖는 유사한 길이의 막관통 도메인에 의한 B7-1 막관통 도메인의 치환
막 디스플레이에 대한 막관통 도메인의 영향을 평가하기 위해서, 다수의 구조물을 설계하였다. 주로 소수성 잔기를 함유하는 막관통 나선은 표면 디스플레이의 안정화에 유리한 것으로 생각되며, 따라서 1차적인 접근법으로서, 상기 B7-1 막관통 영역의 B7-1 막관통 도메인을 오직 소수성 잔기만을 함유하는 다른 단백질의 막관통 도메인에 의해 치환시켰다. 더욱이, 상기 막관통 나선의 길이는 표면 디스플레이에 대해 영향을 미칠 수 있으므로, 이들 첫 번째 구조물은 오직 상기 B7-1 막관통 도메인과 유사한 길이를 갖는 막관통 도메인들로 구성되었다.
이들 막관통 도메인의 서열 및 특성을 표 4에 요약한다.
22-23 아미노산(모두 소수성)을 갖는 막관통 도메인: 특성 및 서열
막관통 도메인 길이 소수성 극성 하전된 서열 서열번호
B7 22 20 2 0 TLVLFGAGFGAVITVVVIVVII 173
ACLV1 23 23 0 0 LALILGPVLALLALVALGVLGLW 174
ANTR2 23 23 0 0 IAAIIVILVLLLLLGIGLMWWFW 175
CD4 22 22 0 0 MALIVLGGVAGLLLFIGLGIFF 176
ITB1 23 23 0 0 IAGVIAGILLFVIIFLGVVLVM 179
PTPRM 22 22 0 0 IAGVIAGILLFVIIFLGVVLVM 177
TNR5 22 22 0 0 ALVVIPIIFGILFAILLVLVFI 178
소수성 막관통 도메인의 클로닝에 사용되는 프라이머 쌍들
막관통 도메인 프라이머 첫 번째 PCR 프라이머 두 번째 PCR
ACVL1 GlnPr1516 (서열번호 9) / GlnPr2400 (서열번호243) GlnPr1516 (서열번호 9) / GlnPr2401 (서열번호244)
ANTR2 GlnPr1516 (서열번호 9) / GlnPr2402 (서열번호245) GlnPr1516 (서열번호 9) / GlnPr2403 (서열번호246)
CD4 GlnPr1516 (서열번호 9) / GlnPr2404 (서열번호247) GlnPr1516 (서열번호 9) / GlnPr2405 (서열번호248)
PTPRM GlnPr1516 (서열번호 9) / GlnPr2408 (서열번호251) GlnPr1516 (서열번호 9) / GlnPr2409 (서열번호252)
TNR5 GlnPr1516 (서열번호 9) / GlnPr2410 (서열번호253) GlnPr1516 (서열번호 9) / GlnPr2411 (서열번호254)
ITB1 GlnPr1516 (서열번호 9) / GlnPr2406 (서열번호249 GlnPr1516 (서열번호 9) / GlnPr2407 (서열번호250)
상이한 막관통 도메인들을 상기 막관통 도메인의 3' 단부를 변형시키는 프라이머로 상기 cTNT 인트론 4의 일부의 2 단계 PCR 증폭에 의해 생성시켰다. 주형은 항상 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 구조물이었다. 각각의 구조물에 대해서, 첫 번째 라운드 PCR을 표 5에 나열된 각각의 프라이머로 수행하였다. 상기 첫 번째 라운드 PCR 생성물의 클린업 후에, 두 번째 라운드의 PCR을 표 5에 나열된 프라이머로 수행하였다. 클린업 후에, 이들 PCR 생성물을 AgeI 및 ClaI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 수준으로 상기 서열의 확인 후에, 상기 상이한 구조물들의 중간표본을 생성시키고 하기의 GSC 번호를 이들 플라스미드 배치에 할당하였다:
Figure pct00002
모든 중간표본을 서열분석에 의해 확인하였다.
하전된 및/또는 극성 잔기를 함유하는 유사한 길이의 막관통 도메인에 의한 B7-1 막관통 도메인의 치환
오직 소수성 잔기만을 함유하는 막관통 도메인은 표면 디스플레이에 영향을 미치지 않으므로(실시예 4에서 도 10을 참조하시오), B7-1 막관통 도메인과 유사한 길이를 갖지만 하나 이상의 하전된 및/또는 극성 잔기를 함유하는 다른 막관통 도메인들을 선택하였다.
이들 막관통 도메인의 서열 및 특성을 표 6에 요약한다.
하전된 및/또는 극성 잔기를 함유하는 21-24 아미노산을 갖는 막관통 도메인: 특성 및 서열
막관통 도메인 길이 소수성 극성 하전된 서열 서열번호
B7 22 20 2 0 TLVLFGAGFGAVITVVVIVVII 173
IGF1R 24 22 1 1 LIIALPVAVLLIVGGLVIMLYVFH 181
1B07 24 22 1 1 GIVAGLAVLAVVVIGAVVAAVMCR 180
TRBM 24 19 4 1 GLLIGISIASLCLVVALLALLCHL 182
IL4RA 24 16 8 0 LLLGVSVSCIVILAVCLLCYVSIT 183
LRP6 23 15 8 0 TNTVGSVIGVIVTIFVSGTVYFI 184
GpA 23 19 4 0 ITLIIFGVMAGVIGTILLISYGI 185
PTCRA 21 18 0 3 ALWLGVLRLLLFKLLLFDLLL 186
하전된 및/또는 극성 잔기를 함유하는 21-24 아미노산을 갖는 막관통 도메인의 클로닝에 사용되는 진아트 구조물
막관통 도메인 진아트 명칭 진아트 서열 서열번호
1B07 GeneArt_Seq 84 266
IGF1R GeneArt_Seq 83 265
TRBM GeneArt_Seq 85 267
IL4RA GeneArt_Seq 86 268
LRP6 GeneArt_Seq 87 269
GpA GeneArt_Seq 94 276
상이한 막관통 도메인들(PTCRA 제외)을 표 7에 나타낸 이름으로 진아트로부터 주문하였다. 일단 수령했으면, 진아트 구조물들을 물에 재현탁시키고, 이어서 AgeI 및 ClaI로 절단하였다. 상기 생성되는 삽입물을 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 중간표본을 생성시키고 하기의 배치 번호를 받았다:
Figure pct00003
상기 구조물 pGLEX41_HC-I4-B7-PTCRA-B7에 대해서, 2 단계 PCR을 수행하였다. 상기 B7-1 막관통 영역의 B7 세포외 부분을 갖는 cTNT 인트론을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2380(서열번호 223) 및 주형으로서 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)를 사용하여 증폭시켰다. 상기 생성되는 PCR 생성물을 프라이머 GlnPr1516(서열번호 9) 및 GlnPr2381(서열번호 224)로 재-증폭시켰다. 프라이머 GlnPr2380(서열번호 223) 및 GlnPr2381(서열번호 224)은 상기 PTCRA 막관통 도메인의 상기 B7-1 막관통 영역의 B7-1 세포외 부분에의 융합을 허용하였다. 상기 생성되는 PCR 생성물을 ClaI 및 AgeI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_HC-I4-B7-PTCRA-B7을 제조하였다. 상기는 배치 번호 GSC11204를 받았으며 서열분석에 의해 확인되었다(서열번호 93).
PTCRA 막관통 도메인 중의 하전된 잔기의 변형
상기 PTCRA 막관통 도메인은 21 아미노산 길이이며, 이중 3개는 하전된 잔기이다. 이들 하전된 잔기의 존재는 표면 디스플레이 시스템에서 상기 특정한 막관통 도메인의 비교적 불량한 성능에 대한 설명일 수도 있다(실시예 4에서 도 11을 참조하시오). 이들 잔기의 소수성 아미노산 발린으로의 돌연변이는 따라서 표면 디스플레이에 관하여 이로울 수도 있다.
PTCRA 막관통 도메인 중의 하전된 잔기의 돌연변이: 서열, 프라이머 DNA 배치 번호
구조물 명칭 막관통 도메인 서열 서열번호 프라이
첫 번째 라운드 PCR
프라이
두 번째 라운드 PCR
pGLEX41_HC-I4-B7-PTCRA_R8V-B7 ALWLGVLVLLLFKLLLFDLLL
187
GlnPr2382
(서열번호225)
GlnPr 2383
(서열번호226)
pGLEX41_HC-I4-B7-PTCRA_K13V-B7 ALWLGVLRLLLFVLLLFDLLL
188 GlnPr 2380
(서열번호223)
GlnPr 2384
(서열번호227)
pGLEX41_HC-I4-B7-PTCRA_D18V-B7 ALWLGVLRLLLFKLLLFVLLL
189 GlnPr 2380
(서열번호223)
GlnPr 2385
(서열번호228)
pGLEX41_HC-I4-B7-PTCRA_R8V_K13V-B7 ALWLGVLVLLLFVLLLFDLLL
190 GlnPr 2382
(서열번호225)
GlnPr 2386
(서열번호229)
pGLEX41_HC-I4-B7-PTCRA_R8V_D18V-B7 ALWLGVLVLLLFKLLLFVLLL
191 GlnPr 2382
(서열번호225)
GlnPr 2387
(서열번호230)
pGLEX41_HC-I4-B7-PTCRA_K13V_D18V-B7 ALWLGVLRLLLFVLLLFVLLL
192 GlnPr 2380
(서열번호223)
GlnPr 2388
(서열번호231)
pGLEX41_HC-I4-B7-PTCRA_R8V_K13V_D18V-B7 ALWLGVLVLLLFVLLLFVLLL
193 GlnPr 2382
(서열번호225)
GlnPr 2389
(서열번호232)
PTCRA 막관통 도메인 중의 돌연변이되지 않은 및 돌연변이된 하전된 잔기의 모든 가능한 조합들을, 정방향 프라이머로서 GlnPr1516(서열번호 9) 및 상이한 구조물들에 대해 표 8에 개시된 역방향 프라이머와 함께, 주형으로 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)을 사용하여 2단계 PCR에 의해 생성시켰다. 상기 첫 번째 라운드의 PCR 후에, PCR 생성물을 클린업하고 두 번째 라운드의 PCR을 정방향 프라이머로서 GlnPr1516(서열번호 9) 및 표 8에 개시된 역방향 프라이머로 수행하였다. 상기 생성되는 PCR 생성물을 클린업하고, ClaI 및 AgeI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 양성 구조물을 중간표본 규모로 제조하고 서열분석에 의해 확인하였다. 각 구조물의 배치 번호는 하기와 같다:
Figure pct00004
하전된 및/또는 극성 잔기를 함유하는 상이한 길이의 막관통 도메인에 의한 B7-1 막관통 도메인의 치환
상기 막관통 도메인 중의 하전된 잔기의 존재는 표면 디스플레이를 없애지 않기 때문에(실시예 4에서 도 12를 참조하시오), 상기 막관통 도메인의 길이를 B7-1 막관통 도메인보다 짧거나 길고, 이번에는 하나 이상의 하전된 및/또는 극성 잔기를 함유하는 막관통 도메인을 사용하여 평가하였다.
이들 막관통 도메인의 서열 및 특성을 하기 표 9에 요약한다.
하전된 및/또는 극성 잔기를 함유하는 상이한 길이의 막관통 도메인: 특성 및 서열
막관통 도메인 길이 소수성 극성 하전된 서열 서열번호
B7 22 20 2 0 TLVLFGAGFGAVITVVVIVVII 173
IL3RB 17 16 1 0 VLALIVIFLTIAVLLAL 196
FCERA 19 17 1 1 FFIPLLVVILFAVDTGLFI 194
KI2L2 19 17 2 0 ILIGTSVVIILFILLFFLL 195
CD3E 26 18 7 1 VMSVATIVIVDICITGGLLLLVYYWS 197
ITA2B 26 25 1 0 AIPIWWVLVGVLGGLLLLTILVLAMW 198
CD28 27 23 4 0 FWVLVVVGGVLACYSLLVTVAFIIFWV 199
M1M2 27 16 10 1 LWTTITIFITLFLLSVCYSATVTFFKV 200
하전된 및/또는 극성 잔기를 함유하는 상이한 길이를 갖는 막관통 도메인의 클로닝에 사용되는 진아트 구조물
막관통 도메인 진아트 서열 명칭 진아트 서열번호
IL3RB GeneArt_Seq 88 270
FCERA GeneArt_Seq 89 271
KI2L2 GeneArt_Seq 90 272
CD3E GeneArt_Seq 91 273
ITA2B GeneArt_Seq 92 274
CD28 GeneArt_Seq 93 275
M1M2 GeneArt_Seq 80 262
상이한 막관통 도메인들을 표 10에 나타낸 이름으로 진아트로부터 주문하였다. 일단 수령했으면, 진아트 구조물들을 물에 재현탁시키고, 이어서 AgeI 및 ClaI로 절단하였다. 상기 생성되는 삽입물을 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 중간표본을 생성시키고 하기의 배치 번호를 받았다:
Figure pct00005
B7-1 막관통 도메인 길이의 변형
표면 디스플레이에 대한 막관통 길이의 영향을 평가하기 위해서, B7-1 막관통 도메인의 상이한 변이체들을, B7-1 막관통 도메인 서열의 중간에 소수성 잔기를 제거하거나 가함으로써 생성시켰다.
B7-1 막관통 도메인 길이의 변형: 서열 및 프라이머
막관통 도메인 서열 서열번호 프라이머
B7 (18) TLVLFGAGFGATVIVVII 201 GlnPr2395 (서열번호 238) / GlnPr2394 (서열번호237)
B7 (20) TLVLFGAGFGATVVVIVVII 202 GlnPr2392 (서열번호 235) / GlnPr2393 (서열번호236)
B7 (24) TLVLFGAGFGAVVIVTVVVIVVII 203 GlnPr2396 (서열번호 239) / GlnPr2397 (서열번호240)
B7 (26) TLVLFGAGFGAVVIVVVTVVVIVVII 204 GlnPr2398 (서열번호 241) / GlnPr2399 (서열번호242)
상기 목적을 위해서, 프라이머 어닐링을 수행하였다. B7-1 막관통 도메인의 각각의 변이체에 대해서, 그들의 3' 단부에서 어닐링하는 프라이머들을 주문하였다. 각각의 구조물에 사용된 프라이머 쌍을 표 11에 개시한다. 상기 프라이머들은 어닐링이 허용되었으며 이어서 상기 서열을 PCR에 의해 완성시켰다. 클린업 후에, 생성되는 PCR 생성물을 SfoI 및 AgeI로 직접 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 주쇄에 클로닝하거나, 또는 pCR-블런트(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프 테크놀로지스) 셔틀 벡터에 연결하였다(상기 어닐링 생성물은 매우 짧기 때문에, 상기 직접 연결이 모든 생성물에 작용하지는 않았다). 두 번째 경우에, 소량표본을 상기 pCR-블런트(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프테크놀로지스) 중의 어닐링된 생성물의 연결 후에 획득된 콜로니로부터 추출하였다. 서열 확인 후에, 양성 소량표본을 SfoI 및 AgeI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 주쇄에 연결하여 클로닝하였다. 소량표본 선별 후에, 중간표본을 각각의 구조물에 대해 제조하였다. GSC 배치 번호가 하기에 개시되는 바와 같이 이들 중간표본에 대해 부여되었으며 상기 표본들은 서열분석에 의해 확인되었다.
Figure pct00006
B7-1 막관통 영역 중 시토졸 꼬리의 변형
시토졸 꼬리(ER 유출 신호가 있거나 없는)는 표면 디스플레이에 영향을 미칠 수 있기 때문에, 변형된 시토졸 꼬리를 갖는 다수의 구조물들을 설계하였다. 이들 시토졸 꼬리의 서열 및 특성을 표 12에 요약한다.
시토졸 꼬리: 특성 및 서열
시토졸 꼬리 ER 유출 신호 서열 서열번호.
B7 있음 KCFCKHRSCFRRNEASRETNNSLTFGPEEALAEQTVFL 218
M1M2 KWIFSSVVDLKQTIIPDYRNMIGQGA 207
6His 없음 ASAHHHHHH 205
KCFCK 없음 KCFCK 206
ERGIC53 있음 RSQQEAAAKKFF 208
ERGIC53_noER 없음 RSQQEAAAKKWW 209
GAT1 있음 MFLTLKGSLKQRLQVMIQPSEDIVRPENGPEQPQAGSSASKEAYI 210
GAT1_noER 없음 MFLTLKGS 211
AGTR2 있음 CFVGNRFQQKLRSVFRVPITWLQGKRETMSCRKSSSLREMDTFVS 212
AGTR2_noER 없음 CFVGNRFQQKLRSVFRVPITWLQGKRETMSCRKSSSLR 213
V1BR 있음 NSHLLPRPLRHLACCGGPQPRMRRRLSDGSLSSRHTTLLTRSSCPATLSLSLSLTLSGRPRPEESPRDLELADGEGTAETIIF 214
V1BR_noER 없음 NSHEESPRDLELADGEGTAETIIF 215
VGLG 있음 CIKLKHTKKRQIYTDIEMNRLGK 216
VGLG_noER 없음 CIKLKHTKKRQIAAAAAANRLGK 217
상이한 클로닝 전략을 상이한 구조물의 길이에 따라 적용하였다. 첫 번째 구조물을 상기 시토졸 꼬리를 변형시키는 프라이머들로 B7-1 세포외 및 막관통 도메인을 갖는 cTNT 인트론 4의 PCR 증폭에 의해 생성시켰다.
시토졸 꼬리 변형에 사용된 프라이머 쌍 및 효소
시토졸 꼬리 프라이머쌍 효소
6His GlnPr2377 (서열번호 220) / GlnPr 1516 (서열번호9) HindIII / BstBI
KCFCK GlnPr 2376 (서열번호 219)/ GlnPr 1516 (서열번호9) HindIII / BstBI
GAT1_noER GlnPr 2415 (서열번호 258) / GlnPr 1516 (서열번호9) ClaI / BstBI
상기 사용된 프라이머 쌍들은 표 13에 개시되며 사용된 주형은 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)이었다. 상기 정제된 PCR 생성물을 표 13에 개시된 효소로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 클로닝하였다. 소량표본 선별 후에, 중간표본을 생성시키고 하기의 배치 번호를 받았다:
Figure pct00007
모든 중간표본을 서열분석에 의해 확인하였다.
M1M2 시토졸 꼬리를 B7-1 막관통 영역에 융합시키기 위해서, 융합 PCR을 수행하였다. B7-1 세포외 및 막관통 도메인을 갖는 cTNT 인트론 4를 주형으로서 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)를 사용하여 GlnPr1516(서열번호 9) 및 GlnPr2391(서열번호 234)로 증폭시켰다. SV40 폴리(A) 신호를 갖는 상기 M1M2 시토졸 꼬리를 주형으로서 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)를 사용하여 프라이머 GlnPr2390(서열번호 233) 및 GlnPr1650(서열번호 19)로 증폭시켰다. 클린업 후에, 상기 두 PCR 산물을 모두 프라이머로서 GlnPr1516(서열번호 9) 및 GlnPr1650(서열번호 19)을 사용하여 세 번째 PCR에서 융합시켰다. 상기 생성되는 PCR 생성물을 클린업하고 SfoI 및 BstBI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 주쇄에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_HC-I4-B7-B7-M1M2를 생성시켰으며, 배치 번호 GSC11758을 받았고 서열분석에 의해 확인하였다(서열번호 114).
일부 구조물들에 대해서, 프라이머 어닐링 전략이 선택되었다. 각각의 시토졸 꼬리에 대해서, 그들의 3' 단부에서 어닐링하는 프라이머들을 주문하였다. 각각의 구조물에 사용된 프라이머 쌍을 표 14에 개시한다. 상기 프라이머들은 어닐링이 허용되었으며 이어서 상기 서열을 PCR에 의해 완성시켰다. 클린업 후에, 생성되는 PCR 생성물을 SfoI 및 BstBI로 직접 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 주쇄에 클로닝하거나, 또는 pCR-블런트 셔틀 벡터(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프 테크놀로지스)에 연결하였다(상기 어닐링 생성물은 매우 짧기 때문에, 상기 직접 연결이 모든 생성물에 작용하지는 않았다). 두 번째 경우에, 소량표본을 상기 pCR-블런트(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프테크놀로지스) 중의 어닐링된 생성물의 연결 후에 획득된 콜로니로부터 추출하였다. 서열 확인 후에, 양성 소량표본을 SfoI 및 BstBI로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 주쇄에 연결하였다. 소량표본 선별 후에, 중간표본을 각각의 구조물에 대해 제조하였다. GSC 배치 번호가 하기 표 14에 개시되는 바와 같이 이들 중간표본에 대해 부여되었으며 상기 표본들은 서열분석에 의해 확인되었다.
시토졸 꼬리 변형을 위한 프라이머 어닐링에 사용된 프라이머 쌍 및 DNA 배치 번호
시토졸 꼬리 프라이머 중간표본 배치 번호
ERGIC53 GlnPr2412 (서열번호 255) / GlnPr2413 (서열번호256) GSC11764 (서열번호 115)
ERGIC53_noER GlnPr2412 (서열번호 255) / GlnPr2414 (서열번호257) GSC11678 (서열번호 116)
최종적으로, 최종 구조물들에 대해서, 서열들을 표 15에 개시된 서열 명칭으로 진아트로부터 주문하였다. 일단 수령했으면, 진아트 구조물들을 물에 재현탁시키고, 이어서 SfoI 및 BstBI로 절단하였다. 상기 생성되는 삽입물을 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 중간표본을 생성시키고 하기 표에 상세히 나타낸 배치 번호를 받았다:
시토졸 꼬리 변형을 위해 주문된 진아트 서열 및 DNA 배치 번호
시토졸 꼬리 진아트 진아트 서열번호 중간표본 배치 번호
GAT1 GeneArt_Seq95 277 GSC11759 (서열번호 117)
AGTR2 GeneArt_Seq 96 278 GSC11760 (서열번호 119)
AGTR2_noER GeneArt_Seq 97 279 GSC11761 (서열번호 120)
V1BR GeneArt_Seq 98 280 GSC11762 (서열번호 121)
V1BR_noER GeneArt_Seq 99 281 GSC11765 (서열번호 122)
VGLG GeneArt_Seq 100 282 GSC11766 (서열번호 123)
VGLG_noER GeneArt_Seq 101 283 GSC11763 (서열번호 124)
상기 B7-1 시토졸 꼬리의 영향을 추가로 평가하기 위해서 M1M2 막관통 도메인의 시토졸 꼬리를 B7-1 시토졸 꼬리에 의해 치환시켰다. 이를 위해서, 상기 B7-1 시토졸 꼬리를 갖는 M1M2 막관통 도메인을 진아트로부터 진아트_Seq82(서열번호 264)로서 주문하였다. 상기 진아트 구조물을 ClaI 및 및 BstBI로 절단하고 삽입물을 동일한 효소로 절단하고 CIP로 처리한 주쇄 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_HC-M1M2-M1M2-B7을 생성시켰으며, 플라스미드 배치 번호 GSC11294를 받고 서열분석에 의해 확인하였다(서열번호 125).
IgG1 항체의 경쇄의 발현을 위한 벡터의 클로닝
경쇄 삽입물(0704970pGA4)을 갖는 진아트로부터 제공된 클로닝 벡터를 프라이머 GlnPr501(서열번호 4) 및 GlnPr502(서열번호 5)를 사용하는 PCR에 대한 주형으로서 사용하였다. 이들 프라이머는 상기 경쇄의 개방 판독 프레임을 증폭시키고 상기 개방 판독 프레임에 HindIII 제한 부위 5' 및 XbaI 제한 부위 3'를 가한다. 상기 앰플리콘을 XbaI 및 HindIII로 절단하고 XbaI 및 HindIII를 사용하여 셔틀 벡터에 연결하였다. 소량표본 선별 후에, 기가표본을 생성시켰으며, 이를 서열분석 및 절단에 의해 확인하였다.
상기 IgG1 포맷의 항체의 경쇄의 암호화 영역을 상기 기가표본으로부터 XbaI 및 HindIII로 절단하고, 동일한 효소로 개방하고 CIP로 처리한 플라스미드 pGLEX41(GSC281, 서열번호 304)의 주쇄에 클로닝하였다. 소량표본 선별 후에, pGLEX41_LC의 대량표본을 생성시켰으며, 배치 번호 GSC315(서열번호 294)를 받고 서열분석에 의해 확인하였다. 후속으로, 동일한 DNA의 다수의 배치를 중간표본 또는 기가표본 수준으로 생성시키고, 배치 번호 GSC315a, GSC315b, GSC315c, GSC315d 및 GSC315e를 받았다(이들 표본은 모두 서열분석에 의해 확인되었으므로 이들을 하기에서 GSC315 플라스미드(서열번호 294)로서 지칭할 것이다).
IgG4 항체의 경쇄의 발현을 위한 벡터의 클로닝
상기 IgG4 중쇄를 암호화하는 서열을 글렌마크(Glenmark)에서 생성시키고 셔틀 벡터 중에서 수령하였다. 상기 IgG4 중쇄 암호화 서열을 프라이머 GlnPr1488(서열번호 328) 및 GlnPr1452(서열번호 327)로 PCR에 의해 증폭시켰다. 정제 후에, 상기 생성되는 PCR 생성물을 프라이머 GlnPr1494(서열번호 260) 및 GlnPr1452(서열번호 327)로 재-증폭시켰다. 이들 두 라운드의 PCR은 상기 리더 펩티드를 변형시켰으며 상기 암호화 서열의 양쪽 단부에 제한 부위를 가하였다. 상기 생성되는 PCR 생성물을 정제하고 셔틀 벡터 pCR-블런트(제로 블런트® PCR 클로닝 키트, 인비트로젠, 라이프테크놀로지스)에 클로닝하였다. 소량표본 선별 후에, 양성 클론을 SpeI 및 ClaI로 절단하여 IgG4 중쇄 암호화 서열을 추출하였다. 상기 생성 삽입물을 NheI 및 BstBI로 절단하고 CIP로 처리한 pGLEX41(GSC281, 서열번호 304)에 연결하였다. 소량표본 선별 후에, 기가표본 pGLEX41_IgG4-HC를 생성시켰으며, 플라스미드 배치 번호 GSB59를 받았고 서열분석에 의해 확인하였다(서열번호 79).
B71- 막관통 영역의 발현을 허용하는 선택적 스플라이스에 의한 IgG4 항체의 중쇄의 발현을 위한 벡터의 클로닝
막-결합된 IgG4 발현을 위한 선택적 스플라이스 카세트의 부가를 위해서, IgG4 중쇄에 대한 암호화 서열을 주형으로서 pGLEX41_IgG4-HC(GSB59, 서열번호 79)를 사용하여 프라이머 GlnPr1494(서열번호 260) 및 GlnPr2294(서열번호 261)로 PCR에 의해 증폭시켰다. 상기 생성되는 PCR 생성물을 클린업하고, SpeI 및 HindIII로 절단하고, NheI 및 HindIII로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55) 주쇄에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_IgG4-HC-B7-B7-B7을 제조하였으며, 플라스미드 배치 번호 GSC11218을 받았고 서열분석에 의해 확인하였다(서열번호 80).
IgG4 항체의 경쇄의 발현을 위한 벡터의 클로닝
상기 IgG4 경쇄를 암호화하는 서열을 글렌마크에서 생성시키고 셔틀 벡터 중에서 수령하였다. 3개의 상이한 프라이머 GlnPr1487(서열번호 325), GlnPr1491(서열번호 326) 및 GlnPr1494(서열번호 260)와 함께 단일 라운드의 PCR을 사용하여, 상기 리더 펩티드를 교환하고 제한 부위를 상기 암호화 서열의 양쪽 단부에 가하였다. 상기 PCR 생성물을 SpeI 및 ClaI로 절단하고, NheI 및 BstBI로 개방하고 CIP로 처리한 pGLEX41(GSC281, 서열번호 304) 주쇄에 연결하였다. 소량표본 선별 후에, 중간표본 pGLEX41_IgG4-LC를 생성시켰으며, 플라스미드 배치 번호 GSC3704를 받았고 서열분석에 의해 확인하였다(서열번호 319).
BEAT® 이중특이성 항체의 분비된 중쇄의 발현을 위한 벡터의 클로닝
이중특이성 항체의 중쇄를 이중특이성 BEAT® 포맷의 부분으로서 글렌마크에서 생성시켰다. 두 라운드의 PCR을 사용하여, 코작 서열, 신호 펩티드 및 인접 제한 부위를 가하였다. 첫 번째 라운드에서, 주형을 프라이머 GlnPr1726(서열번호 24) 및 GlnPr1500(서열번호 7)을 사용하여 증폭시켰다. 상기 PCR 생성물을 정제시키고 프라이머 GlnPr1500(서열번호 7) 및 GlnPr1725(서열번호 23)를 사용하는 두 번째 라운드의 PCR에 대한 주형으로서 사용하였다. 생성되는 앰플리콘을 정제시키고 제한 효소 SpeI 및 ClaI를 사용하여 절단하였다. 상기 삽입물을 NheI 및 BstBI를 사용하여 개방하고 CIP로 처리한 주쇄 pGLEX41(GSC281, 서열번호 304)내로 클로닝하였다. 소량표본 선별 후에, pGLEX41_BEAT-HC-His를 중간표본 규모로 생성시켰으며 배치 번호 GSC5607(서열번호 296)을 받았다. 서열분석 대조용 및 제한 절단은 상기 플라스미드를 확인하였다.
상기 플라스미드를, 주형 서열로부터 His-태그의 제거를 위해 프라이머 GlnPr1725(서열번호 23) 및 GlnPr1760(서열번호 27)을 사용하는 변형 PCR에 대한 주형으로서 사용하였다. 상기 앰플리콘을 SpeI 및 ClaI로 절단하고, 제한 효소 NheI 및 BstBI를 사용하여 개방하고 CIP로 처리한 벡터 pGLEX41(GSC281, 서열번호 304)의 주쇄 내로 클로닝하였다. 소량표본 선별 후에, 중간표본 pGLEX41_BEAT-HC는 플라스미드 배치 번호 GSC5644를 제공받았으며 서열분석에 의해 확인되었다(서열번호 49).
이중특이성 BEAT® 항체의 막 디스플레이된 중쇄에 대한 선택적 플라이스 발현 벡터의 클로닝
BEAT 중쇄(GSC5644, 서열번호 49)를 암호화하는 주형 벡터를 프라이머 GlnPr1800(서열번호 29) 및 GlnPr1725(서열번호 23)를 사용하여 증폭시켰다. 상기 정제된 생성물을 제한 효소 SpeI 및 HindIII를 사용하여 절단하고, 효소 NheI 및 HindIII를 사용하여 개방하고 CIP로 처리한 벡터 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 클로닝하였다. 소량표본 선별 후에, 대량 표본 pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2는 플라스미드 배치 번호 GSC5537(서열번호 50)을 받았으며 제한 절단 및 서열분석에 의해 확인되었다.
표면 디스플레이에 B7-1 막관통 영역을 사용하기 위해서, 구조물 pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(GSC5537, 서열번호 50)의 삽입물을 SacI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 재클로닝하였다. 소량표본 선별 후에, 대량표본 pGLEX41_BEAT-HC-I4-B7-B7-B7을 생성시키고, 플라스미드 배치 번호 GSC10488을 받고 서열분석에 의해 확인하였다(서열번호 321).
이중특이성 항체의 분비된 scFv - Fc에 대한 발현 벡터의 클로닝
scFv-Fc 서열이 상기 이중특이성 BEAT® 포맷의 부분으로서 사내 개발되었다. 증폭을 프라이머 GlnPr1690(서열번호 22), GlnPr1689(서열번호 21) 및 GlnPr1502(서열번호 8)를 사용하여 수행하였다. 이들 프라이머는 코작 서열, 신호 펩티드 및 제한 부위를 상기 앰플리콘에 가한다. 상기 PCR 생성물을 프라이머 GlnPr1689(서열번호 21) 및 GlnPr1502(서열번호 8)를 사용하여 재-증폭시키고 생성되는 앰플리콘을 NheI 및 ClaI를 사용하여 절단하였다. 상기 삽입 단편을 NheI 및 BstBI를 사용하여 절단하고 CIP로 처리한 주쇄 pGLEX41(GSC281, 서열번호 304)와 연결하였다. 소량표본 선별 후에, 배치 번호 GSC5608(서열번호 51)을 갖는 중간표본 pGLEX41_scFv-Fc를 생성시켰으며 제한 절단 및 서열분석에 의해 확인하였다.
이중특이성 항체의 막 디스플레이된 scFv - Fc에 대한 선택적 스플라이스 발현 벡터의 클로닝
scFv를 암호화는 주형 벡터(GSC5608, 서열번호 51)를 프라이머 GlnPr1801(서열번호 30) 및 GlnPr1689(서열번호 21)를 사용하여 증폭시켰다. 상기 정제된 생성물을 NheI 및 HindIII를 사용하여 절단하고, 동일한 효소를 사용하여 개방하고 CIP로 처리한 벡터 pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899, 서열번호 36)에 클로닝하였다. 소량표본 선별 후에, 플라스미드 배치 번호 GSC5538(서열번호 52)을 갖는 중간표본 pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2를 생성시켰으며 제한 절단 및 서열분석에 의해 확인하였다.
표면 디스플레이에 B7-1 막관통 영역을 사용하기 위해서, 구조물 pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2(GSC5537, 서열번호 50)의 삽입물을 NheI 및 HindIII로 절단하고, 동일한 효소로 절단하고 CIP로 처리한 pGLEX41_HC-I4-B7-B7-B7(GSC7056, 서열번호 55)에 재클로닝하였다. 소량표본 선별 후에, 대량표본 pGLEX41_scFv-Fc-I4-B7-B7-B7을 생성시키고, 플라스미드 배치 번호 GSC10487을 받고 서열분석에 의해 확인하였다(서열번호 323).
이중특이성 항체의 경쇄에 대한 발현 벡터의 클로닝
경쇄 서열이 상기 이중특이성 BEAT® 포맷의 부분으로서 사내 개발되었다. 증폭을 프라이머 GlnPr1689(서열번호 21), GlnPr1727(서열번호 25) 및 GlnPr1437(서열번호 6)을 사용하여 수행하였다. 이들 프라이머는 신호 서열, 코작 서열, 및 인접 제한 부위를 상기 앰플리콘에 가한다. 상기 앰플리콘을 정제시키고 제한 효소 ClaI 및 NheI를 사용하여 절단하고, NheI 및 ClaI로 개방하고 CIP로 절단한 셔틀 벡터의 주쇄에 클로닝하였다. 소량표본 선별 후에, 대량표본을 제조하였으며 서열분석에 의해 확인하였다. 상기 이중특이성 구조물의 경쇄를 암호화하는 상기 셔틀 벡터를 제한 효소 NheI 및 ClaI를 사용하여 절단하고 삽입물을 NheI 및 BstBI로 개방하고 CIP로 처리한 벡터 pGLEX41(GSC281, 서열번호 304)에 클로닝하였다. 소량표본 선별 후에, pGLEX41_BEAT-LC의 중간표본을 생성시켰으며(플라스미드 배치 번호 GSC5540, 서열번호 302) 상기 플라스미드를 제한 절단 및 서열분석에 의해 확인하였다.
실시예 2: 번역된 생성물의 표면 디스플레이 및 특이적 검출
도입
실시예 1은 분비된 단백질 또는 C-말단 막관통 영역(TM)을 갖는 동일한 단백질을 암호화하는, 동일한 DNA 주형으로부터 2개의 상이한 mRNA의 발현을 유도하는 선택적 스플라이스 구조물의 클로닝을 개시한다. 상기 정의 섹션에서 상세히 개시한 바와 같이, 막관통 영역은 임의의 링커, 막관통 도메인 및 임의의 세포질 꼬리를 포함한다. 이들 구조물을, 상기 기술이 표적 단백질의 효율적인 분비를 유지시키면서 세포막상의 단백질의 분획을 디스플레이하는데 사용될 수 있는지를 측정하기 위해서 CHO-S 세포에 형질감염시켰다. 3개의 상이한 단백질이 본 실험에 사용되었다: IgG1 하위부류의 항체, IgG4 하위부류의 항체 및 BEAT® 포맷의 이중특이성 항체.
물질 및 방법
형질감염
현탁액 CHO-S 세포를 50 ㎖ 생물반응기 튜브(튜브스핀스(Tubespins, TPP) 포맷 중의 폴리에틸렌이민(JetPEI®, 폴리플러스-형질감염, 프랑스 일키르히 소재)을 사용하여 발현 벡터들로 형질감염시켰다. 이를 위해서 지수 증식 세포를 5 ㎖의 OptiMEM 배지(#31985-047, 인비트로젠) 또는 CD-CHO 배지(#10743-011, 라이프 테크놀로지스) 중에 2E6 세포/㎖의 밀도로 시딩하였다. JetPEI®:DNA 복합체를 상기 세포에 3(㎍/㎍)의 중량비로 가하였다. 상기 세포 현탁액 중의 최종 DNA 농도는 2.5 ㎍/㎖이었다. 진탕(200 rpm) 하에 37 ℃에서 5시간 인큐베이션 후에, 5 ㎖의 신선한 인큐베이션 배지를 상기 세포 현탁액에 가하였다. 이어서 상기 세포를 37 ℃, 5% CO2 및 80% 습도에서 진탕 플랫폼상에서 인큐베이션하였다.
표면 염색
세포의 표면 염색을 형질감염 후 1일째에 수행하였다. 총 1 E5 세포를 수확하고 96웰 플레이트의 환저 웰로 옮겼다. 상기 세포를 세척 완충제(PBS 중 2% FBS)로 2회 세척하고 이어서 검출 항체를 함유하는 100 ㎕ 세척 완충제에 재현탁하였다. 카파 경쇄의 특이적 검출을 마우스 항-인간 카파 경쇄 APC 표지된 항체(#561323, BD 파밍겐(Pharmingen))를 사용하여 수행하고, 적색 레이저(640 ㎚)에 의해 여기시키고 스펙트럼 범위 661/19 ㎚에서 검출하였다. 중쇄 및 scFv-Fc 모두, 청색 레이저(488 ㎚)에 의해 여기되고 스펙트럼 범위 583/26 ㎚에서 검출되는 PE 접합된 염소 항-인간 Fc 감마 특이성 항체(#12-4998-82, 이바이오사이언스(eBioscience))를 사용하여 검출되었으며 상기 scFv-Fc는, 청색 레이저에 의해 488 ㎚에서 여기되고 스펙트럼 범위 525/30에서 검출되는 FITC-표지된 단백질 A(#P5145, 시그마)를 사용하여 특이적으로 검출되었다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 1회 세척하고 유식 세포측정 분석을 위해 200 ㎕의 세척 완충제에 재현탁시켰다. 상기 세포를 구아바(Guava) 유식 세포계(머크 밀리포어(Merck Millipore)) 또는 FACSCalibur(벡톤 디킨슨(Becton Dickinson))로 분석하였다. 분비된 분자의 일시 발현 수준을 옥텟 QK 장비(포르테바이오(Fortebio), 미국 캘리포니아주 멘로 파크 소재) 및 단백질 A 바이오센서를 사용하여 형질감염 후 4 내지 6일째에 측정하였다.
결과
IgG1 항체 발현을 위해서, CHO-S 세포를 경쇄를 발현하는 발현 벡터 pGLEX41_LC(서열번호 294) 및 각각 pGLEX41_HC-I4-B7-B7-B7(서열번호 55), pGLEX41_HC-I4-M1M2-M1M2-M1M2(서열번호 36), pGLEX41_HC-I4-PTCRA(서열번호 40) 또는 pGLEX41_HC-I4-M1M2-PTCRA-M1M2_보정된(서열번호 284) 명칭의 제2 벡터를 사용하여, 상기 물질 및 방법 섹션에 개시된 바와 같이 형질감염시켰다. 대조용으로서, 분비된 중쇄를 암호화하는 비-스플라이스 구조물을 사용하였다(서열번호 48).
형질감염 후, 상기 세포를 물질 및 방법에 개시된 바와 같이 염색하고 유식 세포측정에 의해 분석하였다. 경쇄 및 중쇄의 분비된 버전을 발현하는 음성 대조용(막관통 영역의 선택적 스플라이스 없음)은 비교적 높은 분비 수준의 IgG1과 함께 단지 낮은 강도의 표면 염색(염색된 세포의 백분율에 대해서 도 2A 및 도 2E의 색칠되지 않은 막대그래프를 참조하시오)만을 제공하였다(도 2F 참조). 이와 대조적으로, M1M2 영역(서열번호 36)을 함유하는 구조물로 형질감염된 세포는 세포막상에 상기 항체를 디스플레이하는 현저한 양성 집단을 나타내었다(도 2B에서 색칠 된 막대그래프를 참조하시오). PTCRA 막관통 영역(도 2C 참조; 서열번호 40)에 의한 전체 M1M2 막관통 영역의 교환, 또는 PTCRA의 막관통 도메인(도 2D 참조; 서열번호 284)에 의한 M1M2의 막관통 도메인의 특정한 교환은 양성이지만, 약하게 염색된 세포 집단을 유도하였다. 쥐 B7-1 막관통 영역(도 2A 참조; 서열번호 55)은 막 디스플레이된 IgG1에 양성인 집단의 40%를 갖는 놀랍게도 높은 염색 수준을 나타내었다.
선택적 스플라이스, 및 따라서 전체적으로 생성된 항체 분획의 막-결합된 발현은 분비된 IgG의 역가에 부정적인 영향을 미치는 것으로 보인다. 그럼에도 불구하고, 상기 M1M2 막관통 영역(또한 PTCRA 막관통 도메인과 함께) 및 특히 B7-1 막관통 영역은 선택적 스플라이스 없이 대조용 구조물의 분비 수준의 80%까지 허용하였다(도 2F 참조).
IgG4 항체 발현을 위해서 CHO-S 세포를, 경쇄를 발현하는 발현 벡터 pGLEX41_IgG4-LC(서열번호 319) 및 중쇄를 암호화하는 제2 벡터를 막 디스플레이용 B7-1 막관통 영역(서열번호 80)의 선택적 스플라이스와 함께 사용하여, 상기 물질 및 방법 섹션에 개시된 바와 같이 형질감염시켰다. 대조용으로서, 분비된 IgG4 중쇄를 암호화하는 비-스플라이스 구조물을 사용하였다(서열번호 79).
형질감염 후, 상기 세포를 물질 및 방법에 개시된 바와 같이 염색하고 유식 세포측정에 의해 분석하였다. 경쇄 및 중쇄의 분비된 버전을 발현하는 음성 대조용(막관통 영역의 선택적 스플라이스 없음)은 대략 6 ㎍/㎖의 IgG4의 상당한 분비 수준과 함께(도 3C 참조) 단지 음성 집단(도 3A 참조)을 제공하였다. 이와 대조적으로, B7-1 영역(서열번호 80)을 함유하는 구조물로 형질감염된 세포는, 발현 수준은 선택적 스플라이스의 존재 및 부재하에서 유사한 수준으로 남아있으면서(도 3C 참조) 세포막상에 상기 항체를 디스플레이하는 현저한 양성 집단을 나타내었다(도 3A 막대그래프 및 도 3B 염색 백분율을 참조하시오).
이중특이성 항체를 막관통 영역(TM)을 통해 세포막상에 디스플레이할 수 있는지를 다루기 위해서, 이중특이성 항체를 암호화하는 실시예 1에 개시된 선택적 스플라이스 구조물을 CHO 세포에서 일시적으로 발현시켰다. 상기 선택적 스플라이스 구조물은, 사내 개발되고 WO2012/131555에 개시된 이중특이성 항체 포맷("BEAT®"라 칭함)(본 실시예에서 모델 단백질로서 사용되었다)을 암호화한다. 상기 BEAT 분자는 IgG 중쇄("중쇄"), 카파 경쇄("경쇄") 및 중쇄 불변 영역에 융합된 scFv("scFv-Fc")의 삼량체이다. 상기 중쇄의 단백질 A-결합 부위는 오직 상기 scFv-Fc의 Fc-단편만이 단백질 A에 결합할 수 있도록 제거되었다. 상기 분자의 설계 및 중쇄 단백질 A 결합 부위의 조작은 상기 삼량체의 모든 서브유닛의 특이적 검출을 허용하였다. 세포막상의 디스플레이를, 중쇄 또는 scFv-Fc의 선택적 스플라이스 구조물을 형질감염시키거나 또는 상기 두 선택적 스플라이스 구조물을 모두 형질감염시킴으로써 성취하였다. 단세포의 표면상에 디스플레이된 막 결합된 BEAT 이중특이성 항체를 유식 세포측정에 의해 특이적으로 검출하였다.
하기에서, 정규 발현 구조물을 암호화하는 벡터들을 pGLEX41_BEAT-HC(서열번호 49)에 대해 "pHC", pGLEX41_BEAT-LC(서열번호 302)에 대해 "pLC" 및 pGLEX41_scFv-Fc(서열번호 51)에 대해 "pScFv-Fc"로 축약할 것이다. 상기 HC에 막관통 영역을 가하는 선택적 스플라이스 구조물을 "pHC-M1M2"(pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2; 서열번호 50)라 칭하고 상기 scFv-Fc에 막관통 영역을 가하는 구조물은 "pScFv-Fc-M1M2"(pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2; 서열번호 52)라 칭할 것이다. 상기 BEAT 항체의 3개의 서브유닛을 암호화하는 발현 벡터들을 상이한 조합의 선택적 스플라이스 발현 구조물 또는 정규 발현 구조물을 사용하여 동시-형질감염시켰다. 표 16은 수행된 형질감염 및 세포막상에 디스플레이될 것이 예상되는 종들을 요약한다.
형질감염 설계 및 세포막상에 디스플레이된 예상된 종들
세포막상에 디스플레이된 예상된 종들
형질감염된 벡터들 Fc 카파 Lc scFv - Fc
pHC + pScFv-Fc + pLC - - -
pHC-M1M2 + pScFv-Fc-M1M2 + pLC + + +
pHC-M1M2 + pScFv-Fc + pLC + + +
pHC + pScFv-Fc-M1M2 + pLC + + +
pScFv-Fc-M1M1 + - +
pHC-M1M2 + pLC + + -
형질감염 후 1일째에 획득된 유식 세포측정 프로파일을 도 4A 및 B에 도시한다. 첫 번째 형질감염 칵테일(pHC + pScFv-Fc + pLC)은 세포막 디스플레이용 막관통 영역을 갖는 구조물을 포함하지 않았다. 따라서, 상기 형질감염에 대해 획득된 프로파일(도 4A, D, G)은 상기 실험에 대한 음성 대조용으로 간주되었으며 막대그래프에서 파선으로 나타낸다.
벡터 pScFv-Fc-M1M2 단독의 형질감염은 항-Fc(중쇄 검출) 및 단백질 A 염색에 대해 오직 양성 세포만을 제공하였다(도 4K, N, Q). 이 경우에, 세포막상에서 경쇄는 검출되지 않았으며 이는 상기 분석의 특이성을 입증한다. 벡터 pHC-M1M2 및 pLC의 동시-형질감염은 항-Fc 및 카파 경쇄 염색에 대해 양성 세포를 제공하였으나, 단백질 A 결합은 관찰할 수 없었다(도 4L, O, R). 이는 상기 단백질 A 결합 부위가 상기 BEAT 분자의 중쇄 서브유닛에서 제거되었다는 사실에 상응하였다. 따라서, 상기 항-인간 Fc 감마 항체는 중쇄에 특이적이지 않고 또한 상기 scFv-Fc를 인식하지 않았지만, 경쇄의 검출은 우리로 하여금 상기 중쇄 발현의 결론을 내리게 하였다.
3개의 서브유닛을 모두 암호화하는 플라스미드 칵테일에 의해 수행된 형질감염은 사용된 선택적 스플라이스 구조물과 독립적으로, 적어도 하나의 막관통 영역을 갖는 BEAT 구조물의 발현을 나타냈다(도 4B, C, J, E, F, M, H, I, P). 상기 염색은 경쇄 및 scFv-Fc뿐만 아니라 Fc 단편(중쇄 및 scFv-Fc)에 대해 양성이었으며, 이는 모든 예상된 종들이 상기 세포막상에 존재함을 암시하였다. 따라서, 완전히 폴딩된 다량체가 상기 세포막상에 존재하였으며, 이는 다량체성 단백질의 발현을 위한 리포터 시스템의 유효성을 입증한다. 놀랍게도, 상기 막관통 영역의 위치에 상관 없이 모든 종이 검출되었다. 상기 막관통 영역(TM)이 중쇄(HC) 및 scFv-Fc 서브유닛 모두에(도 4B, E, H), HC에 단독으로(도 4C, F, I) 또는 scFv-Fc에 단독으로(도 4J, M, P) 부착되었는지에 대한 차이는 관찰되지 않았다.
따라서, 본 명세서에 제공된 접근법은 상기 세포막상에 디스플레이된 이종이량체(예를 들어 중쇄 + scFv-Fc + 경쇄) 및 동종이량체(중쇄 + 경쇄 또는 scFv-Fc 동종이량체)간의 구별을 허용한다. 다량체성 단백질, 예를 들어 이중특이성 항체의 발현과 관련하여, 상기 정보의 질은 대단히 유용하다.
상기 분비된 BEAT 및 scFv-Fc 동종이량체의 농도를 단백질 A 바이오센서를 사용하여 옥텟 QK 장비에 의해 형질감염 후 6일째에 측정하였다. 결과를 도 5에 나타낸다. 예상된 바와 같이, 생성되는 생성물(중쇄-경쇄 동종이량체)이 단백질 A에 결합하지 않기 때문에 발현 벡터 pHC-M1M2 + pLC를 사용하는 형질감염에 대해 상기 단백질 A 바이오센서에 의해 발현을 측정할 수 없었다. 발현 벡터 pScFv-Fc-M1M2를 사용하는 형질감염에 대해서, 오직 분비된 생성물만을 유도하는 대조용 형질감염에 비해 보다 낮은 발현 수준이 관찰되었다. BEAT 분자 또는 scFv-Fc 동종이량체를 선택적 스플라이스 구조물을 사용하는 모든 형질감염에 대해 상등액 중에서 검출할 수 있었다. 이는 상기 BEAT 이종삼량체가 앞서 입증된 바와 같이 세포막상에 디스플레이될 뿐만 아니라 상기 세포의 분비 경로를 사용하여 성공적으로 분비되었음을 입증한다. 보다 중요하게, 상기 선택적 스플라이스 구조물에 의해 획득된 발현 수준은 대조용(pHC + pScFv-Fc + pLC)에 필적하였다. 이는, 상기 분비 수준에 대한 의미있는 영향을 본 실험 셋업에서 측정할 수 없었기 때문에, 단지 단백질의 작은 분획만이 표면 디스플레이를 위한 분비 경로로부터 벗어남을 암시하였다.
요약
이들 결과를 근거로, 상기 선택적 스플라이스 구조물은 선택적 스플라이스에 의해 상기 생성된 항체의 일부가 세포막을 성공적으로 비켜났다는 결론을 내릴 수 있다. 표면 염색은 상기 PTCRA 막관통 도메인을 함유하는 구조물들에 대해서 낮았던 반면, 상기 염색은 상기 M1M2 막관통 영역을 함유하는 구조물로 형질감염된 세포에 대해서 높았으며 B7-1 막관통 영역을 함유하는 구조물에 대해서는 훨씬 더 높았다. 상기 신호 강도 외에, 염색될 수 있는 세포 집단의 백분율은 놀랍게도 상기 B7-1 구조물에 의한 형질감염에서 높았으며, 이는 상기 M1M2 막관통 영역이 B-세포의 진화 중 항체의 효율적인 막 디스플레이를 위해 선택되었고 따라서 면역글로불린의 막 디스플레이에 가장 효율적인 구조물을 나타낼 것으로 간주된다.
전체적인 항체 발현 수준은 상기 분비된 항체의 일부가 세포막으로 다시 향할 때 감소되었지만, 스플라이싱 되지 않은 대조용의 발현 수준의 대략 80%는 상이한 구조물들에 의해 도달되었다.
2개 초과의 서브유닛을 갖는 분자들을 또한 상기 BEAT® 구조물의 예에 의해 입증된 바와 같이 본 발명의 선택적 스플라이스 구조물을 사용하여 세포막상에서 성공적으로 디스플레이할 수 있었다. 이들 구조물은 막관통 영역을 상기 발현된 단백질의 작은 분획에 융합시켰다. 일례로 이중특이성 항체(BEAT)를 사용하는 경우, 오직 분비된 단백질만을 유도하는 대조용 형질감염에 비해 상기 분비 수준의 현저한 차이는 관찰할 수 없었다. 발현 수준에 대한 상기 선택적 스플라이스의 영향이 없거나 또는 단지 적게 존재하였다는 관찰은 상기 기술을 산업적인 용도에 허용 가능하게 한다. 더욱이, 본 명세서에 개시된 접근법이 세포막상에 디스플레이된 다량체의 특이적 검출을 허용함을 입증할 수 있었다. 놀랍게도, 상기 막관통 영역을 상기 분비된 단백질의 표면 디스플레이 또는 발현 수준에 영향을 미치지 않으면서 중쇄 또는 scFv-Fc 또는 이들 두 서브유닛 모두에 가할 수 있었다.
선택적 스플라이스에 의해 세포막상에 디스플레이된 다량체성 분자는 특정 세포의 분비된 다량체성 단백질의 생성물 조성을 반영하기 때문에, 상기 기술은 단세포 수준에서 분비 프로파일의 세포측정 기반의 정성적인 예견을 허용할 것이다. 이는 실시예 5에 입증되어 있다.
실시예 3: 인트론 서열의 변형에 의한 세포 표면 디스플레이 및 발현 역가의 조절
도입
실시예 2에서 입증된 바와 같이, 막관통 영역의 선택적 스플라이스는 달리 통상적으로 분비된 항체의 일부가 다시 세포 표면을 향하게 한다. 그럼에도 불구하고, 상기 분비 과정의 이러한 변형은 항체의 분비 수준에 부정적인 영향을 미칠 수도 있다. 분비된 및 막 디스플레이된 항체간의 스플라이스 비의 미세 조정은 스플라이싱 되지 않은(선택적 스플라이스 막관통 영역이 없는) 항체 구조물에 대해 관찰된 발현 수준을 회복하는데 도움을 줄 수도 있다. 이를 하기의 실시예에서 입증할 것이다.
물질 및 방법
형질감염
현탁액 CHO-S 세포를 50 ㎖ 생물반응기 튜브(튜브스핀스, TPP) 포맷 중의 폴리에틸렌이민(JetPEI®, 폴리플러스-형질감염, 프랑스 일키르히 소재)을 사용하여 발현 벡터들로 형질감염시켰다. 이를 위해서 지수 증식 세포를 5 ㎖의 OptiMEM 배지(#31985-047, 인비트로젠) 중에 2 E6 세포/㎖의 밀도로 시딩하였다. JetPEI®:DNA 복합체를 상기 세포에 3(㎍/㎍)의 중량비로 가하였다. 상기 세포 현탁액 중의 최종 DNA 농도는 2.5 ㎍/㎖이었다. 진탕(200 rpm) 하에 37 ℃에서 5시간 인큐베이션 후에, 5 ㎖의 신선한 인큐베이션 배지를 상기 세포 현탁액에 가하였다. 이어서 상기 세포를 37 ℃, 5% CO2 및 80% 습도에서 진탕 플랫폼상에서 인큐베이션하였다.
표면 염색
세포의 표면 염색을 형질감염 후 1일째에 수행하였다. 총 1 E5 세포를 수확하고 96웰 플레이트의 환저 웰로 옮겼다. 상기 세포를 세척 완충제(PBS 중 2% FBS)로 2회 세척하고 이어서 검출 항체를 함유하는 100 ㎕ 세척 완충제에 재현탁하였다. 중쇄의 특이적 검출을, 청색 레이저(488 ㎚)에 의해 여기되고 스펙트럼 범위 583/26 ㎚에서 검출되는 PE 접합된 염소 항 인간 IgG 항체(#512-4998-82, 이바이오사이언스)를 사용하여 수행하였다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 1회 세척하고 유식 세포측정 분석을 위해 200 ㎕의 세척 완충제에 재현탁시켰다. 상기 세포를 구아바 유식 세포계(머크 밀리포어) 또는 FACSCalibur(벡톤 디킨슨)로 분석하였다. 분비된 분자의 일시 발현 수준을 옥텟 QK 장비(포르테바이오, 미국 캘리포니아주 멘로 파크 소재) 및 단백질 A 바이오센서를 사용하여 형질감염 후 4 내지 6일째에 측정하였다.
결과
CHO-S 세포를, 경쇄를 발현하는 발현 벡터 pGLEX41_LC(서열번호 294) 및 중쇄를 암호화하고 M1M2 막관통 도메인(서열번호 36-39), PTCRA 막관통 도메인(서열번호 40-43), M1M2-PTCRA 융합 막관통 도메인(서열번호 44-47) 또는 B7-1 막관통 도메인(서열번호 53-56)을 갖는 인트론의 변형된 버전들을 함유하는 제2 벡터를 사용하여, 상기 물질 및 방법 섹션에 개시된 바와 같이 형질감염시켰다. 대조용으로서, 선택적 스플라이스가 없는 분비된 중쇄를 사용하였다(서열번호 48).
형질감염 후에, 상기 세포를 물질 및 방법에 개시된 바와 같이 염색하고 유식 세포측정에 의해 분석하였다. 이미 실시예 2에서 관찰된 바와 같이, 경쇄 및 중쇄의 분비된 버전을 발현하는 음성 대조용(막관통 영역의 선택적 스플라이스 없음)은 상당한 수준의 IgG1 분비(도 7 참조)와 함께 단지 낮은 분율의 염색된 세포를 제공하였다(도 6 참조). 이와 대조적으로, M1M2 영역(서열번호 36, 도 6A) 및 B7-1 막관통 도메인(서열번호 55, 도 6M)을 함유하는 구조물로 형질감염된 세포는 세포막상에 상기 항체를 디스플레이하는 현저한 양성 집단을 나타내었다. PTCRA 막관통 도메인(서열번호 40, 도 6E) 또는 M1M2-PTCRA 융합 막관통 도메인(서열번호 44, 도 6I)을 갖는 양성 집단은 약하게 염색되었다.
상기 인트론의 폴리(Y) 트랙 중의 Y 함량의 감소는 상기 스플라이스 수용체를 약화시키는 것으로 나타났으며 이는 상기 스플라이스 비를 분비된 항체에 유리하게 이동시키기 위해 도입되었다. 성공적인 디스플레이를 유도하는 상기 두 막관통 영역(M1M2 및 B7-1)에 대해서, 상기 인트론의 폴리(Y) 트랙 중에 Y가 없는 구조물들(서열번호 37 및 서열번호 53)은 세포의 표면 염색을 나타내지 않았다(도 6B 및 N 참조). 이는 상기 스플라이스의 비가 대개는 분비된 항체를 향해 이동함을 암시하였다.
마우스 면역글로불린 μ 1차 전사물의 인트론 중의 추가적인 폴리(A) 부위의 존재는 상기 선택적 스플라이스 사건에 영향을 주어, 보다 높은 분율의 분비된 생성물(Galli et al., 1987) 및 보다 적은 막 디스플레이된 항체를 유도하는 것으로 나타났다. 이러한 발견을 근거로, 상기 스플라이스 비를 항체 분비에 유리하게 이동시키기 위해서 SV 40 폴리(A) 부위를 상기 분비된 폴리펩타이드의 정지 코돈의 3' 및 상기 인트론의 분지점의 5'에 도입시켰다. 상기 인트론 중의 SV 40 폴리(A) 부위의 부가에 의해, 상기 항체의 분비 수준은 원래의 I4의 경우에 비해 M1M2 구조물에 대해 현저하게 증가하였다(도 7 참조). 동시에, 상기 M1M2 구조물에 대한 막 디스플레이된 항체의 분율(도 6C 참조)이 증가하였다. 상기 B7-1 세포의 염색은 이미 매우 높았기 때문에, 상기 막 디스플레이에 대한 폴리(A)의 영향에 대한 결론을 도출할 수 없었다(도 6O 참조).
가스트린 종결자 부위(mRNA 전사를 종결시키는 것으로 보고됨)를 발현 카세트 부근에서 다른 스플라이스 수용체에 의한 이상 스플라이스 사건을 피하기 위해서 상기 발현 카세트의 폴리(A) 부위의 3'에 직접 도입시켰다. 상기 가스트린 종결자 구조물은 특히 상기 M1M2 구조물에 막 디스플레이된 항체의 분율을 증가시켰지만(도 6D), 분비 수준의 현저한 증가는 유도하지 않았다. 다시, 상기 B7-1 세포에 대한 결론은 도출할 수 없었다(도 6P).
선택적 스플라이스, 및 따라서 전체적으로 생성된 항체의 일부의 막-결합된 발현은 전체적인 분비된 IgG의 역가에 부정적인 영향을 미치는 것으로 보인다. 그럼에도 불구하고, 상기 M1M2 막관통 영역(또한 PTCRA 막관통 도메인과 함께) 및 특히 B7-1 막관통 영역은 선택적 스플라이스 없는 대조용 구조물의 분비 수준의 80%까지 허용하였다(도 7 참조). 더욱 또한, 상기 인트론 중의 폴리(A) 신호의 부가는 세포막상에서 현저한 염색을 유지시키면서 IgG 분비에 유리한 것으로 밝혀졌다. 다른 한편으로 상기 가스트린 종결자는 각각의 참조 구조물에 비해 분비에 단지 작은 영향만을 보였다(도 7 참조).
선행 실험들에서, 상기 인트론 서열의 상이한 변형들은 상기 구조물의 막관통 영역과 독립적으로, 선택적 스플라이스의 효율에 유사한 영향을 나타내었다. 따라서 상기 B7-1 막관통 영역을, 상기가 최고 수준의 염색을 유도하였으므로, 상기 선택적 스플라이스 비에 대한 인트론 서열 변형의 영향 및 항체 분비 수준을 추가로 특성화하기 위해서 선택하였다.
세포 표면 디스플레이된 항체의 양을 감소시키고 대조용 구조물의 발현 수준을 회복시키기 위해서, 스플라이스 비를 분비된 생성물에 유리하게 변경시켰다, 즉 상기 스플라이스 공여 및 스플라이스 수용 부위를 약화시켰다.
상기 스플라이스 수용체 컨센서스 서열 중에 존재하는 폴리(Y) 트랙은 상기 스플라이스 수용체 강도에 중요한 역할을 하는 것으로 공지되어 있다(상기 폴리(Y) 트랙이 짧을수록, 상기 스플라이스 수용 부위가 약해진다). 선행 실험에서, 폴리(Y) 트랙 중 Y함량의 0으로의 완전한 감소는 상기 항체의 세포 표면 디스플레이를 없애는 것으로 나타났다. 천연 치킨 TNT 인트론 4 폴리(Y) 트랙은 27 Y를 함유한다. 폴리(Y) 트랙 중에 감소된 수의 Y를 함유하는 변형된 인트론을 갖는 일련의 구조물을 앞서 개시된 바와 같이 CHO-S 세포에 형질감염시켰다(서열번호 53, 55, 59-63). 표면 염색 및 옥텟 장치 및 단백질 A 바이오센서를 사용하여 발현 수준의 평가 후에, 상기 항체의 세포 표면 디스플레이에 대한 상기 폴리(Y) 트랙의 영향을 명확히 확인할 수 있었다: 상기 폴리(Y) 트랙 중 9Y 미만은 염색된 세포의 비율(도 8 A, B, C, D, E, F, G, H 참조)뿐만 아니라 염색 강도(도 8A, B, C, D, E, F, G, J 참조)를 대단히 감소시켰다. 불행하게도, 세포 표면 디스플레이의 이러한 감소는 전체 발현 수준에 영향을 미치지 않았으며 모든 구조물이 대조용보다 낮은 채로 있었다(도 8I 참조).
상기 스플라이스 비를 분비된 생성물 쪽으로 증가시키는 또 다른 방법은 스플라이스 공여체의 DNA 서열을 변화시킴으로써 선택적으로 스플라이싱된 인트론의 5' 단부에서 상기 스플라이스 공여체의 강도를 감소시키는 것이다. 원래 구조물과 동일한 아미노산 서열을 암호화하는 2개의 상이한 DNA 구조물(SD_CCC, 서열번호 58 및 SD_CCC, 서열번호 57)을 상기 동일한 아미노산을 암호화하는 선택적 코돈을 이용하여 생성시킬 수 있다. 상기 스플라이스 공여체 컨센서스 서열(SD_CCC, 서열번호 58)의 첫 번째 변형은 염색된 세포의 백분율, 염색 강도 또는 발현 수준에 영향을 미치지 않았지만(도 9 참조), 두 번째 경우(SD_GGC, 서열번호 57)는 표면 디스플레이의 대단한 감소를 보였다(백분율 및 강도 모두, 도 9C, D 및 F 참조). 이러한 표면 디스플레이의 감소는 선택적 막관통 도메인 없는 대조용 수준까지 발현 역가의 명백한 감소와 상관되었다(도 9E 참조). 더욱 또한, 상기 세포 표면 디스플레이는 천연 치킨 TNT 인트론 4 서열과 비교시 대단히 감소하였지만, 막관통 도메인이 없는 대조용과 비교시 현저한 염색을 관찰할 수 있었다(도 9C 참조).
요약
상기 가스트린 종결자는 특히 M1M2 구조물에 대해서 세포막상의 IgG에 양으로 염색된 세포의 분율을 증가시켰으나, 표준 구조물에 비해 분비된 IgG의 보다 높은 발현은 유도하지 않았다. 상기 인트론 중 추가적인 폴리(A)의 삽입은 구조물 M1M2 중 막 디스플레이된 항체의 분율을 증가시켰다(B7-1의 경우 결론을 도출할 수 없었다). 추가적인 폴리(A)를 갖는 상기 M1M2 구조물은 또한 높은 수준의 분비된 IgG(스플라이싱 되지 않은 대조용 구조물의 발현의 80%까지)를 나타내었다.
상기 폴리(Y) 트랙의 감소는 상기 스플라이스 수용체를 약화시키고 상기 막 디스플레이된 스플라이스 변이체의 발현을 감소시키는 것으로 예상되었다. 이를 4개의 상이한 기본 구조물 전부(M1M2, PTCRA, M1M2-PTCRA 및 B7-1)에 대해 확인할 수 있었다. 더욱 또한, 표면 디스플레이의 수준은 상기 B7-1 막관통 도메인에 대한 실시예에 의해 묘사된 바와 같이, 상기 폴리(A) 트랙의 길이에 직접적으로 상관있는 것으로 밝혀졌다. 상기 폴리(Y) 트랙 중 최소한의 5Y는 상기와 관련하여 유의수준의 표면 염색에 필요한 것으로 밝혀졌다. 동시에, 분비된 항체의 발현 수준의 증가는 관찰할 수 없었다. 따라서, 상기 선택적 스플라이스의 이동은 분비된 생성물의 축적이 이롭지 않았다. 뜻밖에도, 상기 스플라이스 공여체 컨센서스 서열의 특정한 변형은 분비된 항체의 수준을 증가시키면서 표면 염색 수준의 감소를 허용하였다. 상기 표면 디스플레이의 수준은 매우 낮았으나, 대조용 구조물에 비해 여전히 유의수준이었고, 분비 수준은 대조용과 동일한 것으로 밝혀졌다.
발명자들은 상기 선택적 스플라이스 사건의 빈도가 상기 스플라이스 공여 부위의 강도에 의해 결정되는 것으로 생각한다. 상응하는 스플라이스 수용체가 충분히 강한 경우(상기 폴리(Y) 트랙 중 5Y 초과), 선택적 스플라이스는 막관통 영역을 갖는 구조물을 암호화하는 선택적 mRNA의 형성 및 따라서 막 디스플레이를 유도할 것이다. 상기 스플라이스 수용체를 상기 폴리(Y) 트랙 중 Y의 양을 5Y 미만으로 낮춤으로써 약화시키는 경우, 스플라이스 사건은 덜 효율적일 것이며 상기 선택적 pre-mRNA는 분해될 수도 있는 반면, 스플라이싱 되지 않은 mRNA 및 따라서 분비 수준에는 영향이 없다. 이에 따라서, 상기 스플라이스 수용체의 약화 후에 적은 막 디스플레이가 관찰되었지만, 분비 수준에는 영향이 없었다. 다른 한편으로 상기 스플라이스 공여체의 강도의 감소는 상기 선택적 스플라이스 사건의 빈도를 감소시킬 수도 있다. 결과적으로, 보다 많은 mRNA가 스플라이싱 되지 않은 mRNA의 분비된 생성물을 암호화하고, 이는 분비된 항체의 증가가 관찰되게 한다. 강한 스플라이스 수용체는 mRNA의 효율적인 선택적 스플라이스를 유도하지만, 약한 스플라이스 공여체로 인해 빈도가 낮으며, 이는 현저하지만 약한 막 디스플레이가 관찰됨을 설명할 수 있다.
요약하면, 상기 스플라이스 공여체 및/또는 스플라이스 수용체 서열의 변형은 표면 디스플레이의 수준 및 항체의 분비 수준을 모두 선택적 스플라이스가 없이 발현된 항체의 분비 수준 이하로 변형시켰다. 따라서 상기 제공된 구조물은 상기 선택적 스플라이스 효율을 조절함으로써 상기 디스플레이의 미세 조정 및 목적하는 수준 이하로의 분비를 허용한다.
문헌[Galli G1, Guise J, Tucker PW, Nevins JR (1988). Poly(A) site choice rather than splice site choice governs the regulated production of IgM heavy-chain RNAs. Proc Natl Acad Sci U S A. Apr;85(8):2439-43].
실시예 4: 세포 표면 디스플레이에 대한 막관통 영역의 영향
도입
세포에 의해 생성된 항체 분획의 막 디스플레이에 대한 선택적 스플라이스 시스템은 막관통 영역의 특성에 의해 변경될 수도 있다. 예를 들어, 상기 막관통 도메인의 길이 및 구조가 상기 막 디스플레이의 효능에 영향을 미칠 수도 있음을 추측할 수 있었다. 더욱 또한, 상기 막관통 영역의 시토졸 꼬리는 ER 유출 신호의 존재 또는 부재에 의해 상기 세포 표면 디스플레이에 영향을 미칠 수도 있다. 하기의 실시예에서, 우리는 상기 막관통 도메인의 아미노산 조성이나, 그의 길이 또는 상기 막관통 영역의 시토졸 꼬리가 모두 표면 디스플레이 및 분비에 중요한 영향을 미치지 않음을 입증한다.
물질 및 방법
형질감염
현탁액 CHO-S 세포를 50 ㎖ 생물반응기 튜브(튜브스핀스, TPP) 포맷 중의 폴리에틸렌이민(JetPEI®, 폴리플러스-형질감염, 프랑스 일키르히 소재)을 사용하여 발현 벡터들로 형질감염시켰다. 이를 위해서 지수 증식 세포를 5 ㎖의 OptiMEM 배지(#31985-047, 인비트로젠) 중에 2 E6 세포/㎖의 밀도로 시딩하였다. JetPEI®:DNA 복합체를 상기 세포에 3(㎍/㎍)의 중량비로 가하였다. 상기 세포 현탁액 중의 최종 DNA 농도는 2.5 ㎍/㎖이었다. 진탕(200 rpm) 하에 37 ℃에서 5시간 인큐베이션 후에, 5 ㎖의 신선한 인큐베이션 배지를 상기 세포 현탁액에 가하였다. 이어서 상기 세포를 37 ℃, 5% CO2 및 80% 습도에서 진탕 플랫폼상에서 인큐베이션하였다.
표면 염색
세포의 표면 염색을 형질감염 후 1일째에 수행하였다. 총 1 E5 세포를 수확하고 96웰 플레이트의 환저 웰로 옮겼다. 상기 세포를 세척 완충제(PBS 중 2% FBS)로 2회 세척하고 이어서 검출 항체를 함유하는 100 ㎕ 세척 완충제에 재현탁하였다. 중쇄의 특이적 검출을, 청색 레이저(488 ㎚)에 의해 여기되고 스펙트럼 범위 583/26 ㎚에서 검출되는 PE 접합된 염소 항 인간 IgG 항체(#512-4998-82, 이바이오사이언스)를 사용하여 수행하였다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 1회 세척하고 유식 세포측정 분석을 위해 200 ㎕의 세척 완충제에 재현탁시켰다. 상기 세포를 구아바 유식 세포계(머크 밀리포어) 또는 FACSCalibur(벡톤 디킨슨)로 분석하였다. 분비된 분자의 일시 발현 수준을 옥텟 QK 장비(포르테바이오, 미국 캘리포니아주 멘로 파크 소재) 및 단백질 A 바이오센서를 사용하여 형질감염 후 4 내지 6일째에 측정하였다.
결과
CHO-S 세포를, 경쇄를 발현하는 발현 벡터 pGLEX41_LC(서열번호 294) 및 상이한 막관통 영역을 갖는 중쇄를 암호화하는 제 2벡터를 사용하여, 상기 물질 및 방법 섹션에 개시된 바와 같이 형질감염시켰다. 대조용으로서, 선택적 스플라이스가 없이 분비된 중쇄를 사용하였고(서열번호 48) B7-1 막관통 영역(서열번호 55)을 갖는 구조물을 양성 대조용으로서 사용하였다.
형질감염 후에, 상기 세포를 물질 및 방법에 개시된 바와 같이 염색하고 유식 세포측정에 의해 분석하였다.
막관통 도메인 길이 및 조성
세포 표면 디스플레이 및 항체 분비 수준에 대한 막관통 도메인의 영향을 분석하기 위해서, B7-1 막관통 도메인을 오직 소수성 잔기들(서열번호 81-86 참조)만을 함유하는 유사한 길이(22-23 아미노산)의 막관통 도메인에 의해 치환시켰다. 상기 막관통 도메인의 치환은 항체의 세포 표면 디스플레이 또는 분비에 영향을 미치지 않았다(도 10 참조).
상기 B7-1 막관통 도메인을 소수성 잔기뿐만 아니라 극성 또는 하전된 잔기들(서열번호 87-93)을 함유하는 유사한 길이(21-24 아미노산)의 막관통 도메인에 의해 치환시킨 경우, PTCRA(서열번호 93)로부터 유래된 막관통 도메인을 제외하고, 표면 디스플레이 또는 분비에 대한 영향을 관찰할 수 없었다. 상기 막관통 도메인은, 세포 표면상에 생성물을 나타내는 세포의 분율을 변화시키지 않으면서, 분비 수준에 어떠한 영향도 없이 상기 생성물의 표면 밀도를 대단히 감소시켰다(도 11H, J, K 및 L 참조).
막관통 도메인은 소수성 지질 상에 의해 둘러싸여 있다. 상기 막의 소수성 환경에 이온성 기를 삽입하는 에너지 비용은 매우 높으며, 따라서 상기 막관통 도메인 중의 하전된 아미노산에 대해서 강한 치우침이 존재해야 한다(White and Wimley, 1999). 막관통 나선의 통계학적 분석은 막관통 도메인이, 특히 상기 막관통 영역의 소수성 코어 중에, 주로 소수성 아미노산 잔기에 의해 구성됨을 확인하였다(Beza-Delgado, 2012). 이러한 관찰을 근거로, 우리는 관찰된 약한 염색 강도에 대한, 상기 PTCRA 막관통 도메인 중의 3개의 하전된 잔기(R8, K13 및 D18, 상기 넘버링은 상기 막관통 나선의 발단에서 시작한다)의 영향을 확인하고자 하였다. 상이한 하전된 잔기가 아미노산 발린(상기 막관통 도메인 중의 가장 흔한 4개의 아미노산 중 하나(Baeza-Delgado et al., 2012))으로 교환된 다수의 PTCRA 구조물을 설계하였으며 CHO-S 세포에 형질감염시켰다(서열번호 94-100). 이러한 형질감염의 결과는 상기 표면 염색 강도에 대한 상기 하전된 잔기의 영향을 입증하였다. 단일 아미노산 R8V(서열번호 94), K13V(서열번호 95) 또는 D18V(서열번호 96)의 돌연변이는 표면 디스플레이된 항체의 밀도를 현저하게 증가시켰으나, 상기 항체의 분비 수준에는 그다지 영향을 미치지 않았다(도 12B, C, D 및 J 참조). 상기 단일 돌연변이의 결과로부터 예상되는 바와 같이, 2개의 돌연변이된 하전된 잔기들의 조합(R8V 및 K13V(서열번호 97), R8V 및 D18V(서열번호 98) 또는 K13V 및 D18V(서열번호 99))은 PTCRA의 막관통 도메인과 유사한 분비 수준 및 표면 디스플레이 수준을 나타내었다(도 12E, F, G 및 J 참조). 최종적으로, 3개의 하전된 잔기 모두의 발린으로의 돌연변이(서열번호 100)는 예상된 바와 같이 대조용에 비해 높은 표면 디스플레이를 생성시켰다. 뜻밖에도, 분비된 항체의 발현 수준뿐만 아니라 염색된 세포의 백분율은 상기 구조물에 의해 약간 더 낮았다(도 12H 및 J 참조). 상기 감소된 분비 및 염색 수준에 대한 이유는 현재 불명확하다.
상기 B7-1 막관통 도메인을 소수성 잔기뿐만 아니라 극성 또는 하전된 잔기를 함유하는 보다 짧은 막관통 도메인(17-19 아미노산)(서열번호 101-103)에 의해 치환시킨 경우, 상이한 효과를 확인할 수 있었다. 결과를 도 13에서 찾을 수 있다. FCERA(서열번호 101) 및 KI2L2(서열번호 102)의 막관통 도메인은 염색된 세포의 비율에 작은 유해 영향을 미치는 반면(도 13B, C 및 E), 오직 FCERA로부터 유래된 막관통 도메인이 염색 강도에 부정적인 영향을 미쳤다(도 13C 및 G). 더욱 또한, 2개의 막관통 도메인(FCERA 및 KI2L2)은 모두 분비 수준에 부수적인 유리한 영향을 미쳤다(도 13F). 다른 한편으로 IL3RB(서열번호 103)로부터의 막관통 도메인의 경우, 염색된 세포의 백분율 및 분비 수준에 대해서 상기 B7-1 참조 구조물과 비교된 변화는 관찰되지 않았으며(도 13D, E 및 F), 오직 염색 강도의 약간의 감소만이 관찰되었다(도 13G). 이는 상기 짧은 막관통 도메인을 생성물 표면 디스플레이의 미세 조정에 잠재적인 도구로 만든다.
상기 B7-1 막관통 도메인을 소수성 잔기뿐만 아니라 극성 또는 하전된 잔기(서열번호 104-107)를 함유하는 보다 긴 막관통 도메인에 의해 치환시키는 경우, 상기 B7-1 막관통 도메인을 갖는 참조 구조물에 비해 염색된 세포의 백분율이나, 염색 강도에 대한 영향이 관찰되지 않았다(도 14B, C, D, E, F 및 H 참조). 그럼에도 불구하고 분비는 B7-1보다 상기 막관통 도메인 모두에 의해 약간 더 양호하였다(도 14G 참조).
하나의 막관통 도메인에서 또 다른 막관통 도메인으로의 치환 없이 보다 한정된 방식으로 상기 막관통 도메인 길이의 영향을 평가하기 위해서, 변형된 B7-1 막관통 도메인을 갖는 구조물을 설계하였다. 다수의 소수성 아미노산을 상기 B7-1 막관통 도메인의 소수성 중심으로부터 제거하거나 상기 중심에 가하였다(서열번호 108-111). B7-1의 18 아미노산으로의 단축(서열번호 108)은 염색된 세포의 백분율에 대해 이로웠으나, 염색 강도에 대해서는 약간 손해였다(도 15B, F 및 H 참조). 3개의 다른 구조물(각각 20(서열번호 109), 24(서열번호 110) 및 26(서열번호 111) 아미노산)은 염색된 세포의 백분율 또는 염색 강도에 그다지 영향을 미치지 않았다(도 14C, D, E, F 및 H 참조). 분비 수준에 관하여, 상기 막관통 도메인의 길이의 단축은 이로운 것으로 밝혀진 반면, 연신된 막관통 도메인을 갖는 구조물은 천연 B7-1을 갖는 구조물에 필적하는 분비 수준을 나타내었다(도 14G 참조).
일반적으로, 보다 짧은 막관통 도메인은 염색된 세포의 백분율 및 항체의 분비에 관하여 유리한 것으로 보이지만, 염색 강도는 보다 긴 막관통 도메인에 비해 약간 감소할 수도 있다.
시토졸 꼬리
문헌은 B7-1 시토졸 꼬리 중의 구조적인 비-선형 ER 유출 신호의 존재를 암시한다(Lin et al., 2013). 저자는 세포 표면에 표적화된 막관통 단백질의 시토졸 도메인 중의 ER 유출 신호의 존재가 세포 표면상의 단백질의 양에 긍정적인 영향을 미칠 수도 있음을 발견하였다. 높은 턴오버를 갖는 단백질의 경우에, 상기 EF로부터 막으로의 가속화된 유출은 원형질막으로부터의 단백질분해적 절단을 상쇄시킬 수 있다.
상기 ER 유출 신호가 우리의 시스템에서 막 디스플레이에 적합한지의 여부를 평가하기 위해서, B7-1 시토졸 꼬리를, ER 유출 신호 및 ER 유출 신호 없는 결실 돌연변이체를 함유하는 것으로 공지된 다수의 막관통 단백질의 시토졸 꼬리에 의해 치환시켰다(서열번호 112-124).
도 16P에 도시된 바와 같이, ER 유출 신호의 부재는 분비된 항체의 수준에 약간 유리한 것으로 밝혀진 반면, 염색된 세포의 백분율(도 16B-N 및 O) 및 염색 강도(도 16B-N 및 Q)는 그다지 영향을 받지 않았다. 따라서, 우리의 막 디스플레이된 항체는 빠른 턴오버가 필요하지 않을 수도 있다.
이들 구조물 외에, M1M2 막관통 도메인에서 B7-1 시토졸 꼬리에 의한 M1M2 시토졸 꼬리의 교환을 수행하였다(서열번호 125). 도 17E에 도시된 바와 같이, 상기 교환은 형광의 강도를 약간 증가시켰으나, 염색된 세포의 백분율(도 17C)이나 분비 수준(도 17D)에는 영향을 미치지 않았다.
요약
합해보면, 상기 데이터는 우리의 선택적 스플라이스 시스템에서 막관통 도메인의 길이 또는 아미노산 조성이 항체의 분비 수준 및 세포막상의 생성물 디스플레이에 단지 작은 영향만을 미쳤음을 암시한다. 상기 선택적 스플라이스 시스템의 미세-조정에 사용될 수도 있는, 분비된 대 막-디스플레이된 생성물의 비의 작은 이동이 관찰되었다. 상기 구조물들은 모두 항체의 현저한 표면 디스플레이 및 또한 적합한 분비 수준을 허용하였다.
흥미롭게도, 상기 막관통 도메인의 큰 영향은 상기 세포 표면 디스플레이의 형광 수준에서 관찰되었다. 소수성 아미노산의 존재 또는 부재는 평균 형광의 조절을 허용한 반면, 세포 표면 디스플레이를 나타내는 세포의 백분율 또는 분비 수준에는 영향을 미치지 않았다.
상기 세포질 꼬리 중의 ER 유출 신호는 대조용 항체의 세포 표면 디스플레이에 필요하지 않은 것으로 밝혀졌다. 글리신-알라닌 링커 및 6개의 히스티딘으로 이루어지는 최소 세포질 꼬리 또는 상기 B7-1 꼬리의 처음 5개 아미노산이면 세포 표면 디스플레이에 충분하였다. 이는 빨리 턴오버되는 다른 항체 또는 단백질의 경우와 상이할 수도 있다. 따라서 상기 시토졸 꼬리는 관심 단백질의 표면 디스플레이를 조절하기 위한 흥미로운 도구일 수 있다.
합해보면, 실시예 2 내지 4로부터의 데이터는 표면 디스플레이 수준 및 분비 수준이 상기 선택적 스플라이스 및 막-결합된 단백질의 막 통합에 관련된 상이한 서열들에 의해 영향을 받음을 암시한다. 상기 스플라이스 공여 부위의 특정한 변형은 대조용 비-선택적 스플라이스 구조물과 동일한 분비 수준의 회복을 허용한 반면(실시예 3 도 9 참조), 표면 염색은 B7-1 막관통 영역을 사용하는 경우 현저하게 감소하였다. 다른 한편으로, M1M2 막관통 영역을 사용하는 경우 인트론 중의 SV40 폴리(A)의 부가는 분비 및 표면 디스플레이 수준을 모두 증가시켰다(실시예 3 도 6 및 7 참조). 더욱이, B7-1이 18 또는 20 아미노산으로 감소된 바와 같은 상기 B7-1 막관통 도메인의 변형(도 15 참조)은 상기 분비 수준 및 표면 디스플레이 수준 모두에 긍정적인 영향을 미쳤다. 최종적으로, 상기 B7-1 시토졸 꼬리의, 6His 또는 KCFCK로서 ER 유출 신호를 함유하지 않는 시토졸 꼬리에 의한 치환이 또한 표면 디스플레이 및 분비 수준 모두를 개선시켰다. 최종적으로, 발현시 발현 카세트의 단부에서 가스트린 종결자의 영향은 긍정적이었으며, 인트론 중에 놓는 경우 훨씬 더 유리할 수도 있다. 따라서, 이러한 상이한 특징들을 겸비하는 구조물들은 훨씬 더 유리할 수 있으며, 이는 세포 선택을 원하는 세포 표면 디스플레이의 높은 동적 범위와 결합된 최상의 분비 수준을 허용한다.
이들 구조물의 주쇄는 pGLEX41(GSC281, 서열번호 304)일 것이며 상기 발현 구조물의 단부까지의 상기 스플라이싱 되지 않은 ORF의 최종 5개 아미노산의 서열을 표 17의 단백질 서열과 동일한 융합된 막관통 영역을 갖는 아미노산으로부터 출발하는 단백질 서열뿐만 아니라 DNA 서열로서 나열한다.
잠재적인 구조물들의 서열(*)
구조물 명칭 DNA 서열
서열번호
단백질 서열
서열번호
pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His 331 332
pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His 335 336
pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK 333 334
pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK 337 338
pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His 329 330
pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His 341 342
pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK 339 340
pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK 343 344
*서열은 스플라이싱 되지 않은 ORF의 최종 5개 아미노산으로부터 발현 구조물의 단부까지의 신장부를 나열하였다.
간행물:
Lin, Y., Chen, B., Wei-Cheng Lu, W., Chien-I Su, C., Prijovich,Z., Chung, W., Wu, P., Chen, K., Lee, I., Juan, T and Roffler, S. (2013). The B7-1 Cytoplasmic Tail Enhances Intracellular Transport and Mammalian Cell Surface Display of Chimeric Proteins in the Absence of a Linear ER Export Motif PLoS One. Sep 20;8(9)
Baeza-Delgado, C1, Marti-Renom, MA, Mingarro, I. (2012). Structure-based statistical analysis of transmembrane helices. Eur Biophys J. 2013 Mar;42(2-3):199-207
White, SH and Wimley, WC. (1999). Membrane protein folding and stability: physical principles. Annu Rev Biophys Biomol Struct. 28:319-65.
실시예 5: 표면 디스플레이를 위해 선택적 스플라이스를 사용하는 생성물 분비의 정성적인 예견
도입
세포의 형질감염은 재조합 단백질 발현을 위한 안정한 세포주의 확립에 초기 단계이다. 많은 이유(이종 초기 세포 집단, 게놈 중 플라스미드의 상이한 통합 유전자좌, 상이한 번역-후 기구, 및 발현의 후생적인 조절)로 인해 상기 단계는 일반적으로 발현 및 분비 수준, 그러나 또한 품질 특성, 예를 들어 단백질 폴딩, 글리코실화 및 다른 번역-후 변형에 관하여 이종 세포 집단을 생성시킨다. 이중특이성 항체는 모든 가능한 조합으로 조립될 수 있는 4개 이하의 상이한 서브유닛(2개의 중쇄 및 2개의 경쇄)에 의해 구성된다. ER에서의 폴딩 효능뿐만 아니라 플라스미드 통합, 전사 및 번역의 조절에 따라, 특정 클론은 불필요한 부산물 대신에 바람직하게는 정확하게 조립된 생성물을 분비할 수 있다. 상기 목적하는 분비 패턴을 갖는 클론의 선택은 분비된 단백질의 광범위한 선별 및 특성화를 요한다. 관심 생성물 및 최소 부산물을 생성시키는 세포주를 획득하기 위해서 필요한 선별의 양을 감소시키는 것은 큰 발전일 수 있다.
앞서 실시예 2 내지 4에서, 선별된 단백질의 일부를 선택적 스플라이스 기술을 사용하여 세포막 디스플레이를 위한 분비 경로로부터 이탈시킬 수 있음이 입증되었다. 또한 세포막상에 디스플레이된 단백질의 특이적인 검출은 유식 세포측정을 통해 가능함이 입증되었다.
본 실시예의 목적은 세포막상의 생성물 패턴 디스플레이가 클론의 분비 프로파일을 예견함을 입증하는 것이었다. 이를 위해서, 실시예 2에서 제공된 이종삼량체성 이중특이성 BEAT® 항체를 모델로서 사용하였다. 상기 분자는 하기에서 "표적1" 및 "표적2"라 칭하는 2개의 상이한 가용성 분자에 결합한다. 상기 분자의 개략적 삽화를 도 18, 구조 A에서 볼 수 있다. 이를 하기 본문에서 "BEAT"라 약기할 것이다. 형질감염 후 BEAT 분자뿐만 아니라 "표적1"에 결합하는 단일특이성 중쇄-경쇄 이량체가 분비된다. 상기 분자를 Fab 동종이량체("Fab-DIM"이라 약기함)라 칭한다. 두 번째 부산물은 "표적2"에 결합하는 단일특이성 scFv-Fc 동종이량체("scFv-Fc-DIM"이라 약기함)이다. 이들 부산물을 도 18에서 구조 B 및 C로서 볼 수 있다.
발현 벡터 pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(서열번호 50), pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2(서열번호 52) 및 pGLEX41_BEAT-LC(서열번호 302) 또는 pGLEX41_BEAT-LC(서열번호 302), pGLEX41_scFv-Fc-I4-B7-B7-B7(서열번호 323) 및 pGLEX41_BEAT-HC-I4-B7-B7-B7(서열번호 321)에 의한 세포의 안정한 형질감염 후에, 클론들을 표면 염색에 의해 선별하였다. 2가지 접근법이 상기 세포의 표면 표현형을 특성화하기 위해 수행되었다. 첫 번째 경쇄 및 Fc 단편의 이중 표면 염색이 수행되었다. 상기 염색은 모든 생성된 종들의 검출을 허용하지 않았지만(BEAT와 Fab-DIM이 구분되지 않음), 단일특이성 오염물질 scFv-Fc-DIM을 검출하였다. 상기 방법은 모든 종류의 BEAT 분자에 보편적으로 적용 가능하다. 상기 두 번째 접근법은 보다 특이적이며 각각의 결합 가지의 검출을 위해 가용성 표적을 필요로 하였다. 이 경우에 3개의 가능한 생성물 모두 표면 염색에 의해 명료하게 검출되었다.
재조합 풀 및 클론을 각각 제한 희석 및 유식 세포측정 세포 분류에 의해 생성시켰다. 배치 또는 유가 배양을 수행하였으며 상등액 중에 축적된 생성물을 모세관 전기영동에 의해 분석하였다. 최종적으로 상기 상등액 중에서 측정된 분비 프로파일(BEAT, Fab-DIM 또는 scFv-Fc-DIM 분획)을 재조합 세포의 세포막상에 디스플레이된 생성물 프로파일과 비교하였다.
물질 및 방법
안정한 풀의 확립
안정한 형질감염된 CHO 세포를 각각 항생제 퓨로마이신 및 제네티신에 대한 내성을 제공하는 단백질의 발현을 위한 2개의 특허 벡터와 함께 이중특이성 이종이량체 BEAT의 발현을 위한 앞서 개시된 벡터 pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2("pHC-M1M2"로서 약기됨; 서열번호 50), pGLEX41_scFv-Fc-I4- M1M2-M1M2-M1M2("pscFv-Fc-M1M2"로서 약기됨;서열번호 52) 및 pGLEX41_BEAT-LC("pLC"로서 약기됨; 서열번호302)의 동시-형질감염에 의해 생성시켰다.
현탁액 CHO-S 세포를 50 ㎖ 생물반응기 포맷 중의 폴리에틸렌이민(JetPEI®, 폴리플러스-형질감염, 프랑스 일키르히 소재)을 사용하여 선형화된 벡터로 형질감염시켰다. 이를 위해서 지수 증식 세포를 5 ㎖의 OptiMEM 배지(#31985-047, 인비트로젠) 중에 2 E6 세포/㎖의 밀도로 시딩하였다. JetPEI®:DNA 복합체를 상기 세포에 3(㎍/㎍)의 중량 대 중량비로 가하였다. 2.5 ㎍/㎖의 최종 DNA 농도를 상기 세포에 가하였다. 상기 세포를 진탕(200 rpm) 하에 37 ℃에서 JetPEI®:DNA 복합체와 5시간 인큐베이션 후에, 5 ㎖의 배양 배지 PowerCHO2(#BE12-771Q, 론자(Lonza))를 상기 세포 현탁액에 가하였다. 이어서 상기 세포를 37 ℃, 5% CO2 및 80% 습도에서 진탕 플랫폼상에서 인큐베이션하였다. 형질감염 후 1일에 상기 세포를 96웰 플레이트에 안정한 풀의 생육을 허용하는 농도의 퓨로마이신(#P8833-25 ㎎, 시그마) 및 제네티신(#11811-098, 깁코(Gibco))을 함유하는 선택 배지 중에서 상이한 농도(0.7, 0.5 및 0.4 E5 세포/㎖)로 시딩하였다. 정적 조건하에서 14일의 선택 후에 15개의 생성 안정성 풀을 상기 웰로부터 골라내고 튜브스핀(TubeSpin) 생물반응기로 확대시켰다.
재조합 클론의 확립
클론들을 각각 항생제 퓨로마이신 및 제네티신에 대한 내성을 제공하는 단백질의 발현을 위한 2개의 특허 벡터와 함께 이중특이성 이종이량체 BEAT의 발현을 위한 앞서 개시된 벡터 pGLEX41_BEAT-HC-I4-B7-B7-B7("pHC-B7"로서 약기됨; 서열번호 321), pGLEX41_scFv-Fc-I4-B7-B7-B7("pscFv-Fc-B7"로서 약기됨; 서열번호 323) 및 pGLEX41_BEAT-LC("pLC"로서 약기됨; 서열번호302)의 동시-형질감염에 의해 생성시켰다. 형질감염 및 안정한 형질감염체의 선택을 앞서 개시한 바와 같이 수행하였다. 정적 조건하에서 14일의 선택 후에 모든 안정한 형질감염체를 수집하고, 모으고 1주일 동안 동적인 조건(궤도 진탕)하에서 계대배양하였다. 단세포 분류를 펄스 처리에 의해 세포 이중체를 제외하고 살아있는 세포상에서 게이팅에 의해 FACSAria II를 사용하여 수행하였다.
세포 표면상에 디스플레이된 생성물의 LC 및 Fc 염색
상기 안정한 세포상의 경쇄(LC) 및 Fc 단편의 이중 표면 염색을 실시예 2에 상세히 개시된 바와 같은 배치 시딩 후 2일째에 수행하였다. 간단히, 총 1 E5 세포를 수확하고 96 웰 플레이트의 환저 웰로 옮겼다. 상기 세포를 세척 완충제(PBS 중 2% FBS)로 2회 세척하고 이어서 100 ㎕의 검출 항체에 재현탁하였다. 카파 경쇄의 특이적 검출을 마우스 항-인간 카파 LC APC 표지된 항체(#561323, BD 파밍겐)를 사용하여 수행하고, Fc 단편을 PE 접합된 염소 항-인간 Fc 감마 특이성 항체(#12-4998-82, 이바이오사이언스)를 사용하여 검출하였다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 1회 세척하고 유식 세포측정 분석을 위해 200 ㎕에 재현탁시켰다. 상기 세포를 구아바 유식 세포계(머크 밀리포어)로 분석하였다.
세포 표면상에 디스플레이된 특정한 결합제의 염색
상기 염색을 위해서 가용성 표적을 세포 표면상에 디스플레이된 분자의 결합 가지의 검출에 사용하였다. 간단히, 총 1 E5 세포를 수확하고 96 웰 플레이트의 환저 웰로 옮겼다. 상기 세포를 세척 완충제(2% FBS를 함유하는 PBS)로 2회 세척하고 이어서 비오틴화된 표적1 및 His-태그된 표적2의 혼합물 100 ㎕에 재현탁하였다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 2회 세척하고 APC(#554067, BD 파밍겐)와 접합된 스트렙트아비딘 및 PE(#IC050P, RD 시스템스)로 표지된 항 His-Tag 항체를 함유하는 혼합물 100 ㎕에 재현탁하였다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 1회 세척하고 유식 세포측정 분석을 위해 200 ㎕에 재현탁시켰다. 상기 세포를 구아바 유식 세포계(머크 밀리포어)로 분석하였다.
세포 분비 프로파일의 분석
재조합 풀을 보충된 생육 배지(PowerCHO2, 2 mM L-글루타민, 8 mM 글루타맥스(라이프 테크놀로지스, 미국 캘리포니아주 칼스바드 소재), 15% 이피션트 피드(Efficient Feed) A(라이프 테크놀로지스), 15% 이피션트 피드 B(라이프 테크놀로지스)) 중의 0.5 E6 세포/㎖의 세포 밀도로 튜브스핀스에 시딩하였다. 클론들을 생육 배지(PowerCHO2, 2 mM L-글루타민) 중의 0.5 E6 세포/㎖의 세포 밀도로 튜브스핀스에 시딩하고 ActiCHO 피드 A & B 피드(#U050-078, PAA 레보라토리즈 GmbH)의 공급을 매일 기준으로 수행하였다. 배치 또는 유가배양 14일째에 상등액을 원심분리에 의해 수확하고 0.2 ㎛ 주사기 필터(#99722, TPP)를 사용하여 여과하였다. 조 상등액을 직접 분석하거나 또는 스트림라인(Streamline) 단백질 A 비드(#17-1281-02, 독일 소재)를 사용하여 정제하였다. 상기 단백질을 캘리퍼 랩칩(Caliper LabChip) GXII 단백질 분석을 사용하여 분석하였다. 상이한 종들이 그들의 분자량에 따라 확인되었으며 각 생성물의 분률을 측정하였다.
결과
총 15개의 안정한 풀을 pHC-M1M2, pScFv-Fc-M1M2 및 pLC 구조물에 의한 형질감염에 따라 수득하였다. 이들 풀의 분비 프로파일을 측정하기 위해서 보충된 배치를 시작하였다. 상기 풀상의 경쇄 및 Fc 단편(scFv-Fc 및 중쇄)의 이중 표면 염색을 배치 시딩 후 2일째에 수행하였다. 도 19는 보충된 배치 2일째에 이중 염색에 의해 측정된 풀 중 하나의 표면 프로파일의 일례를 제공한다. 점 도표는 카파 LC 염색에 대한 강도(y-축) 대 인간 Fc 염색의 강도(x-축)를 나타낸다. 사분면은 음으로 및 양으로 염색된 세포간의 임의의 한계를 고정시킨다. 사분면 Q8은 세포막상에 단백질을 발현하지 않는 세포의 분율, 예를 들어 비-생산자의 부분 모집단을 나타낸다. Q7은 상기 Fc 단편에 대해 양성이지만 카파 LC에 대해서는 음성인 세포의 분율이며 따라서 세포막상에서 scFv-Fc-DIM을 나타내는 세포에 상응한다. Q6에서 이중 양성 세포는 세포막상에서 Lc 및 Fc 단편, 예를 들어 BEAT 또는 Fab-DIM 분자를 모두 디스플레이하는 세포이다.
상기 분석은 33.8%의 비-생산자(Q8), 50.3%의 scFv-Fc-DIM 분비자(Q7) 및 15.8%의 잠재적인 BEAT 또는 Fab-DIM 분비자(Q6)의 이종 세포 집단을 암시하였다. 상기 표면 염색과 분비된 생성물간의 상관성을 계산할 수 있기 위해서, 오직 생산 집단만을 고려하였다. 따라서 생산 세포 분획(Q6 + Q7) 내의 BEAT 및 Fab-DIM 생산자의 분율뿐만 아니라 scFv-Fc-DIM 생산자의 분율을 상기 비-생산자 분율 Q8을 제외하고 다시 계산하였다(상기 분율을 Q6* 및 Q7*로서 칭할 것이다). 예를 들어 도 17에 도시된 분석에서 상기 집단들을 하기와 같이 계산하였다:
Q6* = Q6/ (Q6+Q7) = 23.9% 및 Q7* = Q7/ (Q6+Q7) = 76.1%.
상기 분석을 모두 15개의 생성 안정성 풀에 대해 수행하였으며 도 20에 도시된 상관성에 사용하였다.
BEAT, Fab-DIM 및 scFv-Fc-DIM 생산자의 분율을 선택적 스플라이스에 의한 세포막상의 종 디스플레이에 따른 표면 염색에 의해 식별할 수 있었다. 이어서 상기 결과를 상기 분석된 풀의 실제 분비 프로파일과 대조하였다. 이를 위해서, 상기 15개 생성 안정성 풀의 상등액을 단백질 A에 의해 14일째에 정제하고 각각의 분비된 분자를 분자량에 따라 확인하고 캘리퍼 랩칩 GXII 단백질 분석에 의해 정량분석하였다. 이러한 정제 조건하에서 오직 단백질 A 결합 종, 즉 BEAT 및 scFv-Fc-DIM 분자만이, Fab-DIM 분자는 상기 단백질 A 결합 부위가 없으므로, Fab-DIM 분자로서 상기 상등액으로부터 정제되었음에 유의해야 한다. 도 20은 분비된 분자의 백분율과 표면 염색에 의해 확인된 상응하는 세포 분율간의 관계를 나타낸다.
상기 데이터는 표면 디스플레이 및 분비 프로파일이 BEAT 및 scFv-Fc-DIM 분비에 대해 고도로 상관됨(R2=0.9)을 암시한다. 그러나 상기 관계의 성질은 선형이 아니다. 선형 회귀의 결여는, 상기 실험에서 수행된 표면 염색이 BEAT와 Fab-DIM 사이를 구분하지 않는 반면 상기 정제된 분비된 생성물은 Fab-DIM 분획을 제외한다는 사실에 의해 설명될 수 있다. 상기 상등액 중의 분비된 BEAT 및 scFv-Fc-DIM의 백분율은 약간 과대평가될 수도 있다. 그럼에도 불구하고, 상기 실험은 특정 분자의 표면 디스플레이에 대한 양성 세포의 분율이 클수록, 상기 상등액 중의 상기 분자의 분율이 큼을 입증하였다. 본 실시예에서, 분비된 BEAT 분자의 분율은 상기 시험된 안정한 풀이 20%를 초과하는 양성 세포의 백분율을 갖는 경우 선형으로 증가하였다. 75% 초과의 이중 양성 세포(Q6)를 갖는 안정한 풀의 선택은 90%를 초과하는 목적하는 BEAT 분자를 제공하는 분비 세포 집단의 선택을 허용한다. 이중 양성 표현형을 갖는 클론 집단, 예를 들어 세포 집단의 100%가 LC 및 Fc 표면 염색 모두에 대해 양성인 경우, 대략 100%에 접근하는, BEAT 분비의 훨씬 더 높은 분률이 예상됨은 타당하다.
상기 방법의 감도를 증가시키고 표면 디스플레이와 분비 패턴간의 선형 관계를 입증하기 위해서, 검출 시약으로서 가용성 표적을 수반하는 상이한 검출 방법을 적용하였다. 이런 식으로 3개의 가능한 생성물은 모두 그들의 결합 패턴에 의해 명료하게 확인된다. 도 21은 세포 분류 전 측정된 풀의 표면 프로파일의 일례를 제공한다. 점 도표는 표적1에 대한 결합제의 세포 표면 밀도(y-축) 대 표적2에 대한 결합제의 세포 표면 밀도(x-축)를 나타낸다. 사분면은 음으로 및 양으로 염색된 세포간의 임의의 한계를 고정시킨다. Q1은 표적1 결합에 양성지만 표적2 결합에는 음성이고, 따라서 세포막상에 Fab-DIM을 나타내는 세포에 상응하는 세포의 분율이다. Q2에서 이중 양성 세포는 세포막상의 표적1 및 2에 대한 두 결합제 모두를 나타내는 세포이며 따라서 상기 막상에서 BEAT를 디스플레이하는 세포에 상응한다. Q3은 오직 표적2 결합제만을 디스플레이하며 따라서 scFv-Fc-DIM에 상응하는 세포이다. 사분면 Q4는 세포막상에서 단백질을 발현하지 않는 세포의 분율, 예를 들어 비-생산자의 부분 모집단을 나타낸다. 이들 세포가 항체의 분비에 기여하지 않았으므로, 이들을 상기 분석으로부터 제외시켰다.
pHC-B7, pScFv-Fc-B7 및 pLC 구조물로 형질감염 후에 유식 세포측정 세포 분류에 의해 생성된 모든 생성 클론(28)을 상기 접근법을 사용하여 분석하였다. 앞서 개시한 바와 같이, BEAT, Fab-DIM 및 scFv-Fc-DIM 생산자의 분획들은 선택적 스플라이스에 의한 세포막 상의 종 디스플레이에 따른 표면 염색에 의해 확인될 수 있었다. 각 클론의 실제 분비 프로파일을 캘리퍼 랩칩 GXII 단백질 분석에 의해 상등액 중에서 직접 유가배양 14일째에 측정하였다.
도 22는 상기 상등액에서 검출된 BEAT 분자의 분율과 세포 표면상에 BEAT 표현형을 디스플레이하는 세포의 분율(Q2의 %)간의 상관성을 도시한다. 상기 특정한 염색을 사용하여 양호한 선형 상관성(R2=0.8)이 획득되었다. 상기 데이터는 상기 BEAT 분자를 분비하는 클론의 습성이 상기 세포막상에서 검출된 생성물 패턴에 의해 예견될 수 있음을 분명히 가리켰다.
결론
본 실시예에서 세포막 디스플레이와 병행된 선택적 스플라이스 기술은 단세포의 분비 프로파일의 정성적인 예견에 유효한 리포터 시스템임을 입증하였다. LC 및 Fc 표면 검출에 기반한 일반적인 검출 방법을 사용하거나 또는 상기 분자의 가용성 분자를 수반하는 생성물 특이성 염색 방법을 사용하여 상기 세포막 디스플레이 패턴과 형질감염된 세포의 분비 프로파일간에 명백한 상관성을 발견하였다. 상기 접근법은 배치 또는 유가 배양에서 세포 성능의 시간 소모적인 선별을 요구하지도 않고, 분비된 생성물의 정제 및 광범위한 특성화를 수확하지도 않는다.
결론적으로, 본 명세서에 개시된 리포터 시스템은 이종삼량체성 분자에 대해 특정한 분비 프로파일을 갖는 세포 클론에 대한 신뢰할만한, 대량처리 선별 도구를 제공한다.
분비 프로파일의 정성적인 예견 외에, 특정 세포 클론의 분비 수준의 정량적인 예견은 세포주 개발 목적에 매우 중요하다. 하기의 실시예에서 선택적 스플라이스 접근법을 사용하는 막 결합된, 표면 디스플레이된 생성물의 수준이 클론의 분비 수준과 상관있는지의 여부를 조사하였다.
실시예 6: 표면 디스플레이에 대한 선택적 스플라이스를 사용하는 분비 수준의 정량적인 예견
도입
세포주 개발 공정의 큰 도전은 고성능 클론, 예를 들어 양질 재조합 단백질의 높은 분비율에 대한 시간 유효한 방식의 선택이다. 선택적 스플라이스를 통한 발현된 단백질 분획의 세포막상의 디스플레이는 클론의 실제 정성적인 분비 프로파일을 암시함이 앞서 입증되었다. 본 실시예에서 세포막 디스플레이의 수준이 클론의 분비 수준과 정량적으로 상관이 있으며 상기 표면 디스플레이의 강도를 기준으로 고생산성 세포가 선택될 수 있음을 입증할 것이다.
물질 및 방법
안정한 세포주 개발
안정한 형질감염된 CHO 세포를 각각 항생제 퓨로마이신 및 제네티신에 대한 내성을 제공하는 단백질의 발현을 위한 2개의 특허 벡터와 함께 벡터 pGLEX41_HC-I4-M1M2-M1M2-M1M2(서열번호 36) 및 pGLEX41_LC(서열번호 294)의 동시-형질감염에 의해 생성시켰다.
현탁액 CHO-S 세포를 50 ㎖ 생물반응기 포맷 중의 폴리에틸렌이민(JetPEI®, 폴리플러스-형질감염, 프랑스 일키르히 소재)을 사용하여 선형화된 벡터로 형질감염시켰다. 이를 위해서 지수 증식 세포를 5 ㎖의 OptiMEM 배지(#31985-047, 인비트로젠) 중에 2 E6 세포/㎖의 밀도로 시딩하였다. JetPEI®:DNA 복합체를 상기 세포에 3(㎍/㎍)의 중량 대 중량비로 가하였다. 2.5 ㎍/㎖의 최종 DNA 농도를 상기 세포에 가하였다. 상기 세포를 진탕(200 rpm) 하에 37 ℃에서 JetPEI®:DNA 복합체와 5시간 인큐베이션 후에, 5 ㎖의 배양 배지 PowerCHO2(#BE12-771Q, 론자)를 상기 세포 현탁액에 가하였다. 이어서 상기 세포를 37 ℃, 5% CO2 및 80% 습도에서 진탕 플랫폼상에서 인큐베이션하였다. 형질감염 후 1일에 상기 세포를 96웰 플레이트에 4 ㎍/㎖의 퓨로마이신(#P8833-25 ㎎, 시그마) 및 400 ㎍/㎖의 제네티신(#11811-098, 깁코)을 함유하는 선택 배지 중의 상이한 농도(0.7, 0.5 및 0.4 E5 세포/㎖)로 시딩하였다. 발현 수준의 평가를 위해서 정적 조건하에서 14일의 선택 후에 15개의 생성 안정성 풀을 상기 웰로부터 골라내고 튜브스핀 생물반응기로 확대시켰다.
발현 수준의 평가
보충된 배치를 2 mM L-글루타민, 8 mM 글루타맥스, 15% 이피션트 피드 A(#A1023401, 인비트로젠) 및 15% 이피션트 피드 B(#A1024001, 인비트로젠)가 보충된 PowerCHO2(#BE12-771Q, 론자)에서 0.5 E6 세포/㎖의 세포 밀도로 시딩하였다. 생육성 세포수(VCC) 및 생육력을 구아바 유식 세포계의 비아카운트(ViaCount) 분석을 사용하여 1, 3 및 7일째에 측정하였다. IgG 역가를 옥텟 QK 장비를 사용하여 1, 3 및 7일째에 측정하였다. 안정한 풀의 비생산성 qP를 하기식에 따라 제1일 및 제3일 사이에서 측정하였다:
qP = (ΔIgGd3 -d1/Δtd3 -d1) x (1/VCC평균d1 -d3)
상기 식에서,
qP = 비분비율 또는 생산성[pg/세포/일]
IgG = 제3일 및 제1일에 IgG 역가[pg/㎖]
t = 배양 시간[일]
VCC평균d1 -d3 = 제1일 및 제3일 사이의 평균 생육성 세포수[세포/㎖]
상기 세포막상의 디스플레이된 IgG의 정량분석을 하기에 개시하는 바와 같이 지수증식기 동안 제1일에 수행하였다.
세포의 염색
상기 안정한 풀상의 Fc 단편의 염색을 배치 시딩 후 1일째에 수행하였다. 간단히, 총 1 E5 세포를 수확하고 96 웰 플레이트의 환저 웰로 옮겼다. 상기 세포를 세척 완충제(2% FBS를 함유하는 PBS)로 2회 세척하고 100 ㎕의 검출 항체에 재현탁하였다. 상기 Fc 단편의 특이적 검출을 PE 접합된 염소 항-인간 Fc 감마 특이성 항체(#12-4998-82, 이바이오사이언스)를 사용하여 수행하였다. 실온 암실에서 20분 인큐베이션 후에, 세포를 세척 완충제로 1회 세척하고 유식 세포측정 분석을 위해 200 ㎕에 재현탁시켰다. 상기 세포를 구아바 유식 세포계로 분석하였다.
유식 세포측정 세포 분류
클론을 앞서 개시된 바와 같이("안정한 세포주 개발" 섹션을 참조하시오) 확립된 안정한 형질감염체의 이종 풀로부터 유식 세포측정 세포 분류에 의해 생성시켰다. 이를 위해서 상기 Fc 단편의 표면 염색을 초기에 개시된 프로토콜에 따라 수행하였다. 상기 분류를 펄스 처리에 의해 세포 이중체를 제외하고 살아있는 세포상에서 게이팅에 의해 FACSAria II를 사용하여 수행하였다. 3개의 게이트를 표면 형광 강도("저", "중간" 및 "고")에 따라 한정하고 단세포를 200 ㎕의 클로닝 배지를 함유하는 96웰 플레이트에 분배하였다. 정적 조건하에서 2주의 생육 후에 세포를 동적 조건하에서 확대시키고 선택된 클론의 성능을 앞서 개시된 바와 같이 평가하였다.
결과
안정한 풀의 표면 염색 프로파일에 대한 분석을 도 23에 예시한다. 영역 g1에서 게이팅된 살아있는 세포의 표면 형광을 막대그래프로 나타내고(도 23, 플롯 B) 상기 분포의 평균 형광(평균[RFU])을 산정하였다. 평균 형광을 세포막상에서 발현된 IgG 수준의 크기로서 사용하였다. 상기 분석을 생성된 모든 안정한 풀에 대해 수행하고 표면 IgG의 수준을 상등액 중에서 측정된 분비된 IgG의 실제 수준과 비교하였다.
도 24는 보충된 배치의 1일째에 측정된 모든 안정한 풀의 표면 형광 강도와 분비 수준간의 상관성을 나타낸다. 양호한 상관성(R2>0.8)이 표면 IgG 발현과 역가사이(도 24, 플롯 A)뿐만 아니라 표면 IgG 발현과 비생산성(도 24, 플롯 B) 사이에서 관찰되었다. 상기 데이터는 선택적으로 스플라이싱된 막관통 IgG의 표면 발현이 안정한 형질감염된 세포의 실제 분비 수준을 보고하였음을 입증한다. 유사하게 양호한 상관성(R2>0.8)이 제1일의 풀의 표면 형광과 7일 배치 과정의 용량 생산성 사이에서 관찰되었다(도 25 참조; 상기 배치에서 7일은 정지상의 끝에 상응한다). 상기 데이터는 배치 과정의 끝에서 상기 풀들의 성능을 검출된 표면 IgG 발현에 따라 초기에 예견할 수 있음을 암시힌다. 배치 과정에서, 상기 세포의 생리학적 상태는 변화하는 배지 환경에 따라 계속해서 변한다. 따라서 배치 과정에서 선택적 스플라이스를 통한 리포터 IgG의 표면 디스플레이와 실제 분비 수준간의 상관성은 상기 세포의 물리적 상태(지수 증식 또는 정지) 및 배치 과정 단계(증식 또는 생산)에 독립적이다.
상기 가정을 확인하기 위해서, 클론을 세포 표면상에 디스플레이된 항체의 밀도에 따라 유식 세포측정 세포 분류에 의해 생성시켰다. 이를 위해서 안정한 풀을 항-인간 Fc PE 표지된 항체를 사용하여 표면 IgG에 대해 염색하였다. 3개의 영역을 세포의 표면 형광성("저", "중간" 및 "고")에 따라 한정하고 단세포를 96웰 플레이트에 상응하게 클로닝하였다. 게이팅 전략을 도 26A에서 알 수 있다. 대략 2주 후에 클론을 확대시키고 상기 세포의 표면 강도를 다시 측정하여 분류된 표현형이 실제로 클로닝 후에 획득되었음을 확인하였다. 모든 클론의 표면 강도의 분포를 도 26B에서 볼 수 있다. 종합적으로 상기 분류는 예상된 표현형 "저", "중간" 및 "고"에 상응하는 3개의 상이한 분류된 그룹의 표면 IgG의 분포로서 성공적이었다.
일부 이상치가 예를 들어 높은 표면 형광을 나타내는 "저" 그룹에서 검출되었는데, 이는 추정상 분류전 염색의 인위적인 결과에 기인한다. 상기 생성된 클론의 성능을 후속적으로 보충된 배치에서 평가하였다. 도 26C는 각 그룹에 대한 비생산성 qP의 분포를 도시한다. 원래 풀의 qP를 또한 4회 중복하여 평가하였으며 대조용으로서 상기 도표에 제공한다. 최선의 수행자는 대략 10 pg/세포/일의 중간 qP를 갖는 "고" 표면 형광 그룹내에서 명백히 확인되었다. 원래 풀(대략 5 pg/세포/일)에 비해 상기 생산성은 2 내지 6배 인자까지 현저하게 개선되었으며, 최선의 클론은 30 pg/세포/일을 초과하여 도달하였다. 대조적으로 "저" 및 "중간" 범주의 클론은 종합적으로 0 pg/세포/일에 가까운 중간 qP를 갖는 낮은 수행자였다. 일부 이상치는 >20 pg/세포/일에 도달하였으나 이들 표현형도 또한 유식 세포측정에 의해 검출된 IgG의 높은 표면 밀도를 나타내었다.
결론
본 실시예에서 세포막상의 선택적 스플라이스를 통해 발현된 IgG의 수준은 재조합 세포의 실제 분비 수준을 보고함이 입증되었다. 생성물의 특이적 검출 후의 세포막 형광은 상등액 중의 축적된 IgG 농도 및 형질감염된 안정한 세포의 qP와 상관있다. 또한 상기 상관성은 배치 생성 과정의 단계와 무관하게 타당함이 입증되었다. 합해보면, 이들 데이터는 재조합 세포의 정량적인 분비 수준을 본 명세서에 개시된 선택적 스플라이스 표면 디스플레이 리포터 시스템에 의해 예견할 수 있음을 암시하였다. 이는 유식 세포측정 세포 분류를 사용하여 세포 표면상에 디스플레이된 IgG의 밀도에 따라 클론을 선택함으로써 확인되었다. 실제로, 상기 접근법을 사용하여 고 생산자를 선택할 수 있었으며 산업적으로 적합한 비생산성을 나타내는 클론들을 시간 효율적인 방식으로 생성시킬 수 있었다.
SEQUENCE LISTING <110> Glenmark Pharmaceuticals S.A. <120> Expression constructs and methods for selecting host cells expressing polypeptides <130> IPA161310-CH <150> EP 14157324.6 <151> 2014-02-28 <160> 347 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr269 <400> 1 caggggggcg gagcctatgg 20 <210> 2 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr497 <400> 2 gcccccctcc cgcgaggaga tgaccaagaa ccaggtgtcc ctg 43 <210> 3 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr498 <400> 3 tttctagatt catcacttgc cgggggacag gctc 34 <210> 4 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr501 <400> 4 tataaagctt ccaccatgga gagccctgcc c 31 <210> 5 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr502 <400> 5 tatatctaga ttcatcagca ctcgccccgg ttg 33 <210> 6 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1437 <400> 6 ccaaatcgat ttatcagcac tcgccccggt tgaag 35 <210> 7 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1500 <400> 7 ccgggatcga tttatcagtg atggtgatgg tgatg 35 <210> 8 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1502 <400> 8 ggccgatcga tttatcactt gccaggagac ag 32 <210> 9 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1516 <400> 9 gatgaaagct tggtaggtga tcctcctg 28 <210> 10 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1517 <400> 10 atgtattcga atatctccac cggttgcagc tctgagccag ggaggaggga ag 52 <210> 11 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1518 <400> 11 taagctagcc caccatggag agccctgc 28 <210> 12 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1519 <400> 12 gaggctcttc tgcgtgtagt ggttgtgcaa ggcctcgtgc atcacgctg 49 <210> 13 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1520 <400> 13 ctaccaagct ttcatcattt acccggagac agggagaggc tcttctgcgt g 51 <210> 14 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1521 <400> 14 gggagctgga cgggctgtgg acgaccatca ccatcttcat cacactcttc ctgttaagcg 60 tgtgctacag tgccaccgtc accttcttca ag 92 <210> 15 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1522 <400> 15 gtagtcgggg atgatggtct gcttcaggtc caccaccgag gagaagatcc acttcacctt 60 gaagaaggtg acggtggcac tgtagcacac gc 92 <210> 16 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1523 <400> 16 atataccggt ggagagctgt gcggaggcgc aggacgggga gctggacggg ctgtg 55 <210> 17 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1524 <400> 17 atatttcgaa tcactaggcc ccctgtccga tcatgttcct gtagtcgggg atgatggtc 59 <210> 18 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1649 <400> 18 tctccaccgg ttgcagctct gttccctcct ccctcggtta g 41 <210> 19 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1650 <400> 19 gcgccatcga tacagacatg ataagataca ttg 33 <210> 20 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1651 <400> 20 gcgcgatcga tacttgttta ttgcagctta taatgg 36 <210> 21 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1689 <400> 21 atatgctagc ccaccatgcg gagccctgcc cagctgctgt tcctgctgct gctg 54 <210> 22 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1690 <400> 22 tgctgttcct gctgctgctg tggatccctg gcaccaacgc cgaggtgcag ctggtcgagt 60 c 61 <210> 23 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1725 <400> 23 atatactagt ccaccatgcg gagccctgcc cagctgctgt tcctgctgct gctg 54 <210> 24 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1726 <400> 24 ctgttcctgc tgctgctgtg gatccctggc accaacgccc aggtgcagct gcagcagtc 59 <210> 25 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1727 <400> 25 ctgttcctgc tgctgctgtg gatccctggc accaacgcca tggagacaga cacactcc 58 <210> 26 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1735 <400> 26 gacttcgaat catcaatgat ggtggtggtg atgggcgctg gcgaggagca ggtcgaacag 60 gagcagcttg 70 <210> 27 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1760 <400> 27 ccgcatcgat ttatcattta cccgggctca ggctcag 37 <210> 28 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1799 <400> 28 atataccggt ggaggccctg tggctgggcg tgctgagact gctgctgttc aagctgctcc 60 tgttcgacct g 71 <210> 29 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1800 <400> 29 gtaagctttc atcatttacc cggagacagg gagaggctct tctgcgtgaa tcggttgtgc 60 <210> 30 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1801 <400> 30 gcgcgaagct ttcatcattt acccggagac agggagaggc tcttctgcgt ataatgattg 60 <210> 31 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1840 <400> 31 atataccggt ggaggccctg tggctgggcg tgctg 35 <210> 32 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2099 <400> 32 tcctcggggg gagatccacc accacctgag ccagggagga gggaag 46 <210> 33 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2100 <400> 33 gcgcttcgaa tcatcacaga aacacggtct g 31 <210> 34 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2101 <400> 34 tggtggtgga tctccccccg aggacccccc tgactccaag 40 <210> 35 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2102 <400> 35 tcctcggggg gagatccacc accacctgtt ccctcctccc tcggttag 48 <210> 36 <211> 1082 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC3899 <400> 36 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600 aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660 tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tggatcttct 720 cctcggtggt ggacctgaag cagaccatca tccccgacta caggaacatg atcggacagg 780 gggcctagtg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840 attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900 ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960 ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020 ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080 gt 1082 <210> 37 <211> 1064 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC4398 <400> 37 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540 gggaggaggg aacagagctg caaccggtgg agagctgtgc ggaggcgcag gacggggagc 600 tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta agcgtgtgct 660 acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg gtggacctga 720 agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag tgattcgaaa 780 tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 840 atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 900 gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 960 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 1020 gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1064 <210> 38 <211> 1219 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC4401 <400> 38 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720 ggtggagagc tgtgcggagg cgcaggacgg ggagctggac gggctgtgga cgaccatcac 780 catcttcatc acactcttcc tgttaagcgt gtgctacagt gccaccgtca ccttcttcaa 840 ggtgaagtgg atcttctcct cggtggtgga cctgaagcag accatcatcc ccgactacag 900 gaacatgatc ggacaggggg cctagtgatt cgaaatgacc gaccaagcga cgcccaacct 960 gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 1020 tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc 1080 ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 1140 tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 1200 tgtatcttat catgtctgt 1219 <210> 39 <211> 1263 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC4402 <400> 39 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600 aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660 tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tggatcttct 720 cctcggtggt ggacctgaag cagaccatca tccccgacta caggaacatg atcggacagg 780 gggcctagtg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840 attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900 ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960 ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020 ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080 gtataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 1140 gaaattgtta tccgctcaca attccacaca acatacgagc cggggcagga taatatatgg 1200 tagggttcat agccagagta accttttttt ttaattttta ttttatttta tttttgagat 1260 cag 1263 <210> 40 <211> 977 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5854 <400> 40 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag gccctgtggc 600 tgggcgtgct gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcgccagcg 660 cccatcacca ccaccatcat tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 720 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 780 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 840 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 900 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 960 tatcttatca tgtctgt 977 <210> 41 <211> 959 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5855 <400> 41 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540 gggaggaggg aacagagctg caaccggtgg aggccctgtg gctgggcgtg ctgagactgc 600 tgctgttcaa gctgctcctg ttcgacctgc tcctcgccag cgcccatcac caccaccatc 660 attgatgatt cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt 720 ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 780 tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 840 cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 900 tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 959 <210> 42 <211> 1114 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5857 <400> 42 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720 ggtggaggcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc tcctgttcga 780 cctgctcctc gccagcgccc atcaccacca ccatcattga tgattcgaaa tgaccgacca 840 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 900 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 960 gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 1020 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 1080 gtccaaactc atcaatgtat cttatcatgt ctgt 1114 <210> 43 <211> 1158 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5856 <400> 43 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag gccctgtggc 600 tgggcgtgct gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcgccagcg 660 cccatcacca ccaccatcat tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 720 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 780 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 840 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 900 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 960 tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 1020 agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccgggg 1080 caggataata tatggtaggg ttcatagcca gagtaacctt tttttttaat ttttatttta 1140 ttttattttt gagatcag 1158 <210> 44 <211> 1076 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC6030 <400> 44 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600 aggcgcagga cggggagctg gacgccctgt ggctgggcgt gctgagactg ctgctgttca 660 agctgctcct gttcgacctg ctcctcacct tcttcaaggt gaagtggatc ttctcctcgg 720 tggtggacct gaagcagacc atcatccccg actacaggaa catgatcgga cagggggcct 780 agtgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076 <210> 45 <211> 1058 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC6048 <400> 45 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540 gggaggaggg aacagagctg caaccggtgg agagctgtgc ggaggcgcag gacggggagc 600 tggacgccct gtggctgggc gtgctgagac tgctgctgtt caagctgctc ctgttcgacc 660 tgctcctcac cttcttcaag gtgaagtgga tcttctcctc ggtggtggac ctgaagcaga 720 ccatcatccc cgactacagg aacatgatcg gacagggggc ctagtgattc gaaatgaccg 780 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 840 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 900 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 960 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1020 gtttgtccaa actcatcaat gtatcttatc atgtctgt 1058 <210> 46 <211> 1213 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC6047 <400> 46 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720 ggtggagagc tgtgcggagg cgcaggacgg ggagctggac gccctgtggc tgggcgtgct 780 gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcaccttct tcaaggtgaa 840 gtggatcttc tcctcggtgg tggacctgaa gcagaccatc atccccgact acaggaacat 900 gatcggacag ggggcctagt gattcgaaat gaccgaccaa gcgacgccca acctgccatc 960 acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 1020 ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 1080 caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 1140 aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 1200 ttatcatgtc tgt 1213 <210> 47 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC6046 <400> 47 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600 aggcgcagga cggggagctg gacgccctgt ggctgggcgt gctgagactg ctgctgttca 660 agctgctcct gttcgacctg ctcctcacct tcttcaaggt gaagtggatc ttctcctcgg 720 tggtggacct gaagcagacc atcatccccg actacaggaa catgatcgga cagggggcct 780 agtgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgtatac 1080 cgtcgacctc tagctagagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 1140 gttatccgct cacaattcca cacaacatac gagccggggc aggataatat atggtagggt 1200 tcatagccag agtaaccttt ttttttaatt tttattttat tttatttttg agatcag 1257 <210> 48 <211> 1738 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC314 <400> 48 atggagagcc ctgcccagct gctgttcctg ctgctgctgt ggctgcctga cacccaggcc 60 gaggtgcagc tggtcgagtc tggcggcgga ctggtgcagc ctggcggctc cctgcggctg 120 tcctgcgccg cctccggctt caacatcaag gacacctaca tccactgggt gcggcaggcc 180 cctggcaagg gcctggagtg ggtggcccgg atctacccta ccaacggcta caccagatac 240 gccgactccg tgaagggccg gttcaccatc tccgccgaca cctccaagaa caccgcctac 300 ctgcagatga actccctgcg ggccgaggac accgccgtgt actactgctc cagatgggga 360 ggagatggct tctacgccat ggactactgg ggccagggca ccctggtgac cgtgtcctcc 420 gcctccacca agggccccag cgtgttcccc ctggccccca gcagcaagtc taccagcggc 480 ggcacagcag ccctgggatg cctggtgaag gactacttcc ccgagcccgt gaccgtgagc 540 tggaacagcg gagccctgac ctccggcgtg cacaccttcc ccgccgtgct gcagagcagc 600 ggcctgtaca gcctgagcag cgtggtgacc gtgcccagca gcagcctggg cacccagacc 660 tacatctgca acgtgaacca caagcccagc aacaccaagg tggacaagaa ggtggagccc 720 aagagctgcg acaagaccca cacctgccct ccctgtcctg ctcctgagct gctcggcgga 780 ccctccgtgt tcctgttccc ccccaagccc aaggacaccc tgatgatcag caggaccccc 840 gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc cagaggtgaa gttcaactgg 900 tacgtggacg gcgtggaggt gcacaacgcc aagaccaagc ccagagagga acagtacaac 960 agcacctaca gggtggtgtc cgtgctgacc gtgctgcacc aggactggct gaacggcaaa 1020 gagtacaagt gcaaggtctc caacaaggcc ctgccagccc ccatcgagaa aaccatcagc 1080 aaggccaagg gccagccacg ggagccccag gtgtacaccc tgcccccctc ccgcgaggag 1140 atgaccaaga accaggtgtc cctgacatgt ctggtgaaag gcttctaccc cagcgacatc 1200 gccgtggagt gggagagcaa cggccagccc gagaacaact acaagaccac ccccccagtg 1260 ctggacagcg acggcagctt cttcctgtac agcaagctga ccgtggacaa gagcaggtgg 1320 cagcagggca acgtgttcag ctgcagcgtg atgcacgagg ccctgcacaa ccactacacc 1380 cagaagagcc tgagcctgtc ccccggcaag tgatgaatct agaggtaccc ccggggggcc 1440 cctcgagttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 1500 caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 1560 gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 1620 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 1680 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgt 1738 <210> 49 <211> 1410 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5644 <400> 49 atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60 caggtgcagc tgcagcagtc tggcgccgaa ctggccagac caggcgccag cgtgaagatg 120 agctgcaagg ccagcggcta caccttcacc cggtacacca tgcactgggt gaaacagcgg 180 cctggacagg gcctggaatg gatcggctac atcaacccca gccggggcta caccaactac 240 aaccagaagt tcaaggacaa ggccaccctg accaccgaca agagcagcag caccgcctac 300 atgcagctga gcagcctgac cagcgaggac agcgccgtgt actactgcgc ccggtactac 360 gacgaccact actgcctgga ctactggggc cagggcacca ccctgaccgt gagcagcgcg 420 tcgaccaagg gccccagcgt gttcccgcta gcccccagca gcaagagcac cagcggcggc 480 acagccgccc tgggctgcct ggtgaaggac tacttccccg agcccgttac cgtgtcctgg 540 aactctggag ccctgacctc cggcgtgcac accttccccg ccgtgctcca gagcagcggc 600 ctgtacagcc tgagcagcgt ggtgacagtg cccagcagca gcctgggaac ccagacctac 660 atctgcaacg tgaaccacaa gcccagcaac accaaggtgg acaagaaggt ggagcccaag 720 agctgcgaca aaactcacac ctgcccaccc tgccctgccc ctgagctgct gggcggaccc 780 tccgtgttcc tgttcccccc caagcccaag gacaccctga tgatcagccg gacccccgag 840 gtgacctgcg tggtggtgga cgtgagccac gaggaccctg aggtgaagtt caattggtac 900 gtggacggcg tggaggtgca caacgccaag accaagcccc gggaggaaca gtacaacagc 960 acctaccggg tggtgtccgt gctgaccgtg ctgcaccagg actggctgaa cggcaaggaa 1020 tacaagtgca aggtctccaa caaggccctg cctgccccca tcgaaaagac catcagcaag 1080 gccaagggcc agccgcgcga accgcaggtg tacaccctgc cccccagccg ggaagagatg 1140 accaagaacc aggtgaaact ggtgtgcctg gtgacaggct tctaccccag cgatatcgcc 1200 gtggaatggg agagcagcgg ccagcctgag aacaactact acaccacccc ccccatgctg 1260 gacagcgacg gcagcttcag cctggtgtcc tggctgaacg tggacaagag ccggtggcag 1320 cagggcaaca tcttcagctg cagcgtgatg cacgaggccc tgcacaaccg gttcacccag 1380 aagtccctga gcctgagccc gggtaaatga 1410 <210> 50 <211> 1074 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5537 <400> 50 gggtaaatga tgaaagcttg gtaggtgatc ctcctgctgc tttggttcag ggttttgctt 60 gagggggggg ggtggtgatt tccttgccat gggcagactg agcagaaaag gccattggga 120 ccatgttctg aatgcctcca cctcaaccac cggccggtag gaccaaagcc accccgtgtt 180 ttctcaggat ctcttttccc agggagatcc ctcggcccaa agagggagat ggcaatgctg 240 gatgtgtgca caataattca acaggcattg gaacttcagc atcgatgctg aatgcaatta 300 acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 360 cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 420 ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 480 ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 540 ttcccttccc tcctccctgg ctcagagctg caaccggtgg agagctgtgc ggaggcgcag 600 gacggggagc tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta 660 agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg 720 gtggacctga agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag 780 tgattcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc 840 gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 900 ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 960 tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1020 ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1074 <210> 51 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5608 <400> 51 atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60 gaggtgcagc tggtcgagtc tggcggcgga ctggtgcagc ctggcggctc cctgcggctg 120 tcctgcgccg cctccggctt caacatcaag gacacctaca tccactgggt gcggcaggcc 180 cctggcaagg gcctggagtg ggtggcccgg atctacccta ccaacggcta caccagatac 240 gccgactccg tgaagggccg gttcaccatc tccgccgaca cctccaagaa caccgcctac 300 ctgcagatga actccctgcg ggccgaggac accgccgtgt actactgctc cagatgggga 360 ggagatggct tctacgccat ggactactgg ggccagggca ccctggtgac cgtgtcctcc 420 ggtggcggtg gcagcggcgg tggtggttcc ggaggcggcg gttctgacat ccagatgacc 480 cagtccccct ccagcctgtc tgcctccgtg ggcgaccggg tgaccatcac ctgccgggcc 540 tcccaggacg tgaacaccgc cgtggcctgg tatcagcaga agcctggcaa ggcccctaag 600 ctgctgatct actccgcctc cttcctgtac tccggcgtgc cttcccggtt ctccggctcc 660 cggtccggca ccgacttcac cctgaccatc tcctccctgc agcctgagga cttcgccacc 720 tactactgcc agcagcacta caccacccct cctaccttcg gccagggcac caaggtggag 780 atcaagaggg gaggaggagg taccgacaaa actcacacat gcccaccgtg cccagcacct 840 gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 900 atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 960 gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 1020 gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 1080 tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 1140 gagaaaacca tctccaaagc caaaggacag cccagggaac ctgaggtggc cacattccca 1200 cctagccggg acgagctgac aaaaaatcag gtcaccctcg tctgtctcgt gaccggcttt 1260 tacccttccg acattgccgt ggaatgggaa tccaatgggc agcccgagaa caattacaag 1320 acagaccccc ccctgctgga atccgatggc agcttcgccc tgagcagccg gctgcgggtg 1380 gacaagtcca gatggcagca ggggaatgtc ttttcctgct ccgtcatgca tgaagccctc 1440 cacaatcatt atacacagaa aagcctgagc ctgtctcctg gcaagtga 1488 <210> 52 <211> 1074 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC5538 <400> 52 gggtaaatga tgaaagcttg gtaggtgatc ctcctgctgc tttggttcag ggttttgctt 60 gagggggggg ggtggtgatt tccttgccat gggcagactg agcagaaaag gccattggga 120 ccatgttctg aatgcctcca cctcaaccac cggccggtag gaccaaagcc accccgtgtt 180 ttctcaggat ctcttttccc agggagatcc ctcggcccaa agagggagat ggcaatgctg 240 gatgtgtgca caataattca acaggcattg gaacttcagc atcgatgctg aatgcaatta 300 acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 360 cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 420 ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 480 ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 540 ttcccttccc tcctccctgg ctcagagctg caaccggtgg agagctgtgc ggaggcgcag 600 gacggggagc tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta 660 agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg 720 gtggacctga agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag 780 tgattcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc 840 gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 900 ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 960 tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1020 ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1074 <210> 53 <211> 1076 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC7057 <400> 53 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540 gggaggaggg aacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600 ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660 ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720 caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780 gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076 <210> 54 <211> 1231 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC7058 <400> 54 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720 atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780 cggcgccgtg attaccgtgg tcgtgatcgt cgtgattatc aagtgcttct gcaagcaccg 840 gtcctgcttc cggcggaacg aggcctccag agagacaaac aactccctga ccttcggccc 900 cgaggaagcc ctggctgagc agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc 960 gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 1020 cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 1080 ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa 1140 tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 1200 caaactcatc aatgtatctt atcatgtctg t 1231 <210> 55 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC7056 <400> 55 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 56 <211> 1275 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC7059 <400> 56 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 1140 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggggcag 1200 gataatatat ggtagggttc atagccagag taaccttttt ttttaatttt tattttattt 1260 tatttttgag atcag 1275 <210> 57 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC9765 <400> 57 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 58 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC9764 <400> 58 ctgtctcccg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 59 <211> 1076 <212> DNA <213> Artificial Sequence <220> <223> GSC9949 <400> 59 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccgt 540 ctccttctgg gacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600 ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660 ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720 caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780 gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076 <210> 60 <211> 1076 <212> DNA <213> Artificial Sequence <220> <223> GSC9768 <400> 60 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct 540 gggaggattg cacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600 ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660 ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720 caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780 gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076 <210> 61 <211> 1076 <212> DNA <213> Artificial Sequence <220> <223> GSC9763 <400> 61 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct 540 gtccttattg cacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600 ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660 ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720 caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780 gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076 <210> 62 <211> 1076 <212> DNA <213> Artificial Sequence <220> <223> GSC9770 <400> 62 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540 gacctgaggg gacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600 ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660 ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720 caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780 gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076 <210> 63 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC9950 <400> 63 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctg ctacctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 64 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq32 <400> 64 accggtggag agctgtgcgg aggcgcagga cggggagctg gacgccctgt ggctgggcgt 60 gctgagactg ctgctgttca agctgctcct gttcgacctg ctcctcacct tcttcaaggt 120 gaagtggatc ttctcctcgg tggtggacct gaagcagacc atcatccccg actacaggaa 180 catgatcgga cagggggcct agtgattcga a 211 <210> 65 <211> 2009 <212> DNA <213> Homo sapiens <400> 65 agctttctgg ggcaggccag gcctgacctt ggctttgggg cagggagggg gctaaggtga 60 ggcaggtggc gccagcaggt gcacacccaa tgcccatgag cccagacact ggacgctgaa 120 cctcgcggac agttaagaac ccaggggcct ctgcgcctgg gcccagctct gtcccacacc 180 gcggtcacat ggcaccacct ctcttgcagc ctccaccaag ggcccatcgg tcttccccct 240 ggcaccctcc tccaagagca cctctggggg cacagcggcc ctgggctgcc tggtcaagga 300 ctacttcccc gaaccggtga cggtgtcgtg gaactcaggc gccctgacca gcggcgtgca 360 caccttcccg gctgtcctac agtcctcagg actctactcc ctcagcagcg tggtgaccgt 420 gccctccagc agcttgggca cccagaccta catctgcaac gtgaatcaca agcccagcaa 480 caccaaggtg gacaagaaag ttggtgagag gccagcacag ggagggaggg tgtctgctgg 540 aagcaggctc agcgctcctg cctggacgca tcccggctat gcagccccag tccagggcag 600 caaggcaggc cccgtctgcc tcttcacccg gagcctctgc ccgccccact catgctcagg 660 gagagggtct tctggctttt tcccaggctc tgggcaggca caggctaggt gcccctaacc 720 caggccctgc acacaaaggg gcaggtgctg ggctcagacc tgccaagagc catatccggg 780 aggaccctgc ccctgaccta agcccacccc aaaggccaaa ctctccactc cctcagctcg 840 gacaccttct ctcctcccag attccagtaa ctcccaatct tctctctgca gagcccaaat 900 cttgtgacaa aactcacaca tgcccaccgt gcccaggtaa gccagcccag gcctcgccct 960 ccagctcaag gcgggacagg tgccctagag tagcctgcat ccagggacag gccccagccg 1020 ggtgctgaca cgtccacctc catctcttcc tcagcacctg aactcctggg gggaccgtca 1080 gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 1140 acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 1200 gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 1260 taccgggtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 1320 aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 1380 aaaggtggga cccgtggggt gcgagggcca catggacaga ggccggctcg gcccaccctc 1440 tgccctgaga gtgaccgctg taccaacctc tgtcctacag ggcagccccg agaaccacag 1500 gtgtacaccc tgcccccatc ccgggatgag ctgaccaaga accaggtcag cctgacctgc 1560 ctggtcaaag gcttctatcc cagcgacatc gccgtggagt gggagagcaa tgggcagccg 1620 gagaacaact acaagaccac gcctcccgtg ctggactccg acggctcctt cttcctctac 1680 agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg 1740 atgcatgagg ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa 1800 tgagtgcgac ggccggcaag ccccgctccc cgggctctcg cggtcgcacg aggatgcttg 1860 gcacgtaccc cctgtacata cttcccgggc gcccagcatg gaaataaagc acccagcgct 1920 gccctgggcc cctgcgagac tgtgatggtt ctttccacgg gtcaggccga gtctgaggcc 1980 tgagtggcat gagggaggca gagcgggtc 2009 <210> 66 <211> 216 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq43 <400> 66 ccccccgagg acccccctga ctccaagaat accctggtgc tgttcggcgc tggcttcggc 60 gccgtgatta ccgtggtcgt gatcgtcgtg attatcaagt gcttctgcaa gcaccggtcc 120 tgcttccggc ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag 180 gaagccctgg ctgagcagac cgtgtttctg tgatga 216 <210> 67 <211> 546 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC2819 <400> 67 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac ctctgcgctt cttcccttcc ctcctccctg 540 gctcag 546 <210> 68 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC3469 <400> 68 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac cgagggagga gggaacag 528 <210> 69 <211> 563 <212> DNA <213> Artificial Sequence <220> <223> Intron cTNT-I4 <400> 69 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540 cccttccctc ctccctggct cag 563 <210> 70 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(0Y) <400> 70 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga gggaggaggg 540 aacag 545 <210> 71 <211> 700 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(polyA) <400> 71 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt ttattgcagc 300 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 360 actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatcga 420 tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca cagtgcagga 480 ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg gaaccggggt 540 ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga gagctgaaag 600 ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa ggcacctggc 660 taacctctgc gcttcttccc ttccctcctc cctggctcag 700 <210> 72 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(3Y) <400> 72 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga gacctgaggg 540 gacag 545 <210> 73 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(5Y) <400> 73 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct gtccttattg 540 cacag 545 <210> 74 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(5Y-5) <400> 74 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct gggaggattg 540 cacag 545 <210> 75 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(9Y) <400> 75 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccgt ctccttctgg 540 gacag 545 <210> 76 <211> 563 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(15Y-3? <400> 76 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540 cccttccctg ctacctggct cag 563 <210> 77 <211> 1035 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(SV40ter) <400> 77 gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc gaccaagcga 300 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 360 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 420 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 480 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 540 aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag agcttggcgt 600 aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca 660 tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc ttttttttta 720 atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta acaatgctca 780 agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg cagcagtggg 840 gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg ctgcttcagt 900 gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac ctggtgcaca 960 ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc ttcccttccc 1020 tcctccctgg ctcag 1035 <210> 78 <211> 563 <212> DNA <213> Artificial Sequence <220> <223> Intron I4(SD_GGC) <400> 78 gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60 gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120 atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180 ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240 tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300 aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360 gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420 gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480 ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540 cccttccctc ctccctggct cag 563 <210> 79 <211> 375 <212> DNA <213> Artificial Sequence <220> <223> GSB59abc <400> 79 ctgtccctgg gcaagtgata gaagcttgcg gccgcgctta gcgatatcga attctctaga 60 ggtacccccg gggggcccct cgagttcgaa atgaccgacc aagcgacgcc caacctgcca 120 tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 180 cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 240 cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 300 acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 360 tcttatcatg tctgt 375 <210> 80 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC11218 <400> 80 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 81 <211> 1097 <212> DNA <213> Artificial Sequence <220> <223> GSC11213 <400> 81 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatctg gctctgatcc tgggacctgt gctggctctg ctggcactgg 660 tggctctggg agtgctggga ctgtggaagt gcttctgcaa gcaccggtcc tgcttccggc 720 ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780 ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080 tatcttatca tgtctgt 1097 <210> 82 <211> 1097 <212> DNA <213> Artificial Sequence <220> <223> GSC11214 <400> 82 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatatc gccgccatca tcgtgatcct ggtgttgctc ctgctgctgg 660 gcatcggcct gatgtggtgg ttctggaagt gcttctgcaa gcaccggtcc tgcttccggc 720 ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780 ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080 tatcttatca tgtctgt 1097 <210> 83 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC11210 <400> 83 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatatg gccctgattg tgctgggcgg agtggctggc ctgctgctgt 660 ttatcggcct gggcatcttc ttcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 84 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC11205 <400> 84 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatatc gctggcgtga tcgctggcat cctgctgttc gtgatcatct 660 tcctgggcgt ggtgctcgtg atgaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 85 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC11217 <400> 85 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgct ctggtcgtga tccccatcat cttcggcatc ctgttcgcca 660 tcctgctggt gctggtgttc atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 86 <211> 1097 <212> DNA <213> Artificial Sequence <220> <223> GSC11756 <400> 86 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatatc atccctatcg tggccggcgt ggtggctggc atcgtgctga 660 ttggactggc cctgctgctg atctggaagt gcttctgcaa gcaccggtcc tgcttccggc 720 ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780 ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080 tatcttatca tgtctgt 1097 <210> 87 <211> 1100 <212> DNA <213> Artificial Sequence <220> <223> GSC11296 <400> 87 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgga atcgtggctg gactggctgt gctggccgtg gtcgtgattg 660 gagctgtggt ggccgccgtg atgtgcagaa agtgcttctg caagcaccgg tcctgcttcc 720 ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780 tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840 tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900 ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960 cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020 atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080 atgtatctta tcatgtctgt 1100 <210> 88 <211> 1100 <212> DNA <213> Artificial Sequence <220> <223> GSC11295 <400> 88 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatctg atcattgccc tgcctgtggc cgtgctgctg atcgtgggag 660 gcctcgtgat catgctgtac gtgttccaca agtgcttctg caagcaccgg tcctgcttcc 720 ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780 tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840 tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900 ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960 cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020 atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080 atgtatctta tcatgtctgt 1100 <210> 89 <211> 1100 <212> DNA <213> Artificial Sequence <220> <223> GSC11390 <400> 89 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatggc ctgctgatcg gcatctccat cgcctccctg tgcctggtgg 660 tggccctgct ggccctgctg tgccacctga agtgcttctg caagcaccgg tcctgcttcc 720 ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780 tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840 tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900 ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960 cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020 atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080 atgtatctta tcatgtctgt 1100 <210> 90 <211> 1100 <212> DNA <213> Artificial Sequence <220> <223> GSC11391 <400> 90 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatctg ctgctgggcg tgtccgtgtc ctgcatcgtg atcctggccg 660 tgtgcctgct gtgctacgtg tccatcacca agtgcttctg caagcaccgg tcctgcttcc 720 ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780 tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840 tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900 ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960 cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020 atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080 atgtatctta tcatgtctgt 1100 <210> 91 <211> 1097 <212> DNA <213> Artificial Sequence <220> <223> GSC11392 <400> 91 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc aacaccgtgg gctccgtgat cggcgtgatc gtgaccatct 660 tcgtgtccgg caccgtgtac ttcatcaagt gcttctgcaa gcaccggtcc tgcttccggc 720 ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780 ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080 tatcttatca tgtctgt 1097 <210> 92 <211> 1097 <212> DNA <213> Artificial Sequence <220> <223> GSC11397 <400> 92 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatatc accctgatca tcttcggcgt gatggccggc gtgatcggca 660 ccatcctgct gatctcctac ggcatcaagt gcttctgcaa gcaccggtcc tgcttccggc 720 ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780 ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840 catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900 tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960 accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080 tatcttatca tgtctgt 1097 <210> 93 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11204 <400> 93 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc 660 tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 94 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11216 <400> 94 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcaagctgc 660 tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 95 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11203 <400> 95 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcgtgctgc 660 tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 96 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11211 <400> 96 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc 660 tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 97 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11212 <400> 97 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcgtgctgc 660 tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 98 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11398 <400> 98 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcaagctgc 660 tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 99 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11208 <400> 99 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcgtgctgc 660 tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 100 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> GSC11291 <400> 100 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcgtgctgc 660 tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720 aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780 agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840 gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900 acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080 atcatgtctg t 1091 <210> 101 <211> 1085 <212> DNA <213> Artificial Sequence <220> <223> GSC11297 <400> 101 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatttc ttcatccccc tgctggtggt gatcctgttc gccgtggaca 660 ccggcctgtt catcaagtgc ttctgcaagc accggtcctg cttccggcgg aacgaggcct 720 ccagagagac aaacaactcc ctgaccttcg gccccgagga agccctggct gagcagaccg 780 tgtttctgtg atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 840 tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 900 gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 960 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 1020 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 1080 tctgt 1085 <210> 102 <211> 1085 <212> DNA <213> Artificial Sequence <220> <223> GSC11298 <400> 102 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatatc ctgatcggca cctccgtggt gatcatcctg ttcatcctgc 660 tgttcttcct gctgaagtgc ttctgcaagc accggtcctg cttccggcgg aacgaggcct 720 ccagagagac aaacaactcc ctgaccttcg gccccgagga agccctggct gagcagaccg 780 tgtttctgtg atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 840 tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 900 gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 960 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 1020 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 1080 tctgt 1085 <210> 103 <211> 1079 <212> DNA <213> Artificial Sequence <220> <223> GSC11393 <400> 103 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgtg ctggccctga tcgtgatctt cctgaccatc gccgtgctgc 660 tggccctgaa gtgcttctgc aagcaccggt cctgcttccg gcggaacgag gcctccagag 720 agacaaacaa ctccctgacc ttcggccccg aggaagccct ggctgagcag accgtgtttc 780 tgtgatgatt cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt 840 ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 900 tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 960 cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 1020 tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 1079 <210> 104 <211> 1106 <212> DNA <213> Artificial Sequence <220> <223> GSC11394 <400> 104 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgtg atgtccgtgg ccaccatcgt gatcgtggac atctgcatca 660 ccggcggcct gctgctgctg gtgtactact ggtccaagtg cttctgcaag caccggtcct 720 gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780 aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840 ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900 gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960 tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080 tcatcaatgt atcttatcat gtctgt 1106 <210> 105 <211> 1106 <212> DNA <213> Artificial Sequence <220> <223> GSC11395 <400> 105 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatgcc atccccatct ggtgggtgct ggtgggcgtg ctgggcggcc 660 tgctgctgct gaccatcctg gtgctggcca tgtggaagtg cttctgcaag caccggtcct 720 gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780 aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840 ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900 gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960 tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080 tcatcaatgt atcttatcat gtctgt 1106 <210> 106 <211> 1109 <212> DNA <213> Artificial Sequence <220> <223> GSC11396 <400> 106 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatttc tgggtgctgg tggtggtggg cggcgtgctg gcctgctact 660 ccctgctggt gaccgtggcc ttcatcatct tctgggtgaa gtgcttctgc aagcaccggt 720 cctgcttccg gcggaacgag gcctccagag agacaaacaa ctccctgacc ttcggccccg 780 aggaagccct ggctgagcag accgtgtttc tgtgatgatt cgaaatgacc gaccaagcga 840 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 900 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 960 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1020 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1080 aactcatcaa tgtatcttat catgtctgt 1109 <210> 107 <211> 1109 <212> DNA <213> Artificial Sequence <220> <223> GSC11389 <400> 107 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatctg tggacgacca tcaccatctt catcacactc ttcctgttaa 660 gcgtgtgcta cagtgccacc gtcaccttct tcaaggtgaa gtgcttctgc aagcaccggt 720 cctgcttccg gcggaacgag gcctccagag agacaaacaa ctccctgacc ttcggccccg 780 aggaagccct ggctgagcag accgtgtttc tgtgatgatt cgaaatgacc gaccaagcga 840 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 900 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 960 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1020 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1080 aactcatcaa tgtatcttat catgtctgt 1109 <210> 108 <211> 1082 <212> DNA <213> Artificial Sequence <220> <223> GSC11677 <400> 108 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc accgtgatcg 660 tcgtgattat caagtgcttc tgcaagcacc ggtcctgctt ccggcggaac gaggcctcca 720 gagagacaaa caactccctg accttcggcc ccgaggaagc cctggctgag cagaccgtgt 780 ttctgtgatg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840 attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900 ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960 ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020 ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080 gt 1082 <210> 109 <211> 1088 <212> DNA <213> Artificial Sequence <220> <223> GSC11679 <400> 109 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc accgtggtcg 660 tgatcgtcgt gattatcaag tgcttctgca agcaccggtc ctgcttccgg cggaacgagg 720 cctccagaga gacaaacaac tccctgacct tcggccccga ggaagccctg gctgagcaga 780 ccgtgtttct gtgatgattc gaaatgaccg accaagcgac gcccaacctg ccatcacgag 840 atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 900 ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact 960 tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 1020 aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 1080 atgtctgt 1088 <210> 110 <211> 1100 <212> DNA <213> Artificial Sequence <220> <223> GSC11484 <400> 110 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtggtcattg 660 taaccgtggt cgtgatcgtc gtgattatca agtgcttctg caagcaccgg tcctgcttcc 720 ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780 tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840 tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900 ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960 cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020 atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080 atgtatctta tcatgtctgt 1100 <210> 111 <211> 1106 <212> DNA <213> Artificial Sequence <220> <223> GSC11292 <400> 111 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtggtcattg 660 tagtcgtaac cgtggtcgtg atcgtcgtga ttatcaagtg cttctgcaag caccggtcct 720 gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780 aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840 ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900 gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960 tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080 tcatcaatgt atcttatcat gtctgt 1106 <210> 112 <211> 1007 <212> DNA <213> Artificial Sequence <220> <223> GSC11207 <400> 112 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcgccagcg cccatcacca ccaccatcat tgatgattcg 720 aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct 780 tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 840 gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg 900 gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 960 ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgt 1007 <210> 113 <211> 995 <212> DNA <213> Artificial Sequence <220> <223> GSC11209 <400> 113 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagtg atgattcgaa atgaccgacc 720 aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 780 tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 840 tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 900 gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 960 tgtccaaact catcaatgta tcttatcatg tctgt 995 <210> 114 <211> 1058 <212> DNA <213> Artificial Sequence <220> <223> GSC11758 <400> 114 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgga tcttctcctc ggtggtggac ctgaagcaga 720 ccatcatccc cgactacagg aacatgatcg gacagggggc ctagtgattc gaaatgaccg 780 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 840 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 900 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 960 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1020 gtttgtccaa actcatcaat gtatcttatc atgtctgt 1058 <210> 115 <211> 1016 <212> PRT <213> Artificial Sequence <220> <223> GSC11764 <400> 115 Cys Thr Gly Thr Cys Thr Cys Cys Gly Gly Gly Thr Ala Ala Ala Thr 1 5 10 15 Gly Ala Thr Gly Ala Ala Ala Gly Cys Thr Thr Gly Gly Thr Ala Gly 20 25 30 Gly Thr Gly Ala Thr Cys Cys Thr Cys Cys Thr Gly Cys Thr Gly Cys 35 40 45 Thr Thr Thr Gly Gly Thr Thr Cys Ala Gly Gly Gly Thr Thr Thr Thr 50 55 60 Gly Cys Thr Thr Gly Ala Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 65 70 75 80 Thr Gly Gly Thr Gly Ala Thr Thr Thr Cys Cys Thr Thr Gly Cys Cys 85 90 95 Ala Thr Gly Gly Gly Cys Ala Gly Ala Cys Thr Gly Ala Gly Cys Ala 100 105 110 Gly Ala Ala Ala Ala Gly Gly Cys Cys Ala Thr Thr Gly Gly Gly Ala 115 120 125 Cys Cys Ala Thr Gly Thr Thr Cys Thr Gly Ala Ala Thr Gly Cys Cys 130 135 140 Thr Cys Cys Ala Cys Cys Thr Cys Ala Ala Cys Cys Ala Cys Cys Gly 145 150 155 160 Gly Cys Cys Gly Gly Thr Ala Gly Gly Ala Cys Cys Ala Ala Ala Gly 165 170 175 Cys Cys Ala Cys Cys Cys Cys Gly Thr Gly Thr Thr Thr Thr Cys Thr 180 185 190 Cys Ala Gly Gly Ala Thr Cys Thr Cys Thr Thr Thr Thr Cys Cys Cys 195 200 205 Ala Gly Gly Gly Ala Gly Ala Thr Cys Cys Cys Thr Cys Gly Gly Cys 210 215 220 Cys Cys Ala Ala Ala Gly Ala Gly Gly Gly Ala Gly Ala Thr Gly Gly 225 230 235 240 Cys Ala Ala Thr Gly Cys Thr Gly Gly Ala Thr Gly Thr Gly Thr Gly 245 250 255 Cys Ala Cys Ala Ala Thr Ala Ala Thr Thr Cys Ala Ala Cys Ala Gly 260 265 270 Gly Cys Ala Thr Thr Gly Gly Ala Ala Cys Thr Thr Cys Ala Gly Cys 275 280 285 Ala Thr Cys Gly Ala Thr Gly Cys Thr Gly Ala Ala Thr Gly Cys Ala 290 295 300 Ala Thr Thr Ala Ala Cys Ala Ala Thr Gly Cys Thr Cys Ala Ala Gly 305 310 315 320 Cys Ala Gly Ala Ala Cys Cys Cys Cys Cys Gly Gly Cys Thr Cys Cys 325 330 335 Ala Thr Cys Ala Gly Cys Ala Cys Ala Gly Thr Gly Cys Ala Gly Gly 340 345 350 Ala Cys Cys Ala Ala Ala Cys Cys Cys Cys Ala Thr Gly Cys Thr Gly 355 360 365 Cys Ala Gly Cys Ala Gly Thr Gly Gly Gly Gly Cys Thr Gly Thr Cys 370 375 380 Thr Gly Thr Ala Cys Gly Gly Gly Gly Thr Gly Gly Gly Cys Ala Ala 385 390 395 400 Thr Gly Gly Gly Ala Ala Cys Cys Gly Gly Gly Gly Thr Cys Thr Gly 405 410 415 Cys Thr Gly Gly Gly Gly Cys Thr Cys Cys Thr Gly Cys Thr Gly Cys 420 425 430 Thr Thr Cys Ala Gly Thr Gly Cys Thr Gly Cys Cys Ala Thr Gly Cys 435 440 445 Ala Gly Cys Cys Ala Cys Ala Cys Ala Thr Cys Cys Thr Gly Ala Gly 450 455 460 Ala Gly Cys Thr Gly Ala Ala Ala Gly Gly Gly Thr Cys Gly Gly Cys 465 470 475 480 Gly Thr Cys Cys Thr Cys Ala Cys Cys Thr Gly Gly Thr Gly Cys Ala 485 490 495 Cys Ala Cys Cys Gly Thr Ala Gly Cys Thr Cys Thr Gly Cys Cys Cys 500 505 510 Cys Ala Cys Ala Gly Cys Thr Thr Thr Ala Ala Gly Gly Cys Ala Cys 515 520 525 Cys Thr Gly Gly Cys Thr Ala Ala Cys Cys Thr Cys Thr Gly Cys Gly 530 535 540 Cys Thr Thr Cys Thr Thr Cys Cys Cys Thr Thr Cys Cys Cys Thr Cys 545 550 555 560 Cys Thr Cys Cys Cys Thr Gly Gly Cys Thr Cys Ala Gly Gly Thr Gly 565 570 575 Gly Thr Gly Gly Thr Gly Gly Ala Thr Cys Thr Cys Cys Cys Cys Cys 580 585 590 Cys Gly Ala Gly Gly Ala Cys Cys Cys Cys Cys Cys Thr Gly Ala Cys 595 600 605 Thr Cys Cys Ala Ala Gly Ala Ala Thr Ala Cys Cys Cys Thr Gly Gly 610 615 620 Thr Gly Cys Thr Gly Thr Thr Cys Gly Gly Cys Gly Cys Thr Gly Gly 625 630 635 640 Cys Thr Thr Cys Gly Gly Cys Gly Cys Cys Gly Thr Gly Ala Thr Thr 645 650 655 Ala Cys Cys Gly Thr Gly Gly Thr Cys Gly Thr Gly Ala Thr Cys Gly 660 665 670 Thr Cys Gly Thr Gly Ala Thr Thr Ala Thr Cys Ala Gly Gly Thr Cys 675 680 685 Cys Cys Ala Gly Cys Ala Gly Gly Ala Gly Gly Cys Cys Gly Cys Cys 690 695 700 Gly Cys Cys Ala Ala Gly Ala Ala Gly Thr Thr Cys Thr Thr Cys Thr 705 710 715 720 Gly Ala Thr Gly Ala Thr Thr Cys Gly Ala Ala Ala Thr Gly Ala Cys 725 730 735 Cys Gly Ala Cys Cys Ala Ala Gly Cys Gly Ala Cys Gly Cys Cys Cys 740 745 750 Ala Ala Cys Cys Thr Gly Cys Cys Ala Thr Cys Ala Cys Gly Ala Gly 755 760 765 Ala Thr Thr Thr Cys Gly Ala Thr Thr Cys Cys Ala Cys Cys Gly Cys 770 775 780 Cys Gly Cys Cys Thr Thr Cys Thr Ala Thr Gly Ala Ala Ala Gly Gly 785 790 795 800 Thr Thr Gly Gly Gly Cys Thr Thr Cys Gly Gly Ala Ala Thr Cys Gly 805 810 815 Thr Thr Thr Thr Cys Cys Gly Gly Gly Ala Cys Gly Cys Cys Gly Gly 820 825 830 Cys Thr Gly Gly Ala Thr Gly Ala Thr Cys Cys Thr Cys Cys Ala Gly 835 840 845 Cys Gly Cys Gly Gly Gly Gly Ala Thr Cys Thr Cys Ala Thr Gly Cys 850 855 860 Thr Gly Gly Ala Gly Thr Thr Cys Thr Thr Cys Gly Cys Cys Cys Ala 865 870 875 880 Cys Cys Cys Cys Ala Ala Cys Thr Thr Gly Thr Thr Thr Ala Thr Thr 885 890 895 Gly Cys Ala Gly Cys Thr Thr Ala Thr Ala Ala Thr Gly Gly Thr Thr 900 905 910 Ala Cys Ala Ala Ala Thr Ala Ala Ala Gly Cys Ala Ala Thr Ala Gly 915 920 925 Cys Ala Thr Cys Ala Cys Ala Ala Ala Thr Thr Thr Cys Ala Cys Ala 930 935 940 Ala Ala Thr Ala Ala Ala Gly Cys Ala Thr Thr Thr Thr Thr Thr Thr 945 950 955 960 Cys Ala Cys Thr Gly Cys Ala Thr Thr Cys Thr Ala Gly Thr Thr Gly 965 970 975 Thr Gly Gly Thr Thr Thr Gly Thr Cys Cys Ala Ala Ala Cys Thr Cys 980 985 990 Ala Thr Cys Ala Ala Thr Gly Thr Ala Thr Cys Thr Thr Ala Thr Cys 995 1000 1005 Ala Thr Gly Thr Cys Thr Gly Thr 1010 1015 <210> 116 <211> 1016 <212> DNA <213> Artificial Sequence <220> <223> GSC11678 <400> 116 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaggtccc agcaggaggc cgccgccaag aagtggtggt 720 gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 780 ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 840 tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 900 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 960 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1016 <210> 117 <211> 1115 <212> DNA <213> Artificial Sequence <220> <223> GSC11759 <400> 117 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcatgttcc tgaccctgaa gggctccctg aagcagaggc 720 tgcaggtgat gatccagccc tccgaggaca tcgtgaggcc cgagaacggc cccgagcagc 780 cccaggccgg ctcctccgcc tccaaggagg cctacatctg atgattcgaa atgaccgacc 840 aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 900 tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 960 tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 1020 gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1080 tgtccaaact catcaatgta tcttatcatg tctgt 1115 <210> 118 <211> 1004 <212> DNA <213> Artificial Sequence <220> <223> GSC11483 <400> 118 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcatgttcc tgaccctgaa gggctcctga tgattcgaaa 720 tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 780 atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 840 gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 900 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 960 gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1004 <210> 119 <211> 1115 <212> DNA <213> Artificial Sequence <220> <223> GSC11760 <400> 119 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atctgcttcg tgggcaacag gttccagcag aagctgaggt 720 ccgtgttcag ggtgcccatc acctggctgc agggcaagag ggagaccatg tcctgcagga 780 agtcctcctc cctgagggag atggacacct tcgtgtcctg atgattcgaa atgaccgacc 840 aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 900 tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 960 tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 1020 gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1080 tgtccaaact catcaatgta tcttatcatg tctgt 1115 <210> 120 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> GSC11761 <400> 120 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atctgcttcg tgggcaacag gttccagcag aagctgaggt 720 ccgtgttcag ggtgcccatc acctggctgc agggcaagag ggagaccatg tcctgcagga 780 agtcctcctc cctgaggtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 121 <211> 1229 <212> DNA <213> Artificial Sequence <220> <223> GSC11762 <400> 121 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaactccc acctgctgcc caggcccctg aggcacctgg 720 cctgctgcgg cggcccccag cccaggatga ggaggaggct gtccgacggc tccctgtcct 780 ccaggcacac caccctgctg accaggtcct cctgccccgc caccctgtcc ctgtccctgt 840 ccctgaccct gtccggcagg cccaggcccg aggagtcccc cagggacctg gagctggccg 900 acggcgaggg caccgccgag accatcatct tctgatgatt cgaaatgacc gaccaagcga 960 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 1020 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 1080 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1140 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1200 aactcatcaa tgtatcttat catgtctgt 1229 <210> 122 <211> 1052 <212> DNA <213> Artificial Sequence <220> <223> GSC11765 <400> 122 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaactccc acgaggagtc ccccagggac ctggagctgg 720 ccgacggcga gggcaccgcc gagaccatca tcttctgatg attcgaaatg accgaccaag 780 cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 840 gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 900 tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 960 atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 1020 ccaaactcat caatgtatct tatcatgtct gt 1052 <210> 123 <211> 1049 <212> DNA <213> Artificial Sequence <220> <223> GSC11766 <400> 123 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atctgcatca agctgaagca caccaagaag aggcagatct 720 acaccgacat cgagatgaac aggctgggca agtgatgatt cgaaatgacc gaccaagcga 780 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 840 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 900 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 960 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1020 aactcatcaa tgtatcttat catgtctgt 1049 <210> 124 <211> 1049 <212> DNA <213> Artificial Sequence <220> <223> GSC11763 <400> 124 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atctgcatca agctgaagca caccaagaag aggcagatcg 720 ccgccgccgc cgccgccaac aggctgggca agtgatgatt cgaaatgacc gaccaagcga 780 cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 840 tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 900 agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 960 gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1020 aactcatcaa tgtatcttat catgtctgt 1049 <210> 125 <211> 1118 <212> DNA <213> Artificial Sequence <220> <223> GSC11294 <400> 125 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600 aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660 tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tgcttctgca 720 agcaccggtc ctgcttccgg cggaacgagg cctccagaga gacaaacaac tccctgacct 780 tcggccccga ggaagccctg gctgagcaga ccgtgtttct gtagtgattc gaaatgaccg 840 accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 900 ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 960 tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 1020 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1080 gtttgtccaa actcatcaat gtatcttatc atgtctgt 1118 <210> 126 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> GSB59abc <400> 126 Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Gly Val His Ala Gln Val Thr Leu Lys Glu Ser Gly Pro Ala Leu 20 25 30 Val Lys Pro Thr Gln Thr Leu Thr Leu Thr Cys Ser Phe Ser Gly Phe 35 40 45 Ser Leu Ser Thr Ser Gly Met Gly Val Gly Trp Ile Arg Gln Pro Pro 50 55 60 Gly Lys Ala Leu Glu Trp Ile Ala His Ile Trp Trp Asp Asp Asp Lys 65 70 75 80 Tyr Tyr Asn Thr Ala Leu Lys Thr Arg Leu Thr Ile Ser Lys Asp Thr 85 90 95 Ser Lys Asn Gln Val Val Leu Thr Met Thr Asn Met Asp Pro Val Asp 100 105 110 Thr Ala Thr Tyr Tyr Cys Ala Arg Ile Asp Trp Asp Gly Phe Ala Tyr 115 120 125 Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly 130 135 140 Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser 145 150 155 160 Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val 165 170 175 Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe 180 185 190 Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val 195 200 205 Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val 210 215 220 Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys 225 230 235 240 Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly 245 250 255 Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile 260 265 270 Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu 275 280 285 Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His 290 295 300 Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg 305 310 315 320 Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys 325 330 335 Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu 340 345 350 Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr 355 360 365 Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu 370 375 380 Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp 385 390 395 400 Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val 405 410 415 Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp 420 425 430 Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His 435 440 445 Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu 450 455 460 Gly Lys 465 <210> 127 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> GSC11218 <400> 127 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His 35 40 45 Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser 50 55 60 Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 80 <210> 128 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> GSC11213 <400> 128 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Leu Ala Leu Ile Leu Gly Pro Val Leu Ala Leu Leu 20 25 30 Ala Leu Val Ala Leu Gly Val Leu Gly Leu Trp Lys Cys Phe Cys Lys 35 40 45 His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn 50 55 60 Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe 65 70 75 80 Leu <210> 129 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> GSC11214 <400> 129 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ile Ala Ala Ile Ile Val Ile Leu Val Leu Leu Leu 20 25 30 Leu Leu Gly Ile Gly Leu Met Trp Trp Phe Trp Lys Cys Phe Cys Lys 35 40 45 His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn 50 55 60 Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe 65 70 75 80 Leu <210> 130 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> GSC11210 <400> 130 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu 20 25 30 Leu Leu Phe Ile Gly Leu Gly Ile Phe Phe Lys Cys Phe Cys Lys His 35 40 45 Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser 50 55 60 Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 80 <210> 131 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> GSC11205 <400> 131 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ile Ala Gly Val Ile Ala Gly Ile Leu Leu Phe Val 20 25 30 Ile Ile Phe Leu Gly Val Val Leu Val Met Lys Cys Phe Cys Lys His 35 40 45 Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser 50 55 60 Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 80 <210> 132 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> GSC11217 <400> 132 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Val Val Ile Pro Ile Ile Phe Gly Ile Leu 20 25 30 Phe Ala Ile Leu Leu Val Leu Val Phe Ile Lys Cys Phe Cys Lys His 35 40 45 Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser 50 55 60 Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 80 <210> 133 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> GSC11756 <400> 133 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ile Ile Pro Ile Val Ala Gly Val Val Ala Gly Ile 20 25 30 Val Leu Ile Gly Leu Ala Leu Leu Leu Ile Trp Lys Cys Phe Cys Lys 35 40 45 His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn 50 55 60 Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe 65 70 75 80 Leu <210> 134 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> GSC11296 <400> 134 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Gly Ile Val Ala Gly Leu Ala Val Leu Ala Val Val 20 25 30 Val Ile Gly Ala Val Val Ala Ala Val Met Cys Arg Lys Cys Phe Cys 35 40 45 Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn 50 55 60 Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val 65 70 75 80 Phe Leu <210> 135 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> GSC11295 <400> 135 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Leu Ile Ile Ala Leu Pro Val Ala Val Leu Leu Ile 20 25 30 Val Gly Gly Leu Val Ile Met Leu Tyr Val Phe His Lys Cys Phe Cys 35 40 45 Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn 50 55 60 Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val 65 70 75 80 Phe Leu <210> 136 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> GSC11390 <400> 136 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Gly Leu Leu Ile Gly Ile Ser Ile Ala Ser Leu Cys 20 25 30 Leu Val Val Ala Leu Leu Ala Leu Leu Cys His Leu Lys Cys Phe Cys 35 40 45 Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn 50 55 60 Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val 65 70 75 80 Phe Leu <210> 137 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> GSC11391 <400> 137 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Leu Leu Leu Gly Val Ser Val Ser Cys Ile Val Ile 20 25 30 Leu Ala Val Cys Leu Leu Cys Tyr Val Ser Ile Thr Lys Cys Phe Cys 35 40 45 Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn 50 55 60 Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val 65 70 75 80 Phe Leu <210> 138 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> GSC11392 <400> 138 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Asn Thr Val Gly Ser Val Ile Gly Val Ile Val 20 25 30 Thr Ile Phe Val Ser Gly Thr Val Tyr Phe Ile Lys Cys Phe Cys Lys 35 40 45 His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn 50 55 60 Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe 65 70 75 80 Leu <210> 139 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> GSC11397 <400> 139 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ile Thr Leu Ile Ile Phe Gly Val Met Ala Gly Val 20 25 30 Ile Gly Thr Ile Leu Leu Ile Ser Tyr Gly Ile Lys Cys Phe Cys Lys 35 40 45 His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn 50 55 60 Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe 65 70 75 80 Leu <210> 140 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11204 <400> 140 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe 20 25 30 Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 141 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11216 <400> 141 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe 20 25 30 Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 142 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11203 <400> 142 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe 20 25 30 Val Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 143 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11211 <400> 143 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe 20 25 30 Lys Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 144 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11212 <400> 144 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe 20 25 30 Val Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 145 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11398 <400> 145 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe 20 25 30 Lys Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 146 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11208 <400> 146 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe 20 25 30 Val Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 147 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> GSC11291 <400> 147 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe 20 25 30 Val Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg 35 40 45 Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu 50 55 60 Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 148 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> GSC11297 <400> 148 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Phe Phe Ile Pro Leu Leu Val Val Ile Leu Phe Ala 20 25 30 Val Asp Thr Gly Leu Phe Ile Lys Cys Phe Cys Lys His Arg Ser Cys 35 40 45 Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe 50 55 60 Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 149 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> GSC11298 <400> 149 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ile Leu Ile Gly Thr Ser Val Val Ile Ile Leu Phe 20 25 30 Ile Leu Leu Phe Phe Leu Leu Lys Cys Phe Cys Lys His Arg Ser Cys 35 40 45 Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe 50 55 60 Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 150 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> GSC11393 <400> 150 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Val Leu Ala Leu Ile Val Ile Phe Leu Thr Ile Ala 20 25 30 Val Leu Leu Ala Leu Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg 35 40 45 Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro 50 55 60 Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 151 <211> 84 <212> PRT <213> Artificial Sequence <220> <223> GSC11394 <400> 151 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile 20 25 30 Cys Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Cys 35 40 45 Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu 50 55 60 Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln 65 70 75 80 Thr Val Phe Leu <210> 152 <211> 84 <212> PRT <213> Artificial Sequence <220> <223> GSC11395 <400> 152 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Ala Ile Pro Ile Trp Trp Val Leu Val Gly Val Leu 20 25 30 Gly Gly Leu Leu Leu Leu Thr Ile Leu Val Leu Ala Met Trp Lys Cys 35 40 45 Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu 50 55 60 Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln 65 70 75 80 Thr Val Phe Leu <210> 153 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> GSC11396 <400> 153 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala 20 25 30 Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Lys 35 40 45 Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg 50 55 60 Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu 65 70 75 80 Gln Thr Val Phe Leu 85 <210> 154 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> GSC11389 <400> 154 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe 20 25 30 Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val Lys 35 40 45 Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg 50 55 60 Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu 65 70 75 80 Gln Thr Val Phe Leu 85 <210> 155 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> GSC11677 <400> 155 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr 20 25 30 Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser Cys Phe 35 40 45 Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly 50 55 60 Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 156 <211> 78 <212> PRT <213> Artificial Sequence <220> <223> GSC11679 <400> 156 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr 20 25 30 Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser 35 40 45 Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr 50 55 60 Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 157 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> GSC11484 <400> 157 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Val Ile Val Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys 35 40 45 Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn 50 55 60 Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val 65 70 75 80 Phe Leu <210> 158 <211> 84 <212> PRT <213> Artificial Sequence <220> <223> GSC11292 <400> 158 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Val Ile Val Val Val Thr Val Val Val Ile Val Val Ile Ile Lys Cys 35 40 45 Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu 50 55 60 Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln 65 70 75 80 Thr Val Phe Leu <210> 159 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> GSC11207 <400> 159 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Ala Ser Ala His His His 35 40 45 His His His 50 <210> 160 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> GSC11209 <400> 160 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys 35 40 45 <210> 161 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> GSC11758 <400> 161 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Lys Trp Ile Phe Ser Ser 35 40 45 Val Val Asp Leu Lys Gln Thr Ile Ile Pro Asp Tyr Arg Asn Met Ile 50 55 60 Gly Gln Gly Ala 65 <210> 162 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> GSC11764 <400> 162 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Arg Ser Gln Gln Glu Ala 35 40 45 Ala Ala Lys Lys Phe Phe 50 <210> 163 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> GSC11678 <400> 163 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Arg Ser Gln Gln Glu Ala 35 40 45 Ala Ala Lys Lys Trp Trp 50 <210> 164 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> GSC11759 <400> 164 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Met Phe Leu Thr Leu Lys 35 40 45 Gly Ser Leu Lys Gln Arg Leu Gln Val Met Ile Gln Pro Ser Glu Asp 50 55 60 Ile Val Arg Pro Glu Asn Gly Pro Glu Gln Pro Gln Ala Gly Ser Ser 65 70 75 80 Ala Ser Lys Glu Ala Tyr Ile 85 <210> 165 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> GSC11483 <400> 165 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Met Phe Leu Thr Leu Lys 35 40 45 Gly Ser 50 <210> 166 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> GSC11760 <400> 166 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Cys Phe Val Gly Asn Arg 35 40 45 Phe Gln Gln Lys Leu Arg Ser Val Phe Arg Val Pro Ile Thr Trp Leu 50 55 60 Gln Gly Lys Arg Glu Thr Met Ser Cys Arg Lys Ser Ser Ser Leu Arg 65 70 75 80 Glu Met Asp Thr Phe Val Ser 85 <210> 167 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> GSC11761 <400> 167 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Cys Phe Val Gly Asn Arg 35 40 45 Phe Gln Gln Lys Leu Arg Ser Val Phe Arg Val Pro Ile Thr Trp Leu 50 55 60 Gln Gly Lys Arg Glu Thr Met Ser Cys Arg Lys Ser Ser Ser Leu Arg 65 70 75 80 <210> 168 <211> 125 <212> PRT <213> Artificial Sequence <220> <223> GSC11762 <400> 168 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Asn Ser His Leu Leu Pro 35 40 45 Arg Pro Leu Arg His Leu Ala Cys Cys Gly Gly Pro Gln Pro Arg Met 50 55 60 Arg Arg Arg Leu Ser Asp Gly Ser Leu Ser Ser Arg His Thr Thr Leu 65 70 75 80 Leu Thr Arg Ser Ser Cys Pro Ala Thr Leu Ser Leu Ser Leu Ser Leu 85 90 95 Thr Leu Ser Gly Arg Pro Arg Pro Glu Glu Ser Pro Arg Asp Leu Glu 100 105 110 Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr Ile Ile Phe 115 120 125 <210> 169 <211> 66 <212> PRT <213> Artificial Sequence <220> <223> GSC11765 <400> 169 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Asn Ser His Glu Glu Ser 35 40 45 Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr Ile 50 55 60 Ile Phe 65 <210> 170 <211> 65 <212> PRT <213> Artificial Sequence <220> <223> GSC11766 <400> 170 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Cys Ile Lys Leu Lys His 35 40 45 Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly 50 55 60 Lys 65 <210> 171 <211> 65 <212> PRT <213> Artificial Sequence <220> <223> GSC11763 <400> 171 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Cys Ile Lys Leu Lys His 35 40 45 Thr Lys Lys Arg Gln Ile Ala Ala Ala Ala Ala Ala Asn Arg Leu Gly 50 55 60 Lys 65 <210> 172 <211> 88 <212> PRT <213> Artificial Sequence <220> <223> GSC11294 <400> 172 Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala 1 5 10 15 Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile 20 25 30 Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe 35 40 45 Lys Val Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu 50 55 60 Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala 65 70 75 80 Leu Ala Glu Gln Thr Val Phe Leu 85 <210> 173 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> B7 TM domain <400> 173 Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Ile Thr Val Val 1 5 10 15 Val Ile Val Val Ile Ile 20 <210> 174 <211> 23 <212> PRT <213> Homo sapiens <400> 174 Leu Ala Leu Ile Leu Gly Pro Val Leu Ala Leu Leu Ala Leu Val Ala 1 5 10 15 Leu Gly Val Leu Gly Leu Trp 20 <210> 175 <211> 23 <212> PRT <213> Homo sapiens <400> 175 Ile Ala Ala Ile Ile Val Ile Leu Val Leu Leu Leu Leu Leu Gly Ile 1 5 10 15 Gly Leu Met Trp Trp Phe Trp 20 <210> 176 <211> 22 <212> PRT <213> Homo sapiens <400> 176 Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu Leu Leu Phe Ile 1 5 10 15 Gly Leu Gly Ile Phe Phe 20 <210> 177 <211> 22 <212> PRT <213> Homo sapiens <400> 177 Ile Ala Gly Val Ile Ala Gly Ile Leu Leu Phe Val Ile Ile Phe Leu 1 5 10 15 Gly Val Val Leu Val Met 20 <210> 178 <211> 22 <212> PRT <213> Homo sapiens <400> 178 Ala Leu Val Val Ile Pro Ile Ile Phe Gly Ile Leu Phe Ala Ile Leu 1 5 10 15 Leu Val Leu Val Phe Ile 20 <210> 179 <211> 23 <212> PRT <213> Homo sapiens <400> 179 Ile Ile Pro Ile Val Ala Gly Val Val Ala Gly Ile Val Leu Ile Gly 1 5 10 15 Leu Ala Leu Leu Leu Ile Trp 20 <210> 180 <211> 24 <212> PRT <213> Homo sapiens <400> 180 Gly Ile Val Ala Gly Leu Ala Val Leu Ala Val Val Val Ile Gly Ala 1 5 10 15 Val Val Ala Ala Val Met Cys Arg 20 <210> 181 <211> 24 <212> PRT <213> Homo sapiens <400> 181 Leu Ile Ile Ala Leu Pro Val Ala Val Leu Leu Ile Val Gly Gly Leu 1 5 10 15 Val Ile Met Leu Tyr Val Phe His 20 <210> 182 <211> 24 <212> PRT <213> Homo sapiens <400> 182 Gly Leu Leu Ile Gly Ile Ser Ile Ala Ser Leu Cys Leu Val Val Ala 1 5 10 15 Leu Leu Ala Leu Leu Cys His Leu 20 <210> 183 <211> 24 <212> PRT <213> Homo sapiens <400> 183 Leu Leu Leu Gly Val Ser Val Ser Cys Ile Val Ile Leu Ala Val Cys 1 5 10 15 Leu Leu Cys Tyr Val Ser Ile Thr 20 <210> 184 <211> 23 <212> PRT <213> Homo sapiens <400> 184 Thr Asn Thr Val Gly Ser Val Ile Gly Val Ile Val Thr Ile Phe Val 1 5 10 15 Ser Gly Thr Val Tyr Phe Ile 20 <210> 185 <211> 23 <212> PRT <213> Homo sapiens <400> 185 Ile Thr Leu Ile Ile Phe Gly Val Met Ala Gly Val Ile Gly Thr Ile 1 5 10 15 Leu Leu Ile Ser Tyr Gly Ile 20 <210> 186 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA TM domain <400> 186 Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu 1 5 10 15 Phe Asp Leu Leu Leu 20 <210> 187 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_R8V TM domain <400> 187 Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Lys Leu Leu Leu 1 5 10 15 Phe Asp Leu Leu Leu 20 <210> 188 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_K13V TM domain <400> 188 Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Val Leu Leu Leu 1 5 10 15 Phe Asp Leu Leu Leu 20 <210> 189 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_D18V TM domain <400> 189 Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu 1 5 10 15 Phe Val Leu Leu Leu 20 <210> 190 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_R8V_K13V TM domain <400> 190 Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Val Leu Leu Leu 1 5 10 15 Phe Asp Leu Leu Leu 20 <210> 191 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_R8V_D18V TM domain <400> 191 Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Lys Leu Leu Leu 1 5 10 15 Phe Val Leu Leu Leu 20 <210> 192 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_K13V_D18V TM domain <400> 192 Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Val Leu Leu Leu 1 5 10 15 Phe Val Leu Leu Leu 20 <210> 193 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> PTCRA_R8V_K13V_D18V TM domain <400> 193 Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Val Leu Leu Leu 1 5 10 15 Phe Val Leu Leu Leu 20 <210> 194 <211> 19 <212> PRT <213> Homo sapiens <400> 194 Phe Phe Ile Pro Leu Leu Val Val Ile Leu Phe Ala Val Asp Thr Gly 1 5 10 15 Leu Phe Ile <210> 195 <211> 19 <212> PRT <213> Homo sapiens <400> 195 Ile Leu Ile Gly Thr Ser Val Val Ile Ile Leu Phe Ile Leu Leu Phe 1 5 10 15 Phe Leu Leu <210> 196 <211> 17 <212> PRT <213> Homo sapiens <400> 196 Val Leu Ala Leu Ile Val Ile Phe Leu Thr Ile Ala Val Leu Leu Ala 1 5 10 15 Leu <210> 197 <211> 26 <212> PRT <213> Homo sapiens <400> 197 Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly 1 5 10 15 Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser 20 25 <210> 198 <211> 26 <212> PRT <213> Homo sapiens <400> 198 Ala Ile Pro Ile Trp Trp Val Leu Val Gly Val Leu Gly Gly Leu Leu 1 5 10 15 Leu Leu Thr Ile Leu Val Leu Ala Met Trp 20 25 <210> 199 <211> 27 <212> PRT <213> Homo sapiens <400> 199 Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu 1 5 10 15 Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val 20 25 <210> 200 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> M1M2 TM domain <400> 200 Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe Leu Leu Ser Val 1 5 10 15 Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val 20 25 <210> 201 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> B7(18) TM domain <400> 201 Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile Val Val 1 5 10 15 Ile Ile <210> 202 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> B7(20) TM domain <400> 202 Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val Val Ile 1 5 10 15 Val Val Ile Ile 20 <210> 203 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> B7(24) TM domain <400> 203 Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Val Ile Val Thr 1 5 10 15 Val Val Val Ile Val Val Ile Ile 20 <210> 204 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> B7(26) TM domain <400> 204 Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Val Ile Val Val 1 5 10 15 Val Thr Val Val Val Ile Val Val Ile Ile 20 25 <210> 205 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> 6His cyto tail <400> 205 Ala Ser Ala His His His His His His 1 5 <210> 206 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> KCFCK cyto tail <400> 206 Lys Cys Phe Cys Lys 1 5 <210> 207 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> M1M2 cyto tail <400> 207 Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro 1 5 10 15 Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala 20 25 <210> 208 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> ERGIC53 cyto tail <400> 208 Arg Ser Gln Gln Glu Ala Ala Ala Lys Lys Phe Phe 1 5 10 <210> 209 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> ERGICnoER cyto tail <400> 209 Arg Ser Gln Gln Glu Ala Ala Ala Lys Lys Trp Trp 1 5 10 <210> 210 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> GAT1 cyto tail <400> 210 Met Phe Leu Thr Leu Lys Gly Ser Leu Lys Gln Arg Leu Gln Val Met 1 5 10 15 Ile Gln Pro Ser Glu Asp Ile Val Arg Pro Glu Asn Gly Pro Glu Gln 20 25 30 Pro Gln Ala Gly Ser Ser Ala Ser Lys Glu Ala Tyr Ile 35 40 45 <210> 211 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> GAT1noER cyto tail <400> 211 Met Phe Leu Thr Leu Lys Gly Ser 1 5 <210> 212 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> AGTR2 cyto tail <400> 212 Cys Phe Val Gly Asn Arg Phe Gln Gln Lys Leu Arg Ser Val Phe Arg 1 5 10 15 Val Pro Ile Thr Trp Leu Gln Gly Lys Arg Glu Thr Met Ser Cys Arg 20 25 30 Lys Ser Ser Ser Leu Arg Glu Met Asp Thr Phe Val Ser 35 40 45 <210> 213 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> AGTR2noER cyto tail <400> 213 Cys Phe Val Gly Asn Arg Phe Gln Gln Lys Leu Arg Ser Val Phe Arg 1 5 10 15 Val Pro Ile Thr Trp Leu Gln Gly Lys Arg Glu Thr Met Ser Cys Arg 20 25 30 Lys Ser Ser Ser Leu Arg 35 <210> 214 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> V1BR cyto tail <400> 214 Asn Ser His Leu Leu Pro Arg Pro Leu Arg His Leu Ala Cys Cys Gly 1 5 10 15 Gly Pro Gln Pro Arg Met Arg Arg Arg Leu Ser Asp Gly Ser Leu Ser 20 25 30 Ser Arg His Thr Thr Leu Leu Thr Arg Ser Ser Cys Pro Ala Thr Leu 35 40 45 Ser Leu Ser Leu Ser Leu Thr Leu Ser Gly Arg Pro Arg Pro Glu Glu 50 55 60 Ser Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr 65 70 75 80 Ile Ile Phe <210> 215 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> V1BRnoER cyto tail <400> 215 Asn Ser His Glu Glu Ser Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu 1 5 10 15 Gly Thr Ala Glu Thr Ile Ile Phe 20 <210> 216 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> VGLG cyto tail <400> 216 Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile 1 5 10 15 Glu Met Asn Arg Leu Gly Lys 20 <210> 217 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> VGLGnoER cyto tail <400> 217 Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Ala Ala Ala Ala 1 5 10 15 Ala Ala Asn Arg Leu Gly Lys 20 <210> 218 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> B7 cyto tail <400> 218 Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser 1 5 10 15 Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala 20 25 30 Glu Gln Thr Val Phe Leu 35 <210> 219 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2376 <400> 219 ggccgttcga atcatcactt gcagaagcac ttgataatc 39 <210> 220 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2377 <400> 220 gtcatttcga atcatcaatg atggtggtgg tgatgggcgc tggcgataat cacgacgatc 60 acgac 65 <210> 221 <211> 59 <212> PRT <213> Artificial Sequence <220> <223> Primer GlnPr2378 <400> 221 Thr Thr Gly Ala Ala Cys Ala Gly Cys Ala Gly Cys Ala Gly Thr Cys 1 5 10 15 Thr Cys Ala Gly Cys Ala Cys Gly Cys Cys Cys Ala Gly Cys Cys Ala 20 25 30 Cys Ala Gly Gly Gly Cys Cys Cys Cys Gly Thr Cys Cys Ala Gly Cys 35 40 45 Thr Cys Cys Cys Cys Gly Thr Cys Cys Thr Gly 50 55 <210> 222 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2379 <400> 222 ctgagactgc tgctgttcaa gctgctcctg ttcgacctgc tcctcaagtg gatcttctcc 60 tcggtg 66 <210> 223 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2380 <400> 223 gcttgaacag cagcagtctc agcacgccca gccacagggc attcttggag tcaggggggt 60 cctc 64 <210> 224 <211> 69 <212> PRT <213> Artificial Sequence <220> <223> Primer GlnPr2381 <400> 224 Cys Ala Gly Gly Ala Cys Cys Gly Gly Thr Gly Cys Thr Thr Gly Cys 1 5 10 15 Ala Gly Ala Ala Gly Cys Ala Cys Thr Thr Gly Ala Gly Gly Ala Gly 20 25 30 Cys Ala Gly Gly Thr Cys Gly Ala Ala Cys Ala Gly Gly Ala Gly Cys 35 40 45 Ala Gly Cys Thr Thr Gly Ala Ala Cys Ala Gly Cys Ala Gly Cys Ala 50 55 60 Gly Thr Cys Thr Cys 65 <210> 225 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2382 <400> 225 gcttgaacag cagcagtacc agcacgccca gccacagggc attcttggag tcaggggggt 60 cctc 64 <210> 226 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2383 <400> 226 caggaccggt gcttgcagaa gcacttgagg agcaggtcga acaggagcag cttgaacagc 60 agcagtacc 69 <210> 227 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2384 <400> 227 gaccggtgct tgcagaagca cttgaggagc aggtcgaaca ggagcagcac gaacagcagc 60 agtctc 66 <210> 228 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2385 <400> 228 gaccggtgct tgcagaagca cttgaggagc aggacgaaca ggagcagctt gaacagcagc 60 agtctc 66 <210> 229 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2386 <400> 229 caggaccggt gcttgcagaa gcacttgagg agcaggtcga acaggagcag cacgaacagc 60 agcagtacc 69 <210> 230 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2387 <400> 230 caggaccggt gcttgcagaa gcacttgagg agcaggacga acaggagcag cttgaacagc 60 agcagtacc 69 <210> 231 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2388 <400> 231 gaccggtgct tgcagaagca cttgaggagc aggacgaaca ggagcagcac gaacagcagc 60 agtctc 66 <210> 232 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2389 <400> 232 caggaccggt gcttgcagaa gcacttgagg agcaggacga acaggagcag cacgaacagc 60 agcagtacc 69 <210> 233 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2390 <400> 233 ggtcgtgatc gtcgtgatta tcaagtggat cttctcctcg gtggtgg 47 <210> 234 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2391 <400> 234 ccaccaccga ggagaagatc cacttgataa tcacgacgat cacgacc 47 <210> 235 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2392 <400> 235 cttcggcgcc accgtggtcg tgatcgtcgt gattatcaag tg 42 <210> 236 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2393 <400> 236 caggaccggt gcttgcagaa gcacttgata atcacgacga tc 42 <210> 237 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2394 <400> 237 cttcggcgcc accgtgatcg tcgtgattat caagtgcttc 40 <210> 238 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2395 <400> 238 caggaccggt gcttgcagaa gcacttgata atcacgac 38 <210> 239 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2396 <400> 239 cttcggcgcc gtggtcattg taaccgtggt cgtgatcgtc gtg 43 <210> 240 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2397 <400> 240 caggaccggt gcttgcagaa gcacttgata atcacgacga tcacgaccac 50 <210> 241 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2398 <400> 241 cttcggcgcc gtggtcattg tagtcgtaac cgtggtcgtg atcgtcgtg 49 <210> 242 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2399 <400> 242 caggaccggt gcttgcagaa gcacttgata atcacgacga tcacgaccac gg 52 <210> 243 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2400 <400> 243 gagccaccag tgccagcaga gccagcacag gtcccaggat cagagccaga ttcttggagt 60 caggggggtc 70 <210> 244 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> > Seq Id No. 244 Primer GlnPr2401 <400> 244 caggaccggt gcttgcagaa gcacttccac agtcccagca ctcccagagc caccagtgcc 60 agcag 65 <210> 245 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2402 <400> 245 cgatgcccag cagcaggagc aacaccagga tcacgatgat ggcggcgata ttcttggagt 60 caggggggtc 70 <210> 246 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2403 <400> 246 caggaccggt gcttgcagaa gcacttccag aaccaccaca tcaggccgat gcccagcagc 60 aggag 65 <210> 247 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2404 <400> 247 gataaacagc agcaggccag ccactccgcc cagcacaatc agggccatat tcttggagtc 60 aggggggtc 69 <210> 248 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2405 <400> 248 caggaccggt gcttgcagaa gcacttgaag aagatgccca ggccgataaa cagcagcagg 60 cc 62 <210> 249 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2406 <400> 249 gtccaatcag cacgatgcca gccaccacgc cggccacgat agggatgata ttcttggagt 60 caggggggtc 70 <210> 250 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2407 <400> 250 caggaccggt gcttgcagaa gcacttccag atcagcagca gggccagtcc aatcagcacg 60 atgcc 65 <210> 251 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2408 <400> 251 ccaggaagat gatcacgaac agcaggatgc cagcgatcac gccagcgata ttcttggagt 60 caggggggtc 70 <210> 252 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2409 <400> 252 caggaccggt gcttgcagaa gcacttcatc acgagcacca cgcccaggaa gatgatcacg 60 aa 62 <210> 253 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2410 <400> 253 gcaggatggc gaacaggatg ccgaagatga tggggatcac gaccagagca ttcttggagt 60 caggggggtc 70 <210> 254 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2411 <400> 254 caggaccggt gcttgcagaa gcacttgatg aacaccagca ccagcaggat ggcgaacagg 60 atg 63 <210> 255 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2412 <400> 255 cttcggcgcc gtgattaccg tggtcgtgat cgtcgtgatt atcaggtccc agcaggaggc 60 cgccg 65 <210> 256 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2413 <400> 256 gtcatttcga atcatcagaa gaacttcttg gcggcggcct cctgctggga c 51 <210> 257 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2414 <400> 257 gtcatttcga atcatcacca ccacttcttg gcggcggcct cctgctggga c 51 <210> 258 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2415 <400> 258 ggtcatttcg aatcatcagg agcccttcag ggtcaggaac atgataatca cgacgatcac 60 gac 63 <210> 259 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1285 <400> 259 cggaagaatt cagccacagc tttaaggcac ctggctaac 39 <210> 260 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr1494 <400> 260 acgaactagt ccaccatgga aagcccagcc cagctgctgt tcctgctgct gctgtggctg 60 cccgac 66 <210> 261 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2294 <400> 261 ctaccaagct ttcatcattt acccggagac agggagaggc tcttctgcgt gtagtggttg 60 tgcaaggcct cg 72 <210> 262 <211> 432 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq80 <400> 262 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatc tgtggacgac catcaccatc ttcatcacac 360 tcttcctgtt aagcgtgtgc tacagtgcca ccgtcacctt cttcaaggtg aagtgcttct 420 gcaagcaccg gt 432 <210> 263 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq81 <400> 263 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatc tgtggacgac catcaccatc ttcatcacac 360 tcttcctgtt aagcgtgtgc tacagtgcca ccgtcacctt cttcaaggtg aagtggatct 420 tctcctcggt ggtggacctg aagcagacca tcatccccga ctacaggaac atgatcggac 480 agggggccta gtgattcgaa 500 <210> 264 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq82 <400> 264 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcagagctg caaccggtgg 300 agagctgtgc ggaggcgcag gacggggagc tggacgggct gtggacgacc atcaccatct 360 tcatcacact cttcctgtta agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga 420 agtgcttctg caagcaccgg tcctgcttcc ggcggaacga ggcctccaga gagacaaaca 480 actccctgac cttcggcccc gaggaagccc tggctgagca gaccgtgttt ctgtagtgat 540 tcgaa 545 <210> 265 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq83 <400> 265 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatc tgatcattgc cctgcctgtg gccgtgctgc 360 tgatcgtggg aggcctcgtg atcatgctgt acgtgttcca caagtgcttc tgcaagcacc 420 ggt 423 <210> 266 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq84 <400> 266 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatg gaatcgtggc tggactggct gtgctggccg 360 tggtcgtgat tggagctgtg gtggccgccg tgatgtgcag aaagtgcttc tgcaagcacc 420 ggt 423 <210> 267 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq85 <400> 267 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatg gcctgctgat cggcatctcc atcgcctccc 360 tgtgcctggt ggtggccctg ctggccctgc tgtgccacct gaagtgcttc tgcaagcacc 420 ggt 423 <210> 268 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq86 <400> 268 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatc tgctgctggg cgtgtccgtg tcctgcatcg 360 tgatcctggc cgtgtgcctg ctgtgctacg tgtccatcac caagtgcttc tgcaagcacc 420 ggt 423 <210> 269 <211> 420 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq87 <400> 269 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaata ccaacaccgt gggctccgtg atcggcgtga 360 tcgtgaccat cttcgtgtcc ggcaccgtgt acttcatcaa gtgcttctgc aagcaccggt 420 <210> 270 <211> 402 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq88 <400> 270 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatg tgctggccct gatcgtgatc ttcctgacca 360 tcgccgtgct gctggccctg aagtgcttct gcaagcaccg gt 402 <210> 271 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq89 <400> 271 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatt tcttcatccc cctgctggtg gtgatcctgt 360 tcgccgtgga caccggcctg ttcatcaagt gcttctgcaa gcaccggt 408 <210> 272 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq90 <400> 272 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaata tcctgatcgg cacctccgtg gtgatcatcc 360 tgttcatcct gctgttcttc ctgctgaagt gcttctgcaa gcaccggt 408 <210> 273 <211> 429 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq91 <400> 273 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatg tgatgtccgt ggccaccatc gtgatcgtgg 360 acatctgcat caccggcggc ctgctgctgc tggtgtacta ctggtccaag tgcttctgca 420 agcaccggt 429 <210> 274 <211> 429 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq92 <400> 274 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatg ccatccccat ctggtgggtg ctggtgggcg 360 tgctgggcgg cctgctgctg ctgaccatcc tggtgctggc catgtggaag tgcttctgca 420 agcaccggt 429 <210> 275 <211> 432 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq93 <400> 275 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaatt tctgggtgct ggtggtggtg ggcggcgtgc 360 tggcctgcta ctccctgctg gtgaccgtgg ccttcatcat cttctgggtg aagtgcttct 420 gcaagcaccg gt 432 <210> 276 <211> 420 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq94 <400> 276 atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60 caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120 ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180 gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240 ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300 cccccgagga cccccctgac tccaagaata tcaccctgat catcttcggc gtgatggccg 360 gcgtgatcgg caccatcctg ctgatctcct acggcatcaa gtgcttctgc aagcaccggt 420 <210> 277 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq95 <400> 277 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca tgttcctgac cctgaagggc 60 tccctgaagc agaggctgca ggtgatgatc cagccctccg aggacatcgt gaggcccgag 120 aacggccccg agcagcccca ggccggctcc tccgcctcca aggaggccta catctgatga 180 ttcgaa 186 <210> 278 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq96 <400> 278 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcttcgtggg caacaggttc 60 cagcagaagc tgaggtccgt gttcagggtg cccatcacct ggctgcaggg caagagggag 120 accatgtcct gcaggaagtc ctcctccctg agggagatgg acaccttcgt gtcctgatga 180 ttcgaa 186 <210> 279 <211> 165 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq97 <400> 279 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcttcgtggg caacaggttc 60 cagcagaagc tgaggtccgt gttcagggtg cccatcacct ggctgcaggg caagagggag 120 accatgtcct gcaggaagtc ctcctccctg aggtgatgat tcgaa 165 <210> 280 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq98 <400> 280 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca actcccacct gctgcccagg 60 cccctgaggc acctggcctg ctgcggcggc ccccagccca ggatgaggag gaggctgtcc 120 gacggctccc tgtcctccag gcacaccacc ctgctgacca ggtcctcctg ccccgccacc 180 ctgtccctgt ccctgtccct gaccctgtcc ggcaggccca ggcccgagga gtcccccagg 240 gacctggagc tggccgacgg cgagggcacc gccgagacca tcatcttctg atgattcgaa 300 <210> 281 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq99 <400> 281 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca actcccacga ggagtccccc 60 agggacctgg agctggccga cggcgagggc accgccgaga ccatcatctt ctgatgattc 120 gaa 123 <210> 282 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq100 <400> 282 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcatcaagct gaagcacacc 60 aagaagaggc agatctacac cgacatcgag atgaacaggc tgggcaagtg atgattcgaa 120 <210> 283 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> GeneArt_Seq101 <400> 283 ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcatcaagct gaagcacacc 60 aagaagaggc agatcgccgc cgccgccgcc gccaacaggc tgggcaagtg atgattcgaa 120 <210> 284 <211> 1064 <212> DNA <213> Artificial Sequence <220> <223> GSC11206 <400> 284 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600 aggcgcagga cggggagctg gacggggccc tgtggctggg cgtgctgaga ctgctgctgt 660 tcaagctgct cctgttcgac ctgctcctca agtggatctt ctcctcggtg gtggacctga 720 agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag tgattcgaaa 780 tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 840 atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 900 gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 960 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 1020 gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1064 <210> 285 <211> 70 <212> PRT <213> Artificial Sequence <220> <223> GSC11206 <400> 285 Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala 1 5 10 15 Gln Asp Gly Glu Leu Asp Gly Ala Leu Trp Leu Gly Val Leu Arg Leu 20 25 30 Leu Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Trp Ile Phe 35 40 45 Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro Asp Tyr Arg Asn 50 55 60 Met Ile Gly Gln Gly Ala 65 70 <210> 286 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> GSC314 <400> 286 Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Gln Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val 20 25 30 Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn 35 40 45 Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly 50 55 60 Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr 65 70 75 80 Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys 85 90 95 Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp 115 120 125 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys 130 135 140 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 145 150 155 160 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 165 170 175 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 180 185 190 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 195 200 205 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 210 215 220 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro 225 230 235 240 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 245 250 255 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 260 265 270 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 275 280 285 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 290 295 300 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 305 310 315 320 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 325 330 335 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 340 345 350 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 355 360 365 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn 370 375 380 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 385 390 395 400 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 405 410 415 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 420 425 430 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 435 440 445 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 450 455 460 Ser Leu Ser Pro Gly Lys 465 470 <210> 287 <211> 375 <212> DNA <213> Artificial Sequence <220> <223> GSC3836 <400> 287 ctgtctccgg gtaaatgatg aaagcttgcg gccgcgctta gcgatatcga attctctaga 60 ggtacccccg gggggcccct cgagttcgaa atgaccgacc aagcgacgcc caacctgcca 120 tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 180 cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 240 cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 300 acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 360 tcttatcatg tctgt 375 <210> 288 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> GSC3836 / GSC3848 <400> 288 Leu Ser Pro Gly Lys 1 5 <210> 289 <211> 884 <212> DNA <213> Artificial Sequence <220> <223> GSC3848 <400> 289 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag atattcgaaa 600 tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 660 atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 720 gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 780 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 840 gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 884 <210> 290 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> GSC3899 / GSC4398 / GSC4401 / GSC4402 <400> 290 Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala 1 5 10 15 Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile 20 25 30 Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe 35 40 45 Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile 50 55 60 Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala 65 70 75 <210> 291 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> GSC5854 / GSC5855 / GSC5857 / GSC5856 <400> 291 Leu Ser Leu Ser Pro Ala Glu Leu Gln Pro Val Glu Ala Leu Trp Leu 1 5 10 15 Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu 20 25 30 Leu Ala Ser Ala His His His His His His 35 40 <210> 292 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> GSC6030 / GSC6048 / GSC6047 / GSC6046 <400> 292 Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala 1 5 10 15 Gln Asp Gly Glu Leu Asp Ala Leu Trp Leu Gly Val Leu Arg Leu Leu 20 25 30 Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu Leu Thr Phe Phe Lys Val 35 40 45 Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro 50 55 60 Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala 65 70 <210> 293 <211> 78 <212> PRT <213> Artificial Sequence <220> <223> GSC7057 / GSC7058 / GSC7056 / GSC7059 / GSC9763 / GSC9764 / GSC9765 / GSC9768 / GSC9770 / GSC9949 / GSC9950 <400> 293 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Ile Thr 20 25 30 Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser 35 40 45 Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr 50 55 60 Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 <210> 294 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> GSC315 <400> 294 atggagagcc ctgcccagct gctgttcctg ctgctgctgt ggctgcctga cggagtccat 60 gccgacatcc agatgaccca gtccccctcc agcctgtctg cctccgtggg cgaccgggtg 120 accatcacct gccgggcctc ccaggacgtg aacaccgccg tggcctggta tcagcagaag 180 cctggcaagg cccctaagct gctgatctac tccgcctcct tcctgtactc cggcgtgcct 240 tcccggttct ccggctcccg gtccggcacc gacttcaccc tgaccatctc ctccctgcag 300 cctgaggact tcgccaccta ctactgccag cagcactaca ccacccctcc taccttcggc 360 cagggcacca aggtggagat caagcggacc gtggccgctc cttccgtgtt catcttccct 420 ccctccgacg agcagctgaa gagcggcacc gccagcgtgg tgtgcctgct gaacaacttt 480 taccctcggg aggccaaggt gcagtggaag gtggacaacg ccctgcagtc cggcaactcc 540 caggaatccg tcaccgagca ggactccaag gacagcacct actccctgtc ctccaccctg 600 accctgtcca aggccgacta cgagaagcac aaggtgtacg cctgcgaggt gacccaccag 660 ggcctgtcca gccctgtgac caagtccttc aaccggggcg agtgctga 708 <210> 295 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> GSC315 <400> 295 Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Gly Val His Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 20 25 30 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln 35 40 45 Asp Val Asn Thr Ala Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala 50 55 60 Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro 65 70 75 80 Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile 85 90 95 Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His 100 105 110 Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 115 120 125 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 130 135 140 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 145 150 155 160 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 165 170 175 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 180 185 190 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 195 200 205 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 210 215 220 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 225 230 235 <210> 296 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> GSC5607 <400> 296 atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60 caggtgcagc tgcagcagtc tggcgccgaa ctggccagac caggcgccag cgtgaagatg 120 agctgcaagg ccagcggcta caccttcacc cggtacacca tgcactgggt gaaacagcgg 180 cctggacagg gcctggaatg gatcggctac atcaacccca gccggggcta caccaactac 240 aaccagaagt tcaaggacaa ggccaccctg accaccgaca agagcagcag caccgcctac 300 atgcagctga gcagcctgac cagcgaggac agcgccgtgt actactgcgc ccggtactac 360 gacgaccact actgcctgga ctactggggc cagggcacca ccctgaccgt gagcagcgcg 420 tcgaccaagg gccccagcgt gttcccgcta gcccccagca gcaagagcac cagcggcggc 480 acagccgccc tgggctgcct ggtgaaggac tacttccccg agcccgttac cgtgtcctgg 540 aactctggag ccctgacctc cggcgtgcac accttccccg ccgtgctcca gagcagcggc 600 ctgtacagcc tgagcagcgt ggtgacagtg cccagcagca gcctgggaac ccagacctac 660 atctgcaacg tgaaccacaa gcccagcaac accaaggtgg acaagaaggt ggagcccaag 720 agctgcgaca aaactcacac ctgcccaccc tgccctgccc ctgagctgct gggcggaccc 780 tccgtgttcc tgttcccccc caagcccaag gacaccctga tgatcagccg gacccccgag 840 gtgacctgcg tggtggtgga cgtgagccac gaggaccctg aggtgaagtt caattggtac 900 gtggacggcg tggaggtgca caacgccaag accaagcccc gggaggaaca gtacaacagc 960 acctaccggg tggtgtccgt gctgaccgtg ctgcaccagg actggctgaa cggcaaggaa 1020 tacaagtgca aggtctccaa caaggccctg cctgccccca tcgaaaagac catcagcaag 1080 gccaagggcc agccgcgcga accgcaggtg tacaccctgc cccccagccg ggaagagatg 1140 accaagaacc aggtgaaact ggtgtgcctg gtgacaggct tctaccccag cgatatcgcc 1200 gtggaatggg agagcagcgg ccagcctgag aacaactact acaccacccc ccccatgctg 1260 gacagcgacg gcagcttcag cctggtgtcc tggctgaacg tggacaagag ccggtggcag 1320 cagggcaaca tcttcagctg cagcgtgatg cacgaggccc tgcacaaccg gttcacccag 1380 aagtccctga gcctgagccc gggtaaacat caccatcacc atcactga 1428 <210> 297 <211> 475 <212> PRT <213> Artificial Sequence <220> <223> GSC5607 <400> 297 Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro 1 5 10 15 Gly Thr Asn Ala Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala 20 25 30 Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr 35 40 45 Phe Thr Arg Tyr Thr Met His Trp Val Lys Gln Arg Pro Gly Gln Gly 50 55 60 Leu Glu Trp Ile Gly Tyr Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr 65 70 75 80 Asn Gln Lys Phe Lys Asp Lys Ala Thr Leu Thr Thr Asp Lys Ser Ser 85 90 95 Ser Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala 100 105 110 Val Tyr Tyr Cys Ala Arg Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr 115 120 125 Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly 130 135 140 Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly 145 150 155 160 Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val 165 170 175 Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe 180 185 190 Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val 195 200 205 Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val 210 215 220 Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys 225 230 235 240 Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu 245 250 255 Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr 260 265 270 Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val 275 280 285 Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val 290 295 300 Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser 305 310 315 320 Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu 325 330 335 Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala 340 345 350 Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro 355 360 365 Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln 370 375 380 Val Lys Leu Val Cys Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala 385 390 395 400 Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Tyr Thr Thr 405 410 415 Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Ser Leu Val Ser Trp Leu 420 425 430 Asn Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser 435 440 445 Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser 450 455 460 Leu Ser Pro Gly Lys His His His His His His 465 470 475 <210> 298 <211> 469 <212> PRT <213> Artificial Sequence <220> <223> GSC5644 <400> 298 Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro 1 5 10 15 Gly Thr Asn Ala Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala 20 25 30 Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr 35 40 45 Phe Thr Arg Tyr Thr Met His Trp Val Lys Gln Arg Pro Gly Gln Gly 50 55 60 Leu Glu Trp Ile Gly Tyr Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr 65 70 75 80 Asn Gln Lys Phe Lys Asp Lys Ala Thr Leu Thr Thr Asp Lys Ser Ser 85 90 95 Ser Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala 100 105 110 Val Tyr Tyr Cys Ala Arg Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr 115 120 125 Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly 130 135 140 Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly 145 150 155 160 Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val 165 170 175 Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe 180 185 190 Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val 195 200 205 Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val 210 215 220 Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys 225 230 235 240 Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu 245 250 255 Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr 260 265 270 Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val 275 280 285 Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val 290 295 300 Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser 305 310 315 320 Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu 325 330 335 Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala 340 345 350 Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro 355 360 365 Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln 370 375 380 Val Lys Leu Val Cys Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala 385 390 395 400 Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Tyr Thr Thr 405 410 415 Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Ser Leu Val Ser Trp Leu 420 425 430 Asn Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser 435 440 445 Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser 450 455 460 Leu Ser Pro Gly Lys 465 <210> 299 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> GSC5537 <400> 299 Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala 1 5 10 15 Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile 20 25 30 Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe 35 40 45 Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile 50 55 60 Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala 65 70 75 <210> 300 <211> 495 <212> PRT <213> Artificial Sequence <220> <223> GSC5608 <400> 300 Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro 1 5 10 15 Gly Thr Asn Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val 20 25 30 Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn 35 40 45 Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly 50 55 60 Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr 65 70 75 80 Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys 85 90 95 Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp 115 120 125 Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr 145 150 155 160 Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile 165 170 175 Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala Val Ala Trp Tyr Gln 180 185 190 Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe 195 200 205 Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr 210 215 220 Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr 225 230 235 240 Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly 245 250 255 Thr Lys Val Glu Ile Lys Arg Gly Gly Gly Gly Thr Asp Lys Thr His 260 265 270 Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val 275 280 285 Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr 290 295 300 Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu 305 310 315 320 Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys 325 330 335 Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser 340 345 350 Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys 355 360 365 Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile 370 375 380 Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Glu Val Ala Thr Phe Pro 385 390 395 400 Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Thr Leu Val Cys Leu 405 410 415 Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn 420 425 430 Gly Gln Pro Glu Asn Asn Tyr Lys Thr Asp Pro Pro Leu Leu Glu Ser 435 440 445 Asp Gly Ser Phe Ala Leu Ser Ser Arg Leu Arg Val Asp Lys Ser Arg 450 455 460 Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu 465 470 475 480 His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 485 490 495 <210> 301 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> GSC5538 <400> 301 Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala 1 5 10 15 Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile 20 25 30 Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe 35 40 45 Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile 50 55 60 Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala 65 70 75 <210> 302 <211> 702 <212> DNA <213> Artificial Sequence <220> <223> GSC5540 <400> 302 atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60 cagattgtgc tgacccagag ccccgccatc atgtctgcca gccctggcga gaaagtgacc 120 atgacctgca gcgccagcag cagcgtgtcc tacatgaact ggtatcagca gaagtccggc 180 accagcccca agcggtggat ctacgacacc agcaagctgg cctccggcgt gcccgcccac 240 tttagaggca gcggcagcgg cacctcctac tccctgacca tcagcggcat ggaagccgag 300 gacgccgcca cctactactg ccagcagtgg tccagcaacc ccttcacctt cggctccggc 360 accaaactgg aaattaaccg tacggtggcc gctcccagcg tgttcatctt cccccccagc 420 gacgagcagc tgaagagcgg caccgcctcc gtggtgtgcc tgctgaacaa cttctacccc 480 cgggaggcca aggtgcagtg gaaggtggac aacgccctcc agagcggcaa cagccaggaa 540 agcgtcaccg agcaggacag caaggactcc acctacagcc tgagcagcac cctgaccctg 600 agcaaggccg actacgagaa gcacaaggtg tacgcctgcg aggtgaccca ccagggcctg 660 tccagccccg tgaccaagag cttcaaccgg ggcgagtgct ga 702 <210> 303 <211> 233 <212> PRT <213> Artificial Sequence <220> <223> GSC5540 <400> 303 Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro 1 5 10 15 Gly Thr Asn Ala Gln Ile Val Leu Thr Gln Ser Pro Ala Ile Met Ser 20 25 30 Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser 35 40 45 Val Ser Tyr Met Asn Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys 50 55 60 Arg Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ala His 65 70 75 80 Phe Arg Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Gly 85 90 95 Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser 100 105 110 Asn Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Asn Arg Thr 115 120 125 Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu 130 135 140 Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro 145 150 155 160 Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly 165 170 175 Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr 180 185 190 Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His 195 200 205 Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val 210 215 220 Thr Lys Ser Phe Asn Arg Gly Glu Cys 225 230 <210> 304 <211> 1522 <212> DNA <213> Artificial Sequence <220> <223> GSC281 <400> 304 gaattgtacc tgcccgtaca taaggtcaat aggggtgaat caacggaaaa gtcccattgg 60 agccaagtac actgcgtcaa tagggacttt ccattgggtt ttgcccagta cataaggtca 120 ataggggatg agtcaatggg aaaaacccat tggagccaag tacactgact caatagggac 180 tttccattgg gttttgccca gtacataagg tcaatagggg gtgagtcaac aggaaagttc 240 cattggagcc aagtacattg agtcaatagg gactttccaa tgggttttgc ccagtacata 300 aggtcaatgg gaggtaagcc aatgggtttt tcccattact ggcacgtata ctgagtcatt 360 agggactttc caatgggttt tgcccagtac ataaggtcaa taggggtgaa tcaacaggaa 420 agtcccattg gagccaagta cactgagtca atagggactt tccattgggt tttgcccagt 480 acaaaaggtc aatagggggt gagtcaatgg gtttttccca ttattggcac gtacataagg 540 tcaatagggg tgagtcattg ggtttttcca gccaatttaa ttaaaacgcc atgtactttc 600 ccaccattga cgtcaatggg ctattgaaac taatgcaacg tgacctttaa acggtacttt 660 cccatagctg attaatggga aagtaccgtt ctcgagccaa tacacgtcaa tgggaagtga 720 aagggcagcc aaaacgtaac accgccccgg ttttccctgg aaattccata ttggcacgca 780 ttctattggc tgagctgcgt tcacgtgggt ataagcagag ctcgtttagt gaaccgtcag 840 atcgcctgga gacgccatcc acgctgtttt gacctccata gaagacaccg ggaccgatcc 900 agcctccgcg gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta 960 agtaccgcct atagagtcta taggcccacc cccttggctt cttatgcgac ggatcccgta 1020 ctatgaggtg tggcaggctt gagatctggc catacacttg agtgacaatg acatccactt 1080 tgcctttctc tccacaggtg tccactccca cgtccaactg cagctcggtt cgatcgataa 1140 ttaattaagc tagcggcgcc gttaacaccg gttgatcaaa gcttgcggcc gcgcttagcg 1200 atatcgaatt ctctagaggt acccccgggg ggcccctcga gttcgaaatg accgaccaag 1260 cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 1320 gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 1380 tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 1440 atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 1500 ccaaactcat caatgtatct ta 1522 <210> 305 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> GSC3469 <400> 305 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 tatcatgtct gt 132 <210> 306 <211> 470 <212> DNA <213> Artificial Sequence <220> <223> GSC23 <400> 306 cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 60 cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 120 gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 180 tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 240 ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac 300 ctctagctag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 360 gctcacaatt ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc 420 cagagtaacc ttttttttta atttttattt tattttattt ttgagatcag 470 <210> 307 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> GSC4340 <400> 307 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac cgagacctga ggggacag 528 <210> 308 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> GSC4222 <400> 308 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac cctgtcctta ttgcacag 528 <210> 309 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> GSC2617 <400> 309 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac cctgggagga ttgcacag 528 <210> 310 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> GSC4335 <400> 310 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac cgtctccttc tgggacag 528 <210> 311 <211> 546 <212> DNA <213> Artificial Sequence <220> <223> GSC2332 <400> 311 ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60 ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120 acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180 cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240 aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300 cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360 acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420 cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480 tgccccacag ctttaaggca cctggctaac ctctgcgctt cttcccttcc ctgctacctg 540 gctcag 546 <210> 312 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2160 <400> 312 ccaagctttc atcatttgcc cggagacagg gagagg 36 <210> 313 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2161 <400> 313 ccaagctttc atcatttacc gggagacagg gagaggctct tc 42 <210> 314 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2162 <400> 314 gtcctcgggg ggagatccac caccacctgt cccagaagga gacggttag 49 <210> 315 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2163 <400> 315 gtcctcgggg ggagatccac caccacctgt gcaatcctcc cagggttag 49 <210> 316 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2164 <400> 316 gtcctcgggg ggagatccac caccacctgt gcaataagga cagggttag 49 <210> 317 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2165 <400> 317 gtcctcgggg ggagatccac caccacctgt cccctcaggt ctcggttag 49 <210> 318 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer GlnPr2166 <400> 318 gtcctcgggg ggagatccac caccacctga gccaggtagc agggaaggg 49 <210> 319 <211> 705 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC3704 <400> 319 atggaaagcc cagcccagct gctgttcctg ctgctgctgt ggctgcccga cggggtgcac 60 gctgagatcg tgctgacaca gagccccgcc accctgtctc tgagccctgg cgaaagagcc 120 accctgagct gtagagccag cagcagcgtg tcctacatgc actggtatca gcagaagccc 180 ggccaggcgc cgcgcccgtg gatttatgcg accagcaatc gggccacagg catccctgcc 240 agattttctg gcagcggctc cggcaccgac tacaccctga ccatctccag cctggaaccc 300 gaggacttcg ccgtgtacta ctgccagcag tggtccagca acccctggac atttggccag 360 ggcaccaaag tggaaattaa acgtacggtg gccgctccca gcgtgttcat cttccccccc 420 agcgacgagc agctgaagag cggcaccgcc tccgtggtgt gcctgctgaa caacttctac 480 ccccgggagg ccaaggtgca gtggaaggtg gacaacgccc tccagagcgg caacagccag 540 gaaagcgtca ccgagcagga cagcaaggac tccacctaca gcctgagcag caccctgacc 600 ctgagcaagg ccgactacga gaagcacaag gtgtacgcct gcgaggtgac ccaccagggc 660 ctgtccagcc ccgtgaccaa gagcttcaac cggggcgagt gctga 705 <210> 320 <211> 234 <212> PRT <213> Artificial Sequence <220> <223> Construct GSC3704 <400> 320 Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Gly Val His Ala Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu 20 25 30 Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Ser 35 40 45 Ser Val Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro 50 55 60 Arg Pro Trp Ile Tyr Ala Thr Ser Asn Arg Ala Thr Gly Ile Pro Ala 65 70 75 80 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Ser 85 90 95 Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Trp Ser 100 105 110 Ser Asn Pro Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg 115 120 125 Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln 130 135 140 Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr 145 150 155 160 Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser 165 170 175 Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr 180 185 190 Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys 195 200 205 His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro 210 215 220 Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 225 230 <210> 321 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC10488 <400> 321 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 322 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> Construct GSC10488 <400> 322 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His 35 40 45 Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser 50 55 60 Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 80 <210> 323 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> Construct GSC10487 <400> 323 ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300 tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360 ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420 ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480 gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540 tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600 cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660 tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720 acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780 agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840 cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900 gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960 ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020 caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080 cttatcatgt ctgt 1094 <210> 324 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> Construct GSC10487 <400> 324 Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro 1 5 10 15 Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val 20 25 30 Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His 35 40 45 Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser 50 55 60 Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu 65 70 75 80 <210> 325 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> GlnPr1487 <400> 325 ctgctgctgt ggctgcccga cggggtgcac gctgagatcg tgctgacaca gag 53 <210> 326 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> GlnPr1491 <400> 326 ccaaatcgat ttatcagcac tcgccccggt tgaag 35 <210> 327 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> GlnPr1452 <400> 327 acgtatcgat tcatcacttg ccgggggaca g 31 <210> 328 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> GlnPr1488 <400> 328 ctgctgctgt ggctgcccga cggggtgcac gctcaggtca cactgaaaga gtc 53 <210> 329 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His <400> 329 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300 gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360 aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420 ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540 ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600 agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660 ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720 ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780 acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840 cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900 ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960 ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020 ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080 tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtgat cgtcgtgatt 1140 atcgccagcg cccatcacca ccaccatcat tgatgatgat tcgaaatgac cgaccaagcg 1200 acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc 1260 ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg 1320 gagttcttcg cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat 1380 agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc 1440 aaactcatca atgtatctta tcatgtctgt 1470 <210> 330 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His <400> 330 Leu Ser Leu Ser Arg Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp 1 5 10 15 Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val 20 25 30 Ile Val Val Ile Ile Ala Ser Ala His His His His His His 35 40 45 <210> 331 <211> 1135 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His <400> 331 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720 atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780 cggcgccacc gtgatcgtcg tgattatcgc cagcgcccat caccaccacc atcattgatg 840 atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 900 cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 960 cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 1020 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 1080 actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgt 1135 <210> 332 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His <400> 332 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile 20 25 30 Val Val Ile Ile Ala Ser Ala His His His His His His 35 40 45 <210> 333 <211> 1123 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK <400> 333 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720 atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780 cggcgccacc gtgatcgtcg tgattatcaa gtgcttctgc aagtgatgat gattcgaaat 840 gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg ccgccttcta 900 tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc tccagcgcgg 960 ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt ataatggtta 1020 caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 1080 ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgt 1123 <210> 334 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK <400> 334 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile 20 25 30 Val Val Ile Ile Lys Cys Phe Cys Lys 35 40 <210> 335 <211> 1141 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His <400> 335 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720 atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780 cggcgccacc gtggtcgtga tcgtcgtgat tatcgccagc gcccatcacc accaccatca 840 ttgatgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga 900 ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg 960 gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat 1020 tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 1080 tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 1140 t 1141 <210> 336 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His <400> 336 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val 20 25 30 Val Ile Val Val Ile Ile Ala Ser Ala His His His His His His 35 40 45 <210> 337 <211> 1129 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK <400> 337 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420 tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480 cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540 gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600 gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660 ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720 atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780 cggcgccacc gtggtcgtga tcgtcgtgat tatcaagtgc ttctgcaagt gatgatgatt 840 cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 900 cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 960 gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 1020 tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 1080 ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 1129 <210> 338 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK <400> 338 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val 20 25 30 Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys 35 40 <210> 339 <211> 1458 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK <400> 339 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300 gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360 aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420 ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540 ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600 agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660 ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720 ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780 acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840 cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900 ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960 ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020 ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080 tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtgat cgtcgtgatt 1140 atcaagtgct tctgcaagtg atgatgattc gaaatgaccg accaagcgac gcccaacctg 1200 ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt 1260 ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc 1320 caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 1380 ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 1440 gtatcttatc atgtctgt 1458 <210> 340 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK <400> 340 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile 20 25 30 Val Val Ile Ile Lys Cys Phe Cys Lys 35 40 <210> 341 <211> 1476 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His <400> 341 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300 gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360 aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420 ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540 ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600 agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660 ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720 ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780 acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840 cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900 ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960 ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020 ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080 tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtggt cgtgatcgtc 1140 gtgattatcg ccagcgccca tcaccaccac catcattgat gatgattcga aatgaccgac 1200 caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg 1260 ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc 1320 atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa 1380 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 1440 ttgtccaaac tcatcaatgt atcttatcat gtctgt 1476 <210> 342 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His <400> 342 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val 20 25 30 Val Ile Val Val Ile Ile Ala Ser Ala His His His His His His 35 40 45 <210> 343 <211> 1464 <212> DNA <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK <400> 343 ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60 ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120 cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180 cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240 caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300 gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360 aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420 ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540 ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600 agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660 ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720 ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780 acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840 cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900 ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960 ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020 ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080 tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtggt cgtgatcgtc 1140 gtgattatca agtgcttctg caagtgatga tgattcgaaa tgaccgacca agcgacgccc 1200 aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga 1260 atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc 1320 ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1380 acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1440 atcaatgtat cttatcatgt ctgt 1464 <210> 344 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK <400> 344 Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser 1 5 10 15 Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val 20 25 30 Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys 35 40 <210> 345 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Splice donor consensus <400> 345 maggtragt 9 <210> 346 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Splice acceptor consensus <220> <221> misc_feature <222> (7)..(7) <223> poly (Y) tract comprising at least 15 nucleotides and an abundance of pyrimidine (C or T) bases <220> <221> misc_feature <222> (8)..(8) <223> n is a, c, g, or t <400> 346 ctrayynnca gg 12 <210> 347 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Branch Point Consensus <400> 347 ctrayy 6

Claims (18)

  1. 5'에서 3' 방향으로
    프로모터;
    관심 폴리펩티드를 암호화하는 제1 엑손;
    스플라이스 공여 부위, 인트론 및 스플라이스 수용 부위(여기에서 제1 정지 코돈이 상기 인트론 내의 스플라이스 공여 부위와 스플라이스 수용 부위 사이에 위치한다);
    변형된 면역글로불린 막관통 영역 또는 변형되거나 변형되지 않은 비-면역글로불린 막관통 영역 중에서 선택된 막관통 영역을 암호화하는 제2 엑손;
    제2 정지 코돈; 및
    폴리(A) 부위
    를 포함하는 발현 구조물로,
    숙주 세포에 진입시, 상기 제1 및 제2 엑손의 전사가 상기 관심 폴리펩티드의 발현 및 상기 숙주 세포막상의 상기 관심 폴리펩티드의 일부의 표면 디스플레이를 생성시키는 발현 구조물.
  2. 제1항에 있어서,
    막관통 영역이 17 내지 29개 잔기, 바람직하게는 19 내지 26개 잔기 및 가장 바람직하게는 21 내지 24개 잔기를 포함하는 발현 구조물.
  3. 제1항 또는 제2항에 있어서,
    비-면역글로불린 막관통 영역이 인간 혈소판-유래된 성장인자 수용체(PDGFR), 인간 아시알로당단백질 수용체, 인간 및 쥐 B7-1, 인간 ICAM-1, 인간 erbb1, 인간 erbb2, 인간 erbb3, 인간 erbb4, 인간 섬유아세포 성장인자 수용체, 예를 들어 FGFR1, FGFR2, FGFR3, FGFR4, 인간 VEGFR-1, 인간 VEGFR-2, 인간 에리트로포이에틴 수용체, 인간 PRL-R, 프로락틴 수용체, 인간 EphA1, 에프린 A형 수용체 1, 인간 인슐린, IGF-1 수용체, 인간 수용체-유사 단백질 티로신 포스파타제, 인간 뉴로필린, 인간 주요 조직적합성 복합체 부류 II(알파 및 베타쇄), 인간 인테그린(알파 및 베타 패밀리), 인간 신데칸, 인간 마이엘린 단백질, 인간 카데린, 인간 시냅토브레빈-2, 인간 글리코포린-A, 인간 Bnip3, 인간 APP, 아밀로이드 전구체 단백질, 인간 T-세포 수용체 알파 및 베타, CD3 감마, CD3 델타, CD3 제타, 및 CD3 입실론의 막관통 영역으로 이루어지는 그룹 중에서 선택되는 발현 구조물.
  4. 제1항에 있어서,
    비-면역글로불린 막관통 영역이 쥐 B7-1 막관통 영역(서열번호 173), ACLV1(서열번호 174), ANTR2(서열번호 175), CD4(서열번호 176), PTPRM(서열번호 177), TNR5(서열번호 178), ITB1(서열번호 179), IGF1R(서열번호 181), 1B07(서열번호 180), TRMB(서열번호 182), IL4RA(서열번호 183), LRP6(서열번호 184), GpA(서열번호 185), PTCRA(서열번호 186)인 발현 구조물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    인트론이 폴리(A) 부위를 포함하는 발현 구조물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    인트론의 스플라이스 수용 부위가 폴리(Y) 트랙을 포함하고 상기 폴리(Y) 트랙의 Y 함량이 상기 트랙내 피리미딘 염기 수의 변경에 의해 변형되는 발현 구조물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    적어도 하나의 분지점 영역을 포함하고, 상기 적어도 하나의 분지점 영역의 서열이 분지점 영역 컨센서스 서열 CTRAYY(서열번호 347)에 관하여 변형되는 발현 구조물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    인트론의 스플라이스 공여 부위의 컨센서스 서열이 변형된 발현 구조물.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    관심 폴리펩티드가 항체 중쇄 또는 그의 단편을 포함하는 발현 구조물.
  10. 제1항 내지 제9항 중 어느 한 항에 따른 발현 구조물을 암호화하는 폴리뉴클레오티드.
  11. 제10항에 따른 하나 이상의 폴리뉴클레오티드를 포함하는 클로닝 또는 발현 벡터.
  12. 제11항에 따른 하나 이상의 클로닝 또는 발현 벡터를 포함하는 숙주 세포.
  13. 제12항에 있어서,
    항체 중쇄의 발현을 위한 제9항의 발현 구조물을 암호화하는 폴리뉴클레오티드를 포함하는 발현 벡터 및 항체 경쇄의 발현을 위한 발현 구조물을 암호화하는 폴리뉴클레오티드를 포함하는 발현 벡터를 포함하는 숙주 세포.
  14. 제12항에 있어서,
    항체 중쇄의 발현을 위한 제9항의 발현 구조물을 암호화하는 폴리뉴클레오티드를 포함하는 발현 벡터, scFv-Fc의 발현을 위한 제8항의 발현 구조물을 암호화하는 폴리뉴클레오티드를 포함하는 발현 벡터 및 항체 경쇄의 발현을 위한 발현 구조물을 암호화하는 폴리뉴클레오티드를 포함하는 발현 벡터를 포함하는 숙주 세포.
  15. 제12항 내지 제14항 중 어느 한 항의 숙주 세포(들)를 배양물 중에서 배양하고 상기 배양물로부터 발현된 폴리펩티드를 단리함을 포함하는 폴리펩티드의 생성 방법.
  16. 관심 폴리펩티드를 발현하는 숙주 세포(들)의 선택 방법으로서,
    (i) 숙주 세포(들)를 제1항의 발현 구조물로 형질감염시키고;
    (ii) 상기 숙주 세포(들)를 상기 관심 폴리펩티드의 발현에 적합한 조건하에서 배양하고;
    (iii) 상기 관심 폴리펩티드의 세포막 발현을 검출하고;
    (iv) 상기 세포막의 표면상에 상기 관심 폴리펩티드를 목적하는 발현 수준으로 디스플레이하는 숙주 세포(들)를 선택함
    을 포함하는 방법.
  17. 이종다량체성 관심 폴리펩티드를 발현하는 숙주 세포(들)의 선택 방법으로서,
    (i) 숙주 세포(들)를 적어도 제1 관심 폴리펩티드를 암호화하는 제1항의 발현 구조물 및 제2 관심 폴리펩티드를 암호화하는 제1항의 발현 구조물로 동시-형질감염시키고;
    (ii) 상기 숙주 세포(들)를 상기 이종다량체성 관심 폴리펩티드의 발현에 적합한 조건하에서 배양하고;
    (iii) 상기 이종다량체성 관심 폴리펩티드의 세포막 발현을 검출하고;
    (iv) 상기 세포막의 표면상에 목적하는 상기 이종다량체성 관심 폴리펩티드를 목적하는 발현 수준으로 디스플레이하는 숙주 세포(들)를 선택함
    을 포함하는 방법.
  18. 이중특이성 항체를 발현하는 숙주 세포(들)의 선택 방법으로서,
    (i) 숙주 세포(들)를 항체 중쇄를 암호화하는 제1항의 발현 구조물, scFv-Fc를 암호화하는 제1항의 발현 구조물 및 항체 경쇄를 암호화하는 발현 구조물로 동시-형질감염시키고;
    (ii) 상기 숙주 세포(들)를 상기 이중특이성 항체의 발현에 적합한 조건하에서 배양하고;
    (iii) 상기 이중특이성 항체의 세포막 발현을 검출하고;
    (iv) 상기 세포막의 표면상에 목적하는 상기 이중특이성 항체를 목적하는 발현 수준으로 디스플레이하는 숙주 세포(들)를 선택함
    을 포함하는 방법.

KR1020167026968A 2014-02-28 2015-03-02 폴리펩티드를 발현하는 숙주 세포의 선택을 위한 발현 구조물 및 방법 KR20160135738A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14157324 2014-02-28
EP14157324.6 2014-02-28
PCT/EP2015/054331 WO2015128509A1 (en) 2014-02-28 2015-03-02 Expression constructs and methods for selecting host cells expressing polypeptides

Publications (1)

Publication Number Publication Date
KR20160135738A true KR20160135738A (ko) 2016-11-28

Family

ID=50184819

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167026968A KR20160135738A (ko) 2014-02-28 2015-03-02 폴리펩티드를 발현하는 숙주 세포의 선택을 위한 발현 구조물 및 방법

Country Status (15)

Country Link
US (2) US20170350886A1 (ko)
EP (1) EP3110950B1 (ko)
JP (1) JP7008406B2 (ko)
KR (1) KR20160135738A (ko)
CN (1) CN106255752A (ko)
AU (1) AU2015222065B2 (ko)
BR (1) BR112016019832A2 (ko)
CA (1) CA2940880C (ko)
EA (1) EA035266B1 (ko)
IL (1) IL247491A0 (ko)
MA (1) MA39502A (ko)
MX (1) MX2016011194A (ko)
NZ (1) NZ723624A (ko)
SG (2) SG10201913396RA (ko)
WO (1) WO2015128509A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017005923A1 (en) * 2015-07-09 2017-01-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) Lentiviral vector expressing membrane-anchored or secreted antibody
EP3463396A1 (en) * 2016-06-07 2019-04-10 Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft Chimeric antigen receptor and car-t cells that bind bcma
AU2018262156A1 (en) * 2017-05-02 2019-11-28 Alligator Bioscience Ab Bispecific antibody against OX40 and CTLA-4
WO2019169071A1 (en) * 2018-03-01 2019-09-06 University Of Washington Transmembrane polypeptides
CN112739713A (zh) * 2018-06-25 2021-04-30 华盛顿大学 有力的且选择性的白介素模拟物的从头设计
MX2021015193A (es) * 2019-06-28 2022-01-18 Hoffmann La Roche Metodo para la produccion de un anticuerpo.
EP4366836A2 (en) * 2021-07-08 2024-05-15 Medic Life Sciences Inc. High-throughput screening system for identification of novel drugs and drug targets
CN113881701B (zh) * 2021-09-08 2024-04-19 山东大学 一种阳性转染细胞亲和分选方法及试剂盒

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2208792B1 (en) * 2006-05-17 2015-05-06 Hoffmann-La Roche AG Polypeptide producing cells
WO2009059235A2 (en) * 2007-11-01 2009-05-07 Facet Biotech Corporation Immunoglobulin display vectors
WO2009151605A1 (en) * 2008-06-11 2009-12-17 Jn Biosciences Llc Expression vectors
WO2014126254A1 (ja) * 2013-02-18 2014-08-21 協和発酵キリン株式会社 膜結合型タンパク質発現ベクター

Also Published As

Publication number Publication date
EP3110950B1 (en) 2022-09-21
BR112016019832A2 (pt) 2017-10-17
JP7008406B2 (ja) 2022-01-25
SG11201607114VA (en) 2016-09-29
CA2940880A1 (en) 2015-09-03
MX2016011194A (es) 2017-04-06
EA035266B1 (ru) 2020-05-22
NZ723624A (en) 2022-07-29
US20170350886A1 (en) 2017-12-07
AU2015222065B2 (en) 2021-05-20
EA201691548A1 (ru) 2017-02-28
CN106255752A (zh) 2016-12-21
MA39502A (fr) 2015-09-03
SG10201913396RA (en) 2020-03-30
US20190056396A1 (en) 2019-02-21
WO2015128509A1 (en) 2015-09-03
IL247491A0 (en) 2016-11-30
EP3110950A1 (en) 2017-01-04
JP2017508459A (ja) 2017-03-30
CA2940880C (en) 2023-09-26
AU2015222065A1 (en) 2016-09-15

Similar Documents

Publication Publication Date Title
KR20160135738A (ko) 폴리펩티드를 발현하는 숙주 세포의 선택을 위한 발현 구조물 및 방법
CN107406508B (zh) 人源化的抗trop-2单克隆抗体及其应用
KR102272932B1 (ko) 이종 유전자로 무장된 종양살상 아데노바이러스
RU2747011C2 (ru) Общие легкие цепи и способы их применения
CN109206517B (zh) St2抗原结合蛋白
CN109071652B (zh) 包含tnf家族配体三聚体和生腱蛋白结合模块的抗原结合分子
KR102208698B1 (ko) 신생아 Fc 수용체에 대해 향상된 결합을 지니는 변이체 Fc-폴리펩타이드
AU2017385274B2 (en) Fusion protein including BDNF
KR20170036796A (ko) Sirp-알파 면역글로불린 융합 단백질
KR20180053322A (ko) Cd3 결합 폴리펩타이드
KR20150004856A (ko) Cd3 결합 폴리펩타이드
KR20140034310A (ko) 이중특이적 t 세포 활성화 항원 결합 분자
KR20150041626A (ko) 아시알로당단백질 수용체 항체 및 이의 용도
KR20140091031A (ko) 저밀도 지단백질-관련 단백질 6 (lrp6) - 반감기 연장제 구축물
KR20180134894A (ko) 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법
KR20190141655A (ko) 종양 형질도입용 조성물 및 방법
KR102659872B1 (ko) 안지오포이에틴-유사 4 항체 및 사용 방법
CN110753552B (zh) 用于降低嵌合Notch受体的免疫原性的方法和组合物
AU2019236586B2 (en) Expression constructs and methods for expressing polypeptides in eukaryotic cells
JP2024016181A (ja) 所定の構成の複数の発現カセットの標的指向性組込みによって多価二重特異性抗体発現細胞を作製するための方法
KR20230066552A (ko) 항체-다량체-융합체의 발현 방법
TW202241943A (zh) Tau特異性抗體基因療法組合物、方法及其用途
KR20230059789A (ko) 항-가변 muc1* 항체 및 이의 용도
KR101718764B1 (ko) 항체 발현용 바이시스트로닉 발현벡터 및 이를 이용한 항체의 생산 방법
KR20230105972A (ko) 혈관신생 억제제가 결합된 항-C3b 항체 또는 항-C5 항체 및 이의 용도

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application