KR102390716B1 - 코리스메이트-유도된 산물의 생산을 위한 유전적으로 조작된 미생물들 - Google Patents

코리스메이트-유도된 산물의 생산을 위한 유전적으로 조작된 미생물들 Download PDF

Info

Publication number
KR102390716B1
KR102390716B1 KR1020177033776A KR20177033776A KR102390716B1 KR 102390716 B1 KR102390716 B1 KR 102390716B1 KR 1020177033776 A KR1020177033776 A KR 1020177033776A KR 20177033776 A KR20177033776 A KR 20177033776A KR 102390716 B1 KR102390716 B1 KR 102390716B1
Authority
KR
South Korea
Prior art keywords
leu
gly
glu
ser
ala
Prior art date
Application number
KR1020177033776A
Other languages
English (en)
Other versions
KR20180002704A (ko
Inventor
제임스 브루스 야른턴 베렌도르프
마이클 쾨프케
로안 푸옹 트란
와이엇 에릭 엘런
Original Assignee
란자테크 엔지, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 란자테크 엔지, 인크. filed Critical 란자테크 엔지, 인크.
Publication of KR20180002704A publication Critical patent/KR20180002704A/ko
Application granted granted Critical
Publication of KR102390716B1 publication Critical patent/KR102390716B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/04Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/005Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/03Oxo-acid-lyases (4.1.3)
    • C12Y401/0304Chorismate lyase (4.1.3.40)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/99Other carbon-oxygen lyases (4.2.99)
    • C12Y402/99021Isochorismate lyase (4.2.99.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y504/00Intramolecular transferases (5.4)
    • C12Y504/04Intramolecular transferases (5.4) transferring hydroxy groups (5.4.4)
    • C12Y504/04002Isochorismate synthase (5.4.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y504/00Intramolecular transferases (5.4)
    • C12Y504/99Intramolecular transferases (5.4) transferring other groups (5.4.99)
    • C12Y504/99005Chorismate mutase (5.4.99.5)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 코리스메이트-유도된 산물들, 이를 테면 파라-히드록시벤조산, 살리실레이트, 2-아미노벤조에이트, 2,3-디히드록시벤조에이트그리고 4-히드록시시클로헥산 카르복실산을 생산하는 유전적으로 조작된 미생물과 그 방법을 제공한다. 전형적으로, 상기 미생물은 (a) 외생성 코리스메이트 피루베이트 분해효소, (b) 외생성 이소코리스메이트 합성효소, (c) 외생성 이소코리스메이트 피루베이트 분해효소, 그리고 (d) 파괴성 돌연변이를 포함하는 프레페네이트 합성효소중 적어도 하나를 포함한다.

Description

코리스메이트-유도된 산물의 생산을 위한 유전적으로 조작된 미생물들
관련 출원들에 대한 교차 참조
본 출원은 2015년 5월 27일자로 제출된 미국 가특허 출원 번호 62/167,101에 대해 우선권을 주장하며, 이 출원의 전문이 여기에 참고자료로 편입된다.
발명의 분야
본 발명은 미생물 발효, 구체적으로 가스 기질의 미생물 발효에 의한 코리스메이트(chorismate)-유도된 산물들을 만드는 방법 및 유전적으로 조작된 미생물들에 관한 것이다.
현재 당(sugar)이나 셀룰로오스-기반 공급공급원을 생산하기 위해 식품 또는 비-식품 작물을 사용하는 생물학적으로 생산된 화학 물질 상품은 토지 이용, 식량 확보, 공급 변동성 및 환경 문제와 관련된 단점을 가지고 있다.
일산화탄소 (CO) 및/또는 이산화탄소 (CO2) 및 수소 (H2)를 함유하는 가스를 다양한 연료 및 화학 물질로 전환시키는데 촉매 공정이 사용될 수 있다는 것은 오랫동안 인지되어 왔다. 그러나, 미생물은 또한 그러한 기체를 생물학적으로 연료 및 화학 물질로 전환시키는데 사용될 수도 있다. 생물학적 공정은 촉매 공정과 비교하여 더 높은 특이성, 더 높은 수율, 더 낮은 에너지 비용 및 중독에 대한 촉매의 더 큰 저항성을 포함한, 몇 가지 이점이 있다.
CO는 석탄, 오일 및 오일-유래 산물과 같은 유기 물질의 불완전 연소의 자유 에너지-풍부한 주요 부산물이다. 예를 들면, 호주의 철강 산업은 매년 50 만 톤 이상의 CO를 만들고, 이를 대기로 방출한다고 보고된 바 있다.
CO를 유일한 탄소원으로 하여 성장할 수 있는 미생물의 능력이 1903년에 처음 발견되었다. 이것은 나중에 자가영양성(autotrophic) 성장의 아세틸 코엔자임 A (아세틸-CoA) 생화학적 경로를 사용하는 미생물의 특성으로 확인되었는데, 이것은 우드-융둘 (Wood-Ljungdahl) 경로로도 알려져 있다. 일산화탄소영양성광합성, 메탄생성 및 초산생성 미생물을 비롯한 많은 수의 혐기성 미생물이 CO를 CO2, H2, 메탄, n-부탄올, 아세테이트 및 에탄올과 같은 다양한 최종 산물로 대사시키는 것으로 나타났다.
방향족 화합물 파라-히드록시벤조산 (pHBA)은 액정(liquid crystal) 중합체에 사용되는 주요 단량체이며, 또한 일반적으로 파라벤으로 불리는 파라히드록시벤조에이트 또는 파라히드록시벤조산 에스테르의 제조를 위한 전구물질로 사용된다. 액정 중합체는 여러 용도를 갖는 케블러(Kevlar)와 벡트란(Vectran)을 포함한다. 파라벤 및 및 그 염은 화장품, 제약 및 식품 산업을 포함한 다양한 산업 분야에서 사용된다. 그들은 효과적인 보존제이며, 화장품 및 식품 제제의 살균 및 살진균 효과를 위해 사용될 수 있다.
따라서, pHBA 및 다른 고-부가 가치의 코리메이트-유도된 산물을 생산하기 위한 추가적인 미생물 및 방법이 여전히 요구된다.
본 발명은 코리스메이트-유도된 생산물들을 만들 수 있는 유전적으로 조작된 미생물을 제공한다. 구체적으로, 본 발명은 적어도 하나 코리스메이트-유도된 생산물을 만들 수 있는 유전적으로 조작된 미생물을 제공하며, 이때 상기 세균은 (a) 외생성 코리스메이트 피루베이트 분해효소 (EC 4.1.3.40), (b) 외생성 이소코리스메이트 합성효소 (EC 5.4.4.2), (c) 외생성 이소코리스메이트 피루베이트 분해효소 (EC 4.2.99.21), 그리고 (d) 파괴성 돌연변이를 포함하는 프레페네이트 합성효소 (EC 5.4.99.5)중 적어도 하나를 포함한다. 특정 구체예들에 있어서, 상기 유전적으로 조작된 미생물은 C1-고정 세균, 이를 테면 C1-함유 가스 기질의 발효에 의해 적어도 하나 코리스메이트-유도된 산물을 만들 수 있는 클로스트리듐(Clostridium) 세균이다.
예를 들면, 상기 코리스메이트 피루베이트 분해효소는 ubiC일 수 있고, 상기 이소코리스메이트 합성효소는 pchA일 수 있고, 이소코리스메이트 피루베이트 분해효소는 pchB일 수 있고, 그리고 프레페네이트 합성효소는 pheA일 수 있다. 프레페네이트 합성효소에서 파괴성 돌연변이(disruptive mutation)는 프레페네이트 합성효소의 발현 또는 활성을 감소 또는 제거할 수 있다. 이러한 파괴성 돌연변이로 인하여 모계 세균 및/또는 실질적으로 티로신 또는 페닐알라닌을 만들지 않는 세균과 비교하였을 때, 프레페네이트 또는 프레페네이트-유도된 산물들의 생산량이 감소된 세균이 만들어질 수 있다.
본 발명의 미생물은 (a) 상기 외생성 코리스메이트 피루베이트 분해효소, (b) 상기 외생성 이소코리스메이트 합성효소, (c) 상기 외생성 이소코리스메이트 피루베이트 분해효소, 그리고 (d) 파괴성 돌연변이를 포함하는 프레페네이트 합성효소중 적어도 하나를 암호화하는 적어도 하나의 핵산을 포함할 수 있다. 특정 구체예들에 있어서, 상기 핵산은 클로스트리듐에서 발현에 최적화되도록 코돈 최적화된다.
상기 코리스메이트-유도된 산물은 코리스메이트로부터 직접 또는 간접적으로 만들어지는 임의의 산물이다. 구체적으로, 상기 코리스메이트-유도된 산물은 6-원자의 탄소 환, 예를 들면, 카르복실 기 또는 카르복실레이트 음이온으로 치환되고, 그리고 하나 또는 그 이상의 OH 기 및/또는 하나 또는 그 이상의 NH2 기로 추가 치환된, 벤젠 또는 시클로헥산 환을 포함할 수 있다. 코리스메이트-유도된 산물들은 파라-히드록시벤조산, 살리실레이트, 2-아미노벤조에이트, 디히드록시벤조에이트그리고 4-히드록시시클로헥산 카르복실산을 포함하나, 이에 국한되지 않는다.
한 구체예에서, 본 발명의 미생물은 코리스메이트 피루베이트 분해효소, ubiC를 발현시키고, 파라-히드록시벤조산의 코리스메이트-유도된 산물을 만든다. 한 구체예에서 본 발명의 미생물은 피드백-비감성(feedback-insensitive) DAHP 합성효소를 더 발현시킨다.
한 구체예에서, 본 발명의 미생물은 이소코리스메이트 합성효소, pchA 및 이소코리스메이트 피루베이트 분해효소, pchB를 발현시키고, 살리실레이트의 코리스메이트-유도된 산물을 만든다. 한 구체예에서 본 발명의 미생물은 피드백-비감성(feedback-insensitive) DAHP 합성효소를 더 발현시킨다.
한 구체예에서, 본 발명의 미생물은 파괴성 돌연변이를 포함하는 프레페네이트 합성효소를 포함하며, 2-아미노벤조에이트, 2,3-디히드록시벤조에이트3,4-디히드록시벤조에이트 및 4-히드록시시클로헥산 카르복실산의 하나 또는 그 이상의 코리스메이트-유도된 산물을 만든다.
한 구체예에서, 본 발명의 미생물은 모계 미생물에 의해 만들어지지 않는 적어도 하나 코리스메이트-유도된 산물을 만들거나, 또는 모계 미생물에 의해 만들어지는 양보다 더 많은 양으로 적어도 하나 코리스메이트-유도된 산물을 만든다.
한 구체예에서, 본 발명의 세균은 C1-고정 모계 세균으로부터 유도된다. 바람직한 구체예에서, 본 발명의 세균은 클로스트리듐 오토에타노게눔(Clostridium autoethanogenum), 클로스트리듐 리중다레이(Clostridium ljungdahlii), 그리고 클로스트리듐 라가스다레이(Clostridium ragsdalei)로 구성된 집단에서 선택된 모계 세균으로부터 유도된다. 특별히 바람직한 구체예에서, 본 발명의 세균은 DSMZ 수탁 번호 DSM23693으로 기탁된 클로스트리듐 오토에타노게눔(Clostridium autoethanogenum) 모계 세균으로부터 유도된다.
본 발명은 C1-함유 가스 기질 존재하여 본 발명의 미생물을 발효시키는 것을 포함하는 발효 산물을 만드는 방법을 더 제공한다. 일반적으로, 상기 발효 산물은 코리스메이트-유도된 산물이다. 바람직한 구체예에서, 상기 가스 기질은 적어도 하나 C1 탄소 공급원을 포함한다.
도 1은 클로스트리디아(clostridia)에서 자생(native) 쉬키메이트(shikimate) 경로를 통하여 코리스메이트를 만드는 것을 보여주는 도표다.
도 2는 유전적으로 조작된 클로스트리듐 세균에서 pHBA 생산 경로를 보여주는 도표다.
도 3은 유전적으로 조작된 클로스트리듐 세균에서 살리실레이트 생산 경로를 보여주는 도표다.
도 4는 pheA를 암호화하는 핵산에 파괴성 돌연변이가 포함된 유전적으로 조작된 클로스트리듐 세균에서 방향족 산물들의 생산 경로를 보여주는 도표다.
도 5는 정통(authentic) pHBA 표준의 정량화를 보여주는 표준 곡선 그래프다.
도 6a는 정통 표준의 총 이온 카운트를 나타내는 그래프이다: (i) C. 오토에타노게눔 LZ1561 배양 배지의 상청액에서 준비된 정통 표준의 pHBA (트리메틸실레이트화된), (ii) 물에서 준비된 정통 표준의 pHBA (트리메틸실레이트화된), 그리고 (iii) 트리메틸실레이트화된 pHBA의 질량 스펙트럼.
도 6b는 발효 시료 및 표준의 선택된 이온 모니터링을 보여주는 그래프다: (i) pARO_01 플라스미드없는 C. 오토에타노게눔 LZ1561, (ii)와 (iii) pARO_01 플라스미드를 품고 있는 C. 오토에타노게눔 LZ1561에서 얻은 시료, (iv) 정통 표준의 pHBA, 그리고 (v) LZ1561/pARO_01에서 pHBA 및 pHBA 정점에 대한 NIST 데이터베이스 엔트리 간의 총 이온 카운트 비교.
도 7은 pARO_01 플라스미드의 그림이다. 상기 코리스메이트 피루베이트 분해효소 (ubiC) 및 피드백-비감성 DAHP 합성효소 (aroG*)는 우드-융둘 프로모터 (Pwl)의 제어 하에 있다. 다른 셔틀 벡터 특징들 또한 나타낸다.
도 8은 테스트 균주들에서 바이오매스(biomass) 축적을 보여주는 그래프다. 바이오매스는 상이한 시점에서 600nm에서 배양 시료의 흡광도를 측정함으로서 평가되었다. 데이터 포인터는 n=3 레플리케이트(replicate) 배양물의 평균 ± 1 표준 편차를 나타낸다. LZ1561은 형질변환안된 C. 오토에타노게눔 LZ1561을 지칭한다. pARO_01(1) 및 pARO_01(2)는 pARO_01 플라스미드로 형질변환된 C. 오토에타노게눔 LZ1561의 생물학적 레플리케이트이다.
도 9a 및 9b는 테스트 균주들에서 p-히드록시벤조에이트 축척을 나타내는 그래프다. 도 9a는 24, 96, 144, 그리고 192 시간(hr) 시점에서 각 시료에서 탐지된 pHBA의 정량화를 나타낸다. 3가지 레플리케이트 배양물은 음성 대조균주 (C. 오토에타노게눔 LZ1561) 그리고 pARO_01을 품고있는 C. 오토에타노게눔 LZ1561의 2개 생물학적 레플리케이트의 시료다. 도 9b는 n=3 기술적 레플리케이트의 평균 ± 1 SD이다.
도 10은 pheA를 암호화하는 핵산에 파괴성 돌연변이가 포함된 유전적으로 조작된 클로스트리듐 세균에서 방향족 화합물들의 생산을 보여주는 도표다. ΔpheA 균주는 4-히드록시 시클로헥산 카르복실산, 2-아미노벤조산, 그리고 3,4-디히드록시벤조산을 만들지만, 대조균주 (LZ1561)는 만들지 않는다.
도 11a는 살리실레이트 생합성 경로의 유도와 함께, 그리고 이 경로의 유도없이, 살리실레이트 생산 균주의 바이오매스 성장을 보여주는 그래프다.
도 11b는 살리실레이트 생합성 경로의 유도와 함께, 그리고 이 경로의 유도없이, 테스트 균주의 액체 배양물 안에서 살리실레이트 축척 차이를 보여주는 그래프다.
도 12는 pheA를 암호화하는 핵산에 파괴성 돌연변이가 포함된 유전적으로 조작된 클로스트리듐 세균에서 발효에 의해 생산된 4-히드록시 시클로헥산 카르복실산, 2-아미노벤조산, 그리고 3,4-디히드록시벤조산의 농도를 보여주는 그래프다.
도 13은 코리스메이트 피루베이트 분해효소 (EC 4.1.3.40)의 예시적인 공급원을 확인하는 표다.
도 14는 이소코리스메이트 합성효소 (EC 5.4.4.2)의 예시적인 공급원을 확인하는 표다.
도 15는 이소코리스메이트 피루베이트 분해효소 (EC 4.2.99.21)의 예시적인 공급원을 확인하는 표다.
클로스트리디아(Clostridia) 는 쉬키메이트 경로를 통하여 포스포에놀피루베이트와 에리트로스-4-포스페이트로부터 코리스메이트를 자생적으로 생산하는데, 이것은 방향족 아미노산 트립토판, 티로신, 그리고 페닐알라닌의 전구물질이다 (도 1). 이 경로는 Bentley, Crit Rev Biochem Mol Biol, 25.5: 307-384, 1990에서 상세하게 기술된다. 본 발명은 가스 기질의 발효에 의해 적어도 하나 코리스메이트-유도된 산물을 만들 수 있는 유전적으로 조작된 세균을 제공한다.
발명자들은 코리스메이트-유도된 산물이 실질적으로 생산될 수 있고, C1-탄소 공급원로부터 회수될 수 있음을 증명하였다. 본 발명은 주요 탄소 및 에너지 공급원으로써 C1-함유 가스 기질을 이용하여 적어도 하나 코리스메이트-유도된 산물을 만드는 방법을 제공한다. 이 방식에서, 본 발명은 당- 또는 셀룰로오스-기반의 기질에 의존하는 공정보다 여러가지 장점을 갖는다. 예를 들면, 당- 또는 셀룰로오스-기반의 기질은 전형적으로 식품 (가령, 사탕수수)에 또한 유용하며, 이들의 집중적인 토지 이용은 환경에 부정적인 영향을 미친다. 또한, 본 발명은 임의로 폐가스 (예를 들어, 산업 공정으로부터 나오는 CO)를 사용하여 코리스메이트-유도된 산물의 제조를 위한 대안적인 방법을 제공한다. 따라서, 본 발명은 폐가스로부터 수입원을 제공하고, 또한 가스가 대기로 타오를 경우 발생되는 탄소 배출을 줄이기 위해 폐가스 안에 탄소를 포획한다.
종속영양성(Heterotrophic) 미생물들, 이를 테면 대장균(E. coli )과 S. 세르비시에(s. cerevisiae) 해당작용을 통하여 상대적으로 높은 수준의 ATP를 만든다. 대조적으로, C1-탄소 공급원 (가령, CO 또는 CO2)를 이용하는 미생물들은 ATP 이용성이 저조하다. 예를 들면, 전형적인 일산화탄소영양성 미생물인 C. 오토에타노게눔(C. autoethanogenum) 반응 역학 분석에서 pHBA, 코리스메이트-유도된 산물)을 생산할 때, 고정된 CO mol 당 -0.4 ATP의 예상 ATP 수율을 제시한다. 이와 같이, 에너지 제약으로 인해 pHBA가 생성되지 않을 것으로 예상된다. 유사하게, 자가영양성 조건 하에서 그러한 화합물을 생산하는 대사 부하로 인하여, 일산화탄소영양성 미생물에 의해 다른 코리스메이트-유도된 산물이 생산될 것으로 기대되지는 않는다. 그러나, 놀랍게도, 본 발명자들은 가스 기질로부터 다수의 코리스메이트-유도된 산물들이 만들어질 수 있음을 보여 주었다. 또한, 전술한 산물은 산업 폐기물 가스로부터 제조될 수 있고, 이점은 다른 기질에 비해 실용적, 경제적 및 환경적 이점을 제공한다.
구체적으로, 본 발명은 (a) 외생성 코리스메이트 피루베이트 분해효소를 암호화하는 핵산, (b) 외생성 이소코리스메이트 합성효소 (a.k.a., 이소코리스메이트 뮤타제)를 암호화하는 핵산, (c) 외생성 이소코리스메이트 피루베이트 분해효소를 암호화하는 핵산, 그리고 (d) 파괴성 돌연변이를 포함하는 프레페네이트 합성효소를 암호화하는 핵산중 최소 한가지를 도입시킴으로써, 적어도 하나 코리스메이트-유도된 산물을 만들 수 있는 유전적으로 조작된 미생물들을 제공한다. 바람직한 구체예에서, 상기 유전적으로 조작된 미생물은 가스 기질의 발효에 의해 적어도 하나 코리스메이트-유도된 산물을 만들 수 있는 C1-고정 세균이다. 바람직한 구체예들에서, 상기 C1-고정 세균은 클로스트리듐 세균이다.
“코리스메이트-유도된 산물(chorismate-derived product)” 또는 “코리스메이트로부터 유도된 산물(product derived from chorismate)”, 또는 유사한 용어들은 코리스메이트 (또는 코리스민산)으로부터 직접 또는 간접적으로 만들어진 산물들을 포괄한다. 코리스메이트-유도된 산물들은 전형적으로 6-원자의 탄소 환, 예를 들면, 카르복실 기 또는 카르복실레이트 음이온으로 치환되고, 그리고 하나 또는 그 이상의 OH 기 및/또는 하나 또는 그 이상의 NH2 기로 추가 치환된, 벤젠 또는 시클로헥산 환을 포함할 수 있다. 구체적으로, 코리스메이트-유도된 산물들은 파라-히드록시벤조산, 살리실레이트, 2-아미노벤조에이트, 2,3-디히드록시벤조에이트3,4-디히드록시벤조에이트그리고 4-히드록시시클로헥산 카르복실산을 포함하나, 이에 국한되지 않는다.
본 발명의 미생물은 유비퀴논 생합성의 제 1 단계에서 코리스메이트로부터 파라-히드록시벤조산과 피루베이트로의 전환을 촉매하는 외생성 코리스메이트 피루베이트 분해효소 효소 (EC 4.1.3.40)를 포함할 수 있다. 상기 효소는 이러한 효소를 갖는 임의의 미생물로부터 유도될 수 있다. 상기 효소는 UbiC 효소일 수 있다. UbiC 효소는 대장균(Escherichia coli), 클렙시엘라 옥시토카(Klebsiella oxytoca), 씨트로박터 플레운디(Citrobacter freundii), 또는 UbiC 효소를 갖는 임의의 다른 미생물로부터 유도될 수 있다. 한 구체예에서, UbiC 효소는 대장균(escherichia coli)으로부터 유도되며, 서열번호: 1 또는 이의 기능적 등가 변이체를 포함한다.
유사하게, 본 발명의 미생물은 외생성 코리스메이트 피루베이트 분해효소를 암호화하는 핵산을 포함할 수 있다. 상기 핵산은 코리스메이트 피루베이트 분해효소 유전자를 갖는 임의의 미생물로부터 유도된 코리스메이트 피루베이트 분해효소 유전자일 수 있다. 상기 코리스메이트 피루베이트 분해효소 유전자는 ubiC 유전자일 수 있다. 상기 ubiC 유전자는 대장균(Escherichia coli), 클렙시엘라 옥시토카(Klebsiella oxytoca), 씨트로박터 플레운디(Citrobacter freundii), 또는 UbiC 유전자를 갖는 임의의 다른 미생물로부터 유도될 수 있다. 한 구체예에서, 상기 ubiC 유전자는 대장균(Escherichia coli)으로부터 유도되며, 서열번호: 2 또는 이의 기능적 등가 변이체를 포함한다.
상기 UbiC 효소 또는 ubiC 유전자는 용해도, 안정성, 또는 다른 유전자/효소 성질을 개선시키기 위하여 또한 변형(가령, 돌연변이)될 수 있다. 이러한 변형은 산물의 역가를 증가시킬 수 있다. 실시예 4는 파라-히드록시벤조산 잔류(retention)를 통하여 산물 억제를 감소시키도록 UbiC 효소를 조작하는 실험 프로토콜을 기술한다. 한 가지 특정 변형은 ubiC 유전자를 조작하여, 시스테인 대신 두 개의 표면-활성 세린을 갖는 UbiC 효소를 발현시키는 것이다. 상기 세린 잔기로 인하여 단백질 응집은 감소되고, 이로 인하여 용해도는 개선된다. 따라서, 특정 구체예에서, UbiC 효소는 적어도 하나 표면-활성 시스테인을 세린으로 대체시키는 돌연변이를 포함한다.
대체 구체예에서, 상기 코리스메이트 피루베이트 분해효소 (EC 4.1.3.40)는 예를 들면, 도 13에서 확인되는 임의의 공급원이거나, 또는 이로부터 유도될 수 있다.
외생성 코리스메이트 피루베이트 분해효소 (가령, ubiC) 또는 외생성 코리스메이트 피루베이트 분해효소를 암호화하는 핵산 (가령, ubiC)의 도입으로 본 발명의 미생물에 의해 코리스메이트-유도된 산물인 파라-히드록시벤조산이 생산된다. 파라-히드록시벤조산의 생산은 도 2에서 설명된다. 아세토박테리움 우디(Acetobacterium woodii), 알칼리박테이룸 바치(Alkalibaculum bacchii), 블라우티아 프루덕타(Blautia producta), 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum), 클로스트리듐 아세티쿰(Clostridium aceticum), 클로스트리듐 오토에타노게눔, 클로스트리듐 카르복시디보란스(Clostridium carboxidivorans), 클로스트리듐 코스카티(Clostridium coskatii), 클로스트리듐 드라케이(Clostridium drakei), 클로스트리듐 포르미코아세티쿰(Clostridium formicoaceticum), 클로스트리듐 리중다레이, 클로스트리듐 마그눔(Clostridium magnum), 클로스트리듐 라가스다레이, 클로스트리듐 스카토로게네스(Clostridium scatologenes), 유박테리움 리모숨(Eubacterium limosum), 모오렐라 테르마우토트로피카(Moorella thermthermautotrophica), 모오렐라 테르모아세티카(Moorella thermoacetica), 옥소박터 펜니기(Oxobacter pfennigii), 스포로무사 오바타(Sporomusa ovata), 스포로무사 실바세티카(Sporomusa silvacetica), 스포로무사 스페로이데스(Sporomusa sphaeroides), 그리고 테르모안에어로박터 키부이(Thermoanaerobacter kivui) 종들을 포함하는 C1 고정 세균은 자생적으로 파라-히드록시벤조산을 만들지 않는다. 사실, 유비퀴논은 일반적으로 호기성 호흡 미생물에서만 생산되기 때문에, 일산화탄소영양성 미생물에서는 코리스메이트 피루베이트 분해효소를 일반적으로 찾아볼 수 없다. 아미노산 대신 pHBA를 생산하는 코리스메이트의 전환은 미생물의 성장이나 생존에 악영향을 미칠 것으로 예상되지만, 본 발명자들은 이들 미생물이 표준 조건 하에서 생존 및 성장을 현저하게 저해하는 정도로 영향을 주지 않는다는 것을 보여 주었다.
파라-히드록시벤조산은 또한 예를 들면, pHBA, 4-히드록시벤조산, p-히드록시벤조산, 또는 파라-히드록시벤조에이트로 지칭될 수 있다. 본원에서 사용되는 이들 용어중 임의의 것과 관련하여, 이 분자의 산 및 음이온 형태 모두가 포함된다.
Figure 112017116259310-pct00001
본 발명의 미생물은 코리스메이트의 이소코리스메이트로의 전환을 촉매하는 이소코리스메이트 뮤타제(EC 5.4.4.2)로도 지칭되는, 외생성 이소코리스메이트 합성효소 효소를 포함할 수 있다. 상기 효소는 이러한 효소를 갖는 임의의 미생물로부터 유도될 수 있다. 상기 효소는 PchA 효소일 수 있다. PchA 효소는 슈도모나스 에어루기노사 또는 PchA 효소를 보유하는 임의의 다른 미생물로부터 유도될 수 있다. 한 구체예에서, PchA 효소는 슈도모나스 에어루기노사 (Pseudomonas aeruginosa)로부터 유도되며, 서열번호: 3 또는 이의 기능적 등가 변이체를 포함한다.
유사하게, 본 발명의 미생물은 외생성 이소코리스메이트 합성효소를 암호화하는 핵산을 포함할 수 있다. 상기 핵산은 이소코리스메이트 합성효소 유전자를 갖는 임의의 미생물로부터 유도된 이소코리스메이트 합성효소 유전자일 수 있다. 이소코리스메이트 합성효소 유전자는 pchA 유전자일 수 있다. pchA 유전자는 슈도모나스 에어루기노사 또는 pchA 유전자를 보유하는 임의의 다른 미생물로부터 유도될 수 있다. 한 구체예에서, pchA 유전자는 슈도모나스 에어루기노사로부터 유도되며, 서열번호: 4 또는 이의 기능적 등가 변이체를 포함한다.
대체 구체예에서, 이소코리스메이트 합성효소 (EC 5.4.4.2)는 도 14에서 확인되는 임의의 공급원이거나, 또는 이로부터 유도될 수 있다.
본 발명의 미생물은 이소코리스메이트를 살리실레이트와 피루베이트로의 전환을 촉매하는 외생성 이소코리스메이트 피루베이트 분해효소 효소 (EC 4.2.99.21)를 포함할 수 있다. 상기 효소는 이러한 효소를 갖는 임의의 미생물로부터 유도될 수 있다. 상기 효소는 PchB 효소일 수 있다. PchB 효소는 슈도모나스 에어루기노사 또는 PchB 효소를 보유하는 임의의 다른 미생물로부터 유도될 수 있다. 한 구체예에서, PchB 효소는 슈도모나스 에어루기노사 로부터 유도되며, 서열번호: 5 또는 이의 기능적 등가 변이체를 포함한다.
유사하게, 본 발명의 미생물은 외생성 이소코리스메이트 피루베이트 분해효소를 암호화하는 핵산을 포함할 수 있다. 상기 핵산은 이소코리스메이트 피루베이트 분해효소 유전자를 갖는 임의의 미생물로부터 유도된 이소코리스메이트 피루베이트 분해효소 유전자일 수 있다. 이소코리스메이트 피루베이트 분해효소 유전자는 pchB 유전자일 수 있다. pchB 유전자는 슈도모나스 에어루기노사 또는 pchB 유전자를 보유하는 임의의 다른 미생물로부터 유도될 수 있다. 한 구체예에서, pchB 유전자는 슈도모나스 에어루기노사로부터 유도되며, 서열번호: 6 또는 이의 기능적 등가 변이체를 포함한다.
대체 구체예에서, 이소코리스메이트 피루베이트 분해효소 (EC 4.2.99.21) 예를 들면, 도 15에서 확인되는 임의의 공급원이거나, 또는 이로부터 유도될 수 있다.
(1) 외생성 이소코리스메이트 합성효소 (가령, pchA) 및 (2) 외생성 이소코리스메이트 피루베이트 분해효소 (가령, pchB)의 도입으로 본 발명의 미생물에 의한 코리스메이트-유도된 산물인, 살리실레이트가 생산된다. 살리실레이트의 생산은 도 3에서 설명되며, 이에 따르면 코리스메이트는 이소코리스메이트 합성효소에 의해 이소코리스메이트로 전환되고, 그 다음 이소코리스메이트 피루베이트 분해효소에 의해 살리실레이트와 피루베이트로 더 전환된다. 아세토박테리움 우디, 알칼리박테이룸 바치, 블라우티아 프루덕타, 부티리박테리움 메틸로트로피쿰, 클로스트리듐 아세티쿰, 클로스트리듐 오토에타노게눔, 클로스트리듐 카르복시디보란스, 클로스트리듐 코스카티, 클로스트리듐 드라케이, 클로스트리듐 포르미코아세티쿰, 클로스트리듐 리중다레이, 클로스트리듐 마그눔, 클로스트리듐 라가스다레이, 클로스트리듐 스카토로게네스, 유박테리움 리모숨, 모오렐라 테르마우토트로피카, 모오렐라 테르모아세티카, 옥소박터 펜니기, 스포로무사 오바타, 스포로무사 실바세티카, 스포로무사 스페로이데스, 그리고 테르모안에어로박터 키부이 종이 포함된 C1 고정 세균은 자생적으로 살리실레이트를 생산하지 않는다.
살리실레이트는 예를 들면, 2-히드록시벤조에이트살리실산, 또는 2-히드록시벤조산으로도 지칭될 수 있다. 본원에서 사용되는 이들 용어중 임의의 것과 관련하여, 이 분자의 산 및 음이온 형태 모두가 포함된다.
Figure 112017116259310-pct00002
(d) 파괴성 돌연변이를 포함하는 프레페네이트 합성효소
본 발명의 미생물은 파괴성 돌연변이가 포함된 프레페네이트 합성효소 효소 (EC 5.4.99.5)를 포함할 수 있다. 프레페네이트 합성효소 전형적으로 코리스메이트의 프레페네이트로의 전환 (가령, 코리스메이트 ↔ 프레페네이트 뮤타제 반응)을 촉매한다. 따라서, 파괴성 돌연변이가 포함된 프레페네이트 합성효소는 코리스메이트를 프레페네이트로 전환시키지 못하거나, 또는 전환 능력이 떨어진다. 파괴성 돌연변이를 포함하는 프레페네이트 합성효소는 파괴성 돌연변이가 포함된 pheA일 수 있다. 프레페네이트 합성효소는 코리스메이트 뮤타제라고도 지칭될 수 있다.
일부 구체예들에서, pheA는 프레페네이트 합성효소 (가령, 코리스메이트 뮤타제) (EC 5.4.99.5) 및 프레페네이트 탈수효소 (EC 4.2.1.51) 반응 모두를 실행하는 이중기능성 효소일 수 있다. 별도 효소에 의해 이들 두 반응이 실행되는 미생물에서, EC 5.4.99.5 활성을 해체시키면 프레페네이트 또는 프레페네이트의 하류 화합물의 생산이 상당히 감소하거나, 또는 생산되지 않는 결과를 초래할 것이고, 한편 EC 4.2.1.51 활성만 해체시키면 프레페네이트는 여전히 생산될 수 있기 때문에 동일한 표현형을 얻지 못할 것이다. 한 구체예에서, pheA는 클로스트리듐 오토에타노게눔으로부터 유도되며, 서열번호: 11 또는 이의 기능적 등가 변이체를 포함한다.
유사하게, 본 발명의 미생물은 파괴성 돌연변이를 포함하는 프레페네이트 합성효소를 암호화하는 핵산을 포함할 수 있다. 상기 핵산은 파괴성 돌연변이가 포함된 pheA 유전자일 수 있다. 한 구체예에서, 상기 파괴성 돌연변이는 pheA 유전자의 녹아웃(knockout) 돌연변이다. 한 구체예에서, pheA 유전자는 클로스트리듐 오토에타노게눔로부터 유도되며, 서열번호: 10 또는 코돈-최적화된 또는 이의 기능적 등가 변이체를 포함한다.
파괴성 프레페네이트 합성효소로 인하여 페닐알라닌 및 티로신의 생산은 감소 또는 생산되지 않는다. 놀랍게도, 파괴성 프레페네이트 합성효소로 인하여 일반적으로 추가 산물들이 생산되지 않거나, 또는 매우 낮은 수준으로 생산되는 결과를 또한 초래한다.
구체적으로, 프레페네이트 합성효소 (가령, pheA) 또는 프레페네이트 합성효소를 암호화하는 핵산 (가령, pheA) 안에 파괴성 돌연변이의 도입으로 본 미생물에 의해 2-아미노벤조에이트, 디히드록시벤조에이트 그리고 4-히드록시시클로헥산 카르복실산중 하나 또는 그 이상이 생산되는데, 이들 모두 코리스메이트-유도된 산물이다. 이들 산물들의 생산 경로는 도 4에서 설명된다. 클로스트리디아(clostridia) 이를 테면 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 그리고 클로스트리듐 라가스다레이 종을 포함한 많은 미생물들은 자생적으로 이들 산물을 만들지 않거나, 또는 이들 산물을 매우 낮은 수준으로 만든다.
pheA의 예시적인 공급원이 제시된다. 그러나, pheA에 대한 다른 적합한 공급원이 이용가능할 수 있다는 것을 이해해야 한다. 예를 들어, 프레페네이트 탈수 효소는 다음의 공급원 중 어느 하나이거나, 또는 이로부터 유도될 수 있으며, 그 서열은 공개적으로 이용 가능하다:
Figure 112017116259310-pct00003
Figure 112017116259310-pct00004
2-아미노벤조에이트는 예를 들면, 2-아미노벤조산, o-아미노벤조산, 안트라닐산, 안트라닐레이트, 또는 비타민 L1로도 또한 지칭될 수 있다. 본원에서 사용되는 이들 용어중 임의의 것과 관련하여, 이 분자의 산 및 음이온 형태 모두가 포함된다.
Figure 112017116259310-pct00005
디히드록시벤조에이트는 예를 들면, 2,3-디히드록시벤조에이트, 2,3-디히드록시벤조산, 3,4-디히드록시벤조에이트, 3,4-디히드록시벤조산 또는 트로토카테큐산으로도 지칭될 수 있다. 본원에서 사용되는 이들 용어중 임의의 것과 관련하여, 이 분자의 산 및 음이온 형태 모두가 포함된다.
Figure 112017116259310-pct00006
Figure 112017116259310-pct00007
Figure 112017116259310-pct00008
4-히드록시시클로헥산 카르복실산은 예를 들면, cis-4-히드록시시클로헥산 카르복실산 또는 4-히드록시시클로헥산-1-카르복실레이트로도 또한 지칭될 수 있다. 본원에서 사용되는 이들 용어중 임의의 것과 관련하여, 이 분자의 산 및 음이온 형태 모두가 포함된다.
Figure 112017116259310-pct00009
또 다른 구체예에서, 본 발명의 미생물은 쉬키메이트 경로 (도 1)의 첫번째 단계를 촉매하는 피드백-비감성 DAHP 합성효소 DAHP 합성효소를 암호화하는 핵산을 더 포함할 수 있는데, 이때 에리트로스-4-포스페이트와 포스포에놀피루베이트는 3-데옥시-D-아라비노헵토소네이트-7-포스페이트로 전환된다. 본 발명자들은 상기 경로에서 이 단계는 대장균의 경우 설명된 바와 같이(Hu et al. J. Basic Microbiol. 2003, 43:399-406), 방향족 아미노산 (트립토판, 페닐알라닌, 티로신)에 의한 피드백 억제를 받는 것으로 본다. 따라서, 선행기술에 근거하여 본 발명자들은 피드백 비감수성 DAHP 합성 효소를 개발하였으며, 이로써 상기 피드백 억제에 의해 감소된 코리스메이트-유도된 산물로의 유출 위험이 감소될 것으로 본다. 적절한 DAHP 합성효소를 암호화하는 핵산은 당분야의 당업자들에게 공지되어 있다. 그러나, 예시를 통하여, DAHP 합성효소가 암호화된 핵산은 대장균, 클로스트리듐 베이헤린키(Clostridium beijerinckii), 또는 사카로미세스 세르비시에(Saccharomyces cerevisiae)로부터 유도될 수 있다. 한 구체예에서, DAHP 합성효소는 대장균의 피드백-비감성 DAHP 합성효소일 수 있고, 서열번호: 7의 핵산 서열 및 서열번호: 8의 아미노산 서열을 갖는다. 상기 피드백-비감성 DAHP 합성효소는 전술한 효소중 하나를 암호화하는 유전자와 동일한 벡터, 또는 상이한 벡터로 도입될 수 있다. 상기 피드백-비감성 DAHP 합성효소는 자체 고유 프로모터를 가지거나, 또는 바이시스트로닉(bicistronic) 정렬로 전술한 효소중 하나에 대한 프로모터를 따를 수 있으며, 이때 단일 프로모터는 상기 효소와 피드백-비감성 DAHP 합성효소 모두를 암호화하는 단일 mRNA의 전사를 구동한다.
한 구체예에서, 본 발명의 미생물은 외생성 코리스메이트 피루베이트 분해효소 효소 (EC 4.1.3.40), 그리고 외생성 피드백-비감성 DAHP 합성효소를 포함할 수 있다. 특정 구체예들에 있어서, 상기 미생물은 외생성 UbiC 효소, 그리고 외생성 피드백-비감성 DAHP 합성효소를 포함한다. 특정 구체예에서, 본 발명은 서열번호: 1의 핵산 서열을 갖는 외생성 ubiC 유전자, 그리고 서열번호: 7의 핵산 서열을 갖는 외생성 피드백-비감성 DAHP 합성효소를 포함한다. 한 구체예에서, 외생성 코리스메이트 피루베이트 분해효소 효소와 외생성 피드백-비감성 DAHP 합성효소를 모두 포함하는 미생물은 피드백-비감성 DAHP 합성효소가 없는 미생물과 비교하였을 때, 파라-히드록시벤조산을 더 많이 생산한다는 것이 실증된다.
유사하게, 본 발명의 미생물은 외생성 코리스메이트 피루베이트 분해효소와 피드백-비감성 DAHP 합성효소를 모두 암호화하는 핵산을 포함할 수 있다.
한 구체예에서, 본 발명의 미생물은 (i) 외생성 이소코리스메이트 뮤타제, (EC 5.4.4.2), (ii) 이소코리스메이트 피루베이트 분해효소 효소 (EC 4.2.99.21), 그리고 (iii) 외생성 피드백-비감성 DAHP 합성효소를 포함한다. 특정 구체예들에 있어서, 상기 미생물은 외생성 PchA 효소, 외생성 PchB 효소, 그리고 외생성 피드백-비감성 DAHP 합성효소를 포함한다. 한 구체예에서, 외생성 피드백-비감성 DAHP 합성효소를 포함하는 미생물은 피드백-비감성 DAHP 합성효소가 없는 미생물과 비교하였을 때, 살리실산을 더 많이 생산한다는 것이 실증된다.
유사하게, 본 발명의 미생물은 외생성 코리스메이트 피루베이트 분해효소와 피드백-비감성 DAHP 합성효소를 모두 암호화하는 핵산을 포함할 수 있다.
또다른 구체예에서, 본 발명의 미생물은 피드백-비감성 DAHP 합성효소를 포함하지 않고, 대신 단지 내생성 DAHP 합성효소만을 포함한다. 방향족 아미노산의 생산 또는 자연 농도가 피드백 저해를 유도하지 않을 정도로 충분히 낮을 것으로 예상되는 경우, 피드백-비감성 DAHP 합성 효소의 도입은 필요없다.
본 발명의 미생물은 임의의 농도 또는 임의의 양으로 코리스메이트-유도된 산물들을 만들 수 있다. 한 구체예에서, 본 발명의 미생물은 적어도 약 5 mg/L, 10 mg/L, 15 mg/L, 20 mg/L, 30 mg/L, 50 mg/L, 75 mg/L, 100 mg/L, 200 mg/L, 500 mg/L, 750 mg/L, 1g/L, 1.5g/L 또는 2 g/L의 농도로 코리스메이트-유도된 산물들을 만든다. 한 구체예에서, 본 발명의 미생물은 적어도 10 mg/L, 50gm/L, 100mg/L, 500mg/L,800mg/L, 또는 1g/L의 농도로 적어도 하나 코리스메이트-유도된 산물을 만든다.
더욱이, 본 발명의 미생물은 특정 선택성 또는 최소 선택성으로 산물을 만들도록 조작될 수 있다. 한 구체예에서, 표적 코리스메이트-유도된 산물은 본 발명의 미생물에 의해 만들어지는 모든 발효 산물의 적어도 약 5%, 10%, 15%, 20%, 30%, 50%, 또는 75%를 차지한다. 한 구체예에서, 표적 코리스메이트-유도된 산물은 본 발명의 미생물에 의해 만들어지는 모든 발효 산물의 적어도 10%를 차지하고, 따라서 본 발명의 미생물은 표적 코리스메이트-유도된 산물에 대하여 적어도 10%의 선택성을 갖는다. 또다른 구체예에서, 표적 코리스메이트-유도된 산물은 본 발명의 미생물에 의해 만들어지는 모든 발효 산물의 적어도 30%를 차지하고, 따라서 본 발명의 미생물은 표적 코리스메이트-유도된 산물에 대하여 적어도 30%의 선택성을 갖는다.
본 발명은 가스 기질 존재하여 본 발명의 미생물을 발효시키는 것으로 포함하는 발효 산물, 구체적으로 코리스메이트-유도된 산물을 만드는 방법을 더 제공한다.
본 발명은 가스 기질 존재하에 본 발명의 미생물을 발효시킴으로써 생산되는 코리스메이트-유도된 산물들을 또한 제공한다.
정의 및 배경
용어 “유전적 변형(genetic modification)” 또는 “유전 공학(genetic engineering)”은 넓은 의미로 미생물의 게놈 또는 핵산의 조작을 의미한다. 유전적 변형 방법은 예를 들면, 이종 유전자 발현, 유전자 또는 프로모터 삽입 또는 결손, 핵산 돌연변이, 변경된(altered) 유전자 발현 또는 비활성화, 효소 공학, 지향된(directed) 진화, 지식-기반 설계, 무작위 돌연변이생성 방법, 유전자 셔플링, 그리고 코돈 최적화를 포함한다.
“재조합체(Recombinant)”란 핵산, 단백질, 또는 미생물의 유전적 변형, 조작, 또는 재조합의 산물을 나타낸다. 일반적으로, 상기 “재조합체”라는 용어는 다수 원료, 이를 테면 2 또는 그 이상의 상이한 균주 또는 미생물 종으로부터 유도된 유전 물질을 포함하는 또는 암호화된 핵산, 단백질, 또는 미생물을 의미한다. 상기 “재조합체”라는 용어는 돌연변이된 형태 내생성 핵 또는 단백질이 포함된 돌연변이된 핵산 또는 단백질을 포함하는 미생물을 설명할 때 또한 사용될 수 있다.
"내생성(Endogenous)"은 본 발명의 미생물이 유도된 야생형 또는 모계 미생물에 존재하거나 또는 발현되는 핵산 또는 단백질을 지칭한다. 예를 들면, 내생성 유전자는 본 발명의 미생물이 유도된 야생형 또는 모계 미생물에 자생적으로 존재하는 유전자다. 한 구체예에서, 내생성 유전자의 발현은 외생성 조절 요소, 이를 테면 외생성 프로모터에 의해 제어될 수 있다.
“외생성(Exogenous)”이란 본 발명의 미생물이 유도된 야생형 또는 모계 미생물에 존재하지 않는 핵산 또는 단백질을 지칭한다. 한 구체예에서, 외생성 유전자 또는 효소는 이종 (가령, 상이한) 균주 또는 종으로부터 유도될 수 있으며, 그리고 본 발명의 미생물로 도입되거나 또는 발현될 수 있다. 또다른 구체예에서, 외생성 유전자 또는 효소는 인위적으로 또는 재조합적으로 만들어질 수 있고, 그리고 본 발명의 미생물로 도입되거나 또는 발현될 수 있다. 외생성 핵산은 본 발명의 미생물의 게놈에 통합되거나, 또는 본 발명의 미생물안에 염색체 외의 상태로 있는, 예를 들어 플라스미드에 유지되도록 개작될 수 있다.
“효소 활성(Enzyme activity)”은 효소의 활성, 효소의 양 또는 반응을 촉매하는 효소의 이용가능성을 포함하지만 이에 국한되지는 않는, 효소의 활성을 광범위하게 말한다. 따라서, "증가하는(increasing)" 효소 활성은 효소의 활성을 증가시키거나, 효소의 양을 증가시키거나, 또는 반응을 촉진시키는 효소의 이용가능성을 증가시키는 것을 포함한다.
“돌연변이된(Mutated)”이란 본 발명의 미생물이 유래된 야생형 또는 모계 미생물과 비교하여, 본 발명의 미생물에서 변형된 핵산 또는 단백질을 지칭한다. 한 구체예에서, 상기 돌연변이는 효소를 암호화하는 유전자에서 결손, 삽입, 또는 치환일 수 있다. 또다른 구체예에서, 상기 돌연변이는 효소에서 하나 또는 그 이상의 아미노산의 결손, 삽입, 또는 치환일 수 있다.
구체적으로, “파괴성 돌연변이(disruptive mutation)”는 유전자 또는 효소의 발현 또는 활성을 감소 또는 제거(가령, "파괴")하는 돌연변이다. 상기 파괴성 돌연변이는 이 유전자 또는 효소를 부분적으로 비활성화시키거나, 완전하게 비활성화시키거나, 또는 결손시킬 수 있다. 상기 파괴성 돌연변이는 녹아웃 (KO) 돌연변이일 수 있다. 상기 파괴성 돌연변이는 효소에 의해 만들어진 산물의 생합성을 감소, 방해 또는 차단시키는 임의의 돌연변이일 수 있다. 상기 파괴성 돌연변이는 예를 들면, 효소를 암호화하는 유전자에서 돌연변이, 효소를 암호화하는 유전자의 발현에 관여하는 유전적 조절 요소에서 돌연변이, 효소의 활성을 감소 또는 억제시키는 단백질을 생산하는 핵산의 도입, 또는 효소의 발현을 억제하는 핵산(가령, 안티센스 RNA, siRNA, CRISPR) 또는 단백질의 도입을 포함한다. 상기 파괴성 돌연변이는 당 업계에 공지된 임의의 방법을 사용하여 도입될 수 있다.
“코돈 최적화(Codon optimization)”란 특정 균주 또는 종에서 핵산의 최적화된 또는 개선된 해독을 위하여 핵산, 이를 테면 유전자의 돌연변이를 의미한다. 코돈 최적화로 해독 속도가 빨라지거나 또는 해독 정확도가 높아질 수 있다. 바람직한 구체예에서, 본 발명의 유전자는 클로스트리듐, 특히 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 또는 클로스트리듐 라가스다레이에서 발현을 위하여 코돈 최적화된다. 추가 바람직한 구체예에서, 본 발명의 유전자는 DSMZ 수탁 번호 DSM23693로 기탁된 클로스트리듐 오토에타노게눔 LZ1561에서 발현을 위하여 코돈 최적화된다.
“과다발현된(Overexpressed)”이란 본 발명의 미생물이 유래된 야생형 또는 모계 미생물과 비교하여, 본 발명의 미생물에서 핵산 또는 단백질의 발현이 증가된 것을 지칭한다. 과발현은 유전자 복사 수, 유전자 전사율, 유전자 해독율 또는 효소 분해율의 변형을 포함하여, 당업계에 공지된 임의의 수단에 의해 달성될 수 있다.
용어 “변이체(variants)”는 선행 기술에 개시되거나, 또는 본원에 예시된 기준 핵산 및 단백질의 서열과 같이, 서열이 기준 핵산 및 단백질의 서열로부터 변화된 핵산 및 단백질을 포함한다. 본 발명은 기준 핵산 또는 단백질과 실질적으로 동일한 기능을 수행하는 변이체 핵산 또는 단백질을 사용하여 실시될 수 있다. 예를 들면, 변이체 단백질은 기준 단백질과 실질적으로 동일한 기능을 수행하거나, 또는 기준 단백질과 실질적으로 동일한 반응을 촉매할 수 있다. 변이체 유전자는 기준 유전자와 동일하거나 실질적으로 동일한 단백질을 암호화할 수 있다. 변이체 프로모터는 기준 프로모터로서 하나 이상의 유전자의 발현을 촉진시키는 실질적으로 동일한 능력을 가질 수 있다.
이러한 핵산 또는 단백질은 본 명세서에서 "기능적으로 대등한 변이체(functionally equivalent variants)"로 지칭될 수 있다. 예로서, 핵산의 기능적으로 대등한 변이체는 대립 유전자(allelic) 변이체, 유전자 단편, 돌연변이된 유전자, 다형성(polymorphisms) 및 이와 유사한 것등을 포함할 수 있다. 다른 미생물의 상동성(Homologous) 유전자 또한 기능적으로 대등한 변이체의 예이다. 이들은 이를 테면 클로스트리듐 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리듐 베이헤린키, 또는 클로스트리듐 리중다레이 종에는 상동성 유전자를 포함하는데, 이의 상세는 웹사이트, 이를 테면 Genbank 또는 NCBI에서 공개되어 있다. 기능적으로 대등한 변이체는 또한 특정 미생물에 대한 코돈 최적화의 결과로서 서열이 변화된 핵산을 포함한다. 기능적으로 대등한 핵산 변이체는 기준 핵산에 대하여 적어도 대략적으로 70%, 대략적으로 80%, 대략적으로 85%, 대략적으로 90%, 대략적으로 95%, 대략적으로 98%, 또는 그 이상의 핵산 서열 동일성 (상동성 백분율)을 갖는 것이 바람직할 것이다. 기능적으로 대등한 단백질 변이체는 기준 단백질에 대하여 적어도 대략적으로 70%, 대략적으로 80%, 대략적으로 85%, 대략적으로 90%, 대략적으로 95%, 대략적으로 98%, 또는 그 이상의 아미노산 동일성 (상동성 백분율)을 가지는 것이 바람직할 것이다. 변이체 핵산 또는 단백질의 기능적 등가성은 당 업계에 공지된 임의의 방법을 사용하여 평가할 수 있다.
핵산은 당업계에 공지된 임의의 방법을 사용하여 본 발명의 미생물로 전달될 수 있다. 예를 들면, 핵산은 네이키드(naked) 핵산으로 전달될 수 있거나, 또는 이를 테면, 리포좀과 같은 하나 이상의 물질로 제제화될 수 있다. 상기 핵산은 DNA, RNA, cDNA, 또는 적절한 경우 이의 조합이될 수 있다. 제한(Restriction) 억제제들이 특정 구체예들에서 이용될 수 있다. 추가 벡터는 플라스미드, 바이러스, 박테리오파아지, 코스미드, 및 인공 염색체를 포함할 수 있다. 바람직한 구체예에서, 핵산은 플라스미드를 이용하여 본 발명의 미생물로 전달된다. 예를 들면, (형질 도입 또는 형질 감염을 포함한) 형질전환은 전기 천공, 초음파처리, 폴리에틸렌 글리콜-매개 형질전환, 화학적 또는 자연적 컴피턴스, 원형질체 형질전환, 프로파아지 유도 또는 접합에 의해 달성될 수 있다. 활성 제한 효소 시스템을 갖는 특정 구체예에서, 핵산을 미생물에 도입하기 전, 핵산의 메틸화가 필요할 수 있다.
더욱이, 핵산은 특정 핵산의 발현을 증가시키거나, 또는 달리 조절하기 위해 프로모터와 같은 조절 요소를 포함하도록 설계될 수 있다. 프로모터는 구성적 프로모터 또는 유도성 프로모터 일 수 있다. 이상적으로는, 상기 프로모터는 우드-융둘(Wood-Ljungdahl) 경로 프로모터, 페레독신 프로모터, 피루베이트:페레독신 산화환원 효소 프로모터, Rnf 복합 오페론 프로모터, ATP 합성 효소 오페론 프로모터, 또는 포스포 트랜스아세틸라제/아세테이트 키나제 오페론 프로모터이다.
"미생물(microorganism)"은 현미경적 유기체, 구체적으로 박테리아, 고균(archea), 바이러스 또는 곰팡이이다. 본 발명의 미생물은 전형적으로 세균이다. 본 명세서에 사용된 "미생물"의 기재는 "세균(bacterium)"를 포괄해야 한다.
“모계(parental) 미생물”이란 본 발명의 미생물을 만들 때 이용된 미생물이다. 상기 모계 미생물은 자연 발생적 미생물 (가령, 야생형 미생물)이거나, 또는 기존에 변형된 미생물 (가령, 돌연변이체 또는 재조합 미생물)일 수 있다. 본 발명의 미생물은 이의 모계 미생물에서 발현되지 않았거나, 또는 과다발현되지 않았던 하나 또는 그 이상의 효소를 발현 또는 과다발현시키도록 변형될 수 있다. 유사하게, 본 발명의 미생물은 이의 모계 미생물에 포함되지 않았던 하나 또는 그 이상의 유전자를 포함하도록 변형될 수 있다. 한 구체예에서, 상기 모계 미생물은 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 또는 클로스트리듐 라가스다레이이다. 바람직한 구체예에서, 상기 모계 미생물은 DSMZ 수탁 번호 DSM23693로 기탁된 클로스트리듐 오토에타노게눔 LZ1561이다.
용어 “~로부터 유도된(derived from)"이란 새로운 핵산, 단백질, 또는 미생물을 만들기 위하여, 상이한 (가령, 모계 또는 야생형) 핵산, 단백질, 또는 미생물로부터 변형된 또는 개작된 핵산, 단백질, 또는 미생물을 나타낸다. 이러한 변형 또는 개작(adaptations)에는 전형적으로 핵산 또는 유전자의 삽입, 결손, 돌연변이, 또는 치환이 포함된다. 일반적으로, 본 발명의 미생물은 모계 미생물로부터 유도된다. 한 구체예에서, 본 발명의 미생물은 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 또는 클로스트리듐 라가스다레이로부터 유도된다. 바람직한 구체예에서, 본 발명의 미생물은 DSMZ 수탁 번호 DSM23693로 기탁된 클로스트리듐 오토에타노게눔 LZ1561로부터 유도된다.
본 발명의 미생물은 기능적 특성에 따라 세분될 수 있다. 예를 들면, 본 발명의 미생물은 C1 고정 미생물, 혐기성 미생물, 아세토겐, 에타놀로겐, 일산화탄소요구성 및/또는 메타노겐이거나, 또는 이들로부터 유도될 수 있다. 표 1은 대표적인 미생물 목록을 제공하고, 그 기능적 특성을 제공한다.
Figure 112017116259310-pct00010
Figure 112017116259310-pct00011
Figure 112017116259310-pct00012
“C1”이란 한 개의 탄소 분자, 예를 들면, CO, CO2, CH4, 또는 CH3OH를 말한다. “C1-옥시게네이트”는 적어도 한 개의 산호 원자를 포함하는 한 개의 탄소 분자, 예를 들면, CO, CO2, 또는 CH3OH를 말한다. “C1-탄소 공급원”이란 본 발명의 미생물을 위한 부분적 또는 유일한 탄소원으로서 작용하는 한 개의 탄소-분자를 지칭한다. 예를 들면, C1-탄소 공급원은 CO, CO2, CH4, CH3OH, 또는 CH2O2중 하나 또는 그 이상을 포함할 수 있다. 바람직하게는, C1-탄소 공급원은 CO와 CO2중 하나, 또는 이 둘 모두를 포함한다. “C1-고정 미생물(C1-fixing microorganism)”이란 C1- 탄소원으로부터 하나 이상의 산물을 생산하는 능력을 가진 미생물을 말한다. 전형적으로, 본 발명의 미생물은 C1-고정 세균이다. 바람직한 구체예에서, 본 발명의 미생물은 표 1에서 확인된 C1-고정 미생물로부터 유도된다.
"혐기성균(anaerobe)"은 성장하는데 산소를 필요로 하지 않는 미생물이다. 혐기성균은 산소가 존재하면 부정적으로 반응하거나 또는 심지어 죽을 수도 있다. 전형적으로, 본 발명의 미생물은 혐기성균이다. 바람직한 구체예에서, 본 발명의 미생물은 표 1에서 확인된 혐기성균으로부터 유도된다.
"아세토겐(acetogen)"이란 혐기성 호흡의 산물로서 아세테이트 (또는 아세트산)를 생산하거나 생산할 수 있는 미생물이다. 전형적으로, 아세토겐은 에너지 보존 및 아세틸 -CoA 및 아세틸 -CoA 유도 산물, 이를 테면 아세테이트의 합성을 위한 주요 기전으로서, 우드-융돌(Wood-Ljungdahl) 경로를 사용하는 의무적 혐기성 박테리아이다(Ragsdale, Biochim Biophys Acta, 1784: 1873-1898, 2008). 아세토겐은 아세틸-CoA 경로를 (1) CO2로부터 아세틸-CoA의 환원 합성을 위한 기전으로, (2) 말단 전자-수용, 에너지 보존 프로세스로, (3) 세포의 탄소 합성에서 이산화탄소의 고정 (동화) 기전으로 이용한다(Drake, Acetogenic Prokaryotes, In: The Prokaryotes, 3rd edition, p. 354, New York, NY, 2006). 모든 자연 발생적 아세토겐은 C1-고정, 혐기성, 자가영양성, 그리고 비-메탄영양요구성이다. 전형적으로, 본 발명의 미생물은 아세토겐이다. 바람직한 구체예에서, 본 발명의 미생물은 표 1에서 확인된 아세토겐으로부터 유도된다.
“에타놀로겐(ethanologen)” 은 에탄올을 생산하거나 또는 생산할 수 있는 미생물이다. 전형적으로, 본 발명의 미생물은 에타놀로겐이다. 바람직한 구체예에서, 본 발명의 미생물은 표 1에서 확인된 에타놀로겐으로부터 유도된다.
“자가영양요구성(autotroph)”이란 유기 탄소 부재하에 성장할 수 있는 미생물이다. 대신, 자가영양요구성은 무기 탄소 공급원, 이를 테면 CO 및/또는 CO2를 이용한다. 전형적으로, 본 발명의 미생물은 자가영양요구성이다. 바람직한 구체예에서, 본 발명의 미생물은 표 1에서 확인된 자가영양요구성으로부터 유도된다.
“일산화탄소요구성(carboxydotroph)”은 유일한 탄소 공급원로 CO를 이용할 수 있는 미생물이다. 전형적으로, 본 발명의 미생물은 일산화탄소요구성이다. 바람직한 구체예에서, 본 발명의 미생물은 표 1에서 확인된 일산화탄소요구성으로부터 유도된다.
“메탄영양요구성(methanotroph)”은 탄소와 에너지의 유일한 공급원으로써 메탄을 이용할 수 있는 미생물이다. 특정 구체예들에 있어서, 본 발명의 미생물은 메탄영양요구성으로부터 유도된다.
더욱 광범위하게, 본 발명의 미생물은 표 1에서 확인된 임의의 속(genus) 또는 종(species)으로부터 유도될 수 있다. 바람직한 구체예에서, 본 발명의 미생물은 클로스트리듐 세균이다.
바람직한 구체예에서, 본 발명의 미생물은 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 그리고 클로스트리듐 라가스다레이종을 포함하는 클로스트리디아(clostridia) 클러스트로부터 유도된다. 이들 종은 Abrini, Arch Microbiol, 161: 345-351, 1994 (클로스트리듐 오토에타노게눔), Tanner, Int J System Bacteriol, 43: 232-236, 1993 (클로스트리듐 리중다레이), 그리고 Huhnke, WO 2008/028055 (클로스트리듐 라가스다레이)에서 최초 보고되고, 특징화되었다.
이들 3 종은 많은 유사성을 가진다. 구체적으로, 이들 종은 클로스트리듐 속의 모두 C1-고정, 혐기성, 초산생성, 에타놀로겐, 그리고 일산화탄소영양성 구성원이다. 이 종들은 유사한 유전자형과 표현형, 그리고 에너지 보존과 발효 대사의 방식을 가지고 있다. 더욱이, 이들 종은 99% 이상의 동일성을 가지고, 약 22-30 mol%의 DNA G + C 함량을 보유한 16S rRNA DNA를 갖는 클로스트리디아 rRNA 상동성 군 I에 군집되며, 그램-음성이며, 형태와 크기가 유사하고(0.5-0.7 x 3-5 μm 사이에서 대수적으로 성장하는 세포), 중온성(mesophilic) (30-37 ℃에서 최적으로 성장)이며, pH 약 4-7.5 (최적의 pH는 약 5.5-6임)의 유사한 pH 범위를 갖고, 사이토크롬이 결여되어 있고, 그리고 Rnf 보합체를 통하여 에너지를 보존한다. 또한, 이들 종에서 카르복시산은 상응하는 알코올로 환원되었다.(Perez, Biotechnol Bioeng, 110:1066-1077, 2012). 중요한 것은, 이 종들은 모두 CO를 함유한 기체에서 강한 자가영양성 (autotrophic) 성장을 보이고, 주요 발효 산물로써 에탄올과 아세테이트 (또는 아세트산)를 생산하며, 특정 조건에서 2,3-부탄디올과 젖산을 소량 생산한다.
그러나, 이들 세 종은 또한 많은 차이점을 가지고 있다. 이 종들은 상이한 출처로부터 분리되었다: 클로스트리듐 오토에타노게눔은 토끼 장으로부터, 클로스트리듐 리중다레이는 양계장 폐기물로부터, 그리고 클로스트리듐 라가스다레이는 담수 침전물로부터 분리되었다. 이들 종은 다양한 당 (예, 람노오스, 아라비노스), 산 (예, 글루코 네이트, 시트르산), 아미노산 (예, 아르기닌, 히스티딘) 및 기타 기질 (예, 베타인, 부탄올)의 용도에서 상이하다. 더욱이, 이들 종은 특정 비타민(가령, 티아민, 바이오틴)에 대하여 영양요구성이 상이하다. 이들 종은 우드-융둘(Wood-Ljungdahl) 경로 유전자와 단백질의 핵산과 아미노산 서열에서 차이가 있지만, 이들 유전자와 단백질의 일반적인 체계와 수는 모든 종에서 동일하다는 것이 밝혀졌다(Kopke, Curr Opin Biotechnol, 22: 320-325, 2011).
따라서, 요약하면, 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 또는 클로스트리듐 라가스다레이 의 특징중 많은 것들은 이종에 특이적이지 않으며, 클로스트리듐 속의 C1 고정, 혐기성, 아세토 제닉, 에타놀로겐 및 일산화탄소영양성 구성원에 대하여 오히려 일반적인 특징이다. 그러나, 이 종들은 사실상 구별되기 때문에, 이들 종의 유전자 변형 또는 조작은 이들 종의 또다른 것에서 동일한 효과를 가지지 않을 수도 있다. 예를 들어, 성장, 수행 또는 산물의 생산에 있어서 차이가 관찰될 수 있다,
본 발명의 미생물은 클로스트리듐 오토에타노게눔, 클로스트리듐 리중다레이, 또는 클로스트리듐 라가스다레이.의 분리주 또는 돌연변이체로부터 또한 유도될 수 있다. 클로스트리듐 오토에타노게눔 의 분리주 및 돌연변이체는 JA1-1 (DSM10061) (Abrini, Arch Microbiol, 161: 345-351, 1994), LBS1560 (DSM19630) (WO 2009/064200), 그리고 LZ1561 (DSM23693)을 포함한다. 클로스트리듐 리중다레이 의 분리주 및 돌연변이체는 ATCC 49587 (Tanner, Int J Syst Bacteriol, 43: 232-236, 1993), PETCT (DSM13528, ATCC 55383), ERI-2 (ATCC 55380) (US 5,593,886), C-01 (ATCC 55988) (US 6,368,819), O-52 (ATCC 55989) (US 6,368,819), 그리고 OTA-1 (Tirado-Acevedo, Production of bioethanol from synthesis gas using Clostridium ljungdahlii, PhD thesis, North Carolina State University, 2010)를 포함한다. 클로스트리듐 라가스다레이의 분리주 및 돌연변이체는 PI 1 (ATCC BAA-622, ATCC PTA-7826) (WO 2008/028055)를 포함한다.
“기질(Substrate)”이란 본 발명의 미생물의 탄소 및/또는 에너지 공급원을 지칭한다. 전형적으로, 상기 기질은 가스이며, C1-탄소 공급원, 예를 들면, CO, CO2, 및/또는 CH4를 포함한다. 바람직하게는, 상기 기질은 CO 또는 CO + CO2의 C1-탄소 공급원을 포함한다. 상기 기질은 다른 비-탄소 성분들, 이를 테면 H2, N2, 또는 전자를 더 포함할 수 있다.
상기 기질은 일반적으로 적어도 소량의 CO, 이를 테면 약 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 mol%의 CO를 포함할 수 있다. 상기 기질은 일정 범위의 CO, 이를 테면 약 20-80, 30-70, 또는 40-60 mol%의 CO를 포함할 수 있다. 바람직하게는, 상기 기질은 약 40-70 mol%의 CO (가령, 제강 공장 또는 고로 가스), 약 20-30 mol%의 CO (가령, 기본 산소 가마 가스), 또는 약 15-45 mol%의 CO (가령, 합성 가스)를 포함한다. 일부 구체예들에서, 상기 기질은 상대적으로 저량의 CO, 이를 테면 약 1-10 또는 1-20 mol%의 CO를 포함할 수 있다. 본 발명의 미생물은 전형적으로 상기 기질에 있는 적어도 일부분의 CO를 산물로 전환시킨다.
상기 기질은 약간의 양의 H2를 포함할 수 있다. 예를 들면, 상기 기질은 약 1, 2, 5, 10, 15, 20, 또는 30 mol%의 H2를 포함할 수 있다. 일부 구체예들에서, 상기 기질은 상대적으로 많은 양의 H2, 이를 테면 약 60, 70, 80, 또는 90 mol%의 H2를 포함할 수 있다. 추가 구체예들에서, 상기 기질은 실질적으로 H2를 포함하지 않는다.
상기 기질은 약간의 양의 CO2를 포함할 수 있다. 예를 들면, 상기 기질은 약 1-80 또는 1-30 mol%의 CO2를 포함할 수 있다. 일부 구체예들에서, 상기 기질은 약 20, 15, 10, 또는 5 mol% 미만의 CO2를 포함할 수 있다. 또다른 구체예에서, 상기 기질은 실질적으로 CO2를 포함하지 않는다.
상기 기질은 전형적으로 가스이지만, 상기 기질은 대체 형태로 또한 제공될 수 있다. 예를 들면, 상기 기질은 마이크로버블 분산 생성기를 사용하여 CO-함유 가스로 포화된 액체에 용해될 수 있다. 추가의 예로써, 기질은 고체 지지체 상에 흡착될 수 있다.
기질 및/또는 C1-탄소 공급원은 산업 공정의 부산물, 또는 자동차 배기 가스 또는 바이오매스 가스화와 같은 일부 다른 공급원로부터 얻어지는 폐가스일 수 있다. 특정 구체예들에 있어서, 상기 산업 공정은 철 금속 산물 제조, 이를 테면 제강 제조, 비-철 산물 제조, 석유 정제 공정, 석탄 가스화, 전력 생산, 카본 블랙 생산, 암모니아 생산, 메탄올 생산, 그리고 코크 제조로 구성된 집단에서 선택된다. 이들 구체예에서, 상기 기질 및/또는 C1-탄소 공급원은 대기로 방출되기 전에 임의의 편리한 방법을 사용하여 산업 공정으로부터 포획될 수 있다.
상기 기질 및/또는 C1-탄소 공급원은 합성 가스일 수 있는데, 이를 테면, 석탄 또는 정제 잔류물의 가스화, 바이오매스의 가스화 또는 천연 가스의 개질에 의해 얻어진 합성 가스일 수 있다. 상기 기질의 조성은 반응의 효율 및/또는 비용에 중요한 영향을 미칠 수 있다. 예를 들면, 산소(O2)의 존재는 혐기성 발효 공정의 효과를 감소시킬 수 있다. 상기 기질의 조성에 따라, 기질을 처리하거나, 문지러거나 또는 여과하여 독소, 원하지 않는 성분, 또는 먼지 입자와 같은 임의의 원하지 않는 불순물을 제거하고, 그리고/또는 바람직한 성분의 농도를 증가시키는 것이 바람직할 수 있다.
본 발명의 미생물은 배양되어, 하나 또는 그 이상의 산물이 만들어질 수 있다. 예를 들면, 클로스트리듐 오토에타노게눔은 다음을 생산하거나 또는 생산하도록 조작될 수 있다: 에탄올 (WO 2007/117157), 아세테이트 (WO 2007/117157), 부탄올 (WO 2008/115080 및 WO 2012/053905), 부티레이트 (WO 2008/115080), 2,3-부탄디올 (WO 2009/151342), 젖산염 (WO 2011/112103), 부텐 (WO 2012/024522), 부타디엔 (WO 2012/024522), 메틸 에틸 케톤 (2-부탄온) (WO 2012/024522 및 WO 2013/185123), 에틸렌 (WO 2012/026833), 아세톤 (WO 2012/115527), 이소프로판올 (WO 2012/115527), 지질 (WO 2013/036147), 3-히드록시프로피오네이트 (3-HP) (WO 2013/180581), 이소프렌 (WO 2013/180584), 지방산 (WO 2013/191567), 2-부탄올 (WO 2013/185123), 1,2-프로판디올 (WO 2014/0369152), 그리고 1-프로판올 (WO 2014/0369152). 하나 또는 그 이상의 표적 산물에 추가하여, 본 발명의 미생물은 에탄올, 아세테이트, 및/또는 2,3-부탄디올을 또한 만들 수 있다.
“선택성(Selectivity)”이란 미생물에 의해 만들어진 모든 발효 산물에 대하여 표적 산물의 생산 비율을 지칭한다. 본 발명의 미생물은 특정 선택성 또는 최소 선택성으로 산물을 만들도록 조작될 수 있다. 한 구체예에서, 표적 산물은 본 발명의 미생물에 의해 만들어지는 모든 발효 산물의 적어도 약 5%, 10%, 15%, 20%, 30%, 50%, 또는 75%를 차지한다. 한 구체예에서, 상기 표적 산물은 본 발명의 미생물에 의해 만들어지는 모든 발효 산물의 적어도 10%를 차지하고, 따라서 본 발명의 미생물은 상기 표적 산물에 대하여 적어도 10%의 선택성을 갖는다. 또다른 구체예에서, 상기 표적 산물은 본 발명의 미생물에 의해 만들어지는 모든 발효 산물의 적어도 30%를 차지하고, 따라서 본 발명의 미생물은 상기 표적 산물에 대하여 적어도 30%의 선택성을 갖는다.
전형적으로, 상기 배양은 생물반응장치에서 실행된다. 용어 “생물반응장치(bioreactor)”는 연속 교반 탱크 반응기 (CSTR), 고정화 셀 반응기 (ICR), 살수 배드 반응기 (TBR), 버블 칼럼 (bubble column), 가스 리프트 발효기(gas lift fermenter), 고정 믹서(static mixer), 또는 가스-액체 접촉에 적합한 기타 용기 또는 장치와 같은 하나 또는 그 이상의 용기, 타워 또는 파이핑 배열로 구성된 배양/발효 장치를 포함한다. 일부 구체예들에서, 상기 생물반응장치는 제 1 성장 반응기 및 제 2 배양/발효 반응기를 포함할 수 있다. 상기 기질은 이들 반응기 중 하나 또는 모두에 제공될 수 있다. 본원에 사용된 용어 "배양(culture)"과 "발효(fermentation)"는 호환적으로 사용된다. 이들 용어는 배양/발효 과정의 성장 단계와 산물 생합성 단계를 모두 포함한다.
배양은 일반적으로 미생물의 성장을 허용하는데 충분한 양분, 비타민 및/또는 미네랄을 함유하는 수성 배양 배지에서 유지된다. 바람직하게는, 수성 배양 배지는 혐기성 미생물 성장 배지, 이를 테면, 최소 혐기성 미생물 성장 배지이다. 적합한 배지는 당분야에 공지되어 있다.
배양/발효는 표적 산물의 생산에 적절한 조건 하에서 실시하는 것이 바람직하다. 고려해야 할 반응 조건은 압력 (또는 분압), 온도, 기체 유속, 액체 유속, 배지 pH, 배지 산화환원 전위, 교반 속도 (연속 교반 탱크 반응기를 사용하는 경우), 접종 수준, 액상의 기체가 제한적이 되지 않도록 최대 가스 기질 농도, 그리고 산물 억제를 피하기 위하여 최대 산물의 농도를 포함한다. 구체적으로, 기체-제한 조건 하에서 배양으로 인하여 산물이 소모될 수 있기 때문에, 기질의 유입 속도는 액상 기체 농도가 제한되지 않도록 조정될 수 있다.
고압에서 생물반응장치를 작동시키면 기체상으로부터 액체상으로 기체량 전달 속도가 증가된다. 따라서, 일반적으로 대기압보다 높은 압력에서 배양/발효를 수행하는 것이 바람직하다. 또한, 주어진 기체 전환율은 부분적으로 기질 잔류 시간에 대한 함수이며, 잔류 시간은 생물반응장치의 필요 용적량을 결정하기 때문에, 가압 시스템의 사용으로 요구되는 생물반응장치의 용적을 크게 감소시킬 수 있고, 결과적으로 배양/발효 장비의 자본 비용은 절감될 수 있다. 다시, 생물반응장치 안에 액체 용적을 주입 기체 유속으로 나눈 것으로 정의되는 잔류 시간은 대기압보다 오히려 상승된 압력으로 생물반응장치가 유지될 때, 또한 감소될 수 있다는 것을 의미한다. 최적의 반응 조건은 사용된 특정 미생물에 따라 부분적으로 달라질 것이다. 그러나, 일반적으로, 대기압보다 높은 압력에서 발효시키는 것이 바람직하다. 또한, 주어진 기체 전환율은 부분적으로 기질 잔류 시간에 대한 함수이며, 원하는 잔류 시간을 얻는 것은 생물반응장치의 필요 용적량을 결정하기 때문에, 가압 시스템의 사용으로 요구되는 생물반응장치의 용적을 크게 감소시킬 수 있고, 결과적으로 발효 장비의 자본 비용은 절감될 수 있다.
표적 산물은 당업계에 공지된 임의의 방법 또는 방법의 조합, 예를 들어 분별 증류, 증발, 투석증발(pervaporation), 가스 스트리핑, 상 분리 및 액체 추출이 포함된 추출 발효를 사용하여 발효액으로부터 분리 또는 정제될 수 있다 . 특정 구체예들에 있어서, 표적 산물들은 생물반응장치로부터 발효액의 일부를 연속적으로 제거하고, 발효액으로부터 미생물 세포를 분리하고 (통상적으로 여과를 통하여), 그리고 발효액으로부터 하나 이상의 표적 산물을 회수한다. 알코올 및/또는 아세톤은 예를 들면, 증류에 의해 회수될 수 있다. 산은 예를 들면, 활성탄에서 흡착시킴으로써, 회수될 수 있다. 분리된 미생물 세포들은 생물반응장치로 되돌려보내는 것이 바람직하다. 표적 산물이 제거된 후에 남아있는 무-세포 투과액(permeate)도 생물반응장치로 되돌려보내는 것이 바람직하다. 생물반응장치로 되돌리기에 앞서, 배지를 보충하기 위해, 비타민 B와 같은 추가 영양분을 무-세포 투과액에 첨가할 수 있다.
실시예
하기 실시예들은 본 발명을 추가로 설명하지만, 본 발명의 범주를 어떤 방식으로도 제한하는 것으로 해석되어서는 안된다.
실시예 1
본 실시예는 C. 오토에타노게눔C. 리중다레이를 배양하는 일반적인 방법을 기술한다.
C. 오토에타노게눔 DSM10061 및 DSM23693 (DSM10061의 유도물) 그리고 C. 리중다레이 DSM13528는 DSMZ (The German Collection of Microorganisms and Cell Cultures, Inhoffenstraße 7 B, 38124 Braunschweig, Germany)에서 구하였다.
균주들은 표준 혐기성 기술을 이용하여 37 ℃, PETC 배지, pH 5.6에서 성장시켰다 (Hungate, Methods Microbiol, 3B: 117-132, 1969; Wolfe, Adv Microbiol Physiol, 6: 107-146, 1971). 과당 (종속영양성 성장) 또는 공간 부분에서 30 psi의 CO-함유하는 제강 가스 (뉴질랜드 New Zealand Steel site에서 수집; 조성: 44% CO, 32% N2, 22% CO2, 2% H2) (자가영양성 성장)를 기질로 이용하였다. 고체 배지의 경우, 1.2 % 박토 한천(bacto agar) (BD, Franklin Lakes, NJ 07417, USA)가 추가되었다.
Figure 112017116259310-pct00013
Figure 112017116259310-pct00014
Figure 112017116259310-pct00015
실시예 2
본 실시예는 p-히드록시벤조에이트 발현 플라스미드를 포함하는 균주의 구축을 실증한다.
코리스메이트 피루베이트 분해효소 (ubiC)의 뉴클레오티드 서열(서열번호: 1)은 C. 오토에타노게눔 코돈-사용 표(GeneArt)에 따라 최적화시키고 (서열번호: 2), 우드-융돌(Wood-Ljungdahl) 경로 프로모터 (US 20110256600)의 제어 하에 pMTL8315 발현 벡터 (도 7) 안으로 클론시켰다. 피드백-비감성 돌연변이체 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 합성효소 (aroG*)의 코딩 서열 (서열번호: 8)은 바이시스트로닉 형식에서 ubiC에 따라 또한 포함되었다 (도 7). 플라스미드 pARO_01 (서열번호: 9)는 공여자로써 대장균 균주 CA434와 접합을 통하여 C. 오토에타노게눔 LZ1561 (DSM23693)으로 형질변환되었다. 공여자 균주는 25 μg/mL 클로람페니콜 및 100 μg/mL 스펙티노마이신이 보충된 LB 배지에서 하룻밤 동안 성장되었다. 1.5 mL의 배양물로부터 세포는 원심분리를 통하여 수거하고, 인산염 완충 염수 (PBS)로 세척되었다. 혐기성 작업대 안에서, 공여자 세포 펠렛을 200 μL의 지수적으로 성장한 수령체 LZ1561에 재현탁시켰다. 접합 혼합물을 PETC-MES 한천 배지 상에 찍어넣고, 37 ℃에서 배양하였다. 24 시간 후, 이 세포들을 접합 플레이트로부터 긁어내고, 7.5 μg 티암페니콜/mL (Sigma) 및 10 μg 트리메토프림/mL (Sigma)이 보충된 PETC-MES 한천 배지상에 도말하였다. 플라스미드를 품고있는 3개의 콜로니 (가령 생물학적 트리플리케이트) 분리주는 7.5 μg 티암페니콜/mL와 탄소 공급원으로써 제강 배지 가스를 모의한 가스 혼합물 (50 % CO, 10 % H2, 30 % CO2, 10 % N2, 이하 본 출원에서는 “제강 가스(mill gas)”로 지칭됨)이 함유된 PETC-MES 액체 배지에서 성장되었다.
액체 배양물은 티암페니콜과 22 psi의 제강 가스를 담고 있는 혈청 병 안에 10 mL PETC-MES 배지에서 성장되었다. 바이오매스 (도 8)와 pHBA (도 9a 및 도 9b)를 측정하기 위하여 시료를 매일 채취하였다.
pHBA를 측정하기 위하여, 시료 (100 μL)에 10 μL 0.1N NaOH를 찔러넣고, 냉동시키고, 그 다음 동결건조시켰다.  그 다음 이 시료는 100 μL BSTFA + TCMS (99:1) 및 피리딘 100 μL으로 유도화되었다.  그 다음 이 시료는 60 ℃에서 30 분간 항온처리되어, 카르복실산 기능기의 트리메틸실일 유도체가 형성되었다.   GC-MS 방법의 상세는 다음과 같다: 주사. 용적. 1uL; 주사. T 250 ℃; 분할 비 10:1. 초기 T 50 ℃ (5 분 유지); 최종 T 220 ℃ (20℃/min); 항속(const. flow) 1 mL/min (He 운반체 가스); 컬럼 Zebron ZB-5MS 30m x 0.25mm x 0.25μm. Varian Ion Trap 4000, 풀 스캔 모드 40-400 m/z에서 작동. Tune PFTBA
도 9a에서, LZ1561 (대조 균주)는 3개의 기술적 레플리케이트 (가령, 성장 및 시료채취 3회)를 갖는다. pARO_01를 갖는 LZ1561의 2개 생물학적 레플리케이트도 또한 준비되었고, 이들 각각은 3개의 기술적 레플리케이트를 가진다. “기술적 레플리케이트(Technical replicate)”란 별도의 실험에서 각 균주를 성장시키고, 시료채취하는 것을 말하며, “생물학적 레플리케이트(biological replicate)”는 스크래취(scratch)로부터 균주를 재생하는 것을 말한다. 이러한 방식으로, 레플리케이트는 이 미생물의 배경 생물학적 변이를 설명하는 반면, 기술적 레플리케이트는 배양, 샘플링 및 분석 방법을 포함한 기술적 측면으로 인한 변이를 설명한다. 도 9a는 pHBA가 별도 경우에서 반복적으로 생산되었다는 것을 보여준다. 도 8과 도 9b는 성장 및 pHBA 생산성의 전반적으로 나타낸다.
실시예 3
본 실시예는 가스 발효를 통하여 p-히드록시벤조에이트의 생산을 실증한다.
플라스미드 pARO_01 (서열번호: 9)를 품고 있는 C. 오토에타노게눔은 실시예 1에서 설명된 바와 같이, 제강 가스에서 성장되었다. 실시예 1에서 실행된 것과 같이, 배양물의 GC-MS 분석에서 코리스메이트 피루베이트 분해효소를 발현시키는 세균에 의해 pHBA가 만들어졌다는 것이 확인되었다. 이 방법을 이용한 pHBA 분석의 선형 범위는 0-12.5 mg/mL (도 5)이었다.
pHBA는 pHBA 표준의 잔류 시간 및 특징적인 단편 이온과 NIST 질량 분석 데이터베이스로부터의 예측된 특성 이온을 비교하여 검증되었다 (도 6).
pMTL8315 발현 벡터 상에 암호화된 코리스메이트-피루베이트 분해효소를 발현시키는 모든 배양물에서 pHBA 생산이 관찰되었다. 임의의 하나의 배양물에서 관찰된 pHBA의 정점 역가는 8일 후 17 mg pHBA/L이었다(도 9b). 상기 발현 벡터가 없는 대조 시료에서 pHBA는 관찰되지 않았다.
배양물에 존재하는 상기 유전적으로 조작된 세균에 의해 pHBA는 탐지가능한 수준으로 생성되었다.
실시예 4
본 실시예는 효소 공학을 통하여 pHBA의 생산을 증가시키는 실험 프로토콜을 실증한다.
UbiC는 pHBA의 잔류를 통하여 산물 억제를 받는다. ubiC를 암호화하는 핵산 서열은 상기 효소에 의한 산물 잔류에 관여하는 아미노산이 돌연변이되도록 변형되어, 이 산물의 방출은 증가될 수 있다. 이를 위하여, pHBA 결합에 관여하는 아미노산은 결합 산물을 가진 구조의 분석에 의해 동정된다. 산물 저해는 pHBA 결합 및 잔류에 관여하는 아미노산을 돌연변이시킴으로써 최소화된다. pHBA 수율에 있어서 가장 큰 촉매 효능을 갖는 효소를 확인하기 위해, ubiC 돌연변이체의 표적 라이브러리를 만들 수 있고, 이때 pHBA-결합 아미노산의 다양한 조합이 변형되고, 이러한 돌연변이 효소는 효소 분석법으로 분석할 수 있다. 그 다음 대부분 pHBA 생산성이 개선된 균주들을 입증하기 위하여, 개선된 돌연변이체들이 C. 오토에타노게눔 LZ1561에서 발현된다.
실시예 5
본 실시예는 살리실레이트 발현 플라스미드를 포함하는 균주의 구축을 실증한다.
pchA (서열번호: 4) 및 pchB (서열번호: 6)의 뉴클레오티드 서열은 코돈 최적화되었고, 테트라사이클린-유도성 프로모터의 제어 하에 발현 벡터 안으로 클론되었다. 이 플라스미드는 공여자로써 대장균 균주 CA434와 접합을 통하여 C. 오토에타노게눔 LZ1561 (DSM23693)으로 형질변환되었다. 공여자 균주는 25 μg/mL 클로람페니콜 및 100 μg/mL 스펙티노마이신이 보충된 LB 배지에서 하룻밤 동안 성장되었다. 1.5 mL의 배양물로부터 세포는 원심분리를 통하여 수거하고, 인산염 완충 염수 (PBS)로 세척되었다. 혐기성 작업대 안에서, 공여자 세포 펠렛을 200 μL의 지수적으로 성장한 수령체 C. 오토에타노게눔에 재현탁시켰다. 접합 혼합물을 PETC-MES 한천 배지 상에 찍어넣고, 37 ℃에서 배양하였다. 24 시간 후, 이 세포들을 접합 플레이트로부터 긁어내고, 7.5 μg 티암페니콜/mL (Sigma) 및 10 μg 트리메토프림/mL (Sigma)이 보충된 PETC-MES 한천 배지상에 도말하였다. 플라스미드를 품고 있는 3개의 콜로니 (가령 생물학적 트리플리케이트) 분리주는 7.5 μg 티암페니콜/mL와 탄소 공급원으로써 제강 가스가 함유된 PETC-MES 액체 배지에서 성장되었다.
액체 배양물은 티암페니콜과 22 psi의 제강 가스를 담고 있는 혈청 병 안에 10 mL PETC-MES 배지에서 성장되었다.
바이오매스를 분광광도계로 모니터링하였다 OD600 nm = 0.3에서 40 ng 무수물테트라사이클린/mL을 추가하여 살리실레이트 생합성 경로의 발현을 유도하였다. 듀플리케이트 배양물 (3개의 생물학적 트리플리케이트의 기술적 레플리케이트)는 무수물테트라사이클린 없이 성장되었고, 살리실레이트 생합성 경로은 유도안된 상태로 유지되었다. 시료를 매일 채취하였다.
Agilent CP-SIL 5CB-MS (50 m × 0.25 μm × 0.25 μm) 컬럼 및 오토샘플러가 구비된 Thermo Scientific ISQ LT GCMS를 이용하여, 기체 크로마토그래피 질량 분석(GCMS)에 의해 살리실레이트 농도가 측정되었다.  600 μL의 아세토니트릴과 50 μL 0.1N NaOH로 300 μL의 시료를 희석하여 시료를 준비하였다. 상기 시료는 볼텍스한 후, 14,000 rpm에서 3분 동안 원심분리되었고; 800 μL의 상청액은 유리 바이알로 이동된 후, 시료는 Thermo SpeedVac®에서 건조되었다. 건조 후, 이 시료는 22 mg/ml 메톡시아민 HCl이 포함된 100 μL의 피리딘 용액에 현탁되었고, 그 다음 봉해진 유리 바이알에서 60℃에서 60분간 가열되었다. 이후, 300 μL N,O-비스트리플로오르아세타미드(BSTFA)가 추가되었고, 봉해진 유리 바이알에서 60℃에서 60분간 가열되었다. 분석을 위하여 시료는 1.5 μL 주사를 이용하여 오토샘플러로 옮겨진다: 분할 비는 20대 1, 그리고 유입 온도는 250℃임. 크로마토크래피는 80 ℃ (유지 없음)에서 분당 3 ℃의 경사로 140℃까지, 그리고 분당 20 ℃의 경사로 230℃까지 오븐 프로그램과, 최종 4-분의 유지로 실시되었다. 컬럼 유속은 분당 38 cm2이며, 운반 가스는 헬륨이다.   MS 이온 공급원은 280 ℃에서 유지되었다. 정량화(Quantitation)는 정량화 이온을 위하여 267m/z를 이용하여 실행하였고, 퀄리파이어(qualifier) 이온으로서 135 및 45m/z가 사용되었다.
도 11a은 유도된 시료와 유도안된 시료에서 바이오매스 성장을 비교한 것을 나타낸다. 도 11b에서 살리실레이트가 반복적으로 생산되었다는 것을 보여준다.
실시예 6
본 실시예는 코리스메이트-유도된 산물들의 강화된 생산을 위한 pheA 녹아웃을 실증하였다.
pheA (가령, C. 오토에타노게눔, CAETHG_0905 (CP006763.1:973789..974925)에서)는 효소 프레페네이트 합성효소를 암호화하는 유전자다. 프레페네이트 합성효소는 코리스메이트가 방향족 아미노산 페닐알라닌 및 티로신의 전구물질인 프레페네이트로 전환을 촉매한다. pheA 기능은 ClosTron 방법 (Heap et al., J Microbiol Methods. 2010, 80(1):49-55)을 이용하여 이 유전자를 파괴함으로써 녹아웃되었다. ClosTron 플라스미드 pMTL007C-E2는 DNA2.0에 의해 생성되었고 공여자로써 대장균 균주 CA434 와 접합을 통하여 C. 오토에타노게눔 LZ1561 (DSM23693)으로 형질변환되었다. 공여자 균주는 25 μg/mL 클로람페니콜이 보충된 LB 배지에서 하룻밤 동안 성장되었다. 1.5 mL의 배양물로부터 세포는 원심분리를 통하여 수거하고, 인산염 완충 염수 (PBS)로 세척되었다. 혐기성 작업대 안에서, 공여자 세포 펠렛을 200 μL의 지수적으로 성장한 수령체 C. 오토에타노게눔 LZ1561에 재현탁시켰다. 접합 혼합물을 PETC 한천 배지 상에 찍어넣고, 37 ℃에서 배양하였다. 24 시간 후, 이 세포들을 접합 플레이트로부터 긁어내고, 500 μL PBS에 재현탁시키고, 그리고 7.5 μg/mL 티암페니콜 (Sigma) 및 10 μg/mL 트리메토프림 (Sigma)이 보충된 PETC 한천 배지 상에 도말하였다. 플라스미드를 품고있는 분리주는 탄소원으로 제강 가스와 함께 7.5 μg 티암페니콜/mL을 함유하는 PETC-MES 액체 배지에서 성장되었다.
항생제 클라리트로마이신 (5 μg/mL)이 함유된 PETC 고체 배지 상에 콜로니를 스트리킹하였다(streaked). 이 단계는 인트론 재표적 서열을 게놈에 통합하기 위해 선택되었다. 인트론 서열을 표적 부위에 통합시키면, 게놈에서 1800개의 염기쌍의 삽입을 초래하고, 이들은 콜로니 PCR에 의해 스크리닝되었다. 포지티브 ClosTron 돌연변이체의 PCR 산물은 정제되고, 서열화되어, 삽입 부위가 확인되었다.
액체 배양물은 클라리트로마이신과 22 psi의 제강 가스를 담고 있는 혈청 병안에 10 mL PETC-MES 배지에서 성장되었다. 이 혈청 병으로부터 글리세롤 스톡이 준비되었다.
생물반응장치 실험은 2 L BioFlo 115 워터 재킷 시스템(New Brunswick Scientific Corp., Edison, NJ)에서 실행되었는데, 작업 용적은 1.5 L이다. 상기 CSTR 시스템에는 6개-블레이드의 Rushton 임펠러 2개가 장착되어 있으며, 배플(baffles)은 발효액의 혼합과 가스의 액체량 이동을 개선시킨다. pH 및 산화-환원 전위 (ORP) 전극 (Broadley-James Corporation)은 해드플레이트를 통하여 삽입되었고, 5분 간격으로 이들의 판독이 기록되었다. 수산화암모늄 5 M 용액의 자동 첨가에 의해 pH는 5.0으로 유지되었다.
접종물은 글리세롤 스톡으로부터 준비되었다. 1 mL의 글리세롤 스톡은 탄소원으로 22 psi 제강 가스를 가진 PETC 배지 50ml로 전달되었다. 상기 배양물은 가시적인 성장이 관찰될 때까지 2-3일 동안 37 ℃에서 배양되었다. 그 다음 이 배양물을 이용하여 1L-Schott 병 안에 200 mL의 새로운 배지를 접종하였고, 제강 가스는 22 psi 압력으로 추가되었다. Schott 병은 발효통으로 이동하기에 앞서 다시 24-36시간 동안 배양되었다.
교반은 200 rpm로 설정되었으며, 가스 유속은 35 mL/min/L으로 설정되었다. 하루 뒤, 교반 속도는 4시간 간격으로 25 rpm씩 증분되어 최대 값 900 rpm이 되도록 하였다. 가스 유속은 표적 CO 수취가 이루어질 수 있는 최대 유속으로 4시간 간격으로 25 mL/min/L 씩 증가되었다. Na2S는 발효 전체 과정에 걸쳐 추가되는데, 초기 발효 속도 0.3 mL/h이며, 이후 헤드스페이스에서 H2S 농도가 200~ppm 아래로 떨어지면, 0.2 mL/h씩 증분되어 증가시켰다. H2S 농도와 함께, CO 및 H2 소비, 그리고 CO2 생산은 기체 크로마토그래피(GC)를 사용하여 매시간 측정되었다 HPLC를 사용하여 세포 질량 및 대사산물 농도를 결정하기 위해, 발효 과정에 걸쳐 일정한 간격으로 발효기로부터 액체 시료를 채취했다.
배치(batch) 모드로 시작한 후, OD가 2의 값에 도달하면 발효기를 연속 모드로 전환시켰다. 배지 및 양분 유입 속도는 하나 또는 이상의 정밀 연동 펌프 (Masterflex L/S 디지털 구동 펌프)에 의해 제어되었으며, 발효기 용적은 CSTR로부터 발효액 제거를 위해 펌프를 작동시키는 레벨 프로브를 사용하여 일정하게 유지되었다. 희석 비율은 한 단계에서 0.5 일-1 로 설정되었으며, 24시간 간격으로 1 일-1 에서 1.7 일-1 로 증가되었다.
상기 발효에 추가되는 추가 장비는 공극 크기가 0.2 μm이며, 표면적이 1,200 cm2인 중공 섬유막(GE Healthcare)이다. 이 막은 발효에서 세포 농도를 증가시키는데 사용되었다. 이 발효액을 막을 통해 고속으로 펌핑한 후, 발효기로 다시 되돌려 보내고, 무-세포 여과액의 흐름은 배지 펌프 속도보다 느린 속도로 여과액 탱크로 펌핑했다. 이로 인하여 발효통 안의 세균 세포의 잔류류 시간이 증가되었다.
도 10에 나타낸 바와 같이, GC-MS를 이용하여 3가지 새로운 화합물이 동정되었다. 이들 화합물은 cis-4-히드록시시클로헥산 카르복실산, 3,4-디히드록시벤조산, 그리고 2-아미노벤조산이다. 이들 화합물은 오직 pheA::CT 배양에서만 탐지되었고, 모계 균주 (LZ1561) 배양에서는 탐지되지 않았다.
3,4 디히드록시 벤조산, 2-아미노벤조산 및 cis-4-히드록시시클로헥산카르복실산 농도는 Agilent CP-SIL 5CB-MS (50 m × 0.25 μm × 0.25 μm) 컬럼, 오토샘플러, 그리고 불꽃 이온화 탐지기(FID)가 구비된 Agilent 6890N GC를 이용하여 기체 크로마토그래피(GC) 질량 분석에 의해 측정되었다.  시료는 400 μL의 시료를 400 μL의 아세토니트릴로 희석시키고, 14,000 rpm에서 3분 동안 원심분리하여 준비되었고; 이 상청액은 유리 바이알로 이동된 후, 시료는 Thermo SpeedVac®에서 건조되었다. 건조후, 이 시료는 400 μL의 N,O-비스트리플로오르아세타미드(BSTFA) 및 피리딘(3:1 비율)의 용액에 재현탁되었고, 봉해진 유리 바이알에서 60℃에서 60분간 가열되었다. 시료는 1 μL 주사를 이용하여 분석을 위한 오토샘플러로 옮겨진다: 분할 비는 30대 1, 그리고 유입 온도는 250℃임. 크로마토크래피는 70 ℃ (유지 없음)에서 분당 3 ℃의 경사로 110℃까지, 그리고 분당 15 ℃의 경사로 230℃까지, 그리고 분당 40 ℃의 최종 경사로 310℃까지의 오븐 프로그램과, 최종 3-분의 유지로 실시되었다. 컬럼 유속은 분당 1.8 ml이며, 운반 가스는 헬륨이다.   FID는 320 ℃에서 유지되었으며, 수소는 40 ml/min에서, 공기는 400 ml/min에서, 그리고 메이커업 가스(makeup gas)로써 헬륨은 20 ml/min로 유지되었다.
도 12는 발효 운용 과정에 걸쳐 cis-4-히드록시시클로헥산 카르복실산, 3,4-디히드록시벤조산, 그리고 2-아미노벤조산의 농도를 보여준다. 도 12에 나타난 바와 같이, 발효 6일차에 화합물 cis-4-히드록시시클로헥산카르복실산는 약 0.9g/L의 농도로 증가되었다. 2-아미노벤조산는 발효 8-9일차에 약 0.45g/L의 농도로 축적되었다. 3,4-디히드록시벤조산은 더 적은 양으로 생성되었는데, 6-8일차에 대략 0.3g/L의 농도에서 정점을 찍었다. 6일차에 관찰된 cis-4-히드록시시클로헥산카르복실산, 2-아미노벤조산 및 3,4-디히드록시벤조산의 전체 축적은 >1.3 g/L이었다.
cis-4-히드록시시클로헥산카르복실산 생산에 대하여 문헌에서 공지된 것은 거의 없다. GC-MS를 이용하여 어린이 소변에서 cis-4 히드록시시클로헥산카르복실산이 탐지되었다는 유일한 보고가 있다. 이 화합물은 장내 세균 대사의 부산물로 이라고 가설이 있다 (Kronick, Clinica Chimica Acta, 132: 205-208, 1983). 이 화합물은 반응 기전이 피루베이트 분자의 절단에 이어, NAD(P)H를 통하여 제공될 수 있는 추가 2.5 H2 분자를 필요로 하는 환원에 의해 설명될 수 있기 때문에, 코리스메이트 또는 프레파네이트의 직접적인 반응 산물로 보인다.
2-아미노벤조산은 상기 코리스메이트에서 트립토판 경로의 알려진 중간산물이다. 안트라닐레이트 합성효소는 아민화에 이어 코리스메이트의 방향족화를 촉매하여, 트립토판 분자의 방향족 골격을 얻게 된다. 안트라닐레이트 합성효소의 유전자 발현은 고도로 조절되고, 최종 산물 트립토판에 의한 피드백 억제를 받게되는 것으로 알려져 있다 (Dosselaere, Crit Rev Microbiol, 27: 75-131, 2001). 2-아미노벤조산은 성장이 멈출 때만 발효액으로 분비되며, 이것은 성장이 중단될 때, 더 이상 반응하지 않은 과다유출 산물임을 나타낸다.
본원에 인용된 출판물, 특허 출원 및 특허를 포함하는 모든 문헌은 각각의 문헌이 개별적으로, 그리고 참고 문헌으로 인용된 것으로서 본원에 그 전문이 기재되어있는 것과 동일한 정도로 참고 자료에 편입된다. 이 명세의 선행 기술에 대한 언급은 선행 기술이 임의의 나라에서 노력 분야에서 일반적인 지식의 일부를 구성한다는 것을 인정하는 것이 아니며, 그렇게 받아들여서도 안된다.
본 발명을 설명하는 맥락에서 (특히 이하의 청구 범위의 문맥에서) 단수("a" 및 "an" 그리고 "the") 및 유사한 지시자의 사용은 명시적되거나 또는 명백하게 상반되는 기재가 없는 한, 단수와 복수를 포괄하는 것으로 해석되어야 한다. "포함하는(comprising)", "갖는(having)", "포함하는(including) "및 "함유하는(containing)" 용어들은 다른 언급이 없는 한, 개방형-용어 (즉, "포함하지만 이에 국한되지 않는"을 의미 함)로 해석되어야 한다. 본원에서 값의 범위 언급은 단지 본원에서 다른 언급이 없는 한, 범위 내에 속하는 각각의 개별 값을 개별적으로 언급하는 약식 방법으로 이용하기 위한 것이며, 각각의 개별 값은 본 명세서에서 개별적으로 인용된 것처럼 명세서에 통합된다. 본원에 기술된 모든 방법은 본원에서 달리 지시되지 않는 한, 또는 명백한 반대 지시가 없는 한, 임의의 적합한 순서로 수행될 수 있다. 본 명세서에서 제공된 임의의 그리고 모든 실시예 또는 예시적인 언어 (예를 들어, "~와 같은")의 사용은 다른 언급이 없는 한, 본 발명을 보다 잘 나타내도록 의도된 것이며, 본 발명의 범위를 제한하지 않는다. 명세서에서 어떠한 언어도 본 발명의 실시에 필수적인 것으로 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안된다.
본 발명의 바람직한 구체예들이 본원에 기술된다. 상기 바람직한 구체예들의 변형은 전술한 설명을 읽음으로써 당업자에게 자명해질 수 있다. 본 발명자는 숙련된 기술자들이 그러한 변형을 적절하게 사용할 것을 기대하며, 본 발명자는 본 발명이 본원에 구체적으로 기술된 것과 다르게 실시되도록 만들었다. 따라서, 본 발명은 적용 가능한 법률에 의해 허용된 바와 같이, 본 명세서에 첨부된 청구 범위에 기재된 주제의 모든 변경 및 등가물을 포함한다. 또한, 본원에서 달리 지시되지 않는 한 또는 문맥에 의해 명확하게 모순되지 않는 한, 모든 가능한 변형에서 상기 언급 된 요소의 임의의 조합이 본 발명에 포함된다.
SEQUENCE LISTING <110> UCL Business PLC <120> Cell <130> P106294PCT <150> GB 1509413.9 <151> 2015-06-01 <160> 63 <170> PatentIn version 3.5 <210> 1 <211> 619 <212> PRT <213> Homo sapiens <400> 1 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro Gln Arg Arg Ile Asp Thr Leu Asn 275 280 285 Ser Asp Gly Tyr Thr Pro Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys 290 295 300 Pro Arg Pro Met Pro Met Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser 305 310 315 320 Asp Pro Glu Glu Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn 325 330 335 Leu Leu Ile Ala Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val 340 345 350 Arg Gln Gly Val Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile 355 360 365 Lys Val Leu Lys Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met 370 375 380 Arg Glu Ala Gln Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg 385 390 395 400 Leu Ile Gly Val Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met 405 410 415 Ala Gly Gly Gly Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu 420 425 430 Ile Pro Val Ser Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly 435 440 445 Met Lys Tyr Leu Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala 450 455 460 Arg Asn Val Leu Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe 465 470 475 480 Gly Leu Ser Lys Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg 485 490 495 Ser Ala Gly Lys Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn 500 505 510 Phe Arg Lys Phe Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr 515 520 525 Met Trp Glu Ala Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys 530 535 540 Gly Pro Glu Val Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys 545 550 555 560 Pro Pro Glu Cys Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp 565 570 575 Ile Tyr Lys Trp Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg 580 585 590 Met Arg Ala Cys Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro 595 600 605 Gly Ser Thr Gln Lys Ala Glu Ala Ala Cys Ala 610 615 <210> 2 <211> 280 <212> PRT <213> Artificial Sequence <220> <223> ZAP70 complete SH2 domain <400> 2 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro 275 280 <210> 3 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> ZAP70 SH2 1 <400> 3 Phe Phe Tyr Gly Ser Ile Ser Arg Ala Glu Ala Glu Glu His Leu Lys 1 5 10 15 Leu Ala Gly Met Ala Asp Gly Leu Phe Leu Leu Arg Gln Cys Leu Arg 20 25 30 Ser Leu Gly Gly Tyr Val Leu Ser Leu Val His Asp Val Arg Phe His 35 40 45 His Phe Pro Ile Glu Arg Gln Leu Asn Gly Thr Tyr Ala Ile Ala Gly 50 55 60 Gly Lys Ala His Cys Gly Pro Ala Glu Leu Cys Glu Phe Tyr Ser Arg 65 70 75 80 Asp Pro Asp Gly Leu Pro Cys Asn Leu Arg Lys Pro Cys 85 90 <210> 4 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> ZAP70 SH2 2 <400> 4 Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys Leu Tyr 1 5 10 15 Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg Lys Glu 20 25 30 Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val Tyr His 35 40 45 Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro Glu Gly 50 55 60 Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys Leu Lys 65 70 75 80 Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys 85 90 <210> 5 <211> 595 <212> PRT <213> Homo sapiens <400> 5 Met Val Arg Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr 1 5 10 15 Leu Leu Lys Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser 20 25 30 Arg Lys Asn Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln 35 40 45 Val Thr His Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr 50 55 60 Gly Gly Glu Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr 65 70 75 80 Gln Gln Gln Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu 85 90 95 Lys Tyr Pro Leu Asn Cys Ser Asp Pro Thr Ser Glu Arg Trp Tyr His 100 105 110 Gly His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly 115 120 125 Glu Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln Pro Gly Asp 130 135 140 Phe Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser 145 150 155 160 Pro Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly Gly Arg Tyr 165 170 175 Thr Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp Leu Val Glu 180 185 190 His Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr 195 200 205 Leu Arg Gln Pro Tyr Tyr Ala Thr Arg Val Asn Ala Ala Asp Ile Glu 210 215 220 Asn Arg Val Leu Glu Leu Asn Lys Lys Gln Glu Ser Glu Asp Thr Ala 225 230 235 240 Lys Ala Gly Phe Trp Glu Glu Phe Glu Ser Leu Gln Lys Gln Glu Val 245 250 255 Lys Asn Leu His Gln Arg Leu Glu Gly Gln Arg Pro Glu Asn Lys Gly 260 265 270 Lys Asn Arg Tyr Lys Asn Ile Leu Pro Phe Asp His Ser Arg Val Ile 275 280 285 Leu Gln Gly Arg Asp Ser Asn Ile Pro Gly Ser Asp Tyr Ile Asn Ala 290 295 300 Asn Tyr Ile Lys Asn Gln Leu Leu Gly Pro Asp Glu Asn Ala Lys Thr 305 310 315 320 Tyr Ile Ala Ser Gln Gly Cys Leu Glu Ala Thr Val Asn Asp Phe Trp 325 330 335 Gln Met Ala Trp Gln Glu Asn Ser Arg Val Ile Val Met Thr Thr Arg 340 345 350 Glu Val Glu Lys Gly Arg Asn Lys Cys Val Pro Tyr Trp Pro Glu Val 355 360 365 Gly Met Gln Arg Ala Tyr Gly Pro Tyr Ser Val Thr Asn Cys Gly Glu 370 375 380 His Asp Thr Thr Glu Tyr Lys Leu Arg Thr Leu Gln Val Ser Pro Leu 385 390 395 400 Asp Asn Gly Asp Leu Ile Arg Glu Ile Trp His Tyr Gln Tyr Leu Ser 405 410 415 Trp Pro Asp His Gly Val Pro Ser Glu Pro Gly Gly Val Leu Ser Phe 420 425 430 Leu Asp Gln Ile Asn Gln Arg Gln Glu Ser Leu Pro His Ala Gly Pro 435 440 445 Ile Ile Val His Cys Ser Ala Gly Ile Gly Arg Thr Gly Thr Ile Ile 450 455 460 Val Ile Asp Met Leu Met Glu Asn Ile Ser Thr Lys Gly Leu Asp Cys 465 470 475 480 Asp Ile Asp Ile Gln Lys Thr Ile Gln Met Val Arg Ala Gln Arg Ser 485 490 495 Gly Met Val Gln Thr Glu Ala Gln Tyr Lys Phe Ile Tyr Val Ala Ile 500 505 510 Ala Gln Phe Ile Glu Thr Thr Lys Lys Lys Leu Glu Val Leu Gln Ser 515 520 525 Gln Lys Gly Gln Glu Ser Glu Tyr Gly Asn Ile Thr Tyr Pro Pro Ala 530 535 540 Met Lys Asn Ala His Ala Lys Ala Ser Arg Thr Ser Ser Lys His Lys 545 550 555 560 Glu Asp Val Tyr Glu Asn Leu His Thr Lys Asn Lys Arg Glu Glu Lys 565 570 575 Val Lys Lys Gln Arg Ser Ala Asp Lys Glu Lys Ser Lys Gly Ser Leu 580 585 590 Lys Arg Lys 595 <210> 6 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> PTPN6 SH2 complete domain <400> 6 Met Val Arg Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr 1 5 10 15 Leu Leu Lys Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser 20 25 30 Arg Lys Asn Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln 35 40 45 Val Thr His Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr 50 55 60 Gly Gly Glu Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr 65 70 75 80 Gln Gln Gln Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu 85 90 95 Lys Tyr Pro Leu Asn Cys Ser Asp Pro Thr Ser Glu Arg Trp Tyr His 100 105 110 Gly His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly 115 120 125 Glu Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln Pro Gly Asp 130 135 140 Phe Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser 145 150 155 160 Pro Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly Gly Arg Tyr 165 170 175 Thr Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp Leu Val Glu 180 185 190 His Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr 195 200 205 Leu Arg Gln Pro Tyr Tyr 210 <210> 7 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> PTPN6 SH2 1 <400> 7 Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr Leu Leu Lys 1 5 10 15 Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser Arg Lys Asn 20 25 30 Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln Val Thr His 35 40 45 Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr Gly Gly Glu 50 55 60 Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr Gln Gln Gln 65 70 75 80 Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu Lys Tyr Pro 85 90 95 Leu <210> 8 <211> 104 <212> PRT <213> Artificial Sequence <220> <223> PTPN6 SH2 2 <400> 8 Trp Tyr His Gly His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln 1 5 10 15 Ala Lys Gly Glu Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln 20 25 30 Pro Gly Asp Phe Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly 35 40 45 Pro Gly Ser Pro Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly 50 55 60 Gly Arg Tyr Thr Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp 65 70 75 80 Leu Val Glu His Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala 85 90 95 Phe Val Tyr Leu Arg Gln Pro Tyr 100 <210> 9 <211> 597 <212> PRT <213> Homo sapiens <400> 9 Met Thr Ser Arg Arg Trp Phe His Pro Asn Ile Thr Gly Val Glu Ala 1 5 10 15 Glu Asn Leu Leu Leu Thr Arg Gly Val Asp Gly Ser Phe Leu Ala Arg 20 25 30 Pro Ser Lys Ser Asn Pro Gly Asp Phe Thr Leu Ser Val Arg Arg Asn 35 40 45 Gly Ala Val Thr His Ile Lys Ile Gln Asn Thr Gly Asp Tyr Tyr Asp 50 55 60 Leu Tyr Gly Gly Glu Lys Phe Ala Thr Leu Ala Glu Leu Val Gln Tyr 65 70 75 80 Tyr Met Glu His His Gly Gln Leu Lys Glu Lys Asn Gly Asp Val Ile 85 90 95 Glu Leu Lys Tyr Pro Leu Asn Cys Ala Asp Pro Thr Ser Glu Arg Trp 100 105 110 Phe His Gly His Leu Ser Gly Lys Glu Ala Glu Lys Leu Leu Thr Glu 115 120 125 Lys Gly Lys His Gly Ser Phe Leu Val Arg Glu Ser Gln Ser His Pro 130 135 140 Gly Asp Phe Val Leu Ser Val Arg Thr Gly Asp Asp Lys Gly Glu Ser 145 150 155 160 Asn Asp Gly Lys Ser Lys Val Thr His Val Met Ile Arg Cys Gln Glu 165 170 175 Leu Lys Tyr Asp Val Gly Gly Gly Glu Arg Phe Asp Ser Leu Thr Asp 180 185 190 Leu Val Glu His Tyr Lys Lys Asn Pro Met Val Glu Thr Leu Gly Thr 195 200 205 Val Leu Gln Leu Lys Gln Pro Leu Asn Thr Thr Arg Ile Asn Ala Ala 210 215 220 Glu Ile Glu Ser Arg Val Arg Glu Leu Ser Lys Leu Ala Glu Thr Thr 225 230 235 240 Asp Lys Val Lys Gln Gly Phe Trp Glu Glu Phe Glu Thr Leu Gln Gln 245 250 255 Gln Glu Cys Lys Leu Leu Tyr Ser Arg Lys Glu Gly Gln Arg Gln Glu 260 265 270 Asn Lys Asn Lys Asn Arg Tyr Lys Asn Ile Leu Pro Phe Asp His Thr 275 280 285 Arg Val Val Leu His Asp Gly Asp Pro Asn Glu Pro Val Ser Asp Tyr 290 295 300 Ile Asn Ala Asn Ile Ile Met Pro Glu Phe Glu Thr Lys Cys Asn Asn 305 310 315 320 Ser Lys Pro Lys Lys Ser Tyr Ile Ala Thr Gln Gly Cys Leu Gln Asn 325 330 335 Thr Val Asn Asp Phe Trp Arg Met Val Phe Gln Glu Asn Ser Arg Val 340 345 350 Ile Val Met Thr Thr Lys Glu Val Glu Arg Gly Lys Ser Lys Cys Val 355 360 365 Lys Tyr Trp Pro Asp Glu Tyr Ala Leu Lys Glu Tyr Gly Val Met Arg 370 375 380 Val Arg Asn Val Lys Glu Ser Ala Ala His Asp Tyr Thr Leu Arg Glu 385 390 395 400 Leu Lys Leu Ser Lys Val Gly Gln Ala Leu Leu Gln Gly Asn Thr Glu 405 410 415 Arg Thr Val Trp Gln Tyr His Phe Arg Thr Trp Pro Asp His Gly Val 420 425 430 Pro Ser Asp Pro Gly Gly Val Leu Asp Phe Leu Glu Glu Val His His 435 440 445 Lys Gln Glu Ser Ile Val Asp Ala Gly Pro Val Val Val His Cys Ser 450 455 460 Ala Gly Ile Gly Arg Thr Gly Thr Phe Ile Val Ile Asp Ile Leu Ile 465 470 475 480 Asp Ile Ile Arg Glu Lys Gly Val Asp Cys Asp Ile Asp Val Pro Lys 485 490 495 Thr Ile Gln Met Val Arg Ser Gln Arg Ser Gly Met Val Gln Thr Glu 500 505 510 Ala Gln Tyr Arg Phe Ile Tyr Met Ala Val Gln His Tyr Ile Glu Thr 515 520 525 Leu Gln Arg Arg Ile Glu Glu Glu Gln Lys Ser Lys Arg Lys Gly His 530 535 540 Glu Tyr Thr Asn Ile Lys Tyr Ser Leu Val Asp Gln Thr Ser Gly Asp 545 550 555 560 Gln Ser Pro Leu Pro Pro Cys Thr Pro Thr Pro Pro Cys Ala Glu Met 565 570 575 Arg Glu Asp Ser Ala Arg Val Tyr Glu Asn Val Gly Leu Met Gln Gln 580 585 590 Gln Arg Ser Phe Arg 595 <210> 10 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> SHP-2 first SH2 domain <400> 10 Trp Phe His Pro Asn Ile Thr Gly Val Glu Ala Glu Asn Leu Leu Leu 1 5 10 15 Thr Arg Gly Val Asp Gly Ser Phe Leu Ala Arg Pro Ser Lys Ser Asn 20 25 30 Pro Gly Asp Phe Thr Leu Ser Val Arg Arg Asn Gly Ala Val Thr His 35 40 45 Ile Lys Ile Gln Asn Thr Gly Asp Tyr Tyr Asp Leu Tyr Gly Gly Glu 50 55 60 Lys Phe Ala Thr Leu Ala Glu Leu Val Gln Tyr Tyr Met Glu His His 65 70 75 80 Gly Gln Leu Lys Glu Lys Asn Gly Asp Val Ile Glu Leu Lys Tyr Pro 85 90 95 Leu <210> 11 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> SHP-2 second SH2 domain <400> 11 Trp Phe His Gly His Leu Ser Gly Lys Glu Ala Glu Lys Leu Leu Thr 1 5 10 15 Glu Lys Gly Lys His Gly Ser Phe Leu Val Arg Glu Ser Gln Ser His 20 25 30 Pro Gly Asp Phe Val Leu Ser Val Arg Thr Gly Asp Asp Lys Gly Glu 35 40 45 Ser Asn Asp Gly Lys Ser Lys Val Thr His Val Met Ile Arg Cys Gln 50 55 60 Glu Leu Lys Tyr Asp Val Gly Gly Gly Glu Arg Phe Asp Ser Leu Thr 65 70 75 80 Asp Leu Val Glu His Tyr Lys Lys Asn Pro Met Val Glu Thr Leu Gly 85 90 95 Thr Val Leu Gln Leu Lys Gln Pro Leu 100 105 <210> 12 <211> 211 <212> PRT <213> Artificial Sequence <220> <223> SHP-2 both SH2 domains <400> 12 Trp Phe His Pro Asn Ile Thr Gly Val Glu Ala Glu Asn Leu Leu Leu 1 5 10 15 Thr Arg Gly Val Asp Gly Ser Phe Leu Ala Arg Pro Ser Lys Ser Asn 20 25 30 Pro Gly Asp Phe Thr Leu Ser Val Arg Arg Asn Gly Ala Val Thr His 35 40 45 Ile Lys Ile Gln Asn Thr Gly Asp Tyr Tyr Asp Leu Tyr Gly Gly Glu 50 55 60 Lys Phe Ala Thr Leu Ala Glu Leu Val Gln Tyr Tyr Met Glu His His 65 70 75 80 Gly Gln Leu Lys Glu Lys Asn Gly Asp Val Ile Glu Leu Lys Tyr Pro 85 90 95 Leu Asn Cys Ala Asp Pro Thr Ser Glu Arg Trp Phe His Gly His Leu 100 105 110 Ser Gly Lys Glu Ala Glu Lys Leu Leu Thr Glu Lys Gly Lys His Gly 115 120 125 Ser Phe Leu Val Arg Glu Ser Gln Ser His Pro Gly Asp Phe Val Leu 130 135 140 Ser Val Arg Thr Gly Asp Asp Lys Gly Glu Ser Asn Asp Gly Lys Ser 145 150 155 160 Lys Val Thr His Val Met Ile Arg Cys Gln Glu Leu Lys Tyr Asp Val 165 170 175 Gly Gly Gly Glu Arg Phe Asp Ser Leu Thr Asp Leu Val Glu His Tyr 180 185 190 Lys Lys Asn Pro Met Val Glu Thr Leu Gly Thr Val Leu Gln Leu Lys 195 200 205 Gln Pro Leu 210 <210> 13 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> CD3-zeta endodomain <400> 13 Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly 1 5 10 15 Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr 20 25 30 Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys 35 40 45 Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys 50 55 60 Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg 65 70 75 80 Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala 85 90 95 Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg 100 105 110 <210> 14 <211> 754 <212> PRT <213> Artificial Sequence <220> <223> ZAP70-SH2 domain fused to a CD3-zeta endodomain <400> 14 Met Arg Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln 1 5 10 15 Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu 20 25 30 Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly 35 40 45 Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu 50 55 60 Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly 65 70 75 80 Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser 85 90 95 Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro 100 105 110 Pro Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Met Pro Asp Pro Ala Ala His Leu Pro 130 135 140 Phe Phe Tyr Gly Ser Ile Ser Arg Ala Glu Ala Glu Glu His Leu Lys 145 150 155 160 Leu Ala Gly Met Ala Asp Gly Leu Phe Leu Leu Arg Gln Cys Leu Arg 165 170 175 Ser Leu Gly Gly Tyr Val Leu Ser Leu Val His Asp Val Arg Phe His 180 185 190 His Phe Pro Ile Glu Arg Gln Leu Asn Gly Thr Tyr Ala Ile Ala Gly 195 200 205 Gly Lys Ala His Cys Gly Pro Ala Glu Leu Cys Glu Phe Tyr Ser Arg 210 215 220 Asp Pro Asp Gly Leu Pro Cys Asn Leu Arg Lys Pro Cys Asn Arg Pro 225 230 235 240 Ser Gly Leu Glu Pro Gln Pro Gly Val Phe Asp Cys Leu Arg Asp Ala 245 250 255 Met Val Arg Asp Tyr Val Arg Gln Thr Trp Lys Leu Glu Gly Glu Ala 260 265 270 Leu Glu Gln Ala Ile Ile Ser Gln Ala Pro Gln Val Glu Lys Leu Ile 275 280 285 Ala Thr Thr Ala His Glu Arg Met Pro Trp Tyr His Ser Ser Leu Thr 290 295 300 Arg Glu Glu Ala Glu Arg Lys Leu Tyr Ser Gly Ala Gln Thr Asp Gly 305 310 315 320 Lys Phe Leu Leu Arg Pro Arg Lys Glu Gln Gly Thr Tyr Ala Leu Ser 325 330 335 Leu Ile Tyr Gly Lys Thr Val Tyr His Tyr Leu Ile Ser Gln Asp Lys 340 345 350 Ala Gly Lys Tyr Cys Ile Pro Glu Gly Thr Lys Phe Asp Thr Leu Trp 355 360 365 Gln Leu Val Glu Tyr Leu Lys Leu Lys Ala Asp Gly Leu Ile Tyr Cys 370 375 380 Leu Lys Glu Ala Cys Pro Asn Ser Ser Ala Ser Asn Ala Ser Gly Ala 385 390 395 400 Ala Ala Pro Thr Leu Pro Ala His Pro Ser Thr Leu Thr His Pro Gln 405 410 415 Arg Arg Ile Asp Thr Leu Asn Ser Asp Gly Tyr Thr Pro Glu Pro Ala 420 425 430 Arg Ile Thr Ser Pro Asp Lys Pro Arg Pro Met Pro Met Asp Thr Ser 435 440 445 Val Tyr Glu Ser Pro Tyr Ser Asp Pro Glu Glu Leu Lys Asp Lys Lys 450 455 460 Leu Phe Leu Lys Arg Asp Asn Leu Leu Ile Ala Asp Ile Glu Leu Gly 465 470 475 480 Cys Gly Asn Phe Gly Ser Val Arg Gln Gly Val Tyr Arg Met Arg Lys 485 490 495 Lys Gln Ile Asp Val Ala Ile Lys Val Leu Lys Gln Gly Thr Glu Lys 500 505 510 Ala Asp Thr Glu Glu Met Met Arg Glu Ala Gln Ile Met His Gln Leu 515 520 525 Asp Asn Pro Tyr Ile Val Arg Leu Ile Gly Val Cys Gln Ala Glu Ala 530 535 540 Leu Met Leu Val Met Glu Met Ala Gly Gly Gly Pro Leu His Lys Phe 545 550 555 560 Leu Val Gly Lys Arg Glu Glu Ile Pro Val Ser Asn Val Ala Glu Leu 565 570 575 Leu His Gln Val Ser Met Gly Met Lys Tyr Leu Glu Glu Lys Asn Phe 580 585 590 Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Leu Val Asn Arg His 595 600 605 Tyr Ala Lys Ile Ser Asp Phe Gly Leu Ser Lys Ala Leu Gly Ala Asp 610 615 620 Asp Ser Tyr Tyr Thr Ala Arg Ser Ala Gly Lys Trp Pro Leu Lys Trp 625 630 635 640 Tyr Ala Pro Glu Cys Ile Asn Phe Arg Lys Phe Ser Ser Arg Ser Asp 645 650 655 Val Trp Ser Tyr Gly Val Thr Met Trp Glu Ala Leu Ser Tyr Gly Gln 660 665 670 Lys Pro Tyr Lys Lys Met Lys Gly Pro Glu Val Met Ala Phe Ile Glu 675 680 685 Gln Gly Lys Arg Met Glu Cys Pro Pro Glu Cys Pro Pro Glu Leu Tyr 690 695 700 Ala Leu Met Ser Asp Cys Trp Ile Tyr Lys Trp Glu Asp Arg Pro Asp 705 710 715 720 Phe Leu Thr Val Glu Gln Arg Met Arg Ala Cys Tyr Tyr Ser Leu Ala 725 730 735 Ser Lys Val Glu Gly Pro Pro Gly Ser Thr Gln Lys Ala Glu Ala Ala 740 745 750 Cys Ala <210> 15 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> PDCD1 endodomain <400> 15 Cys Ser Arg Ala Ala Arg Gly Thr Ile Gly Ala Arg Arg Thr Gly Gln 1 5 10 15 Pro Leu Lys Glu Asp Pro Ser Ala Val Pro Val Phe Ser Val Asp Tyr 20 25 30 Gly Glu Leu Asp Phe Gln Trp Arg Glu Lys Thr Pro Glu Pro Pro Val 35 40 45 Pro Cys Val Pro Glu Gln Thr Glu Tyr Ala Thr Ile Val Phe Pro Ser 50 55 60 Gly Met Gly Thr Ser Ser Pro Ala Arg Arg Gly Ser Ala Asp Gly Pro 65 70 75 80 Arg Ser Ala Gln Pro Leu Arg Pro Glu Asp Gly His Cys Ser Trp Pro 85 90 95 Leu <210> 16 <211> 141 <212> PRT <213> Artificial Sequence <220> <223> BTLA4 endodomain <400> 16 Lys Leu Gln Arg Arg Trp Lys Arg Thr Gln Ser Gln Gln Gly Leu Gln 1 5 10 15 Glu Asn Ser Ser Gly Gln Ser Phe Phe Val Arg Asn Lys Lys Val Arg 20 25 30 Arg Ala Pro Leu Ser Glu Gly Pro His Ser Leu Gly Cys Tyr Asn Pro 35 40 45 Met Met Glu Asp Gly Ile Ser Tyr Thr Thr Leu Arg Phe Pro Glu Met 50 55 60 Asn Ile Pro Arg Thr Gly Asp Ala Glu Ser Ser Glu Met Gln Arg Pro 65 70 75 80 Pro Pro Asp Cys Asp Asp Thr Val Thr Tyr Ser Ala Leu His Lys Arg 85 90 95 Gln Val Gly Asp Tyr Glu Asn Val Ile Pro Asp Phe Pro Glu Asp Glu 100 105 110 Gly Ile His Tyr Ser Glu Leu Ile Gln Phe Gly Val Gly Glu Arg Pro 115 120 125 Gln Ala Gln Glu Asn Val Asp Tyr Val Ile Leu Lys His 130 135 140 <210> 17 <211> 168 <212> PRT <213> Artificial Sequence <220> <223> LILRB1 endodomain <400> 17 Leu Arg His Arg Arg Gln Gly Lys His Trp Thr Ser Thr Gln Arg Lys 1 5 10 15 Ala Asp Phe Gln His Pro Ala Gly Ala Val Gly Pro Glu Pro Thr Asp 20 25 30 Arg Gly Leu Gln Trp Arg Ser Ser Pro Ala Ala Asp Ala Gln Glu Glu 35 40 45 Asn Leu Tyr Ala Ala Val Lys His Thr Gln Pro Glu Asp Gly Val Glu 50 55 60 Met Asp Thr Arg Ser Pro His Asp Glu Asp Pro Gln Ala Val Thr Tyr 65 70 75 80 Ala Glu Val Lys His Ser Arg Pro Arg Arg Glu Met Ala Ser Pro Pro 85 90 95 Ser Pro Leu Ser Gly Glu Phe Leu Asp Thr Lys Asp Arg Gln Ala Glu 100 105 110 Glu Asp Arg Gln Met Asp Thr Glu Ala Ala Ala Ser Glu Ala Pro Gln 115 120 125 Asp Val Thr Tyr Ala Gln Leu His Ser Leu Thr Leu Arg Arg Glu Ala 130 135 140 Thr Glu Pro Pro Pro Ser Gln Glu Gly Pro Ser Pro Ala Val Pro Ser 145 150 155 160 Ile Tyr Ala Thr Leu Ala Ile His 165 <210> 18 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> LAIR1 endodomain <400> 18 His Arg Gln Asn Gln Ile Lys Gln Gly Pro Pro Arg Ser Lys Asp Glu 1 5 10 15 Glu Gln Lys Pro Gln Gln Arg Pro Asp Leu Ala Val Asp Val Leu Glu 20 25 30 Arg Thr Ala Asp Lys Ala Thr Val Asn Gly Leu Pro Glu Lys Asp Arg 35 40 45 Glu Thr Asp Thr Ser Ala Leu Ala Ala Gly Ser Ser Gln Glu Val Thr 50 55 60 Tyr Ala Gln Leu Asp His Trp Ala Leu Thr Gln Arg Thr Ala Arg Ala 65 70 75 80 Val Ser Pro Gln Ser Thr Lys Pro Met Ala Glu Ser Ile Thr Tyr Ala 85 90 95 Ala Val Ala Arg His 100 <210> 19 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> CTLA4 endodomain <400> 19 Phe Leu Leu Trp Ile Leu Ala Ala Val Ser Ser Gly Leu Phe Phe Tyr 1 5 10 15 Ser Phe Leu Leu Thr Ala Val Ser Leu Ser Lys Met Leu Lys Lys Arg 20 25 30 Ser Pro Leu Thr Thr Gly Val Tyr Val Lys Met Pro Pro Thr Glu Pro 35 40 45 Glu Cys Glu Lys Gln Phe Gln Pro Tyr Phe Ile Pro Ile Asn 50 55 60 <210> 20 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> KIR2DL1 endodomain <400> 20 Gly Asn Ser Arg His Leu His Val Leu Ile Gly Thr Ser Val Val Ile 1 5 10 15 Ile Pro Phe Ala Ile Leu Leu Phe Phe Leu Leu His Arg Trp Cys Ala 20 25 30 Asn Lys Lys Asn Ala Val Val Met Asp Gln Glu Pro Ala Gly Asn Arg 35 40 45 Thr Val Asn Arg Glu Asp Ser Asp Glu Gln Asp Pro Gln Glu Val Thr 50 55 60 Tyr Thr Gln Leu Asn His Cys Val Phe Thr Gln Arg Lys Ile Thr Arg 65 70 75 80 Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp Ile Ile Val Tyr Thr 85 90 95 Glu Leu Pro Asn Ala Glu Ser Arg Ser Lys Val Val Ser Cys Pro 100 105 110 <210> 21 <211> 143 <212> PRT <213> Artificial Sequence <220> <223> KIR2DL4 endodomain <400> 21 Gly Ile Ala Arg His Leu His Ala Val Ile Arg Tyr Ser Val Ala Ile 1 5 10 15 Ile Leu Phe Thr Ile Leu Pro Phe Phe Leu Leu His Arg Trp Cys Ser 20 25 30 Lys Lys Lys Glu Asn Ala Ala Val Met Asn Gln Glu Pro Ala Gly His 35 40 45 Arg Thr Val Asn Arg Glu Asp Ser Asp Glu Gln Asp Pro Gln Glu Val 50 55 60 Thr Tyr Ala Gln Leu Asp His Cys Ile Phe Thr Gln Arg Lys Ile Thr 65 70 75 80 Gly Pro Ser Gln Arg Ser Lys Arg Pro Ser Thr Asp Thr Ser Val Cys 85 90 95 Ile Glu Leu Pro Asn Ala Glu Pro Arg Ala Leu Ser Pro Ala His Glu 100 105 110 His His Ser Gln Ala Leu Met Gly Ser Ser Arg Glu Thr Thr Ala Leu 115 120 125 Ser Gln Thr Gln Leu Ala Ser Ser Asn Val Pro Ala Ala Gly Ile 130 135 140 <210> 22 <211> 143 <212> PRT <213> Artificial Sequence <220> <223> KIR2DL5 endodomain <400> 22 Thr Gly Ile Arg Arg His Leu His Ile Leu Ile Gly Thr Ser Val Ala 1 5 10 15 Ile Ile Leu Phe Ile Ile Leu Phe Phe Phe Leu Leu His Cys Cys Cys 20 25 30 Ser Asn Lys Lys Asn Ala Ala Val Met Asp Gln Glu Pro Ala Gly Asp 35 40 45 Arg Thr Val Asn Arg Glu Asp Ser Asp Asp Gln Asp Pro Gln Glu Val 50 55 60 Thr Tyr Ala Gln Leu Asp His Cys Val Phe Thr Gln Thr Lys Ile Thr 65 70 75 80 Ser Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp Thr Thr Met Tyr 85 90 95 Met Glu Leu Pro Asn Ala Lys Pro Arg Ser Leu Ser Pro Ala His Lys 100 105 110 His His Ser Gln Ala Leu Arg Gly Ser Ser Arg Glu Thr Thr Ala Leu 115 120 125 Ser Gln Asn Arg Val Ala Ser Ser His Val Pro Ala Ala Gly Ile 130 135 140 <210> 23 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> KIR3DL1 endodomain <400> 23 Lys Asp Pro Arg His Leu His Ile Leu Ile Gly Thr Ser Val Val Ile 1 5 10 15 Ile Leu Phe Ile Leu Leu Leu Phe Phe Leu Leu His Leu Trp Cys Ser 20 25 30 Asn Lys Lys Asn Ala Ala Val Met Asp Gln Glu Pro Ala Gly Asn Arg 35 40 45 Thr Ala Asn Ser Glu Asp Ser Asp Glu Gln Asp Pro Glu Glu Val Thr 50 55 60 Tyr Ala Gln Leu Asp His Cys Val Phe Thr Gln Arg Lys Ile Thr Arg 65 70 75 80 Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp Thr Ile Leu Tyr Thr 85 90 95 Glu Leu Pro Asn Ala Lys Pro Arg Ser Lys Val Val Ser Cys Pro 100 105 110 <210> 24 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> KIR3DL3 endodomain <400> 24 Lys Asp Pro Gly Asn Ser Arg His Leu His Val Leu Ile Gly Thr Ser 1 5 10 15 Val Val Ile Ile Pro Phe Ala Ile Leu Leu Phe Phe Leu Leu His Arg 20 25 30 Trp Cys Ala Asn Lys Lys Asn Ala Val Val Met Asp Gln Glu Pro Ala 35 40 45 Gly Asn Arg Thr Val Asn Arg Glu Asp Ser Asp Glu Gln Asp Pro Gln 50 55 60 Glu Val Thr Tyr Ala Gln Leu Asn His Cys Val Phe Thr Gln Arg Lys 65 70 75 80 Ile Thr Arg Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp Thr Ser 85 90 95 Val <210> 25 <211> 701 <212> PRT <213> Artificial Sequence <220> <223> PTPN6-SH2 domain fused to a PD1 endodomain <400> 25 Met Thr Gly Gln Pro Leu Lys Glu Asp Pro Ser Ala Val Pro Val Phe 1 5 10 15 Ser Val Asp Tyr Gly Glu Leu Asp Phe Gln Trp Arg Glu Lys Thr Pro 20 25 30 Glu Pro Pro Val Pro Cys Val Pro Glu Gln Thr Glu Tyr Ala Thr Ile 35 40 45 Val Phe Pro Ser Gly Met Gly Thr Ser Ser Pro Ala Arg Arg Gly Ser 50 55 60 Ala Asp Gly Pro Arg Ser Ala Gln Pro Leu Arg Pro Glu Asp Gly His 65 70 75 80 Cys Ser Trp Pro Leu Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 85 90 95 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Val Arg Trp Phe His 100 105 110 Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr Leu Leu Lys Gly Arg Gly 115 120 125 Val His Gly Ser Phe Leu Ala Arg Pro Ser Arg Lys Asn Gln Gly Asp 130 135 140 Phe Ser Leu Ser Val Arg Val Gly Asp Gln Val Thr His Ile Arg Ile 145 150 155 160 Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr Gly Gly Glu Lys Phe Ala 165 170 175 Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr Gln Gln Gln Gly Val Leu 180 185 190 Gln Asp Arg Asp Gly Thr Ile Ile His Leu Lys Tyr Pro Leu Asn Cys 195 200 205 Ser Asp Pro Thr Ser Glu Arg Trp Tyr His Gly His Met Ser Gly Gly 210 215 220 Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly Glu Pro Trp Thr Phe Leu 225 230 235 240 Val Arg Glu Ser Leu Ser Gln Pro Gly Asp Phe Val Leu Ser Val Leu 245 250 255 Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser Pro Leu Arg Val Thr His 260 265 270 Ile Lys Val Met Cys Glu Gly Gly Arg Tyr Thr Val Gly Gly Leu Glu 275 280 285 Thr Phe Asp Ser Leu Thr Asp Leu Val Glu His Phe Lys Lys Thr Gly 290 295 300 Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr Leu Arg Gln Pro Tyr Tyr 305 310 315 320 Ala Thr Arg Val Asn Ala Ala Asp Ile Glu Asn Arg Val Leu Glu Leu 325 330 335 Asn Lys Lys Gln Glu Ser Glu Asp Thr Ala Lys Ala Gly Phe Trp Glu 340 345 350 Glu Phe Glu Ser Leu Gln Lys Gln Glu Val Lys Asn Leu His Gln Arg 355 360 365 Leu Glu Gly Gln Arg Pro Glu Asn Lys Gly Lys Asn Arg Tyr Lys Asn 370 375 380 Ile Leu Pro Phe Asp His Ser Arg Val Ile Leu Gln Gly Arg Asp Ser 385 390 395 400 Asn Ile Pro Gly Ser Asp Tyr Ile Asn Ala Asn Tyr Ile Lys Asn Gln 405 410 415 Leu Leu Gly Pro Asp Glu Asn Ala Lys Thr Tyr Ile Ala Ser Gln Gly 420 425 430 Cys Leu Glu Ala Thr Val Asn Asp Phe Trp Gln Met Ala Trp Gln Glu 435 440 445 Asn Ser Arg Val Ile Val Met Thr Thr Arg Glu Val Glu Lys Gly Arg 450 455 460 Asn Lys Cys Val Pro Tyr Trp Pro Glu Val Gly Met Gln Arg Ala Tyr 465 470 475 480 Gly Pro Tyr Ser Val Thr Asn Cys Gly Glu His Asp Thr Thr Glu Tyr 485 490 495 Lys Leu Arg Thr Leu Gln Val Ser Pro Leu Asp Asn Gly Asp Leu Ile 500 505 510 Arg Glu Ile Trp His Tyr Gln Tyr Leu Ser Trp Pro Asp His Gly Val 515 520 525 Pro Ser Glu Pro Gly Gly Val Leu Ser Phe Leu Asp Gln Ile Asn Gln 530 535 540 Arg Gln Glu Ser Leu Pro His Ala Gly Pro Ile Ile Val His Cys Ser 545 550 555 560 Ala Gly Ile Gly Arg Thr Gly Thr Ile Ile Val Ile Asp Met Leu Met 565 570 575 Glu Asn Ile Ser Thr Lys Gly Leu Asp Cys Asp Ile Asp Ile Gln Lys 580 585 590 Thr Ile Gln Met Val Arg Ala Gln Arg Ser Gly Met Val Gln Thr Glu 595 600 605 Ala Gln Tyr Lys Phe Ile Tyr Val Ala Ile Ala Gln Phe Ile Glu Thr 610 615 620 Thr Lys Lys Lys Leu Glu Val Leu Gln Ser Gln Lys Gly Gln Glu Ser 625 630 635 640 Glu Tyr Gly Asn Ile Thr Tyr Pro Pro Ala Met Lys Asn Ala His Ala 645 650 655 Lys Ala Ser Arg Thr Ser Ser Lys His Lys Glu Asp Val Tyr Glu Asn 660 665 670 Leu His Thr Lys Asn Lys Arg Glu Glu Lys Val Lys Lys Gln Arg Ser 675 680 685 Ala Asp Lys Glu Lys Ser Lys Gly Ser Leu Lys Arg Lys 690 695 700 <210> 26 <211> 299 <212> PRT <213> Artificial Sequence <220> <223> ZAP70 kinase domain <400> 26 Asp Pro Glu Glu Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn 1 5 10 15 Leu Leu Ile Ala Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val 20 25 30 Arg Gln Gly Val Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile 35 40 45 Lys Val Leu Lys Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met 50 55 60 Arg Glu Ala Gln Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg 65 70 75 80 Leu Ile Gly Val Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met 85 90 95 Ala Gly Gly Gly Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu 100 105 110 Ile Pro Val Ser Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly 115 120 125 Met Lys Tyr Leu Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala 130 135 140 Arg Asn Val Leu Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe 145 150 155 160 Gly Leu Ser Lys Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg 165 170 175 Ser Ala Gly Lys Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn 180 185 190 Phe Arg Lys Phe Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr 195 200 205 Met Trp Glu Ala Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys 210 215 220 Gly Pro Glu Val Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys 225 230 235 240 Pro Pro Glu Cys Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp 245 250 255 Ile Tyr Lys Trp Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg 260 265 270 Met Arg Ala Cys Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro 275 280 285 Gly Ser Thr Gln Lys Ala Glu Ala Ala Cys Ala 290 295 <210> 27 <211> 280 <212> PRT <213> Artificial Sequence <220> <223> PTPN6 phosphatase domain <400> 27 Phe Trp Glu Glu Phe Glu Ser Leu Gln Lys Gln Glu Val Lys Asn Leu 1 5 10 15 His Gln Arg Leu Glu Gly Gln Arg Pro Glu Asn Lys Gly Lys Asn Arg 20 25 30 Tyr Lys Asn Ile Leu Pro Phe Asp His Ser Arg Val Ile Leu Gln Gly 35 40 45 Arg Asp Ser Asn Ile Pro Gly Ser Asp Tyr Ile Asn Ala Asn Tyr Ile 50 55 60 Lys Asn Gln Leu Leu Gly Pro Asp Glu Asn Ala Lys Thr Tyr Ile Ala 65 70 75 80 Ser Gln Gly Cys Leu Glu Ala Thr Val Asn Asp Phe Trp Gln Met Ala 85 90 95 Trp Gln Glu Asn Ser Arg Val Ile Val Met Thr Thr Arg Glu Val Glu 100 105 110 Lys Gly Arg Asn Lys Cys Val Pro Tyr Trp Pro Glu Val Gly Met Gln 115 120 125 Arg Ala Tyr Gly Pro Tyr Ser Val Thr Asn Cys Gly Glu His Asp Thr 130 135 140 Thr Glu Tyr Lys Leu Arg Thr Leu Gln Val Ser Pro Leu Asp Asn Gly 145 150 155 160 Asp Leu Ile Arg Glu Ile Trp His Tyr Gln Tyr Leu Ser Trp Pro Asp 165 170 175 His Gly Val Pro Ser Glu Pro Gly Gly Val Leu Ser Phe Leu Asp Gln 180 185 190 Ile Asn Gln Arg Gln Glu Ser Leu Pro His Ala Gly Pro Ile Ile Val 195 200 205 His Cys Ser Ala Gly Ile Gly Arg Thr Gly Thr Ile Ile Val Ile Asp 210 215 220 Met Leu Met Glu Asn Ile Ser Thr Lys Gly Leu Asp Cys Asp Ile Asp 225 230 235 240 Ile Gln Lys Thr Ile Gln Met Val Arg Ala Gln Arg Ser Gly Met Val 245 250 255 Gln Thr Glu Ala Gln Tyr Lys Phe Ile Tyr Val Ala Ile Ala Gln Phe 260 265 270 Ile Glu Thr Thr Lys Lys Lys Leu 275 280 <210> 28 <211> 274 <212> PRT <213> Artificial Sequence <220> <223> SHP-2 phosphatase domain <400> 28 Trp Glu Glu Phe Glu Thr Leu Gln Gln Gln Glu Cys Lys Leu Leu Tyr 1 5 10 15 Ser Arg Lys Glu Gly Gln Arg Gln Glu Asn Lys Asn Lys Asn Arg Tyr 20 25 30 Lys Asn Ile Leu Pro Phe Asp His Thr Arg Val Val Leu His Asp Gly 35 40 45 Asp Pro Asn Glu Pro Val Ser Asp Tyr Ile Asn Ala Asn Ile Ile Met 50 55 60 Pro Glu Phe Glu Thr Lys Cys Asn Asn Ser Lys Pro Lys Lys Ser Tyr 65 70 75 80 Ile Ala Thr Gln Gly Cys Leu Gln Asn Thr Val Asn Asp Phe Trp Arg 85 90 95 Met Val Phe Gln Glu Asn Ser Arg Val Ile Val Met Thr Thr Lys Glu 100 105 110 Val Glu Arg Gly Lys Ser Lys Cys Val Lys Tyr Trp Pro Asp Glu Tyr 115 120 125 Ala Leu Lys Glu Tyr Gly Val Met Arg Val Arg Asn Val Lys Glu Ser 130 135 140 Ala Ala His Asp Tyr Thr Leu Arg Glu Leu Lys Leu Ser Lys Val Gly 145 150 155 160 Gln Ala Leu Leu Gln Gly Asn Thr Glu Arg Thr Val Trp Gln Tyr His 165 170 175 Phe Arg Thr Trp Pro Asp His Gly Val Pro Ser Asp Pro Gly Gly Val 180 185 190 Leu Asp Phe Leu Glu Glu Val His His Lys Gln Glu Ser Ile Met Asp 195 200 205 Ala Gly Pro Val Val Val His Cys Ser Ala Gly Ile Gly Arg Thr Gly 210 215 220 Thr Phe Ile Val Ile Asp Ile Leu Ile Asp Ile Ile Arg Glu Lys Gly 225 230 235 240 Val Asp Cys Asp Ile Asp Val Pro Lys Thr Ile Gln Met Val Arg Ser 245 250 255 Gln Arg Ser Gly Met Val Gln Thr Glu Ala Gln Tyr Arg Phe Ile Tyr 260 265 270 Met Ala <210> 29 <211> 519 <212> PRT <213> Artificial Sequence <220> <223> PTPN6 SH2 domain fusion: ZAP70 kinase domain <400> 29 Met Val Arg Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr 1 5 10 15 Leu Leu Lys Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser 20 25 30 Arg Lys Asn Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln 35 40 45 Val Thr His Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr 50 55 60 Gly Gly Glu Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr 65 70 75 80 Gln Gln Gln Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu 85 90 95 Lys Tyr Pro Leu Asn Cys Ser Asp Pro Thr Ser Glu Arg Trp Tyr His 100 105 110 Gly His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly 115 120 125 Glu Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln Pro Gly Asp 130 135 140 Phe Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser 145 150 155 160 Pro Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly Gly Arg Tyr 165 170 175 Thr Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp Leu Val Glu 180 185 190 His Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr 195 200 205 Leu Arg Gln Pro Tyr Tyr Ser Gly Gly Gly Gly Ser Asp Pro Glu Glu 210 215 220 Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn Leu Leu Ile Ala 225 230 235 240 Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val Arg Gln Gly Val 245 250 255 Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile Lys Val Leu Lys 260 265 270 Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met Arg Glu Ala Gln 275 280 285 Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg Leu Ile Gly Val 290 295 300 Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met Ala Gly Gly Gly 305 310 315 320 Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu Ile Pro Val Ser 325 330 335 Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly Met Lys Tyr Leu 340 345 350 Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala Arg Asn Val Leu 355 360 365 Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe Gly Leu Ser Lys 370 375 380 Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg Ser Ala Gly Lys 385 390 395 400 Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn Phe Arg Lys Phe 405 410 415 Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr Met Trp Glu Ala 420 425 430 Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys Gly Pro Glu Val 435 440 445 Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys Pro Pro Glu Cys 450 455 460 Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp Ile Tyr Lys Trp 465 470 475 480 Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg Met Arg Ala Cys 485 490 495 Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro Gly Ser Thr Gln 500 505 510 Lys Ala Glu Ala Ala Cys Ala 515 <210> 30 <211> 581 <212> PRT <213> Artificial Sequence <220> <223> ZAP70 SH2 domain fusion: PTPN6 phosphatase domain <400> 30 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro Ser Gly Gly Gly Gly Ser Gly Gly 275 280 285 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Phe Trp Glu 290 295 300 Glu Phe Glu Ser Leu Gln Lys Gln Glu Val Lys Asn Leu His Gln Arg 305 310 315 320 Leu Glu Gly Gln Arg Pro Glu Asn Lys Gly Lys Asn Arg Tyr Lys Asn 325 330 335 Ile Leu Pro Phe Asp His Ser Arg Val Ile Leu Gln Gly Arg Asp Ser 340 345 350 Asn Ile Pro Gly Ser Asp Tyr Ile Asn Ala Asn Tyr Ile Lys Asn Gln 355 360 365 Leu Leu Gly Pro Asp Glu Asn Ala Lys Thr Tyr Ile Ala Ser Gln Gly 370 375 380 Cys Leu Glu Ala Thr Val Asn Asp Phe Trp Gln Met Ala Trp Gln Glu 385 390 395 400 Asn Ser Arg Val Ile Val Met Thr Thr Arg Glu Val Glu Lys Gly Arg 405 410 415 Asn Lys Cys Val Pro Tyr Trp Pro Glu Val Gly Met Gln Arg Ala Tyr 420 425 430 Gly Pro Tyr Ser Val Thr Asn Cys Gly Glu His Asp Thr Thr Glu Tyr 435 440 445 Lys Leu Arg Thr Leu Gln Val Ser Pro Leu Asp Asn Gly Asp Leu Ile 450 455 460 Arg Glu Ile Trp His Tyr Gln Tyr Leu Ser Trp Pro Asp His Gly Val 465 470 475 480 Pro Ser Glu Pro Gly Gly Val Leu Ser Phe Leu Asp Gln Ile Asn Gln 485 490 495 Arg Gln Glu Ser Leu Pro His Ala Gly Pro Ile Ile Val His Cys Ser 500 505 510 Ala Gly Ile Gly Arg Thr Gly Thr Ile Ile Val Ile Asp Met Leu Met 515 520 525 Glu Asn Ile Ser Thr Lys Gly Leu Asp Cys Asp Ile Asp Ile Gln Lys 530 535 540 Thr Ile Gln Met Val Arg Ala Gln Arg Ser Gly Met Val Gln Thr Glu 545 550 555 560 Ala Gln Tyr Lys Phe Ile Tyr Val Ala Ile Ala Gln Phe Ile Glu Thr 565 570 575 Thr Lys Lys Lys Leu 580 <210> 31 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> CD28 endodomain <400> 31 Met Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met 1 5 10 15 Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala 20 25 30 Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser 35 40 <210> 32 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> 41BB endodomain <400> 32 Met Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe 1 5 10 15 Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg 20 25 30 Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu 35 40 <210> 33 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> OX40 endodomain <400> 33 Met Arg Asp Gln Arg Leu Pro Pro Asp Ala His Lys Pro Pro Gly Gly 1 5 10 15 Gly Ser Phe Arg Thr Pro Ile Gln Glu Glu Gln Ala Asp Ala His Ser 20 25 30 Thr Leu Ala Lys Ile 35 <210> 34 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> ICOS endodomain <400> 34 Cys Trp Leu Thr Lys Lys Lys Tyr Ser Ser Ser Val His Asp Pro Asn 1 5 10 15 Gly Glu Tyr Met Phe Met Arg Ala Val Asn Thr Ala Lys Lys Ser Arg 20 25 30 Leu Thr Asp Val Thr Leu 35 <210> 35 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> CD27 endodomain <400> 35 Gln Arg Arg Lys Tyr Arg Ser Asn Lys Gly Glu Ser Pro Val Glu Pro 1 5 10 15 Ala Glu Pro Cys His Tyr Ser Cys Pro Arg Glu Glu Glu Gly Ser Thr 20 25 30 Ile Pro Ile Gln Glu Asp Tyr Arg Lys Pro Glu Pro Ala Cys Ser Pro 35 40 45 <210> 36 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> BTLA endodomain <400> 36 Arg Arg His Gln Gly Lys Gln Asn Glu Leu Ser Asp Thr Ala Gly Arg 1 5 10 15 Glu Ile Asn Leu Val Asp Ala His Leu Lys Ser Glu Gln Thr Glu Ala 20 25 30 Ser Thr Arg Gln Asn Ser Gln Val Leu Leu Ser Glu Thr Gly Ile Tyr 35 40 45 Asp Asn Asp Pro Asp Leu Cys Phe Arg Met Gln Glu Gly Ser Glu Val 50 55 60 Tyr Ser Asn Pro Cys Leu Glu Glu Asn Lys Pro Gly Ile Val Tyr Ala 65 70 75 80 Ser Leu Asn His Ser Val Ile Gly Pro Asn Ser Arg Leu Ala Arg Asn 85 90 95 Val Lys Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val Arg Ser 100 105 110 <210> 37 <211> 188 <212> PRT <213> Artificial Sequence <220> <223> CD30 endodomain <400> 37 His Arg Arg Ala Cys Arg Lys Arg Ile Arg Gln Lys Leu His Leu Cys 1 5 10 15 Tyr Pro Val Gln Thr Ser Gln Pro Lys Leu Glu Leu Val Asp Ser Arg 20 25 30 Pro Arg Arg Ser Ser Thr Gln Leu Arg Ser Gly Ala Ser Val Thr Glu 35 40 45 Pro Val Ala Glu Glu Arg Gly Leu Met Ser Gln Pro Leu Met Glu Thr 50 55 60 Cys His Ser Val Gly Ala Ala Tyr Leu Glu Ser Leu Pro Leu Gln Asp 65 70 75 80 Ala Ser Pro Ala Gly Gly Pro Ser Ser Pro Arg Asp Leu Pro Glu Pro 85 90 95 Arg Val Ser Thr Glu His Thr Asn Asn Lys Ile Glu Lys Ile Tyr Ile 100 105 110 Met Lys Ala Asp Thr Val Ile Val Gly Thr Val Lys Ala Glu Leu Pro 115 120 125 Glu Gly Arg Gly Leu Ala Gly Pro Ala Glu Pro Glu Leu Glu Glu Glu 130 135 140 Leu Glu Ala Asp His Thr Pro His Tyr Pro Glu Gln Glu Thr Glu Pro 145 150 155 160 Pro Leu Gly Ser Cys Ser Asp Val Met Leu Ser Val Glu Glu Glu Gly 165 170 175 Lys Glu Asp Pro Leu Pro Thr Ala Ala Ser Gly Lys 180 185 <210> 38 <211> 58 <212> PRT <213> Artificial Sequence <220> <223> GITR endodomain <400> 38 Gln Leu Gly Leu His Ile Trp Gln Leu Arg Ser Gln Cys Met Trp Pro 1 5 10 15 Arg Glu Thr Gln Leu Leu Leu Glu Val Pro Pro Ser Thr Glu Asp Ala 20 25 30 Arg Ser Cys Gln Phe Pro Glu Glu Glu Arg Gly Glu Arg Ser Ala Glu 35 40 45 Glu Lys Gly Arg Leu Gly Asp Leu Trp Val 50 55 <210> 39 <211> 60 <212> PRT <213> Artificial Sequence <220> <223> HVEM endodomain <400> 39 Cys Val Lys Arg Arg Lys Pro Arg Gly Asp Val Val Lys Val Ile Val 1 5 10 15 Ser Val Gln Arg Lys Arg Gln Glu Ala Glu Gly Glu Ala Thr Val Ile 20 25 30 Glu Ala Leu Gln Ala Pro Pro Asp Val Thr Thr Val Ala Val Glu Glu 35 40 45 Thr Ile Pro Ser Phe Thr Gly Arg Ser Pro Asn His 50 55 60 <210> 40 <211> 682 <212> PRT <213> Artificial Sequence <220> <223> CD28 endodomain fused to amino-terminus of full-length ZAP <400> 40 Met Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met 1 5 10 15 Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala 20 25 30 Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser Ser Gly Gly Gly Gly Ser 35 40 45 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met 50 55 60 Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser Arg 65 70 75 80 Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly Leu 85 90 95 Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu Ser 100 105 110 Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln Leu 115 120 125 Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro Ala 130 135 140 Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys Asn 145 150 155 160 Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro Gly 165 170 175 Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg Gln 180 185 190 Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser Gln 195 200 205 Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg Met 210 215 220 Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys Leu 225 230 235 240 Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg Lys 245 250 255 Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val Tyr 260 265 270 His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro Glu 275 280 285 Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys Leu 290 295 300 Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn Ser 305 310 315 320 Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala His 325 330 335 Pro Ser Thr Leu Thr His Pro Gln Arg Arg Ile Asp Thr Leu Asn Ser 340 345 350 Asp Gly Tyr Thr Pro Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys Pro 355 360 365 Arg Pro Met Pro Met Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser Asp 370 375 380 Pro Glu Glu Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn Leu 385 390 395 400 Leu Ile Ala Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val Arg 405 410 415 Gln Gly Val Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile Lys 420 425 430 Val Leu Lys Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met Arg 435 440 445 Glu Ala Gln Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg Leu 450 455 460 Ile Gly Val Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met Ala 465 470 475 480 Gly Gly Gly Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu Ile 485 490 495 Pro Val Ser Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly Met 500 505 510 Lys Tyr Leu Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala Arg 515 520 525 Asn Val Leu Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe Gly 530 535 540 Leu Ser Lys Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg Ser 545 550 555 560 Ala Gly Lys Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn Phe 565 570 575 Arg Lys Phe Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr Met 580 585 590 Trp Glu Ala Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys Gly 595 600 605 Pro Glu Val Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys Pro 610 615 620 Pro Glu Cys Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp Ile 625 630 635 640 Tyr Lys Trp Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg Met 645 650 655 Arg Ala Cys Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro Gly 660 665 670 Ser Thr Gln Lys Ala Glu Ala Ala Cys Ala 675 680 <210> 41 <211> 683 <212> PRT <213> Artificial Sequence <220> <223> 41BB endodomain fused to amino-terminus of full-length ZAP <400> 41 Met Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe 1 5 10 15 Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg 20 25 30 Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Ser Gly Gly Gly Gly 35 40 45 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 50 55 60 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 65 70 75 80 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 85 90 95 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 100 105 110 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 115 120 125 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 130 135 140 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 145 150 155 160 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 165 170 175 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 180 185 190 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 195 200 205 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 210 215 220 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 225 230 235 240 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 245 250 255 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 260 265 270 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 275 280 285 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 290 295 300 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 305 310 315 320 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 325 330 335 His Pro Ser Thr Leu Thr His Pro Gln Arg Arg Ile Asp Thr Leu Asn 340 345 350 Ser Asp Gly Tyr Thr Pro Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys 355 360 365 Pro Arg Pro Met Pro Met Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser 370 375 380 Asp Pro Glu Glu Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn 385 390 395 400 Leu Leu Ile Ala Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val 405 410 415 Arg Gln Gly Val Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile 420 425 430 Lys Val Leu Lys Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met 435 440 445 Arg Glu Ala Gln Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg 450 455 460 Leu Ile Gly Val Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met 465 470 475 480 Ala Gly Gly Gly Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu 485 490 495 Ile Pro Val Ser Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly 500 505 510 Met Lys Tyr Leu Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala 515 520 525 Arg Asn Val Leu Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe 530 535 540 Gly Leu Ser Lys Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg 545 550 555 560 Ser Ala Gly Lys Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn 565 570 575 Phe Arg Lys Phe Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr 580 585 590 Met Trp Glu Ala Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys 595 600 605 Gly Pro Glu Val Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys 610 615 620 Pro Pro Glu Cys Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp 625 630 635 640 Ile Tyr Lys Trp Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg 645 650 655 Met Arg Ala Cys Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro 660 665 670 Gly Ser Thr Gln Lys Ala Glu Ala Ala Cys Ala 675 680 <210> 42 <211> 677 <212> PRT <213> Artificial Sequence <220> <223> OX40 endodomain fused to amino-terminus of full-length ZAP <400> 42 Met Arg Asp Gln Arg Leu Pro Pro Asp Ala His Lys Pro Pro Gly Gly 1 5 10 15 Gly Ser Phe Arg Thr Pro Ile Gln Glu Glu Gln Ala Asp Ala His Ser 20 25 30 Thr Leu Ala Lys Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Pro Asp Pro Ala Ala 50 55 60 His Leu Pro Phe Phe Tyr Gly Ser Ile Ser Arg Ala Glu Ala Glu Glu 65 70 75 80 His Leu Lys Leu Ala Gly Met Ala Asp Gly Leu Phe Leu Leu Arg Gln 85 90 95 Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu Ser Leu Val His Asp Val 100 105 110 Arg Phe His His Phe Pro Ile Glu Arg Gln Leu Asn Gly Thr Tyr Ala 115 120 125 Ile Ala Gly Gly Lys Ala His Cys Gly Pro Ala Glu Leu Cys Glu Phe 130 135 140 Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys Asn Leu Arg Lys Pro Cys 145 150 155 160 Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro Gly Val Phe Asp Cys Leu 165 170 175 Arg Asp Ala Met Val Arg Asp Tyr Val Arg Gln Thr Trp Lys Leu Glu 180 185 190 Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser Gln Ala Pro Gln Val Glu 195 200 205 Lys Leu Ile Ala Thr Thr Ala His Glu Arg Met Pro Trp Tyr His Ser 210 215 220 Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys Leu Tyr Ser Gly Ala Gln 225 230 235 240 Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg Lys Glu Gln Gly Thr Tyr 245 250 255 Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val Tyr His Tyr Leu Ile Ser 260 265 270 Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro Glu Gly Thr Lys Phe Asp 275 280 285 Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys Leu Lys Ala Asp Gly Leu 290 295 300 Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn Ser Ser Ala Ser Asn Ala 305 310 315 320 Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala His Pro Ser Thr Leu Thr 325 330 335 His Pro Gln Arg Arg Ile Asp Thr Leu Asn Ser Asp Gly Tyr Thr Pro 340 345 350 Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys Pro Arg Pro Met Pro Met 355 360 365 Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser Asp Pro Glu Glu Leu Lys 370 375 380 Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn Leu Leu Ile Ala Asp Ile 385 390 395 400 Glu Leu Gly Cys Gly Asn Phe Gly Ser Val Arg Gln Gly Val Tyr Arg 405 410 415 Met Arg Lys Lys Gln Ile Asp Val Ala Ile Lys Val Leu Lys Gln Gly 420 425 430 Thr Glu Lys Ala Asp Thr Glu Glu Met Met Arg Glu Ala Gln Ile Met 435 440 445 His Gln Leu Asp Asn Pro Tyr Ile Val Arg Leu Ile Gly Val Cys Gln 450 455 460 Ala Glu Ala Leu Met Leu Val Met Glu Met Ala Gly Gly Gly Pro Leu 465 470 475 480 His Lys Phe Leu Val Gly Lys Arg Glu Glu Ile Pro Val Ser Asn Val 485 490 495 Ala Glu Leu Leu His Gln Val Ser Met Gly Met Lys Tyr Leu Glu Glu 500 505 510 Lys Asn Phe Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Leu Val 515 520 525 Asn Arg His Tyr Ala Lys Ile Ser Asp Phe Gly Leu Ser Lys Ala Leu 530 535 540 Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg Ser Ala Gly Lys Trp Pro 545 550 555 560 Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn Phe Arg Lys Phe Ser Ser 565 570 575 Arg Ser Asp Val Trp Ser Tyr Gly Val Thr Met Trp Glu Ala Leu Ser 580 585 590 Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys Gly Pro Glu Val Met Ala 595 600 605 Phe Ile Glu Gln Gly Lys Arg Met Glu Cys Pro Pro Glu Cys Pro Pro 610 615 620 Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp Ile Tyr Lys Trp Glu Asp 625 630 635 640 Arg Pro Asp Phe Leu Thr Val Glu Gln Arg Met Arg Ala Cys Tyr Tyr 645 650 655 Ser Leu Ala Ser Lys Val Glu Gly Pro Pro Gly Ser Thr Gln Lys Ala 660 665 670 Glu Ala Ala Cys Ala 675 <210> 43 <211> 276 <212> PRT <213> Artificial Sequence <220> <223> CD28 endodomain fused to the amino-terminus of PTPN6 SH2 domain <400> 43 Met Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met 1 5 10 15 Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala 20 25 30 Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser Ser Gly Gly Gly Gly Ser 35 40 45 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met 50 55 60 Val Arg Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr Leu 65 70 75 80 Leu Lys Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser Arg 85 90 95 Lys Asn Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln Val 100 105 110 Thr His Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr Gly 115 120 125 Gly Glu Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr Gln 130 135 140 Gln Gln Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu Lys 145 150 155 160 Tyr Pro Leu Asn Cys Ser Asp Pro Thr Ser Glu Arg Trp Tyr His Gly 165 170 175 His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly Glu 180 185 190 Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln Pro Gly Asp Phe 195 200 205 Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser Pro 210 215 220 Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly Gly Arg Tyr Thr 225 230 235 240 Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp Leu Val Glu His 245 250 255 Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr Leu 260 265 270 Arg Gln Pro Tyr 275 <210> 44 <211> 277 <212> PRT <213> Artificial Sequence <220> <223> 41BB endodomain fused to the amino-terminus of PTPN6 SH2 domain <400> 44 Met Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe 1 5 10 15 Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg 20 25 30 Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Ser Gly Gly Gly Gly 35 40 45 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 50 55 60 Met Val Arg Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr 65 70 75 80 Leu Leu Lys Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser 85 90 95 Arg Lys Asn Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln 100 105 110 Val Thr His Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr 115 120 125 Gly Gly Glu Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr 130 135 140 Gln Gln Gln Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu 145 150 155 160 Lys Tyr Pro Leu Asn Cys Ser Asp Pro Thr Ser Glu Arg Trp Tyr His 165 170 175 Gly His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly 180 185 190 Glu Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln Pro Gly Asp 195 200 205 Phe Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser 210 215 220 Pro Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly Gly Arg Tyr 225 230 235 240 Thr Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp Leu Val Glu 245 250 255 His Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr 260 265 270 Leu Arg Gln Pro Tyr 275 <210> 45 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> OX40 endodomain fused to the amino-terminus of PTPN6 SH2 domain <400> 45 Met Arg Asp Gln Arg Leu Pro Pro Asp Ala His Lys Pro Pro Gly Gly 1 5 10 15 Gly Ser Phe Arg Thr Pro Ile Gln Glu Glu Gln Ala Asp Ala His Ser 20 25 30 Thr Leu Ala Lys Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Val Arg Trp Phe His 50 55 60 Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr Leu Leu Lys Gly Arg Gly 65 70 75 80 Val His Gly Ser Phe Leu Ala Arg Pro Ser Arg Lys Asn Gln Gly Asp 85 90 95 Phe Ser Leu Ser Val Arg Val Gly Asp Gln Val Thr His Ile Arg Ile 100 105 110 Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr Gly Gly Glu Lys Phe Ala 115 120 125 Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr Gln Gln Gln Gly Val Leu 130 135 140 Gln Asp Arg Asp Gly Thr Ile Ile His Leu Lys Tyr Pro Leu Asn Cys 145 150 155 160 Ser Asp Pro Thr Ser Glu Arg Trp Tyr His Gly His Met Ser Gly Gly 165 170 175 Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly Glu Pro Trp Thr Phe Leu 180 185 190 Val Arg Glu Ser Leu Ser Gln Pro Gly Asp Phe Val Leu Ser Val Leu 195 200 205 Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser Pro Leu Arg Val Thr His 210 215 220 Ile Lys Val Met Cys Glu Gly Gly Arg Tyr Thr Val Gly Gly Leu Glu 225 230 235 240 Thr Phe Asp Ser Leu Thr Asp Leu Val Glu His Phe Lys Lys Thr Gly 245 250 255 Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr Leu Arg Gln Pro Tyr 260 265 270 <210> 46 <211> 350 <212> PRT <213> Artificial Sequence <220> <223> Akt kinase domain <400> 46 Ala Glu Glu Met Glu Val Ser Leu Ala Lys Pro Lys His Arg Val Thr 1 5 10 15 Met Asn Glu Phe Glu Tyr Leu Lys Leu Leu Gly Lys Gly Thr Phe Gly 20 25 30 Lys Val Ile Leu Val Lys Glu Lys Ala Thr Gly Arg Tyr Tyr Ala Met 35 40 45 Lys Ile Leu Lys Lys Glu Val Ile Val Ala Lys Asp Glu Val Ala His 50 55 60 Thr Leu Thr Glu Asn Arg Val Leu Gln Asn Ser Arg His Pro Phe Leu 65 70 75 80 Thr Ala Leu Lys Tyr Ser Phe Gln Thr His Asp Arg Leu Cys Phe Val 85 90 95 Met Glu Tyr Ala Asn Gly Gly Glu Leu Phe Phe His Leu Ser Arg Glu 100 105 110 Arg Val Phe Ser Glu Asp Arg Ala Arg Phe Tyr Gly Ala Glu Ile Val 115 120 125 Ser Ala Leu Asp Tyr Leu His Ser Glu Lys Asn Val Val Tyr Arg Asp 130 135 140 Leu Lys Leu Glu Asn Leu Met Leu Asp Lys Asp Gly His Ile Lys Ile 145 150 155 160 Thr Asp Phe Gly Leu Cys Lys Glu Gly Ile Lys Asp Gly Ala Thr Met 165 170 175 Lys Thr Phe Cys Gly Thr Pro Glu Tyr Leu Ala Pro Glu Val Leu Glu 180 185 190 Asp Asn Asp Tyr Gly Arg Ala Val Asp Trp Trp Gly Leu Gly Val Val 195 200 205 Met Tyr Glu Met Met Cys Gly Arg Leu Pro Phe Tyr Asn Gln Asp His 210 215 220 Glu Lys Leu Phe Glu Leu Ile Leu Met Glu Glu Ile Arg Phe Pro Arg 225 230 235 240 Thr Leu Gly Pro Glu Ala Lys Ser Leu Leu Ser Gly Leu Leu Lys Lys 245 250 255 Asp Pro Lys Gln Arg Leu Gly Gly Gly Ser Glu Asp Ala Lys Glu Ile 260 265 270 Met Gln His Arg Phe Phe Ala Gly Ile Val Trp Gln His Val Tyr Glu 275 280 285 Lys Lys Leu Ser Pro Pro Phe Lys Pro Gln Val Thr Ser Glu Thr Asp 290 295 300 Thr Arg Tyr Phe Asp Glu Glu Phe Thr Ala Gln Met Ile Thr Ile Thr 305 310 315 320 Pro Pro Asp Gln Asp Asp Ser Met Glu Cys Val Asp Ser Glu Arg Arg 325 330 335 Pro His Phe Pro Gln Phe Ser Tyr Ser Ala Ser Gly Thr Ala 340 345 350 <210> 47 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> ZAP70-SH2 domain fused directly to an Akt kinase domain <400> 47 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro Ala Glu Glu Met Glu Val Ser Leu 275 280 285 Ala Lys Pro Lys His Arg Val Thr Met Asn Glu Phe Glu Tyr Leu Lys 290 295 300 Leu Leu Gly Lys Gly Thr Phe Gly Lys Val Ile Leu Val Lys Glu Lys 305 310 315 320 Ala Thr Gly Arg Tyr Tyr Ala Met Lys Ile Leu Lys Lys Glu Val Ile 325 330 335 Val Ala Lys Asp Glu Val Ala His Thr Leu Thr Glu Asn Arg Val Leu 340 345 350 Gln Asn Ser Arg His Pro Phe Leu Thr Ala Leu Lys Tyr Ser Phe Gln 355 360 365 Thr His Asp Arg Leu Cys Phe Val Met Glu Tyr Ala Asn Gly Gly Glu 370 375 380 Leu Phe Phe His Leu Ser Arg Glu Arg Val Phe Ser Glu Asp Arg Ala 385 390 395 400 Arg Phe Tyr Gly Ala Glu Ile Val Ser Ala Leu Asp Tyr Leu His Ser 405 410 415 Glu Lys Asn Val Val Tyr Arg Asp Leu Lys Leu Glu Asn Leu Met Leu 420 425 430 Asp Lys Asp Gly His Ile Lys Ile Thr Asp Phe Gly Leu Cys Lys Glu 435 440 445 Gly Ile Lys Asp Gly Ala Thr Met Lys Thr Phe Cys Gly Thr Pro Glu 450 455 460 Tyr Leu Ala Pro Glu Val Leu Glu Asp Asn Asp Tyr Gly Arg Ala Val 465 470 475 480 Asp Trp Trp Gly Leu Gly Val Val Met Tyr Glu Met Met Cys Gly Arg 485 490 495 Leu Pro Phe Tyr Asn Gln Asp His Glu Lys Leu Phe Glu Leu Ile Leu 500 505 510 Met Glu Glu Ile Arg Phe Pro Arg Thr Leu Gly Pro Glu Ala Lys Ser 515 520 525 Leu Leu Ser Gly Leu Leu Lys Lys Asp Pro Lys Gln Arg Leu Gly Gly 530 535 540 Gly Ser Glu Asp Ala Lys Glu Ile Met Gln His Arg Phe Phe Ala Gly 545 550 555 560 Ile Val Trp Gln His Val Tyr Glu Lys Lys Leu Ser Pro Pro Phe Lys 565 570 575 Pro Gln Val Thr Ser Glu Thr Asp Thr Arg Tyr Phe Asp Glu Glu Phe 580 585 590 Thr Ala Gln Met Ile Thr Ile Thr Pro Pro Asp Gln Asp Asp Ser Met 595 600 605 Glu Cys Val Asp Ser Glu Arg Arg Pro His Phe Pro Gln Phe Ser Tyr 610 615 620 Ser Ala Ser Gly Thr Ala 625 630 <210> 48 <211> 651 <212> PRT <213> Artificial Sequence <220> <223> ZAP70-SH2 domain fused to an Akt kinase domain via a linker <400> 48 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro Ser Gly Gly Gly Gly Ser Gly Gly 275 280 285 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Glu 290 295 300 Met Glu Val Ser Leu Ala Lys Pro Lys His Arg Val Thr Met Asn Glu 305 310 315 320 Phe Glu Tyr Leu Lys Leu Leu Gly Lys Gly Thr Phe Gly Lys Val Ile 325 330 335 Leu Val Lys Glu Lys Ala Thr Gly Arg Tyr Tyr Ala Met Lys Ile Leu 340 345 350 Lys Lys Glu Val Ile Val Ala Lys Asp Glu Val Ala His Thr Leu Thr 355 360 365 Glu Asn Arg Val Leu Gln Asn Ser Arg His Pro Phe Leu Thr Ala Leu 370 375 380 Lys Tyr Ser Phe Gln Thr His Asp Arg Leu Cys Phe Val Met Glu Tyr 385 390 395 400 Ala Asn Gly Gly Glu Leu Phe Phe His Leu Ser Arg Glu Arg Val Phe 405 410 415 Ser Glu Asp Arg Ala Arg Phe Tyr Gly Ala Glu Ile Val Ser Ala Leu 420 425 430 Asp Tyr Leu His Ser Glu Lys Asn Val Val Tyr Arg Asp Leu Lys Leu 435 440 445 Glu Asn Leu Met Leu Asp Lys Asp Gly His Ile Lys Ile Thr Asp Phe 450 455 460 Gly Leu Cys Lys Glu Gly Ile Lys Asp Gly Ala Thr Met Lys Thr Phe 465 470 475 480 Cys Gly Thr Pro Glu Tyr Leu Ala Pro Glu Val Leu Glu Asp Asn Asp 485 490 495 Tyr Gly Arg Ala Val Asp Trp Trp Gly Leu Gly Val Val Met Tyr Glu 500 505 510 Met Met Cys Gly Arg Leu Pro Phe Tyr Asn Gln Asp His Glu Lys Leu 515 520 525 Phe Glu Leu Ile Leu Met Glu Glu Ile Arg Phe Pro Arg Thr Leu Gly 530 535 540 Pro Glu Ala Lys Ser Leu Leu Ser Gly Leu Leu Lys Lys Asp Pro Lys 545 550 555 560 Gln Arg Leu Gly Gly Gly Ser Glu Asp Ala Lys Glu Ile Met Gln His 565 570 575 Arg Phe Phe Ala Gly Ile Val Trp Gln His Val Tyr Glu Lys Lys Leu 580 585 590 Ser Pro Pro Phe Lys Pro Gln Val Thr Ser Glu Thr Asp Thr Arg Tyr 595 600 605 Phe Asp Glu Glu Phe Thr Ala Gln Met Ile Thr Ile Thr Pro Pro Asp 610 615 620 Gln Asp Asp Ser Met Glu Cys Val Asp Ser Glu Arg Arg Pro His Phe 625 630 635 640 Pro Gln Phe Ser Tyr Ser Ala Ser Gly Thr Ala 645 650 <210> 49 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> ZAP70 mutated to be non-functional and fused to an Akt kinase domain <400> 49 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Lys Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro Ala Glu Glu Met Glu Val Ser Leu 275 280 285 Ala Lys Pro Lys His Arg Val Thr Met Asn Glu Phe Glu Tyr Leu Lys 290 295 300 Leu Leu Gly Lys Gly Thr Phe Gly Lys Val Ile Leu Val Lys Glu Lys 305 310 315 320 Ala Thr Gly Arg Tyr Tyr Ala Met Lys Ile Leu Lys Lys Glu Val Ile 325 330 335 Val Ala Lys Asp Glu Val Ala His Thr Leu Thr Glu Asn Arg Val Leu 340 345 350 Gln Asn Ser Arg His Pro Phe Leu Thr Ala Leu Lys Tyr Ser Phe Gln 355 360 365 Thr His Asp Arg Leu Cys Phe Val Met Glu Tyr Ala Asn Gly Gly Glu 370 375 380 Leu Phe Phe His Leu Ser Arg Glu Arg Val Phe Ser Glu Asp Arg Ala 385 390 395 400 Arg Phe Tyr Gly Ala Glu Ile Val Ser Ala Leu Asp Tyr Leu His Ser 405 410 415 Glu Lys Asn Val Val Tyr Arg Asp Leu Lys Leu Glu Asn Leu Met Leu 420 425 430 Asp Lys Asp Gly His Ile Lys Ile Thr Asp Phe Gly Leu Cys Lys Glu 435 440 445 Gly Ile Lys Asp Gly Ala Thr Met Lys Thr Phe Cys Gly Thr Pro Glu 450 455 460 Tyr Leu Ala Pro Glu Val Leu Glu Asp Asn Asp Tyr Gly Arg Ala Val 465 470 475 480 Asp Trp Trp Gly Leu Gly Val Val Met Tyr Glu Met Met Cys Gly Arg 485 490 495 Leu Pro Phe Tyr Asn Gln Asp His Glu Lys Leu Phe Glu Leu Ile Leu 500 505 510 Met Glu Glu Ile Arg Phe Pro Arg Thr Leu Gly Pro Glu Ala Lys Ser 515 520 525 Leu Leu Ser Gly Leu Leu Lys Lys Asp Pro Lys Gln Arg Leu Gly Gly 530 535 540 Gly Ser Glu Asp Ala Lys Glu Ile Met Gln His Arg Phe Phe Ala Gly 545 550 555 560 Ile Val Trp Gln His Val Tyr Glu Lys Lys Leu Ser Pro Pro Phe Lys 565 570 575 Pro Gln Val Thr Ser Glu Thr Asp Thr Arg Tyr Phe Asp Glu Glu Phe 580 585 590 Thr Ala Gln Met Ile Thr Ile Thr Pro Pro Asp Gln Asp Asp Ser Met 595 600 605 Glu Cys Val Asp Ser Glu Arg Arg Pro His Phe Pro Gln Phe Ser Tyr 610 615 620 Ser Ala Ser Gly Thr Ala 625 630 <210> 50 <211> 590 <212> PRT <213> Artificial Sequence <220> <223> Kinase containing domain of JAK2 <400> 50 Arg Asn Glu Asp Leu Ile Phe Asn Glu Ser Leu Gly Gln Gly Thr Phe 1 5 10 15 Thr Lys Ile Phe Lys Gly Val Arg Arg Glu Val Gly Asp Tyr Gly Gln 20 25 30 Leu His Glu Thr Glu Val Leu Leu Lys Val Leu Asp Lys Ala His Arg 35 40 45 Asn Tyr Ser Glu Ser Phe Phe Glu Ala Ala Ser Met Met Ser Lys Leu 50 55 60 Ser His Lys His Leu Val Leu Asn Tyr Gly Val Cys Val Cys Gly Asp 65 70 75 80 Glu Asn Ile Leu Val Gln Glu Phe Val Lys Phe Gly Ser Leu Asp Thr 85 90 95 Tyr Leu Lys Lys Asn Lys Asn Cys Ile Asn Ile Leu Trp Lys Leu Glu 100 105 110 Val Ala Lys Gln Leu Ala Trp Ala Met His Phe Leu Glu Glu Asn Thr 115 120 125 Leu Ile His Gly Asn Val Cys Ala Lys Asn Ile Leu Leu Ile Arg Glu 130 135 140 Glu Asp Arg Lys Thr Gly Asn Pro Pro Phe Ile Lys Leu Ser Asp Pro 145 150 155 160 Gly Ile Ser Ile Thr Val Leu Pro Lys Asp Ile Leu Gln Glu Arg Ile 165 170 175 Pro Trp Val Pro Pro Glu Cys Ile Glu Asn Pro Lys Asn Leu Asn Leu 180 185 190 Ala Thr Asp Lys Trp Ser Phe Gly Thr Thr Leu Trp Glu Ile Cys Ser 195 200 205 Gly Gly Asp Lys Pro Leu Ser Ala Leu Asp Ser Gln Arg Lys Leu Gln 210 215 220 Phe Tyr Glu Asp Arg His Gln Leu Pro Ala Pro Lys Trp Ala Glu Leu 225 230 235 240 Ala Asn Leu Ile Asn Asn Cys Met Asp Tyr Glu Pro Asp Phe Arg Pro 245 250 255 Ser Phe Arg Ala Ile Ile Arg Asp Leu Asn Ser Leu Phe Thr Pro Asp 260 265 270 Tyr Glu Leu Leu Thr Glu Asn Asp Met Leu Pro Asn Met Arg Ile Gly 275 280 285 Ala Leu Gly Phe Ser Gly Ala Phe Glu Asp Arg Asp Pro Thr Gln Phe 290 295 300 Glu Glu Arg His Leu Lys Phe Leu Gln Gln Leu Gly Lys Gly Asn Phe 305 310 315 320 Gly Ser Val Glu Met Cys Arg Tyr Asp Pro Leu Gln Asp Asn Thr Gly 325 330 335 Glu Val Val Ala Val Lys Lys Leu Gln His Ser Thr Glu Glu His Leu 340 345 350 Arg Asp Phe Glu Arg Glu Ile Glu Ile Leu Lys Ser Leu Gln His Asp 355 360 365 Asn Ile Val Lys Tyr Lys Gly Val Cys Tyr Ser Ala Gly Arg Arg Asn 370 375 380 Leu Lys Leu Ile Met Glu Tyr Leu Pro Tyr Gly Ser Leu Arg Asp Tyr 385 390 395 400 Leu Gln Lys His Lys Glu Arg Ile Asp His Ile Lys Leu Leu Gln Tyr 405 410 415 Thr Ser Gln Ile Cys Lys Gly Met Glu Tyr Leu Gly Thr Lys Arg Tyr 420 425 430 Ile His Arg Asp Leu Ala Thr Arg Asn Ile Leu Val Glu Asn Glu Asn 435 440 445 Arg Val Lys Ile Gly Asp Phe Gly Leu Thr Lys Val Leu Pro Gln Asp 450 455 460 Lys Glu Tyr Tyr Lys Val Lys Glu Pro Gly Glu Ser Pro Ile Phe Trp 465 470 475 480 Tyr Ala Pro Glu Ser Leu Thr Glu Ser Lys Phe Ser Val Ala Ser Asp 485 490 495 Val Trp Ser Phe Gly Val Val Leu Tyr Glu Leu Phe Thr Tyr Ile Glu 500 505 510 Lys Ser Lys Ser Pro Pro Ala Glu Phe Met Arg Met Ile Gly Asn Asp 515 520 525 Lys Gln Gly Gln Met Ile Val Phe His Leu Ile Glu Leu Leu Lys Asn 530 535 540 Asn Gly Arg Leu Pro Arg Pro Asp Gly Cys Pro Asp Glu Ile Tyr Met 545 550 555 560 Ile Met Thr Glu Cys Trp Asn Asn Asn Val Asn Gln Arg Pro Ser Phe 565 570 575 Arg Asp Leu Ala Leu Arg Val Asp Gln Ile Arg Asp Asn Met 580 585 590 <210> 51 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> consensus Tobacco Etch Virus (TEV) cleavage site <400> 51 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 52 <211> 240 <212> PRT <213> Artificial Sequence <220> <223> TeV protease domain <400> 52 Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Thr Ile 1 5 10 15 Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly 20 25 30 Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg 35 40 45 Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val 50 55 60 Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met 65 70 75 80 Ile Ile Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu 85 90 95 Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr 100 105 110 Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys 115 120 125 Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr 130 135 140 Lys Asp Gly Gln Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe 145 150 155 160 Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr 165 170 175 Phe Thr Ser Val Pro Lys Asn Phe Met Glu Leu Leu Thr Asn Gln Glu 180 185 190 Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu 195 200 205 Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln 210 215 220 Pro Val Lys Glu Ala Thr Gln Leu Met Asn Glu Leu Val Tyr Ser Gln 225 230 235 240 <210> 53 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> ZAP70-SH2 domain fused to a TEV protease sequence <400> 53 Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser 1 5 10 15 Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly 20 25 30 Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu 35 40 45 Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln 50 55 60 Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro 65 70 75 80 Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys 85 90 95 Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro 100 105 110 Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg 115 120 125 Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser 130 135 140 Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg 145 150 155 160 Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys 165 170 175 Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg 180 185 190 Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val 195 200 205 Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro 210 215 220 Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys 225 230 235 240 Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn 245 250 255 Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala 260 265 270 His Pro Ser Thr Leu Thr His Pro Ser Gly Gly Gly Gly Ser Gly Gly 275 280 285 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Leu Phe 290 295 300 Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Thr Ile Cys His Leu 305 310 315 320 Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe 325 330 335 Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly 340 345 350 Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn Thr 355 360 365 Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Ile Ile Ile 370 375 380 Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg 385 390 395 400 Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln 405 410 415 Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro 420 425 430 Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly 435 440 445 Gln Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly 450 455 460 Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser 465 470 475 480 Val Pro Lys Asn Phe Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln 485 490 495 Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly 500 505 510 His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys 515 520 525 Glu Ala Thr Gln Leu Met Asn Glu Leu Val Tyr Ser Gln 530 535 540 <210> 54 <211> 460 <212> PRT <213> Artificial Sequence <220> <223> PTPN6-SH2 domain fused to a TEV protease sequence <400> 54 Met Val Arg Trp Phe His Arg Asp Leu Ser Gly Leu Asp Ala Glu Thr 1 5 10 15 Leu Leu Lys Gly Arg Gly Val His Gly Ser Phe Leu Ala Arg Pro Ser 20 25 30 Arg Lys Asn Gln Gly Asp Phe Ser Leu Ser Val Arg Val Gly Asp Gln 35 40 45 Val Thr His Ile Arg Ile Gln Asn Ser Gly Asp Phe Tyr Asp Leu Tyr 50 55 60 Gly Gly Glu Lys Phe Ala Thr Leu Thr Glu Leu Val Glu Tyr Tyr Thr 65 70 75 80 Gln Gln Gln Gly Val Leu Gln Asp Arg Asp Gly Thr Ile Ile His Leu 85 90 95 Lys Tyr Pro Leu Asn Cys Ser Asp Pro Thr Ser Glu Arg Trp Tyr His 100 105 110 Gly His Met Ser Gly Gly Gln Ala Glu Thr Leu Leu Gln Ala Lys Gly 115 120 125 Glu Pro Trp Thr Phe Leu Val Arg Glu Ser Leu Ser Gln Pro Gly Asp 130 135 140 Phe Val Leu Ser Val Leu Ser Asp Gln Pro Lys Ala Gly Pro Gly Ser 145 150 155 160 Pro Leu Arg Val Thr His Ile Lys Val Met Cys Glu Gly Gly Arg Tyr 165 170 175 Thr Val Gly Gly Leu Glu Thr Phe Asp Ser Leu Thr Asp Leu Val Glu 180 185 190 His Phe Lys Lys Thr Gly Ile Glu Glu Ala Ser Gly Ala Phe Val Tyr 195 200 205 Leu Arg Gln Pro Tyr Tyr Ser Gly Gly Gly Gly Ser Ser Leu Phe Lys 210 215 220 Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Thr Ile Cys His Leu Thr 225 230 235 240 Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly 245 250 255 Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr 260 265 270 Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr 275 280 285 Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Ile Ile Ile Arg 290 295 300 Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu 305 310 315 320 Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr 325 330 335 Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser 340 345 350 Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly Gln 355 360 365 Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile 370 375 380 His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val 385 390 395 400 Pro Lys Asn Phe Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp 405 410 415 Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His 420 425 430 Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu 435 440 445 Ala Thr Gln Leu Met Asn Glu Leu Val Tyr Ser Gln 450 455 460 <210> 55 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> membrane tethered transcription factor <400> 55 Met Gly Thr Ser Leu Leu Cys Trp Met Ala Leu Cys Leu Leu Gly Ala 1 5 10 15 Asp His Ala Asp Ala Cys Pro Tyr Ser Asn Pro Ser Leu Cys Ser Gly 20 25 30 Gly Gly Gly Ser Glu Leu Pro Thr Gln Gly Thr Phe Ser Asn Val Ser 35 40 45 Thr Asn Val Ser Pro Ala Lys Pro Thr Thr Thr Ala Cys Pro Tyr Ser 50 55 60 Asn Pro Ser Leu Cys Ser Gly Gly Gly Gly Ser Pro Ala Pro Arg Pro 65 70 75 80 Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro 85 90 95 Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu 100 105 110 Asp Phe Ala Cys Asp Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly 115 120 125 Leu Leu Leu Phe Ile Gly Leu Gly Ile Phe Phe Cys Val Arg Cys Arg 130 135 140 His Arg Arg Arg Gln Ala Glu Arg Met Ala Gln Ile Lys Arg Val Val 145 150 155 160 Ser Glu Lys Lys Thr Ala Gln Ala Pro His Arg Phe Gln Lys Thr Cys 165 170 175 Ser Pro Ile Ser Gly Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Met 180 185 190 Pro Lys Lys Lys Arg Lys Val Ala Pro Pro Thr Asp Val Ser Leu Gly 195 200 205 Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp 210 215 220 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro 225 230 235 240 Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp 245 250 255 Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile 260 265 270 Asp Glu Tyr Gly Gly Ser Gly Gly Gly Ser Met Gln Ile Leu Val Ala 275 280 285 Ser Asp Ala Thr Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp 290 295 300 Ile Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys 305 310 315 320 Ala Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr 325 330 335 Lys Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg 340 345 350 Leu Glu Arg Leu Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp 355 360 365 Leu Asp Met Ile Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu 370 375 380 Leu Thr Gly Leu Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr 385 390 395 400 Asp Arg Leu Ala Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln 405 410 415 His Arg Ile Ser Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly 420 425 430 Gln Arg Gln Leu Thr Val 435 <210> 56 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> target receptor <400> 56 Met Ala Val Pro Thr Gln Val Leu Gly Leu Leu Leu Leu Trp Leu Thr 1 5 10 15 Asp Ala Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser 20 25 30 Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Glu Asp 35 40 45 Ile Tyr Phe Asn Leu Val Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro 50 55 60 Lys Leu Leu Ile Tyr Asp Thr Asn Arg Leu Ala Asp Gly Val Pro Ser 65 70 75 80 Arg Phe Ser Gly Ser Gly Ser Gly Thr Gln Tyr Thr Leu Thr Ile Ser 85 90 95 Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln His Tyr Lys 100 105 110 Asn Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg 115 120 125 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 130 135 140 Gly Gly Gly Gly Ser Arg Ser Glu Val Gln Leu Val Glu Ser Gly Gly 145 150 155 160 Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 165 170 175 Gly Phe Thr Leu Ser Asn Tyr Gly Met His Trp Ile Arg Gln Ala Pro 180 185 190 Gly Lys Gly Leu Glu Trp Val Ser Ser Ile Ser Leu Asn Gly Gly Ser 195 200 205 Thr Tyr Tyr Arg Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp 210 215 220 Asn Ala Lys Ser Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu 225 230 235 240 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Gln Asp Ala Tyr Thr Gly Gly 245 250 255 Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Met 260 265 270 Asp Pro Ala Thr Thr Thr Lys Pro Val Leu Arg Thr Pro Ser Pro Val 275 280 285 His Pro Thr Gly Thr Ser Gln Pro Gln Arg Pro Glu Asp Cys Arg Pro 290 295 300 Arg Gly Ser Val Lys Gly Thr Gly Leu Asp Phe Ala Cys Asp Ile Tyr 305 310 315 320 Val Gly Val Val Gly Gly Leu Leu Gly Ser Leu Val Leu Leu Val Trp 325 330 335 Val Leu Ala Val Ile Cys Ser Arg Ala Ala Arg Gly Thr Ile Gly Ala 340 345 350 Arg Arg Thr Gly Gln Pro Leu Lys Glu Asp Pro Ser Ala Val Pro Val 355 360 365 Phe Ser Val Asp Tyr Gly Glu Leu Asp Phe Gln Trp Arg Glu Lys Thr 370 375 380 Pro Glu Pro Pro Val Pro Cys Val Pro Glu Gln Thr Glu Tyr Ala Thr 385 390 395 400 Ile Val Phe Pro Ser Gly Met Gly Thr Ser Ser Pro Ala Arg Arg Gly 405 410 415 Ser Ala Asp Gly Pro Arg Ser Ala Gln Pro Leu Arg Pro Glu Asp Gly 420 425 430 His Cys Ser Trp Pro Leu 435 <210> 57 <211> 509 <212> PRT <213> Artificial Sequence <220> <223> receptor containing a CAR against CD19 with a cleavable CD3-zeta endodomain <400> 57 Met Ser Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu 1 5 10 15 His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu 20 25 30 Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln 35 40 45 Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr 50 55 60 Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro 65 70 75 80 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile 85 90 95 Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly 100 105 110 Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr 115 120 125 Lys Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser Glu Val Lys Leu Gln Glu Ser Gly Pro Gly 145 150 155 160 Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly 165 170 175 Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg 180 185 190 Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr 195 200 205 Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser 210 215 220 Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr 225 230 235 240 Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala 245 250 255 Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Asp Pro 260 265 270 Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala 275 280 285 Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly 290 295 300 Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Phe Trp 305 310 315 320 Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu Val 325 330 335 Thr Val Ala Phe Ile Ile Phe Trp Val Arg Cys Arg His Arg Arg Arg 340 345 350 Gln Ala Glu Arg Met Ala Gln Ile Lys Arg Val Val Ser Glu Lys Lys 355 360 365 Thr Ala Gln Ala Pro His Arg Phe Gln Lys Thr Cys Ser Pro Ile Ser 370 375 380 Gly Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Met Arg Arg Val Lys 385 390 395 400 Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln 405 410 415 Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu 420 425 430 Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg 435 440 445 Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met 450 455 460 Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly 465 470 475 480 Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp 485 490 495 Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg 500 505 <210> 58 <211> 827 <212> PRT <213> Artificial Sequence <220> <223> receptor containing a CAR against CD19 with a CD3-zeta endodomain and a cleavable CD148 endodomain <400> 58 Met Ser Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu 1 5 10 15 His Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu 20 25 30 Ser Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln 35 40 45 Asp Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr 50 55 60 Val Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro 65 70 75 80 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile 85 90 95 Ser Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly 100 105 110 Asn Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr 115 120 125 Lys Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser Glu Val Lys Leu Gln Glu Ser Gly Pro Gly 145 150 155 160 Leu Val Ala Pro Ser Gln Ser Leu Ser Val Thr Cys Thr Val Ser Gly 165 170 175 Val Ser Leu Pro Asp Tyr Gly Val Ser Trp Ile Arg Gln Pro Pro Arg 180 185 190 Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Ser Glu Thr Thr Tyr 195 200 205 Tyr Asn Ser Ala Leu Lys Ser Arg Leu Thr Ile Ile Lys Asp Asn Ser 210 215 220 Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Thr Asp Asp Thr 225 230 235 240 Ala Ile Tyr Tyr Cys Ala Lys His Tyr Tyr Tyr Gly Gly Ser Tyr Ala 245 250 255 Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Asp Pro 260 265 270 Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala 275 280 285 Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly 290 295 300 Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Phe Trp 305 310 315 320 Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu Val 325 330 335 Thr Val Ala Phe Ile Ile Phe Trp Val Arg Arg Val Lys Phe Ser Arg 340 345 350 Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn 355 360 365 Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg 370 375 380 Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro 385 390 395 400 Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala 405 410 415 Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His 420 425 430 Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp 435 440 445 Ala Leu His Met Gln Ala Leu Pro Pro Arg Glu Asn Leu Tyr Phe Gln 450 455 460 Met Ala Val Phe Gly Cys Ile Phe Gly Ala Leu Val Ile Val Thr Val 465 470 475 480 Gly Gly Phe Ile Phe Trp Arg Lys Lys Arg Lys Asp Ala Lys Asn Asn 485 490 495 Glu Val Ser Phe Ser Gln Ile Lys Pro Lys Lys Ser Lys Leu Ile Arg 500 505 510 Val Glu Asn Phe Glu Ala Tyr Phe Lys Lys Gln Gln Ala Asp Ser Asn 515 520 525 Cys Gly Phe Ala Glu Glu Tyr Glu Asp Leu Lys Leu Val Gly Ile Ser 530 535 540 Gln Pro Lys Tyr Ala Ala Glu Leu Ala Glu Asn Arg Gly Lys Asn Arg 545 550 555 560 Tyr Asn Asn Val Leu Pro Tyr Asp Ile Ser Arg Val Lys Leu Ser Val 565 570 575 Gln Thr His Ser Thr Asp Asp Tyr Ile Asn Ala Asn Tyr Met Pro Gly 580 585 590 Tyr His Ser Lys Lys Asp Phe Ile Ala Thr Gln Gly Pro Leu Pro Asn 595 600 605 Thr Leu Lys Asp Phe Trp Arg Met Val Trp Glu Lys Asn Val Tyr Ala 610 615 620 Ile Ile Met Leu Thr Lys Cys Val Glu Gln Gly Arg Thr Lys Cys Glu 625 630 635 640 Glu Tyr Trp Pro Ser Lys Gln Ala Gln Asp Tyr Gly Asp Ile Thr Val 645 650 655 Ala Met Thr Ser Glu Ile Val Leu Pro Glu Trp Thr Ile Arg Asp Phe 660 665 670 Thr Val Lys Asn Ile Gln Thr Ser Glu Ser His Pro Leu Arg Gln Phe 675 680 685 His Phe Thr Ser Trp Pro Asp His Gly Val Pro Asp Thr Thr Asp Leu 690 695 700 Leu Ile Asn Phe Arg Tyr Leu Val Arg Asp Tyr Met Lys Gln Ser Pro 705 710 715 720 Pro Glu Ser Pro Ile Leu Val His Cys Ser Ala Gly Val Gly Arg Thr 725 730 735 Gly Thr Phe Ile Ala Ile Asp Arg Leu Ile Tyr Gln Ile Glu Asn Glu 740 745 750 Asn Thr Val Asp Val Tyr Gly Ile Val Tyr Asp Leu Arg Met His Arg 755 760 765 Pro Leu Met Val Gln Thr Glu Asp Gln Tyr Val Phe Leu Asn Gln Cys 770 775 780 Val Leu Asp Ile Val Arg Ser Gln Lys Asp Ser Lys Val Asp Leu Ile 785 790 795 800 Tyr Gln Asn Thr Thr Ala Met Thr Ile Tyr Glu Asn Leu Ala Pro Val 805 810 815 Thr Thr Phe Gly Lys Thr Asn Gly Tyr Ile Ala 820 825 <210> 59 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> 2a self-cleaving peptide <400> 59 Arg Ala Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 1 5 10 15 Asn Pro Gly Pro 20 <210> 60 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> 2a self-cleaving peptide <400> 60 Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 61 <211> 563 <212> PRT <213> Artificial Sequence <220> <223> dual SH2 domains from SHP-2 fused to ZAP70 kinase domain <400> 61 Trp Phe His Pro Asn Ile Thr Gly Val Glu Ala Glu Asn Leu Leu Leu 1 5 10 15 Thr Arg Gly Val Asp Gly Ser Phe Leu Ala Arg Pro Ser Lys Ser Asn 20 25 30 Pro Gly Asp Phe Thr Leu Ser Val Arg Arg Asn Gly Ala Val Thr His 35 40 45 Ile Lys Ile Gln Asn Thr Gly Asp Tyr Tyr Asp Leu Tyr Gly Gly Glu 50 55 60 Lys Phe Ala Thr Leu Ala Glu Leu Val Gln Tyr Tyr Met Glu His His 65 70 75 80 Gly Gln Leu Lys Glu Lys Asn Gly Asp Val Ile Glu Leu Lys Tyr Pro 85 90 95 Leu Asn Cys Ala Asp Pro Thr Ser Glu Arg Trp Phe His Gly His Leu 100 105 110 Ser Gly Lys Glu Ala Glu Lys Leu Leu Thr Glu Lys Gly Lys His Gly 115 120 125 Ser Phe Leu Val Arg Glu Ser Gln Ser His Pro Gly Asp Phe Val Leu 130 135 140 Ser Val Arg Thr Gly Asp Asp Lys Gly Glu Ser Asn Asp Gly Lys Ser 145 150 155 160 Lys Val Thr His Val Met Ile Arg Cys Gln Glu Leu Lys Tyr Asp Val 165 170 175 Gly Gly Gly Glu Arg Phe Asp Ser Leu Thr Asp Leu Val Glu His Tyr 180 185 190 Lys Lys Asn Pro Met Val Glu Thr Leu Gly Thr Val Leu Gln Leu Lys 195 200 205 Gln Pro Leu Asn Thr Thr Arg Ile Asn Pro Asn Ser Ser Ala Ser Asn 210 215 220 Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala His Pro Ser Thr Leu 225 230 235 240 Thr His Pro Gln Arg Arg Ile Asp Thr Leu Asn Ser Asp Gly Tyr Thr 245 250 255 Pro Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys Pro Arg Pro Met Pro 260 265 270 Met Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser Asp Pro Glu Glu Leu 275 280 285 Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn Leu Leu Ile Ala Asp 290 295 300 Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val Arg Gln Gly Val Tyr 305 310 315 320 Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile Lys Val Leu Lys Gln 325 330 335 Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met Arg Glu Ala Gln Ile 340 345 350 Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg Leu Ile Gly Val Cys 355 360 365 Gln Ala Glu Ala Leu Met Leu Val Met Glu Met Ala Gly Gly Gly Pro 370 375 380 Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu Ile Pro Val Ser Asn 385 390 395 400 Val Ala Glu Leu Leu His Gln Val Ser Met Gly Met Lys Tyr Leu Glu 405 410 415 Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Leu 420 425 430 Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe Gly Leu Ser Lys Ala 435 440 445 Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg Ser Ala Gly Lys Trp 450 455 460 Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn Phe Arg Lys Phe Ser 465 470 475 480 Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr Met Trp Glu Ala Leu 485 490 495 Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys Gly Pro Glu Val Met 500 505 510 Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys Pro Pro Glu Cys Pro 515 520 525 Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp Ile Tyr Lys Trp Glu 530 535 540 Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg Met Arg Ala Cys Tyr 545 550 555 560 Tyr Ser Leu <210> 62 <211> 567 <212> PRT <213> Artificial Sequence <220> <223> dual SHP-2 SH2 domain fused to an Akt kinase domain <400> 62 Trp Phe His Pro Asn Ile Thr Gly Val Glu Ala Glu Asn Leu Leu Leu 1 5 10 15 Thr Arg Gly Val Asp Gly Ser Phe Leu Ala Arg Pro Ser Lys Ser Asn 20 25 30 Pro Gly Asp Phe Thr Leu Ser Val Arg Arg Asn Gly Ala Val Thr His 35 40 45 Ile Lys Ile Gln Asn Thr Gly Asp Tyr Tyr Asp Leu Tyr Gly Gly Glu 50 55 60 Lys Phe Ala Thr Leu Ala Glu Leu Val Gln Tyr Tyr Met Glu His His 65 70 75 80 Gly Gln Leu Lys Glu Lys Asn Gly Asp Val Ile Glu Leu Lys Tyr Pro 85 90 95 Leu Asn Cys Ala Asp Pro Thr Ser Glu Arg Trp Phe His Gly His Leu 100 105 110 Ser Gly Lys Glu Ala Glu Lys Leu Leu Thr Glu Lys Gly Lys His Gly 115 120 125 Ser Phe Leu Val Arg Glu Ser Gln Ser His Pro Gly Asp Phe Val Leu 130 135 140 Ser Val Arg Thr Gly Asp Asp Lys Gly Glu Ser Asn Asp Gly Lys Ser 145 150 155 160 Lys Val Thr His Val Met Ile Arg Cys Gln Glu Leu Lys Tyr Asp Val 165 170 175 Gly Gly Gly Glu Arg Phe Asp Ser Leu Thr Asp Leu Val Glu His Tyr 180 185 190 Lys Lys Asn Pro Met Val Glu Thr Leu Gly Thr Val Leu Gln Leu Lys 195 200 205 Gln Pro Leu Asn Thr Thr Arg Ile Asn Ala Glu Glu Met Glu Val Ser 210 215 220 Leu Ala Lys Pro Lys His Arg Val Thr Met Asn Glu Phe Glu Tyr Leu 225 230 235 240 Lys Leu Leu Gly Lys Gly Thr Phe Gly Lys Val Ile Leu Val Lys Glu 245 250 255 Lys Ala Thr Gly Arg Tyr Tyr Ala Met Lys Ile Leu Lys Lys Glu Val 260 265 270 Ile Val Ala Lys Asp Glu Val Ala His Thr Leu Thr Glu Asn Arg Val 275 280 285 Leu Gln Asn Ser Arg His Pro Phe Leu Thr Ala Leu Lys Tyr Ser Phe 290 295 300 Gln Thr His Asp Arg Leu Cys Phe Val Met Glu Tyr Ala Asn Gly Gly 305 310 315 320 Glu Leu Phe Phe His Leu Ser Arg Glu Arg Val Phe Ser Glu Asp Arg 325 330 335 Ala Arg Phe Tyr Gly Ala Glu Ile Val Ser Ala Leu Asp Tyr Leu His 340 345 350 Ser Glu Lys Asn Val Val Tyr Arg Asp Leu Lys Leu Glu Asn Leu Met 355 360 365 Leu Asp Lys Asp Gly His Ile Lys Ile Thr Asp Phe Gly Leu Cys Lys 370 375 380 Glu Gly Ile Lys Asp Gly Ala Thr Met Lys Thr Phe Cys Gly Thr Pro 385 390 395 400 Glu Tyr Leu Ala Pro Glu Val Leu Glu Asp Asn Asp Tyr Gly Arg Ala 405 410 415 Val Asp Trp Trp Gly Leu Gly Val Val Met Tyr Glu Met Met Cys Gly 420 425 430 Arg Leu Pro Phe Tyr Asn Gln Asp His Glu Lys Leu Phe Glu Leu Ile 435 440 445 Leu Met Glu Glu Ile Arg Phe Pro Arg Thr Leu Gly Pro Glu Ala Lys 450 455 460 Ser Leu Leu Ser Gly Leu Leu Lys Lys Asp Pro Lys Gln Arg Leu Gly 465 470 475 480 Gly Gly Ser Glu Asp Ala Lys Glu Ile Met Gln His Arg Phe Phe Ala 485 490 495 Gly Ile Val Trp Gln His Val Tyr Glu Lys Lys Leu Ser Pro Pro Phe 500 505 510 Lys Pro Gln Val Thr Ser Glu Thr Asp Thr Arg Tyr Phe Asp Glu Glu 515 520 525 Phe Thr Ala Gln Met Ile Thr Ile Thr Pro Pro Asp Gln Asp Asp Ser 530 535 540 Met Glu Cys Val Asp Ser Glu Arg Arg Pro His Phe Pro Gln Phe Ser 545 550 555 560 Tyr Ser Ala Ser Gly Thr Ala 565 <210> 63 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> ITIM conserved sequence <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa may be Ser, Ile, Val or Leu <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (4)..(5) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa may be Ile, Val or Leu <400> 63 Xaa Xaa Tyr Xaa Xaa Xaa 1 5

Claims (24)

  1. 적어도 하나의 코리스메이트-유도된 산물을 생산할 수 있는 유전적으로 조작된 일산화탄소영양성 초산생성 (carboxydotrophic acetogenic) 세균으로서, 상기 세균은 다음 중 적어도 하나를 포함하는, 세균:
    a. 외생성 코리스메이트 피루베이트 분해효소 (EC 4.1.3.40),
    b. 외생성 이소코리스메이트 합성효소 (EC 5.4.4.2),
    c. 외생성 이소코리스메이트 피루베이트 분해효소 (EC 4.2.99.21), 및
    d. 프레페네이트 합성효소를 부분적으로 비활성화시키거나, 완전하게 비활성화시키거나, 결손시키거나, 또는 녹아웃시키는 파괴성 돌연변이를 포함하는 프레페네이트 합성효소 (EC 5.4.99.5).
  2. 청구항 1에 있어서, 상기 세균은 가스 기질의 발효에 의해, 적어도 하나의 코리스메이트-유도된 산물을 생산할 수 있는 클로스트리듐(Clostridium) 세균인, 세균.
  3. 청구항 1에 있어서, 상기 코리스메이트 피루베이트 분해효소는 ubiC인, 세균.
  4. 청구항 1에 있어서, 상기 이소코리스메이트 합성효소는 pchA인, 세균.
  5. 청구항 1에 있어서, 상기 이소코리스메이트 피루베이트 분해효소는 pchB인, 세균.
  6. 청구항 1에 있어서, 상기 프레페네이트 합성효소는 pheA인, 세균.
  7. 청구항 1에 있어서, 상기 파괴성 돌연변이는 프레페네이트 합성효소의 발현 또는 활성을 감소시키거나 제거하는 것인, 세균.
  8. 청구항 7에 있어서, 상기 세균은 모계 세균과 비교하였을 때 감소된 양의 프레페네이트 또는 프레페네이트-유도된 산물들을 생산하는 것인, 세균.
  9. 청구항 7에 있어서, 상기 세균은 티로신 또는 페닐알라닌을 생산하지 않는 것인, 세균.
  10. 청구항 1에 있어서, 상기 세균은 다음 중 적어도 하나를 암호화하는 적어도 하나의 핵산을 포함하는 것인, 세균:
    a.  상기 외생성 코리스메이트 피루베이트 분해효소,
    b.  상기 외생성 이소코리스메이트 합성효소,
    c.  상기 외생성 이소코리스메이트 피루베이트 분해효소, 및
    d.  파괴성 돌연변이를 포함하는 상기 프레페네이트 합성효소.
  11. 청구항 10에 있어서, 상기 핵산은 클로스트리듐(Clostridium)에서 발현을 위하여 코돈 최적화된 것인, 세균.
  12. 청구항 1에 있어서, 상기 코리스메이트-유도된 산물은 카르복실 기 또는 카르복실레이트 음이온으로 치환되고, 하나 이상의 OH 기 및/또는 하나 이상의 NH2 기로 추가로 치환된, 6-원자의 탄소 환을 포함하는 것인, 세균.
  13. 청구항 1에 있어서, 상기 코리스메이트-유도된 산물은 파라-히드록시벤조산, 살리실레이트, 2-아미노벤조에이트, 디히드록시벤조에이트, 4-히드록시시클로헥산 카르복실산, 및 이의 염 및 이온으로 구성된 군에서 선택되는 것인, 세균.
  14. 청구항 1에 있어서, 상기 세균은 ubiC인 코리스메이트 피루베이트 분해효소를 발현시키고, 파라-히드록시벤조산인 코리스메이트-유도된 산물을 생산하는 것인, 세균.
  15. 청구항 1에 있어서, 상기 세균은 pchA인 이소코리스메이트 합성효소 및 pchB인 이소코리스메이트 피루베이트 분해효소를 발현시키고, 살리실레이트인 코리스메이트-유도된 산물을 생산하는 것인, 세균.
  16. 청구항 14 또는 15에 있어서, 상기 세균은 피드백-비감성 DAHP 합성효소를 추가로 발현시키는 것인, 세균.
  17. 청구항 1에 있어서, 상기 세균은 파괴성 돌연변이를 포함하는 프레페네이트 합성효소를 포함하고, 2-아미노벤조에이트, 2,3-디히드록시벤조에이트 또는 4-히드록시시클로헥산 카르복실산인 코리스메이트-유도된 산물을 생산하는 것인, 세균.
  18. 청구항 1에 있어서, 상기 세균은 모계 세균에 의해 생산되지 않는 적어도 하나의 코리스메이트-유도된 산물을 생산하는 것인, 세균.
  19. 청구항 1에 있어서, 상기 세균은 모계 세균보다 더 많은 양의 적어도 하나의 코리스메이트-유도된 산물을 생산하는 것인, 세균.
  20. 청구항 1에 있어서, 상기 세균은 클로스트리듐 오토에타노게눔(Clostridium autoethanogenum), 클로스트리듐 리중다레이(Clostridium ljungdahlii), 및 클로스트리듐 라가스다레이(Clostridium ragsdalei)로 구성된 군으로부터 선택된 모계 세균으로부터 유도된 것인, 세균.
  21. 청구항 20에 있어서, 상기 클로스트리듐 오토에타노게눔(Clostridium autoethanogenum)은 클로스트리듐 오토에타노게눔(Clostridium autoethanogenum) DSM23693인, 세균.
  22. 청구항 2에 있어서, 상기 가스 기질은 CO, CO2, 및 H2 중 적어도 하나를 포함하는 것인, 세균.
  23. 발효 산물을 생산하는 방법으로서,
    발효 산물을 생산하기 위하여 가스 기질의 존재하에 청구항 1의 세균을 발효시키는 단계를 포함하는, 방법.
  24. 청구항 23에 있어서, 상기 가스 기질은 CO, CO2, 및 H2 중 적어도 하나를 포함하는 것인, 방법.
KR1020177033776A 2015-05-27 2016-05-26 코리스메이트-유도된 산물의 생산을 위한 유전적으로 조작된 미생물들 KR102390716B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562167101P 2015-05-27 2015-05-27
US62/167,101 2015-05-27
PCT/US2016/034495 WO2016191625A1 (en) 2015-05-27 2016-05-26 Genetically engineered microorganisms for the production of chorismate-derived products

Publications (2)

Publication Number Publication Date
KR20180002704A KR20180002704A (ko) 2018-01-08
KR102390716B1 true KR102390716B1 (ko) 2022-04-26

Family

ID=57393384

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177033776A KR102390716B1 (ko) 2015-05-27 2016-05-26 코리스메이트-유도된 산물의 생산을 위한 유전적으로 조작된 미생물들

Country Status (11)

Country Link
US (1) US10174303B2 (ko)
EP (1) EP3303594A4 (ko)
JP (1) JP6871870B2 (ko)
KR (1) KR102390716B1 (ko)
CN (2) CN113684167A (ko)
BR (4) BR122023023155A2 (ko)
CA (1) CA2985481C (ko)
EA (1) EA036334B9 (ko)
MY (1) MY186542A (ko)
WO (1) WO2016191625A1 (ko)
ZA (1) ZA201707234B (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10590406B2 (en) * 2014-12-08 2020-03-17 Lanzatech New Zealand Limited Recombinant microorganisms exhibiting increased flux through a fermentation pathway
WO2017200884A1 (en) 2016-05-14 2017-11-23 Lanzatech, Inc. Microorganism with modified aldehyde:ferredoxin oxidoreductase activity and related methods
KR101918673B1 (ko) 2017-04-17 2018-11-14 주식회사 콧데 해양 유래 신규 미생물 및 이를 이용한 화장품 조성물
EA202090616A1 (ru) 2017-09-08 2020-06-10 Ланцатек, Инк. Способы и системы для получения метаболита с использованием обогащенных водородом с1-содержащих субстратов
CN111225978A (zh) * 2017-09-28 2020-06-02 朗泽科技有限公司 Wood-ljungdahl微生物的基因敲除
WO2019126400A1 (en) 2017-12-19 2019-06-27 Lanzatech, Inc. Microorganisms and methods for the biological production of ethylene glycol
EP3752276A4 (en) 2018-02-12 2021-11-17 Lanzatech, Inc. METHODS FOR IMPROVING CARBON CONVERSION EFFICIENCY
EA202092427A1 (ru) 2018-04-20 2021-02-02 Ланцатек, Инк. Интермиттентные электролизные потоки
CN112955558A (zh) 2018-11-19 2021-06-11 朗泽科技有限公司 发酵和气化的集成
WO2020163020A1 (en) 2019-02-08 2020-08-13 Lanzatech, Inc. Process for recovering close boiling products
KR20210134988A (ko) 2019-07-11 2021-11-11 란자테크, 인크. 가스 이용률을 최적화하는 방법
JP2021185831A (ja) * 2020-05-29 2021-12-13 花王株式会社 没食子酸生産能を有する形質転換体
JP2023520257A (ja) 2020-06-06 2023-05-16 ランザテク,インコーポレイテッド アセトラクテートデカルボキシラーゼ遺伝子座位でのノックインを有する微生物
AU2022218205A1 (en) 2021-02-08 2023-05-25 Lanzatech, Inc. Recombinant microorganisms and uses therefor
WO2022245340A1 (en) * 2021-05-18 2022-11-24 Zymergen Inc. Engineered biosynthetic pathways for production of deoxyhydrochorismic acid by fermentation
TW202307202A (zh) 2021-08-06 2023-02-16 美商朗澤科技有限公司 用於改良乙二醇之生物產生的微生物及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140370557A1 (en) * 2013-06-13 2014-12-18 University Of Georgia Research Foundation, Inc. Genetically engineered microbes and methods for producing 4-hydroxycoumarin
WO2015069847A2 (en) * 2013-11-06 2015-05-14 Massachusetts Institute Of Technology Co-culture based modular engineering for the biosynthesis of isoprenoids, aromatics and aromatic-derived compounds

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57170184A (en) * 1980-07-18 1982-10-20 Unisearch Ltd Mutant of e. coli and production of phenylalanine
US6210937B1 (en) * 1997-04-22 2001-04-03 Bechtel Bwxt Idaho, Llc Development of genetically engineered bacteria for production of selected aromatic compounds
CA2333433A1 (en) * 1998-03-31 1999-10-07 Zeneca Mogen B. V. Salicylic acid pathway genes and their use for the induction of resistance in plants
US7056742B2 (en) * 2003-06-16 2006-06-06 E. I. Du Pont De Nemours And Company High Level production of arbutin in green plants
CN100412199C (zh) * 2006-04-29 2008-08-20 北京未名凯拓作物设计中心有限公司 一种提高植物中水杨酸含量的方法及其专用载体
US7704723B2 (en) 2006-08-31 2010-04-27 The Board Of Regents For Oklahoma State University Isolation and characterization of novel clostridial species
CN101903513B (zh) * 2007-01-12 2013-08-21 科罗拉多大学董事会法人 增强微生物对产生的有机化学物质的耐受性的组合物和方法
EP2201123B1 (en) * 2007-10-16 2012-01-18 Monsanto Technology, LLC Processes for recovering shikimic acid
EP2529011A4 (en) * 2010-01-29 2015-07-15 Genomatica Inc MICROORGANISMS AND METHODS FOR BIOSYNTHESIS OF P-TOLUATE AND TEREPHTHALATE
EA025778B1 (ru) * 2010-07-28 2017-01-30 Ланзатек Нью Зиленд Лимитед Новые бактерии и способы их применения
CN102140431B (zh) * 2010-12-21 2014-08-27 大成生化科技(松原)有限公司 L-色氨酸基因工程菌,其构建方法以及使用其发酵生产l-色氨酸的方法
US20110256600A1 (en) 2011-02-02 2011-10-20 Lanzatech New Zealand Limited Recombinant Microorganisms and Methods of Use Thereof
WO2013103894A1 (en) * 2012-01-05 2013-07-11 Paromatics, Llc Biological syntheisis of p-aminobenzoic acid, p-aminophenol, n-(4-hydroxyphenyl)ethanamide and derivatives thereof
US20130316364A1 (en) * 2012-05-23 2013-11-28 Lanzatech New Zealand Limited Selection Method and Recombinant Microorganisms and uses Therefor
BR112015010557A2 (pt) 2012-11-13 2018-05-22 Bayer Materialscience Ag método para a produção de fenol a partir de fontes renováveis por meio de fermentação.
WO2014105796A2 (en) * 2012-12-31 2014-07-03 Invista North America S.A.R.L. Methods of producing 7-carbon chemicals via aromatic compounds
ES2961674T3 (es) * 2013-01-30 2024-03-13 Lanzatech Nz Inc Microorganismos recombinantes que comprenden enzimas dependientes de NADPH y métodos de producción de los mismos

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140370557A1 (en) * 2013-06-13 2014-12-18 University Of Georgia Research Foundation, Inc. Genetically engineered microbes and methods for producing 4-hydroxycoumarin
WO2015069847A2 (en) * 2013-11-06 2015-05-14 Massachusetts Institute Of Technology Co-culture based modular engineering for the biosynthesis of isoprenoids, aromatics and aromatic-derived compounds

Also Published As

Publication number Publication date
BR122023023155A2 (pt) 2024-03-05
EP3303594A4 (en) 2018-12-05
CN107636147B (zh) 2021-09-10
CN107636147A (zh) 2018-01-26
EP3303594A1 (en) 2018-04-11
JP2018522536A (ja) 2018-08-16
BR112017025309A2 (pt) 2018-07-31
US10174303B2 (en) 2019-01-08
CA2985481A1 (en) 2016-12-01
EA036334B1 (ru) 2020-10-28
CA2985481C (en) 2019-04-30
EA201792544A1 (ru) 2018-05-31
BR122023023164A2 (pt) 2024-03-05
ZA201707234B (en) 2019-12-18
MY186542A (en) 2021-07-26
EA036334B9 (ru) 2020-12-24
WO2016191625A1 (en) 2016-12-01
KR20180002704A (ko) 2018-01-08
US20160348087A1 (en) 2016-12-01
BR122023023156A2 (pt) 2024-03-05
CN113684167A (zh) 2021-11-23
JP6871870B2 (ja) 2021-05-19

Similar Documents

Publication Publication Date Title
KR102390716B1 (ko) 코리스메이트-유도된 산물의 생산을 위한 유전적으로 조작된 미생물들
US10316337B2 (en) Genetically engineered bacterium for the production of isobutylene
JP6302471B2 (ja) 組換え微生物およびその使用
TWI824995B (zh) 用於改良氣體醱酵產乙酸菌之效率的精胺酸增補
KR20160093648A (ko) 케톤을 생산하기 위한 방법 및 미생물
CN113840909A (zh) 从气态底物发酵生产2-苯乙醇
TWI811184B (zh) 包括產能醱酵路徑之經基因工程改造之細菌
EA040778B1 (ru) Добавление аргинина с целью повышения эффективности ацетогенов, ферментирующих газ

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant