KR20140048929A - 물질대사적 발달의 방법 - Google Patents

물질대사적 발달의 방법 Download PDF

Info

Publication number
KR20140048929A
KR20140048929A KR1020147000219A KR20147000219A KR20140048929A KR 20140048929 A KR20140048929 A KR 20140048929A KR 1020147000219 A KR1020147000219 A KR 1020147000219A KR 20147000219 A KR20147000219 A KR 20147000219A KR 20140048929 A KR20140048929 A KR 20140048929A
Authority
KR
South Korea
Prior art keywords
gene
ser
ala
lys
glu
Prior art date
Application number
KR1020147000219A
Other languages
English (en)
Inventor
루디 판드자이탄
사라 세바이
알레한드로 루케
Original Assignee
에비아제닉스 에스.에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에비아제닉스 에스.에이. filed Critical 에비아제닉스 에스.에이.
Publication of KR20140048929A publication Critical patent/KR20140048929A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mycology (AREA)
  • Ecology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은
a) 단일 단계 과정으로 (i) 세포 게놈의 통합 부분이거나 유전 작제물의 골격내 존재하는 재조합될 다른 유전자에 대해 상동성이 99.5% 미만인 서열을 갖는 적어도 하나의 유전자 A를 사용하여 세포를 형질전환시키고, (ii) 유전자를 재조합시키며, (iii) 표적 게놈의 통합 부위에서 유전자의 유전자 모자이크를 생성하며, 여기서, 적어도 하나의 유전자 A는 통합 부위의 5' 또는 3' 말단에 고정되는 5' 말단 또는 3' 말단에서 단일의 플랭킹 표적 서열을 갖고, (iv) 물질대사 경로의 궁극적인 추가의 유전자를 재조합하는 단계, 및
b) 유전자 모자이크와 변이체를 발현할 수 있는 궁극적인 추가의 유전자를 포함하는 클론을 선택하는 단계를 포함하는, 체세포 생체내 조립 및, 적어도 하나의 유전자 A의 유전자 모자이크를 사용하는 물질대사 경로의 재조합에 의해, 물질대사 경로의 천연의 소 방향족 분자 생성물의 변이체의 물질대사적 발달을 위한 방법에 관한 것이다.

Description

물질대사적 발달의 방법{METHOD OF METABOLIC EVOLUTION}
본 발명은 체세포 생체내 조립체(somatic in vivo assembly)에 의한 물질대사 경로(metabolic pathway)의 천연의 소 방향족 분자 생성물(natural small aromatic molecule product)의 변이체의 물질대사 발달(metabolic evolution)을 위한 방법 및 유전자 모자이크(gene mosaics)를 사용하는 상기 대사 경로의 재조합(recombination)에 관한 것이다.
단백질 설계의 주요 목표들 중의 하나는 신규의 또는 개선된 특성을 갖는 단백질을 생성하는 것이다. 단백질 또는 효소에 바람직한 활성을 부여하는 능력은 화학 및 약제 산업에서 고려할만한 실제적 적용을 갖는다. 지향 단백질 발달(directed protein evolution)은 단백질 가공시 강력한 기술 플랫폼으로 알려져 있으며, 여기서 변이체의 라이브러리(library)는 바람직한 특성을 지닌 클론(clone)에 대해 실험적으로 조사된다.
지향 단백질 발달은 천연에서 발견되지 않는 바람직한 특성을 지닌 단백질 또는 핵산을 발달시키기 위한 천연의 선택력을 활용한다. 단백질 돌연변이체 및 변이체를 생성하고 바람직한 기능을 선택하기 위해 각종 기술이 사용되고 있다. 재조합 DNA 기술은 신속한 증식 및/또는 높은-수준의 단백질 생산을 위해 단일의 구조 유전자 또는 전체 경로를 위한 유전자를 적합한 대리 숙주로 이전하도록 한다. 활성 또는 기타 특성에 있어서 축적된 개선은 돌연변이 및 스크리닝(screening)의 반복을 통해 일반적으로 수득된다. 지향 발달의 적용은 단백질 안전성을 개선시키고 효소 및 유기체의 활성 또는 전체적인 수행능을 향상시키거나 효소 기질 특이성을 변경시켜 새로운 활성을 설계하기 위한 학문 및 산업 연구소에서 주로 발견된다. 대부분의 지향 발달 계획은 농업, 의학 또는 산업 측면(생체촉매반응)에서 사람에게 유용한 특성을 발달시키는 것을 추구한다.
전체 물질대사 경로의 발달은 특히 매력적인 개념인데, 이는, 대부분의 천연 및 신규 화합물이 단일 효소에 의해서라기 보다는 경로에 의해 생산되기 때문이다. 물질대사 경로 가공은 경로에 있어서 모든 효소의 조화로운 조작을 일반적으로 필요로 한다. 신규 물질대사 경로의 발달 및 생물학적가공(bioprocessing)의 향상은 개개 유전자, 전체 플라스미드, 다중유전자 집단, 또는 심지어 전체 게놈을 발달시키기 위한 재조합 및 스크리닝 또는 선택의 반복된 주기의 공정을 통해 일반적으로 수행된다.
문헌[참조: Shao et al (1)]은 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)에서 인접 단편(fragment)의 5' 또는 3' 말단의 서열을 함유하는 5' 및 3' 말단에서 2개의 플랭킹[flanking: 고정(anchoring)] 영역의 생체내 상동 재조합체를 통해 단일 단계로 전체 생화학적 경로 또는 게놈을 암호화하는 거대한 재조합 DNA의 조립체(assembly)를 기술하고 있다.
문헌[참조: Elefanty et al. (2)]은 돌연변이체 마우스를 생성하기 위한 유전자 표적화 실험을 기술하고 있으며, 여기서, lacZ 리포터 유전자(reporter gene)는 SCL 유전자 자리(locus)에서 녹킹(knocking)된다. 2개의 고정 서열, 즉, 5' 및 3' 말단 각각에서 1개씩의 서열을 사용하는 SCL - lacZ 유전자 표적화 전략을 나타내는 도 1을 참조한다.
문헌[참조: US7807422B2 (3)]은 재조합 미생물에 의한 플라보노이드의 생산을 기술하고 있다. 유전자 세트가 이종 숙주 세포내로 도입됨으로써, 유전자 발현 효소의 생산을 가져온다.
문헌[참조: Naesby et al. (4)]은 효모에서 다양한 천연 생성물 또는 중간체의 생합성 경로 및 생산의 무작위적 조립체를 기술하고 있다. 7개 단계의 플라보노이드 경로의 효소를 암호화하는 유전자는 효모 발현 카세트(yeast expression cassette)내로 개별 클로닝된 후, 효모 인공 염색체 위에 무작위로 결합되었다. 유사하게, 문헌[참조: Trantas et al (5)]에서는 효모 플라스미드내에서 플라보노이드 및 스틸벤 경로 효소를 암호화하는 이종 유전자를 발현시킬 수 있었다.
지향 발달은 또한 생체내 발달로 불리는, 살아 있는 세포 속에서 수행될 수 있거나, 세포를 전혀 포함하지 않을 수 있다(시험관내 발달). 생체내 발달은 발달된 단백질 또는 핵산이 살아있는 유기체들내에서 사용되어야 하는 경우 유용한, 세포 환경내 특성 선택의 이점을 갖는다. 효모내에서의 생체내 상동 재조합은 유전자 클로닝, 플라스미드 작제(plasmid construction) 및 라이브러리 생성을 위해 광범위하게 사용되어 왔다.
라이브러리 다양성은 돌연변이유발 또는 재조합을 통해 수득된다. DNA 셔플링(shuffling)은 다수의 유전자들로부터 유리한 돌연변이들의 직접적인 재조합을 허용한다. DNA 셔플링에서 DNA 서열의 집단은 무작위로 단편화된 후, 완전한 길이의 하이브리드 서열들로 재조립된다.
상동 재조합 목적을 위해, 천연에 존재하는 상동 유전자를 출발 다양성의 공급원으로서 사용한다. 단일-유전자 셔플링 라이브러리 구성원은 전형적으로 95% 이상 동일하다. 그러나, 패밀리-셔플링(familiy-shuffling)은 전형적으로 60% 이상 동일한 서열의 교환을 차단하도록 한다. 기능적인 서열 다양성은 천연의 선택에서 살아남은 관련된 모 서열들로부터 기원하므로, 훨씬 더 많은 수의 돌연변이가 구조 또는 기능에 있어 유해한 효과을 도입하지 않고 소정의 서열내에서 용인된다.
다양성이 30% 이하인 상이한 기원의 DNA 단편의 재조합은 국제출원공보 WO1990007576A1호(6)에 기술되어 있다. 하이브리드 유전자는, 이의 미스매치 복구(mismatch repair: MMR) 시스템이 일시적으로 불활성화된 세균 또는 미스매치 복구 결핍성 세균내에서 속간(intergeneric) 및/또는 종간(interspecific) 재조합에 의해 생체내에서 생산된다. 이로써 손상된 DNA가 복구되는 과정이 회피되며, 이는 다양한 서열들 사이의 재조합 빈도, 즉, 동족 재조합(homeologous recombination) 상 억제 효과를 가질 수 있다.
라이브러리의 다양성은 효율적으로 짝을 이루어 이배체 유기체를 형성시키는 반수체 세포의 능력의 장점을 취함으로써 향상시킬 수 있다. 이의 식물성 생장 생활 주기에서 에스. 세레비지아에(S. cerevisiae) 세포는 반수체 게놈을 가진다. 즉, 모든 염색체는 단일 카피(single copy)로 존재한다. 특정 조건들 하에서 반수체 세포는 짝을 이룰 수 있다. 이러한 방법에 의해, 이배체 세포가 형성된다. 이배체 세포는 특히, 특정 영양물이 손실되는 경우에 다시 반수체 세포를 형성할 수 있다. 이후에, 이들은 감수분열이라 불리는 공정을 수행한 후 포자형성에 의해 4개의 반수체 포자를 형성한다. 감수분열 동안 2개의 모 게놈의 상이한 염색체가 결합한다. 감수분열 재조합 동안 DNA 단편은 교환하여 재조합된 DNA 물질을 생성한다.
국제출원공보 WO2005/075654A1호(7)는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)내에서 재조합 DNA 서열을 생성하기 위한 시스템을 기재하고 있으며, 당해 시스템은 에스. 세레비지아에의 성적 생식 주기를 기초로 한다. 이형접합체성 이배체 세포는 감수분열 및 포자 형성의 공정을 유도하는 조건들하에서 성장한다. 감수분열은 유전적 재조합의 증가된 빈도에 의해 일반적으로 특성화된다. 따라서, 반수체 세포 또는 포자들인 감수분열의 생성물은 2개의 분기된(diverged) DNA 서열들 사이의 재조합으로 인하여 재조합 DNA 서열을 함유할 수 있다. 반복된 방법에 의해 재조합 반수체 자손이 선택되어 서로 짝을 이루며, 수득되는 이배체는 다시 포자를 형성하고, 이의 자손 포자는 적절한 선택 조건에 처하여 새로운 재조합 현상을 확인한다. 이러한 공정은 야생형 또는 미스매치 복구 결함성 에스. 세레비지아에 세포에 기술되어 있다. 따라서, 2개의 선택 마커에 의해 각각 플랭킹된 목적 유전자는 미스매치 복구 결함성 이배체 균주의 2개의 자매 염색체 각각의 동일한 유전자자리 내로 통합된다. DNA 서열은 DNA가 통합될 유전자자리의 플랭킹 DNA 서열에 100% 동일한 신규 DNA 단편의 5' 또는 3' 말단에 가해진다. 이들 플랭킹 표적 서열은, 길이가 약 400 내지 450 뉴클레오타이드이다. 이후에, 세포는 포자형성을 개시하도록 강제된다. 포자형성 동안 재조합 공정이 일어난다. 수득되는 포자 및 재조합 서열은 적절한 플랭킹 마커에 대한 선택에 의해 차별화될 수 있다.
상동 DNA 서열을 효율적으로 재조합하는 효모의 능력을 또한 이용하여 라이브러리의 다양성을 증가시킬 수 있다. 89.9%의 상동성을 공유하는 2개의 유전자를 PCR에 의해 돌연변이시켜 야생형 효모로 형질전환시키는 경우, 2개의 유전자 전체에서 몇개의 교차점(cross-over points)을 나타내는, 10e7의 키메라 라이브러리(chimeric library)가 생체내 상동 재조합을 통해 생성된다(8).
재조합 숙주를 가공하여 물질대사 경로를 개선시킴으로써 소 분자(small molecule)를 산업적 규모로 생산하는 노력들이 이루어져 왔지만, 이러한 물질대사 생성물의 변이체는 예를 들면, 중간체의 축적을 초래하는 불완전한 경로에 의해 산발적으로만 발견되어 왔다.
본 발명의 목적은 물질대사 경로의 생성물들로서 천연의 소 방향족 분자의 변이체를 생산하는 개선된 방법을 제공하는 것이다.
당해 목적은 본 발명의 실시실시양태들을 제공함으로써 달성된다.
발명의 요약
본 발명에 따라서,
a) 단일 단계 과정으로 (i) 세포 게놈의 통합 부분이거나 유전 작제물(genetic construct)의 골격내에 존재하는 재조합될 다른 유전자에 대해 상동성이 99.5% 미만인 서열을 갖는 적어도 하나의 유전자 A를 사용하여 세포를 형질전환시키고, (ii) 유전자를 재조합시키며, (iii) 표적 게놈의 통합 부위에서 유전자의 유전자 모자이크를 생성하며, 여기서, 적어도 하나의 유전자 A는 상기 통합 부위의 5' 또는 3' 말단에 고정된 5' 말단 또는 3' 말단에서 단일의 플랭킹 표적 서열을 갖고, (iv) 물질대사 경로의 궁극적인 추가의 유전자를 재조합하는 단계, 및
b) 상기 유전자 모자이크와, 변이체를 발현할 수 있는 궁극적인 추가의 유전자를 포함하는 클론을 선택하는 단계를 포함하는, 체세포 생체내 조립 및, 적어도 하나의 유전자 A의 유전자 모자이크를 사용하는 물질대사 경로의 재조합에 의한, 물질대사 경로의 천연의 소 방향족 분자 생성물의 변이체의 물질대사적 발달을 위한 방법을 제공한다.
선택 마커가 유전자 모자이크내에서 사용되고 클론이 선택 마커의 존재에 따라 선택되는 것이 특히 바람직하다. 예를 들면, 유전자 모자이크는 선택 마커를 포함하는데, 예를 들면, 여기서, 상기 유전자 A는 선택 마커에 연결된다. 대안적으로, 선택은 또한 예를 들면, 수율 또는 기능적 특징을 결정함으로써 재조합들로 초래된 임의 생성물의 존재로 이루어질 수 있다. 구체적으로 하나 이상의 상이한 선택 마커가 유전자 모자이크 유형을 달리하는데 사용될 수 있다.
본 발명의 방법에 유용한 선택 마커는 공지된 영양물질 영양요구성 마커, 항생물질 내성 마커, 형광성 마커, 녹-인 마커들(knock-in markers), 활성화제/결합 도메인 마커 및 우성 열성 마커(dominant recessive marker) 및 비색 마커 중 임의의 것으로 이루어진 그룹 중에서 선택될 수 있다. 바람직한 마커는 일시적으로 불활성화되거나 기능적으로 녹아웃될 수 있고, 재-확립되어 이의 현저한 특성을 회복할 수 있다. 추가의 바람직한 마커는 추적가능한 유전자이며, 여기서 마커는 마커 기능을 지닌 별도의 서열의 부재하에, 유전자 서열 A 및/또는 유전자 B와 같은 다른 유전자(들)의 기능이므로, 유전자 모자이크의 발현은 모자이크 자체의 검출을 통해 직접 측정될 수 있다. 이 경우 유전자 모자이크는 직접적으로 추적가능하다.
구체적인 실시실시양태에 따라서, 상기 유전자는 선형 폴리뉴클레오타이드, 벡터 또는 효모 인공 염색체 속에 포함된다. 구체적으로, 유전자 A 및/또는 재조합될 다른 유전자는 바람직하게는 300 내지 20,000bp의 선형 폴리뉴클레오타이드의 형태이다. 구체적으로, 플라스미드 또는 메가플라스미드를 작제하거나 사용할 필요는 없을 수 있다. 따라서, 유전자(들)은 자체로, 즉, 담체없이 사용될 수 있다.
재조합 및 통합에 사용된 유전자는 또한 예를 들면, 상기 유전자(들)을 수반하기 위한 벡터로서 사용될, 임의 유전적 작제물내에 포함될 수 있다. 이러한 유전자는 따라서 유전자 작제물, 예를 들면, 선형 폴리뉴클레오타이드, 벡터 또는 효모 인공 염색체 내에 포함될 수 있다. 이들은 선형 폴리뉴클레오타이드, 플라스미드, PCR 작제물, 인공 염색체, 예를 들면, 효모 인공 염색체, 바이러스 벡터 또는 수송가능한 성분을 바람직하게 포함한다.
본 발명의 구체적인 실시양태에 따라서, 표적 게놈의 통합 부위는 예를 들면, 선형 폴리뉴클레오타이드, 플라스미드 또는 인공 염색체를 포함하는 염색체내 유전자 어느 것 위에도 위치한다.
구체적으로, 상기 다른 유전자는 표적 게놈, 예를 들면, 세포 게놈의 일부이다. 바람직한 실시양태에서, 상기 다른 유전자는 세포 게놈의 일부인 유전자 B이다.
대안의 바람직한 실시양태에 따라서, 상기 다른 유전자는 선형 폴리뉴클레오타이드와 같은, 표적 게놈으로부터의 유전적 작제물 분리체이며, 재조합의 과정 동안 표적 게놈내로 임의로 통합된다.
본 발명에 따른 방법의 구체적인 양상에 따라서, 세포는 적어도 하나의 유전자 A 및 적어도 하나의 유전자 B와 함께 공동-형질전환(co-transform)되며, 여기서 유전자 A의 상기 단일의 플랭킹 표적 서열은 상기 표적 게놈 위의 통합 부위의 5' 말단에 고정되며, 여기서 유전자 B는 통합 부위의 3' 말단에 고정되는 단일의 플랭및 표적 서열에 연결된다.
구체적으로, 세포는 선택 마커를 지닌 적어도 하나의 유전자 A와 적어도 하나의 유전자 B와 공동-형질전환될 수 있으며, 여기서 유전자 A의 상기 단일의 플랭킹 표적 서열은 상기 표적 게놈 상의 통합 부위의 5' 말단에 고정되고, 여기서 유전자 B는 상이한 선택 마커 및, 통합 부위의 3' 말단에 고정된 단일의 플랭킹 표적 서열에 연결되고, 여기서 적어도 2개의 선택 마커에 대한 클론이 선택된다.
구체적으로, 세포는 적어도 2개의 상이한 유전자 A1 및 A2 및 임의로 적어도 2개의 상이한 유전자 B1 및 B2로 공동-형질전환된다.
본 발명에 따른 방법의 추가의 양상에 따라서, 적어도 하나의 추가 유전자 C는 공동-형질전환되며, 당해 유전자 C는 유전자 A 및/또는 상기 다른 유전자, 예를 들면, 유전자 B의 서열과 하이브리드화하는 서열을 가짐으로써 유전자 A 및/또는 상기 다른 유전자에 대한 상기 추가 유전자 C의 조립체 및 궁극적인 재조합체가 수득된다.
구체적으로, 상기 유전자 C의 하이브리드화 서열은 상기 서열에 대해 99.5% 미만의 서열 상동성, 및 바람직하게는 적어도 30%의 서열 상동성을 갖는다.
구체적으로 유전자들내에 적어도 하나의 뉴클레오타이드 교환 또는 교차를 갖는 유전자 모자이크가 선택된다. 즉, 예를 들면, 개선된 특성 또는 개선된 수율을 갖는, 상이한 방식의 생성물의 발현에 적합한 유전자들과 같이, 재조합된 유전자내 유전자 모자이크를 수득하기 위한 부분적인 유전자의 혼합물로서 이해되는, 유전자 A의 일부분 및 결합된 상기 다른 유전자(들)의 일부분을 포함하는 것들과 같은, 유전자내 교차를 갖는 모자이크가 선택된다. 이러한 유전자내 유전자 모자이크는 재조합 및 바람직하게는 또한 일련의 유전자들의 조립에 의해 생산될 수 있으며, 여기서 조립된 유전자들 중 하나 이상은 이러한 유전자내 유전자 모자이크를 갖는다.
바람직한 실시양태에 따라서, 적어도 3개의 상이한 유전자 A 및/또는 B 및/또는 C의 모자이크가 수득될 수 있다.
바람직하게는, 상기 유전자 A 및/또는 상기 다른 유전자는 비-암호화 서열이거나 활성을 갖는 폴리펩타이드 또는 폴리펩타이드의 일부분을 암호화하는 서열이다.
구체적으로, 본 발명의 방법은 활성을 갖는 폴리펩타이드의 일부분을 암호화하는 유전자 A, B 및/또는 C를 사용한다. 따라서, 유전자 A 및/또는 B 및/또는 C와 같은 유전자, 바람직하게는 이들 모두는 자체로서 생물학적으로 활성인 폴리펩타이드를 개별적으로 암호화하지 않지만, 이의 일부분만을 암호화할 수 있으며, 유전자 조립시에만 각각의 활성 또는 변형된 활성을 가져올 수 있다.
본 발명의 방법을 사용하여, 생화학 경로의 폴리펩타이드를 암호화하는 다중 유전자를 조립하여 재조합시킬 수 있다. 바람직한 실시양태에 따라서, 상기 물질대사 경로의 적어도 2개의 유전자의 재조합 및 조립에 있어서, 예를 들면, 상기 물질대사 경로의 폴리펩타이드를 암호화하는 적어도 2개의 유전자가 재조합되어 조립된다.
구체적으로, 상기 유전자는 바람직하게는 300 내지 20,000bp의 선형 폴리뉴클레오타이드이다.
구체적인 실시양태에 따라서, 염기 쌍이 적어도 3개, 바람직하게는 적어도 9개 내지 20,000개 이하이고, 바람직하게는 700bp당 적어도 3개의 교차 현상을 갖는 유전자 모자이크가 수득된다. 이는 바람직하게는, 700개 염기쌍, 보다 바람직하게는 600b당, 500bp 또는 심지어 그 이하의 bp 당 적어도 3개의 교차 현상, 바람직하게는 적어도 4, 5 또는 10개의 교차 현상을 지닌, 적어도 하나의 유전자내 모자이크를 포함하는 유전자 모자이크가 바람직하다. 전형적으로, 고도의 교차 현상은 유전자의 폭넓은 다양성을 제공하며, 이는 적합한 라이브러리 구성원을 선택하기 위한 라이브러리를 생산하는데 사용될 수 있다. 모자이크 또는 교차 현상의 정도는 이러한 라이브러리의 품질 매개변수로서 이해될 수 있다.
본 발명에 따른 방법은 구체적으로 유전자내 유전자 모자이크를 갖는 적어도 하나의 클론의 선택을 제공한다. 구체적으로, 유전자 조립체 및 적어도 하나의 유전자내 유전자 모자이크를 갖는 적어도 하나의 클론이 선택된다.
본 발명의 방법에 따라 변형되는 유전자는 예를 들면, 과학적 또는 산업적 목적을 위해 소 유기 분자를 생산하기 위한 공급원 물질의 효소적 프로세싱에 유용한 임의 유전자들일 수 있다. 이들 유전자는 예를 들면, 전체적으로 또는 부분적으로 일부분 서열을 포함하며, 생물학적 활성을 지닌 폴리펩타이드를 암호화하지 않는 폴리펩타이드의 변이체를 암호화할 수 있으며, 당해 폴리펩타이드는 효소, 전사 인자, 수송 단백질, 시그날 펩타이드(signal peptide), 수용체, 호르몬, 성장 인자로 이루어진 그룹 중에서 구체적으로 선택되나, 또한 생성물의 발현을 증진시킬 수 있는 프로모터(promoter), 터미네이터(terminator) 및 다른 조절 인자와 같은 비 폴리펩타이드 유전자를 암호화할 수 있다.
따라서, 본원에서 이해되는 것으로서 "효소적 발달" 또는 "효소적 합성"을 포함하는 "물질대사적 발달"을 위한 서열의 재조합체 및/또는 조립체는 효소 변이체 또는, 보조 인자를 포함하지만 또한 비-암호화 서열도 포함하는, 효소의 발현 또는 활성을 개선시키는 화합물에 의해서와 같은 물질대사 경로의 효소적 가공을 뒷받침하는 서열 모자이크를 말한다.
또한 "부분 유전자"로 불리는, 생물학적 활성을 갖는 폴리펩타이드의 일부분으로서 아미노산 서열을 암호화하는 유전자를 변형시키는 경우, 이러한 부분 유전자의 조립체가 기능적 특징을 갖는 것, 예를 들면, 생물학적 활성을 갖는 폴리펩타이드를 암호화하는 것이 바람직할 수 있다. 바람직하게는, 다수의 상이한 유전자, 예를 들면 크기가 3bp 내지 20,000bp, 구체적으로 적어도 100bp, 바람직하게는 300bp 내지 20,000bp, 구체적으로 10,000bp 이하의 크기를 갖는 다수의 상이한 유전자가 재조합되고, 상이한 유전자의 수는 예를 들면, 생물학적 활성을 갖는 재조합 폴리펩타이드를 암호화하는 재조합된 유전자 서열을 생산하기 위해 적어도 2개, 보다 구체적으로 적어도 3, 4, 5, 6, 7, 8, 9 또는 적어도 10개이며, 이는 예를 들면, 증가된 생물학적 활성을 갖도록 유리하게 조절된다. 이와 관련하여 사용된 것으로서 용어 "생물학적 활성"은 구체적으로, 특수 기질을 특수 생성물로 전환시키는 활성과 같은 효소 활성을 말한다. 본 발명에 따라 다양화된 바람직한 유전자는 다중-사슬 폴리펩타이드를 암호화한다.
본 발명에 따른 방법은 구체적으로 항상 중간체를 포함하는, 페닐프로파노이드, 플라보노이드, 플라바놀, 안토시아닌, 리그닌, 시아니딘, 챨콘(chalcone), 바닐린, 및 천연적으로 존재하는 이의 유도체로 이루어진 그룹 중에서 선택된 천연의 소 방향족 분자를 말한다.
특히, 상기 변이체는 재조합 효소 변이체에 의해 합성된다.
구체적인 실시양태에서, 효소 변이체는 이러한 유전자 모자이크에 의해, 예를 들면 유전자 모자이크의 재조합 및 궁극적인 조립에 의해 직접적으로, 또는 예를 들면 효소 공정의 순서를 통한 이러한 유전자 모자이크의 결과로써 수득된다. 예시적인 방법은 신나메이트-4-하이드롤라제(C4H) 및, 개선되거나 신규한 효소학적 특성을 갖는 효소를 암호화하는 C4H 생성된 유전자를 말한다.
4-쿠마로일 CoA는 폴리프로파노이드 물질대사에서 중심 분자이며, 이는 또한 플라보노이드와 스틸벤의 합성을 정의하기 위한 중요한 분지점인, 리가제 4CL에 대한 기질이다. 주요 효소 CHS는 플라보노이드와 이소플라본 둘다의 합성을 위한 중간체로서 사용되는 챨콘을 합성한다.
바람직한 실시양태에 따라서, 상기 변이체는 예를 들면, 기능성 검정에 의해 측정된 것으로서, 항균, 항산화, 향기 및 풍미가 강한 활성의 그룹 중에서 선택된 생물학적 활성을 갖는 페닐프로파노이드이다.
특히 바람직한 방법은 신규한 구조 및 기능을 갖는 천연의 소 방향족 분자의 변이체를 생산하기 위한 생물학적 공급원 물질 또는 배열의 가공으로서, 각각의 유전자 모자이크를 갖는 효소 변이체 또는 경로 변이체를 수득하기 위해, 생물학적 활성을 갖는 적어도 2개의 효소를 포함하는, 효소 및 효소 경로의 재조합체 및 조립체를 사용한다. 이로써, 효소 발달을 통해 신규한 소 분자를 합성하는 것이 최초로 가능하게 되었다.
임의 재조합 적격 진핵 또는 원핵 숙주 세포도 본 발명에 따른 체세포 생체내 재조합에 의해 유전자 모자이크를 생성하는데 사용될 수 있다. 본 발명의 바람직한 실시양태에 따라서, 세포는 복구 결함성 세포, 예를 들면, DNA 복구 결함과 같은 핵산 복구 결함 세포, 즉, DNA 복구 결함성 세포, 또는 MMR 결함 세포이다.
구체적으로, 세포는 진핵 세포, 바람직하게는 진균, 포유동물 또는 식물 세포, 또는 원핵 세포이다.
바람직하게는 세포는 아스퍼길러스 아종(Aspergillus sp) 또는 진균 세포이며, 바람직하게는 사카로마이세스(Saccharomyces), 칸디다(Candida), 클루이베로마이세스(Kluyveromyces), 한세눌라(Hansenula), 스키조사카로마이세스(Schizosaccaromyces), 야로위아(Yarrowia), 피치아(Pichia) 및 아스퍼길러스(Aspergillus)로 이루어진 그룹 중에서 선택될 수 있다.
바람직하게는, 반수체 효모 균주들과 같은 반수체 균주들이 사용된다.
대안적으로, 이. 콜라이(E. coli), 바실러스, 스트렙토마이세스 또는, 헬라(HeLa) 세포 또는 저켓(Jurkat) 세포와 같은 포유동물 세포 또는, 아라비도프시스(Arabidopsis)와 같은 식물 세포가 사용될 수 있다.
구체적인 실시양태에 따라서, 플랭킹 표적 서열은, 길이가 적어도 5 bp, 바람직하게는 적어도 10 bp, 보다 바람직하게는 적어도 20 bp, 50 bp, 100 bp 내지 5,000 bp이다. 구체적으로, 플랭킹 표적 서열은 상기 유전자에 연결되거나 상기 유전자의 필수적인 말단 부분이다. 상기 플랭킹 표적 서열은, 상동성이 30% 내지 99.5%, 바람직하게는 95% 미만, 90% 미만, 80% 미만의 범위이며, 상기 통합 부위의 고정 서열과 하이브리드화되는 것이 바람직하다.
게놈의 표적 통합 부위에 고정되는 적어도 2개의 상이한 플랭킹 표적 서열이 본 발명에 따라 사용되는 경우, 이들은 서로 재조합하지 않는 것이 바람직하며, 바람직하게는 이들은 30% 미만의 상동성을 공유한다.
본 발명의 특수 실시양태에 따라서, 본 발명에 따른 방법을 사용하여 세포내에서 다양한 유전자 모자이크를 생성하는 단계, 및 상기 세포의 표면에 상기 다양성을 나타내게 하여 모자이크의 라이브러리를 수득하는 단계를 포함하는, 유전자 변이체의 세포 디스플레이(display) 방법이 제공된다.
본 발명의 구체적인 양상에 따라서,
a) 단일 단계 과정으로 (i) 세포 게놈의 통합 부분이거나 유전자 작제물의 골격내에 존재하는 재조합될 다른 유전자에 대해 서열 상동성이 99.5% 미만인 적어도 하나의 유전자 A를 갖는 세포를 형질전환시키고, (ii) 상기 유전자를 재조합시키고, (iii) 표적 게놈의 통합 부위에서 유전자의 유전자 모자이크를 생성하며, 여기서, 상기 적어도 하나의 유전자 A는 상기 통합 부위의 5' 또는 3' 말단에 고정되는 5' 말단 또는 3' 말단에서 단일의 플랭킹 표적 서열을 갖고, (iv) 물질대사 경로의 궁극적인 추가의 유전자들을 재조합하는 단계, 및
b) 유전자 모자이크 및 궁극적인 추가의 유전자를 포함하는 클론을 수집하여 상기 변이체를 생산할 수 있는 라이브러리를 수득하는 단계를 포함하여, 체세포 생체내 조립 및, 적어도 하나의 유전자 A의 유전자 모자이크를 사용하는 상기 물질대사 경로의 재조합에 의한 재조합 세포 가공을 포함하는 것으로서, 물질대사 경로의 천연의 소 방향족 분자 생성물의 변이체를 생산하는 세포의 라이브러리가 제공된다.
본 발명의 다른 양상에 따라서, 적어도 1%, 보다 바람직하게는 적어도 10%, 보다 바람직하게는 적어도 20%, 보다 바람직하게는 적어도 40%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 80%, 심지어 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 기능적 ORF를 함유하는, 상기 변이체를 생산하는 적어도 10E3의 상이한 클론을 포함하는 것으로서, 상기 방법으로 수득가능한 라이브러리가 제공된다.
용어 "수득가능한"은 또한 방법으로 수득된 생성물을 말하는 것으로 잘 이해된다.
구체적인 실시양태에 따라서, 물질대사 경로의 레파토리를 암호화하는 재조합 유전자를 포함하는 세포의 라이브러리가 제공되며, 이는 본 발명에 따른 방법으로 수득가능하다.
구체적으로, 라이브러리는 합성 효소의 레파토리를 암호화하는 재조합 유전자를 포함하는 세포의 라이브러리이다.
구체적으로, 합성 재조합 유전자의 라이브러리가 제공되며, 이는 본 발명에 따른 방법으로 수득가능한 라이브러리로부터 수득가능하다.
이러한 바람직한 디스플레이에 의해 수득가능한 라이브러리는 기능적인 개방 판독 프레임(open reading frame: ORF)내에 높은 비율(high percent)의 유전자 모자이크, 바람직하게는 적어도 80%의 유전자 모자이크를 포함한다.
본 발명에 따른 라이브러리는, 구체적으로 유전자 변이체를 함유하는 각종 유기체를 포함하는 구체적으로 생물학적 라이브러리인 임의의 적합한 형태로 존재할 수 있다. 본 발명에 따른 생물학적 라이브러리는 유기체의 레파토리를 창조하기 위해 유기체의 집단내에 함유되고/되거나 유기체의 집단에 의해 구체적으로 발현될 수 있으며, 여기서 개개 유기체는 적어도 하나의 라이브러리 구성원을 포함한다.
본 발명의 구체적인 양상에 따라서, 이러한 라이브러리로부터의 유전자 변이체, 예를 들면, 유기체의 레퍼토리로부터 선택된 유기체를 포함하는 유기체가 추가로 제공된다. 본 발명에 따라 제공된 유기체는 예를 들면, 생산 숙주 세포로서 적합한 발현 시스템으로 유전자 발현 생성물을 발현시키기 위해 사용될 수 있다.
본 발명에 따른 방법은 바람직하게는 예를 들면, 기능적 검정을 통해 본 발명에 따른 라이브러리로부터 천연의 소 방향족 분자의 변이체를 선택하는 단계를 추가로 제공한다.
예를 들면, 변이체의 구조 및 기능을 측정하여, 변이체를 추가로 특성화하는 것이 바람직하다.
구체적인 실시양태에서, 당해 방법은 재조합 숙주내에서 상기 변이체를 생산하는 것을 추가로 포함한다.
다른 구체적인 실시양태에서, 당해 방법은 상기 변이체를 합성적으로 생산함을 추가로 포함한다.
도 1: 비-감수분열성 생체내 재조합
동족 유전자 A 및 B(상동성 99.5% 미만)를 재조합하였다. 마커 서열 및 플랭킹 표적 서열은 상동이 아니므로, 재조합/조립체는 유전자 A 및 B에서만 발생하였다. 그 결과, 하이브리드/모자이크 DNA는 재조합된 유전자 A 및 B, 2개의 마커 및 두개의 플랭킹 표적 서열을 함유하였다. 상기 유전자 모자이크는 표적 염색체상의 표적 유전자자리내로 통합된다. 전체 작제물을 통합한 클론은 마커 둘다에 대해 선택성인 적절한 배지 속에서 성장시켰다.
T 5' 및 T 3'는 염색체 부위 상의 상동 통합을 지향하는 효모 게놈(약 400bp) 상의 표적 서열(99.5% 미만의 상동성)에 상응한다. M1 및 M2는 이중 선택을 위한 플랭킹 마커이다. 유전자 A 및 유전자 B는 제공된 정도의 상동성(99.5% 미만)을 지닌 관련된 상동 버젼이다. 오우버랩핑(overlapping) 서열은 유전자 둘다의 전체 ORF에 상응한다. MMR 결함성 효소 형질전환체내 동족 재조합에 의한 조립 후, 이중 선택은 재조합체들의 분리를 허용한다.
도 2: 동족 재조합에 의한 DNA 의 재조합 및 조립
당해 도는 구체적인 실시양태의 개략도를 나타내며, 여기서 세포는 적어도 2개의 유전자, 80bp의 이들의 오우버랩핑 분획 상에 상동성이 99.5% 미만인, DNA 단편 A 및 B로 공동-형질전환된다. 각각의 DNA 단편은 하나의 선택 마커에 의해 플랭킹된다.
단편 A는 염색체 상에 5' 말단의 정확한 통합 부위에 상응하는 플랭킹 표적 서열 및 단편 B와 오우버랩된 하이브리드화 영역을 함유하였고, 단편 B는 3' 통합 부위에 상응하는 플랭킹 표적 서열 및 단편 A와 오우버랩된 하이브리드화 영역을 함유하였다. 미스매치(mismatch) 결함성 효모 세포를 수득되는 단편으로 형질전환시켰다. 수득되는 형질전환체를 마커 둘다에 대해 선택적인 배지에 플레이팅(plating)하였다. 마커 둘다에 대해 선택될 수 있는 클론을 분리하고, 조립되고/통합된 군집의 온전성 및 또한 유전자 A 및 B의 ORF 재구성을 선택된 재조합체의 게놈성 DNA의 분자 분석으로 입증하였다.
T 5' 및 T3'는 염색체 부위 위에 상동 통합을 지정하는 효모 게놈(약 400bp) 상의 표적 서열(99.5% 미만의 상동성)에 상응한다. M1 및 M2는 이중 선택을 위한 플랭킹 마커이다. DNA 단편 A 및 B는 하나의 유전자로 조립될 수 있으며, 이는 GFP와 같이 추적가능하거나, 당해 방법으로 조립되는 2개의 유전자를 나타낼 수 있다. 모든 유전자의 오우버랩된 서열은 상동성이 99.5%(120bp) 미만이며, 동족 재조합에 의한 조립 후 ORF의 재구성을 허용한다. 이중 선택은 재조합체 분리를 허용하고 조립체의 주요 확인으로서 제공된다.
도 3: 유전자 A, B 및 C의 재조합 및 조립
당해 도는 추가의 유전자 C의 공동-형질전환을 나타내며, 당해 유전자 C는 유전자 A 및/또는 B의 플랭킹 서열과 하이브리드화함으로써 상기 유전자 C의 유전자 A 및 B로의 조립체를 수득하는 서열을 갖는다.
T 5' 및 T 3'는 염색체 부위 상에 상동 통합을 지정하는 효모 게놈(약 400bp) 상의 표적 서열(99.5% 미만의 상동성)에 상응한다. M1 및 M2는 이중 선택을 위한 플랭킹 마커이다. 유전자 A, 유전자 B 및 유전자 C는 제공된 정도의 상동성(99.5% 미만)을 지닌 관련된 동족 버젼이다. 오우버랩핑 서열은 유전자의 5' 부분 및 3' 부분에 상응한다. 유전자 B는 플랭킹 단편을 연결하며 신규의 ORF ABC는 서열 유사성에 의해 재구성된다. MMR 결함성 효모 형질전환체내에서 동족 재조합에 의한 조립 후, 이중 선택은 재조합체들의 분리를 허용한다.
도 4: 동족 유전자 서열을 함유하는 단편에 의한 플라보노이드 경로의 조립
당해 도는 페닐알라닌으로부터 개시하는 플라보노이드 생산을 위한 8개의 유전자를 포함하는 8개 단편의 공동-형질전환을 나타낸다. 각각의 단편은 각각의 모 유전자[동족(homeologous) 또는 상동(homologous) 서열]의 전체 ORF의 영역내에서만 하이브리드화하여 재조합한다. 당해 방식으로, 전체 경로가 DNA 결함성 복구 효모 세포내에서 조립된 후 염색체내로 통합된다.
Tg 5' 및 Tg 3'는 목적한 염색체 부위내로 상동 통합을 개시하는 효모 게놈(약 400bp) 상의 표적 서열(99.5% 미만의 상동성)에 상응한다. URA3HPH (하이그로마이신 내성)은 재조합 경로의 이중 선택을 가능하게 하는 플랭킹 마커이다. 유전자 CHI, F3H, PAL , CHS , C4H , FLS, 및 4 CL은 제공된 정도의 상동성(99.5% 미만)을 지닌 상동 버젼과 관련되어 있다. 각각의 유전자는 효모 세포내에서 이의 발현을 허용하는 하나의 프로모터 및 하나의 터미네이터 서열을 지닌다. 오우버랩핑 서열은 유전자의 전체 ORF에 상응한다. MMR 결함성 효모 형질전환체내에서 동족 재조합에 의한 단편의 조립 후, 기능성 재조합된 완전한 경로가 재구성되며 이중 선택은 재조합체들의 분리를 가능하도록 한다.
각각의 유전자의 식물 공급원은 3개의 문자로 나타낸 유전자의 명칭 다음에 또한 3개 문자로 나타낸다. 상응하는 식물 종은 좌측에 나타낸다. 유전자의 상동 버젼사이의 서열 동일성은 퍼센트로 나타낸다. 일부 단편들 옆의 기호 *는, 이들이 상동 통합에 사용되었음을 나타내며, 오우버랩핑 단편의 유전자 서열이 100% 동일함을 의미한다(야생형 대조군, 클론 H3).
도 5: 신규 재조합 플로보노이드 경로의 구조 및 조립을 위한 각각의 단편을 증폭시키는데 사용된 프라이머
당해 도는 도 4에 기술된 바와 같이 합성 DNA 단편을 사용한 형질전환 후 DNA 복구 결함성 효모 세포내에서 통합된 플라보노이드 경로의 최종의 생체내 재조합된 구조를 나타낸다. 회색 화살표(처음 및 마지막 화살표)는 선택 마커에 상응하며, 흑색 화살표는 플라보노이드 경로를 위한 특이적인 유전자를 나타내고, 백색 사각형은 각각의 유전자에 대한 프로모터 및 터미네이터 서열을 나타낸다(세부사항에 대해서는 도 4 참조). 또한, 당해 도는 도 4에 나타나는 바와 같은 각각의 단편을 증폭시키는데 사용된 프라이머를 나열한다. 프라이머 세부사항 및 기능에 대해서는 표 6을 참조한다.
도 6: 경로의 조립을 입증하고 서열분석을 위한 재조합 유전자를 증폭시키는데 사용된 프라이머
도 5에서와 같이, 당해 도는 효모내에서 통합 후 단편의 조립을 입증하고 서열분석을 위해 재조합 유전자를 증폭시키는데 사용된 프라이머를 나타낸다. 프라이머 세부사항 및 기능에 대해서는 표 7을 참조한다.
도 7: 클론 M1 으로부터 수득된 재조합 경로의 모자이크 서열
7a: 당해 도는 플라보노이드 경로의 발현 카세트를 함유하는 단편의 효모내 조립 및, 통합으로부터 수득된 7개의 재조합 유전자의 모자이크 구조를 나타낸다. 게놈 DNA를 선택된 클론으로부터 추출하고 특이적인 프라이머를 사용하여 재조합 플라보노이드 유전자를 증폭시킨다. 백색 사각형은 모 유전자 A(즉. PA = H3[야생형 대조군] 클론에 또한 존재하는, 글리신 max로부터의 CHI 유전자)로부터 기원한 서열에 상응한다. 흑색 사각형은 모 유전자 B(즉, PB = 크리산테뮴 아종(Chrysanthemum sp.)으로부터의 CHI 유전자)로부터 기원한 서열에 상응한다. M1 클론의 유전자 서열내 하나 이상의 뉴클레오타이드 교환의 존재는 조립의 결과로서 모 유전자들 사이의 교차 현상을 입증한다(세부사항에 대해서는 도 14의 서열 참조). 7b: 사용된 각각의 모 유전자에 대한 유전자 명 및 식물 공급원에 대한 참조.
도 8: 플라보노이드 경로를 함유하는 재조합 클론으로부터 기원한 효모 상층액의 제균 효과
당해 도는 이. 콜라이 배양된 세포 상에서 플라보노이드 유전자를 발현하는 효모 배양 상층액의 억제 효과를 나타낸다. 재조합 플라보노이드 경로를 함유하는 클론의 유도된 상층액 중 1/10 용적을 0.05의 OD600에서 이. 콜라이 TOP10 세포를 접종한 LB의 9/10 용적에 가하였다. 여러 시점에서, OD를 측정하고 수득된 값을 플라보노이드 유전자를 발현하지 않은 상응하는 대조군과 비교하였다. 이. 콜라이 성장에 있어서 강력한 억제 효과는, 클론 H3, M1, M7 및 M8의 상층액을 가한 경우 관찰되었다. 클론 M3 및 M4, 및 또한 음성 대조군 클론 Y26의 경우 또는 효모 배지만을 사용한 경우 현저한 효과가 관찰되지 않았다.
도 9: 효모 배양 상층액내 플라보노이드 존재하에서 DPH 의 ?칭( quenching )
당해 도는, 플라보노이드의 경우에 알려져 있는 바와 같이, 재조합 플라보노이드 경로를 발현하는 클론에 의해 생성된 화합물이 DPH를 ?칭할 수 있음을 나타낸다. 재조합 플라보노이드 경로를 함유하는 클론의 효모 배양물 유도된 상층액을 에틸 아세테이트로 추출하여 동결건조시켰다. 펠렛을 70% 에탄올의 초기 용적의 1/10으로 회수하였다. 각각의 샘플에 대해, 9μl를 1μl의 0.1 mM DPH(DMSO 중)에 가하고 혼합하였다. 이후에, 5μl를 하이본드-C 막(Hybond-C membrane) 상에 로딩(loading)하고 샘플의 ?칭을 UV-트랜스일루미네이터(transiluminator)(삽도 A)에서 관찰하였다. 프로그램 영상-J를 사용하여 점의 신호 강도를 측정하였다. 값을 배지 만(?칭 없음)으로부터 제조된 추출물로 수득한 시그날에 대해 표준화하였다. 나린게닌(1μM)을 최대 ?칭의 대조군으로 사용하였다. H3, M1, M4 및 M7 클론은 보다 높은 값의 ?칭을 나타내었으며, M2, M3 및 Y26(음성 대조군)을 사용하여서는 불량한 효과가 관찰되거나 효과가 관찰되지 않았다.
도 10: 유전자 및 단백질 모자이크 OXA11 / OXA7 의 서열(서열 번호 1 내지 14)
OXA7 오리진(origin)의 뉴클레오타이드 서열은 굵은 활자체이고 밑줄쳐져 있으며, 돌연변이 뉴클레오타이드 서열은 굵은 활자의 이탤릭체이다.
클론을 이중 선택으로 분리하고 DNA를 증폭 및 서열분석을 위해 사용하였다. 두 개의 사슬 중 명확하게 판독가능한 서열만을 사용하였다. 수득되는 크로마토그램은 클러스탈-유형 프로그램(Clustal-like program)으로 정렬하였다.
도 11: 유전자 및 단백질 모자이크 OXA11 / OXA5 의 서열(서열 번호 15 내지 38)
OXA5 오리진의 뉴클레오타이드 서열은 굵은 활자체이고 밑줄쳐져 있으며, 돌연변이 뉴클레오타이드 서열은 굵은 활자의 이탤릭체이다.
클론을 이중 선택으로 분리하고 DNA를 증폭 및 서열분석을 위해 사용하였다. 두개의 사슬 중 명확하게 판독가능한 서열만을 사용하였다. 수득되는 크로마토그램은 클러스탈-유형 프로그램으로 정렬하였다.
도 12: 모 유전자 OXA11[피. 아에루기노사 ( P. aeruginosa ), GI :296549, 서열 번호 39), OXA7(이. 콜라이 , GI :516188, 서열 번호 40) 및 OXA5 (피. 아에루기노사 , GI :48856, 서열 번호 41)의 서열
도 13: 동족 조립체 OXA11 / OXA5 / OXA7 에 상응하는, 복합체 모자이크 유전자를 포함하는 클론의 서열
OXA11/OXA5/OXA7의 각각의 단백질 어닐링의 서열 클론 및 결과: 도 13a) OUL3-05-II (서열 번호 42 및 43), 도 13b) OUL3-05-III (서열 번호 44 및 45), 도 13c) OUL3-05-IV (서열 번호 46 및 47), 도 13d) OUL3-05-IX (서열 번호 48 및 49) 및 도 13e) OUL3-05-X (서열 번호 50 및 51).
OXA 5의 뉴클레오타이드 서열은 굵은 활자체이고 OXA 7에 상응하는 것들은 밑줄쳐져 있다. 굵은 활자체가 아니고, 밑줄쳐져 있지 않은 서열은 OXA 11에 상응한다.
도 14: 실시예 3의 재조합 클론의 서열
서열 클론 및 결과는 서열 번호 52 내지 58로서 제공하였다.
도 15: 대조군 클론 H3 비교하여 보다 많은 양의 p-쿠마르산을 축적할 수 있는 재조합 클론 M1 의 유도된 모자이크 C4H 효소
당해 도는, 부분적인 유도 조건하에서 및 배양물에 신남산을 가함에 의해, 클론 M1(모자이크 플라보노이드 경로)의 상층액이 대조군(모자이크 없음) H3 클론보다 p-쿠마린산을 2배 이상 함유하였음을 나타낸다.
배양물을 글루코즈의 존재하에 성장시켜 외인성 페닐알라닌 및 메티오닌의 부재하에 PAL 활성을 억제시켜 C4H 발현을 유도시켰다. 신나메이트의 공급은 150 μM의 전구체를 배지에 가하여 수행하였다. 배양물의 분취량을 상이한 시점에 취하고 상층액은 세포를 펠렛팅(pelleting)하여 수득하였다. 상층액을 SPE 컬럼 상에서 추출하고, 메탄올 추출물을 C18 HPLC 컬럼을 사용하는 표준 프로토콜에 의해 기술한 바와 같이(4) 아세토니트릴/물 구배로 분리하였다. 상층액 중 p-쿠마르산 및 신남산의 몰 농도를 표준 분자를 사용한 교정 전 피크하 영역을 사용하여 계산하였다. 값을 배양물 중 세포의 수에 대해 표준화하였다. p-쿠마르산의 생산은 연속된 흑색 선으로 나타낸다. H3 대조군 클론은 흑색 정사각형에 상응하며 모자이크 M1 클론은 흑색 다이아몬드에 상응한다. 담회색 선은 공급물 전구체 신나메이트의 고갈을 나타낸다.
도 16: 나린게닌 - 챨콘의 공급 동안 대조군(모자이크 없음) 및 M1 (모자이크)의 상층액 내 중간체 및 최종 플라보노이드 생성물의 상이한 수율
당해 도는, 완전히 유도된 배양물에 150μM의 나린게닌-챨콘(NAR)을 공급하는 경우 H3(흑색 다이아몬드, 삽도 A)보다 M1(흑색 정사각형) 상층액내에 5배 더 많은 양의 p-쿠마르산을 나타낸다. 음성 대조군 값은 회색 삼각형으로 추적된다. 상층액을 SPE 컬럼 위에서 추출하고, 메탄올 추출물을 C18 HPLC 컬럼 및 기술한 바와 같은(4) 아세토니트릴/물 구배를 사용하는 표준 프로토콜로 분리하였다. 12시간째에 신나메이트의 생산 및 소모(삽도 B)는 12시간째에 디하이드로카엠프페롤의 생산(삽도 C)과 관련되어 있으며, 후자는 공급물 분자 나린게닌으로부터 특정하게 기원한다. 최종 플라보노이드 생성물 카엠프페롤은 직후 나타난다(18시간째, 삽도 D). M1 클론은 대조군 H3보다 3배 적은 양의 캄프페롤이 수득되지만, 모자이크 클론은 H3와 비교하여 보다 많은 전구체를 소모한다. 이러한 차이는, 재조합유전성 모자이크화(recombinogenic mosaicism)가 최종 및 중간체 생성물의 개선된 생산을 초래함을 제안하며 재조합 경로가 전구체 및/또는 중간체의 이용시 배양물 및 공급의 동일한 조건하에서 상이하게 거동함을 나타낸다.
발명의 상세한 설명
따라서, 본 발명은 상동 DNA 서열, 즉 유사하지만 동일하지 않은 서열의 생체내 재조합을 위한 신규한 고 효율의 방법을 통해 최초로 가능했던 천연의 소 방향족 분자의 변이체의 효소적 발달에 관한 것이다. 이후, 상동 서열이 재조합되는 경우 때때로 상동 재조합으로 불리는 용어 상동 재조합은 동일하거나 동일하지 않을 수 있는 특정의 상동성을 갖는 서열의 재조합을 말한다. 부위-특이적인 분해 및 연결에 의존하는 통상의 클로닝 시도와는 달리 상동 재조합은 상보 서열을 정렬하며 단편들 사이의 교환이 가능하도록 한다. 또한 하이브리드 유전자로 불리는 재조합 모자이크 유전자는 미스매치된 염기를 갖는 서열의 하이브리드화를 통해 세포내에서 생성된다. 이러한 본 발명의 돌연변이유발 방법에 의해, 목적한 폴리펩타이드의 적합한 선택 및 재설계를 위한 다양성을 시간 효율적인 방식으로 용이하게 생성하는 것이 가능하다.
구체적으로, 본 발명은 생체내 재조합의 기능적 시스템에 의해, 단일 단계 과정으로 다양한 유전자의 효과적인 재조합 및 모자이크 형성, 다양화 및 조립을 사용한다.
용어 "단일 단계 과정"은, 유전자를 사용한 세포의 형질전환, 유전자의 재조합, 모자이크 유전자의 생성 및 유전자의 표적 게놈내로의 통합과 같은, 재조합체를 가공하는 수개의 공정 단계가 하나의 방법 단계로 기술적으로 수행됨을 의미한다. 따라서, 생체내 재조합 전 DNA 담체의 시험관내 재조합, 또는 감수분열을 사용하는 단계를 포함하는 공정 단계의 임의의 반복 주기의 필요성이 없어질 수 있다. 유리하게는, 모자이크 효모 세포의 사용을 피할 수 있다.
본 발명에 따른 단일 단계 과정은 동시에 숙주에 의한 이러한 가공된 재조합체의 발현도 포함할 수 있다. 이에 의해, 발현 생성물을 수득하기 위한 추가의 조작이 필요하지 않을 수 있다.
본 발명에 따른 용어 "유전자 모자이크(gene mosaic)"는 적어도 2개의 상이한 유전자와 적어도 하나의 교차 현상의 조합을 의미한다. 구체적으로, 이러한 교차는 DNA 서열의 조합 또는 혼합을 위해 제공된다. 유전자 모자이크는 유전자(들)의 유전자내 혼합, 유전자내 유전자 모자이크 및/또는, 유전자들의 연결, 예를 들면 적어도 2개의 선형 유전자 또는 이의 일부분의 상부에서 하부까지(head-to-toe) 연결로, 예를 들면 오우버랩핑 단면에서 유전자내 교차를 지닌 유전자 조립체, 및 임의로 오우버랩과 함께 이어진(stringed) 복합체 유전자, 또한 임의로 유전자내 및 유전자간 교차(들) 또는 유전자 모자이크(들) 둘다를 지닌 유전자의 조립체를 수득하는 것으로 이해되는 유전자 조립에 의해 생성될 수 있다.
용어 "교차"는, 2개의 DNA 사슬이 유전 정보, 즉, 적어도 하나의 뉴클레오타이드를 교환할 수 있는 부위에서의 유전자들 사이의 조합을 말한다. 교차 공정은 모 유전자로부터 기원하는 유전자 또는 서열의 상이한 조합을 갖는 자손 모자이크 유전자(offspring mosaic gene)를 생성한다.
대안적으로, 다른 복구 메카니즘이 제공될 수 있으며, 이는 교차, 예를 들면, 사슬의 접합 후 부정확한 뉴클레오타이드의 인식, 절개 및/또는 치환을 포함하는 뉴클레오타이드 절개 복구 또는 비 상동 말단 연결 메카니즘에 기초하지 않는다.
용어 "플랭킹 표적 서열"은 유전자(들) A 및/또는 조합될 다른 유전자(들)의 부위를 포함하는 게놈성 표적 통합 부위, 선형 폴리뉴클레오타이드, 선형 또는 환형 플라스미드 YAC 등과 같이, 목적한 표적에 대해 상보성인 뉴클레오타이드 서열의 영역을 말한다. 특이한 정도의 상보성 또는 상동성으로 인하여, 플랭킹 표적 서열은 표적 통합 부위와 하이브리드화할 수 있고 표적 통합 부위내로 유전자(들)을 통합시킬 수 있다.
용어 세포의 "게놈"은 예를 들면, 유전자 A 및/또는 재조합될 다른 유전자(들), 바이러스, 자가 복제 담체 및 벡터, 플라스미드, 및 인공 염색체 등을 포함하는 수송가능한 성분을 포함하는 선형 폴리뉴클레오타이드와 같은 염색체 또는 비-염색체 유전 성분인 DNA의 유전자 및 비-암호화 서열로 나타낸 유기체의 고유 정보의 실체를 말한다. 인공 염색체는 세포내 도입시 안정한 유지를 위해 필수적인 모든 서열을 함유하는 선형 또는 환형 DNA 분자이며, 이들은 천연 염색체와 유사하게 거동하므로 게놈의 일부로 고려된다.
용어 "상동"은, 2개 이상의 뉴클레오타이드 서열이 상응하는 위치에서 동일하거나 보존된 염기 쌍을 가짐(특정 정도로, 100%까지)을 나타낸다. 본 발명에 따라 사용된 것으로서 상보성, 상응하는 또는 매칭된 서열로 또한 불리는 상동 서열은 바람직하게는 상동 대응 서열과 하이브리드화하며, 예를 들면, 적어도 30% 서열 동일성을 가지지만, 완전한 길이의 천연의 DNA 서열 또는 본원에 기재된 것으로서 DNA 서열의 분절(segment)과 관련하여, 각각의 상보 서열과 99.5% 미만의 서열 동일성, 가능하게는 95% 미만, 90% 미만, 85% 미만 또는 80% 미만의 서열 동일성을 갖는다. 바람직하게는, 상동 서열은 적어도 약 30% 뉴클레오타이드 서열 동일성, 바람직하게는 적어도 약 40% 동일성, 보다 바람직하게는 적어도 약 50% 동일성, 보다 바람직하게는 적어도 약 60% 동일성, 보다 바람직하게는 적어도 약 70% 동일성, 보다 바람직하게는 적어도 약 80% 동일성, 보다 바람직하게는 적어도 약 90% 동일성, 보다 바람직하게는 적어도 약 95% 동일성을 가질 것이다. 위에 인용한 바와 같은 상한치 및 하한치를 갖는 바람직한 범위는 30% 내지 99.5%의 상응하는 서열 동일성의 범위내이다. 본원에 사용된 것으로서, 동일성의 정도는 또한 항상 상보 서열을 말한다.
유전자의 뉴클레오타이드 서열과 관련하여 "동일성 퍼센트(%)"는 서열을 정렬하고 경우에 따라 갭(gap)을 도입하여 최대 퍼센트의 서열 동일성을 달성하며, 서열 동일성의 일부로서 임의의 보존적인 치환을 고려하지 않은 후, DNA 서열내 뉴클레오타이드와 동일한 후보물 DNA 서열내 뉴클레오타이드의 퍼센트로서 정의된다. 뉴클레오타이드 서열 동일성 퍼센트의 측정 목적을 위한 정렬은 예를 들면, 공공의 이용가능한 컴퓨터 소프트웨어를 사용하는 당해 분야의 기술내에 있는 각종 방법으로 달성할 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸친 최대 정렬을 달성하는데 요구되는 임의의 알고리즘도 포함하여, 정렬을 측정하기 위한 적절한 매개변수를 측정할 수 있다.
용어 "고정(anchoring)"은 유전자 또는 유전자 모자이크가 게놈의 통합 부위내로 통합될 수 있도록 하기 위해 부분적인 또는 완전한 서열 상동성을 지닌 "고정 서열"이라 불리는 분절을 통해 이러한 유전자 또는 유전자 모자이크의 통합 서열에 대한 결합을 의미한다. 구체적으로, 고정 서열은 게놈 서열의 통합 부위에 대해 상동이거나 부분적으로 상동인 플랭킹 표적 영역일 수 있다. 바람직한 고정 서열은 표적 통합 부위에 대한 서열 상동성이 바람직하게는 적어도 약 70%, 보다 바람직하게는 적어도 80%, 90%, 95% 내지 99.5% 이하이거나 게놈의 하이브리드화 부분과 완전히 매치한다.
통합 부위는 적합하게는 숙주 게놈상의 정의된 유전자자리일 수 있으며, 여기서, 고 빈도의 재조합 현상이 발생할 수 있다. 바람직한 유전자자리는 예를 들면, 에스. 세레비지아에의 염색체 III 상의 BUD31-HCM1 유전자자리이다. 일반적으로, 재조합을 고 빈도로 나타내지만 세포 생존능의 변화가 없는 효모 염색체 상의 임의의 추가의 유전자자리도 바람직하다.
용어 "발현" 또는 "발현 시스템" 또는 "발현 카세트"는 작동가능한 연결로 바람직한 암호화 서열 및 조절 서열을 함유함으로써 이들 서열에 의해 형질전환되거나 형질감염된 숙주가 암호화된 단백질을 생산할 수 있는 핵산 분자를 말한다. 형질전환을 달성하기 위하여, 발현 시스템은 벡터상에 포함될 수 있으나, 이후 관련된 DNA가 또한 숙주 염색체내로 통합될 수 있다.
용어 "유전자"는 또한 유전자의 DNA 단편, 특히 부분 유전자인 것을 포함한다. 단편은 또한 수개의 개방 판독 프레임(open reading frame)을 동일한 ORF 또는 상이한 ORF의 반복체로서 함유할 수 있다. 당해 용어는 특히 암호화되지 않은 뉴클레오타이드 서열, 예를 들면, 전사되지 않거나 해독되지 않은 서열, 또는 암호화 폴리펩타이드를 전체로 또는 일부분으로 포함한다.
본 발명에 따라 사용된 것으로서 용어 "유전자 A"는 비-암호화 서열 또는 목적한 폴리펩타이드 또는 폴리펩타이드들을 암호화하는 임의 뉴클레오타이드 서열을 의미한다. 유전자 A는, 바람직하게는 적어도 마커 서열을 혼입하며 유전자 A 또는 유전 작제물의 5' 말단 또는 3' 말단에서 단일의 플랭킹 표적 서열을 갖고, 발현 카세트, 선형 폴리뉴클레오타이드, 플라스미드 또는 벡터와 같은 유전 작제물의 골격내에 존재함을 특징으로 한다. 본 발명에 따른 방법에서, 유전자 A는 전형적으로 유전자 모자이크 형성을 위해 재조합될 일련의 유전자들내 제1 유전자이다. 유전자 A는 경우에 따라, 궁극적으로 유전자 A의 변이체, 또는 유전자 B, C, D, E, F, G, H 등 중의 임의의 것인, 재조합될 다른 유전자에 대해 상동이다. 이로써 유전자 A당 단지 하나의 플랭킹 표적 서열이 최대 정확도 목적을 위해 제공된다. 유전자 A의 변이체는 유전자 A1, A2, A3 등으로 불리며, 이는 서열 상동성을 특정 정도로 가지며, 임의로 유사한 기능적 특징을 갖는다. 용어 "적어도 하나의 유전자 A"는 적어도 하나의 유전자 A 및 임의로 유전자 A의 변이체를 의미할 것이다.
본 발명에 따라 사용된 것으로서 용어 "유전자 B"는 경우에 따라, 궁극적으로 유전자 A, 유전자 B의 변이체, 또는 유전자 C, D, E, F, G, H 등 중 임의의 것이고, 재조합될 다른 유전자와 유전자 모자이크 형성을 위해 선택되는, 비-암호화 서열 또는 목적한 폴리펩타이드 또는 폴리펩타이드들을 암호화하는 임의 뉴클레오타이드 서열을 의미한다. 유전자 B는 유전자 A 또는 다른 유전자에 대해 특정한 정도로 상동이어서 유전자 A 또는 재조합될 다른 유전자와 모자이크 형성이 가능하다. 본 발명에 따른 방법에서 유전자 B는 전형적으로 유전자 모자이크 형성을 위해 재조합될 일련의 유전자들에서 최종 유전자이다. 유전자 B는 세포 게놈의 필수적인 부분일 수 있거나, 발현 카세트, 선형 폴리뉴클레오타이드, 플라스미드 또는 벡터와 같은 유전 작제물의 골격내에 존재할 수 있고, 바람직하게는 적어도 마커 서열을 통합하고, 유전자의 반대쪽 말단에서를 의미하는, 유전자 A의 플랭킹 표적 서열의 대응물(counterpart)로서, 유전자 B 또는 유전 작제물의 5' 말단 또는 3' 말단에서 단일의 플랭킹 표적 서열을 갖는다. 유전자 A의 플랭킹 표적 서열이 유전자 A의 5' 말단에 존재하는 경우, 유전자 B는 전형적으로 3' 말단에서 이의 플랭킹 표적 서열을 가질 수 있고 이의 역도 가능하다. 이로써, 유전자 B당 단지 하나의 플랭킹 표적 서열이 최대의 정확도 목적을 위해 전형적으로 제공된다. 유전자 B는 유전자 A의 변이체일 수 있다. 유전자 B의 변이체는 유전자 B1, B2, B3 등으로 불리며, 이는 특정 정도의 서열 상동성을 가지며, 임의로 유사한 기능적 특징을 갖는다. 용어 "적어도 하나의 유전자 B"는 적어도 유전자 B 및 임의로 유전자 B의 변이체를 의미할 것이다.
본 발명에 따라 사용된 것으로서 용어 "유전자 C"는 비-암호화 서열 또는 목적한 폴리펩타이드를 암호화하는 임의 뉴클레오타이드 서열을 의미할 것이다. 유전자 C는 마커 서열을 임의로 통합하고, 유전자 A 및/또는 유전자 B, 유전자 C의 변이체, 또는 경우에 따라, 궁극적으로 다른 유전자 D, E, F, G, H 등의 서열에 대해 상동인 이의 뉴클레오타이드 서열의 분절에 의해 특징화되고, 발현 카세트, 선형 폴리뉴클레오타이드, 플라스미드 또는 벡터와 같은 유전 작제물의 골격내에 존재함을 추가의 특징으로 한다. 유전자 C는 바람직하게는 유전자 C의 5' 말단 또는 3' 말단 중 어느 하나에서 단일의 플랭킹 표적 서열, 또는 양쪽 측면에서 플랭킹 표적 서열을 가진다. 이로써, 유전자 C는 유전자 A 및/또는 다른 유전자와 부분적으로 또는 완전히 하이브리드화하여 유전자를 재조합하고, 연결하며 조립할 수 있다. 본 발명에 따른 방법에서, 유전자 C는 전형적으로 유전자 모자이크 형성을 위해 재조합될 일련의 유전자내에서 유전자 A를 뒤따르는 제2 유전자이다. 유전자 C의 변이체는 C1, C2, C3 등으로 불리며, 이는 특정 정도로 서열 상동성을 가지며 임의로 유사한 기능적 특징을 갖는다.
추가의 유전자 D는 유전자 C, 유전자 D의 변이체 또는 궁극적으로 경우에 따라 다른 유전자 A, B, E, F, G, H 등의 서열에 대해 상동이어서 각각의 재조합 및 연결을 제공하는 이의 뉴클레오타이드 서열 또는 이의 뉴클레오타이드 서열의 분절의 하이브리드화를 통해 추가로 재조합되고 조립될 수 있다. 유전자 D는 바람직하게는 유전자 D의 5' 말단 또는 3' 말단 중 어느 하나에서, 단일의 플랭킹 표적 서열을 가지거나, 양쪽 측면에서 플랭킹 표적 서열을 갖는다. 본 발명에 따른 방법에서, 유전자 D는 전형적으로 유전자 모자이크 형성을 위해 재조합될 일련의 유전자내에서 유전자 C를 뒤따르는 다음 유전자이다. 유전자 D의 변이체는 D1, D2, D3 등으로 불리며, 이는 특정 정도의 서열 상동성을 가지며 임의로 유사한 기능적 특징을 갖는다.
추가의 유전자 E는 유전자 D, 유전자 E의 변이체 또는 궁극적으로 경우에 따라 다른 유전자 A, B, C, F, G, H 등의 서열에 대해 상동이어서 각각의 재조합 및 연결을 제공하는 이의 뉴클레오타이드 서열의 분절을 통해 추가로 재조합되고 조립될 수 있다. 유전자 E는 바람직하게는 유전자 E의 5' 말단 또는 3' 말단 중 어느 하나에서 단일의 플랭킹 표적 서열을 가지거나, 양쪽 측면에서 플랭킹 표적 서열을 갖는다. 본 발명에 따른 방법에서, 유전자 E는 전형적으로 유전자 모자이크 형성을 위해 재조합될 일련의 유전자내에서 유전자 D를 뒤따르는 다음 유전자이다. 유전자 E의 변이체는 E1, E2, E3 등으로 불리며, 이는 특정 정도의 서열 상동성을 가지며 임의로 유사한 기능적 특징을 갖는다.
추가의 유전자 F, G, H 등도 상응하게 사용될 수 있다. 일련의 추가의 유전자는 알파벳 문자의 수로 제한되지 않음이 이해되어야 한다. 목적 유전자의 최종 사슬은 유전자 A 및 B에 대한 연결을 통해 게놈의 통합 부위에서 유전자 조립체를 수득하도록 수득될 수 있다. 이렇게 조립된 목적 유전자는 작동적으로 연결되어 목적한 상응하는 폴리펩타이드 및 대사물질 각각의 발현을 뒷받침한다. 조립의 구체적인 방법은 심지어 거대한 수의 DNA 단편을 조립하기 위한 생체내 재조합에 의한 카세트의 조합을 사용함으로써 실질적인 크기의 목적한 DNA 분자를 수득한다. 오우버랩핑 서열을 나타내는 카세트는 전체의 목적한 서열을 포함하도록 적합하게 설계된다. 하나의 실시양태에서, 바람직한 오우버랩은 적어도 약 5 bp, 바람직하게는 적어도 약 10 bp이다. 다른 실시양태에서, 오우버랩은 적어도 15, 바람직하게는 적어도 20 이상 내지 1.000 bp 이하일 수 있다.
하나의 바람직한 실시양태에서, 카세트들 중 일부는 확인하도록 하는 마커 서열을 함유하도록 설계된다. 전형적으로 마커 서열은 트랜스포손 삽입체(transposon 삽입)를 용인하는 부위에 위치함으로써 최종의 바람직한 핵산 서열에 대한 생물학적 효과를 최소화한다.
구체적인 실시양태에서, 숙주 세포는, 상기 유전자 또는 단편의 혼합물과 함께 공동-형질전환시키고, 재조합되거나 조립된 서열이 형질감염되는 상기 숙주를 배양함으로써 심지어 다수의 유전자 또는 핵산의 DNA 단편과 오우버랩핑 서열, 예를 들면, 적어도 2개, 바람직하게는 적어도 3, 4, 5, 6, 7, 8, 9개, 보다 바람직하게는 적어도 10개의 유전자 또는 핵산 단편을 숙주 세포내에서 재조합하거나 조립할 수 있다.
본 발명에 따라 사용될 유전자 또는 DNA 단편은, 전체 유전자 또는 일부로서, 이중 사슬(double-stranded) 또는 단일 사슬일 수 있다. 이중 사슬 핵산 서열에는 일반적으로 300 내지 20,000개의 염기쌍이 존재하며 단일 사슬 단편은 일반적으로 더 짧고 40 내지 10,000개 뉴클레오타이드의 범위일 수 있다. 예를 들어, 2 Mb 내지 500 Mb 이하 범위 내 조립체는 효모내에서 조립될 수 있다.
다수의 유기체로부터의 게놈 서열은 공공으로 이용가능하며 본 발명에 따른 방법과 함께 사용될 수 있다. 이러한 게놈 서열은 바람직하게는 숙주 세포의 상이한 균주 또는 상이한 종으로부터 수득된 정보를 포함함으로써 특정 다양성을 갖는 상동 서열을 제공한다.
재조합을 위한 기질로서 사용된 초기 유전자는 일반적으로 유전자의 변이체 형태를 포함하는 폴리뉴클레오타이드의 수집체(collection)이다. 변이체 형태는 기질들 사이에 상동 재조합을 허용하기에 충분한, 서로에 대해 실질적인 서열 동일성을 나타낸다. 폴리뉴클레오타이드들 사이의 다양성은 천연적인, 예를 들면, 대립형질 또는 종 변이체이거나, 유도될 수 있는데, 예를 들면, 오류-유발(error-prone) PCR 또는 오류-유발 반복 서열 재조합, 또는 시험관내 재조합의 결과일 수 있다. 다양성은 또한 대안의 코돈 용도를 갖는 천연 단백질을 암호화하는 재합성 유전자로부터 수득될 수 있다. 재조합이 출발 물질에서 존재하는 것보다 더 다양한 생성물을 생성할 수 있는, 기질들 사이에 적어도 충분한 다양성이 존재하여야 한다. 적어도 하나 이상의 위치에서 상이한 적어도 2개의 기질이 존재하여야 한다. 다양성의 정도는 관여할 기능적 변화의 정도 및 재조합되는 기질의 길이에 의존한다. 위치의 69% 이하의 다양성이 전형적이다.
본 발명의 방법에 따라서 유전자 A, B, C 및 추가의 유전자가 완전한 길이의 유전자를 포함할 수 있는, 오우버랩에서 적어도 하나의 교차 및 임의로 유전자 조립체를 수득하기 위한 것과 같이, 하이브리드화를 위해 설계된 적어도 특수한 분절에서, 예를 들면, 오우버랩핑 단면에서 적어도 30%의 상동성을 공유하는 것이 바람직하다. 바람직한 상동성 퍼센트는 적어도 40%, 보다 바람직하게는 적어도 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 90%, 심지어 보다 바람직하게는 적어도 95% 내지 99.5% 미만이다.
예를 들면, 이러한 유전자를 유전자 변이체와 함께 단순히 조립, 예를 들면 함께 엮고(string) 임의로 혼합하여 보다 큰 유전자, 예를 들면 개개의 물질대사 경로의 구성원들을 다양화하거나 당해 방법에 따른 물질대사 경로의 다양성을 조립하는 것이 또한 바람직할 수 있다. 천연에서 존재하지 않는 물질대사 경로가 당해 방식으로 작제될 수 있다. 따라서, 이러한 하부(down-stream) 효소를 결여하고 있는 상이한 유기체에 의해 생산된 바람직한 기질에서 작동하는 하나의 유기체내에 존재하는 효소는 유전자 또는 부분적인 유전자의 조립체를 작제하여 재조합된 효소를 수득함으로써 동일한 유기체내에서 암호화될 수 있다. 따라서, 다중 효소를 포함시켜 복합한 물질대사 경로를 작제할 수 있다. 이는, 폴리펩타이드 또는 부분 폴리펩타이드의 집단이 경로내 이들의 생화학적 기능에 따라 정렬될 수 있는 경우 유리하다. 목적한 예시적인 유전자 경로는 플라보놀, 매크롤라이드, 폴리케타이드 등과 같은, 산업 목적의 제2 대사산물의 합성을 위한 효소를 암호화한다.
또한, 조합적 라이브러리는 단편을 혼합하여 제조할 수 있는데, 여기서 단편들 중 하나 이상은 동일한 하이브리드화 서열과 함께, 그러나 효소 또는 다른 단백질을 암호화하는 상이한 개재 서열(intervening sequence)과 함께 공급된다.
유전 경로는 조합 방식으로 작제됨으로써 조합적 라이브러리내 각각의 구성원이 유전자 변이체의 상이한 조합을 갖도록 할 수 있다. 예를 들어, 변이체의 조합적 라이브러리를 개개의 DNA 성분으로부터 작제할 수 있으며, 여기서 상이한 단편이 재조합되고 조립되며, 여기서 상이한 단편 각각은 수개의 변이체를 갖는다. 물질대사 경로의 재조합 및 조립체는 성공적인 가공을 입증하기 위한 마커 서열의 존재를 필요로 하지 않을 수 있다. 바람직한 방식의 대사산물의 발현은 작업 실시예에 대해 이미 나타내었다. 물질대사 경로의 성공적인 재조합 및 조립체는 예를 들면, 세포 배양 배지 속에서 제2 대사물질의 검출에 의해 측정될 수 있다.
원핵 및 진핵 숙주 세포는 이. 콜라이 또는 바실러스 아종(Bacillus sp), 효에스. 세레비지아에(S. cerevisiae)와 같은 효모 숙주 세포, 스포도프테라 프루기페르다(Spodooptera frugiperda)와 같은 곤충 숙주 세포, 또는 헬라(HeLa) 및 저켓(Jurkat)과 같은 사람 숙주 세포를 포함하여, 기재된 방법과 함께 사용하기 위해 둘다 고려된다.
바람직한 숙주 세포는 칸디다 종(Candida sp), 피키아 종(Pichia sp) 및 사카로마이세스 종(Saccharomyces sp)으로부터와 같은 반수체 세포이다.
본 발명의 방법은 성 주기 또는 감수분열 재조합을 사용하지 않을 수 있다. DNA 단편은 반수체 세포내로 형질전환될 수 있다. 형질전환체는 선택 플레이트 상에 즉시 스트리킹(streaking)될 수 있다. 이후, 재조합체는 PCR 또는, 갭 복구(gap repair)와 같은 다른 수단에 의해 분리될 수 있다.
본 발명의 공정은 임의의 야생형 또는, DNA 또는 RNA 복구와 같은, 핵산 복구에 있어서 결함이 있는 것을 포함하는 복구 결함성 원핵 또는 진핵 세포내에서 수행할 수 있다. 야생형 세포에서, 적합한 통합 부위가 선택되며, 이는 상동 재조합을 허용한다. 야생형 세포에서 수행된 것으로서 본 발명에 따른 방법은 바람직하게는 적어도 80%, 바람직하게는 적어도 90% 서열 동일성을 갖는 유전자 A 및 B와 같은 유전자의 재조합을 위해 제공된다. 손상되고 미스매치된 DNA가 일반적으로 불구되고 재조합이 억제되지만, 통합 부위에서 상동 재조합은 또한 이러한 야생형 세포에서도 가능함이 놀랍게도 밝혀졌다.
미스매치 복구(mismatch repair: MMR) 시스템의 돌연변이 또는 변형은 세포내에서 재조합의 빈도를 향상시킬 수 있다. 대안적으로, 재조합을 향상시킬 수 있는 DNA 복구 유전자 rad1, recQ의 완전하거나 일시적인 녹-아웃(knock-out)과 같은 다른 복구 결함 시스템을 사용할 수 있다.
DNA 복구 결함성 세포는 본 발명의 방법에서 바람직하게 사용된다. 예로서, 미스매치 복구는 완전하게 또는 일시적으로 녹아웃시킬 수 있거나, 세포가 표적화된 재조합이 수행되는 동안 또는 후에 배양되는 세포 배양 배지에 특이적인 기질을 첨가함으로써 조건화시키거나 유도할 수 있다. 구체적으로, 세포의 MMR 결함은 미스매치 복구에 포함된 유전자의 돌연변이, UV 광을 사용한 처리, 2-아미노퓨린과 같은 화학물질을 사용한 처리, 예를 들면, 일시적인 불활성화 및 활성화를 허용할 수 있는 조절가능한 프로모터를 통한 미스매치 복구에 포함된 유전자의 유도성 발현 또는 억압을 포함하여 미스매치 복구를 일시적으로 또는 영구적으로 손상시키는 임의 전략에 의해서도 달성될 수 있다.
세균 미스매치 복구 시스템은 집중적으로 연구되어 왔다. 효모와 같은 다른 시스템에서, 이의 생성물이 세균 미스매치 복구 단백질, 예를 들면, MutS 단백질의 유사체, 즉, Msh1, Msh2p, Msh3p, Msh4, Msh5, Msh6p, 및 MutL 단백질의 유사체, 즉, 에스. 세레비지아에내 Mlh1p, Mlh2p, Mlh3p, 및 Pms1과 상동성을 공유하는 수개의 유전자들이 확인되어 왔다.
바람직한 미스매치 복구 결함 세포의 예는 결함이 있거나 (일시적으로) 불활성화된 MSH2를 갖는 에스. 세레비지아에, 예를 들면, MXY47(파괴된 MSH2를 갖는 W303) 균주와 같은 가공된 W303, BY, SK1 균주이다.
MMR의 추가의 바람직한 시스템은 예를 들면, 미스매치의 인식에 관여하는, 단백질 MutS 및 MutL에 대해 결함이 있는, MutS 또는 MutL 유형의 효소적 MutHLS 미스매치 복구 시스템에 대해 결함이 있는 균주와 같이,제US5912119호에 기술된 것과 같은 잘 공지된 세균 균주의 선택이다. 바람직한 균주는 예를 들면, F- mutL을 사용하는 에스. 타이피무리움(S. Typhimurium) 또는 재조합 이. 콜라이 Hfr/S. 타이피무리움 F- mutL의 균주이다.
또한, 헬라 및 저켓 세포와 같은 다른 진핵 미스매치 복구 결합성 세포가 본 발명에 따라 바람직하게 사용된다.
본 발명에 따른 방법은 주로 성공적인 재조합 생성물의 마커 보조된 선택을 사용한다. 분자 마커 또는 DNA 핑거프린팅(fingerprinting)과 같은 도구의 사용은 목적 유전자를 맵핑(mapping)할 수 있다. 이는 세포의 거대한 레퍼토리를 스크리닝하여 목적한 특성을 소유하는 세포의 선택을 수득하도록 한다. 스크리닝은 특정 유전자의 존재 또는 부재를 기초로 한다.
본 발명에 따라 사용된 것으로서 용어 "선택 마커"는 성공적인 통합 시 마커를 제공하는 단백질-암호화 또는 비-암호화 DNA 서열을 말한다. 구체적으로, 단백질-암호화 마커 서열은 영양물질 마커, 색소 마커, 항생제 내성 마커, 항생제 민감성 마커, 형광성 마커, 녹-인(knock-in) 마커, 활성화제/결합 도메인 마커 및 우성 열성 마커, 비색계 마커, 및 2개 이상의 소단위가 동일한 세포내에서 발현되는 경우에만 기능하는 효소의 상이한 소단위를 암호화하는 서열의 그룹 중에서 선택된다. 당해 용어는 또한 별도의 마커 서열을 사용할 필요없이, 유전자 모자이크의 직접적인 측정을 제공하는 재조합될 추적가능한 유전자를 말한다.
"영양물질 마커"는 세포의 영양요구성을 보충함으로써 영양요구성 세포에서 기본 영양을 부여할 수 있는 유전자 생성물을 암호화하는 마커 서열이다. 본 발명에 따라서 용어 "영양요구성"은, 세포가 영양요구성 세포 자체에 의해 생산될 수 없는 필수 영양분을 함유하는 배지 속에서 성장하여야 함을 의미한다. 영양 마커 유전자의 유전자 생성물은 영양요구성 세포내에서 결여한 당해 필수 영양분의 합성을 촉진한다. 영양분 마커 유전자를 성공적으로 발현시킴으로써, 세포가 성장하는 배양 배지에 당해 필수 영양분을 첨가할 필요가 없다.
바람직한 마커 서열은 URA3, LEU2, CAN1, CYH2, TRP1, ADE1 및 MET5이다.
"색소 마커"를 암호화하는 유전자는 발현시 세포를 염색할 수 있는 색소의 합성에 관여되는 유전자 생성물을 암호화한다. 이로써 색소 마커를 성공적으로 발현하는 세포의 신속한 표현형적 검출이 제공된다.
"항생제 내성 마커"는, 생성물을 발현하지 않는 세포가 성장할 수 없는 농도에서 항생제의 존재하에 세포가 성장하도록 하는, 유전자 생성물을 암호화하는 유전자이다.
"항생제 민감성 마커"는 마커 유전자이며, 여기서 유전자 생성물은 항생제의 존재하에서 상기 마커를 발현하는 세포의 성장을 억제한다.
"녹-인" 마커는 녹-아웃(know-out) 세포에 대한 결실 연결을 나타내므로, 성공적인 재조합 및 작동시 세포가 성장하도록 하는 뉴클레오타이드 서열로서 이해된다. 녹-아웃 세포는 유전적으로 가공된 세포이며, 여기서 하나 이상의 유전자는 표적화된 돌연변이를 통해 작동되지 않는다(turn-off). 이러한 결실(missing) 유전자는 녹-인 마커로서 적합하게 사용될 수 있다.
"형광성 마커"는 각각의 형광 시그날을 방사함으로써 검출가능한 형광단을 암호화하는 뉴클레오타이드 서열을 의미한다. 세포는 차등적인 형광성 표지(labeling)를 기초로 하는 유동 세포분석의 잘-공지된 기술에 의해 용이하게 분류할 수 있다.
다양화 또는 재조합에 사용된 바와 같은 유전자는 성공적인 재조합 현상을 위한 충분한 서열 길이를 갖는 서열 또는 이의 일부분 또는 단편을 암호화하는 폴리펩타이드 또는 단백질을 암호화하는 서열 또는 비-암호화 서열일 수 있다. 보다 구체적으로, 상기 유전자는 3 bp, 바람직하게는 적어도 100 bp, 보다 바람직하게는 적어도 300 bp의 최소 길이를 갖는다.
본 발명에 따라 수득된 바람직한 유전자 모자이크는 적어도 3개, 바람직하게는 20,000개 이하의 염기쌍일 수 있으며, 바람직한 범위는 300 내지 10.000 bp일 수 있고; 적어도 500 bp 또는 적어도 1.000 bp의 거대한 DNA 서열이 특히 바람직하다.
단일 뉴클레오타이드의 교차 또는 적어도 1, 바람직하게는 적어도 2, 3, 4, 5, 10, 20 이하의 보다 큰 뉴클레오타이드 서열의 분절들의 교차를 포함하는, 700개 염기쌍 당 적어도 3개의 교차 현상, 바람직하게는 700개 염기쌍 당 적어도 4개의 교차, 보다 바람직하게는 700개 염기쌍 또는 500개의 염기쌍 당 적어도 5, 6 또는 7개의 교차로 특징지워지는 유전자 모자이크가 특히 바람직하다.
본 발명에 따라서, 홀수 뿐 아니라 짝수의 재조합 현상이 하나의 단일 재조합된 유전자내에서 수득될 수 있다. 이는 감수분열 생체내 재조합보다 특수한 이점이다.
재조합 모자이크화의 복합한 패턴은 하나의 단일 분자내에서 높은 수의 상이한 길이의 재조합된 서열 블록에 이르는, 본 방법에 의해 수득될 수 있다. 또한, 주형 사슬들 중 하나에 상응하는 뉴클레오타이드의 점-유사 교체(point-like replacement)는 개방 판독 프레임의 골격과 관련한 다양성의 중요한 공급원으로서 수득될 수 있다. 모자이크화 및 점-유사 교환은 단백질 수준에서 필수적으로 보존적이지 않다. 실제로, 상이한 극성 특성을 지닌 신규 아미노산이 재조합 후 생성되어 당해 방법에 의해 유도된 재조합 단백질에 대해 신규의 잠재적 및 효소적 단백질 특성을 제공한다.
바람직하게는, 상기 유전자는 비-암호화 서열 또는 단백질 암호화 서열 또는 치료학적 또는 산업적 적용의 효소 또는 단백질을 암호화하는 이의 단편의 일부이다. 다음 용어 "폴리펩타이드"는 바람직하게는 적어도 2개의 아미노산, 바람직하게는 적어도 3개의 폴리펩타이드 및 단백질을 갖는 목적 펩타이드를 포함할 것이다. 목적한 폴리펩타이드는 바람직하게는 효소, 전사 인자, 수송 단백질, 시그날 펩타이드, 수용체, 호르몬 및 성장 인자 중에서 선택되나 이에 한정되지 않는다. 유전자 모자이크로부터 생성되는 각각의 재조합 변이체는 신규한 대사물질의 합성을 개시하고 촉매할 수 있다. 따라서, 효소적 합성 공정을 뒷받침하는 물질대사적 발달에 의해 천연의 소 방향족 분자의 변이체 다수를 효과적으로 생산하는 것이 최초로 가능하다.
구체적으로, 식물 또는 효모에 의해 효소 활성에 의해 생산된 것과 같은 페닐알라닌, 타이로신 또는 트립토판과 같은 방향족 아미노산, 또는 임의 중간체 또는 유도체의 대사물질이 신규 방법으로 생산될 수 있다. 따라서 효소 변이체의 레퍼토리는 다양한 대사물질 형성을 이끌며, 이후, 이는 바람직한 구조 및 기능에 대해 스크리닝된다. 천연의 소 방향족 분자의 변이체는 기능적 또는 생물학적 활성을 소유하는 이들의 증가된 가능성에 대해 순수 합성 유기 물질보다 장점을 갖는다.
Phe 및 Tyr은 밀접하게 관련되어 있다. 이들은 타이로신에서 추가로 하이드록실화되는 벤젠 고리를 함유한다. 타이로신은 필수 아미노산 페닐알라닌으로부터 직접 합성된다. 트립토판은 접합된 인돌 고리를 함유한다. 이러한 물질대사 관계는 복잡한 영양 의존성을 유발한다. 식물에서, 쉬키메이트 경로(shikimate pathway)는 페닐프로파노이드의 생합성을 위한 화합물 페닐알라닌을 생산한다. 라덕타제, 옥시게나제, 및 트랜스퍼라제의 조합으로 생산된 하이드록시신나메이트 및 에스테르는 기관내에서 대사물질의 특수 양식을 규정하고 이들의 의존성에 따라 이러한 프로파일은 각각의 식물 종에서 특징적이다. PP 경로의 초기 3개 단계는 PAL, C4H 및 4CL 효소에 의해 촉매되어 모든 후속된 측쇄 및 수득되는 대사산물, 예를 들면, 플라보노이드, 리그닌, 페닐프로파노이드 에스테르, 아우론, 이소플라본, 스틸벤, 프로난토시아닌 등에 대한 기초를 제공한다.
예를 들어, PAL은 Phe의 탈아민화를 촉매하여 신남산을 제공하며, 이는 페닐프로파노이드 경로에서 제1 단계이고 1차 및 2차 물질대사 사이의 조절 지점임이 공지되어 있다. 페닐프로파노이드 화합물은 리그닌, 플로보노이드, 이소플라보노이드, 쿠마린 및 스틸벤을 포함하는, 천연에서 많은 기능을 가진 광범위한 페놀성 화합물에 대한 전구체이다.
물질대사 경로의 생성물은 전형적으로 천연의 소 분자 또는 개선되거나 신규 기능을 가진, 글리코실화, 아실화, 아민화, 하이드록실화 또는 메틸화에 있어서 상이한 이의 변이체이다. 이러한 대사물질은 향수 또는 향미료로서 또는 치료학적 분자(예를 들면, 항-감염성 또는 암 치료용)로서 적합하다.
본원에 사용된 것으로서 용어 "소 방향족 분자"는, 상이한 유형 및 다수의 방향족 고리를 갖는 복합체 구조 및 각종 치환체 그룹을 포함하는, 방향족 구조를 갖는 광범위한 소 유기 분자를 말하며, 여기서 하나 이상의 CH 그룹은 N, O 및 S와 같은 헤테로원자에 의해 교체될 수 있다.
대사물질로서 수득가능한 천연의 소 방향족 분자의 바람직한 예는 바닐린, 쿠마르산, 페룰산, 리그닌, 3-페닐프로파노이드, 플라보노이드, 안토시아닌이다.
신규의 기능적 특성을 갖는 바람직한 예는 예를 들면, 에틸바닐린(향), 옥틸메톡시신나메이트 및 이의 에스테르(자외선차단제), 항균 효과가 증가된 챨콘 유도체이다.
이러한 대사물질 생산의 중간체는 때때로 향미료 또는 향수 제제로서 또는 식품 성분으로서 유용하다.
유전자 모자이크를 포함하는 선택된 클론에 의해 대사물질 또는 이러한 대사물질의 중간체로서 합성되면, 이들은 전형적으로 적합한 발현 시스템, 예를 들면, 미생물 생산, 또는 시험관내 합성 공정에 의해 대규모로 생산된다.
본 발명의 바람직한 실시양태에서, 모자이크 유전자의 조합, 숙주 게놈과의 이의 재조합, 및 추가로 목적한 재조합 폴리펩타이드 또는 상기 숙주 세포의 대사물질을 생산하기 위한 모자이크 유전자의 발현이 단일 단계 과정으로 수행된다.
본 발명에 따라서, 당해 분야의 기술내에 있는 통상의 분자 생물학, 미생물학 및 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌 (9)에 완전하게 설명되어 있다.
생체내 재조합의 경우, 게놈 또는 다른 유전자와 재조합될 유전자를 사용하여 표준 형질감염 기술을 사용하여 숙주를 형질감염시킨다. 적합한 실시양태에서, 복제 오리진(origin of replication)을 제공하는 DNA가 작제물에 포함된다. 복제 오리진은, 숙련가가 적합하게 선택할 수 있다. 유전자의 특성에 따라서, 보충적인 복제 오리진은, 서열이 복제 오리진 자체로서 작동할 수 있는 게놈 또는 유전자와 함께 이미 존재하는 경우 필요하지 않을 수 있다.
합성 핵산 서열 또는 카세트 및 소세트는 선형 폴리뉴클레오타이드, 플라스미드, 메가플라스미드, 합성 또는 인공 염색체, 예를 들면, 식물, 세균, 포유동물 또는 효모 인공 염색체의 형태로 생산될 수 있다.
세포는, 이러한 DNA가 세포내로 도입되는 경우 외인성 또는 이종 DNA에 의해 형질전환될 수 있다. 형질전환 DNA는 통합되거나 통합되지 않을 수 있는데, 즉, 세포의 게놈내로 공유결합적으로 연결될 수 있다. 예를 들면, 원핵세포, 효모 및 포유동물 세포에서, 형질전환 DNA는 플라스미드와 같은 에피소옴 성분 위에 유지될 수 있다. 진핵 세포와 관련하여, 안정하게 형질전환된 세포는, 형질전환 DNA가 염색체내로 통합됨으로써 이것이 딸 세포(daughter cell)에 의해 염색체 복제를 통해 유전된다. 이러한 안전성은 형질전환 DNA를 함유하는 딸 세포의 집단으로 구성된 클론 또는 세포주를 확립하는 진핵 세포의 능력에 의해 입증된다.
다양한 유전자 물질이 플라스미드내로 통합될 수 있다. 플라스미드는 흔히 표준 클로닝 벡터, 예를 들면, 세균 다중카피(multicopy) 플라스미드이다. 기질은 동일하거나 상이한 플라스미드내로 통합될 수 있다. 흔히, 상이한 유형의 선택가능한 마커를 갖는 적어도 2개의 상이한 유형의 플라스미드를 사용하여 적어도 2개의 유형의 벡터를 함유하는 세포를 선택하도록 한다.
다양한 유전자 기질을 함유하는 플라스미드는 임의 방법[예를 들면, 화학적 형질전환, 천연의 적격성(natural competence), 전기천공(electroporation), 바이오리스틱(biolistic), 파아지 또는 바이러스 시스템내로의 패키징(packaging)]에 의해 세포내로 초기에 도입된다. 흔히, 상기 플라스미드는 포화 농도(최대 형질감염능과 관련하여)에서 또는 당해 농도 근처에서 존재하여 동일한 세포로 도입되는 하나 이상의 플라스미드의 확률을 증가시킨다. 각종 기질을 함유하는 플라스미드는 동시에 또는 다중 라운드(multiple round)로 형질감염시킬 수 있다. 예를 들어, 다중 라운드 시도에서 세포는 플라스미드의 제1 분취량으로 형질감염된 후, 형질감염체를 선택하고 증식시킨 후, 플라스미드의 제2 분취량으로 형질감염시킨다. 바람직한 플라스미드는 예를 들면, pUC 및 pMXY9, pMXY12 및 pMIX-LAM과 같은 pBluscribe 유도체 또는 YCp50과 같은 YAC 유도체이다.
발달 속도는 모든 유전자 기질이 재조합에 관여하도록 함으로써 증가시킬 수 있다. 이는 형질감염된 세포를 전기천공에 적용시킴으로써 달성할 수 있다. 전기천공을 위한 조건은 외인성 DNA를 세포내로 도입시키기 위해 통상적으로 사용된 것과 동일하다. 발달 속도는 또한 세포를 융합시켜 플라스미드 또는 염색체의 교환을 유도함으로써 증가시킬 수 있다. 융합은 PEG와 같은 화학제, 또는 인플루엔자 바이러스 헤마글루티닌, HSV-1 gB 및 gD와 같은 바이러스성 단백질에 의해 유도될 수 있다. 발달 속도는 또한 돌연변이인자 숙주 세포[예를 들면, 세균내에서 Mut L, S, D, T, H, 효모내에서 유사한 돌연변이체 및, 사람 세포주에서 아탁시아 켈란기엑타시아(Ataxia telangiectasia)]의 사용으로 증가시킬 수 있다.
재조합된 유전자를 지닌 세포는 바람직한 기능을 위해 스크리닝 또는 선택 처리한다. 예를 들면, 발달되는 기질이 약물 내성 유전자를 함유하는 경우, 약물 내성에 대해 선택할 수 있다.
전형적으로, 재조합의 본 발명의 방법에서, 바람직한 표현형을 획득하는 재조합의 최종 생성물은 위치의 0.1% 내지 50%에서 출발하는 기질과는 상이하며 천연적으로 획득된 돌연변이의 속도의 과도한 크기의 속도 차수(예를 들면, 적어도 10배, 100배, 1,000배, 또는 10,000배까지)에서 발달된다. 최종의 유전자 모자이크 생성물은 생산 목적을 위해 셔플링된(shuffled) DNA의 활용을 위해 보다 바람직한 다른 숙주로 형질감염될 수 있다.
본 발명에 따른 바람직한 방법에서, 숙주 세포는 익히 공지된 세포 디스플레이 시스템을 사용하여 세포 표면상에 유전자 모자이크를 나타낸다. 이러한 하이브리드화를 통한 다양화에 의해, 적합하게 디스플레이하여 이러한 변이체의 라이브러리를 생성할 수 있는 유전자 변이체의 레퍼토리를 생산한다.
적합한 디스플레이 방법은 효모 디스플레이 및 세균 세포 디스플레이를 포함한다. 특히 바람직한 라이브러리는 단백질 가공 및 라이브러리 가공에서 많은 적용과 함께 사용된 것으로서 효모 표면 디스플레이 라이브러리이다. 이러한 라이브러리는 야생형 폴리펩타이드의 것에 대해 향상된 표현형 특성을 갖는 폴리펩타이드 변이체의 적합한 선택을 제공한다. 바람직하게는, 세포-계 선택 방법이 예를 들면, 표면-고정된 리간드에 대해 사용된다. 일반적으로 사용된 선택 기술은 야생형 폴리펩타이드의 특성을 지닌 이러한 라이브러리로부터 수득된 돌연변이체 폴리펩타이드의 특성을 분석하고 비교함을 포함한다. 개선된 바람직한 특성은 수용체에 결합할 수 있는 리간드 폴리펩타이드의 결합 특성의 특이성 또는 친화성의 변화를 포함할 수 있다. 폴리펩타이드 친화성 성숙이 본 발명의 특히 바람직한 실시양태이다. 변이체의 추가의 바람직한 특성은 안전성, 예를 들면, 열안정성, pH 안정성, 프로테아제 안정성, 가용성, 목적한 재조합 폴리펩타이드의 분비 수율 또는 수준을 말한다.
본 발명에 따른 방법으로 수득된 라이브러리는 기능적 ORF내에서 발현될 수 있는, 기능적 모자이크 유전자의 잠재적인 선도 후보물을 높은 퍼센트로 함유한다. 바람직한 라이브러리는 기능성 ORF내에 함유된 유전자 모자이크 중 적어도 80%, 바람직하게는 적어도 85%, 적어도 90%, 심지어 적어도 95%를 갖는다. 본 발명에 따라 제공된 라이브러리는 구체적으로 높은 퍼센트의 성공적인 하이브리드화를 나타내는 마커 서열의 퍼센트로 추가로 특징화된다. 본 발명에 따라서 홀수 뿐만 아니라 짝수의 모자이크 패치(mosaic patch)들이 수득될 수 있으며, 이는 상기 방법으로 생산된 재조합 라이브러리내 변이체 또는 라이브러리 구성원의 수를 증가시킨다.
일반적으로, 본 발명에 따른 라이브러리는 유전자 모자이크의 적어도 10개 변이체, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 1,000개, 보다 바람직하게는 적어도 104개, 보다 바람직하게는 적어도 105개, 보다 바람직하게는 적어도 106개, 보다 바람직하게는 적어도 107개, 보다 바람직하게는 적어도 108개, 보다 바람직하게는 적어도 109개, 보다 바람직하게는 적어도 1010개, 보다 바람직하게는 적어도 1011개, 1012개 이하, 심지어 보다 더 큰 개수가 실현가능하다.
본 발명에 따른 방법은 유전자 모자이크의 기능성 변이체를 발현하는 적어도 102개의 독립된 클론을 함유하는 라이브러리를 제공할 수 있다. 본 발명에 따라서, 예를 들면, 친화성 성숙된, 예비선택된 독립적인 클론의 혼주물(pool)이 제공되며, 당해 혼주물은 바람직하게는 적어도 10개, 보다 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 1,000개, 보다 바람직하게는 적어도 10,000개, 심지어 100,000개 이상의 독립된 클론을 포함한다. 예비선택된 혼주물을 포함하는 이들 라이브러리는 본 발명에 따르는 고 친화성 변이체를 선택하기 위한 바람직한 공급원이다.
본 발명에 따라 사용된 라이브러리는, 바람직하게는 모 유전자로부터 기원한 적어도 102개의 라이브러리 구성원, 보다 바람직하게는 적어도 103개, 보다 바람직하게는 적어도 104개, 보다 바람직하게는 적어도 105개, 보다 바람직하게는 적어도 106개의 라이브러리 구성원, 보다 바람직하게는 적어도 107개, 보다 바람직하게는 적어도 108개, 보다 바람직하게는 적어도 109개, 보다 바람직하게는 적어도 1010개, 보다 바람직하게는 적어도 1011개, 1012개 이하의 라이브러리의 구성원을 포함함으로써 상응하는 목적 폴리펩타이드에 대해 신규 특성을 가공한다.
바람직하게는, 라이브러리는 효모 라이브러리이며 효모 숙주 세포는 바람직하게는 생물학적 활성을 갖는 목적한 폴리펩타이드를 세포의 표면에 나타낸다. 대안적으로, 생성물은 세포내에 머물거나 세포 외부로 분비된다. 효모 숙주 세포는 사카로마이세스 속, 피키아(Pichia), 한세눌라(Hansenula), 스키조사카로마이세스(Schizosaccharomyces), 클루이베로마이세스(Kluyveromyces), 야로위아(Yarrowia) 및 칸디다로부터 바람직하게 선택된다. 가장 바람직하게는, 숙주 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)이다.
본원에 기술된 실시예는 본 발명을 예시하는 것이며 이에 한정되는 것으로 의도되지 않는다. 본 발명의 상이한 실시양태는 본 발명에 따라서 기술되어 있다. 많은 변형 및 변화가 본원에 기술되고 나열된 기술에 대해 본 발명의 취지 및 영역에서 벗어남이 없이 이루어질 수 있다. 따라서, 실시예는 단지 예시하는 것이며 본 발명의 영역을 한정하지 않은 것으로 이해되어야 한다.
실시예
실시예 1
설명
제1 실험 장치에서 본 발명자들은 재조합될 기질로서 OXA 부류의 베타 락타마제 유전자를 사용하였다. OXA 유전자의 장점은, 이용가능한 상이한 다양성(5 내지 50%)의 동족 유전자가 존재한다는 사실에 있다. 따라서, 이들 유전자는 생체내 재조합의 다양성의 한계를 시험하기 위한 우수한 후보물들이다. 유전자들은 또한 취급하기 용이하다(약 800bp 길이).
Figure pct00001
제1 실험에서 Oxa 11을 각각 Oxa 7 (95% 동일성), Oxa 5 (77% 동일성) 및 Oxa 1 (49% 동일성)으로 재조합시켰다.
본 발명자들은 영양요구성(-ura3, -leu2) 마커 유전자 및 msh2의 녹 아웃을 함유하는 균주 수집물(EUROSCARF)로부터 기원한 효모 균주 BY47을 사용하였다. 우라실 및 루이신 생합성 경로에서 결함이 있는 유전자는 영양요구성을 초래하는데, 즉, 우라실 및 루이신이 성장 배지에 첨가되어야 한다.
제1 단계에서 한편으로 마커 URA3 및 OXA11 또는 다른 한편으로 OXA 5/7/1 각각을 다른 마커 LEU2와 함께 함유하는 유전자 단편을 설계하였다. URA-OXA11 단편의 5' 말단에 인접하게 효모 염색체의 BUD 31 영역내에 5' 삽입 부위에 상응하는 약 400bp의 DNA 단편을 삽입하였다(5' 플랭킹 표적 서열). OXA 5/7/1의 3' 말단에서 염색체 상의 인접한 3' 부위에 상응하는 약 400bp의 DNA 단편(3' 플랭킹 표적 서열)을 삽입하였다(도 3). 모든 단편은 제네아트(Geneart)(독일 소재)에서의 표준 프로토콜에 따라 합성하였다.
합성된 단편을 PCR로 증폭시켜 형질전환에 사용하였다.
URA3-OXA 11 단편 및 다른 OXA-LEU2 단편 중 하나를 야생형(이배체 BY26240, Euroscarf) 및 미스매치 결함성 균주(반수체 a-mater BY06240, msh2-, Euroscarf)내로 형질전환시켰다. 형질전환 프로토콜은 가이츠(Gietz)(10)에 따랐다. 형질전환체를 적절한 마커 상 선택을 위한 선택 배지(우라실, 루이신 비함유)를 함유하는 플레이트 상에 플레이팅하였다. 72시간 후 콜로니를 관찰할 수 있었다.
Figure pct00002
(1) 상동 대조군
(2) DNA 수준에서 5%의 다양성
(3) DNA 수준에서 23%의 다양성
(4) DNA 수준에서 51%의 다양성
(5) 형질전환 혼합물 ml당 추정된 cpu 수 및 선택 배지(-ura -leu) 상의 DNA의 ㎍
ND = 검출된 콜로니 없음
BY06240 형질전환으로부터 유래된 총 48개의 콜로니를 분리하고 콜로니 PCR을 수행하였다[챠(Cha) 및 틸리(Thilly) 프로토콜(11)에 기초한 분해 및 헤르쿨라제 PCR]. 상이한 PCR 반응이 수행되어 표적 영역내로의 단편의 정확한 삽입을 입증한다. 48개 중 37개의 콜로니는 정확한 삽입 프로파일을 나타내었다. 이들 37개로부터, 31개가 서열분석을 위한 선명하고 이용가능한 증폭 생성물을 제공하였다. Oxa ORF 만을 플랭킹하는 2개의 특이적인 프라이머를 사용하는 반응은, OXA 서열이 실제로 조립되는 경우 실제 재조합체의 증폭을 허용한다. 또한, 상기 수득된 생성물은 직접적인 서열분석을 위한 정확한 기질이다. 따라서, 상기 양성 증폭 생성물을 서열분석하였다(GATC).
서열분석의 결과
31개 클론(보다 선명한 양성 증폭 시그날을 가진 것들) 중 24개의 클론을 서열분석하였다. 이들은 상동 대조군 Oxa11/Oxa11(서열 번호 39), 상동 대조군 Oxa07/Oxa07(서열 번호 40), 상동 대조군 Oxa05/Oxa05(서열 번호 41) fe02 내지 fe06, fe09 및 fe11: Oxa11/Oxa07 (서열 번호 1 내지 서열 번호 14) fe09 및 fe13, fe14, fe16 내지 fe24: Oxa11/Oxa5 (서열 번호 15 내지 서열 번호 38)에 상응하였다.
서열분석을 위해 클론 모두의 결과는 도 10 및 11 및 서열 번호 1 내지 38을 참조한다.
Oxa11/Oxa07 클론의 DNA 어닐링을 위해 도 10, 서열 번호 1, 3, 5, 7, 9, 11 및 13을 참조한다.
Oxa11/Oxa05 클론의 DNA 어닐링을 위해 도 11 , 서열 번호 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 및 37을 참조한다.
OXA11/Oxa07의 단백질 어닐링을 위해 도 10, 서열 번호 2, 4, 6, 8, 10, 12 및 14를 참조한다.
Oxa11/Oxa05의 단백질 어닐링을 위해 도 11, 서열 번호 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 및 38을 참조한다.
실시예 2
설명
복합체 모자이크 유전자의 라이브러리를 생성하기 위한 제2의 대안으로서, 3개의 상이하지만 관련된 유전자 서열을 조립하고 재조합하였다. 실시예 1에서와 같이, OXA 유전자 서열들을 MMR 결함성 효모내에서 이들의 조립을 위해 사용하였다. 도 3에 나타낸 바와 같이, 모자이크 생성 원리는 OXA 5(유전자 C)의 전체 ORF와 하이브리드화하는 OXA 11 (유전자 A) 및 OXA 7 (유전자 B)의 각각의 트렁케이트된 서열(truncated sequence)의 용도에 기초한다. 따라서, 영양요구성 마커를 공유하는 조립되고 통합된 카세트 A-B-C 만이 형질전환 후 선택될 것이다.
실시예 1에서와 같이, 본 발명자들은 영양요구성(-ura3, -leu2) 마커 유전자의 녹 아웃 및 msh2의 결실을 함유하는 균주 수집체(EUROSCARF)로부터 기원한 효모 균주 BY47을 사용하였다. 우라실 및 루이신 생합성 경로에서 유전자 결함은 영양요구성을 초래하는데, 즉, 우라실 및 루이신이 성장 배지에 첨가되어야 한다.
트렁케이트된 유전자 A 및 B를 함유하는 신규 유전자 단편들을 실시예 1에서 이미 기술한 단편: URA-Oxa11(OXA11 ORF의 뉴클레오타이드 386 내지 406번 상에서 역방 프라이머 어닐링) 및 OXA7-Leu(OXA 7 ORF의 뉴클레오타이드 421 내지 441번 상에서 전방 프라이머 어닐링)으로부터 특이적인 PCR로 수득하였다. OXA 5 유전자의 전체 ORF는 단편 OXA5-Leu로부터 PCR로 수득하였다. 단편 END-Leu는 실시예 1에서와 같이 사용하였다. 정제된 PCR 단편을 형질전환에 사용하였다.
형질전환 프로토콜은 가이츠(Gietz)(10)에 따랐다. 형질전환체를 적절한 마커상에서 선택하기 위한 선택 배지(우라실, 루이신 비함유)를 함유하는 플레이트 상에 플레이팅하였다. 72시간 후 콜로니를 관찰할 수 있었다.
Figure pct00003
(1) 조립하기 위한 3개의 OXA 서열
(2) 중간 서열 OXA5는 결여되어 있다(음성 대조군)
(3) MMR 능숙한 효모에서 상동 재조합 배경
(4) MMR 결함성 효모에서 상동 재조합 배경
(5) ND = 검출된 콜로니 없음
BY06240 형질전환으로부터 생성된 총 8개의 콜로니를 무작위로 분리하고 콜로니 PCR을 수행하였다(챠 및 틸리 프로토콜(11)에 기초한 분해 및 헤르쿨라제 PCR). 상이한 PCR 반응이 수행되어 표적 영역내로의 단편의 정확한 삽입을 입증하였다. 8개의 콜로니 중 7개의 콜로니는 정확한 삽입 프로파일을 나타내었다. 이들 7개로부터 서열분석을 위한 선명하고 이용가능한 증폭 생성물을 수득하였다. Oxa ORF를 플랭킹하는 2개의 특이적인 프라이머를 사용하는 반응만이, OXA 서열이 실제로 조립되는 경우 실제 재조합체의 증폭을 허용한다. 추가로, 상기 수득된 생성물은 직접적인 서열분석을 위한 정확한 기질이다. 따라서, 상기 양성 증폭 생성물을 서열분석하였다(GATC).
서열분석의 결과
8개의 콜로니 중 7개(보다 선명한 양성 증폭 시그날을 가진 것들)를 서열분석하여 5개의 이용가능한 서열을 수득하였다. 이들은 모두 클론 OUL3-05-II, OUL3-05-III, OUL3-05-IV, OUL3-05-IX 및 OUL3-05-X로부터의 상동 조립체 OXA11/OXA5/OXA7에 상응하였다.
서열분석을 위해, 클론 및 단백질 어닐링 모두의 결과는 선택된 클론(도 13): OXA11/OXA5/OXA7의 OUL3-05-II (서열 번호 42 및 43), OUL3-05-III (서열 번호 44 및 45), OUL3-05-IV (서열 번호 46 및 47), OUL3-05-IX (서열 번호 48 및 49) 및 OUL3-05-X (서열 번호 50 및 51)의 서열을 참조한다.
토의
세포에 의한 조립용 주형(template)으로서 다양한 서열을 지닌 유사분열 MMR 결함성 세포의 단순한 형질전환 방법 및 생체내 재조합에 의한 다양성의 생성이 입증되어 있다.
재조합 모자이크화의 복잡한 양식은, 길이가 상이한 적어도 17개의 패취를 800 bp의 단일 분자(즉, 클론 fe19(서열 번호 27) 및 fe20(서열 번호 28)내로 도달하게 하는 실시예 1에 기술된 방법으로 수득하였다. 재조합 현상은 모든 길이의 서열에서 발생하는 것으로 여겨진다.
더우기, 주형 사슬들 중의 하나에 상응하는 뉴클레오타이드의 점-유사 교체는 ORF[즉, 클론 fe19(서열 번호 27) 및 fe20 (서열 번호 29)]의 골격에 관한 다양성의 중요한 공급원으로서 관찰되었다.
또한, 당해 재조합 방법은 3개의 관련된 유전자(OXA 11, OXA 7 및 OXA 5)로 부터의 서열을 동시에(즉, 클론 OUL3-05-III 및 OUL3-05-IX) 사용함으로써 실시예 2에 나타낸 바와 같이 2개 이상의 관련된 유전자로부터 모자이크를 생산하였다. 이는 수개의 유전자로부터 목적한 영역을 재조합하기 위한 고도의 효율적인 방법이며, 생체내에서 모자이크 유전자 라이브러리의 생성을 기초로 하는 다양성의 신규 공급원을 나타낸다.
재조합 클론 중 어느 것도, 해독된 DNA의 인 실리코 분석(in silico analysis)에 의해 입증되는 바와 같은 트렁케이트된 단백질 생성물을 생성하지 않았다.
21개 중 단지 1개의 클론(fe15) 만이 모 프로파일을 나타내었다(데이타는 나타내지 않음)
모자이크 현상 및 점-유사 교환은 단백질 수준에서 필수적으로 보존적이지 않다. 실제로, 극성 특성이 상이한 신규 아미노산이 재조합 후 생성되어 재조합 뮤테인(mutein)[즉, 클론 fe19 (서열 번호 27) 및 fe20 (서열 번호 29)]에 대해 신규의 잠재적 및 효소적 단백질 특성을 제공하였다.
재조합 라이브러리를 제조하는 당해 시도에 의한 재조합체 생성의 한가지 매우 매력적인 특성은, 홀수뿐만 아니라 짝수의 재조합 현상이, 홀수 현상만이 라이브러리내로 나타날 수 있는 모자이크 재조합 시도와 비교하여 수득될 수 있다[즉, fe06(서열 번호 7), fe11 (서열 번호 13), fe13 (서열 번호 17), fe19 (서열 번호 27)]는 것이다.
모 주형과는 관련되지 않은 일부 점 돌연변이가 소수의 서열[즉, fe16 (서열 번호 21) 및 fe17 (서열 번호 23)]에서 관찰되었다. 모든 경우에서, 상기 돌연변이는 수득되는 ORF의 판독 프레임을 변화시키지 않았다.
실시예 3
설명
플라보노이드 합성은 모든 페닐프로파노이드로서 페닐알라닌으로 개시한다. 7개의 효소가 L-페닐알라닌의 플라보놀로의 전환에 요구된다. 페닐알라닌은 쿠마레이트-CoA로 효소 페닐알라닌 리아제(PAL), 신나메이트-4-하이드롤라제(C4H) 및 4-쿠마로일-CoA 리가제(4CL)의 연속적인 작용에 의해 전환된다. 쿠마레이트-CoA는 상이한 폴리페놀의 생합성을 위한 주요 분기점이다. 예로서, 쿠마레이트-CoA는 챨콘 신타제(CHS), 챨콘 이소머라제(CHI), 플라보논 3-하이드록실라제(F3H) 및 플라보놀 신타제(FLS)가 관여하는 반응 캐스케이드(reaction cascade)의 전구체이다. NADP-사이토크롬 P450 옥시리덕타제(CPR)는 C4H 및 F3'H 효소의 촉매 작용을 위해 존재하여야 한다. 경로의 중간체 대사산물은 광범위한 스펙트럼의 플라보노이드에 대한 신규 기질로서 제공된다. 당해 물질대사 경로의 많은 식물 유전자가 특징화되어 있다(12, 13 및 당해 문헌에서의 참조 문헌).
당해 유전자 대부분은 효모에서 기능적으로 발현될 수 있다. 그러나, 발현 수준 또는 활성 또는 안전성 어느 것도 기술되어 있지 않다. 따라서, 본 발명자들은 유도성 발현 시스템을 선택하여 생물학적 활성을 측정하고 물질대사 유동도(metabolic flux)를 분석하였다. 주요 및/또는 고 배출 스크리닝 방법(high throughput screening method)이 이에 의해 형질전환된 세포(즉, 조립 및 재조합 후)의 상층액을 사용하여 개발되었다. 플라보노이드 유전자 대부분은 DNA 서열 유사성에 있어서 95 내지 70%의 범위인 상동 대응물을 갖는다.
컴퓨터 분석은 플라보노이드 경로의 8개 유전자를 함유하는 8개의 단편 및 또한 이들의 동족 재조합 파트너를 설계하도록 한다. 단편, ORF 및 또한 상부 및 하부 서열은 도 4에 나타낸다(서열 공급원에 대한 세부사항에 대해서는 표 4 및 5를 참조하고, 각각의 단편의 증폭에 대해서는 도 5b 및 표 6을 참조한다). 앞서 언급한 참조문헌들과는 대조적으로, 본 발명자들은 20 kb의 DNA 길이의 당해 경로의 7개 유전자를 조립하여 재조합하기로 결정하였다. 제1 및 마지막 단편은 추가로 실시예 2에 나타낸 게놈내로 경로의 통합을 위한 표적 서열을 함유하였다. 당해 제1 실험에서 각각의 효소의 2개 유전자를 조립/재조합하였다. 기능성 시험 및 비교를 위한 참조를 위하여, 각각의 효소의 동일한 모 버젼 유전자(PA) 만을 함유하는 야생형 경로를 조립하였다.
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
효모 형질전환: 효모 형질전환용 프로토콜을 문헌[참조: Geitz and Woods (10)]으로부터 약간 변형시켰다. 세포를 YPD 배지 속에서 예비배양한 후 신규의 풍부한 배지를 접종하는데 사용하였다. 이들을 OD600이 0.6에 이를 때까지 수거하고, 펠렛을 2회 세척하며 1/50 용적으로 농축시켰다. 적격 세포(competent cell)를 형질전환 PEG/LiAC/ssDNA 혼합물에 500 ng의 각각의 단편과 함께 가하였다. 짧게는, 단편(상동 및 동족)을 등몰 혼합물 속에서 제조하고 적격 세포 BY06(msh2 결함성)을 형질전환시켰다. 추가로 적격 세포를 DNA 없이(음성 대조군) 형질전환시켰다. 재조합 클론의 선택은 Ura를 함유하지 않고 하이드로마이신을 함유하는 배지 속에서 수행하였다.
재조합체의 분석:
5일 후 상이한 단편으로 형질전환시킨 클론을 선택 배지위에서 관찰하였다. 예측한 바와 같이, DNA가 없는 대조군의 경우에는 클론이 관찰되지 않았다. 7개의 클론을 서열 분석을 위해 무작위로 선택하였다: 1개 클론을 H3으로 명명된 조립된 야생형 유전자를 함유하는 형질전환체로부터 선택하였다. 당해 클론을 야생형 대조군으로서 제공하였다. 상동 유전자의 생체내 재조합으로부터 수득된 6개의 다른 클론을 또한 분리하고 게놈성 DNA(gDNA)를 위자드 게노믹 DNA 정제 키트(Wizard Genomic DNA purification kit, 제조원: Promega)를 사용하여 제조하였다. 우선, 집단의 정확한 통합을 gDNA로부터 표적화된 PCR로 분석하였다. 90% 이상의 선택된 클론에서 증폭된 단편은 예측된 길이에 상응하였으며 이는 정확한 통합을 입증한다. 이후에, 각각의 이들 클론의 7개의 플라보노이드 유전자를 단편의 정확한 조립을 또한 입증하는 특이적인 프라이머를 사용하여 증폭시켰다. 상기 증폭 생성물을 서열분석하였다(세부사항에 대해서 도 14의 재조합 클론 M1의 조립된 서열 참조). 서열 분석 결과는, 본 발명자들이 경로에 관여된 8개의 유전자의 염색체내에서 조립, 재조합 및 안정한 통합에 의해 효모내에서 완전한 플라보노이드 경로를 재구성하는데 성공하였음을 입증하였다. 100% 상동 유전자의 조립체로부터 배출된 H3으로 명명된 야생형 클론 및 6개의 재조합 클론의 분석은, 상동 유전자가 재조합되고 조립되어 정확한 ORF를 생성하였음을 나타내었다. 본 발명자들은 임의의 골격 이동(frame shift), 결실 또는 삽입도 관찰할 수 없었다. 무작위적으로 분리된 상동 클론의 서열 분석은, 플라보노이드 경로의 대부분의 유전자가 이들의 2개의 모 버젼 사이의 모자이크이었음을 입증하였다.
재조합 플라보노이드의 경로를 포함하는 효모 클론의 분석
a) 재조합 클론의 배양 상층액의 제균 효과
플라보놀 또는 챨콘과 같은 폴리페놀 대사산물은 제균 또는 항균 효과를 가진 화합물로 기술되어 왔다(14, 15, 16). 당해 특성은 플라보노이드 유도체와 이의 전구체를 약물 개발용의 흥미있는 후보물이 되도록 한다. 제균 효과는 간단한 방법, 예를 들면, 세균 성장 억제용 광도계 시험으로 스크리닝할 수 있다.
위에서 언급한 클론 중 수개의 상층액을 사용하여 이. 콜라이 성장 배지에 가하는 경우 이들의 제균 능력을 입증하였다(도 8).
효모 배양물을 유도 조건(단일의 탄소원으로서 갈락토즈, 페닐알라닌을 함유하나 메티오닌은 함유하지 않음)하에서 적어도 72시간 동안 성장시켰다. 이들을 원심분리에 의해 수거하고 상층액을 회수하였다. 대조군으로서, 본 발명자들은 클론과 동일한 조건하에 배양한 Y06 균주(플라보놀 유전자 없음), 및 효모가 들어있지 않은 배지를 사용하였다. 이들 상층액의 1/10 용적을 이. 콜라이 현탁액(OD600 = 0.05)이 들어있는 LB 배지에 가하였다. 세균 배양물을 30℃에서 성장시키고 이들의 세포 밀도를 각각 2시간째에 측정하였다. 도 8에 나타난 바와 같이, 세균 성장에 있어서 강력한 억제 효과가 대조군과 비교하는 경우 클론 HIII, M1, M7 및 M8의 상층액에서 관찰되었다. 다른 클론은 보다 낮은 효과를 생성하거나 효과를 전혀 생성하지 않았다. 최종적으로, 이들 억제 인자는 당해 유도 조건에서 플라보노이드 유전자를 지닌 클론에서만 존재하며 대조군 배양물 Y06(플라보노이드 유전자 없음)에서는 존재하지 않았다.
일부 플라보노이드 유전자를 PAL의 경우 GAL1/10 및 CHI 및 C4H의 경우 F3H 및 MET 2/25와 같은 유도성 프로모터로 조절한다. 상기 억제 결과를 확인하기 위하여, 본 발명자들은 효모 클론을 글루코즈 및 메티오닌이 들어있는 배지 속에서 배양시켜 경로의 유도성 유전자를 사일런싱(silencing) 시키고 플라보노이드 대사산물의 생산을 억제하였다. 유도되지 않은 효모 배양물을 앞서와 같이 처리하고 상층액을 사용하여 이. 콜라이 배양물 위에서 이들의 억제 효과를 분석하였다(데이타는 나타내지 않음). 억제 효과는 재조합 플라보노이드 클론 중 어느 것에 대해서도 관찰되지 않았다. 실제로, 당해 상층액 모두는 필수적으로 대조군 Y06과 같이 거동하였다. 흥미롭게도, 클론을 유도성 조건(갈락토즈, 메티오닌 및 페닐알라닌의 존재)에서 배양하는 경우, 이. 콜라이 배양물에 대한 억제 효과가 회복되었다(데이타는 나타내지 않음). 이들 억제 효과는 동일한 배양 조건에서 대조군 Y06과 비교하여, 클론 HIII, M1 및 M8의 경우 5배 더 높고 다른 클론의 경우 2배 높거나 거의 없었다.
b) 재조합 플라보노이드 경로를 포함하는 효모 배양 상층액내로 플라보노이드 및 전구체의 존재에 의한 DPH의 ?칭
당해 시험은 1,6-디페닐-1,3,5-헥사트리엔(DPH)의 형광성을 ?칭하기 위한 플라보노이드로서 3개-고리 분자의 능력에 기초한다. 당해 특징은 플라보노이드 분해 미생물을 분석하는데 효과적으로 사용되어 왔다(17). 프로토콜을 조정하여 나일론 막 위에 플라보노이드를 함유하는 추출물의 ?칭이 가시적이 되도록 하였다. 재조합된 플라보노이드 경로를 포함하는 유도 조건에서 성장시킨 효모 배양물의 상층액을 에틸 아세테이트로 추출하고 동결건조시켰다. 이후에, 펠렛을 최초 용적의 1/10로 에탄올 70%로 회수하였다. 각각의 샘플에 대해, 9μl를 1μl의 DPH (DMSO 중 0.1 mM)에 가하고 혼합하였다. 이후에, 5μl를 하이본드(Hybond)-C 막 위에 로딩하고, 샘플의 ?칭을 UV-트랜스루미네이터(UV-transiluminator) 상에서 관찰하였다(도 8, 삽도 A). 영상-J 프로그램을 사용하여 점의 시그날 강도를 측정하고 배지만(?칭 없음)으로부터의 추출물에서 수득한 시그날에 대해 표준화하였다. 나린게닌(1μM)을 최대 ?칭의 대조군으로서 사용하였다. 값들의 막대그래프를 나타낸다(도 8. 삽도 B). 명확하게는, H3, M1, M4 및 M7 클론은 보다 높은 ?칭 값을 나타내었고, 클론 M2, M3 및 Y26(음성 대조군)으로는 불량한 효과가 관찰되거나 효과가 관찰되지 않았다. 이들 결과는, 재조합 플라보노이드 경로를 포함하는 본 발명자들의 효모 세포가 플라보노이드 및 이의 중간체를 합성하는 추가의 증거이다.
c) 유도된 배양물로부터의 효모 재조합 플라보노이드 상층액의 HPLC 분석
억제성 세균 활성을 탐구하기 위해 기술된 클론 중 일부의 상층액을 SPE 컬럼에서 추출하고 메탄올 추출물을 표준 프로토콜에 의해 C18 HPLC 컬럼 및 기술한 바와 같은(4) 아세토니트릴/물 구배를 사용하여 분리하였다. 추가로, 목적한 피크를 표준 방법(4, 5)에 의해 HPLC-MS로 질량 분광법에 적용시켜 유도된 배양 상층액 속에서 플라보노이드 화합물의 존재를 확인하였다.
앞서 언급한 바와 같이, 부분 유도 조건하에 성장시킨 배양물로부터의 야생형 및 음성 대조군 상층액을 HPLC로 분석하였다. 도 8에 나타낸 클론의 상층액을 SPE C18 하이드라 컬럼 상에서 공급자(Macherey-Nagel)의 지시에 따라 추가로 정제하고 고 성능 액체 크로마토그래피 및 질량 분석을 기술한 바와 같이(4, 5) 수행하였다. 표 8은 수득된 대부분의 중요한 결과를 요약한다.
선택된 피크의 질량을 측정하기 위하여, 샘플 상층액을 SPE (C18) 컬럼 위에서 추출하고 HPLC-MS로 분석하였다. 100μl의 추출물을 HPLC로 우선 분석하였다. 플라보노이드 경로 유전자를 발현하는 세포로부터의 추출물은 플라보노이드 유전자를 함유하지 않은 대조군과 비교하여 신규 피크를 함유하였음이 입증될 수 있었다(참조: 표 8). 선택된 피크를 질량 분광분석법으로 분석하였다. 따라서, 신규 피크에 상응하는 질량을 단편화하고 수득되는 단편을 공지된 플라보노이드 표준물의 단편화로부터 생성된 단편과 비교하였다. 따라서, 카페인, 트랜스-신남산, p-쿠마르산, 나린게닌, 디하이드로카엠프페롤, 카엠프페롤, 및 쿠에르세틴이 확인되었으며, 예로서 효모 클론 H3 및 모자이크 클론 M1에서 플라보노이드의 생산을 확인하였다.
언급한 바와 같이, 보다 상세한 분석은, H3 및 일부 재조합 클론이 또한 p-쿠마레이트 및 신나메이트로서 플라보노이드 조기 전구체를 축적하였음을 나타내었다. 놀랍게도, 플라보노이드 경로와 직접 관련되지 않은 카페인산, 플로레트산 및 스티렌의 3개 화합물이 검출되었다. 특정 조건하에서, 플라보노이드 유전자로 형질전환된 효모 세포가 전구체를 이용하여 신규 중간체를 생산할 수 있거나, 상이한 효소 유전자의 재조합이, 변경된 활성 및 기질 특이성을 갖는 효소를 생성하였음을 고려하는 것이 타당하다. 이후에, 이는 물질대사 화합물 라이브러리에서 발견된 분자의 다양성을 반영할 수 있다. 최종적으로, 수개의 아직 공지되지 않은 피크가 플라보노이드 재조합 경로를 함유하는 클론에 대해 특이적인 상층액에서 검출되었다(표 8).
Figure pct00008
(*) 2개의 반수체 형질전환된 세포를 접합시켜(짝을 지워) 2개의 동일한 경로를 함유하는 이배체 세포를 수득하였다.
d) 상동 플라보노이드 재조합과 모자이크 클론 사이의 상이한 화합물 프로파일
CH4 모자이크 효소 및 p-쿠마르산 생산
총 유도 조건하 및 동일한 세포 질량과 관련하여, M1 클론은 HPLC에 의한 분리 후 상동 대조군 H3 보다 3배 이상 더 많은 쿠마르산을 축적시킬 수 있음이 관찰되었다. 당해 거동은, 외인성 페닐알라닌이 배양물로부터 빠진 경우에도 동일하게 유지된다(세포는 내인성 아미노산을 사용한다). 둘다의 경우에서, 신남산 양은 검출불가능하게 남으며, 이는, 신남산이 생산됨과 동시에 소모됨을 제안한다. 세포 배양물에 외인성 페닐알라닌의 부재하에 배양물에 첨가된 메티오닌 없이 150μM의 신남산을 공급하는 경우, H3 보다 모자이크 M1 클론에서 2배 더 많은 쿠마레이트가 존재한다(도 15). 클론 둘다에서 C4H 효소의 발현이 메티오닌의 부재하에서 유도되므로, 당해 배양물에서 M1 모자이크 C4H 효소는 H3 클론에 대한 것에서 이의 모 버젼보다 더 활성이다.
F3H 모자이크 효소는 모 H3보다 카엠프페롤에서 보다 더 전구체를 전환시킨다.
유도된 H3 및 M1 세포 배양물에 150 μM의 나린게닌-챨콘을 공급하는 경우 모자이크 클론 M1에 대해 동일한 거동(보다 높은 p-쿠마레이트 생산)이 신나메이트의 명백히 보다 우수한 전환과 함께(도 16B) 관찰되었다(도 16A). 동시에, 모 클론 H3는, 전구체 디하이드로카엠프페롤이 완전히 사용되지 않는 경우에도 많은 양의 플라보노이드 카엠프페롤을 생산할 수 있었다(도 16C 및 D). 반면에, 모자이크 M1 클론은 카엠프페롤로 완전히 전환되는 것으로 여겨지는 디하이드로카엠프페롤을 축적시키지 않았다(도 16C 및 D). FLS 효소의 발현은 둘다의 경우에서 구성요소이며 플라보노이드 생산을 위한 병목(bottle neck)인 것으로 여겨진다. F3H 효소 발현은 갈락토즈의 존재하에서 조절될 수 있다. 디하이드로카엠프페롤의 축적이 동일한 배양 배지하에서 모자이크 클론 M1에서는 관찰되지 않지만 H3에서는 관찰된다는 사실은, 모자이크 효소가 디하이드로카엠프페롤 전환에 있어서 당해 상이한 거동 및 수득되는 카엠프페롤 수율에 대한 원인인 변형을 겪음을 제안한다.
논의
재조합 경로의 복잡한 라이브러리를 조립하고, 재조합하며 발현하는 신규의 1 단계 방법은 현저한 효능을 나타내었다. 14개의 관련된 유전자 버젼을 사용하여 DNA 복구 결함성 세포내로 조립되고 통합되는 경우 이들의 발현에 있어 조절될 수 있는 모자이크 경로를 생성하였다. 당해 공정은, 효소의 재조합 형태가 기능적으로 발현될 수 있음을 허용하는 ORF의 구조적 통합성을 준수한다. 이러한 구체적인 경우에서, 본 발명자들은 상응하는 유전자를 변형시키고 경로의 최종 생성물로서 플라보노이드 및 이들의 중간체를 유도함으로써 확인할 수 있었다. 재조합 경로의 유도성 발현은 기능적이므로, 이는 중간체 및 유도체, 및 또한 최종 플라보노이드 생성물을 단순한 배지 변형으로 생성할 수 있는 가능성을 본 발명자들에게 제공한다. 유도된 재조합 세포 배양물(모자이크 경로)의 HPLC 상층액 분석은, 특정 분자의 생산이 대조군(모자이크 경로 없음)과 비교하여 더 높음을 입증하며, 이는 촉매 효소의 개량을 제안한다. 또한, 스티렌, 카페인산 및 플로레트산과 같은 상이한 분자가 재조합 클론의 상층액 속에서만 발견되었다. 최종적으로, 플라보노이드 단편 특징을 함유하는 아직 확인되지 않은 수개의 분자가 검출되었으며 이는, 복잡한 페닐프로파노이드 화합물 라이브러리가 당해 방법에 의해 생성되었다는 개념을 강화시킨다. 이들 결과는 또한 바닐린, 스티렌, 아미노산 등과 같은 방향족 화합물의 물질대사에 관여된 다른 경로에서 라이브러리의 클론을 이용할 수 있는 가능성을 열어놓는다. 따라서, 당해 방법은 또한 다른 경로에 적용시키고, DNA 복구 메카니즘이 조절될 수 있는 다른 유기체에서 사용하여 상동 재조합 및 유전자 집단 조립체를 촉진하여 신규한 다양성을 제공할 수 있다.
참조 문헌
1- Shao Z., Zhao H. and Zhao H. 2009. DNA assembler, an in vivo genetic method for rapid construction of biochemical pathways. Nucleic Acids Research 37(2):e16 Epu
2- Elefanti A., Begley C., Metcalf D., Barnett L., Koentgen F. and Robb L. 1998. Characterization of hematopoietic progenitor cells that express the transcription factor SCL, using a lacZ "knock-in" strategy. Proc. Natl. Acad. Sci. 95, 11897-11902
3- Koffas M., Leonard E., Yan Y. US Patent published 05-Oct-2010. Production of flavonoids by recombinant microorganisms
4- Naesby M et al. 2009. Yeast artificial chromosomes employed for random assembly of biosynthetic pathways and production of diverse compounds in Saccharomyces cerevisiae . Microbial Cell Factories. 8:45
5- Trantas E., Panopoulos N. and Ververidis F. 2009. Metabolic engineering of the complete pathway leading to heterologous biosynthesis of various flavonoids and stilbenoids in Saccharomyces cerevisiae . Metabolic Engineering. 11: 335-366
6- Radman M. and Rayssiguier C. WO patent 1990. In Vivo Recombination Of Partially Homologous DNA Sequences
7- Smith K. and Borts R. WO patent 2005. Generation de genes recombinants dans Saccharomyces cerevisiae .
8- Swers J., Kellogg B. and Wittrup K. 2004. Shuffled antibody libraries created by in vivo homologous recombination and yeast surface display. Nucleic Acids Research 32(3) e36
9- Sambrook J., Fritsch E. and Maniatis T. 1992. Molecular Cloning: A Laboratory Manual. ISBN-13: 978-0879693091
10- Gietz, R. and Woods R. 2002. Transformation of yeast by the LiAc/ss Carrier DNA/PEG method. Methods in Enzymology 350: 87-96
11- Cha R. and Thilly W. 1995. Specificity, Efficiency and fidelity of PCR, in PCR primer: A laboratory Manual, Dieffenbach and Dveksler eds., pp 37
12- Vogt T. 2010. Phenylpropanoids Biosynthesis. Mol Plant. Vol 3, 1: 2-20
13- Winkel-Shirley B. 2001. Flavonoid biosynthesis. A colorful model for genetics, biochemistry, cell biology, and biotechnology. Plant Physiol. 2:485-93
14- Oboh G. 2006. Antioxidant and antimicrobial properties of ethanolic extract of Ocimum gratissimum leaves. Journal Phar Tox, 1(1): 47-53
15- Karaman I, Gezegen H, Gurdere M, Dingil A, Ceylan M. 2010. Screening of biological activities of a series of chalcone derivatives against human pathogenic microorganisms. Chem Biodivers. 7(2): 400-8
16- Batovska D. and Todorova I. 2010. Trends in utilization of the pharmacological potential of chalcones. Curr Clin Pharmacol, 5(1):1-29, Review
17- Schoefer L., Braune A., Blaut M. 2001. A fluorescence quenching test for the detection of Flavonoid Transformation. FEMS Microbiology Letters 204: 277-280
18- Vogt T. 2010. Phenylpropanoids Biosynthesis. Mol Plant. Vol 3, 1: 2-20
19- Walton N., Mayer M., Narbad A. 2003. Molecules of Interest: Vanillin. Phytochemistry 63 : 505-515
20- Sinha A., Sharma U., Sharma N. 2008. A comprehensive review on vanilla flavor: extraction, isolation and quantification of vanillin and others constituents. Int J Food Sci Nutr. 59: 299-326.
<110> EVIAGENICS S.A. <120> METHOD OF METABOLIC EVOLUTION <130> IPA131295 <150> US 61/499,535 <151> 2011-06-21 <160> 100 <170> KopatentIn 2.0 <210> 1 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> hybrid <400> 1 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca ataacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaaaccaag agccatgaaa 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggcggcatt gacaaattct ggttggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 2 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 2 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asn Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 3 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 3 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaagccaag agccatgaaa 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggtcggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 4 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 4 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Ser Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 5 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 5 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat cagggaaagt 780 gagggcatca ttggtggcta a 801 <210> 6 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 6 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Arg Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 7 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 7 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcacca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaagg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 8 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 8 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Pro Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 9 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 9 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atggacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 10 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 10 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Met Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 11 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 11 atgaaaacat ttgccgcata tgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacct ataacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaagccaag agccatgaaa 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 12 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 12 Met Lys Thr Phe Ala Ala Tyr Val Ile Thr Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Tyr Asn Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 13 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 13 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa ggaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaattcattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 14 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 14 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Arg Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Phe Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 15 <211> 804 <212> DNA <213> artificial <220> <223> hybrid <400> 15 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagagact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gcaatagtta cagaagcaac tccagaatat 600 atagttcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca tcattggtgg ctaa 804 <210> 16 <211> 267 <212> PRT <213> artificial <220> <223> hybrid <400> 16 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Ile 180 185 190 Val Thr Glu Ala Thr Pro Glu Tyr Ile Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 17 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 17 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggtaga gaaaggaact gaggtttact ttttcgcctt tagcatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 18 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 18 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Thr Glu Val Tyr Phe Phe Ala Phe Ser Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 19 <211> 804 <212> DNA <213> artificial <220> <223> hybrid <400> 19 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg agagtaaatt gccgtcaaga aaatccattt caacgaaaat catggcaagt 780 gaaggcatca tcattggtgg ctaa 804 <210> 20 <211> 267 <212> PRT <213> artificial <220> <223> hybrid <400> 20 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Ser Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 21 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 21 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagtg agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtctcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 22 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 22 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Ser Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 23 <211> 804 <212> DNA <213> artificial <220> <223> hybrid <400> 23 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaaga ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca tcattggtgg ctaa 804 <210> 24 <211> 267 <212> PRT <213> artificial <220> <223> hybrid <400> 24 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Glu Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 25 <211> 800 <212> DNA <213> artificial <220> <223> hybrid <400> 25 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga gataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttgg gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aatccattcc caccaaaatc atggaaagtg 780 agggcatcat tggtggctaa 800 <210> 26 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 26 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Arg Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Gly Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 27 <211> 802 <212> DNA <213> artificial <220> <223> hybrid <400> 27 atgaaaacat ttgccgcata tgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttttcgtgct ttgtaaaagt agcagtaaat cctgcgctac caataactta gctcgtgcat 180 caaaggaata tcttccagca tcaacattta agatccccaa cgcaattatc ggcctagaaa 240 ctggtgtcat aaagaatgag catcaggttt tcaaatggga cggaaagcca agagccatga 300 aacaatggga aagagacttg agcttaagag gggcaataca agtttcagcg gttcccgtat 360 ttcaacaaat cgccagagaa gttggcgaag taagaatgca gaaatatctt aaaaaatttt 420 catatggtaa ccagaatatc agtggtggca ttgacaaatt ctggttggag ggtcagctta 480 gaatttccgc agttaatcaa gtggagtttc tagagtctct atttttaaat aaattgtcag 540 catcaaaaga aaatcagcta atagtaaaag aggctttggt aacggaggct gcgcctgaat 600 atcttgtgca ttcaaaaact ggtttttctg gtgtgggaac tgagtcaaat cctggtgtcg 660 catggtgggt tggttgggtt gagaagggag cagaggttta ctttttcgca tttaacatgg 720 atatagacaa cgaaaataag ttgccgctaa gaaaatccat tcccaccaaa tcatggcaag 780 tgagggcatc attggtggct aa 802 <210> 28 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 28 Met Lys Thr Phe Ala Ala Tyr Val Ile Thr Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asn Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 29 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 29 atgaaaacat ttgccgcata cgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaggg tcagcttaga 480 attcccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 30 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 30 Met Lys Thr Phe Ala Ala Tyr Val Ile Thr Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Pro Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 31 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 31 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 32 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 32 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 33 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 33 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaacat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggac 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 34 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 34 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu His Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 35 <211> 804 <212> DNA <213> artificial <220> <223> hybrid <400> 35 atgaaaacat ttgccgcata tttaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca tcattggtgg ctta 804 <210> 36 <211> 267 <212> PRT <213> artificial <220> <223> hybrid <400> 36 Met Lys Thr Phe Ala Ala Tyr Leu Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 37 <211> 804 <212> DNA <213> artificial <220> <223> hybrid <400> 37 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttctgctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagact gaggtttact tttttgcttc taacatggac 720 atagacaatg agagtaaatt gccgtcaaga aaatccattt caacgaaaat catggcaagt 780 gaaggcatca tcattggtgg ctaa 804 <210> 38 <211> 267 <212> PRT <213> artificial <220> <223> hybrid <400> 38 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Ser Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Ser Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 39 <211> 801 <212> DNA <213> Pseudomonas. aeruginosa <400> 39 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaatcct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 40 <211> 801 <212> DNA <213> Escherichia coli <400> 40 atgaaaacat ttgccgcata tgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca ataacttagc tcgtgcacca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaaaccaag agccatgaaa 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggcggcatt gacaaattct ggtcggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 41 <211> 804 <212> DNA <213> Pseudomonas aeruginosa <400> 41 atgaaaacca tagccgcata cttagttact tcctgttttt caagcaccgc gctctcaaag 60 tctatttctg aaaatttggt gtggaataaa gaattttcta gtgaatccgt acatggcgtt 120 tttgtacttt gtaaaagtag tagcaattcc tgtactacaa ataatgcggc acgtgcatct 180 acagcctata ttccagcatc aacattcaaa attcctaatg ctctaatagg tcttgaaacc 240 ggcgccataa aagatgaacg gcagattttc aaatgggacg gcaagcccag agccatgaaa 300 caatgggaaa aagacttaag gctaaggggc gctatacagg tttctgcggt tccggtattt 360 caacaaattg ccagagaagt tggcgaaatg agaatgcaaa gatatcttaa cctgttttca 420 tacggtaacg ccaatatagg gggaggcatt gacaaattct ggctagaggg tcagcttaga 480 atcccagcat tcaatcaaga taaatcttta gagtcgctct tcctgaataa tttgccagca 540 tcaaaagcaa atcaactaat agtaaaagag gcaatagtta cagaagctac gccagaatat 600 attgttcatt caaaaactgg gtattccggt gttggcacag aatcaagtcc tggtgtcgct 660 tggtgggttg gttgggtagg gaaaggagct gaggtttact tttttgcatt taacatggac 720 atagacaatg agaataaatt gccgtcaaga aaatccattt caacgaaaat catggcaagt 780 gaaggcatca tcattggtgg ctaa 804 <210> 42 <211> 827 <212> DNA <213> artificial <220> <223> hybrid <400> 42 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacattcaaa attcctaatg ctctaatagg tcttgaaacc 240 ggcgccataa aagatgaacg gcaggttttc aaatgggacg gcaagcccag agccatgaag 300 caatgggaaa aagacttaaa gctaaggggc gctatacagg tttctgctgt tccggtattt 360 caacaaattg ccagagaagt tggcgaaata agaatgcaaa aataccttaa cctgttttca 420 tacggcaacg ccaatatagg gggaggcatt gacaaattct ggctagaagg tcagcttaga 480 atctcagcat tcaatcaagt taaattttta gagtcgctct acctgaataa tttgccagca 540 tcaaaagcaa accaactaat agtaaaagag gcaatagtta cagaagcaac tccagaatat 600 atagttcatt caaaaactgg gtattccggt gttggcacag aatcaagtcc tggtgtcgct 660 tggtgggttg gttgggtaga gaaaggaact gaggtttact tttttgcttt taacatggac 720 atagacaatg agagtaaatt gccgtcaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta agctgtgaag atcccagcaa aggctta 827 <210> 43 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 43 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Leu Ile Gly Leu Glu Thr 65 70 75 80 Gly Ala Ile Lys Asp Glu Arg Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Lys Asp Leu Lys Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Asn Leu Phe Ser Tyr Gly Asn Ala 130 135 140 Asn Ile Gly Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Phe Asn Gln Val Lys Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Asn Leu Pro Ala Ser Lys Ala Asn Gln Leu Ile Val Lys Glu Ala Ile 180 185 190 Val Thr Glu Ala Thr Pro Glu Tyr Ile Val His Ser Lys Thr Gly Tyr 195 200 205 Ser Gly Val Gly Thr Glu Ser Ser Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 44 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 44 atgaaaacat ttgccgcata tttagttctc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg tctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaaata agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggctagaagg tcagcttaga 480 atctcagcat tcaatcaagt taaattttta gagtcgctct acctgaataa tttgccagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 45 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 45 Met Lys Thr Phe Ala Ala Tyr Leu Val Leu Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Phe Asn Gln Val Lys Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Asn Leu Pro Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 46 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 46 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctagt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaaata agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 47 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 47 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 48 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 48 atgaaaacat tagccgcata tttagttcta gttttttatg caagcaccgc gctctcagag 60 tcaattacag aaaatttggc gtggaataaa gaattttcta gtgaatccgt acatggcgtt 120 tttgtacttt gtaaaagtag tagcaattcc tgtactacaa ataatgcggc acgtgcatct 180 acagcctata ttccagcatc aacattcaaa attcctaatg ctctaatagg tcttgaaacc 240 ggcgccataa aagatgaacg gcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttaaa gctaaggggc gctatacagg tttctgctgt tccggtattt 360 caacaaattg ccagagaagt tggcgaaata agaatgcaaa aataccttaa cctgttttca 420 tacggcaacg ccaatatagg gggaggcatt gacaaattct ggctagaagg tcagcttaga 480 atctcagcat tcaatcaagt taaattttta gagtcgctct acctgaataa attgtcagca 540 tcaaaagaaa accaactaat agtaaaagag gcaatagtta cagaagcaac tccagaatat 600 atagttcatt caaaaactgg tttttctggt gttggcacag aatcaagtcc tggtgtcgct 660 tggtgggttg gttgggtaga gaaaggaact gaggtttact tttttgcttt taacatggac 720 atagacaatg agagtaaatt gccgtcaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 49 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 49 Met Lys Thr Leu Ala Ala Tyr Leu Val Leu Val Phe Tyr Ala Ser Thr 1 5 10 15 Ala Leu Ser Glu Ser Ile Thr Glu Asn Leu Ala Trp Asn Lys Glu Phe 20 25 30 Ser Ser Glu Ser Val His Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Asn Ser Cys Thr Thr Asn Asn Ala Ala Arg Ala Ser Thr Ala Tyr Ile 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Leu Ile Gly Leu Glu Thr 65 70 75 80 Gly Ala Ile Lys Asp Glu Arg Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Lys Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Asn Leu Phe Ser Tyr Gly Asn Ala 130 135 140 Asn Ile Gly Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Phe Asn Gln Val Lys Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Ile 180 185 190 Val Thr Glu Ala Thr Pro Glu Tyr Ile Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Ser Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 50 <211> 801 <212> DNA <213> artificial <220> <223> hybrid <400> 50 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaagg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 51 <211> 266 <212> PRT <213> artificial <220> <223> hybrid <400> 51 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 52 <211> 1704 <212> DNA <213> artificial <220> <223> hybrid <400> 52 atgatgtctg ttgctactgt tgaaccacca aagccagaat tgtctccacc acaaaaccaa 60 aacgctccat cttctcacga aactgatcac attttcagat ctaagttgcc agatattact 120 atttctaacg atttgccatt gcacgcttac tgtttcgaaa acttgtctga tttctctgat 180 agaccatgtt tgatttctgg ttctactggt aagactttca cttacgctga tactcacttg 240 atttcttcta agattgctgc tggtttgtct aacttgggta ttttgaaggg tgatgttgtt 300 atgattttgt tgcaaaactc tgctgatttc gttttctctt tcttggctat ttctatgatt 360 ggtgctgttg ctactactgc ttctccattc tacactgctc cagaaatttt caagcaattc 420 actgtttcta aggaaaagtt ggttattact caagctatgt acgttgataa gttgagaaac 480 cacgatggtg ctaagttggg tgaagatttc attgttatta ctattgatga tccaccagaa 540 aactgtttgc acttcaacgt tttggttgaa gcttctgaat ctgaaatgcc aactgtttct 600 attttgccag atgatccagt tgctttgcca ttctcttctg gtactactgg tttgccaaag 660 ggtgttattt tgactcacaa gtctttgatt acttctgttg ctcaacaagt tgatggtgaa 720 attccaaact tgtacttgaa gcaagatgat gttgttttgt gtgttttgcc attgttccac 780 attttctctt tgaactctgt tttgttgtgt tctttgagag ctggttctgc tgttttgttg 840 atgcaaaagt tcgaaattgg ttctttgttg gaattgattc aaagacacag agtttctgtt 900 gctatggttg ttccaccatt ggttttggct ttggctaaga acccaatggt tgctgatttc 960 gatttgtctt ctattagatt ggttttgtct ggtgctgctc cattgggtaa ggaattggaa 1020 gaagctttga gaaacagaat gccacaagct gttttgggtc aaggttacgg tatgactgaa 1080 gctggtccag ttttgtctat gtgtttggct ttcgctaagc aaccattcca aactaagtct 1140 ggttcttgtg gtactgttgt tagaaacgct gaattgaagg ttgttgatcc agaaactggt 1200 agatctttgg gttacaacca accaggtgaa atttgtatta gaggtcaaca aattatgaag 1260 ggttacttga acgatgaagc tgctactgct tctactattg attctgaagg ttggttgcac 1320 actggtgatg ttggttacgt tgatgatgat gatgaaattt tcattgttga tagagttaag 1380 gaaattatta agttcaaggg tttccaagtt ccaccagctg aattggaagc tttgttggtt 1440 aaccacccat ctattgctga tgctgctgtt gttccacaaa aggatgaagt tgctggtgaa 1500 gttccagttg ctttcgttgt tagatctgat gatttggatt tgtctgaaga agctgttaag 1560 gaatacattg ctaagcaagt tgttttctac aagaagttgc acaaggtttt cttcgttcac 1620 tctattccaa agtctgcttc tggtaagatt ttgagaaagg atttgagagc taagttggct 1680 actgctacta ctcaaactcc ataa 1704 <210> 53 <211> 1518 <212> DNA <213> artificial <220> <223> hybrid <400> 53 atggatttgt tgttgttgga aaaggctttg atgggtttgt tcttggctgc tgttgttgct 60 attgctgttt ctactttgag aggtaagaag ttgaagttgc caccaggtcc aattccagtt 120 ccagttttcg gtaactggtt gcaagttggt gatgatttga accaaagaaa cttggttgat 180 tacgctaaga agttcggtga tttgttcatg ttgagaatgg gtcaaagaaa cttggttgtt 240 gtttcttctc cagaattggc taaggaagtt ttgcacactc aaggtgttga attcggttct 300 agaactagaa acgttgtttt cgatattttc actggtaagg gtcaagatat ggttttcact 360 gtttacggtg aacactggag aaagatgaga agaattatga ctgttccatt cttcactaac 420 aaggttgttc aacaatacag acacggttgg gaatctgaag ctgctgctgt tgttgaagat 480 gttaagaaga acccagatgc tgctactact ggtactgtta tgagaagaag attgcaattg 540 atgatgtaca acaacatgta cagaattatg ttcgatagaa gattcgaatc tgatgaagat 600 ccaatgttct tgagattgaa agctttgaac ggtgaaagat ctagattggc tcaatctttc 660 gaatacaact acggtgattt cattccaatt ttgagaccat tcttgaaggg ttacttgaag 720 atttgtaagg aagttaagga aactagattg aagttgttca aggattactt cgttgatgaa 780 agaaagaagt tggaatctac taagtctgct gacaacaact ctttgaagtg tgctattgat 840 cacattattg aagctcaaag aaagggtgaa attaacgaag ataacgtttt gtacattgtt 900 gaaaacatta acgttgctgc tattgaaact actttgtggt ctattgaatg gggtattgct 960 gaattggtta accacccaga aattcaacaa aagttgagag atgaaattga tagagttttg 1020 ggtgctggtc accaagttac tgaaccagat attcaaaagt tgccatactt gcaagctgtt 1080 gttaaggaaa ctttgagatt cagaatggct attccattgt tggttccaca catgaacttg 1140 cacgatgcta agttgggtgg ttacgatatt ccagctgaat ctaagatttt ggttaacgct 1200 tggtggttgg ctaacaaccc agctcactgg aacaagccag aagaattcag accagaaaga 1260 ttcttggaag aagaatctaa ggttgaagct aacggtaacg atttcaaata cattccattc 1320 ggtgttggta gaagatcttg tccaggtatt attttggctt tgccaatttt gggtattgct 1380 atgggtagat tggttcaaaa cttcgaattg ttgccaccac caggtcaatc tcaaattgat 1440 acttctgaaa agggtggtca attctctttg cacattttga agcactctac tattgtttgt 1500 aagccaagat ctttgtaa 1518 <210> 54 <211> 705 <212> DNA <213> artificial <220> <223> hybrid <400> 54 atggctttcc catctgttac ttctgttact gttgaaaacg ttactttccc accaactgtt 60 aagccaccat gttctccaaa cactttcttc ttggctggtg ctggtgttag aggtttgcaa 120 attcaccacg ctttcgttaa gttcactgct atttgtattt acttgcaata cgatgctttg 180 tctttcttgt ctgttaagtg gaagactaag tctactcacc aattgactga atctgatcaa 240 ttcttctctg atattgttac tggtccattc gaaaagttca tgcaagttac tatgattttg 300 ccattgactg gtcaacaata ctctgaaaag gttgctgaaa actgtgttgc tatttggaga 360 tctttgggta tttacactga ttctgaagct gaagctattg ataagttctt gtctgttttc 420 aaggatttga ctttcccacc aggtgcttct attttgttca ctacttctcc agatggttct 480 ttgactattt ctttctctaa ggatggtatg attccagaag ctgctaacat tgttttggaa 540 aacgaaaagt tggctcaagc tgttattgaa tctgttattg gtaagaacgg tgtttctcca 600 gctactaagc aatctttggc ttctagattg tctgatttga tgaaccactt cgatgaaaag 660 gctactactg atgctgaacc aaacttgtct aagaacggtt tgtaa 705 <210> 55 <211> 1170 <212> DNA <213> artificial <220> <223> hybrid <400> 55 atggttactg ttgaagaagt tagaaaggct caaagagctg aaggtccagc tactgttatg 60 gctattggta ctgctactcc accaaactgt gttgatcaat ctacttaccc agattactac 120 ttcagaatta ctaactctga acacaagact gaattgaagg aaaagttcca gagaatgtgt 180 gaaaagtcta tgattaagaa gagatacatg cacttgactg aagaaatttt gaaggaaaac 240 ccaaacatgt gtgaatacat ggctccatct ttggatgcta gacaagatat tgttgttgtt 300 gaagttccaa agttgggtaa ggaagctgct caaaaggcta ttaaggaatg gggtcaacca 360 aagtctaaga ttactcactt ggttttctgt actacttctg gtgttgatat gccaggttgt 420 gattaccaat tgactaagtt gttgggtttg agaccatctg ttaagagatt gatgatgtac 480 caacaaggtt gtttcgctgg tggtactgtt ttgagattgg ctaaggattt ggctgaaaac 540 aacaagggtg ctagagtttt ggttgtttgt tctgaaatta ctgctgttac tttcagaggt 600 ccaaacgata ctcacttgga ttctttggtt ggtcaagctt tgttcggtga tggtgctgct 660 gctattatta ttggttctga tccaattcca ggtgttgaaa gaccattgtt cgaattggtt 720 tctgctgctc aaactatttt gccagattct gaaggtgcta ttgatggtca cttgagagaa 780 gttggtttga ctttccactt gttgaaggat gttccaggtt tgatttctaa gaacattgaa 840 aagtctttgg aagaagcttt caagccattg ggtatttctg attggaactc tttgttctgg 900 attgctcacc caggtggtcc agctattttg gatcaagttg aaattaagtt gggtttgaag 960 ccagaaaagt tgagagctac tagacacgtt ttgtctgaat acggtaacat gtcttctgct 1020 tgtgttttgt tcattttgga tgaaatgaga agaaagtcta aggaagatgg tttgaagact 1080 actggtgaag gtattgaatg gggtgttttg ttcggtttcg gtccaggttt gactgttgaa 1140 actgttgttt tgcactctgt tgctacttaa 1170 <210> 56 <211> 1131 <212> DNA <213> artificial <220> <223> hybrid <400> 56 atggctccaa ctgctaagac tttgacttac ttggctcaag aaaagacttt ggaatcttct 60 ttcgttagag atgaagaaga aagaccaaag gttgcttaca acgaattctc tgatgaaatt 120 ccagttattt ctttggctgg tattgatgaa gttgatggta gaagaagaga aatttgtgaa 180 aagattgttg aagcttgtga aaactggggt attttccaag ttgttgatca cggtgttgat 240 gctgatttga ttgctgatat gactagattg gctagagaat tcttcgcttt gccagctgaa 300 gataagttga gatacgatat gtctggtggt aagaagggtg gtttcattgt ttcttctcac 360 ttgcaaggtg aagctgttca agattggaga gaaattgtta cttacttctc ttacccagtt 420 aaggctagag attacggtag atggccagaa aagccagctg gttggtgtgc tgttgttgaa 480 agatactctg aaagattgat gggtttgtct tgtaacttga tgggtgtttt gtctgaagct 540 atgggtttgg aaactgaagc tttggctaag gcttgtgttg atatggatca aaaggttgtt 600 gttaacttct acccaagatg tccacaacca gatttgactt tgggtttgaa gagacacact 660 gatccaggta ctattacttt gttgttgcaa gatttggttg gtggtttgca agctactaga 720 gatggtggta agaactggat tactgttcaa ccaatttctg gtgctttcgt tgttaacttg 780 ggtgatcacg gtcacttcat gtctaacggt agattcaaga acgctgatca ccaagctgtt 840 gttaacggtg aatcttctag attgtctatt gctactttcc aaaacccagc tccagatgct 900 agagtttggc cattggctgt tagagaaggt gaagaaccaa ttttggaaga accaattact 960 ttcactgaaa tgtacagaag aaagatggaa agagatttgg atttggctaa gagaaagaag 1020 caagctaagg atcaattgat gcaacaacaa ttgcaattgc aacaacaaca agctgttgct 1080 gctgctccaa tgccaactgc tactaagcca ttgaacgaaa ttttggctta a 1131 <210> 57 <211> 1011 <212> DNA <213> artificial <220> <223> hybrid <400> 57 atgggtgttg aaagagttca agatattgct tctactattt ctgaagatac tattccagct 60 gaatacatta gatctgaaaa cgaacaacca ggtattacta ctgttccaaa cactgttttg 120 gaatgtccaa ctattgattt ctctgatcca gatgaagaaa agttgttgaa gcaaattttc 180 gaagcttcta ttgattgggg tatgtaccaa attgttaacc acgatatttc taacgaagct 240 atttctaagt tgcaagctgt tggtaaggaa ttcttcgaag aattgccaca agaagaaaag 300 gaagtttacg ctaaggatcc aaactctaag tctgttgaag gttacggtac tttcttgcaa 360 aaggaatttg aaggtaagaa gggttgggtt gatcacttgt tccacaagat ttggccacca 420 tctgctatta actacagatt ctggccaaag aacccaccat cttacagaga agctaacgaa 480 gaatacgcta agtggttgag aaaggttgtt gatgagttgt tcaagttgtt gtctttgggt 540 ttgggtttgg aagctcaaga aatgaagaag gctgctggtg ctgatgattt tgtttacttg 600 ttgaagatta actactaccc accatgtcca agaccagatt tggctttggg tgttgttgct 660 cacactgata tgtcttacat tactttgttg gttccaaacg aagttcaagg tttgcaagtt 720 ttcaaggatg gtcactggta cgatgttaac tacattccaa acgctattat tgttcacatt 780 ggtgatcaag ttgaaatttt gtctaacggt aagtacaagt ctgtttacca cagaactact 840 gttaacaagt acaagactag aatgtcttgg ccagttttct tggaaccatc ttctgaacac 900 gaagttggtc caattccaaa gttgattaac gataaggaaa acccaccaga gttcaagact 960 aagaagtaca aggattacgt ttactgtaag ttgaacaagt tgccacaata a 1011 <210> 58 <211> 2148 <212> DNA <213> artificial <220> <223> hybrid <400> 58 atggaaactg ttactaagaa cggttaccaa aacggtaacg gttggaattt gtgtatgaag 60 aaggaagatc cattgaactg gggtgttgct gctgaagctt tgactggttc tcacttggat 120 gaagttaaga gaatggttgc tgaatacaga aagccagttg ttaagttgga aggtgaaact 180 ttgactattt ctcaagttgc tgctatttct gctagagatg attctggtgt taaggttgaa 240 ttgtctgaag aagctagagc tggtgttaag gcttcttctg attgggttat ggattctatg 300 aacaagggta ctgattctta cggtgttact actggtttcg gtgctacttc tcacagaaga 360 actaagcaag gtggtgcttt gcaaaaggaa ttgattagat tcttgaacgc tggtattttc 420 ggtaacggta ctgaaacttg tcacactttg ccacactctg ctactagagc tgctatgttg 480 gttagaatta acactttgtt gcaaggttac tctggtatta gattcgaaat tttggaagct 540 attactaagt tcttgaacca caacattact ccatgtttgc cattgagagg tactattact 600 gcttctggtg atttggttcc attgtcttac attgctggtt tgttgactgg tagaccaaac 660 tctaaggctg ttggtccaac tggtgttact ttgtctccag aagaagcttt caagttggct 720 ggtgttgaag gtggtttctt cgaattgcaa ccaaaggaag gtttggcttt ggttaacggt 780 actgctgttg gttctggtat ggcttctatg gttttgttcg aagctaacat tttggctgtt 840 ttggctgaag ttatgtctgc tattttcgct gaagttatgc aaggtaagcc agaattcact 900 gatcacttga ctcacaagtt gaagcaccac ccaggtcaaa ttgaagctgc tgctattatg 960 gaacacattt tggatggttc tgcttacgtt aaggctgctc aaaagttgca cgaaatggat 1020 ccattgcaaa agccaaagca agatagatac gctttgagaa cttctccaca atggttgggt 1080 ccacaaattg aagttattag atcttctact aagatgattg aaagagaaat taactctgtt 1140 aacgataacc cattgattga tgtttctaga aacaaggcta ttcacggtgg taacttccaa 1200 ggttctccaa ttggtgtttc tatggataac actagattgg ctattgctgc tattggtaag 1260 ttgatgttcg ctcaattctc tgaattggtt aacgatttct acaacaacgg tttgccatct 1320 aacttgtctg gtggtagaaa cccatctttg gattacggtt tcaagggtgc tgaaattgct 1380 atggcttctt actgttctga attgcaattc ttggctaacc cagttactaa ccacgttcaa 1440 tctgctgaac aacacaacca agatgttaac tctttgggtt tgatttcttc tagaaagact 1500 tctgaagctg ttgaaatttt gaagttgatg tctactactt tcttggttgg tttgtgtcaa 1560 gctattgatt tgagacactt ggaagaaaac ttgaagtcta ctgttaagaa cactgtttct 1620 caagttgcta agagagtttt gactatgggt gttaacggtg aattgcaccc atctagattc 1680 tgtgaaaagg atttgttgag agttgttgat agagaataca ttttcgctta cattgatgat 1740 ccatgttctg ctacttaccc attgatgcaa aagttgagag aaactttggt tgaacacgct 1800 ttgaacaacg gtgaaaacga aaagaacttc tctacttctg ttttccaaaa gattgctgct 1860 ttcgaagatg aattgaaggc tttgttgcca aaggaagttg aaactgctag agctgctttg 1920 gaatctggta acccagctat tccaaacaga attaaggaat gtagatctta cccattgtac 1980 aagttcgtta gagaagaatt gggtactgaa tacttgactg gtgaaaaggt tagatctcca 2040 ggtgaagaat tcgaaaaggt tttcactgct atgtctaagg gtgaaattat tgatccattg 2100 ttggaatgtt tggaatcttg gaacggtgct ccattgccaa tttgttaa 2148 <210> 59 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 59 ctgtgctgtc tgcgctgcat tc 22 <210> 60 <211> 23 <212> DNA <213> artificial <220> <223> primer <400> 60 ttacttgtga gattgtggat cac 23 <210> 61 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 61 atggctttcc catctgttac t 21 <210> 62 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 62 atggctccaa ctgctaagac t 21 <210> 63 <211> 23 <212> DNA <213> artificial <220> <223> primer <400> 63 ttaagccaaa atttccttca atg 23 <210> 64 <211> 23 <212> DNA <213> artificial <220> <223> primer <400> 64 ttaacaaatt ggcaatggag aac 23 <210> 65 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 65 atggaaactg ttactaagaa cggt 24 <210> 66 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 66 ttaagtagca acagagtgca aa 22 <210> 67 <211> 25 <212> DNA <213> artificial <220> <223> primer <400> 67 atggttactg ttgaagaata cagaa 25 <210> 68 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 68 ttagaaagat cttggcttag caac 24 <210> 69 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 69 atggatttgt tgttgttgga aa 22 <210> 70 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 70 ttattgtggc aacttgttca ac 22 <210> 71 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 71 atgaagacta ttcaaggtca atct 24 <210> 72 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 72 ttatggagtt tgagtagcag c 21 <210> 73 <211> 23 <212> DNA <213> artificial <220> <223> primer <400> 73 atgattactt tggctccatc ttt 23 <210> 74 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 74 gcgcatgtgt ccgatctttg 20 <210> 75 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 75 atggctttcc catctgttac t 21 <210> 76 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 76 atggctccaa ctgctaagac t 21 <210> 77 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 77 atggaaactg ttactaagaa cggt 24 <210> 78 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 78 ttaagtagca acagagtgca aa 22 <210> 79 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 79 atggatttgt tgttgttgga aa 22 <210> 80 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 80 ttattgtggc aacttgttca ac 22 <210> 81 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 81 atgaagacta ttcaaggtca atct 24 <210> 82 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 82 ttatggagtt tgagtagcag c 21 <210> 83 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 83 caccagcgct ctagatacat 20 <210> 84 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 84 tgtgttaccg atatcggcga at 22 <210> 85 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 85 tcattaccgc ttccaagtct a 21 <210> 86 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 86 acgcagaatt ttcgagttat ta 22 <210> 87 <211> 23 <212> DNA <213> artificial <220> <223> primer <400> 87 agaagtgtca acaacgtatc tac 23 <210> 88 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 88 ggtggtaatg ccatgtaata tgat 24 <210> 89 <211> 25 <212> DNA <213> artificial <220> <223> primer <400> 89 ttcggtttgt attacttctt attca 25 <210> 90 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 90 tacatgcgta cacgcgtctg ta 22 <210> 91 <211> 23 <212> DNA <213> artificial <220> <223> primer <400> 91 ccaattggtt caagtctcca aat 23 <210> 92 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 92 acgcagaatt ttcgagttat ta 22 <210> 93 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 93 ctactgccta gcatcttgct aa 22 <210> 94 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 94 aatagggacc tagacttcag 20 <210> 95 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 95 acgcacacta ctctctaatg 20 <210> 96 <211> 24 <212> DNA <213> artificial <220> <223> primer <400> 96 cccttacaag aacattcacg aaat 24 <210> 97 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 97 agacggtagg tattgattgt a 21 <210> 98 <211> 22 <212> DNA <213> artificial <220> <223> primer <400> 98 cgacctcatg ctatacctga ga 22 <210> 99 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 99 ctacttcgag cggaggcatc 20 <210> 100 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 100 tcattgcctt ctccactctc 20

Claims (24)

  1. a) 단일 단계 과정으로 (i) 세포 게놈의 통합 부분(integral part)이거나 유전 작제물의 골격내 존재하는 재조합될 다른 유전자에 대해 상동성이 99.5% 미만인 서열을 갖는 적어도 하나의 유전자 A를 사용하여 세포를 형질전환시키고, (ii) 상기 유전자를 재조합시키며, (iii) 표적 게놈의 통합 부위에서 유전자들의 유전자 모자이크를 생성하며, 여기서, 상기 적어도 하나의 유전자 A는 상기 통합 부위의 5' 또는 3' 말단에 고정되는 5' 말단 또는 3' 말단에서의 단일의 플랭킹 표적 서열(flanking target sequence)을 갖고, (iv) 상기 물질대사 경로의 궁극적인(eventual) 추가의 유전자를 재조합하는 단계, 및
    b) 상기 유전자 모자이크와, 상기 변이체를 발현할 수 있는 상기 궁극적인 추가의 유전자를 포함하는 클론을 선택하는 단계를 포함하는, 적어도 하나의 유전자 A의 유전자 모자이크를 사용하는 상기 물질대사 경로의 체세포 생체내(in vivo) 조립 및 재조합에 의한, 상기 물질대사 경로의 천연의 소 방향족 분자 생성물(natural small aromatic molecule product)의 변이체의 물질대사적 발달(metabolic evolution)을 위한 방법.
  2. 제1항에 있어서, 상기 다른 유전자가 세포의 게놈의 일부분인 방법.
  3. 제1항 또는 제2항에 있어서, 세포가 적어도 하나의 유전자 A 및 적어도 하나의 유전자 B로 공동-형질전환(co-transforming)되며, 여기서 상기 유전자 A의 단일의 플랭킹 표적 서열은 상기 표적 게놈 상의 통합 부위의 5' 말단에 고정되며, 여기서 유전자 B는 통합 부위의 3' 말단에 고정되는 단일의 플랭킹 표적 서열에 연결되는 방법.
  4. 제1항 내지 제3항 중의 어느 한 항에 있어서, 세포가 적어도 2개의 상이한 유전자 A1 및 A2 및, 임의로 적어도 2개의 상이한 유전자 B1 및 B2로 공동-형질전환되는 방법.
  5. 제1항 내지 제4항 중의 어느 한 항에 있어서, 적어도 하나의 추가의 유전자 C가 공동-형질전환되며, 당해 유전자 C는 유전자 A 및/또는 상기 다른 유전자의 서열과 하이브리드화하는 서열을 가져서 유전자 A 및/또는 상기 다른 유전자에 대한 상기 추가의 유전자 C의 조립체를 수득하는 방법.
  6. 제1항 내지 제5항 중의 어느 한 항에 있어서, 상기 유전자 A 및/또는 상기 다른 유전자가 비-암호화 서열(non-coding sequence)이거나 활성을 갖는 폴리펩타이드 또는 폴리펩타이드의 일부분을 암호화하는 서열인 방법.
  7. 제1항 내지 제6항 중의 어느 한 항에 있어서, 상기 물질대사 경로의 적어도 2개의 유전자가 재조합되고 조립되는 방법.
  8. 제7항에 있어서, 상기 유전자가 바람직하게는 300 내지 20,000bp의 선형 폴리뉴클레오타이드인 방법.
  9. 제1항 내지 제8항 중의 어느 한 항에 있어서, 바람직하게는 700bp당 적어도 3개의 교차 현상(crossover event)을 갖는, 적어도 3 내지 20,000개 염기 쌍의 유전자 모자이크가 수득되는 방법.
  10. 제1항 내지 제9항 중의 어느 한 항에 있어서, 세포가 DNA 복구 결함성 세포인 방법.
  11. 제1항 내지 제10항 중의 어느 한 항에 있어서, 세포가 진핵 세포, 바람직하게는 진균, 포유동물 또는 식물 세포, 또는 원핵 세포인 방법.
  12. 제1항 내지 제11항 중의 어느 한 항에 있어서, 천연의 소 방향족 분자가 페닐프로파노이드, 플라보노이드, 플라보놀, 안토시아닌, 리그닌, 시아니딘, 챨콘(chalcone), 바닐린, 및 천연적으로 존재하는 이의 유도체로 이루어진 그룹 중에서 선택되는 방법.
  13. 제1항 내지 제12항 중의 어느 한 항에 있어서, 상기 변이체가 재조합 효소 변이체에 의해 합성되는 방법.
  14. a) 단일 단계 과정으로 (i) 세포 게놈의 통합 부분이거나 유전자 작제물의 골격내에 존재하는 재조합될 다른 유전자에 대해 서열 상동성이 99.5% 미만인 적어도 하나의 유전자 A를 이용하여 세포를 형질전환시키고, (ii) 상기 유전자를 재조합시키며, (iii) 표적 게놈의 통합 부위에서 유전자들의 유전자 모자이크를 생성하며, 여기서, 상기 적어도 하나의 유전자 A는 상기 통합 부위의 5' 또는 3' 말단에 고정되는 5' 말단 또는 3' 말단에서의 단일의 플랭킹 표적 서열을 갖고, (iv) 상기 물질대사 경로의 궁극적인 추가의 유전자들을 재조합하는 단계, 및
    b) 유전자 모자이크 및 상기 궁극적인 추가의 유전자를 포함하는 클론을 수집하여 상기 변이체를 생산할 수 있는 라이브러리를 수득하는 단계를 포함하여, 적어도 하나의 유전자 A의 유전자 모자이크를 사용하여 물질대사 경로를 체세포 생체내 조립 및 재조합함으로써 재조합 세포를 가공함을 포함하는, 물질대사 경로의 천연의 소 방향족 분자 생성물의 변이체를 생산하는 세포의 라이브러리를 제조하는 방법.
  15. 상기 변이체를 생산하는 적어도 103 개의 상이한 클론을 포함하는, 제14항의 방법에 의해 수득된 라이브러리(library).
  16. 제15항에 있어서, 물질대사 경로의 레퍼토리(repertoire)를 암호화하는 재조합 유전자를 포함하는 세포의 라이브러리인 라이브러리.
  17. 제15항 또는 제16항에 있어서, 합성 효소의 레퍼토리를 암호화하는 재조합 유전자를 포함하는 세포의 라이브러리인 라이브러리.
  18. 제15항 내지 제17항 중의 어느 한 항의 라이브러리로부터 수득가능한 합성 재조합 효소의 라이브러리.
  19. 제15항 내지 제18항 중의 어느 한 항의 라이브러리로부터의 유전자 변이체를 포함하는 유기체.
  20. 제15항 내지 제18항 중의 어느 한 항의 라이브러리로부터의 천연의 소 방향족 분자의 변이체를 선택하는 방법.
  21. 제20항에 있어서, 상기 변이체의 구조 및 기능을 결정함을 추가로 포함하는 방법.
  22. 제20항 또는 제21항에 있어서, 상기 변이체를 재조합 숙주에서 생산함을 추가로 포함하는 방법.
  23. 제20항 또는 제21항에 있어서, 상기 변이체를 합성적으로 생산함을 추가로 포함하는 방법.
  24. 제20항 내지 제23항 중의 어느 한 항에 있어서, 상기 변이체가 항생제, 항산화 활성의 그룹 중에서 선택된 생물학적 활성을 갖거나 또는 향수 및 향미료로서의 페닐프로파노이드인 방법.
KR1020147000219A 2011-06-21 2012-06-20 물질대사적 발달의 방법 KR20140048929A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161499535P 2011-06-21 2011-06-21
US61/499,535 2011-06-21
PCT/EP2012/061877 WO2012175570A1 (en) 2011-06-21 2012-06-20 Method of metabolic evolution

Publications (1)

Publication Number Publication Date
KR20140048929A true KR20140048929A (ko) 2014-04-24

Family

ID=46397212

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147000219A KR20140048929A (ko) 2011-06-21 2012-06-20 물질대사적 발달의 방법

Country Status (9)

Country Link
US (1) US20140200145A1 (ko)
EP (1) EP2723860A1 (ko)
JP (1) JP2014519831A (ko)
KR (1) KR20140048929A (ko)
CN (1) CN103764828A (ko)
AU (1) AU2012274098A1 (ko)
BR (1) BR112013032467A2 (ko)
CA (1) CA2839074A1 (ko)
WO (1) WO2012175570A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104593403A (zh) * 2015-01-28 2015-05-06 南京工业大学 一种合成匹诺塞林的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2641793B1 (fr) 1988-12-26 1993-10-01 Setratech Procede de recombinaison in vivo de sequences d'adn presentant des mesappariements de bases
US7750211B2 (en) * 2002-09-10 2010-07-06 The Samuel Roberts Noble Foundation Methods and compositions for production of flavonoid and isoflavonoid nutraceuticals
JP4874124B2 (ja) 2004-01-30 2012-02-15 ミクシス フランス ソシエテ アノニム サッカロマイセス・セレビジエにおける組換え遺伝子の産生
WO2006010117A2 (en) * 2004-07-10 2006-01-26 The Research Foundation Of State University Of New York Production of flavonoids by recombinant microorganisms
EP1734125A1 (en) * 2005-06-16 2006-12-20 Institut National De La Recherche Agronomique Homeologous recombination in MSH2 inactivated plants or cells thereof
EP2478100B1 (en) * 2010-04-09 2013-11-13 Eviagenics S.A. Method of generating gene mosaics

Also Published As

Publication number Publication date
US20140200145A1 (en) 2014-07-17
BR112013032467A2 (pt) 2019-09-24
AU2012274098A1 (en) 2014-01-09
JP2014519831A (ja) 2014-08-21
WO2012175570A1 (en) 2012-12-27
CA2839074A1 (en) 2012-12-27
CN103764828A (zh) 2014-04-30
EP2723860A1 (en) 2014-04-30

Similar Documents

Publication Publication Date Title
Rajkumar et al. Biological parts for Kluyveromyces marxianus synthetic biology
KR102209636B1 (ko) Crispr 이용의 다중화된 게놈 조작
Otten et al. Directed evolution: selecting today's biocatalysts
CN107278227A (zh) 用于体外病毒基因组工程的组合物和方法
CN105283547A (zh) 用于生物合成生产的重组宿主细胞
PT2970934T (pt) Polipèptidos de valenceno sintase, moléculas de ácido nucleico que os codificam e suas utilizações
EP1366176A2 (fr) Genes synthetiques et plasmides bacteriens depourvus de cpg
Baek et al. The yeast platform engineered for synthetic gRNA-landing pads enables multiple gene integrations by a single gRNA/Cas9 system
JP2022501025A (ja) 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体
Narcross et al. Mining enzyme diversity of transcriptome libraries through DNA synthesis for benzylisoquinoline alkaloid pathway optimization in yeast
US8912127B2 (en) Method of generating gene mosaics
CN107058285A (zh) 修饰肽的展示
KR20140048929A (ko) 물질대사적 발달의 방법
US20140274803A1 (en) Method of generating gene mosaics in eukaryotic cells
Luque et al. In vivo evolution of metabolic pathways by homeologous recombination in mitotic cells
CN109477062A (zh) 改良的用于生产丙酸的丙酸杆菌菌株
KR20060126570A (ko) 2개의 염색체외 인자의 사용에 의한 원핵 세포에서 재조합유전자의 발생
Yan et al. Construction of Yeast One-Hybird Library for Screening of Eugenol Synthase Gene Bait vectors in Rosa chinensis
Tamošiūnas et al. Yeast-based system for in vivo evaluation of alleles of the anthocyanin production pathway
KR20230123366A (ko) 신규 합성 프로모터 및 이를 이용한 답토마이신의 생산 방법
Diaz Heterologous Expression of Biosynthetic Gene Clusters from Marine Cyanobacteria
JP2001231577A (ja) 染色体組込み用dna断片、ベクター及びそれらを用いた染色体への遺伝子導入方法
JP2005204595A (ja) ユビキノン生合成に関与する新規遺伝子及びユビキノン生合成欠損株並びにその製造方法
JP2003520024A (ja) 天然サンプルから高分子量dnaを単離するための方法および組成物

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid