KR20210038923A - 개선된 트랜스아미나제 단백질을 코딩하는 핵산 - Google Patents

개선된 트랜스아미나제 단백질을 코딩하는 핵산 Download PDF

Info

Publication number
KR20210038923A
KR20210038923A KR1020217005614A KR20217005614A KR20210038923A KR 20210038923 A KR20210038923 A KR 20210038923A KR 1020217005614 A KR1020217005614 A KR 1020217005614A KR 20217005614 A KR20217005614 A KR 20217005614A KR 20210038923 A KR20210038923 A KR 20210038923A
Authority
KR
South Korea
Prior art keywords
amino acid
seq
different
nucleotide
sequence
Prior art date
Application number
KR1020217005614A
Other languages
English (en)
Inventor
안드레아스 칼 슈타이프
울리케 켈러
모리츠 쇤
크세니아 니젤
마크 제임스 포드
니나 보올케
올리버 켄슈
자스키아 풍크
신디 슐렌부르크
웨인 코코
크리스티나 티스
니콜라우스 파블로브스키
Original Assignee
바이엘 악티엔게젤샤프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이엘 악티엔게젤샤프트 filed Critical 바이엘 악티엔게젤샤프트
Publication of KR20210038923A publication Critical patent/KR20210038923A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/22Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P41/00Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P9/00Preparation of organic compounds containing a metal or atom other than H, N, C, O, S or halogen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01018Beta-alanine-pyruvate transaminase (2.6.1.18)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 개선된 오메가-트랜스아미나제 (ω-TA) 활성을 갖는 단백질, 개선된 ω-TA 활성을 갖는 각각의 단백질을 코딩하는 핵산 분자, 및 키랄 아민 및 아미노산의 입체 선택적 합성을 위한 또는 거울상이성질체 혼합물에서 키랄 아민 이성질체를 증가시키기 위한 방법에 관한 것이다.

Description

개선된 트랜스아미나제 단백질을 코딩하는 핵산
본 발명은 개선된 오메가-트랜스아미나제 (ω-TA) 활성을 갖는 단백질, 개선된 ω-TA 활성을 갖는 각각의 단백질을 코딩하는 핵산 분자, 및 키랄 아민 및 아미노산의 입체 선택적 합성을 위한 또는 거울상이성질체 혼합물에서 키랄 아민 이성질체를 증가시키기 위한 방법에 관한 것이다.
생체촉매반응은 천연에서 이용가능한 효소를 기반으로 할 수 있다. 특정 생성물을 생산하려는 욕구는 특정 효소에 대한 수요를 더욱 자주 생성하며, 이는 원하는 생성물을 대규모로 경제적으로 실현가능하게 생성하도록 적합화된다. 효소 공학은 주어진 생성물의 경제적인 생산을 위해 효소를 최적화하는 한 가지 옵션이다.
아민 및 아미노산은 단백질 및 핵산의 일부로서 천연에서 보편적일 뿐만 아니라, 신경전달물질 (예를 들어 아드레날린 및 히스타민)로서, 조효소의 전구체 (예를 들어 조효소 A의 시스테아민)로서 또는 복합 지질의 전구체 (예를 들어 포스파티딜에탄올아민의 에탄올아민)로서 매우 중요하다. 특히, 약학적으로 알칼로이드로 분류된 고도로 치환된 아민은 매우 다양한 구조 뿐만 아니라, 다양한 형태의 생명체에서 발견되는 생물학적 효과를 나타낸다. 아민의 생물학적 활성, 예컨대 항생제, 진통제 또는 신경독성 활성은 의약품으로서 그들의 잠재성을 높이고, 따라서 이들이 신약에 대한 조사에서 매우 유망한 후보가 되게 한다. 키랄 아민의 입체 중심의 절대 배위는 생체분자와의 상호작용에서, 따라서 생물학적 시스템에 대한 효과의 유형에서 결정적이다. 원하는 표적 분자의 생성을 위해, 정확한 키랄성의 생성은 종종 어려운 일이다. (Schaetzle, 2011, Inaugural Dissertation, Ernst-Moritz-Arndt-University of Greifswald, Germany, "Identification, characterization and application of novel (R)-selective amine transaminases").
제약 회사에서 진행 중인 여러 활성 화합물은 키랄이다. 광학 활성 아민은 여러 활성 제약학적 및 농업적 생성물의 합성을 위한 화합물의 중요한 부류에 속한다. 예를 들어 L-페닐알라닌은 동물 사료에서 중요한 첨가제이다. 거울상이성질체적으로 순수한 아미노산의 화학적 합성을 위해 상업적으로 실행가능한 공정이 없다. 그럼에도 불구하고, 일부 경우에 생체촉매 과정에 의해 라세미 혼합물을 순수한 이성질체로 분할하는 것이 가능하기 때문에, 라세미 아미노산의 화학적 합성은 여전히 중요하다. (Breuer et al., 2004, Angewandte Chemie International Edition 43, 788-824)
아민 트랜스아미나제 또는 ω-트랜스아미나제 (ω-TA)는 키랄 1급 아민의 생성에 매우 중요한 생체촉매이다. ω-TA는 보조인자로서 피리독살-5'-포스페이트 (PLP)를 사용하여 아미노 기를 아미노 공여자로부터 카르보닐 모이어티에 전달하는 것을 촉매한다. 이에 따라, 반응 혼합물은 2가지 아민 (아미노 공여자 및 생성물) 및 2가지 카르보닐 화합물 (케톤 기질 및 부산물)로 이루어진다. (S)-선택적 및 (R)-선택적 트랜스아미나제 둘 다 발견되었고, 지금까지 잘 설명되어 있다. 효소는 고도로 입체 선택적이어서, 직접적인 비대칭 아미노화에 대해 큰 잠재성을 가지며, 키랄 아민은 저렴한 아미노 공여자를 사용하여 비키랄 케톤으로부터 직접적으로 높은 거울상이성질체 과량으로 생성된다. (Fesko et al., 2013, J. Molecular Catalysis B, Enzymatic 96, 103-110)
트랜스아미나제는 광범위한 키랄 아민 및 아미노산의 생체촉매성 합성에서 주목을 받아 왔다. 트랜스아미나제는 라세미 아미노산의 속도론적 분할에 (혼합물로부터 한 이성질체의 제거) 또는 상응하는 프로-키랄 케토-기질로부터 시작하는 비대칭 합성에 적용될 수 있다. 트랜스아미나제에 의해 촉매된 반응은 수용자의 환원성 아미노화와 함께 공여자의 산화성 탈아미노화에 의해 산화환원 반응으로 고려될 수 있다. (Rudat et al., 2012, AMB Express 2:11).
문헌 [Cann et al. (2012, Org. Process Res. Dev. 16, 1953-1966)]은 편두통 의약품의 생성을 위한 전구체인 α-아미노에스테르의 입체 선택적 생성을 위해 ω-트랜스아미나제의 성공적인 사용을 개시한다. 효소적 대 화학적 합성의 이점 및 단점이 논의된다.
US 4,950,606은 광학 활성 아민의 생성을 위한 과정을 기재한다. 이 과정에서, 바실루스 메가테리움(Bacillus megaterium) 및 슈도모나스 푸티다(Pseudomonas putida)로부터의 ω-트랜스아미나제는 아미노 공여자로부터 아미노 기의 거울상이성질체 선택적 전달에 의해 프로-키랄 케톤 또는 케토산을 아민으로 전환시킨다. 아민의 (R)- 및 (S)-배위가 수득될 수 있다.
문헌 [Park et al. (2013, Organic & Biomolecular Chemistry 11, 6929-6933)]은 아민 공여자로서 이소프로필아민 및 다양한 다른 화합물을 사용함으로써 케토산으로부터 비천연 아미노산의 거울상이성질체 선택적 합성에서 상이한 트랜스아미나제의 거동을 개시한다.
문헌 [Park et al. (2013, ChemCatChem 5, 1734-1738)]은 1 용기 반응에서 아미노 공여자로서 라세미 아릴알킬아민을 사용함으로써 프로-키랄 알킬 케톤의 열역학적으로 유리한 비대칭 아미노화를 위해 (R)- 또는 (S)-선택적 ω-트랜스아미나제를 사용할 수 있음을 입증한다. 상기 반응은 과량의 아미노 공여자의 첨가 또는 부산물의 제거를 필요로 하지 않는다.
아미노 공여자로서 2-프로필아민, 1-프로필아민 및 라세미-2-부틸아민을 사용하는 ω-트랜스아미나제 촉매된 반응이 아미노 공여자로서 알라닌이 사용된 반응과 비교하여 3배까지 더 높은 전환을 유도하는 것으로 입증되었다. 아미노산 β-알라닌 및 아스파라긴은 불량한 아미노 공여자였다. 방향족 잔기를 함유하는 일부 메틸 케톤의 경우, 과량의 2-부틸아민 또는 1-페닐에틸아민을 아미노 공여자로서 사용하였을 때, 광학적으로 순수한 아민이 높은 수율로 수득되었다. 평형을 이동시키기 위한 추가의 단계가 필요하였다. (Fesko et al., 2013, J. Molecular Catalysis B, Enzymatic 96, 103-110)
문헌 [Shin & Kim (2001, Biosci. Biotechno. Biochem. 65(8), 1782-1788)]은 아민 공여자로서 (S)-α-메틸벤질아민 ((S)-α-MBA), 1-메틸-3-페닐프로필-아민, 1-아미노테트랄린 또는 1-아미노인단을 비롯한 아릴 아민을 사용하여 ω-트랜스아미나제를 단리하는 것을 개시한다. 양호한 아미노 수용자는 케토산 피루베이트 및 글리옥실레이트 또는 알데히드 프로피온알데히드 및 부타르알데히드인 것으로 확인되었다.
US 6,133,018은 메톡시아세톤 및 비키랄 아미노 공여자 2-아미노프로판을 ω-트랜스아미나제와 접촉시킴으로써 (S)-1-메톡시-2-아미노프로판을 생성하는 것을 개시한다.
아미노 공여자로서 D-알라닌을 사용하여 D-아미노산 아미노트랜스퍼라제 (트랜스아미나제)에 의해 촉매된 케토산에서 각각의 D-아미노산으로의 전환에 의해 D-아미노산을 생성하는 4 효소 시스템이 문헌 [Galkin et al. (1997, J. Fermentation and Bioengeneering 83(3), 299-300)]에 기재되어 있다. 반응 평형을 D-아미노산 방향으로 유도하기 위해, 추가의 반응이 D-아미노산 아미노트랜스퍼라제에 커플링되었다. 피루베이트 및 암모니아는 NADH를 NAD로 환원시킴과 동시에 알라닌 데히드로게나제에 의해 L-알라닌으로 전환된다. L-알라닌은 알라닌 라세마제에 의해 D-알라닌으로 전환된다. NADH에서 NAD로의 재순환은 포르메이트 데히드로게나제에 의해 촉매되는 포름산으로부터 이산화탄소의 형성에 의해 확립된다. 피루베이트는 D-아미노산 아미노트랜스퍼라제 반응에 의해 알라닌으로부터 재순환된다. 글루타메이트, 류신, 노르류신 및 메티오닌의 D-거울상이성질체는 높은 수율로 생성될 수 있는 반면에, D-페닐알라닌 및 D-티로신은 낮은 수율로 합성되었고, D-노르발린은 30% 과량으로만 생성될 수 있었고, 아미노부티레이트는 라세미 혼합물로만 생성되었다.
WO 2010/089171 A2는 트랜스아미나제 활성을 갖는 효소에 의해 촉매되는 반응에서 적어도 1개의 케토 기를 포함하는 다중-시클릭 고리 시스템에서 적어도 1개의 케토 기를 아미노 기로 암모니아화시키는 방법을 개시한다.
WO 2015/195707 A1 (US2015361468 A1)은 트랜스제닉 박테리아에 의해 5개의 탄소 중합체 빌딩 블록을 생성하는 것을 개시한다. 박테리아 생합성 경로는 ω-트랜스아미나제를 비롯한 다중 효소의 도입에 의해 조작된다. ω-트랜스아미나제는 글루타레이트 세미-알데히드에서 5-아미노펜타노에이트로의 반응, 및 5-아미노펜타놀에서 5-옥소펜타놀, 카다베린에서 5-아미노펜탄알, N5-아세틸-1,5-디아미노펜탄에서 N5-아세틸-5-아미노펜탄알로의 역반응을 촉매하는 것으로 입증되었다. L-글루타메이트/2-옥소글루타레이트 또는 L-알라닌/피루베이트를 각각 아미노 공여자/수용자로서 사용하였다.
KR 20030072067은 L-선택적 방향족 아미노산 트랜스퍼라제 (트랜스아미나제)를 포함하는 호열성 바실루스 종 T30 균주의 단리, 및 높은 반응 온도에서 방향족 L-아미노산을 생성하여 케토산 기질의 용해도를 증가시키기 위해 생체촉매로서 이 균주의 용도를 개시한다.
문헌 [Koszelewski et al. (2010, ChemCat Chem 2(1), 73-77, including "Supporting Information")]은 상응하는 프로-키랄 아민으로부터 거울상이성질체적으로 순수한 아민의 합성 및 라세미 아민의 분할을 위한 전세포 촉매의 용도를 개시한다. 바실루스 메가테리움 SC6394, 알칼리게네스 데니트리피칸스(Alcaligenes denitrificans) Y2k-2, 크로모박테리움 비올라세움(Chromobacterium violaceum) DSM30191로부터 상이한 ω-트랜스아미나제, 비브리오 플루비알리스(Vibrio fluvialis)의 ω-트랜스아미나제의 W57G 돌연변이체, 및 아르트로박터(Arthrobacter) 종으로부터 기원하는 CNB05-01로 명명된 돌연변이체를 에스케리키아 콜라이(Escherichia coli) 세포에서 발현한다. 동결건조된 에스케리키아 콜라이 세포를 속도론적 분할 및 입체 선택적 아미노화 반응을 위해 사용하였다.
트랜스아미나제의 사용에 의해 접근가능한 생성물 범위는 케톤과 인접한 위치에 있는 에틸 기보다 더 벌크한 기질을 수용하지 않도록 하는 대부분의 천연 발생 ω-트랜스아미나제의 특징에 의해 제한된다 (Savile et al., 2010, Science 329, 305-309, including "Supporting Information"). 문헌 [Park et al. (2014, Adv. Synth.Catal. 356, 212-220)]은 n-부틸 기까지의 치환기를 갖는 기질 (즉, 2-옥소헥사노에이트 n-헥실)은 수용하지만 분지쇄 α-케토산은 수용하지 않는 파라코커스 데니트리피칸스(Paracoccus denitrificans)로부터의 (S)-선택적 ω-트랜스아미나제를 발견하였다. 파라코커스 데니트리피칸스로부터 (S)-선택적 ω-트랜스아미나제의 변이체 (V153A)는 선형 케토산 (S)-1-페닐부틸아민에 대해 개선된 활성을 나타내었지만, 분지형 케토산을 수용하지 않았다.
각각의 야생형 서열의 아미노산 서열과 비교하여 17개의 아미노산 치환을 포함하는 중온성 아르트로박터 시트레우스(Arthrobacter citreus) ω-트랜스아미나제의 변이체는 아민 공여자로서 이소프로필아민의 존재 하에 치환된 테트랄론으로부터 치환된 (S)-아미노테트랄린을 생성하는 반응에서 개선된 열안정성 및 유의하게 개선된 특이적인 활성을 나타낸다. (Martin et al., 2007, Biochemical Engineering Journal 37, 246-255)
문헌 [Savile et al. (2010, Science 329, 305-309, including "Supporting Information")]은 ω-트랜스아미나제를 수반하는 생체촉매성 과정에 의해 복잡한 항당뇨병제 시타글립틴을 제조하는 것을 개시한다. 아르트로박터 종 (R)-선택적 ω-트랜스아미나제의 다양한 변이체 (ATA-117)를 생성하였다. 상기 효소는 넓은 기질 범위, 이소프로필아민 및 유기 용매에 대한 증가된 내성을 나타낸다. 다양한 트리플루오로메틸-치환된 아민 및 페닐아민이 이들 효소에 의해 생성될 수 있었다. 야생형 효소와 비교하여 27개의 아미노산 치환을 함유하는 아르트로박터 종 (R)-선택적 ω-트랜스아미나제의 최적화된 변이체 (ATA-117)를 사용하여, 아민 공여자로서 이소프로필아민의 존재 하에 프로시타글립틴 케톤의 아미노화에 의해 시타글립틴을 생성하였다.
WO 2006/06339 (US 7,247,460)는 열안정성이며, 각각의 야생형 효소와 비교할 때 각각의 경우에 높은 아민 공여자 농도에 대해 증가된 반응 속도 및 내성을 갖는 아르트로박터 시테루스(Arthrobacter citerus) ω-트랜스아미나제 변이체를 개시한다.
지금까지 트랜스아미나제의 몇몇 개선이 달성되었지만, 아민의 비대칭 합성 또는 라세미 아민의 분할 동안에 발생하는 한계, 예컨대 불리한 평형, 기질 및 생성물 억제, 불량한 열안정성, 불충분한 기질 특이성, 및 트랜스아미나제의 때로는 낮은 거울상이성질체 선택성은 산업적 규모로 광범위한 아민을 효율적으로 생성하기 위해 여전히 극복되어야 한다.
따라서, ω-트랜스아미나제의 추가의 개선이 필요하다. 특히 원하는 아미노화된, 거울상이성질체적으로 풍부한 또는 순수한 생성물의 생성과 관련하여, 바람직하게는 특이적인 및/또는 경제적으로 실행가능한 생성 과정 하에서 개선된 ω-트랜스아미나제가 추가로 필요하다.
본 발명은 그들의 아미노산 서열에서 변형을 포함하는 ω-트랜스아미나제 (ω-TA) 변이체 또는 그들의 아미노산 서열에서 추가의 변형을 포함하는 ω-TA의 추가로 변형된 변이체를 제공하며, 이들 변이체 및 추가로 변형된 변이체는 각각의 야생형 ω-TA와 비교하여 개선된 반응 속도론, 개선된 기질 수용성 및 개선된 특이적인 활성을 갖는 추가의 아미노산 변형을 포함한다. 따라서, 본 발명의 변이체 및 추가의 아미노산 변형을 포함하는 변이체는 각각의 야생형 ω-TA의 사용에 의해 달성될 수 없는 새로운 아미노화된 생성물 또는 각각의 생성물의 전구체의 생성 방법에서 아미노화된 생성물에 대해 경제적으로 효율적인 생성 방법의 개발을 가능하게 한다.
본원에 기재된 ω-TA의 변이체 또는 추가로 변형된 변이체는 공지된 야생형 및 다른 이미 공지된 ω-TA에 비해 이점을 갖는다. 특히, 본원에 기재된 변형된 또는 변이체 ω-TA는 거울상이성질체적으로 풍부한 또는 거울상이성질체적으로 거의 순수한 또는 순수한 화합물, 예를 들어 각각의 야생형 ω-트랜스아미나제에 의해 생성될 수 없는 분지형 또는 방향족 아미노산을 생성할 수 있다는 이점을 갖는다. 본원에 기재된 ω-TA의 추가로 변형된 변이체는 포스포-아미노산의 거울상이성질체적으로 풍부한, 거의 순수한 또는 순수한 화합물을 생성할 수 있다는 이점을 갖는다.
서열식별번호(SEQ ID NO): 3에서 위치 1 내지 477은 진펩트(GenPept) (PDB)로부터 수탁 번호 5G09_A 하에 유래될 수 있는 바실루스 메가테리움로부터의 야생형 ω-트랜스아미나제 (ω-TA)의 아미노산 서열을 나타낸다.
서열식별번호: 6에서 위치 1 내지 479는 진펩트 (PDB)로부터 수탁 번호 5G2P_A 하에 유래될 수 있는 아르트로박터 종으로부터의 야생형 ω-TA의 아미노산 서열을 나타낸다.
서열식별번호: 9에서 위치 1 내지 476은 진펩트 (PDB)로부터 수탁 번호 KRF52528.1 하에 유래될 수 있는 바실루스 종 (토양 76801D1)으로부터의 야생형 ω-TA의 아미노산 서열을 나타낸다.
서열식별번호: 12에서 위치 1 내지 476은 WO 2006/06336 A2에서 서열식별번호: 16으로부터 유래될 수 있는 아르트로박터 종으로부터의 ω-TA 변이체의 아미노산 서열을 나타낸다.
서열식별번호: 15에서 위치 1 내지 476은 WO 2006/06336 A2에서 서열식별번호: 2로부터 유래될 수 있는 아르트로박터 종으로부터의 야생형 ω-TA의 아미노산 서열을 나타낸다.
ω-TA의 활성을 갖는 단백질이 본원에 기재되며, 이들 단백질의 아미노산 서열은 ω-TA의 활성을 갖는 공지된 단백질의 변이체를 나타낸다. 특히, 본원에 기재된 ω-TA의 활성을 갖는 단백질의 아미노산 서열은 서열식별번호: 3에서 위치 1 내지 477의 아미노산으로 표시되는 및/또는 서열식별번호: 6에서 위치 1 내지 479의 아미노산으로 표시되는 및/또는 서열식별번호: 9에서 위치 1 내지 476의 아미노산으로 표시되는 및/또는 서열식별번호: 12에서 위치 1 내지 476의 아미노산으로 표시되는 및/또는 서열식별번호: 15에서 위치 1 내지 476의 아미노산으로 표시되는 아미노산 서열의 변이체를 나타내고, 서열식별번호: 3, 서열식별번호: 6, 서열식별번호: 9, 서열식별번호: 12 및 서열식별번호: 15에 제시된 각각의 아미노산 서열에서 적어도 위치 25, 64, 88, 157, 165, 169, 174, 187, 197, 239, 327, 328, 384, 389, 391, 396, 410 및 414의 아미노산은 각각 서열식별번호: 3, 서열식별번호: 6, 서열식별번호: 9, 서열식별번호: 12 및 서열식별번호: 15에 제시된 각각의 서열에서 각각의 아미노산 위치에 제시된 이들 아미노산과 상이하다.
약어 "ω-TA"가 사용되며, 본원에서 "ω-트랜스아미나제"의 의미를 갖는다.
본원에서 사용된 바와 같이, 용어 "변이체"는 관련 기술분야에 공지된 대상과 상이한 대상을 의미한다. 핵산 분자 및 단백질과 관련하여, 변이체는 상응하게 공지된 서열에서 벗어나지만 ω-TA의 활성을 갖는 단백질을 코딩하는 기능과 같이 동일한 기능을 갖거나 또는 동일한 반응을 촉매하는 단백질을 코딩하는 핵산 서열 또는 아미노산 서열을 각각 포함하는 것으로 이해된다. 공지된 핵산 서열 및 단백질 서열로부터 핵산 분자 서열 및 아미노산 서열의 편차는, 상응하게 공지된 핵산 서열 또는 아미노산 서열과 비교하여 각각 뉴클레오티드 또는 아미노산의 치환 (대체) 및/또는 결실 및/또는 삽입을 포함하는 것을 의미한다.
본 발명의 제1 실시양태는 ω-TA의 활성을 갖는 단백질에 관한 것이며, 단백질은 하기로 이루어진 군으로부터 선택된다:
a) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 3에 제시된 위치 1 내지 477의 아미노산 서열을 포함하는 단백질;
b) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 6에 제시된 위치 1 내지 479의 아미노산 서열을 포함하는 단백질;
c) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 9에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
d) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산 및 위치 187의 아미노산이 S와 상이하고 E와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 12에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
e) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산 및 위치 187의 아미노산이 S와 상이하고 E와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 15에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
f) 각각의 경우에 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187에 상응하는 아미노산이 S와 상이하고, 위치 197에 상응하는 아미노산이 T 또는 M과 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이한 것인, a), b), c), d), e) 또는 f)에 제시된 임의의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질.
아미노산 약어 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T V, W, Y의 의미는 본원에서 하기 "서열의 설명"이라는 부제 단락의 표 4에서 유추할 수 있다.
본원에서 제1 아미노산 서열에서 "위치 x에 상응하는 아미노산" (예를 들어, 서열식별번호: 3에서 위치 64)은, 제2 아미노산 서열의 아미노산 넘버링이 제1 아미노산 서열의 아미노산 넘버링과 상이한 경우에, 제1 아미노산 서열과 비교할 때 제2 아미노산 서열의 아미노산이 제1 아미노산 서열과 제2 아미노산 서열의 쌍별 서열 정렬에서 제1 아미노산 서열의 위치 x에서 보임을 의미한다.
본 발명의 맥락에서, 서열 동일성 또는 동일한 서열과 관련하여 용어 "동일성"은, 전체 서열 길이에 걸쳐 제1 핵산 또는 아미노산 서열과 각각 또 다른 (제2) 핵산 또는 아미노산 서열에 의해 공유된 동일한 아미노산 또는 뉴클레오티드의 개수 (%로 표현됨)를 의미하는 것으로 이해되어야 한다.
"서열 동일성"은 예를 들어 GAP 또는 BESTFIT와 같은 공지된 소프트웨어 또는 엠보스(Emboss) 프로그램 "니들(Needle)"에 포함된 전체 또는 국소 정렬 알고리즘을 사용하여 두 아미노산 또는 두 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 이들 소프트웨어는 두 서열을 그들의 전체 길이에 걸쳐 정렬시키고, 매칭 개수를 최대화하고, 갭 개수를 최소화하기 위해 니들만(Needleman) 및 운쉬(Wunsch) 전체 정렬 알고리즘을 사용한다. 일반적으로, 디폴트 파라미터를 사용하며, 갭 생성 패널티 = 10 및 갭 연장 패널티 = 0.5이다 (뉴클레오티드 및 단백질 정렬의 경우에 둘 다). 뉴클레오티드의 경우에 사용되는 디폴트 평점 행렬은 DNAFULL이며, 단백질의 경우에 디폴트 평점 행렬은 Blosum62이다 (Henikoff & Henikoff, 1992, PNAS 89, 10915-10919). 서열 동일성 백분율에 대한 서열 정렬 및 점수는 예를 들어 EBI (ebi.ac.uk/Tools/emboss/)의 월드 와이드 웹 사이트에서 접근가능한 엠보스와 같은 소프트웨어를 사용하여 결정될 수 있다. 대안적으로, 서열 유사성 또는 동일성은 일반적으로 공지된 알고리즘 및 산출 포맷, 예컨대 FASTA, BLAST 등을 사용하여 데이터베이스 (예를 들어 EMBL, 진뱅크(GenBank))에 대해 검색함으로써 결정될 수 있지만, 바람직하게는 히트를 검색하고 쌍별로 정렬하여, 최종적으로 서열 동일성을 결정해야 한다.
바람직하게는, ω-TA의 활성을 갖는 단백질과 관련하여 동일성은 서열식별번호: 18에 제시된 아미노산 서열과의 비교에 의해 결정되고, ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자와 관련하여 동일성은 컴퓨터 프로그램의 도움으로 서열식별번호: 16 또는 17에 제시된 핵산 서열을 각각 다른 단백질 또는 핵산 분자와 비교함으로써 결정된다. 서로 비교할 서열이 상이한 길이를 갖는 경우, 동일성은 더 짧은 서열이 더 긴 서열과 공유하는 아미노산 또는 뉴클레오티드 개수의 %로 동일성을 각각 결정함으로써 결정된다. 바람직하게는, 동일성은 공개적으로 이용가능한 공지된 컴퓨터 프로그램 클러스탈W(ClustalW)를 이용하여 결정된다 (Thompson et al., Nucleic Acids Research 22 (1994), 4673-4680). 클러스탈W는 줄리 톰슨(Julie Thompson) (Thompson@EMBL-Heidelberg.DE) 및 토비 깁슨(Toby Gibson) (Gibson@EMBL-Heidelberg.DE) (독일 데 69117 하이델베르그 메이에르호프스트라쎄 1 유러피언 몰레큘라 바이올로지 래버러토리)에 의해 공개적으로 이용가능하다. 클러스탈W는 또한 다양한 인터넷 페이지, 특히 IGBMC (인스티튜트 드 제네티크 에 드 바이올로지 몰레큘라 에 셀룰레어(Institut de Genetique et de Biologie Moleculaire et Cellulaire), 프랑스 67404 일키르히 세덱스 비.피.163; ftp://ftp-igbmc.u-strasbg.fr/pub/) 및 EBI (ftp://ftp.ebi.ac.uk/pub/software/) 및 EBI (유러피언 바이오인포르마틱스 인스티튜트(European Bioinformatics Institute), 영국 씨비10 1에스디 캠브릿지 힝스톤 웰컴 트러스트 게놈 캠퍼스)의 모든 미러링된 인터넷 페이지로부터 다운로드할 수 있다.
바람직하게는, 본 발명의 맥락에서 기재된 단백질과 다른 단백질 사이의 동일성을 결정하기 위해 버전 1.8의 클러스탈W 컴퓨터 프로그램을 사용한다. 여기서, 파라미터는 다음과 같이 설정되어야 한다: KTUPLE=1, TOPDIAG=5, WINDOW=5, PAIRGAP=3, GAPOPEN=10, GAPEXTEND=0.05, GAPDIST=8, MAXDIV=40, MATRIX=GONNET, ENDGAPS(OFF), NOPGAP, NOHGAP.
바람직하게는, 예를 들어 본 발명의 맥락에서 기재된 핵산 분자의 뉴클레오티드 서열과 다른 핵산 분자의 뉴클레오티드 서열 사이의 동일성을 결정하기 위해 버전 1.8의 클러스탈W 컴퓨터 프로그램을 사용한다. 여기서, 파라미터는 다음과 같이 설정되어야 한다:
KTUPLE=2, TOPDIAGS=4, PAIRGAP=5, DNAMATRIX:IUB, GAPOPEN=10, GAPEXT=5, MAXDIV=40, TRANSITIONS: 비가중됨.
추가로 동일성은 해당 핵산 분자들 또는 그들에 의해 코딩된 단백질들 사이에 기능적 및/또는 구조적 동등성이 있음을 의미한다. 기능적 동등성은 핵산 분자 서열 또는 아미노산 서열이 ω-TA의 활성을 갖는 단백질을 코딩함을 의미한다. 상기 기재된 분자와 상동성이고 이들 분자의 유도체를 나타내는 핵산 분자는 일반적으로 동일한 생물학적 기능을 갖거나 또는 동일한 반응을 촉매하는, 즉, ω-TA의 활성을 갖는 단백질을 코딩하는 변형을 나타내는 이들 분자의 변이체이다. 이들은 천연 발생 변이체, 예를 들어 다른 종으로부터의 서열, 또는 돌연변이일 수 있으며, 이들 돌연변이는 천연적으로 발생할 수 있었거나 또는 표적화된 돌연변이 유발에 의해 도입되었다. 추가로, 변이체는 합성에 의해 생성된 서열일 수 있다. 대립 유전자 변이체는 천연 발생 변이체 또는 합성에 의해 생성된 변이체 또는 재조합 DNA 기술에 의해 생성된 변이체일 수 있다. 그러나, 본 발명과 관련하여, 이들 변이체가 ω-TA 활성을 갖는 단백질을 코딩하고 본 발명에 따른 단백질과 관련하여 본원에 기재된 아미노산 치환 (대체), 결실 또는 삽입을 포함한다는 것이 결정적이다.
특별한 유형의 유도체는 예를 들어 유전자 코드의 축중성의 결과로서 본 발명의 맥락에서 기재된 핵산 분자와 상이한 핵산 분자이다.
NC-IUBMB (국제 생화학 및 분자 생물학 연합의 명명 위원회(Nomenclature Committee of the International Union of Biochemistry and Molecular Biology))에 따라, 트랜스아미나제 (TA)는 트랜스퍼라제 (EC 2)의 부류에 속한다. 트랜스퍼라제는 기, 예를 들어 메틸 기 또는 글리코실 기를 한 화합물에서 (일반적으로 공여자로 간주됨) 또 다른 화합물 (일반적으로 수용자로 간주됨)로 전달하는 효소이다. 트랜스퍼라제의 그룹은 질소 기를 전달하는 효소 (EC 2.6)를 포함한다. 공식적으로 TA에 의해 촉매된 반응은, 일반 방정식 (I)에 따라 -NH2 기 및 -H를 =O와의 교환으로 카르보닐 기를 함유하는 화합물에 전달함으로써, 카르보닐 수용자의 환원성 아미노화와 함께 (아민) 공여자의 산화성 탈아미노화에 의한 산화환원 반응으로 고려될 수 있다.
R1-CH(-NH2)-R2 + R3-CO-R4 → R1-CO-R2 + R3-CH(-NH2)-R4.
TA에 의해 또한 촉매되는 역반응은 공식적으로 일반 방정식 (Ia)에 따라 설명될 수 있다.
R1-CO-R2 + R3-CH(-NH2)-R4 → R1-CH(-NH2)-R2 + R3-CO-R4.
TA는 피리독살 5'-포스페이트 (PLP)-의존성 효소이다. TA 촉매된 반응의 독특한 구별되는 특징은 (공유 기질-조효소 중간체를 수반하는 널리 확립된 메카니즘에 의한) 아미노 기의 전달이며, 이는 트랜스퍼라제 사이에서 이들 효소를 트랜스아미나제 또는 아미노 트랜스퍼라제 (EC 2.6.1)로 지정된 특별한 하위 그룹으로 할당하는 것을 정당화한다.
TA는 일반적으로 α-TA 및 ω-TA로 추가로 분류된다. 이 명명법은 각각의 TA에 의해 전달된 아미노산의 아미노 기의 상대적인 위치를 기준으로 한다. 아민 카르복실산과 관련하여, α-TA는 α-탄소의 아미노 기의 트랜스아미노화만을 촉매하고, ω-TA는 또한 비-α-아민에 대해 작용하고, 각각의 기질의 원위 아미노 기를 전달한다. (Shin et al., 2003, Appl Microbiol Biotechnol 61, 463-471). 그러나, 일부 ω-TA가 카르복실 기를 보유하지 않는 (1급) 아민 화합물의 트랜스아미노화를 촉매할 수 있음이 관련 기술분야에 공지되어 있다 (Rudat et al., 2012, AMB Express 2(11); Shin et al., 2003, Appl Microbiol Biotechnol 61, 463-471).
단백질이 TA의 활성을 갖는 경우, 특히 ω-TA는 관련 기술분야에 공지되고 기재된 방법에 의해 검출될 수 있다. α-아미노산을 CuSO4/MeOH로 청색 염색하는 것을 기반으로 하여 단백질의 ω-TA 활성을 검출하는 검정이 문헌 [Hwang & Kim (2004, Enzyme and Microbiol Technology 34(5), 429-436)]에 의해 개발되었다. 문헌 [Truppo et al. (2009, Org. Biomol. Chem. 7, 395-398)]은 다중-효소 캐스케이드 pH-지시약 검정을 기반으로 하는 ω-TA의 고처리량 스크리닝을 위한 검정을 기재하며, 통상적인 HPLC 분석 검정 또한 개시한다.
본 발명에 따른 단백질이 ω-TA의 활성을 갖는지 여부를 검출하기 위해 어떤 방법이 이용되는지는 결정적이지 않다. 바람직하게는, 본 발명과 관련하여, 본 발명에 따른 단백질이 ω-TA의 활성을 갖는지 여부를 검출하기 위해 "일반적인 방법", 항목 4에 기재된 방법이 이용되고, 특히 이 방법은 본 발명에 따른 ω-TA 변이체가 ω-TA의 활성을 갖는지 여부를 검출하기 위해 이용된다.
추가의 아미노산 변형을 포함하는 ω-TA 변이체와 관련하여, 바람직하게는 "일반적인 방법", 항목 7에 기재된 방법은 본 발명에 따른 단백질이 ω-TA의 활성을 갖는지 여부를 검출하기 위해 이용된다.
본 발명의 바람직한 실시양태에서 본 발명에 따른 단백질은 (S)-선택적 ω-TA이다.
본 발명과 관련하여 용어 "(S)-선택적"은, 일반 방정식 (I)에 따라 (아민) 수용자의 환원성 아미노화가 (R)-거울상이성질체에 비해 거울상이성질체 과량으로 (S)-거울상이성질체를 생성한다는 것을 의미한다.
(S)-선택적 ω-TA에 의해 촉매된 반응은 공식적으로 일반 방정식 (II)에 따라 설명될 수 있다.
R1-CH(-NH2)-R2 + R3-CO-R4 → R1-CO-R2 + R3-CH((S)-NH2)-R4.
본 발명에 따른 ω-TA 변이체 단백질은 서열식별번호: 3, 6, 9, 12 또는 15에 제시된 아미노산 서열과 관련하여 본원에서 상기 기재된 아미노산 서열과 비교하여 추가의 아미노산 변형 (아미노산 치환, 결실 또는 삽입)을 나타낼 수 있다.
본원에서 상기 항목 a) 또는 c)에서 기재된 ω-TA 변이체 외에도, 서열식별번호: 3의 위치 1 내지 477에 제시된 아미노산 서열 또는 서열식별번호: 9의 위치 1 내지 477에 제시된 아미노산 서열 각각은 위치 2 및/또는 48 및/또는 164 및/또는 242 및/또는 245 및/또는 311 및/또는 353 및/또는 424에서 추가의 아미노산 치환을 가질 수 있고/거나, 서열식별번호: 3에 제시된 아미노산 서열은 위치 202 및/또는 205 및/또는 359 및/또는 475 및/또는 476에서 추가의 아미노산 치환 및/또는 위치 477의 아미노산의 결실을 가질 수 있고/거나, 서열식별번호: 9에 제시된 아미노산 서열은 위치 69 및/또는 90 및/또는 268 및/또는 318 및/또는 322 및/또는 452에서 추가의 아미노산 치환을 가질 수 있다.
상기 항목 b) 및 d)에 기재된 ω-TA 변이체 외에도, 서열식별번호: 6의 위치 1 내지 479에 제시된 아미노산 서열 또는 서열식별번호: 12의 위치 1 내지 476에 제시된 아미노산 서열 각각은 위치 46 및/또는 60 및/또는 185 및/또는 186 및/또는 195 및/또는 205 및/또는 252 및/또는 268 및/또는 409 및/또는 436에서 추가의 아미노산 치환을 가질 수 있고/거나, 서열식별번호: 6에 제시된 아미노산 서열에서 위치 477 및/또는 478 및/또는 479의 아미노산이 결실될 수 있다.
상기 항목 e)에 기재된 ω-TA 변이체 외에도, 서열식별번호: 15의 위치 1 내지 476에 제시된 아미노산 서열은 위치 48 및/또는 164 및/또는 242 및/또는 245 및/또는 255 및/또는 424에서 추가의 아미노산 치환을 가질 수 있다.
따라서, 본 발명의 추가의 실시양태는 추가의 아미노산 변형을 포함하는 본 발명에 따른 단백질에 관한 것이고, 바람직하게는 이들 실시양태는 ω-TA의 활성을 갖는 단백질이고, 단백질은 하기로 이루어진 군으로부터 선택된다:
a) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이하고, 위치 2의 아미노산이 S와 상이하고, 위치 48의 아미노산이 D와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 202의 아미노산이 D와 상이하고, 위치 205의 아미노산이 L과 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 311의 아미노산이 L과 상이하고, 위치 353의 아미노산이 F와 상이하고, 위치 359의 아미노산이 D와 상이하고, 위치 424의 아미노산이 K와 상이하고, 위치 475의 아미노산이 A와 상이하고, 위치 476의 아미노산이 L과 상이하고, 위치 477의 아미노산이 결실된 것을 제외하고는, 서열식별번호: 3에 제시된 위치 1 내지 477의 아미노산 서열을 포함하는 단백질;
b) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이하고, 위치 46의 아미노산이 T와 상이하고, 위치 60의 아미노산이 C와 상이하고, 위치 185의 아미노산이 C와 상이하고, 위치 186의 아미노산이 S와 상이하고, 위치 195의 아미노산이 S와 상이하고, 위치 205의 아미노산이 Y와 상이하고, 위치 252의 아미노산이 V와 상이하고, 위치 268의 아미노산이 S와 상이하고, 위치 409의 아미노산이 R과 상이하고, 위치 436의 아미노산이 A와 상이하고, 위치 477 및 478 및 479의 아미노산이 결실된 것을 제외하고는, 서열식별번호: 6에 제시된 위치 1 내지 479의 아미노산 서열을 포함하는 단백질;
c) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이하고, 위치 2의 아미노산이 S와 상이하고, 위치 48의 아미노산이 D와 상이하고, 위치 69의 아미노산이 P와 상이하고, 위치 90의 아미노산이 S와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 268의 아미노산이 T와 상이하고, 위치 311의 아미노산이 L과 상이하고, 위치 318의 아미노산이 E와 상이하고, 위치 322의 아미노산이 R과 상이하고, 위치 353의 아미노산이 S와 상이하고, 위치 424의 아미노산이 K와 상이하고, 위치 452의 아미노산이 E와 상이한 것을 제외하고는, 서열식별번호: 9에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
d) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이하고, 위치 46의 아미노산이 T와 상이하고, 위치 60의 아미노산이 C와 상이하고, 위치 185의 아미노산이 C와 상이하고, 위치 186의 아미노산이 C와 상이하고, 위치 195의 아미노산이 S와 상이하고, 위치 205의 아미노산이 Y와 상이하고, 위치 252의 아미노산이 V와 상이하고, 위치 268의 아미노산이 S와 상이하고, 위치 409의 아미노산이 R과 상이하고, 위치 436의 아미노산이 A와 상이한 것을 제외하고는, 서열식별번호: 12에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
e) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이하고, 위치 48의 아미노산이 D와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 255의 아미노산이 F와 상이하고, 위치 424의 아미노산이 K와 상이한 것을 제외하고는, 서열식별번호: 15에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
f) 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187에 상응하는 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이하고, 위치 2에 상응하는 아미노산이 S와 상이하고, 위치 48에 상응하는 아미노산이 D와 상이하고, 위치 164에 상응하는 아미노산이 Y와 상이하고, 위치 202에 상응하는 아미노산이 D와 상이하고, 위치 205에 상응하는 아미노산이 L과 상이하고, 위치 242에 상응하는 아미노산이 A와 상이하고, 위치 245에 상응하는 아미노산이 A와 상이하고, 위치 311에 상응하는 아미노산이 L과 상이하고, 위치 353에 상응하는 아미노산이 F와 상이하고, 위치 359에 상응하는 아미노산이 D와 상이하고, 위치 424에 상응하는 아미노산이 K와 상이하고, 위치 475에 상응하는 아미노산이 A와 상이하고, 위치 476에 상응하는 아미노산이 L과 상이하고, 위치 477에 상응하는 아미노산이 결실된 것인, a)에 정의된 바와 같은 임의의 아미노산 서열 (서열식별번호: 3에 제시된 위치 1 내지 477의 아미노산 서열)과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질;
g) 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187에 상응하는 아미노산이 S와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이하고, 위치 46의 아미노산이 T와 상이하고, 위치 60에 상응하는 아미노산이 C와 상이하고, 위치 185에 상응하는 아미노산이 C와 상이하고, 위치 186에 상응하는 아미노산이 S와 상이하고, 위치 195에 상응하는 아미노산이 S와 상이하고, 위치 205에 상응하는 아미노산이 Y와 상이하고, 위치 252에 상응하는 아미노산이 V와 상이하고, 위치 268에 상응하는 아미노산이 S와 상이하고, 위치 409에 상응하는 아미노산이 R과 상이하고, 위치 436에 상응하는 아미노산이 A와 상이하고, 위치 477 및 478 및 479에 상응하는 아미노산이 결실된 것인, b)에 정의된 바와 같은 임의의 아미노산 서열 (서열식별번호: 6에 제시된 위치 1 내지 476)과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질;
h) 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187에 상응하는 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이하고, 위치 2에 상응하는 아미노산이 S와 상이하고, 위치 48에 상응하는 아미노산이 D와 상이하고, 위치 69에 상응하는 아미노산이 P와 상이하고, 위치 90에 상응하는 아미노산이 S와 상이하고, 위치 164에 상응하는 아미노산이 Y와 상이하고, 위치 242에 상응하는 아미노산이 A와 상이하고, 위치 245에 상응하는 아미노산이 A와 상이하고, 위치 268에 상응하는 아미노산이 T와 상이하고, 위치 311에 상응하는 아미노산이 L과 상이하고, 위치 318에 상응하는 아미노산이 E와 상이하고, 위치 322에 상응하는 아미노산이 R과 상이하고, 위치 353에 상응하는 아미노산이 S와 상이하고, 위치 424에 상응하는 아미노산이 K와 상이하고, 위치 452에 상응하는 아미노산이 E와 상이한 것인, c)에 정의된 바와 같은 임의의 아미노산 서열 (서열식별번호: 9에 제시된 위치 1 내지 479)과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질;
i) 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187에 상응하는 아미노산이 S와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이하고, 위치 46에 상응하는 아미노산이 T와 상이하고, 위치 60에 상응하는 아미노산이 C와 상이하고, 위치 185에 상응하는 아미노산이 C와 상이하고, 위치 186에 상응하는 아미노산이 C와 상이하고, 위치 195에 상응하는 아미노산이 S와 상이하고, 위치 205에 상응하는 아미노산이 Y와 상이하고, 위치 252에 상응하는 아미노산이 V와 상이하고, 위치 268에 상응하는 아미노산이 S와 상이하고, 위치 409에 상응하는 아미노산이 R과 상이하고, 위치 436에 상응하는 아미노산이 A와 상이한 것인, d)에 정의된 바와 같은 임의의 아미노산 서열 (서열식별번호: 12에 제시된 위치 1 내지 476)과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질;
j) 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이하고, 위치 48의 아미노산이 D와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 255의 아미노산이 F와 상이하고, 위치 424의 아미노산이 K와 상이한 것인, e)에 정의된 바와 같은 임의의 아미노산 서열 (서열식별번호: 15에 제시된 위치 1 내지 476)과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질.
서열식별번호: 18에서 위치 1 내지 476은 서열식별번호: 3 (위치 1 내지 477), 서열식별번호: 6 (위치 1 내지 479), 서열식별번호: 9 (위치 1 내지 476), 서열식별번호: 12 (위치 1 내지 476 ) 및 서열식별번호: 15 (위치 1 내지 476)에 제시된 각각의 아미노산 서열과 비교하여 본원에서 상기 기재된 모든 아미노산 변형을 포함하는 ω-TA 변이체 단백질의 아미노산 서열을 나타낸다.
표 1은 야생형 ω-TA의 각각의 아미노산 서열 (서열식별번호: 3의 위치 1 내지 477 또는 서열식별번호: 6의 위치 1 내지 479 또는 서열식별번호: 9의 위치 1 내지 476 또는 서열식별번호: 15의 위치 1 내지 476)과 비교하여 뿐만 아니라 아르트로박터 종으로부터의 변형된 ω-TA (서열식별번호: 12의 위치 1 내지 476)와 비교하여 본 발명에 따른 ω-TA 변이체 단백질의 아미노산 서열 (서열식별번호: 18의 위치 1 내지 476)에 존재하는 변형을 요약한다.
Figure pct00001
Figure pct00002
표 1
표 1에서 "End"는 각각의 공지된 (야생형) 서열의 아미노산 서열에 존재하는 마지막 아미노산 이후의 위치를 나타낸다.
따라서, 본 발명의 바람직한 실시양태는 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 본 발명에 따른 단백질에 관한 것이다:
a) 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
b) 서열식별번호: 18에서 위치 25, 64, 88, 157, 165, 169, 174, 187, 197 239, 327, 328, 384, 389, 391, 396, 410 및 414에 상응하는 각각의 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질;
c) 서열식별번호: 18에서 위치 2, 25, 46, 48, 60, 64, 69, 88, 90, 157, 164, 165, 169, 174, 185, 186, 187, 195, 197, 202, 205, 239, 242, 245, 252, 255, 268, 311, 318, 322, 327, 328, 353, 359, 384, 389, 391, 396, 409, 410, 414, 424, 436, 452, 475 및 476에 상응하는 각각의 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질.
가장 바람직한 실시양태에서, ω-TA를 코딩하는 본 발명에 따른 단백질은 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질이다.
지금까지 본원에서 상기 기재된 단백질은 일반적으로 본원에서 본 발명에 따른 ω-TA 변이체 또는 단백질 변이체로 지칭된다.
본 발명에 따른 단백질 변이체에 추가의 아미노산 변형의 도입이 특히 그의 기질 특이성과 관련하여 ω-TA 변이체의 활성을 추가로 개선시킨다는 것이 확인되었고, 이는 이들 추가로 변형된 ω-TA 변이체가 본원에서 상기 기재된 ω-TA 변이체와 비교하여 거울상이성질체적으로 풍부한 또는 거의 순수한 생성물을 생성하는데 더욱 적합하다는 것을 의미한다. 추가의 변형을 포함하는 ω-TA는 본 발명에 따른 단백질로서 본원에서 상기 기재된 ω-TA 변이체와 비교하여 추가로 변형된다. 추가의 변형을 포함하는 ω-TA 변이체는 거울상이성질체적으로 풍부한 또는 거울상이성질체적으로 거의 순수한 포스포-아미노산을 생성하는데 특히 적합하며, 본원에서 추가의 아미노산 변형을 포함하는 ω-TA 변이체 또는 추가의 아미노산 변형을 포함하는 본 발명에 따른 단백질로 지정된다.
추가의 아미노산 변형을 포함하는 ω-TA 변이체와 관련하여, 단백질이 ω-TA의 활성을 가짐을 보여주기 위한 바람직한 방법은 예를 들어 WO 2017/151573에 기재되고, ω-TA 변이체가 추가의 아미노산 변형을 가짐을 입증하기 위한 특히 바람직한 방법은 "일반적인 방법", 항목 7에서 본원에 기재된다.
"거울상이성질체적으로 풍부한"은 본원에서 두 거울상이성질체 중 하나가 다른 거울상이성질체보다 더 많은 양으로 조성물에 존재하고, 바람직하게는 적어도 60%의 한 거울상이성질체가 조성물에 존재하고, 더욱 바람직하게는 적어도 65%의 한 거울상이성질체가 조성물에 존재하고, 추가로 더 바람직하게는 적어도 70%의 한 거울상이성질체가 조성물에 존재하고, 훨씬 더 바람직하게는 적어도 75%의 한 거울상이성질체가 조성물에 존재하고, 추가로 훨씬 더 바람직하게는 적어도 80%의 한 거울상이성질체가 조성물에 존재하고, 특히 바람직하게는 적어도 85%의 한 거울상이성질체가 조성물에 존재하고, 가장 바람직하게는 적어도 90%의 한 거울상이성질체가 조성물에 존재하고 또는 특히 바람직하게는 적어도 94%의 한 거울상이성질체가 조성물에 존재한는 것을 의미한다.
"거울상이성질체적으로 거의 순수한은 본원에서 두 거울상이성질체 중 하나가 적어도 95.0%의 양으로 조성물에 존재하고, 바람직하게는 두 거울상이성질체 중 하나가 적어도 95.5%의 양으로 조성물에 존재하고, 더욱 바람직하게는 두 거울상이성질체 중 하나가 적어도 96.0%의 양으로 조성물에 존재하고, 추가로 더 바람직하게는 두 거울상이성질체 중 하나가 적어도 96.5%의 양으로 조성물에 존재하고, 훨씬 더 바람직하게는 두 거울상이성질체 중 하나가 적어도 97.0%의 양으로 조성물에 존재하고, 추가로 훨씬 더 바람직하게는 두 거울상이성질체 중 하나가 적어도 98.0%의 양으로 조성물에 존재하고, 특히 바람직하게는 두 거울상이성질체 중 하나가 적어도 98.5%의 양으로 조성물에 존재하고, 가장 바람직하게는 두 거울상이성질체 중 하나가 적어도 99.0%의 양으로 조성물에 존재하고, 또는 특히 바람직하게는 두 거울상이성질체 중 하나가 적어도 99.5%의 양으로 조성물에 존재하는 것을 의미한다.
따라서, 본 발명에 따른 또 다른 실시양태는 ω-TA 변이체의 활성을 갖는 본 발명에 따른 단백질 변이체에 관한 것이며, 본 발명에 따른 아미노산 서열은 본 발명에 따른 단백질과 비교하여 추가의 아미노산 변형을 포함한다.
따라서, 바람직하게는, 추가의 아미노산 변형을 포함하는 본 발명에 따른 ω-TA의 활성을 갖는 단백질 (ω-TA 변이체)의 아미노산 서열과 관련하여 본 발명의 또 다른 실시양태는 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 본 발명에 따른 단백질이다:
a) 위치 166의 아미노산이 G이고, 위치 327의 아미노산이 Q인 본 발명에 따른 단백질;
b) 위치 327의 아미노산이 Q이고, 위치 384의 아미노산이 S인 본 발명에 따른 단백질;
c) 위치 326의 아미노산이 Q이고, 위치 327의 아미노산이 Q인 본 발명에 따른 단백질;
d) 위치 327의 아미노산이 Q인 본 발명에 따른 단백질;
e) 위치 326의 아미노산이 F이고, 위치 327의 아미노산이 Q인 본 발명에 따른 단백질;
f) 위치 327의 아미노산이 C인 본 발명에 따른 단백질;
g) 위치 327의 아미노산이 I인 본 발명에 따른 단백질;
h) 위치 327의 아미노산이 M인 본 발명에 따른 단백질;
i) 위치 164의 아미노산이 Y인 본 발명에 따른 단백질;
j) 위치 164의 아미노산이 S인 본 발명에 따른 단백질;
k) 위치 327의 아미노산이 V인 본 발명에 따른 단백질;
l) 위치 409의 아미노산이 R인 본 발명에 따른 단백질;
m) 위치 327의 아미노산이 S인 본 발명에 따른 단백질;
n) 위치 271의 아미노산이 I인 본 발명에 따른 단백질;
o) 329의 아미노산이 G인 본 발명에 따른 단백질;
p) 위치 409의 아미노산이 P인 본 발명에 따른 단백질;
q) 위치 414의 아미노산이 M인 본 발명에 따른 단백질;
r) 위치 165의 아미노산이 K인 본 발명에 따른 단백질;
s) 위치 414의 아미노산이 R인 본 발명에 따른 단백질;
t) 위치 414의 아미노산이 H인 본 발명에 따른 단백질;
u) 위치 165의 아미노산이 C인 본 발명에 따른 단백질;
v) 위치 327의 아미노산이 V인 본 발명에 따른 단백질;
w) 위치 164의 아미노산이 C인 본 발명에 따른 단백질;
x) 위치 409의 아미노산이 K인 본 발명에 따른 단백질.
추가의 아미노산 변형을 포함하는 ω-TA의 활성을 갖는 단백질의 아미노산 서열과 관련하여 본 발명의 더욱 바람직한 실시양태는 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 단백질에 관한 것이다:
a) 서열식별번호: 18에서 위치 166의 아미노산 S가 G로 치환되고, 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
b) 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환되고, 서열식별번호: 18에서 위치 384의 아미노산 C가 S로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
c) 서열식별번호: 18에서 위치 326의 아미노산 E가 Q로 치환되고, 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
d) 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
e) 서열식별번호: 18에서 위치 326의 아미노산 E가 F로 치환되고, 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
f) 서열식별번호: 18에서 위치 327의 아미노산 T가 C로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
g) 서열식별번호: 18에서 위치 327의 아미노산 T가 I로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
h) 서열식별번호: 18에서 위치 327의 아미노산 T가 M으로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
i) 서열식별번호: 18에서 위치 164의 아미노산 F가 Y로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
j) 서열식별번호: 18에서 위치 164의 아미노산 F가 S로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
k) 서열식별번호: 18에서 위치 327의 아미노산 T가 V로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
l) 서열식별번호: 18에서 위치 409의 아미노산 T가 R로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
m) 서열식별번호: 18에서 위치 327의 아미노산 T가 S로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
n) 서열식별번호: 18에서 위치 271의 아미노산 V가 I로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
o) 서열식별번호: 18에서 위치 329의 아미노산 S가 G로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
p) 서열식별번호: 18에서 위치 409의 아미노산 T가 P로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
q) 서열식별번호: 18에서 위치 414의 아미노산 L이 M으로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
r) 서열식별번호: 18에서 위치 165의 아미노산 Q가 K로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
s) 서열식별번호: 18에서 위치 414의 아미노산 L이 R로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
t) 서열식별번호: 18에서 위치 414의 아미노산 L이 H로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
u) 서열식별번호: 18에서 위치 165의 아미노산 Q가 C로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
v) 서열식별번호: 18에서 위치 327의 아미노산 T가 V로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
w) 서열식별번호: 18에서 위치 164의 아미노산 F가 C로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
x) 서열식별번호: 18에서 위치 409의 아미노산 T가 K로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질
y) a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 각각의 아미노산 위치가 a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 임의의 아미노산 서열과 적어도 60 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 단백질 서열의 아미노산 서열에서 상응하는 아미노산 위치에 또한 존재하는 것인, a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x)에 정의된 바와 같은 임의의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질.
본 발명의 실시양태로서, 추가의 아미노산 변형을 포함하는 ω-TA 변이체의 활성을 갖는 바람직한 단백질은 바로 위에 정의된 항목 a), b), c), d), e), f), g), h), i), j), k), l), m), n), o) 및 p)에 정의된 이들 단백질이며, 바로 위에 정의된 항목 a), b), c), d), e), f), g) 및 h)에 정의된 이들 단백질이 더욱 바람직하고, 바로 위에 정의된 항목 a), b) 및 c)에 정의된 이들 단백질이 가장 바람직하다.
표 2는 서열식별번호: 18에 제시된 아미노산 서열 (위치 1 내지 476)과 비교하여 추가의 아미노산 변형을 포함하는 ω-TA의 아미노산 서열에 존재하는 추가의 아미노산 변형을 요약한다.
Figure pct00003
표 2
본 발명의 한 추가의 실시양태는 본 발명에 따른 단백질을 코딩하는 핵산 분자에 관한 것이다.
본 발명에 따른 핵산 분자는 핵산이 본 발명에 따른 단백질을 코딩하는 한 임의의 종류의 핵산일 수 있다. 핵산은 리보핵산 핵산 분자 (예를 들어 RNA, mRNA) 또는 데옥시리보핵산 핵산 분자 (DNA, 예컨대 인트론을 포함할 수 있거나 포함하지 않을 수 있는 게놈 DNA, 및 코딩 DNA)일 수 있다.
특히 서열식별번호: 18의 위치 1 내지 476에 제시된 아미노산 서열을 포함하는 ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자가 본 발명의 관심의 대상이다.
따라서, 본 발명은 또한 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자에 관한 것이다:
a) 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
b) 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 포함하는 단백질을 코딩하는 핵산 분자;
c) 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 589 내지 591에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984의 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖는 것인, 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 핵산 분자;
d) 서열식별번호: 17에서 뉴클레오티드 위치 4 내지 6에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 136 내지 138에 상응하는 코돈이 뉴클레오티드 서열 atg를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 142 144에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 178 내지 180에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 205 내지 207에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 268 내지 270에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492에 상응하는 코돈이 뉴클레오티드 서열 tty를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 553 내지 555에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 556 내지 558에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 583 내지 585에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 589 내지 591에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 604 내지 606에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 613 내지 615에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 724 내지 726에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 733 내지 735에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 754 내지 756에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 763 내지 765에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 802 내지 804에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 931 내지 933에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 952 내지 954에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 964 내지 966에 상응하는 코돈이 뉴클레오티드 서열 aar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1057 내지 1059에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1075 내지 1077에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1270 내지 1272에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1306 내지 1308에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1354 내지 1356에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖는 것인, 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 핵산 분자;
e) 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984의 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖는 것인, a), b), c) 또는 d)에 정의된 핵산 분자의 상보성 가닥과 혼성화하는 핵산 분자;
f) 서열식별번호: 17에서 뉴클레오티드 위치 4 내지 6에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 136 내지 138에 상응하는 코돈이 뉴클레오티드 서열 atg를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 142 144에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 178 내지 180에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 205 내지 207에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 268 내지 270에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492에 상응하는 코돈이 뉴클레오티드 서열 tty를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 553 내지 555에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 556 내지 558에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 583 내지 585에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 589 내지 591에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 604 내지 606에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 613 내지 615에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 724 내지 726에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 733 내지 735에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 754 내지 756에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 763 내지 765에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 802 내지 804에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 931 내지 933에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 952 내지 954에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 964 내지 966에 상응하는 코돈이 뉴클레오티드 서열 aar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1057 내지 1059에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1075 내지 1077에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1270 내지 1272에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1306 내지 1308에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1354 내지 1356에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖는 것인, a), b), c) 또는 d)에 정의된 핵산 분자의 상보성 가닥과 혼성화하는 핵산 분자;
g) 유전자 코드의 축중성으로 인해 a), b), c), d), e) 또는 f)에 정의된 핵산 분자로부터 유래된 핵산 분자;
h) 서열식별번호: 18에서 위치 25, 64, 88, 157, 165, 169, 174, 187, 239, 327, 328, 384, 389, 391, 396, 410 및 414에 상응하는 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 단백질을 코딩하는 핵산 분자;
i) 서열식별번호: 18에서 위치 2, 25, 46, 48, 60, 64, 69, 88, 90, 157, 164, 165, 169, 174, 185, 186, 187, 195, 197, 202, 205, 239, 242, 245, 252, 255, 268, 311, 318, 322, 327, 328, 353, 359, 384, 389, 391, 396, 409, 410, 414, 424, 436, 452, 475 및 476에 상응하는 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 단백질을 코딩하는 핵산 분자;
j) 서열식별번호: 16에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자.
서열식별번호: 16은 서열식별번호: 18에 제시된 아미노산 서열을 갖는 단백질의 역번역에 의해 수득된 뉴클레오티드 서열을 나타내며, 유전자 코드의 축중성이 반영된 것이다.
서열식별번호: 17은 유전자 코드의 축중성으로 인해 서열식별번호: 16의 융통성 있는 뉴클레오티드가 특정한 뉴클레오티드로 치환됨으로써 수득된 합성 핵산 분자이다. 서열식별번호: 16 및 서열식별번호: 17 둘 다 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA의 활성을 갖는 단백질을 코딩한다.
본 발명의 맥락에서, 용어 "와 혼성화하는"은 통상적인 혼성화 조건하의, 바람직하게는 예를 들어 문헌 [Sambrook et al. (Molecular Cloning, A Laboratory Manual, 3rd edition (2001) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. ISBN: 0879695773) 또는 Ausubel et al. (Short Protocols in Molecular Biology, John Wiley & Sons; 5th edition (2002), ISBN: 0471250929)]에 기재된 엄격한 조건하의 혼성화를 의미한다. 특히 바람직하게는, "혼성화"는 하기 조건하의 혼성화를 의미한다:
혼성화 완충제:
2xSSC; 10x덴하르트(Denhardt) 용액 (피콜(Fikoll) 400+PEG+BSA; 1:1:1 비); 0.1% SDS; 5 mM EDTA; 50 mM Na2HPO4; 250 μg/ml의 청어 정자 DNA; 50 μg/ml의 tRNA;
또는
25 M 인산나트륨 완충제 pH 7.2; 1 mM EDTA; 7% SDS
혼성화 온도: T = 65 내지 68℃
세척 완충제: 0.1xSSC; 0.1% SDS
세척 온도: T = 65 내지 68℃.
ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자와 혼성화하는 핵산 분자는 임의의 유기체로부터 기원할 수 있으며; 따라서, 이들은 박테리아, 진균, 동물, 인간, 식물 또는 바이러스로부터 기원할 수 있다.
ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자와 혼성화하는 핵산 분자는 바람직하게는 미생물로부터, 더욱 바람직하게는 진균 또는 박테리아로부터, 가장 바람직하게는 박테리아로부터 기원한다.
언급된 분자와 혼성화하는 핵산 분자는 예를 들어 게놈 또는 cDNA 라이브러리로부터 단리될 수 있다. 예를 들어 표준 방법에 따라 혼성화함으로써 (예를 들어, 문헌 [Sambrook et al., Molecular Cloning, A Laboratory Manual, 3rd edition (2001) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. ISBN: 0879695773; Ausubel et al., Short Protocols in Molecular Biology, John Wiley & Sons; 5th edition (2002),ISBN: 0471250929] 참고) 또는 PCR을 이용하여 증폭시킴으로써, 이러한 핵산 분자는 본원에 기재된 핵산 분자를 사용하여 확인되고 단리될 수 있거나, 또는 이들은 이들 분자의 일부분 또는 이들 분자의 역상보체를 사용하여 확인되고 단리될 수 있다.
ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 서열을 단리하기 위한 혼성화 샘플로서, 예를 들어, 정확하게 또는 본질적으로 서열식별번호: 2에 제시된 위치 1 내지 1431의 핵산 서열, 또는 본질적으로 서열식별번호: 5에 제시된 위치 1 내지 1437의 핵산 서열, 또는 본질적으로 서열식별번호: 8에 제시된 핵산 서열, 또는 본질적으로 서열식별번호: 11에 제시된 핵산 서열, 또는 본질적으로 서열식별번호: 14에 제시된 핵산 서열, 또는 본질적으로 서열식별번호: 17에 제시된 핵산 서열을 갖는 핵산 분자, 또는 이들 핵산 서열의 단편을 사용하는 것이 가능하다.
혼성화 샘플로서 사용된 단편은 또한 통상적인 합성 기술을 이용하여 제조된 합성 단편 또는 올리고뉴클레오티드일 수 있으며, 그의 서열은 본 발명의 맥락에서 기재된 핵산 분자와 본질적으로 동일하다. 본 발명의 맥락에서 기재된 핵산 서열과 혼성화하는 유전자를 확인하고 단리한 경우, 서열을 결정해야 하고, 이 서열에 의해 코딩되는 단백질의 성질을 분석하여, 이들이 ω-TA의 활성을 갖는 단백질인지 여부를 결정해야 한다. 단백질이 ω-TA의 활성을 갖는 단백질의 활성을 갖는지 여부를 결정하는 방법은 관련 기술분야의 기술자에게 공지되어 있고, 본원에서 상기 언급되었다.
본 발명의 맥락에서 기재된 핵산 분자와 혼성화하는 분자는 특히 언급된 핵산 분자의 단편, 유도체 및 대립 유전자 변이체를 포함한다. 본 발명의 맥락에서, 용어 "유도체"는 이들 분자의 서열이 상기 기재된 핵산 분자의 서열과 1개 이상의 위치에서 상이하고, 이들 서열과 매우 동일함을 의미한다. 상기 기재된 핵산 분자와의 차이는 예를 들어 결실, 부가, 치환, 삽입 또는 재조합 때문일 수 있다.
추가의 아미노산 변형을 포함하는 ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자와 관련하여 본 발명의 또 다른 실시양태는 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 단백질을 코딩하는 본 발명에 따른 핵산 분자에 관한 것이다:
a) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 496 내지 498의 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 위치의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
b) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152의 코돈이 뉴클레오티드 서열 wsn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
c) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 976 내지 978의 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 위치의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
d) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
e) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 976 내지 978의 코돈이 뉴클레오티드 서열 tty를 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
f) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
g) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 ath를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
h) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 atg를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
i) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492의 코돈이 뉴클레오티드 서열 tay를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
j) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492의 코돈이 뉴클레오티드 서열 wsn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
k) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 gtn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
l) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227의 코돈이 뉴클레오티드 서열 mgn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
m) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 wsn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
n) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 811 내지 813의 코돈이 뉴클레오티드 서열 ath를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
o) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 985 내지 987의 코돈이 뉴클레오티드 서열 ggn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
p) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227의 코돈이 뉴클레오티드 서열 ccn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
q) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242의 코돈이 뉴클레오티드 서열 atg를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
r) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495의 코돈이 뉴클레오티드 서열 aar을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
s) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242의 코돈이 뉴클레오티드 서열 mgn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
t) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242의 코돈이 뉴클레오티드 서열 cay를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
u) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495의 코돈이 뉴클레오티드 서열 tgy를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
v) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 gtn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
w) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492의 코돈이 뉴클레오티드 서열 tgy를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
x) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227의 코돈이 뉴클레오티드 서열 aar을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
y) a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 각각의 코돈 뉴클레오티드 서열이 a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 임의의 핵산 서열과 적어도 60% 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 핵산 서열에서 상응하는 코돈 뉴클레오티드 위치에 또한 존재하는 것인, a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x)에 정의된 바와 같은 임의의 핵산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 핵산 서열을 갖는 핵산 분자.
본 발명에 따른 바람직한 핵산 분자는 항목 a), b), c), d), e), f), g), h), i), j), k), l), m), n), o) 및 p)에서 바로 위에 정의된 이들 핵산 분자이고, 항목 a) 내지 k)에서 바로 위에 정의된 이들 핵산 분자가 더욱 바람직하고, 항목 a), b), c), d), e), f), g) 및 h)에서 바로 위에 정의된 이들 핵산 분자가 훨씬 더 바람직하고, 항목 a), b) 및 c)에서 바로 위에 정의된 이들 핵산 분자가 가장 바람직하다.
뉴클레오티드 약어 a, c, g, t의 의미 및 축중성 뉴클레오티드에 대한 약어 r, y, s, w, k, m, b, d, h, v, n의 의미는 하기 "서열의 설명"이라는 부제 단락의 표 3에서 유추될 수 있다. 어떤 아미노산이 축중성 뉴클레오티드를 포함하는 코돈에 의해 코딩되는지는 하기 "서열의 설명"이라는 부제 단락의 표 5에서 유추될 수 있다.
추가로, 본 발명은 본 발명에 따른 핵산 분자를 포함하는 재조합 핵산 분자에 관한 것이다.
본 발명과 관련하여, 용어 "재조합 핵산 분자"는, 본 발명에 따른 핵산 분자 외에, 본 발명에 따른 재조합 핵산에서 발생하는 조합물로 천연 발생하지 않는 추가의 서열을 함유하는 핵산 분자를 의미하는 것으로 이해해야 한다. 여기서, 상기 언급된 추가의 서열은 임의의 서열일 수 있고, 바람직하게는 이들은 기능적 또는 조절성 서열 (프로모터, 종결 신호, 인핸서, 리보솜 결합 부위 (rbs), 전사, 번역 또는 RNA 안정성을 증강시키는 리더 서열, 세포내 표적화 서열 등)이고, 특히 바람직하게는 이들은 미생물에서 활성인 기능적 또는 조절성 서열이고, 특별히 특히 바람직하게는 이들은 진균, 특히 효모 또는 박테리아에서 활성인 조절성 서열이다. 본 발명에 따른 재조합 핵산 분자의 생성을 위한 방법은 관련 기술분야의 기술자에게 공지되어 있고, 라이게이션, 유전자 재조합, 또는 핵산 분자의 새로운 합성에 의해 핵산 분자를 결합시키는 것과 같은 유전적 방법이 포함된다. 이들 방법은 예를 들어 문헌 [Sambrok et al. (Molecular Cloning, A Laboratory Manual, 3rd edition (2001) Cold Spring Harbour Laboratory Press, Cold Spring Harbour, NY. ISBN: 0879695773) 또는 Ausubel et al. (Short Protocols in Molecular Biology, John Wiley & Sons; 5th edition ( 2002), ISBN: 0471250929)]에 기재되어 있다.
추가의 실시양태에서, 본 발명에 따른 재조합 핵산 분자는 원핵생물 또는 진핵생물 세포에서 전사를 개시하는 조절성 서열에 의해 연결된 본 발명에 따른 핵산 분자를 포함한다.
세포에서 전사를 개시하는 조절성 서열은 프로모터로도 공지되어 있다.
조절성 서열 및 플라스미드에 관한 정보는 관련 기술분야의 기술자에게 널리 공지되어 있고, 예를 들어 월드 와이드 웹 (http://parts.igem.org/Catalog)에서 국제 유전자 조작 기기 (iGEM) 재단(The International Genetically Engineered Machine (iGEM) Foundation, 미국 02139 매사추세츠주 캠브릿지 스위트 비6104 원 켄달 스퀘어)에 의해 지원된 표준 생물학 부문 등록(Registry of Standard Biological Parts)에 기재되어 있다.
원핵생물 유기체, 예를 들어 이. 콜라이에서 및 진핵생물 유기체에서 전사를 개시하는 조절성 서열은 문헌에 충분히 기재되어 있고, 특히 효모, 예를 들어 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)에서의 이러한 발현이 기재되어 있다. 다양한 숙주 유기체에서 단백질의 발현을 위한 다양한 시스템의 개요는 예를 들어 문헌 [Methods in Enzymology 153 (1987), 383-516 및 Bitter et al. (Methods in Enzymology 153 (1987), 516-544) 또는 Gomes et al. (2016, Advances in Animal and Veterinary Sciences, 4(4), 346) 및 Baghban et al. (2018, Current Pharmaceutical Biotechnology, 19(6))]에서 확인할 수 있다. 일반적인 효모 프로모터는 pAOX1, pHIS4, pGAL, pScADH2이다 (Baghban et al., 2018, 상기 참고). 일반적인 박테리아 프로모터는 문헌 [Marschall et al. (2017, Appl Microbiol Biotechnol 101, 501-512) 및 Tegel et al. (2011, FEBS Journal 278, 729-739)]에 의해 기재된 T5, T7, 람노스-유도성, 아라비노스-유도성, PhoA, 인공 trc (trp-lac) 프로모터이다.
본 발명의 재조합 핵산 분자의 추가의 실시양태는 본 발명에 따른 핵산 분자를 포함하는 벡터 또는 플라스미드이다.
벡터는 일반적으로 분자 생물학 분야에서 및 본원에서 유전 물질 (DNA 또는 RNA)을 표적 세포에 전달하기 위해 사용되는 핵산 서열 또는 핵산 서열을 포함하는 비히클을 나타내는 것으로 이해된다. 벡터는 플라스미드, 예를 들어 트랜스제닉 식물을 생성하기 위한 T-DNA 또는 2성분 벡터, 숙주 세포에서 핵산 서열의 발현을 위한 발현 벡터, 상이한 숙주에서 번식할 수 있는 셔틀 벡터이거나, 또는 벡터는 외래 유전 물질을 숙주에게 전달하도록 변형된 바이러스 입자 또는 박테리오파지일 수 있다.
"플라스미드"는 일반적으로 분자 생물학 분야에서 및 본원에서, 숙주 세포에 존재하는 경우 염색체 DNA로부터 분리된, 자율적으로 자가-복제하는, 종종 원형인 DNA 분자를 나타내는 것으로 이해된다.
본 발명에 따른 핵산 분자, 본 발명에 따른 재조합 핵산 분자, 본 발명에 따른 벡터 또는 플라스미드는 예를 들어 숙주 세포에서 본 발명에 따른 핵산 분자를 발현함으로써 본 발명에 따른 단백질을 생성하기 위해 사용될 수 있다.
본 발명의 또 다른 실시양태는 본 발명에 따른 핵산 분자를 포함하거나 또는 발현하거나, 또는 본 발명에 따른 단백질을 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하는 숙주 또는 숙주 세포에 관한 것이다.
ω-TA의 활성을 갖는 단백질을 코딩하는 본 발명에 따른 핵산 분자는 예를 들어 그들의 증식을 위해 또는 본 발명에 따른 단백질의 생성을 위해 숙주 세포에서 발현될 수 있다. 숙주 세포에서의 발현을 위해, 본 발명에 따른 핵산 분자는 벡터 또는 플라스미드에 포함될 수 있거나, 또는 이들은 각각의 숙주 세포의 게놈에 안정하게 통합될 수 있다. 본 발명에 따른 핵산 분자는 또한 숙주 세포로 그들의 도입을 지원하는 벡터에 의해 포함될 수 있다.
본 발명의 추가의 실시양태는 본 발명에 따른 핵산 분자를 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하고, 각각의 경우에 본 발명에 따른 단백질을 포함하는 본 발명에 따른 숙주 또는 숙주 세포에 관한 것이다.
본 발명의 또 다른 실시양태는 본 발명에 따른 핵산 분자를 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하고, 각각의 경우에 본 발명에 따른 단백질을 발현하는 본 발명에 따른 숙주 또는 숙주 세포에 관한 것이다.
본 발명의 또 다른 실시양태는 본 발명에 따른 핵산 분자를 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하고, 각각의 경우에 ω-트랜스아미나제의 활성을 갖는 단백질을 발현하는 본 발명에 따른 숙주 또는 숙주 세포에 관한 것이다.
"핵산 분자의 발현"은 본원에서 핵산 분자가 RNA 또는 mRNA인 경우에 핵산 분자가 단백질로 번역되고, 바람직하게는 ω-TA의 활성을 갖는 단백질로 번역되거나, 또는 핵산 분자가 DNA 또는 cDNA인 경우에 mRNA로, 바람직하게는 ω-TA의 활성을 갖는 단백질을 코딩하는 mRNA로 전사되고 (그리고 인트론을 함유하는 게놈 DNA의 경우에는 가공되고), 후속적으로 단백질로 번역되는, 바람직하게는 ω-TA의 활성을 갖는 단백질로 번역되는 것을 의미하는 것으로 이해되어야 한다.
숙주에서 주어진 핵산 분자의 전사는 관련 기술분야의 기술자에게 공지된 방법에 의해, 예를 들어 노던 블롯 분석 또는 RT-PCR에 의한 외래 핵산 분자의 특이적인 전사체 (mRNA)의 검출에 의해 입증될 수 있다.
숙주 또는 숙주 세포가 주어진 단백질을 포함하는지 또는 핵산 분자의 발현으로부터 유래된 단백질을 포함하는지 여부는 관련 기술분야의 기술자에게 공지된 방법에 의해, 예를 들어 면역학적 방법, 예컨대 웨스턴 블롯 분석, ELISA (효소 결합 면역 흡착 검정) 또는 RIA (방사선 면역 검정)에 의해 결정될 수 있다. 관련 기술분야의 기술자는 특정한 단백질과 특이적으로 반응하는, 즉, 특정한 단백질에이적으로 결합하는 항체의 제조 방법에 익숙하다 (예를 들어, 문헌 [Lottspeich and Zorbas (eds.), 1998, Bioanalytik, Spektrum akad, Verlag, Heidelberg, Berlin, ISBN 3-8274-0041-4] 참고). 일부 회사 (써모 피셔 사이언티픽(Thermo Fisher Scientific), 미국 0245 매사추세츠주 월섬 써드 애비뉴 168; 진스크립트(GenScript), 미국 08854 뉴저지주 피스카타웨이 센테이얼 애비뉴 60)는 주문 서비스로서 이러항 항체의 제조를 제공한다.
추가로, 관련 기술분야의 기술자는 각각의 숙주 세포에서 ω-TA의 활성을 갖는 단백질의 (추가의) 활성을 검출함으로써 숙주 또는 숙주 세포가 본 발명에 따른 단백질을 포함하는지를 시험할 수 있다. 바람직하게는, 각각의 숙주 세포에서 ω-TA의 추가의 활성을 갖는 단백질의 활성은 본 발명에 따른 숙주 세포의 ω-TA의 활성을 본 발명에 따른 단백질을 포함하지 않는 숙주 세포의 각각의 활성과 비교함으로써 검출된다.
단백질이 ω-TA의 활성을 갖는지를 시험하는 것은 본원에서 상기 기재된 바와 같이 수행될 수 있다.
본 발명에 따른 숙주 또는 숙주 세포는 유기체를 유전적으로 변형시키거나 또는 형질전환시키는 공지된 방법에 의해 관련 기술분야의 기술자에 의해 생성될 수 있다.
따라서, 본 발명의 추가의 대상은 본 발명에 따른 핵산 분자로 또는 본 발명에 따른 재조합 핵산 분자로 또는 본 발명에 따른 벡터로 또는 본 발명에 따른 플라스미드로 유전적으로 변형된 (또는 형질전환된) 본 발명에 따른 숙주 또는 숙주 세포, 특히 원핵생물 또는 진핵생물 숙주 또는 숙주 세포이다. 바람직하게는, 본 발명에 따른 유전적으로 변형된 (형질전환된) 숙주 또는 숙주 세포는 ω-트랜스아미나제의 활성을 갖는 단백질을 발현하고, 더욱 바람직하게는, 본 발명에 따른 유전적으로 변형된 (형질전환된) 숙주 또는 숙주 세포는 본 발명에 따른 단백질을 발현한다.
"핵산 분자로 유전적으로 변형된" 또는 "핵산 분자로 형질전환된"은 본원에서 핵산 분자가 기술적 및/또는 비-천연 발생 수단에 의해, 바람직하게는 분자 생물학, 생명공학 또는 유전자 변형 분야의 기술적 방법에 의해 숙주 또는 숙주 세포에 도입되거나 또는 도입된 것을 의미하는 것으로 이해되어야 한다.
본 발명에 따른 숙주 또는 숙주 세포의 후손, 소산 또는 자손 또한 본 발명의 실시양태이며, 바람직하게는 이들 후손, 소산 또는 자손은 본 발명에 따른 핵산 분자를 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하거나, 또는 본 발명에 따른 단백질을 포함하고, 더욱 바람직하게는 이들 후손, 소산 또는 자손은 본 발명에 따른 핵산 분자를 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하고, 각각의 경우에 단백질을 발현하고, 상기 단백질은 ω-TA의 활성을 갖고, 훨씬 더 바람직하게는 이들 후손, 소산 또는 자손은 본 발명에 따른 핵산 분자를 포함하거나, 또는 본 발명에 따른 재조합 핵산 분자를 포함하거나, 또는 본 발명에 따른 벡터를 포함하거나, 또는 본 발명에 따른 플라스미드를 포함하고, 각각의 경우에 단백질을 발현하고, 상기 단백질은 본 발명에 따른 ω-TA의 활성을 갖는다.
본 발명에 따른 숙주 또는 숙주 세포는 임의의 원핵생물 또는 진핵생물 유기체로부터의 숙주 또는 숙주 세포일 수 있다. 숙주 또는 숙주 세포는 박테리아 또는 박테리아 세포 (예를 들어 이. 콜라이, 바실루스 속의 박테리아, 특히 바실루스 서브틸리스(Bacillus subtilis), 아그로박테리움(Agrobacterium), 특히 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 또는 아그로박테리움 리조게네스(Agrobacterium rhizogenes), 슈도모나스(Pseudomonas), 특히 슈도모나스 플루오레센스(Pseudomonas fluorescens), 스트렙토마이세스(Streptomyces) 종, 로도코커스(Rhodococcus) 종, 특히 로도코커스 로도크로우스(Rhodococcus rhodochrous), 비브리오 나트리겐스(Vibrio natrigens), 코리네박테리움, 특히 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 또는 진균 또는 진균 세포 (예를 들어 아가리쿠스(Agaricus), 특히 아가리쿠스 비스포루스(Agaricus bisporus), 아스퍼길러스(Aspergillus), 트리코더마(Trichoderma) 또는 효모, 특히 에스. 세레비지아에(S. cerevisiae), 피치아(Pichia) 종, 예컨대 피. 파스토리스(P. pastoris)), 뿐만 아니라 식물 또는 식물 세포일 수 있거나, 또는 이들은 동물 또는 동물 세포일 수 있다.
본 발명에 따른 바람직한 숙주 세포는 미생물의 세포이다. 본 특허 출원의 프레임워크 내에서, 이는 예를 들어 문헌 [Schlegel "General Microbiology " (Georg Thieme Publishing House (1985), 1-2)]에 정의된 바와 같이 모든 박테리아 및 모든 원생생물 (예를 들어 진균, 특히 효모 및 조류)을 포함하는 것으로 이해된다.
미생물과 관련하여, 본 발명에 따른 숙주 또는 숙주 세포는 바람직하게는 박테리아/박테리아 세포 또는 효모/효모 세포이고, 가장 바람직하게는 이들은 박테리아/박테리아 세포이다. 박테리아/박테리아 세포와 관련하여, 본 발명에 따른 숙주 또는 숙주 세포는 바람직하게는 바실루스 종/바실루스 종 세포 또는 에스케리키아 콜라이/에스케리키아 콜라이 세포 세포, 가장 바람직하게는 에스케리키아 콜라이/에스케리키아 콜라이 세포이다.
대안적으로, 슈도모나스, 특히 슈도모나스 플루오레센스, 스트렙토마이세스 종, 로도코커스 종, 특히 로도코커스 로도크로우스, 비브리오 종, 특히 비브리오 나트리겐스, 코리네박테리움, 특히 코리네박테리움 글루타미쿰 등이 본 발명에 따른 숙주 또는 숙주 세포일 수 있다.
본 발명의 바람직한 실시양태는 본 발명에 따른 핵산 분자를 포함하는 본 발명에 따른 숙주 또는 숙주 세포에 관한 것이며, 본 발명에 따른 핵산 분자는 상기 핵산 분자의 코돈이 각각 숙주 또는 숙주 세포의 코돈의 사용 빈도에 적합하도록 변경되는 것을 특징으로 한다.
본 발명에 따른 숙주 세포는 본 발명에 따른 단백질의 생성을 위해 사용될 수 있다. 본 발명에 따른 단백질은 아민 (공여자)의 존재 하에 카르보닐 (수용자)로부터 거울상이성질체적으로 풍부한 또는 거의 거울상이성질체적으로 순수한 아민의 생성을 위한 방법에서 사용될 수 있다.
본 발명에 따른 단백질에 의한 거울상이성질체적으로 풍부한 또는 거의 거울상이성질체적으로 순수한 아민의 생성 방법에서 촉매된 반응은 공식적으로 본원에서 상기 일반 방정식 (I)에 의해 기재될 수 있다
따라서, 본 발명의 또 다른 실시양태는 하기 단계를 포함하는 아민의 생성 방법에 관한 것이다:
a) 아민 수용자 분자를 제공하는 단계;
b) 아민 공여자 분자를 제공하는 단계;
c) 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자를 본 발명에 따른 단백질과 접촉시키는 단계;
d) 임의적으로, 아민을 수득하는 단계.
본 발명에 따른 아민 생성 방법의 바람직한 실시양태는 지방족 아민 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알칸 아민, 알켄 아민, 알킨 아민)의 생성 방법이거나, 또는 아릴 아민의 생성 방법이거나, 또는 아미노산의 생성 방법, 더욱 바람직하게는 α-아미노산의 생성 방법, 추가로 더 바람직하게는 분지형 α-아미노산, 방향족 α-아미노산, 또는 치환된 페닐 기를 포함하는 방향족 α-아미노산의 생성 방법, 가장 바람직하게는 아미노산 노르발린, 류신, 페닐알라닌 또는 티로신의 생성 방법이다.
추가의 아미노산 변형을 포함하는 본 발명에 따른 ω-TA 변이체와 관련하여 본 발명에 따른 아민 생성 방법은 바람직하게는 인 포함 지방족 아민 (예컨대 비제한적으로 인 포함 선형, 분지형 또는 시클릭 알칸 아민, 알켄 아민, 알킨 아민)의 생성 방법이거나, 또는 인 포함 아릴 아민의 생성 방법이거나, 또는 인 포함 아미노산의 생성 방법, 더욱 바람직하게는 인 포함 α-아미노산의 생성 방법, 추가로 더 바람직하게는 인 포함 분지형 α-아미노산, 인 포함 방향족 α-아미노산, 또는 치환된 페닐 기를 포함하는 인 포함 방향족 α-아미노산의 생성 방법, 훨씬 더 바람직하게는 인 포함 α-아미노산의 생성 방법, 추가로 훨씬 더 바람직하게는 메틸 치환된 인을 포함하는 α-아미노산의 생성 방법, 가장 바람직하게는 글루포시네이트의 생성 방법이다.
본 발명에 따른 아민 생성 방법의 단계 a)에서 아민 수용자 분자는 아민 공여자 분자로부터 아미노 기를 수용하는 카르보닐 기를 포함하는 분자이며, 이로써 수용자 분자의 카르보닐 기는 아민이 된다.
바람직하게는, 본 발명에 따른 아민 생성 방법의 단계 a)에서 아민 수용자 분자는 지방족 케톤 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알카논, 알케논, 알키논)이거나, 또는 아릴 케톤이거나, 또는 케토산이고, 더욱 바람직하게는 이는 케토산이고, 추가로 더 바람직하게는 이는 α-케토산이고, 가장 바람직하게는 아민 수용자 분자는 2-옥소발레르산, 4-메틸-2-옥소발레르산, 페닐피루브산 또는 4-히드록시페닐피루브산으로 이루어진 군으로부터 선택된다.
추가의 아미노산 변형을 포함하는 본 발명에 따른 단백질 ω-TA 변이체와 관련하여, 본 발명에 따른 아민 생성 방법의 단계 a)에서 아민 수용자 분자는 바람직하게는 인 함유 지방족 케톤 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알카논, 알케논, 알키논)이거나, 또는 인 함유 아릴 케톤, 또는 인 함유 케토산이고, 더욱 바람직하게는 아민 수용자 분자는 인 포함 케토산이고, 추가로 더 바람직하게는 아민 수용자 분자는 인 포함 α-케토산, 훨씬 더 바람직하게는 메틸 치환된 인 포함 α-케토산이고, 가장 바람직하게는 단계 a)에서 아민 수용자 분자는 4-[히드록시(메틸)포스포릴]-2-옥소부탄산이다.
바람직하게는, 본 발명에 따른 아민 생성 방법의 단계 a)에서 아민 수용자 분자는 30 g/l (그램/리터) 내지 300 g/l, 더욱 바람직하게는 30 g/l 내지 250 g/l, 훨씬 더 바람직하게는 40 g/l 내지 250 g/l, 추가로 더 바람직하게는 50 g/l 내지 250 g/l의 양으로 제공된다.
본 발명에 따른 아민 생성 방법의 단계 b)에서 아민 공여자 분자는 아민 기를 아민 수용자 분자에 공여하는 아민 기를 포함하는 분자이며, 이로써 아민 공여자 분자의 아민 기는 카르보닐 기가 된다.
본 발명에 따른 아민 생성 방법의 단계 b)에서 아민 공여자 분자는 키랄, 프로-키랄 또는 비-키랄 아민일 수 있고, 바람직하게는 아민 공여자 분자는 각각 키랄, 프로-키랄 또는 비-키랄의 알킬- 또는 아릴- 또는 아릴-알킬 아민이고, 더욱 바람직하게는 아민 공여자 분자는 아미노산 또는 알킬-아민이다.
알킬- 또는 아릴 아민과 관련하여, 본 발명에 따른 아민 생성 방법의 단계 b)에서 사용되는 바람직한 아미노 공여자 분자는 β-알라닌, 1-프로필아민, (라세미-) 2-부틸아민, 6-아미노헥산산, 이소프로필아민, 벤질아민, 메틸벤질아민, 1-아미노인단, 1-메틸-3-페닐프로필아민이다.
아미노 공여자가 비-키랄 아미노산인 경우, 글리신은 본 발명에 따른 아민 생성 방법의 단계 b)에 제공되기에 바람직한 아미노 공여자 분자이다. 본 발명에 따른 아민 생성 방법의 단계 b)에서 아미노 공여자가 키랄 아미노산인 경우, 아미노산은 바람직하게는 그의 (S)-거울상이성질체로 나타내어 진다. 본 발명에 따른 아민 생성 방법의 단계 b)에서 제공되는 (S)-배위를 갖는 바람직한 아미노산 공여자 분자는 (S)-메틸벤질아민, (S)-1-아미노인단, (S)-1-메틸-3-페닐프로필아민 (S)-아스파르트산, (S)-아스파라긴, (S)-알라닌, (S)-글루타민, (S)-글루탐산, (S)-오르니틴, (S)-포스포세린, (S)-페닐알라닌, (S)-류신, (S)-티로신, (S)-노르발린이다.
본 발명에 따른 아민 생성 방법의 단계 b)에서 제공되기에 가장 바람직한 아미노 공여자 분자는 이소프로필아민이다.
이소프로필아민이 본 발명에 따른 방법에서 아미노 공여자 분자로 사용되는 경우, 이는 ω-TA의 작용에 의해 아세톤으로 전환된다. 아세톤은 비교적 낮은 온도에서 증발한다는 이점을 유도하는 휘발성 화합물이다. 이는 반응 동안에 반응 혼합물로부터 ω-TA에 의해 생성된 아세톤을 제거하여, 반응의 평형이 본 발명에 따른 아민 생성 방법에 의해 생성된 아민 쪽으로 이동하는 유리한 효과를 유도한다. 이는 ω-TA에 의해 촉매되는 역반응이 한 반응 파트너의 결여로 인해 감소되기 때문에 원하는 아민을 다량으로 수득할 수 있게 한다.
바람직하게는, 본 발명에 따른 아민 생성 방법의 단계 b)에서 아민 공여자 분자는 10 g/l (그램/리터) 내지 250 g/l, 더욱 바람직하게는 15 g/l 내지 200 g/l, 추가로 더 바람직하게는 17 g/l 내지 180 g/l의 양으로 제공된다.
본 발명에 따른 아민 생성 방법의 단계 c)에서, 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자를 바람직하게는 용액 중에서 본 발명에 따른 단백질과 접촉시킨다. 용액은 물만 포함하는 수성 용액일 수 있지만, 이는 또한 물 및 유기 용매를 포함하는 용액일 수 있다. 본 발명에 따른 아민 생성 방법의 단계 c)에서 유기 용매를 포함하는 수성 용액 중에서 본 발명에 따른 단백질을 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 접촉시키는 경우에, 유기 용매는 바람직하게는 DMSO (디-메틸 술폭시드), DMAc (디메틸아세트아미드), DMF (디메틸포름아미드), 아세토니트릴, 톨루엔, tert-부틸메틸에테르, 헥산, 헵탄으로부터 선택된다. DMSO, DMAc 및 톨루엔이 가장 바람직하다.
바람직하게는 유기 용매를 포함하는 수성 용액은 10% 이하, 더욱 바람직하게는 20% 이하, 추가로 더 바람직하게는 30% 이하, 훨씬 더 바람직하게는 40% 이하, 가장 바람직하게는 50% 이하의 양으로 유기 용매를 포함한다.
유기 용매를 포함하는 수성 용액의 사용은 본 발명에 따른 아민 생성 방법의 단계 a)에서 제공된 아민 수용자 분자 및/또는 단계 b)에서 제공된 아민 공여자 분자가 낮은 용해도를 갖는 경우에 이들 각각의 용해도가 개선되어 더 많은 양의 기질이 ω-TA에 대해 이용가능해질 수 있다는 이점을 갖는다. 이는 더 높은 반응 속도를 유도하하며, 이는 더 많은 양의 원하는 아민이 더 적은 부피 및 더 짧은 시간으로 생성되어, 공간-시간 수율을 개선시킨다는 것을 의미한다.
본 발명에 따른 아민 생성 방법의 단계 c)에서 수성 용액 중에서 본 발명에 따른 단백질을 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 접촉시키는 경우, 용액은 바람직하게는 pH를 조정하기 위한 완충제 시스템을 포함한다. 바람직한 완충제 시스템은 TRIS-HCl, MOPS, HEPES, TRIS, 비신(Bicine)을 포함하는 것들이다.
바람직하게는, 본 발명에 따른 아민 생성 방법의 단계 c)에서 본 발명에 따른 단백질을 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 접촉시키는 수성 용액의 pH는 pH 4 내지 pH 11의 값으로, 더욱 바람직하게는 pH 5 내지 pH 10의 값으로, 추가로 더 바람직하게는 pH 6 내지 pH 10의 값으로, 훨씬 더 바람직하게는 pH 7 내지 pH 10의 값으로, 추가로 훨씬 더 바람직하게는 pH 8 내지 pH 10의 값으로, 가장 바람직하게는 pH 8.5 내지 pH 9.5의 값으로 조정된다.
바람직하게는, 본 발명에 따른 아민 생성 방법의 단계 c)에서 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 본 발명에 따른 단백질의 접촉은 10℃ 내지 60℃, 더욱 바람직하게는 20℃ 내지 60℃, 추가로 더 바람직하게는 25℃ 내지 55℃, 훨씬 더 바람직하게는 30℃ 내지 50℃, 추가로 훨씬 더 바람직하게는 30℃ 내지 45℃, 가장 바람직하게는 34℃ 내지 42℃의 온도에서 일어난다.
단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 본 발명에 따른 단백질을 본 발명에 따른 아민 생성 방법의 단계 c)에서 아민을 생성하기에 충분한 시간 동안 접촉시킨다.
바람직하게는, 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 본 발명에 따른 단백질을 본 발명에 따른 아민 생성 방법의 단계 c)에서 5 시간 내지 48 시간, 더욱 바람직하게는 5 시간 내지 36 시간 동안, 추가로 더 바람직하게는 5 시간 내지 30 시간 동안, 훨씬 더 바람직하게는 5 시간 내지 24 시간 동안, 추가로 훨씬 더 바람직하게는 5 시간 내지 18 시간 동안, 가장 바람직하게는 5 시간 내지 14 시간 동안, 특히 바람직하게는 5 시간 내지 13 시간 동안 접촉시킨다.
본 발명에 따른 아민 생성 방법의 단계 c)에서 본 발명에 따른 단백질과 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자의 접촉을 위해, 단백질을 상이한 형태의 아민 수용자 분자 및 아민 공여자 분자와 접촉시킬 수 있고, 바람직하게는 단백질을 부분적으로 정제된 형태의 아민 수용자 분자 및 아민 공여자 분자와 접촉시키거나, 또는 단백질을 정제된 형태의 아민 수용자 분자 및 아민 공여자 분자와 접촉시키거나, 또는 단백질은 아민 수용자 분자 및 아민 공여자 분자와 접촉할 때 조 세포 추출물로 존재하거나, 또는 단백질은 살아있는 또는 살아있지 않은 숙주 세포의 성분으로서 존재할 때 아민 수용자 분자 및 아민 공여자 분자와 접촉한다.
본 발명에 따른 아민 생성 방법의 단계 c)에서 단백질을 숙주 세포의 성분으로서 아민 수용자 분자 및 아민 공여자 분자와 접촉시키는 경우, 숙주 세포는 숙주 세포를 배양하기 위해 사용된 배양 배지를 포함하는 것들일 수 있거나, 또는 숙주 세포는 숙주 세포가 배양된 배양 배지를 함유하지 않을 수 있거나, 또는 숙주 세포는 (추가로) 가공되었을 수 있고, 바람직하게는 숙주 세포는 숙주 세포가 배양된 배양 배지를 거의 함유하지 않고, 더욱 바람직하게는 숙주 세포는 (추가로) 가공되었고, 훨씬 더 바람직하게는 숙주 세포는 숙주 세포가 배양된 배양 배지를 거의 함유하지 않고, 숙주 세포는 (추가로) 가공되었다.
"조 세포 추출물"은 본원에서 세포에 존재하는 모든 또는 실질적으로 모든 무기 또는 유기 물질 (추가의 단백질 및/또는 핵산 분자 포함)을 포함하는 살아있는 세포의 파괴에 의해 수득된 추출물을 의미할 것이다.
"부분적으로 정제된"은 본원에서 단백질을 발현하는 살아있는 세포에 존재하는 총 무기 또는 유기 물질 (추가의 단백질 및/또는 핵산 분자 포함)의 (단지) 일부를 포함하는 조성물을 함유하는 단백질을 의미할 것이다.
부분적으로 정제된 추출물은 예를 들어 원심분리, 여과, 임의의 유형의 크로마토그래피 분리, 투석 등과 같은 일반적으로 공지된 수단에 의해 조 세포 추출물로부터 유기 또는 무기 물질의 분획화에 의해 수득될 수 있다. 조 세포 추출물의 분획화는 동일한 또는 상이한 분획화 방법을 이용하여 반복적으로 수행될 수 있고, 침전 단계를 포함할 수 있다.
"정제된"은 본원에서 특이적인 활성 (물질의 총량으로 나눈 분획 건조 중량에 존재하는 단백질, 특히 분획 건조 중량 중 다른 단백질의 활성)이 추가의 분획화 또는 정제 단계에 의해 증가될 수 없는 단백질을 의미할 것이다.
그러나, 용어 "정제된"에 대해 상기 주어진 일반적으로 허용되는 정의로부터, "정제된"은 대부분의 경우에 임의의 추가의 무기 및/또는 유기 화합물이 단백질에 전혀 없음을 의미하는 것은 아님이 자명하다. 바람직하게는, 정제된은 본원에서 본 발명에 따른 단백질이 단백질을 함유하는 건조 중량 물질의 중량의 적어도 95%, 더욱 바람직하게는 적어도 96%, 추가로 더 바람직하게는 적어도 97%, 훨씬 더 바람직하게는 적어도 98%, 추가로 훨씬 더 바람직하게는 적어도 99%, 가장 바람직하게는 적어도 99.5%를 나타냄을 의미할 것이다.
용어 "살아있는 세포"는 본원에서 성장 및/또는 번식할 수 있는 세포를 의미할 것이다.
용어 "살아있지 않은 세포"는 본원에서 성장 및/또는 번식할 수 없는 세포를 의미할 것이다.
살아있지 않은 세포는 비록 더이상 번식 및/또는 성장할 수 없지만, 그러나 본 출원과 관련된 효소 활성, 특히 본 발명에 따른 ω-TA의 활성을 갖는 단백질의 활성을 여전히 나타낸다.
본원에서 사용된 바와 같이, 용어 "배양 배지를 함유하지 않는"은 본원에서 (숙주) 세포의 배양을 위해 사용된 배양 배지가 예를 들어 원심분리 및/또는 여과에 의해 제거된 것을 의미한다.
그러나, 상기 주어진 일반적으로 허용되는 이해로부터, 용어 "배양 배지를 함유하지 않는"은 대부분의 경우에 배양 배지에 존재했던 임의의 추가의 무기 및/또는 유기 화합물이 세포에 완전히 없다는 것을 반드시 의미하는 것은 아님이 자명하다. 바람직하게는, 정제된은 본원에서 본 발명에 따른 세포가 배양 배지를 함유하지 않는 세포를 포함하는 건조 중량 물질의 총량의 적어도 95%, 더욱 바람직하게는 적어도 96%, 추가로 더 바람직하게는 적어도 97%, 훨씬 더 바람직하게는 적어도 98%, 추가로 훨씬 더 바람직하게는 적어도 99%, 가장 바람직하게는 적어도 99.5%를 나타냄을 의미할 것이다.
용어 "숙주 세포가 (추가로) 가공된"은 본원에서 본 발명에 따른 단백질을 포함하는 숙주 세포를 본 발명에 따른 아민 생성 방법의 단계 c)에서 아민 수용자 분자 및 아민 공여자 분자와 접촉하기 전에 이들을 물리적 및/또는 화학적 수단으로 처리하였고, 바람직하게는 이들을 물리적 수단으로 처리하였고, 더욱 바람직하게는 이들을 건조시켰고, 추가로 더 바람직하게는 이들을 냉동 건조 또는 분무 건조시켰고, 가장 바람직하게는 이들을 분무 건조시켰음을 의미할 것이다.
세포의 건조 공정, 특히 냉동 건조 및 분무 건조 공정은 관련 기술분야의 기술자에게 공지되어 있다. 바람직하게는 본 발명에 따른 단백질을 포함하는 숙주 세포를 본 발명에 따른 아민 생성 방법의 단계 c)에서 접촉시키기 전에 본원에서 "일반적인 방법" 항목 9에 기재된 방법에 의해 이들을 냉동 건조 또는 분무 건조시켰고, 가장 바람직하게는 이들을 분무 건조시켰다.
ω-TA의 활성을 갖는 단백질이 피리독살 포스페이트 (PLP) 의존성 효소임이 관련 기술분야의 기술자에게 공지되어 있다. 바람직한 실시양태에서, 본 발명에 따른 아민 생성 방법의 단계 c)에서 PLP의 존재 하에 단백질을 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자와 접촉시키고, 더욱 바람직하게는 PLP는 0.05 g/l 내지 2.0 g/l의 양으로, 추가로 더 바람직하게는 0.05 g/l 내지 1.5 g/l의 양으로, 훨씬 더 바람직하게는 0.05 g/l 내지 1.0 g/l의 양으로, 추가로 훨씬 더 바람직하게는 0.075 g/l 내지 0.75 g/l의 양으로, 가장 바람직하게는 0.1 g/l 내지 0.5 g/l의 양으로 존재한다.
아민 생성 방법에서 필수 단계 d)에서 아민을 수득하는 것은, 생성된 아민의 임의의 추가의 정제없이도 단계 d)의 조성물에 아민이 존재하는 것을 의미하거나, 또는 생성된 아민을 추가로 정제하는 것을 의미할 수 있다. 아민의 정제는 관련 기술분야의 기술자에게 공지된 방법에 의해 수행될 수 있다. 이러한 아민 정제 방법에는 침전을 수반하는 방법, 크로마토그래피, 증류, 추출, 흡착 또는 여과를 포함하는 방법이 포함되나 이로 제한되지 않는다.
본 발명에 따른 아민 생성 방법의 바람직한 실시양태는 하기 단계를 포함하는, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물을 생성하는 방법이다:
a) 아민 수용자 분자를 제공하는 단계;
b) 아민 공여자 분자를 제공하는 단계;
c) 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자를 본 발명에 따른 단백질과 접촉시키는 단계;
d) 임의적으로, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물을 수득하는 단계.
본원에서 사용된 바와 같이, 용어 "거울상이성질체"는 화학 분야에서 일반적으로 이해되는 바와 같이 서로 중첩되지 않는 구조적으로 거울상인 두 입체이성질체 중 하나인 분자를 의미한다. 용어 "거울상이성질체"는 일반적으로 "광학 이성질체"로도 공지되어 있다.
용어 "거울상이성질체 과량 (일반적으로 "ee"로 약칭됨)"은 화학 기술 분야에서 일반적으로 이해되며, 조성물에서 한 거울상이성질체가 각각의 다른 것에 비해 과량임을 나타내기 위해 본원에서 사용되고, 각각의 거울상이성질체의 몰 분율 사이의 절대 차이로서 정의된다. 종종 거울상이성질체 과량은 관련 기술분야에서 % 거울상이성질체 과량으로 표현된다. 예를 들어, 70%의 (S)-거울상이성질체 및 30%의 (R)-거울상이성질체를 포함하는 조성물은 (S)-거울상이성질체와 관련하여 ee = 40% (40% 순수한 (S)-거울상이성질체 + 60% 라세미 (= 30% (S) + 30% (R))를 갖는다. 결론적으로, 라세미 거울상이성질체 혼합물은 ee = 0%를 갖고, 순수한 (S)- 또는 (R)-거울상이성질체는 ee = 100%를 갖는다.
(S)-아민을 거울상이성질체 과량으로 포함하는 조성물을 생성하기 위한 본 발명에 따른 방법의 바람직한 실시양태는 지방족 (S)-아민 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알칸 아민, 알켄 아민, 알킨 아민)을 거울상이성질체 과량으로 생성하는 방법이거나, 또는 아릴 (S)-아민을 거울상이성질체 과량으로 생성하는 방법이거나, 또는 (S)-아미노산을 거울상이성질체 과량으로 생성하는 방법, 더욱 바람직하게는 (S)-α-아미노산을 거울상이성질체 과량으로 생성하는 방법, 추가로 더 바람직하게는 분지형 (S)-α-아미노산, 방향족 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 방향족 (S)-α-아미노산을 거울상이성질체 과량으로 생성하는 방법, 가장 바람직하게는 아미노산 (S)-노르발린, (S)-류신, (S)-페닐알라닌 또는 (S)-티로신을 거울상이성질체 과량으로 생성하는 방법이다.
추가의 아미노산 변형을 포함하는 본 발명에 따른 ω-TA 변이체와 관련하여, (S)-아민을 거울상이성질체 과량으로 포함하는 조성물을 생성하기 위한 본 발명에 따른 방법은 바람직하게는 인 포함 지방족 (S)-아민 (예컨대 비제한적으로 인 포함 선형, 분지형 또는 시클릭 알칸 (S)-아민, 알켄 (S)-아민, 알킨 (S)-아민)을 거울상이성질체 과량으로 생성하는 방법이거나, 또는 인 포함 아릴 (S)-아민을 거울상이성질체 과량으로 생성하는 방법이거나, 또는 인 포함 (S)-아미노산을 거울상이성질체 과량으로 생성하는 방법, 더욱 바람직하게는 인 포함 (S)-α-아미노산을 거울상이성질체 과량으로 생성하는 방법, 추가로 더 바람직하게는 인 포함 분지형 (S)-α-아미노산, 인 포함 방향족 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 인 포함 방향족 (S)-α-아미노산을 거울상이성질체 과량으로 생성하는 방법, 훨씬 더 바람직하게는 인 포함 (S)-α-아미노산을 거울상이성질체 과량으로 생성하는 방법, 추가로 훨씬 더 바람직하게는 메틸 치환된 인을 포함하는 (S)-α-아미노산을 거울상이성질체 과량으로 생성하는 방법, 가장 바람직하게는 (S)-글루포시네이트를 거울상이성질체 과량으로 생성하는 방법이다.
(S)-아민을 거울상이성질체 과량으로 포함하는 조성물을 생성하기 위한 본 발명에 따른 방법의 또 다른 바람직한 실시양태는 (S)-아민을 적어도 20%, 더욱 바람직하게는 적어도 40%, 추가로 더 바람직하게는 적어도 60%, 훨씬 더 바람직하게는 적어도 80%, 추가로 훨씬 더 바람직하게는 적어도 90%, 특히 바람직하게는 적어도 94%, 가장 바람직하게는 적어도 96% 또는 특히 바람직하게는 적어도 98%의 거울상이성질체 과량 (ee)으로 포함하는 조성물을 생성하는 방법이다.
본 발명에 따른 아민 생성 방법의 단계 a)에서 제공되는 아민 수용자 분자의 바람직한 실시양태 및 제공되는 양의 바람직한 실시양태 및 단계 b)에서 제공되는 아민 공여자 분자의 바람직한 실시양태 및 제공되는 양의 바람직한 실시양태와 관련하여 본원에서 상기 정의된 것은, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물의 생성 방법에서 단계 a)의 아민 수용자 분자 및 단계 b)의 아민 공여자 분자 각각에 상응하게 적용가능하다. 그러나, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물의 생성 방법에서 단계 b)에서 제공되는 아민 공여자 분자가 키랄 분자인 경우, 적어도 아민 공여자의 (S)-입체이성질체를 포함하는 거울상이성질체 혼합물이 제공되고, 바람직하게는 아민 공여자의 라세미 혼합물이 제공되는 것이 자명하다. 경제적인 비용의 측면에서 이용가능하고 실현가능한 경우, 키랄 아민 공여자는 바람직하게는 (S)-입체이성질체가 거울상이성질체 과량인 혼합물로 제공될 수 있고, 더욱 바람직하게는, 아민 공여자는 (S)-입체이성질체를 높은 거울상이성질체 과량으로 포함하는 조성물로서 제공될 수 있고, 이 경우 높은 거울상이성질체 과량은 적어도 30%, 더욱 바람직하게는 적어도 40%, 추가로 더 바람직하게는 적어도 60%, 훨씬 더 바람직하게는 적어도 80%, 추가로 훨씬 더 바람직하게는 적어도 90%, 특히 바람직하게는 적어도 94%, 가장 바람직하게는 적어도 96% 또는 특히 바람직하게는 적어도 98%의 거울상이성질체 과량을 의미한다.
본 발명에 따른 아민 생성 방법의 단계 c)에 대해 용액, 수성 용액, 유기 용매를 포함하는 수성 용액, 완충제 시스템, pH 값 및/또는 온도, 단백질의 형태 (조 세포 추출물, 부분적으로 정제된 단백질, 정제된 단백질, 살아있는 또는 살아있지 않은 숙주 세포의 성분으로서 존재하는 단백질, (추가로) 가공된 숙주 세포, 숙주 세포의 분무 건조), 단백질의 양 및 PLP의 존재 및 양의 바람직한 실시양태와 관련하여 본원에서 상기 정의된 것은, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물의 생성 방법의 단계 c)에 상응하게 적용가능하다.
본 발명에 따른 아민 생성 방법의 단계 d)의 바람직한 실시양태와 관련하여 상기 정의된 것은, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물의 생성 방법의 단계 d)에 상응하게 적용가능하다.
본 발명에 따른 아민 생성 방법의 단계 d)에 대해 정의된 것 외에도, 바람직하게는 (S)-아민을 적어도 40%, 더욱 바람직하게는 적어도 70%, 추가로 더 바람직하게는 적어도 80%, 훨씬 더 바람직하게는 적어도 90%, 추가로 훨씬 더 바람직하게는 적어도 95%, 특히 바람직하게는 적어도 97%, 가장 바람직하게는 적어도 98% 또는 특히 바람직하게는 적어도 99%의 거울상이성질체 과량으로 포함하는 조성물이, 그의 (각각의) (R)-아민에 비해 거울상이성질체 과량으로 (S)-아민을 포함하는 조성물을 생성하는 방법의 단계 d)에서 수득된다.
본 발명에 따른 단백질은 또한 (R)- 및 (S)-아민 입체이성질체를 포함하는 조성물로부터 입체이성질체를 감소시키거나 또는 제거하는 방법에서 사용될 수 있다. (R)- 및 (S)-아민 이성질체를 포함하는 조성물로부터 입체이성질체를 감소시키거나 또는 제거할 때 본 발명에 따른 단백질에 의해 촉매된 반응은 일반 방정식 (Ia)를 따른다. 아민의 합성 반응 (방정식 (I) 참고)과 비교하여, 아미노 공여자 및 아미노 수용자는 (R)- 및 (S)-아민을 포함하는 조성물로부터 입체이성질체를 감소시키거나 또는 제거하는 반응에서 서로 교환되는 것으로 볼 수 있다 (방정식 (Ia) 참고). 방정식 (Ia)에 따른 반응은, 특정한 입체이성질체가 상이한 입체이성질체를 포함하는 조성물에서 풍부할 수 있거나, 또는 달리 말하면, 특정한 입체이성질체가 조성물로부터 제거될 수 있다는 이점을 가지며, 이는 때때로 관련 기술분야에서 거울상이성질체 혼합물을 분할하는 것으로서 지정된다. 이들 방법은 화합물이 일반적으로 라세미 혼합물을 생성하는 화학적 합성에 의해 생성되는 경우에 특히 중요하다. 이러한 화합물의 화학적 합성은 공정 경제성 및 다른 이유의 측면에서 원하는 생성 공정일 수 있다. 그러나, 화학적으로 생성된 거울상이성질체의 분리는 어렵거나, 비용이 많이 들거나 또는 심지어 불가능할 수 있다. 본 발명에 따른 단백질은 이러한 화학적으로 생성된 라세미 혼합물로부터 입체이성질체를 제거하기 위해 선택적으로 사용될 수 있다.
따라서, 본 발명의 추가의 실시양태는 하기 단계를 포함하는, (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법에 관한 것이다:
a) (R)-아민 및 (S)-아민 거울상이성질체를 포함하는 조성물을 제공하는 단계
b) 아민 수용자 분자를 제공하는 단계;
c) 단계 a)에서 제공된 조성물 및 단계 b)에서 제공된 아민 수용자를 본 발명에 따른 단백질과 접촉시키는 단계;
d) 임의적으로, 아민 거울상이성질체의 양이 단계 a)에서 제공된 조성물에서 존재하는 양과 비교하여 감소된 것인 조성물을 수득하는 단계.
(R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법에서, 적어도 하나의 (S)-아민 및 하나의 (R)-아민 분자가 존재하는 한, 얼마나 많은 구조적으로 상이한 (R)-아민 및 (S)-아민 분자가 이들 각각의 방법의 단계 a)에서 제공된 조성물에 존재하는지는 결정적이지 않다.
(R)- 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법의 단계 a)에서 제공된 (R)- 및 (S)-아민을 포함하는 조성물은 적어도 하나의 (R)-아민 및 적어도 하나의 (S)-아민을 포함하고, 적어도 하나의 (R)-아민 및 적어도 하나의 (S)-아민은 동일한 분자의 입체이성질체일 수 있거나, 또는 적어도 하나의 (R)-아민 및 적어도 하나의 (S)-아민은 구조적으로 상이한 분자로부터의 입체이성질체일 수 있다.
(R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법의 바람직한 실시양태는 지방족 아민 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알칸 아민, 알켄 아민, 알킨 아민)의 거울상이성질체의 양을 감소시키는 방법이거나, 또는 아릴 아민의 거울상이성질체의 양을 감소시키는 방법이거나, 또는 아미노산의 거울상이성질체의 양을 감소시키는 방법, 더욱 바람직하게는 α-아미노산의 거울상이성질체의 양을 감소시키는 방법, 추가로 더 바람직하게는 분지형 α-아미노산의 거울상이성질체, 방향족 α-아미노산의 거울상이성질체, 또는 치환된 페닐 기를 포함하는 방향족 α-아미노산의 거울상이성질체의 양을 감소시키는 방법, 가장 바람직하게는 노르발린, 류신, 페닐알라닌 또는 티로신으로부터 선택된 아미노산의 거울상이성질체의 양을 감소시키는 방법이다.
본 발명에 따른 추가의 아미노산 변형을 포함하는 ω-TA 변이체와 관련하여, (R)- 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키기 위한 바람직하게는 본 발명에 따른 방법은 인 포함 지방족 아민 (예컨대 비제한적으로 인 포함 선형, 분지형 또는 시클릭 알칸 아민, 알켄 아민, 알킨 아민)의 거울상이성질체의 양을 감소시키는 방법이거나, 또는 인 포함 아릴 아민의 거울상이성질체의 양을 감소시키는 방법이거나, 또는 인 포함 아미노산의 거울상이성질체의 양을 감소시키는 방법, 더욱 바람직하게는 인 포함 α-아미노산의 거울상이성질체의 양을 감소시키는 방법, 추가로 더 바람직하게는 인 포함 분지형 α-아미노산의 거울상이성질체, 인 포함 방향족 α-아미노산의 거울상이성질체, 또는 치환된 페닐 기를 포함하는 인 포함 방향족 α-아미노산의 거울상이성질체의 양을 감소시키는 방법, 훨씬 더 바람직하게는 치환된 인 포함 α-아미노산의 거울상이성질체의 양을 감소시키는 방법, 추가로 훨씬 더 바람직하게는 메틸 치환된 인을 포함하는 α-아미노산의 거울상이성질체의 양을 감소시키는 방법, 가장 바람직하게는 글루포시네이트의 거울상이성질체의 양을 감소시키는 방법이다.
본 발명에 따른 아민 생성 방법의 단계 c)에 대해 용액, 수성 용액, 유기 용매를 포함하는 수성 용액, 완충제 시스템, pH 값 및/또는 온도, 단백질의 형태 (조 세포 추출물, 부분적으로 정제된 단백질, 정제된 단백질, 살아있는 또는 살아있지 않은 숙주 세포의 성분으로서 존재하는 단백질, (추가로) 가공된 숙주 세포, 숙주 세포의 분무 건조), 단백질의 양 및 PLP의 존재 및 양의 바람직한 실시양태와 관련 하에 본원에서 상기 정의된 것은, (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법의 단계 c)에 상응하게 적용가능하다.
본 발명에 따른 아민 생성 방법의 단계 d)의 바람직한 실시양태와 관련하여 본원에서 상기 정의된 것은, (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법의 단계 d)에 상응하게 적용가능하다.
본 발명에 따른 단백질은 특히 (R)-아민 및 (S)-아민 입체이성질체를 포함하는 조성물로부터 (S)-거울상이성질체의 양을 감소시키거나, 또는 이를 실질적으로 또는 거의 완전히 제거하는 방법에서 사용될 수 있으며, 이로써 (R)-아민이 거울상이성질체 과량으로 존재하는 조성물이 생성된다. 거울상이성질체적으로 풍부한 또는 거의 거울상이성질체적으로 순수한 아민을 생성하는 방법에서 (S)-선택적 ω-TA에 의해 촉매된 각각의 반응은 공식적으로 일반 방정식 (II)에 의해 설명될 수 있다:
R1-CH((S,R)-NH2)-R2 + R3-CO-R4 → R1-CO-R2 + R3-CH((R)-NH2)-R4
생물학적 활성을 갖는 여러 화합물, 예컨대 의약품, 농경학에서 사용되는 활성 화합물, 보조 식품 첨가제, 사료 첨가제 등은 거울상이성질체로 존재한다. 대부분의 경우에, 거울상이성질체 중 하나만이 원하는 생물학적 활성을 나타내고, 다른 것은 비활성이거나 또는 종종 심지어 원치않는 부작용을 나타낸다. 오늘날 생물학적 활성을 갖고 의약품으로서, 농격학에서, 보조 식품 또는 사료 첨가제 (예를 들어 아미노산)로서 사용되는 수많은 화합물은 라세미 혼합물로서만 이용가능하다는 단점 때문에, 이들 화합물은 화학적 합성에 의해 경제적으로 실현가능한 조건 하에서만 생성될 수 있다. 본 발명에 따른 단백질은 (S)-아민의 양이 이러한 라세미 혼합물로부터 부분적으로, 유의하게 또는 거의 완전히 제거될 수 있다는 이점을 제공하며, 생물학적으로 활성인 거울상이성질체, 또는 이용되는 생물학적으로 활성인 거울상이성질체의 생성 방법에서 사용하기 위한 전구체를 포함하거나, 또는 비활성 거울상이성질체가 거의 없는 조성물에서 생물학적으로 활성인 거울상이성질체 또는 그의 전구체를 포함하는 조성물이 수득된다는 효과가 있다. 이는 의약품, 농경학에서 사용되는 생성물, 또는 보조 식품 또는 사료 첨가제를 포함하는 생성물에서 부작용을 감소시킨다.
바람직한 실시양태에서, (R)-아민 및 (S)-아민 거울상이성질체를 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법은 하기 단계를 포함하는, (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체를 감소시키는 방법이다:
a) (R)-아민 및 (S)-아민을 포함하는 조성물을 제공하는 단계;
b) 아민 수용자 분자를 제공하는 단계;
c) 단계 a)에서 제공된 조성물 및 단계 b)에서 제공된 아민 수용자 분자를 본 발명에 따른 단백질과 접촉시키는 단계;
d) 임의적으로, (S)-아민 거울상이성질체의 양이 단계 a)에서 제공된 조성물에서 존재하는 양과 비교하여 감소된 것인 조성물을 수득하는 단계.
(R)- 및 (S)-아민 거울상이성질체를 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법의 바람직한 실시양태는 지방족 (S)-아민 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알칸 (S)-아민, 알켄 (S)-아민, 알킨 (S)-아민)의 양을 감소시키는 방법이거나, 또는 아릴 (S)-아민의 양을 감소시키거나 또는 (S)-아미노산의 양을 감소시키는 방법, 더욱 바람직하게는 (S)-α-아미노산의 양을 감소시키는 방법, 추가로 더 바람직하게는 분지형 (S)-α-아미노산, 방향족 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 방향족 (S)-α-아미노산의 양을 감소시키는 방법, 가장 바람직하게는 (S)-노르발린, (S)-류신, (S)-페닐알라닌 또는 (S)-티로신으로부터 선택된 아미노산의 양을 감소시키는 방법이다.
본 발명에 따른 추가의 아미노산 변형을 포함하는 ω-TA 변이체와 관련하여, (R)- 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 본 발명에 따른 방법은 바람직하게는 인 포함 지방족 (S)-아민 (예컨대 비제한적으로 인 포함 선형, 분지형 또는 시클릭 알칸 (S)-아민, 알켄 (S)-아민, 알킨 (S)-아민)의 양을 감소시키는 방법이거나, 또는 인 포함 아릴 (S)-아민의 양을 감소시키는 방법이거나, 또는 인 포함 (S)-아미노산의 양을 감소시키는 방법, 더욱 바람직하게는 인 포함 (S)-α-아미노산의 양을 감소시키는 방법이고, 추가로 더 바람직하게는 인 포함 분지형 (S)-α-아미노산, 인 포함 방향족 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 인 포함 방향족 (S)-α-아미노산의 양을 감소시키는 방법, 훨씬 더 바람직하게는 치환된 인 포함 (S)-α-아미노산의 양을 감소시키는 방법, 추가로 훨씬 더 바람직하게는 메틸 치환된 인을 포함하는 (S)-α-아미노산의 양을 감소시키는 방법, 가장 바람직하게는 (S)-글루포시네이트의 양을 감소시키는 방법이다.
바람직하게는, (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법 각각의 단계 a)에서 제공된 (R)- 및 (S)-아민을 포함하는 조성물은 지방족 (R)- 및 (S)-아민 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알칸 (R)- 및 (S)-아민, 알켄 (R)- 및 (S)-아민, 알킨 (R)- 및 (S)-아민) 또는 아릴 (R)- 및 (S)-아민 또는 (R)- 및 (S)-아미노산, 더욱 바람직하게는 (R)- 및 (S)-α-아미노산, 추가로 더 바람직하게는 분지형 (R)- 및 (S)-α-아미노산, 방향족 (R)- 및 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 방향족 (R)- 및 (S)-α-아미노산, 가장 바람직하게는 아미노산 (R)- 및 (S)-노르발린, (R)- 및 (S)-류신, (R)- 및 (S)-페닐알라닌 또는 (R)- 및 (S)-티로신으로부터 선택된 화합물의 군으로부터 선택된 (R)- 및/또는 (S)-아민을 포함한다.
추가의 아미노산 변형을 포함하는 본 발명에 따른 ω-TA 변이체와 관련하여, 바람직하게는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법 각각의 단계 a)에 제공된 (R)- 및 (S)-아민을 포함하는 조성물은 인 포함 지방족 (R)- 및 (S)-아민 (예컨대 비제한적으로 인 포함 선형, 분지형 또는 시클릭 알칸 (R)- 및 (S)-아민, 알켄 (R)- 및 (S)-아민, 알킨 (R)- 및 (S)-아민) 또는 인 포함 아릴 (R)- 및 (S)-아민 또는 인 포함 (R)- 및 (S)-아미노산, 더욱 바람직하게는 인 포함 (R)- 및 (S)-α-아미노산, 추가로 더 바람직하게는 인 포함 분지형 (R)- 및 (S)-α-아미노산, 인 포함 방향족 (R)- 및 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 인 포함 방향족 (R)- 및 (S)-α-아미노산, 훨씬 더 바람직하게는 치환된 인 포함 (R)- 및 (S)-α-아미노산, 추가로 훨씬 더 바람직하게는 메틸 치환된 인을 포함하는 (R)- 및 (S)-α-아미노산, 가장 바람직하게는 (R)- 및 (S)-글루포시네이트로부터 선택된 화합물의 군으로부터의 (R)- 및/또는 (S)-아민을 포함한다.
더욱 바람직하게는, (R)- 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)- 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법 각각의 단계 a)에서 제공된 (R)- 및 (S)-아민을 포함하는 조성물은 동일한 분자의 (R)- 및 (S)-아민을 포함하고, 더욱 바람직하게는 이는 지방족 (R)- 및 (S)-아민 (예컨대 비제한적으로 선형, 분지형 또는 시클릭 알칸 (R)- 및 (S)-아민, 알켄 (R)- 및 (S)-아민, 알킨 (R)- 및 (S)-아민) 또는 아릴 (R)- 및 (S)-아민 또는 (R)- 및 (S)-아미노산, 더욱 바람직하게는 (R)- 및 (S)-α-아미노산, 추가로 더 바람직하게는 분지형 (R)- 및 (S)-α-아미노산, 방향족 (R)- 및 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 방향족 (R)- 및 (S)-α-아미노산, 가장 바람직하게는 아미노산 (R)- 및 (S)-노르발린, (R)- 및 (S)-류신, (R)- 및 (S)-페닐알라닌 또는 (R)- 및 (S)-티로신으로 이루어진 화합물의 군으로부터 선택된 하나의 단일 화합물의 거울상이성질체를 각각 나타내는 (R)- 및 (S)-아민을 포함한다.
추가의 아미노산 변형을 포함하는 본 발명에 따른 ω-TA 변이체와 관련하여, 바람직하게는 (R)- 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)- 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법 각각의 단계 a)에서 제공된 (R)- 및 (S)-아민을 포함하는 조성물은 동일한 분자의 (R)- 및 (S)-아민을 포함하고, 더욱 바람직하게는 이는 인 포함 지방족 (R)- 및 (S)-아민 (예컨대 비제한적으로 인 포함 선형, 분지형 또는 시클릭 알칸 (R)- 및 (S)-아민, 알켄 (R)- 및 (S)-아민, 알킨 (R)- 및 (S)-아민) 또는 인 포함 아릴 (R)- 및 (S)-아민 또는 인 포함 (R)- 및 (S)-아미노산, 더욱 바람직하게는 인 포함 (R)- 및 (S)-α-아미노산, 추가로 더 바람직하게는 인 포함 분지형 (R)- 및 (S)-α-아미노산, 인 포함 방향족 (R)- 및 (S)-α-아미노산, 또는 치환된 페닐 기를 포함하는 인 포함 방향족 (R)- 및 (S)-α-아미노산, 훨씬 더 바람직하게는 치환된 인 포함 (R)- 및 (S)-α-아미노산, 추가로 훨씬 더 바람직하게는 메틸 치환된 인을 포함하는 (R)- 및 (S)-α-아미노산, 가장 바람직하게는 (R)- 및 (S)-글루포시네이트로 이루어진 화합물의 군으로부터 선택된 하나의 단일 화합물의 거울상이성질체를 각각 나타내는 (R)- 및 (S)-아민을 포함한다.
바람직하게는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법 각각의 단계 b)에서 제공된 아민 수용자 분자는, 아민 생성 방법의 단계 b)에서 제공되는 아민 공여자 분자로서 본원에서 상기 기재된 이들 분자의 아민 기가 카르보닐 기로 대체된 것을 제외하고는, 구조가 아민 공여자로서 아민 생성 방법의 단계 b)에서 제공되는 아민 공여자 분자로서 본원에서 상기 기재된 구조에 상응하는 분자이다. 예를 들어, 아민 생성 방법의 단계 b)에서 제공되는 아민 공여자 분자로서 기재된 이소프로필아민의 아민 기를 카르보닐 기로 대체하면, (R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법 각각의 단계 b)에서 사용되는 상응하는 아민 수용자 분자 아세톤이 생성된다.
(R)-아민 및 (S)-아민을 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법 또는 (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법의 각각의 단계 b)에서 제공되는 가장 바람직한 아민 수용자 분자는 아세톤이다.
본 발명에 따른 아민 생성 방법의 단계 c)에 대해 용액, 수성 용액, 유기 용매를 포함하는 수성 용액, 완충제 시스템, pH 값 및/또는 온도, 단백질의 형태 (조 세포 추출물, 부분적으로 정제된 단백질, 정제된 단백질, 살아있는 또는 살아있지 않은 숙주 세포의 성분으로서 존재하는 단백질, (추가로) 가공된 숙주 세포, 숙주 세포의 분무 건조), 단백질의 양 및 PLP의 존재 및 양의 바람직한 실시양태와 관련하여 본원에서 상기 정의된 것은, (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법의 단계 c)에 상응하게 적용가능하다.
본 발명에 따른 아민 생성 방법의 단계 d)의 바람직한 실시양태와 관련하여 본원에서 상기 정의된 것은, (R)-아민 및 (S)-아민을 포함하는 조성물에서 (S)-아민 거울상이성질체의 양을 감소시키는 방법의 단계 d)에 상응하게 적용가능하다.
본 발명의 추가의 실시양태는 아민의 생성을 위한, 바람직하게는 (S)-아민의 생성을 위한 본 발명에 따른 단백질의 용도이다.
거울상이성질체 혼합물에서 아민의 양, 바람직하게는 (S)-아민의 양을 감소시키기 위한 본 발명에 따른 단백질의 용도 또한 본 발명의 실시양태이다.
본 발명에 따른 숙주 세포에서 본 발명에 따른 단백질을 발현하기 위한 본 발명에 따른 핵산 분자의 용도 또한 본 발명의 실시양태이다.
본 발명의 또 다른 실시양태는 본 발명에 따른 숙주 세포의 형질전환 또는 유전적 변형을 위한 또는 본 발명에 따른 단백질의 생성을 위한 본 발명에 따른 핵산 분자, 본 발명에 따른 재조합 핵산 분자, 본 발명에 따른 플라스미드, 또는 본 발명에 따른 벡터의 용도에 관한 것이다.
아민을 생성하기 위한 또는 거울상이성질체 혼합물에서 아민의 양, 바람직하게는 (S)-아민의 양을 감소시키기 위한 본 발명에 따른 숙주 세포의 용도 또한 본 발명의 실시양태이다.
서열의 설명
본 명세서에 걸쳐, 뉴클레오티드 및 아미노산 약어는 하기 IUPAC 코드에 따라 사용된다:
Figure pct00004
표 3
아미노산과 뉴클레오티드 사이의 구별을 위해, 상기 표에 주어진 대문자 뉴클레오티드 코드 약어는 본원에서 소문자로 표기된다.
Figure pct00005
표 4
코돈 용법은 본원에서 하기 표에 따른 소위 "일반적인 유전자 코드"를 따르며, 여기서 "t"는 리보핵산 (RNA) 서열에서 "u"로 치환되어야 한다. "TLC"는 아미노산의 3 문자 코드를 나타내고, "SLC"는 단일 문자 코드를 나타낸다.
Figure pct00006
Figure pct00007
Figure pct00008
표 5
서열식별번호: 1: 서열식별번호: 3에 제시된 아미노산 서열의 역번역에 의해 수득된 바실루스 메가테리움으로부터의 오메가-트랜스아미나제 (ω-TA)를 코딩하는 핵산 서열이며, 역번역은 일반적인 유전자 코드의 축중성으로 인한 번역 원리를 따른다. 6개의 His 아미노산을 코딩하는 위치 1432 내지 1449의 뉴클레오티드는 위치 1450 내지 1452에 위치하는 정지 코돈 이전에 바실루스 메가테리움으로부터의 서열에 삽입되었다.
서열식별번호: 2: 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 ω-TA를 코딩하는 핵산 서열. 6개의 His 아미노산을 코딩하는 위치 1432 내지 1449의 뉴클레오티드는 위치 1450 내지 1452에 위치하는 정지 코돈 이전에 바실루스 메가테리움으로부터의 서열에 삽입되었다.
서열식별번호: 3: 진펩트 (PDB)로부터 수탁 번호 5G09_A 하에 유래될 수 있는 바실루스 메가테리움로부터의 ω-TA의 아미노산 서열. 제시된 아미노산은 서열식별번호: 1 및 2에 제시된 핵산 서열에 의해 코딩된다. 위치 478 내지 483의 6개의 His 아미노산은 서열 변형에 의해 바실루스 메가테리움으로부터의 서열에 삽입되었다.
서열식별번호: 4: 서열식별번호: 6에 제시된 아미노산 서열의 역번역에 의해 수득되는 아르트로박터 종으로부터의 ω-TA를 코딩하는 핵산 서열이며, 역번역은 일반적인 유전자 코드의 축중성으로 인한 번역 원리를 따른다.
서열식별번호: 5: 서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 ω-TA를 코딩하는 핵산 서열. 6개의 His 아미노산을 코딩하는 위치 1438 내지 1455의 뉴클레오티드는 위치 1456 내지 1458에 위치한 정지 코돈 이전에 아르트로박터 종으로부터의 서열에 삽입되었다.
서열식별번호: 6: 진펩트 (PDB)로부터 수탁 번호 5G2P_A 하에 유래될 수 있는 아르트로박터 종으로부터의 ω-TA의 아미노산 서열. 제시된 아미노산은 서열식별번호: 4 및 5에 제시된 핵산 서열에 의해 코딩된다. 위치 480 내지 485에서 6개의 His 아미노산은 서열 변형에 의해 아르트로박터 종으로부터의 서열에 삽입되었다.
서열식별번호: 7: 서열식별번호: 9에 제시된 아미노산 서열의 역번역에 의해 수득된 바실루스 종 (토양 76801D1)으로부터의 ω-TA를 코딩하는 핵산 서열이며, 역번역은 일반적인 유전자 코드의 축중성으로 인한 번역 원리를 따른다.
서열식별번호: 8: 진뱅크 수탁 번호 LMTA01000079.1로부터 유래될 수 있는 바실루스 종 (토양 76801D1)으로부터의 ω-TA를 코딩하는 핵산 서열.
서열식별번호: 9: 진펩트 (PDB)로부터 수탁 번호 KRF52528.1 하에 유래될 수 있는 바실루스 종 (토양 76801D1)으로부터의 ω-TA의 아미노산 서열. 제시된 아미노은 본원에서 상기 기재된 서열식별번호: 7 및 8에 제시된 핵산 서열에 의해 코딩된다.
서열식별번호: 10: 서열식별번호: 12에 제시된 아미노산 서열의 역번역에 의해 수득된 아르트로박터 종으로부터의 돌연변이된 ω-TA를 코딩하는 핵산 서열이며, 역번역은 일반적인 유전자 코드의 축중성으로 인한 번역 원리를 따른다.
서열식별번호: 11: 서열식별번호: 12에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 돌연변이된 ω-TA 변이체를 코딩하는 핵산 서열. 상기 서열은 WO 2006/063336 A2에서 서열식별번호: 15로부터 유래될 수 있다.
서열식별번호: 12: WO 2006/06336 A2에서 서열식별번호: 16으로부터 유래될 수 있는 아르트로박터 종으로부터의 돌연변이된 ω-TA의 아미노산 서열. 제시된 아미노산은 본원에서 상기 기재된 서열식별번호: 11 및 12에 제시된 핵산 서열에 의해 코딩된다.
서열식별번호: 13: 서열식별번호: 15에 제시된 아미노산 서열의 역번역에 의해 수득된 아르트로박터 종으로부터의 야생형 ω-TA를 코딩하는 핵산 서열이며, 역번역은 일반적인 유전자 코드의 축중성으로 인한 번역 원리를 따른다.
서열식별번호: 14: 서열식별번호: 15에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 야생형 ω-TA를 코딩하는 핵산 서열. 상기 서열은 WO 2006/063336 A2에서 서열식별번호: 1로부터 유래될 수 있다.
서열식별번호: 15: WO 2006/06336 A2에서 서열식별번호: 2로부터 유래될 수 있는 아르트로박터 종으로부터의 야생형 ω-TA의 아미노산 서열. 제시된 아미노산은 본원에서 상기 기재된 서열식별번호: 13 및 14에 제시된 핵산 서열에 의해 코딩된다.
서열식별번호: 16: 서열식별번호: 18에 제시된 아미노산 서열의 역번역에 의해 수득된 개선된 ω-TA를 코딩하는 핵산 서열이며, 역번역은 일반적인 유전자 코드의 축중성으로 인한 번역 원리를 따른다.
서열식별번호: 17: 서열식별번호: 18에 제시된 아미노산 서열을 갖는 개선된 ω-TA를 코딩하는 핵산 서열.
서열식별번호: 18: 개선된 ω-TA의 아미노산 서열이며, 개선은 서열식별번호: 3 및 9에 제시된 바실루스 메가테리움으로부터의 아미노산 서열과 비교하여 및 서열식별번호: 6, 12 및 15에 제시된 아르트로박터 종으로부터의 아미노산 서열과 비교하여 아미노산 치환에 의해 수득된다.
서열식별번호: 19: 로도토룰라 토룰로이데스(Rhodotorula toruloides) (동의어: 로도토룰라 그라실리스(Rhodotorula gracilis))로부터의 D-아미노산 옥시다제 (DAO1) 유전자의 핵산 코딩 서열.
서열식별번호: 20: 서열식별번호: 19에 제시된 코딩 서열로부터 수득된 D-아미노산 옥시다제 (DAO1)의 활성을 갖는 단백질의 아미노산 서열.
서열식별번호: 21: 위치 160 - 162의 뉴클레오티드에 의해 학인된 코돈 및 위치 172 - 174의 뉴클레오티드에 의해 확인된 코돈 및 위치 637 - 639의 뉴클레오티드에 의해 확인된 코돈에서 로도토룰라 토룰로이데스로부터의 핵산 서열과 비교하여 뉴클레오티드 치환 (대체)을 포함하는 로도토룰라 토룰로이데스로부터의 D-아미노산 옥시다제 (DAO1) 유전자의 변이체의 핵산 코딩 서열.
서열식별번호: 22: 서열식별번호: 21에 제시된 코딩 서열로부터 수득된 D-아미노산 옥시다제의 활성을 갖는 단백질의 아미노산 서열. 아미노산 서열은 위치 54, 58 및 213에서 로도토룰라 토룰로이데스로부터의 핵산 서열과 비교하여, 서열식별번호: 21에 제시된 아미노산 서열과 비교하여 아미노산 치환 (대체)을 포함하며, 따라서 DAAO 변이체 (돌연변이체)의 아미노산 서열이다.
서열식별번호: 23: 리스테리아 셀리게리(Listeria seeligeri)로부터의 카탈라제 유전자의 핵산 코딩 서열.
서열식별번호: 24: 서열식별번호: 23에 제시된 코딩 서열로부터 수득된 카탈라제의 활성을 갖는 단백질의 아미노산 서열.
서열식별번호: 25: 카탈라제의 활성을 갖는, 서열식별번호: 24에 제시된 아미노산 서열을 갖는 단백질을 코딩하는 핵산 서열.
서열식별번호: 26: 도 1에서 "lac 오퍼레이터"로 지정된 유전 요소의 핵산 서열.
서열식별번호: 27: 도 1에서 "Trc 프로모터"로 지정된 유전 요소의 핵산 서열.
서열식별번호: 28: 도 1에서 "rrnB"로 지정된 유전 요소의 핵산 서열.
서열식별번호: 29: 도 1에서 "시스트론"으로 지정된 유전 요소의 핵산 서열.
서열식별번호: 30: 도 1에서 "rrnB 종결자"로 지정된 유전 요소의 핵산 서열.
도면의 설명
도 1: 트리-시스트론 RNA로서 단일 오페론으로부터의 DAAO, ω-TA 및 카탈라제의 활성을 갖는 단백질의 발현을 위해 사용되는 유전 요소를 도시하는 플라스미드 맵. 트리-시스트론 RNA의 전사 및 번역에 수반되는 조절성 유전 요소의 약어에 대한 설명:
lac 오퍼레이터: [Ullmann, 2001, Encyclopedia of Life Sciences, John Wiley & Sons, Ltd, ISBN: 9780470015902; Ullmann, 2009, Encyclopedia of Life Sciences (ELS), John Wiley & Sons, Ltd: Chichester. DOI: 10.1002/9780470015902.a0000849.pub2]; 서열식별번호: 26에 제시된 핵산 서열로 이루어짐.
Trc 프로모터: 이. 콜라이 trplacUV5 프로모터로부터 유래된 합성 프로모터 (Brosius et al., 1985, J Biol Chem 260, 3539-3541); 서열식별번호: 27에 제시된 핵산 서열로 이루어짐.
rrnB: RhoI-비의존성 전사 종결 신호 (Pfeiffer & Hartmann, 1997, J Mol Biol. 265(4) 385-393; Orosz et al., 1991, Eur J Biochem. 201(3), 653-659); 서열식별번호: 28에 제시된 핵산 서열로 이루어짐.
t7 인핸서: t7 유전자로부터의 전사 향상 서열. (사용된 서열: ttaacttta).
RBS1: 리보솜 결합 부위 (서열: gaggt).
시스트론: 전사 종결 서열; 서열식별번호: 29에 제시된 핵산 서열로 이루어짐.
RBS2: 리보솜 결합 부위 (사용된 서열: aaggag).
boxA: 전사 종결-방지 서열 (사용된 서열: tgctctttaacaa).
시스트론: 서열식별번호: 29에 제시된 핵산 서열로 이루어진 합성 시스트론.
rrnB 종결자: 전사 종결 신호; 서열식별번호: 30에 제시된 핵산 서열로 이루어짐.
T2 종결자: 번역 종결 신호 (Orosz et al., 1991, Eur J Biochem. 201(3), 653-659).
도 2: 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체와 비교하여, 서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질에 의해 촉매된 2-옥소발레르산의 아미노화에 의한 (S)-노르발린의 생성을 나타낸다.
도 3: 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체와 비교하여, 서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질에 의해 촉매된 4-메틸-2-옥소-발레르산의 아미노화에 의한 (S)-류신의 생성을 나타낸다.
도 4: 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체와 비교하여, 서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질에 의해 촉매된 페닐피루브산의 아미노화에 의한 (S)-페닐알라닌의 생성을 나타낸다.
도 5: 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체와 비교하여, 서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질에 의해 촉매된 p-히드록시페닐피루브산의 아미노화에 의한 (S)-티로신의 생성을 나타낸다.
일반적인 방법
1. ω-TA 변이체, 및 추가의 아미노산 변형을 갖는 ω-TA 변이체의 생성
본원에 기재된 ω-TA의 활성을 갖는 단백질을 코딩하는 본원에 기재된 공지된 뉴클레오티드 서열은 유로핀스 게노믹스 게엠베하(Eurofins Genomics GmbH) (독일 85560 에베르스베르크 안친게르 스트라쎄 7아 유로핀스 게노믹스 게엠베하)에 의해 서비스 제공자에 의해 합성되었다.
서열식별번호: 2, 5, 8, 11, 14에 제시된 핵산 서열에 뉴클레오티드 치환 (대체)을 도입하였다. 대체는 핵산 서열에서 뉴클레오티드를 대체하는데 적절한 임의의 수단에 의해 기준 폴리펩티드를 코딩하는 핵산 서열에서 수행될 수 있다. 이들 방법은 문헌에 광범위하게 기재되어 있고, 각각의 서열에서 관련 기술분야의 기술자에게 널리 공지되어 있다. 몇몇 분자 생물학적 방법을 이용하여, 각각의 뉴클레오티드 대체를 달성할 수 있다. 본 발명에 따른 돌연변이된 핵산 서열 및 상응하는 단백질을 제조하는데 유용한 방법은 사전에 선택된 1개 이상의 아미노산을 코딩하는 코돈에 대해 부위-지정 돌연변이 유발을 수행하여, 이들이 상이한 아미노산을 코딩하도록 선택된 코돈을 변화시키는 것을 포함한다. 이들 부위-지정 돌연변이를 수득하는 방법은 기술자에게 널리 공지되어 있고, 문헌에 광범위하게 기재되어 있거나 (특히: Directed Mutagenesis: A Practical Approach, 1991, Edited by M.J. McPHERSON, IRL PRESS), 또는 상업적 키트 (예를 들어 퀴아젠(Qiagen) 또는 스트라타젠(Stratagene)으로부터의 퀵체인지(QUIKCHANGE)™ 라이트닝 돌연변이 유발 키트)를 이용할 수 있는 방법이다. 부위-지정 돌연변이 유발 이후에, 핵산을 에스케리키아 콜라이 균주 MG1655로 형질전환시켰다. 유리한 생체전환 수율을 갖는 돌연변이된 폴리펩티드를 함유하는 세포를 적절한 스크리닝 방법을 이용하여 선택하였다. 적절한 스크리닝 방법은 본원에서 "일반적인 방법", 항목 4 및 7에 기재되어 있다. 개선된 폴리펩티드를 코딩하는 돌연변이된 핵산 서열이 서열 검증되었다. 서열 검증 방법은 기술자에게 널리 공지되어 있고, 문헌에 광범위하게 기재되어 있다 (예를 들어 문헌 [Sambrook and Russell (2012) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY)] 참고).
2. ω-TA 변이체를 위한 발현 벡터/숙주 세포
야생형 ω-TA (서열식별번호: 2, 5, 8, 14) 또는 돌연변이를 포함하는 공지된 ω-TA (서열식별번호: 11) 또는 본원에 기재된 ω-TA 변이체를 코딩하는 핵산 서열을 상업용 pET22B 벡터 (머크 카게아아(Merck KGaA), 독일 64293 다름스타트 프랑크푸르터 스트라쎄 250)에 클로닝하고, 에스케리키아 콜라이 균주 BL21DE3 세포에서 발현하였다.
3. ω-TA 변이체의 발현
ω-TA 변이체를 코딩하는 각각의 핵산 서열이 도입된 pET22B 벡터를 포함하는 에스케리키아 콜라이 균주 BL21DE3의 사전-배양물을 밤새 180 rpm의 회전식 진탕기 상에서 37℃에서 카르베니실린으로 보충된 20 ml LB-배지를 함유하는 플라스크에서 성장시켰다. 카르베니실린으로 보충된 250 ml LB-배지를 함유하는 플라스크에 사전-배양물을 옮겨서 ωTA 단백질의 발현을 수행하였다. 180 rpm의 회전식 진탕기 상에서 37℃에서 성장시킴으로써 0.6-0.8의 OD (광학 밀도)에 도달한 후에 0.5 mM IPTG (최종 농도)를 첨가하여 ω-TA 단백질의 발현을 유도하였다. 유도된 세포 배양물을 180 rpm 진탕에서 20℃에서 20 시간 동안 인큐베이션하였다. 효소의 정제를 제조자의 프로토콜에 따라 퀴아젠 (퀴아젠 게엠베하, 힐덴 40724 퀴아젠 스트라쎄 1)의 Ni-NTA 패스트 스타트 키트(Ni-NTA Fast Start Kit)를 사용하여 수행하였다.
4. 아민 수용자 및 아민 공여자의 존재 하에 ωTA 변이체에 대한 활성 시험
40 μl 트리에탄올아민 완충제 (탈이온수 중 200 mM 용액, pH=9.0)에, 10 μl 피리독살 포스페이트 (탈이온수 중 10 mM 용액) 및 10 μl의 아미노 공여자 (탈이온수 중 2 M 용액, 수성 HCl의 첨가에 의해 pH=9.0으로 조정됨)를 실온에서 첨가하였다. 후속적으로, 20 μl의 아미노 수용자 (탈이온수 중 100 mM 용액)를 첨가하였다 (아미노 수용자가 물에 용해되지 않는 경우, 비례하는 DMSO가 첨가됨). 최종적으로, 20 μl의 트랜스아미나제 효소 (1.5 mg/ml)를 실온에서 첨가하고, 혼합물을 800 rpm의 회전식 진탕기 상에서 40℃에서 6-7 시간 동안 인큐베이션하였다. 트랜스아미노화 반응은 반응 동안에 다양한 시간 간격으로 취한 분취량의 HPLC-분석에 의해 모니터링하였다.
5. 추가의 아미노산 변형을 갖는 ω-TA 변이체에 대해 사용된 발현 벡터/숙주 세포
추가의 아미노산 변형을 갖는 ω-TA 변이체에 대한 활성 시험을 2 반응 단계를 포함하는 방법을 이용하여 수행하였다.
제1 반응 단계 (단계 1)는 ω-TA에 대한 아민 수용자를 생성한다. 상기 단계는 D-아미노산 옥시다제 (DAAO 또는 DAO, EC 1.4.3.3)에 의해 촉매된다. DAAO는 플라빈 아데닌 디뉴클레오티드 (FAD)-함유 플라보단백질이며, 이는 하기 일반 방정식 (III)에 따라 산소에 의한 D-아미노산의 산화성 탈아미노화를 촉매하여 과산화수소 및 암모니아와 함께 상응하는 2-옥소 산을 생성한다:
α-D-아미노산 + H2O + O2 ------> α-2-옥소 카르복실산 + NH3 + H2O2
제1 반응 단계에서 α-2-옥소 카르복실산의 생성을 위해 사용된 DAAO의 활성을 갖는 단백질은 로도스포리디움 토룰로이데스(Rhodosporidium toruloides)로부터의 DAO1 단백질의 DAAO 변이체이었다. 로도스포리디움 토룰로이데스로부터의 야생형 DAO1 단백질의 코딩 핵산 서열은 진뱅크 수탁 번호 U6006.1 (서열식별번호: 19에 제시됨)로부터 유래될 수 있고, 서열식별번호: 19에 제시된 핵산 서열에 의해 코딩된 상응하는 아미노산 서열은 유니프롯(UniProt) 수탁 번호 P80324 (서열식별번호: 20에 제시됨)로부터 유래될 수 있다. 본원에서 사용된 DAAO 변이체는 돌연변이체 Ac305로서 WO 2017/151573에 개시되어 있다 (페이지 36, 표 1). 서열식별번호: 20과 비교하여 돌연변이체 Ac305는 위치 54 및 58 및 213에서 아미노산 치환 (대체)을 포함한다. 돌연변이체 Ac305에서, 서열식별번호: 20에서 위치 54의 아미노산 N은 C로 치환되고 (대체되고), 서열식별번호: 20에서 위치 58의 아미노산 F는 H로 치환되고 (대체되고), 서열식별번호: 20에서 위치 213의 아미노산 M은 S로 치환된다 (대체된다). 돌연변이체 Ac305의 아미노산 서열은 서열식별번호: 22에 제시된다. 서열식별번호: 22에 제시된 아미노산 서열을 갖는 단백질을 코딩하는 각각의 핵산 서열은 서열식별번호: 21에 제시된다. 단계 1의 반응은 서열식별번호: 22에 제시된 아미노산 서열을 갖는 DAAO의 활성을 갖는 단백질에 의해 촉매되었다.
제2 반응 단계 (단계 2)에서, 단계 1에서 DAAO의 활성을 갖는 단백질에 의해 생성된 α-2-옥소 카르복실산을 일반 방정식 (I)에 따라 아민 공여자의 존재 하에 ω-TA 활성을 갖는 단백질에 의해 아미노산으로 전환시킨다.
일반 방정식 (III)에 의한 단계 1의 설명으로부터 명백해지는 바와 같이, DAAO의 활성을 갖는 단백질에 의해 촉매된 D-아미노산에서 케토산으로의 전환은 과산화수소 (H2O2)를 생성한다. H2O2의 제거가 필요할 수 있지만, 모든 상황에서 반드시 필요한 것은 아니다. H2O2의 제거는 카탈라제의 활성을 갖는 단백질을 첨가함으로써 본 발명에 따라 수행되었다.
카탈라제 (EC 1.11.1.6; 과산화수소:과산화수소 옥시도리덕타제)의 활성을 갖는 단백질은 관련 기술분야에 공지되어 있고, 하기 일반 방정식 (IV)에 따라 과산화수소 (H2O2)에서 물 (H2O) 및 산소 (O2)로의 전환을 촉매한다:
2H2O2 ------> O2 + 2H2O
H2O2의 제거를 위해 사용된 리스테리아 셀리게리로부터의 카탈라제의 활성을 갖는 단백질의 아미노산 서열은 서열식별번호: 24에 제시되고, 진펩트 수탁 번호 WP_012986600.1 하에 유래될 수 있다. 서열식별번호: 23 (진뱅크 수탁 번호 NC_013891.1 하에 유래될 수 있음)은 서열식별번호: 24에 제시된 아미노산 서열을 갖는 카탈라제 단백질에 대한 리스테리아 셀리게리로부터의 핵산 코딩 서열을 나타낸다. 서열식별번호: 25는 서열식별번호: 24에 제시된 아미노산 서열을 갖는 카탈라제 단백질을 또한 코딩하는 핵산 서열이다. 서열식별번호: 23에 제시된 핵산 서열과 비교하여, 서열식별번호: 25에 제시된 핵산 서열의 코돈은 에스케리키아 콜라이의 코돈 용법에 대해 적합화되었다.
DAAO의 활성을 갖는 단백질, ω-TA의 활성을 갖는 단백질, 및 카탈라제의 활성을 갖는 단백질을 생성하기 위해, 3가지 모든 단백질이 trc-프로모터 (trp- 및 lacUV5-프로모터로부터 기원하는 서열로 구성된 혼성체 프로모터)로부터 트리-시스트론 RNA로서 단일 오페론으로부터 전사되는 방식으로, 각각의 3가지 단백질을 코딩하는 핵산 서열을 이. 콜라이 발현 벡터에 클로닝하였다. 프로모터로부터의 전사와 관련하여 유전자의 순서는 DAAO (서열식별번호: 21) -> 추가의 아미노산 변형을 포함하는 ω-TA 변이체를 코딩하는 핵산 분자 (본원에서 상기 기재됨) -> 카탈라제 (서열식별번호: 25)이었다. 서열식별번호: 21은 그의 5'-말단에서 번역에 의해 아미노산 서열 M A R I R L을 코딩하는 핵산 서열과 융합되었다.
사용된 발현 벡터는 pSE420 (애드진(Addgene) (02139 매사추세츠주 캠브릿지 스위트 550에이 시드니 스트리트 75); https://www.addgene.org/vector-database/4064/ 또는 써모 피셔 사이언티픽 (인비트로겐(Invitrogen)) (미국 02451 매사추세츠주 월섬 써드 애비뉴 168 써모 피셔 사이언티픽 인크.), https://www.thermofisher.com/search/results?query=pSE420&focusarea로부터 유래될 수 있는 설명 및 서열)을 기반으로 한다. 유전 요소를 일반적으로 공지된 방법에 의해 변형된 pSE420 벡터에 도입시켰다. 사용된 발현 벡터에 존재하는 관련 유전 요소는 도 1에 제시되어 있다. 3가지 효소의 발현을 위해, 발현 벡터를 에스케리키아 콜라이 균주 MG1655 세포로 전달하였다.
6. 추가의 아미노산 변형을 포함하는 ω-TA 변이체의 발현
추가의 아미노산 변형을 포함하는 ω-TA 변이체를 "일반적인 방법", 항목 5에서 상기 기재된 트리-시스트론 발현 벡터에 클로닝하고, 에스케리키아 콜라이 균주 MG1655 세포에서 발현하였다. 이를 위해, 카나마이신으로 보충된 LB-배지 중의 20 ml 사전-배양물을 밤새 진탕 플라스크에서 37℃에서 180 rpm의 회전식 진탕기 상에서 성장시켰다. 카나마이신으로 보충된 200 ml LB-배지를 함유하는 플라스크로 사전-배양물을 옮겨서 ωTA 단백질의 발현을 수행하였다. 0.6-0.8의 OD에 도달한 후에 1mM IPTG (최종 농도)의 첨가에 의해 ωTA 단백질의 발현을 유도하였다. 유도된 세포 배양물을 20℃에서 20 시간 동안 180 rpm 진탕에서 인큐베이션하였다. 수확을 위해, 세포 배양물을 4℃에서 15 분 동안 8000 g에서 원심분리하고, 수득된 세포 펠렛을 냉동 건조 또는 분무 건조할 때까지 -80℃에서 보관하였다.
7. 추가의 아미노산 변형을 갖는 ω-TA 변이체의 활성 시험
자석 교반기, O2-기체 투입 튜브 및 pH-제어된 투여 장치를 구비한 1 리터의 온도-조정가능한 유리 이중 자켓 반응기에서, 268 ml의 수성 50 w% 라세미 (R,S)-글루포시네이트 암모늄 용액 (160.8 g 라세미 글루포시네이트 암모늄에 상응함)을 첨가하였다. pH-제어된 투여 장치를 통해 수성 2 M 이소-프로필아민 용액을 기계적 교반 하에 (250 rpm) pH=9.0에 도달할 때까지 첨가하였다. 수성 2 M 이소-프로필아민 용액의 제어된 첨가에 의해 pH는 전체 반응 시간 동안에 일정하게 유지된다. 반응기를 35℃ 내부 온도로 가열하였다.
비커에서, 도 1에 기재된 발현 벡터를 함유하고 야생형 ω-TA 단백질 및 추가의 아미노산 변형을 포함하는 ω-TA 변이체를 발현하는 8 g의 분무 건조된 에스케리키아 콜라이 균주 MG1655 세포, 200 mg 피리독살 포스페이트, 2 ml 폴리프로필렌 글리콜 (P 2000) 및 138 ml 탈이온수를 혼합하였다. 이 혼합물을 35℃에서 교반 하에 (250 rpm) 유리 반응기에 첨가하였다. O2-기체 투입 튜브를 통해, 산소 기체를 0.1 l/분의 유속으로 반응 혼합물을 통해 버블링하였다. 혼합물을 24 시간 동안 교반하고, 반응 진행을 반응 동안에 다양한 시간 간격으로 취한 분취량의 HPLC-분석을 통해 모니터링하였다. 그 후, 산소 기체 공급 뿐만 아니라 이소-프로필아민 공급을 중단하고, 반응 혼합물을 90℃에서 30 분 동안 교반 하에 (250 rpm) 변성시켰다. 잔류 혼합물을 실온으로 냉각시켰다.
8. ω-TA에 의해 생성된 아민의 검출
A) 트랜스아미노화 생성물 (S)-노르발린, (S)-류신, (S)-티로신 및 (S)-글루포시네이트 암모늄의 분석
트랜스아미노화 반응의 과정을 HPLC 분석을 통해 모니터링하였다. 이 작업에서 이용된 HPLC 방법은 문헌 [Davankov et al. (1980, Chromatographia 13(11), 677 - 685)]의 공보를 기반으로 한다.
구체적으로, 하기 HPLC 파라미터를 이용하였다:
칼럼: 페노메넥스 키렉스(Phenomenex Chirex) 3126 (D) - 페니실라민 150*4.6 mm (Cat.: 00F-3126-E0)
유속: 1 ml/분
용리액: A) 탈이온수 + 0.5 g/L CuSO4 (v/v)
B) 메탄올
A:B = 90:10 (등용매성)
검출기: DAD 230 nm
오븐: 30 ℃
작동 시간: 15 분
B) 트랜스아미노화 생성물 L-페닐알라닌의 분석:
트랜스아미노화 반응의 과정을 HPLC 분석을 통해 모니터링하였다. 구체적으로, 하기 HPLC 파라미터를 이용하였다:
칼럼: 페노메넥스 프로디지(Phenomenex Prodigy) 3 μm ODS-3 100A 100*4 mm (Cat.: 00D-4222-D0)
유속: 2 ml/분
용리액: A) 아세토니트릴
B) 탈이온수
7 분 내에 A:B = 5:95에서 A:B = 95:5로의 구배
검출기: VWD1 A, 210 nm
오븐: 40 ℃
작동 시간: 9 분
9. 세포의 분무 건조
분무 건조 실험을 220℃의 최대 온도 입력을 갖는 실험실 (실험실 규모) 분무 건조기에서 수행하였다. 건조기는 5-8 bar 하에 200-800 l/h (리터/시간)에서 압축 공기 또는 질소를 사용한다. 최대 기류는 35 m3/h (미터3/시간)에 의해 도달할 수 있다.
플라스크 성장된 배양물 또는 발효된 물질 (즉, 1 리터의 총 부피)로부터 박테리아 세포 덩어리를 건조시키기 위해, 브로쓰를 원심분리에 의해 10배 (10x) 농축시키고, 원심분리 후에 수득된 배양물 상청액에서 100 ml의 최종 부피로 재현탁시켰다. 수득된 농축물은 펌핑에 적합해야 하며, 자석 교반기에 의해 일정하게 혼합되어야 한다. 100%로 설정된 흡인기에 의해 500 l/h의 기류를 이용하여 액체를 0.7 mm 노즐에 적용하였다. 전형적인 생성물 유량은 10 ml/분이었고, 적용된 온도는 투입구의 경우 평균 -145℃ 및 배출구의 경우 85℃이었다. 후속적인 건조된 생물량을 칭량하고, 생체내 변환 실험을 위해 g/l 규모로 사용하였다.
실시예
1. 2-옥소발레르산에서 (S)-노르발린으로의 전환
서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질, 또는 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체를 "일반적인 방법", 항목 3에 기재된 바와 같이 발현하고 정제하였다.
탈이온수 중 25 μl의 트리에탄올아민 완충제 (탈이온수 중 200 mM 용액, pH=9.0), 탈이온수 중 10 μl의 피리독살 포스페이트 (PLP) (탈이온수 중 10 mM 용액) 및 탈이온수 중 10 μl의 이소-프로필아민 (탈이온수 중 2 M 용액, 수성 HCl의 첨가에 의해 pH=9.0으로 조정됨)을 실온에서 첨가하였다. 후속적으로, 20 μl의 2-옥소발레르산 (탈이온수 중 100 mM 용액)을 첨가하였다. 최종적으로, 1.5 mg/ml의 각각의 ω-TA 단백질을 포함하는 35 μl의 용액을 실온에서 첨가하고, 혼합물을 40℃에서 800 rpm의 회전식 진탕기 상에서 6 시간 동안 인큐베이션하였다. 트랜스아미노화 반응을 "일반적인 방법" 항목 8에 기재된 바와 같이 반응 동안에 상이한 시간 간격으로 취한 분취량의 HPLC-분석에 의해 모니터링하였다.
표 6은 서열식별번호: 6에 제시된 아미노산 서열을 갖는 아르트로박터 종 및 서열식별번호: 3에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 이들 야생형 단백질과 비교하여 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체에 대해 수득된 결과를 나타낸다. 결과는 또한 도 2에 제시되어 있다.
Figure pct00009
표 6
표 6의 설명:
시간 (h)으로 측정된 "시간"은 반응이 시작된 이래로 경과된 시간을 나타낸다.
"mAU*s"는 밀리 (m) 흡광도 (A) 단위 (U) 곱하기 (*) 초 (s)에 대한 약어이며; HPLC 크로마토그램에서 피크하 면적을 기재하는 표준 단위이다. 피크하 면적이 클수록, 각각의 생성물의 양이 더 많다.
표 6 및 도 2로부터, ω-TA 변이체에 의해 촉매된 반응에서 2-옥소발레르산으로부터 (S)-노르발린의 생성은 아르트로박터 종 및 바실루스 메가테리움으로부터의 야생형 단백질에 의해 촉매된 반응에 비해 빠르게 진행됨을 유추할 수 있다. 또한, 반응 동안에 생성된 (S)-노르발린의 최대량은 아르트로박터 종 및 바실루스 메가테리움으로부터의 야생형 단백질에 의해 촉매된 반응과 비교하여 ω-TA 변이체에 의해 촉매된 반응에서 유의하게 더 일찍 도달한다.
2. 4-메틸-2-옥소-발레르산에서 (S)-류신으로의 전환
서열식별번호: 3에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 6에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질, 또는 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체를 "일반적인 방법", 항목 3에 기재된 바와 같이 발현하고 정제하였다.
40 μl의 트리에탄올아민 완충제 (탈이온수 중 200 mM 용액, pH=9.0)에, 10 μl의 피리독살 포스페이트 (탈이온수 중 10 mM 용액) 및 10 μl의 이소-프로필아민 (탈이온수 중 2 M 용액, 수성 HCl의 첨가에 의해 pH=9.0으로 조정됨)을 실온에서 첨가하였다. 후속적으로, 20 μl의 4-메틸-2-옥소-발레르산 (탈이온수 중 100 mM 용액)을 첨가하였다. 최종적으로, 1.5 mg/ml의 각각의 ω-TA 단백질을 포함하는 20 μl의 용액을 실온에서 첨가하고, 혼합물을 40℃에서 800 rpm의 회전식 진탕기 상에서 6 시간 동안 인큐베이션하였다. 트랜스아미노화 반응을 "일반적인 방법" 항목 8에 기재된 바와 같이 반응 동안에 상이한 시간 간격으로 취한 분취량의 HPLC-분석에 의해 모니터링하였다.
표 7은 서열식별번호: 3에 제시된 아미노산 서열을 갖는 아르트로박터 종 및 서열식별번호: 6에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 이들 야생형 단백질과 비교하여 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체에 대해 수득된 결과를 나타낸다. 결과는 또한 도 3에 제시되어 있다.
Figure pct00010
표 7
표 7의 설명: 표 6의 설명 참고
표 7 및 도 3으로부터, 아르트로박터 종 및 바실루스 메가테리움으로부터의 야생형 효소는 4-메틸-2-옥소-발레르산의 아미노화에 의해 (S)-류신을 생성하지 않는 반면에, ω-TA 변이체는 (S)-류신을 매우 효율적으로 생성한다는 것을 유추할 수 있다.
3. 페닐피루브산에서 (S)-페닐알라닌으로의 전환
서열식별번호: 3에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 6에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질, 또는 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체를 "일반적인 방법", 항목 3에 기재된 바와 같이 발현하고 정제하였다.
40 μl의 트리에탄올아민 완충제 (탈이온수 중 200 mM 용액, pH=9.0)에, 10 μl의 피리독살 포스페이트 (탈이온수 중 10 mM 용액) 및 10 μl의 이소-프로필아민 (탈이온수 중 2 M 용액, 수성 HCl의 첨가에 의해 pH=9.0으로 조정됨)을 실온에서 첨가하였다. 후속적으로, 1:1 비의 DMSO/탈이온수 중 20 μl의 페닐피루브산 (100 mM 페닐피루브산 용액)을 첨가하였다. 최종적으로, 1.5 mg/ml의 각각의 ω-TA 단백질을 포함하는 20 μl의 용액을 실온에서 첨가하고, 혼합물을 40℃에서 800 rpm의 회전식 진탕기 상에서 6 시간 동안 인큐베이션하였다. 트랜스아미노화 반응을 "일반적인 방법" 항목 8에 기재된 바와 같이 반응 동안에 상이한 시간 간격으로 취한 분취량의 HPLC-분석에 의해 모니터링하였다.
표 8은 서열식별번호: 3에 제시된 아미노산 서열을 갖는 아르트로박터 종 및 서열식별번호: 6에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 이들 야생형 단백질과 비교하여 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체에 대해 수득된 결과를 나타낸다. 결과는 또한 도 4에 제시되어 있다.
Figure pct00011
표 8
표 8의 설명: 표 6의 설명 참고
표 8 및 도 4로부터, 아르트로박터 종으로부터의 야생형 효소가 페닐피루브산으로부터 (S)-페닐알라닌을 생성하지 않고, 바실루스 메가테리움으로부터의 야생형 효소가 ω-TA 변이체에 의해 생성된 (S)-페닐알라닌의 양에 비해 적은 양으로 매우 천천히 (S)-페닐알라닌을 생성한다는 것을 유추할 수 있다.
4. p-히드록시페닐피루브산에서 (S)-티로신으로의 전환:
서열식별번호: 3에 제시된 아미노산 서열을 갖는 아르트로박터 종으로부터의 또는 서열식별번호: 6에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 야생형 ω-TA 단백질, 또는 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체를 "일반적인 방법", 항목 3에 기재된 바와 같이 발현하고 정제하였다.
40 μl의 트리에탄올아민 완충제 (탈이온수 중 200 mM 용액, pH=9.0)에, 10 μl의 피리독살 포스페이트 (탈이온수 중 10 mM 용액) 및 10 μl의 이소-프로필아민 (탈이온수 중 2 M 용액, 수성 HCl의 첨가에 의해 pH=9.0으로 조정됨)을 실온에서 첨가하였다. 후속적으로, 1:1 비의 DMSO/탈이온수 중 20 μl의 p-히드록시페닐피루브산 (100 mM p-히드록시페닐피루브산 용액)을 첨가하였다. 최종적으로, 1.5 mg/ml의 각각의 ω-TA 단백질을 포함하는 20 μl의 용액을 실온에서 첨가하고, 혼합물을 40℃에서 800 rpm의 회전식 진탕기 상에서 6 시간 동안 인큐베이션하였다. 트랜스아미노화 반응을 "일반적인 방법" 항목 8에 기재된 바와 같이 반응 동안에 상이한 시간 간격으로 취한 분취량의 HPLC-분석에 의해 모니터링하였다.
표 9는 서열식별번호: 3에 제시된 아미노산 서열을 갖는 아르트로박터 종 및 서열식별번호: 6에 제시된 아미노산 서열을 갖는 바실루스 메가테리움으로부터의 이들 야생형 단백질과 비교하여 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체에 대해 수득된 결과를 나타낸다. 결과는 또한 도 5에 제시되어 있다.
Figure pct00012
표 9
표 9의 설명: 표 6의 설명 참고
표 9 및 도 5로부터, 아르트로박터 종 및 바실루스 메가테리움으로부터의 야생형 효소는 p-히드록시페닐피루브산의 아미노화에 의해 (S)-티로신을 생성하지 않는 반면에, ω-TA 변이체는 (S)-티로신을 매우 효율적으로 생성한다는 것을 유추할 수 있다.
5. 추가의 아미노산 변형을 포함하는 ω-TA 변이체에 의해 4-[히드록시(메틸)포스포릴]-2-옥소부탄산으로부터 (S)-글루포시네이트의 생성
서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체 및 표 2에서 본원에 기재된 추가의 아미노산 변형을 포함하는 ω-TA 변이체를 "일반적인 방법", 항목 6에 기재된 바와 같이 DAAO의 활성 및 카탈라제의 활성을 갖는 단백질 ("일반적인 방법", 항목 5 참고)에 의해 함께 발현한 후, "일반적인 방법", 항목 9에 기재된 바와 같이 분무 건조시켰다. DAAO는 (R)-글루포시네이트의 탈아미노화에 의해 4-[히드록시(메틸)포스포릴]-2-옥소부탄산을 생성한다. 후속적으로, 4-[히드록시(메틸)포스포릴]-2-옥소부탄산이 아미노 수용자로서 추가의 아미노산 변형을 갖는 ω-TA 변이체의 사용에 의해 사용되고, 아미노화 반응에서 (S)-글루포시네이트로 전환된다. 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체 및 표 2에서 본원에 기재된 추가의 아미노산 변형을 포함하는 ω-TA 변이체의 활성 시험을 "일반적인 방법, 항목 7에 기재된 시험에 따라 수행하였다. 반응을 시작한지 5 시간 후에 각각의 반응에서 생성된 (S)-글루포시네이트의 양을 측정함으로써 트랜스아미노화 반응을 "일반적인 방법" 항목 8에 기재된 바와 같이 HPLC-분석에 의해 모니터링하였다.
표 10은 추가의 아미노산 변형을 포함하는 각각의 ω-TA 변이체에 의해 생성된 (S)-글루포시네이트 (S-GA)의 양 및 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체에 의해 생성된 양을 나타낸다.
Figure pct00013
표 10
표 10의 설명:
아미노산 변화의 확인을 위해, 칼럼 1의 숫자는 서열식별번호: 18에 제시된 아미노산 서열의 아미노산 위치를 나타낸다. 숫자 앞에 있는 문자는 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 존재하는 아미노산을 나타낸다. 숫자 뒤에 있는 문자는 추가의 아미노산 변형을 포함하는 ω-TA 변이체의 아미노산 서열에서 각각의 위치에 존재하는 아미노산을 나타낸다. 각각 숫자 앞과 뒤에 있는 문자인 칼럼의 동일한 열에 주어진 두 숫자는 서열식별번호: 18에 제시된 아미노산 서열과 비교하여 2개의 동시 아미노산 치환 (대체)을 나타낸다.
표 10으로부터, 서열식별번호: 18에 제시된 아미노산 서열을 갖는 ω-TA 변이체와 비교하여 추가의 아미노산 변형을 포함하는 ω-TA 변이체가 더 많은 (S)-글루포시네이트를 생성한다는 것을 유추할 수 있다.
SEQUENCE LISTING <110> Bayer AG <120> Nucleic acids encoding improved transaminase proteins <130> BCS181013FC <150> EP18186729.2 <151> 2018-07-31 <160> 30 <170> PatentIn version 3.5 <210> 1 <211> 1449 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence due to degeneracy of genetic code. <220> <221> misc_feature <222> (1)..(1449) <223> Nucleotide abbreviations are used according to IUPAC code. Back translation from protein sequence shown under SEQ ID NO 3. <400> 1 atgwsnytna cngtncaraa rathaaytgg garcargtna argartggga ymgnaartay 60 ytnatgmgna cnttywsnac ncaraaygar taycarccng tnccnathga rwsnacngar 120 ggngaytayy tnathatgcc ngayggnacn mgnytnytng ayttyttyaa ycarytntay 180 tgygtnaayy tnggncaraa raaycaraar gtnaaygcng cnathaarga rgcnytngay 240 mgntayggnt tygtntggga yacntaygcn acngaytaya argcnaargc ngcnaarath 300 athathgarg ayathytngg ngaygargay tggccnggna argtnmgntt ygtnwsnacn 360 ggnwsngarg cngtngarac ngcnytnaay athgcnmgny tntayacnaa ymgnccnytn 420 gtngtnacnm gngarcayga ytaycayggn tggacnggng gngcngcnac ngtnacnmgn 480 ytnmgnwsnt aymgnwsngg nytngtnggn garaaywsng arwsnttyws ngcncarath 540 ccnggnwsnw sntayaayws ngcngtnytn atggcnccnw snccnaayat gttycargay 600 wsngayggna ayytnytnaa rgaygaraay ggngarytny tnwsngtnaa rtayacnmgn 660 mgnatgathg araaytaygg nccngarcar gtngcngcng tnathacnga rgtnwsncar 720 ggngcnggnw sngcnatgcc nccntaygar tayathccnc arathmgnaa ratgacnaar 780 garytnggng tnytntggat haaygaygar gtnytnacng gnttyggnmg nacnggnaar 840 tggttyggnt aycarcayta yggngtncar ccngayatha thacnatggg naarggnytn 900 wsnwsnwsnw snytnccngc nggngcngtn ytngtnwsna argarathgc ngcnttyatg 960 gayaarcaym gntgggarws ngtnwsnacn taygcnggnc ayccngtngc natggcngcn 1020 gtntgygcna ayytngargt natgatggar garaayttyg tngarcargc naargaywsn 1080 ggngartaya thmgnwsnaa rytngarytn ytncargara arcayaarws nathggnaay 1140 ttygayggnt ayggnytnyt ntggathgtn gayathgtna aygcnaarac naaracnccn 1200 taygtnaary tngaymgnaa yttyacncay ggnatgaayc cnaaycarat hccnacncar 1260 athathatga araargcnyt ngaraarggn gtnytnathg gnggngtnat gccnaayacn 1320 atgmgnathg gngcnwsnyt naaygtnwsn mgnggngaya thgayaargc natggaygcn 1380 ytngaytayg cnytngayta yytngarwsn ggngartggc argcnytnga rcaycaycay 1440 caycaycay 1449 <210> 2 <211> 1452 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence. <220> <221> CDS <222> (1)..(1452) <223> Back translation from protein sequence shown under SEQ ID NO 3, derivable from NCBI under accesssion No. 5G09. <400> 2 atg agc ctt acc gta cag aaa atc aac tgg gaa cag gtc aaa gaa tgg 48 Met Ser Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 gat cgc aaa tac ctg atg cgt acc ttc agc acc cag aat gag tat caa 96 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 cct gtc ccg att gag tcc acg gaa ggc gat tac ttg att atg cca gat 144 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Asp 35 40 45 ggg acg cgc tta ctg gac ttc ttc aat cag ctg tat tgc gtg aat ctg 192 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Leu 50 55 60 ggg caa aag aac cag aag gtt aat gca gcg atc aaa gaa gcc ctg gat 240 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 cgc tat ggt ttc gtc tgg gat acg tac gcg acc gac tat aaa gcg aaa 288 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 gct gcg aaa att atc att gag gac atc ttg ggc gat gaa gat tgg ccc 336 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 ggt aaa gtt cgc ttt gtg agc aca ggt tct gaa gca gtg gaa acc gcc 384 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 ctg aat atc gcg cgc tta tac act aat cgc ccg ctc gta gtg act cgt 432 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 gag cat gac tat cat ggt tgg act ggt ggt gct gcg acg gtc acg cgc 480 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 ctg cgt tcg tac cgt tcc gga ctt gtg ggc gaa aac tcg gag tcc ttt 528 Leu Arg Ser Tyr Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 tcc gct caa att ccg ggc agt agc tat aac tcc gca gtt ctg atg gca 576 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Ser Ala Val Leu Met Ala 180 185 190 ccg tca ccg aac atg ttc cag gac agt gat ggc aat ctc ctg aaa gac 624 Pro Ser Pro Asn Met Phe Gln Asp Ser Asp Gly Asn Leu Leu Lys Asp 195 200 205 gaa aat ggc gaa ctg ctg tct gtg aaa tat acc cgt cgc atg att gaa 672 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 aac tat ggg ccg gaa cag gta gca gcc gtc att acc gag gtt tct caa 720 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 ggt gcc gga agc gct atg cca ccg tac gaa tac att ccg caa att cgg 768 Gly Ala Gly Ser Ala Met Pro Pro Tyr Glu Tyr Ile Pro Gln Ile Arg 245 250 255 aaa atg acc aaa gaa ctg ggc gtg ctt tgg atc aat gac gaa gta ctg 816 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Asn Asp Glu Val Leu 260 265 270 acc ggt ttt ggc cgt aca ggc aaa tgg ttt ggt tac cag cac tat ggc 864 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 gtt caa ccg gat atc att acg atg ggt aaa gga ctg agt tca tcg tca 912 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 ctc cca gct ggc gcc gtt ctg gtg agt aaa gaa att gca gcg ttc atg 960 Leu Pro Ala Gly Ala Val Leu Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 gat aaa cat cgg tgg gaa tct gtt tcg act tat gcc ggg cat cca gtc 1008 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 gcg atg gca gct gtt tgt gcg aac ctg gaa gtg atg atg gaa gag aac 1056 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 ttt gtg gaa cag gcg aaa gat agc ggc gaa tat atc cgt agc aag tta 1104 Phe Val Glu Gln Ala Lys Asp Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 gag ctg ttg cag gag aaa cac aag agc att ggg aac ttt gac ggc tat 1152 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 ggg tta ctg tgg att gtg gac att gtg aat gcc aag acc aaa acc cct 1200 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 tat gtc aaa ctc gac cgc aac ttt aca cac gga atg aac ccc aat cag 1248 Tyr Val Lys Leu Asp Arg Asn Phe Thr His Gly Met Asn Pro Asn Gln 405 410 415 atc ccg aca cag atc atc atg aag aag gcg ttg gag aaa ggc gtt ctg 1296 Ile Pro Thr Gln Ile Ile Met Lys Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 att ggt ggc gtg atg cct aac acg atg cgc atc ggt gcg tcg ctt aac 1344 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 gta tca cgt ggc gat att gat aaa gcg atg gat gcc ctg gat tac gcc 1392 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 tta gat tac ctg gag agt ggt gaa tgg caa gcc ttg gaa cat cac cac 1440 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Ala Leu Glu His His His 465 470 475 480 cac cat cat taa 1452 His His His <210> 3 <211> 483 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 3 Met Ser Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Asp 35 40 45 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Leu 50 55 60 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 Leu Arg Ser Tyr Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Ser Ala Val Leu Met Ala 180 185 190 Pro Ser Pro Asn Met Phe Gln Asp Ser Asp Gly Asn Leu Leu Lys Asp 195 200 205 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 Gly Ala Gly Ser Ala Met Pro Pro Tyr Glu Tyr Ile Pro Gln Ile Arg 245 250 255 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Asn Asp Glu Val Leu 260 265 270 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 Leu Pro Ala Gly Ala Val Leu Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 Phe Val Glu Gln Ala Lys Asp Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 Tyr Val Lys Leu Asp Arg Asn Phe Thr His Gly Met Asn Pro Asn Gln 405 410 415 Ile Pro Thr Gln Ile Ile Met Lys Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Ala Leu Glu His His His 465 470 475 480 His His His <210> 4 <211> 1455 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence due to degeneracy of genetic code. <220> <221> misc_feature <222> (1)..(1455) <223> Nucleotide abbreviations are used according to IUPAC code. Back translation from protein sequence shown under SEQ ID NO 6. <400> 4 atgggnytna cngtncaraa rathaaytgg garcargtna argartggga ymgnaartay 60 ytnatgmgna cnttywsnac ncaraaygar taycarccng tnccnathga rwsnacngar 120 ggngaytayy tnathacncc nggnggnacn mgnytnytng ayttyttyaa ycarytntgy 180 tgygtnaayy tnggncaraa raaycaraar gtnaaygcng cnathaarga rgcnytngay 240 mgntayggnt tygtntggga yacntaygcn acngaytaya argcnaargc ngcnaarath 300 athathgarg ayathytngg ngaygargay tggccnggna argtnmgntt ygtnwsnacn 360 ggnwsngarg cngtngarac ngcnytnaay athgcnmgny tntayacnaa ymgnccnytn 420 gtngtnacnm gngarcayga ytaycayggn tggacnggng gngcngcnac ngtnacnmgn 480 ytnmgnwsnt tymgnwsngg nytngtnggn garaaywsng arwsnttyws ngcncarath 540 ccnggnwsnw sntgywsnws ngcngtnytn atggcnccnw snwsnaayac nttycargay 600 wsnaayggna aytayytnaa rgaygaraay ggngarytny tnwsngtnaa rtayacnmgn 660 mgnatgathg araaytaygg nccngarcar gtngcngcng tnathacnga rgtnwsncar 720 ggngtnggnw snacnatgcc nccntaygar taygtnccnc arathmgnaa ratgacnaar 780 garytnggng tnytntggat hwsngaygar gtnytnacng gnttyggnmg nacnggnaar 840 tggttyggnt aycarcayta yggngtncar ccngayatha thacnatggg naarggnytn 900 wsnwsnwsnw snytnccngc nggngcngtn gtngtnwsna argarathgc ngcnttyatg 960 gayaarcaym gntgggarws ngtnwsnacn taygcnggnc ayccngtngc natggcngcn 1020 gtntgygcna ayytngargt natgatggar garaayytng tngarcargc naaraaywsn 1080 ggngartaya thmgnwsnaa rytngarytn ytncargara arcayaarws nathggnaay 1140 ttygayggnt ayggnytnyt ntggathgtn gayathgtna aygcnaarac naaracnccn 1200 taygtnaary tngaymgnaa yttymgncay ggnatgaayc cnaaycarat hccnacncar 1260 athathatgg araargcnyt ngaraarggn gtnytnathg gnggngcnat gccnaayacn 1320 atgmgnathg gngcnwsnyt naaygtnwsn mgnggngaya thgayaargc natggaygcn 1380 ytngaytayg cnytngayta yytngarwsn ggngartggc arcarwsngc nytngarcay 1440 caycaycayc aycay 1455 <210> 5 <211> 1458 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence. <220> <221> CDS <222> (1)..(1458) <223> Cretaed by back-translation of the protein sequence shown under SEQ ID NO 6, derivable from NCBI under accession No. 5G2P. <400> 5 atg ggt ctg acc gtg cag aag att aac tgg gaa cag gtg aag gag tgg 48 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 gat cgc aaa tat ctg atg cgc acg ttc tct acc cag aac gaa tac cag 96 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 cct gtt ccg att gag tca acc gaa ggt gac tac ctt att aca ccc ggc 144 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Thr Pro Gly 35 40 45 ggt act cgc ttg ctc gat ttc ttc aat cag ctc tgc tgc gtg aac ctt 192 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Cys Cys Val Asn Leu 50 55 60 ggt caa aag aac cag aaa gta aat gcc gcg atc aaa gaa gcc ctg gat 240 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 cgt tat ggc ttt gtg tgg gac acc tat gcc acc gat tac aaa gcg aaa 288 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 gct gct aaa atc atc att gag gac att ctg ggc gat gaa gat tgg cca 336 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 ggc aaa gtg cgc ttt gtc agt acc ggt agc gaa gcc gtg gaa acg gca 384 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 ttg aac atc gca cgc tta tac acc aat cgt cca ctt gtg gtg aca cgt 432 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 gag cac gat tac cat gga tgg acg ggt gga gcc gct act gtt aca cgc 480 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 ctg cgt tct ttt cgg tct ggc ctg gtt ggg gaa aac agc gag tcc ttt 528 Leu Arg Ser Phe Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 tcc gct caa att ccg ggc agc agc tgt tcg tca gca gtt ctt atg gcg 576 Ser Ala Gln Ile Pro Gly Ser Ser Cys Ser Ser Ala Val Leu Met Ala 180 185 190 cca tcc agt aac acg ttc cag gat agc aat ggc aat tac ctg aag gat 624 Pro Ser Ser Asn Thr Phe Gln Asp Ser Asn Gly Asn Tyr Leu Lys Asp 195 200 205 gag aat ggg gaa ctg ctg tcg gtg aaa tat acg cgt cgt atg atc gag 672 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 aac tat ggg ccg gaa caa gtg gca gcg gtc att acc gaa gta tcc cag 720 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 ggc gtt ggc tca acg atg cct ccg tat gaa tat gtc ccg caa atc cgc 768 Gly Val Gly Ser Thr Met Pro Pro Tyr Glu Tyr Val Pro Gln Ile Arg 245 250 255 aaa atg acc aaa gaa ctg gga gta ctc tgg att tcc gac gaa gta ctg 816 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Ser Asp Glu Val Leu 260 265 270 act ggc ttt ggt cgc acc ggc aaa tgg ttc ggt tat cag cac tac gga 864 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 gtg caa ccc gac atc att aca atg ggt aaa ggt ctg agt agc agc agc 912 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 tta ccg gca ggg gcc gta gtc gtt tcg aaa gaa att gct gcg ttt atg 960 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 gat aaa cac cgc tgg gaa tcg gtt agc act tat gcc ggt cat ccg gtt 1008 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 gcg atg gca gcg gtc tgt gct aac ctc gaa gtg atg atg gaa gag aat 1056 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 ctg gtt gag caa gcc aag aac tct ggt gaa tac atc cgc tca aaa ctg 1104 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 gaa tta ctg cag gaa aag cac aaa tcg att ggg aac ttt gat ggc tat 1152 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 ggg ctg tta tgg atc gta gac att gtc aac gcg aaa acc aaa acc ccg 1200 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 tat gtg aaa ttg gac cgc aat ttc cgt cat ggc atg aat ccg aac cag 1248 Tyr Val Lys Leu Asp Arg Asn Phe Arg His Gly Met Asn Pro Asn Gln 405 410 415 att cct act cag atc att atg gag aaa gcg ttg gag aag ggc gtc ttg 1296 Ile Pro Thr Gln Ile Ile Met Glu Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 att ggc ggt gca atg ccg aat acg atg cgg atc ggt gcc agt ctg aat 1344 Ile Gly Gly Ala Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 gtc tct cgt ggc gat att gat aaa gcg atg gat gcg ctg gac tat gcg 1392 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 ctg gac tac ctg gaa agc ggc gaa tgg caa cag agt gcg tta gaa cat 1440 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser Ala Leu Glu His 465 470 475 480 cac cat cat cac cat taa 1458 His His His His His 485 <210> 6 <211> 485 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Thr Pro Gly 35 40 45 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Cys Cys Val Asn Leu 50 55 60 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 Leu Arg Ser Phe Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 Ser Ala Gln Ile Pro Gly Ser Ser Cys Ser Ser Ala Val Leu Met Ala 180 185 190 Pro Ser Ser Asn Thr Phe Gln Asp Ser Asn Gly Asn Tyr Leu Lys Asp 195 200 205 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 Gly Val Gly Ser Thr Met Pro Pro Tyr Glu Tyr Val Pro Gln Ile Arg 245 250 255 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Ser Asp Glu Val Leu 260 265 270 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 Tyr Val Lys Leu Asp Arg Asn Phe Arg His Gly Met Asn Pro Asn Gln 405 410 415 Ile Pro Thr Gln Ile Ile Met Glu Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 Ile Gly Gly Ala Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser Ala Leu Glu His 465 470 475 480 His His His His His 485 <210> 7 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence due to degeneracy of genetic code. <220> <221> misc_feature <222> (1)..(1428) <223> Nucleotide abbreviations are used according to IUPAC code. Back translation from protein sequence shown under SEQ ID NO 9. <400> 7 atgwsnytna cngtncaraa rathaaytgg garcargtna argartggga ymgnaartay 60 ytnatgmgna cnttywsnac ncaraaygar taycarccng tnccnathga rwsnacngar 120 ggngaytayy tnathatgcc ngayggnacn mgnytnytng ayttyttyaa ycarytntay 180 tgygtnaayy tnggncaraa raayccnaar gtnaaygcng cnathaarga rgcnytngay 240 mgntayggnt tygtntggga yacntaywsn acngaytaya argcnaargc ngcnaarath 300 athathgarg ayathytngg ngaygargay tggccnggna argtnmgntt ygtnwsnacn 360 ggnwsngarg cngtngarac ngcnytnaay athgcnmgny tntayacnaa ymgnccnytn 420 gtngtnacnm gngarcayga ytaycayggn tggacnggng gngcngcnac ngtnacnmgn 480 ytnmgnwsnt aymgnwsngg nytngtnggn garaaywsng arwsnttyws ngcncarath 540 ccnggnwsnw sntayaayws ngcngtnytn atggcnccnw snccnaayat gttycargay 600 wsnaayggna aytgyytnaa rgaygaraay ggngarytny tnwsngtnaa rtayacnmgn 660 mgnatgathg araaytaygg nccngarcar gtngcngcng tnathacnga rgtnwsncar 720 ggngcnggnw sngcnatgcc nccntaygar tayathccnc arathmgnaa ratgacnaar 780 garytnggng tnytntggat hacngaygar gtnytnacng gnttyggnmg nacnggnaar 840 tggttyggnt aycarcayta yggngtncar ccngayatha thacnatggg naarggnytn 900 wsnwsnwsnw snytnccngc nggngcngtn ytngtnwsna argarathgc ngarttyatg 960 gaymgncaym gntgggarws ngtnwsnacn taygcnggnc ayccngtngc natggcngcn 1020 gtntgygcna ayytngargt natgatggar garaayttyg tngarcargc naaraaywsn 1080 ggngartaya thmgnwsnaa rytngarytn ytncargara arcayaarws nathggnaay 1140 ttygayggnt ayggnytnyt ntggathgtn gayathgtna aygcnaarac naaracnccn 1200 taygtnaary tngaymgnaa yttyacncay ggnatgaayc cnaaycarat hccnacncar 1260 athathatga araargcnyt ngaraarggn gtnytnathg gnggngtnat gccnaayacn 1320 atgmgnathg gngcnwsnyt naaygtnwsn mgngargaya thgayaargc natggaygcn 1380 ytngaytayg cnytngayta yytngarwsn ggngartggc arcarwsn 1428 <210> 8 <211> 1431 <212> DNA <213> Bacillus spec. Soil768D1 <220> <221> CDS <222> (1)..(1428) <300> <308> LMTA01000079.1 <309> 2015-11-02 <313> (118099)..(119529) <400> 8 atg agt tta aca gtg caa aaa ata aac tgg gag caa gtt aaa gaa tgg 48 Met Ser Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 gat cgt aaa tac ctg atg agg acg ttt agt acc caa aat gag tat caa 96 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 cca gta ccg att gaa tca aca gaa ggt gac tac ttg att atg cct gat 144 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Asp 35 40 45 ggc aca aga tta tta gat ttc ttc aat caa ctt tat tgt gtc aat tta 192 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Leu 50 55 60 ggt cag aaa aat cca aaa gtt aat gct gca atc aag gag gct tta gac 240 Gly Gln Lys Asn Pro Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 cga tat ggt ttt gta tgg gat act tat tca act gat tat aaa gcc aaa 288 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ser Thr Asp Tyr Lys Ala Lys 85 90 95 gca gca aag ata att att gag gat att tta ggt gat gaa gac tgg cca 336 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 gga aaa gtt agg ttc gta tca aca gga agt gaa gca gtg gaa acg gca 384 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 ctg aac atc gcg agg tta tat aca aat cgc cca cta gtg gtt aca cga 432 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 gaa cac gat tat cat ggt tgg act ggt gga gct gct act gtt act cga 480 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 tta agg tca tat cga agt ggt tta gtt ggg gaa aat tca gaa tct ttt 528 Leu Arg Ser Tyr Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 tca gca caa ata ccc ggt tca tca tat aat agt gct gtt ttg atg gcg 576 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Ser Ala Val Leu Met Ala 180 185 190 cca tcc cct aac atg ttt cag gat tcg aac ggc aac tgc cta aaa gat 624 Pro Ser Pro Asn Met Phe Gln Asp Ser Asn Gly Asn Cys Leu Lys Asp 195 200 205 gaa aac ggg gaa ttg ttg agt gta aag tat aca cgt cgt atg atc gaa 672 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 aac tat ggt ccg gaa caa gtg gca gca gtg ata act gaa gta tcg caa 720 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 ggt gca ggc tct gct atg ccc cca tat gaa tac att cca cag atc cga 768 Gly Ala Gly Ser Ala Met Pro Pro Tyr Glu Tyr Ile Pro Gln Ile Arg 245 250 255 aaa atg aca aaa gaa cta ggt gtc ctt tgg att act gat gaa gtt ctt 816 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Thr Asp Glu Val Leu 260 265 270 act ggc ttt ggg cgg aca ggg aag tgg ttt gga tat cag cat tat ggg 864 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 gta cag cca gat ata atc act atg ggt aaa gga ctc tcc agt tcc tca 912 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 ctc cct gct ggc gct gtc tta gtt agt aag gaa att gca gag ttt atg 960 Leu Pro Ala Gly Ala Val Leu Val Ser Lys Glu Ile Ala Glu Phe Met 305 310 315 320 gat agg cac cga tgg gag tca gta tcc acc tat gcc ggt cat cca gtt 1008 Asp Arg His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 gcg atg gct gcg gtc tgt gca aat tta gaa gtg atg atg gaa gaa aac 1056 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 ttt gtt gag caa gcg aag aac agc ggc gag tat ata agg agt aaa ctt 1104 Phe Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 gaa ctt ctg caa gaa aaa cat aaa agt ata ggt aat ttt gac gga tat 1152 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 ggc ctt tta tgg ata gta gat att gtt aat gcc aag act aag act cct 1200 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 tac gtg aaa ttg gac cgg aac ttt acg cac ggg atg aat cca aat caa 1248 Tyr Val Lys Leu Asp Arg Asn Phe Thr His Gly Met Asn Pro Asn Gln 405 410 415 atc cca aca caa atc att atg aaa aaa gcg cta gaa aaa gga gtg cta 1296 Ile Pro Thr Gln Ile Ile Met Lys Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 att ggt gga gta atg cct aat aca atg aga att ggc gca tct ttg aat 1344 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 gtt agt cgc gaa gac atc gat aaa gca atg gat gca ctg gat tat gca 1392 Val Ser Arg Glu Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 ctt gac tat ttg gaa agt gga gaa tgg cag caa tcc taa 1431 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser 465 470 475 <210> 9 <211> 476 <212> PRT <213> Bacillus spec. Soil768D1 <220> <223> Cretaed by back-translation of a protein sequence. <400> 9 Met Ser Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Asp 35 40 45 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Leu 50 55 60 Gly Gln Lys Asn Pro Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ser Thr Asp Tyr Lys Ala Lys 85 90 95 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 Leu Arg Ser Tyr Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Ser Ala Val Leu Met Ala 180 185 190 Pro Ser Pro Asn Met Phe Gln Asp Ser Asn Gly Asn Cys Leu Lys Asp 195 200 205 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 Gly Ala Gly Ser Ala Met Pro Pro Tyr Glu Tyr Ile Pro Gln Ile Arg 245 250 255 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Thr Asp Glu Val Leu 260 265 270 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 Leu Pro Ala Gly Ala Val Leu Val Ser Lys Glu Ile Ala Glu Phe Met 305 310 315 320 Asp Arg His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 Phe Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 Tyr Val Lys Leu Asp Arg Asn Phe Thr His Gly Met Asn Pro Asn Gln 405 410 415 Ile Pro Thr Gln Ile Ile Met Lys Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 Val Ser Arg Glu Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser 465 470 475 <210> 10 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence due to degeneracy of genetic code. <220> <221> misc_feature <222> (1)..(1428) <223> Nucleotide abbreviations are used according to IUPAC code. Back translation from protein sequence shown under SEQ ID NO 12. <400> 10 atgggnytna cngtncaraa rathaaytgg garcargtna argartggga ymgnaartay 60 ytnatgmgna cnttywsnac ncaraaygar taycarccng tnccnathga rwsnacngar 120 ggngaytayy tnathacncc nggnggnacn mgnytnytng ayttyttyaa ycarytntgy 180 tgygtnaayy tnggncaraa raaycaraar gtnaaygcng cnathaarga rgcnytngay 240 mgntayggnt tygtntggga yacntaygcn acngaytaya argcnaargc ngcnaarath 300 athathgarg ayathytngg ngaygargay tggccnggna argtnmgntt ygtnwsnacn 360 ggnwsngarg cngtngarac ngcnytnaay athgcnmgny tntayacnaa ymgnccnytn 420 gtngtnacnm gngarcayga ytaycayggn tggacnggng gngcngcnac ngtnacnmgn 480 ytnmgnwsnt tymgnwsngg nytngtnggn garaaywsng arwsnttyws ngcncarath 540 ccnggnwsnw sntgywsnws ngcngtnytn atggcnccnw snwsnaayac nttycargay 600 wsnaayggna aytayytnaa rgaygaraay ggngarytny tnwsngtnaa rtayacnmgn 660 mgnatgathg araaytaygg nccngarcar gtngcngcng tnathacnga rgtnwsncar 720 ggngtnggnw snacnatgcc nccntaygar taygtnccnc arathmgnaa ratgacnaar 780 garytnggng tnytntggat hwsngaygar gtnytnacng gnttyggnmg nacnggnaar 840 tggttyggnt aycarcayta yggngtncar ccngayatha thacnatggg naarggnytn 900 wsnwsnwsnw snytnccngc nggngcngtn gtngtnwsna argarathgc ngcnttyatg 960 gayaarcaym gntgggarws ngtnwsnacn taygcnggnc ayccngtngc natggcngcn 1020 gtntgygcna ayytngargt natgatggar garaayytng tngarcargc naaraaywsn 1080 ggngartaya thmgnwsnaa rytngarytn ytncargara arcayaarws nathggnaay 1140 ttygayggnt ayggnytnyt ntggathgtn gayathgtna aygcnaarac naaracnccn 1200 taygtnaary tngaymgnaa yttymgncay ggnatgaayc cnaaycarat hccnacncar 1260 athathatgg araargcnyt ngaraarggn gtnytnathg gnggngcnat gccnaayacn 1320 atgmgnathg gngcnwsnyt naaygtnwsn mgnggngaya thgayaargc natggaygcn 1380 ytngaytayg cnytngayta yytngarwsn ggngartggc arcarwsn 1428 <210> 11 <211> 1431 <212> DNA <213> Artificial Sequence <220> <223> Mutated wild-type sequence. <220> <221> CDS <222> (1)..(1431) <300> <308> NRP_ABN37900 <309> 2006-10-12 <313> (1)..(1431) <300> <302> Thermostable omega-tranaminase <308> NRP_ABN37900 <309> 2006-10-12 <310> WO 2006/063336 A2 <311> 2005-12-12 <312> 2006-06-15 <313> (1)..(1431) <400> 11 atg ggt ctg acc gtg cag aaa att aat tgg gaa cag gtg aaa gaa tgg 48 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 gat cgc aaa tat ctg atg cgt acc ttt agc acc cag aat gaa tat cag 96 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 ccg gtt ccg att gaa agc acc gaa ggc gat tat ctg att aca ccg ggt 144 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Thr Pro Gly 35 40 45 ggt aca cgt ctg ctg gat ttt ttt aat cag ctg tgc tgt gtt aat ctg 192 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Cys Cys Val Asn Leu 50 55 60 ggt cag aaa aat cag aaa gtg aat gca gcc att aaa gaa gca ctg gat 240 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 cgt tac ggt ttt gtg tgg gat acc tat gcc acc gat tat aaa gca aaa 288 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 gcc gca aaa att att att gaa gat att ctg gga gat gaa gat tgg cct 336 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 ggt aaa gtt cgt ttt gtt agc acc ggt agc gaa gca gtt gaa acc gca 384 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 ctg aat att gca cgt ctg tat acc aat cgt ccg ctg gtt gtt acc cgt 432 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 gaa cat gat tat cat ggt tgg acc ggt ggt gca gca acc gtt acc cgt 480 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 ctg cgt agc ttt cgt agc ggt ctg gtt ggt gaa aat agc gaa agc ttt 528 Leu Arg Ser Phe Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 agc gca cag att ccg ggt agc agc tgt agc agc gca gtt ctg atg gca 576 Ser Ala Gln Ile Pro Gly Ser Ser Cys Ser Ser Ala Val Leu Met Ala 180 185 190 ccg agc agc aat acc ttt cag gat agc aat ggc aat tat ctg aaa gat 624 Pro Ser Ser Asn Thr Phe Gln Asp Ser Asn Gly Asn Tyr Leu Lys Asp 195 200 205 gaa aac ggt gaa ctg ctg tct gtt aaa tat acc cgt cgc atg att gaa 672 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 aat tat ggt ccg gaa cag gtt gca gca gtt att acc gaa gtt agc cag 720 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 ggt gtt ggt agc acc atg cct ccg tat gaa tat gtt ccg cag att cgc 768 Gly Val Gly Ser Thr Met Pro Pro Tyr Glu Tyr Val Pro Gln Ile Arg 245 250 255 aaa atg acc aaa gaa ctg ggt gtt ctg tgg att tct gat gaa gtt ctg 816 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Ser Asp Glu Val Leu 260 265 270 acc ggt ttt ggt cgt acc ggt aaa tgg ttt ggc tat cag cat tat ggt 864 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 gtt cag ccg gat att att acc atg ggt aaa ggt ctg agc agc agc agc 912 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 ctg cct gca ggt gca gtt gtt gtg agc aaa gaa atc gca gcc ttt atg 960 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 gat aaa cat cgt tgg gaa agc gtt agc acc tat gca ggt cat cct gtg 1008 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 gct atg gct gcc gtt tgt gca aat ctg gaa gtg atg atg gaa gaa aat 1056 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 ctg gtt gaa cag gcc aaa aat agc ggt gaa tat atc cgt agc aaa ctg 1104 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 gaa ctg ctg cag gaa aaa cat aaa agc att ggc aat ttt gat ggt tat 1152 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 ggc ctg ctg tgg att gtt gat att gtg aat gcc aaa acc aaa acc ccg 1200 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 tat gtt aaa ctg gat cgc aat ttt cgt cat ggc atg aat ccg aat cag 1248 Tyr Val Lys Leu Asp Arg Asn Phe Arg His Gly Met Asn Pro Asn Gln 405 410 415 att ccg acc cag atc att atg gaa aaa gcc ctg gaa aaa ggt gtt ctg 1296 Ile Pro Thr Gln Ile Ile Met Glu Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 att ggt ggt gca atg ccg aat acc atg cgt att ggt gca agc ctg aat 1344 Ile Gly Gly Ala Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 gtt agc cgt ggc gat att gat aaa gca atg gat gca ctg gat tat gcc 1392 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 ctg gat tat ctg gaa agc ggt gaa tgg cag cag agc taa 1431 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser 465 470 475 <210> 12 <211> 476 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Thr Pro Gly 35 40 45 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Cys Cys Val Asn Leu 50 55 60 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 Leu Arg Ser Phe Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 Ser Ala Gln Ile Pro Gly Ser Ser Cys Ser Ser Ala Val Leu Met Ala 180 185 190 Pro Ser Ser Asn Thr Phe Gln Asp Ser Asn Gly Asn Tyr Leu Lys Asp 195 200 205 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 Gly Val Gly Ser Thr Met Pro Pro Tyr Glu Tyr Val Pro Gln Ile Arg 245 250 255 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Ser Asp Glu Val Leu 260 265 270 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 Tyr Val Lys Leu Asp Arg Asn Phe Arg His Gly Met Asn Pro Asn Gln 405 410 415 Ile Pro Thr Gln Ile Ile Met Glu Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 Ile Gly Gly Ala Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser 465 470 475 <210> 13 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence due to degeneracy of genetic code. <220> <221> misc_feature <222> (1)..(1428) <223> Nucleotide abbreviations are used according to IUPAC code. Back translation from protein sequence shown under SEQ ID NO 15. <400> 13 atgggnytna cngtncaraa rathaaytgg garcargtna argartggga ymgnaartay 60 ytnatgmgna cnttywsnac ncaraaygar taycarccng tnccnathga rwsnacngar 120 ggngaytayy tnathatgcc ngayggnacn mgnytnytng ayttyttyaa ycarytntay 180 tgygtnaayy tnggncaraa raaycaraar gtnaaygcng cnathaarga rgcnytngay 240 mgntayggnt tygtntggga yacntaygcn acngaytaya argcnaargc ngcnaarath 300 athathgarg ayathytngg ngaygargay tggccnggna argtnmgntt ygtnwsnacn 360 ggnwsngarg cngtngarac ngcnytnaay athgcnmgny tntayacnaa ymgnccnytn 420 gtngtnacnm gngarcayga ytaycayggn tggacnggng gngcngcnac ngtnacnmgn 480 ytnmgnwsnt aymgnwsngg nytngtnggn garaaywsng arwsnttyws ngcncarath 540 ccnggnwsnw sntayaayws ngcngtnytn atggcnccnw snccnaayat gttycargay 600 wsnaayggna aytgyytnaa rgaygaraay ggngarytny tnwsngtnaa rtayacnmgn 660 mgnatgathg araaytaygg nccngarcar gtngcngcng tnathacnga rgtnwsncar 720 ggngcnggnw sngcnatgcc nccntaygar tayathccnc arttymgnaa ratgacnaar 780 garytnggng tnytntggat haaygaygar gtnytnacng gnttyggnmg nacnggnaar 840 tggttyggnt aycarcayta yggngtncar ccngayatha thacnatggg naarggnytn 900 wsnwsnwsnw snytnccngc nggngcngtn gtngtnwsna argarathgc ngcnttyatg 960 gayaarcaym gntgggarws ngtnwsnacn taygcnggnc ayccngtngc natggcngcn 1020 gtntgygcna ayytngargt natgatggar garaayytng tngarcargc naaraaywsn 1080 ggngartaya thmgnwsnaa rytngarytn ytncargara arcayaarws nathggnaay 1140 ttygayggnt ayggnytnyt ntggathgtn gayathgtna aygcnaarac naaracnccn 1200 taygtnaary tngaymgnaa yttyacncay ggnatgaayc cnaaycarat hccnacncar 1260 athathatga araargcnyt ngaraarggn gtnytnathg gnggngtnat gccnaayacn 1320 atgmgnathg gngcnwsnyt naaygtnwsn mgnggngaya thgayaargc natggaygcn 1380 ytngaytayg cnytngayta yytngarwsn ggngartggc arcarwsn 1428 <210> 14 <211> 1431 <212> DNA <213> Arthrobacter spec. <220> <221> CDS <222> (1)..(1431) <300> <302> Thermostable omega-transaminase <308> NRN_EA065097 <309> 2006-10-12 <310> WO 2006/063336 A2 <311> 2005-12-12 <312> 2006-06-12 <313> (1)..(1431) <400> 14 atg ggt tta aca gtg caa aaa ata aac tgg gag caa gtt aaa gaa tgg 48 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 gat cgt aaa tac ctg atg agg acg ttt agt acc caa aat gag tat caa 96 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 cct gta ccg att gaa tca aca gaa ggt gac tat ttg att atg cct gat 144 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Asp 35 40 45 ggc aca aga tta tta gat ttc ttc aat caa ctt tat tgt gtc aat tta 192 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Leu 50 55 60 ggc cag aaa aat caa aaa gtt aat gct gca atc aag gag gct tta gac 240 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 cga tat ggt ttt gta tgg gat act tat gca act gat tat aaa gcc aaa 288 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 gca gcc aag ata att att gag gat att tta ggt gat gaa gac tgg cca 336 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 gga aaa gtt agg ttc gta tca aca gga agt gaa gca gtg gaa acg gca 384 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 ctg aat atc gcg agg tta tat aca aat cgc cca cta gtg gtt aca cga 432 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 gaa cac gat tat cat ggt tgg act ggt gga gct gct act gtt act cga 480 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 tta agg tca tat cga agt ggt tta gtt ggg gaa aat tca gaa tct ttt 528 Leu Arg Ser Tyr Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 tca gca caa ata ccc ggt tca tca tat aat agt gct gtt ttg atg gcg 576 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Ser Ala Val Leu Met Ala 180 185 190 cca tcc cct aac atg ttt cag gat tcg aac ggc aac tgc cta aaa gat 624 Pro Ser Pro Asn Met Phe Gln Asp Ser Asn Gly Asn Cys Leu Lys Asp 195 200 205 gaa aac ggg gaa ttg ttg agt gta aag tat aca cgt cgt atg atc gaa 672 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 aac tat ggt ccg gaa caa gtg gca gca gtg ata act gaa gta tcg caa 720 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 ggt gca ggc tct gct atg ccc cca tat gaa tac att cca caa ttc cga 768 Gly Ala Gly Ser Ala Met Pro Pro Tyr Glu Tyr Ile Pro Gln Phe Arg 245 250 255 aaa atg aca aaa gaa cta ggt gtc ctt tgg att aat gat gaa gtt ctt 816 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Asn Asp Glu Val Leu 260 265 270 act ggc ttt ggg cgt aca ggg aag tgg ttt gga tat cag cat tat ggg 864 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 gta cag cca gat ata atc act atg ggt aaa gga ctc tcc agt tcc tca 912 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 ctc cct gct ggc gct gtc gta gtt agt aag gaa att gca gcg ttt atg 960 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 gat aag cac cga tgg gag tca gta tcc acc tat gct ggt cat cca gtt 1008 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 gcg atg gct gcg gtt tgt gca aat tta gaa gta atg atg gaa gaa aac 1056 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 ctt gtt gag caa gcg aag aac agc ggc gag tat ata agg agt aaa ctt 1104 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 gaa ctt ctg caa gaa aag cat aaa agt ata ggc aat ttc gac gga tat 1152 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 ggc ctt tta tgg ata gta gat att gtg aat gcc aag act aag act cct 1200 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 tac gta aaa ttg gac agg aac ttt acg cac ggg atg aat cca aat caa 1248 Tyr Val Lys Leu Asp Arg Asn Phe Thr His Gly Met Asn Pro Asn Gln 405 410 415 atc cca aca caa atc att atg aaa aaa gcg cta gaa aaa gga gtg ctg 1296 Ile Pro Thr Gln Ile Ile Met Lys Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 att ggt gga gta atg cct aat aca atg aga att ggc gca tct ttg aat 1344 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 gtt agt cgc gga gac atc gat aaa gca atg gat gca ctg gat tat gca 1392 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 ctt gac tat tta gaa agt gga gaa tgg cag caa tcc taa 1431 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser 465 470 475 <210> 15 <211> 476 <212> PRT <213> Arthrobacter spec. <400> 15 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 Asp Arg Lys Tyr Leu Met Arg Thr Phe Ser Thr Gln Asn Glu Tyr Gln 20 25 30 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Asp 35 40 45 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Leu 50 55 60 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 Arg Tyr Gly Phe Val Trp Asp Thr Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Thr Val Thr Arg 145 150 155 160 Leu Arg Ser Tyr Arg Ser Gly Leu Val Gly Glu Asn Ser Glu Ser Phe 165 170 175 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Ser Ala Val Leu Met Ala 180 185 190 Pro Ser Pro Asn Met Phe Gln Asp Ser Asn Gly Asn Cys Leu Lys Asp 195 200 205 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Ser Gln 225 230 235 240 Gly Ala Gly Ser Ala Met Pro Pro Tyr Glu Tyr Ile Pro Gln Phe Arg 245 250 255 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Asn Asp Glu Val Leu 260 265 270 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 Asp Lys His Arg Trp Glu Ser Val Ser Thr Tyr Ala Gly His Pro Val 325 330 335 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Tyr 370 375 380 Gly Leu Leu Trp Ile Val Asp Ile Val Asn Ala Lys Thr Lys Thr Pro 385 390 395 400 Tyr Val Lys Leu Asp Arg Asn Phe Thr His Gly Met Asn Pro Asn Gln 405 410 415 Ile Pro Thr Gln Ile Ile Met Lys Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser 465 470 475 <210> 16 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Cretaed by back-translation of a protein sequence due to degeneracy of genetic code. <220> <221> misc_feature <222> (1)..(1446) <223> Nucleotide abbreviations are used according to IUPAC code. Back translation from protein sequence shown under SEQ ID NO 18. <400> 16 atgggnytna cngtncaraa rathaaytgg garcargtna argartggga ymgnaartay 60 ytnatgmgna cnmgnwsnac ncaraaygar taycarccng tnccnathga rwsnacngar 120 ggngaytayy tnathatgcc nggnggnacn mgnytnytng ayttyttyaa ycarytntay 180 tgygtnaaya thggncaraa raaycaraar gtnaaygcng cnathaarga rgcnytngay 240 mgntayggnt tygtntggga ygcntaygcn acngaytaya argcnaargc ngcnaarath 300 athathgarg ayathytngg ngaygargay tggccnggna argtnmgntt ygtnwsnacn 360 ggnwsngarg cngtngarac ngcnytnaay athgcnmgny tntayacnaa ymgnccnytn 420 gtngtnacnm gngarcayga ytaycayggn tggacnggng gngcngcngc ngtnacnmgn 480 ytnmgnwsnt tycarwsngg nytngcnggn garaaywsng gnwsnttyws ngcncarath 540 ccnggnwsnw sntayaayaa ygcngtnytn atggcnccnw snccnaaygc nttycargay 600 wsnaayggna aytgyytnaa rgaygaraay ggngarytny tnwsngtnaa rtayacnmgn 660 mgnatgathg araaytaygg nccngarcar gtngcngcng tnathacnga rgtnccncar 720 ggngtnggnw snacnatgcc nccntaygar tayathccnc arathmgnaa ratgacnaar 780 garytnggng tnytntggat haaygaygar gtnytnacng gnttyggnmg nacnggnaar 840 tggttyggnt aycarcayta yggngtncar ccngayatha thacnatggg naarggnytn 900 wsnwsnwsnw snytnccngc nggngcngtn gtngtnwsna argarathgc ngcnttyatg 960 gayaarcaym gntgggarac nggnwsnacn taygcnggnc ayccngtngc natggcngcn 1020 gtntgygcna ayytngargt natgatggar garaayytng tngarcargc naaraaywsn 1080 ggngartaya thmgnwsnaa rytngarytn ytncargara arcayaarws nathggnaay 1140 ttygayggnt gyggnytnyt ntggytngtn garathgtna aygcngarac naaracnccn 1200 taygtnaary tngaymgnaa yttyacnmgn ggnatgaayy tnaaycarat hccnacncar 1260 athathatgg araargcnyt ngaraarggn gtnytnathg gnggngtnat gccnaayacn 1320 atgmgnathg gngcnwsnyt naaygtnwsn mgnggngaya thgayaargc natggaygcn 1380 ytngaytayg cnytngayta yytngarwsn ggngartggc arcarwsnca ycaycaycay 1440 caycay 1446 <210> 17 <211> 1449 <212> DNA <213> Artificial Sequence <220> <223> Mutation of wild-type sequence. <220> <221> CDS <222> (1)..(1449) <400> 17 atg ggc ctg acc gtg cag aaa att aat tgg gaa cag gta aaa gaa tgg 48 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 gat cgg aaa tac ctg atg cgc aca cgg tca acc cag aac gaa tat caa 96 Asp Arg Lys Tyr Leu Met Arg Thr Arg Ser Thr Gln Asn Glu Tyr Gln 20 25 30 ccg gtc ccg atc gaa tcg acc gag ggc gat tac ctg att atg cca gga 144 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Gly 35 40 45 ggg act cgc ctc ctg gat ttc ttt aac cag ctg tat tgc gtc aac atc 192 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Ile 50 55 60 ggt cag aag aat cag aag gtg aat gca gca att aag gag gcg ttg gac 240 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 cgc tat ggc ttt gtg tgg gat gct tat gcg acg gac tat aaa gcc aaa 288 Arg Tyr Gly Phe Val Trp Asp Ala Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 gca gcg aaa atc atc atc gaa gat att ctg ggt gat gaa gat tgg ccc 336 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 ggt aaa gtg cgt ttc gtt tcg act ggt tct gaa gcc gta gaa acc gcg 384 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 ctg aat atc gcc cgt ctt tac acg aat cgc ccc tta gtg gtt aca cgc 432 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 gaa cat gac tat cac ggc tgg acg gga ggt gct gct gcc gtg acg cgc 480 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Ala Val Thr Arg 145 150 155 160 tta cgc agc ttt cag agc ggc ctt gcc ggc gaa aac tca ggt tcc ttt 528 Leu Arg Ser Phe Gln Ser Gly Leu Ala Gly Glu Asn Ser Gly Ser Phe 165 170 175 agt gcg cag att cca ggg tct agc tac aat aat gcg gtt ctg atg gcg 576 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Asn Ala Val Leu Met Ala 180 185 190 cca agc cct aat gcc ttt caa gat agc aac ggc aac tgc ctg aaa gac 624 Pro Ser Pro Asn Ala Phe Gln Asp Ser Asn Gly Asn Cys Leu Lys Asp 195 200 205 gag aac ggt gaa ctg tta agc gtg aaa tat acg cgt cgt atg atc gaa 672 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 aac tat ggg cct gag caa gta gcg gca gtc atc act gaa gta ccg caa 720 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Pro Gln 225 230 235 240 ggt gtc ggc tca aca atg ccg ccg tac gaa tat atc ccg caa att cgc 768 Gly Val Gly Ser Thr Met Pro Pro Tyr Glu Tyr Ile Pro Gln Ile Arg 245 250 255 aaa atg acc aaa gaa tta ggc gtg ttg tgg atc aac gac gaa gtc ctg 816 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Asn Asp Glu Val Leu 260 265 270 acc gga ttt ggc cgc acc ggt aaa tgg ttc ggc tat cag cac tat ggg 864 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 gtt cag cca gat atc att acc atg ggt aaa ggt ctg tct agt tcg tca 912 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 ctg cct gct ggt gca gtt gtg gtg tcc aaa gag att gcg gca ttc atg 960 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 gac aaa cat cgt tgg gag aca ggc tct acg tat gcc ggc cat ccg gtt 1008 Asp Lys His Arg Trp Glu Thr Gly Ser Thr Tyr Ala Gly His Pro Val 325 330 335 gcg atg gct gcc gtt tgt gcg aat ctc gaa gta atg atg gaa gaa aat 1056 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 ctg gtg gaa caa gcg aag aac agt ggg gaa tac att cgc tcc aaa ctg 1104 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 gaa ttg ctg caa gag aaa cac aag tcg att ggc aat ttc gat ggc tgt 1152 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Cys 370 375 380 ggc ttg ctc tgg ttg gtt gag att gtg aat gcc gaa acc aaa act ccg 1200 Gly Leu Leu Trp Leu Val Glu Ile Val Asn Ala Glu Thr Lys Thr Pro 385 390 395 400 tac gtg aaa ctg gac cgt aac ttt acc cgt ggt atg aac tta aac cag 1248 Tyr Val Lys Leu Asp Arg Asn Phe Thr Arg Gly Met Asn Leu Asn Gln 405 410 415 att ccg acc cag att atc atg gag aaa gcc ctt gag aaa ggg gtt ctg 1296 Ile Pro Thr Gln Ile Ile Met Glu Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 att gga ggt gtc atg ccg aac acg atg cgc att gga gca tcc ctg aac 1344 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 gtc agc cgt ggc gat att gac aag gca atg gat gcg ctc gat tac gct 1392 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 ctg gat tac ctt gag agc ggt gaa tgg cag cag agt cat cat cac cat 1440 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser His His His His 465 470 475 480 cat cac taa 1449 His His <210> 18 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 18 Met Gly Leu Thr Val Gln Lys Ile Asn Trp Glu Gln Val Lys Glu Trp 1 5 10 15 Asp Arg Lys Tyr Leu Met Arg Thr Arg Ser Thr Gln Asn Glu Tyr Gln 20 25 30 Pro Val Pro Ile Glu Ser Thr Glu Gly Asp Tyr Leu Ile Met Pro Gly 35 40 45 Gly Thr Arg Leu Leu Asp Phe Phe Asn Gln Leu Tyr Cys Val Asn Ile 50 55 60 Gly Gln Lys Asn Gln Lys Val Asn Ala Ala Ile Lys Glu Ala Leu Asp 65 70 75 80 Arg Tyr Gly Phe Val Trp Asp Ala Tyr Ala Thr Asp Tyr Lys Ala Lys 85 90 95 Ala Ala Lys Ile Ile Ile Glu Asp Ile Leu Gly Asp Glu Asp Trp Pro 100 105 110 Gly Lys Val Arg Phe Val Ser Thr Gly Ser Glu Ala Val Glu Thr Ala 115 120 125 Leu Asn Ile Ala Arg Leu Tyr Thr Asn Arg Pro Leu Val Val Thr Arg 130 135 140 Glu His Asp Tyr His Gly Trp Thr Gly Gly Ala Ala Ala Val Thr Arg 145 150 155 160 Leu Arg Ser Phe Gln Ser Gly Leu Ala Gly Glu Asn Ser Gly Ser Phe 165 170 175 Ser Ala Gln Ile Pro Gly Ser Ser Tyr Asn Asn Ala Val Leu Met Ala 180 185 190 Pro Ser Pro Asn Ala Phe Gln Asp Ser Asn Gly Asn Cys Leu Lys Asp 195 200 205 Glu Asn Gly Glu Leu Leu Ser Val Lys Tyr Thr Arg Arg Met Ile Glu 210 215 220 Asn Tyr Gly Pro Glu Gln Val Ala Ala Val Ile Thr Glu Val Pro Gln 225 230 235 240 Gly Val Gly Ser Thr Met Pro Pro Tyr Glu Tyr Ile Pro Gln Ile Arg 245 250 255 Lys Met Thr Lys Glu Leu Gly Val Leu Trp Ile Asn Asp Glu Val Leu 260 265 270 Thr Gly Phe Gly Arg Thr Gly Lys Trp Phe Gly Tyr Gln His Tyr Gly 275 280 285 Val Gln Pro Asp Ile Ile Thr Met Gly Lys Gly Leu Ser Ser Ser Ser 290 295 300 Leu Pro Ala Gly Ala Val Val Val Ser Lys Glu Ile Ala Ala Phe Met 305 310 315 320 Asp Lys His Arg Trp Glu Thr Gly Ser Thr Tyr Ala Gly His Pro Val 325 330 335 Ala Met Ala Ala Val Cys Ala Asn Leu Glu Val Met Met Glu Glu Asn 340 345 350 Leu Val Glu Gln Ala Lys Asn Ser Gly Glu Tyr Ile Arg Ser Lys Leu 355 360 365 Glu Leu Leu Gln Glu Lys His Lys Ser Ile Gly Asn Phe Asp Gly Cys 370 375 380 Gly Leu Leu Trp Leu Val Glu Ile Val Asn Ala Glu Thr Lys Thr Pro 385 390 395 400 Tyr Val Lys Leu Asp Arg Asn Phe Thr Arg Gly Met Asn Leu Asn Gln 405 410 415 Ile Pro Thr Gln Ile Ile Met Glu Lys Ala Leu Glu Lys Gly Val Leu 420 425 430 Ile Gly Gly Val Met Pro Asn Thr Met Arg Ile Gly Ala Ser Leu Asn 435 440 445 Val Ser Arg Gly Asp Ile Asp Lys Ala Met Asp Ala Leu Asp Tyr Ala 450 455 460 Leu Asp Tyr Leu Glu Ser Gly Glu Trp Gln Gln Ser His His His His 465 470 475 480 His His <210> 19 <211> 1107 <212> DNA <213> Rhodosporidium toruloides <220> <221> CDS <222> (1)..(1107) <300> <308> GenBank / U60066.1 <309> 2001-10-16 <313> (1)..(1107) <400> 19 atg cac tcg cag aag cgc gtc gtt gtc ctc gga tca ggc gtt atc ggt 48 Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly 1 5 10 15 ctg agc agc gcc ctc atc ctc gct cgg aag ggc tac agc gtg cat att 96 Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile 20 25 30 ctc gcg cgc gac ttg ccg gag gac gtc tcg agc cag act ttc gct tca 144 Leu Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser 35 40 45 cca tgg gct ggc gcg aat tgg acg cct ttc atg acg ctt aca gac ggt 192 Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Met Thr Leu Thr Asp Gly 50 55 60 cct cga caa gca aaa tgg gaa gaa tcg act ttc aag aag tgg gtc gag 240 Pro Arg Gln Ala Lys Trp Glu Glu Ser Thr Phe Lys Lys Trp Val Glu 65 70 75 80 ttg gtc ccg acg ggc cat gcc atg tgg ctc aag ggg acg agg cgg ttc 288 Leu Val Pro Thr Gly His Ala Met Trp Leu Lys Gly Thr Arg Arg Phe 85 90 95 gcg cag aac gaa gac ggc ttg ctc ggg cac tgg tac aag gac atc acg 336 Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr 100 105 110 cca aat tac cgc ccc ctc cca tct tcc gaa tgt cca cct ggc gct atc 384 Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Gly Ala Ile 115 120 125 ggc gta acc tac gac acc ctc tcc gtc cac gca cca aag tac tgc cag 432 Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln 130 135 140 tac ctt gca aga gag ctg cag aag ctc ggc gcg acg ttt gag aga cgg 480 Tyr Leu Ala Arg Glu Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg 145 150 155 160 acc gtt acg tcg ctt gag cag gcg ttc gac ggt gcg gat ttg gtg gtc 528 Thr Val Thr Ser Leu Glu Gln Ala Phe Asp Gly Ala Asp Leu Val Val 165 170 175 aac gct acg gga ctt ggc gcc aag tcg att gcg ggc atc gac gac caa 576 Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln 180 185 190 gcc gcc gag cca atc cgc ggg caa acc gtc ctc gtc aag tcc cca tgc 624 Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Pro Cys 195 200 205 aag cga tgc acg atg gac tcg tcc gac ccc gct tct ccc gcc tac atc 672 Lys Arg Cys Thr Met Asp Ser Ser Asp Pro Ala Ser Pro Ala Tyr Ile 210 215 220 att ccc cga cca ggt ggc gaa gtc atc tgc ggc ggg acg tac ggc gtg 720 Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val 225 230 235 240 gga gac tgg gac ttg tct gtc aac cca gag acg gtc cag cgg atc ctc 768 Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu 245 250 255 aag cac tgc ttg cgc ctc gac ccg acc atc tcg agc gac gga acg atc 816 Lys His Cys Leu Arg Leu Asp Pro Thr Ile Ser Ser Asp Gly Thr Ile 260 265 270 gaa ggc atc gag gtc ctc cgc cac aac gtc ggc ttg cga cct gca cga 864 Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg 275 280 285 cga ggc gga ccc cgc gtt gag gca gaa cgg atc gtc ctg cct ctc gac 912 Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Ile Val Leu Pro Leu Asp 290 295 300 cgg aca aag tcg ccc ctc tcg ctc ggc agg ggc agc gca cga gcg gcg 960 Arg Thr Lys Ser Pro Leu Ser Leu Gly Arg Gly Ser Ala Arg Ala Ala 305 310 315 320 aag gag aag gag gtc acg ctt gtg cat gcg tat ggc ttc tcg agt gcg 1008 Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala 325 330 335 gga tac cag cag agt tgg ggc gcg gcg gag gat gtc gcg cag ctc gtc 1056 Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Gln Leu Val 340 345 350 gac gag gcg ttc cag cgg tac cac ggc gcg gcg cgg gag tcg aag ttg 1104 Asp Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu 355 360 365 tag 1107 <210> 20 <211> 368 <212> PRT <213> Rhodosporidium toruloides <400> 20 Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly 1 5 10 15 Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile 20 25 30 Leu Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser 35 40 45 Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Met Thr Leu Thr Asp Gly 50 55 60 Pro Arg Gln Ala Lys Trp Glu Glu Ser Thr Phe Lys Lys Trp Val Glu 65 70 75 80 Leu Val Pro Thr Gly His Ala Met Trp Leu Lys Gly Thr Arg Arg Phe 85 90 95 Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr 100 105 110 Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Gly Ala Ile 115 120 125 Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln 130 135 140 Tyr Leu Ala Arg Glu Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg 145 150 155 160 Thr Val Thr Ser Leu Glu Gln Ala Phe Asp Gly Ala Asp Leu Val Val 165 170 175 Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln 180 185 190 Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Pro Cys 195 200 205 Lys Arg Cys Thr Met Asp Ser Ser Asp Pro Ala Ser Pro Ala Tyr Ile 210 215 220 Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val 225 230 235 240 Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu 245 250 255 Lys His Cys Leu Arg Leu Asp Pro Thr Ile Ser Ser Asp Gly Thr Ile 260 265 270 Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg 275 280 285 Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Ile Val Leu Pro Leu Asp 290 295 300 Arg Thr Lys Ser Pro Leu Ser Leu Gly Arg Gly Ser Ala Arg Ala Ala 305 310 315 320 Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala 325 330 335 Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Gln Leu Val 340 345 350 Asp Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu 355 360 365 <210> 21 <211> 1107 <212> DNA <213> Artificial Sequence <220> <223> DAO1 from Rhodosporidium toruloides comprising mutations in the codons identified by the nucleotides at positions 160 - 162 and the codons identified by the nucleotides at positions 172 - 174 and the codons identified by the nucleotides at positions 637 - <220> <221> CDS <222> (1)..(1107) <220> <221> misc_feature <222> (639)..(639) <223> n is a, c, g, or t <400> 21 atg cac tcg cag aag cgc gtc gtt gtc ctc gga tca ggc gtt atc ggt 48 Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly 1 5 10 15 ctg agc agc gcc ctc atc ctc gct cgg aag ggc tac agc gtg cat att 96 Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile 20 25 30 ctc gcg cgc gac ttg ccg gag gac gtc tcg agc cag act ttc gct tca 144 Leu Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser 35 40 45 cca tgg gct ggc gcg tgy tgg acg cct cay atg acg ctt aca gac ggt 192 Pro Trp Ala Gly Ala Cys Trp Thr Pro His Met Thr Leu Thr Asp Gly 50 55 60 cct cga caa gca aaa tgg gaa gaa tcg act ttc aag aag tgg gtc gag 240 Pro Arg Gln Ala Lys Trp Glu Glu Ser Thr Phe Lys Lys Trp Val Glu 65 70 75 80 ttg gtc ccg acg ggc cat gcc atg tgg ctc aag ggg acg agg cgg ttc 288 Leu Val Pro Thr Gly His Ala Met Trp Leu Lys Gly Thr Arg Arg Phe 85 90 95 gcg cag aac gaa gac ggc ttg ctc ggg cac tgg tac aag gac atc acg 336 Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr 100 105 110 cca aat tac cgc ccc ctc cca tct tcc gaa tgt cca cct ggc gct atc 384 Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Gly Ala Ile 115 120 125 ggc gta acc tac gac acc ctc tcc gtc cac gca cca aag tac tgc cag 432 Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln 130 135 140 tac ctt gca aga gag ctg cag aag ctc ggc gcg acg ttt gag aga cgg 480 Tyr Leu Ala Arg Glu Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg 145 150 155 160 acc gtt acg tcg ctt gag cag gcg ttc gac ggt gcg gat ttg gtg gtc 528 Thr Val Thr Ser Leu Glu Gln Ala Phe Asp Gly Ala Asp Leu Val Val 165 170 175 aac gct acg gga ctt ggc gcc aag tcg att gcg ggc atc gac gac caa 576 Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln 180 185 190 gcc gcc gag cca atc cgc ggg caa acc gtc ctc gtc aag tcc cca tgc 624 Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Pro Cys 195 200 205 aag cga tgc acg wsn gac tcg tcc gac ccc gct tct ccc gcc tac atc 672 Lys Arg Cys Thr Ser Asp Ser Ser Asp Pro Ala Ser Pro Ala Tyr Ile 210 215 220 att ccc cga cca ggt ggc gaa gtc atc tgc ggc ggg acg tac ggc gtg 720 Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val 225 230 235 240 gga gac tgg gac ttg tct gtc aac cca gag acg gtc cag cgg atc ctc 768 Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu 245 250 255 aag cac tgc ttg cgc ctc gac ccg acc atc tcg agc gac gga acg atc 816 Lys His Cys Leu Arg Leu Asp Pro Thr Ile Ser Ser Asp Gly Thr Ile 260 265 270 gaa ggc atc gag gtc ctc cgc cac aac gtc ggc ttg cga cct gca cga 864 Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg 275 280 285 cga ggc gga ccc cgc gtt gag gca gaa cgg atc gtc ctg cct ctc gac 912 Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Ile Val Leu Pro Leu Asp 290 295 300 cgg aca aag tcg ccc ctc tcg ctc ggc agg ggc agc gca cga gcg gcg 960 Arg Thr Lys Ser Pro Leu Ser Leu Gly Arg Gly Ser Ala Arg Ala Ala 305 310 315 320 aag gag aag gag gtc acg ctt gtg cat gcg tat ggc ttc tcg agt gcg 1008 Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala 325 330 335 gga tac cag cag agt tgg ggc gcg gcg gag gat gtc gcg cag ctc gtc 1056 Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Gln Leu Val 340 345 350 gac gag gcg ttc cag cgg tac cac ggc gcg gcg cgg gag tcg aag ttg 1104 Asp Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu 355 360 365 tag 1107 <210> 22 <211> 368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 22 Met His Ser Gln Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly 1 5 10 15 Leu Ser Ser Ala Leu Ile Leu Ala Arg Lys Gly Tyr Ser Val His Ile 20 25 30 Leu Ala Arg Asp Leu Pro Glu Asp Val Ser Ser Gln Thr Phe Ala Ser 35 40 45 Pro Trp Ala Gly Ala Cys Trp Thr Pro His Met Thr Leu Thr Asp Gly 50 55 60 Pro Arg Gln Ala Lys Trp Glu Glu Ser Thr Phe Lys Lys Trp Val Glu 65 70 75 80 Leu Val Pro Thr Gly His Ala Met Trp Leu Lys Gly Thr Arg Arg Phe 85 90 95 Ala Gln Asn Glu Asp Gly Leu Leu Gly His Trp Tyr Lys Asp Ile Thr 100 105 110 Pro Asn Tyr Arg Pro Leu Pro Ser Ser Glu Cys Pro Pro Gly Ala Ile 115 120 125 Gly Val Thr Tyr Asp Thr Leu Ser Val His Ala Pro Lys Tyr Cys Gln 130 135 140 Tyr Leu Ala Arg Glu Leu Gln Lys Leu Gly Ala Thr Phe Glu Arg Arg 145 150 155 160 Thr Val Thr Ser Leu Glu Gln Ala Phe Asp Gly Ala Asp Leu Val Val 165 170 175 Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Ile Asp Asp Gln 180 185 190 Ala Ala Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Pro Cys 195 200 205 Lys Arg Cys Thr Ser Asp Ser Ser Asp Pro Ala Ser Pro Ala Tyr Ile 210 215 220 Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Gly Val 225 230 235 240 Gly Asp Trp Asp Leu Ser Val Asn Pro Glu Thr Val Gln Arg Ile Leu 245 250 255 Lys His Cys Leu Arg Leu Asp Pro Thr Ile Ser Ser Asp Gly Thr Ile 260 265 270 Glu Gly Ile Glu Val Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg 275 280 285 Arg Gly Gly Pro Arg Val Glu Ala Glu Arg Ile Val Leu Pro Leu Asp 290 295 300 Arg Thr Lys Ser Pro Leu Ser Leu Gly Arg Gly Ser Ala Arg Ala Ala 305 310 315 320 Lys Glu Lys Glu Val Thr Leu Val His Ala Tyr Gly Phe Ser Ser Ala 325 330 335 Gly Tyr Gln Gln Ser Trp Gly Ala Ala Glu Asp Val Ala Gln Leu Val 340 345 350 Asp Glu Ala Phe Gln Arg Tyr His Gly Ala Ala Arg Glu Ser Lys Leu 355 360 365 <210> 23 <211> 1467 <212> DNA <213> Listeria seeligeri <220> <221> CDS <222> (1)..(1467) <300> <308> GenBank / NC_013891.1 <309> 2017-02-26 <313> (2760202)..(2761668) <400> 23 atg acc gat aga aga aac tta acg acg aat caa gga gtg ccg att ggg 48 Met Thr Asp Arg Arg Asn Leu Thr Thr Asn Gln Gly Val Pro Ile Gly 1 5 10 15 gac aac caa aat tcg atg aca gcg gga tta aaa gga cca act ttg tta 96 Asp Asn Gln Asn Ser Met Thr Ala Gly Leu Lys Gly Pro Thr Leu Leu 20 25 30 gaa gat tat gtg tta att gag aaa ttg gcg cat ttt gat aga gaa cgt 144 Glu Asp Tyr Val Leu Ile Glu Lys Leu Ala His Phe Asp Arg Glu Arg 35 40 45 gtt cca gaa cgt gtg gtg cat gct cgt ggt gct ggt gcg cac ggc aaa 192 Val Pro Glu Arg Val Val His Ala Arg Gly Ala Gly Ala His Gly Lys 50 55 60 ttt gta acg aaa aaa agc atg aaa aaa tat acg aaa gca caa ttt tta 240 Phe Val Thr Lys Lys Ser Met Lys Lys Tyr Thr Lys Ala Gln Phe Leu 65 70 75 80 caa gaa gaa gga aca gag aca gag gtt ttt gcg cgt ttt tct aca gta 288 Gln Glu Glu Gly Thr Glu Thr Glu Val Phe Ala Arg Phe Ser Thr Val 85 90 95 atc cat ggt caa cat tca cca gaa acg ctt cgt gat cca cgt ggt ttt 336 Ile His Gly Gln His Ser Pro Glu Thr Leu Arg Asp Pro Arg Gly Phe 100 105 110 tcg gtt aaa ttt tat acg gaa gaa ggt aac tat gac ttt gtc ggt aac 384 Ser Val Lys Phe Tyr Thr Glu Glu Gly Asn Tyr Asp Phe Val Gly Asn 115 120 125 aac tta cct gta ttc ttt atc cgt gat gct atc aag ttt cct gac gta 432 Asn Leu Pro Val Phe Phe Ile Arg Asp Ala Ile Lys Phe Pro Asp Val 130 135 140 att cac tcc ttg aag cca gat cca cgt act aac att caa gat ggc aat 480 Ile His Ser Leu Lys Pro Asp Pro Arg Thr Asn Ile Gln Asp Gly Asn 145 150 155 160 cgt tac tgg gac ttc ttt agt tta act ccg gaa gcg acg acg atg att 528 Arg Tyr Trp Asp Phe Phe Ser Leu Thr Pro Glu Ala Thr Thr Met Ile 165 170 175 act tat tta ttt agc gat gag ggg act ccg gca tct tac cgc gaa att 576 Thr Tyr Leu Phe Ser Asp Glu Gly Thr Pro Ala Ser Tyr Arg Glu Ile 180 185 190 cgt ggt tca agc gta cat gcc ttt aaa tgg ata aac gaa gaa ggt aag 624 Arg Gly Ser Ser Val His Ala Phe Lys Trp Ile Asn Glu Glu Gly Lys 195 200 205 act gtt tat gta aaa cta cgc tgg gtt cca aaa gca gga atc gtc aat 672 Thr Val Tyr Val Lys Leu Arg Trp Val Pro Lys Ala Gly Ile Val Asn 210 215 220 ctt tca act gat caa gca gca caa att caa gca aaa gaa ttt aac cat 720 Leu Ser Thr Asp Gln Ala Ala Gln Ile Gln Ala Lys Glu Phe Asn His 225 230 235 240 gct agt cgc gat ttg tat gaa gca att gag aat ggt gat tat cca gag 768 Ala Ser Arg Asp Leu Tyr Glu Ala Ile Glu Asn Gly Asp Tyr Pro Glu 245 250 255 tgg gat tta tat gtg caa gtg cta gat cca aaa gac ttg gat aat tac 816 Trp Asp Leu Tyr Val Gln Val Leu Asp Pro Lys Asp Leu Asp Asn Tyr 260 265 270 gac ttc aat ccg ctt gat gca acc aaa gac tgg ttt gaa gat gta ttt 864 Asp Phe Asn Pro Leu Asp Ala Thr Lys Asp Trp Phe Glu Asp Val Phe 275 280 285 cca tac gag cat gtt gga aca atg aca tta aat cgt aat ccg gat aat 912 Pro Tyr Glu His Val Gly Thr Met Thr Leu Asn Arg Asn Pro Asp Asn 290 295 300 att ttt gct gaa aca gaa tca gtt ggc ttt aat cca ggt gtg ctt gtg 960 Ile Phe Ala Glu Thr Glu Ser Val Gly Phe Asn Pro Gly Val Leu Val 305 310 315 320 ccg ggg atg tta cct tct gag gac cgt tta cta cag ggg cga ttg ttc 1008 Pro Gly Met Leu Pro Ser Glu Asp Arg Leu Leu Gln Gly Arg Leu Phe 325 330 335 tct tac tct gat acg caa aga cac cgc gtt gga cct aac tac tta caa 1056 Ser Tyr Ser Asp Thr Gln Arg His Arg Val Gly Pro Asn Tyr Leu Gln 340 345 350 tta cca atc aac agc cca aaa act cct gtt gat aac aac caa cgt gat 1104 Leu Pro Ile Asn Ser Pro Lys Thr Pro Val Asp Asn Asn Gln Arg Asp 355 360 365 gga cag atg ccg ttt aaa cag caa aca agt tcg att aat tat gaa cca 1152 Gly Gln Met Pro Phe Lys Gln Gln Thr Ser Ser Ile Asn Tyr Glu Pro 370 375 380 aat agt tat gat aca gaa cca aaa gaa aac cct gca tat atc gag cct 1200 Asn Ser Tyr Asp Thr Glu Pro Lys Glu Asn Pro Ala Tyr Ile Glu Pro 385 390 395 400 gag caa gaa att cgt ggg gat atc tct ggc cga cta gtg gca gaa aag 1248 Glu Gln Glu Ile Arg Gly Asp Ile Ser Gly Arg Leu Val Ala Glu Lys 405 410 415 cca aat aac ttt ggt cat gct aaa gaa gtt tgg aag cgt tac tca gat 1296 Pro Asn Asn Phe Gly His Ala Lys Glu Val Trp Lys Arg Tyr Ser Asp 420 425 430 gca gaa cgt gcg gct ctt gtg aaa aat att gta gac gat tgg gaa ggt 1344 Ala Glu Arg Ala Ala Leu Val Lys Asn Ile Val Asp Asp Trp Glu Gly 435 440 445 gtg cgc gaa gat att aag att cgc aac ttg cgc aat ttc tat caa gta 1392 Val Arg Glu Asp Ile Lys Ile Arg Asn Leu Arg Asn Phe Tyr Gln Val 450 455 460 gag ccg gaa ttt gca gaa cgt gtg gct gct gga act gga att aac ctt 1440 Glu Pro Glu Phe Ala Glu Arg Val Ala Ala Gly Thr Gly Ile Asn Leu 465 470 475 480 gct gaa cat gtg ata gat tta aaa taa 1467 Ala Glu His Val Ile Asp Leu Lys 485 <210> 24 <211> 488 <212> PRT <213> Listeria seeligeri <400> 24 Met Thr Asp Arg Arg Asn Leu Thr Thr Asn Gln Gly Val Pro Ile Gly 1 5 10 15 Asp Asn Gln Asn Ser Met Thr Ala Gly Leu Lys Gly Pro Thr Leu Leu 20 25 30 Glu Asp Tyr Val Leu Ile Glu Lys Leu Ala His Phe Asp Arg Glu Arg 35 40 45 Val Pro Glu Arg Val Val His Ala Arg Gly Ala Gly Ala His Gly Lys 50 55 60 Phe Val Thr Lys Lys Ser Met Lys Lys Tyr Thr Lys Ala Gln Phe Leu 65 70 75 80 Gln Glu Glu Gly Thr Glu Thr Glu Val Phe Ala Arg Phe Ser Thr Val 85 90 95 Ile His Gly Gln His Ser Pro Glu Thr Leu Arg Asp Pro Arg Gly Phe 100 105 110 Ser Val Lys Phe Tyr Thr Glu Glu Gly Asn Tyr Asp Phe Val Gly Asn 115 120 125 Asn Leu Pro Val Phe Phe Ile Arg Asp Ala Ile Lys Phe Pro Asp Val 130 135 140 Ile His Ser Leu Lys Pro Asp Pro Arg Thr Asn Ile Gln Asp Gly Asn 145 150 155 160 Arg Tyr Trp Asp Phe Phe Ser Leu Thr Pro Glu Ala Thr Thr Met Ile 165 170 175 Thr Tyr Leu Phe Ser Asp Glu Gly Thr Pro Ala Ser Tyr Arg Glu Ile 180 185 190 Arg Gly Ser Ser Val His Ala Phe Lys Trp Ile Asn Glu Glu Gly Lys 195 200 205 Thr Val Tyr Val Lys Leu Arg Trp Val Pro Lys Ala Gly Ile Val Asn 210 215 220 Leu Ser Thr Asp Gln Ala Ala Gln Ile Gln Ala Lys Glu Phe Asn His 225 230 235 240 Ala Ser Arg Asp Leu Tyr Glu Ala Ile Glu Asn Gly Asp Tyr Pro Glu 245 250 255 Trp Asp Leu Tyr Val Gln Val Leu Asp Pro Lys Asp Leu Asp Asn Tyr 260 265 270 Asp Phe Asn Pro Leu Asp Ala Thr Lys Asp Trp Phe Glu Asp Val Phe 275 280 285 Pro Tyr Glu His Val Gly Thr Met Thr Leu Asn Arg Asn Pro Asp Asn 290 295 300 Ile Phe Ala Glu Thr Glu Ser Val Gly Phe Asn Pro Gly Val Leu Val 305 310 315 320 Pro Gly Met Leu Pro Ser Glu Asp Arg Leu Leu Gln Gly Arg Leu Phe 325 330 335 Ser Tyr Ser Asp Thr Gln Arg His Arg Val Gly Pro Asn Tyr Leu Gln 340 345 350 Leu Pro Ile Asn Ser Pro Lys Thr Pro Val Asp Asn Asn Gln Arg Asp 355 360 365 Gly Gln Met Pro Phe Lys Gln Gln Thr Ser Ser Ile Asn Tyr Glu Pro 370 375 380 Asn Ser Tyr Asp Thr Glu Pro Lys Glu Asn Pro Ala Tyr Ile Glu Pro 385 390 395 400 Glu Gln Glu Ile Arg Gly Asp Ile Ser Gly Arg Leu Val Ala Glu Lys 405 410 415 Pro Asn Asn Phe Gly His Ala Lys Glu Val Trp Lys Arg Tyr Ser Asp 420 425 430 Ala Glu Arg Ala Ala Leu Val Lys Asn Ile Val Asp Asp Trp Glu Gly 435 440 445 Val Arg Glu Asp Ile Lys Ile Arg Asn Leu Arg Asn Phe Tyr Gln Val 450 455 460 Glu Pro Glu Phe Ala Glu Arg Val Ala Ala Gly Thr Gly Ile Asn Leu 465 470 475 480 Ala Glu His Val Ile Asp Leu Lys 485 <210> 25 <211> 1464 <212> DNA <213> Artificial Sequence <220> <223> codon adapted sequence encoding protein having catalase activity <400> 25 atgaccgatc gccgcaacct gaccaccaac cagggcgtgc cgattggcga taaccagaac 60 agcatgaccg cgggcctgaa aggcccgacc ctgctggaag attatgtgct gattgaaaaa 120 ctggcgcatt ttgatcgcga acgcgtgccg gaacgcgtgg tgcatgcgcg cggcgcgggc 180 gcgcatggca aatttgtgac caaaaaaagc atgaaaaaat ataccaaagc gcagtttctg 240 caggaagaag gcaccgaaac cgaagtgttt gcgcgcttta gcaccgtgat tcatggccag 300 catagcccgg aaaccctgcg cgatccgcgc ggctttagcg tgaaatttta taccgaagaa 360 ggcaactatg attttgtggg caacaacctg ccggtgtttt ttattcgcga tgcgattaaa 420 tttccggatg tgattcatag cctgaaaccg gatccgcgca ccaacattca ggatggcaac 480 cgctattggg atttttttag cctgaccccg gaagcgacca ccatgattac ctatctgttt 540 agcgatgaag gcaccccggc gagctatcgc gaaattcgcg gcagcagcgt gcatgcgttt 600 aaatggatta acgaagaagg caaaaccgtg tatgtgaaac tgcgctgggt gccgaaagcg 660 ggcattgtga acctgagcac cgatcaggcg gcgcagattc aggcgaaaga atttaaccat 720 gcgagccgcg atctgtatga agcgattgaa aacggcgatt atccggaatg ggatctgtat 780 gtgcaggtgc tggatccgaa agatctggat aactatgatt ttaacccgct ggatgcgacc 840 aaagattggt ttgaagatgt gtttccgtat gaacatgtgg gcaccatgac cctgaaccgc 900 aacccggata acatttttgc ggaaaccgaa agcgtgggct ttaacccggg cgtgctggtg 960 ccgggcatgc tgccgagcga agatcgcctg ctgcagggcc gcctgtttag ctatagcgat 1020 acccagcgcc atcgcgtggg cccgaactat ctgcagctgc cgattaacag cccgaaaacc 1080 ccggtggata acaaccagcg cgatggccag atgccgttta aacagcagac cagcagcatt 1140 aactatgaac cgaacagcta tgataccgaa ccgaaagaaa acccggcgta tattgaaccg 1200 gaacaggaaa ttcgcggcga tattagcggc cgcctggtgg cggaaaaacc gaacaacttt 1260 ggccatgcga aagaagtgtg gaaacgctat agcgatgcgg aacgcgcggc gctggtgaaa 1320 aacattgtgg atgattggga aggcgtgcgc gaagatatta aaattcgcaa cctgcgcaac 1380 ttttatcagg tggaaccgga atttgcggaa cgcgtggcgg cgggcaccgg cattaacctg 1440 gcggaacatg tgattgatct gaaa 1464 <210> 26 <211> 21 <212> DNA <213> Escherichia coli <400> 26 aattgtgagc ggataacaat t 21 <210> 27 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic promoter comprising sequnces from E. coli trp-promoter and E. coli lacUV5 promoter <400> 27 tgttgacaat taatcatccg gctcgtataa t 31 <210> 28 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Rho-independent terminator <400> 28 cgccgctgag aaaaagcgaa gcggcactgc tctttaacaa tttatcagac aatctgtgtg 60 ggcactcgac 70 <210> 29 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Mini-cistron <400> 29 atgtatcgat taaataagga ggaataa 27 <210> 30 <211> 158 <212> DNA <213> Artificial Sequence <220> <223> Transcription termination signal <400> 30 tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 60 gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 120 caaataaaac gaaaggctca gtcgaaagac tgggcctt 158

Claims (13)

  1. ω-트랜스아미나제 (ω-TA)의 활성을 갖는 단백질로서, 하기로 이루어진 군으로부터 선택된 단백질:
    a) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 3에 제시된 위치 1 내지 477의 아미노산 서열을 포함하는 단백질;
    b) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 6에 제시된 위치 1 내지 479의 아미노산 서열을 포함하는 단백질;
    c) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산이 E와 상이하고, 위치 187의 아미노산이 S와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 9에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
    d) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산 및 위치 187의 아미노산이 S와 상이하고 E와 상이하고, 위치 197의 아미노산이 T와 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 12에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
    e) 위치 25의 아미노산이 F와 상이하고, 위치 64의 아미노산이 L과 상이하고, 위치 88의 아미노산이 T와 상이하고, 위치 157의 아미노산이 T와 상이하고, 위치 165의 아미노산이 R과 상이하고, 위치 169의 아미노산이 V와 상이하고, 위치 174의 아미노산 및 위치 187의 아미노산이 S와 상이하고 E와 상이하고, 위치 197의 아미노산이 M과 상이하고, 위치 239의 아미노산이 S와 상이하고, 위치 327의 아미노산이 S와 상이하고, 위치 328의 아미노산이 V와 상이하고, 위치 384의 아미노산이 Y와 상이하고, 위치 389의 아미노산이 I와 상이하고, 위치 391의 아미노산이 D와 상이하고, 위치 396의 아미노산이 K와 상이하고, 위치 410의 아미노산이 H와 상이하고, 위치 414의 아미노산이 P와 상이한 것을 제외하고는, 서열식별번호: 15에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
    f) 각각의 경우에 위치 25에 상응하는 아미노산이 F와 상이하고, 위치 64에 상응하는 아미노산이 L과 상이하고, 88에 상응하는 아미노산이 T와 상이하고, 위치 157에 상응하는 아미노산이 T와 상이하고, 위치 165에 상응하는 아미노산이 R과 상이하고, 위치 169에 상응하는 아미노산이 V와 상이하고, 위치 174에 상응하는 아미노산이 E와 상이하고, 위치 187에 상응하는 아미노산이 S와 상이하고, 위치 197에 상응하는 아미노산이 T 또는 M과 상이하고, 위치 239에 상응하는 아미노산이 S와 상이하고, 위치 327에 상응하는 아미노산이 S와 상이하고, 위치 328에 상응하는 아미노산이 V와 상이하고, 위치 384에 상응하는 아미노산이 Y와 상이하고, 위치 389에 상응하는 아미노산이 I와 상이하고, 위치 391에 상응하는 아미노산이 D와 상이하고, 위치 396에 상응하는 아미노산이 K와 상이하고, 위치 410에 상응하는 아미노산이 H와 상이하고, 위치 414에 상응하는 아미노산이 P와 상이한 것인, a), b), c), d), e) 또는 f)에 제시된 임의의 아미노산 서열과 적어도 60%, 바람직하게는 70%, 더욱 바람직하게는 80%, 추가로 더 바람직하게는 90%, 훨씬 더 바람직하게는 95%, 추가로 훨씬 더 바람직하게는 96%, 특히 바람직하게는 97%, 가장 바람직하게는 98% 또는 특히 바람직하게는 99% 동일성을 갖는 아미노산 서열을 갖는 단백질.
  2. 제1항에 있어서, 하기로 이루어진 군으로부터 선택된 단백질:
    a) 추가로 위치 2의 아미노산이 S와 상이하고, 위치 48의 아미노산이 D와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 202의 아미노산이 D와 상이하고, 위치 205의 아미노산이 L과 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 311의 아미노산이 L과 상이하고, 위치 353의 아미노산이 F와 상이하고, 위치 359의 아미노산이 D와 상이하고, 위치 424의 아미노산이 K와 상이하고, 위치 475의 아미노산이 A와 상이하고, 위치 476의 아미노산이 L과 상이하고, 위치 477의 아미노산이 결실된 것을 제외하고는, 제1항의 섹션 a)에 정의된 바와 같은 아미노산 서열을 포함하는 단백질;
    b) 추가로 위치 46의 아미노산이 T와 상이하고, 위치 60의 아미노산이 C와 상이하고, 위치 185의 아미노산이 C와 상이하고, 위치 186의 아미노산이 S와 상이하고, 위치 195의 아미노산이 S와 상이하고, 위치 205의 아미노산이 Y와 상이하고, 위치 252의 아미노산이 V와 상이하고, 위치 268의 아미노산이 S와 상이하고, 위치 409의 아미노산이 R과 상이하고, 위치 436의 아미노산이 A와 상이하고, 위치 477 및 478 및 479의 아미노산이 결실된 것을 제외하고는, 제1항의 섹션 b)에 정의된 바와 같은 아미노산 서열을 포함하는 단백질;
    c) 추가로 위치 2의 아미노산이 S와 상이하고, 위치 48의 아미노산이 D와 상이하고, 위치 69의 아미노산이 P와 상이하고, 위치 90의 아미노산이 S와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 268의 아미노산이 T와 상이하고, 위치 311의 아미노산이 L과 상이하고, 위치 318의 아미노산이 E와 상이하고, 위치 322의 아미노산이 R과 상이하고, 위치 353의 아미노산이 S와 상이하고, 위치 424의 아미노산이 K와 상이하고, 위치 452의 아미노산이 E와 상이한 것을 제외하고는, 제1항의 섹션 c)에 정의된 바와 같은 아미노산 서열을 포함하는 단백질;
    d) 추가로 위치 46의 아미노산이 T와 상이하고, 위치 60의 아미노산이 C와 상이하고, 위치 185의 아미노산이 C와 상이하고, 위치 186의 아미노산이 C와 상이하고, 위치 195의 아미노산이 S와 상이하고, 위치 205의 아미노산이 Y와 상이하고, 위치 252의 아미노산이 V와 상이하고, 위치 268의 아미노산이 S와 상이하고, 위치 409의 아미노산이 R과 상이하고, 위치 436의 아미노산이 A와 상이한 것을 제외하고는, 제1항의 섹션 d)에 정의된 바와 같은 아미노산 서열을 포함하는 단백질;
    e) 추가로 위치 48의 아미노산이 D와 상이하고, 위치 164의 아미노산이 Y와 상이하고, 위치 242의 아미노산이 A와 상이하고, 위치 245의 아미노산이 A와 상이하고, 위치 255의 아미노산이 F와 상이하고, 위치 424의 아미노산이 K와 상이한 것을 제외하고는, 제1항의 섹션 d)에 정의된 바와 같은 아미노산 서열을 포함하는 단백질;
    f) a), b), c), d) 또는 e) 각각에 정의된 바와 같은 각각의 아미노산 위치가 a), b), c), d) 또는 e) 각각에 정의된 바와 같은 아미노산 서열과 적어도 60% 동일한 단백질 서열의 아미노산 서열에서 상응하는 아미노산 위치에 또한 존재하는 것인, a), b), c), d) 또는 e)에 정의된 바와 같은 임의의 아미노산 서열과 적어도 60% 동일성을 갖는 아미노산 서열을 갖는 단백질.
  3. 제1항 또는 제2항에 있어서, 하기로 이루어진 군으로부터 선택된 단백질:
    a) 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열을 포함하는 단백질;
    b) 서열식별번호: 18에서 위치 25, 64, 88, 157, 165, 169, 174, 187, 197, 239, 327, 328, 384, 389, 391, 396, 410 및 414에 상응하는 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60% 동일성을 갖는 아미노산 서열을 갖는 단백질;
    c) 서열식별번호: 18에서 위치 2, 25, 46, 48, 60, 64, 69, 88, 90, 157, 164, 165, 169, 174, 187, 195, 197, 202, 205, 239, 242, 245, 252, 255, 268, 311, 318, 322, 327, 328, 353, 359, 384, 389, 391, 396, 409, 410, 414, 424, 436, 452, 475, 476 및 477에 상응하는 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60% 동일성을 갖는 아미노산 서열을 갖는 단백질.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 하기로 이루어진 군으로부터 선택된 단백질:
    a) 위치 166의 아미노산이 G이고, 위치 327의 아미노산이 Q인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    b) 위치 327의 아미노산이 Q이고, 위치 384의 아미노산이 S인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    c) 위치 326의 아미노산이 Q이고, 위치 327의 아미노산이 Q인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    d) 위치 327의 아미노산이 Q인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    e) 위치 326의 아미노산이 F이고, 위치 327의 아미노산이 Q인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    f) 위치 327의 아미노산이 C인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    g) 위치 327의 아미노산이 I인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    h) 위치 327의 아미노산이 M인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    i) 위치 164의 아미노산이 Y인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    j) 위치 164의 아미노산이 S인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    k) 위치 327의 아미노산이 V인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    l) 위치 409의 아미노산이 R인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    m) 위치 327의 아미노산이 S인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    n) 위치 271의 아미노산이 I인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    o) 329의 아미노산이 G인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    p) 위치 409의 아미노산이 P인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    q) 위치 414의 아미노산이 M인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    r) 위치 165의 아미노산이 K인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    s) 위치 414의 아미노산이 R인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    t) 위치 414의 아미노산이 H인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    u) 위치 165의 아미노산이 C인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    v) 위치 327의 아미노산이 V인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    w) 위치 164의 아미노산이 C인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질;
    x) 위치 409의 아미노산이 K인, 제1항 내지 제3항 중 어느 한 항에 따른 단백질.
  5. 제4항에 있어서, 하기로 이루어진 군으로부터 선택된 단백질:
    a) 서열식별번호: 18에서 위치 166의 아미노산 S가 G로 치환되고, 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    b) 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환되고, 서열식별번호: 18에서 위치 384의 아미노산 C가 S로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    c) 서열식별번호: 18에서 위치 326의 아미노산 E가 Q로 치환되고, 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    d) 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    e) 서열식별번호: 18에서 위치 326의 아미노산 E가 F로 치환되고, 서열식별번호: 18에서 위치 327의 아미노산 T가 Q로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    f) 서열식별번호: 18에서 위치 327의 아미노산 T가 C로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    g) 서열식별번호: 18에서 위치 327의 아미노산 T가 I로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    h) 서열식별번호: 18에서 위치 327의 아미노산 T가 M으로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    i) 서열식별번호: 18에서 위치 164의 아미노산 F가 Y로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    j) 서열식별번호: 18에서 위치 164의 아미노산 F가 S로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    k) 서열식별번호: 18에서 위치 327의 아미노산 T가 V로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    l) 서열식별번호: 18에서 위치 409의 아미노산 T가 R로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    m) 서열식별번호: 18에서 위치 327의 아미노산 T가 S로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    n) 서열식별번호: 18에서 위치 271의 아미노산 V가 I로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    o) 서열식별번호: 18에서 위치 329의 아미노산 S가 G로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    p) 서열식별번호: 18에서 위치 409의 아미노산 T가 P로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    q) 서열식별번호: 18에서 위치 414의 아미노산 L이 M으로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    r) 서열식별번호: 18에서 위치 165의 아미노산 Q가 K로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    s) 서열식별번호: 18에서 위치 414의 아미노산 L이 R로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    t) 서열식별번호: 18에서 위치 414의 아미노산 L이 H로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    u) 서열식별번호: 18에서 위치 165의 아미노산 Q가 C로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    v) 서열식별번호: 18에서 위치 327의 아미노산 T가 V로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    w) 서열식별번호: 18에서 위치 164의 아미노산 F가 C로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질;
    x) 서열식별번호: 18에서 위치 409의 아미노산 T가 K로 치환된 것을 제외하고는, 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 갖는 단백질
    y) a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 각각의 아미노산 위치가 a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 임의의 아미노산 서열과 적어도 60% 동일성을 갖는 단백질 서열의 아미노산 서열에서 상응하는 아미노산 위치에 또한 존재하는 것인, a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x)에 정의된 바와 같은 임의의 아미노산 서열과 적어도 60% 동일성을 갖는 아미노산 서열을 갖는 단백질.
  6. 제1항 내지 제5항 중 어느 한 항에 따른 단백질을 코딩하는 핵산 분자.
  7. 제6항에 있어서, 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자:
    a) 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    b) 서열식별번호: 18에 제시된 아미노산 서열에서 위치 1 내지 476의 아미노산 서열을 포함하는 단백질을 코딩하는 핵산 분자;
    c) 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 589 내지 591에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984의 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖는 것인, 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열과 적어도 60% 동일성을 갖는 핵산 분자;
    d) 서열식별번호: 17에서 뉴클레오티드 위치 4 내지 6에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 136 내지 138에 상응하는 코돈이 뉴클레오티드 서열 atg를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 142 144에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 178 내지 180에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 205 내지 207에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 268 내지 270에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492에 상응하는 코돈이 뉴클레오티드 서열 tty를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 553 내지 555에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 556 내지 558에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 583 내지 585에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 589 내지 591에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 604 내지 606에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 613 내지 615에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 724 내지 726에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 733 내지 735에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 754 내지 756에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 763 내지 765에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 802 내지 804에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 931 내지 933에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 952 내지 954에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 964 내지 966에 상응하는 코돈이 뉴클레오티드 서열 aar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1057 내지 1059에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1075 내지 1077에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1270 내지 1272에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1306 내지 1308에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1354 내지 1356에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖는 것인, 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열과 적어도 60% 동일성을 갖는 핵산 분자;
    e) 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984의 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖는 것인, a), b), c) 또는 d)에 정의된 핵산 분자의 상보성 가닥과 혼성화하는 핵산 분자;
    f) 서열식별번호: 17에서 뉴클레오티드 위치 4 내지 6에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 73 내지 75에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 136 내지 138에 상응하는 코돈이 뉴클레오티드 서열 atg를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 142 144에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 178 내지 180에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 190 내지 192에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 205 내지 207에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 262 내지 264에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 268 내지 270에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 469 내지 471에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492에 상응하는 코돈이 뉴클레오티드 서열 tty를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495에 상응하는 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 505 내지 507에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 520 내지 522에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 553 내지 555에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 556 내지 558에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 559 내지 561에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 583 내지 585에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 589 내지 591에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 604 내지 606에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 613 내지 615에 상응하는 코돈이 뉴클레오티드 서열 tgy를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 715 내지 717에 상응하는 코돈이 뉴클레오티드 서열 ccn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 724 내지 726에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 733 내지 735에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 754 내지 756에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 763 내지 765에 상응하는 코돈이 뉴클레오티드 서열 ath를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 802 내지 804에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 931 내지 933에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 952 내지 954에 상응하는 코돈이 뉴클레오티드 서열 gcn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 964 내지 966에 상응하는 코돈이 뉴클레오티드 서열 aar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 982 내지 984에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1057 내지 1059에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1075 내지 1077에 상응하는 코돈이 뉴클레오티드 서열 aay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152에 상응하는 코돈이 뉴클레오티드 서열 tay를 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1165 내지 1167에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1171 내지 1173에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1186 내지 1188에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227에 상응하는 코돈이 뉴클레오티드 서열 acn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1228 내지 1230에 상응하는 코돈이 뉴클레오티드 서열 mgn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242에 상응하는 코돈이 뉴클레오티드 서열 ytn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1270 내지 1272에 상응하는 코돈이 뉴클레오티드 서열 gar을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1306 내지 1308에 상응하는 코돈이 뉴클레오티드 서열 gtn을 갖고, 서열식별번호: 17에서 뉴클레오티드 위치 1354 내지 1356에 상응하는 코돈이 뉴클레오티드 서열 ggn을 갖는 것인, a), b), c) 또는 d)에 정의된 핵산 분자의 상보성 가닥과 혼성화하는 핵산 분자;
    g) 유전자 코드의 축중성으로 인해 a), b), c), d), e) 또는 f)에 정의된 핵산 분자로부터 유래된 핵산 분자;
    h) 서열식별번호: 18에서 위치 25, 64, 88, 157, 165, 169, 174, 187, 239, 327, 328, 384, 389, 391, 396, 410 및 414에 상응하는 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60% 동일성을 갖는 단백질을 코딩하는 핵산 분자;
    i) 서열식별번호: 18에서 위치 2, 25, 46, 48, 60, 64, 69, 88, 90, 157, 164, 165, 169, 174, 185, 186, 187, 195, 197, 202, 205, 239, 242, 245, 252, 255, 268, 311, 318, 322, 327, 328, 353, 359, 384, 389, 391, 396, 409, 410, 414, 424, 436, 452, 475 및 476에 상응하는 아미노산이 서열식별번호: 18에 제시된 아미노산 서열에서 각각의 위치에 제시된 이들 아미노산을 나타내는 것인, 서열식별번호: 18에 제시된 위치 1 내지 476의 아미노산 서열과 적어도 60% 동일성을 갖는 단백질을 코딩하는 핵산 분자;
    j) 서열식별번호: 16에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자.
  8. 제6항 또는 제7항에 있어서, 하기로 이루어진 군으로부터 선택된 ω-TA의 활성을 갖는 단백질을 코딩하는 핵산 분자:
    a) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 496 내지 498의 코돈이 뉴클레오티드 서열 ggn을 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 위치의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    b) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1150 내지 1152의 코돈이 뉴클레오티드 서열 wsn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    c) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 976 내지 978의 코돈이 뉴클레오티드 서열 car을 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 위치의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    d) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    e) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 976 내지 978의 코돈이 뉴클레오티드 서열 tty를 갖고, 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    f) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 car을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    g) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 ath를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    h) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 atg를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    i) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492의 코돈이 뉴클레오티드 서열 tay를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    j) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492의 코돈이 뉴클레오티드 서열 wsn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    k) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 gtn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    l) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227의 코돈이 뉴클레오티드 서열 mgn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    m) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 wsn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    n) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 811 내지 813의 코돈이 뉴클레오티드 서열 ath를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    o) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 985 내지 987의 코돈이 뉴클레오티드 서열 ggn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    p) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227의 코돈이 뉴클레오티드 서열 ccn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    q) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242의 코돈이 뉴클레오티드 서열 atg를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    r) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495의 코돈이 뉴클레오티드 서열 aar을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    s) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242의 코돈이 뉴클레오티드 서열 mgn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    t) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1240 내지 1242의 코돈이 뉴클레오티드 서열 cay를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    u) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 493 내지 495의 코돈이 뉴클레오티드 서열 tgy를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    v) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 979 내지 981의 코돈이 뉴클레오티드 서열 gtn을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    w) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 490 내지 492의 코돈이 뉴클레오티드 서열 tgy를 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    x) 서열식별번호: 16 또는 서열식별번호: 17에서 뉴클레오티드 위치 1225 내지 1227의 코돈이 뉴클레오티드 서열 aar을 갖는 것을 제외하고는, 서열식별번호: 16 또는 서열식별번호: 17에 제시된 핵산 서열에서 위치 1 내지 1428의 핵산 서열을 포함하는 핵산 분자;
    y) a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 각각의 코돈 뉴클레오티드 서열이 a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x) 각각에 정의된 바와 같은 임의의 핵산 서열과 적어도 60% 동일성을 갖는 핵산 서열에서 상응하는 코돈 뉴클레오티드 위치에 또한 존재하는 것인, a), b), c), d), e), f), g), h), i), j), k), l), m), n), o), p), q), r), s), t), u), v), w) 또는 x)에 정의된 바와 같은 임의의 핵산 서열과 적어도 60% 동일성을 갖는 핵산 서열을 갖는 핵산 분자.
  9. 제6항 내지 제8항 중 어느 한 항에 따른 핵산 분자를 포함하는 재조합 핵산 분자.
  10. 제9항에 있어서, 재조합 핵산 분자가 벡터 또는 플라스미드인 재조합 핵산 분자.
  11. 제1항 내지 제5항 중 어느 한 항에 따른 단백질을 포함하거나 또는 제6항 내지 제8항 중 어느 한 항에 따른 핵산 분자를 포함하거나 또는 제9항 또는 제10항에 따른 재조합 핵산 분자를 포함하는 숙주 세포.
  12. 하기 단계를 포함하는, 아민을 생성하는 방법:
    a) 아민 수용자 분자를 제공하는 단계;
    b) 아민 공여자 분자를 제공하는 단계;
    c) 단계 a)에서 제공된 아민 수용자 분자 및 단계 b)에서 제공된 아민 공여자 분자를 제1항 내지 제5항 중 어느 한 항에 따른 단백질과 접촉시키는 단계.
  13. 하기 단계를 포함하는, (R)- 및 (S)-아민 거울상이성질체를 포함하는 조성물에서 아민 거울상이성질체의 양을 감소시키는 방법:
    a) (R)- 및 (S)-아민 거울상이성질체를 포함하는 조성물을 제공하는 단계;
    b) 아민 수용자 분자를 제공하는 단계;
    c) 단계 a)에서 제공된 조성물 및 단계 b)에서 제공된 아민 수용자를 제1항 내지 제5항 중 어느 한 항에 따른 단백질과 접촉시키는 단계.
KR1020217005614A 2018-07-31 2019-07-30 개선된 트랜스아미나제 단백질을 코딩하는 핵산 KR20210038923A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18186729 2018-07-31
EP18186729.2 2018-07-31
PCT/EP2019/070431 WO2020025577A1 (en) 2018-07-31 2019-07-30 Nucleic acids encoding improved transaminase proteins

Publications (1)

Publication Number Publication Date
KR20210038923A true KR20210038923A (ko) 2021-04-08

Family

ID=63259382

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217005614A KR20210038923A (ko) 2018-07-31 2019-07-30 개선된 트랜스아미나제 단백질을 코딩하는 핵산

Country Status (9)

Country Link
US (1) US20220220457A1 (ko)
EP (1) EP3830252A1 (ko)
JP (1) JP7496814B2 (ko)
KR (1) KR20210038923A (ko)
CN (1) CN112888780A (ko)
BR (1) BR112021001800A2 (ko)
IL (1) IL280400A (ko)
MX (1) MX2021001218A (ko)
WO (1) WO2020025577A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111909907B (zh) * 2020-07-08 2022-05-24 浙江工业大学 天冬氨酸氧化酶突变体、工程菌及其在氧化-还原偶联制备精草铵膦中的应用
CN114645027A (zh) * 2020-12-21 2022-06-21 上海合全药物研发有限公司 一种来源于巨大芽孢杆菌的氨基转移酶突变体及其应用
CN117120625A (zh) 2021-04-01 2023-11-24 巴斯夫欧洲公司 制备l-草铵膦的方法
CN114134126B (zh) * 2021-10-28 2023-12-05 浙江大学杭州国际科创中心 转氨酶及其突变体在制备(s)-1-甲氧基-2-丙胺中的应用
CN114277011B (zh) * 2021-12-29 2024-02-06 凯莱英医药集团(天津)股份有限公司 转氨酶突变体及其应用

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4950606A (en) 1989-06-22 1990-08-21 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US6133018A (en) 1997-06-02 2000-10-17 Celgro Enzymatic synthesis of chiral amines using -2-amino propane as amine donor
CN101074441A (zh) * 1999-06-25 2007-11-21 Basf公司 编码代谢途径蛋白的谷氨酸棒杆菌基因
KR100433134B1 (ko) 2002-03-05 2004-05-27 김병기 신규한 호열성 미생물 및 이를 이용한 방향족l-아미노산의 제조 방법
JP4125268B2 (ja) 2004-07-07 2008-07-30 株式会社島精機製作所 横編機における給糸装置のヤーンフィーダ
JP4626198B2 (ja) 2004-07-13 2011-02-02 四国化工機株式会社 容器供給装置
US7172885B2 (en) 2004-12-10 2007-02-06 Cambrex North Brunswick, Inc. Thermostable omega-transaminases
DK2121908T3 (da) * 2007-02-14 2014-01-27 Bayer Cropscience Ag Nukleinsyremolekyler, der koder for trunkeret alternansucrase
DE102009000592A1 (de) 2009-02-04 2010-08-05 Evonik Degussa Gmbh Verfahren zur Herstellung von Aminogruppen tragenden, multizyklischen Ringsystemen
EP2684953B1 (en) * 2011-03-11 2017-06-28 Kaneka Corporation Modified aminotransferase, gene thereof, and method for producing optically active amino compound using same
KR20160089492A (ko) * 2013-11-26 2016-07-27 아심켐 래보러토리즈 (톈진) 컴퍼니, 리미티드 R형 ω-트랜스아미나제 및 그 응용
EP3155107A1 (en) 2014-06-16 2017-04-19 Invista Technologies S.à.r.l. Methods, reagents and cells for biosynthesizing compounds
EP3307881B1 (en) * 2015-06-12 2021-02-24 c-LEcta GmbH Transaminases
MX2018010425A (es) 2016-03-02 2018-11-29 Agrimetis Llc Metodos de preparacion de l-glufosinato.

Also Published As

Publication number Publication date
MX2021001218A (es) 2021-04-12
JP7496814B2 (ja) 2024-06-07
WO2020025577A1 (en) 2020-02-06
IL280400A (en) 2021-03-01
US20220220457A1 (en) 2022-07-14
JP2021532756A (ja) 2021-12-02
EP3830252A1 (en) 2021-06-09
TW202020148A (zh) 2020-06-01
CN112888780A (zh) 2021-06-01
BR112021001800A2 (pt) 2021-05-04

Similar Documents

Publication Publication Date Title
KR20210038923A (ko) 개선된 트랜스아미나제 단백질을 코딩하는 핵산
JP5999565B2 (ja) (r)−選択的アミノ化
AU2016249780B2 (en) Mutant transaminases as well as methods and uses relating thereto
EP2479272A1 (en) Method for producing monatin
FR2825717A1 (fr) Preparation stereoselective de l-acides amines cycliques
WO2016198660A1 (en) Transaminases
WO2003072770A1 (fr) Nouvelle deshydrogenase et gene codant cette derniere
CN111406104B (zh) 减少为了生产氨基酸或氨基酸衍生产物的亚胺/烯胺的积累
TWI851589B (zh) 編碼改良之轉胺酶蛋白質之核酸
CN117545849A (zh) 用于制备l-草铵膦p-烷基酯的酶方法
CN106795511B (zh) 氧化酶、编码该酶的多核苷酸、以及它们的应用
CN106661571B (zh) 氧化酶、编码该酶的多核苷酸、以及它们的应用
US8771997B2 (en) Method for producing monatin using an L-amino acid aminotransferase
US20020102662A1 (en) Methods for racemizing N-acylamino acids and producing optically active amino acids
Ogawa et al. Enantioselective ester hydrolase from Sphingobacterium sp. 238C5 useful for chiral resolution of β-phenylalanine and for its β-peptide synthesis
JPWO2011001889A1 (ja) 光学活性α−アミノ酸のラセミ化方法
TW202423955A (zh) 編碼改良的脂酶蛋白質之核酸
Frese Structure, mechanism and engineering of pyridoxal phosphate-dependent racemases
CA2769606A1 (en) Method for producing monatin
Sonke Novel developments in the chemo-enzymatic synthesis of enantiopure α-hydrogen-and α, α-disubstituted α-amino acids and derivatives
TW202413319A (zh) 以動態動力學立體異構體分解製備(1r,2s)-2,6-二甲基-1-胺基茚烷之方法
TW202412627A (zh) 製備(1r,2s)-2,6-二甲基-1-胺基茚烷之方法
JP2011024572A (ja) 光学活性アミノ酸の製造法