KR20030051897A - 데할로게나제 활성을 가진 효소 및 이의 사용 방법 - Google Patents

데할로게나제 활성을 가진 효소 및 이의 사용 방법 Download PDF

Info

Publication number
KR20030051897A
KR20030051897A KR10-2003-7007377A KR20037007377A KR20030051897A KR 20030051897 A KR20030051897 A KR 20030051897A KR 20037007377 A KR20037007377 A KR 20037007377A KR 20030051897 A KR20030051897 A KR 20030051897A
Authority
KR
South Korea
Prior art keywords
seq
sequence
polypeptide
sequences
homology
Prior art date
Application number
KR10-2003-7007377A
Other languages
English (en)
Inventor
숏제이엠.
마더에릭제이.
리차드슨토비
로버트슨댄
그레이케빈
Original Assignee
다이버사 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다이버사 코포레이션 filed Critical 다이버사 코포레이션
Publication of KR20030051897A publication Critical patent/KR20030051897A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S422/00Chemical apparatus and process disinfecting, deodorizing, preserving, or sterilizing
    • Y10S422/90Decreasing pollution or environmental impact

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Processing Of Solid Wastes (AREA)

Abstract

본 발명은 할로알칸 데할로게나제 및 상기 할로알칸 데할로게나제를 암호화하는 폴리뉴클레오티드에 관한 것이다. 또한, 본 발명은 신규한 데할로게나제를 디자인하는 방법 및 이의 이용 방법을 제공한다. 상기 데할로게나제는 증가된 pII 및 온도에서 증가된 활성 및 안정성을 보유한다.

Description

데할로게나제 활성을 가진 효소 및 이의 사용 방법{ENZYMES HAVING DEHALOGENASE ACTIVITY AND METHODS OF USE THEREOF}
환경 오염물질은 다량의 다양한 화학 물질(이들 중 다수는 미환경 보호청이 1979년에 우선(priority) 오염물질로서 지정한 독성을 가진 환경 위험 요소임)로 이루어진다. 미생물 및 효소적 생물분해는 이러한 오염물질을 제거하기 위한 한가지 방법이다. 따라서, 미생물 및 관련 효소 공정을 통해 상업적 폐기물을 처리하고 오염된 환경을 생물학적으로 되살리는 방법들이 설계되었다.
불행하게도, 다수의 화학 오염물질은 미생물 분해에 내성을 가지거나, 또는 고농도, 그리고 특정 조합으로 존재하는 경우에 가능성있는 미생물 분해제에 대하여 독성을 가진다.
할로알칸 데할로게나제는 알파/베타 하이드롤라제 부류에 속하는데, 이 부류의 모든 효소는 유사한 토폴로지, 반응 메카니즘 및 촉매 트라이어드(triad) 잔기를 공유한다. 문헌[Krooshof, Biochemistry36(31):9571-9580, 1997] 참조. 이 효소는 가수분해에 의해 할로알칸 및 할로카르복실산에서 탄소-할로겐 결합을 분해시켜, 이들을 그에 상응하는 알코올로 전환시킨다. 이 반응은 에틸클로라이드, 메틸클로라이드 및 1,2-디클로로에탄과 같은 할로알칸에 관계된 해독 작용에 있어서 매우 중요하다. 이들 할로알칸은 환경 보호청이 우선 오염물질로 간주한 것이다. 문헌[Rozeboom, H., Kingma, J., Janssen, D., Dijkstra, B. Crystallization of Haloalkane Dehalogenase from Xanthobacter autotrophicus GJ10J Mol Biol 200(3), 611-612(1998)] 참조.
할로알칸 데할로게나제는 염소화 지방족 화합물 상에서 완전히 성장할 수 있는 미생물에 의해 생산된다. 금속이나 산소는 활성에 필요하지 않다: 물이 유일한 기질이다.
크산토박터 오토트로피커스(Xanthobacter autotrophicus) GJ10은 성장을 위해 1,2-디클로로에탄과 약간의 다른 할로알칸 및 할로카르복실산을 사용하는 질소 고정 박테리아가다. 문헌[Rozeboom, J Mol Biol 200:3:611-612, 1988; Keuning, J Bacteriol163(2):635-639, 1985] 참조. 이것은 가장 잘 연구된 데할로게나제인데, 그 이유는 이것이 공지된 촉매 반응 메카니즘, 활성 메카니즘 및 결정 구조를 가지기 때문이다. 문헌[Schanstra, J Biol Chem271(25):14747-14753,1996] 참조.
유기체는 2가지의 다른 데할로게나제를 생산한다. 한가지 데할로게나제는 할로겐화 알칸에 대한 것이고, 다른 하나는 할로겐화 카르복실산에 대한 것이다. 가장 유해한 할로겐화 화합물은 세정제, 살충제 및 용매로서 사용하기 위해 산업적으로 생산된다. 크산토박터 오토트로피커스의 고유 기질은 1,2-디클로로에탄이다. 이 할로알칸은 비닐 생산에 자주 사용된다.
효소는 매우 선택적인 촉매이다. 이들의 홀마크는 기존의 합성 화학에서 비할바 없는, 훌륭한 입체- , 위치- 및 화학-선택적으로 반응을 촉매하는 능력이다. 더욱이, 효소는 매우 다양한 용도를 가진다. 이들은 유기 용매중에서 작용하도록, 극도의 pH 및 온도에서 작동하도록, 그리고 이들의 고유한 생리학적 기질과 구조적으로 연관성이 없는 화합물과의 반응을 촉매하도록 조작될 수 있다.
효소는 광범위한 고유 및 비고유 기질에 대하여 반응하므로, 사실상 임의의 유기 선도 화합물을 변형시킬 수 있다. 더욱이, 종래의 화학 촉매와 달리, 효소는 고도로 거울상- 그리고 위치-선택적이다. 효소가 나타내는 고도의 작용기 특이성은 신규 활성 화합물을 발견하기 위한 합성 시퀀스에서 각 반응의 추적을 가능하게 한다. 효소는 또한 그들의 고유한 생리학적 작용과 관련이 없는 다수의 다양한 반응을 촉매할 수 있다. 예를 들어, 퍼옥시다제는 수소 퍼옥시다제에 의해 페놀의 산화를 촉매한다. 퍼옥시다제는 또한 효소의 고유 작용과 관계가 없는 하이드록실화 반응을 촉매할 수 있다. 다른 예는 폴리펩티드의 분해를 촉매하는 프로테아제이다. 유기 용액에서, 몇가지 프로테아제는 당을 아실화시킬 수 있는데, 이는 이들 효소가 가진 고유의 작용과 무관하다.
본 발명은 효소의 독특한 촉매 특성을 이용한다. 화학적 변환(transformation)에서 생촉매(즉, 정제 또는 미정제 효소, 생존 또는 비생존 세포)는 일반적으로 특정 출발 물질과 반응하는 특수한 생촉매의 동정을 필요로 하지만, 본 발명은 다수의 출발 물질에 존재하는 작용기에 대하여 특이성 있는 반응 조건과 선택된 생촉매를 사용한다.
각각의 생촉매는 작용기 또는 관련된 몇가지 작용기에 대하여 특이적이고, 그 작용기를 포함하는 다수의 출발 물질과 반응할 수 있다.
생촉매 반응은 하나의 출발 물질로부터 유도체의 집단을 생성한다. 이들 유도체는 또 다른 생촉매 반응을 거쳐 제2 유도체 화합물의 집단을 생성할 수 있다. 생촉매 유도체화 반응을 각각 반복하면 최초 화합물의 수천가지 변이체를 얻을 수 있다.
효소는 분자의 출발 물질의 다른 부분에 영향을 주지 않으면서 특정 위치에서 반응하며, 그 과정은 통상의 화학적 방법에 의해서는 달성하기 매우 어렵다. 이러한 고도의 생촉매 특이성은 라이브러리내에서 단일 활성 화합물을 동정하기 위한 수단이 된다. 이 라이브러리는 그것을 생산하는 데 사용되는 일련의 생촉매 반응, 소위 "생물합성 연혁"을 특징으로 한다. 생물 활성에 대하여 라이브러리를 스크리닝하고, 생합성 연혁을 추적(발견)함으로써 활성 화합물을 생성하는 특정 반응 서열을 확인한다. 반응 시퀀스를 반복하여 합성된 화합물의 구조를 결정한다. 다른 합성 및 스크리닝 접근법과는 달리, 이러한 동정의 형태는 고정화 기법을 요하지아니하며, 화합물은 합성되고, 거의 모든 형태의 스크리닝 분석을 사용해서 용액내에서 자유롭게 시험될 수 있다. 작용기에 대한 고도의 효소 반응 특이성이, 생촉매적으로 생산된 라이브러리를 구성하는 특이적인 효소 반응을 "추적"할 수 있게 한다는 사실이 중요하다.
매일 수천의 생촉매 반응 및 스크리닝 분석을 실행할 수 있고 고도의 정확성과 재현성을 담보할 수 있는 로봇식 자동조작을 사용해서 많은 절차상의 단계들을 실행한다. 그 결과, 유도체 화합물 라이브러리의 생성은, 현재의 화학적 방법에 의해서는 수년이 소요될 것이나, 수주내에 가능하다. 소분자를 비롯한 분자의 변형에 대하여 추가로 교시하는 문헌예로서, PCT/US94/09174를 참조할 수 있고, 그 내용은 전체로서 본 명세서에 참고로 포함된다.
본 명세서에서 언급한 문헌은 단지 본 발명의 출원일 이전에 개시된 사항만을 제공한다. 본 발명이 선행 발명에 의한 그러한 개시물에 선행하지 않는다고 해석되어서는 안된다.
관련 출원
본 발명은 2000년 12월 1일에 출원되어 현재 계류중인 미국 출원 60/250,897을 우선권 주장하며, 그 내용은 전체로서 본 명세서에 참고로 포함된다.
발명의 분야
본 발명은 일반적으로 효소, 효소를 암호화하는 폴리뉴클레오티드, 그러한 폴리뉴클레오티드 및 폴리펩티드의 용도, 보다 구체적으로는 할로알칸 데할로게나제 활성을 가진 효소에 관한 것이다.
다음의 도면은 본 발명의 태양을 설명하는 것이고 특허청구범위에 포괄된 본 발명의 범위를 제한하는 것은 아니다.
도 1은 컴퓨터 시스템의 블록도이다.
도 2는 새로운 서열과 데이터베이스 내의 서열 사이의 상동성 수준을 판단하기 위하여 서열의 데이터 베이스와 새로운 뉴클레오티드 또는 단백질 서열을 비교하는 공정의 일 태양을 설명하는 흐름도이다.
도 3은 2개의 서열이 상동성이 있는지 여부를 판단하기 위한 컴퓨터내의 프로세스의 일 태양을 설명하는 흐름도이다.
도 4는 서열 중의 특징의 존재를 검출하기 위한 동정기(identifier) 프로세스(300)의 일 구체예를 설명하는 흐름도이다.
도 5는 본 발명의 폴리펩티드 서열의 정열을 나타낸다. A = 서열 번호 4; B = 서열 번호 2; C = 서열 번호 6; rhod2 = 서열 번호 40; myco4 = 서열 번호 42.
도 6은 본 발명의 서열을 나타낸다(서열 번호 9-38 및 43-48).
도 7은 본 발명의 데할로게나제를 사용하여 글리세롤을 형성할 뿐 아니라 본 발명의 데할로게나제를 사용하여 1,2-프로판디올 또는 1,3-프로판디올을 형성하는 실시예를 나타낸다.
도 8은 본 발명의 데할로게나제를 사용하여 할로-치환된 시클릭 히드로카르빌의 탈할로겐화의 실시예를 나타낸다.
발명의 상세한 설명
본 발명은 할로알칸 데할로게나제 폴리펩티드 및 이들을 암호화하는 폴리뉴클레오티드 뿐 아니라 상기 폴리뉴클레오티드 및 폴리펩티드의 사용 방법에 관한 것이다. 본원에서 사용되는 "할로알칸 데할로게나제"는 하이드롤라제 활성을 가지는 효소, 예를 들어 알킬-효소 중간체를 통해 할로알칸의 가수분해를 촉매할 수 있는 효소를 포함한다.
본 발명의 폴리뉴클레오티드는 데할로게나제 활성을 가지는, 구체적인 태양에서 데할로게나제 활성을 가지는 폴리펩티드를 암호화하는 것으로서 확인되었다.
본 발명의 데할로게나제 및 데할로게나제를 암호화하는 폴리뉴클레오티드는 다수의 공정, 방법 및 조성물에서 유용하다. 예를 들어, 전술한 바와 같이, 데할로게나제는 지방족 오르가노클로린으로 오염된 환경의 치유, 제초제 달라폰(dalapon)의 분해, 할로겐화된 유기산의 분해 뿐 아니라 토양 및 물의 개선을 위하여, 그리고 토양 및 물에서 할로겐화된 유기산을 분해시키는 데에 사용될 수 있다. 더욱이, 본 발명의 데할로게나제는 환경, 의약, 및 산업 공정에서의 불순물을 제거하는 데 사용될 수 있다. 예를 들어, 데할로게나제는 예컨대, 계면활성제, 카르복시메틸 셀룰로즈 또는 티오글리콜산 염을 비롯한 다양한 샘플 중의 할로알칸산 불순물을 분해하는 데에 사용될 수 있다. 또 다른 양태에서, 본 발명의 데할로게나제는 특이적 1,2-디올 또는 라세미 할로게노히드린을 산화적 탈할로겐화 시킴으로써 의약, 농화학 물질 및 강유전성 액체의 형성에 사용될 수 있다. 예를 들어, 데할로게나제는 α,β-디할로프로피온산(예컨대, 디클로로프로피온산)을 데할로게나제로 처리함으로써 광학적으로 활성인 글리시드산 및 락트산(예컨대, 베타 할로락트산)의 합성에 사용될 수 있다. 본 발명의 데할로게나제는 1,3-디할로-2-프로판올로부터 활성(S)-(+)-3-할로-1,2-프로판디올 또는(R)-(-)-3-할로-1,2-프로판디올의 생산에 사용될 수 있다.(S)-(+)-3-할로-1,2-프로판디올은 생리학적 및 의학적 치료 및 의약용의 원료 물질로서 유용하다.
예를 들어, 본 발명의 데할로게나제를 트리클로로프로판디올(TCP) 또는 디클로프로판디올(DCP)과 산화적 탈할로겐화를 가능하게 하는 충분한 시간 및 조건 하에서 접촉시켜 예컨대, 글리세롤(예를 들어, DCP 또는 TCP에서 글리세롤)을 형성할 수 있다(예컨대, 도 7 참조). 다양한 디올이 본 발명의 방법 및 본 발명의 효소를 사용하여 제조되었다. 또한, 본 발명의 방법 및 조성물은 할로겐화된 방향족 화합물에 적용될 수 있다. 예를 들어, 본 발명의 조성물은 도 8에서 도시한 바와 같이, 할로-치환된 시클릭 히드로카르빌을 탈할로겐화하기 위하여 사용될 수 있다. 시클릭 히드로카르빌 화합물의 예로는 시클로알킬, 시클로알케닐, 시클로알카디에닐, 시클로알카트리에닐, 시클로알키닐, 시클로알카디이닐, 방향족 화합물, 2개의 고리가 2개의 고리의 유일한 공통 요소인 단일 원자에 의해 연결된 스피로 탄화수소(예컨대, 스피로[3,4]옥타닐 등), 2개의 고리가 연결되고 2 이상의 원소를 공통적으로 가지는 비시클릭 탄화수소(예컨대, 비시클로[3.2.1]옥탄, 비시클로[2.2.1]헵트-2-엔 등), 2 이상의 시클릭 시스템(즉, 단일 고리 또는 융합 시스템)이 단일 또는 이중 결합에 의해 서로에게 직접 연결되어 있는 고리 어셈블리로서, 상기 고리 연결부의 수는 관련된 시클릭 시스템의 수보다 하나 적은 것인 고리 어셈블리(예컨대, 비페닐일, 비페닐일렌, 래디컬 또는 p-테르페닐, 시클로헥실벤질 등), 폴리시클릭 등을 들 수 있다.
할로알칸 데할로게나제
전체 구조
크산토박토 오토트로피커스로부터 유래한 할로알칸 데할로게나제는 310개의아미노산으로 이루어지며, 분자량이 36,000인 단일 폴리펩티드 사슬로 구성된다. 단량체성 효소는 구형이고 2개의 도메인으로 이루어진다. 주요 도메인은 8개 가닥 순서 12435678의 혼합된 베타 시트가 있는 알파/베타 하이드롤라제 폴드 구조를 가지며, 가닥 2는 나머지에 역평행 상태이다. 제2 도메인은 주요 도메인의 상부에 있는 알파-나선 캡이다(Keuning 등, J.Bacteriol163(2):635-639,1985). 본원에서 보다 상세히 기재하는 바와 같이, 돌연변이유발은 예컨대, 캡 도메인의 특이적 잔기를 돌연변이시킴으로써 효소의 활성을 변화시키기 위하여 행해졌다(Krooshof 등, Biochemistry 36(31):9571-9580,1997).
3개의 촉매 잔기(Asp 124, His 289 및 Asp 260)로 이루어진 크산토박터 오토트로피커스의 효소 활성 부위는 내부 소수성 공동의 2개 도메인 사이에서 발견된다. 베타 사슬 5 및 8 각각의 뒤에 위치한 친핵성 Asp 124 및 일반 염기 His 289는 알파/베타 하이드롤라제류에서 완전히 보존되어 있는 데 반해, Asp 260은 그렇치 않다. 활성 부위에는 10개의 소수성 잔기: 4개의 페닐알라닌; 2개의 트립토판; 2개의 류신; 1개의 발린; 그리고 1개의 프롤린이 나란히 배열되어 있다[참조: Schanstra 등, J Biol Chem271(25):14747-14753, 1996].
효소로 기질을 가수분해할 때, 할로알칸 데할로게나제는 His 289에 의해 활성화되는 물 분자에 의해 가수분해되는 Asp 124와의 친핵 치환에 의해 형성된 공유 중간체를 형성한다[참조: Verschueren, Nature363(6431):693-698, 1993]. Asp 260(데할로게나제 효소에 공통적인 촉매 트라이어드의 제3 요소)의 역할은 부위 지정 돌연변이유발법에 의해 연구되었다. Asp 260을 아스파라긴으로 돌연변이시킨 결과 촉매 불활성인 D260N 돌연변이체가 생성되었는데, 이것은 트라이어드 산 Asp 260이 야생형 효소의 데할로게나제 활성에 필수적임을 입증한다. 또한, Asp 260은 구조적으로 중요한 역할을 하는데, 그 이유는 D260N 효소가 발현시 주로 봉입체에 축적되고 기질이나 생성물은 활성 부위 공동에 결합할 수 없었기 때문이다. Asn 148을 아스파르트산이나 글루탐산으로 치환함으로써 브롬화 기질에 대한 활성을 D260N으로 회복시켰다. 이중 돌연변이 D260N+N148D 및 D260N+N148E 둘다는 야생형 효소에 비해 1,2-디브로모에탄에 대하여 40배 높은 Km 값과 10배 적은 kcat를 가졌다. D260N+N148E 이중 돌연변이체에 대한 예비-정상-상태 동력학 분석 결과, kcat의 감소는 주로 탄소-브롬 결합 분해 속도의 220배 감소 및 알킬-효소 중간체의 가수분해 속도의 10배 감소에 기인하였다. 한편, 브로마이드는 야생형 효소와는 다른 경로를 통해 12배 빨리 방출되었다. 이 돌연변이체의 분자 클로닝 결과, Glu 148은 His 289와 상호작용할 수 있고, 활성 부위를 용매와 연결시키는 터널 영역에서 전하 분포의 변화가 나타났다[참조: Krooshof, Biochemistry36(31):9571-9580, 1997].
유해한 할로겐화 화합물 분해의 제1 단계에서 할로알칸 데할로게나제를 사용한다. 이 데할로게나제 촉매 반응은 에스테르 중간체가 관여하는 2 단계 메카니즘으로 일어난다. 가수분해성 데할로게나제에는 에너지가 필요없고; 따라서, 독성을 유발하는 할로겐이 소실되므로, 유기 물질을 해독하는 간단한 방법이다. 촉매 트라이어드(Asp-His-Asp)는 아스파테이트 카복실레이트(Asp 124)와 함께 반응의 중심점이다. 기질은 활성 부위 공동에 결합하고, Cl-알파 복합체는 Trp 172 및 Trp 175의측쇄 NH기와 반응한다. 제1 단계로서 기질로부터 할로겐을 친핵성 아스파테이트로 치환하고, 그 결과 중간체 공유 에스테르를 얻는다. 이어서, His 289는 에스테르를 가수분해하는 물 분자를 활성화한다. 그 결과, 활성 부위에서 알코올과 할라이드가 치환된다. 친핵성 Asp 124, 및 에스테르 중간체의 물 가수분해가 관여하는 2 단계 메카니즘은 다른 알파/베타 하이드롤라제 효소 부류와 일치한다.
할로알칸 데할로게나제는 지방족 화합물의 탄소-할로겐 결합을 분해한다. 결과는 C-Cl 결합과의 효소 반응이 다른 C-할라이드 이온과의 반응에 비해 느리게 나타난다. 이탈기의 능력이 이러한 차이를 설명한다. 1,2-디클로로에탄 및 1,2-디브로모에탄 반응의 속도 제한 단계는 탄소-할로겐 결합의 분해가 아니라, 활성 부위로부터 이온의 방출이다.
생물학적 분해(Bioremediation)
본 발명은 개선된 효소 특성을 가진, 생물학적 재생에 유용한 다수의 데할로게나제 효소를 제공한다. 본 발명의 폴리뉴클레오티드 및 폴리뉴클레오티드 생성물은 예를 들어 본 발명의 폴리뉴클레오티드 또는 폴리펩티드를 함유하는 형질전환된 숙주 세포(예를 들어, 크산토박터 오토트로피커스 박테리아) 및 할로알칸 1,2-디클로로에탄이 관여하는 지하수의 처리, 및 토양 퇴적물로부터 폴리클로르화 바이페닐(PBC)의 제거에 유용하다.
본 발명의 할로알칸 데할로게나제는 탄소-할라이드를 감소시키려는 작업에 유용하다. 본 발명의 효소는 할로알칸의 분해를 개시한다. 대안으로, 본 발명의 데할로게나제 폴리뉴클레오티드 또는 폴리펩티드를 함유하는 숙주 세포는 할로알칸으로 성장할 수 있고, 해독 효소를 생성할 수 있다.
정의
본원에 사용한 용어 "핵산" 또는 "핵산 서열"은 올리고뉴클레오티드, 이들중 임의의 단편, 게놈 또는 합성된 DNA 또는 RNA(이중 가닥 또는 단일 가닥일 수 있음)을 의미하며, 천연 또는 합성된 센스 또는 안티센스 가닥, 펩티드 핵산(PNA), 임의의 DNA 유사 또는 RNA 유사 물질을 나타낼 수도 있다. 한 구체예에서, 본 발명의 "핵산 서열"은 예를 들어, 상기한 바와 같이 B 군 아미노산 서열내의 폴리펩티드를 암호화하는 서열 및 이의 변이체를 의미한다. 다른 구체예에서, 본 발명의 "핵산 서열"은 상기한 바와 같이 A 군 핵산 서열내의 서열, 이에 상보적인 서열, 상기한 서열의 단편 및 이의 변이체를 포함한다.
본원에 사용한 용어 특정 폴리펩티드 또는 단백질 "의 암호 서열" 또는 특정 폴리펩티드 또는 단백질 "을 암호화하는 뉴클레오티드 서열"은 적합한 조절 서열의 조절 하에 위치되는 경우, 전사되어 폴리펩티드 또는 단백질로 번역되는 핵산 서열을 의미한다.
본원에 사용한 용어 "유전자"는 폴리펩티드 사슬 생성에 관련된 DNA의 분절을 의미하며; 이는 암호 영역의 선행 영역 및 후행 영역(리더 및 테일러) 뿐만 아니라 적합하게는 개개의 암호 서열(엑손) 사이의 개재 서열(인트론)을 포함한다.
본원에 사용한 용어 "아미노산" 또는 "아미노산 서열"은 올리고펩티드, 펩티드, 폴리펩티드 또는 단백질 서열, 또는 이들중 임의의 단편, 부분 또는 서브유닛을 의미하고, 또한 천연 분자 또는 합성 분자를 의미한다. 한 구체예에서, 본 발명의 "아미노산" 또는 "폴리펩티드 서열"은 예를 들어, 상기한 바와 같이 B 군 아미노산 서열 내의 서열, 전술한 서열의 단편 및 이의 변이체를 포함한다. 다른 구체예에서, 본 발명의 "아미노산"은 예를 들어, 상기한 바와 같이 A 군 핵산 서열내 서열을 보유하는 폴리뉴클레오티드에 의해 암호화되는 서열, 이에 상보적인 서열, 전술한 서열의 단편 및 이의 변이체를 포함한다.
본원에 사용한 용어 "폴리펩티드"는 펩티드 결합 또는 변경된 펩티드 결합, 즉 펩티드 동배체에 의해 서로 결합된 아미노산을 의미하며, 20개의 유전자 암호화된 아미노산 이외에 변경된 아미노산을 함유한다. 상기 폴리펩티드는 자연적인 과정, 예를 들어 번역후 처리과정, 또는 당업계에 공지된 화학적 변경 기법에 의해 변경될 수 있다. 변경은 폴리펩티드의 임의의 위치에서 발생할 수 있는데, 예를 들어, 펩티드 주쇄, 아미노산 측쇄 및 아미노 말단 또는 카르복시 말단에서 일어날 수 있다. 동일한 유형의 변경이 주어진 폴리펩티드의 몇몇 부위에서 동일하거나 상이한 정도로 존재하는 것이 바람직하다. 또한, 주어진 폴리펩티드는 다수 유형의 변경을 보유할 수 있다. 이러한 변경으로는 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유결합, 헴 부분의 공유 결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 결합, 지질 또는 지질 유도체의 공유 결합, 포스피티딜이노시톨의 공유 결합, 가교 고리화, 이황화 결합 형성, 탈메틸화, 공유 가교의 형성, 시스테인의 형성, 피로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 페르길화, 단백질분해처리, 인산화, 프레닐화, 라세미화, 셀레노일화, 황산화, 단백질에 대한tRNA 매개된 아미노산 첨가(예를 들어, 아르기닐화)를 들 수 있다[참조: Creighton, T.E., Proteins - Structure and Molecular Properties(2판), W.H. Freeman and Company, New York(1993); Posttranscriptional Covalent Modification of Proteins, B.C. Johnson, Ed. Academic Press, New York, pp. 1-12(1983)].
본원에 사용한 용어 "분리된(isolated)"은 물질이 그의 원래 환경(예를 들어, 천연 물질이라면 자연 환경)으로부터 제거된 것을 의미한다.
예를 들면, 살아 있는 동물 내에 존재하는 천연 폴리뉴클레오티드 또는 폴리펩디드는 분리된 것은 아니며, 자연계에서 공존하는 물질 중 일부 또는 전부로부터 격리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 분리된 것이다. 이러한 폴리뉴클레오티드는 벡터의 일부가 될 수 있고/될 수 있거나, 그러한 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부가 될 수 있으며, 그러한 벡터 또는 조성물이 자연 환경의 일부가 아니라는 점에서 여전히 분리된 것일 수 있다.
본원에 사용된 용어 "정제된(purified)"은 절대 순도를 요구하는 것이 아니라 오히려 상대적인 정의로서의 의미를 갖는다. 라이브러리로부터 얻어지는 개개의 핵산은 통상적으로 전기이동적 균일성으로 정제된다. 이러한 클론으로부터 얻어지는 서열은 라이브러리로부터, 그리고 전체 인간 DNA로부터 직접 얻을 수 없다. 본 발명의 정제된 핵산은 유기체내 게놈 DNA의 잔류물로부터 104-106배 이상으로 정제된다. 그러나, 또한 "정제된"이라는 용어는 게놈 DNA의 잔류물로부터 또는 라이브러리 또는 다른 환경내 다른 서열로부터 적어도 1차, 전형적으로 2차 또는 3차, 보다 전형적으로 4차 또는 5차로 정제되는 핵산을 포함한다.
본원에 사용된 용어 "재조합(recombinant)"이라는 용어는 핵산이 자연 환경에서는 인접하지 않는 "백본(backbone)" 핵산에 인접하다는 것을 의미한다. 부가적으로, "농축된(enriched)" 핵산은 핵산 골격 분자의 집단 내 핵산 삽입물의 수의 5% 이상을 나타낸다. 본 발명에 따른 골격 분자는 핵산, 예컨대 발현 벡터, 자가 복제 핵산, 바이러스, 통합(integrating) 핵산, 및 중요한 핵산 삽입물을 유지 또는 조절하는 데 사용된 다른 벡터 또는 핵산을 포함한다. 전형적으로, 농축된 핵산은 재조합 골격 분자의 집단내 핵산 삽입물의 수의 15% 이상을 나타낸다. 보다 전형적으로, 농축된 핵산은 재조합 골격 분자의 집단내 핵산 삽입물의 수의 50% 이상을 나타낸다. 한 실시양태에서, 농축된 핵산은 재조합 골격 분자의 집단내 핵산 삽입물의 수의 90% 이상을 나타낸다.
"재조합" 폴리펩티드 또는 단백질은 재조합 DNA 기법에 의해 생성된 폴리펩티드 또는 단백질, 즉 소정의 폴리펩티드 또는 단백질을 암호화하는 외인성 DNA 구성물(construct)에 의해 형질전환된 세포로부터 생성되는 폴리펩티드 또는 단백질을 의미한다. "합성" 폴리펩티드 또는 단백질은 화학적 합성에 의해 제조된 것들이다. 고체상 화학적 펩티드 합성 방법은 또한 본 발명의 폴리펩티드 또는 단편을 합성하는 데 이용할 수 있다. 그러한 방법은 1960대 초기 이래로 해당 기술 분야에 공지되어 있고[문헌(메리필드, R.B., J. Am. Chem. Soc., 85:2149-2154, 1963)을 참조할 수 있고; 또한 문헌(스튜워트, J.M. 및 영 J.D., Solid Phase Peptide Synthesis, 제2판, Pierce Chemical Co., Rockford, III., pp. 11-12)을 참조할 수있음], 최근 상업적으로 이용 가능한 실험실 펩티드 설계 및 합성 키트(Cambridge Research Biochemicals)에서 이용되고 있다. 그러한 상업적으로 이용 가능한 실험실 키트는 일반적으로 문헌[H.M. 게이선 등, Proc. Natl. Acad. Sci., USA, 81:3998(1984)]의 교시내용을 이용하고, 단일 플레이트에 모두 연결되어 있는 다수의 "로드" 또는 "핀"의 팁 상에서 펩티드를 합성하는 데 제공된다. 그러한 시스템을 이용하는 경우, 로드 또는 핀의 플레이트는 상응하는 벽 또는 저장소의 제2 플레이트 내로 전화 및 삽입되며, 상기 벽 또는 저장소는 적당한 아미노산을 핀 또는 로드의 팁에 부착 또는 고정하기 위한 용액을 함유한다. 그러한 공정 단계를 반복함으로써, 즉 로드 및 핀의 팁을 적당한 용액 내로 전화 및 삽입함으로써, 아미노산은 소정의 펩티드로 형성된다. 게다가, 다수의 이용 가능한 FMOC 펩티드 합성 시스템을 이용할 수 있다. 예를 들면, 폴리펩티드 또는 단편의 어셈블리는 어플라이드 바이오시스템즈 인코포레이티드(Applied Biosystems Inc.) Model 431A 자동화 펩티드 합성기를 사용하여 고형 지지체 상에서 수행할 수 있다. 그러한 장치는 직접 합성에 의해 또는 다른 공지된 기법을 이용하여 커플링할 수 있는 일련의 단편의 합성에 의해 본 발명의 펩티드에 용이한 접근을 제공한다.
프로모터 서열은 프로모터에서 전사를 개시하는 RNA 폴리머라제가 암호화 서열을 mRNA로 전사시키는 경우 암호화 서열에 "작동 가능하게 연결된다".
"플라스미드"는 대문자 및/또는 숫자에 선행 및/또는 후행하는 소문자 "p"로 나타낸다. 본 명세서에서 출발 플라스미드는 비제한된 원칙에 따라 상업적으로 이용 가능하고, 공개적으로 이용 가능하거나, 또는 공개된 절차에 따라 이용 가능한플라스미드로부터 구성할 수 있다. 게다가, 본 명세서에 설명된 것과 동등한 플라스미드는 해당 기술 분야에 공지되어 있고, 당업자들이라면 명백히 이해할 수 있을 것이다.
DNA의 "분해(digestion)"라는 용어는 DNA 내의 특정 서열에만 작용하는 제한 효소에 의한 DNA의 촉매 절단을 의미한 것이다. 본 명세서에서 사용된 다양한 제한 효소는 상업적으로 이용 가능하고, 이용되었던 그것의 반응 조건, 보조인자 및 다른 요건은 당업자에게 공지되어 있다. 분석 목적의 경우, 전형적으로 플라스미드 또는 DNA 단편의 1 ㎍은 버퍼 용액의 약 20 ㎕ 내 효소 약 2 유닛와 함께 사용된다. 플라스미드 구성을 위해 DNA 단편을 분리하는 목적의 경우, 전형적으로 DNA의 5 내지 50 ㎍은 보다 큰 부피의 효소 20 내지 250 유닛에 의해 소화된다. 특정한 제한 효소에 적당한 완충액 및 기질 양은 제조업자에 의해 제공된다. 37℃에서 약 1 시간의 항온처리 시간이 통상적으로 사용되지만, 공급업자의 설명서에 따라 다양할 수 있다. 분해후에는 겔 전기영동을 수행하여 소정의 단편을 분리할 수 있다.
"올리고뉴클레오티드"는 화학적으로 합성될 수 있는 단일 가닥의 폴리데옥시뉴클레오티드 또는 2개의 상보적 폴리데옥시뉴클레오티드 가닥을 의미한다. 그러한 합성 올리고뉴클레오티드는 5' 포스페이트를 전혀 갖고 있지 않으며, 따라서 키나제의 존재 하에 포스페이트를 ATP에 첨가하는 일 없이는 또 다른 올리고뉴클레오티드에 연결되지 않는다.
2개의 핵산 또는 폴리펩티드에 관한 문맥에서 "실질적으로 동일한"이라는 문구는, 공지된 서열 비교 알고리즘 중 하나를 이용하거나 또는 비주얼 검사를 이용하여 측정했을 때, 최대 일치성에 대하여 비교 및 정렬한 경우, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85% 이상의 뉴클레오티드 또는 아미노산 잔기 동일성, 그리고 일부 양태에서 90~95%의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 2개 이상의 서열을 의미한다. 전형적으로, 실질적인 동일성은 약 100개 이상의 잔기의 영역을 초과하여 존재하고, 가장 일반적으로 서열은 약 150~200개 이상의 잔기를 초과하여 실질적으로 동일하다. 일부 실시양태에서, 서열은 암호화 영역의 전체 길이를 초과하여 실질적으로 동일하다. 일부 실시양태에서, 서열은 암호화 영역의 전체 길이를 초과하여 실질적으로 동일하다.
부가적으로 "실질적으로 동일한" 아미노산 서열은, 특히 그러한 치환이 분자의 활성 부위가 아닌 부위에서 발생할 때, 그리고 폴리펩티드가 기본적으로 그 기능적 특성을 보유한다는 것을 조건으로 할 때, 1 이상의 보존적 또는 비보존적 아미노산 치환, 결실 또는 삽입에 의해 기준 서열과 상이한 서열이다. 보존적 아미노산 치환은, 예를 들면 1개의 아미노산을 동일한 부류 중 또 다른 아미노산으로 치환시킨다(예를 들어, 1개의 소수성 아미노산, 예컨대 이소류신, 발린, 류신 또는 메티오닌의 또 다른 아미노산으로의 치환, 또는 1개의 극성 아미노산의 또 다른 아미노산으로의 치환, 예컨대 아르기긴의 리신으로의 치환, 글루탐산의 아스파트산으로의 치환 또는 글루타민의 아스파라긴으로의 치환). 1개 이상의 아미노산은, 예를 들면 데할로게나제 폴리펩티드로부터 결실될 수 있는데, 이것은 생물학적 활성을 현저하게 변경시키는 일 없이 폴리펩티드의 구조를 변형시킨다. 예를 들면, 데할로게나제의 생물학적 활성에 요구되지 않는 아미노 말단 아미노산 또는 카르복실 말단 아미노산이 제거될 수 있다. 본 발명의 변형된 폴리펩티드 서열은 변형된 폴리펩티드 서열을 데할로게나제 기질과 접촉시키는 방법 및 변형된 폴리펩티드가 분석에서 특정 기질의 양을 감소시키는지 또는 기능적 데할로게나제 폴리펩티드와 기질과의 효소 반응의 생물 생성물을 증가시키는지를 결정하는 방법을 비롯한 임의 수의 방법에 의해 데할로게나제 생물학적 활성에 대하여 분석할 수 있다.
본 명세서에 사용된 바와 같이 "단편"이라는 용어는 2개 이상의 상이한 형태(conformation)로 존재할 수 있는 천연 단백질의 일부이다. 단편은 천연 단백질과 동일하거나 실질적으로 동일한 아미노산 서열을 보유할 수 있다. "실질적으로 동일한"이란 표현은 아미노산 서열이 전체가 아니라 대부분이 동일하지만, 관련된 서열의 1 이상의 기능적 활성을 보유한다는 것을 의미한다. 일반적으로, 2 아미노산 서열은 이들이 약 85% 이상 동일한 경우 "실질적으로 동일하다" 또는 "실질적으로 상동성이다" 라는 의미이다. 또한, 천연 단백질로서 상이한 3차원 구조를 보유하는 단편도 포함된다. 이러한 예로는 "프로 형태" 분자, 예컨대 절단에 의해 변형되어 현저하게 보다 높은 활성을 지닌 성숙 효소를 생성시킬 수 있는 낮은 활성 프로단백질이 있다.
"하이브리드화"란 용어는 핵산 가닥이 염기 쌍 형성(pairing)을 통해 상보성 가닥과 접합하는 과정을 의미한다. 하이브리드화 반응은 중요한 특정 서열이 낮은 농도로 존재하고 있는 샘플내에서도 그러한 서열이 확인될 수 있도록 민감하고 선택적일 수 있다. 적당히 엄격한 조건들은, 예를 들면 예비 하이브리드화 용액 및 하이브리드화 용액 내의 염 또는 포름아미드의 농도에 의해, 또는 하이브리드화 온도에 의해 한정될 수 있으며, 해당 기술 분야에 잘 알려져 있다. 특히, 엄격성은 염의 농도를 감소시키거나, 포름아미드의 농도를 증가시키거나, 또는 하이브리드화 온도를 증가시킴으로써 증가될 수 있다.
예를 들면, 높은 정도의 엄격한 조건 하에 하이브리드화는 약 37℃ 내지 42℃에서 약 50% 포름아미드에서 발생할 수 있다. 하이브리드화는 감소된 엄격한 조건 하에 약 30℃ 내지 35℃에서 약 35% 내지 25% 포름아미드에서 발생할 수 있다. 특히, 하이브리드화는 높은 정도의 엄격한 조건 하에 42℃에서 50% 포름아미드, 5X SSPE, 0.3% SDS 및 200 n/ml 전단 및 변성된 연어 정자 DNA에서 발생할 수 있다. 하이브리드화는 상기 설명한 바와 같이 감소된 엄격한 조건 하에 감소된 온도 35℃에서 단지 35% 포름아미드에서 발생할 수 있다. 특정 수준의 엄격성에 상응하는 온도 범위는 중요한 핵산의 퓨린 대 피리미딘의 비율을 계산하고, 따라서 온도를 조정함으로써 더 좁힐 수 있다. 상기 범위 및 조건에 대한 변형예들은 해당 기술 분야에 잘 알려져 있다.
"변이체"라는 용어는 본 발명의 데할로게나제의 생물학적 활성을 여전히 보유하고 있는 각각의 1 이상의 염기 쌍, 코돈, 인트론, 엑손 또는 아미노산 잔기에서 변형된 본 발명의 폴리뉴클레오티드 또는 폴리펩티드를 의미하는 것이다. 또한, 본 발명의 폴리뉴클레오티드 또는 폴리펩티드는 변형된 염기, 예컨대 이노신의 도입에 의해 변형될 수 있다. 부가적으로, 변형예들은 임의로 1회 이상 반복될 수 있다. 변이체는 예를 들면 에러-프론(error-prone) PCR, 셔플링(shuffling), 올리고뉴클레오티드 지정 돌연변이유발법, 어셈블리 PCR, 성 PCR 돌연변이유발법, 생체내돌연변이유발법, 카세트 돌연변이유발법, 순환 앙상블 돌연변이유발버, 지수 앙상블 돌연변이유발버, 부위 지정 돌연변이유발법, 유전자 재어셈블리, GSSM 및 이들의 임의 조합, 순열 또는 반복 과정과 같은 방법들을 비롯한 임의 수의 수단에 의해 생성될 수 있다.
효소는 고도로 민감한 촉매이다. 이것의 특질은 통상의 합성 화학에서 견줄 수 없는 필수적인 입체(stereo-), 위치(regio-) 및 화학(chemo-) 선택성으로 반응을 촉진하는 성능이다. 게다가, 효소는 주목할 정도로 다용도이다. 효소는 유기 용매 중에서 기능을 수행하고, 극도의 pH(예를 들면, 높은 pH 및 낮은 pH), 극도의 온도(예를 들면, 높은 온도 및 낮은 온도) 및 극도의 염도 수준(예를 들면, 높은 염도 및 낮은 염도)에서 작동하며, 천연 생리학적 기질과 구조적으로 관련이 없는 화합물과의 반응을 촉진하도록 조정될 수 있다.
효소는 광범위한 천연 기질 및 비천연 기질에 대하여 반응성이 있으며, 따라서 실질적으로 임의의 유기 납 화합물의 변형을 가능하게 한다. 게다가, 전형적인 화학 촉매와는 달리, 효소는 고도로 거울상(enantio-) 및 위치 선택성이 있다. 효소에 의해 나타나는 고도의 작용기 특이성은 신규한 합성 화합물을 유도하는 합성 순서에서 각 반응의 행로를 유지할 수 있게 한다. 또한, 효소는 성질상 생리학적 기능과 관련이 없는 많은 다양한 반응들을 촉진할 수 있다. 예를 들면, 퍼옥시다제는 과산화수소에 의한 페놀의 산화를 촉진한다. 또한, 퍼옥시다제는 효소의 고유한 기능과 관련이 없는 히드록실화 반응을 촉진할 수 있다. 다른 예로는 폴리펩티드의 붕괴를 촉진하는 프로테아제가 있다. 유기 용액에서, 또한 일부 프로테아제는 효소의 고유한 기능과 관련이 없는 기능을 갖는 아실레이트 당일 수 있다.
본 발명은 효소의 독특한 촉매 특성을 이용한다. 화학적 형질변환에서 생촉매(즉, 정제되거나 미정제된 효소, 죽거나 살아 있는 세포)를 사용하는 것은 일반적으로 특이적 출발 화합물과 반응하는 특정한 생촉매의 동일화가 필요한 반면에, 본 발명은 많은 출발 화합물에 존재하는 작용기에 특이적인 선택된 생촉매 및 반응 조건을 이용한다.
각각의 생촉매는 한가지 작용기 또는 몇가지 관련된 작용기에 특이적이고, 이러한 작용기를 함유하는 많은 출발 화합물과 반응할 수 있다.
생촉매 반응은 단일 출발 화합물로부터 유도체의 집단을 생성시킨다. 이들 유도체는 또 다른 과정의 생촉매 반응으로 처리하여 유도체 화합물의 제2 집단을 생성시킬 수 있다. 최초 화합물의 수천 변형예들은 생촉매 유도화의 각자 반복에 의해 생성시킬 수 있다.
효소는 전형적인 화학 방법을 이용하여 달성하기가 매우 어려운 공정에서 분자의 나머지 부분에 영향을 미치는 일 없이 출발 화합물의 특이적 부위에서 반응한다. 고도의 생촉매 특이성은 라이브러리 내에 속하는 단일 활성 화합물을 확인하는 수단을 제공한다. 상기 라이브러리는 상기 화합물을 생성시키는 데 사용되는 일련의 생촉매 반응, 일명 "생합성 이력"을 특징으로 한다. 생물학적 활성을 위해 라이브러리를 스크리닝하고, 생합성 이력을 추적하는 것은 활성 화합물을 생성시키는 특이적 반응 순서를 확인시켜 준다. 그 반응 순서는 반복되고, 합성된 화합물의 구조가 결정된다. 이러한 양태의 확인은, 다른 합성 및 스크리닝 접근법과는 달리,고정화 기법이 필요하지 않으며, 화합물들은 합성되어 실질적으로 임의 유형의 스크리닝 분석에 의해 용액으로 자유롭게 시험할 수 있다. 작용기에 대한 효소 반응의 고도한 특이성은 생촉매적으로 생성된 라이브러리를 구성하는 특이적 효소 반응을 "트래킹(tracking)"을 허용한다는 점에 유의하는 것이 중요하다.
절차적 단계들 중 많은 단계는 하루에 수천가지 생촉매 반응 및 스크리닝 분석을 가능하게 할 뿐만 아니라 고도의 정밀성 및 재현성을 보장하는 로봇식 자동화를 이용하여 수행한다. 그 결과, 유도체 화합물의 라이브러리는 현행 화학 방법을 이용하면 몇년이 소요되는 일을 몇주만에 처리할 수 있다.(작은 분자를 비롯한 분자의 변형에 대한 추가의 교시내용에 대해서는 본 명세서에 전적으로 참고 인용되어 있는 PCT/US94/09174호를 참조할 수 있다).
한가지 양태에서, 본 발명은 합성 유전자 재어셈블리라고 칭하는 비확률적 방법을 제공하며, 이것은 핵산 형성 블록이 무작위로 셔플링되지 않거나, 연쇄되지 않거나, 또는 키메라화되지 않지만, 비확률적으로 어셈블링된다는 점을 제외하고는, 비확률적 셔플링과 약간 관련이 있다.
합성 유전자 재어셈블리 방법은 셔플링하고자 하는 폴리뉴클레오티드들 사이의 고도한 상동성의 존재에 좌우되지 않는다. 본 발명은 10100이상의 상이한 키메라로 구성된 후손 분자의 라이브러리(또는 세트)를 비확률적으로 발생시키는 데 이용할 수 있다. 생각하건대, 합성 유전자 재어셈블리는 101000이상의 상이한 후손 키메라로 구성된 라이브러리를 생성시키는 데에도 이용할 수 있다.
따라서, 한가지 양태에서, 본 발명은 의도적으로 선택된 전체 어셈블리 순서를 갖는 최종 완성된 키메라 핵산 분자의 세트를 생성시키는 비확률적 방법을 제공하며, 상기 방법은 유용한 상호 양립하는 연결가능한 말단을 갖는 복수개의 특이적 핵산 형성 블록을 의도적으로 생성시키는 단계, 및 이들 핵산 형성 블록을 설계된 전체 어셈블리 순서가 달성되도록 어셈블링시키는 단계로 구성되어 있다.
어셈블링하고자 하는 핵산 형성 블록의 상기 상호 양립하는 연결가능한 말단은 형성 블록을 선결정된 순서로 커플링시키는 것이 가능하다면 이러한 유형의 정렬된 어셈블리에 "유용한" 것으로 간주된다. 따라서, 한가지 양태에서, 핵산 형성 블록이 커플링될 수 있는 전체 어셈블리 순서는 연결가능한 말단의 설계에 의해 특정되고, 1 이상의 어셈블리 단계가 이용된다면, 그때 핵산 형성 블록이 커플링될 수 있는 전체 어셈블리 순서는 또한 어셈블리 단계(들)의 순차적인 순서에 의해 특정된다. 본 발명의 한가지 실시양태에서, 어닐링 어닐링된 형성 파편은 효소, 예컨대 리가제(예, T4 DNA 리가제)로 처리하여 형성 파편의 공유 결합을 달성한다.
또 다른 실시양태에서, 핵산 형성 블록의 설계는 한 세트의 최종 완성된 키메라 핵산 분자를 생성시키기 위한 기재로서 작용하는 한 세트의 선조 핵산 주형의 서열 분석시에 얻어진다. 따라서, 이러한 선조 핵산 주형은 돌연변이시키고자 하는, 즉 키메라화 또는 셔플링하고자 하는 핵산 형성 블록의 설계에 도움을 주는 서열 정보의 공급원으로서 역할을 한다.
한 예시에서, 본 발명은 한 부류의 관련 유전자의 키메라화 및 한 부류의 암호화된 이들의 관련 생성물을 제공한다. 구체적인 예시에서, 암호화된 생성물은 효소이다. 본 발명의 데할로게나제는 본 명세서에 설명된 방법에 따라 돌연변이화될 수 있다.
따라서, 본 발명의 한가지 양태에 따르면, 다수의 선조 핵산 주형의 서열(예, A 군 핵산 서열의 폴리뉴클레오티드)은 1개 이상의 경계점(demarcation point)을 선택하기 위해 정렬되며, 그러한 경계점은 상동 영역에 위치할 수 있다. 상기 경계점은 발생시키고자 하는 핵산 형성 블록의 경계를 선명하게 하는 데 사용할 수 있다. 따라서, 선조 분자에서 확인되고 선택된 경계점은 후손 분자의 어셈블리 내의 잠재적 키메라화 지점으로서 역할을 한다.
전형적으로 유용한 경계점은 2 이상의 선조 주형에 의해 공유되는 상동 영역(1 이상의 상동성 뉴클레오티드 염기로 구성되는 영역)이지만, 경계점은 선조 주형의 1/2 이상, 선조 주형의 2/3 이상, 선조 주형의 3/4 이상, 바람직하게는 선조 주형의 거의 전부에 의해 공유되는 상동 영역일 수 있다. 여전히 유용한 경계점은 선조 주형의 전부에 의해 공유되는 상동 영역인 것이 훨씬 더 바람직하다.
한 실시양태에서, 유전자 재어셈블리 공정은 과도한 라이브러리를 생성시키기 위해 철저하게 수행된다. 환언하면, 핵산 형성 블록의 가능한 모든 순서가 정해진 조합은 최종 완성된 한 세트의 키메라화 핵산 분자로 제공된다. 동시에, 각각의 조합내 어셈블리 순서(즉, 각각 최종 완성된 키메라 핵산의 5'에서 3으로의 서열에서 각 형성 블록의 어셈블리 순서)는 의도적인 것(또는 비확률적인 것)이다. 상기 방법의 비확률적 성질 때문에, 원하지 않은 부산물의 생성 가능성은 크게 감소된다.
또 다른 실시양태에서, 본 발명의 방법은 유전자 재어셈블리 공정이 체계적으로 수행되어, 예를 들면 체계적으로 구획된 라이브러리를, 체계적으로, 예를 들면 하나씩 스크리닝될 수 있는 구획을 지닌 라이브러리로서 생성시킬 수 있다는 점을 제공한다. 환언하면, 본 발명은 순차적으로 단계화된 어셈블리 반응의 선택적이고 적절한 용도와 함께 특이적 핵산 형성 블록의 선택적이고 적절한 용도를 통해, 실험적 설계가 달성될 수 있으며, 여기서 후손 생성물의 특정한 세트는 몇개의 반응 용기 각각에서 제조된다는 점을 제공한다. 이는 수행하고자 하는 체계적 검사 및 스크리닝 절차를 허용한다. 따라서, 이는 매우 큰 다수의 후손 분자를 보다 작은 군으로 체계적으로 검사하는 것을 허용한다.
특히 선조 분자들 중 낮은 수준의 상동성이 존재하는 경우, 매우 유연하지만 철저하며 더구나 체계적인 방식으로 키메라화를 수행하는 성능 때문에, 본 발명은 매우 많은 수의 후손 분자로 이루어진 라이브러리(또는 세트)의 생성을 제공한다. 본 발명의 유전자 재어셈블리의 비확률적 성질 때문에, 생성된 후손 분자는 설계에 의해 선택되는 전체 어셈블리 순서를 갖는 최종 완성된 키메라 핵산 분자의 라이브러리를 포함하는 것이 바람직하다. 특정한 실시양태에서, 상기 생성된 라이브러리는 103이상 내지 101000이상의 상이한 후손 분자 화학종으로 구성된다.
한 양태에서, 설명된 바와 같이 생성된 최종 완성된 한 세트이 키메라 핵산 분자는 폴리펩티드를 암호화하는 폴리뉴클레오티드로 구성된다. 한 실시양태에 따르면, 이러한 폴리뉴클레오티드는 유전자이며, 인공(man-made) 유전자일 수 있다. 또 다른 실시양태에 따르면, 이러한 폴리뉴클레오티드는 유전자 경로이며, 인공 유전자 경로일 수 있다. 본 발명은 본 발명에 의해 생성된 1 이상의 인공 유전자가 인공 유전자 경로, 예컨대(식물을 비롯한) 진핵 유기체에서 작동 가능한 경로 내로 혼입될 수 있다.
또 다른 예시에서, 형성 블록이 발생되는 단계의 합성 특성은 시험관내 공정에서(예를 들어, 돌연변이유발에 의해) 또는 생체내 공정에서(예를 들어, 숙주 유기체의 유전자 스플라이싱 성능을 이용함으로써) 나중에 임의로 제거될 수 있는 뉴클레오티드(예를 들어, 예를 들면 코돈 또는 인트론 또는 조절 서열일 수 있는 1 이상의 뉴클레오티드)의 설계 및 도입을 허용한다. 많은 실예에 있어서, 이들 뉴클레오티드의 도입은 또한 유용한 경계점을 형성하는 잠재적인 이익 이외에도 많은 다른 이유로 바람직할 수 있다.
따라서, 또 다른 실시양태에 따르면, 본 발명은 핵산 형성 블록이 인트론을 도입하는 데 사용될 수 있다는 점을 제공한다. 따라서, 본 발명은 기능성 인트론이 본 발명의 인공 유전자 내로 도입될 수 있음을 제공한다. 또한, 본 발명은 기능성 인트론이 본 발명의 인공 유전자 경로 내로 도입될 수 있음을 제공한다. 따라서, 본 발명은 1(또는 그 이상)의 인공적으로 도입된 인트론(들)을 함유하는 인공 유전자인 키메라 폴리뉴클레오티드의 생성을 제공한다.
따라서, 본 발명은 또한 1(또는 그 이상)의 인공적으로 도입된 인트론(들)을 함유하는 인공 유전자 경로인 키메라 폴리뉴클레오티드의 생성을 제공한다. 상기 인공적으로 도입된 인트론(들)은 천연 인트론이 유전자 스플라이싱에서 기능적으로 작용하는 방식으로 유전자 스플라이싱을 위한 1 이상의 숙주 세포에서 기능적이다.본 발명은 재조합 및/또는 스플라이싱을 위해 숙주 유기체 내로 도입하고자 하는 인트론 함유 폴리뉴클레오티드를 생성시키는 공정을 제공한다.
본 발명을 이용하여 생성한 인공 유전자는 또한 또 다른 핵산과의 재조합을 위한 기질로서 작용할 수 있다. 마찬가지로, 본 발명을 이용하여 생성시킨 인공 유전자 경로는 또한 또 다른 핵산의 재조합을 위한 기질로서 작용을 할 수 있다. 바람직한 실예에 있어서, 제조합은 인공 인트론 함유 유전자와 핵산 사이의 상동 영역에 의해 또는 그 상동 영역에서 용이하게 이루어지며, 재조합 파트너로서 작용한다. 특히 바람직한 실예에서, 재조합 파트너는 또한 인공 유전자 또는 인공 유전자 경로를 비롯한 본 발명에 의해 생성된 핵산일 수 있다. 제조합은 인공 유전자 내의 1(또는 그 이상)의 인공적으로 도입된 인트론(들)에 존재하는 상동 영역에 의해 용이하게 될 수 있거나 또는 그러한 상동 영역에서 일어날 수 있다.
본 발명의 합성 유전자 재어셈블리 방법은 다수의 핵산 형성 블록을 이용하며, 각각의 형성 블록은 2개의 연결가능한 말단을 갖는 것이 바람직하다. 각 핵산 형성 블록 상의 상기 2개의 연결가능한 말단은 2개의 평활 말단(즉, 각각 제로 뉴클레오티드의 돌출부(overhang)를 갖고 있음), 또는 바람직하게는 1개의 평활 말단 및 1개의 돌출부, 또는 훨씬 더 바람직하게는 2개의 돌출부일 수 있다.
이러한 목적에 유용한 돌출부는 3' 돌출부 또는 5' 돌출부일 수 있다. 따라서, 핵산 형성 블록은 3' 돌출부 또는 대안으로 5' 돌출부를 가질 수 있거나, 또는 대안으로 2개의 3' 돌출부 또는 대안으로 2개의 5' 돌출부를 가질 수 있다. 핵산 형성 블록이 어셈블링되어 최종 완성된 키메라 핵산 분자를 형성하는 전체 순서는의도적인 실험 설계에 의해 결정되고, 무작위로 결정되지 않는다.
한가지 바람직한 실시양태에 따르면, 핵산 형성 블록은 2개의 단일 가닥 핵산(또는 단일 가닥 올리고라고 칭하기도 함)을 화학 합성시키고, 이들 산을 어닐링 처리하여 이중 가닥 핵산 형성 블록을 형성하도록 상기 산들을 접촉시킴으로써 발생된다.
이중 가닥 핵산 형성 블록은 다양한 크기를 가질 수 있다. 이러한 형성 블록의 크기는 작거나 또는 클 수 있다. 형성 블록의 바람직한 크기는 1 염기쌍(임의의 돌출부를 포함하지 않음) 내지 100,000 염기쌍(임의의 돌출부를 포함하지 않음) 범위이다. 다른 바람직한 크기 범위가 또한 제공되는데, 그러한 범위는 하한치가 1 bp 내지 10,000 bp(이들 사이의 모든 정수 값을 포함함)이고, 상한치가 2 bp 내지 100,000 bp(이들 사이의 모든 정수 값을 포함함)이다.
이중 가닥 핵산 형성 블록이 발생될 수 있는 많은 방법이 본 발명에 유용하며, 이 방법은 해당 기술 분야에 잘 알려져 있고, 당업자들에 의해 용이하게 수행될 수 있다.
한 실시양태에 따르면, 이중 가닥 핵산 형성 블록은 먼저 2개의 단일 가닥 핵산을 발생시키고, 이들 가닥을 어닐링하여 이중 가닥 핵산 형성 블록을 형성시킴으로써 생성된다. 이중 가닥 핵산 형성 블록의 2개 가닥은 돌출부를 형성하는 임의의 뉴클레오티드를 제외한 모든 뉴클레오티드에서 상보적일 수 있으므로, 임의의 돌출부(들)를 제외하고는 잘못 형성된 쌍(mismatch)을 전혀 함유하지 않는다. 또 다른 실시양태에 따르면, 이중 가닥 핵산 형성 블록의 2개 가닥은 돌출부를 형성하는 임의의 뉴클레오티드를 제외하고 모든 뉴클레오티드보다 더 적은 뉴클레오티드에서 상보적이다. 따라서, 본 실시양태에 따르면, 이중 가닥 핵산 형성 블록은 코돈 축퇴를 도입하는 데 사용할 수 있다. 코돈 축퇴는 본 명세서에 설명된 위치-포화 돌연변이유발법을 이용하거나, 1 이상의 N,N,G/T 카세트를 이용하거나, 또한 대안으로 1 이상의 N,N,N-카세트를 이용하여 도입한다.
본 발명의 생체내 재조합 방법은 특이적 폴리뉴클레오티드 또는 서열의 알려지지 않은 하이브리드 또는 대립 유전자 풀 상에서 맹검적으로 수행할 수 있다. 그러나, 특정 폴리뉴클레오티드의 실질적인 DNA 또는 RNA 서열을 반드시 알 필요는 없다.
유전자의 혼합된 집단에 속하는 재조합을 이용하는 접근법은 임의의 유용한 단백질, 예를 들면 인터류킨 I, 항체, tPA 및 성장 호르몬의 생성에 유용할 수 있다. 이러한 접근법은 변경된 특이성 또는 활성을 갖는 단백질을 발생시키는 데 이용할 수 있다. 또한, 상기 접근법은 하이브리드 핵산 서열, 예를 들면 프로모터 영역, 인트론, 엑손, 인핸서 서열, 유전자의 31 미번역된 영역 또는 51 미번역된 영역의 생성에 유용할 수 있다. 따라서, 이러한 접근법은 증가된 발현 속도를 갖는 유전자를 생성시키는 데 이용할 수 있다. 또한, 이러한 접근법은 반복적인 DNA 서열의 연구에 유용할 수도 있다. 최종적으로, 이러한 접근법은 리보자임 또는 엡타머를 돌연변이시키는 데 유용할 수 있다.
한 양태에서, 본 명세서에 설명된 발명은 고도로 복잡한 선형 서열, 예컨대 DNA, RNA 또는 단백질 완전 재조합의 유도된 분자 진화를 허용하는 복원적 재분류,재조합 및 선택의 반복된 사이클의 용도에 관한 것이다.
분자의 생체내 셔플링은 변이체를 제공하는 데 유용하고, 세포의 천연 특성을 이용하여 다량체를 제조합함으로써 수행할 수 있다. 생체내 재조합이 분자 다양성에 대한 주요 천연 경로를 제공하지만, 유전자 재조합은 1) 상동성을 인지하는 단계, 2) 재조합 키아즈마의 생성을 유도하는 가닥 절단, 가닥 침입 및 물질대사 단계 및 3) 키아즈마를 불연속 재조합된 분자로 분해하는 단계를 포함하는 비교적 복잡한 방법에 여전히 유지되고 있다. 키아즈마의 형성은 상동성 서열을 인지하는 것이 필요하다.
또 다른 실시양태에서, 본 발명은 적어도 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드로부터 하이브리드 폴리뉴클레오티드를 생성시키는 방법을 포함한다. 본 발명은 하나 이상의 부분 서열 상동성 영역(예를 들어, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 31, 33, 35, 37, 43, 45, 47 및 이들의 조합)에서 공유하는 적어도 제1 뉴클레오티드 및 제2 뉴클레오티드를 적당한 숙주 세포 내로 도입함으로써 하이브리드 폴리뉴클레오티드를 생성시키는 데 이용할 수 있다. 부분 서열 상동성 영역은 하이브리드 폴리뉴클레오티드를 생성시키는 서열 인지를 유도하는 공정을 촉진한다. 본 명세서에 사용된 바와 같이, "하이브리드 폴리뉴클레오티드"라는 용어는 본 발명의 방법으로부터 형성되고 2 이상의 최초 폴리뉴클레오티드 서열로부터 유래한 서열을 함유하는 임의의 뉴클레오티드 서열이다. 이러한 하이브리드 폴리뉴클레오티드는 DNA 분자들 간의 서열 통합을 촉진하는 분자간 재조합 이벤트로부터 형성될 수 있다. 게다가, 그러한 하이브리드 폴리뉴클레오티드는 반복된 서열을 이용하여 DNA 분자 내부의 뉴클레오티드 서열을 변경시키는 분자간 복원적 재분류 공정으로부터 형성될 수 있다.
본 발명은 생물학적 활성 하이브리드 폴리펩티드(예를 들면, 하이브리드 할로알칸 데할로게나제)를 암호화할 수 있는 하이브리드 폴리뉴클레오티드를 생성시키는 수단을 제공한다. 한 양태에서, 최초 폴리뉴클레오티드는 생물학적 활성 폴리펩티드를 암호화한다. 본 발명의 방법은 형성된 하이브리드 폴리뉴클레오티드가 최초 생물학적 활성 폴리펩티드로부터 유도된 활성을 입증하는 폴리펩티드를 암호화하도록 최초 폴리뉴클레오티드의 서열을 통합하는 세포 과정을 이용함으로써 신규한 하이브리드 폴리펩티드를 생성시킨다. 예를 들면, 최초 폴리뉴클레오티드는 상이한 미생물로부터 특정 효소를 암호화할 수 있다. 하나의 유기체 또는 변형물로부터 유래한 제1 폴리뉴클레오티드에 의해 암호화된 효소는, 예를 들면 특정 환경 조건, 예를 들면 높은 염도 하에서 효과적으로 기능을 수행할 수 있다. 상이한 유기체 또는 변형물로부터 유래한 제2 폴리뉴클레오티드에 의해 암호화된 효소는 상이한 환경 조건, 예컨대 극도로 높은 온도 하에서 효과적으로 기능을 수행할 수 있다. 최초 제1 및 제2 폴리뉴클레오티드로부터 유래한 서열을 함유하는 하이브리드 폴리뉴클레오티드는 상기 최초 폴리뉴클레오티드들에 의해 암호화된 모든 효소의 특성을 나타내는 하나의 효소를 암호화할 수 있다. 따라서, 하이브리드 폴리뉴클레오티드에 의해 암호화된 효소는 제1 및 제2 폴리뉴클레오티드에 의해 암호화된 각각의 효소가 공유하는 환경 조건, 예를 들면 높은 염도 및 극고온 하에서 효과적으로 기능을 수행할 수 있다.
본 발명의 폴리뉴클레오티드에 의해 암호화된 효소로는 하이드롤라제, 데할로게나제 및 할로알칸 데할로게나제가 포함되지만, 이들에 국한되는 것은 아니다. 본 발명의 방법으로부터 형성된 하이브리드 폴리펩티드는 최초 효소에서는 나타나지 않는 특수한 효소 활성을 나타낼 수 있다. 예를 들면, 하이드롤라제 활성을 암호화하는 폴리뉴클레오티드의 재조합 및/또는 복원적 재분류를 수행하면, 하이브리드 폴리뉴클레오티드에 의해 암호화되어 형성된 하이브리드 폴리펩티드는 최초 효소 각각으로부터 얻어지는 특수한 하이드롤라제 활성, 즉 하이드롤라제가 작용하는 결합의 유형 및 하이드롤라제가 기능을 수행하는 온도에 대해 스크리닝될 수 있다. 따라서, 예를 들면, 하이드롤라제는 하이브리드 하이드롤라제를 최초 하이드롤라제와 구별하는 화학적 작용기, 예컨대(a) 아미드(펩티드 결합), 즉 프로테아제,(b) 에스테르 결합, 즉 에스테라제 및 리파제,(c) 아세탈, 즉 글리코시다제와, 예를 들면 하이브리드 폴리펩티드가 기능을 수행하는 온도, pH 또는 염 농도를 확인하기 위해 스크리닝될 수 있다.
최초 폴리뉴클레오티드의 공급원은 개별 유기체("분리체"), 정해진 배지 중에서 성장시킨 유기체의 집합체("농후 배양물") 또는 미배양 유기체("환경 샘플")로부터 분리할 수 있다. 환경 샘플로부터 신규의 생활성체를 암호화하는 폴리뉴클레오티드를 유도하는 데 배양물-비의존성 접근 방법을 이용하는 것이 가장 바람직한데, 그 이유는 미개발된 다양한 생물 자원에 접근할 수 있기 때문이다.
"환경 라이브러리"는 환경 샘플에서 생성되고 적당한 원핵 생물 숙주에서 증식할 수 있는 클로닝 벡터에 보관된 천연 유기체의 집합 게놈을 말한다. 클로닝된DNA는 환경 샘플에서 초기에 직접 추출하기 때문에, 순수 배양물에서 성장할 수 있는 원핵 생물의 작은 분획에 제한되지 않는다. 또한, 그들 샘플에 존재하는 환경 DNA를 표준화함으로써 최초 샘플에 존재하는 모든 종으로부터의 DNA를 더 동일하게 표현할 수 있다. 이것은 우성 종에 비해 여러 차수(several orders) 많은 양으로도 표현되지 않을 수 있는 샘플의 미량 성분들로부터의 중요 유전자의 발견 효율을 극적으로 증가시킬 수 있다.
예를 들면, 1종 이상의 미배양 미생물에서 생성된 유전자 라이브러리의 중요 활성을 스크리닝한다. 중요 생활성 분자를 암호화하는 유망한 경로를 먼저 유전자 발현 라이브러리 형태로 원핵 세포에서 포획한다. 중요 활성을 암호화하는 폴리뉴클레오티드는 그러한 라이브러리에서 분리하여 숙주 세포에 주입한다. 재조합 및/또는 복원적 재배열을 촉진하여 신규하거나 개량된 활성을 가진 유망한 활성 생분자를 생성하는 조건 하에, 상기 숙주 세포를 성장시킨다.
폴리뉴클레오티드를 제조할 수 있는 미생물에는 원핵 미생물, 예컨대 유박테리아(Eubacteria) 및 아르카에박테리아(Archaebacteria)와, 하등 진핵 미생물, 예컨대 진균류, 일부 조류 및 원생 동물이 포함된다. 폴리뉴클레오티드는 환경 샘플에서 분리할 수 있는데, 이 경우 핵산은 유기체를 배양하지 않고 회수할 수도 있고 1종 이상의 배양 유기체로부터 회수할 수도 있다. 일 양태에서, 그러한 미생물은 극한 미생물, 예컨대 호극고온성균, 호냉성균(psychrophiles), 호중저온성균(psychrotrophs), 호염성균, 호압성균 및 호산성균일 수 있다. 극한 미생물에서 분리된 효소를 암호화하는 폴리뉴클레오티드가 특히 바람직하다. 그러한 효소는 육지의 온천 및 심해(深海) 열 분출구의 약 100℃ 이상의 온도에서, 북극해의 0℃ 이하의 온도에서, 사해(Dead Sea)의 포화 염 환경에서, 석탄 퇴적물 및 지열(地熱)성 유황천의 0 정도의 pH에서, 또는 오수 슬러지의 11 이상의 pH에서 작용할 수 있다. 예를 들면, 극한 미생물성 유기체로부터 클로닝 및 발현된 각종 에스테라제 및 리파제는 광범위한 온도 및 pH에 걸쳐 높은 활성을 나타낸다.
이상 설명한 바와 같이 선택 및 분리된 폴리뉴클레오티드를 적당한 숙주 세포에 도입한다. 적당한 숙주 세포는 재조합 및/또는 복원적 재배열을 촉진할 수 있는 임의의 세포이다. 선택된 폴리뉴클레오티드는 적당한 조절 서열을 포함하는 벡터 내에 미리 존재하는 것이 바람직하다. 숙주 세포는 고등 진핵 세포, 예컨대 포유동물 세포, 또는 하등 진핵 세포, 예컨대 효모 세포일 수 있는데, 원핵 세포, 예컨대 박테리아 세포가 바람직하다. 숙주 세포에의 구성물의 도입은 인산칼슘 형질감염법, DEAE-덱스트란 매개 감염법 또는 전기천공법에 의해 수행할 수 있다[Davis 등, 1986].
적당한 숙주의 대표적인 예로서는, 박테리아류 세포, 예컨대 대장균, 스트렙토마이세스(Streptomyces), 살모넬라 타이피미리움(Salmonella typhimurium); 진균류 세포, 예컨대 효모; 곤충 세포, 예컨대 드로소필라 S2(Drosophila S2) 및 스포돕테라 Sf9(Spodoptera Sf9); 동물 세포, 예컨대 CHO , COS 또는 보위스(Bowes) 흑색종; 아데노 바이러스; 및 식물 세포를 들 수 있다. 적당한 숙주의 선택은 본 명세서의 교시 내용으로부터 당업자들의 기술 범위 내에서 이루어질 수 있을 것이다.
재조합 단백질을 발현하는 데 사용될 수 있는 각종 포유동물 세포 배양 시스템과 관련하여, 포유동물 발현 시스템의 예에는 문헌["SV40-transformed simian cells support the replication of early SV40 mutants"(Gluzman, 1981)]에 개시되어 있는 원숭이 신장 아세포의 COS-7 세포주와, 상용성 벡터를 발현할 수 있는 기타 세포주, 예컨대 C127, 3T3, CHO, HeLa 및 BHK 세포주가 포함된다. 포유동물 발현 벡터는 복제 원점, 적합한 프로모터 및 인핸서와, 그리고 임의의 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수용체 부위, 전사 종결 서열 및 5' 양말단 비전사 서열을 포함할 것이다. 필요한 비전사 유전자 요소를 제공하는 데 SV40 접합체에서 유도된 DNA 서열과 폴리아데닐화 부위를 사용할 수 있다.
중요 폴리뉴클레오티드를 함유하는 숙주 세포는 프로모터의 활성화, 형질전환체의 선택 또는 유전자의 증폭을 위해 적당히 변성된 종래의 영양 배지 중에서 배양할 수 있다. 온도, pH 등의 배양 조건은 발현을 위해 선택된 숙주 세포에 대해 이미 사용했던 조건들이며, 그것은 당업자들에게 자명한 사항이다. 이어서 특정 효소 활성을 가진 것으로 확인된 클론의 서열을 결정하여 향상된 활성을 가진 효소를 암호화하는 폴리뉴클레오티드 서열을 확인할 수 있다.
다른 양태에서, 본 발명의 방법은 1종 이상의 오페론 또는 유전자 클러스터 또는 그 일부로부터의 생화학적 경로를 암호화하는 신규의 폴리뉴클레오티드를 생성하는 데 사용할 수 있을 것이다. 예를 들면, 박테리아 및 다수의 진핵 생물은 유전자(이 유전자의 생성물은 관련 과정에 연루됨)를 조절하는 조합 메카니즘을 갖는다. 유전자는 하나의 염색체 상에서 "유전자 클러스터"라고 불리는 구성물 내에 집단화되고, 전체 클러스터의 전사를 개시하는 하나의 프로모터를 비롯한 하나의 조절 서열의 제어 하에 함께 전사된다. 즉, 유전자 클러스터는 통상적으로 그들의 기능 면에서 동일 또는 관련된 인접 유전자들의 그룹이다. 유전자 클러스터에 의해 암호화된 생화학적 경로의 일례는 폴리케타이드(polyketide)이다. 폴리케타이드는 생활성 물질이 극히 농후한 공급원 분자로서, 항생제(예컨대, 테트라사이클린 및 크리트로마이신), 항암제(다우노마이신), 면역억제제(FK506 및 라파마이신), 및 수의용 물질(모넨신)이 포함된다. 다수의 폴리케타이드(폴리케타이드 신타제에 의해 제조된 것)가 치료제로서 유용하다. 폴리케타이드 신타제는 길이와 작용 및 고리화의 패턴이 다른 엄청나게 다양한 탄소 쇄의 생합성에 대해 촉매화 작용을 하는 다기능 효소이다. 폴리케타이드 합성 유전자는 유전자 클러스터에 속하고 폴리케타이드 신타제 중 1종 이상의 유형(유형 I로 표시)은 크기가 큰 유전자와 효소를 갖기 때문에, 이들 유전자/단백질의 유전자 조작 및 시험관내 연구가 복잡하다.
유전자 클러스터 DNA는 다른 유기체에서 분리하여 벡터에, 특히 연결된 유전자 클러스터로부터 검출가능한 단백질 또는 단백질-관련 어레이 활성의 생성을 제어 및 조절할 수 있는 발현 조절 서열을 함유하는 벡터에 연결시킬 수 있다. 외인성 DNA 도입 용량이 의외로 큰 벡터를 사용하는 것은 그러한 유전자 클러스터와 함께 사용하는 데 특히 적합하며, 본 명세서에서는 그 예로서 대장균의 f-인자(또는 수정 인자)를 포함하는 것을 제시한다. 상기한 대장균의 f-인자는 접합 반응 중에 그 자체가 높은 빈도의 전이를 수행하는 플라스미드로서, 혼합 미생물 샘플로부터 DNA 단편, 예컨대 유전자 클러스터를 생성하고 안정적으로 증식시키는 데 이상적이다. 특히 바람직한 실시 양태는 "포스미드(fosmid)"로 불리는 클로닝 벡터, 또는박테리아 인공 염색체(BAC) 벡터를 사용하는 것이다. 이들은 게놈성 DNA의 큰 단편을 안정적으로 통합시킬 수 있는 대장균 f-인자에서 유도된다. 혼합된 미배양 환경 샘플로부터의 DNA와 통합시킬 때, 이것은 안정한 "환경 DNA 라이브러리" 형태의 큰 게놈성 단편을 생성할 수 있게 만든다. 본 발명에 사용하기 위한 다른 유형의 벡터는 코스미드(cosmid) 벡터이다. 코스미드 벡터는 본래 게놈성 DNA의 큰 단편을 클로닝하고 증식시키기 위해 고안된 것이다. 코스미드 벡터로의 클로닝은 샘브룩(Sambrook) 등의 문헌[Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press(1989)]에 상세히 개시되어 있다. 일단 적당한 벡터에 연결되면, 다른 폴리케타이드 신타제 유전자 클러스터를 함유하는 2종 이상의 벡터를 적당한 숙주 세포에 도입시킬 수 있다. 유전자 클러스터에 의해 공유되는 부분 서열 상동성 영역은 서열을 재편성하여 하이브리드 유전자 클러스터를 형성하는 공정을 촉진시킬 것이다. 이어서 최초 유전자 클러스터에서 볼 수 없었던, 신규의 하이브리드 유전자 클러스터의 개량된 활성을 스크리닝할 수 있다.
따라서, 한 구체예에서, 본 발명은 하기(1) 내지(5) 단계에 의해 생물학적 활성 하이브리드 폴리펩티드를 제조하고 그러한 폴리펩티드의 향상된 활성을 스크리닝하는 방법에 관한 것이다:
(1) 작동가능한 결합부에 있는 적어도 제1 폴리뉴클레오티드와 작동가능한 결합부에 있는 제2 폴리뉴클레오티드를 적당한 숙주 세포에 도입하는 단계(상기 적어도 제1 폴리뉴클레오티드와 제2 폴리뉴클레오티드는 부분 서열 상동성을 가진 하나 이상의 영역을 공유함);
(2) 서열 재편성을 촉진하여 작동가능한 결합부에 하이브리드 폴리뉴클레오티드를 형성하는 조건하에서 상기 숙주 세포를 성장시키는 단계;
(3) 상기 하이브리드 폴리뉴클레오티드에 의해 암호화된 하이브리드 폴리펩티드를 발현시키는 단계;
(4) 향상된 생물학적 활성의 확인을 촉진하는 조건하에 상기 하이브리드 폴리펩티드를 스크리닝하는 단계; 및
(5) 상기 하이브리드 폴리펩티드를 암호화하는 폴리뉴클레오티드를 분리하는 단계.
다양한 효소 활성을 스크리닝하는 방법은 당업자들에게 공지되어 있고 본 명세서 전반에서 논의된다. 그러한 방법들은 본 발명의 폴리펩티드 및 폴리뉴클레오티드를 분리할 때 이용할 수 있다.
사용할 수 있는 발현 벡터의 대표적인 예로서는 바이러스 입자, 바큘로바이러스, 파지, 플라스미드, 파지미드, 코스미드, 포스미드, 박테리아 인공 염색체, 바이러스 DNA(예컨대, 백신, 아데노바이러스, 계두 바이러스, 슈도라비에스 및 SV40의 유도체), P1-계 인공 염색체, 효모 플라스미드, 효모 인공 염색체, 및 특정의 중요 숙주에 특이성이 있는 임의의 기타 벡터(예컨대, 바실러스, 아스퍼길러스 및 효모)를 들 수 있다. 즉, 예를 들면 DNA는 폴리펩티드를 발현하는 다양한 발현 벡터 중 어느 하나에 포함될 수 있다. 그러한 벡터들은 염색체성, 비염색체성 및 합성 DNA 서열을 포함한다. 다수의 적합한 벡터가 당업자들에게 공지되어 있고, 시판되고 있다. 그 예로서 하기의 벡터들을 제시한다: 박테리아성 - pQE벡터(Qiagen), pBluescript 플라스미드, pNH 벡터, 람다-ZAP 벡터(Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T(Pharmacia); 진핵성 - pXT1, pSG5(Stratagene), pSVK3, pBPV, pMSG, pSVLSV40(Pharmacia). 그러나, 숙주 내에서 발현가능하고 생육가능한 것인 한 임의의 다른 플라스미드 또는 다른 벡터를 사용할 수 있다. 낮은 사본 수 또는 높은 사본 수의 벡터를 본 발명에 사용할 수 있다.
발현 벡터의 DNA 서열을 적당한 발현 대조 서열(들)(프로모터)에 작동가능하게 연결하여 RNA 합성을 유도한다. 특별히 명명된 박테리아성 프로모터에는lacI, lacZ, T3, T7, gpt, lambd P R , P L trp가 포함된다. 진핵성 프로모터에는 직초기 CMV, HSV 티미딘 키나제, 초기 및 말기 SV40, 레트로바이러스로부터의 LTRs, 및 마우스 메탈로티오네인-I이 포함된다. 적당한 벡터와 프로모터의 선택은 당업자들의 기술 상식에 해당하는 것이다. 발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위와 전사 종결기를 함유한다. 벡터는 또한 발현을 증폭시키는 데 적당한 서열을 포함할 수 있다. 프로모터 영역은 클로람페니콜 트랜스퍼라제(CAT) 벡터 또는 선택성 표지를 가진 다른 벡터를 사용하는 임의의 바람직한 유전자로부터 선택될 수 있다. 또한, 발현 벡터는 형질전환된 숙주 세포의 선택을 위한 표현형, 예컨대 진핵 세포 배양의 경우 디히드로폴레이트 리덕타제 또는 네오마이신 내성, 또는 대장균의 경우 테트라사이클린 또는 암피실린 내성을 제공하는 1종 이상의 선택성 표지 유전자를 함유하는 것이 바람직하다.
시험관내 재배열은, 박테리아에서는 일반적으로 "RecA-의존성" 현상으로 보이는 "재조합"으로 통칭되는 "분자간" 방법에 초점이 맞추어진다. 본 발명은 서열을 재조합하고 재배열하는 숙주 세포의 재조합 방법, 또는 결실에 의해 세포의 유사 반복 서열의 복잡성을 감소시키는 복원적 방법에 대한 세포의 매개 능력에 의존할 수 있다. 이 "복원적 재배열" 방법은 "분자간" RecA-비의존성 방법에 의해 일어난다.
따라서, 본 발명의 다른 양태에서, 복원적 재배열 방법에 의해 신규의 폴리뉴클레오티드가 생성될 수 있다. 이 방법은 연속 서열(최초 암호화 서열)을 함유하는 구성물의 생성 단계, 그것의 적당한 벡터로의 삽입 단계, 그리고 그것의 적당한 숙주 세포로의 연속 도입 단계를 포함한다. 개별 분자 실체의 재배열은 상동성 영역을 가진 구성물의 연속 서열간에서, 또는 유사 반복 유닛간에서 조합적 방법에 의해 일어난다. 재배열 방법은 반복 서열의 복잡성 및/또는 크기를 재조합 및/또는 감소시켜서, 신규의 분자 종을 생성한다. 다양한 처리를 적용하여 재배열 속도를 향상시킬 수 있다. 여기에는 자외선 또는 DNA 손상 화학물질에 의한 처리법, 및/또는 향상된 수준의 "유전자 불안정성"을 표현하는 숙주 세포주의 사용방법이 포함된다. 즉, 재배열 방법은 상동성 재조합 또는 그 자체의 진화를 유도하는 유사 반복 서열의 천연 특성과 관련이 있을 수 있다.
반복 또는 "유사 반복" 서열은 유전자적 불안정성에서 역할을 수행한다. 본 발명에 있어서, "유사 반복체"는 그들의 최초 단위 구조에 제한되지 않는 반복체이다. 유사 반복 단위는 구성물에서 서열의 어레이로서, 즉 유사 서열의 연속 유닛으로서 존재할 수 있다. 일단 연결되면, 연속적 서열 간의 연결부는 실질적으로 보이지 않게 되고, 생성된 구성물의 유사 반복 특성은 분자 수준으로 계속된다. 세포의결실 과정을 수행하여 유사 반복 서열 간에서 작동하는 생성 구성물의 복잡성을 감소시킨다. 유사 반복 단위는 미끄러짐 현상(slippage event)가 일어날 때 실질적으로 무제한적인 주형 목록을 제공한다. 따라서 유사 반복체를 함유하는 구성물은 유사 반복 유닛 내 어디에서라도 실질적으로 결실(및 가능한 경우, 삽입)이 일어날 수 있는 충분한 분자 분해성을 효과적으로 제공한다.
유사 반복 서열이 모두 동일 배향으로, 예컨대 머리-꼬리 또는 그 반대로 연결되는 경우, 세포는 개별 유닛들을 구별할 수 없다. 따라서, 복원적 방법은 서열 전반에 걸쳐 일어날 수 있다. 반대로, 예컨대 유닛이 머리-꼬리가 아니라 머리-머리로 존재하는 경우, 반전은 인접 유닛의 말단점을 묘사하므로 결실 형성은 분리된 유닛의 손실을 촉진할 것이다. 즉, 본 발명에 의하면 서열은 동일한 배향으로 존재하는 것이 바람직하다. 유사 반복 서열의 무작위 배향은 재배열 효율의 손실을 초래할 것이며, 서열의 일정한 배향은 최대의 효율을 제공할 것이다. 그러나, 동일 배향의 인접 서열의 수가 적으면 효율은 감소하지만, 신규 분자의 효과적 회수를 위한 충분한 순응성은 여전히 제공할 수 있다. 구성물은 높은 효율을 제공하도록 동일 배향의 유사 반복 서열을 갖도록 만들 수 있다.
서열은 하기(a) 내지(c)를 비롯한 다양한 방법 중 어느 것이라도 사용하여 머리-꼬리 배향으로 조립할 수 있다:
(a) 단일 가닥을 만들 때 배향을 제공하는 폴리-A 머리와 폴리-T 꼬리를 포함하는 프라이머를 사용할 수 있다. 이것은 프라이머의 처음 몇 개의 염기를 RNA로부터 만들고 RNAseH를 용이하게 제거함으로써 달성된다.
(b) 특정의 제한 분해 부위를 포함하는 프라이머를 사용할 수 있다. 다수의 부위, 특정 서열의 배터리, 및 반복적 합성 및 연결 단계가 요구된다.
(c) 프라이머의 내부 염기 중 몇 개를 티올화시키고 엑소뉴클레아제를 사용하여 적절히 말단화된 분자를 생성할 수 있다.
재배열 서열의 회수는 감소된 반복성 지수(RI)를 가진 클로닝 벡터의 확인에 의존한다. 재배열된 암호화 서열은 증폭에 의해 회수할 수 있다. 생성물을 재클로닝하여 발현시킨다. 감소된 RI를 가진 클로닝 벡터의 회수는 하기(1) 내지(4)의 방법으로 수행할 수 있다:
(1) 구성물의 복잡성이 감소될 때 안정적으로 유지되는 벡터만을 사용.
(2) 물리적 절차에 의해 짧아진 벡터의 물리적 회수(이 경우에, 클로닝 벡터는 표준 플라스미드 분리 절차를 이용하여 회수하고 표준 절차를 이용하여 아가로스 겔 또는 저분자량 분획을 가진 컬럼으로 크기 분류함).
(3) 삽입물 크기가 감소할 때 선택할 수 있는 비연속성 유전자를 함유하는 벡터의 회수.
(4) 발현 벡터와 적당한 선택에 의한 직접 선택 기술의 이용.
관련 유기체로부터의 암호화 서열(예컨대, 유전자)은 고도의 상동성을 나타낼 수 있고 아주 다양한 단백질 생성물을 암호화할 수 있다. 이러한 유형의 서열은 본 발명에 있어서 유사 반복체로서 특히 유용하다. 그러나, 이하에 예시되는 실시예가 아주 동일한 최초 암호화 서열(유사 반복체)의 재배열을 설명하지만, 이 방법은 그렇게 아주 동일한 반복체에 한정되는 것은 아니다.
하기 실시예는 본 발명의 방법을 설명한다. 세(3) 개의 특이 종에서 유도된 암호화 핵산 서열(유사 반복체)이 개시된다. 각 서열은 구별되는 특성들을 가진 단백질을 암호화한다. 각각의 서열은 서열의 특정 위치에 있는 하나 또는 소수의 염기쌍에 의해 구별된다. 유사 반복 서열은 연결 분자의 집단 내에서 가능한 모든 순열 및 조합이 가능하도록 개별적으로 또는 집합적으로 증폭시키고 무작위 조립체에 연결한다. 유사 반복 단위의 수는 조립 조건에 의해 제어할 수 있다. 구성물 내의 유사 반복 단위의 평균 수는 반복성 지수(RI)로서 정의된다.
형성되면, 구성물은 공지된 프로토콜에 따라 아가로즈 겔에서 크기 분류하거나 크기 분류하지 않고 클로닝 벡터에 삽입하여 적당한 숙주 세포에 감염시킬 수 있다. 이이서 세포를 증식시키고 "복원적 재배열"를 수행한다. 복원적 재배열 과정의 속도는 필요에 따라 DNA 손상을 도입하여 자극할 수 있다. RI의 감소가 "분자간" 메카니즘에 의해서 반복 서열 간의 결실 형성에 의해 매개되는지, 또는 "분자간" 메카니즘을 통해 재조합 유사 작용에 의해 매개되는지 여부는 중요하지 않다. 최종 결과는 모든 가능한 조합으로의 분자의 재배열이다.
임의로, 이 방법은 결합 능력 또는 상호작용 능력을 가진 셔플링된 개별 라이브러리 요소를 동정하거나, 소정의 거대 분자, 예컨대 프로테인어커스(proteinaccous) 수용체, 올리고사카라이드, 바이론, 또는 기타 소정의 화합물 또는 구성물과의 특정 반응(예컨대, 효소의 촉매적 도메인)을 촉매 작용하는 셔플링된 푸울의 라이브러리 요소를 스크리닝하는 추가의 단계를 포함한다.
그러한 라이브러리로부터 동정되는 폴리펩티드는 치료, 진단, 조사 및 관련목적(예컨대, 촉매, 수용액의 삼투 몰농도를 증가시키는 용질 등)에 사용할 수 있고/있거나, 1 사이클 이상의 추가의 셔플링 및/또는 선택을 수행할 수 있다.
다른 양태에서, 재조합 또는 재배열 전에 또는 도중에, 본 발명의 방법에 의해 생성된 폴리뉴클레오티드는 최초 폴리뉴클레오티드로의 돌연변이의 도입을 촉진하는 시약 또는 방법으로 처리할 수 있다. 그러한 돌연변이의 도입은 생성되는 하이브리드 폴리뉴클레오티드 및 그것으로부터 암호화된 폴리펩티드의 다양성을 증가시킨다. 돌연변이를 촉진하는 시약 또는 방법에는(+)-CC-1065 또는 합성 유사체, 예컨대(+)-CC-1065-(N3-아데닌(참조: Sun and Hurley(1992)); DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화 4'-플루오로-4-아미노비페닐 부가물(참조: 예컨대, van de Poll 등(1992)); 또는 DNA 합성을 억제할 수 있는 N-아세틸화 또는 탈아세틸화된 4-아미노비페닐 부가물(참조: van de Poll 등(1992), pp. 751-758); 3가 크롬, 3가 크롬염, DNA 복제를 억제할 수 있는 다환식 방향족 탄화수소(PAH) DNA 부가물, 예컨대 7-브로모메틸-벤즈[α]안트라센("BMA"), 트리스(2,3-디브로모프로필)포스페이트("트리스-BP"), 1,2-디브로모-3-클로로프로판("DBCP"), 2-브로모아크롤레인(2BA), 벤조[α]피렌-7,8-디히드로디올-9-10-에폭사이드("BPDE"), 백금(II) 할로겐 염, N-히드록시-2-아미노-3-메틸이미다조[4,5-f]-퀴놀린("N-히드록시-IQ"), 및 N-히드록시-2-아미노-1-메틸-6-페닐이미다조[4,5-f]-피리딘("N-히드록시-PhIP")를 들 수 있는데, 이들에 한정되는 것은 아니다. PCR 증폭을 느리게 하거나 중지시키는 데 특히 바람직한 수단은 UV광(+)-CC-1065 및(+)-CC-1065-(N3-아데닌)으로 구성된다. 특히 바람직한 수단은 DNA 부가물 또는 폴리뉴클레오티드 또는 폴리뉴클레오티드 푸울로부터의 DNA 부가물을 포함하는 폴리뉴클레오티드이며, 이것은 추가의 처리 전에 폴리뉴클레오티드를 포함하는 용액을 가열하는 것을 비롯한 방법으로 방출 또는 제거할 수 있다.
또 다른 양태에서, 본 발명은 야생형 단백질을 암호화하는 이중 가닥 주형 폴리뉴클레오티드를 포함하는 샘플을 하이브리드 또는 재배열 폴리뉴클레오티드의 생성을 제공하는 본 발명에 의한 조건하에 처리하여 생물학적 활성을 가진 재조합 단백질을 제조하는 방법에 관한 것이다.
본 발명은 또한, 전 범위의 단일 아미노산 치환이 각 아미노산 위치(유전자 부위 포화 돌연변이유발법(GSSM))에서 표현되는 한 그룹의 후손 폴리뉴클레오티드를 생성하도록 폴리뉴클레오티드에 점 돌연변이를 도입하는 데 독점 코돈 프라이머(축퇴성 N,N,N 서열 함유)를 사용하는 방법을 제공한다. 사용된 올리고는 제1 상동성 서열, 축퇴성 N,N,N 서열, 및 바람직하나 필수적인 것은 아닌 제2 상동성 서열을 연속적으로 포함한다. 그러한 올리고를 사용하여 얻은 하류 후손 번역 생성물은, N,N,N 서열의 축퇴성이 20개의 아미노산 모두에 대한 코돈을 포함하기 때문에, 폴리펩티드를 따라 각 아미노산 부위에서 가능한 모든 아미노산 변화를 포함한다.
한 양태에서, 선조 폴리뉴클레오티드 주형 내의 최초 코돈 각각에 대해 전 범위의 코돈 치환을 수행하는 데 그러한 축퇴성 올리고 중 하나(하나의 축퇴성 N,N,N 카세트를 포함)를 사용한다. 다른 양태에서, 선조 폴리뉴클레오티드 주형 내의 최초 코돈 2개 이상에 대해 전 범위의 코돈 치환을 수행하는 데 동일한 올리고또는 동일하지 않은 올리고의 적어도 2개의 축퇴성 N,N,N 카세트를 사용한다. 즉, 하나 이상의 부위에 아미노산 돌연변이를 도입하기 위한 하나의 올리고에는 하나 이상의 N,N,N 서열이 함유될 수 있다. 이러한 복수의 N,N,N 서열은 직접 인접할 수도 있고, 하나 이상의 추가의 뉴클레오티드 서열(들)에 의해 분리될 수도 있다. 또 다른 양태에서, 첨가 및 결실을 도입할 수 있는 올리고는 아미노산 첨가, 결실 및/또는 치환의 임의의 조합 또는 순열을 도입하는 데 단독으로 사용되거나 N,N,N 서열을 함유하는 코돈과 병용될 수 있다.
구체적인 예에 있어서, 인접 N,N,N 트리플릿, 즉 축퇴성(N,N,N)n서열을 함유하는 올리고를 사용하여 2개 이상의 인접 아미노산 위치를 연속적으로 돌연변이시킬 수 있다.
다른 양태에서, 본 발명은 N,N,N 서열보다 축퇴성이 낮은 변성 카세트를 사용하는 방법을 제공한다. 예를 들면, 경우에 따라(예컨대, 올리고에) 하나의 N만을 포함하는 축퇴성 트리플릿 서열을 사용하는 것이 바람직할 수 있는데, 그 N은 트리플릿의 제1, 제2 및 제3 위치에 존재할 수 있다. 그들의 임의의 조합 및 순열을 포함하는 임의의 다른 염기를 트리플릿의 나머지 두 위치에 사용할 수 있다. 또한, 경우에 따라(예컨대, 올리고에) 축퇴성 N,N,N 트리플릿 서열, N,N,G/T 또는 N,N,G/C 트리플릿 서열을 사용하는 것이 바람직할 수 있다.
그러나, 본 발명에 개시한 바와 같이 축퇴성 트리플릿(예컨대, N,N,G/T 또는 N,N,G/C 트리플릿 서열)을 사용하는 것은 여러 가지 이유에서 유리한 것으로 생각된다. 한 양태에서, 본 발명은 폴리펩티드의 각각의 모든 아미노산 위치에 모든 범위의 가능한 아미노산(총 20개의 아미노산에 대해)의 치환을 체계적이고도 아주 용이하게 발생시키는 수단을 제공한다. 즉, 100개의 아미노산 폴리펩티드에 대해, 본 발명은 2000개의 분리된 종(즉, 100개의 아미노산 위치마다 20개의 가능한 아미노산)을 체계적이고도 아주 용이하게 형성한다. 축퇴성 N,N,G/T 또는 N,N,G/C 트리플릿 서열을 함유하는 올리고의 사용을 통해 20개의 가능한 아미노산을 암호화하는 32개의 개별 서열을 제공하는 것으로 생각된다. 즉, 그러한 하나의 올리고를 사용하여 선조 폴리뉴클레오티드 서열을 포화 돌연변이시키는 반응 용기 내에서, 20개의 분리된 폴리펩티드를 암호화하는 32개의 분리된 후손 폴리뉴클레오티드가 생성된다. 이에 반해, 부위-유도 돌연변이에 비축퇴성 올리고를 사용하면 반응 용기당 단 하나의 후손 폴리펩티드 생성물이 생성된다.
본 발명은 또한 개시된 축퇴성 프라이머와 임의로 병용할 수 있는 비축퇴성 올리고의 사용 방법을 제공한다. 경우에 따라, 연구 대상 폴리뉴클레오티드에서 특정 점 돌연변이를 발생시키는 비축퇴성 올리고를 사용하는 것이 유리할 것으로 생각된다. 이것은 특정의 침묵 점 돌연변이, 상응하는 아미노산 변화를 유도하는 점 돌연변이, 및 정지 코돈의 생성 및 폴리펩티드 단편의 상응하는 발현을 일으키는 점 돌연변이를 발생시키는 수단을 제공한다.
즉, 본 발명의 바람직한 구체예에서, 각 포화 돌연변이 반응 용기는 20개의 모든 아미노산이 선조 폴리뉴클레오티드에서 돌연변이된 코돈 위치에 대응하는 하나의 특정 아미노산 위치에 표현되도록 20개 이상의 후손 폴리펩티드 분자를 암호화하는 폴리뉴클레오티드를 함유한다. 각 포화 돌연변이 반응 용기에서 생성된 32배의 축퇴성 후손 폴리펩티드에 대해 클로날 증폭(예컨대, 발현 벡터를 사용하는 적당한 대장균 숙주에 클로닝시킴) 및 발현 스크리닝을 수행할 수 있다. 개별 후손 폴리펩티드가 스크리닝에 의해 특성상의 양호한 변화를 나타내는 것으로 확인되는 경우(선조 폴리펩티드와 비교할 때), 그것을 서열화하여 그것에 함유된 상응하는 양호한 아미노산 치환을 확인할 수 있다.
본 명세서에 개시된 바와 같이 포화 돌연변이를 사용하여 선조 폴리펩티드의 각각의 모든 아미노산 위치를 돌연변이시킬 때, 양호한 아미노산 변화는 하나 이상의 아미노산 위치에서 확인될 수 있다. 이들 양호한 아미노산 치환의 전부 또는 일부의 조합을 함유하는 하나 이상의 새로운 후손 분자가 생성될 수 있다. 예를 들면, 하나의 폴리펩티드의 3개의 아미노산 위치 각각에서 2개의 양호한 특정 아미노산 변화가 확인되면, 순열은 3개의 위치 각각에 대해 3개의 가능성(최초 아미노산으로부터의 비변화, 및 2개의 바람직한 변화)을 포함한다. 즉, 이미 시험된 것 7개, 즉 6개의 단일 점 돌연변이(즉, 3개의 위치 각각에서 2개씩)와 임의의 위치에서의 비변화를 포함하여 3×3×3, 즉 총 27개의 가능성이 존재한다.
다른 실시 양태에서, 부위 포화 돌연변이는 스크리닝과 함께 셔플링, 키메라화, 재조합 및 다른 돌연변이 기법을 함께 사용할 수 있다. 본 발명은 반복 방식의 포화 돌연변이를 비롯한 임의의 돌연변이 기법(들)의 사용 방법을 제공한다. 일례에서, 임의의 돌연변이 기법(들)의 반복 사용은 스크리닝과 함께 사용된다.
즉, 본 발명은 추가의 돌연변이 기법과 조합된 포화 돌연변이 기법의 사용 방법, 예컨대 재조합 및 복원적 재배열에 의해 하이브리드 폴리뉴클레오티드가 생성되도록 2 이상의 관련 폴리뉴클레오티드를 적당한 숙주 세포에 도입시키는 방법을 제공하나, 본 발명이 이것에 한정되는 것은 아니다.
유전자의 전체 서열을 따라 돌연변이 기법을 수행하는 것 외에, 본 발명은 폴리뉴클레오티드 서열에서 임의의 수의 염기 각각을 치환하는 데 사용할 수 있는 돌연변이유발법을 제공하는데, 돌연변이시킬 염기의 수는 15 내지 100,000의 모든 정수가 바람직하다. 즉, 분자를 따라 모든 위치에서 돌연변이를 유발시키기보다는, 모든 또는 분리된 수의 염기(바람직하게는 총 15 내지 100,000의 부분 세트)를 돌연변이시킬 수 있다. 폴리뉴클레오티드 서열을 따라 각 위치 또는 위치 그룹을 돌연변이시키는 데 별개의 뉴클레오티드를 사용하는 것이 바람직하다. 돌연변이시킬 3 위치로 이루어진 한 개의 그룹은 하나의 코돈일 수 있다. 돌연변이는 돌연변이 카세트라고도 불리는 이종성 카세트를 함유하는 돌연변이유발성 프라이머를 사용하여 도입시키는 것이 바람직하다. 바람직한 카세트는 1 내지 500개의 염기를 가질 수 있다. 그러한 이종성 카세트의 각 뉴클레오티드 위치는 N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G 또는 E이고, 여기서 E는 A, C, G 또는 T가 아닌 임의의 염기이다(E는 디자이너 올리고라고도 칭할 수 있음).
일반적으로, 포화 돌연변이유발법은 돌연변이시키고자 하는 소정의 폴리뉴클레오티드 서열(여기서, 돌연변이시키고자 하는 서열은 약 15 내지 100,000개의 염기 길이를 갖는 것이 바람직함)에서 돌연변이 카세트의 전 세트(여기서, 각 카세트는 약 1 내지 500개의 염기 길이를 갖는 것이 바람직함)를 돌연변이시키는 것을 포함한다. 즉, 하나의 돌연변이 그룹(1 내지 100개 범위의 돌연변이)을 돌연변이시키고자 하는 각 카세트에 도입시킨다. 하나의 카세트에 도입시키고자하는 하나의 돌연변이 그룹은 1 주기의 포화 돌연변이 기법의 적용 중에 제2 카세트에 도입시키고자 하는 제2 돌연변이 그룹과 동일 또는 상이할 수 있다. 그러한 그룹의 예는 결실, 첨가, 부분 코돈의 그룹 및 특정 뉴클레오티드 카세트의 그룹이다.
돌연변이시키고자 하는 소정의 서열은 전 유전자, 경로, cDNA, 전 오픈 리딩 프레임(ORF), 전 프로모터, 인핸서, 리프레서/트랜스액티베이터, 복제 원점, 인트론, 오퍼레이터, 또는 임의의 폴리뉴클레오티드 작용기를 포함한다. 일반적으로, 이러한 목적의 "소정의 서열"은 15개의 염기-폴리뉴클레오티드 서열과 15 내지 15,000개의 염기 길이를 가진 폴리뉴클레오티드 서열(본 발명은 그 사이의 모든 정수에 대해 구체적으로 명명함) 중 어떤 폴리뉴클레오티드라도 좋다. 코돈 그룹을 선택하는 데 고려해야 할 사항에는 축퇴성 돌연변이 카세트에 의해 암호화된 아미노산 유형이 포함된다.
돌연변이 카세트에 도입시킬 수 있는 돌연변이 그룹의 특히 바람직한 예에서, 본 발명은 특히 각 위치의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 아미노산을 암호화하는 축퇴성 코돈 치환(축퇴성 올리고 사용)과 그것에 의해 암호화된 폴리펩티드의 라이브러리를 제공한다.
본 발명의 일 양태는 A 군 핵산 서열의 서열 및 그것과 실질적으로 동일한 서열, 그것에 상보적인 서열, 또는 A 군 핵산 서열의 서열(또는 그것에 상보적인 서열) 중 하나의 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개 이상의 연속 염기를 포함하는 단편 중 하나를 포함하는 분리된 핵산이다. 분리된 핵산은 cDNA, 게놈성 DNA, 및 합성 DNA를 비롯한 DNA를 포함할 수 있다. DNA는 이중 가닥 또는 단일 가닥일 수 있으며, 하나의 가닥은 암호화 가닥 또는 비암호화(안티-센스) 가닥일 수 있다. 또한, 분리된 핵산은 RNA를 포함할 수 있다.
상세히 후술하는 바와 같이, A 군 핵산 서열 및 이와 거의 동일한 서열 중 하나의 분리된 핵산은 B 군 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드 중 하나 또는 B 군 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드 중 하나의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 포함하는 단편을 제조하는 데에 사용될 수 있다.
따라서, 본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드 중 하나 또는 B 군 아미노산 서열의 폴리펩티드 중 하나의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 포함하는 단편을 암호하는 분리된 핵산이다. 이들 핵산의 암호화 서열은 A 군 핵산 서열의 핵산 중 하나 또는 이들의 단편의 암호화 서열 중 하나와 동일할 수 있거나, 또는 B 군 아미노산 서열, 이와 거의 동일한 서열의 폴리펩티드 중 하나 및 유전자 암호의 과잉 또는 축퇴의 결과로서, B 군 아미노산 서열의 폴리펩티드 중 하나의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 가지는 단편 중 하나를 암호하는 상이한 암호화 서열일 수 있다. 유전자 암호는 당업자에게 잘 알려져 있으며, 예를 들어, 문헌[B.Lewin, Genes VI, Oxford University Press, 1997]의 214 면에서 얻을 수 있으며, 상기 문헌은 본원에 참고문헌으로 인용되어 있다.
B 군 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드 중 하나를 암호하는 분리된 핵산은 단지 A 군 핵산 서열 및 이와 거의 동일한 서열의 암호화 서열 및 리더 서열 또는 프로프로테인 서열과 같은 추가적인 암호화 서열 및 암호화 서열의 인트론 또는 비-암호화 서열 5' 및/또는 3'과 같은 비 암호화 서열을 포함하지만, 이에 제한되지는 않는다. 따라서, 본원에서 사용되는 바와 같이, "폴리펩티드를 암호화하는 폴리뉴클레오티드"는 폴리펩티드의 암호화 서열 만을 포함하는 폴리뉴클레오티드 뿐 아니라 추가적인 암호화 및/또는 비암호화 서열을 포함하는 폴리뉴클레오티드를 포함한다.
대안적으로, A 군 핵산 서열 및 이와 거의 동일한 서열의 핵산 서열은 통상의 기술, 예를 들어, 부위 지정 돌연변이유발법, 또는 기타 당업자에게 익숙한 기술을사용하여 돌연변이유발시켜 A 군 핵산 서열 및 이와 거의 동일한 서열의 폴리뉴클레오티드에 침묵 변화(silent change)를 도입시킬 수 있다. 본원에서 "침묵 변화"는 예를 들어, 폴리뉴클레오티드에 의해 암호화되는 아미노산을 변경하지 않는 변화를 포함한다. 이러한 변화는 숙주 유기체에서 자주 발생하는 코돈 또는 코돈 쌍들을 도입함으로써 폴리펩티드를 암호화하는 벡터를 포함하는 숙주 세포에 의해 생산된 폴리펩티드의 레벨을 증가시키기 위하여 바람직할 것이다.
본 발명은 또한 B 군 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드에서 아미노산 치환, 추가, 결실, 융합 및 절두를 가져오는 뉴클레오티드의 변화가 있는 폴리펩티드에 관한 것이다. 상기 뉴클레오티드의 변화는 부위 지정 돌연변이유발법, 무작위 화학적 돌연변이유발법, 엑소뉴클레아제 III 결실 및 기타 재조합 DNA 기법과 같은 기법을 사용하여 도입될 수 있다. 대안적으로, 상기 뉴클레오티드 변화는 A 군 핵산 서열 및 이와 거의 동일한 서열(또는 이와 상보적인 서열)의 서열 중 하나의 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개 이상의 연속 염기를 포함하는 프로브와, 본원에서 제공된 바와 같은 높은 정도, 중간 정도, 또는 낮은 정도의 엄격성 조건하에서 특이적으로 하이브리드화하는 핵산을 동정함으로써 분리되는 자연발생적 대립 유전자 변이체가 될 수 있다.
A 군 핵산 서열 및 이와 거의 동일한 서열, 이에 상보적인 서열 또는 A 군 핵산 서열 및 이와 거의 동일한 서열, 이에 상보적인 서열 중 하나의 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개 이상의 연속 염기를 포함하는 단편의 분리된 핵산은 생물학적 샘플, 예컨대 토양 샘플이 본 발명의 핵산 서열을 보유하는 유기체 또는 핵산이 수득되는 유기체를 함유하는지 여부를 판단하기 위한 프로브로서 사용될 수도 있다. 상기 공정에서, 핵산이 분리된 유기체를 잠정적으로 보유하고 있는 생물학적 샘플이 얻어지며 핵산은 샘플로부터 얻어진다. 상기 핵산은 프로브를 핵산에 존재하는 임의의 상보적인 서열에 특이적으로 하이브리드하도록 하는 조건하에서 프로브와 접촉시킨다.
필요하다면, 프로브를 상보적인 서열에 특이적으로 하이브리드화하는 조건은 상보적인 서열을 함유하는 것으로 알려진 샘플의 상보적인 서열 및 상보적인 서열을 포함하지 않는 대조 서열과 접촉하도록 프로브를 위치시켜 판단할 수 있다. 하이브리드화 완충액의 염 농도, 하이브리드화 완충액의 포름아미드 농도, 또는 하이브리드화 온도와 같은 하이브리드화 조건은 프로브를 상보적인 핵산에 특이적으로 하이브리드화 하도록 하는 조건을 동정하기 위해 변화될 수 있다.
샘플이 핵산이 분리된 유기체를 포함한다면, 프로브의 특이적 하이브리드화가 검출될 것이다. 하이브리드화는 프로브를 방사성 동위원소, 형광 염료 또는 검출가능한 생성물의 형성을 촉매할 수 있는 효소와 같은 검출가능한 시약으로 표지함으로써 검출할 수 있다.
샘플 중의 상보적인 핵산의 존재를 검출하기 위한 표지된 프로브의 다수의 사용 방법은 당업자에게 익숙하다. 이들은 서던 블롯, 노던 블롯, 콜로니 하이브리드화 방법 및 돗 블롯을 들 수 있다. 이들 각각의 방법의 프로토콜은 Ausubel 등,Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc.(1997) 및 Sambrook 등,Molecular Clonng: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press(1989)에서 제공되며, 전체가 본원에 참고문헌으로 인용된다.
대안적으로, 1 이상의 프로브(핵산 샘플에 존재하는 임의의 상보적인 서열에 특이적으로 하이브리드화할 수 있는 것 중 1 이상)는 증폭 반응에서 사용되어 샘플이 본 발명의 핵산 서열을 포함하는 유기체(예컨대, 핵산이 분리된 유기체)를 포함하는 지 여부를 판단할 수 있다. 통상, 프로브는 올리고뉴클레오티드를 포함한다. 한 태양에서, 증폭 반응은 PCR 반응을 포함한다. PCR 프로토콜은 Ausubel 및 Sambrook(상동)에서 기재하고 있다. 대안적으로, 증폭은 리가제 연쇄반응, 3SR 또는 표준 이동 반응을 포함한다. Branny,F., "The Ligase Chain Reaction in a PCRWorld",PCR Methods and Applications 1:5-16,1991; E.Fahy 등., "Self-sustained Sequence Replication(3SR): An Isothermal Transcription-based Amplication System Alternative to PCR",PCR Methods and Applications 1:25-33,1001; 및 Walker G.T.등, "Strand Displacement Amplication-an Isothermalin vitroDNA Amplication Technique",Nucleic Acid Research20:1691-1696,1992,를 참조하라, 상기 문헌은 본원에 참고문헌으로 인용되어 있다. 상기 공정들에서, 샘플 중의 핵산은 프로브와 접촉시키고 증폭 반응을 수행한 후 임의의 생성된 증폭 생성물을 검출한다. 증폭 생성물은 반응 생성물 상에서 겔 전기영동을 수행하고 겔을 에티듐 브로마이드와 같은 인터컬레이터(interculator)로 염색하여 검출할 수 있다 대안적으로, 1 이상의 프로브는 방사성 동위원소로 표지시킬 수 있으며, 방사성 증폭 생성물의 존재는 겔 전기영동 후 방사능사진법으로 검출할 수 있다.
A 군 핵산 서열 및 이와 거의 동일한 서열의 서열 말단 가까이의 서열로부터 유래된 프로브는 A 군 핵산 서열 및 이와 거의 동일한 서열의 서열에 인접하게 위치된 게놈 서열을 포함하는 클론을 동정하기 위한 염색체 워킹법(chromosome walking procedure)에 사용될 수도 있다. 이러한 방법은 숙주 유기체로부터 추가의 단백질을 암호화하는 유전자의 분리를 가능하게 한다.
A 군 핵산 서열 및 이와 거의 동일한 서열, 이와 상보적인 서열 또는 A 군 핵산 서열 및 이와 거의 동일한 서열 또는 이와 상보적인 서열의 서열 중 하나의 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 또는 500개 이상의 연속 염기를 포함하는 단편의 분리된 핵산은 관련된 핵산을 동정하고 분리하기 위한 프로브로서 사용될 수 있다. 일부 태양에서, 관련된 핵산은 핵산이 분리된 것과는 다른 유기체로부터의 cDNA 또는 게놈 DNA일 수 있다. 예를 들어, 다른 유기체는 관련된 유기체일 수도 있다. 상기 공정에서, 핵산 샘플은 프로브가 관련 서열에 특이적으로 하이브리드하도록 하는 조건하에서 프로브와 접촉시킨다. 관련된 유기체로부터의 핵산에 대한 프로브의 하이브리드화는 임의의 전술한 방법을 사용하여 검출된다.
핵산 하이브리드화 반응에서, 특정 수준의 엄격성을 달성하기 위하여 사용된 조건은 하이브리드화 될 핵산의 성질에 따라 달라질 수 있다. 예를 들어, 핵산의 하이브리드화 영역의 길이, 상보성 정도, 뉴클레오티드 서열 조성(예를 들어, GC 대 AT 함량) 및 핵산형(예를 들어, RNA 대 DNA)은 하이브리드화 조건을 선택하는 데에 고려될 수 있다. 추가적인 고려 사항은 핵산 중 하나가 예컨대 여과기 상에 고정되었는지 여부이다.
하이브리드화는 낮은 정도의 엄격성, 중간 정도의 엄격성 또는 높은 정도 엄격성 조건하에서 수행될 수 있다. 핵산 하이브리드화의 예로서, 고정화된 변성 핵산을 포함하는 중합체 막을 0.9 M NaCl, 50 mM NaH2PO4, pH7.0, 5.0 mM Na2EDTA, 0.5% SDS, 10X 덴하르트 및 0.5 mg/ml폴리리보아데닐산으로 구성된 용액에서 45℃하에 30분 동안 우선 예비 하이브리드화시킨다. 대략적으로,32P 말단 표지된 올리고뉴클레오티드 프로브의 2 X 107cpm(비활성도 4-9 X108cpm/㎍)이 이어서 용액에 첨가된다. 12-16 시간의 항온처리 후, 상기 막은 실온하에 0.5 % SDS를 함유하는 1X SET(150 mM NaCl, 20 mM 트리스 하이드로클로라이드, pH 7.8, 1mM Na2EDTA)에서 30분 동안 세척하고 올리고뉴클레오티드 프로브를 위해 Tm-10℃하에 신선한 1 X SET으로 30분 세척한다. 이후 상기 막은 하이브리드화 시그널을 검출하기 위하여 방사능사진 필름에 노출시킨다.
검출 가능한 프로브에 하이브리드화하는 cDNA 또는 게놈 DNA와 같은 핵산을 동정하기 위해 이용되는 하이브리드화 조건의 엄격성을 변화시킴으로써 프로브에 대한 상동성 정도가 서로 다른 핵산들을 동정하고 분리할 수 있다. 엄격성은 프로브의 융점 이하의 다양한 온도에서 하이브리드화를 수행하여 변화시킬 수 있다. 융점 Tm은 표적 서열의 50%가 완벽한 상보성 프로브에 하이브리드하는 온도(특정 이온 강도 및 pH에서)이다. 매우 엄격한 조건은 특정 프로브에 대한 Tm과 같거나 또는 약 5℃ 더 낮게 선택된다. 프로브의 융점은 하기 식을 이용하여 계산할 수 있다.
길이가 14∼70 뉴클레오티드인 프로브의 경우, 융점(Tm)은 다음 식을 이용하여 계산한다: Tm= 81.5+16.6(log[Na+]+0.41(G+C 비율)-(600/N), 여기서 N은 프로브의 길이이다.
하이브리드화가 포름아미드를 함유하는 용액 중에서 수행될 경우, 융점은 다음 식을 이용하여 계산할 수 있다: Tm= 81.5+16.6(log[Na+]+0.41(G+C 비율)-(0.63% 포름아미드)-(600/N), 여기서 N은 프로브의 길이이다.
예비 하이브리드화는 6 x SSC, 5 x 덴하르트 시약, 0.5% SDS, 분해된 변성 연어 정자 DNA 100 ㎍ 또는 6 x SSC, 5 x 덴하르트 시약, 0.5% SDS, 분해된 변성 연어 정자 DNA 100 ㎍, 50% 포름아미드 중에서 수행될 수 있다. SSC 및 덴하르트 용액의 조성은 Sambrook 등의 상기 문헌에 기재되어 있다.
하이브리드화는 검출 가능한 프로브를 전술한 예비 하이브리드화 용액에 첨가하여 수행한다. 프로브가 두가닥 DNA를 포함할 경우, 이를 하이브리드화 용액에 첨가하기 전에 변성시킨다. 프로브가 이 프로브에 대한 상보 서열 또는 상동성인 서열을 포함하는 cDNA 또는 게놈 DNA에 하이브리드화하도록 충분한 시간 동안 필터를 하이브리드화 용액과 접촉시킨다. 길이가 200 뉴클레오티드 이상인 프로브의 경우 하이브리드화는 Tm보다 15∼25℃ 낮은 온도에서 수행할 수 있다. 올리고뉴클레오티드 프로브와 같이 더 짧은 프로브의 경우 하이브리드화는 Tm보다 5∼10℃ 더 낮은 온도에서 수행할 수 있다. 일반적으로, 6 x SSC에서의 하이브리드화의 경우, 약 68℃에서 하이브리드화를 수행한다. 통상적으로, 50% 포름알데히드 함유 용액에서의 하이브리드화의 경우에는 약 42℃에서 하이브리드화를 수행한다.
전술한 모든 하이브리드화는 높은 정도의 엄격성 조건에 속하는 것으로 간주된다.
하이브리드화 후에 필터를 세척하여 임의의 비특이적으로 결합된 검출 가능한 프로브를 제거한다. 필터를 세척하는 데 이용되는 엄격성 역시 하이브리드화되는 핵산의 성질, 하이브리드화되는 핵산의 길이, 상보성 정도, 뉴클레오티드 서열조성(예컨대, GC 대 AT 함량), 및 핵산 유형(예컨대, RNA 대 DNA)에 따라 달라질 수 있다. 점차적으로 엄격성을 높이는 세척 조건의 예를 들면 다음과 같다: 2 x SSC, 0.1% SDS로 실온에서 15분간(낮은 정도의 엄격성); 0.1 x SSC, 0.5% SDS로 실온에서 30분∼1시간(중간 정도의 엄격성); 0.1 x SSC, 0.5% SDS로 하이브리드화 온도에서 68℃ 사이에서 15분∼30분(높은 정도의 엄격성); 및 0.15 M NaCl로 72℃에서 15분간(매우 높은 엄격성). 마지막 낮은 정도의 엄격성 세척은 0.1 x SSC 중에서 실온에서 수행할 수 있다. 상기 예는 필터 세척에 이용될 수 있는 설정 조건 중 한가지를 단지 예로 든 것에 불과하다. 당업자라면 상이한 엄격성 세척을 위한 여러가지 방법이 있음을 알 것이다. 몇가지 다른 예에 대해서는 후술한다.
프로브에 하이브리드화된 핵산은 방사능 사진이나 기타 통상적인 기법에 의해 확인한다.
프로브 서열에 대한 상동성 정도가 낮은 핵산을 동정하기 위해 상기 절차를 변형시킬 수 있다. 예를 들어, 검출 가능한 프로브에 대해 낮은 상동성을 갖는 핵산을 얻기 위해서는 덜 엄중한 조건을 이용할 수 있다. 예를 들어, 하이브리드화 온도를 Na+농도가 약 1 M인 하이브리드화 완충액 중에서 68℃에서 42℃로 5℃씩 감소시킬 수 있다. 하이브리드화 후, 하이브리드화 온도에서 필터를 2 x SSC, 0.5% SDS로 세척할 수 있다. 이러한 조건은 50℃ 이상에서는 "중간 정도의 엄격성" 조건으로, 50℃ 이하에서는 "낮은 정도의 엄격성" 조건으로 간주된다. "중간 정도의 엄격성" 하이브리드화 조건의 한가지 구체적 예는 상기 하이브리드화를 55℃에서 수행하는 경우이다. "낮은 정도의 엄격성" 하이브리드화 조건의 한가지 구체적 예는상기 하이브리드화를 45℃에서 수행하는 경우이다.
대안으로, 하이드브리드화는 포름아미드를 함유하는 6 x SSC와 같은 완충액 중에서 42℃의 온도에서 수행할 수도 있다. 이러한 경우, 프로브에 대한 상동성 정도가 낮은 클론을 동정하기 위해서는 하이브리드화 완충액 중의 포름아미드의 농도를 50%에서 0%까지 5%씩 감소시킬 수 있다. 하이브리드화 후, 필터를 6 x SSC, 0.5% SDS로 50℃에서 세척할 수 있다. 이러한 조건은 포름아미드 농도가 25% 이상인 경우에는 "중간 정도의 엄격성" 조건으로 간주되고, 포름아미드 농도가 25% 이하인 경우에는 "낮은 정도의 엄격성" 조건으로 간주된다. "중간 정도의 엄격성" 하이브리드화 조건의 한가지 구체적 예는 상기 하이브리드화를 30% 포름알데히드에서 수행하는 경우이다. "낮은 정도의 엄격성" 하이브리드화 조건의 한가지 구체적 예는 상기 하이브리드화를 10% 포름알데히드에서 수행하는 경우이다.
예를 들어, 전술한 방법은 A 군의 핵산 서열 중 하나, 및 이 서열과 실질적으로 동일한 서열, 또는 약 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, 또는 500개 이상의 연속 염기를 포함하는 이 서열의 단편, 및 이 서열의 상보 서열로 이루어진 군에서 선택되는 핵산 서열에 대한 상동성이 약 97% 이상, 95% 이상, 90% 이상, 85% 이상, 80% 이상, 75% 이상, 70% 이상, 65% 이상, 60% 이상, 55% 이상 또는 50% 이상인 서열을 갖는 핵산을 분리하는 데 이용될 수 있다. 상동성은 정렬 알고리즘을 이용하여 측정할 수 있다. 예를 들어, 상동성 폴리뉴클레오티드는 전술한 암호화 서열 중 하나의 자연 발생적 대립유전자 변이체인 암호화 서열을 포함할 수 있다. 이러한 대립유전자 변이체는 A 군 핵산 서열의 핵산 또는 이 서열에 상보적인 서열과 비교할 때 하나 이상의 뉴클레오티드의 치환, 결실 또는 부가를 포함할 수 있다.
또한, 상기 절차는 서열 정렬 알고리즘(예컨대, 디폴트 매개변수를 이용한 FASTA 버전 3.0t78 알고리즘)을 이용하여 결정하였을 때, B 군 아미노산 서열 중 하나의 서열, 및 이 서열과 실질적으로 동일한 서열을 포함하는 폴리펩티드, 또는 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개 이상의 연속 아미노산을 포함하는 이의 단편에 대한 상동성이 약 99% 이상, 95% 이상, 90% 이상, 85% 이상, 80% 이상, 75% 이상, 70% 이상, 65% 이상, 60% 이상, 55% 이상 또는 50% 이상인 폴리펩티드를 암호화하는 핵산을 분리하는 데 이용될 수 있다.
본 발명의 또 다른 양태는 A 군의 핵산 서열 중 하나, 및 이 서열과 실질적으로 동일한 서열을 포함하는 분리 또는 정제된 폴리펩티드, 또는 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개 이상의 연속 아미노산을 포함하는 이 폴리펩티드의 단편이다. 전술한 바와 같이 이러한 폴리펩티드는 암호화 서열이 적절한 숙주 세포 내에서 암호화된 폴리펩티드의 발현을 유도할 수 있는 서열에 작동적으로 연결되도록 벡터로 그 폴리펩티드를 암호화하는 핵산을 삽입함으로써 얻을 수 있다. 예를 들어, 발현 벡터는 프로모터, 번역 개시를 위한 리보좀 결합 부위 및 전사 종결 서열을 포함할 수 있다. 이 벡터는 또한 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다.
박테리아에서 폴리펩티드 또는 이의 단편을 발현시키는 데 적합한 프로모터로는이. 콜리 lac또는trp프로모터,lacI프로모터,lacZ프로모터,T3프로모터,T7프로모터,gpt프로모터,람다 P R 프로모터,람다 P L 프로모터, 3-포스포글리세레이트 키나제(PGK)와 같은 당분해 효소를 암호화하는 오페론 유래의 프로모터, 및 산 포스파타제 프로모터를 들 수 있다. 진균 프로모터로는 ∀ 인자 프로모터가 있다. 진핵 프로모터로는 CMV 직초기 프로모터, HSV 티미딘 키나제 프로모터, 열 충격 프로모터, 조기 및 후기 SV40 프로모터, 레트로바이러스 유래의 LTR, 및 마우스 메탈로티오네인-I 프로모터를 들 수 있다. 원핵 또는 진핵 세포 또는 이들의 바이러스에서 유전자의 발현을 조절하는 것으로 알려진 다른 프로모터도 사용할 수 있다.
포유동물 발현 벡터는 또한 복제 원점, 임의의 필요한 리보좀 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수용체 부위, 전자 종결 서열, 및 5' 측접 비전사 서열을 포함할 수 있다. 일부 구체예에서는, SV40 스플라이스 및 폴리아데닐화 부위로부터 유래된 DNA 서열을 필요한 비전사 유전자 구성요소를 제공하는 데 이용할 수 있다.
진핵 세포에서 폴리펩티드 또는 이의 단편을 발현시키기 위한 벡터는 발현 수준을 증가시키는 인핸서를 포함할 수도 있다. 인핸서는 DNA의 시스-작용성 구성요소로서, 일반적으로 그 길이는 전사를 증가시키도록 프로모터에 작용할 수 있는 약 10∼약 300 bp이다. 예로는 복제 원점의 후반부에 작용하는 100∼270 bp 길이의 SV40 인핸서, 사이토메갈로바이러스 초기 프로모터 인핸서, 복제 원점의 후반부에 작용하는 폴리오마 인핸서, 및 아데노바이러스 인핸서가 있다.
그 밖에도, 발현 벡터는 일반적으로, 벡터를 포함하는 숙주 세포를 선별할수 있게 하는 하나 이상의 선별 마커 유전자를 포함한다. 이러한 선별 마커에는 진핵 세포 배양의 경우 디히드로폴레이트 리덕타제를 암호화하는 유전자 또는 네오마이신 내성을 부여하는 유전자가 있고, E. 콜라이에서 테트라사이클린 또는 암피실린 내성을 부여하는 유전자, 및 S. 세레비지이(S. cerevisiae) TRP1 유전자가 있다.
발현 라이브러리가 만들어지면, 스크리닝 전에 세포 분류법에 의해 그 라이브러리를 "바이오패닝(biopanning)"하는 추가 단계를 포함시킬 수 있다. "바이오패닝" 절차는(i) 특정 생물학적 활성을 갖는 생물체를 암호화하는 DNA 서열의 적어도 일부분을 포함하는 하나 이상의 프로브 DNA를 사용함으로써 1종 이상의 미생물에서 유래된 DNA로부터 표적 DNA를 선택적으로 분리하는 단계, 및(ii) 선택적으로, 분리된 표적 DNA로 숙주를 형질전환시켜서 클론의 라이브러리를 제조하여 이를 특정 생물학적 활성에 대해 스크리닝하는 단계에 의해, 제조된 클론의 라이브러리에서 서열 상동성에 대해 스크리닝함으로써 특정 생물학적 활성을 가진 클론을 동정하는 방법을 칭한다.
1종 이상의 미생물로부터 얻은 DNA로부터 원하는 표적 DNA를 선택적으로 분리하기 위해 사용되는 프로브 DNA는 알고 있는 활성을 갖는 효소에 대한 DNA의 전길이 암호화 영역 서열 또는 부분적인 암호화 영역 서열일 수 있다. 최초의 DNA 라이브러리는 특정 효소 활성을 갖는 효소를 암호화하는 DNA 서열의 적어도 일부분을 포함하는 프로브의 혼합물을 이용하여 프로빙하는 것이 바람직할 수 있다. 이러한 프로브(들) 라이브러리는 한가닥인 것이 바람직하며, 프로빙되는 미생물 DNA는 한가닥 형태로 전환시킨 것이 바람직하다. 특히 적절한 프로브는 스크리닝할 특정 효소 활성과 유사하거나 동일한 활성을 갖는 효소를 암호화하는 DNA로부터 유래된 것이다.
프로브 DNA는 염기 길이가 약 10개 이상이어야 하며, 15개 이상인 것이 바람직하다. 한 구체예로서, 전체 암호화 영역이 프로브로 사용될 수 있다. 하나 이상의 DNA 프로브를 사용하여 표적 DNA를 선택적으로 분리하는 하이브리드화를 위한 조건은 약 50% 이상의 서열 동일성, 보다 구체적으로 약 70% 이상의 서열 동일성의 하이브리드화 엄격성을 제공하도록 계획한다.
핵산 하이브리드화 반응에서는 특정 수준의 엄격성을 얻기 위해 이용되는 조건이 하이브리드화되는 핵산의 성질에 따라 달라진다. 예를 들어, 핵산의 하이브리드화 영역의 길이, 상보성 정도, 뉴클레오티드 서열 조성(예컨대, GC 대 AT 함량), 및 핵산 유형(예컨대, RNA 대 DNA)은 하이브리드화 조건을 선택할 때 고려될 수 있다. 또 다른 고려 대상으로는 핵산 중 하나가, 예컨대 필터에 고정되어 있는냐 하는 것이다.
점차적으로 엄격성을 높이는 조건의 한 예를 들면 다음과 같다: 2 x SSC/0.1% SDS, 실온 부근(하이브리드화 조건); 0.2 x SSC/0.1% SDS, 실온 부근(낮은 정도의 엄격성 조건); 0.2 x SSC/0.1% SDS, 약 42℃(중간 정도의 엄격성 조건); 및 0.1 x SSC, 약 68℃(높은 정도의 엄격성 조건). 세척은 상기 조건 중 하나만을 이용하여, 예컨대 높은 정도의 엄격성 조건에서 수행할 수 있거나, 또는 이들 조건 각각을 상기 순서대로, 예컨대 각각 10∼15분간 이용하고, 상기한 모든 단계 또는몇 단계를 반복할 수 있다. 그러나, 전술한 바와 같이, 최적 조건은 이용되는 구체적 하이브리드화 반응에 따라 달라지며 실험적으로 결정할 수 있다.
원하는 표적 DNA를 분리하기 위해 미생물 DNA 라이브러리를 프로빙하는 하이브리드화 기법은 당업계에 잘 알려져 있는 것으로, 문헌에 소개되어 있는 어떠한 기법도 본 발명에 사용하기에 적합한데, 특히, 미생물 유래의 DNA로부터 표적 DNA를 분리하는 데 있어서의 용이성을 위해 고체상에 직간접적으로 결합된 프로브 DNA를 사용하는 기법이 적합하다.
바람직하게는 프로브 DNA를 특이적 결합 쌍의 한 파트너(즉, 리간드)로 "표지"하고, 그 쌍의 나머지 한 파트너는 공급원으로부터 표적 서열을 쉽게 분리할 수 있도록 고체 매트릭스에 결합시킨다. 리간드와 특이적 결합 파트너는(1) 항원 또는 합텐 및 항체 또는 이의 특이적 결합 단편;(2) 비오틴 또는 이미노비오틴 및 아비딘 또는 스트렙타비딘;(3) 당 및 이에 특이적인 렉틴;(4) 효소 및 이의 억제제;(5) 아포효소 및 보조 인자;(6) 상보성 단독중합 올리고뉴클레오티드; 및(7) 호르몬과 그 수용체 중에서 선택될 수 있으며, 서로의 역할은 바뀔 수 있다. 고체상은(1) 유리 또는 중합체 표면;(2) 중합체 비드를 패킹한 컬럼; 및(3) 자성 또는 상자성 입자 중에서 선택하는 것이 바람직하다.
또한, 선택 사항이긴 하지만 분리된 표적 DNA를 증폭시키는 것이 바람직하다. 이러한 경우 분리 후 표적 DNA를 프로브 DNA로부터 분리한다. 그 후 이를 증폭시킨 후에 숙주의 형질전환에 사용한다. 적어도 그 일부로서 소정의 DNA 서열을 포함하도록 선택된 두가닥 DNA를 한가닥으로 만들어서 증폭에 사용하고, 이를 다시어닐링시키면 다수개의 선택된 두가닥 DNA를 얻을 수 있다. 다수의 증폭 기법이 당업계에 널리 공지되어 있다.
그 후 선택된 DNA를 사용하여 적절한 유기체를 형질전환시킴으로써 스크리닝을 위한 라이브러리를 제조한다. 숙주, 특히 본원에서 특별히 바람직하다고 언급한 숙주에, 형질전환에 적합한 조건 하에 접종(inoculation)에 의해 표적 DNA를 포함하는 벡터를 인위적으로 도입함으로써 이 숙주를 형질전환시킨다.
그 후 제조된 형질전환된 클론의 라이브러리로 원하는 효소 활성을 나타내는 클론을 스크리닝한다.
유기체로부터 선택적으로 분리된 DNA 유래의 다수의 클론이 준비되면, 이 클론으로 특정 효소 활성을 갖는지를 스크리닝하여 특정 효소 특성을 갖는 클론을 동정한다.
효소 활성에 대한 스크리닝은 개개의 발현 클론에 대해 실시할 수도 있고, 또는 먼저 발현 클론의 혼합물에 대해 실시하여 그 혼합물이 하나 이상의 특정 효소 활성을 갖는지를 확인할 수 있다. 그 혼합물이 특정 효소 활성을 갖는다면 그러한 효소 활성 또는 보다 특이적인 활성에 대해 FACS 기계를 사용하여 개개의 클론을 재스크리닝할 수 있다. 대안으로, 겔 미소소적과 같은 캡슐화 기법을 이용하여 FACS 기계 상에서 클론 그룹 내의 양성 발현 클론에 대해 스크리닝되는 한 지점에 다수개의 클론을 배치시킨 다음, 이를 FACS 기계 상에서 다시 스크리닝할 개별 클론으로 분류하여 양성인 개별 클론을 찾아낼 수 있다. 따라서, 예를 들어 클론 혼합물이 하이드롤라제 활성을 갖는다면 개개의 클론을 회수한 다음, FACS 기계를 이용하여 스크리닝하여 그러한 클론 중 어느 것이 하이드롤라제 활성을 갖는지를 확인할 수 있다. 본원에서 사용되는 "작은 삽입체 라이브러리"란 약 5000 bp 이하의 무작위적인 작은 크기의 핵산 삽입체를 갖는 클론을 포함하는 유전자 라이브러리를 의미한다. 본원에서 사용되는 "큰 삽입체 라이브러리"란 약 5000 내지 수십만 bp 이상의 무작위적인 큰 크기의 핵산 삽입체를 갖는 클론을 포함하는 유전자 라이브러리를 의미한다.
전술한 양태 중 하나와 관련하여 설명한 바와 같이, 본 발명은 미생물 유래의 선택된 DNA를 포함하는 클론의 효소 활성 스크리닝을 위한 하기 단계를 포함하는 방법을 제공한다: 특정 효소 활성에 대해 라이브리를 스크리닝하는 단계(상기 라이브러리는 다수의 클론을 포함하며, 이 클론은 미생물의 게놈 DNA로부터 선택된 DNA를 회수함으로써 준비되며, 상기 DNA는 특정 활성을 갖는 효소를 암호화하는 DNA 서열의 전부 또는 일부인 하나 이상의 DNA 서열에 하이브리드화하여 선택한다); 및 선택된 DNA로 숙주를 형질전환시켜서 클론을 얻고, 이를 특정 효소 활성에 대해 스크리닝하는 단계.
한 구체예에서, 미생물에서 유래된 DNA 라이브러리를 사용하여 이로부터, 하기 단계에 의해 특정 효소 활성을 갖는 효소를 암호화하는 DNA 서열의 전부 또는 일부인 하나 이상의 프로브 DNA 서열에 하이브리드화하는 DNA 선별하기 위한 선별 절차를 실시한다:
(a) 두가닥 게놈 DNA 군집을 한가닥 DNA 군집으로 만드는 단계;
(b) 하이브리드화가 일어나게 하는 조건 하에, 리간드에 결합된 DNA 프로브와(a)의 한가닥 DNA 군을 접촉시켜서 프로브와 여기에 하이브리드화하는 게놈 DNA 군의 구성원의 두가닥 복합체를 형성하는 단계;
(c)(b)의 두가닥 복합체와 상기 리간드에 대한 고체상 특이적 결합 파트너를 접촉시켜서 고체상 복합체를 형성하는 단계;
(d)(b)의 한가닥 DNA 군으로부터 고체상 복합체를 분리하는 단계;
(e) 프로브로부터 고체상 결합 프로브에 결합된 게놈 군의 구성원을 해리시키는 단계;
(f)(e)의 게놈 군의 구성원으로부터 두가닥 DNA를 형성하는 단계;
(g)(f)의 두가닥 DNA를 적절한 숙주에 도입하여 선택된 DNA를 함유하는 다수의 클론을 포함하는 라이브러리를 형성하는 단계; 및
(h) 특정 효소 활성에 대해 라이브러리를 스크리닝하는 단계.
또 다른 양태로서 본 발명의 방법은 시그널 또는 분비 서열을 포함하는 DNA를 회수하기 위한 사전 선별 단계를 포함한다. 이러한 방식에서는 시그널 또는 분비 서열을 포함하는 DNA만을 전술한 바와 같은 하이브리드화에 의해 게놈 DNA 군으로부터 선별하는 것이 가능하다. 아래 단락에서는 본 발명의 이러한 구체예에 대한 프로토콜, 일반적인 분비 시그널 서열의 성질 및 기능과, 분석 또는 선별 과정에 이러한 서열을 이용하는 구체적 예에 대해 설명한다.
이러한 양태의 한 구체예는(a) 단계와(b) 단계 사이에 아래의 단계들을 더 포함한다.
(ai) 하이브리드화가 일어나게 하는 조건 하에(a)의 한가닥 DNA 군과 특정종류의 단백질에 특이적인 분비 시그널 서열에 상보적인 리간드 결합형 올리고뉴클레오티드 프로브를 접촉시켜서 두가닥 복합체를 형성하는 단계;
(aii)(ai)의 두가닥 복합체와, 상기 리간드에 대한 고체상 특이적 결합 파트너를 접촉시켜서 고체상 복합체를 형성하는 단계;
(aiii)(a)의 한가닥 DNA 군으로부터 고체상 복합체를 분리하는 단계;
(aiv) 상기 고체상 결합 프로브에 결합된 게놈 군의 구성원을 해리시키는 단계; 및
(av) 고체상 결합 프로브를 이 프로브에 결합된 게놈 군의 구성원으로부터 분리하는 단계.
그 후 시그널 서열을 포함하도록 선택 및 분리된 DNA를 사용하여, 이로부터 특정 효소 활성을 갖는 효소(들)를 암호화하는 DNA로부터 유래된 하나 이상의 프로브 DNA 서열에 결합하는 DNA를 선별 및 분리하기 위한 전술한 선별 절차를 수행한다.
이 절차는 1996년 8월 2일에 출원된 미국 특허 출원 제08/692,002호에 기술 및 예시되어 있으며, 이 특허는 본원에서 참고문헌으로 인용한다.
FACS계 기계를 사용하여 생체내 바이오패닝을 수행할 수 있다. 전사된 RNA를 안정화시키는 구성요소를 포함하는 벡터를 사용하여 복합 유전자 라이브러리를 제작한다. 예를 들어, RNA의 전사 영역에 측접하도록 디자인된 헤어핀과 같은 2차 구조를 형성하는 서열을 포함시키면, RNA 전사 영역의 안정성이 강화되어 세포 내에서의 반감기가 증가된다. 바이오패닝 방법에 사용되는 프로브 분자는 표적 분자에프로브가 결합될 경우에만 형광을 발하는 리포터 분자로 표지된 올리고뉴클레오티드로 구성된다. 이들 프로브는 몇가지의 형질전환 방법 중 1가지를 이용하여 라이브러리로부터 재조합 세포로 도입한다. 이 프로브 분자는 전사된 표적 mRNA에 결합하여 DNA/RNA 이종이중체(heteroduplex) 분자를 형성한다. 표적에 프로브가 결합되면 형광 시그널을 발하게 되며, 이는 스크리닝 과정 중에 FACS 기계에 의해 검출 및 분류된다.
몇몇 구체예에서, B 군 아미노산 서열, 이것과 실질적으로 동일한 서열의 폴리펩티드 중 하나, 또는 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개 이상의 연속 아미노산을 포함하는 이의 단편을 암호화하는 핵산을 번역된 폴리펩티드 또는 그 단편의 분비를 유도할 수 있는 리더 서열과 적절한 상으로 어셈블한다. 선택적으로, 핵산은 B 군 아미노산 서열, 이것과 실질적으로 동일한 서열의 폴리펩티드 중 하나, 또는 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 포함하는 이의 단편을 이종 펩티드(들), 예컨대 증가된 안정성 또는 단순화된 정제와 같은 원하는 특성을 제공하는 N-말단 표시(identification) 펩티드에 융합시킨 융합 폴리펩티드를 암호화할 수 있다.
적절한 DNA 서열을 다양한 방법으로 벡터에 삽입시킬 수 있다. 일반적으로 DNA 서열은 적절한 제한 엔도뉴클레아제로 삽입체와 벡터를 분해한 후 벡터의 원하는 위치에 결찰시킨다. 대안으로, 삽입체와 벡터 둘다의 평활 말단을 연결시킬 수 있다. 다양한 클로닝 기법이 Ausubel 등의 문헌[Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997] 및 Sambrook 등의 문헌[MolecularCloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press(1989)]에 기재되어 있으며, 이들 문헌은 본원에서 참고문헌으로 인용한다. 이러한 방법 등은 당업자의 지식 범위에 속하는 것이다.
벡터는, 예컨대 플라스미드, 바이러스 입자 또는 파지의 형태일 수 있다. 다른 벡터로는 염색체, 비염색체 및 합성 DNA 서열, SV40의 유도체; 박테리아 플라스미드, 파지 DNA, 배큘로바이러스, 효모 플라스미드, 플라스미드와 파지 DNA를 조합하여 만든 벡터, 바이러스 DNA, 예컨대 백시니아, 아데노바이러스, 계두 바이러스 및 가성 광견병 바이러스의 DNA가 있다. 원핵 및 진핵 숙주에 사용하기 위한 다양한 클로닝 및 발현 벡터에 대해서는 Sambrook 등의 문헌[Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, N.Y.(1989)]에 기재되어 있으며, 이 문헌은 본원에서 참고문헌으로 인용한다.
사용될 수 있는 구체적인 박테리아 벡터로는 잘 알려진 클로닝 벡터의 유전자 구성요소를 포함하는 시판되는 플라스미드, 예컨대 pBR322(ATCC 37017), pKK223-3(스웨덴 웁살라 소재의 파마시아 파인 케미칼스), GEM1(미국 위스콘신주 매디슨 소재의 프로메가 바이오텍), pQE70, pQE60, pQE-9(퀴아젠), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A(스트라타진), ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5(파마시아), pKK232-8 및 pCM7을 들 수 있다. 구체적인 진핵 벡터로는 pSV2CAT, pOG44, pXT1, pSG(스트라타진), pSVK3, pBPV, pMSG 및 pSVL(파마시아)를 들 수 있다. 그러나, 숙주 세포 내에서 복제할 수 있고 생존할 수 있는 것이라면 임의의 다른 벡터도 사용할 수 있다.
숙주 세포는 원핵 세포, 진핵 세포, 포유동물 세포, 곤충 세포 또는 식물 세포를 비롯하여 당업자가 잘 알고 있는 숙주 세포 중 임의의 것일 수 있다. 적절한 숙주의 대표적인 예로는 박테리아 세포, 예컨대 이. 콜리, 스트렙토마이세스(Streptomyces), 바실러스 서브틸리스(Bacillus subtilis), 살모넬라 티피무리움(Salmonella typhimurium) 및 슈도모나스, 스트렙토마이세스 및 스타필로코커스 속에 속하는 다양한 종들, 진균 세포, 예컨대 효모, 곤충 세포, 예컨대 드로소필라 S2(Drosophila S2) 및 스포돕테라 Sf9(Spodoptera Sf9), 동물 세포, 예컨대 CHO, COS 또는 바우스 멜라노마 및 아데노바이러스를 들 수 있다. 적절한 숙주의 선택은 당업자의 능력 범위에 속하는 것이다.
벡터는 형질전환, 형질감염, 형질도입, 바이러스 감염, 유전자 총, 또는 Ti 매개 유전자 전달을 비롯하여 다양한 기법 중 임의의 기법을 이용하여 도입할 수 있다. 구체적 방법으로는 인산칼슘 형질감염, DEAE-덱스트란 매개 형질감염, 리포펙션, 또는 전기천공법(Davis, L., Dibner, M., Battey, I.의 문헌[Basic Methods in Molecular Biology(1986)])을 들 수 있다.
적절하다면, 프로모터를 활성화시키고, 형질전환체를 선별하거나 본 발명의 유전자를 증폭시키기에 적절하도록 변화시킨 통상적인 영양 배지에서 조작된 숙주 세포를 배양할 수 있다. 적절한 숙주 균주를 형질전환시키고 이 숙주 균주를 적절한 세포 밀도로 배양한 후, 적절한 수단(예컨대, 온도 변화 또는 화학적 유도)을 통해 선택된 프로모터를 유도한 다음, 목적하는 폴리펩티드 또는 그 단편을 생성하도록 추가 시간 동안 세포를 배양할 수 있다.
세포는 통상 원심분리에 의해 수거하여 물리적 또는 화학적 수단으로 파괴하고, 얻어진 미정제 추출물을 후속 정제를 위해 유지시킨다. 단백질의 발현에 사용되는 미생물 세포는 동결-해동 반복, 초음파 처리, 기계적 파괴, 또는 세포 용해제의 사용을 비롯하여 임의의 통상적인 방법으로 파괴할 수 있다. 이러한 방법들은 당업자에게 잘 알려져 있는 것이다. 황산암모늄 또는 에탄올 침전, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로즈 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 히드록실아파타이트 크로마토그래피 및 렉틴 크로마토그래피를 비롯한 방법에 의해 발현된 폴리펩티드 또는 이의 단편을 재조합 세포 배양물로부터 회수 및 정제할 수 있다. 폴리펩티드의 배열(configuration)을 완성하기 위해 필요하다면 단백질 리폴딩 단계를 이용할 수 있다. 원한다면 고성능 액체 크로마토그래피(HPLC)를 최종 정제 단계에 이용할 수 있다.
또한, 다양한 포유동물 세포 배양 시스템을 사용하여 재조합 단백질을 발현시킬 수 있다. 포유동물 발현 시스템의 예로는 원숭이 신장 섬유아세포의 COS-7 세포주(Gulzman, Cell, 23: 175, 1981에 기재됨) 및 C127, 3T3, CHO, HeLa 및 BHK 세포주와 같은 혼화성 벡터로부터 단백질을 발현할 수 있는 기타 세포주를 포함한다.
숙주 세포중의 구성물을 통상적인 방식으로 사용하여 재조합 서열에 의해 암호화된 유전자 생성물을 생산할 수 있다. 재조합 생산 방법에 사용된 숙주에 따라, 벡터를 함유하는 숙주 세포에 의해 생성된 폴리펩티드는 글리코실화되거나 또는 글리코실화되지 않은 것일 수 도 있다. 본 발명의 폴리펩티드는 처음의 메티오닌 아미노산 잔기를 포함할 수도 있거나 또는 포함하지 않을 수도 있다.
또는, B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개 이상의 연속 아미노산을 함유하는 단편은 통상의 펩티드 합성기에 의해 합성 생산될수 있다. 다른 구체예에서, 단편 또는 폴리펩티드의 일부는 펩티드 합성에 의해 상응하는 전장 폴리펩티드를 생성하는데 사용할 수 있다; 그러므로, 이들 단편은 전장 폴리펩티드를 생성하는 중간체로서 사용할 수도 있다.
폴리펩티드 또는 이의 단편을 암호화하는 핵산에 작동가능하게 결합된 프로모터를 함유하는 DNA 구성물로부터 전사된 mRNA를 사용하는 B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 함유하는 단편중 하나를 제조하는데 무세포 번역계를 또한 이용할 수 있다. 일부 구체예에서, DNA 구성물을 선형화한 후 시험관내에서 전사 반응을 수행할 수 있다. 이후, 전사된 mRNA는 적당한 무세포 번역 추출물(예, 토끼의 망상 적혈구 추출물)과 함께 항온처리하여 소정의 폴리펩티드 또는 이의 단편을 생성한다.
본 발명은 또한 B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 함유하는 단편의 변이체를 포함한다. "변이체"란 이들 폴리펩티드의 유도체 또는 아날로그를 포함한다. 특히, 이 변이체는 B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열이 아미노산 서열에서 하나이상의 치환, 첨가, 결실, 융합 및 절단이 조합되어 달라진 것일 수 있다.
변이체는 자연적으로 발생하거나 또는 시험관내에서 생산된 것일 수 있다. 특히, 이 변이체는 부위 지정 돌연변이유발법, 무작위 화학적 돌연변이유발법, 엑소뉴클레아제 III 결실법, 및 표준 클로닝 기법과 같은 유전 공학 기술을 사용하여 생산될 수 있다. 또는, 이러한 변이체, 단편, 아날로그, 또는 유도체는 화학적 합성 또는 변형 방법을 사용하여 생산될 수 있다.
변이체를 제조하는 기타 방법은 당업자에게 익숙한 것들이다. 이들 방법은 천연 분리물로부터 얻은 핵산 서열을 변형시켜 산업적 용도나 실험실 용도에서 이들의 가치를 향상시키는 특성을 지닌 폴리펩티드를 암호화하는 핵산을 생성하는 방법을 포함한다. 이러한 방법에서, 천연 분리물로부터 얻은 서열과는 1개 이상의 뉴클레오티드가 다른 다수의 다른 변이체 서열이 생성되어 특성이 규명된다. 일반적으로, 이러한 뉴클레오티드의 차이는 천연 분리물로부터 핵산에 의해 암호화된 폴리펩티드에서 아미노산의 변화를 가져온다.
예컨대, 변이체는 에러 프론 PCR을 사용하여 생성될 수 있다. 에러 프론 PCR에서, PCR은 DNA 폴리머라제의 복사 신뢰도가 낮은 조건하에서 수행되어 PCR 생성물의 전체 길이에 걸쳐 높은 비율로 점 돌연변이가 발생하게 된다. 에러 프론 PCR은 본원에 전체가 참고로 인용된 문헌[Leung, D.W.등, Technique, 1:11-15, 1989 및 Caldwell, R.C. & Joyce G.F., PCR Methods Applic. 2:28-33, 1992]에 개시되어 있다. 요컨대, 이러한 방법을 통해 돌연변이시킬 핵산을 PCR 프라이머, 반응 완충액, MgCl2, Taq 폴리머라제 및 적합한 농도의 dNTPs와 혼합하여 PCR 생성물의 전체길이에 걸친 점 돌연변이를 높은 비율로 얻는 것이다. 예를 들면, 이 반응은 돌연변이시킬 핵산 20 fmole, 각 PCR 프라이머 30 pmole, 50 mM KCl, 10 mM 트리스 HCl(pH 8.3) 및 0.01% 젤라틴을 함유하는 반응 버퍼, 7 mM MgCl2, 0.5 mM MnCl2, 5 유닛의 Taq 폴리머라제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 및 1 mM dTTP로 이루어진 용액을 사용하여 수행될 수도 있다. PCR은 94℃에서 1분간, 45℃에서 1분간, 72℃에서 1분간 30회의 사이클 동안 수행될수 있다. 그러나, 이들 매개변수는 적절히 변형될수 있다. 돌연변이된 핵산은 적당한 벡터내로 클로닝되고, 돌연변이된 핵산에 의해 암호화된 폴리펩티드의 활성을 평가한다.
변이체는 또한 클론닝된 임의의 목적 DNA중에서 위치 특이성 돌연변이를 생성하기 위해서 올리고뉴클레오티드 지정 돌연변이유발법을 사용하여 생성될 수 있다. 올리고뉴클레오티드 돌연변이유발법은 본원에 전체가 참고로 인용된 Reidhaar-Olson, J.F & Sauer, R.T등 Science, 241:53-57, 1988에 개시되어 있다. 요컨대, 이 방법에서는 클로닝된 DNA내로 도입시킬 1개 이상의 변이를 지닌 두가닥 올리고뉴를레오티드 다수개를 합성하여 변이시킬 클로닝된 DNA내로 삽입한다. 변이된 DNA를 함유한 클론을 회수하고, 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
변이체를 생성하는 다른 방법은 어셈블리 PCR 이다. 어셈블리 PCR은 작은 DNA 단편 혼합물로부터 얻은 PCR 생성물의 어셈블리를 포함한다. 많은 수의 다른 PCR 반응이 동일 바이알내에서 한 반응의 생성물이 다른 반응의 생성물을 프라이밍하는 식으로 나란히 일어난다. 미국 특허 제5,965,408호(1996년 7월 9일 출원)에 기재된 어셈블리 PCR은 "Method of DNA Reassembly by Interrupting Synthesis"라는 표제로 개시되어 있는데, 이는 본원에 전체가 참고로 인용되었다.
변이체를 생성하는 다른 방법은 성 PCR 돌연변이유발법이다. 성 PCR 돌연변이유발법에서, 강제적인 상동성 재조합은 시험관내에서, 서로 다르지만 상당히 연관성이 있는 DNA 분자간에 일어나는 데, 이는 서열 상동성을 근거로 DNA 분자를 무작위 단편화한 후, PCR 반응에서 프라이머 연장반응에 의해 크로스오버를 고정시킨 결과로서 인한 것이다. 성 PCR 돌연변이유발법은 본원에서 참고로 인용된 Stemmer, W.P., PNAS, USA, 91:10747-10751, 1994에 개시되어 있다. 즉, 이러한 방법에서, 재조합 처리될 다수의 핵산은 DNAse로 분해되어 평균 크기가 50-200 뉴클레오티드인 단편을 생성한다. 소정의 평균 크기를 지닌 단편을 정제하고, 이를 PCR 혼합물중에 재현탁한다. PCR은 핵산 단편간의 재조합을 용이하게 하는 조건하에서 수행된다. 예를 들면, PCR은 각각의 dNTP, 2.2 mM의 MgCl2, 50 mM KCl, 10 mM 트리스 HCl, pH 9.0, 및 0.1%의 트리톤 X-100의 0.2 mM 용액중에 10-30 ng/㎕농도의 정제된 단편을 재현탁시키므로써 수행될 수 있다. 100:1의 반응 혼합물 당 2.5 유닛의 Taq 폴리머라제를 첨가하고, 하기의 순서를 사용하여 PCR을 수행한다: 94℃에서 60초간, 94℃에서 30초간, 50-55℃에서 30초간, 72℃에서 30초간(30-45회) 및 72℃에서 5분간. 그러나, 이들 매개변수는 적절히 변형될 수 있다. 일부 구체예에서, 올리고뉴클레오티드는 PCR 반응에 포함될 수 있다. 다른 구체예에서는, DNA 폴리머라제 I의 클리나우 단편을 제1 세트의 PCR 반응에서 사용하고, Taq 폴리머라제는 제2세트의 PCR 반응에 사용할 수 있다. 재조합 서열을 분리하고 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
변이체는 또한 생체내 돌연변이유발법에 의해 생성될 수 있다. 일부 구체예에서, 목적 서열에서의 무작위 돌연변이는 하나 이상의 DNA 수복 경로에서 돌연변이를 운반하는 이. 콜리 균주와 같은 박테리아 균주에서 목적 서열을 증식시켜 생성된다. 이러한 "변이체" 균주는 야생형 모균주의 것보다 높은 무작위 변이율을 지닌다. 이들 균주중 하나에서 DNA를 증식시키면 종국적으로는 그 DNA중에서 무작위 돌연변이가 생성된다. 생체내 돌연변이유발법에 사용하기에 적합한 변이체 균주는 1991년 10월 31에 공개되고, 발명의 명칭이 "Methods for Phenotype Creation from Multiple Gene Populations"인 PCT 공개팜플렛 No. WO 91/16427에 기재되어 있다. 이 문헌은 전체가 본원에 참고로 인용된다.
변이체는 또한 카세트 돌연변이유발법을 사용하여 생성될 수 있다. 카세트 변이유발법의 경우 이본쇄 DNA 분자의 소영역은 천연 서열과는 다른 합성 올리고뉴클레오티드 "카세트"로 치환되었다. 올리고뉴클레오티드는 완전히 및/또는 부분적으로 무작위화된 천연 서열을 함유한다.
순환 앙상블 돌연변이유발법은 또한 변이체를 생성하는 데 사용될 수 있다. 순환 앙상블 돌연변이유발법은 아미노산 서열이 다른 표현형 연관 변이주의 다양한 집단을 생성하도록 개발된 단백질 가공(단백질 돌연변이유발법)을 위한 알고리즘이다. 이 방법은 피드백 메카니즘을 사용하여 조합 카세트 변이의 연속적인 회수를 조절한다. 순환 앙상블 돌연변이유발법은 본원에 전체가 참고로 인용된 Arkin, A.P. 및 Youvan, D.C., PNAS, USA, 89:7811-7815, 1992에 개시되어 있다.
일부 구체예에서, 변이체는 지수 앙상블 돌연변이유발법을 사용하여 생성된다. 지수 앙상블 돌연변이유발법은 독특하면서 기능성 변이주를 다량 지닌 조합 라이브러리를 생성하는 방법인데, 이 방법에서, 소그룹 잔기는 각 변형 위치에서 기능성 단백질을 리드하는 아미노산을 동정하도록 나란히 무작위화되어 있다. 지수 앙상블 돌연변이유발법에 관해서는 Delegrave, S & Youvan, D.C., Biotechnology Research, 11: 1548-1552, 1993(본원에 전체가 참고로 인용됨)에 개시되어 있다. 무작위 및 부위 지정 돌연변이유발법은 본원에 전체가 참고로 인용된 Biotechnology 4:450-455, 1993에서 Arnold, F.H., Current Opinion에 개시되어 있다.
일부 구체예에서, 변이체는 셔플링 과정을 이용하여 생성되는데, 이 과정은 구별된 폴리펩티드를 암호화하는 다수의 핵산 부위를 함께 융합시켜 키메라 폴리펩티드를 암호화하는 키메라 핵산 서열을 생성하는 것으로서, 이는 미국 특허 제5,965,408호(1996년 7월 9일), "Method of DNA Reassembly by Interrupting Synthesis", 및 미국 특허 5,939,250(1996년 5월 22일)의 "Production of Enzymes Having Desired Activities by Mutagenesis"에 개시되어 있다. 이 두 문헌은 본원에 참고로 인용되었다.
B 군 아미노산 서열의 폴리펩티드 변이체는 B 군 아미노산 서열의 폴리펩티드의 1개 이상의 아미노산 잔기가 보존된 또는 비보존된 아미노산 잔기(바람직하게는 보존된 아미노산 잔기)로 치환된 변이체가며, 이 치환된 아미노산 잔기는 유전 암호에 의해 암호화된 것이거나 또는 안된 것일 수 있다.
보존적 치환이란 폴리펩티드중에서 주어진 아미노산을 특성이 유사한 다른아미노산으로 치환시킨 것을 말한다. 일반적으로 보존적 치환체로 간주되는 것은 다음의 치환을 들 수 있다: 지방족 아미노산(예, 알라닌, 발린, 루이신 및 이소루이신)이 다른 지방족 아미노산으로 치환된 것; 세린을 트레오닌으로 치환하던지 또는 이와 반대로 치환하는 것; 아스팔트산 및 글루타민산과 같은 산성 잔기를 다른 산성 잔기로 치환하는 것; 아미드 기를 지닌 잔기(예, 아스파라진 및 글루타민)를 아미드 기를 갖는 다른 잔기로 치환하는 것; 리신 및 아르기닌과 같은 염기성 잔기를 다른 염기성 잔기로 교체하는 것; 및 페닐알라닌, 티로신과 같은 방향족 잔기를 다른 방향족 잔기로 치환하는 것.
기타 변이체는 B 군 아미노산 서열의 폴리펩티드의 아미노산 잔기중 1개 이상이 치환기를 함유한 것을 말한다.
또 다른 기타 변이체는 폴리펩티드가 폴리펩티드의 반감기를 증가시키는 화합물(예, 폴리에틸렌 글리콜)과 같은 다른 화합물과 화합된 것이다.
부가의 변이체는 부가의 아미노산이 리더 서열, 분비 서열, 프로프로테인 서열 또는 폴리펩티드의 정제, 농축, 또는 안정화를 용이케하는 서열과 같은 폴리펩티드에 융합된 것을 말한다.
일부 구체예에서, 단편, 유도체 및 아날로그는 B 군 아미노산 서열, 이것과 실질적으로 동일한 서열과 동일한 생물학적 기능 또는 활성을 보유한다. 다른 구체예에서, 단편, 유도체 또는 아날로그는 프로프로테인을 포함하므로 단편, 유도체, 또는 아날로그등은 프로프로테인을 분해하여 활성화시키면 활성 폴리펩티드를 생성한다.
본 발명의 다른 범주는 B 군 아미노산 서열, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 포함하는 단편중 하나에 대해서 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 65% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 95% 이상의 상동성을 갖는 폴리펩티드 또는 이의 단편이다. 상동성은 전술한 프로그램중 어느것에 의해서도 측정할 수있으며, 이들 프로그램은 비교된 폴리펩티드 또는 단편을 배열하여 이들간의 아미노산 동일성 또는 유사성 정도를 측정하는 것이다. 아미노산 "상동성"은 전술한 보존적 아미노산 치환을 포함하는 의미이다.
B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 포함하는 단편중 하나와 상동성을 갖는 폴리펩티드 또는 단편은 전술한 기술을 사용하여 이들을 암호화하는 핵산을 분리함으로써 제조될 수 있다.
또는, 상동성의 폴리펩티드 또는 단편들은 생화학적 농축 방법 또는 정제 방법을 사용하여 얻을 수 있다. 잠재적 상동성을 지닌 폴리펩티드 또는 단편들의 서열은 단백질 분해, 겔 전기 영동 및/또는 마이크로시퀀싱에 의해 측정될 수 있다. 추정된 상동성 폴리펩티드 또는 단편의 서열은 전술한 임의의 프로그램을 사용하여 B 군 아미노산 서열의 폴리펩티드, 이것과 실질적으로 동일한 서열, 또는 이것의 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개 이상의 연속 아미노산을 함유하는 단편중 하나와 비교할 수 있다.
본 발명의 다른 범주는 B 군 아미노산 서열, 및 이것과 실질적으로 동일한 서열의 폴리펩티드의 효소 기능을 보유하는, B 군 아미노산 서열, 및 이것과 실질적으로 동일한 서열의 단편 또는 변이체를 동정하는 분석에 관한 것이다 예를 들면, 상기 폴리펩티드의 단편 또는 변이체를 사용하여 생화학적 반응을 촉진할 수있는데, 이는 단편이나 또는 변이체가 B 군의 아미노산 서열의 폴리펩티드 효소 활성을 보유한다는 것을 의미한다.
변이체 또는 단편이 B 군 아미노산 서열의 폴리펩티드, 이것과 실질적으로 동일한 서열의 효소 활성을 보유하는 지 여부를 측정하는 분석은 다음 단계를 포함한다: 폴리펩티드 단편 또는 변이체를 폴리펩티드 단편 또는 변이체가 기능을 발휘하도록 하는 조건하에서 기질 분자와 접촉시키는 단계, 폴리펩티드와 기질간의 반응에서 특정 반응 생성물 양의 증가 또는 기질 양의 감소를 검출하는 단계.
B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 함유하는 단편은 다양한 용도로 사용될 수 있다. 예컨대, 폴리펩티드 또는 이의 단편을 사용하여 생화학적 반응을 촉진할 수 있다. 본 발명의 한 관점에 따라, B 군 아미노산 서열의 폴리펩티드, 이것과 실질적으로 동일한 서열, 또는 글리코시드 결합을 가수분해하는 이런 폴리펩티드를 암호화하는 폴리뉴클레오티드를 이용하는 방법이 제공된다. 이러한 방법에서, 글리코시드 결합의 가수분해를 용이하게 하는 조건하에서 글리코시드 결합을 함유하는 기질(예, 전분)을 B 군 아미노산 서열의 폴리펩티드 또는 이것과 실질적으로 동일한 서열중 하나와 접촉시킨다.
B 군 아미노산 서열, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산을 포함하는 단편을 사용하여 폴리펩티드 또는 단편에 특이적으로 결합하는 항체를 생성할 수 있다. 생성된 항체를 면역 친화성 크로마토그래피 방법에 사용하여 폴리펩티드를 분리 또는 정제하거나 또는 폴리펩티드가 생물학적 샘플중에 존재하는지 여부를 측정할 수있다. 이러한 방법에서, 단백질 제제, 예를 들면 추출물 또는 생물학적 샘플을 B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개 이상의 연속 아미노산을 포함하는 단편중 하나에 특이적으로 결합할 수있는 항체와 접촉시킨다.
면역친화성 방법에서, 항체는 비드 또는 다른 칼럼 매트릭스와 같은 고체 지지체에 부착된다. 단백질 제제물을 항체가 특이적으로 B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이의 단편중 하나에 특이적으로 결합하는 조건하에서 항체와 접촉시킨다. 비특이적으로 결합된 단백질을 제거하기 위해 세척한 후, 특이적으로 결합된 폴리펩티드를 용출시킨다.
생물학적 샘플중에서 단백질이 항체와 결합할 수 있는 역량은 당업자에 익숙한 다양한 임의의 방법을 사용하여 측정될 수 있다. 예를 들면, 항체를 검출 가능한 라벨(예, 형광제, 효소 라벨 또는 방사성 동위원소)로 표지하여 결합을 측정할 수 있다. 또는, 이러한 검출 가능한 라벨을 지닌 이차 항체를 사용하여 샘플에 대한 항체의 결합을 검출할 수 있다. 특정 분석법으로는 ELISA 분석법, 샌드위치 분석법, 방사면역분석법 및 웨스턴 블롯을 포함한다.
B 군 아미노산 서열의 폴리펩티드, 및 이것과 실질적으로 동일한 서열, 또는 이것의 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 또는 150개 이상의 연속 아미노산에 대해서 생성된 폴리클로날 항체는 폴리펩티드를 동물에 직접 주사하거나 또는 이 폴리펩티드를 동물(예컨대, 사람을 제외한 동물)에 투여함으로써 얻을 수 있다. 이렇게 얻은 항체를 폴리펩티드 그자체에 결합시킨다. 이러한 방식으로, 폴리펩티드의 단편만을 암호화하는 서열을 사용하여 전체의 천연 폴리펩티드에 결합할 수있는 항체가 생성되고, 그 항체를 사용하여 폴리펩티드를 발현하는 세포로부터 폴리펩티드를 분리한다.
모노클로날 항체를 제조하기 위하여, 연속 세포주 배양액에 의하여 생성되는 항체를 제공하는 임의의 기법이 사용될 수 있다. 그 예로서는 하이브리도마 기법(Kohler and Milstein, Nature, 256:495-497, 1975, 본원에 참고 문헌으로 인용됨), 트리오마 기법, 인간 B 세포 하이브리도마 기법(Kozbor외 다수, Immunology Today 4:72, 1983, 본원에 참고 문헌으로 인용됨) 및 EBV-하이브리도마 기법(Cole외 다수, 1985, Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc.,pp.77-96, 본원에 참고 문헌으로 인용됨)을 포함한다.
단일 사슬 항체의 생성에 관하여 기술된 기법(미국 특허 제4,946,778호, 본원에 참고 문헌으로 인용함)은 B 군 아미노산 서열의 폴리펩티드 및 이것과 실질적으로 동일한 서열, 또는 이의 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개 또는 150개 이상의 연속 아미노산을 포함하는 이의 단편에 대한단일 사슬 항체를 생성하는데에 적용될 수 있다. 또는 트랜스게닉 마우스는 상기 폴리펩티드 또는 이의 단편에 대한 인간화된 항체를 발현시키는데에 사용될 수 있다.
B 군 아미노산 서열의 폴리펩티드 및 이와 실질적으로 동일한 서열, 또는 이의 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개 또는 150개 이상의 연속 아미노산을 포함하는 단편에 대하여 생성된 항체는 다른 유기체 및 샘플로부터 얻어진 유사한 폴리펩티드의 스크리닝에 사용될 수 있다. 이러한 기법에서, 유기체로부터 얻어진 폴리펩티드는 항체와 접촉하게 되며, 이로써 항체에 특이적으로 결합하는 폴리펩티드가 확인된다. 전술한 방법들중 임의의 방법이 항체 결합을 확인하는데에 사용될 수 있다. 이러한 스크리닝 분석법중 하나의 방법은 문헌["Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol 160, pp.87-116, 본원에 그 자체로서 참고 문헌으로 인용되어 있음]에 기술되어 있다.
본원에 사용된 "서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 43, 45 및 47에 나타낸 핵산 서열"이란 용어는 A 군 핵산 서열의 뉴클레오티드 서열, 이와 실질적으로 동일한 서열, 및 A 군 핵산 서열에 상동성인 서열 및 이의 단편과 전술한 모든 서열에 상보적인 서열을 포함한다. 상기 단편은 A 군 핵산 서열의 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개, 150개, 200개, 300개, 400개 또는 500개 이상의 연속 뉴클레오티드를 포함하는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33,35, 37, 43, 45 및 47의 일부분, 및 이와 실질적으로 동일한 서열을 포함한다. A 군 핵산 서열의 상동성 서열 및 단편, 그리고 이와 실질적으로 동일한 서열이란, 이 서열에 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55% 또는 50% 이상의 상동성을 보유하는 서열을 의미한다. 상동성은 디폴트 매개변수를 이용하는 FASTA 버젼 3.0t78을 비롯한, 본원에 기술된 컴퓨터 프로그램 및 매개변수중 임의의 것을 사용하여 결정될 수 있다. 상동성 서열은 또한 A 군 핵산 서열에 나타낸 핵산 서열중 티민이 우리딘으로 치환된 RNA 서열을 포함한다. 상동성 서열은 본원에 기술된 방법중 임의의 방법을 사용하여 얻어질 수 있거나 또는 서열 결정 오류를 정정함으로 인하여 생성될 수 있다. A 군 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열은 통상의 1문자 포멧(Stryer, Lubert,Biochemistry, 3rd Ed., W.H.Freeman & Co., New York 참조) 또는 서열중 뉴클레오티드의 동일성을 기록하는 임의의 다른 포멧으로 나타낼 수 있다.
본원에 사용된 "서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48"이란 용어는, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 43, 45 및 47에 나타낸 서열에 의하여 암호화되는, B 군 아미노산 서열의 폴리펩티드 서열 및 B 군 아미노산 서열의 폴리펩티드와 실질적으로 동일한 서열, B 군 아미노산 서열의 폴리펩티드에 상동성인 폴리펩티드 서열 및 이와 실질적으로 동일한 서열, 또는 전술한 서열중 임의의 서열의 단편을 포함한다. 상동성 폴리펩티드 서열이란, B 군 아미노산 서열의 폴리펩티드 서열중 하나와 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%,65%, 60%, 55% 또는 50% 이상의 상동성을 보유하는 폴리펩티드 서열을 의미한다. 상동성은 디폴트 매개변수 또는 임의의 변형된 매개변수를 이용하는 FASTA 버젼 3.0t78을 비롯한, 본원에 기술된 임의의 컴퓨터 프로그램 및 매개변수를 사용하여 결정될 수 있다. 상동성 서열은 본원에 기술된 임의의 방법을 사용하여 얻을 수 있거나 또는 서열 결정 오류를 정정함으로써 얻을 수 있다. 상기 폴리펩티드 단편은 B 군 아미노산 서열의 폴리펩티드의 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 75개, 100개 또는 150개 이상의 연속 아미노산, 및 이와 실질적으로 동일한 서열을 포함한다. B 군 아미노산 서열에 나타낸 폴리펩티드 암호 및 이와 실질적으로 동일한 서열은 통상의 1문자 포멧 또는 3문자 포멧[Stryer, Lubert,Biochemistry, 3rd Ed., W.H.Freeman & Co., New York의 내부 뒷표지 참조] 또는 서열중 폴리펩티드의 동일성과 관련된 임의의 다른 포멧으로 나타낼 수 있다는 것을 이해할 것이다.
당업자는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 43, 45 및 47에 나타낸 핵산 서열 및 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 나타낸 폴리펩티드 서열은 컴퓨터에 의하여 판독할 수 있으며 엑세스가 가능한 임의의 매체상에 저장, 기록 및 조작될 수 있음을 이해할 것이다. 본원에 사용된 "기록된" 및 "저장된"이란 용어는 컴퓨터 매체상에 정보를 저장하는 방식을 의미한다. 당업자는 컴퓨터 판독가능한 매체상에 정보를 기록하기 위한 현재 공지된 방법중 임의의 방법을 용이하게 채택하여 A 군 핵산 서열에 나타낸 1 이상의 핵산 서열 및 이와 실질적으로 동일한 서열, B 군 아미노산 서열에 나타낸 폴리펩티드 서열중 1 이상의 서열 및 이와 실질적으로 동일한 서열을 생성할 수 있다. 본 발명의 다른 측면은 A 군 핵산 서열에 나타낸 2개, 5개, 10개, 15개 또는 20개 이상의 핵산 서열 및 이와 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다.
본 발명의 다른 측면은 A 군 핵산 서열에 나타낸 1 이상의 핵산 서열 및 이와 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다. 본 발명의 다른 측면은 B 군 아미노산 서열에 나타낸 폴리펩티드 서열중 1 이상 및 이와 실질적으로 동일한 서열이 기록된 컴퓨터 판독가능한 매체이다. 본 발명의 다른 측면은 전술한 바와 같은 2개, 5개, 10개, 15개 또는 20개 이상의 서열이 기록된 컴퓨터 판독가능한 매체이다.
컴퓨터 판독가능한 매체는 자기적으로 판독가능한 매체, 광학적으로 판독가능한 매체, 전자적으로 판독가능한 매체 및 자기적/광학적 매체를 포함한다. 예를 들어, 컴퓨터 판독가능한 매체는 하드 디스크, 플로피 디스크, 자기 테이프, CD-ROM, 디지털 버서타일 디스크(Digital Versatile Disk ; DVD), 랜덤 엑세스 메모리(Random Access Memory ; RAM) 또는 리드 온리 메모리(Read Only Memory ; ROM) 뿐만 아니라, 당업자에게 공지된 다른 유형의 기타 매체일 수 있다.
본 발명의 구체예로서는 시스템(예, 인터넷에 기초한 시스템), 구체적으로 본원에 기술된 서열 정보를 저장 및 조작하는 컴퓨터 시스템을 포함한다. 컴퓨터 시스템(100)의 하나의 예는 도 1에 블록 다이어그램 형태로 예시되어 있다. 본원에 사용된 "컴퓨터 시스템"이란, A 군 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드서열 및 이와 실질적으로 동일한 서열, 또는 B 군 아미노산 서열에 나타낸 폴리펩티드 서열을 분석하는데에 사용되는 하드웨어 부품, 소프트웨어 부품 및 데이타 저장 부품을 의미한다. 상기 컴퓨터 시스템(100)은 통상적으로 서열 데이타를 처리, 엑세스 및 조작하기 위한 프로세서를 포함한다. 상기 프로세서(105)는 임의의 널리 공지된 유형의 중앙 처리 유닛 예컨대, 인텔 코포레이숀의 펜티엄 Ⅲ, 또는 썬, 모토로라, 컴팩, AMD 또는 인터내셔날 비지니스 머신으로부터 입수된 유사 프로세서일 수 있다.
통상적으로 컴퓨터 시스템(100)은 프로세서(105) 및 데이타를 저장하기 위한 1 이상의 인터넷 데이타 저장 부품(110), 및 데이타 저장 부품상에 저장된 데이타를 검색하기 위한 1 이상의 데이타 검색 장치를 포함하는 일반 목적의 시스템이다. 당업자는 현재 사용될 수 있는 컴퓨터 시스템중 임의의 하나가 적당하다는 사실을 용이하게 이해할 것이다.
하나의 특정 구체예에서, 컴퓨터 시스템(100)은 주요 메모리(115)(바람직하게는 RAM으로서 설치된) 및 1 이상의 내부 데이타 저장 장치(110) 예컨대, 데이타가 기록되어 있는 하드 드라이브 및/또는 다른 컴퓨터 판독가능한 매체에 연결되어 있는 모선과 연결된 프로세서(105)를 포함한다. 몇몇 구체예에서, 컴퓨터 시스템(100)은 추가로 내부 데이타 저장 장치(110)에 저장된 데이타를 판독하기 위한 1 이상의 데이타 검색 장치(118)를 포함한다.
데이타 검색 장치(118)는 예를 들어, 플로피 디스크 드라이브, 컴팩트 디스크 드라이브, 자기 테이프 드라이브, 또는 원거리 데이타 저장 시스템에(예, 인터넷을 통하여) 접속할 수 있는 모뎀 등일 수 있다. 몇몇 구체예에서, 내부 데이타 저장 장치(110)는 제어 논리 및/또는 데이타가 기록되어 있는, 분리 가능한 컴퓨터 판독가능한 매체 예컨대, 플로피 디스크, 컴팩트 디스크, 자기 테이프 등이다. 컴퓨터 시스템(100)은 유리하게는 일단 데이타 검색 장치에 삽입된 데이타 저장 부품으로부터 얻어지는 제어 논리 및/또는 데이타를 판독하기 위한 적당한 소프트웨어를 포함하거나 또는 이에 의하여 프로그램될 수 있다.
상기 컴퓨터 시스템(100)은 컴퓨터 사용자에게 출력 내용을 디스플레이 하는 디스플레이(120)를 포함한다. 또한 상기 컴퓨터 시스템(100)은 컴퓨터 시스템(100)에 집중된 엑세스를 제공하는 네트워크 또는 광역 네트워크중 다른 컴퓨터 시스템 125a-c에 연결될 수 있다는 사실에 주목해야 할 것이다.
A 군 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 이와 실질적으로 동일한 서열, 또는 B 군 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열의 뉴클레오티드 서열을 엑세싱 및 프로세싱하기 위한 소프트웨어(예컨대, 써치 도구, 비교 도구 및 모델링 도구 등)는 수행중 주요 메모리(115)에 내재할 수 있다.
몇몇 구체예에서, 컴퓨터 시스템(100)은 추가로 컴퓨터 판독가능한 매체상에 저장된 A 군 핵산 서열에 나타낸 핵산 서열 및 이와 실질적으로 동일한 서열, 또는 B 군 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열을 컴퓨터 판독가능한 매체상에 저장된 참조 뉴클레오티드 또는 폴리펩티드 서열(들)과 비교하기 위한 서열 비교 알고리즘을 포함할 수 있다. "서열 비교 알고리즘"이란, 뉴클레오티드 서열과 데이타 저장 수단에 저장된 다른 뉴클레오티드 서열 및/또는 화합물을 비교하기 위한 컴퓨터 시스템(100)상에 설치된(직접적으로(locally) 또는 원거리로(remotely) 설치된) 1 이상의 프로그램을 의미한다. 예를 들어, 서열 비교 알고리즘은 컴퓨터 판독가능한 매체상에 저장된 A 군 핵산 서열에 나타낸 핵산 서열의 뉴클레오티드 서열 및 이와 실질적으로 동일한 서열, 또는 B 군 아미노산 서열에 나타낸 폴리펩티드 서열 및 이와 실질적으로 동일한 서열을 상동성 또는 구조적 모티프를 확인하기 위한 컴퓨터 판독가능한 매체상에 저장된 참조 서열과 비교할 수 있다. 본 특허출원 명세서중에 제시된 다양한 서열 비교 프로그램은 특히 본 발명의 이러한 측면에 사용하기 위한 것으로 간주된다. 단백질 및/또는 핵산 서열 상동성은 당 업계에 공지된 다양한 서열 비교 알고리즘 및 프로그램중 임의의 것을 사용하여 평가될 수 있다. 이러한 알고리즘 및 프로그램으로는 TBLASTN, BLASTP, FASTA, TFASTA 및 CLUSTALW(Pearson 및 Lipman, Proc.Natl.Acad.Sci. USA 85(8):2444-2448, 1988 ; Altschul외 다수, J.Mol.Biol.215(3):403-410, 1990 ; Thompson외 다수, Nucleic Acids Res.22(2):4673-4680, 1994 ; Higgins외 다수, Methods Enzymol.266:383-402, 1996 ; Altschul외 다수, J.Mol.Biol.215(3):403-410, 1990 ; Altschul외 다수, Nature Genetics 3:266-272, 1993)를 포함하나, 이에 한정되는 것은 결코 아니다.
상동성 또는 동일성은 종종 서열 분석 소프트웨어(예, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705)를 사용하여측정된다. 이러한 소프트웨어는 다양한 결실, 치환 및 기타 변형에 대한 상동성에 등급을 부여하여 유사한 서열과 매치시킨다. 2 이상의 핵산 또는 폴리펩티드 서열에 있어서 "상동성" 및 "동일성"이란 용어는, 임의의 수의 서열 비교 알고리즘을 사용하거나 또는 수동식 정렬 및 시각에 의한 관찰에 의하여 측정된 비교 윈도우 또는 특정 영역에 대한 최대 대응값에 대하여 비교하고 정렬되었을때에 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드를 특정 비율로 보유하는 2 이상의 서열 또는 부분 서열(subsequence)을 의미한다.
서열 비교를 위하여, 통상적으로 하나의 서열은, 테스트 서열과 비교되는 참조 서열의 역할을 한다. 서열 비교 알고리즘을 사용할 경우, 테스트 서열 및 참조 서열은 컴퓨터에 입력되며, 필요에 따라서는 서열 좌표가 지정되고, 서열 알고리즘 프로그램 매개변수가 지정된다. 디폴트 프로그램 매개변수가 사용되거나, 또는 매개변수가 지정될 수 있다. 이후 서열 비교 알고리즘은, 프로그램 매개변수를 기초로 하여 참조 서열에 상대적인 테스트 서열에 관한 서열 동일성 %를 계산한다.
본원에서 "비교 윈도우"는 2개의 서열들을 최적으로 정렬한후 연속 위치의 동일한 번호를 보유하는 참조 서열과 서열이 비교될 수 있는, 20∼600, 일반적으로 약 50∼약 200, 더욱 일반적으로 약 100∼약 150으로 이루어진 군으로부터 선택된 연속 위치의 번호 중 어느 하나의 번호를 보유하는 분절에 대한 참조 기준을 포함한다. 비교를 위하여 서열을 정렬하는 방법은 당 업계에 널리 공지되어 있다. 비교를 위한 서열의 최적 정렬은 예를 들어, Smith & Waterman의 로컬 상동성 알고리즘(Adv.Appl.Math.2:482, 1981), Needleman & Wunsch의 상동성 정렬 알고리즘(J.Mol.Biol.48:443, 1970), Pearson & Lipman의 유사도 방법에 대한 써치(Proc.Nat'l.Acad.Sci.USA 85:2444, 1998), 이러한 알고리즘의 컴퓨터화된 실행(Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI의 GAP, BESTFIT, FASTA 및 TFASTA) 또는 수동식 정렬 및 시각에 의한 관찰에 의하여 수행될 수 있다. 상동성 또는 동일성을 결정하기 위한 다른 알고리즘으로서는 예를 들어, BLAST 프로그램(National Center for Biological Information의 Basic Local Alignment Search Tool) 이외에도, ALIGN, AMAS(Analysis of Multiply Aligned Sequences), AMP(Protein Multiple Sequence Alignment), ASSET(Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN(Biological Sequence Comparative Analysis Node), BLIMPS(Blocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman 알고리즘, DARWIN, Las Vegas 알고리즘, FNAT(Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC , FILTER, FSAP(Fristensky Sequence Analysis Package), GAP(Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC(Sensitive Sequence Comparison), LALIGN(Local Sequence Alignment), LCP(Local Content Program), MACAW(Multiple Alignment Construction & Analysis Workbench), MAP(Multiple Alignment Program), MBLKP, MBLKN, PIMA(Pattern-Induced Multisequence Alignment), SAGA(Sequence Alignment by Genetic Algorithm) 및 WHAT-IF를 포함한다. 이러한 정렬 프로그램은 또한 실질적으로 동일한 서열을 보유하는 폴리뉴클레오티드 서열을 확인하는 게놈 데이타 베이스를 스크리닝하는데에 사용될 수도 있다. 다수의 게놈 데이타 베이스가 유용한데, 예를 들어 인간 게놈의 상당 부분은 인간 게놈 서열 결정 프로젝트(J.Roach, http://weber.u.Washington.edu/~roach/human_genome_progress 2.html)(Gibbs, 1995)의 일부로서 유용하다. 예를 들어, 엠.제니탈리움(M.genitalium)(Fraser 외 다수, 1995), 엠.재나쉬(M.jannaschii)(Bult 등, 1996), 에이치. 인플루엔자에(H.influenzae)(Fleischmann 등, 1995), 이. 콜라이(E.coli)(Blattner 등, 1997), 및 효모(에스. 세레비지애(S.cerevisiae)(Mewes 등, 1997), 및 디.멜라노가스터(D.melanogaster)(Adams 등, 2000)를 포함하여 21개 이상의 다른 게놈들은 이미 서열 결정되어 있다. 모델 유기체 예컨대, 마우스, 씨.엘레간스(C.elegans) 및 아라바돕시스 종(Arabadopsis sp.)의 게놈을 서열 결정하는것도 상당히 진척되었다. 몇몇 기능에 관한 정보로 주석을 단 게놈 정보를 포함하는 몇몇 데이타 베이스는 여러 기관에 의하여 보유되며, 이는 인터넷 예를 들어, http://wwwtigr.org/tdb; http://www.genetics.wisc.edu; http://genome-www.stanford.edu/~ball; http://hiv-web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk; http://Pasteur.fr/other/biology; 및 http://www.genome. wi.mit.edu을 통하여 입수할 수 있다.
유용한 알고리즘의 예로서는 BLAST 및 BLAST 2.0 알고리즘이 있는데, 이에 관하여는 각각 Altschul외 다수의 문헌[Nuc.Acids Res.25:3389-3402, 1977 및 J.Mol.Biol. 215:403-410, 1990]에 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/)을 통하여 공개적으로 입수할 수 있다. 이 알고리즘은 우선 의문 서열중 길이 W의 짧은 문자들을 확인함으로써 고 스코어 생성 서열 쌍(High Scoring Sequence Pairs ; HSPs)을 확인하는 것을 포함하는데, 여기서 상기 쌍들은 데이타 베이스 서열중 동일한 길이의 문자로 정렬되었을때 몇몇 양의 값의 역치 스코어 T와 매치되거나 또는 이를 만족시킨다. T는 이웃하는 문자 스코어 역치를 의미한다(Altschul 등, 상기문헌참조). 이러한 처음의 연속하는 문자 히트(hit)는 이를 포함하는 더욱 긴 HSPs를 찾기 위한 써치를 개시하는 시드(seed)의 역할을 한다. 상기 문자 히트는 누적 정렬 스코어(cumulative alignment score)가 증가할때까지 각 서열을 따라서 양 방향으로 확장된다. 뉴클레오티드 서열에 대한 누적 스코어는 매개변수 M(매치되는 잔기들의 쌍에 대한 리워드 스코어(reward score) ; 항상 0 보다 큼)을 사용하여 계산된다. 아미노산 서열에 대하여, 누적 스코어를 계산하는데에 스코어 생성 매트릭스가 사용된다. 상기 문자 히트의 각 방향으로의 연장은 ; 누적 정렬 스코어가 이의 얻어진 최대 값으로부터 양 X만큼 감소될 때 ; 1 이상의 음의 스코어 값을 갖는 잔기 정렬이 축적됨으로 인하여, 누적 스코어가 0 또는 그 이하로 될 때 ; 또는 둘중 어느 하나의 서열의 말단이 도착할 때에 중지된다. 상기 BLAST 알고리즘 매개변수인 W, T 및 X는 정렬의 정확도 및 속도를 결정한다. 상기 BLASTN 프로그램(뉴클레오티드 서열에 대한)은 디폴트 값으로서 문자의 길이(W) 11, 기대치(E) 10, M = 5, N = -4 및 양 서열의 비교값을 사용한다. 아미노산 서열에 있어서, BLASTP 프로그램은 디폴트값으로서 문자의 길이 3, 및 기대치(E) 10, 그리고 BLOSUM62 스코어 생성 매트릭스(Henikoff & Henikoff, Proc.Natl.Acad.Sci.USA 89:10915, 1989) 정렬(B) 50, 기대치(E) 10, M = 5, N = -4 및 양 사슬의 비교값을 사용한다.
상기 BLAST 알고리즘은 또한 2개의 서열간 유사도의 통계학적 분석법을 수행한다[예를 들어, Karlin & Altschul, Proc.Natl.Acad.Sci.USA 90:5873, 1993]. BLAST 알고리즘에 의하여 제공된 유사도 측정의 한 수단으로서는 가장 작은 총계 확률(P(N))이 있는데, 이는 2개의 뉴클레오티드 또는 아미노산 서열간의 매치가 우연히 발생할 확률을 나타낸다. 예를 들어, 핵산은 테스트 핵산과 참조 핵산의 비교시 가장 작은 총계 확률도가 약 0.2 미만, 더욱 바람직하게는 약 0.01 미만 및 가장 바람직하게는 약 0.001 미만이면, 참조 서열과 유사한 것으로 간주된다.
하나의 구체예에서, 단백질 및 핵산 서열 상동성은 Basic Local Alignment Search Tool("BLAST")을 사용하여 평가된다. 특히, 5개의 특정 BLAST 프로그램은 다음과 같은 작업을 수행하는데에 사용된다.
(1) BLASTP 및 BLAST3는 아미노산 의문 서열과 단백질 서열 데이타 베이스를 비교하고 ;
(2) BLASTN은 뉴클레오티드 의문 서열과 뉴크렐오타이드 서열 데이타 베이스를 비교하며 ;
(3) BLASTX는 의문 뉴클레오티드 서열(양 사슬)의 6개의 프레임 개념 번역 생성물과 단백질 서열 데이타 베이스를 비교하고 ;
(4) TBLASTN은 의문 단백질 서열과 6개의 번역 프레임(양 서열) 모두에서 번역된 뉴클레오티드 서열 데이타 베이스를 비교하며 ; 그리고
(5) TBLASTX는 뉴클레오티드 의문 서열의 6개의 프레임 번역물을 뉴클레오티드 서열 데이타 베이스의 6개의 프레임 번역물과 비교한다.
상기 BLAST 프로그램은, 본원에서 "고 스코어 생성 분절 쌍(high-scoring segment pairs)"이라 칭하여지는, 의문 아미노산 서열 또는 핵산 서열과 단백질 또는 핵산 서열 데이타 베이스로부터 얻어지는 것이 바람직한 테스트 서열 사이의 유사한 분절을 확인함으로써 상동성 서열을 확인한다. 고 스코어 생성 분절 쌍은 바람직하게는 스코어 생성 매트릭스(이중 다수는 당 업계에 공지됨)에 의하여 확인된다(즉, 정렬된다). 사용된 스코어 생성 매트릭스는 BLOSUM62 매트릭스(Gonnet외 다수, Science 256:1443-1445, 1992 ; Henikoff 및 Henikoff, Proteins 17:49-61, 1993)인 것이 바람직하다. 이보다는 덜 바람직하지만, PAM 또는 PAM250 매트릭스도 사용될 수 있다[Schwartz 및 Dayhoff편저, 1978, Matrices for Detecting Distance Relationships : Atlas of Protein Sequence and Structure, Washington : National Biomedical Research Foundation]. BLAST 프로그램은 U.S. National Library of Machine, 예를 들어 www.ncbi.nlm.nih.gov를 통하여 입수할 수 있다.
상기 알고리즘에 사용되는 매개변수들은 연구된 서열 길이 및 상동성의 정도에 따라서 조정될 수 있다. 몇몇 구체예에서, 상기 매개변수들은 사용자의 지시가 없는 알고리즘에 의하여 사용된 디폴트 매개변수일 수 있다.
도 2는 신규의 서열과 데이타 베이스 서열 사이의 상동성 수준을 결정하기 위하여 신규의 뉴클레오티드 또는 단백질 서열과 서열 데이타 베이스를 비교하기위한 프로세스(200)의 하나의 구체예를 나타내는 순서도이다. 서열의 데이타 베이스는 컴퓨터 시스템(100)내에 저장된 개인적인 데이타 베이스, 또는 예컨대 GENBANK와 같이 인터넷을 통하여 입수할 수 있는 공개된 데이타 베이스일 수 있다.
프로세스(200)는 출발 상태(201)에서 개시되어 이후 비교될 신규의 서열이 컴퓨터 시스템(100)의 메모리에 저장된 상태(202)로 진행된다. 전술한 바와 같이, 상기 메모리는 RAM 또는 내부 저장 장치를 비롯한 임의의 유형의 메모리일 수 있다.
프로세스(200)는 이후 서열 데이타 베이스가 분석 및 비교를 위하여 개방된 상태(204)로 진행된다. 이후 이 프로세스(200)는 데이타 베이스에 저장된 제1 서열이 컴퓨터상에 메모리로 판독되는 상태(206)로 진행된다. 이후 상태(210)에서 제1 서열이 제2 사열과 동일한지 여부를 결정하기 위하여 비교 단계가 수행된다. 이 단계는 신규의 서열 및 데이타 베이스중 제1 서열간을 정확하게 비교하는 것에 한정되지 않음을 인식하는 것이 중요하다. 뉴클레오티드 또는 단백질 서열이 동일하지는 않더라도, 2개의 뉴클레오티드 또는 단백질 서열을 비교하기 위한 널리 공지된 방법이 당업자에게 알려져 있다. 예를 들어, 2개의 테스트된 서열 사이의 상동성 수준을 높이기 위하여 이들 서열중 하나의 서열에 갭이 도입될 수 있다. 비교 수행중에 상기 갭 또는 다른 특징이 서열에 도입되는지 여부를 제어하는 매개변수들은 보통 컴퓨터 시스템 사용자에 의하여 도입된다.
일단 스테이트(210)에서 두 서열의 비교가 이루어지면, 두 서열이 동일한 지 여부가 결정 스테이트(210)에서 결정된다. 물론, "동일" 이라는 개념은 완전히 동일한 서열에 한정되지 않는다. 사용자에 의해 입력된 상동성 매개변수내의 서열은 프로세스(200)에서 "동일한" 것으로 표시될 것이다.
두 서열이 동일하다고 결정되면, 프로세스(200)는 스테이트(214)로 이동하며, 여기서 데이타베이스로부터의 서열의 이름이 사용자에게 보여진다. 이 스테이트는 사용자에게 나타난 이름을 갖는 서열이, 입력된 상동성 조건을 충족함을 알려준다. 일단 저장된 서열의 이름이 사용자에게 보여지면, 프로세스(200)은 결정 스테이트(218)로 이동하며, 여기서 데이타베이스에 더 이상의 서열이 존재하는 지 여부가 결정된다. 만일 더 이상의 서열이 데이타베이스에 존재하지 않으면, 프로세스(200)은 최종 스테이트(220)에서 종결된다. 하지만, 만일 데이타베이스에 더 이상의 서열이 존재하면, 프로세스(200)은 스테이트(224)로 이동하며, 여기서 포인터가 데이타베이스내의 다음 서열로 이동하여 새로운 서열과 비교될 수 있다. 이러한 방식으로, 새로운 서열이 배열되고, 데이타베이스내의 모든 서열과 비교된다.
만일 결정 스테이트(212)에서 서열들이 상동성이 아닌 것으로 결정되면, 프로세스(200)은 비교를 위한 어떤 다른 서열이 데이타베이스에 존재하는 지 여부를 결정하기 위하여 결정 스테이트(218)로 즉시 이동할 것이다.
따라서, 본 발명의 한 가지 관점은 프로세서, A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열 및 그와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열을 저장하고 있는 데이타 저장 장치, A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열 및 그와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열과 비교될 기준 뉴클레오티드 서열 또는 폴리펩티드 서열을 검색할 수 있게 저장하고 있는 데이타 저장 장치, 및 비교를 수행하는 서열 비교기를 포함하는 컴퓨터 시스템이다. 서열 비교기는 비교되는 서열간의 상동성 정도를 나타내거나, 또는 전술한 A 군 핵산 서열 및 그와 실질적으로 동일한 서열의 핵산 코드, 또는 B 군 아미노산 서열 및 그와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열에서 구조적 모티프를 동정하거나, 또는 이들 핵산 코드와 폴리펩티드 코드에 비교되는 서열에서 구조적 모티프를 동정할 수도 있다. 일부 구체예에서, 데이타 저장 장치는 A 군 핵산 서열 및 그와 실질적으로 동일한 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열 및 그와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열 중 2, 5, 10, 15, 20, 25, 30 또는 40개 또는 그 이상의 서열을 저장할 수도 있다.
본 발명의 다른 관점은 A 군 핵산 서열 및 그와 실질적으로 동일한 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열 및 그와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열과 기준 뉴클레오티드 서열간의 상동성 정도를 결정하는 방법이다. 이 방법은 상동성 정도를 결정하는 컴퓨터 프로그램을 사용하여 핵산 코드 또는 폴리펩티드 코드 및 기준 뉴클레오티드 또는 폴리펩티드 서열을 판독하고, 핵산 코드 또는 폴리펩티드 코드와 기준 뉴클레오티드 또는 폴리펩티드 서열간의 상동성을 컴퓨터 프로그램으로 결정하는 것을 포함한다. 이 컴퓨터 프로그램은 본원에서 구체적으로 열거된 것들(예, 디폴트 매개변수를 갖거나 또는 임의의 변형된 매개변수를 갖는 BLAST2N)을 포함하여 상동성 정도를 결정하는 많은 컴퓨터 프로그램중 임의의 것일 수 있다. 본 발명 방법은 전술한 컴퓨터 시스템을 이용하여 실시될 수 있다. 이 방법은 또한 컴퓨터 프로그램을 사용하여, 전술한 A 군 핵산 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열에 개시된 폴리펩티드 서열 중 적어도 2, 5, 10, 15, 20, 25, 30 또는 40 또는 그 이상을 판독하고, 핵산 코드 또는 폴리펩티드 코드와 기준 뉴클레오티드 서열 또는 폴리펩티드 서열간의 상동성을 결정함으로써 실시될 수도 있다.
도 3은 두 서열이 상동인지를 결정하기 위한 컴퓨터에서 프로세스(250)의 한 구체예를 보여주는 흐름도이다. 프로세스(250)은 출발 스테이트(252)에서 시작하고 이어서 비교될 제1 서열이 메모리에 저장되는 스테이트(254)로 이동한다. 비교될 제2 서열은 이어서 스테이트(256)의 메모리에 저장된다. 이어서 프로세스(250)은 제 1 서열의 제 1 문자가 판독되는 스테이트(260)으로 이동하고 이어서 제 2 서열의 제 1 문자가 판독되는 스테이트(262)로 이동한다. 만일 서열이 뉴클레오티드 서열이면, 그 문자는 일반적으로 A, T, C, G, 또는 U일 것이다. 만일 서열이 단백질 서열이면, 단일 문자 아미노산 코드여서 제1 및 제 2 서열이 쉽게 비교될 수 있는 것이 바람직하다.
이어서, 두 문자가 동일한지 여부가 결정 스테이트(264)에서 결정된다. 만일 그들이 동일하면, 이어서 프로세스(250)이 스테이트(268)로 이동하고 여기서 제 1 및 2 서열의 다음 문자가 판독된다. 다음 문자가 동일한 지 여부가 결정된다. 만일 동일하면, 프로세스(250)은 두 문자가 상이할 때까지 이 루프를 계속 진행한다. 만일 다음 두 문자가 상이한 것으로 결정되면, 프로세스(250)은 판독해야 할 더 이상의 문자가 어느 한 서열에 있는지를 결정하기 위해 결정 스테이트(274)로 이동한다.
더 이상 판독할 문자가 없으면, 프로세스(250)은 스테이트(276)으로 이동하고 여기서 제1 및 제2 서열간의 상동성 정도가 사용자에게 보여진다. 상동성 정도는 제 1서열내의 문자의 총수 중 서열간에 동일한 문자의 비율을 계산함으로써 결정된다. 따라서, 만일 제1 100 뉴클레오티드 서열의 모든 문자가 제 2 서열의 모든 문자와 배열된다면, 그 상동성 정도는 100%가 될 것이다.
다르게는, 컴퓨터 프로그램은 본 발명에 개시된 핵산 서열의 뉴클레오티드 서열을 하나 이상의 기준 뉴클레오티드 서열과 비교하여, A 군 핵산 서열 및 이와 실질적으로 동일한 서열의 핵산 코드가 하나 이상의 위치에서 기준 핵산 서열과 상이한지를 결정하는 컴퓨터 프로그램일 수 있다. 임의로, 그러한 프로그램은 기준 폴리뉴클레오티드 또는 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열의 서열에 대하여 삽입, 결실, 또는 치환된 뉴클레오티드의 길이 및 정체를 기록한다. 한 구체예에서, 컴퓨터 프로그램은 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열이 기준 뉴클레오티드 서열에 대하여 단일 뉴클레오티드 다형성(SNP)를 함유하는지 여부를 결정하는 프로그램일 수도 있다.
따라서, 본 발명의 다른 관점은 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열이 기준 뉴클레오티드 서열과 하나 이상의 뉴클레오티드에서 상이한지 여부를 결정하는 방법으로서, 핵산 서열간의 차이를 동정하는 컴퓨터 프로그램을 사용하여 핵산 코드와 기준 뉴클레오티드 서열을 판독하는 단계 및 핵산 코드와 기준 뉴클레오티드 서열간의 차이를 컴퓨터 프로그램으로 확인하는 단계를 포함한다. 일부 구체예에서, 컴퓨터 프로그램은 단일 뉴클레오티드 다형태를 확인하는 프로그램이다. 이 방법은 전술한 컴퓨터 시스템 및 도 3에 도시된 방법에 의해 실시될 수도 있다. 이 방법은 또한 A 군 핵산 서열에 개시된 핵산 서열 및 이와 실질적으로 동일한 서열 중 적어도 2, 5, 10, 15, 20, 25, 30, 또는 40 또는 그 이상과 기준 뉴클레오티드 서열을 컴퓨터 프로그램을 이용하여 판독하고 핵산 코드와 기준 뉴클레오티드 서열간의 차이를 컴퓨터 프로그램으로 확인함으로써 실시될 수도 있다.
다른 구체예에서, 컴퓨터 기반 시스템은 A 군 핵산 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열내의 특징을 확인하기 위한 확인기를 추가로 포함할 수도 있다.
"동정기"는 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열, 및 B 군 아미노산 서열과 이에 실질적으로 동일한 서열에 개시된 폴리펩티드 서열내의 어떤 특징을 동정하는 하나 이상의 프로그램을 말한다. 한 구체예에서, 동정기는 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열의 오픈 리딩 프레임을 확인하는 프로그램을 포함할 수도 있다.
도 5는 서열 내의 특징의 존재를 검출하는 동정기 프로세스(300)의 한 구체예를 보여주는 흐름도이다. 프로세스(300)는 출발 스테이트(302)에서 시작하고 이어서 스테이트(304)로 이동하여, 여기서 특성이 검사될 제 1 서열이 컴퓨터 시스템(100)의 메모리(115)에 저장된다. 이어서 프로세스(300)은 서열 특징의 데이타베이스가 공개되는 스테이트(306)으로 이동한다. 그러한 데이타베이스는 특징의 명칭과 함께 각 특징의 속성의 리스트를 포함할 것이다. 예를 들어, 특징 명은 "개시 코돈" 이고 속성은 "ATG"일 것이다. 다른 예로는 특징 명은 "TAATAA 박스" 이고 특징의 속성은 "TAATAA"일 것이다. 그러한 데이타베이스의 예는 위스콘신 대학 유전학 컴퓨터 그룹(www.gcg.com)에 의해 만들어진다. 다르게는, 특징들은 알파 헬릭스, 베타 시트와 같은 구조적 폴리펩티드 모티프, 또는 효소 활성 부위, 헬릭스-턴-헬릭스 모티프와 같은 기능적 폴리펩티드 모티프 또는 당업계에 공지된 기타 모티프일 수 있다.
일단 특징의 데이타베이스가 스테이트(306)에서 공개되면, 프로세스(300)은 제 1 특징이 데이타베이스로부터 판독되는 스테이트(308)로 이동한다. 이어서 제 1 특징의 속성과 제 1 서열이 스테이트(310)에서 비교된다. 특징의 속성이 제 1 서열에서 발견되는 지 여부는 결정 스테이트(316)에서 결정된다. 만일 속성이 발견되면, 프로세스(300)은 발견된 특징의 명칭이 사용자에게 보여지는 스테이트(318)로 이동한다.
이어서 프로세스(300)은 특징이 더 데이타베이스에 존재하는지 여부를 결정하는 결정 스테이트(320)으로 이동한다. 만일 특징이 더 존재하지 않으면, 프로세스(300)은 마지막 스테이트(324)에서 종결된다. 하지만, 만일 데이타베이스에 특징이 더 존재하면, 프로세스(300)은 스테이트(326)에서 다음 서열 특징을 판독하고 루프는 스테이트(310)으로 돌아가며 여기서 다음 특징의 속성이 제 1 서열에 대해 비교된다.
만일 결정 스테이트(316)에서 특징 속성이 제 1 서열에서 발견되지 않으면, 프로세스(300)은 직접 결정 스테이트(320)으로 이동하여 더 이상의 특징이 데이타베이스에 존재하는지 여부를 결정함을 주목해야 한다.
따라서, 본 발명의 다른 관점은 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열 내의 특징을 동정하는 방법으로서, 핵산 코드 또는 폴리펩티드 코드내의 특징을 동정하는 컴퓨터 프로그램을 사용하여 이들 코드를 판독하고 컴퓨터 프로그램을 이용하여 핵산 코드내의 특징을 동정하는 것을 포함한다. 한 구체예에서, 컴퓨터 프로그램은 오픈 리딩 프레임을 동정하는 컴퓨터 프로그램을 포함한다. 본 발명 방법은 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열, 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열 중 단일 서열 또는 2, 5, 10, 15, 20, 25, 30 또는 40개 이상를 컴퓨터 프로그램을 이용하여 판독하고, 핵산 코드 또는 폴리펩티드 코드내의 특징을 컴퓨터 프로그램을 이용하여 동정함으로써 수행될 수도 있다.
A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열, 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열 은 다양한 포맷으로 다양한 데이타 프로세서 프로그램에 저장되고 조작될 수 있다. 예를 들어, A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열 , 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열은 MicrosoftWORD 또는 WORDPERFECT와 같은 워드 프로세싱 파일내의 텍스트로서, 또는 DB2, SYBASE, 또는 ORACLE과 같은 당업자에게 익숙한 다양한 데이타베이스 프로그램내의 ASCII 화일로서 저장될 수 있다. 또한, 많은 컴퓨터 프로그램과 데이타베이스가 A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열, 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열에 비교될 기준 뉴클레오티드 서열 또는 폴리펩티드 서열의 공급원 또는 서열 비교 알고리즘, 동정기로 이용될 수 있다. 하기 리스트는 본 발명을 제한하고자 하는 것이 아니라, A 군 핵산 서열 및 이와 실질적으로 동일한 서열에 개시된 핵산 서열, 또는 B 군 아미노산 서열 및 이와 실질적으로 동일한 서열에 개시된 폴리펩티드 서열에 유용한 프로그램 및 데이타베이스에 대한 가이드를 제공하기 위한 것이다.
이용될 수 있는 프로그램 및 데이타베이스는 MacPattern(EMBL), DiscoveryBase(Molecular Applications Group), GeneMine(Molecular Applications Group), Look(Molecular Application Group), MacLook(Molecular Applications Group), BLAST 및 BLAST2(NCBI), BLASTN 및 BLASTX(Altschul 등, J.Mol.Biol.215:403, 1990), FASTA(Pearson and Lipman, Proc.Natl.Acad.Sci.USA, 85:2444, 1988), FASTDB(Brutlag 등 Comp. App.Biosci.6:237-245, 1990), Catalyst(Molecular Simulations Inc.), Catalyst/SHAPE(Molecular Simulations Inc.), Cerius2.DBAccess(Molecular Simulations Inc.), HypoGen(Molecular Simulations Inc.), Insight II,(Molecular Simulations Inc.), Discovery(Molecular Simulations Inc.), CHARMm(Molecular Simulations Inc.),Felix(Molecular Simulations Inc.), DelPhi(Molecular Simulations Inc.), QuanteMM(Molecular Simulations Inc.), Homology(Molecular Simulations Inc.), Modeler(Molecular Simulations Inc.), ISIS(Molecular Simulations Inc.), Quanta/Protein Design(Molecular Simulations Inc.), WebLab(Molecular Simulations Inc.), WebLab Diversity Explorer(Molecular Simulations Inc.), Gene Explorer(Molecular Simulations Inc.), SeqFold(Molecular Simulations Inc.), the MDL Available Chemicals Directory database, the MDL Drug Data Report data base, the Comprehensive Medicinal Chemistry database, Derwent's World Drug Index database, the BioByteMasterFile database, the Genbank database, 및 the Genseqn database를 포함하지만 이것으로 한정되는 것은 아니다. 많은 다른 프로그램과 데이타베이스가 본원 개시하에서 당업자에게 명확할 것이다.
상기 프로그램을 이용하여 검출할 수 있는 모티프는 루이신 지퍼, 헬릭스-턴-헬릭스 모티프, 글리코실화 부위, 유비퀴틴화 부위, 알파 헬릭스 및 베타 시트를 암호하는 서열, 암호된 단백질의 분비를 지시하는 시그날 펩티드를 암호하는 시그날 서열, 호메오박스, 산성 스트레치, 효소 활성 부위, 기질 결합 부위 및 효소 절단 부위와 같은 전사 조절에 관련된 서열을 포함한다.
본 발명은 효소의 독특한 촉매 특성을 이용한다. 화학적 전환에서 생촉매(즉, 정제되거나 미정제된 효소, 살아있지 않거나 살아있는 세포)를 이용하는 것은 특정 출발 화합물과 반응하는 구체적 생촉매의 동정을 필요로 하는 반면, 본 발명은 작은 분자와 같은 많은 출발 화합물에 존재하는 기능성 기에 대해 특이적인 반응 조건과 선택된 생촉매를 이용한다. 각 생촉매는 하나의 기능성 기 또는 여러 관련된 기능성 기에 대해 특이적이며, 이 기능성 기를 함유하는 많은 출발 화합물과 반응할 수 있다.
생촉매 반응은 하나의 출발 화합물로부터 유도체 집단을 생성한다. 이들 유도체는 또 다른 생촉매 반응에 노출되어 제 2의 유도체 화합물 집단을 생성할 수 있다. 원래의 작은 분자 또는 화합물의 수천가지의 변이가 매회의 생촉매 유도화에서 생성될 수 있다.
효소는 분자의 나머지에 영향을 주지 않고 출발 화합물의 특정 부위에서 반응하며, 이는 이전의 화학적 방법을 이용할 경우엔 이루기 매우 힘든 것이다. 이러한 높은 생촉매적 특이성은 라이브러리내의 단일 활성 화합물을 동정하는 수단을 제공한다. 라이브러리는 소위 "생합성 히스토리"라고 불리는, 그것을 생성하기 위해 이용되는 연속적인 생촉매 반응을 특징으로 한다. 생물 활성에 대해 라이브러리를 스크리닝하고 생합성 히스토리를 추적함으로써 그 활성 화합물을 생성하는 특이적 반응 순서를 동정한다. 이 반응 순서는 반복되며 합성된 화합물의 구조가 결정된다. 이러한 방식의 동정은 다른 합성 및 스크리닝 접근법과는 달리, 고정화 기법을 필요로 하지 않으며, 화합물은 사실상 임의의 유형의 스크리닝 분석을 이용하여 용액에서 합성 및 시험될 수 있다. 기능성 기에서의 효소 반응의 높은 특이성이 생촉매적으로 생성된 라이브러리를 형성하는 특이적 효소 반응의 "추적"을 가능하게 함을 주목하는 것이 중요하다.
방법중의 많은 단계가 수천개의 생촉매적 반응과 스크리닝 분석이 하루에 실시될 수 있도록 할 뿐만 아니라 고도의 정확성 및 재현성을 보장하는 로보트 자동화를 이용하여 수행된다. 결과적으로, 현재의 화학적 방법을 이용하면 몇 년이 걸리게 될 유도체 화합물 라이브러리가 수주내에 생성될 수 있다.
특정 구체예에서, 본 발명은 작은 분자를 변형시키는 방법을 제공하며, 이는 본원에 개시된 폴리뉴클레오티드에 의해 암호된 폴리펩티드 또는 효소적으로 활성인 그 단편을 작은 분자와 접촉시켜 변형된 작은 분자를 생성하는 것을 포함한다. 변형된 작은 분자의 라이브러리는 변형된 작은 분자가 원하는 활성을 나타내는 라이브러리내에 존재하는 지 여부를 결정하기 위해 시험된다. 원하는 활성의 변형된 작은 분자를 생성하는 특이적 생촉매 반응은, 라이브러리의 일부를 생성하기 위해 이용되는 생촉매 반응 각각을 체계적으로 제거하고, 이어서 라이브러리 일부에 생성된 작은 분자를 원하는 활성을 갖는 변형된 작은 분자가 존재하는지 여부에 대하여 시험함으로써 동정된다. 원하는 활성의 변형된 작은 분자를 생성하는 특이적 생촉매 반응은 선택적으로 반복된다. 생촉매 반응은 작은 분자의 구조내에서 발견되는 구별되는 구조적 부분과 반응하는 생촉매 그룹으로 수행되며, 각 생촉매는 하나의 구조적 부분 또는 관련된 구조적 부분의 그룹에 대해 특이적이며, 각 생촉매는 구별되는 구조적 부분을 함유하는 많은 상이한 작은 분자와 반응한다.
본 발명은 하기 실시예에서 추가로 설명될 것이다. 하지만, 본 발명은 그러한 실시예에 한정되지 않음을 이해해야 한다.
발명의 개요
본 발명은 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 43, 45, 47에 제시된 서열을 가진 분리된 핵산, 및 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 43, 45, 47에 50% 이상의 서열 동일성을 가지고 데할로게나제 활성을 가진 폴리펩티드를 암호화하는 이의 변이체를 제공한다.
본 발명의 또 다른 양태는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 43, 45, 47에 제시된 서열(이하, "A 군 핵산 서열"이라 부름), 그와 실질적으로 동일한 서열 및 그에 상보적인 서열을 가진 분리된 핵산이다.
본 발명의 또 다른 양태는 A 군 핵산 서열, 이와 거의 동일한 서열 및 이에 상보적인 서열에 나타난 서열의 10개 이상의 연속 염기들을 포함하는 분리된 핵산이다.
본 발명의 또 다른 양태에서, 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48에 나타낸 서열을 보유하는 폴리펩티드를 암호화하는 분리된 핵산 및 데할로게나제 활성을 가지고 상기 서열에 50 % 이상의 서열 동일성을 가지는 폴리펩티드를 암호화하는 이들의 변이체를 제공한다.
본 발명의 다른 양태는 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48(이후, "B 군 아미노산 서열"로 지칭)에 나타난 서열 및 이와 거의 동일한 서열을 보유하는 폴리펩티드 또는 이들의 기능적 단편을 암호화하는 분리된 핵산이다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열의 10개 이상의 연속 아미노산을 가지는 폴리펩티드를 암호화하는 분리된 핵산이다.
본 발명의 또 다른 양태에서, B 군 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열을 보유하는 정제된 폴리펩티드를 제공한다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열을 보유하는 폴리펩티드와 특이적으로 결합하는 분리되거나 정제된 항체이다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드 중 하나의 10개 이상의 연속 아미노산을 가지는 폴리펩티드와 특이적으로 결합하는 분리되거나 정제된 항체 또는 이의 결합 단편이다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열을 보유하는 폴리펩티드를 제조하는 방법이다. 상기 방법은 폴리펩티드를 암호화하는 핵산을 숙주 세포로 도입시키는 단계 및 핵산을 발현시키는 조건하에서 숙주 세포를 배양하는 단계를 포함하는데, 이때 핵산은 프로모터에 작동적으로 연결된다.
본 발명의 다른 양태는 B 군 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열의 10개 이상의 아미노산을 가지는 폴리펩티드를 제조하는 방법이다. 상기 방법은 폴리펩티드를 암호화하는 핵산을 숙주 세포로 도입시키는 단계 및 핵산을 발현시키는 조건하에서 숙주 세포를 배양함으로써 폴리펩티드를 생산하는 단계를 포함하는데, 이때 핵산은 프로모터에 작동가능하게 연결된다.
본 발명의 다른 양태는 A 군 핵산 서열 및 이와 거의 동일한 서열, A 군 핵산 서열의 서열에 상보적인 서열, 상기 서열의 30 이상의 연속적인 뉴클레오티드를 포함하는 단편에 나타난 서열을 보유하는 핵산을 수득하는 단계 및 서열 중의 1개이상의 뉴클레오티드를 다른 뉴클레오티드로 변경시키는 단계, 서열 중의 1개 이상의 뉴클레오티드를 결실시키는 단계 또는 서열에 1개 이상의 뉴클레오티드를 추가하는 단계를 포함하는 변이체를 제조하는 방법이다.
본 발명의 다른 양태는 A 군 핵산 서열 및 이와 거의 동일한 서열에 나타난 서열 또는 B 군의 아미노산 서열 및 이와 거의 동일한 서열에 나타난 폴리펩티드 서열이 저장되어 있는 컴퓨터 판독가능한 매체이다.
본 발명의 다른 양태는 프로세서 및 데이터 저장 장치를 포함하는 컴퓨터 시스템으로서, 데이터 저장 장치는 그 위에 A 군 핵산 서열 및 이와 거의 동일한 서열에 나타난 서열 또는 B 군의 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열의 폴리펩티드를 저장시킨 것이다.
본 발명의 다른 양태는 제1 서열을 기준 서열과 비교하는 방법으로서, 제1 서열은 A 군 핵산 서열 및 이와 거의 동일한 서열에 나타난 서열 또는 B 군의 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드 코드이다. 상기 방법은 제1 서열 및 기준 서열을 서열을 비교하는 컴퓨터 프로그램을 이용하여 판독하고 제1 서열과 기준 서열의 차이를 컴퓨터 프로그램으로 판단하는 단계를 포함한다.
본 발명의 다른 양태는 A 군 핵산 서열 및 이와 거의 동일한 서열에 나타난 서열 또는 B 군의 아미노산 서열 및 이와 거의 동일한 서열에 나타난 서열을 보유하는 폴리펩티드의 특징을 동정하는 방법으로서, 상기 서열을 서열 중의 특징을 동정하는 컴퓨터 프로그램을 사용하여 판독하고 컴퓨터 프로그램으로 상기 서열의 특징을 동정하는 단계를 포함한다.
본 발명의 다른 양태는 B 군의 아미노산 서열 및 이와 거의 동일한 서열의 폴리펩티드의 효소 작용을 보유한 B 군의 아미노산 서열 및 이와 거의 동일한 서열의 단편 또는 변이체를 동정하기 위한 분석이다. 상기 분석은 B 군의 아미노산 서열, 이와 거의 동일한 서열의 폴리펩티드, 또는 폴리펩티드 단편 또는 변이체를 폴리펩티드 단편 또는 변이체가 작용하게 하는 조건하에서 기질 분자와 접촉시키고, 기질 농도의 감소 또는 폴리펩티드와 기질 사이 반응의 특이적 반응 생성물의 농도 증가를 감지함으로써 상기 서열의 단편 또는 변이체를 동정하는 단계를 포함한다.
본 발명의 또 다른 양태에서, 글리세롤을 합성하는 방법을 제공한다. 상기 방법은 트리클로로프로판 또는 디클로로프로판올을 B 군의 아미노산 서열 및 이와 거의 동일한 서열로 구성된 군으로부터 선택된 서열과 70 % 이상의 상동성을 가지고 데할로게나제 활성을 가지는 폴리펩티드와, 글리세롤을 합성시키기 위한 조건하에서 접촉시키는 단계를 포함한다.
본 발명의 또 다른 태양에서, 광학적으로 활성인 할로락트산을 생산하는 방법을 제공한다. 상기 방법은 디할로프로피온산을 B 군의 아미노산 서열 및 이와 거의 동일한 서열로 구성된 군으로부터 선택된 서열과 70 % 이상의 상동성을 가지고 데할로게나제 활성을 가지는 폴리펩티드와, 광학적으로 활성인 할로락트산을 생산하기 위한 조건하에서 접촉시키는 단계를 포함한다.
본 발명의 또 다른 양태에서, 환경적 샘플과 B 군의 아미노산 서열 및 이와 거의 동일한 서열로 구성된 군으로부터 선택된 서열과 70 % 이상의 상동성을 가지고 데할로게나제 활성을 가지는 폴리펩티드를 접촉시키는 생물학적분해(bioremediation) 방법을 포함한다.
본 발명의 또 다른 양태에서, 샘플로부터 할로겐화된 불순물 또는 할로겐화된 오염물을 제거하는 방법을 제공한다. 상기 방법은 샘플과 B 군의 아미노산 서열 및 이와 거의 동일한 서열로 구성된 군으로부터 선택된 서열과 70 % 이상의 상동성을 가지고 데할로게나제 활성을 가지는 폴리펩티드를 접촉시키는 단계를 포함한다.
본 발명의 또 다른 양태는 디할로프로판 또는 모노할로프로판올을 B 군의 아미노산 서열 및 이와 거의 동일한 서열로 구성된 군으로부터 선택된 서열과 70 % 이상의 상동성을 가지고 데할로게나제 활성을 가지는 폴리펩티드와, 디올을 합성하기 위한 조건하에서 접촉시키는 단계를 포함하는 디올을 합성하는 방법을 제공한다.
본 발명의 또 다른 양태에서, 할로-치환된 시클릭 히드로카르빌을 탈할로겐화시키는 방법을 제공한다. 상기 방법은 할로-치환된 시클릭 히드로카르빌을 B 군의 아미노산 서열 및 이와 거의 동일한 서열로 구성된 군으로부터 선택된 서열과 70 % 이상의 상동성을 가지고 데할로게나제 활성을 가지는 폴리펩티드와, 할로-치환된 시클릭 히드로카르빌을 탈할로겐화시키기 위한 조건하에서 접촉시키는 단계를 포함한다.
실시예 1
부위 포화 돌연변이유발법
부위 포화 돌연변이를 이루기 위해, 하기와 같이 32-배 축퇴된 올리고뉴클레오티드 프라이머를 이용한 부위 지정 돌연변이유발법에 의해, 서열 번호 1에 의해 암호되는 데할로게나제 효소(서열 번호 2)의 모든 잔기(317)를 모든 20개의 아미노산으로 전환시켰다.
데할로게나제 발현 구조체의 배양물을 성장시켜 플라스미드 제조물을 만들었다.
각 코돈을 임의화시키기 위해 프라이머를 만들었다 - 그들은 공통된 구조 X20NN(G/T)X20를 가지며, 여기서 X20은 바뀌게 될 코돈에 인접하는 서열번호 1의 핵산 서열의 20 뉴클레오티드를 나타낸다.
플라스미드 주형 ~50ng, 각 프라이머 125 ng, 1X 천연 Pfu 완충액, 각 dNTP 200μM 및 천연 Pfu DNA 폴리머라제 2.5 U을 함유하는 반응 혼합물 25㎕를 제조하였다.
반응을 하기와 같이 로보96(Robo96) 그래디언트 사이클러(Gradient Cycler)에서 반복시켰다:
95℃에서 1분간 초기 변성화;
95℃에서 45초, 53℃에서 1분 및 72℃에서 11분의 사이클을 20회; 및
72℃에서 10분간의 최종 연장 단계.
메틸화된 주형 DNA를 절단하기 위해 37℃에서 1시간동안 DpnI 10 U으로 반응 혼합물을 처리하였다.
반응 혼합물 2 ㎕를 사용하여 XL1-블루 MRF' 세포를 형질전환시키고 전체 형질전환 혼합물을 큰 LB-Amp-Met 플레이트에 도말하여 200-1000 콜로니를 얻었다.
각 콜로니를 LB-Amp-IPTG를 함유하는 384-웰 미세적정 플레이트의 웰내에 접종하여 밤새 성장시켰다.
이들 플레이트상의 클론을 다음날 분석하였다.
실시예 2
데할로게나제 열 안정성
본 발명은 지시된 진화에 의해 생성될 원하는 특성이, 해로운 환경으로 생각될 수도 있는 것을 포함한 변화된 환경에 일정 기간동안 노출된 분자의 개선된 잔여 활성(예, 효소 활성, 면역반응성, 항생 활성 등)에 의해 제한적 방식으로 예시됨을 보여준다. 그러한 해로운 환경은 하기의 임의의 조합(반복되건 아니건, 그리고 임의의 순서 또는 조합으로)을 포함할 수 있다: 증가된 온도(작용 효소의 변성을 야기할 수도 있는 온도 포함), 감소된 온도, 증가된 염도, 감소된 염도, 증가된 pH, 감소된 pH, 증가된 압력, 감소된 압력, 및 방사성 원(UV 선, 가시 광선, 및 전체 전자기 스펙트럼 포함)에의 노출의 변화.
하기 실시예는 증가된 온도에 노출시 효소가 활성을 다시 얻거나 보유하는 능력을 진화시키기 위한 지시된 진화의 적용을 보여준다.
데할로게나제 효소의 모든 잔기(317)을 상기한 바와 같이 32-배 축퇴된 올리고뉴클레오티드 프라이머를 이용한 부위 지시된 돌연변이에 의해 모든 20개의 아미노산으로 전환시켰다. 스크리닝 과정은 다음과 같았다:
384-웰 플레이트내의 밤샘 배양물을 원심분리하고 배지를 제거하였다. 각 웰에 0.06 mL의 1mM Tris/SO4 2-pH 7.8를 첨가하였다.
로보트가 각 모(parent) 성장 플레이트로부터 0.02mL 세포 현탁액으로 이루어진 2 개의 분석 플레이트를 만들었다.
하나의 분석 플레이트를 실온에, 다른 하나는 승온(초기 스크린은 55℃를 이용)에 일정 기간(처음에는 30분) 두었다.
정해진 기간후, 실온 기재(TCP 포화된 1 mM Tris/ SO4 2-pH 7.8과 1.5 mM NaN3및 0.1mM 브로모티몰 블루) 0.08 mL을 각 웰에 첨가하였다. TCP는 트리클로로프로판이다.
다양한 시간대에 620nm에서 측정하여 각 웰을 위한 진행 곡선을 얻었다.
데이터를 분석하고 가열된 세포의 동역학과 가열되지 않은 세포의 동역학을 비교하였다. 각 플레이트는 돌연변이되지 않은 20F12 대조군의 1-2 컬럼(24웰)을 함유하였다.
안정성이 개선된 것으로 나타난 웰을 다시 성장시키고 동일한 조건하에서 시험하였다.
이 과정에 이어, 효소에 증가된 열적 안정성을 부여한 돌연변이를 갖는 클론을 서열결정하여 그 개선을 특이적으로 일으킨 각 위치의 정확한 아미노산 변화를 결정하였다. 서열 번호 5와 7에 개시된 핵산 서열과 서열 번호 6과 8에 개시된 폴리펩티드 서열을 각각 보유한 돌연변이를 동정하였다. 위치 G182V(서열 번호 6)에서의 열 돌연변이는 또한 유사한 증가된 열 안정성을 갖는 글루타메이트(Q) 일 수 있다. 유사하게, P302A 돌연변이는 루이신(L), 세린(S), 리신(K) 또는 아르기닌(R)로 변화될 수 있다. 이들 변이체(하기하는 것들 뿐만 아니라)는 본 발명에 포함된다.
이 과정에 이어, 9개의 단일 부위 돌연변이가 증가된 열 안정성을 부여하는 것으로 나타났다. 서열 분석은 하기 변화가 유익함을 보여주었다:
D89G;F91S;T159L;G182Q, G182V;I220L;N238T;W251Y;P302A,P302L,P302S,P302K;P302R/S306R. 단지 두 개의 부위(189와 302)만이 둘 이상의 치환을 보유했다. 리스트상의 처음 5개를 하나의 유전자내로 결합시켰다(G189Q를 이용).
일정 기간동안 증가된 온도(55℃ 및 80℃)에서 효소를 항온처리하고 30℃에서 활성 분석을 하여 열안정성을 평가하였다. 초기 비율을 더 높은 온도에서의 시간에 대하여 대비하였다. 효소는 항온처리 및 분석동안 50 mM Tris/SO4pH 7.8에 유지되었다. 생성물(Cl-)을 Fe(NO3)3와 HgSCN을 이용한 표준 방법에 의해 검출하였다. 서열 번호 2의 데할로게나제를 사실상 야생형으로 이용하였다. 겉보기 반감기(T1/2)를 지수적 붕괴 함수에 데이터를 적용시켜 계산하였다.
본 발명은 그 일부 바람직한 구체예에 대하여 상세하게 개시되었지만, 변형과 변화가 개시되고 청구된 범위내임이 이해될 것이다.

Claims (145)

  1. 데할로게나제 활성을 보유하는 폴리펩티드를 암호화하는 서열을 포함하는 분리된 핵산으로서, 상기 서열이
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 이루어진 군으로부터 선택되는 것인 분리된 핵산.
  2. 제1항에 있어서, 상기 분리된 핵산은 높은 정도의 엄격한 조건 하에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39,43, 45 및 47, 및 서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체로 구성되는 군으로부터 선택되는 서열에 하이브리드화하는 상보 서열을 포함하는 것인 분리된 핵산.
  3. 제1항에 있어서, 상기 분리된 핵산은 중간 정도의 엄격한 조건 하에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47, 및 서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체로 구성되는 군으로부터 선택되는 서열에 하이브리드화하는 상보 서열을 포함하는 것인 분리된 핵산.
  4. 제1항에 있어서, 상기 분리된 핵산은 낮은 정도의 엄격한 조건 하에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47, 및 서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5,7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체로 구성되는 군으로부터 선택되는 서열에 하이브리드화하는 상보 서열을 포함하는 것인 분리된 핵산.
  5. 제1항에 있어서, 상기 변이체는 서열 비교 알고리즘을 이용하는 분석에 의해 측정되는 바와 같이 약 200개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 것인 분리된 핵산.
  6. 제1항에 있어서, 상기 변이체는 전체 서열 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 것인 분리된 핵산.
  7. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 55% 이상의 상동성을 보유하는 것인 분리된 핵산.
  8. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및47중 하나 이상의 서열에 약 60% 이상의 상동성을 보유하는 것인 분리된 핵산.
  9. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 65% 이상의 상동성을 보유하는 것인 분리된 핵산.
  10. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 70% 이상의 상동성을 보유하는 것인 분리된 핵산.
  11. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 75% 이상의 상동성을 보유하는 것인 분리된 핵산.
  12. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 80% 이상의 상동성을 보유하는 것인 분리된 핵산.
  13. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및47중 하나 이상의 서열에 약 85% 이상의 상동성을 보유하는 것인 분리된 핵산.
  14. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 90% 이상의 상동성을 보유하는 것인 분리된 핵산.
  15. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 변이체는 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 95% 이상의 상동성을 보유하는 것인 분리된 핵산.
  16. 제1항에 있어서, 상기 서열 비교 알고리즘은 디폴트 매개변수를 이용하는 FASTA 버젼 3.0t78인 분리된 핵산.
  17. 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33,35, 37, 39, 43, 45 및 47에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 서열의 10개 이상의 연속 염기를 포함하는 분리된 핵산.
  18. 제17항에 있어서, 상기 서열이 약 200개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 50% 이상의 상동성을 보유하는 것인 분리된 핵산.
  19. 제17항에 있어서, 상기 서열이 전체 서열 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 50% 이상의 상동성을 보유하는 것인 분리된 핵산.
  20. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 55% 이상의 상동성을 보유하는 것인분리된 핵산.
  21. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 60% 이상의 상동성을 보유하는 것인 분리된 핵산.
  22. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 65% 이상의 상동성을 보유하는 것인 분리된 핵산.
  23. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 70% 이상의 상동성을 보유하는 것인 분리된 핵산.
  24. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 75% 이상의 상동성을 보유하는 것인분리된 핵산.
  25. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 80% 이상의 상동성을 보유하는 것인 분리된 핵산.
  26. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 85% 이상의 상동성을 보유하는 것인 분리된 핵산.
  27. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 90% 이상의 상동성을 보유하는 것인 분리된 핵산.
  28. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47로 구성되는 군으로부터 선택된 서열에 약 95% 이상의 상동성을 보유하는 것인분리된 핵산.
  29. (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 보유하는 폴리펩티드; 및
    (ii) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드
    로 이루어진 군으로부터 선택되는 폴리펩티드를 암호화하는 분리된 핵산.
  30. (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 보유하는 폴리펩티드; 및
    (ii) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드
    로 구성되는 군으로부터 선택되는 정제된 폴리펩티드.
  31. 제30항에 있어서, 상기 아미노산 서열이 약 200개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32,34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 50% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  32. 제30항에 있어서, 상기 아미노산 서열이 전체 서열 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 50% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  33. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 55% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  34. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 60% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  35. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 65% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  36. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 70% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  37. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 75% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  38. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 80% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  39. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 85% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  40. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 90% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  41. 제30항 내지 제32항에 있어서, 상기 아미노산 서열이 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열에 약 95% 이상의 상동성을 보유하는 정제된 폴리펩티드.
  42. 제30항에 있어서,
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48; 및
    전체 서열 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 55% 이상의 상동성을 보유하는 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 보유하는 것인 정제된 폴리펩티드.
  43. (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 포함하는 폴리펩티드; 및
    (ii) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드
    로 구성되는 군으로부터 선택되는 폴리펩티드에 특이적으로 결합하는 정제된 항체.
  44. 제43항에 있어서, 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드에 특이적으로 결합하는 것인 정제된 항체.
  45. 제43항에 있어서, 상기 항체가 폴리클로날 항체인 항체.
  46. 제43항에 있어서, 상기 항체가 모노클로날 항체인 항체.
  47. (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14,16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 보유하는 폴리펩티드; 및
    (ii) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드
    로 구성되는 군으로부터 선택되는 폴리펩티드를 제조하는 방법으로서, 상기 방법이
    (a) 상기 폴리펩티드를 암호화하는 핵산의 발현이 가능한 조건 하에서 상기 핵산을 숙주 세포에 도입하는 단계; 및
    (b) 상기 폴리펩티드를 회수하는 단계
    를 포함하는 것인 방법.
  48. 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 폴리펩티드를 제조하는 방법으로서,
    (a) 상기 폴리펩티드의 발현을 가능하게 하는 조건 하에서 프로모터에 작동가능하게 연결되고 상기 폴리펩티드를 암호화하는 핵산을 숙주 세포에 도입하는 단계; 및
    (b) 상기 폴리펩티드를 회수하는 단계
    를 포함하는 것인 방법.
  49. (a)(i) 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열과 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열과 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열; 및
    (ii) 임의의 전술한 서열중 30개 이상의 연속 뉴클레오티드를 포함하는 단편
    으로 구성되는 군으로부터 선택되는 폴리뉴클레오티드를 포함하는 핵산을 획득하는 단계; 및
    (b) 다른 뉴클레오티드에 상기 폴리뉴클레오티드내 하나 이상의 뉴클레오티드를 변경시키거나, 상기 폴리뉴클레오티드내 하나 이상의 뉴클레오티드를 결실시키거나, 또는 상기 폴리뉴클레오티드에 하나 이상의 뉴클레오티드를 첨가시키는 단계
    를 포함하는 변이체 생성 방법.
  50. 제49항에 있어서, 상기 변경은 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지정 돌연변이유발법, 어셈블리 PCR. 성 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 순환 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 위치 특이성 돌연변이유발법, 유전자 재어셈블리, 유전자 부위 포화 돌연변이유발법 또는 이의 임의의 조합, 순열 또는 반복 처리로부터 선택되는 방법에 의해 도입되는 것인 방법.
  51. 제50항에 있어서, 상기 변경이 에러 프론 PCR에 의해 도입되는 것인 방법.
  52. 제50항에 있어서, 상기 변경이 셔플링에 의해 도입되는 것인 방법.
  53. 제50항에 있어서, 상기 변경이 올리고뉴클레오티드 지정 돌연변이유발법에 의해 도입되는 것인 방법.
  54. 제50항에 있어서, 상기 변경이 어셈블리 PCR에 의해 도입되는 것인 방법.
  55. 제50항에 있어서, 상기 변경이 성 PCR 돌연변이유발법에 의해 도입되는 것인방법.
  56. 제50항에 있어서, 상기 변경이 생체내 돌연변이유발법에 의해 도입되는 것인 방법.
  57. 제50항에 있어서, 상기 변경이 카세트 돌연변이유발법에 의해 도입되는 것인 방법.
  58. 제50항에 있어서, 상기 변경이 순환 앙상블 돌연변이유발법에 의해 도입되는 것인 방법.
  59. 제50항에 있어서, 상기 변경이 지수 앙상블 돌연변이유발법에 의해 도입되는 것인 방법.
  60. 제50항에 있어서, 상기 변경이 위치 특이성 돌연변이유발법에 의해 도입되는 것인 방법.
  61. 제50항에 있어서, 상기 변경이 유전자 재어셈블리에 의해 도입되는 것인 방법.
  62. 제50항에 있어서, 상기 변경이 유전자 부위 포화 돌연변이유발법에 의해 도입되는 것인 방법.
  63. 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47의 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열과 약 50% 이상의 상동성을 보유하는 핵산 서열의 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 핵산 서열;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 폴리펩티드 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체에 상보적인 폴리펩티드 서열
    로 구성되는 군으로부터 선택되는 서열을 저장하고 있는 컴퓨터 판독가능한 매체.
  64. 프로세서 및 데이타 저장 장치를 포함하는 컴퓨터 시스템으로서, 상기 데이타 저장 장치에는
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47의 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열을 약 50% 이상의 상동성을 보유하는 핵산 서열의 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33,35, 37, 39, 43, 45 및 47에 상보적인 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열을 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 핵산 서열;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 폴리펩티드 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체에 상보적인 폴리펩티드 서열
    로 구성되는 군으로부터 선택되는 서열이 저장되어 있는 것인 컴퓨터 시스템.
  65. 제64항에 있어서, 서열 비교 알고리즘, 및 저장된 하나 이상의 참조 서열을 보유하는 데이타 저장 장치를 더 포함하는 것인 컴퓨터 시스템.
  66. 제65항에 있어서, 상기 서열 비교 알고리즘은 다형태를 나타내는 컴퓨터 프로그램을 포함하는 것인 컴퓨터 시스템.
  67. 제64항에 있어서, 상기 서열 내에서 하나 이상의 특징을 확인하는 확인기를 더 포함하는 것인 컴퓨터 시스템.
  68. (a) 서열을 비교하는 컴퓨터 프로그램을 이용하여 제1 서열과 제2 서열을 판독하는 단계; 및
    (b) 상기 컴퓨터 프로그램을 이용하여 제1 서열 및 제2 서열간의 차이를 결정하는 단계
    를 포함하는, 제1 서열과 제2 서열의 비교 방법으로서,
    상기 제1 서열이
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47의 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11,13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 핵산 서열의 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 핵산 서열의 변이체에 상보적인 핵산 서열;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 폴리펩티드 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체에 상보적인 폴리펩티드 서열
    로 구성되는 군으로부터 선택되는 서열인 방법.
  69. 제68항에 있어서, 상기 제1 서열과 제2 서열간의 차이를 결정하는 단계가 다형태를 확인하는 단계를 더 포함하는 것인 방법.
  70. (a) 서열 내에서 하나 이상의 특징을 확인하는 컴퓨터 프로그램을 이용하여 서열을 판독하는 단계; 및
    (b) 상기 컴퓨터 프로그램을 이용하여 서열 내에서 하나 이상의 특징을 확인하는 단계
    를 포함하는, 서열내 특징 확인 방법으로서,
    상기 서열이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47의 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 핵산 서열의 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 핵산 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 핵산 서열의 변이체에 상보적인 핵산 서열;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 폴리펩티드 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체에 상보적인 폴리펩티드 서열
    로 구성되는 군으로부터 선택되는 것인 방법.
  71. 탄소-할로겐 결합의 가수분해를 용이하게하는 조건 하에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 폴리펩티드와 탄소-할로겐 결합을 함유하는 물질을 접촉시키는 단계를 포함하는, 탄소-할로겐 결합의 가수분해 방법.
  72. 할로알칸 또는 할로카르복실산의 분해를 용이하게 하는 조건 하에서,
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드 서열;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 폴리펩티드 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 약 50% 이상의 상동성을 보유하는 폴리펩티드 서열의 변이체에 상보적인 폴리펩티드 서열
    로 구성되는 군으로부터 선택된 서열을 보유하는 폴리펩티드와 할로알칸 또는 할로카르복실산을 함유하는 샘플을 접촉시키는 단계를 포함하는, 할로알칸 또는 할로카르복실산의 분해를 촉매하는 방법.
  73. 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47의 단편; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열과 약 50% 이상의 상동성을 보유하는 서열
    에 의해 암호화되고,
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 약 50% 이상의 상동성을 보유하는 서열
    의 하나 이상의 특성을 보유하는 작용성 폴리펩티드 단편 또는 변이체를 확인하기 위한 분석 방법으로서,
    상기 분석 방법이
    (a) 특정 폴리펩티드를 기능하게 하는 조건 하에서,
    (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48의 폴리펩티드; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 약 50% 이상의 상동성을 보유하는 서열; 및
    (ii) 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 서열;및
    전술한 서열중 임의의 서열에 상보적인 서열
    에 의해 암호화되는 폴리펩티드 단편 또는 변이체
    와 기질 분자를 접촉시키는 단계; 및
    (b) 기질 양의 감소 또는 상기 폴리펩티드와 상기 기질 사이의 반으로 생성된 반응 생성물의 양의 증가를 검출하는 단계
    를 포함하며, 기질 양의 감소 또는 반응 생성물의 양의 증가가 작용성 폴리펩티드의 존재를 나타내는 것인 방법.
  74. 길이가 약 10 내지 50 뉴클레오티드인 올리고뉴클레오티드를 포함하고, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39,43, 45 및 47로 구성되는 군으로부터 선택되는 핵산 서열의 핵산 표적 영역에 50% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하며, 중간 정도 내지 매우 엄격한 조건 하에서 핵산 표적 영역에 하이브리드화하여 검출가능한 표적:프로브 이중체를 형성하는 핵산 프로브.
  75. 제74항에 있어서, 상기 올리고뉴클레오티드가 DNA인 핵산 프로브.
  76. 제74항에 있어서, 상기 올리고뉴클레오티드가 핵산 표적 영역에 55% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  77. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 60% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  78. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 65% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  79. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 70% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  80. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 75% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  81. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 80% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  82. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 85% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  83. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 90% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  84. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 95% 이상 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  85. 제74항에 있어서, 상기 올리고뉴클레오티드가 상기 핵산 표적 영역에 완전히 상보적인 10개 이상의 연속 뉴클레오티드 분절을 보유하는 것인 핵산 프로브.
  86. 제74항에 있어서, 상기 올리고뉴클레오티드의 길이가 15 내지 50개의 염기인 핵산 프로브.
  87. 제74항에 있어서, 상기 프로브가 검출가능한 동위원소 표지를 더 포함하는 것인 핵산 프로브.
  88. 제74항에 있어서, 상기 프로브가 형광 분자, 화학발광 분자, 효소, 보조인자, 효소 기질 및 합텐으로 구성되는 군으로부터 선택되는 검출가능한 비동위원소 표지를 더 포함하는 것인 핵산 프로브.
  89. 제86항에 있어서, 상기 올리고뉴클레오티드는 상기 핵산 표적 영역에 90% 이상 상보적인 15개 이상의 연속 뉴클레오티드의 분적을 보유하며, 중간 정도 내지 매우 엄격한 조건 하에서 상기 핵산 표적 영역에 하이브리드화하여 검출가능한 표적:프로브 이중체를 형성하는 것인 핵산 프로브.
  90. 제86항에 있어서, 상기 올리고뉴클레오티드는 상기 핵산 표적 영역에 95% 이상 상보적인 15개 이상의 연속 뉴클레오티드의 분적을 보유하며, 중간 정도 내지 매우 엄격한 조건 하에서 상기 핵산 표적 영역에 하이브리드화하여 검출가능한 표적:프로브 이중체를 형성하는 것인 핵산 프로브.
  91. 제86항에 있어서, 상기 올리고뉴클레오티드는 상기 핵산 표적 영역에 97% 이상 상보적인 15개 이상의 연속 뉴클레오티드의 분적을 보유하며, 중간 정도 내지 매우 엄격한 조건 하에서 상기 핵산 표적 영역에 하이브리드화하여 검출가능한 표적:프로브 이중체를 형성하는 것인 핵산 프로브.
  92. 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 적어도 하나의 단편과 동일하거나 또는 완전히 상보적인 서열을 보유하는 데할로게나제 유전자의 분리 또는 확인을 위한 폴리뉴클레오티드 프로브.
  93. (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 서열;및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 보유하는 폴리펩티드; 및
    (ii) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드
    로 구성되는 군으로부터 선택되는 폴리펩티드를 포함하며, 액체인 단백질 제제.
  94. (i) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48에 상보적인 서열;및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정된 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46 및 48중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 아미노산 서열을 보유하는 폴리펩티드; 및
    (ii) 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32,34, 36, 38, 44, 46 및 48로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리펩티드의 10개 이상의 연속 아미노산을 보유하는 폴리펩티드
    로 구성되는 군으로부터 선택되는 폴리펩티드를 포함하며, 고체인 단백질 제제.
  95. (i) 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열로 구성되는 군으로부터 선택되는 폴리뉴클레오티드에 의해 암호화된 하나 이상의 폴리펩티드; 및
    (ii) 전술한 서열중 임의의 서열의 단편
    과 하나 이상의 소분자를 혼합하여 하나 이상의 생촉매 반응에 의해 하나 이상의 변경된 소분자를 제조하는 단계를 포함하며, 이때 상기 하나 이상의 폴리펩티드가 데할로게나제 활성을 보유하는 것인 소분자 변경 방법.
  96. 제95항에 있어서, 상기 하나 이상의 폴리펩티드는 다수의 폴리펩티드를 포함하고, 상기 하나 이상의 소분자는 다수의 소분자를 포함함으로써 다수의 변경된 소분자는 변경된 소분자의 라이브러리를 형성하는 다수의 생촉매 반응에 의해 제조되는 것인 방법.
  97. 제96항에 있어서, 원하는 활성을 나타내는 변경된 특정 소분자가 상기 라이브러리 내에 존재하는지 여부를 결정하기 위해 상기 라이브러리를 테스트하는 단계를 포함하는 것인 방법.
  98. 제97항에 있어서, 상기 라이브러리를 테스트하는 단계가 원하는 활성을 가진 변경된 특정 소분자의 존재 또는 부재에 대해 변경된 소분자의 일부분을 테스트함으로써 상기 라이브러리내에 다수의 변경된 소분자의 일부분을 제조하는데 사용된 생촉매 반응중 하나를 제외한 모두를 전체적으로 제거하는 단계;및
    원하는 활성의 변경된 특정 소분자를 제조하는 특이적 생촉매 반응을 확인하는 단계
    를 더 포함하는 것인 방법.
  99. 제98항에 있어서, 원하는 활성의 변경된 소분자를 제조하는 상기 특이적 생촉매 반응을 반복 수행하는 것인 방법.
  100. 제93항에 있어서, 상기 생촉매 반응은 하나 이상의 소분자 내에서 확인된 구별되는 구조 부분과 반응하는 일군의 생촉매를 이용하여 수행하며;
    각각의 생촉매는 특정 구조 부분 또는 일군의 관련된 구조 부분에 특이적이며;
    각각의 생촉매는 특정 생촉매에 특이적인 특정 구조 부분을 함유하는 다수의 소분자와 반응하는 것인 방법.
  101. 데할로게나제 활성을 보유하는 폴리펩티드를 암호화하는 서열을 포함하는 클로닝 벡터로서, 상기 서열은
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 것인 클로닝 벡터.
  102. 데할로게나제 활성을 보유하는 폴리펩티드를 암호화하는 서열을 포함하는 숙주 세포로서, 상기 서열은
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 서열; 및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 것인 숙주 세포.
  103. (i) 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47;
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47중 하나 이상의 서열에 약 50% 이상의 상동성을 보유하는 변이체;
    서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 상보적인 서열;및
    서열 비교 알고리즘을 이용하는 분석 또는 육안 검사에 의해 측정되는 바와 같이 약 100개 이상의 잔기로 이루어진 영역 상에서 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 43, 45 및 47에 약 50% 이상의 상동성을 보유하는 변이체에 상보적인 서열
    로 구성되는 군으로부터 선택되는 서열을 보유하는 폴리뉴클레오티드; 및
    (ii) 낮은 정도, 중간 정도 및 높은 정도로 엄격한 조건 하에서 선행 서열중 임의의 서열을 보유하는 핵산에 하이브리드화하는 분리된 핵산
    을 포함하며, 숙주 세포 내에서 복제할 수 있는 발현 벡터.
  104. 제101항 또는 제103항에 있어서, 상기 벡터는 바이러스 벡터, 플리스미드 벡터, 파지 벡터, 파지미드 벡터, 코스미드, 포스미드, 박테리오파지, 인공 염색체, 아데노바이러스 벡터, 레트로바이러스 벡터 및 아데노-관련 바이러스 벡터로 구성되는 군으로부터 선택되는 것인 벡터.
  105. 제103항의 발현 벡터를 포함하는 숙주 세포.
  106. 제47항, 제102항, 제103항 또는 제105항중 어느 한 항에 있어서, 상기 숙주는 원핵생물, 진핵생물, 균류, 효모, 식물 및 대사가 활발한 숙주로 구성되는 군으로부터 선택되는 것인 숙주 세포.
  107. 제1항에 있어서, 상기 변이체는 에러-프론 PCR, 셔플링, 올리고뉴크레오티드-지정 돌연변이유발법, 어셈블리 PCR. 성 PCR 돌연변이유발법, 생체내 돌연변이유발법, 카세트 돌연변이유발법, 순환 앙상블 돌연변이유발법, 지수 앙상블 돌연변이유발법, 위치 특이성 돌연변이유발법, 유전자 재어셈블리, 유전자 부위 포화 돌연변이유발법 또는 이의 임의의 조합, 순열 또는 반복 처리로부터 선택되는 방법에 의해 제조되는 것인 분리된 핵산.
  108. 제49항 내지 제62항중 어느 한 항에 있어서, 하나 이상의 뉴클레오티드의 변경은 필요에 따라 1회 또는 수회 반복하는 것인 방법.
  109. 제49항에 있어서, 상기 변경은 변경된 염기의 도입인 방법.
  110. 제64항에 있어서, 상기 변경된 염기는 이노신인 방법.
  111. (R)-(±)-3-할로-1,2-프로판디올을 생성하는 조건 하에서 1,3-디할로-2-프로판올과 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 70% 이상의 상동성을 보유하고, 데할로게나제 활성을 보유하는 폴리펩티드를 접촉시키는 단계를 포함하는,(R)-(±)-3-할로-1,2-프로판디올의 제조 방법.
  112. 제111항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  113. 제111항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는 것인 방법.
  114. 제111항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  115. 제111항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입을 보유하는 서열로 구성되는 군 내에 전술한 바와 같은 서열을 보유하는 것인 방법.
  116. 글리세롤을 합성하는 조건 하에서 트리클로로프로판 또는 디클로로프로판올과 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되며 데할로게나제 활성을 보유하는 폴리펩티드를 접촉시키는 단계를 포함하는 글리세롤 합성 방법.
  117. 제116항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  118. 제116항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는 것인 방법.
  119. 제116항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  120. 제116항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입으로 구성되는 군으로부터 선택되는 서열을 보유하는 것인 방법.
  121. 임의 활성 할로락트산을 제조하는 조건 하에서, 디할로프로피온산과 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되며, 데할로게나제 활성을 보유하는 폴리펩티드를 접촉시키는 단계를 포함하는, 임의 활성 할로락트산의 제조 방법.
  122. 제121항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  123. 제121항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는 것인 방법.
  124. 제121항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  125. 제121항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입을 보유하는 서열로 구성되는 군으로부터 선택되는 서열을 보유하는 것인 방법.
  126. 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 70% 이상의 상동성을 보유하고, 데할로게나제 활성을 보유하는 폴리펩티드와 환경적 샘플을 접촉시키는 단계를 포함하는, 생물학적 분해(bioremediation) 방법.
  127. 제126항에 있어서, 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  128. 제126항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는 것인 방법.
  129. 제126항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  130. 제126항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입을 보유하는 서열로 구성되는 군으로부터 선택되는 서열을 보유하는 것인 방법.
  131. 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 70% 이상의 상동성을 보유하고, 데할로게나제 활성을 보유하는 폴리펩티드와 샘플을 접촉시키는 단계를 포함하는, 상기 샘플로부터 할로겐환된 오염물질 또는 할로겐화된 불순물의 제거 방법.
  132. 제131항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  133. 제131항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는것인 방법.
  134. 제131항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  135. 제131항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입을 보유하는 서열로 구성되는 군으로부터 선택되는 서열을 보유하는 것인 방법.
  136. 디올을 합성하는 조건 하에서, 디할로프로판 또는 모노할로프로판올과 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 70% 이상의 상동성을 보유하는 폴리펩티드를 접촉시키는 단계를 포함하는, 디올 합성 방법.
  137. 제136항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  138. 제136항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는 것인 방법.
  139. 제136항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  140. 제136항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입을 보유하는 서열로 구성되는 군으로부터 선택되는 서열을 보유하는 것인 방법.
  141. 할로 치환된 시클릭 히드로카르빌을 탈할로겐화하는 조건 하에서, 할로 치환된 시클릭 히드로카르빌과 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24,26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 70% 이상의 상동성을 보유하며 데할로게나제 활성을 보유하는 폴리펩티드를 접촉시키는 단계를 포함하는, 할로 치환된 시클릭 히드로카르빌의 탈할로겐화 방법.
  142. 제141항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 80% 이상의 상동성을 보유하는 것인 방법.
  143. 제141항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 90% 이상의 상동성을 보유하는 것인 방법.
  144. 제141항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이와 실질적으로 동일한 서열로 구성되는 군으로부터 선택되는 서열에 95% 이상의 상동성을 보유하는 것인 방법.
  145. 제141항에 있어서, 상기 폴리펩티드는 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 44, 46, 48 및 이의 보존적 치환, 결실 또는 삽입을 보유하는 서열로 구성되는 군으로부터 선택되는 서열을 보유하는 것인 방법.
KR10-2003-7007377A 2000-12-01 2001-11-30 데할로게나제 활성을 가진 효소 및 이의 사용 방법 KR20030051897A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25089700P 2000-12-01 2000-12-01
US60/250,897 2000-12-01
PCT/US2001/045337 WO2002068583A2 (en) 2000-12-01 2001-11-30 Enzymes having dehalogenase activity and methods of use thereof

Publications (1)

Publication Number Publication Date
KR20030051897A true KR20030051897A (ko) 2003-06-25

Family

ID=22949600

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-7007377A KR20030051897A (ko) 2000-12-01 2001-11-30 데할로게나제 활성을 가진 효소 및 이의 사용 방법

Country Status (9)

Country Link
US (4) US7078504B2 (ko)
EP (1) EP1507870A4 (ko)
JP (4) JP4589602B2 (ko)
KR (1) KR20030051897A (ko)
CN (2) CN1610754B (ko)
BR (1) BR0115875A (ko)
CA (2) CA2430192C (ko)
MX (1) MXPA03004840A (ko)
WO (1) WO2002068583A2 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040005673A1 (en) * 2001-06-29 2004-01-08 Kevin Jarrell System for manipulating nucleic acids
CA2360011A1 (en) * 1999-01-05 2000-07-13 Trustees Of Boston University Ordered gene assembly
US7435562B2 (en) * 2000-07-21 2008-10-14 Modular Genetics, Inc. Modular vector systems
KR20030051897A (ko) 2000-12-01 2003-06-25 다이버사 코포레이션 데할로게나제 활성을 가진 효소 및 이의 사용 방법
EP1625223A4 (en) * 2002-09-20 2009-11-11 Verenium Corp CHEMOENZYMATIC PROCEDURES FOR SYNTHESIS OF STATINES AND STATIN INTERCONNECTIONS
US7238842B2 (en) 2003-01-31 2007-07-03 Promega Corporation Covalent tethering of functional groups to proteins
US7429472B2 (en) 2003-01-31 2008-09-30 Promega Corporation Method of immobilizing a protein or molecule via a mutant dehalogenase that is bound to an immobilized dehalogenase substrate and linked directly or indirectly to the protein or molecule
US7425436B2 (en) 2004-07-30 2008-09-16 Promega Corporation Covalent tethering of functional groups to proteins and substrates therefor
JP2008519602A (ja) 2004-11-11 2008-06-12 モジュラー ジェネティクス, インコーポレイテッド 多様性を生じるためのラダーアセンブリおよびシステム
US7632666B2 (en) * 2004-12-27 2009-12-15 Masarykova Univerzita V Brne Method of production of optically active halohydrocarbons and alcohols using hydrolytic dehalogenation catalysed by haloalkane dehalogenases
EP2087107A2 (en) * 2006-10-30 2009-08-12 Promega Corporation Mutant hydrolase proteins with enhanced kinetics and functional expression
WO2011137368A2 (en) 2010-04-30 2011-11-03 Life Technologies Corporation Systems and methods for analyzing nucleic acid sequences
US9268903B2 (en) 2010-07-06 2016-02-23 Life Technologies Corporation Systems and methods for sequence data alignment quality assessment
CN102296046B (zh) * 2011-09-16 2013-08-14 广州市暨源生物科技有限公司 可用于预防慢性重金属中毒的重组食品级乳酸菌、其制备方法与应用
CN104694514B (zh) * 2015-03-18 2017-11-28 中国科学院微生物研究所 一种脱卤酶DhmB及其编码基因与应用
EP3093337A3 (en) 2015-05-13 2017-03-15 Samsung Electronics Co., Ltd. Microorganism including gene encoding protein having hydroxylase activity and method of reducing concentration of fluorinated methane in sample using the same
US10358632B2 (en) 2015-12-07 2019-07-23 Samsung Electronics Co., Ltd. Bacterial cytochrome P450 protein variant and method of reducing concentration of fluorinated methane in sample using the same
CN109706139A (zh) * 2019-03-01 2019-05-03 中国人民解放军92609部队 脱卤素酶基因LinB、脱卤素酶、脱卤素酶基因工程菌及其构建方法和应用方法
US11760793B2 (en) 2020-12-18 2023-09-19 University Of Tennessee Research Foundation Antibody for skewing sex ratio and methods of use thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5108892A (en) * 1989-08-03 1992-04-28 Promega Corporation Method of using a taq dna polymerase without 5'-3'-exonuclease activity
US6037465A (en) * 1994-06-14 2000-03-14 Invitek Gmbh Universal process for isolating and purifying nucleic acids from extremely small amounts of highly contaminated various starting materials
US5723125A (en) * 1995-12-28 1998-03-03 Tanox Biosystems, Inc. Hybrid with interferon-alpha and an immunoglobulin Fc linked through a non-immunogenic peptide
IL131209A0 (en) * 1997-02-13 2001-01-28 Dow Chemical Co Recombinant haloaliphatic dehalogenases
US6183740B1 (en) * 1997-08-13 2001-02-06 Diversa Corporation Recombinant bacterial phytases and uses thereof
AU6504099A (en) * 1998-09-29 2000-04-17 Diversa Corporation Nucleic acids and proteins from Cenarchaeum symbiosum
EP1092041A4 (en) * 1999-03-26 2001-09-19 Diversa Corp EXONUCLEASE-MEDIATED ASSEMBLY OF NUCLEIC ACIDS IN THE DIRECT EVOLUTION
EP1319068A2 (en) 2000-09-15 2003-06-18 Diversa Corporation Combinatorial screening of mixed populations of organisms
KR20030051897A (ko) 2000-12-01 2003-06-25 다이버사 코포레이션 데할로게나제 활성을 가진 효소 및 이의 사용 방법

Also Published As

Publication number Publication date
JP2008142089A (ja) 2008-06-26
US20060035216A1 (en) 2006-02-16
US20060275804A1 (en) 2006-12-07
CA2430192C (en) 2014-06-03
US9453211B2 (en) 2016-09-27
US7671189B2 (en) 2010-03-02
JP2005501515A (ja) 2005-01-20
EP1507870A2 (en) 2005-02-23
CN102690799A (zh) 2012-09-26
US20130115675A1 (en) 2013-05-09
CN1610754A (zh) 2005-04-27
JP2015107123A (ja) 2015-06-11
WO2002068583A2 (en) 2002-09-06
CA2430192A1 (en) 2002-09-06
MXPA03004840A (es) 2008-10-08
CA2846761A1 (en) 2002-09-06
US8153411B2 (en) 2012-04-10
CN1610754B (zh) 2012-07-04
BR0115875A (pt) 2005-05-10
US7078504B2 (en) 2006-07-18
JP5697365B2 (ja) 2015-04-08
JP4589602B2 (ja) 2010-12-01
WO2002068583A3 (en) 2004-12-02
JP2010268796A (ja) 2010-12-02
EP1507870A4 (en) 2005-11-09
US20100112666A1 (en) 2010-05-06

Similar Documents

Publication Publication Date Title
US9453211B2 (en) Dehalogenases, nucleic acids encoding them and methods for making and using them
US20030044956A1 (en) Enzymes having carboxymethyl cellulase activity and methods of use thereof
JP4261799B2 (ja) 鏡像異性的に純粋なα−置換カルボン酸の製造方法
JP2004523211A (ja) 高温ポリメラーゼ活性を有する酵素およびその使用方法
US20050202494A1 (en) Catalases
JP2005502310A (ja) ハイドロラーゼ酵素および速度論的分割における用途
US20050221364A1 (en) Enzymes having alpha-galactosidase activity and methods of use thereof
US7288400B2 (en) Nucleic acids encoding esterases and methods of making and using them
AU2011201053B2 (en) Enzymes having dehalogenase activity and methods of use thereof
US20020164751A1 (en) Enzymes having thermostable phosphatase activity and methods of use thereof
US20020137185A1 (en) Enzymes having amidase activity and methods of use thereof
AU2001297671A1 (en) Enzymes having dehalogenase activity and methods of use thereof
US20020120118A1 (en) Enzymes having endoglucanase activity and methods of use thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
J501 Disposition of invalidation of trial